特許5984150 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧

特許5984150情報処理装置、情報処理方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5984150

(24)【登録日】2016年8月12日

(45)【発行日】2016年9月6日

(54)【発明の名称】情報処理装置、情報処理方法、及びプログラム

(51)【国際特許分類】

G06Q 30/02 20120101AFI20160823BHJP

G06N 99/00 20100101ALI20160823BHJP

【ＦＩ】

G06Q30/02 310

G06N99/00 150

G06N99/00 180

【請求項の数】11

【全頁数】20

(21)【出願番号】特願2014-168585(P2014-168585)

(22)【出願日】2014年8月21日

(65)【公開番号】特開2016-45642(P2016-45642A)

(43)【公開日】2016年4月4日

【審査請求日】2016年1月12日

【国等の委託研究の成果に係る記載事項】（出願人による申告）平成２５年度、独立行政法人科学技術振興機構、戦略的創造研究推進事業「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」（ＣＲＥＳＴ）、産業技術力強化法第１９条の適用を受ける特許出願

【早期審査対象出願】

(73)【特許権者】

【識別番号】390009531

【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション

【氏名又は名称原語表記】ＩＮＴＥＲＮＡＴＩＯＮＡＬＢＵＳＩＮＥＳＳＭＡＣＨＩＮＥＳＣＯＲＰＯＲＡＴＩＯＮ

(74)【代理人】

【識別番号】100108501

【弁理士】

【氏名又は名称】上野剛史

(74)【代理人】

【識別番号】100112690

【弁理士】

【氏名又は名称】太佐種一

(72)【発明者】

【氏名】恐神貴行

(72)【発明者】

【氏名】勝木孝行

【審査官】渡邉加寿磨

(56)【参考文献】

【文献】特開２０１４−０６７２０６（ＪＰ，Ａ）

【文献】特開２００１−０２２８３１（ＪＰ，Ａ）

【文献】特開２００３−０１６２４３（ＪＰ，Ａ）

【文献】特開２００９−２７１８７３（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｑ１０／００ − ９９／００

Ｇ０６Ｎ９９／００

(57)【特許請求の範囲】

【請求項1】

複数の選択主体が選択対象を選択した履歴を含む履歴データを取得する履歴取得部と、
各選択対象のそれぞれが有する特徴量と、各選択主体による特徴への嗜好度と、複数の選択環境のそれぞれにおける各選択対象の選択されやすさを示す環境依存度とを用いて前記複数の選択主体のそれぞれが各選択対象を選択する選択可能性を算出する選択モデルにおいて、各選択主体による特徴への前記嗜好度および各選択環境における各選択対象の選択の前記環境依存度を、前記履歴データを用いて学習させる学習処理部と、
前記学習処理部による学習結果を出力する出力部と、
を備え、
前記学習処理部は、前記履歴データが選択モデルに合致するように、各選択環境において各選択主体が各選択対象を選択する前記選択可能性を、当該選択対象の複数の特徴に対応する複数の特徴量を示す特徴ベクトルおよび当該選択主体の複数の特徴のそれぞれに対する嗜好度を示す嗜好ベクトルの積と、当該選択環境に対応する各選択対象の選択の環境依存度を示す環境依存ベクトルにおける当該選択対象に対応する要素とに基づいて算出する前記選択モデルを学習させる、
情報処理装置。

【請求項2】

前記学習処理部は、前記選択モデルにおいて、複数の前記選択対象のそれぞれが有する特徴についての前記特徴量を更に学習する、
請求項１に記載の情報処理装置。

【請求項3】

複数の前記選択対象のそれぞれが有する特徴についての前記特徴量を取得する特徴量取得部を更に備える請求項１に記載の情報処理装置。

【請求項4】

前記履歴データは、前記複数の選択環境のそれぞれにおいて少なくとも一の選択主体が選択対象を選択した履歴を含み、
前記学習処理部は、各選択環境において前記複数の選択主体に共通する各選択対象の前記環境依存度を用いる前記選択モデルを学習させる請求項１から３のいずれか１項に記載の情報処理装置。

【請求項5】

各選択主体の前記嗜好ベクトルおよび各選択環境における前記環境依存ベクトルの各要素は、事前分布によって表され、
前記学習処理部は、各選択主体の前記嗜好ベクトルおよび各選択環境における前記環境依存ベクトルの各要素について事前分布の分布パラメータを学習により算出する
請求項１から４のいずれか１項に記載の情報処理装置。

【請求項6】

前記学習処理部は、
各選択主体の前記嗜好ベクトルおよび各選択環境における前記環境依存ベクトルの事前分布の分布パラメータを生成し、
各選択環境における前記環境依存ベクトルの事前分布に基づいて、各選択環境における前記環境依存ベクトルの次のサンプルを生成し、
各選択主体の前記嗜好ベクトルの事前分布に基づいて、各選択主体の前記嗜好ベクトルの次のサンプルを生成し、
複数回発生した各選択環境における前記環境依存ベクトルおよび各選択主体の前記嗜好ベクトルのサンプルに基づいて、各選択環境における前記環境依存ベクトルおよび各選択主体の前記嗜好ベクトルの分布を算出する
請求項５に記載の情報処理装置。

【請求項7】

前記学習処理部は、
前記環境依存ベクトルの前記事前分布の前記分布パラメータ及び前記環境依存ベクトルの前回のサンプルに基づく分布から、各選択環境における前記環境依存ベクトルのサンプル候補を生成し、
前記環境依存ベクトルのサンプル候補のそれぞれについて、事前分布に対する当該サンプル候補の生起確率と、前記履歴データにおける選択に対する当該サンプル候補および各選択主体の嗜好ベクトルの尤度に基づいて、当該サンプル候補を前記環境依存ベクトルの次のサンプルとして選択するか否かを決定する、
請求項６に記載の情報処理装置。

【請求項8】

前記学習処理部は、
前記嗜好ベクトルの前記事前分布の前記分布パラメータ及び前記嗜好ベクトルの前回のサンプルに基づく分布から、各選択主体の前記嗜好ベクトルのサンプル候補を生成し、
各選択主体の前記嗜好ベクトルのサンプル候補のそれぞれについて、事前分布に対する当該サンプル候補の生起確率と、前記履歴データにおける選択に対する各選択環境における前記環境依存ベクトルおよび当該サンプル候補の尤度に基づいて、当該サンプル候補を前記嗜好ベクトルの次のサンプルとして選択するか否かを決定する、
請求項６または７に記載の情報処理装置。

【請求項9】

前記学習処理部は、各選択環境における前記環境依存ベクトルおよび各選択主体の前記嗜好ベクトルに対応して前記履歴データにおける選択が発生する確率に基づく目的関数を用いて各選択環境における前記環境依存ベクトルおよび各選択主体の前記嗜好ベクトルを算出する
請求項１から８のいずれか１項に記載の情報処理装置。

【請求項10】

コンピュータにより実行される情報処理方法であって、
複数の選択対象のそれぞれが有する特徴についての特徴量を取得する特徴量取得段階と、
複数の選択主体が選択対象を選択した履歴を含む履歴データを取得する履歴取得段階と、
各選択対象についての前記特徴量と、各選択主体による特徴への嗜好度と、複数の選択環境のそれぞれにおける各選択対象の選択されやすさを示す環境依存度とを用いて前記複数の選択主体のそれぞれが各選択対象を選択する選択可能性を算出する選択モデルにおいて、各選択主体による特徴への前記嗜好度および各選択環境における各選択対象の選択の前記環境依存度を、前記履歴データを用いて学習させる学習処理段階と、
前記学習処理段階で得られた学習結果を出力する出力段階と、
を備え、
前記学習処理段階において、前記履歴データが選択モデルに合致するように、各選択環境において各選択主体が各選択対象を選択する前記選択可能性を、当該選択対象の複数の特徴に対応する複数の特徴量を示す特徴ベクトルおよび当該選択主体の複数の特徴のそれぞれに対する嗜好度を示す嗜好ベクトルの積と、当該選択環境に対応する各選択対象の選択の環境依存度を示す環境依存ベクトルにおける当該選択対象に対応する要素とに基づいて算出する前記選択モデルを学習させる、
情報処理方法。

【請求項11】

コンピュータを、請求項１から９のいずれか１項に記載の情報処理装置として機能させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法、及びプログラムに関する。

【背景技術】

【0002】

選択主体（例えば、消費者）が複数の選択肢（例えば、複数の商品）から何を選択するかを予測するための手法として、ロジットモデルを用いたコンジョイント解析が知られている（例えば、特許文献１〜５及び非特許文献１）。この方法では、選択肢の特徴をベクトル化し、選択肢の特徴及び実際に選択された選択肢に対して対象者の嗜好ベクトルをロジスティック回帰分析することにより、選択主体の嗜好を推定し、選択主体が将来選択するであろう選択対象を予測する予測モデルを構築する。

【0003】

ここで、従来のロジットモデルを用いたコンジョイント解析は、選択主体が認識した選択肢の中から嗜好に合致するものを選択する状況を前提とするので、学習データにおいて選択主体が認識する選択肢を明示的に指定する必要がある。しかし、通常の購買データ等の学習データでは、消費者が選んだ商品のみが記録され、消費者がどの商品と比較してその商品を選んだかは記録されておらず、選択主体が認識した選択肢を考慮した上で選択対象を予測することができない。

【0004】

また、選択主体が選択肢を検討する際に、選択肢の特徴及び嗜好のみならず、認知バイアス及び／又は売り場の状況等の選択時の環境に影響を受けることがある。しかし、従来のロジットモデルを用いたコンジョイント解析ではこのような選択時の環境の影響は考慮しておらず、環境の影響を排除して選択主体の正確な嗜好を推定することは困難であった。
［特許文献１］特開２０１３−１０９４７０号公報
［特許文献２］特開２００５−３１６７５６号公報
［特許文献３］特開２００１−１７５７６１号公報
［特許文献４］特開２０１１−６５５０４号公報
［特許文献５］特開２００６−８５５５８号公報
［非特許文献１］O. Chapelle and Z. Harchaoui, "A machine learning approach to conjoint analysis," in Advances in Neural Information Processing Systems 17, L. K. Saul, Y. Weiss, and L. Bottou, Eds., 2005, pp. 257-264

【発明の概要】

【発明が解決しようとする課題】

【0005】

従来のロジットモデルを用いたコンジョイント解析の課題を解決することを課題とする。

【課題を解決するための手段】

【0006】

本発明の第１の態様においては、複数の選択主体が選択対象を選択した履歴を含む履歴データを取得する履歴取得部と、各選択対象のそれぞれが有する特徴量と、各選択主体による特徴への嗜好度と、複数の選択環境のそれぞれにおける各選択対象の選択されやすさを示す環境依存度とを用いて複数の選択主体のそれぞれが各選択対象を選択する選択可能性を算出する選択モデルにおいて、各選択主体による特徴への嗜好度および各選択環境における各選択対象の選択の環境依存度を、履歴データを用いて学習させる学習処理部と、学習処理部による学習結果を出力する出力部とを備える情報処理装置、当該装置を用いた情報処理方法、及び、当該装置に用いるプログラムを提供する。

【0007】

なお、上記の発明の概要は、本発明の特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

【図面の簡単な説明】

【0008】

【図1】本実施形態の情報処理装置１０が構築する選択モデルの一例を示す。

【図2】図１の選択モデルにおける商品陳列の一例を示す。

【図3】本実施形態の情報処理装置１０のブロック図を示す。

【図4】本実施形態の情報処理装置１０による学習処理のフローを示す。

【図5】本実施形態の情報処理装置１０によるシュミレーションのフローを示す。

【図6】本実施形態の学習処理に用いられる階層ベイズモデルの概要を示す。

【図7】本実施形態の具体的な学習アルゴリズムの一例を示す。

【図8】本実施形態の情報処理装置１０の効果の一例を示す。

【図9】本実施形態の情報処理装置１０の効果の一例を示す。

【図10】コンピュータ１９００のハードウェア構成の一例を示す。

【発明を実施するための形態】

【0009】

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

【0010】

図１は、本実施形態の情報処理装置１０が構築する選択モデルの一例を示す。ここでは、選択主体である消費者が、選択対象である商品Ａ、商品Ｂ、商品Ｃ及び商品Ｄから１つを選択する場合を例に説明する。消費者は、環境依存度と、消費者自身の各商品に対する嗜好度とに基づいて、１つの商品を選択する。

【0011】

環境依存度は、選択環境において選択対象の選択主体への提示態様及び／又は選択主体の認知バイアス（例えば、おとり効果、アンカー効果及び確証バイアス等）の結果生じる、選択環境のそれぞれにおける各選択対象の選択されやすさを示し、選択対象自体の特徴とは直接関係が無いパラメータである。図１の例において、消費者は、商品Ａ、商品Ｂ、商品Ｃ及び商品Ｄのうち環境依存度の高い商品Ａ、商品Ｂ及び商品Ｃを選択肢として認識し、そのうち消費者の嗜好度との合致度が高い商品Ｂを最終的に購入する。

【0012】

図２は、図１の選択モデルにおける商品陳列の一例を示す。例えば、商品Ｄが他の商品Ａ〜Ｃと比較して目立たないように陳列された場合、消費者は商品Ａ〜Ｄのうち商品Ａ〜Ｃのみを選択肢として認識する場合がある。一例として、図２に示すように、他の商品Ａ〜Ｃが棚全体で多数展示されているのに対し、商品Ｄが棚の端の方で他商品から離れて１つだけ陳列されていた場合、商品Ｄは他の商品よりも露出が少なく、消費者に選択肢として認識されないことがある。このような場合、当該選択環境における商品Ｄについての環境依存度は低いものとなる。

【0013】

本実施形態の情報処理装置１０は、このような選択対象の特徴に直接依存しない選択時の環境に関する因子を環境依存度として選択モデルに取り込む。ここで、選択主体が一の選択対象を選択する機会の単位を選択機会とすると、情報処理装置１０は、選択機会ごとに独立した選択環境が存在することを想定し、選択機会ごとの環境依存度を設定する。

【0014】

図３は、本実施形態に係る情報処理装置１０のブロック図を示す。情報処理装置１０は、選択主体が選択対象を選択した履歴から、選択対象の特徴への嗜好度と、選択環境の環境依存度とを推定する選択モデルを生成し、当該選択モデルに基づいて選択対象の将来の選択をシミュレーションする。情報処理装置１０は、特徴量取得部１１０、履歴取得部１２０、学習処理部１５０、条件取得部１７０、シミュレーション部１８０、及び、出力部１９０を備える。

【0015】

特徴量取得部１１０は、複数の選択対象のそれぞれが有する特徴についての特徴量を含む特徴データを取得する。例えば商品を選択対象とする場合、特徴量取得部１１０は、商品の複数の特徴（例えば、大きさ、色及び価格等）に対応する複数の特徴量を各成分として有する特徴ベクトルを、情報処理装置１０の外部又は内部のデータベース２０から取得する。特徴量取得部１１０は、取得した特徴データを学習処理部１５０に提供する。

【0016】

履歴取得部１２０は、情報処理装置１０の外部又は内部のデータベース２０から、選択主体が選択対象を選択した履歴を含む履歴データを取得する。例えば商品を選択対象とする場合、履歴取得部１２０は、複数の消費者が商品を購入した記録を含む購入履歴を取得する。履歴取得部１２０は、取得した履歴データを学習処理部１５０に提供する。

【0017】

学習処理部１５０は、各選択対象のそれぞれが有する各選択対象の１又は複数の特徴のそれぞれに対応する１又は複数の特徴量と、各選択主体による特徴への嗜好度と、複数の選択環境のそれぞれにおける各選択対象の環境依存度とを用いて複数の選択主体のそれぞれが各選択対象を選択する選択可能性を算出する選択モデルにおいて、各選択主体による特徴への嗜好度および各選択機会ごとの選択環境における各選択対象の選択の環境依存度を、履歴データを用いて学習させる。例えば、学習処理部１５０は、学習モデルに、ベイズ推定により各選択対象の嗜好度及び選択機会ごとの環境依存度を学習させる。学習処理部１５０は、学習結果をシミュレーション部１８０及び出力部１９０に提供する。

【0018】

条件取得部１７０は、情報処理装置１０のユーザから選択モデルのシミュレーションの実行に必要なシミュレーション条件を取得する。例えば、消費者が商品を選択して購入する選択モデルをシミュレーションする場合、条件取得部１７０は、消費者の選択対象となる商品の特徴データを取得する。条件取得部１７０は、取得したシミュレーション条件をシミュレーション部１８０に提供する。

【0019】

シミュレーション部１８０は、学習処理部１５０の学習の結果得られた嗜好度及び環境依存度と、条件取得部１７０から取得したシミュレーション条件とに基づいて、選択主体が選択対象を選択する選択モデルに基づくシミュレーションを実行する。例えば、シミュレーション部１８０は、予め定められた嗜好を有する消費者が商品をどのように選択するかのシミュレーションを実行する。シミュレーション部１８０は、シミュレーションの実行結果データを出力部１９０に提供する。

【0020】

出力部１９０は、学習処理部１５０による学習結果及び／又はシミュレーション部１８０によるシミュレーション結果を出力する。例えば、出力部１９０は、学習により得られた嗜好度及び環境依存度、及び／又は、シミュレーションの結果、消費者が商品を購入した結果等を、情報処理装置１０のディスプレイ等に表示してよい。

【0021】

このように情報処理装置１０は、選択対象への嗜好度だけでなく選択環境の環境依存度に基づいて、選択主体が選択を行う選択モデルを構築する。これにより、情報処理装置１０は、選択が行われた環境及び認知バイアス等の選択対象の特徴とは直接関係がない要素の影響を選択モデル内で考慮し、選択主体の選択対象への嗜好度をより正確に推定することができる。また、情報処理装置１０は、推定した嗜好度及び環境依存度に基づいて、選択主体が選択を実行する様子をより正確にシミュレートすることができる。

【0022】

図４は、本実施形態の情報処理装置１０による学習処理のフローを示す。本実施形態では、主に消費者個人が商品を選択する場合の選択モデルについて説明するが、情報処理装置１０の適用対象はこれに限られない。例えば、情報処理装置１０は、個人、団体、ロボット及び／又は動物等の意思決定可能な選択主体が、商品、サービス、動作の対象及び／又は取得の対象等を選択対象として選択することを選択モデルとしてモデル化する。

【0023】

本実施形態において、情報処理装置１０は、Ｓ１１０〜Ｓ１４０の処理を実行することにより、選択モデルを構築する。

【0024】

まず、Ｓ１１０において、特徴量取得部１１０は、特徴データとして、Ｋ個（Ｋは２以上の整数）の選択対象のそれぞれについて、各選択対象の複数の特徴に対応する複数の特徴量を示す特徴ベクトルｕ^{（ｋ｜ｋ∈Ｋ）}を取得する。例えば、特徴量取得部１１０は、選択対象となる各商品ｋについて、商品の特徴（一例として、大きさ、色、価格、性能、製造者、及び種類等）を数値化した特徴量を各成分として有する特徴ベクトルｕ^（ｋ）を含む特徴データをデータベース２０から取得する。特徴量取得部１１０は、取得した特徴データを学習処理部１５０に提供する。

【0025】

次にＳ１２０において、履歴取得部１２０は、複数の選択機会に対応する複数の選択環境のそれぞれにおいて、１又は２以上の選択主体が選択対象を選択した履歴を含む履歴データを取得する。例えば、履歴取得部１２０は、ｎ（ｎ∈Ｎ）番目の選択機会で、ｍ（ｍ∈Ｍ）番目の選択主体がｋ_ｎ^ｍ番目の選択対象を選択したことを履歴として取得する。

【0026】

選択機会は、複数の選択主体に対して共通であってよい。例えば、商品の選択を例にとると、履歴取得部１２０は、１番目の選択機会（ｎ＝１）の履歴として、ＸＸ月第１週目に百貨店ＺＺ売場Ａで第１消費者が購入した商品ｋ_１^１と、同期間同店同売り場で第２消費者が購入した商品ｋ_１^２と、…同日同店同売り場で第Ｍ消費者が購入した商品ｋ_１^Ｍとを含む購買履歴を取得してよい。これにより、後に学習処理部１５０が各選択機会に対応する各選択環境の環境依存度を推定する際に、複数の選択主体に共通の環境依存度を得ることができる。

【0027】

なお、一の選択主体が複数の選択対象を同時に選択する場合は、複数の選択対象をそれぞれ一つの購入機会におけるものとしてよい。例えば、第１消費者がＸＸ月第１週目に百貨店ＺＺで２個の商品を購入した場合、履歴取得部１２０は、履歴として、商品ｋ_１^１として２個の商品に対応する２個のデータを取得してよい。

【0028】

これに代えて、一の選択主体が複数の選択対象を同時に選択する場合は、複数の選択対象をそれぞれ別の購入機会におけるものとしてよい。例えば、第１消費者がＸＸ月第１週目に百貨店ＺＺで２個の商品を購入した場合、履歴取得部１２０は、履歴として、商品ｋ_１^１及び商品ｋ_２^１を取得してよい。履歴取得部１２０は、取得した履歴データを学習処理部１５０に提供する。

【0029】

次に、Ｓ１３０において、学習処理部１５０は、各選択対象の特徴量と、各選択主体の嗜好度と、環境依存度とを用いて複数の選択主体のそれぞれが各選択対象を選択する選択可能性を算出する選択モデルを構築し、当該選択モデルに各選択主体による特徴への嗜好度および各選択環境における各選択対象の選択の環境依存度を、特徴データ及び履歴データを用いて学習させる。

【0030】

例えば、学習処理部１５０は、複数の特徴のそれぞれに対する嗜好度を各成分として含む各選択主体ｍについての嗜好ベクトルｗ^（ｍ）と、各選択機会ｎに対応する各選択環境において複数の選択主体に共通する各選択対象の環境依存度とを選択モデルに学習させる。学習処理部１５０は、特徴ベクトルを所与のものとせず、学習データに基づいて嗜好ベクトル及び環境依存度に加え、各選択対象ｋの特徴ベクトルｕ^（ｋ）を選択モデルに学習させてもよい。

【0031】

学習処理部１５０は、環境依存度の学習において、選択機会ｎの選択環境についての各選択対象ｋの選択の環境依存度ｖ_ｎ，ｋを成分として含む環境依存ベクトルｖ^（ｎ）を学習してよい。これにより、学習処理部１５０は、各選択機会において提供される選択環境における、各選択対象の選択されやすさを推定する。

【0032】

学習処理部１５０は、全ての選択主体に共通の環境依存度ｖ_ｎ，ｋを学習してもよい。これに代えて、学習処理部１５０は、選択主体のグループごとに共通の環境依存度ｖ_ｎ，ｋを学習してもよい。例えば、学習処理部１５０は、属性が共通する複数の選択主体ごとに共通の環境依存度ｖ_ｎ，ｋを学習してもよい。一例として、学習処理部１５０は、男女別、年齢層別、住所別、及び／又は職業別にグループ分けされた複数の選択主体ごとに環境依存度ｖ_ｎ，ｋを学習してもよい。これにより、例えば、学習処理部１５０は、選択機会ｎ'に対応する売場で商品ｋ'が、男性には購入の選択肢として認知されやすいが女性には認知されにくいように展示された場合等に、男性用の環境依存度ｖ^ｍｌ_ｎ'，ｋ'の値を高くし、女性用の環境依存度ｖ^ｆｍ_ｎ'，ｋ'の値を低くすることにより、認知の性差をモデル化することができる。

【0033】

学習処理部１５０は、学習処理部１５０は、選択対象の特徴と選択主体の嗜好の合致度に選択対象の環境依存度を加えたロジットモデルを学習してよい。具体的には、下記数式１に示すように、学習処理部１５０は、選択機会ｎで提供される各選択環境において各選択主体ｍが各選択対象ｋを選択する選択可能性ｐ（ｋ｜ｗ^（ｍ），ｖ^（ｎ））を、当該選択対象の特徴ベクトルｕ^（ｋ）および当該選択主体の嗜好ベクトルｗ^（ｍ）の積と、当該選択環境に対応する環境依存ベクトルｖ^（ｎ）における当該選択対象ｋに対応する要素ｖ_ｎ，ｋとに基づいて算出する選択モデルを学習する。

【数1】

…数式１

【0034】

学習処理部１５０は、この学習処理において、各選択主体による特徴への嗜好度の事後確率分布、及び、各選択環境における各選択対象の選択の環境依存度の事後確率分布を算出してよい。例えば、学習処理部１５０は、ギブスサンプリング、メトロポリス・ヘイスティング法等のマルコフ連鎖モンテカルロ法（ＭＣＭＣ）に基づくベイズ推定を実行して嗜好度及び環境依存度の事後確率分布を算出してもよい。これに代えて、学習処理部１５０は、最大事後確率（ＭＡＰ）推定又は最尤法等を用いて各選択主体による特徴への嗜好度の値、及び、各選択環境における環境依存度の値を推定してもよい。学習処理部１５０による学習の具体的なアルゴリズムについては後述する。

【0035】

学習処理部１５０は、学習結果を出力部１９０に提供する。例えば、学習処理部１５０は、学習の結果得られた嗜好度の値及び環境依存度の値、又は、これらの事後確率分布をシミュレーション部１８０及び／又は出力部１９０に提供する。一例として、学習処理部１５０は、事後確率分布に基づくサンプル値、及び／又は、事後確率分布の平均値／分散／中央値等を含む学習結果をシミュレーション部１８０及び／又は出力部１９０に提供してよい。

【0036】

次に、Ｓ１４０において、出力部１９０は、学習結果に含まれる嗜好度及び環境依存度の事後確率分布等を情報処理装置１０のディスプレイ等に表示してよい。

【0037】

図５は、本実施形態の情報処理装置１０によるシュミレーションのフローを示す。本実施形態において、情報処理装置１０は、Ｓ２１０〜Ｓ２３０の処理を実行することにより、選択モデルに基づくシミュレーションを実行する。

【0038】

まず、Ｓ２１０において、条件取得部１７０が、情報処理装置１０のユーザから選択モデルのシミュレーションの実行に必要なシミュレーション条件を取得する。例えば、条件取得部１７０は、複数の選択対象についての特徴ベクトルｕ^（ｋ）を含む特徴データを取得する。一例として、消費者が商品を選択して購入する選択モデルをシミュレーションする場合、条件取得部１７０は、消費者の購入対象となる全商品の特徴ベクトルｕ^（ｋ）を含む特徴データを取得する。

【0039】

また、条件取得部１７０は、選択が行われる選択環境に関する選択環境情報を取得してよい。例えば、消費者が商品を選択して購入する選択モデルをシミュレーションする場合、条件取得部１７０は、商品の販売期間、商品の販売場所、及び／又は、商品の展示方法等の情報を選択環境情報として取得する。条件取得部１７０は、取得したシミュレーション条件をシミュレーション部１８０に提供する。

【0040】

次に、Ｓ２２０において、シミュレーション部１８０は、学習処理部１５０の学習結果に基づくシミュレーションを実行する。例えば、シミュレーション部１８０は、条件取得部１７０から取得した特徴ベクトルｕ^（ｋ）と、学習処理部１５０から取得した選択主体の嗜好ベクトルｗ^（ｍ）及び選択環境に対応する環境依存ベクトルｖ^（ｎ）とを用い、数式１に基づく選択可能性ｐ（ｋ｜ｗ^（ｍ），ｖ^（ｎ））で、選択機会ｎで選択主体ｍが選択対象ｋを選択する選択モデルをシミュレートする。

【0041】

ここで、シミュレーション部１８０は、環境依存ベクトルｖ^（ｎ）を選択環境情報に基づいて設定してよい。例えば、ＸＸ月第１週目に百貨店ＺＺ売場Ａで商品を選択主体（消費者）に選択させる選択環境に選択機会ｎ＝１を割り当て、ＸＸ月第１週目に百貨店ＺＺ売場Ｂで商品を選択させる選択環境に選択機会ｎ＝２を割り当てる。この場合、シミュレーション部１８０は、ＸＸ月第１週目に百貨店ＺＺ売場Ａで商品を選択させる選択環境に対応する環境依存ベクトルとしてｖ^（１）を割り当て、同期間同店売場Ｂで商品を選択させる選択環境に対応する環境依存ベクトルとしてｖ^（２）を割り当ててよい。これにより、シミュレーション部１８０は、過去に選択が行われた環境（例えば特定時期の特定の売り場の環境）と同じ環境で選択がされる様子をシミュレートすることができる。

【0042】

また、学習処理部１５０から嗜好ベクトルｗ^（ｍ）及び環境依存ベクトルｖ^（ｎ）が確率分布として与えられる場合、シミュレーション部１８０は、嗜好ベクトルｗ^（ｍ）及び環境依存ベクトルｖ^（ｎ）として確率分布からのサンプル値、平均値、又は、中央値等を用いてよい。

【0043】

シミュレーション部１８０は、シミュレーションの実行結果を出力部１９０に提供する。例えば、シミュレーション部１８０は、各選択主体が各選択機会ごとに選択した選択対象を含むシミュレーションの実行結果データを出力部１９０に提供する。

【0044】

次に、Ｓ２３０において、出力部１９０は、実行結果データを表示する。例えば、出力部１９０は、シミュレーションの結果選択された選択対象のヒストグラム等を情報処理装置１０のディスプレイに表示等してよい。

【0045】

このように、情報処理装置１０は、選択が行われた環境の環境依存度とを含む選択モデルを構築し、これをベイズ推定等により解く。これにより、情報処理装置１０は、選択対象が置かれた環境及び選択主体の認知バイアス等の選択対象の特徴とは直接関係がない要素の影響を考慮し、各選択主体の選択対象への嗜好度をより正確に推定できる。従って、情報処理装置１０は、例えば、消費者が嗜好及び環境に応じて商品を選択して購入する環境をより正確にシミュレートすることができる。

【0046】

ここで、図６及び図７により、図４のＳ１３０における学習処理の具体例を説明する。学習処理部１５０は、例えば、選択主体の嗜好度及び選択環境の環境依存度の事後確率分布を生成する階層ベイズモデルのパラメータを推定する。

【0047】

図６は、本実施形態の学習処理部１５０による学習処理に用いられる階層ベイズモデルの概要を示す。図示するように、学習処理部１５０は、環境依存ベクトルｖ^（ｎ）について無情報共役事前分布から超パラメータである平均μ_ｖ及び分散Σ_ｖをサンプリングし、当該平均μ_ｖ及び分散Σ_ｖを持つからガウス事前分布に従って、環境依存ベクトルｖ^（ｎ）を生成する。ｎ∈Ｎにおいて、環境依存ベクトルｖ^（ｎ）は互いに独立であり同一の分布に従う（ｉ．ｉ．ｄ．）。

【0048】

また、学習処理部１５０は、嗜好ベクトルｗ^（ｍ）について無情報共役事前分布から超パラメータであるμ_ｗ及びΣ_ｗの値をサンプリングし、当該サンプリングしたμ_ｗ及びΣ_ｗの値を平均μ_ｗ及び分散Σ_ｗとするガウス事前分布に従って、嗜好ベクトルｗ^（ｍ）を生成する。ｍ∈Ｍにおいて、嗜好ベクトルｗ^（ｍ）は互いに独立であり同一の分布に従う（ｉ．ｉ．ｄ．）。

【0049】

ここで、学習処理部１５０は、各選択主体（Ａ、Ｂ…）が各選択機会（１、２、３…）で選択した選択対象ｋ_１^（Ａ）〜ｋ_３^（Ａ）、ｋ_１^（Ｂ）〜ｋ_３^（Ｂ）…を含む履歴データＤが選択モデルに合致するように、環境依存ベクトルｖ^（ｎ）のガウス事前分布、及び、嗜好ベクトルｗ^（ｍ）のガウス事前分布を学習する。学習処理部１５０は、ガウス事前分布を用いることにより、計算効率を向上し、良好なロバスト性を担保することができる。

【0050】

図７は、本実施形態の学習処理部１５０が実行する階層ベイズモデルを用いた学習アルゴリズムの具体的例を示す。学習処理部１５０は、図７の第１〜１５行目の処理を実行することにより、図４のＳ１３０に係る学習処理を実行してよい。

【0051】

なお、図中のΣ_ｍはΣ_ｍ∈Ｍを示し、Σ_ｎはΣ_ｎ∈Ｎを示し、Π_ｍはΠ_ｍ∈Ｍを示し、Π_ｎはΠ_ｎ∈Ｎを示し、ｗバー（図中ではｗにオーバーライン、ここではｗ_ｔｏｔとする）はΣ_ｍｗ^（ｍ）／Ｍを示し、ｖバー（図中ではｖにオーバーライン、ｖ_ｔｏｔと記する）はΣ_ｎｖ^（ｎ）／Ｎを示し、φ（・｜μ，Σ）は平均がμで共分散がΣとなる多次元正規分布（μ，Σ）の確率密度関数を示す。

【0052】

まず、第１行目において、学習処理部１５０は、ｖ、ｗ、μ_ｖ、Σ_ｖ、μ_ｗ及びΣ_ｗを初期化する。例えば、学習処理部１５０は、環境依存ベクトルｖ^（ｎ）及び嗜好ベクトルｗ^（ｍ）の各成分に予め定められた初期値（例えば０）及び／又はランダムな値を割り当ててよい。また、学習処理部１５０は、μ_ｖ、Σ_ｖ、μ_ｗ及びΣ_ｗに予め定められた値（例えば、μ_ｖ＝０、μ_ｗ＝０、Σ_ｖ＝１、Σ_ｗ＝１等）を割り当ててよい。

【0053】

次に、第２行目〜第１５行目において、学習処理部１５０は、第１ループの処理を実行する。学習処理部１５０は、第１ループ処理を予め定められた条件が満たされるまで繰り返す。学習処理部１５０は、第１ループ処理を終了する予め定められたの条件として、ループ処理を予め定められた回数繰り返したこと、又は、出力されるｖ^（ｎ）及びｗ^（ｍ）の確率分布が定常状態になったこと等を用いてよい。

【0054】

第１ループ内の第３行目において、学習処理部１５０は、無情報共役事前分布となる平均がΣ_ｎｖ^（ｎ）／｜Ｎ｜で共分散がΣ_ｖ／｜Ｎ｜の多次元正規分布からμ_ｖをサンプリングする。

【0055】

次に、第４行目において、学習処理部１５０は、無情報共役事前分布となるスケールが｛｜Ｌ｜Ｉ＋Σ_ｎ（ｖ^（ｎ）−ｖ_ｔｏｔ）（ｖ^（ｎ）―ｖ_ｔｏｔ）^Ｔ｝／（｜Ｌ｜＋｜Ｎ｜）で自由度が｜Ｌ｜＋｜Ｎ｜の逆ウィシャート分布からΣ_ｖをサンプリングする。ここでＬは選択対象の集合を示し、Ｉは単位行列を示す。

【0056】

次に、第５行目において、学習処理部１５０は、無情報共役事前分布となる平均がΣ_ｍｗ^（ｍ）／｜Ｍ｜で共分散がΣ_ｗ／｜Ｍ｜の多次元正規分布からμ_ｗをサンプリングする。

【0057】

次に、第６行目において、学習処理部１５０は、無情報共役事前分布となるスケールが｛｜Ａ｜Ｉ＋Σ_ｍ（ｗ^（ｍ）−ｗ_ｔｏｔ）（ｗ^（ｍ）―ｗ_ｔｏｔ）^Ｔ｝／（｜Ａ｜＋｜Ｍ｜）で自由度が｜Ａ｜＋｜Ｍ｜の逆ウィシャート分布からΣ_ｖをサンプリングする。ここでＡは嗜好ベクトルの要素の集合を示し、Ｉは単位行列を示す。

【0058】

このように、第３〜６行目において、学習処理部１５０は、各選択主体の嗜好ベクトルおよび各選択環境における環境依存ベクトルの事前分布の分布パラメータ（μ_ｖ、Σ_ｖ、μ_ｗ及びΣ_ｗ）を生成する。

【0059】

次に、第７行目〜第１０行目において、学習処理部１５０は、第１ループ内で第２ループの処理を実行する。学習処理部１５０は、第２ループ処理を完了することにより、ｎ∈Ｎについて事後確率分布を形成するｖ^（ｎ）をサンプリングする。

【0060】

まず、第２ループ内の第８行目において、学習処理部１５０は、環境依存ベクトルの事前分布の分布パラメータΣ_ｖ及び環境依存ベクトルの前回の第１ループで得られたサンプルｖ^（ｎ）に基づく分布から、各選択環境における環境依存ベクトルのサンプル候補ｖ・^（ｎ）を生成する。例えば、学習処理部１５０は、平均がｖ^（ｎ）で、共分散がρΣ_ｖとなる多次元正規分布Ｎｏｒｍａｌ（ｖ^（ｎ），ρΣ_ｖ）から、ｖ・^（ｎ）（図中ではｖの上にドット）をサンプリングする。初回の第１ループ処理ではｖ^（ｎ）に１行目で定義した初期値が与えられ、２回目以降の第１ループ処理ではｖ^（ｎ）に前回の第１ループ処理で得られた値が与えられる。なお、ρは学習処理の前に予め定められたパラメータであり、例えば０．２３である。

【0061】

次に、第９行目において、学習処理部１５０は、環境依存ベクトルのサンプル候補ｖ・^（ｎ）のそれぞれについて、事前分布に対する当該サンプル候補ｖ・^（ｎ）の生起確率と、履歴データにおける選択に対する当該サンプル候補ｖ・^（ｎ）および各選択主体の環境依存ベクトルの尤度に基づいて、当該サンプル候補ｖ・^（ｎ）を環境依存ベクトルの次のサンプルとして選択するか否かを決定する。

【0062】

具体的には、学習処理部１５０は、平均がμ_ｖで共分散がΣ_ｖとなる多次元正規分布からｖ・^（ｎ）が生起される生起確率密度φ（ｖ・^（ｎ）｜μ_ｖ，Σ_ｖ）（即ち、事前確率分布におけるｖ・^（ｎ）の生起確率密度）と、ｖ・^（ｎ）及びｗ^（ｍ）を条件としたときに履歴データが示すｋ_ｎ^（ｍ）が選択される確率のｍ∈Ｍの総乗Π_ｍ（ｋ_ｎ^（ｍ）｜ｖ・^（ｎ），ｗ^（ｍ））（即ち、ｖ・^（ｎ）の尤度）との積を、平均がμ_ｖで共分散がΣ_ｖとなる多次元正規分布からｖ^（ｎ）が生起される生起確率密度φ（ｖ^（ｎ）｜μ_ｖ，Σ_ｖ）（即ち、事前確率分布におけるｖ^（ｎ）の生起確率密度）と、ｖ^（ｎ）及びｗ^（ｍ）を条件としたときに履歴データが示すｋ_ｎ^（ｍ）が選択される確率のｍ∈Ｍの総乗Π_ｍ（ｋ_ｎ^（ｍ）｜ｖ^（ｎ），ｗ^（ｍ））（即ち、ｖ^（ｎ）の尤度）との積で除した除算値を算出する。そして、学習処理部１５０は、当該除算値及び１のうち小さい方の確率で、サンプリングされたｖ・^（ｎ）を新しいサンプルｖ^（ｎ）として採択する。

【0063】

このように、学習処理部１５０は、第８行目及び第９行目の第２ループ処理を実行することにより、前回の第１ループの処理の結果得られた各選択環境における環境依存ベクトルｖ^（ｎ）に基づく多次元正規分布から次のサンプルの候補ｖ・^（ｎ）をサンプリングし、各選択環境における環境依存ベクトルｖ^（ｎ）の事前分布、及び、環境依存ベクトルｖ^（ｎ）の尤度に基づいて当該ｖ・^（ｎ）を採択することにより、各選択環境における環境依存ベクトルの次の第１ループにおけるサンプルｖ^（ｎ）を生成して収集する。

【0064】

次に、第１１行目〜第１４行目において、学習処理部１５０は、第１ループ内で第２ループに続く第３ループの処理を実行する。学習処理部１５０は、第３ループ処理を完了することにより、ｍ∈Ｍについて事後確率分布を形成するｗ^（ｍ）をサンプリングする。

【0065】

まず、第３ループ内の第１２行目において、学習処理部１５０は、嗜好ベクトルの事前分布の分布パラメータΣ_ｗ及び嗜好ベクトルの前回の第１ループで得られたサンプルｗ^（ｍ）に基づく分布から、各選択環境における嗜好ベクトルのサンプル候補ｗ・^（ｍ）を生成する。例えば、学習処理部１５０は、平均がｗ^（ｍ）で、共分散がρΣ_ｗとなる多次元正規分布Ｎｏｒｍａｌ（ｗ^（ｍ），ρΣ_ｗ）から、ｗ・^（ｍ）（図中ではｗの上にドット）をサンプリングする。初回の第１ループ処理ではｗ^（ｍ）に１行目で定義した初期値が与えられ、２回目以降の第１ループ処理ではｗ^（ｍ）に前回の第１ループ処理で得られた値が与えられる。

【0066】

次に、第１３行目において、学習処理部１５０は、嗜好ベクトルのサンプル候補ｗ・^（ｍ）のそれぞれについて、事前分布に対する当該サンプル候補ｗ・^（ｍ）の生起確率と、履歴データにおける選択に対する当該サンプル候補ｗ・^（ｍ）および各選択主体の嗜好ベクトルの尤度に基づいて、当該サンプル候補ｗ・^（ｍ）を嗜好ベクトルの次のサンプルとして選択するか否かを決定する。

【0067】

具体的には、学習処理部１５０は、平均がμ_ｗで共分散がΣ_ｗとなる多次元正規分布からｗ・^（ｍ）が生起される生起確率密度φ（ｗ・^（ｍ）｜μ_ｗ，Σ_ｗ）（即ち、事前確率分布におけるｗ・^（ｍ）の生起確率密度）と、ｖ^（ｎ）及びｗ・^（ｍ）を条件としたときに履歴データが示すｋ_ｎ^（ｍ）が選択される確率のｍ∈Ｍの総乗Π_ｍ（ｋ_ｎ^（ｍ）｜ｖ^（ｎ），ｗ・^（ｍ））（即ち、ｗ・^（ｍ）の尤度）との積を、平均がμ_ｗで分散がΣ_ｗとなる正規分布からｗ^（ｍ）が生起される生起確率密度φ（ｗ^（ｍ）｜μ_ｗ，Σ_ｗ）（即ち、事前確率分布におけるｗ^（ｍ）の生起確率密度）と、ｖ^（ｎ）及びｗ^（ｍ）を条件としたときに履歴データが示すｋ_ｎ^（ｍ）が選択される確率のｎ∈Ｎの総乗Π_ｍ（ｋ_ｎ^（ｍ）｜ｖ^（ｎ），ｗ^（ｍ））（即ち、ｗ^（ｍ）の尤度）との積で除した除算値を算出する。そして、学習処理部１５０は、算出した除算値及び１のうち小さい方の確率で、サンプリングされたｗ・^（ｍ）を新しいｗ^（ｍ）として採択する。

【0068】

従って、学習処理部１５０は、第１２行目及び第１３行目の第３ループ処理を実行することにより、前回の第１ループの処理の結果得られた各選択環境における嗜好ベクトルｗ^（ｍ）に基づく多次元正規分布から次のサンプルの候補ｗ・^（ｍ）をサンプリングし、各選択環境における嗜好ベクトルｗ^（ｍ）の事前分布、及び、嗜好ベクトルｗ^（ｍ）の尤度に基づいて当該ｗ・^（ｍ）を採択することにより、各選択環境における嗜好ベクトルの次の第１ループにおけるサンプルｖ^（ｎ）を生成して収集する。

【0069】

このように、各選択主体の嗜好ベクトルおよび各選択環境における環境依存ベクトルの各要素は事前分布によって表わされ、学習処理部１５０は、第１ループ内における第３〜第６行目の処理において、ギブスサンプリングに基づいて、各選択主体の嗜好ベクトルｗ^（ｍ）および各選択環境における環境依存ベクトルｖ^（ｎ）の各要素について事前分布の分布パラメータ（μ_ｖ，Σ_ｖ，μ_ｗ，Σ_ｗ）を学習により算出する。

【0070】

また、学習処理部１５０は、前回のサンプルを中心とする多次元正規分布から、各選択環境における環境依存ベクトルおよび各選択主体の嗜好ベクトルのサンプリングを行い、複数回発生した環境依存ベクトルおよび嗜好ベクトルのサンプルに基づいて、各選択環境における環境依存ベクトルｖ^（ｎ）および各選択主体の嗜好ベクトルｗ^（ｍ）の分布を算出する。すなわち、学習処理部１５０は、第２ループ及び第３ループの処理で、ｗ^（ｍ）及びｖ^（ｎ）についてメトロポリスヘイスティングに基づく学習を実行する。

【0071】

学習処理部１５０は、第１ループの処理の後、採択されたサンプルｗ・^（ｍ）及びサンプルｖ・^（ｎ）を収集することで最終的に得られた各選択主体ｍについての嗜好ベクトルｗ^（ｍ）の分布、及び、各選択機会ｎについての環境依存ベクトルｖ^（ｎ）の分布を、それぞれの事後確率分布として出力する。学習処理部１５０は、図７の処理を実行するに当たり、処理開始後の予め定められた回数の第１ループの処理で得られたサンプルを収集しないことにより、初期のサンプルの影響を排除してよい。

【0072】

次に、学習処理部１５０が、階層ベイズモデルに代えて近似的ＭＡＰ推定を実行してＳ１３０の学習処理を実行する場合について説明する。

【0073】

この場合、学習処理部１５０は、各選択環境における環境依存ベクトルｖ^（ｎ）および各選択主体の嗜好ベクトルｗ^（ｍ）に対応して履歴データにおける選択が発生する確率に基づく目的関数を用いて、各選択環境における環境依存ベクトルｖ^（ｎ）および各選択主体の嗜好ベクトルｗ^（ｍ）を算出する。

【0074】

例えば、学習処理部１５０は、実際に選択された選択対象ｋ_ｎ^（ｍ）を含む履歴データに対して、数式２に示す事後確率を最大化するように環境依存ベクトルｖ^（ｎ）及び嗜好ベクトルｗ^（ｍ）を最適化する。数式２の第１項は環境依存ベクトルｖ^（ｎ）及び嗜好ベクトルｗ^（ｍ）の尤度に対応し、第２項及び第３項は環境依存ベクトルｖ^（ｎ）及び嗜好ベクトルｗ^（ｍ）の事前分布に対応する。学習処理部１５０は、最適化された環境依存ベクトルｖ^（ｎ）および嗜好ベクトルｗ^（ｍ）を学習結果として出力する。

【数2】

…数式２

【0075】

図８及び図９は、本実施形態の情報処理装置１０の効果の一例を示す。図８の実線は、本実施形態の情報処理装置１０が近似的ＭＡＰ推定を用いて環境依存度を含む選択モデルにより、選択確率を学習した結果を示す。点線は、環境依存度を考慮しない従来のロジットモデルを用いた選択確率の学習結果を示す。

【0076】

図８のグラフの縦軸は、テストデータから推測した選択主体による選択対象の選択確率と、テストデータを生成するのに用いた真の選択確率との絶対誤差の合計を示し、横軸は選択モデル中の環境依存度の影響の大きさの規模を示す。絶対誤差は、数式３で示される。

【数3】

…数式３

【0077】

図８の４個のグラフは、選択モデルにおけるパラメータβ及びパラメータσを変更した場合の絶対誤差の結果を示す。パラメータβは、選択主体がｗ^（ｍ）及びｕ^（ｍ）に依存して選択をする程度を示し、値が低いと選択主体がよりランダムに選択対象を選択する傾向が増大する。また、パラメータσは選択主体の嗜好の分散性を示し、値が高いと複数の選択主体がより多様な嗜好ベクトルを有する。

【0078】

図８の４個のグラフに示すように、本実施形態の情報処理装置１０によると、従来のロジットモデルによる手法に比べて、全体的に絶対誤差が小さくテストデータに対しより正確に選択確率を推定していることがわかる。特に、本実施形態の情報処理装置１０によると、選択モデル中の環境依存度の影響が大きくなるにつれて（すなわち、横軸の値が大きくなるにつれて）、従来の手法に比べてより正確な推定ができることが示される。

【0079】

図９に示すグラフは、情報処理装置１０の学習処理時間に関する効果を示す。横軸は図８と同じであり、縦軸は情報処理装置１０が学習処理に要した時間を示す。図中のグラフに示すように、本実施形態の情報処理装置１０によると、従来のロジットモデルによる手法に比べて、処理時間が多少増加するが一般的に許容範囲に収まる程度であることがわかる。

【0080】

ここで、本実施形態の変形例に係る情報処理装置１０について説明する。本実施形態の情報処理装置１０は、各選択機会において選択対象のおかれた選択環境が不明である状況を想定して、各商品の環境依存度を成分として含む環境依存ベクトルｖ^（ｎ）を学習する。しかし、選択環境が少なくとも一部判明している場合、本変形例の情報処理装置１０は、判明している選択環境を考慮して学習を実行してよい。

【0081】

例えば、ある売場に陳列された商品が判明している場合、学習処理部１５０は、学習中、陳列されなかった商品の当該選択機会における環境依存度を低く（例えば、−∞）に固定してよい。これにより、学習処理部１５０は、判明している売場の状況を反映して学習を実行することができる。

【0082】

図１０は、情報処理装置１０として機能するコンピュータ１９００のハードウェア構成の一例を示す。本実施形態に係るコンピュータ１９００は、ホスト・コントローラ２０８２により相互に接続されるＣＰＵ２０００、ＲＡＭ２０２０、グラフィック・コントローラ２０７５、及び表示装置２０８０を有するＣＰＵ周辺部と、入出力コントローラ２０８４によりホスト・コントローラ２０８２に接続される通信インターフェイス２０３０、ハードディスクドライブ２０４０、及びＣＤ−ＲＯＭドライブ２０６０を有する入出力部と、入出力コントローラ２０８４に接続されるＲＯＭ２０１０、フレキシブルディスク・ドライブ２０５０、及び入出力チップ２０７０を有するレガシー入出力部を備える。

【0083】

ホスト・コントローラ２０８２は、ＲＡＭ２０２０と、高い転送レートでＲＡＭ２０２０をアクセスするＣＰＵ２０００及びグラフィック・コントローラ２０７５とを接続する。ＣＰＵ２０００は、ＲＯＭ２０１０及びＲＡＭ２０２０に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ２０７５は、ＣＰＵ２０００等がＲＡＭ２０２０内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置２０８０上に表示させる。これに代えて、グラフィック・コントローラ２０７５は、ＣＰＵ２０００等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。

【0084】

入出力コントローラ２０８４は、ホスト・コントローラ２０８２と、比較的高速な入出力装置である通信インターフェイス２０３０、ハードディスクドライブ２０４０、ＣＤ−ＲＯＭドライブ２０６０を接続する。通信インターフェイス２０３０は、有線又は無線によりネットワークを介して他の装置と通信する。また、通信インターフェイスは、通信を行うハードウェアとして機能する。ハードディスクドライブ２０４０は、コンピュータ１９００内のＣＰＵ２０００が使用するプログラム及びデータを格納する。ＣＤ−ＲＯＭドライブ２０６０は、ＣＤ−ＲＯＭ２０９５からプログラム又はデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。

【0085】

また、入出力コントローラ２０８４には、ＲＯＭ２０１０と、フレキシブルディスク・ドライブ２０５０、及び入出力チップ２０７０の比較的低速な入出力装置とが接続される。ＲＯＭ２０１０は、コンピュータ１９００が起動時に実行するブート・プログラム、及び／又は、コンピュータ１９００のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ２０５０は、フレキシブルディスク２０９０からプログラム又はデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。入出力チップ２０７０は、フレキシブルディスク・ドライブ２０５０を入出力コントローラ２０８４へと接続するとともに、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を入出力コントローラ２０８４へと接続する。

【0086】

ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供されるプログラムは、フレキシブルディスク２０９０、ＣＤ−ＲＯＭ２０９５、又はＩＣカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、ＲＡＭ２０２０を介してコンピュータ１９００内のハードディスクドライブ２０４０にインストールされ、ＣＰＵ２０００において実行される。

【0087】

コンピュータ１９００にインストールされ、コンピュータ１９００を情報処理装置１０として機能させるプログラムは、特徴量取得モジュール、履歴取得モジュール、学習処理モジュール、条件取得モジュール、シミュレーションモジュール、及び、出力モジュールを備える。これらのプログラム又はモジュールは、ＣＰＵ２０００等に働きかけて、コンピュータ１９００を、特徴量取得部１１０、履歴取得部１２０、学習処理部１５０、条件取得部１７０、シミュレーション部１８０、及び、出力部１９０としてそれぞれ機能させてよい。

【0088】

これらのプログラムに記述された情報処理は、コンピュータ１９００に読込まれることにより、ソフトウェアと上述した各種のハードウェア資源とが協働した具体的手段である特徴量取得部１１０、履歴取得部１２０、学習処理部１５０、条件取得部１７０、シミュレーション部１８０、及び、出力部１９０として機能する。そして、これらの具体的手段によって、本実施形態におけるコンピュータ１９００の使用目的に応じた情報の演算又は加工を実現することにより、使用目的に応じた特有の情報処理装置１０が構築される。

【0089】

一例として、コンピュータ１９００と外部の装置等との間で通信を行う場合には、ＣＰＵ２０００は、ＲＡＭ２０２０上にロードされた通信プログラムを実行し、通信プログラムに記述された処理内容に基づいて、通信インターフェイス２０３０に対して通信処理を指示する。通信インターフェイス２０３０は、ＣＰＵ２０００の制御を受けて、ＲＡＭ２０２０、ハードディスクドライブ２０４０、フレキシブルディスク２０９０、又はＣＤ−ＲＯＭ２０９５等の記憶装置上に設けた送信バッファ領域等に記憶された送信データを読み出してネットワークへと送信し、もしくは、ネットワークから受信した受信データを記憶装置上に設けた受信バッファ領域等へと書き込む。このように、通信インターフェイス２０３０は、ＤＭＡ（ダイレクト・メモリ・アクセス）方式により記憶装置との間で送受信データを転送してもよく、これに代えて、ＣＰＵ２０００が転送元の記憶装置又は通信インターフェイス２０３０からデータを読み出し、転送先の通信インターフェイス２０３０又は記憶装置へとデータを書き込むことにより送受信データを転送してもよい。

【0090】

また、ＣＰＵ２０００は、ハードディスクドライブ２０４０、ＣＤ−ＲＯＭドライブ２０６０（ＣＤ−ＲＯＭ２０９５）、フレキシブルディスク・ドライブ２０５０（フレキシブルディスク２０９０）等の外部記憶装置に格納されたファイルまたはデータベース等の中から、全部または必要な部分をＤＭＡ転送等によりＲＡＭ２０２０へと読み込ませ、ＲＡＭ２０２０上のデータに対して各種の処理を行う。そして、ＣＰＵ２０００は、処理を終えたデータを、ＤＭＡ転送等により外部記憶装置へと書き戻す。このような処理において、ＲＡＭ２０２０は、外部記憶装置の内容を一時的に保持するものとみなせるから、本実施形態においてはＲＡＭ２０２０及び外部記憶装置等をメモリ、記憶部、または記憶装置等と総称する。例えば、情報処理装置１０の記憶部は、特徴量取得部１１０、履歴取得部１２０、学習処理部１５０、条件取得部１７０、シミュレーション部１８０、及び、出力部１９０から受け取った／へ提供するデータを適宜記憶してよい。例えば、記憶部は、特徴量取得部１１０又は履歴取得部１２０から入力されたデータを受け取って記憶してよい。また、記憶部は、学習処理部１５０が学習した結果等を記憶してよい。

【0091】

本実施形態における各種のプログラム、データ、テーブル、データベース等の各種の情報は、このような記憶装置上に格納されて、情報処理の対象となる。なお、ＣＰＵ２０００は、ＲＡＭ２０２０の一部をキャッシュメモリに保持し、キャッシュメモリ上で読み書きを行うこともできる。このような形態においても、キャッシュメモリはＲＡＭ２０２０の機能の一部を担うから、本実施形態においては、区別して示す場合を除き、キャッシュメモリもＲＡＭ２０２０、メモリ、及び／又は記憶装置に含まれるものとする。

【0092】

また、ＣＰＵ２０００は、ＲＡＭ２０２０から読み出したデータに対して、プログラムの命令列により指定された、本実施形態中に記載した各種の演算、情報の加工、条件判断、情報の検索・置換等を含む各種の処理を行い、ＲＡＭ２０２０へと書き戻す。例えば、ＣＰＵ２０００は、条件判断を行う場合においては、本実施形態において示した各種の変数が、他の変数または定数と比較して、大きい、小さい、以上、以下、等しい等の条件を満たすか否かを判断し、条件が成立した場合（又は不成立であった場合）に、異なる命令列へと分岐し、またはサブルーチンを呼び出す。

【0093】

また、ＣＰＵ２０００は、記憶装置内のファイルまたはデータベース等に格納された情報を検索することができる。例えば、第１属性の属性値に対し第２属性の属性値がそれぞれ対応付けられた複数のエントリが記憶装置に格納されている場合において、ＣＰＵ２０００は、記憶装置に格納されている複数のエントリの中から第１属性の属性値が指定された条件と一致するエントリを検索し、そのエントリに格納されている第２属性の属性値を読み出すことにより、所定の条件を満たす第１属性に対応付けられた第２属性の属性値を得ることができる。

【0094】

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

【0095】

また、実施形態の説明において複数の要素が列挙された場合には、列挙された要素以外の要素を用いてもよい。例えば、「Ｘは、Ａ、Ｂ及びＣを用いてＹを実行する」と記載される場合、Ｘは、Ａ、Ｂ及びＣに加え、Ｄを用いてＹを実行してもよい。

【0096】

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

【符号の説明】

【0097】

１０情報処理装置、１１０特徴量取得部、１２０履歴取得部、１５０学習処理部、１７０条件取得部、１８０シミュレーション部、１９０出力部、１９００コンピュータ、２０００ＣＰＵ、２０１０ＲＯＭ、２０２０ＲＡＭ、２０３０通信インターフェイス、２０４０ハードディスクドライブ、２０５０フレキシブルディスク・ドライブ、２０６０ＣＤ−ＲＯＭドライブ、２０７０入出力チップ、２０７５グラフィック・コントローラ、２０８０表示装置、２０８２ホスト・コントローラ、２０８４入出力コントローラ、２０９０フレキシブルディスク、２０９５ＣＤ−ＲＯＭ

【図1】