IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7163975属性生成装置、属性生成方法および属性生成プログラム
<>
  • 特許-属性生成装置、属性生成方法および属性生成プログラム 図1
  • 特許-属性生成装置、属性生成方法および属性生成プログラム 図2
  • 特許-属性生成装置、属性生成方法および属性生成プログラム 図3
  • 特許-属性生成装置、属性生成方法および属性生成プログラム 図4
  • 特許-属性生成装置、属性生成方法および属性生成プログラム 図5
  • 特許-属性生成装置、属性生成方法および属性生成プログラム 図6
  • 特許-属性生成装置、属性生成方法および属性生成プログラム 図7
  • 特許-属性生成装置、属性生成方法および属性生成プログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-24
(45)【発行日】2022-11-01
(54)【発明の名称】属性生成装置、属性生成方法および属性生成プログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20221025BHJP
【FI】
G06N20/00
【請求項の数】 9
(21)【出願番号】P 2020565115
(86)(22)【出願日】2019-01-10
(86)【国際出願番号】 JP2019000567
(87)【国際公開番号】W WO2020144820
(87)【国際公開日】2020-07-16
【審査請求日】2021-06-28
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103090
【弁理士】
【氏名又は名称】岩壁 冬樹
(74)【代理人】
【識別番号】100124501
【弁理士】
【氏名又は名称】塩川 誠人
(72)【発明者】
【氏名】坂井 智哉
(72)【発明者】
【氏名】十河 泰弘
【審査官】大桃 由紀雄
(56)【参考文献】
【文献】国際公開第2017/094207(WO,A1)
【文献】米国特許出願公開第2018/0349795(US,A1)
【文献】特表2003-524221(JP,A)
【文献】Koutra, DANAI et al.,PNP: Fast Path Ensemble Method for Movie Design,KDD '17 Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data,米国,ACM,2017年08月17日,pp.1527-1536,https://dl.acm.org/citation.cfm?id=3098076,DOI: 10.1145/3097983.3098076
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
対象者の特徴ベクトルに基づいて当該対象者の評価結果をターゲットごとに予測する予測器による予測結果と、ターゲットの属性を説明変数として対象者ごとに学習された評価結果を予測する予測モデルによる予測結果との差を最小化するように、前記ターゲットの属性を説明変数とするモデルである属性視点モデルを対象者ごとに学習する学習部と、
学習された予測モデルに対して適用される属性に応じて得られる評価結果が、指定された目的を満たすように前記属性を生成する属性生成部とを備えた
ことを特徴とする属性生成装置。
【請求項2】
属性生成部は、関係性のある属性同士が選択されることを抑制する制約条件のもとで、指定された目的を満たすように、複数の属性を生成する
請求項1記載の属性生成装置。
【請求項3】
属性生成部は、属性視点モデルに属性を適用することで、所望の対象者像を生成する
請求項1または請求項2記載の属性生成装置。
【請求項4】
属性生成部は、属性視点モデルに属性を適用することで、指定された範囲内の対象者の中から、所望の対象者を特定する
請求項1から請求項3のうちのいずれか1項に記載の属性生成装置。
【請求項5】
属性生成部は、順位付けされた各予測結果が得られる属性をそれぞれ生成する
請求項1から請求項4のうちのいずれか1項に記載の属性生成装置。
【請求項6】
コンピュータが、対象者の特徴ベクトルに基づいて当該対象者の評価結果をターゲットごとに予測する予測器による予測結果と、ターゲットの属性を説明変数として対象者ごとに学習された評価結果を予測する予測モデルによる予測結果との差を最小化するように、前記ターゲットの属性を説明変数とするモデルである属性視点モデルを対象者ごとに学習し、
前記コンピュータが、学習された予測モデルに対して適用される属性に応じて得られる評価結果が、指定された目的を満たすように前記属性を生成する
ことを特徴とする属性生成方法。
【請求項7】
コンピュータが、関係性のある属性同士が選択されることを抑制する制約条件のもとで、指定された目的を満たすように、複数の属性を生成する
請求項6記載の属性生成方法。
【請求項8】
コンピュータに、
対象者の特徴ベクトルに基づいて当該対象者の評価結果をターゲットごとに予測する予測器による予測結果と、ターゲットの属性を説明変数として対象者ごとに学習された評価結果を予測する予測モデルによる予測結果との差を最小化するように、前記ターゲットの属性を説明変数とするモデルである属性視点モデルを対象者ごとに学習する学習処理、および、
学習された予測モデルに対して適用される属性に応じて得られる評価結果が、指定された目的を満たすように前記属性を生成する属性生成処理
を実行させるための属性生成プログラム。
【請求項9】
コンピュータに、
属性生成処理で、関係性のある属性同士が選択されることを抑制する制約条件のもとで、指定された目的を満たすように、複数の属性を生成させる
請求項8記載の属性生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、目的とするターゲットの属性を生成する属性生成装置、属性生成方法および属性生成プログラムに関する。
【背景技術】
【0002】
ビジネスシーンにおいて新たな価値を創造するために、創造的活動によって、日々新商品や新サービスが考案され、提供され続けている。商品やサービスが収益を生む要因は様々であることから、開発側の視点において、収益に結び付く可能性の高い要素の組合せを列挙する際に考慮すべき点は多い。そのため、これらの作業を人間による手作業で行うには時間もかかり、また見落としの可能性も存在する。
【0003】
さらに、マーケティングの視点から、人間が直感的に思いついた新商品やサービスも、それに対価を支払うユーザに届かなければ、商品やサービスが有する価値が活かされない。また、開発した商品やサービスが、どういったユーザ層に効果があるのか調査するにはコストおよび時間を要する。また、調査の段階において、想定外のユーザ層が対価を支払う可能性が存在したとしても、人間の直感だけでは、そのような対価を支払うユーザ層が調査計画の段階で抜け落ちる可能性もある。
【0004】
このように、人間が過去のすべての情報を把握して、成功する見込みが高い新企画を作成することは難しい。一方で、コンピュータは多くの情報を考慮したうえで、可能性の高い組み合わせを提示することが可能である。そこで、このような問題に対応するため、新商品やサービスを検討する方法が各種提案されている。
【0005】
特許文献1には、蓄積された商品データに基づき顧客に適した化粧品のカウンセリングを行なうシステムが記載されている。特許文献1に記載されたシステムは、顧客がアンケートに回答することにより生成される使用評価データに基づいて商品を提案し、提案できる商品がない場合には、その商品を顧客が実現を望んでいる商品と判断する。
【0006】
また、非特許文献1には、対象ユーザ層の特徴を用いて新しい映画を設計する方法が記載されている。非特許文献1に記載された方法では、映画の属性に対するユーザの好みを学習し、予算制約の条件の下で対象ユーザの好みを最大にするような映画の属性を選ぶことで、新しい映画を設計する。
【先行技術文献】
【特許文献】
【0007】
【文献】特開2003-85303号公報
【非特許文献】
【0008】
【文献】Koutra, D., Dighe, A., Bhagat, S., Weinsberg, U., Ioannidis, S., Faloutsos, C., & Bolot, J., "PNP: Fast path ensemble method for movie design”, In Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 1527-1536, August 2017.
【発明の概要】
【発明が解決しようとする課題】
【0009】
特許文献1に記載されたシステムでは、顧客に対して繰り返し商品を提案することで、新規に開発が必要な商品の特性を特定する。そのため、ユーザの協力が不可欠であるとともに、複数の商品を顧客に利用してもらう必要があるため、多くのコストがかかってしまうという問題がある。
【0010】
また、非特許文献1に記載された方法では、対象ユーザの属性に対する平均的な好み(レーティング)を学習し、選ばれた属性のレーティングの和が大きくなるように映画を設計する。しかし、非特許文献1に記載された方法では、映画そのもののレーティングの高さ(すなわち、映画の売上等)を考慮していない。
【0011】
すなわち、非特許文献1に記載された方法では、対象ユーザの個々の属性に対する評価を行っているにすぎず、属性全体に対する評価を行っているわけではないため、個々の属性の評価の単純な和が、必ずしも属性全体の評価になるとは限らないという問題がある。さらに、非特許文献1に記載された方法では、対象ユーザの個々の特徴自体から予測を行なっているわけではないため、対象ユーザに関する特徴を生かして属性を生成することができていないという問題もある。
【0012】
そのため、過去のデータに基づいて、高収益を見込み得る新商品像や、ある商品に対して高い収益を見込める利用者像など、目的に応じたターゲットを表わす属性を生成できることが好ましい。
【0013】
そこで、本発明では、目的に応じたターゲットを表わす属性を生成できる属性生成装置、属性生成方法および属性生成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0014】
本発明による属性生成装置は、対象者の特徴ベクトルに基づいてその対象者の評価結果をターゲットごとに予測する予測器による予測結果と、ターゲットの属性を説明変数として対象者ごとに学習された評価結果を予測する予測モデルによる予測結果との差を最小化するように、ターゲットの属性を説明変数とするモデルである属性視点モデルを対象者ごとに学習する学習部と、学習された予測モデルに対して適用される属性に応じて得られる評価結果が、指定された目的を満たすように、属性を生成する属性生成部とを備えたことを特徴とする。
【0015】
本発明による属性生成方法は、コンピュータが、対象者の特徴ベクトルに基づいてその対象者の評価結果をターゲットごとに予測する予測器による予測結果と、ターゲットの属性を説明変数として対象者ごとに学習された評価結果を予測する予測モデルによる予測結果との差を最小化するように、ターゲットの属性を説明変数とするモデルである属性視点モデルを対象者ごとに学習し、コンピュータが、学習された予測モデルに対して適用される属性に応じて得られる評価結果が、指定された目的を満たすように属性を生成することを特徴とする。
【0016】
本発明による属性生成プログラムは、コンピュータに、対象者の特徴ベクトルに基づいてその対象者の評価結果をターゲットごとに予測する予測器による予測結果と、ターゲットの属性を説明変数として対象者ごとに学習された評価結果を予測する予測モデルによる予測結果との差を最小化するように、ターゲットの属性を説明変数とするモデルである属性視点モデルを対象者ごとに学習する学習処理、および、学習された予測モデルに対して適用される属性に応じて得られる評価結果が、指定された目的を満たすように属性を生成する属性生成処理を実行させることを特徴とする。
【発明の効果】
【0017】
本発明によれば、目的に応じたターゲットを表わす属性を生成できる。
【図面の簡単な説明】
【0018】
図1】本発明による属性生成装置の一実施形態の構成例を示すブロック図である。
図2】属性を生成する際の設定処理の例を示すフローチャートである。
図3】属性生成装置の動作例を示すフローチャートである。
図4】属性を生成する処理の具体例を示す説明図である。
図5】属性を生成する動作例を説明する説明図である。
図6】対象者像の生成および対象者の選択を行う動作例を説明する説明図である。
図7】本発明による属性生成装置の概要を示すブロック図である。
図8】少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
【発明を実施するための形態】
【0019】
まず、本発明による属性生成装置の説明をする前に、本発明に関連する技術であるゼロショット学習について説明する。ゼロショット学習とは、学習時には対応するラベルが付加された教師データがないクラスやタスクに対しても、テスト時にそのクラスやタスクにおけるラベルを予測するための学習方法である。ゼロショット学習では、対象者の特徴量およびターゲットの属性の2つを入力とする予測器が構成される。
【0020】
この方法を用いることで、例えば、分類の場合、テスト時に未知のクラスが存在しても、クラスを説明する属性があれば分類可能になり、回帰の場合、テスト時に未知のタスクが存在しても、タスクを説明する属性があれば予測可能になる。例えば、新商品の売上を予測する場面において、未知のタスクが新商品であり、予測対象が売上になる。
【0021】
ゼロショット学習では、例えば、新商品の売上を予測可能であることから、ゼロショット学習は、新商品であっても売上が高いか低いかを事前に見積れる方法であると言える。そこから、本願発明者は、売上の高さから新商品の属性を生成できるとの着想を得た。すなわち、本願発明者は、売上や満足度などの目的から、ターゲットを表わす属性を生成できるとの着想を得た。
【0022】
具体的には、本発明では、新商品や新店舗、新サービスを構成するものを属性変数の集まりで表現したとき、高い収益を見込める商品や店舗、サービスに結び付く可能性の高い属性変数の組合せをデータに基づいて生成する。また、開発した新商品やサービスなどに高い対価を支払うであろうユーザ像や、所定のグループ内に存在するユーザのうち、より目的に近いユーザ像を選択する。
【0023】
本発明では、対象者が所望する評価結果に沿ったターゲットの属性を生成する。以下では、発明の理解を容易にするため、対象ユーザにとって平均的に良好と考えられる平均売上が高い商品の属性を生成する場合を具体例として適宜説明する。ただし、対象ユーザは対象者の一例であり、対象者には、個人ユーザだけでなく、団体や企業なども含まれる。また、平均売上は、評価結果の一例であり、評価結果には、売上や満足度など、いわゆる各種レーティングの集計結果(平均、上位等)などが含まれる。また、商品は、ターゲットの一例であり、ターゲットには、商品だけでなく、サービスや店舗なども含まれる。
【0024】
以下、本発明の実施形態を図面を参照して説明する。
【0025】
図1は、本発明による属性生成装置の一実施形態の構成例を示すブロック図である。本実施形態の属性生成装置100は、記憶部10と、学習部20と、属性生成部30とを備えている。
【0026】
記憶部10は、対象者の特徴を表わす情報(以下、特徴ベクトルと記す。)の集合を記憶する。記憶部10は、例えば、ユーザの特徴ベクトルの集合を記憶する。以下の説明では、ユーザの特徴ベクトルをxと記し、その特徴ベクトルxの集合を{x∈R i=1と記す。ここで、nは、対象者数である。
【0027】
例えば、対象者として、個人ユーザを考える。この場合、対象者の特徴を表わす情報として、性別や年齢、住所や職業などが挙げられる。
【0028】
また、記憶部10は、各ターゲットに対する評価器(予測器)の集合を記憶する。記憶部10は、例えば、各商品に対する売上予測器の集合を記憶する。以下の説明では、売上予測器をhと記し、その予測器hの集合を{h:R→R} t=1と記す。予測器hは、特徴ベクトルを引数として評価結果を出力する。具体的には、評価器hは、ユーザの特徴ベクトルを引数として売上の予測値y^(yの上付きハット)を出力する。ここで、kは、ターゲット数(例えば、商品がターゲットであれば既存の商品数)である。
【0029】
例えば、売上を予測する予測器を考える。この場合、予測器は、日付情報や天気情報などを入力として売上を予測する。予測器には、現在運用中の予測器が用いられてもよく、対応する予測器が存在しない場合には、一般的な方法を用いて新たに作成されてもよい。
【0030】
また、記憶部10は、各ターゲットの特性を表わす属性の集合を記憶する。以下の説明では、単に属性と記した場合、1以上の属性変数の集合(属性ベクトル)を表わすものとする。
【0031】
属性変数は、例えば、実数値、二値もしくはカテゴリ値またはこれらの組合せである。実数値の例として、金額やカロリー、量などが挙げられる。実数値には、区間(例えば、[0,1]区間で割合を表示など、)が指定されていてもよい。二値の属性変数は、例えば、情報の有無(例えば、材料を含むか否か、など)を示すほか、候補が二つの場合に用いられる。カテゴリ値は、例えば、複数の候補(例えば、製造会社、種類の別など)がある場合に用いられる。なお、カテゴリ値は、二値変数に変更可能である。例えば、カテゴリ値A,B,Cが存在する場合、それぞれ、[1,0,0]、[0,1,0]、[0,0,1]と表わすことが可能である。上記の組合せとして、例えば、m個の実数値で表される属性や、t個の実数値と、m-t個の二値で表される属性などが挙げられる。
【0032】
記憶部10は、例えば、各商品の特性を表わす属性ベクトルの集合を記憶する。以下の説明では、属性ベクトルをaと記し、属性ベクトルaの集合を{a∈R|||a|| =1} t=1と記す。
【0033】
例えば、ターゲットとして、商品(アイスクリーム類)を考える。この場合、アイスクリーム類の特性を表わす特性(すなわち、属性変数)として、商品名や商品説明から切り出した単語や、種類(アイスミルク、など)、栄養成分(無脂乳固形分7.0%、乳脂肪分4.0%、卵脂肪分0.5%など)、原材料名(乳製品、砂糖、はちみつ、卵黄、など)、内容量、価格、製造会社、用途などが挙げられる。なお、属性変数は文字データに限られず、例えば、商品パッケージを示す画像であってもよい。
【0034】
さらに、記憶部10は、ある特定の対象者xに対するターゲット属性視点の予測モデル(以下、単に予測モデルと記す。)を記憶する。ターゲット属性視点の予測モデルとは、ターゲットの特性を表わす属性変数を説明変数とし、評価結果(例えば、売上、満足度など)を目的変数とする予測モデルである。言い換えると、この予測モデルは、対象者を固定してターゲットを入れ替えた場合に評価結果がどのように変わるか示すモデルであると言える。以下の説明では、ある特定の対象者xに対する予測モデルをf:R→Rと記す。この予測モデルの態様は、予め定められる。
【0035】
また、記憶部10は、予測の目標とする入力データを記憶する。この入力データは、上述する予測器を用いた予測に用いられるデータである。例えば、上記予測器によって8月分の売上予測を行う場合、入力データとして、8月分の日付情報や天気情報が入力データとして記憶される。また、記憶部10は、この入力データを予測器に適用した結果(予測結果)と入力データとを対応付けたデータを学習データとして記憶する。なお、記憶部10は、予測結果に基づく学習データのみを記憶してもよい。
【0036】
このようにして生成される学習データは、商品の予測結果を表わすデータであると言える。さらに、この学習データから商品が特定できることから、その商品の特性を表わす複数の属性も特定できることになる。
【0037】
学習部20は、学習データに基づいて、ターゲットの属性視点の予測モデルを学習する。具体的には、学習部20は、対象者ごとに、予測器による予測結果と予測モデルによる予測結果との差を最小化するように上記予測モデルを学習する。例えば、商品のユーザ売上に着目した場合、学習部20は、ユーザの売上を商品ごとに予測する予測器にユーザの特徴ベクトルを適用して、第一の予測結果を算出する。さらに、学習部20は、商品の属性を説明変数としてユーザごとに学習された売上を予測する予測モデルに上記学習データを適用して、第二の予測結果を算出する。そして、学習部20は、第一の予測結果と第二の予測結果との差を最小化するように上記予測モデルを学習する。
【0038】
なお、学習部20が、予測モデルを学習する方法は任意である。ここで、属性視点の売上予測モデルの態様が線形モデルであると仮定すると、予測モデルは、以下に例示する式1で表される。
【0039】
【数1】
【0040】
この場合、学習部20は、対象者全てに対して以下に例示する式2の最適化問題を解くことで、属性視点の売上予測モデルを学習する。なお、式2においてλ≧0は、正則化パラメータである。また、下記に示すI∈Rm×mは、単位行列である。
【0041】
【数2】
【0042】
なお、予測モデルは、線形モデルである場合に限定されず、ニューラルネットワークなど、他の一般的なモデルであってもよい。上記に示す式2を一般化すると、学習部20が解く最適化問題は、以下に例示する式3で表すことができる。式3において、W(・)は正則化関数であり、λは正則化パラメータである。
【0043】
【数3】
【0044】
例えば、上記に示す商品(アイスクリーム類)の場合、学習部20は、各アイスクリーム類の属性と予測売上との対応を表わす関数を学習していると言える。
【0045】
属性生成部30は、対象者ごとに学習された属性視点の予測モデルに基づいて、ターゲットの属性を生成する。上述するように、予測モデルは、対象者を固定してターゲットを入れ替えた場合に評価結果がどのように変わるか示すモデルであり、ターゲットの属性が指定されたときの各対象者の評価結果を表わすモデルである。
【0046】
予測モデルに対して各属性の組合せを選択すると全体の評価結果が決定されることになる。そこで、属性生成部30は、学習された予測モデルに対して適用される属性に応じて得られる評価結果が指定された目的を満たすように、定められた制約において、属性を生成する。
【0047】
例えば、予測モデルが上記に示す式2で算出されており、平均売上を最大にする属性を得ることを目的とするものとする。この場合、属性ベクトルaに対する平均売上は、式1に基づき、以下に例示する式4で表すことができる。
【0048】
【数4】
【0049】
実際、aは、未知の属性である。そこで、属性生成部30は、以下に例示する式5の最適化問題を解くことにより、平均売上を最大にするような属性を生成する。式5において、Sは、各対象者の予測モデルの係数からなるm×n次元の行列である。
【0050】
【数5】
【0051】
なお、上記に例示する式5の最適化問題を解くことにより、属性a^(aの上付きハット)は、以下の式6のように算出される。
【0052】
【数6】
【0053】
なお、一般的なモデルに対しても、同様の方法で属性を生成することができる。例えば、予測モデルが上記に示す式3で算出されており、同様に、平均売上を最大にする属性を得ることを目的とするものとする。この場合、属性ベクトルaに対する平均売上は、以下に例示する式7で表すことができる。
【0054】
【数7】
【0055】
このとき、属性生成部30は、以下に例示する式8の最適化問題を解くことにより、平均売上を最大にするような属性を生成できる。属性生成部30は、例えば、目的関数のaに関する勾配を計算して更新し、更新したaを正規化して制約を満たすように(すなわち、射影勾配法によって)式8の最適化問題を解いてもよい。
【0056】
【数8】
【0057】
このようにして、属性生成部30は、学習された予測モデルに対して適用される属性に応じて得られる評価結果が平均売上を最大にするように、定められた制約において属性を生成すればよい。
【0058】
なお、属性生成部30が生成する属性の数は一つに限られず、複数であってもよい。属性生成部30、例えば、出来るだけ売上を高くするような複数の属性を生成してもよい。
【0059】
例えば、予測モデルが上記に示す式2で算出されており、売上を高くする属性を3つ取得することを目的とするものとする。この場合、属性生成部30は、以下に例示する式9の最適化問題を解くことにより、複数(3つ)の属性を生成してもよい。
【0060】
【数9】
【0061】
さらに、生成される複数の属性がそれぞれ多様な属性を示すように、以下に例示する式10の制約が加えられてもよい。
【0062】
【数10】
【0063】
式10に例示する制約は、多様な属性を得るための制約条件であり、関係性のある属性同士が選択されることを抑制するための条件である。具体的には、この制約条件は、生成される属性ベクトルを含む行列と、その行列の転置行列との内積が単位行列になるという条件として定義できる。式10に例示するように、直交する属性を生成することで、生成する属性の多様化を実現できる。実用上は、生成されるベクトル同士が直交する制約を、ベクトル同士の内積を適当な閾値以下にする制約に変更してもよい。これにより、ベクトル同士が直交する制約に近い効果を得つつ、短い計算時間で解を得ることが可能になる。
【0064】
例えば、上述する商品(アイスクリーム類)の場合、属性生成部30は、栄養成分や原材料、内容量などの制約のもとで、学習された関数を最大にする新しいアイスクリーム類の属性を生成する。属性生成部30は、生成した属性のアイスクリーム類を売上が見込める新しいアイスクリーム類としてユーザに提示する。
【0065】
また、属性生成部30は、属性視点の予測モデルに属性を適用することで、所望の対象者像を生成してもよい。具体的には、属性生成部30は、属性視点の予測モデルに属性を適用して評価結果を取得し、その評価結果が指定された条件を満たす対象者を特定することで、所望の対象者像を生成してもよい。また、特定する対象者の範囲(以下、ドメインと記すこともある)が指定されている場合、属性生成部30は、そのドメイン内から所望の対象者像を特定してもよい。
【0066】
例えば、開発された新商品の売上が見込める対象者像を生成する場合を想定する。予測モデルが上記の式1に例示する線形モデルで表されている場合、開発された新商品の属性をanewとすると、各対象者に対する売り上げは、以下に例示する式11で予測される。
【0067】
【数11】
【0068】
そこで、属性生成部30は、上記式11に基づいて算出される売上が指定された条件を満たす対象者を特定する。例えば、「売上が高い上位10%の対象者を選択する」という条件が指定されていた場合、属性生成部30は、算出された売上が上位10%内である対象者を特定する。
【0069】
属性生成部30は、特定した対象者をそのままユーザに提示してもよい。また、属性生成部30は、特定した複数の対象者の平均像を生成して出力してもよい。平均像の生成方法として、評価結果の平均を算出する方法や、対象者の平均像を生成する方法が挙げられる。
【0070】
属性生成部30は、例えば、以下に例示する式12に基づいて、売上上位10%の対象者の売上の平均を算出してもよい。なお、対象者が、例えば、ユーザIDで特定されている場合、式12において、r(・)は、ユーザIDを売上が高い順に並べた時の順位を返す関数として定義される。
【0071】
【数12】
【0072】
また、属性生成部30が対象者の平均像を生成する方法は任意である。属性生成部30は、例えば、対象者データの多様体構造を考慮して平均を算出し、その算出結果を対象者の平均像として出力してもよい。具体的には、対象ユーザの特定の要素に対する好みは線形でないことが多い。そのため、属性生成部30は、好き嫌いの変化の非線形性を考慮して(または、他の機械学習手法を利用して非線形性を学習して)平均を計算してもよい。
【0073】
なお、上記説明では、ターゲットとして、商品(アイスクリーム類)の例を説明した。他のターゲットとして、店舗やサービスについても同様の方法で属性を生成できる。以下、店舗およびサービスの具体例を説明する。
【0074】
店舗(コンビニエンスストア)の例では、既存の店舗の属性変数が挙げられる。具体的には、アイスクリーム類の特性を表わす特性(すなわち、属性変数)として、所在情報(関東地方、神奈川県、川崎市、中原区、下沼部、など)、デモグラフィック情報(人口、年代別人口、男女比など)、周辺情報(役所近辺、学校近辺、会社近辺、幹線道路沿い、など)、半径1km内の推定人口、店舗面積、駐車可能台数などが挙げられる。他にも、周辺住民状況や近隣店舗、敷地、階数、業種などが属性変数として用いられてもよい。
【0075】
さらに、各店舗の売上予測を行う予測器の集合が準備される。この予測器も、運用中のものであってもよく、新たに生成されるものであってもよい。予測器は、例えば、日付情報や天気情報などを入力として売上を予測する。そして、予測の目標とする入力データ(例えば、適当な期間中の日付情報や天気情報)を用意し、上記予測器を用いて既存の店舗の予測売上を計算し、学習データとする。
【0076】
学習部20は、学習データに基づいて、店舗の属性視点の予測モデルを学習する。具体的には、学習部20は、各店舗の属性と予測売上との対応を表わす関数を学習する。属性生成部30は、店舗面積などの制約のもとで、学習した関数を最大にする新しい店舗の属性を生成する。属性生成部30は、例えば、新店舗候補の属性から、学習した関数を最大にする店舗属性を選択してもよい。そして、属性生成部30は、売上が見込める新しい店舗の属性を提示する。
【0077】
サービス(食事サービス)の例では、既存の食事サービスの属性変数が挙げられる。具体的には、カロリーや栄養成分、量や金額などが挙げられる。他にも、月額費用や、サービスを構成する要素(例えば、ケーブルテレビのチャンネル、サプリメントの定期配送における各種サプリメント、洋服(レンタル)の定期配送における各種洋服、お菓子の定期配送における各種お菓子、食品の定期配送における各種食品、化粧品の定期配送における各種化粧品、漫画の定期配送における各種漫画、など)が属性変数として用いられてもよい。
【0078】
さらに、各サービスの満足度予測を行う予測器の集合が準備される。この予測器も、運用中のものであってもよく、新たに生成されるものであってもよい。予測器は、例えば、
顧客属性や購買履歴などを入力として、配送された食事に対する満足度を予測する。ここで、食事サービスは、各種セット(満腹セット、塩分控えめセット、無理せずダイエットセットなど)が存在すると仮定する。そして、目標とする入力データ(例えば、特定の顧客や複数の顧客)を用意し、上記予測器を用いて既存のサービスの満足度を計算し、学習データとする。
【0079】
学習部20は、学習データに基づいて、サービスの属性視点の予測モデルを学習する。具体的には、学習部20は、各サービスの属性と予測満足度との対応を表わす関数を学習する。属性生成部30は、カロリーや量、栄養成分、金額などの制約のもとで、学習した関数を最大にする新しいサービスの属性を生成する。そして、属性生成部30は、満足度が見込める新しいサービスの属性を提示する。
【0080】
学習部20と、属性生成部30とは、プログラム(属性生成プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array ))によって実現される。
【0081】
例えば、プログラムは、属性生成装置が備える記憶部10に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、学習部20および属性生成部30として動作してもよい。また、属性生成装置の機能がSaaS(Software as a Service )形式で提供されてもよい。
【0082】
学習部20と、属性生成部30とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
【0083】
また、属性生成装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
【0084】
次に、本実施形態の属性生成装置の動作を説明する。図2は、属性を生成する際の設定処理の例を示すフローチャートである。
【0085】
まず、各ターゲットの属性が作成され(ステップS11)、各ターゲットに対する予測器が準備される(ステップS12)。この予測器は、予め存在することが仮定されてもよいし、新たに生成されてもよい。次に、対象とする特徴量のドメインが設定される(ステップS13)。これは、候補とする対象者を設定することに対応する。そして、生成したい属性の性質(目標)を決定する(ステップS14)。目標の例として、例えば、平均値最大、閾値以上の複数候補、などが挙げられる。その後、属性生成装置100が、属性を生成し、出力する(ステップS15)。
【0086】
図3は、本実施形態の属性生成装置100の動作例を示すフローチャートである。学習部20は、予測器による予測結果と予測モデルによる予測結果との差を最小化するように、属性視点モデルを対象者ごとに学習する(ステップS21)。そして、属性生成部30は、学習された予測モデルに対して適用される属性に応じて得られる評価結果が、指定された目的を満たすように属性を生成する(ステップS22)。
【0087】
以上のように、本実施形態では、学習部20が、対象者の特徴ベクトルに基づいてその対象者の評価結果をターゲットごとに予測する予測器による予測結果と、ターゲットの属性を説明変数として対象者ごとに学習された評価結果を予測する予測モデルによる予測結果との差を最小化するように、属性視点モデルを対象者ごとに学習する。そして、属性生成部30が、学習された予測モデルに対して適用される属性に応じて得られる評価結果が、指定された目的を満たすように属性を生成する。よって、目的に応じたターゲットを表わす属性を生成できる。
【0088】
すなわち、本実施形態の属性生成装置100を用いることで、新商品開発のアシストや、新店舗の出店先および出店内容のアシスト、新サービス企画のアシストが可能になる。さらに、本実施形態の属性生成装置100を用いることで、新商品やサービスのターゲットユーザの分析、新商品やサービスに高い対価を支払うであろうユーザの選定等を行うことも可能になる。このように、本実施形態の属性生成装置100は、創造的ビジネス活動における意思決定をアシストするために、高収益や多様性といった観点から属性を生成することで、創造的活動を促進していると言える。
【0089】
また、例えば、非特許文献1には、属性としてカテゴリ値を用いる方法については開示されているが、連続値を用いる方法については開示されていない。本実施形態では、属性値が連続値の場合にも、同様に属性を生成できる。なお、本実施形態においてカテゴリ値を扱う場合、カテゴリ値を二値化し、二値制約を境界付き連続値制約に緩和した最適化問題を解けばよい。また、その際、実数値で表される属性ベクトルのL2ノルムが単位であるといった制約を適宜変更する(例えば、一つの属性ベクトルにおいて0または1になるカテゴリ変数の数を制限する)ことが好ましい。同様に、多様な属性ベクトルを生成する場合も、特定のカテゴリ変数を出力できる属性ベクトルの数を制限することで達成できる。
【0090】
次に、本実施形態の変形例を説明する。上記実施形態では、指定される目的として、平均売上が高い商品の属性を生成する場合を例示した。以下、指定される目的の他の具体例を説明する。なお、以下の説明では、ターゲットの属性変数を並べたm次元の属性ベクトル(m次元の属性ベクトル)がk個存在し、対象者の特徴量を並べたd次元のベクトル(d次元の特徴ベクトル)がn個存在するものとする。そして、特徴ベクトルを入力として予測値を返す関数(予測器)がk個存在するものとする。また、本変形例では、説明を簡易にするため、実数値の属性ベクトルを考える。ただし、カテゴリ値、または実数値とカテゴリ値両方の属性変数を有する属性ベクトルを扱う場合、上記の実数値およびカテゴリ値に対して適切な制限を属性変数の種類に応じて加えればよい。
【0091】
また、各予測器に対して、n個の特徴量(説明変数)に対するn個の予測結果を得ているものとし、学習部20が、予測器に対応する属性変数と評価結果との対応関係を予測モデルとして学習しているものとする。また、対象者の集合をXと記す。
【0092】
第一の目的として、予測モデルの評価結果を最大にするような属性(ベクトル)を求めるケースが挙げられる。属性生成部30は、この目的を満たす属性を、以下に例示する式13で算出してもよい。
【0093】
【数13】
【0094】
第二の目的として、s個の属性変数に対応する予測モデルの和を最大にするs個の多様な属性変数を求めるケースが挙げられる。属性生成部30は、この目的を満たす属性変数を、以下に例示する式14で算出してもよい。
【0095】
【数14】
【0096】
第三の目的として、予測モデルの評価結果の最大値のτ倍よりも大きくなるようなs個の多様な属性変数を求めるケースが挙げられる。属性生成部30は、この目的を満たす属性変数を、以下に例示する式15または式16で算出してもよい。なお、式15および式16の制約は、いずれも同じである。また、τ≧0は、ハイパーパラメータである。
【0097】
【数15】
【0098】
図4は、属性を生成する処理の具体例を示す説明図である。図4(a)に例示するグラフは、第一の目的に対応し、評価結果を最大にするような丸印で示す属性を選択していることを示す。図4(b)に例示するグラフは、第二の目的に対応し、評価結果の中から3つ(s=3)の属性を、それぞれ多様な観点から生成していることを示す。図4(c)に例示するグラフは、第三の目的に対応し、評価結果の中から最大値の0.7倍(t=0.7)よりも大きくなるような3つ(s=3)の属性を、それぞれ多様な観点から生成していることを示す。
【0099】
第四の目的として、予測モデルの評価結果の分散を小さくするような属性変数を求めるケースが挙げられる。評価結果の分散を小さくするようにすることで、得られる属性変数に対する効用が大きく変動することを抑制できる。この場合、属性生成部30は、分散計算における平均として、既知のm個の属性変数に対する評価結果の平均を用いればよい。具体的には、属性生成部30は、この目的を満たす属性変数を、以下に例示する式17で算出してもよい。
【0100】
【数16】
【0101】
第五の目的として、n個の説明変数に対する予測モデルの評価結果に基づいて計算されるCVaR(Conditional Value at Risk )を最大化する属性変数を求めるケースが挙げられる。属性生成部30は、この目的を満たす属性変数を、以下に例示する式18で算出してもよい。式18に例示するCVaRのα(0≦α≦1)は、評価結果の小さい方からの割合を示す。例えば、評価結果の小さい方からの割合が5%までを考慮する場合、α=0.05が設定される。
【0102】
【数17】
【0103】
第六の目的として、n個の説明変数をクラスタ化し、クラスタごとに評価結果を最大化する属性変数を求めるケースが挙げられる。この場合、属性生成部30は、まず、k-meansなどのクラスタリング手法を用いて特徴量に基づくクラスタ化を行い、対象者のクラスタ{C j=1を生成する。そして、属性生成部30は、各クラスタについて、上記の第一の目的で示す処理を行えばよい。
【0104】
第七の目的として、評価結果を最大化するような属性ベクトルを、その属性に対するコスト(例えば、予算)の制約のもとで求めるケースが挙げられる。すなわち、各属性変数を選んだときのコストと、予算が与えられた際に予算以下になるように属性を選ぶケースである。このコストには、属性変数の値に応じたコスト(例えば、値が大きくなると高くなるコスト)が用いられてもよい。この場合、属性生成部30は、予算制約のもとで、以下に例示する式19を用いて属性(ベクトル)を算出してもよい。
【0105】
【数18】
【0106】
式19においてPは費用の最大値であり、cはコストを示す費用ベクトルである。例えば、4つの属性変数が存在する場合、費用ベクトルcは、単位を万円とすると、例えば、c=(10,5,3,7)のように、属性変数に対応させて定義される。
【0107】
なお、上記に示す式19を用いた場合、費用を最大まで使用する属性ベクトルが算出され得る。一方、最大の費用が設定されていたとしても、できるだけ費用は抑えられる方が好ましい。そこで、属性生成部30は、費用を抑制するように、以下に例示する式20を用いて属性(ベクトル)を算出してもよい。式20において、τ≧0は、ハイパーパラメータである。
【0108】
【数19】
【0109】
第八の目的として、予測モデルの評価結果を最大化するトップからs個の属性ベクトルを求めるケースが挙げられる。属性生成部30は、この目的を満たす属性(ベクトル)を、以下に例示する式21で算出してもよい。
【0110】
【数20】
【0111】
第九の目的として、予測モデルの評価結果として、評価結果の平均値、最大値および、平均値と最大値の中間値が得られる3つの属性ベクトルを求めるケースが挙げられる。新たな属性を提示されたユーザにとって、最大値が得られると予測される属性が提示された場合、比較対象が存在しないことから、納得感を十分に得られない場合がある。このような場合を想定し、属性生成部30が、順位付けされた各評価結果が得られる属性をそれぞれ生成する、すなわち、最大値、中間値および平均値(言い換えると、松竹梅のような順位付)が得られると予測される属性をそれぞれ求めてユーザに提示することで、ユーザへの納得感を高めることが可能になる。
【0112】
まず初めに、属性生成部30は、例えば、第一の目的で示す処理と同様、以下に例示する式22を用いて、評価結果を最大するような属性を算出する。次に、属性生成部30は、以下に例示する式23を用いて、評価結果の平均値が得られる属性(ベクトル)を算出する。そして、属性生成部30は、以下に例示する式24を用いて、評価結果の中間値が得られる属性(ベクトル)を算出する。
【0113】
【数21】
【0114】
次に、本実施形態の属性生成装置の動作の具体例を説明する。図5は、属性を生成する動作例を説明する説明図である。図5に示す例は、各雑誌に対するユーザの満足度が予測できる系200が存在する状況で、新たな雑誌の属性を生成するシステムの一例である。
【0115】
ここで、目的として、ある特徴量で示される対象ユーザ201の平均満足度が高い属性を3つ知りたいという状況を想定する。この場合、系200から出力される評価結果202と、対象ユーザ201の特徴量203を、目的を示すクエリ204とともに、属性生成装置100へ入力する。ここで、評価結果202は、属性視点モデルによる評価結果に対応し、特徴量203は、対象となる対象者の特徴ベクトルに対応する。また、目的を示すクエリ204は、属性を生成する際に指定される目的に対応する。
【0116】
属性生成装置100は、生成した属性を出力装置300に出力することで、ユーザに対して新しい雑誌の属性を提示する。
【0117】
図6は、対象者像の生成および対象者の選択を行う動作例を説明する説明図である。図6に示す例は、各雑誌に対するユーザの満足度が予測できる系210が存在する状況で、ある雑誌を好む平均ユーザ像を生成し、また、ユーザグループの中からある雑誌を好むユーザを特定するシステムの一例である。
【0118】
まず、属性1で表される雑誌1を好む平均ユーザ像を知りたいとする。この場合、系210から出力される評価結果212と、雑誌の属性213を、目的を示すクエリ214とともに、属性生成装置100へ入力する。ここで、評価結果212は、属性視点モデルによる評価結果に対応し、属性213は、ターゲットの属性ベクトルに対応する。また、目的を示すクエリ214は、所望の対象者像を表わすクエリに対応する。属性生成装置100は、クエリに基づいてユーザ(対象者)を特定して平均ユーザ像を生成する。
【0119】
次に、指定された対象者の範囲から、属性1で表される雑誌1を好むユーザを特定したいとする。この場合、系210から出力される評価結果212と、雑誌の属性223およびユーザの特徴量215を、目的を示すクエリ224とともに、属性生成装置100へ入力する。ここで、ユーザ215は、指定された範囲内の対象者に対応する。属性生成装置100は、クエリに基づいてユーザ(対象者)を特定する。
【0120】
属性生成装置100は、平均ユーザ像および特定したユーザを出力装置300に出力することで、ユーザに対して対象とするユーザを提示する。
【0121】
次に、本発明の概要を説明する。図7は、本発明による属性生成装置の概要を示すブロック図である。本発明による属性生成装置80(例えば、属性生成装置100)は、対象者(例えば、個人ユーザや団体、企業など)の特徴ベクトルに基づいて、その対象者の評価結果(例えば、レーティング、売上、満足度、など)をターゲット(例えば、商品、サービス、店舗、など)ごとに予測する予測器による予測結果と、ターゲットの属性を説明変数として対象者ごとに学習された評価結果を予測する予測モデルによる予測結果との差を最小化するように、ターゲットの属性を説明変数とするモデルである属性視点モデルを対象者ごとに学習する学習部81(例えば、学習部20)と、学習された予測モデルに対して適用される属性に応じて得られる評価結果が、指定された目的(例えば、平均売上を最大化する属性を生成する、など)を満たすように、属性を生成する属性生成部82(例えば、属性生成部30)とを備えている。
【0122】
そのような構成により、目的に応じたターゲットを表わす属性を生成できる。
【0123】
また、属性生成部は、関係性のある属性同士が選択されることを抑制する制約条件(例えば、属性ベクトル同士の直交行列が単位行列になる、など)のもとで、指定された目的を満たすように、複数の属性を生成してもよい。そのような構成により、多様な属性を生成することが可能になる。
【0124】
また、属性生成部は、属性視点モデルに属性を適用することで、所望の対象者像(例えば、ターゲットの属性を好むユーザ像など)を生成してもよい。
【0125】
また、属性生成部は、属性視点モデルに属性を適用することで、指定された範囲内の対象者の中から、所望の対象者を特定してもよい。
【0126】
また、属性生成部は、順位付けされた(例えば、最大値、中間値、平均値の順、など)各予測結果が得られる属性をそれぞれ生成してもよい。そのような構成により、ユーザの納得感を高めることが可能になる。
【0127】
図8は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1000は、プロセッサ1001、主記憶装置1002、補助記憶装置1003、インタフェース1004を備える。
【0128】
上述の属性生成装置は、コンピュータ1000に実装される。そして、上述した各処理部の動作は、プログラム(属性生成プログラム)の形式で補助記憶装置1003に記憶されている。プロセッサ1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、当該プログラムに従って上記処理を実行する。
【0129】
なお、少なくとも1つの実施形態において、補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD-ROM(Compact Disc Read-only memory )、DVD-ROM(Read-only memory)、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000が当該プログラムを主記憶装置1002に展開し、上記処理を実行してもよい。
【0130】
また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【符号の説明】
【0131】
10 記憶部
20 学習部
30 属性生成部
100 属性生成装置
図1
図2
図3
図4
図5
図6
図7
図8