特開2018-194940(P2018-194940A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特開2018-194940情報処理装置、情報処理方法、及び情報処理プログラム
<>
  • 特開2018194940-情報処理装置、情報処理方法、及び情報処理プログラム 図000008
  • 特開2018194940-情報処理装置、情報処理方法、及び情報処理プログラム 図000009
  • 特開2018194940-情報処理装置、情報処理方法、及び情報処理プログラム 図000010
  • 特開2018194940-情報処理装置、情報処理方法、及び情報処理プログラム 図000011
  • 特開2018194940-情報処理装置、情報処理方法、及び情報処理プログラム 図000012
  • 特開2018194940-情報処理装置、情報処理方法、及び情報処理プログラム 図000013
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2018-194940(P2018-194940A)
(43)【公開日】2018年12月6日
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20181109BHJP
【FI】
   G06F17/30 210D
【審査請求】未請求
【請求項の数】12
【出願形態】OL
【全頁数】22
(21)【出願番号】特願2017-96353(P2017-96353)
(22)【出願日】2017年5月15日
(71)【出願人】
【識別番号】500257300
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110000637
【氏名又は名称】特許業務法人樹之下知的財産事務所
(72)【発明者】
【氏名】真田 勉
(57)【要約】
【課題】各グループの目標値に対して分類対象を適切に分類可能とする情報処理装置、情報処理方法、及び情報処理プログラムを提供する。
【解決手段】サーバ装置10は、ユーザの属性を示すユーザ属性情報を含むユーザ情報を取得するユーザ情報取得部131と、ユーザをグループ分けするグループ設定部133と、を備え、グループ設定部133は、グループに対するユーザの関連度を示すスコアを用いてユーザをグループ分けする際に、ユーザの情報に基づいてスコアを補正してグループに属するユーザの数を調整する。
【選択図】図2
【特許請求の範囲】
【請求項1】
分類対象をグループ分けするグループ設定部を備え、
前記グループ設定部は、グループに対する前記分類対象の関連度を示すスコアを用いて前記分類対象をグループ分けする際に、前記分類対象の情報に基づいて前記スコアを補正して前記グループに属する前記分類対象の数を調整する
ことを特徴とする情報処理装置。
【請求項2】
請求項1に記載の情報処理装置において、
前記分類対象の情報は、前記グループに属する前記分類対象の情報である
ことを特徴とする情報処理装置。
【請求項3】
請求項1又は請求項2に記載の情報処理装置において、
前記分類対象の情報は、前記グループに属する前記分類対象の数と、前記グループに属する前記分類対象の数に関する目標値との比であり、
前記グループ設定部は、前記比が所定範囲外である場合に、前記スコアを補正する
ことを特徴とする情報処理装置。
【請求項4】
請求項3に記載の情報処理装置において、
前記グループ設定部は、前記比が前記所定範囲外となる場合、前記比が前記所定範囲内となるまで、前記スコアを補正する
ことを特徴とする情報処理装置。
【請求項5】
請求項3又は請求項4に記載の情報処理装置において、
前記グループ設定部は、前記スコアを補正値で除算することで前記スコアを補正し、前記グループに属する前記分類対象の数が前記目標値よりも大きい場合に前記補正値を増加させ、小さい場合に前記補正値を減少させる
ことを特徴とする情報処理装置。
【請求項6】
請求項5に記載の情報処理装置において、
前記グループ設定部は、前記目標値をUgt、前記グループに属する前記分類対象の数をU、前記比が前記所定範囲外となった際の前記補正値をbg1、補正係数の指数をαとして、下記式(1)により補正値bを修正する
【数1】
ことを特徴とする情報処理装置。
【請求項7】
請求項1から請求項5のいずれか1項に記載の情報処理装置において、
前記グループ設定部は、複数の前記グループ毎に設定された補正値により前記スコアを補正する
ことを特徴とする情報処理装置。
【請求項8】
請求項3から請求項7のいずれか1項に記載の情報処理装置において、
前記グループ設定部は、前記スコア又は補正された前記スコアに基づいて、前記分類対象が属する仮グループを前記分類対象毎に選択し、前記仮グループに属する前記分類対象の数と、前記グループに属する前記分類対象の数に関する目標値との比が所定範囲内である場合に、前記仮グループを前記分類対象が属する前記グループとする
ことを特徴とする情報処理装置。
【請求項9】
請求項6に記載の情報処理装置において、
前記グループ設定部は、前記分類対象の情報に基づいて、前記補正係数の指数αを修正する
ことを特徴とする情報処理装置。
【請求項10】
請求項9に記載の情報処理装置において、
前記グループ設定部は、前記目標値Ugtと前記分類対象の数Uと比に基づいて前記補正係数の指数αを修正する
ことを特徴とする情報処理装置。
【請求項11】
コンピュータにより分類対象を複数のグループの何れかに分類する情報処理方法であって、
前記コンピュータは、グループ設定部を備え、
前記グループ設定部により、前記グループに対する前記分類対象の関連度を示すスコアを用いて前記分類対象をグループ分けする際に、前記分類対象の情報に基づいて前記スコアを補正して前記グループに属する前記分類対象の数を調整する
ことを特徴とする情報処理方法。
【請求項12】
コンピュータにより読み込まれて実行される情報処理プログラムであって、
前記コンピュータを請求項1から請求項10のいずれか1項に記載の情報処理装置として機能させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の分類対象を分類する情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、複数の分類対象を、当該分類対象が有する属性に応じてグループ分けする技術が知られている(例えば特許文献1参照)。
特許文献1の広告配信サーバでは、ユーザ属性データベースにユーザの属性情報が記録され、ユーザ属性分析手段が属性情報を分析して、ユーザの客観的な属性である因子属性を導出する。この因子属性は、母集団におけるカテゴリスコアであり、カテゴリに対してどの程度肯定的であるかを示す値となる。そして、広告配信サーバでは、広告を配信する際に、広告属性(キーワード群)に対応する因子属性を有するユーザデータを抽出して広告配信対象とする。
すなわち、特許文献1に記載の広告配信サーバは、同一の因子属性を有するユーザ(分類対象)を1つのグループとして、複数のユーザを複数のグループに分類し、各グループに対応する広告を、そのグループに属するユーザに配信する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−26456号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、上記特許文献1に記載のような従来技術では、分類対象を属性に応じてグループ分けした際に、各グループに属する分類対象の数が、必ずしもそのグループの目標とする分類対象の数とはならない場合がある。
例えば、マーケティング活動においてユーザを複数のグループに分割する場合、以下のような条件でユーザをグループ分けする。
(A)1人のユーザは、複数のグループに属することができる。
(B)1人のユーザが属するグループ数には、上限がある。
(C)各グループに属するユーザ数には、目標値がある。
この場合、従来、例えば特許文献1に示すような技術を用いて、ユーザ毎の各グループに対するスコアを算出した後、当該スコアが大きいグループを上限数(以下、G個とする)だけ選択して、そのグループをユーザが属するグループとしていた。ここで、各グループに属するユーザの数が、目標値に近い場合は問題とならない。しかしながら、実際には、グループに属するユーザ数が、目標値に対して乖離することが多い。
具体例を挙げると、ユーザを、登録された属性情報や行動履歴等によって、男性グループと、女性グループとにグループ分けする場合、男性グループのユーザ数が女性グループのユーザ数よりも多くなる傾向がある。しかしながら、実際のマーケットにおいては、男性向けよりも女性向けの商品の販促活動の需要が大きい。広告主は、女性向けの商品の広告を配信する場合、できるだけ多くの女性ユーザに広告を配信することを望むが、上記のように、ユーザをグループ分けした際に女性グループに属するユーザ数が少なくなると、配信の目標値とユーザ数とが乖離し、広告主が期待した広告効果が十分に得られない。
【0005】
本発明は、各グループの目標値に対して分類対象適切に分類可能な情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の情報処理装置は、分類対象が有する属性情報を取得する属性取得部と、前記分類対象をグループ分けするグループ設定部と、を備え、前記グループ設定部は、グループに対する前記分類対象の関連度を示すスコアを用いて前記分類対象をグループ分けする際に、前記分類対象の情報に基づいて、前記スコアを補正して前記グループに属する前記分類対象の数を調整することを特徴とする。
【発明の効果】
【0007】
本発明では、分類対象の情報に基づいてスコアを補正して、グループに属する分類対象の数を調整する。これにより、各グループに属する分類対象の数を目標値に近付けることができ、各分類対象を適切に分類することができる。
【図面の簡単な説明】
【0008】
図1】第一実施形態の情報処理システムの概略構成を示すブロック図。
図2】第一実施形態のサーバ装置の概略構成を示すブロック図。
図3】端末装置の概略構成を示すブロック図。
図4】第一実施形態の情報処理方法を示すフローチャート。
図5】第二実施形態における補正値修正処理の詳細を示すフローチャート。
図6】第二実施形態におけるユーザ数と目標値との比の推移の一例を示す図。
【発明を実施するための形態】
【0009】
[第一実施形態]
以下、本発明に係る第一実施形態の情報処理装置について説明する。
図1は、本発明に係る情報処理装置であるサーバ装置10を含む情報処理システム1の概略構成を示すブロック図である。
図1に示すように、情報処理システム1は、サーバ装置10と、サーバ装置10にネットワーク(例えばインターネット等)を介して通信可能に接続される複数の端末装置20とにより構築されている。
【0010】
この情報処理システム1では、サーバ装置10が、端末装置20から送信された各種情報に基づいて、端末装置20を操作するユーザ(本実施形態における分類対象)を複数のグループに分類する。
なお、ここでは、サーバ装置10によりユーザを分類する例を一例として示すが、サーバ装置10は、各グループに分類されたユーザに対して、それぞれのグループに対応した様々な処理を実施してもよい。例えば、サーバ装置10は、各グループに属するユーザに対して、グループの属性に応じた広告等のコンテンツを配信してもよく、各グループに属するユーザに関する特定の情報を、提携する企業に提供してもよい。
【0011】
[サーバ装置10の構成]
図2は、本実施形態のサーバ装置10の概略構成を示すブロック図である。
本実施形態のサーバ装置10は、コンピュータにより構成され、通信部11と、記録部12と、制御部13と、等を含んで構成されている。
通信部11は、ネットワークに接続されており、ネットワークを介して端末装置20や、ネットワーク上のその他の装置と通信する。
【0012】
記録部12は、例えばメモリ、ハードディスク等により構成されたデータ記録装置である。この記録部12は、本発明の分類対象であるユーザに関する各種データを記録するユーザ情報記録領域(ユーザDB12A)や、ユーザをグループ分けするための各グループに関する各種情報を記録するグループ情報記録領域(グループDB12B)等を備える。
【0013】
ユーザDB12Aは、各ユーザの特徴を示す複数の属性データを記録したユーザ情報が複数記録されたデータベースである。このユーザ情報は、例えば、ユーザ識別情報(ユーザID)、ユーザ属性情報、所属グループ情報等を含む。
ユーザ識別情報は、各ユーザを識別するための情報であり、ユーザ毎にそれぞれ異なる情報を持つ。
ユーザ属性情報は、ユーザの特徴を示す情報であり、例えば、性別、年齢又は年齢層、居所、職業、趣味や興味分野等、ユーザに関する様々な情報を含む。また、ユーザ属性情報としては、ユーザが端末装置20を操作することで入力される入力情報(例えばユーザ登録やアンケート回答等により入力するキーワード)の他、ユーザの行動により検出される情報を含めてもよい。
ユーザの行動により検出される情報としては、例えば、所定期間毎のユーザの端末装置20の操作履歴や、所定期間毎のインターネット上の行動履歴(例えば検索処理におけるキーワードの履歴や、閲覧ページの履歴、商品等の購入履歴やダウンロード履歴等)等が挙げられる。また、端末装置20に特定の情報を検出するセンサー(例えば、現在位置情報を検出するGPS装置、加速度等の動きや姿勢を検出する加速度センサーやモーションセンサー、温度を検出する温度センサーや、血流や血圧等の健康情報を検出するセンサー等)が搭載されている場合、センサーにより検出された所定期間毎の検出値(センサー検出履歴)が記録されてもよい。
所属グループ情報は、ユーザが所属するグループに関する情報であり、例えば、後述するグループ情報のグループIDが記録されている。
【0014】
グループDB12Bは、各グループを管理するための情報や、各グループの特徴を示す情報を記録したグループ情報が複数記録されたデータベースである。このグループ情報は、例えば、グループ識別情報(グループID)、目標値、スコア算出手法等を含む。
グループ識別情報は、各グループを識別するための情報であり、グループ毎にそれぞれ異なる情報を持つ。
目標値は、グループに属させるユーザ数の目標値であり、グループ毎にそれぞれ設定されている。
スコア算出手法は、ユーザ属性情報により、各グループに対するスコアを算出するルール(数式や論理式等)である
なお、グループ情報としては、その他、グループ名、グループに属するユーザに提供するサービスや配信コンテンツやコンテンツの記録場所、グループに属するユーザにサービスを提供する企業等に関する情報が関連付けられていてもよい。また、本実施形態では、スコア算出手法を記録する例を示すが、グループに属させるユーザの条件やグループの属性等が別途記録されていてもよい。
さらに、本実施形態では、ユーザ情報に、所属グループ情報が含まれ、最終的に、ユーザが所属するグループに関する情報が記録されるが、グループ情報に、グループに所属するユーザに関する情報(例えばユーザID)が記録されていてもよい。
【0015】
また、記録部12は、制御部13により実行させる複数のプログラムを記録する。これらのプログラムとしては、サーバ装置10の各部を制御するオペレーティングシステムを実行するためのプログラム、オペレーティングシステム上で実行される各種アプリケーションプログラム(本発明の情報処理プログラム(分類処理プログラム)等)を含む。
【0016】
制御部13は、CPU(Central Processing Unit)等の演算回路、RAM(Random Access Memory)等の記録回路により構成される。制御部13は、記録部12等に記録されているプログラムをRAMに展開し、RAMに展開されたプログラムとの協働で、各種処理を実行する。そして、制御部13は、記録部12に記録された情報処理プログラム(分類処理プログラム)を読み込んで実行することで、図2に示すように、ユーザ情報取得部131、グループ情報取得部132、グループ設定部133等として機能する。
【0017】
ユーザ情報取得部131は、本発明の属性取得部としても機能し、ネットワークを介して端末装置20から送信されたユーザ情報を取得してユーザDB12Aに記録する。
グループ情報取得部132は、グループ情報を取得して、グループDB12Bに記録する。グループ情報の取得としては、例えばネットワークを介して、所定の装置(例えば広告主が管理する広告主端末等)からグループ情報を取得する。又は、グループ情報取得部132は、サーバ装置10の管理者がネットワークを介して所定の端末から送信したグループ情報を取得してもよく、或いはサーバ装置10に接続された入力手段により入力したグループ情報を取得してもよい。
また、グループ情報取得部132は、上述したグループ情報、すなわち、目標値及びスコア算出手法を取得してもよく、グループに属させるユーザの条件(例えば企業が望む広告コンテンツの配信対象のユーザの条件や、広告コンテンツの種別等)を取得してもよい。この場合、グループ情報取得部132は、得られた情報から、目標値やスコア算出手法を設定すればよい。
【0018】
グループ設定部133は、各ユーザを各グループに分類(グループ分け)し、ユーザ情報の所属グループ情報を更新する。
具体的には、グループ設定部133は、スコア算出部133A、スコア補正部133B、グループ選択部133C、及びグループ登録部133Dの機能構成を含む。
スコア算出部133Aは、各ユーザにおける各グループに対するスコアを算出する。このスコアは、ユーザとグループとの関連度を示す値であり、ユーザがグループの条件にどれだけ合致しているかを示す。本実施形態では、スコアが大きい程、そのユーザがそのグループに関連していることを示し、つまり、ユーザの属性がグループの条件に近い程スコアの値が高くなる。なお、スコアの算出方法としては、公知の技術(例えば特開2016−153972号公報等)を利用できる。
【0019】
スコア補正部133Bは、スコア算出部133Aで算出されたスコアを、補正値を用いて補正する。本実施形態では、補正値は、各グループについてそれぞれ設定される値であり、全ユーザに共通の値ではあるが、グループの目標値と、グループの条件に対応したユーザ数との関係により増減される。
なお、グループの目標値は、グループに属させるユーザ数の目標値であって、例えばユーザ属性情報等に基づいて設定される。また、グループの条件に対応したユーザ数は、ユーザ属性情報に基づいて実際にユーザをグループ分けした際のユーザ数である。したがって、スコア補正部133Bは、ユーザの情報に基づいてスコアを補正すると言い換えることができる。
【0020】
グループ選択部133Cは、スコア算出部133Aにより算出されたスコア、又はスコア補正部133Bにより補正されたスコア(補正スコア)に基づいて、各ユーザに対応するグループを選択する。ここで、選択されるグループは、ユーザに対する仮グループであり、正式に決定されたグループではない。
グループ登録部133Dは、各ユーザをグループ分けした際に、各グループに属するユーザ数がグループ毎に設定された目標値、又は目標値に近い値となった場合に、当該ユーザをグループに所属させる、つまり、ユーザ情報の所属ユーザ情報に、選択されたグループのグループIDを記録する。
【0021】
[端末装置20の構成]
図3は、一般的な端末装置20の概略構成を示すブロック図である。
端末装置20は、上述のように、分類対象であるユーザが保有するコンピュータであり、例えばスマートフォンやタブレット端末、パーソナルコンピュータ等により構成される。この端末装置20は、例えば、図3に示すように、表示部21、入力操作部22、端末通信部23、端末記録部24、及び端末制御部25等を含んで構成される。
表示部21は、例えば液晶ディスプレイ等により構成され、端末制御部25の制御の下、所定の画像を表示させる。
入力操作部22は、例えば表示部21と一体に設けられたタッチパネルにより構成されてもよく、キーボードやマウス等の入力装置により構成されていてもよい。この入力操作部22は、ユーザにより操作されることで、操作に応じた操作信号を端末制御部25に出力する。
端末通信部23は、サーバ装置10やネットワーク上の所定の装置と通信する。
【0022】
端末記録部24は、例えばメモリやハードディスク等のデータ記録装置により構成されている。端末記録部24には、例えば、入力操作部22の入力操作により入力されたユーザに関するユーザ属性情報(例えば、性別、年齢、居所、興味分野)の他、ユーザが端末装置20を操作した際の操作履歴や、ユーザのインターネット上での行動履歴、端末装置20に設けられた各種センサー(例えばGPS装置やモーションセンサー等)により検出された検出結果履歴等が記録されていてもよい。また、端末記録部24には、端末装置20を制御するための各種プログラム等が記録される。
【0023】
端末制御部25は、CPU(Central Processing Unit)等の演算回路、RAM(Random Access Memory)等の記録回路により構成され、端末装置20の各部を制御する。端末制御部25は、端末記録部24等に記録されているプログラム(ソフトウェア)をRAMに展開し、RAMに展開されたプログラムとの協働で、各種処理を実行する。具体的には、端末制御部25は、上記プログラムを読み込み実行することで、ユーザの入力操作部22の操作に応じて、所定のアプリケーションプログラムを起動させたり、端末装置20の各種センサーを起動させて各センシングデータを取得したりする。また、ユーザ属性情報や操作履歴、行動履歴や検出結果履歴を取得し、端末記録部24に記録させたりする。また、端末制御部25は、例えばユーザの操作に基づいて、端末記録部24に記録された各種情報をサーバ装置10に送信する。
【0024】
[情報処理システムの動作]
次に、本実施形態における情報処理システム1における情報処理方法、特に、サーバ装置10における分類対象であるユーザの分類方法について説明する。
図4は、本実施形態における情報処理方法を示すフローチャートである。
本実施形態の情報処理システム1では、ユーザ情報及びグループ情報に基づいて、分類対象であるユーザを各グループにグループ分け(分類)する。特に、本実施形態の情報処理システム1は、例えばサービスを提供する企業が、提供するサービスの広告やアンケート等のコンテンツを配信する場合や、商品等の試供品を送付する場合等の企業のマーケティング活動において、対象となるユーザを選定する際に好適に利用できる。
例えば、企業等の広告主が、インターネットを介してユーザに広告コンテンツを配信する場合、企業が保有する各ユーザに関するユーザ情報に基づいて、ユーザを選定して広告コンテンツを配信する。この場合、企業が本実施形態のサーバ装置10を用いて、ユーザをサービスに応じたグループにグループ分けし、各グループに対応した広告コンテンツを、当該グループに属するユーザに配信する。或いは、例えば、インターネット上において多くのユーザが利用するサイト、所謂ポータルサイトに対して、広告コンテンツの配信を依頼する場合では、本実施形態のサーバ装置10を利用する。これにより、ポータルサイトのサーバ装置10が、ユーザを各企業から依頼されたサービスに応じたグループにグループ分けし、各グループに対応した広告コンテンツを、当該グループに属するユーザに配信する。
以下において、本実施形態の情報処理方法の一例として、企業等の広告主が、例えばポータルサイト等が保有するサーバ装置10に広告依頼を送信し、サーバ装置10が、ユーザを広告に対応したグループに分類する例を説明する。
【0025】
なお、本実施形態におけるユーザのグループ分けでは、次の3つの条件(A)〜(C)、すなわち、
(A)1人のユーザは、複数のグループに属することができる。
(B)1人のユーザが属するグループ数には上限がある。
(C)各グループに属するユーザ数には、目標値(グループに属するユーザ数の目標値)があり、目標値に近い程良い。
に基づいて実施される。
ここで、以下の説明にあたり、1人のユーザが属することができるグループ数の上限値をGとし、グループg(又は仮グループg)に属するユーザ数をUとし、グループにおけるユーザ数の目標値をUgtとする。
【0026】
本実施形態の情報処理システム1において、サーバ装置10は、各ユーザを複数のグループにグループ分けするに際し、まず、ユーザ情報取得部131は、各ユーザのユーザ情報を取得し(ステップS1)、グループ情報取得部132は、各グループのグループ情報を取得する(ステップS2)。
【0027】
ステップS1では、ユーザ情報取得部131は、各ユーザが保有する端末装置20から、ユーザ情報を取得する。
例えば、ユーザが端末装置20の入力操作部22を操作することで、端末装置20がネットワーク上で閲覧可能となる所定のコンテンツ(例えばユーザ登録ページ)にアクセスする。これにより端末装置20の表示部21にユーザ登録ページが表示される。ユーザが当該ユーザ登録ページの案内に従って各種ユーザ属性(例えば性別や年齢、居所や職業等)を入力することで、端末装置20はサーバ装置10にユーザ属性情報を送信する。この際、ユーザ情報取得部131は、ユーザIDが端末装置20から入力されている場合に、ユーザ情報をユーザDB12Aから特定し、当該ユーザ情報のユーザ属性情報を更新する。また、ユーザIDが無い場合では、新規にユーザ情報を生成し、ユーザIDを新たに付与し、入力されたユーザ属性情報を記録する。
また、ユーザ情報取得部131は、例えば、端末装置20から定期的或いはユーザにより設定された所定タイミングで、ユーザ属性情報を取得し、ユーザDB12Aの対応するユーザ情報を更新してもよい。具体的には、ユーザ情報取得部131は、端末装置20の端末記録部24に記録される操作履歴や、インターネットにおける行動履歴、センサー検出履歴等を、端末装置20から受信する。
【0028】
ステップS2では、グループ情報取得部132は、各グループ情報を生成したり、更新したりする。
本実施形態では、広告主から広告コンテンツの配信に関するグループ情報を取得する。この場合、グループ情報取得部132は、広告主が保有する広告主端末から、広告コンテンツの配信数や、スコア算出手法を取得する。
また、スコア算出手法に替えて、広告コンテンツの配信対象の条件を取得してもよい。この場合、グループ情報取得部132は、広告コンテンツの配信対象の条件、つまり、グループに属させる対象ユーザの条件に基づいて、スコアを算出する。
【0029】
スコアの算出方法としては、例えば正解情報に基づいたモデル生成等を用いることができる。
具体例を挙げて説明すると、「A化粧品の販売」に関する広告コンテンツの配信に関するスコアの算出の場合、「A化粧品」を実際に購入したユーザを特定し、ユーザDB12Aから当該ユーザのユーザ情報を正解情報として抽出する。この場合、サーバ装置10から「A化粧品の購入」に関するアンケート情報を端末装置20に送信し、端末装置20から「購入した」との回答が得られた場合に、当該ユーザのユーザ情報を正解情報としてもよい。また、ユーザ属性情報(例えば、インターネット上における購入履歴等)において、「A化粧品の購入」が記録されているユーザ情報を、正解情報として抽出してもよい。そして、複数の正解情報(ユーザ情報)に記録されている各ユーザ属性を集計及び分析することで、各ユーザ属性に対する係数(重み値)をそれぞれ算出する。つまり、正解情報に対応するユーザのうち、多くのユーザに共通するユーザ属性に関して重み値を大きくし、共通しないユーザ属性に関して重み値を小さくし、重み値をスコア算出係数としてスコアを算出する。なお、各グループにおける各ユーザ属性に対する重み値は、機械学習(ディープラーニングを用いたニューラルネットワーク等)により、調整してもよい。
【0030】
また、グループ情報取得部132は、目標値をインターネット上の情報等に基づいて適宜設定してもよい。例えば、インターネット上で公開されているリサーチサイトや、ブログ等における記事、コメント投稿等のインターネット上の公開情報から、広告対象のサービス(例えば「A化粧品」等)に関する公開情報の内容、公開情報の件数を抽出する。そして、インターネット人口に対する公開情報の件数に基づいて、マーケットにおける需要を予測して、目標値を設定してもよい。例えば、マーケットにおける需要に合わせた目標値をテーブルデータとして保有しておき、当該テーブルデータに基づいて、目標値を設定してもよい。
【0031】
また、図4においては、ステップS1の後にステップS2を実施しているが、これに限らない。すなわち、ユーザによるユーザ登録のタイミングや、ユーザ属性情報の送信、グループ情報の登録は、ユーザや広告主により任意のタイミングで実施されるものであり、ステップS1及びステップS2が同時に実施されてもよく、ステップS2の後にステップS1が実施されてもよい。
【0032】
そして、サーバ装置10は、ユーザの分類処理(グループ分け)を実施するか否かを判定する(ステップS3)。つまり、サーバ装置10は、分類処理を実施するタイミングとなったか否かを判定する。
このタイミングは、例えば予め設定された日時でもよく、予め設定された周期毎でもよい。また、ステップS1やステップS2により情報が更新された後でもよい。ステップS1やステップS2により情報が更新された後のタイミングとしては、例えばステップS1又はステップS2が実施された直後でもよく、またステップS1又はステップS2の実施後、予め設定された時間の経過後であってもよい。或いは、各ユーザに広告コンテンツの配信を行うタイミングで、分類処理を実施してもよい。
ステップS3でNoと判定された場合は、ステップS1に戻り、前記タイミングまで待機する。
【0033】
ステップS3においてYesと判定された場合、サーバ装置10のスコア算出部133Aは、ユーザuのグループgに対するスコアSugを、全ユーザと全グループについて算出する(ステップS4)。
スコアの算出方法は、上述したように、公知の技術を用いることができる。例えば、あるグループに対して、N個のユーザ属性の各値(属性値)A,A,A,…A,…AN−1,Aに対して、それぞれ重み値k,k,k,…k,…kN−1,kが設定されている場合、スコア算出部133Aは、スコアSugを下記式(1)により算出する。
【0034】
【数1】
【0035】
ユーザ属性の各値Aはユーザごとに異なり、スコア重み値kはグループごとに異なるので、スコアSugはユーザごとグループごとに異なる値となる。
なお、ユーザ属性の各値が性別等の選択項目である場合、各グループに応じて適宜属性の値を修正してもよい。例えば「女性用の化粧品」に対するグループに対するスコア算出では、性別に関するユーザ属性が「男性」の場合に属性値を「0」、「女性」の場合に属性値を「1」として、スコアSugを算出する。また、居所に関するユーザ属性では、例えばグループが目標とする位置に対して距離が近い場合に値を大きくし、距離が遠い場合に値を小さくしてもよい。例えば「東京都」に在住のグループに対するスコア算出において、居所に関するユーザ属性が「東京都」である場合には属性値を「1.0」、東京都の近県である「山梨県」では属性値を「0.8」、東京都から遠い「愛知県」では属性値を「0.5」にする。
【0036】
なお、スコアの算出方法としては、これに限定されるものではなく、その他の方法によりスコアを算出してもよい。例えば、各ユーザ属性を入力値、各グループに対するスコアを出力値とする機械学習モデル(例えばニューラルネットワーク等)を用いることで、各ユーザの各グループに対するスコアSugを算出してもよい。
【0037】
この後、スコア補正部133Bは、ステップS4にて算出されたスコアを、補正値bにより補正し、補正スコアTugを算出する(ステップS5)。
具体的には、スコア補正部133Bは、下記式(2)に基づいて、補正スコアTugを算出する。
【0038】
【数2】
【0039】
式(2)において、分母の補正値bは、グループ毎に設定される値であり、ユーザには依存しない。本実施形態では、各補正値bの初期値は、「1」とする。よって、1回目のステップS5で算出される補正スコアTugは、ステップS4にて算出されるスコアSugと同値になる。
【0040】
この後、グループ選択部133Cは、各ユーザに関して、ステップS5により算出された補正スコアTugが大きい順にG個のグループを選択する(ステップS6)。すなわち、ユーザが属することが可能なグループ数の上限値G個だけ、グループを選択する。なお、ここで選択されるグループは、ユーザが属するグループとして実際にユーザ情報に登録されるグループではなく、仮グループとなる。
【0041】
次に、グループ設定部133は、仮グループとしてユーザが分類された各グループにおけるユーザ数Uと、当該グループの目標値Ugtとの比が、所定範囲内となるか否かを判定する。具体的には、下記式(3)に示す条件を満たすか否か、すなわち、ユーザ数Uと目標値Ugtとの比(U/Ugt)が、所定範囲内(下限閾値P1から上限閾値P2までの間)となるか否かを判定する(ステップS7)。
【0042】
【数3】
【0043】
式(3)において、閾値P1,P2は、ユーザ数Uが目標値Ugtに近いか否かを判断するための値である。よって、例えば、グループに属するユーザ数Uとして、目標値Ugtの80%から110%の範囲を設定する場合、P1=0.8、P2=1.1を設定すればよい。また、厳密に目標値Ugtと一致させる場合は、P1=P2=1.0を設定してもよい。
これらの閾値P1,P2は、各グループに対して共通の値としてもよいが、グループ毎にそれぞれ別の閾値P1,P2を設定してもよい。例えば、目標値Ugtが小さいグループ程閾値P1,P2を1に近い値としてもよい。
ステップS7においてNoと判定された場合は、ユーザ数Uと目標値Ugtとが乖離していることを意味する。この場合、スコア補正部133Bは、補正値bを修正し(ステップS8)、ステップS5に戻る。
このステップS8では、スコア補正部133Bは、下記式(4)に基づいて、補正値bを修正する。
【0044】
【数4】
【0045】
ここで、α(ただしα>0)は、補正係数の指数であり、本実施形態では固定値が用いられる。
本実施形態では、式(4)に示すように、前回のステップS5において補正スコアTugの算出に用いた補正値bに対して、(U/Ugtαをかけ合せて、新たな補正値bとする。
すなわち、1回目のループではb=1であるため、補正スコアTug=スコアSugとなり、スコアSugに基づいたグループ分け(仮グループの選択)が実施される。そして、(U/Ugt)が所定範囲内とならない(UとUgtの値が乖離している)場合に、補正値bを、式(4)に示すように、ユーザ数Uと目標値Ugtとの比(U/Ugt)に応じて修正する。
【0046】
式(4)による補正値bの修正では、ユーザ数Uが、目標値Ugtよりも大きい場合には、補正値bが大きくなり、式(2)により算出される補正スコアTugが小さくなる。また、ユーザ数Uが、目標値Ugtよりも小さい場合には、補正値bが小さくなり、補正スコアTugが大きくなる。
なお、補正値bは各グループのそれぞれに対して設定される。つまり、Aグループにおいてユーザ数Uと目標値Ugtとの値が乖離し、Bグループにおいてユーザ数Uが目標値Ugtに近い値となる場合、Aグループに対する補正値bのみが修正される。これにより、上記の様なループ処理を複数回実施することで、全てのグループのそれぞれに属するユーザ数Uが、それぞれのグループの目標値Ugtの値に近づくように調整される。
【0047】
そして、ステップS7において、全てのグループに対して上記式(3)を満たすと判定される(ステップS7においてYesと判定)と、グループ登録部133Dは、各ユーザに対して選択した仮グループを、ユーザが所属するグループとして設定する(ステップS9)。このようにして、各グループに属するユーザが決定され、グループ登録部133Dは、ユーザ情報の所属グループ情報に対して、ユーザが所属するグループの例えばグループIDを記録して更新する。
なお、本実施形態では、ユーザ情報を更新する例を示すが、各グループと、当該グループに所属するユーザとを関連付けたユーザグループ情報を生成して記録部12に記録してもよい。また、上述したように、各グループ情報に、当該グループに所属するユーザの例えばユーザIDを記録する等でもよい。
【0048】
以上のような分類処理の後、サーバ装置10は、各グループに所属するユーザ(端末装置20)に対して、当該グループに対応した各種処理を実施する。例えば、グループに対して関連付けられた広告コンテンツを、グループに所属するユーザの端末装置20に送信する広告処理を実施したり、アンケート情報を配信したりする。
【0049】
[第一実施形態の作用効果]
本実施形態のサーバ装置10では、グループ設定部133は、ユーザ情報に基づいてユーザのグループに対するスコアSugを算出し、ユーザの情報に基づいてスコアSugを補正してグループに属するユーザ数Uを調整する。
これにより、スコアSugは、ユーザ数Uが目標値Ugtに近づくように補正されるので、ユーザを各グループに対して適切に分類することができる。
【0050】
具体例を挙げて上記作用効果を説明する。マーケットにおいて需要が高い「50代女性用の化粧品」の広告コンテンツを配信する際、従来の方法(補正値により補正しない場合)では、ユーザを例えば「性別」「年齢」「興味分野」等に合わせて、グループに対応するスコアを算出し、スコアが高い順にユーザをグループに所属させる。しかしながら、インターネットを利用するユーザの人口分布と、実際の人口分布とは異なることがあり、例えば需要が高い「50代女性用の化粧品」に対応するグループに対して、十分なユーザ数が確保できない場合がある。特に、広告配信を望む企業側では、できるだけ多くのユーザに広告を配信することを望み、少しでも「50代」「女性」「化粧に興味がある」と推定できる属性を有するユーザに対して、広告コンテンツを配信することを望む。したがって、「50代女性用の化粧品」に合致する可能性が高いユーザのみを選択する従来の手法では、このような要望に応えることができない。
これに対して、本実施形態では、ステップS5により、補正値bを用いてスコアSugを補正し、補正されたスコアTugに基づいてグループを選択するので、各グループのユーザ数Uが、グループの目標値Ugtに近くなるように、各ユーザがグループ分けされる。この場合、例えばスコアSugのみによりグループを設定した際に、グループの目標値Ugtに対して過剰にユーザ数Uが多い場合では、補正スコアTugに応じたグループ設定が実施されることで、当該グループに対してより適合性が高いユーザが選択されることになる。一方、スコアSugのみによりグループを設定した際に、グループの目標値Ugtに対してユーザ数Uが少ない場合では、補正スコアTugに応じたグループ設定が実施されることで、当該グループの条件に少しでも当てはまる可能性が高いユーザが、当該グループに所属するユーザとして選択されることになる。
以上のように、本実施形態では、ユーザを各グループの目標値Ugtに合わせて適切に分類することが可能となり、例えば広告コンテンツの配信等におけるマーケティング活動において、マーケットの需要に応じた適切なユーザを選択することが可能となる。
【0051】
本実施形態では、グループ設定部133は、グループに属するユーザ数Uと、目標値Ugtとの比(U/Ugt)が、式(3)を満たさない(所定範囲外となる)場合に、スコアSugを補正する。
ユーザを複数のグループに分類する際、閾値P1,P2をP1=P2=1.0とし、ユーザ数Uと目標値Ugtとが完全に一致することが最も好ましい。しかしながら、ユーザ数Uと目標値Ugtとを精度よく一致させるためには、補正係数の指数αを小さい値に設定し、ステップS5からステップS8のループ処理を非常に多くの回数繰り返す必要があり、分類処理に係る処理時間が長くなり、処理負荷も増大する。これに対して、上記のように、下限閾値P1及び上限閾値P2を設定し、比(U/Ugt)が所定範囲内となるように、スコアを補正することで、処理時間の短縮や、処理負荷の軽減を図ることができる。
【0052】
ここで、閾値P1,P2は、各グループのそれぞれに対して個別に設定できる。
グループ毎に、目標値Ugtの重要性が異なる場合がある。例えば、広告コンテンツの配信を例示すると、目標値Ugtに対して±20%範囲内のユーザ数Uへの広告コンテンツの配信を望む広告主もいれば、目標値Ugtに対して±5%範囲内のユーザ数Uへの広告コンテンツの配信を望む広告主もいる。本実施形態では、各グループに対してそれぞれ閾値P1,P2を別々に設けることで、様々な広告主の要望を好適に満たすことができる。すなわち、グループ毎に設定された条件に応じて、適切にユーザをグループ分けすることができる。
【0053】
また、目標値Ugtの大小によって、閾値P1,P2を変更してもよい。
すなわち、目標値Ugtが大きいグループでは、ユーザ数Uが目標値Ugtに対して少なく、かつ目標値Ugtに対して大きく乖離している場合、グループに対して補正される前のスコアSugが小さい多くのユーザが、修正後グループに割り当てられる可能性が高くなり、グループに対するユーザの適合性の点での精度が低下する。また、目標値Ugtが小さいグループでは、目標値Ugtが大きいグループに比べて、比(U/Ugt)に対するユーザ1人当りの効果が大きくなる。一般に、マーケットにおいて需要が小さい分野では、グループのユーザ数の目標値が小さく設定される。このような分野では、当該分野に興味があるユーザも限られるため、精度よくユーザを選択する必要が生じる。このとき閾値P1,P2を1に近い値とする。これにより、各グループの条件に近い属性のユーザを適切にグループに所属させることができる。
【0054】
本実施形態では、スコア補正部133Bは、仮グループに属するユーザ数Uと、目標値Ugtとの比が所定範囲外となる場合(ステップS7においてNoと判定された場合)、仮グループに属するユーザ数Uと、目標値Ugtとの比が、全てのグル-プにおいて所定範囲内となるまで(ステップS7においてYesと判定されるまで)、補正値を逐次的に修正する。すなわち、本実施形態では、ステップS5からステップS8のループ処理を繰り返し実施することで、全てのグループにおいて、ユーザ数Uと目標値Ugtとが同値又は近い値になる。これにより、ユーザのグループ分けの精度が飛躍的に向上する。
【0055】
本実施形態のスコア補正部133Bは、比(U/Ugt)が所定範囲外であり、ユーザ数U>目標値Ugtである場合には、補正値bを大きくし、逆にユーザ数U<目標値Ugtである場合には、補正値bを小さくする。これにより、補正されたスコアTugに基づいて仮グループを設定した際に、ユーザ数Uをグループの目標値Ugtに近づけることができる。
【0056】
この際、スコア補正部133Bは、式(4)に基づいて補正値bを修正する。すなわち、ユーザ数Uと目標値Ugtとの比に応じて補正値を増減させる。この場合、ユーザ数Uと目標値Ugtとの差が大きい場合には、補正値bの変化量(修正量)が大きく、補正スコアTugの変化量(前回算出された補正スコアTugとの差)も大きくなる。また、ユーザ数Uと目標値Ugtとの差が小さい場合には、補正値bの変化量(修正量)が小さくなり、補正スコアTugの変化量も小さくなる。
つまり、目標値Ugtに対するユーザ数Uとの差が大きい場合には、ユーザ数Uが目標値Ugtに迅速に収束するように作用し、目標値Ugtに対するユーザ数Uとの差が小さい場合には、ユーザ数Uが目標値Ugtに精度よく近づくように作用する。よって、ユーザのグループ分け(分類処理)に係る処理時間の短縮と、分類精度の高精度化の両立を図ることができる。
【0057】
本実施形態では、複数のグループ毎に設定された補正値bにより、各ユーザに関してグループ毎に補正スコアTugを算出する。つまり、目標値Ugtとユーザ数Uとの比の大小に応じて、グループ毎に補正値bが設定される。これにより、各グループに属するユーザ数Uを目標値Ugtに近付けることができる。
例えばAグループにおいて比(U/Ugt)が所定範囲内となり、Bグループにおいて比(U/Ugt)が所定範囲外となる場合では、Aグループに対する補正値bはそのまま維持され(補正スコアに変化なし)、Bグループに対する補正値bのみが修正される(補正スコアも修正される)。
なお、Bグループの補正スコアが修正されることで、Bグループに属するユーザ数のみならず、Aグループに属するユーザ数も変動することがあるが、その場合は次にAグループに対する補正スコアが修正される。このようにステップS5からステップS8の処理を繰り返すことで、最終的に全てのグループにおけるユーザ数が最適化される。
【0058】
本実施形態では、グループ設定部133は、補正スコアTugに基づいて、ユーザを所属させる仮グループを選択し、各仮グループに属するユーザ数Uと目標値Ugtとの比が所定範囲内となった場合に、仮グループを前記分類対象が属するグループとして登録する。
本実施形態では、各グループにおけるユーザ数Uが目標値Ugtに近づくように、複数のユーザを複数のグループにグループ分けする。したがって、1つのグループにおいて、比(U/Ugt)が所定範囲内となった場合でも、他のグループを最適化する際に、当該グループに属するユーザが変更される可能性がある。この場合、1つのグループにおいて比(U/Ugt)が所定範囲内となった際に、当該グループのグループIDをユーザ情報に登録すると、当該グループに属するユーザが変更された際に、再度ユーザ情報を更新する必要が生じる。これに対して、本実施形態では、各グループに対するユーザ数と目標値とにより、グループ分けが適切であるか否かをまず判定し、その後、全てのグループで適切であると判定された場合に、各ユーザと各グループとを関連付ける。これにより、上記のような不要な更新処理が省略され、処理負荷の軽減及び処理の高速化を図れる。
【0059】
[第二実施形態]
次に、本発明に係る第二実施形態について説明する。
上述した第一実施形態では、スコア補正部133Bは、ステップS8において、補正値bを修正する際に、補正係数の指数αを固定値とした。すなわち、第一実施形態では、補正係数を固定値とするので、補正係数の指数αが大きいと、補正値bの変化量(修正量)が大きくなり、補正スコアTugの変化値も大きくなる。この場合、ユーザ数Uを迅速に目標値Ugtに収束させることが可能となるが、逆に収束せずに発散する可能性も高くなる。一方、補正係数の指数αが小さいと、補正値bの変化量が小さくなり、補正スコアTugの変化量も小さくなる。この場合、精度よくユーザ数Uを目標値Ugtに収束させることが可能となるが、逆に処理に係る時間が長くなる。
これに対して、第二実施形態では、補正係数の指数αが固定値とならない点で上記第一実施形態と相違する。
なお、以降の説明にあたり、既に説明した事項については同一符号を付し、その説明を省略又は簡略化する。また、第二実施形態における情報処理システム1の構成、サーバ装置10の構成、及び端末装置20の構成は、第一実施形態と同様であり、スコア補正部133Bにおける処理内容が異なるだけである。よって、以降において、スコア補正部133Bが実施する処理を中心に説明する。
【0060】
第二実施形態では、スコア補正部133Bは、ユーザ数Ugと目標値Ugtとの差、又はユーザ数Uと目標値Ugtとの比に応じて、補正係数の指数αを変化させる。
図5は、第二実施形態におけるステップS8(図4参照;補正値修正処理)の処理の詳細を示すフローチャートである。
本実施形態では、スコア補正部133Bは、まず、補正係数の指数αの修正回数を示す変数jを導入し、初期値としてj=1を設定する。
スコア補正部133Bは、図4に示す分類処理において、初回のステップS5において、第一実施形態と同様、補正値b=1として、補正スコアTugを算出する。
そして、ステップS7において、Noと判定されると、スコア補正部133Bは、ステップS8の補正値修正処理を実施する。
この補正値修正処理において、本実施形態では、スコア補正部133Bは、先ず、変数jがj=1であるか否かを判定する(ステップS11)。
ステップS11において、Yesと判定された場合(j=1の場合)、スコア補正部133Bは、補正係数の指数αをα=1に設定する(ステップS12)。
【0061】
一方、ステップS11において、Noと判定された場合(j>1の場合)、スコア補正部133Bは、前回のステップS6でユーザ毎に仮グループを選択した際の各グループ(各仮グループ)のユーザ数Ug(j−1)と、目標値Ugtとの比(Ug(j−1)/Ugt)を算出する。なお、前回のステップS6とは、j−1回目の補正係数の指数αの修正により設定された補正値bを用いて算出された補正スコアTugに基づいた仮グループの選択処理を示す。
そして、スコア補正部133Bは、比(Ug(j−1)/Ugt)が、第一閾値Q1よりも小さいか否か、又は、比(Ug(j−1)/Ugt)が第二閾値Q2よりも大きいか否かを判定する(ステップS13)。なお、第一閾値Q1は、下限閾値P1よりも小さい値であり、第二閾値Q2は、上限閾値P2よりも大きい値である。
【0062】
ステップS13においてYesと判定された場合、すなわち比(Ug(j−1)/Ugt)が第一閾値Q1より小さいか、又は第二閾値Q2より大きい場合は、目標とする所定範囲までまだ遠いので、スコア補正部133Bは、補正係数の指数αを、nαに設定し直す(ステップS14)。ここに、nは1より大きい値(例えば2)である。すなわち、前回のステップS5における補正値bの算出(式(4)参照)に用いた補正係数の指数αの値をn倍に大きくし、次のステップS5での補正値bの算出に用いる補正係数の指数αとする。なお、本実施形態では、「n」は固定値である。
【0063】
一方、ステップS13においてNoと判定された場合、すなわち比(Ug(j−1)/Ugt)が閾値Q1,Q2の間に有る場合は、目標とする所定範囲に近いので、スコア補正部133Bは、補正係数の指数αをα/nに設定し直す(ステップS15)。すなわち、前回のステップS5における補正値bの算出(式(4)参照)に用いた補正係数の指数αの値を1/n倍にし、次のステップS5での補正値bの算出に用いる補正係数の指数αとする。
以上の後、スコア補正部133Bは、式(4)に基づいて、補正値bを算出し(ステップS16)、変数jに「1」を加算する(ステップS17)。
【0064】
上記のように補正係数の指数αを変更した際の、スコア補正部133Bにより算出される補正スコアTugについて、具体例を用いて説明する。
図6は、本実施形態における比(U/Ugt)の推移の一例を示す図である。
図6に示す例では、初回(b=1)として算出された補正スコアTug(=Sug)が小さく、当該補正スコアTugに基づいて各ユーザに対して仮グループを選択すると、比(Ugt/Ug0)が、第一閾値Q1よりも小さくなる。この場合、初回のステップS7においてNoと判定されると、j=1であるので、ステップS8のステップS13において補正係数の指数α=1とされ、ステップS16において補正値bがb×(Ug0/Ugt)に補正されて、ステップS5の処理に戻る。
【0065】
しかしながら、本例では、補正された補正値bを用いて補正スコアTugを算出した場合でも、比(Ug1/Ugt)が、第一閾値Q1よりも小さくなる。よって、ステップS8のステップS13においてYesと判定され、(本例では、n=2として)補正係数の指数α=2とされる。これにより、ステップS16では、補正値bがb×(Ug1/Ugtに補正されて、ステップS5の処理に戻る。この場合、当該補正値bに基づいてユーザ数Ug2を算出すると、Ug2−Ug1>Ug1−Ug0となり、図6(A)に示すように、比(U/Ugt)が「1」に大きく近づく。
また、本例では、この補正値bを用いて補正スコアTugを算出した場合でも、比(Ug2/Ugt)が、第一閾値Q1よりも小さくなる。よって、3回目のステップS7においてもNoと判定され、ステップS14において、補正係数の指数α=4とされ、ステップS16では、補正値bがb×(Ug2/Ugtに補正される。この場合、Ug3−Ug2>Ug2−Ug1となり、図6(A)に示すように、更に、比(Ug3/Ugt)が「1」に大きく近づく。
【0066】
これにより、ループ処理のステップS7でNoと判定されるものの、比(Ug3/Ugt)が、第一閾値Q1から下限閾値P1の間の値となる。このため、次のステップS8においては、ステップS13でNoと判定され、補正係数の指数αがα/2に、つまり、本例においてはα=2に修正され、補正値bが、b×(Ug3/Ugtに補正される。
これにより、比(Ug3/Ugt)が、下限閾値P1から1(又は上限閾値P2)の間の値となり、ループ処理のステップS7でYesと判定される。
【0067】
また、図6(A)では、変数jがj=4(4回目の補正係数の指数α及び補正値の修正)となった際に算出された5回目の補正スコアTugにより、比(Ug4/Ugt)が下限閾値P1から上限閾値P2の間に収まる例である。これに対して、図6(B)は、例えば比(Ug4/Ugt)が下限閾値P1から上限閾値P2の範囲を超えて、上限閾値P2から第二閾値Q2の間の値となる場合がある。
このような場合でも、次のステップS13においてNoと判定されることで、補正係数の指数αが更に1/n倍にされる(本例では、α=1)。これにより、図6(B)に示すように、比(Ug5/Ugt)が下限閾値P1から上限閾値P2の間の値となって、値が収束する。
【0068】
[本実施形態の作用効果]
本実施形態では、スコア補正部133Bは、グループ(仮グループ)に属するユーザ数Uと目標値Ugtとの比と、第一閾値Q1及び第二閾値Q2との値を比較して、比較結果に応じて補正係数の指数αの値を増減させる。つまり、(U/Ugt)<Q1又は(U/Ugt)>Q2の場合、すなわち比が所定範囲より大きく離れているときには、補正係数の指数αを増大させ、Q1<(U/Ugt)<P1又はP2<(U/Ugt)<Q2の場合、すなわち比が所定範囲に近いときには、補正係数の指数αを減少させる。
これにより、目標値Ugtとユーザ数Uとが大きく乖離している場合には、ユーザ数Uを迅速に目標値Ugtに近付けるように大きめのαを用い、また、目標値Ugtとユーザ数Uとが近くなった場合には、ユーザ数Uを精度よく目標値Ugtに近付けるように小さめのαを使う。よって、サーバ装置10は、迅速に、かつ、精度良く分類処理を実施することができる。
【0069】
[変形例]
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、以下に示される変形をも含むものである。
【0070】
(変形例1)
上記第二実施形態において、ユーザ数Uと目標値Ugtとの比と、第一閾値Q1及び第二閾値Q2との比較結果に基づいて、補正係数の指数αを増減させる例を示したが、これに限定されない。
例えば、比(U/Ugt)と閾値Q1,Q2との比較結果に加え、比(U/Ugt)の増減傾向等に基づいて補正係数の指数αを増減させてもよい。
すなわち、上記第二実施形態では、(U/Ugt)<Q1又は(U/Ugt)>Q2の場合に補正係数の指数αを増大させる。この場合、例えば比(U/Ugt)が第一閾値Q1よりも小さい値から、第二閾値Q2を超える値に変動する場合がある。上記第二実施形態では、この場合、(U/Ugt)>Q2となることから、更に補正係数の指数αを増大させるので、次にユーザに対する仮グループを選択した際に、再び、(U/Ugt)<Q1となり、補正係数の指数αが更に増大し、ユーザ数UがUgtに収束せず、発散してしまう場合がある。
これに対して、スコア補正部133Bは、例えば、比(U/Ugt)の値が、1を跨いで変化する場合、つまり、ユーザ数Uと、目標値Ugtとの大小関係を判定して、その関係が逆転して変化した場合に、補正係数の指数αを減少 (例えばα/nに修正)させてもよい。
【0071】
また、比(U/Ugt)の範囲毎に、αを固定してもよい。例えば、P1>Q1>Q3>Q4となる第三閾値Q3及び第四閾値Q4、P2<Q2<Q5<Q6となる第五閾値Q5及び第六閾値Q6を更に設定する。そして、スコア補正部133Bは、(U/Ugt)<Q4又は(U/Ugt)>Q6の場合に、α=4を設定し、Q4≦(U/Ugt)<Q3又はQ5<(U/Ugt)≦Q6の場合に、α=3を設定し、Q3≦(U/Ugt)<Q1又はQ2<(U/Ugt)≦Q5の場合に、α=2を設定し、Q1≦(U/Ugt)<P1又はP2<(U/Ugt)≦Q2の場合に、α=1を設定する。すなわち、比(U/Ugt)が1に近いほど、小さめのαを設定する。
さらには、スコア補正部133Bは、比(U/Ugt)と1との差の絶対値をβとし(β=|1−(U/Ugt)|)、βの値に応じて補正係数の指数αを増減させる関数(α=f(β)、fはβの非減少関数)を用いて補正係数の指数αを算出してもよい。
これらの場合でも、上述したような比(U/Ugt)が発散する不都合を抑制でき、迅速かつ高精度な分類処理を実施できる。
【0072】
(変形例2)
第二実施形態において、スコア補正部133Bは、補正係数の指数αを増大させる際に、指数αにnを乗算し、補正係数の指数αを減少させる際に、指数αをnで除算したが、補正係数の指数αの増減方法はこれに限定されない。例えば、スコア補正部133Bは、補正係数の指数αを増大させる際に、指数αに所定値W1を加算(α=α+W1)し、補正係数の指数αを減少させる際に、指数αから所定値W2を減算(α=α―W2)してもよい。
【0073】
(変形例3)
上記第一実施形態において、下限閾値P1及び上限閾値P2をグループ毎に異なる値としたが、例えば、各グループにおける目標値Ugtがそれぞれ近い値である場合等では、共通の値としてもよい。
また、上記第一実施形態で閾値P1,P2として、目標値Ugtが小さいグループの閾値P1,P2を1に近い値とする例を示したが、これに限定されない。例えば、目標値Ugtが大きいグループほど、閾値P1,P2を1に近い値としてもよい。つまり、目標値Ugtが大きいグループでは、一般に、ユーザ数Uも大きくなる。この場合、閾値P1,P2が1から大きく離れていると、グループに属するユーザ数の変動も大きい。例えば、目標値「ユーザ100人」に対して下限閾値を0.8、上限閾値を1.2とする場合、±20人までが誤差範囲となる。これに対して、目標値「ユーザ10000人」に対して同一閾値を設定すると、±2,000人までが誤差範囲として設定されることになる。よって、割合として見た場合には、同一の20%であるが、実際のユーザ数には大きな差が生じることになる。これに対して、上記のように、目標値Ugtが大きいグループほど、閾値P1,P2を1に近い値とすることで、上記のような不都合を抑制できる。
【0074】
(変形例4)
第一実施形態及び第二実施形態において、ユーザ数Uと目標値Ugtとの比に基づいて、補正値bや補正係数の指数αを修正する例を示したが、これに限定されない。すなわち、本発明において、分類対象の情報に基づいてスコアを補正する処理は、上記実施形態に示した分類対象の条件(グループに属する分類対象と目標値との比)に基づいてスコアを補正するものに限定されるものではなく、例えば、グループに属する分類対象の数そのものに基づいてスコアを補正するものをも含む。
具体的な例を挙げると、例えば、各グループにおける目標値が同一値又は略同一値である場合等において、ユーザ数Uに基づいて、補正値bや補正係数の指数αを修正してもよい。より具体的には、スコア補正部133Bは、ユーザ数Uと目標値Ugtとの差に基づいてスコアを補正してもよい。この場合、ステップS7において、式(3)に替えて、P4<Ugt−U<P5となっているか否かを判定し、範囲外である場合に、補正値bや補正係数の指数αを修正してもよい。
補正係数の指数αに関しても同様であり、スコア補正部133Bは、ユーザ数Uと目標値Ugtとの差に基づいて補正係数の指数αを修正してもよい。
【0075】
(変形例5)
また、グループに属する分類対象の情報に基づいてスコアを補正する例を示したが、これに限定されない。例えば、グループに属していない分類対象の情報に基づいてスコアを補正してもよい。
例えば、ユーザを「A」から「D」の4つのグループに分類する際に、「A」グループに対する補正値を、「B」から「D」に属するユーザのユーザ数に基づいて設定してもよい。
具体的には、「A」グループ以外のグループにおいて、ユーザ数Uと目標値Ugtとの比が所定範囲内となっているグループ数に応じて、「A」グループの補正値を設定してもよい。例えば、スコア補正部133Bは、「A」グループ(仮グループ)のユーザ数UgAと目標値UgAtとの比が所定範囲外である場合、「B」から「D」の各グループにおける比(U/Ugt)が所定範囲外である場合の補正値を、「B」から「D」の各グループにおける比(U/Ugt)が所定範囲内である場合の補正値よりも大きくする。
また、比(U/Ugt)が所定範囲内となっているグループの数又は割合が所定数以上になった場合には、それ以上各グループのスコアを補正せず、その場でグループを確定してもよい。例えば、全グループのうちの80%以上において、比(U/Ugt)が所定範囲内となった場合に、たとえ比(U/Ugt)が所定範囲外となっているグループが残っていても、そこでグループを確定してもよい。
この場合、スコアを過剰に変更することによって、他のグループにおけるユーザの適合性での精度(つまり、グループの条件に対してユーザ属性がどれだけ合致しているか否か)の低下を抑制できる。
【0076】
(変形例6)
第一実施形態において、スコア補正部133Bは、補正値bの初期値をb=1として、スコアSugを補正(補正スコアTugを算出)しているが、初回は補正スコアTugの算出をスキップしてもよい。
つまり、初回はスコアSugのみによりユーザが属する仮グループを選択し、ユーザ数Uが目標値Ugtに対して大きく乖離している場合に、次回以降、スコア補正部133Bにより補正スコアTugを算出してもよい。
【0077】
(変形例7)
第一実施形態において、スコア補正部133Bは、補正値bを、前回のスコア補正時に用いた補正値bを元にして、式(4)により修正する例を示すが、これに限定されない。
例えば、スコア補正部133Bは、補正値の初期値をbg0とし、i回目の補正時の補正値bgiをbgi=bg0×(U/Ugtαにより算出する。ここにbg0は固定された値である。
この場合でも、補正された補正スコアTugに基づいて、ユーザをグループ(仮グループ)分けするため、各グループのユーザ数Uが徐々に変化し、目標値Ugtに収束させることができる。
【0078】
なお、この場合、補正値bの修正回数(変数i)に応じて、αの値を増減させてもよい。
例えば、指数αをα/iに修正してもよく、この場合、修正回数が多いほど、αの値が小さくなる。
この際、第二実施形態や変形例1にて示すように、ユーザ数U及び目標値Ugtの比に基づいて、補正係数の指数αの修正値を変更してもよく、これにより、ユーザ数Uを迅速かつ高精度に、目標値Ugtに収束させることができる。
【0079】
さらに、記録部12に、比(U/Ugt)に対する補正値bの関係を、例えばテーブルデータとして予め記録しておき、スコア補正部133Bは、比(U/Ugt)に対する補正値bを当該テーブルデータから読み出してもよい。
【0080】
(変形例8)
第一実施形態において、ステップS6において、グループ選択部133Cは、補正スコアTugが大きい順にG個のグループを、仮グループとして選択する例を示した。この場合、各ユーザに対して選択された仮グループは、例えばメモリにおける一時記憶領域に記録されることになる。これに対して、グループ登録部133Dが、グループ選択部133Cにより選択したグループをユーザ情報の所属グループ情報に記録(登録)してもよい。この場合、ステップS7においてNoと判定されて、ステップS5及びステップS6の処理を再度実施する際に、グループ登録部133Dは、ユーザ情報の所属グループ情報を更新すればよい。当該処理では、ステップS5からステップS8のループ処理を繰り返す毎に、ユーザ情報を更新する必要が生じるが、ステップS7においてYesと判定された場合の更新処理(ステップS9の処理)を省略することができる。
【0081】
(変形例9)
第一実施形態では、ステップS5からステップS8の処理を反復処理として、ステップS7においてYesと判定されるまで繰り返して実施する例を示したが、これに限定されない。各グループの目標値に対して、ユーザ数が所定範囲内となるように、補正スコアTugが算出されれば、1回の補正のみであってもよい。
例えば、過去のグループ分け(分類処理)の結果に基づいて、各グループの目標値、スコアのみによりユーザをグループ分けした際の各グループの所属ユーザ数、各グループに対するユーザの所属条件、及び補正値等に基づいて、グループ情報を入力値、補正値を出力値としたグループ予測モデルを生成する。そして、グループ分けを実施する際に、各グループ情報を入力値として、グループ予測モデルに入力し、出力された各グループの補正値を使って、ユーザの各グループに対するスコアSugを補正する。この場合、機械学習によりグループ予測モデルを更新することで、グループに対する補正値bの精度を向上させることができる。そして、このようなグループ予測モデルに基づいた補正値を用いることで、各グループの目標値に対して、ユーザ数が所定範囲内となるように、補正スコアTugが算出されるので、補正スコアの算出が例えば1回のみでよく、より迅速な分類処理を行うことができる。
【0082】
(変形例10)
第一実施形態において、スコア補正部133Bは、スコアSugを補正値bで除算することで補正スコアを算出する例を示したが、これに限定されない。
例えば、ユーザ数Uが目標値Ugtよりも大きい場合に1未満となり、ユーザ数Uが目標値Ugtよりも小さい場合に1より大きくなる値であれば、スコアSugに対してその値を乗算してもよい。
また、スコア補正部133Bは、スコアSugを所定の補正値分だけ加算又は減算することで補正スコアTugを算出してもよい。この場合、ユーザ数と目標値との差が大きい程値が大きい補正値を用いる。そして、ユーザ数が目標値を上回る場合に、スコアを補正値分だけ減算し、ユーザ数が目標値を下回る場合に、スコアを補正値分だけ加算する等が例示できる。
【0083】
(変形例11)
上記第一実施形態及び第二実施形態、各変形例において、本発明の分類対象をユーザとする例を示したが、これに限定されない。例えば、農産物等を分類対象として、当該農産物の産地や、収穫時期、サイズや重量、色等をそれぞれ属性情報として、各農産物を、複数のグループに分類してもよい。この場合、例えば、一般家庭で需要の大きい通常の農産物、富裕層で需要の大きい高級農産物、工場等において加工に用いられる加工用農産物等に分類することができる。
【0084】
また、上記実施形態では、サーバ装置10により、端末装置20を操作する各ユーザを分類する例であり、サーバ装置10を本発明の情報処理装置として機能させたが、分類対象によって、端末装置20を本発明の情報処理装置として機能させることができる。
例えば、端末装置20において、ユーザにより取得された画像情報(例えばインターネット上からダウンロードした画像や動画、撮像カメラにより撮影された写真画像や動画等)を分類対象とする情報処理装置として機能させることができる。この場合、画像や動画のダウンロード日時、撮影日時、ファイルサイズ、ファイルタイプ、撮影場面等を属性情報として、各画像を分類してもよい。この際、端末装置20は、端末記録部24に記録された分類処理プログラムを読み込んで実行させることで、端末制御部25を、属性取得部及びグループ設定部として機能させる。これにより、上記実施形態と略同一の情報処理方法により、各画像を、ユーザが設定したグループに、ユーザが設定した目標値に応じて分類することが可能となる。
【0085】
その他、本発明の実施の際の具体的な構造及び手順は、本発明の目的を達成できる範囲で他の構造などに適宜変更できる。
【符号の説明】
【0086】
1…情報処理システム、10…サーバ装置(情報処理装置)、12…記録部、13…制御部、131…ユーザ情報取得部(属性取得部)、132…グループ情報取得部、133…グループ設定部、133A…スコア算出部、133B…スコア補正部、133C…グループ選択部、133D…グループ登録部。
図1
図2
図3
図4
図5
図6