IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7104214提供装置、提供方法、及び提供プログラム
<>
  • 特許-提供装置、提供方法、及び提供プログラム 図1
  • 特許-提供装置、提供方法、及び提供プログラム 図2
  • 特許-提供装置、提供方法、及び提供プログラム 図3
  • 特許-提供装置、提供方法、及び提供プログラム 図4
  • 特許-提供装置、提供方法、及び提供プログラム 図5
  • 特許-提供装置、提供方法、及び提供プログラム 図6
  • 特許-提供装置、提供方法、及び提供プログラム 図7
  • 特許-提供装置、提供方法、及び提供プログラム 図8
  • 特許-提供装置、提供方法、及び提供プログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-07-11
(45)【発行日】2022-07-20
(54)【発明の名称】提供装置、提供方法、及び提供プログラム
(51)【国際特許分類】
   G06Q 30/02 20120101AFI20220712BHJP
【FI】
G06Q30/02 300
【請求項の数】 7
(21)【出願番号】P 2021085686
(22)【出願日】2021-05-20
【審査請求日】2021-11-18
【早期審査対象出願】
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】佐々木 潔
(72)【発明者】
【氏名】田島 玲
(72)【発明者】
【氏名】石川 貴大
(72)【発明者】
【氏名】塚本 浩司
(72)【発明者】
【氏名】中村 征良
(72)【発明者】
【氏名】中山 一紀
【審査官】原 忠
(56)【参考文献】
【文献】特開2020-035068(JP,A)
【文献】特開2015-146145(JP,A)
【文献】中国特許出願公開第112580733(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
第1の事業者から、所定のカテゴリに属するユーザの属性情報を受け付ける受付部と、
第2の事業者が予め蓄積するユーザ情報を用いて前記ユーザ情報に含まれるユーザを分類するモデルであって、前記受付部により受け付けられた前記属性情報を有するユーザを同一カテゴリに分類する分類モデルを生成する生成部と、
前記生成部により生成された前記分類モデルを用いて、前記ユーザ情報に含まれるユーザの中から前記所定のカテゴリに属するユーザを分類する分類部と、
前記分類部により分類されたユーザに紐付くデータを用いて前記各ユーザについて予め算出された特徴情報を相互に比較し、前記特徴情報の類似度に基づいて前記各ユーザ複数の部分集合にグループ分けするグルーピング部と、
前記グルーピング部により同一の部分集合にグループ分けされた前記各ユーザに関する統計情報を前記第1の事業者に提供する提供部と
を備えることを特徴とする提供装置。
【請求項2】
前記提供部は、
前記グルーピング部により前記同一の部分集合にグループ分けされたユーザの数が所定の閾値以上となることを条件として、前記同一の部分集合に属する前記各ユーザに関する統計情報を提供する
ことを特徴とする請求項1に記載の提供装置。
【請求項3】
前記提供部は、
前記グルーピング部により前記同一の部分集合にグループ分けされたユーザの数が所定の閾値未満である場合、前記ユーザの数が前記所定の閾値以上となるように、前記所定のカテゴリに属するユーザかどうかを分類するための閾値条件を緩和する
ことを特徴とする請求項1又は2に記載の提供装置。
【請求項4】
前記提供部は、
前記統計情報として、前記分類モデルから出力されるスコアに基づく情報を提供する
ことを特徴とする請求項1~3のいずれか1つに記載の提供装置。
【請求項5】
前記提供部は、
各カテゴリに分類されたユーザの統計情報を組み合わせて提供する
ことを特徴とする請求項1~4のいずれか1つに記載の提供装置。
【請求項6】
コンピュータが実行する提供方法であって、
第1の事業者から、所定のカテゴリに属するユーザの属性情報を受け付ける受付工程と、
第2の事業者が予め蓄積するユーザ情報を用いて前記ユーザ情報に含まれるユーザを分類するモデルであって、前記受付工程により受け付けられた前記属性情報を有するユーザを同一カテゴリに分類する分類モデルを生成する生成工程と、
前記生成工程により生成された前記分類モデルを用いて、前記ユーザ情報に含まれるユーザの中から前記所定のカテゴリに属するユーザを分類する分類工程と、
前記分類工程により分類されたユーザに紐付くデータを用いて前記各ユーザについて予め算出された特徴情報を相互に比較し、前記特徴情報の類似度に基づいて前記各ユーザ複数の部分集合にグループ分けするグルーピング工程と、
前記グルーピング工程により同一の部分集合にグループ分けされた前記各ユーザに関する統計情報を前記第1の事業者に提供する提供工程と
を含むことを特徴とする提供方法。
【請求項7】
コンピュータに、
第1の事業者から、所定のカテゴリに属するユーザの属性情報を受け付ける受付手順と、
第2の事業者が予め蓄積するユーザ情報を用いて前記ユーザ情報に含まれるユーザを分類するモデルであって、前記受付手順により受け付けられた前記属性情報を有するユーザを同一カテゴリに分類する分類モデルを生成する生成手順と、
前記生成手順により生成された前記分類モデルを用いて、前記ユーザ情報に含まれるユーザの中から前記所定のカテゴリに属するユーザを分類する分類手順と、
前記分類手順により分類されたユーザに紐付くデータを用いて前記各ユーザについて予め算出された特徴情報を相互に比較し、前記特徴情報の類似度に基づいて前記各ユーザ複数の部分集合にグループ分けするグルーピング手順と、
前記グルーピング手順により同一の部分集合にグループ分けされた前記各ユーザに関する統計情報を前記第1の事業者に提供する提供手順と
を実行させることを特徴とする提供プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、提供装置、提供方法、及び提供プログラムに関する。
【背景技術】
【0002】
従来、ビジネスシーン等に活用することを目的として、インターネットを介してやり取りされる膨大なデータを様々な側面から分析するための様々な技術が提案されている。たとえば、購買履歴データ等を用いて時期のトレンドを考慮して顧客を分析する技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2015-146145号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術は、ターゲットとなるユーザに関する有益な情報を提供する上で改善の余地がある。
【0005】
本願は、上記に鑑みてなされたものであって、ターゲットとなるユーザに関する有益な情報を提供できる提供装置、提供方法、及び提供プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る提供装置は、受付部と、生成部と、分類部と、グルーピング部と、提供部とを備える。受付部は、第1の事業者から、所定のカテゴリに属するユーザの属性情報を受け付ける。生成部は、第2の事業者が予め蓄積するユーザ情報を用いてユーザ情報に含まれるユーザを分類するモデルであって、受付部により受け付けられた属性情報を有するユーザを同一カテゴリに分類する分類モデルを生成する。分類部は、生成部により生成された分類モデルを用いて、ユーザ情報に含まれるユーザの中から所定のカテゴリに属するユーザを分類する。グルーピング部は、分類部により分類されたユーザをグループ分けする。提供部は、グルーピング部により同一の集合にグループ分けされたユーザに関する統計情報を第1の事業者に提供する。
【発明の効果】
【0007】
実施形態の態様の1つによれば、ターゲットとなるユーザに関する有益な情報を提供できる。
【図面の簡単な説明】
【0008】
図1図1は、実施形態に係る情報処理の一例を示す図である。
図2図2は、実施形態に係る検索履歴に基づく統計情報の一例を示す図である。
図3図3は、実施形態に係る購入履歴に基づく統計情報の一例を示す図である。
図4図4は、実施形態に係る検索履歴に基づく統計情報の他の例を示す図である。
図5図5は、実施形態に係る提供装置の構成例を示す図である。
図6図6は、実施形態に係るカテゴリごとの検索履歴に関する統計情報の一例を示す図である。
図7図7は、実施形態に係る提供装置による処理手順の一例を示すフローチャートである。
図8図8は、変形例に係る統計情報の提供方法の一例を示す図である。
図9図9は、実施形態又は変形例に係る提供装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る提供装置、提供方法、及び提供プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、以下に説明する実施形態により本願に係る提供装置、提供方法、及び提供プログラムが限定されるものではない。また、以下に説明する実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下に説明する実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
[1.情報処理の概要]
以下、図面を参照しつつ、実施形態に係る情報処理の一例を説明する。図1は、実施形態に係る情報処理の一例を示す図である。なお、以下に説明する例に限らず、任意の数の事業者端末について、以下に説明する情報処理を並列して実行できる。
【0011】
図1に示すように、実施形態に係る提供システム1は、事業者端末10と、提供装置100とを備える。事業者端末10及び提供装置100は、それぞれ有線又は無線によりネットワークN(たとえば、図5参照)に接続される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網、固定電話網等)や、地域IP(Internet Protocol)網や、インターネット等の通信ネットワークである。ネットワークNは、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。事業者端末10及び提供装置100は、ネットワークNを通じて相互に通信できる。
【0012】
図1に示す事業者端末10は、事業者X(「第1の事業者」の一例)が管理する情報処理装置である。たとえば、事業者Xは、消費者に対して所定の商品又は役務を提供する事業を反復継続的に独立して行っている。事業者端末10は、典型的には、デスクトップ型またはノート型のパーソナルコンピュータである。なお、事業者端末10は、スマートフォンやタブレット、PDA(Personal Digital Assistant)などの任意の情報処理端末により実現されてもよい。
【0013】
また、事業者端末10は、提供装置100から提供される情報を、ウェブブラウザやアプリケーションにより表示できる。なお、事業者端末10は、情報の表示処理を実現する制御情報を提供装置100などから受け取った場合には、制御情報に従って表示処理を実現する。
【0014】
また、事業者端末10は、事業者Xが営む事業に関する顧客情報を収集し、収集した顧客情報を管理する。また、事業者端末10は、事業者Xが収集した顧客情報の分析を行うことにより、所定のカテゴリに属するユーザのラベル(「属性情報」の一例)を特定する。たとえば、事業者端末10は、居所が「中央区在住」で、年齢が「50代」で、かつ性別が「男性」のカテゴリに属する顧客について、「冷蔵庫購入」や「年収一千万円以上」などのラベルを特定する。そして、事業者端末10は、提供装置100に対して、任意のタイミングで、所定のカテゴリごとに特定したラベルの情報を提供する。
【0015】
図1に示す提供装置100は、インターネット上の各種サービスを利用者に提供する事業を反復継続的に独立して行っている事業者Y(「第2の事業者」の一例)が管理する情報処理装置である。たとえば、提供装置100は、サーバ装置やクラウドシステムなどにより実現される。なお、提供装置100は、サービス利用者が使用する利用者端末(図示略)や事業者端末10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)等のスクリプト言語やCSS(Cascading Style Sheets)等のスタイルシート言語により記述される。なお、提供装置100から配信されるアプリケーションそのものを制御情報とみなしてもよい。
【0016】
提供装置100は、たとえば、ポータルサイトなどのオンラインコンテンツを介してインターネット上の各種サービスをサービス利用者に提供する。提供装置100が提供するサービスには、検索エンジンサイトや、ニュースサイトや、技術解説サイトや、ショッピングサイトや、ファイナンスサイト(株価サイト)や、路線検索サイトや、地図提供サイトや、旅行サイトや、飲食店紹介サイトや、ウェブブログなどに関するウェブページなどを介して提供される各種サービスが含まれる。また、提供装置100は、事業者端末10にインストールされた各種アプリ(例えば、ポータルアプリ、ニュースアプリ、オークションアプリ、天気予報アプリ、ショッピングアプリ、ファイナンス(株価)アプリ、路線検索アプリ、地図提供アプリ、旅行アプリ、飲食店紹介アプリ、ブログ閲覧アプリ等)に表示する情報を提供できる。
【0017】
また、提供装置100は、上述した各種サービスの提供を通じて、サービス利用者が入力した検索ワードを受信できる。また、提供装置100は、受信された検索ワードを、検索履歴(検索ログ)として蓄積できる。また、提供装置100は、各種サービスにおけるサービス利用者の操作や閲覧等に基づくユーザ属性(例えば、年齢、性別、地域等のデモフラフィック属性や、各種サービスのオンラインコンテンツの利用履歴等に基づいて推定されるサイコグラフィック属性など)や、各種サービス等におけるサービス利用者の行動履歴を収集し、ユーザIDと対応付けて格納する。また、提供装置100は、サービス利用者が使用する利用者端末(図示略)に予めインストールされた各種サービスに関するアプリケーションに表示する情報を、利用者端末に配信する装置であってもよい。また、提供装置100は、アプリケーションのデータそのものを配信するサーバ装置であってもよい。
【0018】
また、提供装置100は、事業者Xに対して、事業者Yが予め蓄積するサービス利用者情報を用いて、事業者Xから提供されたラベルに基づいて分類モデルを作成し、作成した分類モデルにより分類された各ユーザに基づく統計情報を提供する。
【0019】
図1に示すように、まず、提供装置100は、事業者端末10から、所定のカテゴリごとに、所定のカテゴリに属する顧客(ユーザ)のラベルの情報を受け付ける(ステップS1)。図1に示す例では、たとえば、提供装置100は、カテゴリCT-Aに属するユーザのラベルLA-1およびラベルLA-2や、カテゴリCT-Bに属するユーザのラベルLBや、カテゴリCT-Cに属するユーザのラベルLCなどを受け付けている。
【0020】
続いて、提供装置100は、事業者端末10から受け付けたラベルの情報を有するユーザを同一カテゴリに分類する分類モデルを生成する(ステップS2)。すなわち、提供装置100は、事業者Yが予め蓄積するサービス利用者情報(「ユーザ情報」の一例)を用いて、サービス利用者情報に含まれるサービス利用者を分類するモデルを生成する。
【0021】
たとえば、提供装置100は、学習用データを用いて、入力用データの入力に応じて当該入力用データに対応するユーザが、ラベルに対応する所定のカテゴリに属するユーザであるかどうかを分類(推定)する分類モデルを学習する。具体的には、提供装置100は、モデル(ニューラルネットワーク)を構成する相互に接続されたノード間の接続係数(重み)等のパラメータを学習する。
【0022】
また、分類モデルの学習は、種々の機械学習に関する技術を用いて行われる。たとえば、提供装置100は、モデルに入力するデータと、そのデータが入力された場合の出力を示す分類ラベル(正解ラベル)を用いて行う学習の手法、すなわち教師有り学習の手法によりモデルのパラメータを学習する。なお、上記は一例であり、提供装置100は、モデルのパラメータを学習可能であれば、どのような学習の手法により、モデルのパラメータを学習してもよい。
【0023】
ここで、図1に示す分類モデルMAの学習について具体例を交えて説明する。たとえば、提供装置100を管理する事業者Yは、サービス利用者情報の中から、ラベルLA-1(「冷蔵庫購入」)およびラベルLA-2(「年収一千万円以上」)の双方に該当するサンプルデータを取得する。そして、事業者Yは、取得したサンプルデータに対して、ラベルLA-1およびラベルLA-2に対応するカテゴリCT-A(「中央区在住」+「50代」+「男性」)を分類ラベル(正解ラベル)として付与した学習用データを準備する。
【0024】
次に、提供装置100は、準備した学習用データをモデルに学習させて、ラベルLA-1およびラベルLA-2に該当する任意のユーザに紐づくデータを入力した場合、モデルが出力するスコアのうち、該当ユーザをカテゴリCT-Aに分類するスコアが所定の閾値以上となるように(カテゴリCT-Aに属するユーザをカテゴリCT-Aに正しく分類できるように)、バックプロパゲーション等の学習手法を用いて、上述したパラメータを学習する。このようにして、サービス利用者をカテゴリCT-Aに分類する分類モデルMAを生成できる。同様に、提供装置100は、分類モデルMBや分類モデルMCなどを生成できる。なお、提供装置100は、生成した分類モデルにより分類されるサービス利用者の数が所定の閾値以上となるような分類モデルを生成してもよい。
【0025】
提供装置100は、各分類モデルを生成するためのモデル(ネットワーク)として、たとえば、DNN(Deep Neural Network)や、SVM(Support Vector Machine)などの任意のネットワークを採用できる。また、分類モデルは、決定木であってもよい。
【0026】
続いて、提供装置100は、分類モデルを用いて、予め蓄積するサービス利用者情報に含まれるサービス利用者の中から、所定のカテゴリに属するユーザを分類する(ステップS3)。
【0027】
続いて、提供装置100は、分類モデルによって分類されたユーザをグループ分けする(ステップS4)。以下、分類モデルMAによって、カテゴリCT-A(「中央区在住」+「50代」+「男性」)に分類されたユーザのグループ分けについて例示する。
【0028】
たとえば、提供装置100は、サービス利用者情報の中から、カテゴリCT-A(「中央区在住」+「50代」+「男性」)に属する各ユーザに紐づくデータを取得し、取得したデータを用いて、各ユーザをグループ分け(クラスタリング)する。なお、グループ分けは、たとえば、各ユーザについて予め算出された特徴情報を相互に比較し、特徴情報の類似度に基づいて行うことができる。ここで、特徴情報は、ユーザが入力した検索ワードの傾向や、各種サービスにおける行動履歴や、行動履歴から推定されるユーザ属性などをベクトル化することにより得られる情報であってもよいし、ユーザの属性を単に数値化した情報であってもよい。また、グループ分けの手法は、階層型であってもよいし、非階層型であってもよい。階層型のグループ分けに用いる計算方法として、ウォード法や、群平均法や、最短距離法や、最長距離法などの任意の方法を利用できる。また、非階層型のグループ分けに用いる計算方法として、k-means法などの任意の方法を利用できる。
【0029】
グループ分け後、提供装置100は、同一の集合(以下、「同一クラスタ」と称する。)にグループ分けされた各ユーザに関する統計情報を事業者Xに提供する(ステップS5)。
【0030】
提供装置100は、所定のカテゴリに属する各ユーザをグループ分けした各クラスタ(たとえば、ユーザ数≧10)について、クラスタを特徴付けるデータを個別に集計する。そして、提供装置100は、クラスタごとに個別に集計したデータを元に統計情報を生成して、事業者Xに提供する。なお、提供装置100は、グループ分けした各クラスタに属するユーザ数に対して、下限のみならず、上限(たとえば、ユーザ数≦20)を設けてもよい。
【0031】
たとえば、提供装置100は、同一クラスタに属する各ユーザに紐づく検索履歴を参照し、クラスタごとに各ユーザが入力した検索ワードを個別に集計し、最も多く検索されている検索ワードを特定する。そして、提供装置100は、クラスタごとに特定した検索ワードの情報を統計情報として事業者Xに提供できる。図2は、実施形態に係る検索履歴に基づく統計情報の一例を示す図である。
【0032】
図2に示すように、提供装置100は、たとえば、各クラスタにおいてユーザの検索数が最も多かった検索ワードの情報を、対応するカテゴリの情報に関連付けて、リスト形式で構成した統計情報を事業者Xに提供できる。図2に示す例では、カテゴリCT-Aに属するユーザからグループ分けされたクラスタ1つにおいて最も検索数が多かった検索ワードである「社交ダンス」や、カテゴリCT-Aに属するユーザからグループ分けされたクラスタ1つにおいて最も検索数が多かった検索ワードである「移住」や、カテゴリCT-Aに属するユーザからグループ分けされたクラスタ1つにおいて最も検索数が多かった検索ワードである「世界遺産」などが示されている。
【0033】
また、たとえば、提供装置100は、同一クラスタに属する各ユーザに紐づく購入履歴を参照し、クラスタごとに各ユーザが購入した商品の購入数を個別に集計し、最も多く購入されている商品を特定する。そして、提供装置100は、クラスタごとに特定した商品の情報を統計情報として事業者Xに提供できる。図3は、実施形態に係る購入履歴に基づく統計情報の一例を示す図である。
【0034】
図3に示すように、提供装置100は、たとえば、各クラスタにおいてユーザの購入数が最も多かった商品の情報を、対応するカテゴリの情報に関連付けて、リスト形式で構成した統計情報を事業者Xに提供できる。図3に示す例では、カテゴリCT-Aに属するユーザからグループ分けされたクラスタ1つにおいて最も購入数の最も多かった商品である「カメラ」や、カテゴリCT-Aに属するユーザからグループ分けされたクラスタ1つにおいて最も購入数の最も多かった商品である「掃除機」や、カテゴリCT-Aに属するユーザからグループ分けされたクラスタ1つにおいて最も購入数の最も多かった商品である「寝具」などが示されている。
【0035】
また、提供装置100は、リスト形式の統計情報を提供する例に限られない。図4は、実施形態に係る検索履歴に基づく統計情報の他の例を示す図である。図4に示すように、提供装置100は、各クラスタにおいてユーザの検索数が最も多かった検索ワードの情報を、対応する分類モデルMAに関連付けて、キーワードマップ形式で構成した統計情報を事業者Xに提供してもよい。
【0036】
また、提供装置100は、分類モデルから出力される各ユーザのスコアに基づく情報を統計情報として提供できる。図2図4に示す例では、検索ワード:「社交ダンス」に紐づく集合(クラスタ)に属する各ユーザについて分類モデルMAから出力された出力スコアの平均値VA1-1が検索ワード:「社交ダンス」に関連付けて提供されている。同様に、検索ワード:「移住」に紐づく集合(クラスタ)に属する各ユーザについて分類モデルMAから出力された出力スコアの平均値VA1-2が検索ワード:「移住」に関連付けて提供されている。同様に、検索ワード:「世界遺産」に紐づく集合(クラスタ)に属する各ユーザについて分類モデルMAから出力された出力スコアの平均値VA1-3が検索ワード:「世界遺産」に関連付けて提供されている。これにより、統計情報の提供を受けた事業者Xは、カテゴリCT-Aに属するユーザについて、より相関が強い検索ワードを特定できる。
【0037】
このように、提供装置100は、事業者Xに対して、所定のカテゴリに属するユーザに関する有益な情報を提供できる。すなわち、提供装置100は、事業者Xに対して、たとえば、事業者Xがターゲットとなるユーザに関する有益な情報を提供できる。なお、提供装置100は、検索履歴や購買履歴に限らず、ユーザ属性などに関する統計情報を事業者Xに提供できる。
【0038】
また、提供装置100は、同一クラスタにグループ分けされたユーザの数が所定の閾値以上となることを条件として、同一クラスタに属するユーザに関する統計情報を提供する。これにより、匿名性を担保した統計情報の提供を実現できる。
【0039】
また、提供装置100は、同一の集合にグループ分けされたユーザの数が所定の閾値未満である場合、ユーザの数が所定の閾値以上となるように、所定のカテゴリ(たとえば、カテゴリCT-A:「中央区在住」+「50代」+「男性」)に属するユーザかどうかを分類するための閾値条件を緩和してもよい。すなわち、提供装置100は、分類モデルから出力されるスコアのうち、該当ユーザを所定のカテゴリに分類するスコアを判定するための閾値を緩和してもよい。これにより、所定のカテゴリに属するユーザの数を拡張でき、グループ分けされたユーザの数が所定の条件を満たすように調整できる。なお、提供装置100は、クラスタリングする際に、類似するユーザを判定するための条件を緩和してもよい。
【0040】
[2.提供装置の構成]
図5を用いて、実施形態に係る提供装置100の構成について説明する。図5は、実施形態に係る提供装置の構成例を示す図である。
【0041】
図5に示すように、提供装置100は、通信部110と、記憶部120と、制御部130とを備える。なお、図5は、提供装置100の構成例を示すものであり、図5に示す形態には限られず、図5に示す以外の他の機能部を備える形態であってもよい。
【0042】
(通信部110)
通信部110は、例えば、ネットワークNと有線または無線で接続され、ネットワークNを介して、事業者端末10などの他の装置との間で情報の送受信を行う。通信部110は、例えば、NIC(Network Interface Card)やアンテナなどによって実現される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網や固定電話網など)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。
【0043】
通信部110は、事業者端末10から、所定のカテゴリごとに、所定のカテゴリに属する顧客(ユーザ)のラベルの情報を受信する。また、通信部110は、制御部130が生成した統計情報を事業者端末10に送信する。
【0044】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリなどの半導体メモリ素子、または、ハードディスクや光ディスクなどの記憶装置によって実現される。記憶部120は、制御部130の各部により実行される情報処理を実現するためのプログラム及びデータを記憶する。
【0045】
図5に示すように、記憶部120は、サービス利用者情報記憶部121及びモデル記憶部122を有する。サービス利用者情報記憶部121は、サービス利用者を特定するための識別情報(たとえば、ユーザID)に関連付けて、サービス利用者に関するサービス利用者情報を記憶する。サービス利用者情報には、サービス利用者の検索履歴(検索ログ)や、各種サービスにおけるサービス利用者の操作や閲覧等に基づくユーザ属性(例えば、年齢、性別、地域等のデモフラフィック属性や、各種サービスのオンラインコンテンツの利用履歴等に基づいて推定されるサイコグラフィック属性など)や、各種サービス等におけるサービス利用者の行動履歴などを含む。モデル記憶部122は、制御部130により所定のカテゴリごとに生成されたモデルのデータを記憶する。
【0046】
(制御部130)
制御部130は、提供装置100を制御するコントローラ(controller)である。制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などによって、提供装置100内部の記憶装置に記憶されている各種プログラム(例えば、情報処理プログラム)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現されてもよい。
【0047】
図5に示すように、制御部130は、受付部131と、生成部132と、分類部133と、グルーピング部134と、提供部135とを有する。制御部130は、これらの各部により、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図4に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各部の接続関係は、図4に示した接続関係に限られず、他の接続関係であってもよい。
【0048】
(受付部131)
受付部131は、通信部110を通じて、第1の事業者(たとえば、「事業者X」)から、所定のカテゴリ(たとえば、「中央区在住」+「50代」+「男性」)に属するユーザのラベルの情報(たとえば、「冷蔵庫購入」や「年収一千万円以上」)を受け付ける。受付部131は、受け付けたラベルの情報を生成部132に送る。
【0049】
(生成部132)
生成部132は、受付部131から取得したラベルの情報を有するユーザを同一カテゴリに分類する分類モデルを所定のカテゴリごとに生成する。生成部132は、生成した分類モデルのデータをモデル記憶部122に保存する。
【0050】
(分類部133)
分類部133は、モデル記憶部122に記憶されている分類モデルを用いて、サービス利用者情報記憶部121に記憶されているサービス利用者情報に含まれるサービス利用者の中から、所定のカテゴリに属するユーザを分類する。分類部133は、分類した各ユーザを特定するための識別情報(たとえば、ユーザID)をグルーピング部134に送る。
【0051】
(グルーピング部134)
グルーピング部134は、上述したように、任意のグルーピング手法を用いて、分類部133により分類されたユーザをグループ分けする。グルーピング部134は、グループ分けした各ユーザを特定するための識別情報(たとえば、ユーザID)を提供部135に送る。
【0052】
(提供部135)
提供部135は、上述したように、同一クラスタにグループ分けされた各ユーザに関する統計情報を事業者Xに提供する。具体的には、提供部135は、同一クラスタにグループ分けされたユーザの数が10以上となる各クラスタについて、各クラスタに属するユーザを特徴付けるデータ(検索ワードや購入商品、ユーザ属性など)を個別に集計する。そして、提供部135は、クラスタごとに特定したデータを元に統計情報を生成し、通信部110を通じて事業者Xに提供する。
【0053】
図6は、実施形態に係るカテゴリごとの検索履歴に関する統計情報の一例を示す図である。たとえば、図6に示すように、提供部135は、同一クラスタにグループ分けされた各ユーザにより最も検索されている検索ワードの情報を、対応するカテゴリに関連付けたリスト形式の統計情報を事業者Xに提供できる。
【0054】
[3.処理手順]
以下、図7を用いて、実施形態に係る提供装置100による処理手順について説明する。図7は、実施形態に係る提供装置による処理手順の一例を示すフローチャートである。図7に示す処理手順は、提供装置100の制御部130により実行される。図7に示す処理手順は、提供装置100の稼働中、繰り返し実行される。
【0055】
図7に示すように、受付部131は、通信部110を通じて、所定のカテゴリに属するユーザのラベルの情報を事業者端末10から受け付ける(ステップS101)。
【0056】
また,生成部132は、受付部131から取得したラベルの情報を有するユーザを同一カテゴリに分類する分類モデルを所定のカテゴリごとに生成する(ステップS102)。
【0057】
また、分類部133は、モデル記憶部122に記憶されている分類モデルを用いて、サービス利用者情報記憶部121に記憶されているサービス利用者情報に含まれるサービス利用者の中から、所定のカテゴリに属するユーザを分類する(ステップS103)。
【0058】
また、グルーピング部134は、上述したように、任意のグルーピング手法を用いて、分類部133により分類されたユーザをグループ分けする(ステップS104)。
【0059】
また、提供部135は、通信部110を通じて、グルーピング部134により同一クラスタにグループ分けされたユーザに関する統計情報を事業者Xに提供し(ステップS105)、図7に示す処理手順を終了する。
【0060】
[4.変形例]
(4-1.複数の分類モデルに基づく統計情報の提供)
上述した実施形態において、提供装置100は、各カテゴリに分類されたユーザの統計情報を組み合わせて提供してもよい。図8は、変形例に係る統計情報の提供方法の一例を示す図である。図8は、「中央区在住」+「50代」のカテゴリに属するユーザに関する統計情報を提供する場合の一例を示している。
【0061】
図8に示すように、提供装置100は、「中央区在住」+「50代」のカテゴリに属するユーザに関する統計情報を提供する場合、より条件が限定された複数のカテゴリの各々に対応する分類モデルを用いてユーザを分類し、分類したユーザをグループ分けする。たとえば、提供装置100は、分類モデルMAを用いて、「中央区在住」+「50代」+「男性」のカテゴリに属するユーザを分類する。また、提供装置100は、分類モデルMXを用いて、「中央区在住」+「50代」+「女性」のカテゴリに属するユーザを分類する。
【0062】
続いて、提供装置100は、「中央区在住」+「50代」+「男性」のカテゴリに分類されたユーザをグループ分けすることにより、同一クラスタにグループ分けされたユーザに関する統計情報を生成する。また、提供装置100は、「中央区在住」+「50代」+「女性」のカテゴリに分類されたユーザをグループ分けすることにより、同一クラスタにグループ分けされたユーザに関する統計情報を生成する。
【0063】
そして、提供装置100は、「中央区在住」+「50代」+「男性」のカテゴリに属するユーザに関する統計情報と、「中央区在住」+「50代」+「女性」のカテゴリに属するユーザに関する統計情報とを組み合わせて提供する。これにより、提供装置100は、所定のカテゴリに属するユーザの分類精度を落とさずに、所望のカテゴリに属するユーザに関する統計情報の提供を実現できる。
【0064】
(4-2.分類モデルの援用)
上述した実施形態において、提供装置100は、モデル記憶部122に記憶されている分類モデルを、事業者Xが営む事業と競業関係にある他社に対して統計情報を提供する際に援用してもよい。
【0065】
[5.ハードウェア構成]
実施形態又は変形例に係る提供装置100は、例えば図9に示すような構成のコンピュータ1000によって実現される。図9は、実施形態又は変形例に係る提供装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【0066】
コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0067】
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラムなどを格納する。
【0068】
HDD1400は、CPU1100によって実行されるプログラム、および、かかるプログラムによって使用されるデータなどを格納する。通信インターフェイス1500は、ネットワーク(通信網)Nを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、ネットワーク(通信網)Nを介して他の機器へ送信する。
【0069】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタなどの出力装置、及び、キーボードやマウスなどの入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。
【0070】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)などの光学記録媒体、MO(Magneto-Optical disk)などの光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリなどである。
【0071】
例えば、コンピュータ1000が実施形態に係る提供装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、ネットワーク(通信網)Nを介してこれらのプログラムを取得してもよい。
【0072】
[6.その他]
上述した実施形態又は変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0073】
上述の実施形態において、提供装置100による提供方法(たとえば、図7参照)を実現するために、提供装置100が有する制御部130の各部(受付部131、生成部132、分類部133、グルーピング部134、及び提供部135)に対応する処理機能は、提供装置100に予めインストールされている提供プログラムに対するアドオンとして実現してもよいし、軽量なプログラミング言語などを用いて、専用の提供プログラムとして柔軟に記述することにより実現されてもよい。
【0074】
また、上述した実施形態及び変形例において、提供装置100は、サービス利用者に対して各種サービスを提供する装置と、事業者に対して統計情報を提供する装置とに物理的に分散して構成されていてもよい。
【0075】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。たとえば、制御部130の受付部131および生成部132とは機能的に統合されていてもよい。
【0076】
また、上述の実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0077】
[7.効果]
上述の実施形態又は変形例に係る提供装置100は、受付部131と、生成部132と、分類部133と、グルーピング部134と、提供部135とを備える。受付部131は、たとえば事業者X(「第1の事業者」の一例)から、所定のカテゴリに属するユーザのラベルの情報(「属性情報」の一例)を受け付ける。生成部132は、たとえば、事業者Y(「第2の事業者」の一例)が予め蓄積するサービス利用者情報(「ユーザ情報」の一例)を用いて、サービス利用者情報に含まれるユーザを分類するモデルであって、受付部131により受け付けられたラベルの情報を有するユーザを同一カテゴリに分類する分類モデルを生成する。分類部133は、生成部132により生成された分類モデルを用いて、サービス利用者情報に含まれるユーザの中から所定のカテゴリに属するユーザを分類する。グルーピング部134は、分類部133により分類されたユーザをグループ分けする。提供部135は、グルーピング部134により同一の集合にグループ分けされたユーザに関する統計情報を事業者Xに提供する。
【0078】
このようにして、実施形態又は変形例に係る提供装置100は、たとえば事業者Xに対して、所定のカテゴリに属するユーザに関する有益な情報を提供できる。すなわち、提供装置100は、事業者Xに対して、ターゲットとなるユーザに関する有益な情報、言い換えれば、事業者Xの事業の範囲では知り得えない多種多様な情報を提供できる。
【0079】
また、実施形態又は変形例に係る提供装置100において、提供部135は、グルーピング部134により同一の集合にグループ分けされたユーザの数が所定の閾値以上となることを条件として、同一の集合に属するユーザに関する統計情報を提供する。これにより、実施形態又は変形例に係る提供装置100は、匿名性を担保したユーザの提供を実現できる。
【0080】
また、実施形態又は変形例に係る提供装置100において、提供部135は、グルーピング部134により同一の集合にグループ分けされたユーザの数が所定の閾値未満である場合、ユーザの数が所定の閾値以上となるように、所定のカテゴリに属するユーザかどうかを分類するための閾値条件を緩和する。これにより、積極的な統計情報の提供を実現できる。
【0081】
また、実施形態又は変形例に係る提供装置100において、提供部135は、統計情報として、分類モデルから出力されるスコアに基づく情報(たとえば、各クラスタに属するユーザのスコアの平均値)を提供してもよい。これにより、統計情報において、所定のカテゴリ(たとえば、「中央区在住」+「50代」+「男性」)に相関性のある情報を容易に特定するための客観的な指標を提供できる。
【0082】
また、実施形態又は変形例に係る提供装置100において、提供部135は、各カテゴリに分類されたユーザの統計情報を組み合わせて提供する。これにより、所定のカテゴリに属するユーザの分類精度を落とさずに、所望のカテゴリに属するユーザに関する統計情報の提供を実現できる。
【0083】
以上、本願の実施形態をいくつかの図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0084】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。
【符号の説明】
【0085】
10 事業者端末
100 提供装置
110 通信部
120 記憶部
121 サービス利用者情報記憶部
122 モデル記憶部
130 制御部
131 受付部
132 生成部
133 分類部
134 グルーピング部
135 提供部
【要約】
【課題】ターゲットとなるユーザに関する有益な情報を提供すること。
【解決手段】本願に係る提供装置は、受付部と、生成部と、分類部と、グルーピング部と、提供部とを備える。受付部は、第1の事業者から、所定のカテゴリに属するユーザの属性情報を受け付ける。生成部は、第2の事業者が予め蓄積するユーザ情報を用いてユーザ情報に含まれるユーザを分類するモデルであって、受付部により受け付けられた属性情報を有するユーザを同一カテゴリに分類する分類モデルを生成する。分類部は、生成部により生成された分類モデルを用いて、ユーザ情報に含まれるユーザの中から所定のカテゴリに属するユーザを分類する。グルーピング部は、分類部により分類されたユーザをグループ分けする。提供部は、グルーピング部により同一の集合にグループ分けされたユーザに関する統計情報を第1の事業者に提供する。
【選択図】図5
図1
図2
図3
図4
図5
図6
図7
図8
図9