特許第6853009号(P6853009)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許6853009集計装置、集計方法、及び集計プログラム
<>
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000002
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000003
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000004
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000005
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000006
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000007
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000008
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000009
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000010
  • 特許6853009-集計装置、集計方法、及び集計プログラム 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6853009
(24)【登録日】2021年3月15日
(45)【発行日】2021年3月31日
(54)【発明の名称】集計装置、集計方法、及び集計プログラム
(51)【国際特許分類】
   G06F 16/953 20190101AFI20210322BHJP
【FI】
   G06F16/953
【請求項の数】7
【全頁数】21
(21)【出願番号】特願2016-199398(P2016-199398)
(22)【出願日】2016年10月7日
(65)【公開番号】特開2018-60468(P2018-60468A)
(43)【公開日】2018年4月12日
【審査請求日】2019年3月25日
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】西本 保則
(72)【発明者】
【氏名】堀江 亮介
【審査官】 原 秀人
(56)【参考文献】
【文献】 特表2008−520037(JP,A)
【文献】 特開2005−302041(JP,A)
【文献】 特開2009−277071(JP,A)
【文献】 特開2013−037404(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00−16/958
(57)【特許請求の範囲】
【請求項1】
検索クエリに含まれる各トークンであって、地名に関するラベルまたは前記地名以外の他のカテゴリに関するラベルが付された各トークンであり、複数のラベルが付された複数ラベルトークンを含む各トークンに関する情報を取得する取得部と、
前記各トークンに付されたラベルの複数の組み合わせであって、前記複数ラベルトークンに付された複数のラベルのうち、同一カテゴリのラベル間での組み合わせを含まない複数の組み合わせの各々を対象に前記検索クエリによる検索回数に関する情報を集計する集計部と、
を備えることを特徴とする集計装置。
【請求項2】
前記集計部は、
前記各トークンに付されたラベルの重みに基づいて、前記複数の組み合わせ毎に前記検索クエリによる検索回数に関する情報を集計する
ことを特徴とする請求項1に記載の集計装置。
【請求項3】
前記取得部は、
前記他のカテゴリとして業種に関するラベルが付されたトークンに関する情報を取得する
ことを特徴とする請求項1または請求項2に記載の集計装置。
【請求項4】
前記取得部は、
前記地名に関連する関連ユーザが入力した検索クエリに含まれる一のトークンであって、前記地名に関するラベルが付された一のトークンに関する情報を取得し、前記関連ユーザ以外の他のユーザが入力した検索クエリに含まれる他のトークンであって、前記地名に関するラベルが付された他のトークンに関する情報を取得し、
前記集計部は、
前記関連ユーザと前記他のユーザとの各々を対象として、前記複数の組み合わせ毎に前記検索クエリによる検索回数に関する情報を集計する
ことを特徴とする請求項1〜3のいずれか1項に記載の集計装置。
【請求項5】
前記取得部は、
前記地名に対応する地域に居住する前記関連ユーザが入力した検索クエリに含まれる前記一のトークンに関する情報を取得し、前記他のユーザが入力した検索クエリに含まれる前記他のトークンに関する情報を取得する
ことを特徴とする請求項4に記載の集計装置。
【請求項6】
コンピュータが実行する集計方法であって、
検索クエリに含まれる各トークンであって、地名に関するラベルまたは前記地名以外の他のカテゴリに関するラベルが付された各トークンであり、複数のラベルが付された複数ラベルトークンを含む各トークンに関する情報を取得する取得工程と、
前記各トークンに付されたラベルの複数の組み合わせであって、前記複数ラベルトークンに付された複数のラベルのうち、同一カテゴリのラベル間での組み合わせを含まない複数の組み合わせの各々を対象に前記検索クエリによる検索回数に関する情報を集計する集計工程と、
を含むことを特徴とする集計方法。
【請求項7】
検索クエリに含まれる各トークンであって、地名に関するラベルまたは前記地名以外の他のカテゴリに関するラベルが付された各トークンであり、複数のラベルが付された複数ラベルトークンを含む各トークンに関する情報を取得する取得手順と、
前記各トークンに付されたラベルの複数の組み合わせであって、前記複数ラベルトークンに付された複数のラベルのうち、同一カテゴリのラベル間での組み合わせを含まない複数の組み合わせの各々を対象に前記検索クエリによる検索回数に関する情報を集計する集計手順と、
をコンピュータに実行させることを特徴とする集計プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、集計装置、集計方法、及び集計プログラムに関する。
【背景技術】
【0002】
従来、検索システムに用いられた検索クエリ(以下、単に「クエリ」ともいう)に基づいて、検索の対象に関する情報を収集する技術が提供されている。例えば、クエリには、所定の区切り文字で区切られた複数の文字列(以下、「トークン」ともいう)が含まれる場合がある。また、例えば、所定の対象をクラスに分類する技術が提供されている。例えば、このような所定の対象をクラスに分類する技術により、トークンの内容(意味)に関連するラベルが付される。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】C.N. Silla Jr., A.A. Freitas, "A survey of hierarchical classification across different application domains", Data Mining and Knowledge Discovery, 22(1-2):182-196, January 2011
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の従来技術では、複数のラベルが付されたトークンが検索クエリに含まれる場合、適切に検索回数を集計することができるとは限らない。例えば、クエリ全体に基づいて検索回数を集計するだけでは、複数のラベルが付されたトークンが含まれる場合に、どの対象にどの程度検索が行われたかを適切に集計することができない場合がある。
【0005】
本願は、上記に鑑みてなされたものであって、複数のラベルが付されたトークンが含まれる場合であっても、適切に検索回数を集計する集計装置、集計方法、及び集計プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る集計装置は、検索クエリに含まれる各トークンであって、地名に関するラベルまたは前記地名以外の他のカテゴリに関するラベルが付された各トークンに関する情報を取得する取得部と、前記各トークンに付されたラベルの組み合わせ毎に前記検索クエリによる検索回数に関する情報を集計する集計部と、を備えたことを特徴とする。
【発明の効果】
【0007】
実施形態の一態様によれば、複数のラベルが付されたトークンが含まれる場合であっても、適切に検索回数を集計することができるという効果を奏する。
【図面の簡単な説明】
【0008】
図1図1は、実施形態に係る集計処理の一例を示す図である。
図2図2は、実施形態に係る集計装置の構成例を示す図である。
図3図3は、実施形態に係る検索履歴情報記憶部の一例を示す図である。
図4図4は、実施形態に係るトークン情報記憶部の一例を示す図である。
図5図5は、実施形態に係る集計情報記憶部の一例を示す図である。
図6図6は、実施形態に係る集計処理手順を示すフローチャートである。
図7図7は、変形例に係る集計装置の構成例を示す図である。
図8図8は、変形例に係る集計情報記憶部の一例を示す図である。
図9図9は、変形例に係るユーザ情報記憶部の一例を示す図である。
図10図10は、集計装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る集計装置、集計方法、及び集計プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る集計装置、集計方法、及び集計プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
(実施形態)
〔1.集計処理〕
まず、図1を用いて、実施形態に係る集計処理の一例について説明する。図1は、実施形態に係る集計処理の一例を示す図である。図1では、集計装置100が所定の検索システムで用いられた検索クエリ(クエリ)をトークンに付されたラベル(以下、「タグ」ともいう)の組み合わせ毎のスコア(検索回数)を算出し、各ラベルの組み合わせのスコアを集計する場合を示す。なお、ここでいう「トークン」とは、ユーザが検索に用いたクエリに含まれる所定の区切り文字で区切られた文字列を意味する。例えば、「トークン」は、ユーザが検索に用いたクエリにおいてスペースで区切られた各文字列を意味する。例えば、検索クエリが「六本木 グルメ」であった場合、文字列「六本木」や文字列「グルメ」がトークンとなる。
【0011】
図1に示すように、集計システム1には、検索装置50と、集計装置100とが含まれる。検索装置50と、集計装置100とは所定のネットワークを介して、有線または無線により通信可能に接続される。なお、図1に示した推定システム1には、複数台の検索装置50や、複数台の集計装置100が含まれてもよい。
【0012】
検索装置50は、所定の検索サービスを提供する情報処理装置である。例えば、検索装置50は、ユーザが利用する端末装置から検索クエリを取得し、その検索クエリに応じた検索結果を端末装置に提供する。なお、検索装置50は、集計装置100と一体であってもよい。
【0013】
図1の例では、集計装置100は、検索クエリQ11を検索装置50から取得する(ステップS10)。なお、集計装置100は、ユーザが利用する端末装置から検索クエリQ11を取得してもよい。また、図1の例では、検索クエリQ11は、「横浜 青葉区 トマト」という文字列であるものとする。
【0014】
まず、集計装置100は、検索クエリQ11をトークンに分割することにより、検索クエリQ11に含まれるトークンを取得する。具体的には、集計装置100は、検索クエリQ11からスペース(「 」)で区切られた各文字列をトークンとして取得する。図1の例では、集計装置100は、検索クエリQ11から文字列「横浜」であるトークンTK11を取得する(ステップS11−1)。また、図1の例では、集計装置100は、検索クエリQ11から文字列「青葉区」であるトークンTK12を取得する(ステップS11−2)。また、図1の例では、集計装置100は、検索クエリQ11から文字列「トマト」であるトークンTK13を取得する(ステップS11−3)。
【0015】
そして、集計装置100は、各トークンTK11〜TK13に付されたタグに関する情報をトークン情報記憶部122(図4参照)から取得する。例えば、トークンTK11には、カテゴリが「地名」であるタグ「神奈川」が付されているため、集計装置100は、タグTG11−1に示すように、「横浜」に付されたタグ「神奈川」を取得する。このように、地名に関するトークンには、カテゴリが「地名」のタグが付されるが、種々の方法により地名に関するトークンに地名に関するタグが付されてもよい。例えば、登記等のデータから抽出された地名に関する情報を用いて、地名に関するトークンには、カテゴリが「地名」のタグが付されてもよい。
【0016】
また、集計装置100は、トークンTK11に付されたタグ「神奈川」の重みをトークン情報記憶部122(図4参照)から取得する。例えば、集計装置100は、重みWT11−1に示すように、「横浜」に付されたタグ「神奈川」の重み「1」を取得する。
【0017】
また、図1の例では、集計装置100は、タグTG12−1に示すように、「青葉区」に付されたタグ「神奈川」を取得する。また、集計装置100は、タグTG12−2に示すように、「青葉区」に付されたタグ「宮城」を取得する。
【0018】
また、集計装置100は、トークンTK12に付されたタグ「神奈川」やタグ「宮城」の重みをトークン情報記憶部122(図4参照)から取得する。例えば、集計装置100は、重みWT12−1に示すように、「青葉区」に付されたタグ「神奈川」の重み「0.5」を取得する。また、例えば、集計装置100は、重みWT12−2に示すように、「青葉区」に付されたタグ「宮城」の重み「0.5」を取得する。なお、図1の例では、説明を簡単にするために、トークンTK12に付されたタグ「神奈川」やタグ「宮城」の重みを「0.5」とする場合を示すが、「青葉区」との関連性や他のトークンとの関係等の種々の情報に基づいて、「青葉区」に付されたタグ「神奈川」やタグ「宮城」の重みを変動させてもよい。
【0019】
例えば、検索クエリQ11には、地名「神奈川」を示すトークンTK11があるため、「青葉区」に付されたタグ「神奈川」の重みをタグ「宮城」の重みよりも大きくしてもよい。例えば、集計装置100は、検索クエリQ11の「青葉区」に付されたタグ「神奈川」の重みとタグ「宮城」の重みとを神奈川県と宮城県の人口の多寡に応じて変動させてもよい。例えば、集計装置100は、神奈川県の人口と宮城県の人口との比率が「3:2」である場合、検索クエリQ11の「青葉区」に付されたタグ「神奈川」の重みを「0.3」とし、タグ「宮城」の重みを「0.2」としてもよい。例えば、集計装置100は、「青葉区」と「神奈川」との類似度と、「青葉区」と「宮城」との類似度の差に応じて、検索クエリQ11の「青葉区」に付されたタグ「神奈川」の重みとタグ「宮城」の重みとを変動させてもよい。この場合、集計装置100は、例えばWord2Vec等の種々の従来技術を適宜用いて、「青葉区」と「神奈川」との類似度や、「青葉区」と「宮城」との類似度を算出してもよい。
【0020】
また、例えば、トークンTK13には、カテゴリが「業種」であるタグ「飲食業」やタグ「農業」が付されているため、集計装置100は、タグTG13−1に示すように、「トマト」に付されたタグ「飲食業」を取得する。また、集計装置100は、タグTG13−2に示すように、「トマト」に付されたタグ「農業」を取得する。
【0021】
また、集計装置100は、トークンTK13に付されたタグ「飲食業」やタグ「農業」の重みをトークン情報記憶部122(図4参照)から取得する。例えば、集計装置100は、重みWT13−1に示すように、「トマト」に付されたタグ「飲食業」の重み「0.3」を取得する。また、例えば、集計装置100は、重みWT13−2に示すように、「トマト」に付されたタグ「農業」の重み「0.2」を取得する。例えば、図1の例では、集計装置100は、トークンTK13に付されたタグ「飲食業」やタグ「農業」の重みを、検索連動広告のキーワードとして文字列「トマト」を指定した広告主の業種の割合に基づいて算出してもよい。この場合、検索連動広告のキーワードとして文字列「トマト」を指定した広告主における業種「飲食業」と業種「農業」との割合が「3:2」であることを示す。
【0022】
なお、業種に関するタグの重みは、検索連動広告のキーワードに関する情報に限らず、種々の情報を適宜用いて決定されてもよい。例えば、集計装置100は、検索クエリQ11の「トマト」に付されたタグ「飲食業」の重みとタグ「農業」の重みとをトマトの飲食業における市場規模(売上)とトマトの農業における市場規模(売上)の多寡に応じて変動させてもよい。例えば、集計装置100は、トマトの飲食業における市場規模(売上)とトマトの農業における市場規模(売上)との比率が「4:1」である場合、検索クエリQ11の「トマト」に付されたタグ「飲食業」の重みを「0.4」とし、タグ「農業」の重みを「0.1」としてもよい。
【0023】
その後、集計装置100は、カテゴリ「地名」に関するタグが付されたトークンTK11、12に基づいて、カテゴリ「地名」における各タグの比率を算出する(ステップS12−1)。図1の例では、集計装置100は、比率情報RT11−1に示すように、トークンTK11、12に関する情報に基づいて、カテゴリ「地名」のタグ「神奈川」とタグ「宮城」との比率を算出する。図1の例では、集計装置100は、カテゴリ「地名」のタグ「神奈川」とタグ「宮城」との比率を、各トークンTK11、TK12の各タグTG11−1、TG12−1、TG12−2の重みを加算した値の比「1+0.5:0.5」として算出してもよい。この場合、集計装置100は、カテゴリ「地名」のタグ「神奈川」とタグ「宮城」との比率を、「1.5:0.5」として算出し、検索クエリQ11のカテゴリ「地名」における割合(以下、「指標値」もという)は、「神奈川」が「3/4」、「宮城」が「1/4」であると算出する。
【0024】
なお、比率の算出は上記に限らず、目的に応じて種々の方法により算出されてもよい。例えば、集計装置100は、カテゴリ「地名」のタグ「神奈川」とタグ「宮城」との比率を、各トークンTK11、TK12の重みを乗算した値の比「1×0.5:0×0.5」として算出してもよい。この場合、集計装置100は、カテゴリ「地名」のタグ「神奈川」とタグ「宮城」との比率を、「1:0」として算出し、検索クエリQ11をカテゴリ「地名」のタグ「神奈川」のみを対象とするクエリとしてもよい。
【0025】
また、集計装置100は、カテゴリ「業種」に関するタグが付されたトークンTK13に基づいて、カテゴリ「業種」における各タグの比率を算出する(ステップS12−2)。図1の例では、集計装置100は、比率情報RT12−1に示すように、トークンTK13に関する情報に基づいて、カテゴリ「業種」のタグ「飲食業」とタグ「農業」との比率を算出する。図1の例では、集計装置100はカテゴリ「業種」のタグ「飲食業」とタグ「農業」との比率を、各トークンTK13の各タグTG13−1、TG13−2の重みの比「0.3:0.2」として算出してもよい。この場合、集計装置100は、カテゴリ「業種」のタグ「飲食業」とタグ「農業」との比率は、「3:2」であり、検索クエリQ11のカテゴリ「業種」における指標値は、「飲食業」が「3/5」、「農業」が「2/5」であると算出する。
【0026】
その後、集計装置100は、比率情報RT11−1、RT12−1に基づいて、トークンTK11〜TK13に付されたタグTG11−1〜TG13−2の組み合わせ毎のスコア(検索回数)を算出し、各タグTG11−1〜TG13−2の組み合わせのスコアを集計する(ステップS13)。
【0027】
図1の例では、集計装置100は、集計リストLT11に示すような4つの組み合わせごとにスコアを算出し、集計する。ここで、集計リストLT11に示す「組み合わせID」は、検索回数の集計の対象となるタグの組み合わせを識別するための識別情報を示す。また、「カテゴリ1(地名)」は、対応する組み合わせIDにより識別される組み合わせに含まれ、カテゴリが「地名」であるタグを示す。また、「カテゴリ2(業種)」は、対応する組み合わせIDにより識別される組み合わせに含まれ、カテゴリが「業種」であるタグを示す。例えば、組み合わせID「CN11」により識別される組み合わせ(以下、「組み合わせCN11」と記載する場合がある)は、カテゴリが「地名」のタグ「神奈川」とカテゴリが「業種」のタグ「飲食業」との組み合わせであることを示す。
【0028】
また、例えば、組み合わせID「CN12」により識別される組み合わせ(以下、「組み合わせCN12」と記載する場合がある)は、カテゴリが「地名」のタグ「神奈川」とカテゴリが「業種」のタグ「農業」との組み合わせであることを示す。また、例えば、組み合わせID「CN13」により識別される組み合わせ(以下、「組み合わせCN13」と記載する場合がある)は、カテゴリが「地名」のタグ「宮城」とカテゴリが「業種」のタグ「飲食業」との組み合わせであることを示す。また、例えば、組み合わせID「CN14」により識別される組み合わせ(以下、「組み合わせCN14」と記載する場合がある)は、カテゴリが「地名」のタグ「宮城」とカテゴリが「業種」のタグ「農業」との組み合わせであることを示す。
【0029】
すなわち、図1の例では、集計装置100は、組み合わせCN11〜CN14の各々についてスコアを算出する。例えば、集計装置100は、計算情報FM11に示すように、組み合わせCN11〜CN14の各々についてスコアを算出する。例えば、集計装置100は、組み合わせCN11のスコアをカテゴリ「地名」における「神奈川」の指標値とカテゴリ「業種」における「飲食業」の指標値とを乗算することにより算出する。具体的には、集計装置100は、計算情報FM11中の式「CN11(スコア)=(1.5/2)×(0.3/0.5)」により、組み合わせCN11のスコアを「0.45」と算出する。
【0030】
また、例えば、集計装置100は、組み合わせCN12のスコアをカテゴリ「地名」における「神奈川」の指標値とカテゴリ「業種」における「農業」の指標値とを乗算することにより算出する。具体的には、集計装置100は、計算情報FM11中の式「CN12(スコア)=(1.5/2)×(0.2/0.5)」により、組み合わせCN12のスコアを「0.3」と算出する。
【0031】
また、例えば、集計装置100は、組み合わせCN13のスコアをカテゴリ「地名」における「宮城」の指標値とカテゴリ「業種」における「飲食業」の指標値とを乗算することにより算出する。具体的には、集計装置100は、計算情報FM11中の式「CN13(スコア)=(0.5/2)×(0.3/0.5)」により、組み合わせCN13のスコアを「0.15」と算出する。
【0032】
また、例えば、集計装置100は、組み合わせCN14のスコアをカテゴリ「地名」における「宮城」の指標値とカテゴリ「業種」における「農業」の指標値とを乗算することにより算出する。具体的には、集計装置100は、計算情報FM11中の式「CN14(スコア)=(0.5/2)×(0.2/0.5)」により、組み合わせCN12のスコアを「0.1」と算出する。
【0033】
なお、上述した、各組み合わせCN11〜CN14のスコアを合計すると「0.45+0.3+0.15+0.1=1」となる。そのため、集計装置100は、各組み合わせCN11〜CN14のスコアは、検索クエリQ11の1回の検索を各トークンに付されたタグの組み合わせ毎に分配する場合の回数として用いることができる。
【0034】
図1の例では、集計装置100は、集計リストLT11に示すように、検索クエリQ11の1回の検索について、組み合わせCN11〜CN14のスコアを検索回数として集計する。例えば、集計装置100は、集計リストLT11に示すように、検索クエリQ11の1回の検索について、組み合わせCN11の検索回数を「0.45」回と集計する。また、例えば、集計装置100は、検索クエリQ11の1回の検索について、組み合わせCN12の検索回数を「0.3」回と集計する。また、例えば、集計装置100は、検索クエリQ11の1回の検索について、組み合わせCN13の検索回数を「0.15」回と集計する。また、例えば、集計装置100は、検索クエリQ11の1回の検索について、組み合わせCN14の検索回数を「0.1」回と集計する。その後、集計装置100は、集計リストLT11に示すような集計情報を検索装置50へ送信する(ステップS14)。
【0035】
上記のように、各トークンに付されたタグの組み合わせ毎にスコアを算出することにより、集計装置100は、地名に関するラベルや地名以外の他のカテゴリに関するラベルを含む複数のラベル(タグ)が付されたトークンが含まれる場合であっても、適切に検索回数を集計することができる。このように、集計装置100は、タグの組み合わせごとにスコアを算出し、集計することにより、地域毎や業種毎の検索量を適切に把握することができる。また、集計装置100は、集計した情報に基づいて、地域毎や業種毎のビジネス需要を把握することができる。このような、地域毎や業種毎のビジネス需要に関する情報は、広告営業などに利用されてもよい。また、集計装置100は、集計した各組み合わせの検索回数に種々のサービスを提供してもよい。
【0036】
例えば、集計装置100は、各地名(例えば、都道府県)について、どのような業種と組み合わせて検索が行われているかを示す情報を、その地方におけるサービス提供者に提供してもよい。例えば、集計装置100は、図5に示す集計情報記憶部123に記憶された組み合わせごとのスコア(検索回数)に基づいて、どのような業種と組み合わせて検索が行われているかを示す情報を、神奈川県や宮城県でサービスを提供する事業者に提供してもよい。例えば、集計装置100は、図5に示す集計情報記憶部123に記憶された組み合わせCN11のスコアと組み合わせCN12のスコアとの比較に基づいて、神奈川県については飲食業に関する検索が多いことを示す情報を、神奈川県でサービスを提供する事業者に提供してもよい。また、例えば、集計装置100は、図5に示す集計情報記憶部123に記憶された組み合わせCN13のスコアと組み合わせCN14のスコアとの比較に基づいて、宮城県については農業に関する検索が多いことを示す情報を、宮城県でサービスを提供する事業者に提供してもよい。
【0037】
また、上記に示す例においては、タグのカテゴリが「地名」と「業種」の2つである場合を示したが、タグのカテゴリは目的に応じて種々のカテゴリが適用されてもよい。例えば、タグのカテゴリは、ユーザの属性に関するカテゴリであってもよい。例えば、タグのカテゴリが「性別」や「年代」等であってもよい。この場合、例えば、各タグの重みは割合に基づいて算出されてもよい。例えば、トークン「車」にカテゴリ「性別」のタグ「男」とタグ「女」とが付されている場合、トークン「車」を検索に用いる割合に応じて、トークン「車」に付されたタグ「男」の重みとタグ「女」の重みとが算出されてもよい。例えば、トークン「車」を検索に用いる割合は、男性が「90%」であり、女性が「10%」である場合、トークン「車」に付されたタグ「男」の重みは「0.9」と算出され、タグ「女」の重みは「0.1」と算出されてもよい。例えば、トークン「車」にカテゴリ「性別」のタグ「男」とタグ「女」とが付されている場合、トークンである「車」に興味・関心を有するユーザにおける男女比に応じて、トークン「車」に付されたタグ「男」の重みとタグ「女」の重みとが算出されてもよい。このように、ユーザの属性に関するタグの組み合わせのスコアを集計することにより、集計装置100は、詳細なユーザ属性に対応するユーザごとにスコアを集計することができる。なお、上記は一例であり、集計装置100が集計するタグの組み合わせごとのスコアは、そのスコアが利用可能であれば、どのようなサービスに用いられてもよい。
【0038】
〔2.集計装置の構成〕
次に、図2を用いて、実施形態に係る集計装置100の構成について説明する。図2は、実施形態に係る集計装置の構成例を示す図である。図2に示すように、集計装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、集計装置100は、各種の情報を表示する表示部や、各種の情報を入力する入力部を有してもよい。
【0039】
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、所定のネットワークと有線または無線で接続され、外部の情報処理装置との間で情報の送受信を行う。
【0040】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図2に示すように、検索履歴情報記憶部121と、トークン情報記憶部122と、集計情報記憶部123とを有する。
【0041】
(検索履歴情報記憶部121)
実施形態に係る検索履歴情報記憶部121は、検索に関する各種情報を記憶する。例えば、図3では、検索履歴情報記憶部121は、所定の検索システムにおいて使用されたクエリに関する情報を記憶する。図3は、実施形態に係る検索履歴情報記憶部の一例を示す図である。図3に示す検索履歴情報記憶部121は、「検索クエリID」、「検索クエリ」、「入力ユーザ」、「日時」といった項目を有する。「検索クエリ」には、「トークン1」、「トークン2」、「トークン3」といった項目が含まれる。
【0042】
「検索クエリID」は、クエリを識別するための識別情報を示す。「検索クエリ」の「トークン1」や「トークン2」や「トークン3」は、対応するクエリに含まれるトークンを示す。「入力ユーザ」は、対応するクエリを入力(使用)したユーザを示す。また、「日時」は、対応するクエリが入力(使用)された日時を示す。
【0043】
図3の例では、検索クエリID「Q11」により識別されるクエリは、「横浜」や「青葉区」や「トマト」といったトークンを含むことを示す。また、検索クエリID「Q11」により識別されるクエリを用いたユーザがユーザ「U1」であることを示す。また、検索クエリID「Q11」により識別されるクエリを用いた検索が「日時DA」に行われたことを示す。なお、図3の例では、日時DAのように日時を抽象的な記号で表記するが、例えば「2016年7月27日21時28分54秒」のような具体的な日時であってもよい。
【0044】
また、図3の例では、検索クエリID「Q12」により識別されるクエリは、「中央区」や「本町」や「きゅうり」といったトークンを含むことを示す。また、検索クエリID「Q12」により識別されるクエリを用いたユーザがユーザ「U2」であることを示す。また、検索クエリID「Q12」により識別されるクエリを用いた検索が「日時DB」に行われたことを示す。
【0045】
なお、検索履歴情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。「トークン1」や「トークン2」や「トークン3」には、後述するトークンIDが記憶されてもよい。
【0046】
(トークン情報記憶部122)
実施形態に係るトークン情報記憶部122は、特徴クラスタに関する各種情報を記憶する。例えば、図4では、トークン情報記憶部122は、特徴クラスタに関する情報を記憶する。図4は、実施形態に係るトークン情報記憶部の一例を示す図である。図4に示すトークン情報記憶部122は、「トークンID」、「トークン」、「タグ1」、「タグ2」といった項目を有する。「タグ1」や「タグ2」には、「タグ」、「カテゴリ」、「重み」等の項目が含まれる。
【0047】
「トークンID」は、トークンを識別するための識別情報を示す。「トークン」は、対応するトークンIDにより識別されるトークンを示す。「タグ1」の「タグ」は、対応するトークンに付されたタグを示す。また、「タグ1」の「カテゴリ」は、対応するトークンに付されたタグのカテゴリを示す。また、「タグ1」の「重み」は、対応するトークンに付されたタグの重みを示す。また、「タグ2」の「タグ」は、対応するトークンに付されたタグを示す。また、「タグ2」の「カテゴリ」は、対応するトークンに付されたタグのカテゴリを示す。また、「タグ2」の「重み」は、対応するトークンに付されたタグの重みを示す。
【0048】
図4の例では、トークンID「TK11」により識別されるトークン「横浜」には、1つのタグ「神奈川」が付されていることを示す。また、トークン「横浜」に付されたタグ「神奈川」のカテゴリは「地名」であり、その重みは「1」であることを示す。
【0049】
また、図4の例では、トークンID「TK12」により識別されるトークン「青葉区」には、タグ「神奈川」とタグ「宮城」との2つのタグが付されていることを示す。また、トークン「青葉区」に付されたタグ「神奈川」のカテゴリは「地名」であり、その重みは「0.5」であることを示す。また、トークン「青葉区」に付されたタグ「宮城」のカテゴリは「地名」であり、その重みは「0.5」であることを示す。
【0050】
なお、トークン情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、トークン情報記憶部122は、トークンが取得された日時に関する情報を記憶してもよい。
【0051】
(集計情報記憶部123)
実施形態に係る集計情報記憶部123は、検索回数の集計に関する各種情報を記憶する。図5は、実施形態に係る集計情報記憶部の一例を示す図である。図5に示す集計情報記憶部123は、「組み合わせID」、「カテゴリ1(地名)」、「カテゴリ2(業種)」、「スコア(検索回数)」といった項目を有する。
【0052】
「組み合わせID」は、検索回数の集計の対象となるタグの組み合わせを識別するための識別情報を示す。また、「カテゴリ1(地名)」は、対応する組み合わせIDにより識別される組み合わせに含まれ、カテゴリが「地名」であるタグを示す。また、「カテゴリ2(業種)」は、対応する組み合わせIDにより識別される組み合わせに含まれ、カテゴリが「業種」であるタグを示す。「スコア(検索回数)」は、対応する組み合わせIDにより識別される組み合わせについて集計されたスコア(検索回数)を示す。
【0053】
例えば、図5に示す例において、組み合わせID「CN11」により識別される組み合わせは、カテゴリが「地名」のタグ「神奈川」とカテゴリが「業種」のタグ「飲食業」との組み合わせであることを示す。また、例えば、図5に示す例において、組み合わせID「CN11」により識別される組み合わせのスコア(検索回数)は、「1000」であることを示す。
【0054】
なお、集計情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
【0055】
(制御部130)
図2の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、集計装置100内部の記憶装置に記憶されている各種プログラム(集計プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0056】
図2に示すように、制御部130は、取得部131と、算出部132と、集計部133と、送信部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
【0057】
(取得部131)
例えば、取得部131は、各種情報を取得する。例えば、取得部131は、検索履歴情報記憶部121やトークン情報記憶部122や集計情報記憶部123から種々の情報を取得する。例えば、取得部131は、外部の情報処理装置から種々の情報を取得する。例えば、取得部131は、外部の情報処理装置から検索回数の集計の対象となる検索クエリに関する情報を取得する。例えば、取得部131は、検索クエリに含まれる各トークンであって、地名に関するラベルまたは地名以外の他のカテゴリに関するラベルが付された各トークンに関する情報を取得する。
【0058】
また、取得部131は、検索クエリに含まれる各トークンであって、異なるカテゴリのラベルが付された各トークンに関する情報を取得する。例えば、取得部131は、地名に関するラベルが付された一のトークンに関する情報と、地名以外の他のカテゴリに関するラベルが付されたトークンに関する情報とを取得する。例えば、取得部131は、他のカテゴリとして業種に関するラベルが付されたトークンに関する情報を取得する。
【0059】
図1の例では、取得部131は、検索クエリQ11をトークンに分割することにより、検索クエリQ11に含まれるトークンを取得する。例えば、取得部131は、検索クエリQ11からスペース(「 」)で区切られた各文字列をトークンとして取得する。例えば、取得部131は、検索クエリQ11から文字列「横浜」であるトークンTK11を取得する。また、例えば、取得部131は、検索クエリQ11から文字列「青葉区」であるトークンTK12を取得する。また、例えば、取得部131は、検索クエリQ11から文字列「トマト」であるトークンTK13を取得する。
【0060】
例えば、取得部131は、地名に関連する関連ユーザが入力した検索クエリに含まれる一のトークンであって、地名に関するラベルが付された一のトークンに関する情報を取得する。また、例えば、取得部131は、関連ユーザ以外の他のユーザが入力した検索クエリに含まれる一のトークンであって、地名に関するラベルが付された一のトークンに関する情報を取得する。また、例えば、取得部131は、地名に対応する地域に居住する関連ユーザが入力した検索クエリに含まれる一のトークンに関する情報を取得し、他のユーザが入力した検索クエリに含まれる一のトークンに関する情報を取得する。
【0061】
(算出部132)
算出部132は、種々の情報を算出する。算出部132は、カテゴリごとにタグの比率を算出する。図1の例では、算出部132は、カテゴリ「地名」に関するタグが付されたトークンTK11、12に基づいて、カテゴリ「地名」における各タグの比率を算出する(ステップS12−1)。例えば、算出部132は、比率情報RT11−1に示すように、トークンTK11、12に関する情報に基づいて、カテゴリ「地名」のタグ「神奈川」とタグ「宮城」との比率を算出する。例えば、算出部132は、カテゴリ「地名」のタグ「神奈川」とタグ「宮城」との比率を、各トークンTK11、TK12の各タグTG11−1、TG12−1、TG12−2の重みを加算した値の比「1+0.5:0+0.5」として算出してもよい。この場合、算出部132は、カテゴリ「地名」のタグ「神奈川」とタグ「宮城」との比率を、「1.5:0.5」として算出し、検索クエリQ11のカテゴリ「地名」における指標値は、「神奈川」が「3/4」、「宮城」が「1/4」であると算出する。
【0062】
また、例えば、算出部132は、カテゴリ「業種」に関するタグが付されたトークンTK13に基づいて、カテゴリ「業種」における各タグの比率を算出する。図1の例では、算出部132は、比率情報RT12−1に示すように、トークンTK13に関する情報に基づいて、カテゴリ「業種」のタグ「飲食業」とタグ「農業」との比率を算出する。例えば、算出部132はカテゴリ「業種」のタグ「飲食業」とタグ「農業」との比率を、各トークンTK13の各タグTG13−1、TG13−2の重みの比「0.3:0.2」として算出してもよい。この場合、算出部132は、カテゴリ「業種」のタグ「飲食業」とタグ「農業」との比率は、「3:2」であり、検索クエリQ11のカテゴリ「業種」における指標値は、「飲食業」が「3/5」、「農業」が「2/5」であると算出する。
【0063】
例えば、算出部132は、比率情報RT11−1、RT12−1に基づいて、トークンTK11〜TK13に付されたタグTG11−1〜TG13−2の組み合わせ毎のスコア(検索回数)を算出する。図1の例では、算出部132は、集計リストLT11に示すような4つの組み合わせごとにスコアを算出する。
【0064】
図1の例では、算出部132は、組み合わせCN11〜CN14の各々についてスコアを算出する。例えば、算出部132は、計算情報FM11に示すように、組み合わせCN11〜CN14の各々についてスコアを算出する。例えば、算出部132は、組み合わせCN11のスコアをカテゴリ「地名」における「神奈川」の指標値とカテゴリ「業種」における「飲食業」の指標値とを乗算することにより算出する。具体的には、算出部132は、計算情報FM11中の式「CN11(スコア)=(1.5/2)×(0.3/0.5)」により、組み合わせCN11のスコアを「0.45」と算出する。
【0065】
また、例えば、算出部132は、組み合わせCN12のスコアをカテゴリ「地名」における「神奈川」の指標値とカテゴリ「業種」における「農業」の指標値とを乗算することにより算出する。具体的には、算出部132は、計算情報FM11中の式「CN12(スコア)=(1.5/2)×(0.2/0.5)」により、組み合わせCN12のスコアを「0.3」と算出する。
【0066】
また、例えば、算出部132は、組み合わせCN13のスコアをカテゴリ「地名」における「宮城」の指標値とカテゴリ「業種」における「飲食業」の指標値とを乗算することにより算出する。具体的には、算出部132は、計算情報FM11中の式「CN13(スコア)=(0.5/2)×(0.3/0.5)」により、組み合わせCN13のスコアを「0.15」と算出する。
【0067】
また、例えば、算出部132は、組み合わせCN14のスコアをカテゴリ「地名」における「宮城」の指標値とカテゴリ「業種」における「農業」の指標値とを乗算することにより算出する。具体的には、算出部132は、計算情報FM11中の式「CN14(スコア)=(0.5/2)×(0.2/0.5)」により、組み合わせCN12のスコアを「0.1」と算出する。
【0068】
(集計部133)
集計部133は、種々の情報を集計する。例えば、集計部133は、各トークンに付されたラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計する。例えば、集計部133は、各トークンに付されたラベルの重みに基づいて、ラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計する。例えば、集計部133は、関連ユーザと他のユーザとの各々を対象として、ラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計する。
【0069】
図1の例では、集計部133は、算出部132により算出されたスコアに基づいて、各タグTG11−1〜TG13−2の組み合わせのスコアを集計する。図1の例では、集計部133は、集計リストLT11に示すように、検索クエリQ11の1回の検索について、組み合わせCN11〜CN14のスコアを検索回数として集計する。例えば、集計部133は、集計リストLT11に示すように、検索クエリQ11の1回の検索について、組み合わせCN11の検索回数を「0.45」回と集計する。また、例えば、集計部133は、検索クエリQ11の1回の検索について、組み合わせCN12の検索回数を「0.3」回と集計する。また、例えば、集計部133は、検索クエリQ11の1回の検索について、組み合わせCN13の検索回数を「0.15」回と集計する。また、例えば、集計部133は、検索クエリQ11の1回の検索について、組み合わせCN14の検索回数を「0.1」回と集計する。
【0070】
(送信部134)
送信部134は、外部の情報処理装置に各種情報を送信する。例えば、送信部134は、集計部133により集計された検索回数を外部の情報処理装置へ送信する。
【0071】
〔3.集計処理のフロー〕
次に、図6を用いて、実施形態に係る集計装置100による集計処理の手順について説明する。図6は、実施形態に係る集計処理手順を示すフローチャートである。
【0072】
図6に示すように、集計装置100は、検索クエリを取得する(ステップS101)。例えば、集計装置100は、「横浜 青葉区 トマト」という文字列である検索クエリQ11(図1参照)を取得する。
【0073】
そして、集計装置100は、検索クエリをトークンに分割する(ステップS102)。図1の例では、集計装置100は、検索クエリQ11をトークンに分割することにより、検索クエリQ11に含まれるトークンを取得する。
【0074】
また、集計装置100は、カテゴリごとにタグの比率を算出する(ステップS103)。図1の例では、集計装置100は、カテゴリ「地名」に関するタグが付されたトークンTK11、12に基づいて、カテゴリ「地名」における各タグの比率を算出する。また、図1の例では、集計装置100は、カテゴリ「業種」に関するタグが付されたトークンTK13に基づいて、カテゴリ「業種」における各タグの比率を算出する。
【0075】
その後、集計装置100は、タグの比率に基づいて検索回数を集計する(ステップS104)。図1の例では、集計装置100は、集計リストLT11に示すように、検索クエリQ11の1回の検索について、組み合わせCN11〜CN14のスコアを検索回数として集計する。例えば、集計装置100は、集計リストLT11に示すように、検索クエリQ11の1回の検索について、組み合わせCN11の検索回数を「0.45」回と集計する。また、例えば、集計装置100は、検索クエリQ11の1回の検索について、組み合わせCN12の検索回数を「0.3」回と集計する。また、例えば、集計装置100は、検索クエリQ11の1回の検索について、組み合わせCN13の検索回数を「0.15」回と集計する。また、例えば、集計装置100は、検索クエリQ11の1回の検索について、組み合わせCN14の検索回数を「0.1」回と集計する。
【0076】
〔4.変形例〕
上述した例では、検索クエリを入力したユーザに依らずに、検索クエリの検索回数をタグの組み合わせ毎に集計する場合を示したが、集計装置100Aは、ユーザの分類に応じて、検索回数をタグの組み合わせ毎に集計してもよい。この点について、図7図9を用いて説明する。
【0077】
〔5.集計装置の構成〕
次に、図7を用いて、変形例に係る集計装置100Aの構成について説明する。図7は、変形例に係る集計装置の構成例を示す図である。図7に示すように、集計装置100Aは、通信部110と、記憶部120Aと、制御部130Aとを有する。なお、集計装置100Aにおいて、実施形態に係る集計装置100と同様の点については、同一の符号を付して、適宜説明を省略する。
【0078】
(記憶部120A)
記憶部120Aは、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。変形例に係る記憶部120Aは、図7に示すように、検索履歴情報記憶部121と、トークン情報記憶部122と、集計情報記憶部123Aと、ユーザ情報記憶部124とを有する。
【0079】
(集計情報記憶部123A)
変形例に係る集計情報記憶部123Aは、検索回数の集計に関する各種情報を記憶する。図8は、変形例に係る集計情報記憶部の一例を示す図である。図8に示す集計情報記憶部123Aは、「組み合わせID」、「ユーザ区分」、「カテゴリ1(地名)」、「カテゴリ2(業種)」、「スコア(検索回数)」といった項目を有する。このように、図8に示す集計情報記憶部123Aは、項目「ユーザ区分」が実施形態に係る集計情報記憶部123と相違する。
【0080】
「ユーザ区分」は、組み合わせIDにより識別される組み合わせを対象として検索回数が集計されたユーザの区分を示す。
【0081】
例えば、図8に示す例において、組み合わせID「CN111」により識別される組み合わせは、ユーザ区分「地元」に分類されるユーザが入力した検索クエリを対象とした検索回数の集計を示す。また、組み合わせID「CN111」により識別される組み合わせは、カテゴリが「地名」のタグ「神奈川」とカテゴリが「業種」のタグ「飲食業」との組み合わせであることを示す。また、例えば、図8に示す例において、組み合わせID「CN111」により識別される組み合わせのスコア(検索回数)は、「800」であることを示す。
【0082】
例えば、図8に示す例において、組み合わせID「CN112」により識別される組み合わせは、ユーザ区分「遠方」に分類されるユーザが入力した検索クエリを対象とした検索回数の集計を示す。また、組み合わせID「CN112」により識別される組み合わせは、カテゴリが「地名」のタグ「神奈川」とカテゴリが「業種」のタグ「飲食業」との組み合わせであることを示す。また、例えば、図8に示す例において、組み合わせID「CN112」により識別される組み合わせのスコア(検索回数)は、「200」であることを示す。
【0083】
なお、集計情報記憶部123Aは、上記に限らず、目的に応じて種々の情報を記憶してもよい。
【0084】
(ユーザ情報記憶部124)
変形例に係るユーザ情報記憶部124は、ユーザ属性に関する各種情報を記憶する。例えば、ユーザ情報記憶部124は、ユーザ属性情報を記憶する。図9は、変形例に係るユーザ情報記憶部の一例を示す図である。図9に示すユーザ情報記憶部124は、「ユーザID」、「年齢」、「性別」、「居住地」、「興味」といった項目が含まれる。
【0085】
「ユーザID」は、ユーザを識別するための識別情報を示す。また、「年齢」は、ユーザIDにより識別されるユーザの年齢を示す。なお、「年齢」は、例えば35歳など、ユーザIDにより識別されるユーザの具体的な年齢であってもよい。また、「性別」は、ユーザIDにより識別されるユーザの性別を示す。また、「居住地」は、ユーザIDにより識別されるユーザの居住する地域を示す。なお、「居住地」は、ユーザIDにより識別されるユーザの具体的な住所であってもよい。また、「興味」は、ユーザIDにより識別されるユーザが関心のある対象を示す。なお、「興味」は、複数登録されてもよい。
【0086】
例えば、図9に示す例において、ユーザID「U1」により識別されるユーザの年齢は、「30代」であり、性別は、「男性」であることを示す。また、例えば、図9に示す例において、ユーザID「U1」により識別されるユーザは、居住地が「神奈川」であり、関心のある対象が「スポーツ」であることを示す。
【0087】
なお、ユーザ情報記憶部124は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、ユーザ情報記憶部124は、ユーザのデモグラフィック属性に関する情報やサイコグラフィック属性に関する情報を記憶してもよい。例えば、ユーザ情報記憶部124は、氏名、家族構成、収入、ライフスタイル等の情報を記憶してもよい。
【0088】
(制御部130A)
図7の説明に戻って、制御部130Aは、コントローラ(controller)であり、例えば、CPUやMPU等によって、集計装置100A内部の記憶装置に記憶されている各種プログラム(抽出プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130Aは、コントローラであり、例えば、ASICやFPGA等の集積回路により実現される。
【0089】
図7に示すように、制御部130Aは、取得部131と、算出部132と、集計部133Aと、送信部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
【0090】
例えば、変形例に係る取得部131は、各種情報を取得する。例えば、取得部131は、検索クエリやその検索クエリを入力したユーザに関する情報を取得する。例えば、取得部131は、ユーザが利用する端末装置から検索クエリや、ユーザの属性情報を取得する。例えば、取得部131は、ユーザの居住地に関する情報を取得する。例えば、取得部131は、地名に関連する関連ユーザが入力した検索クエリに含まれる一のトークンであって、地名に関するラベルが付された一のトークンに関する情報を取得する。また、例えば、取得部131は、関連ユーザ以外の他のユーザが入力した検索クエリに含まれる他のトークンであって、地名に関するラベルが付された他のトークンに関する情報を取得する。また、例えば、取得部131は、地名に対応する地域に居住する関連ユーザが入力した検索クエリに含まれる一のトークンに関する情報を取得し、他のユーザが入力した検索クエリに含まれる他のトークンに関する情報を取得する。
【0091】
(集計部133A)
集計部133Aは、種々の情報を集計する。例えば、集計部133Aは、集計部133と同様に種々の情報を集計する。例えば、集計部133Aは、関連ユーザと他のユーザとの各々を対象として、ラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計する。例えば、集計部133Aは、カテゴリ「地名」に関するタグに対応する居住地が属性に含まれるユーザを関連ユーザとして、それ以外のユーザを他のユーザとして、ラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計する。
【0092】
例えば、検索クエリQ11を入力したユーザが居住地「神奈川」の属性を含むユーザU1である場合、集計部133Aは、関連ユーザ、すなわち図8に示すユーザ区分「地元」に分類されるユーザが入力した検索クエリとして、検索回数を集計する。また、例えば、検索クエリQ11を入力したユーザが居住地「愛知」の属性を含むユーザU2である場合、集計部133Aは、関連ユーザ、すなわち図8に示すユーザ区分「遠方」に分類されるユーザが入力した検索クエリとして、検索回数を集計する。このように、集計部133が検索を行ったユーザの住所(居住地)に応じて、ユーザを分類して集計を行うことにより、集計装置100Aは、ビジネス需要を地域内からの需要と、地域外からの需要とに分けて把握することが可能となる。
【0093】
〔6.効果〕
上述してきたように、実施形態に係る集計装置100及び変形例に係る集計装置100Aは、取得部131と、集計部133、133Aとを有する。取得部131は、検索クエリに含まれる各トークンであって、地名に関するラベルまたは前記地名以外の他のカテゴリに関するラベルが付された各トークンに関する情報を取得する。集計部133、133Aは、各トークンに付されたラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計する。
【0094】
これにより、実施形態に係る集計装置100及び変形例に係る集計装置100Aは、地名に関するラベルや地名以外の他のカテゴリに関するラベル等の複数のラベルが付されたトークンが含まれる場合であっても、適切に検索回数を集計することができる。
【0095】
また、実施形態に係る集計装置100及び変形例に係る集計装置100Aにおいて、集計部133、133Aは、各トークンに付されたラベルの重みに基づいて、ラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計する。
【0096】
これにより、実施形態に係る集計装置100及び変形例に係る集計装置100Aは、各トークンに付されたラベルの重みに基づいて、ラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計することにより、複数のラベルが付されたトークンが含まれる場合であっても、適切に検索回数を集計することができる。
【0097】
また、実施形態に係る集計装置100及び変形例に係る集計装置100Aにおいて、取得部131は、他のカテゴリとして業種に関するラベルが付されたトークンに関する情報を取得する。
【0098】
これにより、実施形態に係る集計装置100及び変形例に係る集計装置100Aは、他のカテゴリとして業種に関するラベルが付されたトークンに関する情報を取得することにより、業種を含む複数のラベルが付されたトークンが含まれる場合であっても、適切に検索回数を集計することができる。
【0099】
また、変形例に係る集計装置100Aにおいて、取得部131は、地名に関連する関連ユーザが入力した検索クエリに含まれる一のトークンであって、地名に関するラベルが付された一のトークンに関する情報を取得し、関連ユーザ以外の他のユーザが入力した検索クエリに含まれる他のトークンであって、地名に関するラベルが付された他のトークンに関する情報を取得する。集計部133Aは、関連ユーザと他のユーザとの各々を対象として、ラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計する。
【0100】
これにより、変形例に係る集計装置100Aは、関連ユーザと他のユーザとの各々を対象として、ラベルの組み合わせ毎に検索クエリによる検索回数に関する情報を集計することにより、複数のラベルが付されたトークンが含まれる場合であっても、ユーザの分類に応じて、適切に検索回数を集計することができる。
【0101】
また、変形例に係る集計装置100Aにおいて、取得部131は、地名に対応する地域に居住する関連ユーザが入力した検索クエリに含まれる一のトークンに関する情報を取得し、他のユーザが入力した検索クエリに含まれる他のトークンに関する情報を取得する。
【0102】
これにより、変形例に係る集計装置100Aは、地名に対応する地域に居住する関連ユーザが入力した検索クエリに含まれる一のトークンに関する情報を取得し、他のユーザが入力した検索クエリに含まれる他のトークンに関する情報を取得することにより、複数のラベルが付されたトークンが含まれる場合であっても、居住する地域に基づくユーザの分類に応じて、適切に検索回数を集計することができる。
【0103】
〔7.ハードウェア構成〕
上述してきた実施形態に係る集計装置100及び変形例に係る集計装置100Aは、例えば図10に示すような構成のコンピュータ1000によって実現される。図10は、集計装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0104】
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0105】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定のネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定のネットワークNを介して他の機器へ送信する。
【0106】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
【0107】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0108】
例えば、コンピュータ1000が実施形態に係る集計装置100及び変形例に係る集計装置100Aとして機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130、130Aの機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定のネットワークNを介してこれらのプログラムを取得してもよい。
【0109】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0110】
〔8.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0111】
また、上述してきた実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0112】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0113】
100 集計装置
121 検索履歴情報記憶部
122 トークン情報記憶部
123 集計情報記憶部
130 制御部
131 取得部
132 算出部
133 集計部
134 送信部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10