特開2017-224022(P2017-224022A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特開2017-224022クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム
<>
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000004
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000005
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000006
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000007
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000008
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000009
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000010
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000011
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000012
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000013
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000014
  • 特開2017224022-クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム 図000015
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2017-224022(P2017-224022A)
(43)【公開日】2017年12月21日
(54)【発明の名称】クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20171124BHJP
   G06Q 30/02 20120101ALI20171124BHJP
【FI】
   G06F17/30 330Z
   G06F17/30 310A
   G06Q30/02 398
【審査請求】未請求
【請求項の数】12
【出願形態】OL
【全頁数】16
(21)【出願番号】特願2016-117035(P2016-117035)
(22)【出願日】2016年6月13日
(71)【出願人】
【識別番号】500257300
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】100106909
【弁理士】
【氏名又は名称】棚井 澄雄
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100174986
【弁理士】
【氏名又は名称】林 康旨
(72)【発明者】
【氏名】臼渕 護
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB08
(57)【要約】
【課題】入力された検索クエリに関連の強い検索クエリを抽出する際に、より多様な検索クエリを抽出することができるクエリ抽出装置などを提供すること。
【解決手段】ネットワークを介して検索を行う検索サービスにおいて受け付けられた検索クエリのログを取得する取得部と、第1検索クエリの入力を受け付ける受付部と、前記取得部により取得された検索クエリのログに基づいて、前記検索クエリのログに含まれる検索クエリの中から、前記検索サービスにおいて、前記第1検索クエリの受付数の推移と相関がある受付数の推移を示す第2検索クエリを抽出する抽出部と、を備えるクエリ抽出装置。
【選択図】図1
【特許請求の範囲】
【請求項1】
ネットワークを介して検索を行う検索サービスにおいて受け付けられた検索クエリのログを取得する取得部と、
第1検索クエリの入力を受け付ける受付部と、
前記取得部により取得された検索クエリのログに基づいて、前記検索クエリのログに含まれる検索クエリの中から、前記検索サービスにおいて、前記第1検索クエリの受付数の推移と相関がある受付数の推移を示す第2検索クエリを抽出する抽出部と、
を備えるクエリ抽出装置。
【請求項2】
前記受付部は、検索処理の種類を指定する情報を受け付け、
前記抽出部は、前記第1検索クエリの受付数の推移と相関がある受付数の推移を示し、且つ前記検索サービスにおいて受付部により受け付けられた種類の検索処理により抽出された検索クエリを、前記第2検索クエリとして抽出する、
請求項1に記載のクエリ抽出装置。
【請求項3】
前記受付部は、検索処理の除外条件を指定する情報を受け付け、
前記抽出部は、前記第1検索クエリの受付数の推移と相関がある受付数の推移を示し、且つ前記受付部により受け付けられた前記除外条件に該当しない検索クエリを、前記第2検索クエリとして抽出する、
請求項1に記載のクエリ抽出装置。
【請求項4】
前記受付部は、前記抽出部により抽出される前記第2検索クエリを更に絞り込む絞込条件を指定する情報を受け付け、
前記抽出部は、前記第2検索クエリを、前記受付部により受け付けられた前記絞込条件で絞り込んだ結果を出力する、
請求項1に記載のクエリ抽出装置。
【請求項5】
前記受付部は、検索クエリの受付数の推移を平滑化するための期間を指定する情報を受け付け、
前記抽出部は、前記第1検索クエリの前記期間で平滑化された受付数の推移と相関がある前記期間で平滑化された受付数の推移を示す検索クエリを、前記第2検索クエリとして抽出する、
請求項1に記載のクエリ抽出装置。
【請求項6】
前記受付部は、検索クエリの受付数の推移をシフトさせるための期間を指定する情報を受け付け、
前記抽出部は、前記第1検索クエリの受付数の推移を前記期間だけシフトさせた推移と相関がある推移を示す検索クエリを、前記第2検索クエリとして抽出する、
請求項1に記載のクエリ抽出装置。
【請求項7】
前記受付部は、検索クエリの受付数が所定値以下の検索クエリを指定する情報を受け付け、
前記抽出部は、前記検索クエリのログに含まれる検索クエリのうち受付数が所定値以下であり、且つ前記第1検索クエリの受付数の推移と相関がある受付数の推移を示す検索クエリを、前記第2検索クエリとして抽出する、
請求項1に記載のクエリ抽出装置。
【請求項8】
前記受付部が前記第1検索クエリと逆相関の検索クエリを指定する情報を受け付けた場合、前記抽出部は、前記第1検索クエリの受付数の推移と相関が逆の受付数の推移を示す検索クエリを、前記第2検索クエリとして抽出する、
請求項1に記載のクエリ抽出装置。
【請求項9】
請求項1から8のうちいずれか1項に記載のクエリ抽出装置と、
端末装置から検索クエリを受け付けた場合に、受け付けた検索クエリの受付数の推移と相関がある受付数の推移を示す第2検索クエリを前記クエリ抽出装置から取得し、前記第2検索クエリを前記端末装置に送信する検索サーバと、
を備える、検索システム。
【請求項10】
請求項1から8のうちいずれか1項に記載のクエリ抽出装置と、
前記クエリ抽出装置から前記第2検索クエリを取得し、前記第2検索クエリに関連する広告情報を配信する広告配信装置と、
を備える、広告配信システム。
【請求項11】
ネットワークを介して検索を行う検索サービスにおいて受け付けられた検索クエリのログを取得し、
第1検索クエリの入力を受け付け、
取得した検索クエリのログに基づいて、前記検索クエリのログに含まれる検索クエリの中から、前記検索サービスにおいて、前記第1検索クエリの受付数の推移と相関がある受付数の推移を示す第2検索クエリを抽出する、
クエリ抽出方法。
【請求項12】
コンピュータに、
ネットワークを介して検索を行う検索サービスにおいて受け付けられた検索クエリのログを取得させ、
第1検索クエリの入力を受け付けさせ、
取得した検索クエリのログに基づいて、前記検索クエリのログに含まれる検索クエリの中から、前記検索サービスにおいて、前記第1検索クエリの受付数の推移と相関がある受付数の推移を示す第2検索クエリを抽出させる、
クエリ抽出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラムに関する。
【背景技術】
【0002】
検索クエリに基づいて検索結果を提供する検索サービスにおいて、付随するサービスとして、検索クエリに関連したクエリを抽出するサービスが提供されている。例えば、検索サービスを提供するサーバ装置は、端末装置から検索クエリを受信したときに、受信した検索クエリに関連する検索クエリを抽出して、関連クエリとして端末装置に提供する。関連クエリは、より詳細な検索クエリの候補として端末装置においてユーザに提示されたりする。これに関連し、複数の検索クエリのそれぞれに関連する検索クエリを抽出することで、検索クエリに直接表現されていないユーザの検索意図を抽出する技術が知られている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2012−113486号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した特許文献1に記載された技術では、検索クエリを受信した場合に、当該検索クエリとアンド検索されたことがある検索クエリを抽出するので、過去にアンド検索されたことがない検索クエリを抽出することはできない。この結果、多様な検索クエリを抽出できない場合があった。
【0005】
本発明は、このような事情を考慮してなされたものであり、入力された検索クエリに関連の強い検索クエリを抽出する際に、より多様な検索クエリを抽出することができるクエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0006】
本発明の一態様は、ネットワークを介して検索を行う検索サービスにおいて受け付けられた検索クエリのログを取得する取得部と、第1検索クエリの入力を受け付ける受付部と、前記取得部により取得された検索クエリのログに基づいて、前記検索クエリのログに含まれる検索クエリの中から、前記検索サービスにおいて、前記第1検索クエリの受付数の推移と相関がある受付数の推移を示す第2検索クエリを抽出する抽出部と、を備えるクエリ抽出装置である。
【発明の効果】
【0007】
本発明の一態様によれば、入力された検索クエリに関連の強い検索クエリを抽出する際に、より多様な検索クエリを抽出することができる。
【図面の簡単な説明】
【0008】
図1】第1実施形態におけるクエリ抽出システム1のシステム構成、および検索サーバ200の内部構成の一例を示す図である。
図2】検索ログデータベース300Aに格納される情報の一例を示す図である。
図3】クエリ抽出装置400の内部構成の一例を示すブロック図である。
図4】関連クエリを抽出する全体的な流れを示すシーケンス図である。
図5】管理端末500に表示される検索クエリ設定用画像500Aの一例を示す図である。
図6】検索クエリ、対象データ条件、および追加条件によって抽出された関連クエリを示す図である。
図7】第2実施形態における検索システム1Aの全体構成および情報の流れの一例を示す図である。
図8】第2実施形態の検索システム1Aにおいて関連クエリを生成する処理の流れの一例を示すフローチャートである。
図9】第2実施形態の検索システム1Aにおいて関連クエリを提供する処理の流れの一例を示すフローチャートである。
図10】第3実施形態における広告配信システム1Bの全体構成および情報の流れの一例を示す図である。
図11】実施形態の変形例を示す図である。
図12】クエリ抽出装置400のハードウェア構成を示す図である。
【発明を実施するための形態】
【0009】
以下、図面を参照し、本発明のクエリ抽出装置、検索システム、広告配信システム、クエリ抽出方法、およびクエリ抽出プログラムの実施形態について説明する。例えばネットワークを介して提供される検索サービスにおいて、検索サーバが端末装置から受け付ける検索クエリの受付数の推移は、検索クエリによって様々であるが、検索クエリの内容、季節、イベント、曜日などの要因によって特徴的な変化となる場合がある。このような観点から、実施形態のクエリ抽出装置は、受付数の推移の間に相関がある検索クエリを、互いに関連する検索クエリとして抽出するものである。これによって、入力された検索クエリに関連の強い検索クエリを抽出する際に、より多様な検索クエリを抽出することができる。実施形態のクエリ抽出装置は、例えば、検索サーバにより受け付けられた検索クエリを解析する一つの手法として、受付数の推移に相関がある一連の検索クエリを抽出するツール(プログラム)を実行することで実現することができる。
【0010】
<第1実施形態>
[システムの全体構成]
図1は、第1実施形態におけるクエリ抽出システム1のシステム構成、および検索サーバ200の内部構成の一例を示す図である。クエリ抽出システム1は、例えば、一以上の端末装置100と、検索サーバ200と、検索ログデータベース(DB(DataBase))サーバ300と、クエリ抽出装置400と、管理端末500とを備える。図1の例では、一以上の端末装置100と、検索サーバ200と、検索ログデータベースサーバ300と、クエリ抽出装置400とが、ネットワークNWに接続されている。また、図1では、クエリ抽出装置400と管理端末500とは、ネットワークNWとは異なるネットワークを介して接続されているように示しているが、これらはネットワークNWを介して接続されてもよい。
【0011】
検索サーバ200と検索ログデータベースサーバ300に含まれる構成要素の一部または全部は、統合されて一つの装置とされてもよい。また、クエリ抽出装置400と管理端末500に含まれる構成要素の一部または全部は、統合されて一つの装置とされてもよい。ネットワークNWに接続される各装置は、NIC(Network Interface Card)や無線通信モジュールなどの通信インターフェースを備えている(図1では不図示)。ネットワークNWは、例えば、無線基地局、Wi−Fiアクセスポイント、通信回線、プロバイダ、インターネットなどを含む。なお、これらの構成要素の全ての組み合わせが相互に通信可能である必要はなく、ネットワークNWは、一部にローカルなネットワークを含んでもよい。
【0012】
端末装置100は、ユーザ(一般利用者)によって使用される装置である。端末装置100は、例えば、スマートフォンなどの携帯電話、タブレット端末、パーソナルコンピュータなどのコンピュータ装置(通信装置)である。端末装置100は、ウェブブラウザなどのUA(User Agent)が起動し、ユーザによって所定の操作がなされることで、検索サーバ200に対して検索クエリを含むHTTP(Hypertext Transfer Protocol)リクエストを送信する。そして、端末装置100は、検索サーバ200から返信された検索結果を含むウェブページに基づいてウェブ画面を生成し、表示部に表示させる。なお、画像を取得するための手段として、ウェブブラウザに代えて、任意のアプリケーションプログラムが使用されてもよい。
【0013】
検索サーバ200は、検索クエリを受け付けたことに対し、検索結果を応答する検索サービスを提供する。検索サーバ200は、例えば、クエリ受付部202と、検索部204と、ログ記録部206とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのプロセッサが、記憶部(不図示)などに記憶されたプログラムを実行することにより実現される。また、これらの構成要素は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェア(回路部;circuitry)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。検索サーバ200は、クエリ受付部202により端末装置100から受信した検索クエリを受け付ける。検索サーバ200は、受け付けられた検索クエリに基づいて、検索部204によりネットワーク上で検索を行う。検索サーバ200は、検索結果を含むウェブページを端末装置100に返信する。また、検索サーバ200は、ログ記録部206により検索クエリのログを検索ログデータベースサーバ300に記憶させる。
【0014】
検索ログデータベースサーバ300は、例えば、HDD(Hard Disk Drive)やフラッシュメモリ、RAM(Random Access Memory)、ROM(Read Only Memory)、或いはこれらのうち複数を組み合わせたハイブリッド型記憶装置により実現される。図2は、検索ログデータベース300Aに格納される情報の一例を示す図である。検索ログデータベース300Aに格納される情報は、例えば、検索サーバ200により受け付けられた検索クエリを示す情報に対して、検索処理の種類、および検索サーバ200により検索クエリが受け付けられた日時を示す情報が対応付けられた情報である。検索クエリとは、キーワードなどの文字情報、URL、検索ドメインなどの検索サーバ200に処理をさせるための情報である。
【0015】
図3は、クエリ抽出装置400の内部構成の一例を示すブロック図である。クエリ抽出装置400は、例えば、ログ取得部402と、推移演算部404と、相関演算部406と、応答部408とを備える。これらの構成要素は、例えば、CPUなどのプロセッサが、記憶部などに記憶されたプログラムを実行することにより実現される。また、これらの構成要素は、LSIやASIC、FPGAなどのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0016】
ログ取得部402は、検索ログデータベースサーバ300に記憶された検索ログデータベース300Aから検索クエリのログとして、検索クエリ、検索の種類、および日時のうち少なくとも検索クエリおよび日時を示す情報を取得する。
【0017】
推移演算部404は、ログ取得部402により取得された情報に基づいて、検索クエリの受付数の推移を演算する。検索クエリの受付数の推移は、例えば、所定のサンプリング期間において検索クエリが受け付けられた回数を表す情報である。所定のサンプリング期間は、例えば1日であるが、これに限定されず、1週間、数時間または数十分であってよい。
【0018】
相関演算部406は、例えば下記式(1)に従って演算を行うことで、推移演算部404により演算された検索クエリの受付数の推移同士の相関を演算する。式(1)において、rは相関係数、xは一方の検索クエリの受付数であり、yは他方の検索クエリの受付数である。xバー(xの上側に横線が付加されたもの)は一方の検索クエリの受付数の所定のサンプリング期間における平均値であり、yバー(yの上側に横線が付加されたもの)は他方の検索クエリの受付数の所定のサンプリング期間における平均値である。
【数1】
【0019】
応答部408は、管理端末500から受信した検索クエリ(第1検索クエリ)を含むリクエストに対し、検索クエリに対する関連クエリ(第2検索クエリ)を含む情報を検索サーバ200に送信する。関連クエリとは、検索ログデータベース300Aに含まれる検索クエリのうち、リクエストに含まれる検索クエリの受付数の推移と相関がある受付数の推移を示す検索クエリである。
【0020】
管理端末500は、クエリ抽出装置400の管理者によって使用される装置である。管理端末500は、例えば、パーソナルコンピュータ、タブレット端末、スマートフォンなどの携帯電話などのコンピュータ装置(通信装置)である。管理端末500は、管理者の操作に基づいて検索クエリを含むリクエストをクエリ抽出装置400に送信し、クエリ抽出装置400から関連クエリを含む情報を受信する。
【0021】
[シーケンス]
以下、図1に示すクエリ抽出システム1において実行される全体的な通信および処理の流れについて説明する。図4は、関連クエリを抽出する全体的な流れを示すシーケンス図である。まず、端末装置100が、検索クエリを含むHTTPリクエストを検索サーバ200に送信する(S1)。検索サーバ200は、HTTPリクエストに含まれる検索クエリに対する検索結果を含むウェブページを端末装置100に送信する(S2)。また、検索サーバ200は、検索クエリおよび検索クエリの受付日時を含む情報を検索ログデータベースサーバ300に送信する(S3)。これにより、検索ログデータベースサーバ300が、検索ログデータベース300Aに対して検索クエリおよび検索クエリの受付日時を記憶する(S4)。
【0022】
次に、管理端末500が、検索クエリを含むリクエストをクエリ抽出装置400に送信する(S5)。次にクエリ抽出装置400は、リクエストに含まれる検索クエリのログ、および他の検索クエリのログを取得する(S6)。クエリ抽出装置400は、検索クエリのログに含まれる検索クエリの中から、リクエストに含まれる検索クエリの受付数の推移と相関がある受付数の推移を示す関連クエリを抽出する(S7)。次に、クエリ抽出装置400は、関連クエリを管理端末500に送信する(S8)。
【0023】
[検索クエリなどの設定および関連クエリの抽出]
以下、検索サーバ200において、関連クエリを取得するために指定可能な検索クエリなどの設定処理、および管理端末500により指定された検索クエリなどに基づいて関連クエリを抽出する処理について説明する。図5は、管理端末500に表示される検索クエリ設定用画像500Aの一例を示す図である。検索クエリ設定用画像500Aは、検索クエリの入力枠510と、対象データの条件の入力枠512と、追加条件の入力枠514と、決定ボタン516と、検索クエリの推移波形520と、関連クエリ一覧530とを含む。対象データとは、検索クエリのログのうち、リクエストに含められる検索クエリ以外の検索クエリである。
【0024】
検索クエリの入力枠510には、リクエストに含められる検索クエリが指定される。リクエストに含められる検索クエリは、例えば、文字情報、検索ドメイン、情報の位置情報、または時系列で変化する情報である。情報の位置情報は、例えば、URLなどの参照情報である。時系列で変化する情報は、例えば、数週間で1ずつ上昇するサンプルデータや、平日に上昇するサンプルデータなどである。また、検索クエリの入力枠510には、検索クエリの条件が指定される。検索クエリの条件は、例えば、検索クエリが検索された検索処理の種類である。検索処理の種類は、ウェブ検索、またはバーティカル検索(画像、動画、地図、またはニュース、知恵袋などのいずれか)である。
【0025】
対象データの条件の入力枠512には、対象データの条件が指定される。対象データの条件は、例えば、検索サービスにおいて検索クエリが検索された検索処理の種類である。検索処理の種類は、ウェブ検索、またはバーティカル検索(画像、動画、地図、またはニュースなどのいずれか)である。
【0026】
追加条件の入力枠514には、関連クエリを取得するための追加条件が指定される。関連クエリを取得するための追加条件は、関連クエリから除外する条件(以下、検索処理の除外条件と記載する。)、関連クエリを絞り込む条件(以下、絞込条件と記載する)、リクエストに含まれる検索クエリの受付数の推移を平滑化するための期間を指定する情報、またはリクエストに含まれる検索クエリの受付数の推移をシフトさせるための期間を指定する情報である。なお、追加条件は、これら以外であってもよく、例えば、サンプリング期間であってよい。例えば、数年に1度のイベントなどの受付数の変動周期が長い検索クエリについてはサンプリング期間を長く指定してよく、夜間などに受付数が大きく変動する検索クエリについてはサンプリング期間を数時間に指定してよい。
【0027】
決定ボタン516は、少なくともリクエストに含まれる検索クエリおよび対象データ条件が指定された状態で選択される。図5の例において、決定ボタン516は、例えば、リクエストに含まれる検索クエリとして「ウェブ検索、台風」、対象データ条件として「ウェブ検索」、および追加条件として「「台風」を除く」という除外条件が指定された状態で選択される。
【0028】
管理端末500は、決定ボタン516が選択されたことに応じて、検索クエリとしての「ウェブ検索、台風」、対象データ条件としての「ウェブ検索」、および追加条件としての「「台風」を除く」を含むリクエストをクエリ抽出装置400に送信する。対象データ条件としての「ウェブ検索」は、検索処理の種類を指定する情報の一例である。追加条件としての「「台風」を除く」は、除外条件の一例である。
【0029】
クエリ抽出装置400は、ウェブ検索で「台風」が指定された検索クエリの受付数の推移を表す情報を取得して、管理端末500に応答する。また、クエリ抽出装置400は、ウェブ検索で「台風」が指定された検索クエリの受付数の推移と、検索クエリのログのうちウェブ検索された検索クエリの受付数の推移との相関を演算し、相関が高い所定数の関連クエリを取得する。さらに、クエリ抽出装置400は、取得した関連クエリのうち文字情報として「台風」を含むクエリを除外して、除外条件に該当しない検索クエリを、関連クエリとして抽出し、管理端末500に応答する。これにより、管理端末500は、検索クエリの推移波形520および関連クエリ一覧530を表示する。
【0030】
[関連クエリの抽出結果]
図6は、検索クエリ、対象データ条件、および追加条件によって抽出された関連クエリを示す図である。
【0031】
クエリ抽出装置400は、検索クエリとしてウェブ検索で「ヒータ」、対象データ条件として「ウェブ検索」、および追加条件として「ニッチクエリ」が指定された場合、受付数が所定値以下の検索クエリを、検索ログデータベース300Aから抽出する。そして、クエリ抽出装置400は、抽出された検索クエリのうち、ウェブ検索で「ヒータ」の受付数の推移と相関がある推移の検索クエリを、関連クエリとして抽出する。
【0032】
クエリ抽出装置400は、検索クエリとしてウェブ検索で「賃貸」、対象データ条件として「ウェブ検索」、および追加条件として「直近7日で平滑化」が指定された場合、リクエストに含まれた検索クエリの受付数の推移および検索クエリのログに含まれる検索クエリの受付数の推移を、直近7日間において受付数の移動平均をとることで、それぞれの推移を平滑化する。追加条件としての「直近7日で平滑化」は、検索クエリの受付数の推移を平滑化するための期間を指定する情報の一例である。クエリ抽出装置400は、「賃貸」の受付数の推移およびウェブ検索において検索された検索クエリの受付数の推移を、指定された期間における平均値に変換することで、それぞれの推移を平滑化する。クエリ抽出装置400は、平滑化された「賃貸」の受付数の推移と相関がある平滑化された受付数の推移を示す検索クエリを、関連クエリとして抽出する。
【0033】
クエリ抽出装置400は、検索クエリとしてウェブ検索で「ハロウィン」、対象データ条件として「画像検索」が指定された場合、ウェブ検索で「地震」の受付数の推移と相関がある画像検索された検索クエリを、関連クエリとして抽出する。このように、クエリ抽出装置400は、検索処理の種類を指定することで、関連クエリのカテゴリを分けることができる。
【0034】
クエリ抽出装置400は、検索クエリとしてウェブ検索で「地震」、対象データ条件として「検索結果URL」が指定された場合、ウェブ検索で「地震」の受付数の推移と相関がある選択回数の推移を示すURLに対する流入クエリを、関連クエリとして抽出する。URLの選択回数は、例えば、端末装置100によりURLがクリックされて、検索サーバ200がHTTPリクエストを受け付けた回数である。このように、クエリ抽出装置400は、URLのクリック数を指定することで、文字情報で表れる表記ゆれなどのクエリを纏めることができるので、外れ値によるノイズを抑制することができる。
【0035】
クエリ抽出装置400は、検索クエリとしてウェブ検索で「クリスマスプレゼント」、対象データ条件として「SSURL」、および追加条件として「「通販サイトaaa」で絞る」という絞込条件が指定された場合、ウェブ検索で「クリスマスプレゼント」の受付数の推移と相関がある選択回数の推移を示すURLに流入するための検索クエリを、通販サイトaaaに関連する検索クエリに絞り込んで、関連クエリとして抽出する。「「通販サイトaaa」で絞る」は、絞込条件の一例である。通販サイトaaaに関連する検索クエリとは、例えば、通販サイトaaaという文字情報を含む検索クエリ、通販サイトaaaにおいて検索された検索クエリ、または通販サイトaaaのウェブページを表示させるために検索された検索クエリである。
【0036】
クエリ抽出装置400は、検索クエリとして「検索ドメインの「www.tsuhan.co.jp」」、および対象データ条件として「検索結果ドメイン」が指定された場合、「www.tsuhan.co.jp」の受付数の推移と相関がある受付数の推移を示す検索結果ドメインに流入するための検索クエリを、関連クエリとして抽出する。このように、クエリ抽出装置400は、ドメイン同士で相関を取ることで、強い相関関係の関連クエリを抽出することができる。
【0037】
クエリ抽出装置400は、検索クエリとして「2週間で1つずつ上昇するサンプルデータ」や「平日に上昇するサンプルデータ」という時系列で変化する情報が指定された場合、検索クエリのログに含まれる検索クエリの中から、指定された時系列の変化と相関がある受付数の推移を示す検索クエリを、関連クエリとして抽出する。
【0038】
クエリ抽出装置400は、追加条件として「1日後にシフト」が指定された場合、リクエストに含まれる検索クエリの受付数の推移を、指定された期間だけシフトさせる。追加条件として「1日後にシフト」は、リクエストに含まれる検索クエリの受付数の推移をシフトさせるための期間を指定する情報の一例である。クエリ抽出装置400は、リクエストに含まれる検索クエリの受付数の推移を指定された期間だけシフトさせた推移と相関がある推移を示す検索クエリを、関連クエリとして抽出する。これにより、クエリ抽出装置400は、例えば、台風が到来した一日後に受付数が多くなる「台風一過」などを関連クエリとして抽出することができる。
【0039】
クエリ抽出装置400は、追加条件として「逆相関」が指定された場合、検索クエリのログに含まれる検索クエリから、リクエストに含まれる検索クエリの受付数の推移と相関が逆の受付数の推移を示す検索クエリを、関連クエリとして抽出する。これにより、クエリ抽出装置400は、例えば、台風が到来した場合に受付数が少なくなる「漁船」などを関連クエリとして抽出することができる。
【0040】
[第1実施形態の効果]
以上説明した第1実施形態のクエリ抽出装置400によれば、ネットワークNWを介して検索を行う検索サービスにおいて受け付けられた検索クエリのログを取得するログ取得部402と、検索サーバ200から検索クエリの入力を受け付ける応答部408と、ログ取得部402により取得された検索クエリのログに基づいて、検索クエリのログに含まれる検索クエリの中から、検索サービスにおいて、リクエストに含まれる検索クエリの受付数の推移と相関がある受付数の推移を示す関連クエリを抽出する推移演算部404および相関演算部406を備えるので、入力された検索クエリに関連の強い検索クエリを抽出する際に、より多様な検索クエリを抽出することができる。クエリ抽出装置400によれば、例えば、検索クエリのログから、リクエストに含まれる検索クエリと同時期に検索された検索クエリを関連クエリとして抽出することができる。
【0041】
また、第1実施形態のクエリ抽出装置400によれば、追加条件を指定することで、検索クエリのログから抽出する関連クエリを調整することができるので、関連クエリを取得したい管理者の意向に沿って更に多様な関連クエリを抽出することができる。
【0042】
<第2実施形態>
以下、第2実施形態について説明する。第2実施形態の検索システム1Aは、管理端末500から検索クエリを含む検索リクエストを受信した場合に、受信した検索クエリに関連する検索候補を含む情報を管理端末500に提供する点で、第1実施形態のクエリ抽出システム1とは異なる。以下、この点を中心に説明する。
【0043】
[システムの全体構成]
図7は、第2実施形態における検索システム1Aの全体構成および情報の流れの一例を示す図である。第2実施形態の検索システム1Aにおいて、クエリ抽出装置400Aは、例えば定期的に、検索ログデータベースサーバ300から検索クエリのログS10を読み出す。クエリ抽出装置400Aは、読み出した検索クエリのログS10から、管理端末500から受信した検索クエリに対する関連クエリを抽出する。クエリ抽出装置400Aは、管理端末500から受信した検索クエリと関連クエリとの対応関係を表すテーブルデータS11を検索サーバ200Aに送信する。検索サーバ200Aは、内部の記憶部にテーブルデータS11を記憶する。
【0044】
検索サーバ200Aは、端末装置100から検索クエリS12を含む検索リクエストを受け付けた場合、テーブルデータS11を参照して、検索クエリS12に対応付けられている関連クエリを取得し、取得した関連クエリを検索候補S13として端末装置100に送信する。これにより、検索サーバ200Aは、端末装置100に検索候補S13を表示させたりすることができる。
【0045】
[関連クエリの生成処理]
図8は、第2実施形態の検索システム1Aにおいて関連クエリを生成する処理の流れの一例を示すフローチャートである。なお、このフローチャートの処理は、所定の期間ごとに繰り返して実行される。まずクエリ抽出装置400Aは、ログ取得タイミングが到来したか否かを判定する(S100)。ログ取得タイミングは、管理端末500からリクエストを受け付けたタイミングであるが、これに限定されず、1日に1回や1月に1回などであってよい。クエリ抽出装置400Aは、ログ取得タイミングが到来したと判定した場合、検索ログデータベース300Aに含まれる検索クエリのうち、受付数が多い上位N個の検索クエリのログS10を取得する(S102)。クエリ抽出装置400Aは、取得した検索クエリのログS10に含まれる検索クエリごとに、検索クエリのログS10の全体からM個の関連クエリを抽出する(S104)。なお、Nは1以上の自然数であり、例えば、20個である。また、Mは1以上の自然数であり、例えば5個などの所定の検索候補の数である。次にクエリ抽出装置400Aは、N個の検索クエリとM個の関連クエリとを含むテーブルデータS11を検索サーバ200Aに送信することで、検索サーバ200Aに記憶する(S106)。なお、ログ取得タイミングが到来していない場合、本フローチャートの処理は終了する。
【0046】
[検索候補の提供処理]
図9は、第2実施形態の検索システム1Aにおいて関連クエリを提供する処理の流れの一例を示すフローチャートである。なお、このフローチャートの処理は、所定の期間ごとに繰り返して実行される。検索サーバ200Aは、端末装置100から検索リクエストを受け付けたか否かを判定する(S200)。検索サーバ200Aは、検索リクエストを受け付けた場合、テーブルデータS11を参照して、検索リクエストに含まれる検索クエリS12に対応付けられた関連クエリがあるか否かを判定する(S202)。検索サーバ200Aは、関連クエリがある場合、関連クエリをテーブルデータS11から読み出して、読み出した関連クエリを検索候補S13として端末装置100に送信する(S204)。
【0047】
検索サーバ200Aは、関連クエリがない場合、検索クエリS12をクエリ抽出装置400Aに送信する(S206)。クエリ抽出装置400Aは、検索クエリのログから検索クエリS12の受付数の推移と相関がある受付数の推移を示す検索クエリを抽出し、検索サーバ200Aに送信する。これにより、検索サーバ200Aは、検索クエリS12の関連クエリを取得する(S208)。検索サーバ200Aは、取得した関連クエリを検索候補S13として端末装置100に送信する(S204)。
【0048】
[第2実施形態の効果]
以上説明した第2実施形態の検索システム1Aによれば、端末装置100から検索クエリを受け付けた場合に、受け付けた検索クエリの受付数の推移と相関がある受付数の推移を示す関連クエリをクエリ抽出装置400Aから取得し、関連クエリを検索候補として端末装置100に送信するので、より多様な検索候補を提供することができる。
【0049】
<第3実施形態>
以下、第3実施形態について説明する。第3実施形態の広告配信システム1Bは、検索サーバ200Bが端末装置100から検索クエリを受け付けた場合に、広告情報を端末装置100に提供する点で、上述した実施形態とは異なる。以下、この点を中心に説明する。
【0050】
図10は、第3実施形態における広告配信システム1Bの全体構成および情報の流れの一例を示す図である。広告配信システム1Bは、ネットワークNWを介して、検索サーバ200Bおよびクエリ抽出装置400Bと接続されている広告配信装置600を備える。広告配信装置600は、広告リクエストに応じて検索サーバ200Bに広告を配信する。広告配信装置600は、例えば、広告決定部602を備える。広告決定部602を含む構成要素は、例えば、CPUなどのプロセッサがプログラムを実行することにより実現される。また、これらの構成要素は、LSIやASIC、FPGAなどのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。広告決定部602は、関連クエリに基づいて、広告を決定する。
【0051】
検索サーバ200Bは、端末装置100から検索クエリS20を含む検索リクエストを受け付けた場合、受信した検索クエリS20を検索クエリS21としてクエリ抽出装置400Bに送信する。クエリ抽出装置400Bは、検索クエリのログから、受信した検索クエリS21の受付数の推移と相関がある受付数の推移を示す関連クエリS22を抽出し、関連クエリS22を含む広告リクエストを広告配信装置600に送信する。
【0052】
広告配信装置600は、広告リクエストを受信した場合、広告決定部602により関連クエリS22に対応付けられている広告情報があるか否かを判定する。広告配信装置600は、関連クエリS22に対応付けられている広告情報がある場合、当該広告情報S23を検索サーバ200Bに送信する。広告配信装置600は、関連クエリS22に対応付けられている広告情報がない場合、他の広告情報を検索サーバ200Bに送信する。検索サーバ200Bは、広告枠に広告情報に設定した検索結果を含むウェブページを、検索結果S24として端末装置100に送信する。
【0053】
[第3実施形態の効果]
以上説明した第3実施形態の広告配信システム1Bによれば、クエリ抽出装置400Bと、クエリ抽出装置400Bから関連クエリを取得し、関連クエリに関連する広告情報を端末装置100に送信する広告配信装置600とを備えるので、より多様な関連クエリに対して広告を配信することができる。
【0054】
<変形例>
図11は、実施形態の変形例を示す図である。上述した実施形態は、クエリ抽出装置400と管理端末500がネットワークを介して接続されているものとして説明したが、図10に示すように、クエリ抽出装置400の機能を備える管理端末400Cにより検索クエリのログから関連クエリを抽出する処理を実現してよい。
【0055】
<ハードウェア構成>
図12は、クエリ抽出装置400のハードウェア構成を示す図である。クエリ抽出装置400は、NIC400−1、CPU400−2、RAM400−3、ROM400−4、フラッシュメモリやHDDなどの二次記憶装置400−5、およびドライブ装置400−6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置400−6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置400−5、またはドライブ装置400−6に装着された可搬型記憶媒体に記憶されたプログラムがDMAコントローラ(不図示)などによってRAM100−3に展開され、CPU400−2によって実行されることで、クエリ抽出装置400の各機能部が実現される。
【0056】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何など限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【0057】
上述した実施形態は、検索サーバが検索クエリを受け付けるものとしたが、これに限定されず、検索クエリを検索サーバに転送するための検索サーバとは別体のフロントサーバを備えていてもよい。この場合、フロントサーバは、検索クエリを検索サーバおよびクエリ抽出装置に転送し、検索サーバからクエリ抽出装置には検索クエリを抽出しなくてよい。
【符号の説明】
【0058】
1…クエリ抽出システム、1A…検索システム、1B…広告配信システム、100…端末装置、200…検索サーバ、200A…検索サーバ、200B…検索サーバ、202…クエリ受付部、204…検索部、206…ログ記録部、300…検索ログデータベースサーバ、300A…検索ログデータベース、400…クエリ抽出装置、400A…クエリ抽出装置、400B…クエリ抽出装置、400C…管理端末、402…ログ取得部、404…推移演算部、406…相関演算部、408…応答部、500…管理端末、600…広告配信装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12