(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-19
(45)【発行日】2024-04-30
(54)【発明の名称】検索装置、検索方法及び検索プログラム
(51)【国際特許分類】
G06F 16/9035 20190101AFI20240422BHJP
【FI】
G06F16/9035
(21)【出願番号】P 2020188221
(22)【出願日】2020-11-11
【審査請求日】2021-03-17
【審判番号】
【審判請求日】2023-04-24
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】南 翔太郎
(72)【発明者】
【氏名】賀来 智博
(72)【発明者】
【氏名】竹中 光
(72)【発明者】
【氏名】坂井 俊亮
(72)【発明者】
【氏名】宮崎 林太郎
(72)【発明者】
【氏名】熊谷 俊宏
【合議体】
【審判長】吉田 美彦
【審判官】林 毅
【審判官】稲垣 良一
(56)【参考文献】
【文献】特表2008-545196(JP,A)
【文献】特開2008-186452(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F16/9035
(57)【特許請求の範囲】
【請求項1】
利用者から検索クエリを受け付けた場合、前記利用者の属性に係る属性情報と前記検索クエリとに基づき、検索対象となる所定のドメイン
の各ドメインに対する前記利用者の興味の度合いを推定する推定部と、
前記
所定
のドメインの中で前記推定された興味の度合いが所定の閾値
を超えるドメインがない場合、前記検索クエリにマッチしたコンテンツへのリンクの一覧
のみを出力し、前記
所定
のドメインの中で前記推定された興味の度合いが
前記所定の閾値を超える
ドメインがある場合、当該
ドメインのサーバに対して前記検索クエリを投入することにより前記サーバから受信した検索結果を、前記検索クエリにマッチしたコンテンツへのリンクの一覧ととも
に出力する検索結果出力部と、
を有することを特徴とする検索装置。
【請求項2】
前記推定部は、
利用者の属性情報と、当該利用者からの検索クエリと、所定のドメインに対する当該利用者の興味の度合いとの関連性を学習したモデルを用いて、所定のドメインに対する利用者の興味の度合いを推定する
ことを特徴とする請求項1に記載の検索装置。
【請求項3】
前記推定部は、
利用者からの検索クエリおよび前記利用者の性別、年代、および、行動履歴の少なくともいずれかの情報を含む利用者情報と、所定のドメインに対する当該利用者の興味の度合いとの関連性を学習したモデルを用いて、所定のドメインに対する利用者の興味の度合いを推定する
ことを特徴とする請求項1に記載の検索装置。
【請求項4】
前記モデルは、
前記利用者から検索クエリを受け付けた際、当該検索クエリにマッチしたコンテンツのうち、前記利用者により選択されたコンテンツのドメインを示したログに基づいて学習されたモデルである
ことを特徴とする請求項
3に記載の検索装置。
【請求項5】
前記モデルは、
前記ログに基づき、前記検索クエリにマッチしたコンテンツのうち、どのドメインのコンテンツが何回選択されたかのカウント結果を反映したモデルである
ことを特徴とする請求項
4に記載の検索装置。
【請求項6】
前記検索結果出力部は、
前記所定のドメインのうち、前記推定された興味の度合いが所定の閾値を超える
ドメインが複数ある場合、当該複数のドメインのうちのいずれか1つのドメイン
のサーバに
対して前記検索クエリを投入する
ことにより前記
サーバから受信した前記検
索結果を、前記検索クエリにマッチしたコンテンツへのリンクの一覧とともに出力する
ことを特徴とする請求項1に記載の検索装置。
【請求項7】
前記検索結果出力部は、
前記所定のドメインのうち、前記推定された興味の度合いが所定の閾値を超え
るドメイン
が複数ある場合、当該複数のドメインそれぞれ
のサーバに
対して前記検索クエリを投入する
ことにより前記
それぞれのサーバから受信した前記検索
結果を、前記検索クエリに
マッチしたコンテンツへのリンクの一覧とともに出力する
ことを特徴とする請求項1に記載の検索装置。
【請求項8】
前記所定のドメインに、電子商店街のドメインが含まれることを特徴とする請求項1に記載の検索装置。
【請求項9】
前記電子商店街のドメインの
サーバに
対して前記検索クエリ
を投入する
ことにより前記サーバから受信した前記検索結果は、
前記
サーバにおいて検索された商品の情報および画像の組を並べて表示した情報である
ことを特徴とする請求項
8に記載の検索装置。
【請求項10】
前記検索結果が多数の商品の情報を含む場合、当該商品の情報および画像の組を、利用者の操作に応じて利用者が視認しやすい状態で表示する
ことを特徴とする請求項
9に記載の検索装置。
【請求項11】
検索装置が実行する検索方法であって、
利用者から検索クエリを受け付けた場合、前記利用者の属性に係る属性情報と前記検索クエリとに基づき、検索対象となる所定のドメイン
の各ドメインに対する前記利用者の興味の度合いを推定する推定工程と、
前記
所定
のドメインの中で前記推定された興味の度合いが所定の閾値
を超えるドメインがない場合、前記検索クエリにマッチしたコンテンツへのリンクの一覧
のみを出力し、前記
所定
のドメインの中で前記推定された興味の度合いが
前記所定の閾値を超える
ドメインがある場合、当該
ドメインのサーバに対して前記検索クエリを投入することにより前記サーバから受信した検索結果を、前記検索クエリにマッチしたコンテンツへのリンクの一覧ととも
に出力する検索結果出力工程と、
を含むことを特徴とする検索方法。
【請求項12】
利用者から検索クエリを受け付けた場合、前記利用者の属性に係る属性情報と前記検索クエリとに基づき、検索対象となる所定のドメイン
の各ドメインに対する前記利用者の興味の度合いを推定する推定手順と、
前記
所定
のドメインの中で前記推定された興味の度合いが所定の閾値
を超えるドメインがない場合、前記検索クエリにマッチしたコンテンツへのリンクの一覧
のみを出力し、前記
所定
のドメインの中で前記推定された興味の度合いが
前記所定の閾値を超える
ドメインがある場合、当該
ドメインのサーバに対して前記検索クエリを投入することにより前記サーバから受信した検索結果を、前記検索クエリにマッチしたコンテンツへのリンクの一覧ととも
に出力する検索結果出力手順と、
をコンピュータに実行させるための検索プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索装置、検索方法及び検索プログラムに関する。
【背景技術】
【0002】
従来、検索クエリを用いたコンテンツの検索の結果として、検索により得られたコンテンツ上での当該検索クエリによる検索の結果を併せて提示する技術がある(特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、上述した従来技術により提示される検索の結果は、検索者(利用者)の興味の度合いが高いものではない場合もある。例えば、利用者は、検索クエリに入力した商品を購入可能なショッピングサイトを検索したいにもかかわらず、ショッピングサイト以外のサイト上での検索結果が提示される可能性もある。
【0005】
本願は、上記に鑑みてなされたものであって、利用者にとって興味の度合いの高いコンテンツにおける検索結果を提供する検索装置、検索方法及び検索プログラムを提供すること目的とする。
【課題を解決するための手段】
【0006】
前記した課題を解決するため、本発明は、利用者から検索クエリを受け付けた場合、前記検索クエリに基づき、検索対象となる所定のドメインのコンテンツに対する前記利用者の興味の度合いを推定する推定部と、前記推定された興味の度合いが所定の閾値を超える場合、前記推定された度合いが所定の閾値を超えるドメインのコンテンツにおける前記検索クエリによる検索結果を、検索されたコンテンツの結果とともに出力する検索結果出力部と、を有することを特徴とする。
【発明の効果】
【0007】
実施形態の一態様によれば、利用者にとって興味の度合いの高いコンテンツにおける検索結果を提供することができるという効果を奏する。
【図面の簡単な説明】
【0008】
【
図1】
図1は、第1の実施形態に係る検索装置が実行する検索処理の一例を示す図である。
【
図2】
図2は、第1の実施形態に係る検索装置の構成の一例を示す図である。
【
図3】
図3は、第1の実施形態に係るログ情報の一例を示す図である。
【
図4】
図4は、検索ドメインによる検索結果を示す画面の一例を示す図である。
【
図5】
図5は、第1の実施形態に係る検索装置が実行する検索処理の流れの一例を示すフローチャートである。
【
図6】
図6は、第2の実施形態に係る辞書データの一例を示す図である。
【
図7】
図7は、
図6に示す辞書データの変形例を示す図である。
【
図8】
図8は、各実施形態に係る検索装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る検索装置、決定方法及び決定プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。
【0010】
なお、以下の各実施形態により本願に係る検索装置、検索方法及び検索プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。
【0011】
[第1の実施形態]
[検索処理の一例]
図1を用いて、第1の実施形態に係る検索装置100が実行する検索処理の一例を説明する。
図1は、第1の実施形態に係る検索装置100が実行する検索処理の一例を示す図である。
【0012】
図1に示すように、検索システム1は、端末装置10と、検索装置100と、サーバ200とを含む。端末装置10と、検索装置100と、サーバ200とは、図示しない所定の通信網を介して、有線又は無線により通信可能に接続される。なお、検索システム1における、端末装置10、検索装置100、サーバ200は、それぞれ複数台であってよい。
【0013】
端末装置10は、ブラウザに表示されるウェブページやアプリケーション用のコンテンツ等のコンテンツにアクセスする利用者によって利用される情報処理装置である。例えば、端末装置10は、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット端末や、携帯電話機や、PDA(Personal Digital Assistant)等である。
【0014】
図1の例では、端末装置10が利用者によって利用されるノート型PCである場合を示す。なお、以下では、端末装置10を利用者と表記する場合がある。すなわち、以下では、利用者を端末装置10と読み替えることもできる。また、以下では、各利用者によって利用される端末装置10を区別する必要のない場合には、端末装置10と表記する場合がある。
【0015】
なお、各実施形態における検索クエリは1以上の検索ワードを含む。つまり、検索クエリに含まれる検索ワードは1つでもよいし、スペース等で分割された複数の検索ワードであってもよい。また、検索ワードは、(1)ブランド名、(2)例えば、「シューズ」等、商品のカテゴリや種別を示す単語、(3)サイズ、モデル名等、商品をより限定するための単語等の組み合せであってもよい。
【0016】
検索装置100は、利用者から検索クエリを受け付けた場合、当該検索クエリにマッチするウェブページやコンテンツの検索処理を行う。ここで、例えば、検索装置100は、利用者からの検索クエリに基づき、検索対象となる所定のドメインのコンテンツに対する利用者の興味の度合いを推定する。そして、検索装置100は、推定した興味の度合いが所定の閾値を超える場合、推定された度合いが所定の閾値を超えるドメインのコンテンツに検索クエリを送信し、当該ドメインのコンテンツから当該検索クエリによる検索結果を受け取る。そして、検索装置100は、当該ドメインのコンテンツから受け取った検索結果を、検索されたコンテンツの結果とともに出力する。
【0017】
また、サーバ200は、ブラウザに表示されるウェブページやアプリケーション用のコンテンツ等を提供するサーバであり、例えば、電子商店街のコンテンツを提供するサーバである。このサーバ200は、例えば、検索装置100から受信した検索クエリに基づき、自身のコンテンツを検索し、その検索結果を検索装置100へ送信する。
【0018】
以下、
図1を用いて、検索装置100による検索処理の一例を流れに沿って説明する。
【0019】
例えば、検索装置100は、利用者の端末装置10から検索クエリ1を受け付けると、検索クエリ1に基づき、検索対象となる所定のドメインのコンテンツに対する利用者の興味の度合いの推定値を示すスコア(以下、適宜「スコア」と略す)を算出する。
【0020】
なお、スコアの算出には、例えば、利用者からの検索クエリと、所定のドメインのコンテンツに対する利用者の興味の度合いとの関連性を学習したモデルを用いる。このモデルは、例えば、ロジスティック回帰、SVM(Support Vector Machine)、深層学習等の機械学習の従来技術により生成される。
【0021】
例えば、モデルは、利用者から検索クエリを受け付けた際、当該検索クエリによる検索の結果であるコンテンツのうち、利用者により選択されたコンテンツのドメインを示したログを学習データとして用いた機械学習により生成される。
【0022】
モデルの生成は、例えば、以下の手順で行われる。
(1)検索装置100は、ドメインごとにモデルを準備しておく。
(2)検索装置100は、対応するドメインを利用者がクリックした際に入力した検索クエリを正例とし、他のドメインを利用者がクリックした際に入力した検索クエリを負例として取得する。
(3)検索装置100は、正例を入力した際に、負例を入力した際よりも高い値のスコアを出力するように、モデルの学習を行う。
【0023】
上記のようにして学習されたモデルは、検索クエリを入力した利用者の各ドメインに対する興味の度合いを示すスコアを算出することができる。
【0024】
例えば、商品を販売するショッピングサイトのドメインにおいては、利用者は、検索クエリを用いて商品を検索する。ここで、利用者が、検索サイトから、商品を販売するドメインを検索し、検索リストからリンク先のドメインに遷移し、再度検索クエリを用いて検索するのは、手間がかかる。
【0025】
また、検索サイトにおける検索の結果に、ショッピングドメインの検索結果を表示すれば、手間が削減されるものの、すべての検索クエリにおいてこのような処理を行った場合、逆に煩雑になったり、利用者の意図に反したりする恐れがある。
【0026】
そこで、検索装置100は、モデルにより算出したスコアから、所定のショッピングドメインに対する利用者の興味の度合いを判定し、興味の度合いが高い場合に、所定のショッピングドメインにおける検索結果を提供する。
【0027】
検索装置100は、算出したスコアが所定の閾値以下の場合、検索クエリによる検索結果を端末装置10へ返す。例えば、検索装置100は、検索クエリ1にマッチしたコンテンツへのリンクの一覧を示した検索結果1を端末装置10へ返す。
【0028】
一方、検索装置100は、算出されたスコアが所定の閾値を超える場合、スコアが所定の閾値を超えるドメインのサーバ200に対し、検索クエリを投入し、検索クエリに対する検索結果を受信する。そして、検索装置100は、サーバ200から受信した検索結果(他のドメインにおける検索結果)を含む検索結果を端末装置10へ返す。
【0029】
例えば、検索装置100は、検索クエリ2に基づき、上記のスコアを算出したところ、スコアが所定の閾値を超える場合、サーバ200に対し、検索クエリ2に基づく検索クエリを投入し、サーバ200から、当該検索クエリに対する検索結果を受信する。そして、検索装置100は、サーバ200から受信した検索結果を含む検索結果2を端末装置10へ返す。
【0030】
検索結果2は、例えば、
図1に示すように、サーバ200における検索クエリ2による検索結果(他のドメインにおける検索結果)と、検索クエリ2にマッチしたコンテンツへのリンクの一覧とを示した情報である。
【0031】
例えば、サーバ200が電子商店街(ショッピングサイト)のコンテンツを提供するサーバである場合、サーバ200における検索結果は、
図1に示すように、サーバ200において検索された商品の情報および画像の組を並べて表示した情報である。また、上記の商品の情報および画像の組は、利用者の操作に応じて変更可能に表示されたものでもよい。また、上記のサーバ200における検索結果は、当該サーバ200のドメイン名を示す情報を含んでもよい。
【0032】
なお、上記の例においては、スコアが所定の閾値を超えるドメインが1つであった場合について説明したが、スコアが所定の閾値を超えるドメインが複数ある場合、検索装置100は、当該複数のドメインそれぞれにおける検索結果を端末装置10へ返してもよい。
【0033】
[検索装置の構成]
次に、
図2を用いて、第1の実施形態に係る検索装置100の構成について説明する。
図2は、第1の実施形態に係る検索装置100の構成例を示す図である。検索装置100は、通信部110と、記憶部120と、制御部130とを有する。
【0034】
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線又は無線で接続され、端末装置10、サーバ200との間で情報の送受信を行う。例えば、通信部110は、端末装置10から検索クエリを受け付けたり、サーバ200へ検索クエリを送信したり、当該サーバ200からの検索結果を受信したりする。
【0035】
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、例えば、ログ情報と、モデルとを有する。破線で示した辞書データは、装備される場合と装備されない場合とがあり、装備される場合については、第2の実施形態で述べる。
【0036】
(ログ情報について)
ログ情報は、利用者による過去の検索結果を示した情報である。ログ情報は、例えば、検索クエリにより検索されたコンテンツのうち、利用者により選択(クリック)されたコンテンツのドメインを示した情報である。
図3に、第1の実施形態に係るログ情報の一例を示す。
図3に示した例では、ログ情報は、「利用者情報」、「検索クエリ」、「クリックしたドメイン」等の項目を有する。
【0037】
「利用者情報」は、利用者の情報であり、例えば、利用者の年代、性別、行動履歴(例えば、商品の購入履歴等)等を示した情報である。利用者の情報は、例えば、当該利用者が検索装置100を利用する際に入力された利用者IDをキーとして、外部から取得したものを用いてもよいし、検索時に利用者から入力された情報を用いてもよい。
【0038】
「検索クエリ」は、当該利用者から受け付けた検索クエリを示した情報である。「クリックしたドメイン」は、当該検索クエリにより検索されたコンテンツのうち、当該利用者により選択されたコンテンツのドメインを示した情報である。
【0039】
図3に示す例では、「20代の男性」である利用者が、「スニーカー」という検索ワードの検索クエリによりコンテンツの検索を行い、検索されたコンテンツのうち、「example1.com」のドメインのコンテンツを選択したことを示す。
【0040】
上記のログ情報について、さらに
図4を参照しながら説明する。例えば、
図4に示すように、ある検索ドメインが、利用者から入力された「スニーカー」というキーワードで検索を実行すると、検索結果として、(1)ドメインP1「example1.com」のドメインのコンテンツへのリンク、(2)ドメインP2「example2.com」のドメインのコンテンツへのリンク、(3)ドメインP3「example3.com」のドメインのコンテンツへのリンク等が表示される。
【0041】
ここで、上記の「スニーカー」を入力した利用者が、
図4に示す、(1)ドメインP1「example1.com」のドメインのコンテンツへのリンクを選択した場合、当該利用者は、「スニーカー」により検索されたコンテンツのうち、「example1.com」のドメインのコンテンツを選択したことが上記のログ情報に記録される。
【0042】
(モデルについて)
図2の説明に戻る。モデルは、利用者からの検索クエリと、所定のドメインのコンテンツに対する当該利用者の興味の度合いとの関連性を学習したモデルである。モデルは、上記のログ情報に基づいて、モデル生成部131により生成される。なお、モデルは、例えば、上記の所定のドメインが複数ある場合、ドメインごとに生成される。
【0043】
(制御部130について)
制御部130は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、検索装置100内部の記憶装置に記憶されている各種プログラム(検索プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0044】
制御部130は、モデル生成部131と、取得部132と、スコア算出部133と、判定部134と、検索結果取得部135と、検索結果出力部136とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
【0045】
なお、制御部130の内部構成は、
図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。例えば、モデル生成部131、取得部132およびスコア算出部133は、検索装置100とは別の装置に装備されてもよい。より具体的には、制御部130が発揮する機能は、モデル生成部131の機能を発揮するモデル生成サーバ、取得部132の機能を発揮する検索クエリ受付サーバ、およびスコア算出部133の機能を発揮するスコア算出サーバが協働して処理を実行することにより、実現されてもよい。
【0046】
(モデル生成部131について)
モデル生成部131は、ログ情報(
図3参照)に基づき、上記のモデルを生成する。例えば、モデル生成部131は、ログ情報に基づき、利用者が、検索クエリにより検索されたコンテンツのうち、どのドメインのコンテンツを選択したかに基づき、上記のモデルを生成する。なお、モデル生成部131は、上記のログ情報に基づき、利用者が、当該ドメインのコンテンツを選択した回数をカウントし、そのカウントの結果も考慮してモデルを生成してもよい。
【0047】
(取得部132について)
取得部132は、各種情報を取得する。例えば、取得部132は、利用者からの検索クエリ、ログ情報等を取得する。
【0048】
(スコア算出部133について)
スコア算出部133は、検索クエリに基づき、検索対象となる所定のドメインのコンテンツに対する利用者の興味の度合いの推定値を示すスコアを算出する。例えば、スコア算出部133は、検索クエリと、モデルとを用いて、検索対象となる所定のドメインごとに、当該ドメインのコンテンツに対する利用者の興味の度合いの推定値を示すスコアを算出する。
【0049】
(判定部134について)
判定部134は、スコア算出部133により算出されたスコアが所定の閾値を超えるドメインがあるか否かを判定する。例えば、判定部134は、検索対象となる所定のドメイン(例えば、
図4に示すドメインP1,P2,P3)のうち、スコアが所定の閾値を超えるドメインがあるか否かを判定する。
【0050】
(検索結果取得部135について)
検索結果取得部135は、判定部134によりスコアが所定の閾値を超えると判定されたドメインのコンテンツから、検索クエリによる検索結果を取得する。例えば、判定部134により、ドメインP1のスコアが所定の閾値を超えると判定された場合、検索結果取得部135は、ドメインP1のサーバ(例えば、
図1に示すサーバ200)へ検索クエリを送信し、ドメインP1のサーバから、当該検索クエリによる検索結果を受信する。
【0051】
なお、検索結果取得部135は、スコアが所定の閾値を超えると判定されたドメインのうち、いずれか1つのドメインのサーバから、検索クエリによる検索結果を取得してもよいし、複数のドメインのサーバから、検索クエリによる検索結果を取得してもよい。また、検索結果取得部135は、スコアが所定の閾値を超えると判定されたドメインのうち、所定のジャンルのドメイン(例えば、電子商店街のドメイン)のサーバから、検索クエリによる検索結果を取得してもよい。さらに、検索結果出力部136は、検索装置100のドメインと同じドメインのコンテンツから検索クエリによる検索結果を取得してもよい。
【0052】
(検索結果出力部136について)
検索結果出力部136は、検索結果取得部135により取得された検索結果を、検索クエリにより検索されたコンテンツの結果とともに出力する。例えば、検索結果出力部136は、検索結果取得部135により取得された検索結果に示される商品の情報および画像の組を並べて表示した情報を、検索クエリにより検索されたコンテンツへのリンクの一覧とともに端末装置10に表示する。
【0053】
例えば、検索結果出力部136は、
図1に示すように、他のドメインから検索クエリにより検索された、商品Aおよび商品Aの価格「1200円」と、商品Bおよび商品Bの価格「1500円」と、商品Cおよび商品Cの価格「1700円」とを並べて表示した情報を、検索されたコンテンツへのリンクの一覧とともに端末装置10に表示する。なお、検索結果出力部136は、上記の商品の情報および画像の組を、利用者の操作に応じて変更可能に表示してもよい。
【0054】
[検索処理の手順]
次に、
図5を用いて、第1の実施形態に係る検索装置100が実行する検索処理の手順について説明する。
図5は、第1の実施形態に係る検索装置100が実行する検索処理の流れの一例を示すフローチャートである。なお、検索装置100のモデル生成部131は、ログ情報(
図3参照)に基づいて、モデルを生成済みであるものとする。
【0055】
図5に示すように、取得部132は、利用者から検索クエリを取得する(ステップS1)。そして、スコア算出部133は、上記の検索クエリとモデルとを用いて、検索対象となる所定のドメインごとに、当該ドメインのコンテンツに対する利用者の興味の度合いの推定値を示すスコアを算出する(ステップS2)。
【0056】
ステップS2の後、判定部134は、検索対象となる所定のドメインのうち、スコアが所定の閾値を超えるドメインがあるか否かを判定する(ステップS3)。ここで、判定部134が、スコアが所定の閾値を超えるドメインがあると判定した場合(ステップS3;Yes)、検索結果取得部135は、当該ドメインのコンテンツから、検索クエリによる検索結果を取得する(ステップS4)。そして、検索結果出力部136は、検索結果取得部135により取得された検索結果を、検索クエリにより検索されたコンテンツの結果とともに出力する(ステップS5)。
【0057】
一方、判定部134は、スコアが所定の閾値を超えるドメインはないと判定した場合(ステップS3;No)、検索結果出力部136は、検索クエリにより検索されたコンテンツの結果を出力する(ステップS6)。
【0058】
[第2の実施形態]
次に、第2の実施形態について説明する。第2の実施形態に係る検索装置100は、検索対象となる所定のドメインのスコアを算出する際、辞書データ(
図2参照)を参照してスコアを算出する。この辞書データは、例えば、
図2に示すように、検索装置100内の記憶部120に装備されていてもよいし、検索装置100の外部に装備されてもよい。
【0059】
図6は、第2の実施形態に係る辞書データの一例を示す図である。辞書データは、例えば、
図6に示すように、検索クエリと、当該検索クエリによる検索結果のコンテンツのドメインのうち、利用者に選択(クリック)された1以上のドメインと、選択されたドメインそれぞれのスコアとを示した情報である。
【0060】
図6に示す辞書データにおいて、「検索クエリ1」により検索されたドメインのうち、「ドメイン1」に対する「スコア1」であり、「ドメイン2」に対するスコアは「スコア2」であることを示す。上記の辞書データは、例えば、前記したログ情報に基づき生成されたものでもよいし、検索装置100の管理者等が手動で設定したものでもよい。
【0061】
スコア算出部133は、検索クエリによる検索対象となる所定のドメインのスコアを算出する際、辞書データに示される、当該検索クエリに対応付けられた上記の所定のドメインに対するスコアを用いる。
【0062】
なお、スコア算出部133は、検索対象となる所定のドメインのスコアを算出する際、上記の辞書データとモデルの両方を用いてもよい。
【0063】
例えば、スコア算出部133は、利用者からの検索クエリについて、辞書データに、当該検索クエリに対応付けられた所定のドメインのスコアが登録されている場合には、辞書データに登録されるスコアを用いる。一方、辞書データに、当該検索クエリに対応付けられた所定のドメインのスコアが登録されていない場合、スコア算出部133は、上記のモデルを用いてスコアを算出する。
【0064】
このようにすることで、検索装置100は、例えば、モデルの学習がまだ不充分な状態であっても、検索クエリに対する所定のドメインのスコアを得ることができる。
【0065】
[その他の実施形態]
また、検索装置100は、検索クエリに加え、検索クエリの入力者である利用者の情報(例えば、利用者の性別、年代、商品の購入履歴等の情報)を用いて、スコアを算出してよい。
【0066】
この場合、モデル生成部131がモデルを生成する際、ログ情報に含まれる利用者の情報(利用者情報)も用いる。すなわち、モデル生成部131は、ログ情報に示される利用者からの検索クエリおよび当該利用者の情報と、所定のドメインのコンテンツに対する利用者の興味の度合いとの関連性を学習することによりモデルを生成する。そして、スコア算出部133が、スコアを算出する際には、検索クエリおよび当該検索クエリの入力者である利用者の情報と、上記のモデルを用いてスコアの算出を行う。なお、スコアの算出に用いる利用者の情報は、取得部132が検索クエリを取得する際に取得してもよいし、利用者のID等をキーとして、外部の装置等から取得してもよい。
【0067】
例えば、検索装置100は以下の手順により検索処理を行う。ここでは、ブランド#Aのスニーカーを購入する際、男性は「スポーツショップ#A」から購入する頻度が高いが、女性は「シューズショップ#A」から購入する頻度が高い場合を考える。
【0068】
(1)検索装置100は、「スポーツショップ#A」と「シューズショップ#A」とに対応するモデルを準備する。
(2)検索装置100は、「スポーツショップ#A」をクリックした利用者の性別と検索クエリとの組を正例とし、それ以外の組を負例として「スポーツショップ#A」と対応するモデル(第1モデル)に学習させる。
(3)また、検索装置100は、「シューズショップ#A」をクリックした利用者の性別と検索クエリとの組を正例とし、それ以外の組を負例として「シューズショップ#A」と対応するモデル(第2モデル)に学習させる。
(4)検索装置100は、ある利用者が入力した検索クエリと性別とを各モデルに入力し、スコアを算出する。ここで、検索クエリが「ブランド#A スニーカー」等であり、利用者の性別が男性であるならば、第1モデルのスコアが高くなり、同一の検索クエリであっても、利用者の性別が女性であるならば、第2モデルのスコアが高くなる。
(5)検索装置100は、算出されたスコアがより高いドメインにおける検索結果を提示する。例えば、利用者が男性なら、検索装置100は、「スポーツショップ#A」における検索結果を提供し、利用者が女性なら「シューズショップ#A」の検索結果を提供する。
【0069】
なお、検索装置100は、上述のもの以外にも、利用者のデモグラフィック属性やサイコグラフィック属性、現在位置や検索時間帯に応じたスコアを算出してもよい。その場合、上記の各種の要素の特徴をモデルに学習させることにより、スコアの算出を実現可能である。
【0070】
また、検索結果取得部135が、スコアが所定の閾値を超えると判定されたドメインのサーバに対し検索クエリを送信する際、上記の利用者の情報を含めて送信し、当該サーバから当該利用者の情報も考慮した検索結果を取得してもよい。
【0071】
さらに、第2の実施形態の検索装置100のように、辞書データを用いてスコアの算出を行う場合、各検索クエリの入力者(利用者)の情報を含む辞書データ(
図7参照)を用いてスコアの算出を行う。
【0072】
前記した実施形態において、検索装置100が、ショッピングに関する検索に適用される場合について説明したが、これに限定されない。例えば、検索装置100は、いわゆるQ&Aサービス(質問回答サービス)にも適用することができる。例えば、検索装置100は、検索クエリが入力された際に、検索結果から質問回答サービスが選択された履歴を正例として、検索クエリから質問回答サービスを利用する意図を示すスコアを算出するモデルを学習する。そして、検索装置100は、利用者が入力した検索クエリと対応するスコアが所定の閾値を超える場合は、かかる検索クエリと対応する質問や回答を検索結果に含めてもよい。
【0073】
例えば、Q&Aサービスにおいて、利用者から質問の投稿を受け付けると、質問の投稿の内容を公開し、公開した質問に対する回答の投稿を受け付ける。ここで、検索装置100は、質問の投稿の内容を検索クエリとし、受け付けた当該質問に対する回答の中から、より利用者の質問の意図にマッチする回答を検索し、検索された回答を質問結果に含めて表示する。このとき、検索装置100は、当該質問に対する回答それぞれについて、利用者の質問の意図にマッチする度合いを推定し、推定した度合いが所定の閾値を超える回答について、質問結果に含めて表示してもよい。また、このような質問回答サービス以外にも、適宜任意のサービスに対して上述した処理が適用可能である。
【0074】
[ハードウェア構成]
また、上述してきた各実施形態に係る検索装置100は、例えば、
図8に示すような構成のコンピュータ1000によって実現される。以下、検索装置100を例に挙げて説明する。
図7は、検索装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0075】
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0076】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100がネットワークNを介して生成したデータを他の機器へ送信する。
【0077】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0078】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0079】
例えば、コンピュータ1000が実施形態に係る検索装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
【0080】
[その他]
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0081】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0082】
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0083】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、決定部は、決定手段や決定回路に読み替えることができる。
【0084】
[効果]
上述してきたように、検索装置100は、スコア算出部133と、検索結果出力部136とを備える。スコア算出部133は、利用者からの検索クエリに基づき、検索対象となる所定のドメインのコンテンツに対する利用者の興味の度合いを推定する。検索結果出力部136は、スコア算出部133により推定された興味の度合いが所定の閾値を超える場合、推定された興味の度合いが所定の閾値を超えるドメインのコンテンツにおける検索クエリによる検索結果を、検索されたコンテンツの結果とともに出力する。
【0085】
これにより、検索装置100は、推定された利用者の興味の度合が所定の閾値を満たすコンテンツにおける検索結果を、検索されたコンテンツの結果とともに出力することができる。その結果、検索装置100は、利用者によって興味の度合いの高いコンテンツにおける検索結果を提供することができる。
【0086】
また、上述したように、検索結果出力部136により出力される検索結果は、検索装置100のドメインと同じドメインのコンテンツであってもよい。
【0087】
これにより、検索装置100は、自身の検索装置100のドメインと同じドメインのコンテンツにおける検索結果を提供することができる。
【0088】
また、上述したように、スコア算出部133は、利用者からの検索クエリと、所定のドメインのコンテンツに対する利用者の興味の度合いとの関連性を学習したモデルを用いて、所定のドメインのコンテンツに対する、利用者の興味の度合いを推定する。
【0089】
これにより、検索装置100は、所定のドメインのコンテンツに対する、利用者の興味の度合いを精度よく推定することができる。
【0090】
また、上述したように、スコア算出部133は、利用者からの検索クエリおよび利用者の情報と、所定のドメインのコンテンツに対する利用者の興味の度合いとの関連性を学習したモデルを用いて、所定のドメインのコンテンツに対する、利用者の興味の度合いを推定してもよい。
【0091】
これにより、検索装置100は、所定のドメインのコンテンツに対する、利用者の興味の度合いを推定する際、利用者の情報(例えば、利用者の年代、性別、購入履歴等の情報)を考慮して推定することができる。その結果、検索装置100は、所定のドメインのコンテンツに対する、利用者の興味の度合いをより精度よく推定することができる。
【0092】
また、上述したように、検索装置100の用いるモデルは、利用者から検索クエリを受け付けた際、検索クエリによる検索の結果であるコンテンツのうち、利用者により選択されたコンテンツのドメインを示したログに基づいて学習されたモデルである。
【0093】
これにより、検索装置100は、所定のドメインのコンテンツに対する、利用者の興味の度合いを推定する際、過去に利用者がどの検索クエリでコンテンツの検索を行い、その中からどのコンテンツを選択したかを反映したモデルに基づき、推定することができる。その結果、検索装置100は、所定のドメインのコンテンツに対する、利用者の興味の度合いをより精度よく推定することができる。
【0094】
また、上述したように、検索装置100の用いるモデルは、上記のログに基づき、検索クエリによる検索の結果であるコンテンツのうち、どのドメインのコンテンツが何回選択されたかのカウント結果を反映したモデルであってもよい。
【0095】
これにより、検索装置100は、所定のドメインのコンテンツに対する、利用者の興味の度合いを推定する際、過去に利用者がどの検索クエリでコンテンツの検索を行い、その中からどのコンテンツを何回選択したかを反映したモデルに基づき、推定することができる。その結果、検索装置100は、所定のドメインのコンテンツに対する、利用者の興味の度合いをより精度よく推定することができる。
【0096】
また、上述したように、検索装置100が用いる利用者の情報は、当該利用者の性別、年代、および、商品の購入履歴の少なくともいずれかの情報を含む。
【0097】
これにより、検索装置100は、所定のドメインのコンテンツに対する、利用者の興味の度合いを推定する際、当該利用者の性別、年代、行動履歴を考慮して推定することができる。
【0098】
また、上述したように、検索結果出力部136は、スコア算出部133により推定された興味の度合いが所定の閾値を超えるいずれか1つのドメインのコンテンツにおける検索クエリによる検索結果を、検索されたコンテンツの結果とともに出力する。
【0099】
これにより、検索装置100は、利用者にとって視認しやすい検索結果を提示することができる。
【0100】
また、上述したように、検索結果出力部136は、スコア算出部133により推定された興味の度合いが所定の閾値を超える複数のドメインのコンテンツにおける検索クエリによる検索結果を、検索されたコンテンツの結果とともに出力する。
【0101】
これにより、検索装置100は、利用者にとって興味の度合いが高いと思われる複数のドメイン検索結果を提示することができる。
【0102】
また、上述したように、検索結果出力部136は、推定された度合いが所定の閾値を超えるドメインのうち、電子商店街のドメインのコンテンツにおける検索クエリによる検索結果を、検索されたコンテンツの結果とともに出力してもよい。
【0103】
これにより、検索装置100は、検索クエリに入力された商品を購入可能な電子商店街における検索結果を提示することができる。
【0104】
また、上述したように、電子商店街のドメインのコンテンツにおける検索クエリによる検索結果は、当該コンテンツにおいて検索された商品の情報および画像の組を並べて表示した情報であってもよい。
【0105】
これにより、検索装置100は、検索クエリに入力された商品を購入可能な電子商店街における検索結果を、利用者が視認しやすい状態で表示することができる。
【0106】
また、上述したように、当該コンテンツにおいて検索された商品の情報および画像の組は、利用者の操作に応じて変更可能に表示されてよい。
【0107】
これにより、検索装置100は、検索クエリに入力された商品を購入可能な電子商店街における検索結果が多数の商品の情報を含む場合であっても、利用者が視認しやすい状態で表示することができる。
【0108】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【符号の説明】
【0109】
1 検索システム
10 端末装置
100 検索装置
110 通信部
120 記憶部
130 制御部
131 モデル生成部
132 取得部
133 スコア算出部
134 判定部
135 検索結果取得部
136 検索結果出力部