特許第6783133号(P6783133)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許6783133情報処理装置、情報処理方法、およびプログラム
<>
  • 特許6783133-情報処理装置、情報処理方法、およびプログラム 図000002
  • 特許6783133-情報処理装置、情報処理方法、およびプログラム 図000003
  • 特許6783133-情報処理装置、情報処理方法、およびプログラム 図000004
  • 特許6783133-情報処理装置、情報処理方法、およびプログラム 図000005
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6783133
(24)【登録日】2020年10月23日
(45)【発行日】2020年11月11日
(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム
(51)【国際特許分類】
   G06F 16/9032 20190101AFI20201102BHJP
【FI】
   G06F16/9032
【請求項の数】20
【全頁数】13
(21)【出願番号】特願2016-240883(P2016-240883)
(22)【出願日】2016年12月13日
(65)【公開番号】特開2018-97560(P2018-97560A)
(43)【公開日】2018年6月21日
【審査請求日】2019年3月25日
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100181124
【弁理士】
【氏名又は名称】沖田 壮男
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】堀野 将晴
(72)【発明者】
【氏名】山本 浩司
【審査官】 齊藤 貴孝
(56)【参考文献】
【文献】 国際公開第2015/132970(WO,A1)
【文献】 米国特許出願公開第2009/0187515(US,A1)
【文献】 特開2014−006620(JP,A)
【文献】 特表2008−538149(JP,A)
【文献】 米国特許第08583675(US,B1)
【文献】 米国特許出願公開第2011/0208730(US,A1)
【文献】 米国特許第08122011(US,B1)
【文献】 米国特許第09342626(US,B1)
【文献】 原田 尚幸, 他3名,評価値の離散変化追跡によるランキングモデルの最適化に関する一考察,電子情報通信学会技術研究報告,社団法人電子情報通信学会,2010年 3月 2日,第109巻, 第461号,p.461-466
【文献】 橋本 泰平、外1名,類似語の例示を用いた多義的クエリの曖昧性解消手法,第8回データ工学と情報マネジメントに関するフォーラム (第14回日本データベース学会年次大会) [online],日本,電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2016年 3月 2日,p.1−8
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00−16/958
(57)【特許請求の範囲】
【請求項1】
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習する学習部と、
前記学習部により学習された素性の重みに基づいて、前記サジェストクエリを順位付けする順位付け部と、
を備え、
前記素性は、前記入力されたクエリと選択されたサジェストクエリのペアをキーとして集計した検索数を含む、
情報処理装置。
【請求項2】
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習する学習部と、
前記学習部により学習された素性の重みに基づいて、前記サジェストクエリを順位付けする順位付け部と、
を備え、
前記素性は、前記サジェストクエリが選択された前提での前記入力されたクエリの検索数を含む、
情報処理装置。
【請求項3】
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習する学習部と、
前記学習部により学習された素性の重みに基づいて、前記サジェストクエリを順位付けする順位付け部と、
を備え、
前記素性は、前記サジェストクエリと前記入力されたクエリの差分の文字列で求めたCTRを含む、
情報処理装置。
【請求項4】
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習する学習部と、
前記学習部により学習された素性の重みに基づいて、前記サジェストクエリを順位付けする順位付け部と、
を備え、
前記素性は、前記サジェストクエリを使わずに前記入力されたクエリが検索された検索数を含む、
情報処理装置。
【請求項5】
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習する学習部と、
前記学習部により学習された素性の重みに基づいて、前記サジェストクエリを順位付けする順位付け部と、
を備え、
前記素性は、前記入力されたクエリのみで検索された場合と、前記サジェストクエリで検索された場合とを含む検索クエリで検索をした時の商品ヒット数を含む、
情報処理装置。
【請求項6】
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習する学習部と、
前記学習部により学習された素性の重みに基づいて、前記サジェストクエリを順位付けする順位付け部と、
を備え、
前記素性は、前記入力されたクエリのみで検索された場合と、前記サジェストクエリで検索された場合とを含む検索クエリに関するランキング結果を含む、
情報処理装置。
【請求項7】
前記学習部は、前記クエリごとに前記サジェストクエリの素性の重みを学習し、
前記順位付け部は、前記クエリごとに前記サジェストクエリを順位付けする、
請求項1から6のうちいずれか1項記載の情報処理装置。
【請求項8】
前記サジェストクエリの集合は、利用者によって選択された場合に正例、選択されなかった場合に負例と区別がなされており、
前記学習部は、サポートベクタマシンを用いて素性の重みを学習し、判定が間違ったサンプルの超平面からの距離の合計が少なくなるように超平面を求める、
請求項1から7のうちいずれか1項記載の情報処理装置。
【請求項9】
コンピュータが、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習し、
前記学習した素性の重みに基づいて、前記サジェストクエリを順位付けし、
前記素性は、前記入力されたクエリと選択されたサジェストクエリのペアをキーとして集計した検索数を含む、
情報処理方法。
【請求項10】
コンピュータが、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習し、
前記学習した素性の重みに基づいて、前記サジェストクエリを順位付けし、
前記素性は、前記サジェストクエリが選択された前提での前記入力されたクエリの検索数を含む、
情報処理方法。
【請求項11】
コンピュータが、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習し、
前記学習した素性の重みに基づいて、前記サジェストクエリを順位付けし、
前記素性は、前記サジェストクエリと前記入力されたクエリの差分の文字列で求めたCTRを含む、
情報処理方法。
【請求項12】
コンピュータが、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習し、
前記学習した素性の重みに基づいて、前記サジェストクエリを順位付けし、
前記素性は、前記サジェストクエリを使わずに前記入力されたクエリが検索された検索数を含む、
情報処理方法。
【請求項13】
コンピュータが、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習し、
前記学習した素性の重みに基づいて、前記サジェストクエリを順位付けし、
前記素性は、前記入力されたクエリのみで検索された場合と、前記サジェストクエリで検索された場合とを含む検索クエリで検索をした時の商品ヒット数を含む、
情報処理方法。
【請求項14】
コンピュータが、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習し、
前記学習した素性の重みに基づいて、前記サジェストクエリを順位付けし、
前記素性は、前記入力されたクエリのみで検索された場合と、前記サジェストクエリで検索された場合とを含む検索クエリに関するランキング結果を含む、
情報処理方法。
【請求項15】
コンピュータに、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習させ、
前記学習させた素性の重みに基づいて、前記サジェストクエリを順位付けさせ、
前記素性は、前記入力されたクエリと選択されたサジェストクエリのペアをキーとして集計した検索数を含む、
プログラム。
【請求項16】
コンピュータに、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習させ、
前記学習させた素性の重みに基づいて、前記サジェストクエリを順位付けさせ、
前記素性は、前記サジェストクエリが選択された前提での前記入力されたクエリの検索数を含む、
プログラム。
【請求項17】
コンピュータに、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習させ、
前記学習させた素性の重みに基づいて、前記サジェストクエリを順位付けさせ、
前記素性は、前記サジェストクエリと前記入力されたクエリの差分の文字列で求めたCTRを含む、
プログラム。
【請求項18】
コンピュータに、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習させ、
前記学習させた素性の重みに基づいて、前記サジェストクエリを順位付けさせ、
前記素性は、前記サジェストクエリを使わずに前記入力されたクエリが検索された検索数を含む、
プログラム。
【請求項19】
コンピュータに、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習させ、
前記学習させた素性の重みに基づいて、前記サジェストクエリを順位付けさせ、
前記素性は、前記入力されたクエリのみで検索された場合と、前記サジェストクエリで検索された場合とを含む検索クエリで検索をした時の商品ヒット数を含む、
プログラム。
【請求項20】
コンピュータに、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習させ、
前記学習させた素性の重みに基づいて、前記サジェストクエリを順位付けさせ、
前記素性は、前記入力されたクエリのみで検索された場合と、前記サジェストクエリで検索された場合とを含む検索クエリに関するランキング結果を含む、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
従来、ショッピングシステム(電子店舗)におけるサジェストクエリの順位付けを行う技術が開示されている(特許文献1参照)。この技術では、商品情報の表示順位が、リスティングスコアに基づいて決定される。リスティングスコアは、商品またはその商品の商品ページに対して決定された評価を示す値である。リスティングスコアは、商品ページに対するアクセス数(閲覧数)が多いほどリスティングスコアが高くなったり、商品の購入数が多いほどリスティングスコアが高くなったりするように決定される。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2013−050905号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、例えば、複数の電子店舗が登録されたポータルサイトにおいて運用を行った場合、特定の店舗が意図的に、自身の商品ページのアクセス数が多くなるように操作を行う場合があり、サジェストクエリを適切に順位付けすることができない場合があった。
【0005】
本発明は、このような事情を考慮してなされたものであり、より適切にサジェストクエリを順位付けすることが可能な情報処理装置、情報処理方法、およびプログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0006】
本発明の一態様は、電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習する学習部と、前記学習部により学習された素性の重みに基づいて、前記サジェストクエリを順位付けする順位付け部と、を備える情報処理装置である。
【発明の効果】
【0007】
本発明の一態様によれば、より適切にサジェストクエリを順位付けすることができる。
【図面の簡単な説明】
【0008】
図1】情報処理装置の一例であるランキング管理装置100の構成および使用環境を示す図である。
図2】電子店舗サーバ20により提供されるインターフェース画面の一例を示す図である。
図3】学習用データ154の内容の一例を模式的に示す図である。
図4】学習部120および順位付け部130により実行される処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。実施形態の情報処理装置は、一以上のプロセッサによって実現される。情報処理装置は、ネットワークを介して商品またはサービス(以下、商品等)を販売する電子店舗において、入力されたクエリ(以下、入力クエリ)に対して提示されるサジェストクエリの順位付けを行う装置である。情報処理装置は、正例、負例の区別がなされたサジェストクエリの集合に基づいて、例えば入力クエリごとにサジェストクエリの素性の重みを学習し、学習した素性の重みに基づいて、例えば入力クエリごとにサジェストクエリを順位付けする。なお、情報処理装置と、電子店舗を運営する装置とは別体の装置である必要はなく、これらは一つのプロセッサによって実現されてもよい。以下、情報処理装置の機能について段階的に開示する。
【0010】
図1は、情報処理装置の一例であるランキング管理装置100の構成および使用環境を示す図である。ランキング管理装置100は、ネットワークNWに接続される。ネットワークNWは、例えば、無線基地局、Wi−Fiアクセスポイント、通信回線、プロバイダ、インターネットなどを含む。ネットワークNWには、一以上の端末装置10および電子店舗サーバ20が接続される。なお、必ずしも端末装置10とランキング管理装置100が通信可能である必要は無く、ネットワークNWは幾つかのサブネットワークに分割されていてもよい。
【0011】
端末装置10は、電子店舗を利用する利用者によって使用される端末装置である。端末装置10としては、例えば、スマートフォンなどの携帯電話、パーソナルコンピュータ、タブレット端末などが使用される。端末装置10では、ウェブブラウザやニュースアプリなどのUA(User Agent)が起動し、電子店舗サーバ20にアクセスする。
【0012】
電子店舗サーバ20は、電子店舗を運営するサーバ装置である。電子店舗サーバ20は、ウェブサーバ、アプリサーバ、その他の形態で動作する。電子店舗サーバ20は、端末装置10の利用者にネットワークNW上での買い物を可能とするためのインターフェース画面を、端末装置10に提供する。
【0013】
図2は、電子店舗サーバ20により提供されるインターフェース画面の一例を示す図である。この画面には、入力クエリを入力するためのクエリ入力窓QWが設定される。クエリ入力窓QWに入力クエリが入力されると、例えば、入力クエリに対して他のワードが追加されたサジェストクエリの一覧情報であるサジェストクエリ一覧SQLが表示される。サジェストクエリ一覧SQLに表示されるサジェストクエリの順序は、ランキング管理装置100により行われた順位付けに基づいて決定される。サジェストクエリが選択された状態で検索ボタンSBが操作されると、選択されたサジェストクエリを用いて検索した結果を表示する画面に遷移する。このようにして電子店舗における買い物が開始される。
【0014】
電子店舗サーバ20は、利用者によって検索が行われる度に、入力クエリに対して提示したサジェストクエリ、および、検索の度にサジェストクエリ一覧SQLの中で選択されたサジェストクエリの情報などを、ログ情報22として記憶部に蓄積する。ログ情報22には、これらの情報の他、最終的に商品の購入に至ったか、などの利用者の購買行動に関する情報が含まれてよい。
【0015】
図1に戻り、ランキング管理装置100は、例えば、情報管理部110と、学習部120と、順位付け部130とを備える。これらの機能部は、例えば、CPU(Central Processing Unit)などのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの機能部のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアが協働するものであってもよい。
【0016】
また、ランキング管理装置100は、記憶部150を備える。記憶部150は、例えば、HDD(Hard Disk Drive)やフラッシュメモリ、RAM(Random Access Memory)、ROM(Read Only Memory)などによって実現される。記憶部150には、ランキングデータ152、学習用データ154、重みデータ156などの情報が格納される。
【0017】
図1に示すランキング管理装置100の構成は、適宜、分散化されてもよい。例えば、学習部120と順位付け部130は、独立したプロセッサによって実現されてもよいし、記憶部150は、ランキング管理装置100からネットワークNWを介してアクセス可能なNAS(Network Attached Storage)であってもよい。また、電子店舗サーバ20とランキング管理装置100は統合されて一つのプロセッサで実現されてもよい。
【0018】
情報管理部110は、電子店舗サーバ20からログ情報22を取得し、適宜、加工を加えて学習用データ154として記憶部150に記憶させる。
【0019】
学習部120は、学習用データ154に基づいて、例えば入力クエリごとに、サジェストクエリの素性の重みを学習する。図3は、学習用データ154の内容の一例を模式的に示す図である。図示するように、学習用データ154は、入力クエリごとに、検索が行われた度に、提示されたサジェストクエリと、その中で選択されたサジェストクエリとを対応付けた情報である。選択されたサジェストクエリには正例である旨を示すフラグが、選択されなかったサジェストクエリには負例である旨を示すフラグが、それぞれ付されている。
【0020】
サジェストクエリの素性とは、例えば、以下に示すもののうち一部または全部を含む。以下において、括弧内のバイナリ、対数値、実数値とは、説明文で表される内容をどのような数値形式で扱うかを示している。
【0021】
1.編集距離(バイナリ)
この素性は、一文字の挿入・削除・置換によって、一方の文字列(入力クエリ)をもう一方の文字列(サジェストクエリ)に変形するのに必要な手順の最小回数である。編集距離は、例えば、編集距離が[0〜2,3〜4,5〜6,7〜8,9〜10,11〜12,13〜15,16〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
【0022】
2.表示位置(バイナリ)
この素性は、固定数が提示されるサジェストクエリのうち、何番目のサジェストクエリが選択されたかを示す情報である。
【0023】
3.サジェストクエリの文字長(バイナリ)
この素性は、サジェストクエリの文字数が所定数(例えば15)以上であるか、所定数未満であるかを示す情報である。
【0024】
4.サジェストクエリのトークン数(実数)
この素性は、サジェストクエリを形態素解析して得られるトークン数である。トークンとは、分解できない文字列の並びの最小単位である。
【0025】
5.入力クエリと選択されたサジェストクエリのペアをキーとして集計した検索数(バイナリ)
この素性は、例えば、検索数が、[0〜2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
【0026】
6.サジェスト実績CTR(Click Through Ratio)(実数)
この素性は、サジェストクエリの選択回数を検索数で除算した値で表される。
【0027】
7.サジェストクエリが選択された前提での入力クエリの検索数(バイナリ)
この素性は、例えば、その検索数が、[0〜10,11〜50,51〜100,101〜1000,1001〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
【0028】
8.サジェストクエリと入力クエリの差分の文字列で求めたCTR(実数)
この素性は、例えば、入力クエリを「スマートフォン」、サジェストクエリを「スマートフォン ケース」とした場合、「ケース」に関するCTRである。
【0029】
9.サジェストクエリを使わずに入力クエリが検索された検索数(バイナリ)
この素性は、例えば、検索数が、[0,1,2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
【0030】
10.検索クエリ(入力クエリのみで検索された場合と、サジェストクエリで検索された場合を含む)の検索数(バイナリ)
この素性は、例えば、その検索数が、[0〜2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
【0031】
11.検索クエリで検索をした時の検索結果の商品リンクのクリック数(バイナリ)
この素性は、1リクエストに最大1クリックまで数えられ、[0〜2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
【0032】
12.検索クエリで検索をした時の検索結果の商品リンクのクリック総数(バイナリ) この素性は、商品詳細ページのリンク数全てのクリックを数えたものである。最大値は表示された商品リンク数と同じ数になる。この数は、[0〜2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
【0033】
13.検索クエリで検索をした時の商品詳細のCTR(実数)
この素性は、商品リンクのクリック数(複数リンクをクリックしても1としてカウント)を、リクエスト数で除算した値で表される。
【0034】
14.検索クエリで検索をした時の商品詳細のiCTR(実数)
この素性は、商品リンクのクリック数を、商品詳細のリンク数で除算した値で表される。
【0035】
15.検索クエリで検索をした時の商品詳細のClick Per Request(対数)
この素性は、1リクエストにどのくらいの商品詳細リンクがクリックされたかで表される。最大値はクリック数分となる。
【0036】
16.検索クエリで検索をした時の商品ヒット数(対数)
【0037】
17.検索クエリが、検索数の多いクエリの上位所定数(例えば5000個)に該当するか否か(バイナリ)
この素性は、上記条件に該当する場合に1、該当しない場合にゼロで表される。
【0038】
18.検索クエリをスペース区切りにした文字列が、上位所定数(例えば5000個)に該当するか否か(バイナリ)
この素性は、上記条件に該当する場合に1、該当しない場合にゼロで表される。
【0039】
19.検索クエリを形態素解析して抜き出した名詞が、上位所定数(例えば5000個)に該当するか否か(バイナリ)
この素性は、上記条件に該当する場合に1、該当しない場合にゼロで表される。
【0040】
学習部120は、上記説明したサジェストクエリの素性の重みを学習する。学習用データ154は、検索のログ情報に基づいているため、同じサジェストクエリであっても正例になったり負例になったりすることがある。このため、学習部120は、例えば、SVM(Support Vector Machine;サポートベクタマシン)を用いて、判定が間違ったサンプルの超平面からの距離の合計が少なくなるように超平面を求める。
【0041】
順位付け部130は、学習部120により学習された素性の重みに基づいて、例えば入力クエリごとに、サジェストクエリを順位付けする。順位付けした結果は、電子店舗サーバ20に提供される。電子店舗サーバ20は、提供された順位付けの結果に基づいて、入力クエリに対して提示するサジェストクエリを決定する。これによって、サジェストクエリのCTRなどを向上させることができる。
【0042】
図4は、学習部120および順位付け部130により実行される処理の流れの一例を示すフローチャートである。まず、学習部120は、ランキングデータ152を読み込む(S100)。ランキングデータ152は、例えば入力クエリごとに、サジェストクエリを順位付けしたデータである。初期データとしてのランキングデータ152は、例えば、検索クエリの頻度順で並べられた所定数の(例えば200個の)サジェストクエリである。
【0043】
次に、学習部120が、SVMを学習用データ154に適用し、サジェストクエリの素性の重みを学習し(S102)、重みデータ156として記憶部150に記憶させる。順位付け部130は、学習された重みに基づいて、ランキングデータ152に含まれるサジェストクエリを順位付けし、ランキングデータを更新する(S104)。
【0044】
順位付け部130は、例えば、式(1)で表される評価値Scoreをサジェストクエリごとに算出し、評価値Scoreの高い順にサジェストクエリを順位付けする。式中、iは素性のインデックスであり、wは素性に対する重みであり、fはサジェストクエリの素性の値(例えば、前述した1〜19)である。
Score=Σw×f …(1)
【0045】
以下に具体例を示す。例えば、入力クエリが「iPhone」(登録商標)であり、素性として[6.サジェスト実績CTR]および[16.検索クエリで検索をした時の商品ヒット数]が採用されたものとする。そして、学習部120は、[6.サジェスト実績CTR]に対する重みwを0.5、[16.検索クエリで検索をした時の商品ヒット数]に対する重みw16を0.3と学習したものとする。
【0046】
この場合において、サジェストクエリ[iPhone ケース]について、[6.サジェスト実績CTR]が0.1、[16.検索クエリで検索をした時の商品ヒット数]が3(=log101000)であったとする。この場のサジェストクエリ[iPhone ケース]についての評価値Score(iPhone ケース)は、以下のように算出される。
Score(iPhone ケース)=0.5×0.1+0.3×3=0.95
【0047】
一方、サジェストクエリ[iPhone 7]について、[6.サジェスト実績CTR]が0.2、[16.検索クエリで検索をした時の商品ヒット数]が2(=log10100)であったとする。この場のサジェストクエリ[iPhone 7]についての評価値Score(iPhone 7)は、以下のように算出される。
Score(iPhone 7)=0.5×0.2+0.3×2=0.7
【0048】
上記のケースでは、Score(iPhone ケース)の方がScore(iPhone 7)よりも高い値となっている。このため、順位付け部130は、サジェストクエリ[iPhone ケース]のランキングをサジェストクエリ[iPhone 7]のランキングよりも高くする。
【0049】
本出願の出願人は、単に検索クエリの頻度順で並べられたサジェストクエリのランキングと比較して、実施形態の手法により各種の指標値が有意に向上したことを確認した。指標値には、平均サジェストCTR、平均サジェストMRR(mean Reciprocal Rank)などがある。
【0050】
以上説明した実施形態の情報処理装置、情報処理方法、およびプログラムによれば、電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、サジェストクエリの素性の重みを学習し、学習された素性の重みに基づいて、サジェストクエリを順位付けすることにより、より適切にサジェストクエリを順位付けすることができる。
【0051】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0052】
10 端末装置
20 電子店舗サーバ
22 ログ情報
100 ランキング管理装置(情報処理装置)
110 情報管理部
120 学習部
130 順位付け部
150 記憶部
152 ランキングデータ
154 学習用データ
156 重みデータ
図1
図2
図3
図4