(58)【調査した分野】(Int.Cl.,DB名)
クエリと、商品またはサービス(以下、商品等)のカテゴリとが対応付けられたカテゴリ情報を参照し、複数の商品等の情報を含む商品等情報から入力された入力クエリに対応付けられたカテゴリが付与された商品等を抽出する情報抽出部と、
情報を検索する検索装置が前記入力クエリを用いて前記商品等情報から抽出した商品等の情報と、前記情報抽出部により抽出された商品等の情報とに基づいて、前記検索装置の処理を評価する評価部と、
を備え、
前記情報抽出部は、更にクエリと、商品等の識別情報とが対応付けられた対応情報を参照し、前記商品等情報から前記入力クエリに対応付けられた識別情報が付与された商品等の情報を抽出し、
前記評価部は、更に、前記検索装置が前記入力クエリを用いて検索した検索結果に含まれる商品等の数と、前記検索結果に含まれる商品等であって、前記情報抽出部により抽出された商品等に付与された識別情報と同様の識別情報を有する商品等の数とに基づいて、前記検索装置の処理を評価する、
情報処理装置。
前記評価部は、前記検索装置が前記入力クエリを用いて検索した検索結果に含まれる商品等の数と、前記検索結果に含まれる商品等であって、前記情報抽出部により抽出された商品等に付与されたカテゴリと同様のカテゴリを有する商品等の数とに基づいて、前記検索装置の処理を評価する、
請求項1に記載の情報処理装置。
前記評価部は、更に、前記情報抽出部により抽出された商品等の数と、前記検索結果に含まれる商品等であって、前記情報抽出部により抽出された商品等に付与された識別情報と同様の識別情報を有する商品等の数とに基づいて、前記検索装置の処理を評価する、
請求項1または2に記載の情報処理装置。
前記検索装置は、前記評価部の評価結果に基づいて、前記商品等の情報に含まれる商品の説明を、前記商品等の情報に含まれる識別情報が同一の商品等の情報に含まれる商品の説明に置換する、
請求項1から3のうちいずれか1項に記載の情報処理装置。
取得した商品等の情報に対して候補となる候補カテゴリを決定し、決定した候補カテゴリをユーザに提示し、前記ユーザによって決定されたカテゴリと前記商品等の情報とを互いに対応付けて前記カテゴリ情報を生成するカテゴリ設定部を、更に備える、
請求項1から4のうちいずれか1項に記載の情報処理装置。
【発明を実施するための形態】
【0009】
以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。情報処理装置は、一以上のプロセッサによって実現される。情報処理装置は、クエリと、商品またはサービス(以下、商品等)のカテゴリとが対応付けられたカテゴリ情報を参照し、複数の商品等の情報を含む商品等情報から入力された入力クエリに対応付けられたカテゴリが付与された商品等を抽出する。そして、情報処理装置は、情報を検索する検索装置が入力クエリを用いて商品等情報から抽出した商品等の情報と、抽出した商品等の情報とに基づいて、検索装置の処理を評価する。これにより、検索結果を容易に評価することができる。
【0010】
<第1実施形態>
[構成]
図1は、情報処理システム1の構成の一例を示す図である。情報処理システム1は、例えば、一以上の検索装置10と、情報処理装置20とを備える。上記の検索装置10、および情報処理装置20は、ネットワークNWを介して互いに通信する。ネットワークNWは、例えば、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、専用回線、無線基地局、プロバイダなどを含む。検索装置10と情報処理装置20とは一体であってもよい。
【0011】
検索装置10は、例えば、記憶装置に記憶された複数の商品等の情報を含む商品等情報から入力クエリとの関連度が所定度合以上ある商品等情報を抽出する。商品等の情報とは、例えば、商品等の識別情報や、商品等の品名、商品等の説明、商品のカテゴリ等が互いに対応付けられた情報である。
【0012】
情報処理装置20は、例えば、通信部22と、第1抽出部24と、第2抽出部26と、制御部28と、評価部30と、記憶部40とを備える。第1抽出部24、第2抽出部26、制御部28、および評価部30は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサが、記憶装置に記憶されたプログラムを実行することにより実現される。また、これらの機能部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。また、上記のプログラムは、予め記憶装置に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体が情報処理装置20のドライブ装置に装着されることで記憶装置にインストールされてもよい。また、これらの機能部は、複数の装置に分散されて設けられてもよい。
【0013】
記憶部40は、例えば、ROM(Read Only Memory)、フラッシュメモリ、SDカード、RAM(Random Access Memory)、HDD(Hard Disc Drive)、レジスタ等によって実現される。また、記憶部40の一部または全部は、NASや外部ストレージサーバ等であってもよい。また、記憶部40には、商品等情報42、第1対応情報44(「カテゴリ情報」の一例)、第2対応情報46(「対応情報」の一例)、抽出情報48、検索結果情報50、および評価情報52が記憶されている(詳細は後述する)。
【0014】
通信部22は、例えば、NIC(Network Interface Card)等の通信インターフェースを含む。
【0015】
第1抽出部24は、クエリと、商品等の識別情報とが対応付けられた第1対応情報44を参照し、商品等情報42から入力されたから入力クエリに対応付けられた識別情報が付与された商品等の情報(例えば識別情報)を抽出する。商品等情報42は、検索装置10の記憶装置に記憶された商品等情報と同様の情報である。
【0016】
図2は、第1対応情報44の内容の一例を示す図である。第1対応情報44は、クエリ、およびそのクエリの識別情報が互いに対応付けられた情報である。第1対応情報44に含まれるクエリは、後述する第2対応情報46に含まれるクエリに比して、固有名詞に近いクエリである。第1対応情報44に含まれるクエリは、例えば「テレビ 商品名」や、「テレビ 型番」、「テレビ 商品等の特徴を示す情報」などの名詞である。
【0017】
識別情報は、例えば、JAN(Japan Article Number)コードや、ISBN(International Standard Book Number)などの流通において商品等を識別するために規格された識別情報である。例えば、第1抽出部24は、クエリ「テレビAAA」が入力された場合、識別情報「ID001」および商品等「SE001」を抽出する。例えば、第1抽出部24は、入力クエリが入力された場合、第1対応情報44において対応する識別情報を特定し、更に商品等情報42から特定した識別情報が付与された商品等の情報を抽出する。
【0018】
第2抽出部26は、クエリと、商品等のカテゴリとが対応付けられた第2対応情報46を参照し、商品等情報42から入力された入力クエリに対応付けられたカテゴリが付与された商品等の情報を抽出する。例えば、第2抽出部26は、第1抽出部24が第1対応情報44を参照して、クエリに対応付けられた商品等の情報を抽出できかった場合に、処理を実行してもいし、予め第1抽出部24の処理よりも優先度が高く設定されている場合に、第1抽出部24の処理よりも処理を優先してもよい。
【0019】
図3は、第2対応情報46の内容の一例を示す図である。第2対応情報46は、クエリ、およびそのクエリに対応する商品等が属するカテゴリが互いに対応付けられた情報である。第2対応情報46に含まれるクエリは、例えば、「テレビ」や、「エアコン」、「冷蔵庫」などの普通名詞である。例えば、第2抽出部26は、クエリ「テレビ」が入力された場合、第2対応情報46において対応するカテゴリを特定し、更に商品等情報42から特定したカテゴリが付与された商品等の情報を抽出する。
【0020】
制御部28は、第1抽出部24または第2抽出部26により抽出された商品等の情報と入力クエリとを互いに対応付けて抽出情報48として記憶部40に記憶させる。
【0021】
評価部30は、抽出情報48を用いて、検索装置10により抽出された検索結果情報50を評価する。検索結果情報50は、検索装置10が入力クエリを用いて、商品等情報から抽出した商品等の情報である。例えば、評価部30は、適合率(Precision)や再現率(Recall)を導出し、導出結果を評価情報52として記憶部40に記憶させる。
【0022】
適合率とは、例えば、(正解の商品等の数/検索装置10が入力クエリを用いて検索した検索結果に含まれる商品等の数)である。正解の商品等とは、検索装置10の検索結果に含まれる商品等であって、第2抽出部26により抽出された商品等に付与されたカテゴリと同様のカテゴリを有する商品等である。また、正解の商品等とは、検索装置10の検索結果に含まれる商品等であって、第1抽出部24により抽出された商品等に付与された識別情報と同様の識別情報を有する商品等である。再現率とは、例えば、(正解の商品等の数/第1抽出部24または第2抽出部26により抽出された商品等の数)である。
【0023】
[フローチャート]
図4は、情報処理装置20により実行される処理の流れの一例を示すフローチャートである。まず、第1抽出部24が、第1対応情報44を参照し、入力クエリを用いて入力クエリの識別情報を特定することができるか否かを判定する(S10)。識別情報が特定された場合、S14の処理に進む。
【0024】
識別情報が特定されない場合、第2抽出部26は、第2対応情報46を参照し、入力クエリを用いて入力クエリのカテゴリを特定することができるか否かを判定する(S12)。カテゴリが特定された場合(またはS10で識別情報が特定された場合)、制御部28は、特定結果に基づいて、商品等情報42から商品等の情報を抽出し、入力クエリと商品等の情報とを互いに対応付けて抽出情報48として記憶部40に記憶させる(S14)。
【0025】
S10で識別情報が特定されず、且つ、S12でカテゴリが特定されなかった場合、商品等の特定は不可として、入力クエリと処理結果とを互いに対応付けて記憶部40に記憶させる(S16)。なお、クエリと、特定不可を示すラベルとが互いに対応付けられた特定不可情報が記憶部40に記憶されていてもよい。この場合、情報処理装置20は、特定不可情報を参照して、入力クエリに対応する商品等の情報を特定できないと判定してもよい。特定不可を示すラベルが付与されるクエリは、例えば、「替えのベルト」などのように、複数のカテゴリの商品等において使用される可能性が存在する商品等やパーツ等を示すクエリである。これにより本フローチャートの1ルーチンの処理は終了する。
【0026】
そして、評価部30は、上述した処理結果と、検索装置10の検索結果とを用いて、検索装置10を評価する。
【0027】
[処理結果]
図5は、比較例の情報処理装置の処理結果の一例を示す図である。例えば、情報処理装置は、入力クエリと、入力クエリに関連する情報としてユーザに提供された過去の履歴情報とに基づいて、ユーザに提供する商品等を決定する。履歴情報とは、例えば、検索装置の表示部に検索装置10の検索結果である商品等が表示された回数のうちクリックされた回数(クリック数)の割合を示すCTR(Click Through Rate)や、アクセス数(またはユーザ)のうち商品を購入等した回数の割合を示すCVR(Conversion Rate)である。
【0028】
例えば、入力クエリ「テレビ(またはテレビ AAA)」を入力したユーザが、テレビ台やテレビを壁に掛けるためのテレビ用金具を購入したり、詳細を閲覧したりする割合が高いことがある。このような履歴情報が取得された場合、情報処理装置は、例えば、入力クエリに対してCTRやCVRが高い商品等の情報を抽出する場合がある。例えば、情報処理装置は、
図5に示すように入力クエリ「テレビ(またはテレビ AAA)」に関連する情報として、テレビ台やテレビ用金具の情報をユーザに提供する場合がある。
【0029】
また、例えば、検索結果を参照し、人手で検索結果に含まれる各商品等が検索結果に含めるべき商品等であるか否かを判断し、判断結果を検索装置10の検索処理に反映させることができるが、コストが高くなることがある。このため、本実施形態では、情報処理装置20の処理結果を用いて判断や評価を行う。
【0030】
図6および
図7は、本実施形態の情報処理装置20の処理結果の一例を示す図である。本実施形態の情報処理装置20は、第1対応情報44を参照して、入力クエリに対する識別情報を特定し、特定結果を用いて商品等を抽出する。これにより、情報処理装置20は、
図6に示すように入力クエリ「テレビ AAA」に対して、その入力クエリに対応付けられた識別情報を有するテレビを抽出することができる。
【0031】
また、本実施形態の情報処理装置20は、第2対応情報46を参照して、入力クエリに対するカテゴリを特定し、特定結果を用いて商品等を抽出する。これにより、情報処理装置20は、
図7に示すように入力クエリ「テレビ」に対して、その入力クエリに対応付けられたカテゴリを有する商品等(テレビ)を抽出することができる。
【0032】
そして、情報処理装置20は、入力クエリを用いて抽出した商品等の情報と、検索装置10の検索結果である商品等の情報とを比較し、検索装置10の検出結果を容易に評価することができる。
【0033】
なお、本実施形態の情報処理装置20は、検索装置10の検索結果と共に、検索装置10により抽出された商品等情報が画像において設定される領域の位置を取得してもよい。この場合、情報処理装置20は、設定される領域の位置に対して設定された重みを加味して、検出結果を評価してもよい。これにより、例えば、ユーザにとって目につきやすい位置に、第1対応情報44または第2対応情報46に含まれる入力クエリに対応付けられた商品等の情報が設定されている場合、そうでない場合に比べて評価が高くなる傾向となり、上記とは反対の場合には評価が低くなる傾向となる。この結果、より精度よく検索装置10の検索結果を評価することができる。
【0034】
以上説明した第1実施形態によれば、情報処理装置20が、第1対応情報を参照し、商品等を抽出し、第2対応情報を参照し、商品等を抽出し、抽出結果を用いて、検索装置10の検索結果を評価することにより、より容易、且つ精度よく検索装置10の検索結果を評価することができる。
【0035】
<第2実施形態>
以下、第2実施形態について説明する。第2実施形態では、検索装置10は、情報処理装置20の評価結果を反映して検索を実行する。以下、第1実施形態との相違点について説明する。
【0036】
図8は、検索装置10の処理の内容を模式的に示す図である。検索装置10は、入力クエリを用いて、商品等情報から商品等の情報を抽出する。例えば、検索装置10は、入力クエリの単語と一致する単語が、商品等情報の商品名と商品説明とのうちいずれかに含まれている場合に、その商品を抽出する対象の商品と判定する。
【0037】
図8の(1)において、商品等情報に含まれる商品名ABCの商品説明は「null」である。この場合、例えば、検索装置10は、入力クエリ「ABC パズル」を用いて検索を行った場合、識別情報「1111」の商品名「ABC」の商品等情報は抽出できない。
【0038】
情報処理装置20が、上記のように処理を実行する検索装置10の処理結果を評価した場合、検索結果が所定の基準を満たしていないと判定した場合、検索装置10に検索結果が基準を満たしていなことを通知(改善通知)する。基準を満たしていないとは、本来、抽出すべき商品等の情報が抽出されなかったことである。本来、抽出すべき商品等の情報とは、例えば、第1対応情報44または第2対応情報46において入力クエリに対応付けられた識別情報またはカテゴリが付与された商品等の情報である。また、基準を満たしていないとは、再現率や適合率が所定値未満であることや、正解となる商品等の情報の数が所定値以下であってもよい。
【0039】
検索装置10は、上記の改善通知を取得した場合、
図8の(2)に示すような処理を行う。検索装置10は、例えば、本来、抽出すべき商品等の情報を取得し、取得した商品等の情報の商品説明が「null」である商品等の情報の識別情報と、合致する識別情報を有し、且つ商品説明が存在する商品等の情報を抽出する。そして、検索装置10は、「null」である商品説明を、抽出した商品等の商品説明に置換する。これにより、商品説明には、「パズル」という単語が含まれる。
【0040】
上述したように、検索装置10が、商品説明を他の商品説明で補完することにより、所定の入力クエリを用いて、これまで抽出できなかった商品等の情報を抽出することができる。この結果、情報処理装置20は、検索結果が所定の基準を満たすように改善することができる。
【0041】
以上説明した第2実施形態によれば、検索装置10が、情報処理装置20の評価結果に基づいて、商品説明を他の商品説明で補完することにより、検索結果の精度をより向上させることができる。
【0042】
<第3実施形態>
以下、第3実施形態について説明する。第3実施形態の情報処理装置20Aは、第2対応情報46を生成する。以下、第1実施形態との相違点について説明する。
【0043】
図9は、情報処理装置20Aの機能構成の一例を示す図である。情報処理装置20Aは、第1実施形態の情報処理装置20の機能構成に加え、カテゴリ設定部32および入出力部34を備える。カテゴリ設定部32は、取得した商品等の情報(例えば商品名や、商品の画像等)と、過去にユーザによって選択された商品のカテゴリとに基づいて、候補となる候補カテゴリを設定し、設定したカテゴリを入出力部34に出力させる。
【0044】
入出力部34は、例えば画像を表示する表示部と、ユーザの操作を受け付ける受付部とを含む。例えば、ユーザは、表示部により表示された、商品の画像や商品名等を参照し、候補カテゴリのうちから、適切なカテゴリを選択する。そして、カテゴリ設定部32は、ユーザに選択されたカテゴリと、商品等情報とを対応付けて第2対応情報46を生成する。
【0045】
以上説明した実施形態の情報処理装置20は、クエリと、商品またはサービス(以下、商品等)のカテゴリとが対応付けられたカテゴリ情報を参照し、複数の商品等の情報を含む商品等情報から入力された入力クエリに対応付けられたカテゴリが付与された商品等を抽出する第2抽出部26と、情報を検索する検索装置が前記入力クエリを用いて商品等情報から抽出した商品等の情報と、第2抽出部26により抽出された商品等の情報とに基づいて、前記検索装置の処理を評価する評価部30とを備えることにより、検索結果を容易に評価することができる。
【0046】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。