【文献】
アクセス数を狙って無関係なキーワードを商品説明に入れるのは楽天でNGに,[online],日本,Asa Kataoka Office,2012年 9月25日,[検索日2015.3.10],インターネット,URL,http://basara-company.biz/2012/09/25/rakuten-seo-spam/
(58)【調査した分野】(Int.Cl.,DB名)
一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照し、一つの前記キーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い、処理対象商品を抽出する処理対象商品抽出部と、
抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する適否判定部と、
前記不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する不適正キーワード対応処理部と、を備えた
情報処理装置。
前記不適正キーワード対応処理部は、前記不適正キーワード対応処理として、商品ページの情報が記憶されたデータベースにおいて、前記処理対象商品の商品ページに係る前記不適正キーワードの記載に対する適正化処理を実行する
請求項1に記載の情報処理装置。
一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照し、一つの前記キーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い、処理対象商品を抽出する手順と、
抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する手順と、
前記不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する手順とを
演算処理装置に実行させるプログラム。
一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照し、一つの前記キーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い、処理対象商品を抽出する手順と、
抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する手順と、
前記不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する手順とを
演算処理装置に実行させるプログラムを記憶した記憶媒体。
【発明を実施するための形態】
【0016】
本実施の形態においては、電子商取引サービスを提供する電子商取引サーバと、商品に紐付けられたキーワードなどの適正を判断する商品監視サーバを例に説明する。
以下、実施の形態を次の順序で説明する。
【0017】
<1.全体構成>
<2.ハードウエア構成>
<3.各種データベース>
<4.処理の流れ>
<5.適否判定処理例>
[5−1.適否判定処理の第1例]
[5−2.適否判定処理の第2例]
[5−3.適否判定処理の第3例]
<6.不適正キーワード対応処理例>
[6−1.不適正キーワード対応処理の第1例]
[6−2.不適正キーワード対応処理の第2例]
[6−3.不適正キーワード対応処理の第3例]
[6−4.不適正キーワード対応処理の第4例]
<7.変形例>
<8.まとめ>
<9.プログラム及び記憶媒体>
【0018】
<1.全体構成>
本実施の形態の電子商取引サーバ1、商品監視サーバ2を含むネットワークシステム全体の構成を
図1及び
図2を用いて説明する。
図1に示すように、本実施の形態の電子商取引サーバ1は、通信ネットワーク3を介して、商品監視サーバ2、商品提供者端末4、ユーザ端末5と相互に通信可能な状態に接続されている。
【0019】
電子商取引サーバ1は、商品の取引に関する各種サービスを提供する情報処理装置である。各種サービスとは、例えば、当該電子商取引で扱っている商品群の中からユーザが所望する商品を検索して提示する商品検索サービスや、商品提供者が販売したい商品を管理する商品管理機能や、ユーザ情報を管理し必要に応じて提示するユーザ情報管理サービスや、商品提供者の情報を管理し必要に応じて提示する商品提供者情報管理サービスや、商品の売買が成立した際の代金のやりとりを仲介する決済処理サービスなどである。
【0020】
また、電子商取引サーバ1は、商品検索サービスを提供するために、検索に用いられるキーワード(検索キーワード)と扱っている商品を直接的、或いは、間接的に紐付けて管理している。直接的に紐付けて管理する例としては、検索キーワードごとに商品を紐付けて管理する。また、間接的に紐付けて管理する例としては、例えば、商品情報が記載されたウェブページ(以降、商品ページと記載)を商品に紐付けて管理する。これにより、商品ページに記載された情報を検索キーワードとして間接的に管理する。
【0021】
電子商取引サーバ1は、上記した各種のサービスを提供するために、様々なDB(Database)を管理している。例えば、ユーザの情報が記憶されるユーザDB100A、商品提供者の情報が記憶される商品提供者DB100B、商品情報が記憶される商品DB100C、商品ページの情報が記憶される商品ページDB100D、商品検索に用いられる検索DB100Eなどである。各DBについては、後述する。
【0022】
商品監視サーバ2は、電子商取引サーバ1によって各種商品に紐付け管理されている検索キーワードが適正であるか否かを判定し、不適正と判定した場合は、後述する各種処理を実行する。このために、商品監視サーバ2は、一つの商品に対して共に付与されにくい複数の検索キーワードのセット(以降、キーワードセットと記載)が記憶されたキーワードDB200Aを管理する。キーワードDB200Aの詳細については、後述する。
【0023】
商品監視サーバ2は、
図2に示すように、処理対象商品抽出部2aと、適否判定部2bと、不適正キーワード対応処理部2cと、更新処理部2dとを有している。
処理対象商品抽出部2aは、キーワードDB200Aに記憶されたキーワードセットを用いて検索DB100Eに記憶された情報を検索し、不適正な検索キーワードが紐付けられている可能性のある処理対象商品を抽出する。その際、キーワードDB200Aに記憶された例外商品情報などを利用する。
適否判定部2bは、抽出された処理対象商品に紐付けられている検索キーワードが不適正キーワードであるか否かを判定する。その際、商品DB100Cに記憶された商品情報や商品ページDB100Dに記憶された店舗情報などを利用して判定を行う。
【0024】
不適正キーワード対応処理部2cは、不適正キーワードとして判定された検索キーワードを用いた商品検索において、検索結果が適正なものとなるように不適正キーワード対応処理を行う。詳しくは、いくつかの処理例を後述する。
更新処理部2dは、キーワードDB200Aに記憶されたキーワードセットの更新や例外商品情報の更新を行う更新処理を実行する。
【0025】
図1の構成において、通信ネットワーク3の構成は特に限定されるものではなく、例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、CATV(Community Antenna TeleVision)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網などが想定される。
また通信ネットワーク3の全部又は一部を構成する伝送媒体についても多様な例が想定される。例えばIEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)、電力線搬送、電話線などの有線でも、IrDA(Infrared Data Association)のような赤外線、ブルートゥース(登録商標)、802.11無線、携帯電話網、衛星回線、地上波デジタル網などの無線でも利用可能である。
【0026】
図1に示す商品提供者端末4は、電子商取引サーバ1が提供するサービスを介して自身の商品の販売を行う商品提供者が利用する端末である。
商品提供者端末4では、必要に応じて各種の送受信処理などが実行される。
ユーザ端末5は、上記の各種サービスを享受するユーザが使用する情報処理装置であり、例えば、通信機能を備えたPC(Personal Computer)やフィーチャーフォンやPDA(Personal Digital Assistants)、或いは、スマートフォンやタブレット端末などのスマートデバイスなどである。
【0027】
<2.ハードウエア構成>
図3は、
図1に示した電子商取引サーバ1、商品監視サーバ2、商品提供者端末4及びユーザ端末5のハードウエアを例示する図である。それぞれのサーバや端末におけるコンピュータ装置のCPU(Central Processing Unit)101は、ROM(Read Only Memory)102に記憶されているプログラム、または記憶部108からRAM(Random Access Memory)103にロードされたプログラムに従って各種の処理を実行する。RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104には、入出力インターフェース105も接続されている。
入出力インターフェース105には、キーボード、マウス、タッチパネルなどよりなる入力装置106、LCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、有機EL(Electroluminescence)パネルなどよりなるディスプレイ、並びにスピーカなどよりなる出力装置107、HDD(Hard Disk Drive)やフラッシュメモリ装置などより構成される記憶部108、通信ネットワーク3を介しての通信処理や機器間通信を行う通信部109が接続されている。
入出力インターフェース105にはまた、必要に応じてメディアドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111が適宜装着され、リムーバブルメディア111に対する情報の書込や読出が行われる。
【0028】
このようなコンピュータ装置では、通信部109による通信によりデータやプログラムのアップロード、ダウンロードが行われたり、リムーバブルメディア111を介したデータやプログラムの受け渡しが可能である。
CPU101が各種のプログラムに基づいて処理動作を行うことで、電子商取引サーバ1、商品監視サーバ2、商品提供者端末4及びユーザ端末5のそれぞれにおいて後述する情報処理や通信が実行される。
尚、電子商取引サーバ1、商品監視サーバ2、商品提供者端末4及びユーザ端末5を構成するそれぞれの情報処理装置は、
図3のようなコンピュータ装置が単一で構成されることに限らず、システム化された複数のコンピュータ装置によって構成されてもよい。複数のコンピュータ装置は、LANなどによりシステム化されていてもよいし、インターネットなどを利用したVPN(Virtual Private Network)などにより遠隔地に配置されたものでもよい。
【0029】
<3.各種データベース>
ユーザDB100Aには、電子商取引サーバ1が提供するサービスを享受する各ユーザの情報が記憶される。
具体的には、例えば
図4に示すように、ユーザ情報として、ユーザID(Identification)やログインPW(Passward)、ユーザの氏名や住所や連絡先(電話番号やメールアドレス)などが記憶される。更に、ユーザごとの購入履歴や閲覧履歴などが記憶されてもよい。
尚、ユーザDB100Aには、上記した全ての情報が記憶されている必要はなく、ユーザによって記憶されていない情報があってもよい。但し、少なくともユーザIDとログインPWは記憶されていることが望ましい。
【0030】
商品提供者DB100Bには、電子商取引サーバ1を介して商品を提供する商品提供者の情報が記憶される。
具体的には、例えば
図5に示すように、商品提供者情報として、商品提供者ID、ログインPW、店舗名、店舗ロゴ、取扱商品の商品ID(電子商取引サーバ1が商品ごとに付与する商品固有のコード情報)、商品ページURL、商品ごとの価格、商品提供者ページのURL(Uniform Resource Locator)、連絡先(電話番号やメールアドレスなど)などが記憶される。商品ページURLは商品ページごとに付されるURLであり、同一商品であっても商品提供者が異なる場合には、異なる商品ページURLが付される。
店舗ロゴの情報は、画像データそのものでもよいし、保存されている画像データのリンク情報(URL情報)などでもよい。
また、取扱商品情報として、商品IDだけでなく商品の在庫情報などを記憶してもよい。
商品提供者ページのURLとしては、電子商取引サーバ1が提供する商品提供者ページだけでなく、他のサーバによって管理されている商品提供者のウェブページ(例えば店舗のHP(Homepage)など)が記憶されてもよい。
【0031】
商品DB100Cには、電子商取引サーバ1を介して売買が可能な各商品についての情報が記憶される。
具体的には、例えば
図6に示すように、商品情報として、商品ID、商品ジャンル、商品画像、製造者(メーカー)情報、製造者によって付与される型番情報、販売開始日、取扱商品提供者情報などが記憶される。
商品画像の情報は、画像データそのものでもよいし、保存されている画像データのリンク情報(URL情報など)でもよい。
また、商品DB100Cには、上記以外にも、生産地や商品のスペック(色、大きさ、性能情報)などが記憶されてもよい。
【0032】
商品ページDB100Dには、電子商取引サーバ1を介して売買が可能な各商品ごとの商品ページのHTML(HyperText Markup Language)データが記憶される。
具体的には、
図7Aに示すように、商品ページごとに、HTMLデータやHTMLデータに記載される画像データなどが紐付けられて記憶される。HTMLデータには、例えば
図7Bに示すように、商品名や型番情報、商品ID、価格情報、また、商品画像や商品の説明文などが、ウェブページ上における配置情報と共に記憶される。更に、HTMLデータには、購入する商品の個数を入力する欄などのいくつかの入力欄や、SNS(Social Networking Service)へ当該商品情報を投稿するためのボタンなどの情報も、ウェブページ上における配置情報と共に記憶される。
【0033】
検索DB100Eには、例えば
図8に示すように、検索キーワードと、当該検索キーワードを用いた商品検索によって抽出される商品ページの商品ページIDと、商品ページの優先度と、商品ページの適正フラグとが、紐付けられて記憶される。商品ページの適正フラグには、「適正」と「不適正」の2種類のステータスがあり、「不適正」とされた商品ページは、当該検索キーワードを用いた商品検索の検索結果として抽出されない。
検索DB100Eに記憶された各種の情報は、定期的に商品ページDB100Dをクローリングすることにより更新される。
【0034】
キーワードDB200Aには、前述したように、一つの商品に対して共に付与されにくい複数の検索キーワードのセットがキーワードセットとして記憶される。
具体的には、例えば
図9に示すように、キーワードセットIDに対して、複数の検索キーワードと、例外情報が紐付けて記憶される。
【0035】
複数のキーワードの例としては、例えば、キーワードセットIDがKS0001とされたキーワードセットに対して、ブランドA、ブランドB、ブランドC、ブランドDが紐付けられている。即ち、検索キーワードとしてのブランドA、ブランドB、ブランドC、ブランドDは、通常は一つの商品に紐付けられることが不適切として選択されたものである。即ち、これらの検索キーワードは、一つの商品に対して共に付与されにくいといえる。また、キーワードセットIDがKS0001とされたキーワードセットには、例外情報として商品ID0001が紐付けられている。商品ID0001は、複数のブランド商品を組み合わせて販売される商品のような、例えば福袋などの商品とされる。
また、キーワードセットID0002として、ブランドE、ブランドF、ブランドGが紐付けられている。更にキーワードセットIDがKS0002とされたキーワードセットには、例外情報としてブランドEとブランドGが紐付けられている。ブランドEとブランドGは、例えば姉妹ブランドなどとされ、一つの商品に対して共に紐付けられる可能性があるため、例外情報として記憶される。従って、この場合には、ブランドE、ブランドFの組合せが一つの商品に紐付けられている場合と、ブランドF、ブランドGの組合せが一つの商品に紐付けられている場合には、不適切とされる。
【0036】
更に、他のキーワードセットとして、キーワードセットIDがKS0154とされたキーワードセットには複数の著作者が紐付けられており、例外情報として、共著した本の商品IDが紐付けられている。
また、キーワードセットIDがKS0267とされたキーワードセットには複数の歌手が紐付けられ、例外情報として、複数の歌手の曲を一つのCD(Compact Disc)にまとめたオムニバスCDの商品ID(I2129)が紐付けられている。
【0037】
尚、キーワードセットは、例えば人手によって手動的に、或いは、演算処理装置によって自動的に、予め選定される。
自動的に選定を行う場合、例えば、商品ジャンルが被っているブランド名を選定し、キーワードセットとして登録することが考えられる。
また、キーワードセットには、2個以上であれば、3個、或いは4個の検索キーワードが紐付けられていてもよい。
【0038】
<4.処理の流れ>
電子商取引サーバ1が管理する各商品に対して、商品監視サーバ2が不適正キーワードを検出して対応するまでの処理の流れを、
図10を参照して説明する。
以下の説明では、「ブランドA」、「ブランドC」を含む複数の検索キーワードが紐付けられた「商品A」を用いて、具体的に説明する。
【0039】
先ず、ステップS101において、商品監視サーバ2の処理対象商品抽出部2aは、キーワードDB200aから一つのキーワードセット(例えば、キーワードセットIDがKS0001とされたキーワードセット)を取得する。尚、キーワードセットが複数ある場合、ステップS101は実行されるごとに重複しないように一つずつキーワードセットを取得する。
【0040】
次に、ステップS102において、処理対象商品抽出部2aは、ステップS101で取得したキーワードセット(キーワードセットID=KS0001)に属する複数の検索キーワード(例えば「ブランドA」、「ブランドB」、「ブランドC」、「ブランドD」)の中から一つ(例えば「ブランドA」)を選択する。
続いて、ステップS103において、処理対象商品抽出部2aは、ステップS102で選択した検索キーワードを用いた商品検索を行い、検索結果を取得する。商品検索は、例えば、検索DB100Eを対象として行う。このとき、適正フラグが「不適正」とされた商品ページは検索結果として抽出されない。
【0041】
次に、処理対象商品抽出部2aはステップS104において、ステップS101で取得したキーワードセット(キーワードセットID=KS0001)に紐付けられた複数の検索キーワードの中から、商品検索の検索結果を取得していない検索キーワードがあるか否かを判定する。検索結果を取得していない検索キーワードがある場合は、ステップS103、S104を繰り返し実行する。
【0042】
検索結果を取得していない検索キーワードがない場合は、ステップS101で取得したキーワードセット(キーワードセットID=KS0001)に紐付けられた検索キーワード全て(即ち、「ブランドA」、「ブランドB」、「ブランドC」、「ブランドD」の全て)に対して、商品検索の検索結果を取得したこととなる。
この場合、続くステップS105において処理対象商品抽出部2aは、ステップS103で取得した各検索キーワードに基づくそれぞれの検索結果に、同一の商品が含まれているか否かを判定する。同一の商品が含まれている場合、処理対象商品抽出部2aは、当該商品を処理対象商品と判定する。尚、同一の商品とは、同一の商品ページで販売されている商品であり、換言すれば、同一の商品提供者によって販売されている同一の商品となる。
【0043】
同一の商品が複数の検索結果に含まれていない場合、後述するステップS106乃至ステップS109を実行せずにステップS110の処理へ遷移する。
同一の商品が複数の検索結果に含まれている場合、当該商品には、一つの商品に対して共に紐付けられにくい複数の検索キーワードが紐付けられている。この場合、処理対象商品抽出部2aは続くステップS106において、当該商品が処理対象商品の例外に該当するか否かを判定する。具体的には、「ブランドA」を用いた商品検索の検索結果と「ブランドC」を用いた商品検索の検索結果に「商品A」が含まれている場合、「商品A」が処理対象商品の例外に該当するか否かを判定する。
【0044】
処理対象商品の例外とは、前述したように、複数の商品が含まれる福袋のような商品や姉妹ブランドを持つブランドの商品などである。また、二つの企業で共同開発したために双方の企業名が検索キーワードとして紐付けられた商品なども処理対象商品の例外とされる。例外についての情報は、例えば、キーワードDB200Aに記憶される。
当該商品、即ち、「商品A」が例外に該当すると判定した場合には、次にステップS109を実行する。
【0045】
「商品A」が例外に該当しないと判定した場合、適否判定部2bはステップS107において、ステップS106で処理対象商品と判定された「商品A」に紐付けられた検索キーワードに対する適否判定処理を実行する。適否判定処理では、処理対象商品に紐付けられたそれぞれの検索キーワードのうちで、先のステップS103で実行した商品検索に用いた検索キーワードのそれぞれが当該商品の検索キーワードとして適正であるか否かを判定する。具体的には、「商品A」に「ブランドA」、「ブランドC」、「日本製」、「木製」などの検索キーワードが紐付けられている場合、ステップS103で実行した商品検索の検索キーワードである「ブランドA」、「ブランドC」のそれぞれが、「商品A」の検索キーワードとして適正であるか否かを判定する。適否判定処理の具体的な処理内容に関しては、いくつかの例を後述する。
【0046】
次に、不適正キーワード対応処理部2cはステップS108において、処理対象商品が検索結果として抽出され難くする不適正キーワード対応処理を実行する。具体的には、「商品A」が検索結果として抽出され難くする処理を実行する。不適正キーワード対応処理に関しては、いくつかの例を後述する。
次に、ステップS109で商品監視サーバ2は、ステップS105において判定した複数の検索結果に含まれる同一の商品が他にあるか判定する。具体的には、「商品A」以外に複数の検索結果に含まれる商品があるか判定する。他の商品がある場合には、ステップS106乃至S109を繰り返し実行する。
他の商品が無い場合には、続くステップS110において商品監視サーバ2は、未調査のキーワードセット(即ち、ステップS102乃至S109の一連の処理が実行されていないキーワードセット)があるか否かを判定する。
未調査のキーワードセットがある場合、商品監視サーバ2はステップS101の処理を再び実行する。未調査のキーワードセットが無い場合、商品監視サーバ2は
図10に示す一連の処理を終了する。
【0047】
<5.適否判定処理例>
[5−1.適否判定処理の第1例]
ここでは、
図10のステップS107で説明した適否判定処理の例を説明する。
適否判定処理の第1例では、商品ページにおける検索キーワードの出現回数に基づいて、適否の判定を行う。具体的に、
図11を参照して説明する。
先ず、ステップS201において適否判定部2bは、商品ページDB100Dから、処理対象商品としての「商品A」の商品ページの構成を記載したHTMLファイルを取得し、HTMLファイル内に「ブランドA」が出現する回数をカウントする。
続いて、適否判定部2bはステップS202において、出現回数が閾値未満であるか否かを判定する。閾値未満であった場合、続くステップS203において適否判定部2bは「ブランドA」は「商品A」に紐付けられるべきでない不適正キーワードとして判定する。
一方、閾値以上であった場合、適否判定部2bはステップS204において、「ブランドA」は「商品A」に紐付けられていてもよい適正キーワードとして判定する。
【0048】
尚、HTMLファイル内に出現する回数の替わりに、商品ページに表示される個数としてもよい。これにより、商品ページには表示されないようにHTMLファイルに「ブランドA」という文言を記載して、当該商品が「ブランドA」という検索キーワードを用いた商品検索の検索結果として抽出されるようにした場合には、「ブランドA」という文言がカウントされず、カウント数が少なくなるため、不適正な検索キーワードとして判定されやすくなる。
【0049】
[5−2.適否判定処理の第2例]
適否判定処理の第2例では、商品が属するジャンルに基づいて、適否判定処理の第1例で述べた閾値を変更する。具体的に、
図12を参照して説明する。
先ず、適否判定部2bはステップS301において、処理対象商品としての「商品A」の商品ジャンル情報を取得する。
次に、適否判定部2bはステップS302において、商品ジャンルが特定のジャンルであるか否かを判定する。これは、例えば、キーワードDB200Aに記憶された情報を基に判断する。特定のジャンルであると判定した場合、適否判定部2bは続くステップS303において閾値を下げる。特定のジャンルに属する「商品A」に紐付けられたメーカー名の出現回数(HTMLファイル内や商品ページ内での出現回数)の閾値(適否判定処理の第1例で示した閾値)を下げる処理を実行する。
一方、特定のジャンルでないと判定した場合、
図12に示した一連の処理を終了する。
例えば、「商品A」のジャンル情報が「デスクトップパソコン」であった場合、「商品A」には様々なメーカーの部品が搭載されていることが予想される。
閾値を下げることにより、各メーカー名の出現回数が閾値を超えやすくなるため、不適正な検索キーワードとして判定されにくくすることができる。
【0050】
[5−3.適否判定処理の第3例]
適否判定処理の第3例では、商品ページにおける検索キーワードの出現態様に基づいて、適否判定を行う。具体的に、
図13を参照して説明する。
先ず、適否判定部2bはステップS401において、検索キーワードの出現態様を取得する。例えば、検索キーワードが文章中に出現するのか、或いは、羅列された検索キーワードとして出現するのかを取得する。
次に、適否判定部2bはステップS402において、ステップS401の取得結果が単語(検索キーワード)の羅列であるか否かを判定する。単語の羅列であった場合、適否判定部2bはステップS403において、当該検索キーワードを不適正キーワードとして判定する。
一方、単語の羅列でなかった場合、適否判定部2bはステップS404において、当該検索キーワードを適正キーワードとして判定する。
これにより、例えば、「○○と同品質を確保しつつ、低価格を実現!」という文章中にでてくる「○○」は、不適正な検索キーワードとして判定しない。しかし、「○○、△△、□□」のように、検索結果として当該商品が抽出されやすくするために「○○」、「△△」、□□」という検索キーワードを単に羅列したに過ぎない記載に対しては、不適正な検索キーワードとして判定する。
【0051】
<6.不適正キーワード対応処理例>
[6−1.不適正キーワード対応処理の第1例]
ここでは、
図10のステップS108で説明した不適正キーワード対応処理の例を説明する。
不適正キーワード対応処理の第1例では、検索DB100Eにおいて、検索キーワードが不適正キーワードとして判定された処理対象商品の商品ページと不適正キーワードの紐付けは維持したまま、不適正キーワードを用いた商品検索の検索結果として処理対象商品が抽出されないように情報を書き換える処理を行う。具体的には、
図8に示す検索DB100Eにおいて、不適正キーワードとして判定された検索キーワードに紐付けられた処理対象商品の商品ページの適正フラグを「適正」から「不適正」に変更する(
図14のステップS501)。
これにより、不適正キーワードを用いた商品検索の検索結果として、処理対象商品が抽出されなくなる。
【0052】
[6−2.不適正キーワード対応処理の第2例]
不適正キーワード対応処理の第2例では、商品ページDB100Eにおいて、検索キーワードが不適正キーワードとして判定された処理対象商品の商品ページのHTMLデータから、不適正キーワードの削除を行う(
図15のステップS601)。これにより、商品ページDB100Eの更新時における商品ページのクローリング作業において、不適正キーワードと処理対象商品の紐付けが解消される。従って、以降の不適正キーワードを用いた商品検索において、紐付けが解消された処理対象商品が検索結果として抽出されなくなる。
尚、HTMLデータから不適正キーワードの削除を行う替わりに、HTMLデータに記載された不適正キーワードを別の文言に書き換えてもよい。具体的には、不適正キーワードを「削除されました」等の文言に書き換えるなどである。これによっても、上記した効果を得ることができる。
【0053】
[6−3.不適正キーワード対応処理の第3例]
不適正キーワード対応処理の第3例では、検索DB100Eに記憶された優先度(表示優先度)を低下させる処理を行う。具体的には、検索キーワードに紐付けられた各商品ページの一覧の中で、当該検索キーワードが不適正キーワードとして判定された処理対象商品の商品ページの優先度情報を低下させる(
図16のステップS701)。これにより、不適正キーワードを用いた商品検索の検索結果として、処理対象商品が上位に表示されなくなる。
【0054】
[6−4.不適正キーワード対応処理の第4例]
不適正キーワード対応処理の第4例では、検索DB100Eにおいて処理対象商品が紐付けられた全ての検索キーワードに対して、当該処理対象商品の適正フラグを「適正」から「不適正」に変更する非表示処理を実行する(
図17のステップS801)。この処理は、例えば、当該商品が検索結果として表示される機会を増やすために様々な検索キーワードを商品ページに記載しているような悪質な商品ページに対して行われる。これにより、何れの検索キーワードを用いて商品検索を行っても、検索結果に当該処理対象商品が抽出されなくなる。即ち、商品検索の検索結果から処理対象商品が除外される。
【0055】
<7.変形例>
先のステップS105の説明において、同一の商品が複数の検索結果に含まれているか否かを判定したが、所定の数の検索結果に含まれているか否かを判定してもよい。具体的に、
図18を参照して説明する。尚、
図10で説明した処理と同様の処理は、
図10と同じ符号を付して説明を省略する。
例えば、所定の数として3を選択した場合、ステップS101とステップS102の間のステップS701において、処理対象商品抽出2aは、取得したキーワードセットに所定の数(=3)以上の検索キーワードが含まれているかを判定する。
所定の数以上の検索キーワードが含まれていなかった場合、処理対象商品抽出2aは、ステップS110の処理で次のキーワードセットを取得するか否かを判定する。
所定の数以上の検索キーワードが含まれていた場合、ステップS102の検索キーワード取得処理を実行する。
尚、処理対象商品抽出2aは、
図10のステップS105の替わりに
図18のステップS702として、所定の数(=3)以上の検索結果に該当する商品があるか否かを判定する。
これにより、商品が過剰に処理対象商品として判定されてしまうことを抑制することができる。
【0056】
先のステップS103乃至S105において、複数の商品検索の検索結果に該当する商品を処理対象商品として抽出する際に、ステップS102で選択した一つの検索キーワードごとに商品検索を行ったが、複数の検索キーワードを用いたアンド検索を行ってもよい。
具体的に
図19を参照して説明する。尚、
図10で説明した処理と同様の処理は、
図10と同じ符号を付し、
図18で説明した処理と同様の処理は
図18と同じ符号を付し、説明を省略する。
【0057】
処理対象商品抽出2aは、ステップS101でキーワードセットを取得した後、ステップS701で所定の数以上の検索キーワードが含まれているかを判定する。所定の数未満であった場合、処理対象商品抽出2aは、ステップS110の処理で次のキーワードセットを取得するか否かを判定する。
検索キーワードが所定の数以上含まれているキーワードセットであった場合、続いて、処理対象商品抽出2aは、ステップS801において、キーワードセットに属する検索キーワードから所定の数の検索キーワードを一つの組合せとして選択する。次のステップS802では、処理対象商品抽出2aは、ステップS801で選択した所定の数の検索キーワードを用いた商品検索を実行する。このときの商品検索は、複数の検索キーワード全てに紐付けられた商品が抽出されるアンド検索となる。
【0058】
続いて、処理対象商品抽出2aはステップS803において、商品検索の検索結果として抽出された商品があるか否かを判定する。抽出された商品が無かった場合、ステップS804で、処理対象商品抽出2aは、ステップS101で取得したキーワードセットに含まれる検索キーワードの組合せの中で、商品検索(アンド検索)を実行していない組合せがあるか否かを判定する。実行していない組合せがある場合には、処理対象商品抽出2aは、は再びステップS801の処理を実行する。
実行していない組合せが無い場合、処理対象商品抽出2aはステップS110において、未調査のキーワードセットがあるか否かを判定する。
ステップS803において、アンド検索の検索結果として抽出された商品があると判定した場合、処理対象商品抽出2aは、先のステップS106乃至ステップS108を実行する。
【0059】
以上の処理により、例えば、2つの検索キーワードの商品結果に同一の商品が含まれているときに当該商品を処理対象商品と判定する場合、キーワードセットに属する検索キーワードの中から二つの検索キーワードを用いたアンド検索を実行し、検索結果として抽出された商品を処理対象商品と判定する。二つの検索キーワードの全ての組合せを用いてアンド検索を実行することにより、漏れなく処理対象商品を抽出することができる。
【0060】
<8.まとめ>
これまで説明してきたように、本実施の形態の商品監視サーバ2は、一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているキーワードDB200Aを参照し、一つのキーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベース(商品DB100C、商品ページDB100D、検索DB100Eなど)を対象とした商品検索を行い、処理対象商品を抽出する処理対象商品抽出部2aと、抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する適否判定部2bと、不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する不適正キーワード対応処理部2cと、を備えている。
これにより、不適正キーワードを用いた商品検索において適切な検索結果が抽出される。
従って、商品検索の精度や品質を向上させることができる。
【0061】
適否判定部2bは、処理対象商品が属するジャンル情報を用いて不適正キーワードであるか否かの判定を行う。
これにより、商品が属する商品ジャンルにおける検索キーワードの付与傾向を反映した判定が行われる。例えば、複数のメーカー名が紐付けられた商品が多い商品ジャンルにおいては、前述した適否判定処理の第2例のように、閾値を下げることで、各メーカー名が不適正な検索キーワードとして判定されてしまうことを防止することができる。
【0062】
適否判定部2bは、処理対象商品の商品情報が記載された商品ページにおける不適正キーワードの出現回数を用いて不適正キーワードであるか否かの判定を行う。
商品ページにおいて所定回数以上出現するキーワードは、単に商品ページが商品検索に掛かりやすくするために記載されたものでなく、商品の説明を行う上で必要なものである可能性が高い。従って、上記の判定を実行することにより、商品ページにおいて所定回数以上出現するキーワードは、必要なキーワードとされ、不適正な検索キーワードとして判定されない。
これにより、商品の説明に必要なキーワードなどが不適正キーワードとして判定されることを抑制することができる。
【0063】
処理対象商品抽出部2aは、処理対象商品から除外される商品情報が記憶されたキーワードDB200Aを参照して処理対象商品の抽出を行う。
これにより、商品ごとの事情を鑑み、処理対象商品から除外されるべき商品が処理対象商品として抽出されることが防止される。例えば、様々な商品によって構成される福袋などの商品は、様々なキーワードが紐づけられる可能性が高いことは明らかである。そこで、そのような商品は、処理対象商品から除外されることが望ましい。
先のステップS106で説明した処理を実行することにより、このような商品が処理対象商品から除外され、適切に処理対象商品の抽出を行うことができる。
【0064】
不適正キーワード対応処理部2cは、不適正キーワード対応処理として、商品ページの情報が記憶されたデータベース(商品DB100C、商品ページDB100D、検索DB100Eなど)において、処理対象商品の商品ページに係る不適正キーワードの記載に対する適正化処理を実行する。
具体的には、先の不適正キーワード対応処理の第2例で説明したように、商品ページのHTMLデータから当該不適正キーワードを削除する処理や、書き換える処理などを実行する。
これにより、商品ページの情報が記憶されたデータベースが適正化される。
従って、商品検索によって抽出される検索結果の適正化が図られる。
【0065】
適正キーワード対応処理部2cは、先の不適正キーワード対応処理の第3例で説明したように、不適正キーワード対応処理として、商品検索の検索結果における処理対象商品の表示優先度を低下させる処理を実行する。
これにより、商品検索の検索結果において、処理対象商品の表示が適正化される。
従って、商品検索の精度が向上すると共に、不適正な記載のある商品ページをユーザが閲覧する頻度が低下し、商品検索の品質の低下を感じさせることを抑制することができる。
【0066】
不適正キーワード対応処理部2cは、先の不適正キーワード対応処理の第4例で説明したように、不適正キーワード対応処理として、商品検索の検索結果の表示から処理対象商品を除外する非表示処理を実行する。
例えば、処理対象商品が紐付けられた全ての検索キーワードに対して、当該処理対象商品の適正フラグを「適正」から「不適正」に変更する処理を実行する。
これにより、商品検索の検索結果において、処理対象商品が表示されない。
従って、不適正な記載のある商品ページをユーザが閲覧する頻度が更に低下し、商品検索の品質の低下を感じさせることを、より抑制することができる。
【0067】
<9.プログラム及び記憶媒体>
以上、本発明の商品監視サーバ2を説明してきたが、実施の形態のプログラムは、商品監視サーバ2における処理を演算処理装置(CPUなど)に実行させるプログラムである。
【0068】
実施の形態のプログラムは、一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照する処理を演算処理装置に実行させる。
また、一つのキーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い処理対象商品を抽出する処理を演算処理装置に実行させる。
更に、抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する処理を演算処理装置に実行させる。
加えて、不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を演算処理装置に実行させる。
即ちこのプログラムは、演算処理装置に対して、
図10で説明したステップS101乃至ステップS110の各処理、
図11で説明したステップS201乃至ステップS204の各処理、
図12で説明したステップS301乃至ステップS303の各処理、
図13で説明したステップS401乃至ステップS404の各処理、
図14のステップS501の処理、
図15のステップS601の処理、
図16のステップS701の処理、
図17のステップS801の処理、
図18で説明した各処理、
図19で説明した各処理を実行させるプログラムである。
【0069】
このようなプログラムにより、上述した商品監視サーバ2を実現できる。
そしてこのようなプログラムはコンピュータ装置などの機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROMなどに予め記憶しておくことができる。或いはまた、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスクなどのリムーバブル記憶媒体に、一時的或いは永続的に格納(記憶)しておくことができる。またこのようなリムーバブル記憶媒体は、いわゆるパッケージソフトウェアとして提供することができる。
また、このようなプログラムは、リムーバブル記憶媒体からパーソナルコンピュータなどにインストールする他、ダウンロードサイトから、LAN、インターネットなどのネットワークを介してダウンロードすることもできる。
商品検索に用いられたキーワードに基づいて抽出すべきでない商品が検索結果として抽出され、商品検索の精度や品質の低下をユーザが感じてしまう。これを解決するために、情報処理装置は、一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照し、一つの前記キーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い、処理対象商品を抽出する処理対象商品抽出部と、
抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する適否判定部と、前記不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する不適正キーワード対応処理部と、を備える。