(58)【調査した分野】(Int.Cl.,DB名)
請求項1に記載のシステムであって、前記1または複数のプロセッサは、さらに、前記複数のウェブページ情報セットから第1のウェブページ情報セットをフィルタアウトするか否かを、前記第1のウェブページ情報セットと前記検索クエリとの間の類似度に基づいて、決定するよう構成されている、システム。
【発明を実施するための形態】
【0011】
本発明は、処理、装置、システム、物質の組成、コンピュータ読み取り可能な格納媒体上に具現化されたコンピュータプログラム製品、および/または、プロセッサ(プロセッサに接続されたメモリに格納および/またはそのメモリによって提供される命令を実行するよう構成されたプロセッサ)を含め、様々な形態で実装されうる。本明細書では、これらの実装または本発明が取りうる任意の他の形態を、技術と呼ぶ。一般に、開示された処理の工程の順序は、本発明の範囲内で変更されてもよい。特に言及しない限り、タスクを実行するよう構成されるものとして記載されたプロセッサまたはメモリなどの構成要素は、ある時間にタスクを実行するよう一時的に構成された一般的な構成要素として、または、タスクを実行するよう製造された特定の構成要素として実装されてよい。本明細書では、「プロセッサ」という用語は、1または複数のデバイス、回路、および/または、コンピュータプログラム命令などのデータを処理するよう構成された処理コアを指すものとする。
【0012】
以下では、本発明の原理を示す図面を参照しつつ、本発明の1または複数の実施形態の詳細な説明を行う。本発明は、かかる実施形態に関連して説明されているが、どの実施形態にも限定されない。本発明の範囲は、特許請求の範囲によってのみ限定されるものであり、多くの代替物、変形物、および、等価物を含む。以下の説明では、本発明の完全な理解を提供するために、多くの具体的な詳細事項が記載されている。これらの詳細事項は、例示を目的としたものであり、本発明は、これらの具体的な詳細事項の一部または全てがなくとも特許請求の範囲に従って実施可能である。簡単のために、本発明に関連する技術分野で周知の技術事項については、本発明が必要以上にわかりにくくならないように、詳細には説明していない。
【0013】
検索結果生成の実施形態について本明細書に記載する。1または複数の検索キーワードを含む検索クエリが、ユーザから受信される。様々な実施形態において、検索クエリは、ウェブページ情報セットのデータベースとマッチングされる。様々な実施形態において、ウェブページ情報セットは、特定のウェブページまたは広告に関連するコンテンツおよび/またはメタデータを表す。ウェブページ情報セットは、販売業者および販売業者によって販売されている1または複数の商品に関連する属性を含みうる。ウェブページ情報セットは、関連する販売業者(例えば、グループ内の各ウェブページ情報セットを提出した販売業者)ごとにソートされ、特定の業者に関連する各ウェブページ情報グループについて、第1のフィールド値がグループ内のウェブページ情報セットから抽出され、販売業者とさらに販売業者に関連するグループ内のウェブページ情報セットの各々とに関連する第1の属性の属性値として用いられる。いくつかの実施形態において、第1の属性は、主要商品属性であり、販売業者によって販売される商品の(1または複数の)主要なタイプを正確に表すと推定される。いくつかの実施形態において、値は、販売業者グループのウェブページ情報セット内の主力商品ワードである。いくつかの実施形態において、検索キーワードは、ウェブページ情報セットに対応する第1の属性の値と比較され、第1の属性の値が検索キーワードと一致するウェブページ情報セットが、ユーザに返される検索結果内に含められる。
【0014】
図1は、検索結果を生成するためのシステムの一実施形態を示す図である。この例において、システム100は、クライアントデバイス102、ネットワーク104、サーバ106、および、データベース108を備える。
【0015】
クライアントデバイス102は、ネットワーク104を介してサーバ106と通信するよう構成されている。クライアントデバイス102は、ラップトップコンピュータとして図示されているが、クライアントデバイス102のその他の例としては、デスクトップコンピュータ、携帯デバイス、タブレットデバイス、スマートフォン、および/または、任意のその他のコンピュータデバイスが挙げられる。クライアントデバイス120は、ユーザが文字を入力しうる入力インターフェース(例えば、物理キーボードまたはタッチスクリーン)と、情報をユーザに表示しうるディスプレイインターフェースとを備える。様々な実施形態において、ユーザは、クライアントデバイス102で実行されるウェブブラウザアプリケーションを用いて、検索クエリを検索ページに入力しうる。検索クエリは、クライアントデバイス102からサーバ106に送信される。サーバ106は、クライアントデバイス102に検索結果を返すよう構成されている。いくつかの実施形態において、サーバ106から返された検索結果の少なくとも一部は、ウェブページ情報セットである。ウェブページ情報セットは、(1または複数の商品の販売に関連する)ウェブページまたは広告に関連しうる。
【0016】
ウェブページ情報セットは、データベース108に格納される。各ウェブページ情報セットは、1または複数の商品の販売業者によって提出される。したがって、ウェブページ情報のコンテンツ(例えば、商品ワード、関連業種、商品属性、カテゴリ、販売業者情報など)が、関連する販売業者によって決定される。ウェブページ情報セットが販売業者によって提出されるため、時に、ウェブページ情報セットは、商品の主要なタイプまたは販売業者に関連する主要な業種ではない商品または業種に関連する情報を含みうる。いくつかの実施形態において、データベース108は、例えば、以前に受信した検索クエリおよび検索結果から以前に選択された情報セットに関連する履歴データも格納する。
【0017】
サーバ106は、データベース108に格納されたウェブページ情報セットを販売業者に基づいてグループにソートするよう構成されている。言い換えると、同じ販売業者に関連するウェブページ情報セットが、同じグループにソートされる。サーバ106は、販売業者に関連するグループに関連するウェブページ情報セットから抽出された値に基づいて、少なくとも販売業者に関連する第1の属性値を決定するよう構成されている。様々な実施形態において、第1の属性は、販売業者によって提供された1または複数の主要な商品を表す主要商品属性を含む。様々な実施形態において、サーバ106は、ウェブページ情報セットに関連する販売業者に関する第1の属性値が検索クエリに含まれた検索キーワードに対応するか否かに基づいて、ウェブページ情報セットを検索結果に含めるか否かを決定するよう構成されている。第1の属性値が少なくとも検索キーワードに対応する場合、ウェブページ情報セットは検索結果に含められる。例えば、第1の属性が主要商品属性であった場合、検索クエリに関連する主要商品を有する販売業者に関連するウェブページ情報セットのみが、検索結果に含められる。
【0018】
図2は、検索結果を生成するための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、処理200は、
図1のシステム100で実施される。
【0019】
工程202で、1または複数の検索キーワードを含む検索クエリが、ユーザから受信される。例えば、検索クエリは、ユーザによってウェブページの検索エンジンに入力されてよい。
【0020】
工程204で、検索クエリと一致する複数のウェブページ情報セットが決定される。いくつかの実施形態において、検索クエリは、ウェブページ情報データベースに格納されたウェブページ情報セットと比較され、予備一致ウェブページ情報セットが決定される。ウェブページ情報セットは、特定の販売業者によって提出されるため、その販売業者によって提供されたコンテンツおよび/またはメタデータを含む。いくつかの実施形態において、ウェブページ情報セットのコンテンツおよび/またはメタデータは、様々なフィールドに格納される。例えば、一致ウェブページ情報セットは、検索クエリの少なくとも1つのキーワードに一致または類似する少なくとも1つのキーワードを含むウェブページ情報セットである。しかしながら、予備一致ウェブページ情報セットは、検索結果として直接ユーザに返されない。後述するように、予備一致ウェブページ情報セットの少なくとも一部が、検索結果としてユーザに返されるために選択される。
【0021】
工程206で、複数のウェブページ情報セットが、複数のウェブページ情報セットのそれぞれに関連する販売業者に基づいて、1または複数のグループにソートされる。予備一致ウェブページ情報セットは、様々なグループにソートされ、ここで、同じグループ内のウェブページ情報セットは同じ販売業者に関連する。言い換えると、同じ販売業者によって提出されたウェブページ情報セットは、同じグループにソートされる。
【0022】
いくつかの実施形態では、クエリに応答して予備一致ウェブページ情報セットをソートするのではなく、データベースに格納されたウェブページ情報セットすべてが、クエリを処理する前に、関連する販売業者に基づいてグループにソートされる。
【0023】
工程208で、販売業者に関連するウェブページ情報セットグループについて、ウェブページ情報セットグループに含まれる値が、販売業者に関連する第1の属性の属性値として決定される。いくつかの実施形態では、ウェブページ情報セットグループの各々について、特定のフィールド値が、グループに関連する販売業者に関連付けられる第1の属性に割り当てられる。様々な実施形態において、販売業者に関連する第1の属性は、主要商品属性である。いくつかの実施形態において、ウェブページ情報セットは、以下のフィールドのうちの少なくとも1以上を含む:商品ワード、関連業種、カテゴリ、商品属性、発行元、および、販売業者情報(例えば、販売業者の住所、販売業者の名称、および、その他のかかる情報)。
【0024】
グループのウェブページ情報セットの各々の第1の指定フィールド値が抽出される。例えば、第1の指定フィールドは、ウェブページ情報セットの商品ワードフィールドである。販売業者に関連する主要商品属性は、ウェブページ情報セットグループに関連する販売業者が主に販売している商品のタイプまたは具体的な商品を記述するために用いられる。いくつかの実施形態において、主要商品属性の値は、販売業者に関連するウェブページ情報セットの商品ワードフィールドから抽出された主力商品ワードを含む。例えば、販売業者に関連するウェブページ情報セットの商品ワードフィールドの値が抽出され、一意的な主力商品ワードがそれらの値から抽出されうる。様々な実施形態において、主力商品ワードは、商品のタイプを表す単語または句(通例は、名詞)である。例えば、抽出された値から主力商品ワードを取得するために、一般的な品詞タグ付けツールを用いて、抽出された各商品ワードフィールド値の品詞(名詞、動詞、形容詞など)を取得できる。抽出された商品ワードフィールド値から抽出された1または複数の(一意的な)名詞のセットが、主力商品ワードとなる。また、例えば、必ずしも名詞だけではなく主力商品ワードを構成する句の辞書を用いて、抽出された商品ワードフィールド値から主力商品ワードを抽出してもよい。例えば、「サムスン」および「ブランド」が主力商品ワード辞書に含まれないが「タブレット」が含まれる場合、商品ワードフィールド値「サムスンブランドタブレット」の主力商品ワードは「タブレット」であり、それが主要商品属性の値として用いられる。いくつかの実施形態において、後に詳述するように、出現率が、各主力商品ワードセットについて決定され(出現率は、主力商品ワードセットが、販売業者について決定された主力商品ワードセットすべての中で出現する頻度)、第1の所定の閾値を超える対応する出現率を持つ主力商品ワードセットのみが、販売業者に関連する主要商品属性の属性値として用いられる。販売業者に関連する主要商品属性は、販売業者に関連するすべてのウェブページ情報セットにも関連する。
【0025】
いくつかの実施形態において、グループのウェブページ情報セットの各々の第2の指定フィールド値が抽出され、販売業者に関連する第2の属性に用いられる。様々な実施形態において、販売業者に関連する第2の属性は、主要業種属性である。例えば、第2の指定フィールドは、ウェブページ情報セットの関連業種フィールドである。主要業種属性は、ウェブページ情報セットに関連する販売業者が関連する業種の(1または複数の)主要なタイプを記述するために用いられてよい。「主要業種」属性値の一例は、「通信装置」である。いくつかの実施形態において、後に詳述するように、出現率が、抽出された各関連業種値に対して決定され、第2の所定の閾値を超える対応する出現率を持つ関連業種のみが、販売業者に関連する主要業種属性の属性値として用いられる。販売業者に関連する主要業種属性は、販売業者に関連するすべてのウェブページ情報セットにも関連する。
【0026】
様々なウェブページ情報セットが、同じ商品に関連しうるが、各ウェブページ情報セットは、若干異なるフィールド値を含みうる(例えば、ウェブページ情報セットは、これらのフィールド値に異なる言い回しを指定しうるそれぞれの販売業者によって提出されているため)。以下は、特定のフィールドおよびそれぞれの値を含むウェブページ情報セットである:
【0033】
販売業者:ユーザ1、アリババネットワークテクノロジー社
【0034】
上で挙げた販売業者の例(ユーザ1、アリババネットワークテクノロジー社)について、以下の主要商品属性値および主要業種属性値が、上で挙げたウェブページ情報セットおよび販売業者に関連するその他のウェブページ情報セットに基づいて抽出されうる:
【0035】
主要商品:携帯電話、MP3、コンピュータ、電話
【0036】
主要業種:通信装置、ビジネスサービス
【0037】
以下は、特定の販売業者について主要商品属性および主要業種属性の値を選択する一例である:
【0038】
最初に、販売業者に関連する(例えば、予備一致ウェブページ情報セットのうちの)ウェブページ情報セットが見いだされる。次いで、ウェブページ情報セットに対応する商品ワードフィールドおよび関連業種フィールドのすべての値が抽出される。各商品ワードフィールド値(または、そこから抽出された主力商品ワードセット)および各関連業種フィールド値について、ウェブページ情報セット内での出現率が決定される。次いで、第1の所定の閾値を超える出現率を有する商品ワードフィールド値(または、そこから抽出された主力商品ワードセット)が、販売業者の主要商品属性の値として選択され、第2の所定の閾値を超える出現率を有する関連業種値が、販売業者の主要業種属性の値として選択される。いくつかの実施形態において、主要商品属性に選択された値は、販売業者に関連するウェブページ情報セットの商品ワードフィールドから抽出された値から決定された主力商品ワードを含む。例えば、第1の所定の閾値は10%である。商品ワードAは、販売業者に関連する全ウェブページ情報の中で50回出現する。商品ワードBおよび商品ワードCは、販売業者に関連する全ウェブページ情報セットの中でそれぞれ30回および2回出現する。商品ワードCの出現率は、2/(50+30+2)=2.4%であり、これは、第1の所定の閾値10%よりも小さい。したがって、商品ワードCは、販売業者の主要商品属性に対応する属性値として選択されない。しかしながら、商品ワードAの出現率(50/(50+30+2)=61.0%)およびBの出現率(30/(50+30+2)=36.6%)は、第1の所定の閾値10%よりも大きいため、販売業者に対応する主力商品ワードであり、販売業者の主要商品属性値の値としても選択される。
【0039】
工程210で、販売業者に関連するウェブページ情報セットグループの中のウェブページ情報セットを検索結果に含めるか否かが、販売業者に関連する第1の属性(例えば、主要商品属性および/または主要業種属性)の属性値に検索クエリが対応するか否かに少なくとも部分的に基づいて決定される。(1または複数の)主要商品属性値および/または(1または複数の)主要業種属性値が販売業者について選択されると、販売業者に関連するウェブページ情報セットを潜在的にユーザに返すために検索結果に含めるべきか否かは、検索クエリの検索キーワードが(1または複数の)主要商品属性値および/または(1または複数の)主要業種属性値のいずれかに一致するか否かに基づいて決まる。(1または複数の)主要商品属性値および/または(1または複数の)主要業種属性値は販売業者に関連する商品/業種のタイプを正確に表すと推定されるので、販売業者によって販売される商品の主要なタイプとあまり関連がないのに販売業者によって提出されたウェブページ情報セットに含まれうる他の商品ワードフィールド値および関連業種フィールド値は、検索クエリとのマッチングに利用されない。したがって、かかるあまり関係のない商品フィールド値の重要性が、主要商品属性および/または主要業種属性の利用によって弱められる。
【0040】
いくつかの実施形態において、(1または複数の)主要商品属性値および/または(1または複数の)主要業種属性値が、類似度に基づいて検索キーワードの少なくとも一部に対応するのか、または、完全一致するのかが、判定されてよい。例えば、主要商品属性値が「携帯電話」であり、検索キーワードも「携帯電話」である場合、2つは完全一致である。いくつかの実施形態において、(1または複数の)主要商品属性値および/または(1または複数の)主要業種属性値は、2つのワード間の所定の対応関係に基づいて、検索キーワードの少なくとも一部に対応すると判定されてもよい。例えば、主要商品属性値が「携帯電話」、検索キーワードが「ノキア」であり、かつ、「携帯電話」および「ノキア」の間の所定の対応関係が予め確立されている場合、2つのワードは、所定の対応関係に従って一致する。
【0041】
いくつかの実施形態において、検索キーワードが、ウェブページ情報セットに関連する販売業者の(1または複数の)主要商品属性値または(1または複数の)主要業種属性値のいずれか一方と一致した場合、ウェブページ情報セットは、ユーザに返される検索結果内に潜在的に含められる。しかしながら、検索キーワードが、ウェブページ情報セットに関連する販売業者の(1または複数の)主要商品属性値にも(1または複数の)主要業種属性値にも一致しなかった場合、ウェブページ情報セットは、ユーザに返される検索結果から除外される。
【0042】
各販売業者に関連する割り当てられた(1または複数の)主要商品属性値および/または(1または複数の)主要業種属性値を用いて検索結果を決定することにより、検索クエリと関連しない(1または複数の)主要商品属性値および/または(1または複数の)主要業種属性値を持つウェブページ情報セットが、検索結果からフィルタアウトおよび除外される。販売業者がウェブページ情報セットで偽の情報を公表している場合、かかるウェブページ情報は、かかるウェブページ情報に関連する主要商品および/または主要業種が検索クエリに関連する商品と関係ないと判定することにより、フィルタアウトされうる。さらに、検索クエリと無関係の主要商品または主要業種を有するウェブページ情報が検索結果から除外されるので、検索エンジンサーバが、検索クエリを送信したクライアントに検索結果データを送信する時に、それに応じて送信データ量が低減される。結果として、ネットワーク送信速度が改善し、ネットワークの混雑が緩和される。
【0043】
図3は、検索結果を生成するための処理の一実施形態を示すフローチャートである。いくつかの実施形態において、処理300は、
図1のシステム100で実施される。
【0044】
処理300は、処理200と類似するが、検索クエリと十分に類似しないウェブページ情報セットをフィルタアウトする工程と、少なくとも一部がユーザに返される検索結果を順位付ける工程と、をさらに備える。
【0045】
工程302で、1または複数の検索キーワードを含む検索クエリが、ユーザから受信される。例えば、検索クエリは、ユーザによってウェブページの検索エンジンに入力されてよい。
【0046】
工程304で、検索クエリと一致する複数のウェブページ情報セットが決定される。いくつかの実施形態において、検索クエリは、ウェブページ情報データベースに格納されたウェブページ情報セットと比較され、予備一致ウェブページ情報セットが決定される。
【0047】
工程306で、検索クエリに対する第1のウェブページ情報セットの類似度値に少なくとも部分的に基づいて、複数のウェブページ情報セットから第1のウェブページ情報セットをフィルタアウトするか否かが判定される。いくつかの実施形態において、工程306は、予備一致ウェブページ情報セット(または、全ウェブページ情報セットのデータベース)の内、検索クエリと十分に類似しないウェブページ情報セットをさらなる処理からフィルタアウト(すなわち、除外)するために任意選択的に実行される。いくつかの実施形態において、ウェブページ情報セットが検索クエリと十分に類似するか否かを判定するために、検索クエリに対するウェブページ情報セットの類似度値が決定され、類似度値が所定の類似度閾値よりも小さい場合、ウェブページ情報セットは検索クエリとの類似が不十分であると見なされるため、フィルタアウトされる。予備一致ウェブページ情報セット(または、全ウェブページ情報セットのデータベース)からの各ウェブページ情報セットと、検索クエリとの間の類似度値は、任意の適切な技術によって決定されてよい。
【0048】
以下は、ウェブページ情報セットと検索クエリとの間の類似度値を決定するための技術の一例である:
【0049】
検索クエリの検索キーワードに関連する1または複数の主力商品ワードが抽出される。ユーザが検索キーワードを提供する際に厳格なルールはないので、検索クエリ内の検索キーワードの大部分は口語である。時に、検索クエリは、ユーザが検索しようとする商品の名称に関する単語と、さらに、商品の名称に関連する単語に加えて説明的な語句も含む。かかる説明的な語句は、非常に多様でありうる。例えば、ユーザが高齢者の利用に適した携帯電話を購入したい場合、ユーザは、ウェブページで以下の検索キーワードを入力しうる:「高齢者が利用できるノキアの携帯電話」または「高齢者が使う多機能携帯電話、ノキア」。検索されたウェブページ情報は、高齢者に適したコンピュータおよびノキアディスプレイデバイスならびにユーザの検索キーワードに関係するその他のかかるウェブページ情報を販売しうるが、かかる品物すべてが、ユーザの実際に購入したい高齢者に適した携帯電話であるわけではない。検索クエリに含まれる主力商品ワードだけを最初に抽出し、検索クエリに関連する主力商品ワードを用いてウェブページ情報セットとの類似度値を決定することが望ましい。例えば、検索クエリの主力商品ワードを取得するために、一般的な品詞タグ付けツールを用いて、検索クエリ内の各検索キーワードの品詞(名詞、動詞、形容詞など)を取得できる。検索クエリから抽出された1または複数の名詞のセットが、主力商品ワードとなる。検索クエリが少なくとも1つの名詞を含むとする。検索クエリが名詞を1つだけ含む場合、その名詞が主力商品ワードである。検索クエリが2つの名詞AおよびBを含む場合、AおよびBの間の関係性が評価される。名詞Aが名詞Bを修飾する可能性が高い場合、名詞Bが主力商品ワードである。逆の場合には、名詞Aが主力商品ワードである。可能性の間の差が非常に小さい場合、または、2つの名詞が非常によく似ている場合、2つの名詞の両方が主力商品ワードになる。検索クエリが3以上の名詞を含む場合、最後の名詞Cが主力商品ワードと見なされ、Cに対する最初の2つの名詞の関係性が評価されて(上述のように、2つの名詞のみが含まれる状況と同様)、2つの名詞の一方または両方が主力商品ワードであるか否かが決定される。
【0050】
ウェブページ情報セットに関連する1または複数の主力商品ワードが、ウェブページ情報セット(例えば、その商品ワードフィールドなど特定のフィールドの値)から抽出される。ウェブページ情報セットの主力商品ワードは、検索クエリについて上述したのと同じ技術例を用いて決定されてよい。
【0051】
主力商品ワードが検索クエリおよびウェブページ情報セットに対して決定された後、様々なカテゴリにおけるクリックレートが、検索クエリから抽出された主力商品ワードセットの各々およびウェブページ情報セットから抽出された各主力商品ワードセットについて決定される。クリックレートカテゴリ分布が、ウェブページ情報セットから抽出された各主力商品ワードセットについて決定される。例えば、ウェブページ情報セットに関連する主力商品ワードセットのクリックレートカテゴリ分布は、同じ商品ワードセットを含んだ履歴ウェブページ情報セットに含まれたカテゴリを含んでよい。クリックレートカテゴリ分布が、検索クエリに関連する各主力商品ワードセットについて決定される。例えば、検索クエリに関連する主力商品ワードセットのクリックレートカテゴリ分布は、主力商品ワードセットを含んだ検索クエリに対して過去に返された検索結果の中から選択されたウェブページ情報セットに関連するカテゴリを含みうる。クリックレートカテゴリ分布は、異なる各カテゴリについての統計的表現を含みうる。
【0052】
クリックレートカテゴリ分布が、検索クエリに関連する主力商品ワードセットおよびウェブページ情報セットに関連する主力商品ワードセットの各々について決定されたと仮定すると、検索クエリおよびウェブページ情報セットの間の類似度値は、以下の式の例、すなわち式(1)を用いて決定されてよい:
【0054】
式1で、D(Q
p,D
p)は、ウェブページ情報セットと検索クエリとの間の類似度値を表し、Q
pは、検索クエリの主力商品ワードのクリックレートカテゴリ分布を表し、D
pは、ウェブページ情報セット内での主力商品ワードのクリックレートカテゴリ分布を表し、wは、検索クエリに関連するクリックレートカテゴリ分布およびウェブページ情報セットに関連するクリックレートカテゴリ分布において異なるカテゴリの最大数を表し、p
Q(w)は、検索クエリのカテゴリwに対するクリックレートを表し、p
D(w)は、特定のウェブページ情報セット内の主力商品ワードのカテゴリwに対するクリックレートを表す。
【0055】
次いで、類似度値(例えば、D(Q
p,D
p))は、所定の類似度閾値と比較される。いくつかの実施形態において、類似度値が所定の類似度閾値より小さい場合、類似度値に関連するウェブページ情報セットは、フィルタアウト(例えば、さらなる処理から除外)される。いくつかの実施形態において、類似度値が所定の類似度閾値以上である場合、類似度値に関連するウェブページ情報セットは保持される(例えば、さらなる処理に含められる)。
【0056】
工程308で、複数のウェブページ情報セットが、複数のウェブページ情報セットのそれぞれに関連する販売業者に基づいて、1または複数のグループにソートされる。工程306でフィルタアウトされなかった予備一致ウェブページ情報セットは、様々なグループにソートされ、ここで、同じグループ内のウェブページ情報セットは同じ販売業者に関連する。言い換えると、同じ販売業者によって提出されたウェブページ情報セットは、同じグループにソートされる。
【0057】
工程310で、販売業者に関連するウェブページ情報セットのグループについて、ウェブページ情報セットのグループに含まれる値が、販売業者に関連する主要商品属性の属性値として決定される。例えば、工程310は、
図2の処理200の工程208と同様に実行されてよい。
図2の処理200の工程208について上述したように、販売業者に関連するグループ内のウェブページ情報セットの第2の指定フィールドからの値が、販売業者に関連する主要業種属性を決定するために用いられてよい。
【0058】
工程312で、検索クエリが販売業者に関連する主要商品属性の属性値に対応することに少なくとも部分的に基づいて、ウェブページ情報セットのグループの中のウェブページ情報セットが、検索結果に含められることが決定される。例えば、工程312は、
図2の処理200の工程210と同様に実行されてよい。
図2の処理200の工程210について上述したように、ウェブページ情報セットは、その販売業者に関連する主要商品属性値またはその販売業者に関連する主要業種属性値の少なくとも一方が検索クエリの検索キーワードに対応する場合に、検索結果に含められると決定される。また、ウェブページ情報セットは、その販売業者に関連する主要商品属性値もその販売業者に関連する主要業種属性値も検索クエリの検索キーワードに対応しない場合には、検索結果から除外されると決定される。
【0059】
工程314で、検索結果が順位付けされる。いくつかの実施形態において、工程312で検索結果に含められると決定されたウェブページ情報セットが、ユーザへの表示の前に任意選択的に順位付けられる。
【0060】
検索結果は、任意の適切な技術に基づいて順位付けられてよい。順位付け技術の一例を以下で説明する:
【0061】
検索クエリの1または複数の特徴が決定される。例えば、特徴は、検索クエリを送信したクライアントデバイスに関連する位置情報を含みうる。また、クリック確率予測モデルが決定される。クリック確率予測モデルは、ウェブページ情報セットに対応する予測クリックレート確率を、検索クエリに関連する異なる特徴情報について含む。例えば、予測クリックレート確率は、履歴検索からの記録された検索キーワード、以前に表示された検索結果および検索結果ページ上でのそれぞれの位置、ならびに、履歴検索結果の中でユーザによって選択されたウェブページ情報セットなど、履歴情報に基づいてよい。さらに、ユーザによって選択されたウェブページ情報セットに対する検索キーワードに関連する特徴情報(例えば、人気のある検索キーワードまたはヒットした検索キーワードに関連する位置およびウェブページ情報セットに対する検索キーワードの相関などの情報)が、これらの履歴検索から決定される。例えば、機械学習方法(例えば、論理回帰モデルなど)をかかる履歴データに用いて、特徴情報を決定してよく、トレーニングを行って、検索結果ページで以前に表示された各ウェブページ情報セットに対する検索クエリに関連するどの特徴についてどのようなクリックレートが得られるのかを決定する。例えば、統計モデルのトレーニングは、検索結果ページで過去に表示された各ウェブページ情報セットに対する検索クエリに関連する1セットの特徴について予測クリックレートを取得できうる。したがって、クリック確率予測モデルが、いくつかの実施形態において確立され、このモデルは、異なる特徴情報に対応する予測クリックレート確率に関する統計情報を含む。新たな検索クエリ(すなわち、これまで特徴情報が決定されていない検索クエリ)が受信されると、検索結果に含まれるウェブページ情報セットと検索クエリに含まれる検索キーワードとの間の関係性に関する計算がリアルタイムで実行され、以前に生成されたクリック確率が、ウェブページ情報セットに対する新たな検索クエリについてリトリーブされる。いくつかの実施形態において、ウェブページ情報セットは、現在の検索クエリの特徴情報についてのそれぞれの予測クリックレート確率に基づいて順位付けられてよい。
【0062】
時に、ウェブページ情報セットは広告を含む。広告が検索結果ページに提供される場合、販売業者は、検索キーワードに入札することで、その検索キーワードが検索クエリに含まれる時に、販売業者に関連するウェブページ情報セット(例えば、広告)が検索結果ページに表示される可能性を大きくすることができる。したがって、様々な検索キーワードに関連する入札価格がデータベースに格納されてよい。順位付けされるウェブページ情報セットが広告を含む場合など、いくつかの実施形態では、順位値が、予測クリックレート確率、現在の検索クエリの特徴情報、および、現在の検索クエリの検索キーワードに関連する入札価格に基づいて、各ウェブページ情報セットに対して決定される。例えば、各ウェブページ情報セットの順位値は、現在の検索クエリの特徴情報に対するそれぞれの予測クリックレート確率と現在の検索クエリに関連する入札価格との積として決定されてよい。例えば、検索クエリが1つの検索キーワードを含む場合、検索クエリに関連する入札価格は、検索キーワードの入札価格である。あるいは、検索クエリが複数の検索キーワードを含む場合、検索クエリに関連する入札価格は、検索キーワードのいずれかに関連する最高の入札価格である。次いで、検索結果は、それぞれの順位値の降順で順位付けされる。
【0063】
いくつかの実施形態において、検索結果が順位付けられると、上位の検索結果の少なくとも一部が、ユーザに表示されるために返される。
【0064】
工程316で、ウェブページ
情報セットグループの中のウェブページ情報セットは、主要商品属性を用いて更新される。任意選択的に、いくつかの実施形態において、主要商品属性が決定されたグループに関連するウェブページ情報セットは、決定された主要商品属性で更新されてよい。例えば、ウェブページ情報セットに含まれる情報の少なくとも一部は、関連販売業者によって自発的に提出されたものなので、ウェブページ情報セットは、システムによってその販売業者について決定された主要商品属性の値の中の主力商品ワードを含まない場合がある。したがって、ウェブページ情報セットに含まれない主要商品属性に関連する商品ワードが、ウェブページ情報セットに追加されてよく、主要商品属性に関連しないのにウェブページ情報セットに含まれる商品ワードが、ウェブページ情報セットから削除されてよい。一例を示すために、販売業者がウェブページ情報セットAのために提出した商品ワードフィールドの値が「携帯電話、MP3、コンピュータ、および、電話」であると仮定する。次いで、上述のウェブページ情報セットAを含め、販売業者に関連するウェブページ情報セットが見いだされる。販売業者について(例えば、
図2の処理200などの処理に基づいて)決定された主要商品属性値は、「MP3、タブレット」だけである。したがって、ウェブページ情報セットAは、主要商品属性値に基づいて、「コンピュータ」、「電話」、および、「携帯電話」を除外し、「タブレット」を追加するよう更新されてよい。ウェブページ情報セットAの更新後の商品ワードフィールドは、「MP3、タブレット」を含む。ウェブページ情報セットAの更新後の商品ワードフィールドは、販売業者によって販売される主要な商品をよりよく反映する。また、ウェブページ情報セットのかかる自動更新は、以前に提出した情報を更新するのを忘れた販売業者の役に立ちうる。
【0065】
任意選択的に、いくつかの実施形態において、主要業種属性が決定されたグループに関連するウェブページ情報セットは、決定された主要業種属性で更新されてよい。例えば、ウェブページ情報セットに含まれる情報の少なくとも一部は、関連販売業者によって自発的に提出されたものなので、ウェブページ情報セットは、その販売業者について決定された主要業種属性の値の中の業種を含まない場合がある。したがって、ウェブページ情報セットに含まれない主要業種属性に関連する業種が、ウェブページ情報セットに追加されてよく、主要業種属性に関連しないのにウェブページ情報セットに含まれる業種が、ウェブページ情報セットから削除されてよい。ウェブページ情報セットの更新後の業種フィールドは、販売業者に関連する主要な業種をよりよく反映する。
【0066】
記載した処理の実施形態については、簡単のために、すべてが、一連の動作の組み合わせとして提示されている。しかしながら、特定の工程は、本願の精神の範囲内で他の順序で実行されてもよいし、他の工程と同時に実行されてもよいため、当業者であれば、本願が、記載された動作の順序によって限定されないことに気づくべきである。
【0067】
図4は、検索結果を生成するためのシステムの一実施形態を示す図である。この例において、システム400は、ウェブページ情報モジュール401、属性値統計モジュール402、および、検索結果抽出モジュール403を備える。いくつかの実施形態において、
図2の処理200は、システム400で実施される。
【0068】
モジュールおよびサブモジュールは、1または複数のプロセッサ上で実行されるソフトウェアコンポーネントとして、設計されたプログラム可能論理デバイスおよび/または特定用途向け集積回路などのハードウェアとして実装されてよく、要素は、コンピュータデバイス(パーソナルコンピュータ、サーバ、ネットワーク装置など)に本発明の実施形態に記載された方法を実行させるための複数の命令など、不揮発性記憶媒体(光学ディスク、フラッシュ記憶装置、携帯用ハードディスクなど)に格納することができるソフトウェア製品の形態で具現化されてよい。モジュールおよびサブモジュールは、単一のデバイス上に実装されてもよいし、複数のデバイスにわたって分散されてもよい。
【0069】
ウェブページ情報モジュール401は、対応するウェブページ情報セットを検索するための基礎として検索キーワードを用いるよう構成されている。
【0070】
属性値統計モジュール402は、関連販売業者に基づいて、複数のウェブページ情報セットをグループにソートするよう構成されている。属性値統計モジュール402は、さらに、特定の販売業者に関連するウェブページ情報の中から、所定の閾値よりも大きい出現率を有する第1の指定フィールドおよび/または第2の指定フィールドの値を抽出するよう構成されている。例えば、第1の指定フィールドは商品ワードフィールドであり、第2の指定フィールドは関連業種フィールドである。抽出された第1の指定フィールド値の主力商品ワードは、販売業者の主要商品属性値の属性値として用いられる。また、第2の指定フィールド値に含まれる1または複数の業種値は、販売業者の主要業種属性値の属性値として用いられる。
【0071】
検索結果抽出モジュール403は、検索結果に含めるために、検索クエリに対応する主要商品属性および/または主要業種属性に関連するウェブページ情報セットを決定するよう構成されている。
【0072】
いくつかの実施形態において、属性値統計
モジュール402は、以下を含んでよい:
【0073】
様々な関連販売業者に基づいて、ウェブページ情報セットをソートするよう構成されたウェブページ情報抽出サブモジュール。
【0074】
商品ワードフィールドの値および/または関連業種フィールドの値をウェブページ情報セットのグループから抽出するよう構成された率計算サブモジュール。率計算サブモジュールは、さらに、商品ワードフィールドの異なる各値についてグループの中での出現率を決定し、どの値が第1の所定の閾値を超える出現率に関連するのかを決定するよう構成されている。率計算サブモジュールは、さらに、関連業種フィールドの異なる各値についてグループの中での出現率を決定し、どの値が第2の所定の閾値を超える出現率に関連するのかを決定するよう構成されている。
【0075】
第1の所定の閾値よりも大きい関連する率を有する商品ワードフィールド値から主力商品ワードを抽出し、販売業者に関連する主要商品属性に対応する属性値としてそれらを用いるよう構成された属性値抽出サブモジュール。属性値抽出サブモジュールは、さらに、第2の所定の閾値よりも大きい出現率を有する関連業種値を、販売業者に関連する主要産業属性に対応する属性値として用いるよう構成されている。
【0076】
図5は、検索結果を生成するためのシステムの一実施形態を示す図である。例において、システム500は、ウェブページ情報検索モジュール501、ウェブページフィルタリングモジュール502、属性値統計モジュール503、検索結果抽出モジュール504、検索結果表示モジュール505、および、情報更新モジュール506を備える。いくつかの実施形態において、処理300は、システム500で実施される。
【0077】
ウェブページ情報検索モジュール501は、対応するウェブページ情報を検索するための基礎としてユーザ入力検索キーワードを用いる。
【0078】
ウェブページフィルタリングモジュール502は、検索キーワードに対する関連類似度値が所定の類似度閾値よりも小さいウェブページ情報セットをフィルタアウトするよう構成されている。
【0079】
いくつかの実施形態において、検索キーワードに対するウェブページ情報セットの類似度値は、以下に記載のサブモジュールを用いて決定される:
【0080】
ウェブページ情報セットおよび検索キーワードから主力商品ワードを別個に抽出するよう構成された主力商品ワード抽出サブモジュール。
【0081】
異なるクリックカテゴリにおける各主力商品ワードのクリックレートを用いて、検索キーワードに対する各ウェブページ情報セットの類似度値を計算するよう構成された類似度計算サブモジュール。
【0082】
関連販売業者に基づいて、複数のウェブページ情報セットをグループにソートするよう構成された属性値統計モジュール503。属性値統計モジュール503は、さらに、特定の販売業者に関連するウェブページ情報の中から、所定の閾値よりも大きい出現率を有する第1の指定フィールドおよび/または第2の指定フィールドの値を抽出するよう構成されている。例えば、第1の指定フィールドは商品ワードフィールドであり、第2の指定フィールドは関連業種フィールドである。抽出された第1の指定フィールド値の主力商品ワードは、販売業者の主要商品属性値の属性値として用いられる。また、第2の指定フィールド値に含まれる1または複数の業種値は、販売業者の主要業種属性値の属性値として用いられる。
【0083】
検索結果抽出モジュール504は、検索結果に含めるために、検索クエリに対応する主要商品属性および/または主要業種属性に関連するウェブページ情報セットを決定するよう構成されている。
【0084】
いくつかの実施形態において、検索結果が順位付けされてもよい。
【0085】
検索結果表示モジュール505は、ユーザのために検索結果ページに検索結果を表示するよう構成されている。
【0086】
いくつかの実施形態において、販売業者の少なくとも一部は、広告主を含み、検索結果表示モジュール505は、以下を含んでよい:
【0087】
様々なウェブページ情報セットに関連して検索キーワードの特徴情報に関する統計情報を別個に収集するよう構成された特徴情報統計サブモジュール。
【0088】
クリック確率予測サブモジュールは、特徴情報およびクリック確率予測モデルを用いて、様々なウェブページ情報セットの予測クリック確率を決定するよう構成されている。クリック確率予測モデルは、履歴検索クエリに関連する異なる特徴情報に対応する様々なウェブページ情報セットの予測クリック確率の統計情報を含む。
【0089】
販売リード順位付けサブモジュールは、それぞれの予測クリック確率、現在の検索クエリの特徴情報、および、検索キーワード入札価格に基づいて、様々なウェブページ情報セットを順位付けるよう構成されている。
【0090】
いくつかの実施形態において、様々な販売業者に関連して取得された主要商品属性および主要業種属性は、販売業者に関連するウェブページ情報セットを更新するために用いられてもよい。いくつかの実施形態において、システム500は、さらに以下を含む:
【0091】
情報更新モジュール506は、販売業者に関連するウェブページ情報セットの更新の基礎として、各販売業者の主要商品属性および主要業種属性を用いるよう構成されている。
【0092】
本願は、多くの汎用または専用コンピュータシステム環境または構成で利用できる。例えば、パーソナルコンピュータ、サーバ、ハンドヘルドデバイスまたは携帯型装置、タブレット型の装置、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能な家庭用電子機器、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたは装置のうちの任意のものを備える分散型コンピュータ環境などである。
【0093】
本願は、コンピュータによって実行されるコンピュータ実行可能なコマンド(プログラムモジュールなど)の一般的なコンテキストで記述されてよい。一般に、プログラムモジュールは、特定のタスクの実行または特定の抽象データ型の実施のためのルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを備える。本願は、分散型コンピュータ環境で実施されてもよく、かかる分散型コンピュータ環境では、通信ネットワークを介して接続されたリモート処理装置によってタスクが実行される。分散型コンピュータ環境において、プログラムモジュールは、記憶装置を備えるローカルまたはリモートコンピュータの記憶媒体に格納されうる。
【0094】
ここまで、本願により提供される検索結果生成方法および検索結果生成デバイスについて詳述した。本明細書は、具体的な実施形態を用いて、本願の実施例の原理および形態を説明している。上記の実施形態の説明は、単に、本願の方法およびその中心概念の理解を助けるよう意図されたものである。さらに、当業者は、本願の概念に基づいて、具体的な実施例および応用範囲に対して修正を加えることができる。要するに、本記載の内容は、本願を限定するものとして理解されるべきではない。
【0095】
上述の実施形態は、理解しやすいようにいくぶん詳しく説明されているが、本発明は、提供された詳細事項に限定されるものではない。本発明を実施する多くの代替方法が存在する。開示された実施形態は、例示であり、限定を意図するものではない。
本発明は、以下のような態様で実現することもできる。
適用例1:
システムであって、
1または複数のプロセッサであって、
複数のウェブページ情報セットを、前記複数のウェブページ情報セットのそれぞれに関連する販売業者に基づいて、1または複数のグループにソートし、
販売業者に関連するウェブページ情報セットグループについて、前記ウェブページ情報セットグループに含まれる値を、前記販売業者に関連する第1の属性の属性値として、決定し、
検索クエリが、前記販売業者に関連する前記第1の属性の前記属性値に対応するか否かに少なくとも部分的に基づいて、前記販売業者に関連する前記ウェブページ情報セットグループの中のウェブページ情報セットを検索結果に含めるか否かを決定するよう構成された、1または複数のプロセッサと、
前記1または複数のプロセッサに接続され、前記1または複数のプロセッサに命令を提供するよう構成された1または複数のメモリと、
を備える、システム。
適用例2:
適用例1のシステムであって、前記第1の属性は、主要商品属性を含む、システム。
適用例3:
適用例1のシステムであって、前記ウェブページ情報セットグループに含まれる前記値を決定することは、
前記ウェブページ情報セットグループから商品ワードフィールドに関連する値を抽出することと、
前記抽出された値のうちの少なくとも各一意的な値の出現率を決定することと、
前記一意的な値に関連する前記出現率が、第1の所定の閾値以上である場合に、前記抽出された値のうちの少なくとも前記一意的な値を決定することと、
を含む、システム。
適用例4:
適用例1のシステムであって、前記1または複数のプロセッサは、さらに、
前記販売業者に関連する前記ウェブページ情報セットグループについて、前記ウェブページ情報セットグループに含まれる別の値を、前記販売業者に関連する第2の属性の属性値として、決定するよう構成されている、システム。
適用例5:
適用例4のシステムであって、前記第2の属性は、主要業種属性を含む、システム。
適用例6:
適用例4のシステムであって、前記ウェブページ情報セットグループに含まれる前記別の値を決定することは、
前記ウェブページ情報セットグループから関連業種フィールドに関連する値を抽出することと、
前記抽出された値のうちの少なくとも各一意的な値の出現率を決定することと、
前記一意的な値に関連する前記出現率が、第2の所定の閾値以上である場合に、前記抽出された値のうちの少なくとも前記一意的な値を決定することと、
を含む、システム。
適用例7:
適用例6のシステムであって、前記検索クエリが、前記販売業者に関連する前記第1の属性の前記属性値に対応するか否かに少なくとも部分的に基づいて、前記販売業者に関連する前記ウェブページ情報セットグループの中の前記ウェブページ情報セットを検索結果に含めるか否かを決定することは、さらに、前記検索クエリが、前記販売業者に関連する前記第2の属性の前記属性値に対応するか否かに基づく、システム。
適用例8:
適用例7のシステムであって、前記検索クエリが、前記販売業者に関連する前記第1の属性の前記属性値または前記販売業者に関連する前記第2の属性の前記属性値に対応する場合に、前記ウェブページ情報セットを前記検索結果に含め、前記検索クエリが、前記販売業者に関連する前記第1の属性の前記属性値にも前記販売業者に関連する前記第2の属性の前記属性値にも対応しない場合に、前記ウェブページ情報セットを前記検索結果から除外する、システム。
適用例9:
適用例1のシステムであって、前記検索クエリが、前記販売業者に関連する前記第1の属性の前記属性値に対応する場合に、前記ウェブページ情報セットを前記検索結果に含め、前記検索クエリが、前記販売業者に関連する前記第1の属性の前記属性値に対応しない場合に、前記ウェブページ情報セットを前記検索結果から除外する、システム。
適用例10:
適用例1のシステムであって、前記1または複数のプロセッサは、さらに、前記複数のウェブページ情報セットから第1のウェブページ情報セットをフィルタアウトするか否かを、前記第1のウェブページ情報セットと前記検索クエリとの間の類似度に基づいて、決定するよう構成されている、システム。
適用例11:
適用例1のシステムであって、前記1または複数のプロセッサは、さらに、検索結果を順位付けするよう構成されている、システム。
適用例12:
適用例11のシステムであって、前記1または複数のプロセッサは、さらに、前記順位付けられた検索結果の少なくとも一部を返すよう構成されている、システム。
適用例13:
適用例1のシステムであって、前記複数のウェブページ情報セットの少なくとも一部は、製品情報セットを含む、システム。
適用例14:
適用例1のシステムであって、前記複数のウェブページ情報セットは、前記検索クエリと一致するように決定されたものである、システム。
適用例15:
方法であって、
1または複数のプロセッサを用いて、複数のウェブページ情報セットを、前記複数のウェブページ情報セットのそれぞれに関連する販売業者に基づいて、1または複数のグループにソートする工程と、
販売業者に関連するウェブページ情報セットグループについて、前記ウェブページ情報セットグループに含まれる値を、前記販売業者に関連する第1の属性の属性値として、決定する工程と、
検索クエリが、前記販売業者に関連する前記第1の属性の前記属性値に対応するか否かに少なくとも部分的に基づいて、前記販売業者に関連する前記ウェブページ情報セットグループの中のウェブページ情報セットを検索結果に含めるか否かを決定する工程と、
を備える、方法。
適用例16:
適用例15の方法であって、前記第1の属性は、主要商品属性を含む、方法。
適用例17:
適用例15の方法であって、前記ウェブページ情報セットグループに含まれる前記値を決定する工程は、
前記ウェブページ情報セットグループから商品ワードフィールドに関連する値を抽出する工程と、
前記抽出された値のうちの少なくとも各一意的な値の出現率を決定する工程と、
前記一意的な値に関連する前記出現率が、第1の所定の閾値以上である場合に、前記抽出された値のうちの少なくとも前記一意的な値を決定する工程と、
を含む、方法。
適用例18:
適用例15の方法であって、さらに、
前記販売業者に関連する前記ウェブページ情報セットグループについて、前記ウェブページ情報セットグループに含まれる別の値を、前記販売業者に関連する第2の属性の属性値として、決定する工程を備える、方法。
適用例19:
適用例18の方法であって、前記第2の属性は、主要業種属性を含む、方法。
適用例20:
適用例18の方法であって、前記ウェブページ情報セットグループに含まれる前記別の値を決定する工程は、
前記ウェブページ情報セットグループから関連業種フィールドに関連する値を抽出する工程と、
前記抽出された値のうちの少なくとも各一意的な値の出現率を決定する工程と、
前記一意的な値に関連する前記出現率が、第2の所定の閾値以上である場合に、前記抽出された値のうちの少なくとも前記一意的な値を決定する工程と、
を含む、方法。
適用例21:
コンピュータプログラム製品であって、前記コンピュータプログラム製品は、持続性のコンピュータ読み取り可能な記憶媒体内に具現化され、
複数のウェブページ情報セットを、前記複数のウェブページ情報セットのそれぞれに関連する販売業者に基づいて、1または複数のグループにソートするためのコンピュータ命令と、
販売業者に関連するウェブページ情報セットグループについて、前記ウェブページ情報セットグループに含まれる値を、前記販売業者に関連する第1の属性の属性値として、決定するためのコンピュータ命令と、
検索クエリが、前記販売業者に関連する前記第1の属性の前記属性値に対応するか否かに少なくとも部分的に基づいて、前記販売業者に関連する前記ウェブページ情報セットグループの中のウェブページ情報セットを検索結果に含めるか否かを決定するためのコンピュータ命令と、
を備える、コンピュータプログラム製品。