特許第5956558号(P5956558)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アリババ・グループ・ホールディング・リミテッドの特許一覧

特許5956558製品カテゴリ情報を判断する方法および装置
<>
  • 特許5956558-製品カテゴリ情報を判断する方法および装置 図000003
  • 特許5956558-製品カテゴリ情報を判断する方法および装置 図000004
  • 特許5956558-製品カテゴリ情報を判断する方法および装置 図000005
  • 特許5956558-製品カテゴリ情報を判断する方法および装置 図000006
  • 特許5956558-製品カテゴリ情報を判断する方法および装置 図000007
  • 特許5956558-製品カテゴリ情報を判断する方法および装置 図000008
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5956558
(24)【登録日】2016年6月24日
(45)【発行日】2016年7月27日
(54)【発明の名称】製品カテゴリ情報を判断する方法および装置
(51)【国際特許分類】
   G06F 17/30 20060101AFI20160714BHJP
【FI】
   G06F17/30 210D
   G06F17/30 414A
【請求項の数】19
【全頁数】15
(21)【出願番号】特願2014-505177(P2014-505177)
(86)(22)【出願日】2012年4月2日
(65)【公表番号】特表2014-512614(P2014-512614A)
(43)【公表日】2014年5月22日
(86)【国際出願番号】US2012031875
(87)【国際公開番号】WO2012141934
(87)【国際公開日】20121018
【審査請求日】2015年3月6日
(31)【優先権主張番号】201110093430.9
(32)【優先日】2011年4月14日
(33)【優先権主張国】CN
(73)【特許権者】
【識別番号】510330264
【氏名又は名称】アリババ・グループ・ホールディング・リミテッド
【氏名又は名称原語表記】ALIBABA GROUP HOLDING LIMITED
(74)【代理人】
【識別番号】110001243
【氏名又は名称】特許業務法人 谷・阿部特許事務所
(72)【発明者】
【氏名】ミヤオ ウェン イエン
(72)【発明者】
【氏名】チエン ジエン ピン
【審査官】 齊藤 貴孝
(56)【参考文献】
【文献】 米国特許第07870039(US,B1)
【文献】 米国特許第06947936(US,B1)
【文献】 国際公開第2011/037603(WO,A1)
【文献】 特表2006−527886(JP,A)
【文献】 特表2003−528359(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
1つ以上のプロセッサによって実行される時、
製品と関連付けられる製品情報を受信することと、
1つ以上の単語セグメントを含む句を生成するように、前記製品情報上で単語セグメント化を行うことと、
前記句と、製品カテゴリツリーにおいて親ノードを有する複数のノードに対応する複数の製品カテゴリとの間の関連度を見出すことであって、前記複数のノードの各々は、製品カテゴリに対応し、前記関連度は、前記親ノードおよび前記複数のノードに対応するそれぞれの製品カテゴリに関連付けられた製品タイトル内に前記句が含まれているそれぞれの回数、および、前記親ノードおよび前記複数のノードに対応する前記それぞれの製品カテゴリ内に含まれている製品のそれぞれの数、に基づいている、見出すことと、
前記関連度に基づいて、前記複数のノードからあるノードを選択することと、を含む行為を実施する、コンピュータが実行可能な命令を記憶する、1つ以上のコンピュータが読み取り可能な媒体。
【請求項2】
前記親ノードは、前記製品カテゴリツリーのルートノードである、請求項1に記載の1つ以上のコンピュータが読み取り可能な媒体。
【請求項3】
前記行為は、
前記選択されたノードが前記製品カテゴリツリーのリーフノードであるかどうかを判断することと、
前記選択されたノードが前記リーフノードである場合、
前記製品情報を、前記ノードに対応する製品カテゴリと関連付けることであって、前記製品情報は、前記製品のタイトル情報を含む、関連付けることと、
前記選択されたノードが前記リーフノードではない場合、
前記選択されたノードが1つ以上のリーフノードを有するということを判断することと、
前記句と、前記1つ以上のリーフノードに対応する1つ以上の製品カテゴリとの間の関連度に基づいて、前記1つ以上のリーフノードのうちのあるリーフノードを判断することと、
前記タイトル情報を、前記リーフノードに対応する製品カテゴリと関連付けることと、をさらに含む、請求項1に記載の1つ以上のコンピュータが読み取り可能な媒体。
【請求項4】
前記行為は、
前記選択されたノードが前記リーフノードではない場合、
前記選択されたノードがリーフノードを有しないということを判断することと、
前記選択されたノードの1つ以上の子ノードを判断することと、をさらに含む、請求項3に記載の1つ以上のコンピュータが読み取り可能な媒体。
【請求項5】
前記行為は、
前記関連度が既定の閾値未満であるかどうかを判断することと、
前記関連度が前記既定の閾値未満である場合、前記1つ以上の単語セグメントに基づいて、別の句を生成することと、
前記別の句と、前記複数のノードに対応する前記複数の製品カテゴリとの間の他の関連度を見出すことと、をさらに含む、請求項1に記載の1つ以上のコンピュータが読み取り可能な媒体。
【請求項6】
前記ノードを選択することは、
前記複数のノードから1つ以上のノードを選択することであって、前記1つ以上のノードは、既定の値を上回る前記句との関連度を有する製品カテゴリに対応する、選択することと、
前記句と、前記1つ以上のノードに対応する前記製品カテゴリとの間の1つ以上の合計関連度を計算することと、
前記1つ以上の合計関連度に基づいて、前記1つ以上のノードから前記ノードを選択することと、を含む、請求項1に記載の1つ以上のコンピュータが読み取り可能な媒体。
【請求項7】
前記1つ以上の合計関連度は、単語セグメントの各々と、前記選択された1つ以上のノードに対応する前記製品カテゴリと間の関連度に基づいて計算される、合計関連度を含み、前記単語セグメントは、前記製品情報に基づいて生成される、請求項6に記載の1つ以上のコンピュータが読み取り可能な媒体。
【請求項8】
前記1つ以上の合計関連度は、1つ以上の句の各々と、前記選択された1つ以上のノードに対応する前記製品カテゴリとの間の関連度に基づいて計算される、合計関連度を含み、前記1つ以上の句は、前記単語セグメントに基づいて生成される、請求項6に記載の1つ以上のコンピュータが読み取り可能な媒体。
【請求項9】
前記行為は、
親ノードとして前記ノードを設定することと、
前記親ノードの1つ以上の子ノードを判断することと、をさらに含む、請求項1に記載の1つ以上のコンピュータが読み取り可能な媒体。
【請求項10】
コンピュータによって実行される方法であって、
製品情報を受信することと、
前記製品情報に基づいて生成される1つ以上の単語セグメントを含む句を形成することと、
製品カテゴリツリーの1つ以上のノードを判断することであって、前記1つ以上のノードは、親ノードと接続する、判断することと、
前記句と、前記1つ以上のノードに対応する製品カテゴリとの間の関連度に基づいて、前記1つ以上のノードのうちのあるノードを判断することであって、前記関連度は、前記親ノードおよび前記1つ以上のノードに対応するそれぞれの製品カテゴリに関連付けられた製品タイトル内に前記句が含まれているそれぞれの回数、および、前記親ノードおよび前記1つ以上のノードに対応する前記それぞれの製品カテゴリ内に含まれている製品のそれぞれの数、に基づいている、判断することと、を含む、方法。
【請求項11】
前記1つ以上のノードのうちの前記ノードを判断することは、1つ以上の句の各々、および前記1つ以上のノードに対応する前記製品カテゴリにさらに基づいて、前記1つ以上のノードのうちの前記ノードを判断することを含み、前記1つ以上の句は、前記1つ以上の単語セグメントに基づいて生成される、請求項10に記載の方法。
【請求項12】
前記判断されたノードが1つ以上のリーフノードを有するということを判断することと、
前記句と、前記1つ以上のリーフノードに対応するそれぞれの1つ以上の製品カテゴリとの間の関連度に基づいて、前記1つ以上のリーフノードのうちのあるリーフノードを判断することと、
前記製品情報を、前記リーフノードに対応する製品カテゴリと関連付けることと、をさらに含む、請求項10に記載の方法。
【請求項13】
前記判断されたノードがリーフノードを有しないということを判断することと、
前記判断されたノードの1つ以上の子ノードを判断することと、をさらに含む、請求項10に記載の方法。
【請求項14】
前記親ノードは、前記製品カテゴリツリーのルートノードである、請求項10に記載の方法。
【請求項15】
コンピュータによって実行される方法であって、
特定のノード、および製品カテゴリツリーと関連付けられる前記特定のノードの親ノードを判断することであって、前記特定のノードは、複数の製品タイトルを含む製品カテゴリに対応する、判断することと、
1つ以上の単語セグメントを含む句を生成するように、前記複数の製品タイトルのある製品タイトル上で単語セグメント化を行うことと、
前記句と前記複数の製品タイトルとの間の関係に基づいて、前記句と前記製品カテゴリとの間の関連度を計算することであって、前記関連度は、前記親ノードおよび前記特定のノードに対応するそれぞれの製品カテゴリに関連付けられた製品タイトル内に前記句が含まれているそれぞれの回数、および、前記親ノードおよび前記特定のノードに対応する前記それぞれの製品カテゴリ内に含まれている製品のそれぞれの数、に基づいている、計算することと、を含む、方法。
【請求項16】
前記関連度を計算することは、
前記特定のノードに対応する製品カテゴリ内に含まれる前記複数の製品タイトルの数、および
前記特定のノードの親ノードに対応する製品カテゴリに含まれる製品タイトルの数に基づいて、計算することを含む、請求項15に記載の方法。
【請求項17】
クラウドコンピューティングプラットフォームと関連付けられるデータベースに前記関連度を記憶することをさらに含む、請求項15に記載の方法。
【請求項18】
1つ以上のプロセッサと、前記1つ以上のプロセッサによって実行される時、請求項10−17のいずれか一項に記載された行為を前記1つ以上のプロセッサに実施させる実行可能命令を記憶するメモリと、を備えたシステム。
【請求項19】
1つ以上のプロセッサによって実行される時、請求項10−17のいずれか一項に記載された行為を前記1つ以上のプロセッサに実施させる実行可能命令を記憶する、1つ以上のコンピュータが読み取り可能な媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(相互参照の関連出願)
本出願は、2011年4月14日出願の「METHOD AND APPARATUS OF DETERMINING PRODUCT CATEGORY INFORMATION」と題する中国特許出願第201110093430.9号への優先権を主張するものであり、その全体として参照することにより本明細書に組み込まれる。
【0002】
本開示は、データ処理の分野に関する。より具体的には、本開示は、製品カテゴリ情報を判断する方法および装置に関する。
【背景技術】
【0003】
ユーザがサーバを通じて製品の情報をアップロードする時、ユーザは、サーバによって提供される製品カテゴリ情報に従って、アップロードされた製品のカテゴリを判断し、そのカテゴリを製品の情報と関連付けることが必要である。しかしながら、製品カテゴリ情報を判断する従来の技術は、何らかの問題(例えば、不正確な結果および非効率性)を提示し得る。例えば、サーバによって提供される製品カテゴリ情報が複雑である時、適切なカテゴリを選択することが困難であり得る。
【発明の概要】
【0004】
本開示は、製品カテゴリ情報を判断するための方法およびデバイスを提供する。一部の実施形態において、ユーザは、サーバに製品タイトル情報を提出することができる。サーバは、製品タイトル情報に基づいて、句を生成することができる。次いで、サーバは、句と、製品カテゴリツリーにおける複数のノードに対応する製品カテゴリとの間の関連度を見出すように、データベースを検索することができる。関連度に基づいて、サーバは、複数のノードからあるノードを選択することができる。サーバは、ノードが製品カテゴリツリーのリーフノード(leaf node)である時、製品タイトル情報を、製品カテゴリに対応するノードと関連付けることができる。
【0005】
一部の実施形態において、サーバは、製品カテゴリツリーのノードを選択することができる。ノードは、複数の製品タイトルを含む製品カテゴリに対応することができる。サーバは、複数の製品タイトルのうちのある製品タイトルに基づいて、句を生成し、次いで、句と複数の製品タイトルとの間の関係に基づいて、句と製品カテゴリとの間の関連度を計算することができる。
【図面の簡単な説明】
【0006】
発明を実施するための形態は、添付の図面を参照して説明される。異なる図面における同じ参照番号の使用は、類似または同一の項目を示す。
図1】例示的な製品カテゴリツリーの例解的な構造のブロック図である。
図2】製品カテゴリ情報を判断するための例解的なアーキテクチャのブロック図である。
図3】製品カテゴリ情報を判断するための例解的なプロセスの流れ図である。
図4】製品情報と製品カテゴリとの間の関連度を計算するための例解的なプロセスの流れ図である。
図5】製品カテゴリ情報を判断するための別の例解的なプロセスの流れ図である。
図6図2に示される環境において展開され得る、例解的なコンピューティングデバイスのブロック図である。
【発明を実施するための形態】
【0007】
本開示は、製品が関連付けられ得る製品カテゴリの検索の正確性および効率性を改善するための製品カテゴリ情報を判断する方法、システム、および装置を導入する。製品情報と対応する製品カテゴリ情報との間の関連度を計算し、データベースに記憶することができる。製品情報は、ユーザによって提供することができ、対応する製品カテゴリ情報は、サービスプロバイダによって提供することができる。一例として、関連度は、Product_ID−Product_Title_Information−Product_Category_IDとしてデータベースに記憶することができる。
【0008】
製品カテゴリは、製品カテゴリツリーのリーフノードに対応する製品カテゴリであり得る。製品カテゴリツリーにおいて、リーフノードのより高いレベルのノード(例えば、親ノード)が存在する一方、リーフノードのより低いレベルのノード(例えば、子ノード)は存在しない。製品情報は、リーフノードに対応する製品カテゴリと関連付けることができる。加えて、親ノードとそれらの子ノードとの間の関係により、各対応するノードは、製品カテゴリの判断の間、ルートノードからルートノードに接続される子ノードまで、および最終的には、対応するリーフノードまで判断される。したがって、製品カテゴリツリーにおいて、製品情報をリーフノードと関連付けることができ、リーフノードの親ノードに対応する製品カテゴリは、製品情報を含むことができる。
【0009】
図1は、例示的な製品カテゴリツリー100の例解的な構造のブロック図である。製品カテゴリツリー100は、ルートノード102を含むことができ、これは、3つの子ノード:植物園芸ノード104、3Cデジタルノード106、および女性のドレスノード108を含むことができ、これらは、3つの製品カテゴリに対応する。植物園芸ノード104は、2つの子ノード:植木鉢ノード110、および花の種ノード112をさらに含むことができる。植木鉢ノード110は、2つの子ノード:球根花ノード114、および芳香花ノード116を含むことができる。
【0010】
球根花ノード114および芳香花ノード116は、リーフノードであり得、これらは、それぞれ、球根花および芳香花の製品カテゴリに対応する。製品情報は、球根花ノード114および芳香花ノード116に対応する製品カテゴリと関連付けることができる。製品情報がリーフノード(例えば、球根花ノード114)と関連付けられた後、このリーフノードの関連付けられたより高いレベルのノード(例えば、植木鉢ノード110および植物園芸ノード104)は、製品情報も含むことができる。例えば、製品カテゴリツリーにおけるリーフノードから特定の関連付けられたより高いレベルのノードへのパスは、製品情報がリーフノードと関連付けられた後、データベースにおいて保有される。したがって、データベースにおいて保有される製品情報と関連付けられた製品カテゴリ情報との間の関連度は、Product_ID−Product_Title_Information−Associated_Root_Node_ID−Associated_Parent_Node_IDとして示すことができる。
【0011】
図2は、製品カテゴリ情報を判断するための例解的なアーキテクチャ200のブロック図である。アーキテクチャ200の下で、ユーザ202は、ユーザデバイス204を介してログインし、ユーザ202に製品カテゴリツリーを提供することができる、サーバ206に製品情報を提供することができる。ユーザ202は、ルートノードの子または孫ノードを選択することによって、リーフノードに対応する製品カテゴリを選ぶことができ、次いで、サーバ206は、製品情報を製品カテゴリに関連付けることができる。サーバ206は、ウェブサーバとして実装することができる。サーバ206が製品情報を製品カテゴリに関連付けた後、サーバ206は、記憶するために、データベース208に関連する情報を伝送することができる。一部の実施形態において、クラウドコンピューティングプラットフォーム210が実装されてもよい。例えば、クラウドコンピューティングプラットフォーム210は、Hadoopを含むことができる。
【0012】
クラウドコンピューティングプラットフォーム210は、分散型解析システム212、およびリアルタイム解析システム214を含むことができる。一部の実施形態において、クラウドコンピューティングプラットフォーム210は、データベース208から関連する情報を定期的に受信することができる。クラウドコンピューティングプラットフォーム210は、製品情報および関連付けられた製品カテゴリ情報を記憶し、情報を解析し、製品情報と製品カテゴリとの間の関連度を判断することができる。例えば、クラウドコンピューティングプラットフォーム210は、製品情報の各句と、製品カテゴリツリーの各対応する製品カテゴリとの間の関連度を判断することができる。一部の実施形態において、分散型解析システム212およびリアルタイム解析システム214は、関連度を判断するために実装することができる。分散型解析システム212は、オフライン分散型解析システムであってもよく、リアルタイム解析システム214は、オンラインリアルタイム解析システムであってもよい。クラウドコンピューティングプラットフォーム210は、製品カテゴリ情報を判断するように、サーバ206に、関連度と関連付けられる情報をさらに提供することができる。
【0013】
図3は、製品カテゴリ情報を判断するための例解的なプロセス300の流れ図である。302において、サーバ206は、ユーザ202によって提出することができる製品情報を受信することができる。製品情報は、製品タイトル情報、および製品の他の説明情報を含むことができる。一部の実施形態において、サーバ206は、他のサーバにおける製品情報をデータベースに組み込みつつ、他のサーバから製品情報を受信することができる。
【0014】
304において、サーバ206は、1つ以上の単語セグメントを含み、製品タイトルに対応する、各句を判断するように、製品タイトル情報上で単語セグメント化を行うことができる。一部の実施形態において、単語セグメントは、単語および/もしくは文字、または複数の単語および/もしくは文字であってもよい。306において、サーバ206は、各句と、ルートノード(例えば、ルートノード102)の各子ノード(例えば、植物園芸ノード104、3Cデジタルノード106、および女性のドレスノード108)との間の関連値を検索することができる。サーバ206は、句と各子ノードとの間の関連値に基づいて、句と製品カテゴリとの間の関連度を判断することができる。したがって、サーバ206は、各句と各製品カテゴリとの間の関連度を判断することができる。
【0015】
308において、サーバ206は、各句と各子ノードとの間の関連度に基づいて、製品情報に対応する特定のノードを判断することができる。一部の実施形態において、サーバ206は、既定の関連値を上回るある句に関する関連値を有する子ノードを選択することができる。一部の実施形態において、サーバ206は、製品タイトル情報、および各選択された子ノードに対応する製品カテゴリから導出される、全ての句間の合計関連度をさらに判断することができる。一部の実施形態において、サーバ206は、製品カテゴリが、他の製品カテゴリよりも最も大きな合計関連度を有するように、製品タイトル情報に対応する製品カテゴリを選択することができる。
【0016】
310において、サーバ206は、製品カテゴリに対応するルートノードの子ノードを、親ノードとして設定することができる。次いで、サーバ206は、製品タイトル情報に対応する製品を、親ノードから導出されるリーフノードに対応する製品カテゴリに関連付けることができる。
【0017】
図4は、製品情報と製品カテゴリとの間の関連度を計算するための例解的なプロセス400の流れ図である。402において、サーバ206は、各製品カテゴリのノードに対応する親ノードを判断することができる。一部の実施形態において、製品カテゴリは、各製品が属するカテゴリであってもよい。各製品カテゴリは、製品カテゴリツリーのノードに対応することができ、製品情報が関連付けられるノードは、リーフノードであってもよい。製品カテゴリツリーのルートノードから開始する製品カテゴリツリー100において、ノードは、互いに接続される。ルートノードは、子ノードを有し、リーフノードは、親ノードのみを有し、中間ノードは、親ノードおよび子ノードを有する。
【0018】
404において、サーバ206は、ノードに含まれる各製品の製品タイトル情報に対応する句を判断することができる。一部の実施形態において、サーバ206は、製品タイトルに対応する1つ以上の句を判断するように、製品タイトル情報上で単語セグメント化を行うことができる。句の各々は、1つ以上の単語セグメントを含むことができる。各句に対して、サーバ206は、句が親ノードに対応する製品カテゴリに含まれる製品タイトルに含有される数に基づいて、句と親ノードとの間の関連値を判断することができる。関連値は、句がそのノードに対応する製品カテゴリに含まれる製品タイトルに含有される数、ならびにそのノードおよび親ノードにそれぞれ対応する製品カテゴリに含まれる製品の数にさらに基づいて判定され得る。
【0019】
例えば、サーバ206は、句がそのノードに対応する製品カテゴリに含まれる製品タイトルに含有される数、およびそのノードに対応する製品カテゴリに含まれる製品の数に基づいて、句および対応するノードの重みを判断することができる。サーバ206は、ノードおよび親ノードにぞれぞれに対応する製品カテゴリに含まれる製品の数に基づいて、句および親ノードに対応する他の製品カテゴリの別の重みを判断することができる。2つの重みに基づいて、サーバ206は、句と対応する製品カテゴリとの間の関連値を計算することができる。各ノードに対して、製品タイトル情報の各句と、対応する製品カテゴリとの間の関連値を記憶することができる。
【0020】
例えば、各句と植木鉢110との間の関連度を判断するために、サーバ206は、植物園芸104を親ノードとして判断することができる。植木鉢110に含まれる製品タイトル情報に対して、サーバ206は、製品タイトル情報の各句と植木鉢110との間の関連値を計算することができる。各句と植物園芸104との間の関連度を判断するために、サーバ206は、植物園芸104の親ノードをルートノード102として識別することができる。植物園芸ノード104に含まれる各製品の製品タイトル情報に対して、サーバ206は、各句と植物園芸104との間の関連値を計算することができる。一部の実施形態において、サーバ206は、リーフノードから開始しルートノードまで、またはルートノードからリーフノードまでの関連値を計算することができる。
【0021】
ID「1000」を有する製品が、球根花ノード114と関連付けられると想定する。結果として、製品カテゴリツリー100に従って、球根花ノード114は、リーフノードであり、植木鉢ノード110は、その親ノードである。さらに、製品1000のタイトル情報が、「持ち運び可能な水栽培紫ヒヤシンス球根」であると想定する。結果として、サーバ206は、タイトル情報上で単語セグメント化を行い、「ヒヤシンス」に基づいて句を生成し、「ヒヤシンス」を含む句と、球根花ノード114との間の関連値を判断することができる。
【0022】
さらに、植木鉢ノード110に対応する製品カテゴリに関連する製品の数が、1,623,912であり、球根花ノード114に対応する製品カテゴリに関する製品の数が、104,286であると想定する。加えて、球根花ノード114の製品の製品タイトル情報における句「ヒヤシンス」の出現の数が、6,588であり、植木鉢ノード110の製品の製品タイトル情報における数が、20,683であると想定する。結果として、句「ヒヤシンス」に関する球根花ノード114の製品カテゴリの重みは、6.3%(即ち、6588/104286)である。植木鉢ノード110の他の製品の別の重みは、0.1%(即ち、(20683−6588)/(1623912−104286))である。したがって、句「ヒヤシンス」と、球根花114の製品カテゴリとの間の関連値は、85.3%(即ち、[6588/104286−(20683−6588)/(1623912−104286)]/(6588/104286))である。同様に、サーバ206は、句「ヒヤシンス」と、植木鉢ノード110の製品カテゴリとの間の関連値を判断することができる。
【0023】
一部の実施形態において、句は、複数の単語セグメント(例えば、「紫ヒヤシンス」または「ヒヤシンス ヒヤシンス球根」)を含み得る。例えば、3C電子機器のデジタル製品およびデジタル製品付属品に対して、製品タイトル情報の異なる単語と、異なる製品カテゴリとの間の関連度は、類似であり得る。各製品カテゴリに対する単一の単語セグメントに基づいて、どの製品カテゴリに製品が属するかを判断することは困難であり得る。例えば、「本物のSamsung Galaxy S i9000携帯電話バッテリ」を含む製品タイトル情報に対して、製品カテゴリ「携帯電話」と製品情報との間の関連度、および製品カテゴリ「携帯電話バッテリ」と製品情報との間の別の関連度は、実質的に類似であると判断し得る。問題を解決するために、サーバ206は、各製品カテゴリに対する少なくとも2つの単語セグメントを含む句間で関連度を判断することができる。例えば、サーバ206は、句「携帯電話バッテリ」と、製品カテゴリ「携帯電話バッテリ」との間の関連度を判断することができる。
【0024】
一部の実施形態において、単語セグメントを含む句と、各製品カテゴリとの間の関連度は、1次ベクトルとして設定されてもよく、少なくとも2つの単語を含む句と、各製品カテゴリとの間の関連度は、2次ベクトルとして設定されてもよい。
【0025】
各句と各製品カテゴリとの間の関連値を判断し、記憶した後、サーバ206は、例えば、ユーザ202によって提供される、製品タイトル情報に対応する製品カテゴリを判断することができる。
【0026】
図5は、製品カテゴリ情報を判断するための別の例解的なプロセス500の流れ図である。502において、サーバ206は、製品タイトル情報を含み得る製品情報を受信し得る。例えば、ユーザデバイス204は、製品情報をサーバ206に伝送し、製品カテゴリ判断を要求することができる。
【0027】
504において、サーバ206は、受信された製品タイトル情報に基づいて、単語セグメントを判断することができる。各単語セグメントは、製品カテゴリ判断のために使用することができる。一部の実施形態において、サーバ206は、製品タイトル情報を統一し、製品タイトル情報の各文字に対応する文字標準を判断することができる。例えば、製品情報が大文字および小文字の両方を有する時、サーバ206は、標準が大文字である場合、小文字を大文字に変換することができる。次いで、サーバは、製品タイトル情報上で単語セグメント化を行い、製品カテゴリ判断のための単語セグメントを取得するように、使用不可能な単語セグメント表に基づいて、ある単語セグメントを除去することができる。
【0028】
506において、サーバ206は、単語セグメントと、ルートノードまたは親ノードの各子ノードとの間のセグメント関連度を判断することができる。サーバ206は、句と各子ノードとの間の記憶された関連値に基づいて、セグメント関連度を判断することができる。
【0029】
508において、サーバ206は、セグメント関連度が、既定の閾値を下回るかどうかを判断することができる。セグメント関連度が閾値未満である場合(即ち、508からの「はい」分岐)、サーバ206は、509において、単語セグメントが製品タイトル情報の最後の単語であるかどうかを判断することができる。サーバ206が、単語セグメントが製品タイトル情報の最後の単語セグメントであると判断する場合(即ち、510からの「はい」分岐)、動作504〜510は、ループプロセスによって実施することができる(動作504に戻る動作510からの破線を介して)。サーバ206は、製品カテゴリ判断のための別の単語セグメントを選択することができる。単語セグメントが最後の単語セグメントではない場合(即ち、510からの「いいえ」分岐)、サーバ206は、512において、その単語セグメントおよびその単語セグメントの後の少なくとも別の単語セグメントを含む、句を生成することができる。
【0030】
セグメント関連度が閾値未満ではない場合(即ち、508からの「いいえ」分岐)、サーバ206は、514において、各単語セグメントに対応する子ノードを選択することができる。サーバは、単語セグメントに関して既定の値を上回る関連値を有する子ノードを選択することができる。一部の実施形態において、サーバは、単語セグメントに関して他の子ノードを上回る関連値を有する子ノードを選択することができる。一部の実施形態において、サーバ206は、動作512から生成される句に関する関連度を検索し、次いで、子ノードを判断することができる。
【0031】
516において、サーバ206は、各選択された子ノードに対応する製品カテゴリおよび製品タイトル情報に対する1つ以上の合計関連度を計算することができる。一部の実施形態において、サーバ206は、製品タイトル情報の各単語セグメントと選択された製品カテゴリとの間の関連度に基づいて、第1の合計関連度を判断することができる。一部の実施形態において、サーバ206は、単語セグメントから導出される各句と選択された製品カテゴリとの間の関連度に基づいて、第2の合計関連度を判断することができる。
【0032】
518において、サーバ206は、合計関連度に基づいて、製品タイトル情報に対応する特定の製品カテゴリを判断することができる。この特定の製品カテゴリは、最大の合計関連度を有し得る。一部の実施形態において、サーバ206は、第1の合計関連度および第2の合計関連度に基づいて、総合計関連度を計算することができ、特定の製品カテゴリは、最大の総合計関連度を有し得る。
【0033】
520において、サーバ206は、特定の製品カテゴリに対応するノードを親ノードとして設定し、次いで、対応する子ノードを判断することができる。動作506〜520は、製品タイトル情報がリーフノードに対応する製品カテゴリに関連付けられるまで、ループプロセスによって実施することができる(動作506に戻る動作520からの破線を介して)。
【0034】
例えば、製品の製品タイトル情報が、単語セグメントA、B、およびCを含み、製品カテゴリ設定数が3であると想定する。加えて、各単語セグメントと、製品タイトル情報に含有される各製品カテゴリとの間の関連度を、以下の表1に提供する。
【0035】
【表1】
【0036】
さらに、ルートノードに含有される子ノードに対応する製品カテゴリが、R1、R2、R3であり、単語Aと製品カテゴリR1、R2、およびR3との間の関連度が、50%、83%、および62%として判断され、単語Bと製品カテゴリR1、R3、およびR5との間の関連度が、40%、20%、および37%として判断され、単語Cと製品カテゴリR1、R2、およびR4との間の関連度が、42%、57%、および32%として判断されると想定する。設定関連度閾値が70%であると想定する。
【0037】
したがって、単語Aおよび単語Bによって構成される句と、製品カテゴリR1、R2、およびR5との間の関連度は、20%、40%、および30%として判断され、単語Aおよび単語Cによって構成される句と、製品カテゴリR1、R2、およびR3との間の関連度は、10%、30%、および40%として判断される。さらに、製品タイトル情報と製品カテゴリR1との間の第1の合計関連度は、132%であり、製品タイトル情報と製品カテゴリR2との間の第1の合計関連度は、140%であり、製品タイトル情報と製品カテゴリR3との間の第1の合計関連度は、82%であり、製品タイトル情報と製品カテゴリR4との間の第1の合計関連度は、32%であり、製品タイトル情報と製品カテゴリR5との間の第1の合計関連度は、37%である。
【0038】
加えて、製品タイトル情報と製品カテゴリR1との間の第2の合計関連度は、30%であり、製品タイトル情報と製品カテゴリR2との間の第2の合計関連度は、70%であり、製品タイトル情報と製品カテゴリR3との間の第2の合計関連度は、40%であり、製品タイトル情報と製品カテゴリR5との間の第2の合計関連度は、30%である。
【0039】
したがって、製品タイトル情報と製品カテゴリR1との間の合計関連度は、162%であり、製品タイトル情報と製品カテゴリR2との間の合計関連度は、210%であり、製品タイトル情報と製品カテゴリR3との間の合計関連度は、122%であり、製品タイトル情報と製品カテゴリR4との間の合計関連度は、32%であり、製品タイトル情報と製品カテゴリR5との間の合計関連度は、67%である。したがって、製品情報を含むノードは、製品カテゴリR2に対応するノードである。次いで、サーバ206は、製品タイトル情報がリーフノードに対応する製品カテゴリに関連付けられるまで、そのノードを親ノードとして設定し、親ノードの子ノードを判断し、製品タイトル情報に対応する新たに判断された子ノードの別のノードを判断することができる。
【0040】
図6は、図2に示される環境において展開され得る、例解的なコンピューティングデバイス600のブロック図である。サーバ206は、任意の好適なサーバ(複数を含む)として構成されてもよい。1つの例示的な構成において、サーバ206は、1つ以上のプロセッサ602、入力/出力インターフェース604、ネットワークインターフェース606、およびメモリ608を含む。
【0041】
メモリ608は、ランダムアクセスメモリ(RAM)といった揮発性メモリ、および/または読み取り専用メモリ(ROM)もしくはフラッシュRAMといった非揮発性メモリの形態のコンピュータが読み取り可能な媒体を含むことができる。メモリ608は、コンピュータが読み取り可能な媒体の例である。
【0042】
コンピュータが読み取り可能な媒体には、コンピュータが読み取り可能な命令、データ構造、プログラムモジュール、もしくは他のデータといった情報の記憶のための任意の方法または技術において実装される、揮発性および非揮発性、取り外し可能および取り外し不可能な媒体が含まれる。コンピュータ記憶媒体の例としては、相変化メモリ(PRAM)、静的ランダムアクセスメモリ(SRAM)、動的ランダムアクセスメモリ(DRAM)、他のタイプのランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、フラッシュメモリもしくは他のメモリ技術、コンパクトディスク読み取り専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)もしくは他の光学的記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶デバイス、またはコンピューティングデバイスによるアクセスのために情報を記憶するために使用することができる任意の他の非伝送媒体が含まれるが、これらに限定されない。本明細書において定義されるように、コンピュータが読み取り可能な媒体は、変調されたデータ信号および搬送波といった一時的媒体を含まない。
【0043】
より詳細にメモリ608を見ると、メモリ608は、モード判断モジュール610、制御モジュール612、関連度判断モジュール614、セグメント化モジュール616、検索モジュール618、および製品カテゴリ判断モジュール620を格納することができる。ノード判断モジュール610は、製品カテゴリツリー内の製品に対応するノード(例えば、子ノードおよび親ノード)を判断することができる。
【0044】
制御モジュール612は、製品タイトル情報上で単語セグメント化を行い、製品タイトル情報に対応する各句を判断することができる。句は、少なくとも1つの単語セグメントを含み得る。各句に対して、制御モジュール612は、対応する親ノードに対応する製品カテゴリに含有される製品タイトル情報における句の出現、ノードに対応する製品カテゴリに含有される製品タイトル情報における句の出現、そのノードに対応する製品カテゴリに含有される製品の数、および親ノードに対応する製品カテゴリに含有される製品の数に従って、句とそのノードに対応する製品カテゴリとの間の関連度を判断することができる。
【0045】
一部の実施形態において、サーバ206は、関連度表を記憶することができる。表は、各単語と各製品カテゴリとの間の関連度を有する表、および少なくとも2つの単語によって構成される各句と各製品カテゴリとの間の関連度を有する別の表を含むことができる。各句は、1つ以上の単語セグメントを含むことができる。サーバ206は、ルートノードに接続される各子ノード、および各子ノードと各句との間の保有された関連度に従って、各句と各子ノードとの間の関連度を判断することができる。サーバ206は、製品タイトル情報の各句と各子ノードとの間の関連度に従って、製品タイトル情報を含む子ノードを判断することができる。その後、サーバ206は、子ノードを親ノードとして設定し、親ノードの子ノードを判断することができる。したがって、製品タイトル情報の各句と各子ノードとの間の関連度を判断することができ、製品の製品タイトル情報がリーフノードに対応する製品カテゴリに関連付けられるまで、製品タイトル情報を含有する子ノードを判断することができる。
【0046】
一部の実施形態において、制御モジュール612は、ノードに対応する製品カテゴリに含有される製品タイトル情報における句の出現、およびノードに対応する製品カテゴリに含有される製品数に従って、句とノードに対応する製品カテゴリとの間の第1の重みを判断することができる。制御モジュール612は、父ノードに対応する製品カテゴリに含有される製品タイトル情報における句の出現、そのノードに対応する製品カテゴリに含有される製品タイトル情報における句の出現、そのノードに対応する製品カテゴリに含有される製品の数、および親ノードに対応する製品カテゴリに含有される製品の数に従って、句と父ノードに対応する製品カテゴリとの間の第2の重みを判断することができる。制御モジュール612は、第1の重みと第2の重みとの間の相違を判断することができ、相違および第1の重みの商に従って、句とそのノードに対応する製品カテゴリとの間の関連度を判断することができる。
【0047】
一部の実施形態において、制御モジュール612は、ノードに対応する製品カテゴリに含有される製品タイトル情報における句の出現、およびノードに対応する製品カテゴリに含有される製品数の商に従って、第1の重みを判断することができる。
【0048】
一部の実施形態において、制御モジュール612は、父ノードに対応する製品カテゴリに含有される製品タイトル情報における句の出現と、そのノードに対応する製品カテゴリに含有される製品タイトル情報における句の出現との間の第1の相違を判断することができる。制御モジュール612はまた、父ノードに対応する製品カテゴリに含有される製品数と、そのノードに対応する製品カテゴリに含有される製品数との間の第2の相違を判断し、次いで、第1の相違および第2の相違の商に従って第2の重みを判断することができる。
【0049】
一部の実施形態において、句と製品カテゴリとの間の関連度は、サーバ206に記憶することができる。サーバ206は、オンラインリアルタイム予測システムによって、製品が属する製品カテゴリを検索し、判断することができる。オンラインリアルタイム予測システムは、サーバ206に含むことができる。例えば、サーバ206は、アパッチモジュールを含むことができる。アパッチモジュールは、制御モジュール612およびノード判断610、ならびに関連度判断モジュール614によって実装することができる。
【0050】
関連度判断モジュール614は、句と、製品カテゴリツリーのノードに対応する製品カテゴリとの間の関連度を記憶することができる。セグメント化モジュール616は、製品タイトル情報を受信し、製品タイトル情報上で単語セグメント化を行い、製品タイトル情報に対応する各句を判断することができる。
【0051】
検索モジュール618は、受信された句とノードに対応する製品カテゴリとの間の関連値に従って、句と子ノードとの間の関連度を検索することができる。製品カテゴリ判断モジュールは、句と子ノードとの間の検索された関連度に従って、製品情報を含有するノードを判断し、子ノードを親ノードとして設定することができる。
【0052】
一部の実施形態において、検索モジュール618は、受信された各句と各製品カテゴリとの間の関連度に従って、句に含有される各製品カテゴリに対応する子ノードを判断することができる。検索モジュール618は、記憶された句と子ノードに対応する製品カテゴリとの間の関連度を、検索された句と子ノードとの間の関連度として設定することができる。一部の実施形態において、検索モジュール618は、句と子ノードとの間の検索された関連度が、事前設定された関連度閾値を上回るかどうかを判断することができる。
【0053】
製品カテゴリ判断モジュール620は、製品の製品タイトル情報が、リーフノードに対応する製品カテゴリと関連付けられるまで、親ノードの子ノードを判断することができる。一部の実施形態において、製品カテゴリ判断モジュール620は、検索された句に対応する既定の値を上回る関連度を有する子ノードを選択することができる。製品カテゴリ判断モジュール620は、製品タイトル情報の各句と製品カテゴリとの間の関連度に基づいて、製品タイトル情報と製品カテゴリとの間の合計関連度を判断することができる。製品カテゴリ判断モジュール620は、最大の合計関連度を有する製品カテゴリを、製品情報を含有するノードに対応する製品カテゴリとして判断することができる。
【0054】
本開示における実施形態は、例解目的に過ぎず、本開示の範囲を制限することは意図されない。当業者は、本開示において提供される実施形態に変更および改変を行うことができるであろう。当業者が理解するであろういかなる変更および改変も、本開示の範囲内である。
図1
図2
図3
図4
図5
図6