(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-14
(45)【発行日】2022-06-22
(54)【発明の名称】データ変形システムおよび方法
(51)【国際特許分類】
G06F 16/90 20190101AFI20220615BHJP
G06F 5/00 20060101ALI20220615BHJP
G06F 40/40 20200101ALI20220615BHJP
G06Q 30/06 20120101ALI20220615BHJP
【FI】
G06F16/90
G06F5/00
G06F40/40
G06Q30/06 300
(21)【出願番号】P 2021016114
(22)【出願日】2021-02-03
(62)【分割の表示】P 2017552171の分割
【原出願日】2016-04-07
【審査請求日】2021-03-04
(32)【優先日】2015-04-08
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】517344343
【氏名又は名称】LISUTO株式会社
(74)【代理人】
【識別番号】100080791
【氏名又は名称】高島 一
(74)【代理人】
【識別番号】100136629
【氏名又は名称】鎌田 光宜
(74)【代理人】
【識別番号】100125070
【氏名又は名称】土井 京子
(74)【代理人】
【識別番号】100121212
【氏名又は名称】田村 弥栄子
(74)【代理人】
【識別番号】100174296
【氏名又は名称】當麻 博文
(74)【代理人】
【識別番号】100137729
【氏名又は名称】赤井 厚子
(74)【代理人】
【識別番号】100151301
【氏名又は名称】戸崎 富哉
(74)【代理人】
【識別番号】100170184
【氏名又は名称】北脇 大
(72)【発明者】
【氏名】プラテック、ニール
(72)【発明者】
【氏名】ザスラフスキー、パヴェル
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特開平09-081569(JP,A)
【文献】特開平11-085758(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 5/00
G06F 40/40
G06Q 30/06
(57)【特許請求の範囲】
【請求項1】
データを変形する方法であって:
第1の言語固有の形式のデータを受け取ることを有し;
前記第1の言語固有の形式の前記データを、言語非依存型の形式に変換することを有し;
前記言語非依存型の形式の前記データを貯蔵することを有し;かつ
前記第1の言語固有の形式の前記データを構造化されていないデータから構造化データに変換することを有し、かつ、前記の第1の言語固有の形式の前記データを前記言語非依存型の形式に変換することが、前記の第1の言語固有の形式の前記構造化データを前記言語非依存型の形式の構造化データに変換することを有する、
前記データを変形する方法。
【請求項2】
さらに:
前記言語非依存型の形式の前記データを、少なくとも一つの第2の言語固有の形式に変換することを有し;
オンデマンドで、前記少なくとも一つの第2の言語固有の形式のうちの少なくとも一つの前記データをエクスポートすることを有し;かつ、
前記少なくとも一つの第2の言語固有の形式が、少なくとも前記第1の言語固有の形式を有する、
請求項1に記載のデータを変形するための方法。
【請求項3】
前記少なくとも一つの第2の言語固有の形式のデータが、前記第1の言語固有の形式の言語と同一の言語のデータを有する、請求項2に記載の方法。
【請求項4】
前記第1の言語固有の形式の前記データが構造化されていないデータであり;かつ、
前記言語非依存型の形式が構造化された言語非依存型の形式である、
請求項1-3のいずれか一項に記載のデータを変形するための方法。
【請求項5】
前記第1の言語固有の形式の前記データを受け取ることが、第1の言語固有の形式の構造化されていない製品データを受け取ることを有し;
当該方法はまた:
構造化された言語非依存型の製品データベースを提供することを有し、該構造化された言語非依存型の製品データベースは、多数の製品のそれぞれについて、多数の構造化された言語非依存型の製品属性値を貯蔵するように構成されており、該多数の構造化された言語非依存型の製品属性値は、対応する多数の構造化された言語非依存型の製品属性に割り当てられたものであり;かつ、
前記構造化されていない製品データを分析し、かつ、前記第1の言語固有の形式の前記構造化されていない製品データから、構造化されていない製品固有属性値を抽出することを有し、該構造化されていない製品固有属性値は、対応する構造化されていない製品属性に割り当てられたものであり;
前記言語非依存型の形式の前記データを、少なくとも一つの第2の言語固有の形式に変換することが、対応する構造化されていない製品属性に割り当てられた、前記構造化されていない製品固有属性値を、構造化された言語非依存型の形式に変換することを有し;かつ、
当該方法はさらに:
前記対応する構造化された言語非依存型の製品属性に割り当てられた、前記構造化された言語非依存型の製品固有属性値が、前記構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連するか否かを確認することを有し;
前記対応する構造化された言語非依存型の製品属性に割り当てられた、前記構造化された言語非依存型の製品固有属性値が、前記構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連しないことを確認することに応答して、前記対応する構造化された言語非依存型の製品属性に割り当てられた、前記構造化された言語非依存型の製品固有属性値を有する新製品を、前記構造化された言語非依存型の製品データベースに追加することを含み;かつ、
前記対応する構造化された言語非依存型の製品属性に割り当てられた、前記構造化された言語非依存型の製品固有属性値が、前記構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連することを確認することに応答して、前記構造化された言語非依存型の製品固有属性値を、前記特定の製品の前記対応する言語非依存型の構造化された製品属性に割り当てることを含む、
請求項2または3に記載のデータを変形するための方法。
【請求項6】
前記の第1の言語固有の形式の前記構造化されていない製品データを受け取ることが、前記の第1の言語固有の形式の前記構造化されていない製品データを、前記第1の言語固有の形式の前記構造化されていない製品データに記載された製品の売主から受け取ることを有する、
請求項5に記載のデータを変形するための方法。
【請求項7】
前記の第1の言語固有の形式の前記構造化されていない製品データを受け取ることが、前記の第1の言語固有の形式の前記構造化されていない製品データを、複数の電子商取引プラットフォームのいずれかから自動的に引き出すことを有する、
請求項5に記載のデータを変形するための方法。
【請求項8】
前記多数の製品が、多数の製品カテゴリーに分類される、
請求項5-7のいずれか一項に記載のデータを変形するための方法。
【請求項9】
前記構造化された言語非依存型の形式の前記データまたは前記少なくとも一つの第2の言語固有の形式のデータを、少なくとも部分的に複数の第三者の電子商取引プラットフォームのいずれかへのエクスポートに適したフォーマットに変換することもまた有し;かつ、
前記複数の第三者の電子商取引プラットフォームのうちの特定の一つへのエクスポートに適した前記フォーマットの前記製品データを、前記複数の第三者の電子商取引プラットフォームのうちの前記特定の一つにエクスポートすることもまた有する、
請求項5-8のいずれか一項に記載のデータを変形するための方法。
【請求項10】
前記の対応する構造化されていない製品属性に割り当てられた、前記構造化されていない製品固有属性値を、前記構造化された言語非依存型の形式に変換することが:
前記第1の言語固有の形式の前記構造化されていない製品固有属性値および前記構造化されていない製品属性が、ディクショナリ内に含まれているか否かを確認することを有し、前記ディクショナリは、その中に含まれている各製品属性および製品属性値について、
言語非依存型の識別子と、前記第1の言語の形式のうちの少なくとも一つおよび前記少なくとも一つの第2の言語固有の形式のそれぞれへのその翻訳とを有し;
前記構造化されていない製品固有属性値および前記構造化されていない製品属性が、前記ディクショナリ内に含まれていることを確認することに応答して、前記ディクショナリを前記構造化されていない製品固有属性値および前記構造化されていない製品属性を、前記構造化された言語非依存型の形式に変換するために使用することを有し;かつ、
前記構造化されていない製品固有属性値および前記構造化されていない製品属性が、前記ディクショナリ内に含まれていないことを確認することに応答して、前記第1の言語固有の形式の前記構造化されていない製品固有属性値および前記構造化されていない製品属性のそれぞれを、前記ディクショナリに追加し、かつ、言語非依存型の識別子を、前記構造化されていない製品固有属性値および前記構造化されていない製品属性のそれぞれに割り当てることを有する、
請求項5-9のいずれか一項に記載のデータを変形するための方法。
【請求項11】
データを変形するためのシステムであって:
データ受取機能を有し、該データ受取機能は、第1の言語固有の形式のデータを受け取るように作動可能であり;
言語固有のデータから言語非依存型のデータへの変換機能を有し、該言語固有のデータから言語非依存型のデータへの変換機能は、前記第1の言語固有の形式の前記データを言語非依存型の形式に変換するように作動可能であり;
言語非依存型のデータベースを有し、該言語非依存型のデータベースは、前記言語非依存型の形式の前記データを貯蔵するように構成されており;
前記言語固有のデータから言語非依存型のデータへの変換機能がまた:
前記第1の言語固有の形式の前記データを、構造化されていないデータから構造化データに変換するように作動可能であり;かつ、
前記第1の言語固有の形式の前記構造化データを、前記言語非依存型の形式の構造化データに変換するように作動可能である、
前記データを変形するためのシステム。
【請求項12】
さらに:
言語非依存型のデータから言語固有のデータへの変換機能を有し、該言語非依存型のデータから言語固有のデータへの変換機能は、前記言語非依存型の形式の前記データを少なくとも一つの第2の言語固有の形式に変換するように作動可能であり;かつ、
データエクスポート機能を有し、該データエクスポート機能は、オンデマンドで、前記少なくとも一つの第2の言語固有の形式の少なくとも一つの前記データをエクスポートするように作動可能であり、
前記少なくとも一つの第2の言語固有の形式が、少なくとも前記第1の言語固有の形式を有する、
請求項11に記載のデータを変形するためのシステム。
【請求項13】
前記少なくとも一つの第2の言語固有の形式のデータが、前記第1の言語固有の形式の言語と同一の言語のデータを有する、請求項12に記載のデータを変形するためのシステム。
【請求項14】
前記第1の言語固有の形式の前記データが構造化されていないデータであり;かつ、
前記言語非依存型の形式が構造化された言語非依存型の形式である、
請求項11-13のいずれか一項に記載のデータを変形するためのシステム。
【請求項15】
前記第1の言語固有の形式の前記データを受け取ることが、第1の言語固有の形式の構造化されていない製品データを受け取ることを有し;
当該システムはまた、構造化された言語非依存型の製品データベースを有し、該構造化された言語非依存型の製品データベースは、多数の製品のそれぞれについて、多数の構造化された言語非依存型の製品属性値を貯蔵するように構成されており、該多数の構造化された言語非依存型の製品属性値は、対応する多数の構造化された言語非依存型の製品属性に割り当てられたものであり;
当該システムは追加的に:
データ抽出機能を含んでおり、該データ抽出機能は、前記構造化されていない製品データを分析し、かつ、前記第1の言語固有の形式の前記構造化されていない製品データから、構造化されていない製品固有属性値を抽出するものであり、該構造化されていない製品固有属性値は、対応する構造化されていない製品属性に割り当てられたものであり;
前記言語非依存型の形式の前記データを、少なくとも一つの第2の言語固有の形式に変換することが、前記構造化されていない製品固有属性値を構造化された言語非依存型の形式に変換することを有し、該構造化されていない製品固有属性値は、対応する構造化されていない製品属性に割り当てられたものであり;かつ、
当該システムはさらに、製品マッチング機能を含み、該製品マッチング機能は:
前記対応する構造化された言語非依存型の製品属性に割り当てられた、前記構造化された言語非依存型の製品固有属性値が、前記構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連するか否かを確認するものであり;
前記対応する構造化された言語非依存型の製品属性に割り当てられた、前記構造化された言語非依存型の製品固有属性値が、前記構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連しないことを確認することに応答して、前記対応する構造化された言語非依存型の製品属性に割り当てられた、前記構造化された言語非依存型の製品固有属性値を有する新製品を、前記構造化された言語非依存型の製品データベースに追加するものであり;かつ、
前記対応する構造化された言語非依存型の製品属性に割り当てられた、前記構造化された言語非依存型の製品固有属性値が、前記構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連することを確認することに応答して、前記構造化された言語非依存型の製品固有属性値を、前記特定の製品の前記対応する言語非依存型の構造化された製品属性に割り当てるものである、
請求項12または13に記載のデータを変形するためのシステム。
【請求項16】
前記言語非依存型のデータから言語固有のデータへの変換機能がまた、前記構造化された言語非依存型の形式の前記製品データまたは前記少なくとも一つの第2の言語固有の形式の製品データを、少なくとも部分的に複数の第三者の電子商取引プラットフォームのいずれかへのエクスポートに適したフォーマットに変換するように作動可能であり;かつ、
前記データエクスポート機能がまた、前記複数の第三者の電子商取引プラットフォームのうちの特定の一つへのエクスポートに適した前記フォーマットの前記製品データを、前記複数の第三者の電子商取引プラットフォームのうちの前記特定の一つにエクスポートするように作動可能である、
請求項15に記載のデータを変形するためのシステム。
【請求項17】
前記構造化されていない言語固有のデータから構造化された言語非依存型のデータへの変換機能がまた:
前記第1の言語固有の形式の前記構造化されていない製品固有属性値および前記構造化されていない製品属性が、ディクショナリ内に含まれているか否かについて確認するように作動可能であり、該ディクショナリは、その中に有されている各製品属性および製品属性値について、言語非依存型の識別子と、前記第1の言語の形式のうちの少なくとも一つおよび前記少なくとも一つの第2の言語固有の形式のそれぞれへのその翻訳とを有し;
前記構造化されていない製品固有属性値および前記構造化されていない製品属性が、前記ディクショナリ内に含まれていることを確認することに応答して、前記構造化されていない製品固有属性値および前記構造化されていない製品属性を前記構造化された言語非依存型の形式に変換するために、前記ディクショナリを使用するように作動可能であり;かつ、
前記構造化されていない製品固有属性値および前記構造化されていない製品属性が、前記ディクショナリ内に含まれていないことを確認することに応答して、前記第1の言語固有の形式の前記構造化されていない製品固有属性値および前記構造化されていない製品属性のそれぞれを、前記ディクショナリに追加し、かつ、言語非依存型の識別子を、前記構造化されていない製品固有属性値および前記構造化されていない製品属性のそれぞれに割り当てるように作動可能である、
請求項15または16に記載のデータを変形するためのシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の参照
ここで、2015年4月8日に出願され、「データ伝達システムおよび方法(Data Transmission System and Method)」と題する、米国仮特許出願第62/144,407号
が参照され、その開示は参照により本明細書に組み込まれ、かつ、37 C.F.R 1.78(a)(1)に従いその優先権が主張される。
【0002】
発明の分野
本発明は、データ変形(data transformation)のための方法とシステムに関する。
【背景技術】
【0003】
発明の背景
種々のデータ変形システムおよび方法が知られている。
【発明の概要】
【0004】
本発明は、データ変形のための改良された方法およびシステムを提供しようとするものである。
【0005】
よって、本発明の好ましい実施形態に従い、データを変形(transforming)する方法が提供されており、当該方法は、第1の言語固有(specific)の形式のデータを受け取ることを含み、第1の言語固有の形式(form)のデータを言語非依存型(language agnostic
)の形式に変換(converting)することを含み、言語非依存型の形式のデータを貯蔵することを含み、言語非依存型の形式のデータを少なくとも一つの第2の言語固有の形式に変換することを含み、かつ、オンデマンドで(on demand;要求に応じて)、少なくとも一
つの第2の言語固有の形式のうちの少なくとも一つのデータをエクスポートすることを含む。
【0006】
好ましくは、言語非依存型の形式のデータを少なくとも一つの第2の言語固有の形式に変換することは、オンデマンドで行われる。
【0007】
本発明の好ましい実施形態に従い、少なくとも一つの第2の言語固有の形式のデータは、複数の第2の言語固有の形式のデータを含む。代替的には、少なくとも一つの第2の言語固有の形式のデータは、単一の第2の言語固有の形式のデータを含む。
【0008】
本発明の好ましい実施形態に従い、少なくとも一つの第2の言語固有の形式は、少なくとも第1の言語固有の形式を含む。好ましくは、少なくとも一つの第2の言語固有の形式のデータは、第1の言語固有の形式の言語と同一の言語のデータを含む。
【0009】
好ましくは、データを変形する方法はまた、第1の言語固有の形式のデータを構造化されていない(unstructured)データから構造化(structured)データに変換することを含み、かつ、第1の言語固有の形式のデータを言語非依存型の形式に変換することは、第1の言語固有の形式の構造化データを言語非依存型の形式の構造化データ(structured data in the language agnostic form)に変換することを含む。
【0010】
本発明の好ましい実施形態に従い、第1の言語固有の形式のデータは、物体(object)に関する。追加的には、物体は、商品(article)を含む。好ましくは、商品の属性(attributes)は、データにより説明される。追加的には、データは、対応する商品の属性に
割り当てられた属性値を含む。
【0011】
また、本発明の別の好ましい実施形態に従い、データを変形するためのシステムが提供されており、当該システムは、
データ受取機能を含み、該データ受取機能は、第1の言語固有の形式のデータを受け取るように作動可能であり、
言語固有のデータから言語非依存型のデータへの変換機能を含み、該言語固有のデータから言語非依存型のデータへの変換機能は、第1の言語固有の形式のデータを言語非依存型の形式に変換するように作動可能であり、
言語非依存型のデータベースを含み、該言語非依存型のデータベースは、言語非依存型の形式のデータを貯蔵するように構成されており、
言語非依存型のデータから言語固有のデータへの変換機能を含み、該言語非依存型のデータから言語固有のデータへの変換機能は、言語非依存型の形式のデータを少なくとも一つの第2の言語固有の形式に変換するように作動可能であり、かつ、
データエクスポート機能を含み、該データエクスポート機能は、オンデマンドで、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つのデータをエクスポートするように作動可能である。
【0012】
本発明の好ましい実施形態に従い、言語非依存型のデータから言語固有のデータへの変換機能は、オンデマンドで、言語非依存型の形式のデータを少なくとも一つの第2の言語固有の形式に変換するように作動可能である。
【0013】
好ましくは、少なくとも一つの第2の言語固有の形式のデータは、複数の第2の言語固有の形式のデータを含む。代替的には、少なくとも一つの第2の言語固有の形式のデータは、単一の第2の言語固有の形式のデータを含む。
【0014】
本発明の好ましい実施形態に従い、少なくとも一つの第2の言語固有の形式は、少なくとも第1の言語固有の形式を含む。好ましくは、少なくとも一つの第2の言語固有の形式のデータは、第1の言語固有の形式の言語と同一の言語のデータを含む。
【0015】
好ましくは、言語固有のデータから言語非依存型のデータへの変換機能はまた、第1の言語固有の形式のデータを構造化されていないデータから構造化データに変換するように作動可能であり、かつ、第1の言語固有の形式の構造化データを言語非依存型の形式の構造化データに変換するように作動可能である。
【0016】
好ましくは、第1の言語固有の形式のデータは、物体に関する。追加的には、物体は、商品を含む。好ましくは、商品の属性は、データにより説明される。追加的には、データは、対応する商品の属性に割り当てられた属性値を含む。
【0017】
さらに、本発明の好ましい実施形態に従い、データを変形するための方法が提供されており、当該方法は、第1の言語固有の形式の構造化されていないデータを受け取ることを含み、第1の言語固有の形式の構造化されていないデータを、構造化された言語非依存型の形式(structured language agnostic form)に変換することを含み、構造化された言
語非依存型の形式のデータを貯蔵することを含み、構造化された言語非依存型の形式のデータを少なくとも一つの第2の言語固有の形式に変換することを含み、かつ、オンデマンドで、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つのデータをエクスポートすることを含む。
【0018】
本発明の好ましい実施形態に従い、構造化された言語非依存型の形式のデータを少なくとも一つの第2の言語固有の形式に変換することは、オンデマンドで行われる。
【0019】
本発明の好ましい実施形態に従い、少なくとも一つの第2の言語固有の形式のデータは、複数の第2の言語固有の形式のデータを含む。代替的には、少なくとも一つの第2の言語固有の形式のデータは、単一の第2の言語固有の形式のデータを含む。
【0020】
好ましくは、少なくとも一つの第2の言語固有の形式は、少なくとも第1の言語固有の形式を含む。好ましくは、少なくとも一つの第2の言語固有の形式のデータは、第1の言語固有の形式の言語と同一の言語のデータを含む。
【0021】
本発明の好ましい実施形態に従い、データを変形する方法はまた、第1の言語固有の形式の構造化されていないデータを、構造化されていないデータから構造化データに変換することを含み、かつ、第1の言語固有の形式の構造化されていないデータを構造化された言語非依存型の形式に変換することは、第1の言語固有の形式の構造化データを、言語非依存型の形式の構造化データに変換することを含む。
【0022】
好ましくは、第1の言語固有の形式のデータは、物体に関する。追加的には、物体は、商品を含む。本発明の好ましい実施形態に従い、商品の属性は、データにより説明される。追加的には、データは、対応する商品の属性に割り当てられた属性値を含む。
【0023】
さらにまた、本発明のまた別の好ましい実施形態に従い、データを変形するためのシステムが提供されており、当該システムは、
構造化されていないデータ受取機能を含み、該構造化されていないデータ受取機能は、第1の言語固有の形式の構造化されていないデータを受け取るように作動可能であり、
構造化されていない言語固有のデータから構造化された言語非依存型のデータへの変換機能を含み、該構造化されていない言語固有のデータから構造化された言語非依存型のデータへの変換機能は、第1の言語固有の形式の構造化されていないデータを構造化された言語非依存型の形式に変換するように作動可能であり、
構造化された言語非依存型のデータベースを含み、該構造化された言語非依存型のデータベースは、構造化された言語非依存型の形式のデータを貯蔵するように構成されており、
言語非依存型のデータから言語固有のデータへの変換機能を含み、該言語非依存型のデータから言語固有のデータへの変換機能は、構造化された言語非依存型の形式のデータを少なくとも一つの第2の言語固有の形式に変換するように作動可能であり、かつ、
データエクスポート機能を含み、該データエクスポート機能は、オンデマンドで、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つのデータをエクスポートするように作動可能である。
【0024】
本発明の好ましい実施形態に従い、言語非依存型のデータから言語固有のデータへの変換機能は、オンデマンドで、構造化された言語非依存型の形式のデータを少なくとも一つの第2の言語固有の形式に変換するように作動可能である。
【0025】
好ましくは、少なくとも一つの第2の言語固有の形式の前記データは、複数の第2の言語固有の形式のデータを含む。代替的には、少なくとも一つの第2の言語固有の形式のデータは、単一の第2の言語固有の形式のデータを含む。
【0026】
本発明の好ましい実施形態に従い、少なくとも一つの第2の言語固有の形式は、少なくとも第1の言語固有の形式を含む。好ましくは、少なくとも一つの第2の言語固有の形式のデータは、第1の言語固有の形式の言語と同一の言語のデータを含む。
【0027】
本発明の好ましい実施形態に従い、構造化されていない言語固有のデータから構造化さ
れた言語非依存型のデータへの変換機能は、第1の言語固有の形式のデータを構造化されていないデータから構造化データに変換するように作動可能であり、かつ、第1の言語固有の形式の構造化データを言語非依存型の形式の構造化データに変換するように作動可能である。
【0028】
好ましくは、第1の言語固有の形式のデータは、物体に関する。追加的には、物体は、商品を含む。本発明の好ましい実施形態に従い、商品の属性は、データにより説明される。追加的には、データは、対応する商品の属性に割り当てられた属性値を含む。
【0029】
そのうえにまた、本発明のさらに別の好ましい実施形態に従い、製品(product)デー
タを変形するための方法が提供されており、当該方法は、
構造化された言語非依存型の製品データベースを提供することを含み、該構造化された言語非依存型の製品データベースは、多数の製品のそれぞれについて、対応する多数の構造化された言語非依存型の製品属性に割り当てられた、多数の構造化された言語非依存型の製品属性値を貯蔵するように構成されており、
第1の言語固有の形式の構造化されていない製品データを受け取ることを含み、
構造化されていない製品データを分析し、かつ、第1の言語固有の形式の構造化されていない製品データから、構造化されていない製品固有属性値(product-specific attribute value)を抽出することを含み、該構造化されていない製品固有属性値は、対応する構造化されていない製品属性に割り当てられたものであり、
構造化されていない製品固有属性値(対応する構造化されていない製品属性に割り当てられたものである)を、構造化された言語非依存型の形式に変換することを含み、
構造化された言語非依存型の製品固有属性値(対応する構造化された言語非依存型の製品属性に割り当てられたものである)が、構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連するか否かを確認することを含み、
構造化された言語非依存型の製品データベースは、多数の製品のそれぞれについて、多数の構造化された言語非依存型の製品属性値(対応する多数の構造化された言語非依存型の製品属性に割り当てられたものである)を貯蔵するように構成されており、
構造化された言語非依存型の製品固有属性値(対応する構造化された言語非依存型の製品属性に割り当てられたものである)が、構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連しないことを確認することに応答して、構造化された言語非依存型の製品固有属性値(対応する構造化された言語非依存型の製品属性に割り当てられたものである)を有する新製品を、構造化された言語非依存型の製品データベースに追加することを含み、かつ、
構造化された言語非依存型の製品固有属性値(対応する構造化された言語非依存型の製品属性に割り当てられたものである)が、構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連することを確認することに応答して、構造化された言語非依存型の製品固有属性値を、特定の製品の対応する言語非依存型の構造化された製品属性に割り当てることを含む。
【0030】
好ましくは、第1の言語固有の形式の構造化されていない製品データを受け取ることは、第1の言語固有の形式の構造化されていない製品データを第1の言語固有の形式の構造化されていない製品データに記載された製品の売主から受け取ることを含む。代替的には、第1の言語固有の形式の構造化されていない製品データを受け取ることは、第1の言語固有の形式の構造化されていない製品データを複数の電子商取引プラットフォームのいずれかから自動的に引き出すことを含む。
【0031】
好ましくは、多数の製品は、多数の製品カテゴリーに分類される。追加的には、製品データを変形するための方法はまた、製品を製品カテゴリーのうちの少なくとも一つに分類することを含む。好ましくは、製品データを変形するための方法はまた、構造化されてい
ない製品データをその中に記載された製品を製品カテゴリーのうちの少なくとも一つに分類するために分析することを含む。追加的には、製品データを変形するための方法はまた、構造化された言語非依存型の製品固有属性値(対応する言語非依存型の構造化された製品属性に割り当てられたものである)が、構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連するか否かを確認することのために分類することを使用することを含む。
【0032】
本発明の好ましい実施形態に従い、製品データを変形するための方法はまた、構造化された言語非依存型の形式のデータを少なくとも一つの第2の言語固有の形式に変換することを含み、かつ、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つの製品データをエクスポートすることを含む。
【0033】
好ましくは、製品データを変形するための方法はまた、構造化された言語非依存型の形式のデータを複数の第三者の電子商取引プラットフォームのいずれかへのエクスポートに適したフォーマットに変換することを含み、かつ、複数の第三者の電子商取引プラットフォームのうちの特定の一つへのエクスポートに適したフォーマットの製品データを複数の第三者の電子商取引プラットフォームのうちの特定の一つにエクスポートすることを含む。
【0034】
本発明の好ましい実施形態に従い、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つの製品データをエクスポートすることは、オンデマンドなものである。代替的には、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つの製品データをエクスポートすることは、自動である。
【0035】
好ましくは、構造化されていない製品固有属性値(対応する構造化されていない製品属性に割り当てられたものである)を、構造化された言語非依存型の形式に変換することは、第1の言語固有の形式の構造化されていない製品固有属性値および構造化されていない製品属性がディクショナリ内に含まれているか否かを確認することを含み、ディクショナリは、その中に含まれている各製品属性および製品属性値について、言語非依存型の識別子と、第1の言語の形式のうちの少なくとも一つおよび少なくとも一つの第2の言語固有の形式のそれぞれへのその翻訳とを含み、構造化されていない製品固有属性値および構造化されていない製品属性がディクショナリ内に含まれていることを確認することに応答して、ディクショナリを構造化されていない製品固有属性値および構造化されていない製品属性を構造化された言語非依存型の形式に変換するために使用することを含み、かつ、構造化されていない製品固有属性値および構造化されていない製品属性がディクショナリ内に含まれていないことを確認することに応答して、第1の言語固有の形式の構造化されていない製品固有属性値および構造化されていない製品属性のそれぞれをディクショナリに追加すること、および、言語非依存型の識別子を構造化されていない製品固有属性値および構造化されていない製品属性のそれぞれに割り当てることを含む。
【0036】
本発明の好ましい実施形態に従い、構造化されていない製品固有属性値(対応する構造化されていない製品属性に割り当てられたものである)を、構造化された言語非依存型の形式に変換することはまた、構造化されていない製品固有属性値および構造化されていない製品属性がディクショナリ内に含まれていないことを確認することに応答して、構造化されていない製品固有属性値および構造化されていない製品属性をディクショナリに少なくとも一つの第2の言語固有の形式のそれぞれに自動的に翻訳すること、および、翻訳をディクショナリに追加することを含む。好ましくは、構造化されていない製品固有属性値(対応する構造化されていない製品属性に割り当てられたものである)を、構造化された言語非依存型の形式に変換することはまた、構造化されていない製品固有属性値および構造化されていない製品属性がディクショナリ内に含まれていないことを確認することに応
答して、システムのアドミニストレータ(管理者)に、構造化されていない製品固有属性値および構造化されていない製品属性を少なくとも一つの第2の言語固有の形式のそれぞれに翻訳し、かつ、翻訳をディクショナリに追加するよう指示することを含む。
【0037】
本発明の好ましい実施形態に従い、構造化された言語非依存型の形式の製品データを、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つに変換することは、ディクショナリを使用する。
【0038】
本発明の好ましい実施形態に従い、構造化された言語非依存型の形式の製品データを少なくとも一つの第2の言語固有の形式のうちの少なくとも一つに変換することは、オンデマンドで行われる。代替的には、構造化された言語非依存型の形式の製品データを少なくとも一つの第2の言語固有の形式のうちの少なくとも一つに変換することは、自動的に行われる。
【0039】
好ましくは、少なくとも一つの第2の言語固有の形式の前記データは、複数の第2の言語固有の形式のデータを含む。代替的には、少なくとも一つの第2の言語固有の形式のデータは、単一の第2の言語固有の形式のデータを含む。
【0040】
本発明の好ましい実施形態に従い、少なくとも一つの第2の言語固有の形式は、少なくとも第1の言語固有の形式を含む。好ましくは、少なくとも一つの第2の言語固有の形式のデータは、第1の言語固有の形式の言語と同一の言語のデータを含む。
【0041】
また、本発明のさらに別の好ましい実施形態に従い、多言語製品カタログシステムが提供されており、当該多言語製品カタログシステムは、
構造化されていない製品データ受取機能を含み、該構造化されていない製品データ受取機能は、第1の言語固有の形式の構造化されていない製品データを受け取るように作動可能であり、
構造化されていない製品データ抽出機能を含み、該構造化されていない製品データ抽出機能は、構造化されていない製品データを分析し、かつ、第1の言語固有の形式の構造化されていない製品データから、構造化されていない製品固有属性値(対応する構造化されていない製品属性に割り当てられたものである)を抽出するように作動可能であり、
構造化されていない言語固有の製品データから構造化された言語非依存型の製品データへの変換機能を含み、該構造化されていない言語固有の製品データから構造化された言語非依存型の製品データへの変換機能は、構造化されていない製品固有属性値(対応する構造化されていない製品属性に割り当てられたものである)を、構造化された言語非依存型の形式に変換するように作動可能であり、
製品マッチング機能を含み、該製品マッチング機能は、構造化された言語非依存型の製品固有属性値(対応する構造化された言語非依存型の製品属性に割り当てられたものである)が、構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連するか否かを確認し、構造化された言語非依存型の製品固有属性値(対応する構造化された言語非依存型の製品属性に割り当てられたものである)が、構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連しないことを確認することに応答して、構造化された言語非依存型の製品固有属性値(対応する構造化された言語非依存型の製品属性に割り当てられたものである)を有する新製品を、構造化された言語非依存型の製品データベースに追加し、かつ、構造化された言語非依存型の製品固有属性値(対応する構造化された言語非依存型の製品属性に割り当てられたものである)が、構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連することを確認することに応答して、構造化された言語非依存型の製品固有属性値を、特定の製品の対応する言語非依存型の構造化された製品属性に割り当てるように作動可能である。
【0042】
好ましくは、構造化されていない製品データ受取機能は、第1の言語固有の形式の構造化されていない製品データを、第1の言語固有の形式の構造化されていない製品データに記載された製品の売主から受け取るように作動可能である。本発明の好ましい実施形態に従い、構造化されていない製品データ受取機能は、第1の言語固有の形式の構造化されていない製品データを、第1の言語固有の形式の構造化されていない製品データを複数の電子商取引プラットフォームのいずれかから自動的に引き出すことにより、受け取るように作動可能である。
【0043】
好ましくは、多数の製品は、多数の製品カテゴリーに分類される。本発明の好ましい実施形態に従い、多言語製品カタログシステムはまた、製品分類機能を含み、該製品分類機能は、製品を製品カテゴリーのうちの少なくとも一つに分類するように作動可能である。追加的には、製品分類機能は、構造化されていない製品データをその中に記載された製品を製品カテゴリーのうちの少なくとも一つに分類するために分析するように作動可能である。好ましくは、製品マッチング機能はまた、構造化された言語非依存型の製品固有属性値(対応する言語非依存型の構造化された製品属性に割り当てられたものである)が、構造化された言語非依存型の製品データベース内に貯蔵された特定の製品に関連するか否かを確認することのために製品分類機能を使用するように作動可能である。
【0044】
本発明の好ましい実施形態に従い、多言語製品カタログシステムはまた、言語非依存型の製品データから言語固有の製品データへの変換機能を含み、該言語非依存型の製品データから言語固有の製品データへの変換機能は、構造化された言語非依存型の形式の製品データを、少なくとも一つの第2の言語固有の形式に変換するように作動可能であり、かつ、製品データエクスポート機能を含み、該製品データエクスポート機能は、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つの製品データをエクスポートするように作動可能である。追加的には、言語非依存型の製品データから言語固有の製品データへの変換機能はまた、構造化された言語非依存型の形式の製品データを、複数の第三者の電子商取引プラットフォームのいずれかへのエクスポートに適したフォーマットに変換するように作動可能であり、かつ、製品データエクスポート機能はまた、複数の第三者の電子商取引プラットフォームのうちの特定の一つへのエクスポートに適したフォーマットの製品データを、複数の第三者の電子商取引プラットフォームのうちの特定の一つにエクスポートするように作動可能である。
【0045】
好ましくは、製品データエクスポート機能は、オンデマンドで、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つの製品データをエクスポートするように作動可能である。代替的には、製品データエクスポート機能は、少なくとも一つの第2の言語固有の形式のうちの少なくとも一つの製品データを自動的にエクスポートするように作動可能である。
【0046】
本発明の好ましい実施形態に従い、多言語製品カタログシステムはまた、ディクショナリを含み、該ディクショナリは、その中に含まれている各製品属性および製品属性値について、言語非依存型の識別子と、第1の言語の形式の少なくとも一つおよび少なくとも一つの第2の言語固有の形式のそれぞれへのその翻訳とを含む。
【0047】
本発明の好ましい実施形態に従い、構造化されていない言語固有の製品データから構造化された言語非依存型の製品データへの変換機能はまた、第1の言語固有の形式の構造化されていない製品固有属性値および構造化されていない製品属性がディクショナリ内に含まれているか否かを確認し、構造化されていない製品固有属性値および構造化されていない製品属性がディクショナリ内に含まれていることを確認することに応答して、ディクショナリを構造化されていない製品固有属性値および構造化されていない製品属性を、構造化された言語非依存型の形式に変換するために使用し、かつ、構造化されていない製品固
有属性値および構造化されていない製品属性がディクショナリ内に含まれていないことを確認することに応答して、第1の言語固有の形式の構造化されていない製品固有属性値および構造化されていない製品属性のそれぞれを、ディクショナリに追加し、かつ、言語非依存型の識別子を、構造化されていない製品固有属性値および構造化されていない製品属性のそれぞれに割り当てるように作動可能である。
【0048】
本発明の好ましい実施形態に従い、構造化されていない言語固有の製品データから構造化された言語非依存型の製品データへの変換機能はまた、構造化されていない製品固有属性値および構造化されていない製品属性がディクショナリ内に含まれていないことを確認することに応答して、構造化されていない製品固有属性値および構造化されていない製品属性を、ディクショナリに少なくとも一つの第2の言語固有の形式のそれぞれに自動的に翻訳し、かつ、翻訳をディクショナリに追加するように作動可能である。追加的には、構造化されていない言語固有の製品データから構造化された言語非依存型の製品データへの変換機能はまた、構造化されていない製品固有属性値および構造化されていない製品属性がディクショナリ内に含まれていないことを確認することに応答して、システムのアドミニストレータに、構造化されていない製品固有属性値および構造化されていない製品属性を少なくとも一つの第2の言語固有の形式のそれぞれに翻訳し、かつ、翻訳をディクショナリに追加するよう指示するように作動可能である。
【0049】
好ましくは、言語非依存型の製品データから言語固有の製品データへの変換機能は、構造化された言語非依存型の形式の製品データを少なくとも第2の言語固有の形式のうちの少なくとも一つに変換するためにディクショナリを使用するように作動可能である。
【0050】
本発明の好ましい実施形態に従い、言語非依存型の製品データから言語固有の製品データへの変換機能は、オンデマンドで、構造化された言語非依存型の形式の製品データを、少なくとも第2の言語固有の形式のうちの少なくとも一つに変換するように作動可能である。代替的には、言語非依存型の製品データから言語固有の製品データへの変換機能は、構造化された言語非依存型の形式の製品データを、少なくとも第2の言語固有の形式のうちの少なくとも一つに自動的に変換するように作動可能である。
【0051】
好ましくは、少なくとも一つの第2の言語固有の形式のデータは、複数の第2の言語固有の形式のデータを含む。代替的には、少なくとも一つの第2の言語固有の形式のデータは、単一の第2の言語固有の形式のデータを含む。
【0052】
本発明の好ましい実施形態に従い、少なくとも一つの第2の言語固有の形式は、少なくとも第1の言語固有の形式を含む。好ましくは、少なくとも一つの第2の言語固有の形式のデータは、第1の言語固有の形式の言語と同一の言語のデータを含む。
【0053】
図面の簡単な説明
本発明は、図面とともに、以下の詳細な説明からより完全に理解され、かつ、把握されるであろう。
【図面の簡単な説明】
【0054】
【
図1】
図1は、本発明の好ましい実施形態に従い組み立てられ、かつ、作動する、データ変形システムの簡略化されたブロックダイヤグラム図である。
【
図2】
図2は、
図1のシステムの実施形態と連携して、売主により実行されるいくつかの初期工程を説明する簡略化されたフローチャートである。
【
図3】
図3Aおよび3Bは、構造化されていない言語固有のリスティングデータの二つの例を示し、そのそれぞれは、異なる売主供給ファイルの一部を形成する。
【
図4】
図4は、
図1のシステムの実施形態の一部を形成する、構造化されていない製品データ受取機能(UPDRF)の簡略化されたブロックダイアグラム図である。
【
図5】
図5は、
図4の構造化されていない製品データ受取機能(UPDRF)の一部を形成する、入力データ列マッパーの動作を説明する簡略図である。
【
図6】
図6は、
図4の構造化されていない製品データ受取機能(UPDRF)の動作を説明する簡略化されたフローチャートである。
【
図7】
図7は、
図1のシステムの実施形態の一部を形成する、データベース内に最初に貯蔵された構造化されていない言語固有のリスティングデータの簡略化された例である。
【
図8】
図8は、
図1のシステムの実施形態の一部を形成する、製品データ抽出機能および製品マッチング機能の動作を説明する簡略化されたフローチャートである。
【
図9】
図9は、
図1のシステムの実施形態の一部を形成する、製品データ抽出機能および製品マッチング機能において使用されるカテゴリー構造表の簡略図である。
【
図10】
図10は、
図1のシステムの実施形態の一部を形成する、製品データ抽出機能の動作の例の簡略図である。
【
図11】
図11は、
図10の抽出機能により使用される、典型的なカテゴリー属性構造表の簡略図である。
【
図12】
図12は、
図10の抽出機能により使用される、典型的な属性値構造表の簡略図である。
【
図13】
図13は、
図1のシステムの実施形態により使用される典型的な構造翻訳表の一部の簡略図である。
【
図14】
図14Aおよび14Bは、
図10の抽出機能により使用される、二つのカテゴリー固有のルールセットの簡略化されたフローチャートである。
【
図15】
図15は、典型的なカテゴリー固有のマトリクスマッチングルールの簡略図である。
【
図16】
図16は、
図1のシステムの実施形態の新製品作成およびデータ富化動作を説明する簡略化されたフローチャートである。
【
図17】
図17は、構造化された製品表の一部の簡略図である。
【
図18】
図18は、構造化された製品データ表の一部の簡略図である。
【
図19】
図19は、典型的なマーケットプレイス固有のデータ仕様表の一部の簡略図である。
【
図20】
図20は、
図1の実施形態の一部を形成する、言語非依存型の製品データから言語固有の製品データへの変換機能の動作の例の簡略図である。
【
図22】
図22は、典型的な製品データ重量属性拡張および変換ルールの簡略化されたフローチャートである。
【
図23】
図23は、典型的な言語固有、マーケットプレイス固有の、製品リスティング作成ルールの簡略図である。
【
図24】
図24は、カテゴリーの特定のマーケットプレイスへのマッピングの簡略図である。
【
図25】
図25は、属性-値ペアの特定のマーケットプレイスへのマッピングの簡略図である。
【
図26】
図26は、典型的な言語固有、マーケットプレイス固有の、リスティングデータ変換ルールの簡略図である。
【発明を実施するための形態】
【0055】
好ましい実施形態の詳細な説明
ここで、本発明の好ましい実施形態に従い組み立てられ、かつ、作動する、データ変換システム100の簡略化されたブロックダイヤグラム図である
図1を参照する。
図1は、多言語電子商取引環境の文脈で本発明の実施形態を説明しており、本発明の本実施形態および他の実施形態は、そのような環境に限定される必要のないことが理解される。
【0056】
従来の電子商取引プラットフォームは、典型的には、半構造化された(semi structured)形式での製品のリスティング(listing;出品登録)を容易にする。種々の従来の電子商取引プラットフォームに送られる、リスティングのために必要なフォーマットは、それぞれ異なり、かつ、言語固有である。したがって、広範囲の電子商取引プラットフォーム上に製品提供のリスティングを希望する商人は、典型的には、各電子商取引プラットフォーム上に、かつ、すべての所望の言語で、別々に彼らの商品をリスティングする必要がある。
【0057】
第1の複数の言語のいずれかの構造化されていない製品リスティングをインポートし、インポートされた製品リスティングを構造化された言語非依存型の形式に変換し、かつ、その後、第2の複数の言語のいずれかの製品リスティングを提供することを容易にすることは、本発明の実施形態の際立った特徴である。本発明の実施形態のシステムは、あらゆる言語で、構造化された多言語カタログまたはあらゆる適した電子商取引プラットフォームにおいてリスティングに適した製品リスティングを提供する。
【0058】
第2の複数の言語は、典型的にはまた、元の製品リスティングの言語を含み、かつ、本発明の実施形態のシステムは、第1の言語の構造化されていない製品リスティングをインポートし、かつ、同一の言語の構造化された製品リスティングを提供するために利用されてもよいことが、把握される。
【0059】
図1に見られるように、データ変形システム100は、典型的には、データ変形システム100の一部を形成するデータベース110と相互に作用するデータ操作機能102を含む。データベース110は、好ましくは、典型的には言語固有のフォーマットの入力として提供される構造化されていない製品リスティングのための、および、データ変形システム100のデータ操作機能102により提供される構造化された製品リスティングのための、記憶装置を含む。構造化された製品リスティングは、言語非依存型のフォーマットと一つ以上の言語固有のフォーマットとの両方でデータベース110内に貯蔵されてもよい。
【0060】
データ変形システム100のデータ操作機能102は、好ましくは、データベース110と相互作用する少なくとも次のものを含む:
構造化されていない製品データ受取機能120を含み、該構造化されていない製品データ受取機能120は、
図4を参照して以下でさらに説明され、かつ、典型的には供給アップロードツール122を含み、該供給アップロードツール122は、入力データマッパー124を含み、かつ、前記構造化されていない製品データ受取機能120は、供給ファイル受取機能128を含み、該供給ファイル受取機能128は、好ましくは、データ書込機能130と、処理必要性確認器と、分類器/マッチャートリガー134とを含み;
製品分類/マッチング機能136を含み;
特にディクショナリ142と相互作用する、構造化されていない製品データ抽出機能140を含み;
特にディクショナリ142と相互作用する、構造化されていない言語固有の製品データから構造化された言語非依存型の製品データへの変換機能144を含み;
新製品作成および製品データ富化機能146を含み;
言語非依存型の製品データから言語固有の製品データへの変換機能150を含み;
データエクスポート機能160を含み;かつ
選択されたマーケットプレイスリスティング作成機能170を含む。
【0061】
これらの機能は、
図4-25を参照して、以下でさらに説明される。
【0062】
ここで、
図1のシステムを使用する、売主により実行される典型的な初期動作を説明する
図2を参照する。
図2に見られるように、売主は、彼が彼の製品のリスティングを希望するマーケットプレイス(本明細書では、「ボーディング(boarding)用マーケットプレイス」とも呼ばれる)を選択する。売主は、好ましくは、各マーケットプレイスについての通貨換算ポリシー、各マーケットプレイスについての価格および値上げポリシーならびに各マーケットプレイスについての発送および返送ポリシーを選択する。売主は、その後、
図1のシステムにおけるデータベース110に売主リスティング供給ファイル(seller
listing feed file)をアップロードする。
図2に見られるように、売主リスティングファイルのアップロード後、売主は、構造化されていない言語に特定の製品リスティングを構造化された言語非依存型の製品リスティングに変換するために、本発明のシステムの変換工程を起動し、該言語非依存型の製品リスティングは、その後、データベース110内に貯蔵される。
【0063】
図1の図示された実施形態に見られるように、売主リスティング供給ファイルの一部を形成する構造化されていない言語固有のリスティングデータは、典型的には、構造化されていない製品データ受取機能(UPDRF)120を介して、データ変形システム100に提供される。好ましくは、データ変形システム100は、データベース110内に構造化されていない言語固有のリスティングデータを貯蔵する。二つの異なる売主リスティング供給ファイルの例が、
図3Aおよび3Bに現れる。
【0064】
図3Aおよび3Bにおける売主リスティング供給ファイルの各例は、カメラのレンズについて二つの別々のリスティングを含むことが、把握される。
図3Aおよび3Bにおけるすべてのリスティングの言語は、英語であり、かつ、両例におけるリスティングデータは、フリーテキストを含み、該フリーテキストは、カメラレンズについて説明するだけでなく、レンズの状態およびレンズの価格についても説明する。ある時には、発送データもまた、含まれる。
【0065】
構造化されていない製品データ受取機能(URDRF)120は、
図4において概して説明され、かつ、供給アップロードツール122を含み、該供給アップロードツール122は、構造化されていない言語固有のリスティングデータを、典型的には
図3Aおよび3Bに示されるような売主供給ファイルの形式で受け取る。供給アップロードツール122は、典型的には、
図1のシステムのポータルと関連するウェブページ上に実装され、また、
図2を参照して上述した機能を可能にする。
【0066】
供給アップロードツール122は、特に、入力データ列マッパー(input data column mapper)124を含み、該入力データ列マッパー124は、売主から受け取られた指示に基づいて、売主リスティング供給ファイルにおける列(column)をデータベース110における列にマッピングする。入力データ列マッパー124は、マッピング指示出力を提供し、該マッピング指示出力は、売主リスティング供給ファイルにおける列をデータベース110における列と対応するように再配置するためにデータ変形システム100の構造化されていない製品データ受取機能120により使用され、前記入力データ列マッパー124は、その後、データベース110に再配置されたデータをアップロードする。
図5は、入力データ列マッパー124の動作を説明する。
【0067】
データベース110に売主リスティング供給ファイルをアップロードするための好ましい工程を要約する簡略化されたフローチャートが、
図6に現れる。入力データ列マッパー124により提供されるマッピング指示出力に加えて、売主リスティング供給ファイルおよびマッピング指示出力が、供給ファイル受取機能128により処理され、該供給ファイル受取機能128はまた、構造化されていない製品データ受取機能(UPDRF)の一部を形成する。
【0068】
供給ファイル受取機能128は、データ書込機能130を含み、該データ書込機能130は、入力データ列マッパー124により生成されたマッピング指示に従って売主リスティング供給における各行(raw)からのデータをデータベース110における対応する行
に書き込む。データ書込機能130はまた、各行にユニークなリスティングキー(listing key)を追加し、該ユニークなリスティングキーは、好ましくは、リスティングデータ
上に、従来のMD5ハッシュ関数のようなハッシュ関数の演算により生成される。
【0069】
データ書込機能130はまた、好ましくは、各行に、売主リスティングデータがデータベース110にアップロードされる日を示す更新日を追加する。
【0070】
供給ファイル受取機能128はまた、処理必要性確認器(NEED TO PROCESS ascertainer)132を含み、該処理必要性確認器132は、新たにロードされたリスティングがデ
ータベース上に既に存在するリスティングと関連するか否かを確認し、かつ、もし関連しなければ、新たにロードされたリスティングを処理必要性の対象としてリスティングする。処理必要性確認器132は、新たに追加された行のユニークなリスティングキーとデータベース内のすべてのリスティングのユニークなリスティングキーとを比較する。もし一致が見出せなければ、処理必要性フラグが新たに追加された行の処理必要性の列に現れる。
【0071】
供給ファイル受取機能128は、追加的には、分類器/マッチャートリガー134を含む。分類器/マッチャートリガー134は、売主リスティング供給ファイル全体がデータベース110にアップロードされ、かつ、ユニークなリスティングキーがそれぞれの新たな行について生成された時のみ作動する。
【0072】
売主リスティング供給ファイル全体のアップロードに続いて、分類器/マッチャートリガー134は、分類/マッチング機能136を起動し、該分類/マッチング機能136は、処理必要性フラグが新たに追加された行の処理必要性の列に現れる行を処理する。分類/マッチング機能136は、新たなリスティングをデータベース110内に既にある製品と一致させることを試みる。
【0073】
データベース110内に貯蔵された例示的な更新された構造化されていない言語固有のリスティングテーブルが、
図7に見られ、該リスティングテーブルは、
図3Aおよび3Bの売主リスティング供給ファイルに現れるリスティングデータを含む。各行は、特に、ユニークなリスティングキー、更新日、および適切である場合には処理必要性フラグを含むことがわかる。
【0074】
上述の通り、売主リスティング供給ファイル全体のアップロードに続いて、分類器/マッチャートリガー134は、分類/マッチング機能136を起動し、該分類/マッチング機能136は、処理必要性フラグが現れる行を処理する。
【0075】
分類/マッチング機能136は、全般的概観を提示する
図8に関連して、以下で説明される。
【0076】
図8に見られるように、分類/マッチング機能136は、まず、新たなリスティング内の全体が数字からなるUPCコードやその同等物のようなユニークな製品識別子の存在についてチェックする。もしそのようなユニークな製品識別子が売主リスティング供給ファイルからデータベース110(
図7)内に貯蔵された行のリスティングの説明列内のデータから抽出され、かつ、そのユニークな製品識別子が既にデータベース110内に貯蔵されていれば、リスティングにより示される製品は、既にデータベース110内に貯蔵され
た製品と一致する。
【0077】
もしユニークな製品識別子を用いたマッチングが達成されなければ、分類器/マッチング機能136は、次に、新たなリスティングから製造者と、数字および通常ラテン文字である文字からなってもよい製造者製品番号とを抽出することを試みる。もし製造者および製造者製品番号が売主リスティング供給ファイルからデータベース110(
図5)内に貯蔵された行のリスティングの説明列内のデータから抽出され、かつ、その製造者および製造者製品番号が既にデータベース110内に貯蔵されていれば、リスティングにより示される製品は、既にデータベース110内に貯蔵された製品と一致する。
【0078】
もしユニークな製品識別子と製造者および製造者製品番号とを用いたマッチングが達成されなければ、分類器/マッチング機能136は、次に、新たなリスティングの言語を識別することを試みる。これは、https://pypi.ython.org/pypi/jangdetectに見られ得るような従来技術を用いて達成される。
【0079】
新たなリスティングの言語が識別されるとすぐ、リスティングは、カテゴリーに分類される。分類器/マッチング機能136は、それぞれの新たに追加された行におけるすべてのリスティングデータを分類し、かつ、データベース110内に貯蔵されたカテゴリー構造表(その簡略化された実施例は
図9に現れる)内の複数のカテゴリーのうちの一つに関連するものとして行を分類するために、言語固有の機能を使用すること、かつ、好ましくは、トレーニングされた統計モデルを使用することにより、リスティングをカテゴリーに分類する。
【0080】
図9を考慮すると、カテゴリー構造はいくつかのカテゴリー間の親子関係の存在の指標を含むことがわかる。このように、例えば、カテゴリーC1000およびC1002は親カテゴリーC100に関連し、カテゴリーC1001は親カテゴリーC101に関連し、かつ、カテゴリーC100およびC101は親カテゴリーを有しない。分類機能は、もし存在すれば最も特定のカテゴリー、例えば子カテゴリー、にそれぞれの新たに追加された行を分類するように作動することが、把握される。分類機能は、各行にカテゴリーIDを割り当てるように作動する。このカテゴリーIDは、言語非依存型である。
【0081】
リスティングのカテゴリーが確認されるとすぐ、構造化されていない製品データ抽出機能140は、リスティングデータから種々の属性および値を抽出し、かつ、リスティング抽出データの言語固有のキャッシュ内に属性および値を貯蔵する。そのような工程の例は、
図10において図表で説明される。
【0082】
図10を考慮すると、種々の構造化された言語固有の属性および値は構造化されていない製品データ抽出機能140により構造化されていない言語固有のリスティングデータから抽出されることがわかる。抽出された属性および値のそれぞれは言語非依存型の対応するIDを有することもまた、把握される。抽出された言語固有の構造化データは、好ましくは、リスティング抽出データの言語固有のキャッシュ内に一時的に貯蔵され、かつ、構造化されていない言語固有の製品データから構造化された言語非依存型の製品データへの変換機能144は、対応する抽出された言語非依存型の構造データを提供し、該構造データは、好ましくは、リスティング抽出データの言語非依存型のキャッシュ内に一時的に貯蔵される。
【0083】
各属性は、属性IDを有する。
図11は、データベース110内に貯蔵されたカテゴリー属性構造表の例であり、その属性は、特定のカテゴリー、ここではそのカテゴリーIDがC1002(
図9)であるレンズ、に関連する。各属性は言語非依存型の属性IDを有し、かつ、属性タイプにより特徴付けられることがわかる。属性タイプは、典型的には:
離散値リスト - 所定の値の所定の離散数を含み;
数字 - 多くの値を有していてもよい数字を含む。
【0084】
各値は、値IDを有する。
図12は、データベース110内に貯蔵された属性値構造表の簡略化された例であり、その値は種々の属性(
図11)と関連する。
【0085】
これは稀であり、かつ、一般的には起こらないと推定されるが、種々の属性および値は複数のカテゴリーに適用可能であり得ることが、把握される。
【0086】
図9、11および12の表に例示された構造は、データベース110内に貯蔵された非常に大きな言語固有の/言語非依存型の表に関連し、該データベース110は、カテゴリー、属性および値ならびにそれらの対応する言語非依存型のIDについて、すべての関連する言語におけるリスティングの説明に対応する製品データを貯蔵する。ディクショナリ142は、特に、言語固有の/言語非依存型の表に具現化され、その簡略化された例は、
図13に現れる。実際、
図9、11および12の表に例示された構造は、言語固有のカテゴリー、属性または値名なしでデータベース110内に貯蔵されてもよい。
【0087】
好ましくは、典型的には、もし数百万でなければ何十万のエントリーを含む言語固有の/言語非依存型の表全体は、マッチングに用いられない。代わりに、確認された言語におけるそれらのエントリーのみが用いられ、かつ、それらのエントリーのうち、最初は、カテゴリー(
図9)に関連するそれらのエントリーのみが、
図10の機能において使用される。リスティングのカテゴリーが確認された時にのみすぐ、属性および値のマッチングが、言語固有の/言語非依存型の表(
図13)におけるそれらのエントリー(
図11および12)のみを用いて試みられ、該エントリーは、既に確認された言語およびカテゴリーに関連する。
【0088】
好ましくは、実際にはもっとも重要な値は単一の属性に固有であり、したがって、値を一致させることにより属性の一致もまた達成されるので、属性および値のマッチングの際、まず、
図13に例示された値表を用いて値の一致が試みられる。
【0089】
もう一度
図10を見ると、種々のルールが存在することが、把握され、該ルールは、種々のリスティングデータ要素、典型的には値、を識別し、かつ、それらを種々の属性と関連付ける。例えば、「18-55」は、焦点距離に言及するものとしてルールにより認識され、かつ、「F/」は、レンズ口径に言及する。
図11の機能において有用な二つの典型的なルールのセットが、
図14Aおよび14Bに現れる。
【0090】
ここで
図8に戻ると、カテゴリー固有の特徴マッチマトリクスはマッチングのために使用されることがわかる。このマトリクスは、各カテゴリーについて、そのカテゴリーにおける製品について製品一致を確立するために知られなければならない属性の最低セットを規定する。そのようなマトリクスの例が、
図15に現れる。
【0091】
もし製品一致を確立するために必要な属性および値が抽出され、かつ、データベース内の製品がマトリクスにおいて特定された属性および値をすべて含めば、新たなリスティング内の製品は、データベース内の製品と一致する。
【0092】
もし製品一致を確立するために必要な属性および値が抽出されなければ、システム100は、新製品作成およびデータ富化機能146を利用して、データベース110にリスティングを追加する。
【0093】
ここで、システム100の新製品作成およびデータ富化機能146を説明する簡略化さ
れたフローチャートである、
図16を参照する。
【0094】
図16に見られるように、もし新たなリスティングが既にデータベース内にある製品と一致すれば、新たなリスティングにおける属性および値はすべて抽出され、かつ、データベース110内の言語非依存型の構造化された製品表内に言語非依存型の形式で貯蔵される。
【0095】
新たなリスティング内に現れる属性-値ペアがすべてデータベース内に貯蔵された製品データ内に現れるか否かが、その後確認される。もしデータベース内に貯蔵された製品データ内に現れない新たなリスティング内における属性および値があれば、これらの新たな属性および値は、データベース110内に存在する製品に追加される。
【0096】
もし新たなリスティングが既にデータベース内にある製品と一致しなければ、新製品行がデータベース110内の構造化された製品表内に作成される。構造化された製品表の例は、
図17に現れる。新製品IDが作成され、かつ、関連する属性/値ペアがすべてそれと関連付けられ、かつ、好ましくは、データベース110内の新たな構造化製品データ表内に貯蔵され、その例は
図18に現れる。新製品IDおよび新たな属性/値ペアの作成後、リスティングがデータベース110内の言語非依存型の構造化された製品表に言語非依存型の形式で追加される。
【0097】
図16に見られるように、もし新たなリスティングがデータベース110内のカテゴリーに分類されなければ、新たなリスティングは処分され、かつ、システム100は、好ましくは、売主に新たなリスティングが分類不可能であったことを通知する。
【0098】
この段階で、データベース110内のデータは、売主(
図2)により指定された一つ以上のマーケットプレイスへのエクスポートのための準備ができている。各マーケットプレイスについて、初期工程は、製品データを言語非依存型の形式からそのマーケットプレイスに適した言語固有の形式に変換することである。
図20は、システム100の言語非依存型の製品データから言語固有の製品データへの変換機能150の例を示す。使用は、好ましくは、構造翻訳表からなり、その例は、
図21に現れる。追加的には、マーケットプレイス固有の変換パラメータが、マーケットプレイス固有のデータ仕様表内に見出され、その例は、
図19で説明される。
【0099】
好ましくは、言語非依存型の製品データから言語固有の製品データへの変換機能150は、まず、属性を言語非依存型の形式から指定されたマーケットプレイスに適した言語固有の形式に変換する。その後、言語非依存型の製品データから言語固有の製品データへの変換機能150は、数字ではない値を翻訳する。
図20に見られ得るように、処理は、出力として、指定されたマーケットプレイスに適した言語固有の形式の複数の属性-値ペアを生成する。
【0100】
異なるマーケットプレイスは異なる測定単位および通貨を使用するので、製品データの種々の操作がデータエクスポート機能160により実行されてもよい。そのような操作用の典型的なルールは、
図22に現れる。追加的には、製品データのマーケットプレイス固有の改変が適切かも知れない。
図23は、この目的のために適したルールを示す。
【0101】
図23に見られるように、典型的な言語固有の製品リスティング作成ルールが、OZONマーケットプレイスについてロシア語で提示される。典型的には、
図21の表および翻訳された値を用いることにより、七つの異なる属性-値ペアが翻訳される。結果として生じるマーケットプレイスの言語固有の製品データリスティングは、データベース110内のマーケットプレイスの言語固有の製品データキャッシュ内に貯蔵され、かつ、指定され
たマーケットプレイスへのボーディングのための準備ができている。
【0102】
好ましくは、選択されたマーケットプレイスリスティング作成機能170は、リスティングを指定されたマーケットプレイスにボーディングさせるために、指定されたマーケットプレイスのAPIを使用する。システム100の選択されたマーケットプレイスリスティング作成機能170は、APIを介して、マーケットプレイス固有のフォーマットおよび言語のリスティング供給を提出する。マーケットプレイス固有のフォーマットは、特定のマーケットプレイスへのカテゴリーマッピングおよび属性-値ペアマッピングを含む。このマッピングの例は、
図24および
図25に見られる。
【0103】
このマッピングは、一対一の場合もあれば、一対多数および/または多数対一のようにより複雑な場合もある。そのような場合、属性-値ペアがマッピングに関連してもよい。
【0104】
それぞれのリスティングされた製品のボーディングされたマーケットプレイスカテゴリーが選択されるとすぐ、属性値ペアがボーディングされたマーケットプレイスの特定の属性値ペアにマップされる。これは、典型的には、一対一マッピングを使用する。属性-値ペアマッピングの例は、
図25に現れる。ボーディングされたマーケットプレイス内に存在しないデータベース内の属性値ペアは、典型的には無視される。ボーディングされたマーケットプレイス内には存在するがデータベース内には存在しない属性-値ペアもまた、典型的には無視されるが、代替的には、事前に実行される変換により提供され得る。そのような変換の例は、
図26に現れる。
【0105】
さらに重要な工程は、マーケットプレイス固有の製品情報と、製品データ内に含まれていないリスティング情報とを一つにすることである。そのようなリスティング情報の一例は、価格情報である。上記で
図2を参照して注目されたように、異なる価格ポリシーが異なるマーケットプレイスについて売主により選択されてもよいため、価格ポリシーは、売主により選択され、かつ、通貨換算の結果だけではないので、マーケットプレイスに特有であってもよい。
【0106】
価格以外に、リスティング情報は、
図26に見られるように、製品の状態に関連する売主選択パラメータを含んでいてもよい。
【0107】
本発明の範囲は、上記で特に示され、かつ、説明されたものにより限定されないことが、当業者により把握されるであろう。むしろ、本発明の範囲は、上述の特徴の組み合わせおよび部分的組み合わせ、ならびに先行技術にはないその変形を含む。