IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 楽天株式会社の特許一覧

特開2024-50174情報処理装置、情報処理方法、及びプログラム
<>
  • 特開-情報処理装置、情報処理方法、及びプログラム 図1
  • 特開-情報処理装置、情報処理方法、及びプログラム 図2
  • 特開-情報処理装置、情報処理方法、及びプログラム 図3
  • 特開-情報処理装置、情報処理方法、及びプログラム 図4
  • 特開-情報処理装置、情報処理方法、及びプログラム 図5
  • 特開-情報処理装置、情報処理方法、及びプログラム 図6
  • 特開-情報処理装置、情報処理方法、及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024050174
(43)【公開日】2024-04-10
(54)【発明の名称】情報処理装置、情報処理方法、及びプログラム
(51)【国際特許分類】
   G06F 16/906 20190101AFI20240403BHJP
   G06Q 30/0601 20230101ALI20240403BHJP
【FI】
G06F16/906
G06Q30/06 300
【審査請求】有
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2022156853
(22)【出願日】2022-09-29
(71)【出願人】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(72)【発明者】
【氏名】友岡 高志
(72)【発明者】
【氏名】中澤 満
【テーマコード(参考)】
5B175
5L030
5L049
【Fターム(参考)】
5B175FA03
5L030BB22
5L049BB22
(57)【要約】
【課題】機械的な処理により商品に関する商品情報が不明確であるかをチェックすることができる情報処理装置、情報処理方法、及びプログラムを提供する。
【解決手段】電子商取引プラットフォームにおいて使用される情報処理装置30は1以上のプロセッサ31と1以上のメモリ32とを備える。メモリ32には、電子商取引プラットフォームに登録された複数の商品17に関する商品データ37が格納されている。商品データ37は複数のデータセットを含む。各データセットは、1つの商品17について登録された複数のデータ項目を含む。各データ項目は、1つの商品17に関する商品情報を含む。プロセッサ31は、1以上の商品情報を比較するための指標を得るために、1以上の商品情報に対して指標化処理を実行するように構成される。
【選択図】図1
【特許請求の範囲】
【請求項1】
電子商取引プラットフォームにおいて使用される情報処理装置であって、
前記情報処理装置は、1以上のプロセッサと1以上のメモリとを備え、
前記メモリには、前記電子商取引プラットフォームに登録された複数の商品に関する商品データが格納されており、
前記商品データは複数のデータセットを含み、
前記各データセットは、1つの前記商品について登録された複数のデータ項目を含み、
前記各データ項目は、前記1つの商品に関する商品情報を含み、
前記プロセッサは、1以上の前記商品情報を比較するための指標を得るために、前記1以上の商品情報に対して指標化処理を実行するように構成される、
情報処理装置。
【請求項2】
前記指標化処理は、
1つの前記商品情報に基づいて前記1つの商品に係る第1指標を得ることと、
前記1つの商品情報を加工することにより加工情報を生成することと、
前記加工情報に基づいて前記1つの商品に係る第2指標を得ることと、を含み、
前記プロセッサは、さらに、前記第1指標と前記第2指標とを比較する比較処理を実行するように構成される、
請求項1に記載の情報処理装置。
【請求項3】
前記複数のデータ項目は、第1データ項目及び第2データ項目を含み、
前記第1データ項目は前記商品情報である第1商品情報を含み、前記第2データ項目は前記商品情報である第2商品情報を含み、
前記指標化処理は、
前記第1商品情報に基づいて前記1つの商品に係る第1指標を得ることと、
前記第2商品情報に基づいて前記1つの商品に係る第2指標を得ることと、を含み、
前記プロセッサは、さらに、前記第1指標と前記第2指標とを比較する比較処理を実行するように構成される、
請求項1に記載の情報処理装置。
【請求項4】
前記指標化処理は、前記商品情報を加工することにより加工情報を生成することを含み、
前記商品情報に基づいて前記1つの商品に係る前記指標を得ることは、前記加工情報に基づいて前記指標を得ることを含む、
請求項3に記載の情報処理装置。
【請求項5】
前記商品情報を加工することは、前記商品情報を符号化すること、前記商品情報である文字列を要約すること、前記商品情報である画像を処理すること、前記商品情報から一部を抽出すること、のうち何れか1以上を含む、
請求項4に記載の情報処理装置。
【請求項6】
前記抽出することは、前記商品情報である文字列の中から1部を抽出することと、前記商品情報である画像から文字を抽出することと、前記商品情報である画像の一部を切り出すこと又は切り取ることと、のうち少なくとも1つを含む、
請求項5に記載の情報処理装置。
【請求項7】
前記指標は、前記商品を分類するために規定されたカテゴリであり、
前記指標を得ることは、前記商品情報に基づいて前記1つの商品を分類することを含む、
請求項1に記載の情報処理装置。
【請求項8】
前記指標は、前記商品があるカテゴリであることの確率であり、
前記指標化処理は、前記1つの商品が前記あるカテゴリに該当する確率を算出することを含む、
請求項1に記載の情報処理装置。
【請求項9】
前記複数のデータ項目は、互いに種類の異なるデータを含み、
前記データの種類は、属性及び当該属性に対する属性値、文字列、画像、数値のうち何れかである、
請求項1に記載の情報処理装置。
【請求項10】
前記複数のデータ項目は、前記商品に関する、タイトル、サイズ、ブランド、状態、説明文、画像、カテゴリのうち何れか1以上を含む、
請求項1に記載の情報処理装置。
【請求項11】
前記複数のデータ項目は、前記商品の販売者のプロフィール、前記販売者の評価、前記販売者に対するコメント、前記販売者の登録日、前記販売者のIPアドレスのうち何れか1以上を含む、
請求項1に記載の情報処理装置。
【請求項12】
前記指標化処理の少なくとも一部は、1以上の機械学習モデルを使用して実行される、
請求項1に記載の情報処理装置。
【請求項13】
前記指標は、前記商品を分類するために規定されたカテゴリであり、
前記指標化処理は、前記1つの商品を異なる情報に基づいて2回以上分類することにより、2以上の分類結果を得ることを含み、
前記プロセッサは、前記2以上の分類結果に基づいて特定処理を実行するように構成され、前記特定処理は、
前記2以上の分類結果が互いに一致しない場合に、前記1つの商品について登録された商品情報が不明確であることを特定し、前記2以上の分類結果が互いに一致する場合に、当該分類結果に基づいて前記1つの商品の前記カテゴリを特定することを含む、
請求項1~12のうち何れか一項に記載の情報処理装置。
【請求項14】
電子商取引プラットフォームにおいて使用される情報処理装置が実行する情報処理方法であって、
前記電子商取引プラットフォームに登録された複数の商品に関する商品データを取得することであって、前記商品データは複数のデータセットを含み、前記各データセットは、1つの前記商品について登録された複数のデータ項目を含み、前記各データ項目は、前記1つの商品に関する商品情報を含む、ことと、
1以上の前記商品情報を比較するための指標を得るために、前記1以上の商品情報に対して指標化処理を実行することと、
を含む、情報処理方法。
【請求項15】
電子商取引プラットフォームにおいて使用される情報処理装置によって実行されるプログラムであって、
前記プログラムは、1以上のコンピュータに、
前記電子商取引プラットフォームに登録された複数の商品に関する商品データを取得することであって、前記商品データは複数のデータセットを含み、前記各データセットは、1つの前記商品について登録された複数のデータ項目を含み、前記各データ項目は、前記1つの商品に関する商品情報を含む、ことと、
1以上の前記商品情報を比較するための指標を得るために、前記1以上の商品情報に対して指標化処理を実行することと、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
特許文献1は、販売者と購入者とが商取引を行う電子商取引プラットフォームの一例を開示している。一般的に、販売者は1つの商品につき複数の商品情報を電子商取引プラットフォームに登録可能である。商品情報の例は、商品の種類、説明文、又は画像である。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2019-28544号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
購入者は通常、登録された商品情報に基づいて類似の商品を比較しつつ、どの商品を購入するかを検討する。このとき、商品によって登録される商品情報が不揃いだったり、登録された複数の商品情報間で不整合があったりすることがある。登録情報が不明確であることは、人の目で詳細にチェックすれば、発見して改善することも可能である。しかし、登録された膨大なデータを人の目で全てチェックするのは困難である。そのため、機械的な処理により登録情報をチェックする手法の確立が望まれる。
【0005】
本開示は、機械的な処理により商品に関する商品情報が不明確であるかをチェックすることができる情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示の一態様に係る情報処理装置は、電子商取引プラットフォームにおいて使用される。前記情報処理装置は、1以上のプロセッサと1以上のメモリとを備え、前記メモリには、前記電子商取引プラットフォームに登録された複数の商品に関する商品データが格納されており、前記商品データは複数のデータセットを含み、前記各データセットは、1つの前記商品について登録された複数のデータ項目を含み、前記各データ項目は、前記1つの商品に関する商品情報を含み、前記プロセッサは、1以上の前記商品情報を比較するための指標を得るために、前記1以上の商品情報に対して指標化処理を実行するように構成される。
【0007】
本開示の一態様に係る情報処理方法は、電子商取引プラットフォームにおいて使用される情報処理装置が実行する。前記情報処理方法は、前記電子商取引プラットフォームに登録された複数の商品に関する商品データを取得することであって、前記商品データは複数のデータセットを含み、前記各データセットは、1つの前記商品について登録された複数のデータ項目を含み、前記各データ項目は、前記1つの商品に関する商品情報を含む、ことと、1以上の前記商品情報を比較するための指標を得るために、前記1以上の商品情報に対して指標化処理を実行することと、を含む。
【0008】
本開示の一態様に係るプログラムは、電子商取引プラットフォームにおいて使用される情報処理装置によって実行される。前記プログラムは、1以上のコンピュータに、前記電子商取引プラットフォームに登録された複数の商品に関する商品データを取得することであって、前記商品データは複数のデータセットを含み、前記各データセットは、1つの前記商品について登録された複数のデータ項目を含み、前記各データ項目は、前記1つの商品に関する商品情報を含む、ことと、1以上の前記商品情報を比較するための指標を得るために、前記1以上の商品情報に対して指標化処理を実行することと、を実行させる。
【図面の簡単な説明】
【0009】
図1図1は実施形態に係る情報処理装置を含むシステムの構成を示す図である。
図2図2図1の情報処理装置に格納される商品データの一例を示す図である。
図3図3は実施形態に係る商品画面の一例を示す図である。
図4図4図1の情報処理装置による指標化処理の第5実施例の説明図である。
図5図5図1の情報処理装置による指標化処理の第6実施例の説明図である。
図6図6図1の情報処理装置による指標化処理の第7実施例の説明図である。
図7図7図1の情報処理装置が実行する指標化処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
本開示の情報処理装置、情報処理方法、及びプログラムの例を、以下に図面を参照しつつ説明する。本発明はこれらの例示に限定されるものではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
【0011】
[情報処理システム]
図1は、電子商取引プラットフォームに係る情報処理システム11の一例を示す。情報処理システム11は、商品17の商取引サイトを提供するサーバ20と、電子商取引プラットフォームにおいて使用される情報処理装置30と、を含む。サーバ20及び情報処理装置30は、ネットワーク12を通じて、1以上の販売者端末13及び1以上の購入者端末14と通信する。情報処理装置30は、サーバ20と一体であってもよい。この場合、情報処理装置30の機能をサーバ20が有する。
【0012】
ネットワーク12は、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線等を含む。図1に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワーク12は、一部にローカルなネットワークを含んでもよい。
【0013】
販売者端末13及び購入者端末14は、例えば、スマートフォン、パーソナルコンピュータ、タブレットなどである。各販売者端末13は販売者15によって操作される。各購入者端末14は購入者16によって操作される。商品17の販売者15及び商品17の購入者16は商取引サイトのユーザである。
【0014】
サーバ20は、1以上のプロセッサ21、1以上のメモリ22、および通信機23、及びこれら要素を相互に接続するための通信バス24を備える。通信機23は、ネットワーク12を介して他の装置、例え販売者端末13、購入者端末14及び情報処理装置30との通信を可能とする。メモリ22には、商取引サイトを運営するためのアプリケーション25及び商品データ27が格納されている。
【0015】
サーバ20は、販売者端末13から商品情報を受信する。商品情報の詳細は後述する。受信した商品情報は、商取引サイトで取引される商品17の商品データ27として、メモリ22に格納される。このように商品データ27が格納されることにより、その商品データ27に係る商品17が商取引サイト(電子商取引プラットフォーム)に登録される。商品データ27は、商取引サイトに登録された商品17に関する登録情報であるといえる。
【0016】
購入者16は、登録された商品情報に基づいて類似の商品17を比較しながら、どの商品17を購入するかを検討することがある。そのため、アプリケーション25は、在庫となる商品17を種々の条件に基づいて検索するための検索機能を有してもよい。
【0017】
情報処理装置30は、1以上のプロセッサ31、1以上のメモリ32、通信機33、及びこれら要素を相互に接続するための通信バス34を備える。通信機33は、ネットワーク12を介して、例えばサーバ20との通信を可能とする。メモリ32には、機械学習のための1以上の学習プログラム35及び生成された1以上の機械学習モデル36が格納されている。機械学習モデル36は、例えば、後に説明する機械学習モデル36a~36nの何れか1以上を採用することができるが、これに限らず、目的の結果を得られる任意の機械学習モデルを採用してもよい。
【0018】
情報処理装置30は、定期的に、又は特定のタイミングで、あるいは、リアルタイムで、サーバ20から商品データ27を取得する。これにより、メモリ32には、電子商取引プラットフォームに登録された複数の商品17に関する商品データ27が商品データ37として格納される。情報処理装置30は、サーバ20とは別の構成要素、例えば、コンピュータ、サーバ、又はストレージなどを経由して、商品データ27を取得してもよい。サーバ20において随時に更新される商品データ27と区別するために、情報処理装置30に格納されたデータを商品データ37と言う。
【0019】
プロセッサ21及びプロセッサ31は、例えば、CPU、GPU、およびTPUのような演算ユニットを含む。プロセッサ21及びプロセッサ31は、各種ソフトウェア処理を実行するように構成される処理回路である。処理回路は、ソフトウェア処理の少なくとも一部を処理する専用のハードウェア回路(たとえばASIC等)を備えてもよい。すなわち、ソフトウェア処理は、1又は複数のソフトウェア処理回路及び1又は複数の専用のハードウェア回路の少なくとも一方を備えた処理回路(processing circuitry)によって実行されればよい。
【0020】
メモリ22及びメモリ32は、コンピュータ可読媒体である。メモリ22及びメモリ32は、例えば、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、ROM(Read Only Memory)などの非一過性の記憶媒体を含む。プロセッサ21及びプロセッサ31は、与えられる信号に応じて、又は、予め定められた条件が成立したことに応じて、それぞれメモリ22及びメモリ32に格納されているプログラムに含まれる一連の命令を実行する。
【0021】
[商取引サイト]
次に、サーバ20が提供する商取引サイトについて説明する。商取引サイトは、販売者15と購入者16との取引を仲介するために提供される。例えば、アプリケーション25は、1以上の販売者端末13から受信した複数の商品17に係る商品情報を商品データ27としてメモリ22に格納する処理をプロセッサ21に実行させる。
【0022】
図2に示すように、商品データ27は、各商品17について登録された複数のデータセット50を含む。各データセット50はデータの種類が異なる複数のデータ項目を含む。データ項目の例は、例えば、タイトル51、カテゴリ52、説明文53、サイズ54、ブランド55、状態56、配送料情報57、発送時期58、発送元の地域59、「いいね」数60、販売者のプロフィール61、販売者の属性62、販売者の評価63、販売者へのコメント64、販売者の登録日65、販売者のIPアドレス66、画像67、価格68であるが、これらに限られない。例えば、データ項目は、画像67に代えて、又は画像67に加えて、音声データを含んでもよい。
【0023】
各データ項目は、1つの商品17に関する商品情報を含む。各データセット50は、複数のデータ項目のうち少なくとも1つの商品情報を含む。複数のデータ項目に含まれるデータの種類は互いに異なってもよい。データの種類は、属性及び当該属性に対する属性値、文字列(テキスト)、画像、数値のうち何れかであってもよい。以下、「属性及び当該属性に対する属性値」を単に「属性:属性値」と表記することがある。
【0024】
例えば、カテゴリ52、サイズ54、ブランド55、配送料情報57、発送時期58、発送元の地域59、及び販売者の属性62のデータの種類は属性:属性値であってもよい。カテゴリ52及び発送元の地域59は、予め規定された区分から選択するように設定されていてもよい。発送元の地域59の区分は、例えば、都道府県のような行政区である。
【0025】
図3に示すように、タイトル51、説明文53、状態56、販売者のプロフィール61及び販売者へのコメント64のデータの種類は文字列であってもよい。文字列は、複数の文章を含んでもよい。状態56は、例えば、「未使用」「新品」「目立つ傷や汚れなし」のような使用状態を示す。画像67のデータの種類は、画像であり、画像には動画を含んでもよい。画像67は、図3に示すように、文字(図3では「商品は写真です」)を含む静止画であってもよいし、音声データを含む動画であってもよい。「いいね」数60、販売者の評価63、及び価格68のデータの種類は数値であってもよい。
【0026】
タイトル51は、対象の属性(例えば、名称、ブランド名、サイズ、及び色など)を示す情報を1以上含んでいてもよい。タイトル51は、例えば名称、ブランド名、サイズ、及び色を全て含むような長い文字列であってもよい。また、タイトル51は、「限定」「送料無料」「オススメ」のような、商品17自体の属性ではない、例えば販売促進のための宣伝用文言を含んでもよい。
【0027】
タイトル51及び説明文53には文字数の制限があってもよく、タイトル51の制限文字数は、説明文53の制限文字数より少なくてもよい。タイトル51は、商品17の識別情報でもある。よって、データ項目として、「タイトル51」に代えて識別情報(例えば、商品17の名称等)を含めてもよい。
【0028】
アプリケーション25は、登録された商品データ37を図3に示す商品画面18に表示させる処理をプロセッサ21に実行させる。商品画面18は、各データ項目を表示するための表示領域を有する。商品画面18は、ユーザ(例えば、販売者15又は購入者16)の要求に応じて、それぞれユーザ端末(例えば、販売者端末13又は購入者端末14)のディスプレイに表示される。
【0029】
[指標化処理]
プロセッサ31は、1以上の商品情報を比較するための指標71を得るために、1以上の商品情報に対して指標化処理を実行するように構成される。指標化処理の少なくとも一部は、1以上の機械学習モデル36を使用して実行されてもよい。
【0030】
ここで、複数のデータ項目のうち任意の2つのデータ項目に含まれる商品情報に基づいて2つの指標71を得る場合、その2つのデータ項目を第1データ項目及び第2データ項目ということがある。すなわち、第1、第2、第3・・・は特定の対象(データ項目、商品情報、又は指標など)を指すのではなく、複数のデータ項目を識別するために用いられる序数である。序数の数は2つに限定されず、3以上の任意の数に変更できる。この場合、第1データ項目が含む商品情報を第1商品情報といい、第2データ項目が含む商品情報を第2商品情報ということがある。また、第1商品情報に基づいて得られる指標71を第1指標71aといい、第2商品情報に基づいて得られる指標71を第2指標71bということがある。この場合、指標化処理は、第1商品情報に基づいて1つの商品17に係る第1指標71aを得ることと、第2商品情報に基づいて同じ商品17に係る第2指標71bを得ることと、を含む。そして、プロセッサ31は、複数の指標71(例えば、第1指標71aと第2指標71b)を比較する比較処理を実行するように構成される。
【0031】
指標71は、例えば、商品17を分類するために規定されたカテゴリである。この場合、指標71を得ることは、商品情報に基づいて1つの商品17を分類することを含む。商品17は、データ項目の1つであるカテゴリ52の何れかに該当するように分類してもよい。あるいは、商品17を、データ項目であるカテゴリ52とは異なる区分で分類してもよい。
【0032】
商品17は、商品情報に基づいて、公知の機械学習モデル36aを使用して分類してもよい。例えば、自然言語処理(NLP:Natural Language Processing)用の畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)又はBERT(Bidirectional Encoder Representations from Transformers)に文字列を入力して分類タスクを解くことにより、分類結果(指標71)を得てもよい。同様に、画像処理用のCNNのような機械学習モデル36bに画像を入力して分解タスクを解くことにより、分類結果(指標71)を得ることができる。
【0033】
指標化処理は、1つの商品17を異なる情報に基づいて2回以上分類することにより、2以上の分類結果を得ることを含んでもよい。例えば、第1実施例として、カテゴリ52が「人形」及び「写真」を含む場合、第1データ項目である説明文53に基づいて商品17を「人形」に分類することが第1指標71aを得ることになり、第2データ項目である画像67に基づいて商品17を「写真」に分類することが第2指標71bを得ることになる。
【0034】
プロセッサ31は、このような2以上の分類結果を比較する比較処理を実行した後、その比較結果に基づいて、特定処理を実行するように構成されてもよい。特定処理は、2以上の分類結果が互いに一致しない場合に、1つの商品17について登録された商品情報(少なくとも、分類に用いられた商品情報)が不明確であることを特定し、2以上の分類結果が互いに一致する場合に、当該分類結果に基づいてその1つの商品17のカテゴリを特定することを含んでもよい。比較結果の一致に関しては、必ずしも完全一致でなくてもよく、指標71の種類によっては、特定の条件(例えば、閾値条件)を満たす範囲で一致していればよい場合もある。
【0035】
第1実施例として、第1指標71a(第1の分類結果)が「人形」、第2指標71b(第2の分類結果)が「写真」である場合、係る商品17が人形なのか写真なのかが不明確であると特定される。こうした不明確さは、登録された商品情報に誤記があるに生じ得るし、過った情報が登録された場合にも生じ得る。
【0036】
これに対して、複数の指標71が何れも同じ分類結果(例えば「人形」)であれば、それら分類結果は正しい可能性が高い。そのため、その分類結果に基づいて、商品17のカテゴリが「人形」であると特定してもよい。
【0037】
より簡素な第2実施例では、商品情報そのものであるカテゴリ52を第1指標71aとし、この第1指標71aを、他の商品情報から得られた分類結果である第2指標71bと比較してもよい。この場合、プロセッサ31は、2つの商品情報を比較するために、1つの商品情報に対して指標化処理を実行すればよい。そして、プロセッサ31は、2以上の指標71(例えば、第1指標71a及び第2指標71b)に基づいて特定処理を実行するように構成されてもよい。この特定処理は、2以上の指標71が互いに一致しない場合に、1つの商品17について登録された商品情報が不明確であることを特定し、2以上の指標71が互いに一致する場合に、当該一致した指標71に基づいてその1つの商品17のカテゴリ52を特定することを含む。
【0038】
登録情報の明確性は、一致する分類結果の数が多ければ多いほど、より高いといえる。そのため、3以上の指標71(3以上の分類結果)に基づいて特定処理を行ってもよい。この場合、全ての指標71が一致している場合に明確であると特定してもよいし、特定の条件を満たす範囲で一致していればよい場合もある。例えば、得られた指標71が有効でない又は不適切であると判断できる場合には、その指標71を除いた他の指標71に基づいて特定処理を行ってもよい。
【0039】
指標71は、商品17があるカテゴリ52であることの確率であってもよい。この場合、指標化処理は、1つの商品17があるカテゴリ52に該当する確率を算出することを含んでもよい。そして、プロセッサ31は、あるカテゴリ52に該当する確率が予め規定された閾値以上である場合にその商品17がそのカテゴリ52に該当すると判断してもよい。
【0040】
指標化処理は、分類に先だって、商品情報を加工することにより加工情報を生成することを含んでもよい。この場合、商品情報に基づいて1つの商品に係る指標71を得ることは、加工情報に基づいて指標71を得ることを含む。例えば、指標化処理は、加工情報に基づいて商品17を分類する処理を含んでもよい。
【0041】
指標化処理は、1つの商品情報に基づいて1つの商品17に係る第1指標71aを得ることと、その1つの商品情報を加工することにより加工情報を生成することと、加工情報に基づいてその1つの商品17に係る第2指標71bを得ることと、を含んでもよい。例えば、第3実施例として、説明文53(原文)に基づいて商品17を「人形」に分類することで第1指標71aを得る。さらに、同じ説明文53を加工した加工文を加工情報として生成する。そして、その加工文に基づいて同じ商品17を「人形」に分類することで第2指標71bを得る。この場合、プロセッサ31は、第1指標71aと第2指標71bとを比較する比較処理及び特定処理を実行するように構成される。
【0042】
そして、第1指標71aが「人形」、第2指標71bも「人形」であれば、係る商品17が人形であると特定される。一方、2以上の指標71が互いに異なれば、登録された商品情報が不明確であると特定される。こうした加工は、特に、説明文53が長い場合、画像67がない又は画像67が不鮮明である場合、あるいは、登録されたデータ項目が少ない場合に有効である。例えば、画像67がない場合には説明文53など他の商品情報から内容を判断する必要がある。しかし、説明文53が長いと、購入者16は内容を読み飛ばしたり、読み誤ったりする可能性があるためである。
【0043】
商品情報を加工することは、商品情報を符号化すること、商品情報である文字列を要約すること、商品情報である画像を処理すること、商品情報から一部を抽出すること、音声データを文字列(例えば、「この商品はぬいぐるみではありません」)に変換すること、のうち何れか1以上を含んでもよい。例えば、上記第3実施例では、説明文53を要約した要約文を加工情報としてもよい。
【0044】
文字列の要約は、例えば自然言語処モデルを使用して行うことができる。文字列は、音声データから変換された文字列であってもよいし、画像に含まれる文字列であってもよい。要約は、抽出型要約、抽象型要約、又はこれらの組み合わせであってもよい。
【0045】
抽出型要約モデルは、文章中から重要な部分を抽出することによって、要約文を生成するように構成される。例えば、文字列から得られる分散(ベクトル)表現に応じた重要度を予め学習済みの機械学習モデル36cに文章、例えば説明文53を入力する。一例として、畳み込みニューラルネットワークを用いて、入力された説明文53を複数の部分(例えば、複数の文)に分割し、分割された各部分に対して重要か重要でないかという分類問題を解く。これにより、各部分の分散表現を得る。そして、重要であると分類された部分を並べることによって、要約文を生成する。このように作成された要約文は、元の説明文53から抽出された部分をつぎはぎした文章であるともいえるし、元の説明文53を部分的に削除した文章であるともいえる。
【0046】
あるいは、畳み込みニューラルネットワークにより得た各部分の分散表現を、系列変換(Sequence-to-Sequence)モデルのような他のモデルによって重要度を評価してもよい。この場合、重要であると評価された部分を並べることによって、要約文を生成する。その他、BERT又はELECTRAのような事前学習済みの機械学習モデル36dを用いた抽出型要約モデルを使用して要約文を生成することもできる。
【0047】
抽象型要約モデルは、元の文章、例えば説明文53から新しい文章(要約文)を生成するように構成される。例えば、系列変換(Sequence-to-Sequence)モデルを用いてもよい。あるいは、BERT又はELECTRAのような事前学習済みの機械学習モデル36eを用いた抽象型要約モデルを用いてもよい。さらに、抽出型要約と抽象型要約とを混合したタイプの機械学習モデル36fを用いてもよい。
【0048】
こうしたモデルを訓練又は微調整(fine-tuning)するために、データにラベル付けしてもよい。例えば、各カテゴリにおいて特徴的な単語が含まれている場合(例えばカテゴリが「カード」である文章に単語「写真」が含まれている場合)、その文章を正解データとしてもよい。これにより、カテゴリに応じて要約のための機械学習モデル36gを訓練又は微調整することができる。あるいは、あるカテゴリに対して特徴的な単語又は不明確になりやすい用語をデータベースに登録しておき、その登録用語を要約文に含めるようにしてもよい。
【0049】
画像処理は、画像の解像度を高める超解像処理又は画像の解像度を低下させる処理であってもよい。これに代えて、又はこれに加えて、コントラスト、明るさ、露出、およびその他のパラメータの最適化のような画像処理を行ってもよい。あるいは、画像67から特徴的な部分(例えば、人形の部分)を切り抜いたり(クロッピング)、人形の背景部分を切り取ったり(トリミング)してもよい。画像の切り抜き又は切り取りは、情報の抽出であるともいえる。解像度又はパラメータの変更は、抽出された画像(以下、「抽出画像」という)に対して行ってもよい。
【0050】
例えば、元の画像67から抽出画像(加工情報)を生成する場合には、活性化マップ又は顕著性マップ(Saliency Map)のような、任意のマップモデルを用いて、特徴的な部分を抽出してもよい。活性化マップは、例えば、畳み込みニューラルネットワークモデルに入力する画像に対して、Grad-CAM(Gradient-weighted Class Activation Mapping)を適用することによって生成することができる。そして、活性化している領域(あるカテゴリであることを示す領域)を切り抜いたり、活性化していない領域(あるカテゴリであることを示さない領域)を切り取ったりする。あるいは、顕著性マップを用いて、顕著性スコアが低い領域(人が見落としやすい領域)を切り抜くことによって、加工情報を生成してもよい。
【0051】
別の方法として、審美性スコア(Aesthetic Score)のマップに基づいて画像の切り抜きを行ってもよい。例えば、NIMA(Neural Image Assessment)のような、CNNベースの画像評価モデルにGrad-CAMを適用して、審美性スコアに応じて画像の領域を強調したヒートマップを生成する。これにより、画像において、審美性スコアが高い領域を切り抜いたり、審美性スコアの低い領域(人が見落としやすい領域)を切り取ったりすることによって、加工情報を生成してもよい。
【0052】
符号化は、種類が異なる複数のデータ(例えば、カテゴリ52と説明文53と画像67)を互いに比較可能なデータに変換することを含む。符号化は、加工情報に対して行ってもよい。符号化の例として、商品情報、例えば文字列及び画像をそれぞれ分散表現に変換してもよい。例えば、上記第1実施例において、説明文53(原文)と画像67とをそれぞれ分散表現に変換してもよい。例えば、CNN、FastText、Doc2Vec、Sentence2Vec、Data2Vec、又はBERT等の公知の機械学習モデル36hを用いて、文字列を符号化してもよい。この機械学習モデル36hは、文字列を入力すると、その文字列の分散表現を出力する。符号化されたデータ、例えば分散表現は指標71の一例である。画像の符号化は、CNN等の公知の機械学習モデル36iを用いて行うことができる。
【0053】
商品情報から一部を抽出することは、商品情報である文字列の中から1部を抽出することと、商品情報である画像から文字を抽出することと、商品情報である画像の一部を切り出すこと又は切り取ることと、動画から音声データ又は文字列を抽出することと、のうち少なくとも1つを含んでもよい。
【0054】
画像から文字を抽出する場合、まず画像から文字を検出し、その後、検出した文字を認識して、文字列とする。この加工では、文字検出と文字認識とを別々のタスクとして行う機械学習モデル36jを採用してもよいし、文字検出と文字認識とを同時に行う機械学習モデル36kを採用してもよい。文字の抽出は、公知のOCR(Optical Character Recognition)のための機械学習モデル36mを用いて行うことができる。例えば、CNN、Faster R-CNN、R2CNN(Rotational Region CNN)、YOLO(You Only Look Once)のようなワンショット物体検出、FOTS(Fast Oriented Text Spotting)などを採用してもよい。あるいは、画像から文字列を抽出するために、公知のOCRアプリケーションを用いてもよい。
【0055】
動画又は音声データから文字列を抽出する場合、音声を認識して文字列に変換する、自動音声認識(ASR:Automatic Speech Recognition)を行う。自動音声認識は、例えば、リカレントニューラルネットワーク(RNN)、Residual CNN、ContextNet、又はトランスフォーマ(Transformer)を応用した機械学習モデル36nを用いて行うことができる。
【0056】
抽出した文字列又は画像は、必要に応じて符号化又は分類して、元の商品情報、他の商品情報、又は他の加工情報と比較してもよい。例えば、画像67全体を分類した結果と、その同じ画像67の抽出画像を分類した結果とを比較してもよい。複数の異なる画像67が登録されている場合には、画像67毎に上述の指標化処理を行ってもよい。
【0057】
一例として、画像67から抽出した文字(図3では「商品は写真です」)を加工情報とすることができる。第4実施例として、この抽出した文字をエンコードした後に分類した分類結果と、他の商品情報、例えば説明文53又は説明文53の加工情報(例えば、エンコードした要約文)に基づく分類結果とを比較してもよい。あるいは、説明文53の文章の中から特徴的な(重要な)表現(図3では、例えば「ぬいぐるみセットの写真」など)を抽出した文字をエンコードしてもよい。
【0058】
2つの分散表現(2つの商品情報、2つの指標71、又は2つの分類結果)が予め規定された閾値以上の類似度である場合には、2つの分散表現が一致すると特定してもよい。言い換えると、2つの分散表現の類似度が閾値未満であれば、1つの商品について登録された商品情報が不明確であることが特定され得る。
【0059】
3以上の分散表現を得た場合には、類似しない2つの分散表現がある場合に、それら商品情報が不明確であるとプロセッサ31が特定してもよい。より厳密な判断を要する場合は、類似度が閾値未満の分散表現が1つでもあれば、それら商品情報が不明確であるとプロセッサ31が特定してもよい。
【0060】
図4に示す第5実施例では、第1指標71aは、画像67から抽出した文字をエンコードした加工情報に基づく、「商品17が写真である確率:100%」である。第2指標71bは、説明文53をエンコードした加工情報に基づく、「商品17が写真である確率:50%かつ同商品17が人形である確率:50%」である。第3指標71cは、説明文53の要約文をエンコードした加工情報に基づく、「商品17が写真である確率:100%」である。こうした3つの指標71(第1指標71a~第3指標71c)を得た場合、第2指標71bに「人形である確率:50%」が含まれることに基づいて、それら商品情報が不明確であるとプロセッサ31が特定してもよい。
【0061】
特定処理では、単に、「明確である」「不明確である」との2択の特定結果を設定してもよい。これに加えて、確率又は指標71のばらつき具合に応じて「概ね明確である」又は「不明確な可能性がある」のような、中間的な複数の特定結果を設定してもよい。あるいは、特定結果として、明確性を示す度数(例えば、明確度:1,2,3・・・)を採用してもよい。
【0062】
図5に示す第6実施例のように、1つの商品情報、例えば説明文53を複数の部分53a~53e、例えば1文ずつに分割し、各部分(各文)を符号化して、部分毎の(文章毎の)確率、例えば第1指標71a~第5指標71eを得てもよい。そして、1つの商品情報から得た第1指標71a~第5指標71eのうち、他の指標71と異なるカテゴリである確率が閾値(例えば、50%又は100%)以上である場合、プロセッサ31がその商品情報が不明確であると特定してもよい。
【0063】
図6に示す第7実施例のように、トークナイザ(Tokenization)を用いて、1つの商品情報、例えば説明文53を単語(トークン)に分解して(トークナイズ)、分解した単語の各々をコンピュータで処理可能な形式に符号化してもよい。そして、単語毎に特定のカテゴリに該当する確率(指標71a,71b,71c・・・・)を算出してもよい。
【0064】
すなわち、文字列を分割する場合の単位は、「文」であってもよいし、「単語」であってもよい。あるいは、段落毎、節毎、特定の文字数毎など、任意の単位で文字列を分割してもよい。そして、それら部分毎に得た複数の指標71のうち、他の指標71と異なるカテゴリである確率が閾値以上である場合、プロセッサ31がその商品情報が不明確であると特定してもよい。さらに、部分毎の確率に加えて、説明文53全体の確率を、追加の指標71としてもよい。
【0065】
特定の商品情報に基づいて、特定処理を行う場合の判断方法又は判断基準を変更してもよい。例えば、価格68が規定の閾値(例えば、あるカテゴリ52又は属性における平均価格を大きく上回る価格)を超える場合、比較する指標71を増やしたり、明確と特定する基準を厳しくしたりしてもよい。あるいは、商品情報が不明確になりがちなカテゴリ52がある場合、該当するカテゴリ52の商品17の場合に、比較する指標71を増やしたり、明確と特定する基準を厳しくしたりしてもよい。その他、販売者の属性62に応じて、判断方法又は判断基準を変更してもよい。
【0066】
ある条件を満たした場合に、特定の商品情報に基づく指標71を得て、比較対象とするようにしてもよい。例えば、説明文53の文字数が規定数以上である場合には、その説明文53の加工情報に基づく指標71を得るようにしてもよい。あるいは、販売者15の評価63が規定のレベルよりも低い場合には、その販売者15の商品17に対して、比較する指標71を増やしたり、明確と特定する基準を厳しくしたりしてもよい。
【0067】
[情報処理装置30が実行する情報処理]
図7に、登録された商品情報が不明確であるか否かを特定するために、情報処理装置30が実行する情報処理の一例を示す。情報処理装置30は、電子商取引プラットフォームに登録された複数の商品17の各々について、ステップS11~S15の処理を実行する。この情報処理は、商品17が登録される都度行ってもよいし、カテゴリ52毎に、又は規定のタイミングで、複数の商品17について連続的に行ってもよい。
【0068】
ステップS11では、プロセッサ31がサーバ20から商品データ27を取得して、商品データ37としてメモリ32に格納する。ステップS12では、プロセッサ31が、1つの商品17について、1以上の商品情報を比較するための指標71を得るために、1以上の商品情報に対して指標化処理を実行する。ステップS12で指標化処理の対象とする商品情報、指標化処理の内容、得る指標71の数は、商品17、カテゴリ52、又は登録された商品情報等の条件に応じて、変更してもよい。
【0069】
ステップS13では、プロセッサ31が、ステップS12で得た1以上の指標71のうち少なくとも2つを比較する比較処理を実行する。より詳細には、プロセッサ31が、複数の比較対象が一致するか否かを判断する。
【0070】
ステップS14では、情報処理装置30は、ステップS13の比較結果に基づいて、特定処理を実行する。例えば、プロセッサ31は、複数の指標71が一致しない場合、又は指標71に係る要件を満たさない場合(例えば、あるカテゴリである確率が閾値未満である場合)には、その商品17について登録された商品情報が不明確であることを特定する。これに対して、プロセッサ31は、複数の指標71が一致する場合、又は指標71に係る要件を満たす場合には、その商品17について登録された商品情報が明確であることを特定する。指標71がカテゴリである場合、商品情報が明確であることに代えて、あるいはそれに加えて、プロセッサ31は、その商品17が指標71として得られたカテゴリに属することを特定してもよい。
【0071】
ステップS15では、プロセッサ31が、少なくとも特定処理の結果をメモリ32に保存して、処理を終了する。ステップS15において、プロセッサ31は、さらに、ステップS12で得られた指標71及びステップS13の比較処理結果をメモリ32に保存してもよい。
【0072】
[本開示の作用]
1つの商品17について複数の商品情報が登録されている場合、それら商品情報の全てが正しいか否かを判断するのは容易ではない。例えば、登録された画像67が登録された商品17の写真であるか否かを第三者(例えば、商取引サイトの管理者)が確認することは困難である。同様に、複数の商品情報間に不整合がある場合に、どの商品情報が誤っているのか判別するのは困難である。商品情報に係る不備のパターンは様々であり、その全ての判断基準を定めるには大変な手間がかかる。加えて、複数の商品情報のデータの種類が互いに異なる場合、そのまま比較することはできない。
【0073】
その点、情報処理装置30は、複数の商品情報をそれぞれ指標化することにより、複数の指標71を得ることができる。この場合、商品情報のデータの種類が異なっていても、符号化又は分類のような処理を行うことにより、比較可能な指標71を得ることができる。さらに、情報処理装置30は、1つの商品情報を加工することにより、元の商品情報と加工情報とから、それぞれ指標71を得ることができる。
【0074】
そして、情報処理装置30が複数の指標71を比較することにより、少なくとも、商品情報が不明確であるか否かをチェックすることができる。すなわち、どの商品情報にどのような不備があるかまでは特定できなくとも、機械的な処理によって、商品情報が不明確であるか否かを特定又は推定することが可能になる。
【0075】
指標化処理は、機械学習モデル36を用いたデータ処理によって行うことができるので、人の目で個別にチェックする手間が省ける。指標化処理をするために、データの種類に応じた機械学習モデル36を選定することができるので、多様な商品情報に対応することができる。
【0076】
商品情報が不明確であるか否かをチェックすることにより、不明確な情報を是正するための様々な対策をとることが可能になる。例えば、不明確であると特定された商品情報のみ人の目でチェックすれば、全ての商品情報を人の目でチェックするよりも、かなり省力化できる。また、こうしたチェックで情報の不備に係るパターンが把握できれば、そのパターン毎に別途判断の手法を確立することが可能になる。こうした対策により、商取引サイトにおける登録情報の信頼性及び明確性を高めることができる。
【0077】
[本開示の効果]
本開示によれば、以下の効果を奏することができる。
(1)情報処理装置30を用いて、機械的な処理により商品17に関する商品情報の不明確さをチェックすることができる。
【0078】
(2)第3実施例のように、1つの元の商品情報から得た第1指標71aと、その商品情報の加工情報から得た第2指標71bとを比較することにより、商品情報の不明確さをチェックすることができる。したがって、1つの商品情報から得られた複数の指標71を用いて、比較処理を実行することができる。
【0079】
(3)第1実施例のように、複数の商品情報からそれぞれ異なる指標71を得ることができる。そして、それら指標71を比較することにより、商品情報の不明確さをチェックすることができる。
【0080】
(4)商品情報を加工することにより、元の商品情報とは異なる、より多様な情報を得ることが可能になる。また、元の商品情報とその加工情報とから、それぞれ異なる指標71を得ることが可能になる。
【0081】
(5)商品情報を符号化することにより、種類の異なるデータを互いに比較することが可能になる。
(6)文字列を要約することにより、元の商品情報(例えば、説明文53)を、ユーザ(例えば、購入者16)が読んだ場合により目を引くような、より特徴的な表現に変換することができる。
【0082】
(7)画像67を加工することにより、ユーザ(例えば、購入者16)が見た場合により目を引くような、より特徴的な画像に変換することができる。
(8)画像又は文字列のような商品情報から一部を抽出することにより、その商品情報のより特徴的な部分を抽出することができる。これにより、より正確なチェックを行うことが可能になる。
【0083】
(9)文字列の中から一部を抽出することにより、より特徴的な部分(例えば、単語)に重点を置いた指標71を得ることができる。
(10)画像67から文字を抽出することにより、画像67に含まれる文字情報に基づいて指標71を得ることができる。
【0084】
(11)画像67の一部を切り出すこと又は切り取ることにより、より特徴的な部分に基づいて指標71を得ることができる。
(12)商品17のカテゴリを指標71とすることにより、異なる種類の商品情報を互いに比較することが可能になる。また、分類の細かさを変更することにより、指標化処理の計算量を調整することが可能になる。
【0085】
(13)商品17があるカテゴリであることの確率を指標71とすることにより、その確率を閾値と比較して、商品情報が不明確であるか否かの判断を定量的に行うことが可能になる。
【0086】
(14)複数のデータ項目は、互いに種類の異なるデータを含むが、符号化を含む指標化処理を行うことにより、それらデータを比較することが可能になる。
(15)1以上の機械学習モデル36を使用することにより、人間の判断に近い指標化処理が可能になる。また、複数の機械学習モデル36を組み合わせることで、異なる種類のデータに対する指標化処理が可能になる。
【0087】
本実施形態は、以下のように変更して実施することができる。本実施形態及び以下の変更例は、技術的に矛盾しない範囲で互いに組み合わせて実施することができる。
・指標71は、ある対象(例えば、ある商品17に係るブランド、品目、種類、属性、属性値、又はこれらの組み合わせ、あるいは、モチーフとして用いられているキャラクタなど)であることの確率であってもよい。
【0088】
・指標71は、類似度であってもよい。例えば、指標化処理として、複数の商品情報をそれぞれベクトル化して、互いのコサイン類似度に基づいて、どのカテゴリに属するかを判断してもよい。あるいは、ある対象(例えば、ある商品17に係るブランド、品目、種類、属性、属性値、又はこれらの組み合わせ、あるいは、モチーフとして用いられているキャラクタなど)を指標化した値(正解データ)に対する類似度に基づいて、指標化した商品情報のカテゴリを判断してもよい。
【0089】
・カテゴリ52は、販売者15によって登録される商品情報ではなく、情報処理装置30によって特定され分類結果に基づいて生成するデータ項目であってもよい。あるいは、販売者15によってカテゴリ52が登録されなかった場合に、情報処理装置30による分類結果に基づいてカテゴリ52のデータを生成してもよい。他の例として、登録された商品情報が不明確であった場合に、販売者15によって登録されたカテゴリ52を特定された分類結果に基づいて修正してもよい。
【0090】
以下に、上記実施形態及び変更例から把握される態様を列挙する。
[1]電子商取引プラットフォームにおいて使用される情報処理装置であって、
前記情報処理装置は、1以上のプロセッサと1以上のメモリとを備え、
前記メモリには、前記電子商取引プラットフォームに登録された複数の商品に関する商品データが格納されており、
前記商品データは複数のデータセットを含み、
前記各データセットは、1つの前記商品について登録された複数のデータ項目を含み、
前記各データ項目は、前記1つの商品に関する商品情報を含み、
前記プロセッサは、1以上の前記商品情報を比較するための指標を得るために、前記1以上の商品情報に対して指標化処理を実行するように構成される、
情報処理装置。
【0091】
この構成によれば、1つの商品情報から複数の指標を得たり、複数の商品情報の各々から指標を得たりすることができる。そのように、商品情報から複数の指標を得ることにより、商品情報を比較することが可能になる。
【0092】
[2]前記指標化処理は、
1つの前記商品情報に基づいて前記1つの商品に係る第1指標を得ることと、
前記1つの商品情報を加工することにより加工情報を生成することと、
前記加工情報に基づいて前記1つの商品に係る第2指標を得ることと、を含み、
前記プロセッサは、さらに、前記第1指標と前記第2指標とを比較する比較処理を実行するように構成される、
上記[1]に記載の情報処理装置。
【0093】
この構成によれば、1つの商品情報と、その商品情報の加工情報とから、それぞれ指標を得ることができる。したがって、1つの商品情報から複数の指標を得ることが可能になる。なお、プロセッサは、さらに、比較処理の後に、比較処理における比較結果に基づいて、特定処理を実行してもよい。この特定処理では、第1指標と第2指標とが一致しない場合に、指標化に係る商品情報が不明確であることを特定してもよい。
【0094】
[3]前記複数のデータ項目は、第1データ項目及び第2データ項目を含み、
前記第1データ項目は前記商品情報である第1商品情報を含み、前記第2データ項目は前記商品情報である第2商品情報を含み、
前記指標化処理は、
前記第1商品情報に基づいて前記1つの商品に係る第1指標を得ることと、
前記第2商品情報に基づいて前記1つの商品に係る第2指標を得ることと、を含み、
前記プロセッサは、さらに、前記第1指標と前記第2指標とを比較する比較処理を実行するように構成される、
上記[1]に記載の情報処理装置。
【0095】
この構成によれば、複数の商品情報からそれぞれ指標を得ることができる。したがって、指標化処理により得た指標を介して、異なる複数の商品情報を機械的な処理で比較することが可能になる。なお、プロセッサは、さらに、比較処理の後に、比較処理における比較結果に基づいて、特定処理を実行してもよい。この特定処理では、第1指標と第2指標とが一致しない場合に、指標化に係る商品情報が不明確であることを特定してもよい。
【0096】
[4]前記指標化処理は、前記商品情報を加工することにより加工情報を生成することを含み、
前記商品情報に基づいて前記1つの商品に係る前記指標を得ることは、前記加工情報に基づいて前記指標を得ることを含む、
上記[3]に記載の情報処理装置。
【0097】
この構成によれば、1つの商品情報と、その商品情報の加工情報とから、それぞれ指標を得ることができる。したがって、1つの商品情報から複数の指標を得ることが可能になる。
【0098】
[5]前記商品情報を加工することは、前記商品情報を符号化すること、前記商品情報である文字列を要約すること、前記商品情報である画像を処理すること、前記商品情報から一部を抽出すること、のうち何れか1以上を含む、
上記[2]~[4]のうち何れかに記載の情報処理装置。
【0099】
この構成によれば、符号化、要約、画像処理、又は抽出により、多様な加工情報を得ることができる。そして、元の商品情報に応じて適切な加工を行うことにより、元の商品情報よりも特徴を端的に現した指標を得ることが可能になる。
【0100】
[6]前記抽出することは、前記商品情報である文字列の中から1部を抽出することと、前記商品情報である画像から文字を抽出することと、前記商品情報である画像の一部を切り出すこと又は切り取ることと、のうち少なくとも1つを含む、
請求項5に記載の情報処理装置。
【0101】
この構成によれば、文字列の中から特徴的な部分を抽出することにより、元の商品情報よりも特徴を端的に現した指標を得ることが可能になる。また、画像から文字を抽出することにより、元の商品情報とは異なる種類のデータを得ることが可能になる。また、画像の中から特徴的な領域を切り出すことにより、元の商品情報よりも特徴を端的に現した指標を得ることが可能になる。また、画像の中から背景のような特徴のない領域を切り取ることにより、より特徴的な領域を残すことができる。これにより、元の商品情報よりも特徴を端的に現した指標を得ることが可能になる。
【0102】
[7]前記指標は、前記商品を分類するために規定されたカテゴリであり、
前記指標を得ることは、前記商品情報に基づいて前記1つの商品を分類することを含む、
上記[1]~[6]のうち何れかに記載の情報処理装置。
【0103】
この構成によれば、様々な商品情報をそれぞれ規定のカテゴリに分類することにより、機械的な処理により互いに比較可能な指標にすることができる。
[8]前記指標は、前記商品があるカテゴリであることの確率であり、
前記指標化処理は、前記1つの商品が前記あるカテゴリに該当する確率を算出することを含む、
上記[1]~[6]のうち何れかに記載の情報処理装置。
【0104】
この構成によれば、様々な商品情報又は加工情報のそれぞれについて、1つの商品があるカテゴリに該当する確率を算出することにより、その確率を互いに比較することができる。これにより、機械的な処理により複数の指標がどの程度一致しているかを判断することが可能になる。
【0105】
[9]前記複数のデータ項目は、互いに種類の異なるデータを含み、
前記データの種類は、属性及び当該属性に対する属性値、文字列、画像、数値のうち何れかである、
上記[1]~[8]のうち何れかに記載の情報処理装置。
【0106】
請求項1に記載の情報処理装置。
この構成によれば、種類が異なる複数のデータを指標化することにより、複数の商品情報を機械的な処理により互いに比較することが可能になる。
【0107】
[10]前記複数のデータ項目は、前記商品に関する、タイトル、サイズ、ブランド、状態、説明文、画像、カテゴリのうち何れか1以上を含む、
上記[1]~[9]のうち何れかに記載の情報処理装置。
【0108】
この構成によれば、各商品について登録されたデータ項目が統一されていなくても、何れか1以上のデータ項目を指標化することにより、その商品についての商品情報の不明確さを機械的にチェックすることが可能になる。
【0109】
[11]前記複数のデータ項目は、前記商品の販売者のプロフィール、前記販売者の評価、前記販売者に対するコメント、前記販売者の登録日、前記販売者のIPアドレスのうち何れか1以上を含む、
上記[1]~[10]のうち何れかに記載の情報処理装置。
【0110】
この構成によれば、各商品を販売する販売者に関するデータ項目に基づいて、商品情報の不明確さを機械的にチェックすることが可能になる。これにより、各販売者に関する信用情報を得ることができる。
【0111】
[12]前記指標化処理の少なくとも一部は、1以上の機械学習モデルを使用して実行される、
上記[1]~[11]のうち何れかに記載の情報処理装置。
【0112】
この構成によれば、1以上の機械学習モデルを使用することにより、人間の判断に近い指標化処理が可能になる。また、複数の機械学習モデルを組み合わせることで、異なる種類のデータに対する指標化処理が可能になる。
【0113】
[13]前記指標は、前記商品を分類するために規定されたカテゴリであり、
前記指標化処理は、前記1つの商品を異なる情報に基づいて2回以上分類することにより、2以上の分類結果を得ることを含み、
前記プロセッサは、前記2以上の分類結果に基づいて特定処理を実行するように構成され、前記特定処理は、
前記2以上の分類結果が互いに一致しない場合に、前記1つの商品について登録された商品情報が不明確であることを特定し、前記2以上の分類結果が互いに一致する場合に、当該分類結果に基づいて前記1つの商品の前記カテゴリを特定することを含む、
上記[1]~[12]のうち何れかに記載の情報処理装置。
【0114】
この構成によれば、2以上の分類結果に基づいて、1つの商品について登録された商品情報が不明確であるか否かを特定することが可能になる。また、2以上の分類結果が互いに一致する場合には、その商品のカテゴリを特定することが可能になる。
【0115】
[14]前記指標は、前記商品を分類するために規定されたカテゴリであり、
前記複数のデータ項目は前記商品のカテゴリを含み、
前記指標化処理は、前記1つの商品を前記商品情報に基づいて分類することにより分類結果を得ることを含み、
前記プロセッサは、前記カテゴリと前記分類結果に基づいて特定処理を実行するように構成され、前記特定処理は、
前記カテゴリと前記分類結果が互いに一致しない場合に、前記1つの商品について登録された商品情報が不明確であることを特定し、前記カテゴリと前記分類結果が互いに一致する場合に、当該分類結果に基づいて前記1つの商品の前記カテゴリを特定することを含む、
上記[1]~[12]のうち何れかに記載の情報処理装置。
【0116】
この構成によれば、商品情報であるカテゴリと、カテゴリとは別の商品情報の分類結果とに基づいて、商品情報が不明確であるか否かと特定することが可能になる。
[15]電子商取引プラットフォームにおいて使用される情報処理装置が実行する情報処理方法であって、
前記電子商取引プラットフォームに登録された複数の商品に関する商品データを取得することであって、前記商品データは複数のデータセットを含み、前記各データセットは、1つの前記商品について登録された複数のデータ項目を含み、前記各データ項目は、前記1つの商品に関する商品情報を含む、ことと、
1以上の前記商品情報を比較するための指標を得るために、前記1以上の商品情報に対して指標化処理を実行することと、
を含む、情報処理方法。
【0117】
[16]電子商取引プラットフォームにおいて使用される情報処理装置によって実行されるプログラムであって、
前記プログラムは、1以上のコンピュータに、
前記電子商取引プラットフォームに登録された複数の商品に関する商品データを取得することであって、前記商品データは複数のデータセットを含み、前記各データセットは、1つの前記商品について登録された複数のデータ項目を含み、前記各データ項目は、前記1つの商品に関する商品情報を含む、ことと、
1以上の前記商品情報を比較するための指標を得るために、前記1以上の商品情報に対して指標化処理を実行することと、
を実行させるためのプログラム。
【符号の説明】
【0118】
11…システム、12…ネットワーク、13…販売者端末、14…購入者端末、15…販売者、16…購入者、17…商品、18…商品画面、20…サーバ、21…プロセッサ、22…メモリ、23…通信機、24…通信バス、25…アプリケーション、27…商品データ、30…情報処理装置、31…プロセッサ、32…メモリ、33…通信機、34…通信バス、35…学習プログラム、36,36a,36b,36c,36d,36e,36f,36g,36h,36i,36j,36k,36m,36n…機械学習モデル、37…商品データ、50…データセット、51…タイトル、52…カテゴリ、53…説明文、67…画像、68…価格、71…指標、71a…第1指標、71b…第2指標、71c…第3指標。
図1
図2
図3
図4
図5
図6
図7