IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7456486アイテム分類支援システム、方法およびプログラム
<>
  • 特許-アイテム分類支援システム、方法およびプログラム 図1
  • 特許-アイテム分類支援システム、方法およびプログラム 図2
  • 特許-アイテム分類支援システム、方法およびプログラム 図3
  • 特許-アイテム分類支援システム、方法およびプログラム 図4
  • 特許-アイテム分類支援システム、方法およびプログラム 図5
  • 特許-アイテム分類支援システム、方法およびプログラム 図6
  • 特許-アイテム分類支援システム、方法およびプログラム 図7
  • 特許-アイテム分類支援システム、方法およびプログラム 図8
  • 特許-アイテム分類支援システム、方法およびプログラム 図9
  • 特許-アイテム分類支援システム、方法およびプログラム 図10
  • 特許-アイテム分類支援システム、方法およびプログラム 図11
  • 特許-アイテム分類支援システム、方法およびプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-18
(45)【発行日】2024-03-27
(54)【発明の名称】アイテム分類支援システム、方法およびプログラム
(51)【国際特許分類】
   G06F 18/22 20230101AFI20240319BHJP
   G06F 18/214 20230101ALI20240319BHJP
   G06N 20/00 20190101ALI20240319BHJP
【FI】
G06F18/22
G06F18/214
G06N20/00 130
【請求項の数】 10
(21)【出願番号】P 2022502375
(86)(22)【出願日】2020-02-25
(86)【国際出願番号】 JP2020007495
(87)【国際公開番号】W WO2021171373
(87)【国際公開日】2021-09-02
【審査請求日】2022-07-28
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103090
【弁理士】
【氏名又は名称】岩壁 冬樹
(74)【代理人】
【識別番号】100124501
【弁理士】
【氏名又は名称】塩川 誠人
(72)【発明者】
【氏名】小山田 昌史
【審査官】渡辺 一帆
(56)【参考文献】
【文献】特開2017-072917(JP,A)
【文献】特開2011-150603(JP,A)
【文献】国際公開第2018/020842(WO,A1)
【文献】特開2015-153013(JP,A)
【文献】榊 剛史 ほか,"Web上の情報を用いた関連語のシソーラス構築について",自然言語処理 [online],一般社団法人言語処理学会,2007年,第14巻, 第2号,pp. 3-31,[retrieved on 2023.09.20], Retrieved from the Internet: <URL: https://www.jstage.jst.go.jp/article/jnlp1994/14/2/14_2_3/_article/-char/ja/>,<DOI: 10.5715/jnlp.14.2_3>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 18/22
G06F 18/214
G06N 20/00-20/20
(57)【特許請求の範囲】
【請求項1】
複数のアイテム名を含むグループに属するアイテム名から、当該アイテム名を構成する1つ以上の単語を、アイテム名毎にそれぞれ取得する取得手段と、
取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する算出手段と、
取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和が上位M番目(Mは自然数)までの単語を、前記複数のアイテム名が表す各アイテムの分類名の候補に決定する決定手段とを備え
前記決定手段は、
前記複数のアイテム名における単語の重みを単語毎にそれぞれ算出し、
取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和を算出された重みで重み付けた結果が上位M番目までの単語を、分類名の候補に決定し、
前記複数のアイテム名における単語の出現頻度と、任意に選択されたアイテム名における単語の出現頻度とを用いて、単語の重みを算出する
ことを特徴とするアイテム分類支援システム。
【請求項2】
算出手段は、
アイテム名を構成する単語の当該アイテム名との関連度を1として算出し、
アイテム名を構成しない単語の当該アイテム名との関連度を0として算出する
請求項1記載のアイテム分類支援システム。
【請求項3】
取得手段は、複数のアイテム名をいずれも構成せず、かつ前記複数のアイテム名のいずれかに関連する単語を外部から取得する
請求項1または請求項2記載のアイテム分類支援システム。
【請求項4】
算出手段は、予め保持されている辞書に定められている複数の単語間の類似性を基に関連度を算出する
請求項1から請求項3のうちのいずれか1項に記載のアイテム分類支援システム。
【請求項5】
複数のアイテム名を表示するとともに、前記複数のアイテム名が表す各アイテムの、決定手段により決定された分類名の複数の候補をユーザによる指定可能な態様で表示する表示制御手段と、
前記分類名の複数の候補のいずれかが前記ユーザに指定された場合、前記各アイテムが前記ユーザに指定された分類名で分類されると決定する分類決定手段とを備える
請求項1から請求項のうちのいずれか1項に記載のアイテム分類支援システム。
【請求項6】
表示制御手段は、分類名の候補と併せて、前記分類名の候補となる単語を含むアイテム名を表示する
請求項記載のアイテム分類支援システム。
【請求項7】
コンピュータが、
複数のアイテム名を含むグループに属するアイテム名から、当該アイテム名を構成する1つ以上の単語を、アイテム名毎にそれぞれ取得し、
取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出し、
取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和が上位M番目までの単語を、前記複数のアイテム名が表す各アイテムの分類名の候補に決定し、
前記複数のアイテム名における単語の重みを単語毎にそれぞれ算出し、
取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和を算出された重みで重み付けた結果が上位M番目までの単語を、分類名の候補に決定し、
前記複数のアイテム名における単語の出現頻度と、任意に選択されたアイテム名における単語の出現頻度とを用いて、単語の重みを算出する
ことを特徴とするアイテム分類支援方法。
【請求項8】
アイテム名を構成する単語の当該アイテム名との関連度を1として算出し、
アイテム名を構成しない単語の当該アイテム名との関連度を0として算出する
請求項7記載のアイテム分類支援方法。
【請求項9】
コンピュータに、
複数のアイテム名を含むグループに属するアイテム名から、当該アイテム名を構成する1つ以上の単語を、アイテム名毎にそれぞれ取得する取得処理、
取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する算出処理、および
取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和が上位M番目までの単語を、前記複数のアイテム名が表す各アイテムの分類名の候補に決定する決定処理を実行させるためのアイテム分類支援プログラムであって、
前記決定処理で、
前記複数のアイテム名における単語の重みを単語毎にそれぞれ算出させ、
取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和を算出された重みで重み付けた結果が上位M番目までの単語を、分類名の候補に決定させ、
前記複数のアイテム名における単語の出現頻度と、任意に選択されたアイテム名における単語の出現頻度とを用いて、単語の重みを算出させる
アイテム分類支援プログラム。
【請求項10】
コンピュータに、
算出処理で、
アイテム名を構成する単語の当該アイテム名との関連度を1として算出させ、
アイテム名を構成しない単語の当該アイテム名との関連度を0として算出させる
請求項9記載のアイテム分類支援プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アイテムの分類を支援するアイテム分類支援システム、アイテム分類支援方法、および、アイテム分類支援プログラムに関する。
【背景技術】
【0002】
商品と、その商品に応じた分類の分類名とを対応付けたデータを作成する場合がある。図12は、商品と分類名とを対応付けたデータの例を示す模式図である。なお、商品は、商品名で表される。図12に示す例では、例えば、「名探偵C 1/10」という商品名の商品は、「フィギュア」に分類され、「怪盗Xポスター」という商品名の商品は「ポスター」に分類されることを示している。
【0003】
商品と分類名とを対応付けたデータは、例えば、商品の需要予測を行うための機械学習における教師データとして利用される。
【0004】
商品に対して、その商品に応じた分類の分類名を定める作業は、商品毎に人手で行われることが一般的である。
【0005】
なお、特許文献1には、データを検出するためのモデルを生成する情報処理装置が記載されている。特許文献1に記載されている情報処理装置は、学習対象となるデータのうち、所定の条件を満たす対象データに基づいて対象データの分類を設定する分類手段と、対象データと対象データに設定された分類とに基づいてデータを検出するモデルを生成するモデル生成手段とを備える。
【0006】
また、特許文献2には、ユーザが通信ネットワークを介して商品の購入を行うeコマース(Electronic Commerce )に関する情報処理装置が記載されている。
【先行技術文献】
【特許文献】
【0007】
【文献】国際公開第2019/187865号
【文献】国際公開第2015/132886号
【発明の概要】
【発明が解決しようとする課題】
【0008】
前述のように、商品に対して、その商品に応じた分類の分類名を定める作業は、商品毎に人手で行われることが一般的である。そのため、その作業には、非常に手間がかかる。
【0009】
また、商品だけでなく、商品以外のアイテムであっても、アイテムに応じた分類の分類名を容易に定められることが好ましい。
【0010】
特許文献1には、商品の分類の分類名を定めることは開示されていない。
【0011】
また、特許文献2には、商品の分類の分類名を定めることは開示されている。具体的には、特許文献2に記載されている情報処理装置は、選択された複数の商品のそれぞれについて属性を表すキーワードを抽出し、抽出されたキーワードのうちで複数の商品に共通または類似する少なくとも一つのキーワードをグループワード(分類名)として選択する。
【0012】
しかし、複数の商品に共通または類似する属性だけではなく、複数の商品に関連する属性も選択された方が、ユーザが選択できる分類名の候補の範囲が広がる。特許文献2に記載されている情報処理装置では、複数の商品に共通または類似するキーワードを選択することしか想定されていない。
【0013】
そこで、本発明は、分類対象となるアイテムの分類の適切な分類名の候補をユーザに提示できるアイテム分類支援システム、アイテム分類支援方法、および、アイテム分類支援プログラムを提供することを目的とする。
【課題を解決するための手段】
【0014】
本発明によるアイテム分類支援システムは、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する1つ以上の単語を、アイテム名毎にそれぞれ取得する取得手段と、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する算出手段と、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位M番目(Mは自然数)までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定する決定手段とを備え、決定手段は、複数のアイテム名における単語の重みを単語毎にそれぞれ算出し、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和を算出された重みで重み付けた結果が上位M番目までの単語を、分類名の候補に決定し、複数のアイテム名における単語の出現頻度と、任意に選択されたアイテム名における単語の出現頻度とを用いて、単語の重みを算出することを特徴とする。
【0015】
本発明によるアイテム分類支援方法は、コンピュータが、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する1つ以上の単語を、アイテム名毎にそれぞれ取得し、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出し、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位M番目までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定し、複数のアイテム名における単語の重みを単語毎にそれぞれ算出し、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和を算出された重みで重み付けた結果が上位M番目までの単語を、分類名の候補に決定し、複数のアイテム名における単語の出現頻度と、任意に選択されたアイテム名における単語の出現頻度とを用いて、単語の重みを算出することを特徴とする。
【0016】
本発明によるアイテム分類支援プログラムは、コンピュータに、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する1つ以上の単語を、アイテム名毎にそれぞれ取得する取得処理、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する算出処理、および取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位M番目までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定する決定処理を実行させるためのアイテム分類支援プログラムであって、決定処理で、複数のアイテム名における単語の重みを単語毎にそれぞれ算出させ、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和を算出された重みで重み付けた結果が上位M番目までの単語を、分類名の候補に決定させ、複数のアイテム名における単語の出現頻度と、任意に選択されたアイテム名における単語の出現頻度とを用いて、単語の重みを算出させることを特徴とする。
【発明の効果】
【0017】
本発明によれば、分類対象となるアイテムの分類の適切な分類名の候補をユーザに提示できる。
【図面の簡単な説明】
【0018】
図1】本発明の実施形態のアイテム分類支援システムの構成例を示すブロック図である。
図2】分類名候補決定部3の構成例を示すブロック図である。
図3】単語行列作成部7が作成する単語行列の例を示す説明図である。
図4】単語行列補正部8が補正する単語行列の例を示す説明図である。
図5】分類名候補抽出部9が抽出する分類名の候補を決定する例を示す説明図である。
図6】分類名候補抽出部9が各単語の重みを決定する例を示す説明図である。
図7】分類名候補抽出部9が抽出する分類名の候補を決定する他の例を示す説明図である。
図8】表示制御部4がディスプレイ装置5上に表示する画面の例を示す説明図である。
図9】本発明の実施形態の処理経過の例を示すフローチャートである。
図10】本発明の実施形態のアイテム分類支援システムに係るコンピュータの構成例を示す概略ブロック図である。
図11】本発明のアイテム分類支援システムの概要を示すブロック図である。
図12】商品と分類名とを対応付けたデータの例を示す模式図である。
【発明を実施するための形態】
【0019】
以下、本発明の実施形態を図面を参照して説明する。
【0020】
以下では、分類対象となるアイテムが商品である場合を例にして説明するが、分類対象となるアイテムは商品に限られない。アイテムは、例えば、会社であってもよい。
【0021】
アイテムは、アイテム名で表される。例えば、アイテムが商品である場合には、商品名がアイテム名に該当する。また、アイテムが会社である場合には、会社名がアイテム名に該当する。
【0022】
図1は、本発明の実施形態のアイテム分類支援システムの構成例を示すブロック図である。本発明の実施形態のアイテム分類支援システム1は、グルーピング済アイテム名記憶部2と、分類名候補決定部3と、表示制御部4と、ディスプレイ装置5と、分類決定部6とを備える。
【0023】
グルーピング済アイテム名記憶部2は、既にグループに分けられたアイテムのアイテム名を複数記憶する記憶装置である。本例では、グルーピング済アイテム名記憶部2は、グループに分けられた商品の商品名を複数記憶する。
【0024】
具体的には、グルーピング済アイテム名記憶部2には、商品(アイテム)の商品名(アイテム名)の集合に対する商品名のグループが記憶されている。
【0025】
商品名のグループは、例えば、1つの所定の商品名と、所定の商品名との類似度が所定の基準以上である1つ以上の商品名とで構成されるグループである。2つの商品名間の類似度は、例えば「2つの商品名間の編集距離の逆数」である。なお、グループは、上記以外の方法で定められてもよい。
【0026】
分類名候補決定部3は、上述した商品の分類名の候補を決定する機能を有する。図2は、分類名候補決定部3の構成例を示すブロック図である。
【0027】
図2に示すように、本実施形態の分類名候補決定部3は、単語行列作成部7と、単語行列補正部8と、分類名候補抽出部9とを含む。また、分類名候補決定部3は、インターネットに接続されている。以下、本実施形態の分類名候補決定部3が商品の分類名の候補を決定する処理を説明する。
【0028】
グルーピング済アイテム名記憶部2に記憶されているグループを1つ取り出すと、最初に分類名候補決定部3の単語行列作成部7は、単語行列を作成する。図3は、単語行列作成部7が作成する単語行列の例を示す説明図である。
【0029】
最初に、単語行列作成部7は、図3に示すように、単語行列の1列目に、取り出されたグループに含まれている複数の商品名をそれぞれ格納する。図3に示す商品名の例は、「たっぷりミルクソーダ」、「たっぷりプリン」、「ぎっしりアンパン」である。なお、本例では、取り出されたグループに商品名が全部で10個含まれている。
【0030】
単語行列作成部7は、単語行列に格納された各商品名に対して、最初の処理として形態素解析をそれぞれ行う。単語行列作成部7が形態素解析を行うと、各商品名は、1つ以上の単語に分割される。例えば、「たっぷりミルクソーダ」は、単語「たっぷり」と、単語「ミルク」と、単語「ソーダ」に分割される。
【0031】
次いで、単語行列作成部7は、各商品名が分割されて取得された各単語を、図3に示すように単語行列の1行目に格納する。なお、図3に示す単語「たっぷり」のように、複数の商品名から同一の単語がそれぞれ取得されたとき、単語行列作成部7は、取得された単語を1つだけ格納する。
【0032】
すなわち、単語行列作成部7は、複数の商品名を含むグループに属する商品名から、その商品名を構成する1つ以上の単語を、商品名毎にそれぞれ取得する。
【0033】
なお、図3に示すa1、a2、・・・は、単語行列の1行目に格納された各単語を識別する記号である。例えば、a1は、単語「たっぷり」を示す。
【0034】
また、単語行列作成部7は、単語行列に格納された各商品名に対して、2つ目の処理として商品名データベース検索を行う。
【0035】
単語行列作成部7は、例えば、商品名を用いて商品名データベース検索を行い、検索に用いられた商品名の属性を商品名データベースから抽出する。
【0036】
商品名データベースは、例えばユーザが勤務している店舗内に備えられている、商品名とその属性が検索可能に格納されたデータベースである。単語行列作成部7は、商品名データベースに接続し、商品名を検索する。
【0037】
本例において、単語行列作成部7は、商品名「たっぷりプリン」を用いて商品名データベース検索を行った結果、「たっぷりプリン」の属性が「なめらか」であることを発見した。よって、図3に示すように、単語行列作成部7は、単語行列の1行目に「なめらか」を格納している。
【0038】
なお、商品名データベースに商品名がカテゴリ毎に格納されている場合、単語行列作成部7は、商品名データベース検索に用いられた単語の上位概念(カテゴリ)を意味する単語を商品名データベースから抽出してもよい。
【0039】
上位概念を意味する単語として、単語行列作成部7は、例えば「ぎっしりアンパン」の上位概念である単語「パン」、「たっぷりミルクソーダ」の上位概念である単語「乳製品」を抽出し、単語行列に格納してもよい。
【0040】
また、単語行列作成部7は、単語行列に格納された各商品名に対して、3つ目の処理としてWorld Wide Web(以下、単にWeb と呼ぶ。)検索を行う。
【0041】
単語行列作成部7は、例えば、商品名を用いてWeb 検索を行い、検索に用いられた商品名に付随することが多い単語をWeb から抽出する。
【0042】
本例において、単語行列作成部7は、商品名「たっぷりミルクソーダ」を用いてWeb 検索を行った結果、「自然派」という単語をWeb に多数発見した。よって、図3に示すように、単語行列作成部7は、単語行列の1行目に「自然派」を格納している。
【0043】
すなわち、単語行列作成部7は、複数の商品名をいずれも構成せず、かつ複数の商品名のいずれかに関連する単語を外部(商品名データベース、またはWeb )から取得する。
【0044】
次いで、単語行列作成部7は、単語行列の1行目に格納された各単語が、1列目に格納された各商品名に含まれているか否かを判定する。単語が商品名に含まれている場合、単語行列作成部7は、対応する単語行列の成分の値を「1」に設定する。また、単語が商品名に含まれていない場合、単語行列作成部7は、対応する単語行列の成分の値を「0」に設定する。
【0045】
例えば、商品名「たっぷりミルクソーダ」には単語「たっぷり」が含まれているので、単語行列作成部7は、単語行列の(「たっぷりミルクソーダ」,「たっぷり」)成分の値を「1」に設定する。また、商品名「たっぷりミルクソーダ」には単語「プリン」が含まれていないので、単語行列作成部7は、単語行列の(「たっぷりミルクソーダ」,「プリン」)成分の値を「0」に設定する。
【0046】
単語行列の全ての成分に対して判定を行った後、単語行列作成部7は、作成された単語行列を単語行列補正部8に入力する。単語行列補正部8は、入力された単語行列の成分の値を補正する機能を有する。
【0047】
図4は、単語行列補正部8が補正する単語行列の例を示す説明図である。図4に示す下線付きの値が、単語行列補正部8が補正した単語行列の成分の値である。単語行列補正部8は、任意のルールに基づいて、単語行列の各成分の値(特に「0」)を補正できる。
【0048】
例えば、商品名データベースから「たっぷりプリン」の属性が「なめらか」であることが発見されたため、単語行列補正部8は、(「たっぷりプリン」,「なめらか」)成分の値を、0よりも大きい値に補正してもよい。図4に示す例では、単語行列補正部8は、(「たっぷりプリン」,「なめらか」)成分の値を「0」から「0.9」に補正している。
【0049】
また、単語行列補正部8は、予め保持されている辞書に定められている複数の単語間の類似性を基に補正してもよい。例えば、単語「たっぷり」と単語「ぎっしり」とが類似していることが辞書に定められている場合、単語行列補正部8は、(「ぎっしりアンパン」,「たっぷり」)成分の値を、0よりも大きい値に補正してもよい。図4に示す例では、単語行列補正部8は、(「ぎっしりアンパン」,「ぎっしり」)成分の値が「1」であるので、(「ぎっしりアンパン」,「たっぷり」)成分の値を「0」から「0.8」に補正している。
【0050】
同様の理由で、単語行列補正部8は、(「たっぷりミルクソーダ」,「ぎっしり」)成分の値、および(「たっぷりプリン」,「ぎっしり」)成分の値を、どちらも0よりも大きい値に補正してもよい。
【0051】
図4に示す例では、単語行列補正部8は、(「たっぷりミルクソーダ」,「たっぷり」)成分の値が「1」であるので、(「たっぷりミルクソーダ」,「ぎっしり」)成分の値を「0」から「0.8」に補正している。また、単語行列補正部8は、(「たっぷりプリン」,「たっぷり」)成分の値が「1」であるので、(「たっぷりプリン」,「ぎっしり」)成分の値を「0」から「0.8」に補正している。
【0052】
単語行列補正部8は、他にも様々な方法で単語行列の成分の値を補正できる。また、単語行列補正部8は、低ランク近似を行うことによって、単語行列を値が「0」の成分がより少ない行列に変換してもよい。
【0053】
すなわち、単語行列作成部7および単語行列補正部8は、取得された単語が商品名に関連する度合いである関連度を、商品名毎にそれぞれ算出する。特に、単語行列作成部7は、商品名を構成する単語のその商品名との関連度を1として算出し、商品名を構成しない単語のその商品名との関連度を0として算出する。
【0054】
また、単語行列補正部8は、予め保持されている辞書に定められている複数の単語間の類似性を基に関連度を算出してもよい。
【0055】
単語行列補正部8は、補正した単語行列を分類名候補抽出部9に入力する。分類名候補抽出部9は、入力された単語行列から分類名の候補を抽出する機能を有する。本実施形態の分類名候補抽出部9は、以下の2つの方法のいずれかを用いて分類名の候補を抽出する。
【0056】
1つ目の方法は、単純に単語行列の成分の値に基づいて抽出する分類名の候補を決定する方法である。図5は、分類名候補抽出部9が抽出する分類名の候補を決定する例を示す説明図である。
【0057】
分類名候補抽出部9は、以下の式で定義されるスコアS1(ai)(iは自然数)を、各単語aiに対してそれぞれ計算する。
【0058】
S1(ai) = Σn=1 N(bi n) ・・・式(1)
【0059】
なお、式(1)におけるbi n は、単語行列の(i,n)成分の値である(nは1以上10以下の自然数、N=10)。図5に示す単語行列の下の各値が、各単語aiに対してそれぞれ計算されたスコアS1(ai)である。
【0060】
次いで、分類名候補抽出部9は、単語行列の1行目に格納された各単語のうち、算出されたスコアが上位の単語を、抽出される分類名の候補に決定する。図5に示す例では、分類名候補抽出部9は、算出されたスコアが最高である単語「たっぷり」を、抽出される分類名の候補の1つに決定している。
【0061】
すなわち、分類名候補抽出部9は、単語行列作成部7により取得された単語のうち、単語行列作成部7および単語行列補正部8により算出された関連度の複数の商品名に渡る和が上位M番目(Mは自然数)までの単語を、複数の商品名が表す各商品の分類名の候補に決定する。
【0062】
2つ目の方法は、各単語の相対的な重要度である重みも用いて抽出する分類名の候補を決定する方法である。図6は、分類名候補抽出部9が各単語の重みを決定する例を示す説明図である。
【0063】
本例において、分類名候補抽出部9は、図6に示す行列の2行目のように、取り出されたグループに含まれている10個の商品名における、単語行列の1行目に格納された各単語の出現頻度をそれぞれ計算する。
【0064】
例えば、図6に示すように、分類名候補抽出部9は、単語「たっぷり」の取り出されたグループにおける出現頻度を、「4/10」と計算している。出現頻度「4/10」は、10個の商品名に単語「たっぷり」が4個含まれていたことを意味する。
【0065】
また、分類名候補抽出部9は、図6に示す行列の3行目のように、その他のグループに含まれている10個の商品名における、単語行列の1行目に格納された各単語の出現頻度をそれぞれ計算する。
【0066】
例えば、図6に示すように、分類名候補抽出部9は、単語「たっぷり」のその他のグループにおける出現頻度を、「2/10」と計算している。出現頻度「2/10」は、10個の商品名に単語「たっぷり」が2個含まれていたことを意味する。
【0067】
なお、その他のグループは、商品名データベース検索、Web 検索、または他の方法で任意に検索された10個の商品名で構成されるグループである。任意に検索された10個の商品名は、取り出されたグループに属さない商品名である。
【0068】
また、分類名候補抽出部9は、図6に示す行列の4行目のように、取り出されたグループにおける出現頻度からその他のグループにおける出現頻度を引くことによって、単語行列の1行目に格納された各単語の出現頻度の差をそれぞれ計算する。
【0069】
例えば、図6に示すように、分類名候補抽出部9は、単語「たっぷり」の出現頻度の差を、「(4/10-2/10=)2/10」と計算している。
【0070】
なお、取り出されたグループにおける出現頻度からその他のグループにおける出現頻度が引かれた値が負の値になる場合、分類名候補抽出部9は、図6に示すように、出現頻度の差を「0」に設定する。例えば、図6に示す単語「ミルク」の出現頻度の差は、(2/10-5/10)<0であるため、「0」に設定されている。
【0071】
次いで、分類名候補抽出部9は、以下の式で定義されるスコアS2(ai) を、各単語aiに対してそれぞれ計算する。
【0072】
S2(ai) = Σn=1 N(wi×bi n) ・・・式(2)
【0073】
なお、式(2)におけるwiは、単語aiの相対的な重要度を示す重みである。本例における重みwiは、図6に示す単語aiの出現頻度の差である。なお、分類名候補抽出部9は、重みwiをtf-idf法で算出してもよい。
【0074】
図7は、分類名候補抽出部9が抽出する分類名の候補を決定する他の例を示す説明図である。図7に示す単語行列の下の計算された各値が、各単語aiに対してそれぞれ計算されたスコアS2(ai)である。
【0075】
次いで、分類名候補抽出部9は、単語行列の1行目に格納された各単語のうち、算出されたスコアが上位の単語を、抽出する分類名の候補に決定する。図7に示す例では、分類名候補抽出部9は、算出されたスコアが上位3番目までの単語「たっぷり」、「ソーダ」、「ぎっしり」を、抽出される分類名の候補に決定している。
【0076】
すなわち、分類名候補抽出部9は、複数の商品名における単語の重みを単語毎にそれぞれ算出する。また、分類名候補抽出部9は、単語行列作成部7により取得された単語のうち、単語行列作成部7および単語行列補正部8により算出された関連度の複数のアイテム名に渡る和を算出された重みで重み付けた結果が上位M番目までの単語を、分類名の候補に決定する。
【0077】
また、上記の例のように、分類名候補抽出部9は、複数の商品名における単語の出現頻度と、任意に選択された商品名における単語の出現頻度とを用いて、単語の重みを算出してもよい。
【0078】
分類名候補決定部3は、分類名候補抽出部9により抽出された分類名の候補を表示制御部4に入力する。表示制御部4は、入力された分類名の候補を、グループに属する各商品名が表す各商品の分類名の候補としてディスプレイ装置5上に表示する。
【0079】
ディスプレイ装置5は、情報を表示する装置であり、一般的なディスプレイ装置でよい。
【0080】
以下、表示制御部4の動作について説明する。ここでは、グルーピング済アイテム名記憶部2に記憶されている1つのグループに着目して説明する。なお、グルーピング済アイテム名記憶部2に複数のグループが記憶されている場合、表示制御部4は、グループ毎に同様の動作を行えばよい。
【0081】
表示制御部4は、グループに属する個々の商品名をディスプレイ装置5上に表示するとともに、そのグループに属する各商品名が表す各商品の分類名の複数の候補をディスプレイ装置5上に表示する。このとき、表示制御部4は、分類名の複数の候補を、ユーザによる指定可能な態様で(例えば、マウスクリック等で指定可能な態様で)、ディスプレイ装置5上に表示する。表示制御部4がディスプレイ装置5上に表示する画面には、他のGUI(Graphical User Interface)等が含まれていてもよい。
【0082】
図8は、表示制御部4がディスプレイ装置5上に表示する画面の例を示す説明図である。図8に示す例では、表示制御部4がグループに属する商品名である「たっぷりミルクソーダ」、「たっぷりプリン」、「ぎっしりアンパン」等を表示した場合を示している。また、表示制御部4が、各商品名が表す各商品の分類名の候補50として、「たっぷり」、「ソーダ」および「ぎっしり」を表示した場合を示している。これらの候補50は、ユーザによるマウスクリック等の操作によって指定可能である。
【0083】
分類決定部6は、表示された分類名の複数の候補50のうちのいずれかが、マウスクリック等の操作でユーザによって指定された場合、グループに属する各商品名(すなわち、表示されている各商品名)が表す各商品が、ユーザによって指定された分類名で分類されると決定する。そして、分類決定部6は、グループに属する各商品名と、指定された分類名とを対応付けたデータを生成する。
【0084】
例えば、図8に例示する画面において、各候補50のうち分類名「たっぷり」がユーザによって指定されたとする。この場合、分類決定部6は、図8に示す「たっぷりミルクソーダ」、「たっぷりプリン」および「ぎっしりアンパン」が表す各商品が、「たっぷり」という分類名で分類されると決定する。そして、分類決定部6は、「たっぷりミルクソーダ」、「たっぷりプリン」および「ぎっしりアンパン」のそれぞれと、「たっぷり」という分類名とを対応付けたデータを生成する。
【0085】
すなわち、表示制御部4は、複数の商品名を表示するとともに、複数の商品名が表す各商品の、分類名候補決定部3により決定された分類名の複数の候補をユーザによる指定可能な態様で表示する。
【0086】
また、表示制御部4は、分類名の候補と併せて、分類名の候補となる単語を含む商品名を表示してもよい。例えば、図8に示すように、表示制御部4は、ユーザが画面上でカーソルを分類名の候補に合わせたときに、該当の分類名の候補の横に、分類名の候補となる単語を含む商品名を表示してもよい。
【0087】
分類名の候補となる単語を含む商品名は、例えば、Web 検索で得られた商品名である。分類名候補決定部3は、分類名の候補となる単語を含む商品名を表示制御部4に入力する。
【0088】
グループに属する各商品名以外の商品名も参考にすることによって、ユーザは、分類名の複数の候補の中から最終的に使用したい分類名をより決めやすくなる可能性がある。
【0089】
分類名候補決定部3、表示制御部4および分類決定部6は、例えば、アイテム分類支援プログラムに従って動作するコンピュータのCPU(Central Processing Unit )によって実現される。例えば、CPUが、コンピュータのプログラム記憶装置等のプログラム記録媒体からアイテム分類支援プログラムを読み込み、そのアイテム分類支援プログラムに従って、分類名候補決定部3、表示制御部4および分類決定部6として動作すればよい。グルーピング済アイテム名記憶部2は、例えば、コンピュータが備える記憶装置によって実現される。
【0090】
次に、処理経過について説明する。図9は、本発明の実施形態の処理経過の例を示すフローチャートである。なお、既に説明した事項については、詳細な説明を省略する。また、グルーピング済アイテム名記憶部2は、既にグループに分けられた商品の商品名を、予め記憶している。
【0091】
最初に、分類名候補決定部3は、グルーピング済アイテム名記憶部2に記憶されている商品名のグループを1つ取り出す(ステップS1)。
【0092】
次いで、分類名候補決定部3の単語行列作成部7は、形態素解析、商品名データベース検索、およびWeb 検索をそれぞれ行うことによって、取り出されたグループに含まれている商品名を基に単語行列を作成する(ステップS2)。なお、単語行列作成部7は、ステップS2において、商品名データベース検索、またはWeb 検索を実行しなくてもよい。
【0093】
次いで、単語行列補正部8は、単語行列作成部7により作成された単語行列の成分の値を補正する(ステップS3)。なお、ステップS3の処理は、省略されてもよい。
【0094】
次いで、分類名候補抽出部9は、単語行列補正部8により補正された単語行列から分類名の候補を抽出する(ステップS4)。分類名候補決定部3は、分類名候補抽出部9により抽出された分類名の候補を表示制御部4に入力する。
【0095】
次いで、表示制御部4は、グループに属する個々の商品名をディスプレイ装置5上に表示するとともに、そのグループに属する各商品名が表す各商品の分類名の複数の候補50(図8等を参照)をディスプレイ装置5上に表示する(ステップS5)。
【0096】
ステップS5において、表示制御部4は、分類名の複数の候補50を、ユーザによる指定可能な態様で(例えば、マウスクリック等で指定可能な態様で)、ディスプレイ装置5上に表示する。なお、分類名の複数の候補50は、分類名候補決定部3から入力された分類名の候補の集合である。
【0097】
分類名の複数の候補50(図8等を参照)のいずれかがユーザによって指定された場合、分類決定部6は、グループに属する各商品名が表す各商品が、ユーザに指定された分類名で分類されると決定する(ステップS6)。このとき、分類決定部6は、グループに属する各商品名と、指定された分類名とを対応付けたデータを生成する。
【0098】
本実施形態によれば、単語行列作成部7が、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する1つ以上の単語を、アイテム名毎にそれぞれ取得する。また、単語行列作成部7および単語行列補正部8が、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する。また、分類名候補抽出部9が、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位M番目までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定する。
【0099】
従って、本実施形態のアイテム分類支援システム1は、グループに含まれている複数のアイテム名との関連度が高い分類名の候補をユーザに提示できる。よって、アイテム分類支援システム1は、商品毎に人手で分類名を定める一般的な方法に比べて、ユーザの負担を大幅に軽減することができる。また、アイテム分類支援システム1は、特許文献2に記載されている情報処理装置に比べて、多くの種類の分類名の候補をユーザに提示できる。
【0100】
図10は、本発明の実施形態のアイテム分類支援システム1に係るコンピュータの構成例を示す概略ブロック図である。例えば、コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004と、ディスプレイ装置1005とを備える。
【0101】
本発明の実施形態のアイテム分類支援システム1は、コンピュータ1000によって実現される。アイテム分類支援システム1の動作は、プログラム(アイテム分類支援プログラム)の形式で、補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、そのプログラムに従って、上記の実施形態で説明した処理を実行する。この場合、分類名候補決定部3、表示制御部4および分類決定部6は、CPU1001によって実現される。ディスプレイ装置5は、ディスプレイ装置1005によって実現される。
【0102】
補助記憶装置1003は、一時的でない有形の媒体の例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD-ROM(Compact Disk Read Only Memory )、DVD-ROM(Digital Versatile Disk Read Only Memory )、半導体メモリ等が挙げられる。また、プログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000がそのプログラムを主記憶装置1002に展開し、そのプログラムに従って上記の実施形態で説明した処理を実行してもよい。
【0103】
また、各構成要素の一部または全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
【0104】
各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
【0105】
次に、本発明の概要について説明する。図11は、本発明のアイテム分類支援システムの概要を示すブロック図である。本発明のアイテム分類支援システムは、取得手段11と、算出手段12と、決定手段13とを備える。
【0106】
取得手段11(例えば、単語行列作成部7)は、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する1つ以上の単語を、アイテム名毎にそれぞれ取得する。
【0107】
算出手段12(例えば、単語行列作成部7および単語行列補正部8)は、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する。
【0108】
決定手段13(例えば、分類名候補抽出部9)は、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位M番目までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定する。
【0109】
また、算出手段12は、アイテム名を構成する単語のそのアイテム名との関連度を1として算出し、アイテム名を構成しない単語のそのアイテム名との関連度を0として算出してもよい。
【0110】
そのような構成により、分類対象となるアイテムの分類の適切な分類名の候補をユーザに提示できる。
【0111】
また、取得手段11は、複数のアイテム名をいずれも構成せず、かつ複数のアイテム名のいずれかに関連する単語を外部(例えば、商品名データベース)から取得してもよい。
【0112】
また、算出手段12は、予め保持されている辞書に定められている複数の単語間の類似性を基に関連度を算出してもよい。
【0113】
そのような構成により、分類対象となるアイテムのアイテム名から想定されない分類名の候補をユーザに提示できる。
【0114】
また、決定手段13は、複数のアイテム名における単語の重みを単語毎にそれぞれ算出し、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和と算出された重みの積が上位M番目までの単語を、分類名の候補に決定してもよい。
【0115】
また、決定手段13は、複数のアイテム名における単語の出現頻度と、任意に選択されたアイテム名における単語の出現頻度とを用いて、単語の重みを算出してもよい。
【0116】
そのような構成により、分類対象となるアイテムの分類のより適切な分類名の候補をユーザに提示できる。
【0117】
また、アイテム分類支援システム10は、複数のアイテム名を表示するとともに、複数のアイテム名が表す各アイテムの、決定手段13により決定された分類名の複数の候補をユーザによる指定可能な態様で表示する表示制御手段(例えば、表示制御部4)と、分類名の複数の候補のいずれかがユーザに指定された場合、各アイテムがユーザに指定された分類名で分類されると決定する分類決定手段(例えば、分類決定部6)とを備えてもよい。
【0118】
そのような構成により、分類対象となるアイテムの分類の分類名をユーザが容易に定められるようにユーザを支援できる。
【0119】
また、表示制御手段は、分類名の候補と併せて、分類名の候補を含むアイテム名を表示してもよい。
【0120】
そのような構成により、分類対象となるアイテムの分類の分類名をユーザがより容易に定めることができる。
【0121】
以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【産業上の利用の可能性】
【0122】
本発明は、アイテムの分類を支援するアイテム分類支援システムに好適に適用可能である。
【符号の説明】
【0123】
1 アイテム分類支援システム
2 グルーピング済アイテム名記憶部
3 分類名候補決定部
4 表示制御部
5 ディスプレイ装置
6 分類決定部
7 単語行列作成部
8 単語行列補正部
9 分類名候補抽出部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12