(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-04
(45)【発行日】2025-02-13
(54)【発明の名称】情報処理装置、情報処理方法およびプログラム
(51)【国際特許分類】
G06Q 50/18 20120101AFI20250205BHJP
【FI】
G06Q50/18 310
(21)【出願番号】P 2021051708
(22)【出願日】2021-03-25
【審査請求日】2024-01-22
【新規性喪失の例外の表示】特許法第30条第2項適用 掲載年月日:令和3年2月22日、掲載アドレス:https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_uri&item_id=209717&file_id=1&file_no=1 集会名:一般社団法人情報処理学会第132回MPS研究発表会(第123回数理モデル化と問題解決研究発表会)、開催日(発表日):2021年3月1日~2日(3月1日)
(73)【特許権者】
【識別番号】000102728
【氏名又は名称】株式会社NTTデータグループ
(74)【代理人】
【識別番号】100095407
【氏名又は名称】木村 満
(74)【代理人】
【識別番号】100132883
【氏名又は名称】森川 泰司
(74)【代理人】
【識別番号】100166442
【氏名又は名称】鈴木 洋雅
(74)【代理人】
【識別番号】100174067
【氏名又は名称】湯浅 夏樹
(72)【発明者】
【氏名】藤城 真祥
(72)【発明者】
【氏名】小池 大地
(72)【発明者】
【氏名】末永 高志
【審査官】田中 寛人
(56)【参考文献】
【文献】特開2018-113002(JP,A)
【文献】特開2020-064457(JP,A)
【文献】米国特許出願公開第2016/0132979(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
登録商標における商標登録出願時に商標登録出願人により入力された指定商品または指定役務と、登録時の指定商品または指定役務と、の情報を含む商標情報を記憶する記憶手段と、
新たに入力された指定商品または指定役務を示す出願商品名等情報と、前記記憶手段に記憶されている前記商標情報に含まれる登録時の指定商品または指定役務を示す登録商品名等情報と、の概念的な類似度合いを示す概念類似度を
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して算出する概念類似度算出手段と、
前記出願商品名等情報と前記登録商品名等情報との文字列の類似度合いを示す表層類似度を
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して算出する表層類似度算出手段と、
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して前記概念類似度算出手段で算出された前記概念類似度
と前記表層類似度算出手段で算出された前記表層類似度と、に基づいて
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する統合スコアを算出する統合スコア算出手段と、
前記統合スコア算出手段で算出された
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記統合スコアに基づいて前記登録商品名等情報を抽出し、抽出した前記登録商品名等情報を、前記出願商品名等情報と整合性の高い指定商品名等情報として出力する結果抽出手段と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記統合スコア算出手段は、
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して前記概念類似度算出手段で算出された前記概念類似度
と前記表層類似度算出手段で算出された前記表層類似度と、を前記概念類似度と前記表層類似度に応じて重みを変更させ非線形に統合するよう機械学習された統合モデルに入力することで、
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記統合スコアを算出する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記商標情報に含まれる前記登録商品名等情報と、前記登録商品名等情報に対応する出願時の指定商品または指定役務と、に基づいて前記概念類似度算出手段および前記表層類似度算出手段で算出した前記概念類似度と前記表層類似度を正例データとし、多次元正規分布に従い前記概念類似度と前記表層類似度が高くなるにつれて少数となるようユーザが人為的に設定したデータを負例データとし、前記統合モデルを機械学習させる学習手段を、
さらに備えることを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記統合スコア算出手段は、
前記概念類似度算出手段で算出された
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対する前記概念類似度と、前記表層類似度算出手段で算出された
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対する前記表層類似度と、の平均を第1統合スコアとして算出する第1統合スコア算出手段と、
前記概念類似度算出手段で算出された
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対する前記概念類似度と、前記表層類似度算出手段で算出された
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対する前記表層類似度と、を前記概念類似度と前記表層類似度に応じて重みを変更させ非線形に統合するよう機械学習された統合モデルに入力することで、第2統合スコアを算出する第2統合スコア算出手段と、を含み、
前記結果抽出手段は、
前記第1統合スコア算出手段で算出された
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記第1統合スコアに基づいて前記登録商品名等情報を抽出する第1抽出手段と、
前記第2統合スコア算出手段で算出された
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記第2統合スコアに基づいて前記登録商品名等情報を抽出する第2抽出手段と、を含み、
前記第1抽出手段で抽出した前記登録商品名等情報と前記第2抽出手段で抽出した前記登録商品名等情報とを前記出願商品名等情報と整合性の高い指定商品名等情報として、前記登録商品名等情報が重複しないよう出力する、
ことを特徴とする請求項1~3のいずれか1項に記載の情報処理装置。
【請求項5】
情報処理装置における情報処理方法であって、
登録商標における商標登録出願時に商標登録出願人により入力された指定商品または指定役務と、登録時の指定商品または指定役務と、の情報を含む商標情報を記憶する記憶ステップと、
新たに入力された指定商品または指定役務を示す出願商品名等情報と、前記記憶ステップで記憶した前記商標情報に含まれる登録時の指定商品または指定役務を示す登録商品名等情報と、の概念的な類似度合いを示す概念類似度を
、前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対して算出する概念類似度算出ステップと、
前記出願商品名等情報と前記登録商品名等情報との文字列の類似度合いを示す表層類似度を
、前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対して算出する表層類似度算出ステップと、
前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対して前記概念類似度算出ステップで算出した前記概念類似度
と前記表層類似度算出ステップで算出した前記表層類似度と、に基づいて
、前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対応する統合スコアを算出する統合スコア算出ステップと、
前記統合スコア算出ステップで算出した
、前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対応する前記統合スコアに基づいて前記登録商品名等情報を抽出し、抽出した前記登録商品名等情報を、前記出願商品名等情報と整合性の高い指定商品名等情報として出力する結果抽出ステップと、
を含むことを特徴とする情報処理方法。
【請求項6】
コンピュータを、
登録商標における商標登録出願時に商標登録出願人により入力された指定商品または指定役務と、登録時の指定商品または指定役務と、の情報を含む商標情報を記憶する記憶手段、
新たに入力された指定商品または指定役務を示す出願商品名等情報と、前記記憶手段に記憶されている前記商標情報に含まれる登録時の指定商品または指定役務を示す登録商品名等情報と、の概念的な類似度合いを示す概念類似度を
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して算出する概念類似度算出手段、
前記出願商品名等情報と前記登録商品名等情報との文字列の類似度合いを示す表層類似度を
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して算出する表層類似度算出手段、
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して前記概念類似度算出手段で算出された前記概念類似度
と前記表層類似度算出手段で算出された前記表層類似度と、に基づいて
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する統合スコアを算出する統合スコア算出手段、
前記統合スコア算出手段で算出された
、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記統合スコアに基づいて前記登録商品名等情報を抽出し、抽出した前記登録商品名等情報を、前記出願商品名等情報と整合性の高い指定商品名等情報として出力する結果抽出手段、
として機能させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法およびプログラムに関する。
【背景技術】
【0002】
商標登録出願における審査等を行う場合、指定商品または指定役務、ならびに商品および役務の区分を特定する必要がある。しかしながら、指定商品または指定役務の名称(指定商品名等)は出願人により入力されるため、その特定が容易ではない。
【0003】
そこで、指定商品名等を容易に特定する技術として、例えば、特許文献1には、出願人により入力された指定商品名等の特徴量を用いて指定商品名等を特定する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の技術では、出願人により入力された指定商品名等と概念が類似している指定商品名等を含めて高精度に指定商品名等を特定するという点では未だ十分ではない。したがって、指定商品名等を容易かつ高精度に特定するといった点で改善の余地があった。
【0006】
本発明は、上述のような事情に鑑みてなされたものであり、指定商品名等を容易かつ高精度に特定することが可能な情報処理装置、情報処理方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するため、本発明の第1の観点に係る情報処理装置は、
登録商標における商標登録出願時に商標登録出願人により入力された指定商品または指定役務と、登録時の指定商品または指定役務と、の情報を含む商標情報を記憶する記憶手段と、
新たに入力された指定商品または指定役務を示す出願商品名等情報と、前記記憶手段に記憶されている前記商標情報に含まれる登録時の指定商品または指定役務を示す登録商品名等情報と、の概念的な類似度合いを示す概念類似度を、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して算出する概念類似度算出手段と、
前記出願商品名等情報と前記登録商品名等情報との文字列の類似度合いを示す表層類似度を、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して算出する表層類似度算出手段と、
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して前記概念類似度算出手段で算出された前記概念類似度と前記表層類似度算出手段で算出された前記表層類似度と、に基づいて、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する統合スコアを算出する統合スコア算出手段と、
前記統合スコア算出手段で算出された、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記統合スコアに基づいて前記登録商品名等情報を抽出し、抽出した前記登録商品名等情報を、前記出願商品名等情報と整合性の高い指定商品名等情報として出力する結果抽出手段と、
を備えることを特徴とする。
【0008】
前記統合スコア算出手段は、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して前記概念類似度算出手段で算出された前記概念類似度と前記表層類似度算出手段で算出された前記表層類似度と、を前記概念類似度と前記表層類似度に応じて重みを変更させ非線形に統合するよう機械学習された統合モデルに入力することで、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記統合スコアを算出する、
ようにしてもよい。
【0009】
前記商標情報に含まれる前記登録商品名等情報と、前記登録商品名等情報に対応する出願時の指定商品または指定役務と、に基づいて前記概念類似度算出手段および前記表層類似度算出手段で算出した前記概念類似度と前記表層類似度を正例データとし、多次元正規分布に従い前記概念類似度と前記表層類似度が高くなるにつれて少数となるようユーザが人為的に設定したデータを負例データとし、前記統合モデルを機械学習させる学習手段を、
さらに備えるようにしてもよい。
【0010】
前記統合スコア算出手段は、
前記概念類似度算出手段で算出された前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対する前記概念類似度と、前記表層類似度算出手段で算出された前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対する前記表層類似度と、の平均を第1統合スコアとして算出する第1統合スコア算出手段と、
前記概念類似度算出手段で算出された前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対する前記概念類似度と、前記表層類似度算出手段で算出された前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対する前記表層類似度と、を前記概念類似度と前記表層類似度に応じて重みを変更させ非線形に統合するよう機械学習された統合モデルに入力することで、第2統合スコアを算出する第2統合スコア算出手段と、を含み、
前記結果抽出手段は、
前記第1統合スコア算出手段で算出された、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記第1統合スコアに基づいて前記登録商品名等情報を抽出する第1抽出手段と、
前記第2統合スコア算出手段で算出された、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記第2統合スコアに基づいて前記登録商品名等情報を抽出する第2抽出手段と、を含み、
前記第1抽出手段で抽出した前記登録商品名等情報と前記第2抽出手段で抽出した前記登録商品名等情報とを前記出願商品名等情報と整合性の高い指定商品名等情報として、前記登録商品名等情報が重複しないよう出力する、
ことを特徴とするようにしてもよい。
【0011】
上記目的を達成するため、本発明の第2の観点に係る情報処理方法は、
情報処理装置における情報処理方法であって、
登録商標における商標登録出願時に商標登録出願人により入力された指定商品または指定役務と、登録時の指定商品または指定役務と、の情報を含む商標情報を記憶する記憶ステップと、
新たに入力された指定商品または指定役務を示す出願商品名等情報と、前記記憶ステップで記憶した前記商標情報に含まれる登録時の指定商品または指定役務を示す登録商品名等情報と、の概念的な類似度合いを示す概念類似度を、前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対して算出する概念類似度算出ステップと、
前記出願商品名等情報と前記登録商品名等情報との文字列の類似度合いを示す表層類似度を、前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対して算出する表層類似度算出ステップと、
前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対して前記概念類似度算出ステップで算出した前記概念類似度と前記表層類似度算出ステップで算出した前記表層類似度と、に基づいて、前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対応する統合スコアを算出する統合スコア算出ステップと、
前記統合スコア算出ステップで算出した、前記記憶ステップで記憶した前記登録商品名等情報のそれぞれに対応する前記統合スコアに基づいて前記登録商品名等情報を抽出し、抽出した前記登録商品名等情報を、前記出願商品名等情報と整合性の高い指定商品名等情報として出力する結果抽出ステップと、
を含むことを特徴とする。
【0012】
上記目的を達成するため、本発明の第3の観点に係るプログラムは、
コンピュータを、
登録商標における商標登録出願時に商標登録出願人により入力された指定商品または指定役務と、登録時の指定商品または指定役務と、の情報を含む商標情報を記憶する記憶手段、
新たに入力された指定商品または指定役務を示す出願商品名等情報と、前記記憶手段に記憶されている前記商標情報に含まれる登録時の指定商品または指定役務を示す登録商品名等情報と、の概念的な類似度合いを示す概念類似度を、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して算出する概念類似度算出手段、
前記出願商品名等情報と前記登録商品名等情報との文字列の類似度合いを示す表層類似度を、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して算出する表層類似度算出手段、
前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対して前記概念類似度算出手段で算出された前記概念類似度と前記表層類似度算出手段で算出された前記表層類似度と、に基づいて、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する統合スコアを算出する統合スコア算出手段、
前記統合スコア算出手段で算出された、前記記憶手段に記憶されている前記登録商品名等情報のそれぞれに対応する前記統合スコアに基づいて前記登録商品名等情報を抽出し、抽出した前記登録商品名等情報を、前記出願商品名等情報と整合性の高い指定商品名等情報として出力する結果抽出手段、
として機能させることを特徴とする。
【発明の効果】
【0013】
本発明によれば、指定商品名等を容易かつ高精度に特定することができる。
【図面の簡単な説明】
【0014】
【
図1】本発明の実施の形態1に係る情報処理装置の一例を示すブロック図である。
【
図2】本発明の実施の形態1における商品名等特定処理の一例を示すフローチャートである。
【
図3】本発明の実施の形態1における商品名等特定処理の概念図である。
【
図4】本発明の実施の形態1における商品名等特定処理が実行された場合における実際に登録された登録商品名等の特定順位を示す図である。
【
図5】本発明の実施の形態1における商品名等特定処理が実行された場合における実際に登録された登録商品名等の特定順位を示す図である。
【
図6】本発明の実施の形態2に係る情報処理装置の一例を示すブロック図である。
【
図7】本発明の実施の形態2における学習処理の一例を示すフローチャートである。
【
図8】本発明の実施の形態2における正例データの分布例を示す図である。
【
図9】本発明の実施の形態2における負例データの分布例を示す図である。
【
図10】本発明の実施の形態2における学習処理の概念図である。
【
図11】本発明の実施の形態2における商品名等特定処理の一例を示すフローチャートである。
【
図12】本発明の実施の形態2における商品名等特定処理の概念図である。
【
図13】本発明の実施の形態2における商品名等特定処理が実行された場合における指定商品名等の表示例を示す図である。
【
図14】変形例における商品名等特定処理が実行された場合における指定商品名等の表示例を説明するための説明図である。
【
図15】変形例における商品名等特定処理が実行された場合における正解の商品名等の表示順位と表示割合とを示す図である。
【発明を実施するための形態】
【0015】
(実施の形態1)
以下、本発明を実施するための形態に係る情報処理装置、情報処理方法およびプログラムについて、図面を参照して詳細に説明する。なお、図中同一または相当する部分には同一符号を付す。
【0016】
まず、実施の形態1に係る情報処理装置100の構成について、
図1を参照して説明する。実施の形態1に係る情報処理装置100は、
図1に示すように、インターネット等のネットワーク210に接続された情報端末である。情報処理装置100は、当該ネットワーク210を介して他の情報端末と各種データを送受信する。
【0017】
具体的に、情報処理装置100は、商標登録出願の審査(商標の審査)を行うために設けられた携帯電話やスマートフォン、タブレットやPC(Personal Computer)等の情報端末であり、P2P(Peer to Peer)等の分散型のネットワーク210を構築している。なお、情報処理装置100は、P2P型のシステムに限られず、例えばクラウドコンピューティング型であってもよい。なお、当該情報処理装置100は、商標の審査を行うための情報端末であるため特許庁内に設けられるが、この他にも、例えば、商標登録出願時における調査を行うために用いられてもよく、この場合には、特許庁以外の場所に設けられてよい。
【0018】
商標の審査は、特許庁が公開している「商標審査の進め方」(https://www.jpo.go.jp/system/laws/rule/guideline/trademark/document/index/sinsa_susumekata.pdf)のp.5における「2-2 指定商品・指定役務に関する調査・検討」に「指定商品・指定役務の表示が具体的かつ明確かどうかについては、商標法施行規則第6条に基づく別表(省令別表)、類似商品・役務審査基準、ニース協定に基づく国際分類のアルファベット順一覧表等に基づき、過去に採択された例との整合性を考慮した上で検討を行う。」と記載されているように、商標登録出願人により入力された指定商品名等(以下、出願商品名等)と、過去に採択された例との整合性が考慮される。そのため、実施の形態1に係る情報処理装置100は、商標登録出願人により入力された指定商品名等(以下、出願商品名等)に基づいて、過去に採択された例との整合性の高い指定商品名等を特定して表示することで、容易かつ高精度に指定商品名等を特定可能にする。
【0019】
情報処理装置100は、
図1に示すように、記憶部110と、制御部120と、入出力部130と、通信部140と、これらを相互に接続するシステムバス(図示省略)と、を備えている。
【0020】
記憶部110は、ROM(Read Only Memory)やRAM(Random Access Memory)等を備える。ROMは制御部120のCPU(Central Processing Unit)が実行するプログラム111、およびプログラムを実行する上で予め必要なデータ(図示省略)を記憶する。なお、図示は省略しているが、記憶部110には、商標登録出願時に商標登録出願人により入力された指定商品名等(出願商品名等)と、当該商標登録出願が登録された際の指定商品名等(登録商品名等)とを示す商標情報が記憶される。当該商標情報は、特許庁のデータベースから取得して記憶されればよい。なお、例えば、当該情報処理装置100を商標登録出願時における調査を行うために用いる場合には、当該商標情報を特許庁のデータベースからネットワーク210を介して取得すればよい。また、実施の形態1における当該商標情報には、2020年時点で登録されている約25000件の出願商品名等と登録商品名等の組が含まれる。
【0021】
プログラム111は、後述する商品名等特定処理を実行するためのプログラムである。具体的に、プログラム111は、後述する概念類似度算出部121、表層類似度算出部122、統合スコア算出部123、および結果抽出部124としての機能を実現させるためのプログラムであり、予め記憶部110に記憶されている。
【0022】
制御部120は、CPUやASIC(Application Specific Integrated Circuit)等から構成される。制御部120は、記憶部110に記憶されたプログラム111に従って動作し、当該プログラムに従った処理を実行する。制御部120は、記憶部110に記憶されたプログラム111により提供される主要な機能部として、概念類似度算出部121と、表層類似度算出部122と、統合スコア算出部123と、結果抽出部124と、を備える。
【0023】
概念類似度算出部121は、出願商品名等と登録商品名等との概念的な類似度合いを示す概念類似度を算出する機能部である。具体的に、概念類似度算出部121は、出願商品名等の特徴ベクトルと登録商品名等の特徴ベクトルのコサイン類似度を、全ての登録商標の登録商品名等(全登録商品名等)について求めることで、出願商品名等と全登録商品名等との概念類似度を算出する。なお、概念類似度は、コサイン類似度の他、ダイス係数、ジャッカード係数、内積等により算出してもよい。
【0024】
表層類似度算出部122は、出願商品名等と登録商品名等との表層的な一致度、すなわち出願商品名等と登録商品名等との文字列の類似度合いを示す表層類似度を算出する機能部である。具体的に、表層類似度算出部122は、出願商品名等と登録商品名等のレーベンシュタイン距離やジャロ・ウィンクラー距離等の編集距離を、全登録商品名等について求めることで、出願商品名等と全登録商品名等との表層類似度を算出する。
【0025】
統合スコア算出部123は、概念類似度算出部121により算出した概念類似度と、表層類似度算出部122により算出した表層類似度と、を統合した統合スコアを算出する機能部である。具体的に、統合スコア算出部123は、概念類似度と表層類似度の平均を統合スコアとして算出する。なお、平均については、相加平均に限られず、例えば、相乗平均や重み付け平均などであってもよい。
【0026】
結果抽出部124は、統合スコア算出部123により算出した統合スコアの高い登録商品名等を、出願商品名等と整合性の高い指定商品名等として抽出し、入出力部130へ表示する機能部である。具体的に、結果抽出部124は、統合スコアの最も高い登録商品名等から順に10個抽出し、順位付けをして、出願商品名等とともに入出力部130へ表示する。そのため、結果抽出部124は、出願商品名等と整合性の高い指定商品名等の候補を出力する機能部であるといえる。
【0027】
入出力部130は、キーボード、マウス、カメラ、マイク、液晶ディスプレイ、有機EL(Electoro-Luminescence)ディスプレイ等から構成され、各種データの入出力を行うための装置である。
【0028】
通信部140は、情報処理装置100がネットワーク210を介して他の情報端末と通信を行うためのデバイスである。
【0029】
これら各機能部が協働することで、過去に採択され、出願商品名等との整合性の高い指定商品名等を特定して表示する機能を、当該情報処理装置100に実現させる。
【0030】
以上が、情報処理装置100の構成である。続いて情報処理装置100の動作等について、
図2~4を参照して説明する。
図2は、商品名等特定処理の一例を示すフローチャートである。商品名等特定処理は、過去に採択され、出願商品名等との整合性の高い指定商品名等を特定して表示する処理である。当該商品名等特定処理は、ユーザによる入出力部130に対する操作が行われることで実行を開始する。なお、
図3は、当該商品名等特定処理の概念図である。
【0031】
商品名等特定処理を開始すると、情報処理装置100は、概念類似度算出部121の機能により、
図2および
図3に示すように、出願商品名等と登録商品名等との概念類似度を、全登録商品名等について算出する(ステップS101)。ステップS101の処理では、上述したように、出願商品名等と登録商品名等とのコサイン類似度を、全登録商品名等について求めることで、出願商品名等と全登録商品名等の概念類似度を算出する。
【0032】
ステップS101の処理を実行した後、情報処理装置100は、表層類似度算出部122の機能により、
図2および
図3に示すように、出願商品名等と登録商品名等との表層類似度を、全登録商品名等について算出する(ステップS102)。ステップS102の処理では、上述したように、出願商品名等と登録商品名等との編集距離を、全登録商品名等について求めることで、出願商品名等と全登録商品名等との表層類似度を算出する。
【0033】
続いて情報処理装置100は、統合スコア算出部123の機能により、
図2および
図3に示すように、ステップS101の処理で算出した概念類似度と、ステップS102の処理で算出した表層類似度と、に基づいて、これらを統合した統合スコアを算出する(ステップS103)。ステップS103の処理では、上述したように、概念類似度と表層類似度の平均を統合スコアとして算出する。
【0034】
ステップS103の処理を実行した後、情報処理装置100は、結果抽出部124の機能により、
図2および
図3に示すように、ステップS103の処理で算出した統合スコアの高い順に、登録商品名等を抽出し、抽出した登録商品名等を、出願商品名等と整合性の高い指定商品名等の候補として表示し(ステップS104)、当該商品名等特定処理を終了する。ステップS104の処理では、上述したように、統合スコアの最も高い登録商品名等から順に10個抽出して順位付けをし、出願商品名等とともに指定商品名等の候補として入出力部130へ表示する。なお、入出力部130へ表示する指定商品名等の候補については、1位~10位までの10個に限られず、10個未満や10個以上であってもよく、ユーザの設定により変更可能であってよい。なお、順位付けを行わず、上位10個を順不同に表示するようにしてもよい。
【0035】
次に、商標登録出願時において商標登録出願人により、出願商品名等として、「その他のおもちゃ類」と入力された場合と「加工食品」と入力された場合を例に、
図4を参照して説明する。
図4は、実施の形態1における商品名等特定処理が実行された場合における実際に登録された登録商品名等(正解の商品名等)の特定順位を示す図である。なお、図示する例では、理解を容易にするため、当該商品名等特定処理において、概念類似度のみを用いて指定商品名等を特定する場合、すなわち
図2のステップS104の処理において概念類似度の高い登録商品名等を抽出する場合と、表層類似度のみを用いて指定商品名等を特定する場合、すなわち
図2のステップS104の処理において表層類似度の高い登録商品名等を抽出する場合における指定商品名等の特定順位を合わせて示している。
【0036】
具体的に、
図4は、当該出願商品名等について、概念類似度のみを用いて指定商品名等を特定する場合と、表層類似度のみを用いて特定する場合と、実施の形態1における商品名等特定処理により統合スコアを用いて指定商品名等を特定する場合と、のそれぞれについて、実際に登録された登録商品名等(正解の商品名等)が、表示順位の何位になるか(全25000件中の順位)を示している。
【0037】
図4に示すように、出願商品名等として「その他のおもちゃ類」と入力された場合、概念類似度のみを用いて指定商品名等を特定する場合、すなわち、概念類似度の高い順に登録商品名等を抽出する場合、正解の商品名等である「おもちゃ」の概念類似度は12位となり、1位~10位までの10個を抽出する場合には抽出されないこととなる。また、表層類似度のみを用いて指定商品名等を特定する場合、すなわち、表層類似度の高い順に登録商品名等を抽出する場合、正解の商品名等である「おもちゃ」の表層類似度は32位となり、1位~10位までの10個を抽出する場合には抽出されないこととなる。これに対し、実施の形態1における商品名等特定処理により統合スコアを用いて指定商品名等を特定する場合、正解の商品名等である「おもちゃ」の統合スコアは1位となり、商品名等特定処理において抽出され表示されることとなる。
【0038】
同様に、出願商品名等として「加工食品」と入力された場合、概念類似度のみを用いて指定商品名等を特定する場合、正解の商品名等である「穀物の加工食品」の概念類似度は15位となり、商品名等特定処理において1位~10位までの10個を抽出する場合には抽出されないこととなる。また、表層類似度のみを用いて指定商品名等を特定する場合、正解の商品名等である「穀物の加工食品」の表層類似度は18位となり、商品名等特定処理において1位~10位までの10個を抽出する場合には抽出されないこととなる。これに対し、実施の形態1における商品名等特定処理により統合スコアを用いて指定商品名等を特定する場合、正解の商品名等である「穀物の加工食品」の統合スコアは5位となり、商品名等特定処理において抽出され表示されることとなる。
【0039】
このように、実施の形態1に係る情報処理装置100によれば、概念類似度と表層類似度とを統合した統合スコアに基づいて指定商品名等を特定することから、概念類似度のみを用いて指定商品名等を特定する場合や、表層類似度のみを用いて指定商品名等を特定する場合と比較して、正解の商品名等を上位に抽出できる。また、実施の形態1に係る情報処理装置100によれば、出願商品名等に基づいて、過去に採択された例との整合性を、統合スコアにより判定するため、指定商品名等を容易に特定できる。したがって、実施の形態1に係る情報処理装置100によれば、概念類似度と表層類似度といった2つの観点を考慮して、容易かつ高精度に指定商品名等を特定することができる。
【0040】
(実施の形態2)
上記実施の形態1に係る情報処理装置100は、
図2のステップS103の処理において概念類似度と表層類似度の平均を統合スコアとして算出し、ステップS104の処理により統合スコアの最も高い登録商品名等から順に10個抽出して順位付けをし、出願商品名等とともに指定商品名等の候補として入出力部130へ表示する。しかしながら、上記実施の形態1に係る情報処理装置100では、概念類似度と表層類似度のうちの一方が極端に高い場合、
図5に示すように、統合スコアに基づいて指定商品名等を特定すると、正解の商品名等が抽出されないといった事象が生じることがある。
図5は、実施の形態1における商品名等特定処理が実行された場合における実際に登録された登録商品名等(正解の商品名等)の特定順位を示す図であり、理解を容易にするため、
図4と同様、出願商品名等について、概念類似度のみを用いて指定商品名等を特定する場合と、表層類似度のみを用いて特定する場合と、実施の形態1における商品名等特定処理により統合スコアを用いて指定商品名等を特定する場合と、のそれぞれについて、実際に登録された登録商品名等(正解の商品名等)が、表示順位の何位になるか(全25000件中の順位)を示している。
【0041】
図5に示すように、出願商品名等として「チラシ」と入力された場合、概念類似度のみを用いて指定商品名等を特定する場合、すなわち、概念類似度の高い順に登録商品名等を抽出する場合、正解の商品名等である「広告・販売促進用印刷物」の概念類似度は3位となり、1位~10位までの10個を抽出する場合に抽出されることとなる。一方、表層類似度のみを用いて指定商品名等を特定する場合、すなわち、表層類似度の高い順に登録商品名等を抽出する場合、正解の商品名等である「広告・販売促進用印刷物」の表層類似度は9217位となり、1位~10位までの10個を抽出する場合には抽出されないこととなる。また、実施の形態1における商品名等特定処理により統合スコアを用いて指定商品名等を特定する場合、正解の商品名等である「広告・販売促進用印刷物」の統合スコアは47位となり、抽出されないこととなる。
【0042】
同様に、出願商品名等として「穀物の加工品」と入力された場合、概念類似度のみを用いて指定商品名等を特定する場合、正解の商品名等である「うどんの麺」の概念類似度は1位となり、1位~10位までの10個を抽出する場合に抽出されることとなる。一方、表層類似度のみを用いて指定商品名等を特定する場合、正解の商品名等である「うどんの麺」の表層類似度は15981位となり、1位~10位までの10個を抽出する場合には抽出されないこととなる。また、実施の形態1における商品名等特定処理により統合スコアを用いて指定商品名等を特定する場合、正解の商品名等である「うどんの麺」の統合スコアは26位となり、抽出されないこととなる。
【0043】
このように、上記実施の形態1に係る情報処理装置100では、一部の出願商品名等、すなわち、概念類似度と表層類似度のうちの一方が極端に高くなる出願商品名等が入力された場合、概念類似度のみ、または表層類似度のみを用いて指定商品名等を特定した方が高精度であるといった事象が発生することがあり、改善の余地があった。
【0044】
そのため、実施の形態2に係る情報処理装置200は、概念類似度と表層類似度のうちの一方が極端に高くなる出願商品名等が入力された場合であっても、商品名等特定処理において正解の商品名等を高精度に表示可能とする。以下、このような情報処理装置200について、図面を参照して説明する。なお、図中、上記実施の形態1と同一部分には同一符号を付し、説明を省略する。
【0045】
図6は、本発明の実施の形態2に係る情報処理装置200の一例を示すブロック図である。実施の形態2に係る情報処理装置200は、実施の形態1に係る情報処理装置100と同様、インターネット等のネットワーク210に接続された情報端末であり、当該ネットワーク210を介して他の情報端末と各種データを送受信する。情報処理装置200は、実施の形態1に係る情報処理装置100と同様、記憶部110と、制御部120と、入出力部130と、通信部140と、これらを相互に接続するシステムバス(図示省略)と、を備えている。
【0046】
実施の形態2における記憶部110は、プログラム111Aと、統合モデル112と、正例データ113と、負例データ114と、を記憶する。なお、商標情報が記憶される点については、実施の形態1と同様である。
【0047】
プログラム111Aは、後述する学習処理と、実施の形態2における商品名等特定処理を実行するためのプログラムである。具体的に、プログラム111Aは、概念類似度算出部121、表層類似度算出部122、統合スコア算出部123、結果抽出部124、および学習部125としての機能を実現させるためのプログラムであり、予め記憶部110に記憶されている。
【0048】
統合モデル112は、例えばニューラルネットワークであり、入力層、中間層、出力層を有するネットワークモデルである。統合モデル112は、特定のタスクについて、学習データに基づいて生成したパラメータを有し、当該統合モデル112に入力された入力データに応じた出力を行うものである。具体的に、統合モデル112は、概念類似度算出部121により算出された概念類似度と、表層類似度算出部122により算出された表層類似度と、を入力データとし、これらを統合させた統合スコアを出力する機械学習モデルであり、当該概念類似度と表層類似度に応じて統合時の重みを変更させ、これらを非線形に統合するスコアリングロジックとなるよう、後述する学習処理により機械学習されている。
【0049】
すなわち、実施の形態2における統合モデル112により出力される統合スコアは、実施の形態1において算出される統合スコアとは異なり、入力された概念類似度と表層類似度の優先度合いを考慮し、状況に応じた統合スコアを出力するよう、後述する学習処理により機械学習されている。
【0050】
正例データ113は、記憶部に記憶されている商標情報に含まれる25000件の登録商品名等(正解の商品名等)と出願商品名等との概念類似度と表層類似度とを示すデータである。正例データ113は、後述する学習処理が実行され、登録商品名等(正解の商品名等)における出願時の商品名等の概念類似度と表層類似度がそれぞれ算出されることで、記憶部110へ記憶される。なお、正例データ113は、
図8に示すように、概念類似度を横軸、表層類似度を縦軸とした場合に、図示する点線で区画されたA領域~D領域について、B領域>C領域≧A領域>D領域の順に多く分布されるデータである。なお、C領域とA領域の分布数については、状況によっては反対となっていることもある。
【0051】
負例データ114は、予めユーザが人為的に設定した概念類似度と表層類似度の組み合わせのデータであり、
図9に示すように、原点を中心とした多次元正規分布に従うよう設定される。すなわち、負例データ114は、
図9に示すように、図示する点線で区画されたA領域~D領域のうちD領域に多く分布するデータであり、かつ、原点から、概念類似度と表層類似度が高くなるにつれて少数となるよう分布されたデータとなっている。
【0052】
実施の形態2において負例データ114を人為的に設定するのは、例えば、出願商品名等に対応する正解の商品名等以外の事例(概念類似度と表層類似度の組み合わせ)を負例データ114とすると、
図8に示すC領域に正例よりも多数のデータが分布されることとなる。その結果、当該C領域における負例が正例を包含するため、後述する学習処理により統合モデル112を機械学習させた場合に正例を無視してしまい、実態と乖離してしまうおそれがある。そのため、実施の形態2における情報処理装置200では、予め人為的に設定された負例データ114を記憶している。
【0053】
制御部120は、記憶部110に記憶されたプログラム111Aにより提供される主要な機能部として、概念類似度算出部121と、表層類似度算出部122と、統合スコア算出部123Aと、結果抽出部124と、学習部125と、を備える。
【0054】
概念類似度算出部121、表層類似度算出部122、および結果抽出部124は、上記実施の形態1と同様である。統合スコア算出部123Aは、概念類似度算出部121により算出した概念類似度と、表層類似度算出部122により算出した表層類似度と、を統合した統合スコアを算出する機能部である点では、上記実施の形態1における統合スコア算出部123と同様であるが、実施の形態2における統合スコア算出部123Aは、算出した概念類似度と表層類似度とを統合モデル112に入力し、統合スコアを算出する。
【0055】
学習部125は、正例データ113と負例データ114とに基づいて統合モデル112を機械学習させる機能部である。具体的に、学習部125は、概念類似度と表層類似度に応じて統合時の重みを変更させ、これらを非線形に統合するスコアリングロジックとなるよう、すなわち、概念類似度と表層類似度のうちの一方が極端に高くなる出願商品名等が入力された場合であっても高い統合スコアが算出されるよう、正例データ113と負例データ114とに基づいて統合モデル112を機械学習させる。
【0056】
以上が、情報処理装置200の構成である。続いて情報処理装置200の動作等について、
図7~
図13を参照して説明する。
図7は、学習処理の一例を示すフローチャートである。学習処理は、正例データ113と負例データ114とに基づいて統合モデル112を機械学習させる処理である。当該学習処理は、ユーザによる入出力部130に対する操作が行われることで実行を開始する。なお、
図10は、当該学習処理の概念図である。
【0057】
学習処理を開始すると、情報処理装置200は、概念類似度算出部121の機能により、
図7および
図10に示すように、出願商品名等と登録商品名等との概念類似度を算出する(ステップS201)。具体的に、ステップS201の処理では、記憶部に記憶されている商標情報に含まれる25000件の登録商品名等(正解の商品名等)それぞれについて、出願時の商品名等との概念類似度を算出する。
【0058】
ステップS201の処理を実行した後、情報処理装置200は、表層類似度算出部122の機能により、
図7および
図10に示すように、出願商品名等と登録商品名等との表層類似度を算出する(ステップS202)。具体的に、ステップS202の処理では、記憶部に記憶されている商標情報に含まれる25000件の登録商品名等(正解の商品名等)それぞれについて、出願時の商品名等との表層類似度を算出する。
【0059】
続いて情報処理装置200は、ステップS201およびステップS202の処理で算出した概念類似度と表層類似度とを正例データ113として記憶部110に記憶する(ステップS203)。
【0060】
ステップS203の処理を実行した後、情報処理装置200は、学習部125の機能により、
図7および
図10に示すように、ステップS203の処理で記憶した正例データ113と、予め記憶部110に記憶された負例データ114と、に基づいて、統合モデル112に機械学習させ(ステップS204)、学習処理を終了する。当該学習処理が行われることにより、概念類似度と表層類似度に応じて統合時の重みを変更させ、これらを非線形に統合するスコアリングロジックとなるよう、すなわち、概念類似度と表層類似度のうちの一方が極端に高くなる出願商品名等が入力された場合であっても高い統合スコアが算出されるよう、統合モデル112が機械学習することとなる。
【0061】
続いて実施の形態2に係る情報処理装置200における商品名等特定処理について説明する。
図11は、実施の形態2における商品名等特定処理の一例を示すフローチャートである。当該商品名等特定処理は、上記実施の形態1における商品等特定処理と同様、ユーザによる入出力部130に対する操作が行われることで実行を開始する。なお、
図12は、当該商品名等特定処理の概念図である。
【0062】
商品名等特定処理を開始すると、情報処理装置200は、概念類似度算出部121の機能により、
図11および
図12に示すように、出願商品名等と登録商品名等との概念類似度を、全登録商品名等について算出する(ステップS301)。ステップS301の処理では、上記実施の形態1と同様に、出願商品名等と登録商品名等とのコサイン類似度を、全登録商品名等について求めることで、出願商品名等と全登録商品名等の概念類似度を算出する。
【0063】
ステップS301の処理を実行した後、情報処理装置200は、表層類似度算出部122の機能により、
図11および
図12に示すように、出願商品名等と登録商品名等との表層類似度を、全登録商品名等について算出する(ステップS302)。ステップS302の処理では、上記実施の形態1と同様に、出願商品名等と登録商品名等との編集距離を、全登録商品名等について求めることで、出願商品名等と全登録商品名等との表層類似度を算出する。
【0064】
続いて情報処理装置200は、統合スコア算出部123Aの機能により、
図11および
図12に示すように、ステップS301の処理で算出したコサイン類似度と、ステップS302の処理で算出した表層類似度と、に基づいて、これらを統合した統合スコアを算出する(ステップS303)。具体的に、ステップS303の処理では、ステップS301およびステップS302の処理で算出した概念類似度と表層類似度とを統合モデル112に入力することで統合スコアを算出する。
【0065】
ステップS303の処理を実行した後、情報処理装置200は、結果抽出部124の機能により、
図11および
図12に示すように、ステップS303の処理で算出した統合スコアの高い順に、登録商品名等を抽出し、抽出した登録商品名等を、出願商品名等と整合性の高い指定商品名等の候補として表示し(ステップS304)、当該商品名等特定処理を終了する。ステップS304の処理では、上記実施の形態1と同様に、統合スコアの最も高い登録商品名等から順に10個抽出して順位付けをし、出願商品名等とともに指定商品名等の候補として入出力部130へ表示する。なお、入出力部130へ表示する指定商品名等の候補については、1位~10位までの10個に限られず、10個未満や10個以上であってもよく、ユーザの設定により変更可能であってよい。なお、順位付けを行わず、上位10個を順不同に表示するようにしてもよい。
【0066】
次に、商標登録出願時において商標登録出願人により、出願商品名等として、「チラシ」と入力された場合と「穀物の加工品」と入力された場合に、実施の形態2における商品名等特定処理を実行した結果について、
図13を参照して説明する。
図13は、商品名等特定処理が実行された場合における指定商品名等の表示例を示す図である。なお、図示する例では、理解と容易にするため、正解の商品名等である「広告・販売促進用印刷物」および「うどんの麺」を合わせて表示しているが、実際は表示されないものである。
【0067】
図示するように、出願商品名等として「チラシ」と入力された場合、実施の形態2における商品名等特定処理を実行すると、1位に「ブラシ」、2位に「ポスター」、3位に「パンフレット」が表示され、4位に正解の商品名等である「広告・販売促進用印刷物」が表示される。したがって、実施の形態2における商品名等特定処理によれば、上記実施の形態1における商品等特定処理では47位となり表示されなかった正解の商品名等である「広告・販売促進用印刷物」を上位に表示することができる。
【0068】
また、出願商品名等として「穀物の加工品」と入力された場合、実施の形態2における商品名等特定処理を実行すると、1位に「穀物の加工品」、2位に「そばの加工品」、3位に「穀物の加工品を取材とする総菜」が表示され、4位に正解の商品名等である「うどんの麺」が表示される。したがって、実施の形態2における商品名等特定処理によれば、上記実施の形態1における商品等特定処理では26位となり表示されなかった正解の商品名等である「うどんの麺」を上位に表示することができる。
【0069】
このように、実施の形態2に係る情報処理装置200によれば、一部の出願商品名等、すなわち、概念類似度と表層類似度のうちの一方が極端に高くなる出願商品名等が入力された場合であっても、概念類似度と表層類似度に応じて統合時の重みを変更させるよう学習させた統合モデル112により統合スコアを算出するため、高精度に指定商品名等を特定することができる。また、原点を中心とした多次元正規分布に従うよう予めユーザが人為的に設定した負例データ114を用いて当該統合モデル112を機械学習させるため、正例を無視して実態と乖離してしまうことを防止し、高精度に指定商品名等を特定することができる。
【0070】
(変形例)
なお、この発明は、上記実施の形態1および実施の形態2に限定されず、様々な変形及び応用が可能である。例えば、上記実施の形態1に係る情報処理装置100や上記実施の形態2に係る情報処理装置200では、上記で示した全ての技術的特徴を備えるものでなくてもよく、従来技術における少なくとも1つの課題を解決できるように、上記実施の形態1および上記実施の形態2で説明した一部の構成を備えたものであってもよい。また、下記の変形例それぞれについて、少なくとも一部を組み合わせてもよい。
【0071】
上記実施の形態1に係る情報処理装置100では、商品名等特定処理において概念類似度と表層類似度の平均を統合スコアとして算出し、上記実施の形態2に係る情報処理装置200では、商品名等特定処理において概念類似度と表層類似度を統合モデル112に入力して統合スコアを算出し、それぞれ統合スコアの高い順に、1位~10位までの10個の登録商品名等を表示する例を示したが、これは一例である。
【0072】
例えば、上記実施の形態1に係る情報処理装置100と上記実施の形態200に係る情報処理装置200とを組み合わせてもよい。具体的に、概念類似度と表層類似度の平均を統合スコアとして算出し(平均統合スコア)、当該平均統合スコアの高い順に1位~10位までの10個の登録商品名等を抽出し、かつ、概念類似度と表層類似度を統合モデル112に入力して統合スコアを算出し(統合モデル統合スコア)、当該統合モデル統合スコアの高い順に1位~10位までの10個の登録商品名等を抽出した上で、共通する登録商品名等を除外して登録商品名等を表示してもよい。この場合、商品名等特定処理において、平均統合スコアを算出し、平均統合スコアの高い順に1位~10位までの10個の登録商品名等を抽出して表示した後に、統合モデル統合スコアを算出して統合モデル統合スコアの高い順に1位~10位までの10個の登録商品名等を抽出し、平均統合スコアに基づいて抽出された登録商品名等と共通する登録商品名等があれば、当該共通する登録商品名等を除き、表示すればよい。すなわち、平均統合スコアに基づいて抽出した登録商品名等と、統合モデル統合スコアに基づいて抽出した登録商品名等と、が重複して表示されないようにすればよい。
【0073】
図14は、この変形例における商品名等特定処理が実行された場合における指定商品名等の表示例を説明するための説明図である。図示するように、出願商品名等として「チラシ」と入力された場合、平均統合スコアに基づくと、1位に「ブラシ」、2位に「歯ブラシ」、3位に「靴ブラシ」、4位に「金ブラシ」が抽出され表示される。そして、統合モデル統合スコアに基づくと、1位「ブラシ」、2位「ポスター」、3位「パンフレット」、4位「広告・販売促進用印刷物」として当該登録商品名等が抽出されるが、「ブラシ」については平均統合スコアに基づくものと共通するため、除外され、2位以降が表示されることとなる。なお、図示は省略しているが、5位以降にも平均統合スコアに基づくものと共通する登録商品名等がある場合には、除外される。
【0074】
なお、商品名等特定処理において、まず平均統合スコアを算出し、平均統合スコアの高い順に1位~10位までの10個の登録商品名等を抽出して表示した後に、統合モデル統合スコアを算出する例を示したが、まず統合モデル統合スコアを算出し、その後平均統合スコアを算出するようにしてもよい。また、平均統合スコアを算出と統合モデル統合スコアの算出の両方を実行するか否かをユーザにより選択可能としてもよい。
【0075】
このように、平均統合スコアと統合モデル統合スコアの両方を用いて登録商品名等を表示することで、より高精度に指定商品名等を特定することができる。
図15は、この変形例における商品名等特定処理が実行された場合における正解の商品名等の表示順位と表示割合とを示す図である。具体的に、図示する例では、平均統合スコアと統合モデル統合スコアの両方を用いた場合における表示順位と表示割合をA、統合モデル統合スコアのみ用いた場合をB、平均統合スコアのみ用いた場合をCとして示している。図示するように、平均統合スコアと統合モデル統合スコアの両方を用いて登録商品名等を表示する場合、正解の商品名等が10位以内に表示される割合が87%となっている。したがって、統合モデル統合スコアのみ用いた場合や平均統合スコアのみ用いた場合よりも高精度に指定商品名等を特定することができる。
【0076】
また、上記実施の形態1および上記実施の形態2における商品名等登録処理では、商品および役務の区分に関わらず、記憶部110に記憶されている商標情報に含まれる25000件の登録商品名等(正解の商品名等)と出願商品名等との概念類似度と表層類似度とを算出する例を示したが、これは一例である。上記実施の形態1および上記実施の形態2における商品名等登録処理では、例えば、少なくとも出願時または登録時の商品および役務の区分を選択可能とし、選択された商品および役務の区分に属する登録商品名等(正解の商品名等)についてのみ、出願商品名等との概念類似度と表層類似度とを算出してもよい。これによれば、商標情報に含まれる全ての登録商品名等(正解の商品名等)について、出願商品名等との概念類似度と表層類似度とを算出する必要がなくなり、処理負担を軽減することができる。なお、記憶部に記憶されている商標情報には、出願商品名等と登録商品名等に加え、登録時の商品および役務の区分が含まれていればよい。
【0077】
なお、上記実施の形態1に係る情報処理装置100および上記実施の形態2に係る情報処理装置200は、専用の装置によらず、通常のコンピュータを用いて実現可能である。例えば、コンピュータに上述のいずれかを実行するためのプログラムを格納した記録媒体から該プログラムをコンピュータにインストールすることにより、上述の処理を実行する情報処理装置100および情報処理装置200を構成してもよい。また、複数のコンピュータが協働して動作することによって、1つの情報処理装置100および情報処理装置200を構成してもよい。
【0078】
また、上述の機能を、OS(Operating System)とアプリケーションとの分担、またはOSとアプリケーションとの協働により実現する場合等には、OS以外の部分のみを媒体に格納してもよい。
【0079】
また、搬送波にプログラムを重畳し、通信ネットワークを介して配信することも可能である。例えば、通信ネットワーク上の掲示板(BBS、Bulletin Board System)に当該プログラムを掲示し、ネットワークを介して当該プログラムを配信してもよい。そして、これらのプログラムを起動し、オペレーティングシステムの制御下で、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行できるように構成してもよい。
【符号の説明】
【0080】
100、200 情報処理装置、110 記憶部、111、111A プログラム、112 統合モデル、113 正例データ、114 負例データ、120 制御部、121 概念類似度算出部、122 表層類似度算出部、123、123A 統合スコア算出部、124 結果抽出部、125 学習部、130 入出力部、140 通信部、210 ネットワーク