(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-21
(45)【発行日】2023-01-04
(54)【発明の名称】商標情報処理装置及び方法、並びにプログラム
(51)【国際特許分類】
G06Q 50/18 20120101AFI20221222BHJP
G06F 16/906 20190101ALI20221222BHJP
【FI】
G06Q50/18 310
G06F16/906
(21)【出願番号】P 2017004748
(22)【出願日】2017-01-15
【審査請求日】2020-01-15
【審判番号】
【審判請求日】2021-07-12
(73)【特許権者】
【識別番号】517014929
【氏名又は名称】cotobox株式会社
(74)【代理人】
【識別番号】100161573
【氏名又は名称】五味 和泰
(72)【発明者】
【氏名】五味 和泰
(72)【発明者】
【氏名】林 佑磨
(72)【発明者】
【氏名】森岡 幹
(72)【発明者】
【氏名】二宗 素紀
【合議体】
【審判長】高瀬 勤
【審判官】相崎 裕恒
【審判官】松田 直也
(56)【参考文献】
【文献】特開2016-110440(JP,A)
【文献】特開2011-227727(JP,A)
【文献】特開2006-65651(JP,A)
【文献】特開2000-172705(JP,A)
【文献】特開2014-132394(JP,A)
【文献】特開2016-207093(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q10/00-99/00
G06F16/00-16/958
(57)【特許請求の範囲】
【請求項1】
商品・役務情報に含まれる指定商品・指定役務名の特徴量である第1特徴量を抽出する第1特徴量抽出部と、
商品・役務に関する入力テキストの特徴量である第2特徴量を抽出する第2特徴量抽出部と
、
商品・役務に関するグループを推定する
ためのモデルを
、第1特徴量を入力として学習するモデル学習部と、
第2特徴量と前記モデルとに基づいて前記グループを推定し、推定したグループに対応する商品・役務情報を抽出する商品・役務情報抽出部と、
を有することを特徴とする商標情報処理装置。
【請求項2】
請求項1に記載の商標情報処理装置において、
前記グループは階層構造を有し、
前記モデルは階層ごとに前記グループを推定するモデルであり、
前記商品・役務情報抽出部は、第2特徴量と前記モデルとに基づいて上位階層のグループを推定するとともに、推定したグループに紐づく下位階層のグループを推定し、各推定したグループに対応する商品・役務情報を抽出する、
ことを特徴とする商標情報処理装置。
【請求項3】
請求項1に記載の商標情報処理装置において、
前記抽出された商品・役務情報のフィードバック情報を取得するフィードバック情報取得部と、
前記フィードバック情報に基づいてモデルを再学習するモデル再学習部と、
を有する特徴とする商標情報処理装置。
【請求項4】
商標情報処理装置が実行する商標情報処理方法において、
商品・役務情報に含まれる指定商品・指定役務名の特徴量である第1特徴量を抽出する第1特徴量抽出ステップと
、
商品・役務に関するグループを推定する
ためのモデルを
、第1特徴量を入力として学習するモデル学習ステップと、
商品・役務に関する入力テキストの特徴量である第2特徴量を抽出する第2特徴量抽出ステップと、
第2特徴量と前記モデルとに基づいて前記グループを推定し、推定したグループに対応する商品・役務情報を抽出する商品・役務情報抽出ステップと、
を有することを特徴とする商標情報処理方法。
【請求項5】
コンピュータに、
商品・役務情報に含まれる指定商品・指定役務名の特徴量である第1特徴量を抽出する第1特徴量抽出ステップと
、
商品・役務に関するグループを推定する
ためのモデルを
、第1特徴量を入力として学習するモデル学習ステップと、
商品・役務に関する入力テキストの特徴量である第2特徴量を抽出する第2特徴量抽出ステップと、
第2特徴量と前記モデルとに基づいて前記グループを推定し、推定したグループに対応する商品・役務情報を抽出する商品・役務情報抽出ステップと、
を含む制御処理を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、商標情報処理装置及び方法、並びにプログラムに関する。
【背景技術】
【0002】
通常、商標権の取得や調査を行う場合、指定商品又は指定役務並びに商品及び役務の区分を特定する必要がある。
【0003】
下記特許文献1には、指定商品又は指定役務と、商品及び役務の区分との分類情報が格納されたデータベースを有する商標登録出願願書作成装置が開示されている。この装置においては、ユーザが商品名又は役務名をフリーワードで入力した場合、その入力ワードに対応する分類情報がデータベースから抽出され、画面に表示される。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1の装置では、ユーザの入力ワードと、データベース内の指定商品・役務が対応しない場合、分類情報が抽出されないという問題がある。弁理士などの商標の専門家がユーザである場合、指定商品又は指定役務に合致するキーワードを入力することは比較的容易であるが、商標実務の経験のないユーザにとって、そのようなキーワードを入力することは難しい。
【0006】
また、上記特許文献1の装置では、ユーザの入力ワードと指定商品・役務とが対応した場合、その指定商品・役務に対応する分類情報が網羅的に出力される。この抽出方法は、特許庁が運営する特許情報プラットフォーム(J-PlatPat)の商品・役務名検索においても同様であり、検索キーワードに対応する、又は検索キーワードを含む全ての商品・役務名が区分に紐付けられて一覧として出力される。このような出力結果からユーザの目的にあった分類情報を特定することは、時間がかかり、しかも商標実務に精通していないユーザにとっては困難である。
【0007】
本発明は、簡易に素早くかつ精度よく、指定商品・役務、または商品・役務の区分を含む商品・役務情報を特定できる商標情報処理装置及び方法、並びにプログラムを提供することにある。
【課題を解決するための手段】
【0008】
本発明は、商品・役務情報に含まれる指定商品・指定役務名の特徴量である第1特徴量を抽出する第1特徴量抽出部と、商品・役務に関する入力テキストの特徴量である第2特徴量を抽出する第2特徴量抽出部と、第1特徴量又は第2特徴量の少なくとも一方を入力とし、商品・役務に関するグループを推定するためのモデルを学習するモデル学習部と、第2特徴量と前記モデルとに基づいて前記グループを推定し、推定したグループに対応する商品・役務情報を抽出する商品・役務情報抽出部とを有することを特徴とする商標情報処理装置である。
【0009】
また、前記グループは階層構造を有し、前記モデルは階層ごとに前記グループを推定するモデルであり、前記商品・役務情報抽出部は、第2特徴量と前記モデルとに基づいて上位階層のグループを推定するとともに、推定したグループに紐づく下位階層のグループを推定し、各推定したグループに対応する商品・役務情報を抽出することができる。
【0010】
また、前記抽出された商品・役務情報のフィードバック情報を取得するフィードバック情報取得部と、前記フィードバック情報に基づいてモデルを再学習するモデル再学習部と、を有することができる。
【0011】
また、別の発明は、商標情報処理装置が実行する商標情報処理方法において、商品・役務情報に含まれる指定商品・指定役務名の特徴量である第1特徴量を抽出する第1特徴量抽出ステップと、商品・役務に関するグループを推定するモデルを、第1特徴量を入力として学習するためのモデル学習ステップと、商品・役務に関する入力テキストの特徴量である第2特徴量を抽出する第2特徴量抽出ステップと、第2特徴量と前記モデルとに基づいて前記グループを推定し、推定したグループに対応する商品・役務情報を抽出する商品・役務情報抽出ステップと、を有することを特徴とする。
【0012】
また、別の発明は、コンピュータに、商品・役務情報に含まれる指定商品・指定役務名の特徴量である第1特徴量を抽出する第1特徴量抽出ステップと、商品・役務に関するグループを推定するモデルを、第1特徴量を入力とし学習するためのモデル学習ステップと、商品・役務に関する入力テキストの特徴量である第2特徴量を抽出する第2特徴量抽出ステップと、第2特徴量と前記モデルとに基づいて前記グループを推定し、推定したグループに対応する商品・役務情報を抽出する商品・役務情報抽出ステップと、を含む制御処理を実行させるプログラムである。
【発明の効果】
【0013】
本発明の商標情報処理装置及び方法、並びにプログラムによれば、簡易に素早くかつ精度よく、商品・役務情報を特定できる。
【図面の簡単な説明】
【0014】
【
図1】商標情報処理装置の一実施形態としてネットワークに接続された構成を示す図である。
【
図2】本実施形態に係る商標情報処理装置のハードウェア構成を示す図である。
【
図3】本実施形態に係る商標情報処理装置の機能的構成を示す機能ブロック図である。
【
図7】商標情報処理装置が実行する処理の流れを示すフロー図である。
【発明を実施するための形態】
【0015】
以下、商標情報処理装置及び方法、並びにプログラムの実施形態について、図を用いて説明する。
【0016】
[ネットワークに接続された商標情報処理装置の構成]
図1は、商標情報処理装置の一実施形態としてネットワークに接続された構成を示す図である。商標情報処理装置10は、インターネット等のネットワーク12を介して、複数の情報端末14に接続される。なお、
図1の情報端末14の数は一例であり、情報端末14の数は3台に限定されず、例えば4台以上の任意の数であっても良い。
【0017】
商標情報処理装置10(以下、単に「装置10」と記す)は、商標調査サービス、商標登録出願書類作成サービス、または商標権実施・侵害モニタリングサービスなどの商標サービスを提供する情報処理装置である。なお、
図1に示す装置10は1台で構成されているが、本発明はこの構成に限定されない。例えば、装置10は、複数台の商標情報処理装置で構成されているものであっても良い。
【0018】
情報端末14は、ユーザが利用するスマートフォン、タブレット端末、ウェアラブル端末、PC(Personal Computer)等のコンピュータである。情報端末14は、有線または無線のネットワーク12に接続し、装置10と通信を行うことができる。装置10が提供する商標サービスは、情報端末14にインストールされたウェブブラウザ上で動作するウェブアプリケーションにより動作してもよく、情報端末14にインストールされたアプリケションにより動作してもよい。
【0019】
上記の構成により、情報端末14のユーザは、所定の操作を行うことにより、装置10が提供する商標サービスを利用することができる。
【0020】
[商標情報処理装置のハードウェア構成]
次に、本実施形態の装置10のハードウェア構成について
図2を用いて説明する。
【0021】
装置10は、一般的なコンピュータの構成を有しており、例えば、CPU(Central Processing Unit)16、RAM(Random Access Memory)18、ROM(Read Only Memory)20と、記憶部22と、ネットワークI/F(Interface)部24、入力部26、表示部28、及びバス30等を有する。
【0022】
CPU16は、ROM20や記憶部22等に記憶されたプログラムやデータをRAM18上に読み出し、処理を実行することにより、装置10全体の制御や機能を実現する演算装置である。RAM18は、CPU16のワークエリア等として用いられる揮発性のメモリである。ROM20は、例えば、装置10の起動時に実行されるBIOS(Basic Input/Output System)、及び各種設定等が記憶された不揮発性のメモリである。
【0023】
記憶部22は、OS(Operating System)や、各種のアプリケーションプログラム等を記憶する、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)等のストレージ装置である。
【0024】
ネットワークI/F部24は、装置10をネットワーク12に接続し、情報端末14等と通信を行うための通信インタフェースである。
【0025】
入力部26は、例えばキーボードやマウス等の入力装置であり、装置10の運用者が、装置10に各種操作信号を入力するために用いられる。表示部28は、例えばディスプレイ等の表示装置であり、装置10による処理結果等を表示する。なお、入力部26、表示部28等は、必要なときに、装置10に接続して利用する形態であってもよい。
【0026】
バス30は、上記の各構成に共通に接続され、例えば、アドレス信号、データ信号、及び各種の制御信号等を伝達する。
【0027】
なお、本実施形態の装置10は、上記構成に限定されず、ハードウェアの構成が別々のコンピュータにより実現されてもよい。また、装置10が提供する商標サービスが、情報端末14にインストールされたアプリケションにより動作する場合、本実施形態の装置10のハードウェア構成の一部が情報端末14のハードウェアによって実現されてもよい。
【0028】
[商標情報処理装置の機能的構成]
図3は、装置10の機能的構成のうち、商標における指定商品又は指定役務並びに商品及び役務の区分を特定する処理を実行するための機能的構成を示す機能ブロック図である。
【0029】
装置10のCPU16においては、上記処理が実行される場合、第1特徴量抽出部32と、第2特徴量生成部34と、モデル学習部36と、商品・役務情報抽出部38と、フィードバック情報取得部40と、モデル再学習部42とが機能する。また装置10の記憶部22の一部領域には、商品・役務情報44と、第1特徴量46と、第2特徴量48と、モデル50と、抽出商品・役務情報52と、フィードバック情報54とが格納される。
【0030】
第1特徴量抽出部32は、商品・役務情報44に含まれる指定商品・指定役務名の特徴量46を抽出する。
【0031】
商品・役務情報44は、特許庁が提供する公開情報に含まれており、その公開情報を取得して記憶部22に格納される。公開情報は、商標公報、公開・国際商標公報、商標整理標準化データである。なお、公開情報は、日本特許庁に限らず、他国特許庁が提供するものであってもよい。
【0032】
指定商品・指定役務名は、商標の使用をする商品・役務の内容及び範囲を表す名称であり、商標公報の「指定商品又は指定役務並びに商品及び役務の区分」の項目の「指定商品(指定役務)」の欄に記載される。「指定商品(指定役務)」の欄に、2以上の指定商品(指定役務)がある場合、指定商品・指定役務名は、コンマ「,」で区切られている各名称である。例えば、「指定商品(指定役務)」の欄に、「ビール,清涼飲料,果実飲料」と記載されている場合、指定商品・指定役務名は、「ビール」と「清涼飲料」と「果実飲料」である。
【0033】
第1特徴量抽出部32が抽出する特徴量(以降、単に「第1特徴量」と記す)46は、指定商品・指定役務名の素性を要素とする特徴ベクトルであり、指定商品・指定役務名が含む所定の単位の特徴情報を、機械学習用にベクトル化したものである。所定の単位とは、形態素またはN-gramである。形態素は、意味を持つ最小の言語単位である。N-gramは、N言語単位が隣接して生じる言語単位である。所定の単位の特徴情報には、品詞、読み、意味、原形(活用のある単語のみ)の情報の少なくとも1つが含まれる。第1特徴量に含まれる素性のスコアは、二値(0又は1)、出現数、TF-IDF(Term Frequency-Inverse Document Frequency)の値、LDA(Latent Dirichlet Allocation)の値などである。
【0034】
第1特徴量抽出部32が抽出する第1特徴量46の一例について、
図4を用いて説明する。指定商品名が「電池」と「電子補聴器」であり、テキスト解析にN-gramと形態素を用いた場合について説明する。第1特徴量抽出部32は、指定商品名に含まれる所定の単位と、その単位の頻度とに基づいて二値ベクトルを抽出する。具体的には、「電池」は、「電」、「池」、「電池」に解析され、それらには数値「1」が、それ以外には数値「0」が付される。一方、「電子補聴器」は、「電」、「子」、「補」、「聴」、「器」、「補聴器」に解析され、それらには数値「1」が、それ以外には数値「0」が付される。これらの特徴ベクトルは第1特徴量46として記憶部22に格納される。
【0035】
また、第1特徴量抽出部32は、辞書等を利用することで同義語、上位・下位語を同一素性として扱う、またはTF-IDF値に閾値を設けるなど統計の取りやすい特徴量を設計することが好適である。これにより、第1特徴量46の特徴ベクトルの次元の低減が可能になるとともに、ノイズに対して頑健になり、後述の商品・役務情報抽出部38により抽出される抽出商品・役務情報52の精度が向上する。
【0036】
第2特徴量抽出部34は、商品・役務に関する入力テキストの特徴量48を抽出する。
【0037】
商品・役務に関する入力テキストとは、ユーザが情報端末14により文字入力した商品名又は役務名に関する文字列情報である。例えば、商品名が「携帯電話」である場合、ユーザは、「携帯電話」、「携帯端末」、「スマートフォン」、「スマホ」、「モバイルフォン」などと入力し、その文字列情報が装置10に送られる。なお、本実施形態では、入力テキストはユーザの情報端末14から入力される場合について説明したが、本発明はこの構成に限定されない。例えば、装置10が、所定のウェブサイトに表示される文字列情報を取得し、これを入力テキストとすることができる。ウェブサイトから文字列情報を取得する方法は、ウェブクローラやスクレイピングなどの既知のソフトウェアを使用することによって実現可能である。
【0038】
第2特徴量抽出部34が抽出する特徴量(以降、単に「第2特徴量」と記す)48は、入力テキストの素性を要素とする特徴ベクトルであり、入力テキストが含む所定の単位の特徴情報を、機械学習用にベクトル化したものである。所定の単位は、第1特徴量46と同様であり、詳細な説明は省略する。第2特徴量に含まれる素性のスコアは、第1特徴量と同様、二値(0又は1)、出現数、TF-IDF(Term Frequency-Inverse Document Frequency)の値、LDA(Latent Dirichlet Allocation)の値などである。
【0039】
第2特徴量抽出部34が抽出する第2特徴量48の一例について、
図5を用いて説明する。入力テキストが「冷凍機械器具」であり、テキスト解析にN-gramと形態素を用いた場合について説明する。第2特徴量抽出部34は、入力テキストに含まれる所定の単位と、その単位の頻度とに基づいて二値ベクトルを抽出する。具体的には、「冷凍機械器具」は、「冷」、「凍」、「機」、「械」、「器」、「具」、「冷凍」、「機械」、「器具」に解析され、それらには数値「1」が付される。この特徴ベクトルは第2特徴量48として記憶部22に格納される。
【0040】
また、第2特徴量抽出部34は、辞書等を利用することで同義語、上位・下位語を同一素性として扱う、またはTF-IDF値に閾値を設けるなど統計の取りやすい特徴量を設計することが好適である。これにより、第2特徴量48の特徴ベクトルの次元の低減が可能になるとともに、ノイズに対して頑健になり、後述の商品・役務情報抽出部38により抽出される抽出商品・役務情報52の精度が向上する。
【0041】
モデル学習部36は、商品・役務に関するグループを推定するためのモデル50を、第1特徴量46又は第2特徴量48の少なくとも一方を入力として学習する。
【0042】
商品・役務に関するグループは、商標法施行令別表に記載される商品又は役務の区分数だけあり、平成29年時点で45個のグループに分けられる。モデル学習部36により、特徴量46,48の入力に対して各グループを推定するモデル50が学習される。モデル学習部36による学習で生成されたモデル50は、記憶部22に格納される。
【0043】
モデル50の学習には、教師用データと所定の機械学習のアルゴリズムとが用いられる。教師用データは、特許庁が提供する商品・役務情報44であり、具体的には、指定商品・指定役務名の第1特徴量46と、この指定商品・指定役務名に対応する商品・役務に関するグループとである。これらの対応関係は、登録商標の情報を用いれば、特許庁の審査を経ているので、正しい関係であり、教師用データとして適している。第1特徴量46が、モデル50を学習するための説明変数となる。一方、グループが、モデル50を学習するための目的変数となる。よって、第1特徴量46を入力とし、商品・役務に関するグループを出力とすることで、モデル学習部36は、説明変数によって目的変数が説明できるかを学習し、定量的に分析可能なモデル50を学習および生成することができる。
【0044】
所定の機械学習のアルゴリズムは、線形回帰、決定木、ロジスティック回帰、ニューラルネットワーク、k-means法、Nearest Neighbor法、SVM(Support vector machine)等を利用することができる。また、機械学習のアルゴリズムとして、逐一を学習できるオンライン線形識別器を用いることができる。このアルゴリズムは、後述するような、ユーザからのフィードバック情報54を即時にモデル50に反映させたい場合、特に有用である。オンライン線形識別器には、パーセプトロン、CW(Confidence Weighted Online Learning)、AROW(Adaptive Regularization of Weight Vectors)などがある。
【0045】
商品・役務情報抽出部38は、第2特徴量48とモデル50とに基づいてグループを推定し、推定したグループに対応する商品・役務情報52を抽出する。抽出される商品・役務情報(以降、単に「抽出商品・役務情報」と記す)52は、商品及び役務の区分であるが、さらに、区分に対応する指定商品又は指定役務、類似群コード、類似群コードに対応する指定商品又は指定役務の少なくとも1つを含めることができる。類似群コードとは、特許庁の類似商品・役務審査基準に記載されるグループであり、共通性を有する商品・役務をグルーピングし、同じグループに属する指定商品・役務付した5桁の共通コードのことである。
【0046】
商品・役務情報抽出部38の抽出方法の一例について、
図6を用いて説明する。第2特徴量48は、第1特徴量46の抽出の例示で説明した「電池」と「電子補聴器」のものを使用する。特許庁が提供する公開情報によれば、「電池」の区分は第9類であり、「電子補聴器」の区分は第10類である。
【0047】
図6に示される重みは、モデル学習部36で学習したモデル50である。本実施形態では、機械学習のアルゴリズムとして線形識別器を用いて、区分を適切に推定するように特徴ベクトルの重みを学習している。この図で示される重みは、区分の一例として、第9類のものを用いる。
【0048】
商品・役務情報抽出部38は、第2特徴量48の素数と、それに対応する重みとを掛け合わせてマージンを計算する。「電池」のマージンは、2.8(>0)であり正であるので、第9類と推定される。一方、「電子補聴器」のマージンは、−1.7(<0)であり負であるので、第9類ではないと推定される。「電池」に対応するグループが第9類と推定された場合、商品・役務情報抽出部38は、そのグループに対応する抽出商品・役務情報52を抽出する。また、「電子補聴器」については、第10類のモデル50により、第10類と推定され、商品・役務情報抽出部38は、そのグループに対応する抽出商品・役務情報52を抽出する。なお、本実施形態では、各グループに対応するモデル50がそれぞれ存在するが、本発明はこの構成に限定されず、モデル50の数はグループの数と同じでなくてもよい。例えば、全グループを推定可能なモデル50が、1つのみであってもよく、全グループの数より多くあってもよい。
【0049】
以上の構成により、ユーザは、仮に入力テキストが指定商品又は指定役務に完全または部分一致しなくても、入力テキストに対する区分を精度よく特定することができる。また、教師用データ(正解データ)に基づくモデル50により精度の良い商品・役務情報52が抽出されるので、抽出結果を少なくすることができ、特定するまでの時間を短縮することができる。
【0050】
商品・役務情報抽出部38で算出される正数のマージンが大きいほど、推定されたグループは正解であるという確信度が高い。よって、商品・役務情報抽出部38は、マージンが大きい順に抽出商品・役務情報52を抽出し、その順に、ユーザの情報端末14の画面に表示させることにより、ユーザは容易に確信度の高い抽出商品・役務情報52を特定することができる。また、抽出数の閾値を設定し、その閾値を超えた場合、正数のマージンが小さいグループに対応する抽出商品・役務情報52を非表示とすることで、ユーザによる抽出商品・役務情報52の特定作業の手間を省くことができる。
【0051】
また、装置10は、抽出商品・役務情報52のフィードバック情報54を取得するフィードバック情報取得部40と、フィードバック情報54に基づいてモデル50を再学習するモデル再学習部42とを有する。
【0052】
フィードバック情報54は、装置10の運用者またはユーザが判断した、抽出商品・役務情報52について適正であるか否かの適正度を含む。適正度は、抽出結果に対する正誤の二値であってもよく、さらに正誤の中間値を設けてもよい。さらに、フィードバック情報54は、ユーザの入力テキストと、この入力テキストの第2特徴量48と、その第2特量量に基づく抽出商品・役務情報52と、抽出商品・役務情報52とを含むことができる。
【0053】
フィードバック情報取得部40よりフィードバック情報54が得られた場合、モデル再学習部42は、フィードバック情報54に基づいてモデル50を再学習する。具体的には、モデル再学習部42は、第2特徴量48と抽出商品・役務情報52と適正度とに基づいてモデル50を再学習し、再構築する。この再学習後のモデル50は、フィードバック情報54を提供したユーザのみが装置10にアクセスするときのみ適用されもよく、全ユーザが利用可能なモデル50に置き換えることもできる。これにより、ユーザが抽出結果に対してフィードバックをすればするほど、モデル50がより多くファインチューニングされ、抽出商品・役務情報52の精度が自動的に改善される。新しい商品・役務を表す名称が創作され、使い始めたとき、このようなモデルの自動的な再学習機能があれば、人的資源を使用したアルゴリズムの修正に比べ、迅速かつ手間なく商標サービスに反映することができる。また、特許庁から取得した新規の商品・役務情報44については、モデル学習部36またはモデル再学習部42を用いてモデル50を学習させることができる。
【0054】
本実施形態においては、商品・役務に関するグループが、商標法施行令別表に記載される商品又は役務の区分数に分けられている場合について説明したが、本発明はこの構成に限定されない。グループが、上述の区分数より少なく分けられていてもよく、多く分けられていてもよい。例えば、グループが、区分の数より多い類似群コードであってもよい。さらに、グループが、外国特許庁または国際機関が設定したグループであり、共通性を有する商品・役務をグルーピングし、同じグループに属する指定商品・役務付しであってもよい。
【0055】
また、グループが、階層構造を有するように構成されても良い。例えば、グループが2つの階層構造を有する場合について説明する。グループの上位階層は、区分数により分けられており、下位階層は、類似群コードにより分けられている。このようにグループが階層構造で構成される場合、モデル50は階層ごとにグループを推定するモデルになる。そして、商品・役務情報抽出部38は、第2特徴量48とモデル50とに基づいて上位階層のグループ、例えば区分を推定するとともに、推定したグループに紐づく下位階層のグループ、例えば類似群コードを推定し、各推定したグループに対応する商品・役務情報52を抽出する。この例においては、各推定したグループに対応する商品・役務情報52とは、区分の番号、類似群コード、指定商品・役務名である。
【0056】
クラウドコンピューティングによる商標サービスを提供することにより、同一のユーザまたは同一組織のユーザだけではなく、不特定多数のユーザよりフィードバック情報54をリアルタイムで得られる。この情報に基づいてモデル50を再学習することにより、運用上、モデル50の改善に関するメンテナンスが不要となる。さらに、クラウドコンピューティングを用いたウェブアプリケーションに再学習機能を組み込むことにより、スタンドアローンのアプリケーションに比べ、抽出商品・役務情報52の精度を自動的かつ高速で改善させることができる。
【0057】
次に、
図7を用いて、装置10が実行する処理の流れについて説明する。
【0058】
まず、ステップS01において、第1特徴量抽出部32は、商品・役務情報44に含まれる指定商品・指定役務名の第1特徴量46を抽出する。
【0059】
そして、ステップS02では、第2特徴量抽出部34は、商品・役務に関する入力テキストの第2特徴量48を抽出する。
【0060】
次に、ステップS03において、モデル学習部36は、第1特徴量46又は第2特徴量48の少なくとも一方を入力とし、商品・役務に関するグループを推定するモデル50を学習する。
【0061】
最後に、ステップS04において、商品・役務情報抽出部38は、第2特徴量48とモデル50とに基づいてグループを推定し、推定したグループに対応する抽出商品・役務情報52を抽出し、この処理が終了する。
【0062】
この処理において、グループが階層構造を有するように構成されても良い。グループが2つの階層構造を有する場合、モデル50は2つ階層ごとにグループを推定するモデルになる。そして、商品・役務情報抽出部38は、第2特徴量48とモデル50とに基づいて上位階層のグループ、例えば区分を推定するとともに、推定したグループに紐づく下位階層のグループ、例えば類似群コードを推定し、各推定したグループに対応する商品・役務情報52を抽出する。このようなグループの階層構造により、より小さい規模にグルーピングされたグループに対応する商品・役務情報52を精度よく抽出することが可能になる。
【0063】
また、上記処理の流れに、さらに、フィードバック情報取得部40が、抽出商品・役務情報52のフィードバック情報54を取得し、モデル再学習部42が、フィードバック情報54に基づいてモデル50を再学習するようにしてもよい。
【0064】
上述した一連の処理を実行することができる機能を装置10が備えていればよく、本発明は
図3に示す機能的構成に限定されない。上記一連の処理は、ハードウェアにより実行させることも、ソフトウェアにより実行させることもできる。また、1つの機能ブロックは、ハードウェア単体で構成されてもよいし、ソフトウェア単体で構成されてもよく、またはこれらの組み合わせで構成されてもよい。
【0065】
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータなどにネットワークや記憶媒体からインストールされる。なお、プログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理を含むことができる。
【符号の説明】
【0066】
10 商標情報処理装置、12 ネットワーク、14 情報端末、16 CPU、18 RAM、20 ROM、22 記憶部、24 ネットワークI/F、26 入力部、28 表示部、30 バス、32 第1特徴量抽出部、34 第2特徴量抽出部、36 モデル学習部、38 商品・役務情報抽出部、40 フィードバック取得部、42 モデル再学習部、44 商品・役務情報、46 第1特徴量、48 第2特徴量、50 モデル、52 抽出商品・役務情報、54 フィードバック情報。