特開2022-73872 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ＩＰＳＩＧＮの特許一覧

特開2022-73872侵害情報抽出システム、方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022073872

(43)【公開日】2022-05-17

(54)【発明の名称】侵害情報抽出システム、方法及びプログラム

(51)【国際特許分類】

G06Q 50/18 20120101AFI20220510BHJP

【ＦＩ】

G06Q50/18 310

【審査請求】未請求

【請求項の数】18

【出願形態】ＯＬ

(21)【出願番号】P 2021006882

(22)【出願日】2021-01-20

(62)【分割の表示】P 2020181776の分割

【原出願日】2020-10-29

(71)【出願人】

【識別番号】520115978

【氏名又は名称】株式会社ＩＰＳＩＧＮ

(74)【代理人】

【識別番号】100177220

【弁理士】

【氏名又は名称】小木智彦

(72)【発明者】

【氏名】谷口将仁

【テーマコード（参考）】

5L049

【Ｆターム（参考）】

5L049CC33

(57)【要約】（修正有）

【課題】自動で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する侵害情報抽出システム、方法及びプログラムを提供する。
【解決手段】侵害情報抽出システムにおいて、侵害情報抽出サーバ１０は、登録番号から対象となる知的財産の権利を示す権利情報２２を取得し、他の知的財産の権利を示すデータを加工した学習データ１８を機械学習してモデル２０を生成し、モデル２０により対象となる知的財産の権利を示す権利情報２２を解析して、検索するために必要な文字または画像を判断した判断結果２４を用いて、文字検索または画像検索を行った検索結果２６から、対象となる知的財産の権利を侵害している可能性のある侵害情報２８を抽出する。
【選択図】図２

【特許請求の範囲】

【請求項1】

登録番号から対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を取得して、当該権利情報を解析する解析手段と、
前記解析の結果から、検索するために必要な文字または画像を判断する判断手段と、
前記判断した文字または画像を用いて、検索エンジンで検索する検索手段と、
前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出する抽出手段と、
を備える侵害情報抽出システム。

【請求項2】

前記判断した文字の類語を特定する類語特定手段を備え、
前記検索手段は、前記特定された類語を用いて、検索エンジンで検索する、
請求項１に記載の侵害情報抽出システム。

【請求項3】

前記判断した文字を、他の言語に翻訳する翻訳手段を備え、
前記検索手段は、前記他の言語に翻訳された文字を用いて、検索エンジンで検索する、請求項１に記載の侵害情報抽出システム。

【請求項4】

前記抽出した侵害情報に対するタスクを管理するタスク管理手段と、
を備える請求項１に記載の侵害情報抽出システム。

【請求項5】

前記抽出手段は、定期的に抽出し、
今回抽出した侵害情報が、前回抽出した侵害情報から変更がある場合に、抽出の結果に変更があることを通知する通知手段、
を備える請求項１に記載の侵害情報抽出システム。

【請求項6】

前記抽出した侵害情報をダウンロードするダウンロード手段と、
前記ダウンロードした内容と日時とを紐づけて保存する保存手段と、
を備える請求項１に記載の侵害情報抽出システム。

【請求項7】

所定のメンバーからなるグループを作成するグループ作成手段と、
前記作成したグループ内で、前記抽出した侵害情報を共有する共有手段と、
を備える請求項１に記載の侵害情報抽出システム。

【請求項8】

前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利者の情報を取得する権利者情報取得手段を備え、
前記解析手段は、前記取得した権利者が保有する特許、実用新案、意匠及び商標のいずれか一つを示す権利情報を一括で解析する請求項１に記載の侵害情報抽出システム。

【請求項9】

前記抽出した侵害情報を解析して、どの部分に侵害の根拠があるかを特定する根拠特定手段、
を備える請求項１に記載の侵害情報抽出システム。

【請求項10】

キーワードの指定を受け付けるキーワード受付手段を備え、
前記抽出手段は、前記指定されたキーワードを反映して抽出する、
請求項１に記載の侵害情報抽出システム。

【請求項11】

前記抽出した侵害情報のＵＲＬを管理する管理手段と、
前記管理した複数のＵＲＬを一覧にしたレポートを出力する出力手段と、
を備える請求項１に記載の侵害情報抽出システム。

【請求項12】

前記抽出した侵害情報の侵害可能性を算出する算出手段と、
前記算出した侵害可能性の高い順に、前記抽出した侵害情報を並び替える並替手段と、
を備える請求項１に記載の侵害情報抽出システム。

【請求項13】

ユーザに会員登録させる会員手段を備え、
前記解析手段は、前記ユーザから指定された特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析する
請求項１に記載の侵害情報抽出システム。

【請求項14】

前記抽出した侵害情報のうち、指定された侵害情報をブックマークに登録するブックマーク手段と、
前記ブックマークに登録した侵害情報を、一覧で表示する表示手段と、
を備える請求項１に記載の侵害情報抽出システム。

【請求項15】

前記抽出するスケジュールを設定するスケジュール手段を備え、
前記検索手段は、前記設定されたスケジュールに基づいて、前記判断した文字または画像を用いて、検索エンジンで検索する
請求項１に記載の侵害情報抽出システム。

【請求項16】

前記判断した文字または画像の変更を受け付ける変更受付手段を備え、
前記検索手段は、前記変更した文字または画像を用いて、検索エンジンで検索する
請求項１に記載の侵害情報抽出システム。

【請求項17】

登録番号から対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を取得して、当該権利情報を解析するステップと、
前記解析の結果から、検索するために必要な文字または画像を判断するステップと、
前記判断した文字または画像を用いて、検索エンジンで検索するステップと、
前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出するステップと、
を備える侵害情報抽出方法。

【請求項18】

コンピュータに、
登録番号から対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を取得して、当該権利情報を解析するステップと、
前記解析の結果から、検索するために必要な文字または画像を判断するステップと、
前記判断した文字または画像を用いて、検索エンジンで検索するステップと、
前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出するステップと、
を実行させるための侵害情報抽出プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、侵害情報抽出システム、方法及びプログラムに関し、更に具体的には、自動で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する技術に関する。

【背景技術】

【0002】

近年、特許、商標、意匠、および実用新案を扱う技術が注目されている。例えば、過去に審査された審査結果を機械学習して権利取得の可能性が上がる補正情報を生成する技術がある（特許文献１）。

【0003】

他には、知的財産情報を機械学習して知的財産の権利取得の可能性を算出する技術がある（特許文献２）。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０１９－１７９４９３号公報

【特許文献2】特開２０１９－１７９５７８号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

知的財産を取得して競合優位性を構築した状態であっても、その知的財産権を侵害している競合他社を野放しにしたままでは、競合優位性を保った状態で事業を行うことができない。知的財産を侵害している競合他社を把握するには模倣調査が必要であるが、知的財産の模倣調査には専門的なスキルと経験が必要となる。専門家を使って模倣調査を行うと手間とコストが大きくかかる問題や、そもそも専門家が不足している問題があるため、競合優位性を護れていない企業が多くある。そこで、専門家を必要とせずに、手間もコストも削減して、企業の競合優位性を護るためには、自動で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する技術が有効となる。

【0006】

しかしながら、特許文献１及び特許文献２の技術では、過去に審査された審査結果を機械学習して権利取得の可能性が上がる補正情報を生成することや、知的財産情報を機械学習して知的財産の権利取得の可能性を算出することはできるが、自動で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する技術を提供することはできない。

【0007】

従って、本発明は、自動で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する侵害情報抽出システム、方法及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0008】

本発明は、登録番号から対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を取得して、当該権利情報を解析する解析手段と、前記解析の結果から、検索するために必要な文字または画像を判断する判断手段と、前記判断した文字または画像を用いて、検索エンジンで検索する検索手段と、前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出する抽出手段と、を備える侵害情報抽出システムを提供する。

【0009】

また、本発明は、登録番号から対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を取得して、当該権利情報を解析するステップと、前記解析の結果から、検索するために必要な文字または画像を判断するステップと、前記判断した文字または画像を用いて、検索エンジンで検索するステップと、前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出するステップと、を備える侵害情報抽出方法を提供する。

【0010】

更に、本発明は、コンピュータに、登録番号から対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を取得して、当該権利情報を解析するステップと、前記解析の結果から、検索するために必要な文字または画像を判断するステップと、前記判断した文字または画像を用いて、検索エンジンで検索するステップと、前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出するステップと、を実行させるための侵害情報抽出プログラムを提供する。

【発明の効果】

【0011】

本発明によれば、登録番号から対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を取得して、当該権利情報を解析して、解析の結果から、検索するために必要な文字または画像を判断して、判断した文字または画像を用いて、検索エンジンで検索して、検索の結果から、対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出することとした。

【0012】

このように、自動で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出できるという効果がある。

【図面の簡単な説明】

【0013】

【図1】本発明の一実施形態の侵害情報抽出システムの全体構成を示す概念図である。

【図2】前記実施形態の侵害情報抽出サーバのハードウェア構成を示すブロック図である。

【図3】前記実施形態の侵害情報抽出サーバの機能構成を示すブロック図である。

【図4】前記実施形態のユーザ端末の構成を示すブロック図である。

【図5】前記実施形態の学習データの一例を示す図である。

【図6】前記実施形態の学習データの他の一例を示す図である。

【図7】前記実施形態の学習データの他の一例を示す図である。

【図8】前記実施形態の類語辞書の一例を示す図である。

【図9】前記実施形態の辞書の一例を示す図である。

【図10】前記実施形態のユーザ端末に表示される対象となる知的財産の権利を示す権利情報を取得するための画面の一例を示す図である。

【図11】前記実施形態のユーザ端末に表示される画面の一例を示す図である。

【図12】前記実施形態による侵害情報抽出処理の一例を示すフローチャートである。

【発明を実施するための形態】

【0014】

本発明は、登録番号から対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を取得して、当該権利情報を解析して、解析の結果から、検索するために必要な文字または画像を判断して、判断した文字または画像を用いて検索エンジンで検索して、検索の結果から対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出するものである。以下、本発明を実施するための最良の形態を、実施例に基づいて詳細に説明する。

【0015】

＜基本概念＞・・・まず、本発明の侵害情報抽出技術の基本的な概念について説明する。本発明は、人工知能で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する精度を高める、人工知能技術に関する。具体的には、対象となる知的財産の権利を示す権利情報（例えば、登録時の公報）を解析し、解析の結果から、検索するために必要な文字または画像（例えば、特許の独立項に記載されている文字や、意匠の実線と破線の画像など）を判断し、前記判断した文字または画像を用いて、検索エンジンで検索（文字検索または画像検索）し、前記検索の結果から、前記対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する。例えば、抽出する精度が高くなるということは、抽出する侵害情報が役に立つ度合いが高い侵害情報になるということを意味する。

【0016】

ここで、他の知的財産の権利を示すデータ（登録時の公報）を加工した学習データ（丸付けした画像データまたはテキストデータ）を機械学習してモデルを生成し、前記解析にあたり、生成したモデルを利用して、前記対象となる知的財産の権利を示す権利情報を解析してもよい。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。また、前記判断した文字の類語を特定し、特定された類語も含めて検索してもよいし、判断した文字を外国語に翻訳して、翻訳された文字を用いて検索してもよい。

【0017】

以下、本発明を実施するための最良の形態を、実施例に基づいて詳細に説明する。

【0018】

＜全体構成＞・・・図１は、本実施形態による侵害情報抽出システムの全体構成を示す概念図である。図１に示すように、侵害情報抽出システム１００は、侵害情報抽出サーバ１０と、ユーザ８０のユーザ端末８２により構成されている。これらは、図示しないインターネットなどのネットワークを介して、相互にデータ通信可能となっている。ユーザ８０には、後述するグループを構成するメンバーや、その他の者が含まれてもよい。

【0019】

図１に示すように、まず、侵害情報抽出サーバ１０は、対象となる知的財産の権利を示す権利情報（登録番号や登録時の公報など）を、ユーザ８０がユーザ端末８２によって入力した内容から取得する。例えば、ユーザ８０によって入力された登録番号によって権利情報を取得してもよいし、ユーザ８０によって入力された内容をそのままを権利情報として取得してもよい（例えば、ユーザ８０によって入力された特許請求の範囲など）。

【0020】

また、侵害情報抽出サーバ１０は、必要に応じて、他の知的財産の権利を示すデータ（登録時の公報など）を加工した学習データを機械学習して（ステップＳ２）、モデルを生成してもよい（ステップＳ３）。具体的には、色々な知的財産権（特許権、実用新案権、意匠権、商標権）の権利情報を示す画像の特徴部分（キーワードや図形の特徴点など）に丸付けをして加工した学習データ１８を、数十～数万個用意して、その学習データ１８を機械学習してモデルを生成する。丸付けは、例えば、どのような分野のどのような内容か、を認識するために、分野を示す分野情報と、内容を示す内容情報の両方に行う。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。

【0021】

分野を示す分野情報は、特許であれば、ＩＰＣ分類、ＦＩ、Ｆタームなどであり、商標であれば、商品・役務の区分などであり、意匠であれば、意匠分類、意匠に係る物品などである。実用新案については、特許と同様である。

【0022】

また、内容を示す内容情報は、特許であれば、請求の範囲の独立項のキーワード、従属項のキーワードなどであり、商標であれば、登録商標の文字または図形であり、意匠であれば、図面の実線、破線などである。実用新案については、特許と同様である。

【0023】

なお、学習データとしては、文字と図形の両方に対応して認識できるため画像の学習データが好ましいが、テキストの学習データを利用することを妨げるものではない。

【0024】

以上のような学習データを機械学習すると、その学習データにカスタマイズされたモデルが生成される。すなわち、公報のどの箇所に分野情報があって、どのような文字が記載されているか、どの箇所に内容情報があって、どのような文字または図形なのか、などが機械学習されたモデルが生成される。

【0025】

次に、侵害情報抽出サーバ１０は、ユーザ８０がユーザ端末８２によって入力した対象となる知的財産の権利を示す権利情報を解析する（ステップＳ４）。この解析は、例えば、公報に何が記載されているかを把握するために行うものである。例えば、登録時の公報を画像キャプチャして画像解析してもよいし、登録時の公報を文字としてテキストマイニングしてもよい。また、知的財産の権利を示す権利情報を含んだテキストデータを取得して解析しても構わない。

【0026】

公報の決まった場所に、分野を示す分野情報や、内容を示す内容情報が記載されているため、機械学習を必須としなくても解析は可能であるが、解析の精度を上げるために、前記ステップＳ３で生成したモデルを使用して、解析を行うようにしてもよい。例えば、モデルを利用して解析する場合には、対象となる知的財産の権利を示す画像（権利情報）を入力すると、権利情報からどの部分（分野情報や内容情報を示すキーワードや図形の特徴点など）を抜き出すかを解析する。例えば、知的財産の権利を示す権利情報を含むテキストデータの場合は、そのテキストデータの内、知的財産の権利を示す権利情報がどこにあるかを解析する。

【0027】

そして、侵害情報抽出サーバ１０は、前記解析の結果から、検索するために必要な文字または画像を判断する（ステップＳ５）。具体的には、検索エンジンで、文字検索または画像検索をするために、検索に必要な文字または画像がどれなのかを判断する。検索に必要な文字または画像とは、例えば、分野情報は文字を判断し、内容情報は文字または図形を判断することになる。具体的には、分野情報であれば、特許のＩＰＣ分類の文字や、商標の商品・役務の区分などの文字を判断する。内容情報であれば、特許の独立項に記載されている文字や、意匠の実線と破線の画像などを判断する。判断した文字または画像を変更（選定、追加、削除など）してもよい。例えば、判断した文字または画像を、ユーザに変更（選定、追加、削除など）させてもよい。

【0028】

次に、侵害情報抽出サーバ１０は、前記判断した文字または画像を用いて、検索エンジンで検索を行う（ステップＳ６）。前記ステップＳ５で判断した文字または画像を使って、既知の検索エンジンで、文字検索や画像検索を行う。例えば、ユーザによって変更された文字または画像を用いて、検索エンジンで検索してもよい。

【0029】

次に、侵害情報抽出サーバ１０は、前記検索の結果から、前記対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する（ステップＳ７）。具体的には、検索結果に表示されたＷｅｂページ／動画／画像などのコンテンツの中から侵害情報を抽出する。なお、これらのコンテンツを解析して侵害情報を抽出してもよいし、解析せずにランダムに抽出してもよいし、解析せずに全てを抽出してもよい。例えば、解析の精度が高い場合には、Ｗｅｂページ／動画／画像などのコンテンツを解析して侵害情報を抽出すると、最終的な強化学習後の抽出の精度がより高くなることが期待できる。

【0030】

つまり、抽出する精度が高くなるということは、抽出する侵害情報が役に立つ度合いが高い侵害情報になるということを意味する。

【0031】

このように、自動で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出することができる。

【0032】

＜侵害情報抽出サーバのハードウェア構成＞・・・図２は、本実施形態の侵害情報抽出サーバ１０のハードウェア構成を示すブロック図である。侵害情報抽出サーバ１０は、例えば、プロセッサ１２、メモリ１４、ストレージ１６、通信部３４を備え、これらは図示しないバスにより接続されている。プロセッサ１２は、例えば、ＣＰＵ（Central Processing Unit）により構成され、メモリ１４に記憶された各種プログラムを読み出して実行することで、各種処理を行う。

【0033】

前記メモリ１４は、プロセッサ１２により実行されるプログラムを記憶するものであり、例えば、ＲＯＭ（Read Only Memory）やＲＡＭ（Random Access Memory）により構成される。例えば、図３に示す各種手段が記憶されている。ストレージ１６は、例えば、学習データ１８、モデル２０、権利情報２２、判断結果２４、検索結果２６、侵害情報２８、辞書３０、グループ情報３２や、図示しない制御プログラムなどを記憶するものである。通信部３４は、ネットワークを介して、ユーザ端末８２や、他の外部装置とデータ通信を行うものである。

【0034】

ストレージ１６に記憶される学習データ１８は、例えば、色々な知的財産の権利（特許権、実用新案権、意匠権、商標権）を示すデータ（例えば、登録時の公報）に丸付けをして加工したものである。学習データ１８は、例えば、数十～数万用意され、これらの学習データ１８を機械学習して、モデル２０が生成される。丸付は、例えば、どのような分野のどのような内容か、を認識するために、分野を示す分野情報と、内容を示す内容情報の両方に行う。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。

【0035】

図５は、分野を示す分野情報に関する学習データの一例を示す図であり、(A)は特許権に関する学習データ１８Ａ、(B)は意匠権に関する学習データ１８Ｂ、(C)は商標権に関する学習データ１８Ｃの一例を示す。分野を示す分野情報は、特許であれば、ＩＰＣ分類、ＦＩ、Ｆタームなどである。図５(A)の例では、ＩＰＣ分類、ＦＩタームに囲み線Ｃで丸付け加工されている。実用新案についても同様である。また、分野を示す分野情報は、意匠であれば、意匠分類、意匠に係る物品などであり、図５(B)の例では、意匠に係る物品、意匠分類、国際意匠分類、Ｄタームに囲み線Ｃで丸付け加工されている。また、分野を示す分野情報は、商標であれば、商品・役務の区分などであり、図５(C)の例では、「第９類」、「第３７類」といった区分に囲み線Ｃで丸付け加工がされている。

【0036】

図６は、特許の内容を示す内容情報に関する学習データ１８Ａの一例を示す図である。権利の内容を示す内容情報は、特許であれば、請求の範囲の独立項のキーワード、従属項のキーワードなどである。図６の例では、学習データとして、特許請求の範囲を示す画像が用いられる。そして、権利範囲の画像に丸付けをして加工したものを学習データ１８Ａとする。丸付けは、図６に示すように、キーワードを囲み線Ｃで囲うことにより行われる。図示の例では、囲み線Ｃにより、「本人」、「認定する」、「画像を」、「正当性」、「同時」、「写真付証明書」、「顔」、「ユーザ」、「一致」の文言がキーワードとして囲み線Ｃにより囲まれている。実用新案についても同様である。

【0037】

また、ＩＰＣ分類を学習データに紐づけて機械学習してもよい。更に、キーワードに加えて、特許権や実用新案権の権利範囲をもっともよく反映している図面のうち、前記キーワードに対応する部分を丸付けした画像を学習データとして加えてもよい

【0038】

図７は、意匠の内容を示す内容情報に関する学習データ１８Ｂの一例を示す図である。意匠権の権利内容は、図面に表されたものによって決まるものであり、学習データとして、図面の画像が用いられる。そして、権利範囲の画像の特徴部分に丸付けをして加工したものを学習データ１８Ｂとする。図７は、部分意匠の例であり、丸付けは、例えば、「正面及び平面側斜視図」の全体、すなわち、破線部分も含めて囲み線Ｃ１で囲むとともに、意匠登録を受けようとする部分、すなわち、実線部分を囲み線Ｃ２で囲むことにより行われる。

【0039】

なお、図７では、「正面及び平面側斜視図」についてのみ示したが、他の図面についても同様の丸付けを行うようにしてもよい。また、図面の丸付けに加え、「意匠の説明」からキーワードに丸付けをして、あわせて学習データ１８Ｂとしてもよい。また、意匠の分類を、学習データに紐づけて機械学習してもよい。

【0040】

また、商標の権利内容に関する学習データは、文字商標の場合は、特許権や実用新案権と同様にキーワードを丸付けすることで学習データとされる。例えば、商標の文字全体を一つのキーワードとして丸付けしてもよいし、２以上の語からなる結合商標の場合には、全体をキーワードとして丸付けすることに加え、商標を構成する各語をキーワードとして丸付けしてもよい。また、前記キーワードに加えて、区分を学習データに紐づけて機械学習してもよい。

【0041】

文字商標以外の商標についても、同様に画像を用い、全体を特徴部分として丸付けして囲ったり、文字と結合した画像部分を特徴部分として丸付けして囲って、学習データを用意してもよい。

【0042】

【0043】

前記ストレージ１６に記憶されるモデル２０は、学習データ１８を機械学習して生成されるもので、ユーザ８０から取得した対象となる知的財産の権利を示す権利情報の解析に利用される。

【0044】

権利情報２２は、ユーザ８０から入力された知的財産の権利を示す権利情報（登録番号、特許請求の範囲、権利者情報など）である。例えば、特許権であれば、登録番号に対して、特許請求の範囲、権利者情報、ＩＰＣ分類などが紐づけて記憶される。実用新案権についても同様である。

【0045】

意匠権であれば、登録番号に対して、図面、権利者情報、分類などが紐づけて記憶される。商標権であれば、登録番号に対して、商標、権利者情報、区分などが紐づけて記憶される。

【0046】

判断結果２４は、ユーザ８０から入力された対象となる知的財産の侵害情報の抽出のための検索に必要な文字または画像として判断されたものである。判断した文字または画像を変更（選定、追加、削除など）してもよい。例えば、判断した文字または画像を、ユーザに変更（選定、追加、削除など）させてもよい。

【0047】

検索結果２６は、判断結果２４である文字または画像を用いて、検索エンジンで検索（文字検索または画像検索）した結果である。また、検索結果２６は、ユーザによって変更された文字または画像を用いて、検索エンジンで検索した結果であってもよい。

【0048】

侵害情報２８は、判断結果２４に基づいて、検索エンジンを利用して検索した検索結果２６から、前記対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出したものである。検索結果に表示されたＷｅｂページ／動画／画像などのコンテンツは削除されるものも多数あるため、抽出した侵害情報は、ダウンロードして、ダウンロードした内容と日時とを紐づけて記憶してもよい。また、侵害情報は一つとは限らず、複数の侵害情報が検索によりヒットした場合には、それら複数の侵害情報が、ユーザ８０から入力された知的財産権に紐づけて記憶される。また、抽出した全ての侵害情報をダウンロードするとストレージコストが膨大になるため、例えば保存ボタンを設置して、ユーザが保存ボタンを押した侵害情報だけを保存して、保存ボタンが押されなかった侵害情報は一定期間後に破棄してもよい。逆に、抽出した侵害情報のＵＲＬだけをユーザに提供して、ユーザが保存ボタンを押した侵害情報だけをダウンロードして保存してもよい。

【0049】

辞書３０は、判断結果２４である文字の類語を特定するための類語辞書や、前記判断した文字を他の言語（例えば、英語、中国語、スペイン語など）に翻訳するための翻訳用の外国語辞書等が含まれる。

【0050】

図８は、判断結果２４である文字の類語を特定するための類語辞書の一例を示す図である。図８に示す類語辞書３０Ａでは、判断した文字「本人」に対する類語として「当人」、判断した文字「認定」に対する類語として「判定／評定／査定」、判断した文字「画像」に対する類語として「映像／画面」が記載されている。

【0051】

図９は、判断結果２４である文字を、例えば、日本語から外国語（図示の例では、英語及び中国語）に翻訳するための辞書３０Ｂの一例を示す。辞書３０Ｂでは、判断した文字「写真」に対する英語として「ｐｈｏｔｏ」、中国語として「照片」が記載され、「判断した文字「本人」に対する英語として「ｙｏｕｒｓｅｌｆ」、中国語として「此人」が記載され、判断した文字「認定する」に対する英語として「ａｕｔｈｏｒｉｓｅ」、中国語として「

」が記載されている。

【0052】

このような辞書３０は、侵害情報抽出サーバ１０にあってもよいし、外部の辞書と連携するようにしてもよい。

【0053】

グループ情報３２は、所定のメンバーからなるグループに関する情報である。グループは、例えば、企業の企画経営部、知的財産部、〇〇チーム、社外の専門家など、所定のメンバーで構成されるものであり、メンバーの組み合わせは調整できる。当該グループ内で、抽出した侵害情報２６が共有される。

【0054】

＜侵害情報抽出サーバの機能構成＞・・・図３は、侵害情報抽出サーバ１０の機能構成を示すブロック図である。侵害情報抽出サーバ１０は、解析手段４０、生成手段４２、判断手段４３、検索手段４４、抽出手段４６、類語特定手段４８、翻訳手段４９、タスク管理手段５０、通知手段５１、ダウンロード手段５２、保存手段５４、グループ作成手段５６、共有手段５８、権利者情報取得手段６０、根拠特定手段６２、キーワード受付手段６４、管理手段６６、出力手段６８、算出手段７０、並替手段７２を備えている。

【0055】

解析手段４０は、対象となる知的財産の権利を示す権利情報を解析するものである。この解析は、例えば、公報に何が記載されているかを把握するために行う。例えば、登録時の公報を画像キャプチャして画像解析してもよいし、登録時の公報を文字としてテキストマイニングしてもよい。対象となる知的財産の権利を示す権利情報は、例えば、ユーザ８０によって入力された登録番号によって、外部データベースから当該登録番号に該当する権利の権利情報を取得してもよいし、ユーザ８０によって入力された権利範囲そのまま（例えば、特許請求の範囲の文言や、意匠の図面など）を権利情報としてもよい。また、知的財産の権利を示す権利情報を含んだテキストデータを取得して解析しても構わない。知的財産の権利を示す権利情報を含むテキストデータの場合は、そのテキストデータの内、知的財産の権利を示す権利情報がどこにあるかを解析する。

【0056】

なお、ユーザ８０による入力は、解析手段４０がネットワークを介してユーザ端末８２の表示部９２（図１参照）に、対象となる知的財産の権利を示す権利情報を入力させるための画面を表示し、画面を見たユーザ８０が、入力部９０によって行う。当該入力した内容を、通信部及びネットワークを介して、侵害情報抽出サーバ１０に送信することにより、侵害情報抽出サーバ１０は、権利情報を取得する。

【0057】

図１０には、ユーザ端末８２の表示部９２に表示される画面１１０の一例が示されている。画面１１０には、特許、商標、意匠、実用新案などを選択できるプルダウンメニュー１１２、登録番号入力欄１１４、特許や実用新案のためのＩＰＣ分類入力欄１１６Ａ、意匠の分類のための分類入力欄１１６Ｂ、商標の区分のための区分入力欄１１６Ｃが表示されている。

【0058】

このほか、キーワードの追加により判断精度をカスタマイズするためのキーワード入力欄１１８、指定された権利者が保有する知的財産権の登録番号を一括で取得するための権利者情報入力欄１２０、登録公報を直接入力するための登録公報入力欄１２２が表示されている。これらの入力欄に１１８～１２２については、後述する。

【0059】

生成手段４２は、他の知的財産の権利を示すデータ（登録時の公報など）を加工した学習データを機械学習して、モデルを生成するものである。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。具体的には、色々な知的財産権の登録時の公報の画像に丸付などをした画像の学習データ１８を、数十～数万個用意して、その学習データ１８を機械学習してモデル２０を生成する。丸付は、例えば、どのような分野のどのような内容か、を認識するために、分野を示す分野情報と、内容を示す内容情報の両方に行う。

【0060】

学習データ１８は、例えば、特許権については、図５(A)の学習データ１８Ａに示すように、分野を示す分野情報として、ＩＰＣ分類、ＦＩ、Ｆタームなどに囲み線Ｃで丸付けを行ったものと、図６の学習データ１８Ａに示すように、内容を示す内容情報として、請求の範囲の独立項のキーワード、従属項のキーワードなどに囲み線Ｃで丸付けを行ったものが利用される。文字商標についても同様である。生成手段４２は、特許や実用新案については、ＩＰＣ分類を学習データ１８Ａに紐づけて機械学習し、文字商標については区分を学習データに紐づけて機械学習する。また、特許や文字商標の、丸付けして抜き出したキーワードとその類語もまとめて機械学習してもよい。

【0061】

また、意匠権については、図５(B)の学習データ１８Ｂに示すように、分野を示す分野情報として、意匠分類や意匠に係る物品などの囲み線Ｃで丸付けを行ったものと、図７の学習データ１８Ｂに示すように、内容を示す内容情報として、画像全体、および画像中の特徴ある図形部分を囲み線Ｃ１、Ｃ２で丸付けしてものが利用される。囲み線Ｃ１、Ｃ２で抜き出した図形（特徴点）と、それに似た図形（似た特徴点）もまとめて機械学習してもよい。図形商標や、図形と文字が結合した結合商標のうちの図形部分についても、同様に丸付けが行われた部分と、その部分に似た特徴点をまとめて機械学習してもよい。生成手段４２は、意匠の分類を学習データ１８Ｂに紐づけて機械学習してもよいし、商標の区分を商標権の学習データに紐づけて機械学習してもよい。

【0062】

なお、図５～図７に示す丸付けは一例であり、権利範囲を示す画像の特徴部分（キーワードや図形などの特徴点）をハイライトで示したり、色分けによって他の部分と分けるようにしてもよい。むろん、これらの加工例も一例であり、これらを組み合わせてもよいし、同様の効果を奏する範囲内で、適宜変更してよい。

【0063】

以上のような学習データ１８を機械学習すると、その学習データ１８にカスタマイズされたモデル２０が生成される。すなわち、公報のどの箇所に分野情報があって、どのような文字が記載されているか、どの箇所に内容情報があって、どのような文字または図形なのか、などが学習されたモデル２０が生成される。生成されたモデル２０は、ストレージ１６に記憶される。

【0064】

前記解析手段４０は、前記生成されたモデル２０を利用して、対象となる知的財産の権利を示す権利情報を解析してもよい。例えば、モデル２０に、対象となる知的財産の権利を示す権利情報の画像（ユーザ８０が保有する知的財産権の権利情報を表す画像）を入力し、権利情報からどの部分を抜き出すかを解析する。抜き出す部分は、例えば、キーワードや図形などの特徴部分である。

【0065】

判断手段４３は、前記解析手段４０の解析の結果から、検索するために必要な文字または画像を判断するものである。具体的には、検索エンジンで、文字検索または画像検索をするために、検索に必要な文字または画像がどれなのかを判断する。検索に必要な文字または画像とは、例えば、分野情報は文字を判断し、内容情報は文字または図形を判断することになる。具体的には、特許の独立項に記載されている文字や、意匠の実線と破線の画像などを判断する。判断結果２４は、ストレージ１６に記憶される。判断した文字または画像を変更（選定、追加、削除など）してもよい。例えば、判断した文字または画像を、ユーザに変更（選定、追加、削除など）させてもよい。変更した結果を、ストレージ１６に記憶してもよい。

【0066】

検索手段４４は、前記判断手段４３によって判断した文字または画像を用いて、検索エンジンで検索を行うものである。検索結果２６は、ストレージ１６に記憶される。例えば、ユーザによって変更された文字または画像を用いて、検索エンジンで検索してもよいし、この結果を検索結果２６として、ストレージ１６に保存してもよい。

【0067】

抽出手段４６は、前記検索手段４４による検索の結果から、対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出するものである。具体的には、検索結果に表示されたＷｅｂページ／動画／画像などのコンテンツの中から侵害情報を抽出する。なお、これらのコンテンツを解析して侵害情報を抽出してもよいし、解析せずにランダムに抽出してもよいし、解析せずに全てを抽出してもよい。例えば、解析の精度が高い場合には、Ｗｅｂページ／動画／画像などのコンテンツを解析して侵害情報を抽出すると、最終的な強化学習後の抽出の精度がより高くなることが期待できる。抽出した侵害情報２８は、ストレージ１６に記憶される。

【0068】

なお、検索エンジンで検索した場合、例えば、学術論文や権利者自身の商品販売サイトなどの侵害情報とはならないノイズを拾ってしまうことがある。そこで、抽出手段４６は、フィルタ機能を備えている。

【0069】

例えば、キーワードでノイズ除去する場合、検索エンジンによって検索すると、検索一覧ページではページタイトルが表示されるので、そのページタイトルから、学術系、販売系のキーワードが含まれていれば排除して、ノイズ除去を行う。

【0070】

または、除外するＵＲＬリストを作成し、そのリスト内のＵＲＬに該当する場合には、抽出する侵害情報から除外してもよい。むろん、他の手法によるノイズ除去を行うことを妨げるものではない。

【0071】

図１１は、抽出した複数の侵害情報１３２～１４０のうち、ユーザ８０が侵害情報１３６を選択した場合に、画面１５０に侵害情報１３６の詳細が示される様子を示す。画面１５０には、侵害情報ページのＵＲＬ１５２、侵害情報ページ１５４、文章１５６、当該文章１５６中の侵害の根拠となる部分を、アンダーライン、太字、ハイライトなどで表した根拠部分１５８、いいねボタン１６０、悪いねボタン１６２が表示されている。あくまで一例であって、図１１の通りに配置されていなくても構わない。例えば、いいねボタン１６０、悪いねボタン１６２は、図１１左側の侵害情報の一覧に配置されてもよい。例えば、示される侵害情報１３６がダウンロードされた情報である場合は、侵害情報ページのＵＲＬ１５２は示さなくてもよい。

【0072】

類語特定手段４８は、判断手段４３によって判断した文字の類語を特定するものであって、検索手段４４は、特定された類語を用いて検索エンジンで検索してもよい。類語の特定には、例えば、図８に示す類語辞典３０Ａが参照される。

【0073】

次に、翻訳手段４９は、前記判断手段４３によって判断した文字を、他の言語に翻訳するものである。この場合、前記検索手段４４は、前記他の言語に翻訳された文字を用いて、検索エンジンで検索する。翻訳手段４９による翻訳は、例えば、図９に示す辞書３０Ｂを参照して行われる。

【0074】

また、翻訳手段４９による翻訳は、前記類語特定手段４８によって特定した類語に対応してもよい。例えば、日本語の辞書を参照して日本語の類語全てを特定してから、外国語（例えば、中国語等）に翻訳してもよいし、逆に、翻訳手段４９によって、例えば、中国語に翻訳してから、中国語の辞書を参照して、中国語の類語全てを特定してもよい。

【0075】

次に、タスク管理手段５０は、前記抽出手段４６で抽出した侵害情報２８に対するタスクを管理するものである。例えば、抽出した侵害情報２８に対する、権利行使／訴訟／ライセンス交渉などのタスク（及びタスクの進捗状況）を管理する機能である。他社の模倣を発見したら、その後の工程では、権利行使／訴訟／ライセンス交渉などのタスクを行うことになるため、タスク管理手段５０によってタスク管理を行うことにより利便性を高める。タスク管理手段５０によるタスクの管理は、例えば、訴訟業務代理の会社などと共有してタスク管理するようにしてもよい。

【0076】

次に、通知手段５１は、前記抽出手段４６が定期的（例えば、毎日１回／週１回／隔週１回／月１回など）に侵害情報を抽出し、今回抽出した侵害情報が、前回抽出した侵害情報から変更がある場合に、抽出の結果に変更があることをユーザ８０に通知するものである。侵害情報の変更とは、例えば、前回の抽出では５個の侵害情報が抽出され、今回の抽出では７個の侵害情報が抽出した場合などである。なお、定期的に抽出していても抽出結果に変更があるケースとしては、抽出の精度が高くなり、これまで抽出できていなかった侵害情報を抽出できるようになった場合や、新しい侵害情報を誰かがインターネット上に掲載したために抽出した場合などがある。なお、ユーザ８０側へ通知される情報には、単に侵害情報に変更があったことのみならず、変更のあった侵害情報へアクセスする手段を含んでもよい。このように定期的に判断して変化があれば通知することで、監視通知機能を持たせることができる。ユーザ８０側が把握している侵害情報をアップデートするのに役立つ。

【0077】

ダウンロード手段５２は、前記抽出手段４６によって抽出した侵害情報をダウンロードするものである。保存手段５４は、ダウンロード手段５２によってダウンロードした内容と日時とを紐づけて、ストレージ１６に侵害情報２８として自動的に保存するものである。また、抽出した全ての侵害情報をダウンロードするとストレージコストが膨大になるため、例えば保存ボタンを設置して、ユーザ８０が保存ボタンを押した侵害情報だけを保存して、保存ボタンが押されなかった侵害情報は一定期間後に破棄してもよい。逆に、抽出した侵害情報のＵＲＬだけをユーザ８０に提供して、ユーザ８０が保存ボタンを押した侵害情報だけをダウンロードして保存してもよい。

【0078】

グループ作成手段５６は、所定のメンバーからなるグループを作成するものである。例えば、ユーザ端末８２の表示部９２に、グループのメンバーを指定するための画面を表示させ、当該画面に入力された所定のメンバーごとに、グループ情報３２としてストレージ１６に記憶する。グループは、例えば、企業の企画経営部、知的財産部、〇〇チームや、社外の専門家など、所定のメンバーで構成されるものであるが、これに限定されない。また、作成したグループ内で、侵害情報についてチャット可能なチャットルームも作成できる。

【0079】

共有手段５８は、グループ作成手段５６で作成されたグループ内で、抽出した侵害情報２６を共有するものである。これにより、部内共有、チーム共有、社外の専門家との共有などが可能となり、侵害情報２８を効率的に供給することができる。

【0080】

権利者情報取得手段６０は、ユーザ８０から対象となる知的財産の権利者の情報を取得するものである。例えば、ユーザ８０から権利情報を取得するための画面１１０に表示された権利者情報入力欄１２０に入力された権利者情報をネットワークを介して取得する。また、ユーザ８０によって入力された登録番号から、対象となる知的財産の権利者の情報を取得してもよい。

【0081】

そして、前記解析手段４０は、取得した権利者が保有する知的財産を示す権利情報を一括で解析する。その権利者が保有する知的財産を示す権利情報を一括で解析するため、１つ１つ登録番号を入力する手間を省くことができる。具体的には、知的財産権の種類と登録番号によって特定される権利の登録公報などから権利情報を解析する。解析においては、必要に応じて前記モデル２０を使用してもよい。生成されたモデル２０に、解析した権利情報の画像などを入力すると、解析手段４０が、どのキーワードを抜き出すか、あるいは、どの図形や特徴点を抜き出すかを一括で解析し、検索手段４４が、解析結果にもとづいて、既知の検索エンジンを利用して検索し、抽出手段４６が、検索結果から、取得した権利者が保有する知的財産権を侵害している可能性のある侵害情報を一括で抽出する。

【0082】

次に、根拠特定手段６２は、前記抽出手段４６によって抽出した侵害情報のどの部分に、侵害の根拠があるかを特定するものである。例えば、図１１に示す画面１３０において、ユーザ８０が、侵害情報１３６を選択すると、図１１の右側に示す画面１５０のように、侵害情報１３６のＵＲＬ１５２と、侵害情報ページ１５４と、侵害情報ページ１５４に記載された文章１５６が表示される。根拠特定手段６２は、例えば、前記文章１５６中の侵害の根拠となる部分を、アンダーライン、太字、ハイライトなどで表して根拠部分１５８を明示する。

【0083】

キーワード受付手段６４は、ユーザ８０からキーワードの指定を受け付けるものである。例えば、図１０に示すように、ユーザ８０から権利情報を取得するための画面１１０に表示されたキーワード入力欄１１８に、ユーザ８０が、ユーザ端末８２を用いて入力したキーワードの指定を受け付ける。指定されたキーワードは、前記抽出手段４６が侵害情報を抽出する際に、キーワードを反映して抽出するように用いられる。キーワードを追加することにより、判断精度をカスタマイズすることができる。また、前記判断手段４３が判断した文字を、変更したり追加したりすることもできる。例えば、検索結果の中から、指定されたキーワードが記載されているコンテンツを抽出することができる。

【0084】

管理手段６６は、抽出手段４６で抽出した侵害情報のＵＲＬを管理するものである。出力手段６８は、管理手段６６によって管理された複数のＵＲＬを一覧にしたレポートを出力するものである。例えば、抽出した全ての侵害情報のＵＲＬを一覧にすると膨大になるので、所定の期間を設定して、その期間中に抽出した侵害情報のＵＲＬを一覧にしたレポートを出力してもよい。出力するレポートのファイル形式は、ＣＳＶ形式やＰＤＦ形式が好ましいが、他のファイル形式を妨げるものではない。

【0085】

算出手段７０は、前記抽出手段４６によって抽出した侵害情報２８の侵害可能性を算出するものである。侵害可能性の算出は、例えば、特許権や実用新案権であれば、同じキーワードを含む個数が多いほど侵害可能性が高く、同じキーワードを含む個数が少ないほど侵害可能性が低いと算出する。例えば、図形の意匠権や商標権であれば、図形の特徴点が似ている度合いが高いほど侵害可能性が高く、図形の特徴点が似ている度合いが低いほど侵害可能性が低いと算出する。このような侵害可能性の算出結果は、例えば、パーセンテージで示されてもよい。

【0086】

並替手段７２は、判断手段７０で算出した侵害可能性の高い順に、抽出した侵害情報２６を並び替えるものである。例えば、図１１の左側の画面１３０であれば、侵害情報１３２が最も侵害可能性が高く、最上段に表示され、侵害情報１３４以降になるほど侵害可能性が低くなるという具合である。このような並び替えにより、ユーザ８０は、侵害可能性の高い侵害情報から順に詳細を確認することができる。

【0087】

ユーザに会員登録させて、ユーザから指定された特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析してもよい。例えば、会員登録されたユーザから、対象となる知的財産権の登録番号を指定して貰って、その登録番号の特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析する。

【0088】

抽出した侵害情報のうち、指定された侵害情報をブックマークに登録して、ブックマークに登録した侵害情報を、一覧で表示してもよい。例えば、抽出した侵害情報をユーザが閲覧して気になった侵害情報をブックマークに登録することができ、ブックマークに登録した侵害情報を一覧で表示する。また、ブックマークに登録した侵害情報の一覧を、ファイル出力できるようにしてもよい。また、対象となる知的財産の権利ごとに、ブックマークの一覧を整理して表示してもよい。また、ブックマークの一覧に表示した侵害情報に対して、ユーザからのメモを記録することもできる。また、ブックマークの一覧に表示した侵害情報に対して、グループで共有することもできる。

【0089】

抽出するスケジュールを設定して、その設定されたスケジュールに基づいて、判断した文字または画像を用いて、検索エンジンで検索してもよい。例えば、検索する文字や画像によっては、毎日検索、週１回検索、または月１回検索など、検索のスケジュールを設定したい場合がある。対象となる同じ知的財産権に対して複数の文字や画像のパターンで検索するために、複数の文字や画像のパターンごとに抽出するスケジュールを設定することができる。例えば、同じ登録番号の知的財産権に対して、複数の検索パターンを用意して、その検索パターンごとに抽出するスケジュールを設定することができる。

【0090】

判断した文字または画像の変更を受け付けて、変更した文字または画像を用いて、検索エンジンで検索してもよい。判断した文字または画像を変更（選定、追加、削除など）できる。例えば、判断した文字または画像を、ユーザに変更（選定、追加、削除など）させてもよい。ユーザによって変更された文字または画像を用いて、検索エンジンで検索できる。

【0091】

＜ユーザ端末の構成＞・・・図４は、本実施形態のユーザ端末８２の構成を示すブロック図である。ユーザ端末８２は、例えば、プロセッサ８４、メモリ８６、ストレージ８８、入力部９０、表示部９２、通信部９４を備え、これらは図示しないバスにより接続されている。プロセッサ８４は、例えば、ＣＰＵ（Central Processing Unit）により構成され、メモリ８６に記憶された各種プログラムを読み出して実行することで、各種処理を行う。

【0092】

前記メモリ８６は、プロセッサ８４により実行されるプログラムを記憶するものであり、例えば、ＲＯＭ（Read Only Memory）やＲＡＭ（Random Access Memory）により構成される。ストレージ８８は、例えば、侵害情報抽出サーバ１０から取得した情報や、図示しない制御プログラムなどを記憶するものである。入力部９０は、キーボードやタッチパネルがあるが、これに限定されない。表示部９２は、ディスプレイやタッチパネルである。通信部９４は、ネットワークを介して、侵害情報抽出サーバ１０と各種データ通信を行うものである。むろん、必要に応じて、他の外部装置とデータ通信を行うようにしてもよい。

【0093】

このようなユーザ端末８２としては、スマートフォンやパソコン、タブレットなどが利用されるが、これに限定されるものではない。また、ユーザ８０ごとに異なる種類のユーザ端末８２を用いてもよい。

【0094】

なお、上述した各種手段は、本実施形態では、侵害情報抽出サーバ１０に備えることとしたが、全部または一部をユーザ端末８２や、クラウド上の他の端末やサーバに設けるようにしてもよい。

【0095】

＜侵害情報抽出処理＞・・・次に、侵害情報抽出システム１００による侵害情報抽出処理の一例について、図１２も参照して説明する。図１２は、本実施形態の侵害情報抽出処理の一例を示すフローチャートである。

【0096】

まず、侵害情報抽出サーバ１０の解析手段４０は、対象となる知的財産の権利を示す権利情報を解析する（ステップＳ２０）。対象となる知的財産の権利を示す権利情報（登録番号、登録時の公報など）は、ユーザ８０がユーザ端末８２によって入力した内容から取得する。例えば、ユーザ８０によって入力された登録番号によって権利情報を取得してもよいし、ユーザ８０によって入力された内容をそのままを権利情報として取得してもよい（例えば、ユーザ８０によって入力された特許請求の範囲など）。この解析は、公報に何が記載されているかを把握するために行うものである。例えば、登録時の公報を画像キャプチャして画像解析してもよいし、登録時の公報を文字としてテキストマイニングしてもよい。また、知的財産の権利を示す権利情報を含んだテキストデータを取得して解析しても構わない。知的財産の権利を示す権利情報を含むテキストデータの場合は、そのテキストデータの内、知的財産の権利を示す権利情報がどこにあるかを解析する。

【0097】

【0098】

このほか、キーワードの追加により判断精度をカスタマイズするためのキーワード入力欄１１８、指定された権利者が保有する知的財産権の登録番号を一括で取得するための権利者情報入力欄１２０、登録公報を直接入力するための登録公報入力欄１２２が表示されている。ユーザ８０が、前記画面１１０において、所望の情報を入力ないし選択することで、侵害情報抽出サーバ１０は、ユーザ８０から入力された対象となる知的財産の権利を示す権利情報を取得することができる。

【0099】

なお、解析手段４０による解析にあたり、侵害情報抽出サーバ１０は、必要に応じて、生成手段４２によって、他の知的財産の権利を示すデータ（登録時の公報など）を加工した学習データを機械学習して、モデル２０を生成しておいてもよい。具体的には、色々な知的財産権（特許権、実用新案権、意匠権、商標権）の権利情報を示す画像の特徴部分（キーワードや図形の特徴点など）に丸付けをして加工した学習データ１８を、数十～数万個用意して、その学習データ１８を機械学習してモデル２０を生成する。丸付は、例えば、どのような分野のどのような内容か、を認識するために、分野を示す情報と、内容を示す情報の両方に行う。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。

【0100】

【0101】

【0102】

【0103】

以上のような学習データを機械学習すると、その学習データにカスタマイズされたモデルが生成される。すなわち、公報のどの箇所に分野情報があって、どのような文字が記載されているか、どの箇所に内容情報があって、どのような文字または図形なのか、などが学習されたモデル２０が生成される。前記解析手段４０は、生成したモデル２０に、対象となる知的財産の権利を示す画像（権利情報）を入力し、権利情報からどの部分（キーワードや図形の特徴点など）を抜き出すかを解析する。

【0104】

次に、侵害情報抽出サーバ１０の判断手段４３は、前記解析手段４０の解析の結果から、検索するために必要な文字または画像を判断する（ステップＳ２２）。具体的には、検索エンジンで、文字検索または画像検索をするために、検索に必要な文字または画像がどれなのかを判断する。検索に必要な文字または画像とは、例えば、分野情報は文字を判断し、内容情報は文字または図形を判断することになる。具体的には、分野情報であれば、特許のＩＰＣ分類の文字や、商標の商品・役務の区分などの文字を判断する。内容情報であれば、特許の独立項に記載されている文字や、意匠の実線と破線の画像などを判断する。判断した文字または画像を変更（選定、追加、削除など）してもよい。例えば、判断した文字または画像を、ユーザに変更（選定、追加、削除など）させてもよい。

【0105】

次に、侵害情報抽出サーバ１０の検索手段４４は、前記判断した文字または画像を用いて、検索エンジンで検索を行う（ステップＳ２４）。前記ステップＳ２２で判断した文字または画像を使って、既知の検索エンジンで、文字検索や画像検索を行う。例えば、ユーザによって変更された文字または画像を用いて、検索エンジンで検索してもよい。

【0106】

このとき、類語特定手段４８によって、判断手段４３によって判断した文字の類語を特定し、検索手段４４は、特定された類語を用いて検索エンジンで検索してもよい。類語の特定には、例えば、図８に示す類語辞典３０Ａが参照される。

【0107】

また、前記判断手段４３によって判断した文字を、翻訳手段４９によって他の言語に翻訳し、前記検索手段４４は、前記他の言語に翻訳された文字を用いて、検索エンジンで検索してもよい。翻訳手段４９による翻訳は、例えば、図９に示す辞書３０Ｂを参照して行われる。

【0108】

なお、翻訳手段４９による翻訳は、前記類語特定手段４８によって特定した類語に対応してもよい。例えば、日本語の辞書を参照して日本語の類語全てを特定してから、外国語（例えば、中国語等）に翻訳してもよいし、逆に、翻訳手段４９によって、例えば、中国語に翻訳してから、中国語の辞書を参照して、中国語の類語全てを特定してもよい。

【0109】

そして、侵害情報抽出サーバ１０の抽出手段４６は、前記検索の結果から、前記対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する（ステップＳ２６）。具体的には、検索結果に表示されたＷｅｂページ／動画／画像などのコンテンツの中から侵害情報を抽出する。なお、これらのコンテンツを解析して侵害情報を抽出してもよいし、解析せずにランダムに抽出してもよいし、解析せずに全てを抽出してもよい。。例えば、解析の精度が高い場合には、Ｗｅｂページ／動画／画像などのコンテンツを解析して侵害情報を抽出すると、最終的な強化学習後の抽出の精度がより高くなることが期待できる。

【0110】

検索エンジンで検索した場合、例えば、学術論文や権利者自身の商品販売サイトなどの侵害情報とはならないノイズを拾ってしまうことがある。そこで、抽出手段４６が備えるフィルタ機能により、ノイズが除去される。

【0111】

例えば、キーワードでノイズ除去する場合、検索エンジンによって検索すると、検索一覧ページではページタイトルが表示されるので、そのページタイトルから、学術系、販売系のキーワードが含まれていれば排除して、ノイズ除去を行う。または、除外するＵＲＬリストを作成し、そのリスト内のＵＲＬに該当する場合には、抽出する侵害情報から除外してもよい。むろん、他の手法によるノイズ除去を行うことを妨げるものではない。

【0112】

侵害情報抽出サーバ１０の管理手段６６は、抽出手段４６で抽出した侵害情報のＵＲＬを管理し、出力手段６８が、前記管理手段６６によって管理された複数のＵＲＬを一覧にしたレポートを出力する。出力するレポートのファイル形式は、ＣＳＶ形式やＰＤＦ形式が好ましいが、他のファイル形式を妨げるものではない。

【0113】

このとき、抽出した侵害情報全てを表示すると件数が多い場合には、並替手段７２によって、算出手段７０で算出された侵害可能性の高い順に、抽出した侵害情報２６を並び替え、侵害の可能性が高いベスト１０だけをユーザ端末８２の表示部９２に表示してもよい。また、前記出力手段６８は、抽出した侵害情報全件のＵＲＬの一覧をＣＳＶ形式やＰＤＦ形式などで出力してもよい。

【0114】

そして、図１１の画面１３０に示すように、表示された複数の侵害情報から、ユーザ８０によって選択された侵害情報１３６の詳細を、図１１の画面１５０に示すように表示してもよい。

【0115】

ここで、根拠特定手段６２によって、抽出手段４６によって抽出した侵害情報のどの部分に、侵害の根拠があるかを具体的に特定してもよい。例えば、図１１に示す画面１３０において、ユーザ８０が、侵害情報１３６を選択すると、図１１の右側に示す画面１５０のように、侵害情報１３６のＵＲＬ１５２と、侵害情報ページ１５４と、侵害情報ページ１５４に記載された文章１５６が表示される。根拠特定手段６２は、例えば、前記文章１５６中の侵害の根拠となる部分を、アンダーライン、太字、ハイライトなどで表して根拠部分１５８を明示する。

【0116】

本実施形態では、通知手段６０は、前記抽出手段４６が定期的（例えば、毎日１回／週１回／隔週１回／月１回など）に侵害情報を抽出し、今回抽出した侵害情報が、前回抽出した侵害情報から変更がある場合に、抽出の結果に変更があることを通知する（ステップＳ３８でＹｅｓ、ステップＳ４０）。侵害情報の変更とは、例えば、前回の抽出では５個の侵害情報が抽出され、今回の抽出では７個の侵害情報が抽出した場合などである。なお、定期的に抽出していても抽出結果に変更があるケースとしては、抽出の精度が高くなり、これまで抽出できていなかった侵害情報を抽出できるようになった場合や、新しい侵害情報を誰かがインターネット上に掲載したために抽出した場合などがある。なお、ユーザ８０側へ通知される情報には、単に侵害情報に変更があったことのみならず、変更のあった侵害情報へアクセスする手段を含んでもよい。このように定期的に判断して変化があれば通知することで、監視通知機能を持たせることができる。ユーザ８０側が把握している侵害情報をアップデートするのに役立つ。

【0117】

また、本実施形態では、タスク管理手段５０は、前記抽出手段４６で抽出した侵害情報２８に対するタスクを管理を行う（ステップＳ３０）。例えば、抽出した侵害情報２８に対する、権利行使／訴訟／ライセンス交渉などのタスクを管理する。他社の模倣を発見したら、その後の工程では、権利行使／訴訟／ライセンス交渉などのタスクを行うことになるため、タスク管理手段５０によってタスク管理を行うことにより利便性を高める。タスク管理手段５０によるタスクの管理は、例えば、訴訟業務代理の会社などと共有してタスク管理するようにしてもよい。

【0118】

更に、本実施形態では、ダウンロード手段５２が、抽出手段４６によって抽出した侵害情報２８をダウンロード（ステップＳ３２）し、保存手段５４によって、ダウンロードした内容と日時とを紐づけて、ストレージ１６に侵害情報２８として自動的に保存することもできる（ステップＳ３４）。ネットワーク上の情報は保存しないとすぐに消されてしまうことがあるが、本実施形態によれば、自動的にダウンロードして保存するため、ネットワーク上から侵害情報が消されたとしても、証拠を残すことができる。また、抽出した全ての侵害情報をダウンロードするとストレージコストが膨大になるため、例えば保存ボタンを設置して、ユーザ８０が保存ボタンを押した侵害情報だけを保存して、保存ボタンが押されなかった侵害情報は一定期間後に破棄してもよい。逆に、抽出した侵害情報のＵＲＬだけをユーザ８０に提供して、ユーザ８０が保存ボタンを押した侵害情報だけをダウンロードして保存してもよい。

【0119】

なお、本実施形態において、侵害情報抽出サーバ１０のグループ作成手段５６により、所定のメンバーからなるグループを作成してもよい。例えば、ユーザ端末８２の表示部９２に、グループのメンバーを指定するための画面を表示させ、当該画面に入力された所定のメンバーごとに、グループ情報３２としてストレージ１６に記憶する。グループは、例えば、企業の企画経営部、知的財産部、〇〇チームや、社外の専門家など、所定のメンバーで構成されるものであるが、これに限定されない。また、作成したグループ内で、侵害情報についてチャット可能なチャットルームも作成できる。

【0120】

共有手段５８は、グループ作成手段５６で作成されたグループ内で、前記ステップＳ２６で抽出した侵害情報２８を共有する。これにより、部内共有、チーム共有、社外の専門家との共有などが可能となり、侵害情報２８を効率的に供給することができる。

【0121】

また、本実施形態において、侵害情報抽出サーバ１０のキーワード受付手段６４によって、ユーザ８０からキーワードの指定を受け付けてもよい。例えば、図１０に示すように、ユーザ８０から権利情報を取得するための画面１１０に表示されたキーワード入力欄１１８に入力されたキーワードの指定を受け付ける。指定されたキーワードは、前記抽出手段４６が侵害情報を抽出する際に、キーワードを反映して抽出するように用いられる。キーワードを追加することにより、判断精度をカスタマイズすることができる。また、前記判断手段４３が判断した文字を、変更したり追加したりすることもできる。例えば、検索結果の中から、指定されたキーワードが記載されているコンテンツを抽出することができる。

【0122】

更に、本実施形態において、権利者情報取得手段６０によって、ユーザ８０から権利者の情報を取得してもよい。例えば、ユーザ８０から権利情報を取得するための画面１１０に表示された権利者情報入力欄１２０に入力された権利者情報をネットワークを介して取得してもよい。また、ユーザ８０によって入力された登録番号から、対象となる知的財産の権利者の情報を取得してもよい。

【0123】

そして、前記解析手段４０は、取得した権利者が保有する知的財産を示す権利情報を一括で解析する。その権利者が保有する知的財産を示す権利情報を一括で解析するため、１つ１つ登録番号を入力する手間を省くことができる。具体的には、知的財産権の種類と登録番号によって特定される権利の登録公報などから権利情報を解析する。そして、生成されたモデル２０に、解析した権利情報の画像などを入力すると、解析手段４０が、どのキーワードを抜き出すか、あるいは、どの図形や特徴点を抜き出すかを一括で解析し、検索手段４４が、解析結果にもとづいて、既知の検索エンジンを利用して検索し、抽出手段４６が、検索結果から、取得した権利者が保有する知的財産権を侵害している可能性のある侵害情報を一括で抽出する。

【0124】

なお、予めユーザ８０に会員登録をさせて、ユーザ端末８２から指定された特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析してもよい。例えば、会員登録されたユーザから、対象となる知的財産権の登録番号を指定して貰って、その登録番号の特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析する。

【0125】

さらに、抽出した侵害情報のうち、指定された侵害情報をブックマークに登録して、ブックマークに登録した侵害情報を、一覧でユーザ端末８２等に表示してもよい。例えば、抽出した侵害情報のうちユーザが閲覧して気になった侵害情報をブックマークに登録することができ、ブックマークに登録した侵害情報を一覧で表示する。また、ブックマークに登録した侵害情報の一覧を、ユーザ端末８２等でファイル出力できるようにしてもよい。また、対象となる知的財産の権利ごとに、ブックマークの一覧を整理して表示してもよい。また、ブックマークの一覧に表示した侵害情報に対して、ユーザからのメモを記録することもできる。また、ブックマークの一覧に表示した侵害情報に対して、グループで共有することもできる。

【0126】

加えて、抽出する日時や期間である「スケジュール」を設定して、その設定されたスケジュールに基づいて、判断した文字または画像を用いて、検索エンジンで定期的に検索してもよい。例えば、検索する文字や画像によっては、毎日検索、週１回検索、または月１回検索など、検索のスケジュールを設定したい場合がある。対象となる同じ知的財産権に対して複数の文字や画像のパターンで検索するために、複数の文字や画像のパターンごとに抽出するスケジュールを設定することができる。例えば、同じ登録番号の知的財産権に対して、複数の検索パターンを用意して、その検索パターンごとに抽出するスケジュールを設定することができる。

【0127】

また、判断手段４３が判断した文字または画像の変更を受け付けて、変更した文字または画像を用いて、検索エンジンで検索してもよい。すなわち、一度判断した文字または画像を後から変更（選定、追加、削除など）できる。例えば、判断した文字または画像を、ユーザ端末８２を介して、ユーザに変更（選定、追加、削除など）させてもよい。ユーザによって変更された文字または画像を用いて、検索エンジンで検索できる。

【0128】

＜効果＞・・・以上説明した実施形態によれば、侵害情報抽出システム１００は、対象となる知的財産の権利を示す権利情報を解析して、解析の結果から、検索するために必要な文字または画像を判断して、判断した文字または画像を用いて検索エンジンで検索して、検索の結果から対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出するため、自動で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出できるという効果がある。

【0129】

なお、上述した実施形態は一例であり、同様の効果を奏する範囲内で適宜変更が可能である。また、侵害情報抽出サーバ１０は、単体のコンピュータであってもよく、例えば、端末であってもよい。また、上述した機能構成が、それぞれ異なるコンピュータで実行されるコンピュータシステム（クラウド）であってもよい。更に、本実施形態では、多くの処理を侵害情報抽出サーバ１０で実行することとしたが、その機能の全部または一部を、ユーザ端末８２で実行するようにしてもよい。

【0130】

また、上述した手段、機能は、コンピュータ（ＣＰＵ、情報処理装置、各種端末を含む）が、所定のプログラムを読み込んで、実行することによって実現される。プログラムは、例えば、単数又は複数のコンピュータからネットワーク経由で提供される（クラウドサービス、ＳａａＳ：ソフトウェア・アズ・ア・サービス）形態で提供される。また、プログラムは、例えば、コンピュータ読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体からプログラムを読み取って内部記録装置又は外部記録装置に転送し記録して実行する。

【0131】

更に、本発明は、方法またはプログラムの発明として提供されてもよい。また、そのプログラムを、例えば、磁気ディスク、光ディスク、光磁気ディスクなどの記録装置（記録媒体）に予め記録しておき、その記録装置から通信回線を介してコンピュータに提供するようにしてもよい。

【産業上の利用可能性】

【0132】

本発明によれば、対象となる知的財産の権利を示す権利情報を解析して、解析の結果から、検索するために必要な文字または画像を判断して、判断した文字または画像を用いて検索エンジンで検索して、検索の結果から対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出することとした。

【0133】

このように、自動で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出できるため、侵害情報抽出システムの用途に適用できる。

【符号の説明】

【0134】

１０：侵害情報抽出サーバ
１２：プロセッサ
１４：メモリ
１６：ストレージ
１８、１８Ａ、１８Ｂ：学習データ
２０：モデル
２２：権利情報
２４：判断結果
２６：検索結果
２８：侵害情報
３０、３０Ａ、３０Ｂ：辞書
３２：グループ情報
３４：通信部
４０：解析手段
４２：生成手段
４３：判断手段
４４：検索手段
４６：抽出手段
４８：類語特定手段
４９：翻訳手段
５０：タスク管理手段
５１：通知手段
５２：ダウンロード手段
５４：保存手段
５６：グループ作成手段
５８：共有手段
６０：権利者情報取得手段
６２：根拠特定手段
６４：キーワード受付手段
６６：管理手段
６８：出力手段
７０：算出手段
７２：並替手段
８０：ユーザ
８２：ユーザ端末
８４：プロセッサ
８６：メモリ
８８：ストレージ
９０：入力部
９２：表示部
９４：通信部
１００：侵害情報抽出システム
１１０：画面
１１２：プルダウンメニュー
１１４：登録番号入力欄
１１６Ａ：ＩＰＣ分類入力欄
１１６Ｂ：分類入力欄
１１６Ｃ：区分入力欄
１１８：キーワード入力欄
１２０：権利者情報入力欄
１２２：登録公報入力欄
１３０：画面
１３２、１３４、１３６、１４０：侵害情報
１５０：画面
１５２：ＵＲＬ
１５４：侵害情報ページ
１５６：根拠情報
１６０：いいねボタン
１６２：悪いねボタン
Ｃ、Ｃ１、Ｃ２：囲み線

【図1】