特許第6232607号(P6232607)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 白井 和之の特許一覧

特許6232607特許要件適否予測装置および特許要件適否予測プログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】6232607
(24)【登録日】2017年11月2日
(45)【発行日】2017年11月22日
(54)【発明の名称】特許要件適否予測装置および特許要件適否予測プログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20171113BHJP
   G06Q 50/18 20120101ALI20171113BHJP
【FI】
   G06F17/30 350C
   G06F17/30 220Z
   G06F17/30 170A
   G06Q50/18 310
【請求項の数】4
【全頁数】36
(21)【出願番号】特願2017-105667(P2017-105667)
(22)【出願日】2017年5月29日
【審査請求日】2017年6月30日
【早期審査対象出願】
(73)【特許権者】
【識別番号】316003173
【氏名又は名称】白井 和之
(74)【代理人】
【識別番号】100117558
【弁理士】
【氏名又は名称】白井 和之
(72)【発明者】
【氏名】白井 和之
【審査官】 山本 俊介
(56)【参考文献】
【文献】 特許第6123143(JP,B1)
【文献】 特開2009−238074(JP,A)
【文献】 特開2007−242005(JP,A)
【文献】 特開2000−148789(JP,A)
【文献】 特開2000−132569(JP,A)
【文献】 特開2003−141288(JP,A)
【文献】 米国特許出願公開第2017/0109848(US,A1)
【文献】 米国特許出願公開第2014/0324709(US,A1)
【文献】 米国特許出願公開第2015/0178272(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
先行技術調査の対象である調査対象発明の検索に用いられる検索文書を用いて、公開特許公報の電子データである公開公報データを検索し、該検索結果に応じて、前記調査対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記調査対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記調査対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段を有し、
前記進歩性予測処理部は、前記公開公報データによって特定される先行技術発明のうち、前記調査対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、
前記主引用発明検索部は、前記検索文書を用いて前記主引用発明を検索する主検索文書データを生成し、該主検索文書データを用いて前記公開公報データを対象とする概念検索を行い、該概念検索の結果、類似度の降順に該類似度が最も高い最類似文献を含む複数の類似文献を抽出し、かつ前記検索文書から生成される全文検索タームを用いた前記公開公報データを対象とする全文検索でヒットしたヒット文献に前記複数の類似文献と一致する類似ヒット文献があったときは、該類似ヒット文献のうちの前記類似度が最も高い最類似ヒット文献を前記主引用発明が開示されている主引用文献とし、
前記文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される発明移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、該発明移動ベクトルは、前記検索文書に応じた調査対象発明ベクトルと、前記最類似ヒット文献に応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測装置。
【請求項2】
先行技術調査の対象である調査対象発明の検索に用いられる検索文書を用いて、公開特許公報の電子データである公開公報データを検索し、該検索結果に応じて、前記調査対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記調査対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記調査対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段を有し、
前記進歩性予測処理部は、前記公開公報データによって特定される先行技術発明のうち、前記調査対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、
前記主引用発明検索部は、前記検索文書を用いて前記主引用発明を検索する主検索文書データを生成し、該主検索文書データを用いて前記公開公報データを対象とする概念検索を行い、該概念検索の結果、類似度の降順に該類似度が最も高い最類似文献を含む複数の類似文献を抽出し、かつ各該類似文献を前記主引用発明が開示されている主引用文献とし、
前記文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される発明移動ベクトルを進歩性の要件に適合しない可能性が極めて高いクラス、高いクラス、該進歩性の要件に適合するクラスのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、該発明移動ベクトルは、前記検索文書に応じた調査対象発明ベクトルと、各前記類似文献に応じた引用候補ベクトルそれぞれとの差分に応じた複数のベクトルであり、
前記特許要件適否予測処理手段は、前記文書分類部から出力される複数の前記要件適否文書ベクトルに応じて、前記調査対象発明について、前記進歩性の要件に適合しない可能性を示す非適合率を算出する非適合率算出部を更に有する特許要件適否予測装置。
【請求項3】
前記文書分類部は、前記訓練データとして、前記学習文書ベクトルが第1の学習文書ベクトルで前記教師ベクトルが新規性および進歩性の拒絶理由有りを示すベクトルとの組み合わせと、前記学習文書ベクトルが第2の学習文書ベクトルで前記教師ベクトルが進歩性の拒絶理由有りで新規性の拒絶理由無しを示すベクトルとの組み合わせと、前記学習文書ベクトルが第3の学習文書ベクトルで前記教師ベクトルが進歩性の拒絶理由無しを示すベクトルとの組み合わせが用いられ、
前記第1の学習文書ベクトルは、すでに公開されている公開済出願の中で拒絶理由通知が発行された出願であって、該拒絶理由通知で同じ文献を引用して新規性および進歩性無しの拒絶理由が指摘されていた新規性・進歩性拒絶出願の該拒絶理由が指摘されていた請求項に応じた文書ベクトルと、該拒絶理由で引用されていた前記文献である第1の主引用刊行物に応じた第1の引用文書ベクトルとの差分に応じた第1の移動文書ベクトルであり、
前記第2の学習文書ベクトルは、前記公開済出願の中で拒絶理由通知が発行された出願であって、該拒絶理由通知で新規性の拒絶理由は指摘されていないが進歩性の拒絶理由が指摘されていた進歩性拒絶出願の該拒絶理由が指摘されていた請求項に応じた文書ベクトルと、該拒絶理由で主たる刊行物として引用されていた第2の主引用刊行物に応じた第2の引用文書ベクトルとの差分に応じた第2の移動文書ベクトルであり、
前記第3の学習文書ベクトルは、前記公開済出願の中で拒絶理由通知が発行されずに特許査定が発行された拒絶無し出願または拒絶理由通知が発行された出願であって、該拒絶理由通知で進歩性の拒絶理由が指摘されていなかった進歩性拒絶無し出願の請求項1に応じた文書ベクトルと、前記拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる学習用最類似文献に応じた非引用文書ベクトルとの差分から求めた第3の移動文書ベクトルである請求項2記載の特許要件適否予測装置。
【請求項4】
コンピュータを特許要件適否予測装置として機能させるための特許要件適否予測プログラムであって、該コンピュータを
先行技術調査の対象である調査対象発明の検索に用いられる検索文書を用いて、公開特許公報の電子データである公開公報データを検索し、該検索結果に応じて、前記調査対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記調査対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記調査対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段として機能させ、
前記進歩性予測処理部が前記公開公報データによって特定される先行技術発明のうち、前記調査対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、
前記主引用発明検索部が前記検索文書を用いて前記主引用発明を検索する主検索文書データを生成し、該主検索文書データを用いて前記公開公報データを対象とする概念検索を行い、該概念検索の結果、類似度の降順に該類似度が最も高い最類似文献を含む複数の類似文献を抽出し、かつ前記検索文書から生成される全文検索タームを用いた前記公開公報データを対象とする全文検索でヒットしたヒット文献に前記複数の類似文献と一致する類似ヒット文献があったときは、該類似ヒット文献のうち前記類似度が最も高い最類似ヒット文献を前記主引用発明が開示されている主引用文献とし、
前記文書分類部が、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される発明移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、該発明移動ベクトルは、前記検索文書に応じた調査対象発明ベクトルと、前記最類似ヒット文献に応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、先行技術調査の対象である調査対象発明について、新規性、進歩性といった特許要件に適合しているか否かの適否を予測する特許要件適否予測装置および特許要件適否予測プログラムに関する。
【背景技術】
【0002】
従来、電力需要や株価の予測、商品の購買予測、不動産の将来価格の予測といった様々な場面で予測が行われ、そのための装置や方法も数多く提案されている。発明を特許出願して権利化する権利化業務に関しても、出願された発明に関する特許可能性(特許性、パテンタビリティともいう)を予測する技術が提案されている(例えば、特許文献1参照)。特許文献1には、次のような特許性予測装置が記載されている。この装置は、審査結果通知済の特許出願(既通知出願)を特許データベースから取得して、既通知出願の請求項についての情報量と、類似する先行出願の数を検出し、既通知出願を対象とする回帰分析を実行して、これらから算出した登録予見式にしたがい、審査結果未通知出願の特許性の予測値を算出する。
【0003】
また、従来、特許可能性の予測のほか、発明の特許性や発明の質、特許出願や特許権の価値を評価する装置や方法も提案されている(例えば、特許文献2,3,4,5,6参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−238074号公報
【特許文献2】特開2015−207194号公報
【特許文献3】特開2000−181966号公報
【特許文献4】特開2000−132606号公報
【特許文献5】特開2015−187883号公報
【特許文献6】特開2007−108803号公報
【特許文献7】特許第6123143号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記のとおり、従来技術によれば特許出願について特許可能性を予測することや特許権を評価することが可能である。
【0006】
しかし、前述の従来技術、例えば、特許文献1記載の特許性予測装置では、特許性の予測が、既通知出願の請求項についての情報量や、類似する先行出願数といった情報に基づき算出された登録予見式にしたがって行われる。この予測は、請求項の広狭、技術分野の疎密および特許性との間の統計的な相関関係に基づいて行われ、特許法や特許・実用新案審査基準に基づくものではなかった。そのため、特許文献1記載の特許性予測装置では、特許実務に沿った予測結果が得られないおそれが高いという課題があった。
【0007】
ところで、特許出願をしようとするときは、出願しようとする発明について先行技術調査を行うことが不可欠である。従来、先行技術調査の技術として、キーワードを用いて行う全文検索と、自然文で検索する概念検索とが知られており、それらを活用した複数の検索サービスが提供されている。
【0008】
しかし、従来技術では、先行技術調査の対象である調査対象発明と関連性のある先行技術文献がピックアップされるにとどまり、その先行技術文献に開示されている先行技術が、調査対象発明の特許要件具備を阻害する技術なのかどうかが明らかにされることはなかった。
【0009】
そのため、出願しようとする発明と先行技術調査で見つかった先行技術との相違を明確にしようとするにも、そのための手間や時間を従来の先行技術調査によって軽減することは困難であった。
【0010】
一方、特許要件の審査は、特許庁審査官が特許法や特許・実用新案審査基準に沿って行うものであるから(特許法47条)、特許要件を具備するように出願書類を準備するには、特許法や特許・実用新案審査基準の理解が不可欠であり、特に、特許法第29条第2項の要件(進歩性)を具備するように出願書類を準備するには、特許法や特許・実用新案審査基準の十分な理解と、より熟練した経験やスキルが求められる。そのため、特許要件を具備するように出願書類を準備することは、とても手間や時間のかかることである。
【0011】
この点、特許文献1記載の従来技術によって、発明の特許可能性が予測されるから、これを活用することによって、出願書類の準備に要する負担を軽減できるのではないかとも考えられる。
【0012】
しかし、特許文献1記載の従来技術では、予測結果が審査実務に適合していないおそれがあるから、そのような予測結果を活用しても、出願書類の準備負担の軽減が有効にならないおそれがある。従来、審査実務に適合した予測を行おうとする考えもあるが(特許文献7参照)、この従来技術では、類似度の最も高い文献が主たる引用発明を開示した文献とされていて、そうならない可能性(例えば、類似度が次に高い文献が主たる引用発明になる場合など)が考慮されていなかったため、予測の精度が高められないおそれがあった。
【0013】
したがって、特許要件を具備するような出願書類の準備負担の軽減が有効になるよう、調査対象発明に関して、特許要件の適否の予測が審査実務に適合した内容で行われ、しかも予測の精度が高められることが望まれていた。
【0014】
本発明は、上記課題を解決するためになされたもので、出願書類の準備負担軽減が有効になるように、調査対象発明について、審査実務に適合した内容の特許要件の適否に関する予測が行われ、しかも予測の精度が高められるようにした特許要件適否予測装置および特許要件適否予測プログラムを提供することを目的とする。
【課題を解決するための手段】
【0015】
上記課題を解決するため、本発明は、先行技術調査の対象である調査対象発明の検索に用いられる検索文書を用いて、公開特許公報の電子データである公開公報データを検索し、その検索結果に応じて、調査対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、調査対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて調査対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段を有し、進歩性予測処理部は、公開公報データによって特定される先行技術発明のうち、調査対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、主引用発明検索部は、検索文書を用いて主引用発明を検索する主検索文書データを生成し、その主検索文書データを用いて公開公報データを対象とする概念検索を行い、その概念検索の結果、類似度の降順にその類似度が最も高い最類似文献を含む複数の類似文献を抽出し、かつ検索文書から生成される全文検索タームを用いた公開公報データを対象とする全文検索でヒットしたヒット文献に複数の類似文献と一致する類似ヒット文献があったときは、その類似ヒット文献のうちの類似度が最も高い最類似ヒット文献を主引用発明が開示されている主引用文献とし、文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される発明移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、その発明移動ベクトルは、検索文書に応じた調査対象発明ベクトルと、最類似ヒット文献に応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測装置を特徴とする。
【0016】
また、本発明は、先行技術調査の対象である調査対象発明の検索に用いられる検索文書を用いて、公開特許公報の電子データである公開公報データを検索し、その検索結果に応じて、調査対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、調査対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて調査対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段を有し、進歩性予測処理部は、公開公報データによって特定される先行技術発明のうち、調査対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、主引用発明検索部は、検索文書を用いて主引用発明を検索する主検索文書データを生成し、その主検索文書データを用いて公開公報データを対象とする概念検索を行い、その概念検索の結果、類似度の降順にその類似度が最も高い最類似文献を含む複数の類似文献を抽出し、かつ各その類似文献を主引用発明が開示されている主引用文献とし、文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される発明移動ベクトルを進歩性の要件に適合しない可能性が極めて高いクラス、高いクラス、その進歩性の要件に適合するクラスのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、その発明移動ベクトルは、検索文書に応じた調査対象発明ベクトルと、各類似文献に応じた引用候補ベクトルそれぞれとの差分に応じた複数のベクトルであり、特許要件適否予測処理手段は、文書分類部から出力される複数の要件適否文書ベクトルに応じて、調査対象発明について、進歩性の要件に適合しない可能性を示す非適合率を算出する非適合率算出部を更に有する特許要件適否予測装置を提供する。
【0017】
上記特許要件適否予測装置の場合、文書分類部は、訓練データとして、学習文書ベクトルが第1の学習文書ベクトルで教師ベクトルが新規性および進歩性の拒絶理由有りを示すベクトルとの組み合わせと、学習文書ベクトルが第2の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りで新規性の拒絶理由無しを示すベクトルとの組み合わせと、学習文書ベクトルが第3の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトルとの組み合わせが用いられ、第1の学習文書ベクトルは、すでに公開されている公開済出願の中で拒絶理由通知が発行された出願であって、その拒絶理由通知で同じ文献を引用して新規性および進歩性無しの拒絶理由が指摘されていた新規性・進歩性拒絶出願のその拒絶理由が指摘されていた請求項に応じた文書ベクトルと、その拒絶理由で引用されていた文献である第1の主引用刊行物に応じた第1の引用文書ベクトルとの差分に応じた第1の移動文書ベクトルであり、第2の学習文書ベクトルは、公開済出願の中で拒絶理由通知が発行された出願であって、その拒絶理由通知で新規性の拒絶理由は指摘されていないが進歩性の拒絶理由が指摘されていた進歩性拒絶出願のその拒絶理由が指摘されていた請求項に応じた文書ベクトルと、その拒絶理由で主たる刊行物として引用されていた第2の主引用刊行物に応じた第2の引用文書ベクトルとの差分に応じた第2の移動文書ベクトルであり、第3の学習文書ベクトルは、公開済出願の中で拒絶理由通知が発行されずに特許査定が発行された拒絶無し出願または拒絶理由通知が発行された出願であって、その拒絶理由通知で進歩性の拒絶理由が指摘されていなかった進歩性拒絶無し出願の請求項1に応じた文書ベクトルと、拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる学習用最類似文献に応じた非引用文書ベクトルとの差分から求めた第3の移動文書ベクトルである請求項2記載の特許要件適否予測装置とすることができる。
【0018】
さらにまた、本発明は、コンピュータを特許要件適否予測装置として機能させるための特許要件適否予測プログラムであって、そのコンピュータを先行技術調査の対象である調査対象発明の検索に用いられる検索文書を用いて、公開特許公報の電子データである公開公報データを検索し、その検索結果に応じて、調査対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、調査対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて調査対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段として機能させ、進歩性予測処理部が公開公報データによって特定される先行技術発明のうち、調査対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、主引用発明検索部が検索文書を用いて主引用発明を検索する主検索文書データを生成し、その主検索文書データを用いて公開公報データを対象とする概念検索を行い、その概念検索の結果、類似度の降順にその類似度が最も高い最類似文献を含む複数の類似文献を抽出し、かつ検索文書から生成される全文検索タームを用いた公開公報データを対象とする全文検索でヒットしたヒット文献に複数の類似文献と一致する類似ヒット文献があったときは、その類似ヒット文献のうち類似度が最も高い最類似ヒット文献を主引用発明が開示されている主引用文献とし、文書分類部が、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される発明移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、その発明移動ベクトルは、検索文書に応じた調査対象発明ベクトルと、最類似ヒット文献に応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測プログラムを提供する。
【発明の効果】
【0019】
以上詳述したように、本発明によれば、出願書類の準備負担軽減が有効になるように、調査対象発明について、審査実務に適合した内容の特許要件の適否に関する予測が行われ、しかも予測の精度が高められるようにした特許要件適否予測装置および特許要件適否予測プログラムが得られる。
【図面の簡単な説明】
【0020】
図1】本発明の第1の実施の形態に係る特許要件適否予測サーバを含む特許要件適否予測システムのシステム構成図である。
図2】特許要件適否予測サーバの内部の構成を中心に示すブロック図である。
図3】ユーザ端末装置の内部の構成を中心に示すブロック図である。
図4】本発明の第1の実施の形態に係る特許要件適否予測サーバの主要な構成を示す機能ブロック図である。
図5】本発明の第1の実施の形態に係る特許要件適否予測処理部の主要な構成を示す機能ブロック図である。
図6】入力ベクトル生成部の主要な構成を示す機能ブロック図である。
図7】(a)は、全文検索ファイルのレコードレイアウトの一例を示す図であり、(b)は、概念検索ファイルのレコードレイアウトの一例を示す図である。
図8】sstテーブルのレコードレイアウトの一例を示す図である。
図9】予測結果記憶部のレコードレイアウトの一例を示す図である。
図10】機械学習部のネットワーク構造の一例を示す図である。
図11】特許要件適否予測処理の動作手順の一例を示すフローチャートである。
図12】特許要件適否予測ルーチンの動作手順の一例を示すフローチャートである。
図13】新規性・拡大先願予測ルーチンの動作手順の一例を示すフローチャートである。
図14】拡大先願予測ルーチンの動作手順の一例を示すフローチャートである。
図15】進歩性予測ルーチンの動作手順の一例を示すフローチャートである。
図16】主引用発明検索処理の一例を示すフローチャートである。
図17】概念検索後処理の一例を示すフローチャートである。
図18】副引用発明検索処理の一例を示すフローチャートである。
図19】審査対象となる特許出願と、複数の特許公開公報との関係を模式的に示した図である。
図20】特許要件適否予測リストの一例を示す図である。
図21】本発明の第2の実施の形態に係る特許要件適否予測サーバの主要な構成を示す機能ブロック図である。
図22】本発明の第2の実施の形態に係る特許要件適否予測処理部の主要な構成を示す機能ブロック図である。
図23】同じく入力ベクトル生成部の主要な構成を示す機能ブロック図である。
図24】同じく予測結果記憶部のレコードレイアウトの一例を示す図である。
図25】同じく特許要件適否予測リストの一例を示す図である。
図26】変形例に係る特許要件適否予測処理部の主要な構成を示す機能ブロック図である。
図27】予測付き検索画面のレイアウトの一例を示す図である。
図28】本発明の第2の実施の形態に係る特許要件適否予測サーバにおける概念検索後処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0021】
以下、本発明の実施の形態について図面を参照しつつ説明する。なお、同一要素には同一符号を用い、重複する説明は省略する。
【0022】
第1の実施の形態
(特許要件適否予測システムの全体構成)
まず、本発明の第1の実施の形態に係る特許要件適否予測サーバ10を含む特許要件適否予測システム1の構成について説明する。
【0023】
図1は特許要件適否予測システム1のシステム構成図である。図1に示すように、特許要件適否予測システム1は、特許要件適否予測サーバ10と、ユーザが操作する複数のユーザ端末装置30(図1では、固定端末装置30A、30B、30C)とを有し、これらがインターネットN1を介して互いに接続される構成を有している。
【0024】
特許要件適否予測サーバ10は、特許要件適否予測プログラムにしたがったデータ処理を行う。特許要件適否予測サーバ10は、ユーザによる先行技術調査の対象である調査対象発明について、特許要件(本実施形態では、新規性(特許法第29条第1項3号)、拡大先願(特許法第29条の2)および進歩性(特許法第29条第2項))に適合しているか否かを予測する。ユーザ端末装置30は、特許要件適否予測サーバ10との間でデータの受信または送信を行う。
【0025】
特許要件適否予測システム1では、特許要件適否予測サーバ10が、調査対象発明について、進歩性違反の拒絶理由が見つかる可能性が高いか低いかを審査実績に基づく複数の訓練データで機械学習を行った人工知能プログラムで予測して、特許要件の適否が予測される。特許要件適否予測サーバ10によって、調査対象発明について特許要件の適否の予測が審査実務に適合した内容で行われるため、出願書類の準備負担を有効に軽減することができる。
【0026】
(特許要件適否予測サーバ10の構成)
次に、図2を参照して特許要件適否予測サーバ10の構成について説明する。図2は、特許要件適否予測サーバ10の内部の構成を中心に示すブロック図である。特許要件適否予測サーバ10は、調査対象発明の特許要件適否の予測に関するサービスを提供する専門事業者が運用するサーバである。
【0027】
特許要件適否予測サーバ10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13とを有している。CPU11は、ROM12に記憶されているプログラムにしたがい作動して、KBC(Key board controller)17を介してキーボード19やマウス20の操作入力で得られる入力データをメインバス19Aを介して入力する一方、他の構成要素との信号の入出力を行い、特許要件適否予測サーバ10全体の動作制御を行う。CPU11は、後述する特許要件適否予測プログラムにしたがい、後述する検索文書データ生成部101、sstテーブル生成部102、特許要件適否予測処理部103、対象公報抽出部104、予測結果編集処理部105としての動作を行う。ROM12には、特許要件適否予測プログラム等のCPU11が実行する制御プログラムと、恒久的なデータが記憶されている。RAM13にはCPU11が作動する際に用いるデータやプログラムが記憶されている。
【0028】
そのほか特許要件適否予測サーバ10は、ハードディスク装置(Hard disk drive,HDD)14と、通信制御部15と、通信処理部16と、ビデオコントローラ18とを有している。
【0029】
ハードディスク装置14には、特許要件適否予測プログラムの実行に必要な図4に示す各種記憶部またはDB(database)と、その他の記憶部またはDBが形成されている。ハードディスク装置14には、検索文書データ記憶部153と、sstテーブル154と、対象公報記憶部155と、予測結果ファイル記憶部156と、全文検索ファイル157および概念検索ファイル158(図4には図示せず)とが形成されている。各記憶部またはDBについては後述する。
【0030】
通信制御部15は、CPU11の指示にしたがい作動して、ユーザ端末装置30や、図示しない特許庁サーバとの通信を行うための回線の接続および切断を制御する。通信処理部16は、通信制御部15の指示にしたがい作動して、インターネットN1を介して行われるデータの送受信を実行する。
【0031】
ビデオコントローラ18は、図示しないディスプレイ装置における画像表示を制御して、各種の設定に用いられる画面等を表示させる。
【0032】
そして、ハードディスク装置14の各種記憶部またはDBについて説明すると次のとおりである。検索文書データ記憶部153には、検索文書データ生成部101が生成した検索文書データ(後述する検索文書から生成される電子データ)が記憶されている。公開公報DB150は、公開特許公報の電子データが公開公報データとして格納されている。公開公報DB150として、図4では、工業所有権情報・研修館により運営されている特許情報プラットフォーム(J−PlatPat)のデータベースまたはそこからダウンロードした電子データを記憶しているデータベースを想定している。後者のデータベースは、図示しないサーバに格納することができるし、HDD14に格納してもよい。
【0033】
ここで、検索文書とは、調査対象発明の検索に用いられる文書であって、調査対象発明を把握するのに用いられるテキストデータで構成されている。検索文書および検索文書データについては、詳しくは後述する。検索文書は、例えばユーザ端末装置30から特許要件適否予測サーバ10に暗号化通信(例えば、SSLを利用した暗号化通信)によって送信される。
【0034】
sstテーブル154には、検索文書データから生成される副検索ターム(sub search term、副引用発明を検索するためのキーワード)が記憶されている。sstテーブル154は、図8に示すように、検索タームエリア154a,完全コードエリア154bおよび文献ナンバエリア154cを有し、これらによって1件のレコードが生成される。
【0035】
検索タームエリア154aは、副検索タームが記憶される部分であって、固定エリア154dと可変エリア154eとを有している。固定エリア154dには、すべての副検索タームに備えられ、全文検索で固定的に用いれる単語がセットされている。本実施形態の場合、後述する予測付き検索画面181(図27参照)の名称エリア181aから入力されたデータ(名称データK1)および目的・課題エリア181cから入力されたデータ(目的・課題データK2)に応じた単語が固定エリア154dにセットされている。可変エリア154eには、全文検索で可変的に用いれる単語がセットされている。本実施形態の場合、予測付き検索画面181の解決手段エリア181dから入力されたデータ(解決手段データK3)に応じた単語が可変エリア154eにセットされている。解決手段データK3は、発明の構成要件となる複数の単語が含まれることが多いので、それらを各単語に区分して(K3からK3までのn個、図8ではK3からK3までの5種類)、各単語を1または2以上含むすべての組み合わせが可変エリア154eにセットされている。また、可変エリア154eには、単語数エリア154fが設けられている。単語数エリア154fには、"1"、"2"といった可変エリア154eにセットされている単語数に応じたデータがセットされている。
【0036】
完全コードエリア154bには、完全コードがセットされている。完全コードとは、可変エリア154eにセットされている単語が解決手段データK3の単語のすべてからなっていることをコード"P0"か、すべてになるための組み合わせのレコードに共通のコードが記憶されている。例えば、図8において完全コードが"P11"であるのは、可変エリア154eがK3のレコードと、K3からK3までを含むレコードとであり、この両レコードの単語を含むことで解決手段データK3のすべての単語(図8では、K3からK3までの5種類)を含むことになる。文献ナンバエリア154cには、検索タームエリア154aの検索タームを用いた全文検索でヒットした文献の文献番号が記憶されている。
【0037】
対象公報記憶部155には、主引用発明検索および副引用発明検索の対象とされる公開公報データ(検索対象公報データ)が記憶されている。予測結果記憶部156には、図9に示すような後述する予測結果ファイルが記憶されている。
【0038】
検索文書データ生成部101は、検索文書から検索文書データを生成し、その検索文書データを検索文書データ記憶部153に記憶させる。検索文書は、図27に示す予測付き検索画面181からユーザによって入力される。
【0039】
その予測付き検索画面181には、名称エリア181a,目的・課題エリア181c、解決手段エリア181dが設けられていて、これらから入力されたデータが検索文書を構成する。名称エリア181aには、調査対象発明の名称が入力される。名称エリア181aには、名称プルダウンバー181bが備えられているため、これを選択して発明の名称が入力される。名称プルダウンバー181bには、発明の名称として用いられやすい単語(発明の名称の末尾に用いられる単語で、名称単語ともいう)が予め登録され、ユーザがユーザ端末装置30で選択できる。名称単語としては、例えば、装置、方法、システム、デバイス、回路、モジュール、部材、具、材、素子、プログラム、基板、その他が登録されている。目的・課題エリア181cには、調査対象発明の目的または課題が入力される。解決手段エリア181dには、調査対象発明の目的または課題を解決するための手段が入力される。
【0040】
検索文書データ生成部101は、入力された検索文書を用いて形態素解析および不要語の除去を行い検索文書データを生成する。不要語の除去が行われることにより、検索に用いられる索引語の総数を減らせるため、検索の効率が向上する。一般に、自然言語は、内容語と機能語の2つに大別できる。内容語はそれ自体で意味のある単語であり、動詞や名詞が該当する。機能語は単語と単語の関係を表す単語であり、助詞や助動詞などが該当する。形態素解析が行われたことで各単語の品詞がわかるため、その結果に基づき、機能語を不要語として除去できる。
【0041】
sstテーブル生成部102は、検索文書データを用いて前述した構成を有するsstテーブル154を生成する。sstテーブル生成部102は、名称エリア181aから入力されたデータおよび目的・課題エリア181cから入力されたデータに応じた単語を固定エリア154dにセットし、解決手段エリア181dから入力されたデータに応じた単語を各単語に細分化して、可変エリア154eにセットする。また、可変エリア154eを参照して完全コードエリア154bに完全コードをセットする。
【0042】
続いて、特許要件適否予測処理部103について説明する。特許要件適否予測処理部103は、図5に示すように、新規性・拡大先願予測処理部125と、進歩性予測処理部126とを有している。新規性・拡大先願予測処理部125は、検索文書データ記憶部153に記憶されている検索文書データを全文検索タームに用いて対象公報記憶部155の検索対象公報データを対象とする全文検索を行い、その結果にしたがい、新規性・拡大先願予測データNdを予測結果ファイル生成部127に出力し、ヒットした文献の文献ナンバを全文検索ファイル157にセットする。新規性・拡大先願予測処理部125の機能、動作手順については、後に詳しく説明する。
【0043】
進歩性予測処理部126は、引用発明検索部131と、入力ベクトル生成部132と、機械学習部133とを有している。引用発明検索部131は、後述する主引用発明検索を行う主引用発明検索部および副引用発明検索を行う副引用発明検索部を有している。また、引用発明検索部131は、主引用発明検索および副引用発明検索の結果にしたがい、進歩性予測データVd1を予測結果ファイル生成部127に出力し、検索文書データiedと概念検索データVd2を入力ベクトル生成部132に出力する。概念検索データVd2には、新規性・拡大先願予測処理部125による全文検索の結果と、主引用発明検索部による概念検索の結果との対比結果にしたがい決定された後述する最類似ヒット文献または最類似文献の公開公報データが含まれている(図17参照)。引用発明検索部131の機能、動作手順については、後に詳しく説明する。
【0044】
入力ベクトル生成部132は、図6に示すように、検索対象発明ベクトル生成部132aと、引用候補ベクトル生成部132bと、移動ベクトル生成部132cとを有している。
【0045】
検索対象発明ベクトル生成部132aは、検索文書データiedを入力してその特徴語を抽出し、各語に応じた重み付けを行って、検索文書に応じた検索対象発明ベクトルEVを生成する。引用候補ベクトル生成部132bは、概念検索データVd2に含まれる主引用文献(最類似ヒット文献または最類似文献)の公開公報データを入力してその特徴語を抽出し、各語に応じた重み付けを行って主引用文献に応じた文書ベクトル(引用候補ベクトル)RfVを生成する。移動ベクトル生成部132cは、検索対象発明ベクトルEVと、引用候補ベクトルRfVとの差分を計算して、双方の文書ベクトルの差分に応じた発明移動ベクトルV3を生成する。
【0046】
詳しくは後述するが、最類似文献は概念検索で類似度が最も高いとされた文献であり、最類似ヒット文献は類似度が一定値以上であり、しかも全文検索でヒットした文献でもある。そのため、いずれの文献も、調査対象発明の進歩性の審査で主引用発明の開示文献として引用される確率が高く、後者にいたっては、新規性要件不備の根拠とされる可能性も高いと推測される。そのため、最類似ヒット文献または最類似文献を引用候補として引用候補ベクトルRfVを求め、これと検索対象発明ベクトルEVとの差分を計算して発明移動ベクトルV3を求めれば、調査対象発明と、最類似ヒット文献または最類似文献に開示されている発明との相違に応じた文書ベクトル(発明移動ベクトルV3に相当する)が生成される。
【0047】
機械学習部133は、本発明の実施の形態にかかる文書分類部であって、次のような訓練データ(学習パターンともいう)を用いた機械学習(教師付き学習)によって、発明移動ベクトルV3を進歩性の要件に適合するクラスと適合しないクラス(拒絶理由が無いクラスと有るクラス)に分類し、その分類結果に応じた出力信号(要件適否文書ベクトル)V4を出力するように構築されている。本発明の実施の形態の場合、学習パターンは次に述べるHLパターンとすることができる。
【0048】
HLパターンは、学習文書ベクトルが第1の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りを示すベクトル(例えば、正解のクラスに対応した次元だけが"1"で、他が"0"のベクトル)との組み合わせと、学習文書ベクトルが第2の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトル(例えば、上記とは別の次元だけが"1"で、他が"0"のベクトル)との組み合わせのパターンである。
【0049】
第1の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知(1stアクション)が発行された出願であって、その1stアクションで進歩性違反の拒絶理由(特許法第29条第2項の要件を満たしていないとする拒絶理由)が指摘されていた出願(進歩性拒絶出願)の該拒絶理由が指摘されていた(拒絶理由通知発行時点の)請求項に応じた文書ベクトルと、そのときの引用文献1(主たる刊行物として引用されていた主引用文献)に応じた文書ベクトル(引用文書ベクトル)との差分に応じた第1の移動文書ベクトルである。
【0050】
第2の学習文書ベクトルは、公開済出願の中で審査の結果、1stアクションが発行されずに特許査定が発行された出願(拒絶無し出願)または1stアクションは発行されたがその拒絶理由に進歩性違反の拒絶理由が指摘されていなかった出願(進歩性拒絶無し出願)の(拒絶理由通知が発行された時点の)請求項1に応じた文書ベクトルと、それら拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる文献(学習用最類似文献)に応じた文書ベクトル(非引用文書ベクトル)との差分に応じた第2の移動文書ベクトルである。
【0051】
機械学習部133は、上記のようなHLパターンの学習パターンで学習を繰り返し行うことにより、発明移動ベクトルV3を進歩性の拒絶理由有りまたは無しのいずれかのクラスに分類し、その分類したクラスに応じた要件適否文書ベクトルV4を出力する。前者は、調査対象発明が出願された場合について、進歩性違反の拒絶理由が発行される可能性が高い場合、後者は低い場合に相当する。
【0052】
機械学習部133は、入力される発明移動ベクトルV3を進歩性の拒絶理由が有るクラスと無いクラスに分類して、その分類結果に応じた要件適否文書ベクトルV4を出力すればよいので、機械学習部133にサポートベクターマシーン(SVM)と呼ばれる学習アルゴリズムを適用することができる。サポートベクターマシーン(SVM)によれば、決定境界との距離(マージン)が最大になるように、決定境界を得ることができる。
【0053】
また、機械学習部133の情報処理に脳神経回路網をモデルにしたニューラルネットワークを適用することができる。ニューラルネットワークには、階層型ニューラルネットワークと、相互結合型ニューラルネットワークがある。たとえば、機械学習部133の学習アルゴリズムとして、階層型ニューラルネットワークのパーセプトロンを適用することができる。
【0054】
パーセプトロンはS層、A層、R層と呼ばれる3層からなる階層型ネットワークで構成され(図示せず)、S層からA層、A層からR層という片方向の結合だけが存在している。前述のHLパターンの学習パターンが与えられると、第1の学習文書ベクトルまたは第2の学習文書ベクトルが入力されたときの出力ベクトルがそれぞれの教師ベクトルと異なっていたときに、その誤差に応じて結合の重みが修正され、出力ベクトルと教師ベクトルとの誤差が一定値以下になったときに学習が終了する。
【0055】
しかしながら、パーセプトロンでは、学習パターンが線形分離不可能な場合にアルゴリズムが停止しないおそれがある。そのため、機械学習部133が学習によって非線形な決定境界を獲得できるようにするため、階層型ニューラルネットワークの中で応用例が多く、誤識別の少ない非線形識別面が学習できるBP(バックプロパゲーション)ネットワークを適用することが好ましい。
【0056】
BPネットワークは、図10に示すように、入力層および出力層と、その間の中間層とを有し、誤差逆伝播アルゴリズムと呼ばれる学習アルゴリズムによって、ユニット間のすべての結合の重みが学習可能になっている。誤差逆伝播アルゴリズムでは、入力信号が入力層、中間層、出力層と伝わり、その一方、誤差信号が逆に伝わることによって、重み調整が行われる。
【0057】
そして、図10に示すBPネットワークに、学習パターンx(x、x・・・x)が入力されたとき、ある階層のj(0≦j≦n)番目のユニットには、そのユニットjとの結合を有する1階層前のユニットから重み付きの信号が入力される。そこで、1階層前のi(0≦i≦n)番目のユニットからの信号をtip,重みをwijとすると、ユニットjへの入力は、式1のようになり、ユニットjの出力は、閾値関数をfとして、式2のようになる。
【0058】
式1
【数1】
【0059】
式2
【数2】
【0060】
学習パターンxに対する誤差Dは、出力層のユニットkの出力と、教師信号bkpの差の2乗和で定義されるから、以下の式3のようになる。この誤差Dをすべての学習パターンに対して足しあげて式4のDを求め、そのDが最小になるように、ユニット間の結合重みが調整されて機械学習部133における学習が行われる。この場合、個々の学習パターンが入力されるごとに、式5によって重みが調整される。wijは更新前の重み、w'ijは更新後の重み、ρは学習係数である。これは確率的最急降下法と呼ばれる。なお、ユニットの入出力関数は式6に示すシグモイド関数が用いられる。
【0061】
式3
【数3】
【0062】
式4
【数4】
【0063】
式5
【数5】
【0064】
式6
【数6】
【0065】
(ユーザ端末装置30の構成)
ユーザ端末装置30は、図1に示すように、インターネットN1への接続環境を備え、特許要件適否予測サーバ10と通信を行うことができる。なお、ユーザ端末装置30は、据え置き型(または持ち運び可能なノート型)のパーソナルコンピュータを想定しているが、タブレット型の端末装置でもよい。
【0066】
ユーザ端末装置30は、図3に示すように、CPU31、ROM32、RAM33、データ記憶部34、液晶表示部35を有している。また、ユーザ端末装置30は、音声変換処理部36、通信制御部37、通信処理部38a、無線通信部38b、スピーカ39およびマイク40を有している。
【0067】
CPU31は、ROM32に記憶されているプログラムにしたがい作動してユーザ端末装置30全体の動作制御を司る。ROM32はCPU31が実行するプログラム、例えば、データ通信を行うための通信制御プログラムが記憶されている。RAM33には、CPU31によるプログラムの実行に必要なデータ等が記憶される。
【0068】
データ記憶部34には種々のデータが記憶されている。液晶表示部35は、LCD(Liquid Crystal Display)とその駆動部を有し、文字、図形、記号などの画像表示を行う画像表示手段である。音声変換処理部36は、音声データを伸張してスピーカ39に出力する一方、マイク40から入力するアナログ音声信号をデジタルの音声データに変換および圧縮して、通信処理部38aに入力する。通信制御部37はCPU31の指示を受けて作動し、データ通信を行うための回線の接続および切断を制御する。通信処理部38aは、通信制御部37の指示にしたがい作動して、インターネットN1を介して行われるデータの送受信を実行する。無線通信部38bは通信制御部37の制御にしたがい、無線によるデータの送受信を実行する無線通信手段である。スピーカ39は、音声を出力する音声出力手段であり、マイク40はユーザの会話内容等の音声を入力し、電気信号に変換する。
【0069】
(特許要件適否予測システムの動作内容)
次に、図4とともに図11から図18までを参照して、特許要件適否予測サーバ10による特許要件適否予測処理の動作内容について説明する。
【0070】
ここで、図4は、特許要件適否予測処理を実現する特許要件適否予測サーバ10の主要な構成を示す機能ブロック図である。特許要件適否予測サーバ10では、CPU11が特許要件適否予測プログラムにしたがい、公開公報DB150、検索文書データ記憶部153、sstテーブル154等に記憶されている各種ファイルやDBにアクセスしながら、検索文書データ生成部101、sstテーブル生成部102、特許要件適否予測処理部103、対象公報抽出部104、予測結果編集処理部105としての動作を行う。これにより、特許要件適否予測処理が実行される。なお、特許要件適否予測プログラムは、特許要件適否予測サーバ10を検索文書データ生成部101、sstテーブル生成部102、特許要件適否予測処理部103、予測結果編集処理部105等として機能させるためのプログラムである。
【0071】
そして、特許要件適否予測サーバ10が特許要件適否予測処理を行うときは、CPU11が特許要件適否予測プログラムにしたがい図11に示すフローチャートに沿った動作を行う。図11は、特許要件適否予測プログラムにしたがったCPU11の特許要件適否予測処理の動作手順の一例を示すフローチャートである。なお、図11図12等において"S"とはステップを略記したものである。
【0072】
CPU11は、特許要件適否予測プログラムにしたがい動作を開始すると、ステップ1に進み、ユーザ認証処理を行う。ここでは、ユーザがユーザ端末装置30を用いて入力したユーザIDおよびパスワードを確認する等してユーザ認証処理を行う。次に、CPU11は、ステップ2に進み、ポイント残高確認処理を行う。ポイント残高確認処理では、ユーザのポイント残高が一定値以上あるかどうかをCPU11が確認し、ポイント残高不足であれば、特許要件適否予測処理を終了するか、ポイント残高不足を知らせるメッセージの送信などを行う。
【0073】
CPU11は、処理をステップ3に進めると、検索文書データ生成部101を作動させて予測付き検索画面181をユーザ端末装置30に表示させ、予測付き検索画面181を用いた検索文書の入力があるまで待機する。そして、検索文書の入力があると、CPU11はステップ4に処理を進めて入力された検索文書から検索文書データを生成し、続くステップ5では、生成された検索文書データを検索文書データ記憶部153に記憶させる。
【0074】
次に、CPU11は、処理をステップ6に進めて予測終了条件が成立しているか否かを判定する。ここで、CPU11は予測終了条件が成立しているときはステップ8に進むが、そうでないときはステップ7に進む。CPU11はステップ7に進むと、後述する特許要件適否予測ルーチンを実行するが、ステップ8に進むと、終了処理を実行し、そのユーザに対する特許要件適否予測処理を終了する。このようにすることで、予測終了条件が成立するまでの間、特許要件適否予測処理が自動的かつ継続的に実行される。
【0075】
そして、CPU11はステップ7に進むときは、図12に示すフローチャートに沿って特許要件適否予測ルーチンを実行する。
【0076】
(特許要件適否予測ルーチン)
CPU11は特許要件適否予測ルーチンを開始すると、ステップ11に進み、対象公報抽出部104としての動作を行い公報抽出処理を行う。この場合、CPU11は、マシン日付を基準にして公開公報データを抽出し(公開日がマシン日付よりも前の公開公報データを抽出する)、抽出したデータを検索対象公報データとして対象公報記憶部155に記憶させる。次に、CPU11は、処理をステップ12に進めてsstテーブル生成部102としての動作を行い、sstテーブル生成処理を実行する。ここで生成されたデータがsstテーブル154に記憶される。
【0077】
続いてCPU11は、ステップ13に処理を進めて後述する新規性・拡大先願予測ルーチンを実行してからステップ14に進み、進歩性予測ルーチンを実行する。その後、CPU11は、ステップ15に進み、CPU11が予測結果編集処理部105としての動作を行い、後述する予測結果リストL1を編集出力する。その後、ステップ16のポイント消費処理を実行して、特許要件適否予測を行った検索文書データに応じて、ポイント残高を減らす。その後、特許要件適否予測ルーチンが終了する。
【0078】
(新規性・拡大先願予測ルーチン)
そして、CPU11は、ステップ13に処理を進めると、前述した新規性・拡大先願予測処理部125としての動作を行い、図13図14に示すフローチャートに沿って、新規性・拡大先願予測ルーチンを実行する。
【0079】
この場合、CPU11は、新規性・拡大先願予測ルーチンをスタートするとステップ21に処理を進め、検索文書データ記憶部153に記憶されている検索文書データを全文検索タームに用いて、対象公報記憶部155の検索対象公報データを対象とする全文検索(この全文検索を主発明全文検索ともいう)を行い、ヒットした文献の件数が文献MAXにセットされる。
【0080】
続いて処理がステップ22に進み、ステップ21でヒットした文献があったか否か(文献MAXが1以上か否か)が判定され、ヒットした文献があればステップ23に処理が進み、そうでなければ新規性・拡大先願予測ルーチンが終了する。
【0081】
ステップ23では、文献カウンタに"1"が加算され、続くステップ24では、文献カウンタが文献MAX以下であるか否かが判定され、これが成立しているときはステップ25に処理が進み、そうでなければステップ28に処理が進む。ステップ25では、ヒットした文献の出願公開日(ヒット文献公開日)がマシン日付(本実施の形態では、検索文書データの出願日(対象出願日)として扱われる)よりも小さいか否か(ヒット文献公開日<対象出願日 が成立するか否か)が判定され、これが成立しているときはステップ26に処理が進み、そうでなければステップ27に処理が進む。ステップ26では、新規性無しを示す新規性フラグ"N1"を含むように新規性・拡大先願予測データNdが生成される。その後、ステップ23に戻り、上記同様の処理が繰り返えされる。
【0082】
そして、ステップ27では、後述する拡大先願予測ルーチンが実行される。ステップ28に処理が進むと、新規性・拡大先願予測データNdが出力される。続くステップ29でCPU11がヒットした文献の文献ナンバを全文検索ファイル157に記憶させると、その後、新規性・拡大先願予測ルーチンが終了する。全文検索ファイル157には、図7(a)に示すように、連番(ref−no)と、文献ナンバとが記憶されている。
【0083】
一方、CPU11は、図14に示すフローチャートに沿って拡大先願予測ルーチンを実行する。拡大先願予測ルーチンがスタートすると、ステップ41に処理が進み、ヒットした文献の出願日(文献出願日)が対象出願日よりも前であるか否か(文献出願日<対象出願日 が成立するか否か)が判定され、これが成立しているときはステップ42に処理が進むが、そうでなければ拡大先願予測ルーチンを終了する。ステップ42では、調査対象発明とヒットした文献とで発明者が同一であるか否かが判定され、これが成立していないときはステップ43に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。ステップ43では、調査対象発明とヒットした文献とで出願人が同一であるか否かが判定され、これが成立していないときはステップ44に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。そして、CPU11は、ステップ44に処理を進めると、拡大先願の要件(特許法第29条の2に規定される要件)を満たしていないことを示す拡大先願フラグ"F1"を含むように新規性・拡大先願予測データNdを生成する。その後、拡大先願予測ルーチンが終了する。
【0084】
以上で新規性・拡大先願予測ルーチンが終了すると、図12において処理がステップ13からステップ14に進み、CPU11が進歩性予測処理部126としての動作を行い、進歩性予測ルーチンを実行する。CPU11は、図15図18に示すフローチャートに沿って進歩性予測ルーチンを実行する。
【0085】
(進歩性予測ルーチン)
CPU11は、進歩性予測ルーチンをスタートすると、図15に示すステップ71に処理を進め、主引用発明検索処理を実行する。CPU11は、続くステップ72に処理を進めて、主引用発明検索処理で主引用発明があったか否か(後述する主引用文献がセットされているか否か)を判定し、主引用発明があればステップ73に処理が進み、主引用発明がなければステップ76に処理が進む。続くステップ73では、後述する概念検索後処理が実行され、その後のステップ74で副引用発明があったか否か(後述する副引用文献がセットされているか否か)が判定される。ここで副引用発明があればステップ75に処理が進み、副引用発明がなければステップ77に処理が進む。
【0086】
CPU11はステップ75に処理を進めると、該当する検索文書データについて検索フラグ(検索flag)に"VX"をセットし、ステップ77では、検索フラグ(検索flag)に"VY"をセットする。また、CPU11はステップ76に処理を進めると、セットされた検索フラグを含むように進歩性予測データVd1を生成して、それを予測結果ファイル生成部127に出力する。また、CPU11は検索文書データiedと検索結果に応じた概念検索データVd2を入力ベクトル生成部132に出力する。
【0087】
進歩性予測ルーチンでは、主引用発明が見つかった場合に"VX"または"VY"が検索フラグにセットされる。主引用発明が見つかると、それによって、進歩性の要件を満たさないと判断される可能性が高いため、進歩性違反の拒絶理由が見つかるか否かは主引用発明が見つかるか否かに大きく左右される。進歩性予測データVd1は、このような検索フラグを含むことによって、進歩性の要件適否を示すものとなる。ステップ76が実行されたあと、進歩性予測ルーチンが終了する。
【0088】
そして、CPU11は、図16に示すフローチャートに沿って主引用発明検索処理を実行する。主引用発明検索処理は、調査対象発明に最も近い主引用発明を検索する処理である。
【0089】
CPU11は、主引用発明検索処理を開始すると、ステップ82に処理を進め、検索文書データ記憶部153から、検索文書データを読みだして主検索文書データ(主引用発明を概念検索で検索するときの文書データ)を生成する。
【0090】
続くステップ83では、CPU11が主引用発明の検索処理、すなわち、主検索文書データを入力文書に用いて、対象公報記憶部155に記憶されている検索対象公報データについて概念検索を行う。この概念検索では、主検索文書データと、検索される文書それぞれを特徴語の抽出、重み付けを行う等してそれぞれの文書に応じたベクトル(文書ベクトル)が生成され、各ベクトルの内積が求められて類似度が算出される。次のステップ84では、ステップ83の概念検索の結果から、最も大きい類似度が一定値以上になっているか否かが判定され、一定値以上の場合はステップ85に処理が進み、そうでなければ主引用発明検索処理が終了する。
【0091】
ステップ85では、最類似文献を含む類似度が一定値以上の複数の文献がそれぞれの類似度とともに概念検索ファイル158に記憶される。ステップ85が実行された後、主引用発明検索処理が終了する。概念検索ファイル158は概念検索で見つかった類似度が一定値以上の文献の文献ナンバをそれぞれの類似度とともに記憶するファイルであって、図7(b)に示すように、連番、類似度、文献ナンバが記憶されている。
【0092】
概念検索後処理は、図17に示すフローチャートに沿って実行される。概念検索後処理では、主発明全文検索の結果と概念検索の結果とが対比され、その結果にしたがい、主引用発明が開示されている文献(主引用文献)および副引用発明が開示されている文献(副引用文献)が決定される。
【0093】
CPU11は、概念検索後処理を開始すると、ステップ91に処理を進めて、全文検索ファイル157を参照する。続くステップ92では、全文検索ファイル157に文献ナンバが記憶されているか否かによって、主発明全文検索でヒットした文献があるか否かが判定され、ヒットした文献があればステップ93に処理が進み、無ければステップ96に処理が進む。CPU11はステップ93では、概念検索ファイル158を参照する。続くステップ94では、全文検索ファイル157に記憶されている文献ナンバと、概念検索ファイル158に記憶されている文献ナンバとが対比され、主発明全文検索でヒットした文献に、概念検索で見つかった複数の類似文献と一致する文献(この場合の一致する文献を類似ヒット文献ともいう)があるか否かが判定される。類似ヒット文献があるときはステップ95に処理が進み、無ければステップ98に処理が進む。ステップ95では、類似ヒット文献のうち、類似度が最も高い文献(つまり、類似ヒット文献の中で類似度が最も高い文献であり、「最類似ヒット文献」ともいう)を選出し、それを主引用文献と副引用文献にセットしてその後、検索後処理を終了する。
【0094】
そして、ステップ98に処理が進むときは、全文検索ファイル157と概念検索ファイル158の中に一致している文献がないため、概念検索ファイル158の文献の中で類似度が最も大きい文献(最類似文献)を選出し、それを主引用文献にセットして、ステップ99に処理を進める。また、続くステップ99では、全文検索ファイル157に記憶されている文献が副引用文献にセットされ、その後、概念検索後処理が終了する。
【0095】
一方、ステップ96に処理が進む場合は、全文検索ファイル157に文献ナンバが記憶されていない(ステップ21の主発明全文検索で文献がヒットしなかった)ので、概念検索ファイル158に記憶されている文献の中で類似度が最も大きい文献(最類似文献)を選出し、それを主引用文献にセットして、ステップ97に処理を進める。ステップ97では、後述する副引用発明検索処理が実行される。副引用発明検索処理が実行された後、概念検索後処理が終了する。
【0096】
副引用発明検索処理は、図18に示すフローチャートに沿って実行される。CPU11は副引用発明検索処理を開始すると、ステップ111に処理を進めて、sstテーブル154を参照し、検索タームエリア154aに設定されている各副検索タームを用いて検索対象公報データを対象として全文検索処理を実行する(この全文検索を副発明全文検索ともいう)。前述したように、sstテーブル154には、K3からK3までのn個の単語の少なくとも1つを含むように設定された副検索タームが記憶されている。その各副検索タームを用いて副発明全文検索処理が実行される。
【0097】
続くステップ112では、ステップ111の副発明全文検索でヒットした文献ナンバをsstテーブル154の文献ナンバ(ref−no)エリア154cにセットする。次のステップ113では、sstテーブル154に設定されているすべての副検索タームにつき、副発明全文検索処理が終了したか否かが判定され、終了していればステップ114に処理が進むが、そうでなければステップ111に処理が戻る。ステップ114では、同じ完全フラグのレコード(例えば、完全フラグがP11であるレコード)の中に文献ナンバが設定されているか否かが判定され、設定されていればステップ115に処理が進み、そうでなければステップ116に処理が進む。ステップ115では、該当する文献ナンバを副引用文献にセットして副引用発明検索処理が終了する。また、ステップ116では、sstテーブル154に設定されている副検索タームの中で、単語数エリア154fに最大値が設定されているレコードの文献ナンバエリア154cから文献ナンバを読み出し、それを参考文献(参考文献とは、副引用発明が開示されているとは認定できないが、調査対象発明との関連性が認められる文献)にセットする(本実施の形態では、可変エリア154eに最大でK3からK3までの5種類の単語がセットされ得るが、副引用発明検索処理は全文検索ファイル157に文献ナンバがセットされていない場合に実行されるので、単語数エリア154fの最大値は4以下になる)。その後、副引用発明検索処理が終了する。
【0098】
以上のようにして、新規性・拡大先願予測ルーチンと、進歩性予測ルーチンとが実行されると、それぞれの結果に応じて、新規性・拡大先願予測データNdと、進歩性予測データVd1とが予測結果ファイル生成部127に出力される。また、機械学習部133から要件適否文書ベクトルV4が出力されるので、これらを用いて予測結果ファイル生成部127が図9に示した予測結果ファイルを生成し、予測結果記憶部156に記憶させる。
【0099】
予測結果ファイルは、図9に示すように、検索文書番号、検索文書、検索フラグ、ヒット文献、マシン予測の各項目のデータが調査対象発明ごとに記憶されている。マシン予測とは、機械学習記憶部133からの要件適否文書ベクトルV4に応じたデータであって、進歩性予測ルーチンで見つかった主引用文献および/または副引用文献を引用した進歩性違反の拒絶理由が見つかる可能性が高いか低いか(高い場合は"H"、低い場合は"L")を示している。
【0100】
また、予測結果編集部105が予測結果ファイルを読み込み、図20に示すような特許要件適否予測リストL1を編集および出力して、ユーザ端末装置30に送信する。特許要件適否予測リストL1には、調査対象発明の検索文書番号、新規性(拡大先願)、進歩性の要件適否がその根拠となる文献(主引用文献、副引用文献)とともに示されている。新規性(拡大先願)、進歩性の要件に適合しない(満たさない)と予測される場合は、"X"、適合する(満たす)と予測される場合は"A"が記載される。これらは、予測結果ファイルの検索フラグで判断される。
【0101】
進歩性の要件に適合しないと予測される場合の"X"(主引用文献、副引用文献有り)、"Y"(主引用文献のみ有り)、には、"H"、"L"が併記される(図20では、"H"が併記されるばあいのみ例示)これは、機械学習部133の要件適否文書ベクトルV4にしたがったもので、"H"は主引用文献で進歩性違反の拒絶理由が発行される可能性が高い場合、"L"は低い場合を示している。
【0102】
以上のように、本発明の実施の形態にかかる特許要件適否予測サーバ10では、調査対象発明の検索に用いられる検索文書を用いて検索文書データを生成し、その検索文書データを用いて主引用発明検索、副引用発明検索を行っている。主引用発明検索は、調査対象発明とその骨格において共通する、すなわち、先行技術発明のうち、調査対象発明に最も近い主引用発明を検索文書データで探し出す処理であり、特許法や特許・実用新案審査基準に沿って行われる。特許要件適否予測サーバ10では、主引用発明検索(図16参照)において、概念検索を実行することによって類似度が一定値以上の文献(1または2件以上)が主引用文献の候補として選出されてそれらが概念検索ファイル158に記録されるが、それらの中に主発明全文検索でヒットした文献と一致する文献があった場合は、その一致した文献のうち、類似度が最も大きい文献(上記最類似ヒット文献)が主引用文献に設定される(図17のステップ95)。その文献は、概念検索で類似度が一定値以上として選出され、しかも主発明全文検索で見つかった文献なので、調査対象発明と一致している可能性が高く、主引用発明として引用される可能性も高い。
【0103】
また、主発明全文検索の結果と概念検索の結果で一致する文献がない場合、概念検索で類似度が一定値以上として選出された文献には、主引用発明との関連性が認められるため、その中で類似度が最も大きい文献(最類似文献)が主引用文献に設定される(ステップ98)。さらに、主発明全文検索で見つかった文献は、調査対象発明の構成要件(K1、K2、K3)と共通する構成要件を開示していると認められるから、主引用文献になるか、そうでないとしても副引用文献とされる可能性がある。
【0104】
一方、主発明全文検索で一致する文献が見つからなかった場合には、調査対象発明の構成要件(K1、K2、K3)と同じ構成要件を開示している文献が見つからなかった場合に相当するが、その場合は、概念検索で見つかった最類似文献が主引用文献に設定されたうえで、副引用発明検索(図18)が行われる。その場合、完全フラグが同じレコードに文献がセットされていればその文献が副引用文献にセットされる。完全フラグが同じレコードの文献は、それらが共に揃うことで調査対象発明の構成要件(K1、K2、K3)と同じ構成要件の存在が認められることを示す文献なので、少なくとも副引用文献として引用される可能性が認められる。ステップ99の処理、またはステップ97で副引用文献を検索する処理は、調査対象発明と主引用発明との相違点を含むと認められる文献を検索する処理である。
【0105】
以上のように、本発明の実施の形態にかかる特許要件適否予測サーバ10では、主引用発明検索処理を実行し、その結果にしたがい副引用発明検索処理を実行して、双方の結果から進歩性の要件適否を判断しているため、特許法や特許・実用新案審査基準に沿って進歩性の要件適否が判断される。したがって、特許要件の適否に関する予測が審査実務に適合した内容で行われるので、特許出願の出願書類の準備負担が有効に軽減される。しかも、類似度が一定値以上の文献が主引用文献の候補として選出され、類似度が最も高い文献のみならずその次の文献も主引用文献となりえるため、その次の文献が主引用文献とされる可能性も含めた予測が可能となり、したがって
予測の精度が高められる。
【0106】
一方、前述したように、特許要件適否予測処理部103が機械学習部133を有しているが、その機械学習部133は過去の審査実績に基づく学習データで訓練された人工知能プログラムで構築されている。
【0107】
ところで、平成26年の実績ベースで年間32万数千件程度の特許出願が出されており、その一部またはそれ以前の多数の特許出願について1stアクションがすでに発行されている。その中には、拒絶理由通知で進歩性違反の拒絶理由が指摘されている出願(進歩性拒絶出願)が多数存在している。
【0108】
進歩性拒絶出願では、審査結果が、審査時点の請求項に記載された発明と主引用発明とに相違点があったものの、その相違点だけでは、進歩性があるとは審査官によって判断されなかったということを意味している。これに対し、特許出願の中には、1stアクションが発行されることなく特許査定が発行された出願や、拒絶理由通知が発行されたものの、その理由に進歩性違反の拒絶理由が指摘されていなかった出願(進歩性拒絶無し出願)も存在している。
【0109】
そして、例えば図19に示すように、審査対象となる特許出願Pdがあり、その出願日がtであったとすると、特許出願Pdに対する主引用発明または副引用発明となりえるのは、公知、公用、文献公知およびインターネット公知の発明であり、主に出願日tより前にすでに公開されている出願の特許公開公報(図19では、rf1〜rf6)に開示されている発明である。
【0110】
ここで、仮に、審査の結果、公報rf6に開示されている発明が主引用発明に該当すると判断されたとする。すると、その場合、特許出願Pdに係る発明と、その公報rf6に開示されている発明とに相違点があったものの、その相違点に応じた距離dpが、特許出願Pdに係る発明の進歩性を肯定するに足りる大きさではなかったと考えられる。逆に、公報rf6に開示されている発明が主引用発明には該当しないと判断されていたとすれば、距離dpが、出願Pdに係る発明の進歩性を肯定するに足りる大きさであったと考えられる。
【0111】
もし、発明の進歩性が肯定されるときの相違がどの程度で、否定されるときの相違がどの程度なのかが割り出せれば、それが特許要件適否の客観的な判断材料になると考えられるが、以上を考慮すると、そのためには、2つの発明の相違に応じた距離dpがどの程度なのかを割り出すのが有効であると考えられる。これを過去の審査実績に基づく訓練データの学習によって割り出し、進歩性が否定されるおそれが高いのか、それとも低いのかの目安を付けるのが機械学習部133である。
【0112】
機械学習部133の学習において、本件出願にかかる発明(本願発明)では、距離dpを2つの文書ベクトルの差分と捉え、進歩性の拒絶理由有りの場合、無しの場合それぞれの距離dpを学習するため、前述のHLパターンによる訓練データで学習が行われている。
【0113】
そして、特許要件の適否を予測する場合は、調査対象発明について、検査文書データを用いて概念検索で最類似文献を含む類似度が一定値以上の文献(1または2以上)を探し出す。また、検査文書データを用いて全文検索(主発明全文検索)を行い、ヒットする文献を探し出す。類似文献は、検索対象発明ベクトルとの類似度が高い文書ベクトルを有しているので、公開済出願の中で主引用文献になる可能性が高いと認められる。しかしながら、これらの中に全文検索でヒットした文献と一致する文献(類似ヒット文献)があったときは、そのうちの類似度が最も高い文献(最類似ヒット文献)だけで新規性、進歩性の要件が否定される可能性が高いと認められる。そこで、最類似ヒット文献から求めた引用候補ベクトルRfVと、調査対象発明の検索文書データから求めた要旨ベクトルEVとの差分を求めて発明移動ベクトルV3を生成し、これを機械学習部133に入力して、最類似ヒット文献を引用する進歩性違反の拒絶理由が有るのか、無いのかが出力されるようにしている。これにより、進歩性違反の拒絶理由が見つかる可能性が高いのか、低いのかの目安を付けることが可能になる。
【0114】
以上のように、特許要件適否予測サーバ10では、機械学習部133を備えていることによって、特許庁の審査実績を反映させる形で特許要件適否の予測が行われることになる。従前のような審査官や弁理士などの専門家の経験や勘だけに頼らざるを得ない判断結果に人工知能の判断結果を生かせるようになるため、予測結果に客観性を持たせることが可能になる。従来の先行技術調査は、関連性のある先行技術文献がピックアップされるに過ぎなかったが、本実施の形態によれば、調査結果に特許要件適否の予測結果が付加され、しかもその予測は審査実務に適合した内容で行われている。そのため、特許要件適否予測サーバ10によって、出願書類の準備負担を有効に軽減でき、権利化業務の効率向上が期待できる。
【0115】
また、進歩性予測処理部126が主引用発明検索で概念検索を行っている。進歩性違反の拒絶理由が有るのかどうかは主引用発明が見つかるか否かが大きく左右するが、その主引用発明を探す主引用発明検索で全文検索を行うと、複数の文献がヒットする可能性があり、主引用発明(主引用文献)を特定できない場合がある。この点、概念検索では、文書ベクトルの内積から求めた類似度にしたがい類似している文献が順番付けされるので、主引用文献の特定に有効である。そして、上記の要領で見つけた主引用文献に機械学習部133による予測を併用することで、その主引用文献を引用した進歩性違反の拒絶理由が出るおそれが高いのか、低いのかを予測することができる。
【0116】
以上の説明では、より好ましい実施の形態として、進歩性予測処理部126の引用発明検索部131が主引用発明検索部および副引用発明検索部を有している場合を示している。前述したように、主引用発明検索によって主引用発明が見つかると、進歩性無しの拒絶理由が見つかる可能性が高いから、主引用発明が見つかったら、その後は副引用発明検索を行うことなく入力ベクトル生成部132と、機械学習部133を作動させて要件適否文書ベクトルV4を出力するようにしてもよい。この場合でも、前述のステップ76で生成される主引用文献に関する進歩性予測データVd1と、機械学習部133により生成される要件適否文書ベクトルV4とを併用することで、審査実務に適合した内容の予測が行えるのであって、しかもその予測は人工知能の判断結果を生かしたものとなるから、予測結果に客観性を持たせることができる。したがって、進歩性予測処理部126が主引用発明検索部を有していればよく、副引用発明検索部を有していなくてもよいが、上記のように、副引用発明検索部を有する進歩性予測処理部126の方がより好ましい。
【0117】
第2の実施の形態
続いて、第2の実施の形態に係る特許要件適否予測サーバ200について、図21図26を参照して説明する。特許要件適否予測サーバ200は、図21に示すように、前述した特許要件適否予測サーバ10と比較して、特許要件適否予測処理部103、予測結果編集処理部105、予測結果記憶部156の代わりに特許要件適否予測処理部203、予測結果編集処理部205、予測結果記憶部256を有する点と、予測結果リストL1の代わりに予測結果リストL2を出力する点とで相違している。
【0118】
特許要件適否予測処理部203は、図22に示すように、特許要件適否予測処理部103と比較して、進歩性予測処理部126と予測結果ファイル生成部127の代わりに進歩性予測処理部226と予測結果ファイル生成部227を有する点で相違している。
【0119】
そして、進歩性予測処理部226は、進歩性予測処理部126と比較して、引用発明検索部131と機械学習部133の代わりに引用発明検索部231と機械学習部233を有する点と、入力ベクトル生成部132の動作が異なる点とで相違している。
【0120】
前述した第1の実施の形態に係る進歩性予測処理部126では、主引用発明検索が行われた後の概念検索後処理において、主発明全文検索の結果と概念検索の結果とを対比した結果にしたがい主引用文献を決定している。決定される主引用文献は1件だけである。これに対し、第2の実施の形態に係る進歩性予測処理部226では、類似度の降順に最類似文献を含むn件の文献(nは2以上の整数)を類似文献として抽出し、それらを主発明全文検索の結果とは対比せずに主引用文献にセットしている。また、機械学習部233が、n件の発明移動ベクトルV3〜V3をそれぞれ後述するSクラス、Hクラス、Lクラスの3つのクラスに分類する。
【0121】
引用発明検索部231は、引用発明検索部131と同様に主引用発明検索部および副引用発明検索部を有しているが、引用発明検索部131と比較して、主引用発明検索部の動作が異なり、出力されるデータも異なる。引用発明検索部231の主引用発明検索部は、進歩性予測ルーチンにおいて、ステップ73で図17に示した概念検索後処理の代わりに図28に示す概念検索後処理を実行する。すなわち、CPU11は、概念検索後処理を開始すると、ステップ96Aに処理を進め、概念検索ファイル158の文献の中で類似度の降順に類似度が最も大きい文献(最類似文献)を含む複数の文献を抽出し、それらを主引用文献にセットする。続いてステップ97に処理が進み、上記同様にして、副引用発明検索処理が実行されると、概念検索後処理が終了する。
【0122】
こうして、引用発明検索部231の主引用発明検索部は、最類似文献を含むn件の文献を類似文献として抽出し、それらを主引用文献(doc〜doc)にセットする。
【0123】
また、主引用発明検索部の動作が異なることに伴い、前述した進歩性予測ルーチンにおけるステップ76でCPU11が各類似文献に応じたn件の進歩性予測データVd1〜Vd1を生成して、それらを予測結果ファイル生成部227に出力する。また、CPU11は検索文書データiedを入力ベクトル生成部132に出力するが、各類似文献に応じたn件の概念検索データVd2〜Vd2を入力ベクトル生成部132に出力する。
【0124】
機械学習部233は、機械学習部133と比較して、次に述べるSHLパターンを学習パターンに用いた機械学習(教師付き学習)によって、各類似文献に応じたn件の発明移動ベクトルV3〜V3をそれぞれSクラス、Hクラス、Lクラスのいずれかに分類し、その分類結果に応じたn件の出力信号(要件適否文書ベクトルV4〜V4)を出力するように構築されている。Sクラス、Hクラス、Lクラスは、それぞれ、進歩性の要件に適合しない可能性が極めて高いクラス、適合しない可能性が高いクラス、適合するクラス(調査対象発明について、進歩性違反の拒絶理由が見つかる可能性が極めて高いクラス、高いクラス、無いクラス)に相当している。
【0125】
また、SHLパターンは、次のパターンS、H、Lの3つのパターンの組み合わせである。
パターンS:学習文書ベクトルが第1の学習文書ベクトルで教師ベクトルが新規性および進歩性の拒絶理由有りを示すベクトル(例えば、正解のクラスに対応した次元だけが"1"で、他が"0"のベクトル)との組み合わせ
パターンH:学習文書ベクトルが第2の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りで新規性の拒絶理由無しを示すベクトル(例えば、正解のクラスに対応した上記とは別の次元だけが"1"で、他が"0"のベクトル)との組み合わせ
パターンL:学習文書ベクトルが第3の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトル(例えば、上記2つとは別の次元だけが"1"で、他が"0"のベクトル)との組み合わせのパターンである。
【0126】
第1の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知(1stアクション)が発行された出願であって、その1stアクションで、同じ文献を引用して新規性および進歩性違反の拒絶理由(特許法第29条第1項第3号および同条第2項の要件を満たしていないとする拒絶理由)が指摘されていた出願(新規性・進歩性拒絶出願)の該拒絶理由が指摘されていた(拒絶理由通知発行時点の)請求項に応じた文書ベクトルと、そのときの引用文献1(主たる刊行物として引用されていた第1の主引用刊行物)に応じた文書ベクトル(第1の引用文書ベクトル)との差分に応じた第1の移動文書ベクトルである。
【0127】
第2の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知(1stアクション)が発行された出願であって、その1stアクションで、新規性の拒絶理由(特許法第29条第1項第3号の要件を満たしていないとする拒絶理由)は指摘されていないが、進歩性違反の拒絶理由(同条第2項の要件を満たしていないとする拒絶理由)が指摘されていた出願(進歩性拒絶出願)の該拒絶理由が指摘されていた(拒絶理由通知発行時点の)請求項に応じた文書ベクトルと、そのときの引用文献1(主たる刊行物として引用されていた第2の主引用刊行物)に応じた文書ベクトル(第2の引用文書ベクトル)との差分に応じた第2の移動文書ベクトルである。
【0128】
第3の学習文書ベクトルは、公開済出願の中で審査の結果、1stアクションが発行されずに特許査定が発行された出願(拒絶無し出願)または1stアクションは発行されたがその拒絶理由に進歩性違反の拒絶理由が指摘されていなかった出願(進歩性拒絶無し出願)の(拒絶理由通知が発行された時点の)請求項1に応じた文書ベクトルと、それら拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる文献(学習用最類似文献)に応じた文書ベクトル(非引用文書ベクトル)との差分に応じた第3の移動文書ベクトルである。
【0129】
機械学習部233は、機械学習部133と同様、情報処理に脳神経回路網をモデルにしたニューラルネットワークを適用することができるが、そのうちのBP(バックプロパゲーション)ネットワークを適用することが好ましい。
【0130】
そして、進歩性予測処理部226の入力ベクトル生成部132は図23に示すように、検索対象発明ベクトル生成部132aと、引用候補ベクトル生成部132bと、移動ベクトル生成部132cとを有しているが、そのうちの引用候補ベクトル生成部132bと、移動ベクトル生成部132cの動作が異なっている。すなわち、引用候補ベクトル生成部132bは、引用発明検索部231からn件の概念検索データVd2〜Vd2が入力されるので、そのそれぞれに含まれる各類似文献の公開公報データを入力してその特徴語を抽出し、各語に応じた重み付けを行って各類似文献に応じたn件の文書ベクトル(引用候補ベクトル)RfV〜RfVを生成する。移動ベクトル生成部132cは、検索対象発明ベクトルEVと、各引用候補ベクトルRfV〜RfVとの差分を計算して、双方の文書ベクトルの差分に応じたn件の発明移動ベクトルV3〜V3を生成する。
【0131】
前述したように、各類似文献は、主引用発明検索部による概念検索によって、最も高い類似度からその降順に抽出した文献であるため、そのいずれも調査対象発明の審査で、主引用発明の開示文献として引用される確率が高いと推測される。そのため、各類似文献を引用候補として引用候補ベクトルRfV〜RfVを求め、これらと検索対象発明ベクトルEVとの差分を計算して発明移動ベクトルV3〜V3を求めれば、調査対象発明と、各類似文献に開示されている発明との相違に応じた発明移動ベクトルV3〜V3が生成される。
【0132】
予測結果ファイル生成部227は、予測結果ファイル生成部127と比較して、図24に示したレイアウトを有する予測結果ファイルを生成してそれを予測結果記憶部256に記憶させる点と、本発明の実施の形態にかかる非適合率算出部としての動作を行い、調査対象発明に関する非適合率Vrを算出する点とで相違している。
【0133】
非適合率Vrは、調査対象発明についての進歩性の要件に適合しない可能性であって、調査対象発明について、進歩性違反の拒絶理由が見つかる可能性を示している。機械学習部233から出力される要件適否文書ベクトルV4〜V4は、進歩性の要件に適合しない可能性が極めて高い、高い、無いといった内容で生成されるので、調査対象発明について、各類似文献との関係でみた進歩性違反の拒絶理由が見つかる可能性を示している。そのため、これらを用いて予測結果ファイル生成部227が調査対象発明に関する非適合率Vrを算出する。この場合、予測結果ファイル生成部227は、その非適合率Vrを非適合率算出規則にしたがい算出する。非適合率算出規則とは、予測結果ファイル生成部227が非適合率Vrを算出する規則であって、本実施の形態では、要件適否文書ベクトルV4〜V4の中に含まれるSクラス、Hクラス、Mクラスそれぞれの件数に応じて、非適合率Vrの数値が決定されるように、図示しない算出規則テーブルに設定されている。非適合率算出規則は例えば次のようにすることができる。
【0134】
Sクラスが2件以上:Vr≧85%
Sクラスが1件で、Hクラスの件数が50%以上:Vr≧75%
Sクラスが1件で、Hクラスの件数が50%未満:Vr≧65%
Sクラスが0件で、Hクラスの件数が50%以上:Vr≧50%
Sクラスが0件で、Hクラスの件数が50%未満:Vr≧40%
Sクラス、Hクラスがともに0件:Vr≧15%
【0135】
上記非適合率算出規則によれば、例えば、類似文献が5件(前述の整数nが"5")の場合、Sクラスが2件あればVr≧85%である。また、Sクラスが1件で、Hクラスが3件ならVr≧75%になるが、Hクラスが2件だとVr≧65%、Sクラス、Hクラスがともに0件(全件がLクラス)だとVr≧15%になる。
【0136】
そして、図24に示すように、予測結果ファイル生成部227が生成する予測結果ファイルは、予測結果ファイル生成部127が生成する予測結果ファイルと比較して、非適合率Vrが含まれている点で相違している。
【0137】
また、予測結果編集処理部205は、予測結果編集処理部105と比較して、予測結果ファイルを読み込み、図25に示すような特許要件適否予測リストL2を編集および出力する点で相違している。特許要件適否予測リストL2は、特許要件適否予測リストL1と比較して、OA率が追加されている点で相違している。OA率とは、調査対象発明について、審査過程で特許要件(新規性または進歩性)に違反する拒絶理由が見つかり、それを示す拒絶理由通知書が発行される可能性を示していて、前述した非適合率Vrに相当する数値が示されている。
【0138】
以上のように、第2の実施の形態に係る特許要件適否予測サーバ200では、特許要件適否予測処理部203の進歩性予測処理部226において、引用発明検索部231が最類似文献を含むn件の類似文献を主引用文献にセットしている。また、機械学習部233が各類似文献に応じた発明移動ベクトルV3〜V3をSクラス、Hクラス、Lクラスの3つに分類し、その分類結果に応じた要件適否文書ベクトルV4〜V4を出力する。
【0139】
第1の実施の形態に係る特許要件適否予測サーバ10では、特許要件適否に関する予測が審査実務に適合した内容で、しかも特許庁の審査実績を反映させる形で行われる。この点は、特許要件適否予測サーバ200も同様である。
【0140】
しかし、特許要件適否予測サーバ10では、主引用発明検索で複数の文献が類似文献として抽出されるも、後続の概念検索後処理において、そのうちの1件だけ(最類似ヒット文献または最類似文献)が主引用文献とされるに過ぎなかった。その決定された文献は、実際の審査の結果、主引用文献として引用される可能性が高いと考えられるが、実際の審査で引用されるとは限らないし、その決定された文献と、その次の類似度の文献(次類似文献)とで類似度の相違がごくわずかでしかなく、その次類似文献の方が主引用文献として適切な場合も十分に考えられる。そのため、主引用発明検索で最類似文献を含む複数の文献を抽出し、これらを対象として機械学習部233による文書ベクトルの分類を行えば、次類似文献をも考慮に入れた形で特許要件適否に関する予測が行われる。そのため、特許要件適否予測サーバ10の予測の精度よりも、特許要件適否予測サーバ200の予測の精度が向上する。
【0141】
また、実際の審査実務では、ある特許出願について、進歩性違反の拒絶理由が見つかるとき、進歩性違反の拒絶理由と新規性違反の拒絶理由とが同じ文献(この場合に引用される文献を新規性・進歩性拒絶引用文献ともいう)を引用して指摘される場合がある。このような場合、その特許出願にかかる請求項にかかる発明と、新規性・進歩性拒絶引用文献に開示されている発明とに相違がないと審査官によって判断されているから、発明移動ベクトルV3〜V3の中にSクラスへ分類される文書ベクトルが含まれているときは、進歩性違反の拒絶理由が見つかる可能性がそうでない場合に比べてより高くなっていると考えられる。したがって、新規性・進歩性拒絶出願からみた距離dpと、進歩性拒絶出願からみた距離dpとが区別できるように、SHLパターンによる機械学習を行って機械学習部233を構築しておくことで、進歩性違反の拒絶理由が見つかる可能性が極めて高い場合とそうでない場合とを区別した予測が可能になる。こうすることで、特許要件適否予測サーバ200による予測精度の向上と、業務効率のより一層の改善が期待できる。
【0142】
(変形例1)
上記の進歩性予測処理部226では、一つの機械学習部233がn件の発明移動ベクトルV3〜V3の分類を行っていたが、図26に示した特許要件適否予測処理部213における進歩性予測処理部227のように、発明移動ベクトルV3〜V3に応じた複数の機械学習部233〜233を有し、そのそれぞれが発明移動ベクトルV3〜V3を分類するようにしてもよい。また、図示はしないが、入力ベクトル生成部132も、概念検索データVd2〜Vd2の件数に応じて複数設けてもよい。これらのようにすると、各機械学習部233〜233または各入力ベクトル生成部132が並行に処理を実行するので、処理時間を短縮することができる。
【0143】
(変形例2)
以上述べた各実施の形態では、特許要件適否予測サーバ10,200に特許要件適否予測プログラムがインストールされることによって、特許要件適否予測サーバ10,200が特許要件適否予測装置として機能する場合を例にとって説明している。その他、本発明は、ユーザ端末装置30が特許要件適否予測装置として機能する場合についても適用がある。この場合、前述した特許要件適否予測プログラムについて少なくとも以下の変更点1)、2)にしたがった変更を行い、その変更後の特許要件適否予測プログラムを特許要件適否予測サーバ10,200からユーザ端末装置30にダウンロードし、ユーザ端末装置30にインストールすればよい。
【0144】
変更点1) 入力操作を行うための画像データを特許要件適否予測サーバ10,200からユーザ端末装置30に送信することなくユーザ端末装置30に表示させる。
変更点2) 特許要件適否予測リストをユーザ端末装置30が出力する。
【0145】
以上の説明は、本発明の実施の形態についての説明であって、この発明の装置及び方法を限定するものではなく、様々な変形例を容易に実施することができる。また、各実施形態における構成要素、機能、特徴あるいは方法ステップを適宜組合わせて構成される装置又は方法も本発明に含まれるものである。
【0146】
例えば、ユーザ端末装置は高機能携帯電話機や、タブレット型の端末装置ではなく、ノートパソコンや、PDAでもよい。なお、CPU11が実行する特許要件適否予測プログラムは、磁気記録媒体、CD−ROM,DVD等の各種記録媒体に記録することができるし、ネットワークを介して図示しないサーバからダウンロードすることもできる。
【0147】
また、上記実施形態では、検索文書が予測付き検索画面181を用いて入力される場合を想定しているが、予測付き検索画面181のようにして入力エリアを区分けせず1つにし、そのエリアから思いついたままの文書をユーザが入力させて、その入力文書をそのまま検索文書としてもよい。ただし、予測付き検索画面181を用いることによって、発明の名称、目的・課題、解決手段といった区分けがなされ、そのそれぞれに応じた文書が入力されることで、検索文書が発明の要旨特定に有益な情報を含むようにパターン化(ないし定型化)される。こうすることで、調査対象発明がより明確に特定され得るため、より有効な検索が可能になる。
【0148】
上記実施形態では、検索文書を用いて検索文書データを生成し、その検索文書データを用いて全文検索、概念検索が実行されているが、入力された検索文書を用いて全文検索、概念検索が実行されてもよい。
【0149】
第1の実施の形態では、概念検索後処理(図17)において、主発明全文検索の結果と概念検索の結果の対比結果にしたがい主引用文献が決定されている。その際、最も類似度が高い文献を主引用文献としているが(ステップ95,98)、これらのステップ95,98およびステップ96で、類似度の降順に最も類似度が高い文献を含む複数の文献を主引用文献としてもよい。
【産業上の利用可能性】
【0150】
本発明を適用することにより、出願書類の準備負担軽減が有効になるように、調査対象発明について、審査実務に適合した内容の特許要件の適否に関する予測を行うことができ、しかも予測の精度が高められる。本発明は、特許要件適否予測装置および特許要件適否予測プログラムの分野で利用することができる。
【符号の説明】
【0151】
1…特許要件適否予測システム、10,200…特許要件適否予測サーバ、11,31…CPU、30…ユーザ端末装置、101…検索文書データ生成部、102…sstテーブル生成部、103,203,213…特許要件適否予測処理部、105…予測結果編集処理部、125…新規性・拡大先願予測処理部、126,226,227…進歩性予測処理部、132…入力ベクトル生成部、132a…検索対象発明ベクトル生成部、132b…引用候補ベクトル生成部、132c…移動ベクトル生成部、133,233…機械学習部、153…検索文書データ記憶部、154…sstテーブル、156,256…予測結果記憶部、L1、L2…予測結果リスト。
【要約】
【課題】調査対象発明について、審査実務に適合した内容の特許要件の適否に関する予測が行われて出願書類の準備負担が有効に軽減される。
【解決手段】特許要件適否予測サーバは、検索文書を用いて公開公報データを検索し、その検索結果に応じて、新規性予測データを生成する新規性予測処理部と、進歩性予測データを生成する進歩性予測処理部とを有する特許要件適否予測処理手段を有する。進歩性予測処理部は、主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、主引用発明検索部は最類似ヒット文献を主引用発明が開示されている主引用文献とし、文書分類部は、機械学習によって、入力される発明移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築されている。
【選択図】図4
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28