(58)【調査した分野】(Int.Cl.,DB名)
前記判定ステップは、前記発明文章を構成要素ごとに切り分けた上で、切り分けられた前記構成要素ごとに前記特許文章群に含まれる文章との編集距離を基に前記発明文章の特許性を判定する
ことを特徴とする請求項1または2に記載の特許評価判定方法。
前記特許文章群抽出ステップは、前記特許文章群に付与されている特許分類を抽出して、当該抽出された特許分類の中から抽出数が多い上位特許分類を選択し、前記検索キーワードおよび前記選択された上位特許分類を用いて前記特許文章群を再度抽出する
ことを特徴とする請求項1から3のいずれか一項に記載の特許評価判定方法。
前記特許文章群抽出ステップは、前記検索キーワードおよび前記選択された上位特許分類を用いて得られた前記特許文章群の中から分散表現空間における前記検索キーワードと近接する特許群に絞り込んだ結果を前記特許文章群として抽出する
ことを特徴とする請求項4に記載の特許評価判定方法。
前記判定ステップは、前記発明文章および前記特許文章群に含まれる文章を比較して前記発明文章と類似する特許文章を抽出し、前記発明文章および当該抽出された特許文章との類似度を判定することで前記発明文章の特許性を判定する
ことを特徴とする請求項1〜5のいずれか一項に記載の特許評価判定方法。
【発明を実施するための形態】
【0018】
以下、本開示の一側面に係る特許評価判定システム、特許評価判定方法、および特許評価判定プログラムについて図を参照しつつ説明する。但し、本開示の技術的範囲はそれらの実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶ点に留意されたい。
【0019】
(特許評価判定システム1による処理の概要)
図1は、特許評価判定システム1による処理の一例を説明するための模式図である。
【0020】
特許評価判定システム1は、複数のユーザの端末装置2、2、2・・・および特許文章データベース3、これらの複数のユーザの端末装置2および特許文章データベース3と相互に通信されるサーバ4を有する。サーバ4は、複数のユーザの端末装置2から特許性の評価判定を希望する発明文章を受信して、当該発明文章に含まれる発明を代表するキーワードを検索キーワードとして抽出する検索キーワード抽出部412を有する。サーバ4は、抽出された検索キーワードを基に特許文章データベース3から類似特許文章群を抽出する特許文章群抽出部413を有する。そして、サーバ4は、複数のユーザの端末装置2、2、2・・・から受信した発明文章と抽出された特許文章群とを比較して、発明文章の特許性を判定する判定部414を有する。そして、サーバ4は、判定部413が判定した特許性の評価を複数のユーザの端末装置2、2、2・・・に送信する。
【0021】
なお、本実施形態では、特許文章データベース3に記憶されている特許文章を検索対象として記載しているが、サーバ4は、特許文章データベース3から特許文章をダウンロードしてサーバ4内で類似特許文章群を抽出する構成としてもよい。この構成によると、処理をローカルで完結できるため、処理速度を早めることができる。
【0022】
特許文章データベース3は、例えば特許庁のデータベースである。特許庁のデータベースは、1庁でも複数庁を含んでいてもよい。なお、米国、欧州、日本、中国、および韓国の5庁のデータベースを含むことで世界の特許の約90%を網羅することができるため、特許性の判定の精度を上げるためには、これらの5庁のデータベースを含んでいるとよい。
【0023】
また、ユーザの端末装置2、2、2・・・からサーバ4が受信する発明文章は、特許庁にて公開になっている公知文献に含まれる請求項でもよい。また、出願前の請求項に関する文章でもよく、出願審査後などの補正予定の請求項でもよい。なお、この発明文章は、1つの発明のみを含んでいることが望ましい。すなわち、1つの請求項の形式の記載であるとよい。もちろん、複数の請求項の形式で発明文章をユーザの端末装置2がサーバ4に送信することも可能である。その場合、発明ごとの区切りをサーバ4のサーバ処理部416が認識して発明ごとに特許性の判定を行なうとよい。なお、本実施形態においては、出願前の発明の内容を発明文章として説明するが、本発明はこの構成に限定されない。
【0024】
(特許評価判定システム1の概略構成)
図2は、特許評価判定システム1の概略構成の一例を示す図である。
【0025】
特許評価判定システム1は、複数のユーザの端末装置2、2、2・・・と、特許文章データベース3と、サーバ4とを有する。以下では、複数のユーザの端末装置を単にユーザの端末装置2と称する場合がある。ユーザの端末装置2、2、2・・・およびサーバ4は、例えば、インターネット5などの通信ネットワークを介してそれぞれ相互に接続される。更に、特許文章データベース3およびサーバ4は、例えば、インターネット5などの通信ネットワークを介してそれぞれ相互に接続される。また、ここではインターネット5が1つ例示されているが、インターネット5が複数のネットワークからなる場合は、それぞれのネットワーク間にゲートウェイ(図示しない)を適宜設けてもよい。ユーザの端末装置2で実行されるプログラム(例えば、閲覧プログラム)と、サーバ4で実行されるプログラム(例えば、管理プログラム)とは、ハイパーテキスト転送プロトコル(HTTP)などの通信プロトコルを用いて通信を行う。
【0026】
更に、ユーザの端末装置2とサーバ4との間の接続、および特許文章データベース3とサーバ4との間の接続は、扱う情報が機密情報となるため、インターネット5の通信環境がセキュリティーの面で優れている必要がある。また、ユーザの端末装置2とサーバ4との間の接続、および特許文章データベース3とサーバ4との間の接続は、専用の回線を用意することでセキュリティーを強化することができる。
【0027】
(ユーザの端末装置2の概略構成)
図3は、ユーザの端末装置2の概略構成の一例を示す図である。
【0028】
ユーザの端末装置2は、無線通信ネットワークへの接続、Webアクセスなどを実行する。そのために、ユーザの端末装置2は、端末通信部211と、端末記憶部212と、端末操作部213と、端末表示部214と、端末処理部215とを備える。
【0029】
なお、ユーザの端末装置2としては、タブレットPCやノートPCを想定するが、本発明はこれに限定されない。ユーザの端末装置2は、本発明が適用可能であればよく、例えば、多機能携帯電話(所謂「スマートフォン」)、携帯電話(所謂「フィーチャーフォン」)、携帯情報端末(PDA)、携帯ゲーム機、携帯音楽プレイヤ、タブレット端末、などでもよい。
【0030】
端末通信部211は、通信インターフェース回路を備え、ユーザの端末装置2をインターネット5に接続する。端末通信部211は、ネットワークを介して端末処理部215から供給されたデータをサーバ4などに送信する。また、端末通信部211は、ネットワークを介してサーバ4などから受信したデータを端末処理部215に供給する。
【0031】
端末記憶部212は、例えば、半導体メモリ装置を備える。端末記憶部212は、端末処理部215での処理に用いられるオペレーティングシステムプログラム、ドライバプログラム、アプリケーションプログラム、データなどを記憶する。例えば、端末記憶部212は、ドライバプログラムとして、端末操作部213を制御する入力デバイスドライバプログラム、端末表示部214を制御する出力デバイスドライバプログラムなどを記憶する。また、端末記憶部212は、アプリケーションプログラムとして、店舗関係者が端末操作部213を操作することによって入力された検索条件、特徴情報および特徴画像などをサーバ4に登録するための登録画面を表示する閲覧プログラムなどを記憶する。各種プログラムは、例えばCD−ROM、DVD−ROMなどのコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラムなどを用いて端末記憶部212にインストールされてもよい。また、端末記憶部212は、所定の処理に係る一時的なデータを一時的に記憶してもよい。
【0032】
端末操作部213は、ユーザの端末装置2の操作が可能であればどのようなデバイスでもよく、例えば、マウス、タッチパネル、またはキーボタンなどである。ユーザは、端末操作部213を用いて、情報の選択や解除、文字や数字などを入力することができる。端末操作部213は、ユーザにより操作されると、その操作に対応する信号を発生する。そして、発生した信号は、端末処理部215に送信される。
【0033】
端末表示部214も、映像や画像などの表示が可能であればどのようなデバイスでもよく、例えば、液晶ディスプレイや有機EL(Electro−Luminescence)ディスプレイなどである。端末表示部214は、端末処理部215から供給された映像データに応じた映像や、画像データに応じた画像などを表示する。
【0034】
端末処理部215は、一または複数個のプロセッサおよびその周辺回路を備える。端末処理部215は、ユーザの端末装置2の全体的な動作を統括的に制御するものであり、例えば、CPUである。端末処理部215は、ユーザの端末装置2の各種処理が端末記憶部212に記憶されているプログラムや端末操作部213の操作などに基づいて適切な手順で実行されるように、端末通信部211や端末表示部214などの動作を制御する。端末処理部215は、端末記憶部212に記憶されているプログラム(オペレーティングシステムプログラムやドライバプログラム、アプリケーションプログラムなど)に基づいて処理を実行する。また、端末処理部215は、複数のプログラム(アプリケーションプログラムなど)を並列に実行することができる。
【0035】
端末処理部215は、ユーザの端末装置2の外部から受信した画面表示情報をユーザに閲覧可能な画面表示として処理をする機能や、ユーザからの端末操作部213の操作内容に基づく処理をユーザの端末装置2の外部に送信可能な信号に変換して端末通信部211に送る機能を備える。これらの機能は、端末処理部215が備えるプロセッサで実行されるプログラムにより実現される機能モジュールである。あるいは、これらの各部は、独立した集積回路、マイクロプロセッサ、またはファームウェアとしてユーザの端末装置2に実装されてもよい。
【0036】
(ユーザの端末装置2の処理)
ユーザの端末装置2は、ユーザに操作される。ユーザは、端末操作部213を操作して特許性の判定を行いたい発明文章をユーザの端末装置2に入力する。必要に応じて端末処理部215が発明文章の誤記修正を行なったり、文法の修正を行なったりしてもよい。
【0037】
また、ユーザの端末装置2は、企業の端末装置や企業全体のネットワークであってもよい。更にユーザの端末装置2は、特許庁の端末装置や特許庁全体のネットワークであってもよい。
【0038】
(特許文章データベース3の構成)
特許文章データベース3は、サーバ4の要求に応じて所望の特許文章群をサーバ4に提供する。すなわち、特許文章データベース3は、サーバ4から受信した検索条件に基づいて当該検索条件に該当する特許文章群を抽出して、サーバ4に送信する。特許文章データベース3は、サーバ4からの要求がある度に特許文章を検索してサーバ4に送信してもよく、定期的に代表的な検索結果について特許文章データベース3が特許文章をサーバ4に送信してもよい。特に図示しないが、特許文章データベース3は、処理部、通信部、および記憶部などのサーバとしての構成要素を備えているとよい。
【0039】
更に、サーバ4が特許文章データベース3を兼ねている場合、特許文章データベース3は、特許文章をサーバ4に送信してサーバ4のサーバ記憶部411などが特許文章を記憶する。特許文章データベース3は、サーバ4からの要求に応じて特許文章をサーバ4に送信してもよく、特許文章データベース3の主動によって特許文章をサーバ4に送信してもよい。この場合、サーバ4は、サーバ4内で検索および判定を完結できるため、処理速度を自由に調整することができる。
【0040】
特許文章データベース3は、新しく公開された公開特許公報や登録特許公報を蓄積して記憶している。特許文章データベース3は、過去の特許文章全てにおいて、項目分けされているとよい。例えば、要約、特許請求の範囲(請求項)、全文などに分かれているとよい。本実施形態で特許評価判定システム1は、後術する通り全文検索および請求項に含まれる検索キーワードのフリーワード検索を行なう。
【0041】
(サーバ4の概略構成)
図4は、サーバ4の概略構成の一例を示す図である。
【0042】
サーバ4は、サーバ4の記憶領域であるサーバ記憶部411を含む。また、検索キーワード抽出部412、特許文章群抽出部413、判定部414、および生成部415を含むサーバ処理部416を更に備える。更に、サーバ4は、ユーザの端末装置2および特許文章データベース3と通信するためにサーバ通信部417を備える。
【0043】
サーバ記憶部411は、例えば、半導体メモリ、磁気ディスク装置および光ディスク装置の内の少なくとも一つを有し、バスを介してサーバ4と接続される。サーバ記憶部411は、サーバ処理部416による処理に用いられるドライバプログラム、オペレーティングシステムプログラム、アプリケーションプログラム、データなどを記憶する。例えば、サーバ記憶部411は、ドライバプログラムとして、サーバ通信部417を制御する通信デバイスドライバプログラムなどを記憶する。コンピュータプログラムは、例えばCD−ROM、DVD−ROMなどのコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラムなどを用いてサーバ記憶部411にインストールされてもよい。また、サーバ記憶部411は、特許文章テーブルなどを記憶する。なお、サーバ記憶部411は、本発明の記憶部に相当することができる。
【0044】
サーバ処理部416は、検索キーワード抽出部412、特許文章群抽出部413、判定部414、および生成部415を含む。サーバ処理部416による機能は、サーバ処理部416が備えるプロセッサで実行されるプログラムにより実現される機能モジュールである。あるいは、これらの各部は、独立した集積回路、マイクロプロセッサ、またはファームウェアとしてサーバ4に実装されてもよい。なお、サーバ処理部416の処理内容は後述する。また、サーバ処理部416の構成要素の切り分けは、一例であって、どの構成要素がどの処理を行うかは、本実施形態の記載に限定されない。
【0045】
検索キーワード抽出部412は、ユーザの端末装置2からサーバ通信部417が受信した発明文章に含まれる複数の単語から特許文章群を検索するための検索キーワードを抽出する。検索キーワード抽出部412は、受信された発明文章を要素毎に分割する。具体的には、小用語解析を用いるとよい。すなわち、発明文章を複数の単語単位に分割して、どの単語がどの単語を修飾しているかの係り受け関係を抽出する。発明文章が英文などの場合には、ピリオド、コロン、セミコロン、カンマ、や関係代名詞の優先順位で分割をするデリミタ処理を行うとよい。そして、発明文書中に含まれる複数の単語の中から検索キーワードを抽出する。例えば、出現頻度の高い単語を検索キーワードとして抽出してもよく、単語の係り受け関係から重要な用語を検索キーワードとして抽出してもよい。すなわち、検索キーワードは、ユーザが入力した発明文章が属する技術分野を1単語で表すための用語である。なお、検索キーワードは、通常1つの単語であるが、検索キーワードを1つに絞込み辛い場合などは、複数の単語としてもよい。入力された発明文章から検索キーワードを抽出する技術は、一般的な技術を用いればよく、上記手法には限定されない。
【0046】
このように、発明文章において重要な検索キーワードを発明文章から抽出することで特許文章群抽出部413が容易に特許文章群を抽出することができる。また、特許評価判定システム1として、特許性の評価判定をすばやく処理することができる。
【0047】
特許文章群抽出部413は、検索キーワード抽出部412が抽出した検索キーワードを用いて入力された発明文章に類似する特許文章群を抽出する。特許文章群の抽出は、特許文章データベース3に含まれる特許文章を単にキーワード検索によって検索してもよい。例えば、検索キーワードが特許文章の全文に記載されている特許文章群を検索結果としてもよく、検索キーワードが全請求項に記載されている特許文章群を検索結果として抽出してもよく、請求項1に検索キーワードが記載されている特許文章群を検索結果として抽出してもよい。本実施形態においては、特許文章の全文において検索キーワードが検出される検索結果を特許文章群としているが、本発明は、検索対象箇所に限定されない。検索対象文章が短い程、処理が軽くなるため、簡易調査として請求項1のみを検索対象とすることもできる。
【0048】
特許文章群抽出部413は、検索キーワードが含まれる特許文章群の中から当該検索キーワードの重要度を考慮して特許文章群の精度を上げてもよい。例えば、特許文章群抽出部413は、TF−IDF法などを用いて、検索キーワードが特許文章群に含まれる文章においてどの程度の重要度があるかを評価する。ここでは、検索キーワードが1つの特許文章全体において出現する特許文章は、重要度が低いと仮定し、1つの特許文章において特定の文章にしか出現しない場合は、重要度が高い仮定する。なお、TF−IDF法などを用いて、検索キーワードに対する特許文章群の抽出は、ユーザが端末装置2に発明文章を入力し、検索キーワードが得られた際に行なわれてもよく、代表的な検索キーワードに対する特許文章群を予めサーバ記憶部411内に記憶しておいてもよい。
【0049】
このように、特許文章群抽出部413は、単にフリーワード検索において抽出された特許文章群と比較して、検索キーワードの重要度を考慮した上で特許文章群を抽出できるため、無駄な処理をせずに精度の高い特許評価判定を特許評価判定システム1が実施できる。また、より最適な特許文章群を抽出することで、特許評価判定システム1は特許性の評価判定をすばやく処理することができる。
【0050】
判定部414は、特許文章群抽出部413が抽出した特許文章群に含まれる文章の全文(以降「特許文章群の全文)と記載することもある)と発明文章とを比較して類似度を求める。判定部414は、特許文章群に含まれる文章の全文および発明文章を最小の文単位(以降最小文と呼ぶ)に分割して、これらの最小文同士の類似度を求める。すなわち、発明文章に含まれる構成要素単位に文章を最小文に分割して、構成要素が特許文章群に開示されているか否かを判定することで類似度を求める。なお、判定部414は、発明文章に含まれる最小文が1つの特許文章に含まれているか、複数の特許文章に分かれて記載されているかを類似度に反映させてもよい。1つの文章に全ての最小文が開示されている場合、入力された発明文章の新規性が欠如していると判定できる。また、複数の特許文章に最小文がまたがって記載されている場合には、入力された特許文章に進歩性が欠如していると判定できる。
【0051】
このように、判定部414は、予め最小文に発明文章および特許文章を区切った上で、発明文章および特許文章群の比較を行なうため、発明文章の全体および特許文章全体を比較するよりも小規模で文章同士の類似判定ができる。よって、特許評価判定システム1による類似判定の精度が向上する。
【0052】
判定部414は、類似度を求める際に、以下の類似度のスコア算出式によりとしてのスコア付けを行う。なお、このスコア算出は、最小文同士を元に算出されるが、発明文章全体および特許文章群の全文の編集距離を求める構成としてもよい。
類似度のスコア算出式=(発明文章の長さペナルティ)×(最小文の単語単位での含有率)×(文字列レベルでの編集距離の逆数)
ここで、編集距離とは2つの文字列があったとき、1つの文字列をもう1つに編集するときの距離である。すなわち、1文字の追加または削除は、スコアが1となり、1文字削除して追加した場合はスコアが2となるように算出される。本発明の特許性の判定に編集距離を用いるのは、表記ゆれを吸収するためである。
また、発明文の長さペナルティは、短すぎる文同士を比較した際に編集距離が小さくなり過ぎるため、補正をかけるための係数である。
【0053】
このように、判定部414は、編集距離を用いて発明文章と特許文章群の類似の判定を行なうことで、単語や文字単位で詳細に文章同士の類似度を正確に算出することができる。通常の特許評価判定方法では、類似した単語がいくつ含まれているかに応じて特許性の判定を行なっているが、編集距離を用いることで文章として意味までも類似しているか判定することが可能になる。
【0054】
判定部414は、上記の通り特許文章群について類似度を求め、類似度の高い特許文章と発明文章との類似度に応じて特許性の判定結果の算出を行なう。類似度から最終的な特許性の判定を行なう手法は、さまざまな手法があり、本発明は、これらの手法には限定されない。
【0055】
例えば、ユーザによって入力された発明文章の最小文と類似度の高い特許文章の全文の最小文との編集距離に基づいて算出されたスコアおよび分散表現空間で合致している特許文章の全文のスコアを合算し、特許文章の全文の構成要素である最小文ごとにスコアを判定する。そして、判定部414は、スコアを0〜1で正規化してパーセントとして出力する。
【0056】
更に、判定部414によるランク付けはA〜Dの4段階とした場合、Aは特許性が最も高く、B〜Dと段階的に特許性が下がっていく。このランク付けの判断は、発明文章の要素全てに対してのスコアによって算出される。
【0057】
判定部414は、類似度の高い特許文章を複数抽出してもよい。本実施形態においては、3件の類似特許文章を抽出する構成としている。例えば、類似特許文章の全文の最小文である構成要素のうち、最大スコア(3件の特許文章での最大類似度)が1つでも所定値よりも低いものがあればBランク以上とし、2つ以上所定値より低いものがあればAランクとする。また、最大スコアの最小値(どの構成要素も特許文章のいずれかに記載がある)が所定値より高ければDランクとする。また、構成要素のほとんどのスコアが所定値より低い場合は、Bランクとして、構成要素の半数が高くなければCランクとする。これらのいずれの条件にも該当しない場合、判定部414は文書全体のキーワード一致率や、ベクトル類似度からランクを付与してもよい。
【0058】
特許性をランク付けによって表示することでユーザは、簡単に特許性の判定を把握することができる。また、1件でも類似度の高い特許文章が抽出された場合にはランクを下げることで正確な特許性判断結果をユーザの端末装置2に送信することができる。
【0059】
図5は、判定部414による発明文章の類似特許との類似スコアを示す表の一例である。発明文章は、構成要素AAA、構成要素BBB、構成要素CCC、および構成要素DDDの4つの構成要素に分割されており、類似特許X、類似特許Y、および類似特許Zとの類似度がパーセントで示されている。上記ランク付けルールによると、発明文章のランクはCランクとなり、類似度と共に判定結果として算出される。
【0060】
生成部415は、ユーザの端末装置2に送信されるさまざまな表示画面を生成する。特に、判定部414が判定した特許性の判定結果を含む画面を生成して、サーバ通信部417を介してユーザの端末装置2に送信する。
【0061】
生成部415が生成した特許性の判定結果は、サーバ記憶部411に記憶されてもよい。しかしながら、発明文章の機密観点から発明文章の内容および特許性の判定結果もサーバ記憶部411に記憶せずに、これらの情報を一時的な保存領域(メモリ)に記憶して、ユーザの端末装置2に送信する構成とする方が好ましい。この一時的な保存領域もサーバ記憶部411が司ってもよい。
【0062】
サーバ通信部417は、サーバ4をインターネット5に接続するための通信インターフェース回路を有する。サーバ通信部417は、ユーザの端末装置2から特許性の判定を求める発明文章を受信し、判定部414による判定結果をユーザの端末装置2に送信する。また、サーバ通信部417は、特許文章データベース3から特許文章の提供を受ける際に、情報を受信する。サーバ通信部417は、必要に応じてユーザの端末装置2とさまざまな通信を行い、サーバ通信部417は、必要に応じて特許文章データベース3とさまざまな通信を行う。
【0063】
(特許評価判定システム1による処理)
図6は、本実施形態にかかる特許評価判定システム1によるユーザの端末装置2から発明文章の判定要求に応じて、当該発明文章の特許性を判定し、判定結果をユーザの端末装置2に送信するまでの一連の流れの動作シーケンスの一例を示す図である。
【0064】
以下に説明する動作シーケンスは、予めサーバ記憶部411に記憶されているプログラムに基づいて、主にサーバ処理部416により、サーバ4の各要素と協働して実行される。また、以下に説明する動作シーケンスにおいて、サーバ4は、サーバ通信部417を介してユーザの端末装置2と各種の情報を送受信する。
【0065】
最初にサーバ4のサーバ通信部417は、ユーザの端末装置2から特許性の判定を行ないたい発明文章を受信する(ステップS101)。なお、本処理は、発明文章をサーバ通信部417がユーザの端末装置2から受信した際に開始される。
【0066】
続いて、サーバ処理部416は、発明文章が特許性の判定を行なうためにふさわしい形式で記述されているかをサーバ処理部416は判定する(ステップS102)。例えば、本実施形態では、発明文章が1つの発明からなっている必要があるため、読点が複数存在する文章であれば、サーバ処理部416は、エラー情報を、サーバ通信部417を介してユーザの端末装置2に送信する。発明文章が誤った形式で記述されている場合(ステップS102がNO)には、サーバ処理部416は、エラー情報をユーザの端末装置2に送信して(ステップS103)処理が終了する。そして、サーバ処理部416は、形式が修正された発明文章、または次の発明文章の受信を待つ。
【0067】
発明文章が正しい形式で記述されている場合(ステップS102がYES)、サーバ処理部416は、ユーザの端末装置2から受信した発明文章が属する技術分野を1単語で表すための用語を抽出する(ステップS104)。サーバ処理部416は、発明文章を複数の単語単位に分割して、どの単語がどの単語を修飾しているかの係り受け関係を抽出して、単語の係り受け関係から重要な用語を検索キーワードとして抽出する。
【0068】
続いて、サーバ処理部416は、抽出された検索キーワードを用いて入力された発明文章に類似する特許文章群を抽出する(ステップS105)。具体的には、サーバ処理部416は、特許文章データベース3から検索キーワードが特許文章の全文に記載されている特許文章群を検索結果として抽出する。この際、サーバ処理部416は、検索キーワードが個々の特許文章においてどの程度重要な単語であるかを判定した上で、関連性が高い特許文章のみを特許文章群として抽出する。
【0069】
そして、サーバ処理部416は、特許文章群の全文と発明文章とを比較して類似度を求める(ステップS106)。具体的には、サーバ処理部416は、発明文章に含まれる構成要素単位に文章を最小文に分割して、構成要素が特許文章群に開示されているか否かを判定することで類似度を求める。サーバ処理部416は、類似度のスコアをそれぞれの特許文章群に含まれる特許文章に対して算出して、類似度のスコアが高い特許文章を3件抽出する。ここで、サーバ処理部416は、ユーザの端末装置2から入力された発明文章の長さを考慮して、短すぎる場合には類似度が高く出るように類似度のスコアを補正してもよい。
【0070】
更に、サーバ処理部416は、抽出された3件の類似度のスコアが高い特許文章の最小文とユーザの端末装置2から入力された発明文章の最小文との編集距離に基づいて入力された発明文章の特許性の判定を行なう(ステップS107)。ここで、サーバ処理部416は、ユーザの端末装置2に入力された発明文章の特許性の判定をランクとして算出する。すなわち、特許性の評価をA〜Dのランクで評価して判定結果としてユーザの端末装置に送信する(ステップS108)。
【0071】
(ユーザの端末装置2の機能)
図7は、ユーザの端末装置2の端末表示部214によって表示される発明文章入力画面200の一例を示す図である。
【0072】
図7は、ユーザの端末装置2に表示される発明文章の入力画面の一例を示す図である。発明文章入力画面200は、ユーザが端末装置2を用いて発明文章を入力して特許性の判定を要求するための画面である。発明文章入力画面200には、任意の発明文章を入力する入力欄を形成する領域である発明文章入力領域201および入力された発明文章が正しく入力されているかを確認するための確認画面に進むための確認ボタン202が表示されている。
【0073】
図8は、ユーザの端末装置2の端末表示部214によって表示される発明文章表示画面300の一例を示す図である。
【0074】
図8に示す通り、発明文章表示画面300は、ユーザが端末装置2を用いて入力した発明文章が正しく入力されたかを示す画面である。発明文章表示画面300には、入力された発明文章を構成要素ごとに区分して表示する。
図8の例では、構成要素AAA、構成要素BBB、構成要素CCC、および構成要素DDDの4つの構成要素からなる発明文章を
図7の発明文章入力領域201に入力をして、確認ボタン202をユーザがマウスによるクリック動作などで押下した場合に表示される画面を模式している。すなわち、
図8の例では、構成要素AAA、構成要素BBB、構成要素CCC、および構成要素DDDの4つの構成要素からなる発明文章に分けられた状態で発明文章が表示されている。発明文章表示画面300には、発明文章が表示される表示欄を形成する領域である発明文章表示領域301および当該発明文章表示領域301に表示されている発明文章について特許性の判定を行なうための判定開始ボタン302が表示されている。
【0075】
図9は、ユーザの端末装置2の端末表示部214によって表示される発明文章評価画面400の一例を示す図である。
【0076】
図9は、ユーザの端末装置2に表示される発明文章評価画面400の一例を示す図である。発明文章評価画面400は、ユーザが端末装置2を用いて入力した発明文章が正しく入力されたかを示す画面である。発明文章評価画面400には、入力された発明文章を構成要素ごとに区分して、それぞれの構成要素ごとに類似度の高い特許文章との比較結果をパーセントで示している比較結果表示領域401が含まれる。また、発明文章評価画面400には、これらの比較結果から算出される発明文章の特許性の判定結果をA〜Dのランクで表示するランク表示領域402が含まれる。
図9の例では、構成要素AAA、構成要素BBB、構成要素CCC、および構成要素DDDの4つの構成要素および類似特許文章との比較結果から算出される発明文章の特許性の判定結果は、Cランクとされている。
【0077】
以上説明したように、本実施形態にかかる特許評価判定システム1は、複数のユーザの端末装置2からの要求に含まれる発明文章の特許性を判定することができる。更に、特許評価判定システム1は、発明文章および類似特許文章の全文の最小文同士を文字の編集距離として類似度を算出しているため、単に同一の単語が特許文章群に含まれているかを」判定する方法と比較して高い精度で発明文章の特許性を判定することができる。
【0078】
なお、本発明は、特許評価判定システム1として、ユーザの端末装置2、特許文章データベース3、およびサーバ4がそれぞれ独立しているシステムとして記載しているが、これらの機能が全て一箇所に存在する判定装置としても同様の効果を発揮することができる。また、これらの機能をユーザの端末装置などにインストールさせるためのプログラムとして提供することも可能である。
【0079】
当業者は、本発明の精神および範囲から外れることなく、さまざまな変更、置換および修正をこれに加えることが可能であることを理解されたい。以下に説明する変形例においては、それぞれの変形例同士が組み合わされて本発明を実施可能であることも理解されたい。
【0080】
(変形例1)
サーバ処理部416の特許文章群抽出部413は、特許文章群の精度を上げるために以下の処理を行なうことができる。サーバ処理部416の特許文章群抽出部413は、抽出された特許文章群の特許文章に付与されている特許分類(例えば、IPCやCPC)を抽出して、ヒストグラムを作成して、上位の数件の特許分類を選択する。そして、選択された特許分類を用いて再度検索キーワードとのAND検索を行なう。ここで、検索キーワードによる検索は、単にフリーワード検索でもよいが、上述の通りTF−IDF法などを用いて、検索キーワードが特許文章群に含まれる文章においてどの程度の重要度があるかを評価した上で検索結果を得る方が好ましい。この検索結果を発明文章との比較に用いる特許文章群として更新する。この処理によって、特許文章群の集合体としての精度が上がって、特許性の判定の精度も上がる。すなわち、特許文章群抽出部413は、特許分類を用いることで集合体としての網羅性が上がることで特許文章の抽出漏れが減少する。
【0081】
図10は、本実施形態の変形例1にかかる特許評価判定システム1によるユーザの端末装置2から発明文章の判定要求に応じて、当該発明文章の特許性を判定し、判定結果をユーザの端末装置2に送信するまでの一連の流れの動作シーケンスの一例を示す図である。
【0082】
ステップS105にて、抽出された検索キーワードを用いて入力された発明文章に類似する特許文章群を抽出した後、サーバ処理部416は、特許文章群から特許分類を抽出して抽出数が多い上位特許分類を選択する(ステップS109)。続いてサーバ処理部416は、検索キーワードおよび選択された上位特許分類を用いて特許文章群を再度抽出する(ステップS110)。なお、この特許分類による検索は、特許分類を複数含む場合には、OR検索とすることで特許文章群に広がりを持たすことができる。
【0083】
(変形例2)
サーバ処理部416の特許文章群抽出部413は、特許文章群の精度を上げるために以下の処理を行なうことができる。サーバ処理部416の特許文章群抽出部413は、抽出された特許文章群のそれぞれの特許文章に含まれる文章の全文について、分散表現空間で検索キーワードと近接するものを抽出して、抽出された結果を発明文章との比較に用いる特許文章群として更新する。すなわち、特許文章群抽出部413は、機械学習によって類似する文章同士で使われている単語同士は似た概念を持っていると仮定して、類似単語を同一ベクトルとしてシミュレーションする。この処理によって、類似キーワードもベクトルが同じと認識することができる。この処理によって、特許文章群の集合体としての精度が上がって、特許性の判定の精度も上がる。すなわち、特許文章群抽出部413は、分散表現空間で検索キーワードと近接する特許文章を抽出しているため、検索キーワードに類似する文言を備える特許文章も抽出することができる。
【0084】
図11は、本実施形態の変形例2にかかる特許評価判定システム1によるユーザの端末装置2から発明文章の判定要求に応じて、当該発明文章の特許性を判定し、判定結果をユーザの端末装置2に送信するまでの一連の流れの動作シーケンスの一例を示す図である。
【0085】
ステップS105にて、抽出された検索キーワードを用いて入力された発明文章に類似する特許文章群を抽出した後、サーバ処理部416は、分散表現空間における前記検索キーワードと近接する特許群に絞り込んだ結果を特許文章群として抽出する(ステップS111)。
【0086】
なお、本変形例2の処理と変形例1の処理を組み合わせる場合は、変形例1のステップS110の後に変形例2のステップS111をサーバ処理部416が実施すると特許文章群として精度が高くなる。もちろん、サーバ処理部416は、変形例2のステップS111の後に変形例1のステップS110を実施する処理とすることも可能である。
【0087】
(変形例3)
本実施形態において、発明文章は、出願前の発明の内容を発明文章として説明したが、出願後の特許出願などに含まれる請求項の特許性の判定に特許評価判定システム1を用いることもできる。この場合、特許文章群抽出部413は、特許性の判定を行なう特許出願などの出願日を考慮して、出願日よりも前に公開された特許文章から特許文章群を抽出する。この出願日は、特許文章データベース3が記憶している出願日でもよく、ユーザによって端末装置2に直接入力される日付でもよい。
特許評価判定方法は、発明に関する発明文章の入力を受け付ける発明入力ステップと、前記入力された発明文章を単語単位に構文解析を行なった上で、前記発明文章における任意の検索キーワードを抽出するキーワード抽出ステップと、前記抽出された検索キーワードを用いて当該検索キーワードが含まれる特許文章群をデータベースから抽出する特許文章群抽出ステップと、前記発明文章および前記特許文章群に含まれる文章を比較して前記発明文章の特許性を判定する判定ステップと、を含んで構成されている。