IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アイ・ピー・ファイン株式会社の特許一覧

<>
  • 特開-文献情報評価方法 図1
  • 特開-文献情報評価方法 図2
  • 特開-文献情報評価方法 図3
  • 特開-文献情報評価方法 図4
  • 特開-文献情報評価方法 図5
  • 特開-文献情報評価方法 図6
  • 特開-文献情報評価方法 図7
  • 特開-文献情報評価方法 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024021207
(43)【公開日】2024-02-16
(54)【発明の名称】文献情報評価方法
(51)【国際特許分類】
   G06F 16/383 20190101AFI20240208BHJP
   G06Q 50/10 20120101ALI20240208BHJP
【FI】
G06F16/383
G06Q50/10
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022123891
(22)【出願日】2022-08-03
(71)【出願人】
【識別番号】303053839
【氏名又は名称】アイ・ピー・ファイン株式会社
(74)【代理人】
【識別番号】100098545
【弁理士】
【氏名又は名称】阿部 伸一
(74)【代理人】
【識別番号】100189717
【弁理士】
【氏名又は名称】太田 貴章
(72)【発明者】
【氏名】古川 智昭
(72)【発明者】
【氏名】中西 昌弘
(72)【発明者】
【氏名】平尾 啓
(72)【発明者】
【氏名】津村 恵美子
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175DA01
5B175FA01
5B175FB04
5L049CC11
(57)【要約】
【課題】関連語を反映してユニークワードを維持した評価結果を得ることができる文献情報評価方法を提供すること。
【解決手段】コンピュータが、サーチワード抽出ステップS1、ノイズワード抽出ステップS2、ユニークワード処理ステップS3、サーチ関連語群処理ステップS4、ノイズ関連語群処理ステップS5、一つのサーチ関連語群に含まれるサーチユニークワードをOR条件とし、異なるサーチ関連語群間を加算条件として設定するサーチ検索条件設定ステップS8と、一つのノイズ関連語群に含まれるノイズユニークワードをOR条件とし、異なるノイズ関連語群間を加算条件として設定するノイズ検索条件設定ステップS9、サーチ検索条件設定ステップS8とノイズ検索条件設定ステップS9で設定された条件によって算出される文献ワード付与率に応じて未評価文献の評価結果を表示する評価結果表示ステップS10を実行する。
【選択図】 図1
【特許請求の範囲】
【請求項1】
既にサーチ対象であると評価された評価済サーチ文献と、既にノイズ対象として評価された評価済ノイズ文献とを用いて、コンピュータによって未評価文献を評価する文献情報評価方法であって、
前記コンピュータが、
前記評価済サーチ文献に記載されているサーチワードを抽出するサーチワード抽出ステップと、
前記評価済ノイズ文献に記載されているノイズワードを抽出するノイズワード抽出ステップと、
前記サーチワード抽出ステップで抽出された前記サーチワードと前記ノイズワード抽出ステップで抽出された前記ノイズワードとを対比し、前記サーチワードと前記ノイズワードとが同じである共通ワードを除去するユニークワード処理ステップと、
前記ユニークワード処理ステップで前記共通ワードが除去されたサーチユニークワードを、関連語辞書を用いてサーチ関連語群に纏めるサーチ関連語群処理ステップと、
前記ユニークワード処理ステップで前記共通ワードが除去されたノイズユニークワードを、前記関連語辞書を用いてノイズ関連語群に纏めるノイズ関連語群処理ステップと、
前記サーチ関連語群処理ステップで纏まった一つの前記サーチ関連語群に含まれる前記サーチユニークワードをOR条件とし、異なる前記サーチ関連語群間を加算条件として設定するサーチ検索条件設定ステップと、
前記ノイズ関連語群処理ステップで纏まった一つの前記ノイズ関連語群に含まれる前記ノイズユニークワードをOR条件とし、異なる前記ノイズ関連語群間を加算条件として設定するノイズ検索条件設定ステップと、
前記サーチ検索条件設定ステップと前記ノイズ検索条件設定ステップで設定された条件によって算出される文献ワード付与率に応じて前記未評価文献の評価結果を表示する評価結果表示ステップと
を実行する
ことを特徴とする文献情報評価方法。
【請求項2】
既にサーチ対象であると評価された評価済サーチ文献と、既にノイズ対象として評価された評価済ノイズ文献とを用いて、コンピュータによって未評価文献を評価する文献情報評価方法であって、
前記コンピュータが、
前記評価済サーチ文献に記載されているサーチワードを抽出するサーチワード抽出ステップと、
前記評価済ノイズ文献に記載されているノイズワードを抽出するノイズワード抽出ステップと、
前記サーチワード抽出ステップで抽出された前記サーチワードを、関連語辞書を用いてサーチ関連語群に纏めるサーチ関連語群処理ステップと、
前記ノイズワード抽出ステップで抽出された前記ノイズワードを、前記関連語辞書を用いてノイズ関連語群に纏めるノイズ関連語群処理ステップと、
前記サーチワードと前記ノイズワードとが同じである共通ワードを除去するユニークワード処理ステップと、
前記サーチ関連語群処理ステップで纏まった一つの前記サーチ関連語群に含まれる前記サーチユニークワードをOR条件とし、異なる前記サーチ関連語群間を加算条件として設定するサーチ検索条件設定ステップと、
前記ノイズ関連語群処理ステップで纏まった一つの前記ノイズ関連語群に含まれる前記ノイズユニークワードをOR条件とし、異なる前記ノイズ関連語群間を加算条件として設定するノイズ検索条件設定ステップと、
前記サーチ検索条件設定ステップと前記ノイズ検索条件設定ステップで設定された条件によって算出される文献ワード付与率に応じて前記未評価文献の評価結果を表示する評価結果表示ステップと
を実行する
ことを特徴とする文献情報評価方法。
【請求項3】
前記サーチワード抽出ステップで抽出する前記サーチワード、及び前記ノイズワード抽出ステップで抽出する前記ノイズワードについて、ワード出現回数又はワード出現件数を算出し、
前記サーチ関連語群処理ステップでは、前記ワード出現回数又は前記ワード出現件数が第1設定数以上である前記サーチユニークワードを対象として処理し、
前記ノイズ関連語群処理ステップでは、前記ワード出現回数又は前記ワード出現件数が第2設定数以上である前記ノイズユニークワードを対象として処理する
ことを特徴とする請求項1又は請求項2に記載の文献情報評価方法。
【請求項4】
前記サーチワード抽出ステップで抽出する前記サーチワード、及び前記ノイズワード抽出ステップで抽出する前記ノイズワードについて、ワード出現回数又はワード出現件数を算出し、
前記サーチ検索条件設定ステップでは、一つの前記サーチ関連語群に纏まった前記サーチユニークワードのワード出現合計回数又はワード出現合計件数が第1設定合計数以上である前記サーチ関連語群を対象として処理し、
前記ノイズ検索条件設定ステップでは、一つの前記ノイズ関連語群に纏まった前記ノイズユニークワードのワード出現合計回数又はワード出現合計件数が第2設定合計数以上である前記ノイズ関連語群を対象として処理する
ことを特徴とする請求項1又は請求項2に記載の文献情報評価方法。
【請求項5】
前記コンピュータが、
前記サーチ関連語群処理ステップで纏められた前記サーチ関連語群、及び前記ノイズ関連語群処理ステップで纏められた前記ノイズ関連語群を、前記サーチユニークワード及び前記ノイズユニークワードとともに表示するユニークワード関連語群表示ステップを実行する
ことを特徴とする請求項1又は請求項2に記載の文献情報評価方法。
【請求項6】
前記ユニークワード関連語群表示ステップでは、ユーザに対して、前記サーチユニークワード、前記ノイズユニークワード、前記サーチ関連語群、及び前記ノイズ関連語群のいずれかについて削除を促し、
前記サーチ検索条件設定ステップ及び前記ノイズ検索条件設定ステップでは、
前記ユーザが削除指示を行った、前記サーチユニークワード、前記ノイズユニークワード、前記サーチ関連語群、又は前記ノイズ関連語群を用いない
ことを特徴とする請求項5に記載の文献情報評価方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、既にサーチ対象であると評価された評価済サーチ文献と、既にノイズ対象として評価された評価済ノイズ文献とを用いて、コンピュータによって未評価文献を評価する文献情報評価方法に関する。
【背景技術】
【0002】
特許や論文などの文献調査においては、データベースから検索により関連文献を抽出して内容を評価するが、関連のない文献(ノイズ)が大量に混在してしまうことが多く、そのため調査には多くの無駄な時間や労力がかかるという問題があった。このため近年では、機械学習を用いて探索した文献や既に評価済みの文献を教師文献として、抽出された大量の未評価文献を類似度の高い順に並べ替えを行い、関連が高いと思われる文献から調査できるようにした情報処理方法、所謂第三世代AIが提案されている。
本出願人は、人工知能、アルゴリズム、又はあらかじめ設定された所定条件によって確率判定値が付与された未評価案件データの中から、評価対象案件データを選択する際の判断を容易とする特許調査支援方法を提案している(特許文献1)。
特許文献1によれば、第1の軸をサーチ確率、第2の軸をノイズ確率とする少なくとも2軸を有するグラフに表示されるプロットの散布状況を把握した上で評価対象案件データを選択できるため、サーチ対象確率判定値やノイズ対象確率判定値からでは判断しづらい境界を認識でき、評価対象案件データを的確に選択できる。
更に特許文献1によれば、抽出した評価対象案件データを評価し、評価した結果、テーマでは必要なサーチ対象案件であると評価されると第1群教師案件データに追加し、評価した結果、テーマでは不要なノイズ対象案件であると評価されると第2群教師案件データに追加することで、教師特許の件数を増やすことができ、更に的確なAI(人工知能)判定を得ることができる。
しかしながら、機械学習はワード情報の類似性を判定処理するものであるため、利用者が重要と考えるキーワードについては一切考慮されないという問題がある。
そこで出願人は、サーチワードとノイズワードを設定してキーワードによる関連性判定と、機械学習による判定処理結果とをマトリクス表示できる特許調査支援システムを提案している(特許文献2)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第6453502号公報
【特許文献2】特許願2021-165832号
【発明の概要】
【発明が解決しようとする課題】
【0004】
ここで、キーワードによる判定を得るためには、サーチワードとノイズワードを選定する必要がある。
既に文献中からキーワードを自動抽出する技術があり、このキーワードを自動抽出する技術を用いることで、例えば、既にサーチ対象であると評価された評価済サーチ文献からサーチワードを抽出し、既にノイズ対象として評価された評価済ノイズ文献からノイズワードを自動抽出することが可能である。
しかし、サーチワードとノイズワードとを自動抽出すると、同じキーワードがサーチワードとノイズワードとして抽出されることがあり、同じキーワードが双方に存在してしまうと、正確な評価結果を得られない。
また、サーチワード又はノイズワードとして、同義語や類似語などの関連語が含まれる場合には、これらの関連語を加算条件にすると、正確な評価結果を得られない。
【0005】
そこで、本発明は、関連語を反映してユニークワードを維持した評価結果を得ることができる文献情報評価方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
請求項1記載の本発明の文献情報評価方法は、既にサーチ対象であると評価された評価済サーチ文献と、既にノイズ対象として評価された評価済ノイズ文献とを用いて、コンピュータによって未評価文献を評価する文献情報評価方法であって、前記コンピュータが、前記評価済サーチ文献に記載されているサーチワードを抽出するサーチワード抽出ステップS1と、前記評価済ノイズ文献に記載されているノイズワードを抽出するノイズワード抽出ステップS2と、前記サーチワード抽出ステップS1で抽出された前記サーチワードと前記ノイズワード抽出ステップS2で抽出された前記ノイズワードとを対比し、前記サーチワードと前記ノイズワードとが同じである共通ワードを除去するユニークワード処理ステップS3と、前記ユニークワード処理ステップS3で前記共通ワードが除去されたサーチユニークワードを、関連語辞書を用いてサーチ関連語群に纏めるサーチ関連語群処理ステップS4と、前記ユニークワード処理ステップS3で前記共通ワードが除去されたノイズユニークワードを、前記関連語辞書を用いてノイズ関連語群に纏めるノイズ関連語群処理ステップS5と、前記サーチ関連語群処理ステップS4で纏まった一つの前記サーチ関連語群に含まれる前記サーチユニークワードをOR条件とし、異なる前記サーチ関連語群間を加算条件として設定するサーチ検索条件設定ステップS8と、前記ノイズ関連語群処理ステップS5で纏まった一つの前記ノイズ関連語群に含まれる前記ノイズユニークワードをOR条件とし、異なる前記ノイズ関連語群間を加算条件として設定するノイズ検索条件設定ステップS9と、前記サーチ検索条件設定ステップS8と前記ノイズ検索条件設定ステップS9で設定された条件によって算出される文献ワード付与率に応じて前記未評価文献の評価結果を表示する評価結果表示ステップS10とを実行することを特徴とする。
請求項2記載の本発明の文献情報評価方法は、既にサーチ対象であると評価された評価済サーチ文献と、既にノイズ対象として評価された評価済ノイズ文献とを用いて、コンピュータによって未評価文献を評価する文献情報評価方法であって、前記コンピュータが、前記評価済サーチ文献に記載されているサーチワードを抽出するサーチワード抽出ステップS1と、前記評価済ノイズ文献に記載されているノイズワードを抽出するノイズワード抽出ステップS2と、前記サーチワード抽出ステップS1で抽出された前記サーチワードを、関連語辞書を用いてサーチ関連語群に纏めるサーチ関連語群処理ステップS4と、前記ノイズワード抽出ステップS2で抽出された前記ノイズワードを、前記関連語辞書を用いてノイズ関連語群に纏めるノイズ関連語群処理ステップS5と、前記サーチワードと前記ノイズワードとが同じである共通ワードを除去するユニークワード処理ステップS3と、前記サーチ関連語群処理ステップS4で纏まった一つの前記サーチ関連語群に含まれる前記サーチユニークワードをOR条件とし、異なる前記サーチ関連語群間を加算条件として設定するサーチ検索条件設定ステップS8と、前記ノイズ関連語群処理ステップS5で纏まった一つの前記ノイズ関連語群に含まれる前記ノイズユニークワードをOR条件とし、異なる前記ノイズ関連語群間を加算条件として設定するノイズ検索条件設定ステップS9と、前記サーチ検索条件設定ステップS8と前記ノイズ検索条件設定ステップS9で設定された条件によって算出される文献ワード付与率に応じて前記未評価文献の評価結果を表示する評価結果表示ステップS10とを実行することを特徴とする。
請求項3記載の本発明は、請求項1又は請求項2に記載の文献情報評価方法において、前記サーチワード抽出ステップS1で抽出する前記サーチワード、及び前記ノイズワード抽出ステップS2で抽出する前記ノイズワードについて、ワード出現回数又はワード出現件数を算出し、前記サーチ関連語群処理ステップS4では、前記ワード出現回数又は前記ワード出現件数が第1設定数以上である前記サーチユニークワードを対象として処理し、前記ノイズ関連語群処理ステップS5では、前記ワード出現回数又は前記ワード出現件数が第2設定数以上である前記ノイズユニークワードを対象として処理することを特徴とする。
請求項4記載の本発明は、請求項1又は請求項2に記載の文献情報評価方法において、前記サーチワード抽出ステップS1で抽出する前記サーチワード、及び前記ノイズワード抽出ステップS2で抽出する前記ノイズワードについて、ワード出現回数又はワード出現件数を算出し、前記サーチ検索条件設定ステップS8では、一つの前記サーチ関連語群に纏まった前記サーチユニークワードのワード出現合計回数又はワード出現合計件数が第1設定合計数以上である前記サーチ関連語群を対象として処理し、前記ノイズ検索条件設定ステップS9では、一つの前記ノイズ関連語群に纏まった前記ノイズユニークワードのワード出現合計回数又はワード出現合計件数が第2設定合計数以上である前記ノイズ関連語群を対象として処理することを特徴とする。
請求項5記載の本発明は、請求項1又は請求項2に記載の文献情報評価方法において、前記コンピュータが、前記サーチ関連語群処理ステップS4で纏められた前記サーチ関連語群、及び前記ノイズ関連語群処理ステップS5で纏められた前記ノイズ関連語群を、前記サーチユニークワード及び前記ノイズユニークワードとともに表示するユニークワード関連語群表示ステップS6を実行することを特徴とする。
請求項6記載の本発明は、請求項5に記載の文献情報評価方法において、前記ユニークワード関連語群表示ステップS6では、ユーザに対して、前記サーチユニークワード、前記ノイズユニークワード、前記サーチ関連語群、及び前記ノイズ関連語群のいずれかについて削除を促し、前記サーチ検索条件設定ステップS8及び前記ノイズ検索条件設定ステップS9では、前記ユーザが削除指示を行った、前記サーチユニークワード、前記ノイズユニークワード、前記サーチ関連語群、又は前記ノイズ関連語群を用いないことを特徴とする。
【発明の効果】
【0007】
本発明によれば、サーチワードとノイズワードとが同じである共通ワードを除去することで、サーチユニークワードとノイズユニークワードとを用いることができ、更にサーチユニークワードについてはサーチ関連語群に纏め、ノイズユニークワードについてはノイズ関連語群に纏め、一つのサーチ関連語群に含まれるサーチユニークワードをOR条件とし、異なるサーチ関連語群間を加算条件とし、一つのノイズ関連語群に含まれるノイズユニークワードをOR条件とし、異なるノイズ関連語群間を加算条件として設定することで、関連語を反映してユニークワードを維持した評価結果を得ることができる。
【図面の簡単な説明】
【0008】
図1】本発明の一実施例における文献情報評価方法のフローチャート
図2】サーチワード抽出ステップで抽出されるサーチワードとノイズワード抽出ステップで抽出されるノイズワードの概念図
図3】ユニークワード処理の後のサーチユニークワードとノイズユニークワードの概念図
図4】ユサーチ関連語群とノイズ関連語群の概念図
図5】ユニークワード関連語群表示の概念図
図6】サーチ検索条件設定とノイズ検索条件設定とを示す概念図
図7】評価結果の表示を示す概念図
図8】本発明の他の実施例における文献情報評価方法のフローチャート
【発明を実施するための形態】
【0009】
本発明の第1の実施の形態による文献情報評価方法は、コンピュータが、評価済サーチ文献に記載されているサーチワードを抽出するサーチワード抽出ステップと、評価済ノイズ文献に記載されているノイズワードを抽出するノイズワード抽出ステップと、サーチワード抽出ステップで抽出されたサーチワードとノイズワード抽出ステップで抽出されたノイズワードとを対比し、サーチワードとノイズワードとが同じである共通ワードを除去するユニークワード処理ステップと、ユニークワード処理ステップで共通ワードが除去されたサーチユニークワードを、関連語辞書を用いてサーチ関連語群に纏めるサーチ関連語群処理ステップと、ユニークワード処理ステップで共通ワードが除去されたノイズユニークワードを、関連語辞書を用いてノイズ関連語群に纏めるノイズ関連語群処理ステップと、サーチ関連語群処理ステップで纏まった一つのサーチ関連語群に含まれるサーチユニークワードをOR条件とし、異なるサーチ関連語群間を加算条件として設定するサーチ検索条件設定ステップと、ノイズ関連語群処理ステップで纏まった一つのノイズ関連語群に含まれるノイズユニークワードをOR条件とし、異なるノイズ関連語群間を加算条件として設定するノイズ検索条件設定ステップと、サーチ検索条件設定ステップとノイズ検索条件設定ステップで設定された条件によって算出される文献ワード付与率に応じて未評価文献の評価結果を表示する評価結果表示ステップとを実行するものである。本実施の形態によれば、サーチワードとノイズワードとが同じである共通ワードを除去することで、サーチユニークワードとノイズユニークワードとを用いることができ、更にサーチユニークワードについてはサーチ関連語群に纏め、ノイズユニークワードについてはノイズ関連語群に纏め、一つのサーチ関連語群に含まれるサーチユニークワードをOR条件とし、異なるサーチ関連語群間を加算条件とし、一つのノイズ関連語群に含まれるノイズユニークワードをOR条件とし、異なるノイズ関連語群間を加算条件として設定することで、関連語を反映してユニークワードを維持した評価結果を得ることができる。
【0010】
本発明の第2の実施の形態による文献情報評価方法は、コンピュータが、評価済サーチ文献に記載されているサーチワードを抽出するサーチワード抽出ステップと、評価済ノイズ文献に記載されているノイズワードを抽出するノイズワード抽出ステップと、サーチワード抽出ステップで抽出されたサーチワードを、関連語辞書を用いてサーチ関連語群に纏めるサーチ関連語群処理ステップと、ノイズワード抽出ステップで抽出されたノイズワードを、関連語辞書を用いてノイズ関連語群に纏めるノイズ関連語群処理ステップと、サーチワードとノイズワードとが同じである共通ワードを除去するユニークワード処理ステップと、サーチ関連語群処理ステップで纏まった一つのサーチ関連語群に含まれるサーチユニークワードをOR条件とし、異なるサーチ関連語群間を加算条件として設定するサーチ検索条件設定ステップと、ノイズ関連語群処理ステップで纏まった一つのノイズ関連語群に含まれるノイズユニークワードをOR条件とし、異なるノイズ関連語群間を加算条件として設定するノイズ検索条件設定ステップと、サーチ検索条件設定ステップとノイズ検索条件設定ステップで設定された条件によって算出される文献ワード付与率に応じて未評価文献の評価結果を表示する評価結果表示ステップとを実行するものである。本実施の形態によれば、サーチワードとノイズワードとが同じである共通ワードを除去することで、サーチユニークワードとノイズユニークワードとを用いることができ、更にサーチユニークワードについてはサーチ関連語群に纏め、ノイズユニークワードについてはノイズ関連語群に纏め、一つのサーチ関連語群に含まれるサーチユニークワードをOR条件とし、異なるサーチ関連語群間を加算条件とし、一つのノイズ関連語群に含まれるノイズユニークワードをOR条件とし、異なるノイズ関連語群間を加算条件として設定することで、関連語を反映してユニークワードを維持した評価結果を得ることができる。
【0011】
本発明の第3の実施の形態は、第1又は請求項2の実施の形態による文献情報評価方法において、サーチワード抽出ステップで抽出するサーチワード、及びノイズワード抽出ステップで抽出するノイズワードについて、ワード出現回数又はワード出現件数を算出し、サーチ関連語群処理ステップでは、ワード出現回数又はワード出現件数が第1設定数以上であるサーチユニークワードを対象として処理し、ノイズ関連語群処理ステップでは、ワード出現回数又はワード出現件数が第2設定数以上であるノイズユニークワードを対象として処理するものである。本実施の形態によれば、ワード出現回数又はワード出現件数が設定数以上のサーチユニークワード及びノイズユニークワードを対象として処理することで、処理負荷を軽減できるとともに、ワード出現回数又はワード出現件数が少ないサーチユニークワード及びノイズユニークワードの影響を無くすことができる。
【0012】
本発明の第4の実施の形態は、第1又は請求項2の実施の形態による文献情報評価方法において、サーチワード抽出ステップで抽出するサーチワード、及びノイズワード抽出ステップで抽出するノイズワードについて、ワード出現回数又はワード出現件数を算出し、サーチ検索条件設定ステップでは、一つのサーチ関連語群に纏まったサーチユニークワードのワード出現合計回数又はワード出現合計件数が第1設定合計数以上であるサーチ関連語群を対象として処理し、ノイズ検索条件設定ステップでは、一つのノイズ関連語群に纏まったノイズユニークワードのワード出現合計回数又はワード出現合計件数が第2設定合計数以上であるノイズ関連語群を対象として処理するものである。本実施の形態によれば、ワード出現合計回数又はワード出現合計件数が設定数以上のサーチ関連語群及びノイズ関連語群を対象として処理することで、処理負荷を軽減できるとともに、ワード出現合計回数又はワード出現合計件数が少ないサーチ関連語群及びノイズ関連語群の影響を無くすことができる。
【0013】
本発明の第5の実施の形態は、第1又は第2のいずれかの実施の形態による文献情報評価方法において、コンピュータが、サーチ関連語群処理ステップで纏められたサーチ関連語群、及びノイズ関連語群処理ステップで纏められたノイズ関連語群を、サーチユニークワード及びノイズユニークワードとともに表示するユニークワード関連語群表示ステップを実行するものである。本実施の形態によれば、サーチ関連語群及びノイズ関連語群を、サーチユニークワード及びノイズユニークワードとともにユーザが確認することができる。
【0014】
本発明の第6の実施の形態は、第5の実施の形態による文献情報評価方法において、ユニークワード関連語群表示ステップでは、ユーザに対して、サーチユニークワード、ノイズユニークワード、サーチ関連語群、及びノイズ関連語群のいずれかについて削除を促し、サーチ検索条件設定ステップ及びノイズ検索条件設定ステップでは、ユーザが削除指示を行った、サーチユニークワード、ノイズユニークワード、サーチ関連語群、又はノイズ関連語群を用いないものである。本実施の形態によれば、より正確な評価結果を得ることができる。
【実施例0015】
以下に、本発明の文献情報評価方法の一実施例について説明する。
図1は本発明の一実施例における文献情報評価方法のフローチャートである。
本実施例における文献情報評価方法は、既にサーチ対象であると評価された評価済サーチ文献と、既にノイズ対象として評価された評価済ノイズ文献とを用いて、コンピュータによって未評価文献を評価する。
データベースには、複数の評価済サーチ文献と複数の評価済ノイズ文献とからなる評価済文献を蓄積している。
【0016】
コンピュータは、サーチワード抽出ステップ(S1)、ノイズワード抽出ステップ(S2)、ユニークワード処理ステップ(S3)、サーチ関連語群処理ステップ(S4)、ノイズ関連語群処理ステップ(S5)、ユニークワード関連語群表示ステップ(S6)、ユニークワード削除処理ステップ(S7)、サーチ検索条件設定ステップ(S8)、ノイズ検索条件設定ステップ(S9)、及び評価結果表示ステップ(S10)を実行する。
【0017】
サーチワード抽出ステップ(S1)では、評価済サーチ文献に記載されているサーチワードを抽出する。
ノイズワード抽出ステップ(S2)では、評価済ノイズ文献に記載されているノイズワードを抽出する。
サーチワード抽出ステップ(S1)で抽出するサーチワード、及びノイズワード抽出ステップ(S2)で抽出するノイズワードについて、ワード出現回数又はワード出現件数を算出する。
【0018】
図2は、サーチワード抽出ステップで抽出されるサーチワードとノイズワード抽出ステップで抽出されるノイズワードの概念図である。
図2では、サーチワードとして「a1」「a2」「a3」「b1」「b2」「c1」「c2」「c3」「c4」が抽出され、ノイズワードとして「b1」「c2」「c5」「d1」「d2」「d3」「e1」「e2」「e3」が抽出されたことを示している。
ワード出現回数はそのワードが使われた回数であり、ワード出現件数はそのワードが使われた文献の件数である。
【0019】
ユニークワード処理ステップ(S3)では、サーチワード抽出ステップ(S1)で抽出されたサーチワードとノイズワード抽出ステップ(S2)で抽出されたノイズワードとを対比し、サーチワードとノイズワードとが同じである共通ワードを除去する。
図2では、「b1」「c2」がサーチワードとして抽出されるとともにノイズワードとしても抽出されているので共通ワードである。
【0020】
図3は、ユニークワード処理の後のサーチユニークワードとノイズユニークワードの概念図である。
図3に示すように、サーチユニークワード及びノイズユニークワードでは「b1」「c2」が除去されている。
【0021】
サーチ関連語群処理ステップ(S4)では、ユニークワード処理ステップ(S3)で共通ワードが除去されたサーチユニークワードを、関連語辞書を用いてサーチ関連語群に纏める。
ノイズ関連語群処理ステップ(S5)では、ユニークワード処理ステップ(S3)で共通ワードが除去されたノイズユニークワードを、関連語辞書を用いてノイズ関連語群に纏める。
ここで関連語とは、同義語、類似語、上位概念語、又は下位概念語など、関連するキーワードとして何らかの紐づけがされたものである。
【0022】
図4は、ユサーチ関連語群とノイズ関連語群の概念図である。
図4では、「a1」「a2」「a3」が一つのサーチ関連語群A、「b2」が一つのサーチ関連語群B、「c1」「c3」「c4」が一つのサーチ関連語群Cであり、「c5」が一つのノイズ関連語群C、「d1」「d2」「d3」が一つのノイズ関連語群D、「e1」「e2」「e3」が一つのノイズ関連語群Eであることを示している。
【0023】
ユニークワード関連語群表示ステップ(S6)では、サーチ関連語群処理ステップ(S4)で纏められたサーチ関連語群、及びノイズ関連語群処理ステップ(S5)で纏められたノイズ関連語群を、サーチユニークワード及びノイズユニークワードとともに表示する。
サーチ関連語群及びノイズ関連語群を、サーチユニークワード及びノイズユニークワードとともに表示することでユーザは検索条件を確認することができる。
【0024】
図5は、ユニークワード関連語群表示の概念図である。
図5では、二酸化炭素に関する関連語群を示しており、図5(a)に示すように、サーチユニークワードとして「炭酸ガス」「CO2」「二酸化炭素」「温暖化ガス」「一酸化二窒素」「メタン」「ハイドロフルオロカーボン」「温室効果ガス」「ガス」「気体」が抽出され、図5(b)に示すように、ノイズユニークワードとして「シーオーツー」「亜酸化窒素」「パーフルオロカーボン」「人為的温室効果ガス」「六フッ化硫黄」が抽出されている。
【0025】
ユニークワード関連語群表示ステップ(S6)では、ユーザに対して、サーチユニークワード、ノイズユニークワード、サーチ関連語群、及びノイズ関連語群のいずれかについて削除を促す。
【0026】
図5では、サーチユニークワード及びノイズユニークワードについて、チェックを付けないことで、一部のサーチユニークワード及びノイズユニークワードについてユーザが削除指示を行っていることを示している。
サーチユニークワードについては、「温暖化ガス」「一酸化二窒素」「メタン」「温室効果ガス」「ガス」「気体」を削除指示し、ノイズユニークワードについては、「シーオーツー」「亜酸化窒素」「パーフルオロカーボン」「人為的温室効果ガス」「六フッ化硫黄」を削除指示していることを示している。
【0027】
ユニークワード削除処理ステップ(S7)では、ユーザが削除指示を行った、サーチユニークワード、ノイズユニークワード、サーチ関連語群、又はノイズ関連語群を削除し、削除されたサーチユニークワード、ノイズユニークワード、サーチ関連語群、又はノイズ関連語群については、サーチ検索条件設定ステップ(S8)及びノイズ検索条件設定ステップ(S9)での条件設定には用いない。
サーチ検索条件設定ステップ(S8)では、サーチ関連語群処理ステップ(S4)で纏まった一つのサーチ関連語群に含まれるサーチユニークワードをOR条件とし、異なるサーチ関連語群間を加算条件として設定する。
ノイズ検索条件設定ステップ(S9)では、ノイズ関連語群処理ステップ(S5)で纏まった一つのノイズ関連語群に含まれるノイズユニークワードをOR条件とし、異なるノイズ関連語群間を加算条件として設定する。
【0028】
図6はサーチ検索条件設定とノイズ検索条件設定とを示す概念図である。
一つのサーチ関連語群Aに含まれる「a1」「a2」「a3」はOR条件として設定される。また、一つのサーチ関連語群Cに含まれる「c1」「c3」「c4」についてもOR条件として設定される。
そして、サーチ関連語群Aとサーチ関連語群Bとサーチ関連語群Cとは加算条件として設定される。
また、一つのノイズ関連語群Dに含まれる「d1」「d2」「d3」はOR条件として設定される。また、一つのノイズ関連語群Eに含まれる「e1」「e2」「e3」についてもOR条件として設定される。
そして、ノイズ関連語群Cとノイズ関連語群Dとノイズ関連語群Eとは加算条件として設定される。
なお、図6に示すように、それぞれのサーチ関連語群A、B、Cについて、及びそれぞれのノイズ関連語群C、D、Eについて重み付けを設定することができる。また、サーチ検索条件とノイズ検索条件について、最高値を設定することができる。
【0029】
例えば、第1未評価文献はサーチ関連語群を全く含まず、第2未評価文献はサーチ関連語群Aだけを含み、第3未評価文献はサーチ関連語群Bだけを含み、第4未評価文献はサーチ関連語群A及びサーチ関連語群Bを含み、第5未評価文献はサーチ関連語群A、サーチ関連語群B、及びサーチ関連語群Cを含むとする。ここで、サーチ関連語群Aだけを含む場合とは、一つのサーチ関連語群Aに含まれる「a1」「a2」「a3」はOR条件として設定されることから、「a1」「a2」「a3」の少なくともいずれか一つを含む場合となる。
【0030】
重み付けが付与されていない場合には、第1未評価文献の文献ワード付与率は「0%」、第2未評価文献の文献ワード付与率は「33.3%」、第3未評価文献の文献ワード付与率は「33.3%」、第4未評価文献の文献ワード付与率は「66.6%」、第5未評価文献の文献ワード付与率は「100%」となる。
異なるサーチ関連語群間は加算条件として設定されることから、サーチ関連語群A及びサーチ関連語群Bを含む第4未評価文献では、文献ワード付与率は「33.3%」+「33.3%」で、「66.6%」となり、サーチ関連語群A、サーチ関連語群B、及びサーチ関連語群Cを含む第5未評価文献では、文献ワード付与率は「33.3%」+「33.3%」+「33.3%」で、「100%」となっている。
重み付けが付与されている場合には、例えば、サーチ関連語群Aの重み付けを「5」、サーチ関連語群Bの重み付けを「2」、サーチ関連語群Cの重み付けを「3」とすると、重み付け処理を行うことで、第1未評価文献の文献ワード付与率は「0%」、第2未評価文献の文献ワード付与率は「5/10=50%」、第3未評価文献の文献ワード付与率は「2/10=20%」、第4未評価文献の文献ワード付与率は「5/10+2/10=70%」、第5未評価文献の文献ワード付与率は「5/10+2/10+3/10=100%」となる。
なお、ノイズ関連語群についての文献ワード付与率についても、サーチ関連語群と同様に算出される。
【0031】
評価結果表示ステップ(S10)では、サーチ検索条件設定ステップ(S8)とノイズ検索条件設定ステップ(S9)で設定された条件によって算出される文献ワード付与率に応じて未評価文献の評価結果を表示する。
【0032】
図7は評価結果の表示を示す概念図である。
例えば、サーチ関連語群A、サーチ関連語群B、及びサーチ関連語群Cに含まれるサーチユニークワードが全て出現し、ノイズ関連語群C、ノイズ関連語群D、及びノイズ関連語群Eに含まれるノイズユニークワードが一つも出現しない文献については、サーチ判定が100%に表示され、ノイズ関連語群C、ノイズ関連語群D、及びノイズ関連語群Eに含まれるノイズユニークワードが全て出現し、サーチ関連語群A、サーチ関連語群B、及びサーチ関連語群Cに含まれるサーチユニークワードが一つも出現しない文献については、ノイズ判定が100%に表示される。
【0033】
なお、サーチ関連語群処理ステップ(S4)では、ワード出現回数又はワード出現件数が第1設定数以上であるサーチユニークワードを対象として処理し、ノイズ関連語群処理ステップ(S5)では、ワード出現回数又はワード出現件数が第2設定数以上であるノイズユニークワードを対象として処理することもできる。
例えば、第1設定数を「5」と設定すると、図3に示すサーチユニークワードでは、ワード出現回数又はワード出現件数が5以上であるサーチユニークワードを対象としてサーチ関連語群処理を行う。すなわち、ワード出現回数が「2」である「C1」「C4」と、ワード出現回数が「3」である「C3」はサーチ関連語群処理の対象から除外される。
また、第2設定数を「5」と設定すると、図3に示すノイズユニークワードでは、ワード出現回数が5以上であるノイズユニークワードを対象としてノイズ関連語群処理を行う。すなわち、ワード出現回数が「1」である「e3」と、ワード出現回数が「2」である「e1」はノイズ関連語群処理の対象から除外される。または、ワード出現件数が5以上であるノイズユニークワードを対象としてノイズ関連語群処理を行う。すなわち、ワード出現件数が「1」である「e2」「e3」と、ワード出現件数が「2」である「e1」はノイズ関連語群処理の対象から除外される。
第1設定数と第2設定数は同じであってもよい。
このように、ワード出現回数又はワード出現件数が設定数以上のサーチユニークワード及びノイズユニークワードを対象として処理することで、処理負荷を軽減できるとともに、ワード出現回数又はワード出現件数が少ないサーチユニークワード及びノイズユニークワードの影響を無くすことができる。
【0034】
また、サーチ検索条件設定ステップ(S8)では、一つのサーチ関連語群に纏まったサーチユニークワードのワード出現合計回数又はワード出現合計件数が第1設定合計数以上であるサーチ関連語群を対象として処理し、ノイズ検索条件設定ステップ(S9)では、一つのノイズ関連語群に纏まったノイズユニークワードのワード出現合計回数又はワード出現合計件数が第2設定合計数以上であるノイズ関連語群を対象として処理することもできる。
例えば、第1設定合計数を「10」と設定すると、図4に示すサーチユニークワードでは、一つのサーチ関連語群Cに纏まったサーチユニークワード「c1」「c3」「c4」のワード出現合計回数が「7」であるため、サーチ検索条件設定の対象から除外され、サーチ検索条件設定ステップ(S8)では、サーチ関連語群Aとサーチ関連語群Bとを対象として処理する。
また、一つのサーチ関連語群Cに纏まったサーチユニークワード「c1」「c3」「c4」のワード出現合計件数が「3」であるため、サーチ検索条件設定の対象から除外され、サーチ検索条件設定ステップ(S8)では、サーチ関連語群Aとサーチ関連語群Bとを対象として処理する。
また、第2設定合計数を「5」と設定すると、図4に示すノイズユニークワードでは、一つのノイズ関連語群Eに纏まったノイズユニークワード「e1」「e2」「e3」のワード出現合計件数が「4」であるため、ノイズ検索条件設定の対象から除外され、ノイズ検索条件設定ステップ(S9)では、ノイズ関連語群Cとノイズ関連語群Dとを対象として処理する。
第1設定合計数と第2設定合計数は同じであってもよい。
【0035】
このように、ワード出現合計回数又はワード出現合計件数が設定数以上のサーチ関連語群及びノイズ関連語群を対象として処理することで、処理負荷を軽減できるとともに、ワード出現合計回数又はワード出現合計件数が少ないサーチ関連語群及びノイズ関連語群の影響を無くすことができる。
【0036】
図8は本発明の他の実施例における文献情報評価方法のフローチャートである。
本実施例では、ユニークワード処理ステップ(S3)を行う前に、サーチ関連語群処理ステップ(S4)とノイズ関連語群処理ステップ(S5)とを行うものである。
本実施例に示すように、サーチ関連語群処理ステップ(S4)とノイズ関連語群処理ステップ(S5)とを行った後に、ユニークワード処理ステップ(S3)を行ってもよい。
従って、サーチ関連語群処理ステップ(S4)では、サーチワード抽出ステップ(S1)で抽出されたサーチワードを、関連語辞書を用いてサーチ関連語群に纏め、ノイズ関連語群処理ステップ(S5)では、ノイズワード抽出ステップ(S2)で抽出されたノイズワードを、関連語辞書を用いてノイズ関連語群に纏める。
【0037】
以上のように本実施例によれば、サーチワードとノイズワードとが同じである共通ワードを除去することで、サーチユニークワードとノイズユニークワードとを用いることができ、更にサーチユニークワードについてはサーチ関連語群に纏め、ノイズユニークワードについてはノイズ関連語群に纏め、一つのサーチ関連語群に含まれるサーチユニークワードをOR条件とし、異なるサーチ関連語群間を加算条件とし、一つのノイズ関連語群に含まれるノイズユニークワードをOR条件とし、異なるノイズ関連語群間を加算条件として設定することで、関連語を反映してユニークワードを維持した評価結果を得ることができる。
本発明は、国内における特許公報だけなく、中国や米国などの外国の特許公報などの特許文献や、論文などの非特許文献を未評価文献として評価することができる。また、評価済サーチ文献及び評価済ノイズ文献は、未評価文献と同様に特許文献や非特許文献を評価したものを用いることができるが、例えば、研究開発テーマ別に纏めた情報を評価済文献として利用することもできる。すなわち、評価済サーチ文献及び評価済ノイズ文献については、サーチ対象であるかノイズ対象であるかを評価でき、サーチワード又はノイズワードとして抽出できるキーワードが含まれている情報を文献として用いることができる。
【産業上の利用可能性】
【0038】
本発明によれば、関連語を反映してユニークワードを維持した評価結果を得ることができる。
【符号の説明】
【0039】
S1 サーチワード抽出ステップ
S2 ノイズワード抽出ステップ
S3 ユニークワード処理ステップ
S4 サーチ関連語群処理ステップ
S5 ノイズ関連語群処理ステップ
S6 ユニークワード関連語群表示ステップ
S7 ユニークワード削除処理ステップ
S8 サーチ検索条件設定ステップ
S9 ノイズ検索条件設定ステップ
S10 評価結果表示ステップ
図1
図2
図3
図4
図5
図6
図7
図8