(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-01-17
(45)【発行日】2024-01-25
(54)【発明の名称】分析プログラム、情報処理装置、および分析方法
(51)【国際特許分類】
G06F 16/30 20190101AFI20240118BHJP
G06Q 50/18 20120101ALI20240118BHJP
G06F 40/194 20200101ALI20240118BHJP
【FI】
G06F16/30
G06Q50/18 310
G06F40/194
(21)【出願番号】P 2023147399
(22)【出願日】2023-09-12
【審査請求日】2023-09-12
【早期審査対象出願】
(73)【特許権者】
【識別番号】519022458
【氏名又は名称】Patentfield株式会社
(74)【代理人】
【識別番号】100185719
【氏名又は名称】北原 悠樹
(74)【代理人】
【識別番号】100150072
【氏名又は名称】藤原 賢司
(72)【発明者】
【氏名】村上 直也
【審査官】早川 学
(56)【参考文献】
【文献】特開2005-332330(JP,A)
【文献】米国特許出願公開第2016/0224622(US,A1)
【文献】米国特許出願公開第2014/0324709(US,A1)
【文献】米国特許出願公開第2013/0086469(US,A1)
【文献】米国特許出願公開第2012/0259618(US,A1)
【文献】国際公開第2020/208693(WO,A1)
【文献】中国特許出願公開第101334771(CN,A)
【文献】中国特許出願公開第114676703(CN,A)
【文献】国際公開第2020/026366(WO,A1)
【文献】国際公開第2020/240875(WO,A1)
【文献】ChatGPTで文章の評価・比較をする実践方法!ビジネスのあらゆるシーンで使える!,YouTube [online][video],リモートワーク研究所【リモ研】,2023年04月22日,[検索日:2023.10.20], Internet<URL: https://www.youtube.com/watch?v=cSZuniHlvjw >
(58)【調査した分野】(Int.Cl.,DB名)
G06F16/00-16/958
G06Q10/00-99/00
G06F40/00-40/58
(57)【特許請求の範囲】
【請求項1】
特許情報の分析プログラムであって、
前記分析プログラムは、コンピュータに、
技術的思想を含む技術情報を取得するステップと、
前記技術情報と比較する対象の特許情報を取得するステップと、
2つの情報の関連性を特定の観点から評価するための所定の指示文に対して、前記技術情報と前記特許情報とを指定するステップと、
前記技術情報と前記特許情報とが指定された前記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、前記技術情報と前記特許情報との関連性を示す評価結果を前記観点について出力するステップとを実行させる、分析プログラム。
【請求項2】
前記所定の指示文は、2つの情報の関連性を複数の観点から評価するよう規定されており、
前記出力するステップでは、前記技術情報と前記特許情報との関連性を示す評価結果が前記複数の観点の各々について出力される、請求項1に記載の分析プログラム。
【請求項3】
前記複数の観点は、技術分野の観点と、課題の観点と、作用機能の観点と、内容示唆の観点と、パラメータの観点と、数値限定の観点と、技術用語の観点との内の少なくとも1つを含む、請求項2に記載の分析プログラム。
【請求項4】
前記分析プログラムは、前記コンピュータに、さらに、
前記観点の別の前記評価結果を纏めた総合評価結果を出力するステップを実行させる、請求項2または3に記載の分析プログラム。
【請求項5】
前記複数の観点の各々には、重みが関連付けられており、
前記総合評価結果は、前記観点の別の前記評価結果に対して前記重みを付けて算出される、請求項4に記載の分析プログラム。
【請求項6】
前記所定の指示文は、
前記2つの情報の関連度を前記大規模言語モデルに出力させるための指示と、
前記関連度の評価理由を前記大規模言語モデルに出力させるための指示とを含み、
前記評価結果は、
前記技術情報と前記特許情報とに係る前記関連度と、
前記技術情報と前記特許情報とに係る前記評価理由とを含む、請求項1~3のいずれか1項に記載の分析プログラム。
【請求項7】
前記分析プログラムは、前記コンピュータに、さらに、
前記特許情報を前記技術情報と比較する際における概念レベルに関する入力を受け付けるステップを実行させ、
前記指定するステップは、さらに、前記概念レベルに関する入力を前記指示文に反映することを含む、請求項1~3のいずれか1項に記載の分析プログラム。
【請求項8】
前記分析プログラムは、前記コンピュータに、さらに、
前記評価結果がディスプレイに表示されている際に、前記特許情報を前記技術情報と比較する際における概念レベルに関する入力を受け付けるステップと、
前記概念レベルに関する入力を反映した再評価のための指示文を生成するステップと、
前記再評価のための指示文を前記大規模言語モデルに入力することで当該大規模言語モデルから得られる結果を出力するステップとを実行させる、請求項1~3のいずれか1項に記載の分析プログラム。
【請求項9】
前記分析プログラムは、前記コンピュータに、さらに、
予め定められたアルゴリズムに基づいて、前記技術情報と前記特許情報との類似度を算出するステップを実行させ、
前記評価結果は、前記大規模言語モデルから得られる前記結果と、前記類似度とに基づいて、前記観点の別に出力される、請求項1~3のいずれか1項に記載の分析プログラム。
【請求項10】
前記複数の観点は、
第1の観点と、
前記第1の観点とは異なる第2の観点とを含み、
前記大規模言語モデルは、
第1の言語モデルと、
前記第1の言語モデルとは異なる第2の言語モデルとを含み、
前記第1の観点で前記技術情報と前記特許情報との関連性を評価するための前記指示文は、前記第1の言語モデルに入力され、
前記第2の観点で前記技術情報と前記特許情報との関連性を評価するための前記指示文は、前記第2の言語モデルに入力される、請求項
2または3に記載の分析プログラム。
【請求項11】
前記技術情報は、図面を含み、
前記特許情報は、図面を含み、
前記観点は、図面の内容の観点を含む、請求項1~3のいずれか1項に記載の分析プログラム。
【請求項12】
前記指示文は、
前記2つの情報の関連性を特定の観点で評価させるための第1の指示と、
前記第1の指示に基づく前記2つの情報の関連性の評価結果を用いて、当該2つの情報の関連性を前記特定の観点でさらに評価させるための第2の指示とを含む、請求項1~3のいずれか1項に記載の分析プログラム。
【請求項13】
特許情報を分析することが可能な情報処理装置であって、
前記情報処理装置をするための制御部を備え、
前記制御部は、
技術的思想を含む技術情報を取得する処理と、
前記技術情報と比較する対象の特許情報を取得する処理と、
2つの情報の関連性を観点から評価するための所定の指示文に対して、前記技術情報と前記特許情報とを指定する処理と、
前記技術情報と前記特許情報とが指定された前記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、前記技術情報と前記特許情報との関連性を示す評価結果を前記観点について出力する処理とを実行する、情報処理装置。
【請求項14】
コンピュータによって実行される特許情報の分析方法であって、
技術的思想を含む技術情報を取得するステップと、
前記技術情報と比較する対象の特許情報を取得するステップと、
2つの情報の関連性を複数の観点から評価するための所定の指示文に対して、前記技術情報と前記特許情報とを指定するステップと、
前記技術情報と前記特許情報とが指定された前記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、前記技術情報と前記特許情報との関連性を示す評価結果を前記観点について出力するステップとを備える、分析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、分析プログラム、情報処理装置、および分析方法に関する。
【背景技術】
【0002】
近年、様々な大規模言語モデルが開発されている。大規模言語モデルは、膨大な量のテキストデータを学習した言語モデルであり、様々な自然言語を処理可能なように学習されている。
【0003】
非特許文献1は、大規模言語モデルの一例であるChatGPTの出力精度を向上させるための方法を開示している。具体的には、非特許文献1は、「Let's think step by step(一歩ずつ考えよう)」との指示文をChatGPTに入力することで、出力の正確性が向上することを開示している。
【先行技術文献】
【非特許文献】
【0004】
【文献】"ChatGPTを賢くする呪文"、日経経済新聞、[online]、2023年3月24日、[2023年9月6日検索]、インターネット<URL:https://www.nikkei.com/article/DGXZQOUC22BVO0S3A320C2000000/>
【発明の概要】
【発明が解決しようとする課題】
【0005】
大規模言語モデルは、様々なサービスに適用され得るが、具体的なサービスとして実現されている例は未だ少ない。これに関して、大規模言語モデルを特許情報の分析に利用し、新たな価値を提供することが望まれている。
【課題を解決するための手段】
【0006】
本開示の一例では、特許情報の分析プログラムが提供される。上記分析プログラムは、コンピュータに、技術的思想を含む技術情報を取得するステップと、上記技術情報と比較する対象の特許情報を取得するステップと、2つの情報の関連性を特定の観点から評価するための所定の指示文に対して、上記技術情報と上記特許情報とを指定するステップと、上記技術情報と上記特許情報とが指定された上記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、上記技術情報と上記特許情報との関連性を示す評価結果を上記観点について出力するステップとを実行させる。
【0007】
本開示の一例では、上記所定の指示文は、2つの情報の関連性を複数の観点から評価するよう規定されている。上記出力するステップでは、上記技術情報と上記特許情報との関連性を示す評価結果が上記複数の観点の各々について出力される。
【0008】
本開示の一例では、上記複数の観点は、技術分野の観点と、課題の観点と、作用機能の観点と、内容示唆の観点と、パラメータの観点と、数値限定の観点と、技術用語の観点との内の少なくとも1つを含む。
【0009】
本開示の一例では、上記分析プログラムは、上記コンピュータに、さらに、上記観点の別の上記評価結果を纏めた総合評価結果を出力するステップを実行させる。
【0010】
本開示の一例では、上記複数の観点の各々には、重みが関連付けられている。上記総合評価結果は、上記観点の別の上記評価結果に対して上記重みを付けて算出される。
【0011】
本開示の一例では、上記所定の指示文は、上記2つの情報の関連度を上記大規模言語モデルに出力させるための指示と、上記関連度の評価理由を上記大規模言語モデルに出力させるための指示とを含む。上記評価結果は、上記技術情報と上記特許情報とに係る上記関連度と、上記技術情報と上記特許情報とに係る上記評価理由とを含む。
【0012】
本開示の一例では、上記分析プログラムは、上記コンピュータに、さらに、上記特許情報を上記技術情報と比較する際における概念レベルに関する入力を受け付けるステップを実行させる。上記指定するステップは、さらに、上記概念レベルに関する入力を上記指示文に反映することを含む。
【0013】
本開示の一例では、上記分析プログラムは、上記コンピュータに、さらに、上記評価結果がディスプレイに表示されている際に、上記特許情報を上記技術情報と比較する際における概念レベルに関する入力を受け付けるステップと、上記概念レベルに関する入力を反映した再評価のための指示文を生成するステップと、上記再評価のための指示文を上記大規模言語モデルに入力することで当該大規模言語モデルから得られる結果を出力するステップとを実行させる。
【0014】
本開示の一例では、上記分析プログラムは、上記コンピュータに、さらに、予め定められたアルゴリズムに基づいて、上記技術情報と上記特許情報との類似度を算出するステップを実行させる。上記評価結果は、上記大規模言語モデルから得られる上記結果と、上記類似度とに基づいて、上記観点の別に出力される。
【0015】
本開示の一例では、上記複数の観点は、第1の観点と、上記第1の観点とは異なる第2の観点とを含む。上記大規模言語モデルは、第1の言語モデルと、上記第1の言語モデルとは異なる第2の言語モデルとを含む。上記第1の観点で上記技術情報と上記特許情報との関連性を評価するための上記指示文は、上記第1の言語モデルに入力される。上記第2の観点で上記技術情報と上記特許情報との関連性を評価するための上記指示文は、上記第2の言語モデルに入力される。
【0016】
本開示の一例では、上記技術情報は、図面を含む。上記特許情報は、図面を含む。上記観点は、図面の内容の観点を含む。
【0017】
本開示の一例では、上記指示文は、上記2つの情報の関連性を特定の観点で評価させるための第1の指示と、上記第1の指示に基づく上記2つの情報の関連性の評価結果を用いて、当該2つの情報の関連性を上記特定の観点でさらに評価させるための第2の指示とを含む。
【0018】
本開示の他の例では、特許情報を分析することが可能な情報処理装置が提供される。上記情報処理装置は、上記情報処理装置をするための制御部を備える。上記制御部は、技術的思想を含む技術情報を取得する処理と、上記技術情報と比較する対象の特許情報を取得する処理と、2つの情報の関連性を観点から評価するための所定の指示文に対して、上記技術情報と上記特許情報とを指定する処理と、上記技術情報と上記特許情報とが指定された上記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、上記技術情報と上記特許情報との関連性を示す評価結果を上記観点について出力する処理とを実行する。
【0019】
本開示の他の例では、コンピュータによって実行される特許情報の分析方法が提供される。上記分析方法は、技術的思想を含む技術情報を取得するステップと、上記技術情報と比較する対象の特許情報を取得するステップと、2つの情報の関連性を複数の観点から評価するための所定の指示文に対して、上記技術情報と上記特許情報とを指定するステップと、上記技術情報と上記特許情報とが指定された上記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、上記技術情報と上記特許情報との関連性を示す評価結果を上記観点について出力するステップとを備える。
【0020】
本発明の上記および他の目的、特徴、局面および利点は、添付の図面と関連して理解される本発明に関する次の詳細な説明から明らかとなるであろう。
【図面の簡単な説明】
【0021】
【
図1】情報処理システムの装置構成の一例を示す図である。
【
図3】変形例に従う関連性評価機能を説明するための図である。
【
図4】情報処理装置のハードウェア構成の一例を示す模式図である。
【
図5】ユーザ端末のハードウェア構成の一例を示す模式図である。
【
図6】情報処理装置とユーザ端末とサーバとの間のデータフローの一例を示す図である。
【
図10】大規模言語モデルによって生成された回答の一例である回答情報を示す図である。
【
図12】技術情報と特許情報との関連性評価に係るフローチャートを示す図である。
【
図13】観点別に対応付けられている重みの例を示す図である。
【
図14】他の例に従う関連性評価処理を概略的に示す図である。
【
図15】他の例に従う関連性評価処理を概略的に示す図である。
【発明を実施するための形態】
【0022】
以下、図面を参照しつつ、本発明に従う各実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。したがって、これらについての詳細な説明は繰り返さない。なお、以下で説明される各実施の形態および各変形例は、適宜選択的に組み合わされてもよい。
【0023】
<A.情報処理システム10>
まず、
図1を参照して、情報処理システム10の装置構成について説明する。
図1は、情報処理システム10の装置構成の一例を示す図である。
【0024】
図1に示されるように、情報処理システム10は、情報処理装置100と、ユーザ端末200と、サーバ300とを含む。情報処理装置100、ユーザ端末200、およびサーバ300は、ネットワークNW(たとえば、インターネット)を通じて互いに通信可能に構成される。
【0025】
情報処理装置100は、ノート型またはデスクトップ型のPC(Personal Computer)、タブレット端末、スマートフォン、または、通信機能を備えたその他のコンピュータである。情報処理システム10を構成する情報処理装置100の数は、1つであってもよいし、2つ以上であってもよい。情報処理装置100は、たとえば、企業「A」によって運用されている。
【0026】
ユーザ端末200は、たとえば、ノート型またはデスクトップ型のPC、タブレット端末、スマートフォン、または、通信機能を備えたその他のコンピュータである。情報処理システム10を構成するユーザ端末200の数は、1つであってもよいし、2つ以上であってもよい。情報処理装置100は、たとえば、一般ユーザであるユーザ「A」によって所有されている。
【0027】
サーバ300は、ノート型またはデスクトップ型のPC(Personal Computer)、タブレット端末、スマートフォン、または、通信機能を備えたその他のコンピュータである。情報処理システム10を構成するサーバ300の数は、1つであってもよいし、2つ以上であってもよい。サーバ300は、たとえば、企業「B」によって運用されている。
【0028】
サーバ300は、大規模言語モデル324を格納している。大規模言語モデル324は、数十億以上の膨大な量のテキストデータを学習した言語モデルであり、様々な自然言語を処理可能なように学習されている。大規模言語モデル324は、LLM(Large Language Models)とも呼ばれている。大規模言語モデル324は、指示文の入力を受けると、当該指示文に応じた出力を生成するように学習されている。
【0029】
大規模言語モデル324としては、たとえば、GPT-3(Generative Pretrained Transformer)やGPT-4などのGPTシリーズ、PaLM(Scaling Language Modeling with Pathways)、LLaMA(Large Language Model Meta AI)、および、既知のLLMが挙げられる。また、大規模言語モデルは、GPTシリーズの他、BERT(Bidirectional Encoder Representations from Transformers)のようなTransformerベースの大規模言語モデル、CNN(Convolutional Neural Network)、RNN(Recurrent Neural Network)、LSTM(Long Short Term Memory)など、種々の大規模言語モデルが用いられてもよい。
【0030】
企業「B」は、たとえば、大規模言語モデル324の機能を利用するためのAPI(Application Programming Interface)を公開している。これにより、企業「A」の設計者や一般ユーザは、当該APIを通じて大規模言語モデル324の機能を利用することができる。
【0031】
なお、本明細書に記載されている各種処理は、情報処理装置100に実装されてもよいし、ユーザ端末200に実装されてもよいし、サーバ300に実装されてもよいし、その他のコンピュータに実装されてもよい。
【0032】
また、上述では、情報処理システム10がサーバ300を含む例について説明を行ったが、情報処理システム10は、サーバ300を含まなくてもよい。この場合、情報処理システム10は、1つ以上の情報処理装置100と、1つ以上のユーザ端末200とで構成される。
【0033】
<B.処理概要>
情報処理装置100は、特許情報に関する様々な分析機能をユーザ「A」に提供する。一例として、情報処理装置100は、技術情報と特許情報との関連性を評価するための機能をユーザ「A」に提供する。
【0034】
「特許情報」とは、特許文献に関するデータである。特許情報は、たとえば、公開特許公報、特許公報、公表特許公報、再公表特許、実用新案公報などの特許文献を含む。一例として、特許情報は、書誌事項と、明細書と、特許請求の範囲と、図面と、要約書とを含む。書誌事項としては、たとえば、出願番号と、公開番号と、特許登録番号と、出願日と、公開日と、登録日と、出願人と、特許権利者と、発明の名称と、代理人と、出願国とが挙げられる。なお、特許情報は、公開技報などの非特許文献であってもよい。
【0035】
「技術情報」とは、技術的思想を含むデータを言う。技術的思想は、技術的課題を解決するための技術的手段である。技術情報は、たとえば、技術的手段を文字列で記述されたものである。技術情報は、たとえば、発明特定事項が記述された発明情報を含む。
【0036】
以下では、
図2を参照して、技術情報123と特許情報125との関連性を評価する機能の概要について説明する。
図2は、関連性評価機能を説明するための図である。
【0037】
情報処理装置100は、ユーザ端末200から技術情報123を取得する。技術情報123は、ユーザ端末200のユーザ「A」によって入力された文字列であってもよいし、ユーザ「A」の操作に応じて特許情報から抽出されたデータであってもよい。
【0038】
また、情報処理装置100は、技術情報123と比較する特許情報125を取得する。特許情報125の取得先は任意である。一例として、特許情報125は、情報処理装置100内の記憶装置内に格納されている後述の特許データベース124(
図4参照)から取得される。他の例として、特許情報125は、特許庁で管理されているサーバ内の特許データベースから取得される。さらに他の例として、特許情報125は、他のサーバで管理されている特許データベースから取得される。
【0039】
技術情報123と特許情報125との関連性評価は、大規模言語モデル324を利用することで実現される。より具体的には、まず、情報処理装置100は、2つの情報の関連性を特定の観点から評価するための所定の指示文128に対して、技術情報123と特許情報125とを指定する。
【0040】
指示文128は、たとえば、テンプレートとして情報処理装置100内に予め登録されている。また、指示文128は、引数部129Aと、引数部129Bとを含む。引数部129Aには、技術情報123が指定される。一方で、引数部129Bには、特許情報125が指定される。
【0041】
また、指示文128は、技術情報123および特許情報125の関連性をどのような観点で評価するか規定している。
図2の例では、2つの情報を観点「α」で評価するように規定されている。観点「α」は、予め規定されていてもよいし、引数として規定されていてもよい。観点「α」が引数として規定されている場合は、当該観点は、ユーザ端末200のユーザ「A」によって任意に指定される。
【0042】
技術情報123および特許情報125が指定された指示文128は、大規模言語モデル324に入力される。大規模言語モデル324は、指示文128の入力を受けると、指示文128に応じた回答を生成する。生成された回答は、情報処理装置100に出力される。
【0043】
情報処理装置100は、大規模言語モデル324から得られる回答に基づいて、技術情報123と特許情報125との関連性を示す評価結果130を観点「α」について出力する。当該関連性は、関連度合いを示す数値で表わされてもよいし、説明文で表わされてもよい。
図2の例では、当該関連性が数値で表わされている。
【0044】
情報処理装置100による評価結果130の出力先は任意である。一例として、当該出力先は、ユーザ端末200である。ユーザ端末200に出力された評価結果130は、たとえば、ユーザ端末200のディスプレイに表示される。
【0045】
以上のように、情報処理装置100は、技術情報123と特許情報125との関連性評価に大規模言語モデル324を利用することで、ユーザに新たな価値を提供する。
【0046】
関連性評価機能は、たとえば、以下の場合に有効である。これまで、特許調査においては、人間が何千件~何万件の特許文献を読むことによりスクリーニングまたは査読することが中心であった。このとき、ユーザが
図2に示される関連性評価機能を利用すれば、調査対象の技術情報123が特許情報125とどの程度関連しているかを容易に判定することができる。これにより、ユーザは、スクリーニングまたは査読に要する時間を大幅に短縮することができる。
【0047】
なお、
図2の例では、指示文128が単一の観点「α」から関連性を評価するように規定されていたが、指示文128は、複数の観点から関連性を評価するように規定されていてもよい。
【0048】
図3は、変形例に従う関連性評価機能を説明するための図である。
図3に示される指示文128は、2つの情報の関連性を複数の観点「α」,「β」から評価するよう規定されている。大規模言語モデル324は、当該指示文128の入力を受けると、指示文128に応じた回答を生成する。
【0049】
情報処理装置100は、大規模言語モデル324から得られる結果に基づいて、技術情報123と特許情報125との関連性を示す評価結果130を出力する。評価結果130は、技術情報123と特許情報125との関連性を観点「α」,「β」の各々について示す。評価結果130は、情報処理装置100からユーザ端末200に送信され、ユーザ端末200のディスプレイに表示される。
【0050】
これにより、ユーザは、技術情報123が特許情報125に関連しているか否かを複数の観点の関連性に基づいて判断することができる。結果として、ユーザは、調査対象の技術情報123が特許情報125とどの程度関連しているかをさらに容易に判定することができる。
【0051】
<C.観点の種類>
引き続き
図2および
図3を参照して、指示文128に規定されている観点「α」,「β」について説明する。
【0052】
指示文128には、任意の観点が規定され得る。好ましくは、ユーザが技術情報123と特許情報125との関連性を評価する際に重視する事項が観点として規定され得る。一例として、審査基準「第III部第2章第2節 進歩性」に記載されている「主引用発明に副引用発明を適用する動機付け」の判断指標が観点「α」,「β」に規定される。
【0053】
より具体的には、観点「α」,「β」は、技術分野の共通性の観点と、課題の共通性の観点と、作用機能の共通性の観点と、内容示唆の共通性の観点と、パラメータの共通性の観点と、数値限定の共通性の観点と、技術用語の共通性の観点との内の少なくとも1つを含む。これにより、技術情報123と特許情報125との共通性が進歩性の判断基準に合う評価軸で評価される。
【0054】
なお、指示文128に規定される観点は、上記の例に限定されない。他の例として、指示文128に規定される観点は、用途探索に適した観点であってもよい。当該観点は、適用される用途または製品の共通性の観点であってもよいし、適用される産業分野の共通性の観点であってもよい。
【0055】
さらに他の例として、指示文128に規定される観点は、図面の共通性の観点であってもよい。この具体例については後述する。
【0056】
さらに他の例として、指示文128に規定される観点は、技術情報123に係る発明と特許情報125に係る発明との一方を他方に組み合わせることに関して阻害要因が存在するか否かを評価する観点であってもよい。
【0057】
さらに他の例として、技術情報123に係る発明と特許情報125に係る発明との間の差異が設計変更であるか否かを評価する観点であってもよい。
【0058】
<D.ハードウェア構成>
次に、
図4および
図5を参照して、上述の
図1に示される情報処理装置100とユーザ端末200とのハードウェア構成について順に説明する。
【0059】
なお、
図1に示されるサーバ300のハードウェア構成は、情報処理装置100と同様であるので、その説明については繰り返さない。
【0060】
(D1.情報処理装置100)
まず、
図4を参照して、
図1に示される情報処理装置100のハードウェア構成について説明する。
図4は、情報処理装置100のハードウェア構成の一例を示す模式図である。
【0061】
情報処理装置100は、制御装置101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103と、通信インターフェイス104と、表示インターフェイス105と、入力インターフェイス107と、補助記憶装置120とを含む。これらのコンポーネントは、バス110に接続される。
【0062】
制御装置101は、たとえば、少なくとも1つの集積回路によって構成される。集積回路は、たとえば、少なくとも1つのCPU(Central Processing Unit)、少なくとも1つのGPU(Graphics Processing Unit)、少なくとも1つのASIC(Application Specific Integrated Circuit)、少なくとも1つのFPGA(Field Programmable Gate Array)、またはそれらの組み合わせなどによって構成され得る。
【0063】
制御装置101は、分析プログラム122やオペレーティングシステムなどの各種プログラムを実行することで情報処理装置100の動作を制御する。制御装置101は、各種プログラムの実行命令を受け付けたことに基づいて、補助記憶装置120またはROM102からRAM103に当該プログラムを読み出す。RAM103は、ワーキングメモリとして機能し、各種プログラムの実行に必要な各種データを一時的に格納する。
【0064】
通信インターフェイス104には、LAN(Local Area Network)やアンテナなどが接続される。情報処理装置100は、通信インターフェイス104を介して、外部機器との間でデータをやり取りする。当該外部機器は、たとえば、ユーザ端末200、サーバ300、その他の通信機器などを含む。
【0065】
表示インターフェイス105には、ディスプレイ106が接続される。表示インターフェイス105は、制御装置101などからの指令に従って、ディスプレイ106に対して、画像を表示するための画像信号を送出する。ディスプレイ106は、たとえば、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ、またはその他の表示機器である。なお、ディスプレイ106は、情報処理装置100と一体的に構成されてもよいし、情報処理装置100とは別に構成されてもよい。
【0066】
入力インターフェイス107には、入力デバイス108が接続される。入力デバイス108は、たとえば、マウス、キーボード、タッチパネル、またはユーザの操作を受け付けることが可能なその他の装置である。なお、入力デバイス108は、情報処理装置100と一体的に構成されてもよいし、情報処理装置100とは別に構成されてもよい。
【0067】
補助記憶装置120は、たとえば、ハードディスク、フラッシュメモリ、SSD(Solid State Drive)、およびその他の記憶媒体である。補助記憶装置120は、分析プログラム122、特許データベース124、および上述の指示文128などを格納する。特許データベース124は、複数の特許情報125を含む。分析プログラム122、特許データベース124、および指示文128の格納場所は、補助記憶装置120に限定されず、制御装置101の記憶領域(たとえば、キャッシュメモリなど)、ROM102、RAM103、外部機器などに格納されていてもよい。
【0068】
なお、分析プログラム122は、単体のプログラムとしてではなく、任意のプログラムの一部に組み込まれて提供されてもよい。この場合、分析プログラム122に規定される各種処理は、後述の分析プログラム222などの任意のプログラムと協働して実現される。このような一部のモジュールを含まないプログラムであっても、本実施の形態に従う分析プログラム122の趣旨を逸脱するものではない。さらに、分析プログラム122によって提供される機能の一部または全部は、専用のハードウェアによって実現されてもよい。さらに、少なくとも1つのサーバが分析プログラム122の処理の一部を実行する所謂クラウドサービスのような形態で情報処理装置100が構成されてもよい。
【0069】
(D2.ユーザ端末200)
次に、
図5を参照して、
図1に示されるユーザ端末200のハードウェア構成について説明する。
図5は、ユーザ端末200のハードウェア構成の一例を示す模式図である。
【0070】
ユーザ端末200は、制御装置201と、ROM202と、RAM203と、通信インターフェイス204と、表示インターフェイス205と、入力インターフェイス207と、補助記憶装置220とを含む。これらのコンポーネントは、バス210に接続される。
【0071】
制御装置201は、たとえば、少なくとも1つの集積回路によって構成される。集積回路は、たとえば、少なくとも1つのCPU、少なくとも1つのGPU、少なくとも1つのASIC、少なくとも1つのFPGA、またはそれらの組み合わせなどによって構成され得る。
【0072】
制御装置201は、分析プログラム222やオペレーティングシステムなどの各種プログラムを実行することでユーザ端末200の動作を制御する。制御装置201は、各種プログラムの実行命令を受け付けたことに基づいて、補助記憶装置220またはROM202からRAM203に当該プログラムを読み出す。RAM203は、ワーキングメモリとして機能し、当該プログラムの実行に必要な各種データを一時的に格納する。
【0073】
通信インターフェイス204には、LANやアンテナなどが接続される。ユーザ端末200は、通信インターフェイス204を介して、外部機器との間でデータをやり取りする。当該外部機器は、たとえば、情報処理装置100、サーバ300、およびその他の通信機器などを含む。ユーザ端末200は、情報処理装置100から分析プログラム222をダウンロード可能に構成されてもよい。
【0074】
表示インターフェイス205には、ディスプレイ206が接続される。表示インターフェイス205は、制御装置201などからの指令に従って、ディスプレイ206に対して、画像を表示するための画像信号を送出する。ディスプレイ206は、たとえば、液晶ディスプレイ、有機ELディスプレイ、またはその他の表示機器である。なお、ディスプレイ206は、ユーザ端末200と一体的に構成されてもよいし、ユーザ端末200とは別に構成されてもよい。
【0075】
入力インターフェイス207には、入力デバイス208が接続される。入力デバイス208は、たとえば、マウス、キーボード、タッチパネル、またはユーザの操作を受け付けることが可能なその他の装置である。なお、入力デバイス208は、ユーザ端末200と一体的に構成されてもよいし、ユーザ端末200とは別に構成されてもよい。
【0076】
補助記憶装置220は、たとえば、ハードディスク、フラッシュメモリ、SSD(Solid State Drive)、およびその他の記憶媒体である。補助記憶装置220は、分析プログラム222などを格納する。分析プログラム222の格納場所は、補助記憶装置220に限定されず、制御装置201の記憶領域(たとえば、キャッシュメモリなど)、ROM202、RAM203、外部機器(たとえば、サーバー)などに格納されていてもよい。
【0077】
なお、分析プログラム222は、単体のプログラムとしてではなく、任意のプログラムの一部に組み込まれて提供されてもよい。この場合、分析プログラム222に規定される各種処理は、上述の分析プログラム122などの任意のプログラムと協働して実現される。このような一部のモジュールを含まないプログラムであっても、本実施の形態に従う分析プログラム222の趣旨を逸脱するものではない。さらに、分析プログラム222によって提供される機能の一部または全部は、専用のハードウェアによって実現されてもよい。さらに、少なくとも1つのサーバが分析プログラム222の処理の一部を実行する所謂クラウドサービスのような形態でユーザ端末200が構成されてもよい。
【0078】
<E.データフロー>
次に、
図6~
図11を参照して、技術情報123と特許情報125との関連性評価に係る情報処理システム10の動作について説明する。
図6は、情報処理装置100とユーザ端末200とサーバ300との間のデータフローの一例を示す図である。
【0079】
なお、上述のように、情報処理装置100は、技術情報123と特許情報125との関連性評価機能を提供するが、以下では、当該関連性評価機能を特許情報125の査読に応用する前提で説明を行う。
【0080】
(E1.ステップS110)
ステップS110において、ユーザ端末200は、
図7に示される入力画面400Aを表示する。
図7は、一例としての入力画面400Aを示す図である。
【0081】
入力画面400Aは、上述の特許データベース124(
図4参照)から特許情報125を検索するための検索条件を受け付ける。ユーザは、当該検索条件を入力することで、技術情報123と比較する1つ以上の特許情報125を指定することができる。入力画面400Aは、たとえば、選択欄410と、入力欄412とを含む。
【0082】
選択欄410は、検索種別の選択入力を受け付ける。一例として、選択欄410で指定可能な検索種別は、「全文検索」、「フィールド検索」、「コマンド検索」、「セマンティック検索」、「番号検索」などが挙げられる。
【0083】
入力欄412は、各種の検索条件の入力を受け付ける。入力欄412に入力可能な検索条件は、たとえば、特許文献の番号、当該番号の種別(たとえば、出願番号や公開番号など)、出願の公開国などが挙げられる。
【0084】
(E2.ステップS112)
次に、ステップS112において、ユーザ端末200は、
図8に示される入力画面400Aを表示する。
図8は、一例としての入力画面400Bを示す図である。
【0085】
入力画面400Bは、査読条件の設定を受け付ける。一例として、入力画面400Bは、入力欄420と、選択欄422と、入力欄424と、選択欄426と、開始ボタン428とを含む。
【0086】
入力欄420は、査読対象の設定を受け付ける。一例として、入力欄420は、査読する特許情報125の最大件数と、特許情報125中の査読箇所との入力を受け付ける。指定可能な査読箇所としては、たとえば、要約書、発明の名称、特許請求の範囲におけるトップクレーム(すなわち、請求項1)、技術分野、背景技術、発明が解決しようとする課題、発明の効果、課題を解決するための手段、および明細書などが挙げられる。
【0087】
選択欄422は、査読種別の選択を受け付ける。選択可能な査読種別は、たとえば、関連性評価、要約・情報抽出などのユーザ指示、ユーザタグ/評価などが挙げられる。
【0088】
入力欄424は、上述の技術情報123の入力を受け付ける。入力欄424は、たとえば、技術的思想を示す文の入力を受け付ける。一例として、ユーザは、自身または他社が発明した内容を入力欄424に入力する。他の例として、ユーザは、自社製品の仕様を入力欄424に入力する。
【0089】
選択欄426は、利用する大規模言語モデル324の選択を受け付ける。選択欄426で選択された大規模言語モデル324は、技術情報123と特許情報125との関連性評価に利用される。
【0090】
ユーザが査読の開始ボタン428を押したことに基づいて、ユーザ端末200は、
図7に示される入力画面400Aに入力された検索条件と、
図8に示される入力画面400Bに入力された査読条件とを情報処理装置100に送信する。
【0091】
(E3.ステップS120)
次に、ステップS120において、情報処理装置100は、上述の特許データベース124に登録されている特許情報125の内から、上述の入力画面400A(
図7参照)に入力された検索条件に合致する特許情報125を検索する。情報処理装置100は、当該検索条件に合致した特許情報125を、技術情報123と比較する母集団とみなす。
【0092】
(E4.ステップS122)
次に、ステップS122において、情報処理装置100は、大規模言語モデル324に入力するための上述の指示文128(
図2および
図3参照)を生成する。
【0093】
図9は、一例としての指示文128を示す図である。指示文128は、複数の引数部129Aと、複数の引数部129Bとを含む。情報処理装置100は、複数の引数部129Aの各々に対して技術情報123を指定し、複数の引数部129Bの各々に対して特許情報125を指定する。指示文128は、ステップS120で検索された特許情報125の各々について生成される。
【0094】
好ましくは、
図9に示されるように、指示文128は、2つの情報の関連度を大規模言語モデル324に出力させるための指示131Aと、当該関連度の評価理由を大規模言語モデル324に出力させるための指示とを含む。これにより、ユーザによる関連度の判断指標が増える。
【0095】
また、指示文128は、各観点での評価結果を総合して2つの情報の関連度を大規模言語モデル324に出力させるための指示131Cと、当該総合評価の理由を大規模言語モデル324に出力させるための指示131Dとを含む。
【0096】
情報処理装置100は、ステップS122で生成した指示文128をサーバ300に送信する。
【0097】
(E5.ステップS130)
次に、ステップS130において、サーバ300は、情報処理装置100から指示文128を受信したことに基づいて、当該指示文128を大規模言語モデル324に入力する。これにより、大規模言語モデル324は、指示文128に応じた回答を生成する。
【0098】
図10は、大規模言語モデル324によって生成された回答の一例である回答情報326を示す図である。
図10の例では、回答情報326が表形式で示されているが、回答情報326の形式は任意である。大規模言語モデル324の出力形式は、たとえば、指示文128に予め規定されており、大規模言語モデル324は、指示文128に規定されている出力形式に従って回答情報326を出力する。
【0099】
回答情報326は、技術情報123と特許情報125との関連性の評価結果327を特許情報125の別に含む。評価結果327は、技術情報123と特許情報125との関連度を示す関連性スコアと、当該関連度の評価理由とを含む。当該関連性スコアは、指示文128で指示された評価観点ごとに含まれている。同様に、当該評価理由は、指示文128で指示された評価観点ごとに含まれている。また、評価結果327は、各評価観点での総合評価スコアと、当該総合評価理由とを含む。
【0100】
評価結果327は、特許情報125の識別子で一意に特定され得る。当該識別子は、たとえば、特許情報125の出願番号、特許情報125の公開番号、特許情報125の登録公報番号、特許情報125の出願人情報などで規定される。
【0101】
情報処理装置100は、ステップS130で生成した回答情報326を情報処理装置100に送信する。
【0102】
(E6.ステップS140,S150)
次に、ステップS140において、情報処理装置100は、サーバ300から受信した回答情報326に基づいて、評価結果画面を生成する。当該評価結果画面は、たとえば、HTML(HyperText Markup Language)などの言語で記述される。
【0103】
次に、ステップS150において、ユーザ端末200は、情報処理装置100によって生成された評価結果画面を表示する。
図11は、一例としての評価結果画面400Cを示す図である。評価結果画面400Cは、たとえば、ユーザ端末200のディスプレイ206に表示される。
【0104】
評価結果画面400Cは、技術情報123に係る情報を表示する表示領域430と、技術情報123および特許情報125の関連性の評価結果を表示する表示領域440とを含む。表示領域440は、表示領域442と、評価結果の表示領域444,446とを含む。表示領域440は、技術情報123と比較した特許情報125の数に応じて並べて設けられる。
【0105】
表示領域430は、上述の入力画面400A,400B(
図7,
図8参照)に入力された情報などを表示する。一例として、表示領域430は、「ID」(Identification)と、「査読種別」と、「モデル」と、「ステータス」と、「取扱時間」と、「査読対象」と、「調査観点」とを表示する。
【0106】
「ID」は、査読評価結果を一意に識別するための識別子である。「査読種別」は、上述の選択欄422(
図8参照)で設定された事項に対応する。「モデル」は、関連性評価時に使用された大規模言語モデル324の種類を示し、上述の選択欄426(
図8参照)で設定された情報に対応している。「ステータス」は、関連性評価処理が正常に終了したか否かを示す。「取扱時間」は、関連性評価処理の実行を開始してから終了するまでに要した時間を示す。「査読対象」は、上述の入力欄420(
図8参照)に入力された情報に対応している。「調査観点」は、技術情報123の内容を示し、上述の入力欄420(
図8参照)に入力された事項に対応している。
【0107】
表示領域442は、関連性評価の対象となった特許情報125に係る情報を表示する。表示領域442には、たとえば、「発明の名称」と、「出願番号」と、「公開番号」と、「ステータス」と、「要約」とが表示される。
【0108】
「要約」には、たとえば、特許情報125の内容の概略が表示される。一例として、当該概略は、特許情報125の内容を要約するように大規模言語モデル324に指示して大規模言語モデル324から出力される結果から生成されたものである。他の例として、当該概略は、特許情報125に含まれている要約書から生成されたものである。
【0109】
表示領域444には、大規模言語モデル324の回答情報326(
図10参照)から生成された評価結果がグラフで表示される。
図11の例では、当該評価結果は、各観点での評価スコアがレーダーチャートで示されている。好ましくは、表示領域444に表示するグラフの種類は、ユーザによって任意に設定され得る。
【0110】
表示領域446には、大規模言語モデル324の回答情報326(
図10参照)から生成された評価結果が表形式で表示される。
図11の例では、表示領域446において、回答情報326に含まれている観点別の関連性スコアと、回答情報326に含まれている観点別の評価理由と、回答情報326に含まれている総合評価スコアと、回答情報326に含まれている総合評価理由とが表示されている。
【0111】
このように、情報処理装置100は、観点別の評価結果を纏めた総合評価結果を出力する。これにより、ユーザは、技術情報123と特許情報125との関連度を容易に認識することができる。
【0112】
好ましくは、総合評価結果として「合計スコア」が表示領域446にさらに表示される。「合計スコア」は、観点別の評価結果スコアの合計値に相当する。なお、「合計スコア」の代わりに観点別の評価結果スコアの「平均スコア」が表示されてもよい。
【0113】
なお、評価結果画面400Cに表示する評価結果は、評価観点ごとに選択可能に構成されてもよい。一例として、ユーザは、「課題の共通性の観点」に着目して関連性を評価する場合、「課題の共通性の観点」以外の観点を非選択とする。これにより、評価結果画面400Cには、「課題の共通性の観点」に係る評価結果のみが表示される。このように構成されることで、ユーザは、技術情報123と特許情報125との関連性を自身の目的に合わせて評価することができる。なお、評価観点の選択は、回答情報326の生成前に指示文128に反映されてもよいし、評価結果画面400Cの表示内容にのみ反映されてもよい。
【0114】
また、評価結果画面400Cに表示される評価観点は、並び替え可能に構成されてもよい。これにより、ユーザは、自身の目的に応じたより優先度の高い評価項目を上位に表示することが可能になる。
【0115】
さらに、評価結果画面400Cに表示される複数の表示領域440は、選択したソート条件に従って並び替え可能に構成される。選択可能なソート条件としては、たとえば、評価スコアの昇順/降順、総合評価スコアの昇順/降順、および合計スコアの昇順/降順などが挙げられる。
【0116】
さらに、評価結果画面400Cに表示される内容は、
図11の例に限定されない。評価結果画面400Cには、さらに多くの情報(以下、「付加情報」ともいう。)が表示されてもよい。付加情報としては、たとえば、特許情報125の技術要約、特許情報125の課題要約、特許情報125に含まれる特徴的なキーワード、特許情報125に付与されている分類などが挙げられる。これらの付加情報は、大規模言語モデル324によって生成される。
【0117】
<I.フローチャート>
次に、
図12を参照して、情報処理装置100の制御フローの一例について説明する。
図12は、技術情報123と特許情報125との関連性評価に係るフローチャートを示す図である。
【0118】
図12に示される処理は、情報処理装置100の制御装置101が上述の分析プログラム122を実行することにより実現される。他の局面において、処理の一部または全部が、回路素子またはその他のハードウェアによって実行されてもよい。
【0119】
ステップS210において、制御装置101は、関連性評価の開始ボタン428(
図8参照)が押されたか否かを判断する。制御装置101は、関連性評価の開始ボタン428が押されたと判断した場合(ステップS210においてYES)、制御をステップS212に切り替える。そうでない場合には(ステップS210においてNO)、制御装置101は、ステップS210の処理を再び実行する。
【0120】
ステップS212において、制御装置101は、上述の特許データベース124に登録されている特許情報125の内から、上述の入力画面400A(
図7参照)に入力された検索条件に合致する特許情報125を検索する。
【0121】
ステップS214において、制御装置101は、大規模言語モデル324に入力するための上述の指示文128を生成する。指示文128の生成処理については上述の通りであるので、その説明については繰り返さない。制御装置101は、生成した指示文128をサーバ300に送信する。
【0122】
サーバ300は、受信した指示文128を大規模言語モデル324に入力し、指示文128に応じた回答情報326(
図10参照)を生成する。回答情報326は、情報処理装置100に送信される。
【0123】
ステップS216において、制御装置101は、サーバ300から受信した回答情報326に基づいて、上述の評価結果画面400C(
図11参照)を生成する。評価結果画面400Cについては上述の通りであるので、その説明については繰り返さない。
【0124】
ステップS218において、制御装置101は、ステップS216で生成した評価結果画面400Cをユーザ端末200に出力する。これにより、ユーザ端末200は、評価結果画面400Cをディスプレイ206に表示する。
【0125】
<J1.その他>
次に、上記実施の形態の他の例について説明する。
【0126】
上述の通り、
図11に示される「総合評価スコア」や「合計スコア」などの総合評価結果は、技術情報123と特許情報125との関連性を各観点で評価した結果に基づいて生成されている。このとき、各観点に係る評価結果に対して重み付けがされてもよい。
【0127】
図13は、観点別に対応付けられている重みの例を示す図である。
図13の例では、観点「α」に対しては、重み「w1」が関連付けられている。観点「β」に対しては、重み「w2」が関連付けられている。観点「γ」に対しては、重み「w3」が関連付けられている。観点「δ」に対しては、重み「w4」が関連付けられている。重み「w1」~「w4」は、予め設定されていてもよいし、ユーザによって任意に設定されてもよい。
【0128】
また、
図13には、観点「α」での評価結果として、関連性スコア「s1」が示されている。観点「β」での評価結果として、関連性スコア「s2」が示されている。観点「γ」での評価結果として、関連性スコア「s3」が示されている。観点「δ」での評価結果として、関連性スコア「s4」が示されている。
【0129】
情報処理装置100は、観点の別の評価結果「s1」~「s4」に対して重み「w1」~「w4」を考慮して総合評価結果を算出する。一例として、情報処理装置100は、評価結果「s1」~「s4」に対して重み「w1」~「w4」をそれぞれ乗算することで加重平均を算出する。情報処理装置100は、当該算出した加重平均を総合評価結果として出力する。
【0130】
<J2.その他>
次に、上記実施の形態のさらに他の例について説明する。
【0131】
場合によっては、技術情報123および特許情報125が想定よりも広い概念で比較されていることがある。この場合に備えて、情報処理装置100は、技術情報123および特許情報125の関連性を再評価可能に構成される。具体的には、情報処理装置100は、評価結果画面400C(
図11参照)がユーザ端末200のディスプレイ206に表示されている際に、特許情報125を技術情報123と比較する際における概念レベルに関する入力を受け付ける。
【0132】
ある局面において、「概念レベルに関する入力」は、評価結果画面400C内の入力欄(図示しない)において実現される。一例として、技術情報123と特許情報125との評価結果として、「両特許ともに情報処理システムとその方法に関連している。」との結果が表示されたとする。この場合、ユーザは、たとえば、「概念レベルに関する入力」として[「情報処理システムとその方法」といった概念は広すぎるため、「戦略を適切に評価する情報処理システム」、など具体的な概念で比較して下さい。]との文言を入力する。このような指示文の入力により、「概念レベルに関する入力」が実現される。
【0133】
他の局面において、「概念レベルに関する入力」は、評価結果画面400C内の選択欄(図示しない)において実現される。当該選択欄の選択肢には、評価時における概念レベルが示されている。選択肢としては、たとえば、概念「広い」、概念「普通」および概念「狭い」が挙げられる。
【0134】
概念「広い」には、第1の概念を基準に関連性を再評価するための指示文が関連付けられている。概念「中」には、第2の概念を基準に関連性を再評価するための指示文が関連付けられている。第2の概念は、第1の概念よりも狭い。概念「狭い」には、第3の概念で関連性を再評価するための指示文が関連付けられている。第3の概念は、第2の概念よりも狭い。
【0135】
その後、情報処理装置100は、「概念レベルに関する入力」を反映した再評価のための指示文を生成する。反映の方法は、任意である。一例として、情報処理装置100は、「概念レベルに関する入力」を再評価のための指示文に含める。
【0136】
その後、情報処理装置100は、生成した再評価のための指示文を大規模言語モデル324に入力する。そして、情報処理装置100は、大規模言語モデル324から得られる結果を出力する。これにより、ユーザは、概念レベルを段階的に狭めながら関連性評価を行うことができる。
【0137】
なお、「概念レベルに関する入力」を受け付けるタイミングは、関連性評価の実行後に限定されず、関連性評価の実行前であってもよい。
【0138】
一例として、「概念レベルに関する入力」は、関連性評価に係る条件を設定するための上述の入力画面400A,400B(
図7,
図8参照)で受け付けられてもよい。「概念レベルに関する入力」は、上述の指示文128(
図9など参照)に反映する。これにより、ユーザは、概念レベルを指定して関連性評価を行うことができる。
【0139】
<J3.その他>
次に、上記実施の形態のさらに他の例について説明する。
【0140】
上述の
図11の例では、大規模言語モデル324から出力される評価スコアや評価理由が評価結果画面400Cにそのまま出力されていた。しかしながら、大規模言語モデル324の出力が評価結果画面400Cに必ずしもそのまま出力される必要はない。
【0141】
一例として、情報処理装置100は、予め定められたアルゴリズムに基づいて、技術情報123と特許情報125との類似度を算出する。類似度の算出アルゴリズムには、任意の技術が採用され得る。一例として、情報処理装置100は、技術情報123および特許情報125のそれぞれから、文章、画像または特許分類などに基づく特徴ベクトルを抽出する。そして、情報処理装置100は、技術情報123から抽出された特徴ベクトルと、特許情報125から抽出された特徴ベクトルとの類似度を算出する。当該類似度は、たとえば、コサイン類似度である。特徴ベクトルを抽出するためには、たとえば、単語のTF、TFIDF、BM25、その他頻度に応じた指標や、Word2Vec、 FastTextなどの単語ベクトルを生成するモデルによって得られる指標、BERTなど文エンコーダーモデルによって得られる指標が用いられ得る。
【0142】
そして、情報処理装置100は、大規模言語モデル324から得られる観点別の評価結果と、上記算出された類似度と総合し、評価結果として出力する。当該観点別の評価結果と当該類似度とを総合する方法は、任意である。一例として、情報処理装置100は、大規模言語モデル324から得られる観点別の評価結果に対して、上記算出された類似度を加算することで総合する。
【0143】
<J4.その他>
次に、上記実施の形態のさらに他の例について説明する。
【0144】
上述の例では、情報処理装置100は、技術情報123と特許情報125との関連性を各観点で評価する際に、1つの大規模言語モデル324を用いていた。しかしながら、情報処理装置100は、観点ごとに異なる大規模言語モデル324を用いて、技術情報123と特許情報125との関連性を評価してもよい。
【0145】
図14は、本例における関連性評価の処理を概略的に示す図である。
図14には、異なる種類の大規模言語モデル324A,324Bが示されている。
【0146】
大規模言語モデル324Aには、技術情報123と特許情報125との関連性を観点「α」で評価するための指示文128Aが入力される。一方で、大規模言語モデル324Bには、技術情報123と特許情報125との関連性を観点「β」で評価するための指示文128Bが入力される。このように、本例においては、利用する大規模言語モデル324A,324Bは、評価観点別に決められている。
【0147】
典型的には、大規模言語モデル324Aは、観点「α」での関連性評価に適するようにチューニングされている。同様に、大規模言語モデル324Bは、観点「β」での関連性評価に適するようにチューニングされている。当該チューニングには、たとえば、Chat GPT APIのファインチューニング、またはLlama2、Japanese Stable LMなどのオープンソースモデルのファインチューニングが使用される。
【0148】
<J5.その他>
次に、上記実施の形態のさらに他の例について説明する。
【0149】
上述の例では、情報処理装置100は、技術情報123の文章内容と特許情報125の文章内容との関連性を評価していた。これに対して、本例では、情報処理装置100は、技術情報123に含まれる図面の内容と特許情報125に含まれる図面との関連性を評価する。
【0150】
図15は、本例における関連性評価の処理を概略的に示す図である。
図15に示されるように、技術情報123は、1つ以上の図面123Fを含む。同様に、特許情報125は、1つ以上の図面125Fを含む。また、指示文128は、2つの情報の関連性を図面の内容の観点で評価するように規定されている。図面123F,125Fは、たとえば、画像データである。画像の形式については特に限定されない。
【0151】
情報処理装置100は、指示文128の引数部129Aに対して技術情報123を指定し、指示文128の引数部129Bに対して特許情報125を指定する。技術情報123と特許情報125とが指定された指示文128は、情報処理装置100からサーバ300に送信され、サーバ300内の大規模言語モデル324に入力される。
【0152】
大規模言語モデル324は、指示文128の入力を受けると、指示文128に応じた回答を生成する。なお、大規模言語モデル324は、画像の内容を解釈可能に学習されている。これにより、大規模言語モデル324は、技術情報123に含まれている図面123Fの内容を解釈するとともに、特許情報125に含まれている図面125Fの内容を解釈する。画像の内容を解釈可能な大規模言語モデルとして、たとえば、CLIP(Contrastive Language-Image Pretraining)、BLIP(Bootstrapping Language Image Pre-training for unified vision-language understanding and generation)、ViLBERT(Vision-and-Language BERT)などが用いられ得る。
【0153】
情報処理装置100は、大規模言語モデル324から得られる各解釈結果に基づいて、技術情報123と特許情報125との関連性を示す評価結果130を図面の内容の観点について出力する。当該関連性は、関連度合いを示す数値で表わされてもよいし、説明文で表わされてもよい。
図15の例では、当該関連性が数値で表わされている。
【0154】
上記関連性が説明文で出力される場合、当該説明文は、「技術情報123に含まれる図面123Fは、XXXという構造を有しており、特許情報125に含まれる図面125Fと比べて、XXXという部分が一致していない。」などの文言で示される。
【0155】
<J6.その他>
次に、上記実施の形態のさらに他の例について説明する。
【0156】
本例では、情報処理装置100は、技術情報123と特許情報125との関連性を同一の観点に関して段階的に評価する。これにより、関連性評価の精度が向上する。
【0157】
図16は、本例における指示文128Cを示す図である。指示文128Cは、指示132A(第1の指示)と、指示132B(第2の指示)とを含む。指示132Aは、2つの情報の関連性を特定の観点で評価させるための指示である。指示132Bは、指示132Aに基づく2つの情報の関連性の評価結果を用いて、当該2つの情報の関連性を同一の観点でさらに評価させるための指示である。
【0158】
情報処理装置100は、指示文128Cの引数部129Aに対して技術情報123を指定し、指示文128Cの引数部129Bに対して特許情報125を指定する。技術情報123と特許情報125とが指定された指示文128Cは、大規模言語モデル324に入力される。大規模言語モデル324は、指示文128Cの入力を受けると、指示文128Cに応じて、技術情報123と特許情報125との関連性を多段階で評価する。
【0159】
今回開示された実施の形態は全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。
【符号の説明】
【0160】
10 情報処理システム、100 情報処理装置、101 制御装置、102 ROM、103 RAM、104 通信インターフェイス、105 表示インターフェイス、106 ディスプレイ、107 入力インターフェイス、108 入力デバイス、110 バス、120 補助記憶装置、122 分析プログラム、123 技術情報、123F 図面、124 特許データベース、125 特許情報、125F 図面、128 指示文、128A 指示文、128B 指示文、128C 指示文、129A 引数部、129B 引数部、130 評価結果、132A 指示、132B 指示、200 ユーザ端末、201 制御装置、202 ROM、203 RAM、204 通信インターフェイス、205 表示インターフェイス、206 ディスプレイ、207 入力インターフェイス、208 入力デバイス、210 バス、220 補助記憶装置、222 分析プログラム、300 サーバ、324 大規模言語モデル、324A 大規模言語モデル、324B 大規模言語モデル、326 回答情報、400A 入力画面、400B 入力画面、400C 評価結果画面、410 選択欄、412 入力欄、420 入力欄、422 選択欄、424 入力欄、426 選択欄、428 開始ボタン、430 表示領域、440 表示領域、442 表示領域、444 表示領域、446 表示領域、NW ネットワーク。
【要約】
【課題】大規模言語モデルを特許情報の分析に利用し、新たな価値を提供する技術を提供する。
【解決手段】特許情報の分析プログラムは、コンピュータに、技術的思想を含む技術情報を取得するステップと、技術情報と比較する対象の特許情報を取得するステップと、2つの情報の関連性を特定の観点から評価するための所定の指示文に対して、技術情報と特許情報とを指定するステップと、技術情報と特許情報とが指定された指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、技術情報と特許情報との関連性を示す評価結果を観点について出力するステップとを実行させる。
【選択図】
図2