(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-08-23
(45)【発行日】2024-09-02
(54)【発明の名称】プログラム、方法、情報処理装置、システム
(51)【国際特許分類】
G06Q 50/18 20120101AFI20240826BHJP
G06F 16/332 20190101ALI20240826BHJP
【FI】
G06Q50/18 310
G06F16/332
(21)【出願番号】P 2023099801
(22)【出願日】2023-06-19
【審査請求日】2024-02-08
【早期審査対象出願】
(73)【特許権者】
【識別番号】522447406
【氏名又は名称】パテント・インテグレーション株式会社
(74)【代理人】
【識別番号】110002815
【氏名又は名称】IPTech弁理士法人
(72)【発明者】
【氏名】大瀬 佳之
【審査官】松野 広一
(56)【参考文献】
【文献】国際公開第2022/046403(WO,A1)
【文献】米国特許出願公開第2020/0050638(US,A1)
【文献】米国特許出願公開第2009/0063427(US,A1)
【文献】中国特許出願公開第111062832(CN,A)
【文献】米国特許出願公開第2019/0005198(US,A1)
【文献】特開2016-206748(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 16/332
(57)【特許請求の範囲】
【請求項1】
プロセッサと、記憶部とを備えるコンピュータに実行させるためのプログラムであって、
前記プロセッサが、
特許文書に対して実行される
タスクに関する情報を受け付けるタスク受付ステップと、
特許文書に対して適用されるクエリ情報を受け付けるクエリ受付ステップと、
特許に関する特許文書を取得する文書取得ステップと、
前記文書取得ステップにおいて取得した前記特許文書のうち、前記タスク受付ステップにおいて受け付けた前記タスクに応じて所定の抽出箇所を抽出する抽出ステップと、
前記タスク受付ステップにおいて受け付けた前記タスクに応じた情報に、前記クエリ受付ステップにおいて受け付けた前記クエリ情報
および前記抽出ステップにおいて抽出した前記抽出箇所を含
めることによりプロンプトを生成する生成ステップと、
を実行するプログラム。
【請求項2】
前記タスク受付ステップは、
特許文書に分類を付与する分類付与タスクと、
特許文書とターゲット文書との関連性を判定するスクリーニングタスクと、
特許文書と対象製品との関連性を判定する該非判定タスクと、
のうち少なくともいずれか1つの
タスクを示す情報を受け付けるステップであり、
前記抽出ステップは、
前記
タスクが分類付与タスクである場合には、特許文書のうち、要約書、特許請求の範囲、請求項1、および、明細書のうち少なくともいずれか1つ、
前記
タスクがスクリーニングタスクである場合には、特許文書のうち、要約書、特許請求の範囲、請求項1、および、明細書のうち少なくともいずれか1つ、
前記
タスクが該非判定タスクである場合には、特許文書のうち、請求項1、および、特許請求の範囲のうち少なくともいずか1つ、
の前記タスク受付ステップにおいて受け付けた前記
タスクを示す情報に応じた異なる前記所定の抽出箇所を抽出可能なステップである、
請求項1記載のプログラム。
【請求項3】
前記生成ステップは、前記文書取得ステップにおいて取得した前記特許文書に関する指標値および当該指標値の根拠を出力する命令を含む前記プロンプトを生成するステップである、
請求項1記載のプログラム。
【請求項4】
前記生成ステップは、前記タスク受付ステップにおいて受け付けた前記
タスクを示す情報に応じたタスクの実行結果を示す指標値を出力するための命令を含む前記プロンプトを生成するステップであり、
前記指標値は、
前記
タスクが分類付与タスクである場合には、付与した分類に関する精度を示す指標値であり、
前記
タスクがスクリーニングタスクである場合には、ターゲット発明との関連度を示す指標値であり、
前記
タスクが該非判定タスクである場合には、対象製品との関連度を示す指標値である、
請求項3記載のプログラム。
【請求項5】
前記プロセッサが、
前記生成ステップにおいて生成した前記プロンプトを、人工知能システムへ送信する送信ステップと、
前記人工知能システムから前記プロンプトに対する前記指標値および前記根拠を含む回答内容を受信する回答受信ステップと、
前記回答受信ステップにおいて受信した前記指標値および前記根拠をユーザに提示する回答提示ステップと、
を実行する、
請求項3記載のプログラム。
【請求項6】
前記生成ステップは、前記タスク受付ステップにおいて受け付けた前記
タスクに関する情報に応じ
た前記プロンプトを生成するステップである、
請求項1記載のプログラム。
【請求項7】
前記文書取得ステップは、複数の特許に関する特許文書を取得するステップであり、
前記抽出ステップは、前記タスク受付ステップにおいて受け付けた前記タスクに応じて、前記文書取得ステップにおいて取得した前記複数の特許文書のそれぞれについて複数の所定の抽出箇所を抽出する抽出ステップであり、
前記生成ステップは、前記クエリ受付ステップにおいて受け付けた前記クエリ情報および前記抽出ステップにおいて抽出した前記複数の抽出箇所のそれぞれに基づき、前記文書取得ステップにおいて取得した前記複数の特許文書のそれぞれに対して複数のプロンプトを生成するステップである、
請求項1記載のプログラム。
【請求項8】
前記プロセッサが、
複数のタスクを選択可能にユーザに提示するタスク提示ステップと、
を実行し、
前記タスク受付ステップは、前記ユーザから、前記タスク提示ステップにおいて提示された前記
複数のタスクのうち所定の
タスクに関する情報の入力操作を受け付けるステップである、
請求項1記載のプログラム。
【請求項9】
前記プロセッサが、
前記生成ステップにおいて生成した前記プロンプトを、人工知能システムへ送信する送信ステップと、
前記人工知能システムから前記プロンプトに対する回答内容を受信する回答受信ステップと、
を実行する、
請求項1記載のプログラム。
【請求項10】
前記プロセッサが、
前記タスク受付ステップにおいて受け付けた前記タスクに応じて、複数の抽出項目を選択可能にユーザに提示する抽出提示ステップと、
前記抽出提示ステップにおいて提示した前記複数の抽出項目に対して、前記ユーザから所定の1または複数の抽出項目に対する選択操作を受け付ける項目選択ステップと、
を実行し、
前記抽出ステップは、前記項目選択ステップにおいて選択された前記所定の1または複数の抽出項目に基づき、前記特許文書のうち前記所定の抽出箇所を抽出するステップである、
請求項1記載のプログラム。
【請求項11】
プロセッサと、記憶部とを備えるコンピュータに実行させるためのプログラムであって、
前記プロセッサが、
特許文書に対して実行される
タスクに関する情報を受け付けるタスク受付ステップと、
特許文書に対して適用されるクエリ情報を受け付けるクエリ受付ステップと、
特許に関する特許文書を取得する文書取得ステップと、
前記タスク受付ステップにおいて受け付けた前記タスクに応じた情報に、前記クエリ受付ステップにおいて受け付けた前記クエリ情報を含
めることによりプロンプトを生成する生成ステップと、
を実行し、
前記生成ステップは、前記文書取得ステップにおいて取得した前記特許文書に関する指標値および当該指標値の根拠を出力する命令を含む前記プロンプトを生成するステップである、
プログラム。
【請求項12】
前記生成ステップは、前記タスク受付ステップにおいて受け付けた前記
タスクに関する
情報に応じたタスクの実行結果を示す指標値を出力するための命令を含む前記プロンプトを生成するステップであり、
前記指標値は、
前記
タスクが分類付与タスクである場合には、付与した分類に関する精度を示す指標値であり、
前記
タスクがスクリーニングタスクである場合には、ターゲット発明との関連度を示す指標値であり、
前記
タスクが該非判定タスクである場合には、対象製品との関連度を示す指標値である、
請求項11記載のプログラム。
【請求項13】
前記プロセッサが、
前記生成ステップにおいて生成した前記プロンプトを、人工知能システムへ送信する送信ステップと、
前記人工知能システムから前記プロンプトに対する前記指標値および前記根拠を含む回答内容を受信する回答受信ステップと、
前記回答受信ステップにおいて受信した前記指標値および前記根拠をユーザに提示する回答提示ステップと、
を実行する、
請求項12記載のプログラム。
【請求項14】
プロセッサと、メモリとを備えるコンピュータに実行される方法であって、前記プロセッサが、請求項1から請求項13のいずれかに係る発明において実行される全てのステップを実行する方法。
【請求項15】
制御部と、記憶部とを備える情報処理装置であって、前記制御部が、請求項1から請求項13のいずれかに係る発明において実行される全てのステップを実行する情報処理装置。
【請求項16】
請求項1から請求項13のいずれかに係る発明において実行される全てのステップを実行する手段を備えるシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、プログラム、方法、情報処理装置、システムに関する。
【背景技術】
【0002】
特許業務を支援する技術が知られている。
特許文献1には、請求項の理解を支援するための技術に関し、請求項中のポイントとなる構成要素を特定して提示し、その説明を重点的に読むことができるようにする技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文書に対して適用する好適なプロンプトを容易に生成できていないという課題がある。
そこで、本開示は、上記課題を解決すべくなされたものであって、その目的は、特許文書に対して適用する好適なプロンプトを容易に生成する技術を提供することである。
【課題を解決するための手段】
【0005】
プロセッサと、記憶部とを備えるコンピュータに実行させるためのプログラムであって、プロセッサが、特許文書に対して実行されるタスクに関するタスク情報を受け付けるタスク受付ステップと、特許文書に対して適用されるクエリ情報を受け付けるクエリ受付ステップと、特許に関する特許文書を取得する文書取得ステップと、文書取得ステップにおいて取得した特許文書のうち、タスク受付ステップにおいて受け付けたタスクに応じて所定の抽出箇所を抽出する抽出ステップと、クエリ受付ステップにおいて受け付けたクエリ情報および抽出ステップにおいて抽出した抽出箇所を含むプロンプトを生成する生成ステップと、を実行するプログラム。
【発明の効果】
【0006】
本開示によれば、特許文書に対して適用する好適なプロンプトを容易に生成することができる。
【図面の簡単な説明】
【0007】
【
図1】システム1の機能構成を示すブロック図である。
【
図2】サーバ10の機能構成を示すブロック図である。
【
図3】ユーザ端末20の機能構成を示すブロック図である。
【
図4】ユーザテーブル1012のデータ構造を示す図である。
【
図5】文書テーブル1013のデータ構造を示す図である。
【
図6】用語テーブル1014のデータ構造を示す図である。
【
図7】支援テーブル1015のデータ構造を示す図である。
【
図8】タスクマスタ1016のデータ構造を示す図である。
【
図9】リストテーブル1017のデータ構造を示す図である。
【
図10】文書表示処理の動作を示すフローチャートである。
【
図11】問合処理の動作を示すフローチャートである。
【
図12】文書表示処理および問合処理の動作を示す画面例である。
【
図13】リスト処理の動作を示すフローチャートである。
【
図15】コンピュータ90の基本的なハードウェア構成を示すブロック図である。
【発明を実施するための形態】
【0008】
以下、本開示の実施形態について図面を参照して説明する。実施形態を説明する全図において、共通の構成要素には同一の符号を付し、繰り返しの説明を省略する。なお、以下の実施形態は、特許請求の範囲に記載された本開示の内容を不当に限定するものではない。また、実施形態に示される構成要素のすべてが、本開示の必須の構成要素であるとは限らない。また、各図は模式図であり、必ずしも厳密に図示されたものではない。
【0009】
<システム1の構成>
本開示におけるシステム1は、特許文書の読解支援サービスを提供する情報処理システムである。
システム1は、ネットワークNを介して接続された、サーバ10、ユーザ端末20、人工知能システム40の情報処理装置を備える。
図1は、システム1の機能構成を示すブロック図である。
図2は、サーバ10の機能構成を示すブロック図である。
図3は、ユーザ端末20の機能構成を示すブロック図である。
【0010】
各情報処理装置は演算装置と記憶装置とを備えたコンピュータにより構成されている。コンピュータの基本ハードウェア構成および、当該ハードウェア構成により実現されるコンピュータの基本機能構成は後述する。サーバ10、ユーザ端末20、人工知能システム40のそれぞれについて、後述するコンピュータの基本ハードウェア構成およびコンピュータの基本機能構成と重複する説明は省略する。
【0011】
<サーバ10の構成>
サーバ10は、特許文書の読解支援サービスを提供する情報処理装置である。
サーバ10は、記憶部101、制御部104を備える。
【0012】
<サーバ10の記憶部101の構成>
サーバ10の記憶部101は、アプリケーションプログラム1011、ユーザテーブル1012、文書テーブル1013、用語テーブル1014、支援テーブル1015、タスクマスタ1016、リストテーブル1017を備える。
【0013】
アプリケーションプログラム1011は、サーバ10の制御部104を各機能ユニットとして機能させるためのプログラムである。
アプリケーションプログラム1011は、ウェブブラウザアプリケーションなどのアプリケーションを含む。
【0014】
ユーザテーブル1012は、サービスを利用する会員ユーザ(以下、ユーザ)の情報を記憶し管理するテーブルである。ユーザは、サービスの利用登録を行うことで、当該ユーザの情報がユーザテーブル1012の新しいレコードに記憶される。これにより、ユーザは本開示にかかるサービスを利用できるようになる。
ユーザテーブル1012は、ユーザIDを主キーとして、ユーザID、ユーザ名のカラムを有するテーブルである。
図4は、ユーザテーブル1012のデータ構造を示す図である。
【0015】
ユーザIDは、ユーザを識別するためのユーザ識別情報を記憶する項目である。ユーザ識別情報は、ユーザごとにユニークな値が設定されている項目である。
ユーザ名は、ユーザの氏名を記憶する項目である。ユーザ名は、氏名ではなく、ニックネームなど任意の文字列を設定しても良い。
【0016】
文書テーブル1013は、特許文書に関する情報(文書情報)を記憶し管理するためのテーブルである。
文書テーブル1013は、文書ID、ユーザID、文書名、文書内容のカラムを有するテーブルである。
図5は、文書テーブル1013のデータ構造を示す図である。
【0017】
文書IDは、特許文書を識別するための文書識別情報を記憶する項目である。
ユーザIDは、ユーザを識別するためのユーザ識別情報を記憶する項目である。
文書名は、特許文書の名称を記憶する項目である。文書名は任意の文字列を設定することができる。例えば、文書名は、特許文書の公開番号、登録番号、出願番号、その他、整理番号等を記憶する。
文書内容は、特許文書の文書内容を記憶する項目である。具体的に、特許文書のテキスト情報が記憶される。例えば、文書内容は、特許文書(明細書)に含まれる「特許請求の範囲」「要約」「発明の詳細な説明」「実施例」「実施形態」等の、一部または全部を含む。具体的には、公開公報、特許公報等の公報テキストが記憶される。
【0018】
用語テーブル1014は、用語に関する情報(用語情報)を記憶し管理するためのテーブルである。
用語テーブル1014は、文書ID、用語テキストのカラムを有するテーブルである。
図6は、用語テーブル1014のデータ構造を示す図である。
【0019】
文書IDは、特許文書を識別するための文書識別情報を記憶する項目である。
用語テキストは、用語の文字列を記憶する項目である。具体的に、用語テキストは、文書識別情報により特定される特許文書に含まれる専門用語等の文字列を記憶する。
【0020】
支援テーブル1015は、人工知能システムに対する問い合わせ文章に関するプロンプトおよび人工知能システムからの回答内容(支援情報)を記憶し管理するためのテーブルである。
支援テーブル1015は、文書ID、プロンプト、回答内容のカラムを有するテーブルである。
図7は、支援テーブル1015のデータ構造を示す図である。
【0021】
文書IDは、特許文書を識別するための文書識別情報を記憶する項目である。
プロンプトは、人工知能システムに対する問い合わせ文章に関するプロンプトを記憶する項目である。プロンプトとは、主に人工知能システムに対して入力される問い合わせ文(テキスト)である。具体的に、ユーザは、人工知能システムが所望の出力結果を出力するように、人工知能システムに対してプロンプトの入力を行うことができる。なお、プロンプトは文字列である必要はなく、画像、動画、音声等によるプロンプトでも良い。例えば、ユーザによるジェスチャ、音声指示等もプロンプトになり得る。
回答内容は、プロンプトに対する人工知能システムからの回答内容を記憶する項目である。具体的に、人工知能システムからの回答内容に関するテキスト情報が記憶される。なお、本開示においてはテキストによる回答を行う人工知能システムを一例として説明するが、それに限られない。画像、動画、音声等により回答を行う人工知能システムにあっては、回答内容には、画像データ、動画データ、音声データ等が記憶されるものとしても良い。
【0022】
タスクマスタ1016は、特許文書に対して実行されるタスクに関する情報(タスク情報)を記憶し管理するためのテーブルである。
タスクマスタ1016は、タスクIDを主キーとして、タスクID、タスク種別、抽出項目、タスクデータのカラムを有するテーブルである。
図8は、タスクマスタ1016のデータ構造を示す図である。
【0023】
タスクIDは、タスクを識別するためのタスク識別情報を記憶する項目である。タスク識別情報は、タスク情報ごとにユニークな値が設定されている項目である。
タスク種別は、タスクの種別に関するタスク種別情報を記憶する項目である。具体的に、タスク種別は、特許文書に対して実行される処理(タスク)の目的に応じたタスクの内容を特定する文字列が記憶される。本開示において、タスク種別には、以下のタスクの内容に応じて「分類付与」、「スクリーニング」、「該非判定」などの情報が記憶される。
・分類付与タスク:複数の特許文書のそれぞれの内容に応じて分類を付与するタスクである。
・スクリーニングタスク:複数の特許文書のそれぞれがターゲット文書と関連しているか否かを判定させるタスクである。具体的に、「従来技術調査」、「先行技術調査」、「無効資料調査」などのように、タスクを細分化しても良い。
・該非判定タスク:複数の特許文書のそれぞれが対象製品と関連しているか否かを判定させるタスクである。例えば、「クリアランス調査」、「FTO調査」、「他社侵害品調査」などの特許業務において実行されるタスクである。
抽出項目は、タスクを実行する際に特許文書の抽出項目を示す情報(抽出項目情報)を記憶する項目である。具体的に、抽出項目は、「要約書」、「明細書」、「特許請求の範囲」、「図面」などのタスクを提供する特許文書の抽出項目を示す文字列を含む。また、抽出項目は、「発明の名称」、「発明の詳細な説明」、「技術分野」、「背景技術」、「先行技術文献」、「発明が解決しようとする課題」、「課題を解決するための手段」、「発明の効果」、「図面の簡単な説明」、「発明を実施するための形態」、「実施例」、「産業上の利用可能性」、「符号の説明等」、「課題」、「解決手段」などのタスクを提供する特許文書の抽出項目を示す文字列を含む。
具体的に、抽出項目は、タスク種別に応じて以下のような抽出項目情報が記憶される。
・分類付与:要約書、特許請求の範囲、請求項1、明細書など
・スクリーニング:要約書、特許請求の範囲、請求項1、明細書など
・該非判定:請求項1、特許請求の範囲
タスクデータは、タスクに関する情報(文字列)を記憶する項目である。具体的に、タスクデータは、タスク種別に応じて以下のような文字列が記憶される。なお、<クエリ>の項目には後述するクエリデータが、<抽出文書>には、特許文書に含まれる文章のうち、抽出項目に基づき特定される抽出箇所(抽出内容、部分文章)が挿入されプロンプトが生成される。
・タスク種別が「分類付与」の場合
『
以下のように技術分類を定義します。以下の「対象特許」に記載された発明が分類A、B、Cのいずれかに分類してください。対象特許と分類との関連度を0~100の間で算定してください。そのように判断した理由を出力してください。
#技術分類:<クエリ>(分類A「・・・」、分類B「・・・」、分類C「・・・」)
#対象特許:<抽出文書>(特許文書のうち要約書、特許請求の範囲の箇所(内容))
』
・タスク種別が「スクリーニング」の場合
『
以下の「ターゲット発明」に記載された発明が、以下の「対象特許」に記載された発明に記載されているか否かの検討をしてください。ターゲット発明と対象特許との関連度を0~100の間で算定してください。そのように判断した理由を出力してください。
#ターゲット発明:<クエリ>(・・・手段と、・・・手段と、・・・を備える装置)
#対象特許:<抽出文書>(特許文書のうち要約書、特許請求の範囲、明細書の箇所(内容))
』
・タスク種別が「該非判定」の場合
『
以下の「対象製品」に記載された製品、サービス等が、以下の「対象特許」に記載された発明の権利範囲に含まれるか否かの検討をしてください。対象製品と対象特許との関連度を0~100の間で算定してください。そのように判断した理由を出力してください。
#対象製品:<クエリ>(・・・手段と、・・・手段と、・・・を備える装置)
#対象特許:<抽出文書>(特許文書のうち請求項1の箇所(内容))
』
【0024】
リストテーブル1017は、複数の特許文書を含むリスト(リスト情報)を記憶し管理するためのテーブルである。
リストテーブル1017は、リストIDを主キーとして、リストID、文書リスト、タスクID、クエリデータのカラムを有するテーブルである。
図9は、リストテーブル1017のデータ構造を示す図である。
【0025】
リストIDは、リストを識別するためのリスト識別情報を記憶する項目である。リスト識別情報は、リスト情報ごとにユニークな値が設定されている項目である。
文書リストは、複数の特許文書の文書IDからなるリストを記憶する項目である。文書リストは、文書IDだけでなく、文書IDと関連付けて文書名、文書内容等を記憶する構成としても良い。
タスクIDは、リスト識別情報により特定される複数の特許文書を含むリストに対して適用するタスクを示すタスク識別情報を記憶する項目である。
クエリデータは、リスト識別情報により特定される複数の特許文書を含むリストに対して適用するクエリを記憶する項目である。具体的に、クエリデータは、タスクの種類に応じて以下のようなクエリが記憶される。
・分類付与タスク:分類対象を定義する文章(文字列)および分類対象を表現する複数の例示的な文章(文字列)が例示列挙したものが記憶される。
例)分類Aは「・・・」、分類Bは「・・・」、分類Cは「・・・」
・スクリーニング:ターゲット発明を記述した文章(文字列)が記憶される。
例)・・・手段と、・・・手段と、・・・を備える装置
・該非判定:対象製品を表現した文章(文字列)が記憶される。
例)・・・手段と、・・・手段と、・・・を備える装置
【0026】
<サーバ10の制御部104の構成>
サーバ10の制御部104は、ユーザ登録制御部1041、文書表示部1042、問合部1043を備える。制御部104は、記憶部101に記憶されたアプリケーションプログラム1011を実行することにより、各機能ユニットが実現される。
【0027】
ユーザ登録制御部1041は、本開示に係るサービスの利用を希望するユーザの情報をユーザテーブル1012に記憶する処理を行う。
ユーザテーブル1012に記憶される情報は、ユーザが任意の情報処理端末からサービス提供者が運営するウェブページなどを開き、所定の入力フォームに情報を入力しサーバ10へ送信する。ユーザ登録制御部1041は、受信した情報をユーザテーブル1012の新しいレコードに記憶し、ユーザ登録が完了する。これにより、ユーザテーブル1012に記憶されたユーザはサービスを利用することができるようになる。
ユーザ登録制御部1041によるユーザ情報のユーザテーブル1012への登録に先立ち、サービス提供者は所定の審査を行いユーザによるサービス利用可否を制限しても良い。
ユーザIDは、ユーザを識別できる任意の文字列または数字で良く、ユーザが希望する任意の文字列または数字、もしくはユーザ登録制御部1041が自動的に任意の文字列または数字を設定しても良い。
【0028】
文書表示部1042は、文書表示処理を実行する。詳細は後述する。
【0029】
問合部1043は、問合処理を実行する。詳細は後述する。
【0030】
<ユーザ端末20の構成>
ユーザ端末20は、サービスを利用するユーザが操作する情報処理装置である。ユーザ端末20は、例えば、スマートフォン、タブレット等の携帯端末でもよいし、据え置き型のPC(Personal Computer)、ラップトップPCであってもよい。また、HMD(Head Mount Display)、腕時計型端末等のウェアラブル端末であってもよい。
ユーザ端末20は、記憶部201、制御部204、入力装置206、出力装置208を備える。
【0031】
<ユーザ端末20の記憶部201の構成>
ユーザ端末20の記憶部201は、ユーザID2011、アプリケーションプログラム2012を備える。
【0032】
ユーザID2011はユーザのアカウントIDである。ユーザは、ユーザ端末20からユーザID2011を、サーバ10へ送信する。サーバ10は、ユーザID2011に基づきユーザを識別し、本開示にかかるサービスをユーザに対して提供する。なお、ユーザID2011には、ユーザ端末20を利用しているユーザを識別するにあたりサーバ10から一時的に付与されるセッションIDなどの情報を含む。
【0033】
アプリケーションプログラム2012は、記憶部201に予め記憶されていても良いし、通信IFを介してサービス提供者が運営するウェブサーバ等からダウンロードする構成としても良い。
アプリケーションプログラム2012は、ウェブブラウザアプリケーションなどのアプリケーションを含む。
アプリケーションプログラム2012は、ユーザ端末20に記憶されているウェブブラウザアプリケーション上で実行されるJavaScript(登録商標)などのインタープリター型プログラミング言語を含む。
【0034】
<ユーザ端末20の制御部204の構成>
ユーザ端末20の制御部204は、入力制御部2041、出力制御部2042を備える。制御部204は、記憶部201に記憶されたアプリケーションプログラム2012を実行することにより、各機能ユニットが実現される。
【0035】
<ユーザ端末20の入力装置206の構成>
ユーザ端末20の入力装置206は、カメラ2061、マイク2062、位置情報センサ2063、モーションセンサ2064、タッチデバイス2065を備える。
【0036】
<ユーザ端末20の出力装置208の構成>
ユーザ端末20の出力装置208は、ディスプレイ2081、スピーカ2082を備える。
【0037】
<人工知能システム40の構成>
人工知能システム40は、プロンプトに対する回答内容を出力する情報処理装置である。例えば、人工知能システム40は、ChatGPT、OpenAI GPT、PerplexityAsk、BingAI等が含まれる。これらの人工知能システムは対話応対(チャット)の機能を備えており、ユーザは任意の問い合わせや命令指示を文章で人工知能システムに与えることにより、当該問い合わせに対する回答や命令指示に対する回答を得ることができる。本開示においては、ユーザは、問合処理において作成したプロンプトを人工知能システム40へ送信することにより、特許文書の読解を支援する文章を回答内容として得ることができる。
また本開示において、人工知能システムは、テキストベースの対話応対に限られない。例えば、Midjourney、Stable Diffusion等の画像生成AIシステムであっても構わない。例えば、ユーザは、問合処理において作成したプロンプトを、そのような画像生成AIシステムに送信することにより、特許文書の読解を支援する画像や動画を回答内容として得ることができる。
その他、本開示は、動画や音声等により回答内容を出力する人工知能システムに対しても適用可能である。人工知能システム40は、大規模言語モデルシステム(LLMシステム)を含む。
【0038】
<システム1の動作>
以下、システム1の各処理について説明する。
図10は、文書表示処理の動作を示すフローチャートである。
図11は、問合処理の動作を示すフローチャートである。
図12は、文書表示処理および問合処理の動作を示す画面例である。
図13は、リスト処理の動作を示すフローチャートである。
図14は、リスト処理の動作を示す画面例である。
【0039】
<文書表示処理>
文書表示処理は、特許文書および用語を受け付け、当該用語に基づき特許文書をハイライト表示(異なる色や、背景色、太字、下線等の装飾を付与した表示態様により強調表示)する処理である。
【0040】
<文書表示処理の概要>
文書表示処理は、特許文書を受け付け、当該特許文書に基づき重要語を抽出し、用語の入力を受け付け、当該用語に基づき特許文書に対するハイライト処理を実行し、当該ハイライト処理が行われた文書を表示する一連の処理である。
【0041】
<文書表示処理の詳細>
以下に、文書表示処理の詳細を説明する。
【0042】
ステップS101において、サーバ10の文書表示部1042は、特許に関する文書を受け付ける文書受付ステップを実行する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、ウェブブラウザ等に文書表示処理を実行するためのページ(文書表示処理ページ)のURLを入力し、文書表示処理ページを開く。ユーザ端末20の制御部204は、文書表示処理ページを開くためのリクエストを、サーバ10へ送信する。サーバ10の制御部104は、受信したリクエストに基づき、文書表示処理ページを生成しユーザ端末20へ送信する。ユーザ端末20の制御部204は、受信した文書表示処理ページをユーザ端末20のディスプレイ2081に表示する。
【0043】
図12は、文書表示処理における文書表示画面の画面例である。ユーザ端末20のディスプレイ2081には、文書表示ページD1が表示される。文書表示ページD1は、文書表示画面D10を含む。文書表示画面D10は、文書入力ボタンD100、文書表示エリアD101、用語入力エリアD102、問合回答エリアD105を含む。用語入力エリアD102は、用語入力欄D1021、D1022、D1023・・・、定義解説ボタンD1031、D1032、D1033・・・、要約生成ボタンD1041を含む。問合回答エリアD105は、プロンプト入力欄D1051、プロンプト送信ボタンD1052、プロンプトD1061、D1062・・・、回答内容D1071、D1072・・・、補助ボタンD1081、D1082、D1083・・・を含む。回答内容D1071は、段落番号D1091、D1092・・・を含む。
【0044】
ユーザは、ユーザ端末20の入力装置206を操作することにより、文書表示画面D10に表示された文書入力ボタンD100を押下する。ユーザ端末20の制御部204は、文書入力ダイアログ画面を生成し、ユーザ端末20のディスプレイ2081に表示する。ユーザは、文書入力ダイアログ画面において、文書名および文書内容を入力する。具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、文書名の入力欄に公開公報、特許公報の公報番号を入力する。ユーザは、ユーザ端末20の入力装置206を操作することにより、文書内容の入力欄に公開公報、特許公報の明細書のテキスト情報を入力する。なお、文書内容は、文書名に入力された公報番号に基づき、ユーザ端末20の制御部204が不図示の公報データベース等を参照することにより取得し、自動的に入力する構成としても良い。ユーザは、文書入力ダイアログ画面に表示されている「送信ボタン」を押下することにより、文書名、文書内容の入力欄に入力された情報をサーバ10へ送信する。サーバ10へ送信する情報は、ユーザID2011を含む。
サーバ10の文書表示部1042は、ユーザ端末20からユーザID2011、文書名、文書内容を受信し、受け付ける。サーバ10の文書表示部1042は、受信したユーザID2011、文書名、文書内容を、それぞれ、文書テーブル1013の新たなレコードのユーザID、文書名、文書内容の項目に記憶する。
【0045】
ステップS101において、サーバ10の文書表示部1042は、文書受付ステップにおいて受け付けた文書をユーザに提示する文書提示ステップを実行する。
ユーザ端末20の制御部204は、入力を受け付けた文書内容を文書表示エリアD101に表示し、ユーザに対して提示する。ユーザは、文書表示エリアD101により、特許文書の内容を確認することができる。
【0046】
ステップS102において、サーバ10の文書表示部1042は、文書受付ステップにおいて受け付けた文書の内容を解析することにより得られる1または複数の重要語を特定する重要語特定ステップを実行する。
具体的に、サーバ10の文書表示部1042は、ステップS101において受信した文書内容を解析することにより、1または複数の重要語を特定する。サーバ10の文書表示部1042は、文書内容に含まれる文章に対して形態素解析を適用することにより、単語ごとに分割する。サーバ10の文書表示部1042は、単語ごとの重要度(スコア)を、TF-IDF法、テキストランキング法、nグラム法などにより算定する。
TF-IDF法は、単語の出現頻度と逆文書頻度を組み合わせることにより単語ごとの重要度を算定する手法である。nグラム法は、連続したn個の単語を抽出し、出現頻度に基づいて単語ごとのスコアを算定する手法である。テキストランキング法は、ページランクアルゴリズムに基づいて単語ごとの重要度を算定する手法である。その他、LexRank、LSA(Latent Semantic Analysis)などの手法がある。
サーバ10の文書表示部1042は、重要度順に所定個数の単語、または、所定値以上の重要度の単語を重要語として抽出し、特定する。サーバ10の文書表示部1042は、特定した重要語をユーザ端末20へ送信する。ユーザ端末20の制御部204は、重要語を受信し受け付ける。
なお、ユーザ端末20の制御部204が、重要語の抽出処理を実行しても良い。
【0047】
ステップS103において、ユーザ端末20の制御部204は、文書受付ステップにおいて受け付けた文書に含まれる1または複数の用語を受け付ける用語受付ステップを実行する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、用語入力欄D1021、D1022、D1023に、文書表示エリアD101に表示された文書内容に含まれる用語を、コピーアンドペーストしたり、キーボードを用いた入力操作を行うことにより入力する。ユーザは、任意の文字列を用語入力欄D1021、D1022、D1023に入力することができる。
【0048】
ステップS103において、用語受付ステップは、重要語特定ステップにおいて特定した1または複数の重要語を、1または複数の用語として受け付けるステップを実行する。
具体的に、ユーザ端末20の制御部204は、サーバ10から受信した1または複数の重要語を用語入力欄D1021、D1022、D1023に入力した状態で、ユーザに対して提示しても良い。ユーザ端末20の制御部204は、サーバ10から受信した1または複数の重要語を、1または複数の用語として受け付けても良い。
【0049】
ステップS103において、ユーザ端末20の制御部204は、重要語特定ステップにおいて特定した1または複数の重要語をユーザに提示する重要語提示ステップを実行する。
具体的に、ユーザ端末20の制御部204は、サーバ10から受信した1または複数の重要語をユーザ端末20のディスプレイ2081に選択可能な態様で提示しても良い。例えば、ユーザは、ユーザ端末20の入力装置206を操作することにより、1または複数の重要語を選択することが可能な態様(例えば、チェックボックスやラジオボックス等と関連付けられた態様)でユーザに対して提示される。
【0050】
ステップS103において、用語受付ステップは、ユーザから重要語提示ステップにおいて提示した1または複数の重要語に対する入力操作に応じて、入力操作に対応する少なくとも一部の重要語を、1または複数の用語として受け付けるステップを実行する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、ユーザ端末20のディスプレイ2081に選択可能な態様で提示された1または複数の重要語のうち、所定の1または複数の重要語を選択する。ユーザ端末20の制御部204は、選択された所定の1または複数の重要語を、用語入力欄D1021、D1022、D1023に入力する。これにより、ユーザ端末20の制御部204は、ユーザにより選択された所定の1または複数の重要語を、1または複数の用語として受け付けることができる。
【0051】
なお、ユーザ端末20の制御部204は、1または複数の重要語を提示するダイアログを文書表示画面D10に重ねて提示することにより1または複数の重要語をユーザに対して提示する。ユーザは、ユーザ端末20の入力装置206を操作することにより、当該1または複数の重要語に対する選択操作を行うことにより、選択された1または複数の重要語を用語入力欄D1021、D1022、D1023に入力する構成としても良い。
【0052】
ステップS104において、ユーザ端末20の制御部204は、文書表示エリアD101に表示された文書内容に含まれる1または複数の用語に対してハイライト処理を実行する。具体的に、ユーザ端末20の制御部204は、ステップS103において受け付けた1または複数の用語について、文書内容に含まれる当該1または複数の用語を、異なる色や、背景色、太字、下線等の装飾を付与した表示態様により強調表示(ハイライト表示)させる。例えば、ユーザ端末20の制御部204は、文書内容に対して、1または複数の用語のそれぞれを、強調表示された1または複数の用語で置換することにより、文書内容に含まれる1または複数の用語をハイライト表示させることができる。
なお、サーバ10の文書表示部1042が、ハイライト処理を実行しても良い。
【0053】
ステップS105において、文書提示ステップは、用語受付ステップにおいて受け付けた1または複数の用語に基づき、文書に含まれる1または複数の用語を識別可能な態様でユーザに提示するステップを実行する。
具体的に、ユーザ端末20の制御部204は、ハイライト表示させた文書内容を文書表示エリアD101に表示し、ユーザに対して提示する。
【0054】
<問合処理>
問合処理は、文書表示処理において受け付けた用語に基づき問い合わせ文章に関するプロンプト(問い合わせ文章、質問文、質問クエリ)を作成し、当該プロンプトに基づき特許文書の読解に役立つ情報を人工知能システムへ問い合わせる処理である。
【0055】
<問合処理の概要>
問合処理は、用語の選択を受け付け、選択された用語に基づきプロンプトを作成し、ユーザからプロンプトの編集を受け付け、プロンプトを人工知能システムへ送信し、人工知能システムから回答内容を受信し、受信した回答内容を表示する一連の処理である。
【0056】
<問合処理の詳細>
以下に、問合処理の詳細を説明する。
【0057】
ステップS301において、ユーザは、ユーザ端末20の入力装置206を操作することにより、用語入力エリアD102に含まれる1または複数の用語入力欄D1021、D1022、D1023を選択する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、定義解説ボタンD1031、D1032、D1033のいずれか1つを押下する。これにより、押下された定義解説ボタンD1031、D1032、D1033のいずれか1つに対応する用語入力欄D1021、D1022、D1023のいずれか1つが選択される。
ユーザは、ユーザ端末20の入力装置206を操作することにより、要約生成ボタンD1041を押下する。これにより、用語入力欄D1021、D1022、D1023のすべてが選択される。なお、用語入力欄D1021、D1022、D1023の一部が選択される構成としても良い。例えば、用語入力欄D1021、D1022、D1023のそれぞれに関連付けられたチェックボックス等を選択することにより、複数の用語入力欄D1021、D1022、D1023のうち、所定の1または複数の用語入力欄が選択される構成としても良い。
その他、ユーザは、用語入力エリアD102において、ユーザ端末20の入力装置206を操作することにより、用語入力欄D1021、D1022、D1023の一部または全部を選択することができる。
【0058】
ステップS302において、ユーザ端末20の制御部204は、用語受付ステップにおいて受け付けた用語に基づき問い合わせ文章に関するプロンプトを作成する問合作成ステップを実行する。
具体的に、ユーザ端末20の制御部204は、ステップS301において選択された用語に基づき、問い合わせ文章に関するプロンプトを作成する。
【0059】
ステップS302において、問合作成ステップは、1または複数の用語の定義または意味の説明を問い合わせる文章を含むプロンプトを作成するステップを実行する。
具体的に、ユーザが、ユーザ端末20の入力装置206を操作することにより、定義解説ボタンD1031を押下すると、ユーザ端末20の制御部204は、用語入力欄D1021に入力された用語「用語1」に基づき、『この文章において用語「用語1」の意味や内容を説明してください。』というプロンプト(文字列)を作成する。ステップS301において、1つの用語のみが選択されている場合には、ユーザ端末20の制御部204は、自動的に用語の定義または意味の説明を問い合わせる文章を含むプロンプトを作成しても良い。
【0060】
ステップS302において、問合作成ステップは、複数の用語の関係性の説明を問い合わせる文章を含むプロンプトを作成するステップを実行する。
具体的に、ユーザが、ユーザ端末20の入力装置206を操作することにより、要約生成ボタンD1041を押下すると、ユーザ端末20の制御部204は、用語入力欄D1021、D1022、D1023に入力された用語「用語1」、「用語2」、「用語3」に基づき、『この文章において用語「用語1」、「用語2」、「用語3」の関係を説明してください。』というプロンプト(文字列)を作成する。ステップS301において、複数の用語が選択されている場合には、ユーザ端末20の制御部204は、自動的に複数の用語の関係性の説明を問い合わせる文章を含むプロンプトを作成しても良い。
【0061】
ステップS302において、問合作成ステップは、文書受付ステップにおいて受け付けた文書の内容に基づき特定される技術分野に関する情報を含むプロンプトを作成するステップを実行する。
具体的に、ユーザ端末20の制御部204は、文章内容を解析することにより特許文書が言及している技術分野である「技術分野1」を特定する。技術分野は、特許文書に含まれる特許分類等の文字列に基づき特定しても良い。ユーザ端末20の制御部204は、特定した技術分野に基づき『以下の文章は、「技術分野1」の技術分野における文章です。』というプロンプト(文字列)を作成し、既に作成したプロンプトに含める。
これにより、例えば、ユーザ端末20の制御部204は、『以下の文章は、「技術分野1」の技術分野における文章です。この文章において用語「用語1」の意味や内容を説明してください。』というプロンプトを作成する。
【0062】
ステップS302において、問合作成ステップは、ユーザから受け付ける入力操作に応じて、プロンプトを作成するステップを実行する。
具体的に、ユーザ端末20の制御部204は、定義解説ボタンD1031、D1032、D1033の押下、要約生成ボタンD1041の押下等の、ユーザ端末20の入力装置206の入力操作をトリガーとしてプロンプトを作成する構成としても良い。
また、ユーザ端末20の制御部204は、用語入力欄D1021、D1022、D1023に入力された用語、重要語に応じて、ユーザによる入力操作を受け付けることなく自動的にプロンプトを作成しても良い。
【0063】
ステップS302において、ユーザ端末20の制御部204は、プロンプトの末尾に文書内容の全文を付加してプロンプトを完成させる。例えば、ユーザ端末20の制御部204は、『以下の文章は、「技術分野1」の技術分野における文章です。この文章において用語「用語1」の意味や内容を説明してください。〔文書内容〕』というプロンプトを作成する。
【0064】
ステップS302において、ユーザ端末20の制御部204は、プロンプトの末尾に文書内容の全文ではなく、文書内容の一部を付加してプロンプトを完成させても良い。例えば、ユーザ端末20の制御部204は、『以下の文章は、「技術分野1」の技術分野における文章です。この文章において用語「用語1」の意味や内容を説明してください。〔部分文書1〕〔部分文書2〕〔部分文書3〕』というプロンプトを作成する。
【0065】
問合作成ステップは、問い合わせ文章または1もしくは複数の用語に基づき、文書受付ステップにおいて受け付けた文書の一部である部分文書を特定し、部分文書を含むプロンプトを作成するステップを実行する。
問合作成ステップは、文書受付ステップにおいて受け付けた文書から、問い合わせ文章または1もしくは複数の用語に含まれる単語を含む、行または段落を特定し、行または段落のみからなる部分文書を含むプロンプトを作成するステップを実行する。
具体的に、ユーザ端末20の制御部204は、文書内容を行または段落ごとの複数の部分文書に分割する。ユーザ端末20の制御部204は、用語入力欄D1021、D1022、D1023の入力値と、複数の部分文書との関連度を算定する。具体的には、複数の部分文書のそれぞれと、用語入力欄D1021、D1022、D1023の入力値との間のコサイン類似度、ユークリッド距離、ジャッカー係数等を関連度とすることができる。ユーザ端末20の制御部204は、関連度順に所定個数の部分文書、または、所定値以上の関連度の1または複数の部分文書を抽出しプロンプトの末尾に付加する。
なお、ユーザ端末20の制御部204が、既に作成したプロンプトと、複数の部分文書との関連度を算定しても良い。この場合、既に作成したプロンプトと関連度が高い1または複数の部分文書が、当該プロンプトの末尾に付加される。
なお、部分文書は、行、段落である必要はなく、特許文書を構成する任意の文書単位で分割したものを部分文書としても構わない。
【0066】
なお、サーバ10の問合部1043が、プロンプト作成処理を実行しても良い。
【0067】
ユーザ端末20の制御部204は、作成したプロンプトを、プロンプト入力欄D1051に入力する。
【0068】
ステップS303において、ユーザは、ユーザ端末20の入力装置206を操作することにより、プロンプト入力欄D1051に入力されているプロンプトの内容を編集することができる。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、プロンプト入力欄D1051に入力されているプロンプトを修正し、編集することができる。ユーザは、ユーザ端末20の入力装置206を操作することにより、補助ボタンD1081、D1082、D1083のいずれかを押下することにより、「簡潔に説明してください。」、「箇条書きで説明してください。」、「300文字以内で説明してください。」のいずれかの補助的な文字列をプロンプト入力欄D1051に入力されているプロンプトに付加することができる。これにより、人工知能システム40からの回答内容を期待したものとなるように制御することができる。
【0069】
ステップS304において、サーバ10の問合部1043は、問合作成ステップにおいて作成したプロンプトを外部の事業者が運営する人工知能システムへ送信することにより問い合わせる問合送信ステップを実行する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、プロンプト送信ボタンD1052を押下する。ユーザ端末20の制御部204は、プロンプト入力欄D1051に入力されている文字列(プロンプト)をサーバ10へ送信する。サーバ10の問合部1043は、ユーザ端末20から受信した文字列(プロンプト)を人工知能システム40が提供する人工知能サービスのAPI(Application Programming Interface)エンドポイントへ送信する。
なお、ユーザ端末20の制御部204が、プロンプト入力欄D1051に入力されている文字列(プロンプト)を直接、人工知能サービスのAPI(Application Programming Interface)エンドポイントへ送信しても良い。
【0070】
ステップS305において、サーバ10の問合部1043は、送信したプロンプトに対するレスポンスを受信する。レスポンスは、プロンプトに対する回答内容に関する文字列を含む。サーバ10の問合部1043は、受信したレスポンスをユーザ端末20へ送信する。
なお、ユーザ端末20の制御部204が、送信したプロンプトに対するレスポンスを人工知能システム40から直接受信しても良い。
【0071】
ステップS306において、サーバ10の問合部1043は、問合送信ステップにおいて送信したプロンプトに対する回答内容をユーザに提示する回答提示ステップを実行する。回答提示ステップは、文書提示ステップにおいて提示した文書とともに、回答内容をユーザに提示するステップを実行する。
具体的に、ユーザ端末20の制御部204は、レスポンスを受信すると、プロンプトおよび当該プロンプトに対するレスポンスに含まれる回答内容のそれぞれを、プロンプトD1061、回答内容D1071に表示する。複数のプロンプト、当該複数のプロンプトに対する複数の回答内容のそれぞれが、プロンプトD1061、D1062・・・、回答内容D1071、D1072に表示され、ユーザに対して提示される。
問合回答エリアD105は、文書表示エリアD101とともに表示される。これにより、ユーザは、ハイライト表示された特許文書と、人工知能システムからの回答内容とを併せて確認することができ、効率的に特許文書を読解することができる。
【0072】
ステップS306において、回答提示ステップは、用語受付ステップにおいて受け付けた1または複数の用語に基づき、回答内容に含まれる1または複数の用語を識別可能な態様でユーザに提示するステップを実行する。
具体的に、ユーザ端末20の制御部204は、プロンプトD1061、D1062に表示される文字列および、回答内容D1071、D1072に表示される文字列に対しても、ハイライト処理を実行しても良い。例えば、ユーザ端末20の制御部204は、プロンプトまたは回答内容の文字列に対して、1または複数の用語のそれぞれを、強調表示された1または複数の用語で置換することにより、文字列に含まれる1または複数の用語をハイライト表示させることができる。
これにより、人工知能システムからの回答内容に含まれる用語に対してもハイライト表示することができる。ユーザは、ハイライト表示された特許文書と、ハイライト表示された回答内容とを併せて確認することができ、効率的に特許文書を読解することができる。
【0073】
回答提示ステップは、プロンプトまたは回答内容に関連する、文書受付ステップにおいて受け付けた文書の一部である部分文書を特定する一部特定ステップと、特定した部分文書を示す情報を回答内容と併せて提示するステップと、を含む。
回答提示ステップは、プロンプトまたは回答内容に関連する、文書受付ステップにおいて受け付けた文書の行または段落を特定する一部特定ステップと、特定した行または段落を回答内容と併せて提示するステップと、を含む。
具体的に、ユーザ端末20の制御部204は、文書内容を行または段落ごとの複数の部分文書に分割する。ユーザ端末20の制御部204は、用語入力欄D1021、D1022、D1023の入力値と、複数の部分文書との関連度を算定する。具体的には、複数の部分文書のそれぞれと、用語入力欄D1021、D1022、D1023の入力値との間のコサイン類似度、ユークリッド距離、ジャッカー係数等を関連度とすることができる。ユーザ端末20の制御部204は、関連度順に所定個数の部分文書、または、所定値以上の関連度の1または複数の部分文書を特定する行番号または段落番号を、問合回答エリアD105の段落番号D1091、D1092に表示する。
なお、部分文書は、行、段落である必要はなく、特許文書を構成する任意の文書単位で分割したものを部分文書としても構わない。
【0074】
なお、サーバ10の文書表示部1042が、回答内容提示処理を実行しても良い。
【0075】
<リスト処理>
リスト処理は、ユーザから複数の特許文書を含むリスト、および、当該リストに適用する質問文(クエリ)を受け付け、当該クエリをリストに含まれる複数の特許文書に対して適用することによりプロンプトを生成し、当該プロンプトに基づき人工知能システムへ問い合わせる処理である。
【0076】
<リスト処理の概要>
リスト処理は、ユーザからクエリの入力を受け付け、複数の特許文書を含むリストを受け付け、当該リストに含まれる特許文書を特定し、クエリおよび特許文書に基づきプロンプトを生成し、生成したプロンプトを人工知能システムへ送信し、人工知能システムから回答内容を受信し、受信した回答内容を特許文書と関連付けて提示する一連の処理である。
【0077】
<リスト処理の詳細>
以下に、リスト処理の詳細を説明する。
【0078】
ステップS501において、サーバ10のリスト処理部1044は、リスト処理を実行するためのリスト処理画面をユーザに対して提示する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作し、ブラウザアプリケーション等を実行し、リスト処理を実行するためのウェブページ(リストページ)のURL等を入力することによりリストページD3を開く。ユーザ端末20の制御部204は、リストページを開くためのユーザID2011を含むリクエストをサーバ10へ送信する。
【0079】
サーバ10は、リクエストを受信するとリストページを生成しユーザ端末20へ送信する。ユーザ端末20の制御部204は、リストページをユーザ端末20のディスプレイ2081に表示し、提示する。
図14は、リスト処理におけるリスト画面の画面例である。ユーザ端末20のディスプレイ2081には、リストページD3が表示される。リストページD3は、タスク選択欄D301、抽出項目選択欄D311、クエリ入力欄D302、文書入力欄D303、プロンプト表示欄D304、送信ボタンD305、回答結果D306を含む。
【0080】
ステップS501において、ユーザ端末20の制御部204は、複数のタスク情報を選択可能にユーザに提示するタスク提示ステップを実行する。
具体的に、サーバ10のリスト処理部1044は、タスクマスタ1016を参照してタスクID、タスク種別の項目を取得し、ユーザ端末20へ送信する。ユーザ端末20の制御部204は、受信した複数のタスク種別を選択可能な態様でタスク選択欄D301に表示する。例えば、ユーザ端末20の制御部204は、タスク選択欄D301に表示される複数のタスク種別のそれぞれを、タスク種別を選択するためのラジオボタンと関連付けてユーザに対して提示する。
【0081】
ステップS501において、サーバ10のリスト処理部1044は、特許文書に対して実行されるタスクに関するタスク情報を受け付けるタスク受付ステップを実行する。タスク受付ステップは、ユーザから、タスク提示ステップにおいて提示された複数のタスク情報のうち所定のタスク情報の入力操作を受け付けるステップを実行する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、タスク選択欄D301に表示されている複数のタスク種別から特許文書に対して実行する所定のタスク種別を選択する。
【0082】
タスク受付ステップは、特許文書に分類を付与する分類付与タスクと、特許文書とターゲット文書との関連性を判定するスクリーニングタスクと、特許文書と対象製品との関連性を判定する該非判定タスクと、のうち少なくともいずれか1つのタスクを示すタスク情報を受け付けるステップを実行する。
具体的に、ユーザは、分類付与タスク、スクリーニングタスク、該非判定タスクなどのタスク種別から、所定のタスク種別を選択することができる。なお、複数のタスク種別を選択できる構成としても良い。
【0083】
ユーザ端末20の制御部204は、タスク選択欄D301において選択されたタスク情報に応じたタスクIDをサーバ10へ送信する。サーバ10のリスト処理部1044は、タスクIDを受信し、受け付ける。
【0084】
なお、本開示において、複数のタスク情報が選択可能に提示され、ユーザにより選択される構成を一例として開示したがそれに限られない。例えば、タスク情報は一種類(分類付与タスク、スクリーニングタスク、該非判定タスクのうちのいずれか1つ)であり、予めタスク情報が所定のタスク情報として定められているものとしても良い。この場合、ステップS501にかかる処理を省略しても良い。この場合も、サーバ10のリスト処理部1044は、予め定められているタスク情報の入力を受け付けたものと解釈することができる。
また、タスク情報は選択により受け付ける構成はなく、後述するクエリ受付ステップにおいて受け付けたクエリの内容に基づき特定される構成としても良い。
また、タスク選択欄D301に代えて、ユーザがタスク情報、タスク種別等を入力可能なタスク入力欄を設けても良い、ユーザは、タスク入力欄に、分類付与タスク、スクリーニングタスク、該非判定タスクなどのタスク情報を示す情報を入力し、ユーザ端末20の制御部204またはサーバ10のリスト処理部1044がタスク種別を受け付ける構成としても構わない。
【0085】
ステップS502において、サーバ10のリスト処理部1044は、特許文書に対して適用されるクエリ情報を受け付けるクエリ受付ステップを実行する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、クエリ入力欄D302に特許文書に対して適用するクエリに関する文字列を入力する。例えば、ユーザは、ユーザ端末20の入力装置206を操作することにより、ステップS501において選択されたタスク種別に応じて、以下のようなクエリをクエリ入力欄D302に入力する。
【0086】
〔分類付与タスクの場合のクエリ〕
分類Aは、情報処理機器に関する分類である。
分類Bは、農機具に関する分類である。
分類Cは、食料品に関する分類である。
【0087】
〔スクリーニングタスクの場合のクエリ〕
クエリ例1)・・・手段と、・・・手段と、・・・を備える装置
クエリ例2)・・・工程と、・・・工程と、・・・を備える方法
クエリ例3)・・・ステップと、・・・ステップと、・・・を実行するプログラム
【0088】
〔該非判定タスクの場合のクエリ〕
クエリ例1)・・・手段と、・・・手段と、・・・を備える装置
クエリ例2)・・・工程と、・・・工程と、・・・を備える方法
クエリ例3)・・・ステップと、・・・ステップと、・・・を実行するプログラム
【0089】
ユーザ端末20の制御部204は、クエリ入力欄D302に入力された文字列をサーバ10へ送信する。サーバ10のリスト処理部1044は、文字列を受信し、クエリデータとして受け付ける。
【0090】
ステップS503において、サーバ10のリスト処理部1044は、特許に関する特許文書を取得する文書取得ステップを実行する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、文書入力欄D303に特許文書の文書IDを入力する。なお、特許文書は文書テーブル1013における文書IDにより指定される必要はなく、ユーザは、文書入力欄D303に、公開特許公報等の特許番号、特許文書ごとの要約、特許請求の範囲および特許明細書等の特許文書の内容を入力しても良い。ユーザは、ユーザ端末20の記憶部201に記憶された、Word、Excel、CSVファイル等に含まれる特許文書の情報をアップロード対象として直接選択できる構成としても構わない。ユーザは、任意の手段により所定の特許文書をサーバ10へ送信できる構成であればどのような手段であっても良い。
【0091】
文書取得ステップは、複数の特許に関する特許文書を取得するステップを実行する。
なお、ユーザは、ユーザ端末20の入力装置206を操作することにより、複数の特許文書をサーバ10に対して送信する構成としても良い。ユーザは、ユーザ端末20の入力装置206を操作することにより、文書入力欄D303に複数の特許文書の文書IDを入力しても良い。また、ユーザは、複数の特許文書の情報を含むExcel、CSVファイル等をサーバ10へ送信しても良い。
【0092】
ユーザ端末20の制御部204は、ユーザにより入力または選択された1または複数の特許文書をサーバ10へ送信する。サーバ10のリスト処理部1044は、1または複数の特許文書を受信により取得し、受け付ける。
【0093】
サーバ10のリスト処理部1044は、ユーザ端末20から受信した、タスクID、クエリデータ、1または複数の特許文書を、リストテーブル1017の新たなレコードのタスクID、クエリデータ、文書リストの項目に記憶する。
【0094】
本開示においては、一例として1の特許文書を入力した場合の処理を以下のステップS504からS507まで説明する。なお、複数の特許文書を入力した場合は、複数の特許文書に含まれるそれぞれの特許文書ごとにステップS504からS507までの処理を実行する構成とすれば良い。
【0095】
ステップS504において、サーバ10のリスト処理部1044は、タスク受付ステップにおいて受け付けたタスクに応じて、文書取得ステップにおいて取得した特許文書のうち所定の抽出箇所を抽出する抽出ステップを実行する。
具体的に、サーバ10のリスト処理部1044は、受信した文書IDに基づき、文書テーブル1013の文書IDの項目を検索し、文書内容の項目を取得する。なお、ユーザは、文書入力欄D303に文書内容を入力したり、文書内容を含むファイル等をアップロードした場合にはこの処理を省略しても良い。
【0096】
その他、受信した文書ID、文書名に基づき、不図示の特許データベース等を参照して、要約書、特許請求の範囲、明細書等を含む特許文書を取得する構成としても良い。この場合、取得した抽出項目に基づき、所定の抽出項目を除外して特許データベース等から特許文書を取得しても良い。例えば、該非判定タスクの場合において、要約書、明細書等の抽出項目を除外して、特許データベース等から特許文書を取得しても良い。この場合も、文章内容のうち所定の抽出箇所を抽出したことに相当する。
【0097】
サーバ10のリスト処理部1044は、受信したタスクIDに基づき、タスクマスタ1016のタスクIDの項目を検索し、抽出項目、タスクデータを取得する。サーバ10のリスト処理部1044は、取得した抽出項目に基づき、文書内容のうち所定の抽出箇所(抽出内容、部分文章)を抽出する。
【0098】
なお、抽出ステップは、後述する人工知能システム40が入力を受け付け可能な文字数等のトークン数制限に応じて、抽出箇所に対してさらに文字列を短縮する処理を実行しても良い。具体的に、サーバ10のリスト処理部1044は、抽出箇所に含まれる文字列を、文章、文節などのセンテンスごとに分割し、TF-IDF、LexRank、LSA等の手法に基づき算定される重要度が高い文章、文節などを抽出し、重要度が低い文章、文節などを除外することにより、人工知能システム40が入力を受け付け可能な文字数等に収まるように文字列を短くする。
また、抽出箇所の先頭から人工知能システム40が入力を受け付け可能な所定長を抽出箇所とし、所定長を超える文字列を除外して抽出箇所としても良い。
その他、所定の抽出箇所に対して任意の後処理を適用しても構わない。この場合、任意の後処理を適用したあとの文字列も所定の抽出箇所の一種として扱うことができる。
【0099】
例えば、抽出ステップは、タスク受付ステップにおいて受け付けたタスク情報に応じて、タスク情報が分類付与タスクである場合には、特許文書のうち、要約書、特許請求の範囲、請求項1、および、明細書のうち少なくともいずれか1つ、タスク情報がスクリーニングタスクである場合には、特許文書のうち、要約書、特許請求の範囲、請求項1、および、明細書のうち少なくともいずれか1つ、タスク情報が該非判定タスクである場合には、特許文書のうち、請求項1、および、特許請求の範囲のうち少なくともいずか1つ、にかかる所定の抽出箇所を抽出するステップを実行する。
これにより、ユーザにより選択されたタスクを実行するにあたり必要な箇所が特許文書の文書内容から抽出される。なお、本開示においてはユーザによる操作によらずに特許文書から所定の抽出箇所を抽出する処理を一例として開示したがこれに限定されない。例えば、タスク受付ステップにおいて受け付けたタスク情報に応じて、所定の抽出項目に関する選択可否を抽出項目選択欄D311により提示し、ユーザにより選択された抽出項目に応じて、特許文書から所定の抽出箇所を抽出する処理をしても良い。
例えば、タスク情報が分類付与タスクである場合には、要約書、特許請求の範囲、請求項1、および、明細書のうち少なくともいずれか1つを選択可能な抽出項目選択欄D311をユーザに対して提示し、ユーザにより選択された抽出項目に応じて、特許文書から所定の抽出箇所を抽出する処理としても良い。これにより、ユーザによる選択に応じて、分類付与タスクにおいて、要約書、特許請求の範囲、請求項1、明細書のうち少なくともいずれか1つの抽出箇所を、所定の抽出箇所から除外することができる。
本開示は、ユーザにより実行されるタスクの内容(タスク情報)に応じて、同じ特許文書に対して異なる抽出箇所を抽出する処理が実行可能であれば足りる。例えば、スクリーニングタスク、該非判定タスクを適用する1の特許文書に対して、スクリーニングタスク、該非判定タスクごとに異なる抽出箇所(例えば、スクリーニングタスクであれば明細書、該非判定タスクであれば請求項1)を抽出する処理が実行可能であれば足りる。
【0100】
抽出ステップは、タスク受付ステップにおいて受け付けたタスクに応じて、文書取得ステップにおいて取得した複数の特許文書のそれぞれについて複数の所定の抽出箇所を抽出する抽出ステップを実行する。
具体的に、複数の特許文書を入力した場合は、複数の特許文書に含まれるそれぞれの特許文書ごとに、抽出ステップが実行される。また、抽出した抽出箇所は文書IDと関連付けて記憶される。
【0101】
ステップS505において、サーバ10のリスト処理部1044は、クエリ受付ステップにおいて受け付けたクエリ情報および抽出ステップにおいて抽出した抽出箇所を含むプロンプトを生成する生成ステップを実行する。生成ステップは、タスク受付ステップにおいて受け付けたタスク情報に応じてプロンプトを生成するステップを実行する。
生成ステップは、文書取得ステップにおいて取得した特許文書に関する指標値および指標値の根拠を出力する命令を含むプロンプトを生成するステップを実行する。生成ステップは、タスク受付ステップにおいて受け付けたタスク情報に応じたタスクの実行結果を示す指標値を出力するための命令を含むプロンプトを生成するステップを実行する。
【0102】
具体的に、サーバ10のリスト処理部1044は、ステップS504において取得したタスクデータに対して、ステップS502において取得したクエリデータ、ステップS504において抽出した抽出箇所を適用することによりプロンプトを生成する。サーバ10のリスト処理部1044は、タスクデータの文字列のうち、「<クエリ>」をクエリデータで、「<抽出文書>」を抽出箇所で置換することにより、以下のプロンプトを生成することができる。
【0103】
〔分類付与タスクの場合のプロンプト〕
以下のように技術分類を定義します。以下の「対象特許」に記載された発明が分類A、B、Cのいずれかに分類してください。対象特許と分類との関連度を0~100の間で算定してください。そのように判断した理由を出力してください。
#技術分類:
分類Aは、情報処理機器に関する分類である。
分類Bは、農機具に関する分類である。
分類Cは、食料品に関する分類である。
#対象特許:
〔要約書〕
・・・
〔特許請求の範囲〕
・・・
【0104】
〔スクリーニングタスクの場合のプロンプト〕
以下の「ターゲット発明」に記載された発明が、以下の「対象特許」に記載された発明に記載されているか否かの検討をしてください。ターゲット発明と対象特許との関連度を0~100の間で算定してください。そのように判断した理由を出力してください。
#ターゲット発明:
・・・手段と、・・・手段と、・・・を備える装置
#対象特許:
〔要約書〕
・・・
〔特許請求の範囲〕
・・・
〔明細書〕
・・・
【0105】
〔該非判定タスクの場合のプロンプト〕
以下の「対象製品」に記載された製品、サービス等が、以下の「対象特許」に記載された発明の権利範囲に含まれるか否かの検討をしてください。対象製品と対象特許との関連度を0~100の間で算定してください。そのように判断した理由を出力してください。
#対象製品:
・・・手段と、・・・手段と、・・・を備える装置
#対象特許:
〔請求項1〕
・・・
【0106】
ステップS505において、生成ステップは、クエリ受付ステップにおいて受け付けたクエリ情報および抽出ステップにおいて抽出した複数の抽出箇所のそれぞれに基づき、文書取得ステップにおいて取得した複数の特許文書のそれぞれに対して複数のプロンプトを生成するステップを実行する。
具体的に、複数の特許文書を入力した場合は、複数の特許文書に含まれるそれぞれの特許文書ごとに抽出された抽出箇所に基づき、プロンプトを生成する生成ステップが実行される。また、生成したプロンプトは文書IDと関連付けて記憶される。
【0107】
ステップS506において、サーバ10のリスト処理部1044は、生成したプロンプトをユーザ端末20へ送信する。ユーザ端末20の制御部204は、受信したプロンプトをユーザ端末20のプロンプト表示欄D304に表示する。
サーバ10のリスト処理部1044は、生成ステップにおいて生成したプロンプトを、人工知能システムへ送信する送信ステップを実行する。
具体的に、ユーザは、ユーザ端末20の入力装置206を操作することにより、送信ボタンD305を押下する。ユーザ端末20の制御部204は、生成したプロンプト(文字列)を人工知能システム40へ送信するリクエストをサーバ10へ送信する。サーバ10のリスト処理部1044は、生成したプロンプト(文字列)を人工知能システム40が提供する人工知能サービスのAPI(Application Programming Interface)エンドポイントへ送信する。
なお、ユーザ端末20の制御部204が、プロンプト表示欄D304に表示されているプロンプト(文字列)を直接、人工知能サービスのAPI(Application Programming Interface)エンドポイントへ送信しても良い。
【0108】
ステップS507において、サーバ10のリスト処理部1044は、人工知能システム40からプロンプトに対する回答内容を受信する回答受信ステップを実行する。サーバ10のリスト処理部1044は、人工知能システム40からプロンプトに対する指標値および根拠を含む回答内容を受信する回答受信ステップを実行する。
具体的に、サーバ10のリスト処理部1044は、送信したプロンプトに対するレスポンスを受信する。レスポンスは、プロンプトに対する回答内容に関する文字列を含む。
例えば、回答内容は以下のような情報を含む。なお、本開示においては一例として以下のような回答内容を説明するが、回答内容は「指標値」および「根拠」に関するフィールド(key)を有するJSON等の構造化されたデータで受信する構成が好適である。例えば、ChatGPTと呼ばれる大規模言語モデル(LLM)では、Function Callingという機能を用いることにより、回答結果を構造化(型付け)されたデータとすることができる。
【0109】
〔分類付与タスクの場合の回答内容〕
#分類:A
#関連度:80
#理由:
対象特許は、構成・・、構成・・・を備えている。一方、対象特許は、構成・・、構成・・・を備えていない。分類Aの分類定義に合致しており、分類B、分類Cの分類定義に合致しない。分類Aとの関連度は80程度である。
【0110】
〔スクリーニングタスクの場合の回答内容〕
#関連度:40
#理由:
ターゲット発明は、対象特許と、・・・の観点で一致しており、・・・の観点で相違する。
相違する部分が大きく、対象特許との関連度は40程度である。
【0111】
〔該非判定タスクの場合の回答内容〕
#関連度:20
#理由:
対象製品は、対象特許と、・・・の観点で一致しており、・・・の観点で相違する。
対象製品は、対象特許の権利範囲には含まれない。対象特許との関連度は20程度である。
【0112】
このとき、指標値(関連度)は、タスク情報が分類付与タスクである場合には、付与した分類に関する精度を示す指標値であり、タスク情報がスクリーニングタスクである場合には、ターゲット発明との関連度を示す指標値であり、タスク情報が該非判定タスクである場合には、対象製品との関連度を示す指標値となる。
【0113】
サーバ10のリスト処理部1044は、ステップS503において受け付けた文書ID、ステップS505において生成したプロンプト、回答内容を、支援テーブル1015の新たなレコードの文書ID、プロンプト、回答内容の項目に記憶する。
【0114】
ステップS508において、サーバ10のリスト処理部1044は、回答受信ステップにおいて受信した指標値および根拠をユーザに提示する回答提示ステップを実行する。
具体的に、サーバ10のリスト処理部1044は、受信した回答内容をユーザ端末20へ送信する。ユーザ端末20の制御部204は、受信した回答内容を回答結果D306に表示する。なお、ユーザは、ユーザ端末20の入力装置206を操作することにより、回答結果にかかる情報をWord、Excel、CSVファイル等のファイル形式でダウンロード可能な構成としても良い。
サーバ10のリスト処理部1044は、指標値および根拠に加えて、特許文書の抽出箇所をユーザに提示しても良い。これにより、ユーザは特許文書のどの箇所に基づき指標値がどのような根拠で算定されたのか確認することができる。
【0115】
複数の特許文書を入力した場合は、サーバ10のリスト処理部1044は、複数の特許文書のそれぞれに対して生成されたプロンプトに応じた回答内容を、ユーザ端末20へ送信する。ユーザ端末20の制御部204は、受信した複数の回答内容を回答結果D306に表示し提示しても良い。具体的に、複数の特許文書の文書ID、公報番号、文書名等の文書を特定する情報と、それぞれの文書ごとに生成されたプロンプト、当該プロンプトに応じて人工知能システム40から受信した回答内容を関連付けて、それぞれ提示しても良い。また、指標値および根拠に加えて、特許文書の抽出箇所をユーザに提示しても良い。
また、ユーザは、ユーザ端末20の入力装置206を操作することにより、複数の特許文書の文書ID、公報番号、文書名等の文書を特定する情報と、それぞれの文書ごとに生成されたプロンプト、当該プロンプトに応じて人工知能システム40から受信した回答内容が記憶されたWord、Excel、CSVファイル等のファイルをダウンロード可能な構成としても良い。
【0116】
<コンピュータの基本ハードウェア構成>
図15は、コンピュータ90の基本的なハードウェア構成を示すブロック図である。コンピュータ90は、プロセッサ901、主記憶装置902、補助記憶装置903、通信IF991(インタフェース、Interface)を少なくとも備える。これらは通信バス921により相互に電気的に接続される。
【0117】
プロセッサ901とは、プログラムに記述された命令セットを実行するためのハードウェアである。プロセッサ901は、演算装置、レジスタ、周辺回路等から構成される。
【0118】
主記憶装置902とは、プログラム、及びプログラム等で処理されるデータ等を一時的に記憶するためのものである。例えば、DRAM(Dynamic Random Access Memory)等の揮発性のメモリである。
【0119】
補助記憶装置903とは、データ及びプログラムを保存するための記憶装置である。例えば、フラッシュメモリ、HDD(Hard Disc Drive)、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等である。
【0120】
通信IF991とは、有線又は無線の通信規格を用いて、他のコンピュータとネットワークを介して通信するための信号を入出力するためのインタフェースである。
ネットワークは、インターネット、LAN、無線基地局等によって構築される各種移動通信システム等で構成される。例えば、ネットワークには、3G、4G、5G移動通信システム、LTE(Long Term Evolution)、所定のアクセスポイントによってインターネットに接続可能な無線ネットワーク(例えばWi-Fi(登録商標))等が含まれる。無線で接続する場合、通信プロトコルとして例えば、Z-Wave(登録商標)、ZigBee(登録商標)、Bluetooth(登録商標)等が含まれる。有線で接続する場合は、ネットワークには、USB(Universal Serial Bus)ケーブル等により直接接続するものも含む。
【0121】
なお、各ハードウェア構成の全部または一部を複数のコンピュータ90に分散して設け、ネットワークを介して相互に接続することによりコンピュータ90を仮想的に実現することができる。このように、コンピュータ90は、単一の筐体、ケースに収納されたコンピュータ90だけでなく、仮想化されたコンピュータシステムも含む概念である。
【0122】
<コンピュータ90の基本機能構成>
コンピュータ90の基本ハードウェア構成(
図15)により実現されるコンピュータの機能構成を説明する。コンピュータは、制御部、記憶部、通信部の機能ユニットを少なくとも備える。
【0123】
なお、コンピュータ90が備える機能ユニットは、それぞれの機能ユニットの全部または一部を、ネットワークで相互に接続された複数のコンピュータ90に分散して設けても実現することができる。コンピュータ90は、単一のコンピュータ90だけでなく、仮想化されたコンピュータシステムも含む概念である。
【0124】
制御部は、プロセッサ901が補助記憶装置903に記憶された各種プログラムを読み出して主記憶装置902に展開し、当該プログラムに従って処理を実行することにより実現される。制御部は、プログラムの種類に応じて様々な情報処理を行う機能ユニットを実現することができる。これにより、コンピュータは情報処理を行う情報処理装置として実現される。
【0125】
記憶部は、主記憶装置902、補助記憶装置903により実現される。記憶部は、データ、各種プログラム、各種データベースを記憶する。また、プロセッサ901は、プログラムに従って記憶部に対応する記憶領域を主記憶装置902または補助記憶装置903に確保することができる。また、制御部は、各種プログラムに従ってプロセッサ901に、記憶部に記憶されたデータの追加、更新、削除処理を実行させることができる。
【0126】
データベースは、リレーショナルデータベースを指し、行と列によって構造的に規定された表形式のテーブル、マスタと呼ばれるデータ集合を、互いに関連づけて管理するためのものである。データベースでは、表をテーブル、マスタ、表の列をカラム、表の行をレコードと呼ぶ。リレーショナルデータベースでは、テーブル、マスタ同士の関係を設定し、関連づけることができる。
通常、各テーブル、各マスタにはレコードを一意に特定するための主キーとなるカラムが設定されるが、カラムへの主キーの設定は必須ではない。制御部は、各種プログラムに従ってプロセッサ901に、記憶部に記憶された特定のテーブル、マスタにレコードを追加、削除、更新を実行させることができる。
また、記憶部に、データ、各種プログラム、各種データベースを記憶させることにより、本開示にかかる情報処理装置、情報処理システムが製造されたものとして捉えることができる。
【0127】
なお、本開示におけるデータベース、マスタは、情報が構造的に規定された任意のデータ構造体(リスト、辞書、連想配列、オブジェクトなど)を含み得る。データ構造体には、データと、任意のプログラミング言語により記述された関数、クラス、メソッドなどを組み合わせることにより、データ構造体と見なし得るデータも含むものとする。
【0128】
通信部は、通信IF991により実現される。通信部は、ネットワークを介して他のコンピュータ90と通信を行う機能を実現する。通信部は、他のコンピュータ90から送信された情報を受信し、制御部へ入力することができる。制御部は、各種プログラムに従ってプロセッサ901に、受信した情報に対する情報処理を実行させることができる。また、通信部は、制御部から出力された情報を他のコンピュータ90へ送信することができる。
【0129】
<付記>
以上の各実施形態で説明した事項を以下に付記する。
【0130】
(付記1)
プロセッサと、記憶部とを備えるコンピュータに実行させるためのプログラムであって、プロセッサが、特許文書に対して実行されるタスクに関するタスク情報を受け付けるタスク受付ステップ(S501)と、特許文書に対して適用されるクエリ情報を受け付けるクエリ受付ステップ(S502)と、特許に関する特許文書を取得する文書取得ステップ(S503)と、文書取得ステップにおいて取得した特許文書のうち、タスク受付ステップにおいて受け付けたタスクに応じて所定の抽出箇所を抽出する抽出ステップ(S504)と、クエリ受付ステップにおいて受け付けたクエリ情報および抽出ステップにおいて抽出した抽出箇所を含むプロンプトを生成する生成ステップ(S505)と、を実行するプログラム。
これにより、ユーザは特許文書に対して適用されるタスクに応じて好適なプロンプトを容易に生成することができる。
【0131】
(付記2)
タスク受付ステップ(S501)は、特許文書に分類を付与する分類付与タスクと、特許文書とターゲット文書との関連性を判定するスクリーニングタスクと、特許文書と対象製品との関連性を判定する該非判定タスクと、のうち少なくともいずれか1つのタスクを示すタスク情報を受け付けるステップであり、抽出ステップ(S504)は、タスク情報が分類付与タスクである場合には、特許文書のうち、要約書、特許請求の範囲、付記1、および、明細書のうち少なくともいずれか1つ、タスク情報がスクリーニングタスクである場合には、特許文書のうち、要約書、特許請求の範囲、付記1、および、明細書のうち少なくともいずれか1つ、タスク情報が該非判定タスクである場合には、特許文書のうち、付記1、および、特許請求の範囲のうち少なくともいずか1つ、のタスク受付ステップにおいて受け付けたタスク情報に応じた異なる所定の抽出箇所を抽出可能なステップである、付記1記載のプログラム。
これにより、ユーザは特許文書に対して適用する、分類付与、スクリーニング、該非判定タスクのうち、希望するタスクに応じて好適なプロンプトを容易に生成することができる。
【0132】
(付記3)
生成ステップ(S505)は、文書取得ステップにおいて取得した特許文書に関する指標値および当該指標値の根拠を出力する命令を含むプロンプトを生成するステップである、付記1記載のプログラム。
これにより、ユーザは特許文書に対してタスクを実行することができるとともに、指標値および指標値の根拠を得るためのプロンプトを生成することができる。
【0133】
(付記4)
生成ステップ(S505)は、タスク受付ステップにおいて受け付けたタスク情報に応じたタスクの実行結果を示す指標値を出力するための命令を含むプロンプトを生成するステップであり、指標値は、タスク情報が分類付与タスクである場合には、付与した分類に関する精度を示す指標値であり、タスク情報がスクリーニングタスクである場合には、ターゲット発明との関連度を示す指標値であり、タスク情報が該非判定タスクである場合には、対象製品との関連度を示す指標値である、付記3記載のプログラム。
これにより、ユーザは特許文書に対し分類付与、スクリーニング、該非判定などのタスクを実行した際に、実行結果を示す指標値を出力するためのプロンプトを生成することができる。
【0134】
(付記5)
プロセッサが、生成ステップにおいて生成したプロンプトを、人工知能システムへ送信する送信ステップ(S506)と、人工知能システムからプロンプトに対する指標値および根拠を含む回答内容を受信する回答受信ステップ(S507)と、回答受信ステップにおいて受信した指標値および根拠をユーザに提示する回答提示ステップ(S508)と、を実行する、付記3記載のプログラム。
これにより、ユーザは特許文書に対してタスクを実行することができるとともに、タスクを実行した際のタスクの実行結果を示す指標値および当該指標値の根拠を含む回答内容を確認することができる。
【0135】
(付記6)
生成ステップ(S505)は、タスク受付ステップにおいて受け付けたタスク情報に応じてプロンプトを生成するステップである、付記1記載のプログラム。
これにより、ユーザは特許文書に対して適用されるタスクに応じて好適なプロンプトを容易に生成することができる。
【0136】
(付記7)
文書取得ステップ(S503)は、複数の特許に関する特許文書を取得するステップであり、抽出ステップ(S504)は、タスク受付ステップにおいて受け付けたタスクに応じて、文書取得ステップにおいて取得した複数の特許文書のそれぞれについて複数の所定の抽出箇所を抽出する抽出ステップであり、生成ステップ(S505)は、クエリ受付ステップにおいて受け付けたクエリ情報および抽出ステップにおいて抽出した複数の抽出箇所のそれぞれに基づき、文書取得ステップにおいて取得した複数の特許文書のそれぞれに対して複数のプロンプトを生成するステップである、付記1記載のプログラム。
これにより、ユーザは複数の特許文書に対して、所定のタスク、所定のクエリを適用するためのプロンプトをまとめて作成することができる。プロンプト作成工数を低減することができる。
【0137】
(付記8)
プロセッサが、複数のタスク情報を選択可能にユーザに提示するタスク提示ステップ(S501)と、を実行し、タスク受付ステップ(S501)は、ユーザから、タスク提示ステップにおいて提示された複数のタスク情報のうち所定のタスク情報の入力操作を受け付けるステップである、付記1記載のプログラム。
これにより、ユーザは提示された複数のタスク情報のうち、実行する所望のタスク情報を選択することにより、タスクに応じた好適なプロンプトを容易に作成することができる。
【0138】
(付記9)
プロセッサが、生成ステップにおいて生成したプロンプトを、人工知能システムへ送信する送信ステップ(S506)と、人工知能システムからプロンプトに対する回答内容を受信する回答受信ステップ(S507)と、を実行する、付記1記載のプログラム。
これにより、ユーザは特許文書に対して適用されるタスクに応じて好適なプロンプトに対する回答内容を得ることができる。
【0139】
(付記10)
プロセッサが、タスク受付ステップにおいて受け付けたタスクに応じて、複数の抽出項目を選択可能にユーザに提示する抽出提示ステップと、抽出提示ステップにおいて提示した複数の抽出項目に対して、ユーザから所定の1または複数の抽出項目に対する選択操作を受け付ける項目選択ステップと、を実行し、抽出ステップは、項目選択ステップにおいて選択された所定の1または複数の抽出項目に基づき、特許文書のうち所定の抽出箇所を抽出するステップである、付記1記載のプログラム。
これにより、ユーザは特許文書に対して適用されるタスクに応じた抽出箇所を編集することができる。ユーザが実行したいタスクの内容に応じて好適な抽出箇所に応じたプロンプトを作成することができる。
【0140】
(付記11)
プロセッサと、メモリとを備えるコンピュータに実行される方法であって、プロセッサが、付記1から付記10のいずれかに係る発明において実行される全てのステップを実行する方法。
これにより、ユーザは特許文書に対して適用されるタスクに応じて好適なプロンプトを容易に生成することができる。
【0141】
(付記12)
制御部と、記憶部とを備える情報処理装置であって、制御部が、付記1から付記10のいずれかに係る発明において実行される全てのステップを実行する情報処理装置。
これにより、ユーザは特許文書に対して適用されるタスクに応じて好適なプロンプトを容易に生成することができる。
【0142】
(付記13)
付記1から付記10のいずれかに係る発明において実行される全てのステップを実行する手段を備えるシステム。
これにより、ユーザは特許文書に対して適用されるタスクに応じて好適なプロンプトを容易に生成することができる。
【符号の説明】
【0143】
1 システム、10 サーバ、101 記憶部、104 制御部、106 入力装置、108 出力装置、20 ユーザ端末、201 記憶部、204 制御部、206 入力装置、208 出力装置、40 人工知能システム、401 記憶部、404 制御部、406 入力装置、408 出力装置
【要約】
【課題】特許文書に対して適用する好適なプロンプトを容易に生成できていないという課題がある。
【解決手段】プロセッサと、記憶部とを備えるコンピュータに実行させるためのプログラムであって、プロセッサが、特許文書に対して実行されるタスクに関するタスク情報を受け付けるタスク受付ステップと、特許文書に対して適用されるクエリ情報を受け付けるクエリ受付ステップと、特許に関する特許文書を取得する文書取得ステップと、文書取得ステップにおいて取得した特許文書のうち、タスク受付ステップにおいて受け付けたタスクに応じて所定の抽出箇所を抽出する抽出ステップと、クエリ受付ステップにおいて受け付けたクエリ情報および抽出ステップにおいて抽出した抽出箇所を含むプロンプトを生成する生成ステップと、を実行するプログラム。
【選択図】
図14