特許7628204 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 新日鉄住金ソリューションズ株式会社の特許一覧

特許7628204情報処理装置、情報処理方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16A
16B
17A
17B
18
19
20
21
22
23
24
25
26A
26B
26C
26D

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2025-01-30

(45)【発行日】2025-02-07

(54)【発明の名称】情報処理装置、情報処理方法、及びプログラム

(51)【国際特許分類】

G06F 40/253 20200101AFI20250131BHJP

G06F 16/30 20190101ALI20250131BHJP

G06Q 10/10 20230101ALI20250131BHJP

【ＦＩ】

G06F40/253

G06F16/30

G06Q10/10

【請求項の数】 10

(21)【出願番号】P 2024056207

(22)【出願日】2024-03-29

【審査請求日】2024-10-18

【早期審査対象出願】

(73)【特許権者】

【識別番号】000191076

【氏名又は名称】日鉄ソリューションズ株式会社

(74)【代理人】

【識別番号】100117857

【弁理士】

【氏名又は名称】南林薫

(72)【発明者】

【氏名】樫村孝

【審査官】齊藤貴孝

(56)【参考文献】

【文献】特開２０２１－０４３９５５（ＪＰ，Ａ）

【文献】特開２０２３－０８２３３０（ＪＰ，Ａ）

【文献】特開２０１８－０１０３４９（ＪＰ，Ａ）

【文献】特開２０１１－１４１７６６（ＪＰ，Ａ）

【文献】中国特許出願公開第１１４２４０１６０（ＣＮ，Ａ）

【文献】米国特許出願公開第２０２３／０３９４２３５（ＵＳ，Ａ１）

【文献】天野富夫、外１名，モデルとパターンに基づく静的テスト仕様記述の自動生成，ＰＲＯＶＩＳＩＯＮ，日本，日本アイ・ビー・エム株式会社，2010年11月01日，第６７号，ｐ．９４－１００

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ４０／００－４０／５８

Ｇ０６Ｑ１０／００－９９／００

Ｇ０６Ｆ１６／００－１６／９５８

(57)【特許請求の範囲】

【請求項1】

第１文書及び第２文書を取得する取得手段と、
前記第１文書から確認する内容を抽出して前記内容毎のタスクを生成する解析手段と、
前記第１文書の特徴を示す属性情報を抽出する情報抽出手段と、
前記属性情報に基づいて、１又は複数の前記第２文書の内から候補文書を選択する選択手段と、
前記タスクで確認する内容に関する条件を前記候補文書から検索する検索手段と、
前記解析手段により生成された前記タスクを学習済モデルに順次入力し、入力された前記タスクで確認する内容が前記候補文書から検索された前記条件に適合するか否かを前記学習済モデルに回答させる処理手段と、
前記処理手段による処理結果を出力する出力手段とを有することを特徴とする情報処理装置。

【請求項2】

前記選択手段は、前記属性情報が示す前記第１文書の特徴と前記第２文書の特徴との類似度に基づいて、１又は複数の前記第２文書の内から前記候補文書を選択することを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記選択手段は、前記第２文書の特徴を示す情報を抽出して構築された前記第２文書に関するルールインデックスに対する前記属性情報に基づく検索結果から前記第１文書の特徴と前記第２文書の特徴との類似度を取得することを特徴とする請求項２に記載の情報処理装置。

【請求項4】

前記情報抽出手段は、前記第１文書と、前記第１文書の特徴を示す情報を抽出する指示を含むプロンプトを学習済モデルに入力することで前記属性情報を抽出することを特徴とする請求項１に記載の情報処理装置。

【請求項5】

前記処理手段に入力された前記タスクに複数の前記内容が含まれる場合、該タスクを複数のタスクにさらに分割することを特徴とする請求項１に記載の情報処理装置。

【請求項6】

前記学習済モデルは、大規模言語モデルであることを特徴とする請求項１に記載の情報処理装置。

【請求項7】

前記学習済モデルは、大規模マルチモーダルモデルであることを特徴とする請求項１に記載の情報処理装置。

【請求項8】

前記解析手段は、前記第１文書を学習済モデルに入力することで前記内容毎のタスクを生成し、
前記検索手段は、前記タスクで確認する内容を学習済モデルに入力することで前記タスクで確認する内容に関する条件を検索することを特徴とする請求項１に記載の情報処理装置。

【請求項9】

情報処理装置が実行する情報処理方法であって、
第１文書及び第２文書を取得する取得工程と、
前記第１文書から確認する内容を抽出して前記内容毎のタスクを生成する解析工程と、
前記第１文書の特徴を示す属性情報を抽出する情報抽出工程と、
前記属性情報に基づいて、１又は複数の前記第２文書の内から候補文書を選択する選択工程と、
前記タスクで確認する内容に関する条件を前記候補文書から検索する検索工程と、
前記解析工程にて生成された前記タスクを学習済モデルに順次入力し、入力された前記タスクで確認する内容が前記候補文書から検索された前記条件に適合するか否かを前記学習済モデルに回答させる処理工程と、
前記処理工程での処理結果を出力する出力工程とを有することを特徴とする情報処理方法。

【請求項10】

情報処理装置のコンピュータに、
第１文書及び第２文書を取得する取得ステップと、
前記第１文書から確認する内容を抽出して前記内容毎のタスクを生成する解析ステップと、
前記第１文書の特徴を示す属性情報を抽出する情報抽出ステップと、
前記属性情報に基づいて、１又は複数の前記第２文書の内から候補文書を選択する選択ステップと、
前記タスクで確認する内容に関する条件を前記候補文書から検索する検索ステップと、
前記解析ステップにて生成された前記タスクを学習済モデルに順次入力し、入力された前記タスクで確認する内容が前記候補文書から検索された前記条件に適合するか否かを前記学習済モデルに回答させる処理ステップと、
前記処理ステップでの処理結果を出力する出力ステップとを実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法、及びプログラムに関する。

【背景技術】

【0002】

従来、ドキュメント同士の比較は人が目視等で行っていたが、近年では大量の電子文書が取り扱われるようになり、コンピュータを利用して作業を効率的に行われるようになった。しかし、大量の文書を人が確認する場合、ヒューマンエラーが発生しやすく、また、コンピュータを利用した電子文書の比較では、統一されたフォーマットの文書同士であれば比較することは容易であるが、フォーマットが統一されていない文書を比較することは容易ではない。例えば、フォーマットが必ずしも統一されていない仕様書等の内容が規格等に準拠しているか否かの確認作業などに利用するのには適していなかった。

【0003】

特許文献１には、規格基準の各基準内容に対して、組織内規程の複数の規定内容のそれぞれについて意味的な同一性を演算して同一性のスコアを算出し、最も同一性のスコアが高い規定内容を紐づけ、各基準内容とそれに紐づく規定内容との同一性のスコアを用いて平均化して規格基準と組織内規程との合致性のスコアを算出し、各基準内容と基準内容に紐づく規定内容と合致性のスコアをユーザに表示する技術が提案されている。

【0004】

特許文献２には、複数のデータタイプを含むクエリドキュメントを異なるデータタイプの要素へと分解し、分解したデータタイプの要素についてそのデータタイプの類似性探索を行い、クエリドキュメントに類似するドキュメントを見つける技術が提案されている。

【先行技術文献】

【特許文献】

【0005】

【文献】特開２０２０－８６７３７号公報

【文献】特表２００２－５３７６０４号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

フォーマットを限定されることなく、対象の文書の内容が、求められる条件に適合しているか否かの判定をコンピュータ等の情報処理装置を利用して行うことが可能な仕組みが望まれている。本発明は、対象の文書の内容が、求められる条件に適合しているか否かの確認作業を効率化することが可能な情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0007】

本発明に係る情報処理装置は、第１文書及び第２文書を取得する取得手段と、前記第１文書から確認する内容を抽出して前記内容毎のタスクを生成する解析手段と、前記第１文書の特徴を示す属性情報を抽出する情報抽出手段と、前記属性情報に基づいて、１又は複数の前記第２文書の内から候補文書を選択する選択手段と、前記タスクで確認する内容に関する条件を前記候補文書から検索する検索手段と、前記解析手段により生成された前記タスクを学習済モデルに順次入力し、入力された前記タスクで確認する内容が前記候補文書から検索された前記条件に適合するか否かを前記学習済モデルに回答させる処理手段と、前記処理手段による処理結果を出力する出力手段とを有することを特徴とする。

【発明の効果】

【0008】

本発明によれば、対象の文書の内容が、求められる条件に適合しているか否かの確認作業を効率化することが可能な情報処理装置、情報処理方法、及びプログラムを提供することができる。

【図面の簡単な説明】

【0009】

【図1】情報処理装置のハードウェア構成の例を示す図である。

【図2】第１の実施形態における情報処理装置の機能構成の例を示す図である。

【図3】第１の実施形態における情報処理装置の処理例を説明する図である。

【図4】仕様書の分割の例を説明する図である。

【図5】タスク分解の例を説明する図である。

【図6】タスク分解でのプロンプトの例を説明する図である。

【図7】タスク分解の例を説明する図である。

【図8】タスク分解でのプロンプトの例を説明する図である。

【図9】前提情報抽出でのプロンプトの例を説明する図である。

【図10】規格文書ＤＢの例を説明する図である。

【図11】検索ツールによる検索の例を説明する図である。

【図12】突合処理の例を説明する図である。

【図13】突合処理の例を説明する図である。

【図14】突合処理の例を説明する図である。

【図15】突合処理の例を説明する図である。

【図16A】突合処理の例を説明する図である。

【図16B】突合処理の例を説明する図である。

【図17A】突合処理の例を説明する図である。

【図17B】突合処理の例を説明する図である。

【図18】突合処理の例を説明する図である。

【図19】突合処理の例を説明する図である。

【図20】処理結果の出力例を示す図である。

【図21】第２の実施形態における情報処理装置の機能構成の例を示す図である。

【図22】第２の実施形態における情報処理装置の処理例を説明する図である。

【図23】属性情報抽出の例を説明する図である。

【図24】ルールインデックス構築の例を説明する図である。

【図25】第２の実施形態における処理を説明する図である。

【図26A】突合処理に関するサンプルの例を説明する図である。

【図26B】突合処理に関するサンプルの例を説明する図である。

【図26C】突合処理に関するサンプルの例を説明する図である。

【図26D】突合処理に関するサンプルの例を説明する図である。

【発明を実施するための形態】

【0010】

以下、本発明の実施形態を図面に基づいて説明する。なお、以下の説明では、「文書」と称した場合、デジタルデータで構成された電子文書（デジタル文書）も含まれるものとする。

【0011】

＜第１の実施形態＞
図１は、本発明の一実施形態における情報処理装置１００のハードウェア構成の一例を示す図である。情報処理装置１００は、ＣＰＵ１０１、ＲＯＭ１０２、ＲＡＭ１０３、補助記憶装置１０４、出力装置１０５、入力装置１０６、及びネットワークＩ／Ｆ１０７を有する。ＣＰＵ１０１、ＲＯＭ１０２、ＲＡＭ１０３、補助記憶装置１０４、出力装置１０５、入力装置１０６、及びネットワークＩ／Ｆ１０７は、システムバス１０８を介して通信可能に接続されている。

【0012】

ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０１は、情報処理装置１００の各種動作を制御する中央演算装置である。例えば、ＣＰＵ１０１は、情報処理装置１００全体の動作を制御してもよい。ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１０２は、ＣＰＵ１０１で実行可能な制御プログラムやブートプログラム等を記憶する。ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１０３は、ＣＰＵ１０１の主記憶メモリであり、ワークエリア又は各種プログラムを展開するための一時記憶領域として用いられる。

【0013】

補助記憶装置１０４は、各種データや各種プログラム等を記憶する。補助記憶装置１０４は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）や、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）に代表される不揮発性メモリ等のような、各種データを一時的又は持続的に記憶可能な記憶デバイスにより実現される。

【0014】

出力装置１０５は、各種情報を出力する装置であり、ユーザに対する各種情報の提示に利用される。例えば、出力装置１０５は、ディスプレイ等の表示デバイスにより実現される。出力装置１０５は、各種表示情報を表示させることで、ユーザに対して情報を提示する。他の例として、出力装置１０５は、音声や電子音等の音を出力する音響出力デバイスにより実現されてもよい。この場合には、出力装置１０５は、音声や電子音等の音を出力することで、ユーザに対して情報を提示する。また、出力装置１０５として適用されるデバイスは、ユーザに対して情報を提示するために利用する媒体に応じて適宜変更されてもよい。

【0015】

入力装置１０６は、ユーザからの各種指示の受け付けに利用される。例えば、入力装置１０６は、マウス、キーボード、タッチパネル等の入力デバイスを含む。他の例として、入力装置１０６は、マイクロフォン等の集音デバイスを含み、ユーザが発話した音声を集音してもよい。この場合には、集音された音声に対して音響解析や自然言語処理等の各種解析処理が施されることで、この音声が示す内容がユーザからの指示として認識される。また、入力装置１０６として適用されるデバイスは、ユーザからの指示を認識する方法に応じて適宜変更されてもよい。また、入力装置１０６として複数種類のデバイスが適用されてもよい。

【0016】

ネットワークＩ／Ｆ１０７は、外部の装置等とのネットワークを介した通信に利用される。なお、ネットワークＩ／Ｆ１０７として適用されるデバイスは、通信経路の種別や適用される通信方式に応じて適宜変更されてもよい。

【0017】

ＣＰＵ１０１が、ＲＯＭ１０２又は補助記憶装置１０４に記憶されたプログラムをＲＡＭ１０３に展開し、そのプログラムを実行することで、後述する情報処理装置の各機能及び各処理等が実現される。

【0018】

図２は、第１の実施形態における情報処理装置１００の機能構成の例を示す図である。情報処理装置１００は、取得部２０１、解析部２０２、データベース（ＤＢ）作成部２０３、情報抽出部２０４、適合判定部２０５、出力部２０９、及び記憶部２１０を有する。

【0019】

ここで、本実施形態における情報処理装置１００では、機械学習（ディープラーニング、深層学習）によって生成され、記憶部２１０に記憶されている学習済モデル２１１を用いて機能の一部が実現される。以下では、学習済モデル２１１は、大規模言語モデル（ＬＬＭ：ＬａｒｇｅＬａｎｇｕａｇｅＭｏｄｅｌ）であるとして説明する。大規模言語モデル（ＬＬＭ）は、大量のテキストデータ（大規模コーパス等）とディープラーニング技術を用いて構築された言語モデルであり、指示や命令等を示すプロンプトと呼ばれるテキストデータが入力されると、プロンプトに基づいて推論を行い、入力されたプロンプトに応じたテキストデータを生成して出力する。なお、大規模言語モデル（ＬＬＭ）に限定されるものではなく、学習済モデル２１１として、例えば、テキストデータに対応可能な大規模マルチモーダルモデル（ラージマルチモーダルモデル、ＬＭＭ）を適用してもよい。

【0020】

取得部２０１は、適合性の確認作業に関する文書を取得する。取得部２０１は、求められる条件に適合しているか否かを確認される第１文書（確認対象の文書）、及び第１文書に対応する確認対象の条件を示している第２文書を取得する。取得部２０１は、取得手段の一例である。第１文書の一例としては、例えば、製品又はサービス等に関する仕様書、契約の内容等に関する契約書、提案書等が挙げられる。また、第２文書の一例としては、例えば、基準とするルールが示された規格書や規程書等の文書や、ＲＦＰ（ＲｅｑｕｅｓｔｆｏｒＰｒｏｐｏｓａｌ、提案依頼書）等が挙げられる。なお、前述した第１文書及び第２文書の例は一例であり、これに限定されるものではない。

【0021】

解析部２０２は、取得部２０１により取得された第１文書を解析して、第１文書の内容において、求められる条件に適合しているか否かを確認する内容を抽出し、抽出した内容毎の突合タスク（以下、単に「タスク」とも称す。）を生成する。解析部２０２は、解析手段の一例である。解析部２０２は、第１文書と、確認する必要がある内容を抽出しタスクを出力する指示を含むプロンプトとを学習済モデル２１１に対して入力することで、第１文書の確認作業に関するタスクを生成する。生成された突合タスク（タスク）は、記憶部２１０にタスクデータ２１３として格納される。なお、解析部２０２は、学習済モデル２１１を用いて突合タスク（タスク）を生成するものに限定されるものではない。例えば、解析部２０２は、予めフォーマットが定められている文書（第１文書）からアルゴリズムによる機械的処理等によって、確認する必要がある内容を抽出して突合タスク（タスク）を生成するようにしてもよい。

【0022】

ＤＢ作成部２０３は、取得部２０１により取得された文書に基づいて、文書に関するデータベース（ｒｅｔｒｉｅｖｅｒ）を作成する。ＤＢ作成部２０３により作成されたデータベース（ｒｅｔｒｉｅｖｅｒ）は、記憶部２１０に文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）として記憶される。すなわち、ＤＢ作成部２０３は、取得部２０１により取得された第１文書に基づいて第１文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２１５を作成し、取得部２０１により取得された第２文書に基づいて第２文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２１６を作成する。これら文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２１５、２１６は、学習済モデル２１１を用いて文書の内容に関する適合判定を行う際に用いる検索ツールとしてのＤＢ（ｒｅｔｒｉｅｖｅｒ）である。文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２１５、２１６は、例えば、全文検索エンジンであり、ＢＭ２５による検索が行われる。ＤＢ作成部２０３は、作成手段の一例である。

【0023】

情報抽出部２０４は、取得部２０１により取得された第１文書から所定の情報を抽出する。情報抽出部２０４は、情報抽出手段の一例である。第１の実施形態では、情報抽出部２０４は、取得部２０１により取得された第１文書から前提情報を抽出する。ここで、前提情報は、第１文書を通して共通的な情報であり、例えば、第１文書において参照している基準（ルール）に関する情報等である。情報抽出部２０４は、第１文書と、第１文書を通して共通的な情報を抽出する指示を含むプロンプトとを学習済モデル２１１に対して入力することで、第１文書に関する前提情報を抽出する。抽出された前提情報は、記憶部２１０に前提情報２１４として格納され、学習済モデル２１１を用いた文書の内容に関する適合判定処理において、ヒント情報として学習済モデル２１１に与えられる。

【0024】

適合判定部２０５は、確認対象である第１文書に関する適合判定を行う。適合判定部２０５は、記憶部２１０にタスクデータ２１３として格納された第１文書に関するタスクに基づいて、タスクで確認する第１文書の内容が、求められる条件に適合しているか否かの確認を行う。具体的には、適合判定部２０５は、第１文書に関するタスク及び前提情報をプロンプトとして学習済モデル２１１に入力することで、タスクに示される第１文書の内容が、第２文書で示している条件に適合しているか否かを判定する。また、適合判定部２０５は、適合判定にて検証するタスクが、後述する突合処理部２０６において検証可能な１つのタスクになっておらず、複数のタスク、すなわち複数の内容が含まれて構成されている場合に、そのタスクを検証可能なタスクに分割する。適合判定部２０５は、突合処理部２０６、情報検索部２０７、及びコード実行部２０８を有する。

【0025】

突合処理部２０６は、第１文書と第２文書との突合処理を行い、第１文書の内容が、求められる条件に適合しているか否かを判定する。突合処理部２０６は、処理手段の一例である。突合処理部２０６は、第１文書に関するタスク及び前提情報を含むプロンプトを学習済モデル２１１に入力することで、タスクに示される第１文書の内容が、第２文書で示される条件に適合しているか否かを推論する。また、突合処理部２０６は、第１文書に関するタスク及び前提情報をプロンプトとして学習済モデル２１１に入力することで生成される検索要求や演算処理等を行うためのコード（プログラム）を情報検索部２０７やコード実行部２０８に出力する。

【0026】

情報検索部２０７は、突合処理部２０６からの検索要求に応じて、第１文書及び第２文書を検索して検索結果を突合処理部２０６に出力する。情報検索部２０７は、検索手段の一例である。情報検索部２０７は、突合処理部２０６から入力される検索用クエリを受けて、学習済モデル２１１を用いて第１文書ＤＢ２１５、第２文書ＤＢ２１６に対する検索処理を行い、入力された検索用クエリに応じた検索結果を突合処理部２０６に返す。なお、情報検索部２０７は、学習済モデル２１１を用いて検索処理を行い検索結果を出力するものに限定されるものではない。例えば、情報検索部２０７は、突合処理部２０６から入力される検索用クエリを受けて、第１文書ＤＢ２１５、第２文書ＤＢ２１６に対するルールベースでの検索処理を行い、取得した検索結果を突合処理部２０６に返すようにしてもよい。例えば、後述する図１１に示す検索処理において、検索処理１１０４して得られた検索結果１１０６をそのまま最終検索結果１１０８として出力するようにしてもよい。

【0027】

コード実行部２０８は、コード（プログラム）を実行して実行結果を出力する。コード実行部２０８は、突合処理部２０６から入力されるコード（プログラム）を実行して、実行結果を突合処理部２０６に返す。

【0028】

出力部２０９は、適合判定部２０５による第１文書に関する適合判定の結果、すなわち第１文書に関するタスクとして抽出された第１文書の内容が、求められる条件に適合しているか否かの判定結果を出力する。出力部２０９は、第１文書の内容が、求められる条件に適合しているか否かの判定結果とともに、その判定結果となる理由を合わせて出力するようにしてもよい。

【0029】

記憶部２１０は、情報処理装置１００での処理を行う際に用いられる各種データ等を記憶する。記憶部２１０には、例えば、学習済モデル２１１、設定ファイル２１２、タスクデータ２１３、前提情報２１４、第１文書ＤＢ２１５、及び第２文書ＤＢ２１６が格納されている。学習済モデル２１１は、情報処理装置１００において行われる各種の推論に用いられる、機械学習（ディープラーニング、深層学習）が行われたモデルである。設定ファイル２１２は、学習済モデル２１１に入力するプロンプト等が格納されているファイルである。設定ファイル２１２には、プロンプトとして入力する学習サンプルも格納されていてもよい。学習サンプルは、設定ファイル２１２等に複数準備しておき、実現する機能に応じて選択し学習済モデル２１１に与えるようにしてもよい。タスクデータ２１３は、解析部２０２により生成された確認作業に関するタスクであり、前提情報２１４は、情報抽出部２０４により抽出された前提情報である。第１文書ＤＢ２１５は、ＤＢ作成部２０３により作成された第１文書用のＤＢであり、第２文書ＤＢ２１６は、ＤＢ作成部２０３により作成された第２文書用のＤＢである。

【0030】

図３を参照して、第１の実施形態における情報処理装置１００での処理について説明する。図３は、第１の実施形態における情報処理装置１００の処理例を説明する図である。以下では、一例として、確認対象の文書である第１文書を製品の仕様書３０１、求められる確認対象の条件を示している第２文書を製品の規格に関する規格文書３０２とし、仕様書３０１に記載されている内容が規格文書３０２の規格に適合しているか否かを確認する場合を例に説明する。

【0031】

情報処理装置１００は、第１文書としての仕様書３０１を取得する。また、情報処理装置１００は、第２文書としての規格文書３０２を取得する。

【0032】

（処理３０３、３０５：仕様書の分割及びタスク分解）
取得した仕様書３０１に対して、情報処理装置１００は、仕様書の分割処理３０３を行い、仕様書３０１全体を仕様書の一部となる複数の文書３０４に分割する。仕様書の分割処理３０３では、情報処理装置１００は、アルゴリズムによる機械的処理によって、分割後の各文書が学習済モデル２１１で処理可能なサイズとなるように、仕様書３０１を複数の文書に分割する。例えば、情報処理装置１００は、ＯＣＲ又はＰＤＦパーサ等で読み取った仕様書３０１のテキストデータについて、数字による箇条書き等に基づいて所定のパターンで分割して、仕様書３０１を複数の文書３０４に分割する。図４に示す仕様書の分割の例では、情報処理装置１００は、仕様書４０１を、数字による箇条書きに基づいて項番（項目）毎のテキストデータ４０２～４０５に分割する。仕様書中の表については、例えばＣＳＶ形式のデータに変換される。

【0033】

また、情報処理装置１００は、分割後の複数の文書３０４に対してタスク分解処理３０５を行い、仕様書３０１の内容確認に関する突合タスク（タスク）３０６を生成する。タスク分解処理３０５では、情報処理装置１００は、分割された文書３０４と、規格に適合しているか否かを確認する必要がある内容を抽出しタスクを出力する指示を含むプロンプトとを学習済モデル２１１に対して入力することで、仕様書３０１の内容確認に関するタスク３０６を生成する。

【0034】

図５～図８を参照して、タスク分解処理３０５でのタスク分解の例について説明する。
図５及び図６を参照して、定量的事項について確認するためのタスクを生成する例について説明する。図５（Ａ）は、仕様書３０１での記載を示しており、製品における化学成分として、炭素（Ｃ）、マンガン（Ｍｎ）、ケイ素（Ｓｉ）、リン（Ｐ）の値が製品毎に記載されている。この図５（Ａ）に示した記載についての分割後のデータ３０４が、図５（Ｂ）に示すデータである。情報処理装置１００は、図５（Ｂ）に示すデータと図６に示すプロンプト６００とを学習済モデル２１１に対して入力することで、確認する必要がある内容についてタスクに分解し、図５（Ｃ）に示すようにタスクを生成する。

【0035】

図６に示すように、プロンプト６００は、記載の数値について規格に関連しているために規格との記載の一致を確認する必要がある値を網羅的に出力させ、チェックする事項を可能な限り検証可能な小さいタスクに落とし込むことを指示するプロンプト６０１を含む。また、プロンプト６００は、表形式のデータである場合の学習サンプル６０２や抽出したい情報がない場合の学習サンプル６０３等を含んでもよい。このようなプロンプトを用いることにより、図５（Ｃ）に示すように、抽出する情報（タスク）の粒度を制御して後述する突合処理で検証可能な小さなタスクまで分解し、仕様書３０１に記載の値が規格に適合しているか否かを確認するタスクを生成することが可能となる。また、例示したような学習サンプルをプロンプト６００に含ませることで、学習サンプルに適応した出力を返す精度が高いという大規模言語モデルの特性を利用して、所望の形式でのタスクの出力を得ることが可能となる。

【0036】

次に、図７及び図８を参照して、定性的事項について確認するためのタスク（突合タスク）を生成する例について説明する。図７（Ａ）は、仕様書３０１での記載を示しており、製品に関する品質管理基準、製品識別とトレーサビリティ、表面仕上げについて記載されている。情報処理装置１００は、図７（Ａ）に示す品質管理基準についての分割後のデータと図８に示すプロンプト８００とを学習済モデル２１１に対して入力することで、確認する必要がある内容についてタスクに分解し、図７（Ｂ）に示すようにタスク（突合タスク）を生成する。また、同様に、学習済モデル２１１に対して、図７（Ａ）に示す製品識別とトレーサビリティについての分割後のデータと図８に示すプロンプト８００とを入力することで図７（Ｃ）に示すようにタスク（突合タスク）を生成し、図７（Ａ）に示す表面仕上げについての分割後のデータと図８に示すプロンプト８００とを入力することで図７（Ｄ）に示すようにタスク（突合タスク）を生成する。

【0037】

図８に示すように、プロンプト８００は、規格に関連しているために規格との記載の一致を確認する必要がある内容を出力させ、チェックする事項を可能な限り検証可能な小さいタスクに落とし込むことを指示するプロンプト８０１を含む。また、プロンプト８００は、定性的事項の抽出に関する学習サンプル８０２、８０３や抽出したい情報がない場合の学習サンプル等を含んでもよい。このようなプロンプトを用いることにより、図７（Ｂ）～図７（Ｄ）に示すように、抽出する情報（タスク）の粒度を制御して後述する突合処理で検証可能な小さなタスクまで分解し、仕様書３０１に記載の内容が規格に適合しているか否かを確認するタスクを生成することが可能となる。また、例示したような学習サンプルをプロンプト８００に含ませることで、学習サンプルに適応した出力を返す精度が高いという大規模言語モデルの特性を利用して、所望の形式でのタスクの出力を得ることが可能となる。

【0038】

（処理３０７：前提情報抽出）
取得した仕様書３０１に対して、情報処理装置１００は、前提情報抽出処理３０７を行い、仕様書３０１を通して共通的な情報である前提情報３０８を抽出する。前提情報抽出処理３０７では、情報処理装置１００は、仕様書３０１と、仕様書を通して共通的な情報を抽出する指示を含むプロンプトとを学習済モデル２１１に対して入力することで、仕様書３０１に関する前提情報３０８を生成する。この例では、図９に示すように、仕様書に明記されている規格と製品の種類とを仕様書３０１から抽出することを指示するプロンプト９００を入力することで、仕様書において参照している規格の情報や仕様書に記載されている製品の種類等を前提情報３０８として抽出する。

【0039】

（処理３０９、３１１：ＤＢ作成）
情報処理装置１００は、取得した仕様書３０１に基づいて仕様書のＤＢ作成処理３０９を行い、仕様書ＤＢ（ｒｅｔｒｉｅｖｅｒ）３１０を作成する。また、情報処理装置１００は、取得した規格文書３０２に基づいて規格文書のＤＢ作成処理３１１を行い、規格文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）３１２を作成する。仕様書ＤＢ（ｒｅｔｒｉｅｖｅｒ）３１０は図２に示した第１文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２１５に相当し、規格文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）３１２は図２に示した第２文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２１６に相当する。ＤＢ作成処理３０９、３１１では、情報処理装置１００は、アルゴリズムによる機械的処理によって、仕様書３０１、規格文書３０２をそれぞれ検索可能な形の状態に処理してデータベースを作成する。

【0040】

例えば、情報処理装置１００は、図１０に一例を示すように、規格文書３０２のページ毎に、「ＩｒｏｎＳｔａｎｄａｒｄ２０２３」等のファイル名、「鋼板規格」等の文書名称、「１．はじめに本文書は・・・」等の本文、及び「ｐ１」等のページ番号の情報を含むレコードを作成して規格文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）３１２を構成する。例えば、レコードにページ番号を含ませることで、後述する学習済モデル２１１を用いて検索を行う際に、次のページや前のページ等の異なるページを参照するなどの対応が可能となる。仕様書ＤＢ（ｒｅｔｒｉｅｖｅｒ）３１０も同様に構成すればよい。なお、各レコードが有する情報は、前述した例に限定されるものではなく、他の情報が含まれていてもよい。また、文書のページ毎にレコードを作成するようにしているが、これは一例であり、他の構成単位毎にレコードを作成するようにしてもよい。

【0041】

ここで、規格文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）３１２は、予め作成しておくようにしてもよいし、仕様書３０１の内容が規格に適合しているか否かの確認を行う際に作成するようにしてもよい。例えば、繰り返し利用される規格文書や長期に亘って利用される規格文書等の規格文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）３１２を作成し保持しておくようにすれば、その都度作成する必要がなく、処理を軽減することができる。また、恒常的な保存が許されない規格文書であれば、仕様書３０１の内容が規格に適合しているか否かの確認を行う際に規格文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）３１２を作成することで、情報漏えい等の発生を抑制することができる。

【0042】

（処理３２０：適合判定）
タスク分解処理３０５で生成されたタスクに対して、情報処理装置１００は、学習済モデル２１１を用いてタスク毎に適合判定処理３２０を行い、仕様書３０１に記載の内容が規格文書３０２の規格に適合しているか否かを判定する。タスクリスト３２１には、タスク分解処理３０５によって生成されたタスク３０６がキュー形式で記憶されている。適合判定処理３２０では、タスクリスト３２１から１つずつ順に取り出されるタスク３２２に対して、情報処理装置１００が学習済モデル２１１を用いて突合処理３２３を行い、処理結果３４０を出力する。タスクリスト３２１のタスクがなくなるまで突合処理３２３が行われる。

【0043】

突合処理３２３では、学習済モデル２１１に文書の内容を突合する際の人間のワークフローをシミュレーションさせ、ツールを用いて突合に必要な情報の収集等を行い、収集した情報等に基づいて意味的な推論を行って処理結果を得る。また、推論を行うにあたり、少数又は多数の特定ドメインのワークフローのサンプルを学習済モデル２１１に学習（Ｆｅｗ－ｓｈｏｔ学習等）させ、ワークフローのドメインに適合させる。

【0044】

本実施形態における突合処理３２３は、ＲｅＡｃｔ（ＲｅａｓｏｎｉｎｇａｎｄＡｃｔｉｎｇ）と呼ばれるフレームワークに倣って処理を行い、処理結果を出力する。すなわち、突合処理３２３では、ＲｅＡｃｔフレームワークに倣って、Ｑｕｅｓｔｉｏｎ（質問）に対し、Ｔｈｏｕｇｈｔ（思考）、Ａｃｔｉｏｎ（行動）、Ｏｂｓｅｒｖａｔｉｏｎ（観察）のフェーズ毎にテキストを生成して、このＴｈｏｕｇｈｔ→Ａｃｔｉｏｎ→Ｏｂｓｅｒｖａｔｉｏｎの流れを１回又は複数回経て、ＦｉｎａｌＡｎｓｗｅｒ（最終の回答）を導出する。

【0045】

この例では、タスク３２２がＱｕｅｓｔｉｏｎに相当する。Ｔｈｏｕｇｈｔでは学習済モデル２１１により目的を達成するための現プロセスからの計画を思考し、Ａｃｔｉｏｎでは学習済モデル２１１により計画を実行するためのツールの選択を行う。そして、ツールを実行するための入力を行った上で実行したツールの実行結果をＯｂｓｅｒｖａｔｉｏｎで観察する。このＯｂｓｅｒｖａｔｉｏｎで得られたツールの実行結果に基づいてＴｈｏｕｇｈｔで計画を思考し、計画があればＡｃｔｉｏｎに進み、結論が出ていればＦｉｎａｌＡｎｓｗｅｒを生成する。

【0046】

本実施形態では、突合処理３２３において学習済モデル２１１が利用するツールとして、タスク分割ツール３２４、仕様書検索ツール３２６、規格検索ツール３２９、及びコード実行ツール３３２がある。タスク分割ツール３２４は適合判定部２０５により実現され、仕様書検索ツール３２６及び規格検索ツール３２９は情報検索部２０７により実現され、コード実行ツール３３２はコード実行部２０８により実現される。

【0047】

タスク分割ツール３２４は、突合処理３２３によって分割されたタスク３２５を、タスクリスト３２１に追加する機能を有する。後述するように、タスクリスト３２１から取り出されて突合処理３２３に入力されたタスク３２２が、検証可能な１つのタスクになっておらず、複数のタスク、すなわち複数の内容が含まれて構成されている場合、突合処理３２３では、そのタスク３２２を検証可能なタスク３２５に分割する。この複数に分割されたタスクを、タスク分割ツール３２４がタスクリスト３２１に追加する。

【0048】

仕様書検索ツール３２６は、タスク３２２の検証に必要な詳細情報等を仕様書３０１から検索する機能を有する。仕様書検索ツール３２６は、仕様書の検索用クエリ３２７を受け付けて仕様書ＤＢ（Ｒｅｔｒｉｅｖｅｒ）３１０を検索し、検索して得られた情報を仕様書情報３２８として返す。また、仕様書検索ツール３２６は、仕様書ＤＢ（Ｒｅｔｒｉｅｖｅｒ）３１０の検索結果から関連する部分を抽出して要約する機能や、その抽出内容の説明を付加する機能を有する。この検索結果の要約機能により、例えば、検索結果を学習済モデル２１１にプロンプトとして与えられるように文字数を削減することが可能となる。

【0049】

規格検索ツール３２９は、仕様書３０１に記載された内容に対応する規格の詳細を規格文書３０２から検索する機能を有する。規格文書検索ツール３２９は、規格文書の検索用クエリ３３０を受け付けて規格文書ＤＢ（Ｒｅｔｒｉｅｖｅｒ）３１２を検索し、検索して得られた情報を規格情報３３１として返す。また、規格文書検索ツール３２９は、規格文書ＤＢ（Ｒｅｔｒｉｅｖｅｒ）３１２の検索結果から関連する部分を抽出して要約する機能や、その抽出内容の説明を付加する機能を有する。この検索結果の要約機能により、例えば、検索結果を学習済モデル２１１にプロンプトとして与えられるように文字数を削減することが可能となる。

【0050】

コード実行ツール３３２は、数値比較等の演算（単位変換や四則演算等も含む）を行うための、学習済モデル２１１が生成したコード（プログラム）を実行する機能を有する。コード実行ツール３３２は、学習済モデル２１１が生成したコード（プログラム）３３３を受け付けて、そのコード（プログラム）を実行して実行結果３３４を返す。

【0051】

ここで、検索ツール３２６、３２９による検索について説明する。以下では、規格検索ツール３２９による検索を例に説明するが、仕様書検索ツール３２６による検索も同様である。図１１は、規格書検索ツール３２９による検索の例を説明する図である。

【0052】

規格書の検索を行う際、情報処理装置１００は、確認するタスク及び前提情報に基づいて、検索の意図１１０１及び検索クエリ１１０３を生成する。図１１に示した例では、情報処理装置１００は、「ＩＳ３６０Ｂ－ＳＳＢの疲労強度を知りたい」という検索の意図１１０１、及び“ＩｒｏｎＳｔａｎｄａｒｄ２０２３”、“鋼板”、“ＩＳ３６０Ｂ－ＳＳＢ”、“疲労強度”を含む検索クエリ１１０３を生成する。

【0053】

次に、情報処理装置１００は、生成された検索クエリ１１０３を用いて検索処理１１０４を実行する。検索処理１１０４では、検索クエリ１１０３を用いて規格文書データ１１０５に対するルールベースでの検索処理が行われ、検索クエリ１１０３に応じた検索結果１１０６が出力される。

【0054】

ここで、後述する突合処理において、検索ツール３２６、３２９による検索結果はプロンプトに追加されて学習済モデル２１１による推論に用いられる。例えば、複数行にわたる表のうち、特定の行の情報が必要である場合、説明なし、かつ、該当部分の抽出のみである場合、ヘッダの情報等が失われ、単語を羅列した情報のみが抽出されることになる。このような情報のみを検索結果として学習済モデル２１１に入力しても、学習済モデル２１１では解釈が困難であるため、突合処理に関する誤った推論や計画を立ててしまうことがあり、また計画性にも欠ける推論となってしまう。これは通常の文章のみの文書からの情報抽出では起こりにくいが、仕様書や規格文書等のレイアウト付き文書からの情報抽出では図表等が多々利用されているために発生しうる。

【0055】

そこで、本実施形態では、情報処理装置１００は、検索処理１１０４により得られた検索結果１１０６に対して、検索の意図１１０１に基づいて検索結果の要約等を行う検索結果要約処理１１０７を実行し、処理結果を最終検索結果１１０８として出力する。検索結果要約処理１１０７は、学習済モデル２１１を用いて行われる。検索結果要約処理１１０７では、検索処理１１０４により得られた検索結果１１０６について、該当箇所（検索の意図１１０１に関連する部分）の抽出と抽出内容の説明の提供を行う。例えば、検索の意図１１０１に関して、対象の情報が得られた場合には該当箇所と説明を出力し、対象の情報は得られなかったが参照すべき表等の参照する情報が得られた場合にはその情報と説明を出力し、対象の情報がなかった場合には「ＮＯ＿ＯＵＴＰＵＴ」と説明を出力する。なお、説明は、例えば、情報が得られた１又は複数のページに記載の文章等を考慮して生成する。例えば、図１１に示した例では、１つ目の検索結果１１０６にはＩＳ３６０Ａ、ＩＳ３６０Ｂ、及びＩＳ３４０の疲労強度に関する情報が含まれているが、情報処理装置１００は、検索の意図１１０１に応じて、１つ目の検索結果１１０６からはＩＳ３６０Ｂの疲労強度に関する情報のみを抽出して説明とともに最終検索結果１１０８として出力する。

【0056】

このように検索ツール３２６、３２９による検索結果１１０６に対して検索結果要約処理１１０７を実行して最終検索結果１１０８を出力することで、突合処理において検索結果とその説明情報を学習済モデル２１１に与えることによって学習済モデル２１１に適切な情報を入力することができ、推論や計画性に関する精度の向上を図ることができる。

【0057】

以下、突合処理の例について説明する。図１２～図１９に示す突合処理の推論プロセスにおいて、Ｑｕｅｓｔｉｏｎは確認対象のタスク（突合処理の入力情報）であり、Ｔｈｏｕｇｈｔ、Ａｃｔｉｏｎ、ＡｃｔｉｏｎＩｎｐｕｔ、ＦｉｎａｌＡｎｓｗｅｒは、学習済モデル２１１による推論であり、Ｏｂｓｅｒｖａｔｉｏｎは各ツールによる実行結果である。

【0058】

前述したように本実施形態では、突合処理において推論を行うにあたり、突合処理に関するワークフローのサンプルを学習済モデル２１１に学習（Ｆｅｗ－ｓｈｏｔ学習等）させ、突合処理に関するドメインに適合させる。例えば、図２６Ａ～図２６Ｄに示すようなサンプルを含むプロンプトを学習済モデル２１１に与えることによって学習させる。突合処理において推論を行う際には、図２６Ａ～図２６Ｄに示した要素２６００Ａ～２６００Ｄを結合し、その末尾にタスクをＱｕｅｓｔｉｏｎとして付加して推論を行う。図２６Ａにおいて、２６０１は突合処理に関するルールであり、２６０２は規格を検索して突合する例と数値比較を伴う突合例とに関するサンプルである。図２６Ｂにおいて２６０３は規格及び仕様書を検索して突合する例と数値比較を伴う突合例とに関するサンプルであり、図２６Ｃにおいて２６０４は多段階検索で適切な情報を使用して突合する例に関するサンプルである。また、図２６Ｄにおいて、２６０６は検索失敗時のハンドリングの例に関するサンプルであり、２６０７は複数タスクで構成されるタスクを単一なタスクに分割する例に関するサンプルである。このようなサンプルを含むプロンプトを学習済モデル２１１に与えることで、タスクに応じた適切な流れでタスクに関する処理を実行することができる。

【0059】

図１２は、突合処理の例を説明する図である。図１２には、定量的事項について、規格を検索して突合処理を行い確認する例についての推論プロセスを示している。図１２に示す例では、Ｑｕｅｓｔｉｏｎに示すように、『製品型番ＩＳ３８０Ａ（－ＳＳＰ）の適用サイズ「１０ｍ」の記載について、ＩｒｏｎＳｔａｎｄａｒｄの制限を満たしているか。』を確認するタスク３２２が入力されている。また、仕様書３０１から前提情報３０８として抽出された規格候補及び鋼材の種類の情報が追加情報として入力されている。

【0060】

これらＱｕｅｓｔｉｏｎに記載のタスク及び追加情報を含む情報をプロンプトとして学習済モデル２１１に入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２の該当製品の適用サイズを調べることを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとして規格検索ツール３２９（ＳｅａｒｃｈＳｔａｎｄａｒｄ）を選択し（Ａｃｔｉｏｎ）、規格検索ツール３２９に入力する情報（引数）を生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。ここで、ｓｔａｎｄａｒｄ＿ｎｏ、ｔｉｔｌｅ、及びｓｅｎｔｅｎｃｅは、検索クエリとして検索ツールに入力される情報であり、ｑｕｅｓｔｉｏｎは、検索の意図として検索ツールに入力される情報である。

【0061】

ＡｃｔｉｏｎＩｎｐｕｔに記載の情報に基づいて規格検索ツール３２９により規格文書ＤＢ３１２の検索が行われ、ツールの実行結果である規格検索ツール３２９による検索結果が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。規格検索ツール３２９では、前述したような検索結果の要約処理が施され、例えば、規格文書３０２に対する検索結果から抽出した関連する部分と、抽出内容の説明とで構成される最終の検索結果が規格検索ツール３２９による検索結果として出力される。（他の推論プロセスにおいても同様）

【0062】

続いて、Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（規格文書の検索結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２の記載より推測される該当製品の適用サイズの制限を満たすかをコード（プログラム）で検証することを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとしてコード実行ツール３３２（ＲｕｎＣｏｄｅ）を選択し（Ａｃｔｉｏｎ）、コード実行ツール３３２で実行させるコードを生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0063】

ＡｃｔｉｏｎＩｎｐｕｔに記載のコード（プログラム）がコード実行ツール３３２で実行され、ツールの実行結果であるコード実行ツール３３２による実行結果（Ｔｒｕｅ）が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（コードの実行結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、コードによる検証結果から、製品型番ＩＳ３８０Ａの適用サイズが規格文書３０２の記載より推測される適用サイズの制限を満たすと判定し（Ｔｈｏｕｇｈｔ）、突合処理結果として確認に関する各種情報及び確認結果がＯＫ（適合している）であることを示す回答を生成する（ＦｉｎａｌＡｎｓｗｅｒ）。

【0064】

図１３は、突合処理の例を説明する図である。図１３には、定量的事項について、規格を検索して突合処理を行い確認する例についての推論プロセスを示している。図１３に示す例では、Ｑｕｅｓｔｉｏｎに示すように、『製品型番ＩＳ３６０Ｂ（－ＳＳＳ）の適用サイズ「９ｍ」の記載について、ＩｒｏｎＳｔａｎｄａｒｄの制限を満たしているか。』を確認するタスク３２２について突合処理を行う。

【0065】

図１３に示す例では、図１２に示した例と同様にして、学習済モデル２１１による推論を行い、規格検索ツール３２９及びコード実行ツール３３２を用いて処理が行われ、コード実行ツール３３２による実行結果（Ｆａｌｓｅ）が突合処理部２０６に返される。コード実行ツール３３２による実行結果をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、コードによる検証結果から、製品型番ＩＳ３６０Ｂの適用サイズが規格文書３０２の記載より推測される適用サイズの制限を満たさないと判定し（Ｔｈｏｕｇｈｔ）、突合処理結果として確認に関する各種情報及び確認結果がＮＧ（適合していない）であることを示す回答を生成する（ＦｉｎａｌＡｎｓｗｅｒ）。

【0066】

図１４は、突合処理の例を説明する図である。図１４には、定性的事項について、規格を検索して突合処理を行い確認する例についての推論プロセスを示している。図１４に示す例では、Ｑｕｅｓｔｉｏｎに示すように、『規格上の表面の前処理はピックリング処理であるか。』を確認するタスク３２２が入力されている。また、仕様書３０１から前提情報３０８として抽出された規格候補及び鋼材の種類の情報が追加情報として入力されている。

【0067】

これらＱｕｅｓｔｉｏｎに記載のタスク及び追加情報を含む情報をプロンプトとして学習済モデル２１１に入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２における表面の前処理がピックリング処理であるかを調べることを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとして規格検索ツール３２９（ＳｅａｒｃｈＳｔａｎｄａｒｄ）を選択し（Ａｃｔｉｏｎ）、規格検索ツール３２９に入力する情報（引数）を生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0068】

ＡｃｔｉｏｎＩｎｐｕｔに記載の情報に基づいて規格検索ツール３２９により規格文書ＤＢ３１２の検索が行われ、ツールの実行結果である規格検索ツール３２９による検索結果が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（規格文書の検索結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２の記載より推測される表面の前処理がピックリング処理であり規格に適合すると判定し（Ｔｈｏｕｇｈｔ）、突合処理結果として確認に関する各種情報及び確認結果がＯＫ（適合している）であることを示す回答を生成する（ＦｉｎａｌＡｎｓｗｅｒ）。

【0069】

図１５は、突合処理の例を説明する図である。図１５には、定性的事項について、規格を検索して突合処理を行い確認する例についての推論プロセスを示している。図１５に示す例では、Ｑｕｅｓｔｉｏｎに示すように、『規格上の表面の最終仕上げはブラシ仕上げであるか。』を確認するタスク３２２について突合処理を行う。

【0070】

図１５に示す例では、図１４に示した例と同様にして、学習済モデル２１１による推論を行い、規格検索ツール３２９を用いて処理が行われ、規格検索ツール３２９による実行結果（検索結果）が突合処理部２０６に返される。規格検索ツール３２９による実行結果をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２の記載より推測される表面の最終仕上げはブラシ仕上げではなく規格に適合しないと判定し（Ｔｈｏｕｇｈｔ）、突合処理結果として確認に関する各種情報及び確認結果がＮＧ（適合していない）であることを示す回答を生成する（ＦｉｎａｌＡｎｓｗｅｒ）。

【0071】

図１６Ａ及び図１６Ｂは、突合処理の例を説明する図である。図１６Ａ及び図１６Ｂには、定量的事項について、規格及び仕様書を検索して突合処理を行い確認する例についての推論プロセスを示している。この例では、図１６ＡにおいてＱｕｅｓｔｉｏｎに示すように、『ＩＳ３８０Ａ（－ＳＳＰ）の疲労強度「２８０≦Ｆ≦２９０」の記載について、ＩｒｏｎＳｔａｎｄａｒｄの制限を満たしているか。』を確認するタスク３２２が入力されている。また、仕様書３０１から前提情報３０８として抽出された規格候補及び鋼材の種類の情報が追加情報として入力されている。

【0072】

これらＱｕｅｓｔｉｏｎに記載のタスク及び追加情報を含む情報をプロンプトとして学習済モデル２１１に入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２の該当製品の疲労強度を調べることを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとして規格検索ツール３２９（ＳｅａｒｃｈＳｔａｎｄａｒｄ）を選択し（Ａｃｔｉｏｎ）、規格検索ツール３２９に入力する情報（引数）を生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0073】

ＡｃｔｉｏｎＩｎｐｕｔに記載の情報に基づいて規格検索ツール３２９により規格文書ＤＢ３１２の検索が行われ、ツールの実行結果である規格検索ツール３２９による検索結果が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（規格文書の検索結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２の記載より推測される該当製品の疲労強度を満たすか否かは製品の長さによることから、仕様書３０１から製品の長さを調べることを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとして仕様書検索ツール３２６（ＳｅａｒｃｈＤｅｓｉｇｎＤｏｃｕｍｅｎｔ）を選択し（Ａｃｔｉｏｎ）、仕様書検索ツール３２６に入力する情報（引数）を生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0074】

ＡｃｔｉｏｎＩｎｐｕｔに記載の情報に基づいて仕様書検索ツール３２６により仕様書ＤＢ３１０の検索が行われ、図１６Ｂに示すように、ツールの実行結果である仕様書検索ツール３２６による検索結果が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（仕様書の検索結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、仕様書３０１における疲労強度の記載について規格文書３０２の記載より推測される該当製品の疲労強度の制限を満たすかをコード（プログラム）で検証することを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとしてコード実行ツール３３２（ＲｕｎＣｏｄｅ）を選択し（Ａｃｔｉｏｎ）、コード実行ツール３３２で実行させるコードを生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0075】

ＡｃｔｉｏｎＩｎｐｕｔに記載のコード（プログラム）がコード実行ツール３３２で実行され、ツールの実行結果であるコード実行ツール３３２による実行結果（Ｔｒｕｅ）が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（コードの実行結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、コードによる検証結果から、ＩＳ３８０Ａの疲労強度が規格文書３０２の記載より推測される疲労強度の制限を満たすと判定し（Ｔｈｏｕｇｈｔ）、突合処理結果として確認に関する各種情報及び確認結果がＯＫ（適合している）であることを示す回答を生成する（ＦｉｎａｌＡｎｓｗｅｒ）。
図１６Ａ及び図１６Ｂに示した例では、定量的事項について確認するタスクを例に示したが、定性的事項について確認するタスクについても同様に処理が行われる。

【0076】

図１７Ａ及び図１７Ｂは、突合処理の例を説明する図である。図１７Ａ及び図１７Ｂには、定量的事項について、多段階検索で適切な情報を使用して突合処理を行い確認する例についての推論プロセスを示している。この例では、図１７ＡにおいてＱｕｅｓｔｉｏｎに示すように、『ＩＳ３８０Ａ（－ＳＳＰ）の化学成分における炭素の値「０．２０％」について、ＩｒｏｎＳｔａｎｄａｒｄの制限を満たしているか。』を確認するタスク３２２が入力されている。また、仕様書３０１から前提情報３０８として抽出された規格候補及び鋼材の種類の情報が追加情報として入力されている。

【0077】

これらＱｕｅｓｔｉｏｎに記載のタスク及び追加情報を含む情報をプロンプトとして学習済モデル２１１に入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２の該当製品の化学成分における炭素の値を調べることを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとして規格検索ツール３２９（ＳｅａｒｃｈＳｔａｎｄａｒｄ）を選択し（Ａｃｔｉｏｎ）、規格検索ツール３２９に入力する情報（引数）を生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0078】

ＡｃｔｉｏｎＩｎｐｕｔに記載の情報に基づいて規格検索ツール３２９により規格文書ＤＢ３１２の検索が行われ、ツールの実行結果である規格検索ツール３２９による検索結果が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（規格文書の検索結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２から該当製品の化学成分における炭素の値は直接的には得られなかったが、規格文書３０２の記載より表２に化学成分が記載されていると推測されることから、規格文書３０２の表２の化学成分を検索することを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとして規格検索ツール３２９（ＳｅａｒｃｈＳｔａｎｄａｒｄ）を選択し（Ａｃｔｉｏｎ）、規格検索ツール３２９に入力する情報（引数）を生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0079】

ＡｃｔｉｏｎＩｎｐｕｔに記載の情報に基づいて規格検索ツール３２９により仕様書ＤＢ３１０の検索が行われ、図１７Ｂに示すように、ツールの実行結果である規格文書検索ツール３２９による検索結果が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（規格文書の検索結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２の記載より推測される該当製品の化学成分における炭素の値の制限を満たすかをコード（プログラム）で検証することを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとしてコード実行ツール３３２（ＲｕｎＣｏｄｅ）を選択し（Ａｃｔｉｏｎ）、コード実行ツール３３２で実行させるコードを生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0080】

ＡｃｔｉｏｎＩｎｐｕｔに記載のコード（プログラム）がコード実行ツール３３２で実行され、ツールの実行結果であるコード実行ツール３３２による実行結果（Ｔｒｕｅ）が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（コードの実行結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、コードによる検証結果から、ＩＳ３８０Ａの化学成分における炭素の値が規格文書３０２の記載より推測される化学成分における炭素の値の制限を満たすと判定し（Ｔｈｏｕｇｈｔ）、突合処理結果として確認に関する各種情報及び確認結果がＯＫ（適合している）であることを示す回答を生成する（ＦｉｎａｌＡｎｓｗｅｒ）。
図１７Ａ及び図１７Ｂに示した例では、定量的事項について確認するタスクを例に示したが、定性的事項について確認するタスクについても同様に処理が行われる。

【0081】

図１８は、突合処理の例を説明する図である。図１８には、複数のタスクを含む入力タスクを、それぞれ単一のタスクに分解する例についての推論プロセスを示している。図１８に示す例では、Ｑｕｅｓｔｉｏｎに示すように、『ＩＳ３８０Ａ（－ＳＳＡ）およびＩＳ３８０Ｂ（－ＳＳＳ）の疲労強度「２７０≦Ｆ≦２８０」、「２６０≦Ｆ≦３０８」が、ＩｒｏｎＳｔａｎｄａｒｄの制限を満たすか』を確認するタスク３２２が入力されている。また、仕様書３０１から前提情報３０８として抽出された規格候補及び鋼材の種類の情報が追加情報として入力されている。

【0082】

これらＱｕｅｓｔｉｏｎに記載のタスク及び追加情報を含む情報をプロンプトとして学習済モデル２１１に入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、タスク分解が必要なため、タスクを分解してタスクリストに追加することを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとしてタスク分割ツール３２４（ＡｄｄＴａｓｋ）を選択し（Ａｃｔｉｏｎ）、タスク分割ツール３２４に入力する情報を生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0083】

ＡｃｔｉｏｎＩｎｐｕｔに記載の情報に基づいてタスク分割ツール３２４により分解後のそれぞれのタスクがタスクリスト３２１に追加され、ツールの実行結果であるタスク分割ツール３２４による処理結果が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。例えば、この例に示した『ＩＳ３８０Ａ（－ＳＳＡ）およびＩＳ３８０Ｂ（－ＳＳＳ）の疲労強度「２７０≦Ｆ≦２８０」、「２６０≦Ｆ≦３０８」が、ＩｒｏｎＳｔａｎｄａｒｄの制限を満たすか』を確認するタスクは、『ＩＳ３８０Ａ（－ＳＳＡ）の疲労強度「２７０≦Ｆ≦２８０」がＩｒｏｎＳｔａｎｄａｒｄの制限を満たすか』、『ＩＳ３８０Ｂ（－ＳＳＳ）の疲労強度「２６０≦Ｆ≦３０８」がＩｒｏｎＳｔａｎｄａｒｄの制限を満たすか』をそれぞれ確認するタスクに分解されてタスクリスト３２１に追加される。

【0084】

Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、タスク分割ツール３２４によるタスクリスト３２１への分解されたタスクの追加が正常に終了したと判定し（Ｔｈｏｕｇｈｔ）、突合処理結果としてｓｋｉｐすることを示す回答を生成する（ＦｉｎａｌＡｎｓｗｅｒ）。

【0085】

図１９は、突合処理の例を説明する図である。図１９には、検索失敗時にハルシネーションを抑制する処理例についての推論プロセスを示している。図１９に示す例では、Ｑｕｅｓｔｉｏｎに示すように、『ＩＳ３８０Ａ（－ＳＳＡ）の電気抵抗「１．０×１０＾－７以上１．５×１０＾－７Ω・ｍ以下」がＩｒｏｎＳｔａｎｄａｒｄの制限を満たすか』を確認するタスク３２２が入力されている。また、仕様書３０１から前提情報３０８として抽出された規格候補及び鋼材の種類の情報が追加情報として入力されている。

【0086】

これらＱｕｅｓｔｉｏｎに記載のタスク及び追加情報を含む情報をプロンプトとして学習済モデル２１１に入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２の該当製品の電気抵抗を調べることを計画し（Ｔｈｏｕｇｈｔ）、それを実行するツールとして規格検索ツール３２９（ＳｅａｒｃｈＳｔａｎｄａｒｄ）を選択し（Ａｃｔｉｏｎ）、規格検索ツール３２９に入力する情報（引数）を生成する（ＡｃｔｉｏｎＩｎｐｕｔ）。

【0087】

ＡｃｔｉｏｎＩｎｐｕｔに記載の情報に基づいて規格検索ツール３２９により規格文書ＤＢ３１２の検索が行われ、ツールの実行結果である規格検索ツール３２９による検索結果が突合処理部２０６に返される（Ｏｂｓｅｒｖａｔｉｏｎ）。Ｏｂｓｅｒｖａｔｉｏｎに記載のツールの実行結果（規格文書の検索結果）をプロンプトとして追加して入力することで、情報処理装置１００は、プロンプトとして入力された情報に基づいて学習済モデル２１１による推論を行う。この推論により、規格文書３０２では該当製品の電気抵抗についての情報は得られず、仕様書３０１の電気抵抗の記載が規格の制限を満たすか否かは確認することができないと判定し（Ｔｈｏｕｇｈｔ）、突合処理結果として確認に関する各種情報及び確認結果がＮＧ（適合していない）であることを示す回答を生成する（ＦｉｎａｌＡｎｓｗｅｒ）。このように対象の情報が得られない場合には「ＮＯ＿ＯＵＴＰＵＴ」を出力し、対象の情報が得られなかったことを明示的に示すことでハルシネーションの発生を抑止することができる。

【0088】

図２０（Ａ）及び図２０（Ｂ）は、本実施形態における処理結果の出力例を示す図である。前述した情報処理装置１００での処理結果は、例えば、図２０（Ａ）に示すリスト２００１や図２０（Ｂ）に示すリスト２０１１のように、検証したタスク毎に検証内容と検証結果とが一覧表示される。図２０（Ａ）に示したリスト２００１及び図２０（Ｂ）に示したリスト２０１１では、検証を行ったすべてのタスクについて表示するようにしているが、検証結果がＮＧである（仕様書の記載が規格に適合していると判定できなかった）タスクについてのみ表示するようにしてもよい。

【0089】

また、入力装置１０６に対するユーザ操作等によって、リストに表示したタスクの内から検索結果がＮＧであるタスクが選択されたことに応じて、例えば、図２０（Ａ）に示す詳細レポート２００２や図２０（Ｂ）に示す詳細レポート２０１２のように、検証結果がＮＧとなった根拠を表示するようにしてもよい。この例では、詳細レポート２００２、２０１２は、問題部分と検証されたプロセス部分とで構成されており、突合処理における推論プロセス等に基づいて生成することが可能である。なお、検索結果がＮＧであるタスクに対して詳細レポートの表示を指示するボタン等のＧＵＩを設け、そのＧＵＩに対する操作等が行われたことに応じて詳細レポートを表示するようにしてもよい。

【0090】

図２０（Ａ）に示した詳細レポート２００２は、図１３に推論プロセスを示したタスクに関する詳細レポートであり、図２０（Ｂ）に示した詳細レポート２０１２は、図１９に推論プロセスを示したタスクに関する詳細レポートである。例えば、詳細レポートにおいて、問題部分は推論プロセスにおけるＦｉｎａｌＡｎｓｗｅｒに基づいて生成されており、検証されたプロセス部分は推論プロセスにおけるＴｈｏｕｇｈｔ、ＡｃｔｉｏｎＩｎｐｕｔ、及びＯｂｓｅｒｖａｔｉｏｎ等に基づいて生成されている。また、検証されたプロセス部分において、例えば、クエリは推論プロセスにおけるＡｃｔｉｏｎＩｎｐｕｔに基づいて生成され、検索結果は推論プロセスにおけるＯｂｓｅｒｖａｔｉｏｎに基づいて生成され、考察は推論プロセスにおけるＴｈｏｕｇｈｔに基づいて生成されている。

【0091】

なお、前述した例では、結果のリストと、検証結果がＮＧとなった根拠を示す詳細レポートとはそれぞれ分けて表示する例を示したが、結果のリストと詳細レポートとを合わせて表示するようにしてもよい。また、詳細レポートにおいて示す情報は、前述した例に限定されるものではなく、例えば、検証を行う際に用いたツールに関する情報を示すようにしてもよい。

【0092】

第１の実施形態によれば、情報処理装置１００は、第１文書（例えば、仕様書）から確認する内容を抽出して内容毎のタスクを生成し、生成したタスクを学習済モデル２１１に順次入力して、タスクで確認する内容が第２文書（例えば、規格文書）から検索された条件に適合するか否かを学習済モデル２１１に回答させ、処理結果として出力する。これにより、確認対象である第１文書の内容が、第２文書に示される求められる条件に適合しているか否かの確認作業を効率化することが可能となる。

【0093】

また、一般に学習済モデルにおいて学習していないドメイン外の知識を必要とする生成においてはハルシネーションが発生するが、本実施形態では、確認を行う際に外部のツール（検索ツール３２６、３２９）を用いて情報を検索し、得られた検索結果をプロンプトに追加して突合処理を行う学習済モデルに与えることでハルシネーションの発生を抑止することが可能となる。

【0094】

＜第２の実施形態＞
第１の実施形態では確認される第１文書から確認対象の条件を示している第２文書が特定可能な例について示したが、第１文書から第２文書を特定することが困難な場合もある。第２の実施形態では、確認される第１文書から確認対象の条件を示している第２文書が特定困難な場合の例について説明する。第２の実施形態における情報処理装置２１００のハードウェア構成は、図１に示した第１の実施形態における情報処理装置１００のハードウェア構成と同様であるので、説明は省略する。

【0095】

図２１は、第２の実施形態における情報処理装置２１００の機能構成の例を示す図である。図２１において、図２に示した構成要素と同一の機能を有する構成要素には同一の符号を付し、重複する説明は省略する。情報処理装置２１００は、取得部２０１、解析部２０２、ＤＢ作成部２０３、情報抽出部２０４、適合判定部２０５、出力部２０９、記憶部２１０、及び候補選択部２１０１を有する。また、適合判定部２０５は、突合処理部２０６、情報検索部２０７、及びコード実行部２０８を有する。

【0096】

情報処理装置２１００においても、第１の実施形態における情報処理装置１００と同様に、機械学習（ディープラーニング、深層学習）によって生成され、記憶部２１０に記憶されている学習済モデル２１１を用いて機能の一部が実現される。学習済モデル２１１は、例えば、大規模言語モデル（ＬＬＭ）や、テキストデータに対応可能な大規模マルチモーダルモデル（ラージマルチモーダルモデル、ＬＭＭ）である。

【0097】

第２の実施形態では、解析部２０２は、第１の実施形態と同様にして、第１文書の内容の確認作業に関する突合タスク（タスク）を生成する。また、解析部２０２は、取得部２０１により取得される、１つ又は複数の第２文書を解析して、それぞれの第２文書に記載されている基準（ルール）の特徴を表す情報を抽出して、第２文書に関するルールインデックスを構築する。解析部２０２は、第２文書と、基準（ルール）の特徴を表す情報を抽出して出力する指示を含むプロンプトとを学習済モデル２１１に対して入力することで、それぞれの第２文書から基準（ルール）の特徴を表す情報を抽出する。抽出された基準（ルール）の特徴を表す情報は、それが抽出された第２文書と紐づけられて、記憶部２１０に第２文書のルールインデックス２１０３として格納される。なお、第２文書を章立て等に基づいて所定のパターンで複数の文書に分割して学習済モデル２１１に対して入力するようにしてもよい。

【0098】

第２の実施形態では、情報抽出部２０４は、取得部２０１により取得される第１文書から属性情報を抽出する。ここで、属性情報は、第１文書の特徴を示している情報であり、例えば、第１文書において参照している基準（ルール）の特定に寄与するような情報等である。情報抽出部２０４は、第１文書と、第１文書の特徴を示している情報を抽出する指示を含むプロンプトとを学習済モデル２１１に対して入力することで、第１文書に関する属性情報を抽出する。抽出された属性情報は、記憶部２１０に属性情報２１０２として格納される。情報抽出部２０４は、例えば章立て等に基づいて第１文書を複数の文書に分割して学習済モデル２１１に入力する。したがって、属性情報は、章立て等に基づいて分割した複数の文書毎に抽出される。

【0099】

候補選択部２１０１は、情報抽出部２０４により第１文書から抽出された属性情報２１０２と、解析部２０２により構築された第２文書のルールインデックス２１０３とに基づいて、１つ又は複数の第２文書の内から第１文書の内容の確認に用いる第２文書（候補文書）を選択する。候補選択部２１０１は、選択手段の一例である。候補選択部２１０１は、第１文書の特徴と第２文書の特徴との類似度に基づいて、第１文書の内容の確認に用いる第２文書を選択する。候補選択部２１０１は、例えば、第１文書から抽出された属性情報２１０２毎に第２文書のルールインデックス２１０３を検索し、属性情報２１０２毎に得られた検索結果に関するスコア（特徴の類似度）を第２文書毎に合算してスコアの高い第２文書を候補文書として選択する。なお、候補選択部２１０１は、１つの第２文書に限らず、例えばスコア（特徴の類似度）が閾値を超えた複数の第２文書を選択するようにしてもよい。候補選択部２１０１により選択された第２文書については、ＤＢ作成部２０３により文書に関するデータベース（ｒｅｔｒｉｅｖｅｒ）が作成され、記憶部２１０に第２文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２１６として記憶される。

【0100】

図２２を参照して、第２の実施形態における情報処理装置２１００での処理について説明する。図２２は、第２の実施形態における情報処理装置２１００の処理例を説明する図である。以下では、一例として、第１文書を製品の仕様書２２０１、第２文書を製品の規格に関する規格文書２２０２とし、仕様書２２０１に記載されている内容が規格文書２２０２の規格に適合しているか否かを確認する場合を例に説明する。

【0101】

情報処理装置２１００は、第１文書としての仕様書２２０１を取得する。また、情報処理装置２１００は、１つ又は複数の第２文書としての規格文書２２０２を取得する。

【0102】

（処理２２０３、２２０５：仕様書の分割及びタスク分解）
取得した仕様書２２０１に対して、情報処理装置２１００は、仕様書の分割処理２２０３を行い、仕様書２２０１全体を仕様書の一部となる複数の文書２２０４に分割する。仕様書の分割処理２２０３では、第１の実施形態における仕様書の分割処理３０３と同様にして、情報処理装置２１００は、アルゴリズムによる機械的処理によって、分割後の各文書が学習済モデル２１１で処理可能なサイズとなるように、仕様書２２０１を複数の文書に分割する。

【0103】

また、情報処理装置２１００は、分割後の複数の文書２２０４に対してタスク分解処理２２０５を行い、仕様書２２０１の内容確認に関する突合タスク（タスク）２２０６を生成する。タスク分解処理２２０５では、第１の実施形態におけるタスク分解処理３０５と同様にして、情報処理装置２１００は、分割された文書２２０４と、規格に適合しているか否かを確認する必要がある内容を抽出しタスクを出力する指示を含むプロンプトとを学習済モデル２１１に対して入力することで、仕様書２２０１の内容確認に関するタスク２２０６を生成する。

【0104】

（処理２２０７：属性情報抽出）
取得した仕様書２２０１に対して、情報処理装置２１００は、属性情報抽出処理２２０７を行い、第１文書において参照している規格の特定に寄与するような第１文書の特徴を示している属性情報を抽出する。属性情報抽出処理２２０７では、情報処理装置２１００は、章立て等に基づいて複数の文書に分割した仕様書２２０１と、仕様書２２０１において特徴を示す情報を抽出する指示を含むプロンプトとを学習済モデル２１１に対して入力することで、仕様書２２０１に関する属性情報２２０８を生成する。この例では、図２３（Ａ）に示すように仕様書に記載されている製品の特徴を示す情報を仕様書２２０１から抽出することを指示するプロンプト２３００を入力することで、図２３（Ｂ）に示すような仕様書において参照している規格の特定に寄与するような情報等を属性情報２２０８として抽出する。

【0105】

（処理２２０９：仕様書のＤＢ作成）
情報処理装置２１００は、取得した仕様書２２０１に基づいて仕様書のＤＢ作成処理２２０９を行い、仕様書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２２１０を作成する。仕様書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２２１０は図２１に示した第１文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２１５に相当する。情報処理装置２１００は、アルゴリズムによる機械的処理によって、仕様書２２０１を検索可能な形の状態に処理してデータベースを作成する。

【0106】

（処理２２１１：ルールインデックス構築）
取得した規格文書２２０２に対して、情報処理装置２１００は、規格文書のルールインデックス構築処理２２１１を行い、それぞれの規格文書に記載されている規格の特徴を表す情報を抽出して、規格文書のルールインデックス２２１２を構築する。規格文書のルールインデックス構築処理２２１１では、情報処理装置２１００は、章立て等に基づいて複数の文書に分割した規格文書と、規格の特徴を表す情報を抽出して出力する指示を含むプロンプトとを学習済モデル２１１に対して入力することで、それぞれの規格文書から規格の特徴を表す情報を抽出する。例えば、情報処理装置２１００は、分割された規格文書と図２４（Ａ）に示すプロンプト２４００とを学習済モデル２１１に対して入力することで、規格文書から図２４（Ｂ）に示すような規格の特徴を表す情報を抽出する。情報処理装置２１００は、抽出した規格の特徴を表す情報と規格文書を紐づけて規格文書のルールインデックス２２１２を構築する。図２４（Ａ）に示すプロンプト２４００は、規格文書から規格の特徴を表す情報を端的に出力させることを指示するプロンプト２４０１、及び学習済モデル２１１に学習させる学習サンプル２４０２、２４０３を含む。

【0107】

（処理２２１３：規格文書の候補文書抽出）
情報処理装置２１００は、規格文書の候補文書抽出処理２２１３を行い、仕様書２２０１の内容の確認に用いる、候補文書となる規格文書２２０２を選択する。規格文書の候補文書抽出処理２２１３では、情報処理装置２１００は、属性情報抽出処理２２０７で抽出された属性情報２２０８に基づいて規格文書のルールインデックス２２１２を検索し、検索結果に関するスコア（特徴の類似度）が高い規格文書２２０２を仕様書２２０１の内容の確認に用いる候補文書として選択する。また、情報処理装置２１００は、選択した候補文書（選択された規格文書２２０２）に基づいて規格文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２２１４を作成する。規格文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２２１４は図２１に示した第２文書ＤＢ（ｒｅｔｒｉｅｖｅｒ）２１６に相当する。

【0108】

（処理２２２０：適合判定）
タスク分解処理２２０５で生成されたタスクに対して、情報処理装置２１００は、第１の実施形態と同様にして、学習済モデル２１１を用いてタスク毎に適合判定処理２２２０を行い、仕様書２２０１に記載の内容が規格文書２２０２の規格に適合しているか否かを判定する。適合判定処理２２０では、タスク分解処理２２０５によって生成されたタスク２２０６がキュー形式で記憶されているタスクリスト２２２１から１つずつ順に取り出されるタスク２２２２に対して、情報処理装置２１００が学習済モデル２１１を用いて突合処理２２２３を行い、処理結果２２４０を出力する。タスクリスト２２２１のタスクがなくなるまで突合処理２２２３が行われる。

【0109】

突合処理２２２３では、第１の実施形態と同様にして、学習済モデル２１１に文書の内容を突合する際の人間のワークフローをシミュレーションさせ、ツールを用いて突合に必要な情報の収集等を行い、収集した情報等に基づいて意味的な推論を行って処理結果を得る。本実施形態においても、突合処理２２２３は、ＲｅＡｃｔと呼ばれるフレームワークに倣って処理を行い、処理結果を出力する。

【0110】

本実施形態では、突合処理２２２３において学習済モデル２１１が利用するツールとして、タスク分割ツール２２２４、仕様書検索ツール２２２６、規格検索ツール２２２９、及びコード実行ツール２２３２がある。タスク分割ツール２２２４は適合判定部２０５により実現され、仕様書検索ツール２２２６及び規格検索ツール２２２９は情報検索部２０７により実現され、コード実行ツール２２３２はコード実行部２０８により実現される。タスク分割ツール２２２４、仕様書検索ツール２２２６、規格検索ツール２２２９、及びコード実行ツール２２３２は、第１の実施形態におけるタスク分割ツール３２４、仕様書検索ツール３２６、規格検索ツール３２９、及びコード実行ツール３３２とそれぞれ同様であるので説明は省略する。

【0111】

図２５に示すように、情報処理装置２１００は、仕様書２２０１に対して規格に適合しているか否かを確認する必要がある内容を抽出する抽出処理２５０１を行って突合タスク（タスク）２５０２を生成する。情報処理装置２１００は、仕様書２２０１に対して特徴を示している属性情報を抽出する抽出処理２５０３を行って仕様書２２０１に関する属性情報２５０４を生成する。

【0112】

また、情報処理装置２１００は、規格文書２２０２に対して規格の特徴を表す情報を抽出する抽出処理２５０５を行って規格文書のルールインデックス２５０６を構築する。規格文書のルールインデックス２５０６では、規格の特徴を表す情報（条件句）に対してそれが記載されている規格文書（従うルール）が関連付けられている。

【0113】

情報処理装置２１００は、属性情報２５０４に基づいて規格文書のルールインデックス２５０６に対する検索処理２５０７を行い、検索結果から得られる特徴の類似度に基づいて仕様書２２０１の内容の確認に用いる規格文書の候補文書２５０８を選択する。そして、情報処理装置２１００は、生成されたタスク２５０２に対して、学習済モデル２１１を用いてタスク毎に適合判定処理２５０９を行い、仕様書２２０１に記載の内容が候補文書２５０８として選択された規格文書２２０２の規格に適合しているか否かを判定して処理結果２２４０を出力する。なお、この適合判定処理２５０９における規格文書の検索の結果、候補文書２５０８に含まれていない別の規格を参照する必要がある場合には、選択された候補文書２５０８に限らず他の文書（例えば、すべての規格文書）を対象に検索を行うようにしてもよい。

【0114】

例えば、確認対象である第１文書から第２文書を特定することが困難な場合、原文をそのまま検索エンジンに入力してのキーワード検索や埋め込み検索を行うことが考えられる。キーワード検索では、意味を考慮しないためにノイズの入った検索結果となりやすい。また、埋め込み検索では、意味・文脈に沿った類似的な結果が得られることが期待されるが、なぜ特定の検索結果が選ばれたのかを理解するのが困難な場合がある。

【0115】

それに対して、本実施形態では、情報処理装置２１００は、第１文書から抽出された属性情報と、第２文書から基準（ルール）の特徴を表す情報を抽出して構築した第２文書に関するルールインデックスとを用いた検索結果から得られる第１文書の特徴と第２文書の特徴との類似度に基づいて、第１文書の内容確認に用いる第２文書を選択する。このようにして第１文書の内容確認に用いる第２文書を選択することで、検索結果として関係のない第２文書が選択されることが減少し、検索結果として関連性の高い第２文書を選択することが可能となる。また、学習済モデルに与えるプロンプトに特定のドメインに特化した言葉（専門用語）を用いることで、ドメイン特化領域にも対応でき、専門的な検索が可能となる。

【0116】

また、第２の実施形態によれば、確認対象である第１文書から内容確認に用いる第２文書を特定することが困難な場合でも、第１文書の特徴に応じた第２文書を選択でき、第１文書の内容が求められる条件に適合しているか否かの確認作業を効率化することが可能となる。

【0117】

なお、前述した第１及び第２の実施形態では、学習済モデル２１１は、情報処理装置１００（２１００）の記憶部２１０に記憶されている構成としているが、情報処理装置１００（２１００）とネットワークを介して通信可能な他の情報処理装置（サーバ装置等）に備えるような構成としてもよい。この場合には、情報処理装置１００（２１００）は、ネットワークＩ／Ｆ１０７等により学習済モデル２１１を備える他の情報処理装置に、学習済モデル２１１に対する入力を送信し、それに対する処理結果を受信するようにすればよい。

【0118】

また、前述した第１及び第２の実施形態では、学習サンプルを含むプロンプトに与えて学習済モデル２１１を学習（Ｆｅｗ－ｓｈｏｔ学習）させるようにしているが、各機能に合わせてファインチューニングした学習済モデルを用いるようにしてもよい。

【0119】

なお、前記実施形態は、何れも本発明を実施するにあたっての具体化のほんの一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。

【符号の説明】

【0120】

１００、２１００情報処理装置
１０１ＣＰＵ
１０２ＲＯＭ
１０３ＲＡＭ
１０４補助記憶装置
１０５出力装置
１０６入力装置
１０７ネットワークＩ／Ｆ
２０１取得部
２０２解析部
２０３ＤＢ作成部
２０４情報抽出部
２０５適合判定部
２０６突合処理部
２０７情報検索部
２０８コード実行部
２０９出力部
２１０記憶部
２１１学習済モデル
２１２設定ファイル
２１３タスクデータ
２１４前提情報
２１５第１文書ＤＢ（Ｒｅｔｒｉｅｖｅｒ）
２１６第２文書ＤＢ（Ｒｅｔｒｉｅｖｅｒ）
２１０１候補選択部
２１０２属性情報
２１０３ルールインデックス

【要約】

【課題】対象の文書の内容が、求められる条件に適合しているか否かの確認作業を効率化することが可能な情報処理装置を提供する。
【解決手段】情報処理装置は、第１文書及び第２文書を取得する取得手段と、第１文書から確認する内容を抽出して内容毎のタスクを生成する解析手段と、第１文書の特徴を示す属性情報を抽出する情報抽出手段と、属性情報に基づいて、１又は複数の第２文書の内から候補文書を選択する選択手段と、タスクで確認する内容に関する条件を候補文書から検索する検索手段と、解析手段により生成されたタスクを学習済モデルに順次入力し、入力されたタスクで確認する内容が候補文書から検索された条件に適合するか否かを学習済モデルに回答させる処理手段と、処理手段による処理結果を出力する出力手段とを有する。
【選択図】図３