特許7569130 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社テクトムの特許一覧

特許7569130情報処理装置、情報処理方法および情報処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-10-08

(45)【発行日】2024-10-17

(54)【発明の名称】情報処理装置、情報処理方法および情報処理プログラム

(51)【国際特許分類】

G06F 16/903 20190101AFI20241009BHJP

G06N 20/00 20190101ALI20241009BHJP

【ＦＩ】

G06F16/903

G06N20/00

【請求項の数】 32

(21)【出願番号】P 2024545259

(86)(22)【出願日】2024-07-29

(86)【国際出願番号】 JP2024027006

【審査請求日】2024-07-30

【早期審査対象出願】

(73)【特許権者】

【識別番号】523434100

【氏名又は名称】株式会社テクトム

(74)【代理人】

【識別番号】230116816

【弁護士】

【氏名又は名称】成川弘樹

(74)【代理人】

【識別番号】100159248

【弁理士】

【氏名又は名称】齋藤修

(74)【代理人】

【識別番号】100174850

【弁理士】

【氏名又は名称】大崎絵美

(72)【発明者】

【氏名】北村尚紀

(72)【発明者】

【氏名】ハミルトンフランシスニルス

【審査官】甲斐哲雄

(56)【参考文献】

【文献】特開２０２１－１８９８３５（ＪＰ，Ａ）

【文献】中国特許出願公開第１１７７０９４８３（ＣＮ，Ａ）

【文献】中国特許出願公開第１１７７６３１２８（ＣＮ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｎ３／００－９９／００

(57)【特許請求の範囲】

【請求項1】

対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第１プロンプト設定部と、
前記設定した所望情報取得プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第１サンプル設定部と、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、
を有する情報処理装置。

【請求項2】

前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を不正解情報として指定する不正解情報指定部を、さらに有する請求項１に記載の情報処理装置。

【請求項3】

前記指定した正解情報を説明する正解情報説明プロンプトを設定する正解情報説明プロンプト設定部を、さらに有する請求項２に記載の情報処理装置。

【請求項4】

前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記ファイルデータから前記所望情報を取得する第１所望情報取得部を、さらに有する請求項３に記載の情報処理装置。

【請求項5】

前記第１所望情報取得部は、さらに前記指定した不正解情報を入力して、前記ファイルデータから前記所望情報を取得する請求項４に記載の情報処理装置。

【請求項6】

前記第１所望情報取得部は、さらに前記設定した正解情報説明プロンプトを入力して、前記ファイルデータから前記所望情報を取得する請求項４または５に記載の情報処理装置。

【請求項7】

前記設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する請求項１または２に記載の情報処理装置。

【請求項8】

前記取得した所望情報を検証する検証部を、さらに有する請求項４または５に記載の情報処理装置。

【請求項9】

前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記所望情報を取得するための取得スクリプトを生成する取得スクリプト生成部と、を有する請求項１に記載の情報処理装置。

【請求項10】

前記生成した取得スクリプトにより前記ファイルデータから前記所望情報を取得する第２所望情報取得部を、さらに有する請求項９に記載の情報処理装置。

【請求項11】

前記生成した取得スクリプトを蓄積する取得スクリプト蓄積部を、さらに有する請求項９または１０に記載の情報提供装置。

【請求項12】

前記生成した取得スクリプトにより前記ファイルデータから取得した所望情報を前記指定した正解情報と対比して評価する取得スクリプト評価部を、さらに有する請求項１０に記載の情報処理装置。

【請求項13】

前記取得スクリプト生成部は、前記取得スクリプト評価部による評価結果をさらに入力して前記取得スクリプトを生成する請求項１２に記載の情報処理装置。

【請求項14】

前記生成した取得スクリプトと、前記ファイルデータの一部または全部を前記学習済みＡＩモデルに入力し、前記生成した取得スクリプトを前記ファイルデータに適応するよう修正する取得スクリプト修正部を、さらに有する請求項９または１０に記載の情報処理装置。

【請求項15】

前記取得スクリプト修正部は、さらに前記生成した取得スクリプトの元となる所望情報取得プロンプトを前記学習済みＡＩモデルに入力して修正する請求項１４に記載の情報処理装置。

【請求項16】

前記設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する請求項９または１０に記載の情報処理装置。

【請求項17】

前記取得した所望情報を検証する検証部を、さらに有する請求項１５に記載の情報処理装置。

【請求項18】

前記取得スクリプト修正部は、前記検証部による検証結果を反映させて取得スクリプトを修正する請求項１７に記載の情報処理装置。

【請求項19】

対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第２プロンプト設定部と、
前記設定したプロンプト生成プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第２サンプル設定部と、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、
を有する情報処理装置。

【請求項20】

前記設定したプロンプト生成プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記取得プロンプトを生成する取得プロンプト生成部を、さらに有する請求項１９に記載の情報処理装置。

【請求項21】

前記生成した取得プロンプトを前記学習済みＡＩモデルに入力して、前記ファイルデータから前記所望情報を取得する第３所望情報取得部を、さらに有する請求項２０に記載の情報処理装置。

【請求項22】

前記生成した取得プロンプトを蓄積する取得プロンプト蓄積部を、さらに有する請求項２０または２１に記載の情報処装置。

【請求項23】

前記生成した取得プロンプトにより前記正解サンプルファイルデータに対して前記所望情報を取得した結果を前記正解情報と比較して評価する取得プロンプト評価部を、さらに有する請求項２１に記載の情報処理装置。

【請求項24】

前記取得プロンプト生成部は、前記取得プロンプト評価部による評価結果を反映させて取得プロンプトを生成する請求項２３に記載の情報処理装置。

【請求項25】

前記第３所望情報取得部は、前記生成した取得プロンプトを生成するために入力された前記プロンプト生成プロンプトと前記正解サンプルファイルデータおよび正解情報をさらに入力して所望情報を取得する請求項２１に記載の情報処理装置。

【請求項26】

前記設定したプロンプト生成プロンプトにより取得プロンプトを生成するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する請求項１９または２０に記載の情報処理装置。

【請求項27】

前記第３所望情報取得部により取得した取得結果を検証する検証部を、さらに有する請求項２１に記載の情報処理装置。

【請求項28】

前記取得プロンプト生成部は、前記検証部による検証結果を反映させて取得プロンプトを生成する請求項２７に記載の情報処理装置。

【請求項29】

情報処理装置が実行する情報処理方法であって、
対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第１プロンプト設定ステップと、
前記設定した所望情報取得プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第１サンプル設定ステップと、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、
を有する情報処理方法。

【請求項30】

対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第１プロンプト設定ステップと、
前記設定した所望情報取得プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第１サンプル設定ステップと、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、
を情報処理装置に実行させる情報処理プログラム。

【請求項31】

情報処理装置が実行する情報処理方法であって、
対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第２プロンプト設定ステップと、
前記設定したプロンプト生成プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第２サンプル設定ステップと、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、
を有する情報処理方法。

【請求項32】

対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第２プロンプト設定ステップと、
前記設定したプロンプト生成プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第２サンプル設定ステップと、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、
を情報処理装置に実行させる情報処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、様々な情報を含むファイルデータ群から所望の情報を取得する情報処理装置に関する。

【背景技術】

【0002】

近年、ファイルデータ群から所定の情報を取得するために大規模言語モデル（以下、ＬＬＭと省略する場合がある。）を利用することが広がりつつある。例えば、特許文献１には、広告のチラシなどのように形式の定まっていない多様な印刷物から所定の項目に関する文字情報を収集するためにＬＬＭを利用した技術が開示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特許第７４３０４３７号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

特許文献１の技術は、収集する項目を特定する指示をはじめ、収集に関する諸々の指示を含むプロンプトをＬＬＭに与えることで、ＯＣＲにより読み取ったチラシに印刷されていた一群の文字列から１以上の所定の項目に関する１以上の文字情報を収集する。

【0005】

特許文献１のような所望の情報を収集する技術において、正解例をＬＬＭに入力することで、より好適に所望の情報を抽出することができる場合がある。しかし、画像やＣＡＤやＢＩＭといった形式のデータから上述した正解例を的確に指定することは、容易ではないという問題がある。

【課題を解決するための手段】

【0006】

そこで、上記課題を解決するために本発明において、以下の情報処理装置などを提供する。すなわち、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第１プロンプト設定部と、前記設定した所望情報取得プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第１サンプル設定部と、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、を有する情報処理装置を提供する。

【0007】

また、前記特徴に加え、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を不正解情報として指定する不正解情報指定部を、さらに有する情報処理装置を提供する。

【0008】

また、前記特徴に加え、前記指定した正解情報を説明する正解情報説明プロンプトを設定する正解情報説明プロンプト設定部を、さらに有する情報処理装置を提供する。

【0009】

また、前記特徴に加え、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する第１所望情報取得部を、さらに有する情報処理装置を提供する。

【0010】

また、前記特徴に加え、前記第１所望情報取得部は、さらに前記指定した不正解情報を入力して、前記対象となるファイルデータから前記所望情報を取得する情報処理装置を提供する。

【0011】

また、前記特徴に加え、前記第１所望情報取得部は、さらに前記設定した正解情報説明プロンプトを入力して、前記対象となるファイルデータから前記所望情報を取得する情報処理装置を提供する。

【0012】

また、前記特徴に加え、前記設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する情報処理装置を提供する。

【0013】

また、前記特徴に加え、前記取得した所望情報を検証する検証部を、さらに有する情報処理装置を提供する。

【0014】

また、前記特徴に加え、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記所望情報を取得するための取得スクリプトを生成する取得スクリプト生成部を、さらに有する情報処理装置を提供する。

【0015】

また、前記特徴に加え、前記生成した取得スクリプトにより前記対象となるファイルデータから前記所望情報を取得する第２所望情報取得部を、さらに有する情報処理装置を提供する。

【0016】

また、前記特徴に加え、前記生成した取得スクリプトを蓄積する取得スクリプト蓄積部を、さらに有する情報処理装置を提供する。

【0017】

また、前記特徴に加え、前記生成した取得スクリプトにより対象となる項目を含むファイルデータから取得した所望情報を前記指定した正解情報と対比して評価する取得スクリプト評価部を、さらに有する情報処理装置を提供する。

【0018】

また、前記特徴に加え、前記取得スクリプト生成部は、前記取得スクリプト評価部による評価結果をさらに入力して前記取得スクリプトを生成する情報処理装置を提供する。

【0019】

また、前記特徴に加え、前記生成した取得スクリプトと、前記対象となる項目を含むファイルデータの一部または全部を前記学習済みＡＩモデルに入力し、前記生成した取得スクリプトを前記対象となるファイルデータに適応するよう修正する取得スクリプト修正部を、さらに有する情報処理装置を提供する。

【0020】

また、前記特徴に加え、前記取得スクリプト修正部は、さらに前記生成した取得スクリプトの元となる所望情報取得プロンプトを前記学習済みＡＩモデルに入力して修正する情報処理装置を提供する。

【0021】

【0022】

また、前記特徴に加え、前記取得した所望情報を検証する検証部を、さらに有する情報処理装置を提供する。

【0023】

また、前記特徴に加え、前記取得スクリプト修正部は、前記検証部による検証結果を反映させて取得スクリプトを修正する情報処理装置を提供する。

【0024】

対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第２プロンプト設定部と、前記設定したプロンプト生成プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第２サンプル設定部と、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、を有する情報処理装置を提供する。

【0025】

また、前記特徴に加え、前記設定したプロンプト生成プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記取得プロンプトを生成する取得プロンプト生成部を、さらに有する情報処理装置を提供する。

【0026】

また、前記特徴に加え、前記生成した取得プロンプトを前記学習済みＡＩモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する第３所望情報取得部を、さらに有する情報処理装置を提供する。

【0027】

また、前記特徴に加え、前記生成した取得プロンプトを蓄積する取得プロンプト蓄積部を、さらに有する情報処理装置を提供する。

【0028】

また、前記特徴に加え、前記生成した取得プロンプトにより前記正解サンプルファイルデータに対して前記所望情報を取得した結果を前記正解情報と比較して評価する取得プロンプト評価部を、さらに有する情報処理装置を提供する。

【0029】

また、前記特徴に加え、前記取得プロンプト生成部は、前記取得プロンプト評価部による評価結果を反映させて取得プロンプトを生成する情報処理装置を提供する。

【0030】

また、前記特徴に加え、前記第３所望情報取得部は、前記生成された取得プロンプトを生成するために入力された前記プロンプト生成プロンプトと前記正解サンプルファイルデータおよび正解情報をさらに入力して所望情報を取得する情報処理装置を提供する。

【0031】

また、前記特徴に加え、前記設定したプロンプト生成プロンプトにより取得プロンプトを生成するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する情報処理装置を提供する。

【0032】

また、前記特徴に加え、前記第３所望情報取得部により取得した取得結果を検証する検証部を、さらに有する情報処理装置を提供する。

【0033】

また、前記特徴に加え、前記取得プロンプト生成部は、前記検証部による検証結果を反映させて取得プロンプトを生成する情報処理装置を提供する。

【0034】

また、情報処理装置が実行する情報処理方法であって、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを設定する第１プロンプト設定ステップと、前記設定した取得プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第１サンプル設定ステップと、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、を有する情報処理方法を提供する。

【0035】

また、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを設定する第１プロンプト設定ステップと、前記設定した取得プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第１サンプル設定ステップと、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、を情報処理装置に実行させる情報処理プログラムを提供する。

【0036】

また、情報処理装置が実行する情報処理方法であって、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第２プロンプト設定ステップと、前記設定したプロンプト生成プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第２サンプル設定ステップと、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、を有する情報処理方法を提供する。

【0037】

また、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第２プロンプト設定ステップと、前記設定したプロンプト生成プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第２サンプル設定ステップと、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、を情報処理装置に実行させる情報処理プログラムを提供する。

【発明の効果】

【0038】

本発明により、所望の情報を学習済みＡＩモデルから出力させるための好ましい正解例を的確に指定することを容易なものとすることができる。

【図面の簡単な説明】

【0039】

【図1】実施例１の情報処理装置の機能的構成の一例を示すブロック図

【図2】正解サンプルファイルデータを表示するビューワーの一例を示す概念図

【図3】実施例１の情報処理装置を実現するハードウエアの構成例を示す概念図

【図4】実施例１の情報処理装置の処理の流れの一例を簡略に示すフロー図

【図5】実施例２の情報処理装置の機能的構成の一例を示すブロック図

【図6】実施例３の情報処理装置の機能的構成の一例を示すブロック図

【図7】実施例３の情報処理装置の処理の流れの一例を簡略に示すフロー図

【図8】詳細プロンプトの設定項目と設定例を示す図

【図9】詳細プロンプトの各設定項目が適用される方法を示す図

【図10】詳細プロンプトを設定するときの入力画面の一例を示す概念図

【図11】検証を行う際の種々の設定を例示する図

【図12】ＰＤＦ形式のファイルデータについて、位置情報を付与したテキストファイルに変換する例を示す概念図

【図13】ファイルデータの形式を変換する他の例を示す概念図

【図14】データ削減の他の態様について示す概念図

【図15】根拠として３Ｄモデル上の抽出範囲を表示する例を示す概念図

【発明を実施するための形態】

【0040】

以下、本発明の実施の形態について、添付図面を用いて説明する。なお、本発明は、これら実施形態に何ら限定されるべきものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施し得る。

【0041】

＜実施例１＞
＜概要＞
本発明は、様々なファイルデータ群を対象として、所望の情報を取得するにあたり、学習済みＡＩモデルにプロンプトなどと共に入力する正解例となるサンプルファイルデータをビューワーに表示し、そのデータ上の特定情報を指定することで正解となる情報を指定することができるものである。これにより、正解情報を容易に指定することができる。

【0042】

以下では、情報処理装置の機能および処理の流れ、並びにハードウエアの内容について説明する。なお、以下に記載する本システムの機能ブロックは、ハードウエアおよびソフトウェアの組み合わせとして実現され得る。具体的には、コンピュータを利用するものであれば、ＣＰＵ（中央演算装置）や主メモリ、バス、あるいは二次記憶装置（ハードディスクドライブや不揮発性メモリ、ＣＤやＤＶＤなどの記憶メディアとそれらメディアの読取ドライブなど）、情報入力に利用される入力デバイス、印刷機器や表示装置、その他の外部周辺装置などのハードウエア構成部、またその外部周辺装置用のインタフェース、通信用インタフェース、それらハードウエアを制御するためのドライバプログラムやその他アプリケーションプログラム、ユーザ・インターフェース用アプリケーションなどが挙げられる。そして主メモリ上に展開したプログラムに従ったＣＰＵの演算処理によって、入力デバイスやその他インタフェースなどから入力され、メモリやハードディスク上に保持されているデータなどが加工、蓄積されたり、上記各ハードウエアやソフトウェアを制御するための命令が生成されたりする。あるいは本システムの機能ブロックは専用ハードウエアによって実現されてもよい。

【0043】

また、この発明はシステムとして実現できるのみでなく、方法としても実現可能である。また、このような発明の一部をソフトウェアとして構成することができる。さらに、そのようなソフトウェアをコンピュータに実行させるために用いるプログラム、およびプログラムを固定した記録媒体も、当然にこの発明の技術的な範囲に含まれる（本明細書の全体を通じて同様である）。

【0044】

＜機能的構成＞
図１は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。図１に示すように、情報処理装置１００は、第１プロンプト設定部１０１と、第１サンプル設定部１０２と、正解情報指定部１０３と、第１所望情報取得部１０４と、を有する。

【0045】

本実施例において、学習済みＡＩモデルは、事前に学習して汎用的なタスクに対応できる機械学習モデルである。代表的なものとしてはＬＬＭがよく知られているが、小規模な言語モデルや画像やその他のフォーマットを扱えるマルチモーダルな言語モデルなどのように異なるものであってもよい。

【0046】

＜第１プロンプト設定部＞
第１プロンプト設定部１０１は、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する機能を有する。対象となるファイルデータは、本情報処理装置が備えるストレージにて蓄積したものでもよいし、本情報処理装置と通信回線等を介して接続するストレージにて蓄積されているものでもよい。また、ファイルデータのファイル形式は多種存在し限定するものではないが、例えば、ワードファイル、ＰＤＦ（Portable Document Format）ファイル、エクセルファイル、画像ファイル、ＣＳＶ（Comma Separated Values）ファイル、テキストファイル、ＢＩＭ（Building Information Modeling）ファイル、２ＤＣＡＤ（Computer Aided Design）ファイル、３Ｄモデルファイルなどがある。

【0047】

また、「所望情報」は、所望の項目の情報や、その項目の情報を何らかの演算・加工して得られる情報（総数、平均情報、最大情報、座標情報、距離や衝突などの空間的関係性、３次元モデル情報、３次元図形情報、画像、画像中の特定部分、画像の内容、文字情報など）を意味する。

【0048】

例えば、複数の建築物の設備に関するＣＳＶファイルを対象として、そのファイルデータ群から「エレベーターの総数」を所望する場合は、ファイルごとに含まれる建築物のエレベーターの数を抽出し、それらの数を合算した情報が所望情報となる。また、数情報の計算のみならず、３次元空間処理や２次元図形処理などの処理結果を所望情報として設定してもよい。例えば、複数の建築物の３次元モデルファイルを対象として、「柱と梁の衝突箇所」を所望する場合は、ファイルごとに含まれている柱と梁のモデルをすべて抽出し、それらの衝突の有無を計算し、衝突のある箇所を抽出した３次元空間の情報が所望情報となる。

【0049】

さらに例えば、複数の建築物の２次元図面ファイルを対象として、「立面図と平面図の不整合箇所」を所望する場合は、ファイルごとに含まれている立面と平面の建築設計情報をすべて抽出し、それらを３次元立体として再構成した際の整合性の有無を確認し、その不整合箇所を文章化したテキストが所望情報となる。

【0050】

所望情報取得プロンプトには、学習済みＡＩモデルへの指示だけでなく、適切な回答に導くための条件や参照すべき事例を含むことができる。例えば、ＢＩＭモデルの一部である「柱オブジェクト」を抽出する指示を与える所望情報取得プロンプトを設定する際には、
「“柱オブジェクト”の値を抽出してください。“柱オブジェクト”は建物のＢＩＭモデルの一部であり、縦に長く地面から垂直に伸びる３次元構造を持っています。」
といった文章を所望情報取得プロンプトとして設定する。

【0051】

また、所望情報取得プロンプトは一つに限られず複数設定することもできる。例えば、上記の「柱オブジェクト」を抽出するという指示の他に、「梁オブジェクト」の抽出や「昇降機の種類と台数」を抽出する指示を併せて設定することができる。そして、「梁オブジェクト」の抽出の場合は、
「”梁オブジェクト”の値を抽出してください。”梁オブジェクト”は建物のＢＩＭモデルの一部であり、横に長く地面から２ｍ以上離れた箇所に３次元構造を持っています」
といった文章により設定する。また、「昇降機の種類と台数」を抽出する場合は、
「ＢＩＭモデル内の昇降機の種類と台数を抽出してください。該当がない場合は空白を出力してください。」
といった文章により設定する。

【0052】

＜第１サンプル設定部＞
第１サンプル設定部１０２は、前記設定した所望情報取得プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する機能を有する。

【0053】

正解サンプルファイルデータは、対象となるファイルデータから所望情報を取得する際の見本となるファイルデータであり、その中に正解例となる正解情報を含むものである。例えば、室内の照度分布を所望情報として求める場合、照明などの設備が配置された室内を表したＢＩＭデータなどが正解サンプルファイルデータに該当する。このような正解サンプルファイルデータと、その中に表される照明が正解情報となる。

【0054】

また、対象となる複数の正解サンプルファイルデータに対して一つの正解情報が設定される場合だけでなく、複数の正解サンプルファイルデータに対して、それぞれの正解情報が設定される場合もある。例えば、柱と梁の情報を含む複数の建築構造についての３次元モデルファイルが正解サンプルファイルデータであって、各建築構造における「柱と梁の衝突箇所」が所望情報である場合には、各建築構造における実際の「柱と梁の衝突箇所」の数は「１」に限らず様々であり、それぞれの正解サンプルファイルデータごとに、それぞれの柱と梁の衝突箇所が正解情報として指定される。なお、この場合の正解情報は、衝突箇所を示す３次元画像上の座標情報であってもよいし、衝突箇所を囲み線で示すなどして明らかにした画像情報であってもよい。

【0055】

＜正解情報指定部＞
正解情報指定部１０３は、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する機能を有する。正解情報となる３次元空間モデル、２次元ベクターデータ、画像、表データ、数値、文章などをユーザが指定する操作は操作上専門性を要するが、本構成のようにビューワーを備えることにより、正解情報となる３次元モデルや３次元空間、２次元図形のパーツや、画像の領域、表データ上のセルなどを簡易に指定することができ有益である。

【0056】

図２は、正解サンプルファイルデータを表示するビューワーの一例を示す概念図である。図２（ａ）に示すように、ビューワー２０１には、正解サンプルファイルデータとして照明などの設備が配置された室内を表したＢＩＭデータが表示されている。このＢＩＭデータは、表示されている室内の寸法や材質、各設備（天井照明２０２、ブラケットライト２０３、ベンチ２０４、カウンター２０５）などのオブジェクトについての諸情報を含んでおり、それぞれ抽出可能となっている。

【0057】

ここで、所望情報が室内の照度分布であり、この正解サンプルファイルデータから正解情報として天井照明２０２を指定しようとする場合、例えば、図２（ｂ）に示すように、天井照明２０２を囲み線２０６で囲んで選択することにより、正解情報として指定することができる。また、併せて、ブラケットライト２０５についても同様に正解情報として指定することができる。このように、正解情報を指定することにより、天井照明およびブラケットライトそれぞれの照度や位置などの情報が特定され室内の照度分布を得るための正解情報となる。なお、この場合の正解情報の指定は、囲んで選択するのみではなく、直接３Ｄオブジェクトを選択し指定してもよい。

【0058】

正解情報の指定は正解サンプルファイルデータによって、様々な態様にて指定することができる。例えば、正解サンプルファイルデータが画像ファイルである場合には、画像ファイルを開くビューワー上で特定の範囲を選択することで、その範囲を抽出するべき正解情報とすることができる。また、ＣＡＤファイルを開くビューワー上で特定のレイヤーを選択することで、そのレイヤーを抽出するべき正解情報とすることができる。

【0059】

また、データ内に明示的に存在しない内容を指定することもあり得る。例えば、ビューワーでＢＩＭファイルを開き、そのビューワーで特定のオブジェクトと特定のオブジェクトの間のスペースを選択することで、そのオブジェクト間の距離を抽出するべき正解情報とすることができる。また、エクセルなどの表データをビューワー上で開き、特定のセルを選択することで、そのセルを抽出するべき正解情報とすることができる。

【0060】

上述したように、指定する正解情報は、数情報、３次元空間モデル、２次元図形、画像、文章など、どのようなフォーマットでもよい。また、演算処理の結果などを正解情報として指定しても良い。また、正解情報は所望する最終結果の情報のみならず、そこに至る処理過程における正解情報を与えてもよい。例えば、前述の３次元モデルから「柱と梁の衝突箇所」を抽出する例においては、（１）ファイルごとに含まれている柱と梁のモデル、（２）それらの衝突の有無、（３）衝突のある箇所を抽出した３次元空間の情報などを、処理過程における正解情報としてもよい。

【0061】

＜不正解情報指定部＞
不正解情報指定部は、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を不正解情報として指定する機能を有する。３Ｄモデルなどでは、正解情報のオブジェクトと紛らわしいオブジェクトが存在することがよくある。例えば、「空調ダクト」を抽出したい場合には、それらオブジェクトの付近には「給排水配管」、「配線ラック」などが配置されることがあり、これらは互いに似ているオブジェクトである。この際には、「空調ダクト」を正解として指定するのみではなく「給排水配管」や「配線ラック」を不正解として指定することで、学習済みＡＩが過剰に配管を検出することを避け、正確に目的の所望情報を取得することが出来る。

【0062】

また、正解情報がなく、不正解情報のみを含むファイルを正解サンプルファイルデータに設定することもありえる。

【0063】

＜正解情報説明プロンプト設定部＞
正解情報説明プロンプト設定部は、前記指定した正解情報を説明する正解情報説明プロンプトを設定する機能を有する。３Ｄモデルなどでは、正解情報のオブジェクトと紛らわしいオブジェクトが存在することがよくある。例えば、「空調ダクト」を抽出したい場合には、それらオブジェクトの付近には「給排水配管」「配線ラック」などが配置されることがあり、これらは互いに似ているオブジェクトである。この際には、「空調ダクト」を正解情報として指定するのみではなく、
”この正解サンプルファイルデータでは、この「空調ダクト」が目的となる所望情報の正解である。なぜなら、それらは細長い円柱状のモデルで有ることに加え、端部が「給気口」に接続されているからである。”
というように正解情報を説明するプロンプトを設定することで、学習済みＡＩが間違った情報を検出することを避け、正確に目的の所望情報を取得することが出来る。また、正解サンプルファイルデータと正解情報のペアが、複数で学習済みＡＩモデルにサンプルとして入力される場合には、このペア毎に正解情報説明プロンプトを設定しても良い。

【0064】

また、不正解情報指定部により不正解情報が指定されている場合には、この不正解情報についての説明を正解情報説明プロンプトに含めるように構成してもよい。

【0065】

なお、正解サンプルファイルデータは、第１所望情報取得部による取得の対象となる複数のファイルデータに対して当然少数となるケースが多いが、その逆の場合も有りうる。また、正解サンプルファイルデータは、取得の対象となる複数のファイルデータの一部であってもよいし、別のファイルデータであってもよい。正解サンプルファイルデータと正解情報の設定等はユーザが行うものであってもよいし、本装置をユーザに提供する者などにより予め設定等されるものであってもよい。

【0066】

＜第１所望情報取得部＞
第１所望情報取得部１０５は、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する機能を有する。

【0067】

対象となるファイルデータは学習済みＡＩモデルに入力され、所望情報取得プロンプトの指示により抽出対象が抽出され、必要に応じて演算等の加工がなされ、最終的に所望情報を取得する。また、後述する詳細プロンプトをさらに入力して抽出・取得することもできる。また、蓄積した所望情報取得プロンプトと詳細プロンプトを入力して抽出・取得することもできる。

【0068】

上述した「柱オブジェクト」を抽出する指示を与える所望情報取得プロンプトを入力した場合には、「柱オブジェクト」が抽出され、そのファイル名やファイルデータのサムネイル画像とともに出力することができる。そして、抽出した情報をタグ付けしてエクセルファイルに入力・保存したり、抽出した情報をデータベースに登録したりすることで、非構造化のファイルデータを検索・統計処理・ＡＩの学習データへの利用等に好適な構造化データとすることができる。

【0069】

また、抽出した情報をエクセルファイルなどに取り込んでデータベース化するだけでなく、抽出元のファイルデータの形式に応じて、抽出した情報を処理することもできる。例えば、ＣＳＶファイルの場合には、抽出した情報をそのＣＳＶファイル内部に新たなカラム（行）を加えて、追記して保存するようにしてもよい。また、エクセルファイルの場合には、抽出した情報をそのエクセルファイル内部に追加したカラムや追加したシートに追記して保存する。また、ＢＩＭファイルについては、抽出した情報を、そのＢＩＭファイル内部に追記して保存するようにしてもよい。

【0070】

また、様々なフォーマットの正解サンプルファイルデータと正解情報を入力することで、それらの各フォーマットでのファイルデータからも適切に情報の取得を行うことができる。この点は、後述する取得スクリプトや取得プロンプトにより所望情報を取得する場合においても、同様のことである。

【0071】

また、第１所望情報取得部は、さらに前記指定した不正解情報を入力して、前記対象となるファイルデータから前記所望情報を取得するように構成することができる。このような構成により、所望情報をより的確に取得することができる。

【0072】

また、第１所望情報取得部は、さらに前記設定した正解情報説明プロンプトを入力して、前記対象となるファイルデータから前記所望情報を取得するよういに構成することができる。このような構成により、所望情報をより的確に取得することができる。

【0073】

＜ハードウエア構成＞
図３は、実施例１の情報処理装置を実現するハードウエアの構成例を示す概念図である。図示するように、情報処理装置３００は、各種演算処理を行うＣＰＵ３０１と、揮発性記録媒体であるＲＡＭ３０２と、不揮発性の記憶媒体であるフラッシュメモリやＨＤＤなどのストレージ３０３と、通信インタフェース３０４と、入出力インタフェース３０５と、を有している。ＲＡＭ３０２は、各種演算処理を行うプログラムをＣＰＵ３０１に実行させるために読み出すとともに、そのプログラムのワーク領域（作業領域）を提供する。また、ＲＡＭ３０２には、複数のアドレスが割り当てられており、ＣＰＵ３０１で実行されるプログラムは、そのアドレスを特定しアクセスすることで相互にデータのやり取りを行い、処理を行うことが可能となっている（本明細書を通じて同様である）。

【0074】

ここで、図１の情報処理装置１００の第１プロンプト設定部１０１、第１サンプル設定部１０２および第１所望情報取得部１０４の各機能は、主に図３のＣＰＵ３０１、ＲＡＭ３０２により実現される。また、正解情報指定部１０３の機能は、主に図３のＣＰＵ３０１、ＲＡＭ３０２および入出力インタフェース３０５により実現される。また、対象となるファイルデータを蓄積するデータベースが外部に存在したり、第１所望情報取得部が外部に存在する学習済みＡＩモデルを用いたりする場合には、通信インタフェース３０４や入出力インタフェース３０５を介して相互に信号や情報の授受を行うことで各機能が実現される。また、図１には示されていない不正解情報指定部および正解情報説明プロンプト設定部の各機能は、ＣＰＵ３０１、ＲＡＭ３０２および入出力インタフェース３０５により実現される。

【0075】

＜処理の流れ＞
図４は、実施例１の情報処理装置の処理の流れの一例を簡略に示すフロー図である。まず、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する（Ｓ４０１：第１プロンプト設定ステップ）。そして、前記設定した所望情報取得プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する（Ｓ４０２：第１サンプル設定ステップ）。そして、前記設定した正解サンプルファイルデータをビューワーに表示する（Ｓ４０３：正解サンプルファイルデータ表示ステップ）。そして、前記表示されるデータ上の特定情報を正解情報として指定する（Ｓ４０４：正解情報指定ステップ）。そして、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する（Ｓ４０５：第１所望情報取得ステップ）。なお、正解情報指定ステップは、正解サンプルファイルデータ表示ステップを含むものとしてもよい。また、不正解情報指定ステップおよび正解情報説明プロンプト設定ステップを含むものとしてもよい。

【0076】

＜効果＞
本実施例の情報処理装置によれば、所望の情報を学習済みＡＩモデルから出力させるための好適な正解例を的確に指定することを容易なものとすることができる。

【0077】

＜実施例２＞
＜概要＞
本発明は、実施例１の情報処理装置において、所望情報取得プロンプトを正解情報などとともに学習済みＡＩモデルに入力して所望情報を取得する態様に代えて、所望情報取得プロンプトと正解情報などを学習済みＡＩモデルに入力することで生成するスクリプト（簡易的なプログラム）を実行することにより所望情報を取得するものである。

【0078】

＜機能的構成＞
図５は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。図５に示すように、情報処理装置５００は、第１プロンプト設定部５０１と、第１サンプル設定部５０２と、正解情報指定部５０３と、取得スクリプト生成部５０４と、取得スクリプト蓄積部５０５と、第２所望情報取得部５０６を有する。第１プロンプト設定部、第１サンプル設定部および正解情報指定部の各構成は実施例１における同名の構成と同様の機能を有するものであるので説明を省略する。

【0079】

＜取得スクリプト生成部＞
取得スクリプト生成部５０４は、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記所望情報を取得するための取得スクリプトを生成する機能を有する。

【0080】

実施例１において説明したように所望情報取得プロンプトは所望情報を取得するためのプロンプトであるところ、本実施例においては、正解例とともに学習済みＡＩモデルに入力して取得スクリプトを生成し、この取得スクリプトを実行させることで所望情報を取得するためのプロンプトとなる。例えば、
“種々の設備が配置された室内を表した複数のＢＩＭファイルを今からサンプルとして与えます。これらのＢＩＭファイルから、室内の各種の照明を抽出し、それらによる各室内の照明分布を求めるスクリプトを作ってください。”
というもので、所望情報である室内の照明分布を算出するための取得スクリプトの生成を指示するものとなっている。

【0081】

また、取得スクリプトによる所望情報を取得するためのプロセスが複雑になる場合には、複数ステップに分けて取得スクリプトを生成するように所望情報取得プロンプトを設定してもよい。例えば、３次元モデルから「柱と梁の衝突箇所」を抽出する例においては、（１）ファイルごとに含まれている柱と梁のモデルを抽出する取得スクリプトを生成する所望情報取得プロンプト、（２）それらの衝突の有無を確認する取得スクリプトを生成する所望情報取得プロンプト、（３）衝突のある箇所を抽出した３次元空間の情報を取得する取得スクリプトを生成する所望情報取得プロンプトなどに分割し、各ステップでの取得スクリプトを生成する所望情報取得プロンプトを設定してもよい。

【0082】

＜取得スクリプト蓄積部＞
取得スクリプト蓄積部５０５は、前記生成した取得スクリプトを蓄積する機能を有する。取得スクリプト蓄積部を持つことで、一度生成した取得スクリプトを再利用することができ、大量の対象となるファイルデータから再現性を持って値を取得することが可能となる。また、生成した取得スクリプトを用いて後述する第２所望情報取得部により取得した取得結果や、ともに入力した元の所望情報取得プロンプトおよび正解サンプルファイルデータなどと関連付けて蓄積してもよい。

【0083】

＜第２所望情報取得部＞
第２所望情報取得部５０６は、前記生成した取得スクリプトにより前記対象となるファイルデータから前記所望情報を取得する機能を有する。上述した対象となるファイルデータに対して生成した取得スクリプトを実行して、所望情報を取得する処理を行う。取得した結果は保存することが好ましい。これは、後述するように、取得結果を検証したりするなどの後処理に取得結果を供するためである。

【0084】

また、第２所望情報取得部で取得された所望情報を、新たな対象となるファイルデータとして、別の取得スクリプトへ渡してもよい。つまり、本発明における取得スクリプトの生成と対象ファイルデータからの所望情報の取得は連結させることができ、より複雑な処理を構成することも可能である。

【0085】

以上のように、取得スクリプトの実行により所望情報を取得する処理を行うので、学習済みＡＩモデルを都度呼び出して、所望の情報を取得しようとする場合に対して、要する時間とコストを抑えることができ、また一定の抽出精度で再現性のある情報の抽出ができる。

【0086】

さらに、「その課題を解決するために静的なスクリプトを用意しようとしても、専門的な知識のあるエンジニアでしか自分でスクリプトを作れない」という問題があったが、学習済みＡＩモデルで取得スクリプトを生成することで、誰でも自ら取得スクリプトを作成することができるという効果を得ることができる。

【0087】

＜ハードウエア構成＞
本実施例の情報処理装置は、実施例１に準じ図３に示したハードウエア構成により実現することができる。図５に示した実施例２の情報処理装置５００に特有の構成である取得スクリプト生成部５０４および第２所望情報取得部５０６の機能は、主に図３のＣＰＵ３０１、ＲＡＭ３０２により実現される。また、取得スクリプト蓄積部５０５の機能は、主に図３のストレージ３０３により実現される。

【0088】

＜処理の流れ＞
本実施例の情報処理装置の処理の流れは、実施例１の情報処理装置の処理の流れにおける正解情報指定ステップ（Ｓ４０４）まで基本的に同様である。そして、設定した所望情報取得プロンプトと、設定した正解サンプルファイルデータおよび指定した正解情報とを学習済みＡＩモデルに入力して、所望情報を取得するための取得スクリプトを生成する取得スクリプト生成ステップと、生成した取得スクリプトを蓄積する取得スクリプト蓄積ステップと、生成した取得スクリプトにより対象となるファイルデータから所望情報を取得する第２所望情報取得ステップと、をさらに含む。なお、取得スクリプト蓄積ステップは第２所望情報取得ステップの後に行うものとしてもよい。

【0089】

＜効果＞
本実施例の情報処理装置によれば、正解例を的確に指定することを容易にするとともに、学習済みＡＩモデルを都度呼び出して、所望の情報を取得しようとする場合に対して、要する時間とコストを抑えることができる。

【0090】

＜実施例３＞
＜概要＞
本発明は、様々なファイルデータ群を対象として、所望の情報を取得するにあたり学習済みＡＩモデルに入力されるプロンプト（以下、取得プロンプトという）を、所望の情報を取得するための正解例となる正解サンプルファイルデータと正解情報をプロンプトとともに学習済みＡＩモデルに入力して生成するものである。これにより、不慣れなユーザであっても、取得プロンプトを好適に生成することができる。

【0091】

＜機能的構成＞
図６は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。図６に示すように、情報処理装置６００は、第２プロンプト設定部６０１と、第２サンプル設定部６０２と、正解情報指定部６０３と、取得プロンプト生成部６０４と、取得プロンプト蓄積部６０５と、第３所望情報取得部６０６と、を有する。

【0092】

＜第２プロンプト設定部＞
第２プロンプト設定部６０１は、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する機能を有する。本構成における所望情報は、実施例１や実施例２において説明したとおりである。

【0093】

第２プロンプト設定部で設定されるプロンプト生成プロンプトと後述する正解サンプルファイルデータおよび正解情報とを取得プロンプト生成部に入力して取得プロンプトを生成するが、ここで設定するプロンプト生成プロンプトは、所望情報を指定し、正解サンプルファイルデータを参考にして取得プロンプトを生成せよ、といった形で設定してもよいし、あるいは、正解サンプルファイルデータから正解情報を取得するプロンプトを生成せよ、といった形で設定してもよい。

【0094】

例えば、上記の例のように「室内の照度分布」が所望情報である場合、“以下のサンプルファイルデータと正解情報を参考にして、複数のＢＩＭファイルのそれぞれについて室内の照明を全て抽出し、各照明についての諸情報から室内の照度分布を求めるプロンプト（取得プロンプト）を生成してください”といったようなプロンプト生成プロンプトを設定してする。

【0095】

また、所望情報を取得するためのプロセスが複雑になる場合には、複数ステップに分けて取得プロンプトを生成するようにプロンプト生成プロンプトを設定してもよい。例えば、前述の室内の照度分布を取得する例においては、（１）ファイルごとに含まれているすべての照明についての諸情報から照度分布の算出に必要な情報を抽出する取得プロンプトを生成するプロンプト、（２）抽出した情報を用いて室内の照度分布を算出する取得プロンプトを生成するプロンプトなどに分割し、各ステップでの取得プロンプトを生成するようプロンプト生成プロンプトを設定してもよい。

【0096】

＜第２サンプル設定部＞
第２サンプル設定部６０２は、前記設定したプロンプト生成プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する機能を有する。本構成における正解サンプルファイルデータは、実施例１や実施例２における正解サンプルファイルデータと同様である。

【0097】

＜正解情報指定部＞
正解情報指定部６０３は、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する機能を有する。本構成の機能は、実施例１や実施例２における正解情報指定部と同様である。

【0098】

また、実施例１で説明した不正解情報指定部や正解情報説明プロンプト設定部を備えるように構成することもできる。

【0099】

＜取得プロンプト生成部＞
取得プロンプト生成部６０４は、前記設定したプロンプト生成プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記取得プロンプトを生成する機能を有する。

【0100】

例えば、上述した照度分布を求めるために生成された取得プロンプトの場合、上述したプロンプト生成プロンプトと、実施例１などで説明したようなＢＩＭファイルやそのファイルにおいて指定された正解例とを学習済みＡＩモデルに入力することで、
“複数のＢＩＭファイルのそれぞれについて室内の照明を全て抽出し、各照明についての諸情報から室内の照度分布を求めるプロンプトを生成してください。なお、作業面の高さは、室内のオブジェクトの高さより１ｍｍ高く設定してください。”
といった取得プロンプトが生成される。

【0101】

また、取得プロンプトの生成には、プロンプトの生成のみに限らず、同時に静的なスクリプトの生成を伴う場合もあり、その際には静的スクリプトにより安定して高速に対象となるファイルデータから所望情報を取得できる。また、生成されたプロンプトがスクリプトを呼ぶ場合や、スクリプトがプロンプㇳを呼ぶ場合もある。

【0102】

また、不正解情報指定部により指定した不正解情報や正解情報説明プロンプト設定部により設定した正解情報説明プロンプトを、さらに学習済みＡＩモデルに入力して取得プロンプトを生成するように構成してもよい。

【0103】

＜取得プロンプト蓄積部＞
取得プロンプト蓄積部６０５は、前記生成した取得プロンプトを蓄積する機能を有する。取得プロンプト蓄積部を持つことで、一度生成した取得プロンプトを再利用することができ、大量の対象となるファイルデータから再現性を持って値を取得することが可能となる。また、生成した取得プロンプトを用いて後述する第３所望情報取得部により取得した取得結果や、生成のために入力した元のプロンプト生成プロンプトや正解サンプルファイルデータおよび正解情報と関連付けて蓄積してもよい。

【0104】

＜第３所望情報取得部＞
第３所望情報取得部６０６は、前記生成した取得プロンプトを前記学習済みＡＩモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する機能を有する。取得した結果は保存することが好ましい。これは、後述するように、取得結果を検証したり、再整形したりするなどの後処理に取得結果を供するためである。なお、第３所望情報取得部で用いられる学習済みＡＩモデルは、取得プロンプト生成部で用いられる学習済みＡＩモデルと同じものであってもよいし、異なるものであってもよい。

【0105】

また、第３所望情報取得部は、前記生成された取得プロンプトを生成するために入力された前記プロンプト生成プロンプトと前記正解サンプルファイルデータおよび正解情報をさらに入力して所望情報を取得するように構成することもできる。あるいは、指定された不正解情報と設定された正解情報説明プロンプトをさらに入力して所望情報を取得するように構成することもできる。このように構成することで、所望情報を取得するのに好適な取得プロンプトの生成を容易に行うことができる。

【0106】

また、第３所望情報取得部で取得された所望情報を、新たな対象となるファイルデータとして、別の取得プロンプトによる処理へ渡してもよい。つまり、本発明における取得プロンプトの生成と対象ファイルからの所望情報の取得は連結させることができ、より複雑な処理を構成することも可能である。

【0107】

＜ハードウエア構成＞
実施例３の情報処理装置は、図３に示した実施例１の情報処理装置を実現するハードウエアにより実現することができる。すなわち、図６の情報処理装置６００の第２プロンプト設定部６０１、第２サンプル設定部６０２、正解情報指定部６０３、取得プロンプト生成部６０４および第３所望情報取得部６０６の各機能は、主に図３のＣＰＵ３０１、ＲＡＭ３０２により実現される。また、取得プロンプト蓄積部６０５の機能は、主に図３のストレージ３０３により実現される。また、対象となるファイルデータを蓄積するデータベースが外部に存在したり、取得プロンプト生成部や第３所望情報取得部が外部に存在する学習済みＡＩモデルを用いたりする場合には、通信インタフェース３０４や入出力インタフェース３０５を介して相互に信号や情報の授受を行うことで各機能が実現される。

【0108】

＜処理の流れ＞
図７は、実施例３の情報処理装置の処理の流れの一例を簡略に示すフロー図である。まず、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する（Ｓ７０１：第２プロンプト設定ステップ）。そして、前記設定したプロンプト生成プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する（Ｓ７０２：第２サンプル設定ステップ）。そして、前記設定した正解サンプルファイルデータをビューワーに表示する（Ｓ７０３：正解サンプルファイルデータ表示ステップ）。そして、前記表示されるデータ上の特定情報を正解情報として指定する（Ｓ７０４：正解情報指定ステップ）。そして、前記設定したプロンプト生成プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みＡＩモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する（Ｓ７０５：第３所望情報取得ステップ）。なお、正解情報指定ステップは、正解サンプルファイルデータ表示ステップを含むものとしてもよい。

【0109】

＜効果＞
本実施例の情報処理装置によれば、正解例を的確に指定することを容易にするとともに、所望の情報を抽出するための好適なプロンプトの作成を、不慣れなユーザにとっても容易なものとすることができる。

【0110】

＜付加機能＞
以下に、上述した実施例１から実施例３のいずれかに付加することができる機能を説明する。まずは、実施例１に付加できる機能を説明する。実施例２や実施例３にも付加することができる場合には、その旨説明する。

【0111】

＜詳細プロンプト設定部＞
詳細プロンプト設定部は、前記設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する機能を有する。

【0112】

図８は、詳細プロンプトの一例を示す図である。図示するように、本例では所望情報取得プロンプトが「“図面番号”の値を抽出してください。」であり、このプロンプトの指示を詳細に設定する項目として、「Ｎｏ」、「名称」、「説明」、「必要性」および「例」の各設定項目が示されている。

【0113】

例えば設定項目１は、「複数タグ名の付与」という名称であり、「文字表記のブレへの対応」のための設定項目であることが示されている。また、その説明として「抽出するデータ項目名を複数明示的に付与する」と示され、その例として「[“図面番号”,“図面ＩＤ”]」が示されている。この詳細プロンプトを設定することで、「“図面番号”の値を抽出してください。」という指示について「図面番号」だけでなく、「図面ＩＤ」と記されたものも抽出の対象にする指示が付加される。

【0114】

他にも詳細プロンプトの設定項目として、文字表記のブレへの対応として、抽出するデータ項目名の説明を付与する「タグの説明の付与」、抽出対象範囲の絞り込みのために、画像上でデータ項目が存在する範囲を指定する「絶対位置の指定」と、複数ページのＰＤＦなどで何ページにあるか指定する「対象ページの指定」、誤抽出の抑制のために、抽出した値に近いサンプル群、もしくは遠いサンプル群を指定する「サンプル指定」、誤抽出の抑制と出力結果のフォーマット統一のために、ユーザは抽出したいフォーマットを指定できる「フォーマット指定」、表形式フォーマットへの対応として、何かしらの内容に対して、相対的な位置を指定できる「相対位置の指定」および、すべてのファイルに抽出したい内容が無い場合の対応として、特定の条件によって、抽出内容を変更する「条件設定」がある。もちろん、これらに限らずユーザが自ら種々の設定項目を設けて詳細プロンプトの設定を行うことができる。

【0115】

ここで、上述した各設定項目の適用方法であるが、大別すると、方法１の「ファイル内容を絞る」、方法２の「プロンプトを繋げる」および方法３の「検出結果を確認し、再整形する」の３つ分けることができる。方法１は、学習済みＡＩモデルに入力する前に入力の対象となるファイルデータを絞り込むことを意味し、方法２は、設定した詳細プロンプトをメインプロンプトに繋げることを意味する。方法３は、抽出結果を、指定されたサンプルやフォーマットなどに応じて再整形することを意味する。

【0116】

図９は、詳細プロンプトの各設定項目が適用される方法を示す図である。図示するように、「複数タグ名の付与」、「タグ説明の付与」および「条件設定」の各項目は、方法２の「プロンプトを繋げる」が適用される。また、「絶対位置の指定」と「対象ページの指定」は、方法１の「ファイル内容を絞る」と方法２が適用される。また、「サンプル指定」は、方法２と方法３の「抽出結果を確認し、再整形する」が適用される。そして、「フォーマット指定」と「相対位置の指定」は、方法１～方法３のすべてが適用される。適用例については後述する。

【0117】

図１０は、詳細プロンプトを設定するときの入力画面の一例を示す概念図である。図示するように、画面１００１の上部左側には既に設定されている所望情報取得プロンプト１００２が表示されている。そして、画面の左側に「タグ名」、「絶対位置指定」、「サンプル指定」および「相対位置指定」の各設定項目の入力欄１００３が表示されている。また、ユーザの操作によって、さらに別の設定項目の入力欄が表示される。これらの各入力欄に対するユーザの記入操作を受け付けることで、詳細プロンプトが設定される。そして、第１所望情報取得部は、詳細プロンプトの設定を適用して抽出する。このように詳細プロンプトを設定して抽出することで、抽出精度向上を図ることができる。

【0118】

以上のような詳細プロンプトを適用した例を示す。例えば、「サンプル指定」の項目において「D-00033,F-00102と似た内容です」と設定し、「相対位置指定」の項目において「この項目は、ページ左下にあります」と設定した場合、この詳細プロンプトが所望情報取得プロンプトに繋げられて入力される。そして、「相対位置指定」の適用により、学習済みＡＩモデルに入力するファイルデータについて、ページ左下のみを入力する（方法１：ファイル内容を絞る）。そして、「サンプル指定」の適用により、抽出された「図面番号」が「D-00033,F-00102」と似ている図面番号を抜き出す（方法３：抽出結果を確認し、再整形する）。このときの再整形は、学習済みＡＩモデルを用いてもよいし、別に再整形を指示するスクリプトを入力することによってもよい。

【0119】

また、詳細プロンプト設定部は、詳細プロンプトの設定を行うにあたり、設定された所望情報取得プロンプトに応じて自動的に各設定項目を設定するように構成することができる。あるいは、ユーザによる設定を受け入れつつ、設定されていない項目について、何らかの設定をお薦めするように構成してもよい。詳細プロンプトの設定をユーザから受け付けることで、ユーザの意向に柔軟かつ好適に情報の取得を行うことができるが、最適なプロンプトの設定を行うことがユーザにとって難しい場合もある。そこで、このように、詳細プロンプトの自動記入やサジェストの機能が有効である。これらの機能により、簡易化・操作性向上を図ることができる。

【0120】

また、簡易化・操作性向上を図るため、所望情報取得部は、対象となり得るファイルデータのすべてに対する取得の前に、設定した所望情報取得プロンプトによる、または設定した所望情報取得プロンプトと詳細プロンプトとによるテスト取得を行うよう構成することも好ましい。テスト取得とは、対象となり得るファイルデータのうちの一部に対して取得を行うことである。このテスト取得の結果により、ユーザは設定した所望情報取得プロンプトや詳細プロンプトが自ら所望する取得結果をもたらすものか否かの判断をすることができ、より望ましい取得結果を得るためのプロンプトの再設定を行うことができる。

【0121】

図１０に示すように、画面１００１の左側であって、詳細プロンプトの入力欄１００３と所望情報取得プロンプトの表示欄１００４の下に「テスト」ボタン１００５が表示され、このボタンによりテスト抽出が行われる。そして、テスト抽出の結果が、図中において説明のために記した点線枠１００６の中に表示されている。ユーザは、この抽出結果に基づき、プロンプトの再設定や、テスト抽出の結果が得られたプロンプトによる実際の抽出を行うことができる。

【0122】

詳細プロンプト設定部は、実施例２や実施例３においても付加構成として適用することができる。例えば、実施例２においては、設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトとして、上述の詳細プロンプトを設定する構成として適用することができる。また、実施例３においては、設定したプロンプト生成プロンプトにより取得プロンプトを生成するための詳細なプロンプトとして、上述の詳細プロンプトを設定する構成として適用することができる。

【0123】

＜検証部＞
検証部は、前記取得した所望情報を検証する機能を有する。検証部による検証の具体的な態様は種々ある。図１１は、検証を行う際の種々の設定を例示する図である。図示するように、４種の設定を行うことができ、それぞれ「詳細プロンプト利用」、「検証プロンプト」、「検証スクリプト」および「ファイル間比較」である。

【0124】

「詳細プロンプト利用」は、詳細プロンプトで設定した抽出の設定を検証に利用する。例えば、詳細プロンプトの設定項目である「サンプル指定」において、ネガティブサンプルの指定を行っていた場合、その指定されたネガティブサンプルを流用して、“抽出結果はネガティブサンプルに類似していないか？”という検証を行う。また、「相対位置の指定」での設定を利用して“抽出した値の左には、”屋上”という文字があるか？“という検証を行う。

【0125】

また、「検証プロンプト」は、検証用のプロンプトを独自に設定するものであり、例えば、“この値が、エレベーターの扉の素材を示しているかどうかチェックしてください”といったプロンプトを設定して入力する。また、「検証スクリプト」は、検証用のスクリプトを独自に設定するものであり、例えば、図示するように、抽出結果が「１」未満の場合に「Error」を返し、それ以外は「OK」を返す、といった命令を入力して検証する。

【0126】

また、「ファイル間比較」は、複数のファイルから抽出する際には、抽出結果を他ファイルと比較して妥当性を確認する。例示するように、抽出されたファイルＡ～ファイルＤを比較すると、ファイルＡ、ファイルＣ、ファイルＤはいずれも数字と記号のみの表記であるのに対して、ファイルＢは漢字主体の表記となっている。このような場合に、「ファイルＢは、他と比べて妥当ではない」という検証結果を得る。

【0127】

ここで、検証部により取得結果の検証をした場合、第１所望情報取得部は、その検証結果を反映させて再取得を行うように構成することもできる。例えば、上述したように抽出結果の値がエラーである場合、“前回の抽出では〇〇〇という値を抽出していましたが、エラーの検証結果がでました。このエラー結果を考慮し、再度値を抽出してください。”といった指示を入力して再度所望情報の取得を行う。

【0128】

検証部は、実施例２や実施例３においても付加構成として適用することができる。実施例２においては、第２所望情報取得部により取得した所望情報を検証する構成として適用でき、実施例３においては、第３所望情報取得部により取得した所望情報を検証する構成として適用できる。

【0129】

続いて、実施例２に付加することができる機能について説明する。

【0130】

＜取得スクリプト評価部＞
取得スクリプト評価部は、前記生成した取得スクリプトにより対象となる項目を含むファイルデータから取得した所望情報を前記指定した正解情報と対比して評価する機能を有する。この正解情報は、実施例１の第１サンプル設定部や正解情報指定部で述べた通りである。生成した取得スクリプトにより、正解サンプルファイルデータから実際に所望情報を取得して、その結果と正解情報を比較することで、どの程度正確な取得スクリプトであるかを評価することがきる。すなわち、取得した結果と正解情報とが合致すれば正確であると評価することができる。

【0131】

また、取得スクリプト生成部において、この評価結果をさらに学習済みＡＩモデルに入力するように構成することで、評価結果を踏まえた取得スクリプトを生成することができ、より正確な取得スクリプトの生成に役立たせることができる。例えば、取得した情報と正解情報が合致するまで取得スクリプトの再生成を続けるように構成することもできる。なお、取得スクリプトの評価は、取得スクリプト蓄積部に蓄積している取得スクリプトに対して行ってもよい。

【0132】

＜取得スクリプト修正部＞
取得スクリプト修正部は、前記生成した取得スクリプトと、前記対象となるファイルデータの一部または全部を前記学習済みＡＩモデルに入力し、前記生成した取得スクリプトを前記対象となるファイルデータに適応するよう修正する機能を有する。なお、修正に用いられる学習済みＡＩモデルは、上述した取得スクリプト生成部で用いられる学習済みＡＩモデルと同じものであってもよいし、別のものであってもよい。

【0133】

例えば、取得スクリプト作成の際に入力したサンプルファイルデータになかったファイル形式のファイルデータや取得すべき項目名などが対象となるファイルデータに含まれている場合には、所望情報を正確に取得できない場合が生じる。このような事態を防止するために、生成した取得スクリプトを対象となるファイルデータとともに学習済みＡＩモデルに入力する。

【0134】

そして、以下の例のようなプロンプトを与えることで、取得スクリプトを修正する。
「このスクリプトは、“ＢＩＭファイルから、建築物の３Ｄオブジェクトの一覧のうち柱オブジェクトを選択し、その総数を求めよ”という目的に沿って作られたスクリプトです。
ただし、この処理対象のファイルデータでは正常に動作しない可能性があります。正常に動作しない箇所を見つけ出し、スクリプトを修正してください。」
例えば、「柱オブジェクトの総数」を取得するために作成した取得スクリプトが、「柱」という値のプロパティを持つオブジェクトを抽出するスクリプトを実行させるものである場合、対象となるファイルデータに、「Ｐｉｌｌａｒ」という値のプロパティを持つ柱オブジェクトが含まれている場合には、このファイルデータの情報は取得の対象から漏れてしまい、正確な所望情報を得ることはできない。そこで、上記のようなプロンプトとともに作成済みの取得スクリプトと対象となるファイルデータとを学習済みＡＩモデルに入力することにより、対象となるファイルデータに適応した取得スクリプトの生成を行うことできる。

【0135】

ファイルデータに適応させるための修正は、対象となるファイルデータからファイルデータを一つずつ学習済みＡＩモデルに入力して行ってもよいし、すべてのファイルデータを学習済みＡＩモデルに入力して行ってもよい。また、修正する取得スクリプトを作成する元となった所望情報取得プロンプトをさらに入力してもよい。

【0136】

また、上述した取得スクリプト蓄積部により蓄積されている取得スクリプトについても、生成した取得スクリプトに対する修正と同じように修正するように構成することもできる。対象となるファイルデータが増減したり変わったりすることにより、蓄積した取得スクリプトについて修正が必要になることもあるので、これについて修正可能に構成することは好ましい。

【0137】

また、付加機能の一つとして説明した検証部を実施例２に適用した場合、取得スクリプト修正部は、この検証部による検証結果を反映させて取得スクリプトを修正するように構成することができる。例えば、上述したように取得結果の情報がエラーである場合、“前回の抽出では〇〇〇という情報を抽出していましたが、エラーの検証結果がでました。このエラー結果を考慮し、スクリプトを修正してください。”といったプロンプトを学習済みＡＩモデルに入力して取得スクリプトの修正を行う。

【0138】

続いて、実施例３に付加することができる機能について説明する。

【0139】

＜取得プロンプト評価部＞
取得プロンプト評価部は、前記生成した取得プロンプトにより前記正解サンプルファイルデータに対して前記所望情報を取得した結果を前記正解情報と比較して評価する機能を有する。実施例２の付加機能である取得スクリプト評価部と同様に、本構成においては生成した取得スクリプトを評価する。同様に、取得プロンプト生成部において、取得プロンプト評価部による評価結果をさらに学習済みＡＩモデルに入力するように構成し、評価結果を反映させた取得プロンプトを生成することができる。

【0140】

さらに、実施例１から実施例３のいずれにも付加することができる機能について説明する。

【0141】

＜フィルタリング部＞
フィルタリング部は、対象となるファイルデータのうち所定のファイルデータを、第１所望情報取得部から第３所望情報取得部のいずれかによる取得の対象から除去する機能を有する。フィルタリングする手法は種々存在する。例えば、ファイルの属性（拡張子、サイズ、ファイル名、ファイルに付随するデータ項目など）に基づきフィルタリングする。また、個別のキーワードを設定し、このキーワードに基づきフィルタリングする。具体的には、セマンティックサーチ、クラスタリング、文字検索などを行いフィルタリングするためのスクリプトを生成し、そのスクリプトを実行することによりフィルタリングがなされる。また、学習済みＡＩモデルに指示を与えてフィルタリングするようにしてもよい。例えば、“このファイルはエレベーターの内容を含んでいる？”という指示を入力することで、エレベーターの内容を含むか否かによりフィルタリングすることができる。

【0142】

このようなフィルタリング部の機能により、例えば、対象となる５００個のファイルデータのうち、構造モデルからは柱オブジェクトを取得したいが、設備モデルは対象としてスキップしたいといったユーザの要望に応えることができる。

【0143】

＜変換部＞
変換部は、ファイルデータの特性に応じて対象となるファイルデータの形式を変換する機能を有する。変換部を有する場合、第１所望情報取得部から第３所望情報取得部のいずれかは、変換部により変換したファイルデータから所望情報の取得を行う。例えば、ファイルデータがＰＤＦ形式である場合には、テキストファイルの形式に変換する。また、画像データの場合には、ＯＣＲにより文字認識をしてテキストファイルの形式に変換する。また３次元データの場合には２次元データや画像に変換してもよい。このような変換を行うことでロバスト性向上に寄与する。

【0144】

さらに、テキストファイルに変換する際に、テキストの位置情報を付与するように変換することも好ましい。図１２は、ＰＤＦ形式のファイルデータについて、位置情報を付与したテキストファイルに変換する例を示す概念図である。図１２（ａ）は、住宅の建築面積表を示すＰＤＦ形式のファイルの一部を示している。図１２（ｂ）は、「形状」、「計算式」、「面積」の各テキストを、それらの位置情報とともに記述したＪＳＯＮ形式に変換した例を示している。また、図１２（ｃ）は、同様にテキストを位置情報とともに記述したＡｒｒａｙ形式に変換した例を示している。このように、位置情報を付与することで、テキスト間の関係性を考慮した抽出が行われ、ロバスト性向上に寄与する。また、図１２（ｄ）は、元のファイルにおいて「洋室１」、「洋室２」、「洋室３」のそれぞれの「面積」と「帖」を示した表を示していたテキストを、位置情報ではなくテーブル情報を持つテキスト（図中の点線枠内）に変換する例を示している。このように変換することで、テーブル構造を保持したまま取得の対象とすることができる。

【0145】

図１３は、ファイルデータの形式を変換する他の例を示す概念図である。図１３に示すように、図形を含むファイル（キッチン平面図）の場合は、ＳＶＧ形式に変換し図形情報を持つテキストにしておくことで、スクリプトによる取得を行いやすくなる。また、逆に２次元のベクター情報をラスター画像のように変換してもよいし、３次元から２次元へのデータ変換などを行ってもよい。

【0146】

＜データ削減部＞
データ削減部は、対象となるファイルデータのデータ削減をする機能を有する。データ削減は様々な態様で行うことができる。例えば、対象となるファイルデータから特定の空間、プロパティ、エリア、特定のページやセクション、パラグラフ、テーブルなどに絞ることでデータ削減する。また、ファイルの属性（ページ番号、位置など）でフィルタリングしたり、個別のキーワードでフィルタリングしたり（セマンティックサーチ、クラスタリング、文字検索）、空間の位置（ｘ,ｙ,ｚ,座標）でフィルタリングしたりすることができる。また、学習済みＡＩモデルに指示を入力してフィルタリングすることもできる（“このファイルはエレベーターの内容を含んでいる？）。

【0147】

図１４は、データ削減の他の態様について示す概念図である。図１４（ａ）に示すように、一のファイルデータ１４０１において特定の箇所１４０２を切り取って、その中に目的のデータが含まれているかをチェックする。その結果、目的のデータが含まれていれば、その箇所を第１所望情報取得部から第３所望情報取得部のいずれかの取得処理に供する。含まれなかった場合には、先の箇所からずらした箇所１４０３を切り取って、同様にチェックを行う。このように取得する前のチェックで目的のデータを含まないものを取得の対象から除外することで処理効率の向上を図ることができる。なお、このチェックは、スクリプトの実行により行ってもよいし、学習済みＡＩモデルを用いて行ってもよいし、その他の手法によってもよい。また、このような処理は３次元空間上で実施してもよい。

【0148】

また、図１４（ｂ）に示すように、特定の箇所をずらしながら上述のチェックを行い、目的のデータを含む箇所をメモリ１４０４に一時保管する。そして、処理メモリ１４０４が目的のデータを取得するために必要な要素をすべて含んでいるかチェックし、すべて含んでいる場合は、メモリに保持されている箇所を第１所望情報取得部から第３所望情報取得部のいずれかでの取得処理に供する。一方、すべて含んでいない場合には、特定の箇所をさらにずらして上述のチェックからの一連の処理を繰り返す。

【0149】

＜根拠表示部＞
根拠表示部は、第１所望情報取得部から第３所望情報取得部のいずれかにより取得した取得結果について、その取得結果が取得された根拠を表示する機能を有する。

【0150】

各実施例の情報処理装置において、所望情報の取得は、それぞれのプロセスを経て行われる。例えば、実施例２においては、所望情報取得プロンプトと正解サンプルファイルデータおよび正解情報を学習済みＡＩモデルに入力して生成した取得スクリプトを、学習済みＡＩモデルに入力して所望情報を取得する。ここで、所望情報を得るのに最適な取得スクリプトを生成するための所望情報取得プロンプトの設定が難しい場合も有る。そこで、取得結果に至った根拠（途中プロセスなど）を表示することで、ユーザに対して「何をどうすれば取得結果を改善できるか」ということを示すことができる。

【0151】

図１５は、根拠として３Ｄモデル上の抽出範囲を表示する例を示す概念図である。図示しているのは、建築物を表す３Ｄモデルであり、このモデルから取得された情報（柱オブジェクト）の位置を３Ｄ上で太点線の枠１５０１で囲んで強調表示している。これにより、ユーザは取得結果がどこから取得されたかが分かる。また、３次元モデルを処理する取得スクリプトなどでは、その取得スクリプトの処理過程の表示や、その際に利用された情報の強調表示などをすることも根拠の確認に有用である。

【0152】

また、取得した理由を説明する表示をしてもよい。例えば、事前処理として取得前に学習済みＡＩモデルに「この情報を取得結果として出力した理由を、詳細のプロセスごとに出力してください」という指示を入力しておく。すると、取得した後に取得結果を示すとともに、例えば「室内の各種の照明は天井付近に配置されており、オブジェクト名に”照明”という文字が含まれているため、これらのオブジェクトを照明として抽出しました」という根拠が表示される。このように、自ら設定した所望情報取得プロンプトと、それにより生成された取得スクリプトが取得結果に及ぼす作用が示されることで、ユーザは種々の設定について省みることができ所望情報取得の最適化に資することができる。実施例１や実施例３においても同様に、所望情報の取得に至った根拠や途中プロセスを表示することは有用である。

【符号の説明】

【0153】

１００、５００、６００：情報処理装置
１０１、５０１：第１プロンプト設定部
１０２、５０２：第１サンプル設定部
１０３、５０３、６０３：正解情報指定部
１０４：第１所望情報取得部
５０４：取得スクリプト生成部
５０５：取得スクリプト蓄積部
５０６：第２所望情報取得部
６０１：第２プロンプト設定部
６０２：第２サンプル設定部
６０４：取得プロンプト生成部
６０５：取得プロンプト蓄積部
６０６：第３所望情報取得部
３０１：ＣＰＵ
３０２：ＲＡＭ
３０３：ストレージ
３０４：通信インタフェース
３０５：入出力インタフェース

【要約】

【課題】学習済みＡＩモデルを用いて所望の情報を抽出する際に、正解例を入力することで好適に所望の情報を抽出することができる場合があるが、画像やＣＡＤやＢＩＭといった形式のデータから正解例を的確に指定することは容易ではないという問題がある。
【解決手段】上記課題を解決するために、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第１プロンプト設定部と、前記設定した所望情報取得プロンプトとともに学習済みＡＩモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第１サンプル設定部と、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、を有する情報処理装置などを提供する。

【図1】