(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-10-08
(45)【発行日】2024-10-17
(54)【発明の名称】情報処理装置、情報処理方法および情報処理プログラム
(51)【国際特許分類】
G06F 16/903 20190101AFI20241009BHJP
G06N 20/00 20190101ALI20241009BHJP
【FI】
G06F16/903
G06N20/00
(21)【出願番号】P 2024545259
(86)(22)【出願日】2024-07-29
(86)【国際出願番号】 JP2024027006
【審査請求日】2024-07-30
【早期審査対象出願】
(73)【特許権者】
【識別番号】523434100
【氏名又は名称】株式会社テクトム
(74)【代理人】
【識別番号】230116816
【氏名又は名称】成川 弘樹
(74)【代理人】
【識別番号】100159248
【氏名又は名称】齋藤 修
(74)【代理人】
【識別番号】100174850
【氏名又は名称】大崎 絵美
(72)【発明者】
【氏名】北村 尚紀
(72)【発明者】
【氏名】ハミルトン フランシス ニルス
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特開2021-189835(JP,A)
【文献】中国特許出願公開第117709483(CN,A)
【文献】中国特許出願公開第117763128(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第1プロンプト設定部と、
前記設定した所望情報取得プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第1サンプル設定部と、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、
を有する情報処理装置。
【請求項2】
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を不正解情報として指定する不正解情報指定部を、さらに有する請求項1に記載の情報処理装置。
【請求項3】
前記指定した正解情報を説明する正解情報説明プロンプトを設定する正解情報説明プロンプト設定部を、さらに有する請求項
2に記載の情報処理装置。
【請求項4】
前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、
前記ファイルデータから前記所望情報を取得する第1所望情報取得部を、さらに有する請求項
3に記載の情報処理装置。
【請求項5】
前記第1所望情報取得部は、さらに前記指定した不正解情報を入力して、
前記ファイルデータから前記所望情報を取得する請求項4に記載の情報処理装置。
【請求項6】
前記第1所望情報取得部は、さらに前記設定した正解情報説明プロンプトを入力して、
前記ファイルデータから前記所望情報を取得する請求項4または5に記載の情報処理装置。
【請求項7】
前記設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する請求項1または2に記載の情報処理装置。
【請求項8】
前記取得した所望情報を検証する検証部を、さらに有する請求項4または5に記載の情報処理装置。
【請求項9】
前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記所望情報を取得するための取得スクリプトを生成する取得スクリプト生成部と、を有する請求項1に記載の情報処理装置。
【請求項10】
前記生成した取得スクリプトにより
前記ファイルデータから前記所望情報を取得する第2所望情報取得部を、さらに有する請求項9に記載の情報処理装置。
【請求項11】
前記生成した取得スクリプトを蓄積する取得スクリプト蓄積部を、さらに有する請求項9または10に記載の情報提供装置。
【請求項12】
前記生成した取得スクリプトにより
前記ファイルデータから取得した所望情報を前記指定した正解情報と対比して評価する取得スクリプト評価部を、さらに有する請求項10に記載の情報処理装置。
【請求項13】
前記取得スクリプト生成部は、前記取得スクリプト評価部による評価結果をさらに入力して前記取得スクリプトを生成する請求項12に記載の情報処理装置。
【請求項14】
前記生成した取得スクリプトと、
前記ファイルデータの一部または全部を前記学習済みAIモデルに入力し、前記生成した取得スクリプトを
前記ファイルデータに適応するよう修正する取得スクリプト修正部を、さらに有する請求項9または10に記載の情報処理装置。
【請求項15】
前記取得スクリプト修正部は、さらに前記生成した取得スクリプトの元となる所望情報取得プロンプトを前記学習済みAIモデルに入力して修正する請求項14に記載の情報処理装置。
【請求項16】
前記設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する請求項9または10に記載の情報処理装置。
【請求項17】
前記取得した所望情報を検証する検証部を、さらに有する請求項
15に記載の情報処理装置。
【請求項18】
前記取得スクリプト修正部は、前記検証部による検証結果を反映させて取得スクリプトを修正する請求項17に記載の情報処理装置。
【請求項19】
対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第2プロンプト設定部と、
前記設定したプロンプト生成プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第2サンプル設定部と、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、
を有する情報処理装置。
【請求項20】
前記設定したプロンプト生成プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記取得プロンプトを生成する取得プロンプト生成部を、さらに有する請求項19に記載の情報処理装置。
【請求項21】
前記生成した取得プロンプトを前記学習済みAIモデルに入力して、
前記ファイルデータから前記所望情報を取得する第3所望情報取得部を、さらに有する請求項20に記載の情報処理装置。
【請求項22】
前記生成した取得プロンプトを蓄積する取得プロンプト蓄積部を、さらに有する請求項20または21に記載の情報処装置。
【請求項23】
前記生成した取得プロンプトにより前記正解サンプルファイルデータに対して前記所望情報を取得した結果を前記正解情報と比較して評価する取得プロンプト評価部を、さらに有する請求項21に記載の情報処理装置。
【請求項24】
前記取得プロンプト生成部は、前記取得プロンプト評価部による評価結果を反映させて取得プロンプトを生成する請求項23に記載の情報処理装置。
【請求項25】
前記第3所望情報取得部は、前記生成
した取得プロンプトを生成するために入力された前記プロンプト生成プロンプトと前記正解サンプルファイルデータおよび正解情報をさらに入力して所望情報を取得する請求項21に記載の情報処理装置。
【請求項26】
前記設定したプロンプト生成プロンプトにより取得プロンプトを生成するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する請求項19または20に記載の情報処理装置。
【請求項27】
前記第3所望情報取得部により取得した取得結果を検証する検証部を、さらに有する請求項21に記載の情報処理装置。
【請求項28】
前記取得プロンプト生成部は、前記検証部による検証結果を反映させて取得プロンプトを生成する請求項27に記載の情報処理装置。
【請求項29】
情報処理装置が実行する情報処理方法であって、
対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第1プロンプト設定ステップと、
前記設定した所望情報取得プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第1サンプル設定ステップと、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、
を有する情報処理方法。
【請求項30】
対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第1プロンプト設定ステップと、
前記設定した所望情報取得プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第1サンプル設定ステップと、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報
を正解情報として指定する正解情報指定ステップと、
を情報処理装置に実行させる情報処理プログラム。
【請求項31】
情報処理装置が実行する情報処理方法であって、
対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第2プロンプト設定ステップと、
前記設定したプロンプト生成プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第2サンプル設定ステップと、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、
を有する情報処理方法。
【請求項32】
対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第2プロンプト設定ステップと、
前記設定したプロンプト生成プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第2サンプル設定ステップと、
前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、
を情報処理装置に実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、様々な情報を含むファイルデータ群から所望の情報を取得する情報処理装置に関する。
【背景技術】
【0002】
近年、ファイルデータ群から所定の情報を取得するために大規模言語モデル(以下、LLMと省略する場合がある。)を利用することが広がりつつある。例えば、特許文献1には、広告のチラシなどのように形式の定まっていない多様な印刷物から所定の項目に関する文字情報を収集するためにLLMを利用した技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の技術は、収集する項目を特定する指示をはじめ、収集に関する諸々の指示を含むプロンプトをLLMに与えることで、OCRにより読み取ったチラシに印刷されていた一群の文字列から1以上の所定の項目に関する1以上の文字情報を収集する。
【0005】
特許文献1のような所望の情報を収集する技術において、正解例をLLMに入力することで、より好適に所望の情報を抽出することができる場合がある。しかし、画像やCADやBIMといった形式のデータから上述した正解例を的確に指定することは、容易ではないという問題がある。
【課題を解決するための手段】
【0006】
そこで、上記課題を解決するために本発明において、以下の情報処理装置などを提供する。すなわち、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第1プロンプト設定部と、前記設定した所望情報取得プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第1サンプル設定部と、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、を有する情報処理装置を提供する。
【0007】
また、前記特徴に加え、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を不正解情報として指定する不正解情報指定部を、さらに有する情報処理装置を提供する。
【0008】
また、前記特徴に加え、前記指定した正解情報を説明する正解情報説明プロンプトを設定する正解情報説明プロンプト設定部を、さらに有する情報処理装置を提供する。
【0009】
また、前記特徴に加え、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する第1所望情報取得部を、さらに有する情報処理装置を提供する。
【0010】
また、前記特徴に加え、前記第1所望情報取得部は、さらに前記指定した不正解情報を入力して、前記対象となるファイルデータから前記所望情報を取得する情報処理装置を提供する。
【0011】
また、前記特徴に加え、前記第1所望情報取得部は、さらに前記設定した正解情報説明プロンプトを入力して、前記対象となるファイルデータから前記所望情報を取得する情報処理装置を提供する。
【0012】
また、前記特徴に加え、前記設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する情報処理装置を提供する。
【0013】
また、前記特徴に加え、前記取得した所望情報を検証する検証部を、さらに有する情報処理装置を提供する。
【0014】
また、前記特徴に加え、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記所望情報を取得するための取得スクリプトを生成する取得スクリプト生成部を、さらに有する情報処理装置を提供する。
【0015】
また、前記特徴に加え、前記生成した取得スクリプトにより前記対象となるファイルデータから前記所望情報を取得する第2所望情報取得部を、さらに有する情報処理装置を提供する。
【0016】
また、前記特徴に加え、前記生成した取得スクリプトを蓄積する取得スクリプト蓄積部を、さらに有する情報処理装置を提供する。
【0017】
また、前記特徴に加え、前記生成した取得スクリプトにより対象となる項目を含むファイルデータから取得した所望情報を前記指定した正解情報と対比して評価する取得スクリプト評価部を、さらに有する情報処理装置を提供する。
【0018】
また、前記特徴に加え、前記取得スクリプト生成部は、前記取得スクリプト評価部による評価結果をさらに入力して前記取得スクリプトを生成する情報処理装置を提供する。
【0019】
また、前記特徴に加え、前記生成した取得スクリプトと、前記対象となる項目を含むファイルデータの一部または全部を前記学習済みAIモデルに入力し、前記生成した取得スクリプトを前記対象となるファイルデータに適応するよう修正する取得スクリプト修正部を、さらに有する情報処理装置を提供する。
【0020】
また、前記特徴に加え、前記取得スクリプト修正部は、さらに前記生成した取得スクリプトの元となる所望情報取得プロンプトを前記学習済みAIモデルに入力して修正する情報処理装置を提供する。
【0021】
また、前記特徴に加え、前記設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する情報処理装置を提供する。
【0022】
また、前記特徴に加え、前記取得した所望情報を検証する検証部を、さらに有する情報処理装置を提供する。
【0023】
また、前記特徴に加え、前記取得スクリプト修正部は、前記検証部による検証結果を反映させて取得スクリプトを修正する情報処理装置を提供する。
【0024】
対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第2プロンプト設定部と、前記設定したプロンプト生成プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第2サンプル設定部と、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、を有する情報処理装置を提供する。
【0025】
また、前記特徴に加え、前記設定したプロンプト生成プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記取得プロンプトを生成する取得プロンプト生成部を、さらに有する情報処理装置を提供する。
【0026】
また、前記特徴に加え、前記生成した取得プロンプトを前記学習済みAIモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する第3所望情報取得部を、さらに有する情報処理装置を提供する。
【0027】
また、前記特徴に加え、前記生成した取得プロンプトを蓄積する取得プロンプト蓄積部を、さらに有する情報処理装置を提供する。
【0028】
また、前記特徴に加え、前記生成した取得プロンプトにより前記正解サンプルファイルデータに対して前記所望情報を取得した結果を前記正解情報と比較して評価する取得プロンプト評価部を、さらに有する情報処理装置を提供する。
【0029】
また、前記特徴に加え、前記取得プロンプト生成部は、前記取得プロンプト評価部による評価結果を反映させて取得プロンプトを生成する情報処理装置を提供する。
【0030】
また、前記特徴に加え、前記第3所望情報取得部は、前記生成された取得プロンプトを生成するために入力された前記プロンプト生成プロンプトと前記正解サンプルファイルデータおよび正解情報をさらに入力して所望情報を取得する情報処理装置を提供する。
【0031】
また、前記特徴に加え、前記設定したプロンプト生成プロンプトにより取得プロンプトを生成するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する情報処理装置を提供する。
【0032】
また、前記特徴に加え、前記第3所望情報取得部により取得した取得結果を検証する検証部を、さらに有する情報処理装置を提供する。
【0033】
また、前記特徴に加え、前記取得プロンプト生成部は、前記検証部による検証結果を反映させて取得プロンプトを生成する情報処理装置を提供する。
【0034】
また、情報処理装置が実行する情報処理方法であって、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを設定する第1プロンプト設定ステップと、前記設定した取得プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第1サンプル設定ステップと、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、を有する情報処理方法を提供する。
【0035】
また、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを設定する第1プロンプト設定ステップと、前記設定した取得プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第1サンプル設定ステップと、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、を情報処理装置に実行させる情報処理プログラムを提供する。
【0036】
また、情報処理装置が実行する情報処理方法であって、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第2プロンプト設定ステップと、前記設定したプロンプト生成プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第2サンプル設定ステップと、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、を有する情報処理方法を提供する。
【0037】
また、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する第2プロンプト設定ステップと、前記設定したプロンプト生成プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第2サンプル設定ステップと、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定ステップと、を情報処理装置に実行させる情報処理プログラムを提供する。
【発明の効果】
【0038】
本発明により、所望の情報を学習済みAIモデルから出力させるための好ましい正解例を的確に指定することを容易なものとすることができる。
【図面の簡単な説明】
【0039】
【
図1】実施例1の情報処理装置の機能的構成の一例を示すブロック図
【
図2】正解サンプルファイルデータを表示するビューワーの一例を示す概念図
【
図3】実施例1の情報処理装置を実現するハードウエアの構成例を示す概念図
【
図4】実施例1の情報処理装置の処理の流れの一例を簡略に示すフロー図
【
図5】実施例2の情報処理装置の機能的構成の一例を示すブロック図
【
図6】実施例3の情報処理装置の機能的構成の一例を示すブロック図
【
図7】実施例3の情報処理装置の処理の流れの一例を簡略に示すフロー図
【
図9】詳細プロンプトの各設定項目が適用される方法を示す図
【
図10】詳細プロンプトを設定するときの入力画面の一例を示す概念図
【
図12】PDF形式のファイルデータについて、位置情報を付与したテキストファイルに変換する例を示す概念図
【
図13】ファイルデータの形式を変換する他の例を示す概念図
【
図15】根拠として3Dモデル上の抽出範囲を表示する例を示す概念図
【発明を実施するための形態】
【0040】
以下、本発明の実施の形態について、添付図面を用いて説明する。なお、本発明は、これら実施形態に何ら限定されるべきものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施し得る。
【0041】
<実施例1>
<概要>
本発明は、様々なファイルデータ群を対象として、所望の情報を取得するにあたり、学習済みAIモデルにプロンプトなどと共に入力する正解例となるサンプルファイルデータをビューワーに表示し、そのデータ上の特定情報を指定することで正解となる情報を指定することができるものである。これにより、正解情報を容易に指定することができる。
【0042】
以下では、情報処理装置の機能および処理の流れ、並びにハードウエアの内容について説明する。なお、以下に記載する本システムの機能ブロックは、ハードウエアおよびソフトウェアの組み合わせとして実現され得る。具体的には、コンピュータを利用するものであれば、CPU(中央演算装置)や主メモリ、バス、あるいは二次記憶装置(ハードディスクドライブや不揮発性メモリ、CDやDVDなどの記憶メディアとそれらメディアの読取ドライブなど)、情報入力に利用される入力デバイス、印刷機器や表示装置、その他の外部周辺装置などのハードウエア構成部、またその外部周辺装置用のインタフェース、通信用インタフェース、それらハードウエアを制御するためのドライバプログラムやその他アプリケーションプログラム、ユーザ・インターフェース用アプリケーションなどが挙げられる。そして主メモリ上に展開したプログラムに従ったCPUの演算処理によって、入力デバイスやその他インタフェースなどから入力され、メモリやハードディスク上に保持されているデータなどが加工、蓄積されたり、上記各ハードウエアやソフトウェアを制御するための命令が生成されたりする。あるいは本システムの機能ブロックは専用ハードウエアによって実現されてもよい。
【0043】
また、この発明はシステムとして実現できるのみでなく、方法としても実現可能である。また、このような発明の一部をソフトウェアとして構成することができる。さらに、そのようなソフトウェアをコンピュータに実行させるために用いるプログラム、およびプログラムを固定した記録媒体も、当然にこの発明の技術的な範囲に含まれる(本明細書の全体を通じて同様である)。
【0044】
<機能的構成>
図1は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。
図1に示すように、情報処理装置100は、第1プロンプト設定部101と、第1サンプル設定部102と、正解情報指定部103と、第1所望情報取得部104と、を有する。
【0045】
本実施例において、学習済みAIモデルは、事前に学習して汎用的なタスクに対応できる機械学習モデルである。代表的なものとしてはLLMがよく知られているが、小規模な言語モデルや画像やその他のフォーマットを扱えるマルチモーダルな言語モデルなどのように異なるものであってもよい。
【0046】
<第1プロンプト設定部>
第1プロンプト設定部101は、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する機能を有する。対象となるファイルデータは、本情報処理装置が備えるストレージにて蓄積したものでもよいし、本情報処理装置と通信回線等を介して接続するストレージにて蓄積されているものでもよい。また、ファイルデータのファイル形式は多種存在し限定するものではないが、例えば、ワードファイル、PDF(Portable Document Format)ファイル、エクセルファイル、画像ファイル、CSV(Comma Separated Values)ファイル、テキストファイル、BIM(Building Information Modeling)ファイル、2DCAD(Computer Aided Design)ファイル、3Dモデルファイルなどがある。
【0047】
また、「所望情報」は、所望の項目の情報や、その項目の情報を何らかの演算・加工して得られる情報(総数、平均情報、最大情報、座標情報、距離や衝突などの空間的関係性、3次元モデル情報、3次元図形情報、画像、画像中の特定部分、画像の内容、文字情報など)を意味する。
【0048】
例えば、複数の建築物の設備に関するCSVファイルを対象として、そのファイルデータ群から「エレベーターの総数」を所望する場合は、ファイルごとに含まれる建築物のエレベーターの数を抽出し、それらの数を合算した情報が所望情報となる。また、数情報の計算のみならず、3次元空間処理や2次元図形処理などの処理結果を所望情報として設定してもよい。例えば、複数の建築物の3次元モデルファイルを対象として、「柱と梁の衝突箇所」を所望する場合は、ファイルごとに含まれている柱と梁のモデルをすべて抽出し、それらの衝突の有無を計算し、衝突のある箇所を抽出した3次元空間の情報が所望情報となる。
【0049】
さらに例えば、複数の建築物の2次元図面ファイルを対象として、「立面図と平面図の不整合箇所」を所望する場合は、ファイルごとに含まれている立面と平面の建築設計情報をすべて抽出し、それらを3次元立体として再構成した際の整合性の有無を確認し、その不整合箇所を文章化したテキストが所望情報となる。
【0050】
所望情報取得プロンプトには、学習済みAIモデルへの指示だけでなく、適切な回答に導くための条件や参照すべき事例を含むことができる。例えば、BIMモデルの一部である「柱オブジェクト」を抽出する指示を与える所望情報取得プロンプトを設定する際には、
「“柱オブジェクト”の値を抽出してください。“柱オブジェクト”は建物のBIMモデルの一部であり、縦に長く地面から垂直に伸びる3次元構造を持っています。」
といった文章を所望情報取得プロンプトとして設定する。
【0051】
また、所望情報取得プロンプトは一つに限られず複数設定することもできる。例えば、上記の「柱オブジェクト」を抽出するという指示の他に、「梁オブジェクト」の抽出や「昇降機の種類と台数」を抽出する指示を併せて設定することができる。そして、「梁オブジェクト」の抽出の場合は、
「”梁オブジェクト”の値を抽出してください。”梁オブジェクト”は建物のBIMモデルの一部であり、横に長く地面から2m以上離れた箇所に3次元構造を持っています」
といった文章により設定する。また、「昇降機の種類と台数」を抽出する場合は、
「BIMモデル内の昇降機の種類と台数を抽出してください。該当がない場合は空白を出力してください。」
といった文章により設定する。
【0052】
<第1サンプル設定部>
第1サンプル設定部102は、前記設定した所望情報取得プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する機能を有する。
【0053】
正解サンプルファイルデータは、対象となるファイルデータから所望情報を取得する際の見本となるファイルデータであり、その中に正解例となる正解情報を含むものである。例えば、室内の照度分布を所望情報として求める場合、照明などの設備が配置された室内を表したBIMデータなどが正解サンプルファイルデータに該当する。このような正解サンプルファイルデータと、その中に表される照明が正解情報となる。
【0054】
また、対象となる複数の正解サンプルファイルデータに対して一つの正解情報が設定される場合だけでなく、複数の正解サンプルファイルデータに対して、それぞれの正解情報が設定される場合もある。例えば、柱と梁の情報を含む複数の建築構造についての3次元モデルファイルが正解サンプルファイルデータであって、各建築構造における「柱と梁の衝突箇所」が所望情報である場合には、各建築構造における実際の「柱と梁の衝突箇所」の数は「1」に限らず様々であり、それぞれの正解サンプルファイルデータごとに、それぞれの柱と梁の衝突箇所が正解情報として指定される。なお、この場合の正解情報は、衝突箇所を示す3次元画像上の座標情報であってもよいし、衝突箇所を囲み線で示すなどして明らかにした画像情報であってもよい。
【0055】
<正解情報指定部>
正解情報指定部103は、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する機能を有する。正解情報となる3次元空間モデル、2次元ベクターデータ、画像、表データ、数値、文章などをユーザが指定する操作は操作上専門性を要するが、本構成のようにビューワーを備えることにより、正解情報となる3次元モデルや3次元空間、2次元図形のパーツや、画像の領域、表データ上のセルなどを簡易に指定することができ有益である。
【0056】
図2は、正解サンプルファイルデータを表示するビューワーの一例を示す概念図である。
図2(a)に示すように、ビューワー201には、正解サンプルファイルデータとして照明などの設備が配置された室内を表したBIMデータが表示されている。このBIMデータは、表示されている室内の寸法や材質、各設備(天井照明202、ブラケットライト203、ベンチ204、カウンター205)などのオブジェクトについての諸情報を含んでおり、それぞれ抽出可能となっている。
【0057】
ここで、所望情報が室内の照度分布であり、この正解サンプルファイルデータから正解情報として天井照明202を指定しようとする場合、例えば、
図2(b)に示すように、天井照明202を囲み線206で囲んで選択することにより、正解情報として指定することができる。また、併せて、ブラケットライト205についても同様に正解情報として指定することができる。このように、正解情報を指定することにより、天井照明およびブラケットライトそれぞれの照度や位置などの情報が特定され室内の照度分布を得るための正解情報となる。なお、この場合の正解情報の指定は、囲んで選択するのみではなく、直接3Dオブジェクトを選択し指定してもよい。
【0058】
正解情報の指定は正解サンプルファイルデータによって、様々な態様にて指定することができる。例えば、正解サンプルファイルデータが画像ファイルである場合には、画像ファイルを開くビューワー上で特定の範囲を選択することで、その範囲を抽出するべき正解情報とすることができる。また、CADファイルを開くビューワー上で特定のレイヤーを選択することで、そのレイヤーを抽出するべき正解情報とすることができる。
【0059】
また、データ内に明示的に存在しない内容を指定することもあり得る。例えば、ビューワーでBIMファイルを開き、そのビューワーで特定のオブジェクトと特定のオブジェクトの間のスペースを選択することで、そのオブジェクト間の距離を抽出するべき正解情報とすることができる。また、エクセルなどの表データをビューワー上で開き、特定のセルを選択することで、そのセルを抽出するべき正解情報とすることができる。
【0060】
上述したように、指定する正解情報は、数情報、3次元空間モデル、2次元図形、画像、文章など、どのようなフォーマットでもよい。また、演算処理の結果などを正解情報として指定しても良い。また、正解情報は所望する最終結果の情報のみならず、そこに至る処理過程における正解情報を与えてもよい。例えば、前述の3次元モデルから「柱と梁の衝突箇所」を抽出する例においては、(1)ファイルごとに含まれている柱と梁のモデル、(2)それらの衝突の有無、(3)衝突のある箇所を抽出した3次元空間の情報などを、処理過程における正解情報としてもよい。
【0061】
<不正解情報指定部>
不正解情報指定部は、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を不正解情報として指定する機能を有する。3Dモデルなどでは、正解情報のオブジェクトと紛らわしいオブジェクトが存在することがよくある。例えば、「空調ダクト」を抽出したい場合には、それらオブジェクトの付近には「給排水配管」、「配線ラック」などが配置されることがあり、これらは互いに似ているオブジェクトである。この際には、「空調ダクト」を正解として指定するのみではなく「給排水配管」や「配線ラック」を不正解として指定することで、学習済みAIが過剰に配管を検出することを避け、正確に目的の所望情報を取得することが出来る。
【0062】
また、正解情報がなく、不正解情報のみを含むファイルを正解サンプルファイルデータに設定することもありえる。
【0063】
<正解情報説明プロンプト設定部>
正解情報説明プロンプト設定部は、前記指定した正解情報を説明する正解情報説明プロンプトを設定する機能を有する。3Dモデルなどでは、正解情報のオブジェクトと紛らわしいオブジェクトが存在することがよくある。例えば、「空調ダクト」を抽出したい場合には、それらオブジェクトの付近には「給排水配管」「配線ラック」などが配置されることがあり、これらは互いに似ているオブジェクトである。この際には、「空調ダクト」を正解情報として指定するのみではなく、
”この正解サンプルファイルデータでは、この「空調ダクト」が目的となる所望情報の正解である。なぜなら、それらは細長い円柱状のモデルで有ることに加え、端部が「給気口」に接続されているからである。”
というように正解情報を説明するプロンプトを設定することで、学習済みAIが間違った情報を検出することを避け、正確に目的の所望情報を取得することが出来る。また、正解サンプルファイルデータと正解情報のペアが、複数で学習済みAIモデルにサンプルとして入力される場合には、このペア毎に正解情報説明プロンプトを設定しても良い。
【0064】
また、不正解情報指定部により不正解情報が指定されている場合には、この不正解情報についての説明を正解情報説明プロンプトに含めるように構成してもよい。
【0065】
なお、正解サンプルファイルデータは、第1所望情報取得部による取得の対象となる複数のファイルデータに対して当然少数となるケースが多いが、その逆の場合も有りうる。また、正解サンプルファイルデータは、取得の対象となる複数のファイルデータの一部であってもよいし、別のファイルデータであってもよい。正解サンプルファイルデータと正解情報の設定等はユーザが行うものであってもよいし、本装置をユーザに提供する者などにより予め設定等されるものであってもよい。
【0066】
<第1所望情報取得部>
第1所望情報取得部105は、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する機能を有する。
【0067】
対象となるファイルデータは学習済みAIモデルに入力され、所望情報取得プロンプトの指示により抽出対象が抽出され、必要に応じて演算等の加工がなされ、最終的に所望情報を取得する。また、後述する詳細プロンプトをさらに入力して抽出・取得することもできる。また、蓄積した所望情報取得プロンプトと詳細プロンプトを入力して抽出・取得することもできる。
【0068】
上述した「柱オブジェクト」を抽出する指示を与える所望情報取得プロンプトを入力した場合には、「柱オブジェクト」が抽出され、そのファイル名やファイルデータのサムネイル画像とともに出力することができる。そして、抽出した情報をタグ付けしてエクセルファイルに入力・保存したり、抽出した情報をデータベースに登録したりすることで、非構造化のファイルデータを検索・統計処理・AIの学習データへの利用等に好適な構造化データとすることができる。
【0069】
また、抽出した情報をエクセルファイルなどに取り込んでデータベース化するだけでなく、抽出元のファイルデータの形式に応じて、抽出した情報を処理することもできる。例えば、CSVファイルの場合には、抽出した情報をそのCSVファイル内部に新たなカラム(行)を加えて、追記して保存するようにしてもよい。また、エクセルファイルの場合には、抽出した情報をそのエクセルファイル内部に追加したカラムや追加したシートに追記して保存する。また、BIMファイルについては、抽出した情報を、そのBIMファイル内部に追記して保存するようにしてもよい。
【0070】
また、様々なフォーマットの正解サンプルファイルデータと正解情報を入力することで、それらの各フォーマットでのファイルデータからも適切に情報の取得を行うことができる。この点は、後述する取得スクリプトや取得プロンプトにより所望情報を取得する場合においても、同様のことである。
【0071】
また、第1所望情報取得部は、さらに前記指定した不正解情報を入力して、前記対象となるファイルデータから前記所望情報を取得するように構成することができる。このような構成により、所望情報をより的確に取得することができる。
【0072】
また、第1所望情報取得部は、さらに前記設定した正解情報説明プロンプトを入力して、前記対象となるファイルデータから前記所望情報を取得するよういに構成することができる。このような構成により、所望情報をより的確に取得することができる。
【0073】
<ハードウエア構成>
図3は、実施例1の情報処理装置を実現するハードウエアの構成例を示す概念図である。図示するように、情報処理装置300は、各種演算処理を行うCPU301と、揮発性記録媒体であるRAM302と、不揮発性の記憶媒体であるフラッシュメモリやHDDなどのストレージ303と、通信インタフェース304と、入出力インタフェース305と、を有している。RAM302は、各種演算処理を行うプログラムをCPU301に実行させるために読み出すとともに、そのプログラムのワーク領域(作業領域)を提供する。また、RAM302には、複数のアドレスが割り当てられており、CPU301で実行されるプログラムは、そのアドレスを特定しアクセスすることで相互にデータのやり取りを行い、処理を行うことが可能となっている(本明細書を通じて同様である)。
【0074】
ここで、
図1の情報処理装置100の第1プロンプト設定部101、第1サンプル設定部102および第1所望情報取得部104の各機能は、主に
図3のCPU301、RAM302により実現される。また、正解情報指定部103の機能は、主に
図3のCPU301、RAM302および入出力インタフェース305により実現される。また、対象となるファイルデータを蓄積するデータベースが外部に存在したり、第1所望情報取得部が外部に存在する学習済みAIモデルを用いたりする場合には、通信インタフェース304や入出力インタフェース305を介して相互に信号や情報の授受を行うことで各機能が実現される。また、
図1には示されていない不正解情報指定部および正解情報説明プロンプト設定部の各機能は、CPU301、RAM302および入出力インタフェース305により実現される。
【0075】
<処理の流れ>
図4は、実施例1の情報処理装置の処理の流れの一例を簡略に示すフロー図である。まず、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する(S401:第1プロンプト設定ステップ)。そして、前記設定した所望情報取得プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する(S402:第1サンプル設定ステップ)。そして、前記設定した正解サンプルファイルデータをビューワーに表示する(S403:正解サンプルファイルデータ表示ステップ)。そして、前記表示されるデータ上の特定情報を正解情報として指定する(S404:正解情報指定ステップ)。そして、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する(S405:第1所望情報取得ステップ)。なお、正解情報指定ステップは、正解サンプルファイルデータ表示ステップを含むものとしてもよい。また、不正解情報指定ステップおよび正解情報説明プロンプト設定ステップを含むものとしてもよい。
【0076】
<効果>
本実施例の情報処理装置によれば、所望の情報を学習済みAIモデルから出力させるための好適な正解例を的確に指定することを容易なものとすることができる。
【0077】
<実施例2>
<概要>
本発明は、実施例1の情報処理装置において、所望情報取得プロンプトを正解情報などとともに学習済みAIモデルに入力して所望情報を取得する態様に代えて、所望情報取得プロンプトと正解情報などを学習済みAIモデルに入力することで生成するスクリプト(簡易的なプログラム)を実行することにより所望情報を取得するものである。
【0078】
<機能的構成>
図5は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。
図5に示すように、情報処理装置500は、第1プロンプト設定部501と、第1サンプル設定部502と、正解情報指定部503と、取得スクリプト生成部504と、取得スクリプト蓄積部505と、第2所望情報取得部506を有する。第1プロンプト設定部、第1サンプル設定部および正解情報指定部の各構成は実施例1における同名の構成と同様の機能を有するものであるので説明を省略する。
【0079】
<取得スクリプト生成部>
取得スクリプト生成部504は、前記設定した所望情報取得プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記所望情報を取得するための取得スクリプトを生成する機能を有する。
【0080】
実施例1において説明したように所望情報取得プロンプトは所望情報を取得するためのプロンプトであるところ、本実施例においては、正解例とともに学習済みAIモデルに入力して取得スクリプトを生成し、この取得スクリプトを実行させることで所望情報を取得するためのプロンプトとなる。例えば、
“種々の設備が配置された室内を表した複数のBIMファイルを今からサンプルとして与えます。これらのBIMファイルから、室内の各種の照明を抽出し、それらによる各室内の照明分布を求めるスクリプトを作ってください。”
というもので、所望情報である室内の照明分布を算出するための取得スクリプトの生成を指示するものとなっている。
【0081】
また、取得スクリプトによる所望情報を取得するためのプロセスが複雑になる場合には、複数ステップに分けて取得スクリプトを生成するように所望情報取得プロンプトを設定してもよい。例えば、3次元モデルから「柱と梁の衝突箇所」を抽出する例においては、(1)ファイルごとに含まれている柱と梁のモデルを抽出する取得スクリプトを生成する所望情報取得プロンプト、(2)それらの衝突の有無を確認する取得スクリプトを生成する所望情報取得プロンプト、(3)衝突のある箇所を抽出した3次元空間の情報を取得する取得スクリプトを生成する所望情報取得プロンプトなどに分割し、各ステップでの取得スクリプトを生成する所望情報取得プロンプトを設定してもよい。
【0082】
<取得スクリプト蓄積部>
取得スクリプト蓄積部505は、前記生成した取得スクリプトを蓄積する機能を有する。取得スクリプト蓄積部を持つことで、一度生成した取得スクリプトを再利用することができ、大量の対象となるファイルデータから再現性を持って値を取得することが可能となる。また、生成した取得スクリプトを用いて後述する第2所望情報取得部により取得した取得結果や、ともに入力した元の所望情報取得プロンプトおよび正解サンプルファイルデータなどと関連付けて蓄積してもよい。
【0083】
<第2所望情報取得部>
第2所望情報取得部506は、前記生成した取得スクリプトにより前記対象となるファイルデータから前記所望情報を取得する機能を有する。上述した対象となるファイルデータに対して生成した取得スクリプトを実行して、所望情報を取得する処理を行う。取得した結果は保存することが好ましい。これは、後述するように、取得結果を検証したりするなどの後処理に取得結果を供するためである。
【0084】
また、第2所望情報取得部で取得された所望情報を、新たな対象となるファイルデータとして、別の取得スクリプトへ渡してもよい。つまり、本発明における取得スクリプトの生成と対象ファイルデータからの所望情報の取得は連結させることができ、より複雑な処理を構成することも可能である。
【0085】
以上のように、取得スクリプトの実行により所望情報を取得する処理を行うので、学習済みAIモデルを都度呼び出して、所望の情報を取得しようとする場合に対して、要する時間とコストを抑えることができ、また一定の抽出精度で再現性のある情報の抽出ができる。
【0086】
さらに、「その課題を解決するために静的なスクリプトを用意しようとしても、専門的な知識のあるエンジニアでしか自分でスクリプトを作れない」という問題があったが、学習済みAIモデルで取得スクリプトを生成することで、誰でも自ら取得スクリプトを作成することができるという効果を得ることができる。
【0087】
<ハードウエア構成>
本実施例の情報処理装置は、実施例1に準じ
図3に示したハードウエア構成により実現することができる。
図5に示した実施例2の情報処理装置500に特有の構成である取得スクリプト生成部504および第2所望情報取得部506の機能は、主に
図3のCPU301、RAM302により実現される。また、取得スクリプト蓄積部505の機能は、主に
図3のストレージ303により実現される。
【0088】
<処理の流れ>
本実施例の情報処理装置の処理の流れは、実施例1の情報処理装置の処理の流れにおける正解情報指定ステップ(S404)まで基本的に同様である。そして、設定した所望情報取得プロンプトと、設定した正解サンプルファイルデータおよび指定した正解情報とを学習済みAIモデルに入力して、所望情報を取得するための取得スクリプトを生成する取得スクリプト生成ステップと、生成した取得スクリプトを蓄積する取得スクリプト蓄積ステップと、生成した取得スクリプトにより対象となるファイルデータから所望情報を取得する第2所望情報取得ステップと、をさらに含む。なお、取得スクリプト蓄積ステップは第2所望情報取得ステップの後に行うものとしてもよい。
【0089】
<効果>
本実施例の情報処理装置によれば、正解例を的確に指定することを容易にするとともに、学習済みAIモデルを都度呼び出して、所望の情報を取得しようとする場合に対して、要する時間とコストを抑えることができる。
【0090】
<実施例3>
<概要>
本発明は、様々なファイルデータ群を対象として、所望の情報を取得するにあたり学習済みAIモデルに入力されるプロンプト(以下、取得プロンプトという)を、所望の情報を取得するための正解例となる正解サンプルファイルデータと正解情報をプロンプトとともに学習済みAIモデルに入力して生成するものである。これにより、不慣れなユーザであっても、取得プロンプトを好適に生成することができる。
【0091】
<機能的構成>
図6は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。
図6に示すように、情報処理装置600は、第2プロンプト設定部601と、第2サンプル設定部602と、正解情報指定部603と、取得プロンプト生成部604と、取得プロンプト蓄積部605と、第3所望情報取得部606と、を有する。
【0092】
<第2プロンプト設定部>
第2プロンプト設定部601は、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する機能を有する。本構成における所望情報は、実施例1や実施例2において説明したとおりである。
【0093】
第2プロンプト設定部で設定されるプロンプト生成プロンプトと後述する正解サンプルファイルデータおよび正解情報とを取得プロンプト生成部に入力して取得プロンプトを生成するが、ここで設定するプロンプト生成プロンプトは、所望情報を指定し、正解サンプルファイルデータを参考にして取得プロンプトを生成せよ、といった形で設定してもよいし、あるいは、正解サンプルファイルデータから正解情報を取得するプロンプトを生成せよ、といった形で設定してもよい。
【0094】
例えば、上記の例のように「室内の照度分布」が所望情報である場合、“以下のサンプルファイルデータと正解情報を参考にして、複数のBIMファイルのそれぞれについて室内の照明を全て抽出し、各照明についての諸情報から室内の照度分布を求めるプロンプト(取得プロンプト)を生成してください”といったようなプロンプト生成プロンプトを設定してする。
【0095】
また、所望情報を取得するためのプロセスが複雑になる場合には、複数ステップに分けて取得プロンプトを生成するようにプロンプト生成プロンプトを設定してもよい。例えば、前述の室内の照度分布を取得する例においては、(1)ファイルごとに含まれているすべての照明についての諸情報から照度分布の算出に必要な情報を抽出する取得プロンプトを生成するプロンプト、(2)抽出した情報を用いて室内の照度分布を算出する取得プロンプトを生成するプロンプトなどに分割し、各ステップでの取得プロンプトを生成するようプロンプト生成プロンプトを設定してもよい。
【0096】
<第2サンプル設定部>
第2サンプル設定部602は、前記設定したプロンプト生成プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する機能を有する。本構成における正解サンプルファイルデータは、実施例1や実施例2における正解サンプルファイルデータと同様である。
【0097】
<正解情報指定部>
正解情報指定部603は、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する機能を有する。本構成の機能は、実施例1や実施例2における正解情報指定部と同様である。
【0098】
また、実施例1で説明した不正解情報指定部や正解情報説明プロンプト設定部を備えるように構成することもできる。
【0099】
<取得プロンプト生成部>
取得プロンプト生成部604は、前記設定したプロンプト生成プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記取得プロンプトを生成する機能を有する。
【0100】
例えば、上述した照度分布を求めるために生成された取得プロンプトの場合、上述したプロンプト生成プロンプトと、実施例1などで説明したようなBIMファイルやそのファイルにおいて指定された正解例とを学習済みAIモデルに入力することで、
“複数のBIMファイルのそれぞれについて室内の照明を全て抽出し、各照明についての諸情報から室内の照度分布を求めるプロンプトを生成してください。なお、作業面の高さは、室内のオブジェクトの高さより1mm高く設定してください。”
といった取得プロンプトが生成される。
【0101】
また、取得プロンプトの生成には、プロンプトの生成のみに限らず、同時に静的なスクリプトの生成を伴う場合もあり、その際には静的スクリプトにより安定して高速に対象となるファイルデータから所望情報を取得できる。また、生成されたプロンプトがスクリプトを呼ぶ場合や、スクリプトがプロンプㇳを呼ぶ場合もある。
【0102】
また、不正解情報指定部により指定した不正解情報や正解情報説明プロンプト設定部により設定した正解情報説明プロンプトを、さらに学習済みAIモデルに入力して取得プロンプトを生成するように構成してもよい。
【0103】
<取得プロンプト蓄積部>
取得プロンプト蓄積部605は、前記生成した取得プロンプトを蓄積する機能を有する。取得プロンプト蓄積部を持つことで、一度生成した取得プロンプトを再利用することができ、大量の対象となるファイルデータから再現性を持って値を取得することが可能となる。また、生成した取得プロンプトを用いて後述する第3所望情報取得部により取得した取得結果や、生成のために入力した元のプロンプト生成プロンプトや正解サンプルファイルデータおよび正解情報と関連付けて蓄積してもよい。
【0104】
<第3所望情報取得部>
第3所望情報取得部606は、前記生成した取得プロンプトを前記学習済みAIモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する機能を有する。取得した結果は保存することが好ましい。これは、後述するように、取得結果を検証したり、再整形したりするなどの後処理に取得結果を供するためである。なお、第3所望情報取得部で用いられる学習済みAIモデルは、取得プロンプト生成部で用いられる学習済みAIモデルと同じものであってもよいし、異なるものであってもよい。
【0105】
また、第3所望情報取得部は、前記生成された取得プロンプトを生成するために入力された前記プロンプト生成プロンプトと前記正解サンプルファイルデータおよび正解情報をさらに入力して所望情報を取得するように構成することもできる。あるいは、指定された不正解情報と設定された正解情報説明プロンプトをさらに入力して所望情報を取得するように構成することもできる。このように構成することで、所望情報を取得するのに好適な取得プロンプトの生成を容易に行うことができる。
【0106】
また、第3所望情報取得部で取得された所望情報を、新たな対象となるファイルデータとして、別の取得プロンプトによる処理へ渡してもよい。つまり、本発明における取得プロンプトの生成と対象ファイルからの所望情報の取得は連結させることができ、より複雑な処理を構成することも可能である。
【0107】
<ハードウエア構成>
実施例3の情報処理装置は、
図3に示した実施例1の情報処理装置を実現するハードウエアにより実現することができる。すなわち、
図6の情報処理装置600の第2プロンプト設定部601、第2サンプル設定部602、正解情報指定部603、取得プロンプト生成部604および第3所望情報取得部606の各機能は、主に
図3のCPU301、RAM302により実現される。また、取得プロンプト蓄積部605の機能は、主に
図3のストレージ303により実現される。また、対象となるファイルデータを蓄積するデータベースが外部に存在したり、取得プロンプト生成部や第3所望情報取得部が外部に存在する学習済みAIモデルを用いたりする場合には、通信インタフェース304や入出力インタフェース305を介して相互に信号や情報の授受を行うことで各機能が実現される。
【0108】
<処理の流れ>
図7は、実施例3の情報処理装置の処理の流れの一例を簡略に示すフロー図である。まず、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための取得プロンプトを生成するためのプロンプト生成プロンプトを設定する(S701:第2プロンプト設定ステップ)。そして、前記設定したプロンプト生成プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する(S702:第2サンプル設定ステップ)。そして、前記設定した正解サンプルファイルデータをビューワーに表示する(S703:正解サンプルファイルデータ表示ステップ)。そして、前記表示されるデータ上の特定情報を正解情報として指定する(S704:正解情報指定ステップ)。そして、前記設定したプロンプト生成プロンプトと、前記設定した正解サンプルファイルデータおよび前記指定した正解情報とを前記学習済みAIモデルに入力して、前記対象となるファイルデータから前記所望情報を取得する(S705:第3所望情報取得ステップ)。なお、正解情報指定ステップは、正解サンプルファイルデータ表示ステップを含むものとしてもよい。
【0109】
<効果>
本実施例の情報処理装置によれば、正解例を的確に指定することを容易にするとともに、所望の情報を抽出するための好適なプロンプトの作成を、不慣れなユーザにとっても容易なものとすることができる。
【0110】
<付加機能>
以下に、上述した実施例1から実施例3のいずれかに付加することができる機能を説明する。まずは、実施例1に付加できる機能を説明する。実施例2や実施例3にも付加することができる場合には、その旨説明する。
【0111】
<詳細プロンプト設定部>
詳細プロンプト設定部は、前記設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する機能を有する。
【0112】
図8は、詳細プロンプトの一例を示す図である。図示するように、本例では所望情報取得プロンプトが「“図面番号”の値を抽出してください。」であり、このプロンプトの指示を詳細に設定する項目として、「No」、「名称」、「説明」、「必要性」および「例」の各設定項目が示されている。
【0113】
例えば設定項目1は、「複数タグ名の付与」という名称であり、「文字表記のブレへの対応」のための設定項目であることが示されている。また、その説明として「抽出するデータ項目名を複数明示的に付与する」と示され、その例として「[“図面番号”,“図面ID”]」が示されている。この詳細プロンプトを設定することで、「“図面番号”の値を抽出してください。」という指示について「図面番号」だけでなく、「図面ID」と記されたものも抽出の対象にする指示が付加される。
【0114】
他にも詳細プロンプトの設定項目として、文字表記のブレへの対応として、抽出するデータ項目名の説明を付与する「タグの説明の付与」、抽出対象範囲の絞り込みのために、画像上でデータ項目が存在する範囲を指定する「絶対位置の指定」と、複数ページのPDFなどで何ページにあるか指定する「対象ページの指定」、誤抽出の抑制のために、抽出した値に近いサンプル群、もしくは遠いサンプル群を指定する「サンプル指定」、誤抽出の抑制と出力結果のフォーマット統一のために、ユーザは抽出したいフォーマットを指定できる「フォーマット指定」、表形式フォーマットへの対応として、何かしらの内容に対して、相対的な位置を指定できる「相対位置の指定」および、すべてのファイルに抽出したい内容が無い場合の対応として、特定の条件によって、抽出内容を変更する「条件設定」がある。もちろん、これらに限らずユーザが自ら種々の設定項目を設けて詳細プロンプトの設定を行うことができる。
【0115】
ここで、上述した各設定項目の適用方法であるが、大別すると、方法1の「ファイル内容を絞る」、方法2の「プロンプトを繋げる」および方法3の「検出結果を確認し、再整形する」の3つ分けることができる。方法1は、学習済みAIモデルに入力する前に入力の対象となるファイルデータを絞り込むことを意味し、方法2は、設定した詳細プロンプトをメインプロンプトに繋げることを意味する。方法3は、抽出結果を、指定されたサンプルやフォーマットなどに応じて再整形することを意味する。
【0116】
図9は、詳細プロンプトの各設定項目が適用される方法を示す図である。図示するように、「複数タグ名の付与」、「タグ説明の付与」および「条件設定」の各項目は、方法2の「プロンプトを繋げる」が適用される。また、「絶対位置の指定」と「対象ページの指定」は、方法1の「ファイル内容を絞る」と方法2が適用される。また、「サンプル指定」は、方法2と方法3の「抽出結果を確認し、再整形する」が適用される。そして、「フォーマット指定」と「相対位置の指定」は、方法1~方法3のすべてが適用される。適用例については後述する。
【0117】
図10は、詳細プロンプトを設定するときの入力画面の一例を示す概念図である。図示するように、画面1001の上部左側には既に設定されている所望情報取得プロンプト1002が表示されている。そして、画面の左側に「タグ名」、「絶対位置指定」、「サンプル指定」および「相対位置指定」の各設定項目の入力欄1003が表示されている。また、ユーザの操作によって、さらに別の設定項目の入力欄が表示される。これらの各入力欄に対するユーザの記入操作を受け付けることで、詳細プロンプトが設定される。そして、第1所望情報取得部は、詳細プロンプトの設定を適用して抽出する。このように詳細プロンプトを設定して抽出することで、抽出精度向上を図ることができる。
【0118】
以上のような詳細プロンプトを適用した例を示す。例えば、「サンプル指定」の項目において「D-00033,F-00102と似た内容です」と設定し、「相対位置指定」の項目において「この項目は、ページ左下にあります」と設定した場合、この詳細プロンプトが所望情報取得プロンプトに繋げられて入力される。そして、「相対位置指定」の適用により、学習済みAIモデルに入力するファイルデータについて、ページ左下のみを入力する(方法1:ファイル内容を絞る)。そして、「サンプル指定」の適用により、抽出された「図面番号」が「D-00033,F-00102」と似ている図面番号を抜き出す(方法3:抽出結果を確認し、再整形する)。このときの再整形は、学習済みAIモデルを用いてもよいし、別に再整形を指示するスクリプトを入力することによってもよい。
【0119】
また、詳細プロンプト設定部は、詳細プロンプトの設定を行うにあたり、設定された所望情報取得プロンプトに応じて自動的に各設定項目を設定するように構成することができる。あるいは、ユーザによる設定を受け入れつつ、設定されていない項目について、何らかの設定をお薦めするように構成してもよい。詳細プロンプトの設定をユーザから受け付けることで、ユーザの意向に柔軟かつ好適に情報の取得を行うことができるが、最適なプロンプトの設定を行うことがユーザにとって難しい場合もある。そこで、このように、詳細プロンプトの自動記入やサジェストの機能が有効である。これらの機能により、簡易化・操作性向上を図ることができる。
【0120】
また、簡易化・操作性向上を図るため、所望情報取得部は、対象となり得るファイルデータのすべてに対する取得の前に、設定した所望情報取得プロンプトによる、または設定した所望情報取得プロンプトと詳細プロンプトとによるテスト取得を行うよう構成することも好ましい。テスト取得とは、対象となり得るファイルデータのうちの一部に対して取得を行うことである。このテスト取得の結果により、ユーザは設定した所望情報取得プロンプトや詳細プロンプトが自ら所望する取得結果をもたらすものか否かの判断をすることができ、より望ましい取得結果を得るためのプロンプトの再設定を行うことができる。
【0121】
図10に示すように、画面1001の左側であって、詳細プロンプトの入力欄1003と所望情報取得プロンプトの表示欄1004の下に「テスト」ボタン1005が表示され、このボタンによりテスト抽出が行われる。そして、テスト抽出の結果が、図中において説明のために記した点線枠1006の中に表示されている。ユーザは、この抽出結果に基づき、プロンプトの再設定や、テスト抽出の結果が得られたプロンプトによる実際の抽出を行うことができる。
【0122】
詳細プロンプト設定部は、実施例2や実施例3においても付加構成として適用することができる。例えば、実施例2においては、設定した所望情報取得プロンプトにおける所望情報を取得するための詳細なプロンプトとして、上述の詳細プロンプトを設定する構成として適用することができる。また、実施例3においては、設定したプロンプト生成プロンプトにより取得プロンプトを生成するための詳細なプロンプトとして、上述の詳細プロンプトを設定する構成として適用することができる。
【0123】
<検証部>
検証部は、前記取得した所望情報を検証する機能を有する。検証部による検証の具体的な態様は種々ある。
図11は、検証を行う際の種々の設定を例示する図である。図示するように、4種の設定を行うことができ、それぞれ「詳細プロンプト利用」、「検証プロンプト」、「検証スクリプト」および「ファイル間比較」である。
【0124】
「詳細プロンプト利用」は、詳細プロンプトで設定した抽出の設定を検証に利用する。例えば、詳細プロンプトの設定項目である「サンプル指定」において、ネガティブサンプルの指定を行っていた場合、その指定されたネガティブサンプルを流用して、“抽出結果はネガティブサンプルに類似していないか?”という検証を行う。また、「相対位置の指定」での設定を利用して“抽出した値の左には、”屋上”という文字があるか?“という検証を行う。
【0125】
また、「検証プロンプト」は、検証用のプロンプトを独自に設定するものであり、例えば、“この値が、エレベーターの扉の素材を示しているかどうかチェックしてください”といったプロンプトを設定して入力する。また、「検証スクリプト」は、検証用のスクリプトを独自に設定するものであり、例えば、図示するように、抽出結果が「1」未満の場合に「Error」を返し、それ以外は「OK」を返す、といった命令を入力して検証する。
【0126】
また、「ファイル間比較」は、複数のファイルから抽出する際には、抽出結果を他ファイルと比較して妥当性を確認する。例示するように、抽出されたファイルA~ファイルDを比較すると、ファイルA、ファイルC、ファイルDはいずれも数字と記号のみの表記であるのに対して、ファイルBは漢字主体の表記となっている。このような場合に、「ファイルBは、他と比べて妥当ではない」という検証結果を得る。
【0127】
ここで、検証部により取得結果の検証をした場合、第1所望情報取得部は、その検証結果を反映させて再取得を行うように構成することもできる。例えば、上述したように抽出結果の値がエラーである場合、“前回の抽出では〇〇〇という値を抽出していましたが、エラーの検証結果がでました。このエラー結果を考慮し、再度値を抽出してください。”といった指示を入力して再度所望情報の取得を行う。
【0128】
検証部は、実施例2や実施例3においても付加構成として適用することができる。実施例2においては、第2所望情報取得部により取得した所望情報を検証する構成として適用でき、実施例3においては、第3所望情報取得部により取得した所望情報を検証する構成として適用できる。
【0129】
続いて、実施例2に付加することができる機能について説明する。
【0130】
<取得スクリプト評価部>
取得スクリプト評価部は、前記生成した取得スクリプトにより対象となる項目を含むファイルデータから取得した所望情報を前記指定した正解情報と対比して評価する機能を有する。この正解情報は、実施例1の第1サンプル設定部や正解情報指定部で述べた通りである。生成した取得スクリプトにより、正解サンプルファイルデータから実際に所望情報を取得して、その結果と正解情報を比較することで、どの程度正確な取得スクリプトであるかを評価することがきる。すなわち、取得した結果と正解情報とが合致すれば正確であると評価することができる。
【0131】
また、取得スクリプト生成部において、この評価結果をさらに学習済みAIモデルに入力するように構成することで、評価結果を踏まえた取得スクリプトを生成することができ、より正確な取得スクリプトの生成に役立たせることができる。例えば、取得した情報と正解情報が合致するまで取得スクリプトの再生成を続けるように構成することもできる。なお、取得スクリプトの評価は、取得スクリプト蓄積部に蓄積している取得スクリプトに対して行ってもよい。
【0132】
<取得スクリプト修正部>
取得スクリプト修正部は、前記生成した取得スクリプトと、前記対象となるファイルデータの一部または全部を前記学習済みAIモデルに入力し、前記生成した取得スクリプトを前記対象となるファイルデータに適応するよう修正する機能を有する。なお、修正に用いられる学習済みAIモデルは、上述した取得スクリプト生成部で用いられる学習済みAIモデルと同じものであってもよいし、別のものであってもよい。
【0133】
例えば、取得スクリプト作成の際に入力したサンプルファイルデータになかったファイル形式のファイルデータや取得すべき項目名などが対象となるファイルデータに含まれている場合には、所望情報を正確に取得できない場合が生じる。このような事態を防止するために、生成した取得スクリプトを対象となるファイルデータとともに学習済みAIモデルに入力する。
【0134】
そして、以下の例のようなプロンプトを与えることで、取得スクリプトを修正する。
「このスクリプトは、“BIMファイルから、建築物の3Dオブジェクトの一覧のうち柱オブジェクトを選択し、その総数を求めよ”という目的に沿って作られたスクリプトです。
ただし、この処理対象のファイルデータでは正常に動作しない可能性があります。正常に動作しない箇所を見つけ出し、スクリプトを修正してください。」
例えば、「柱オブジェクトの総数」を取得するために作成した取得スクリプトが、「柱」という値のプロパティを持つオブジェクトを抽出するスクリプトを実行させるものである場合、対象となるファイルデータに、「Pillar」という値のプロパティを持つ柱オブジェクトが含まれている場合には、このファイルデータの情報は取得の対象から漏れてしまい、正確な所望情報を得ることはできない。そこで、上記のようなプロンプトとともに作成済みの取得スクリプトと対象となるファイルデータとを学習済みAIモデルに入力することにより、対象となるファイルデータに適応した取得スクリプトの生成を行うことできる。
【0135】
ファイルデータに適応させるための修正は、対象となるファイルデータからファイルデータを一つずつ学習済みAIモデルに入力して行ってもよいし、すべてのファイルデータを学習済みAIモデルに入力して行ってもよい。また、修正する取得スクリプトを作成する元となった所望情報取得プロンプトをさらに入力してもよい。
【0136】
また、上述した取得スクリプト蓄積部により蓄積されている取得スクリプトについても、生成した取得スクリプトに対する修正と同じように修正するように構成することもできる。対象となるファイルデータが増減したり変わったりすることにより、蓄積した取得スクリプトについて修正が必要になることもあるので、これについて修正可能に構成することは好ましい。
【0137】
また、付加機能の一つとして説明した検証部を実施例2に適用した場合、取得スクリプト修正部は、この検証部による検証結果を反映させて取得スクリプトを修正するように構成することができる。例えば、上述したように取得結果の情報がエラーである場合、“前回の抽出では〇〇〇という情報を抽出していましたが、エラーの検証結果がでました。このエラー結果を考慮し、スクリプトを修正してください。”といったプロンプトを学習済みAIモデルに入力して取得スクリプトの修正を行う。
【0138】
続いて、実施例3に付加することができる機能について説明する。
【0139】
<取得プロンプト評価部>
取得プロンプト評価部は、前記生成した取得プロンプトにより前記正解サンプルファイルデータに対して前記所望情報を取得した結果を前記正解情報と比較して評価する機能を有する。実施例2の付加機能である取得スクリプト評価部と同様に、本構成においては生成した取得スクリプトを評価する。同様に、取得プロンプト生成部において、取得プロンプト評価部による評価結果をさらに学習済みAIモデルに入力するように構成し、評価結果を反映させた取得プロンプトを生成することができる。
【0140】
さらに、実施例1から実施例3のいずれにも付加することができる機能について説明する。
【0141】
<フィルタリング部>
フィルタリング部は、対象となるファイルデータのうち所定のファイルデータを、第1所望情報取得部から第3所望情報取得部のいずれかによる取得の対象から除去する機能を有する。フィルタリングする手法は種々存在する。例えば、ファイルの属性(拡張子、サイズ、ファイル名、ファイルに付随するデータ項目など)に基づきフィルタリングする。また、個別のキーワードを設定し、このキーワードに基づきフィルタリングする。具体的には、セマンティックサーチ、クラスタリング、文字検索などを行いフィルタリングするためのスクリプトを生成し、そのスクリプトを実行することによりフィルタリングがなされる。また、学習済みAIモデルに指示を与えてフィルタリングするようにしてもよい。例えば、“このファイルはエレベーターの内容を含んでいる?”という指示を入力することで、エレベーターの内容を含むか否かによりフィルタリングすることができる。
【0142】
このようなフィルタリング部の機能により、例えば、対象となる500個のファイルデータのうち、構造モデルからは柱オブジェクトを取得したいが、設備モデルは対象としてスキップしたいといったユーザの要望に応えることができる。
【0143】
<変換部>
変換部は、ファイルデータの特性に応じて対象となるファイルデータの形式を変換する機能を有する。変換部を有する場合、第1所望情報取得部から第3所望情報取得部のいずれかは、変換部により変換したファイルデータから所望情報の取得を行う。例えば、ファイルデータがPDF形式である場合には、テキストファイルの形式に変換する。また、画像データの場合には、OCRにより文字認識をしてテキストファイルの形式に変換する。また3次元データの場合には2次元データや画像に変換してもよい。このような変換を行うことでロバスト性向上に寄与する。
【0144】
さらに、テキストファイルに変換する際に、テキストの位置情報を付与するように変換することも好ましい。
図12は、PDF形式のファイルデータについて、位置情報を付与したテキストファイルに変換する例を示す概念図である。
図12(a)は、住宅の建築面積表を示すPDF形式のファイルの一部を示している。
図12(b)は、「形状」、「計算式」、「面積」の各テキストを、それらの位置情報とともに記述したJSON形式に変換した例を示している。また、
図12(c)は、同様にテキストを位置情報とともに記述したArray形式に変換した例を示している。このように、位置情報を付与することで、テキスト間の関係性を考慮した抽出が行われ、ロバスト性向上に寄与する。また、
図12(d)は、元のファイルにおいて「洋室1」、「洋室2」、「洋室3」のそれぞれの「面積」と「帖」を示した表を示していたテキストを、位置情報ではなくテーブル情報を持つテキスト(図中の点線枠内)に変換する例を示している。このように変換することで、テーブル構造を保持したまま取得の対象とすることができる。
【0145】
図13は、ファイルデータの形式を変換する他の例を示す概念図である。
図13に示すように、図形を含むファイル(キッチン平面図)の場合は、SVG形式に変換し図形情報を持つテキストにしておくことで、スクリプトによる取得を行いやすくなる。また、逆に2次元のベクター情報をラスター画像のように変換してもよいし、3次元から2次元へのデータ変換などを行ってもよい。
【0146】
<データ削減部>
データ削減部は、対象となるファイルデータのデータ削減をする機能を有する。データ削減は様々な態様で行うことができる。例えば、対象となるファイルデータから特定の空間、プロパティ、エリア、特定のページやセクション、パラグラフ、テーブルなどに絞ることでデータ削減する。また、ファイルの属性(ページ番号、位置など)でフィルタリングしたり、個別のキーワードでフィルタリングしたり(セマンティックサーチ、クラスタリング、文字検索)、空間の位置(x,y,z,座標)でフィルタリングしたりすることができる。また、学習済みAIモデルに指示を入力してフィルタリングすることもできる(“このファイルはエレベーターの内容を含んでいる?)。
【0147】
図14は、データ削減の他の態様について示す概念図である。
図14(a)に示すように、一のファイルデータ1401において特定の箇所1402を切り取って、その中に目的のデータが含まれているかをチェックする。その結果、目的のデータが含まれていれば、その箇所を第1所望情報取得部から第3所望情報取得部のいずれかの取得処理に供する。含まれなかった場合には、先の箇所からずらした箇所1403を切り取って、同様にチェックを行う。このように取得する前のチェックで目的のデータを含まないものを取得の対象から除外することで処理効率の向上を図ることができる。なお、このチェックは、スクリプトの実行により行ってもよいし、学習済みAIモデルを用いて行ってもよいし、その他の手法によってもよい。また、このような処理は3次元空間上で実施してもよい。
【0148】
また、
図14(b)に示すように、特定の箇所をずらしながら上述のチェックを行い、目的のデータを含む箇所をメモリ1404に一時保管する。そして、処理メモリ1404が目的のデータを取得するために必要な要素をすべて含んでいるかチェックし、すべて含んでいる場合は、メモリに保持されている箇所を第1所望情報取得部から第3所望情報取得部のいずれかでの取得処理に供する。一方、すべて含んでいない場合には、特定の箇所をさらにずらして上述のチェックからの一連の処理を繰り返す。
【0149】
<根拠表示部>
根拠表示部は、第1所望情報取得部から第3所望情報取得部のいずれかにより取得した取得結果について、その取得結果が取得された根拠を表示する機能を有する。
【0150】
各実施例の情報処理装置において、所望情報の取得は、それぞれのプロセスを経て行われる。例えば、実施例2においては、所望情報取得プロンプトと正解サンプルファイルデータおよび正解情報を学習済みAIモデルに入力して生成した取得スクリプトを、学習済みAIモデルに入力して所望情報を取得する。ここで、所望情報を得るのに最適な取得スクリプトを生成するための所望情報取得プロンプトの設定が難しい場合も有る。そこで、取得結果に至った根拠(途中プロセスなど)を表示することで、ユーザに対して「何をどうすれば取得結果を改善できるか」ということを示すことができる。
【0151】
図15は、根拠として3Dモデル上の抽出範囲を表示する例を示す概念図である。図示しているのは、建築物を表す3Dモデルであり、このモデルから取得された情報(柱オブジェクト)の位置を3D上で太点線の枠1501で囲んで強調表示している。これにより、ユーザは取得結果がどこから取得されたかが分かる。また、3次元モデルを処理する取得スクリプトなどでは、その取得スクリプトの処理過程の表示や、その際に利用された情報の強調表示などをすることも根拠の確認に有用である。
【0152】
また、取得した理由を説明する表示をしてもよい。例えば、事前処理として取得前に学習済みAIモデルに「この情報を取得結果として出力した理由を、詳細のプロセスごとに出力してください」という指示を入力しておく。すると、取得した後に取得結果を示すとともに、例えば「室内の各種の照明は天井付近に配置されており、オブジェクト名に”照明”という文字が含まれているため、これらのオブジェクトを照明として抽出しました」という根拠が表示される。このように、自ら設定した所望情報取得プロンプトと、それにより生成された取得スクリプトが取得結果に及ぼす作用が示されることで、ユーザは種々の設定について省みることができ所望情報取得の最適化に資することができる。実施例1や実施例3においても同様に、所望情報の取得に至った根拠や途中プロセスを表示することは有用である。
【符号の説明】
【0153】
100、500、600:情報処理装置
101、501:第1プロンプト設定部
102、502:第1サンプル設定部
103、503、603:正解情報指定部
104:第1所望情報取得部
504:取得スクリプト生成部
505:取得スクリプト蓄積部
506:第2所望情報取得部
601:第2プロンプト設定部
602:第2サンプル設定部
604:取得プロンプト生成部
605:取得プロンプト蓄積部
606:第3所望情報取得部
301:CPU
302:RAM
303:ストレージ
304:通信インタフェース
305:入出力インタフェース
【要約】
【課題】学習済みAIモデルを用いて所望の情報を抽出する際に、正解例を入力することで好適に所望の情報を抽出することができる場合があるが、画像やCADやBIMといった形式のデータから正解例を的確に指定することは容易ではないという問題がある。
【解決手段】上記課題を解決するために、対象となる項目を含むファイルデータから所望する項目に関する情報である所望情報を取得するための所望情報取得プロンプトを設定する第1プロンプト設定部と、前記設定した所望情報取得プロンプトとともに学習済みAIモデルに入力され、前記所望情報を取得するための正解例となる正解サンプルファイルデータを設定する第1サンプル設定部と、前記設定した正解サンプルファイルデータを表示するビューワー上で、そのデータ上の特定情報を正解情報として指定する正解情報指定部と、を有する情報処理装置などを提供する。