IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社テクトムの特許一覧

特許7551203情報処理装置、情報処理方法及び情報処理プログラム
<>
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図1
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図2
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図3
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図4
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図5
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図6
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図7
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図8
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図9
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図10
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図11
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図12
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図13
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図14
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-09-06
(45)【発行日】2024-09-17
(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
   G06F 9/455 20180101AFI20240909BHJP
   G06F 8/30 20180101ALI20240909BHJP
【FI】
G06F9/455
G06F8/30
【請求項の数】 13
(21)【出願番号】P 2024539757
(86)(22)【出願日】2024-04-11
(86)【国際出願番号】 JP2024014619
【審査請求日】2024-07-01
【早期審査対象出願】
(73)【特許権者】
【識別番号】523434100
【氏名又は名称】株式会社テクトム
(74)【代理人】
【識別番号】230116816
【弁護士】
【氏名又は名称】成川 弘樹
(74)【代理人】
【識別番号】100159248
【弁理士】
【氏名又は名称】齋藤 修
(72)【発明者】
【氏名】北村 尚紀
(72)【発明者】
【氏名】ハミルトン フランシス ニルス
【審査官】児玉 崇晶
(56)【参考文献】
【文献】福田 和宏,ChatGPTにオフィス文書作りを任せる AI時代の丸投げ仕事術,日経パソコン,2023年10月09日,第923号,pp.30-41
【文献】Graham J,Advanced Data Analysis (ChatGPT Enterprise version) [online],help.openai.com,2023年12月09日,[検索日2024.06.13], retrieved from the Internet: <URL: https://web.archive.org/web/20231209112753/https://help.openai.com/ en/articles/8437071-advanced-dataanalysis-chatgpt-enterprise- version>
【文献】インターテックリサーチ株式会社,ChatGPT Advanced Data Analysis-その2(Webスクレーピング),インターテックリサーチブログ [online],2023年09月04日,[検索日2024.06.13], retrieved from the Internet: <URL: https://www.itrco.jp/wordpress/2023/09/chatgpt%e3%81%ab%e8%a8% 8a%e3%81%84%e3%81%a6%e3%81%bf%e3%81%9f%e3%83%bc%e3%81 %9d%e3%81%ae29%ef%bc%88%e7%b6%9aadvanced-data- analysis%ef%bc%89/>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 9/455
G06F 8/30
(57)【特許請求の範囲】
【請求項1】
所望する情報である所望情報を含むファイルデータから所望情報を指定するためのプロンプトを設定するプロンプト設定部と、
前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定部と、
前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、指定された所望情報を取得するためのスクリプトを生成するスクリプト生成部と、を有し、
前記スクリプト生成部は、前記サンプルファイルデータに対する前記指定した所望情報の正解の情報である正解情報をさらに入力して前記スクリプトを生成する情報処理装置。
【請求項2】
前記生成したスクリプトを蓄積するスクリプト蓄積部を、さらに有する請求項1に記載の情報処理装置。
【請求項3】
前記生成したスクリプトにより前記ファイルデータから前記指定した所望情報を取得する所望情報取得部を、さらに有する請求項1または2に記載の情報処理装置。
【請求項4】
前記生成したスクリプトにより前記サンプルファイルデータに対して前記指定した所望情報を取得した結果を前記正解情報と対比して評価するスクリプト評価部を、さらに有する請求項3に記載の情報処理装置。
【請求項5】
前記スクリプト生成部は、前記スクリプト評価部による評価結果をさらに入力して前記スクリプトを生成する請求項4に記載の情報処理装置。
【請求項6】
前記生成したスクリプトと、前記ファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記生成したスクリプトを前記ファイルデータに適応するよう修正するスクリプト修正部を、さらに有する請求項に記載の情報処理装置。
【請求項7】
前記スクリプト修正部は、さらに前記生成したスクリプトの元となるプロンプトを前記学習済み言語モデルに入力して修正する請求項6に記載の情報処理装置。
【請求項8】
前記スクリプト修正部は、前記スクリプト蓄積部が蓄積するスクリプトについても修正する請求項2を引用する請求項6または請求項2を引用する請求項7に記載の情報処理装置。
【請求項9】
前記設定したプロンプトにより指定される所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する請求項1または2に記載の情報処理装置。
【請求項10】
前記所望情報取得部により取得した取得結果を検証する検証部を、さらに有する請求項に記載の情報処理装置。
【請求項11】
前記スクリプト修正部は、前記検証部による検証結果を反映させてスクリプトを修正する請求項10に記載の情報処理装置。
【請求項12】
情報処理装置が実行する情報処理方法であって、
所望する情報である所望情報を含むファイルデータから所望情報を指定するためのプロンプトを設定するプロンプト設定ステップと、
前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定ステップと、
前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、指定された所望情報を取得するためのスクリプトを生成するスクリプト生成ステップと、を有し、
前記スクリプト生成ステップは、前記サンプルファイルデータに対する前記指定した所望情報の正解の情報である正解情報をさらに入力して前記スクリプトを生成する情報処理方法。
【請求項13】
所望する情報である所望情報を含むファイルデータから所望情報を指定するためのプロンプトを設定するプロンプト設定ステップと、
前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定ステップと、
前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、指定された所望情報を取得するためのスクリプトを生成するスクリプト生成ステップと、
を情報処理装置に実行させる情報処理プログラムであって、
前記スクリプト生成ステップは、前記サンプルファイルデータに対する前記指定した所望情報の正解の情報である正解情報をさらに入力して前記スクリプトを生成する情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、様々な情報を含むファイルデータ群から所望の情報を取得する情報処理装置に関する。
【背景技術】
【0002】
近年、ファイルデータ群から所定の情報を取得するために大規模言語モデル(LLM。以下、省略して使用する場合がある。)を利用することが広がりつつある。例えば、特許文献1には、広告のチラシなどのように形式の定まっていない多様な印刷物から所定の項目に関する文字情報を収集するためにLLMを利用した技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第7430437号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の技術は、収集する項目を特定する指示をはじめ、収集に関する諸々の指示を含むプロンプトをLLMに与えることで、OCRにより読み取ったチラシに印刷されていた一群の文字列から1以上の所定の項目に関する1以上の文字情報を収集する。このような技術の場合、情報収集の処理のたびにLLMを呼び出すことになるので、時間とコストがかかってしまうという問題が生じる。また、処理の度にLLMを呼び出すことから、抽出精度が一定でないという問題がある。
【課題を解決するための手段】
【0005】
そこで、上記課題を解決するために本発明において、以下の情報処理装置などを提供する。すなわち、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定するプロンプト設定部と、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定部と、前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、前記指定した所望情報を取得するためのスクリプトを生成するスクリプト生成部と、前記生成したスクリプトにより前記対象となるファイルデータから前記指定した所望情報を取得する所望情報取得部と、を有する情報処理装置を提供する。
【0006】
また、前記特徴に加え、前記生成したスクリプトを蓄積するスクリプト蓄積部を、さらに有する情報処理装置を提供する。
【0007】
また、前記特徴に加え、前記スクリプト生成部は、前記サンプルファイルデータに対する前記指定した所望情報の正解の情報である正解情報をさらに入力して前記スクリプトを生成する情報処理装置を提供する。
【0008】
また、前記特徴に加え、前記生成したスクリプトにより前記サンプルファイルデータに対して前記指定した所望情報を取得した結果を前記正解情報と対比して評価するスクリプト評価部を、さらに有する情報処理装置を提供する。
【0009】
また、前記特徴に加え、前記スクリプト生成部は、前記スクリプト評価部による評価結果をさらに入力して前記スクリプトを生成する情報処理装置を提供する。
【0010】
また、前記特徴に加え、前記生成したスクリプトと、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記生成したスクリプトを前記対象となるファイルデータに適応するよう修正するスクリプト修正部を、さらに有する情報処理装置を提供する。
【0011】
また、前記特徴に加え、前記スクリプト修正部は、さらに前記生成したスクリプトの元となるプロンプトを前記学習済み言語モデルに入力して修正する情報処理装置を提供する。
【0012】
また、前記特徴に加え、前記スクリプト修正部は、前記スクリプト蓄積部が蓄積するスクリプトについても修正する情報処理装置を提供する。
【0013】
また、前記特徴に加え、前記設定したプロンプトにより指定される所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する情報処理装置を提供する。
【0014】
また、前記特徴に加え、前記所望情報取得部により取得した取得結果を検証する検証部を、さらに有する情報処理装置を提供する。
【0015】
また、前記特徴に加え、前記スクリプト修正部は、前記検証部による検証結果を反映させてスクリプトを修正する情報処理装置を提供する。
【0016】
また、情報処理装置が実行する情報処理方法であって、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定するプロンプト設定ステップと、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定ステップと、前記設定したプロンプトとサンプルファイルデータを前記学習済み言語モデルに入力して、前記所望情報を取得するためのスクリプトを生成するスクリプト生成ステップと、前記生成したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する所望情報取得ステップと、を有する情報処理方法を提供する。
【0017】
また、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定するプロンプト設定ステップと、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定ステップと、前記設定したプロンプトとサンプルファイルデータを前記学習済み言語モデルに入力して、前記所望情報を取得するためのスクリプトを生成するスクリプト生成ステップと、前記生成したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する所望情報取得ステップと、を情報処理装置に実行させる情報処理プログラムを提供する。
【0018】
また、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持するスクリプト保持部と、前記保持しているスクリプトを、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記保持しているスクリプトを前記対象となるファイルデータに適応するよう修正する保持スクリプト修正部と、前記修正したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する第2所望情報取得部と、を有する情報処理装置を提供する。
【0019】
また、前記特徴に加え、前記保持スクリプト修正部は、前記保持しているスクリプトを修正するためのプロンプトを、さらに前記事前学習済み言語モデルに入力して修正する情報処理装置を提供する。
【0020】
また、情報処理装置が実行する情報処理方法であって、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持するスクリプト保持ステップと、前記保持しているスクリプトを、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記保持しているスクリプトを前記対象となるファイルデータに適応するよう修正する保持スクリプト修正ステップと、前記修正したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する第2所望情報取得ステップと、を有する情報処理方法を提供する。
【0021】
また、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持するスクリプト保持ステップと、前記保持しているスクリプトを、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記保持しているスクリプトを前記対象となるファイルデータに適応するよう修正する保持スクリプト修正ステップと、前記修正したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する第2所望情報取得ステップと、を情報処理装置に実行させる情報処理プログラムを提供する。
【発明の効果】
【0022】
本発明により、様々な情報を含むファイルデータ群から所望の情報の取得を、要する時間とコストを抑えて行うことができ、また一定の抽出精度で再現性のある情報の抽出ができる。
【図面の簡単な説明】
【0023】
図1】実施例1の情報処理装置の機能的構成の一例を示すブロック図
図2】スクリプト生成部の機能を説明する概念図
図3】実施例1の情報処理装置を実現するハードウエアの構成例を示す概念図
図4】実施例1の情報処理装置の処理の流れの一例を簡略に示すフロー図
図5】実施例2の情報処理装置の機能的構成の一例を示すブロック図
図6】詳細プロンプトの設定項目と設定例を示す図
図7】詳細プロンプトの各設定項目が適用される方法を示す図
図8】詳細プロンプトを設定するときの入力画面の一例を示す概念図
図9】検証を行う際の種々の設定を例示する図
図10】PDF形式のファイルデータについて、位置情報を付与したテキストファイルに変換する例を示す概念図
図11】ファイルデータの形式を変換する他の例を示す概念図
図12】データ削減の他の態様について示す概念図
図13】根拠として画像上の位置を表示する例を示す概念図
図14】実施例3の情報処理装置の機能的構成の一例を示すブロック図
図15】実施例3の情報処理装置の処理の流れの一例を示すフロー図
【発明を実施するための形態】
【0024】
以下、本発明の実施の形態について、添付図面を用いて説明する。なお、本発明は、これら実施形態に何ら限定されるべきものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施し得る。
【0025】
<実施例1>
<概要>
本発明は、様々なファイルデータ群を対象として、スクリプト(簡易的なプログラム)の実行により所望の情報を取得するにあたり、大規模言語モデルを典型とする学習済み言語モデル(LLM。以下、省略して使用する場合がある。)にサンプルとなるファイルデータとプロンプトを入力することにより、このスクリプトを生成するものである。ここで、入力したサンプルの範囲においてロバスト性(どれだけ多様なフォーマットから正確に抽出できるかの度合い)を担保した静的なスクリプトを生成することができる。またLLMを呼び出すのは、スクリプトを生成するときの一度だけであるので、従来技術が要していた時間とコストを削減することができる。また、静的なスクリプトにより処理を行うので、抽出結果が一意に定まる。
【0026】
以下では、情報処理装置の機能及び処理の流れ、並びにハードウエアの内容について説明する。なお、以下に記載する本システムの機能ブロックは、ハードウエア及びソフトウェアの組み合わせとして実現され得る。具体的には、コンピュータを利用するものであれば、CPU(中央演算装置)や主メモリ、バス、あるいは二次記憶装置(ハードディスクドライブや不揮発性メモリ、CDやDVDなどの記憶メディアとそれらメディアの読取ドライブなど)、情報入力に利用される入力デバイス、印刷機器や表示装置、その他の外部周辺装置などのハードウエア構成部、またその外部周辺装置用のインタフェース、通信用インタフェース、それらハードウエアを制御するためのドライバプログラムやその他アプリケーションプログラム、ユーザ・インターフェース用アプリケーションなどが挙げられる。そして主メモリ上に展開したプログラムに従ったCPUの演算処理によって、入力デバイスやその他インタフェースなどから入力され、メモリやハードディスク上に保持されているデータなどが加工、蓄積されたり、上記各ハードウエアやソフトウェアを制御するための命令が生成されたりする。あるいは本システムの機能ブロックは専用ハードウエアによって実現されてもよい。
【0027】
また、この発明はシステムとして実現できるのみでなく、方法としても実現可能である。また、このような発明の一部をソフトウェアとして構成することができる。さらに、そのようなソフトウェアをコンピュータに実行させるために用いるプログラム、及びプログラムを固定した記録媒体も、当然にこの発明の技術的な範囲に含まれる(本明細書の全体を通じて同様である)。
【0028】
<機能的構成>
図1は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。図1に示すように、情報処理装置100は、プロンプト設定部101と、サンプル設定部102と、スクリプト生成部103と、スクリプト蓄積部104と、所望情報取得部105を有する。
【0029】
<プロンプト設定部>
プロンプト設定部101は、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定する機能を有する。対象となるファイルデータは、本情報処理装置が備えるストレージにて蓄積したものでもよいし、本情報処理装置と通信回線等を介して接続するストレージにて蓄積されているものでもよい。また、ファイルデータのファイル形式は多種存在し限定するものではないが、例えば、ワードファイル、PDF(Portable Document Format)ファイル、エクセルファイル、画像ファイル、CSV(Comma Separated Values)ファイル、テキストファイル、BIM(Building Information Modeling)ファイル、2DCAD(Computer Aided Design)ファイル、3Dモデルファイルなどがある。
【0030】
また、「所望情報」は、所望の項目の情報や、その項目の情報を何らかの演算・加工して得られる情報(総数、平均情報、最大情報、距離や衝突などの空間的関係性、3次元モデル情報、3次元図形情報、画像、文字情報など)を意味する。例えば、複数の建築物の設備に関するCSVファイルを対象として、そのファイルデータ群から「エレベーターの総数」を所望する場合は、ファイルごとに含まれる建築物のエレベーターの数を抽出し、それらの数を合算した情報が所望情報となる。また、数情報の計算のみならず、3次元空間処理や3次元図形処理などの処理結果を所望情報として設定してもよい。例えば、複数の建築物の3次元モデルファイルを対象として、「柱と梁の衝突箇所」を所望する場合は、ファイルごとに含まれている柱と梁のモデルをすべて抽出し、それらの衝突の有無を計算し、衝突のある箇所を抽出した3次元空間の情報が所望情報となる。
【0031】
さらに例えば、複数の建築物の3次元図面ファイルを対象として、「立面図と平面図の不整合箇所」を所望する場合は、ファイルごとに含まれている立面と平面の建築設計情報をすべて抽出し、それらを3次元立体として再構成した際の整合性の有無を確認し、その不整合箇所を文章化したテキストが所望情報となる。このような3次元空間や3次元空間の処理においては、一定の処理を静的に行う本発明の方が所望情報を正確に取得できる場合が多い。このような所望情報を指定するプロンプトを設定する。このプロンプトの設定はユーザが行うものであってもよいし、本装置をユーザに提供する者などにより予め設定されるものであってもよい。
【0032】
なお、後述するスクリプト生成部において設定されたプロンプトにより指定された所望情報を取得するためのスクリプトが生成されるが、プロンプト設定部において、スクリプトの生成についても指示するプロンプトを設定してもよい。例えば、上記の例のように「エレベーターの総数」が所望情報である場合、“与えられた複数のCSVファイルからエレベーターの総数を求めてください”といったような、所望情報を指定する指示内容のプロンプトを設定してもよいし、“与えられた複数のCSVファイルからエレベーターの総数を求めるスクリプトを作ってください”といったように、指定した所望情報を取得するためのスクリプトを作成する指示内容のプロンプトを設定してもよい。
【0033】
また、スクリプトの処理が複雑になる場合には、複数ステップに分けてスクリプトを生成するプロンプトを設定してもよい。例えば、前述の3次元モデルから「柱と梁の衝突箇所」を抽出する例においては、(1)ファイルごとに含まれている柱と梁のモデルを抽出するスクリプトを生成するプロンプト、(2)それらの衝突の有無を確認するスクリプトを生成するプロンプト、(3)衝突のある箇所を抽出した3次元空間の情報を取得するスクリプトを生成するプロンプトなどに分割し、それぞれのスクリプトを生成するプロンプトを指定してもよい。
【0034】
<サンプル設定部>
サンプル設定部102は、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定する機能を有する。サンプルファイルデータは、対象となる複数のファイルデータから所望情報を取得する際の見本となるファイルデータであり、例えば、上述した例のように「エレベーターの総数」を所望情報として設定した場合では、エレベーターの台数についての情報を含む複数の「建築物の設備」についてのCSVファイルをサンプルファイルデータとして設定し、「柱と梁の衝突箇所」を所望情報として設定した場合では、柱と梁の情報を含む複数の建築構造についての3次元モデルファイルをサンプルファイルデータとして設定し、「立面図と平面図の整合性の有無」を所望情報として設定した場合では、立面図と平面図の情報を含む複数の「建築設計」についての2次元図面ファイルをサンプルファイルデータとして設定する。
【0035】
また、所望する情報を含むファイルデータであって、それぞれにフォーマットが異なる複数のファイルデータをサンプルファイルデータとして設定することが好ましい。様々なフォーマットのファイルデータに対しても汎用的に所望情報を取得することができるスクリプトの生成に寄与するからである。
【0036】
なお、このサンプルファイルデータは、取得の対象となる複数のファイルデータに対して当然少数となるケースが多いが、その逆の場合も有りうる。また、サンプルファイルデータは、取得の対象となる複数のファイルデータの一部であってもよいし、別のファイルデータであってもよい。サンプルファイルデータの設定はユーザが行うものであってもよいし、本装置をユーザに提供する者などにより予め設定されるものであってもよい。
【0037】
なお、便宜のためプロンプトの設定とサンプルファイルデータの設定を個別の構成として説明してきたが、プロンプトとサンプルファイルデータを一体的に設定するように構成してもよい。すなわち、所望情報を指定するとともにサンプルとなるファイルデータへのリンク情報なども含むプロンプトを設定することで、上記のようなプロンプト設定部とサンプル設定部とによる機能が同じように実現する。
【0038】
<スクリプト生成部>
スクリプト生成部103は、前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、前記指定した所望情報を取得するためのスクリプトを生成する機能を有する。
【0039】
図2は、スクリプト生成部の機能を説明する概念図である。例示しているのは、サンプルファイルデータ201、202である。サンプルファイルデータは、建築物ごとの設備(エレベーター、消火設備、衛生設備)とその数を示すリストであって、一方のサンプルファイルデータ201は日本語で記述されており、他方のサンプルファイルデータ202は主に英語で記述されている。
【0040】
これらのサンプルファイルデータをプロンプトとともにLLMに入力する。以下では、学習済み言語モデルの典型であるLLMを用いて説明する。なお、学習済み言語モデルは、LLMだけでなく自然言語処理タスクを行い得るものであれば、小規模な言語モデルや画像やその他のフォーマットを扱えるマルチモーダルな言語モデルなどのように異なるものであってもよい。
【0041】
そして、図示するプロンプト203は、
「建築物の設備リストの複数のCSVファイルを今からサンプルとして与えます。これらの行は複数の建築物の設備の種類と数を示しています。これらのCSVファイルから、エレベーターの台数を抽出し、その総数を求めるスクリプトを作ってください。」
というもので、所望情報であるエレベーターの総数を算出するスクリプトの生成を指示するものとなっている。
【0042】
LLM204は、このようなプロンプト203とサンプルファイルデータ201、202の入力に対してスクリプトを生成する。日本語表記のリストだけでなく英字表記のリストもサンプルファイルデータとすることで、生成したスクリプト205は、「設備」列が「エレベーター」の行であって「数」の列の欄の情報の総数と、「Equipment」列が「Elevator」の行であって「Number」の列の欄の情報の総数とを合算する処理を実行させるものとなっている。様々な表記のサンプルを入力することにより、いわゆる「表記のゆれ」に対応できるスクリプトの作成が可能となる。
【0043】
また、前述のようにスクリプトの処理が複雑になる場合には、複数ステップに分けて設定されたプロンプトそれぞれについてスクリプトを生成してもよい。また、生成されたスクリプトについて、ユーザが自ら修正を加えることも考えられる。
【0044】
また、様々なフォーマットのサンプルファイルデータを入力することで、それらの各フォーマットでのファイルデータからも適切に情報の取得を行うことができるスクリプトの生成が可能となる。前述の3次元モデルから「柱と梁の衝突箇所」を抽出する例においては、複数の異なる形式の3次元モデルをサンプルデータとして入力することで、多様なモデルのフォーマットに対応する汎用的なスクリプトを生成することができる。
【0045】
また、スクリプト生成部は、サンプルファイルデータに対する指定した所望情報の正解の情報である正解情報をさらに入力してスクリプトを生成するように構成することもできる。例えば、上記の例において、設定したサンプルファイルデータから抽出したエレベーター台数の総数が「241台」である場合には、この「241」が正解情報となる。この正解情報をもLLMに入力することで、より正確に所望情報を取得することができるスクリプトの生成に寄与する。
【0046】
ここで指定する正解情報は、数情報のみならず、スクリプトの処理結果となる3次元空間モデル、2次元図形、画像、文章など、どのようなフォーマットでもよい。また、正解情報はスクリプトの最終結果の情報のみならず、その処理過程における正解情報を与えてもよい。例えば、前述の3次元モデルから「柱と梁の衝突箇所」を抽出する例においては、(1)ファイルごとに含まれている柱と梁のモデル、(2)それらの衝突の有無、(3)衝突のある箇所を抽出した3次元空間の情報などを、処理過程における正解情報として与えてもよい。さらに、正解情報となる3次元モデルをユーザが指定することは操作上専門性を要するため、正解情報となる3次元モデルや3次元空間を簡易に指定できるような3次元ビューワーや表示部を搭載することも望ましい。
【0047】
<スクリプト蓄積部>
スクリプト蓄積部104は、前記生成したスクリプトを蓄積する機能を有する。スクリプト蓄積部を持つことで、一度設定されたスクリプトを再利用することができ、大量の対象となるファイルデータから再現性を持って値を取得することが可能となる。また、生成したスクリプトを用いて後述する所望情報取得部により取得した取得結果や、ともに入力した元のプロンプト及びサンプルファイルデータと関連付けて蓄積してもよい。
【0048】
<所望情報取得部>
所望情報取得部105は、前記生成したスクリプトにより前記対象となるファイルデータから前記指定した所望情報を取得する機能を有する。上述した対象となるファイルデータに対して生成したスクリプトを実行して、指定した所望情報を取得する処理を行う。取得した結果は保存することが好ましい。これは、後述するように、取得結果を検証したり、再整形したりするなどの後処理に取得結果を供するためである。
【0049】
また、所望情報取得部で取得された取得情報を、新たな対象となるファイルデータとして、別のスクリプトへ渡してもよい。つまり、本発明におけるスクリプトの生成と対象ファイルからの所望情報の取得は連結させることができ、より複雑な処理を構成することも可能である。
【0050】
以上のように、スクリプトの実行により所望情報を取得する処理を行うので、LLMを都度呼び出して、所望の情報を取得しようとする場合に対して、要する時間とコストを抑えることができ、また一定の抽出精度で再現性のある情報の抽出ができる。
【0051】
さらに、「その課題を解決するために静的なスクリプトを用意しようとしても、専門的な知識のあるエンジニアでしか自分でスクリプトを作れない」という問題があったが、LLMでスクリプトを生成することで、誰でも自らスクリプトを作成することができるという効果を得ることができる。
【0052】
<ハードウエア構成>
図3は、実施例1の情報処理装置を実現するハードウエアの構成例を示す概念図である。図示するように、情報処理装置300は、各種演算処理を行うCPU301と、揮発性記録媒体であるRAM302と、不揮発性の記憶媒体であるフラッシュメモリやHDDなどのストレージ303と、通信インタフェース304と、入出力インタフェース305と、を有している。RAM302は、各種演算処理を行うプログラムをCPU301に実行させるために読み出すとともに、そのプログラムのワーク領域(作業領域)を提供する。また、RAM302には、複数のアドレスが割り当てられており、CPU301で実行されるプログラムは、そのアドレスを特定しアクセスすることで相互にデータのやり取りを行い、処理を行うことが可能となっている(本明細書を通じて同様である)。
【0053】
ここで、図1の情報処理装置100のプロンプト設定部101、サンプル設定部102、スクリプト生成部103及び所望情報取得部105の各機能は、主に図3のCPU301、RAM302により実現される。また、スクリプト蓄積部105の機能は、主に図3のストレージ303により実現される。また、ファイルデータを蓄積するデータベースが外部に存在したり、抽出部が外部に存在するLLMなどの学習済み言語モデルを用いたりする場合には、通信インタフェース304や入出力インタフェース305を介して相互に信号や情報の授受を行うことで各機能が実現される。
【0054】
<処理の流れ>
図4は、実施例1の情報処理装置の処理の流れの一例を簡略に示すフロー図である。まず、対象となる 複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定する(S401:プロンプト設定ステップ)。そして、設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定する(S402:サンプル設定ステップ)。そして、設定したプロンプトと設定したサンプルファイルデータを学習済み言語モデルに入力して、指定した所望情報を取得するためのスクリプトを生成する(S403:スクリプト生成ステップ)。そして、生成したスクリプトを蓄積する(S404:スクリプト蓄積ステップ)。そして、生成したスクリプトにより前記対象となるファイルデータから前記指定した所望情報を取得する(S405:所望情報取得ステップ)。なお、サンプル設定ステップを、プロンプト設定ステップの先に行ってもよいし、両ステップを一体的に行ってもよい。また、スクリプト蓄積ステップは、所望情報取得ステップの後に行ってもよい。
【0055】
<効果>
本実施例の情報処理装置によれば、様々な情報を含むファイルデータ群から所望の情報の取得を、要する時間とコストを抑えて行うことができ、また一定の抽出精度で再現性のある情報の抽出ができる。
【0056】
<実施例2>
<概要>
本実施例は、実施例1を基本として、生成したスクリプトを評価したり修正したりする構成や、より詳細なプロンプトを設定する構成や、取得結果を検証する構成を、さらに含む情報処理装置である。
【0057】
<機能的構成>
図5は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。図5に示すように、情報処理装置500は、実施例1と同様に、第プロンプト設定部501と、サンプル設定部502と、スクリプト生成部503と、スクリプト蓄積部504と、所望情報取得部505を有し、さらに、スクリプト評価部506と、スクリプト修正部507と、詳細プロンプト設定部508と、検証部509を有する。実施例1と同様の構成についての説明は省略し、スクリプト評価部506、スクリプト修正部507、詳細プロンプト設定部508及び検証部509について、以下に説明する。
【0058】
<スクリプト評価部>
スクリプト評価部506は、前記生成したスクリプトにより前記サンプルファイルデータに対して前記指定した所望情報を取得した結果を前記正解情報と対比して評価する機能を有する。この正解情報は、実施例1のスクリプト生成部で述べた通りである。生成したスクリプトにより、サンプルファイルデータから実際に所望情報を取得して、その結果と正解情報を比較することで、どの程度正確なスクリプトであるかを評価することがきる。すなわち、取得した結果と正解情報とが合致すれば正確であると評価することができる。
【0059】
また、スクリプト生成部において、この評価結果をさらにLLMに入力するように構成することで、評価結果を踏まえたスクリプトを生成することができ、より正確なスクリプトの生成に役立たせることができる。例えば、取得した情報と正解情報が合致するまでスクリプトの再生成を続けるように構成することもできる。なお、スクリプトの評価は、スクリプト蓄積部に蓄積しているスクリプトに対して行ってもよい。
【0060】
<スクリプト修正部>
スクリプト修正部507は、前記生成したスクリプトと、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記生成したスクリプトを前記対象となるファイルデータに適応するよう修正する機能を有する。なお、修正に用いられる学習済み言語モデルは、上述したスクリプト生成部で用いられる学習済み言語モデルと同じものであってもよいし、別のものであってもよい。
【0061】
例えば、スクリプト作成の際に入力したサンプルファイルデータになかったファイル形式のファイルデータや取得すべき項目名などが対象となるファイルデータに含まれている場合には、所望情報を正確に取得できない場合が生じる。このような事態を防止するために、生成したスクリプトを対象となるファイルデータとともに学習済み言語モデルに入力する。
【0062】
そして、以下の例のようなプロンプトを与えることで、スクリプトを修正する。
「このスクリプトは、“CSVファイルから、建築物の設備の一覧のうちエレベーターを示す行を選択し、その総を示す列の情報を抽出して、その総数を求めよ”という目的に沿って作られたスクリプトです。
ただし、この処理対象のファイルデータでは正常に動作しない可能性があります。正常に動作しない箇所を見つけ出し、スクリプトを修正してください。」
例えば、「エレベーターの総数」を取得するために作成したスクリプトが、「設備」列が「エレベーター」の行であって「数」の列の欄の情報の総数と、「Equipment」列が「Elevator」の行であって「Number」の列の欄の情報の総数とを合算する処理を実行させるものである場合、対象となるファイルデータに、「設備」列が「昇降機」の行であって「数」の列の欄を有するファイルデータが含まれている場合には、このファイルデータの情報は取得の対象から漏れてしまい、正確な所望情報を得ることはできない。そこで、上記のようなプロンプトとともに作成済みのスクリプトと対象となるファイルデータとを学習済み言語モデルに入力することにより、対象となるファイルデータに適応したスクリプトの生成を行うことできる。
【0063】
ファイルデータに適応させるための修正は、対象となるファイルデータからファイルデータを一つずつLLMに入力して行ってもよいし、すべてのファイルデータをLLMに入力して行ってもよい。また、修正するスクリプトを作成する元となったプロンプトをさらに入力してもよい。
【0064】
また、上述したスクリプト蓄積部により蓄積されているスクリプトについても、生成したスクリプトに対する修正と同じように修正するように構成することもできる。対象となるファイルデータが増減したり変わったりすることにより、蓄積したスクリプトについて修正が必要になることもあるので、これについて修正可能に構成することは好ましい。
【0065】
<詳細プロンプト設定部>
詳細プロンプト設定部508は、前記設定したプロンプトにより指定される所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する機能を有する。以下に説明する詳細プロンプトの設定項目は、スクリプト生成において適用する項目や、対象となるファイルデータに対して適用する項目や、生成したスクリプトの実行により対象ファイルデータから所望情報を取得する場面で適用する項目もあるし、さらにはスクリプトの実行の後にLLMを用いた後処理において適用する項目であってもよい。詳細プロントが適用される態様は、様々に設定することができる。
【0066】
図6は、詳細プロンプトの設定項目(名称、説明、必要性)と、設定例(例)を例示する図であり、本例では、所望情報を指定するために設定されたプロンプトが、「柱と梁の衝突箇所を出力してください」というものである。
【0067】
例えば設定項目1は、「複数の所望情報名の付与」という名称であり、「文字の定義への正確な理解」のための設定項目であることが示されている。また、その説明として「抽出する所望情報を複数明示的に付与する」と示され、その例として「[“柱”,“Pillar”]」が示されている。この詳細プロンプトを設定することで、「柱と梁の衝突箇所を出力してください。」という指示について「柱」だけでなく、「Pillar」と記されたものも抽出の対象にする指示が付加される。
【0068】
他にも詳細プロンプトの設定項目として、文字の定義への正確な理解のために、抽出する所望情報の説明を付与する「所望情報の説明の付与」、誤抽出の抑制と出力結果のフォーマット統一のために、ユーザは抽出したいフォーマットを指定できる「フォーマット指定」、例外における処理や正確性の向上のために、特定の条件によって、抽出内容を変更する「条件設定」及び、LLMでのスクリプト生成の精度向上のために、LLMがスクリプトを生成する際に参考とするスクリプトを事前に設定する「サンプルスクリプトの提示」がある。もちろん、これらに限らずユーザが自ら種々の設定項目を設けて詳細プロンプトの設定を行うことができる。
【0069】
ここで、上述した各設定項目の適用方法であるが、大別すると、方法1の「ファイル内容を絞る」、方法2の「プロンプトを繋げる」及び方法3の「検出結果を確認し、再整形する」の3つ分けることができる。方法1は、LLMに入力する前に入力の対象となるファイルデータを絞り込むことを意味し、方法2は、設定した詳細プロンプトをメインプロンプトに繋げることを意味する。方法3は、抽出結果を、指定されたフォーマットなどに応じて再整形することを意味する。
【0070】
図7は、詳細プロンプトの各設定項目が適用される方法を示す図である。図示するように、「複数所望情報名の付与」、「所望情報の説明の付与」、「条件設定」及び「サンプルスクリプトの提示」の各項目は、方法2の「プロンプトを繋げる」が適用される。また、「フォーマット指定」は、方法1~方法3のすべてが適用される。適用例については後述する。
【0071】
図8は、詳細プロンプトを設定するときの入力画面の一例を示す概念図である。図示するように、画面801の上部左側には既に設定されているプロンプト「柱と梁の衝突箇所を出力してください」が表示されている。そして、画面の左側に「所望情報名」、「フォーマット指定」、「条件設定」及び「サンプルスクリプト」の各設定項目の入力欄802が表示されている。また、ユーザの操作によって、さらに別の設定項目の入力欄が表示される。これらの各入力欄に対するユーザの記入操作を受け付けることで、詳細プロンプトが設定される。そして、スクリプト生成部は、設定された詳細プロンプトを適用してスクリプトを生成し、あるいは所望情報取得部は、設定された詳細プロンプトを適用して所望情報の取得を行う。このように詳細プロンプトを設定することで、所望情報の取得精度向上を図ることができる。
【0072】
以上のような詳細プロンプトを適用した例を示す。例えば、「所望情報名」の項目において「“Pillar”も“柱”を指しています」と設定し、「条件設定」の項目において「柱が抽出できない場合は空白を出力してください」と設定した場合、この詳細プロンプトがメインプロンプトに繋げられて入力される。そして、「所望情報名」の適用により、「Pillar」と記された3次元モデルも柱として抽出されたうえで柱と梁の衝突箇所が出力される。また、対象となるファイルデータから柱が抽出できなかった場合には、空白が出力される。
【0073】
また、詳細プロンプト設定部は、詳細プロンプトを設定するにあたり、設定されたプロンプトに応じて自動的に各設定項目を設定するように構成することができる。あるいは、ユーザによる設定を受け入れつつ、設定されていない項目について、何らかの設定をお薦めするように構成してもよい。詳細プロンプトの設定をユーザから受け付けることで、ユーザの意向に柔軟かつ好適に抽出を行うことができるが、最適なプロンプトの設定を行うことがユーザにとって難しい場合もある。そこで、このように、詳細プロンプトの自動記入やサジェストの機能が有効である。これらの機能により、簡易化・操作性向上を図ることができる。
【0074】
また、簡易化・操作性向上を図るため、所望情報取得部は、対象となるファイルデータのすべてに対するスクリプトの実行処理の前に、設定したプロンプトと詳細プロンプトとを適用したテストを行うよう構成することも好ましい。このテストは、対象となるファイルデータのうちの一部に対してスクリプトの実行を行うことである。このテストの結果により、ユーザは設定したプロンプトや詳細プロンプトが自ら所望する結果をもたらすものか否かの判断をすることができ、より望ましい取得結果を得るためのプロンプト等の再設定を行うことができる。
【0075】
図8に示すように、画面801の左側であって、詳細プロンプトの入力欄802とプロンプトの表示欄803の下に「テスト」ボタン804が表示され、このボタンによりテストが行われる。そして、テストの結果が、図中において説明のために記した点線枠805の中に表示されている。ユーザは、このテストによる抽出結果に基づき、プロンプトの再設定や、テストの結果が得られたスクリプトによる実際の取得の処理を行うことができる。
【0076】
なお、本例では、詳細プロンプトの設定を、所望情報を指定するプロンプトの設定と別個に行う構成を用いたが、プロンプトと詳細プロンプトとを連続的・一体的に設定するように構成してもよい。
【0077】
<検証部>
検証部509は、前記所望情報取得部により取得した取得結果を検証する機能を有する。検証部による検証の具体的な態様は種々ある。以下に説明する検証は、LLMにプロンプトを入力して行うものでもいし、コーディングしたスクリプトの実行によるものでもよい。
【0078】
図9は、検証を行う際の種々の設定を例示する図である。図示するように、4種の設定を行うことができ、それぞれ「詳細プロンプト利用」、「検証プロンプト」、「検証スクリプト」及び「ファイル間比較」である。
【0079】
「詳細プロンプト利用」は、詳細プロンプトで設定した抽出の設定を検証に利用する。例えば、詳細プロンプトの設定項目である「フォーマット指定」において、フォーマットの指定を行っていた場合、その指定されたフォーマットと抽出結果を比較して、“抽出結果は指定フォーマットと所定の類似範囲にあるか?”という検証を行う。また、「条件設定」での設定を利用して“抽出できなかった場合に、空白が出力されているか?“という検証を行う。
【0080】
また、「検証プロンプト」は、検証用のプロンプトを独自に設定するものであり、例えば、“この情報が、エレベーターの扉の素材を示しているかどうかチェックしてください”といったプロンプトを設定して入力する。また、「検証スクリプト」は、検証用のスクリプトを独自に設定するものであり、例えば、図示するように、検出結果が「1」未満の場合に「Error」を返し、それ以外は「OK」を返す、といった命令を入力して検証する。
【0081】
また、「ファイル間比較」は、複数のファイルから抽出する際には、抽出結果を他ファイルと比較して妥当性を確認する。例示するように、抽出されたファイルA~ファイルDを比較すると、ファイルA、ファイルC、ファイルDはいずれも数字と記号のみの表記であるのに対して、ファイルBは漢字主体の表記となっている。このような場合に、「ファイルBは、他と比べて妥当ではない」という検証結果を得る。
【0082】
ここで、検証部により取得結果の検証をした場合、上述したスクリプト修正部は、その検証結果を反映させてスクリプトを修正するように構成することもできる。例えば、上述したように抽出結果の情報がエラーである場合、“前回の抽出では〇〇〇という情報を抽出していましたが、エラーの検証結果がでました。このエラー結果を考慮し、スクリプトを修正してください。”といった指示をLLMに入力してスクリプトの修正を行う。
【0083】
<ハードウエア構成>
本実施例の情報処理装置は、実施例1に準じ図3に示したハードウエア構成により実現することができる。図5に示した実施例2の情報処理装置に特有の構成であるスクリプト評価部506、スクリプト修正部507、詳細プロンプト設定部508及び検証部509の機能は、主に図3のCPU301、RAM302により実現される。
【0084】
<処理の流れ>
本実施例の情報処理装置の処理の流れは、実施例1の情報処理装置の処理の流れと基本的に同様である。そして、本実施例の情報処理装置においては、生成したスクリプトによりサンプルファイルデータに対して所望情報を取得した結果を正解情報と対比して評価するスクリプト評価ステップと、生成したスクリプトと、対象となるファイルデータの一部または全部を学習済み言語モデルに入力し、生成したスクリプトを対象となるファイルデータに適応するよう修正するスクリプト修正ステップと、設定したプロンプトによる所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定ステップと、所望情報取得ステップにて取得した取得結果を検証する検証ステップと、をさらに含む。
【0085】
<効果>
本実施例の情報処理装置によれば、所望情報取得の精度向上とロバスト性向上を図った情報処理装置を提供することができる。
【0086】
<付加機能>
実施例1または実施例2を基本として、さらに以下の機能的構成を付加した情報処理装置として構成することもできる。
【0087】
<フィルタリング部>
フィルタリング部は、対象となるファイルデータのうち所定のファイルデータを所望情報取得部による取得の対象から除去する機能を有する。フィルタリングする手法は種々存在する。例えば、ファイルの属性(拡張子、サイズ、ファイル名、ファイルに付随するデータ項目など)に基づきフィルタリングする。また、個別のキーワードを設定し、このキーワードに基づきフィルタリングする。具体的には、セマンティックサーチ、クラスタリング、文字検索などを行いフィルタリングするためのスクリプトを生成し、そのスクリプトを実行することによりフィルタリングがなされる。また、LLMに指示を与えてフィルタリングするようにしてもよい。例えば、“このファイルはエレベーターの内容を含んでいる?”という指示を入力することで、エレベーターの内容を含むか否かによりフィルタリングすることができる。
【0088】
このようなフィルタリング部の機能により、例えば、対象となる500個のファイルデータのうち、建築概要書からは面積を取得したいが、立面図は対象としてスキップしたいといったユーザの要望に応えることができる。
【0089】
<変換部>
変換部は、ファイルデータの特性に応じて対象となるファイルデータの形式を変換する機能を有する。なお、本情報処理装置が変換部を有する場合、所望情報取得部は、変換部により変換したファイルデータから取得を行う。例えば、ファイルデータがPDF形式である場合には、テキストファイルの形式に変換する。また、画像データの場合には、OCRにより文字認識をしてテキストファイルの形式に変換する。また3次元データの場合には2次元データや画像に変換してもよい。このような変換を行うことでロバスト性向上に寄与する。
【0090】
さらに、テキストファイルに変換する際に、テキストの位置情報を付与するように変換することも好ましい。図10は、PDF形式のファイルデータについて、位置情報を付与したテキストファイルに変換する例を示す概念図である。図10(a)は、住宅の建築面積表を示すPDF形式のファイルの一部を示している。図10(b)は、「形状」、「計算式」、「面積」の各テキストを、それらの位置情報とともに記述したJSON形式に変換した例を示している。また、図10(c)は、同様にテキストを位置情報とともに記述したArray形式に変換した例を示している。このように、位置情報を付与することで、テキスト間の関係性を考慮した抽出が行われ、ロバスト性向上に寄与する。また、図10(d)は、元のファイルにおいて「洋室1」、「洋室2」、「洋室3」のそれぞれの「面積」と「帖」を示した表を示していたテキストを、位置情報ではなくテーブル情報を持つテキスト(図中の点線枠内)に変換する例を示している。このように変換することで、テーブル構造を保持したまま取得の対象とすることができる。
【0091】
図11は、ファイルデータの形式を変換する他の例を示す概念図である。図11に示すように、図形を含むファイル(キッチン平面図)の場合は、SVG形式に変換し図形情報を持つテキストにしておくことで、スクリプトによる取得を行いやすくなる。また、逆に2次元のベクター情報をラスター画像のように変換してもよいし、3次元から2次元へのデータ変換などを行ってもよい。
【0092】
<データ削減部>
データ削減部は、対象となるファイルデータのデータ削減をする機能を有する。データ削減は様々な態様で行うことができる。例えば、対象となるファイルデータから特定の空間、プロパティ、エリア、特定のページやセクション、パラグラフ、テーブルなどに絞ることでデータ削減する。また、ファイルの属性(ページ番号、位置など)でフィルタリングしたり、個別のキーワードでフィルタリングしたり(セマンティックサーチ、クラスタリング、文字検索)、空間の位置(x,y,z,座標)でフィルタリングしたりすることができる。また、LLMに指示を入力してフィルタリングすることもできる(“このファイルはエレベーターの内容を含んでいる?)。
【0093】
図12は、データ削減の他の態様について示す概念図である。図12(a)に示すように、一のファイルデータ1201において特定の箇所1202を切り取って、その中に目的のデータが含まれているかをチェックする。その結果、目的のデータが含まれていれば、その箇所を所望情報取得の取得処理に供する。含まれなかった場合には、先の箇所からずらした箇所1203を切り取って、同様にチェックを行う。このように取得する前のチェックで目的のデータを含まないものを取得の対象から除外することで処理効率の向上を図ることができる。なお、このチェックは、スクリプトの実行により行ってもよいし、LLMを用いて行ってもよいし、その他の手法によってもよい。また、このような処理は3次元空間上で実施してもよい。
【0094】
また、図12(b)に示すように、特定の箇所をずらしながら上述のチェックを行い、目的のデータを含む箇所をメモリ1204に一時保管する。そして、処理メモリ1204が目的のデータを取得するために必要な要素をすべて含んでいるかチェックし、すべて含んでいる場合は、メモリに保持されている箇所を所望情報取得部での取得処理に供する。一方、すべて含んでいない場合には、特定の箇所をさらにずらして上述のチェックからの一連の処理を繰り返す。
【0095】
<根拠表示部>
根拠表示部は、所望情報取得部により取得した取得結果について、その取得結果が取得された根拠を表示する機能を有する。
【0096】
本情報処理方法は、所望情報を指定するためのプロンプトを設定し、サンプルファイルデータとともにLLMに入力することで生成したスクリプトの実行により所望情報を取得するこができる。一方で、所望情報を得るのに最適なスクリプトを生成するためのプロンプトの設定が難しい場合も有る。そこで、取得結果に至った根拠(途中プロセスなど)を表示することで、ユーザに対して「何をどうすれば取得結果を改善できるか」ということを示すことができる。
【0097】
図13は、根拠として画像上の位置を表示する例を示す概念図である。図示しているのは、住宅の建築面積表を示すPDF形式のファイルであり、このファイルから取得された情報(文字)の位置を画像上で太点線の枠1301で囲んで強調表示している。これにより、ユーザは取得結果がどこから取得されたかが分かる。また、3次元モデルを処理するスクリプトなどでは、そのスクリプトの処理過程の表示や、その際に利用された情報の強調表示などをすることも根拠の確認に有用である。
【0098】
また、取得した理由を説明する表示をしてもよい。例えば、事前処理として取得前にLLMに「この情報を取得結果として出力した理由を、詳細のプロセスごとに出力してください」という指示を入力しておく。すると、取得した後に取得結果を示すとともに、例えば「Z-01301は、”図面番号”というテキストの140px右に位置しており、また、指定された正規表現と合致するため、Z-01301を図面番号として抽出しました。」という根拠が表示される。このように、自ら設定したプロンプトと、それにより生成されたスクリプトが取得結果に及ぼす作用が示されることで、ユーザは種々の設定について省みることができ所望情報取得の最適化に資することができる。
【0099】
<実施例3>
<概要>
本実施例は、実施例1または実施例2の情報処理装置に準じる情報処理装置である。
【0100】
<機能的構成>
図14は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。図14に示すように、情報処理装置1400は、スクリプト保持部1401と、保持スクリプト修正部1402と、第2所望情報取得部1403と、を有する。
【0101】
<スクリプト保持部>
スクリプト保持部1401は、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持する機能を有する。実施例1においては、スクリプト生成部により生成したスクリプトがスクリプト修正部による修正の対象であったが、本実施例では、事前に作成・設定されたスクリプトがスクリプト保持部に保持されている。保持されているスクリプトの内容は、実施例1や実施例2におけるスクリプトと同様であるので、重ねての説明は省略する。
【0102】
<保持スクリプト修正部>
保持スクリプト修正部1402は、前記保持しているスクリプトを、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記保持しているスクリプトを前記対象となるファイルデータに適応するよう修正する機能を有する。
【0103】
保持スクリプト修正部の機能は、修正の対象をスクリプト保持部が保持しているスクリプトとなることの他は、実施例1や実施例2におけるスクリプト修正部の機能と同じである。そのため、ここで重ねて説明することは省略する。
【0104】
また、保持しているスクリプトを修正するためのプロンプトをさらに学習済み言語モデルに入力してスクリプトの修正を行うように構成することもできる。このプロンプトは、どのように修正すべきかを指示するものであり、例えば、取得の対象として適応すべきファイル形式やフォーマットなどを指定したり、除去すべきデータを指定したりするといったものである。
【0105】
<第2所望情報取得部>
第2所望情報取得部1403は、前記修正したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する機能を有する。第2所望情報取得部の機能は、所望情報の取得が保持スクリプト修正部により修正されたスクリプトであることの他は、実施例1や実施例2における所望情報取得部の機能と同じである。そのため、ここで重ねて説明することは省略する。
【0106】
<ハードウエア構成>
本実施例の情報処理装置は、実施例1または実施例2に準じ図3に示したハードウエア構成により実現することができる。図14に示した実施例3の情報処理装置の保持スクリプト修正部1402と第2所望情報取得部1403の機能は、主に図3のCPU301、RAM302により実現される。また、スクリプト保持部1401の機能は、主に図3のストレージ303により実現される。
【0107】
<処理の流れ>
図15は、本実施例の情報処理装置の処理の流れの一例を示すフロー図である。まず、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持する(S1501:スクリプト保持ステップ)。そして、保持しているスクリプトを、対象となるファイルデータの一部または全部を学習済み言語モデルに入力し、保持しているスクリプトを対象となるファイルデータに適応するよう修正する(S1502:保持スクリプト修正ステップ)。そして、修正したスクリプトにより対象となる複数のファイルデータから所望情報を取得する(S1503:変換ステップ)。
【0108】
<効果>
本実施例の情報処理装置によれば、事前に設定され保持されているスクリプトを修正可能にすることで、対象となるファイルデータに適応したスクリプトにより所望情報の取得を行うことができる。
【符号の説明】
【0109】
100、500:情報処理装置
101、501:プロンプト設定部
102、502:サンプル設定部
103、503:スクリプト生成部
104、504:スクリプト蓄積部
105、505:所望情報取得部
506:スクリプト評価部
507:スクリプト修正部
508:詳細プロンプト設定部
509:検証部
301:CPU
302:RAM
303:ストレージ
304:通信インタフェース
305:入出力インタフェース
1400:情報処理装置
1401:スクリプト保持部
1402:保持スクリプト修正部
1403:第2所望情報取得部

【要約】
【課題】従来技術では、情報収集の処理のたびにLLMを呼び出すことになるので、時間とコストがかかってしまうという問題があった。
【解決手段】上記課題を解決するために、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定するプロンプト設定部と、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定部と、前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、前記指定した所望情報を取得するためのスクリプトを生成するスクリプト生成部と、前記生成したスクリプトにより前記対象となるファイルデータから前記指定した所望情報を取得する所望情報取得部と、を有する情報処理装置を提供する。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15