(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-12-20
(45)【発行日】2025-01-06
(54)【発明の名称】情報処理システム、情報処理方法、およびプログラム
(51)【国際特許分類】
G06F 40/279 20200101AFI20241223BHJP
【FI】
G06F40/279
(21)【出願番号】P 2024050920
(22)【出願日】2024-03-27
【審査請求日】2024-04-03
【早期審査対象出願】
(73)【特許権者】
【識別番号】514020389
【氏名又は名称】TIS株式会社
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】小林 祐也
(72)【発明者】
【氏名】園田 健太郎
【審査官】長 由紀子
(56)【参考文献】
【文献】特許第7403023(JP,B1)
【文献】中国特許出願公開第116703337(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-58
G06F 16/00-958
(57)【特許請求の範囲】
【請求項1】
文字を含むテキスト情報を取得するテキスト情報取得部と、
ユーザの操作入力に基づいて、前記テキスト情報から抽出する対象の抽出情報に関する抽出項目を取得する項目取得部と、
抽出の対象として設定され得る設定候補項目と、前記テキスト情報から前記抽出情報を抽出するように学習された生成AI装置に入力するクエリ情報と、を関連づけて格納するクエリデータベースに基づいて、前記抽出項目に対応する前記設定候補項目に関連づけられる抽出クエリ情報を特定するクエリ情報特定部と、
前記テキスト情報に含まれる文字の所定のまとまりであるブロックテキスト情報と、当該文字の所定のまとまりの区分である抽出用ラベルと、を関連づけて格納するテキストデータベースに基づいて、前記抽出項目に対応する前記抽出用ラベルに関連づけられる抽出ブロックテキスト情報を特定するブロックテキスト情報特定部と、
前記抽出クエリ情報と、前記抽出ブロックテキスト情報と、を前記生成AI装置に送信する送信部と、
前記生成AI装置から、前記抽出ブロックテキスト情報に含まれる前記抽出情報を取得する抽出情報取得部と、
を備える情報処理システム
。
【請求項2】
前記抽出用ラベルと、テキスト情報に含まれるテキストの特徴であるテキスト特徴と、の対応関係に基づいて、前記ブロックテキスト情報に前記抽出用ラベルを関連づけるラベル設定部をさらに備える、
請求項1に記載の情報処理システム。
【請求項3】
前記テキスト情報に表形式のデータが含まれる場合、当該表形式のデータにおいて前記抽出項目に対応する項目の有無を判定する判定部をさらに備え、
前記抽出情報取得部は、前記判定部において前記抽出項目に対応する項目が有ると判定された場合、当該表形式のデータにおいて前記抽出項目に対応する項目に関連する情報を、前記抽出情報として取得する、
請求項1または請求項2に記載の情報処理システム。
【請求項4】
前記送信部は、前記判定部において前記抽出項目に対応する項目が無いと判定された場合、前記抽出クエリ情報と、前記抽出ブロックテキスト情報と、を前記生成AI装置に送信する、
請求項3に記載の情報処理システム。
【請求項5】
コンピュータが、
文字を含むテキスト情報を取得するテキスト情報取得部と、
ユーザの操作入力に基づいて、前記テキスト情報から抽出する対象の抽出情報に関する抽出項目を取得することと、
抽出の対象として設定され得る設定候補項目と、前記テキスト情報から前記抽出情報を抽出するように学習された生成AI装置に入力するクエリ情報と、を関連づけて格納するクエリデータベースに基づいて、前記抽出項目に対応する前記設定候補項目に関連づけられる抽出クエリ情報を特定することと、
前記テキスト情報に含まれる文字の所定のまとまりであるブロックテキスト情報と、当該文字の所定のまとまりの区分である抽出用ラベルと、を関連づけて格納するテキストデータベースに基づいて、前記抽出項目に対応する前記抽出用ラベルに関連づけられる抽出ブロックテキスト情報を特定することと、
前記抽出クエリ情報と、前記抽出ブロックテキスト情報と、を前記生成AI装置に送信することと、
前記生成AI装置から、前記抽出ブロックテキスト情報に含まれる前記抽出情報を取得することと
、
を実行する情報処理方法。
【請求項6】
コンピュータに、
文字を含むテキスト情報を取得するテキスト情報取得部と、
ユーザの操作入力に基づいて、前記テキスト情報から抽出する対象の抽出情報に関する抽出項目を取得することと、
抽出の対象として設定され得る設定候補項目と、前記テキスト情報から前記抽出情報を抽出するように学習された生成AI装置に入力するクエリ情報と、を関連づけて格納するクエリデータベースに基づいて、前記抽出項目に対応する前記設定候補項目に関連づけられる抽出クエリ情報を特定することと、
前記テキスト情報に含まれる文字の所定のまとまりであるブロックテキスト情報と、当該文字の所定のまとまりの区分である抽出用ラベルと、を関連づけて格納するテキストデータベースに基づいて、前記抽出項目に対応する前記抽出用ラベルに関連づけられる抽出ブロックテキスト情報を特定することと、
前記抽出クエリ情報と、前記抽出ブロックテキスト情報と、を前記生成AI装置に送信することと、
前記生成AI装置から、前記抽出ブロックテキスト情報に含まれる前記抽出情報を取得することと
、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
生成AI装置を用いてテキストデータからの自動仕訳を行なう会計処理システムが開示されている(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載の会計処理システムは、証憑データから画像認識処理により取引情報を抽出し、抽出した取引情報から文字認識処理により取引明細情報を含むテキスト情報を生成する。また、会計処理システムは、当該取引明細情報に対応する勘定科目の組み合わせを選定することを学習した仕訳生成AIを用いて、当該テキスト情報から仕訳データを生成する。これにより、会計処理システムは適切な自動仕訳を実行することが可能となる。
【0005】
しかし、特許文献1に記載の会計処理システムでは、仕訳生成AIを用いるものの、当該仕訳生成AIに入力する仕訳データを生成させるためのクエリ情報が適切でない場合、テキスト情報から適切に仕訳データを生成できないという問題が生じる。
【0006】
そこで、本発明は、上記の課題を解決するために、テキスト情報に含まれる情報を生成AI装置から適切に取得可能なシステムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一態様に係る情報処理システムは、文字を含むテキスト情報を取得するテキスト情報取得部と、ユーザの操作入力に基づいて、前記テキスト情報から抽出する対象の抽出情報に関する抽出項目を取得する項目取得部と、抽出の対象として設定され得る設定候補項目と、前記テキスト情報から前記抽出情報を抽出するように学習された生成AI装置に入力するクエリ情報と、を関連づけて格納するクエリデータベースに基づいて、前記抽出項目に対応する前記設定候補項目に関連づけられる抽出クエリ情報を特定するクエリ情報特定部と、前記抽出クエリ情報と、前記テキスト情報と、を前記生成AI装置に送信する送信部と、前記生成AI装置から、前記テキスト情報に含まれる前記抽出情報を取得する抽出情報取得部と、を備える。
【0008】
本発明の一態様に係る情報処理方法は、コンピュータが、文字を含むテキスト情報を取得するテキスト情報取得部と、ユーザの操作入力に基づいて、前記テキスト情報から抽出する対象の抽出情報に関する抽出項目を取得することと、抽出の対象として設定され得る設定候補項目と、前記テキスト情報から前記抽出情報を抽出するように学習された生成AI装置に入力するクエリ情報と、を関連づけて格納するクエリデータベースに基づいて、前記抽出項目に対応する前記設定候補項目に関連づけられる抽出クエリ情報を特定することと、前記抽出クエリ情報と、前記テキスト情報と、を前記生成AI装置に送信することと、前記生成AI装置から、前記テキスト情報に含まれる前記抽出情報を取得することと、を実行する。
【0009】
本発明の一態様に係るプログラムは、コンピュータに、文字を含むテキスト情報を取得するテキスト情報取得部と、ユーザの操作入力に基づいて、前記テキスト情報から抽出する対象の抽出情報に関する抽出項目を取得することと、抽出の対象として設定され得る設定候補項目と、前記テキスト情報から前記抽出情報を抽出するように学習された生成AI装置に入力するクエリ情報と、を関連づけて格納するクエリデータベースに基づいて、前記抽出項目に対応する前記設定候補項目に関連づけられる抽出クエリ情報を特定することと、前記抽出クエリ情報と、前記テキスト情報と、を前記生成AI装置に送信することと、前記生成AI装置から、前記テキスト情報に含まれる前記抽出情報を取得することと、を実行させる。
【発明の効果】
【0010】
本発明によれば、テキスト情報に含まれる情報を生成AI装置から適切に取得可能なシステムを提供することができる。
【図面の簡単な説明】
【0011】
【
図2】クエリデータベース101aの一例を示すデータベースである。
【
図3】テキストデータベース101bの一例を示すデータベースである。
【
図4】ラベルデータベース101cの一例を示すデータベースである。
【
図5】抽出システムの処理手順を示すフローチャートである。
【
図7】生成AI装置に入力される抽出クエリ情報および抽出ブロックテキスト情報の一例を示す図である
【
図8】生成AI装置から出力される抽出情報の一例を示す図である。
【
図9】コンピュータのハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0012】
以下に、本発明の一実施形態における抽出システム10について、図面を参照して詳細に説明する。ただし、以下に説明する実施形態は、あくまでも例示であり、以下に明示しない種々の変形や技術の適用を排除する意図はない。すなわち、本発明は、その趣旨を逸脱しない範囲で種々変形し、または各実施例を組み合わせるなどして実施することができる。また、以下の図面の記載において、同一または類似の部分には同一または類似の符号を付して表している。
【0013】
また、本実施形態において、「部」、「装置」、「システム」とは、単に物理的手段を意味するものではなく、その「部」、「装置」、「システム」が有する機能をソフトウェアによって実現する場合も含む。また、一つの「部」、「装置」、「システム」が有する機能が2つ以上の物理的手段や装置により実現されてもよく、二つ以上の「部」、「装置」、「システム」の機能が1つの物理的手段や装置により実現されてもよい。さらには、抽出システム10を構成する複数の装置のそれぞれの以下に示す各種機能が、当該複数の装置における他の装置によって実行されるように構成されていてもよい。
【0014】
===抽出システム10の概要===
<<構成の概要>>
図1を参照して、抽出システム10の概要について説明する。
図1は、抽出システム10の概要を示す図である。
【0015】
抽出システム10は、光学式文字認識装置を用いて対象画像に基づき生成されたデジタル文書に含まれるテキストのうち、ユーザが所望するテキストを抽出するシステムである。
【0016】
対象画像は、例えば各種契約書や論文などの画像である。対象画像は、例えば、JPEG(Joint Photographic Experts Group)、TIFF(Tagged Image File Format)、PNG(Portable Network Graphics)等のグラフィックフォーマットで指定された画像やPDF(Portable Document Format)データの画像である。
【0017】
抽出システム10は、例えば、抽出装置100と、光学式文字認識装置200と、ユーザ端末300とを含む。
【0018】
抽出装置100は、光学式文字認識装置による対象画像の文字認識の結果に基づき、対象画像の文字認識の結果を出力する装置である。
【0019】
光学式文字認識装置200は、対象画像に対して文字認識を実行する装置である。
【0020】
抽出装置100および光学式文字認識装置200は、例えば、クラウドコンピュータ、サーバコンピュータ、パーソナルコンピュータ(例えば、デスクトップ、ラップトップ、タブレットなど)、メディアコンピュータプラットホーム(例えば、ケーブル、衛星セットトップボックス、デジタルビデオレコーダ)、ハンドヘルドコンピュータデバイス(例えば、PDA、電子メールクライアントなど)、あるいは他種のコンピュータ、またはコミュニケーションプラットホームであってもよい。なお、抽出装置100および光学式文字認識装置200における処理の少なくとも一部は、1以上のコンピュータ(限定ではなく例として、1以上のコンピュータにより構成されるクラウドコンピューティング)により実現されていてもよい。
【0021】
ユーザ端末300は、ユーザの操作入力を受け付けて各種情報を表示する装置である。
【0022】
ユーザ端末300は、例えば、スマートフォン、携帯電話(フィーチャーフォン)、パーソナルコンピュータ(例えば、デスクトップ、ラップトップ、タブレットなど)、メディアコンピュータプラットホーム(例えば、ケーブル、衛星セットトップボックス、 デジタルビデオレコーダ)、ハンドヘルドコンピュータデバイス(例えば、PDA(Personal Digital Assistant)、電子メールクライアントなど)、ウェアラブル端末(メガネ型デバイス、時計型デバイスなど)、他種のコンピュータ、またはコミュニケーションプラットホームであってもよい。
【0023】
<<処理の概要>>
図1を参照して、抽出システム10の処理の概要について説明する。
【0024】
まず、ステップS10において、抽出装置100は、光学式文字認識装置200から対象画像に基づき生成されたテキスト情報(以下、「対象テキスト情報」という。)を取得する。
【0025】
ステップS11において、抽出装置100は、対象テキスト情報に含まれる文字の所定のまとまりのテキスト情報(以下、「ブロックテキスト情報」という。)を特定する。抽出装置100は、ブロックテキスト情報ごとに、ブロックテキスト情報の区分を示すラベル(以下、「抽出用ラベル」という。)を付与する。抽出装置100は、ブロックテキスト情報と、抽出用ラベルとを関連づけて記憶部101(後述のラベルデータベースD101c)に格納する。
【0026】
ブロックテキスト情報は、例えば、複数の文のまとまりのテキスト情報であってもよいし、複数の単語のまとまりである一文のテキスト情報であってもよい。具体的には、ブロックテキスト情報は、例えば、契約書や論文などにおいて、少なくとも一つの文を一つのまとまりのテキスト情報としてもよいし、少なくとも一つの、条、項または段落のそれぞれを一つのまとまりのテキスト情報としてもよいし、少なくとも一つの章を一つのまとまりのテキスト情報としてもよいし、表形式でまとまりのある情報を一つのまとまりのテキスト情報であってもよい。
【0027】
ステップS12において、ユーザ端末300は、ユーザの操作入力を受け付けて、テキスト情報から抽出する対象の情報(以下、「抽出情報」という。)に関する区分である項目(以下、「抽出項目」という。)を取得する。ユーザ端末300は、抽出項目を抽出装置100に送信する。
【0028】
ステップS13において、抽出装置100は、ラベルデータベースD111を参照して、抽出項目に対応する抽出用ラベルを特定する。そして、抽出装置100は、テキストデータベースD101bを参照して、特定した抽出用ラベルに関連するブロックテキスト情報(以下、「抽出ブロックテキスト情報」という。)を特定する。
【0029】
ステップS14において、抽出装置100は、クエリデータベースD112を参照して、特定した抽出用ラベルに対応する設定候補項目を特定し、当該設定候補項目に基づき、生成AI(Artificial Intelligence)装置に入力するクエリ情報(以下、「抽出クエリ情報」という。)を特定する。
【0030】
生成AI装置は、深層学習モデルをベースにした巨大なデータセットを有する大規模言語モデル(以下、「生成AI」という。)の機能を有する装置である。生成AIは、例えば、クエリ情報に基づき抽出情報を抽出するように学習されたテキスト生成系AIであり、例えばChatGPTやGoogle Bardなどである。
【0031】
クエリ情報は、生成AI装置に入力する文章であり、いわゆる、生成AIに与える命令文であるプロンプトである。すなわち、抽出クエリ情報は、ブロックテキスト情報から所定のテキスト情報を抽出するために、生成AI装置に入力する命令文である。
【0032】
ステップS15において、抽出装置100は、抽出ブロックテキスト情報と、抽出クエリ情報とを生成AI装置に送信する。
【0033】
ステップS16において、抽出装置100は、生成AI装置から、ブロックテキスト情報からテキスト情報が抽出された結果である抽出情報を取得する。
【0034】
これにより、抽出装置100は、対象テキスト情報からユーザが所望する情報を生成AI装置から適切に抽出することができる。
【0035】
===抽出装置100===
図1に示すように、抽出装置100は、記憶部101と、テキスト情報取得部102と、ラベル設定判定部103と、項目取得部104と、ブロックテキスト情報特定部105と、クエリ情報特定部106と、送信部107と、抽出情報取得部108と、表示処理部109とを含む。
【0036】
記憶部101は、例えば、クエリデータベースD101aと、テキストデータベースD101bと、ラベルデータベースD101cとを含む。
【0037】
図2を参照して、クエリデータベースD101aについて説明する。
図2は、クエリデータベース101aの一例を示すデータベースである。クエリデータベースD101aは、抽出対象として設定され得る項目である設定候補項目とクエリ情報を関連づけて格納するデータベースである。クエリデータベースD101aは、生成AI装置に入力するクエリを特定するためのデータベースである。
【0038】
図2に示すように、クエリデータベースD101aは、例えば、[候補ID]、[設定候補項目]、[クエリ情報]などの項目を含む。[候補ID]は、設定候補項目を一意に識別可能な識別情報が格納される。[設定候補項目]は、設定候補項目を示すテキスト情報が格納される。[クエリ情報]は、生成AI装置に入力するクエリ情報が格納される。
【0039】
クエリ情報は、テキスト情報から設定候補項目に関する抽出情報を生成AI装置に抽出させるために最適化されたプロンプトである。クエリ情報は、例えば抽出要件および抽出例などの項目を含む。抽出要件は、適切な情報を抽出するための情報であり、例えば抽出したい情報の特徴や抽出方法などの情報である(例えば後述する
図7の抽出要件T21)。抽出例は、抽出の精度を向上させるための情報であり、例えば入力に対する抽出結果の例示などの情報である(例えば後述する
図7の抽出例T22)。
【0040】
抽出装置100は、クエリデータベースD101aを用いることにより、ユーザが所望する抽出情報を生成AIから得るためのクエリ情報を生成AI装置に入力することが可能となる。
【0041】
図3を参照して、テキストデータベースD101bについて説明する。
図3は、テキストデータベース101bの一例を示すデータベースである。テキストデータベース101bは、ブロックテキスト情報とブロックテキスト情報の区分を示す抽出用ラベルを関連づけて格納するデータベースである。
【0042】
図3に示すように、テキストデータベースD101bは、例えば、[テキストID]、[テキスト情報]、[ブロックID]、[ブロックテキスト情報]、[抽出用ラベル]などの項目を含む。[テキストID]は、対象テキスト情報を一意に識別可能な識別情報が格納される。[テキスト情報]は、対象テキスト情報が格納される。[ブロックID]は、ブロックテキスト情報を一意に識別可能な識別情報が格納される。[ブロックテキスト情報]は、対象テキスト情報のうちの所定のまとまりのブロックテキスト情報が格納される。[抽出用ラベル]は、ブロックテキスト情報の区分を示すラベルが格納される。
【0043】
抽出装置100は、テキストデータベースD101bを用いることにより、ユーザが所望する抽出情報を生成AIから得るためのクエリ情報をクエリデータベースD101aから適切に抽出することが可能となる。
【0044】
図4を参照して、ラベルデータベースD101cについて説明する。
図4は、ラベルデータベース101cの一例を示すデータベースである。ラベルデータベース101cは、区分を示すラベルとテキスト情報を関連づけて格納するデータベースである。
【0045】
図4に示すように、ラベルデータベースD101cは、例えば、[ラベルID]、[抽出用ラベル]、[テキスト特徴]などの項目を含む。[ラベルID]は、ラベルを一意に識別可能な識別情報が格納される。[ラベル]は、ブロックテキスト情報に付与する抽出用ラベルが格納される。[テキスト特徴]は、抽出用ラベルが関連づけられるブロックテキスト情報に含まれるテキストのテキスト特徴が格納される。テキスト特徴は、例えば、単語、複数の単語の組み合わせ、表形式の領域に含まれる単語や単語の組み合わせなどを示す情報である。具体的には、例えば、抽出用ラベル「会社名称」に対応するテキスト特徴は、「「甲」、「乙」、「契約」のすべてを含むテキスト」という条件である。
【0046】
抽出装置100は、ラベルデータベースD101cを用いることにより、対象テキスト情報に含まれるブロックテキスト情報に対して適切に抽出用ラベルを付与して、テキストデータベースD101bを生成することができる。すなわち、抽出装置100(後述するラベル設定判定部103)は、ブロックテキスト情報に含まれる、単語(例えば「第2条」)、複数の単語の組み合わせ(例えば、「甲」、「乙」、「契約」の組み合わせ)および表形式の領域(例えば、罫線と当該罫線で囲まれる単語の組み合わせ)を含むブロックテキスト情報のそれぞれに対して抽出用ラベルを付与することができる。
【0047】
テキスト情報取得部102は、光学式文字認識装置200において対象画像に基づき生成されたテキスト情報を、例えば光学式文字認識装置200から取得する。
【0048】
ラベル設定判定部103は、対象テキスト情報に含まれるブロックテキスト情報を特定する。そして、ラベル設定判定部103は、抽出用ラベルと、テキスト情報に含まれるテキストのテキスト特徴との対応関係に基づき、当該ブロックテキスト情報に抽出用ラベルを関連づける。ラベル設定判定部103は、ブロックテキスト情報に抽出用ラベルを関連づけてテキストデータベースD101bに格納する。
【0049】
具体的には、まず、ラベル設定判定部103は、対象テキスト情報に含まれるテキストを例えば形態素解析による分析を実行して、対象テキスト情報をブロックテキスト情報に区分する。例えば、ラベル設定判定部103は、対象画像が契約書である場合、対象テキスト情報に「第2条」のテキストを特定すると、契約書の「第2条」に規定される文章をブロックテキスト情報として区分する。
【0050】
そして、ラベル設定判定部103は、例えば、ラベルデータベースD101cに基づきブロックテキスト情報に抽出用ラベルを関連づけてもよい。具体的には、ラベル設定判定部103は、ラベルデータベースD101cを参照して、テキスト特徴のいずれかを充たすブロックテキスト情報に対して、当該テキスト特徴に対応するラベルを抽出用ラベルとして関連づける。ラベル設定判定部103は、ブロックテキスト情報に抽出用ラベルを関連づけてテキストデータベースD101bに格納する。なお、対象テキスト情報に含まれるテキストの解析手法は例えば形態素解析などの手法である。
【0051】
なお、ラベル設定判定部103は、例えば、抽出用ラベルと、テキスト情報に含まれるテキスト特徴とを教師データとして学習された学習済みモデルに対して、ブロックテキスト情報を入力することにより、当該ブロックテキスト情報に抽出用ラベルを関連づけてもよい。具体的には、ラベル設定判定部103は、例えば、学習済みモデルにブロックテキスト情報を入力することにより、当該ブロックテキスト情報に関連する確率が所定の閾値以上を示す少なくとも一つの抽出用ラベルを、学習済みモデルから取得する。ラベル設定判定部103は、取得した抽出用ラベルのうちの例えば最も高い確率を示す抽出用ラベルを当該ブロックテキスト情報に関連づけて、テキストデータベースD101bに格納する。
【0052】
項目取得部104と、ユーザによるユーザ端末300に対する操作入力に基づき抽出項目を取得する。具体的には、項目取得部104は、例えば、対象画像が契約書である場合、ユーザがユーザ端末300に対して入力した「会社名称」を抽出項目として、ユーザ端末300から取得する。
【0053】
ブロックテキスト情報特定部105は、テキストデータベースD101bを参照して、抽出項目に対応するブロックテキスト情報である抽出ブロックテキスト情報を特定する。具体的には、ブロックテキスト情報特定部105は、テキストデータベースD101bにおいて、例えば抽出項目である「会社名称」に対応する、抽出用ラベルである「会社名称」を特定する。そして、ブロックテキスト情報特定部105は、テキストデータベースD101bを参照して、抽出用ラベルである「会社名称」に関連する、ブロックテキスト情報である「第2条・・」を特定する。
【0054】
クエリ情報特定部106と、クエリデータベースD101aを参照して、抽出クエリ情報を特定する。具体的には、クエリ情報特定部106は、クエリデータベースD101aにおいて、例えば抽出項目である「会社名称」に対応する、設定候補項目である「会社名称」を特定する。クエリ情報特定部106は、クエリデータベースD101aにおいて、設定候補項目である「会社名称」に関連する抽出クエリ情報を特定する。
【0055】
送信部107は、生成AI装置から抽出情報を取得するための抽出クエリ情報を送信する。具体的には、送信部107は、抽出クエリ情報とブロックテキスト情報とを生成AI装置に送信する。
【0056】
抽出情報取得部108は、生成AI装置からテキスト情報に含まれる抽出情報を取得する。具体的には、抽出情報取得部108は、対象画像が契約書である場合、例えば契約書から抽出項目「会社名称」である株式会社Aなどを示す抽出情報を取得する。
【0057】
表示処理部109は、各種情報を表示部に表示させる。例えば、表示処理部109は、後述する
図7および
図8に示す情報を表示部に表示させる。
【0058】
<<第1の変形例>>
ラベル設定判定部103は、対象テキスト情報に表形式のデータが含まれる場合、当該表形式の領域に含まれるテキスト情報について、抽出項目に対応するテキスト情報の有無を判定してもよい。
【0059】
具体的には、ラベル設定判定部103は、
図6に示すブロックB30の表形式のテキスト情報を特定する。ラベル設定判定部103は、ラベルデータベースD101cのテキスト特徴に基づき、ブロックB30に対して抽出用ラベルを関連づける。このとき、ラベル設定判定部103は、ブロックB30の表題(
図6では「賃借要件」)に抽出用ラベルを関連づけてもよい。ラベル設定判定部103は、抽出項目に対応する抽出用ラベルに関連するブロックB30であって、当該ブロックB30に含まれるテキスト情報のうち、抽出情報に対応するテキスト情報が含まれるかを判定する。このとき、ラベル設定判定部103は、ブロックB30の罫線を特定して、罫線で囲まれている領域のそれぞれに記載されているテキスト情報について、抽出項目に対応するか否かを判定してもよい。
【0060】
そして、抽出装置100は、ラベル設定判定部103において抽出項目に対応するテキスト情報(項目)が有ると判定された場合、当該表形式のデータにおいて抽出項目に対応する項目に関連する情報を、抽出情報として取得する。
【0061】
一方、抽出装置100は、ラベル設定判定部103において抽出項目に対応するテキスト情報(項目)が無いと判定された場合、上述したとおり、抽出クエリ情報と、抽出ブロックテキスト情報とを生成AI装置に送信して、生成AI装置から抽出情報を取得する。
【0062】
このように、抽出装置100は、対象テキスト情報において項目とテキスト内容との対応関係が明確な情報がある場合はルールベースで抽出情報を取得し、ルールベースで抽出情報を取得できない場合に生成AI装置を利用して抽出情報を取得するように構成されていてもよい。これにより、抽出装置100は、生成AI装置を用いる頻度を減少させるとともに、適切な抽出情報を取得する精度を向上させることが可能となる。
【0063】
<<第2の変形例>>
抽出装置100は、ラベル設定判定部103において抽出項目に対応するテキスト情報(項目)が有ると判定された場合に取得される第1の抽出情報と、ラベル設定判定部103において抽出項目に対応するテキスト情報(項目)が無いと判定された場合に生成AI装置から取得される第2の抽出情報と、を比較した比較結果に基づき、抽出情報を特定してもよい。具体的には、抽出装置100は、比較結果をユーザ端末300に送信して、ユーザの操作入力に基づき第1の抽出情報または第2の抽出情報のうちの選択された結果に基づき、抽出情報を特定してもよい。また、抽出装置100は、第1の抽出情報が示す抽出の正確性の指標と、第2の抽出情報が示す抽出の正確性の指標と、のうちの高い指標を示す抽出情報を特定してもよい。これにより、抽出装置100は、適切な抽出情報を取得する精度を向上させることが可能となる。
【0064】
<<第3の変形例>>
上記において、ラベル設定判定部103は、テキストデータベースD101bを生成するように説明したがこれに限定されない。テキストデータベースD101bを生成しない場合、ラベル設定判定部103は、抽出項目に対応する、ラベルデータベースD101cのラベルに関連する「テキスト特徴」を特定する。そして、ブロックテキスト情報特定部105は、特定されたテキスト特徴に基づき、対象テキスト情報に含まれるブロックテキスト情報のうち、テキスト特徴を充たすブロックテキスト情報に対して当該テキスト特徴に対応する抽出用ラベルを関連づけて、当該ブロックテキスト情報を抽出ブロックテキスト情報として特定する。すなわち、抽出装置100は、テキストデータベースD101bを備える必要はなく、特定したテキスト特徴に基づき、抽出ブロックテキスト情報を特定するよう構成されていてもよい。これにより、簡易なシステム構成により、抽出ブロックテキスト情報を特定可能となる。
【0065】
===光学式文字認識装置200===
図1に戻り、光学式文字認識装置200の構成について説明する。光学式文字認識装置200は、例えば、対象画像が入力された場合、対象画像に含まれる文字を認識して、例えば認識した文字ごとに、テキスト情報、正確性指標および座標(以下、単に「生成情報」という。)を生成する装置である。
【0066】
なお、光学式文字認識装置200は、複数の光学式文字認識装置で構成されていてもよく、例えば複数の光学式文字認識装置のそれぞれで文字認識した結果のうち、正確性が高い文字認識結果である生成情報を抽出装置100に送信するように構成されていてもよい。
【0067】
図1に示すように、光学式文字認識装置200は、例えば、記憶部210と、送受信部220と、処理部230とを備える。記憶部210は各種情報を記憶する。処理部230は文字認識するための処理を実行する。送受信部220は、抽出装置100との間で各種情報を送受信する。処理部230は、例えば文字を区別するように学習されたニューラル・ネットワークを使用して画像を分析する。ニューラル・ネットワークは、例えば複数の畳み込みネットワーク層及び再帰型ネットワーク層を備える。処理部230は、例えば対象画像についてページ、ブロック、行または文字ごとにセグメント化する。セグメント化した画像に含まれる文字について文字認識を実行することで、例えば文字ごとに第1の生成情報を生成する。処理部230は、例えばセグメント化した画像(例えば対象画像、ブロック画像または行画像)を一つのまとまりとしての生成情報を生成してもよい。
【0068】
===ユーザ端末300===
図1を参照して、ユーザ端末300の構成について説明する。
図1に示すように、ユーザ端末300は、例えば、記憶部310と、送受信部320と、表示処理部330との機能部を含む。各機能部は、例えば、プロセッサ1001がメモリ1002に格納されているプログラムを読み出して実現される機能である。
【0069】
記憶部410は、各種情報を記憶する。ユーザ情報311は、ユーザIDを主キーとして、ユーザ名、属性情報などが対応付けられて格納する。ユーザ名は、ユーザが自身で登録した名前であり、任意である。属性情報は、ユーザの氏名や住所などの情報である。送受信部320は抽出装置100との間で各種情報を送受信する。送受信部320で取得された各種情報は記憶部310に記憶される。表示処理部330は抽出装置100から取得する各種情報を表示部に表示させる。
【0070】
===処理手順===
図5、
図6、
図7、
図8を参照して、抽出システム10の処理手順について説明する。
図5は、抽出システム10の処理手順を示すフローチャートである。
図6は、対象テキスト情報の一例を示す図である。
図7は、生成AI装置に入力される抽出クエリ情報および抽出ブロックテキスト情報の一例を示す図である。
図8は、生成AI装置から出力される抽出情報の一例を示す図である。
【0071】
ステップS100において、抽出装置100は、所定の装置から対象画像を取得する。抽出装置100は、光学式文字認識装置200に対象画像を送信する。
【0072】
ステップS101において、光学式文字認識装置200は、対象画像をセグメント化して、対象画像の対象テキスト情報を生成する。光学式文字認識装置200は、対象テキスト情報を抽出装置100に送信する。
【0073】
ステップS102において、抽出装置100は、対象テキスト情報をテキストデータベースD101bに記憶する。このとき、抽出装置100は、対象テキスト情報をブロックテキスト情報に区分して記憶する。
【0074】
具体的には、
図6に示すように、ブロックテキスト情報は、対象テキスト情報に含まれる、例えば「第2条」に含まれるブロックテキスト情報であるブロックB10、「物件の表示」の箇条書きに含まれるブロックテキスト情報であるブロックB20、および「賃借要件」の表形式の領域および当該表形式の領域に含まれるブロックテキスト情報であるブロックB30などを示す情報である。
【0075】
ステップS103において、抽出装置100は、ラベルデータベースD101cにおけるテキスト特徴に基づき、当該テキスト特徴を充たすブロックテキスト情報のそれぞれに抽出ラベルを関連づける。抽出装置100は、抽出用ラベルをブロックテキスト情報に関連づけてテキストデータベースD101bに記憶する。
【0076】
具体的には、抽出装置100は、例えば、
図4に示すラベルデータベースD101cにおけるラベルID「2002」のテキスト特徴「「甲」、「乙」および「契約」をすべて含むテキスト」を充たす、
図3に示すテキストデータベースD101bにおけるブロックID「1001002」のブロックテキスト情報を特定する。抽出装置100は、ブロックテキスト情報を特定できた場合、当該ブロックテキスト情報に対して、ラベルデータベースD101cのテキスト特徴に対応する抽出用ラベル「会社名称」を関連づけて、テキストデータベースD101bに記憶する。
【0077】
ステップS104において、抽出装置100は、ユーザ端末300から抽出情報に関する区分である抽出項目を取得する。具体的には、抽出装置100は、「会社名称」や「住所」などを示す抽出項目を取得する。すなわち、抽出装置100は、ユーザが抽出を所望する項目内容を示す情報を取得する。
【0078】
ステップS105において、抽出装置100は、抽出項目に対応するテキストデータベースD101bの抽出用ラベルに関連する抽出ブロックテキスト情報を特定する。
【0079】
具体的には、抽出装置100は、例えば抽出項目「会社名称」に対応するテキストデータベースD101bの抽出用ラベル「会社名称」を特定する。抽出装置100は、抽出用ラベル「会社名称」に関連する、テキストデータベースD101bのブロックテキスト情報「第2条・・」を抽出ブロックテキスト情報として特定する。
【0080】
ステップS106において、抽出装置100は、抽出項目に対応する、クエリデータベースD101aにおける設定候補項目を特定する。抽出装置100は、特定した設定候補項目に対応するクエリ情報を抽出クエリ情報として特定する。
【0081】
具体的には、抽出装置100は、例えば抽出項目「会社名称」に対応するクエリデータベースD101aの設定候補項目「会社名称」を特定する。抽出装置100は、設定候補項目「会社名称」に対応する、クエリデータベースD101aのクエリ情報を抽出クエリ情報(
図2の「抽出要件」及び「抽出例」に示す情報)として特定する。
【0082】
ステップS107において、抽出装置100は、抽出ブロックテキスト情報と、抽出クエリ情報とを生成AI装置に送信する。以下、
図7を参照して、生成AI装置に送信される抽出ブロックテキスト情報および抽出クエリ情報について説明する。
【0083】
図7に示すように、ブロックテキスト情報T10は、対象テキスト情報に含まれる所定の範囲のテキスト情報であり、ここではブロックテキスト情報「第2条・・」である。また、抽出クエリ情報T20は、抽出要件T21と、抽出例T22とを含む。
図7に示すように、抽出要件T21は、適切な情報を抽出するための情報であり、ここでは抽出対象の具体的な記載(「貸主」および「借主」)や出力形式(JSON側の配列形式)などを指定している。また、抽出例T22は、抽出された情報を使用するユーザの利便性を高めるための情報であり、ここでは入力文章を例示しつつ、当該例示に対する抽出結果の抽出形式を指定している。
【0084】
ステップS108において、抽出装置100は、生成AI装置から抽出情報を取得する。例えば、抽出装置100は、
図8に示す抽出情報をユーザ端末300の表示部に表示させる。
図8に示すように、抽出装置100は、抽出要件T21で指定された出力形式(ここではJSON形式)で抽出対象(ここでは「貸主」の会社名称、「借主」の会社名称)を表示部に表示させる。
【0085】
なお、抽出装置100は、ユーザが複数の抽出情報を取得することを所望している場合、ステップS104からステップS108の処理を繰り返す。
【0086】
このように、抽出システム10では、生成AI装置からユーザが所望する情報を適切に取得するためのプロンプトを生成AI装置に入力することができるため、ユーザが適切に情報を取得することが可能となる。
【0087】
===ハードウェア構成===
図9を参照して、抽出装置100、光学式文字認識装置200およびユーザ端末300をコンピュータで実現する場合のハードウェア構成の一例を説明する。
図9は、コンピュータのハードウェア構成の一例を示す図である。
【0088】
図9に示すように、コンピュータ1000は、プロセッサ1001と、メモリ1002と、記憶装置1003と、入力I/F部1004と、データI/F部1005と、通信I/F部1006、及び表示部1007を含む。
【0089】
プロセッサ1001は、メモリ1002に記憶されているプログラムを実行することによりコンピュータ1000における各種の処理を制御する制御部である。
【0090】
メモリ1002は、例えばRAM(Random Access Memory)等の記憶媒体である。メモリ1002は、プロセッサ1001によって実行されるプログラムのプログラムコードや、プログラムの実行時に必要となるデータを一時的に記憶する。
【0091】
記憶装置1003は、例えばハードディスクドライブ(HDD)やフラッシュメモリ等の不揮発性の記憶媒体である。記憶装置1003は、オペレーティングシステムや、上記各構成を実現するための各種プログラムを記憶する。
【0092】
入力I/F部1004は、ユーザからの入力を受け付けるためのデバイスである。入力I/F部1004の具体例としては、キーボードやマウス、タッチパネル、各種センサー、ウェアラブル・デバイス等が挙げられる。入力I/F部1004は、例えばUSB(Universal Serial Bus)等のインターフェースを介してコンピュータ1000に接続されても良い。
【0093】
データI/F部1005は、コンピュータ1000の外部からデータを入力するためのデバイスである。データI/F部1005の具体例としては、各種記憶媒体に記憶されているデータを読み取るためのドライブ装置等がある。データI/F部1005は、コンピュータ1000の外部に設けられることも考えられる。その場合、データI/F部1005は、例えばUSB等のインターフェースを介してコンピュータ1000へと接続される。
【0094】
通信I/F部1006は、コンピュータ1000の外部の装置と有線又は無線により、インターネットNを介したデータ通信を行うためのデバイスである。通信I/F部1006は、コンピュータ1000の外部に設けられることも考えられる。その場合、通信I/F部1006は、例えばUSB等のインターフェースを介してコンピュータ1000に接続される。
【0095】
表示部1007は、各種情報を表示するためのデバイスである。表示部1007の具体例としては、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ、ウェアラブル・デバイスのディスプレイ等が挙げられる。表示部1007は、コンピュータ1000の外部に設けられても良い。その場合、表示部1007は、例えばディスプレイケーブル等を介してコンピュータ1000に接続される。また、入力I/F部1004としてタッチパネルが採用される場合には、表示部1007は、入力I/F部1004と一体化して構成することが可能である。
【0096】
===まとめ===
<1>本実施形態における抽出システム10は、文字を含むテキスト情報を取得するテキスト情報取得部102と、ユーザの操作入力に基づいて、テキスト情報から抽出する対象の抽出情報に関する抽出項目を取得する項目取得部と、抽出の対象として設定され得る設定候補項目と、テキスト情報から抽出情報を抽出するように学習された生成AI装置に入力するクエリ情報と、を関連づけて格納するクエリデータベースD101aに基づいて、抽出項目に対応する設定候補項目に関連づけられる抽出クエリ情報を特定するクエリ情報特定部106と、抽出クエリ情報と、テキスト情報と、を生成AI装置に送信する送信部107と、生成AI装置から、テキスト情報に含まれる抽出情報を取得する抽出情報取得部108と、を備える。これにより、抽出システム10は、対象テキスト情報からユーザが所望する情報を生成AI装置から適切に抽出することができる。
【0097】
<2>また、本実施形態における抽出システム10は、テキスト情報に含まれる文字の所定のまとまりであるブロックテキスト情報のそれぞれに関連づけられる抽出用ラベルであって、抽出項目に対応する抽出用ラベルに関連づけられる抽出ブロックテキスト情報を特定するブロックテキスト情報特定部105をさらに備え、送信部107は、抽出クエリ情報と、抽出ブロックテキスト情報と、を生成AI装置に送信し、抽出情報取得部108は、生成AI装置から、抽出ブロックテキスト情報に含まれる抽出情報を取得する。これにより、抽出システム10は、対象テキスト情報からユーザが所望する情報を、より少ない処理量で生成AI装置から適切に抽出することができる。
【0098】
<3>また、本実施形態における抽出システム10は、テキスト情報に含まれる文字の所定のまとまりであるブロックテキスト情報と、当該文字の所定のまとまりの区分である抽出用ラベルと、を関連づけて格納するテキストデータベースD101bに基づいて、抽出項目に対応する抽出用ラベルに関連づけられる抽出ブロックテキスト情報を特定するブロックテキスト情報特定部105をさらに備え、送信部107は、抽出クエリ情報と、抽出ブロックテキスト情報と、を生成AI装置に送信し、抽出情報取得部108は、生成AI装置から、抽出ブロックテキスト情報に含まれる抽出情報を取得する。これにより、抽出システム10は、対象テキスト情報からユーザが所望する情報を、より少ない処理量で生成AI装置から適切に抽出することができる。
【0099】
<4>また、本実施形態における抽出システム10は、抽出用ラベルと、テキスト情報に含まれるテキストのテキスト特徴と、の対応関係(例えばラベルデータベースD101cおよび学習済みモデルによる推定結果など)に基づいて、ブロックテキスト情報に抽出用ラベルを関連づけるラベル設定判定部103(ラベル設定部)をさらに備える。これにより、抽出システム10は、対象テキスト情報からユーザが所望する情報を、より少ない処理量で生成AI装置から適切に抽出することができる。
【0100】
<5>また、本実施形態における抽出システム10は、テキスト情報に表形式のデータが含まれる場合、当該表形式のデータにおいて抽出項目に対応する項目の有無を判定するラベル設定判定部103(判定部)をさらに備え、抽出情報取得部108は、ラベル設定判定部103(判定部)において抽出項目に対応する項目が有ると判定された場合、当該表形式のデータにおいて抽出項目に対応する項目に関連する情報を、抽出情報として取得する。これにより、抽出システム10は、対象テキスト情報からユーザが所望する情報を、より少ない処理量で生成AI装置から適切に抽出することができる。
【0101】
<6>また、本実施形態における抽出システム10における送信部107は、ラベル設定判定部103(判定部)において抽出項目に対応する項目が無いと判定された場合、抽出クエリ情報と、抽出ブロックテキスト情報と、を生成AI装置に送信する。これにより、抽出システム10では、生成AI装置を用いる頻度を減少させるとともに、適切な抽出情報を取得する精度を向上させることが可能となる。
【符号の説明】
【0102】
10…抽出システム、100…抽出装置、101…記憶部、102…テキスト情報取得部、103…ラベル設定判定部、104…項目取得部、105…ブロックテキスト情報特定部、106…クエリ情報特定部、107…送信部、108…抽出情報取得部、109…表示処理部、200…光学式文字認識装置、300…ユーザ端末。
【要約】
【課題】 テキスト情報に含まれる情報を生成AI装置から適切に取得可能なシステムを提供することを目的とする。
【解決手段】 文字を含むテキスト情報を取得するテキスト情報取得部と、ユーザの操作入力に基づいて、前記テキスト情報から抽出する対象の抽出情報に関する抽出項目を取得する項目取得部と、抽出の対象として設定され得る設定候補項目と、前記テキスト情報から前記抽出情報を抽出するように学習された生成AI装置に入力するクエリ情報と、を関連づけて格納するクエリデータベースに基づいて、前記抽出項目に対応する前記設定候補項目に関連づけられる抽出クエリ情報を特定するクエリ情報特定部と、前記抽出クエリ情報と、前記テキスト情報と、を前記生成AI装置に送信する送信部と、前記生成AI装置から、前記テキスト情報に含まれる前記抽出情報を取得する抽出情報取得部と、を備える。
【選択図】
図1