IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社マネーフォワードの特許一覧

特許7241822証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム
<>
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図1
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図2
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図3
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図4
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図5
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図6
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図7
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図8
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図9
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図10
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図11
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図12
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図13
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図14
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図15
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図16
  • 特許-証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム 図17
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-09
(45)【発行日】2023-03-17
(54)【発明の名称】証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム
(51)【国際特許分類】
   G06Q 40/00 20230101AFI20230310BHJP
   G06F 3/0484 20220101ALI20230310BHJP
   G06F 3/0481 20220101ALI20230310BHJP
【FI】
G06Q40/00
G06F3/0484
G06F3/0481
【請求項の数】 8
(21)【出願番号】P 2021134973
(22)【出願日】2021-08-20
(65)【公開番号】P2023028965
(43)【公開日】2023-03-03
【審査請求日】2021-08-20
【早期審査対象出願】
【前置審査】
(73)【特許権者】
【識別番号】513040384
【氏名又は名称】株式会社マネーフォワード
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】北岸 郁雄
(72)【発明者】
【氏名】伊藤 大輔
【審査官】樋口 龍弥
(56)【参考文献】
【文献】特開2002-007951(JP,A)
【文献】特開2009-110444(JP,A)
【文献】特開2021-089618(JP,A)
【文献】特開2021-077332(JP,A)
【文献】特開2021-012741(JP,A)
【文献】特開2021-056732(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
G06F 3/0484
G06F 3/0481
(57)【特許請求の範囲】
【請求項1】
電子化された証憑を証憑画面に表示する証憑表示部と、
前記証憑画面と並列させて、前記電子化された証憑に含まれる一部又は全部のテキストの属性を示すラベル情報及び前記ラベル情報に対応するテキストを示す情報を含む、少なくとも1つのテキスト関連情報を、少なくとも1つの前記ラベル情報ごとにテキスト画面に表示するテキスト表示部と、
前記証憑画面及び前記テキスト画面の少なくとも一方の画面におけるユーザの操作を示す操作情報を取得する操作監視部と、
前記操作情報に基づいて、前記証憑画面及び前記テキスト画面のうち、少なくとも前記操作が行われていない画面における、前記操作に対応するテキストの表示を制御する表示制御部と、
を備える証憑構造分析システムであって、
前記テキスト表示部は、前記テキスト画面に表示される1つのラベル情報に対応するテキストとして、複数の候補テキストが前記証憑画面内に存在する場合に、前記複数の候補テキストを前記テキスト画面に表示し、
前記操作監視部は、前記テキスト画面に表示される前記複数の候補テキストの1つの候補テキストを選択する操作に関する操作情報を取得し、
前記証憑表示部は、前記テキスト画面内において選択された前記1つの候補テキストに対応する1つの候補テキストを前記証憑画面内において強調して表示する、
証憑構造分析システム
【請求項2】
電子化された証憑を証憑画面に表示する証憑表示部と、
前記証憑画面と並列させて、前記電子化された証憑に含まれる一部又は全部のテキストの属性を示すラベル情報及び前記ラベル情報に対応するテキストを示す情報を含む、少なくとも1つのテキスト関連情報を、少なくとも1つの前記ラベル情報ごとにテキスト画面に表示するテキスト表示部と、
前記証憑画面及び前記テキスト画面の少なくとも一方の画面におけるユーザの操作を示す操作情報を取得する操作監視部と、
前記操作情報に基づいて、前記証憑画面及び前記テキスト画面のうち、少なくとも前記操作が行われていない画面における、前記操作に対応するテキストの表示を制御する表示制御部と、
を備える証憑構造分析システムであって、
前記操作監視部は、前記ラベル情報に対応すべきテキストが前記テキスト画面に含まれていない場合に、前記証憑画面においてユーザによって選択される位置を示す座標情報を取得し、
前記テキスト表示部は、前記座標情報が示す位置に含まれるテキストを、前記ラベル情報に対応する表示欄に表示する、
証憑構造分析システム
【請求項3】
電子化された証憑を証憑画面に表示する証憑表示部と、
前記証憑画面と並列させて、前記電子化された証憑に含まれる一部又は全部のテキストの属性を示すラベル情報及び前記ラベル情報に対応するテキストを示す情報を含む、少なくとも1つのテキスト関連情報を、少なくとも1つの前記ラベル情報ごとにテキスト画面に表示するテキスト表示部と、
前記証憑画面及び前記テキスト画面の少なくとも一方の画面におけるユーザの操作を示す操作情報を取得する操作監視部と、
前記操作情報に基づいて、前記証憑画面及び前記テキスト画面のうち、少なくとも前記操作が行われていない画面における、前記操作に対応するテキストの表示を制御する表示制御部と、
を備える証憑構造分析システムであって、
前記操作監視部は、前記ラベル情報に対応すべきテキストが前記テキスト画面に含まれていない場合に、前記テキスト画面におけるテキストの一部の入力の操作に関する操作情報を取得し、
前記証憑表示部は、前記入力されるテキストの一部に対応する少なくとも1つのテキストを強調して表示する、
証憑構造分析システム
【請求項4】
前記操作情報、及び前記表示制御部による制御結果に関する情報を示す制御情報の少なくとも一方に基づいて、前記テキスト関連情報に含まれる少なくとも前記ラベル情報を変更した再学習用データを生成するリラベリング部をさらに備える請求項1に記載の証憑構造分析システム。
【請求項5】
前記テキスト関連情報は、テキストの位置を示す座標情報及び複数のテキストで構成される文字列の位置を示す座標情報の少なくとも1つをさらに含む請求項1に記載の証憑構造分析システム。
【請求項6】
前記テキスト表示部は、前記再学習用データにより生成される学習モデルの評価結果に基づいて、少なくとも1つの前記ラベル情報に対応する前記テキスト関連情報の少なくとも1つの候補を表示する、請求項に記載の証憑構造分析システム。
【請求項7】
コンピュータが、
電子化された証憑を証憑画面に表示し、
前記証憑画面と並列させて、前記電子化された証憑に含まれる一部又は全部のテキストの属性を示すラベル情報及び前記ラベル情報に対応するテキストを示す情報を含む、複数のテキスト関連情報を、少なくとも1つの前記ラベル情報ごとにテキスト画面に表示し、
前記証憑画面及び前記テキスト画面の少なくとも一方の画面におけるユーザの操作を示す操作情報を取得し、
前記操作情報に基づいて、前記証憑画面及び前記テキスト画面のうち、少なくとも前記操作が行われていない画面における、前記操作に対応するテキストの表示を制御する、
証憑構造分析方法であって、
前記テキスト画面に表示される1つのラベル情報に対応するテキストとして、複数の候補テキストが前記証憑画面内に存在する場合に、前記複数の候補テキストを前記テキスト画面に表示し、
前記テキスト画面に表示される前記複数の候補テキストの1つの候補テキストを選択する操作に関する操作情報を取得し、
前記テキスト画面内において選択された前記1つの候補テキストに対応する1つの候補テキストを前記証憑画面内において強調して表示する、
証憑構造分析方法
【請求項8】
コンピュータに、
電子化された証憑を証憑画面に表示する証憑表示部と、
前記証憑画面と並列させて、前記電子化された証憑に含まれる一部又は全部のテキストの属性を示すラベル情報及び前記ラベル情報に対応するテキストを示す情報を含む、複数のテキスト関連情報を、少なくとも1つの前記ラベル情報ごとにテキスト画面に表示するテキスト表示部と、
前記証憑画面及び前記テキスト画面の少なくとも一方の画面におけるユーザの操作を示す操作情報を取得する操作監視部と、
前記操作情報に基づいて、前記証憑画面及び前記テキスト画面のうち、少なくとも前記操作が行われていない画面における、前記操作に対応するテキストの表示を制御する表示制御部と、
を実現させるための証憑構造分析プログラムであって、
前記テキスト表示部は、前記テキスト画面に表示される1つのラベル情報に対応するテキストとして、複数の候補テキストが前記証憑画面内に存在する場合に、前記複数の候補テキストを前記テキスト画面に表示し、
前記操作監視部は、前記テキスト画面に表示される前記複数の候補テキストの1つの候補テキストを選択する操作に関する操作情報を取得し、
前記証憑表示部は、前記テキスト画面内において選択された前記1つの候補テキストに対応する1つの候補テキストを前記証憑画面内において強調して表示する、
証憑構造分析プログラム
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラムに関する。
【背景技術】
【0002】
証憑の処理において、担当者は、証憑に記載されている支払額や支払先等の証憑情報を会計ソフトウェア等の会計システムに入力する。ここで、担当者が、証憑情報のうち、処理に必要な情報を全て入力することは、非常に大きな作業負荷であることが指摘されている。そこで、担当者の作業負荷の軽減を目的として、会計システムには、画像認識技術を応用した、証憑情報を電子的に抽出する技術が用いられている場合がある。
【0003】
画像認識技術を応用した証憑情報の抽出においては、証憑に記載されている文字が適切に認識されない場合や、文字の認識は適切であっても、認識される文字から構成される文字列に付与される属性(「発行日」や「請求金額」等の項目)が適切でない場合等、証憑情報が適切に抽出されないエラーが生じる。エラーが生じた場合には、担当者は、生じたエラーを修正して、証憑の処理を行う。例えば、特許文献1では、ユーザは、処理の対象となっている証憑及び証憑情報の抽出結果を比較し、エラーを修正する。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第6732325号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1では、エラーの修正にあたり、キーボードを用いたユーザの手入力が求められていることから、ユーザの修正作業の負荷が高いことが問題となっている。
【0006】
そこで、本発明は、ユーザによる証憑情報の確認作業及び修正作業等の処理作業をより低負荷に実現する証憑構造分析システムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一態様に係る証憑構造分析システムは、電子化された証憑を証憑画面に表示する証憑表示部と、証憑画面と並列させて、電子化された証憑に含まれる一部又は全部のテキストに対応する情報を示すテキスト関連情報の一部又は全部をテキスト画面に表示するテキスト表示部と、証憑画面及びテキスト画面の少なくとも一方の画面におけるユーザの操作を示す操作情報を取得する操作監視部と、操作情報に基づいて、証憑画面及びテキスト画面のうち、少なくとも操作が行われていない画面における、操作に対応するテキストの表示を制御する表示制御部と、を備える。
【0008】
また、本発明の一態様に係る証憑構造分析方法は、コンピュータが、電子化された証憑を証憑画面に表示し、証憑画面と並列させて、電子化された証憑に含まれる一部又は全部のテキストに対応する情報を示すテキスト関連情報の一部又は全部をテキスト画面に表示し、証憑画面及びテキスト画面の少なくとも一方の画面におけるユーザの操作を示す操作情報を取得し、操作情報に基づいて、証憑画面及びテキスト画面のうち、少なくとも操作が行われていない画面における、操作に対応するテキストの表示を制御する。
【0009】
また、本発明の一態様に係る証憑構造分析プログラムは、コンピュータに、電子化された証憑を証憑画面に表示する証憑表示部と、証憑画面と並列させて、電子化された証憑に含まれる一部又は全部のテキストに対応する情報を示すテキスト関連情報の一部又は全部をテキスト画面に表示するテキスト表示部と、証憑画面及びテキスト画面の少なくとも一方の画面におけるユーザの操作を示す操作情報を取得する操作監視部と、操作情報に基づいて、証憑画面及びテキスト画面のうち、少なくとも操作が行われていない画面における、操作に対応するテキストの表示を制御する表示制御部と、を実現させる。
【0010】
なお、本発明において、「部」とは、単に物理的手段を意味するものではなく、その「部」が有する機能をソフトウェアによって実現する場合も含む。また、1つの「部」や装置が有する機能が2つ以上の物理的手段や装置により実現されても、2つ以上の「部」や装置の機能が1つの物理的手段や装置により実現されてもよい。
【発明の効果】
【0011】
本発明によれば、ユーザによる証憑情報の確認作業及び修正作業等の処理作業をより低負荷に実現する証憑構造分析システムを提供することが可能となる。
【図面の簡単な説明】
【0012】
図1図1は、本発明の一実施形態である証憑構造分析システム100の構成を示す図である。
図2図2は、証憑構造分析システム100における処理の概要を示す図である。
図3図3は、証憑データ取得部120が受け付ける証憑の一例を示す図である。
図4図4は、証憑データ記憶部121に格納される情報の一例を示す図である。
図5図5は、証憑データ記憶部121に格納される座標情報の取得例を示す図である。
図6図6は、学習用データ203の生成例を示す図である。
図7図7は、学習用データ記憶部131に格納される情報の一例を示す図である。
図8図8は、テキスト関連情報記憶部141に格納される情報の一例を示す図である。
図9図9は、テキスト画面と証憑画面の表示の一例を示す図である。
図10図10は、テキスト画面と証憑画面における強調表示の一例を示す図である。
図11図11は、表示制御部153による制御に基づいた表示の例を示す図である。
図12図12は、表示制御部153による制御に基づいた表示の例を示す図である。
図13図13は、表示制御部153による制御に基づいた表示の例を示す図である。
図14図14は、表示制御部153による制御に基づいた表示の例を示す図である。
図15図15は、表示制御部153による制御に基づいた表示の例を示す図である。
図16図16は、証憑構造分析システム100におけるモデルデータ生成の処理の一例を示すフローチャートである。
図17図17は、証憑構造分析システム100における表示制御の処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0013】
添付図面を参照して、本発明の好適な実施形態について説明する。図1は、本発明の一実施形態である証憑構造分析システム100の構成を示す図である。
【0014】
証憑構造分析システム100は、ユーザ端末110とインターネットを介して通信可能に接続されるシステムである。証憑構造分析システム100の詳細については、後述する。
【0015】
ユーザ端末110は、ユーザが利用するコンピュータであり、スマートフォン、タブレット端末、パーソナルコンピュータ等である。ユーザ端末110は、ユーザの操作に基づいて、証憑構造分析システム100の処理の対象とする証憑を、証憑構造分析システム100に提供する。ユーザ端末110は、紙媒体の証憑を撮影した画像若しくはスキャンデータを証憑構造分析システム100に提供してもよいし、電子的に作成された証憑を証憑構造分析システム100に提供してもよい。なお、図1では、ユーザ端末110の例として、ユーザ端末110a、110b、110cの3つを示しているが、ユーザ端末110の数はこれに限られない。
【0016】
図2は、証憑構造分析システム100における処理の概要を示す図である。まず、証憑構造分析システム100では、証憑構造分析システム100におけるモデルデータ(学習済みモデル)の生成の元となる多数の学習用証憑201(例えば、請求書等)を電子的に読み込んだ学習用証憑データ202が生成される。そして、生成された学習用証憑データ202に基づいて、学習用証憑201に記載されている一部又は全部のテキスト(例えば、証憑が請求書の場合であれば、「2021年8月31日」、「74,220」等の文字列若しくは、「2」、「0」等の文字)及びテキストに対応する情報(例えば、テキストの属性等であり、より具体的には、例えば、証憑が請求書の場合であれば、「支払期日」、「請求金額」等)を示す学習用データ203が生成される。続いて、証憑構造分析システム100では、生成された学習用データ203を用いて機械学習が行われることにより、学習用証憑データ202に含まれるテキスト及びテキストに対応する情報の対応関係を予測するモデルデータ204が生成される。
【0017】
次に、証憑構造分析システム100では、証憑構造分析システム100における表示対象となる表示対象証憑211を電子的に読み込んだ表示対象証憑データ212が生成される。続いて、生成される表示対象証憑データ212及びモデルデータ204に基づいて、表示対象証憑211に記載されている一部又は全部のテキスト及びテキストに対応する情報を含むテキスト関連情報213が生成される。
【0018】
そして、証憑構造分析システム100では、表示対象証憑211を表示する証憑画面がユーザ端末110に提供され、さらに、証憑画面と並列させて、抽出されたテキスト関連情報213の一部又は全部を表示するテキスト画面がユーザ端末110に提供される(S221、S222)。また、証憑構造分析システム100では、テキスト画面に表示されるテキスト関連情報213及び当該テキスト関連情報213に対応する証憑画面に表示されるテキスト(表示されるテキスト自体若しくは表示されるテキストの周辺の領域)が、それぞれの画面において強調して表示される。
【0019】
さらに、証憑構造分析システム100では、証憑画面及びテキスト画面の少なくとも一方におけるユーザによるユーザ端末110を通じた操作に基づいて、少なくとも当該操作が行われていない画面における、当該操作に対応するテキスト若しくはテキスト関連情報213の表示が制御される(S223、S224)。また、証憑構造分析システム100では、証憑画面及びテキスト画面の少なくとも一方におけるユーザによるユーザ端末110を通じた操作に基づいた表示の制御(例えば、モデルデータ204に基づいて推測された情報を修正する操作)に基づいて、操作若しくは表示制御が行われた証憑に対応する学習用データが生成され、任意のタイミングで、この学習用データを用いた再学習が行われる(S225)。
【0020】
次に、証憑構造分析システム100の詳細について説明する。図1に示すように、証憑構造分析システム100は、証憑データ取得部120、証憑データ記憶部121、学習用データ生成部130、学習用データ記憶部131、モデルデータ生成部132、モデルデータ記憶部133、テキスト関連情報生成部140、テキスト関連情報記憶部141、証憑表示部150、テキスト表示部151、操作監視部152、表示制御部153、リラベリング部154を備える。証憑構造分析システム100を構成するコンピュータは、プロセッサ及び記憶領域を備える。図1に示す各部は、例えば、記憶領域を用いたり、記憶領域に格納されたプログラムをプロセッサが実行したりすることにより実現することができる。
【0021】
証憑データ取得部120は、ユーザ端末110を通じた操作により証憑構造分析システム100の処理の対象となる証憑を受け付け、受け付けた証憑に記載されている一部又は全部のテキストを電子的に読み込んだ証憑データを取得し、取得した証憑データを証憑データ記憶部121に格納する。ここで、証憑データは、証憑ごとに取得されるデータであり、証憑に対する処理を行う際の基礎的なデータである。
【0022】
なお、証憑データ取得部120は、ユーザ端末110から証憑を受け付けることができる。また、クラウド上のストレージに保存されている証憑を受け付けることができ、また、ユーザ端末110を通じて送信されるメールに添付される証憑を受け付けることができる。また、証憑データ取得部120は、後述するモデルデータ生成部132によるモデルデータ生成の元となる学習用証憑201を受け付け、学習用証憑データ202を取得することができ、また、後述するテキスト関連情報生成部140によるテキスト関連情報213の元となる表示対象証憑211を受け付け、表示対象証憑データ212を取得することができる。
【0023】
証憑データ取得部120が証憑を読み込むタイミングは、任意に設定することができる。例えば、証憑データ取得部120は、ユーザ端末110から証憑を受け付けたタイミングで当該証憑を読み込んでもよいし、一定数の証憑を受け付けたタイミングで当該一定数の証憑を一度に読み込んでもよい。また、証憑データ取得部120は、モデルデータ生成部132による処理の直前に読み込んでもよいし、後述するテキスト関連情報生成部140による処理の直前に処理対象となる証憑を読み込んでもよい。
【0024】
図3は、証憑データ取得部120が受け付ける証憑の一例を示す図である。図3は、証憑のタイトルを示す領域301、証憑の発行日を示す領域302、請求額及び支払期日を示す領域303、請求の詳細を示す領域304を含む。なお、証憑データ取得部120が受け付ける証憑のレイアウトは、図3に限られない。また、図3は、請求書の証憑であるが、証憑データ取得部120が受け付ける証憑は請求書に限られず、例えば、領収書や売上伝票等、会計処理の対象となる証憑であればよい。
【0025】
図4は、証憑データ記憶部121に格納される情報の一例を示す図である。証憑データ記憶部121に格納される情報は、例えば、証憑種別ID、文字情報、座標情報を含む。
【0026】
証憑種別IDは、例えば、証憑の形式、発行元、若しくはレイアウトを示す情報であり、証憑の種別を識別するための証憑種別識別情報である。文字情報は、証憑に記載されている文字を示す情報である。ここで、文字は、数字や記号、スペース等を含み、証憑に記載されている言語的情報を指す。座標情報は、文字が記載されている証憑上の位置を示す情報である。座標情報は、例えば、文字又は文字列が記載されている位置を示す矩形の左下(始点)及び右上(終点)のXY座標(X座標(始点)、Y座標(始点)、X座標(終点)、Y座標(終点))であってもよいし、他の形式であってもよい。なお、証憑データ記憶部121に格納される証憑データは、一部が欠けていてもよい。
【0027】
図5は、証憑データ記憶部121に格納される座標情報の取得例を示す図である。図5は、図3の上部を拡大した図であるが、さらに、証憑のタイトルを示す領域301に含まれる文字列「請求書」について、各文字に、文字が記載されている位置を示す矩形の領域(例えば、文字「請」については領域500)が設定されている。
【0028】
ここで、領域500の始点は点501、領域500の終点は点502であり、点501のXY座標はそれぞれX1及びY1、点502のXY座標はそれぞれX2及びY2である。座標情報として、文字が記載されている位置を示す矩形の左下(始点)及び右上(終点)のXY座標(X座標(始点)、Y座標(始点)、X座標(終点)、Y座標(終点))が証憑データ記憶部121に格納される場合には、文字「請」の座標情報として、X1、Y1、X2及びY2が証憑データ記憶部121に格納される。なお、図5では、文字ごとに矩形の領域が設定されているが、文字列ごとに矩形の領域が設定されてもよい。
【0029】
学習用データ生成部130は、ユーザ端末110の操作に基づいて、証憑データ記憶部121に格納される学習用証憑201の学習用証憑データ202を構造化させた学習用データ203を生成し、少なくとも1つの学習用データ203を学習用データ記憶部131に格納する。ここで、学習用データ203は、学習用証憑データ202に含まれる文字情報を文字列情報に統合し、さらに、学習用証憑201ごとに、学習用証憑201に記載されている文字列情報及び文字列情報に対応する属性を対応付けて、学習用証憑データ202を構造化させた情報である。なお、学習用データ203は、学習用証憑201ごとに、学習用証憑データ202に含まれる文字情報及び文字情報に対応する属性を対応付けた情報であってもよい。
【0030】
学習用データ生成部130は、学習用データ203の生成に際して、学習用証憑データ202ごとに、学習用証憑データ202に含まれる文字情報を一定の文字列情報に統合し、当該文字列情報に対し、適切な属性を対応付けて、学習用証憑データ202を構造化する。学習用データ生成部130は、例えば、隣接する文字情報を一定の文字列情報に統合することができる。
【0031】
図6は、学習用データ203の生成例を示す図である。図6は、図3の上部を拡大した図であるが、さらに、証憑の発行日を示す領域302に含まれる文字列「2021年7月15日」について、各文字に、文字が記載されている位置を示す矩形の領域(例えば、1つ目の文字「2」については領域601、文字「0」については領域602)が設定されている。
【0032】
学習用データ生成部130は、ユーザ端末110の操作に基づいて、文字「2」「0」等を文字列「2021年7月15日」として統合し、文字列情報「2021年7月15日」を生成する。さらに、学習用データ生成部130は、文字列「2021年7月15日」が記載されている位置を示す矩形の領域610を設定し、領域610の座標情報を取得する。なお、領域610の座標情報は、例えば、領域610の左下(始点)及び右上(終点)のXY座標(X座標(始点)、Y座標(始点)、X座標(終点)、Y座標(終点))であってもよいし、他の形式であってもよい。また、学習用データ203が、学習用証憑201ごとに、学習用証憑データ202に含まれる文字情報及び文字情報に対応する属性を対応付けた情報である場合には、学習用データ生成部130は、当該文字情報に対応する文字が記載されている位置を示す矩形の領域を設定し、当該領域の座標情報を取得してもよい。
【0033】
また、学習用データ生成部130は、ユーザ端末110を通じて、文字列「2021年7月15日」に対応する属性として、例えば、「発行日」属性を設定する。その上で、学習用データ生成部130は、文字列「2021年7月15日」及び属性「発行日」を対応付けた情報を、学習用データ記憶部131に格納する。なお、学習用データ生成部130が、学習用証憑201ごとに、学習用証憑データ202に含まれる文字情報及び文字情報に対応する属性を対応付ける場合には、学習用データ生成部130は、「2」「0」等の文字ごとに、例えば、属性「発行日」を対応付けることができる。
【0034】
図7は、学習用データ記憶部131に格納される情報の一例を示す図である。学習用データ記憶部131に格納される情報は、例えば、証憑ID、証憑種別ID、文字情報、ラベル情報、座標情報を含む。なお、図7では、学習用データ記憶部131に格納される情報として、文字情報が示されているが、文字列情報が学習用データ記憶部131に格納されてもよい。
【0035】
証憑IDは、証憑ごとに付与されるIDであり、証憑を識別するための証憑識別情報である。ラベル情報は、文字情報又は文字列情報の属性を示す情報であり、例えば、発行日、支払期日、請求金額を含む。座標情報は、文字又は文字列が記載されている証憑上の位置を示す情報である。座標情報は、例えば、文字又は文字列が記載されている位置を示す矩形の4点の座標(X座標(始点)、Y座標(始点)、X座標(終点)、Y座標(終点))であってもよいし、他の形式であってもよい。
【0036】
なお、学習用データ記憶部131に格納されるラベル情報及び文字列情報は、必ずしも証憑に記載されているテキストでなくてもよい。ラベル情報に関しては、例えば、証憑ごとに「発行日」「作成日」等の類似する用語が用いられている場合には、「発行日」と総称して学習用データ記憶部131に格納してもよいし、文字列情報に関しては、例えば、証憑に「2021年7月15日」と記載されている文字列を「20210715」等の文字列に変換して学習用データ記憶部131に格納してもよい。
【0037】
モデルデータ生成部132は、学習用データ記憶部131に格納される学習用データ203を用いて機械学習を行うことによってモデルデータ204を生成し、モデルデータ記憶部133に格納する。ここで、モデルデータ204は、テキストの属性と、証憑に記載されているテキストとの対応関係を予測する学習済みモデルである。
【0038】
モデルデータ生成部132は、例えば、学習用データ203に含まれるラベル情報を特徴量とする機械学習により、ラベル情報に対応するテキストを推測することで、モデルデータ204を生成することができる。また、モデルデータ生成部132は、学習用データ203に含まれる座標情報を特徴量とする機械学習により、ラベル情報に対応するテキストが記載されていると推測される証憑上の位置を算出することで、モデルデータ204を生成してもよい。また、モデルデータ生成部132は、学習用データ203のそれぞれに、学習用データ203のそれぞれの更新日時に応じた重み付けを付与した上で、モデルデータ204を生成することもできる。
【0039】
モデルデータ生成部132によるモデルデータ生成は、例えば、システム管理者の指示に応じて実行される。また、システムメンテナンス時間等の所定のタイミングで自動的に機械学習が実行されてもよいし、後述するリラベリング部154の処理の直後に実行されてもよい。機械学習のアルゴリズムは特に限定されないが、例えば、回帰型ニューラルネットワーク(Recurrent Neural Network)、アテンションベースドニューラルネットワーク(Attention-Based Neural Network)を用いることができる。
【0040】
テキスト関連情報生成部140は、証憑データ記憶部121に格納される表示対象証憑211の表示対象証憑データ212及びモデルデータ記憶部133に格納されるモデルデータ204に基づいて、証憑データ記憶部121に格納される表示対象証憑データ212に対応するテキスト関連情報213を生成し、テキスト関連情報記憶部141に格納する。ここで、テキスト関連情報213は、証憑に記載されている一部又は全部のテキスト及び当該テキストに対応する情報(例えば、テキストの属性等)を含む情報である。
【0041】
テキスト関連情報生成部140は、テキスト関連情報213の生成に際して、モデルデータ204に基づいて、表示対象証憑データ212に含まれるテキスト自体を示す情報に対し、当該情報に対応する属性を対応付けて、表示対象証憑データ212を構造化する。なお、テキスト関連情報生成部140は、テキスト自体を示す情報として、表示対象証憑データ212に含まれる文字情報を用いてもよいし、表示対象証憑データ212に含まれる文字列情報を用いてもよい。表示対象証憑データ212に含まれる文字列情報を用いる場合には、テキスト関連情報生成部140は、表示対象証憑データ212に含まれる文字情報を一定の文字列情報に統合し、当該文字列情報に対し、当該文字列情報に対応する属性を対応付けて、表示対象証憑データ212を構造化する。テキスト関連情報生成部140は、例えば、証憑データ記憶部121に格納されている表示対象証憑データ212に含まれる座標情報に基づいて、隣接している文字情報を統合し文字列情報を生成することができる。
【0042】
また、テキスト関連情報生成部140は、例えば、学習用データ203に含まれるラベル情報を特徴量とする機械学習により生成されたモデルデータ204に基づいて、対応するテキスト自体を示す情報に対し、適切なラベル情報を対応付けることができる。
【0043】
また、テキスト関連情報生成部140は、モデルデータ204に基づいて、テキスト自体を示す同一の情報に対し複数のラベル情報が予測される場合には、当該複数のラベル情報をテキスト自体を示す当該同一の情報のラベル情報として生成してもよいし、対応付けの確からしさが最も高いラベル情報のみをテキスト自体を示す当該同一の情報のラベル情報として生成してもよい。
【0044】
図8は、テキスト関連情報記憶部141に格納される情報の一例を示す図である。テキスト関連情報記憶部141に格納される情報は、例えば、文字列情報、ラベル情報、確度情報、座標情報を含む。確度情報は、文字列情報とラベル情報の対応付けの確からしさの度合いを示す情報である。なお、図8では、テキスト関連情報記憶部141に文字列情報が格納されているが、文字列情報の代わりに文字情報が格納されてもよい。
【0045】
証憑表示部150は、証憑構造分析システム100に提供された証憑を表示する証憑画面を生成し、ユーザ端末110に証憑画面を表示する。証憑表示部150は、ユーザ端末110による証憑の提供方法に応じて、証憑を画像形式で表示してもよいし、文書形式で表示してもよい。また、証憑表示部150は、提供された証憑全体を表示してもよいし、証憑の一部のみを表示してもよい。また、証憑表示部150は、ラベル情報と文字列情報の対応付けの確からしさに応じて、対応するテキスト自体又はテキストの周辺領域を強調表示してもよく、例えば、対応付けの確からしさが一定値未満のテキスト自体又はテキストの周辺領域を強調して表示してもよい。
【0046】
テキスト表示部151は、テキスト関連情報記憶部141に格納されるテキスト関連情報213に基づいて、テキスト関連情報213を表示するテキスト画面を生成し、証憑画面と並列させて、ユーザ端末110にテキスト画面を表示する。
【0047】
なお、テキスト表示部151は、テキスト関連情報213を全て表示してもよいし、テキスト関連情報213の一部を表示してもよい。また、テキスト表示部151が表示する情報は、テキスト関連情報に含まれる情報自体に限られず、例えば、テキスト関連情報213に含まれるラベル情報と当該ラベル情報に対応する文字列とを対応付けたテーブルに基づいて、テキスト表示部151が当該ラベル情報に対応する文字列を表示してもよい。また、テキスト表示部151は、表示されたテキスト関連情報213を、ユーザによるユーザ端末110を通じたテキスト画面における操作によって直接に削除及び入力することが可能な形式でテキスト関連情報213を表示してもよいし、ユーザによるユーザ端末110を通じた操作によっては直接に削除及び入力することができない形式で表示してもよい。
【0048】
また、ラベル情報に対応する文字列情報の候補が複数存在する場合、ユーザによるユーザ端末110を通じた操作が行われる前の初期表示時には、テキスト表示部151は、対応付けの確からしさが最も高い文字列情報をテキスト画面に表示する。
【0049】
なお、テキスト表示部151は、対応付けの確からしさが一定値未満である文字列情報を強調して表示してもよい。
【0050】
図9は、テキスト画面と証憑画面の表示の一例を示す図である。図9に示す画面は、テキスト画面を表示する領域910及び証憑画面を表示する領域920を含む。また、図9に示す画面は、領域910内に、テキスト関連情報記憶部141に格納されるラベル情報を、ユーザによるユーザ端末110を通じたテキスト画面における操作によって直接には削除及び入力することができない形式で表示する領域911、及び、ラベル情報に対応するテキスト関連情報記憶部141に格納される文字列情報を、ユーザによるユーザ端末110を通じたテキスト画面における操作により直接に削除及び入力することが可能な形式で表示する領域912を含む。
【0051】
なお、図9に示す画面は、領域911、912が別個の領域として設けられているが、領域911、912は同一の領域に設けられてもよい。また、領域911、912における、ユーザによるユーザ端末110を通じたテキスト画面における操作による直接の削除及び入力の可否は、どちらでもよい。また、図9に示す画面では、テキスト関連情報213に含まれるラベル情報自体を表示しているが、例えば、テキスト関連情報213に含まれるラベル情報と当該ラベル情報に対応する文字列とを対応付けたテーブルに基づいて、当該ラベル情報に対応する文字列を表示してもよい。
【0052】
また、領域920は図3に示す証憑を表示する画面であるが、証憑表示部150は、領域920に、図3に示す証憑の全部を表示してもよいし、図3に示す証憑の一部のみを表示してもよい。また、図9に示す画面は、左側にテキスト画面が表示され、右側に証憑画面が表示されているが、左右の表示が反対であってもよいし、上下等の他の並列方法によって表示されてもよい。
【0053】
操作監視部152は、証憑画面及びテキスト画面の少なくとも一方の画面における、ユーザによるユーザ端末110を通じた操作を示す操作情報を取得する。
【0054】
ユーザによるユーザ端末110を通じたテキスト画面における操作は、例えば、テキスト画面に表示されているテキストを直接に削除及び入力する操作、テキスト画面に表示されているテキストを選択する操作、及び後述するテキストの候補を表示する操作を含む。ユーザによるユーザ端末110を通じた証憑画面における操作は、例えば、証憑画面内で強調されて表示されるテキスト及び当該テキストの周囲を選択する操作並びにテキストを含む部分を範囲選択する操作を含む。
【0055】
表示制御部153は、操作監視部152が取得する操作情報に基づいて、証憑画面及びテキスト画面のうち、少なくとも当該操作情報に係る操作が行われていない画面における、当該操作に対応するテキストの表示を制御する。つまり、ユーザによるユーザ端末110を通じた操作が証憑画面上にて行われた場合には、表示制御部153は、当該操作に基づいて、少なくともテキスト画面の表示を制御し、ユーザによるユーザ端末110を通じた操作がテキスト画面上にて行われた場合には、表示制御部153は、当該操作に基づいて、少なくとも証憑画面の表示を制御する。
【0056】
以下、図10図13に示す画面の一例を用いて、テキスト表示部及び証憑表示部の表示並びに表示制御部の制御の一例を説明する。
【0057】
図10は、テキスト画面と証憑画面における強調表示の一例を示す図である。図10に示す画面は、図9に示す画面に対応するものであるが、さらに、テキスト画面に表示されている文字列情報及び文字列情報に対応する証憑画面内のテキストの3組(領域1001a及びb、領域1002a及びb、領域1003a及びb)が、それぞれ同一の枠線の矩形にて強調されて表示されている。
【0058】
領域1001aには、ラベル情報「発行日」に対応する文字列情報として「2021年7月15日」が表示されている。領域1001bには、文字列情報「2021年7月15日」に対応するテキスト「2021年7月15日」が表示されている。そして、テキスト表示部151及び証憑表示部150は、領域1001aに表示されている「2021年7月15日」及び領域1001bに表示されている「2021年7月15日」を、それぞれ同一の枠線の矩形にて文字列を囲うことにより強調して表示している。また、テキスト表示部151及び証憑表示部150は、領域1002aに表示されている文字列情報「2021年8月31日」及び領域1002bに表示されているテキスト「2021年8月31日」の組み合わせ、及び、領域1003aに表示されている文字列情報「74,220」及び領域1003bに表示されているテキスト「74,220」の各組み合わせを、それぞれ同一の枠線の矩形にて文字列を囲うことにより強調して表示している。
【0059】
図11は、表示制御部153による制御に基づいた表示の例を示す図である。図11に示す画面は、図9に示す画面に対応するものであるが、さらに、テキスト画面内に、ラベル情報「請求金額」に対応する文字列情報の候補が複数存在することを示すマークが表示される領域1101、及び領域1101に表示されるマークを選択することで文字列情報の候補が表示される領域1102を含む。
【0060】
ユーザによるユーザ端末110を通じた操作によって文字列情報の候補が表示される場合は、例えば、テキスト関連情報生成部140による文字列情報とラベル情報の対応付けが適切に行われず、ユーザが対応付けを適切に修正する場合に発生する。
【0061】
ここで、図11に示す画面では、証憑画面に表示されている証憑には請求金額として「74,220」が記載されているものの、テキスト画面には、請求金額として「20,000」が表示されているため、ユーザが対応付けを適切に修正しようとしている。
【0062】
なお、領域1102に表示される文字列情報の候補の順番は、テキスト関連情報記憶部141に格納されるテキスト関連情報213に含まれる座標情報に基づく順番であってもよいし、テキスト関連情報213に含まれる確度情報に基づく順番であってもよい。
【0063】
ユーザによるユーザ端末110を通じた操作によって、領域1101に表示されるマークが選択されると、操作監視部152は、当該選択に関する操作情報を取得する。続いて、表示制御部153は、操作監視部152が取得した操作情報に基づいて、証憑画面の表示を制御する。
【0064】
そして、証憑表示部150は、表示制御部153による制御に基づいて、例えば、領域1102に表示される文字列情報の候補に対応するテキスト(領域1103及び領域1104)を、強調して表示する。なお、図11に示す画面では、同一の枠線を用いた矩形で文字列を囲うことにより、証憑画面における対応するテキストが強調されて表示されている。
【0065】
図12は、表示制御部153による制御に基づいた表示の例を示す図である。図12に示す画面は、図11に示す画面に続くものであるが、さらに、ユーザによるユーザ端末110を通じた操作によって、証憑画面に強調されて表示されているテキスト(例えば、領域1103に強調されて表示されている「74,220」)が選択されている場面の画面を示す。
【0066】
ユーザによるユーザ端末110を通じた操作によって、証憑画面に強調されて表示されているテキスト(例えば、領域1103に強調されて表示されている「74,220」)が選択されると、操作監視部152は、当該選択に関する操作情報を取得する。続いて、表示制御部153は、操作監視部152が取得した操作情報に基づいて、テキスト画面の表示を制御する。
【0067】
そして、テキスト表示部151は、表示制御部153による制御及びテキスト関連情報記憶部141格納されているテキスト関連情報213に基づいて、選択されたテキストに対応する文字列情報(例えば、「74,220」)を、対応する表示欄(例えば、領域1003a)に表示する。
【0068】
図13は、表示制御部153による制御に基づいた表示の例を示す図である。図13に示す画面は、図11に示す画面に対応するものであるが、図11に示す画面と異なり、ユーザによるユーザ端末110を通じた操作によって、領域1102に表示されている文字列情報の候補の1つ(例えば、領域1301に表示されている「74,220」)が選択された場面の画面を示す。
【0069】
ユーザによるユーザ端末110を通じた操作によって、文字列情報の候補の1つが選択される場合は、例えば、テキスト関連情報生成部140による文字列情報とラベル情報の対応付けが適切に行われず、ユーザが対応付けを適切に修正する場合に発生する。
【0070】
ここで、図13に示す画面では、証憑画面に表示されている証憑には請求金額として「74,220」が記載されているものの、テキスト画面には、請求金額として「20,000」が表示されているため、ユーザが対応付けを適切に修正しようとしている。
【0071】
ユーザによるユーザ端末110を通じた操作により、領域1102に表示されている文字列情報の候補の1つ(例えば、領域1301に表示されている「74,220」)が選択されると、操作監視部152は、当該選択に関する操作情報を取得する。続いて、表示制御部153は、操作監視部152が取得した操作情報及びテキスト関連情報記憶部141に格納されているテキスト関連情報213に基づいて、証憑画面の表示を制御する。
【0072】
そして、証憑表示部150は、表示制御部153による制御に基づいて、例えば、証憑画面に表示されている対応するテキスト(例えば、領域1302に表示されている「74,220」)を強調して表示する。なお、図13に示す画面では、矩形にて文字列を囲うことにより、証憑画面における対応するテキストが強調されて表示されている。
【0073】
図14は、表示制御部153による制御に基づいた表示の例を示す図である。図14に示す画面は、図11に示す画面に対応するものであるが、図11に示す画面と異なり、ユーザによるユーザ端末110を通じた操作によって、テキストを表示している部分(例えば、領域1401)が範囲選択された場面の画面を示す。
【0074】
ユーザによるユーザ端末110を通じた操作によって、テキストが表示されている部分が範囲選択される場合は、例えば、証憑データ取得部120による証憑データの読み込みが適切に行われなかったときや、テキスト関連情報生成部140による文字列情報の生成が適切に行われなかったときにおいて、ユーザがテキスト関連情報213の表示を修正する際に、ユーザが証憑画面上への表示を希望する文字列情報が、文字列情報の候補に含まれていない場合に発生する。
【0075】
ここで、図14に示す画面では、証憑画面に表示されている証憑には請求金額として「74,220」が記載されているものの、テキスト画面には、請求金額の候補に「74,220」が表示されていないため、ユーザが対応付けを適切に修正しようとしている。
【0076】
ユーザによるユーザ端末110を通じた操作によって、テキストが表示されている部分(例えば、「74,220」を含む領域1401)が範囲選択されると、操作監視部152は、当該範囲選択に関する操作情報を取得する。続いて、表示制御部153は、操作監視部152が取得した操作情報に基づいて、当該範囲選択された部分におけるテキスト関連情報生成部140によるテキスト関連情報213の生成及びテキスト関連情報記憶部141への格納処理を伴いながら、テキスト画面の表示を制御する。
【0077】
そして、テキスト表示部151は、表示制御部153による制御及びテキスト関連情報記憶部141に格納されているテキスト関連情報213に基づいて、例えば、範囲選択された位置に含まれている文字列情報(例えば、「74,220」)を、テキスト画面(例えば、領域1003a)に表示する。また、テキスト表示部151は、表示制御部153による制御及びテキスト関連情報記憶部141に格納されているテキスト関連情報213に基づいて、例えば、範囲選択された位置に含まれている文字列情報(例えば、「74,220」)を、文字列情報の候補が表示される領域1102に表示してもよい。
【0078】
図15は、表示制御部153による制御に基づいた表示の例を示す図である。図15に示す画面は、図14に示す画面に対応するものであるが、図14に示す画面と異なり、文字列情報の表示欄(例えば、領域1003a)に、ユーザによるユーザ端末110を通じた操作によって、文字又は文字列(例えば、領域1501に表示されている文字「7」)が入力されている場面の画面を示す。
【0079】
ユーザによるユーザ端末110を通じた操作によって、文字列情報の表示欄に文字又は文字列が入力される場合は、例えば、証憑データ取得部120による証憑データの読み込みが適切に行われなかったときや、テキスト関連情報生成部140による文字列情報の生成が適切に行われなかったときにおいて、ユーザがテキスト関連情報213の表示を修正する場合に発生する。
【0080】
ここで、図15に示す画面では、証憑画面に表示されている証憑には請求金額として「74,220」が記載されているものの、テキスト画面には、請求金額の候補に「74,220」が表示されていないため、ユーザが対応付けを適切に修正しようとしている。
【0081】
ユーザによるユーザ端末110を通じた操作によって、文字列情報の表示欄(例えば、領域1003a)に文字又は文字列(例えば、領域1501に表示されている文字「7」)が入力されると、操作監視部152は、当該入力に関する操作情報を取得する。続いて、表示制御部153は、操作監視部152が取得した操作情報及び当該入力された文字又は文字列を含むテキスト関連情報213に基づいて、証憑画面の表示を制御する。
【0082】
そして、テキスト表示部151は、表示制御部153による制御及びテキスト関連情報記憶部141に格納されているテキスト関連情報213に基づいて、例えば、当該入力がなされた部分(例えば、領域1003a)に、当該入力された文字又は文字列を含むテキスト関連情報213(例えば、文字列情報「74,220」)を表示する。また、証憑表示部150は、表示制御部153による制御及びテキスト関連情報記憶部141に格納されているテキスト関連情報213に基づいて、テキスト表示画面に表示された文字列情報に対応するテキスト(例えば、領域1502に表示される「74,220」)を強調して表示してもよい。なお、図15に示す画面では、矩形にて文字列を囲うことにより、証憑画面における対応するテキストが強調されて表示されている。
【0083】
なお、図15に示す画面では、ユーザが証憑画面上への表示を希望する文字列情報が文字列情報の候補に含まれていない場合の場面を示しているが、ユーザが証憑画面上への表示を希望する文字列情報が文字列情報の候補に含まれている場合に、同様の表示制御が行われてもよい。
【0084】
なお、図10図13及び図15に示す強調表示の方法は、同一の枠線を用いた矩形表示に限られず、例えば、同色の矩形を表示する方法でもよいし、背景を同色で塗りつぶす方法や、該当する文字を同色で表示する方法でもよい。また、図11図14に示す証憑画面及びテキスト画面におけるユーザによるユーザ端末110を通じた選択操作は、例えば、マウスによるクリック操作や、マウスをテキストの上に移動させるマウスオーバー操作によってなされてもよい。
【0085】
また、図9図15に示した画面は、テキスト表示部及び証憑表示部の表示並びに表示制御部の制御の一例であり、表示及び制御のインターフェースはこれらに限られない。
【0086】
リラベリング部154は、操作監視部152が取得する操作情報及び表示制御部153による制御結果に関する情報を示す制御情報の少なくとも一方に基づいて、操作情報に係る操作若しくは制御情報に係る制御によって変更された証憑画面若しくはテキスト画面又はその両方の表示に対応する再学習用データを生成し、再学習用データを学習用データ記憶部131に格納する。
【0087】
例えば、図12に示す画面に対応してユーザによるユーザ端末110を通じた操作によりテキスト画面の表示が制御された場合には、リラベリング部154は、ラベル情報及び修正された文字列情報を対応付けた再学習用データを生成する。
【0088】
なお、リラベリング部154が再学習用データを生成するタイミングは、ユーザによるユーザ端末110を通じた操作ごとであってもよいし、処理対象となっている表示対象証憑211に対するユーザの処理が終了した後であってもよい。また、リラベリング部154は、ユーザによるユーザ端末110を通じた操作がされなかった場合にも、再学習用データを生成してもよい。
【0089】
図16は、証憑構造分析システム100におけるモデルデータ生成の処理の一例を示すフローチャートである。まず、証憑構造分析システム100は、証憑構造分析システム100のモデルデータ生成の対象となる学習用証憑201をユーザ端末110から受け付け、受け付けた学習用証憑201に記載されている一部又は全部のテキストを電子的に読み込んだ学習用証憑データ202を取得し、学習用証憑データ202を証憑データ記憶部121に格納する(S1601)。
【0090】
次に、証憑構造分析システム100は、ユーザ端末110の操作に基づいて、証憑データ記憶部121に格納される学習用証憑データ202を構造化させた学習用データ203を生成し、少なくとも1つの学習用データ203を学習用データ記憶部131に格納する(S1602)。そして、証憑構造分析システム100は、学習用データ記憶部131に格納される学習用データ203に基づいて、モデルデータ204を生成し、モデルデータ記憶部133に格納する(S1603)。
【0091】
図17は、証憑構造分析システム100における表示制御の処理の一例を示すフローチャートである。まず、証憑構造分析システム100は、ユーザ端末110を通じた操作により証憑構造分析システム100の処理の対象となる表示対象証憑211を受け付け、受け付けた表示対象証憑211に記載されている一部又は全部のテキストを電子的に読み込んだ表示対象証憑データ212を取得し、表示対象証憑データ212を証憑データ記憶部121に格納する(S1701)。
【0092】
次に、証憑構造分析システム100は、証憑データ記憶部121に格納されている表示対象証憑データ212及びモデルデータ記憶部133に格納されているモデルデータ204に基づいて、受け付けた証憑に関するテキスト関連情報213を生成し、テキスト関連情報記憶部141に格納する(S1702)。続いて、証憑構造分析システム100は、テキスト関連情報記憶部141に格納されているテキスト関連情報213に基づいて、受け付けた証憑を表示する証憑画面及びテキスト関連情報213を表示するテキスト画面を並列させて表示する(S1703)。
【0093】
そして、証憑構造分析システム100は、ユーザによるユーザ端末110を通じた操作に応じて、証憑画面に表示されているテキスト若しくはテキスト画面に表示されているテキスト関連情報又はその両方について、強調表示及び表示内容の変更等の表示制御を行う(S1704)。さらに、証憑構造分析システム100は、ユーザによるユーザ端末110を通じた操作及び当該操作に対応する表示制御に基づいて、再学習用データを生成する(S1705)。
【0094】
以上、本発明の一実施形態について説明した。証憑構造分析システム100は、表示対象証憑211を表示する証憑画面及びテキスト関連情報213を表示するテキスト画面を並列させて表示し、証憑画面及びテキスト画面の少なくとも一方におけるユーザ端末110を通じた操作に基づいて、当該操作が行われていない画面における表示を制御することができる。これにより、ユーザは、証憑画面とテキスト画面の対応関係をより直感的に把握でき、結果として、より簡便にテキスト画面に入力された情報を確認及び修正することができる。
【0095】
また、証憑構造分析システム100は、ユーザ端末110を通じた操作及び証憑構造分析システム100による表示の制御の少なくとも一方並びにテキスト関連情報213に基づいて、再学習用データを生成することができる。これにより、ユーザ端末110を通じた修正作業を即時的に学習用データに反映させることができ、モデルデータ204の即時的な更新を実現することができる。
【0096】
また、証憑構造分析システム100は、証憑画面に表示されているテキストと、テキスト画面に表示されている対応するテキスト関連情報213とを、強調して表示することができる。これにより、ユーザは、証憑の表示及びテキスト関連情報213の表示が連動する画面の提供を受けることができ、結果として、証憑画面に表示されているテキストと、テキスト画面に表示されているテキスト関連情報213との対応関係をより直感的に把握することができ、より簡便にテキスト画面に入力された情報を確認及び修正することができる。
【0097】
また、証憑構造分析システム100は、証憑画面に表示されているテキスト及びテキスト画面に表示されているテキスト関連情報213の少なくとも一方に対するユーザの操作に基づいて、対応するテキスト画面及び証憑画面の表示を制御することができる。これにより、ユーザは、証憑の表示及びテキスト関連情報213の表示が連動する画面の提供を受けることができ、結果として、テキスト画面に表示されているテキスト関連情報213の修正作業をより直感的に行うことができ、より簡便にテキスト画面に入力された情報を確認及び修正することができる。
【0098】
なお、本実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更/改良され得るととともに、本発明にはその等価物も含まれる。
【符号の説明】
【0099】
100 証憑構造分析システム、110 ユーザ端末、120 証憑データ取得部、121 証憑データ記憶部、130 学習用データ生成部、131 学習用データ記憶部、132 モデルデータ生成部、133 モデルデータ記憶部、140 テキスト関連情報生成部、141 テキスト関連情報記憶部、150 証憑表示部、151 テキスト表示部、152 操作監視部、153 表示制御部、154 リラベリング部、201 学習用証憑、202 学習用証憑データ、203 学習用データ、204 モデルデータ、211 表示対象証憑、212 表示対象証憑データ、213 テキスト関連情報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17