IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

特許7559415情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-24
(45)【発行日】2024-10-02
(54)【発明の名称】情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
(51)【国際特許分類】
   G06Q 20/14 20120101AFI20240925BHJP
【FI】
G06Q20/14
【請求項の数】 10
(21)【出願番号】P 2020133940
(22)【出願日】2020-08-06
(65)【公開番号】P2022030150
(43)【公開日】2022-02-18
【審査請求日】2023-02-24
(73)【特許権者】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】小林 寛
(72)【発明者】
【氏名】渡邊 貴弘
(72)【発明者】
【氏名】種子田 稜
【審査官】田上 隆一
(56)【参考文献】
【文献】特許第6722929(JP,B1)
【文献】特開平05-061897(JP,A)
【文献】特開2006-323717(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
帳票情報に含まれる文字列の定義した情報を参照して帳票画像データから、帳票の発行元を示す情報を抽出し、前記帳票の発行元と対応付けられた入金先情報が格納された記憶部を参照して、前記帳票の発行元を示す情報と対応する入金先情報を取得する情報取得部と、
前記帳票の発行元を示す情報と、前記情報取得部により取得された前記入金先情報と、を含む画面データを端末装置へ出力する表示制御部と、
金融機関情報に含める文字列の定義を示す定義情報と、金融機関情報に含める文字列を抽出する際の条件を示す条件情報とを参照し、前記帳票画像データから金融機関情報を抽出する抽出部と、
を有し、
前記情報取得部は、
前記記憶部から前記帳票の発行元を示す情報と対応する入金先情報が取得されなかった場合に、前記抽出部により抽出された前記金融機関情報を前記帳票の発行元を示す情報と対応する入金先情報に設定する、情報処理装置。
【請求項2】
前記端末装置に表示された前記入金先情報に対する編集が行われた場合に、前記記憶部に格納された前記入金先情報を更新する更新部を有する、請求項1記載の情報処理装置。
【請求項3】
前記帳票画像データに対する文字認識によって抽出された複数の文字列のうち、前記定義情報を参照して特定された特定の文字列との位置関係に基づき、前記複数の文字列から、抽出基点となる文字列を特定し、前記抽出基点となる文字列との位置関係に基づき、前記抽出基点となる文字列と対応する文字列を抽出する認識処理部を有し、
前記認識処理部は、
前記抽出基点となる文字列との位置関係に基づき抽出された文字列を、前記抽出基点となる文字列と対応付けられた項目名の項目値とする、請求項1又は2記載の情報処理装置。
【請求項4】
前記表示制御部は、
前記帳票の発行元を示す情報及び前記入金先情報と、前記認識処理部に基づき抽出された項目名の項目値とを含む画面データを端末装置に出力する、請求項記載の情報処理装置。
【請求項5】
前記帳票は、請求書である、請求項記載の情報処理装置。
【請求項6】
前記認識処理部により抽出された前記項目名は、金融機関に関する情報の項目名であり、
前記認識処理部は、前記項目名と前記項目値とを対応付けて金融機関情報とする、請求項記載の情報処理装置。
【請求項7】
前記情報取得部は、
前記入金先情報と、前記金融機関情報とが一致するか否かを判定し、
前記表示制御部は、
前記入金先情報と前記金融機関情報とが一致しない場合に、前記画面データにアラートを表示させるための情報を含める、請求項記載の情報処理装置。
【請求項8】
情報処理装置と端末装置とを含む情報処理システムによる情報処理方法であって、前記情報処理システムが、
帳票情報に含まれる文字列の定義した情報を参照して帳票画像データから帳票の発行元を示す情報を抽出し、前記帳票の発行元と対応付けられた入金先情報が格納された記憶部を参照して、情報取得部により前記帳票の発行元を示す情報と対応する入金先情報を取得し、
前記帳票の発行元を示す情報と、前記情報取得部により取得された前記入金先情報と、を含む画面データを前記端末装置へ出力し、
金融機関情報に含める文字列の定義を示す定義情報と、金融機関情報に含める文字列を抽出する際の条件を示す条件情報とを参照し、前記帳票画像データから金融機関情報を抽出し、
前記記憶部から前記帳票の発行元を示す情報と対応する入金先情報が取得されなかった場合に、抽出された前記金融機関情報を前記帳票の発行元を示す情報と対応する入金先情報に設定する、情報処理方法。
【請求項9】
帳票情報に含まれる文字列の定義した情報を参照して帳票画像データから帳票の発行元を示す情報を抽出し、前記帳票の発行元と対応付けられた入金先情報が格納された記憶部を参照して、情報取得部により前記帳票の発行元を示す情報と対応する入金先情報を取得する処理と、
前記帳票の発行元を示す情報と、前記情報取得部により取得された前記入金先情報と、を含む画面データを端末装置へ出力する処理と、
金融機関情報に含める文字列の定義を示す定義情報と、金融機関情報に含める文字列を抽出する際の条件を示す条件情報とを参照し、前記帳票画像データから金融機関情報を抽出する処理と、
前記記憶部から前記帳票の発行元を示す情報と対応する入金先情報が取得されなかった場合に、抽出された前記金融機関情報を前記帳票の発行元を示す情報と対応する入金先情報に設定する処理と、をコンピュータに実行させる、情報処理プログラム。
【請求項10】
情報処理装置と端末装置とを含む情報処理システムであって、
前記情報処理装置は、
帳票情報に含まれる文字列の定義した情報を参照して帳票画像データから帳票の発行元を示す情報を抽出し、前記帳票の発行元と対応付けられた入金先情報が格納された記憶部を参照して、前記帳票の発行元を示す情報と対応する入金先情報を取得する情報取得部と、
前記帳票の発行元を示す情報と、前記情報取得部により取得された前記入金先情報と、を含む画面データを前記端末装置へ出力する表示制御部と、
金融機関情報に含める文字列の定義を示す定義情報と、金融機関情報に含める文字列を抽出する際の条件を示す条件情報とを参照し、前記帳票画像データから金融機関情報を抽出する抽出部と、を有し、
前記情報取得部は、
前記記憶部から前記帳票の発行元を示す情報と対応する入金先情報が取得されなかった場合に、前記抽出部により抽出された前記金融機関情報を前記帳票の発行元を示す情報と対応する入金先情報に設定し
前記端末装置は、
前記画面データを表示させる表示部を有する、情報処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票の認識を行う情報処理装置、情報処理方法、情報処理プログラム、情報処理システムに関する。
【背景技術】
【0002】
従来から、帳票画像から文字列を読み取り、読み取った文字列から、互いに対応付く文字列を、項目名と項目値として抽出する帳票認識技術が知られている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
帳票のレイアウトは多種多様であり、その中には、予め固定された項目名と項目値とを含む帳票が存在する。従来の技術では、このように予め固定された項目名と項目値に対しても、帳票認識を行う度に、ユーザによる帳票認識結果の確認が要求され。また、従来では、予め固定された項目名と項目値が正しく抽出されていない場合には、その都度ユーザによる修正が必要となる。
【0004】
このように、従来の技術では、予め固定された項目名と項目値に対しても、ユーザによる確認作業や修正作業等が発生するため、作業が煩雑であり、ユーザの負荷となる。
【0005】
本発明は、上記事情に鑑みて成されたものであり、ユーザの負荷を軽減させることを目的としている。
【課題を解決するための手段】
【0006】
開示の技術は、帳票情報に含まれる文字列の定義した情報を参照して帳票画像データから、帳票の発行元を示す情報を抽出し、前記帳票の発行元と対応付けられた入金先情報が格納された記憶部を参照して、前記帳票の発行元を示す情報と対応する入金先情報を取得する情報取得部と、前記帳票の発行元を示す情報と、前記情報取得部により取得された前記入金先情報と、を含む画面データを端末装置へ出力する表示制御部と、金融機関情報に含める文字列の定義を示す定義情報と、金融機関情報に含める文字列を抽出する際の条件を示す条件情報とを参照し、前記帳票画像データから金融機関情報を抽出する抽出部と、を有し、前記情報取得部は、前記記憶部から前記帳票の発行元を示す情報と対応する入金先情報が取得されなかった場合に、前記抽出部により抽出された前記金融機関情報を前記帳票の発行元を示す情報と対応する入金先情報に設定する、情報処理装置である。

【発明の効果】
【0007】
ユーザの負荷を軽減させることができる。
【図面の簡単な説明】
【0008】
図1】帳票認識システムのシステム構成の一例を示す図である。
図2】サーバ装置のハードウェア構成の一例を示す図である。
図3】抽出定義データベースの一例を示す第一の図である。
図4】抽出定義データベースの一例を示す第二の図である。
図5】辞書データベースの一例を示す図である。
図6】取引先データベースの一例を示す図である。
図7】サーバ装置の機能を説明する図である。
図8】帳票認識システムの動作を説明するシーケンス図である。
図9】ジョブリストの一例を示す図である。
図10】帳票認識部の処理を説明する第一のフローチャートである。
図11】帳票認識部の処理を説明する第二のフローチャートである。
図12】文字認識について説明する図である。
図13A】金融機関情報の抽出結果の一例を示す図である。
図13B】認識結果データの一例を示す図である。
図14】帳票認識部の処理を説明する第三のフローチャートである。
図15】帳票認識部の処理を説明する第四のフローチャートである。
図16】表示例を示す第一の図である。
図17】表示例を示す第二の図である。
図18】表示例を示す第三の図である。
図19】表示例を示す第四の図である。
図20】表示例を示す第五の図である。
図21】表示例を示す第六の図である。
図22】出力データの一例を示す図である。
【発明を実施するための形態】
【0009】
以下に図面を参照して、実施形態について説明する。図1は、帳票認識システムのシステム構成の一例を示す図である。
【0010】
本実施形態の帳票認識システム100は、サーバ装置200、画像形成装置300、端末装置400を有する。本実施形態の帳票認識システム100において、サーバ装置200と、画像形成装置300と、端末装置400とは、ネットワークを介して接続される。
【0011】
また、本実施形態の端末装置400は、例えば、ネットワークを介して基幹システム500と接続される。基幹システム500とは、例えば、本実施形態の帳票認識システム100において帳票を認識した結果を用いて、特定の処理を行うシステムである。
【0012】
本実施形態では、請求書を帳票の一例として説明する。
【0013】
本実施形態の帳票認識システム100は、請求書を読み取った帳票画像から、請求書を発行した請求元と、請求金額を示す情報(請求書情報)を抽出する。そして、帳票認識システム100は、請求元と請求金額の入金となる金融機関とを対応付けた取引先情報を参照し、抽出された請求元と対応する金融機関を特定する。尚、取引先情報は、予めサーバ装置200に格納された情報であり、項目名と項目値とが固定された情報である。つまり、言い換えれば、取引先情報は、請求元(帳票の発行元)と対応付けられた固定情報である。取引先情報の詳細は後述する。
【0014】
また、本実施形態では、帳票認識により、帳票画像から、請求金額の入金先となる金融機関に関する情報(金融機関情報)を抽出し、取引先情報から特定された金融機関を示す情報と照合してもよい。
【0015】
また、基幹システム500は、金融機関に対する請求金額の振込等を行う会計システムであってもよい。
【0016】
本実施形態の帳票認識システム100において、サーバ装置200は、画像形成装置300のスキャナ機能によって読み取られた帳票の画像を示す画像データから、帳票に含まれる項目と項目の値とを抽出し、項目と項目の値とを対応付けたテキストデータとする。
【0017】
以下の説明では、画像形成装置300のスキャナ機能によって読み取られた帳票の画像を帳票画像と呼び、帳票画像を示す画像データを帳票画像データと呼ぶ。
【0018】
また、以下の説明では、帳票画像に含まれる項目の名称(項目名)と、この項目の値(項目値)とを抽出し、項目と項目の値とをテキストデータに変換して対応付けることを、帳票認識と呼ぶ。
【0019】
本実施形態のサーバ装置200は、記憶部220と、帳票認識処理部230とを有する。記憶部220には、画像データベース240、抽出定義データベース250、辞書データベース260、取引先データベース270、認識結果データベース280が設けられている。
【0020】
画像データベース240は、帳票画像データが格納される。抽出定義データベース250は、抽出定義情報が格納される。抽出定義情報は、帳票画像から金融機関情報に含まれる文字列を抽出する際に、帳票認識処理部230に参照される。
【0021】
辞書データベース260は、金融機関を特定するための辞書情報が格納される。辞書情報は、予め取得された情報であり、帳票認識処理部230により、金融機関名等を特定する際に参照される。
【0022】
取引先データベース270は、帳票認識システム100が提供するサービスを利用する組織(テナント)の取引先に関する取引先情報が格納される。テナントとは、言い換えれば、請求書を受け取る請求先である。また、テナントの取引先とは、請求書を受け取ったテナントから、請求書に記載された金額の支払いを受ける組織である。つまり、テナントの取引先とは、言い換えれば、請求書を発行した請求元(帳票の発行元)である。取引先情報は、テナント毎に予め取引先データベース270に格納された情報であり、予め項目名と項目値とが固定された情報である。
【0023】
認識結果データベース280は、帳票認識処理部230による帳票認識の結果を示す情報が格納される。
【0024】
本実施形態の帳票認識処理部230は、画像データベース240に格納された帳票画像データを取得し、文字認識を行って、帳票画像に含まれる文字列群を抽出する。そして、帳票認識処理部230は、文字列群から請求書情報を抽出する。また、帳票認識処理部230は、抽出定義データベース250に格納された抽出定義情報253を参照して、文字列群から、金融機関情報に含める文字列を抽出する。
【0025】
本実施形態の抽出定義情報253は、金融機関情報に含める文字列の定義を示す定義情報251と、金融機関情報に含める文字列を抽出する際の条件を示す条件情報252とを含む。
【0026】
帳票認識処理部230は、定義情報251を参照して、文字認識により抽出された文字列群から、金融機関名と対応する文字列を特定し、特定された文字列との位置関係に基づき、金融機関名を示す文字列(第一の文字列)を抽出する。
【0027】
つまり、第一の文字列は、文字認識によって抽出された文字列群から特定された文字列を基点として抽出される。言い換えれば、文字認識によって抽出された文字列群から特定された文字列は、第一の文字列の抽出基点となる文字列となる。
【0028】
また、帳票認識処理部230は、条件情報252を参照し、金融機関名を示す文字列(第一の文字列)との位置関係に基づき、金融機関情報に含める他の文字列(第二の文字列)を抽出する。
【0029】
つまり、第二の文字列は、第一の文字列を基点として抽出される。言い換えれば、第一の文字列は、前の抽出基点に基づき特定された文字列であって、第二の文字列の抽出基点となる文字列となる。
【0030】
そして、帳票認識処理部230は、帳票画像データから、第一の文字列と第二の文字列とを対応付けて金融機関情報とする。
【0031】
また、帳票認識処理部230は、抽出定義情報253に基づき抽出された文字列と、辞書データベース260に格納された辞書情報とに基づき、金融機関名等を確定させる。そして、帳票認識処理部230は、請求書情報と、金融機関情報とを対応付けた認識結果を認識結果データベース280へ格納する。
【0032】
また、本実施形態の帳票認識処理部230は、取引先データベース270を参照し、帳票認識によって抽出された請求書情報に含まれる請求元と対応する取引先情報を特定する。そして、帳票認識処理部230は、取引先情報に含まれる金融機関を示す情報を、請求金額の入金先を示す入金先情報として、請求書情報と共に、端末装置400に表示させてもよい。
【0033】
本実施形態では、このように、入金先情報を取引先データベース270から取得することで、例えば、帳票画像データから抽出された金融機関情報に誤りがあった場合でも、予め固定された項目名と項目値である入金先情報を取得することができる。
【0034】
したがって、本実施形態によれば、帳票認識を行う度に、ユーザ(テナント)が金融機関情報を確認する必要になく、ユーザの負担を軽減できる。
【0035】
また、本実施形態において、入金先情報は、認識結果データの一部として、請求書情報及び金融機関情報と対応付けられて、認識結果データベース280に格納されてもよい。
【0036】
また、帳票認識処理部230は、認識結果データを、基幹システム500と対応する形式に変換し、基幹システム500に対して出力してもよい。
【0037】
本実施形態では、このように、帳票認識における文字認識によって、金融機関名と対応する文字列と対応付けられた複数の文字列を抽出することができる。言い換えれば、本実施形態によれば、帳票画像から抽出された文字列と対応づけられた複数の文字列を抽出することができ、帳票の認識の精度を向上させることができる。
【0038】
本実施形態の帳票認識システム100において、画像形成装置300は、スキャナ機能を有する複合機である。画像形成装置300は、コピー機能、FAX機能、スキャナ機能等を実現するためのアプリケーションが搭載されており、各機能と対応するアプリケーションを選択することで、これらの機能が実現される。
【0039】
本実施形態の端末装置400は、帳票認識システム100を利用する利用者(テナント)によって使用される。また、端末装置400には、サーバ装置200による帳票認識の結果が表示されてもよい。
【0040】
尚、本実施形態におけるテナントとは、例えば、企業等である。より具体的には、例えば、テナントとは、帳票認識システム100が提供するサービスを利用するための契約を締結している事業所や企業、団体等である。
【0041】
また、図1の例では、サーバ装置200は、記憶部220内に5つのデータベースを有する構成としたが、これに限定されない。各データベースは、一部がサーバ装置200の外部装置に設けられていてもよいし、各データベース全てが外部装置に設けられていてもよい。
【0042】
また、図1の例では、サーバ装置200が帳票認識処理部230を実現するものとしたが、これに限定されない。帳票認識処理部230は、複数の情報処理装置によって実現されてもよい。
【0043】
また、図1の例では、帳票認識システム100に含まれる画像形成装置300と端末装置400とは、それぞれ1台としているが、帳票認識システム100に含まれる画像形成装置300と端末装置400の台数は、任意の数であって良い。
【0044】
次に、図2を参照して、本実施形態のサーバ装置200のハードウェア構成について説明する。図2は、サーバ装置のハードウェア構成の一例を示す図である。
【0045】
図2に示されているように、サーバ装置200は、コンピュータによって構築されており、図2に示されているように、CPU201、ROM202、RAM203、HD204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)208、ネットワークI/F209、バスライン210、キーボード211、ポインティングデバイス212、DVD-RW(Digital Versatile Disk Rewritable)ドライブ214、メディアI/F216を備えている。
【0046】
これらのうち、CPU201は、サーバ装置200全体の動作を制御する。ROM202は、IPL等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。HD204は、プログラム等の各種データを記憶する。HDDコントローラ205は、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御する。ディスプレイ206は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F208は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F209は、通信ネットワークを利用してデータ通信をするためのインターフェースである。バスライン210は、図2に示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
【0047】
また、キーボード211は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス212は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ214は、着脱可能な記録媒体の一例としてのDVD-RW213に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F216は、フラッシュメモリ等の記録メディア215に対するデータの読み出し又は書き込み(記憶)を制御する。
【0048】
本実施形態の端末装置400のハードウェア構成は、サーバ装置200と同様であるから、説明を省略する。尚、端末装置400は、例えば、タブレット型の端末装置や、スマートフォン等であってもよく、キーボード211やポインティングデバイス212と、ディスプレイ206の代わりに、タッチパネル等により実現される表示操作装置を有していてもよい。
【0049】
次に、図3図4を参照して、本実施形態のサーバ装置200の有する抽出定義データベース250について
図3は、抽出定義データベースの一例を示す第一の図である。図3では、抽出定義データベース250に格納された抽出定義情報253に含まれる定義情報251の一例を示す。
【0050】
定義情報251は、情報の項目として、項目名、抽出基点、抽出方向、抽出範囲、辞書参照を有する。抽出定義データベース250において、項目「項目名」とその他の項目とは対応付けられており、項目「項目名」の値と、その他の項目の値とを含む情報が定義情報251となる。
【0051】
項目「項目名」の値は、項目値と対応付けられる項目名を示す。項目「項目名」の値は、項目名と対応する項目「抽出基点」の値が示す文字列との位置関係に基づき抽出される。言い換えれば、項目「項目名」の値は、第一の文字列又は第二の文字列に対応付けられる項目名である。
【0052】
また、項目「項目名」の値は、金融機関情報に含まれる情報の項目でもある。図3の例では、項目「項目名」の値として、銀行名、支店名、口座種別、口座番号、口座名義が含まれる。これらの値は、金融機関情報の項目となる。
【0053】
項目「抽出基点」の値は、項目「項目名」の値が示す項目名の項目値となる文字列を抽出する際に、基点となる文字列を示す。
【0054】
項目「抽出方向」の値は、基点になる文字列と、項目「項目名」の値が示す項目名の項目値となる文字列との位置関係を示す。言い換えれば、項目「抽出方向」の値は、過去に抽出された文字列であって、基点となる文字列(第一の文字列)に対して、項目「項目名」の値が示す項目名の項目値となる文字列(第二の文字列)が存在する方向を示す。
【0055】
項目「抽出範囲」の値は、抽出する文字列の数を示す。項目「辞書参照」の値は、辞書データベース260に格納された辞書情報を参照して文字列を確定させる処理を行うか否かを示す。
【0056】
図3では、例えば、項目名「銀行名」の項目値となる文字列は、帳票画像から抽出された文字列群のうち、「金融機関」、「振込先」等の文字列の右方向又は下方向に位置する文字列であり、該当する文字列の数は1つであり、辞書データベース260に基づき確定される文字列である。
【0057】
また、例えば、項目名「支店名」の項目値となる文字列は、項目名「銀行名」の項目値として抽出された文字列を抽出基点として、抽出基点となる文字列の右側に位置する文字列、又は、抽出基点となる文字列の下側に位置する文字列であり、該当する文字列の数は1つであり、辞書データベース260に基づき確定される文字列である。
【0058】
したがって、ここでは、項目名「銀行名」と対応する項目値として抽出された文字列が第一の文字列となり、項目名「支店名」と対応する項目値として抽出された文字列が第二の文字列となる。
【0059】
また、例えば、項目名「口座種別」の項目値となる文字列は、項目名「支店名」の項目値として抽出された文字列を抽出基点として、抽出基点となる文字列の右側に位置する文字列、又は、抽出基点となる文字列の下側に位置する文字列、又は、抽出基点となる文字列の左側に位置する文字列である。また、項目名「口座種別」の項目値となる文字列は、該当する文字列の数は、2つであり、辞書データベース260に基づき確定される文字列である。
【0060】
この場合、項目名「支店名」と対応する項目値として抽出された文字列が第一の文字列となり、項目名「口座種別」と対応する項目値として抽出された文字列が第二の文字列となる。
【0061】
図4は、抽出定義データベースに一例を示す第二の図である。図4は、抽出定義情報253に含まれる条件情報252を示す。
【0062】
条件情報252は、情報の項目として、支店名抽出条件、口座種別抽出条件、口座番号抽出条件を有する。抽出定義データベース250において、項目「項目名」の値を含む情報が条件情報252となる。
【0063】
項目「支店名抽出条件」の値は、項目名「支店名」の項目値として抽出される文字列の条件を示す。項目「口座種別抽出条件」の値は、項目名「口座種別」の項目値として抽出される文字列の条件を示す。項目「口座番号抽出条件」の値は、項目名「口座番号」の項目値として抽出される文字列の条件を示す・
図4では、項目名「支店名」の項目値として抽出される文字列の条件を、文字列の末尾に、「支店」、「本店」、「店」、「営業所」、「営業部」等であることとしている。また、項目名「口座種別」の項目値として抽出される文字列の条件を、文字列に、「普」、「通」、「当」、「座」、「貯」、「蓄」を含むこととしている。また、項目名「口座番号」の項目値として抽出される文字列の条件を、数字としている。
【0064】
次に、図5を参照して、辞書データベース260について説明する。図5は、辞書データベースの一例を示す図である。
【0065】
本実施形態の辞書データベース260に格納される辞書情報は、情報の項目として、銀行名と支店名とを有し、各項目は対応付けられている。本実施形態において、項目「銀行名」の値と、項目「支店名」の値と、を対応付けた情報が辞書情報である。
【0066】
図5の例では、銀行名「XXX銀行」には、「AAA支店」、「CCC支店」、「EEE支店」が存在することがわかる。
【0067】
次に、図6を参照して、取引先データベース270について説明する。図6は、取引先データベースの一例を示す図である。
【0068】
本実施形態の取引先データベース270は、テナント毎に設けられていてよい。取引先データベース270は、情報の項目として、テナント名、取引先名、基本情報、取引担当者、支払情報等を含む。
【0069】
取引先データベース270において、項目「テナント名」とのその他の項目とが対応付けられている。本実施形態において、取引先データベース270において、項目「テナント名」の値と、その他の項目の値とを含む情報が、取引先情報である。
【0070】
項目「テナント名」の値は、テナントの名称を示し、テナントを特定するための情報である。尚、テナントを特定するための情報として、テナント名以外の情報を用いても良い。具体的には、例えば、テナントを特定するための情報として、テナントID等を用いてもよい。
【0071】
項目「取引先名」の値は、テナントの取引先の名称を示し、取引先を特定するための情報である。尚、取引先とは、請求書の請求元である。したがって、本実施形態の項目「取引先名」の値は、帳票(請求書)の発行元を特定するための情報である。尚、項目「取引先名」の値は、取引先を特定するための情報であればよく、取引先(請求元)を特定する取引先ID等であってもよい。
【0072】
項目「基本情報」の値は、取引先名で特定される取引先の電話番号、住所等を含む情報である。項目「取引担当者」の値は、取引担当者の名称や連絡先等を含む情報である。
【0073】
項目「支払情報」には、項目「支払方法」、「金融機関名」、「支店名」、「口座種別」、「口座番号」、「口座名義」、「手数料負担」、「支払条件」等が対応付けられている。
【0074】
項目「支払方法」の値は、取引先に対する請求金額の支払い方法を示す。項目「金融機関名」の値は、請求金額の入金先となる金融機関を示す。項目「支店名」の値は、請求金額の入金先となる金融機関の支店名を示し、項目「口座種別」、「口座番号」、「口座名義」のそれぞれの値は、口座種別、口座番号、口座名義を示す。
【0075】
項目「手数料負担」の値は、支払いの際に生じる手数料を支払う側を示す。項目「支払条件」の値は、支払いを行う際の条件を示す。
【0076】
本実施形態では、取引先データベース270において、項目「支払情報」と対応付けられた項目「金融機関名」、「支店名」、「口座種別」、「口座番号」、「口座名義」のそれぞれの値を含む情報が、請求金額の入金先を示す入金先情報となる。
【0077】
このように、本実施形態の取引先情報は、項目名と項目値とが、帳票の発行元に応じて予め固定された固定情報である。より具体的には、本実施形態の取引先データベース270に格納された取引先情報に含まれる入金先情報は、項目値と項目値が帳票の発行元に応じて予め決められた固定情報である。固定情報とは、帳票に含まれる情報のうち、帳票の発行元に応じて予め決められた情報である。すなわち、固定情報は、同一発行元により発行された帳票であれば、変化しない情報である。
【0078】
尚、図6は、取引先データベース270の一例を示すものであり、取引先データベース270は、図6に示す全ての項目を含まなくてもよい。取引先データベース270は、例えば、項目「テナント名」、「取引先名」の値と、入金先情報を示す項目「金融機関名」、「支店名」、「口座種別」、「口座番号」、「口座名義」の値と、を含んでいればよい。
【0079】
また、テナント毎の取引先情報には、例えば、各テナントが保有する金融機関の口座情報等を含んでいてもよい。言い換えれば、取引先情報には、請求金額の支払元となる支払元情報が含まれてもよい。
【0080】
次に、図7を参照して、サーバ装置200の機能について説明する。図7は、サーバ装置の機能を説明する図である。
【0081】
本実施形態のサーバ装置200では、例えば、HD504等に格納された情報処理プログラムをCPU201が読み出して実行することで、後述する各部の機能が実現される。
【0082】
本実施形態のサーバ装置200は、帳票認識処理部230を有する。帳票認識処理部230は、入力受付部221、認証処理部222、帳票認識部290を有する。
【0083】
入力受付部221は、サーバ装置200に対する各種の入力を受け付ける。具体的には、入力受付部221は、帳票認識システム100にログインするための認証情報の入力を受け付ける。認証情報とは、例えば、利用者IDとパスワード等である。また、入力受付部221は、例えば、画像形成装置300から送信された帳票画像データの入力を受け付ける。
【0084】
認証処理部222は、入力受付部221が入力を受け付けた認証情報に基づき、認証を行う。尚、認証処理部222は、例えば、サーバ装置200の外部に設けられた認証サーバに対して、入力された認証情報を送信し、認証サーバによる認証の結果を取得してもよい。認証処理部222は、利用者が認証されると、入力受付部221が受け付けた帳票画像データを帳票認識部290に渡してもよい。
【0085】
本実施形態の帳票認識部290は、画像データ格納部291、ジョブリスト生成部292、画像データ取得部293、文字認識部294、第一抽出部295、第二抽出部296、認識結果生成部297、更新部299、表示制御部284、出力部285を有する。
【0086】
画像データ格納部291は、画像形成装置300から帳票画像データを受信すると、画像データベース240に格納する。
【0087】
ジョブリスト生成部292は、入力受付部221が画像形成装置300から帳票画像データの入力を受け付けて、ジョブリストにジョブを登録し、ジョブリストを管理する。ジョブリストの詳細は後述する。
【0088】
画像データ取得部293は、画像データベース240に格納された帳票画像データを取得する。
【0089】
文字認識部294は、帳票画像データから、文字列と、文字列が配置された位置を示す情報とを抽出し、読取結果情報として保持する。したがって、読取結果情報には、帳票画像データから抽出された文字列群が含まれる。読取結果情報の詳細は後述する。
【0090】
第一抽出部295は、読取結果情報から、請求書を発行した請求元を示す情報、請求金額を示す情報を、文字列として抽出し、請求書情報とする。尚、第一抽出部295は、例えば、予め請求書情報に含まれる文字列の定義を示す情報等を保持し、この情報に基づき。請求書情報に含まれる文字列を抽出してもよい。
【0091】
第二抽出部296は、抽出定義データベース250の定義情報251と、条件情報252とを参照して、金融機関情報を抽出する。第二抽出部296の処理の詳細は後述する。
【0092】
このことから、第一抽出部295は、帳票画像データから請求書情報を抽出する請求書情報抽出部の一例であり、第二抽出部296は、帳票画像データから金融機関情報を抽出する金融機関情報抽出部の一例である。
【0093】
認識結果生成部297は、第一抽出部295により抽出された請求書情報と、第二抽出部296により抽出された金融機関情報と、を対応付けた認識結果データを生成する。
【0094】
情報取得部298は、取引先データベース270から、請求書情報に含まれる請求元と対応する支払情報を取得する。具体的には、情報取得部298は、取引先データベース270を参照し、第一抽出部295が抽出した請求書情報に含まれる請求元と、取引先名とが一致する取引先情報を特定する。そして、情報取得部298は、特定した取引先情報に含まれる支払情報を取得する。さらに、本実施形態の情報取得部298は、取得された支払情報から、支払情報に含まれる入金先情報を取得する。
【0095】
更新部299は、端末装置400に表示された認識結果の確認画面に表示された入金先情報に対して、編集が行われた場合等に、取引先データベース270を更新する。
【0096】
表示制御部284は、端末装置400等における画面の表示を制御する。具体的には、表示制御部284は、端末装置400に表示される認識結果確認画面を示す画面データを生成してもよい。
【0097】
出力部285は、表示制御部284が生成した認識結果確認画面を示す画面データを端末装置400へ出力する。言い換えれば、出力部285は、表示制御部284が生成した認識結果確認画面を端末装置400のウェブブラウザ(表示部)上で表示させる。また、出力部285は、認識結果データを、基幹システム500と対応する形式のデータに変換し、出力する。
【0098】
以下に、図8を参照して、本実施形態の帳票認識システム100の動作について説明する。図8は、帳票認識システムの動作を説明するシーケンス図である。
【0099】
帳票認識システム100において、画像形成装置300は、利用者から帳票認識を行うためのアプリケーションの起動要求を受け付けると(ステップS801)、このアプリケーションを起動させる(ステップS802)。利用者とは、例えば、テナントの管理者等である。
【0100】
続いて、画像形成装置300は、利用者から認証情報の入力を受け付けると(ステップS803)、この認証情報をサーバ装置200へ送信し、認証要求を行う(ステップS804)。
【0101】
サーバ装置200は、認証要求を受けて、認証処理部222により認証を行い、その結果を画像形成装置300へ通知する(ステップS805)。尚、ここでは、利用者が認証された場合の動作を示している。
【0102】
続いて、画像形成装置300は、帳票のスキャン指示を受け付け(ステップS806)、帳票のスキャンを行い、帳票画像データを取得する(ステップS807)。続いて、画像形成装置300は、帳票画像データをサーバ装置200へ送信する(ステップS808)。
【0103】
サーバ装置200は、入力受付部221が帳票画像データの入力を受け付けると、認証処理部222がこの帳票画像データを帳票認識部290へ渡す(ステップS809)。尚、図8の例では、認証処理部222を介して帳票画像データが帳票認識部290へ渡されるものとしたが、これに限定されない。帳票画像データは、認証処理部222を介さずに帳票認識部290に渡されてもよい。
【0104】
サーバ装置200の帳票認識部290は、帳票画像データを受け取ると、ジョブリスト生成部292により、ジョブリストにジョブを登録する(ステップS810)。続いて、帳票認識部290は、画像データ格納部291により、帳票画像データを画像データベース240へ格納する(ステップS811)。
【0105】
続いて、帳票認識部290は、画像データ取得部293により、画像データベース240から認識する対象となる帳票画像データを取得し(ステップS812)、帳票画像を認識する処理を実行する(ステップS813)。
【0106】
具体的には、本実施形態の帳票認識部290は、第一抽出部295により、読取結果情報に含まれる文字列群から請求書情報を抽出し、第二抽出部296により、文字列群から金融機関情報を抽出し、認識結果生成部297により、請求書情報と金融機関情報とを対応付けた認識結果データを生成する。
【0107】
また、帳票認識部290は、補完部298により、読取結果情報に含まれる文字列群を辞書データベース260に基づき補完した、補完後読取結果情報を生成する。ステップS813の処理の詳細は後述する。
【0108】
続いて、帳票認識部290は、認識結果生成部297が生成した認識結果データを認識結果データベース280に格納する(ステップS814)。
【0109】
帳票認識システム100において、端末装置400は、利用者からのブラウザの表示指示の入力を受け付けると(ステップS815)、サーバ装置200に対して認識結果データを表示させるブラウザの表示要求を行う(ステップS816)。
【0110】
また、端末装置400は、利用者から認証情報の入力を受け付けて(ステップS817)、この認証情報をサーバ装置200へ送信する(ステップS818)。
【0111】
サーバ装置200は、認証処理部222により、利用者の認証を行い(ステップS819)、その結果を端末装置400へ通知する(ステップS820)。尚、ここでは、利用者が認証された場合の処理を示す。
【0112】
続いて、端末装置400は、利用者から、帳票画像の認識結果の閲覧指示の入力を受け付けると(ステップS821)、サーバ装置200に対して閲覧要求を行う(ステップS822)。
【0113】
サーバ装置200は、閲覧要求を受けて、認識結果データベース280に格納されている認識結果データを取得する(ステップS823)。続いて、サーバ装置200は、認識結果データに含まれる支払情報を取得する(ステップS824)。ステップS824の処理の詳細は後述する。
【0114】
続いて、サーバ装置200は、認識結果確認画面を生成して端末装置400のブラウザ上に表示させ(ステップS825)、利用者に、表示された認識結果確認画面で認識結果を確認させて、処理を終了する。
【0115】
ここで、図9を参照して、本実施形態のジョブリスト生成部292により生成されるジョブリストについて説明する。図9は、ジョブリストの一例を示す図である。
【0116】
本実施形態のサーバ装置200は、画像形成装置300から帳票画像データが入力されると、ジョブリスト生成部292により、帳票画像データとジョブIDとを対応付けたジョブリストとして保持する。
【0117】
本実施形態のジョブリスト91は、情報の項目として、ジョブID、利用者ID、帳票画像ファイルパス、認識結果ファイルパス、ステータスを有する。
【0118】
項目「ジョブID」の値は、ジョブを特定する識別子である。言い換えれば、項目「ジョブID」の値は、画像形成装置300から受信した帳票画像データを特定するための識別子である。
【0119】
項目「利用者ID」の値は、帳票認識システム100にログインした利用者を特定するための識別子である。
【0120】
項目「画像ファイルパス」の値は、帳票画像データが格納されている場所を示す情報である。項目「認識結果ファイルパス」の値は、帳票画像を認識した結果の認識結果データが格納されている場所を示す情報である。
【0121】
項目「ステータス」の値は、帳票画像の認識の進捗を示す。言い換えれば、項目「ステータス」の値は、ジョブの状態を示す。
【0122】
本実施形態では、項目「ステータス」の値として、未処理状態、下書き保存状態、確定済み状態、外部出力済み状態の4つがある。各状態は、以下の通りである。
【0123】
・未処理状態(状態1) 帳票認識によって認識結果データが取得された直後であり、認識結果の確認等が行われていない状態。
【0124】
・下書き保存状態(状態2) 認識結果データの確認等の作業の途中等であり、認識結果データが確定される前の状態。
【0125】
・確定済み状態(状態3) 認識結果データの確認等の作業が完了し、確定された情報として認識結果データベース280へ格納された状態。
・外部出力済み状態(状態4) 帳票認識システム100と連携する会計システム等への認識結果データの出力が完了した状態。
【0126】
本実施形態のサーバ装置200は、画像形成装置300から帳票画像データを受信すると、ジョブリスト生成部292により、ジョブIDを付与し、認証情報として取得した利用者IDを対応付けて、ジョブリスト91にレコードを追加する。そして、ジョブリスト生成部292は、帳票画像データが画像データベース240に格納されると、この格納先を示す情報を項目「画像ファイルパス」の値として、追加する。
【0127】
さらに、ジョブリスト生成部292は、帳票画像の認識において、参照する帳票定義情報が特定されると、その定義IDを項目「定義ID」の値として追加する。そして、ジョブリスト生成部292は、ジョブリスト91が完了して、認識結果データが認識結果データベース280に格納されると、この格納先を示す情報を項目「認識結果ファイルパス」の値として追加し、項目「ステータス」の値を完了とする。
【0128】
本実施形態では、例えば、ジョブリスト生成部292によって生成されたジョブリストを表示してもよい。この場合、利用者は、ジョブリストに基づいて表示されたジョブリスト画面を介して、帳票画像の認識の進捗を確認することができる。
【0129】
次に、図10図11を参照して、本実施形態の帳票認識部290の処理について説明する。図10では、図8のステップS813の処理の詳細を示している。
【0130】
図10は、帳票認識部の処理を説明する第一のフローチャートである。より具体的には、図10では、金融機関情報における項目名「銀行名」の項目値となる文字列を抽出する処理を示している。
【0131】
本実施形態の帳票認識部290は、画像データ取得部293により、画像データベース240から帳票画像データを取得する(ステップS1001)。
【0132】
続いて、帳票認識部290は、文字認識部294により、帳票画像から、文字が形成されている領域(以下、文字フィールド)を切り取り、切り取られた文字フィールドの中の文字を切り取り、文字認識する(ステップS1002)。このとき、文字認識部294は、切り出した文字の位置を示す座標も取得する。
【0133】
続いて、帳票認識部290は、文字認識部294により認識された各文字の位置関係に基づいて読取結果情報を生成して、保持する(ステップS1003)。具体的に、帳票認識部290は、認識された各文字の座標に基づいて、互いの距離が予め設定された閾値以内の文字を1つの文字列として認識し、文字列と、文字列が形成された領域の位置を示す座標などの情報とを対応付けて読取結果情報を生成する。読取結果情報の詳細は後述する。
【0134】
続いて、帳票認識部290は、第二抽出部296により、読取結果情報に含まれる文字列群の中から、定義情報251における項目名「銀行名」と対応する抽出基点とされた文字列と、一致する文字列を特定する(ステップS1004)。尚、第二抽出部296は、項目名「銀行名」と対応する抽出基点と一致する文字列が存在しない場合には、抽出基点とされた文字列と、一部が一致する文字列を特定してもよい。言い換えれば、第二抽出部296は、項目名「銀行名」の項目値を抽出するための基点となる文字列を特定する。
【0135】
続いて、第二抽出部296は、ステップS1003において、項目名「銀行名」の抽出基点となる文字列が特定されたか否かを判定する(ステップS1005)。
【0136】
ステップS1005において、該当する文字列が特定されない場合、第二抽出部296は、項目名「銀行名」の項目値を抽出する処理を終了する。
【0137】
ステップS1005において、項目名「銀行名」の抽出基点となる文字列が特定された場合、第二抽出部296は、読取結果情報に含まれる文字列群の中から、定義情報251において、項目名「銀行名」と対応する抽出方向が示す方向に配置された文字列を抽出する(ステップS1006)。ここで抽出される文字列は、項目名「銀行名」の項目値となる文字列である。
【0138】
続いて、第二抽出部296は、辞書データベース260に格納された辞書情報と、ステップS1006で抽出された文字列とを照合して、項目名「銀行名」の項目値を決定し(ステップS1007)、項目名「銀行名」の項目値を抽出する処理を終了する。
【0139】
尚、実施形態では、第二抽出部296による金融機関情報の抽出が行われる前に、第一抽出部295により、帳票画像データから請求書情報を抽出する処理が行われてもよい。また、第一抽出部295による請求書情報を抽出する処理は、第二抽出部296による金融機関情報を抽出する処理が行われた後に行われてもよい。
【0140】
尚、図10の例では、第二抽出部296は、ステップS1007において、辞書データベース260に格納された辞書情報を参照して、銀行名の項目値を決定するものとしたが、第二抽出部296は、辞書データベース260を参照しなくてもよい。
【0141】
図11は、帳票認識部の処理を説明する第二のフローチャートである。図11では、金融機関情報における項目名「銀行名」に続く項目名の項目値となる文字列を抽出する処理を示している。
【0142】
本実施形態の帳票認識部290は、第二抽出部296により、定義情報251を参照し、項目値を抽出する対象の項目名(抽出対象項目名)に対応する抽出基点となる文字列と、抽出方向と、を取得する(ステップS1101)。
【0143】
続いて、第二抽出部296は、抽出基点となる文字列が取得されたか否かを判定する(ステップS1102)。ステップS1102において、該当する文字列が取得されない場合、第二抽出部296は、後述するステップS1105へ進む。
【0144】
ステップS1102において、該当する文字列が取得された場合、第二抽出部296は、定義情報251を参照し、取得した文字列と抽出方向に沿って、抽出範囲内に配置され、且つ、条件情報252を満たす文字列を取得する(ステップS1103)。
【0145】
続いて、第二抽出部296は、ステップS1103において、該当する文字列が取得されたか否かを判定する(ステップS1104)。ステップS1104において、該当する文字列が取得された場合、第二抽出部296は、後述するステップS1107へ進む。
【0146】
ステップS1104において、該当する文字列が取得されない場合、第二抽出部296は、次の抽出基点となる文字列が存在するか否かを判定する(ステップS1105)。
【0147】
ステップS1105において、該当する文字列が存在する場合、第二抽出部296は、ステップS1101へ戻る。
【0148】
ステップS1105において、該当する文字列が存在しない場合、第二抽出部296は、定義情報251に含まれる各項目名の項目値を空として(ステップS1106)、後述するステップS1110へ進む。したがって、本実施形態では、ここでは、項目名「銀行名」の項目値が抽出されない場合には、金融機関情報の全ての項目名の項目値が空となる。
【0149】
ステップS1104において、該当する文字列が取得できない場合、第二抽出部296は、定義情報251における項目「辞書参照」の値を参照し、辞書データベース260を参照するか否かを判定する(ステップS1107)。
【0150】
ステップS1107において、辞書データベース260を参照しないと判定された場合、第二抽出部296は、後述するステップS1109へ進む。
【0151】
ステップS1107において、辞書データベース260を参照すると判定された場合、第二抽出部296は、辞書データベース260を参照し、抽出された文字列と照合する(ステップS1108)。
【0152】
続いて、第二抽出部296は、項目名の項目値となる文字列を決定する(ステップS1109)。
【0153】
続いて、第二抽出部296は、定義情報251に含まれる全ての項目名に、項目値を対応付けたか否かを判定する(ステップS1110)。ステップS1110において、全ての項目値が対応付けられていない場合、第二抽出部296は、ステップS1101へ戻る。
【0154】
ステップS1110において、全ての項目名に項目値が対応付けられている場合、帳票認識部290は、認識結果生成部297により、金融機関情報と請求書情報とを対応付けた認識結果データを生成する(ステップS1111)。
【0155】
続いて、認識結果生成部297は、認識結果データの格納先をジョブリスト91に登録し(ステップS1112)、処理を終了する。
【0156】
このように、本実施形態の第二抽出部296は、抽出基点とされた文字列との位置関係に基づき抽出された文字列を、次の抽出基点となる文字列する処理を繰り返していく。そして、本実施形態の第二抽出部296は、抽出基点とされた文字列との位置関係に基づき抽出された文字列を、抽出基点とされた文字列と対応する項目名の項目値とする。
【0157】
次に、図12図13A図13Bを参照し、帳票認識部290の処理について具体的に説明する。図12は、文字認識について説明する図である。
【0158】
図12に示す情報121は、帳票画像データに対し、文字認識部294による文字認識を行った結果である。
【0159】
情報121は、文字フィールドを切り取り、文字フィールドの中の文字を認識した結果と、文字の位置を示す座標とから抽出した例を示す。
【0160】
本実施形態の文字認識部294は、この情報121から、隣り合う位置にある文字同士をつなげて文字列(文字列)を認識する。具体的には、文字認識部294は、文字と文字との間の距離が、所定ピクセル以内である文字の組み合わせを、1つ単語として認識しても良い。
【0161】
図12に示す情報122は、文字認識部294により認識された文字列と、文字列の領域とを示す情報であり、文字認識部294による帳票画像の読取結果情報である。
【0162】
また、文字認識部294は、帳票画像データから、縦線と横線で区切られた領域を1つのセルとして認識し、セル毎にセルを識別する識別情報(セルID)を付与する。
【0163】
図12に示す情報122は、帳票画像から認識されたセル毎の領域とセルIDとの対応付けを示す情報である。
【0164】
図12では、例えば、文字列「お振込先」が認識された領域は、情報121において、X座標とY座標によって示される位置を基準として、高さと幅とから特定される。
【0165】
また、情報121において、キーワード「氏名」が認識された領域は、セルID「2」に含まれることがわかる。したがって、キーワード「お振込先」は、読取結果情報に含まれる文字列として、セルID「37」と対応付けられる。
【0166】
本実施形態の帳票認識部290は、このようにして、帳票画像データから、文字列とセルとを対応付ける。
【0167】
図13Aは、金融機関情報の抽出結果の一例を示す図である。本実施形態の第二抽出部296は、まず、図10の処理により、金融機関情報に含まれる項目のうち、銀行名が抽出される。
【0168】
具体的には、第二抽出部296は、定義情報251において、先頭の項目名「銀行名」の抽出基点となる文字列を、読取結果情報に含まれる文字列群から特定する。そして、第二抽出部296は、定義情報251によって規定された、特定した文字列(第一の文字列)との位置関係に基づき、項目名「銀行名」の項目値となる文字列を特定する。
【0169】
定義情報251では、項目名「銀行名」は、抽出基点の文字列の右方向、又は、下方向に位置する文字列である。
【0170】
ここでは、例えば、読取結果情報の文字列群の中から、「お振込先」という文字列が特定されると、第二抽出部296は、この「お振込先」を抽出基点して、「お振込先」の右側又は下側に位置する文字列を、項目名「銀行名」の項目値とする。
【0171】
尚、定義情報251において、抽出方向が複数定義されている場合、最初に定義された抽出方向から順に、該当する位置における文字列の有無を判定していく。
【0172】
図13Aの例では、項目「銀行名」の項目値として、「XXX銀行」という文字列が特定されたことがわかる。
【0173】
尚、ここで、例えば、文字認識によって、項目「銀行名」の項目値に特定された文字列が示す銀行名が、誤っていた場合でも、第二抽出部296は、辞書情報と照合し、特定された文字列と部分一致する文字列を、銀行名を示す文字列とする。
【0174】
次に、第二抽出部296は、定義情報251において、次の項目名「支店名」と対応する抽出基点の文字列を特定する。定義情報251では、項目名「支店名」の抽出基点となる文字列は、抽出済みの銀行名である。したがって、ここでは、「XXX銀行」が抽出基点の文字列となる。
【0175】
第二抽出部296は、項目名「支店名」と対応する抽出方向が、右と下であるため、はじめに、「XXX銀行」の右側に配置された文字列の有無を判定する。そして、該当する位置に文字列が存在する場合、この文字列を、項目名「支店名」の項目値とする。
【0176】
また、第二抽出部296は、右側に該当する文字列が存在しない場合、「XXX銀行」の右側に配置された文字列の有無を判定する。そして、該当する位置に文字列が存在する場合には、その文字列を、項目名「支店名」の項目値とする。
【0177】
第二抽出部296は、この処理を、金融機関情報に含まれる全ての項目名について行い、各項目名と、項目値とを対応づけた情報が、金融機関情報131として抽出される。
【0178】
図13Bは、認識結果データの一例を示す図である。本実施形態の認識結果データ141は、第二抽出部296によって抽出された金融機関情報131と、第一抽出部295によって抽出された請求書情報142とが対応付けられたデータを含む。尚、本実施形態の認識結果データでは、入金先情報を含まれてもよい。図13Bに示す認識結果データ141は、入金先情報が認識結果データに含まれる前の状態であってもよい。
【0179】
請求書情報142には、例えば、情報の項目として、請求書を特定するための請求書番号、請求書の発行元(請求元)、請求日、請求金額等が含まれる。
【0180】
次に、図14を参照して、図8のステップS824の処理の詳細を説明する。図14は、帳票認識部の処理を説明する第三のフローチャートである。図14では、帳票認識部290の情報取得部298による処理を示している。
【0181】
本実施形態の情報取得部298は、図8のステップS823において、認識結果データを取得すると、取引先データベース270を参照する(ステップS1401)。続いて、情報取得部298は、取引先データベース270に、取引先情報の取引先名が、認識結果データに含まれる請求書情報の請求元と完全に一致する取引先情報が存在するか否かを判定する(ステップS1402)。
【0182】
ステップS1402において、取引先データベース270に該当する取引先情報が存在する場合、情報取得部298は、後述するステップS1410へ進む。
【0183】
ステップS1402において、取引先データベース270に該当する取引先情報が存在しない場合、情報取得部298は、取引先データベース270に、取引先情報の取引先名と請求書情報の請求元との標準化編集距離が基準値以下となる取引先情報が存在するか否かを判定する(ステップS1403)。尚、ここでは、取引先名が、請求元と類似している取引先情報が存在するか否かを判定すれば良く、類似しているか否かを判定する方法は、標準化編集距離を求める方法以外の方法であってもよい。
【0184】
ステップS1403において、取引先データベース270に、該当する取引先情報が存在する場合、情報取得部298は、後述するステップS1409へ進む。
【0185】
ステップS1403において、取引先データベース270に該当する取引先情報が存在しない場合、情報取得部298は、第二抽出部296により、金融機関情報が抽出さされているか否かを判定する(ステップS1404)。
【0186】
具体的には、情報取得部298は、認識結果データ141に金融機関情報131が含まれているか否かを判定している。
【0187】
ステップS1404において、金融機関情報が抽出されていない場合、情報取得部298は、後述するステップS1411へ進む。
【0188】
ステップS1404において、金融機関情報が抽出されている場合、情報取得部298は、抽出された金融機関情報が複数存在するか否かを判定する(ステップS1405)。
【0189】
ステップS1405において、複数の金融機関情報が抽出されていない場合、つまり、抽出された金融機関情報が1つであった場合、情報取得部298は、この金融機関情報を入金先情報に設定し(ステップ1406)、後述するステップS1411へ進む。
【0190】
ステップS1405において、複数の金融機関情報が抽出されていた場合、情報取得部298は、端末装置400に金融機関情報の選択画面を表示させ(ステップS1407)、択された金融機関情報を入金先情報に設定し(ステップS1408)、後述するステップS1411へ進む。
【0191】
ステップS1403において、取引先データベース270に、該当する取引先情報が存在する場合、情報取得部298は、標準化編集距離が最小となる取引先情報を参照する(ステップS1409)。
【0192】
続いて、情報取得部298は、参照した取引先情報に含まれる支払情報を取得し、支払情報に含まれる入金先情報を設定する(ステップS1410)。
【0193】
続いて、情報取得部298は、第二抽出部296により抽出された金融機関情報と、取引先データベース270の取引先情報に含まれる入金先情報とを比較し、両者が一致するか否かを判定する(ステップS1411)。
【0194】
ステップS1411において、両者が一致しない場合、情報取得部298は、認識結果の確認画面に表示させるアラートを生成し、処理を終了する。
【0195】
ステップS1411において、両者が一致する場合、情報取得部298は、処理を終了する。
【0196】
本実施形態では、このように、帳票画像データから抽出された請求元と取引先名が一致する、又は、類似する取引先情報を取引先データベース270から取得し、取引先情報の一部として、予め格納されている支払情報に含まれる入金先情報を認識結果データに設定する。
【0197】
したがって、本実施形態では、テナントが請求元に対して請求金額の支払いを行う際に、認識結果の確認画面に表示された入金先情報を毎回確認する必要がなく、テナント(ユーザ)の作業負荷を軽減させることができる。
【0198】
また、本実施形態では、取引先データベース270に、請求元と対応する取引先情報が存在しない場合には、帳票画像データから抽出された金融機関情報を入金先情報として設定するため、テナント(ユーザ)が入金先情報を入力する手間を削減できる。
【0199】
さらに、本実施形態では、取引先データベース270かに取得した入金先情報と、帳票画像データから抽出した金融機関情報とを比較し、一致しない場合には、認識結果の確認画面において、アラートを表示させる。したがって、本実施形態によれば、サーバ装置200によって抽出された入金先情報が正しいか否かの確認をユーザに促すことができる。
【0200】
次に、図15を参照して、認識確の確認画面に表示された入金先情報が更新された場合の更新部299の処理について説明する。図15は、帳票認識部の処理を説明する第四のフローチャートである。図15に示す処理は、認識結果の確認画面において、認識結果データの状態を、確定済みの状態とする操作が行われた後に、更新部299により行われる処理である。
【0201】
本実施形態の更新部299は、認識結果データの状態を確定済みの状態する操作を受け付けると(ステップS1501)、情報取得部298による処理において、取引先データベース270が参照されたか否かを判定する(ステップS1502)。
【0202】
ステップS1502において、取引先データベース270が参照されていない場合、更新部299は、現在設定されている入金先情報(第二抽出部296により抽出された文字列)を、請求元と対応付けて、新規の取引先情報として、取引先データベース270に格納(登録)し(ステップS1503)、後述するステップS1506へ進む。
【0203】
ステップS1502において、取引先データベース270が参照された場合、更新部299は、入金先情報が編集されたか否かを判定する(ステップS1504)。ステップS1504において、編集されていない場合、更新部299は、後述するステップS1506へ進む。
【0204】
ステップS1504において、入金先情報が編集されていた場合、更新部299は、取引先データベース270における、請求元と対応する取引先名と対応付けられた入金先情報を更新する(ステップS1505)。
【0205】
具体的には、更新部299は、例えば、取引先データベース270において、請求元と一致又は類似する取引先名を含む取引先情報に含まれる支払情報と、確定済みの状態とする操作を受け付けたときに設定されていた入金先情報と、が一致しない場合に、入金先情報の編集が行われたと判定してもよい。
【0206】
続いて、更新部299は、認識結果データの状態を確定済みの状態とし、出力部285により、出力データを生成し(ステップS1506)、処理を終了する。
【0207】
本実施形態では、このように、入金先情報が編集された場合には、取引先データベース270を編集内容に合わせて更新することができる。したがって、本実施形態では、ユーザ(テナント)は、1回の入金先情報の編集で、マスタデータである取引先データベース270を更新することができる。このため、本実施形態では、帳票認識を行う度に入金先情報の確認や修正等を行う必要がなく、ユーザの負荷を軽減することができる。
【0208】
次に、図16乃至図21を参照して、本実施形態の表示例について説明する。図16は、表示例を示す第一の図である。
【0209】
図16に示す画面161は、例えば、端末装置400に表示されても良い。画面161は、ステップS826において、端末装置400のブラウザに表示される認識結果の確認画面の一例である。
【0210】
画面161は、表示欄162、表示欄163と、操作ボタン169、170とを含む。表示欄162には、帳票画像データが示す帳票画像が表示される。図16の例では、帳票が請求書であり、帳票画像には、請求書情報を表示させる領域164a、金融機関情報を示す領域164bが含まれる。
【0211】
表示欄163は、表示欄162に表示された帳票画像を示す帳票画像データに対して帳票認識部290による帳票認識を行った結果の認識結果データが表示される。
【0212】
表示欄163は、表示欄165、166、167、168を含む。表示欄165は、請求書情報142が表示される。請求書情報142は、認識結果データの一部である。表示欄166は、金融機関情報131が表示される。表示欄167は、入金先情報が表示される。表示欄168は、ジョブリスト91の項目「ステータス」の値が表示される。
【0213】
図16の例では、領域164aから抽出された請求書情報142が表示欄165に表さ
れ、領域164bから抽出された金融機関情報131が表示欄166に表示される。図16の例では、領域164aから抽出される金融機関情報131が示す金融機関は1つである。
【0214】
また、図16の例では、請求書情報142に含まれる請求元である「○○株式会社」と対応する取引先情報から取得された入金先情報か表示欄167に表示される。
【0215】
図16の例では、請求元が「株式会社○○」である。したがって、帳票認識部290の情報取得部298は、取引先データベース270を参照する。そして、情報取得部298は、取引先名が「株式会社○○」と完全一致する取引先情報が存在するか否かを判定する。
【0216】
この場合、該当する取引先情報が存在するため(図6参照)、情報取得部298は、該当する取引先情報に含まれる支払情報の中から、金融機関、支店名、口座種別、口座番号、口座名義を抽出し、表示欄167に入金先情報として設定する。
【0217】
本実施形態では、表示欄166に表示された金融機関情報と、表示欄167に表示された入金先情報とが一致しているため、アラートは生成されず、画面161にはアラートは表示されない。
【0218】
また、表示欄167には、表示欄167に表示された入金先情報の編集を行うための表示部品167cを含む。
【0219】
本実施形態では、表示欄167の中に含まれる表示部品167cを選択する操作を受け付けると、該当する表示欄に表示された内容の編集が可能となる。表示欄に表示された内容の編集の詳細は後述する。
【0220】
操作ボタン169は、ジョブリスト91のステータスの値を、未処理状態から下書き保存状態とするための操作ボタンである。操作ボタン169が操作されると、表示欄168は、「未処理」から「下書き保存」に変化する。
【0221】
操作ボタン170は、ジョブリスト91のステータスの値を、確定済み状態とするための操作ボタンである。本実施形態では、操作ボタン170が操作されると、ジョブリスト91のステータスの値を、確定済み状態とする。尚、本実施形態において、ステータスが確定済み状態とされた認識結果データは、出力部285により、基幹システム500と対応する形式のデータに変換することができる。
【0222】
図17は、表示例を示す第二の図である。図17に示す画面161Aでは、金融機関情報を示す領域164bに複数の金融機関を示す情報が含まれる場合を示している。
【0223】
この場合、表示欄163Aに含まれる表示欄166Aには、複数の金融機関情報が表示される。また、表示欄163Aには、複数の金融機関情報を選択するための選択欄166a、166bが含まれる。
【0224】
図17の例では、選択欄166a、166bの何れかを選択することで、金融機関情報を選択することができる。
【0225】
図17の例では、情報取得部298は、金融機関情報が選択されると取引先データベース270を参照し、取引先名が「株式会社○○」と一致し、且つ、金融機関名が、選択された金融機関情報に含まれる金融機関名と一致する取引先情報を特定してもよい。そして、情報取得部298は、特定された取引先情報から、入金先情報を抽出し、表示欄167に表示させてもよい。
【0226】
尚、図17の例では、認識結果の確認画面である画面161Aに、金融機関情報の選択欄が表示されるものとしたが、これに限定されない。金融機関情報の選択画面は、認識結果の確認画面が表示される前に、端末装置400等に表示されてもよい。
【0227】
また、本実施形態では、例えば、金融機関情報が複数抽出された場合には、テナントが口座を保有する金融機関が予め記憶部220のテナントDB(非図示)に登録され、登録されたテナントに対応する金融機関と同一の金融機関名を含む金融機関情報が自動的に選択されるようにしてもよい。このようにすることで、金融機関同士の送金にかかる手数料を削減することができる。さらに、本実施形態では、記憶部220に記憶された異なる金融機関の間の送金手数料を記憶しており、抽出された複数の金融機関のうち、テナントに対応する金融機関との間の送信手数料の少ない金融機関が自動的に選択されるようにしてもよい。また、ネットワークを介して、抽出された金融機関を示す情報と、テナントに対応する杞憂機関を示す情報とを他のシステムに送信し、送信手数料を受信して、受信した送信手数料に基づいて、送信手数料の少ない金融機関が自動的に選択されるようにしてもよい。
【0228】
図18は、表示例を示す第三の図である。図18に示す画面161Bでは、表示欄163Bに、金融機関情報が表示される表示欄166が表示されていない。言い換えれば、図18の例では、表示欄163Bには、表示欄165と表示欄167とが表示され、請求項情報と、入金先情報とが表示される。
【0229】
本実施形態では、例えば、第二抽出部296によって抽出された金融機関情報と、情報取得部298によって取得された入金先情報とが完全に一致する場合には、帳票画像データから抽出した金融機関情報の表示を省略し、予め固定された項目名と項目値である入金先情報のみを表示させる。
【0230】
本実施形態では、このように、金融機関情報の表示を省略することで、画面161Bを閲覧しているユーザに対して、必要な情報のみを提示することができる。
【0231】
図19は、表示例を示す第四の図である。図19では、表示欄167Aにおいて、入金先情報以外の内容も自動で表示される例を示している。
【0232】
図19に示す画面161Cにおいて、表示欄165の表示欄165aには、請求日が表示されている。請求日は、請求書情報に含まれる情報である。
【0233】
図19では、情報取得部298は、例えば、この請求日と、取引先名が「株式会社○○」である取引先情報に含まれる支払情報とを参照し、表示欄167Aの表示欄167aに表示される支払期限を設定する。
【0234】
取引先データベース270では、取引先名が「株式会社○○」である取引先情報に含まれる支払情報の項目「支払条件」の値が、「支払期日:2ヶ月後の25日」となっている(図6参照)。したがって、情報取得部298は、請求日である2018年7月20日の2ヶ月後の25日として、2018年9月25日を導出し、表示欄167aに表示させる。
【0235】
このように、本実施形態では、請求書情報と、支払情報とから、表示欄167に表示される入金先情報以外の情報も、自動で設定してもよい。
【0236】
本実施形態では、このようにすることで、ユーザ(テナント)が手入力する項目を減らすことができ、ユーザの負荷を軽減することができる。
【0237】
図20は、表示例を示す第五の図である。図20に示す画面163Dは、第二抽出部296により帳票画像データから抽出された金融機関情報と、情報取得部298により取引先データベース270から取得された入金先情報とが一致しない場合を示している。
【0238】
画面161Dにおいて、表示欄167Bには、金融機関情報と入金先情報とが一致しないことを示すアラート167bが表示されている
本実施形態では、ここで、表示部品167cを操作することで、取引先データベース270に格納されている取引先情報を編集するための画面を表示させることができる。
【0239】
尚、金融機関情報と入金先情報とが一致しない場合とは、例えば、参照する取引先情報が誤っている場合、取引先情報に含まれる金融機関名が変更された場合、請求元を示す文字列ではない文字列が、誤って請求元として抽出された場合等が考えられる。
【0240】
図21は、表示例を示す第六の図である。図21に示す画面161Eは、図20に示す画面161Dにおいて、表示部品167cが操作された後の画面を示す。
【0241】
画面161Eには、取引先名が「株式会社○○」である取引先情報を編集するための画面171が表示される。
【0242】
画面171には、取引先データベース270に格納された取引先情報のうち、取引先名が「株式会社○○」である取引先情報の一覧が表示されている。
【0243】
本実施形態では、例えば、参照される取引先情報に誤りがあった場合には、ユーザは、画面171から、参照すべき取引先情報を選択することができる。
【0244】
また、本実施形態では、例えば、金融機関名の変更等があった場合には、画面171において、該当する取引先情報を編集することができる。
【0245】
本実施形態では、このような操作が行われた後に、操作ボタン170が操作され、ジョブリスト91のステータスの値が、確定済み状態とされると、確定済みの状態とされた認識結果データは、出力部285により、基幹システム500と対応する形式のデータに変換される。
【0246】
次に、図22を参照して、本実施形態の出力部285により基幹システム500に出力するデータの一例について説明する。
【0247】
図22は、出力データの一例を示す図である。図22に示す出力データ231は、支払元情報、入金先情報、請求金額、振込実行日等を含む。
【0248】
本実施形態の出力データ231において、支払元情報は、取引先データベース270に格納された取引先情報に含まれる情報であり、テナントが保有する口座に関する情報である。
【0249】
入金先情報は、取引先データベース270に格納された取引先情報に含まれる入金先情報である。
【0250】
請求金額は、帳票認識部290により、帳票画像データから抽出した請求書情報に含まれる。振込実行日は、例えば、出力データ231が基幹システム500に出力された日であってもよい。
【0251】
本実施形態の出力データ231は、基幹システム500において、テナントから請求元への請求金額の振り込む(支払う)処理を自動的に実行させることができる形式であればよい。
【0252】
このように、本実施形態では、請求書の帳票画像データから、請求元を特定し、取引先データベース270において、予め項目名と項目値とが決められた入金先情報を取得する。
【0253】
このため、本実施形態によれば、入金先情報が認識結果の確認画面において、入金先情報が表示される度に、入金先情報が正しいか否かを確認する手間が省ける。
【0254】
また、本実施形態では、帳票画像データから抽出された金融機関情報と入金先情報とを比較し、両者が一致しない場合には、マスタデータとなる取引先データベース270を更新することができる。
【0255】
したがって、ユーザは、入金先情報が誤っていた場合等でも、1度マスタデータを修正すれば良く、何度も入金先情報を修正する、といった手間を削減できる。
【0256】
尚、上述した実施形態では、請求書を帳票の一例として説明したが、本実施形態が適用される帳票の種類は、請求書に限定されない。また、本実施形態は、固定情報を、入金先情報としたがこれに限定されない。
【0257】
帳票は、例えば、注文書等であってもよく、その場合は、固定情報は、注文書の発行元である発注元に応じて予め固定された発注元の住所や納品先の住所等であってもよい。また、例えば、帳票は、試験の回答用紙等であってもよい。その場合、固定情報は、例えば、回答用紙の発行元を示す試験が行われた教科(すなわち、どの教科の試験かを示す情報)に応じて、予め固定された、その教科の授業を行っいる教師の名称等であってもよい。
【0258】
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
【0259】
また、実施形態に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。
【0260】
ある実施形態では、サーバ装置200は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。同様に、サーバ装置200は、互いに通信するように構成された複数のコンピューティングデバイスを含むことができる。
【0261】
さらに、サーバ装置200は、開示された処理ステップを様々な組み合わせで共有するように構成できる。例えば、サーバ装置200によって実行されるプロセスは、他のサーバ装置によって実行され得る。同様に、サーバ装置200の機能は、他のサーバ装置によって実行することができる。また、サーバ装置と他のサーバ装置の各要素は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。
【0262】
また、明細書中の対応テーブルは、機械学習の学習効果によって生成されたものでもよい。また、取引内容の記載に含まれうるキーワードと勘定項目とを機械学習にて分類付けすることで、対応テーブルを使用しなくてもよい。
【0263】
ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり,コンピュータが、データ識別等の判断に必要なアルゴリズムを、事前に取り込まれる学習データから自律的に生成し,新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、さらに、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。
【0264】
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0265】
100 帳票認識システム
200 サーバ装置
220 記憶部
230 帳票認識処理部
240 画像データベース
250 抽出定義データベース
260 辞書データベース
270 テナントデータベース
280 認識結果データベース
284 表示制御部
285 出力部
290 帳票認識部
291 画像データ格納部
292 ジョブリスト生成部
293 画像データ取得部
294 文字認識部
295 第一抽出部
296 第二抽出部
297 認識結果生成部
298 情報取得部
299 更新部
300 画像形成装置
400 端末装置
500 基幹システム
【先行技術文献】
【特許文献】
【0266】
【文献】特開2016-51339号公報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13A
図13B
図14
図15
図16
図17
図18
図19
図20
図21
図22