IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

<>
  • -帳票認識システム及び帳票認識方法 図1
  • -帳票認識システム及び帳票認識方法 図2
  • -帳票認識システム及び帳票認識方法 図3
  • -帳票認識システム及び帳票認識方法 図4
  • -帳票認識システム及び帳票認識方法 図5
  • -帳票認識システム及び帳票認識方法 図6
  • -帳票認識システム及び帳票認識方法 図7
  • -帳票認識システム及び帳票認識方法 図8
  • -帳票認識システム及び帳票認識方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025025527
(43)【公開日】2025-02-21
(54)【発明の名称】帳票認識システム及び帳票認識方法
(51)【国際特許分類】
   G06V 30/412 20220101AFI20250214BHJP
   G06V 30/24 20220101ALI20250214BHJP
【FI】
G06V30/412
G06V30/24 620Z
【審査請求】有
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023130364
(22)【出願日】2023-08-09
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000925
【氏名又は名称】弁理士法人信友国際特許事務所
(72)【発明者】
【氏名】小松 正樹
(72)【発明者】
【氏名】信田 頼宏
(72)【発明者】
【氏名】堂宮 真法
【テーマコード(参考)】
5B029
5B064
【Fターム(参考)】
5B029AA01
5B029BB02
5B029CC26
5B029EE12
5B064AA01
5B064AB02
5B064BA01
5B064CA08
5B064DA10
5B064DA32
(57)【要約】
【課題】定型エンジンと非定型エンジンの両方に連携する帳票認識システムでは、認識精度は向上するが、認識コストが高くなる傾向があった。
【解決手段】定型エンジン161と非定型エンジン162の両方に連携する帳票認識システム100において、帳票から読み取った帳票画像から定型エンジン161での文字認識に用いるテンプレートを、テンプレートデータベース131から選択する処理を実行し、テンプレート選択結果に基づいて、帳票に対するテンプレートが存在しない場合には、非定型エンジン162により帳票画像に対する文字認識処理を実行し、帳票に対するテンプレートがある場合には選択されたテンプレートを用いて、定型エンジン161により帳票画像に対する文字認識処理を実行する。
【選択図】図3
【特許請求の範囲】
【請求項1】
帳票に記載されている文字の認識に用いられる定型帳票認識エンジンと非定型帳票認識エンジンの両方に連携する帳票認識システムであって、
前記定型帳票認識エンジン及び前記非定型帳票認識エンジンを用いて、帳票の読み取り画像である帳票画像に対する文字認識処理を実行し、前記非定型帳票認識エンジンによる前記帳票画像の文字認識結果を記憶部に蓄積する帳票認識処理部と、
前記帳票の帳票画像から前記定型帳票認識エンジンでの文字認識に用いるテンプレートを、テンプレートデータベースから選択する処理を実行して、テンプレート選択結果を前記帳票認識処理部へ出力するテンプレート選択処理部と、を備え、
前記帳票認識処理部は、前記テンプレート選択結果に基づいて、前記帳票に対するテンプレートが存在しない場合には、前記非定型帳票認識エンジンにより前記帳票画像に対する文字認識処理を実行し、前記帳票に対するテンプレートが存在する場合には選択されたテンプレートを用いて、前記定型帳票認識エンジンにより前記帳票画像に対する文字認識処理を実行する
帳票認識システム。
【請求項2】
前記帳票画像の文字認識結果を、類似する文字認識結果ごとにテンプレート候補として記憶するテンプレート候補記憶部と、
前記記憶部から読み出した前記帳票画像の文字認識結果を、前記テンプレート候補記憶部に記憶された前記文字認識結果と比較し、前記テンプレート候補記憶部の前記文字認識結果に類似する文字認識結果が前記記憶部に存在する場合には、該当するテンプレート候補の文字認識結果の件数に1を加算し、前記記憶部に類似する文字認識結果が存在しない場合には、前記文字認識結果を新しいテンプレート候補として前記テンプレート候補記憶部に登録し、前記テンプレート候補記憶部から費用削減の条件を満たすテンプレート候補を抽出してユーザ端末に送信するテンプレート作成推薦処理部と、を備える
請求項1に記載の帳票認識システム。
【請求項3】
前記テンプレート作成推薦処理部は、前記定型帳票認識エンジンによる文字認識にかかる費用と、前記非定型帳票認識エンジンによる文字認識にかかる費用と、テンプレートの作成にかかる費用とから、前記テンプレートを作成した場合に前記テンプレートを作成する前よりも帳票認識にかかる費用が下がるテンプレート候補を抽出して、作成を推薦するテンプレートとして前記抽出したテンプレート候補の情報を前記ユーザ端末に送信する
請求項2に記載の帳票認識システム。
【請求項4】
前記テンプレート作成推薦処理部は、前記テンプレート候補の所定期間に蓄積された類似する前記文字認識結果の件数と、前記定型帳票認識エンジンによる帳票一枚当たりの文字認識にかかる費用と、前記非定型帳票認識エンジンによる帳票一枚当たりの文字認識にかかる費用と、前記テンプレートの作成にかかる費用とから、前記テンプレートの作成を推薦する前記テンプレート候補を特定する
請求項3に記載の帳票認識システム。
【請求項5】
前記テンプレート作成推薦処理部は、前記記憶部及び前記テンプレート候補記憶部に蓄積された、前記帳票画像の文字認識結果に含まれる項目名を比較し、前記項目名が一致する場合には双方の前記帳票画像の文字認識結果に含まれる特徴量を比較して、前記文字認識結果の類似性を判定する
請求項2に記載の帳票認識システム。
【請求項6】
前記テンプレート作成推薦処理部は、前記記憶部及び前記テンプレート候補記憶部に蓄積された、前記帳票画像の文字認識結果に含まれる項目名を比較して、前記文字認識結果の類似性を判定する
請求項2に記載の帳票認識システム。
【請求項7】
前記テンプレート作成推薦処理部は、前記記憶部及び前記テンプレート候補記憶部に蓄積された、前記帳票画像の文字認識結果に含まれる特徴量を比較して、前記文字認識結果の類似性を判定する
請求項2に記載の帳票認識システム。
【請求項8】
帳票に記載されている文字の認識に用いられる定型帳票認識エンジンと非定型帳票認識エンジンの両方に連携する帳票認識システムによる帳票認識方法であって、
前記帳票の読み取り画像である帳票画像から前記定型帳票認識エンジンでの文字認識に用いるテンプレートを、テンプレートデータベースから選択する処理を実行して、テンプレート選択結果を出力する処理と、
前記テンプレート選択結果に基づいて、前記帳票に対するテンプレートが存在しない場合には、前記非定型帳票認識エンジンにより前記帳票画像に対する文字認識処理を実行し、前記帳票に対するテンプレートが存在する場合には選択されたテンプレートを用いて、前記定型帳票認識エンジンにより前記帳票画像に対する文字認識処理を実行する処理と、
前記非定型帳票認識エンジンによる前記帳票画像の文字認識結果を記憶部に蓄積する処理と、を含む
帳票認識方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票認識システム及び帳票認識方法に関する。
【背景技術】
【0002】
帳票認識エンジンとして定型帳票認識エンジン(以下、定型エンジン)と非定型帳票認識エンジン(以下、非定型エンジン)がある。定型エンジンによる認識では、帳票内のどの範囲を読み取るかを定義したテンプレートを予め用意し、テンプレートに基づいて文字を読み取る。定型エンジンは、帳票を読み取る際に、帳票にテンプレートを重ね合わせ、テンプレートに定義された範囲の文字のみを読み取る。読み取る文字が存在する範囲を予め定義するため、認識精度が高い。しかし、帳票の読み取り項目のレイアウトパターン分(例えば、請求書を読み取る場合には請求元ごと)のテンプレートを作成する必要がある。したがって、多くの取引先の請求書を読み取るなど帳票のレイアウトパターンが多い場合、全ての帳票を定型エンジンで読み取るためには、膨大な運用(テンプレート作成)コストが必要になる。
【0003】
一方、非定型エンジンによる認識では、帳票のレイアウト(文字や画像の配置、大きさ等)を解析し、キー情報を探して、キー情報に紐づく文字を読み取る。事前のテンプレート作成の作業が不要である。しかし、非定型エンジンは、定型エンジンに比べて認識精度が低い。また、非定型エンジン認識は、認識精度向上のためには多くの帳票のサンプルデータを集めて学習を行わせる必要があり、認識精度向上のコストが大きい。さらに、キー情報を探すためにレイアウト解析を行い帳票上の文字全てを読み取るため、認識コストが高い。
【0004】
さらに、定型エンジンと非定型エンジンの両方で読み取りを行う方法もある。定型エンジンで正しく読み取れない(テンプレート未作成の)帳票も、非定型エンジンで正しく読める場合がある。定型エンジンと非定型エンジンの認識結果が一致しない場合、どちらの認識結果を採用するかを人手で判定する必要がある。特許文献1には、読み取り精度向上のために、複数の認識エンジンで読み取りを実施し、それぞれの読み取り結果を比較して、一致しない場合には読み取り結果を人手による判断等で補正する技術が記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2019-204417号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
定型エンジンと非定型エンジンの両方で読み取りを行う方法では、常に一度の認識処理において定型エンジン/非定型エンジンの両方で読み取りを行うため、常に両方のコストがかかる。特許文献1に記載の技術では、定型エンジンと非定型エンジンの両方で読み取りを実施することで、認識精度は向上するが、コスト低減については考慮されていない。
【0007】
一方で、多様なレイアウトの帳票を認識する必要がある業務においては、任意のレイアウトの帳票を認識可能な非定型エンジンを使って認識させるアプローチが一般的となっている。ただし、非定型エンジンは、認識コストが大きく、定型エンジンよりも認識精度が低い。そのため、非定型エンジンのみで帳票認識を運用すると、認識コストや読み取り結果の修正コストが非常にかかるという問題がある。
【0008】
上記の状況から、帳票認識エンジンとして定型エンジンと非定型エンジンの両方に連携する帳票認識システムを用いて多様なレイアウトの帳票を処理する業務において、帳票認識にかかるコストを抑えながら認識精度を向上させる手法が要望されていた。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明の一態様の帳票認識システムは、帳票に記載されている文字の認識に用いられる定型帳票認識エンジンと非定型帳票認識エンジンの両方に連携する。上記帳票認識システムは、帳票認識処理部と、テンプレート選択処理部と、を備える。
上記帳票認識処理部は、定型帳票認識エンジン及び非定型帳票認識エンジンを用いて、帳票の読み取り画像である帳票画像に対する文字認識処理を実行し、非定型帳票認識エンジンによる帳票画像の文字認識結果を記憶部に蓄積する。
上記テンプレート選択処理部は、帳票の帳票画像から定型帳票認識エンジンでの文字認識に用いるテンプレートを、テンプレートデータベースから選択する処理を実行し、テンプレート選択結果を帳票認識処理部へ出力する。
そして、上記帳票認識処理部は、テンプレート選択結果に基づいて、帳票に対するテンプレートが存在しない場合には、非定型帳票認識エンジンにより帳票画像に対する文字認識処理を実行し、帳票に対するテンプレートが存在する場合には選択されたテンプレートを用いて、定型帳票認識エンジンにより帳票画像に対する文字認識処理を実行する。
【発明の効果】
【0010】
本発明の少なくとも一態様によれば、定型帳票認識エンジンと非定型帳票認識エンジンの両方に連携する帳票認識システムを用いて多様なレイアウトの帳票を処理する業務において、帳票認識にかかるコストを抑えながら認識精度を向上させることができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
【図面の簡単な説明】
【0011】
図1】本発明の一実施の形態に係る帳票認識システムの機能構成例を示す図である。
図2】本発明の一実施の形態に係る帳票認識システムのハードウェア構成例を示す図である。
図3】本発明の一実施の形態に係る帳票認識システムによる文字認識処理(テンプレート該当なし)の例を示すシーケンスチャートである。
図4】本発明の一実施の形態に係る帳票認識システムによる文字認識処理(テンプレート該当あり)の例を示すシーケンスチャートである。
図5】帳票画像から抽出される特徴量の例を示す図である。
図6】本発明の一実施の形態に係る帳票認識結果テーブルの構成例を示す図である。
図7】本発明の一実施の形態に係る帳票認識システムのテンプレート作成推薦処理部によるテンプレート候補集計処理の例を示すフローチャートである。
図8】本発明の一実施の形態に係るテンプレート候補テーブルの例を示す図である。
図9】本発明の一実施の形態に係る帳票認識システムのテンプレート作成推薦処理部によるテンプレート作成推薦処理の例を示すシーケンスチャートである。
【発明を実施するための形態】
【0012】
以下、本発明を実施するための形態の例について、添付図面を参照して説明する。本明細書及び添付図面において、同一の構成要素又は実質的に同一の機能を有する構成要素には同一の符号を付して重複する説明を省略する。
【0013】
[帳票認識システムの機能構成]
まず、本発明の一実施の形態に係る帳票認識システムの機能構成について、図1を参照して説明する。
【0014】
図1は、本発明の一実施の形態に係る帳票認識システムの機能構成例を示す図である。図1に示す帳票認識システム100は、帳票認識エンジンとして、定型帳票認識エンジン(定型エンジン)及び非定型帳票認識エンジン(非定型エンジン)の両方と連携する帳票認識システムである。帳票認識システム100は、インターネット180等の通信ネットワークを介して、ユーザ端末170と通信を行う。
【0015】
ユーザ端末170は、帳票認識システム100によるサービスの提供を受けるユーザにより使用される端末である。ユーザ端末170には、デスクトップ型PC(Personal Computer)やノート型PCなどが用いられる。
【0016】
帳票認識システム100は、ウェブサーバ110、サービス制御部120、テンプレート選択処理部130、帳票認識処理部140、及びテンプレート作成推薦処理部150を備える。
【0017】
ウェブサーバ110は、ウェブシステム上で、ユーザ端末170に対しインターネット180を通じて情報や機能を提供するサーバである。ウェブサーバ110は、通信機能を有するコンピューター、又はコンピューター上で動作するサーバソフトウェアである。ウェブサーバ110は、帳票認識システム100の外部に設けられていてもよい。帳票認識システム100とユーザ端末170との通信は、ウェブサーバ110を介して行われるが、以降の説明では、通信時におけるウェブサーバ110の記載を省略する。
【0018】
サービス制御部120は、帳票認識システム100の全体を制御する制御部である。一例として、サービス制御部120は、ユーザ端末170から受信した要求の内容に基づいて、各処理部に指令を出す制御や、各処理部から上記要求に応じたデータを取得してユーザ端末170に応答するように制御したりする。
【0019】
テンプレート選択処理部130は、予め登録された複数のテンプレート画像(単に「テンプレート」とも称する)の中から、入力画像に対応するテンプレート画像を選択する処理を実行する処理部である。入力画像は、例えば、イメージスキャナ等で読み込まれた帳票のデジタル画像データである。テンプレート画像は、OCR(Optical Character Recognition)ソフトウェアなどを使った文字認識処理において、入力画像(帳票画像)内のどの範囲を読み取るかを定義したデータである。一般に、テンプレート画像では、帳票内での読み取り位置と大きさ(範囲)が定義されている。文字認識処理は、イメージスキャナ等による原稿の読み込み時に実行されることも多い。テンプレート画像は、テンプレートデータベース131に格納されている。
【0020】
帳票認識処理部140は、定型エンジン161及び非定型エンジン162に入力画像の文字認識処理を要求する処理部である。また、帳票認識処理部140は、定型エンジン161及び非定型エンジン162から文字認識結果を受信し、文字認識結果を蓄積する処理部である。文字認識結果は、帳票認識結果として帳票認識結果テーブル141に格納される。
【0021】
定型エンジン161及び非定型エンジン162は、帳票認識システム100からの要求に従って、帳票画像に記載された文字を認識する文字認識処理を実行し、その処理結果を文字認識結果として帳票認識システム100に送信する帳票認識エンジンである。
【0022】
テンプレート作成推薦処理部150は、蓄積された帳票認識結果を基に、作成を推薦するテンプレート候補を集計する処理部である。また、テンプレート作成推薦処理部150は、ユーザに作成を推薦するテンプレートの一覧を、ユーザ端末170に送信したりする処理部である。テンプレート候補は、テンプレート候補テーブル151に格納される。
【0023】
[帳票認識システムのハードウェア構成]
ここで、帳票認識システム100のハードウェア構成について、図2を参照して説明する。
図2は、帳票認識システム100のハードウェア構成例を示す図である。図2に示す計算機200は、コンピューターとして用いられるハードウェアの一例である。本実施の形態に係る帳票認識システム10は、計算機200(コンピューター)がプログラムを実行することにより、図1に示した各機能ブロックが連携して行う帳票認識を実現する。
【0024】
計算機200は、システムバスに接続されたCPU(Central Processing Unit)201、ROM(Read Only Memory)202、及びRAM(Random Access Memory)203を備える。さらに、計算機200は、不揮発性ストレージ204、及び通信インターフェース205を備える。
【0025】
CPU201は、本実施の形態に係る各機能を実現するソフトウェアのプログラムコードをROM202から読み出してRAM203にロードし、実行する。RAM203には、CPU201の演算処理の途中で発生した変数やパラメーター等が一時的に書き込まれ、これらの変数やパラメーター等がCPU201によって適宜読み出される。CPU201がROM202から読み出したプログラムコードを実行することで、帳票認識システム100のサービス制御部120、テンプレート選択処理部130、帳票認識処理部140、及びテンプレート作成推薦処理部150の各機能が実現される。ただし、CPU201に代えてMPU(Micro Processing Unit)等の他のプロセッサを用いてもよい。
【0026】
不揮発性ストレージ204は、プログラムが使用するデータやプログラムを実行して得られたデータなどを保存することが可能である。帳票認識システム100のテンプレートデータベース131、帳票認識結果テーブル141、及びテンプレート候補テーブル151は、不揮発性ストレージ204を用いて構成される。また、不揮発性ストレージ204に、OS(Operating System)や、CPU201が実行するプログラムを記録してもよい。不揮発性ストレージ204としては、HDD(Hard Disk Drive)、SSD(Solid State Drive)、光や磁気を利用するディスク媒体、又は半導体メモリカード等が用いられる。なお、テンプレートデータベース131、帳票認識結果テーブル141、及びテンプレート候補テーブル151の情報の保存に、クラウド環境を活用することもできる。
【0027】
通信インターフェース205には、例えばNIC(Network Interface Card)等の通信デバイスが用いられる。通信インターフェース205は、端子が接続されたLANやインターネット等の通信ネットワーク又は専用線等を介して、外部装置との間で各種のデータを送受信することが可能に構成されている。帳票認識システム100のウェブサーバ110の機能は、通信インターフェース205を用いて実現される。
【0028】
ユーザ端末170のハードウェアも、計算機200を用いて構成することができる。ユーザ端末170の計算機200には、図示しない表示装置と入力装置が接続されている。表示装置は、液晶ディスプレイなどのモニタであり、GUI画面やCPU201で行われた演算処理の結果等を表示する。入力装置は、ユーザの操作に応じた入力信号を生成してCPU201へ出力する。入力装置には、例えば、マウス、キーボード、又はタッチセンサなどが用いられ、ユーザは入力装置を操作して情報や指示を入力することができる。表示装置と入力装置は、タッチパネルとして一体に構成されてもよい。なお、帳票認識システム100の計算機200に、表示装置と入力装置が接続されていてもよい。
【0029】
[文字認識処理]
次に、帳票認識システム100による文字認識処理について、図3及び図4を参照して説明する。
【0030】
(該当するテンプレートがない場合)
まず、該当するテンプレートがない場合の文字認識処理について、図3を参照して説明する。
図3は、帳票認識システム100による文字認識処理(テンプレート該当なし)の例を示すシーケンスチャートである。帳票認識システム100は、運用初期段階320(ステップS8~S12)ではテンプレートが存在しないため、全ての帳票を非定型エンジン162で認識しながらテンプレート候補を蓄積する。ステップS1~S3の処理後、ステップS8~S12の処理が実行される。
【0031】
始めに、ユーザ端末170が、帳票認識システム100(サービス制御部120)に認識対象の帳票の読み取り画像(帳票画像)を送信して文字認識の実行を要求する(S1)。
【0032】
次いで、帳票認識システム100のサービス制御部120は、テンプレート選択処理部130に帳票画像を送信する(S2)。
【0033】
次いで、テンプレート選択処理部130は、帳票画像の特徴量を検出して、テンプレートデータベース131に登録されたテンプレートの中から、帳票画像のレイアウトに類似するテンプレートを検索する。例えば、テンプレート選択処理部130は、類似する複数のテンプレートを検索した場合、最も類似性の高いテンプレートを選択する。テンプレート選択処理部130は、テンプレート選択結果(該当あり/該当なし)をサービス制御部120へ送信する。具体的には、テンプレート選択処理部130は、該当するテンプレートが存在した場合はそのテンプレートの情報と、帳票画像の特徴量を、該当するテンプレートが存在しなかった場合は該当なしの情報と、帳票画像の特徴量を、サービス制御部120に送信する(S3)。
【0034】
特徴量は、文字、枠、罫線などのエッジ部(端、ふち、角など)の座標を示す情報であり、特徴点と読み替えることもできる。枠や罫線などにおける線分に関しては、端と端の中間の座標情報を特徴量として取得することができる。
【0035】
(特徴量の例)
ここで、帳票画像から抽出される特徴量の例について、図5を参照して説明する。
図5は、帳票画像から抽出される特徴量の例を示す図である。図5には、帳票画像から抽出した特徴量の例として、横長の枠と、枠内の文字列のそれぞれの特徴量を抽出した例が示されている。例えば、枠内に“おなまえ”という文字列が配置されている場合、この文字列は利用者の「名前」を記載する項目であると推定される。特徴量(特徴点)であるエッジ部には○印がつけられている。図5では、○印が、枠の角に4か所、枠の辺の中央(角と角の間)に2か所、及び各文字の端に26か所つけられている。テンプレートを用いた場合、帳票画像から図5に示すような項目を含む画像、すなわち項目画像が容易に検出される。
【0036】
図3のシーケンスチャートの説明に戻る。ステップS3の処理後、サービス制御部120は、テンプレート選択処理部130からテンプレート選択結果(運用初期段階320ではテンプレート該当なし)を受信すると、帳票認識処理部140に帳票画像と特徴量を送信する(S8)。
【0037】
次いで、帳票認識処理部140は、非定型エンジン162に帳票画像を送信して文字認識を要求する(S9)。
【0038】
次いで、非定型エンジン162は、帳票認識処理部140に帳票画像についての文字認識結果を送信する(S10)。文字認識結果には、項目名と、各項目の値が含まれる。項目は、帳票を用いた業務で利用する情報の区分を表すための情報(例えば、氏名、振込口座など)である。例えば、項目の値の例としては、氏名であれば、帳票の利用者の手書き又は印刷された文字列(名前)、振込口座であれば、手書き又は印刷された数字列である。
【0039】
次いで、帳票認識処理部140は、文字認識結果に含まれる項目名の一覧、及びサービス制御部120から受信した帳票画像の特徴量を帳票認識結果テーブル141に記録する(S11)。
【0040】
(帳票認識結果テーブル)
ここで、帳票認識結果テーブル141の構成について、図6を参照して説明する。
図6は、帳票認識結果テーブル141の構成例を示す図である。帳票認識結果テーブル141は、ID、項目名、及び特徴量の各フィールドを有する。
【0041】
IDフィールドには、非定型エンジン162で認識された帳票を、帳票認識結果テーブル141内で一意に区別するための識別子(番号、符号、文字列など)の情報が格納される。
項目名フィールドには、一つの帳票に含まれる項目の名称の情報が格納される。非定型エンジン162で認識する異なる帳票においてユーザに要求する情報が同じ場合、又は、帳票の内容が類似する場合には、項目名が重複することがある。
特徴量フィールドには、非定型エンジン162で認識された帳票の特徴量の座標情報が格納される。
【0042】
一例として図6では、ID“1”のデータは、項目名が“宛名、請求金額、発行元”、及び特徴量が“(x1,y1)、(x1,y1)、(x1,y1)、・・・”である。また、ID“2”のデータは、項目名が“宛名、請求金額、発行元、振込口座”、特徴量が“(x2,y2)、(x2,y2)、(x2,y2)、・・・”である。
【0043】
図3のシーケンスチャートの説明に戻る。ステップS11の処理後、帳票認識処理部140は、サービス制御部120に帳票画像の文字認識結果を送信する(S12)。ステップS12の処理はステップS11の処理と並行して行われてもよいし、順番が逆でもよい。
【0044】
次いで、サービス制御部120は、ユーザ端末170に帳票画像に対する文字認識結果を送信する(S13)。ユーザ端末170は、帳票認識システム100から非定型エンジン162による帳票画像の文字認識結果を受信して、表示装置に表示する。
【0045】
(該当するテンプレートがある場合)
次に、該当するテンプレートがある場合の文字認識処理について、図4を参照して説明する。
図4は、帳票認識システム100による文字認識処理(テンプレート該当あり)の例を示すシーケンスチャートである。運用改善段階310(ステップS4~S7)においては、テンプレートを作成された帳票が定型エンジン161で認識されるようになり、より高精度、低コスト化されていく。ステップS1~S3の処理後、ステップS4~S7の処理が実行される。
【0046】
始めに、ユーザ端末170、サービス制御部120、及びテンプレート選択処理部130により、ステップS1~S3の処理を実行する。
【0047】
次いで、サービス制御部120は、テンプレート選択処理部130からテンプレート選択結果(運用改善段階310ではテンプレート該当あり)を受信すると、帳票認識処理部140に帳票画像及びテンプレート選択結果に基づくテンプレートを送信する(S4)。
【0048】
次いで、帳票認識処理部140は、受信したテンプレートを利用して帳票画像から項目画像を切り出し、定型エンジン161に項目画像を送信して文字認識を要求する(S5)。項目画像とは、帳票画像の一部であって、手書き又は印刷によって情報が入力される空欄等の領域が用意された項目についての画像である。帳票画像から複数の異なる項目画像が抽出されると考えてよい。
【0049】
次いで、定型エンジン161は、帳票認識処理部140に項目画像についての文字認識結果を送信する(S6)。
【0050】
次いで、帳票認識処理部140は、項目画像についての文字認識結果を帳票画像の文字認識結果としてサービス制御部120に送信する(S7)。
【0051】
次いで、サービス制御部120は、ユーザ端末170に帳票画像に対する文字認識結果を送信する(S13)。ユーザ端末170は、帳票認識システム100から定型エンジン161による帳票画像(項目画像)の文字認識結果を受信して、表示装置に表示する。
【0052】
運用初期段階320では、帳票認識システム100は、ユーザから認識実行要求を受けると、非定型エンジン162で文字認識するとともに、認識した項目一覧、及び帳票画像の特徴量を計算して蓄積する。帳票認識システム100は、文字認識した帳票画像及び文字認識結果を記録する。そして、帳票認識システム100は、一定期間ごとに、蓄積された帳票画像とその項目一覧及び特徴量からテンプレート候補の集計を行い、蓄積されたテンプレート候補(図8参照)から、作成することにより認識コストを下げることができるテンプレートがあるかどうかを判定して、判定結果をユーザに送信する。ユーザは、受信した判定結果を基にテンプレートを作成する。
【0053】
運用改善段階310では、帳票認識システム100は、ユーザから認識実行要求を受けると、送信された帳票画像の特徴量を計算して、特徴量が類似するテンプレートを探索して、該当するテンプレートが存在した場合は、テンプレートを使用して定型エンジン161で帳票画像を認識する。該当するテンプレートが存在しなかった場合は、非定型エンジン162で帳票画像を認識して、認識した項目一覧、及び帳票画像の特徴量を計算して蓄積する。
【0054】
上述したように運用改善段階310では、テンプレートが蓄積されているが、運用初期段階320では、テンプレートが存在しない。図7に示すように、運用初期段階320から運用改善段階310にかけて、帳票認識結果を基にテンプレート候補を蓄積していく。そして、テンプレート作成推薦処理部150は、後述するように、テンプレート候補(帳票)の集計結果、定型エンジン161の認識コスト、非定型エンジン162の認識コスト、及びテンプレートの作成コストから、作成推薦テンプレート一覧を作成して、ユーザにテンプレートの作成を促す。
【0055】
[テンプレート候補集計処理]
次に、帳票認識システム100のテンプレート作成推薦処理部150によるテンプレート候補集計処理について、図7を参照して説明する。
図7は、帳票認識システム100のテンプレート作成推薦処理部150によるテンプレート候補集計処理の例を示すフローチャートである。テンプレート作成推薦処理部150は、ステップS21~S30の処理(処理A)を、帳票認識結果の数の分だけ繰り返し実行する。
【0056】
初めに、テンプレート作成推薦処理部150は、帳票認識結果[i]の“項目名”をitems[i]、帳票認識結果[i]の“特徴量”をfeature[i]とする(S21)。帳票認識結果[i]は、図6に示した帳票認識結果テーブル141のIDフィールドの情報(i=1,・・・,N)に紐づけられたデータである。“N”は、図3及び図4の文字認識処理シーケンスにおいて、非定型エンジン162により認識された帳票の件数に相当する。
【0057】
ここで、テンプレート作成推薦処理部150は、ステップS22~S26の処理(処理B)を、テンプレート候補の数の分だけ繰り返し実行する。
【0058】
まず、テンプレート作成推薦処理部150は、テンプレート候補[j]の“項目名”をitems[j]、テンプレート候補[j]の“特徴量”をfeature[j]とする(S22)。テンプレート候補[j]は、図8に示すテンプレート候補テーブル151のIDフィールドの情報(j=1,・・・,M)に紐づけられたデータである。
【0059】
(テンプレート候補テーブル)
ここで、テンプレート候補テーブル151の構成について、図8を参照して説明する。
図8は、テンプレート候補テーブル151の構成例を示す図である。テンプレート候補テーブル151は、ID、項目名、特徴量、及び件数の各フィールドを有する。
【0060】
IDフィールドには、テンプレート候補テーブル151内のレコードを一意に区別するための識別子(番号、符号、文字列など)の情報が格納される。テンプレート候補テーブル151内のレコードは、類似性が高い帳票(帳票認識結果)のグループごとに作成される。類似性が高い帳票では、IDフィールドの情報と紐づけられたレコードの情報(項目名、特徴量)が同じである。
【0061】
項目名フィールドには、類似性が高い帳票のグループごとに、図6で示した項目名フィールドと同じ情報が格納される。
特徴量フィールドには、類似性が高い帳票のグループごとに、図6で示した特徴量フィールドと同じ情報が格納される。なお、ステップS24の一致する座標情報の数(対応点数)に、上述した座標情報が同じ場合の数に加えて、座標情報が所定の距離内である場合の数も含まれるとき、特徴量フィールドに格納する座標情報は、一番多い座標(例えば一致する座標)、又は、同じとみなせる座標(一致する及び所定距離内の座標)を平均化した座標としてもよい。
件数フィールドには、類似性が高い帳票の件数の情報が格納される。
【0062】
一例として図8では、ID“1”のデータは、項目名が“宛名、請求金額、発行元”、特徴量が“(x1,y1)、(x1,y1)、(x1,y1)、・・・”、及び、件数が“1000”である。また、ID“2”のデータは、項目名が“宛名、請求金額、発行元、振込口座”、特徴量が“(x2,y2)、(x2,y2)、(x2,y2)、・・・”、及び、件数が“100”である。また、ID“3”のデータは、項目名が“住所、氏名、支払金額、・・・”、特徴量が“(x3,y3)、(x3,y3)、(x3,y3)、・・・”、及び、件数が“3”である。
【0063】
図7のフローチャートの説明に戻る。ステップS22の処理後、テンプレート作成推薦処理部150は、帳票認識結果[i]の項目名“items[i]”と、テンプレート候補[j]の項目名“items[j]”が、同じかどうかを判定する(S23)。帳票認識結果[i]の項目名“items[i]”と、テンプレート候補[j]の項目名“items[j]”とが一致するとは、帳票認識結果[i]の「項目名」に含まれた項目と、テンプレート候補[j]の「項目名」に含まれた項目とが、一致するということである。
【0064】
items[i]とitems[j]が一致する場合(S23のYES判定)、テンプレート作成推薦処理部150は、帳票認識結果[i]の特徴量“feature[i]”と、テンプレート候補[j]の特徴量“feature[j]”の対応点数“point”を算出する(S24)。すなわち、テンプレート作成推薦処理部150は、帳票認識結果[i]の特徴量に含まれる座標情報と、テンプレート候補[j]の特徴量に含まれる座標情報とを比較して、一致する座標情報の数を計算する。なお、座標情報の一致には、比較した座標情報が同じ場合に限らず、比較した座標情報が所定の距離内である場合が含まれる構成としてもよい。
【0065】
次いで、テンプレート作成推薦処理部150は、「point≧θ、かつ、point>pointmax」の条件が成立するかどうかを判定する(S25)。この判定処理は、テンプレート候補(j=1,・・・,M)の中から帳票認識結果[i]と特徴量の対応点数が一番多い(一番類似している)ものを探す処理である。point、θ、及びpointmaxの定義は次のとおりである。
【0066】
point:テンプレート候補[j]の特徴量と、帳票認識結果[i]の特徴量との対応点数
θ:業務要件を基に決める対応点数の閾値。対応点数pointが閾値θ以上であると、テンプレート候補[j]と帳票認識結果[i]の特徴量が類似するとみなすことができる。
pointmax:処理Bを開始してから現在までの間で一番対応点数が多いときの対応点数の値(最多対応点数)。対応点数pointが最多対応点数pointmaxを更新したかどうかを確認する。
【0067】
ここで、帳票認識結果[i]の特徴量とテンプレート候補[j]の特徴量との対応点数を計算したが、帳票認識結果[i]の特徴量とテンプレート候補[j]の特徴量との対応点数から、これらの特徴量全体の類似度を計算して類似度に基づいてテンプレート候補の集計処理に利用するようにしてもよい。さらに、ステップ23における帳票認識結果[i]の項目名とテンプレート候補[j]の項目名との間で、これらの項目名全体の類似度を計算して、テンプレート候補の集計処理に利用するようにしてもよい。
【0068】
次いで、テンプレート作成推薦処理部150は、ステップS25において判定条件が成立する場合(S25のYES判定)、最多対応点数pointmaxをこのときの対応点数pointで更新し、かつ、このときのテンプレート候補テーブル151のIDフィールドの値jを、indexmaxとする(S26)。
【0069】
ステップS23においてNO判定、ステップS25においてNO判定、又はステップS26の処理後、テンプレート作成推薦処理部150は、次のテンプレート候補[j+1]に対する処理B(S22~S26)を実行する。そして、テンプレート作成推薦処理部150は、全てのテンプレート候補について処理Bが終了した場合にはステップS27へ進む。
【0070】
処理Bの終了後、テンプレート作成推薦処理部150は、帳票認識結果[i]と類似するテンプレート候補があるかどうか(indexmax≠null?)を判定する(S27)。帳票認識結果[i]と類似するテンプレート候補がある場合には(S27のYES判定)、テンプレート作成推薦処理部150は、テンプレート候補テーブル151内の該当するテンプレート候補[indexmax]の「件数」を1増加させる(S28)。この件数が多いほど、一つのテンプレート候補で多くの帳票に対応可能であることを示しているため、テンプレート作成が推奨される。
【0071】
次いで、テンプレート作成推薦処理部150は、次の帳票認識結果[i+1]に対する処理に備えて、indexmaxと最多対応点数pointmaxをリセットする。すなわち、テンプレート作成推薦処理部150は、indexmaxと“null”に設定するとともに、最多対応点数pointmaxを“0”に設定する(S29)。
【0072】
ステップS27において帳票認識結果[i]と類似するテンプレート候補が一つもなかった場合には(S27のNO判定)、テンプレート作成推薦処理部150は、帳票認識結果[i]をテンプレート候補テーブル151に新規登録して新規テンプレート候補とする(S30)。
【0073】
ステップS29の処理後、又はステップS30の処理後、テンプレート作成推薦処理部150は、次の帳票認識結果[i+1]に対する処理A(S21~S30)を実行する。そして、テンプレート作成推薦処理部150は、全ての帳票認識結果について処理Aが終了すると、本テンプレート候補集計処理を終了する。
【0074】
図7の例では、ステップS23及びS25において、テンプレート作成推薦処理部150が、記憶部(帳票認識結果テーブル141)及びテンプレート候補記憶部(テンプレート候補テーブル151)に蓄積された、帳票画像の文字認識結果に含まれる帳票の項目名を比較し(S23)、項目名が一致する場合には双方の帳票画像の文字認識結果に含まれる特徴量を比較して、帳票(文字認識結果)の類似性を判定する(S24,S25)構成を説明したが、この例に限られない。例えば、双方の帳票画像の文字認識結果に含まれる帳票の項目名を比較して、帳票(文字認識結果)の類似性を判定する構成としてもよい。また、双方の帳票画像の文字認識結果に含まれる帳票の特徴量を比較して、帳票(文字認識結果)の類似性を判定するようにしてもよい。
【0075】
文字認識結果に含まれる帳票の項目名を比較して帳票の類似性を判定する場合、特徴量を用いた場合よりも処理負荷が小さいため、帳票の類似性判定を低コストで実施できる。また、文字認識結果に含まれる帳票の特徴量を比較して帳票の類似性を判定する場合、帳票の類似性判定を高精度で実施できる。
【0076】
[テンプレート作成推薦処理]
次に、帳票認識システム100のテンプレート作成推薦処理部150によるテンプレート作成推薦処理について、図9を参照して説明する。本実施の形態では、新たにテンプレートを作成する場合としない場合の帳票認識にかかるコスト(費用)に基づいて、テンプレート作成の推薦の是非を判断する。
【0077】
図9は、帳票認識システム100のテンプレート作成推薦処理部150によるテンプレート作成推薦処理の例を示すシーケンスチャートである。
【0078】
まず、ユーザ端末170は、帳票認識システム100(サービス制御部120)にテンプレート作成推薦の実行を要求する(S41)。ユーザは、一定周期などの所定の条件に従って、テンプレート作成推薦の実行を要求することが望ましい。例えば、所定の条件の一例としては、所定期間(例えば、1か月)ごと、あるいは、帳票認識システム100から帳票認識結果が設定件数以上蓄積されたことが通知されたときが挙げられる。なお、所定期間は1か月に限らず、数か月や1週間など、種々の期間を設定できる。
【0079】
次いで、サービス制御部120は、テンプレート作成推薦処理部150に作成推薦テンプレート一覧を要求する(S42)。
【0080】
次いで、テンプレート作成推薦処理部150は、テンプレート候補テーブル151からテンプレート候補一覧を取得する処理を実行する(S43)。
【0081】
次いで、テンプレート作成推薦処理部150は、テンプレート候補一覧から費用削減の条件を満たすテンプレート候補を抽出して、ユーザにテンプレート作成を推薦する作成推薦テンプレート一覧を作成する(S44)。以下に、費用削減の条件の一例として式(1)を示す。作成推薦テンプレート一覧には、例えば、1又は複数のテンプレート候補の識別子、項目名、及び特徴量の情報が含まれる。
【0082】
Costfixed × N + Costtemplate < Costunfixed × N ・・・・(1)
Costfixed:テンプレート候補の帳票を定型エンジンで認識するコスト(一枚当たりの費用)
Costunfixed:テンプレート候補の帳票を非定型エンジンで認識するコスト(一枚当たりの費用)
Costtemplate:テンプレート作成コスト(費用)
N:テンプレート候補の件数(1か月間に蓄積された帳票認識結果の件数)
【0083】
ここで、テンプレート作成推薦処理部150による、テンプレート候補一覧から式(1)を満たすテンプレート候補を抽出する際の判断について具体例を挙げて説明する。一例として、Costfixed、Costunfixed、Costtemplate、及びNについて、以下の条件を設定する。
【0084】
Costfixed:定型エンジンによる認識コスト=1円/枚
Costunfixed:非定型エンジンによる認識コスト=50円/枚
Costtemplate:テンプレート作成コスト=50,000円
N:テンプレート候補の件数(1か月に蓄積された帳票認識結果の件数)=10,000枚、10枚
【0085】
(1か月に蓄積された件数が10,000枚の場合)
1円/枚×10,000枚+50,000円<50円/枚×10,000枚
→60,000円 < 500,000円
【0086】
このように、1か月間に蓄積された件数が10,000枚の場合、テンプレート作成を含むコスト(左辺)が、非定型エンジンによる認識コスト(右辺)よりも小さいため、帳票認識システム100はユーザにテンプレート作成を推薦する。以降、帳票認識システム100は、該当する帳票について、推薦後に作成されたテンプレートを用いて定型エンジンにより文字認識を実施する。
【0087】
(1か月に蓄積された件数が10枚の場合)
1円/枚×10枚+50,000円>50円/枚×10枚
→50,010円 > 500円
【0088】
このように、1か月間に蓄積された件数が10枚の場合、テンプレート作成を含むコスト(左辺)が、非定型エンジンによる認識コスト(右辺)を上回るため、帳票認識システム100はテンプレート作成を推薦しない。帳票認識システム100は、該当する帳票について、引き続き非定型エンジンにより文字認識を実施する。
【0089】
本実施の形態では、テンプレート作成推薦処理部150は、テンプレート候補の所定期間に蓄積された類似する文字認識結果の件数(図8)と、定型エンジン161による帳票一枚当たりの文字認識コストと、非定型エンジン162による帳票一枚当たりの文字認識コストと、定型エンジン161での文字認識に用いるテンプレートの作成コストとから、テンプレートの作成を推薦する帳票(テンプレート候補)を特定する。このようにコスト面を考慮してテンプレートを作成することにより、認識精度が高く低コストの定型エンジンでの文字認識の機会が増加させることができ、運用が進むにつれて帳票認識コストを抑えることができる。
【0090】
次いで、テンプレート作成推薦処理部150は、サービス制御部120に作成推薦テンプレート一覧を送信する(S45)。
【0091】
次いで、サービス制御部120は、ユーザ端末170に作成推薦テンプレート一覧を送信する(S46)。ステップS46の処理後、本テンプレート作成推薦処理を終了する。
【0092】
ユーザは、ユーザ端末170により受信した作成推薦テンプレート一覧の情報(テンプレート候補の識別子、項目名、及び特徴量)に基づいて、図示しないテンプレート作成ツールを利用して、作成を推薦された1又は複数の帳票に対するテンプレートを作成する。
【0093】
以上のとおり、本実施の形態に係る帳票認識システムは、帳票に記載されている文字の認識に用いられる定型帳票認識エンジンと非定型帳票認識エンジンの両方に連携する。上記帳票認識システムは、帳票認識処理部(帳票認識処理部140)と、テンプレート選択処理部(テンプレート選択処理部130)と、を備える。
上記帳票認識処理部は、定型帳票認識エンジン及び非定型帳票認識エンジンを用いて、帳票の読み取り画像である帳票画像に対する文字認識処理を実行し、非定型帳票認識エンジンによる帳票画像の文字認識結果を記憶部(帳票認識結果テーブル141)に蓄積する。
上記テンプレート選択処理部は、帳票の帳票画像から定型帳票認識エンジンでの文字認識に用いるテンプレートを、テンプレートデータベース(テンプレートデータベース131)から選択する処理を実行して、テンプレート選択結果を帳票認識処理部へ出力する。
そして、上記帳票認識処理部は、テンプレート選択結果に基づいて、帳票に対するテンプレートが存在しない場合には、非定型帳票認識エンジンにより帳票画像に対する文字認識処理を実行し、帳票に対するテンプレートが存在する場合には選択されたテンプレートを用いて、定型帳票認識エンジンにより帳票画像に対する文字認識処理を実行する。
【0094】
さらに、本実施の形態に係る帳票認識システムは、テンプレート候補記憶部(テンプレート候補テーブル151)と、テンプレート作成推薦処理部(テンプレート作成推薦処理部150)と、を備える。
上記テンプレート候補記憶部は、帳票画像の文字認識結果を、類似する文字認識結果ごとにテンプレート候補として記憶する。
上記テンプレート作成推薦処理部は、記憶部(帳票認識結果テーブル141)から読み出した帳票画像の文字認識結果を、テンプレート候補記憶部に記憶された文字認識結果と比較し、テンプレート候補記憶部の文字認識結果に類似する文字認識結果が記憶部に存在する場合には、該当するテンプレート候補の文字認識結果の件数に1を加算し、記憶部に類似する文字認識結果が存在しない場合には、文字認識結果を新しいテンプレート候補としてテンプレート候補記憶部に登録し、テンプレート候補記憶部から費用削減の条件を満たすテンプレート候補を抽出してユーザ端末に送信する。
【0095】
上記テンプレート作成推薦処理部は、定型帳票認識エンジンによる文字認識にかかる費用と、非定型帳票認識エンジンによる文字認識にかかる費用と、テンプレートの作成にかかる費用とから、テンプレートを作成した場合にテンプレートを作成する前よりも帳票認識にかかる費用が下がるテンプレート候補を抽出して、作成を推薦するテンプレートとして抽出したテンプレート候補の情報(例えば、項目名、特徴量など)をユーザ端末に送信する。
【0096】
上述した本実施の形態では、テンプレート選択処理部のテンプレート選択結果に基づいて、帳票に対するテンプレートが存在しない場合には、非定型帳票認識エンジンによる文字認識処理を実行し、帳票に対するテンプレートが存在する場合には選択されたテンプレートを用いて、定型帳票認識エンジンによる文字認識処理を実行する。
【0097】
このように、目的の帳票に対するテンプレートの有無に応じて定型帳票認識エンジンと非定型帳票認識エンジンを択一的に選択し、テンプレートがある場合には定型帳票認識エンジンで文字認識処理を実行することで、帳票認識にかかるコストを抑えることができる。また、テンプレートを用いて定型帳票認識エンジンによる文字認識を行うので認識精度を向上させることができる。
【0098】
また、上述した本実施の形態では、帳票の認識結果から同じテンプレートで読み取り可能な帳票を特定して、該テンプレートの作成をユーザに推薦する。より具体的には、非定型帳票認識エンジンでの認識結果の蓄積と、帳票認識にかかるコスト(各エンジンによる認識コスト、テンプレート作成コスト、処理件数により変化)とに基づいて、テンプレート作成の要否を判断してテンプレートの作成を推奨する。言い換えると、本実施の形態では、非定型帳票認識エンジンで認識していた帳票のうち、帳票認識にかかるコストを考慮して定型帳票認識エンジンでの認識に切り替えるべき帳票を特定する。このような仕組みにより、定型帳票認識エンジンと非定型帳票認識エンジンの両方に連携する帳票認識システムを用いて多様なレイアウトの帳票を処理する業務において、帳票認識コストを抑えながら認識精度を向上させることができる。
【0099】
また、本実施の形態では、作成することにより帳票認識コストを下げられるテンプレート候補(帳票)の情報をユーザに提示するので、ユーザは、人手によらずに、帳票認識コストを抑える方法を知ることができる。
【0100】
なお、本発明は上述した実施形態に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、その他種々の応用例、変形例を取り得ることは勿論である。例えば、上述した実施形態は本発明を分かりやすく説明するためにその構成を詳細かつ具体的に説明したものであり、必ずしも説明した全ての構成要素を備えるものに限定されない。また、上述した実施形態の構成の一部について、他の構成要素の追加又は置換、削除をすることも可能である。
【0101】
また、上記の各構成、機能、処理部等は、それらの一部又は全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。ハードウェアとして、FPGA(Field Programmable Gate Array)やASIC(Application Specific Integrated Circuit)などの広義のプロセッサデバイスを用いてもよい。
【0102】
また、上述した実施形態に係る帳票認識システム100の各構成要素は、それぞれのハードウェアがネットワークを介して互いに情報を送受信できるならば、いずれのハードウェアに実装されてもよい。また、ある処理部により実施される処理が、1つのハードウェアにより実現されてもよいし、複数のハードウェアによる分散処理により実現されてもよい。
【符号の説明】
【0103】
100…帳票認識システム、 110…ウェブサーバ、 120…サービス制御部
130…テンプレート選択処理部、 131…テンプレートデータベース、 140…帳票認識処理部、 141…帳票認識結果テーブル、 150…テンプレート作成推薦処理部、 151…テンプレート候補テーブル、 161…定型エンジン、 162…非定型エンジン、 170…ユーザ端末、 180…インターネット、 200…計算機、 201…CPU、 202…ROM、 203…RAM、 204…不揮発性ストレージ、 205…通信インターフェース、 310…運用改善段階、 320…運用初期段階
図1
図2
図3
図4
図5
図6
図7
図8
図9
【手続補正書】
【提出日】2024-12-12
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
帳票に記載されている文字の認識に用いられる定型帳票認識エンジンと非定型帳票認識エンジンの両方に連携する帳票認識システムであって、
前記定型帳票認識エンジン及び前記非定型帳票認識エンジンを用いて、帳票の読み取り画像である帳票画像に対する文字認識処理を実行し、前記非定型帳票認識エンジンによる前記帳票画像の文字認識結果を記憶部に蓄積する帳票認識処理部と、
前記帳票の帳票画像から前記定型帳票認識エンジンでの文字認識に用いるテンプレートを、テンプレートデータベースから選択する処理を実行して、テンプレート選択結果を前記帳票認識処理部へ出力するテンプレート選択処理部と、
前記帳票画像の文字認識結果を、類似する文字認識結果ごとにテンプレート候補として記憶するテンプレート候補記憶部と、
テンプレート作成推薦処理部と、を備え、
前記帳票認識処理部は、前記テンプレート選択結果に基づいて、前記帳票に対するテンプレートが存在しない場合には、前記非定型帳票認識エンジンにより前記帳票画像に対する文字認識処理を実行し、前記帳票に対するテンプレートが存在する場合には選択されたテンプレートを用いて、前記定型帳票認識エンジンにより前記帳票画像に対する文字認識処理を実行し、
前記テンプレート作成推薦処理部は、前記記憶部から読み出した前記帳票画像の文字認識結果を、前記テンプレート候補記憶部に記憶された前記文字認識結果と比較し、前記テンプレート候補記憶部の前記文字認識結果に類似する文字認識結果が前記記憶部に存在する場合には、該当するテンプレート候補の文字認識結果の件数に1を加算し、前記記憶部に類似する文字認識結果が存在しない場合には、前記文字認識結果を新しいテンプレート候補として前記テンプレート候補記憶部に登録し、前記テンプレート候補記憶部から費用削減の条件を満たすテンプレート候補を抽出してユーザ端末に送信する
帳票認識システム。
【請求項2】
前記テンプレート作成推薦処理部は、前記定型帳票認識エンジンによる文字認識にかかる費用と、前記非定型帳票認識エンジンによる文字認識にかかる費用と、テンプレートの作成にかかる費用とから、前記テンプレートを作成した場合に前記テンプレートを作成する前よりも帳票認識にかかる費用が下がるテンプレート候補を抽出して、作成を推薦するテンプレートとして前記抽出したテンプレート候補の情報を前記ユーザ端末に送信する
請求項に記載の帳票認識システム。
【請求項3】
前記テンプレート作成推薦処理部は、前記テンプレート候補の所定期間に蓄積された類似する前記文字認識結果の件数と、前記定型帳票認識エンジンによる帳票一枚当たりの文字認識にかかる費用と、前記非定型帳票認識エンジンによる帳票一枚当たりの文字認識にかかる費用と、前記テンプレートの作成にかかる費用とから、前記テンプレートの作成を推薦する前記テンプレート候補を特定する
請求項に記載の帳票認識システム。
【請求項4】
前記テンプレート作成推薦処理部は、前記記憶部及び前記テンプレート候補記憶部に蓄積された、前記帳票画像の文字認識結果に含まれる項目名を比較し、前記項目名が一致する場合には双方の前記帳票画像の文字認識結果に含まれる特徴量を比較して、前記文字認識結果の類似性を判定する
請求項に記載の帳票認識システム。
【請求項5】
前記テンプレート作成推薦処理部は、前記記憶部及び前記テンプレート候補記憶部に蓄積された、前記帳票画像の文字認識結果に含まれる項目名を比較して、前記文字認識結果の類似性を判定する
請求項に記載の帳票認識システム。
【請求項6】
前記テンプレート作成推薦処理部は、前記記憶部及び前記テンプレート候補記憶部に蓄積された、前記帳票画像の文字認識結果に含まれる特徴量を比較して、前記文字認識結果の類似性を判定する
請求項に記載の帳票認識システム。
【請求項7】
帳票に記載されている文字の認識に用いられる定型帳票認識エンジンと非定型帳票認識エンジンの両方に連携する帳票認識システムによる帳票認識方法であって、
前記帳票の読み取り画像である帳票画像から前記定型帳票認識エンジンでの文字認識に用いるテンプレートを、テンプレートデータベースから選択する処理を実行して、テンプレート選択結果を出力する処理と、
前記テンプレート選択結果に基づいて、前記帳票に対するテンプレートが存在しない場合には、前記非定型帳票認識エンジンにより前記帳票画像に対する文字認識処理を実行し、前記帳票に対するテンプレートが存在する場合には選択されたテンプレートを用いて、前記定型帳票認識エンジンにより前記帳票画像に対する文字認識処理を実行する処理と、
前記非定型帳票認識エンジンによる前記帳票画像の文字認識結果を記憶部に蓄積する処理と、
前記帳票画像の文字認識結果を、類似する文字認識結果ごとにテンプレート候補としてテンプレート候補記憶部に記憶する処理と、
前記記憶部から読み出した前記帳票画像の文字認識結果を、前記テンプレート候補記憶部に記憶された前記文字認識結果と比較し、前記テンプレート候補記憶部の前記文字認識結果に類似する文字認識結果が前記記憶部に存在する場合には、該当するテンプレート候補の文字認識結果の件数に1を加算し、前記記憶部に類似する文字認識結果が存在しない場合には、前記文字認識結果を新しいテンプレート候補として前記テンプレート候補記憶部に登録し、前記テンプレート候補記憶部から費用削減の条件を満たすテンプレート候補を抽出してユーザ端末に送信する処理と、を含む
帳票認識方法。