特開2021-117802(P2021-117802A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 京都電子計算株式会社の特許一覧

特開2021-117802帳票振分装置及び帳票振分用プログラム
<>
  • 特開2021117802-帳票振分装置及び帳票振分用プログラム 図000003
  • 特開2021117802-帳票振分装置及び帳票振分用プログラム 図000004
  • 特開2021117802-帳票振分装置及び帳票振分用プログラム 図000005
  • 特開2021117802-帳票振分装置及び帳票振分用プログラム 図000006
  • 特開2021117802-帳票振分装置及び帳票振分用プログラム 図000007
  • 特開2021117802-帳票振分装置及び帳票振分用プログラム 図000008
  • 特開2021117802-帳票振分装置及び帳票振分用プログラム 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2021-117802(P2021-117802A)
(43)【公開日】2021年8月10日
(54)【発明の名称】帳票振分装置及び帳票振分用プログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20210712BHJP
   G06K 9/20 20060101ALI20210712BHJP
【FI】
   G06T7/00 300E
   G06K9/20 340C
【審査請求】未請求
【請求項の数】14
【出願形態】OL
【全頁数】15
(21)【出願番号】特願2020-11378(P2020-11378)
(22)【出願日】2020年1月28日
(71)【出願人】
【識別番号】596153368
【氏名又は名称】京都電子計算株式会社
(74)【代理人】
【識別番号】100121441
【弁理士】
【氏名又は名称】西村 竜平
(74)【代理人】
【識別番号】100154704
【弁理士】
【氏名又は名称】齊藤 真大
(74)【代理人】
【識別番号】100129702
【弁理士】
【氏名又は名称】上村 喜永
(74)【代理人】
【識別番号】100206151
【弁理士】
【氏名又は名称】中村 惇志
(74)【代理人】
【識別番号】100218187
【弁理士】
【氏名又は名称】前田 治子
(72)【発明者】
【氏名】竹内 有一
(72)【発明者】
【氏名】村山 周
(72)【発明者】
【氏名】徳田 壮秀
(72)【発明者】
【氏名】岡本 照範
(72)【発明者】
【氏名】北田 真衣
【テーマコード(参考)】
5B029
5L096
【Fターム(参考)】
5B029AA01
5B029BB02
5B029CC26
5B029CC27
5B029EE12
5L096AA03
5L096AA07
5L096BA18
5L096DA02
5L096EA13
5L096EA15
5L096EA16
5L096EA35
5L096FA16
5L096FA77
5L096JA13
(57)【要約】
【課題】複数種類の帳票に極めて類似する帳票が含まれていても、記入済帳票の種類を正しく振り分けられるようにする。
【解決手段】記入済帳票の画像に含まれる特徴シンボルを、複数種類の帳票の中から予め選択された帳票のテンプレート画像に含まれる特徴シンボルに位置合わせする位置合わせ部14と、位置合わせ後の画像である補正後画像に、記入済帳票の種類が予め選択された帳票の種類か否かに応じた差を生じさせる差別用画像をオーバーレイするオーバーレイ部15と、オーバーレイ後の画像であるオーバーレイ画像に基づいて、記入済帳票の種類が前記予め選択された帳票の種類であるか否かを判定する正誤判定部13bとを備えるようにした。
【選択図】図5
【特許請求の範囲】
【請求項1】
記入済帳票の画像に含まれる特徴シンボルを、複数種類の帳票の中から予め選択された帳票のテンプレート画像に含まれる特徴シンボルに位置合わせする位置合わせ部と、
位置合わせ後の画像である補正後画像に、記入済帳票の種類が前記予め選択された帳票の種類か否かに応じた差を生じさせる差別用画像をオーバーレイするオーバーレイ部と、
オーバーレイ後の画像であるオーバーレイ画像に基づいて、記入済帳票の種類が前記予め選択された帳票の種類であるか否かを判定する正誤判定部とを備えることを特徴とする帳票振分装置。
【請求項2】
前記差別用画像が、前記テンプレート画像の記入欄に対応する線、又は、前記テンプレート画像であることを特徴とする請求項1記載の帳票振分装置。
【請求項3】
記入済帳票の画像に基づいて、当該記入済帳票が複数種類の帳票のうちのどの種類の帳票に記入されたものであるかを判断して振り分ける振り分け部をさらに備え、
前記位置合わせ部が、記入済帳票の画像に含まれる特徴シンボルを、前記振り分け部が判断した種類の帳票のテンプレート画像に含まれる特徴シンボルに位置合わせし、
前記正誤判定部が、前記振り分け部による振り分け結果の正誤を判定することを特徴とする請求項1又は2記載の帳票振分装置。
【請求項4】
前記正誤判定部が、前記オーバーレイ画像の一部に基づいて、前記振り分け結果の正誤を判定することを特徴とする請求項3記載の帳票振分装置。
【請求項5】
前記オーバーレイ部が、前記テンプレート画像に前記差別用画像をオーバーレイしてテンプレートオーバーレイ画像を作成し、
前記正誤判定部が、前記オーバーレイ画像及び前記テンプレートオーバーレイ画像それぞれの対応する一部を比較することにより、前記振り分け結果の正誤を判定することを特徴とする請求項3又は4記載の帳票振分装置。
【請求項6】
前記オーバーレイ画像の一部を切り取る画像切取り部をさらに備えることを特徴とする請求項5記載の帳票振分装置。
【請求項7】
前記オーバーレイ画像の一部が、当該オーバーレイ画像の右下又は左下であることを特徴とする請求項4乃至6のうち何れか一項に記載の帳票振分装置。
【請求項8】
前記オーバーレイ部が、前記補正後画像に、前記テンプレート画像の記入欄に対応する枠線を前記差別用画像としてオーバーレイするものであり、その枠線が、前記記入欄に対して設定された文字読取り領域を示すことを特徴とする請求項1乃至7のうち何れか一項に記載の帳票振分装置。
【請求項9】
前記振り分け部が、記入済帳票の画像に含まれる特徴点と、複数種類の帳票の前記テンプレート画像に含まれる特徴点とを順次比較して、記入済帳票の種類を判断することを特徴とする請求項3記載の帳票振分装置。
【請求項10】
前記正誤判定部が、前記オーバーレイ画像に含まれる特徴点と、前記テンプレート画像に含まれる特徴点とを比較して、前記振り分け結果の正誤を判定することを特徴とする請求項9記載の帳票振分装置。
【請求項11】
前記振り分け部が、記入済帳票の画像に含まれる特徴点と、前記テンプレート画像に含まれる特徴点との一致度を算出し、その一致度と所定の第1閾値とを比較して、記入済帳票の種類を判断するものであり、
前記正誤判定部が、前記オーバーレイ画像に含まれる特徴点と、前記テンプレート画像に含まれる特徴点との一致度を算出し、その一致度と所定の第2閾値とを比較して、前記振り分け結果の正誤を判定するものであることを特徴とする請求項3記載の帳票振分装置。
【請求項12】
前記振り分け部が、記入済帳票の種類として該当するものがない場合、その記入済帳票を該当無し種類と判断して振り分ける、請求項11記載の帳票振分装置。
【請求項13】
位置合わせ部が、該当無し種類に振り分けられた記入済帳票の画像に含まれる特徴シンボルを、前記振り分け部による比較結果のうち、最も一致度が高かった尤もらしい種類の帳票のテンプレート画像に含まれる特徴シンボルに位置合わせし、
前記正誤判定部が、該当無し種類に振り分けられた記入済帳票のオーバーレイ画像に基づいて、記入済帳票の種類が前記尤もらしい種類であるか否かを判定することを特徴とする請求項12記載の帳票振分装置。
【請求項14】
記入済帳票の画像に含まれる特徴シンボルを、複数種類の帳票の中から予め選択された帳票のテンプレート画像に含まれる特徴シンボルに位置合わせする位置合わせ部と、
位置合わせ後の画像である補正後画像に、記入済帳票の種類が前記予め選択された帳票の種類か否かに応じた差を生じさせる差別用画像をオーバーレイするオーバーレイ部と、
オーバーレイ後の画像であるオーバーレイ画像に基づいて、記入済帳票の種類が前記予め選択された帳票の種類であるか否かを判定する正誤判定部としての機能をコンピュータに発揮させることを特徴とする帳票振分装置用プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば帳票に記入された情報をテキスト化して登録するために用いられる帳票振分装置及び帳票振分用プログラムに関するものである。
【背景技術】
【0002】
この種のシステムとしては、特許文献1に示すように、記入済みの帳票(以下、記入済帳票という)をイメージ化して、そのイメージデータを文字認識手段により文字認識させ、これにより得られたテキストデータを登録するように構成されたものがある。
【0003】
かかるシステムにおいて、複数種類の帳票を一挙に登録できるようにするためには、まず、記入済帳票が、複数種類のうちのどの種類の帳票に記入されたものであるかを判別し、複数枚の記入済帳票を種類別に振り分ける必要がある。
【0004】
かかる振り分け方法としては、例えば、記入済帳票の画像に含まれる特徴点を抽出して、この特徴点と、複数種類の帳票のテンプレート画像に含まれる特徴点とを比較し、その一致度の高さに基づいて記入済帳票を種類別に振り分ける方法が挙げられる。
【0005】
しかしながら、種々の帳票の中には、例えば多くの記入項目が一致し、各記入項目に対する記入欄の配列もほぼ同じでありながら、例えば記入欄のサイズが若干違うものなど、一見すると同じ種類に思われるが、実際には異種の帳票が含まれている。
【0006】
このように極めて類似する帳票に上述した振り分け方法を適用すると、どちらの帳票に対しても一致度が高くなり、記入済帳票が誤った種類の帳票に振り分けられてしまう可能性が高くなる。そうすると、その後の画像処理等に影響が及び、文字認識ができないといった問題が生じる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2006−244315号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
そこで、本発明は、上述した問題を解決するべくなされたものであり、複数種類の帳票に極めて類似する帳票が含まれていても、記入済帳票の種類を正しく振り分けられるようにすることをその主たる課題とするものである。
【課題を解決するための手段】
【0009】
すなわち、本発明に係る帳票振分装置は、記入済帳票の画像に含まれる特徴シンボルを、複数種類の帳票の中から予め選択された帳票のテンプレート画像に含まれる特徴シンボルに位置合わせする位置合わせ部と、位置合わせ後の画像である補正後画像に、記入済帳票の種類が前記予め選択された帳票の種類か否かに応じた差を生じさせる差別用画像をオーバーレイするオーバーレイ部と、オーバーレイ後の画像であるオーバーレイ画像に基づいて、記入済帳票の種類が前記予め選択された帳票の種類であるか否かを判定する正誤判定部とを備えることを特徴とするものである。
【0010】
このように構成された帳票振分装置によれば、記入済帳票が予め選択された種類のものであれば、位置合わせ後の補正後画像はテンプレート画像にぴったり位置合わせされるはずであり、逆に選択された種類のものでなければ、特徴シンボルを無理に位置合わせしようとすることで、補正後画像は歪んだり伸びたりする。
その結果、補正後画像に差別用画像をオーバーレイしたオーバーレイ画像には、記入済帳票が予め選択された種類のものであるか否かによって差が生じる。
このことから、複数種類の帳票に極めて類似する帳票が含まれていても、オーバーレイ画像を用いることで、その記入済画像が選択された種類のものであるか否かによる差を顕著に現すことができるので、正誤判定部による判定結果の信頼性を向上させることができ、ひいては記入済帳票の種類を正しく振り分けることが可能となる。
【0011】
前記差別用画像が、前記テンプレート画像の記入欄に対応する線、又は、前記テンプレート画像であることが好ましい。
これならば、差別用画像が簡便に準備できるものとなる。
【0012】
帳票の種類が多岐に亘る場合、記入済帳票を複数種類の帳票のテンプレートに次々と位置合わせしていくのでは効率が悪く、各帳票を振り分けるのに要する処理時間が長くなる。
そこで、処理効率の向上を図るためには、記入済帳票の画像に基づいて、当該記入済帳票が複数種類の帳票のうちのどの種類の帳票に記入されたものであるかを判断して振り分ける振り分け部をさらに備え、前記位置合わせ部が、記入済帳票の画像に含まれる特徴シンボルを、前記振り分け部が判断した種類の帳票のテンプレート画像に含まれる特徴シンボルに位置合わせし、前記正誤判定部が、前記振り分け部による振り分け結果の正誤を判定することが好ましい。
このような構成であれば、始めに振り分け部による振り分けを行い、その振り分け結果の正誤を判定するので、処理時間の短縮化を図れる。
【0013】
ところで、互いに異なる種類の帳票の類似具合が極めて高く、両者のオーバーレイ画像も似通ったものになると、単にオーバーレイ画像を用いるだけでは、振り分けの正誤を正しく判定することが難しくなる。
そこで、前記正誤判定部が、前記オーバーレイ画像の一部に基づいて、前記振り分け結果の正誤を判定することが好ましい。
このような構成であれば、振り分け結果の正誤判定に用いるオーバーレイ画像の一部として、振り分け結果の正誤によってオーバーレイした線のずれが大きく生じる部分を採用することで、オーバーレイ画像の全体を用いる場合に比べて、振り分け結果の正誤の差をより顕著に現すことができ、振り分けの正誤をより正確に判定することが可能となる。
【0014】
より具体的な実施態様としては、前記オーバーレイ部が、前記テンプレート画像に前記差別用画像をオーバーレイしてテンプレートオーバーレイ画像を作成し、前記正誤判定部が、前記オーバーレイ画像及び前記テンプレートオーバーレイ画像それぞれの対応する一部を比較することで、前記振り分け結果の正誤を判定する態様を挙げることができる。
これならば、オーバーレイした画像同士(オーバーレイ画像及びテンプレートオーバーレイ画像)の対応する一部を比較するので、両画像の一致度は、振り分け結果が正しい場合と誤っている場合とで大きく差がつき、より正しく正誤判定することができる。
【0015】
簡素なプログラムで迅速な処理を可能にするためには、前記オーバーレイ画像の一部を切り取る画像切取り部をさらに備えることが好ましい。
【0016】
前記オーバーレイ画像の一部が、当該オーバーレイ画像の右下又は左下であることが好ましい。
このような構成であれば、帳票の右下又は左下は、特徴点(特徴量)が比較的少なく、位置合わせ部による影響(例えば、画像が歪んだり伸びたりする現象)が現れやすいので、帳票全体の中でもオーバーレイされた線がずれやすい。その結果、オーバーレイ画像の右下又は左下を用いることで、振り分け結果の正誤の差をより顕著にすることができる。
【0017】
前記オーバーレイ部が、前記補正後画像に、前記テンプレート画像の記入欄に対応する枠線を前記差別用画像としてオーバーレイするものであり、その枠線が、前記記入欄に対して設定された文字読取り領域を示すことが好ましい。
このような構成であれば、テンプレート画像に対して予め設定した文字読取り領域を、オーバーレイする枠線としても併用することができ、プログラムの簡素化を図れる。
【0018】
前記振り分け部の具体的な実施態様としては、記入済帳票の画像に含まれる特徴点と、複数種類の帳票の前記テンプレート画像に含まれる特徴点とを順次比較して、記入済帳票の種類を判断するものを挙げることができる。
【0019】
上述した振り分け部の構成において、前記正誤判定部が、前記オーバーレイ画像に含まれる特徴点と、前記テンプレート画像に含まれる特徴点とを比較して、前記振り分け結果の正誤を判定することが好ましい。
このような構成であれば、振り分け部及び正誤判定部の双方に、特徴点の比較する機能を兼用させているので、プログラムのさらなる簡素化を図れる。
【0020】
前記振り分け部が、記入済帳票の画像に含まれる特徴点と、前記テンプレート画像に含まれる特徴点との一致度を算出し、その一致度と所定の第1閾値とを比較して、記入済帳票の種類を判断するものであり、前記正誤判定部が、前記オーバーレイ画像に含まれる特徴点と、前記テンプレート画像に含まれる特徴点との一致度を算出し、その一致度と所定の第2閾値とを比較して、前記振り分け結果の正誤を判定するものであることが好ましい。
このような構成であれば、上述したようにプログラムの簡素化を図れるうえ、第1閾値及び第2閾値をそれぞれ適切な値に設定することができるので、、振り分け部による判断基準と正誤判定部による判断基準とを柔軟に設定することができる。
【0021】
前記振り分け部が、記入済帳票の種類として該当するものがない場合、その記入済帳票を該当無し種類と判断して振り分けることが好ましい。
このような構成であれば、記入済帳票が、予めテンプレートを準備した複数種類には含まれない種類のものであることをも判定することができる。
【0022】
上述したように、記入済帳票を該当無し種類に振り分けたものの、実際には、その記入済帳票が予めテンプレートを準備した複数種類に含まれる場合がある。
そこで、位置合わせ部が、該当無し種類に振り分けられた記入済帳票の画像に含まれる特徴シンボルを、前記振り分け部による比較結果のうち、最も一致度が高かった尤もらしい種類の帳票のテンプレート画像に含まれる特徴シンボルに位置合わせし、前記正誤判定部が、該当無し種類に振り分けられた記入済帳票のオーバーレイ画像に基づいて、記入済帳票の種類が前記尤もらしい種類であるか否かを判定することが好ましい。
このような構成であれば、記入済帳票が、実際には尤もらしい種類のものであったか、それとも振り分け部の振り分け結果の通りに該当無し種類に振り分けられるものであったかを判定することができ、振り分け精度のさらなる向上を図れる。
【0023】
また、本発明に係る帳票振分用プログラムは、記入済帳票の画像に含まれる特徴シンボルを、複数種類の帳票の中から予め選択された帳票のテンプレート画像に含まれる特徴シンボルに位置合わせする位置合わせ部と、位置合わせ後の画像である補正後画像に、記入済帳票の種類が前記予め選択された帳票の種類か否かに応じた差を生じさせる差別用画像をオーバーレイするオーバーレイ部と、オーバーレイ後の画像であるオーバーレイ画像に基づいて、記入済帳票の種類が前記予め選択された帳票の種類であるか否かを判定する正誤判定部としての機能をコンピュータに発揮させることを特徴とするものである。
このように構成された帳票振分用プログラムによっても、上述した帳票振分装置と同様の作用効果を奏し得る。
【発明の効果】
【0024】
このように構成した本発明によれば、複数種類の帳票に極めて類似する帳票が含まれていても、記入済帳票の種類を正しく振り分けることができる。
【図面の簡単な説明】
【0025】
図1】一実施形態に係る帳票振分装置の使用例を示す模式図。
図2】同実施形態における帳票の模式図。
図3】同実施形態における帳票振分装置の機能を示す機能ブロック図。
図4】同実施形態における帳票振分装置の動作を説明するためのフローチャート図。
図5】同実施形態におけるオーバーレイ画像。
図6】同実施形態におけるテンプレートオーバーレイ画像。
図7】その他の実施形態における帳票振分装置の機能を示す機能ブロック図。
【発明を実施するための形態】
【0026】
本発明の一実施形態に係る帳票振分装置について図面を参照しながら説明する。
【0027】
本実施形態の帳票振分装置1は、帳票Pに記入された情報を電子化して登録するために用いられるものであり、図1に示すように、スキャナ等の撮像手段2やOCR等の文字認識手段3とともに帳票登録システムXを構築するものである。
【0028】
まず、帳票Pについて、図2を参照しながら簡単に説明する。
帳票Pは、例えば年末調整や年金などに関する種々の届出書などであり、複数の記入項目それぞれに対する記入欄P1が設けられた記入用紙である。なお、記入項目としては、氏名、生年月日、住所、電話番号、種々の金額などを挙げることができる。
【0029】
次に、帳票振分装置1について説明する。
この帳票振分装置1は、CPU、メモリ、入出力インターフェース等を備えた専用乃至汎用のコンピュータである。そして、前記メモリに格納されている帳票登録用プログラムに従って、CPUやその他の周辺機器を協働させることにより、図3に示すように、画像データ取得部11、テンプレート格納部12、比較判断部13、位置合わせ部14、オーバーレイ部15、画像切取り部16、通信部17、記入情報格納部18などとしての機能を発揮するように構成されている。
【0030】
以下、各部の説明を兼ねて、図3の機能ブロック図、及び、図4のフローチャートを参照しながら、帳票振分装置1を用いた本帳票登録システムXによる情報の登録までの動作について説明する。なお、以下に述べる種々の画像とは、画像データそのものであっても良いし、画像データを文字列に変換したデータであっても良い。
【0031】
まず、互いに異なる複数種類の帳票を未記入の状態でスキャナ等の撮像手段2を用いてイメージ化する(S1)。
【0032】
これらの未記入帳票の画像(以下、テンプレート画像という)は、撮像手段2から帳票振分装置1に出力され、画像データ取得部11により取得される。
【0033】
次に、ユーザは、画像データ取得部11が取得したテンプレート画像を用いて、複数種類の帳票それぞれに関するテンプレート情報を作成し、それらのテンプレート情報をテンプレート格納部12に格納する(S2)。
【0034】
このテンプレート情報には、少なくとも帳票の種類、帳票のテンプレート画像、帳票に設けられている記入欄P1に対応する文字読み取り領域などが含まれている。なお、文字読み取り領域は、例えばマウスやキーボードやタッチパネルなどの入力手段を用いてテンプレート画像から抽出可能な領域であり、具体的には記入欄P1の枠線上の座標により表される領域であっても良いし、枠線よりもやや内側又はやや外側の座標により表される領域であっても良い。
【0035】
次に、複数枚の記入済の帳票をスキャナ等の撮像手段2を用いてイメージ化する(S3)。これらの記入済帳票には、互いに異なる複数種類の帳票に記入されたものが含まれており、さらにその中には、極めて類似するものの実際には異なる種類の帳票に記入されたものが含まれている。なお、この工程S3は、S1における未記入帳票のイメージ化とともに行っても良い。
【0036】
このようにして得られた記入済帳票の画像(以下、記入済画像という)は、撮像手段2から帳票振分装置1に出力され、画像データ取得部11により取得される。なお、画像データ取得部11により取得された複数枚の記入済画像は、本装置1のハードディスクの所定領域に設定された帳票イメージ格納部(不図示)に格納されても良い。
【0037】
比較判断部13は、互いに異なる2枚の画像を比較することにより、それらの画像の一致度を判断するものである。
【0038】
以下のステップS4における比較判断部13は、画像データ取得部11が取得した記入済画像に基づいて、その記入済帳票が複数種類のうちのどの種類の帳票に記入されたものであるかを判断して振り分ける振り分け部13aとして機能する。
【0039】
より具体的に説明すると、この振り分け部13aは、記入済画像と、テンプレート格納部12に格納されているテンプレート画像とを順次比較して、これらの画像の一致度を順次算出する(S4)。なお、一致度の算出方法としては種々の方法を採用することができるが、一例としては、テンプレート画像に含まれる複数の特徴点のうち、記入済画像に含まれている特徴点の個数に基づいて算出する方法などを挙げることができる。
【0040】
そして、振り分け部13aは、順次算出される一致度と所定の第1閾値とを比較する(S5)。
【0041】
S5において、一致度が第1閾値を下回っている場合、記入済画像と全種類のテンプレート画像とを比較し終わったかを判断(S6)し、比較していないテンプレート画像が残っていれば、S4に戻る。
【0042】
一方、S5において、一致度が第1閾値以上となった場合に、そのテンプレート画像の種類が、記入済画像に適合した種類であると判断し、記入済画像をその種類(以下、適合種類という)に振り分ける(S71)。
【0043】
続いて、振り分け部13aにより適合種類が振り分けられた記入済画像は、位置合わせ部14に出力される。
位置合わせ部14は、記入済画像に含まれる所定の特徴シンボルを、適合種類の帳票のテンプレート画像に含まれる所定の特徴シンボルに位置合わせする(S81)。なお、特徴シンボルとしては、例えば文字、記号、模様などの曲線部分を含む箇所を挙げることができる。
【0044】
具体的には、記入済画像を必要に応じて移動、回転、拡大、縮小、又は台形補正させることにより、この記入済画像の複数の特徴シンボルそれぞれが、適合種類のテンプレート画像の対応した特徴シンボルそれぞれと重なり合うように位置補正する。言い換えれば、位置合わせ部14は、記入済画像の複数の特徴シンボルそれぞれの座標を、適合種類のテンプレート画像の対応した特徴シンボルそれぞれの座標に一致させるように構成されている。
【0045】
ところで、S6において、記入済画像と全種類のテンプレート画像とを比較し終わったと判断された場合、テンプレート格納部に格納されたテンプレート画像の中には、記入済帳票の種類の該当するものがない蓋然性が高い。そこで、この場合には、本実施形態の振り分け部13aが、記入済帳票を該当無し種類と判断して振り分ける(S72)。
【0046】
この場合、位置合わせ部14は、該当無し種類に振り分けられた記入済帳票の画像に含まれる所定の特徴シンボルを、振り分け部による比較結果のうち、最も一致度が高かった尤もらしい種類の帳票のテンプレート画像に含まれる所定の特徴シンボルに位置合わせする(S82)。
【0047】
ここで、振り分け部13aによる振り分けが誤っていた場合、すなわち記入済画像が適合種類とは別の種類の帳票に記入されたものである場合、上述した位置補正により特徴シンボルを重ね合わせようとした結果、記入済画像の特徴シンボルとは異なる箇所(以下、非特徴箇所という)がずれたり伸びたり歪んだりして変化する。なお、非特徴箇所は、特徴シンボルよりも曲線部分が少なく特徴シンボルとはなり難い箇所であり、例えばテンプレート画像においては直線のみを含む箇所である。なお、このことは、記入済画像がS82における尤もらしい種類とは別の種類の帳票に記入された場合も同様にいえることである。
【0048】
一方、振り分け部13aによる振り分けが正しかった場合、すなわち記入済画像が適合種類の帳票に記入されたものである場合、上述した位置補正により、記入済画像の非特徴箇所が変化することなく、特徴シンボルが重なり合う。なお、このことは、記入済画像がS82における尤もらしい種類の帳票に記入された場合も同様にいえることである。
【0049】
このように、S81・S82において位置合わせ部14が位置補正した画像である補正後画像に対して、オーバーレイ部15が、記入済帳票の種類が上述した適合種類か否かに応じた差、或いは、記入済帳票の種類が上述した尤もらしい種類か否かに応じた差を生じさせる差別用画像をオーバーレイする(S9)。
【0050】
差別用画像は、この実施形態では、適合種類や尤もらしい種類のテンプレート画像の記入欄に対応する枠線であり、テンプレート画像の記入欄の枠線そのものであっても良いし、記入欄よりもやや内側又はやや外側の枠線であっても良く、ここでは上述した文字読み取り領域を示す枠線としてある。
【0051】
ここで、図5に示すように、上述したS71における振り分け部13aの振り分け結果が正しい場合(図5(a))と、S71における振り分け部13aの振り分け結果が誤っている場合(図5(b))との間には、オーバーレイ後の画像であるオーバーレイ画像に差が生じる。そして、このずれは、上述した非特徴箇所において顕著となる。
なお、このオーバーレイ画像の差は、記入済画像がS82における尤もらしい種類の帳票に記入されたものであるか否かにおいても同様に生じるものである。
【0052】
そこで、本実施形態の帳票読取装置は、画像切取り部16が、オーバーレイ画像の一部を切り取る(S10)。
【0053】
具体的にこの画像切取り部16は、オーバーレイ画像のうち、上述した非特徴箇所を含む部分を切り取るように構成されている。より詳細には、種々の帳票において、右下又は左下には曲線が殆どなく、直線のみが現れがちであることから、画像切取り部16は、オーバーレイ画像の右下又は左下を切り取るように構成されており、その切り取られた一部は、オーバーレイ画像全体の例えば1/4〜1/16の範囲である。
【0054】
そして、この切り取られたオーバーレイ画像の一部である記入済切取画像(図5aや図5bに示すもの)は、再び比較判断部13に出力される。
【0055】
以下のステップS11における比較判断部13は、オーバーレイ画像に基づいて、上述した振り分け部13aによる振り分け結果の正誤を判断する正誤判定部13bとして機能する。
【0056】
より具体的に説明すると、ここではまずオーバーレイ部15が、図6に示すように、テンプレート画像の記入欄に対応する枠線、すなわち上述したS9において記入済画像にオーバーレイした差別用画像たる枠線を、このテンプレート画像にもオーバーレイする。このようにして作成された画像(以下、テンプレートオーバーレイ画像という)は、上述したテンプレート情報として、テンプレート格納部12に格納されている。
【0057】
このテンプレートオーバーレイ画像について付言すると、上述したS71における振り分け部13aの振り分け結果が正しい場合、オーバーレイ画像とテンプレートオーバーレイ画像とはほぼずれることなく一致するはずである。一方、S71における振り分け部13aの振り分け結果が誤っている場合、上述したように、補正後画像が延びたり歪んだりするので、オーバーレイ画像とテンプレートオーバーレイ画像とのずれは大きくなるはずであり、このずれは、上述した非特徴箇所において顕著となる。
【0058】
そこで、上述したように画像切取り部16が、上述したオーバーレイ画像を切り取った非特徴箇所を含む一部と同じ領域を、テンプレートオーバーレイ画像からも切り取り、その画像(以下、テンプレート切取画像)を正誤判定部13bに出力する。
【0059】
そして、正誤判定部13bは、記入済切取画像(図5aや図5bに示すもの)とテンプレート切取画像(図6に示すもの)とに基づいて、振り分け部13aによる振り分けの正誤を判定する。
【0060】
より具体的に説明すると、この正誤判定部13bは、記入済切取画像と、テンプレート切取画像とを比較して、これらの画像の一致度を算出する(S11)。なお、一致度の算出方法としては、記入済切取画像に含まれる特徴点と、テンプレート切取画像に含まれる特徴点とを比較する方法を挙げることができ、ここでは上述した振り分け部13aと同じ算出方法を用いている。このように、振り分け部13aと正誤判定部13bとが同じ算出方法で一致度を算出するように構成されていることから、比較判断部13に、振り分け部13a及び正誤判定部13bの双方の機能を発揮させることができる。
【0061】
そして、正誤判定部13bは、算出した一致度と所定の第2閾値とを比較して(S12)、一致度が第2閾値以上となった場合、振り分け部13aによる振り分け結果が正しいと判定する。また、S72において、記入済帳票が該当無し種類に振り分けられているのであれば、算出した一致度と所定の第2閾値とを比較して(S12)、一致度が第2閾値以上となった場合、その記入済帳票が尤もらしい種類であると判定する。
【0062】
このようにして振り分け結果が正しいと判定された場合、或いは、記入済帳票が尤もらしい種類のものであると判定された場合、正誤判定部13bは、記入済画像を通信部17に出力し、通信部17はその記入済画像を文字認識手段3に送信し、文字認識手段3が記入済画像に含まれる文字列を読み取る(S13)。
そして、通信部17は、文字認識手段3により読み取られた文字列である記入情報を受信し、その記入情報を記入情報格納部18に格納して登録を完了する(S14)。なお、この記入情報たる文字列は、図示しない表示部によってディスプレイ等に表示出力されても良い。このとき、この文字列と記入済画像とを比較可能に表示出力することで、必要に応じて文字列を修正等してから記入情報格納部18に格納できるように構成されていても良い。
【0063】
その後、全ての記入済画像の記入情報が登録されているか否かを判断し(S15)、未登録の記入済画像があればS4に戻り、全ての記入済画像の記入情報が登録されていれば登録動作を終了する。
【0064】
一方、S12において、正誤判定部13bは、算出した一致度が第2閾値を下回った場合、振り分け部13aによる振り分け結果が誤っていると判定する。
このようにして振り分け結果が誤っている判定された場合、S4に戻り、振り分け部13aが、再びこの記入済画像と、まだ比較されていないテンプレート画像とを順次比較して、それらの画像の一致度を順次算出し始め、S12において振り分け結果が正しいと判断されるまで、S4〜S12が繰り返される。
【0065】
このように構成された帳票振分装置1によれば、オーバーレイ画像を切り取った記入済切取画像には、振り分け部による振り分け結果の正誤による差が顕著に現れるので、この記入済切取画像とテンプレート切取画像とを比較することで、振り分け結果の正誤を正しく判定することができ、ひいては記入済帳票の種類を正しく振り分けることが可能となる。
【0066】
また、振り分け部13a及び正誤判定部13bの双方に、互いに異なる画像に含まれる対応した特徴点の一致度を算出し、その一致度と所定の閾値とを比較する機能を兼用させているので、プログラムの簡素化を図れる。
【0067】
さらに、S6において、記入済画像と全種類のテンプレート画像とを比較し終わったと判断された場合、記入済帳票を該当無し種類と判断して振り分けるので、記入済帳票が、予めテンプレートを準備した複数種類には含まれない種類のものであることをも判定することができる。
【0068】
なお、本発明は前記実施形態に限られるものではない。
【0069】
例えば、前記実施形態では、オーバーレイ部15が、適合種類のテンプレート画像の記入欄に対応する枠線を差別用画像として補正後画像にオーバーレイするように構成されていたが、差別用画像は、必ずしも枠状の線である必要はなく、複数の直線であっても良いし、格子状の線であっても良い。
【0070】
また、オーバーレイ部15としては、補正後画像に適合種類のテンプレート画像を差別用画像としてオーバーレイしても良い。この場合は、テンプレート画像に含まれる線を抽出してオーバーレイしても良いし、テンプレート画像に透過性を持たせて(例えば半透明にして)オーバーレイしても良い。
【0071】
さらに、差別用画像としては、記入済帳票の種類が振り分けられた種類であるか否かに応じた差を生じさせるものれば良く、例えば記号や文字などであっても良い。
【0072】
画像切取り部16は、オーバーレイ画像やテンプレートオーバーレイ画像の右下又は左下を切り取るように構成されていたが、右上、左下、或いは中央部などを切り取るように構成されていても良い。
【0073】
また、画像切取り部16としては、オーバーレイ画像やテンプレートオーバーレイ画像の一部のみならず、複数箇所を切り取るように構成されていても良い。
この場合、例えば2箇所を切り取る構成であれば、一方の箇所同士の一致度が第2閾値以上であり、且つ、他方の箇所同士の一致度が第2閾値以上である場合に、振り分け結果が正しいと判断するように構成することができる。
【0074】
さらに、画像切取り部16としての機能を用いずに、正誤判定部13bが、記入済画像やテンプレート画像における対応した一部のみに着目して比較し、その一部同士の一致度を算出するように構成されていても良い。
【0075】
加えて、第1閾値や第2閾値の一方又は両方は、記入済帳票の比較対象であるテンプレート画像の種類に応じて異なる値に設定されていても良い。
【0076】
さらに加えて、前記実施形態では、該当無し種類に振り分けられた記入済画像を、最も一致度の高い尤もらしい種類の帳票のテンプレートに位置合わせしていたが、一致度が高い所定順位(例えば上位3つ)までの種類の帳票のテンプレートに位置合わせして、それぞれにオーバーレイしても良い。
【0077】
そのうえ、該当無し種類に振り分けられた記入済画像を、尤もらしい種類のテンプレート画像に位置補正する場合、これらの種類が一致していないと、例えば記入済画像が引き伸ばされて罫線が殆ど残らず、全て或いは大半が背景色となることがある。
この場合、背景色が大半を占める補正後画像に例えばテンプレート画像の記入欄をオーバーレイすると、オーバーレイ画像とオーバーレイテンプレート画像との間の差がつきにくくなる恐れがある。
そこで、帳票振分装置1としては、補正後画像の背景色の全体に占める割合に基づいて、その補正後画像が、誤った種類のテンプレート画像に位置合わせされたものであるか否かを判断する判断部としての機能を備えていても良い。
なお、この判断部の具体的な判断方法としては、例えば背景色の全体に占める割当を算出するとともに、その算出割合と所定の基準割合とを比較し、その算出割合が基準割合を超えた場合に、補正後画像が、誤った種類のテンプレート画像に位置合わせされたものであると判断する方法などを挙げることができる。
【0078】
前記実施形態の帳票振分装置1は、これとは別の文字認識手段3との間でデータを授受するものであったが、図7に示すように、帳票振分装置1が文字認識部19としての機能を備えていても良い。この場合は、前記実施形態の通信部17としての機能は不要である。
【0079】
また、記入済帳票を、テンプレート格納部12に格納された複数種類の帳票のテンプレート画像に所定の順序で次々と位置合わせしていくように構成すれば、帳票振分装置1としては振り分け部13aとしての機能を省略しても良い。
【0080】
さらに、前記実施形態の帳票振分装置1の各部11〜18としての機能は、必ずしも1つのCPUにより発揮される必要はなく、複数のCPUにより発揮される構成としても良い。
【0081】
その他、本発明の趣旨に反しない限りにおいて様々な実施形態の変形や組み合わせを行っても構わない。
【符号の説明】
【0082】
X ・・・帳票登録システム
2 ・・・撮像手段
3 ・・・文字認識手段
1 ・・・帳票振分装置
P ・・・帳票
P1 ・・・記入欄
11 ・・・画像データ取得部
12 ・・・テンプレート格納部
13 ・・・比較判断部
13a・・・振り分け部
13b・・・正誤判定部
14 ・・・位置合わせ部
15 ・・・オーバーレイ部
16 ・・・画像切取り部
17 ・・・通信部
18 ・・・記入情報格納部
19 ・・・文字認識部
図1
図2
図3
図4
図5
図6
図7