(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023184100
(43)【公開日】2023-12-28
(54)【発明の名称】帳票認識処理システム、帳票認識処理方法、及び帳票認識処理プログラム
(51)【国際特許分類】
G06V 30/12 20220101AFI20231221BHJP
G06V 30/14 20220101ALI20231221BHJP
【FI】
G06V30/12 C
G06V30/14 340J
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022098039
(22)【出願日】2022-06-17
(71)【出願人】
【識別番号】000001432
【氏名又は名称】グローリー株式会社
(74)【代理人】
【識別番号】110001818
【氏名又は名称】弁理士法人R&C
(72)【発明者】
【氏名】前田 雅史
【テーマコード(参考)】
5B029
5B064
【Fターム(参考)】
5B029AA01
5B029BB02
5B029BB12
5B029BB17
5B029CC26
5B029CC27
5B064AA01
5B064AB02
5B064AB13
5B064BA01
5B064CA08
5B064DA10
5B064EA07
5B064EA17
5B064EA36
(57)【要約】
【課題】帳票に記載された文字の誤認識を検出しやすくする帳票認識処理システム、帳票認識処理方法及び帳票認識処理プログラムを提供すること。
【解決手段】同一の文字が記載された領域である文字領域を複数備える帳票4の認識処理を行う帳票認識処理システム1であって、帳票4の画像を取得する画像取得部と、予め設定された認識条件を用いて画像から文字情報を認識する文字認識部と、を備え、文字認識部は、認識条件としての第1認識条件を用いて文字領域としての第1文字領域から文字情報を認識し、かつ、第1認識条件とは異なる認識条件としての第2認識条件を用いて文字領域としての第2文字領域から文字情報を認識する、帳票認識処理システム。
【選択図】
図1
【特許請求の範囲】
【請求項1】
同一の文字が記載された領域である文字領域を複数備える帳票の認識処理を行う帳票認識処理システムであって、
前記帳票の画像を取得する画像取得部と、
予め設定された認識条件を用いて前記画像から文字情報を認識する文字認識部と、を備え、
前記文字認識部は、前記認識条件としての第1認識条件を用いて前記文字領域としての第1文字領域から文字情報を認識し、かつ、前記第1認識条件とは異なる前記認識条件としての第2認識条件を用いて前記文字領域としての第2文字領域から文字情報を認識する、帳票認識処理システム。
【請求項2】
前記文字認識部によって認識された文字情報を照合する照合部と、
前記第1文字領域から認識された文字情報と前記第2文字領域から認識された文字情報とが一致すると前記照合部が判定したときに前記帳票の処理を行う処理部と、を更に備える請求項1に記載の帳票認識処理システム。
【請求項3】
前記第2認識条件は、前記文字領域における文字の認識領域において前記第1認識条件と異なっている請求項1に記載の帳票認識処理システム。
【請求項4】
前記認識条件を設定可能な設定部と、
2つの前記文字領域に対して同一の前記認識条件が設定されているときに報知する報知部と、をさらに備える請求項1に記載の帳票認識処理システム。
【請求項5】
前記認識条件を設定可能な設定部をさらに備え、
前記設定部は、2つの前記文字領域に対して同一の前記認識条件が設定されることを禁止する請求項1に記載の帳票認識処理システム。
【請求項6】
前記認識条件を設定可能な設定部と、
全ての前記文字領域に対して同一の前記認識条件が設定されているときに報知する報知部と、をさらに備える請求項1に記載の帳票認識処理システム。
【請求項7】
前記認識条件を設定可能な設定部をさらに備え、
前記設定部は、全ての前記文字領域に対して同一の前記認識条件が設定されることを禁止する請求項1に記載の帳票認識処理システム。
【請求項8】
前記帳票の内容を示すサンプル画像から前記文字領域を特定する特定部をさらに備え、
前記設定部は、前記特定部が特定した前記文字領域に対して前記認識条件を設定する請求項4から7のいずれか一項に記載の帳票認識処理システム。
【請求項9】
同一の文字が記載された領域である文字領域としての第1文字領域及び第2文字領域を備える帳票の認識処理をコンピュータが行う帳票認識処理方法であって、
前記帳票の画像を取得する画像取得ステップと、
第1認識条件によって、前記第1文字領域の文字情報を認識し、かつ、前記第1認識条件とは異なる第2認識条件によって、前記第2文字領域の文字情報を認識する文字認識ステップと、を含む帳票認識処理方法。
【請求項10】
コンピュータに実行されることにより、同一の文字が記載された領域である文字領域としての第1文字領域及び第2文字領域を備える帳票の認識処理が行われる帳票認識処理プログラムであって、
前記帳票の画像を取得する画像取得機能と、
第1認識条件によって、前記第1文字領域の文字情報を認識し、かつ、前記第1認識条件とは異なる第2認識条件によって、前記第2文字領域の文字情報を認識する文字認識機能と、をコンピュータに実現させる帳票認識処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票認識処理システム、帳票認識処理方法、及び帳票認識処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、金融機関等に設置される自動取引装置が記載されている。この自動取引装置は、納付書や請求書等の記載内容を文字認識して税金や公共料金等の払込取引を行う。
【0003】
特許文献2には、紙葉類に記載された文字の認識を行う装置が記載されている。特許文献2のビデオコーディングシステムは、複数の認識部を備える。第2の認識部は、第1の認識部によって文字認識できなかった紙葉類の区分情報に対して、第1の認識部と異なるアルゴリズムで文字認識を行う。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2018-197996号公報
【特許文献2】特開2010-009410号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
自動取引装置が取り扱う帳票には、納付者の氏名や納付金額等を示す文字列が印字される。印字の際の不具合で、文字列の掠れや位置ずれが生じる場合がある。ここで自動取引装置において文字認識できない旨のエラーが生じた場合は、帳票の処理は実行できない。したがって、帳票に対する誤った処理は実行されない。しかし、印字内容と異なる文字を認識してしまった場合、例えば数字の「8」を「9」と認識する誤認識や、「¥8200」を「¥820」と認識する誤認識が発生した場合、帳票の真の記載内容とは異なる誤った処理が実行されてしまう可能性がある。
【0006】
特許文献2の技術では、第1の認識部で文字認識できなかった場合に第2の認識部が重ねて文字認識を行うことで認識率(認識の成功率)を高めることができる。しかし、文字の誤認識が生じた場合、誤った内容であっても認識には「成功」してしまっているので、第2の認識部の処理は行わない。従って特許文献2の技術では上記の問題を解決することはできない。
【0007】
本発明の目的は、帳票に記載された文字の誤認識を検出しやすくする帳票認識処理システム、帳票認識処理方法及び帳票認識処理プログラムを提供することにある。
【課題を解決するための手段】
【0008】
本発明に係る帳票認識処理システムの特徴は、同一の文字が記載された領域である文字領域を複数備える帳票の認識処理を行う帳票認識処理システムであって、前記帳票の画像を取得する画像取得部と、予め設定された認識条件を用いて前記画像から文字情報を認識する文字認識部と、を備え、前記文字認識部は、前記認識条件としての第1認識条件を用いて前記文字領域としての第1文字領域から文字情報を認識し、かつ、前記第1認識条件とは異なる前記認識条件としての第2認識条件を用いて前記文字領域としての第2文字領域から文字情報を認識する点にある。
【0009】
本発明に係る帳票認識処理方法の特徴は、同一の文字が記載された領域である文字領域としての第1文字領域及び第2文字領域を備える帳票の認識処理をコンピュータが行う帳票認識処理方法であって、前記帳票の画像を取得する画像取得ステップと、第1認識条件によって、前記第1文字領域の文字情報を認識し、かつ、前記第1認識条件とは異なる第2認識条件によって、前記第2文字領域の文字情報を認識する文字認識ステップと、を含む点にある。
【0010】
本発明に係る帳票認識処理プログラムの特徴は、コンピュータに実行されることにより、同一の文字が記載された領域である文字領域としての第1文字領域及び第2文字領域を備える帳票の認識処理が行われる帳票認識処理プログラムであって、前記帳票の画像を取得する画像取得機能と、第1認識条件によって、前記第1文字領域の文字情報を認識し、かつ、前記第1認識条件とは異なる第2認識条件によって、前記第2文字領域の文字情報を認識する文字認識機能と、をコンピュータに実現させる点にある。
【0011】
帳票に同一の文字列が複数の箇所に記載される場合がある。例えば、1つの帳票には納入済通知書、納付書、及び領収書の部分があり、それぞれに納付者の氏名と金額とが記載される。発明者らはこの点に注目して鋭意検討し、本発明を想到するに至った。本構成によると、同一の文字が記載された複数の文字領域に対して互いに異なる認識条件にて文字認識処理を実行するように構成される。これにより、文字情報の誤認識が発生した場合であっても、文字領域毎の認識結果が同じになることを抑制することができる。したがって、例えば、複数の文字領域に対して同一の認識条件にて文字認識処理を実行するような構成と比較して、文字領域に記載された文字情報の誤認識を検出しやすくなる。
【0012】
本発明においては、前記文字認識部によって認識された文字情報を照合する照合部と、前記第1文字領域から認識された文字情報と前記第2文字領域から認識された文字情報とが一致すると前記照合部が判定したときに前記帳票の処理を行う処理部と、を更に備えると好適である。
【0013】
本構成によると、文字情報を照合することで、文字情報の誤認識が発生した場合に、文字領域に記載された文字情報の誤認識を検出しやすくなる。
【0014】
本発明においては、前記第2認識条件は、前記文字領域における文字の認識領域において前記第1認識条件と異なっていると好適である。
【0015】
印字の際の用紙ズレ等により、複数の文字領域の文字が同じように標準の位置からズレて印字される場合がある。このような場合に、文字領域における文字の認識領域が同じであると、複数の文字領域の文字に対して同じように誤認識を生じる可能性がある。例えば、複数の文字領域の全てで「¥8200」を「¥820」と誤認識してしまう。本構成によると、複数の文字領域に対して互いに異なる認識領域にて文字認識処理を実行するように構成される。これにより、複数の文字領域に対して同じ誤認識が生じることを抑制でき、文字情報の誤認識を検出しやすくすることができる。
【0016】
本発明においては、前記認識条件を設定可能な設定部と、2つの前記文字領域に対して同一の前記認識条件が設定されているときに報知する報知部と、をさらに備えると好適である。
【0017】
本構成によると、認識条件を設定する際に、2つの文字領域に対して同一の認識条件が設定されているときに報知が行われる。これにより、不注意で2つの文字領域に対して同一の認識条件が設定されてしまうことを抑制できる。したがって、文字情報の誤認識を検出しやすくすることができる。
【0018】
本発明においては、前記認識条件を設定可能な設定部をさらに備え、前記設定部は、2つの前記文字領域に対して同一の前記認識条件が設定されることを禁止すると好適である。
【0019】
本構成によると、認識条件を設定する際に、2つの文字領域に対して同一の認識条件を設定することができなくなる。これにより、2つの文字領域に対して同一の認識条件が設定されてしまうことを防止できる。したがって、文字情報の誤認識を検出しやすくすることができる。
【0020】
本発明においては、前記認識条件を設定可能な設定部と、全ての前記文字領域に対して同一の前記認識条件が設定されているときに報知する報知部と、をさらに備えると好適である。
【0021】
本構成によると、全ての文字領域に対して同一の認識条件が設定されているときに報知が行われる。これにより、全ての文字領域に対して同一の認識条件が設定されてしまうことを抑制できる。したがって、文字情報の誤認識を検出しやすくすることができる。
【0022】
本発明においては、前記認識条件を設定可能な設定部をさらに備え、前記設定部は、全ての前記文字領域に対して同一の前記認識条件が設定されることを禁止すると好適である。
【0023】
本構成によると、全ての文字領域に対して同一の認識条件を設定することができなくなる。これにより、全ての文字領域に対して同一の認識条件が設定されてしまうことを防止できる。したがって、文字情報の誤認識を検出しやすくすることができる。
【0024】
本発明においては、前記帳票の内容を示すサンプル画像から前記文字領域を特定する特定部をさらに備え、前記設定部は、前記特定部が特定した前記文字領域に対して前記認識条件を設定する。
【0025】
本構成によると、文字領域の特定が適切に行われ好ましい。
【図面の簡単な説明】
【0026】
【
図1】帳票認識処理システムの概要を示す図である。
【
図3】帳票認識処理装置及び管理装置の構成を示す機能ブロック図である。
【
図4】帳票認識処理装置の構成を示す断面図である。
【
図5】管理装置で行われる処理手順を示すフローチャートである。
【
図8】帳票認識処理装置で行われる処理手順を示すフローチャートである。
【
図10】文字情報の照合結果の一例を示す図である。
【
図11】別実施形態における文字情報の認識処理の別の一例を示す図である。
【
図12】別実施形態における文字情報の認識処理の別の一例を示す図である。
【
図13】別実施形態における文字情報の認識処理の別の一例を示す図である。
【発明を実施するための形態】
【0027】
以下、帳票認識処理システムについて図面に基づいて説明する。帳票認識処理システムは、帳票の文字認識処理に用いられるシステムである。
図1に示すように、帳票認識処理システム1は、帳票認識処理装置2と、管理装置3と、を備える。
【0028】
帳票認識処理装置2は、納付者から税金や公共料金等の支払いを受け付けるための装置であって、公共施設や金融機関などに設置される。帳票認識処理装置2は、受け付けた帳票4に対して文字認識処理を行い、認識された文字に基づいて支払い等の処理を実行する。
【0029】
帳票4は、定型の文字や枠線が印刷された用紙に、宛名や金額、日付等の個別情報が印字されて、作成される。個別情報の印字の際に用紙の位置ずれや傾き等が発生すると、個別情報が所定の位置からズレて印字される場合がある。帳票4には同一の文字が複数印字される場合がある。図示例では、納付額としての「890」の文字が3箇所に印字されている。上述の印字ズレが発生した場合、3箇所の「890」の文字は同じ方向、例えば、用紙の右へズレた位置へ印字される。右端の「0」の文字が文字認識処理の対象領域の外に位置した場合、印字された「890」の文字に対して、文字認識処理の結果が「89」となってしまう。
【0030】
ここで、3箇所の「890」の文字に対する文字認識処理の認識条件が同一であった場合、文字認識処理の結果が3箇所とも「89」となる可能性がある。そうすると、たとえ3箇所の文字認識処理の結果を互いに照合するように帳票認識処理装置2が構成されていたとしても、3箇所の結果は「89」で一致するため、帳票認識処理装置2が異常を発見することができない。そうすると、誤った認識結果の「89」にて支払いの処理が実行される可能性がある。
【0031】
本実施形態では、帳票認識処理装置2は、同一の文字が記載された複数の文字領域に対して互いに異なる認識条件にて文字認識処理を実行するように構成される。これにより、ある文字領域からの認識結果が「89」となったとしても、他の文字領域に対する認識条件が比較的広く設定され、そこからの認識結果が「890」となれば、帳票認識処理装置2が異常を発見できる可能性がある。このように、本実施形態の帳票認識処理システム1は、印字ズレへの対処において利点を有する。
【0032】
管理装置3は、帳票認識処理装置2において文字認識処理に用いられる認識条件Rを予め設定するための装置である。管理装置3は、同一の文字が記載された文字領域に対する認識条件Rが互いに異なったものとなるように、認識条件Rを設定する。
【0033】
〔帳票〕
帳票4の例が
図2に示されている。帳票4には、上述の通り、予め印刷された「納入済通知書」や「納期限」等の定型の文字や枠線等と、個別に印字される納期限「2018年02月28日」や納付額「890」等の文字(以下「文字列9」と称する。)と、が記載されている。
【0034】
本実施形態では、同一の文字が記載された領域を「文字領域」と称し、符号「41」を付す。図示例では、帳票4は、同一の文字「890」が記載された3つの文字領域41として、左寄りの左側文字領域41a、中央の中央文字領域41b、及び右寄りの右側文字領域41cを有する。
【0035】
帳票4は、
図2に示されるように、枠線42と、領収印が押印される押印領域43と、切り離し線44と、を有する。
【0036】
図2には、文字列9が通常の位置(印字ズレを生じていない場合の正規の位置)にある状態が示されている。図示例では、文字列9が枠線42の内側に位置している。上述した印字ズレ等により、文字列9が通常の位置から上下左右にズレて記載されることがある。ズレが大きい場合、文字列9の一部が枠線42の外に位置する場合がある。この意味で、文字領域41は枠線42の内側に限られず、外側に及ぶ場合がある。
【0037】
〔管理装置〕
管理装置3は、例えばパソコンであり、図示しないCPU及びメモリを備える。メモリに記憶されたプログラムが実行されて、以下述べる各機能部の機能が実現される。
【0038】
管理装置3は、
図3に示すように、画像取得部31と、特定部32と、設定部33と、報知部34と、記憶部35と、通信部36と、表示部37と、を備える。管理装置3は、帳票認識処理装置2に対して遠隔地に設けられてもよいし、帳票認識処理装置2と同じ建物に設けられてもよい。本実施形態においては、管理装置3は、メーカ(製造会社)やディーラ(販売及び保守会社)に設けられている。
【0039】
画像取得部31は、サンプル画像5aを取得する。サンプル画像5aは、例えば、カメラやドキュメントスキャナから取得してもよいし、他の機器から有線通信または無線通信を介して取得してもよい。
【0040】
特定部32は、サンプル画像5aから文字領域41を特定する。文字領域41の特定は、管理装置3が受け付けた人為操作に基づいて行われてもよいし、画像処理等の手法により人為操作に基づかず自動的に行われてもよいし、これらの手法が混合して用いられてもよい。
【0041】
設定部33は、文字領域41に対して認識条件Rを設定する。認識条件Rは、帳票4の文字認識処理に用いられる認識条件である。本実施形態において、認識条件Rは、文字領域41における文字の認識領域である。認識条件Rの設定は、管理装置3が受け付けた人為操作に基づいて行われてもよいし、人為操作に基づかず自動的に行われてもよい。
【0042】
本実施形態において、設定部33は、左側文字領域41aに対して左側認識条件Raを設定する。また、設定部33は、中央文字領域41bに対して中央認識条件Rbを設定する。設定部33は、右側文字領域41cに対して右側認識条件Rcを設定する。これに限らず、帳票4が四つ以上の文字領域41を有する場合は、設定部33は、四つ以上の認識条件Rを設定してもよい。
【0043】
報知部34は、表示部37にメッセージを表示する。これに限らず、報知部34は、メッセージを送信したり、音声や発光で報知してもよい。本実施形態では、報知部34は、2つの文字領域41に対して同一の認識条件Rが設定されているときに、報知を行うよう構成されている。報知部34が、全ての文字領域41に対して同一の認識条件Rが設定されているときに、報知を行うよう構成されてもよい。
【0044】
記憶部35は、サンプルデータ6を記憶する。本実施形態において、記憶部35は、HDDやROM、不揮発性メモリなどの記憶デバイスである。サンプルデータ6は、サンプル画像5aと、サンプル画像5aに紐づけられた文字領域41の位置情報と、認識条件Rと、を有する。
【0045】
通信部36は、インターネット回線などの情報通信網を介して帳票認識処理装置2の通信部29と通信可能である。
【0046】
表示部37は、文字情報を表示可能な装置であり、例えば液晶ディスプレイである。
【0047】
管理装置3が、人為操作を受け付ける入力装置(例えば、キーボードやマウス)を備えてもよい。
【0048】
〔帳票認識処理装置〕
帳票認識処理装置2は、
図3、
図4に示すように、取込部21と、表示部22と、搬送機構23と、撮像装置24と、制御部25と、入出金部26と、収納部27と、排出部28と、通信部29と、を備える。
【0049】
取込部21は、納付者からの帳票4の挿入を受け付ける装置である。
【0050】
表示部22は、利用者に対する情報を表示するとともに利用者からの操作・入力を受け付ける。本実施形態においては、タッチパネル式液晶モニタである。
【0051】
搬送機構23は、
図4に示されるように、ベルト23aと、複数のローラ23bと、カッタ23cと、押印部23dと、ベルト23a及びローラ23bを駆動するモータ(図示なし)と、を備えている。搬送機構23は、取込部21と接続されている。取込部21から取り込まれた帳票4は、搬送機構23によって1枚ずつ搬送される。
【0052】
押印部23dは、帳票4の納付額の支払いが完了すると、領収印を帳票4の押印領域43に押印する。帳票4は、搬送機構23によって上流側へ戻され、カッタ23cが帳票4から領収書を切り離す。
【0053】
領収書が切り離された帳票4は、収納部27に搬送されて収納される。排出部28は、不受理とされた帳票4や領収書を排出する。
【0054】
撮像装置24は、搬送機構23上に位置する帳票4を撮像する。撮像装置24は、例えばカメラやドキュメントスキャナである。
【0055】
〔制御部〕
制御部25は、帳票認識処理装置2全体を制御するCPU(Central Processing Unit)である。制御部25は、画像取得部25aと、文字認識部25bと、照合部25cと、報知部25dと、処理部25eと、記憶部25fと、を備える。メモリ(図示省略)に記憶されたプログラムが実行されることにより、上述した各機能部の機能が実現される。
【0056】
画像取得部25aは、撮像装置24で撮像された帳票4の画像4aを取得する。すなわち制御部25は、画像取得機能を有する。画像4aは、例えば、ドキュメントスキャナから取得してもよいし、他の機器から有線通信または無線通信を介して取得してもよい。
【0057】
文字認識部25bは、画像4aから文字情報を認識する。具体的には、文字認識部25bは、左側認識条件Raによって、左側文字領域41aの文字情報を認識し、かつ、左側認識条件Raとは異なる中央認識条件Rbによって、中央文字領域41bの文字情報を認識し、右側認識条件Rcによって、右側文字領域41cの文字情報を認識する。すなわち制御部25は、文字認識機能を有する。
【0058】
文字認識部25bは、OCR(Optical Character Reader)によって、画像4aから文字情報を認識する。
【0059】
照合部25cは、文字認識部25bによって認識された文字情報を照合する。処理部25eは、照合された文字情報が一致したときに帳票4の処理を行う。
【0060】
報知部25dは、利用者に報知を行う。
【0061】
記憶部25fは、文字認識結果を画像4aと紐づけて記憶する。記憶部25fは、例えば、HDDやROM、不揮発性メモリなどで構成される。
【0062】
入出金部26は、利用者からの紙幣・硬貨の投入を受け入れて、利用者に対する釣銭の払い出しを行う。
【0063】
通信部29は、インターネット回線などの情報通信網を介して管理装置3の通信部36と通信可能である。
【0064】
〔管理装置の処理〕
管理装置3の処理手順について説明する。
図5は、管理装置3の処理手順を示すフローチャートである。画像取得部31によってサンプル画像5aを取得する(ステップS101)と、特定部32が、サンプル画像5aから文字領域41を特定する(ステップS102)。特定部32は、サンプル画像5aから左側文字領域41a、中央文字領域41b及び右側文字領域41cの位置を特定する。文字領域41の帳票4全体における位置情報は、サンプルデータ6に記憶される。
【0065】
設定部33は、複数の文字領域41に対して、それぞれ認識条件Rを設定する(ステップS103)。なお、認識条件Rの設定の詳細については後述する。
【0066】
報知部34は、少なくとも2つの文字領域41に対して同一の認識条件Rが設定されているときに(ステップS104;Yes)、設定者にその旨を報知する(ステップS105)これにより、認識条件Rを修正するように促すことができる。具体的には、報知部34が表示部37に複数の文字領域41に対する認識条件Rが同一である旨を表示する。
【0067】
認識条件Rが修正されて、全ての文字領域41に対する認識条件Rが異なるものとなった場合(ステップS104;No)、管理装置3は、サンプルデータ6を生成する(ステップS106)。設定された認識条件Rは、サンプルデータ6に含まれる状態で、記憶部35に記憶される。通信部36は、サンプルデータ6を帳票認識処理装置2に送信して(ステップS107)処理を終了する。
【0068】
〔認識条件の設定について〕
図6、
図7は、管理装置3において設定される認識条件Rの設定の一例を示している。
図6に示すように、本実施形態においては、サンプル画像5aの文字領域41に文字列9は印字されていないものとする。これに限らず、サンプル画像5aの文字領域41に文字列9が印字されていてもよい。
【0069】
図6、
図7に示すように、認識条件Rは、枠線42a、枠線42b及び枠線42cを基準とする文字の認識領域の相対位置である。左右方向をX軸方向(右が+)、上下方向をY軸方向(上が+)とする。認識条件Rは、第1座標#1と第2座標#2を結ぶ直線を対角線とする矩形で表される。第1座標#1は、矩形の左上角の座標である。第2座標#2は、矩形の左下角の座標である。第1座標#1は、枠線42a、枠線42b及び枠線42cの左上角の座標を原点とした相対位置を表す。第2座標#2は、枠線42a、枠線42b及び枠線42cの右下角の座標を原点とした相対位置を表す。
【0070】
図6に示すように、左側認識条件Raは、枠線42aを基準として第1座標#1及び第2座標#2の位置で表すものとする。中央認識条件Rbは、枠線42bを基準として第1座標#1及び第2座標#2の位置で表すものとする。右側認識条件Rcは、枠線42cを基準として第1座標#1及び第2座標#2の位置で表すものとする。
【0071】
図7は、認識条件Rの設定結果の一例を示している。
図7(a)は、
図6(a)の認識条件Rを示している。X1、Y1、X2、Y2の値は例えば、ピクセル(pixel)で表すものとする。
図6(a)において、左側認識条件Ra、中央認識条件Rb及び右側認識条件Rcは、枠線42a、枠線42b及び枠線42cと一致するように設定されている。したがって、
図7(a)に示すように、左側認識条件Ra、中央認識条件Rb及び右側認識条件Rcは、第1座標#1(X1、Y1)及び第2座標#2(X2、Y2)が全て「±0」となる。この例では、左側認識条件Ra、中央認識条件Rb及び右側認識条件Rcが同一である。
【0072】
図7(b)は、
図6(b)の認識条件Rを示している。
図6(b)において、中央認識条件Rbは、枠線42bと一致するように設定されている。左側認識条件Ra及び右側認識条件Rcは、枠線42a及び枠線42cと一致しないように設定されている。具体的には、
図7(b)に示すように、中央認識条件Rbは、第1座標#1(X1、Y1)及び第2座標#2(X2、Y2)は、全て「±0」となる。
【0073】
左側認識条件Raの第1座標#1(X1、Y1)は、枠線42aの左上の角から-X方向及び+Y方向に偏倚している。したがって、左側認識条件Raの第1座標#1(X1、Y1)は、(-10,+20)で表される。また、左側認識条件Raの第2座標#2(X2、Y2)は、枠線42aの右下の角から+X方向に偏倚している。したがって、左側認識条件Raの第2座標#2(X2、Y2)は、(+10,±0)で表される。
【0074】
右側認識条件Rcの第1座標#1(X1、Y1)は、枠線42cの左上の角と一致する。したがって、右側認識条件Rcの第1座標#1(X1、Y1)を(±0,±0)で表される。また、右側認識条件Rcの第2座標#2(X2、Y2)は、枠線42cの右下の角から+X方向に偏倚している。したがって、右側認識条件Rcの第2座標#2(X2、Y2)は、(+20,±0)で表される。
【0075】
図6(b)及び
図7(b)の例において、左側認識条件Ra、中央認識条件Rb及び右側認識条件Rcは、互いに相違する。
【0076】
〔帳票認識処理装置の処理〕
次に帳票認識処理装置2の処理手順について説明する。
図8は、帳票認識処理装置2の処理手順を示すフローチャートである。通信部29は、管理装置3から、サンプルデータ6を取得し、記憶部25fに記憶する。取込部21が帳票4を取り込むと(ステップS201)、撮像装置24が帳票4を撮像する。
【0077】
画像取得部25aによって、帳票4の画像4aを取得する画像取得ステップ(ステップS202)を含む。画像4aは、サンプル画像5aと照合されて、サンプル画像5aと紐づいた認識条件Rが呼び出される。例えば、画像4aとサンプル画像5aとの照合には、テンプレートマッチング法などが用いられる。なお、画像4aと一致するサンプル画像5aがないと判断された場合は、帳票4は、不受理とされる。不受理とされた帳票4は、排出部28から排出される。
【0078】
文字認識部25bは、取得した画像4aとサンプルデータ6から予め設定された認識条件Rを読み込む(ステップS203)。文字認識部25bは、予め設定された認識条件Rを用いて画像4aから文字情報を認識する(ステップS204)。具体的には、左側認識条件Raによって、左側文字領域41aの文字情報を認識し、かつ、左側認識条件Raとは異なる中央認識条件Rbによって、中央文字領域41bの文字情報を認識し、右側認識条件Rcによって、右側文字領域41cの文字情報を認識する文字認識ステップを含む。
【0079】
なお、ステップS204において、文字認識部25bは、文字領域41の文字情報の認識の他に、帳票4全体の文字情報の認識をしてもよい。また、左側文字領域41aの文字情報の認識処理と中央文字領域41bの文字情報の認識処理とは、同時に行ってもよいし、それぞれ順番に行ってもよい。
【0080】
照合部25cは、文字認識部25bによって認識された文字情報が一致するかを照合する(ステップS205)。具体的には、照合部25cは、左側文字領域41aから認識された文字情報と中央文字領域41bから認識された文字情報と右側文字領域41cから認識された文字情報とが一致するかを照合する(照合ステップ)。これに限らず、照合部25cは、少なくとも複数の文字領域41に記載された文字情報を照合するものであればよい。例えば、照合部25cは、左側文字領域41aから認識された文字情報と中央文字領域41bから認識された文字情報のみを照合してもよい。文字情報の照合の詳細については後述する。
【0081】
処理部25eは、照合部25cによる文字情報が一致するとの判定(ステップS206;Yes)を受けて、帳票4の処理を行う(ステップS207)。具体的には、処理部25eは、納付額を確定して納付額の支払いを開始する。帳票4の納付額の支払いが完了すると、押印部23dは、領収印を帳票4の押印領域43に押印する。
【0082】
押印された帳票4は、搬送機構23によって上流側へ戻され、カッタ23cが帳票4から領収書を切り離す。領収書が切り離された帳票4は、収納部27に搬送されて収納される。排出部28は、領収書を排出する。
【0083】
文字情報が不一致であると判定された場合(ステップS206;No)、報知部25dが報知を行う(ステップS208)。本実施形態において、報知部25dは、表示部22にメッセージを表示させる。例えば、表示部22は、「この帳票の支払いは窓口で行ってください。」などのメッセージを表示する。これに限らず、報知部25dは、窓口担当者にメッセージを有線通信または無線通信を介して送信したり、音声や発光で報知してもよい。この場合、処理部25eは、帳票4を処理せずに、帳票4を排出部28から排出させる。
【0084】
文字認識結果は、帳票データ7として記憶部25fに記憶される。なお、通信部29が帳票データ7を管理装置3に送信するように構成されてもよい。
【0085】
〔文字情報の認識処理について〕
図9は、帳票認識処理装置2において行われる文字情報の認識処理の一例を示している。図示例では、納付額を示す「¥8200」の文字が、右端部が枠線42a、枠線42b、枠線42cの外側にはみ出す状態で印字されている。
【0086】
図9(a)は、左側認識条件Ra、中央認識条件Rb及び右側認識条件Rcが同じである場合を示す。具体的には、左側認識条件Ra、中央認識条件Rb及び右側認識条件Rcは、枠線42a、枠線42b、枠線42cと一致する位置に文字の認識領域が設定されている。
【0087】
図9(b)は、左側認識条件Ra、中央認識条件Rb及び右側認識条件Rcが異なっている場合を示す。具体的には、中央認識条件Rbは、枠線42bと重なる位置に認識領域が設定されている。左側認識条件Ra及び右側認識条件Rcは、枠線42a及び枠線42cを基準として、X軸方向及びY軸方向に偏倚した位置に設定されている。
【0088】
図10は、帳票認識処理装置2において行われる文字情報の照合処理の一例を示している。
図10(a)は、
図9(a)の文字認識結果及び照合結果を示している。帳票4に印字されていた文字は、「¥8200」である。一方、左側文字領域41a、中央文字領域41b及び右側文字領域41cから認識された文字は「¥820」である。枠線42a、42b、42cの外に位置した「0」の文字が認識されていない。この場合、照合部25cは、文字情報が「¥820」で一致すると判定する。したがって、処理部25eは、「¥820」という誤った納付額(帳票4に印字された金額と異なる金額)で帳票4を処理してしまう。
【0089】
図10(b)は、
図9(b)の文字認識結果及び照合結果を示している。左側文字領域41a及び右側文字領域41cから認識された文字情報は、「¥8200」である。中央文字領域41bから認識された文字情報は「¥820」である。この場合、照合部25cは、文字情報が不一致であると判定する。したがって、文字情報の誤認識を検出することができ、処理部25eは、誤った納付額で帳票4を処理することを防止することができる。
【0090】
特許請求の範囲に記載された「第1認識条件」及び「第2認識条件」は、実施形態における左側認識条件Ra、中央認識条件Rb、及び右側認識条件Rcのうちの任意の2つである。特許請求の範囲に記載された「第1文字領域」及び「第2文字領域」は、実施形態における左側文字領域41a、中央文字領域41b、及び右側文字領域41cのうちの「第1認識条件」及び「第2認識条件」に対応する2つである。例えば、中央認識条件Rb及び右側認識条件Rcが「第1認識条件」及び「第2認識条件」に対応する場合、中央文字領域41b及び右側文字領域41cが「第1文字領域」及び「第2文字領域」に対応する。
【0091】
〔別実施形態〕
(1)上述の例では、報知部34が、2つの(又は全ての)文字領域41に対して同一の認識条件Rが設定されているときに、報知を行うよう構成されている。同一の認識条件Rの設定を避けるために、他の手段が採用されてもよい。例えば、設定部33が、2つの(又は全ての)文字領域41に対して同一の認識条件Rが設定されることを禁止するように構成されてもよい。認識条件Rの設定が人為操作に基づいて行われる場合には、設定部33が、2つの(又は全ての)文字領域41に対して同一の認識条件Rを設定する人為操作を受け付けたときに、操作の受容の拒否や、設定完了の禁止を行うように構成されてもよい。
【0092】
(2)帳票認識処理装置2が、文字の誤認識の可能性が高い場合に報知を行うよう構成されてもよい。例えば、
図11に示すように、報知部25dが、文字認識部25bが文字認識を行った際に、余白aが、文字の幅cの一文字分の幅bよりも小さい場合に報知するよう構成されてもよい。報知部25dは、表示部22に利用者に対するメッセージを表示する。具体的には、報知部25dは、誤認識の恐れがある旨及び窓口で処理を行う旨のメッセージを表示部22に表示させる。報知部25dが、窓口担当者にメッセージを有線通信または無線通信を介して送信したり、音声や発光で報知してもよい。
【0093】
また、複数の文字領域41において、余白aが、文字の幅cの一文字分の幅bよりも小さい場合に、報知部25dが報知するよう構成されてもよい。単一の文字領域41において余白aが文字の幅cの一文字分の幅bよりも小さい場合には、報知部25dは報知しない。例えば、左側文字領域41a及び中央文字領域41bにおいて、余白aが、文字の幅cの一文字分の幅bよりも小さい場合に、報知部25dは報知を行う。これにより、単一の文字領域41の余白aが、文字の幅cの一文字分の幅bよりも小さい場合に報知する構成と比較して、帳票4の誤認識の可能性が高い場合にのみ報知を行うことできる。したがって、帳票4の誤認識を検出しやすくし、かつ、報知部25dによる報知が頻発することを抑制できる。
【0094】
(3)上述の例では、認識条件Rが、枠線42を基準とする認識範囲の相対位置において異なる。認識条件Rが他の点で異なってもよい。例えば、認識条件Rが、文字認識の方式において異なってもよい。例えば、1つの認識条件Rの文字認識方式がAIを用いたOCRであり、他の認識条件Rの文字認識方式が非AIのOCRであってもよい。
【0095】
(4)認識条件Rは、文字領域41における文字の認識領域であり、中央認識条件Rbは、左側文字領域41aまたは右側文字領域41cにおける文字の認識領域の大きさが異なるものでもよい。認識条件Rが、文字の認識領域の大きさにおいて異なってもよい。
【0096】
(5)認識条件Rは、
図12に示すように、文字領域41における文字を認識する区分が上述の例と異なる形態であってもよい。図示例では、左側認識条件Raは、左側文字領域41aの文字情報全体を一つの区分で認識する。中央認識条件Rbは、中央文字領域41bの文字情報を一文字ずつの区分で認識する。右側認識条件Rcは、右側文字領域41cの文字情報をカンマ毎に区分して認識する。
【0097】
(6)認識条件Rは、
図13に示すように、文字列9の通常位置(正常に印字された位置)を基準として設定されてもよい。図示例では、左側認識条件Raにおける文字列9を基準とした領域の範囲d1、d2、d3、d4は、中央認識条件Rbにおける文字列9を基準とした領域の範囲e1、e2、e3、e4及び右側認識条件Rcにおける文字列9を基準とした領域の範囲f1、f2、f3、f4と異なる。
【0098】
(7)特定部32が帳票認識処理装置2に設けられてもよい。
【0099】
(8)本実施形態において、認識条件Rは、第1座標#1(X1、Y1)と第2座標#2(X2、Y2)を結ぶ直線を対角線とする矩形で表される。これに限らず、文字領域41の文字の認識領域は任意の形状が可能である。
【0100】
(9)本実施形態においては、文字領域41は、納付額が記載された領域である。これに限らず、文字領域41は、納付者、延滞金、納期限、合計納付金額などが記載された領域でもよい。
【産業上の利用可能性】
【0101】
以上のように本発明に係る帳票認識処理システム、帳票認識処理方法、帳票認識処理プログラムは、帳票の誤認識を検出しやすくする場合に適している。
【符号の説明】
【0102】
1 :帳票認識処理システム
2 :帳票認識処理装置
3 :管理装置
4 :帳票
4a :画像
5a :サンプル画像
25a :画像取得部
25b :文字認識部
25c :照合部
25e :処理部
32 :特定部
33 :設定部
34 :報知部
41 :文字領域
41a :左側文字領域(第1文字領域、第2文字領域)
41b :中央文字領域(第1文字領域、第2文字領域)
41c :右側文字領域(第1文字領域、第2文字領域)
R :認識条件
Ra :左側認識条件(第1認識条件、第2認識条件)
Rb :中央認識条件(第1認識条件、第2認識条件)
Rc :右側認識条件(第1認識条件、第2認識条件)