(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-01-12
(45)【発行日】2023-01-20
(54)【発明の名称】文字読取装置及び文字読取装置用プログラム
(51)【国際特許分類】
G06V 30/146 20220101AFI20230113BHJP
【FI】
G06V30/146
(21)【出願番号】P 2019094481
(22)【出願日】2019-05-20
【審査請求日】2021-11-15
(73)【特許権者】
【識別番号】596153368
【氏名又は名称】京都電子計算株式会社
(74)【代理人】
【識別番号】100121441
【氏名又は名称】西村 竜平
(74)【代理人】
【識別番号】100154704
【氏名又は名称】齊藤 真大
(74)【代理人】
【識別番号】100129702
【氏名又は名称】上村 喜永
(72)【発明者】
【氏名】村山 周
(72)【発明者】
【氏名】徳田 壮秀
(72)【発明者】
【氏名】岡本 照範
(72)【発明者】
【氏名】竹内 有一
【審査官】小池 正彦
(56)【参考文献】
【文献】特開平08-190610(JP,A)
【文献】特開2012-008791(JP,A)
【文献】特開平07-282256(JP,A)
【文献】特開2001-229341(JP,A)
【文献】特開2011-210076(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/146
G06V 30/412
(57)【特許請求の範囲】
【請求項1】
紙面の押印領域に押印された実印影に含まれる文字を読み取る文字読取装置であって、
前記実印影の一部を含む基準印影を、予め前記押印領域に付した基準紙面の画像データである基準画像データを格納する基準画像格納部と、
前記実印影が押印された押印済み紙面の画像データである押印済画像データから、前記押印領域の画像データである実印影画像データを抽出する印影抽出部と、
前記基準画像データにおける基準印影の情報に基づき、前記実印影画像データを所定の向き及び所定の位置に回転補正及び位置補正する補正部とを備えることを特徴とする文字読取装置。
【請求項2】
前記補正部により回転補正及び位置補正された前記実印影画像データの前記押印領域における向き及び位置が、前記基準印影の前記押印領域における向き及び位置と一致していることを特徴とする請求項1記載の文字読取装置。
【請求項3】
前記実印影が、可変な文字を含むものであり、
前記基準印影が、前記実印影から少なくとも前記可変な文字を除いたものであることを特徴とする請求項1又は2記載の文字読取装置。
【請求項4】
前記基準印影が、前記実印影の線分を複数含むものであり、
前記補正部が、前記基準印影に含まれる線分上の複数の基準点に基づいて、前記実印影画像データを回転補正及び位置補正することを特徴とする請求項1乃至3のうち何れか一項に記載の文字読取装置。
【請求項5】
前記基準印影が、前記実印影に含まれる特徴シンボルを含むものであり、
前記補正部が、前記基準印影に含まれる前記特徴シンボル上の基準点に基づいて、前記実印影画像データを回転補正及び位置補正することを特徴とする請求項1乃至4のうち何れか一項に記載の文字読取装置。
【請求項6】
前記押印済画像データにおける複数の特徴点の座標を、前記基準画像データにおける複数の特徴点の座標に位置合わせする位置合わせ部をさらに備えることを特徴とする請求項1乃至5のうち何れか一項に記載の文字読取装置。
【請求項7】
紙面の押印領域に押印された実印影に含まれる文字を読み取る文字読取装置に用いられるプログラムであって、
前記実印影の一部を含む基準印影を、予め前記押印領域に付した基準紙面の画像データである基準画像データを格納する基準画像格納部と、
前記実印影が押印された押印済み紙面の画像データである押印済画像データから、前記押印領域の画像データである実印影画像データを抽出する印影抽出部と、
前記基準画像データにおける基準印影の情報に基づき、前記実印影画像データを所定の向き及び所定の位置に回転補正及び位置補正する補正部としての機能をコンピュータに発揮させることを特徴とする文字読取装置用プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、印影に含まれる日付等の文字を読み取る文字読取装置及びこの装置に用いられるプログラムに関するものである。
【背景技術】
【0002】
近時、例えば帳票に記載された情報を電子化して管理する際、記載された文字をOCR等の文字認識手段によって読み取り、その読取結果を登録するなどして管理する情報管理システムが用いられている。
【0003】
かかるシステムでは、帳票の文字が記載される領域を予め読取領域として設定しておくことで、その読取領域に記載された文字が文字認識されるように構成されている。
【0004】
ところで、例えば帳票に押印された受付印の日付など、印影に含まれる文字を文字認識しようとする場合、押印される枠は予め定められているものの、印影の向きがばらばらであることから、日付等の文字に対応させて読取領域を設定することができない。
【0005】
特許文献1に示す文字読取装置は、印影の傾きを検出し、その傾きに基づいて印影が正立姿勢となるように、イメージデータをスキュー補正してから、文字認識を行うように構成されている。
【0006】
しかしながら、印影のイメージデータを正立姿勢にスキュー補正したとしても、実際の枠内における印影の位置はばらばらであり、結局のところ、枠内のどの領域を読取領域として設定すれば良いかは定まらず、印影に含まれる文字を読み取ることはできない。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
そこで、本発明は、上述した問題を解決するべくなされたものであり、印影に含まれる文字を読み取れるようにすることをその主たる課題とするものである。
【課題を解決するための手段】
【0009】
すなわち、本発明に係る文字読取装置は、紙面の押印領域に押印された実印影に含まれる文字を読み取る文字読取装置であって、前記実印影の一部を含む基準印影を、予め前記押印領域に付した基準紙面の画像データである基準画像データを格納する基準画像格納部と、前記実印影が押印された押印済み紙面の画像データである押印済画像データから、前記押印領域の画像データである実印影画像データを抽出する印影抽出部と、前記基準画像データにおける基準印影の情報に基づき、前記実印影画像データを所定の向き及び所定の位置に回転補正及び位置補正する補正部とを備えることを特徴とするものである。
【0010】
このように構成された文字読取装置によれば、例えば基準印影の向きや位置など、基準画像データにおける基準印影の情報に基づいて、実印影画像データを押印領域において所定の向き及び所定の位置に回転補正及び位置補正するので、ばらばらであった実印影の向き及び位置を統一させることができる。これにより、実印影画像データに含まれる例えば日付等の文字の向きや位置も統一させることができるので、その文字を含むように読取領域を設定することで、実印影に含まれる文字を読み取ることができるようになる。
【0011】
日付等の文字を精度良く読み取れるようにするためには、これらの文字が例えば真っすぐ横並びに配列されていることが望ましい。
そこで、前記補正部により回転補正及び位置補正された前記実印影画像データの前記押印領域における向き及び位置が、前記基準印影の前記押印領域における向き及び位置と一致していることが好ましい。
このような構成であれば、基準紙面の作成時に基準印影を正立姿勢で押印しておけば、回転補正及び位置補正された実印影画像データの日付等の文字を真っすぐ横並びに統一させることができ、文字の読取精度の向上を図れる。
【0012】
前記実印影が、可変な文字を含むものであり、前記基準印影としては、前記実印影から少なくとも前記可変な文字を除いたものであることが好ましい。
これならば、実印影に含まれる日付を読み取るうえで、基準印影を手軽に準備することができる。
【0013】
実印影画像データを回転補正及び位置補正するための具体的な態様としては、前記基準印影が、前記実印影の線分を複数含むものであり、前記補正部が、前記基準印影に含まれる線分上の複数の基準点に基づいて、前記実印影画像データを回転補正及び位置補正する態様が挙げられる。
【0014】
実印影画像データをより精度良く所定の向き及び所定の位置に回転補正及び位置補正するためには、前記基準印影が、前記実印影に含まれる特徴シンボルを含むものであり、前記補正部が、前記基準印影に含まれる前記特徴シンボル上の基準点に基づいて、前記実印影画像データを回転補正及び位置補正することが好ましい。
【0015】
仮に押印済画像データが基準画像データに対して傾いていると、押印済画像データの押印領域を抽出したはずの実印影画像データが、押印領域からずれた領域を抽出したものとなる。
そこで、前記押印済画像データにおける複数の特徴点の座標を、前記基準画像データにおける複数の特徴点の座標に位置合わせする位置合わせ部をさらに備えることが好ましい。
このような構成であれば、押印済画像データを基準画像データに位置合わせするので、実印影画像データを、確実に実印影画像データの押印領域を抽出したものとすることができる。
【0016】
また、本発明に係る文字読取装置用プログラムは、紙面の押印領域に押印された実印影に含まれる文字を読み取る文字読取装置に用いられるプログラムであって、前記実印影の一部を含む基準印影を、予め前記押印領域に付した基準紙面の画像データである基準画像データを格納する基準画像格納部と、前記実印影が押印された押印済み紙面の画像データである押印済画像データから、前記押印領域の画像データである実印影画像データを抽出する印影抽出部と、前記基準画像データにおける基準印影の情報に基づき、前記実印影画像データを所定の向き及び所定の位置に回転補正及び位置補正する補正部としての機能をコンピュータに発揮させることを特徴とするものである。
このように構成された文字読取装置用プログラムであれば、上述した文字読取装置と同様の作用効果を奏し得る。
【発明の効果】
【0017】
このように構成した本発明によれば、印影に含まれる日付等の文字を精度良く読み取ることができる。
【図面の簡単な説明】
【0018】
【
図1】本実施形態に係る文字読取装置の使用例を示す模式図。
【
図2】同実施形態における文字読取装置が適用される紙面の模式図。
【
図3】同実施形態における文字読取装置の機能を示す機能ブロック図。
【
図4】同実施形態における文字読取装置の動作を説明するためのフローチャート図。
【
図6】同実施形態における文字読取装置の動作を説明する模式図。
【
図7】同実施形態における文字読取装置の動作を説明する模式図。
【
図8】同実施形態における表示内容を説明する模式図。
【発明を実施するための形態】
【0019】
本発明の一実施形態に係る文字読取装置について図面を参照しながら説明する。
【0020】
本実施形態の文字読取装置100は、
図1に示すように、例えば帳票等の紙面Pに押印された印影に含まれる文字を読み取るためのものである。この実施形態では、印影に含まれる文字のみならず、紙面Pに記載された文字をも読み取るために用いられ、スキャナ等の撮像手段2とともに、紙面Pに記載された情報を登録する情報登録システム200を構築している。ただし、文字読取装置100としては、少なくとも印影に含まれる文字を読み取るものであれば、種々の用途に用いて構わない。
【0021】
まず、本実施形態の文字読取装置100が適用される帳票等の紙面Pについて、
図2を参照しながら簡単に説明する。
紙面Pは、受付印や受領印などの印鑑を押印する押印領域Z1が設けられたものであり、ここでは種々の記入項目に対する複数の記入領域Z2も設けられている。なお、紙面Pとしては、記入領域Z2が設けられていないものであっても良いし、押印領域Z1は1箇所に限らず、複数個所に設けられていても良い。
【0022】
次に、文字読取装置100について説明する。
この文字読取装置100は、CPU、メモリ、入出力インターフェース等を備えた専用乃至汎用のコンピュータであり、前記メモリに格納されている文字読取装置用プログラムに従って、CPUやその他の周辺機器を協働させることにより、
図3に示すように、テンプレート格納部11、基準画像格納部12、押印済画像格納部13、位置合わせ部14、印影抽出部15、補正部16、文字認識部17、データ出力部18などとしての機能を発揮するように構成されたものである。
【0023】
以下、各部の説明を兼ねて、
図3~
図8を参照しながら、文字読取装置100の動作について説明する。なお、以下に述べる種々の画像データは、所望のデータ形式の画像であり、その画像を文字列やベクトルに変換したデータも含む概念である。
【0024】
まず、ユーザは、
図2~
図4に示すように、紙面Pに設けられている押印領域Z1の座標を、例えばキーボードやマウス等の入力手段を用いてテンプレート情報として入力し、内部メモリ又は外部メモリの所定領域に設定されているテンプレート格納部11に格納する(S1)。なお、ここでのテンプレート情報には、押印領域Z1の座標以外にも、種々の記入領域Z2の座標が含まれている。また、押印領域Z1は、紙面Pにプリントされている枠線と完全に一致させる必要はなく、例えばこの枠線よりもやや大きい領域を押印領域Z1として設定しても良い。
【0025】
次に、
図5及び
図6に示すように、押印領域Z1に押印される印影T1(以下、実印影T1という)の一部を含む印影T2(以下、基準印影T2という)を、予め押印領域Z1に付した基準紙面P’を作成する(S2)。
【0026】
この基準印影T2は、実印影T1のうち少なくとも読取対象となる1又は複数の文字が除かれたものであり、具体的には実印影T1の輪郭や枠線などの線分を含み、実印影T1の日付を空白にしたものである。そして、この基準印影T2を、例えば
図5に示すように、押印領域Z1の中央部などに正立姿勢で押印することで、基準紙面P’が作成される。
なお、ここでいう正立姿勢とは、読取対象となる文字が除かれていなければ、その文字が基準紙面P’にプリントされている他の文字と同じ向きになる姿勢であることが好ましいが、除かれる文字が後述する文字認識部により認識可能であれば、多少傾いた姿勢であっても良い。
【0027】
また、読取対象となる文字は、押印される印影に応じて相違し得る文字であり、日付に限らず、例えば支店名や人名(姓や名)などであっても良い。さらに、基準印影T2は、実印影T1の輪郭や枠線など線分の他、読取対象となる文字に依らずに共通する例えば文字、記号、模様などの特徴シンボルを含んでいても良い。さらに加えて、基準印影T2は、押印領域Z1に必ずしも押印されている必要はなく、プリントされていても良い。
【0028】
続いて、このように作成した基準紙面P’をスキャナ等の撮像手段2を用いて画像化し、その画像化した画像データ(以下、基準画像データという)を、内部メモリ又は外部メモリの所定領域に設定されている基準画像格納部12に格納する(S3)。
【0029】
また、
図5に示すように、この基準画像データのうち、押印領域Z1における少なくとも一部を、後述する文字認識部17が文字認識する領域Z3(以下、読取領域Z3という)として設定する(S4)。具体的には、基準画像データの押印領域Z1のうち、基準印影T2に含まれる領域の少なくとも一部が読取領域Z3として設定される。例えば、実印影T1の日付を文字認識する場合であれば、実印影T1の日付が位置する領域に対応する基準印影T2の領域を、読取領域Z3として設定すれば良い。つまり、基準印影T2のうち、実印影T1から除かれた読取対象となる文字に対応する領域が読取領域Z3として設定される。そして、その読取領域Z3の座標を、例えばキーボードやマウス等の入力手段を用いて、上述したテンプレート情報としてテンプレート格納部11に格納する。
【0030】
次に、
図6(a)に示すように、1又は複数枚の押印済み紙面Pをスキャナ等の撮像手段2を用いて画像化し、その画像化した画像データ(以下、押印済画像データ)を、内部メモリ又は外部メモリの所定領域に設定された押印済画像格納部13に格納する(S5)。
【0031】
続いて、位置合わせ部14が、押印済画像格納部13に格納された押印済画像データを、基準画像データに対して位置合わせする(S6)。
具体的には、紙面Pに設けられている例えば記入領域Z2や押印領域Z1の角など、複数の基準点を予め設定しておき、それらの基準点の座標を、例えばキーボードやマウス等の入力手段を用いて上述したテンプレート情報としてテンプレート格納部11に予め格納しておく。そして、押印済画像データにおける複数の基準点の座標が、基準画像データにおける複数の基準点の座標と一致するように、押印済画像データを回転補正及び位置補正することで、押印済画像データを、基準画像データに位置合わせする。
【0032】
その後、印影抽出部15が、
図6(b)に示すように、押印済画像データから押印領域Z1の画像データである実印影画像データを抽出する。具体的には、テンプレート格納部11に格納されている押印領域Z1の座標を取得し、押印済画像データにおける押印領域Z1の座標を切り取ったものを実印影画像データとして抽出する(S7)。
【0033】
そして、補正部16が、抽出された実印影画像データを、基準画像データにおける基準印影T2の情報に基づき、所定の向き及び所定の位置となるように回転補正及び位置補正する(S8)。
なお、ここでいう位置補正は、画像データを互いに直交する2つの方向(例えば水平方向及び垂直方向)に沿って移動させる補正であり、回転補正は、画像データを所定の中心点(例えば画像データの中心点)周りに回転させる補正である。
【0034】
本実施形態では、基準印影T2に対して予め複数の特徴点を設定しておき、これらの特徴点の座標を用いて、補正部16が、実印影画像データに含まれる実印影T1の押印領域Z1における向き及び位置を回転補正及び位置補正する。
【0035】
より具体的に説明すると、基準画像データにおける基準印影T2に含まれる直線や曲線の交点など、複数の特徴点を予め設定しておき、それらの特徴点の座標を、例えばキーボードやマウス等の入力手段を用いて上述したテンプレート情報としてテンプレート格納部11に予め格納しておく。そして、
図6(c)、(d)に示すように、実印影画像データの複数の特徴点の座標が、基準印影T2における複数の特徴点の座標と一致するように、実印影画像データを回転補正及び位置補正する。これにより、実印影画像データの示す実印影T1が基準印影T2と重なり合い、実印影T1の押印領域Z1における向き及び位置が、基準印影T2の押印領域Z1における向き及び位置と一致する。
この実施形態では、図示していないが、回転補正及び位置補正の精度を向上するべく、上述した特徴点として、基準印影T2に含まれる文字(例えば社名など)や記号等の特徴シンボル上の点をも利用している。
【0036】
なお、
図6(a)~(d)では、実押印が押印領域Z1からはみ出さずに押印されている場合を例示したが、実印影画像データにおける特徴点の少なくとも一部が押印領域Z1に収まっていれば、
図7(a)~(d)に示すように、実押印の一部が押印領域Z1からはみ出していても、補正部16により、実印影画像データを所定の向き及び所定の位置に回転補正及び位置補正することができる。
【0037】
その後、文字認識部17が、補正後の実印影画像データに含まれる文字を文字認識する(S9)。具体的にこの文字認識部17は、OCR等の文字認識手段により発揮される機能であり、上述した読取領域Z3の座標を取得することで、その読取領域Z3に含まれる日付等の文字を文字認識するように構成されている。
【0038】
文字認識部17により文字認識された認識結果は、データ出力部18により、例えばディスプレイや紙などに出力される(S10)。ここでのデータ出力部18は、
図8に示すように、認識結果とともに、補正部16により補正された補正後の実印影画像データを比較可能に出力するように構成されており、これにより認識結果の正誤を判断できるようにしてある。なお、
図8では、
図7の実印影画像データ及びその認識結果をディスプレイに出力した表示内容を例示してある。
【0039】
このように構成された文字読取装置100によれば、基準画像データにおける基準印影T2の情報に基づいて、実印影画像データを所定の向き及び所定の位置に回転補正及び位置補正するので、ばらばらであった実印影T1の向き及び位置を統一させることができ、実印影T1に含まれる日付等の文字を読み取ることが可能となる。
【0040】
また、基準印影T2を押印領域Z1において正立姿勢で押印するとともに、この基準印影T2の向きと一致するように、実印影画像データを回転補正及び位置補正しているで、実印影画像データに含まれる日付等の文字を真っすぐ横並びに統一させることができ、読取精度の向上を図れる。
【0041】
さらに、基準印影T2が、実印影T1のうち少なくとも読取対象とする文字が除かれたものであるので、実印影T1に含まれる日付等の文字を読み取るうえで、基準印影T2を手軽に準備することができる。
【0042】
そのうえ、基準印影T2に含まれる文字や記号等の特徴シンボル上の点を特徴点として設定しているので、実印影画像データの向き及び位置を、より精度良く基準印影T2の向き及び位置と一致させることができる。
【0043】
加えて、位置合わせ部14が、押印済画像データにおける複数の基準点の座標を、基準画像データにおける複数の基準点の座標に位置合わせするので、実印影画像データの押印領域Z1と、基準画像データの押印領域Z1とを一致させることができる。
これにより、仮に撮像手段2により得られた押印済画像データが基準画像データに対して傾いていても、押印済画像データから確実に押印領域Z1の画像データを抽出することができる。
【0044】
なお、本発明は前記実施形態に限られるものではない。
【0045】
例えば、前記実施形態では、押印領域Z1における基準印影T2の向き及び位置と一致するように、実印影画像データを回転補正及び位置補正していたが、必ずしも一致させる必要はなく、基準印影T2の向きから所定角度傾けたり、所定距離ずれるように回転補正及び位置補正しても良い。
【0046】
また、前記実施形態では、実印影画像データに含まれる文字を文字認識した後に、その認識結果とともに補正後の実印影画像データを出力するようにしていたが、補正後の実印影画像データを出力した後に、実印影画像データに含まれる文字を文字認識するようにしても良い。
【0047】
加えて、前記実施形態の文字読取装置100は、実印影に含まれる日付を読み取るものであってが、例えば「可」、「不可」など、実印影に含まれる日付以外の可変な文字を読み取るために用いても良い。
【0048】
さらに、前記実施形態の文字読取装置100が備える種々の機能は、必ずしも全て備えさせる必要はなく、一部の機能を文字読取装置100とは別のコンピュータ等に備えさせても良い。
【0049】
その他、本発明の趣旨に反しない限りにおいて様々な実施形態の変形や組み合わせを行っても構わない。
【符号の説明】
【0050】
200・・・情報登録システム
100・・・文字読取装置
2 ・・・撮像手段
P ・・・紙面
Z1 ・・・押印領域
Z2 ・・・記入領域
Z3 ・・・読取領域
11 ・・・テンプレート格納部
12 ・・・基準画像格納部
13 ・・・押印済画像格納部
14 ・・・位置合わせ部
15 ・・・印影抽出部
16 ・・・補正部
17 ・・・文字認識部
18 ・・・データ出力部
T1 ・・・実印影
T2 ・・・基準印影