(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024174274
(43)【公開日】2024-12-16
(54)【発明の名称】文字認識装置
(51)【国際特許分類】
G06V 30/14 20220101AFI20241209BHJP
【FI】
G06V30/14 340A
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2023092013
(22)【出願日】2023-06-04
(71)【出願人】
【識別番号】520174850
【氏名又は名称】株式会社SEKT
(74)【代理人】
【識別番号】100187104
【弁理士】
【氏名又は名称】乾 智彦
(72)【発明者】
【氏名】関 高志
【テーマコード(参考)】
5B029
【Fターム(参考)】
5B029AA01
5B029CC21
5B029CC25
5B029EE12
(57)【要約】
【課題】帳票の所定の範囲に記入された認識対象項目を精度よく取得する文字認識装置を提供する。
【解決手段】文字認識装置10の情報取得部22、31は、基準帳票および処理対象帳票の画像全体に画像認識を行い、枠座標及び文字列を取得する。第1ガイド設定部23は枠内に文字が認識された基準帳票の枠を基準ガイド枠に設定し、第1範囲設定部25は基準帳票の認識対象項目の記入範囲を基準エントリ範囲に設定する。第2ガイド設定部32は、枠内に文字が認識された処理対象帳票の枠のうち、基準ガイド枠の文字列と同じ文字列が記載され、且つ基準ガイド枠と比較して枠縦横比同士の比が所定範囲内である枠を処理対象ガイド枠に設定する。第2範囲設定部35は、両ガイド枠の相対関係に基づき基準エントリ範囲に対応する処理対象帳票の範囲を処理対象エントリ範囲として設定する。項目取得部36は処理対象エントリ範囲に文字認識を行う。
【選択図】
図1
【特許請求の範囲】
【請求項1】
枠線および文字で構成された帳票のうち、所定の範囲に記入された認識対象項目を取得する文字認識装置であって、
任意の文字を記入するための記入枠が未記入である原本の帳票を基準帳票と定義し、前記記入枠に任意の文字が記入された帳票を処理対象帳票と定義し、枠の幅と高さとの比率を枠縦横比と定義すると、
前記基準帳票の画像全体に枠線および文字を認識するための画像認識を行い、枠座標および文字列を取得する第1情報取得部と、
前記基準帳票の画像認識において枠内に文字が認識された枠を基準ガイド枠として設定する第1ガイド設定部と、
前記基準帳票のうち前記認識対象項目を記入するための範囲を基準エントリ範囲として設定する第1範囲設定部と、
前記処理対象帳票の画像全体に画像認識を行い、枠座標および枠内の文字列を取得する第2情報取得部と、
前記処理対象帳票の画像認識において枠内に文字が認識された枠のうち、前記基準ガイド枠の文字列と同じ文字列が記載され、且つ、当該基準ガイド枠と比較して枠縦横比同士の比が所定範囲内である枠が1つのみの場合、当該枠を処理対象ガイド枠として設定する第2ガイド設定部と、
前記基準ガイド枠と前記処理対象ガイド枠との相対関係に基づき、前記基準エントリ範囲に対応する前記処理対象帳票の範囲を特定し、当該範囲を処理対象エントリ範囲として設定する第2範囲設定部と、
前記処理対象帳票の画像のうち前記処理対象エントリ範囲の部分に文字認識を行い、前記認識対象項目を取得する項目取得部と、
を備える文字認識装置。
【請求項2】
前記文字認識装置は、
前記基準帳票の画像認識にて認識された枠のうち、前記基準ガイド枠以外の枠を基準ガイド候補枠として設定するガイド候補設定部と、
前記基準ガイド枠と前記処理対象ガイド枠との相対関係に基づき、前記処理対象帳票上で前記基準ガイド候補枠に相当する理論上の枠を算出し、当該理論上の枠との関係において、前記処理対象帳票の画像認識にて認識された実際の枠のうち所定の一致条件を満たす枠を前記処理対象ガイド枠として設定するとともに、当該枠に対応する前記基準ガイド候補枠を前記基準ガイド枠として設定する昇格判定部と、
をさらに備える、請求項1に記載の文字認識装置。
【請求項3】
前記基準エントリ範囲からの高さ方向の距離が所定値よりも大きい前記基準ガイド枠が存在するか否かの判定を、距離判定と定義すると、
前記第2範囲設定部は、
前記距離判定が肯定される場合、前記基準エントリ範囲に高さ方向で最も近い前記基準ガイド枠と、当該基準ガイド枠に対応する前記処理対象ガイド枠との相対関係に基づき、前記処理対象エントリ範囲を特定し、
前記距離判定が否定される場合、前記基準エントリ範囲に幅方向で最も近い前記基準ガイド枠と、当該基準ガイド枠に対応する前記処理対象ガイド枠との相対関係に基づき、前記処理対象エントリ範囲を特定する、請求項1に記載の文字認識装置。
【請求項4】
前記基準エントリ範囲の高さが前記基準帳票の枠の高さ一杯に設定されることを、枠に属すると定義し、当該属する枠を所属枠と定義し、前記基準エントリ範囲が枠に属し且つ前記所属枠に対応する前記処理対象ガイド枠が存在するか否かの判定を所属枠判定と定義すると、
前記第2範囲設定部は、
前記所属枠判定が肯定される場合、前記所属枠と当該所属枠に対応する前記処理対象ガイド枠との相対関係に基づき、前記処理対象帳票上で前記基準エントリ範囲に相当する範囲を算出し、当該範囲を前記処理対象エントリ範囲として設定し、
前記所属枠判定が否定される場合、前記基準ガイド枠と前記処理対象ガイド枠との相対関係に基づき、前記処理対象帳票上で前記基準エントリ範囲に相当する範囲を算出し、当該範囲を前記処理対象エントリ範囲として設定する、請求項1に記載の文字認識装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、枠線および文字で構成された帳票のうち、所定の範囲に記入された認識対象項目を取得する文字認識装置に関する。
【背景技術】
【0002】
近年、帳票に記載された文字列を文字認識によりテキスト化する技術が活用されている。この技術では、処理対象帳票の画像の文字列部分を特定し、当該文字列部分を切り出した画像に文字認識を実施する事が一般的である。特許文献1には、帳票の画像から、第1方向に配列された枠の集まりである第1グループ矩形と、第2方向に配列された枠の集まりである第2グループ矩形との交差範囲を記入枠として認識し、当該記入枠内の画像を切り出して文字認識を行う技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、文字列部分を切り出すにあたり、文字列以外の枠線情報や、要求対象範囲外の文字列がノイズとして混じり込まないように該当文字列部分だけを切り出せないと、文字認識精度に大きく影響する事が課題となっている。
【0005】
また、帳票が定型様式であったとしても、イメージ化された処理対象帳票の各項目が帳票原本と同じ位置に存在しているとは限らない。多くの処理対象帳票はスキャナ等を使用してイメージ化されたものであり、イメージ化過程において帳票原本と比べて余白の設定や縮尺などが異なる場合が多いことや、イメージ化する処理対象帳票自体が帳票原本をコピーする等して作成された複製品であるからである。そのため、処理対象帳票の画像に対して帳票原本と同じ座標位置の部分を自動的に切り出すことは実用的ではない。
【0006】
また、例えば特許文献1に開示されているように処理対象帳票の画像に対して枠線を認識する処理を行い、枠に基づき認識対象項目の記載部分の特定を試みることが考えられる。しかし、どの枠が認識対象項目の記載部分に相当する枠であるのか判定が正確にはできない。さらに、枠認識や文字認識の処理特性上、処理対象帳票に対して常に同じ枠および同じ文字列が認識されるとは限らず、イメージ化の状態などに応じて一部の枠線が認識されなかったり、文字が誤認識されたりする。したがって、常に認識対象項目の記載部分に相当する枠が検出されているとは限らない。
【0007】
本発明の目的は、帳票の所定の範囲に記入された認識対象項目を精度よく取得する文字認識装置を提供することにある。
【課題を解決するための手段】
【0008】
本発明にかかる文字認識装置は、第1情報取得部と、第1ガイド設定部と、第1範囲設定部と、第2情報取得部と、第2ガイド設定部と、第2範囲設定部と、項目取得部とを備える。
ここで、任意の文字を記入するための記入枠が未記入である原本の帳票を基準帳票と定義し、記入枠に任意の文字が記入された帳票を処理対象帳票と定義し、枠の幅と高さとの比率を枠縦横比と定義する。
【0009】
第1情報取得部は、基準帳票の画像全体に枠線および文字を認識するための画像認識を行い、枠座標および文字列を取得する。第1ガイド設定部は、基準帳票の画像認識において枠内に文字が認識された枠を基準ガイド枠として設定する。第1範囲設定部は、基準帳票のうち認識対象項目を記入するための範囲を基準エントリ範囲として設定する。
【0010】
第2情報取得部は、処理対象帳票の画像全体に画像認識を行い、枠座標および枠内の文字列を取得する。第2ガイド設定部は、処理対象帳票の画像認識において枠内に文字が認識された枠のうち、基準ガイド枠の文字列と同じ文字列が記載され、且つ、当該基準ガイド枠と比較して枠縦横比同士の比が所定範囲内である枠が1つのみの場合、当該枠を処理対象ガイド枠として設定する。第2範囲設定部は、基準ガイド枠と処理対象ガイド枠との相対関係に基づき、基準エントリ範囲に対応する処理対象帳票の範囲を特定し、当該範囲を処理対象エントリ範囲として設定する。項目取得部は、処理対象帳票の画像のうち処理対象エントリ範囲の部分に文字認識を行い、認識対象項目を取得する。
【0011】
このように本発明では、基準帳票および処理対象帳票の双方の画像全体に対して枠認識および文字認識が行われる。これにより、枠座標の情報による位置関係だけではなく、文字列と枠座標との情報をセットで関連付けたガイド枠を用いることで両帳票間の相対関係を正確に捉えることができる。また、処理対象帳票のガイド枠を設定する際に情報が一定条件を満たさない枠はガイド枠として扱わないようにすることで、一部の枠線が認識されなかったり、文字が誤認識されたりすることに起因する項目取得精度の低下を抑制することができる。
【図面の簡単な説明】
【0012】
【
図1】一実施形態に係る文字認識装置の機能ブロック図である。
【
図2】一実施形態に係る基準帳票の画像を例示する図である。
【
図3】一実施形態に係る処理対象帳票の画像を例示する図である。
【
図4】
図2の基準帳票から画像認識により取得した情報を例示する図である。
【
図5】一実施形態に係る基準ガイド枠の情報を例示する図である。
【
図6】一実施形態に係る基準ガイド候補枠の情報を例示する図である。
【
図7】
図2の基準帳票のうち、基準エントリ範囲として設定される部分を網掛け表示した図である。
【
図8】一実施形態に係る基準エントリ範囲の情報を例示する図である。
【
図9】
図3の処理対象帳票から画像認識により取得した情報を例示する図である。
【
図10】
図5の情報に処理対象ガイド枠の設定時の判定結果を追加した図である。
【
図11】一実施形態に係る処理対象ガイド枠の情報を例示する図である。
【
図12】
図5に示す状態から、処理対象ガイド枠の設定時の判定結果を受けて変更された後の基準ガイド枠の情報を例示する図である。
【
図13】
図6に示す状態から、処理対象ガイド枠の設定時の判定結果を受けて変更された後の基準ガイド候補枠の情報を例示する図である。
【
図14】
図13の基準ガイド候補枠の情報に、当該基準ガイド候補枠に最も近い基準ガイド枠の情報と、処理対象帳票上で当該基準ガイド候補枠に相当する「理論上の枠」の情報とを追加した図である。
【
図15】
図14の処理対象帳票上の「理論上の枠」と「実際の枠」との位置関係を模式的に示す図である。
【
図16】
図11に示す状態から、昇格判定部による昇格判定結果を受けて変更された後の処理対象ガイド枠の情報を例示する図である。
【
図17】
図12に示す状態から、昇格判定部による昇格判定結果を受けて変更された後の基準ガイド枠の情報を例示する図である。
【
図18】
図16に示す状態から基準帳票のサイズに変換された処理対象ガイド枠の枠座標、基準ガイド枠との中心点間の距離、当該距離の中央値、および除外判定結果を例示する図である。
【
図19】
図16に示す状態から、除外判定部による除外判定結果を受けて変更された後の処理対象ガイド枠の情報を例示する図である。
【
図20】
図17に示す状態から、除外判定部による除外判定結果を受けて変更された後の基準ガイド枠の情報を例示する図である。
【
図21】
図8の情報に、特定パターンおよび参照ガイド枠の情報を追加した図である。
【
図22】基準エントリ範囲が枠に属さない場合を例示する図である。
【
図23】一実施形態に係る処理対象エントリ範囲の情報を例示する図である。
【
図24】一実施形態に係る文字認識装置が基準帳票の情報を扱うために実行する処理の手順を示すフローチャートである。
【
図25】一実施形態に係る文字認識装置が処理対象帳票の情報を扱うために実行する処理の手順を示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、本発明の一実施形態に係る文字認識装置について図面を参照して説明する。
図1に示す文字認識装置10は、枠線と文字とで構成された定型の帳票のうち、所定の範囲に記入された項目を文字認識により取得するための装置である。上記項目のことを「認識対象項目」と定義する。
【0014】
図2に示すように、帳票を構成する枠には、見出し枠および記入枠がある。見出し枠は、例えば「氏名」や「生年月日」など、見出しや注釈などが予め枠内に記載されている枠である。記入枠は、任意の文字を記入するための空白部分を枠内に有する枠である。例えば見出し枠「氏名」の内容は、その右隣の空白の記入枠に記入するようになっている。また、見出し枠「生年月日」の内容は、その見出し枠「生年月日」の空白部分に記入するようになっている。このように見出し枠とその内容を記入する記入枠とが別枠である場合と、同じ枠である場合とがある。
【0015】
ここで、
図2に示すように記入枠が未記入である原本の帳票を「基準帳票」と定義する。
図3に示すように記入枠に任意の文字が記入された帳票を「処理対象帳票」と定義する。
図2に示す基準帳票80の画像81および
図3に示す処理対象帳票90の画像91は、各帳票をスキャナ15(
図1参照)で画像化したものである。
図3の処理対象帳票90の枠は、
図2の基準帳票80の枠と比べてサイズが大きく、位置が右側にずれている。
【0016】
文字認識装置10は、図示しないCPU、RAM、ROMおよび入出力インタフェース等を備えたコンピュータを含むように構成されており、後述する各種機能部を備えている。各種機能部の機能は、上記CPUがRAMの一時記憶機能を利用しつつROMに予め記憶された文字認識プログラムを実行することによるソフトウェア処理により実現される。
【0017】
(機能)
文字認識装置10は、主な機能部として、画像取得部21、第1情報取得部22、第1ガイド設定部23、ガイド候補設定部24、第1範囲設定部25、第2情報取得部31、第2ガイド設定部32、昇格判定部33、除外判定部34、第2範囲設定部35、および項目取得部36を備える。
【0018】
画像取得部21は、スキャナ15または外部記憶装置16などから基準帳票80および処理対象帳票90の画像データを取得する。
【0019】
第1情報取得部22は、基準帳票80の画像81全体に枠線および文字を認識するための画像認識を行い、枠座標および文字列を取得する。取得した情報は、枠座標および文字列をセットにした状態で文字認識装置10のデータベースに記憶される。
図4に示すようにデータベースには、基準帳票80の情報として枠座標、文字列、および枠の識別符号(以下FID)「S-0」~「S-26」が記憶される。本実施形態では、画像81の左上を起点としたときの右方向をX、下方向をYで表す。枠のX方向の長さを幅W、Y方向の長さを高さHで表す。枠の幅Wと高さHとの比率を枠縦横比W/Hと定義する。
【0020】
第1ガイド設定部23は、基準帳票80の画像認識において枠内に文字が認識された枠を「基準ガイド枠」として設定する。基本的には見出し枠が基準ガイド枠として設定される。
図5に示すように文字認識装置10のデータベースには、基準ガイド枠の情報として枠座標などに加えて、枠内の文字列と、処理対象帳票90との文字列のマッチングを行うときのマッチタイプとが記憶される。マッチタイプには、「完全一致」、「前方一致」、「後方一致」、および「部分一致」がある。
図5では、説明簡略化のために基準ガイド枠の数を少なく表示しているが、実際には枠内に文字が認識された全ての枠が基準ガイド枠として設定される。
【0021】
ガイド候補設定部24は、基準帳票80の画像認識にて認識された枠のうち、基準ガイド枠以外の枠を基準ガイド候補枠として設定する。
図6に示すように文字認識装置10のデータベースには、基準ガイド候補枠の情報として枠座標およびFIDが記憶される。
図6では、説明簡略化のために基準ガイド候補枠の数を少なく表示しているが、実際には基準ガイド枠として設定されなかった全ての枠が基準ガイド候補枠として設定される。
【0022】
第1範囲設定部25は、基準帳票80のうち認識対象項目を記入するための範囲を基準エントリ範囲として設定する。
図7に示すように基準エントリ範囲は、例えば見出し枠「氏名」に対応する範囲のように、範囲の外縁が記入枠に丁度重なるように(すなわち範囲が記入枠に丁度収まるように)設定される場合と、例えば見出し枠「生年月日」に対応する範囲のように、範囲の外縁の少なくとも一部が記入枠に重ならないように(すなわち範囲が記入枠よりも小さくなるように)設定される場合とがある。第1範囲設定部25による基準エントリ範囲の設定は、適宜、文字認識装置10の操作者からの入力情報に基づき行われる。
【0023】
図8に示すように文字認識装置10のデータベースには、基準エントリ範囲の情報として枠座標などに加えて、所属枠の情報が記憶される。所属枠とは、基準エントリ範囲が属する枠のことである。「基準エントリ範囲が枠に属する」とは、高さ方向において基準エントリ範囲が枠に丁度重なるようになっていること、すなわち基準エントリ範囲の高さが枠の高さ一杯に設定されていることである。
【0024】
第2情報取得部31は、処理対象帳票90の画像91全体に枠線および文字を認識するための画像認識を行い、枠座標および枠内の文字列を取得する。取得した情報は、枠座標および文字列をセットにした状態で文字認識装置10のデータベースに記憶される。
図9に示すようにデータベースには、処理対象帳票90の情報として枠座標、文字列、およびFID「T-0」~「T-23」が記憶される。
【0025】
第2ガイド設定部32は、処理対象帳票90の画像認識において枠内に文字が認識された枠のうち、次の2つの条件(a1),(a2)を満たす枠が1つのみの場合、その枠を「処理対象ガイド枠」として設定する。
【0026】
(a1)基準ガイド枠の文字列と同じ文字列が記載されていること。つまり枠内に認識された文字列と基準ガイド枠の文字列とを指定のマッチタイプ(
図5参照)で照らし合わせたときに一致すること。
【0027】
(a2)基準ガイド枠と比較して枠縦横比W/H同士の比が所定範囲内であること。本実施形態では、基準ガイド枠の枠縦横比W/Hと処理対象ガイド枠の枠縦横比W/Hとの比が0.9~1.1の範囲内にあること。
【0028】
本実施形態では
図10に示すような判定結果により、
図11に示す枠が処理対象ガイド枠として設定される。処理対象ガイド枠のFIDは、その枠に対応する基準ガイド枠のFIDと同じものが設定される。このとき採用されなかった基準ガイド枠は、
図12に示すように基準ガイド枠から除外されて、
図13に示すように基準ガイド候補枠に追加される(降格される)。
【0029】
昇格判定部33は、処理対象帳票90の画像認識にて認識された実際の枠に対して所定の条件を満たす枠があるか否かの判定を行い、条件を満たす枠を処理対象ガイド枠に昇格させるとともに、その枠に対応する基準ガイド候補枠を基準ガイド枠に昇格させる。この一連の処理である昇格判定は次の手順(b1)~(b3)で行われる。
【0030】
(b1)基準ガイド枠と処理対象ガイド枠との相対関係に基づき、処理対象帳票90上で基準ガイド候補枠に相当する「理論上の枠」が算出される。当該算出は次の手順(b1-1)~(b1-4)で行われる。以下において、基準ガイド枠のX,Y,W,HをX1,Y1,W1,H1とし、基準ガイド候補枠のX,YをX2,Y2とし、処理対象ガイド枠のX,Y,W,HをX3,Y3,W3,H3とする。
【0031】
(b1-1)基準帳票80と処理対象帳票90とのX方向の縮尺SxおよびY方向の縮尺Syが式(1)、(2)から計算される。
Sx={(X3+W3)の最大値-X3の最小値}/{(X1+W1)の最大値-X1の最小値}・・・(1)
Sy={(Y3+H3)の最大値-Y3の最小値}/{(Y1+H1)の最大値-Y1の最小値}・・・(2)
【0032】
(b1-2)基準ガイド候補枠から最も近い基準ガイド枠が選定される(
図14参照)。ここで、基準ガイド候補枠からの高さ方向の距離が所定値よりも大きい基準ガイド枠が存在するか否かの判定を、第1距離判定と定義する。前記「最も近い基準ガイド枠」とは、第1距離判定が肯定される場合、基準ガイド候補枠に「高さ方向」で最も近い基準ガイド枠であり、第1距離判定が否定される場合、基準ガイド候補枠に「幅方向」で最も近い基準ガイド枠である。
【0033】
(b1-3)基準ガイド候補枠と前記「最も近い基準ガイド枠」とのX方向距離ΔXおよびY方向距離ΔYが式(3)、(4)から計算される。
ΔX=X2-X1・・・(3)
ΔY=Y2-Y1・・・(4)
【0034】
(b1-4)「理論上の枠」の座標が、前記「最も近い基準ガイド枠」と同じFIDをもつ処理対象ガイド枠の座標(X3a,Y3a,W3a,H3a)に基づき、式(5)~(8)から計算される(
図14参照)。「理論上の枠」のX,Y,W,HをX4,Y4,W4,H4とする。
X4=X3a+(ΔX×Sx)・・・(5)
Y4=Y3a+(ΔY×Sy)・・・(6)
W4=W3a×Sx・・・(7)
H4=H3a×Sy・・・(8)
【0035】
(b2)「理論上の枠」との関係において、処理対象帳票90の画像認識にて認識された「実際の枠」のうち所定の一致条件を満たす枠が存在するか否かが判定される(
図14参照)。上記一致条件は、次の4つの条件(c1)~(c4)である。以下において、「実際の枠」のW,HをW5,H5とする。また、
図15に示すように「理論上の枠」Ftと「実際の枠」Faが重なる部分の面積をS1とし、「理論上の枠」Ftと「実際の枠」Faとに外接する矩形の仮想枠Fvの面積をS2とする。
(c1)W5/H5とW4/H4との比が0.9~1.1の範囲内にあること。
(c2)W5/W4が0.95~1.05の範囲内にあること。
(c3)H5/H4が0.95~1.05の範囲内にあること。
(c4)(S1/S2)×100が80以上であること。
【0036】
(b3)前記一致条件を満たす枠が存在する場合、その枠が処理対象ガイド枠として設定される(
図16参照)とともに、その枠に対応する基準ガイド候補枠が基準ガイド枠として設定される(
図17参照)。
【0037】
除外判定部34は、これまで設定したガイド枠(
図16および
図17参照)に対して外れ値検出を行い、外れ値に該当するガイド枠を除外する。この一連の処理である除外判定は次の手順(d1)~(d5)で行われる。
【0038】
(d1)縮尺Sxおよび縮尺Syが前記式(1)、(2)から再計算される。
【0039】
(d2)処理対象ガイド枠の枠座標が式(9)~(12)により基準帳票80のサイズ(X3b,Y3b,W3b,H3b)に変換される(
図18参照)。
X3b=X3/Sx・・・(9)
Y3b=Y3/Sy・・・(10)
W3b=W3/Sx・・・(11)
H3b=H3/Sy・・・(12)
【0040】
(d3)対応するガイド枠同士の中心点間距離Dc(すなわち基準帳票サイズの処理対象ガイド枠の中心点と基準ガイド枠の中心点との距離)が計算される(
図18参照)。
【0041】
(d4)中心点間距離Dcが式(13)の判定範囲外であるか否かが判定される。中心点間距離Dcの中央値をDcm、中央絶対偏差をMedADとする。
判定範囲=Dcm±(MedAD×1.4826)×6・・・(13)
【0042】
(d5)
図18に示すように、上記(d4)の判定が否定される場合(すなわち中心点間距離Dcが判定範囲内である場合)、判定結果OKとなり、対応する基準ガイド枠および処理対象ガイド枠が維持される。一方で上記(d4)の判定が肯定される場合(すなわち中心点間距離Dcが判定範囲外である場合)、判定結果NGとなり、対応する基準ガイド枠および処理対象ガイド枠が除外される(
図19および
図20参照)。
【0043】
第2範囲設定部35は、基準ガイド枠と処理対象ガイド枠との相対関係に基づき、基準エントリ範囲に対応する処理対象帳票90上の範囲を特定し、当該範囲を処理対象エントリ範囲として設定する。この一連の処理は次の手順(e1)~(e5)で行われる。
【0044】
(e1)縮尺Sxおよび縮尺Syが前記式(1)、(2)から再計算される。
【0045】
(e2)基準エントリ範囲に対応する処理対象帳票90上の範囲を特定するやり方、すなわち特定パターンが選択される。下記条件(e2-1),(e2-2)を両方満たすか否かの判定を所属枠判定と定義すると、所属枠判定が肯定される場合(条件(e2-1),(e2-2)を両方満たす場合)には特定パターンAが選択され、所属枠判定が否定される場合には特定パターンBが選択される(
図21参照)。
(e2-1)基準エントリ範囲が枠に属する。すなわち、
図21において「枠に属するか」が「True」である。枠に属しない場合とは、
図2において帳票名の「入院手術証明書」のように枠外に記載される場合、または、
図22に示すように網掛け表示した基準エントリ範囲の高さが枠の高さ一杯に設定されていない場合である。
(e2-2)所属枠に対応する処理対象ガイド枠が存在する。すなわち、
図19において上記所属枠と同じFIDが付与された処理対象ガイド枠が存在する。
【0046】
(e3)特定パターンAが選択された場合、所属枠と当該所属枠に対応する処理対象ガイド枠との相対関係に基づき、処理対象帳票90上で基準エントリ範囲に相当する範囲が算出され、当該範囲が処理対象エントリ範囲として設定される。具体的には、処理対象エントリ範囲の座標が式(14)~(17)から計算される(
図23参照)。以下において、基準エントリ範囲のX,Y,W,HをX6,Y6,W6,H6とし、基準エントリ範囲の所属枠のX,Y,W,HをX7,Y7,W7,H7とし、所属枠に対応する処理対象ガイド枠のX,Y,W,HをX3c,Y3c,W3c,H3cとし、処理対象エントリ範囲のX,Y,W,HをX8,Y8,W8,H8とする。
X8=X3c+(X6-X7)×(W3c/W7)・・・(14)
Y8=Y3c+(Y6-Y7)×(H3c/H7)・・・(15)
W8=W3p×W6/W7・・・(16)
H8=H3p×H6/H7・・・(17)
【0047】
(e4)特定パターンBが選択された場合、基準ガイド枠と処理対象ガイド枠との相対関係に基づき、処理対象帳票90上で基準エントリ範囲に相当する範囲が算出され、当該範囲が処理対象エントリ範囲として設定される。具体的には、処理対象エントリ範囲の座標が次の手順(e4-1)~(e4-4)で求められる(
図23参照)。
【0048】
(e4-1)基準エントリ範囲から最も近い基準ガイド枠が参照ガイド枠として選定される(
図21参照)。ここで、基準エントリ範囲からの高さ方向の距離が所定値よりも大きい基準ガイド枠が存在するか否かの判定を、第2距離判定と定義する。前記「基準エントリ範囲から最も近い基準ガイド枠」とは、第2距離判定が肯定される場合、基準エントリ範囲に「高さ方向」で最も近い基準ガイド枠であり、第2距離判定が否定される場合、基準エントリ範囲に「幅方向」で最も近い基準ガイド枠である。
【0049】
(e4-2)基準エントリ範囲と前記「基準エントリ範囲から最も近い基準ガイド枠」とのX方向距離ΔXおよびY方向距離ΔYが式(18)、(19)から計算される。
ΔX=X6-X1・・・(18)
ΔY=Y6-Y1・・・(19)
【0050】
(e4-3)処理対象帳票90上で基準エントリ範囲に相当する範囲の座標(X9,Y9,W9,H9)が、前記「基準エントリ範囲から最も近い基準ガイド枠」と同じFIDをもつ処理対象ガイド枠の座標(X3d,Y3d,W3d,H3d)に基づき、式(20)~(23)から計算される。
X9=X3d+(ΔX×Sx)・・・(20)
Y9=Y3d+(ΔY×Sy)・・・(21)
W9=W3d×Sx・・・(22)
H9=H3d×Sy・・・(23)
【0051】
(e4-4)上記(e4-3)で算出された範囲が処理対象エントリ範囲として設定される。つまりX8=X9,Y8=Y9,W8=W9,H8=H9として設定される。
【0052】
項目取得部36は、処理対象帳票90の画像91のうち処理対象エントリ範囲の部分に文字認識を行い、認識対象項目を取得する(
図23参照)。
【0053】
(処理の手順)
次に、文字認識装置10が実行する処理の手順について
図24および
図25を参照して説明する。処理には、基準帳票80の情報を扱う
図24に示す処理と、処理対象帳票90の情報を扱う
図25に示す処理とがある。
【0054】
文字認識装置10は、基準帳票80の情報処理のための所定の実行指示がなされた場合に
図24に示す処理を開始する。先ずステップ100において、画像取得部21は、スキャナ15または外部記憶装置16などから基準帳票80の画像データを取得する。以下において、ステップを「S」と記載する。
【0055】
次にS110において、第1情報取得部22は、基準帳票80の画像81全体に枠線および文字を認識するための画像認識を行い、枠座標および文字列を取得する。取得した情報は、枠座標および文字列をセットにした状態で文字認識装置10のデータベースに記憶される。
【0056】
次にS120において、第1ガイド設定部23は、基準帳票80の画像認識において枠内に文字が認識された枠を「基準ガイド枠」として設定する。
【0057】
次にS130において、ガイド候補設定部24は、基準帳票80の画像認識にて認識された枠のうち、基準ガイド枠以外の枠を基準ガイド候補枠として設定する。
【0058】
次にS140において、第1範囲設定部25は、基準帳票80のうち認識対象項目を記入するための範囲を基準エントリ範囲として設定する。S140の後、
図24の一連の処理を終了する。
【0059】
文字認識装置10は、処理対象帳票90の情報処理のための所定の実行指示がなされた場合に
図25に示す処理を開始する。先ずステップ200において、画像取得部21は、スキャナ15または外部記憶装置16などから処理対象帳票90の画像データを取得する。
【0060】
次にS210において、第2情報取得部31は、処理対象帳票90の画像91全体に枠線および文字を認識するための画像認識を行い、枠座標および枠内の文字列を取得する。
【0061】
次にS220において、第2ガイド設定部32は、処理対象帳票90の画像認識において枠内に文字が認識された枠のうち、前記2つの条件(a1),(a2)を満たす枠が1つのみの場合、その枠を「処理対象ガイド枠」として設定する。
【0062】
次にS230において、昇格判定部33は、処理対象帳票90の画像認識にて認識された「実際の枠」に対して前記所定の一致条件を満たす枠があるか否かの判定を行い、条件を満たす枠を処理対象ガイド枠に昇格させるとともに、その枠に対応する基準ガイド候補枠を基準ガイド枠に昇格させる。
【0063】
次にS240において、除外判定部34は、これまで設定したガイド枠に対して外れ値検出を行い、外れ値に該当するガイド枠を除外する。
【0064】
次にS250において、第2範囲設定部35は、基準ガイド枠と処理対象ガイド枠との相対関係に基づき、基準エントリ範囲に対応する処理対象帳票90上の範囲を特定し、当該範囲を処理対象エントリ範囲として設定する。
【0065】
次にS260において、項目取得部36は、処理対象帳票90の画像91のうち処理対象エントリ範囲の部分に文字認識を行い、認識対象項目を取得する。S260の後、
図25の一連の処理を終了する。
【0066】
(効果)
以上説明したように、文字認識装置10は、第1情報取得部22と、第1ガイド設定部23と、第1範囲設定部25と、第2情報取得部31と、第2ガイド設定部32と、第2範囲設定部35と、項目取得部36とを備える。
第1情報取得部22は、基準帳票80の画像81全体に枠線および文字を認識するための画像認識を行い、枠座標および文字列を取得する。第1ガイド設定部23は、基準帳票80の画像認識において枠内に文字が認識された枠を基準ガイド枠として設定する。第1範囲設定部25は、基準帳票80のうち認識対象項目を記入するための範囲を基準エントリ範囲として設定する。
【0067】
第2情報取得部31は、処理対象帳票90の画像91全体に画像認識を行い、枠座標および枠内の文字列を取得する。第2ガイド設定部32は、処理対象帳票90の画像認識において枠内に文字が認識された枠のうち、基準ガイド枠の文字列と同じ文字列が記載され、且つ、当該基準ガイド枠と比較して枠縦横比同士の比が所定範囲内である枠が1つのみの場合、当該枠を処理対象ガイド枠として設定する。第2範囲設定部35は、基準ガイド枠と処理対象ガイド枠との相対関係に基づき、基準エントリ範囲に対応する処理対象帳票90の範囲を特定し、当該範囲を処理対象エントリ範囲として設定する。項目取得部36は、処理対象帳票90の画像91のうち処理対象エントリ範囲の部分に文字認識を行い、認識対象項目を取得する。
【0068】
このように本実施形態では、基準帳票80および処理対象帳票90の双方の画像全体に対して枠認識および文字認識が行われる。これにより、枠座標の情報による位置関係だけではなく、文字列と枠座標との情報をセットで関連付けたガイド枠を用いることで両帳票間の相対関係を正確に捉えることができる。また、処理対象帳票90のガイド枠を設定する際に情報が一定条件を満たさない枠はガイド枠として扱わないように降格判定を行うことで、一部の枠線が認識されなかったり、文字が誤認識されたりすることに起因する項目取得精度の低下を抑制することができる。
【0069】
また本実施形態では、文字認識装置10は、ガイド候補設定部24および昇格判定部33をさらに備える。ガイド候補設定部24は、基準帳票80の画像認識にて認識された枠のうち、基準ガイド枠以外の枠を基準ガイド候補枠として設定する。昇格判定部33は、基準ガイド枠と処理対象ガイド枠との相対関係に基づき、処理対象帳票90上で基準ガイド候補枠に相当する理論上の枠を算出し、当該理論上の枠との関係において、処理対象帳票90の画像認識にて認識された実際の枠のうち所定の一致条件を満たす枠を処理対象ガイド枠として設定するとともに、当該枠に対応する基準ガイド候補枠を基準ガイド枠として設定する。これにより、より多くのガイド枠を設定し、両帳票間の相対関係に基づく相対位置計算の精度を向上させることができる。
【0070】
また本実施形態では、第2範囲設定部35は、第2距離判定が肯定される場合、基準エントリ範囲に高さ方向で最も近い基準ガイド枠と、当該基準ガイド枠に対応する処理対象ガイド枠との相対関係に基づき、処理対象エントリ範囲を特定する。また第2範囲設定部35は、第2距離判定が否定される場合、基準エントリ範囲に幅方向で最も近い基準ガイド枠と、当該基準ガイド枠に対応する処理対象ガイド枠との相対関係に基づき、処理対象エントリ範囲を特定する。これにより両帳票間の相対関係に基づく相対位置計算(すなわち枠座標の差分計算)の際に、計算上の誤差をできるだけ小さくすることができる。
【0071】
また本実施形態では、第2範囲設定部35は、所属枠判定が肯定される場合、所属枠と当該所属枠に対応する処理対象ガイド枠との相対関係に基づき、処理対象帳票90上で基準エントリ範囲に相当する範囲を算出し、当該範囲を処理対象エントリ範囲として設定する。また第2範囲設定部35は、所属枠判定が否定される場合、基準ガイド枠と処理対象ガイド枠との相対関係に基づき、処理対象帳票90上で基準エントリ範囲に相当する範囲を算出し、当該範囲を処理対象エントリ範囲として設定する。これにより、処理対象帳票90の枠認識状態が不十分な場合でも、事前に設定した基準エントリ範囲の情報から自動的に対応する処理対象エントリ範囲の座標情報を作成することができる。
【0072】
[他の実施形態]
他の実施形態では、文字認識装置としての情報機器の機能部の一部または全部を他の機器が備えていてもよい。すなわち、複数の機器により文字認識装置を構成してもよい。
他の実施形態では、文字認識装置の機能部がもつ機能は、専用の電子回路によるハードウェア処理により実現してもよいし、ソフトウェア処理とハードウェア処理との組み合わせにより実現してもよい。
【0073】
その他、一々例示はしないが、本発明は、その趣旨を逸脱しない範囲内において、種々の変更が加えられて実施されるものである。
【符号の説明】
【0074】
10 文字認識装置
21 画像取得部
22 第1情報取得部
23 第1ガイド設定部
24 ガイド候補設定部
25 第1範囲設定部
31 第2情報取得部
32 第2ガイド設定部
33 昇格判定部
34 除外判定部
35 第2範囲設定部
36 項目取得部
80 基準帳票
90 処理対象帳票