IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社PFUの特許一覧

特許7591915書式定義装置、書式定義方法、及びプログラム
<>
  • 特許-書式定義装置、書式定義方法、及びプログラム 図1
  • 特許-書式定義装置、書式定義方法、及びプログラム 図2
  • 特許-書式定義装置、書式定義方法、及びプログラム 図3
  • 特許-書式定義装置、書式定義方法、及びプログラム 図4
  • 特許-書式定義装置、書式定義方法、及びプログラム 図5
  • 特許-書式定義装置、書式定義方法、及びプログラム 図6
  • 特許-書式定義装置、書式定義方法、及びプログラム 図7
  • 特許-書式定義装置、書式定義方法、及びプログラム 図8
  • 特許-書式定義装置、書式定義方法、及びプログラム 図9
  • 特許-書式定義装置、書式定義方法、及びプログラム 図10
  • 特許-書式定義装置、書式定義方法、及びプログラム 図11
  • 特許-書式定義装置、書式定義方法、及びプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-21
(45)【発行日】2024-11-29
(54)【発明の名称】書式定義装置、書式定義方法、及びプログラム
(51)【国際特許分類】
   G06V 30/412 20220101AFI20241122BHJP
【FI】
G06V30/412
【請求項の数】 10
(21)【出願番号】P 2020202888
(22)【出願日】2020-12-07
(65)【公開番号】P2022090469
(43)【公開日】2022-06-17
【審査請求日】2023-09-20
(73)【特許権者】
【識別番号】000136136
【氏名又は名称】株式会社PFU
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】水口 亮
【審査官】小池 正彦
(56)【参考文献】
【文献】特開2018-018303(JP,A)
【文献】特開2007-241355(JP,A)
【文献】特開2011-076581(JP,A)
【文献】特開2011-228792(JP,A)
【文献】特開2007-233900(JP,A)
【文献】特開2010-021771(JP,A)
【文献】実開平05-008670(JP,U)
【文献】特開2005-167875(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/412
(57)【特許請求の範囲】
【請求項1】
入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定部と、
前記色領域特定部により特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定部と、
前記入力画像における、前記入力領域決定部により決定された入力領域の位置を書式情報として出力する書式情報出力部と
を有し、
前記入力領域決定部は、前記色領域特定部により特定された領域を基準として、文字列が配列される方向の上流側及び下流側に、前記入力領域を拡張する、書式定義装置。
【請求項2】
前記入力領域決定部により前記入力領域を拡張できる範囲を、背景色とは異なる色が存在する領域までに制限する拡張制限部
をさらに有する請求項に記載の書式定義装置。
【請求項3】
前記入力領域決定部により前記入力領域を拡張できる距離に関して、文字列が配列された方向を、文字列の配列方向と直交する方向よりも大きく許容する拡張制限部
をさらに有する請求項に記載の書式定義装置。
【請求項4】
入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定部と、
前記色領域特定部により特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定部と、
前記入力画像における、前記入力領域決定部により決定された入力領域の位置を書式情報として出力する書式情報出力部と、
前記色領域特定部により特定された領域の色に応じて、前記入力領域決定部により決定された入力領域の属性を設定する属性設定部と、
し、
前記書式情報出力部は、前記入力領域決定部により決定された入力領域の位置と、前記属性設定部により設定された属性とを書式情報として出力する書式定義装置。
【請求項5】
前記色領域特定部により特定された領域の色に応じて、前記入力領域決定部により決定された入力領域に入力される文字種を設定する属性設定部
をさらに有し、
前記入力領域決定部は、前記色領域特定部により特定された領域を基準として、文字列が配列される方向の上流側及び下流側、及び、文字列の配列方向に直交する方向に、前記入力領域を拡張し、
前記書式情報出力部は、前記入力領域決定部により決定された入力領域の位置と、前記属性設定部により設定された文字種とを書式情報として出力し、
前記入力領域決定部は、前記入力領域に設定された文字種が手書き文字である場合に、文字列の配列方向と直交する方向の拡張量を、設定された文字種が活字である場合よりも大きくする
請求項に記載の書式定義装置。
【請求項6】
ユーザの操作に応じて、入力領域に設定する属性と、色とを互いに関連付けて登録する色登録部と、
前記色登録部に登録されている色と類似する色の新規登録が要求された場合に、警告表示を行う警告表示部と
をさらに有し、
前記属性設定部は、前記色領域特定部により特定された領域の色と、前記色登録部に登録されている色とに基づいて、前記入力領域決定部により決定された入力領域の属性を設定する
請求項に記載の書式定義装置。
【請求項7】
前記書式情報はOCR処理の定義情報であり、
前記属性設定部は、前記色領域特定部により特定された領域の色に応じて、前記入力領域決定部により決定された入力領域を、OCR処理の対象外に設定する
請求項に記載の書式定義装置。
【請求項8】
入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定部と、
前記色領域特定部により特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定部と、
前記入力画像における、前記入力領域決定部により決定された入力領域の位置を書式情報として出力する書式情報出力部と、
前記入力画像のうち、前記入力領域決定部により入力領域に決定された領域を、単一の色で塗り潰す塗潰し部と、
し、
前記書式情報出力部は、前記塗潰し部により塗り潰された入力画像に関付けて、書式情報を出力する書式定義装置。
【請求項9】
コンピュータが、入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定ステップと、
コンピュータが、前記色領域特定ステップにより特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定ステップと、
コンピュータが、前記入力画像における、前記入力領域決定ステップにより決定された入力領域の位置を書式情報として出力する書式情報出力ステップと
を有し、
前記入力領域決定ステップでは、コンピュータが、前記色領域特定ステップにより特定された領域を基準として、文字列が配列される方向の上流側及び下流側に、前記入力領域を拡張する、書式定義方法。
【請求項10】
入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定ステップと、
前記色領域特定ステップにより特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定ステップと、
前記入力画像における、前記入力領域決定ステップにより決定された入力領域の位置を書式情報として出力する書式情報出力ステップと
をコンピュータに実行させ
前記入力領域決定ステップでは、前記色領域特定ステップにより特定された領域を基準として、文字列が配列される方向の上流側及び下流側に、前記入力領域を拡張する、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、書式定義装置、書式定義方法、及びプログラムに関する。
【背景技術】
【0002】
例えば、特許文献1には、ドキュメントに対する属性地設定処理として実行される色マーカーによる追記情報の重なりや、追記情報と原本情報との重なり部の解析を行い、重なり部がどの色の組み合わせによって生成されたかを解析し、重なり部において途切れた追記情報を修復し、修復追記情報の指定領域の情報を取得して文字認識などの解析を行って結果をデータベースなどに格納する情報処理装置ドキュメントに対する属性値設定処理として実行される色マーカーによる追記情報の重なりや、追記情報と原本情報との重なり部の解析を行い、重なり部がどの色の組み合わせによって生成されたかを解析し、重なり部において途切れた追記情報を修復し、修復追記情報の指定領域の情報を取得して文字認識などの解析を行なって結果をデータベースなどに格納する。本構成により、複数の色マーカーの重なりや、色マーカーと原本情報の重なりが発生しても、正確な追記情報抽出、追記による特定情報の抽出および解析が可能となる点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する(点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更するが開示されている。
【0003】
また、特許文献2には、イメージデータ内において所定の表現によって指定された領域について、第1の領域指定表現により指定された第1領域と、第1の領域指定表現とは異なる第2の領域指定表現により指定された第2領域とを認識する領域認識部と、イメージデータ内において、文字認識の対象となる領域を指定するための位置情報として、第1領域の位置情報を取得する位置情報取得部と、第2領域内に存在する文字を認識することで得られる文字情報を、位置情報取得部により取得された位置情報により指定される文字認識の対象となる領域についての項目名として取得する項目名取得部とを備える情報処理装置OCR認識結果の文字列が同じ画像の分類を行い、文字列に対応する画像の領域を重ね合わせて合成を行い、分類軸の文字列と合成画像の文字列の比較を行い、合成した画像すべてに対して一括で修正処理を行うが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2007-233900
【文献】特開2012-194879
【発明の概要】
【発明が解決しようとする課題】
【0005】
書式を定義するための作業を容易にする書式定義装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明に係る書式定義装置は、入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定部と、前記色領域特定部により特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定部と、前記入力画像における、前記入力領域決定部により決定された入力領域の位置を書式情報として出力する書式情報出力部とを有する。
【0007】
好適には、前記入力画像は帳票画像であり、前記入力領域決定部は、前記色領域特定部により特定された領域から、最も近い罫線までの領域を入力領域とする。
【0008】
好適には、前記入力領域決定部は、前記色領域特定部により特定された領域を基準として、文字列が配列される方向の上流側及び下流側に、前記入力領域を拡張する。
【0009】
好適には、前記入力領域決定部により前記入力領域を拡張できる範囲を、背景色とは異なる色が存在する領域までに制限する拡張制限部をさらに有する。
【0010】
好適には、前記入力領域決定部により前記入力領域を拡張できる距離に関して、文字列が配列された方向を、文字列の配列方向と直交する方向よりも大きく許容する拡張制限部をさらに有する。
【0011】
好適には、前記色領域特定部により特定された領域の色に応じて、前記入力領域決定部により決定された入力領域の属性を設定する属性設定部をさらに有し、前記書式情報出力部は、前記入力領域決定部により決定された入力領域の位置と、前記属性設定部により設定された属性とを書式情報として出力する。
【0012】
好適には、前記色領域特定部により特定された領域の色に応じて、前記入力領域決定部により決定された入力領域に入力される文字種を設定する属性設定部をさらに有し、前記入力領域決定部は、前記色領域特定部により特定された領域を基準として、文字列が配列される方向の上流側及び下流側、及び、文字列の配列方向に直交する方向に、前記入力領域を拡張し、前記書式情報出力部は、前記入力領域決定部により決定された入力領域の位置と、前記属性設定部により設定された文字種とを書式情報として出力し、前記入力領域決定部は、前記入力領域に設定された文字種が手書き文字である場合に、文字列の配列方向と直交する方向の拡張量を、設定された文字種が活字である場合よりも大きくする。
【0013】
好適には、ユーザの操作に応じて、入力領域に設定する属性と、色とを互いに関連付けて登録する色登録部と、前記色登録部に登録されている色と類似する色の新規登録が要求された場合に、警告表示を行う警告表示部とをさらに有し、前記属性設定部は、前記色領域特定部により特定された領域の色と、前記色登録部に登録されている色とに基づいて、前記入力領域決定部により決定された入力領域の属性を設定する。
【0014】
好適には、前記書式情報はOCR処理の定義情報であり、前記属性設定部は、前記色領域特定部により特定された領域の色に応じて、前記入力領域決定部により決定された入力領域を、OCR処理の対象外に設定する。
【0015】
好適には、前記入力画像のうち、前記入力領域決定部により入力領域に決定された領域を、単一の色で塗り潰す塗潰し部をさらに有し、前記書式情報出力部は、前記塗潰し部により塗り潰された入力画像に関付けて、書式情報を出力する。
【0016】
また、本発明に係る書式定義方法は、コンピュータが、入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定ステップと、コンピュータが、前記色領域特定ステップにより特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定ステップと、コンピュータが、前記入力画像における、前記入力領域決定ステップにより決定された入力領域の位置を書式情報として出力する書式情報出力ステップとを有する。
【0017】
また、本発明に係るプログラムは、入力画像から、予め指定された色が連続して存在する領域を特定する色領域特定ステップと、前記色領域特定ステップにより特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する入力領域決定ステップと、前記入力画像における、前記入力領域決定ステップにより決定された入力領域の位置を書式情報として出力する書式情報出力ステップとをコンピュータに実行させる。
【発明の効果】
【0018】
書式を定義するための作業を容易にする書式定義装置を提供できる。
【図面の簡単な説明】
【0019】
図1】書式定義システム1の全体構成を例示する図である。
図2】(A)及び(B)は、色マーカーを用いた書式定義の課題を例示し、(C)及び(D)は、書式定義システム1における書式定義の概要を説明する図である。
図3】書式定義装置2のハードウェア構成を例示する図である。
図4】書式定義装置2の機能構成を例示する図である。
図5】書式定義装置2による書式定義処理(S10)を説明するフローチャートである。
図6】書式定義装置2による色登録処理(S20)を説明するフローチャートである。
図7図5の入力領域決定処理(S120)をより詳細に説明するフローチャートである。
図8】(A)は、マーカー設定画面900の表示例であり、(B)は、マーカー設定情報を例示する図である。
図9】マーカーが付された帳票画像を例示する図である。
図10】帳票の入力欄内の一部に色マーカーが塗られた場合に、入力領域決定部310により決定される入力領域を例示する図である。
図11】入力欄が存在しない帳票において、文字列に色マーカーが塗られた場合に、入力領域決定部310により決定される入力領域を例示する図である。
図12】OCR処理の定義情報を例示する図である。
【発明を実施するための形態】
【0020】
本発明の実施形態を、図面を参照して説明する。
図1は、書式定義システム1の全体構成を例示する図である。
図1に例示するように、書式定義システム1は、書式定義装置2と、スキャナ装置4とを含み、ネットワーク7を介して互いに接続している。複数のスキャナ装置4A及びスキャナ装置4Bを併せてスキャナ装置4と称する。
書式定義装置2は、コンピュータ端末であり、スキャナ装置4から受信した画像データに基づいて、書式を定義し、定義された書式を示す書式情報を出力する。本例の書式定義装置2は、スキャナ装置4から受信した帳票の画像データに基づいて、帳票に対するOCR(Optical Character Recognition)処理を定義する定義情報を生成し、さらに、受信した画像データを加工して未記入の帳票画像データを生成し、生成された未記入の帳票画像データ及び定義情報を外部に送信する。
【0021】
スキャナ装置4は、光学式の読取装置であり、原稿から取得した画像データを書式定義装置2に送信する。本例において、スキャナ装置4は、色マーカーが付された帳票をスキャンするものとする。
【0022】
近年AI-OCR等の登場によりビジネスの場におけるOCRの活用シーンが広がっている。しかし、OCRソフトウェアで帳票を認識し文字化を行うためには、OCRソフトウェアを用いて、読み取り項目に合わせたOCR定義を作成しなければならない。ただし、OCRソフトウェアの習熟度、認識したい項目の数等、帳票によってはOCR定義作成に時間がかかるため、できる限り操作や手順を簡略化し、OCRを初めて利用する人にもすぐに使用できるようなOCRソフトウェアが求められている。
一般的には、ユーザインタフェースを通じて、画像上に領域を指定するが、OCRソフトウェアの仕様を理解する必要があり、初めて利用するユーザにとっては、操作が難しい。これを解決する手段として、図1の構成において、蛍光ペンなどの色マーカーを使用して原紙に直接認識領域を記入させる手法があるが、以下のような課題がある。
【0023】
図2(A)及び(B)は、色マーカーを用いた書式定義の課題を例示し、図2(C)及び(D)は、書式定義システム1における書式定義の概要を説明する図である。
図2(A)に例示するように、互いに隣接する入力項目を指定する場合には、色マーカー同士が重ならないよう記入する必要がある。しかし、入力領域(認識領域)をなるべく広く取ろうとすると、色マーカー同士が接触し易くなり、記入には慎重な作業が必要となる。
また、図2(B)に例示するように、帳票に印刷された文字を囲むことにより入力領域(識別領域)を指定した場合、他の帳票では文字数が多くなり入力領域(識別領域)から、入力文字列(本例では、数字)がはみ出てしまう場合がある。そのため、余裕を持たせた入力領域を見極めた上で記入をしなければならない。これらを入力項目ごとに行うことは煩雑であるし、考慮漏れの入力項目も発生しかねない。また周辺余白が狭い場合には慎重な記入が必要となる。
【0024】
そこで、本例の書式定義システム1では、このように原紙に直接、色マーカーで記入して入力領域(認識領域)を指定する際の作業を単純化し、OCR定義の作成を簡易に行うことができるようにする。すなわち、本例の書式定義システム1において、色マーカーによる入力領域(対象領域)の指定は、原紙の対象文字上にラインを引いて指定するか、対象を矩形で囲むことで行う。その原紙を書式定義システム1で読み込み、色マーカー指定領域を特定するが、指定された領域そのままを使用するのではなく、次のように周辺領域の状況を見て領域を拡張することで、入力領域(識別領域)を広くとったOCR定義が自動的に作成できるようになる。
【0025】
まず、本例の書式定義システム1は、図2(C)に例示するように、色マーカー記入の際は、枠線上にマーカーを引かずに、枠内の空白部分にマーカーで矩形領域を記入する。次に、領域判定処理を行う際に、マーカー記入された矩形領域の周囲に罫線がある場合には、その罫線に隣接するように入力領域(識別領域)を拡大させる。これにより、対象項目のマス目にフィットした入力領域(識別領域)を生成することができる。
【0026】
また、本例の書式定義システム1では、図2(D)に例示するように、対象周囲に枠囲いの無い場合でも、識別対象領域をなるべく左右に広く取ることができれば、帳票上の文字列が認識対象領域(入力領域)から外れてしまうことを防止できる。そのため、マーカー記入された矩形領域の左右に余白がある場合、矩形領域を左右に延長する。この際、背景とは色調の異なる何らかの画素(文字・線・イメージなど)が出現するまで広げて行くことで、周辺余白にフィットした入力領域(識別領域)を生成することができる。
【0027】
さらに、本例の書式定義システム1では、読取り領域(入力領域)を識別すると同時にマーカーペンの色を識別し、色に応じて対象項目の文字識別種別(例えば、活字数字、活字日本語、手書き日本語など)を設定することができる。この色と文字識別種別は、ユーザ操作により後からOCRソフトウェアで変更も可能である。
【0028】
図3は、書式定義装置2のハードウェア構成を例示する図である。
図3に例示するように、書式定義装置2は、CPU200、メモリ202、HDD204、ネットワークインタフェース206(ネットワークIF206)、表示装置208、及び、入力装置210を有し、これらの構成はバス212を介して互いに接続している。
CPU200は、例えば、中央演算装置である。
メモリ202は、例えば、揮発性メモリであり、主記憶装置として機能する。
HDD204は、例えば、ハードディスクドライブ装置であり、不揮発性の記録装置としてコンピュータプログラム(例えば、図4の書式定義プログラム3)やその他のデータファイルを格納する。
ネットワークIF206は、有線又は無線で通信するためのインタフェースであり、例えば、スキャナ装置4との通信を実現する。
表示装置208は、例えば、液晶ディスプレイである。
入力装置210は、例えば、キーボード及びマウスである。
【0029】
図4は、書式定義装置2の機能構成を例示する図である。
図4に例示するように、本例の書式定義装置2には、書式定義プログラム3がインストールされる。
書式定義プログラム3は、色領域特定部300、入力領域決定部310、拡張制限部320、色登録部330、警告表示部340、属性設定部350、塗潰し部360、及び書式情報出力部370を有する。
なお、書式定義プログラム3の一部又は全部は、ASICなどのハードウェアにより実現されてもよく、また、OS(Operating System)の機能を一部借用して実現されてもよい。
【0030】
書式定義プログラム3において、色領域特定部300は、入力画像から、予め指定された色が連続して存在する領域を特定する。本例の色領域特定部300は、スキャナ装置4から受信した帳票の画像データから、予め指定された色のマーカーが付された領域を特定する。予め指定された色は、例えば、色登録部330により登録された色である。
【0031】
入力領域決定部310は、色領域特定部300により特定された領域と、この領域の周囲の余白とを含む領域を、入力領域に決定する。入力領域とは、帳票の画像において、ユーザが入力すべき領域であり、例えば、OCR処理の対象となるOCR対象領域である。より具体的には、入力領域決定部310は、色領域特定部300により特定された領域を基準として、文字列が配列される方向、及び、文字列の配列方向に直交する方向に、領域を拡張して、入力領域とする。本例の入力領域決定部310は、拡張制限部320による制限に従って、色領域特定部300により特定された領域を、文字列が配列される方向、及び、文字列の配列方向に直交する方向に拡張して、入力領域とする。
【0032】
拡張制限部320は、入力領域決定部310による領域拡張を、最も近い罫線までに制限する。これにより、入力決定部310は、色領域特定部300により特定された領域から、最も近い罫線までの領域を入力領域とする。
また、拡張制限部320は、入力領域決定部310による領域拡張を、背景色とは異なる色が存在する領域までに制限する。これにより、入力決定部310は、色領域特定部300により特定された領域から、背景とは色調の異なる何らかの画素(文字・線・イメージなど)が出現するまで広げて、周辺余白にフィットした入力領域を生成できる。
【0033】
さらに、拡張制限部320は、入力領域決定部310による領域拡張を、文字列が配列された方向に関して、文字列の配列方向と直交する方向よりも大きく許容する。これにより、入力決定部310は、文字列方向の上流側及び下流側により大きく拡張して、文字列がはみ出しにくい入力領域を確保できる。
また、拡張制限部320は、入力領域に設定された文字種が手書き文字である場合に、文字列の配列方向と直交する方向の拡張量を、設定された文字種が活字である場合よりも大きく許容する。これにより、入力決定部310は、入力領域に設定された文字種が手書き文字である場合に、設定された文字種が活字である場合よりも、文字列の配列方向と直交する方向に広い入力領域を生成し、手書き入力しやすい入力欄を提供できる。手書き文字は、活字に比べて変位しやすく、より広い記入欄を要するからである。
【0034】
色登録部330は、ユーザの操作に応じて、入力領域に設定する属性と、色とを互いに関連付けて登録する。設定される属性は、例えば、文字種(手書き数字、活字数字、手書きアルファベット、活字アルファベット、手書き漢字等)、OCR処理の要否、OCR処理結果の出力先等である。本例の色登録部330は、図8(A)に例示するマーカー設定画面900において、属性及び色の組み合わせの登録を受け付け、受け付けた情報に基づいて、図8(B)に例示するマーカー設定情報を生成する。例えば、マーカー設定情報には、色に関連付けて、入力領域に記入される文字種、入力領域に対するOCR処理の要否、及び、入力領域に対する塗潰しの要否などが含まれる。
【0035】
警告表示部340は、色登録部に登録されている色と類似する色の新規登録が要求された場合に、警告表示を行う。本例の警告表示部340は、図8(A)のマーカー設定画面900において、既登録の色と同一又は類似の色が選択された場合に、警告を表示する。
【0036】
属性設定部350は、色領域特定部300により特定された領域の色に応じて、入力領域決定部310により決定された入力領域の属性を設定する。本例の属性設定部350は、色登録部330により登録されたマーカー設定情報に基づいて、色領域特定部300により特定された領域の色に対応する属性を、入力領域決定部310により決定された入力領域に設定する。例えば、属性設定部350は、色領域特定部300により特定された領域の色に応じて、入力領域決定部310により決定された入力領域を、OCR処理の対象外に設定する。OCR処理の対象外を積極的に定義することにより、OCR処理全体の精度向上が期待できる。
【0037】
塗潰し部360は、入力画像のうち、入力領域決定部310により入力領域に決定された領域を、単一の色で塗り潰す。本例の塗潰し部360は、図8(B)のマーカー設定情報に従って、スキャナ装置4から受信した帳票の画像データのうち、入力領域決定部310により入力領域に決定された領域の一部を背景色で塗り潰す。
【0038】
書式情報出力部370は、入力領域決定部310により決定された入力領域の位置と、属性設定部350により設定された属性とを書式情報として出力する。本例の書式情報出力部370は、入力領域決定部310により決定された入力領域の位置と、属性設定部350により設定された属性とを書式情報とし、塗潰し部360により一部の入力領域が塗り潰された帳票画像データを未記入帳票として出力する。
【0039】
図5は、書式定義装置2による書式定義処理(S10)を説明するフローチャートである。なお、本例では、図9に例示する帳票(マーカーが付された帳票)がスキャナ装置4によりカラースキャンされ、この画像データが書式定義装置2に送信されることを前提とする。また、元の帳票がカラーである場合には、モノクロコピーによってモノクロ化した帳票を用いてマーカーを付す。
図5に例示するように、ステップ100(S100)において、書式定義装置2の色領域特定部300(図4)は、スキャナ装置4から、マーカーが付された帳票画像データ(図9)を取得する。
【0040】
ステップ105(S105)において、色領域特定部300は、取得した帳票画像データ(図9)から、色登録部330に登録された色が連続する色領域(マーカー領域)を特定する。
ステップ110(S110)において、属性設定部350は、図8(B)のマーカー設定情報を参照して、色領域特定部300により特定された色領域の色に対応する属性を特定する。色の特定は、例えば、色領域を取り出し、取り出した画像内に含まれる色情報をピクセル単位で識別し、黒・白・グレー付近の色(判定除外色)を除く最頻値の色を、色領域の色とする。色情報の特定に用いるピクセルは全ピクセルでもサンプリングしたピクセルでも良い。
ステップ115(S115)において、拡張制限部320は、色領域特定部300により特定された色領域のアスペクト比に基づいて、文字列の配列方法を特定し、特定された文字列配列方向と、属性設定部350により特定された属性(文字種)とに基づいて、拡張の上限範囲を決定する。上限範囲は、例えば、色領域の端部からの距離として予め設定され、文字列方向は、これと直交する方向よりも大きい値である。上限範囲は、ユーザにより変更可能な範囲である。
【0041】
ステップ120(S120)において、入力領域決定部310は、図10及び図11に例示するように、拡張制限部320による制限(黒画素、罫線、又は上限範囲)に従いながら、色領域特定部300により特定された色領域を拡張し、拡張された領域を入力領域に決定する。
【0042】
ステップ125(S125)において、書式定義プログラム3は、取得した帳票画像データに含まれる全ての色領域(マーカー領域)について、S105~S120の処理が完了したか否かを判定し、未処理の色領域が存在する場合に、S105の処理に戻って次の色領域を特定し、未処理の色領域が存在しない場合に、S130の処理に移行する。
【0043】
ステップ130(S130)において、塗潰し部360は、図8(B)のマーカー設定情報に従って、スキャナ装置4から取得した帳票画像データのうち、入力領域決定部310により決定された入力領域を背景色で塗り潰し、未記入帳票の画像データを生成する。
【0044】
ステップ135(S135)において、書式情報出力部370は、図12に例示するように、入力領域決定部310により決定された入力領域の座標と、属性設定部350により特定された各入力領域の属性との組合せをOCR定義情報とする。
ステップ140(S140)において、書式情報出力部370は、生成されたOCR定義情報と、塗潰し部360により生成された未記入帳票画像データとを外部に送信する。
【0045】
このように、書式定義処理(S10)によって、色マーカーが付された色領域を拡張して、入力領域が定義され、各入力領域に対して、色領域の色に対応する属性(文字種等)が設定される。
【0046】
図6は、書式定義装置2による色登録処理(S20)を説明するフローチャートである。
図6に例示するように、ステップ200(S200)において、OCR処理装置2の色登録部330(図4)は、図8(A)のマーカー設定画面900を表示して、ユーザによる色の指定操作を受け付ける。色の指定操作は、例えば、カラーパレットなどを用いて任意の色を指定することができる。
ステップ205(S205)において、警告表示部340は、ユーザにより指定された色と、色登録部330により登録されている色とを比較して、非類似であるか否かを判定する。書式定義プログラム3は、既登録の色と非類似であると判定された場合に、S210の処理に移行し、既登録の色と同一又は類似であると判定された場合に、S215の処理に移行する。色の比較は、例えば、色差の計測に基づいて行われる。
【0047】
ステップ210(S210)において、色登録部330は、ユーザの操作に応じて、ユーザにより指定された色に関連付けて、文字種、項目名、OCR処理の要否、及び塗潰しの要否を入力領域の属性として設定する。文字種は、例えば、活字、手書き、日本語、数字、英字、記号などであり、項目名は、例えば、郵便番号、住所、氏名、商品名称などである。
ステップ215(S215)において、警告表示部340は、ユーザに対して警告表示を行い、指定した色の変更を促す。
【0048】
このように、色登録処理(S20)によって、入力領域に付される色と、属性とを互いに関連付けたマーカー設定情報が設定される。
【0049】
図7は、図5の入力領域決定処理(S120)をより詳細に説明するフローチャートである。
図7に例示するように、ステップ1200(S1200)において、拡張制限部320は、設定した上限範囲内で、色領域特定部300により特定された色領域の周囲に存在する罫線を探索する。
ステップ1205(S1205)において、書式定義プログラム3は、上限範囲内で罫線が発見された場合に、S1210の処理に移行し、上限範囲内で罫線が発見されなかった場合に、S1215の処理に移行する。
ステップ1210(S1210)において、入力領域決定部310は、拡張制限部320により発見された罫線まで、入力領域を拡張する。
【0050】
ステップ1215(S1215)において、拡張制限部320は、設定した上限範囲内で、色領域特定部300により特定された色領域の周囲に存在する黒画素(非背景画素)を探索する。
ステップ1220(S1220)において、書式定義プログラム3は、上限範囲内で黒画素(非背景画素)が発見された場合に、S1225の処理に移行し、上限範囲内で黒画素が発見されなかった場合に、S1230の処理に移行する。
【0051】
ステップ1225(S1225)において、入力領域決定部310は、拡張制限部320により発見された黒画素(非背景画素)まで、入力領域を拡張する。
ステップ1230(S1230)において、入力領域決定部310は、拡張制限部320により設定された上限範囲まで、入力領域を拡張する。
【0052】
図10は、帳票の入力欄内の一部に色マーカーが塗られた場合に、入力領域決定部310により決定される入力領域を例示する図である。
図10に例示するように、入力欄に記載された文字列に色マーカーを塗った場合も、入力欄の内側に矩形で色マーカーを塗った場合も、周囲の罫線まで入力領域が拡張され、同様に、入力欄一杯まで拡張された入力領域が定義される。
【0053】
図11は、入力欄が存在しない帳票において、文字列に色マーカーが塗られた場合に、入力領域決定部310により決定される入力領域を例示する図である。
図11に例示するように、横書きの文字列に色マーカーが塗られた場合には、色領域のアスペクト比から横書きであると判定され、上下方向よりも左右方向に、より大きく拡張された入力領域が定義される。一方、縦書きの文字列に色マーカーが塗られた場合には、左右方向よりも上下方向に、より大きく拡張された入力領域が定義される。これにより、入力領域に記入される文字列の長さが多少変動しても、入力領域からはみ出しにくくなる。
【0054】
以上説明したように、本実施形態の書式定義システム1によれば、色マーカーが記入された色領域を基準として、罫線や黒画素が存在する位置まで拡張して、入力領域を定義することにより、色マーカーによる指定作業を簡易にし、かつ、記入しやすい入力領域を定義することができる。
また、本例の書式定義システム1によれば、色マーカーの色によって、入力領域の属性を設定することができる。
【0055】
[変形例]
上記実施形態では、OCR処理の定義情報を生成する場合を具体例として説明したが、これに限定されるものではなく、OCR処理以外の用途で書式を定義してもよい。
また、上記実施形態では、指定した色のマーカーが付された領域をOCR処理の対象外とする場合を説明したが、マーカーが存在しない領域を全てOCR処理の対象外としてもよい。
また、上記実施形態では、書式定義情報と、未記入帳票画像データをセットで提供する形態を説明したが、未記入帳票画像データのみの作成に使用してもよい。その際、入力領域の塗潰しは、白色だけでなく、入力領域周辺の背景色や、ユーザ指定の任意の色を用いてもよい。
【符号の説明】
【0056】
1…書式定義システム
2…書式定義装置
3…書式定義プログラム
300…色領域特定部
310…入力領域決定部
320…拡張制限部
330…色登録部
340…警告表示部
350…属性設定部
360…塗潰し部
370…書式情報出力部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12