IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社PFUの特許一覧

特許7532171画像判定装置、画像判定方法、及びプログラム
<>
  • 特許-画像判定装置、画像判定方法、及びプログラム 図1
  • 特許-画像判定装置、画像判定方法、及びプログラム 図2
  • 特許-画像判定装置、画像判定方法、及びプログラム 図3
  • 特許-画像判定装置、画像判定方法、及びプログラム 図4
  • 特許-画像判定装置、画像判定方法、及びプログラム 図5
  • 特許-画像判定装置、画像判定方法、及びプログラム 図6
  • 特許-画像判定装置、画像判定方法、及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-02
(45)【発行日】2024-08-13
(54)【発明の名称】画像判定装置、画像判定方法、及びプログラム
(51)【国際特許分類】
   G06V 30/18 20220101AFI20240805BHJP
   G06V 30/10 20220101ALI20240805BHJP
   G06V 30/226 20220101ALI20240805BHJP
   G06K 11/00 20060101ALI20240805BHJP
【FI】
G06V30/18 A
G06V30/10
G06V30/226
G06K11/00
【請求項の数】 9
(21)【出願番号】P 2020157544
(22)【出願日】2020-09-18
(65)【公開番号】P2022051199
(43)【公開日】2022-03-31
【審査請求日】2023-03-17
(73)【特許権者】
【識別番号】000136136
【氏名又は名称】株式会社PFU
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】豊田 裕史
(72)【発明者】
【氏名】岸川 直樹
【審査官】秦野 孝一郎
(56)【参考文献】
【文献】特開2000-181993(JP,A)
【文献】特開2000-339408(JP,A)
【文献】特開2009-015876(JP,A)
【文献】特開2003-308483(JP,A)
【文献】特開平11-296618(JP,A)
【文献】特開平08-123898(JP,A)
【文献】特開平01-014682(JP,A)
【文献】特開平04-273391(JP,A)
【文献】特開平01-259476(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/00-30/424
G06K 11/00
(57)【特許請求の範囲】
【請求項1】
入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定部と、
前記部分判定部による複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定部と
を有する画像判定装置。
【請求項2】
前記部分判定部は、ユーザが指定した複数の入力項目に関して、手書きであるか否かを判定し、
前記全体判定部は、ユーザが指定した全ての入力項目の判定結果に基づいて、前記帳票画像の手書きであるか活字であるかを判定する。
請求項1に記載の画像判定装置。
【請求項3】
前記全体判定部は、各入力項目に対する判定結果と、各入力項目に入力された文字数とに基づいて、前記帳票画像が手書きであるか否かを判定する
請求項2に記載の画像判定装置。
【請求項4】
入力された帳票画像から、互いに連続する有色画素の塊を抽出する塊抽出部
をさらに有し、
前記部分判定部は、前記塊抽出部により抽出された複数の有色画素塊の相対位置に基づいて、入力要素が手書きであるか活字であるかを判定する
請求項1~のいずれか一項に記載の画像判定装置。
【請求項5】
前記部分判定部は、前記塊抽出部により抽出された有色画素塊の上端部又は下端部の位置を比較して、入力要素が手書きであるか活字であるかを判定する
請求項4に記載の画像判定装置。
【請求項6】
前記部分判定部は、前記塊抽出部により抽出された有色画素塊の上端部又は下端部の位置の変動が基準以上である場合に、手書きであると判定し、抽出された有色画素塊の上端部又は下端部の位置の変動が基準値未満である場合に、活字であると判定する
請求項5に記載の画像判定装置。
【請求項7】
前記部分判定部は、同一の入力項目に対して、複数行の入力文字列が存在する場合、文
字数が最大の入力文字列についてのみ、手書きであるか否かを判定する
請求項1~のいずれか一項に記載の画像判定装置。
【請求項8】
コンピュータが、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定ステップと、
コンピュータが、前記部分判定ステップによる複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定ステップと
を有する画像判定方法。
【請求項9】
入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定ステップと、
前記部分判定ステップによる複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定ステップと
コンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像判定装置、画像判定方法、及びプログラムに関する。
【背景技術】
【0002】
例えば、特許文献1には、文書を画像データに変換して得られる文書画像から文字列を抽出し、前記文字列中の各文字の高さ方向の中心位置を求め、全文字の高さ方向の中心位置の規則性により前記文字列が手書き文字か活字かを判別し、該判別結果に基づき文字認識を行う文字認識方法であって、文字列に含まれる濁点を含めずに求めた前記文字の中心位置の規則性により、手書き文字と活字の判別を行うことを特徴とする文字認識方法が開示されている。
【0003】
また、特許文献2には、入力画像より文字群を抽出し、抽出した文字群から手書き文字と印刷活字の判定を行うための所定数の特徴量を抽出し、抽出した特徴量から前記文字群が印刷活字であるか手書き文字であるかを判定して、その判定結果に従い、手書き文字認識用の辞書を用いた文字認識処理、若しくは印刷活字認識用の辞書を用いた文字認識処理を実行する文字認識方法に於いて、前記文字群が印刷活字であるか手書き文字であるかを判定する処理に、前記抽出した特徴量の各々について、値が求まる場合はその値の関数を、値が不定である場合は予め定められた定数を、それぞれ注目する特徴量に対応する関数値として取得するステップと、前記ステップで取得した関数値をもとに前記判定に用いる評価値を求めるステップと、前記ステップで求めた評価値が予め定められた閾値未満であるか否かにより、前記抽出した文字群が手書き文字であるか印刷活字であるかを判定するステップとを具備したことを特徴とする文字認識方法が開示されている。
【0004】
また、特許文献3には、帳票を画像データに変換して得られる画像から、前記帳票の文字記入欄を抽出し、文字記入欄の文字が手書き文字か活字かを判別し、該判別結果に基づき文字認識を行う文字認識方法であって、前記帳票のレイアウトを解析して、項目領域とそれに続く文字記入欄にグループ分けし、項目領域の文字認識を行って認識結果に基づきそれに続く文字記入欄の字種を判定し、上記字種判定結果により、上記グループ毎に項目領域に続く文字記入欄の字種を限定して手書き/活字判別を行うことを特徴とする文字認識方法が開示されている。
【0005】
さらに、特許文献4には、文字列を含む文字列画像に対して、細線情報に変換する細線変換手段と、前記細線変換手段によって細線となった文字列画像内に矩形領域を設定する領域設定手段と、前記領域設定手段によって設定された矩形領域に対して、ハフ変換を行うハフ変換手段と、前記ハフ変換手段によるハフ変換の処理結果の線分の角度情報と、その高さ情報を特徴として抽出する特徴抽出手段と、前記特徴抽出手段によって抽出された特徴に基づいて、前記文字列画像内の文字列は活字又は手書きのいずれであるかを判定する判定手段を具備することを特徴とする画像処理装置が開示されている。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2000-331122
【文献】特開2004-94734
【文献】特開2009-15876
【文献】特開2012-22359
【発明の概要】
【発明が解決しようとする課題】
【0007】
手書き文字又は活字を判定することにより、より帳票の認識精度を向上させる画像判定装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明に係る画像判定装置は、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定部と、前記部分判定部による複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定部とを有する。
【0009】
好適には、前記部分判定部は、ユーザが指定した複数の入力項目に関して、手書きであるか否かを判定し、前記全体判定部は、ユーザが指定した全ての入力項目の判定結果に基づいて、前記帳票画像の手書きであるか活字であるかを判定する。
【0010】
好適には、前記全体判定部は、各入力項目に対する判定結果と、各入力項目に入力された文字数とに基づいて、前記帳票画像が手書きであるか否かを判定する。
【0011】
好適には、互いに連続する有色画素の塊を抽出する塊抽出部をさらに有し、前記部分判定部は、前記塊抽出部により抽出された複数の有色画素塊の相対位置に基づいて、入力要素が手書きであるか活字であるかを判定する。
【0012】
好適には、前記部分判定部は、前記塊抽出部により抽出された有色画素塊の上端部又は下端部の位置を比較して、入力要素が手書きであるか活字であるかを判定する。
【0013】
好適には、前記部分判定部は、前記塊抽出部により抽出された有色画素塊の上端部又は下端部の位置の変動が基準以上である場合に、手書きであると判定し、抽出された有色画素塊の上端部又は下端部の位置の変動が基準値未満である場合に、活字であると判定する。
【0014】
好適には、前記部分判定部は、同一の入力項目に対して、複数行の入力文字列が存在する場合、文字数が最大の入力文字列についてのみ、手書きであるか否かを判定する。
【0015】
本発明に係る画像判定装置は、入力された画像から、互いに連続する有色画素の塊を抽出する塊抽出部と、前記塊抽出部により抽出された複数の塊の相対的な位置に基づいて、抽出された有色画素の塊が手書きであるか否かを判定する手書き判定部とを有する。
【0016】
本発明に係る画像判定方法は、コンピュータが、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定ステップと、コンピュータが、前記部分判定ステップによる複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定ステップとを有する。
【0017】
本発明に係るプログラムは、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定ステップと、前記部分判定ステップによる複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定ステップとコンピュータに実行させる。
【発明の効果】
【0018】
手書き文字又は活字を判定することにより、より帳票の認識精度を向上させる画像判定置を提供することを目的とする。
【図面の簡単な説明】
【0019】
図1】画像判定システム1の全体構成を例示する図である。
図2】画像判定装置7のハードウェア構成を例示する図である。
図3】画像判定装置7の機能構成を例示する図である。
図4】(a)は、複数行に跨る入力要素において、行毎の分割を例示する図であり、(b)は、手書き文字と活字との場合における黒ラン(黒色画素塊)の高さの変動の特徴を例示する図であり、(c)は、手書き文字と活字との場合における黒ラン(黒色画素塊)の書き始めの位置の変動の特徴を例示する図である。
図5】全体判定部714による有色画素塊数に基づいた判定方法を例示する表である。
図6】文字認識までの全体処理(S10)を説明するフローチャートである。
図7】文字種判定処理(S20)を説明するフローチャートである。
【発明を実施するための形態】
【0020】
[背景]
本発明がなされた背景を説明する。
自治体などにおいて公開されている帳票(各種申請書)は、窓口等で紙により配布、また、Webサイトからエクセル形式の帳票をダウンロードすることができる。紙で配布される帳票は、手書き文字により記入され、エクセル形式の帳票は、エクセル上で活字により入力する。したがって、帳票は、手書き文字による帳票と活字による帳票とが存在する。そこで、OCRは、一般的に、手書き文字に最適化した文字認識手法と、活字に最適化した文字認識手法が分かれている。そのため、認識精度を上げるために、帳票が手書き文字であるのか活字であるのかを判定する必要がある。例えば、人が予め、帳票を手書き文字によるものと、活字によるものとに振り分けたり、エクセル形式の帳票を印刷する場合のみ、帳票にQRコード(登録商標)を印刷して両者を振り分けている。
【0021】
しかし、人手の作業が増えるため非効率であり、また、QRコード(登録商標)を印刷するために帳票を変更する必要があり、さらに、QRコード(登録商標)の印刷領域が必要となるが、項目の多い帳票において、QRコード(登録商標)の印字領域の確保が困難である。
そこで、本発明は、OCRの前段において、帳票が手書き文字により記入されたものであるか、活字により入力されたものであるのかを、人手によらず、QRコード(登録商標)の印字領域を必要とせず、画像判定装置7により、判定する。具体的には、画像判定装置7は、人の手書き文字の特徴に基づいて、帳票が手書き文字であるのか活字であるのかを判定することにより、これらの課題を解決し、且つ、文字種の判定精度をより向上させるものである。
【0022】
本発明の実施形態を、図面を参照して説明する。
図1は、画像判定システム1の全体構成を例示する図である。
図1に例示するように、画像判定システム1は、複数のユーザ端末3a、ユーザ端末3b、複数のスキャナ5a、スキャナ5b、及び画像判定装置7を含み、ネットワーク9を介して互いに接続している。ユーザ端末3a及びユーザ端末3bを併せてユーザ端末3と称し、スキャナ5a及びスキャナ5bを併せてスキャナ5と称する。
ユーザ端末3は、コンピュータ端末であり、ユーザにより操作される。具体的には、ユーザ端末3は、帳票の文字種を判定するための入力項目、すなわち、判定対象項目を、ユーザにより受け付ける。ここで、帳票において、項目名と、項目名に関連づく入力箇所とを併せて入力項目という。例えば、項目名は、「氏名」であり、入力箇所は、「氏名」を表す文字が入力される。
【0023】
スキャナ5は、光学式の読取装置で取得した画像データを画像判定装置7に送信する。本例において、スキャナ5は、帳票をスキャンするものとする。スキャナ5は、手書き文字により記入された各種申請書類、又は、活字により入力され印刷された各種申請書類などの帳票をスキャンする。
画像判定装置7は、コンピュータ端末であり、スキャナ5から受信した画像データが、手書き文字による帳票であるのか、活字による帳票であるのかを判定する。具体的には、画像判定装置7は、ユーザ端末3を介して受け付けた、判定対象項目毎に文字種を判定し、判定対象項目毎の判定結果に基づいて、帳票全体が手書き文字、または活字によるものかを判定する。
なお、処理対象の帳票にOCRの対象項目は一つ以上存在し、且つ、1枚の帳票には、手書き文字と活字が混在しないものとする。また、本例では、画像判定装置7とスキャナ5がネットワーク9で接続している形態を説明するが、これに限定されるものではなく、例えば、USB(Universal Serial Bus)ケーブルを介してスキャナ5が直接、画像判定装置7に接続してもよいし、スキャナ5がUSBケーブルを介してユーザ端末3に接続し、このユーザ端末3を経由して画像判定装置7に画像データを送信してもよい。
【0024】
図2は、画像判定装置7のハードウェア構成を例示する図である。
図2に例示するように、画像判定装置7は、CPU200、メモリ202、HDD204、ネットワークインタフェース206(ネットワークIF206)、表示装置208、及び、入力装置210を有し、これらの構成はバス212を介して互いに接続している。
CPU200は、例えば、中央演算装置である。
メモリ202は、例えば、揮発性メモリであり、主記憶装置として機能する。
HDD204は、例えば、ハードディスクドライブ装置であり、不揮発性の記録装置としてコンピュータプログラム(例えば、図3の画像判定プログラム70)やその他のデータファイル(例えば、項目判定結果データベース600)を格納する。
ネットワークIF206は、有線又は無線で通信するためのインタフェースであり、例えば、内部ネットワーク9における通信を実現する。
表示装置208は、例えば、液晶ディスプレイである。
入力装置210は、例えば、キーボード及びマウスである。
【0025】
図3は、画像判定装置7の機能構成を例示する図である。
図3に例示するように、本例の画像判定装置7には、画像判定プログラム70がインストールされると共に、項目判定結果データベース600(項目判定結果DB600)が構成される。
画像判定プログラム70は、判定項目記憶部700、塊抽出部702、塊相対位置検出部704、行分割部706、塊数検出部708、高さ検出部710、部分判定部712、全体判定部714、及びOCR処理部716を有する。
なお、画像判定プログラム70の一部又は全部は、ASICなどのハードウェアにより実現されてもよく、また、OS(Operating System)の機能を一部借用して実現されてもよい。
また、OCR処理部716は、画像判定装置7が有してもよいし、ユーザ端末3また、その他の端末が有してもよい。
【0026】
画像判定プログラム70において、判定項目記憶部700は、ユーザが指定した複数の入力項目を記憶する。具体的には、判定項目記憶部700は、ユーザ端末3により受け付けた、帳票の文字種を判定するための入力項目である判定対象項目を記憶する。
塊抽出部702は、互いに連続する有色画素の塊を抽出する。ここで、有色画素とは、帳票の背景と視覚により区別できる色の画素をいう。本例の帳票は、白色の背景に黒色の文字が記載されたものであり、塊抽出部702は、帳票画像の白又は黒を判別し、連続する画素、すなわち、黒ランを抽出する。
塊相対位置検出部704は、塊抽出部702により抽出された、複数の有色画素塊の相対位置を検出する。具体的には、塊相対位置検出部704は、塊抽出部702により抽出された有色画素塊の上端部又は下端部の位置を検出する。有色画素塊の上端部の位置とは、有色画素塊のTop(Y座標)であり、有色画素塊の下端部の位置とは、有色画素塊のBottom(Y座標)である。具体的には、塊相対位置検出部704は、一つの判定対象項目に入力された複数の黒ラン(黒色画素塊)のTop(Y座標)の標準偏差を算出する。
【0027】
行分割部706は、同一の入力項目における、複数行に跨る入力文字列を行毎に分割する。具体的には、行分割部706は、図4(a)に例示するように、塊抽出部702により抽出された黒ラン(黒色画素塊)に対して、Y軸基準で分布をとり、多峰性に基づいて、複数行に跨る入力文字列を行毎に分割する。
塊数検出部708は、一つの入力項目の入力箇所に入力された有色画素塊の数を検出する。また、塊数検出部708は、同一の入力項目に対して、複数行の入力文字列が存在する場合、文字数が最大の入力文字列を検出する。具体的には、塊数検出部708は、行分割部706により分割された各行の黒ラン(黒色画素塊)の数を検出し、最大の黒ラン数を有する行を検出する。
高さ検出部710は、塊抽出部702により抽出された有色画素塊の高さを検出する。具体的には、高さ検出部710は、一つの入力項目に入力された複数の有色画素塊の高さの標準偏差を算出する。
【0028】
部分判定部712は、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する。具体的には、部分判定部712は、ユーザが指定した複数の入力項目に関して、手書きであるか否かを判定し、判定結果を入力項目に関連付けて項目判定結果DB600に格納する。手書き文字又は活字を判定するための入力項目をユーザが指定することにより、より判定に有効な入力項目を選出することが可能である。例えば、ユーザが予め判定対象項目を指定することにより、記入文字が一文字しかない項目、丸を付けて選択するだけの入力項目、未記入の入力項目等を省略する、または、より入力文字列が多い入力項目を指定することが可能である。
より具体的には、部分判定部712は、塊相対位置検出部704により検出された複数の有色画素塊の相対位置に基づいて、入力要素が手書き文字であるか活字であるかを判定する。ここで、入力要素とは、入力箇所に入力または記載された内容を構成する文字または記号をいう。
【0029】
また、部分判定部712は、高さ検出部710により検出された有色画素塊の高さに基づいて、入力要素が手書きであるか活字であるかを判定する。具体的には、部分判定部712は、高さ検出部710により算出された、高さの標準偏差が基準以上である場合に、手書きであると判定し、高さの標準偏差が基準値未満である場合に、活字であると判定する。
図4(b)に例示するように、手書き文字の場合、文字の高さが変動しやすく、活字の場合は文字の高さが変動しにくい傾向を利用があるため、有色画素塊の高さの標準偏差を算出し、基準値と比較することが手書き又は活字の判定に有効である。
【0030】
さらに、部分判定部712は、塊相対位置検出部704により検出された有色画素塊の上端部又は下端部の位置を比較して、入力要素が手書きであるか活字であるかを判定する。具体的には、部分判定部712は、塊相対位置検出部704により検出された有色画素塊の上端部又は下端部の位置の変動が基準以上である場合に、手書きであると判定し、抽出された有色画素塊の上端部又は下端部の位置の変動が基準値未満である場合に、活字であると判定する。
図4(c)に例示するように、手書き文字の場合は、書き始めの上端部が変動しやすく、活字の場合は、書き始めの上端部が変動しにくい傾向を利用があるため、黒ラン(有色画素塊)の上端部の位置の標準偏差を算出し、基準値と比較することが手書き又は活字の判定に有効となる。
さらに、部分判定部712は、同一の入力項目に対して、複数行の入力文字列が存在する場合、塊数検出部708により検出された、文字数が最大の入力文字列についてのみ、手書きであるか否かを判定する。
【0031】
全体判定部714は、部分判定部712による複数の入力箇所それぞれの判定結果に基づいて、入力された帳票画像が手書きであるか否かを判定する。具体的には、全体判定部714は、ユーザが指定した全ての入力項目の判定結果に基づいて、帳票画像が手書きであるか活字であるかを判定する。より具体的には、全体判定部714は、各入力項目に対する判定結果と、各入力項目に入力された文字数とに基づいて、帳票画像が手書きであるか否かを判定する。
図5に例示するように、全体判定部714は、部分判定部712により、手書きと判定された判定対象項目の有色画素塊数の合計数と、活字と判定された判定対象項目の有色画素塊数の合計数とに基づいて多数決をとる。全体判定部714は、手書きと判定された有色画素塊数の合計数の方が多い場合に、帳票は手書きであると判定し、活字と判定された有色画素塊数の合計数の方が多い場合に、帳票は活字であると判定する。
【0032】
図6は、文字認識までの全体処理(S10)を説明するフローチャートである。
図6に例示するように、ステップ100(S100)において、画像判定装置7は、スキャナ5により取り込まれた帳票の画像データを取得する。
ステップ105(S105)において、ユーザは、ステップ100において、取得された帳票の画像データの項目からマウス等により、帳票内の項目のうち、OCRの対象となる入力項目をユーザ端末3より指定する。さらに、ユーザは、文字種の判定に使用する判定対象項目を指定する。判定項目記憶部700は、指定した文字種の判定に使用する入力項目、すなわち判定対象項目を記憶する。なお、S105の処理は、同一形式の帳票に関して一度だけ実施されれば足り、同一形式の帳票の画像データが複数回取得される場合には、最初の一回だけでもよい。
ステップ110(S110)において、判定項目記憶部700は、対象入力項目のOCR領域を抽出する。具体的には、判定項目記憶部700は、入力項目の入力箇所に記載された入力要素を抽出する。
【0033】
ステップ115(S115)において、塊抽出部702は、判定項目記憶部700により記憶された判定対象項目の入力箇所に入力されている入力要素の2値化を実施する。入力要素とは、判定対象項目の入力箇所に入力された文字、または記号の画像データである。
ステップ120(S120)において、塊抽出部702は、入力箇所に入力されている入力要素素のうち、互いに連続する有色画素の塊を抽出する。
ステップ125(S125)において、部分判定部712は、各判定対象項目において、有色画素塊の特徴量に基づいて、各判定対象項目の文字種の判定を実施する。
ステップ130(S130)において、全体判定部714は、部分判定部712により判定された各判定対象項目における判定結果と、判定に使用した有色画素塊の数とに基づいて、帳票全体の文字種が手書きであるか、活字であるかを判定する。
ステップ135(S135)において、OCR処理部716は、全体判定部714により判定された文字種に応じた文字認識をOCR対象項目に対して実施する。
【0034】
図7は、文字種判定処理(S20)を説明するフローチャートである。
図7に例示するように、ステップ200(S200)において、ユーザにより指定された一つの判定対象項目において、一番左上の有色画素塊を抽出する。具体的には、塊抽出部702は、判定項目記憶部700に記憶された一つの判定対象項目の入力箇所における、一番左上の黒ランを抽出する。
ステップ205(S205)において、高さ検出部710は、一つの判定対象項目に含まれる有色画素塊の高さを検出する。さらに、高さ検出部710は、高さを検出した有色画素塊のうち、高さが基準値以上の有色画素塊を抽出する。これにより、句読点や、記号等の他の文字と明らかに高さが異なる有色画素塊を判定対象から除外することができる。
ステップ210(S210)において、行分割部706は、塊抽出部702により抽出された有色画素塊に対してY軸基準で分布を取り、双峰性に基づいて、判定対象項目の入力要素を行毎に分割する。
ステップ215(S215)において、塊数検出部708は、行分割部706により分割された行毎の有色画素塊の数を検出する。さらに、塊数検出部708は、行毎の有色画素塊数のうち、最も有色画素塊数が多い行を検出する。これにより、より特徴が顕著に表れる行を判定に使用することができる。
【0035】
ステップ220(S220)において、塊数検出部708により、最も有色画素塊数が多いと判定された行に対して、高さ検出部710は、高さの標準偏差を算出する。高さの標準偏差が基準値を超える場合に、部分判定部712は、判定対象項目に入力された文字を手書き文字と判定し、基準値を超えない場合に、部分判定部712は、判定対象項目に入力された文字を活字と判定する。
ステップ225(S225)において、塊数検出部708により、最も有色画素塊数が多いと判定された行に対して、塊相対位置検出部704は、有色画素塊の上端部の位置を検出する。具体的には、塊相対位置検出部704は、塊数検出部708により、最も有色画素塊数が多いと判定された行に対して、黒ランのTop(Y座標)の標準偏差を算出する。Top(Y座標)の標準偏差が基準値を超える場合に、部分判定部712は、判定対象項目に入力された文字を手書き文字と判定し、基準値を超えない場合に、部分判定部712は、判定対象項目に入力された文字を活字と判定する。
ステップ230(S230)において、部分判定部712は、S220において、手書きと判定し、且つS225において手書きと判定した場合に、判定対象項目の入力要素が手書き文字であると判定する。部分判定部712は、判定対象項目の判定結果を項目判定結果DB600に格納する。
【0036】
ステップ235(S235)において、部分判定部712が、判定項目記憶部700により記憶されたすべての判定対象項目について文字種を判定した場合に(S235:Yes)、文字種判定処理(S20)は、S240へ移行し、すべての判定対象項目について文字種を判定していない場合に(S235:No)、S200へ移行する。
ステップ240(S240)において、全体判定部714は、判定対象項目全ての判定結果に基づいて、帳票画像が手書きであるか活字であるかを判定する。具体的には、全体判定部714は、各判定対象項目の判定に使用した有色画素塊数で多数決をとる。より具体的には、手書きと判定された判定対象項目の有色画素塊数の合計が、活字と判定された判定対象項目の有色画素塊数の合計より多い場合に、全体判定部714は、帳票を手書きであると判定し、活字と判定された判定対象項目の有色画素塊数の合計が、手書きと判定された判定対象項目の有色画素塊数の合計より多い場合に、全体判定部714は、帳票を活字であると判定する。
【0037】
以上説明したように、本実施形態の画像判定装置7によれば、文字種に適したOCR処理を実施するための帳票の文字種を、横書きの場合の手書き文字の特徴に基づいて判定することができる。横書きの場合の手書き文字の特徴とは、例えば、文字の高さが一定ではない、書き始めの位置が変動しやすい等である。これらの特徴は、文字列が長くなるほど顕著であるため、帳票全体における活字または手書き文字の判定は、判定対象項目の文字列の長さ、すなわち文字数により多数決をとるため、画像判定装置7はより精度の高い判定を行うことができる。さらに、判定に使用する判定対象項目をユーザが指定しているため、判定に有効な入力項目のみを指定でき、帳票全体における活字または手書き文字の判定の精度を高めることができる。
【符号の説明】
【0038】
1…画像判定システム
3…ユーザ端末
5…スキャナ
7…画像判定装置
9…ネットワーク
70…画像判定プログラム
700…判定項目記憶部
702…塊抽出部
704…塊相対位置検出部
706…行分割部
708…塊数検出部
710…高さ検出部
712…部分判定部
714…全体判定部
716…OCR処理部
600…項目判定結果データベース
図1
図2
図3
図4
図5
図6
図7