特許7532171 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ＰＦＵの特許一覧

特許7532171画像判定装置、画像判定方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-08-02

(45)【発行日】2024-08-13

(54)【発明の名称】画像判定装置、画像判定方法、及びプログラム

(51)【国際特許分類】

G06V 30/18 20220101AFI20240805BHJP

G06V 30/10 20220101ALI20240805BHJP

G06V 30/226 20220101ALI20240805BHJP

G06K 11/00 20060101ALI20240805BHJP

【ＦＩ】

G06V30/18 A

G06V30/10

G06V30/226

G06K11/00

【請求項の数】 9

(21)【出願番号】P 2020157544

(22)【出願日】2020-09-18

(65)【公開番号】P2022051199

(43)【公開日】2022-03-31

【審査請求日】2023-03-17

(73)【特許権者】

【識別番号】000136136

【氏名又は名称】株式会社ＰＦＵ

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】豊田裕史

(72)【発明者】

【氏名】岸川直樹

【審査官】秦野孝一郎

(56)【参考文献】

【文献】特開２０００－１８１９９３（ＪＰ，Ａ）

【文献】特開２０００－３３９４０８（ＪＰ，Ａ）

【文献】特開２００９－０１５８７６（ＪＰ，Ａ）

【文献】特開２００３－３０８４８３（ＪＰ，Ａ）

【文献】特開平１１－２９６６１８（ＪＰ，Ａ）

【文献】特開平０８－１２３８９８（ＪＰ，Ａ）

【文献】特開平０１－０１４６８２（ＪＰ，Ａ）

【文献】特開平０４－２７３３９１（ＪＰ，Ａ）

【文献】特開平０１－２５９４７６（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｖ３０／００－３０／４２４

Ｇ０６Ｋ１１／００

(57)【特許請求の範囲】

【請求項1】

入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定部と、
前記部分判定部による複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定部と
を有する画像判定装置。

【請求項2】

前記部分判定部は、ユーザが指定した複数の入力項目に関して、手書きであるか否かを判定し、
前記全体判定部は、ユーザが指定した全ての入力項目の判定結果に基づいて、前記帳票画像の手書きであるか活字であるかを判定する。
請求項１に記載の画像判定装置。

【請求項3】

前記全体判定部は、各入力項目に対する判定結果と、各入力項目に入力された文字数とに基づいて、前記帳票画像が手書きであるか否かを判定する
請求項２に記載の画像判定装置。

【請求項4】

入力された帳票画像から、互いに連続する有色画素の塊を抽出する塊抽出部
をさらに有し、
前記部分判定部は、前記塊抽出部により抽出された複数の有色画素塊の相対位置に基づいて、入力要素が手書きであるか活字であるかを判定する
請求項１～３のいずれか一項に記載の画像判定装置。

【請求項5】

前記部分判定部は、前記塊抽出部により抽出された有色画素塊の上端部又は下端部の位置を比較して、入力要素が手書きであるか活字であるかを判定する
請求項４に記載の画像判定装置。

【請求項6】

前記部分判定部は、前記塊抽出部により抽出された有色画素塊の上端部又は下端部の位置の変動が基準以上である場合に、手書きであると判定し、抽出された有色画素塊の上端部又は下端部の位置の変動が基準値未満である場合に、活字であると判定する
請求項５に記載の画像判定装置。

【請求項7】

前記部分判定部は、同一の入力項目に対して、複数行の入力文字列が存在する場合、文
字数が最大の入力文字列についてのみ、手書きであるか否かを判定する
請求項１～６のいずれか一項に記載の画像判定装置。

【請求項8】

コンピュータが、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定ステップと、
コンピュータが、前記部分判定ステップによる複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定ステップと
を有する画像判定方法。

【請求項9】

入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定ステップと、
前記部分判定ステップによる複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定ステップと
コンピュータに実行させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、画像判定装置、画像判定方法、及びプログラムに関する。

【背景技術】

【0002】

例えば、特許文献１には、文書を画像データに変換して得られる文書画像から文字列を抽出し、前記文字列中の各文字の高さ方向の中心位置を求め、全文字の高さ方向の中心位置の規則性により前記文字列が手書き文字か活字かを判別し、該判別結果に基づき文字認識を行う文字認識方法であって、文字列に含まれる濁点を含めずに求めた前記文字の中心位置の規則性により、手書き文字と活字の判別を行うことを特徴とする文字認識方法が開示されている。

【0003】

また、特許文献２には、入力画像より文字群を抽出し、抽出した文字群から手書き文字と印刷活字の判定を行うための所定数の特徴量を抽出し、抽出した特徴量から前記文字群が印刷活字であるか手書き文字であるかを判定して、その判定結果に従い、手書き文字認識用の辞書を用いた文字認識処理、若しくは印刷活字認識用の辞書を用いた文字認識処理を実行する文字認識方法に於いて、前記文字群が印刷活字であるか手書き文字であるかを判定する処理に、前記抽出した特徴量の各々について、値が求まる場合はその値の関数を、値が不定である場合は予め定められた定数を、それぞれ注目する特徴量に対応する関数値として取得するステップと、前記ステップで取得した関数値をもとに前記判定に用いる評価値を求めるステップと、前記ステップで求めた評価値が予め定められた閾値未満であるか否かにより、前記抽出した文字群が手書き文字であるか印刷活字であるかを判定するステップとを具備したことを特徴とする文字認識方法が開示されている。

【0004】

また、特許文献３には、帳票を画像データに変換して得られる画像から、前記帳票の文字記入欄を抽出し、文字記入欄の文字が手書き文字か活字かを判別し、該判別結果に基づき文字認識を行う文字認識方法であって、前記帳票のレイアウトを解析して、項目領域とそれに続く文字記入欄にグループ分けし、項目領域の文字認識を行って認識結果に基づきそれに続く文字記入欄の字種を判定し、上記字種判定結果により、上記グループ毎に項目領域に続く文字記入欄の字種を限定して手書き／活字判別を行うことを特徴とする文字認識方法が開示されている。

【0005】

さらに、特許文献４には、文字列を含む文字列画像に対して、細線情報に変換する細線変換手段と、前記細線変換手段によって細線となった文字列画像内に矩形領域を設定する領域設定手段と、前記領域設定手段によって設定された矩形領域に対して、ハフ変換を行うハフ変換手段と、前記ハフ変換手段によるハフ変換の処理結果の線分の角度情報と、その高さ情報を特徴として抽出する特徴抽出手段と、前記特徴抽出手段によって抽出された特徴に基づいて、前記文字列画像内の文字列は活字又は手書きのいずれであるかを判定する判定手段を具備することを特徴とする画像処理装置が開示されている。

【先行技術文献】

【特許文献】

【0006】

【文献】特開２０００－３３１１２２

【文献】特開２００４－９４７３４

【文献】特開２００９－１５８７６

【文献】特開２０１２－２２３５９

【発明の概要】

【発明が解決しようとする課題】

【0007】

手書き文字又は活字を判定することにより、より帳票の認識精度を向上させる画像判定装置を提供することを目的とする。

【課題を解決するための手段】

【0008】

本発明に係る画像判定装置は、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定部と、前記部分判定部による複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定部とを有する。

【0009】

好適には、前記部分判定部は、ユーザが指定した複数の入力項目に関して、手書きであるか否かを判定し、前記全体判定部は、ユーザが指定した全ての入力項目の判定結果に基づいて、前記帳票画像の手書きであるか活字であるかを判定する。

【0010】

好適には、前記全体判定部は、各入力項目に対する判定結果と、各入力項目に入力された文字数とに基づいて、前記帳票画像が手書きであるか否かを判定する。

【0011】

好適には、互いに連続する有色画素の塊を抽出する塊抽出部をさらに有し、前記部分判定部は、前記塊抽出部により抽出された複数の有色画素塊の相対位置に基づいて、入力要素が手書きであるか活字であるかを判定する。

【0012】

好適には、前記部分判定部は、前記塊抽出部により抽出された有色画素塊の上端部又は下端部の位置を比較して、入力要素が手書きであるか活字であるかを判定する。

【0013】

好適には、前記部分判定部は、前記塊抽出部により抽出された有色画素塊の上端部又は下端部の位置の変動が基準以上である場合に、手書きであると判定し、抽出された有色画素塊の上端部又は下端部の位置の変動が基準値未満である場合に、活字であると判定する。

【0014】

好適には、前記部分判定部は、同一の入力項目に対して、複数行の入力文字列が存在する場合、文字数が最大の入力文字列についてのみ、手書きであるか否かを判定する。

【0015】

本発明に係る画像判定装置は、入力された画像から、互いに連続する有色画素の塊を抽出する塊抽出部と、前記塊抽出部により抽出された複数の塊の相対的な位置に基づいて、抽出された有色画素の塊が手書きであるか否かを判定する手書き判定部とを有する。

【0016】

本発明に係る画像判定方法は、コンピュータが、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定ステップと、コンピュータが、前記部分判定ステップによる複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定ステップとを有する。

【0017】

本発明に係るプログラムは、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する部分判定ステップと、前記部分判定ステップによる複数の入力箇所それぞれの判定結果に基づいて、入力された前記帳票画像が手書きであるか否かを判定する全体判定ステップとコンピュータに実行させる。

【発明の効果】

【0018】

手書き文字又は活字を判定することにより、より帳票の認識精度を向上させる画像判定置を提供することを目的とする。

【図面の簡単な説明】

【0019】

【図1】画像判定システム１の全体構成を例示する図である。

【図2】画像判定装置７のハードウェア構成を例示する図である。

【図3】画像判定装置７の機能構成を例示する図である。

【図4】（ａ）は、複数行に跨る入力要素において、行毎の分割を例示する図であり、（ｂ）は、手書き文字と活字との場合における黒ラン（黒色画素塊）の高さの変動の特徴を例示する図であり、（ｃ）は、手書き文字と活字との場合における黒ラン（黒色画素塊）の書き始めの位置の変動の特徴を例示する図である。

【図5】全体判定部７１４による有色画素塊数に基づいた判定方法を例示する表である。

【図6】文字認識までの全体処理（Ｓ１０）を説明するフローチャートである。

【図7】文字種判定処理（Ｓ２０）を説明するフローチャートである。

【発明を実施するための形態】

【0020】

［背景］
本発明がなされた背景を説明する。
自治体などにおいて公開されている帳票（各種申請書）は、窓口等で紙により配布、また、Ｗｅｂサイトからエクセル形式の帳票をダウンロードすることができる。紙で配布される帳票は、手書き文字により記入され、エクセル形式の帳票は、エクセル上で活字により入力する。したがって、帳票は、手書き文字による帳票と活字による帳票とが存在する。そこで、ＯＣＲは、一般的に、手書き文字に最適化した文字認識手法と、活字に最適化した文字認識手法が分かれている。そのため、認識精度を上げるために、帳票が手書き文字であるのか活字であるのかを判定する必要がある。例えば、人が予め、帳票を手書き文字によるものと、活字によるものとに振り分けたり、エクセル形式の帳票を印刷する場合のみ、帳票にＱＲコード（登録商標）を印刷して両者を振り分けている。

【0021】

しかし、人手の作業が増えるため非効率であり、また、ＱＲコード（登録商標）を印刷するために帳票を変更する必要があり、さらに、ＱＲコード（登録商標）の印刷領域が必要となるが、項目の多い帳票において、ＱＲコード（登録商標）の印字領域の確保が困難である。
そこで、本発明は、ＯＣＲの前段において、帳票が手書き文字により記入されたものであるか、活字により入力されたものであるのかを、人手によらず、ＱＲコード（登録商標）の印字領域を必要とせず、画像判定装置７により、判定する。具体的には、画像判定装置７は、人の手書き文字の特徴に基づいて、帳票が手書き文字であるのか活字であるのかを判定することにより、これらの課題を解決し、且つ、文字種の判定精度をより向上させるものである。

【0022】

本発明の実施形態を、図面を参照して説明する。
図１は、画像判定システム１の全体構成を例示する図である。
図１に例示するように、画像判定システム１は、複数のユーザ端末３ａ、ユーザ端末３ｂ、複数のスキャナ５a、スキャナ５ｂ、及び画像判定装置７を含み、ネットワーク９を介して互いに接続している。ユーザ端末３a及びユーザ端末３ｂを併せてユーザ端末３と称し、スキャナ５ａ及びスキャナ５ｂを併せてスキャナ５と称する。
ユーザ端末３は、コンピュータ端末であり、ユーザにより操作される。具体的には、ユーザ端末３は、帳票の文字種を判定するための入力項目、すなわち、判定対象項目を、ユーザにより受け付ける。ここで、帳票において、項目名と、項目名に関連づく入力箇所とを併せて入力項目という。例えば、項目名は、「氏名」であり、入力箇所は、「氏名」を表す文字が入力される。

【0023】

スキャナ５は、光学式の読取装置で取得した画像データを画像判定装置７に送信する。本例において、スキャナ５は、帳票をスキャンするものとする。スキャナ５は、手書き文字により記入された各種申請書類、又は、活字により入力され印刷された各種申請書類などの帳票をスキャンする。
画像判定装置７は、コンピュータ端末であり、スキャナ５から受信した画像データが、手書き文字による帳票であるのか、活字による帳票であるのかを判定する。具体的には、画像判定装置７は、ユーザ端末３を介して受け付けた、判定対象項目毎に文字種を判定し、判定対象項目毎の判定結果に基づいて、帳票全体が手書き文字、または活字によるものかを判定する。
なお、処理対象の帳票にＯＣＲの対象項目は一つ以上存在し、且つ、１枚の帳票には、手書き文字と活字が混在しないものとする。また、本例では、画像判定装置７とスキャナ５がネットワーク９で接続している形態を説明するが、これに限定されるものではなく、例えば、ＵＳＢ（Universal Serial Bus）ケーブルを介してスキャナ５が直接、画像判定装置７に接続してもよいし、スキャナ５がＵＳＢケーブルを介してユーザ端末３に接続し、このユーザ端末３を経由して画像判定装置７に画像データを送信してもよい。

【0024】

図２は、画像判定装置７のハードウェア構成を例示する図である。
図２に例示するように、画像判定装置７は、ＣＰＵ２００、メモリ２０２、ＨＤＤ２０４、ネットワークインタフェース２０６（ネットワークＩＦ２０６）、表示装置２０８、及び、入力装置２１０を有し、これらの構成はバス２１２を介して互いに接続している。
ＣＰＵ２００は、例えば、中央演算装置である。
メモリ２０２は、例えば、揮発性メモリであり、主記憶装置として機能する。
ＨＤＤ２０４は、例えば、ハードディスクドライブ装置であり、不揮発性の記録装置としてコンピュータプログラム（例えば、図３の画像判定プログラム７０）やその他のデータファイル（例えば、項目判定結果データベース６００）を格納する。
ネットワークＩＦ２０６は、有線又は無線で通信するためのインタフェースであり、例えば、内部ネットワーク９における通信を実現する。
表示装置２０８は、例えば、液晶ディスプレイである。
入力装置２１０は、例えば、キーボード及びマウスである。

【0025】

図３は、画像判定装置７の機能構成を例示する図である。
図３に例示するように、本例の画像判定装置７には、画像判定プログラム７０がインストールされると共に、項目判定結果データベース６００（項目判定結果ＤＢ６００）が構成される。
画像判定プログラム７０は、判定項目記憶部７００、塊抽出部７０２、塊相対位置検出部７０４、行分割部７０６、塊数検出部７０８、高さ検出部７１０、部分判定部７１２、全体判定部７１４、及びＯＣＲ処理部７１６を有する。
なお、画像判定プログラム７０の一部又は全部は、ＡＳＩＣなどのハードウェアにより実現されてもよく、また、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）の機能を一部借用して実現されてもよい。
また、ＯＣＲ処理部７１６は、画像判定装置７が有してもよいし、ユーザ端末３また、その他の端末が有してもよい。

【0026】

画像判定プログラム７０において、判定項目記憶部７００は、ユーザが指定した複数の入力項目を記憶する。具体的には、判定項目記憶部７００は、ユーザ端末３により受け付けた、帳票の文字種を判定するための入力項目である判定対象項目を記憶する。
塊抽出部７０２は、互いに連続する有色画素の塊を抽出する。ここで、有色画素とは、帳票の背景と視覚により区別できる色の画素をいう。本例の帳票は、白色の背景に黒色の文字が記載されたものであり、塊抽出部７０２は、帳票画像の白又は黒を判別し、連続する画素、すなわち、黒ランを抽出する。
塊相対位置検出部７０４は、塊抽出部７０２により抽出された、複数の有色画素塊の相対位置を検出する。具体的には、塊相対位置検出部７０４は、塊抽出部７０２により抽出された有色画素塊の上端部又は下端部の位置を検出する。有色画素塊の上端部の位置とは、有色画素塊のＴｏｐ（Ｙ座標）であり、有色画素塊の下端部の位置とは、有色画素塊のＢｏｔｔｏｍ（Ｙ座標）である。具体的には、塊相対位置検出部７０４は、一つの判定対象項目に入力された複数の黒ラン（黒色画素塊）のＴｏｐ（Ｙ座標）の標準偏差を算出する。

【0027】

行分割部７０６は、同一の入力項目における、複数行に跨る入力文字列を行毎に分割する。具体的には、行分割部７０６は、図４（ａ）に例示するように、塊抽出部７０２により抽出された黒ラン（黒色画素塊）に対して、Ｙ軸基準で分布をとり、多峰性に基づいて、複数行に跨る入力文字列を行毎に分割する。
塊数検出部７０８は、一つの入力項目の入力箇所に入力された有色画素塊の数を検出する。また、塊数検出部７０８は、同一の入力項目に対して、複数行の入力文字列が存在する場合、文字数が最大の入力文字列を検出する。具体的には、塊数検出部７０８は、行分割部７０６により分割された各行の黒ラン（黒色画素塊）の数を検出し、最大の黒ラン数を有する行を検出する。
高さ検出部７１０は、塊抽出部７０２により抽出された有色画素塊の高さを検出する。具体的には、高さ検出部７１０は、一つの入力項目に入力された複数の有色画素塊の高さの標準偏差を算出する。

【0028】

部分判定部７１２は、入力された帳票画像に関して、複数の入力箇所それぞれの入力要素が手書きであるか否かを判定する。具体的には、部分判定部７１２は、ユーザが指定した複数の入力項目に関して、手書きであるか否かを判定し、判定結果を入力項目に関連付けて項目判定結果ＤＢ６００に格納する。手書き文字又は活字を判定するための入力項目をユーザが指定することにより、より判定に有効な入力項目を選出することが可能である。例えば、ユーザが予め判定対象項目を指定することにより、記入文字が一文字しかない項目、丸を付けて選択するだけの入力項目、未記入の入力項目等を省略する、または、より入力文字列が多い入力項目を指定することが可能である。
より具体的には、部分判定部７１２は、塊相対位置検出部７０４により検出された複数の有色画素塊の相対位置に基づいて、入力要素が手書き文字であるか活字であるかを判定する。ここで、入力要素とは、入力箇所に入力または記載された内容を構成する文字または記号をいう。

【0029】

また、部分判定部７１２は、高さ検出部７１０により検出された有色画素塊の高さに基づいて、入力要素が手書きであるか活字であるかを判定する。具体的には、部分判定部７１２は、高さ検出部７１０により算出された、高さの標準偏差が基準以上である場合に、手書きであると判定し、高さの標準偏差が基準値未満である場合に、活字であると判定する。
図４（ｂ）に例示するように、手書き文字の場合、文字の高さが変動しやすく、活字の場合は文字の高さが変動しにくい傾向を利用があるため、有色画素塊の高さの標準偏差を算出し、基準値と比較することが手書き又は活字の判定に有効である。

【0030】

さらに、部分判定部７１２は、塊相対位置検出部７０４により検出された有色画素塊の上端部又は下端部の位置を比較して、入力要素が手書きであるか活字であるかを判定する。具体的には、部分判定部７１２は、塊相対位置検出部７０４により検出された有色画素塊の上端部又は下端部の位置の変動が基準以上である場合に、手書きであると判定し、抽出された有色画素塊の上端部又は下端部の位置の変動が基準値未満である場合に、活字であると判定する。
図４（ｃ）に例示するように、手書き文字の場合は、書き始めの上端部が変動しやすく、活字の場合は、書き始めの上端部が変動しにくい傾向を利用があるため、黒ラン（有色画素塊）の上端部の位置の標準偏差を算出し、基準値と比較することが手書き又は活字の判定に有効となる。
さらに、部分判定部７１２は、同一の入力項目に対して、複数行の入力文字列が存在する場合、塊数検出部７０８により検出された、文字数が最大の入力文字列についてのみ、手書きであるか否かを判定する。

【0031】

全体判定部７１４は、部分判定部７１２による複数の入力箇所それぞれの判定結果に基づいて、入力された帳票画像が手書きであるか否かを判定する。具体的には、全体判定部７１４は、ユーザが指定した全ての入力項目の判定結果に基づいて、帳票画像が手書きであるか活字であるかを判定する。より具体的には、全体判定部７１４は、各入力項目に対する判定結果と、各入力項目に入力された文字数とに基づいて、帳票画像が手書きであるか否かを判定する。
図５に例示するように、全体判定部７１４は、部分判定部７１２により、手書きと判定された判定対象項目の有色画素塊数の合計数と、活字と判定された判定対象項目の有色画素塊数の合計数とに基づいて多数決をとる。全体判定部７１４は、手書きと判定された有色画素塊数の合計数の方が多い場合に、帳票は手書きであると判定し、活字と判定された有色画素塊数の合計数の方が多い場合に、帳票は活字であると判定する。

【0032】

図６は、文字認識までの全体処理（Ｓ１０）を説明するフローチャートである。
図６に例示するように、ステップ１００（Ｓ１００）において、画像判定装置７は、スキャナ５により取り込まれた帳票の画像データを取得する。
ステップ１０５（Ｓ１０５）において、ユーザは、ステップ１００において、取得された帳票の画像データの項目からマウス等により、帳票内の項目のうち、ＯＣＲの対象となる入力項目をユーザ端末３より指定する。さらに、ユーザは、文字種の判定に使用する判定対象項目を指定する。判定項目記憶部７００は、指定した文字種の判定に使用する入力項目、すなわち判定対象項目を記憶する。なお、Ｓ１０５の処理は、同一形式の帳票に関して一度だけ実施されれば足り、同一形式の帳票の画像データが複数回取得される場合には、最初の一回だけでもよい。
ステップ１１０（Ｓ１１０）において、判定項目記憶部７００は、対象入力項目のＯＣＲ領域を抽出する。具体的には、判定項目記憶部７００は、入力項目の入力箇所に記載された入力要素を抽出する。

【0033】

ステップ１１５（Ｓ１１５）において、塊抽出部７０２は、判定項目記憶部７００により記憶された判定対象項目の入力箇所に入力されている入力要素の２値化を実施する。入力要素とは、判定対象項目の入力箇所に入力された文字、または記号の画像データである。
ステップ１２０（Ｓ１２０）において、塊抽出部７０２は、入力箇所に入力されている入力要素素のうち、互いに連続する有色画素の塊を抽出する。
ステップ１２５（Ｓ１２５）において、部分判定部７１２は、各判定対象項目において、有色画素塊の特徴量に基づいて、各判定対象項目の文字種の判定を実施する。
ステップ１３０（Ｓ１３０）において、全体判定部７１４は、部分判定部７１２により判定された各判定対象項目における判定結果と、判定に使用した有色画素塊の数とに基づいて、帳票全体の文字種が手書きであるか、活字であるかを判定する。
ステップ１３５（Ｓ１３５）において、ＯＣＲ処理部７１６は、全体判定部７１４により判定された文字種に応じた文字認識をＯＣＲ対象項目に対して実施する。

【0034】

図７は、文字種判定処理（Ｓ２０）を説明するフローチャートである。
図７に例示するように、ステップ２００（Ｓ２００）において、ユーザにより指定された一つの判定対象項目において、一番左上の有色画素塊を抽出する。具体的には、塊抽出部７０２は、判定項目記憶部７００に記憶された一つの判定対象項目の入力箇所における、一番左上の黒ランを抽出する。
ステップ２０５（Ｓ２０５）において、高さ検出部７１０は、一つの判定対象項目に含まれる有色画素塊の高さを検出する。さらに、高さ検出部７１０は、高さを検出した有色画素塊のうち、高さが基準値以上の有色画素塊を抽出する。これにより、句読点や、記号等の他の文字と明らかに高さが異なる有色画素塊を判定対象から除外することができる。
ステップ２１０（Ｓ２１０）において、行分割部７０６は、塊抽出部７０２により抽出された有色画素塊に対してＹ軸基準で分布を取り、双峰性に基づいて、判定対象項目の入力要素を行毎に分割する。
ステップ２１５（Ｓ２１５）において、塊数検出部７０８は、行分割部７０６により分割された行毎の有色画素塊の数を検出する。さらに、塊数検出部７０８は、行毎の有色画素塊数のうち、最も有色画素塊数が多い行を検出する。これにより、より特徴が顕著に表れる行を判定に使用することができる。

【0035】

ステップ２２０（Ｓ２２０）において、塊数検出部７０８により、最も有色画素塊数が多いと判定された行に対して、高さ検出部７１０は、高さの標準偏差を算出する。高さの標準偏差が基準値を超える場合に、部分判定部７１２は、判定対象項目に入力された文字を手書き文字と判定し、基準値を超えない場合に、部分判定部７１２は、判定対象項目に入力された文字を活字と判定する。
ステップ２２５（Ｓ２２５）において、塊数検出部７０８により、最も有色画素塊数が多いと判定された行に対して、塊相対位置検出部７０４は、有色画素塊の上端部の位置を検出する。具体的には、塊相対位置検出部７０４は、塊数検出部７０８により、最も有色画素塊数が多いと判定された行に対して、黒ランのＴｏｐ（Ｙ座標）の標準偏差を算出する。Ｔｏｐ（Ｙ座標）の標準偏差が基準値を超える場合に、部分判定部７１２は、判定対象項目に入力された文字を手書き文字と判定し、基準値を超えない場合に、部分判定部７１２は、判定対象項目に入力された文字を活字と判定する。
ステップ２３０（Ｓ２３０）において、部分判定部７１２は、Ｓ２２０において、手書きと判定し、且つＳ２２５において手書きと判定した場合に、判定対象項目の入力要素が手書き文字であると判定する。部分判定部７１２は、判定対象項目の判定結果を項目判定結果ＤＢ６００に格納する。

【0036】

ステップ２３５（Ｓ２３５）において、部分判定部７１２が、判定項目記憶部７００により記憶されたすべての判定対象項目について文字種を判定した場合に（Ｓ２３５：Ｙｅｓ）、文字種判定処理（Ｓ２０）は、Ｓ２４０へ移行し、すべての判定対象項目について文字種を判定していない場合に（Ｓ２３５：Ｎｏ）、Ｓ２００へ移行する。
ステップ２４０（Ｓ２４０）において、全体判定部７１４は、判定対象項目全ての判定結果に基づいて、帳票画像が手書きであるか活字であるかを判定する。具体的には、全体判定部７１４は、各判定対象項目の判定に使用した有色画素塊数で多数決をとる。より具体的には、手書きと判定された判定対象項目の有色画素塊数の合計が、活字と判定された判定対象項目の有色画素塊数の合計より多い場合に、全体判定部７１４は、帳票を手書きであると判定し、活字と判定された判定対象項目の有色画素塊数の合計が、手書きと判定された判定対象項目の有色画素塊数の合計より多い場合に、全体判定部７１４は、帳票を活字であると判定する。

【0037】

以上説明したように、本実施形態の画像判定装置７によれば、文字種に適したＯＣＲ処理を実施するための帳票の文字種を、横書きの場合の手書き文字の特徴に基づいて判定することができる。横書きの場合の手書き文字の特徴とは、例えば、文字の高さが一定ではない、書き始めの位置が変動しやすい等である。これらの特徴は、文字列が長くなるほど顕著であるため、帳票全体における活字または手書き文字の判定は、判定対象項目の文字列の長さ、すなわち文字数により多数決をとるため、画像判定装置７はより精度の高い判定を行うことができる。さらに、判定に使用する判定対象項目をユーザが指定しているため、判定に有効な入力項目のみを指定でき、帳票全体における活字または手書き文字の判定の精度を高めることができる。

【符号の説明】

【0038】

１…画像判定システム
３…ユーザ端末
５…スキャナ
７…画像判定装置
９…ネットワーク
７０…画像判定プログラム
７００…判定項目記憶部
７０２…塊抽出部
７０４…塊相対位置検出部
７０６…行分割部
７０８…塊数検出部
７１０…高さ検出部
７１２…部分判定部
７１４…全体判定部
７１６…ＯＣＲ処理部
６００…項目判定結果データベース

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版