IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023092134
(43)【公開日】2023-07-03
(54)【発明の名称】画像認識装置、および画像認識方法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20230626BHJP
   G06V 30/14 20220101ALI20230626BHJP
【FI】
G06T7/00 300F
G06K9/20 340J
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2021207145
(22)【出願日】2021-12-21
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】児玉 卓
【テーマコード(参考)】
5B029
5L096
【Fターム(参考)】
5B029AA01
5B029AA03
5B029BB02
5B029DD07
5B029EE10
5B029EE11
5B029EE12
5L096AA02
5L096BA07
5L096CA16
5L096EA04
5L096EA16
5L096EA43
5L096FA12
5L096FA15
5L096FA35
5L096FA59
5L096FA69
5L096JA11
(57)【要約】
【課題】入力画像に含まれる選択受付図形の認識精度に優れた画像認識装置を提供すること。
【解決手段】本発明の一態様に係る画像認識装置は、原稿の少なくとも一部が入力された入力画像に含まれ、項目に対する選択を受け付ける選択受付図形を認識可能な画像認識装置であって、前記入力画像に含まれる図形の外形形状の特徴点に基づき、前記選択受付図形の頂点候補の検出結果を出力する頂点候補出力部と、前記頂点候補出力部から出力される前記頂点候補の検出結果に基づき、前記選択受付図形の認識結果を出力する認識結果出力部と、を有する。
【選択図】図2
【特許請求の範囲】
【請求項1】
原稿の少なくとも一部が入力された入力画像に含まれ、項目に対する選択を受け付ける選択受付図形を認識可能な画像認識装置であって、
前記入力画像に含まれる図形の外形形状の特徴点に基づき、前記選択受付図形の頂点候補の検出結果を出力する頂点候補出力部と、
前記頂点候補出力部から出力される前記頂点候補の検出結果に基づき、前記選択受付図形の認識結果を出力する認識結果出力部と、を有する、画像認識装置。
【請求項2】
前記選択受付図形は矩形の外形形状を有し、
前記選択受付図形の認識結果は、前記選択受付図形における前記矩形の少なくとも1つの頂点位置を含む、請求項1に記載の画像認識装置。
【請求項3】
前記頂点候補出力部は、複数の前記特徴点同士を結ぶ画像領域に含まれる複数の画素のうち、画素値が該特徴点に含まれる画素の画素値と一致する画素数に基づき、前記頂点候補の検出結果を出力する、請求項1または請求項2に記載の画像認識装置。
【請求項4】
前記頂点候補出力部は、前記入力画像に含まれる複数の画素それぞれの画素値から生成されるヒストグラムに基づく二値化閾値を用いて、前記入力画像を二値化した二値化画像から抽出される前記特徴点に基づき、前記頂点候補を出力する、請求項1から請求項3のいずれか1項に記載の画像認識装置。
【請求項5】
前記頂点候補出力部は、前記入力画像の色成分情報およびヒストグラム情報の少なくとも一方に基づき、前記入力画像における手書き領域と前記手書き領域以外の領域とに区別された前記入力画像の前記特徴点に基づき、前記頂点候補を出力する、請求項1から請求項4のいずれか1項に記載の画像認識装置。
【請求項6】
前記認識結果出力部は、前記選択受付図形の大きさ情報および位置情報の少なくとも一方に基づき、前記選択受付図形の認識結果を出力する、請求項1乃至請求項5のいずれか1項に記載の画像認識装置。
【請求項7】
前記頂点候補出力部は、前記入力画像に含まれる罫線領域から検出される前記入力画像の傾きが補正された前記入力画像の前記特徴点に基づき、前記頂点候補を出力する、請求項1から請求項6のいずれか1項に記載の画像認識装置。
【請求項8】
前記頂点候補出力部は、前記入力画像に含まれる複数の画素それぞれの画素値が色反転された前記入力画像の前記特徴点に基づき、前記頂点候補を出力する、請求項1から請求項7のいずれか1項に記載の画像認識装置。
【請求項9】
前記頂点候補出力部は、前記入力画像に含まれる複数の画素それぞれの画素値を色成分に分解して取得される色成分画像における前記特徴点に基づき、前記頂点候補を出力する、請求項1から請求項8のいずれか1項に記載の画像認識装置。
【請求項10】
前記頂点候補出力部は、前記入力画像の色成分情報およびヒストグラム情報の少なくとも一方に基づいて前記入力画像における帳票領域と前記帳票領域以外の領域とに区別された前記入力画像の前記特徴点に基づき、前記頂点候補を出力する、請求項1から請求項9のいずれか1項に記載の画像認識装置。
【請求項11】
前記頂点候補出力部は、前記入力画像に含まれる黒色領域が拡大された前記入力画像における前記特徴点に基づき、前記頂点候補を出力する、請求項1から請求項10のいずれか1項に記載の画像認識装置。
【請求項12】
前記認識結果出力部は、前記頂点候補出力部から出力される前記頂点候補の検出結果に基づいて決定される、前記選択受付図形を指示する認識マークの周辺領域を含む、前記選択受付図形の認識結果を出力する、請求項1から請求項11のいずれか1項に記載の画像認識装置。
【請求項13】
前記認識結果出力部から出力される前記選択受付図形の認識結果に基づき、前記選択受付図形以外の文字および図形の少なくとも一方の検出結果を出力する誤認識評価部をさらに有する、請求項1から請求項12のいずれか1項に記載の画像認識装置。
【請求項14】
原稿の少なくとも一部が入力された入力画像に含まれ、項目に対する選択を受け付ける選択受付図形を認識可能な画像認識装置による画像認識方法であって、前記画像認識装置が、
頂点候補出力部により、前記入力画像に含まれる図形の外形形状の特徴点に基づき、前記選択受付図形の頂点候補の検出結果を出力し、
認識結果出力部により、前記頂点候補出力部から出力される前記頂点候補の検出結果に基づき、前記選択受付図形の認識結果を出力する、画像認識方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像認識装置、および画像認識方法に関する。
【背景技術】
【0002】
OCR(Optical Character Reader)技術を用いて、記録媒体に形成された文字や図形の画像を認識する画像認識装置が知られている。
【0003】
上記の画像認識装置として、認識対象とする帳票画像を定義する際に、帳票画像に含まれる項目と、項目に対する選択肢と、を含む領域の指定を受け付け、領域から抽出された、項目と選択肢とを対応付けた定義を表示するものが開示されている(例えば、特許文献1参照)。
【発明の概要】
【発明が解決しようとする課題】
【0004】
画像認識装置では、帳票画像等の入力画像に含まれ、項目に対する選択を受け付ける選択受付図形の認識精度に優れたものが求められる。
【0005】
本発明は、入力画像に含まれる選択受付図形の認識精度に優れた画像認識装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一態様に係る画像認識装置は、原稿の少なくとも一部が入力された入力画像に含まれ、項目に対する選択を受け付ける選択受付図形を認識可能な画像認識装置であって、前記入力画像に含まれる図形の外形形状の特徴点に基づき、前記選択受付図形の頂点候補の検出結果を出力する頂点候補出力部と、前記頂点候補出力部から出力される前記頂点候補の検出結果に基づき、前記選択受付図形の認識結果を出力する認識結果出力部と、を有する。
【発明の効果】
【0007】
本発明によれば、入力画像に含まれる選択受付図形の認識精度に優れた画像認識装置を提供できる。
【図面の簡単な説明】
【0008】
図1】実施形態に係る画像認識装置の入力画像を例示する図である。
図2】実施形態に係る画像認識装置の出力画像を例示する図である。
図3】実施形態に係る画像認識装置を有する画像形成装置の構成例の図である。
図4】実施形態に係る画像形成装置の構成例のブロック図である。
図5】実施形態に係るコントローラのハードウェア構成例のブロック図である。
図6】実施形態に係るIPUのハードウェア構成例のブロック図である。
図7】実施形態に係るIPUの機能構成例のブロック図である。
図8】実施形態に係る画像形成装置による原稿読取の動作例のフロー図である。
図9】実施形態に係るIPUによる認識処理例のフロー図である。
図10】実施形態に係る入力画像例を示す図である。
図11】実施形態に係る入力画像のヒストグラムを例示する図である。
図12】実施形態に係る二値化画像例を示す図である。
図13】実施形態に係る外形形状画像例を示す図である。
図14】実施形態に係る頂点候補検出処理例を説明する第1図である。
図15】実施形態に係る頂点候補検出処理例を説明する第2図である。
図16】実施形態に係る頂点候補検出処理例を説明する第3図である。
図17】実施形態に係る頂点候補評価処理例を説明する図である。
図18】実施形態に係る出力画像の第1例を示す図である。
図19】実施形態に係る出力画像の第2例を示す図である。
図20】実施形態に係る傾き検出処理例を説明する図である。
図21】実施形態に係る色反転処理例を説明する図である。
図22】実施形態に係る黒色領域の拡大処理例を説明する図である。
図23】その他の実施形態に係る出力画像の第1例を示す図である。
図24】その他の実施形態に係るIPUの機能構成例のブロック図である。
図25】その他の実施形態に係る出力画像の第2例を示す図である。
【発明を実施するための形態】
【0009】
以下、図面を参照して本発明を実施するための形態について詳細に説明する。各図面において、同一構成部には同一符号を付し、重複した説明を適宜省略する。
【0010】
実施形態に係る画像認識装置は、原稿の少なくとも一部が入力された入力画像に含まれ、項目に対する選択を受け付ける選択受付図形を認識可能なものである。
【0011】
選択受付図形とは、選択の対象項目周辺に形成され、選択されたことを示すマークが入力される図形をいう。例えば、選択受付図形は、原稿に含まれる選択の対象項目周辺に形成された四角図形であって、選択された際に、選択されたことを示すチェックマークが付与される、いわゆるチェックボックス等である。対象項目とは、選択受付図形を用いて選択される項目を意味する。
【0012】
実施形態では、一例として選択受付図形がチェックボックスである場合を説明する。
【0013】
図1および図2は、実施形態に係る画像認識装置に対する入出力画像を例示する図であり、図1は入力画像Im0、図2は出力画像Qを例示している。
【0014】
図1に示すように、入力画像Im0は、対象項目510の画像と、対象項目510に隣り合って形成されたチェックボックス511と、を含んでいる。
【0015】
実施形態に係る画像認識装置は、入力画像Im0の中からチェックボックス511を認識し、図2に示すように、認識したチェックボックス511を指示する認識マーク521を付与した出力画像Qを出力する。
【0016】
実施形態に係る画像認識装置によりチェックボックス511を認識することによって、原稿Piにおけるチェックボックス511に、チェックマーク522が付与されているか否か等を、後段の処理装置が正確に認識可能になる。
【0017】
実施形態に係る画像認識装置は、入力画像Im0に含まれる図形の外形形状の特徴点に基づき、チェックボックス511の頂点候補の検出結果を出力する頂点候補出力部と、頂点候補出力部から出力される頂点候補の検出結果に基づき、チェックボックス511の認識結果を出力する認識結果出力部と、を有する。この構成により、入力画像Im0に含まれるチェックボックス511の認識精度に優れた画像認識装置を提供する。ここで、頂点とは、チェックボックス511における図形の角部分をいう。
【0018】
以下、実施形態に係る画像認識装置を有する画像形成装置を一例として説明する。この画像形成装置は、例えば用紙等の記録媒体に画像を形成する機能と、画像が形成された用紙等の原稿を読み取る機能と、を有する複合機(MFP:Multi-Function Peripheral)である。実施形態に係る画像認識装置は、画像形成装置により読み取られた原稿の画像の少なくとも一部が入力された入力画像Im0から、チェックボックス511を認識する。
【0019】
<画像形成装置1の構成例>
(全体構成例)
図3は、画像形成装置1の全体構成の一例を示す図である。図3に示すように、画像形成装置1は、スキャナ100と、プロッタ300と、給紙部400と、を有する。
【0020】
給紙部400は、サイズの異なる用紙を収納する給紙カセット421及び422と、給紙カセット421及び422に収納された用紙をプロッタ300による画像形成位置まで搬送する各種ローラからなる給紙手段423と、を有する。
【0021】
プロッタ300は、露光装置331と、感光体ドラム332と、現像装置333と、転写ベルト334と、定着装置335と、を有する。プロッタ300は、スキャナ100により読取られた原稿の画像データ、或いはネットワークI/Fを介して外部のPC等から入力された画像データに基づいて、露光装置331により感光体ドラム332を露光して感光体ドラム332に潜像を形成する。プロッタ300は、現像装置333により感光体ドラム332に異なる色のトナーを供給して現像する。プロッタ300は、転写ベルト334により感光体ドラム332に現像されたトナー像を給紙部400から供給された用紙に転写した後、定着装置335により用紙に転写されたトナー像を構成するトナーを溶融させて、用紙にカラー画像を定着させる。
【0022】
スキャナ100は、ADF(Auto Document Feeder)41と、スキャナユニット42と、排紙トレイ43と、を有する。スキャナ100は、ADF41を駆動させ、ADF41に載置された原稿をスキャナユニット42に搬送する。スキャナ100は、スキャナユニット42を駆動させ、ADF41から搬送される原稿を撮像させる。ADF41に原稿が載置されておらず、スキャナユニット42に直接原稿が載置された場合には、スキャナユニット42は、載置された原稿を撮像する。すなわち、スキャナユニット42が原稿の撮像部として動作する。
【0023】
図3に示すスキャナユニット42は、例えば、差動ミラー駆動方式であって、光学センサ一体型駆動方式のものである。スキャナユニット42は、第1ミラーユニット204と、第2ミラーユニット210と、レンズ216と、第1センサボード215と、を有する。
【0024】
第1ミラーユニット204は、LED(Light Emitting Diode)等の発光部を含む光源と、ミラーと、を有する光学ユニットである。第1ミラーユニット204は、光源からの光を載置された原稿に照明し、原稿による反射光を第2ミラーユニット210に向けて反射する。
【0025】
第2ミラーユニット210は、第1ミラーユニット204からの光をレンズ216に向けて反射する。レンズ216は、第2ミラーユニット210からの光を、第1センサボード215に設けられた光電変換素子214上において略結像させる。略結像した原稿の像は、光電変換素子214が光電変換してアナログ画像信号とすることにより、原稿の読み取りが行われる。
【0026】
図4は、画像形成装置1の構成を例示するブロック図である。画像形成装置1は、スキャナ100と、コントローラ200と、プロッタ300と、画像メモリ401と、IPU(Image Processing Unit)500と、を有する。
【0027】
画像形成装置1は、スキャナ100により読み取った原稿Piの少なくとも一部が入力された入力画像Im0に対し、IPU500により画像認識処理を行う。なお、IPU500は、画像認識処理以外の画像処理を行ってもよい。画像形成装置1は、IPU500による画像処理後の画像データや、テストチャート(テストパターン)の画像データに基づいて、プロッタ300により用紙に画像形成し、画像形成された用紙を印刷物Poとして出力する。
【0028】
コントローラ200は、画像形成装置1全体の制御を行う。
【0029】
画像メモリ401は、揮発性メモリや、ハードディスク等を含む。画像メモリ401は、スキャナ100、コントローラ200、プロッタ300およびIPU500のそれぞれの間において画像データの送受を行うための一次保管や、後日使用するための恒久保管を行う。
【0030】
IPU500は、入力画像Im0に含まれ、項目に対する選択を受け付けるチェックボックス511を認識可能な画像認識装置の一例である。
【0031】
画像形成装置1は、ネットワークNWを経由し、PC2やサーバー3等に接続し、画像データ等を送受信できる。
【0032】
<コントローラ200のハードウェア構成例>
図5は、コントローラ200のハードウェア構成の一例を示すブロック図である。図5に示すように、コントローラ200は、CPU(Central Processing Unit)10と、RAM(Random Access Memory)11と、ROM(Read Only Memory)12と、HDD(Hard Disk Drive)13と、通信I/F(Interface)14と、を有する。これらはバス15を介して相互に電気的に接続している。また、通信I/F14は、表示装置16及び入力操作部17に接続している。
【0033】
CPU10は演算手段であり、画像形成装置1全体の動作を制御する。RAM11は、情報の高速な読み書きが可能な揮発性の記憶媒体である。CPU10は、情報を処理する際の作業領域としてRAM11を用いる。ROM12は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムを格納している。
【0034】
HDD13は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーションプログラム等を格納している。通信I/F14は、バス15と、各種のハードウェアやネットワーク等と、を接続して制御するインターフェースである。
【0035】
表示装置16は、ユーザが画像形成装置1の状態を確認するための視覚的ユーザインターフェースである。入力操作部17は、キーボードやマウス等、ユーザが画像形成装置1に情報を入力するためのユーザインターフェースである。
【0036】
画像形成装置1は、上記のハードウェア構成において、ROM12やHDD13又は光学ディスク等の記録媒体に格納されたプログラムをRAM11に読み出し、CPU10の制御に従って動作させることにより、ソフトウェア制御部を構成する。画像形成装置1は、このようにして構成されたソフトウェア制御部と、ハードウェアと、を組み合わせることによって、画像形成装置1の機能を実現する。
【0037】
<IPU500のハードウェア構成例>
図6は、IPU500のハードウェア構成の一例を示すブロック図である。図6に示すように、IPU500は、CPU20と、RAM21と、ROM22と、HDD23と、通信I/F24と、を有する。これらはバス25を介して相互に電気的に接続している。
【0038】
CPU20は演算手段であり、IPU500全体の動作を制御する。RAM21は、情報の高速な読み書きが可能な揮発性の記憶媒体である。CPU20は、情報を処理する際の作業領域としてRAM21を用いる。ROM22は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムを格納している。
【0039】
HDD23は、情報の読み書きが可能な不揮発性の記憶媒体であり、OSや各種の制御プログラム、アプリケーションプログラム等を格納している。通信I/F24は、バス25と、各種のハードウェアやネットワーク等と、を接続して制御するインターフェースである。
【0040】
IPU500は、上記のハードウェア構成において、ROM22やHDD23又は光学ディスク等の記録媒体に格納されたプログラムをRAM21に読み出し、CPU20の制御に従って動作させることにより、ソフトウェア制御部を構成する。IPU500は、このようにして構成されたソフトウェア制御部によって、IPU500の機能を実現する機能ブロックを構成する。
【0041】
<IPU500の機能構成例>
図7は、IPU500の機能構成の一例を示すブロック図である。図7に示すように、IPU500は、入力部31と、二値化処理部32と、外形形状抽出部33と、特徴点抽出部34と、頂点候補出力部35と、頂点候補評価部36と、登録部37と、認識結果出力部38と、を有する。IPU500は、これらの機能を、CPU20がROM22に記憶されたプログラムを読み出し、RAM21を作業領域として実行することにより実現する。
【0042】
入力部31は、スキャナ100による原稿Piの読取画像の少なくとも一部が入力された入力画像Im0を、スキャナ100から取得する。また入力部31は、入力画像Im0のサイズ、解像度、色または背景等の情報を取得する。入力部31は、取得した入力画像Im0と、入力画像Im0のサイズ、解像度、色または背景等の情報と、を二値化処理部32に出力する。
【0043】
二値化処理部32は、入力画像Im0に含まれる複数の画素それぞれの画素値から生成されるヒストグラムに基づく二値化閾値を用いて、入力画像Im0の二値化処理を実行し、処理結果である二値化画像Im1を外形形状抽出部33に出力する。
【0044】
なお、二値化閾値は、ヒストグラムに基づくものに限定されず、入力画像Im0の色情報等に基づいて定めてもよい。但し、ヒストグラムに基づいて二値化閾値を定めると、入力画像Im0内における図形以外の画像の影響を抑えられるため、より好適である。また、二値化処理を高速に行うために、二値化処理の前処理として、入力画像Im0がカラー画像である場合にはモノクロ画像変換や、画像の解像度を低下させる変換等を行ってもよい。
【0045】
外形形状抽出部33は、入力画像Im0に基づく二値化画像Im1に含まれる図形の外形形状を抽出し、抽出結果である外形形状画像Im2を特徴点抽出部34に出力する。例えば、外形形状抽出部33は、入力画像Im0に含まれる複数の画素のうち、黒色に着色した画素等の着色画素を検出し、該着色画素により構成される図形の外形形状を抽出する。
【0046】
特徴点抽出部34は、外形形状抽出部33により抽出された図形の外形形状における特徴点を抽出し、抽出結果を頂点候補出力部35に出力する。特徴点は、外形形状抽出部33により抽出された図形における特徴的な部位を意味する。特徴的な部位は、認識したい図形に応じて予め定義しておくことができる。本実施形態では、例えば外形形状における角部を特徴点として抽出する。角部は、2つの直線が交差する部位を意味する。また本実施形態では、抽出結果は、入力画像Im0内での特徴点の位置情報である。例えば外形形状を直線近似等により特徴点抽出処理を行うと、処理を簡略化して処理時間を短縮できるため好適である。
【0047】
頂点候補出力部35は、特徴点抽出部34により抽出された特徴点に基づき、チェックボックス511の頂点候補の検出結果を出力する。頂点候補は、チェックボックス511の頂点である可能性のある部位の位置を意味する。頂点候補の検出結果は、例えば入力画像Im0内での頂点候補の位置である。本実施形態では、頂点候補出力部35は、頂点候補情報を含む頂点候補画像Im3を頂点候補の検出結果として頂点候補評価部36に出力する。
【0048】
本実施形態では、頂点候補出力部35は、入力画像Im0に含まれる複数の画素それぞれの画素値から生成されるヒストグラムに基づく二値化閾値を用いて、入力画像Im0を二値化した二値化画像Im1から抽出される特徴点に基づき、チェックボックス511の頂点候補を出力する。
【0049】
また、本実施形態では、頂点候補出力部35は、特徴点抽出部34により抽出された複数の特徴点同士を結ぶ画像領域に含まれる複数の画素のうち、画素値が該特徴点に含まれる画素の画素値と一致する画素数に基づき、チェックボックス511の頂点候補の検出結果を出力する。
【0050】
頂点候補出力部35は、入力画像Im0の色成分情報およびヒストグラム情報の少なくとも一方に基づき、入力画像Im0における手書き領域と手書き領域以外の領域とに区別された入力画像Im0の特徴点に基づき、チェックボックス511の頂点候補を出力するように構成されてもよい。ここで、手書き領域とは、画像形成装置1のユーザが手書きにより書き込んだ領域を含む原稿Piをスキャナ100により読み取った場合に、入力画像Im0に含まれる該手書きにより書き込んだ領域に対応する領域をいう。
【0051】
手書き領域は、ユーザが手書きにより原稿Piに書き込んだパターンまたはマークに基づくため、原稿Piに画像形成装置等によって形成された画像と比較して、画像の濃度が一定ではない。従って、頂点候補出力部35は、例えば、入力画像Im0に含まれる画像の濃度の変動幅が所定の変動幅閾値よりも大きい領域を手書き領域とし、変動幅閾値以下の領域を手書き領域以外の領域として区別できる。
【0052】
また、頂点候補出力部35は、入力画像Im0に含まれる罫線領域から検出される入力画像Im0の傾きが補正された入力画像Im0の特徴点に基づき、チェックボックス511の頂点候補を出力するように構成されてもよい。ここで、罫線領域とは、罫線が含まれる原稿Piをスキャナ100により読み取った場合に、入力画像Im0に含まれる該罫線に対応する領域をいう。
【0053】
また、頂点候補出力部35は、入力画像Im0に含まれる複数の画素それぞれの画素値が色反転された入力画像Im0の特徴点に基づき、チェックボックス511の頂点候補を出力するように構成されてもよい。色反転とは、所定の色を補色関係にある色に変換することをいう。例えば色反転は、白黒画像における白色の画像領域を黒色に変換し、また黒色の画像領域を白色に変換する白黒反転等である。
【0054】
また、頂点候補出力部35は、入力画像Im0に含まれる複数の画素それぞれの画素値を色成分に分解して取得される色成分画像における特徴点に基づき、チェックボックス511の頂点候補を出力するように構成されてもよい。ここで、色成分画像とは、複数の原色を用いたカラーの入力画像Im0を、原色ごとに色分解した画像をいう。例えば入力画像Im0が赤(R)、緑(G)、青(B)を3原色としたカラー画像である場合には、色成分画像は、赤のみからなる画像、緑のみからなる画像および青のみからなる画像に対応する。
【0055】
また、頂点候補出力部35は、入力画像Im0の色成分情報およびヒストグラム情報の少なくとも一方に基づき、入力画像Im0における帳票領域と帳票領域以外の領域とに区別された入力画像Im0の特徴点に基づき、チェックボックス511の頂点候補を出力するように構成されてもよい。ここで、帳票領域とは、帳票が含まれる原稿Piをスキャナ100により読み取った場合に、入力画像Im0に含まれる該帳票に対応する領域をいう。帳票とは、記入するための空欄を設けた書類をいい、帳簿や伝票等の総称である。
【0056】
また、頂点候補出力部35は、入力画像Im0に含まれる黒色領域が拡大された入力画像Im0の特徴点に基づき、チェックボックス511の頂点候補を出力するように構成されてもよい。黒色領域は、画素値が黒色を示す画像領域を意味する。
【0057】
頂点候補評価部36は、頂点候補出力部35から受け取った頂点候補画像Im3に含まれる頂点候補情報を評価することにより、頂点候補がチェックボックス511の頂点であるか否かを判定する。
【0058】
チェックボックス511は、四角の図形であるため、頂点候補評価部36は、頂点候補が四角の図形の四隅の頂点に該当するか否かを評価することにより、頂点候補がチェックボックス511の頂点であるか否かを判定できる。換言すると、頂点候補評価部36は、チェックボックス511の大きさ情報および位置情報の少なくとも一方に基づき、頂点候補が四角の図形の四隅の頂点に該当するか否かを判定できる。
【0059】
頂点候補評価部36による評価基準は、例えば以下のものが挙げられる。
(1)複数の頂点候補同士を結ぶ直線が着色していること。
(2)頂点候補が矩形または正方形の一部を構成していること。
(3)頂点候補同士の間の距離が、入力画像Im0に含まれる文字のサイズと比較して適当なサイズであること。
【0060】
頂点候補評価部36は、入力画像Im0から検出された頂点候補が2つまたは3つである場合には、検出された頂点候補に基づきは、4つの頂点候補のうちの他の頂点候補を演算により推定し、この推定結果を頂点候補として用いて頂点候補を評価する。
【0061】
登録部37は、頂点候補評価部36から評価結果を受け取り、頂点候補がチェックボックス511の頂点であった場合には、頂点があることに対応する情報と、この頂点の位置情報と、を登録する。チェックボックス511の頂点がなかった場合には、登録部37は、頂点がないことに対応する情報を登録する。その後、登録部37は、頂点の位置情報を認識結果出力部38に出力する。
【0062】
認識結果出力部38は、登録部37から受け取ったチェックボックス511の認識結果を出力する。換言すると、認識結果出力部38は、頂点候補出力部35から出力される頂点候補の検出結果に基づき、チェックボックス511の認識結果を出力する。本実施形態では、認識結果出力部38は、チェックボックス511の認識結果として、頂点の有無情報と、頂点がある場合にはチェックボックス511の位置情報と、を出力する。チェックボックス511は矩形の外形形状を有するため、チェックボックス511の認識結果は、チェックボックス511における矩形の少なくとも1つの頂点位置を含んでいる。
【0063】
認識結果出力部38は、例えばチェックボックス511の頂点位置情報をIPU500の外部装置であるコントローラ200に出力する。但し、外部装置はコントローラ200に限定されず、プロッタ300や表示装置16等の他の外部装置であってもよい。
【0064】
<画像形成装置1による原稿読取動作例>
図8は、画像形成装置1による原稿読取動作の一例を示すフローチャートである。画像形成装置1は、入力操作部17を用いたユーザによる原稿読取の開始指示を受け付けた際に図8の動作を開始する。
【0065】
まず、ステップS81において、画像形成装置1は、スキャナ100により、ADF41またはスキャナユニット42に載置された原稿Piを読み取る。
【0066】
続いて、ステップS82において、画像形成装置1は、コントローラ200により、スキャナ100によって読み取られた原稿Piの枚数をカウントする。
【0067】
続いて、ステップS83において、画像形成装置1は、コントローラ200により、スキャナ100が全ての原稿Piを読み取ったか否かを判定する。例えば、コントローラ200は、ADF41またはスキャナユニット42に原稿Piが載置されているか否か、あるいは読み取った原稿Piの枚数が、入力操作部17を用いて入力された原稿Piの読取指示枚数に到達したか否か、を判定することにより、全ての原稿Piを読み取ったか否かを判定できる。
【0068】
ステップS83において、全ての原稿Piを読み取っていないと判定された場合には(ステップS83、No)、画像形成装置1は、ステップS81以降の動作を再度行う。一方、全ての原稿Piを読み取ったと判定された場合には(ステップS83、Yes)、ステップS84において、画像形成装置1は、表示装置16に原稿Piの情報を表示する。この原稿Piの情報は、例えば読み取った原稿Piの枚数または原稿Piのサイズ等の情報である。
【0069】
続いて、ステップS85において、画像形成装置1は、コントローラ200により、読み取った原稿Piにおけるチェックボックス511を認識するか否かを判定する。この判定は、例えば入力操作部17を用いたユーザ操作等に基づいて行うことができる。
【0070】
ステップS85において、チェックボックス511を認識しないと判定された場合には(ステップS85、No)、画像形成装置1は、動作を終了する。一方、チェックボックス511を認識すると判定された場合には(ステップS85、Yes)、ステップS86において、画像形成装置1は、チェックボックス511の認識処理を実行する。この認識処理の詳細は、図9を参照して次述する。画像形成装置1は、チェックボックス511の認識処理を終了後に動作を終了する。
【0071】
以上のようにして、画像形成装置1は、原稿Piを読み取ることができる。
【0072】
<IPU500による認識処理例>
図9は、IPU500によるチェックボックス511の認識処理の一例を示すフローチャートである。IPU500は、図8の動作におけるステップ86のタイミングにおいて、図9の処理を開始する。
【0073】
まず、ステップS91において、IPU500は、入力部31により、スキャナ100から入力画像Im0を入力することにより取得する。また入力部31は、入力画像Im0のサイズ、解像度、色または背景等の情報を取得する。入力部31は、取得した入力画像Im0、並びに入力画像Im0のサイズ、解像度、色または背景等の情報を二値化処理部32に出力する。
【0074】
続いて、ステップS92において、IPU500は、二値化処理部32により、入力画像Im0に含まれる複数の画素それぞれの画素値から生成されるヒストグラムに基づく二値化閾値を用いて、入力画像Im0の二値化処理を実行し、処理結果である二値化画像Im1を外形形状抽出部33に出力する。
【0075】
続いて、ステップS93において、IPU500は、外形形状抽出部33により、入力画像Im0に基づく二値化画像Im1に含まれる図形の外形形状を抽出し、抽出結果である外形形状画像Im2を特徴点抽出部34に出力する。複数の図形が二値化画像Im1に含まれる場合には、外形形状抽出部33は、全ての図形の外形形状の抽出結果を含む外形形状画像Im2を特徴点抽出部34に出力する。
【0076】
続いて、ステップS94において、IPU500は、特徴点抽出部34により、外形形状抽出部33により抽出された図形の外形形状における特徴点を抽出し、抽出結果を頂点候補出力部35に出力する。図形の外形形状に複数の特徴点が含まれる場合には、特徴点抽出部34は、全ての特徴点の抽出結果を頂点候補出力部35に出力する。また複数の図形の外形形状が外形形状画像Im2に含まれる場合には、特徴点抽出部34は、全ての図形の外形形状における全ての特徴点の抽出結果を頂点候補出力部35に出力する。
【0077】
続いて、ステップS95において、IPU500は、頂点候補出力部35により、特徴点抽出部34により抽出された特徴点に基づき、チェックボックス511の頂点候補の検出結果を出力する。例えば、頂点候補出力部35は、頂点候補情報を含む頂点候補画像Im3を頂点候補の検出結果として頂点候補評価部36に出力する。頂点候補が複数含まれる場合には、頂点候補出力部35は、全ての頂点候補の検出結果を含む頂点候補画像Im3を頂点候補評価部36に出力する。
【0078】
続いて、ステップS96において、IPU500は、頂点候補評価部36により、頂点候補出力部35から受け取った頂点候補画像Im3に含まれる頂点候補情報を評価することにより、頂点候補がチェックボックス511の頂点であるか否かを判定する。頂点候補が複数ある場合には、頂点候補評価部36は、全ての頂点候補がチェックボックス511の頂点であるか否かを判定する。
【0079】
続いて、ステップS97において、IPU500は、登録部37により、頂点候補評価部36から評価結果を受け取り、頂点候補がチェックボックス511の頂点であった場合には、この頂点の位置情報を登録する。登録部37は、全ての頂点の位置情報を認識結果出力部38に出力する。
【0080】
続いて、ステップS98において、IPU500は、認識結果出力部38により、登録部37から受け取ったチェックボックス511の認識結果を出力する。
【0081】
以上のようにして、IPU500は、入力画像Im0に含まれるチェックボックス511の認識処理を実行することができる。
【0082】
<IPU500による認識処理結果例>
次に、IPU500による認識処理結果の一例を説明する。
【0083】
(入力画像Im0の一例)
まず、図10は、入力画像Im0の一例を示す図である。図10に示す入力画像Im0は、図1に示した入力画像Im0におけるさらに小さい領域であるチェックボックス511aおよび511bの周辺領域を、取り出して表示している。
【0084】
(二値化画像Im1の一例)
図11は、入力画像Im0のヒストグラムを例示する図である。図11において、横軸は、入力画像Im0に含まれる画素の画素値を表し、縦軸は度数を表している。二値化処理部32は、図11のようなヒストグラムに基づき、入力画像Im0に含まれる図形を抽出するために適切な二値化閾値を定めることができる。二値化処理部32は、二値化処理により、図12に示すような二値化画像Im1を得ることができる。
【0085】
(外形形状画像Im2の一例)
図13は、外形形状画像Im2の一例を示す図である。図13に示すように、外形形状抽出部33は、入力画像Im0に含まれる図形の外形形状512を抽出する。
【0086】
(頂点候補514の一例)
図14から図16は、頂点候補514の検出処理の一例を説明する図であり、図14は第1図、図15は第2図、図16は第3図である。
【0087】
図14に示すように、特徴点抽出部34は、外形形状画像Im2に含まれる外形形状512に基づき、特徴点513を抽出する。
【0088】
図15は、外形形状画像Im2におけるチェックボックス511a周辺の領域を取り出して表示している。頂点候補出力部35は、チェックボックス511aの四隅のうちの2つの角部である頂点候補514aおよび514bを検出する。
【0089】
図16は、図15のチェックボックス511aを図15よりもさらに拡大して表示した図である。図16に示すように、頂点候補514aおよび514bの位置は、チェックボックス511aにおける黒色の画像領域の外枠部分に対応する。このため、頂点候補出力部35は、頂点候補514a近傍の黒色の画像領域の外側位置514a'と内側位置514a''を参照して補正した頂点候補514aの位置情報を出力する。また、頂点候補出力部35は、頂点候補514b近傍の黒色の画像領域の外側位置514b'と内側位置514b''を参照して補正した頂点候補514bの位置情報を出力する。
【0090】
図17は、頂点候補514の評価処理の一例を説明する図である。
【0091】
頂点候補評価部36は、検出した頂点候補514aと頂点候補514bとを結ぶ画像領域に含まれる複数の画素のうち、画素値が特徴点513に含まれる黒色に対応する画素値と一致する画素数に基づき、頂点候補514aおよび514bを評価する。頂点候補514aと頂点候補514bとを結ぶ画像領域に含まれる画素の画素値が黒色に対応する画素の画素数が所定の画素数閾値よりも多い場合に、頂点候補評価部36は、頂点候補514aおよび514bをそれぞれ頂点候補とする。
【0092】
図17において、例えば誤検出頂点候補515が検出された場合には、誤検出頂点候補515と頂点候補514aとを結ぶ画像領域に含まれる複数の画素の多くは、白色に対応する画素値となるため、黒色に対応する画素の画素数が所定の画素数閾値以下になる。このため、頂点候補評価部36は、誤検出頂点候補515は頂点候補として適切ではないと評価し、誤検出頂点候補515を頂点候補から除去できる。
【0093】
(出力画像の一例)
図18および図19は、出力画像を示す図である。図18は第1例に係る出力画像Qを示し、図19は第2例に係る出力画像Q'を示している。
【0094】
図18では、出力画像Qは、チェックボックス511を指示する認識マーク521を含んでいる。一方、図19では、出力画像Q'は、認識マーク521に加え、対象項目510を指示する項目マーク523をさらに含んでいる。
【0095】
(傾き検出処理例)
図20は、頂点候補出力部35による傾き検出処理の一例を説明する図である。図20は、入力画像Im0が二値化処理された二値化画像Im1を示している。
【0096】
ここで、原稿Piが傾いた状態においてスキャナ100により原稿Piが読み取られると、入力画像Im0および二値化画像Im1が傾き、IPU500は、チェックボックス511の頂点候補514を検出できない場合がある。
【0097】
図20に示すように、原稿Piに含まれる罫線に対応する罫線領域516は、原稿Piの外形形状に沿って設けられている。このため、頂点候補出力部35は、罫線領域516の傾きに基づいて入力画像Im0および二値化画像Im1の傾きを補正し、補正後の二値化画像Im1から頂点候補514を検出する。これにより、IPU500は、チェックボックス511の頂点候補514の検出精度を高く確保可能になる。
【0098】
(色反転処理例)
図21は、色反転処理の一例を説明する図である。図21は、入力画像Im0が二値化処理された二値化画像Im1に対して白黒反転した色反転画像Im1'を示している。
【0099】
頂点候補出力部35は、原稿Piが色反転した画像が形成されたものや、画像の下地が着色されたものである場合においても、色反転画像Im1'を用いて頂点候補514を検出できる。これにより、IPU500は、チェックボックス511の頂点候補514の検出精度を高く確保できる。
【0100】
(黒色領域の拡大処理例)
図22は、黒色領域の拡大処理の一例を説明する図である。二値化画像Im1は、入力画像Im0が二値化された画像であり、黒色領域の拡大処理が施される前の状態を示している。黒色領域拡大画像Im1''は、二値化画像Im1におけるチェックボックス511の枠図形の枠の太さを太くすることにより、黒色領域の面積を増加させた画像である。
【0101】
例えば、原稿Piに形成された画像の劣化等により、チェックボックス511の一部が欠けている原稿Piである場合には、チェックボックス511の認識精度が低下する場合がある。黒色領域の拡大処理を施すことにより、チェックボックス511の欠けた部分を埋めることができるため、IPU500は、チェックボックス511の頂点候補514の検出精度を高く確保できる。
【0102】
<IPU500の作用効果>
次に、IPU500の作用効果について説明する。
【0103】
OCR技術を用いた従来のソフトウェアでは、チェックボックスを個別に定義しないと、OCR技術によりチェックボックスを正しく認識できない場合があった。またOCR技術により帳票を認識する場合には、チェックボックスが含まれる枠を定義するだけでは、チェックボックスを正しくできなかったり、認識精度が低下したりする場合があった。従って、チェックボックスの認識精度を上げるためには、帳票に含まれる罫線内に形成された複数のチェックボックスを、ユーザが個別に手作業によって定義する必要があり、手間がかかった。
【0104】
実施形態に係るIPU500は、原稿Piの少なくとも一部が入力された入力画像Im0に含まれ、項目に対する選択を受け付けるチェックボックス511(選択受付図形)を認識可能な画像認識装置である。またIPU500は、入力画像Im0に含まれる図形の外形形状の特徴点513に基づき、チェックボックスの頂点候補514の検出結果を出力する頂点候補出力部35と、頂点候補出力部35から出力される頂点候補514の検出結果に基づき、チェックボックス511の認識結果を出力する認識結果出力部38と、を有する。例えばチェックボックス511は矩形の外形形状を有し、チェックボックス511の認識結果は、チェックボックス511における矩形の少なくとも1つの頂点位置を含む。
【0105】
実施形態では、外形形状の特徴点513に基づく頂点候補514に基づいてチェックボックス511を認識するため、チェックボックス511の認識精度を向上させることができる。これにより、実施形態では、入力画像Im0に含まれるチェックボックス511の認識精度に優れたIPU500を提供できる。
【0106】
なお、本実施形態では、選択受付図形として四角形の枠状のチェックボックス511を例示したが、これに限定されない。頂点を有する図形であれば、三角形や六角形等の四角形以外の多角形であってもよいし、枠状の図形でなくてもよい。
【0107】
また、本実施形態では、頂点候補出力部35は、複数の特徴点513同士を結ぶ画像領域に含まれる複数の画素のうち、画素値が該特徴点513に含まれる画素の画素値と一致する画素数に基づき、チェックボックス511の頂点候補514の検出結果を出力する。これにより、実施形態では、誤検出された頂点候補514を除去してチェックボックス511の頂点候補514を検出できるため、チェックボックス511の認識精度に優れたIPU500を提供できる。
【0108】
また、本実施形態では、頂点候補出力部35は、入力画像Im0に含まれる複数の画素それぞれの画素値から生成されるヒストグラムに基づく二値化閾値を用いて入力画像Im0を二値化した二値化画像Im1から抽出される特徴点513に基づき、チェックボックス511の頂点候補514を出力する。これにより、手書きのパターンが記入された原稿Piや、チェックボックス511上にノイズパターンが上書きされた原稿Piであっても、チェックボックス511の頂点候補514を検出できるため、チェックボックス511の認識精度に優れたIPU500を提供できる。
【0109】
なお、頂点候補出力部35は、入力画像Im0の色成分情報およびヒストグラム情報の少なくとも一方に基づき、入力画像Im0における手書き領域と手書き領域以外の領域とに区別された入力画像Im0の特徴点513に基づき、チェックボックス511の頂点候補514を出力するように構成されてもよい。これにより、手書きによるパターンが記入された原稿Piであっても、チェックボックス511の頂点候補514を検出できるため、チェックボックス511の認識精度に優れたIPU500を提供できる。
【0110】
また、認識結果出力部38は、チェックボックス511図形の大きさ情報および位置情報の少なくとも一方に基づき、チェックボックス511の認識結果を出力するように構成されてもよい。これにより、IPU500よりも後工程において処理を行う装置に対し、チェックボックス511を用いた選択を受け付ける対象項目510を含む出力画像Qを提供できる。
【0111】
また、頂点候補出力部35は、入力画像Im0に含まれる罫線領域516から検出される入力画像Im0の傾きが補正された入力画像Im0の特徴点513に基づき、チェックボックス511の頂点候補514を出力するように構成されてもよい。これにより、傾いた原稿Piを読み取った入力画像Im0であっても、チェックボックス511の頂点候補514を検出できるため、チェックボックス511の認識精度に優れたIPU500を提供できる。
【0112】
また、頂点候補出力部35は、入力画像Im0に含まれる複数の画素それぞれの画素値が反転された入力画像Im0の特徴点513に基づき、チェックボックス511の頂点候補514を出力するように構成されてもよい。これにより、色反転された画像が形成された原稿Piや、下地が着色された原稿Piであっても、チェックボックス511の頂点候補514を検出できるため、チェックボックス511の認識精度に優れたIPU500を提供できる。
【0113】
また、頂点候補出力部35は、入力画像Im0に含まれる複数の画素それぞれの画素値を色成分に分解して取得される色成分画像における特徴点513に基づき、チェックボックス511の頂点候補514を出力するように構成されてもよい。これにより、カラーの原稿Piや、手書きによるパターンが記入された原稿Piであっても、チェックボックス511の頂点候補514を検出できるため、チェックボックス511の認識精度に優れたIPU500を提供できる。
【0114】
また、頂点候補出力部35は、入力画像Im0の色成分情報およびヒストグラム情報の少なくとも一方に基づき、入力画像Im0における帳票領域と帳票領域以外の領域とに区別された入力画像Im0の特徴点513に基づき、チェックボックス511の頂点候補514を出力するように構成されてもよい。これにより、手書きによるパターンが記入された原稿Piや、チェックボックス511上にノイズパターンが上書きされた原稿Piであっても、チェックボックス511の頂点候補514を検出できるため、チェックボックス511の認識精度に優れたIPU500を提供できる。
【0115】
また、頂点候補出力部35は、入力画像Im0に含まれる黒色領域が拡大された入力画像Im0の特徴点513に基づき、チェックボックス511の頂点候補514を出力するように構成されてもよい。これにより、原稿Piに形成された画像の劣化により、チェックボックス511の一部が欠けている原稿Piであっても、チェックボックス511の頂点候補514を検出できるため、チェックボックス511の認識精度に優れたIPU500を提供できる。
【0116】
[その他の好適な実施形態]
その他の実施形態について説明する。なお、上述した実施形態と同一の構成部には、同一の符号を付し、重複する説明を適宜省略する。
【0117】
図23は、その他の実施形態に係る出力画像Qaを示す図である。出力画像Qaは、頂点候補出力部35から出力される頂点候補514の検出結果に基づいて決定される、チェックボックス511を指示する認識マーク521の周辺領域524を含む。認識結果出力部38は、このような出力画像Qaを出力することにより、手書きされたマークがチェックボックス511内に収まらない場合にも、チェックボックス511を認識できるため、チェックボックス511の認識精度に優れたIPU500を提供できる。
【0118】
図24は、その他の実施形態に係るIPU500bの機能構成の一例を示すブロック図である。図24に示すように、IPU500bは、誤認識評価部39を有する。
【0119】
誤認識評価部39は、認識結果出力部38から出力されるチェックボックス511の認識結果に基づき、チェックボックス511以外の文字および図形の少なくとも一方の検出結果を出力する。
【0120】
図25は、その他の実施形態に係る出力画像Qbを示す図である。図25における出力画像Qb'は、チェックボックス511以外の文字である「団」がチェックボックスとして誤認識された誤認識チェックボックス525を含んでいる。
【0121】
一方、図25における出力画像Qbは、誤認識チェックボックス525が誤認識であることを示す誤認識マーク526を含んでいる。この誤認識マーク526は、誤認識評価部39により、認識結果出力部38から出力されたチェックボックス511の認識結果に基づいて検出され、誤認識評価部39により付与されたマークである。このようにして、IPU500bは、チェックボックス511以外の文字および図形による誤認識を防ぎ、チェックボックス511の認識精度を向上させることができる。
【0122】
以上、好ましい実施の形態について詳説したが、上述した実施の形態に制限されることはなく、特許請求の範囲に記載された範囲を逸脱することなく、上述した実施の形態に種々の変形及び置換を加えることができる。
【0123】
上述した実施形態では、トナーを用いる電子写真方式の画像形成装置を例示したが、これに限定されるものではなく、インク等の液体を用いる液体吐出方式の画像形成装置にも実施形態を適用可能である。インクにおいてもトナーと同様に記録媒体への付着ムラ、飛散、滲み等が生じるため、トナーを用いる場合と同様の作用効果を得ることができる。
【0124】
また、実施形態は、画像認識方法を含む。例えば、画像認識方法は、原稿の少なくとも一部が入力された入力画像に含まれ、項目に対する選択を受け付ける選択受付図形を認識可能な画像認識装置による画像認識方法であって、前記画像認識装置が、頂点候補出力部により、前記入力画像に含まれる図形の外形形状の特徴点に基づき、前記選択受付図形の頂点候補の検出結果を出力し、認識結果出力部により、前記頂点候補出力部から出力される前記頂点候補の検出結果に基づき、前記選択受付図形の認識結果を出力する。このような画像認識方法により、上述したIPU500と同様の効果を得ることができる。
【0125】
実施形態の説明で用いた序数、数量等の数字は、全て本発明の技術を具体的に説明するために例示するものであり、本発明は例示された数字に制限されない。また、構成要素間の接続関係は、本発明の技術を具体的に説明するために例示するものであり、本発明の機能を実現する接続関係をこれに限定するものではない。
【0126】
実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
【符号の説明】
【0127】
1 画像形成装置
2 PC
3 サーバー
10、20 CPU
11、21 RAM
12、22 ROM
13、23 HDD
14、24 通信I/F
15、25 バス
16 表示装置
17 入力操作部
41 ADF
42 スキャナユニット
43 排紙トレイ
31 入力部
32 二値化処理部
33 外形形状抽出部
34 特徴点抽出部
35 頂点候補出力部
36 頂点候補評価部
37 登録部
38 認識結果出力部
39 誤認識評価部
100 スキャナ
200 コントローラ
204 第1ミラーユニット
210 第2ミラーユニット
214 光電変換素子
215 第1センサボード
216 レンズ
300 プロッタ
331 露光装置
332 感光体ドラム
333 現像装置
334 転写ベルト
335 定着装置
401 画像メモリ
421、422 給紙カセット
423 給紙手段
500 IPU(画像認識装置の一例)
510 対象項目
511、511a、511b チェックボックス(選択受付図形の一例)
512 外形形状
513 特徴点
514、514a、514b 頂点候補
515 誤検出頂点候補
516 罫線領域
521 認識マーク
522 チェックマーク
523 項目マーク
524 周辺領域
525 誤認識チェックボックス
526 誤認識マーク
Im0 入力画像
Im1 二値化画像
Im2 外形形状画像
NW ネットワーク
Pi 原稿
Po 印刷物
Q 出力画像
【先行技術文献】
【特許文献】
【0128】
【特許文献1】特開2021-039429号公報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25