(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023081032
(43)【公開日】2023-06-09
(54)【発明の名称】情報処理装置、当該情報処理装置における方法、画像読取システム及びプログラム
(51)【国際特許分類】
H04N 1/387 20060101AFI20230602BHJP
G06V 30/14 20220101ALI20230602BHJP
【FI】
H04N1/387 101
G06K9/20 340A
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2021194681
(22)【出願日】2021-11-30
(71)【出願人】
【識別番号】000104652
【氏名又は名称】キヤノン電子株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】岡野 俊史
【テーマコード(参考)】
5B029
5C076
【Fターム(参考)】
5B029AA01
5B029BB02
5B029CC25
5B029EE19
5C076AA22
5C076BA01
5C076BA06
5C076CA09
(57)【要約】
【課題】OCRの誤認識を減少させる技術を提供する。
【解決手段】情報処理装置は、解像度の入力を受け付ける受付手段と、前記受付手段が受け付けた第1解像度より高い第2解像度で原稿を読取手段に読み取らせることで第1画像データを取得する取得手段と、前記第1画像データに基づき前記原稿の切出領域を判定する第1判定手段と、前記第1画像データが示す複数の第1画素の画素数に基づき第2画像データが示す複数の第2画素の画素数を判定する第2判定手段と、前記第1画像データが示す前記複数の第1画素の内の前記切出領域に対応する複数の第3画素の画素値に基づき、前記複数の第2画素それぞれの画素値を求めることで、前記第2画像データを生成する生成手段と、を備えている。
【選択図】
図6
【特許請求の範囲】
【請求項1】
解像度の入力を受け付ける受付手段と、
前記受付手段が受け付けた第1解像度より高い第2解像度で原稿を読取手段に読み取らせることで第1画像データを取得する取得手段と、
前記第1画像データに基づき前記原稿の切出領域を判定する第1判定手段と、
前記第1画像データが示す複数の第1画素の画素数に基づき第2画像データが示す複数の第2画素の画素数を判定する第2判定手段と、
前記第1画像データが示す前記複数の第1画素の内の前記切出領域に対応する複数の第3画素の画素値に基づき、前記複数の第2画素それぞれの画素値を求めることで、前記第2画像データを生成する生成手段と、
を備えていることを特徴とする情報処理装置。
【請求項2】
前記第1判定手段は、前記第1画像データが示す前記複数の第1画素から、前記原稿に印刷された所定のマーカに対応する画素を検出することで前記切出領域を判定することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記第1判定手段は、前記第1画像データに基づき前記原稿の余白領域を検出することで前記切出領域を判定することを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記第2判定手段は、前記第2解像度と前記第1解像度との比に基づき前記複数の第2画素の画素数を判定することを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。
【請求項5】
前記第2判定手段は、前記第1画像データが示す前記複数の第1画素の第1方向における第1画素数と、前記第1方向とは直交する第2方向における第2画素数とを判定し、前記第2解像度に対する前記第1解像度の比を前記第1画素数に乗ずることで、前記第2画像データが示す前記複数の第2画素の前記第1方向における第3画素数を判定し、前記第2解像度に対する前記第1解像度の比を前記第2画素数に乗ずることで、前記第2画像データが示す前記複数の第2画素の前記第2方向における第4画素数を判定することを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記切出領域に対応する前記複数の第3画素の前記第1方向における画素数は、前記第1画素数より少なく、
前記切出領域に対応する前記複数の第3画素の前記第2方向における画素数は、前記第2画素数より少ない、ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記切出領域に対応する前記複数の第3画素の前記第1方向における画素数は、前記第3画素数より多く、
前記切出領域に対応する前記複数の第3画素の前記第2方向における画素数は、前記第4画素数より多い、ことを特徴とする請求項5又は6に記載の情報処理装置。
【請求項8】
前記生成手段は、前記第2画像データが示す前記複数の第2画素それぞれの第2画素の画素値を、前記第2画像データが示す前記複数の第2画素及び前記切出領域に対応する前記複数の第3画素を所定領域内において等間隔に配置した際に、当該第2画素に最も近い第3画素の画素値を少なくとも使用して決定することを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。
【請求項9】
前記受付手段は、動作モードを設定するための入力をさらに受け付け、
前記取得手段は、前記動作モードとして第1モードが設定されている場合、前記第2解像度で前記原稿を前記読取手段に読み取らせ、前記動作モードとして第2モードが設定されている場合、前記第1解像度で前記原稿を前記読取手段に読み取らせ、
前記生成手段は、前記第1モードが設定されている場合に前記第2画像データを生成し、前記第2モードが設定されている場合には前記第2画像データを生成しない、ことを特徴とする請求項1から8のいずれか1項に記載の情報処理装置。
【請求項10】
前記第2画像データが示す画像の指定領域に対して光学的文字認識処理を行う処理手段をさらに備えていることを特徴とする請求項1から9のいずれか1項に記載の情報処理装置。
【請求項11】
前記読取手段は、前記情報処理装置の外部の画像読取装置であることを特徴とする請求項1から10のいずれか1項に記載の情報処理装置。
【請求項12】
1つ以上のプロセッサを有する装置の前記1つ以上のプロセッサで実行されると、前記装置を請求項1から11のいずれか1項に記載の情報処理装置として機能させることを特徴とするプログラム。
【請求項13】
情報処理装置における方法であって、
設定された第1解像度より高い第2解像度で読取手段に原稿を読み取らせることで第1画像データを取得することと、
前記第1画像データに基づき前記原稿の切出領域を判定することと、
前記第1画像データが示す複数の第1画素の画素数に基づき第2画像データが示す複数の第2画素の画素数を判定することと、
前記第1画像データが示す前記複数の第1画素の内の前記切出領域に対応する複数の第3画素の画素値に基づき、前記複数の第2画素それぞれの画素値を求めることで、前記第2画像データを生成することと、
を含む、方法。
【請求項14】
情報処理装置と、画像読取装置と、を含む画像読取システムであって、
前記画像読取装置は、
前記情報処理装置から通知された読取解像度で原稿を読み取って前記情報処理装置に画像データを出力する手段を備え、
前記情報処理装置は、
解像度の入力を受け付ける受付手段と、
前記受付手段が受け付けた第1解像度より高い第2解像度を前記読取解像度として前記原稿を読み取ることを前記画像読取装置に通知することで第1画像データを取得する取得手段と、
前記第1画像データに基づき前記原稿の切出領域を判定する第1判定手段と、
前記第1画像データが示す複数の第1画素の画素数に基づき第2画像データが示す複数の第2画素の画素数を判定する第2判定手段と、
前記第1画像データが示す前記複数の第1画素の内の前記切出領域に対応する複数の第3画素の画素値に基づき、前記複数の第2画素それぞれの画素値を求めることで、前記第2画像データを生成する生成手段と、
を備えていることを特徴とする画像読取システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置と、当該情報処理装置における方法と、当該情報処理装置及び画像読取装置を含む画像読取システムと、プログラムと、に関する。
【背景技術】
【0002】
企業間で文書を交換する際、予め決められた書式の文書(以下、指定文書と表記する。)を使用することが行われている。例えば、企業間における業務の受発注においては、業務の発注側が請求書の書式を指定したりしている。指定文書の文書ファイルは、例えば、書式を指定する企業によってインターネット上で公開され、指定文書を使用する企業は、この文書ファイルをダウンロードして使用する。指定文書の文書ファイルが、ワードプロセッサ用のファイルではない場合、この文書ファイルからワードプロセッサ用のファイルを生成することも行われている。具体的には、文書ファイルを印刷し、印刷した文書(原稿)に対して光学的文字認識(OCR)処理を行うことで、ワードプロセッサ用のファイルが生成される。
【0003】
なお、原稿全体に対してOCR処理を行うのではなく、原稿内のある特定領域のみに対してOCR処理を行う場合がある。これは、OCR処理においては、原稿の汚れが文字と誤認識され得るからである。原稿内のある特定領域のみに対してOCR処理を行うことで、誤認識された文字を削除/訂正する作業の作業量を減らすことができる。
【0004】
例えば、指定文書が
図1(A)の通りであり、"合計金額"を書き込む点線枠内の領域に対してOCR処理を行うものとする。以下の説明において、OCRが行われる原稿上の領域、つまり、本例では点線枠内の領域を"OCR対象領域"と表記する。なお、OCR処理において読み取る原稿の解像度を、例えば、300dpiとする。
図1(A)の数字は、OCR対象領域の範囲を画素数で示したものである。つまり、
図1(A)の左上の画素を基準(原点)にすると、水平方向においては300番目の画素から1800番目の画素までの範囲であり、かつ、垂直方向においては1500番目の画素から1800番目の画素までの範囲がOCR対象領域である。この場合、ユーザは、
図1(A)のOCR対象領域を画素数又は長さで指定してOCR処理を行う。なお、300dpiの場合、長さは、
図1(A)に示す画素数を300で除することで求められる。以下の説明では、ユーザがOCR処理を行うと指定する原稿上の領域を"ОCR指定領域"と表記する。
【0005】
OCR対象領域は、印刷に用いるソフトの種類やバージョン、プリンタの機種、プリンタの設定等によって異なり得る。
図1(B)は、
図1(A)とは異なる位置、かつ、異なるサイズで印刷された指定文書を示している。
図1(B)において、OCR対象領域は、水平方向においては600番目の画素から1800番目の画素までの範囲となり、垂直方向においては1050番目の画素から1290番目の画素の範囲となっている。したがって、
図1(A)と同じОCR指定領域を使用してOCR処理を行うと、OCR対象領域に対してOCR処理が行われないことになる。
【0006】
このため、特許文献1に記載の技術を適用することができる。特許文献1によると、原稿上の所定のマーカを検出し、マーカに基づき画像を適切なサイズに変倍している。例えば、指定文書の文書ファイルが示す画像を
図2(A)の通りとする。
図2(A)の参照符号10は、OCR対象領域であり、参照符号20及び21はマーカである。
図2(B)は、
図2(A)の文書ファイルにより印刷された原稿を示している。
図2(B)に示す様に、指定文書は縮小されて印刷されている。しかしながら、
図2(B)に示す原稿を読み取り、読み取った画像データからマーカ20及びマーカ21を検出し、マーカ20及びマーカ21で囲まれる領域を切り出した後に
図2(A)と同じサイズとなる様に拡大処理を行うことで、OCR指定領域とOCR対象領域10とを一致させることができる。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
マーカに基づき画像の切出処理及び拡大処理を行うことで、ОCR指定領域とOCR対象領域10とを一致させることができる。しかしながら、拡大処理により、画像には"つぶれ"や"ぼけ"が生じる。画像に"つぶれ"や"ぼけ"が生じると、OCRの誤認識が多くなり、修正作業の作業量が増加し得る。
【0009】
本発明は、OCRの誤認識を減少させる技術を提供するものである。
【課題を解決するための手段】
【0010】
本発明の一態様によると、情報処理装置は、解像度の入力を受け付ける受付手段と、前記受付手段が受け付けた第1解像度より高い第2解像度で原稿を読取手段に読み取らせることで第1画像データを取得する取得手段と、前記第1画像データに基づき前記原稿の切出領域を判定する第1判定手段と、前記第1画像データが示す複数の第1画素の画素数に基づき第2画像データが示す複数の第2画素の画素数を判定する第2判定手段と、前記第1画像データが示す前記複数の第1画素の内の前記切出領域に対応する複数の第3画素の画素値に基づき、前記複数の第2画素それぞれの画素値を求めることで、前記第2画像データを生成する生成手段と、を備えていることを特徴とする。
【発明の効果】
【0011】
本発明によると、OCRの誤認識を減少させることができる。
【図面の簡単な説明】
【0012】
【
図2】OCR対象領域をОCR指定領域に一致させる処理の説明図。
【
図3】一実施形態による画像読取システムの構成図。
【
図6】一実施形態による情報処理装置が実行する処理のフローチャート。
【
図7】一実施形態による情報処理装置が実行する抽出処理のフローチャート。
【
図8】一実施形態による情報処理装置が実行する切出処理の説明図。
【
図9】一実施形態による情報処理装置が実行する変換処理の説明図。
【
図10】一実施形態による情報処理装置が実行する変換処理のフローチャート。
【
図11】一実施形態による情報処理装置が実行する変換処理の説明図。
【
図12】一実施形態による情報処理装置が実行する切出処理の説明図。
【発明を実施するための形態】
【0013】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴のうち二つ以上の特徴が任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。
【0014】
図3は、画像読取装置601及び情報処理装置701を含む、本実施形態による画像読取システムを示している。画像読取装置601の制御部504のCPU505は、ROM507に格納された制御プログラムを実行することにより画像読取装置601を制御する。読取ユニット502は、原稿の表面の画像を読み取って画像データを出力する。画像処理回路503は、読取ユニット502からの画像データに対して画像処理を行う。画像処理回路503によって画像処理された画像データは、制御部504のRAM506に一時的に格納される。制御部504は、RAM506に格納された画像データを、通信部508を介して情報処理装置701に出力する。
【0015】
図4は、画像読取装置601のハードウェア構成を示している。原稿検知センサ609は、トレイ上の原稿Dの有無を検知する。ピックアップローラ602は、トレイに載置された原稿Dを画像読取装置601の搬送路に給送する。給送ローラ603は、ピックアップローラ602により給送された原稿Dを下流側に搬送する。分離ローラ604は、原稿Dの重送を防止する。給送ローラ603の下流側において搬送路に沿って設けられる搬送ローラ608は、原稿を排出口まで搬送する。読取ユニット502のラインイメージセンサ605は、搬送路に沿って搬送される原稿Dの表面を主走査方向の1ライン毎に読み取る。なお、主走査方向は、原稿Dの搬送方向に直交する方向である。また、原稿Dの搬送方向は副走査方向とも呼ばれる。ラインイメージセンサ605は、原稿Dの表面を主走査方向の1ライン毎に読み取ることを繰り返すことで、原稿D全体の表面を読み取って原稿Dの画像データを画像処理回路503に出力する。ラインイメージセンサ605が読み取る画像の解像度は、情報処理装置701から設定され得る。
【0016】
続いて、
図3を用いて情報処理装置701の構成について説明する。CPU703は、記憶デバイス706に格納された制御プログラムを実行することで、後述する情報処理装置701における各種処理を実行する。なお、その際、CPU703は、一時的に記憶しておくデータを、RAM705に格納する。記憶デバイス706は、ハードディスクドライブや、フラッシュメモリ等の任意の不揮発性の記憶装置である。入出力部704は、ディスプレイ、キーボード、マウス等を含み、ユーザインタフェースを提供する。通信部702は、画像読取装置601との通信処理を行う。CPU703は、通信部702を介して、画像読取装置601に画像読取指示を送信する。画像読取装置601は、画像読取指示に応答して原稿Dを読み取り、原稿Dの画像データを情報処理装置701に出力する。
【0017】
図5は、情報処理装置701のCPU703が、入出力部704のディスプレイに表示する設定画面901の例を示している。CPU703は、設定画面901を介して、解像度のユーザ入力を受け付ける。また、CPU703は、設定画面901を介して、画像読取の動作モードに関するユーザ入力を受け付ける。本実施形態において、動作モードは、領域補正機能を使用する(オン)第1モードと、領域補正機能を使用しない(オフ)第2モードと、を有する。この様に、CPU703は、ユーザ入力を受け付ける受付部として機能する。ユーザが設定画面901の"スキャン"ボタンを押下すると、情報処理装置701は、設定に応じた画像読取指示を画像読取装置601に送信する。
【0018】
図6は、本実施形態において情報処理装置701が実行する処理のフローチャートである。なお、以下の説明においては、指定文書の文書ファイルが示す画像(以下、基準画像と表記する)を
図2(A)の通りとする。ОCR指定領域は、基準画像におけるОCR対象領域10と同じ領域である。
図2(A)に示す様に、基準画像は、マーカ20及び21を有する。さらに、以下の説明においては、指定文書の文書ファイルにより印刷した結果、
図2(B)に示す原稿Dが得られたものとする。
図2(B)に示す様に、原稿Dには基準画像が縮小された画像が印刷されている。
【0019】
S10において、CPU703は、
図5に示す設定画面901を表示し、ユーザに解像度と、動作モード、つまり、領域補正機能を使用するか否かを選択させる。なお、以下の説明において、ユーザが設定画面901で設定した解像度を"設定解像度"と表記する。ユーザが設定画面901の"スキャン"ボタンを押下すると、CPU703は、S11において、設定解像度と、領域補正機能を使用するか否かのユーザによる選択と、に基づいて、画像読取装置601による読み取りの解像度(以下、"読取解像度"と表記する。)を決定する。具体的には、ユーザが領域補正機能を使用しないと選択している場合、CPU703は、読取解像度を設定解像度と同じ解像度に決定する。一方、ユーザが領域補正機能を使用すると選択している場合、CPU703は、読取解像度を設定解像度より高い解像度に決定する。本例において、CPU703は、読取解像度を設定解像度の2倍にする。したがって、ユーザが設定解像度として300dpiを選択し、領域補正機能をオンに設定していると、読取解像度は600dpiとなる。
【0020】
CPU703は、読取解像度を決定すると、S12で画像読取装置601に画像読取指示を送信する。画像読取指示は、読取解像度を示す情報を含む。これにより、画像読取装置601は、通知された読取解像度で
図2(B)の原稿Dを読み取って画像データを情報処理装置701に送信する。したがって、情報処理装置701は、S13で、
図2(B)の原稿Dの画像データを取得する。CPU703は、S14で、領域補正機能がオンであるか否かを判定する。領域補正機能がオフ、つまり、ユーザがS10で領域補正機能を使用しないことを選択していた場合、CPU703は、S16で、画像データのOCR指定領域に対する光学的文字認識処理(OCR処理)を行う。一方、領域補正機能がオン、つまり、ユーザがS10で領域補正機能を使用することを選択していた場合、CPU703は、S15で、画像データに対して後述する抽出処理を行う。その後、CPU703は、S16で、抽出処理後の画像データのOCR指定領域に対するOCR処理を行う。
【0021】
図7は、
図6のS15における抽出処理のフローチャートである。S20で、CPU703は、画像データからマーカ20及び21に対応する画素を検出する。本実施形態において、マーカ20及び21は黒色の正方形であるため、CPU703は、黒色の画素が正方形状に固まっている領域を検出することでマーカ20及び21に対応する画素を検出することができる。
【0022】
続いて、CPU703は、S21において、画像データの画素から、マーカ20及び21を互いに対向する頂点とする方形状の領域に含まれる画素を切り出す。
図8(A)は、原稿Dを読取解像度で読み取った画像データ(以下、読取画像データと表記する。)が示す画像を示している。この場合、CPU703は、方形状の領域25の中に含まれる画素を切り出す。以下の説明において、読取画像データから切出領域25に含まれる画素を切り出すことで生成される画像データを切出画像データと表記する。
図8(B)は、切出画像データが示す画像を示している。
【0023】
なお、以下の説明では、
図8(A)に示す様に、読取画像データのX方向の画素数を5000とし、Y方向の画素数を10000とし、切出画像データのX方向の画素数を4000とし、Y方向の画素数を7000とする。なお、X方向は主走査方向に対応し、Y方向は副走査方向に対応する。
【0024】
CPU703は、S22において、S23での変換処理における、変換後のX方向及びY方向それぞれの画素数を判定する。変換後の画素数は、設定解像度で原稿を読み取った際の画素数である。本例では、読取解像度を設定解像度の2倍としているため、変換後のX方向の画素数は、5000/2=2500であり、変換後のY方向の画素数は、10000/2=5000である。より一般的には、設定解像度に対する読取解像度の比をNとし、画像読取装置601からの読取画像データのX方向の画素数及びY方向の画素数をそれぞれXM及びYMとすると、変換後のX方向及びY方向の画素数は、それぞれ、XM/N及びYM/Nとなる。
【0025】
CPU703は、S23において、変換処理を行う。
図9は変換処理の説明図である。
図9(A)は、
図8(B)と同じであり、切出画像データが示す画像を示している。変換処理は、切出画像データを、設定解像度で原稿Dを読み取った場合の画素数の画像データに変換する処理である。以下の説明において、変換処理により得られる設定解像度で原稿Dを読み取った場合の画素数に等しい画像データを変換後画像データと表記する。本例において、変換後画像データのX方向及びY方向の画素数は、S22で求めた2500及び5000である。
図9(B)は、変換後画像データが示す画像を示している。なお、
図9(A)及び
図9(B)は、解像度を考慮して表記しているため、画素数の少ない変換後画像データによる
図9(B)の画像を、画素数の多い切出画像データによる
図9(A)の画像より大きく表示している。なお、例えば、変換後画像データの解像度は300dpiであり、切出画像データの解像度は600dpiである。
【0026】
変換処理において、CPU703は、X方向及びY方向それぞれにおいて、変換後画像データの画素数に対する切出画像データの画素数の比RX及び比RYを求める。本例においては、
図9より、比RX=4000/2500=1.6であり、比RY=7000/5000=1.4である。
【0027】
CPU703は、切出画像データについては、
図9(A)の最も上側かつ最も左側の画素を原点として、各画素をX方向及びY方向の座標に対応付ける。なお、各画素の座標は、原点からの画素数に対応するものとする。つまり、原点に対応する画素の座標は(0,0)であり、原点に対応する画素の1つ右側の画素の座標は(1,0)であり、原点に対応する画素の1つ下側の画素の座標は(0,1)である。したがって、切出画像データが示す画素は、座標(X,Y)=(0,0)~(3999,6999)の範囲の内のX及びYが整数の位置となる。同様に、CPU703は、変換後画像データについても
図9(B)の最も上側かつ最も左側の画素を原点として、各画素をX方向及びY方向の座標に対応付ける。したがって、変換後画像データが示す画素は、座標(X,Y)=(0,0)~(2499,4999)の範囲の内のX及びYが整数の位置となる。
【0028】
なお、以下では、変換後画像データの座標系と、切出画像データの座標系を区別するため、変換後画像データの座標系については、X及びYをAX及びAYと表記し、切出画像データの座標系については、X及びYをBX及びBYと表記する。したがって、切出画像データが示す画素は、座標(BX,BY)=(0,0)~(3999,6999)の範囲の内のBX及びBYが整数の位置となる。同様に、変換後画像データが示す画素は、座標(AX,AY)=(0,0)~(2499,4999)の範囲の内のAX及びAYが整数の位置となる。
【0029】
図10は、
図7のS23における変換処理のフローチャートである。CPU703は、S30においてAX=0に初期化し、S31において、BX=RX×AXに設定する。なお、本例において比RXは1.6であるため、
図10ではRXを1.6として記載している。続いて、CPU703は、S32においてAY=0に初期化し、S33において、BY=RY×AYに設定する。なお、本例において比RYは1.4であるため、
図10ではRYを1.4として記載している。続いて、CPU703は、S34において、切出画像データの座標(BX,BY)の画素値に基づき、変換後画像データの座標(AX,AY)を決定する。なお、S34のP(BX,BY)は、切出画像データの座標系における座標(BX,BY)の画素値を示し、P(AX,AY)は、変換後画像データの座標系における座標(AX,AY)の画素値を示している。なお、S34における処理の詳細については後述する。
【0030】
CPU703は、S35で、AYを1だけ増加させ、S36で、AYが変換後画像データのY方向の画素数である5000に等しいか否かを判定する。AYが変換後画像データのY方向の画素数である5000に等しくない場合、CPU703は、S33から処理を繰り返す。一方、S36で、AYが変換後画像データのY方向の画素数である5000に等しい場合、CPU703は、S37で、AXを1だけ増加させ、S38で、AXが変換後画像データのX方向の画素数である2500に等しいか否かを判定する。AXが変換後画像データのX方向の画素数である2500に等しくない場合、CPU703は、S31から処理を繰り返す。一方、S38で、AXが変換後画像データのX方向の画素数である2500に等しい場合、CPU703は、
図10の処理を終了する。
【0031】
続いて、
図10のS34の処理について、
図11を用いて説明する。
図10から明らかな様に、AX及びAYは1ずつ増加されるため、座標(AX,AY)は、変換後画像データの画素の位置に対応する。一方、BX及びBYは、それぞれ、1.6及び1.4ずつ増加されるため、座標(BX,BY)は、切出画像データの画素の位置に対応しない場合がある。例えば、
図11から明らかな様に、変換後画像データの座標(1,2)の画素の画素値は、S34において、切出画像データにおける座標(1.6,2.8)の画素値に基づき決定される。本例においては、切出画像データの座標(1.6,2.8)の画素値とは、座標(1.6,2.8)に最も近い画素の画素値とする。これは、切出画像データの座標(1.6,2.8)の小数点以下を四捨五入することで求められる。つまり、変換後画像データの座標(1,2)の画素の画素値は、切出画像データの座標(2,3)と同じとする。
【0032】
なお、本実施形態では、切出画像データの座標(BX,BY)の画素値を、BX及びBYの小数点以下を四捨五入した座標の画素の画素値としたが、小数点以下を切り上げ又は切り捨てする構成であっても良い。さらに、切出画像データの座標(BX,BY)を取り囲む4つの画素の画素値に基づき切出画像データの座標(BX,BY)を求める構成であっても良い。
【0033】
なお、
図10の処理の考え方を述べると、CPU703は、まず、切出画像データの画素を、X方向及びY方向それぞれにおいて間隔Iで配置する。続いて、CPU703は、変換後画像データの画素を、X方向においては間隔RX×Iで、かつ、Y方向においては間隔RY×Iで配置する。なお、切出画像データのX=0及びY=0の画素と、変換後画像データのX=0及びY=0の画素の位置は一致させる。そして、CPU703は、変換後画像データの画素に最も近い切出画像データの画素の画素値を、当該変換後画像データの画素の画素値とする、というものである。さらに、
図10の処理の考え方をより簡易的に述べると、切出画像データの画素を所定領域内の全体に渡り等間隔に配置し、変換後画像データの画素も当該所定領域内の全体に渡り等間隔に配置した場合に、変換後画像データの画素の画素値を、当該画素に最も近い切出画像データの画素に基づき決定するというものである。
【0034】
以上、本実施形態では、領域補正を行う場合、設定解像度より高い解像度で原稿を読み取る。そして、マーカに基づき基準画像と同じ領域を切り出した後、設定解像度で読み取った場合の画素数と同じ画素数の画像データに変換する。設定解像度より高い解像度で原稿を読み取るため、画像データの変換において、文字の"つぶれ"や"ぼけ"が生じることを抑え、よって、ОCR処理での誤認識を減らすことができる。また、
図9(B)に示す様に、変換後の画像データが示す画像は、基準画像と同じ位置関係となるため、OCR指定領域とOCR対象領域が一致する。
【0035】
なお、文字の"つぶれ"や"ぼけ"を効果的に防ぐため、切出画像データのX方向における画素数が、変換後画像データのX方向における画素数より多く、切出画像データのY方向における画素数が、変換後画像データのY方向における画素数より多くなる様に、読取解像度を設定する構成とすることができる。つまり、文書ファイルを印刷した場合の一般的な画像の縮小の程度に基づき、S23における変換処理が画素数の削減となる様に読取解像度を設定する構成とすることができる。
【0036】
なお、本実施形態では、原稿上のマーカの位置を右上端と左下端の2か所としているが、本発明はこれに限定されず、マーカの位置から切出領域を特定できるものであればマーカの位置は任意である。例えば、切出領域の4隅にマーカを配置する構成とすることができる。また、切出領域の各辺の上にマーカを配置する構成とすることもできる。さらに、本実施形態では、マーカを黒色の正方形としたが、CPU703がマーカと認識できる任意の色や形状とすることができる。さらに、マーカは、QRコード(登録商標)や絵柄などであっても良い。
【0037】
さらに、切出領域をマーカにより判定するのではなく、原稿の余白領域により判定する構成とすることができる。
図12は、余白領域に基づき切出領域を判定する例を示している。
図12において、点線で囲まれた領域が切出領域であり、それ以外の領域が余白領域である。
【0038】
また、マーカに基づき判定される切出領域を、他の情報に基づき調整する構成とすることができる。例えば、マーカに基づき判定される切出領域の主走査方向の画素数が999であり、変換後の主走査方向の画素数が500であるものとする。この場合、比RXを整数とするために、主走査方向における切出領域を1画素だけ広げて1000画素とすることができる。この場合、OCR指定領域とOCR対象領域には若干の"ずれ"が生じるが、比RXを整数とすることで、ОCR処理での誤認識を減らすことに繋がり得る。
【0039】
また、上記実施形態において、画像読取装置601は、情報処理装置701の外部の装置であった。しかしながら、上記実施形態の画像読取装置601と情報処理装置701とを1つの装置とすること、例えば、情報処理装置701が実行するとした処理を画像読取装置601が実行する構成とすることもできる。また、情報処理装置701は、1つの装置で実現することも、相互に通信可能な複数の装置により実現することもできる。さらに、本発明では、1つ以上のプロセッサを有する装置の当該1つ以上のプロセッサで実行されると、当該装置を上記の情報処理装置701として機能させるプログラムが提供される。当該プログラムは、例えば、当該装置の1つ以上の記憶デバイスに格納される。また、当該プログラムは、コンピュータが読み取り可能な記憶媒体に記憶されて、又は、ネットワーク経由で配布され得る。
【0040】
発明は上記の実施形態に制限されるものではなく、発明の要旨の範囲内で、種々の変形・変更が可能である。
【符号の説明】
【0041】
702:通信部、703:CPU、704:入出力部、705:RAM、706:記憶デバイス