(58)【調査した分野】(Int.Cl.,DB名)
前記データ形式特定手段は、前記余白検出手段によって検出された前記余白パターンを圧縮可能である場合、前記余白パターンを圧縮する前記データ形式を特定することを特徴とする請求項3に記載の画像読取装置。
対象物から画像を読み取り可能な撮像素子を有し、前記画像を読み取った前記撮像素子毎のアナログデータを出力する画像読取手段と、前記画像読取手段から出力されるアナログデータをデジタルデータに変換して圧縮前データを生成する圧縮前データ生成手段とを備えた画像読取装置で実行される画像処理方法であって、
前記圧縮前データ生成手段によって生成された前記圧縮前データに基づいて、前記画像に含まれる余白パターンを検出する余白検出ステップと、
前記余白検出ステップによって検出された前記余白パターンに基づいて、前記画像の文書種別を特定する文書種別特定ステップと、
前記圧縮前データ生成手段によって生成された前記圧縮前データを現像して、所定のデータ形式で圧縮された画像データを生成する画像データ生成ステップと、
前記画像データ生成ステップによって生成された前記画像データを、前記文書種別特定ステップによって特定された前記文書種別を示す文書種別データと関連付けて、記憶部に出力するデータ出力ステップと
を備え、
前記文書種別特定ステップは、前記余白検出ステップによって検出された前記余白パターンの二次元の周波数特性に対応する前記画像の文書種別を、前記余白パターンの二次元の周波数特性と、前記画像の文書種別が対応付けられた文書種別特定テーブルを参照して特定することを特徴とする画像処理方法。
対象物から画像を読み取り可能な撮像素子を有し、前記画像を読み取った前記撮像素子毎のアナログデータを出力する画像読取手段と、前記画像読取手段から出力されるアナログデータをデジタルデータに変換して圧縮前データを生成する圧縮前データ生成手段とを備えた画像読取装置であるコンピュータに、
前記圧縮前データ生成手段によって生成された前記圧縮前データに基づいて、前記画像に含まれる余白パターンを検出する余白検出ステップ、
前記余白検出ステップによって検出された前記余白パターンに基づいて、前記画像の文書種別を特定する文書種別特定ステップ、
前記圧縮前データ生成手段によって生成された前記圧縮前データを現像して、所定のデータ形式で圧縮された画像データを生成する画像データ生成ステップ、
前記画像データ生成ステップによって生成された前記画像データを、前記文書種別特定ステップによって特定された前記文書種別を示す文書種別データと関連付けて、記憶部に出力するデータ出力ステップ
を実行させ、
前記文書種別特定ステップは、前記余白検出ステップによって検出された前記余白パターンの二次元の周波数特性に対応する前記画像の文書種別を、前記余白パターンの二次元の周波数特性と、前記画像の文書種別が対応付けられた文書種別特定テーブルを参照して特定することを特徴とする画像処理プログラム。
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示の画像処理装置では、画像に含まれる線の太さ、線の形状、ひらがな、アルファベット、漢字などの文字種別などが、線画の検出精度に影響を与える。したがって、画像に含まれる線の太さ、線の形状、文字種別などによっては、文書タイプを正確に識別できないおそれがある。さらに、線画領域の特徴量を算出するに当たって、線画パターンについてのパターンマッチング等の処理が必要であり、文書タイプを迅速に識別できないおそれがある。
【0005】
本発明は、上述した課題を解決するためになされたものであり、読み取った画像の文書種別を正確かつ高速に識別可能な画像読取装置、画像処理方法および画像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第一態様に係る画像読取装置は、対象物から画像を読み取り可能な撮像素子を有し、前記画像を読み取った前記撮像素子毎のアナログデータを出力する画像読取手段と、前記画像読取手段から出力されるアナログデータをデジタルデータに変換して圧縮前データを生成する圧縮前データ生成手段と、前記圧縮前データ生成手段によって生成された前記圧縮前データに基づいて、前記画像に含まれる余白パターンを検出する余白検出手段と、前記余白検出手段によって検出された前記余白パターンに基づいて、前記画像の文書種別を特定する文書種別特定手段と、前記圧縮前データ生成手段によって生成された前記圧縮前データを現像して、所定のデータ形式で圧縮された画像データを生成する画像データ生成手段と、前記画像データ生成手段によって生成された前記画像データを、前記文書種別特定手段によって特定された前記文書種別を示す文書種別データと関連付けて、記憶部に出力するデータ出力手段と
、前記余白パターンの二次元の周波数特性と、前記画像の文書種別が対応付けられた文書種別特定テーブルを記憶するテーブル記憶手段とを備え、前記文書種別特定手段は、前記余白検出手段によって検出された前記余白パターンの二次元の周波数特性に対応する前記画像の文書種別を、前記文書種別特定テーブルを参照して特定する。
【0007】
第一態様によれば、画像を読み取った撮像素子毎に出力されるアナログデータがデジタルデータに変換されて、圧縮前データが生成される。生成された圧縮前データに基づいて、画像に含まれる余白パターンが検出される。検出された余白パターンに基づいて、画像の文書種別が特定される。生成された圧縮前データを圧縮して、画像データが生成される。生成された画像データが、特定された文書種別を示す文書種別データと関連付けて、記憶部に出力される。これによれば、読み取った画像に含まれる余白パターンに基づいて画像の文書種別が特定されるので、画像に含まれる線画や文字情報の影響を排除して文書種別を正確かつ高速に識別できる。また、画像データへの圧縮によって劣化する前の圧縮前データに基づいて、文書種別をより正確に識別できる。さらに、出力された画像データの文書種別を、関連付けられた文書種別データに基づいて特定できるため、サーバもしくはPC等の外部機器で文書種別に応じた処理を行う場合に、文書種別を識別するために画像データを圧縮前データに復元する必要がない。
【0008】
また、余白パターンの二次元の周波数特性によって、画像の文書種別を正確に特定できる。
【0009】
前記画像読取手段は、複数の走査ラインによって前記対象物から前記画像を読み取り、前記余白検出手段は、同一の前記走査ラインにおいて余白を示す前記圧縮前データが所定数以上連続する領域を、前記余白パターンとして検出してもよい。この場合、同一の走査ラインにおいて余白を示す圧縮前データが所定数以上連続する領域に基づいて、余白パターンを正確に特定できる。
【0010】
前記余白検出手段によって検出された前記余白パターンに基づいて、前記画像データのデータ圧縮に使用する前記データ形式を特定するデータ形式特定手段を備え、前記画像データ生成手段は、前記データ形式特定手段によって特定された前記データ形式に基づいて、前記画像データを生成してもよい。この場合、余白パターンに対応する最適なデータ形式で圧縮した画像データを生成できる。
【0011】
前記データ形式特定手段は、前記余白検出手段によって検出された前記余白パターンを圧縮可能である場合、前記余白パターンを圧縮する前記データ形式を特定してもよい。この場合、余白パターンが圧縮可能である場合、余白パターンを圧縮することで、画像データを高速に生成できる。
【0012】
本発明の第二態様に係る画像処理方法は、対象物から画像を読み取り可能な撮像素子を有し、前記画像を読み取った前記撮像素子毎のアナログデータを出力する画像読取手段と、前記画像読取手段から出力されるアナログデータをデジタルデータに変換して圧縮前データを生成する圧縮前データ生成手段とを備えた画像読取装置で実行される画像処理方法であって、前記圧縮前データ生成手段によって生成された前記圧縮前データに基づいて、前記画像に含まれる余白パターンを検出する余白検出ステップと、前記余白検出ステップによって検出された前記余白パターンに基づいて、前記画像の文書種別を特定する文書種別特定ステップと、前記圧縮前データ生成手段によって生成された前記圧縮前データを現像して、所定のデータ形式で圧縮された画像データを生成する画像データ生成ステップと、前記画像データ生成ステップによって生成された前記画像データを、前記文書種別特定ステップによって特定された前記文書種別を示す文書種別データと関連付けて、記憶部に出力するデータ出力ステップとを備え
、前記文書種別特定ステップは、前記余白検出ステップによって検出された前記余白パターンの二次元の周波数特性に対応する前記画像の文書種別を、前記余白パターンの二次元の周波数特性と、前記画像の文書種別が対応付けられた文書種別特定テーブルを参照して特定する。
【0013】
本発明の第三態様に係る画像処理プログラムは、対象物から画像を読み取り可能な撮像素子を有し、前記画像を読み取った前記撮像素子毎のアナログデータを出力する画像読取手段と、前記画像読取手段から出力されるアナログデータをデジタルデータに変換して圧縮前データを生成する圧縮前データ生成手段とを備えた画像読取装置であるコンピュータに、前記圧縮前データ生成手段によって生成された前記圧縮前データに基づいて、前記画像に含まれる余白パターンを検出する余白検出ステップ、前記余白検出ステップによって検出された前記余白パターンに基づいて、前記画像の文書種別を特定する文書種別特定ステップ、前記圧縮前データ生成手段によって生成された前記圧縮前データを現像して、所定のデータ形式で圧縮された画像データを生成する画像データ生成ステップ、前記画像データ生成ステップによって生成された前記画像データを、前記文書種別特定ステップによって特定された前記文書種別を示す文書種別データと関連付けて、記憶部に出力するデータ出力ステップを実行させ
、前記文書種別特定ステップは、前記余白検出ステップによって検出された前記余白パターンの二次元の周波数特性に対応する前記画像の文書種別を、前記余白パターンの二次元の周波数特性と、前記画像の文書種別が対応付けられた文書種別特定テーブルを参照して特定する。
【0014】
第二態様および第三態様によれば、画像を読み取った撮像素子毎に出力されるアナログデータがデジタルデータに変換されて、圧縮前データが生成される。生成された圧縮前データに基づいて、画像に含まれる余白パターンが検出される。検出された余白パターンに基づいて、画像の文書種別が特定される。生成された圧縮前データを圧縮して、画像データが生成される。生成された画像データが、特定された文書種別を示す文書種別データと関連付けて、記憶部に出力される。これによれば、読み取った画像に含まれる余白パターンに基づいて画像の文書種別が特定されるので、画像に含まれる線画や文字情報の影響を排除して文書種別を正確かつ高速に識別できる。また、画像データへの圧縮によって劣化する前の圧縮前データに基づいて、文書種別をより正確に識別できる。さらに、出力された画像データの文書種別を、関連付けられた文書種別データに基づいて特定できるため、サーバもしくはPC等の外部機器で文書種別を識別するために画像データを圧縮前データに復元する必要がない。
また、余白パターンの二次元の周波数特性によって、画像の文書種別を正確に特定できる。
【発明を実施するための形態】
【0016】
以下、本発明の実施形態について、図面を参照して説明する。参照する図面は、本発明が採用し得る技術的特徴を説明するために用いられるものである。図面に記載されている装置の構成、各種処理のフローチャート等は、それのみに限定する趣旨ではなく、単なる説明例である。
【0017】
図1を参照して、本実施形態に係る画像処理システムの概要について説明する。画像処理システム1は、画像読取装置11およびサーバ12を備えている。画像読取装置11は、図示しないネットワークによってサーバ12と接続している。画像読取装置11は、原稿に対して手動で走査させて画像を読み取るモバイル型の画像スキャナである。画像読取装置11は、読み取った画像データを、ネットワークを介してサーバ12に送信する。サーバ12は、画像読取装置11から受信した画像データに基づいて、各種サービスを提供することができる。
【0018】
図2を参照して、画像読取装置11の電気的構成について説明する。画像読取装置11は、画像読取装置11全体の制御を司るCPU21を備えている。CPU21には、SRAM22、FLASH ROM23、EEPROM24、通信インタフェース(以下、通信I/Fという。)25、イメージセンサ26、操作キー27、及びディスプレイ28が接続されている。さらに、図示しないが、CPU21には、USBメモリやSDカードなどの外部記憶媒体を接続するためのインタフェースが接続されている。
【0019】
SRAM22には、タイマやカウンタ、一時的なデータが記憶される。FLASH ROM23には、CPU21の制御プログラムが記憶される。EEPROM24には、パラメータや読み取り条件、後述の文書種別特定テーブル90(
図2参照)が記憶される。パラメータとしては、例えば、CPU21がイメージセンサ26を駆動する場合に最適な駆動パラメータや、原稿に照射する光(図示外)の強度パラメータが挙げられる。読み取り条件としては、画像を読み取る場合の画素数、モノクロ/カラー、濃度が挙げられる。通信I/F25は、ネットワークを介した通信を制御するためのコントローラである。
【0020】
イメージセンサ26は、原稿から画像を読み取り可能な撮像素子を有する、例えばCCD方式やCIS方式のセンサである。例えば操作キー27を用いて読み取り指示が入力された場合、イメージセンサ26の撮像素子が原稿から画像を読み取る。イメージセンサ26は、画像を読み取った撮像素子毎のアナログデータを出力する。本実施形態では、イメージセンサ26は、原稿を走査ライン毎に読み取ることで、走査ライン毎のアナログデータを出力する。CPU21は、イメージセンサ26から取得した走査ライン毎のアナログデータをデジタルデータに変換して圧縮前データ(所謂、RAWデータ)を生成する。生成された圧縮前データは、SRAM22に記憶される。
【0021】
なお、本実施形態では、CPU21の制御プログラムがFLASH ROM23にあらかじめ記憶されている。ただし、画像読取装置11の構成によっては、制御プログラムを外部記憶媒体から読み込んだり、ネットワークを介してダウンロードしたりして、画像読取装置11にインストールしてもよい。
【0022】
サーバ12の電気的構成について説明する。サーバ12は、サーバ12全体の制御を司るCPU31を備えている。CPU31は、ROM32、RAM33、HDD34、ディスプレイ35、キーボード36、マウス37、ドライブ装置38、及び通信I/F39を備えている。ROM32には、ブートプログラムやBIOS等が記憶される。RAM33には、タイマやカウンタ、一時的なデータが記憶される。HDD34には、CPU31の制御プログラムやOS、画像読取装置11から受信した画像データなどが記憶される。ドライブ装置38は、外部記憶媒体(図示外)に記憶された情報を読み取ることができる。通信I/F39は、ネットワークを介した通信を制御するためのコントローラである。図示しないが、サーバ12は、Webサーバやアプリケーションサーバなど、各種サービスを提供するための他のサーバと接続されている。
【0023】
図2を参照して、文書種別特定テーブル90について説明する。文書種別特定テーブル90には、原稿から読み取られた画像の余白パターンと、その余白パターンに対応する文書種別とが定められている。
図2に示す例では、余白パターンが、余白パターンを2次元フーリエ変換した周波数別の強度分布の分散値Vx、Vyや、画像中の余白の割合などで定義されている。文書種別が、レシート、名刺、雑誌等で定義されている。したがって、原稿から読み取られた画像の余白パターンに基づいて、その画像の文書種別を特定可能である。
【0024】
図3〜
図10を参照して、画像処理システム1で実行される処理を、画像読取装置11で実行される処理と、サーバ12で実行される処理に分けて説明する。
【0025】
図3を参照して、画像読取装置11で実行される画像データ処理について説明する。本処理は、イメージセンサ26の画像読み取りによってSRAM22に圧縮前データが記憶されると、FLASH ROM23に記憶されている制御プログラムに基づいて、CPU21によって実行される。
【0026】
図3に示すように、画像データ処理では、まずSRAM22に記憶されている圧縮前データに公知のエッジ検出を実行して、イメージセンサ26が画像を読み取った原稿の用紙外形が検出される(S1)。ステップS1で検出された用紙外形の内側領域である用紙エリア内の余白が、公知の画像処理によって検出される(S3)。ステップS3で検出された余白パターンに基づいて、イメージセンサ26が読み取った画像の文書種別が識別される(S5)。詳細には、文書種別特定テーブル90を参照して、ステップS3で検出された余白パターンに対応する文書種別が特定される。
【0027】
次いで、ステップS3で検出された余白パターンに基づいて、用紙エリア内の余白の割合が閾値n以上であるか否かが判断される(S7)。例えば、余白パターンが用紙エリア全体の「50%」以上である場合、余白割合が閾値n以上であると判断される(S7:YES)。この場合、SRAM22に記憶されている圧縮前データが現像されて、ランレングス方式で圧縮された画像データが生成される(S9)。一方、余白パターンが用紙エリア全体の「50%」未満である場合、余白割合が閾値n未満であると判断される(S7:YES)。この場合、SRAM22に記憶されている圧縮前データが現像されて、Jpeg方式で圧縮された画像データが生成される(S11)。ステップS9またはステップS11で生成された画像データは、SRAM22に記憶される。
【0028】
このように、余白パターンに対応する最適なデータ形式で圧縮した画像データが生成される。具体的には、画像中の余白の割合が多い場合には、画像中の余白を圧縮するランレングス方式によって画像データを効率的かつ高速に生成できる。また、ランレングス方式によって圧縮することによって、圧縮後の画像データを圧縮前データに可逆的に損失なく復元できる。一方、画像中の余白の割合が少ない場合には、ランレングス方式とは異なるJpeg方式によって、画像データをより効率的に圧縮できる。
【0029】
最後に、ステップS5で識別された文書種別を示す文書種別データが、SRAM22に記憶された画像データに付与されて、画像データがサーバ12に送信される(S13)。その後、画像データ処理(
図3参照)は終了する。
【0030】
図4〜
図9を参照して、画像データ処理(
図3参照)で実行される処理を具体的に説明する。
図4に示すように、読み取り対象の原稿がレシート50である場合、ステップS1では、読み取られた圧縮前データに基づいてレシート50の用紙外形が検出される。ステップS3では、走査ライン毎に取得した階調データを2値化して、空白を示す「0」が一定画素(例えば、5画素)以上連続した領域が余白として検出される(
図5参照)。これにより、レシート50の余白パターンを示す余白データ51が生成される。
【0031】
ステップS5では、余白データ51が示す余白パターンを2次元フーリエ変換して、x方向およびy方向の周波数別の強度分布が得られる(
図6参照)。文書種別の識別には、周波数別の強度分布の広がりを用いる。本実施形態では強度分布の分散値Vx、Vyを用いた場合を例示する。
図6(A)に示すように、分散値Vyは閾値kよりも大きい。
図6(B)に示すように、分散値Vxは閾値kよりも小さい。したがって、文書種別特定テーブル90(
図2参照)を参照して、画像の文書種別として「レシート」が特定される。
【0032】
次いで、余白データ51が示す余白割合は「50%」未満であるため(S7:NO)、ステップS11では、レシート50の圧縮前データに基づいてJpeg方式で圧縮した画像データが生成される。ステップS13では、生成された画像データに、文書種別「レシート」を示す文書種別データが付与されて、画像データがサーバ12に送信される。
【0033】
図7に示すように、読み取り対象の原稿が名刺60である場合、ステップS1では、名刺60の用紙外形を検出する。ステップS3では、名刺60の余白パターンを示す余白データ61が生成される。ステップS5では、余白データ61が示す余白パターンを2次元フーリエ変換して、分散値Vx、Vyが得られる(
図8参照)。
図8(A)に示すように、分散値Vyは閾値kよりも小さい。
図8(B)に示すように、分散値Vxは閾値kよりも小さい。余白データ61が示す余白割合は、閾値m(例えば、40%)よりも大きい。したがって、文書種別特定テーブル90(
図2参照)を参照して、画像の文書種別として「名刺」が特定される。
【0034】
次いで、余白データ61が示す余白割合は「50%」以上であるため(S7:YES)、ステップS9では、名刺60の圧縮前データに基づいてランレングス方式で圧縮した画像データが生成される。ステップS13では、生成された画像データに、文書種別「名刺」を示す文書種別データが付与されて、画像データがサーバ12に送信される。
【0035】
図9に示すように、読み取り対象の原稿が雑誌70である場合、ステップS1では、雑誌70の用紙外形を検出する。ステップS3では、雑誌70の余白パターンを示す余白データ71を生成する。ステップS5では、余白データ71が示す余白パターンを2次元フーリエ変換して、分散値Vx、Vyを得る。図示しないが、分散値Vx、Vyはいずれも閾値kよりも小さい。余白データ61が示す余白割合は、閾値mよりも小さい。したがって、文書種別特定テーブル90(
図2参照)を参照して、画像の文書種別として「雑誌」が特定される。
【0036】
次いで、余白データ71が示す余白割合は「50%」未満であるため(S7:NO)、ステップS11では、雑誌70の圧縮前データに基づいてJpeg方式で圧縮した画像データが生成される。ステップS13では、生成された画像データに、文書種別「雑誌」を示す文書種別データが付与されて、画像データがサーバ12に送信される。
【0037】
図示しないが、読み取り対象の原稿が写真である場合、写真の余白パターンを示す余白データに基づいて、余白割合が極めて小さいことが特定される。この場合、文書種別特定テーブル90(
図2参照)を参照して、画像の文書種別として「写真」が特定される。さらに、Jpeg方式で圧縮した画像データが生成され、文書種別「写真」を示す文書種別データが付与されて、画像データがサーバ12に送信される。
【0038】
ところで、本実施形態では、読み取った画像の余白パターンのみを周波数解析の対象として、解析した周波数特性に基づいて文書種別が特定される。これにより、画像中の線画情報や文字情報などが、解析した周波数成分に含まれることを排除できる。ひいては、線画の太さや形状、文字種別、言語の違い等の影響を受けることなく、読み取った画像の文書種別を正確かつ高速に特定できる。
【0039】
図10を参照して、サーバ12で実行されるサーバ処理について説明する。本処理は、HDD34に記憶されている制御プログラムに基づいて、CPU31によって実行される。
【0040】
図10に示すように、サーバ処理では、まず画像読取装置11から画像データを受信したか否かが判断される(S51)。画像データを受信した場合(S51:YES)、受信した画像データに付与されている文書種別データに基づいて、画像データがwebサービスに送信される(S53)。
【0041】
例えば、文書種別データが「レシート」である場合、web上で家計簿をつけるサービスを提供するサーバに、画像データが送信される。文書種別データが「名刺」である場合、web上で名刺を管理するサービスを提供するサーバに、画像データが送信される。文書種別データが「雑誌」である場合、web上で雑誌の切り抜きを収集するサービスを提供するサーバに、画像データが送信される。このように、ステップS53では、文書種別に応じた最適なサービスを提供するサーバに、画像データが送信される。その後、または、画像データを受信しなかった場合(S51:NO)、処理はステップS51に戻る。
【0042】
以上説明したように、本実施形態に係る画像読取装置11では、画像を読み取ったイメージセンサ26の撮像素子毎に出力されるアナログデータがデジタルデータに変換されて、圧縮前データが生成される。生成された圧縮前データに基づいて、画像に含まれる余白パターンが検出される。検出された余白パターンに基づいて、画像の文書種別が特定される。生成された圧縮前データを圧縮して、画像データが生成される。生成された画像データが、特定された文書種別を示す文書種別データと関連付けて、サーバ12に出力される。
【0043】
これによれば、読み取った画像に含まれる余白パターンに基づいて画像の文書種別が特定されるので、画像に含まれる線画や文字情報の影響を排除して文書種別を正確かつ高速に識別できる。また、画像データへの圧縮によって劣化する前の圧縮前データに基づいて、文書種別をより正確に識別できる。さらに、出力された画像データの文書種別を、関連付けられた文書種別データに基づいて特定できるため、サーバもしくはPC等の外部機器で文書種別を識別するために画像データを圧縮前データに復元する必要がない。
【0044】
上記実施形態において、イメージセンサ26が本発明の「画像読取手段」に相当し、CPU21が本発明の「圧縮前データ生成手段」に相当する。ステップS1、S3を実行するCPU21が、本発明の「余白検出手段」に相当する。ステップS5を実行するCPU21が、本発明の「文書種別特定手段」に相当する。ステップS9またはステップS11を実行するCPU21が、本発明の「画像データ生成手段」に相当する。ステップS13を実行するCPU21が、本発明の「データ出力手段」に相当する。EEPROM24が、本発明の「テーブル記憶手段」に相当する。ステップS7を実行するCPU21が、本発明の「データ形式特定手段」に相当する。
【0045】
ステップS1、S3が、本発明の「余白検出ステップ」に相当する。ステップS5が、本発明の「文書種別特定ステップ」に相当する。ステップS9またはステップS11が、本発明の「画像データ生成ステップ」に相当する。ステップS13が、本発明の「データ出力ステップ」に相当する。
【0046】
なお、本発明は上記実施形態に限定されるものではなく、発明の要旨を変更しない範囲での変更が可能である。例えば、画像読取装置11は、原稿台(図示外)にセットされた原稿から画像を読み取るフラットベッド型の画像スキャナであってもよい。
【0047】
上記実施形態では、画像読取装置11で生成された画像データが、サーバ12に送信されているが、画像データの出力先はサーバ12に限定されない。例えば、画像読取装置11で生成された画像データは、画像読取装置11のSRAM22や、画像読取装置11に接続されている外部記憶媒体に、文書種別毎のフォルダに分けて保存されてもよいし、画像読取装置11に接続されている図示外のPCの記憶装置に出力されてもよい。
【0048】
上記実施形態では、サーバ12が文書種別に対応する他のサーバに画像データを送信しているが、画像データは適当なサービスに送信されればよい。例えば、サーバ12が各種サービスを提供可能である場合、各サービスの実行時に使用されるHDD34のデータフォルダに、対応する文書種別の画像データを出力してもよい。
【0049】
上記実施形態では、読み取った画像の余白パターンの二次元の周波数特性に基づいて、文書種別が特定されているが、余白パターンに基づく他の手法で文書種別を特定してもよい。例えば、文書種別特定テーブル90に、余白パターンのテンプレートと、そのテンプレートに対応する文書種別とを定められる。ステップS5では、読み取った画像の余白パターンと、文書種別特定テーブル90に定められた余白パターンのテンプレートとのパターンマッチングを実行して、対応する文書種別を特定してもよい。
【0050】
上記実施形態では、画像読取装置11で文書種別が特定されているが、文書種別の特定は外部機器で行われてもよい。例えば、画像読取装置11でステップS1、S3(
図3参照)が実行され、サーバ12でステップS5〜S11(
図3参照)が実行されてもよい。この場合、画像読取装置11で読み取った画像の余白パターンが検出され、サーバ12で余白パターンに基づいて文書種別が特定される。同様に、画像読取装置11にPCが接続されている場合、画像読取装置11でステップS1、S3(
図3参照)が実行され、PCでステップS5〜S13(
図3参照)が実行されてもよい。この場合、画像読取装置11で読み取った画像の余白パターンが検出され、PCで余白パターンに基づいて文書種別が特定され、さらに、文書種別データが付与された画像データがPCからサーバ12に送信される。これらの変形例では、画像読取装置11および外部機器を含む画像処理システム1が、本発明の「画像読取装置」に相当する。
【0051】
上記実施形態では、余白パターンに対応するデータ形式として、ランレングス方式およびJpeg方式を例示したが、他のデータ形式(例えば、GIF形式、PNG形式など)を用いることができることは勿論である。