(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、画像の劣化を抑えつつデータサイズを抑えた文書データを作成することができる画像処理装置及びプログラムを提供することである。
【課題を解決するための手段】
【0005】
請求項1に係る本発明は、画像を受付ける画像受付手段と、前記画像受付手段が受付けた画像に含まれる第1の色の画素と、該画像に含まれる色であって該第1の色と色差が予め定められた範囲内にある少なくとも1色以上の第2の色の画素とから構成される図形の領域を抽出する図形領域抽出手段と、前記図形領域抽出手段により抽出された領域内における、前記第1の色の画素又は前記第2の色の画素のいずれかである画素の割合が予め定められた閾値以上であるか否かを判定する判定手段と、前記判定手段により予め定められた閾値以上であると判定された場合に、前記図形を、前記第1の色及び前記第2の色を代表する色の図形として描画する描画命令に置き換えて文書データを作成する文書データ作成手段とを有する画像処理装置である。
【0006】
請求項2に係る本発明は、前記図形の領域内の文字を抽出する文字抽出手段をさらに有し、前記判定手段は、前記図形の領域内の前記文字抽出手段により抽出された文字が存在する部分について、前記第1の色の画素又は前記第2の色の画素のいずれかである画素の部分であるものとして前記割合に含め、該割合が前記閾値以上であるか否かを判定する請求項1記載の画像処理装置である。
【0007】
請求項3に係る本発明は、前記画像受付手段が受付けた画像について、予め定められた色数以下になるよう変換する色数変換手段をさらに有し、前記判定手段は、前記色数変換手段による変換後の画像について判定する請求項1又は2記載の画像処理装置である。
【0008】
請求項4に係る本発明は、前記画像のうち前記描画命令に置き換えられた図形以外の部分の画像データについて、予め定められた圧縮方式により圧縮する圧縮手段をさらに有し、前記文書データ作成部は、前記圧縮手段により圧縮された画像データと前記描画命令とから構成される文書データを作成する請求項1乃至3いずれか記載の画像処理装置である。
【0009】
請求項5に係る本発明は、前記画像受付手段は、原稿を読み取った画像を受付ける請求項1乃至4いずれか記載の画像処理装置である。
【0010】
請求項6に係る本発明は、画像を受付けるステップと、受付けた画像に含まれる第1の色の画素と、該画像に含まれる色であって該第1の色と色差が予め定められた範囲内にある少なくとも1色以上の第2の色の画素とから構成される図形の領域を抽出するステップと、抽出された領域内における、前記第1の色の画素又は前記第2の色の画素のいずれかである画素の割合が予め定められた閾値以上であるか否かを判定するステップと、予め定められた閾値以上であると判定された場合に、前記図形を、前記第1の色及び前記第2の色を代表する色の図形として描画する描画命令に置き換えて文書データを作成するステップとをコンピュータに実行させるプログラムである。
【発明の効果】
【0011】
請求項1に係る本発明によれば、本構成を有しない場合に比較して、画像の劣化を抑えつつデータサイズを抑えた文書データを作成することができる画像処理装置を提供することができる。
【0012】
請求項2に係る本発明によれば、請求項1に係る本発明の効果に加え、本構成を有しない場合に比較して、図形内に文字が表されている場合であっても、描画命令に置き換える対象を適切に判定することができる画像処理装置を提供することができる。
【0013】
請求項3に係る本発明によれば、請求項1又は2に係る本発明の効果に加え、本構成を有しない場合に比較して、データサイズをさらに抑制することができる画像処理装置を提供することができる。
【0014】
請求項4に係る本発明によれば、請求項1乃至3いずれかに係る本発明の効果に加え、本構成を有しない場合に比較して、データサイズをさらに抑制することができる画像処理装置を提供することができる。
【0015】
請求項5に係る本発明によれば、請求項1乃至4いずれかに係る本発明の効果に加え、1色からなる図形画像が、色にばらつきのある図形画像として読み取られた場合であっても、当該図形について1色の図形画像として文書データを作成することができる画像処理装置を提供することができる。
【0016】
請求項6に係る本発明によれば、本構成を有しない場合に比較して、画像の劣化を抑えつつデータサイズを抑えた文書データを作成することができるプログラムを提供することができる。
【発明を実施するための形態】
【0018】
図1は、本発明の実施形態における画像処理装置2のハードウェア構成を示すブロック図である。
【0019】
画像処理装置2は、
図1に示されるように、CPU4、メモリ6、ハードディスクドライブ(HDD)等の記憶装置8、図示しないネットワークを介して外部の装置との間でデータの送信及び受信を行う通信インタフェース(IF)10、入出力装置12、スキャナなどの読取装置14を有する。これらの構成要素は、制御バス16を介して互いに接続されている。
【0020】
CPU4は、メモリ6または記憶装置8に格納されたプログラムに基づいて処理を実行して、画像処理装置2の動作を制御する。
【0021】
なお、本実施形態では、CPU4は、メモリ6または記憶装置8内に格納されたプログラムを読み出して実行するものとして説明したが、当該プログラムをCD−ROM等の記憶媒体に格納してCPU4に提供することも可能であるし、当該プログラムを、通信IF10を介して提供することも可能である。
【0022】
入出力装置12は、情報を表示する表示手段としての表示装置、及び操作者によってなされる入力を受付ける入力受付装置を兼ねた備えた装置である。入出力装置12は、例えば、タッチパネルにより構成されていてもよいし、ディスプレイ装置及びキーボードなどの入力装置により構成されてもよい。
【0023】
読取装置14は、原稿を読み取るスキャナなどの装置である。
【0024】
図2は、プログラムが実行されることにより実現される画像処理装置2の機能構成を示すブロック図である。
【0025】
図2に示すように、画像処理装置2は、画像受付部20と、色数変換部22と、図形領域抽出部24と、判定部26と、図形内文字抽出部28と、近傍色文字抽出部30と、文字領域抽出部32と、文書データ作成部34とを有する。
【0026】
画像受付部20は、画像データを受付ける。本実施形態では、読取装置14により原稿を読み取って得られた読取画像を受付ける。
【0027】
図3は、読取装置14により読み取られる原稿の一例を示す模式図である。
図3に一例として示した原稿は、2色刷りされた原稿であり、一つの色(ここでは、緑)で塗りつぶされた図形画像100が2つ配置されており、各図形画像100には、黒色の文字102が配置されている。また、黒色の文字104と、図形画像100と同じ色の文字106とが配置されている。
【0028】
色数変換部22は、画像データのデータ量を低減するために、予め定められた色数以下になるよう変換する、いわゆる限定色化処理を行う。ここで限定色化処理とは、多色(例えば約1677万色)で形成された画像データの各画素の色を、もとの画像データよりも少ない数(例えば16色)の色(以下、限定色という。)に置き換える変換を行う処理のことである。限定色化処理では、各画素をすべての限定色と比較し、その色差、すなわちある色空間における注目画素と限定色との距離が最小となる限定色に変換するものである。本実施形態では、色数変換部22は、画像受付部20が受付けた画像データに対し、限定色化処理を行う。
【0029】
図4は、色数変換部22により限定色化処理がなされた画像データを示す模式図であり、
図4(a)は、
図3に示した原稿の読取画像に対し限定色化処理を行った後の画像を示し、
図4(b)は、
図4(a)と同様、
図3に示した原稿の読取画像に対し限定色化処理を行った後の画像を示すものであり、図形画像100が複数の限定色として構成されている様子を明示的に示している。なお、
図4(b)では、図形画像100の部分の限定色化後の色(限定色)が、複数色であることを分かりやすく示すため、変換された限定色の違いを強調して表している。
【0030】
例えば、読取装置14により原稿を読み取る際の解像度が200dpiなどの低解像度である場合などには、読み取り装置の性能限界などに起因して、限定色化後の画像では、本来、一つの色で表されているはずの図形画像100が、
図4(b)に示されるように、複数の限定色から構成される画像データとして表されることがある。より具体的には、一つの色で表されているはずの図形画像100が近傍色で表された図形画像として表されることとなる。ここで、近傍色とは、第1の色と、この第1の色と色差が予め定められた範囲内にある少なくとも1色以上の第2の色とからなる一群の色のことをいう。例えば、
図4に示した例では、
図3における図形画像100は、第1の色である緑1と、第2の色である第一の色の近傍色である緑2、及び第一の色の近傍色である緑3の3色の限定色により構成される図形画像として表される。
【0031】
図2に戻り、画像処理装置2の機能構成の説明を続ける。
図形領域抽出部24は、画像受付部20が受付けた画像に含まれる第1の色の画素と、この画像に含まれる色であって第1の色と色差が予め定められた範囲内にある少なくとも1色以上の第2の色の画素とから構成される図形の領域を抽出する。具体的には、図形領域抽出部24は、画像から近傍色で表された図形のアウトライン(輪郭)をこの図形の領域として抽出する。例えば、図形領域抽出部24は、限定色化処理後の図形画像100を囲う四角形を図形画像100のアウトラインとして抽出する。図形領域抽出部24は、図形画像100を囲う四角形として、図形画像100に外接する四角形をアウトラインとして抽出してもよい。なお、四角形に限らず、他の予め定められた形状を用いてもよい。
【0032】
なお、本実施形態では、色数変換部22による変換後の画像からアウトラインを抽出する。また、本実施形態では、後述するように、限定色化処理後の画像において、近傍色で表された画像について、近傍色を全て予め定められた色(例えば、黒)に置き換えた上、この置き換えられた画像について、アウトラインを抽出する。ただし、アウトラインの抽出として、他の方法を用いてもよい。
【0033】
判定部26は、図形領域抽出部24により抽出された領域内における、第1の色の画素又は第2の色の画素のいずれかである画素、すなわち近傍色で表された画素の割合が予め定められた閾値以上であるか否かを判定する。本実施形態では、上述の通り、近傍色で表された画像について、近傍色を全て予め定められた色に置き換え、この予め定められた色の画素の割合を計算することにより、近傍色で表された画素の割合を算出する。ただし、近傍色の画像領域における近傍色で表された画素の割合の算出として、他の方法を用いてもよい。
【0034】
判定部26による判定は、図形領域抽出部24により抽出された領域が、元々、1つの色で塗りつぶされていた領域であったのか否かを判定することに相当している。例えば、限定色化処理後の図形画像100について、近傍色の画素が、当該図形画像100の領域において予め定められた割合以上存在する場合、限定色化処理後の図形画像100は、読み取られる前の原稿では、1つの色で塗りつぶされた図形であったものとして判定される。
【0035】
なお、本実施形態では、判定部26は、近傍色で表された図形領域内に存在する文字部分についても近傍色の画素であるものとして、近傍色の画素の割合を算出し、算出した割合が閾値以上であるか否かを判定する。具体的には、判定部26は、以下に示す図形内文字抽出部28により抽出された文字が存在する部分について、近傍色の画素の部分であるものとして割合に含めて、閾値以上であるか否かを判定する。
【0036】
図形内文字抽出部28は、近傍色の図形の領域内の文字を抽出する。本実施形態では、限定色化処理後の画像において、画像内の近傍色以外の部分を全て予め定められた色(例えば、白)に置き換えた上、置き換えた色で表された文字をOCR(Optical Character Recognition)技術により文字認識する。白に置き換えた場合、図形内文字抽出部28は、図形内の白抜きされた文字を認識することとなる。ただし、近傍色の図形の領域内の文字の抽出方法として、他の方法を用いてもよい。
【0037】
近傍色文字抽出部30は、色数変換部22による変換後の画像における近傍色の文字を抽出する。
図4に示した例では、緑1、緑2、緑3のいずれかの色により表されている文字を抽出する。本実施形態では、限定色化処理後の画像において、近傍色で表された画像について、近傍色を全て予め定められた色(例えば、黒)に置き換え、他の色については、予め定められた色(例えば、白)に置き換えた上で、この置き換えられた画像について、予め定められた色(この場合、黒)の文字を抽出する。ただし、近傍色の文字の抽出方法として、他の方法を用いてもよい。
【0038】
文字領域抽出部32は、近傍色文字抽出部30が抽出した文字の領域を抽出する。具体的には、文字領域抽出部32は、近傍色の文字を囲う四角形を文字領域として抽出する。文字領域抽出部32は、近傍色の文字に外接する四角形を文字領域として抽出してもよい。なお、四角形に限らず、他の予め定められた形状を用いてもよい。
【0039】
文書データ作成部34は、描画命令作成部36と圧縮部38とを有しており、画像受付部20が受付けた画像に基づいて、PDF(Portable Document Format)やDocuWorks(登録商標)ファイル等の描画命令を備えた文書形式による文書データを作成する。ここで、文書データ作成部34は、近傍色の図形として画像データで表されている図形を、近傍色を代表する色の図形として描画する描画命令に置き換えて文書データを作成する。
【0040】
描画命令作成部36は、判定部26により予め定められた閾値以上であると判定された場合に、判定対象の図形を、近傍色を代表する色の図形として描画する描画命令を作成する。例えば、図形領域抽出部24により抽出された領域を、近傍色を代表する色で描画する描画命令を作成する。具体的には、例えば、高さx1、幅y1の四角形を位置(x2,y2)に描画する描画命令が作成される。なお、近傍色を代表する色としては、例えば、近傍色を構成する各色の平均の色であってもよいし、近傍色を構成するいずれかの色であってもよい。
【0041】
圧縮部38は、画像受付部20が受付けた画像のうち、描画命令作成部36により作成された描画命令に置き換えられた図形以外の部分の画像データについて、予め定められた圧縮方式により圧縮する。本実施形態では、画像受付部20が受付けた色数変換部22による変換後の画像のうち、描画命令に置き換えられた図形以外の部分の画像データをMMR(Modified Modified READ)符号化方式により圧縮処理する。なお、圧縮部38は、この他にも、例えば、画像内の写真部分を抽出し、写真部分の解像度を、文字領域などの他の部分の解像度よりも下げる圧縮処理を行ってもよい。
【0042】
文書データ作成部34は、圧縮部38により圧縮された画像データと描画命令作成部36により作成された描画命令とから構成される文書データを作成する。
【0043】
図5は、画像処理装置2の動作の一例を示すフローチャートである。以下、
図5に示したフローチャートについて説明する。なお、以下の説明では、
図3及び
図4に示した例に基づいて、各動作について説明する。
【0044】
ステップ100(S100)において、読取装置14により読み取られた読取画像データを受付ける。
【0045】
ステップ102(S102)において、ステップ100で受付けた画像データの全てのページに対し、色数を例えば16色以内に限定する限定色化処理を行う。
【0046】
ステップ104(S104)において、ステップ102における限定色化処理後の画像が近傍色を含んでいるか否かを判定する。具体的には、いずれかの限定色と、この限定色と色差が予め定められた範囲内にある少なくとも1色以上の他の限定色とが、限定色化処理後の画像に用いられているか否かが判定される。近傍色を含んでいない場合、ステップ106へ移行し、近傍色を含んでいる場合、ステップ108へ移行する。
【0047】
ステップ106(S106)において、圧縮処理したレイヤー(描画層)のデータを作成することにより文書データを作成する。例えば、ステップ102における限定色化処理によって変換された限定色ごとに、MMR符号化方式により画像データを圧縮し、限定色ごとのレイヤーを作成する。
【0048】
ステップ108(S108)において、近傍色を代表する色を決定する。例えば、近傍色を構成する各限定色の平均色を代表する色として決定する。
【0049】
ステップ110(S110)において、近傍色の画像部分が抽出される。本実施形態では、近傍色の画素を黒色の画素に置き換え、近傍色以外の色の画素を白色の画素に置き換えることにより、近傍色の画像部分が抽出される。
【0050】
図6は、
図4で示した画像において、近傍色の画素を黒色の画素に置き換え、近傍色以外の色の画素を白色の画素に置き換えた場合の置き換え後の画像を示す模式図である。
図6に示すように、図形画像100は、黒色に置き換えられ、文字102は、白色に置き換えられ、文字104は、白色に置き換えられ、文字106は、黒色に置き換えられている。ここで、ステップ110の処理後の文字102は、黒色の図形内における白抜きの文字として表される。
【0051】
ステップ112(S112)において、近傍色の図形の領域内の文字を抽出する。本実施形態では、ステップ110において、黒色に置き換えられた図形内の白抜きの文字102を抽出する。
【0052】
ステップ114(S114)において、図形の領域内の文字が抽出されたか否かが判定され、抽出された場合は、ステップ116へ移行し、抽出されない場合はステップ118へ移行する。
【0053】
ステップ116(S116)において、ステップ112で抽出した文字の領域を黒色に塗りつぶす。例えば、文字領域を白黒反転させ、元の画像と重ねることにより塗りつぶしを行う。
【0054】
図7は、
図6で示した画像において、ステップ112で抽出した文字の領域を黒色に塗りつぶした場合の画像を示す模式図である。
図7に示すように、図形内の文字部分の白色の画素は黒色の画素に反転される。
【0055】
ステップ118(S118)において、ステップ102における限定色化処理後の画像における近傍色の文字を抽出する。本実施形態では、近傍色の文字は、ステップ110により黒色に置き換えられているので、黒色の文字を抽出する。
【0056】
ステップ120(S120)では、ステップ118において文字が抽出されたか否かが判定され、抽出された場合は、ステップ122へ移行し、抽出されない場合はステップ124へ移行する。
【0057】
ステップ122(S122)において、抽出した文字の領域を抽出する。本実施形態では、近傍色の文字を囲う四角形を文字領域として抽出する。
【0058】
図8は、
図7に示した画像において、文字領域を抽出した場合の一例を示す模式図である。
図8に示されるように、限定色化処理後の画像における近傍色の文字106の文字領域108が抽出される。
【0059】
ステップ124(S124)において、近傍色の図形の領域を抽出する。本実施形態では、近傍色の図形は、ステップ110により黒色に置き換えられているので、黒色の図形を囲う四角形を図形領域として抽出する。
【0060】
図9は、
図7に示した画像において、図形領域を抽出した場合の一例を示す模式図である。
図9に示されるように、限定色化処理後の画像における近傍色の図形画像100の図形領域110が抽出される。
【0061】
ステップ126(S126)において、近傍色の図形の領域において、近傍色の画素の割合が予め定められた割合以上であるか否かが判定される。本実施形態では、ステップ124で抽出した領域内における黒色画素の割合が、50パーセント以上であるか否かを判定する。
図9に示した例によれば、図形領域110における全画素に対する黒色画素の割合が、50パーセント以上であるか否かを判定する。
【0062】
予め定められた割合以上である場合、当該図形領域については、1つの色で塗りつぶされた図形として描画してもよい領域であるとして、ステップ128へ移行する。一方、予め定められた割合未満である場合、ステップ130へ移行する。
【0063】
ここで、本実施形態では、ステップ116において、図形画像100内の文字部分が塗りつぶされている。したがって、文字部分の塗りつぶしが行われない場合に比べ、図形領域110における黒色画素の割合は高くなる。これにより、図形画像100内に文字部分が存在する場合、文字数や文字の大きさによっては、図形領域110内の近傍色の画素の割合(本実施形態では、黒色に置き換えられている画素の割合)が、予め定められた割合未満となることが想定されるが、本実施形態では、図形画像100内に文字部分が存在する場合であっても、文字部分の画素も割合に含められるため、1つの色で塗りつぶされた図形として描画してもよい領域として判定される。
【0064】
ステップ128(S128)において、近傍色の画素の割合が予め定められた割合以上であると判定された画像領域について、当該画像領域をステップ108で決定した代表色で塗りつぶす図形を描画する描画命令を指定し、当該画像領域を描画するレイヤーのデータを作成する。
【0065】
本実施形態では、黒色に置き換えられた画素の割合が予め定められた割合以上であると判定された画像領域について、ステップ108で決定した代表色の四角形として描画する描画命令を指定する。なお、本実施形態では、四角形として描画するものとして説明したが、図形画像100の形状において、角が面取りされている場合には、同様に面取りされた図形を描画する描画命令を指定してもよい。
【0066】
一方、ステップ130(S130)では、近傍色の画素の割合が予め定められた割合未満であると判定された画像領域について、当該画像領域をステップ108で決定した代表色の画素の画像データとして、圧縮処理したレイヤーのデータを作成する。本実施形態では、黒色に置き換えられた画素の割合が予め定められた割合未満であると判定された画像領域について、ステップ108で決定した代表色の画像データとして、MMR符号化方式により画像データを圧縮し、レイヤーを作成する。
【0067】
ステップ132(S132)において、ステップ122で抽出した文字領域について、当該文字領域をステップ108で決定した代表色の画素の画像データとして、圧縮処理したレイヤーのデータを作成する。また、近傍色以外の色の領域について、圧縮処理したレイヤーのデータを作成する。そして、作成した全てのレイヤーを重ねて文書データを作成する
【0068】
図4で示した画像を例に説明すると、近傍色で表された文字106の領域について、ステップ108で決定した代表色の画素の画像データとして、MMR符号化方式により圧縮し、レイヤーを作成する。また、図形画像100内の文字102及び文字104について、黒色の画素の画像データとして、MMR符号化方式により圧縮し、レイヤーを作成する。
【0069】
ステップ134(S134)において、全てのページについて、処理がなされたか否かが判定され、全てのページに処理がなされていない場合には、ステップ104へ戻り、全てのページについて処理がなされている場合には、終了する。
【0070】
以上、
図5に示すフローチャートに基づいて、画像処理装置2の動作について説明したが、
図5に示すフローチャートは一例に過ぎず、適宜、変更してもよい。
【0071】
例えば、2色刷りされた原稿を読み取った画像に対し、本発明を適用した文書データを作成することを想定した場合には、ステップ102の後、ステップ104の前に、限定色化処理後の色数が、予め定められた色数以下であるか否かを判定し、予め定められた色数を超える場合に、元の原稿が2色刷りではないと判断してステップ106へ移行し、予め定められた色数以下の場合には、ステップ104へ移行するようにし、ステップ104では、限定色化後の色が、予め定められた色と、この予め定められた色とは色差が予め定められた範囲を超える近傍色とから構成されるかを判定し、予め定められた色と、近傍色とから構成される場合には、ステップ108へ移行し、そうでない場合にはステップ106へ移行するようにしてもよい。
【0072】
より具体的には、例えば、限定色化処理により色数が16色以内に限定される場合、限定色化処理後の色数が、4色以下である場合、ステップ104へ移行し、5〜16色である場合、ステップ106へ移行し、ステップ104では、限定色化後の色が、黒色と、黒とは近傍色の関係にない2色又は3色の色から構成された近傍色とから構成されている場合、ステップ108へ移行し、そうでない場合にはステップ106へ移行するようにしてもよい。
【0073】
また、限定色化処理後の色が、予め定められた色と、この予め定められた色とは色差が予め定められた範囲を超える近傍色とから構成される場合に限らず、近傍色を含む画像であれば、適用対象となる。例えば、予め定められた色と、この予め定められた色とは色差が予め定められた範囲を超える第1の近傍色と、予め定められた色及び第1の近傍色とは色差が予め定められた範囲を超える第2の近傍色とから構成される場合に適用してもよい。また、限定色化処理後の色が、第1の近傍色と、第1の近傍色とは色差が予め定められた範囲を超える第2の近傍色とから構成される場合に適用してもよい。また、予め定められた第1の色と、予め定められた色とは色差が予め定められた範囲を超える予め定められた第2の色と、第1の色及び第2の色とは色差が予め定められた範囲を超える近傍色とから構成される場合に適用してもよい。このように、近傍色を含んでいればよく、近傍色も一群に限らず複数群含んでいてもよい。なお、複数群の近傍色を含む場合には、各近傍色に対し、ステップ108以降の処理を行えばよい。
【0074】
また、以上説明した実施形態では、限定色化処理を行った画像に対し、近傍色の図形画像を描画命令に置き換える処理を適用しているが、限定色化処理が行われていない画像に対して適用してもよい。また、以上説明した実施形態では、原稿を読み取った読取画像に対し、近傍色の図形画像を描画命令に置き換える処理を適用しているが、読取画像であるか否かにかかわらず適用してもよい。