(58)【調査した分野】(Int.Cl.,DB名)
前記置換部は、前記矩形のサイズが設定サイズよりも小さく、かつ前記比率が前記閾値以上である場合に、前記対象領域内の画素の属性を前記非文字属性から前記文字属性に置換する
請求項5ないし7のいずれかに記載の画像処理装置。
【発明を実施するための形態】
【0014】
画像の各画素の属性を定める処理をハードウェアによって行なう画像処理装置は、例えばASIC(Application Specific Integrated Circuit)からなる画像処理用のプロセッサーを備える。プロセッサーは、画像入力手段から入力される画像データをパイプライン形式で処理するリアルタイム動作によって高速の処理を実現する。画像入力手段は、イメージスキャナー、デジタルカメラ、パーソナルコンピューター、または画像データを出力する他の機器のいずれでもよい。また、スキャナーやカメラといった画像入力機器に画像処理装置を組み入れることもでき、その場合における画像入力手段は画像入力機器の一部である。
【0015】
〔第1実施形態〕
図1の上部中央に描かれた画像40は、
図2に例示されるドキュメント4を電子化した画像の要部である。ドキュメント4には大きな文字5が記載されており、この文字5およびその近傍に対応する画像データが
図1において画像40として描かれている。例示の文字5はアルファベットの“C”であり、その文字サイズは一般的なテキストの文字サイズと比べて極端に大きい。
図2では文字5が黒く描かれているが、文字5の色は周囲と視覚的に区別可能な色であればよい。画像40の画素色はRGBの各色成分の階調で表わされる。画像40は、文字5に対応する文字領域50を有している。
【0016】
画像40に対して文字を検出するアルゴリズムによる領域判別が行なわれる。
図1において、領域判別によって定められた画像40の各画素の属性(文字属性または非文字属性)を示す属性画像(属性プレーン)42は、文字領域50の一部分に対応する文字属性領域51を有する。文字属性領域51の各画素の属性は文字属性である。属性画像42における文字属性領域51以外の部分は、属性が非文字属性と定められた画素から構成される非文字属性領域である。属性画像42における非文字属性領域には、文字領域50のうちの文字属性領域51に対応する部分以外の部分に対応する領域52を含んでいる。つまり、属性画像42では、領域判別の部分的な誤りがある。文字領域50が正しく判別されない状況の生じる領域判別方法の例が
図3に模式的に示されている。
【0017】
図3において、(A)、(B)、(C)のように画像の先頭ライン側(図の上側)から画素配列順に各画素の属性が定められていく。(A)の段階で文字属性領域51aが定められ、(B)の段階で文字属性領域51bが定められ、(C)の段階で文字属性領域51が定められている。
図3の例示における判別方法は、エッジに該当するかどうかを判別し、続いてエッジ間距離と閾値とを比較する方法である。注目した画素がエッジに該当し、かつエッジに該当しない画素を挟む他の最も近いエッジに該当する画素との距離(エッジ間距離)が閾値以下である場合に、注目した画素、他の最も近いエッジに該当する画素、およびこれらに挟まれる画素の属性を文字属性に定める。つまり、例示の判別方法は、エッジ間距離が閾値を超えるような太い線は文字の要素ではないとみなす。
図3の例では、アルファベットの“C”の上下方向の中ほどまで判別が進んだとき、エッジ間距離が閾値を超える。「エッジ間距離が閾値以下という文字としての条件から一旦外れると、既に判別された文字属性領域とエッジを介さずに隣接する有色領域を非文字属性領域とする」というアルゴリズムに従い、アルファベットの“C”の下部の属性は非文字属性とされる。パイプライン処理による領域判別では、既に定めた属性は変更されない。このため、アルファベットの“C”の上部は文字属性領域51のまま残存することになる。
【0018】
ここで、文字と判別する条件から一旦外れたとしても、文字属性を次に注目する画素に受け継がせて(伝播させて)、文字属性領域51を拡張させていく方法もある。しかし、次に注目した画素が真に文字の要素か否かを判定することはできない。そのため、例えば
図4に例示される巨大な三角形60が画像内に存在した場合、文字属性を伝播させることによって、巨大な三角形の全体を文字属性領域としてしまう誤判別を引き起こすおそれがある。このことから領域判別では文字属性を伝播させない。
【0019】
エッジ間距離の閾値は、各種ドキュメントでの使用が想定される文字の最大サイズによって決まる。例えば、50ポイントのボールド書体の文字を基準に閾値を設定することができる。その場合、9〜12ポイントといった一般的なサイズまたはそれより小さいサイズの文字では、領域判別において文字全体が文字属性領域と判別される。50ポイントを超える極端に大きい文字(実際には文字ではない何らかの図形であるかもしれない)が入力画像内に存在した場合に、当該文字の一部が文字属性領域として判別されない状況が起こり得る。
【0020】
図1に戻って、属性画像42におけるアルファベットの“C”のように、一つの文字が文字属性の部分と非文字属性の部分とに分かれるのは好ましくない。それは、属性画像42が示す文字属性領域を鮮明にしたり2値化したりする画像処理を画像40に加えたときに、処理後の画像が不自然に見えるからである。特に、高圧縮PDFへの変換やファクシミリ伝送などのために2値化を行うと、2値化されて単色情報のみをもつ文字属性領域と各画素が固有のRGB階調を有したままの非文字属性領域との画質の差異が目立ってしまう。
【0021】
画像が不自然に見える問題に対して、[1]文字属性領域を非文字属性領域に置換して属性を統一するか、[2]非文字属性領域を文字属性領域に置換して属性を統一するかの2通りの解決策[1]、[2]が考えられる。第1実施形態では解決策[1]が適用される。すなわち、属性画像42に対して必要に応じて文字属性領域を非文字属性領域に置換する属性修正処理が行なわれる。この処理を受けた後の属性画像42aが、後段の画像処理のための領域判別情報となる。図示のとおり、処理後の属性画像42aでは、処理前の属性画像42における文字属性領域51が非文字属性領域51aに置換されている。
【0022】
ところで、文字属性領域51を非文字属性領域51aに置換するのに先立って、真に置換すべきかどうか、すなわち、文字属性領域51が文字領域50の全体に対応するか一部分に対応するかを判定する必要がある。一部分に対応する場合が置換すべき場合である。属性修正処理では、文字属性領域51の領域色と文字属性領域51の周囲の複数の画素の色(画素色)とに基づいて、置換の要否が判定される。詳しくは以下のとおりである。
【0023】
文字属性領域51が文字領域50の一部分に対応するのであれば、本来は文字属性領域51が領域52と連続している。言い換えれば、文字属性領域51と領域52とが連続しているかどうかを調べれば、文字属性領域51が文字領域50の一部分であるかどうかが分かる。隣接する二つの領域の色が同一であれば、これら領域は連続していると言える。しかし、属性画像42において、非文字属性領域である領域52と他の非文字属性領域とが区別されていないので、文字属性領域51の輪郭は分かるが、領域52の輪郭は分からない。つまり、領域52を構成する画素の色を調べて領域52の色(領域色)を特定することができない。したがって、属性修正処理では、領域52の領域範囲を特定せずに、輪郭の分かる文字属性領域51に着目して連続性を検出する。
【0024】
連続性を検出するために文字属性領域51の周囲の画素の色を調べる必要があるが、文字属性領域51の輪郭のトレースには相応の処理時間を要する。注目する画素が文字属性領域51のエッジから離れているかどうかを検出するフィルタリングを行なわなければならないからである。
【0025】
そこで、文字属性領域51に対して、これに外接する仮想の矩形71が設定される。矩形71の設定には既知の技術を使用すればよい。例えば、ある画素を開始地点として、その周囲の画素のうちの同じ属性をもつ画素にラベル付けをし、最終的に連続した同じ属性の画素が無くなった時点でラベル付けされている画素の最も外周の座標から、外接する矩形71を求めることができる。解像度を落として処理することにより、連続性検出を高速化することができる。
【0026】
矩形71に内包される文字属性領域51の領域色は、文字属性領域51の全画素の色の平均値である。矩形71の設定に際してラベル付けされた画素のRGBの各成分の画素値を画像40から抽出し、RGBの成分別に加算する。同時に画素数をカウントしておき、成分別の加算結果のそれぞれを画素数で除す。これにより、領域色を示すRGBの各成分の平均値を求めることができる。
【0027】
文字属性領域51の領域色の算定に続いて、文字属性領域51の周囲の色をサンプリングするために、矩形71を囲む1画素幅の環状の画素列81が注目される。そして、画素列81を構成する複数の画素のそれぞれについて、画素色と文字属性領域51の領域色との色差が設定値よりも小さい画素(これを同色画素と呼称する)であるか否かが判定される。色差は、色空間における2つの色の座標間の距離である。例えば、本例のようにRGBの成分で色を表す場合、領域色の座標を(R1,G1,B1)とし、画素色を(R2,G2,B2)として、色差(色空間上の2点間距離)は次式で表される。
色差=〔(R1−R2)
2+(G1−G2)
2+(B1−B2)
2〕
1/2
画素列81における文字属性領域51の領域色と同一またはそれに近い色をもつ同色画素の割合の大小によって、文字属性領域51とその周囲との連続性を判定することができる。
図1の模式的な例では、画素列81は画素8a,8b,8c,8d,8e,8f,8g,8h,8iを含んでおり、これらのうちの画素8c,8d,8e,8f,8g,8hが同色画素である。ただし、実際の画素数は画像の解像度に依存する。例示の画素列81の画素の総数は「70」で、文字領域に対応する可能性のある同色画素の個数は「6」であるので、同色画素か否かの判定で注目した画素の個数“Q”に対する同色画素の個数“q”の比率“R”(R=q/Q)を百分率で表すと約8.57%である。比率Rは矩形71の周囲長に対する文字部分の長さの割合に相当する。予め適切な閾値“Rth”を決めておき、比率Rが閾値Rth以上であれば文字属性領域51がその周囲と連続しているとみなすことができる。一般的なテキスト画像では、文字属性領域51の周囲に文字属性領域51とほぼ同じ色をもつ文字以外の画素が存在する場合はほとんど無いと考えられるので、閾値Rthを低めに設定しても支障はない。例えば、閾値Rthを5%程度にしてもよい。
【0028】
基本的には比率Rの算出に際して画素列81の各画素の属性を考慮する必要はないが、非文字属性の画素のみに注目することによって領域判別の信頼性をより高めることができる。上述したように文字属性領域51の周囲に文字以外の同色画素が存在する場合はほとんど無い。しかし、
図5のように、文字属性領域51の近傍に、文字属性領域51の対応する文字とは別の文字に対応する文字属性領域55の存在する可能性がある。例えば、ロゴタイプでは通常の文字配列とは異なる文字の配置が見受けられる。文字属性領域51とは別の文字属性領域55の画素8p,8q,8r,8s,8t,8uの個数を同色画素の個数qに含めると、比率Rが適正でなくなる。このため、画素列81の画素数Qおよび同色画素の個数qのカウントにおいて画素8p,8q,8r,8s,8t,8uがカウント対象から除外される。
図5の模式的な例示において、画素列81のうちのカウント対象外の画素8p,8q,8r,8s,8t,8uの個数は「6」である。したがって、非文字属性の画素に限定した注目画素の個数Qは、画素列81の全画素数の「70」からカウント対象外の画素数の「6」を差し引いた「64」となる。そして、比率Rは約9.38%となる。閾値Rthを5%とすると、非文字属性の画素のみに注目した場合も、「文字属性領域55はその周囲と連続している」と判定される。
【0029】
このように比率Rが閾値Rthと等しいかまたは閾値Rthを超える場合に、文字属性領域51を非文字属性領域51aに変更する属性置換が必要と判定され、判定に従って属性置換が行なわれる。すなわち、
図1の例において、属性画像42が属性画像42aに修正される。比率Rが閾値Rth未満である場合には、文字属性領域51に対する属性置換は行なわれない。
【0030】
比率Rの算定に際して注目する画素列81については、位置設定の変形例がある。
図1および
図5の例のように文字属性領域51に外接する矩形71に接する画素列81には、本来は文字ではない箇所に文字属性領域51の色成分(文字属性の階調)がある程度取り込まれている可能性がある。例えば、画像40を生成するイメージスキャナーのMTF特性に起因する画像のボケや、解像度変換による画像のボケによって、文字のエッジの階調がエッジ近傍の背景画素の階調とのスムージングを受けたのと同様の状態になる場合がある。文字属性の階調を取り込んだ画素をサンプリングしてしまうと、実際に文字属性領域51と同じ色をもつ画素が文字属性領域51の周囲に存在していたかどうかの判定の確度が低下する。そこで、文字属性領域51に外接する矩形71からN画素(Nは1以上の整数)離れた画素に注目する変形例が考えられる。
図6の例示では、矩形71に沿いかつ矩形71から1画素離れて文字属性領域51を囲む環状の画素列82が、文字属性領域51の周囲の色のサンプリングのために注目される。図示において画素列82は6個の同色画素8j,8k,8m,8n,8v,8wを有している。
【0031】
図7は第1実施形態に係る画像処理装置100の構成を示している。画像処理装置100は、入力される画像を文字属性領域と非文字属性領域とに区分する領域判別ブロック110と、上述の属性修正処理を受け持つ属性修正ブロック120とを備える。領域判別ブロック110は、入力される画像40に対して文字領域を検出する領域判別を行い、画素値が属性を示す属性画像(属性プレーン)42を生成する。属性修正ブロック120は、領域色取得部122、矩形設定部123、置換要否判定部125、および属性置換部126を有し、属性画像42を必要に応じて修正した属性画像42aを生成する。
【0032】
属性修正ブロック120において、領域色取得部122は、属性置換の対象領域である文字属性領域51の領域色を、画像40の色情報に基づく上述の平均値の計算によって取得し、領域色を示すデータDC51を置換要否判定部125に与える。矩形設定部123は、文字属性領域51に外接する仮想の矩形71を設定し、矩形71の位置を示すデータD71を置換要否判定部125に与える。
【0033】
置換要否判定部125は、矩形71を囲む環状の画素列81(または画素列82)における非文字属性の画素を注目画素として選び、注目画素がデータDC51の示す領域色と同一または近い画素色をもつ同色画素であるか否かを判定する。そして、置換要否判定部125は、注目画素の個数に対する同色画素の個数の比率Rを算出し、比率Rと閾値Rthとを比較する。比率Rが閾値Rth以上である場合に、置換要否判定部125は文字属性領域51の属性の置換が必要であると判定する。
【0034】
属性置換部126は、置換要否判定部125による判定の結果を受けて、文字属性領域51の属性を文字属性から非文字属性に置換する。属性画像42に対する属性を置換する部分修正によって得られた修正後の属性画像42aが、画像40の領域判別情報として図示しない後段の画像処理ブロックに送られる。
【0035】
図8は属性修正ブロック120によって行なわれる属性修正処理の流れを示している。
【0036】
矩形設定部123による矩形71の設定(#11)と、領域色取得部122による文字属性領域51の領域色の算出(#12)とに続いて、画素色判別ループの処理が行なわれる。画素色判別ループでは、矩形71を囲む画素列81(または画素列82)を構成する全画素が1画素ずつ順に処理の対象とされる。画素色判別ループの最初のステップ#13において、置換要否判定部125が画素の属性を判別する。注目した画素の属性が文字属性であれば(#13でYES)、置換要否判定部125は当該画素を以降の処理の対象から除外する。これによって、比率Rの算出に関わるべき非文字属性の注目画素が選定されたことになる。矩形71を囲む非文字属性の画素である注目画素の画素色が置換要否判定部125によって画像40から取得され(#14)、注目画素の色と文字属性領域51の領域色との色差が算出される(#15)。色差が閾値以下であれば(#16でYES)、注目画素は同色画素である。この場合、置換要否判定部125は同色画素の個数Qのカウントを一つインクリメントし(#17)、かつ注目画素の個数Qのカウントを一つインクリメントする(#18)。色差が閾値を超える場合は(#16でNO)、置換要否判定部125は注目画素の個数Qのカウントを一つインクリメントする(#18)。こうして画素色判別ループにおいて、矩形71を囲む注目画素の個数Qと注目画素のうちの同色画素の個数qとを数え終えると、置換要否判定部125は個数Qに対する個数qの比率Rを算出して閾値Rthと比較する(#19)。比率Rと閾値Rthとの大小関係によって置換要否の判定結果が決まる。比率Rが閾値Rth以上であれば(#19でYES)、属性置換部126が属性画像42における文字属性領域51の属性を文字属性から非文字属性に置換する(#20)。比率Rが閾値Rth未満であれば(#19でNO)、文字属性領域51の属性は置換されない。
【0037】
〔第2実施形態〕
上述のように属性画像42において一つの文字が文字属性の部分と非文字属性の部分とに分かれると、文字属性領域に対する画像処理を加えた画像が不自然に見える問題が生じる。この問題に対して、第2実施形態では、非文字属性領域を文字属性領域に置換して属性を統一するという上述の解決策[2]が適用される。
【0038】
図9は第2実施形態に係る属性修正処理を模式的に示している。
図9の上部中央に描かれた画像40は、上述の第1実施形態と同様に、
図2に例示されるドキュメント4を電子化した画像の要部であり、属性修正処理に関わる文字領域50を有する。画像40に対して、第1実施形態と同様に文字を検出するアルゴリズムによる領域判別が行なわれ、それによって定められた各画素の属性を示す属性画像42が生成される。
【0039】
属性画像42は、文字領域50の一部分に対応する文字属性領域51を有する。文字属性領域51の各画素の属性は文字属性である。属性画像42における文字属性領域51以外の部分は非文字属性領域であり、属性が非文字属性と定められた画素のみから構成される。属性画像42における非文字属性領域には、文字領域50のうちの文字属性領域51に対応する部分以外の部分に対応する領域52を含んでいる。この領域52が、第2実施形態における属性置換の対象である。以下では領域52を“対象領域52”という。
【0040】
対象領域52は属性画像42ではその領域範囲(領域を構成する画素)が顕在化されていない。つまり、属性画像42において対象領域52を特定することができない。そこで、対象領域52を特定するための画像処理が行なわれる。簡便な処理は、濃度が閾値よりも大きい画素または濃度が閾値よりも小さい画素を抽出する2値化である。
【0041】
2値化は、画像40から文字属性領域51を除く部分を抽出した画像41に対して行なわれる。文字属性領域51を除くとは、2値化の閾値よりも濃度が大きい画素を抽出する場合には文字属性領域51の濃度を閾値より小さい濃度とみなし、閾値よりも濃度が小さい画素を抽出する場合には文字属性領域51の濃度を閾値より大きい濃度とみなすことを意味する。2値化される画像41は、対象領域52(厳密にはこれに対応する部分)とそれ以外の非文字属性領域41A(厳密にはこれに対応する部分)とを有する。一般に、ドキュメントにおける文字とその周囲との間には視覚的に区別可能な濃度差(色差を含む)があるので、2値化によって対象領域52を顕在化させることができる。
図9の例示の2値化では、濃度が閾値よりも大きい画素が抽出される。ただし、周囲よりも淡い文字の存在が想定する場合には、濃度が閾値よりも小さい画素を抽出する2値化を行なえばよい。
【0042】
2値化によって対象領域52の特定が可能になった後、基本的には第1実施形態と同様の手順によって、対象領域52とその周囲との連続性が検出される。
【0043】
まず、2値化画像44において顕在化した対象領域52の周囲の色をサンプリングするため、外接する仮想の矩形72が設定され、矩形72を囲む1画素幅の環状の画素列91がサンプリング箇所として選定される。このとき、文字属性領域51との連続性の有無を検出することができればよいので、画素列91のうちの属性が文字属性である画素のみをサンプリングすべき注目画素に選定するのがよい。
【0044】
次に、連続性の有無の判定に用いる比率Rを算出するため、対象領域52の領域色が求められ、画素列91における複数の注目画素のそれぞれについて、画素色と対象領域52の領域色との色差が設定値よりも小さい画素(同色画素)であるか否かが判定される。
全ての注目画素についての判定が終わると、画素列91における注目画素の個数Qに対する同色画素の個数qの比率Rが算出される。そして、比率Rと閾値“Rth2”とが比較される。比較の結果、比率Rが閾値Rth2以上であれば対象領域52が文字属性領域51と連続しているとみなされる。
【0045】
図9の模式的な例では、画素列91は画素9a,9b,9c,9d,9e,9f,9g,9s,9wを含む82個の画素で構成されており、82個の画素のうちの6個の画素9b,9c,9d,9e,9f,9gが注目画素でありかつ同色画素である。ただし、実際の画素数は画像の解像度に依存する。第2実施形態では注目画素が文字属性の画素に限られているので、第1実施形態の閾値Rthと比べて大きい閾値Rth2を定めるのがよい。
【0046】
対象領域52と文字属性領域51とが連続するということは、対象領域52が文字の一部分に対応するということである。つまり、画像40内の文字領域50が文字属性の部分と非文字属性の部分とに区分されている。したがって、比率Rが閾値Rth2以上であれば、文字内の属性を統一する属性置換を行う必要である。上述のとおり、第2実施形態では、非文字属性領域が文字属性領域に置換される。図示された処理後の属性画像42bでは、処理前の属性画像42における非文字属性をもつ対象領域52が文字属性領域52aに置換されている。
【0047】
図10は第2実施形態に係る画像処理装置100bの構成を示している。
図10において
図7の画像処理装置100の要素と同一の要素には同一の符号が付されている。
【0048】
画像処理装置100bは、属性修正処理を受け持つ属性修正ブロック130を備える。属性修正ブロック130は、領域判別ブロック110によって生成された属性画像42を必要に応じて修正した属性画像42bを生成する。
【0049】
図9および
図10を参照する。属性修正ブロック130において、対象領域特定部131は、属性画像42の示す文字属性領域51を除く部分を画像40から抽出して2値化する。これによって属性画像42における対象領域52が顕在化される。領域色取得部132は、2値化画像44によって特定される対象領域52の領域色を、画像40の色情報に基づく平均値計算によって取得し、領域色を示すデータDC52を置換要否判定部135に与える。矩形設定部133は、対象領域52に外接する仮想の矩形72を設定し、矩形72の位置を示すデータD72を置換要否判定部135に与える。
【0050】
置換要否判定部135は、矩形72を囲む画素列91における文字属性の画素を注目画素として選び、注目画素がデータDC52の示す領域色と同一または近い画素色をもつ同色画素であるか否かを判定する。そして、置換要否判定部135は、注目画素の個数Qに対する同色画素の個数qの比率Rを算出し、比率Rと閾値Rth2とを比較する。比率Rが閾値Rth2以上である場合に、置換要否判定部135は対象領域52の属性の置換が必要であると判定する。
【0051】
属性置換部136は、置換要否判定部135による判定の結果を受けて、対象領域52の属性を非文字属性から文字属性に置換する。属性画像42に対する属性を置換する部分修正によって得られた修正後の属性画像42bが、画像40の領域判別情報として図示しない後段の画像処理ブロックに送られる。
【0052】
図11は属性修正ブロック130によって行なわれる属性修正処理の流れを示している。
【0053】
対象領域特定部131による画像41の2値化(#10)と、矩形設定部133による矩形72の設定(#11b)と、領域色取得部132による対象領域52の領域色の算出(#12b)とに続いて、画素色判別ループの処理が行なわれる。画素色判別ループでは、矩形72を囲む画素列91を構成する全ての画素が1画素ずつ順に処理の対象とされる。画素色判別ループの最初のステップ#13において、置換要否判定部135が画素の属性を判別する。注目した画素の属性が文字属性でなければ、すなわち非文字属性であれば(#13でNO)、置換要否判定部135は当該画素を以降の処理の対象から除外する。これによって、比率Rの算出に関わるべき文字属性をもつ注目画素が選定されたことになる。
【0054】
続いて、置換要否判定部135は注目画素の画素色を画像40から抽出し(#14)、注目画素の画素色と対象領域52の領域色との色差を算出する(#15b)。色差が閾値以下であれば(#16でYES)、注目画素は同色画素である。この場合、置換要否判定部135は同色画素の個数qのカウントを一つインクリメントし(#17)、かつ注目画素の個数Qのカウントを一つインクリメントする(#18)。色差が閾値を超える場合は(#16でNO)、置換要否判定部135は注目画素の個数Qのカウントを一つインクリメントする(#18)。こうして画素色判別ループにおいて、矩形72を囲む注目画素の個数Qと注目画素のうちの同色画素の個数qとを数え終えると、置換要否判定部135は個数Qに対する個数qの比率Rを算出して閾値Rth2と比較する(#19)。比率Rが閾値Rth2以上であれば(#19でYES)、置換要否判定部135は矩形72に内包される画素の総数を特定する矩形サイズとサイズ閾値とを比較する(#19B)。矩形サイズとサイズ閾値との比較は、例えば
図4に示した三角形60のような巨大な非文字属性部分を文字属性領域に置換してしまうのを防ぐための処理である。この処理のためのファームウェアを置換要否判定部135は用いる。矩形サイズとサイズ閾値との大小関係によって置換要否の判定結果が決まる。矩形サイズがサイズ閾値以下であれば(#19BでYES)、属性置換部136が属性画像42における対象領域52の属性を非文字属性から文字属性に置換する(#20b)。比率Rが閾値Rth2未満である場合(#19でNO)、および矩形サイズがサイズ閾値を超える場合(#19BでNO)、対象領域52の属性は置換されない。
【0055】
図12は画像処理回路16を備える画像形成装置10の構成の一例を示している。上述の第1実施形態の画像処理装置100および第2実施形態の画像処理装置100bは、画像処理回路16または画像処理回路16の一部として画像形成装置10に組入れることができる。
【0056】
図12において、画像形成装置10は、コピーおよびファクシミリ通信を含む多数の機能を有するMFP(Multi-functional Peripheral)である。画像形成装置10は操作パネル14によるユーザーの指示および通信インタフェース15を介して通信する外部機器からの要求に応じる。例えば、コピー動作において、ADF(Auto Document Feeder)12が原稿シートをイメージスキャナー13の読取り位置へ搬送し、イメージスキャナー13が原稿シートから画像を読み取る。イメージスキャナー13によってデータ化された画像に対して画像処理回路16が画質を最適化する画像処理を加え、処理後の画像をプリンターエンジン17が例えば電子写真法によって用紙に印刷する。
【0057】
画像処理回路16は、ASIC技術によって作製された画像処理用のプロセッサーを備える。このプロセッサーは、入力された画像を文字属性領域と非文字属性領域とに区分する領域判別ブロック110の機能、および領域判別の結果を必要に応じて修正する属性修正ブロック120(または130)の機能を実現する。
【0058】
画像形成装置10の動作はコントローラー11によって制御される。コントローラー11は、制御用プログラムおよびアプリケーションプログラムを実行するコンピューターとしてのCPU(Central Processing Unit)を有している。プログラムはROM(Read-Only Memory)に記憶されており、プログラムの実行に際してRAM(Random Access Memory)がワークエリアとして用いられる。
【0059】
以上の第1実施形態および第2実施形態によれば、属性置換の要否判定の対象である領域(文字属性領域51、対象領域52)に外接する矩形71,72を設定するので、当該領域の周囲の色のサンプリングを簡便に行うことができる。領域の輪郭に沿ってサンプリングするのと違って、輪郭に沿うための複雑なフィルターが不要であり、矩形71,72の座標計算だけでサンプリングすべき画素を決定することができる。
【0060】
第1実施形態によれば、属性画像42によって領域範囲が既に特定されている文字属性領域51を属性置換の対象領域とするので、対象領域を特定するための顕在化処理が不要となる分の処理時間の短縮およびリソースの負担軽減を図ることができる。
【0061】
第2実施形態によれば、矩形72のサイズが閾値以下である場合に限って非文字属性を文字属性に置換する(文字化する)ので、巨大な図形の一部が文字属性領域である誤判別された画像に対し、非文字属性領域であると正しく判別されていた残りの図形部分まで文字化してしまう、という副作用を防ぐことができる。
【0062】
第1実施形態および第2実施形態において、装置の構成および処理の実行順序を本発明の趣旨に沿う範囲内で適宜変更することができる。例えば、上述の第2実施形態では、比率Rの算出に関わる注目画素を文字属性の画素に限定したが、そのような限定をせず、画素列91の画素を全て注目画素としてもよい。ただし、その場合、非文字属性領域41Aにも対象領域52の領域色に似た色をもつ画素の存在する可能性を否定できないので、連続性の検出の信頼性を高めるために、同色画素を文字属性の画素に限定するのがよい。また、第2実施形態において、矩形72のサイズとサイズ閾値との比較を、比率Rを算出する以前、または比率Rと閾値Rth2を比較する以前に行ってもよい。対象領域52を特定するための処理として、例えば文字色が限定されている場合には限定色に対応した設定範囲内の画素値をもつ画素を抽出してもよい。
【0063】
画像処理装置100,100bの機能をソフトウェアによって、またはソフトウェアとハードウェアとの組合せによって実現してもよい。例えば、画像形成装置10において実現する場合、画像処理用のプログラムを実行するコンピューターとして、コントローラー11のCPUを用いることができる。そのプログラムをコントローラー11のROMに記憶させてもよいし、画像形成装置10に組み付けられるハードディスクドライブのようなストレージに記憶させてもよい。