特許第6249240号(P6249240)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 京セラドキュメントソリューションズ株式会社の特許一覧

<>
  • 特許6249240-画像処理装置 図000002
  • 特許6249240-画像処理装置 図000003
  • 特許6249240-画像処理装置 図000004
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6249240
(24)【登録日】2017年12月1日
(45)【発行日】2017年12月20日
(54)【発明の名称】画像処理装置
(51)【国際特許分類】
   H04N 1/40 20060101AFI20171211BHJP
【FI】
   H04N1/40 F
【請求項の数】4
【全頁数】9
(21)【出願番号】特願2015-65461(P2015-65461)
(22)【出願日】2015年3月27日
(65)【公開番号】特開2016-184914(P2016-184914A)
(43)【公開日】2016年10月20日
【審査請求日】2017年2月22日
(73)【特許権者】
【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
(74)【代理人】
【識別番号】100114971
【弁理士】
【氏名又は名称】青木 修
(72)【発明者】
【氏名】南部 惣太
【審査官】 豊田 好一
(56)【参考文献】
【文献】 特開平08−315069(JP,A)
【文献】 特開2010−224612(JP,A)
【文献】 特開2008−198157(JP,A)
【文献】 特開2004−127203(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 1/40
(57)【特許請求の範囲】
【請求項1】
画像内の網点領域および文字画像を抽出する領域抽出部と、
前記網点領域が罫線を有さない場合において、前記網点領域において主走査方向または副走査方向に少なくとも2つの前記文字画像が配列しており、かつ、前記網点領域を均等分割して得られる分割領域と前記文字画像との位置関係に基づいて、前記文字画像に関する表組みの文字揃えが検出されたとき、当該網点領域を表画像として検出する表画像検出部と、
を備えることを特徴とする画像処理装置。
【請求項2】
前記表画像検出部は、前記網点領域において主走査方向に少なくとも2つの前記文字画像が配列している場合、前記網点領域を主走査方向において均等分割して得られる分割領域と前記文字画像との主走査方向における位置関係に基づいて、前記文字画像に関する表組みの文字揃えを検出することを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記表画像検出部は、前記網点領域において副走査方向に少なくとも2つの前記文字画像が配列している場合、前記網点領域を副走査方向において均等分割して得られる分割領域と前記文字画像との副走査方向における位置関係に基づいて、前記文字画像に関する表組みの文字揃えを検出することを特徴とする請求項1または請求項2記載の画像処理装置。
【請求項4】
検出された前記表画像および前記文字画像以外を背景画像とし、検出された前記表画像、前記文字画像、および前記背景画像を別々に所定の符号化方式で圧縮する圧縮処理部と、
圧縮された前記表画像、圧縮された前記文字画像、および圧縮された前記背景画像を別々のレイヤーとして含む画像ファイルを生成するファイル生成部と、
をさらに備えることを特徴とする請求項1から請求項3のうちのいずれか1項記載の画像処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置に関するものである。
【背景技術】
【0002】
ある画像処理装置では、ラスター画像内のフレームおよび破線を検出し、検出したフレームおよび破線から罫線を推定し、そのフレームが表画像であるか否かを判定している(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2000−200350号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
他方、罫線を使用せずに表を表現する場合がある。例えば、表内の背景色を、セルごと、列ごと、表ごとに変化させることで、罫線が無くても表を表現することが可能である。そのように表現された表内の背景は、ソリッドな(ベタな)画像となるが、そのような表が印刷されると、表内の背景は、網点で印刷される。
【0005】
したがって、そのような表を含む印刷物の画像をスキャナーなどで読み取ると、読み取られた画像(以下、スキャン画像という)内で、そのような表は、網点領域として現れる。その他、スキャン画像では、写真などの階調画像も網点領域として現れる。
【0006】
罫線を有する表の場合、画像内の網点領域から、上述の技術のように罫線に基づいて表画像を特定することができるが、罫線を有さない表の場合、画像内の網点領域から表画像を正確に特定することは困難である。
【0007】
本発明は、上記の問題に鑑みてなされたものであり、画像内の網点領域から、罫線を有さない表画像を正確に特定する画像処理装置を得ることを目的とする。
【課題を解決するための手段】
【0008】
本発明に係る画像処理装置は、画像内の網点領域および文字画像を抽出する領域抽出部と、前記網点領域が罫線を有さない場合において、前記網点領域において主走査方向または副走査方向に少なくとも2つの前記文字画像が配列しており、かつ、前記網点領域を均等分割して得られる分割領域と前記文字画像との位置関係に基づいて、前記文字画像に関する表組みの文字揃えが検出されたとき、当該網点領域を表画像として検出する表画像検出部とを備える。
【発明の効果】
【0009】
本発明によれば、画像内の網点領域から、罫線を有さない表画像が正確に特定される。
【0010】
本発明の上記又は他の目的、特徴および優位性は、添付の図面とともに以下の詳細な説明から更に明らかになる。
【図面の簡単な説明】
【0011】
図1図1は、本発明の実施の形態に係る画像処理装置を備える画像形成装置の構成を示すブロック図である。
図2図2は、図1における画像処理装置13の動作について説明するフローチャートである。
図3図3は、図1における画像処理装置13による文字揃えの検出について説明する図である。
【発明を実施するための形態】
【0012】
以下、図に基づいて本発明の実施の形態を説明する。
【0013】
図1は、本発明の実施の形態に係る画像処理装置を備える画像形成装置の構成を示すブロック図である。図1に示す画像形成装置1は、複写機であるが、スキャナー、複合機などでもよい。
【0014】
この画像形成装置1は、印刷装置11と、画像読取装置12と、画像処理装置13と、記憶装置14と、表示装置15と、入力装置16とを備える。
【0015】
印刷装置11は、出力デバイスの一例であって、画像処理装置13による各種画像処理後の画像データに基づいて原稿画像を、CMYK(シアン・マゼンタ・イエロー・ブラック)色のトナーを使用して電子写真プロセスで印刷する内部装置である。
【0016】
また、画像読取装置12は、原稿から原稿画像を光学的に読み取り、原稿画像の画像データをRGBデータとして生成する内部装置である。
【0017】
また、画像処理装置13は、画像読取装置12などで生成された画像データに対して、色調整、色変換などの画像処理を行う。記憶装置14は、フラッシュメモリーなどの、書き換え可能な不揮発性の記憶装置であり、各種データやプログラムを記憶している。
【0018】
画像処理装置13は、ASIC(Application Specific Integrated Circuit)やコンピューターで実現され、領域抽出部21、表画像検出部22、圧縮処理部23、およびファイル生成部24を有する。
【0019】
領域抽出部21は、ラスター画像データに基づく画像内の網点領域および文字画像を抽出する。
【0020】
領域抽出部21は、網点領域については、例えば、周期的な網点パターンを検出し、網点パターンのエッジを検出し、そのエッジ内部の領域を網点領域として抽出する。また、領域抽出部21は、文字画像については、例えば、ラベリング処理を行い、文字画像を抽出する。
【0021】
表画像検出部22は、抽出された網点領域内に罫線があるか否かを判定し、網点領域内に罫線がある場合、その網点領域を表画像として検出する。
【0022】
また、表画像検出部22は、その網点領域が罫線を有さない場合において、その網点領域において主走査方向または副走査方向に少なくとも2つの文字画像が配列しており、かつ、その網点領域を均等分割して得られる分割領域と文字画像との位置関係に基づいて、文字画像に関する表組みの文字揃えが検出されたとき、当該網点領域を表画像として検出する。
【0023】
具体的には、表画像検出部22は、その網点領域において主走査方向に少なくとも2つの文字画像が配列している場合、その網点領域を主走査方向において均等分割して得られる分割領域と文字画像との主走査方向における位置関係に基づいて、文字画像に関する表組みの文字揃えを検出する。
【0024】
また、表画像検出部22は、その網点領域において副走査方向に少なくとも2つの文字画像が配列している場合、その網点領域を副走査方向において均等分割して得られる分割領域と文字画像との副走査方向における位置関係に基づいて、文字画像に関する表組みの文字揃えを検出する。
【0025】
圧縮処理部23は、検出された表画像および文字画像以外を背景画像と判定し、検出された表画像、文字画像、および背景画像を別々に所定の符号化方式で圧縮する。なお、背景画像の画像データは、マルチビットデータである。
【0026】
例えば、圧縮処理部23は、JPEG(Joint Photographic Experts Group)方式で表画像、文字画像、および背景画像を別々に圧縮する。その際、表画像、文字画像、および背景画像について互いに異なる条件(画像解像度、圧縮に使用する符号化方式など)で圧縮を行うようにしてもよい。例えば、圧縮に使用する符号化方式としてGIF(Graphics Interchange Format)方式、PNG(Portable Network Graphics)方式などのロスレス方式を使用してもよい。
【0027】
ファイル生成部24は、圧縮された表画像、圧縮された文字画像、および圧縮された背景画像を別々のレイヤーとして含む画像ファイル(例えば、PDF(Portable Document Format)ファイル)を生成する。
【0028】
次に、上記画像処理装置13の動作について説明する。図2は、図1における画像処理装置13の動作について説明するフローチャートである。図3は、図1における画像処理装置13による文字揃えの検出について説明する図である。
【0029】
まず、領域抽出部21は、ラスター画像データに基づく画像内の1または複数の網点領域および1または複数の文字画像を抽出する。
【0030】
次に、表画像検出部22は、各網点領域について、以下の処理を行い、網点領域が表画像であるか否かを判定する。
【0031】
表画像検出部22は、網点領域内に罫線があるか否かを判定する(ステップS2)。表画像検出部22は、網点領域内に罫線がある場合、その網点領域が表画像であると判定する(ステップS3)。
【0032】
網点領域内に罫線がない場合、表画像検出部22は、抽出された網点領域が所定値以上の主走査方向(以下、横方向という)の幅を有するか否かを判定する(ステップS4)。
【0033】
抽出された網点領域が所定値以上の横方向の幅を有する場合、表画像検出部22は、抽出された網点領域内において、複数の文字画像が横方向に配列しているか否かを判定する(ステップS5)。
【0034】
抽出された網点領域内において、複数の文字画像が横方向に配列している場合、表画像検出部22は、抽出された網点領域を、横方向において、その網点領域内で抽出された文字画像の数と同数の分割領域に均等に分割し(ステップS6)、各分割領域と各文字画像との位置関係を特定する(ステップS7)。
【0035】
そして、表画像検出部22は、特定した位置関係に基づいて、網点領域において表組みの文字揃えが検出されるか否かを判定する(ステップS8)。
【0036】
例えば図3に示すように、網点領域101〜103において、それぞれ横方向に配列した3つの文字画像が抽出された場合、網点領域101〜103は、それぞれ、3つの分割領域101a〜101c,102a〜102c,103a〜103cに分割される。そして、文字画像が表組みで左揃えになっている場合、分割領域101aの左端から分割領域101aに含まれる文字画像の左端までの距離と、分割領域101bの左端から分割領域101bに含まれる文字画像の左端までの距離と、分割領域101cの左端から分割領域101cに含まれる文字画像の左端までの距離とが略同一となる。したがって、分割領域101aの左端から分割領域101aに含まれる文字画像の左端までの距離と、分割領域101bの左端から分割領域101bに含まれる文字画像の左端までの距離と、分割領域101cの左端から分割領域101cに含まれる文字画像の左端までの距離とが略同一であれば、網点領域101において文字揃え(左揃え)が検出されたと判定される。
【0037】
また、横方向において、分割領域101aの中心から分割領域101aに含まれる文字画像の中心までの距離と、分割領域101bの中心から分割領域101bに含まれる文字画像の中心までの距離と、分割領域101cの中心から分割領域101cに含まれる文字画像の中心までの距離とが略同一であれば、網点領域101において文字揃え(中央揃え)が検出されたと判定される。
【0038】
また、分割領域101aの右端から分割領域101aに含まれる文字画像の右端までの距離と、分割領域101bの右端から分割領域101bに含まれる文字画像の右端までの距離と、分割領域101cの右端から分割領域101cに含まれる文字画像の右端までの距離とが略同一であれば、網点領域101において文字揃え(右揃え)が検出されたと判定される。
【0039】
そして、網点領域において表組みの文字揃えが検出された場合、表画像検出部22は、その複数の網点領域が表画像であると判定する(ステップS3)。
【0040】
他方、抽出された網点領域が所定値以上の横方向の幅を有していない場合(ステップS4)、表画像検出部22は、抽出された網点領域が所定値以上の副走査方向(以下、縦方向という)の幅を有するか否かを判定する(ステップS9)。
【0041】
抽出された網点領域が所定値以上の縦方向の幅を有する場合、表画像検出部22は、抽出された網点領域内において、複数の文字画像が縦方向に配列しているか否かを判定する(ステップS10)。
【0042】
抽出された網点領域内において、複数の文字画像が縦方向に配列している場合、表画像検出部22は、抽出された網点領域を、縦方向において、その網点領域内で抽出された文字画像の数と同数の分割領域に均等に分割し(ステップS11)、各分割領域と各文字画像との位置関係を特定する(ステップS12)。
【0043】
そして、表画像検出部22は、特定した位置関係に基づいて、網点領域において表組みの文字揃えが検出されるか否かを判定する(ステップS13)。
【0044】
網点領域において、縦方向に配列したN個の文字画像が抽出された場合、網点領域は、N個の分割領域に分割される。そして、各分割領域の上端からその分割領域に含まれる文字画像の上端までの距離が互いに略同一であれば、網点領域で文字揃え(上揃え)が検出されたと判定される。また、縦方向において、各分割領域の中心からその分割領域に含まれる文字画像の中心までの距離が互いに略同一であれば、網点領域で文字揃え(中央揃え)が検出されたと判定される。また、各分割領域の下端からその分割領域に含まれる文字画像の下端までの距離が互いに略同一であれば、網点領域で文字揃え(下揃え)が検出されたと判定される。
【0045】
そして、網点領域において表組みの文字揃えが検出された場合、表画像検出部22は、その複数の網点領域が表画像であると判定する(ステップS3)。
【0046】
一方、ステップS9において網点領域の縦方向の幅が所定値以上ではないと判定された場合、ステップS5において複数の文字画像が網点領域内において横方向に配列していないと判定された場合、 ステップS10において複数の文字画像が網点領域内において縦方向に配列していないと判定された場合、並びにステップS8またはステップS13において文字揃えが検出されなかった場合、表画像検出部22は、抽出された網点領域が表画像ではないと判定する(ステップS14)。
【0047】
このようにして、各網点領域が表画像または背景画像に分類された後、圧縮処理部23は、検出された表画像および文字画像以外を背景画像と判定し、検出された表画像、文字画像、および背景画像を別々に所定の符号化方式で圧縮する(ステップS15)。
【0048】
そして、ファイル生成部24は、圧縮された表画像、圧縮された文字画像、および圧縮された背景画像を別々のレイヤーとして含む画像ファイル(ここではPDFファイル)を生成する(ステップS16)。
【0049】
以上のように、上記実施の形態によれば、表画像検出部22は、領域抽出部21により抽出された網点領域が罫線を有さない場合において、その網点領域において主走査方向または副走査方向において少なくとも2つの文字画像が配列しており、かつ、その網点領域を均等分割して得られる分割領域とその文字画像との位置関係に基づいて、その文字画像に関する表組みの文字揃えが検出されたとき、当該網点領域を表画像として検出する。
【0050】
これにより、画像内の網点領域から、罫線を有さない表画像が正確に特定される。
【0051】
したがって、画像内の網点領域が表画像に分類される確率が高くなるため、より高圧縮率のPDFファイルが生成される。
【0052】
なお、上述の実施の形態に対する様々な変更および修正については、当業者には明らかである。そのような変更および修正は、その主題の趣旨および範囲から離れることなく、かつ、意図された利点を弱めることなく行われてもよい。つまり、そのような変更および修正が請求項に含まれることを意図している。
【0053】
例えば、上記実施の形態において、網点領域を、文字画像の数で分割して分割領域を得ているが(ステップS6,S11)、さらに、網点領域を文字画像の数を分割数としてその分割数で分割して得られた分割領域を使用して文字揃えが検出されなかった場合、分割数を増加し、増加した分割数で網点領域を分割して得られた分割領域を使用して文字揃えの検出を再度試みるようにしてもよい。
【産業上の利用可能性】
【0054】
本発明は、例えば、スキャナー、複合機などの画像形成装置に適用可能である。
【符号の説明】
【0055】
13 画像処理装置
21 領域抽出部
22 表画像検出部
23 圧縮処理部
24 ファイル生成部
図1
図2
図3