(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024109037
(43)【公開日】2024-08-13
(54)【発明の名称】画像圧縮装置、画像形成装置、検査装置、画像圧縮方法およびプログラム
(51)【国際特許分類】
H04N 1/64 20060101AFI20240805BHJP
【FI】
H04N1/64
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023205681
(22)【出願日】2023-12-05
(31)【優先権主張番号】P 2023013552
(32)【優先日】2023-01-31
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】石倉 和貴
【テーマコード(参考)】
5C178
【Fターム(参考)】
5C178AC10
5C178BC57
5C178BC91
5C178CC03
5C178CC12
5C178CC52
5C178EC63
(57)【要約】
【課題】圧縮率向上とOCR処理の精度向上とを両立させる、汎用的な圧縮画像を生成する。
【解決手段】画像データと圧縮にかかるパラメータとを受け取り、前記画像データと前記パラメータとの情報に基づき、輝度信号の量子化テーブルと色信号の量子化テーブルとを用いて前記画像データに対して圧縮処理を実施する圧縮部と前記圧縮部に対して前記パラメータを設定するパラメータ設定部と、を備え、前記パラメータ設定部は、前記色信号の量子化テーブルの前記パラメータの上限をα以下の値にし、前記輝度信号の量子化テーブルのAC成分のパラメータの9割以上を、前記色信号の量子化テーブルのAC成分のパラメータ以上の値とする。
【選択図】
図4
【特許請求の範囲】
【請求項1】
画像データと圧縮にかかるパラメータとを受け取り、前記画像データと前記パラメータとの情報に基づき、輝度信号の量子化テーブルと色信号の量子化テーブルとを用いて前記画像データに対して圧縮処理を実施する圧縮部と
前記圧縮部に対して前記パラメータを設定するパラメータ設定部と、
を備え、
前記パラメータ設定部は、
前記色信号の量子化テーブルの前記パラメータの上限をα以下の値にし、
前記輝度信号の量子化テーブルのAC成分のパラメータの9割以上を、前記色信号の量子化テーブルのAC成分のパラメータ以上の値とする、
ことを特徴とする画像圧縮装置。
【請求項2】
前記パラメータ設定部は、前記輝度信号の量子化テーブルのAC成分の全ての各パラメータの値を、前記色信号の量子化テーブルのAC成分の全ての各パラメータ以上とする、
ことを特徴とする請求項1に記載の画像圧縮装置。
【請求項3】
前記パラメータ設定部は、前記色信号の量子化テーブルについて、高周波領域の上限のパラメータをαとした時、低周波領域のパラメータをα/2以上かつα以下の値にする、
ことを特徴とする請求項1に記載の画像圧縮装置。
【請求項4】
設定された圧縮率に応じて、低周波領域と高周波領域とについての、圧縮率の異なる2つの量子化テーブルを生成するパラメータ生成部と、
前記パラメータ生成部で生成された前記2つの量子化テーブルを合成し、圧縮のための新たな量子化テーブルを生成するパラメータ合成部と、
を備え、
前記パラメータ設定部は、前記パラメータ合成部で生成された前記新たな量子化テーブルのパラメータを前記圧縮部に対して設定する、
ことを特徴とする請求項1に記載の画像圧縮装置。
【請求項5】
前記パラメータ合成部は、
量子化テーブルのAC成分の係数に対して、1つ右、または1つ下の係数が小さくなる組み合わせがある場合、小さい係数の値を高い圧縮率の量子化テーブルの係数の値に補正し、
補正後の係数の値が上限αを超える場合、補正後の係数の値を前記上限αに補正する、
ことを特徴とする請求項4に記載の画像圧縮装置。
【請求項6】
前記圧縮部は、色成分を間引くサブサンプリング処理を選択的に実行可能とする、
ことを特徴とする請求項1に記載の画像圧縮装置。
【請求項7】
請求項1ないし6のいずれか一項に記載の画像圧縮装置と、
前記画像圧縮装置によって圧縮された画像データを印字する画像形成部と、
を備えることを特徴とする画像形成装置。
【請求項8】
請求項1ないし6のいずれか一項に記載の画像圧縮装置を備える、
ことを特徴とする検査装置。
【請求項9】
圧縮部が、画像データと圧縮にかかるパラメータとを受け取り、前記画像データと前記パラメータとの情報に基づき、輝度信号の量子化テーブルと色信号の量子化テーブルとを用いて前記画像データに対して圧縮処理を実施する圧縮工程と
パラメータ設定部が、前記圧縮部に対して前記パラメータを設定するパラメータ設定工程と、
を含み、
前記パラメータ設定工程は、
前記色信号の量子化テーブルの前記パラメータの上限をα以下の値にし、
前記輝度信号の量子化テーブルのAC成分のパラメータの9割以上を、前記色信号の量子化テーブルのAC成分のパラメータ以上の値とする、
ことを特徴とする画像圧縮方法。
【請求項10】
コンピュータを、
画像データと圧縮にかかるパラメータとを受け取り、前記画像データと前記パラメータとの情報に基づき、輝度信号の量子化テーブルと色信号の量子化テーブルとを用いて前記画像データに対して圧縮処理を実施する圧縮部と
前記圧縮部に対して前記パラメータを設定するパラメータ設定部と、
として機能させ、
前記パラメータ設定部は、
前記色信号の量子化テーブルの前記パラメータの上限をα以下の値にし、
前記輝度信号の量子化テーブルのAC成分のパラメータの9割以上を、前記色信号の量子化テーブルのAC成分のパラメータ以上の値とする、
ことを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像圧縮装置、画像形成装置、検査装置、画像圧縮方法およびプログラムに関する。
【背景技術】
【0002】
従来、原稿などを読み取った画像の圧縮効果を高める目的で、画像における文字領域と背景領域とをそれぞれ異なる量子化テーブルで圧縮する技術が開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかし、従来技術に示されるように、画像における文字領域と背景領域とでそれぞれ異なる量子化テーブルを用いることは、特殊な圧縮形式になるため、汎用的なOCR(Optical Character Recognition/Reader:光学的文字認識)処理ソフトへの利用が出来ないという問題がある。
【0004】
また、従来技術によれば、色信号(色差)を圧縮することは考慮されているが、輝度信号の圧縮については考慮されておらず、十分な圧縮効果が期待できないという問題がある。
【0005】
本発明は、上記に鑑みてなされたものであって、圧縮率向上とOCR処理の精度向上とを両立させる、汎用的な圧縮画像を生成することを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、本発明は、画像データと圧縮にかかるパラメータとを受け取り、前記画像データと前記パラメータとの情報に基づき、輝度信号の量子化テーブルと色信号の量子化テーブルとを用いて前記画像データに対して圧縮処理を実施する圧縮部と前記圧縮部に対して前記パラメータを設定するパラメータ設定部と、を備え、前記パラメータ設定部は、前記色信号の量子化テーブルの前記パラメータの上限をα以下の値にし、前記輝度信号の量子化テーブルのAC成分のパラメータの9割以上を、前記色信号の量子化テーブルのAC成分のパラメータ以上の値とする、ことを特徴とする。
【発明の効果】
【0007】
本発明によれば、圧縮率向上とOCR処理の精度向上とを両立させる、汎用的な圧縮画像を生成することができる、という効果を奏する。
【図面の簡単な説明】
【0008】
【
図1】
図1は、第1の実施の形態にかかる画像形成装置の構成を示す図である。
【
図2】
図2は、画像形成装置のハードウェア構成例を示すブロック図である。
【
図3】
図3は、画像形成装置の機能構成の一例を示すブロック図である。
【
図4】
図4は、画像圧縮装置の構成を示すブロック図である。
【
図5】
図5は、量子化テーブルを例示的に示す図である。
【
図6】
図6は、黒文字部の8×8画素ブロックを示す図である。
【
図7】
図7は、黒文字部の8×8画素ブロックの色信号の周波数成分およびRGB値を示す図である。
【
図8】
図8は、低圧縮の量子化テーブルで圧縮した例を示す図である。
【
図9】
図9は、別の量子化テーブルを例示的に示す図である。
【
図10】
図10は、第1の実施の形態にかかる画像圧縮装置における処理手順を示すフローチャートである。
【
図11】
図11は、第2の実施の形態にかかる画像圧縮装置の構成を示すブロック図である。
【
図13】
図13は、パラメータ生成の際の補完例を示す図である。
【
図14】
図14は、第3の実施の形態にかかる画像圧縮装置におけるサブサンプリング処理を示す図である。
【
図15】
図15は、第4の実施の形態にかかる検査装置における画像診断処理を示す図である。
【発明を実施するための形態】
【0009】
以下に添付図面を参照して、画像圧縮装置、画像形成装置、検査装置、画像圧縮方法およびプログラムの実施の形態を詳細に説明する。
【0010】
以下では、本発明の画像形成装置を、コピー機能、プリンタ機能、スキャナ機能およびファクシミリ機能のうち少なくとも2つの機能を有する複合機に適用した例を説明するが、適応可能な装置はこれに限られるものではない。例えば、本発明の画像形成装置は、複写機、プリンタ、スキャナ装置、並びに、ファクシミリ装置等の画像形成装置にも適用することができる。
【0011】
(第1の実施の形態)
図1は、第1の実施の形態にかかる画像形成装置1の構成を示す図である。
図1に示すように、画像形成装置1は、自動原稿搬送装置(ADF:Auto Document Feeder)100と、スキャナ6と、給紙部2と、プロッタ4と、画像圧縮装置5と、を備える。なお、画像圧縮装置5の詳細については、後述する。
【0012】
給紙部2は、用紙サイズの異なる記録紙を収納する給紙カセット21,22と、給紙カセット21,22に収納された記録紙をプロッタ4の画像形成位置まで搬送する各種ローラを備える給紙手段23と、を有する。
【0013】
プロッタ4は、露光装置31と、感光体ドラム32と、現像装置33と、転写ベルト34と、定着装置35と、を備える電子写真方式の画像形成部である。なお、プロッタ4は、電子写真方式に限るものではなく、インクジェット方式などの他の方式によって画像を形成するものであってもよい。
【0014】
プロッタ4は、スキャナ6から出力された画像データを記録紙に印字する。より詳細には、プロッタ4は、スキャナ6内部の画像読取部により読み取られた原稿の画像データに基づいて、露光装置31により感光体ドラム32を露光して感光体ドラム32に潜像を形成する。プロッタ4は、現像装置33により感光体ドラム32に異なる色のトナーを供給して現像する。そして、プロッタ4は、転写ベルト34により感光体ドラム32に現像された像を給紙部2から供給された記録紙に転写する。その後、プロッタ4は、定着装置35により記録紙に転写されたトナー画像のトナーを溶融して、記録紙にカラー画像を定着する。
【0015】
図2は、画像形成装置1のハードウェア構成例を示すブロック図である。画像形成装置1は、例えば
図2に示すように、コントローラ210と、オペレーションパネル220と、FCU(Facsimile Control Unit)230と、USB(Universal Serial Bus)デバイス240と、MLB(Media Link Board)250と、スキャナ6と、プロッタ4とを備える。
【0016】
オペレーションパネル220は、画像形成装置1を使用するユーザが各種の設定入力を行ったり、ユーザに提示する各種情報を表示したりするユーザインタフェースである。
【0017】
FCU230は、画像形成装置1のファクシミリ機能を制御する制御ユニットである。USBデバイス240は、USBにより画像形成装置1に接続される機器である。MLB250は、画像データのフォーマット変換を行う変換ボードである。スキャナ6は原稿の読み取りを行うエンジンであり、プロッタ4は印刷を行うエンジンである。処理対象の画像は、スキャナ6による原稿の読み取りによって取得することができる。
【0018】
コントローラ210は、画像形成装置1の動作を制御する制御装置である。コントローラ210は、
図2に示すように、CPU(Central Processing Unit)211と、システムメモリ212と、HDD(Hard Disk Drive)3と、PHY(PHysical Layer:通信系回路の物理階層)214と、ASIC(Application Specific Integrated Circuit)215とを含む。オペレーションパネル220は、コントローラ210のASIC215に接続されている。また、FCU230、USBデバイス240、MLB250、スキャナ6およびプロッタ4は、データ転送バス280を介してコントローラ210のASIC215に接続されている。
【0019】
図3は、画像形成装置1の機能構成の一例を示すブロック図である。
図3に示すように画像形成装置1は、スキャナ6、HDD3、プロッタ4に加え、画像処理部20と、画像圧縮装置5と、を備えている。
【0020】
画像形成装置1では、画像形成装置としての機能的な構成要素の一部または全部が、主にコントローラ210によって実現される。すなわち、画像処理部20は、例えば、コントローラ210のASIC215により実現される。また、画像圧縮装置5は、例えば、コントローラ210のCPU211がシステムメモリ212やHDD3に記憶された所定のプログラム(ソフトウェア)を実行することにより実現される。
【0021】
なお、上記プログラムは、画像形成装置1にインストール可能な形式または実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVDなどのコンピュータで読み取り可能な記録媒体に記録して提供される。また、上記プログラムを、インターネットなどのネットワークに接続されたコンピュータ上に格納し、ネットワーク経由で画像形成装置1にダウンロードさせることにより提供するように構成してもよい。さらに、上記プログラムを、インターネットなどのネットワーク経由で提供または配布するように構成してもよい。また、上記プログラムを、例えば画像形成装置1内のシステムメモリ212やHDD3などに予め組み込んで提供するようにしてもよい。
【0022】
スキャナ6は、自動原稿搬送装置100によって給紙された原稿から画像データを読み取る。スキャナ6は、読み取った画像データを画像処理部20へ送る。
【0023】
画像処理部20は、スキャナ6により読み取られた画像データに対して、所定の画像処理を行う。画像処理部20は、所定の画像処理を実施したデータを、画像圧縮装置5に送信する。
【0024】
画像処理部20は、ガンマ補正部26と、像域分離部27と、データインタフェース部28と、色処理/UCR(Under Color Removal)部24と、プリンタ補正部25と、を備えている。
【0025】
ガンマ補正部26は、スキャナ6が読み取った画像データ(例えば、アナログデジタル変換後のR、G、B各色8ビットの信号)に対して、色ごとの諧調バランスを揃えるための一次元変換(ガンマ補正処理)を施す。変換後の信号である濃度リニア信号(RGB信号:白を意味する信号値を0とする)は、像域分離部27と、データインタフェース部28とに送られる。
【0026】
像域分離部27は、入力された画像データ(入力画像)を、複数の属性に対応する複数の領域に分離する。例えば像域分離部27は、画像データの画素ごとに、「文字」および「非文字」のいずれであるかを示す文字判定結果(総合判定結果)X1と、「有彩」および「無彩」のいずれであるかを示す色判定結果X2を出力する。
【0027】
なお、文字判定結果が「文字」であるとは、例えば、画素が文字を構成する画素であることを意味する。色の判定とは独立に判定されるため、有彩文字および無彩文字のいずれも「文字」と判定される。有彩文字は、主に有彩色により表される文字(例えば色文字)を示す。無彩文字は、主に無彩色により表される文字(例えば黒文字)を示す。文字判定結果が「非文字」であるとは、例えば、画素が印鑑部、写真などの文字以外を構成する画素であることを意味する。以下では、有彩文字および無彩文字を、それぞれ色文字および黒文字という場合がある。
【0028】
なお判定結果を出力する単位は、1画素であってもよいし、複数画素を含む画素ブロックであってもよい。以下では主に1画素単位で判定結果を出力する場合を例に説明する。
【0029】
データインタフェース部28は、像域分離部27から出力された判定結果X1、X2、および、ガンマ補正部26から出力された画像データ(濃度リニア信号)をHDD3へ一時記憶する際のインタフェースである。また、データインタフェース部28は、ガンマ補正後の画像データと像域分離部27からの判定結果X1、X2とを、色処理/UCR部24に出力する。
【0030】
色処理/UCR部24は、画素ごとの判定結果X1、X2に基づいて、色処理およびUCR処理を選択して実行する。例えば色処理/UCR部24は、各8ビットのRGB信号を所定の変換式に基づきプロッタ4の制御信号である画像信号(C,M,Y,Bkの各8ビット)に変換して出力する。
【0031】
プリンタ補正部25は、C,M,Y,Bkの画像信号に対してプロッタ4の階調特性を反映したガンマ補正処理およびディザ処理(擬似中間調処理)を施して、プロッタ4に出力する。
【0032】
画像圧縮装置5は、スキャナ6により読み取られて画像処理部20で画像処理を施された原稿の画像データに対して、画像圧縮処理を行う。
【0033】
図4は、画像圧縮装置5の構成を示すブロック図である。本実施形態にかかる画像圧縮装置5は、色信号に対する圧縮を高画質にすることで圧縮時の色混ざりを防ぎつつ、光学的要因による色づきを圧縮で除去可能なテーブルを設定し、OCR(Optical Character Recognition/Reader:光学的文字認識)処理精度の向上とファイルサイズの軽量化とを両立させることを目的としたものである。より詳細には、画像圧縮装置5は、色信号のパラメータ(係数)の上限をα以下にして低圧縮にすることで、黒部と色部の色混ざりを防ぎOCR精度を向上させる。また、画像圧縮装置5は、輝度信号と色信号とのそれぞれの量子化テーブルのパラメータ(係数)に大小関係を持たせることで、ファイルサイズを小さくする。
【0034】
図4に示すように、画像圧縮装置5は、パラメータ設定部51と、JPEG(Joint Photographic Experts Group)圧縮部52と、を備える。
【0035】
パラメータ設定部51は、JPEG圧縮部52にパラメータ(係数)を設定する。
【0036】
JPEG圧縮部52は、画像処理部20から所定の画像処理を実施した画像データを受け取るとともに、パラメータ設定部51からパラメータ(係数)を受け取る。加えて、JPEG圧縮部52は、HDD3へ一時記憶された像域分離部27からの判定結果X1、X2を受けて、画像処理を実施したデータについて、後述する「文字部」と「印鑑と重ねて打たれた文字部」との2つの領域を判定する。JPEG圧縮部52は、「文字部」と「印鑑と重ねて打たれた文字部」との2つの領域を判定したデータに対して、パラメータに従ってJPEG(Joint Photographic Experts Group)など予め用意された画像圧縮処理であるJPEG圧縮処理を実施する圧縮部である。
【0037】
ここで、
図5はJPEG圧縮部52におけるJPEG圧縮の際に用いる量子化テーブルを例示的に示す図である。
図5(a)は輝度信号に対する圧縮に用いる量子化テーブルの一例を示し、
図5(b)は色信号(色差)に対する圧縮に用いる量子化テーブルの一例を示す。量子化テーブルとは、周波数成分を圧縮する際のパラメータ(係数)であって、輝度信号用(
図5(a))と色信号用(
図5(b))の2つが存在する。なお、
図5に示す各量子化テーブルのパラメータ(係数)の値は、一例である。
【0038】
なお、パラメータ(係数)は、8×8の量子化テーブルの1つ1つの要素を指すものある。量子化テーブルの座標を(x,y)とした時、x,yは0,1,2,3,4,5,6,7のいずれかの値を指すものとする。8×8のテーブル係数の左上の係数を(0,0)と定義する。
図5(a)に示す量子化テーブルの例では、(1,0)のパラメータ(係数)は、“14”である。
【0039】
また、各量子化テーブルにおいて、(0,0)の画素をDC成分、(0,0)以外の画素をAC成分という。
【0040】
なお、量子化テーブルのパラメータ(係数)を大きくすると、圧縮率が大きくなる。すなわち、量子化テーブルのパラメータ(係数)を大きくすると、低画質になり、色混ざりが発生する。
【0041】
ところで、OCR処理が実施される原稿の例の1つに、経理帳票がある。経理帳票のOCR処理対象は、「文字部」、「印鑑と重ねて打たれた文字部」の2つの領域が主にある。「文字部」の領域に対するOCR処理においては、認識の阻害要因が圧縮時のノイズ程度であり、OCR処理の難易度は低いものである。よって、「文字部」の領域に対するOCR処理の際には、シビアな画質が求められない輝度信号を色信号より圧縮することで、圧縮率向上の効果を得ることができる。
【0042】
一方、「印鑑と重ねて打たれた文字部」の領域は、文字部と印鑑部とが近くにあることで、圧縮の際に文字部と印鑑部との色混ざりが発生する。このため、OCR処理の前処理である2値化処理やドロップアウトカラー処理の際に、文字部の除去などの誤った処理によって文字に欠損が生まれるため、誤認識が起こり易くなっている。したがって、「印鑑と重ねて打たれた文字部」の領域に対するOCR処理においては、印鑑等が重ねて打たれた文字のOCR処理の難易度は非常に高いものとなっている。
【0043】
「印鑑と重ねて打たれた文字部」の領域に対するOCR処理においては、圧縮の際に、色信号の量子化テーブルを小さく、すなわち色信号を高画質にすることで、黒文字と色文字の色混ざりを防ぎ、ドロップアウトカラー処理時の欠損を防ぐことが出来るため、OCR処理の精度の向上を図ることができる。
【0044】
一方、単純に色信号の圧縮に高画質な量子化テーブルを用いると、「文字部」のファイルサイズが大きくなりやすい。これは色信号に高画質な量子化テーブルを用いると、スキャナ6内部の画像読取部のセンサのノイズ/レンズの収差/版ズレ等の光学的要因により「文字部」に生じる色信号(色づき)を圧縮後も残してしまうためである。ここで光学的要因による色付きは、低周波領域に発生しやすい。よって、色信号の低周波領域の圧縮率を上げることで、「文字部」に生じる光学的な色づきを圧縮できるため、高画質な圧縮をしつつ圧縮率の向上を図ることができる。
【0045】
ここで、光学的要因による色づきが残った例について説明する。
図6は黒文字部の8×8画素ブロック(JPEG圧縮時処理の最小単位)を示す図、
図7は黒文字部の8×8画素ブロックの色信号の周波数成分およびRGB値を示す図、
図8は低圧縮の量子化テーブルで圧縮した例を示す図である。
【0046】
図6は、圧縮しても色信号(色づき)を除去することができず、ファイルサイズが大きくなる画像の例である。
図6に示す例は、スキャナ6により読み取られて画像処理部20で画像処理を施された原稿の画像データの黒文字部である「文字部」から8×8画素を切り出した画像である。
【0047】
図7(a)は黒文字部の8×8画素ブロックの色信号の周波数成分を示し、
図7(b)は文字部の8×8画素ブロックのRGB値を示している。
図7に示すように、全ての画素がR=G=Bで構成された
図6に示す画像は、AC成分全てが“0”になる。
図6に示す画像は、スキャナ6内部の画像読取部のセンサのノイズ/レンズの収差/版ズレ等の光学的要因による「文字部」に生じる色づきが残っているため、AC成分に“0”以外の値が入っている。
図7においてはR=G=Bの画素の部分をハッチングで表しているが、4画素しかなく、一見黒画素に見えても微妙な色信号付きを含んでいることが分かる。
【0048】
図8は、
図7(a)に示す周波数成分の例に対して、低圧縮のJPEG圧縮をした例である。低圧縮の量子化テーブルで圧縮すると、
図8に示す圧縮後の色信号の周波数成分のように、例えば(1,0)(2,0)の係数が残ってしまう。ここで、量子化後の周波数成分に対して符号化処理が行われる際、要素“0”が連続した場合には、ファイルサイズを小さくすることができる。しかしながら、低圧縮の量子化テーブルを利用すると、圧縮後に要素(丸印Bで示す)が残ってしまうため、ファイルサイズを小さくすることができない。
【0049】
なお、版ズレ等の光学的要因による光学的な色づきは、特に(1,0)(0,1)などで大きくなりやすい。文字は縦線や横線が多く使われることと、人が見やすいサイズの文字はある程度の大きさで印字されるので、周波数成分が低い側になるためである。本実施形態では、光学的な色ずれが発生しやすい領域をAC成分の(1,0)(0,1)を領域として低周波領域と定義し、AC成分のそれ以外の領域を高周波領域と定義とする。
【0050】
以上より、文字部と印鑑部とが重ねられた部分をOCR処理する際は、輝度信号の圧縮に比べて色信号の圧縮の方が重要である。したがって、圧縮の際に、「印鑑と重ねて打たれた文字部」の領域のOCR処理の精度に関わる色信号の圧縮に高画質なテーブルを用いるようにするとよい。
【0051】
また、OCR処理の難易度が低い「文字部」の領域は、色信号の低周波領域の圧縮率を上げて、低画質にしてもよい。すなわち、「文字部」の領域については、圧縮の際に、輝度信号の量子化テーブルのAC成分の係数の値を色信号の量子化テーブルのAC成分の係数の値に比べて大きくして低画質にすることで、ファイルサイズを小さくすることができる。
【0052】
このような輝度信号の量子化テーブルと色信号の量子化テーブルとの関係を採ることにより、ファイルサイズの圧縮効果を得ることができる。
【0053】
輝度信号の量子化テーブルのAC成分の係数の値が色信号の量子化テーブルのAC成分の係数の値以上になる関係は、量子化テーブルの係数の9割が満たせていれば圧縮効果としては十分である。
図5に示すように、例えば、輝度信号の量子化テーブルのAC成分の係数の値と色信号の量子化テーブルのAC成分の係数の値との大小関係が逆転している係数(丸印Aで示す)が1割程度であれば、十分にOCR処理の精度上昇とファイルサイズの圧縮効果とを得ることができる。
【0054】
すなわち、パラメータ設定部51は、輝度信号の量子化テーブルのAC成分の係数の9割以上が、色信号の量子化テーブルのAC成分の係数以上の値とする。これにより、OCR処理の精度向上と圧縮率の向上効果とを得ることができる。
【0055】
ここで、
図9はJPEG圧縮部52におけるJPEG圧縮の際に用いる別の量子化テーブルを例示的に示す図である。
図9(a)は輝度信号の量子化テーブルの一例を示し、
図9(b)は色信号(色差)の量子化テーブルの一例を示す。
【0056】
図9に示す例では、パラメータ設定部51は、輝度信号の量子化テーブルのAC成分の全ての各係数の値を、色信号の量子化テーブルのAC成分の全ての各係数以上とする。このような場合、圧縮効果を更に大きくすることができる。
【0057】
加えて、色信号の量子化テーブルの係数(パラメータ)は、色信号の低周波領域と高周波領域とが以下の関係性を持つことが特徴となっている。
【0058】
パラメータ設定部51は、色信号の量子化テーブルについて、OCR処理の精度向上とファイルサイズの抑制との両立をさせるため、高周波領域の上限の係数をαとした時、低周波領域の係数をα/2以上かつα以下の値にする。以下において、このような特徴を有するようにした理由について説明する。
【0059】
OCR処理の阻害要因の代表例として、上述したような「印鑑と重ねて打たれた文字部」がある。文字部と印鑑部とが近傍にある場合、低周波領域と高周波領域とのどちらも、色信号の周波数成分が発生する。よって、「印鑑と重ねて打たれた文字部」の領域に対して圧縮処理を実施すると、色混ざりが発生することになる。
【0060】
圧縮率が大きい程、ファイルサイズは小さくなるが、反面、色混ざりの副作用は大きくなる。黒に色が混ざることや、色に黒が混ざることは、OCR処理の前処理のドロップアウト処理や2値化処理に悪影響を及ぼすことになる。また、上述したように、量子化テーブルの係数を大きくすると、圧縮率が大きくなる。すなわち、量子化テーブルの係数を大きくすると、低画質になり、色混ざりが発生する。よって、圧縮による色づきの副作用の影響を抑えるために、量子化テーブルの係数の上限を設ける必要がある。
【0061】
一方、光学的要因の色づきは、文字部と印鑑部とが重なった場合などの圧縮時の色づきと比べ、色信号の周波数成分への影響は小さい。よって、量子化テーブルの係数を一定以上の値にすることで、光学的要因の色づきの周波数成分を圧縮によりゼロにすることができ、ファイルサイズを小さくすることができる。
【0062】
従来の圧縮処理では、人間の視覚特性は低周波領域には敏感であるため、低周波領域は圧縮しないようにしていた。
【0063】
一方、本実施形態においては、視覚特性を満しつつ、光学的要因の色づきを除去できるレベルまで圧縮率を上げて、ファイルサイズの低減を可能にする。
【0064】
光学的要因の色づきの周波数成分と、文字部と印鑑部とが重なった場合の周波数成分との色信号のレベル差は十分な差があるため、量子化テーブルの高周波領域の係数と、量子化テーブルの低周波領域の係数との間に、倍の大小関係があれば成立する。すなわち、文字部と印鑑部とが重なった場合の周波数成分の色づきを防ぐことができる高周波領域側の係数の上限をαとすると、低周波領域はα/2以上である必要があり、OCR処理の精度向上とファイルサイズ低減とが両立するためには、色信号の量子化テーブルの高周波領域の係数がα以下、色信号の量子化テーブルの低周波領域の係数はα/2以上かつα以下の関係が必要になる。
【0065】
このように本実施形態によれば、色信号の量子化テーブルのパラメータ(係数)の上限をα以下にして低圧縮にすることで、黒部と色部の色混ざりを防ぎOCR精度を向上させることができる。また、輝度信号と色信号とのそれぞれの量子化テーブルのパラメータ(係数)に大小関係を持たせることで、ファイルサイズを小さくすることができる。すなわち、本実施形態によれば、圧縮率向上とOCR処理の精度向上とを両立させる、汎用的な圧縮画像を生成することができる。
【0066】
加えて、本実施形態によれば、低周波領域の量子化テーブルをα/2以上にすることで、文字部のもつ光学的要因による色づきによる色成分を除去し、ファイルサイズを小さくすることができる。
【0067】
図10は、第1の実施の形態にかかる画像圧縮装置における処理手順を示すフローチャートである。
【0068】
まず、画像圧縮装置5は、画像処理部20で画像処理を施された画像データと、HDD3に保存されたパラメータ(量子化テーブル)を受信する(S10)。ここで、パラメータは標準で規定されている量子化テーブルを用いてもよいが、オリジナルの量子化テーブルを用いるようにしてもよい。
【0069】
次に、パラメータ設定部51は、JPEG圧縮部52のパラメータ(量子化テーブル)を設定する(S11)。ここで、パラメータ設定部51は、色信号の量子化テーブルの係数の値の上限がα以下の値になり、輝度信号の量子化テーブルのAC成分の9割以上が、色信号の量子化テーブルで対応するAC成分の係数の値以上の値になるように、パラメータを設定する。
【0070】
次に、JPEG圧縮部52は、設定されたパラメータを(量子化テーブル)を用いて画像データに圧縮処理を実施する(S12)。
【0071】
図10(b)は、S11の工程のサブ工程を示すフローチャートである。このサブ工程において、まず、パラメータ設定部51は、色信号の量子化テーブルに含まれる各AC成分の値と所定の上限αを比較し、AC成分の値がαを超える場合はそのAC成分をα以下の値に修正する(S111)。ここで、αはあらかじめ決められた値としてもよいが、輝度信号の量子化テーブルのAC成分の値(例えば、
図5(a)の輝度信号用のテーブルの座標(2,2)のパラメータ“20”)としてもよい。また、色信号のAC成分をα以下の値に修正する場合は、そのAC成分をαと同じ値に修正してもよいが、αより小さいに値に修正することもできる。
【0072】
次に、パラメータ設定部51は、各AC成分について、輝度信号の量子化テーブルの座標(x、y)の係数値qY(x,y)と色信号の量子化テーブルの座標(x、y)の係数値qC(x,y)を比較し、qY(x,y)<qC(x,y)となるAC成分の個数をカウントする(S112)。
【0073】
次に、S12のカウント結果が輝度信号のAC成分の個数の9割より小さい場合は、上記のカウント結果が輝度信号のAC成分の個数の9割以上になるように、輝度信号のAC成分の値を修正する(S113)。例えば、修正すべき輝度信号のAC成分がn個ある場合、qY(x,y)<qC(x,y)を満たす輝度信号のAC成分からn個を選択して、それらのAC成分の値をqC(x,y)と同じになるように修正する。この修正により輝度信号の圧縮率は大きくなるが、修正すべき輝度信号のAC成分のうち、x+yが大きい方からn個を選択すれば、x+yが小さい方からn個を選択するよりも、低画質化を抑えることができる。また、qY(x,y)を修正する際は、上記のようにqC(x,y)と同じになるようにしてもよいが、qC(x,y)より大きい値に修正してもよい。
【0074】
次に、パラメータ設定部51は、S111で修正された色信号の量子化テーブルと、S113で修正された輝度信号の量子化テーブルを用いて、JPEG圧縮部52のパラメータ(量子化テーブル)を設定する(S114)。
【0075】
なお、第1の実施の形態にかかる画像圧縮装置5における処理手順では、S113において、S112のカウント結果が輝度信号のAC成分の個数の全て(10割)になるように、輝度信号のAC成分の値を修正してもよい。また、S111において、色信号の量子化テーブルの低周波領域のAC成分の値がα/2より小さい場合は、その値をα/2以上の値に修正する手順を追加してもよい。
【0076】
(第2の実施の形態)
次に、第2の実施の形態について説明する。
【0077】
第2の実施の形態は、パラメータ生成を可能とする点が、第1の実施の形態と異なる。以下、第2の実施の形態の説明では、第1の実施の形態と同一部分の説明については省略し、第1の実施の形態と異なる箇所について説明する。
【0078】
版ズレ等の光学的要因により生じる文字部の持つ色信号は、ハードウェアの性能やバラツキ等に振られるため、圧縮に最適な係数も微妙に異なる。本実施形態は、ハードウェアの個体毎に低周波領域の最適な設定ができるようにしたものである。
【0079】
図11は、第2の実施の形態にかかる画像圧縮装置5の構成を示すブロック図である。本実施形態にかかる画像圧縮装置5は、第2の実施の形態にかかる画像圧縮装置5の構成に加えて、パラメータ生成部53と、パラメータ合成部54と、を備える。
【0080】
パラメータ生成部53は、設定された圧縮率に応じて、量子化テーブルの係数(パラメータ)を生成する。言い換えれば、パラメータ生成部53は、設定された圧縮率に応じて、低周波領域と高周波領域とについての、圧縮率の異なる2つの量子化テーブルを生成する。
【0081】
パラメータ合成部54は、パラメータ生成部53で生成された量子化テーブルに応じて、新しい量子化テーブルを生成する。言い換えれば、パラメータ合成部54は、パラメータ生成部53で生成された圧縮率の異なる2つの量子化テーブルを合成し、圧縮のための新たな量子化テーブルを生成する。
【0082】
なお、パラメータ生成部53が生成する「圧縮率の異なる量子化テーブル」は、標準で規定されている量子化テーブルを用いてもよい。このように標準で規定されている量子化テーブルを用いることで、容易に量子化テーブルの生成を実行することができる。
【0083】
パラメータ設定部51は、パラメータ合成部54で生成された新たな量子化テーブルのパラメータをJPEG圧縮部52に対して設定する。
【0084】
以下において、パラメータ生成例について説明する。
【0085】
図12は、パラメータ生成の一例を示す図である。
図12に示す“画質70”の量子化テーブルおよび“画質90”の量子化テーブルは、前述した標準で規定されている量子化テーブルによって得られた量子化テーブルである。なお、本実施形態では、標準で規定されている量子化テーブルを利用するようにしたが、これに限るものではなく、オリジナルの量子化テーブルを用いるようにしてもよい。
【0086】
パラメータ生成部53は、“画質70”の量子化テーブルを低周波領域側のテーブル設定に用い、“画質70”に比べて高画質な“画質90”の量子化テーブルを高周波領域側のテーブル設定に用いる。
【0087】
図12に例示するパラメータ生成部53によって生成された量子化テーブルにおいては、低周波領域の周波数成分(1,0)(0,1)の係数に対して、図中において下方向や右方向に見ていくと、量子化テーブルの係数が下がっており、低周波領域の周波数成分の係数より高周波領域の周波数成分の係数の方が高画質になってしまっている。
【0088】
一方、人間の視覚特性は、周波数成分の低い部分の変化には敏感であり、周波数成分の高い部分の変化の方が鈍感である。よって低周波領域から高周波領域にかけて高画質になると、圧縮時に低周波領域の成分を高周波領域の成分より変化させてしまい、視覚特性に対して違和感のある画像が生成されてしまう。
【0089】
そこで、パラメータ合成部54は、上記問題を解決するために、以下の条件で量子化テーブルを補完することができるようにしたものである。
【0090】
図13は、パラメータ生成の際の補完例を示す図である。
図13に示すように、パラメータ合成部54は、量子化テーブルのAC成分の係数に対して、1つ右、または1つ下の係数が小さくなる組み合わせがある場合、当該小さい係数の値を高い圧縮率(低画質)の量子化テーブルの係数の値に補正する。加えて、パラメータ合成部54は、補正後の係数の値が上限αを超える場合、補正後の係数の値を上限αに補正する。
図13に示すように、補正された量子化テーブルのハッチングで示す部分Cが、実際に補完された領域である。
【0091】
これにより、高周波の変化には鈍感で、低周波の変化には敏感である人間の視覚特性的に合わせた違和感のない画像を生成することができる。
【0092】
このように本実施形態によれば、低周波領域と高周波領域とに独立して異なる量子化テーブルを持たせるとともに、また、それらの量子化テーブルを合成し、新たな量子化テーブルを生成することで、ハードウェアの個体毎に低周波領域の最適な設定を行うことができる。これにより、低周波領域のパラメータ(係数)を所望の圧縮率で生成することができるため、スキャナ6内部の画像読取部の個体差によって生じるレンズ収差の違いや版ズレの色づきの違いに対応可能なOCR処理の精度向上とファイルサイズの抑制とを両立する量子化テーブルを提供することができる。
【0093】
(第3の実施の形態)
次に、第3の実施の形態について説明する。
【0094】
第3の実施の形態は、JPEG圧縮部52がサブサンプリング処理(色の間引き処理)を選択的に実行可能とする点が、第1の実施の形態または第2の実施の形態と異なる。以下、第3の実施の形態の説明では、第1の実施の形態または第2の実施の形態と同一部分の説明については省略し、第1の実施の形態または第2の実施の形態と異なる箇所について説明する。
【0095】
ここで、
図14は第3の実施の形態にかかる画像圧縮装置5におけるサブサンプリング処理を示す図である。JPEG圧縮部52は、サブサンプリング処理を選択的に実行可能とする。サブサンプリングとは、色成分を間引く方法であり、情報量を減らしてファイルサイズを小さくすることができる。従来、色間引きは、人間の視覚特性が色成分の変化に鈍感であるため、実施されていた。
【0096】
図14に示すサブサンプリング処理は、2×2画素の色成分を1画素の色成分に間引く方法である。なお、2×2画素の色成分を1画素の色成分に間引く方法は一例に過ぎず、横方向だけ色成分を間引く場合や縦方向だけ色成分を間引く場合、もっと広い範囲の色成分を間引く場合などもある。
【0097】
JPEG圧縮部52は、サブサンプリング処理をオフにすることができる。JPEG圧縮部52は、サブサンプリング処理をオフにすることで、色成分の間引きによる黒文字と色文字との色混ざりを防ぎ、ドロップアウトカラー処理などの際の文字の欠損を防ぐことができるため、OCR処理の精度向上効果を奏することができる。
【0098】
JPEG圧縮部52は、サブサンプリング処理をオンにすることができる。JPEG圧縮部52は、サブサンプリング処理をオンにすることで、色成分を間引くことによる色混ざりを生じさせてしまう。しかしながら、間引き処理をする方が一般的な圧縮の処理となっており、多くの汎用的なOCRソフトに対応させることができる、という効果を奏する。
【0099】
(第4の実施の形態)
次に、第4の実施の形態について説明する。
【0100】
第4の実施の形態は、第1の実施の形態ないし第3の実施の形態で説明した圧縮技術を、カラー画像を用いた画像診断に利用する点が、第1の実施の形態ないし第3の実施の形態と異なる。以下、第4の実施の形態の説明では、第1の実施の形態ないし第3の実施の形態と同一部分の説明については省略し、第1の実施の形態ないし第3の実施の形態と異なる箇所について説明する。
【0101】
ここで、
図15は第4の実施の形態にかかる検査装置における画像診断処理を示す図である。
図15は、内視鏡などの検査装置で人間の臓器を撮影したカラー画像の例である。
【0102】
図15に示すように、内視鏡などの検査装置で撮影した画像は、「光源の届かない部分」は光に照らされないため暗く、「光源の届く部分」は光に照らされるため明るく色成分も大きい。
【0103】
第1の実施の形態ないし第3の実施の形態で説明したように、本願の圧縮技術は、輝度成分は大きく圧縮し、色成分は圧縮効果を落とし高画質に保つ圧縮技術である。したがって、本実施形態によれば、内視鏡などの検査装置で画像診断する際、検査装置の結果を本願の圧縮技術で生成することで、診断に利用したい「光源の届く部分」の画像領域は高画質な画像品質を保ち、診断で使わない「光源の届かない部分」の画像領域は高圧縮することで、圧縮効果の高い圧縮画像を生成することができる。
【0104】
以上、本発明に係る各実施形態を説明したが、上述の各実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら新規な実施形態およびその変形は、発明の範囲および要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。さらに、異なる実施形態および変形例にわたる構成要素を適宜組み合わせてもよい。
【符号の説明】
【0105】
1 画像形成装置
4 画像形成部
5 画像圧縮装置
51 パラメータ設定部
52 圧縮部
53 パラメータ生成部
54 パラメータ合成部
【先行技術文献】
【特許文献】
【0106】