特許第5992956号(P5992956)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 京セラドキュメントソリューションズ株式会社の特許一覧

<>
  • 特許5992956-画像処理装置 図000002
  • 特許5992956-画像処理装置 図000003
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5992956
(24)【登録日】2016年8月26日
(45)【発行日】2016年9月14日
(54)【発明の名称】画像処理装置
(51)【国際特許分類】
   G06K 9/62 20060101AFI20160901BHJP
【FI】
   G06K9/62 620Z
【請求項の数】2
【全頁数】8
(21)【出願番号】特願2014-109397(P2014-109397)
(22)【出願日】2014年5月27日
(65)【公開番号】特開2015-225459(P2015-225459A)
(43)【公開日】2015年12月14日
【審査請求日】2016年3月18日
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
(74)【代理人】
【識別番号】100114971
【弁理士】
【氏名又は名称】青木 修
(72)【発明者】
【氏名】木村 新一
【審査官】 ▲広▼島 明芳
(56)【参考文献】
【文献】 特開2012−073749(JP,A)
【文献】 特開2000−207376(JP,A)
【文献】 特開2013−161268(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06K 9/62
(57)【特許請求の範囲】
【請求項1】
原稿画像の1ページごとに文字認識用画像データを生成する画像処理部と、
前記画像処理部により生成された前記文字認識用画像データに対して文字認識処理を行う文字認識処理部とを備え、
前記画像処理部は、(a)ある画質設定であるページの文字認識用画像データを生成し、(b)前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間に基づいて、前記あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成するか否かを判定し、(c)前記あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成すると判定した場合、前記あるページの原稿種別および原稿サイズの少なくとも一方に基づいて前記次ページの画質設定を特定し、特定した前記画質設定で前記次ページの文字認識用画像データを生成し、
前記画質設定は、カラー設定、階調数設定、解像度設定、およびフィルター設定の少なくとも1つを含み、
前記フィルター設定は、前記文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度に変換する処理のオン/オフ設定、および前記文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度に変換する処理のオン/オフ設定の少なくとも1つを含み、
前記画像処理部は、前記あるページのカラー設定および解像度設定をカラーおよびデフォルト解像度として前記あるページの文字認識用画像データを生成し、前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間が所定閾値以上である場合、前記あるページの原稿種別が文字原稿に設定されているときには、前記次ページのカラー設定をモノクロとし、前記あるページの原稿種別が文字原稿に設定されていないときには、前記あるページの原稿サイズが所定サイズを超えていれば、前記次ページの解像度設定を、前記デフォルト解像度より低い所定の解像度とすること、
を特徴とする画像処理装置。
【請求項2】
前記画像処理部は、前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間が所定閾値以上である場合、前記あるページの原稿種別が文字原稿に設定されておらず、かつ、前記あるページの原稿サイズが所定サイズを超えていないときには、前記次ページのフィルター設定において、前記文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度に変換する処理のオン/オフ設定、および前記文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度に変換する処理のオン/オフ設定のうちの少なくとも1つをオンに設定することを特徴とする請求項記載の画像処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置に関するものである。
【背景技術】
【0002】
ある装置では、文字認識(OCR:Optical Character Recognition)処理で、原稿画像内の文字を検出している(例えば特許文献1参照)。
【0003】
原稿画像内には、様々な言語で様々なサイズの文字が含まれている可能性があるため、文字認識率を高くするために、良好な画質の原稿画像に対してOCR処理を行うことが望ましい。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平9−114918号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、原稿画像の画質を高くするほど、画像データのサイズが大きくなってしまい、OCR処理時間が長くなってしまう。
【0006】
本発明は、上記の問題に鑑みてなされたものであり、必要に応じて、文字認識率が低下しないようにしつつ短時間でOCR処理を行う画像処理装置を得ることを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る画像処理装置は、原稿画像の1ページごとに文字認識用画像データを生成する画像処理部と、前記画像処理部により生成された前記文字認識用画像データに対して文字認識処理を行う文字認識処理部とを備える。そして、前記画像処理部は、(a)ある画質設定であるページの文字認識用画像データを生成し、(b)前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間に基づいて、前記あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成するか否かを判定し、(c)前記あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成すると判定した場合、前記あるページの原稿種別および原稿サイズの少なくとも一方に基づいて前記次ページの画質設定を特定し、特定した前記画質設定で前記次ページの文字認識用画像データを生成する。前記画質設定は、カラー設定、階調数設定、解像度設定、およびフィルター設定の少なくとも1つを含み、前記フィルター設定は、前記文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度に変換する処理のオン/オフ設定、および前記文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度に変換する処理のオン/オフ設定の少なくとも1つを含む。そして、前記画像処理部は、前記あるページのカラー設定および解像度設定をカラーおよびデフォルト解像度として前記あるページの文字認識用画像データを生成し、前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間が所定閾値以上である場合、前記あるページの原稿種別が文字原稿に設定されているときには、前記次ページのカラー設定をモノクロとし、前記あるページの原稿種別が文字原稿に設定されていないときには、前記あるページの原稿サイズが所定サイズを超えていれば、前記次ページの解像度設定を、前記デフォルト解像度より低い所定の解像度とする。

【発明の効果】
【0008】
本発明によれば、必要に応じて、文字認識率が低下しないようにしつつ短時間でOCR処理を行う画像処理装置を得ることができる。
【図面の簡単な説明】
【0009】
図1図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。
図2図2は、図1に示す画像処理装置の動作を説明するフローチャートである。
【発明を実施するための形態】
【0010】
以下、図に基づいて本発明の実施の形態を説明する。
【0011】
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。
【0012】
図1に示す画像処理装置は、複合機であって、画像読取装置1、画像入力部2、画像処理部3、OCR処理部4、表示部5、操作部6、印刷制御部7、印刷装置8、状態記憶部9、ファイル作成部10、データ通信部11、およびシステム制御部12を備える。
【0013】
画像読取装置1は、原稿から原稿画像を光学的に読み取り、原稿画像の画像データを生成する。
【0014】
画像入力部2は、画像読取装置1により生成された原稿画像の画像データまたはデータ通信部11により受信された原稿画像の画像データを取得する。
【0015】
画像処理部3は、画像入力部2により取得された原稿画像の画像データから、原稿画像の1ページごとに文字認識用画像データを生成する。画像処理部3は、各ページについての画質設定で文字認識用画像データを生成する。
【0016】
画像処理部3は、(a)ある画質設定で、あるページの文字認識用画像データを生成し、(b)あるページの文字認識用画像データに対する、OCR処理部4による文字認識処理(以下、OCR処理という)の処理時間に基づいて、そのページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成するか否かを判定し、(c)そのページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成すると判定した場合、そのページの原稿種別および原稿サイズの少なくとも一方に基づいて次ページの画質設定(つまり、OCR処理時間が短くなるような画質設定)を特定し、特定した画質設定で次ページの文字認識用画像データを生成する。
【0017】
一般的に、OCR処理の処理時間は、文字認識用画像データのデータサイズに依存するほか、原稿画像内のオブジェクト(文字、線画、罫線など)の数に依存する。そのため、計測される処理時間は、原稿画像の内容に応じて変化する。
【0018】
この実施の形態では、画質設定は、カラー設定、階調数設定、解像度設定、およびフィルター設定の少なくとも1つ(ここでは、すべて)を含む。
【0019】
カラー設定は、文字認識用画像データをモノクロまたはカラーに指定する。
【0020】
階調数設定は、文字認識用画像データの階調数を指定する。
【0021】
例えば、カラー設定および階調数設定によって、256階調のカラーで文字認識用画像データが生成されたり、256階調のグレイスケールで文字認識用画像データが生成されたり、2値化画像で文字認識用画像データが生成されたりする。
【0022】
フィルター設定は、文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度(ここでは0%)に変換する処理のオン/オフ設定、および文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度(ここでは100%)に変換する処理のオン/オフ設定の少なくとも1つ(ここでは両方)を含む。
【0023】
例えば、文字認識用画像データが8ビットRGBカラーデータである場合、上述のオン/オフ設定がオンにされるときには、色成分のすべてが所定濃度以下の濃度値である画素について、所定の最低濃度(R,G,B)=(255,255,255)とされ、色成分のすべてが所定濃度以上の濃度値である画素について、所定の最低濃度(R,G,B)=(0,0,0)とされる。
【0024】
なお、上述のオン/オフ設定がオンにされると、データサイズは減少しないものの、原稿画像のコントラストが高くなり、OCR処理において文字認識が行いやすくなり、OCR処理時間が短くなる。
【0025】
OCR処理部4は、画像処理部3により生成された文字認識用画像データに対してOCR処理を行い、原稿画像内の文字を検出する。
【0026】
表示部5は、例えば液晶ディスプレイ、インジケーターなどを含み、当該画像処理装置の状態、OCR処理の画質設定の変更などを表示する。操作部6は、例えばタッチパネル、ハードキーなどを含み、ユーザー操作を受け付け、電気信号として出力する。
【0027】
印刷制御部7は、印刷装置8を制御して原稿画像などの印刷を印刷装置8に実行させる。印刷装置8は、例えば電子写真方式で原稿画像を印刷用紙に印刷する。
【0028】
状態記憶部9は、当該画像処理装置の状態、各種設定などを記憶する記憶装置である。
【0029】
ファイル作成部10は、原稿画像のラスターイメージデータと、OCR処理部4の文字認識により得られたテキストとを含むファイルを作成する。例えば、ファイル作成部10は、原稿画像のラスターイメージデータのレイヤーと、OCR処理部4の文字認識により得られたテキストのレイヤーとを含むPDF(Portable Document Format)ファイルを作成する。
【0030】
データ通信部11は、例えばネットワークインターフェイスなどであって、パーソナルコンピューターなどの端末装置とデータ通信し、原稿画像の画像データを端末装置から受信したり、ファイル作成部10により作成されたファイルを所定のプロトコルで端末装置へ送信したりする。
【0031】
システム制御部12は、画像読取装置1、画像入力部2、画像処理部3、OCR処理部4、表示部5、操作部6、印刷制御部7、印刷装置8、状態記憶部9、ファイル作成部10、およびデータ通信部11を制御して各種ジョブを実行する。
【0032】
なお、上述の画像入力部2、画像処理部3、OCR処理部4、印刷制御部7、ファイル作成部10、およびシステム制御部12は、所定のプログラムを実行するコンピューター、ASIC(Application Specific Integrated Circuit)などで実現される。
【0033】
次に、上記画像処理装置の動作について説明する。図2は、図1に示す画像処理装置の動作を説明するフローチャートである。
【0034】
システム制御部12は、データ通信部11を介して外部の端末装置から、または操作部6からユーザーによる所定のジョブ(例えば、スキャントゥセンド)の実行指示を受け付けると、そのジョブの一部として以下の処理を各部に実行させる。
【0035】
この実施の形態における画像処理装置では、OCR処理の設定として、「手動(文字認識精度優先)」、「手動(文字認識速度優先)」、および「自動」の3つがある。「手動(文字認識精度優先)」の場合、データサイズの比較的大きい文字認識用画像データが使用され、OCR処理時間は長くなる。「手動(文字認識速度優先)」の場合、データサイズの比較的小さい文字認識用画像データが使用され、OCR処理時間は短くなる。「自動」の場合、以下のようにOCR処理が実行される。
【0036】
まず、画像処理部3は、原稿の第1ページの画像データから、デフォルトの画質設定で第1ページの文字認識用画像データを生成し、OCR処理部4は、生成された文字認識用画像データに対してOCR処理を実行する(ステップS1)。
【0037】
なお、デフォルトの画質設定は、上述の「手動(文字認識精度優先)」の場合の画質設定と同一であり、例えば、256階調カラー、600dpi、およびフィルター設定すべてオフとされる。
【0038】
画像処理部3は、OCR処理部4による第1ページについてのOCR処理の処理時間を計測し(ステップS1)、処理時間が所定の閾値以上であるか否かを判定する(ステップS2)。
【0039】
処理時間が所定の閾値以上ではない場合、画像処理部3は、ステップS1でOCR処理されたページが最終ページであるか否か(つまり、後続のページが存在するか否か)を判定する(ステップS3)。
【0040】
画像処理部3は、ステップS1でOCR処理されたページが最終ページではない場合、次のページに対して、デフォルト画質設定で、次の文字認識用画像データを生成し、OCR処理部4は、生成された文字認識用画像データに対してOCR処理を実行する(ステップS1)。そして、画像処理部3は、OCR処理部4によるそのページについてのOCR処理の処理時間を計測し(ステップS1)、処理時間が所定の閾値以上であるか否かを判定する(ステップS2)。
【0041】
このようにして、1ページ分のOCR処理の処理時間が所定の閾値以上とならなければ、各ページの文字認識用画像データがデフォルト画質設定で生成され、OCR処理される。
【0042】
一方、あるページについてのOCR処理の処理時間が所定の閾値以上となった場合、画像処理部3は、次ページの文字認識用画像データについての画質設定を、OCR処理時間が短くなるようにデフォルト画質設定とは異なる画質設定とする。
【0043】
具体的には、画像処理部3は、ユーザーによってジョブ実行指示において原稿種別が文字原稿に設定されているか否かを判定し(ステップS4)、原稿種別が文字原稿に設定されている場合、次ページのカラー設定をモノクロとする(ステップS5)。なお、次ページのカラー設定をモノクロとする場合、次ページの階調数設定を、上述のあるページの階調数設定から変更しないようにしてもよいし、上述の処理時間に応じて階調数を設定するようにしてもよい。例えば、上述の処理時間が所定の閾値以上である場合、階調数設定を変更せず、上述の処理時間が所定の閾値未満の場合、階調数設定を2(つまりモノクロ2値)とするようにしてもよい。
【0044】
一方、原稿種別が文字原稿に設定されていない場合には、画像処理部3は、ユーザーによってジョブ実行指示において設定された原稿サイズ(あるいは、画像読取装置1で自動検出された原稿サイズ)が所定サイズ(ここでは、A4)を超えているか否かを判定する(ステップS6)。
【0045】
原稿サイズが所定サイズを超えている場合、画像処理部3は、次ページの解像度設定を、デフォルト解像度(デフォルト画質設定における解像度設定の値)より低い所定の解像度(例えば、デフォルト解像度の半分)とする(ステップS7)。
【0046】
また、原稿サイズが所定サイズを超えていない場合には、画像処理部3は、次ページのフィルター設定において、文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度に変換する処理のオン/オフ設定、および文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度に変換する処理のオン/オフ設定のうちの少なくとも1つ(ここでは、両方)をオンに設定する(ステップS8)。
【0047】
このようにして、次ページの文字認識用画像データについての画質設定を決定した後、画像処理部3は、決定した画質設定で次ページの文字認識用画像データを生成し、OCR処理部4は、その文字認識用画像データに対してOCR処理を実行する(ステップS9)。さらに、その後、最終ページまで、画像処理部3およびOCR処理部4は、同一の画質設定で、後続のページの文字認識用画像データを順番に生成し、その文字認識用画像データに対してOCR処理を実行する。
【0048】
以上のように、上記実施の形態によれば、画像処理部3は、原稿画像の1ページごとに文字認識用画像データを生成し、OCR処理部4は、画像処理部3により生成された文字認識用画像データに対してOCR処理を行う。そして、画像処理部3は、(a)ある画質設定であるページの文字認識用画像データを生成し、(b)あるページの文字認識用画像データに対するOCR処理の処理時間に基づいて、あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成するか否かを判定し、(c)あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成すると判定した場合、あるページの原稿種別および原稿サイズの少なくとも一方に基づいて次ページの画質設定を特定し、特定した画質設定で次ページの文字認識用画像データを生成する。
【0049】
これにより、1ページのOCR処理時間が長い場合、次ページの文字認識用画像データの画質設定を原稿種別および原稿サイズに応じて変更することで、文字認識率が低下しないようにしつつ短時間でOCR処理が行われる。
【0050】
なお、上述の実施の形態は、本発明の好適な例であるが、本発明は、これらに限定されるものではなく、本発明の要旨を逸脱しない範囲において、種々の変形、変更が可能である。
【0051】
例えば、上記実施の形態において、ステップS9において、画像処理部3およびOCR処理部4は、画質設定の変更後、所定のページ数の後続ページについて、文字認識用画像データの生成およびOCR処理を実行した後、画質設定をデフォルト画質設定に戻し、ステップS1から、文字認識用画像データの生成およびOCR処理を継続するようにしてもよい。
【産業上の利用可能性】
【0052】
本発明は、例えば、スキャナー、複合機などの画像形成装置に適用可能である。
【符号の説明】
【0053】
3 画像処理部
4 OCR処理部(文字認識処理部の一例)
図1
図2