特許5992956 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 京セラドキュメントソリューションズ株式会社の特許一覧

特許5992956画像処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5992956

(24)【登録日】2016年8月26日

(45)【発行日】2016年9月14日

(54)【発明の名称】画像処理装置

(51)【国際特許分類】

G06K 9/62 20060101AFI20160901BHJP

【ＦＩ】

G06K9/62 620Z

【請求項の数】2

【全頁数】8

(21)【出願番号】特願2014-109397(P2014-109397)

(22)【出願日】2014年5月27日

(65)【公開番号】特開2015-225459(P2015-225459A)

(43)【公開日】2015年12月14日

【審査請求日】2016年3月18日

【早期審査対象出願】

(73)【特許権者】

【識別番号】000006150

【氏名又は名称】京セラドキュメントソリューションズ株式会社

(74)【代理人】

【識別番号】100114971

【弁理士】

【氏名又は名称】青木修

(72)【発明者】

【氏名】木村新一

【審査官】 ▲広▼島明芳

(56)【参考文献】

【文献】特開２０１２−０７３７４９（ＪＰ，Ａ）

【文献】特開２０００−２０７３７６（ＪＰ，Ａ）

【文献】特開２０１３−１６１２６８（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｋ９／６２

(57)【特許請求の範囲】

【請求項1】

原稿画像の１ページごとに文字認識用画像データを生成する画像処理部と、
前記画像処理部により生成された前記文字認識用画像データに対して文字認識処理を行う文字認識処理部とを備え、
前記画像処理部は、（ａ）ある画質設定であるページの文字認識用画像データを生成し、（ｂ）前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間に基づいて、前記あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成するか否かを判定し、（ｃ）前記あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成すると判定した場合、前記あるページの原稿種別および原稿サイズの少なくとも一方に基づいて前記次ページの画質設定を特定し、特定した前記画質設定で前記次ページの文字認識用画像データを生成し、
前記画質設定は、カラー設定、階調数設定、解像度設定、およびフィルター設定の少なくとも１つを含み、
前記フィルター設定は、前記文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度に変換する処理のオン／オフ設定、および前記文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度に変換する処理のオン／オフ設定の少なくとも１つを含み、
前記画像処理部は、前記あるページのカラー設定および解像度設定をカラーおよびデフォルト解像度として前記あるページの文字認識用画像データを生成し、前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間が所定閾値以上である場合、前記あるページの原稿種別が文字原稿に設定されているときには、前記次ページのカラー設定をモノクロとし、前記あるページの原稿種別が文字原稿に設定されていないときには、前記あるページの原稿サイズが所定サイズを超えていれば、前記次ページの解像度設定を、前記デフォルト解像度より低い所定の解像度とすること、
を特徴とする画像処理装置。

【請求項2】

前記画像処理部は、前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間が所定閾値以上である場合、前記あるページの原稿種別が文字原稿に設定されておらず、かつ、前記あるページの原稿サイズが所定サイズを超えていないときには、前記次ページのフィルター設定において、前記文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度に変換する処理のオン／オフ設定、および前記文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度に変換する処理のオン／オフ設定のうちの少なくとも１つをオンに設定することを特徴とする請求項１記載の画像処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、画像処理装置に関するものである。

【背景技術】

【0002】

ある装置では、文字認識（ＯＣＲ：Optical Character Recognition）処理で、原稿画像内の文字を検出している（例えば特許文献１参照）。

【0003】

原稿画像内には、様々な言語で様々なサイズの文字が含まれている可能性があるため、文字認識率を高くするために、良好な画質の原稿画像に対してＯＣＲ処理を行うことが望ましい。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開平９−１１４９１８号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、原稿画像の画質を高くするほど、画像データのサイズが大きくなってしまい、ＯＣＲ処理時間が長くなってしまう。

【0006】

本発明は、上記の問題に鑑みてなされたものであり、必要に応じて、文字認識率が低下しないようにしつつ短時間でＯＣＲ処理を行う画像処理装置を得ることを目的とする。

【課題を解決するための手段】

【0007】

本発明に係る画像処理装置は、原稿画像の１ページごとに文字認識用画像データを生成する画像処理部と、前記画像処理部により生成された前記文字認識用画像データに対して文字認識処理を行う文字認識処理部とを備える。そして、前記画像処理部は、（ａ）ある画質設定であるページの文字認識用画像データを生成し、（ｂ）前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間に基づいて、前記あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成するか否かを判定し、（ｃ）前記あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成すると判定した場合、前記あるページの原稿種別および原稿サイズの少なくとも一方に基づいて前記次ページの画質設定を特定し、特定した前記画質設定で前記次ページの文字認識用画像データを生成する。前記画質設定は、カラー設定、階調数設定、解像度設定、およびフィルター設定の少なくとも１つを含み、前記フィルター設定は、前記文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度に変換する処理のオン／オフ設定、および前記文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度に変換する処理のオン／オフ設定の少なくとも１つを含む。そして、前記画像処理部は、前記あるページのカラー設定および解像度設定をカラーおよびデフォルト解像度として前記あるページの文字認識用画像データを生成し、前記あるページの文字認識用画像データに対する前記文字認識処理の処理時間が所定閾値以上である場合、前記あるページの原稿種別が文字原稿に設定されているときには、前記次ページのカラー設定をモノクロとし、前記あるページの原稿種別が文字原稿に設定されていないときには、前記あるページの原稿サイズが所定サイズを超えていれば、前記次ページの解像度設定を、前記デフォルト解像度より低い所定の解像度とする。

【発明の効果】

【0008】

本発明によれば、必要に応じて、文字認識率が低下しないようにしつつ短時間でＯＣＲ処理を行う画像処理装置を得ることができる。

【図面の簡単な説明】

【0009】

【図1】図１は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。

【図2】図２は、図１に示す画像処理装置の動作を説明するフローチャートである。

【発明を実施するための形態】

【0010】

以下、図に基づいて本発明の実施の形態を説明する。

【0011】

図１は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。

【0012】

図１に示す画像処理装置は、複合機であって、画像読取装置１、画像入力部２、画像処理部３、ＯＣＲ処理部４、表示部５、操作部６、印刷制御部７、印刷装置８、状態記憶部９、ファイル作成部１０、データ通信部１１、およびシステム制御部１２を備える。

【0013】

画像読取装置１は、原稿から原稿画像を光学的に読み取り、原稿画像の画像データを生成する。

【0014】

画像入力部２は、画像読取装置１により生成された原稿画像の画像データまたはデータ通信部１１により受信された原稿画像の画像データを取得する。

【0015】

画像処理部３は、画像入力部２により取得された原稿画像の画像データから、原稿画像の１ページごとに文字認識用画像データを生成する。画像処理部３は、各ページについての画質設定で文字認識用画像データを生成する。

【0016】

画像処理部３は、（ａ）ある画質設定で、あるページの文字認識用画像データを生成し、（ｂ）あるページの文字認識用画像データに対する、ＯＣＲ処理部４による文字認識処理（以下、ＯＣＲ処理という）の処理時間に基づいて、そのページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成するか否かを判定し、（ｃ）そのページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成すると判定した場合、そのページの原稿種別および原稿サイズの少なくとも一方に基づいて次ページの画質設定（つまり、ＯＣＲ処理時間が短くなるような画質設定）を特定し、特定した画質設定で次ページの文字認識用画像データを生成する。

【0017】

一般的に、ＯＣＲ処理の処理時間は、文字認識用画像データのデータサイズに依存するほか、原稿画像内のオブジェクト（文字、線画、罫線など）の数に依存する。そのため、計測される処理時間は、原稿画像の内容に応じて変化する。

【0018】

この実施の形態では、画質設定は、カラー設定、階調数設定、解像度設定、およびフィルター設定の少なくとも１つ（ここでは、すべて）を含む。

【0019】

カラー設定は、文字認識用画像データをモノクロまたはカラーに指定する。

【0020】

階調数設定は、文字認識用画像データの階調数を指定する。

【0021】

例えば、カラー設定および階調数設定によって、２５６階調のカラーで文字認識用画像データが生成されたり、２５６階調のグレイスケールで文字認識用画像データが生成されたり、２値化画像で文字認識用画像データが生成されたりする。

【0022】

フィルター設定は、文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度（ここでは０％）に変換する処理のオン／オフ設定、および文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度（ここでは１００％）に変換する処理のオン／オフ設定の少なくとも１つ（ここでは両方）を含む。

【0023】

例えば、文字認識用画像データが８ビットＲＧＢカラーデータである場合、上述のオン／オフ設定がオンにされるときには、色成分のすべてが所定濃度以下の濃度値である画素について、所定の最低濃度（Ｒ，Ｇ，Ｂ）＝（２５５，２５５，２５５）とされ、色成分のすべてが所定濃度以上の濃度値である画素について、所定の最低濃度（Ｒ，Ｇ，Ｂ）＝（０，０，０）とされる。

【0024】

なお、上述のオン／オフ設定がオンにされると、データサイズは減少しないものの、原稿画像のコントラストが高くなり、ＯＣＲ処理において文字認識が行いやすくなり、ＯＣＲ処理時間が短くなる。

【0025】

ＯＣＲ処理部４は、画像処理部３により生成された文字認識用画像データに対してＯＣＲ処理を行い、原稿画像内の文字を検出する。

【0026】

表示部５は、例えば液晶ディスプレイ、インジケーターなどを含み、当該画像処理装置の状態、ＯＣＲ処理の画質設定の変更などを表示する。操作部６は、例えばタッチパネル、ハードキーなどを含み、ユーザー操作を受け付け、電気信号として出力する。

【0027】

印刷制御部７は、印刷装置８を制御して原稿画像などの印刷を印刷装置８に実行させる。印刷装置８は、例えば電子写真方式で原稿画像を印刷用紙に印刷する。

【0028】

状態記憶部９は、当該画像処理装置の状態、各種設定などを記憶する記憶装置である。

【0029】

ファイル作成部１０は、原稿画像のラスターイメージデータと、ＯＣＲ処理部４の文字認識により得られたテキストとを含むファイルを作成する。例えば、ファイル作成部１０は、原稿画像のラスターイメージデータのレイヤーと、ＯＣＲ処理部４の文字認識により得られたテキストのレイヤーとを含むＰＤＦ（Portable Document Format）ファイルを作成する。

【0030】

データ通信部１１は、例えばネットワークインターフェイスなどであって、パーソナルコンピューターなどの端末装置とデータ通信し、原稿画像の画像データを端末装置から受信したり、ファイル作成部１０により作成されたファイルを所定のプロトコルで端末装置へ送信したりする。

【0031】

システム制御部１２は、画像読取装置１、画像入力部２、画像処理部３、ＯＣＲ処理部４、表示部５、操作部６、印刷制御部７、印刷装置８、状態記憶部９、ファイル作成部１０、およびデータ通信部１１を制御して各種ジョブを実行する。

【0032】

なお、上述の画像入力部２、画像処理部３、ＯＣＲ処理部４、印刷制御部７、ファイル作成部１０、およびシステム制御部１２は、所定のプログラムを実行するコンピューター、ＡＳＩＣ（Application Specific Integrated Circuit）などで実現される。

【0033】

次に、上記画像処理装置の動作について説明する。図２は、図１に示す画像処理装置の動作を説明するフローチャートである。

【0034】

システム制御部１２は、データ通信部１１を介して外部の端末装置から、または操作部６からユーザーによる所定のジョブ（例えば、スキャントゥセンド）の実行指示を受け付けると、そのジョブの一部として以下の処理を各部に実行させる。

【0035】

この実施の形態における画像処理装置では、ＯＣＲ処理の設定として、「手動（文字認識精度優先）」、「手動（文字認識速度優先）」、および「自動」の３つがある。「手動（文字認識精度優先）」の場合、データサイズの比較的大きい文字認識用画像データが使用され、ＯＣＲ処理時間は長くなる。「手動（文字認識速度優先）」の場合、データサイズの比較的小さい文字認識用画像データが使用され、ＯＣＲ処理時間は短くなる。「自動」の場合、以下のようにＯＣＲ処理が実行される。

【0036】

まず、画像処理部３は、原稿の第１ページの画像データから、デフォルトの画質設定で第１ページの文字認識用画像データを生成し、ＯＣＲ処理部４は、生成された文字認識用画像データに対してＯＣＲ処理を実行する（ステップＳ１）。

【0037】

なお、デフォルトの画質設定は、上述の「手動（文字認識精度優先）」の場合の画質設定と同一であり、例えば、２５６階調カラー、６００ｄｐｉ、およびフィルター設定すべてオフとされる。

【0038】

画像処理部３は、ＯＣＲ処理部４による第１ページについてのＯＣＲ処理の処理時間を計測し（ステップＳ１）、処理時間が所定の閾値以上であるか否かを判定する（ステップＳ２）。

【0039】

処理時間が所定の閾値以上ではない場合、画像処理部３は、ステップＳ１でＯＣＲ処理されたページが最終ページであるか否か（つまり、後続のページが存在するか否か）を判定する（ステップＳ３）。

【0040】

画像処理部３は、ステップＳ１でＯＣＲ処理されたページが最終ページではない場合、次のページに対して、デフォルト画質設定で、次の文字認識用画像データを生成し、ＯＣＲ処理部４は、生成された文字認識用画像データに対してＯＣＲ処理を実行する（ステップＳ１）。そして、画像処理部３は、ＯＣＲ処理部４によるそのページについてのＯＣＲ処理の処理時間を計測し（ステップＳ１）、処理時間が所定の閾値以上であるか否かを判定する（ステップＳ２）。

【0041】

このようにして、１ページ分のＯＣＲ処理の処理時間が所定の閾値以上とならなければ、各ページの文字認識用画像データがデフォルト画質設定で生成され、ＯＣＲ処理される。

【0042】

一方、あるページについてのＯＣＲ処理の処理時間が所定の閾値以上となった場合、画像処理部３は、次ページの文字認識用画像データについての画質設定を、ＯＣＲ処理時間が短くなるようにデフォルト画質設定とは異なる画質設定とする。

【0043】

具体的には、画像処理部３は、ユーザーによってジョブ実行指示において原稿種別が文字原稿に設定されているか否かを判定し（ステップＳ４）、原稿種別が文字原稿に設定されている場合、次ページのカラー設定をモノクロとする（ステップＳ５）。なお、次ページのカラー設定をモノクロとする場合、次ページの階調数設定を、上述のあるページの階調数設定から変更しないようにしてもよいし、上述の処理時間に応じて階調数を設定するようにしてもよい。例えば、上述の処理時間が所定の閾値以上である場合、階調数設定を変更せず、上述の処理時間が所定の閾値未満の場合、階調数設定を２（つまりモノクロ２値）とするようにしてもよい。

【0044】

一方、原稿種別が文字原稿に設定されていない場合には、画像処理部３は、ユーザーによってジョブ実行指示において設定された原稿サイズ（あるいは、画像読取装置１で自動検出された原稿サイズ）が所定サイズ（ここでは、Ａ４）を超えているか否かを判定する（ステップＳ６）。

【0045】

原稿サイズが所定サイズを超えている場合、画像処理部３は、次ページの解像度設定を、デフォルト解像度（デフォルト画質設定における解像度設定の値）より低い所定の解像度（例えば、デフォルト解像度の半分）とする（ステップＳ７）。

【0046】

また、原稿サイズが所定サイズを超えていない場合には、画像処理部３は、次ページのフィルター設定において、文字認識用画像データ内の所定濃度以下の濃度値を所定の最低濃度に変換する処理のオン／オフ設定、および文字認識用画像データ内の所定濃度以上の濃度値を所定の最高濃度に変換する処理のオン／オフ設定のうちの少なくとも１つ（ここでは、両方）をオンに設定する（ステップＳ８）。

【0047】

このようにして、次ページの文字認識用画像データについての画質設定を決定した後、画像処理部３は、決定した画質設定で次ページの文字認識用画像データを生成し、ＯＣＲ処理部４は、その文字認識用画像データに対してＯＣＲ処理を実行する（ステップＳ９）。さらに、その後、最終ページまで、画像処理部３およびＯＣＲ処理部４は、同一の画質設定で、後続のページの文字認識用画像データを順番に生成し、その文字認識用画像データに対してＯＣＲ処理を実行する。

【0048】

以上のように、上記実施の形態によれば、画像処理部３は、原稿画像の１ページごとに文字認識用画像データを生成し、ＯＣＲ処理部４は、画像処理部３により生成された文字認識用画像データに対してＯＣＲ処理を行う。そして、画像処理部３は、（ａ）ある画質設定であるページの文字認識用画像データを生成し、（ｂ）あるページの文字認識用画像データに対するＯＣＲ処理の処理時間に基づいて、あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成するか否かを判定し、（ｃ）あるページの画質設定とは異なる画質設定で次ページの文字認識用画像データを生成すると判定した場合、あるページの原稿種別および原稿サイズの少なくとも一方に基づいて次ページの画質設定を特定し、特定した画質設定で次ページの文字認識用画像データを生成する。

【0049】

これにより、１ページのＯＣＲ処理時間が長い場合、次ページの文字認識用画像データの画質設定を原稿種別および原稿サイズに応じて変更することで、文字認識率が低下しないようにしつつ短時間でＯＣＲ処理が行われる。

【0050】

なお、上述の実施の形態は、本発明の好適な例であるが、本発明は、これらに限定されるものではなく、本発明の要旨を逸脱しない範囲において、種々の変形、変更が可能である。

【0051】

例えば、上記実施の形態において、ステップＳ９において、画像処理部３およびＯＣＲ処理部４は、画質設定の変更後、所定のページ数の後続ページについて、文字認識用画像データの生成およびＯＣＲ処理を実行した後、画質設定をデフォルト画質設定に戻し、ステップＳ１から、文字認識用画像データの生成およびＯＣＲ処理を継続するようにしてもよい。

【産業上の利用可能性】

【0052】

本発明は、例えば、スキャナー、複合機などの画像形成装置に適用可能である。

【符号の説明】

【0053】

３画像処理部
４ＯＣＲ処理部（文字認識処理部の一例）

【図1】

【図2】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第5992956号(P5992956)IP Force 特許公報掲載プロジェクト 2022.1.31 β版