IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

<>
  • 特許-画像処理装置及び画像処理プログラム 図1
  • 特許-画像処理装置及び画像処理プログラム 図2
  • 特許-画像処理装置及び画像処理プログラム 図3
  • 特許-画像処理装置及び画像処理プログラム 図4
  • 特許-画像処理装置及び画像処理プログラム 図5
  • 特許-画像処理装置及び画像処理プログラム 図6
  • 特許-画像処理装置及び画像処理プログラム 図7
  • 特許-画像処理装置及び画像処理プログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-27
(45)【発行日】2024-06-04
(54)【発明の名称】画像処理装置及び画像処理プログラム
(51)【国際特許分類】
   H04N 1/387 20060101AFI20240528BHJP
   H04N 1/00 20060101ALI20240528BHJP
   G06T 5/50 20060101ALI20240528BHJP
【FI】
H04N1/387
H04N1/00 127B
G06T5/50
【請求項の数】 6
(21)【出願番号】P 2020101842
(22)【出願日】2020-06-11
(65)【公開番号】P2021197600
(43)【公開日】2021-12-27
【審査請求日】2023-04-12
(73)【特許権者】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】110000442
【氏名又は名称】弁理士法人武和国際特許事務所
(74)【代理人】
【識別番号】100186853
【弁理士】
【氏名又は名称】宗像 孝志
(72)【発明者】
【氏名】吉水 直史
(72)【発明者】
【氏名】藤井 正幸
(72)【発明者】
【氏名】山▲崎▼ 敦司
(72)【発明者】
【氏名】▲柳▼ 裕之
【審査官】橋爪 正樹
(56)【参考文献】
【文献】特開2019-212950(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 1/38- 1/393
H04N 1/00
G06T 5/50
G06T 11/60-11/80
(57)【特許請求の範囲】
【請求項1】
画像を表示するディスプレイと、
オペレータからの入力操作を受け付ける入力部と、
外部装置と通信する通信インタフェースと、
コントローラとを備え、
前記コントローラは、
入力画像データに画像処理を施して出力画像データを生成し、
前記出力画像データで示される出力画像を前記ディスプレイに表示させ、
前記出力画像データの送信許可が前記入力部に入力された場合に、前記通信インタフェースを通じて前記出力画像データを外部装置に送信し、
前記出力画像データの送信拒否が前記入力部に入力された場合に、
前記入力画像データ及び前記出力画像データそれぞれに含まれる文字を抽出し、
前記入力画像データで示される入力画像のうち、前記入力画像データ及び前記出力画像データそれぞれから抽出した文字の認識結果が異なる誤認識領域の画像を切り抜いて、切抜画像データを生成し、
前記切抜画像データで示される切抜画像を、前記出力画像の前記誤認識領域に合成し、
前記切抜画像を合成後の前記出力画像を示す前記出力画像データを、前記通信インタフェースを通じて外部装置に送信することを特徴とする画像処理装置。
【請求項2】
前記コントローラは、前記画像処理として、第1解像度の前記入力画像データを圧縮して、前記第1解像度より低い第2解像度の前記出力画像データを生成することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記コントローラは、
前記切抜画像データを前記第1解像度から前記第2解像度に圧縮し、
地色及び文字の境界であるエッジの位置の最小画素値が地色の位置の最大画素値より大きくなるまで、前記エッジを強調するフィルタ処理を、前記第2解像度の前記切抜画像データに対して繰り返し実行し、
前記最小画素値より小さくなった前記最大画素値を2値化閾値として、前記切抜画像データを2値化し、
2値化後の前記切抜画像データで示される前記切抜画像を、前記出力画像の前記誤認識領域に合成することを特徴とすることを特徴とする請求項2に記載の画像処理装置。
【請求項4】
前記コントローラは、
前記入力画像データ及び前記出力画像データそれぞれに対して、地色及び文字の境界であるエッジを強調するフィルタ処理を実行し、
前記フィルタ処理後の前記入力画像データ及び前記出力画像データそれぞれを2値化し、
2値化後の前記入力画像データ及び前記出力画像データそれぞれに含まれる文字を抽出することを特徴とする請求項1または2に記載の画像処理装置。
【請求項5】
原稿に記録された画像を読み取って前記入力画像データを生成するスキャナ部を備え、
前記コントローラは、前記スキャナ部が生成した前記入力画像データに前記画像処理を施して、前記出力画像データを生成することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
【請求項6】
画像を表示するディスプレイと、
オペレータからの入力操作を受け付ける入力部と、
外部装置と通信する通信インタフェースとに接続されたコンピュータによって実行される画像処理プログラムであって、
入力画像データに画像処理を施して出力画像データを生成し、
前記出力画像データで示される出力画像を前記ディスプレイに表示させ、
前記出力画像データの送信許可が前記入力部に入力された場合に、前記通信インタフェースを通じて前記出力画像データを外部装置に送信し、
前記出力画像データの送信拒否が前記入力部に入力された場合に、
前記入力画像データ及び前記出力画像データそれぞれに含まれる文字文字を抽出し、
前記入力画像データで示される入力画像のうち、前記入力画像データ及び前記出力画像データそれぞれから抽出した文字の認識結果が異なる誤認識領域の画像を切り抜いて、切抜画像データを生成し、
前記切抜画像データで示される切抜画像を、前記出力画像の前記誤認識領域に合成し、
前記切抜画像を合成後の前記出力画像を示す前記出力画像データを、前記通信インタフェースを通じて外部装置に送信する処理を、前記コンピュータに実行させることを特徴とする画像処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及び画像処理プログラムに関する。
【背景技術】
【0002】
従来より、媒体に画像を記録するプリンタ部、原稿に記録された画像を読み取って画像データを生成するスキャナ部、外部装置に画像データをFAX送信するFAX部などを備えた複合機が知られている。このような複合機は、スキャナ部が生成した画像データを送信先装置の能力に合わせて画像処理(圧縮)し、画像処理後の画像データを送信先装置に送信する処理を実行することができる。
【0003】
上記の処理を実行可能な複合機のなかには、画像処理後の画像データで示される画像データをディスプレイにプレビュー表示し、オペレータに画質を確認させてから送信する機能を有するものがある(例えば、特許文献1を参照)。
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記構成の複合機によれば、画質が過度に劣化した画像データの送信を停止させることはできるものの、オペレータが画質の調整をして再びスキャナ部に原稿を読み取らせる必要がある。そのため、オペレータの操作負担が大きいという課題がある。
【0005】
本発明は、このような課題を解決するためになされたものであり、オペレータの操作負担を増加させることなく、画像処理後の画像データの画質を適切に調整して送信することが可能な画像処理装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、画像処理装置は、画像を表示するディスプレイと、オペレータからの入力操作を受け付ける入力部と、外部装置と通信する通信インタフェースと、コントローラとを備え、前記コントローラは、入力画像データに画像処理を施して出力画像データを生成し、前記出力画像データで示される出力画像を前記ディスプレイに表示させ、前記出力画像データの送信許可が前記入力部に入力された場合に、前記通信インタフェースを通じて前記出力画像データを外部装置に送信し、前記出力画像データの送信拒否が前記入力部に入力された場合に、前記入力画像データ及び前記出力画像データそれぞれに含まれる文字を抽出し、前記入力画像データで示される入力画像のうち、前記入力画像データ及び前記出力画像データそれぞれから抽出した文字の認識結果が異なる誤認識領域の画像を切り抜いて、切抜画像データを生成し、前記切抜画像データで示される切抜画像を、前記出力画像の前記誤認識領域に合成し、前記切抜画像を合成後の前記出力画像を示す前記出力画像データを、前記通信インタフェースを通じて外部装置に送信することを特徴とする。
【発明の効果】
【0007】
本発明によれば、オペレータの操作負担を増加させることなく、画像処理後の画像データの画質を適切に調整して送信することができる。
【図面の簡単な説明】
【0008】
図1】画像処理システムの概略図。
図2】MFPのハードウェア構成図。
図3】MFPの機能ブロック図。
図4】画像データ送信処理のフローチャート。
図5】(A)はFAX送信画面、(B)はプレビュー画面。
図6】画質調整処理のフローチャート。
図7】(A)は読取画像データに対するOCR処理の結果、(B)は圧縮画像データに対するOCR処理の結果。
図8】2値化処理部の処理を説明するための図。
【発明を実施するための形態】
【0009】
以下、図面を参照して、本発明の実施形態について説明する。図1は、画像処理システム1の概略図である。画像処理システム1は、通信ネットワーク2を通じて接続された複数の装置間において、画像データを送受信するシステムである。図1に示すように、画像処理システム1では、複数のMFP100A、100B、100C(以下、これらを参照して、「MFP100」と表記することがある。)と、PC110とが、通信ネットワーク2を介して接続されている。
【0010】
MFP100(MFP:Multifunction Peripheral/Product/Printer)は、媒体に画像を記録するプリンタ機能、原稿に記録された画像を読み取って画像データを生成するスキャナ機能、外部装置に画像データをFAX送信するFAX機能などを備えた画像処理装置の一例である。PC110は、画像データを編集する機能を有すると共に、通信ネットワーク2を通じて画像データを送受信可能に構成された画像処理装置の他の例である。さらに、画像処理システム1には、画像処理装置の他の例であるタブレット端末やスマートフォン等が接続されてもよい。
【0011】
また、MFP100A、100B、100Cには、通信ネットワーク2上で当該装置を一意に識別する宛先情報(例えば、FAX番号、IPアドレス等)が割り当てられている。本実施形態では、MFP100Aの宛先情報を“xx-xxxx-xxxx”とし、MFP100Bの宛先情報を“yy-yyyy-yyyy”とし、MFP100Cの宛先情報を“zz-zzzz-zzzz”とする。また図示は省略するが、PC110にも宛先情報が割り当てられる。
【0012】
また、MFP100A、100B、100Cは、処理能力(例えば、用紙サイズ、解像度、色)が互いに異なっていてもよい。用紙サイズとは、例えば、スキャナ部231で読取可能な原稿のサイズ、及びプリンタ部232で画像を形成可能な媒体のサイズを指す。解像度とは、例えば、スキャナ部231で生成可能な画像データの解像度、及びプリンタ部232で形成可能な画像データの解像度を指す。色とは、例えば、スキャナ部231で読取可能な色、及びプリンタ部232で媒体に形成可能な色を指す。
【0013】
本実施形態では、MFP100A、100Cは、用紙サイズ“A3”、“A4”、“A5”、解像度“600dpi”、“400dpi”、“300dpi”、色“カラー”、“モノクロ”に対応する。MFP100Bは、最大の用紙サイズ“A4”、“A5”、最大の解像度“400dpi”、“300dpi”、色“モノクロ”に対応する。そして、MFP100A、100B、100Cは、ITU-T勧告、T.30勧告に基づき、NSFやDISによって、処理能力を示す能力情報を相互に交換(送受信)することができる。
【0014】
通信ネットワーク2は、インターネット、公衆電話回線、LANなどの一部または全部によって構成されている。また、通信ネットワーク2は、有線通信のみならず、無線通信に対応していてもよい。そして、通信ネットワーク2に接続された装置100A、100B、100C、110は、HTTP、FTP、FAXプロトコルなど、様々なプロトコルに準拠した方法で通信することができる。
【0015】
図2は、MFP100のハードウェア構成図である。図2に示されているように、MFP100は、コントローラ210、近距離通信I/F220、エンジン制御部230、操作パネル240(入力部)、ネットワークI/F250(通信インタフェース)を備えている。
【0016】
これらのうち、コントローラ210は、コンピュータの主要部であるCPU201、システムメモリ(MEM-P)202、ノースブリッジ(NB)203、サウスブリッジ(SB)204、ASIC(Application Specific Integrated Circuit)206、記憶部であるローカルメモリ(MEM-C)207、HDDコントローラ208、及び、記憶部であるHD209を有し、NB203とASIC206との間をAGP(Accelerated Graphics Port)バス221で接続した構成となっている。
【0017】
これらのうち、CPU201は、MFP100の全体制御を行う制御部である。NB203は、CPU201と、MEM-P202、SB204、及びAGPバス221とを接続するためのブリッジであり、MEM-P202に対する読み書きなどを制御するメモリコントローラと、PCI(Peripheral Component Interconnect)マスタ及びAGPターゲットとを有する。
【0018】
MEM-P202は、コントローラ210の各機能を実現させるプログラムやデータの格納用メモリであるROM202a、プログラムやデータの展開、及びメモリ印刷時の描画用メモリなどとして用いるRAM202bとからなる。なお、RAM202bに記憶されているプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、CD-R、DVD等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
【0019】
SB204は、NB203とPCIデバイス、周辺デバイスとを接続するためのブリッジである。ASIC206は、画像処理用のハードウェア要素を有する画像処理用途向けのIC(Integrated Circuit)であり、AGPバス221、PCIバス222、HDDコントローラ208およびMEM-C207をそれぞれ接続するブリッジの役割を有する。このASIC206は、PCIターゲットおよびAGPマスタ、ASIC206の中核をなすアービタ(ARB)、MEM-C207を制御するメモリコントローラ、ハードウェアロジックなどにより画像データの回転などを行う複数のDMAC(Direct Memory Access Controller)、並びに、スキャナ部231、プリンタ部232、及びFAX部233との間でPCIバス222を介したデータ転送を行うPCIユニットとからなる。なお、ASIC206には、USB(Universal Serial Bus)のインタフェースや、IEEE1394(Institute of Electrical and Electronics Engineers 1394)のインタフェースを接続するようにしてもよい。
【0020】
MEM-C207は、コピー用画像バッファ及び符号バッファとして用いるローカルメモリである。HD209は、画像データの蓄積、印刷時に用いるフォントデータの蓄積、フォームの蓄積を行うためのストレージである。HD209は、CPU201の制御にしたがってHD209に対するデータの読出又は書込を制御する。AGPバス221は、グラフィック処理を高速化するために提案されたグラフィックスアクセラレータカード用のバスインタフェースであり、MEM-P202に高スループットで直接アクセスすることにより、グラフィックスアクセラレータカードを高速にすることができる。
【0021】
また、近距離通信I/F220には、近距離通信回路220aが備わっている。近距離通信回路220aは、NFC、Bluetooth(登録商標)等の通信回路である。
【0022】
また、エンジン制御部230には、スキャナ部231、プリンタ部232、及びFAX部233が接続されている。スキャナ部231は、コンタクトガラスまたはADF(Auto Document Feeder:自動原稿送り装置)にセットされた原稿を読み取って、画像データを生成する。プリンタ部232は、指定された画像データで示される画像を媒体(例えば、用紙、OHPシート)に形成する。FAX部233は、FAXプロトコルに準拠して、外部装置との間で画像データを送受信する。
【0023】
また、操作パネル240は、現在の設定値や選択画面等を表示させ、操作者からの入力を受け付けるタッチパネル等のパネル表示部240a(ディスプレイ)、並びに、濃度の設定条件などの画像形成に関する条件の設定値を受け付けるテンキー及びコピー開始指示を受け付けるスタートキー等からなる操作パネル240bを備えている。コントローラ210は、MFP100全体の制御を行い、例えば、描画、通信、操作パネル240からの入力等を制御する。
【0024】
なお、MFP100は、操作パネル240のアプリケーション切り替えキーにより、ドキュメントボックス機能、コピー機能、プリンタ機能、およびファクシミリ機能を順次に切り替えて選択することが可能となる。ドキュメントボックス機能の選択時にはドキュメントボックスモードとなり、コピー機能の選択時にはコピーモードとなり、プリンタ機能の選択時にはプリンタモードとなり、ファクシミリモードの選択時にはファクシミリモードとなる。
【0025】
また、ネットワークI/F250は、通信ネットワーク2を利用してデータ通信をするためのインタフェースである。近距離通信I/F220及びネットワークI/F250は、PCIバス222を介して、ASIC206に電気的に接続されている。
【0026】
次に、図3図5を参照して、コントローラ210が実行する処理を説明する。図3は、MFP100の機能ブロック図である。図4は、画像データ送信処理のフローチャートである。図5は、画像データ送信処理でパネル表示部240aに表示される画面例であって、(A)はFAX送信画面を、(B)はプレビュー画面を示す。
【0027】
図3に示すように、MFP100は、スキャン処理部310、画像圧縮部(画像処理部)320、プレビュー処理部330、FAX送信部340、及び画質調整部350を備える。また、画質調整部350は、OCR処理部351、画像切抜部352、2値化処理部353、及び画像合成部354を備える。図3に示す各機能ブロック310~354は、コントローラ210内のCPU301が、HD209に記憶されている画像処理プログラムをRAM202bに展開し、演算実行することで実現される機能部である。
【0028】
図3に示す画像データ送信処理は、例えば、操作パネル240を通じてFAX部233が起動されたことによって開始される。以下、MFP100Aのコントローラ210が画像データ送信処理を実行する例を説明する。但し、画像データ送信処理は、MFP100B、100C或いはPC110によって実行されてもよい。
【0029】
まず、スキャン処理部310は、図5(A)に示すFAX送信画面を、パネル表示部240aに表示させる(S401)。FAX送信画面は、FAX送信の条件(例えば、宛先情報、原稿の読取条件など)をオペレータに指定させるための画面である。但し、FAX送信画面のレイアウトは、図5(A)に限定されない。
【0030】
図5(A)に示すように、FAX送信画面は、宛先情報の入力を受け付けるテキストボックス511と、原稿サイズ、読取解像度R(第1解像度)、及び読取色の選択を受け付けるプルダウンメニュー512、513、514と、[実行]ボタン515とを含む。プルダウンメニュー512、513、514には、MFP100の能力情報に対応する複数の選択肢が設定される。
【0031】
そして、スキャン処理部310は、操作パネル240を通じて、テキストボックス511に宛先が入力され、プルダウンメニュー512~514で読取条件が設定され、[実行]ボタン515が押下されるまで(S402:No)、ステップS403以降の処理の実行を待機する。本実施形態では、図5(A)に示すように、テキストボックス511に宛先情報“yy-yyyy-yyyy”が入力され、プルダウンメニュー512、513、514で原稿サイズ“A4”、読取解像度R“600dpi”、読取色“モノクロ”が選択されたものとして、以下の処理を説明する。
【0032】
次に、スキャン処理部310は、[実行]ボタン515が押下された場合に(S402:Yes)、プルダウンメニューで指定された読取条件に従って、コンタクトガラス或いはADFにセットされた原稿を、スキャナ部231に読み取らせる(S403)。すなわち、スキャナ部231は、A4サイズの原稿に記録された画像を読み取って、解像度が600dpiでモノクロの読取画像データ(入力画像データ)を生成し、生成した読取画像データをHD209に保存する。そして、スキャン処理部310は、画像圧縮部320に制御を引き継ぐ(S404)。
【0033】
次に、スキャン処理部310から制御を引き継いだ画像圧縮部320は、テキストボックス511に入力された宛先情報“yy-yyyy-yyyy”で特定されるMFP100Bから、ネットワークI/F250を通じて能力情報を取得する(S404)。以下、MFP100Bの能力情報に含まれる解像度のうち、最大の解像度“400dpi”を、「宛先解像度R(第2解像度)」と表記する。そして、画像圧縮部320は、読取解像度Rと宛先解像度Rとを比較する(S405)。
【0034】
画像圧縮部320は、読取解像度Rが宛先解像度Rより大きい場合に(S405:Yes)、読取解像度Rの読取画像データを圧縮して宛先解像度Rの圧縮画像データ(入力画像データ)を生成し、生成した圧縮画像データをHD209に保存する(S406)。すなわち、圧縮画像データは、読取画像データより解像度の低い画像データである。画像データの圧縮には、周知の技術を用いることができる。以下、読取画像データで示される画像を「読取画像(入力画像)」と表記し、圧縮画像データで示される画像を「圧縮画像(出力画像)」と表記する。
【0035】
そして、画像圧縮部320は、プレビュー処理部330に制御を引き継ぐ(S407)。一方、画像圧縮部320は、読取解像度Rが宛先解像度R以下の場合に(S405:No)、ステップS407~S409の処理をスキップして、FAX送信部340に制御を引き継ぐ(S410)。
【0036】
次に、画像圧縮部320から制御を引き継いだプレビュー処理部330は、図5(B)に示すプレビュー画面を、パネル表示部240aに表示させる(S407)。プレビュー画面は、圧縮画像データで示される圧縮画像を、オペレータに確認させるための画面である。但し、プレビュー画面のレイアウトは、図5(B)の例に限定されない。
【0037】
図5(B)に示すように、プレビュー画面は、圧縮画像を表示するプレビュー領域521と、[+拡大]ボタン522と、[-縮小]ボタン523と、[送信]ボタン524と、[調整]ボタン525とを含む。[+拡大]ボタン522は、プレビュー領域521上での圧縮画像の拡大表示を指示するボタンである。[-縮小]ボタン523は、プレビュー領域521上での圧縮画像の縮小表示を指示するボタンである。[送信]ボタン524は、圧縮画像データの送信を許可するボタンである。[調整]ボタン525は、圧縮画像データの送信を拒否(換言すれば、圧縮画像データの調整を指示)するボタンである。
【0038】
そして、プレビュー処理部330は、操作パネル240を通じて、[送信]ボタン524及び[調整]ボタン525のいずれかが押下されるまで(S408)、ステップS409以降の処理の実行を待機する。また、プレビュー処理部330は、[+拡大]ボタン522が押下された場合に、プレビュー領域521上での圧縮画像の倍率を上昇させ、[-縮小]ボタン523が押下された場合に、プレビュー領域521上での圧縮画像の倍率を減少させる。
【0039】
オペレータは、必要に応じて[+拡大]ボタン522及び[-縮小]ボタン523を押下しながら、プレビュー領域521に表示された圧縮画像の画質を確認する。そして、オペレータは、圧縮画像の画質に問題がなければ(例えば、圧縮画像に含まれる文字が判別できれば)、[送信]ボタン524を押下する。一方、オペレータは、圧縮画像の画質に問題があれば(例えば、圧縮画像に判別しにくい文字が含まれていれば)、[調整]ボタン525を押下する。
【0040】
そして、プレビュー処理部330は、[調整]ボタン525が押下(すなわち、圧縮画像データの送信拒否が入力)された場合に(S408:調整)、画質調整部350に制御を引き継ぐ(S409)。一方、プレビュー処理部330は、[送信]ボタン524が押下(すなわち、圧縮画像データの送信許可が入力)された場合に(S408:送信)、FAX送信部340に制御を引き継ぐ(S410)。
【0041】
プレビュー処理部330から制御を引き継いだFAX送信部340は、FAX部233を制御することによって、HD209に保存されている圧縮画像データを、宛先情報“yy-yyyy-yyyy”で特定されるMFP100Bに、ネットワークI/F250を通じてFAX送信する(S410)。また、画像圧縮部320から制御を引き継いだFAX送信部340は、FAX部233を制御することによって、HD209に保存されている読取画像データを、宛先情報“yy-yyyy-yyyy”で特定されるMFP100Bに、ネットワークI/F250を通じてFAX送信する(S410)。なお、「FAX送信」とは、FAXプロトコルに準拠した手順で画像データを送信することを指す。
【0042】
また、プレビュー処理部330から制御を引き継いだ画質調整部350は、画質調整処理(S409)を実行する。図6は、画質調整処理のフローチャートである。図7は、(A)は読取画像データに対するOCR処理の結果を示し、(B)は圧縮画像データに対するOCR処理の結果を示す。図8は、2値化処理部353の処理を説明するための図である。画質調整処理は、HD209に保存された圧縮画像データの画質を調整する処理である。
【0043】
まず、画質調整部350のOCR処理部351は、HD209に保存された読取画像データ及び圧縮画像データそれぞれに対して、フィルタ処理、2値化処理、及びOCR処理を実行する(S601)。そして、画質調整部350は、処理結果をHD209に保存して、画像切抜部352に制御を引き継ぐ(S602)。
【0044】
より詳細には、OCR処理部351は、読取画像データ及び圧縮画像データそれぞれに対して、エッジを強調するフィルタ処理を実行する。エッジとは、画像データで示される画像に含まれる地色及び文字の境界を指す。エッジを強調するフィルタ処理の具体例としては、例えば、ラプラシアンフィルタ等が挙げられる。
【0045】
次に、OCR処理部351は、フィルタ処理後の読取画像データ及び圧縮画像データそれぞれを2値化する。2値化とは、各画像データを構成する複数の画素値のうち、画素値が2値化閾値以上の画素に画素値“1”を設定し、画素値が2値化閾値未満の画素に画素値“0”を設定する処理である。これにより、各画像データで示される画像のうち、文字を構成する画素に画素値“1”が設定され、地色を構成する画素に画素値“0”が設定される。2値化閾値は、予め定められた固定値でもよいし、画像データの特性に合わせた可変値でもよい。
【0046】
次に、OCR処理部351は、2値化処理後の読取画像データ及び圧縮画像データそれぞれに対して、OCR処理を実行する。OCR処理は、各画像に含まれる文字を抽出する処理である。より詳細には、OCR処理は、各画像に含まれる文字画像に対応する文字コード(例えば、ASCII、Unicode等)を抽出する処理である。
【0047】
OCR処理は、例えば、周知のOCRエンジンによって実現されるが、例えば以下の手順で処理を行う。まず、OCR処理部351は、画像から抽出した文字画像を所定の大きさに正規化し、特徴(方向成分)を抽出する。次に、OCR処理部351は、文字画像から抽出した特徴と、予め用意された標準パターンとをマッチングする。そして、OCR処理部351は、特徴の一致度が最も高い標準パターンに対応付けられた文字コードを、文字画像に対応する文字コードとして抽出する。但し、OCR処理の具体的な処理方法は、前述の例に限定されない。
【0048】
次に、OCR処理部351から処理を引き継いだ画像切抜部352は、読取画像及び圧縮画像の対応する領域から抽出した文字(文字コード)同士を比較する。そして、OCR処理部351は、対応する領域から抽出した文字の認識結果が異なる誤認識領域を特定する(S602)。図7の例では、読取画像及び圧縮画像の対応する領域のうち、読取画像から抽出された文字“c”(図7(A))と、圧縮画像から抽出された文字“o”(図7(B))との認識結果が異なる。
【0049】
次に、画像切抜部352は、読取画像から誤認識領域の画像を切り抜いて、切抜画像データを生成する。本実施形態では、図8に示すように、図7(A)の文字“c”を囲む矩形の画像が切り抜かれる。また、画像切抜部352は、生成した切抜画像データを読取解像度Rから宛先解像度Rに圧縮して、圧縮後の切抜画像データをHD209に保存する(S603)。すなわち、画像切抜部352は、ステップS603において、入力画像データから出力画像データを生成するための画像処理を、切抜画像データに施す。以下、切抜画像データで示される画像を、「切抜画像」と表記する。そして、画像切抜部352は、2値化処理部353に制御を引き継ぐ。
【0050】
次に、画像切抜部352から制御を引き継いだ2値化処理部353は、宛先解像度Rに圧縮後の切抜画像データに対してフィルタ処理(第1フィルタ処理)を実行する(S604)。ステップS604におけるフィルタ処理は、切抜画像のエッジを強調する処理であって、具体的な方法はステップS601と同様でよい。
【0051】
次に、2値化処理部353は、フィルタ処理後の切抜画像データから、エッジ画素の最小画素値Pminと、非エッジ画素の最大画素値Pmaxとを抽出する(S605)。エッジ画素とは、切抜画像内のエッジを構成する画素であって、図8の画素1-D、1-E、2-B、2-C、2-E、3-C、3-D等の画素を指す。非エッジ画素とは、切抜画像内の地色を構成する画素であって、図8の前述した画素以外の画素を指す。
【0052】
そして、最小画素値Pminは、切抜画像のエッジを構成する複数のエッジ画素のうち、最も地色に近い画素(例えば、画素2-B)の画素値を指す。一方、非エッジ画素の画素値は、原稿に付着した埃や読み取り時のノイズ等によってバラツキがある。そのため、最大画素値Pmaxは、切抜画像の地色を構成する複数の非エッジ画素のうち、地色以外の成分が最も多い画素の画素値を指す。
【0053】
次に、2値化処理部353は、エッジ画素の最小画素値Pminと非エッジ画素の最大画素値Pmaxとを比較する(S606)。そして、2値化処理部353は、最小画素値Pminが最大画素値Pmaxより大きい場合に(S606:Yes)、最大画素値Pmaxを2値化閾値として、切抜画像データに対して2値化処理を実行する(S607)。
【0054】
一方、2値化処理部353は、最小画素値Pminが最大画素値Pmax以下の場合に(S606:No)、切抜画像データに対して第2フィルタ処理を実行する(S604)。そして、2値化処理部353は、最小画素値Pminが最大画素値Pmaxより大きくなるまで(S606:No)、ステップS604~S606の処理を繰り返し実行する。
【0055】
なお、2値化処理部353は、N(Nは2以上の整数)回目のステップS604において、(N-1)回目のステップS604よりエッジをさらに強調するフィルタ処理(第Nフィルタ処理)を実行する。エッジをさらに強調する具体的な方法としては、例えば、第Nフィルタ処理と第(N-1)フィルタ処理とで、ラプラシアンフィルタのパラメータを変更してもよいし、異なるアルゴリズムのフィルタ処理を実行してもよい。
【0056】
なお、ステップS607における2値化処理は、ステップS601と同様でよい。これにより、切抜画像のうち、文字を構成する画素に画素値“1”が設定され、地色を構成する画素に画素値“0”が設定される。次に、2値化処理部353は、2値化処理後の切抜画像データをHD209に保存する。そして、2値化処理部353は、画像合成部354に制御を引き継ぐ(S608)。
【0057】
次に、2値化処理部353から制御を引き継いだ画像合成部354は、2値化後の圧縮画像データで示される圧縮画像の誤認識領域に、2値化後の切抜画像データで示される切抜画像を合成する(S608)。本実施形態では、図7(B)の文字“o”を囲む矩形の画像が、図8の文字“c”を囲む矩形の画像に置換される。次に、画像合成部354は、切抜画像を合成後の圧縮画像を示す圧縮画像データで、HD209に保存された圧縮画像データを上書きする。そして、画像合成部354は、プレビュー処理部330に制御を引き継ぐ(S407)。
【0058】
次に図4に戻って、画像合成部354から制御を引き継いだプレビュー処理部330は、画質調整処理で画質が調整された圧縮画像データを用いて、ステップS407以降の処理を実行する。すなわち、コントローラ210は、オペレータが[送信]ボタン524を押下するまで、ステップS407~S409の処理を繰り返し実行する。そして、オペレータが[送信]ボタン524を押下すると(S408:送信)、FAX送信部340は、HD209に保存された(すなわち、画質が調整された)圧縮画像データを、MFP100Bに対してFAX部233にFAX送信させる(S410)。
【0059】
上記の実施形態によれば、例えば以下の作用効果を奏する。
【0060】
上記の実施形態によれば、オペレータがプレビュー画面を見て文字が判別できないと判断した場合に(S408:調整)、画質調整処理(S409)を実行するので、オペレータの操作負担を増加させることなく、圧縮画像データの画質を適切に調整して送信することができる。なお、上記の実施形態では、画質調整処理(S409)の後に、プレビュー画面を再び表示する(S407)例を説明したが、画質調整処理の後に直接ステップS410を実行してもよい。
【0061】
また、上記の実施形態によれば、読取画像データ及び圧縮画像データそれぞれから抽出した文字の認識結果が異なる誤認識領域に切抜画像を合成するので、文字が潰れて判別しにくい部分の画質を選択的に調整することができる。このように、本発明は、文字が主体の原稿(文書原稿)を読み取って読取画像データを生成する場合に、特に有利な作用効果を奏する。但し、本発明の対象となる入力画像データは、文字のみを含むものに限定されず、少なくとも文字を含み、さらに図柄(例えば、イラスト、写真、グラフ、表など)を含んでもよい。
【0062】
また、上記の実施形態によれば、圧縮画像データ及び切抜画像データそれぞれを2値化してから合成するので、各画像に含まれる文字がさらに鮮明になる。このように、本発明は、原稿をモノクロで読み取って読取画像データを生成する場合に、特に有利な作用効果を奏する。
【0063】
また、上記の実施形態によれば、エッジ画素の最小画素値Pminが、非エッジ画素の最大画素値Pmaxより大きくなるまでフィルタ処理を繰り返し実行し、非エッジ画素の最大画素値Pmaxを2値化閾値として切抜画像データを2値化するので、切抜画像に含まれる文字をさらに鮮明にすることができる。
【0064】
なお、上記の実施形態では、スキャナ部231が生成した読取画像データを入力画像データの一例として説明したが、入力画像データの具体例はこれに限定されない。他の例として、PC110が画像データ送信処理を実行する場合は、画像作成(編集)アプリケーションを用いて作成(編集)した画像データを、入力画像データとしてもよい。さらに他の例として、タブレット端末やスマートフォンが画像データ送信処理を実行する場合は、内蔵カメラで撮影した画像データを、入力画像データとしてもよい。
【0065】
また、上記の実施形態では、画像データをFAX送信する例を説明したが、画像データの送信プロトコルはFAXプロトコルに限定されず、HTTP、FTPなど、画像データを送受信可能なあらゆるプロトコルが適用できる。
【0066】
また、上記の実施形態では、宛先装置の能力に応じて宛先解像度Rを決定する例を説明したが、宛先解像度Rの決定方法は前述の例に限定されない。他の例として、宛先解像度Rは、通信ネットワーク2の帯域幅に応じて決定されてもよいし、予め定められた固定値でもよい。読取解像度Rの決定方法についても同様である。
【0067】
さらに、上記の実施形態では、読取画像データを圧縮して圧縮画像データを生成する例を説明したが、入力画像データから出力画像データを生成するための画像処理は、「圧縮」に限定されない。すなわち、コントローラ210は、画質を低下させる画像処理を入力画像データに施して、出力画像データを生成すればよい。画像処理の他の例としては、コントラスト補正、明るさ補正、色補正、ノイズ除去、拡大及び縮小などが挙げられる。
【0068】
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
【0069】
明細書中の対応テーブル(表)は、機械学習の学習効果によって生成されたものでもよい。また、各パラメータを機械学習にて分類付けすることで、対応テーブルを使用しなくてもよい。ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり,コンピュータが,データ識別等の判断に必要なアルゴリズムを,事前に取り込まれる学習データから自律的に生成し,新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、さらに、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。
【0070】
なお、本発明は上述した実施形態に限定されるものではなく、その技術的要旨を逸脱しない範囲で種々の変形が可能であり、特許請求の範囲に記載された技術思想に含まれる技術的事項の全てが本発明の対象となる。上記実施形態は、好適な例を示したものであるが、当業者であれば、開示した内容から様々な変形例を実現することが可能である。そのような変形例も、特許請求の範囲に記載された技術的範囲に含まれる。
【符号の説明】
【0071】
1 :画像処理システム
2 :通信ネットワーク
100 :MFP
110 :PC
201 :CPU
202a :ROM
202b :RAM
206 :ASIC
208 :HDDコントローラ
210 :コントローラ
220 :近距離通信I/F
220a :近距離通信回路
221 :AGPバス
222 :PCIバス
230 :エンジン制御部
231 :スキャナ部
232 :プリンタ部
233 :FAX部
240 :操作パネル
240a :パネル表示部
240b :操作パネル
250 :ネットワークI/F
301 :CPU
310 :スキャン処理部
320 :画像圧縮部
330 :プレビュー処理部
340 :FAX送信部
350 :画質調整部
351 :OCR処理部
352 :画像切抜部
354 :画像合成部
511 :テキストボックス
512,513,514 :プルダウンメニュー
515 :[実行]ボタン
521 :プレビュー領域
522 :[+拡大]ボタン
523 :[-縮小]ボタン
524 :[送信]ボタン
525 :[調整]ボタン
【先行技術文献】
【特許文献】
【0072】
【文献】特開2016-058856号公報
図1
図2
図3
図4
図5
図6
図7
図8