(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-08
(45)【発行日】2024-07-17
(54)【発明の名称】画像処理装置及び画像形成装置
(51)【国際特許分類】
H04N 1/387 20060101AFI20240709BHJP
G06T 7/11 20170101ALI20240709BHJP
【FI】
H04N1/387 200
G06T7/11
(21)【出願番号】P 2022560681
(86)(22)【出願日】2021-10-05
(86)【国際出願番号】 JP2021036836
(87)【国際公開番号】W WO2022097408
(87)【国際公開日】2022-05-12
【審査請求日】2023-04-04
(31)【優先権主張番号】P 2020184535
(32)【優先日】2020-11-04
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
(74)【代理人】
【識別番号】110003443
【氏名又は名称】弁理士法人TNKアジア国際特許事務所
(72)【発明者】
【氏名】ジェザー・ヴィンヤーロン
【審査官】橘 高志
(56)【参考文献】
【文献】米国特許出願公開第2008/0144131(US,A1)
【文献】特開2015-060581(JP,A)
【文献】特開2012-048637(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 1/387
G06T 7/11
(57)【特許請求の範囲】
【請求項1】
原稿画像を記憶する記憶部と、
前記原稿画像における文字領域を特定する文字領域特定部と、
前記原稿画像から前記文字領域の画像を取得する画像取得部と、
前記文字領域から注釈線を検出し、前記注釈線の位置を特定する注釈線特定部と、
前記原稿画像を用いて、前記原稿画像における前記文字領域の外側に存在する画像を含まず、かつ、前記文字領域の画像から前記注釈線が消去された修正画像を生成する生成部と、
前記文字領域に存在する行領域を特定する行領域特定部と、
前記行領域の間に位置する行間領域を特定する行間領域特定部と、
前記行領域に含まれる複数の文字と、前記複数の文字のそれぞれの位置を示す複数の位置情報とを対応付けて抽出する文字データ抽出部と、
前記文字データ抽出部が抽出した前記複数の位置情報のうちで、前記注釈線特定部が特定した前記注釈線の位置と一致する位置を示す前記位置情報に対応する文字を、対象文字として特定する対象文字特定部と、を備え
、
前記生成部は、前記行領域における前記対象文字を、当該対象文字との一致度が最も高い文字に置換すると共に、前記行間領域の画像を消去することにより、前記文字領域の画像から前記注釈線を消去する、画像処理装置。
【請求項2】
前記記憶部は更に、複数種類のフォントを予め記憶しており、
前記生成部は、前記行領域における前記対象文字を文字単位で区切った矩形状の境界ボックスと、前記複数種類のフォントのそれぞれによって表される予め定められた複数の文字について文字毎に用意されている矩形状の複数の文字ボックスとを、予め定められた縦数×横数のグリッドで格子状に分割した縦数×横数からなるピクセル領域に分割し、前記複数の文字ボックスのうちで前記境界ボックスに対するピクセル領域の一致度が最も高い文字ボックスを特定し、前記対象文字を前記最も高い文字ボックスが示す文字に置換する、請求項
1に記載の画像処理装置。
【請求項3】
前記文字領域特定部は、前記原稿画像をレイアウト解析することにより、前記原稿画像における全ての文字を含む矩形状領域を前記文字領域として特定し、
前記行領域特定部は、
前記文字領域に存在する文字行毎に、前記文字行に含まれる複数の文字のうちで、最も高さの高い文字の上端位置を含む線を上端線として特定し、最も高さの低い文字の下端位置を含む線を下端線として特定し、
前記文字領域の左端位置を含む線を左端線として特定し、前記文字領域の右端位置を含む線を右端線として特定し、
前記上端線、前記下端線、前記左端線、及び前記右端線によって囲まれる領域を、前記行領域として特定する、請求項
1に記載の画像処理装置。
【請求項4】
前記生成部は、前記原稿画像から前記文字領域の外側に存在する周縁領域の画像を消去することで周縁消去画像を生成し、前記周縁消去画像における前記文字領域の画像から前記注釈線を消去することで前記修正画像を生成する、請求項1に記載の画像処理装置。
【請求項5】
前記生成部は、前記原稿画像の外形サイズと同じ外形サイズの下地画像に対して、当該原稿画像における前記文字領域の位置と同じ位置に、前記文字領域の画像から前記注釈線が消去された画像を配置することにより、前記修正画像を生成する、請求項1に記載の画像処理装置。
【請求項6】
表示部と、タッチパネルとを更に備え、
前記文字領域特定部は、前記表示部に表示されている前記原稿画像に対して、矩形状の範囲を指定するための操作を前記タッチパネルが検出すると、前記矩形状の範囲を前記文字領域として特定する、請求項1に記載の画像処理装置。
【請求項7】
原稿画像を記憶する記憶部と、
前記原稿画像における文字領域を特定する文字領域特定部と、
前記原稿画像から前記文字領域の画像を取得する画像取得部と、
前記文字領域から注釈線を検出し、前記注釈線の位置を特定する注釈線特定部と、
前記原稿画像を用いて、前記原稿画像における前記文字領域の外側に存在する画像を含まず、かつ、前記文字領域の画像から前記注釈線が消去された修正画像を生成する生成部と、を備え、
前記記憶部は更に、複数の判定用注釈線を予め記憶しており、
前記注釈線特定部は、前記文字領域から、前記複数の判定用注釈線のうちのいずれか一つとの類似度が予め定められた割合以上である線を検出すると、検出された前記線を前記注釈線として検出する
、画像処理装置。
【請求項8】
請求項1
又は請求項7に記載の画像処理装置と、
原稿を読取って原稿画像を生成する画像読取部と、
前記画像読取部が生成した前記原稿画像を前記記憶部に記憶させる制御部と、
記録媒体に前記修正画像を形成する画像形成部と、を備える画像形成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及び画像形成装置に関し、特に、手書きメモを含む原稿画像から当該手書きメモが消去された画像を取得するための技術に関する。
【背景技術】
【0002】
特許文献1は、原稿画像に含まれている複数の文字画像について、文字画像毎に1つずつ、当該文字画像のフォントが予め定められた複数のフォントのうちのいずれかに一致するか否かを順番に判定し、一致する文字画像を手書き文字ではないと判定し、不一致の文字画像を手書き文字であると判定し、手書き文字ではないと判定された文字画像が残され、手書き文字であると判定された文字が消去された画像を生成する画像形成装置を開示している。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【0004】
特許文献1に記載されている画像形成装置では、原稿画像に含まれている複数の文字画像について、個別に手書き文字であるか否かを判定する。例えば、原稿の周縁部に位置する余白部分に、多くの手書き文字が記載されている場合、上記画像形成装置では、手書き文字の判定処理に時間が掛かるため、手書きメモが消去された画像を迅速に取得できないという問題がある。また、上記画像形成装置では、原稿画像から手書きメモを確実に消去できないおそれがある。更に、原稿画像の文字領域内の任意の語句に対して、手書きの下線又は囲み線等の注釈線が書かれている場合には、当該注釈線を消去できないという問題がある。
【0005】
本発明は、上記の事情に鑑みてなされたものであり、手書き文字及び手書き注釈線等の手書きメモを含む原稿画像から手書きメモが消去された画像を迅速に取得すると共に、手書きメモの消去精度を向上させることを目的とする。
【0006】
本発明の一局面に係る画像処理装置は、原稿画像を記憶する記憶部と、原稿画像における文字領域を特定する文字領域特定部と、原稿画像から文字領域の画像を取得する画像取得部と、文字領域から注釈線を検出し、当該注釈線の位置を特定する注釈線特定部と、原稿画像を用いて、原稿画像における文字領域の外側に存在する画像を含まず、かつ、文字領域の画像から注釈線が消去された修正画像を生成する生成部と、文字領域に存在する行領域を特定する行領域特定部と、行領域の間に位置する行間領域を特定する行間領域特定部と、行領域に含まれる複数の文字と、複数の文字のそれぞれの位置を示す複数の位置情報とを対応付けて抽出する文字データ抽出部と、文字データ抽出部が抽出した複数の位置情報のうちで、注釈線特定部が特定した注釈線の位置と一致する位置を示す位置情報に対応する文字を、対象文字として特定する対象文字特定部と、を備える。生成部は、行領域における対象文字を、当該対象文字との一致度が最も高い文字に置換すると共に、行間領域の画像を消去することにより、文字領域の画像から注釈線を消去する。
本発明の他の一局面に係る画像処理装置は、原稿画像を記憶する記憶部と、原稿画像における文字領域を特定する文字領域特定部と、原稿画像から文字領域の画像を取得する画像取得部と、文字領域から注釈線を検出し、注釈線の位置を特定する注釈線特定部と、原稿画像を用いて、原稿画像における文字領域の外側に存在する画像を含まず、かつ、文字領域の画像から注釈線が消去された修正画像を生成する生成部と、を備える。記憶部は更に、複数の判定用注釈線を予め記憶している。注釈線特定部は、文字領域から、複数の判定用注釈線のうちのいずれか一つとの類似度が予め定められた割合以上である線を検出すると、検出された線を注釈線として検出する。
【0007】
本発明の他の一局面に係る画像形成装置は、上記画像処理装置と、原稿を読取って原稿画像を生成する画像読取部と、画像読取部が生成した原稿画像を記憶部に記憶させる制御部と、記録媒体に修正画像を形成する画像形成部と、を備える。
【発明の効果】
【0008】
本発明によれば、手書きメモを含む原稿画像から手書きメモが消去された画像を迅速に取得でき、さらに手書きメモの消去精度を向上させることができる。
【図面の簡単な説明】
【0009】
【
図1】本発明の一実施形態に係る画像形成装置の斜視図である。
【
図2】画像形成装置の構成を示すブロック図である。
【
図3】手書きメモ消去処理を概念的に示す図である。
【
図5】手書きメモ消去処理の一例を示すフローチャートである。
【
図6A】レイアウト解析された原稿画像の一例を示す図である。
【
図6B】原稿画像において特定された文字領域の一例を示す図である。
【
図8】行領域及び行間領域の特定方法の一例を示す図である。
【
図9A】対象文字を含む行領域の一例を示す図である。
【
図9B】行領域における対象文字を含む部分を示す図である。
【
図9C】注釈線が消去された行領域の一例を示す図である。
【
図10】修正画像生成処理の一例を示すフローチャートである。
【
図11A】手書きメモを有する原稿画像の一例を示す図である。
【
図12】フォント特定処理を概念的に示す図である。
【
図15A】行領域内から注釈線が消去されたときの文字領域の一例を示す図である。
【
図15B】行間領域の画像が消去されたときの文字領域の一例を示す図である。
【
図16】修正画像を示す画像データの一例を示す図である。
【
図17】修正画像の生成方法の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明に係る画像処理装置及び画像形成装置の一実施形態について図面を参照して説明する。
図1は、本発明の一実施形態に係る画像形成装置10の斜視図である。
図2は、画像形成装置10の構成を示すブロック図である。
【0011】
画像形成装置10は、制御ユニット11と、表示部12と、操作部14と、タッチパネル15と、通信部16と、画像読取部17と、画像形成部18と、記憶部19とを備える。これらの構成要素は、互いにバスを通じてデータ又は信号の送受信が可能とされている。
【0012】
画像読取部17は、例えば、自動原稿送り装置により搬送されてくる原稿G1(
図3参照)又はフラットベッド上に載置されている原稿G1を光学的に読取るスキャナーとしてのCCD(Charge Coupled Device)を有する読取機構である。画像読取部17は、原稿G1を示す原稿画像D1(
図3参照)を生成する。原稿画像D1は、上記の読取機構の構成上、外形が矩形状である。
【0013】
画像形成部18は、感光体ドラムの表面を均一帯電させ、感光体ドラムの表面を露光して、感光体ドラムの表面に静電潜像を形成し、感光体ドラムの表面の静電潜像をトナー像に現像して、感光体ドラムの表面のトナー像(画像)を記録紙に転写して定着させる。例えば、画像形成部18は、画像読取部17による原稿G1の読取で得られた原稿画像D1を記録紙に印刷する。原稿画像D1が印刷された記録紙は、排紙トレイ181に排出される。
【0014】
なお、画像形成装置10から画像読取部17と画像形成部18とを除いた部分は、画像処理装置2を構成する。
【0015】
表示部12は、例えば、液晶ディスプレイ(Liquid Crystal Display)、又は、有機EL(Organic Light-Emitting Diode)ディスプレイ等の表示装置である。
【0016】
操作部14は、ユーザーによる操作指示の入力を受付ける。操作部14は、メニューを呼出すためのメニューキー、メニューを構成するGUI(Graphical User Interface)におけるフォーカスを移動させるための矢印キー、メニューを構成するGUIに対して確定操作を行なうための決定キー、又は、スタートキー等のハードキーを備える。
【0017】
タッチパネル15は、抵抗膜方式又は静電容量方式等のタッチパネルである。タッチパネル15は、表示部12の画面に配置される。タッチパネル15は、表示部12の画面に対する指等の接触を接触位置と共に検知する。タッチパネル15は、指等の接触を検知すると、接触位置の座標を示す検知信号を制御ユニット11の制御部21等に出力する。従って、タッチパネル15は、表示部12の画面に対するユーザー操作が入力される操作部としての役割を果たす。
【0018】
通信部16は、通信モジュールを備える通信インターフェイスである。通信部16は、LAN(Local Area Network)又は公衆回線等のネットワークNを通じて、外部装置30(例えば、パーソナルコンピューター、サーバー、又は携帯情報端末等)との間でデータ送受信を行なう。
【0019】
記憶部19は、HDD(Hard Disk Drive)等の大容量の記憶装置である。記憶部19は、画像読取部17による原稿読取で得られた原稿G1の原稿画像D1(つまり、画像データ)を記憶する原稿画像記憶部19Aを備える。
【0020】
図3は、原稿画像D1から手書きメモが消去された画像を生成するための手書きメモ消去処理を概念的に示す図である。画像形成装置10は、
図3に示すように、例えば、手書き文字によって構成される文字列M1乃至M4及び手書き注釈線L1乃至L3等の手書きメモが記載された原稿G1を読取り、原稿画像D1から手書きメモが消去された修正画像CIDを生成するための手書きメモ消去処理を実行するための構成を備える。構成の詳細については、以下に説明する。
【0021】
記憶部19は更に、複数種類のフォントを予め記憶するフォント記憶部19Bを備える。フォント記憶部19Bは、例えば、「Arial」、「Courier New」、及び「Times New Roman」等の複数種類のフォントデータを記憶する。
【0022】
記憶部19は更に、複数の判定用注釈線を予め記憶する注釈線記憶部19Cを備える。注釈線記憶部19Cは、例えば、楕円形、矩形(ボックス)、及び下線等の複数形状の判定用注釈線を示すデータを記憶する。
【0023】
制御ユニット11は、プロセッサー、RAM(Random Access Memory)、及びROM(Read Only Memory)等から構成される。プロセッサーは、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、又はASIC(Application Specific Integrated Circuit)である。制御ユニット11は、記憶部19に記憶されている制御プログラムが上記のプロセッサーで実行されることにより、制御部21、文字領域特定部22、画像取得部23、注釈線特定部24、行領域特定部25、行間領域特定部26、文字データ抽出部27、対象文字特定部28、及び生成部29として機能する。なお、制御ユニット11の制御部21、文字領域特定部22、画像取得部23、注釈線特定部24、行領域特定部25、行間領域特定部26、文字データ抽出部27、対象文字特定部28、及び生成部29は、上記制御プログラムに基づく動作によらず、それぞれハード回路により構成されてもよい。
【0024】
制御部21は、画像形成装置10の全体的な動作制御を司る。
図4は、表示部12の表示画面の一例を示す図である。例えば、制御部21は、
図4に示す操作画面40を表示部12に表示させる。制御部21は、操作画面40に対するユーザーのタッチ操作に従って、コピー処理、印刷処理、スキャン処理、ファクシミリ処理、又は手書きメモ消去処理等の各種の処理に関する制御を行なう。
【0025】
文字領域特定部22は、原稿画像記憶部19Aに記憶されている原稿画像D1(つまり、原稿G1のスキャンにより取得された画像データ)における文字領域CA(後述の
図6B参照)を特定する。文字領域CAは、手書き文字以外の文字が記載されている領域である。例えば、文字領域特定部22は、原稿画像D1に対して、既知のOCR(optical character recognition)処理に含まれるレイアウト解析を行なうことにより、原稿画像D1における文字領域CAを特定する。文字領域特定部22は、原稿画像D1において特定された文字領域CAを示すレイアウト結果を記憶部19に記憶させる。
【0026】
画像取得部23は、原稿画像D1から、文字領域特定部22によって特定された文字領域CAの画像を取得する。例えば、画像取得部23は、原稿画像D1に対して既知の画像切出し(トリミング)処理を行なうことにより、原稿画像D1から文字領域CAの画像を切出す。
【0027】
注釈線特定部24は、文字領域CAから、手書きの注釈線L1乃至L3を検出し、検出された注釈線L1乃至L3の位置を特定する。
図3に示すように、注釈線L1及び注釈線L2は、手書きされた環状の囲み線である。注釈線L3は、手書きされた下線である。
【0028】
具体的には、注釈線特定部24は、文字領域CAから、注釈線記憶部19Cに記憶されている複数の判定用注釈線のうちのいずれか一つとの類似度が予め定められた割合以上である線を検出すると、当該検出された線を注釈線L1乃至L3として検出し、検出された注釈線L1乃至L3の位置を特定する。
【0029】
行領域特定部25は、文字領域CAに存在する複数の行領域CLA(
図8参照)をそれぞれ特定する。例えば、行領域特定部25は、文字領域CAに存在する文字行毎に、当該文字行に含まれる複数の文字のうちで、最も高さの高い文字の上端位置を含む線を上端線LUとして特定し、最も高さの低い文字の下端位置を含む線を下端線LDとして特定する。行領域特定部25は、
図6Bに示す文字領域CAの左端位置を含む線を
図9Aに示すように左端線LLとして特定し、文字領域CAの右端位置を含む線を、
図9Aに示すように右端線LRとして特定する。行領域特定部25は、上端線LU、下端線LD、左端線LL、及び右端線LRによって囲まれる領域を、行領域CLAとして特定する。
【0030】
行間領域特定部26は、隣接する行領域CLAの間に位置する行間領域LSA(
図8参照)を特定する。
【0031】
文字データ抽出部27は、文字領域特定部22が特定した文字領域CAについてOCR処理を行ない、文字領域CAにおける各行領域CLAに含まれる複数の文字(文字データ)と、当該複数の文字のそれぞれの位置を示す複数の位置情報とを対応付けて抽出する。
【0032】
文字データ抽出部27が抽出した文字の位置情報は、原稿画像D1における当該文字の位置を示す情報である。位置情報は、例えば原稿画像D1における文字データの座標を示す。
図6Aに示すように、文字データ抽出部27は、原稿画像D1において、左上角部の座標を(0,0)に、右上角部の座標を(x,0)に、左下角部の座標を(0,y)に、右下角部の座標を(x,y)に設定している。文字データ抽出部27は、原稿画像D1から、文字と、当該文字を含む矩形領域の4隅の座標を示す位置情報(対角線上の2隅の座標を示す位置情報のみとしてもよい。)とを対応付けて抽出する。原稿画像D1が複数の文字を含む場合には、文字データ抽出部27は、複数の文字と当該複数の文字毎の位置情報とをそれぞれ対応付けて抽出する。文字データ抽出部27は、原稿画像D1の文字領域CAにおける文字と当該文字の位置情報とを対応付けて、原稿画像記憶部19Aに記憶させる。
【0033】
対象文字特定部28は、文字データ抽出部27が抽出した複数の位置情報のうちで、注釈線特定部24が特定した注釈線の位置と一致する位置を示す位置情報に対応する文字を、行領域CLAの文字のうちで注釈線が重なっている対象文字TCとして特定する。
【0034】
具体的には、対象文字特定部28は、注釈線L1の位置と一致する位置を示す位置情報に対応する文字を、注釈線L1が重なっている対象文字TCとして特定する。対象文字特定部28はまた、注釈線L2の位置と一致する位置を示す位置情報に対応する文字を、注釈線L2が重なっている対象文字TCとして特定する。
【0035】
なお、対象文字特定部28は、注釈線L3については、注釈線L3が重なっている対象文字TCがないため、対象文字TCを特定しない。つまり、対象文字特定部28は、注釈線L3の位置と一致する位置を示す位置情報が無いので、注釈線L3が重なっている対象文字TCがないと判定し、対象文字TCを特定しない。
【0036】
生成部29は、原稿画像D1を用いて、原稿画像D1における文字領域CAの外側に存在する画像を含まず、かつ、文字領域CAの画像から注釈線L1乃至L3が消去された修正画像CIDを生成する。
【0037】
例えば、生成部29は、行領域CLAにおける対象文字TCを、当該対象文字TCとの一致度が最も高い文字に置換する(例えば、対象文字TC上に、当該対象文字TCのフォントに最も類似するフォントの文字画像を合成する。)。生成部29はまた、行間領域LSAの画像を消去する(例えば、原稿画像D1の行間領域LSAに対して当該行間領域LSAの地色のベタ画像(背景画像)を合成する。)。このようにして、生成部29は、文字領域CAの画像から、注釈線L1乃至L3を消去する。
【0038】
なお、生成部29は、行間領域LSAの地色を、例えば、行間領域LSAの予め定められた箇所の画素の色を検出することにより特定する。また、生成部29は、行間領域LSAの全ての箇所又は一部の画素の平均色を、行間領域LSAの地色として採用してもよい。
【0039】
生成部29は、原稿画像記憶部19Aに記憶されている原稿画像D1から、文字領域CAの外側に存在する周縁領域の画像を消去することで周縁消去画像D2(
図11B参照)を生成する。例えば、生成部29は、原稿画像D1における文字領域CAの外側に存在する周縁領域に、当該周縁領域の地色のベタ画像(背景画像)を合成することにより、周縁消去画像D2を生成する。
【0040】
なお、生成部29は、原稿画像D1の文字領域CAの外側に存在する周縁領域の地色を、例えば、原稿画像D1を示す画像データの周縁領域の手書きメモのない箇所の画素の色を検出することにより特定する。また、生成部29は、周縁領域の手書きメモのない箇所の全て又は一部の画素の平均色を、周縁領域の地色として採用してもよい。
【0041】
生成部29は、周縁消去画像D2の文字領域CAの画像から、注釈線特定部24が特定した注釈線L1乃至L3を消去することで、修正画像CIDを生成する。
【0042】
制御部21は、修正画像CIDを表示部12に表示させる。制御部21は、ユーザーによる印刷指示の操作が操作部14に対して行なわれると、画像形成部18に、修正画像CIDを記録紙に形成させる。制御部21は、ユーザーによるデータ出力指示の操作が操作部14に対して行なわれると、通信部16に、修正画像CIDを示す画像データを外部装置30に送信(出力)させる。
【0043】
続いて、画像形成装置10によって実行される、手書きメモ消去処理について説明する。
図5は、手書きメモ消去処理の一例を示すフローチャートである。
【0044】
制御部21は、表示部12に表示画面40を表示させている状態において、タッチパネル15が「スキャン後メモ消去」という文字列を示すキーKBに対するタッチ操作を検知すると、
図5に示す手書きメモ消去処理の実行を開始する。具体的には、ユーザーがキーKBをタッチすると、タッチパネル15がキーKBに対するタッチ操作を検知して、手書きメモ消去処理の開始信号を制御部21に出力する。制御部21は、当該開始信号の入力に応じて手書きメモ消去処理の実行を開始する。
【0045】
手書きメモが記載されている
図3に示す原稿G1が、ユーザーにより画像読取部17にセットされた状態において、操作部14がユーザーによるスタートボタンの押下を検知すると、制御部21は、画像読取部17に原稿G1を読取らせる(ステップS1)。制御部21は、画像読取部17が生成した原稿画像D1を示す画像データを原稿画像記憶部19Aに記憶させる。
【0046】
図6Aは、レイアウト解析された原稿画像D1の一例を示す図である。
図6Bは、原稿画像D1において特定された文字領域CAの一例を示す図である。文字領域特定部22は、
図6Aに示す原稿画像D1に対して、OCR処理に含まれるレイアウト解析を行なうことにより、
図6Bに示すように、原稿画像D1における文字領域CAを特定する(ステップS2)。文字領域特定部22はまた、原稿画像D1における座標情報に基づいて、原稿画像D1における文字領域CAの位置を示す位置情報を取得する。例えば、文字領域特定部22は、文字領域CAの左上角部P1、右上角部P2、左下角部P3、及び右下角部P4の各座標を示す位置情報を取得する。
【0047】
画像取得部23は、
図6Bに示す原稿画像D1から、文字領域特定部22によって特定された文字領域CAの画像を取得する(ステップS3)。
【0048】
図7は、注釈線L1乃至L3の検出方法の一例を示す図である。注釈線特定部24は、
図7に示すように、文字領域CAから、注釈線記憶部19Cに記憶されている複数の判定用注釈線のうちのいずれか一つとの類似度が予め定められた割合(例えば60%)以上である線L1乃至L3を検出すると、当該検出された線L1乃至L3を注釈線L1乃至L3として検出し、当該注釈線L1乃至L3の位置をそれぞれ特定する(ステップS4)。
【0049】
具体的には、注釈線特定部24はまず、
図7に示すように、文字領域CAの線L1及び線L2のそれぞれについて、注釈線記憶部19Cに記憶されている楕円形の判定用注釈線との類似度を示す第1類似度を算出する。ここでは、注釈線特定部24は、線L1の第1類似度として68%を算出し、線L2の第1類似度として70%を算出したものとする。続いて、注釈線特定部24は、線L1及び線L2のそれぞれについて、注釈線記憶部19Cに記憶されている矩形の判定用注釈線との類似度を示す第2類似度を算出する。ここでは、注釈線特定部24は、線L1の第2類似度として45%を算出し、線L2の第2類似度として58%を算出したものとする。続いて、注釈線特定部24は、線L1及び線L2のそれぞれについて、注釈線記憶部19Cに記憶されている下線の判定用注釈線との類似度を示す第3類似度を算出する。ここでは、注釈線特定部24は、線L1の第3類似度として10%を算出し、線L2の第3類似度として12%を算出したものとする。注釈線特定部24は、線L1及び線L2のそれぞれについての第1類似度が60%以上であるため、線L1及び線L2を注釈線L1及び注釈線L2として検出し、原稿画像D1における座標情報に基づいて、注釈線L1及び注釈線L2の位置を特定する。
【0050】
注釈線特定部24はまた、
図7に示すように、文字領域CAの線L3について第1類似度を算出する。ここでは、注釈線特定部24は、線L3の第1類似度として10%を算出したものとする。続いて、注釈線特定部24は、線L3について第2類似度を算出する。ここでは、注釈線特定部24は、線L3の第2類似度として12%を算出したものとする。続いて、注釈線特定部24は、線L3について第3類似度を算出する。ここでは、注釈線特定部24は、線L3の第3類似度として82%を算出したものとする。注釈線特定部24は、線L3の第3類似度が60%以上であるため、線L3を注釈線L3として検出し、原稿画像D1における座標情報に基づいて、注釈線L3の位置を特定する。
【0051】
行領域特定部25及び行間領域特定部26は、文字領域CAに存在する行領域CLA及び行間領域LSAを特定する(ステップS5)。
図8は、行領域CLA及び行間領域LSAの特定方法の一例を示す図である。
図8に示すように、行領域特定部25は、文字領域CAに存在する文字行毎に、当該文字行に含まれる複数の文字のうちで、最も高さの高い文字の上端位置を含む線を上端線LUとして特定し、最も高さの低い文字の下端位置を含む線を下端線LDとして特定する。行領域特定部25は、
図6Bに示す文字領域CAの左端位置を含む線を、
図8に示すように左端線LLとして特定し、文字領域CAの右端位置を含む線を、
図8に示すように右端線LRとして特定する。このように、行領域特定部25は、上端線LU、下端線LD、左端線LL、及び右端線LRによって囲まれる領域を、行領域CLAとして特定する。
【0052】
行間領域特定部26は、
図8に示すように、隣接する行領域CLAの間に位置する領域を行間領域LSAとして特定する。例えば、行間領域特定部26は、行領域特定部25によって特定された行領域CLAの下端線LDと、当該下端線LDよりも下側に隣接する行領域CLAの上端線LUと、
図6Bに示す文字領域CAの左端位置を含む線及び右端位置を含む線とで囲まれる領域を、行間領域LSAとして特定する。
【0053】
文字データ抽出部27は、文字領域CAについてOCR処理を行ない、文字領域CAにおける各行領域CLAに含まれる複数の文字(文字データ)と、当該複数の文字のそれぞれの位置を示す複数の位置情報とを対応付けて抽出する(ステップS6)。
図9Aは、対象文字を含む行領域の一例を示す図である。例えば、
図9Aに示す行領域CLAについて言えば、文字データ抽出部27は、当該行領域CLAに含まれる各文字及び各空白スペースを示す文字データと、各文字及び各空白スペースの位置情報とをそれぞれ対応付けて抽出する。
【0054】
対象文字特定部28は、文字データ抽出部27が抽出した複数の位置情報のうちで、注釈線特定部24が特定した注釈線の位置と一致する位置を示す位置情報に対応する文字を、行領域CLAの文字のうちで注釈線が重なっている対象文字TCとして特定する(ステップS7)。
図9Bは、行領域における対象文字を含む部分を示す図である。例えば、
図9Bに示すように、注釈線L1の位置と、「king」の各文字の位置情報及び「king」の直後の空白スペースの位置情報が示す位置とが一致する。このため、対象文字特定部28は、「king」の各文字及び直後の空白スペースを、注釈線L1が重なっている対象文字TCとして特定する。また、注釈線L2の位置と、「queen」の各文字の位置情報及び「queen」の前後の空白スペースの位置情報が示す位置とが一致する。このため、対象文字特定部28は、「queen」の各文字及び前後の空白スペースを、注釈線L2が重なっている対象文字TCとして特定する。
【0055】
生成部29は、原稿画像D1から修正画像CIDを生成するための修正画像生成処理を行なう(ステップS8)。
図10は、修正画像生成処理の一例を示すフローチャートである。
【0056】
生成部29は、文字領域CAの外側に存在する周縁領域の画像を消去することで周縁消去画像D2を生成する(ステップS81)。
図11Aは、手書きメモを有する原稿画像D1の一例を示す図である。
図11Bは、周縁消去画像D2の一例を示す図である。
【0057】
例えば、生成部29は、
図11Aに示す原稿画像D1における文字領域CAの外側の周縁領域に、当該周縁領域の地色のベタ画像(背景画像)を合成することにより、
図11Bに示す周縁消去画像D2を生成する。周縁消去画像D2は、手書き文字によって構成される文字列M1乃至M4を含まない。
【0058】
図10に戻って、生成部29は、周縁消去画像D2の文字領域CAの画像から、行領域CLAの内部の
図8に示す注釈線L1及び注釈線L2の画像を消去する(ステップS82)。具体的には、生成部29は、行領域CLAにおいて、注釈線L1及び注釈線L2が重なっている対象文字TCを、当該対象文字TCと同一又は近似する適切な文字の画像に置換することにより、行領域CLAから注釈線L1及び注釈線L2の画像を消去する。
【0059】
ここで、
図12乃至
図15Aを用いて、行領域CLAから注釈線L1及び注釈線L2の画像を消去するための方法について、詳細に説明する。
図12は、対象文字TCのフォントに最も類似するフォントを特定するためのフォント特定処理を概念的に示す図である。
図13は、フォント特定処理の一例を示す図である。
図14は、対象文字TCに最も類似する文字を特定するための文字特定処理の一例を示す図である。
図15Aは、行領域CLAから注釈線L1及び注釈線L2が消去されたときの文字領域CAの一例を示す図である。
【0060】
図12に示すように、生成部29は、注釈線L1が重なっている対象文字TC(ここでは、注釈線L1が重なっている「n」の文字)のフォントに最も類似するフォントを特定する。具体的には、生成部29は、フォント記憶部19Bに記憶されている複数種類のフォント(例えば、「Arial」、「Courier New」、「Times New Roman」)のそれぞれについて、対象文字TCとの一致度を算出する。生成部29は、一致度が最大のフォントを、上記最も類似するフォントとして特定する。
【0061】
生成部29は、
図13に示すように、行領域CLAにおける対象文字TCを文字単位で区切った矩形状の境界ボックスBBと、フォント記憶部19Bに記憶されている複数種類のフォントによって表される予め定められた複数の文字について文字毎に用意されている矩形状の複数の文字ボックスCBとを、予め定められた縦数×横数(例えば22×22)のグリッドで格子状に分割した縦数×横数(例えば22×22)からなるピクセル領域に分割する。生成部29は、複数種類のフォントについての文字ボックスCBのうちで、境界ボックスBBに対するピクセル領域の一致度が最も高い文字ボックスCBのフォントを、対象文字TCのフォントに最も類似するフォントとして特定する。
【0062】
図13に示すように、生成部29は、「q」の文字である対象文字TCと、「Arial」、「Courier New」、及び「Times New Roman」の各フォントによって表される「q」の文字との一致度として、それぞれ、91.03%、83.10%、及び95.07%を算出したものとする。ここでは、「Times New Roman」のフォントについての一致度が最も高い。したがって、生成部29は、対象文字TCのフォントに最も類似するフォントとして、「Times New Roman」を特定する。
【0063】
生成部29はまた、
図14に示すように、行領域CLAにおける対象文字TCを文字単位で区切った矩形状の境界ボックスBBと、特定されたフォント(ここでは、「Times New Roman」のフォント)によって表される予め定められた複数の文字について文字毎に用意されている矩形状の複数の文字ボックスCBとを、予め定められた縦数×横数(例えば22×22)のグリッドで格子状に分割した縦数×横数(例えば22×22)からなるピクセル領域に分割する。生成部29は、「Times New Roman」のフォントについての文字ボックスCBのうちで境界ボックスBBに対するピクセル領域の一致度が最も高い文字ボックスCBが示す文字を、対象文字TCに最も類似する文字として特定する。
【0064】
図14に示すように、生成部29は、「n」の文字である対象文字TCと、「Times New Roman」のフォントによって表される予め定められた複数の文字のうちの、「h」、「n」、及び「p」の各文字との一致度として、それぞれ88.82%、91.39%、及び86.78%を算出したものとする。ここでは、「n」の文字についての一致度が最も高い。したがって、生成部29は、対象文字TCに最も類似する文字として、「Times New Roman」のフォントによって表される「n」の文字を特定する。
【0065】
続いて、生成部29は、行領域CLAにおける注釈線L1が重なっている「n」の文字)の画像上に、上記した対象文字TCに最も類似する文字(つまり、「Times New Roman」のフォントによって表される「n」の文字)の画像を合成する。
図9Cは、注釈線が消去された行領域の一例を示す図である。
図9Cに示すように、生成部29は、例えば「n」という対象文字TCの境界ボックスBB上に、「Times New Roman」のフォントによって表される「n」の文字ボックスCBを合成する。ここでは、境界ボックスBB及び文字ボックスCBは、グリッドを有さない。
【0066】
なお、生成部29は、「king」の「n」以外の各文字、及び「queen」の各文字に対しても、上記と同様にして、対象文字TCのフォントに最も類似するフォントの文字画像を合成する。すなわち、生成部29は、これらの対象文字TCの境界ボックスBB上に、最も類似するフォントについての最も類似する文字の文字ボックスCBを合成する。生成部29はまた、注釈線L1及び注釈線L2が重なっている空白スペースに対しては、空白スペースの画像を合成する。
【0067】
上述したように、生成部29は、行領域CLAにおける対象文字TCを、当該対象文字TCとの一致度が最も高い文字に置換する。すなわち、生成部29は、対象文字TC上に、当該対象文字TCのフォントに最も類似するフォントの文字画像を合成する。これにより、行領域CLAの内部において、注釈線L1及び注釈線L2が重なっている対象文字TCが、当該対象文字TCと同一又は近似する適切な文字の画像に置換され、
図15Aに示すように、行領域CLAから注釈線L1及び注釈線L2の画像が消去される。
【0068】
なお、
図15Aに示す注釈線L3は、行間領域LSAに位置しているので、生成部29は、ステップS82では注釈線L3を消去しない。生成部29は、続くステップS83にて注釈線L3を消去する。
【0069】
図10に戻って、生成部29は、行間領域LSAの画像を消去する(ステップS83)。例えば、生成部29は、行間領域LSAに対して、当該行間領域LSAの地色のベタ画像(背景画像)を合成することにより、
図15Bに示すように、行間領域LSAに存在している注釈線L3を消去する。
【0070】
図15Bは、行間領域LSAの画像が消去されたときの文字領域CAの一例を示す図である。ステップS83の処理によって、行間領域LSAに存在している注釈線L3が消去される。
【0071】
上記したように、生成部29は、
図11Bに示すように、原稿画像D1における文字領域CAの外側に存在する周縁領域の画像を消去した周縁消去画像D2を生成する(ステップS81)。生成部29は、
図15Bに示すように、周縁消去画像D2における文字領域CAの画像から注釈線L1乃至L3を消去する(ステップS82、ステップS83)。このようにして、生成部29は、
図16に示す修正画像CIDを生成する。
図16は、手書きメモが消去された修正画像CIDを示す画像データの一例を示す図である。
【0072】
図5に戻って、制御部21は、
図16に示す修正画像CIDを表示部12に表示させる(ステップS9)。
【0073】
制御部21は、ユーザーによる保存の指示又は印刷の指示を受付けたか否かを判定する(ステップS10)。制御部21は、タッチパネル15が「保存」ボタンに対する押下を検出すると(ステップS10で「保存」)、修正画像CIDを記憶部19に記憶させ(ステップS11)、手書きメモ消去処理を終了する。一方、制御部21は、タッチパネル15が「印刷」ボタンに対する押下を検出すると(ステップS10で「印刷」)、画像形成部18に、修正画像CIDを記録紙に形成させ(ステップS12)、手書きメモ消去処理を終了する。
【0074】
なお、ステップS10において、「送信」の指示を受付けたか否かの判定を追加してもよい。この場合には、制御部21は、ユーザーによる、例えば「送信」ボタンに対する押下等のデータ出力指示の操作が操作部14に対して行なわれると、通信部16に、修正画像CIDを外部装置30に送信(出力)させ、手書きメモ消去処理を終了する。
【0075】
上記実施形態によれば、画像取得部23は、原稿画像D1から文字領域CAの画像を取得する。注釈線特定部24は、文字領域CAから注釈線L1乃至L3を検出し、注釈線L1乃至L3の位置を特定する。生成部29は、原稿画像D1を用いて、原稿画像D1における文字領域CAの外側に存在する画像を含まず、かつ、文字領域CAの画像から注釈線L1乃至L3が消去された修正画像CIDを生成する。
【0076】
これによって、原稿画像D1における文字領域CA内の任意の語句等に対して、手書きの下線又は囲み線等の注釈線L1乃至L3が書かれている場合には、注釈線L1乃至L3が消去された修正画像CIDが生成される。生成された修正画像CIDは、原稿画像D1における文字領域CAの外側の周縁領域に存在する画像を含まないので、周縁領域に存在する画像について、手書き文字の有無を判定したり、手書き文字を個別に消去するための処理を実行したりする必要が無くなる。その結果、手書き文字及び手書き注釈線等の手書きメモを含む原稿画像D1から手書きメモが消去された画像を迅速に取得でき、手書きメモの消去精度を向上させることができる。
【0077】
また上記実施形態によれば、行領域特定部25は、文字領域CAに存在する行領域CLAを特定する。行間領域特定部26は、行領域CLAの間に位置する行間領域LSAを特定する。文字データ抽出部27は、行領域CLAに含まれる複数の文字と、複数の文字のそれぞれの位置を示す複数の位置情報とを対応付けて抽出する。対象文字特定部28は、文字データ抽出部27が抽出した複数の位置情報のうちで、注釈線特定部24が特定した注釈線L1乃至L3の位置と一致する位置を示す位置情報に対応する文字を、注釈線L1乃至L3が重なっている対象文字TCとして特定する。生成部29は、行領域CLAにおける対象文字TCを、当該対象文字TCとの一致度が最も高い文字に置換すると共に、行間領域LSAの画像を消去することにより、文字領域CAの画像から注釈線L1乃至L3を消去する。
【0078】
これによって、文字領域CAに位置する注釈線L1乃至L3を的確に消去できる。その結果、注釈線L1乃至L3の消去精度をより一層向上させることができる。
【0079】
また上記実施形態によれば、生成部29は、行領域CLAにおける対象文字TCを文字単位で区切った矩形状の境界ボックスBBと、フォント記憶部19Bに記憶されている複数種類のフォントのそれぞれによって表される予め定められた複数の文字について文字毎に用意されている矩形状の複数の文字ボックスCBとを、予め定められた縦数×横数のグリッドで格子状に分割した縦数×横数からなるピクセル領域に分割し、複数の文字ボックスCBのうちで境界ボックスBBに対するピクセル領域の一致度が最も高い文字ボックスCBを特定し、対象文字TCを最も高い文字ボックスCBの文字に置換する。
【0080】
これによって、注釈線L1乃至L3が重なっている対象文字TCを、注釈線L1乃至L3を有さない文字に精度良く置換できる。その結果、文字領域CAに位置する注釈線L1乃至L3を的確に消去できる。
【0081】
また上記実施形態によれば、文字領域特定部22は、原稿画像記憶部19Aに記憶されている原稿画像D1をレイアウト解析することにより、原稿画像D1における全ての文字を含む矩形状領域を文字領域CAとして特定する。行領域特定部25は、文字領域CAに存在する文字行毎に、当該文字行に含まれる複数の文字のうちで、最も高さの高い文字の上端位置を含む線を上端線として特定し、最も高さの低い文字の下端位置を含む線を下端線として特定する。行領域特定部25は、文字領域CAの左端位置を含む線を左端線として特定し、文字領域CAの右端位置を含む線を右端線として特定する。行領域特定部25は、上端線、下端線、左端線、及び右端線によって囲まれる領域を、行領域CLAとして特定する。
【0082】
これによって、文字領域CAに存在する文字行を含む行領域CLAを的確に特定できる。
【0083】
また上記実施形態によれば、注釈線特定部24は、文字領域CAから、注釈線記憶部19Cに記憶されている複数の判定用注釈線のうちのいずれか一つとの類似度が予め定められた割合以上である線を検出すると、当該検出された線を注釈線L1乃至L3として検出し、当該注釈線L1乃至L3の位置を特定する。
【0084】
これによって、文字領域CAに複数の注釈線L1乃至L3が存在している場合であっても、これらの注釈線L1乃至L3を的確に検出できる。
【0085】
また上記実施形態によれば、生成部29は、原稿画像D1から文字領域CAの外側に存在する周縁領域の画像を消去することで周縁消去画像D2を生成し、周縁消去画像D2における文字領域CAの画像から注釈線L1乃至L3を消去することで修正画像CIDを生成する。
【0086】
これによって、修正画像CIDにおける文字領域CAの外側の周縁領域について、手書きメモを存在させないようにできる。したがって、周縁領域に対して手書きメモを個別に消去するための処理等を行なう必要が無くなる。その結果、手書きメモを含む原稿画像D1から手書きメモが消去された画像を迅速に取得でき、手書きメモの消去精度をより一層向上させることができる。
【0087】
次に、上記実施形態の変形例に係る画像形成装置10について、
図17を用いて説明する。
図17は、上記実施形態の変形例に係る修正画像の生成方法の一例を示す図である。
【0088】
本変形例に係る画像形成装置10では、
図17に示すように、下地画像D3に、文字領域CAの画像から注釈線L1乃至L3が消去された画像D4を合成することにより、修正画像CIDを生成する点が、上記実施形態とは異なる。なお、以下の説明において、上記実施形態で説明した構成要素と同じ構成要素には同じ番号を付し、説明を省略する。
【0089】
生成部29は、
図17に示すように、原稿画像記憶部19Aに記憶されている原稿画像D1の外形サイズ(例えば、定型のA4サイズ又はB5サイズ等)と同じ外形サイズの下地画像D3に対して、当該原稿画像D1における文字領域CAの位置関係と同じ位置関係となる領域PAに、文字領域CAの画像から注釈線L1乃至L3が消去された画像D4を配置することにより、修正画像CIDを生成する。
【0090】
なお、生成部29は、原稿画像D1に対して既知のエッジ検出処理を行なうことにより、原稿画像D1の外形サイズを検出できる。また、生成部29は、自動原稿送り装置により搬送されてくる原稿G1又はフラットベッド上に載置されている原稿G1の外形サイズを検出する原稿サイズ検出センサーの検出信号を用いて、原稿画像D1の外形サイズを検出してもよい。
【0091】
上記変形例によれば、修正画像CIDにおける文字領域CAの外側の周縁領域について、手書きメモを存在させないようにできる。したがって、周縁領域に対して手書きメモを個別に消去するための処理等を行なう必要が無くなる。その結果、手書きメモを含む原稿画像D1から手書きメモが消去された画像を迅速に取得でき、手書きメモの消去精度をより一層向上させることができる。
【0092】
なお、本発明は上記実施形態の構成に限られず種々の変形が可能である。
【0093】
上記実施形態及び変形例において、文字領域特定部22は、原稿画像D1をレイアウト解析することにより文字領域CAを特定しているが、本発明はそのような実施形態に限定されない。例えば、文字領域特定部22は、ユーザーによる文字領域CAの指定に従って、原稿画像D1における文字領域CAを特定してもよい。例えば、文字領域特定部22は、表示部12に表示されている原稿画像D1に対して、矩形状の範囲の左上隅点と右下隅点との2点をユーザーがタッチする2点操作をタッチパネル15が検出すると、当該矩形状の範囲を文字領域CAとして特定する。なお、ユーザーによる上記操作は、矩形状の範囲の4隅を指示する4点操作、又は、画像を囲む操作(ドラッグ操作)等であってもよい。
【0094】
また上記実施形態では、生成部29は、
図10に示すように、ステップS81、ステップS82、及びステップS83の順に処理を行なっているが、本発明はそのような実施形態に限定されない。例えば、生成部29は、ステップS81、ステップS83、及びステップS82の順に処理を行なったり、ステップS82、ステップS83、及びステップS81の順に処理を行なったりする等、任意の順に処理を行なってもよい。
【0095】
なお、生成部29は、注釈線が除去された境界ボックスBBと文字ボックスCBとの一致度を算出してもよい。具体的には、画像読取部17がカラースキャナーであり、
図6Bに示す文字領域CAの文字の色(例えば、黒色)と、注釈線L1乃至L3の色(例えば、赤色)とが異なる場合に、生成部29は、
図14に示す対象文字TCから注釈線L1の画素を除去(例えば地色に変更)することで、注釈線が除去された境界ボックスBBを生成する。生成部29は、注釈線特定部24が特定した赤色の注釈線L1の位置を示す位置情報を用いて、境界ボックスBB中の注釈線L1の画素を特定できる。生成部29は、注釈線が除去された境界ボックスBBと文字ボックスCBとのピクセル領域の一致度を算出する。これによって、対象文字TCの置換精度を更に向上させることができる。
【0096】
なお、上記実施形態及び変形例では、画像処理装置の一例として、画像形成装置10に搭載されている画像処理装置2について説明しているが、本発明はそのような実施形態に限定されない。例えば、
図2に示す制御ユニット11及び記憶部19を備える画像処理装置(例えば、パーソナルコンピューター、サーバー、携帯情報端末等)であってもよい。
【0097】
図1乃至
図17を用いて説明した上記実施形態の構成及び処理は、本発明の一例に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。