(58)【調査した分野】(Int.Cl.,DB名)
前記共通画像生成手段は、前記膨張画像生成手段にて生成された前記膨張画像を収縮させ、収縮させた当該膨張画像と前記画像との共通部分を抽出して前記共通画像を生成することを特徴とする請求項1記載の画像処理システム。
前記膨張画像生成手段は、前記画像に含まれる前記文字画像の大きさに応じて膨張させる度合いを調整することを特徴とする請求項1乃至3の何れか1項記載の画像処理システム。
【発明を実施するための形態】
【0008】
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
<第1実施形態>
例えば、マーカが引かれた文書を読取り、マーカが引かれた文字とマーカが引かれていない文字とを区別し、マーカやマーカが引かれた文字、マーカで囲まれた領域に対して特定の処理を行う技術が書類の編集や学習用教材などで利用されている。
具体的には、このような技術では、ユーザがマーカを引いた文書の画像から、マーカが引かれた位置や範囲を認識するための画像が生成される。そして、生成した画像によりマーカの位置や範囲を認識して、マーカの削除やマーカ部分の墨塗り、マーカで囲まれた画像を抽出する等の画像処理が行われる。また、マーカが引かれた文書のOCR(Optical Character Recognition)を用いた読出しが行われる。
なお、マーカとは、文字の画像(文字イメージ)等、ユーザがマークを付けたい画像の上に重ねて形成される半透明の画像をいい、例えばラインマーカによって形成される。
【0009】
ここで、例えば、
図8(a)に示す画像には、第1文字81a及び第2文字81bよりなる文字81が含まれる。また、この画像には、第1文字81a上に引かれた第1マーカ82a及び第2文字81b上に引かれた第2マーカ82bよりなるマーカ82が含まれる。さらに、画像は、第1マーカ82aと第2マーカ82bとの間に隙間83が形成される。
そして、この画像からマーカを抽出するためにマーカ82の色を検出すると、例えば、
図8(b)に示すように、隙間83の他に、途切れ領域84により途切れを有するマーカ85が抽出された画像が生成される。
【0010】
このマーカ85が途切れ領域84により途切れて抽出される現象は、黒色の文字81上に引かれた半透明のマーカ82は黒色の文字81が透けて、白色の地に引かれたマーカ82とは色が異なることにより生じる。すなわち、地の上に引かれたマーカ82の色を検出して抽出すると、黒色の文字81と重なる一部のマーカ82が抽出されず、抽出したマーカ85には途切れ領域84が形成されることになる。このように、マーカ82の色を抽出した結果、黒色の文字81と重なった一部のマーカ82が抽出されずに途切れたマーカ85が抽出されることは、「黒トギレ」と呼ばれる。
【0011】
なお、黒トギレは、半透明のマーカに限らず、地の上に押された朱色の印鑑と黒色の文字の上に押された印鑑とにおいても、文字上の印鑑が朱色とは異なる色となれば生じる。すなわち、黒トギレは、地の上のマーク画像と、文字等の被マーク画像上に形成されたマーク画像との色が異なる場合に生じる。
また、黒トギレは、マーク画像と、被マーク画像上に形成されたマーク画像との色が異なる場合であれば、被マーク画像が黒色ではないカラー色であっても生じる。
【0012】
この黒トギレを抑制するために、
図8(b)に示すマーカ85を膨張させて、
図8(c)に示すように、途切れ領域84をマーカ85の色に変換することで途切れ領域84を無くすことが考えられる。また、
図8(b)に示すマーカ85を例えば左右方向にずらした画像を元のマーカ85に重ねて、
図8(d)に示すように、途切れ領域84をマーカ85の色で埋めることが考えられる。
しかしながら、隙間83を隔てて2つのマーカを含む画像の場合、これらの方法では、途切れ領域84のみならず、
図8(b)に示す隙間83も無くなり、第1マーカ82aと第2マーカ82bとが結合してしまう。
【0013】
そこで、第1実施形態では、被マーク画像とマーク画像とを含む画像データから色部分を抽出してマーク部分画像を生成し、マーク部分画像を膨張させて収縮した後に画像データとの論理積演算を行う。そして、画像データとの論理積演算によりマーク画像に含まれる隙間を修復して、マーク画像の位置と範囲を認識するための画像(マーク領域画像)を生成する。以下、詳細に説明する。
【0014】
<システム構成>
まず、第1実施形態に係る画像処理システム1の全体構成について説明する。
図1は、第1実施形態における画像処理システム1の全体構成例を示した図である。
図1に示すように、画像処理システム1は、画像処理を行う画像処理装置の一例としての画像処理装置10と、原稿に形成された画像の読取りを行う読取装置20とを備えている。そして、画像処理装置10と、読取装置20とは、ネットワーク30を介して相互に通信を行うものとする。
【0015】
なお、画像処理装置10としては、パーソナルコンピュータの他、複合機やスレート端末等の画像処理を実行可能な装置が例示できる。また、読取装置20としては、スキャナ等のセットされた原稿を読取る装置が挙げられるが、記憶装置に記憶された撮像画像やアプリケーションソフトにより作成された文書ファイル等を読取る装置でもよい。
【0016】
さらに、画像処理装置10と読取装置20とは別々に設けられる構成としたが、画像の読取りを行って画像処理を実行可能な複合機やカメラ機能が搭載されたスレート端末等により一体に構成されても良い。すなわち、画像処理装置10の機能を有する読取装置20としてスキャナや複合機等、また、読取装置20の機能を有する画像処理装置10としてスレート端末等により、画像処理装置10と読取装置20とが一体に構成されても良い。
【0017】
<画像処理装置10のハードウェア構成>
次に、第1実施形態に係る画像処理装置10のハードウェア構成について説明する。
図2は、第1実施形態における画像処理装置10のハードウェア構成例を示した図である。
【0018】
図2に示すように、画像処理装置10は、CPU(Central Processing Unit)501と、ROM(Read Only Memory)やRAM(Random Access Memory)で構成されたメモリ502とを備える。また、画像処理装置10は、フラッシュメモリ、HDD(Hard Disk Drive)やSSD(Solid State Drive)で構成された記憶装置503と、読取装置20との間で通信を行う通信装置504とを備える。さらに、画像処理装置10は、ユーザによる入力を受け付ける入力装置505と、画面を表示する表示装置506とを備える。また、画像処理装置10は、システム・バスや入出力バス等の各種のバスによって各構成要素が相互に接続され、各構成要素間で通信を行う。
第1実施形態の画像処理装置10では、例えば、表示装置506として画面を表示する液晶ディスプレイと、入力装置505としてマウスやキーボード等が用いられる。なお、本実施形態では、例えば画面を表示し設定情報を受付けるタッチパネル等により、入力装置505と表示装置506とが一体に構成されてもよい。
【0019】
なお、
図2は、本実施の形態が適用されるのに好適な画像処理装置10のハードウェア構成を例示するに過ぎず、図示の構成においてのみ本実施の形態が実現されるのではない。
【0020】
<画像処理装置10>
次に、第1実施形態に係る画像処理装置10の機能構成例について説明する。
図3は第1実施形態における画像処理装置10の機能構成例を示したブロック図である。
図4は、第1実施形態における画像処理装置10の動作例を示す図である。
【0021】
図3に示すように、画像処理装置10は、画像データを取得する取得手段の一例としての画像データ取得部101と、画像データに含まれるマーク部分を検出し抽出したマーク部分画像を生成するマーク部分画像生成手段の一例としてのマーク検出部102を備える。また、画像処理装置10は、画像データに含まれる文字部分を検出し抽出した文字イメージを生成する文字部分画像生成手段の一例としての文字検出部103と、マーク部分画像と文字イメージとの論理和演算により結合画像を生成する結合画像生成手段の一例としての論理和演算部104とを備える。
【0022】
また、画像処理装置10は、マーク部分画像を膨張させてマーク膨張画像を生成する膨張画像生成手段の一例としてのマーク膨張部105と、マーク膨張画像を収縮させてマーク収縮画像を生成する収縮画像生成手段の一例としてのマーク収縮部106とを備える。さらに、画像処理装置10は、収縮画像と結合画像との論理積演算を行ってマーク領域画像を生成する共通画像生成手段の一例としての論理積演算部107とを備える。
なお、各画像において、黒色の画素が「1」、白色の画素が「0」で表されるものとする。
【0023】
画像データ取得部101は、読取装置20(
図1参照)からネットワーク30(
図1参照)を介して、画像データを取得する。また、画像データ取得部101は、取得した画像データをマーク検出部102及び文字検出部103に渡す。
【0024】
具体的には、例えば、
図4(a)に示すように、画像データ51は、マークが施される文字である被マーク画像としての文字部分511と、マーク画像としてのマーカ部分512と印鑑部分513とを含む画像である。このように、第1実施形態では、地の色が白色、被マーク画像が黒色、各マーク画像がカラー色である場合について説明するが、マーク画像と被マーク画像とが異なる色であれば被マーク画像がカラー色でもよい。また、被マーク画像としては「文字画像」があるが、具体的には、文字部分511以外の文字記号、数字、図形や記号等が例として挙げられる。
【0025】
マーク検出部102は、
図3に示すように、画像データ取得部101から画像データを受取る。また、マーク検出部102は、画像データに対して色抽出を行い、被マーク画像とは異なるカラー色である特定色の部分を検出して抽出し、後述する演算処理を行うために2値化を行うことでマーク部分画像を生成する。さらに、マーク検出部102は、マーク部分画像を論理和演算部104とマーク膨張部105とに渡す。
なお、マーク検出部102は、画像データに色が異なる複数のマーク画像が含まれる場合、それぞれの色ごとにマーク部分を抽出して色ごとにマーク部分画像を生成する。
【0026】
具体的には、マーク検出部102は、画像データに含まれる特定色の部分を、色抽出によりマーク部分として検出して抽出する。また、マーク検出部102は、論理和演算部104及び論理積演算部107にて後述する演算を行うために2値化を行い、マーク部分を黒色、マーク部分以外の領域である地を白色にしてマーク部分画像を生成する。
すなわち、マーク部分画像は、マーク部分が「1」、地が「0」で表された画像となる。
【0027】
また、マーク検出部102は、例えば、
図4(a)の画像データ51から
図4(b)に示すようなマーク部分画像52を生成する。具体的には、マーク部分画像52は、画像データ51に含まれるマーカ部分512のうち、文字部分511と重なる特定色と異なった色である一部のマーカ部分512が抽出されず、黒トギレ領域522が生じる。
【0028】
文字検出部103は、
図3に示すように、画像データ取得部101から画像データを受取る。また、文字検出部103は、画像データに対してグレースケール化と2値化とを行って、マーク画像とは異なる色である黒色の部分を検出して抽出し、文字イメージを生成する。さらに、文字検出部103は、文字イメージを論理和演算部104に渡す。
また、文字検出部103は、必要に応じて画像処理装置10内の被マーク画像の位置や範囲を認識するための他の機能構成や画像処理装置10の外部に文字イメージを出力する。
【0029】
具体的には、文字検出部103は、白及び黒の明暗で画像を表現するため、画像データに対して、予め定めた階調で変換するグレースケール化を行ってカラー色を灰色に変換する。さらに、文字検出部103は、文字部分を抽出するために、灰色部分を地の色である白色に変換する2値化を行い、黒色部分を文字部分として抽出して文字イメージを生成する。
すなわち、文字イメージは、文字部分が「1」、地が「0」で表された画像となる。
【0030】
また、例えば、
図4(c)に示すように、文字イメージ53は、画像データ51の黒色部分である文字部分511を抽出した画像となる。
なお、文字検出部103は、黒色の部分を被マーク部分として抽出する構成を示したが、被マーク部分がカラー色であれば、マーク検出部102のように、被マーク部分の色の抽出を行って2値化を行い、文字イメージを生成する。
【0031】
論理和演算部104は、
図3に示すように、マーク検出部102からマーク部分画像を受取るとともに、文字検出部103から文字イメージを受取る。また、論理和演算部104は、マーク部分画像と文字イメージとの論理和演算を行い、マーク部分と文字部分とが結合した結合画像を生成する。さらに、論理和演算部104は結合画像を論理積演算部107に渡す。
【0032】
なお、画像データに色が異なる複数のマーク画像が含まれる場合、マーク画像ごとにマーク部分画像が生成されるため、マーク部分画像を用いて生成される結合画像も色ごとに生成される。一方、画像データに1色のマーク画像のみが含まれる場合には、マーク画像ごとにマーク部分画像や結合画像を生成する必要がないため、画像データに対して2値化を施した画像を結合画像とする。
【0033】
具体的には、論理和演算部104は、マーク部分画像の画素と、マーク部分画像の画素の座標に対応する文字イメージの画素とを比較する。そして、論理和演算部104は、マーク部分画像の画素と文字イメージの画素との少なくともいずれかが「1」、すなわち、黒色である場合には、その画素の座標に対応する結合画像の画素の値を「1」とする。また、論理和演算部104は、マーク部分画像の画素と文字イメージの画素との両方が「0」、すなわち、白色である場合に、その画素の座標に対応する結合画像の画素の値を「0」とする。つまり、論理和演算部104は、マーク部分画像の黒色の画素と文字イメージの黒色の画素との両方の黒色部分を抽出する。そして、論理和演算部104は、これらの処理を全ての画素に対して行い結合画像を生成する。
【0034】
例えば、論理和演算部104は、
図4(d)に示すように、
図4(b)に示すマーク部分画像52におけるマーカ部分521の黒色部分と、
図4(c)に示す文字イメージ53における文字部分531の黒色部分とが結合された結合画像54を生成する。すなわち、マーク部分画像52の画素と文字イメージ53の画素とのうち、いずれかが黒色であれば、その画素の座標に対応する結合画像の画素は黒色となる。
なお、
図4では論理和演算を「OR」と表す。
【0035】
マーク膨張部105は、
図3に示すように、マーク検出部102からマーク部分画像を受取る。また、マーク膨張部105は、マーク部分画像のマーク部分を膨張させて、黒トギレが生じている領域を黒色に置き換えたマーク膨張画像を生成する。さらに、マーク膨張部105は、マーク膨張画像をマーク収縮部106に渡す。
【0036】
具体的には、マーク膨張部105は、マーク部分画像に対して、予め設定された膨張率でマーク部分を膨張させる処理を行うことにより、黒トギレが生じている領域を黒色に置き換える。ここで、膨張とは、対象となるマーク部分の輪郭、すなわち、地である白色との境界を構成する黒色の画素を中心として、周辺の予め定めた範囲にある白色の画素を黒色に置き換えることである。つまり、膨張とは、黒色の画素を中心として、中心から周辺に向けて黒色の領域を広げることである。
また、膨張率は、黒色に置き換える範囲を定めるための度合いであり、黒トギレが生じている領域を黒色に置き換えるために予め設定される。
【0037】
マーク収縮部106は、マーク膨張画像をマーク膨張部105から受取る。また、マーク収縮部106は、マーク膨張画像のマーク部分を収縮させて、膨張されたマーク部分を膨張前のマーク部分と概ね同じ大きさにしたマーク収縮画像を生成する。さらに、マーク収縮部106は、マーク収縮画像を論理積演算部107に渡す。
【0038】
具体的には、マーク収縮部106は、マーク膨張画像に対して、予め設定された収縮率でマーク部分を収縮させる処理を行うことで、膨張されたマーク部分を膨張前のマーク部分画像のマーク部分と概ね同じ大きさに戻す。ここで、収縮とは、対象となるマーク部分の輪郭、すなわち、対象となるマーク部分の黒色との境界を構成する白色の画素を中心として、周辺の予め定めた範囲にある黒色の画素を白色に置き換えることである。つまり、収縮とは、白色の画素を中心として中心から周辺に向けて白色の領域を広げ、黒色の領域を縮めることである。
【0039】
また、収縮率は、白色に置き換える範囲を定めるための度合いである。そして、収縮率は、膨張により大きくなったマーク部分を概ね膨張前の大きさに戻すため、膨張率と同等の度合いで予め設定される。
【0040】
論理積演算部107は、マーク収縮部106からマーク収縮画像を受取るとともに、論理和演算部104から結合画像を受取る。また、論理積演算部107は、マーク収縮画像と結合画像との論理積演算を行い、マーク収縮画像の画素と結合画像の画素とが黒色である共通部分を抽出したマーク領域画像を生成する。すなわち、論理積演算部107は、マーク部分画像の黒色の画素と文字イメージの黒色の画素とが重なる部分を抽出する。
さらに、論理積演算部107は、必要に応じて画像処理装置10内のマーク画像の位置や範囲を認識するための他の機能構成や、画像処理装置10の外部に対してマーク領域画像を出力する。
【0041】
なお、画像データに異なる色の複数のマーク画像が含まれる場合には、上述したようにマーク部分画像が色ごとに生成されることから、マーク収縮画像及び結合画像も同様に色ごとに生成される。さらに、この場合、論理積演算部107ではマーク領域画像も同様に色ごとに生成される。
【0042】
具体的には、論理積演算部107は、マーク収縮画像の画素と、マーク収縮画像の画素の座標に対応する結合画像の画素とを比較する。そして、論理積演算部107は、マーク収縮画像の画素と結合画像の画素との両方が「1」、すなわち、黒色である場合に、その画素の座標に対応する画素の値を「1」とする。また、論理積演算部107は、マーク収縮画像の画素と結合画像の画素との少なくともいずれかが「0」、すなわち、白色である場合には、その画素の座標に対応する画素の値を「0」とする。論理積演算部107は、これらの処理を、全ての画素に対して行ってマーク領域画像を生成する。
【0043】
例えば、論理積演算部107は、
図4(f)に示すマーク収縮画像56と、
図4(d)に示す結合画像54との共通部分が抽出されて、
図4(g)に示すようなマーク領域画像57を生成する。すなわち、マーク収縮画像56の画素と結合画像54の画素とのうち、両方ともが共通して黒色であれば、その画素の座標に対応するマーク領域画像57の画素は黒色となる。
なお、
図4では論理積演算を「AND」と表す。
【0044】
ここで、
図3に示すように、画像データ取得部101、マーク検出部102、文字検出部103、論理和演算部104、マーク膨張部105、マーク収縮部106及び論理積演算部107は、例えば、
図2に示すハードウェア構成におけるCPU501により実現される。より具体的には、画像処理装置10の機能を実現するプログラムがメモリ502または記憶装置503に記憶されており、CPU501がこのプログラムをメモリ502にロードして実行することにより、画像データ取得部101、マーク検出部102、文字検出部103、論理和演算部104、マーク膨張部105、マーク収縮部106及び論理積演算部107の各機能が実現される。
【0045】
なお、CPU501によって実行されるプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータが読取可能な記録媒体に記憶した状態で提供し得る。また、インターネットなどの通信手段を用いて画像処理装置10にダウンロードさせてもよい。
【0046】
<第1実施形態における画像処理装置10の処理手順>
次に、第1実施形態における画像処理装置10の動作例について説明する。
まず、
図4に示すように、画像処理装置10は、画像データ取得部101にて読取装置20(
図1参照)から画像データを取得し、マーク検出部102にて特定の色のマーク部分を検出して抽出しマーク部分画像を生成する(ステップ1)。
【0047】
具体的には、例えば、
図4(a)に示すように、画像データ51には、黒色の文字部分511、第1マーカ512aと第2マーカ512bとで形成される青色のマーカ部分512及び朱色の印鑑部分513が含まれる。さらに、画像データ51には、マーカ部分512を第1マーカ512aと第2マーカ512bとに分け隔てる隙間514が含まれる。
【0048】
また、マーク検出部102は、画像データ51に対して色抽出と2値化との処理を行って、青色のマーカ部分512を検出して抽出し、
図4(b)に示すマーク部分画像52を生成する。この場合、
図4(b)に示すように、マーク部分画像52のマーカ部分521は、黒トギレが生じた黒トギレ領域522と、隙間514に対応する隙間523とにおいて途切れた形状となる。
【0049】
さらに、この場合、マーク検出部102は、画像データ51に含まれる朱色の「済」の印鑑部分513を抽出して図示しないマーク部分画像を生成する。なお、画像データ51には、青色のマーカ部分512のみ、すなわち、1色のマーク画像のみが含まれている場合には、そのマーク画像に対応する1つのマーク部分画像のみが生成される。
【0050】
次に、画像処理装置10は、画像データから文字検出部103にて文字部分を抽出して文字イメージを生成する(ステップ2)。具体的には、文字検出部103は、画像データ51に対してグレースケール化と2値化との処理を行い、黒色の文字部分511を検出して抽出し、
図4(c)に示す文字部分531を含む文字イメージ53を生成する。
【0051】
次に、画像処理装置10は、論理和演算部104にてマーク部分画像と文字イメージとの論理和演算により結合された結合画像を生成する(ステップ3)。具体的には、論理和演算部104では、例えば、
図4(b)に示すマーク部分画像52と、
図4(c)に示す文字イメージ53との論理和演算により、
図4(d)に示すように、マーカ部分521と文字部分531とが結合された結合画像54が生成される。
【0052】
なお、
図4(a)に示す画像データ51には、青色のマーカ部分512とは別に朱色の印鑑部分513が含まれており、印鑑部分513のマーク部分画像が生成される。それに伴い、論理和演算部104では、朱色の印鑑部分513のマーク部分画像を用いて図示しない結合画像を別途生成する。また、画像データ51が青色のマーカ部分512のみを含み、朱色の印鑑部分513等の他の色のマーク画像を含まない場合、マーク画像ごとにマーク部分画像や結合画像を生成する必要が無いため、画像データ51に対して2値化を施した画像を結合画像とする。
【0053】
さらに、画像処理装置10は、マーク膨張部105にて、マーク部分画像のマーク部分を膨張させる処理を行ってマーク膨張画像を生成する(ステップ4)。また、画像処理装置10は、マーク収縮部106にて、マーク膨張画像のマーク部分を収縮させる処理を行ってマーク収縮画像を生成する(ステップ5)。
【0054】
具体的には、マーク膨張部105では、
図4(b)に示すマーク部分画像52を用いた場合、
図4(e)に示すように、マーカ部分521を膨張して大きくしたマーカ部分551を含むマーク膨張画像55を生成する。また、マーク膨張画像55のマーカ部分551では、マーク部分画像52における黒トギレ領域522と隙間523とに対応する領域が黒色に置き換えられる。
【0055】
また、マーク収縮部106では、
図4(e)に示すマーク膨張画像55を用いた場合、
図4(f)に示すように、マーカ部分551を収縮して小さくしたマーカ部分561を含むマーク収縮画像56を生成する。そして、マーク収縮画像56のマーカ部分561は、黒トギレ領域522と隙間523に対応する部分は黒色に置き換えられたまま縮み、
図4(b)に示す膨張前のマーカ部分521と概ね同じ大きさになる。
【0056】
そして、画像処理装置10は、論理積演算部107にてマーク収縮画像と結合画像との論理積演算を行い、マーク領域画像を生成する(ステップ6)。そして、画像処理装置10は、処理を完了する。
【0057】
具体的には、論理積演算部107では、
図4(f)に示すマーク収縮画像56と、
図4(d)に示す結合画像54との論理積演算により、
図4(g)に示すようなマーク領域画像57が生成される。すなわち、論理積演算部107では、第1マーク領域571aと第2マーク領域571bとで形成されるマーク領域571と、第1マーク領域571aと第2マーク領域571bとを隔てる隙間572とを含むマーク領域画像57が生成される。
【0058】
なお、論理積演算部107は、
図4(a)の画像データ51に含まれる朱色の印鑑部分513についても、印鑑部分513のマーク収縮画像と印鑑部分513の結合画像との論理積演算により図示しないマーク領域画像を別途生成する。この場合、論理積演算部107では、印鑑部分513の隙間に対応する位置に隙間を含むマーク領域画像が生成される。
【0059】
ここで、ステップ1からステップ6は、この順序で実行されることとしたが、ステップ1及びステップ2の後にステップ3が実行され、ステップ4の後にステップ5が実行され、さらに、ステップ3及びステップ5の後にステップ6が実行されるものであれば、如何なる順序で実行されてもよい。或いは、ステップ1及びステップ2が並行に実行され、ステップ4またはステップ5とステップ2またはステップ3とが並行に実行されるものであってもよい。
【0060】
さらに、第1実施形態では、マーク収縮部106にてマーク膨張画像を収縮する処理を行ったが、例えばマーク膨張部105にて行った膨張の度合いによっては省略しても良い。また、上述した通り、画像データに1色のマーク画像のみが含まれる場合、結合画像として2値化を施した画像データを用いても良い。これに伴い、第1実施形態では、画像データから抽出したマーク部分画像を膨張させたマーク膨張画像と、2値化を施した画像データとの論理積演算を行うことにより、マーク領域画像を生成しても良い。
【0061】
すなわち、第1実施形態では、例えば膨張の度合いが少なく収縮しなくても支障が無い場合等、収縮を必要としない場合には、
図4に示すステップ5の収縮の処理を省略しても良い。また、第1実施形態では、2値化を施した画像データを結合画像とすることで、
図4に示すステップ2及びステップ3の結合画像を生成する処理を省略しても良い。
【0062】
また、第1実施形態では、論理積演算部107において、マーク収縮部106にてマーク膨張画像を収縮したマーク収縮画像と、論理和演算部104にて生成された結合画像との論理積演算によりマーク領域画像を生成する構成とした。しかし、このような構成以外にも、マーク収縮部106にてマーク膨張画像を収縮させずに、論理積演算部107にてマーク膨張画像と結合画像との論理積演算によりマーク領域画像を生成し、マーク収縮部106にてマーク領域画像を収縮する構成としてもよい。
この場合には、さらに、マーク領域画像とマーク部分画像との論理和演算を行うことで、マーク領域画像のマーク領域がマーク画像の形状により近似する。
【0063】
このように、第1実施形態では、マーク画像の位置や範囲を認識するためのマーク領域画像を生成する際、膨張を行って黒トギレが生じた部分を結合して修復する。それに加えて、第1実施形態では、マーク画像を分断する隙間に対応するマーク部分が膨張により結合されても、結合画像とマーク収縮画像との論理積演算を行って隙間を生成して結合しないようにする。したがって、第1実施形態では、マーカの近くに別のマーカがあるマーク画像であってもマーカを結合させずに黒トギレが修復される。
【0064】
なお、第1実施形態は、マーカの場合に限らず、印鑑画像のように隙間を含むマーク画像であっても、上述した構成により、印鑑画像の隙間に対応する隙間が生成されたマーク領域画像が得られる。したがって、第1実施形態の画像処理装置10では、印鑑画像を抽出する際においても、印鑑画像の黒トギレが修復されるととともに隙間が生成されることで、印鑑画像が何を示す印鑑であるのか認識可能なマーク領域画像が生成される。
また、第1実施形態の画像処理装置10では、画像データに複数色のマーク画像が含まれる場合には色ごとにマーク領域画像を生成して、マーク画像を色ごとに認識できるマーク領域画像が生成される。
【0065】
<第2実施形態>
続いて、第2実施形態が適用される画像処理装置10について説明する。なお、第2実施形態においては、第1実施形態において説明した機能構成と同様の構成については同一の符号を付してその詳細な説明を省略する。
第2実施形態では、画像データに含まれる画像の領域(画像領域)を取囲む最小の矩形(以下、バウンディングボックス)を算出して文字部分を抽出する。また、第2実施形態では、文字部分のバウンディングボックスの幅に応じて、マーク膨張部105にて行われる膨張処理の膨張率を設定する。
【0066】
第2実施形態における画像処理装置10の機能構成例について説明する。
図5は第2実施形態における画像処理装置10の機能構成例を示したブロック図である。
図6は、第2実施形態の画像処理装置10により生成される画像の例を示す図である。
【0067】
図5に示すように、第2実施形態における画像処理装置10は、画像データ取得部101、マーク検出部102、矩形画像生成手段の一例としての文字検出部103、論理和演算部104、マーク膨張部105、マーク収縮部106、論理積演算部107、及び文字幅判定部108を備える。このうち、画像データ取得部101、マーク検出部102、論理和演算部104、マーク膨張部105、マーク収縮部106、及び論理積演算部107については、第1実施形態と同じ機能構成であるためその説明を省略し、以下では、文字検出部103及び文字幅判定部108について詳細に説明する。
【0068】
文字検出部103は、画像データ取得部101から画像データを受取る。また、文字検出部103は、画像データに含まれる画像領域ごとにバウンディングボックスを算出する。さらに、文字検出部103は、バウンディングボックスが予め定められた範囲内となる画像領域を文字部分として判別して抽出し、文字イメージを生成する。また、文字検出部103は、文字イメージを論理和演算部104に渡す。さらに、文字検出部103は、画像領域ごとに算出したバウンディングボックスのうち、各文字部分に対応するバウンディングボックスの大きさを示す矩形情報を文字幅判定部108に渡す。
【0069】
具体的には、文字検出部103は、例えば、図形と文字とを含む画像データに対して、第1実施形態と同様に、グレースケール化を行った後に2値化を行って黒色部分を画像領域として検出する。また、文字検出部103は、検出した全ての画像領域について、画像領域ごとに輪郭を抽出してバウンディングボックスを算出する。そして、文字検出部103は、バウンディングボックスの大きさが予め定められた範囲内であれば、その画像領域を文字部分と判別して抽出することで文字イメージを生成する。
【0070】
予め定められたバウンディングボックスの範囲は、画像データに含まれる文字部分のバウンディングボックスの大きさに応じて設定される。すなわち、文字部分と比較して小さい図形の画像領域や大きな図形の画像領域が画像データに含まれる場合、文字検出部103にて、これらの図形の画像領域が文字部分として判別されないように範囲が設定される。
【0071】
より具体的には、例えば、
図6(a)に示す画像データ61は、例えば12ptや32ptのフォントサイズで書かれた文字部分611と文字部分611より大きい図形614とが含まれる。この場合、例えば、
図6(b)に示す文字部分611のバウンディングボックス631を含むが、図形614のバウンディングボックス632は除外される範囲が設定される。
【0072】
文字幅判定部108は、文字検出部103から矩形情報を受取る。また、文字幅判定部108は、矩形情報を参照して、バウンディングボックスの幅が予め設定された閾値以上となる文字部分があるか否かを判定する。さらに、文字幅判定部108は、バウンディングボックスの幅が予め設定された閾値以上となる文字部分があると判定した場合、調整膨張率をマーク膨張部105に渡し、調整収縮率をマーク収縮部106に渡す。
【0073】
ここで、調整膨張率は、幅が広い黒トギレを黒色に置き換えるために予め調整して設定された度合いであり、予め設定される膨張率よりも大きく設定される。例えば、フォントサイズが8ptの文字よりもサイズが大きい32ptの文字は、文字の太さも8ptより太いため、32ptの文字により生じる黒トギレの幅が広くなる。これに伴い、例えば、8ptの文字により生じる黒トギレを埋める膨張率が予め設定されている場合、32ptの文字により生じる黒トギレを埋めるため、マーク膨張部105に対しては、予め設定された膨張率よりも高い度合いの調整膨張率を設定する必要がある。
【0074】
なお、文字幅判定部108では、バウンディングボックスの幅が閾値以上であるか否かを判定したが、全ての文字部分のバウンディングボックスの幅が閾値以下であるか否かについての判定も行ってもよい。この場合に、文字幅判定部108では、全ての文字部分のバウンディングボックスの幅が閾値以下であると判定した場合、予め設定される膨張率よりも度合いが小さい調整膨張率が設定される。
【0075】
例えば、8ptにより生じる黒トギレの幅は、8ptよりサイズが大きく太さがより太い64ptにより生じる黒トギレの幅よりも小さい。したがって、例えば、64ptの文字により生じる黒トギレを埋める膨張率が予め設定されているが、画像データが8ptの文字のみを含む場合、文字幅判定部108は、膨張率よりも小さく8ptの文字により生じる黒トギレを埋める度合いの調整膨張率を設定する。
【0076】
また、調整収縮率は、調整膨張率による膨張で大きくなったマーク部分を概ね膨張前の大きさに戻すために予め調整して設定された度合いである。具体的には、予め設定された膨張率よりも高い度合いの調整膨張率が設定された場合には、調整収縮率は、調整膨張率に対応して、予め設定される収縮率よりも大きい割合が設定される。一方、予め設定された膨張率よりも小さい度合いの調整膨張率が設定された場合には、調整収縮率は、調整膨張率に対応して、予め設定される収縮率よりも小さい割合が設定される。
【0077】
<第2実施形態における画像処理装置10の処理手順>
次に、第2実施形態における画像処理装置10の動作例を説明する。
図7は、第2実施形態における画像処理装置10の動作例を示す図である。
まず、画像処理装置10は、画像データ取得部101にて画像データを取得し、マーク検出部102にて、
図4におけるステップ1の処理を行ってマーク部分画像を生成する。
【0078】
具体的には、例えば、
図6(a)に示すように、画像データ61には、大きめの文字である「ア行」の文字611a及び小さめの文字である「アイウエオ」の文字611bからなる文字部分611が含まれる。また、画像データ61には、「イウ」の文字部分に引かれた第1マーカ612a及び「エオ」の文字部分に引かれた第2マーカ612bを含むマーカ部分612が含まれる。さらに、画像データ61には、第1マーカ612a及び第2マーカ612bを隔てる隙間613と図形614とが含まれる。
【0079】
例えば、マーク検出部102は、この画像データ61から、
図6(b)に示すように、「ア行」のマーカ部分621aと、「イウ」の第1マーカ部分621bと、「エオ」の第2マーカ部分621cとが含まれるマーク部分画像62を生成する。また、この場合、マーク部分画像62には、「ア行」のマーカ部分621aに第1黒トギレ領域622aと、「イウ」の第1マーカ部分621b及び「エオ」の第2マーカ部分621cに第1黒トギレ領域622aよりも細い第2黒トギレ領域622bとが含まれる。さらに、マーク部分画像62には、「イウ」の第1マーカ部分621b及び「エオ」の第2マーカ部分621cの間に隙間623が含まれる。
【0080】
また、文字検出部103は、画像データ取得部101から取得した画像データに対してグレースケール化の後に2値化を行って黒色部分を画像領域として抽出し、各画像領域の輪郭を抽出してバウンディングボックスを算出する。また、文字検出部103は、
図7に示すように、予め定められた範囲内となる画像領域を文字部分として抽出して文字イメージを生成する(ステップ101)。
【0081】
具体的には、
図6(c)に示すように、例えば、文字検出部103にて画像データ61をもとにバウンディングボックスを算出すると、図形614のバウンディングボックス632は、各文字部分611のバウンディングボックス631よりも大きくなる。
また、この場合、例えば、文字検出部103では、文字部分611のバウンディングボックス631は含まれるが、図形614のバウンディングボックス632は除外される範囲が予め設定される。そして、文字検出部103は、予め設定された範囲内であるバウンディングボックス631に対応する画像領域、すなわち、文字部分611を文字部分として抽出し、
図6(d)に示す文字イメージ64を生成する。
【0082】
次に、文字検出部103は、文字幅判定部108に各文字部分に対応するバウンディングボックスの情報である矩形情報を渡す。そして、文字幅判定部108は、
図7に示すように、矩形情報を参照して、バウンディングボックスの幅が閾値以上となる文字部分があるか否かを判定する(ステップ102)。また、文字幅判定部108は、バウンディングボックスの幅が閾値以上となる文字部分があると判定した場合(ステップ102にてYes)、調整膨張率をマーク膨張部105に渡し、調整収縮率をマーク収縮部106に渡す(ステップ103)。
【0083】
具体的には、文字幅判定部108は、例えば、
図6(c)に示す文字部分611のバウンディングボックス631の幅をもとに判定を行う。ここで、例えば、文字幅判定部108は、「アイウエオ」の各文字部分のバウンディングボックス631bの幅を閾値以下であり、幅がより大きい「ア行」の各文字部分のバウンディングボックス631aを閾値以上であると判定する。
【0084】
また、マーク膨張部105に対して、例えば、
図6(b)に示すマーク部分画像62に含まれる「イウ」の第1マーカ部分621bに生じた第2黒トギレ領域622bを埋める膨張率が予め設定されているとする。この場合、文字幅判定部108は、膨張率よりも高い度合いであり、閾値以上である「ア行」のマーカ部分621aにより生じる第1黒トギレ領域622aを埋めるような調整膨張率をマーク膨張部105に渡す。また、文字幅判定部108は、調整膨張率を用いてマーク膨張部105にて膨張されたマーク膨張画像を膨張前の大きさに戻すため、調整膨張率に対応して、収縮率よりも高い度合いの調整収縮率をマーク収縮部106に渡す。
【0085】
画像処理装置10は、マーク部分画像に対して、マーク膨張部105にて調整膨張率を用いた
図4に示すステップ4の膨張を行ってマーク膨張画像を生成する。さらに、画像処理装置10は、マーク膨張画像に対して、マーク収縮部106にて調整収縮率を用いた
図4に示すステップ5の収縮を行ってマーク収縮画像を生成する。また、論理和演算部104では、
図4に示すステップ3と同様にマーク部分画像と文字イメージとの論理和演算により結合画像が生成される。そして、画像処理装置10は、
図4に示すステップ6と同様に、論理積演算部107にてマーク収縮画像と結合画像との論理積演算によりマーク領域画像を生成し、処理を完了する。
【0086】
具体的には、マーク膨張部105では、調整膨張率を用いて膨張を行い、例えば、
図6(b)に示すマーク部分画像62の第2黒トギレ領域622bよりも幅が広い第1黒トギレ領域622aが結合された
図6(e)に示すマーク膨張画像65が生成される。また、マーク膨張画像65は、マーク部分画像62の第1マーカ部分621bと第2マーカ部分621cとが結合される。さらに、マーク収縮部106では、マーク膨張画像65を調整収縮率で収縮して図示しない収縮画像が生成される。
【0087】
また、
図6(b)に示すマーク部分画像62と、
図6(d)に示す文字イメージ64との論理和演算により図示しない結合画像を生成する。そして、論理積演算部107では、例えば、
図6(a)に示す画像データ61の「イウ」の第1マーカ612a及び「エオ」の第2マーカ612bの間に設けられた隙間613に対応する隙間部分が生成されたマーク領域画像が得られる。
【0088】
一方、画像処理装置10は、
図7に示すように、文字幅判定部108にて、バウンディングボックスの幅が閾値以上となる文字部分がないと判定された場合(ステップ102にてNo)、予め設定された膨張率及び収縮率を用いて、
図4に示すステップ3からステップ6の処理を行う。そして、画像処理装置10は、論理積演算部107にて、生成された結合画像とマーク収縮画像との論理積演算によりマーク領域画像を生成し、処理を完了する。
【0089】
第2実施形態の画像処理装置10では、文字検出部103にて画像データに含まれる画像領域のバウンディングボックスを算出することにより、例えばOCRよりも負荷が少なく短時間で文字であるか否かを判別する。また、第2実施形態では、サイズが大きく太い文字を含む場合でも、膨張率を調整膨張率に変えて膨張を行うことで、大きな黒トギレ領域も黒色に変換される。
【0090】
なお、文字幅判定部108は、バウンディングボックスの幅が予め設定された閾値以上となる文字部分があるか否かを判定したが、幅としては縦や横の長さ等、バウンディングボックスの大きさが分かればよい。
さらに、文字幅判定部108では、予め閾値を複数設定して閾値の範囲ごとに、膨張率を大きくしたり小さくしたり調整して設定する構成にして、膨張率を文字の大きさによって段階的に異なる度合いが設定される構成でもよい。また、この場合、画像処理装置10は、文字の大きさや太さによって柔軟に膨張させる度合いが設定され、様々な太い文字による黒トギレに対応する。
【0091】
次に、マークされた文字を判別するための画像の生成を図る構成について説明する。
第2実施形態における文字検出部103は、各文字部分に対応するバウンディングボックスの領域を黒色で表した画像である矩形画像を生成する構成とする。そして、文字検出部103は、論理積演算部107に矩形画像を渡し、論理積演算部107では、マーク領域画像と矩形画像との論理積演算により領域画像を生成するような構成とする。すなわち、論理積演算部107では、マーク領域画像と各文字部分のバウンディングボックスの領域との共通部分が抽出された領域画像が生成される。
【0092】
この構成により生成された領域画像は、例えば、バウンディングボックスとマーク領域画像とが重なっている位置と範囲とを判別し、バウンディングボックスに対応する文字にマークがあるか否かの認識を容易にする。すなわち、この構成における画像処理装置10は、文章中のどの文字にマークがされているかを容易に認識できる領域画像を生成する。
なお、この場合、文字幅判定部108は、バウンディングボックスの算出を行って矩形画像を生成し、論理積演算部107に矩形画像を渡す構成であれば、第2実施形態にて説明した判定を必ずしも行わなくてもよい。