(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0019】
まず、実施例の前提となる技術について説明する。前提技術では、座標データから筆跡画像を生成し、スキャナから読み取った文書画像から筆跡画像に近い画像を検索し、検索された部分画像を筆跡画像に基づいて消去する。
【0020】
図1は、前提技術の筆跡消去処理の流れを説明する図である。
図1に示すように、電子ペン10を用いて資料に追記で筆記する。このとき、電子ペン10は、資料に筆記した座標データを取得する。
【0021】
スキャナ装置20は、電子ペン10で追記された資料を読み取り、スキャン画像である文書画像a101を取得する。また、電子ペン10から座標データを取得した装置が、座標データから筆跡画像a102を生成する。
【0022】
筆跡画像a102を生成した装置は、スキャナ装置20から文書画像a101を取得し、文書画像a101内で筆跡画像a102に類似する部分画像を検索する。装置は、検索された部分画像から筆跡画像a102を用いて筆跡を消去することで、元の資料の文書画像a103を生成することができる。元の資料とは、電子ペン10で筆記された部分を除く元々記載されていた文字や図形などを含む資料をいう。
【0023】
ここで、電子ペン10で取得できる座標値は、電子ペン10が持つ基準点に対する相対座標である。紙面における座標データは、座標の原点と紙の位置を慎重に合わせることによって得ることができる。
【0024】
しかし、スキャンした文書画像は、スキャン時の紙の位置や角度に微小な変動が生じるため、文書画像の座標系と座標データの座標系は、必ずしも完全に一致するわけではない。紙の位置が数mm程度ずれただけでも筆跡の画素と筆跡の座標値は全く異なる位置を示す。そのため、電子ペン10で取得できる座標値を絶対座標として扱っても、スキャン画像から筆跡に属する画素だけを消去することはできない。
【0025】
すなわち、電子ペン10を用いて得られる筆跡の位置は、筆跡の大まかな位置と形状が分かるということであり、スキャン画像から筆跡のみを消去するという用途のためには座標の精度は不十分である。
【0026】
また、通常の電子ペン10は、紙がめくられて変わった場合に、筆記している紙が別の紙に変わったという情報を取得することができない。専用のボタンを設けるなどによってページ移動のタイミングを指定したとしても、複数ページの資料を参照する際には、ページは順番に参照されるとは限らない。例えば10ページ目に書き込んだ直後に、1ページ目に戻ることもあり得る。
【0027】
そのため、座標データがどのページに書かれているのかを確実に記録するのは困難であり、ユーザにとって煩雑である。したがって、電子ペン10によって得られる座標データは、スキャン画像の原点に対する絶対座標として解釈することはできず、位置合わせの処理が必要となる。
【0028】
そこで、着目するのが、一般化ハフ変換を用いた任意図形の検索技術である。一般化ハフ変換は、「D.H. Ballard, "Generalizing the Hough transform to detect arbitrary shapes," Pattern Recogniton, vol.13, no.2, pp.111-122, 1981.」を参照されたい。
【0029】
一般化ハフ変換は、検索したい画像と、検索の対象となる画像の双方からエッジ点を求める。この場合、検索したい画像は、筆跡画像であり、検索対象となる画像はスキャン画像である。求めたエッジ点の位置と方向を投票することによって、任意の図形を検索するものである。
図2は、一般化ハフ変換の具体的な手順を説明する図である。
(1)検索画像と対象画像の双方からエッジ点を検出する
(2)対象画像の全エッジ点の方向から、基準点への相対位置に得点を投票する
(3)検索画像の中で投票値の最大値が、検索画像の基準点の位置を示す
通常、エッジ点は、Sobelオペレータで画像の勾配値を求め、一定の閾値を超えた勾配値の位置と方向を格納する。一例としては、特開平09−245167号公報を参照されたい。
【0030】
図3は、座標点データから筆跡画像を生成する一例を示す図である。検索したい筆跡は、筆跡の座標点データで与えられているので、
図3に示すように座標点データから筆跡画像を生成して検索すればよい(例えば特開2011−258129参照)。また、座標点データは、筆跡の曲線を折れ線近似した、線分の集合だとみなすことができるので、各線分から筆跡の方向を求めて、エッジ方向とみなすという方法もある。
【0031】
ここで、スキャンされた文書画像の中に含まれる筆跡を、同じ筆跡の座標点データを用いて検索する場合、筆跡の太さが分からないため、検索の精度が低下する可能性がある。紙文書に書かれた筆跡は、使用した電子ペン10や使用者の書き方によって異なった太さの筆跡となっている。例えば細いボールペンと、水性のサインペンでは線の太さに大きな差がある。それに対して、検索したい筆跡は筆跡の座標点データであるため、線の太さの情報は持っていない。
【0032】
図4は、細い筆跡と太い筆跡とから生成したエッジ画像の一例を示す図である。
図4に示すように、線幅が細い筆跡と太い筆跡とをそれぞれエッジ画像に変換すると、エッジは文字の輪郭に沿っているため、異なった線幅の筆跡は、エッジの位置が大きく異なる。そのため、
図4に示すように、座標点データから筆跡画像を生成した場合、生成した筆跡の線幅と、文書中の筆跡の線幅が大幅に異なる場合には検索精度が低下してしまう。
【0033】
線幅の違いを吸収するためには、筆跡画像を細線化するという技術が存在する(例えば特開2009−53826参照)。この技術は、筆跡画像の幅を画像処理的に縮小させて、線幅が1になるようにする技術である。
【0034】
しかし、一般的な細線化技術では、筆跡の線を高精度で復元することはできず、多くのノイズや不正確なパターンが生成されることが知られている。
図5は、文字の太さによる細線化画像の違いを示す図である。
図5に示すように、線幅の異なる筆跡をそれぞれ細線化した例では、例えば「筆」の字の一部のように、細かい構造が太い線では崩れてしまう。
【0035】
そのため、比較的小さく書かれた筆跡を検索するのは困難である。ただし、同じ太さの線幅で筆跡画像を生成すれば、文字の一部の潰れ加減も似てくるため、文字が小さく潰れた筆跡画像でも検出することが可能となる。
【0036】
すなわち、筆跡の線幅が異なれば細かな構造の崩れ方が異なるため、細線化によって同じ幅の筆跡に変換したとしても、やはり異なった線幅の筆跡は検出が困難だということになる。
【0037】
以上のように、文書画像中から追記した筆跡を見つけて消去する機能を実現するために、電子ペン10を用いて取得した座標データを用いて文書画像中の該当する筆跡を見つけようとしても、筆跡の線幅が分からないために検索精度が低下してしまう。
【0038】
書き込みに使用している電子ペン10の種類が予め分かっていれば、筆跡の線幅はある程度は分かる。種類は分かっても、筆記する際の力のかけ具合によって線幅は変化する。また、電子ペン10の先端はインク補充やペンの色、太さを変えるために着脱式となっていることが多く、筆記する際の線の太さは通常は不明である。
【0039】
ユーザに線幅を指定させることも原理的には可能であるが、そのような煩雑な操作はユーザにとっての使い勝手を損ねるため、通常の電子ペン10では筆記前にペンの太さを指定するような機能は装備されていない。よって、一般的に市販されている電子ペン10を用いる場合、筆跡の線幅は未知であることが多い。
【0040】
従って、筆跡の線幅が不明な場合でも、電子ペン10を用いて取得した座標データを用いて追記された筆跡を、スキャンされた文書画像中から見つけ、その筆跡を消去する機能が求められる。
【0041】
そこで、以下に示す実施例では、筆跡の線幅を複数用意し、各線幅の筆跡画像を用いて文書画像内で筆跡部分に最も類似する筆跡画像を選択し、選択された筆跡画像を消去に用いる。以下、実施例について、添付図面を参照しながら説明する。
【0042】
[実施例]
<ハードウェア>
図6は、実施例における画像処理装置100のハードウェアの一例を示すブロック図である。
図6に示す例では、画像処理装置100は、スキャナ装置20、表示装置30、電子ペン10と接続される。
【0043】
電子ペン10は、紙などに筆記することができ、筆記の座標データを同時に取得することができるデバイスである。電子ペン10は、有線又は無線により取得した座標データを画像処理装置100に送信する。電子ペン10は、ペン先が付け替え可能である。電子ペン10として、例えば、超音波型電子ペン、アノトペン、ペンタブレットなどの市販品を適用できる。
【0044】
超音波型電子ペンは、ペン先から一定間隔(100回/秒程度)で超音波と赤外線のパルスを発信する。これを、2箇所の超音波受信機での時間差を用いて三角測量の原理でペン先の座標を計測する。
【0045】
アノトペンは、微小なドットが印刷された専用紙を用いる。ペン先には紙面を撮影するカメラが装着され、筆記中に撮影したドットパターンを用いて、ペン先の座標を認識する。
【0046】
ペンタブレットは、電磁界を発信・検出するタブレットを下敷きとして使用する。ペン先には通常コイルが内蔵され、筆記すると、電磁誘導によりペン先の座標をタブレットが検知可能になる。ペン先にはポールペン等を取り付けることが可能であり、紙への筆記と座標データ取得の両立が可能である。
【0047】
スキャナ装置20は、紙面上の画像をスキャンして二次元に配置されたx,y座標に対して一つずつ画素値を読み込む。読み込まれる画素値がカラー画像の場合、画素値はR(赤色)、G(緑色)、B(青色)の3色の組で表される。
【0048】
読み込まれる画像がグレイ画像の場合、画素値は明度値を表すことが多い。RGBの3色のカラー画素値は、例えば明度値=0.299×R+0.587×G+0.114×Bの変換式を用いて明度値へ変換することができる。スキャナ装置20は、読み込んだ文書画像を画像処理装置100に送信する。
【0049】
画像処理装置100は、座標データから生成した各線幅の筆跡画像を用いて、文書画像内で筆跡部分に最も類似する筆跡画像を選択し、選択された筆跡画像を用いて筆跡部分を消去する。画像処理装置100は、筆跡部分を消去した文書画像を表示するよう制御してもよい。
【0050】
表示装置30は、例えばLCD(Liquid Crystal Display)等であり、画像処理装置100から取得した筆跡部分の消去後の文書画像を表示する。
【0051】
画像処理装置100は、ハードウェアとして、制御部101、主記憶部102、補助記憶部103、通信部104、ドライブ装置105を有する。各部は、バスを介して相互にデータ送受信可能に接続されている。
【0052】
制御部101は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPU(Central Processing Unit)である。また、制御部101は、主記憶部102や補助記憶部103に記憶されたプログラムを実行する演算装置であり、入力装置や記憶装置からデータを受け取り、演算、加工した上で、出力装置や記憶装置に出力する。
【0053】
主記憶部102は、例えば、ROM(Read Only Memory)やRAM(Random Access Memory)などである。主記憶部102は、制御部101が実行する基本ソフトウェアであるOSやアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
【0054】
補助記憶部103は、例えばHDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。補助記憶部103は、例えばスキャナ装置20から取得した文書画像を記憶する。
【0055】
通信部104は、有線又は無線で周辺機器とデータ通信を行う。通信部104は、例えばネットワークを介して、文字を含む画像を取得し、補助記憶部103に記憶する。
【0056】
ドライブ装置105は、記録媒体106、例えばフレキシブルディスクやCD(Compact Disc)から所定のプログラムを読み出し、記憶装置にインストールする。
【0057】
また、記録媒体106に、所定のプログラムを格納し、この記録媒体106に格納されたプログラムは、ドライブ装置105を介して画像処理装置100にインストールされる。インストールされた所定のプログラムは、画像処理装置100により実行可能となる。
【0058】
なお、画像処理装置100は、スキャナ装置20及び表示装置30を別構成としたが、どちらか一方、又は両方を含む構成としてもよい。
【0059】
<機能>
図7は、実施例における画像処理装置100の機能の一例を示すブロック図である。
図7に示す例では、画像処理装置100は、画像取得手段201と、筆跡取得手段202と、生成手段203と、検索手段204と、選択手段205と、消去手段206とを有する。
図7に示す各手段は、例えば制御部101が、補助記憶部103に記憶される筆記消去処理プログラムを主記憶部102にロードし、実行することで機能する。
図7に示す各手段は、例えば制御部101及びワークメモリとしての主記憶部102により実現されうる。
【0060】
画像取得手段201は、電子ペン10による筆跡を含む文書の文書画像をスキャナ装置20から取得する。画像取得手段201は、取得した文書画像を検索手段204及び消去手段206に出力する。
【0061】
筆跡取得手段202は、電子ペン10による筆跡の座標データを電子ペン10から取得する。筆跡取得手段202は、取得した座標データを生成手段203に出力する。
【0062】
生成手段203は、複数の異なる線幅を用いて、取得した座標データに基づく複数の筆跡画像を生成する。生成手段203は、生成した複数の筆跡画像を検索手段204に出力する。
【0063】
検索手段204は、生成された筆跡画像毎に、この筆跡画像と類似する筆跡部分の画像を文書画像から検索する。検索手段204は、例えば、一般化ハフ変換を用いて検索を行う。また、検索手段204は、筆跡画像をテンプレートとし、文書画像内でパターンマッチング技術を用いて検索してもよい。検索手段204は、検索結果を選択手段205に出力する。
【0064】
選択手段205は、文書画像内の筆跡部分の画像と最も類似する筆跡画像を選択する。選択手段205は、例えば、筆跡画像毎に算出された一致度を表すスコア(得点)を用いて、スコアが最も高い筆跡画像を選択する。選択手段205は、選択した筆跡画像とその検索結果を消去手段206に出力する。
【0065】
消去手段206は、選択された筆跡画像を用いて、文書画像から筆跡部分の画像を消去する。
【0066】
次に、実施例における各手段を用いて筆跡消去処理を行う例について説明する。
図8は、実施例における筆跡消去処理の流れを説明する図である。
図8に示す例と、
図1に示す例と異なる点は、生成手段203が、複数の筆跡画像a207を生成することである。複数の筆跡画像a207は、異なる線幅により生成された筆跡画像である。
【0067】
検索手段204は、筆跡画像毎に検索を行うので、検索結果は、筆跡画像の数だけ得られる。選択手段205は、検索結果の中で、最もスコアが高い筆跡画像を選択する。つまり、選択手段205は、実際の筆跡部分と最も類似する線幅の筆跡画像を選択する。
【0068】
消去手段206は、文書画像中の筆跡部分の位置と線幅が得られるので、これらを用いて筆跡部分を文書画像から消去することで、元の資料の文書画像a204を生成することができる。次に、筆跡消去処理に関する各処理について具体的に説明する。
【0069】
(座標データ取得処理)
電子ペン10は、超音波型電子ペンや、タブレット装置の上に紙文書を置いてスタイラスペンの先にボールペン先などを装着して筆記する形式など、市販品を用いることができる。電子ペン10は、例えば筆跡の座標値を一定間隔(例えば0.01秒間隔)で取得して、x座標値とy座標値のペアの配列を出力する機能を有するものを用いればよい。
【0070】
具体的には、座標データは、電子ペン10による筆記を開始した点(ペンダウン)から電子ペン10を上に上げた点(ペンアップ)までが文字の一画を表す。座標データは、このような座標値を時間順で並べた配列で表したものである。
【0071】
図9は、座標データのデータ構造の一例を示す図である。
図9に示す例では、座標点ごとにx座標、y座標、筆記状態が記録されている。x座標とy座標とは、2バイトの整数値で表されたものである。筆記状態は、0〜3のいずれかの値を取る。
【0072】
図10は、筆記状態の意味を説明する図である。
図10に示すように、「0」は、ペンが空中にあって筆記していない状態を示す。「1」は、ストロークの開始点を示す。「2」は、筆記中の座標点で、始点・終点のいずれでもない状態を示す。「3」は、ストロークの終点を示す。筆跡取得手段202は、
図9に示すような座標データを電子ペン10から取得する。
【0073】
(筆跡画像生成処理)
生成手段203は、座標データを入力として、後述の検索手段204が利用できるような筆跡画像を生成する。座標データは、座標点が離散的に並んだデータ(例えば
図9参照)なので、座標点を線分で繋いだ状態が実際の筆跡を表す。
【0074】
図11は、座標点を線分で繋いだ状態の一例を示す図である。
図11に示すように、生成手段203は、まず座標データに含まれる座標点を線分で繋いでいく。次に、生成手段203は、座標点の間の画素を例えば黒画素で埋めることによって筆跡画像を生成する。具体的な手順は、以下に説明する。
【0075】
生成手段203は、複数の線幅で筆跡画像を生成するが、ここでは一つの線幅wに対する筆跡画像生成の手順を示す。生成手段203は、まず、線幅w=1として、座標点間の線分と重なりのある画素を埋める。
図12は、座標点の間を1画素で埋めた状態の一例を示す図である。
図12に示すように、座標点を繋いだ線分上にある画素が、例えば黒画素で埋められる。埋める画素の色は黒に限らず、筆跡の色であればよい。
【0076】
次に、生成手段203は、線分と直交する方向に、設定されている線幅wの矢印を引き、それぞれの矢印の先端を点線で繋ぐ。
図13は、筆跡の境界が決定された状態の一例を示す図である。
図13に示すように、矢印と点線に囲まれた範囲内が筆跡を構成する画素となる。
【0077】
次に、生成手段203は、囲まれた範囲が画素の半分を超えている部分を、黒画素で埋める。
図14は、線幅wで画素を埋めた状態の一例を示す図である。
図14に示すようにして、生成手段203は、設定された複数の線幅で筆跡画像を生成することができる。
【0078】
また、筆跡の線幅は、想定可能な線幅の範囲内で複数の値を設定すればよい。線幅の値は任意に設定できるが、例えば線の太さを0.2mm〜2mmの範囲と想定し、スキャン画像の解像度を200dpiとした場合、0.2mmは約1.57ピクセルに相当し、2mmは15.7ピクセルに相当する。
【0079】
線幅は、若干の誤差を許容して整数化を行い、生成手段203は、例えば1〜16ピクセル幅の筆跡画像を生成すれば良い。生成手段203は、計算効率化のため、生成する筆跡画像の線幅を間引き、例えば1,4,7,10,13,16の6種類の線幅でのみ筆跡画像を生成してもよい。
【0080】
また、生成手段203は、スキャナ装置20からスキャンの解像度を取得できる場合、線幅の太さの範囲や、用いる線幅の間隔を文書画像の解像度に応じて変更してもよい。紙文書において同じ線幅でも、画像上のピクセル値に換算した線幅は解像度に比例する。例えば、200dpi画像で1ピクセル幅の線は、400dpi画像での2ピクセル幅と、紙上では同じ幅である。
【0081】
したがって、線幅の太さの範囲は、解像度にほぼ比例して拡大や縮小するのが望ましい。一方で、後述する画像検索における一致度は、ピクセル値の相違によって左右されるので、用いる線幅の間隔は解像度に寄らず一定値を用いるのが望ましいと考えられる。このような基準に基づいて、生成手段203は、解像度によって線幅の設定を変更する。
【0082】
まず、200dpiの場合の線幅の上限値を16ピクセルだとし、16ピクセルを基準とする。画像の解像度がDだとすると、線幅の上限値は、D×16/200で求めた値を四捨五入する。例えば解像度が300dpiであれば、線幅の上限値は、300×16/200=24となる。
【0083】
線幅の最小値は、常に1だとして、間隔は3ピクセルとすると、生成手段203は、最小値の1ピクセルから順に、3ピクセル間隔で上限値を超えるまでの値を求める。例えば解像度が300dpiの場合、生成手段203は、1,4,7,10,13,16,19,22,25の9種類の線幅を用いればよい。ここでは、線幅の間隔を3ピクセルと一定値にしたが、生成手段203は、間隔を固定せず、用いる線幅の種類を6種類に固定し、最小値から最大値までを6等分し、近似した整数値を用いてもよい。以上のように、生成手段203は、文書画像の解像度に応じて、線幅の数及び/又は値を設定してもよい。
【0084】
(検索処理)
検索手段204は、スキャンされた文書画像の中で、検索対象の筆跡画像に一致する位置を検索する。以降では、検索対象の筆跡画像を検索筆跡画像とも称す。
【0085】
図15は、検索の動作例を示す図である。検索手段204は、検索筆跡画像に対して基準点を設定し、この筆跡と一致するパターンを文書画像の中から見つける。検索手段204は、基準点の位置座標と、一致度の得点と、サイズとを出力する。検索手段204は、
図15に示すように、検索筆跡画像の相対位置の原点を基準点として、x軸とy軸とを文書画像の対応する位置にマッピングする。
【0086】
図15に示す例では、文書画像に追記された筆跡は、文字や罫線と重なっていることがあるため、他の画像と重なりがあっても検索できる技術が必要である。そのため、例えば一般化ハフ変換を用いることができる。
【0087】
一般化ハフ変換では、文書画像の中で検索したい筆跡のサイズが変化していたり、回転したりしている場合でも検索は可能である。しかし、実施例では説明を簡単にするため、サイズ、方向とも変化が無いものとする。サイズ変化や回転の可能性がある場合には、検索手段204は、基準点の位置座標だけでなく、サイズと回転角も出力すればよい。
【0088】
ここで、検索手段204は、一般化ハフ変換を用いる方式の場合、検索筆跡画像から抽出したエッジ方向に基づいて基準点の位置にスコア(得点)を投票し、投票した値の総和が最も高い位置を検索位置とする。検索結果の得点は常に得られ、また、実施例では一つの検索筆跡画像に対して、一つの検索結果が得られるものとする。
【0089】
図16は、線幅毎の検索結果の一例を示す図である。
図16に示すように、検索結果には、線幅毎にスコア、位置座標、サイズが保持される。線幅は、例えば6種類の線幅を用いた場合の結果を示す。
【0090】
線幅は、小さな値なので例えば1バイトで格納される。スコアは、満点(完全に一致)した場合に100点、全く一致しない場合が0点として、0〜100の値を取るものとする。スコアは、例えば1バイトでも表現できるが、スコアの値の範囲を変更する場合も考え、余裕を取って2バイトとする。
【0091】
位置座標は、基準点が文書画像中のどこで検出されたかを示す。位置座標は、x座標とy座標との組となるので、2バイト×2の領域を用いる。サイズは、検索筆跡画像の縦横の幅の長い方(長辺)が、文書画像中で対応する長さで表すものとする。検索手段204は、
図16に示すような最終的な検索結果を選択手段205に出力する。
【0092】
(選択処理)
選択手段205は、複数の線幅で生成した複数の検索筆跡画像のうち、検索結果のスコアが最も大きい結果を選択する。先に述べたように、検索手段204は、一つの筆跡画像に対して一つの検索結果を出力するため、複数の線幅で筆跡画像を生成すると複数の検索結果(基準点の座標値)が得られる。この中で筆跡画像の消去に用いるのは一つの結果だけである。選択手段205では、複数の結果の中から最大スコアである結果を選択する。選択手段205は、選択した筆跡画像とその検索結果を消去手段206に出力する。
【0093】
選択手段205は、
図16に示す例を用いると、線幅w=7の場合が最も良い結果である。w=16は、スコアが低く、また位置座標も全く異なることから、正解ではない別の場所を検出してしまったことが分かる。w=1、16以外の線幅では、正解の筆跡を検出できているが、位置座標やサイズが少しずつずれているため、後段で筆跡を消去する際の精度に影響が及ぶ可能性がある。
【0094】
(消去処理)
消去手段206は、スキャンされた文書画像から筆跡画像を消去する。消去手段206は、既に文書画像の中で筆跡画像の位置座標は分かっているので、その位置に検索画像を重ねれば、消去したい筆跡に属する画素が分かる。したがって、消去手段206は、筆跡に属する画素を背景色で塗り潰せば筆跡画像を消去することができる。ただし、カラー画像の場合には背景が白色とは限らないので、塗り潰す背景色を選択すればよい。
【0095】
仮に、文書画像が白黒画像で背景が白色であり、追記された筆跡が余白などの背景領域にのみ書かれていれば、消去手段206は、筆跡の画素を白で塗り潰すだけでよい。しかし、印刷文字や罫線などと重なって筆記されている場合は、単に画素を塗り潰しただけでは不自然な画像が生成される可能性がある。
【0096】
図17は、単純に背景色で塗りつぶす例を示す図である。
図17(A)は、追記前の画像の一部を示す。黒画素が文字の一部を示すものとする。
図17(B)は、追記後の画像の位置を示す。追記された筆跡が文字の上に筆記されると、
図17(B)に示すように文字画像と筆跡が重なる部分が生ずる。
【0097】
図17(C)は、追記部分を背景色で塗り潰した画像の一部を示す。筆跡の画素が背景色で塗り潰されると、
図17(C)に示すように、文字が途中で途切れてしまう。ただし、筆跡で重ね書きされた画素は、文字の画素か背景かを判断するための情報が失われている。よって、
図17(C)に示す画像が、不適切な画像だとは限らないが、
図17(C)に示す例では、
図17(A)のような画像が生成された方が適切だと考えられる。また、カラー画像などのように、背景が白色のみとは限らない場合も考慮する必要がある。
【0098】
実施例における消去手段206は、次の方法で、適切に背景色を塗り潰す処理を行う。消去手段206は、まず、筆跡に属する画像それぞれについて、その画素に最も近い、非筆跡の画素の色を求める。
【0099】
図18は、実施例による塗り潰し処理を説明する図である。
図18(A)は、塗り潰し色の判定結果を示す。
図18(A)に示す例では、白色の画素をA、黒色の画素をBで示している。消去手段206は、続いて、それぞれの画素について判定した画素の色で塗り潰す。
図18(B)は、塗り潰し後の画像の一部を示す図である。
図18(B)に示す例では、分かりやすくするために黒色で塗り潰した画素Bは、格子状の網模様で示している。
【0100】
消去手段206は、各画素を塗り潰す色として、その画素に最も近い、筆跡以外の画素の色を求める。
図19は、塗り潰し色判定を説明する図である。
図19に示す例では、例えば画素Cは、筆跡以外の画素で最も近いのは、上方向に2画素移動した位置の画素である。この場合、距離は2となる。
【0101】
画素Dの場合は、上方向に3画素進むと背景である白画素が見つかり、それが最も近い画素となる。一方、画素Dから文字画素への距離は、一つ左に進んでから上に3画素進むために、距離は4となる。これにより、画素Dに最も近い画素は、距離が3である背景画素となる。上記の方法を用いて塗り潰し判定を行うと、
図18(A)に示す結果となる。
【0102】
また、消去手段206は、選択された筆跡画像よりも所定値だけ線幅が広い筆跡画像を用いて消去処理を行ってもよい。この理由は、実際の筆跡の線幅よりも少し細い線幅の筆跡画像が最適として選択される場合があり、筆跡画像による消去で筆跡の外縁が残ることを防止するためである。消去手段206は、実際の筆跡の線幅と一致する、又は実際の線幅よりも少し太い線幅の筆跡画像を用いるのが適切である。所定値は、予め実験等をして適切な値を設定しておけばよい。なお、消去手段206は、選択された筆跡画像よりも所定値だけ線幅が広い筆跡画像を生成手段203に生成させればよい。
【0103】
筆跡が消去された画像は、表示装置30に表示されたり、主記憶部102や補助記憶部103に記憶されたりする。
【0104】
以上の構成、処理によれば、電子ペンによる座標データから生成された筆跡画像を用いて、文書画像の筆跡部分を適切に消去することができる。
【0105】
<動作>
次に、実施例における筆跡消去処理の流れについて説明する。
図20は、実施例における筆跡消去処理の一例を示すフローチャートである。
図20に示すステップS101で、ユーザは、電子ペン10を用いて資料に筆記を行う。このとき、電子ペン10は、筆跡の座標データを取得し、画像処理装置100に送信する。画像処理装置100の筆跡取得手段202は、電子ペン10による座標データを取得する。
【0106】
ステップS102で、スキャナ装置20は、電子ペン10で筆記された資料をスキャンして文書画像を生成する。生成された文書画像は、画像処理装置100に送信される。画像処理装置100の画像取得手段201は、文書画像を取得する。
【0107】
ステップS103で、生成手段203は、座標データに基づき、複数の異なる線幅を用いて複数の筆跡画像を生成する。筆跡画像生成処理は、
図21を用いて後述する。
【0108】
ステップS104で、検索手段204は、生成された筆跡画像毎に、文書画像の中から類似する部分画像を検索し、スコアを算出する。
【0109】
ステップS105で、選択手段205は、検索結果の中からスコアが一番高い線幅の筆跡画像を選択する。
【0110】
ステップS106で、消去手段206は、選択された線幅の筆跡画像を用いて、文書画像の中から筆跡部分を消去する。筆跡を消去し、背景色で画素を埋める処理は、
図22を用いて後述する。
【0111】
以上の処理により、電子ペン10により取得された座標データを用いて、文書画像の中から筆跡部分を適切に消去することができる。
【0112】
図21は、複数の筆跡画像を生成する処理の一例を示すフローチャートである。
図21に示すステップS201で、生成手段203は、まず、N種類の線幅の値を配列W[i](i=1,...,N)に設定する。また、生成手段203は、変数iに1を設定する。
【0113】
ステップS202で、生成手段203は、線幅wにW[i]の値を設定する。ステップS203で、生成手段203は、ストローク始点とその隣の点をそれぞれの線分の始点、終点に設定する。
【0114】
ステップS204で、生成手段203は、線幅を1とし、線分を通る画素を埋める(例えば
図12参照)。ステップS205で、生成手段203は、線幅w=1であるか否かを判定する。w=1であれば(ステップS205−YES)ステップS207に進み、w=1でなければ(ステップS205−NO)ステップS206に進む。
【0115】
ステップS206で、生成手段203は、線幅wの範囲で、線分を埋める(例えば
図13,14参照)。
【0116】
ステップS207で、生成手段203は、筆跡の終点に到達したか否かを判定する。終点に到達していれば(ステップS207−YES)ステップS209に進み、終点に送達していなければ(ステップS207−NO)ステップS208に進む。
【0117】
ステップS208で、生成手段203は、線分の終点を次の始点とし、さらに、隣の点を線分の終点に設定する。
【0118】
ステップS209で、生成手段203は、変数i=Nであるか否かを判定する。i=Nであれば(ステップS209−YES)この処理を終了し、i=Nでなければ(ステップS209−NO)ステップS210に進む。
【0119】
ステップS210で、生成手段203は、iの値を1増加させ、ステップS202に戻る。
【0120】
以上の処理により、複数の線幅の筆跡画像を生成することができる。さらに、ステップS201において、生成手段203は、スキャナ装置20のスキャン時の解像度を取得した場合、この解像度に基づいて線幅の値や数を変更してもよい。
【0121】
図22は、筆跡消去後の画素埋め処理の一例を示すフローチャートである。以降では、消去した筆跡部分の画素を筆跡画素とも称す。
図22に示すステップS301で、消去手段206は、全ての筆跡画素の色を「未定」に設定する。
【0122】
ステップS302で、消去手段206は、「未定」の筆跡画素を1つ選んで、現在の処理対象画像に設定する。
【0123】
ステップS303で、消去手段206は、現在の処理対象画像から最も近い画素の色を求める。
【0124】
ステップS304で、消去手段206は、最も近い画素が複数あるか否かを判定する。最も近い画素が複数あれば(ステップS304−YES)ステップS305に進み、最も近い画素が複数なければ(ステップS304−NO)ステップS306に進む。
【0125】
ステップS305で、消去手段206は、最も近い複数の画素の平均の色を求める。ステップS306で、消去手段206は、ステップS303又はステップS305で求めた色を、現在の処理対象画像の色に設定する。
【0126】
ステップS307で、消去手段206は、「未定」画素がないか否かを判定する。「未定」画素がなければ(ステップS307−YES)この処理を終了し、「未定」画素があれば(ステップS307−NO)ステップS302に戻る。
【0127】
以上の処理により、筆跡の重畳によって元文書の画素が上書きされているために文書画像の情報が一部失われている場合でも、文字の途切れのような不自然な現象を抑制して、比較的自然な文書画像を復元することができる。
【0128】
以上、実施例によれば、電子ペンによる座標データから生成された筆跡画像を用いて、文書画像の筆跡部分を適切に消去することができる。また、実施例によれば、スキャナ装置20からのスキャン時の解像度を取得できれば、解像度に応じて線幅の設定を変更することができる。
【0129】
文書画像の筆跡部分を消去することで、文書画像の視認性が向上すると同時に、検索のために行う文字認識処理の精度も向上し、文書画像の利用価値を向上させることができる。
【0130】
なお、前述した実施例で説明した画像処理を実現するためのプログラムを記録媒体に記録することで、実施例での画像処理をコンピュータに実施させることができる。例えば、このプログラムを記録媒体に記録し、このプログラムが記録された記録媒体をコンピュータに読み取らせて、前述した画像処理を実現させることも可能である。
【0131】
なお、実施例における画像処理装置100は、コンピュータ(Personal Computer)や、タブレット端末、スマートフォンなどのプロセッサとメモリとデータを取得するインタフェースを有する処理装置であれば適用可能である。また、スキャナ装置20に電子ペン10からの座標データを送信することで、スキャナ装置20でも上記画像処理を実行することができるように実装してもよい。
【0132】
なお、記録媒体は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。この記録媒体には、搬送波は含まれない。
【0133】
以上、実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。また、前述した実施例の構成要素を全部又は複数を組み合わせることも可能である。
【0134】
なお、以上の実施例に関し、さらに以下の付記を開示する。
(付記1)
電子ペンによる筆跡を含む文書の文書画像を取得する画像取得手段と、
前記電子ペンによる筆跡の座標データを取得する筆跡取得手段と、
複数の異なる線幅を用いて、前記座標データに基づく複数の筆跡画像を生成する生成手段と、
生成された筆跡画像毎に該筆跡画像と類似する筆跡部分の画像を前記文書画像から検索する検索手段と、
前記文書画像内の筆跡部分の画像と最も類似する筆跡画像を選択する選択手段と、
選択された筆跡画像を用いて、前記文書画像から筆跡部分の画像を消去する消去手段と、
を備える画像処理装置。
(付記2)
前記生成手段は、
前記文書画像の解像度に応じて、線幅の数及び/又は値を設定する付記1記載の画像処理装置。
(付記3)
前記生成手段は、
前記文書画像の解像度から線幅の上限値を算出し、該上限値を用いて線幅の数を設定する付記2記載の画像処理装置。
(付記4)
前記消去手段は、
前記選択された筆跡画像よりも所定値だけ線幅が太い筆跡画像を用いて消去処理を行う付記1乃至3いずれか一項に記載の画像処理装置。
(付記5)
前記消去手段は、
消去した画素に対し、該消去した画素以外の画素で、最も近い画素の色を用いて色を復元する付記1乃至4いずれか一項に記載の画像処理装置。
(付記6)
電子ペンによる筆跡を含む文書の文書画像を取得し、
前記電子ペンによる筆跡の座標データを取得し、
複数の異なる線幅を用いて、前記座標データに基づく複数の筆跡画像を生成し、
生成された筆跡画像毎に該筆跡画像と類似する筆跡部分の画像を前記文書画像から検索し、
前記文書画像内の筆跡部分の画像と最も類似する筆跡画像を選択し、
選択された筆跡画像を用いて、前記文書画像から筆跡部分の画像を消去する処理をコンピュータが実行する画像処理方法。
(付記7)
電子ペンによる筆跡を含む文書の文書画像を取得し、
前記電子ペンによる筆跡の座標データを取得し、
複数の異なる線幅を用いて、前記座標データに基づく複数の筆跡画像を生成し、
生成された筆跡画像毎に該筆跡画像と類似する筆跡部分の画像を前記文書画像から検索し、
前記文書画像内の筆跡部分の画像と最も類似する筆跡画像を選択し、
選択された筆跡画像を用いて、前記文書画像から筆跡部分の画像を消去する処理をコンピュータに実行させるプログラム。