(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-11
(45)【発行日】2024-11-19
(54)【発明の名称】線を除去するための画像処理装置、画像処理方法及び記憶媒体
(51)【国際特許分類】
G06V 30/148 20220101AFI20241112BHJP
【FI】
G06V30/148
(21)【出願番号】P 2021044842
(22)【出願日】2021-03-18
【審査請求日】2023-12-07
(31)【優先権主張番号】202010224697.6
(32)【優先日】2020-03-26
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】汪 留安
(72)【発明者】
【氏名】孫 俊
【審査官】小池 正彦
(56)【参考文献】
【文献】特開2001-229342(JP,A)
【文献】中国特許出願公開第106156773(CN,A)
【文献】特開2000-322514(JP,A)
【文献】特開昭61-175878(JP,A)
【文献】特開平03-142691(JP,A)
【文献】諏訪美佐子,外1名,グラフ表現を利用した手書き数字列のセグメンテーション方式,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2008年02月14日,第107巻,第491号,p.161-166
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/148
(57)【特許請求の範囲】
【請求項1】
グレースケール文書画像をターゲット画像として二値化する二値化部と、
前記ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得する分割部と、
前記複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定する有向グラフ決定部と、
前記有向グラフに基づいて、前記有向グラフの単一始点最短経路に関連するターゲット経路を決定するターゲット経路決定部と、
前記グレースケール文書画像における前記ターゲット経路に対応する線を除去する線除去部と、を含む、画像処理装置。
【請求項2】
中心が前記ターゲット画像の水平中央線より上に位置する連結成分を選択して、前記有向グラフのノードを設定し、或いは、
中心が前記ターゲット画像の水平中央線より下に位置する連結成分を選択して、前記有向グラフのノードを設定する、請求項1に記載の画像処理装置。
【請求項3】
前記有向グラフ決定部は、前記有向グラフの複数のノードを決定し、
前記複数のノードは、前記複数の帯状領域の領域内連結成分に一対一で対応する、請求項1に記載の画像処理装置。
【請求項4】
前記有向グラフ決定部は、前記有向グラフの辺を構築し、
構築された辺は、
該辺の先頭ノードの横座標と末尾ノードの横座標とが異なり、
該辺の末尾ノードと先頭ノードとの横座標の差が前記ターゲット画像の高さよりも小さく、且つ
該辺の末尾ノードと先頭ノードとの縦座標の差の絶対値が前記末尾ノード及び前記先頭ノードに対応する対応領域内連結成分の高さの何れよりも小さいことの条件を満たし、
前記有向グラフの各ノードの座標は、対応する領域内連結成分の中心の座標である、請求項3に記載の画像処理装置。
【請求項5】
前記有向グラフ決定部は、前記有向グラフの辺の2つのノードの座標に基づいて、前記辺のコストを決定する、請求項4に記載の画像処理装置。
【請求項6】
前記有向グラフ決定部は、前記有向グラフの複数のノードに対応する領域内連結成分の中心のフィッティング直線を決定する、請求項5に記載の画像処理装置。
【請求項7】
前記有向グラフ決定部は、前記有向グラフの辺の2つのノードの座標及び前記フィッティング直線に基づいて、前記辺のコストを決定する、請求項6に記載の画像処理装置。
【請求項8】
前記ターゲット経路決定部は、
前記有向グラフに仮想ノードを追加し、
前記仮想ノードから他のノードまでの仮想辺を構築し、
前記仮想辺のコストをゼロに設定する、請求項1に記載の画像処理装置。
【請求項9】
グレースケール文書画像をターゲット画像として二値化するステップと、
前記ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得するステップと、
前記複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定するステップと、
前記有向グラフに基づいて、前記有向グラフの単一始点最短経路に関連するターゲット経路を決定するステップと、
前記グレースケール文書画像における前記ターゲット経路に対応する線を除去するステップと、を含む、画像処理方法。
【請求項10】
プログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、前記プログラムがプロセッサにより実行される際に、
グレースケール文書画像をターゲット画像として二値化するステップと、
前記ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得するステップと、
前記複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定するステップと、
前記有向グラフに基づいて、前記有向グラフの単一始点最短経路に関連するターゲット経路を決定するステップと、
前記グレースケール文書画像における前記ターゲット経路に対応する線を除去するステップと、を含む画像処理方法を実現する、記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像処理に関し、具体的には、線を除去するための画像処理装置、画像処理方法及び記憶媒体に関する。
【背景技術】
【0002】
光学式文字認識(OCR:Optical Character Recognition)技術を用いて画像内の文字をテキストに変換することができる。光学式文字認識のアプリケーションでは、OCR認識エンジンの認識性能を向上させるために、入力画像を前処理する必要がある。一般的に、入力画像におけるノイズが多いほど、認識エンジンの認識性能が低下する。入力画像の前処理は、ノイズの除去を含む。従って、前処理により、認識エンジンの性能を向上させることができる。
【0003】
このため、画像内のごま塩ノイズ(salt-and-pepper noise)などを除去するための様々な従来の画像処理方法がある。
【発明の概要】
【発明が解決しようとする課題】
【0004】
以下は、本開示の態様を基本的に理解させるために、本開示の簡単な概要を説明する。なお、この簡単な概要は、本開示を網羅的な概要ではなく、本開示のポイント又は重要な部分を意図的に特定するものではなく、本開示の範囲を意図的に限定するものではなく、後述するより詳細的な説明の前文として、単なる概念を簡単な形で説明することを目的とする。
【0005】
本発明の発明者の発見によると、OCR認識では、入力された文書画像の文字の近傍には、行及び/又は列を識別するための非文字の識別線が存在する可能性がある。例えば、銀行のフォーム、保険、速達のテキスト行の画像には、多くの上線及び下線が存在する。通常、このような線により、認識エンジンの性能が低下してしまう。認識エンジンでは、このような線をノイズと見なしてもよく、この場合、このような線に対して前処理を行う必要がある。また、認識エンジンが入力画像における前景画素及び背景画素を誤って判断することにより、認識エンジンの文字認識性能が低下してしまう場合がある。例えば、認識エンジンが上記の識別線を前景画素として認識し、文字認識を行うと、認識エンジンの文字認識性能が劣化してしまう。これを鑑みて、本開示は、有向グラフに基づいて文書画像における線を除去する技術を提供する。
【課題を解決するための手段】
【0006】
本開示の1つの態様では、グレースケール文書画像をターゲット画像として二値化するステップと、前記ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得するステップと、前記複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定するステップと、前記有向グラフに基づいて、前記有向グラフの単一始点最短経路に関連するターゲット経路を決定するステップと、前記グレースケール文書画像における前記ターゲット経路に対応する線を除去するステップと、を含む、画像処理方法を提供する。
【0007】
本開示のもう1つの態様では、グレースケール文書画像をターゲット画像として二値化する二値化部と、前記ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得する分割部と、前記複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定する有向グラフ決定部と、前記有向グラフに基づいて、前記有向グラフの単一始点最短経路に関連するターゲット経路を決定するターゲット経路決定部と、前記グレースケール文書画像における前記ターゲット経路に対応する線を除去する線除去部と、を含む、画像処理装置を提供する。
【0008】
本開示のもう1つの態様では、プログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、前記プログラムがプロセッサにより実行される際に、グレースケール文書画像をターゲット画像として二値化するステップと、前記ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得するステップと、前記複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定するステップと、前記有向グラフに基づいて、前記有向グラフの単一始点最短経路に関連するターゲット経路を決定するステップと、前記グレースケール文書画像における前記ターゲット経路に対応する線を除去するステップと、を含む画像処理方法を実現する、記憶媒体を提供する。
【0009】
本開示の方法、装置及び記憶媒体によれば、少なくとも、以下の効果の1つを達成することができる。即ち、文書画像における行線を除去し、文書画像における列線を除去し、文書画像におけるノイズ線を除去し、処理速度を向上させ、占有する計算リソースを低減させ、文字認識エンジンの認識性能を改善することができる。
【図面の簡単な説明】
【0010】
本開示の上記及び他の目的、特徴及び利点をより容易に理解させるために、以下は図面を参照しながら本開示の実施形態を説明する。なお、図面は、単なる本開示の原理を説明するためのものである。図面では、縮尺に従って各部のサイズ及び相対位置を描く必要がない。同一の符号は、同一の特徴を表示してもよい。
【
図1】本開示の1つの実施例に係る画像処理方法を示すフローチャートである。
【
図3】奇数番号の帯状領域を隠したターゲット画像及び偶数番号の帯状領域を隠したターゲット画像を例示的に示す図である。
【
図4】本開示の1つの実施例に係る有向グラフの決定方法を示すフローチャートである。
【
図5】本開示の1つの実施例に係る辺のコストの決定方法を示すフローチャートである。
【
図6】本開示の1つの実施例に係る単一始点最短経路の対応する領域内連結成分の例を示す図である。
【
図7】本開示の1つの実施例に係る除去処理により決定されたターゲット領域内連結成分を示す図である。
【
図8】本開示の1つの実施例に係るグレースケール文書画像におけるターゲット経路に対応する線を除去した後のグレースケール文書画像を示す図である。
【
図9】本開示のもう1つの実施例に係る除去処理により決定されたターゲット領域内連結成分を示す図である。
【
図10】本開示の1つの実施例に係る画像処理装置を示す例示的なブロック図である。
【
図11】本開示の1つの実施例に係る光学式文字認識方法を示すフローチャートである。
【
図12】本開示の1つの実施例に係る光学式文字認識装置を示す例示的なブロック図である。
【
図13】本開示の1つの実施例に係る情報処理装置を示す例示的なブロック図である。
【発明を実施するための形態】
【0011】
以下は図面を参照しながら本開示の例示的な実施形態を説明する。説明の便宜上、明細書には実際の実施形態の全ての特徴が示されていない。なお、当業者が実施形態を実現する際に、実施形態を実現するために特定の決定を行ってもよく、これらの決定は実施形態に応じて変更されてもよい。
【0012】
なお、本開示を明確にするために、図面には本発明に密に関連する装置の構成要件及び/又は処理のステップのみが示され、本開示と関係のない細部が省略されている。
【0013】
なお、本開示は、添付の図面を参照して以下の説明を行うため、説明された実施形態に限定されない。本明細書では、実行可能である場合、実施例を互いに組み合わせてもよいし、異なる実施例の特徴を置き換え、或いは利用してもよいし、1つの実施例において1つ又は複数の特徴を省略してもよい。
【0014】
なお、例示的な実施例の各態様は、システム、方法又はコンピュータプログラムプロダクトとして実施されてもよい。このため、例示的な実施例の各態様は、具体的に以下の形式で実現されてもよく、即ち、完全なハードウェアの実施例、完全なソフトウェアの実施例(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、又はソフトウェアとハードウェアとの組み合わせの実施例であってもよく、本明細書では一般的に「回路」、「モジュール」又は「システム」と称される場合がある。さらに、例示的な実施例の各態様は、1つ又は複数のコンピュータ読み取り可能な媒体で表されるコンピュータプログラムプロダクトの形を採用してもよく、該コンピュータ読み取り可能な媒体にはコンピュータ読み取り可能なプログラムコードが記録されている。コンピュータプログラムは、例えば、コンピュータのネットワークを介して配分されてもよいし、1つ又は複数のリモートサーバに配置されてもよいし、装置のメモリに埋め込まされてもよい。
【0015】
1つ又は複数のコンピュータ読み取り可能な媒体の任意の組み合わせを用いてもよい。コンピュータ読み取り可能な媒体は、コンピュータ読み取り可能な信号媒体又はコンピュータ読み取り可能な記憶媒体であってもよい。コンピュータ読み取り可能な記憶媒体は、例えば、電気、磁気、光学、電磁気、赤外線若しくは半導体のシステム、装置若しくは機器、又はこれらの任意の適切な組み合わせであってもよいが、これらに限定されない。コンピュータ読み取り可能な記憶媒体のより具体的な例(非網羅的なリスト)は、1つ又は複数のワイヤの電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去型のプログラミング可能な読み取り専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光学的記憶装置、磁気的記憶装置、又はこれらの適切な組み合わせを含む。本明細書では、コンピュータ読み取り可能な記憶媒体は、命令実行システム、装置若しくは機器により使用され、或いはこれらに関連して使用するプログラムを含み、或いは記憶する任意の有形の媒体であってもよい。
【0016】
コンピュータ読み取り可能な信号媒体は、例えば、ベースバンド内、又はキャリアの一部として伝播される、コンピュータ読み取り可能なプログラムコードを有するデータ信号を含んでもよい。このような伝播信号は、任意の適切な形を採用してもよく、例えば電磁、光学又はこれらの任意の適切な組み合わせを含んでもよいが、これらに限定されない。
【0017】
コンピュータ読み取り可能な信号媒体は、コンピュータ読み取り可能な記憶媒体以外の、命令実行システム、装置又は機器により使用され、或いはこれらに関連して使用されるプログラムを伝送、伝播又は送信できる任意のコンピュータで読み取り可能な媒体であってもよい。
【0018】
コンピュータ読み取り可能な媒体におけるプログラムコードは、任意の適切な媒体を用いて伝送されてもよく、例えば無線、有線、光ケーブル、無線周波数など、又はこれらの任意の適切な組み合わせを含んでもよいが、これらに限定されない。
【0019】
本明細書に開示される例示的な実施例の各態様の操作を実行するためのコンピュータプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせで記述されてもよく、該プログラミング言語は、Java、Smalltalk、C++などのオブジェクト指向プログラミング言語を含み、「C」プログラミング言語又は同様なプログラミング言語などの従来の手続き型プログラミング言語を含む。
【0020】
以下は、例示的な実施例に係る方法、装置(システム)及びコンピュータプログラムプロダクトのフローチャート及び/又はブロック図を参照しながら、本明細書で開示される例示的な実施例の各態様を説明する。なお、フローチャート及び/又はブロック図の各ブロック、並びにフローチャート及び/又はブロック図の各ブロックの組み合わせは、コンピュータプログラム命令により実現されてもよい。これらのコンピュータプログラム命令は、汎用コンピュータ、専用コンピュータ又は他のプログラミング可能なデータ処理装置のプロセッサに提供されて装置を構成し、コンピュータ又は他のプログラミング可能なデータ処理装置によりこれらの命令を実行することで、フローチャート及び/又はブロック図の各ブロックに規定された機能/操作を実現するための装置を構成する。
【0021】
これらのコンピュータプログラム命令は、コンピュータ又は他のプログラミング可能なデータ処理装置に特定の方法で動作するコンピュータ読み取り可能な媒体に記憶され、コンピュータ読み取り可能な媒体に記憶された命令によりフローチャート及び/又はブロック図の各ブロックに規定された機能/操作を実現する命令を含むプロダクトを構成してもよい。
【0022】
コンピュータプログラム命令は、コンピュータ又は他のプログラミング可能なデータ処理装置にロードされ、コンピュータ又は他のプログラミング可能なデータ処理装置で一連の動作ステップが実行され、コンピュータ又は他のプログラミング装置で実行される命令によりフローチャート及び/又はブロック図の各ブロックに規定された機能/操作を実現するプロセスを提供してもよい。
【0023】
本開示の1つの態様では、文書画像を処理するための画像処理方法を提供する。処理された文書画像は、文字認識に用いられてもよい。該方法は、光学式文字認識アプリケーションにおける入力画像に対して行われる前処理の一部とされてもよい。該方法は、画像におけるノイズ線を除去するために用いられてもよい。該線は、行を識別するための行線、列を識別するための列線、又は他の文字の識別線であってもよい。線は、実線、非連続的な線、又は全体的な方向が確定された他の線であってもよい。非連続的な線は、破線及び点線を含む。文書画像は、カラー画像であってもよい。テキスト認識においてカラー文書画像を従来の方法でグレースケール画像に変換してもよいため、以下は、グレースケール文書画像の処理を一例にして、画像処理方法を説明する。以下は、
図1を参照しながら該方法を例示的に説明する。
【0024】
図1は、本開示の1つの実施例に係る画像処理方法10を示すフローチャートである。該方法の入力は、グレースケール文書画像を含む。該方法の出力は、少なくとも一部の非文字識別線が除去されたグレースケール文書画像を含む。
【0025】
ステップS101において、グレースケール文書画像Imgをターゲット画像Imoとして二値化する。該ステップは、例えばSauvola方法を用いて実現されてもよい。二値化により、画像の背景を除去できる。
図2は、ターゲット画像Imoの例を示す図である。
図2のターゲット画像Imoは、線L、文字Ch1及び文字Ch2を含む。対応するグレースケール文書画像Imgは、線Lに対応する線lを含む。画像処理方法10の目的は、グレースケール文書画像Imgにおける線lを除去することを含む。なお、
図2における符号(例えば「L」)及びS字型の指示線は、単にターゲット画像の例示的なターゲット画像Imoに含まれる要素を説明するためにのみ示されたものであり、例示的なターゲット画像Imo自体は、符号及びS字型の指示線を含まない。例示的なターゲット画像Imoにおける文字は手書きのものであるが、ターゲット画像の文字は、これに限らず、印刷されたもの、又は印刷文字及び手書き文字の両方を含んでもよい。なお、文字行の文書画像の下部の行線及び上部の行線をそれぞれ除去するように、文字行の文書画像を中心線に沿って2つの文書画像に分割した後に方法10を実行してもよい。入力された処理すべき画像が既に2値化された画像である場合、該二値化ステップを省略してもよい。
図2では水平方向に沿う1本の線Lを示し、線Lに対応する線lを除去することを一例にして画像処理方法を例示的に説明しているが、複数本の線の除去方法、他の方向の1本の線の除去方法は、水平方向に沿う1本の線の除去方法と同様である。このため、当業者は、水平方向に沿う1本の線の除去方法に基づいて、本開示の方法を複数本の線の除去方法及び/又は他の方向の線の除去方法に適用してもよい。
【0026】
ステップS103において、ターゲット画像Imoを分割し、第1方向に沿って配置された複数の帯状領域R
1、R
2、…、R
n、…、R
Nを取得する。第1方向は、水平方向(ターゲット画像の横方向)、垂直方向(ターゲット画像の縦方向)又は他の方向であってもよい。各帯状領域の長さは、ターゲット画像の長さ又は幅の何れかに等しくてもよい。例えば、1つの例示的な分割方向では、水平方向に沿って、長さがLenのターゲット画像ImoをN個の矩形領域に分割し、各矩形領域の長さはターゲット画像Imoの幅wに等しく、各矩形領域の幅はLen/Nである。除去すべき線を迅速、且つ正確に検出するために、各帯状領域の幅は、例えば2~10の画素幅の所定値に等しくてもよい。該分割方法では、奇数番号の帯状領域又は偶数番号の帯状領域を隠し、ターゲット画像Imoは破線を有する画像になる。これらの帯状領域を順次に併合してターゲット画像Imoを取得する。
図3は、奇数番号の帯状領域を隠したターゲット画像及び偶数番号の帯状領域を隠したターゲット画像を例示的に示す図である。ここで、
図3に示す画像は、
図2における画像に対して若干拡大、縮小されており、第1方向が水平方向であり、
図3(a)は偶数番号の帯状領域を隠した破線化のターゲット画像Imo
oであり、
図3(b)は奇数番号の帯状領域を隠した破線化のターゲット画像Imo
eである。なお、本開示の複数の帯状領域の幅は、等しくてもよいし、等しくなくてもよい。
【0027】
ステップS105において、複数の帯状領域R
nの領域内連結成分CC
ni’に基づいて、ターゲット画像全体についての有向グラフを決定する。ここで、i’は、異なる連結成分を区別するためのインデックスであり、i’=1、2、…、I’となる。I’は、帯状領域R
n内の連結成分の総数である。本開示では、帯状領域内の連結成分は、領域内連結成分とも称される。各領域内連結成分の所属する帯状領域を区別する必要がない場合は、「領域内連結成分」を「CC」又は「CC
i」で表してもよく、i=1、2、…、Iとなる。Iは、ターゲット画像Imo内の領域内連結成分の総数である。各帯状領域内の領域内連結成分の数は、0、1、2、又はそれ以上の数であってもよい。ターゲット画像の全ての帯状領域の領域内連結成分は、領域内連結成分集合{CC
i}を構成する。各領域内連結成分CC
ni’はターゲット画像の前景画素により構成され、各領域内連結成分CC
ni’は単一の帯状領域R
n内にある。分割前のターゲット画像の特定の前景線は、複数の帯状領域を通る初期連結成分を構成するが、分割後のターゲット画像では、異なる帯状領域の境界が区別されるため、該線は複数の領域内連結成分に対応する複数の区間に分割され、それに応じて、該初期連結成分が複数の領域内連結成分により構成されると見なされる。言い換えれば、各帯状領域がサブ画像と見なされ、対応する各サブ画像内の連結成分が領域内連結成分である。例えば、ターゲット画像における1つの連結成分が2つの隣接する帯状領域に跨る場合、この2つの隣接する帯状領域内の2つの連結成分が2つの領域内連結成分と見なされる。
図3(a)及び
図3(b)に示す連結成分は領域内連結成分であり、2つの図における全ての領域内連結成分はターゲット画像全体についての領域内連結成分集合{CC
i}を構成する。
【0028】
有向グラフは、複数のノードnj、複数の辺ejj’を含む。ここで、jは異なるノードを区別するためのインデックスであり、ejj’はノードnjとノードnj’とを連結する辺を表し、その方向がノードnj(先頭ノード)からノードnj’(末尾ノード)への方向である。各辺はコストcnjj’を持つ。これらのノード、辺及びコストは、領域内連結成分集合{CCi}に関連しており、領域内連結成分の情報を含む。ここの辺は、有向グラフの辺であるため、有向辺を意味する。
【0029】
グレースケール文書画像に下部の行線及び上部の行線の両方がある場合、1つの例では、上部の行線を除去するように、中心がターゲット画像の水平中央線より上に位置する連結成分を選択して、有向グラフのノードを設定してもよいし、下部の行線を除去するように、中心がターゲット画像の水平中央線より下に位置する連結成分を選択して、有向グラフのノードを設定してもよい。
【0030】
ステップS107において、有向グラフに基づいて、有向グラフの単一始点最短経路(SSSP:Single Source Shortest Path)P(「最短経路」とも称される)に関連するターゲット経路Poを決定する。一例では、このステップは、有向グラフに仮想ノードを追加するステップと、仮想ノードから他のノードまでの仮想辺を構築するステップと、仮想辺のコストをゼロに設定するステップと、を含んでもよい。有向グラフの単一始点最短経路Pが決定された後に、決定された単一始点最短経路に基づいてターゲット経路Poを決定してもよい。一例では、直接単一始点最短経路をターゲット経路としてもよい。
【0031】
一例では、仮想ノードを始点とする場合、例えばベルマンフォード(Bellman-Ford)方法/アルゴリズムにより、有向グラフの単一始点最短経路を決定する。単一始点最短経路は、複数のノードn
kを含み、kは各ノードを区別するためのインデックスであり、k=1、2、…、Kとなる。これらのノードはノード集合{n
k}を構成し、ノードn
kは領域内連結成分
(外1)
に対応するため、単一始点最短経路は複数の領域内連結成分に対応する。これらの対応する領域内連結成分を最短経路連結成分と称してもよく、これらの最短経路連結成分は最短経路連結成分集合
(外2)
を構成する。最短経路Pと同様に、ターゲット経路Pも複数の対応するノードn
k’(以下はターゲットノードと称される)及び領域内連結成分
(外3)
(以下はターゲット領域内連結成分と称される)を含み、ターゲットノードn
k’に対応する領域内連結成分はターゲット領域内連結成分
(外4)
である。これらの対応するノードは、ターゲットノード集合{n
k’}を構成する。これらの対応する領域内連結成分はターゲット領域内連結成分集合
(外5)
を構成する。より具体的には、ターゲットノードn
k’は、最短経路のノード集合{n
k}から選択される。一例では、ターゲットノード集合{n
k’}は、最短経路のノード集合{n
k}と同一であってもよい。
【0032】
ステップS109において、グレースケール文書画像におけるターゲット経路に対応する線を除去する。具体的には、位置に応じて、ターゲット経路Poのターゲット領域内連結成分集合
(外6)
におけるターゲット領域内連結成分
(外7)
に対応するグレースケール文書画像Img内のエリアA
k’の画素の画素値を、グレースケール文書画像の背景画素に関連付けられた画素値に設定してもよく、例えばグレースケール文書画像の背景画素の平均値(例えば、算術平均値、幾何学的平均値、重み付け平均値)、中央値などに設定してもよい。
【0033】
ステップS105における有向グラフの決定について、
図4を参照してもよい。
図4は、本開示の1つの実施例に係る有向グラフの決定方法40を示すフローチャートである。方法40は、各帯状領域R
n内の領域内連結成分CC
ni’に基づいてターゲット画像Imo全体についての有向グラフを決定する。言い換えれば、方法40は、領域内連結成分集合{CC
i}に基づいてターゲット画像Imo全体についての有向グラフを決定する。
【0034】
ステップS401において、領域内連結成分に基づいて有向グラフのノードを決定する。一例では、ノードは、領域内連結成分に一対一で対応する。例えば、領域内連結成分CCiの対応するノードはnjであり、ここで、i=jのルールに従ってi及びjを設定してもよい。
【0035】
ステップS403において、領域内連結成分に基づいて有向グラフの辺を構築する。領域内連結成分の中心に基づいて辺を構築してもよい。各領域内連結成分CCiの中心の座標は(xi,yi)である。例えば、領域内連結成分CCiの中心の座標(xi,yi)は、((xmax-xmin)/2,(ymax-ymin)/2)であってもよいし、(xav,yav)であってもよく、ここで、xmaxはCCi内の全ての画素の横座標の最大値であり、xminはCCi内の全ての画素の横座標の最小値であり、ymaxはCCi内の全ての画素の縦座標の最大値であり、yminはCCi内の全ての画素の縦座標の最小値であり、xavはCCi内の全ての画素の横座標の平均値(例えば算術平均値)であり、yavはCCi内の全ての画素の縦座標の平均値(例えば算術平均値)である。領域内連結成分CCiの中心の座標の決定方法は、上記の例に限定されない。ノードが領域内連結成分に一対一で対応することを考慮すると、領域内連結成分の中心の座標はノードの座標と称されてもよい。領域内連結成分の中心の座標は領域内連結成分の情報の一部であり、即ち、有向グラフは領域内連結成分の中心の座標に関連する。より具体的には、有向グラフのノード、辺、及び辺のコストは全て、領域内連結成分の中心の座標に関連する。ここで、帯状領域Rn内の領域内連結成分の数がゼロである場合、構築された有向グラフは該帯状領域Rnの情報を含まない。
【0036】
所定の条件に従って有向グラフの辺を構築してもよい。例えば、以下の方法により有向グラフの辺を構築してもよい。ノードn
iとn
i’が式(1)の次の条件を満たす場合、ノードn
iとn
i’との間に有向辺e
ii’を構築する。
【数1】
【0037】
ここで、Hはターゲット画像の高さであり、hiは領域内連結成分CCiの高さであり、hi’は領域内連結成分CCi’の高さである。即ち、辺の先頭ノードの横座標と末尾ノードの横座標とが異なり、辺の末尾ノードと先頭ノードとの横座標の差(即ち、末尾ノードと先頭ノードとの横方向の距離)がターゲット画像の高さよりも小さく、辺の末尾ノードと先頭ノードとの縦座標の差の絶対値(即ち、末尾ノードと先頭ノードとの縦方向の距離)が末尾ノード及び先頭ノードに対応する対応領域内連結成分の高さの何れよりも小さい。上記の条件は単なる一例であり、より一般的には、除去すべき線の方向に基づいて有向グラフの辺を構築してもよい。好ましくは、上記の条件は、除去すべき線の方向が実質的に水平方向である場合に用いられてもよい。
【0038】
除去すべき線が基本的に第1方向である場合、以下の条件に従って辺を構築してもよい。該辺により連結された2つのノードに対応する領域内連結成分の中心の座標の第1方向の座標が異なり、該辺により連結された2つのノードに対応する領域内連結成分の中心の間の第1方向の距離がターゲット画像の第2方向のサイズよりも小さく、該辺により連結された2つのノードに対応する領域内連結成分の中心の第2方向の座標の差の絶対値が対応する連結成分の第2方向のサイズの何れよりも小さい。ここで、第1方向は第2方向と垂直である。
【0039】
また、除去すべき線が垂直方向である場合、グレースケール文書画像を90°だけ回転させた後に、2値化を行い、有向グラフを構築し、線を除去し、最後に、線が除去された文書画像を逆方向に90°だけ回転させてもよい。このように、有向グラフの辺を構築するために用いられる条件は、上記の条件を用いてもよい。
【0040】
ステップS405において、有向グラフの単一始点最短経路を決定するために、領域内連結成分に基づいて、有向グラフの構築された辺のコストを決定する。
【0041】
ステップS405におけるコストの決定について、
図5を参照してもよい。
図5は、本開示の1つの実施例に係る辺のコストの決定方法50を示すフローチャートである。
【0042】
ステップS501において、領域内連結成分の中心のフィッティング直線を決定する。領域内連結成分集合{CCi}における各領域内連結成分の中心の座標に基づいて、線形フィッティングにより、これらの中心に最も近い直線を取得する。一例では、ランダムサンプルコンセンサス(RANSAC:RANdom SAmple Consensus)方法/アルゴリズムによりフィッティング直線を決定する。複数の離散点についての線形フィッティングは従来の手法であり、ここでその説明を省略する。1つの変形例では、フィッティング直線に基づいて、ターゲット画像に除去すべき線があるか否かを判断してもよい。例えば、フィッティング直線の傾きが所定の傾き閾値よりも小さい場合、除去すべき線があると決定し、そうでない場合、提示情報を表示した後に画像処理方法を終了させる。
【0043】
ステップS503において、フィッティング直線に基づいて、構築された辺のコストを決定する。より具体的には、フィッティング直線L
f及び構築された辺に対応する領域内連結成分の中心の座標に基づいて、コストを決定してもよい。コスト決定の一例では、まず、対応するノードの位置及びフィッティング直線(例えば式(2))に基づいて初期コストを決定してもよい。
【数2】
【0044】
ここで、cii’はノードniからノードni’への構築された辺eii’の初期コストであり、(xi,yi)はノードniに対応する領域内連結成分CCiの中心の座標であり、(xi’,yi’)はノードni’に対応する領域内連結成分CCi’の中心の座標であり、dis(CCi’,Lf)はノードni’に対応する領域内連結成分の中心からフィッティング直線Lfまでの距離である。
【0045】
次に、初期コストを正規化し、構築された辺のコストとする。正規化方法の例は、式(3)に例示的に示す対数関数であってもよい。
【数3】
【0046】
ここで、cnii’はノードniからノードni’への構築された辺eii’のコストであり、負の数であり、cminは全ての構築された辺の初期コストのうちの最小初期コストであり、cmaxは全ての構築された辺の初期コストのうちの最大初期コストである。
【0047】
以下は、方法10の変形例を説明する。
【0048】
文書画像内の文字認識を妨げる除去すべき線が文書画像内の文字にくっついている可能性はある。この現象の例として、
図2に示すように、文字Ch2と線Lとがくっついている。このようなくっつくことにより、決定された単一始点最短経路に対応する領域内連結成分に文字領域の一部が含まれる。
図6は、本開示の1つの実施例に係る単一始点最短経路Pの最短経路連結成分
(外8)
(
図6では、最も濃い色の領域となるように着色され、各連結成分
(外9)
の境界が図示されていない)を示している。ここで、
図6では、3種類の色で着色により調整されたターゲット画像について、3種類の異なる領域内連結成分を例示的に示している。例示的に示されているターゲット画像における最短経路連結成分(最も濃い色の着色領域)に加えて、他の領域内連結成分、即ち残り連結成分を示している。該残り連結成分は、残りの連結成分における奇数番号の領域内連結成分(
図6において中間の暗さの色で着色され、「奇数番号のCC」で示されている)及び偶数番号の領域内連結成分(
図6において最も薄い色で着色され、「偶数番号のCC」で示されている)を含み、ここで、番号は、領域内連結成分が所属する帯状領域のインデックスを意味する。
図6に示すように、単一始点最短経路の最短経路連結成分集合
(外10)
には、文字Ch2の文字領域の一部が含まれている(文字Ch2の下部を参照する)。文書画像における最短経路連結成分集合
(外11)
に対応する領域内の画素を直接除去する(例えば、対応する領域の画素値を背景画素の平均値に置き換える)と、認識すべき文字が破壊されるため、テキスト認識エンジンの性能が低下してしまう。従って、好ましくは、単一始点最短経路の最短経路連結成分集合
(外12)
におけるターゲット画像内の文字にくっついているくっつき領域内の連結成分を除去してもよい。
【0049】
従って、
図1のステップS107は、好ましくは、有向グラフに基づいて有向グラフの単一始点最短経路を決定するステップと、
所定のくっつき除去条件に従って単一始点最短経路Pの最短経路連結成分集合
(外13)
におけるターゲット画像内の文字にくっついているくっつき領域内の連結成分を除去し、ターゲット領域内連結成分集合
(外14)
を決定するステップと、を含んでもよい。該くっつき領域内の連結成分を除去する処理は、除去処理と略称されてもよい。一例では、所定のくっつき除去条件は、単一始点最短経路の最短経路連結成分
(外15)
の高さh
kがターゲット画像における領域内連結成分の高さの平均値h
avのTht倍よりも大きいことであってもよく、Thtは所定値である。一例では、所定のくっつき除去条件は、単一始点最短経路の最短経路連結成分
(外16)
の高さh
kがターゲット画像における領域内連結成分の高さの中央値h
miのTht倍よりも大きいことであってもよい。Thtは、ゼロよりも大きい所定閾値であり、その大きさが経験に応じて決定されてもよく、例えば、Thtは0.2であってもよい。h
kが所定のくっつき除去条件を満たす場合、最短経路連結成分集合
(外17)
から対応する領域内連結成分を除去し、そうでない場合、該対応する領域内連結成分を保留する。
図7は、本開示の1つの実施例に係る除去処理により決定されたターゲット領域内連結成分
(外18)
を示す図である。ここで、各ターゲット領域内連結成分
(外19)
の間の境界が示されていない。
図7から分かるように、上記のくっついている文字領域の一部(文字Ch2の下部を参照する)がターゲット領域内連結成分集合
(外20)
に存在しない。
【0050】
図8は、本開示の1つの実施例に係るグレースケール文書画像Imgにおけるターゲット経路に対応する線を除去した後のグレースケール文書画像Img’を示す図である。除去処理は、例えば、グレースケール文書画像Imgについて、ターゲット領域内連結成分
(外21)
における連結成分に対応する領域A
k’の画素の画素値を背景画素の平均値に設定してもよい。ここで、領域A
k’は、グレースケール文書画像Imgにおける画像領域であり、A
k’は、位置で
(外22)
における領域内連結成分
(外23)
に一対一で対応する。
【0051】
また、ターゲット画像について、文字により構成された前景を1つの線として抽出してもよい。
図9は、本開示のもう1つの実施例に係る除去処理により決定されたターゲット領域内連結成分
(外24)
を示す図である。
図9におけるターゲット領域内連結成分集合
(外25)
により構成された最も濃い色の線は、明らかに除去する必要がなく、この線は「偽陽性線」(false-positive line)と称されてもよい。従って、除去処理を行う前に、好ましくは、ターゲット領域内連結成分集合に対応する対応線が偽陽性線であるか否かを決定し、決定結果がYESの場合、除去処理を行わず、決定結果がNOの場合、除去処理を行う。ターゲット領域内連結成分集合
(外26)
の対応線のセグメントの数及びくっつきの数に基づいて、対応線が偽陽性線であるか否かを決定してもよい。一例では、以下の条件に基づいて、対応線が偽陽性線であるか否かを決定してもよい。
【0052】
Lenmax<H AND n_touching/n_segment>Th
ここで、Lenmaxは対応線のセグメントのうちの最長セグメントの長さであり、Hはターゲット画像の高さであり、n_touchingは対応線のくっつきの総数であり、n_segmentは対応線のセグメントの総数である。Thは所定の閾値であり、この条件を満たす場合、対応線が偽陽性線であり、そうでない場合、対応線が偽陽性線ではない。例えば、Thは1.6であってもよい。
図9では、n_segment=9、n_touching=15となり、決定結果はYESであるため、除去処理は行われない。1つのセグメントについて、そのくっつき回数の最大値は2であり、該セグメントの左端の画素の左側の最も近い隣接画素及び該セグメントの右端の画素の右側の最も近い隣接画素が前景画素であるか否かに基づいて、該セグメントのくっつき回数を決定し、両者が何れも前景画像である場合、該セグメントのくっつき回数は2である。各セグメントのくっつき回数の和はn_segmentである。本実施例では「偽陽性線の決定」が除去処理の後に行われるが、1つの変形例では、除去処理の前に行われてもよい。即ち、最短経路連結成分集合
(外27)
に対応する対応線が偽陽性線であるか否かを決定し、決定結果がYESの場合、除去処理を行わず、決定結果がNOの場合、除去処理を行う。
【0053】
本開示の1つの態様では、画像処理装置を提供する。以下は、
図10を参照しながら該装置を例示的に説明する。
【0054】
図10は本開示の1つの実施例に係る画像処理装置100を示す例示的なブロック図である。画像処理装置100は、二値化部101、分割部103、有向グラフ決定部105、ターゲット経路決定部107及び線除去部109を含む。二値化部101は、グレースケール文書画像をターゲット画像として二値化する。分割部103は、ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得する。有向グラフ決定部105は、複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定する。ターゲット経路決定部107は、有向グラフに基づいて、有向グラフの単一始点最短経路に関連するターゲット経路を決定する。線除去部109は、グレースケール文書画像におけるターゲット経路に対応する線を除去する。該画像処理装置100の各部について、本開示に係る画像処理方法の説明を参照してもよい。
【0055】
本開示の1つの態様では、光学式文字認識方法を提供する。
図11は、本開示の1つの実施例に係る光学式文字認識方法11を示すフローチャートである。光学式文字認識方法11は、認識すべき画像に対して前処理を行うステップ(ステップS1101)、及び前処理後の画像内の文字を認識するステップ(ステップS1103)を含む。ここで、前処理は、本開示に係る画像処理方法を含む。
【0056】
本開示の1つの態様では、光学式文字認識装置を提供する。
図12は、本開示の1つの実施例に係る光学式文字認識装置12を示す例示的なブロック図である。光学式文字認識装置12は、認識すべき画像に対して前処理を行う前処理部1201、及び前処理後の画像内の文字を認識する認識部1203を含む。ここで、前処理は、本開示に係る画像処理方法を含む。
【0057】
本開示の1つの態様では、プログラムが記憶されているコンピュータ読み取り可能な記憶媒体を提供する。該プログラムがプロセッサにより実行される際に、グレースケール文書画像をターゲット画像として二値化するステップと、ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得するステップと、複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定するステップと、有向グラフに基づいて、有向グラフの単一始点最短経路に関連するターゲット経路を決定するステップと、グレースケール文書画像におけるターゲット経路に対応する線を除去するステップと、を含む画像処理方法を実現する。
【0058】
本開示の1つの態様では、プログラムが記憶されているコンピュータ読み取り可能な記憶媒体を提供する。該プログラムがプロセッサにより実行される際に、本開示に係る光学式文字認識方法を実現する。
【0059】
本開示の1つの態様では、情報処理装置を提供する。
【0060】
図13は、本開示の1つの実施例に係る情報処理装置13を示す例示的なブロック図である。
図13において、中央処理部(CPU)1301は、読み出し専用メモリ(ROM)1302に記憶されているプログラム、又は記憶部1308からランダムアクセスメモリ(RAM)1303にロードされたプログラムにより各種の処理を実行する。RAM1303には、必要に応じて、CPU1301が各種の処理を実行するに必要なデータが記憶されている。
【0061】
CPU1301、ROM1302、及びRAM1303は、バス1304を介して互いに接続されている。入力/出力インターフェース1305もバス1304に接続されている。
【0062】
入力部1306(キーボード、マウスなどを含む)、出力部1307(ディスプレイ、例えばブラウン管(CRT)、液晶ディスプレイ(LCD)など、及びスピーカなどを含む)、記憶部1308(例えばハードディスクなどを含む)、通信部1309(ネットワークのインタフェースカード、例えばLANカード、モデムなどを含む)は、入力/出力インターフェース1305に接続されている。通信部1309は、ネットワーク、例えばインターネットを介して通信処理を実行する。
【0063】
必要に応じて、ドライバ1310は、入力/出力インターフェース1305に接続されてもよい。取り外し可能な媒体1311は、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどであり、必要に応じてドライバ1310にセットアップされて、その中から読みだされたコンピュータプログラムは必要に応じて記憶部1308にインストールされている。
【0064】
CPU1301は、本開示に係る画像処理方法又は光学式文字認識方法を実現するためのプログラムを実行してもよい。
【0065】
本開示の方法、装置及び記憶媒体によれば、少なくとも、以下の効果の1つを達成することができる。即ち、文書画像における行線を除去し、文書画像における列線を除去し、文書画像におけるノイズ線を除去し、処理速度を向上させ、占有する計算リソースを低減させ、文字認識エンジンの認識性能を改善することができる。
【0066】
以上は本開示の具体的な実施例を説明しているが、当業者は添付の特許請求の範囲の要旨及び範囲内で本開示に対して各種の変更(行の場合、各実施例の特徴を組み合わせ、或いは置き換える)、改善又は均等的なものを行うことができる。これらの変更、改善又は均等的なものは本開示の保護範囲に属する。
【0067】
なお、用語「含む」、「有する」は本明細書に説明された特徴、要素、ステップ又は部材の存在を意味するが、他の1つ又は複数の特徴、要素、ステップ又は部材の存在又は追加を排除するものではない。
【0068】
さらに、本発明の各実施例の方法は、明細書に記載され、或いは図面に示される時間の順序に従って実行されることに限定されず、他の時間の順序に従って実行されてもよいし、並行して又は独立して実行されてもよい。従って、本明細書に記載された方法の実行順序は、本発明の技術的範囲を制限するものではない。
【0069】
また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示するが、これらの付記に限定されない。
(付記1)
グレースケール文書画像をターゲット画像として二値化する二値化部と、
前記ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得する分割部と、
前記複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定する有向グラフ決定部と、
前記有向グラフに基づいて、前記有向グラフの単一始点最短経路に関連するターゲット経路を決定するターゲット経路決定部と、
前記グレースケール文書画像における前記ターゲット経路に対応する線を除去する線除去部と、を含む、画像処理装置。
(付記2)
前記第1方向は、前記ターゲット画像の水平方向又は垂直方向の何れかである、付記1に記載の画像処理装置。
(付記3)
各帯状領域の長さは、前記ターゲット画像の長さ又は幅の何れかに等しい、付記2に記載の画像処理装置。
(付記4)
各帯状領域は矩形である、付記1に記載の画像処理装置。
(付記5)
各帯状領域の幅は、2~10の画素幅の所定値に等しい、付記4に記載の画像処理装置。
(付記6)
中心が前記ターゲット画像の水平中央線より上に位置する連結成分を選択して、前記有向グラフのノードを設定し、或いは、
中心が前記ターゲット画像の水平中央線より下に位置する連結成分を選択して、前記有向グラフのノードを設定する、付記1に記載の画像処理装置。
(付記7)
前記有向グラフ決定部は、前記有向グラフの複数のノードを決定し、
前記複数のノードは、前記複数の帯状領域の領域内連結成分に一対一で対応する、付記1に記載の画像処理装置。
(付記8)
前記有向グラフ決定部は、前記有向グラフの辺を構築する、付記7に記載の画像処理装置。
(付記9)
構築された辺は、
該辺の先頭ノードの横座標と末尾ノードの横座標とが異なり、
該辺の末尾ノードと先頭ノードとの横座標の差が前記ターゲット画像の高さよりも小さく、且つ
該辺の末尾ノードと先頭ノードとの縦座標の差の絶対値が前記末尾ノード及び前記先頭ノードに対応する領域内連結成分の高さの何れよりも小さいことの条件を満たし、
前記有向グラフの各ノードの座標は、対応する領域内連結成分の中心の座標である、付記8に記載の画像処理装置。
(付記10)
前記有向グラフ決定部は、前記有向グラフの辺の2つのノードの座標に基づいて、前記辺のコストを決定する、付記8に記載の画像処理装置。
(付記11)
前記有向グラフ決定部は、前記有向グラフの複数のノードに対応する領域内連結成分の中心のフィッティング直線を決定する、付記10に記載の画像処理装置。
(付記12)
ランダムサンプルコンセンサス(RANSAC)アルゴリズムにより前記フィッティング直線を決定する、付記11に記載の画像処理装置。
(付記13)
前記有向グラフ決定部は、フィッティング直線の傾きに基づいて、前記ターゲット画像に除去すべき線があるか否かを決定する、付記11に記載の画像処理装置。
(付記14)
前記有向グラフ決定部は、前記有向グラフの辺の2つのノードの座標及び前記フィッティング直線に基づいて、前記辺のコストを決定する、付記11に記載の画像処理装置。
(付記15)
前記辺の2つのノードの横座標の差の絶対値、前記辺の2つのノードの縦座標の差の絶対値、及び前記2つのノードのうちの末尾ノードと前記フィッティング直線との距離に基づいて、前記辺のコストを決定する、付記14に記載の画像処理装置。
(付記16)
前記コストは、対数関数を用いて正規化された負の値である、付記15に記載の画像処理装置。
(付記17)
前記ターゲット経路決定部は、
前記有向グラフに仮想ノードを追加し、
前記仮想ノードから他のノードまでの仮想辺を構築し、
前記仮想辺のコストをゼロに設定する、付記1に記載の画像処理装置。
(付記18)
前記ターゲット経路決定部は、前記仮想ノードを始点とする場合、ベルマンフォード(Bellman-Ford)アルゴリズムにより、前記有向グラフの単一始点最短経路を決定する、付記17に記載の画像処理装置。
(付記19)
グレースケール文書画像をターゲット画像として二値化するステップと、
前記ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得するステップと、
前記複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定するステップと、
前記有向グラフに基づいて、前記有向グラフの単一始点最短経路に関連するターゲット経路を決定するステップと、
前記グレースケール文書画像における前記ターゲット経路に対応する線を除去するステップと、を含む、画像処理方法。
(付記20)
プログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、前記プログラムがプロセッサにより実行される際に、
グレースケール文書画像をターゲット画像として二値化するステップと、
前記ターゲット画像を分割し、第1方向に沿って配置された複数の帯状領域を取得するステップと、
前記複数の帯状領域の領域内連結成分に基づいて、ターゲット画像全体についての有向グラフを決定するステップと、
前記有向グラフに基づいて、前記有向グラフの単一始点最短経路に関連するターゲット経路を決定するステップと、
前記グレースケール文書画像における前記ターゲット経路に対応する線を除去するステップと、を含む画像処理方法を実現する、記憶媒体。