(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024037483
(43)【公開日】2024-03-19
(54)【発明の名称】画像処理装置
(51)【国際特許分類】
G06V 30/16 20220101AFI20240312BHJP
【FI】
G06V30/16
【審査請求】未請求
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2022142377
(22)【出願日】2022-09-07
(71)【出願人】
【識別番号】000250502
【氏名又は名称】理想科学工業株式会社
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100101247
【弁理士】
【氏名又は名称】高橋 俊一
(74)【代理人】
【識別番号】100095500
【弁理士】
【氏名又は名称】伊藤 正和
(72)【発明者】
【氏名】飯島 愛璃
【テーマコード(参考)】
5B029
【Fターム(参考)】
5B029CC23
5B029EE04
(57)【要約】 (修正有)
【課題】文字のサイズや位置が安定していない原稿においても文字認識精度を向上させる画像処理装置を提供する。
【解決手段】画像処理装置10において、コントローラ20は、画像読取機構30で読み込まれた文字を含む画像中の文字部の位置及び大きさの情報を取得し、画像処理を実行する画像処理部211と、画像処理の結果から文字認識を行う文字認識部212と、を備える。画像処理部211は、認識された文字の円形近似した際の位置座標と、文字の大きさの傾向に基づいて分類する文字分類部211aと、文字分類部211aにより分類した文字情報から文字の傾きを補正する傾き補正部211bと、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
読み取り装置で読み込まれた文字を含む画像中の文字部の位置及び大きさの情報を取得し、画像処理を実行する画像処理部と、
前記画像処理の結果から文字認識を行う文字認識部と、を備え、
前記画像処理部は、認識された文字の円形近似した際の位置座標と、文字の大きさの傾向に基づいて分類する文字分類部と、分類した文字情報から文字の傾きを補正する傾き補正部とを備える
ことを特徴とする画像処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置に係り、特に、文字認識精度を向上させる画像処理装置に関する。
【背景技術】
【0002】
一般的に、スキャナなどで印刷用紙から画像を読み込み、読み込んだ画像から文字を抽出する際、文字認識向上の為、文字の傾きを補正する必要が有る。
【0003】
特許文献1には、文字の外接矩形の右端・左端・中央などの統一基準を決めることで文字の位置情報を得てから、直線回帰等によって文字列の傾きを算出することが開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の技術では、予め定めた統一基準と類似の文字群を抽出する工程があるため、同一の文字が含まれない場合には文字認識精度が低下するという課題があった。
【0006】
本発明は、このような課題に鑑みてなされたもので、文字の外接円の中心位置から文字列の傾きを求め、角度を補正することで画像の角度を修正し、さらに、外接円の半径や中心位置を用いることで、文字認識精度を向上させる画像処理装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するため、本発明に係る画像処理装置の特徴は、
読み取り装置で読み込まれた文字を含む画像中の文字部の位置及び大きさの情報を取得し、画像処理を実行する画像処理部と、
前記画像処理の結果から文字認識を行う文字認識部と、を備え、
前記画像処理部は、認識された文字の円形近似した際の位置座標と、文字の大きさの傾向に基づいて分類する文字分類部と、分類した文字情報から文字の傾きを補正する傾き補正部とを備えることにある。
【発明の効果】
【0008】
本発明に係る画像処理装置の特徴によれば、文字のサイズや位置が安定していない原稿においても文字認識精度を向上させることができる。
【図面の簡単な説明】
【0009】
【
図1】本発明の実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。
【
図2】本発明の実施形態に係る画像処理装置が備える画像処理部の処理内容を説明した説明図である。(a)は、読み込まれた画像の一例を示した図であり、(b)は、(a)に示した画像G10の部分画像である画像G11の拡大図であり、(c)は、(b)に示した画像G11の部分画像である画像G12の拡大図である。
【
図3】本発明の実施形態に係る画像処理装置が備える文字分類部による文字分類の処理内容を説明した説明図である。
【
図4】本発明の実施形態に係る画像処理装置における処理内容を示したフローチャートである。
【発明を実施するための形態】
【0010】
以下、本発明の実施の形態について、図面を参照して説明する。各図面を通じて同一若しくは同等の部位や構成要素には、同一若しくは同等の符号を付している。ただし、図面は模式的なものであり、現実のものとは異なることに留意すべきである。また、図面相互間においても互いの寸法の関係や比率が異なる部分が含まれている。
【0011】
また、以下に示す実施の形態は、この発明の技術的思想を具体化するための装置等を例示するものであって、この発明の技術的思想は、各構成部品の配置等を下記のものに特定するものでない。この発明の技術的思想は、特許請求の範囲において、種々の変更を加えることができる。
【0012】
図1は、本発明の実施形態に係る画像処理装置10のハードウェア構成を示すブロック図である。本図に示すように、画像処理装置10は、コントローラ20と画像読取機構30とを備えている。画像処理装置10は、画像読取機構30で読み取った原稿の画像データに含まれる文字を補正し、補正した文字を文字認識し、外部装置に出力する処理を行なう。
【0013】
画像読取機構30は、光源、原稿台、原稿台カバー、電荷結合型撮像素子列であるCCD、CCDを走査させる駆動モータ、CCDの出力信号をデジタル信号に変換するADコンバータ等を備えている。光源から原稿台に載置された原稿に光を照射し、その露光面の反射光をCCDで読み取ることにより、原稿露光面の画像データを取得する。原稿台カバーは、原稿台に載置された原稿を押さえるとともに外光を遮断する役割を担っている。また、原稿台カバーにオートシートフィーダ機能を備えさせるようにしてもよい。
【0014】
コントローラ20は、CPU21、ROM22、RAM23、インタフェース24を備えている。CPU21は、ROM22に記録されたプログラムにしたがって処理を行なうことで、画像読取機構30の光学的な原稿読取動作を制御する。読み取った原稿画像には、文字画像が含まれている。
【0015】
コントローラ20は、画像読取機構30で読み取った原稿の画像データに含まれる文字を補正し、補正した文字を文字認識する。
【0016】
RAM23は、読み取られた画像データが記憶される。
【0017】
インタフェース24は、USB等の所定のプロトコルを用いて外部装置との通信を行なう。
【0018】
CPU21は、その機能上、画像処理部211と、文字認識部212とを有する。
【0019】
画像処理部211は、画像読取機構30で読み込まれた文字を含む画像中の文字部の位置及び大きさの情報を取得し、画像処理を実行する。
【0020】
文字認識部212は、画像処理部211による画像処理の結果から文字認識を行う。
【0021】
また、画像処理部211は、文字分類部211aと、傾き補正部211bとを有している。
【0022】
文字分類部211aは、認識された文字の円形近似した際の位置座標と、文字の大きさの傾向に基づいて分類する。
【0023】
図2は、本発明の実施形態に係る画像処理装置10が備える画像処理部211の処理内容を説明した説明図である。(a)は、読み込まれた画像の一例を示した図であり、(b)は、(a)に示した画像G10の部分画像である画像G11の拡大図であり、(c)は、(b)に示した画像G11の部分画像である画像G12の拡大図である。
【0024】
図2(a)に示すように、画像読取機構30で読み込まれた画像G10には、文字が含まれている。
【0025】
文字分類部211aは、読み込まれた画像G10に含まれる画像について、ぼかし処理を実行することにより、
図2(b)に示すような、ぼかし処理が施された画像G11を得る。
【0026】
図2(c)に示すように、画像G12には、ぼかし処理された文字画像D11~D14が含まれている。
【0027】
文字分類部211aは、文字画像D11~D14に外接する外接円D21~D24を求める。そして、外接円D21~D24は、その外接円D21~D24の中心座標および半径を算出する。ここでは、外接円D21について、中心座標(x1,y1)および半径r1を示している。
【0028】
このように、文字画像に対して、ぼかし処理を施すことで、文字の各辺の形状や端部を検出しやすくすることができる。
【0029】
文字分類部211aは、算出した半径rを用いて、類似する文字を分類する。また、文字分類部211aは、分類ごとに、算出した外接円D21~D24の中心座標を用いて、例えば、最小二乗法などの直線回帰式をもちいて傾きを算出する。
【0030】
文字の中には、「ぁ」や「っ」などの小文字が含まれることがある。このような場合には、円の半径rの値から小文字か否かを分類しておくことで、分類したデータを文字認識部212で使用することで文字認識精度を向上さえることができる。
【0031】
図3は、文字分類部211aによる文字分類の処理内容を説明した説明図である。
【0032】
図3に示すように、文字分類部211aは、例えば円の半径rのヒストグラムD10を生成する。そして、文字分類部211aは、閾値Th1よりも半径rが小さい場合に、小文字と分類する。
【0033】
また、アルファベットの「q」や「y」などの文字位置が異なる文字については、文字分類部211aは、隣り合う文字の円の中心位置とのy方向の差分のヒストグラムを生成する。すなわち、
図6に示したヒストグラムの横軸をy方向の差分として生成する。
【0034】
そして、文字分類部211aは、所定の閾値Th2よりもy方向の差分が大きい場合に、小文字と分類する。
【0035】
傾き補正部211bは、文字分類部211aにより分類した文字と算出した傾きとを含む文字情報から文字の傾きを補正する。
【0036】
図4は、本発明の実施形態に係る画像処理装置10における処理内容を示したフローチャートである。
【0037】
図4に示すように、ステップS101において、画像読取機構30が画像データを読み込む。
【0038】
ステップS103において、文字分類部211aは、読み込んだ画像データが、カラー画像か、グレー画像かを判断する。
【0039】
カラー画像である場合(ステップS103;カラーの場合)、ステップS105において、文字分類部211aは、カラー画像をモノクロ化する。
【0040】
ステップS107において、モノクロ化したカラー画像、またはグレー画像を二値化する。
【0041】
ステップS109において、文字分類部211aは、文字画像に外接する外接円を求め、外接円の中心座標および半径を算出する。
【0042】
ステップS111において、文字分類部211aは、算出した半径の大きさから、類似文字を分類する。
【0043】
ステップS113において、文字分類部211aは、分類ごとに、外接円の中心座標から文字列の傾きを求める。
【0044】
ステップS115において、傾き補正部211bは、文字分類部211aにより分類した文字と算出した傾きとを含む文字情報から文字の傾きを補正する。
【0045】
(付記)
本出願は、以下の発明を開示する。
【0046】
(付記1)
読み取り装置で読み込まれた文字を含む画像中の文字部の位置及び大きさの情報を取得し、画像処理を実行する画像処理部と、
前記画像処理の結果から文字認識を行う文字認識部と、を備え、
前記画像処理部は、認識された文字の円形近似した際の位置座標と、文字の大きさの傾向に基づいて分類する文字分類部と、分類した文字情報から文字の傾きを補正する傾き補正部とを備える
ことを特徴とする画像処理装置。
【0047】
これにより、スキャナなどで読み込んだ文字の外接円の中心位置から文字列の傾きを求め、角度を補正することで画像の角度を修正し、さらに、外接円の半径や中心位置を用いることで、ひらがなの小文字やアルファベットのなど大きさや位置が異なる文字について、精度良く抽出することが出来る。特に手書き原稿などの様に、文字のサイズや位置が安定していない原稿においても文字認識精度を向上させることができる。
【符号の説明】
【0048】
10 画像処理装置
20 コントローラ
24 インタフェース
30 画像読取機構
211 画像処理部
211a 文字分類部
211b 補正部
212 文字認識部