(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022053983
(43)【公開日】2022-04-06
(54)【発明の名称】印刷文字認識用正解データ生成装置、方法、およびプログラム
(51)【国際特許分類】
G06V 30/196 20220101AFI20220330BHJP
【FI】
G06K9/68 E
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2020160912
(22)【出願日】2020-09-25
(71)【出願人】
【識別番号】000153203
【氏名又は名称】株式会社日本経済新聞社
(74)【代理人】
【識別番号】100108855
【弁理士】
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100103034
【弁理士】
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100179062
【弁理士】
【氏名又は名称】井上 正
(74)【代理人】
【識別番号】100153051
【弁理士】
【氏名又は名称】河野 直樹
(74)【代理人】
【識別番号】100199565
【弁理士】
【氏名又は名称】飯野 茂
(74)【代理人】
【識別番号】100162570
【弁理士】
【氏名又は名称】金子 早苗
(72)【発明者】
【氏名】山田 剛
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AA01
5B064AB02
5B064BA01
5B064DA19
5B064DA21
5B064DA23
5B064DA26
5B064DC06
5B064DC09
(57)【要約】
【課題】 古文書に印刷された文字のOCR認識のために使用される正解データを、自動的に大量に生成すること。
【解決手段】 印刷文字認識用正解データ生成装置は、印刷された文字の認識用に使用される正解データを自動的に生成する装置であって、所定の文字に対して予め与えられた正解データの画像を記憶する記憶装置と、前記記憶装置に記憶されている前記正解データの画像を取得する正解データ取得部と、前記取得された正解データの画像に、ノイズを加える処理を実施するノイズ追加部と、前記ノイズ追加部によってノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる正解データ書込部とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
印刷された文字の認識用に使用される正解データを自動的に生成する装置であって、
所定の文字に対して予め与えられた正解データの画像を記憶する記憶装置と、
前記記憶装置に記憶されている前記正解データの画像を取得する正解データ取得部と、
前記取得された正解データの画像に、ノイズを加える処理を実施するノイズ追加部と、
前記ノイズ追加部によってノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる正解データ書込部とを備えた、
印刷文字認識用正解データ生成装置。
【請求項2】
前記ノイズ追加部は、前記ノイズを加える処理として、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、
前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、
前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、
前記正解データの画像の少なくとも一部の明るさを変更する第5の処理と
のうちの少なくとも1つを実施する、請求項1に記載の印刷文字認識用正解データ生成装置。
【請求項3】
前記ノイズ追加部は、前記ノイズを加える処理として、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、
前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、
前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、
前記正解データの画像の少なくとも一部の明るさを変更する第5の処理と
のうちの任意の組合せを実施する、請求項1に記載の印刷文字認識用正解データ生成装置。
【請求項4】
前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、請求項2または3に記載の印刷文字認識用正解データ生成装置。
【請求項5】
前記第2の処理において加える点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項2乃至4のうち何れか1項に記載の印刷文字認識用正解データ生成装置。
【請求項6】
前記第3の処理において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項2乃至5のうち何れか1項に記載の印刷文字認識用正解データ生成装置。
【請求項7】
印刷された文字の認識用に使用される正解データを自動的に生成する装置によって実施される方法であって、
前記装置が、
所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶し、
前記記憶装置に記憶されている前記正解データの画像を取得し、
前記取得された正解データの画像に、ノイズを加える処理を実施し、
前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる、
印刷文字認識用正解データ生成方法。
【請求項8】
前記ノイズを加える処理は、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、
前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、
前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、
前記正解データの画像の少なくとも一部の明るさを変更する第5の処理と
のうちの少なくとも1つを含む、請求項7に記載の印刷文字認識用正解データ生成方法。
【請求項9】
前記ノイズを加える処理は、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、
前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、
前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、
前記正解データの画像の少なくとも一部の明るさを変更する第5の処理と
のうちの任意の組合せを含む、請求項7に記載の印刷文字認識用正解データ生成方法。
【請求項10】
前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、請求項8または9に記載の印刷文字認識用正解データ生成方法。
【請求項11】
前記第2の処理において加える点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項8乃至10のうち何れか1項に記載の印刷文字認識用正解データ生成方法。
【請求項12】
前記第3の処理において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項8乃至11のうち何れか1項に記載の印刷文字認識用正解データ生成方法。
【請求項13】
印刷された文字の認識用に使用される正解データを自動的に生成するためのプログラムであって、
所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶する機能、
前記記憶装置に記憶されている前記正解データの画像を取得する機能、
前記取得された正解データの画像に、ノイズを加える処理を実施する機能、
前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる機能、
をプロセッサに実現させるためのプログラム。
【請求項14】
前記ノイズを加える処理を実施する機能は、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能、
前記正解データの画像に、所定数の点を、任意の場所に加える機能、
前記正解データの画像に、所定数の任意の端部を切断する機能、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する機能、
前記正解データの画像の少なくとも一部の明るさを変更する機能、
のうちの少なくとも1つを含む、請求項13に記載のプログラム。
【請求項15】
前記ノイズを加える処理を実施する機能は、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能、
前記正解データの画像に、所定数の点を、任意の場所に加える機能、
前記正解データの画像に、所定数の任意の端部を切断する機能、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する機能、
前記正解データの画像の少なくとも一部の明るさを変更する機能、
のうちの任意の組合せを含む、請求項13に記載のプログラム。
【請求項16】
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能において加えられる線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、請求項14または15に記載のプログラム。
【請求項17】
前記正解データの画像に、所定数の点を、任意の場所に加える機能において加えられる点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項14乃至16のうち何れか1項に記載のプログラム。
【請求項18】
前記正解データの画像に、所定数の任意の端部を切断する機能において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項14乃至17のうち何れか1項に記載のプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、印刷された文字、特に、古文書に印刷された文字の認識のための正解データを自動的に生成するのに好適な、印刷文字認識用正解データ生成装置、方法、およびプログラムに関する。
【背景技術】
【0002】
手書きや印刷された文字をOCRによって正しく認識するためには、あらかじめ適切な正解データを生成し、OCRに提供する必要がある。
【0003】
このように正解データが提供されることによって、OCRは、例えば、印刷された「あ」という画像が、「あ」という文字に紐付けされた正解データと一致した場合に、「あ」という文字であると認識している。
【0004】
一般に、人による癖が文字の見栄えに大きく影響を与える手書きされた文字よりも、印刷機によって印刷された文字の方が、OCRによる認識率は高い。
【0005】
しかしながら、印刷された文字といっても、フォントや、印刷状態に応じて、文字の見栄えは様々に異なる。
【0006】
図5は、古文書における印刷状態の例を示す図である。
【0007】
印刷状態とは、特に、古文書に印刷された文字の場合、
図5(a)に例示するような穴あきや、
図5(b)(c)、(e)に例示するように、印刷用紙に起因する様々な汚れや染み、
図5(d)に例示するような裏写り(d)、
図5(f)に例示するような薄文字のみならず、やぶれ、斜め印刷、かすれ等もある。
【0008】
そのため、古文書に印刷された文字のOCRによる認識率を高めるためには、同じ文字に対して、フォントのみならず、上記のような異なる印刷状態に応じて、正解データを生成し、OCRに提供する必要がある。このように、異なる印刷状態に応じた正解データを生成するために、従来は、様々なパターンの文字の画像を収集し、収集した画像に基づいて、手作業で正解データを生成している。
【先行技術文献】
【特許文献】
【0009】
【発明の概要】
【発明が解決しようとする課題】
【0010】
OCRによる認識率を高めるためには、より多くの正解データを生成し、OCRに提供する必要がある。しかしながら、大量の正解データを生成するためには、様々なパターンの文字画像の収集のために、相応のコストを要するのに加えて、手作業でなされているために、多大な手間を要するという問題がある。
【0011】
本発明はこのような事情に鑑みてなされたものであり、古文書に印刷された文字のOCR認識のために使用される正解データを、自動的に大量に生成することが可能な印刷文字認識用正解データ生成装置、方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0012】
上記の目的を達成するために、本発明では、以下のような手段を講じる。
【0013】
請求項1の発明は、印刷された文字の認識用に使用される正解データを自動的に生成する装置であって、所定の文字に対して予め与えられた正解データの画像を記憶する記憶装置と、前記記憶装置に記憶されている前記正解データの画像を取得する正解データ取得部と、前記取得された正解データの画像に、ノイズを加える処理を実施するノイズ追加部と、前記ノイズ追加部によってノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる正解データ書込部とを備えた印刷文字認識用正解データ生成装置である。
【0014】
請求項2の発明は、前記ノイズ追加部は、前記ノイズを加える処理として、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、前記正解データの画像の少なくとも一部の明るさを変更する第5の処理とのうちの少なくとも1つを実施する、請求項1に記載の印刷文字認識用正解データ生成装置である。
【0015】
請求項3の発明は、前記ノイズ追加部は、前記ノイズを加える処理として、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、前記正解データの画像の少なくとも一部の明るさを変更する第5の処理とのうちの任意の組合せを実施する、請求項1に記載の印刷文字認識用正解データ生成装置である。
【0016】
請求項4の発明は、前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、請求項2または3に記載の印刷文字認識用正解データ生成装置である。
【0017】
請求項5の発明は、前記第2の処理において加える点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項2乃至4のうち何れか1項に記載の印刷文字認識用正解データ生成装置である。
【0018】
請求項6の発明は、前記第3の処理において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項2乃至5のうち何れか1項に記載の印刷文字認識用正解データ生成装置である。
【0019】
請求項7の発明は、印刷された文字の認識用に使用される正解データを自動的に生成する装置によって実施される方法であって、前記装置が、所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶し、前記記憶装置に記憶されている前記正解データの画像を取得し、前記取得された正解データの画像に、ノイズを加える処理を実施し、前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる、印刷文字認識用正解データ生成方法である。
【0020】
請求項8の発明は、前記ノイズを加える処理は、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、前記正解データの画像の少なくとも一部の明るさを変更する第5の処理とのうちの少なくとも1つを含む、請求項7に記載の印刷文字認識用正解データ生成方法である。
【0021】
請求項9の発明は、前記ノイズを加える処理は、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、前記正解データの画像の少なくとも一部の明るさを変更する第5の処理とのうちの任意の組合せを含む、請求項7に記載の印刷文字認識用正解データ生成方法である。
【0022】
請求項10の発明は、前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、請求項8または9に記載の印刷文字認識用正解データ生成方法である。
【0023】
請求項11の発明は、前記第2の処理において加える点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項8乃至10のうち何れか1項に記載の印刷文字認識用正解データ生成方法である。
【0024】
請求項12の発明は、前記第3の処理において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項8乃至11のうち何れか1項に記載の印刷文字認識用正解データ生成方法である。
【0025】
請求項13の発明は、印刷された文字の認識用に使用される正解データを自動的に生成するためのプログラムであって、所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶する機能、前記記憶装置に記憶されている前記正解データの画像を取得する機能、前記取得された正解データの画像に、ノイズを加える処理を実施する機能、前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる機能をプロセッサに実現させるためのプログラムである。
【0026】
請求項14の発明は、前記ノイズを加える処理を実施する機能は、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能、前記正解データの画像に、所定数の点を、任意の場所に加える機能、前記正解データの画像に、所定数の任意の端部を切断する機能、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する機能、前記正解データの画像の少なくとも一部の明るさを変更する機能のうちの少なくとも1つを含む、請求項13に記載のプログラムである。
【0027】
請求項15の発明は、前記ノイズを加える処理を実施する機能は、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能、前記正解データの画像に、所定数の点を、任意の場所に加える機能、前記正解データの画像に、所定数の任意の端部を切断する機能、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する機能、前記正解データの画像の少なくとも一部の明るさを変更する機能のうちの任意の組合せを含む、請求項13に記載のプログラムである。
【0028】
請求項16の発明は、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能において加えられる線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、請求項14または15に記載のプログラムである。
【0029】
請求項17の発明は、前記正解データの画像に、所定数の点を、任意の場所に加える機能において加えられる点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項14乃至16のうち何れか1項に記載のプログラムである。
【0030】
請求項18の発明は、前記正解データの画像に、所定数の任意の端部を切断する機能において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項14乃至17のうち何れか1項に記載のプログラムである。
【発明の効果】
【0031】
本発明の印刷文字認識用正解データ生成装置、方法、およびプログラムによれば、古文書に印刷された文字のOCR認識のために使用される正解データを、自動的に大量に生成することが可能となる。
【図面の簡単な説明】
【0032】
【
図1】
図1は、本発明の実施形態に係る印刷文字認識用正解データ生成方法が適用された印刷文字認識用正解データ生成装置の電子回路構成例を示すブロック図である。
【
図2】
図2は、種々のサブモジュールを備えたノイズ追加モジュールの構成例を示す図である。
【
図3】
図3は、既存の正解データ、および既存の正解データから生成される別の正解データの様々な画像の例を示す図である。
【
図4】
図4は、印刷文字認識用正解データ生成装置の動作例を示すフローチャートである。
【
図5】
図5は、古文書における印刷状態の例を示す図である。
【発明を実施するための形態】
【0033】
以下に、本発明の実施形態を、図面を参照して説明する。
【0034】
図1は、本発明の実施形態に係る印刷文字認識用正解データ生成方法が適用された印刷文字認識用正解データ生成装置の電子回路構成例を示すブロック図である。
【0035】
印刷文字認識用正解データ生成装置10は、印刷された文字のOCR認識用に使用される正解データを自動的に生成する装置であって、その電子回路は、バス11によって互いに接続されたCPU12、記録媒体読取部14、メモリ20、および記憶装置30を備えている。
【0036】
メモリ20は、正解データ取得モジュール21、ノイズ追加モジュール22、および正解データ書込モジュール23を記憶している。
【0037】
これらモジュール21~23のプログラムは、メモリ20に予め記憶されていてもよいし、あるいはメモリカード等の外部記録媒体13から記録媒体読取部14を介してメモリ20に読み込まれて記憶されたものであってもよい。これらモジュール21~23のプログラムは、書き換えできないようになっている。
【0038】
メモリ20には、このようなユーザ書き換え不可能なエリアの他に、書き換え可能なデータを記憶するエリアとして、書込可能データエリア29が確保されている。
【0039】
CPU12は、コンピュータであって、メモリ20に記憶されている各モジュール21~23のプログラムに従い回路各部の動作を制御する。
【0040】
記憶装置30は、予め与えられている正解データA0の画像を記憶している正解データデータベース32(以降、「正解データDB32」と称する)を記憶する。
【0041】
正解データDB32は、正解データ書込モジュール23によって書き込まれた別の正解データA1、・・・・、Am(mは、2以上の整数)の画像も記憶する。
【0042】
記憶装置30例えばSSD(Solid State Drive)やHDD(Hard Disk Drive)等からなる。
【0043】
正解データ取得モジュール21は、記憶装置30の正解データDB32から、予め与えられている正解データA0の画像を取得する。
【0044】
ノイズ追加モジュール22は、正解データ取得モジュール21によって取得された正解データA0の画像に、ノイズを加える処理を実施する。
【0045】
ノイズ追加モジュール22は、穴あき、汚れ、染み、裏写り、薄文字、やぶれ、斜め印刷、かすみ等といった古文書特有の印刷状態を考慮した正解データを、大量かつ自動的に生成する。
【0046】
具体的には、ノイズ追加モジュール22は、正解データ取得モジュール21によって取得された正解データA0の画像に対して、意図的に、線や点を加えたり、端部を切断したり、色や明るさを変更する等といったノイズ追加処理を行う。そして、ノイズ追加処理がなされた正解データを、別の正解データとする。このように、ノイズ追加モジュール22は、既存の正解データA0から派生させることによって、多くの別の正解データA1、・・・・、Amを生成する。
【0047】
これらの処理を実施するために、ノイズ追加モジュール22は、種々のサブモジュールを備えている。
【0048】
図2は、種々のサブモジュールを備えたノイズ追加モジュールの構成例を示す図である。
【0049】
ノイズ追加モジュール22は、線追加サブモジュール220、点追加サブモジュール221、端部切断サブモジュール222、色変更サブモジュール223、および明るさ変更サブモジュール224を備えている。
【0050】
線追加サブモジュール220は、正解データA0の画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理を実行することによって、1つの正解データA0から、複数の別の正解データを生成する。第1の処理で加える線の太さは、例えば、正解データA0の画像によって形成される文字の太さより細くする。これによって、ノイズの過度な追加を阻止し、生成される別の正解データの画像が、正解データA0の画像から著しく逸脱したものとならないようにしている。
【0051】
【0052】
図3は、既存の正解データ、および既存の正解データから生成される別の正解データの様々な画像の例を示す図である。
【0053】
図3(h)は漢数字の「六」に対する正解データA
0を示している。線追加サブモジュール220は、
図3(h)に示すような正解データA
0に対して、
図3(b)、(f)、(i)、(p)に示すように、所定数の任意の長さの線を、任意の場所に加えることによって複数の別の正解データを生成する。
【0054】
図3(b)は、「六」に対する正解データA
0に、1本の線を加えることによって、「六」に対する別の正解データを生成した例を示し、
図3(i)は、3本の線を加えることによって、さらに別の正解データを生成した例を示している。また、
図3(p)、(f)は、太さも長さも一定ではない多くの線を加えることによって、さらに別の正解データを生成した例を示している。なお、
図3(b)、(f)は、後述するように、円追加サブモジュール221によって点を追加する第2の処理もなされている。
【0055】
このようにして、線追加サブモジュール220は、1つの正解データA0から、複数の別の正解データを生成する。これら線の太さは、正解データA0によって形成される「六」という文字の太さよりも細い。
【0056】
点追加サブモジュール221は、正解データA0の画像に、所定数の点を、任意の場所に加える第2の処理を実行することによって、1つの正解データA0から、複数の別の正解データを生成する。第2の処理で加えられる点の直径は、前述したようなノイズの過度な追加を阻止するために、例えば、正解データA0の画像によって形成される文字の太さよりも小さくする。
【0057】
第2の処理も、
図3を用いて具体的に説明する。点追加サブモジュール221は、
図3(h)に示すような漢数字の「六」に対する正解データA
0に対して、
図3(a)、(f)、(d)、(e)、(k)、(m)、(n)に示すように、所定数の点を、任意の場所に加えることによって複数の別の正解データを生成する。
【0058】
図3(a)、(e)、(k)、(m)は、「六」に対する正解データA
0に、1つの点を加えることによって、別の正解データを生成した例を示し、
図3(d)は、2つの点を加えることによって、さらに別の正解データを生成した例を示し、
図3(n)は、3つの点を加えることによって、さらにまた別の正解データを生成した例を示している。なお、
図3(d)は、後述するように、端部切断サブモジュール222によって、端部を切断する第3の処理もなされている。また、
図3(e)、(k)は、後述するように、色変換サブモジュール223によって、色を変換する第4の処理もなされている。
【0059】
このようにして、点追加サブモジュール221もまた、1つの正解データA0から、複数の別の正解データを生成する。これら点の直径は、正解データA0によって形成される文字の太さよりも小さい。
【0060】
端部切断サブモジュール222は、正解データA0の画像に、所定数の任意の端部を切断する第3の処理を実行することによって、1つの正解データA0から、複数の別の正解データを生成する。第3の処理で切断される量は、前述したようなノイズの過度な追加を阻止するために、例えば、正解データA0の画像によって形成される文字の面積の1/3を超えないようにする。
【0061】
第3の処理もまた、
図3を用いて具体的に説明する。端部切断サブモジュール222は、
図3(h)に示すような正解データA
0に対して、
図3(c)に示すように、所定数の任意の端部を切断することによって複数の別の正解データを生成する。
【0062】
図3(c)は、「六」に対する正解データA
0の右下側の端部を切断することによって、別の正解データを生成した例を示す。このようにして、端部切断サブモジュール222もまた、1つの正解データA
0から、複数の別の正解データを生成する。第3の処理で切断される量は、正解データA
0によって形成される文字の面積の1/3を超えない。
【0063】
色変更サブモジュール223は、正解データA0の画像によって形成される文字の少なくとも一部、正解データA0の画像によって形成される文字の背景の少なくとも一部、または正解データA0の画像によって形成される文字と背景との少なくとも一部の色を変更する第4の処理を実行することによって、1つの正解データA0から、複数の正解データを生成する。
【0064】
第4の処理もまた、
図3を用いて具体的に説明する。色変更サブモジュール223は、
図3(h)に示すような正解データA
0に対して、
図3(e)や
図3(g)に示すように、色を変更する処理を実行することによって複数の別の正解データを生成する。
【0065】
図3(g)は、正解データA
0である画像によって形成される文字の色を、例えば黒から赤に変更することによって、別の正解データを生成した例を示し、
図3(e)は、正解データA
0である画像によって形成される文字の背景の色を、例えば白から灰色に変更することによって、さらに別の正解データを生成した例を示している。このようにして、色変換サブモジュール223もまた、1つの正解データA
0から、複数の多くの別の正解データを生成する。
【0066】
明るさ変更サブモジュール224は、正解データA0の画像の少なくとも一部の明るさを変更する第5の処理を実行することによって、1つの正解データA0から、複数の正解データを生成する。
【0067】
第5の処理もまた、
図3を用いて具体的に説明する。明るさ変更サブモジュール224は、
図3(h)に示すような正解データA
0に対して、
図3(j)に示すように、明るさを変更する処理を実行することによって複数の別の正解データを生成する。
【0068】
図3(j)は、正解データA
0の画像によって形成される文字の明るさを下げる(薄くする)ことによって、別の正解データを生成した例を示す。図示していないが、逆に、文字の明るさを上げる(濃くする)ことによって、さらに別の正解データを生成することもできる。このようにして、明るさ変更サブモジュール224もまた、1つの正解データA
0から、複数の別の正解データを生成する。
【0069】
なお、上述した線追加サブモジュール220による第1の処理、点追加サブモジュール221による第2の処理、端部切断サブモジュール222による第3の処理、色変更サブモジュール223による第4の処理、および明るさ変更サブモジュール224による第5の処理は、個別に実施されることに限定されず、任意に組み合わせて、任意の回数実施することも可能である。
【0070】
図3(b)および
図3(f)は、
図3(h)に示すような正解データA
0に対して、線追加サブモジュール220によって線を追加する第1の処理と、点追加サブモジュール221によって点を追加する第2の処理とを組み合わせて実施して、正解データA
0から別の正解データを生成した例を示す。
【0071】
図3(d)は、
図3(h)に示すような正解データA
0に対して、点追加サブモジュール221によって点を追加する第2の処理と、端部切断サブモジュール222によって端部を切断する第3の処理とを組み合わせて実施して、正解データA
0から別の正解データを生成した例を示す。
図3(d)は、
図3(h)に示すような正解データA
0の左下端部が切断されるとともに、正解データA
0によって形成される文字の右側に2つの点が追加されている。
【0072】
図3(e)、(k)は、
図3(h)に示すような正解データA
0に対して、点追加サブモジュール221によって点を追加する第2の処理と、色変更サブモジュール223によって色を変換する第4の処理とを組み合わせて実施して、正解データA
0から別の正解データを生成した例を示す。
【0073】
なお、図示していないが、正解データA0に対して、第1から第5のすべての処理を組み合わせて実施することによって、正解データA0から、複数の別の正解データを生成することも可能である。
【0074】
このように、線追加サブモジュール220による第1の処理、点追加サブモジュール221による第2の処理、端部切断サブモジュール222による第3の処理、色変更サブモジュール223による第4の処理、および明るさ変更サブモジュール224による第5の処理を、それぞれ単独で、あるいは任意に組み合わせて実施することによって、1つの正解データA0から、多くの別の正解データA1、・・・・、Amを効率的に生成できる。
【0075】
正解データ書込モジュール23は、このようにしてノイズ追加モジュール22によって生成された別の正解データA1、・・・・、Amを、記憶装置30の正解データDB32に書き込み、記憶させる。
【0076】
このようにして正解データDB32に記憶された正解データA1、・・・・、Amは、すでに記憶されている正解データA0とともに、OCRによる文字認識のための正解データとして使用される。正解データA1、・・・・、Amは、古文書特有の印刷状態を考慮して生成されている。したがって、正解データA0に加えて、正解データA1、・・・・、Amをも使用してOCRによる文字認識を行うことによって、古文書のOCRによる文字認識率の向上を図ることができる。
【0077】
次に、以上のように構成した印刷文字認識用正解データ生成装置10の動作例について説明する。
【0078】
図4は、印刷文字認識用正解データ生成装置の動作例を示すフローチャートである。
【0079】
記憶装置30の正解データDB32には、例えば、
図3(h)に示す「六」のように、予め与えられている正解データA
0である画像が記憶されている。
【0080】
印刷文字認識用正解データ生成装置10によって、別の正解データA1、・・・・、Amを生成する場合、先ず、正解データ取得モジュール21によって、正解データDB32から、予め与えられている正解データA0の画像が、取得される(S1)。
【0081】
正解データ取得モジュール21によって取得された正解データA0の画像は、次に、ノイズ追加モジュール22によって、ノイズを加える処理が実施される(S2)。
【0082】
ノイズを加える処理には、それぞれ正解データA0の画像に対して、所定数の任意の長さの線を、任意の場所に加える第1の処理、所定数の点を、任意の場所に加える第2の処理、所定数の任意の端部を切断する第3の処理、正解データA0によって形成される文字の少なくとも一部、正解データA0の画像によって形成される文字の背景の少なくとも一部、または正解データA0の画像によって形成される文字と背景との少なくとも一部の色を変更する第4の処理、および正解データA0の画像の少なくとも一部の明るさを変更する第5の処理が含まれる。
【0083】
ノイズ追加モジュール22には、線追加サブモジュール220、点追加サブモジュール221、端部切断サブモジュール222、色変更サブモジュール223、および明るさ変更サブモジュール224が備えらえており、線追加サブモジュール220によって第1の処理が、点追加サブモジュール221によって第2の処理が、端部切断サブモジュール222によって第3の処理が、色変更サブモジュール223によって第4の処理が、および明るさ変更サブモジュール224によって第5の処理が実施される。これら第1乃至第5の処理は、単独で実施されることも、任意に組み合わせて実施されることも可能である。
【0084】
このようにして、ノイズ追加モジュール22では、正解データA0の画像に対して、意図的に、線や点を加えたり、端部を切断したり、色や明るさを変更する等といったノイズ追加処理が行われる。これによって、ノイズ追加モジュール22では、既存の正解データA0からの派生によって、多くの別の正解データA1、・・・・、Amが生成される。
【0085】
なお、第1の処理で加えられる線の太さは、正解データA0の画像によって形成される文字の太さより細くされる。第2の処理で加えられる点の直径は、正解データA0の画像によって形成される文字の太さよりも小さくされる。また、第3の処理で切断される量は、正解データA0の画像によって形成される文字の面積の1/3を超えないようにされる。これによって、ノイズの過度な追加が阻止されるので、生成される別の正解データA1、・・・・、Amの画像は、正解データA0の画像から著しく逸脱することはない適切なものとなる。
【0086】
生成された別の正解データA1、・・・・、Amは、正解データ書込モジュール23によって、記憶装置30の正解データDB32に書き込まれ、記憶される(S3)。このようにして、古文書の文字認識のための正解データA1、・・・・、Amが、自動的に大量に生成される。これら生成された正解データA1、・・・・、Amは、正解データA0とともに、古文書のOCRによる文字認識のために使用される。
【0087】
上述したように、本発明の実施形態に係る印刷文字認識用正解データ生成方法が適用された印刷文字認識用正解データ生成装置によれば、古文書に印刷された文字のOCR認識のために使用される正解データを、1つの正解データから、自動的に大量に生成することが可能となる。
【0088】
このように生成された正解データは、古文書特有の印刷状態、すなわち、印刷状態が悪く、印刷状態のバリエーションが多く存在するということが考慮されて生成されたものである。したがって、このように生成された正解データA1、・・・・、Amを、既存の正解データA0とともに、OCRによる文字認識に使用することによって、従来OCRによる文字認識が困難であった古文書であっても、高い精度で、文字を認識することが可能となる。
【0089】
以上、本発明を実施するための最良の形態について、添付図面を参照しながら説明したが、本発明はかかる構成に限定されない。特許請求の範囲の発明された技術的思想の範疇において、当業者であれば、各種の変更例及び修正例に想到し得るものであり、それら変更例及び修正例についても本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0090】
10 印刷文字認識用正解データ生成装置
11 バス
12 CPU
13 外部記録媒体
14 記録媒体読取部
20 メモリ
21 正解データ取得モジュール
22 ノイズ追加モジュール
23 正解データ書込モジュール
29 書込可能データエリア
30 記憶装置
32 正解データデータベース
220 線追加サブモジュール
221 点追加サブモジュール
222 端部切断サブモジュール
223 色変更サブモジュール
224 明るさ変更サブモジュール
【手続補正書】
【提出日】2021-12-09
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
印刷された文字の認識用に使用される正解データを自動的に生成する装置であって、
所定の文字に対して予め与えられた正解データの画像を記憶する記憶装置と、
前記記憶装置に記憶されている前記正解データの画像を取得する正解データ取得部と、
前記取得された正解データの画像に、ノイズを加える処理を実施するノイズ追加部と、
前記ノイズ追加部によってノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる正解データ書込部とを備え、
前記ノイズ追加部は、前記ノイズを加える処理として、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、
前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、
前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、
前記正解データの画像の少なくとも一部の明るさを変更する第5の処理と
のうちの少なくとも1つを実施し、
前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、
印刷文字認識用正解データ生成装置。
【請求項2】
印刷された文字の認識用に使用される正解データを自動的に生成する装置であって、
所定の文字に対して予め与えられた正解データの画像を記憶する記憶装置と、
前記記憶装置に記憶されている前記正解データの画像を取得する正解データ取得部と、
前記取得された正解データの画像に、ノイズを加える処理を実施するノイズ追加部と、
前記ノイズ追加部によってノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる正解データ書込部とを備え、
前記ノイズ追加部は、前記ノイズを加える処理として、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、
前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、
前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、
前記正解データの画像の少なくとも一部の明るさを変更する第5の処理と
のうちの任意の組合せを実施し、
前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、
印刷文字認識用正解データ生成装置。
【請求項3】
前記第2の処理において加える点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項1または2に記載の印刷文字認識用正解データ生成装置。
【請求項4】
前記第3の処理において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項1乃至3のうち何れか1項に記載の印刷文字認識用正解データ生成装置。
【請求項5】
印刷された文字の認識用に使用される正解データを自動的に生成する装置によって実施される方法であって、
前記装置が、
所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶し、
前記記憶装置に記憶されている前記正解データの画像を取得し、
前記取得された正解データの画像に、ノイズを加える処理を実施し、
前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させ、
前記ノイズを加える処理は、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、
前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、
前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、
前記正解データの画像の少なくとも一部の明るさを変更する第5の処理と
のうちの少なくとも1つを含み、
前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、
印刷文字認識用正解データ生成方法。
【請求項6】
印刷された文字の認識用に使用される正解データを自動的に生成する装置によって実施される方法であって、
前記装置が、
所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶し、
前記記憶装置に記憶されている前記正解データの画像を取得し、
前記取得された正解データの画像に、ノイズを加える処理を実施し、
前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させ、
前記ノイズを加える処理は、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、
前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、
前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、
前記正解データの画像の少なくとも一部の明るさを変更する第5の処理と
のうちの任意の組合せを含み、
前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、
印刷文字認識用正解データ生成方法。
【請求項7】
前記第2の処理において加える点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項5または6に記載の印刷文字認識用正解データ生成方法。
【請求項8】
前記第3の処理において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項5乃至7のうち何れか1項に記載の印刷文字認識用正解データ生成方法。
【請求項9】
印刷された文字の認識用に使用される正解データを自動的に生成するためのプログラムであって、
所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶する機能、
前記記憶装置に記憶されている前記正解データの画像を取得する機能、
前記取得された正解データの画像に、ノイズを加える処理を実施する機能、
前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる機能、をプロセッサに実現させ、
前記ノイズを加える処理を実施する機能は、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能、
前記正解データの画像に、所定数の点を、任意の場所に加える機能、
前記正解データの画像に、所定数の任意の端部を切断する機能、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する機能、
前記正解データの画像の少なくとも一部の明るさを変更する機能、
のうちの少なくとも1つを含み、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能において加えられる線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、
プログラム。
【請求項10】
印刷された文字の認識用に使用される正解データを自動的に生成するためのプログラムであって、
所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶する機能、
前記記憶装置に記憶されている前記正解データの画像を取得する機能、
前記取得された正解データの画像に、ノイズを加える処理を実施する機能、
前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる機能をプロセッサに実現させ、
前記ノイズを加える処理を実施する機能は、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能、
前記正解データの画像に、所定数の点を、任意の場所に加える機能、
前記正解データの画像に、所定数の任意の端部を切断する機能、
前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する機能、
前記正解データの画像の少なくとも一部の明るさを変更する機能、
のうちの任意の組合せを含み、
前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能において加えられる線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、
プログラム。
【請求項11】
前記正解データの画像に、所定数の点を、任意の場所に加える機能において加えられる点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項9または10に記載のプログラム。
【請求項12】
前記正解データの画像に、所定数の任意の端部を切断する機能において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項9乃至11のうち何れか1項に記載のプログラム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0013
【補正方法】変更
【補正の内容】
【0013】
請求項1の発明は、印刷された文字の認識用に使用される正解データを自動的に生成する装置であって、所定の文字に対して予め与えられた正解データの画像を記憶する記憶装置と、前記記憶装置に記憶されている前記正解データの画像を取得する正解データ取得部と、前記取得された正解データの画像に、ノイズを加える処理を実施するノイズ追加部と、前記ノイズ追加部によってノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる正解データ書込部とを備え、前記ノイズ追加部は、前記ノイズを加える処理として、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、前記正解データの画像の少なくとも一部の明るさを変更する第5の処理とのうちの少なくとも1つを実施し、前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、印刷文字認識用正解データ生成装置である。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0014
【補正方法】削除
【補正の内容】
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0015
【補正方法】変更
【補正の内容】
【0015】
請求項2の発明は、印刷された文字の認識用に使用される正解データを自動的に生成する装置であって、所定の文字に対して予め与えられた正解データの画像を記憶する記憶装置と、前記記憶装置に記憶されている前記正解データの画像を取得する正解データ取得部と、前記取得された正解データの画像に、ノイズを加える処理を実施するノイズ追加部と、前記ノイズ追加部によってノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる正解データ書込部とを備え、前記ノイズ追加部は、前記ノイズを加える処理として、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、前記正解データの画像の少なくとも一部の明るさを変更する第5の処理とのうちの任意の組合せを実施し、前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、印刷文字認識用正解データ生成装置である。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0016
【補正方法】削除
【補正の内容】
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0017
【補正方法】変更
【補正の内容】
【0017】
請求項3の発明は、前記第2の処理において加える点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項1または2に記載の印刷文字認識用正解データ生成装置である。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0018
【補正方法】変更
【補正の内容】
【0018】
請求項4の発明は、前記第3の処理において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項1乃至3のうち何れか1項に記載の印刷文字認識用正解データ生成装置である。
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0019
【補正方法】変更
【補正の内容】
【0019】
請求項5の発明は、印刷された文字の認識用に使用される正解データを自動的に生成する装置によって実施される方法であって、前記装置が、所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶し、前記記憶装置に記憶されている前記正解データの画像を取得し、前記取得された正解データの画像に、ノイズを加える処理を実施し、前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させ、前記ノイズを加える処理は、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、前記正解データの画像の少なくとも一部の明るさを変更する第5の処理とのうちの少なくとも1つを含み、前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、印刷文字認識用正解データ生成方法である。
【手続補正9】
【補正対象書類名】明細書
【補正対象項目名】0020
【補正方法】削除
【補正の内容】
【手続補正10】
【補正対象書類名】明細書
【補正対象項目名】0021
【補正方法】変更
【補正の内容】
【0021】
請求項6の発明は、印刷された文字の認識用に使用される正解データを自動的に生成する装置によって実施される方法であって、前記装置が、所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶し、前記記憶装置に記憶されている前記正解データの画像を取得し、前記取得された正解データの画像に、ノイズを加える処理を実施し、前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させ、前記ノイズを加える処理は、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える第1の処理と、前記正解データの画像に、所定数の点を、任意の場所に加える第2の処理と、前記正解データの画像に、所定数の任意の端部を切断する第3の処理と、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する第4の処理と、前記正解データの画像の少なくとも一部の明るさを変更する第5の処理とのうちの任意の組合せを含み、前記第1の処理において加える線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、印刷文字認識用正解データ生成方法である。
【手続補正11】
【補正対象書類名】明細書
【補正対象項目名】0022
【補正方法】削除
【補正の内容】
【手続補正12】
【補正対象書類名】明細書
【補正対象項目名】0023
【補正方法】変更
【補正の内容】
【0023】
請求項7の発明は、前記第2の処理において加える点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項5または6に記載の印刷文字認識用正解データ生成方法である。
【手続補正13】
【補正対象書類名】明細書
【補正対象項目名】0024
【補正方法】変更
【補正の内容】
【0024】
請求項8の発明は、前記第3の処理において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項5乃至7のうち何れか1項に記載の印刷文字認識用正解データ生成方法である。
【手続補正14】
【補正対象書類名】明細書
【補正対象項目名】0025
【補正方法】変更
【補正の内容】
【0025】
請求項9の発明は、印刷された文字の認識用に使用される正解データを自動的に生成するためのプログラムであって、所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶する機能、前記記憶装置に記憶されている前記正解データの画像を取得する機能、前記取得された正解データの画像に、ノイズを加える処理を実施する機能、前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる機能をプロセッサに実現させ、前記ノイズを加える処理を実施する機能は、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能、前記正解データの画像に、所定数の点を、任意の場所に加える機能、前記正解データの画像に、所定数の任意の端部を切断する機能、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する機能、前記正解データの画像の少なくとも一部の明るさを変更する機能、のうちの少なくとも1つを含み、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能において加えられる線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、プログラムである。
【手続補正15】
【補正対象書類名】明細書
【補正対象項目名】0026
【補正方法】削除
【補正の内容】
【手続補正16】
【補正対象書類名】明細書
【補正対象項目名】0027
【補正方法】変更
【補正の内容】
【0027】
請求項10の発明は、印刷された文字の認識用に使用される正解データを自動的に生成するためのプログラムであって、所定の文字に対して予め与えられた正解データの画像を記憶装置に記憶する機能、前記記憶装置に記憶されている前記正解データの画像を取得する機能、前記取得された正解データの画像に、ノイズを加える処理を実施する機能、前記ノイズを加える処理が実施された画像を、前記所定の文字に対する別の正解データの画像として、前記記憶装置に記憶させる機能をプロセッサに実現させ、前記ノイズを加える処理を実施する機能は、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能、前記正解データの画像に、所定数の点を、任意の場所に加える機能、前記正解データの画像に、所定数の任意の端部を切断する機能、前記正解データの画像によって形成される文字の少なくとも一部、前記正解データの画像によって形成される前記文字の背景の少なくとも一部、または前記正解データの画像によって形成される前記文字と前記背景との少なくとも一部の色を変更する機能、前記正解データの画像の少なくとも一部の明るさを変更する機能のうちの任意の組合せを含み、前記正解データの画像に、所定数の任意の長さの線を、任意の場所に加える機能において加えられる線の太さは、前記正解データの画像によって形成される文字の太さよりも細い、プログラムである。
【手続補正17】
【補正対象書類名】明細書
【補正対象項目名】0028
【補正方法】削除
【補正の内容】
【手続補正18】
【補正対象書類名】明細書
【補正対象項目名】0029
【補正方法】変更
【補正の内容】
【0029】
請求項11の発明は、前記正解データの画像に、所定数の点を、任意の場所に加える機能において加えられる点の直径は、前記正解データの画像によって形成される文字の太さよりも小さい、請求項9または10に記載のプログラムである。
【手続補正19】
【補正対象書類名】明細書
【補正対象項目名】0030
【補正方法】変更
【補正の内容】
【0030】
請求項12の発明は、前記正解データの画像に、所定数の任意の端部を切断する機能において切断される量は、前記正解データの画像によって形成される文字の面積の1/3を超えない、請求項9乃至11のうち何れか1項に記載のプログラムである。