IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日本経済新聞社の特許一覧

特開2022-53987手書き文字認識用正解データ生成装置、方法、およびプログラム
<>
  • 特開-手書き文字認識用正解データ生成装置、方法、およびプログラム 図1
  • 特開-手書き文字認識用正解データ生成装置、方法、およびプログラム 図2
  • 特開-手書き文字認識用正解データ生成装置、方法、およびプログラム 図3
  • 特開-手書き文字認識用正解データ生成装置、方法、およびプログラム 図4A
  • 特開-手書き文字認識用正解データ生成装置、方法、およびプログラム 図4B
  • 特開-手書き文字認識用正解データ生成装置、方法、およびプログラム 図4C
  • 特開-手書き文字認識用正解データ生成装置、方法、およびプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022053987
(43)【公開日】2022-04-06
(54)【発明の名称】手書き文字認識用正解データ生成装置、方法、およびプログラム
(51)【国際特許分類】
   G06V 30/196 20220101AFI20220330BHJP
【FI】
G06K9/68 E
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2020160917
(22)【出願日】2020-09-25
(11)【特許番号】
(45)【特許公報発行日】2021-11-24
(71)【出願人】
【識別番号】000153203
【氏名又は名称】株式会社日本経済新聞社
(74)【代理人】
【識別番号】100108855
【弁理士】
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100103034
【弁理士】
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100179062
【弁理士】
【氏名又は名称】井上 正
(74)【代理人】
【識別番号】100153051
【弁理士】
【氏名又は名称】河野 直樹
(74)【代理人】
【識別番号】100199565
【弁理士】
【氏名又は名称】飯野 茂
(74)【代理人】
【識別番号】100162570
【弁理士】
【氏名又は名称】金子 早苗
(72)【発明者】
【氏名】山田 剛
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AB03
5B064BA01
5B064DA21
5B064DA26
(57)【要約】
【課題】 手書き文字のOCR認識のために使用される正解データを、実際の手書き文字から自動的に大量に生成すること。
【解決手段】 手書き文字認識用正解データ生成装置は、手書き文字の認識用に使用される正解データを自動的に生成する装置であって、所定の文字について正しく書かれたと判定された手書き文字の画像に、形状変化処理を実施する形状変化処理部と、前記形状変化処理された前記画像が、前記所定の文字として、文字認識装置によって解釈可能であるか否かを判定し、解釈可能ではないと判定した場合、前記形状変化処理部に対して、形状変化量を下げて、前記形状変化処理を再度実施させる判定部とを備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
手書き文字の認識用に使用される正解データを自動的に生成する装置であって、
所定の文字について正しく書かれたと判定された手書き文字の画像に、形状変化処理を実施する形状変化処理部と、
前記形状変化処理された前記画像が、前記所定の文字として、文字認識装置によって解釈可能であるか否かを判定し、解釈可能ではないと判定した場合、前記形状変化処理部に対して、形状変化量を下げて、前記形状変化処理を再度実施させる判定部とを備えた、
手書き文字認識用正解データ生成装置。
【請求項2】
記憶装置と、
前記判定部によって、前記解釈可能であると判定された画像を、前記正解データの画像として、前記記憶装置に記憶させる正解データ書込部とをさらに備えた、
請求項1に記載の手書き文字認識用正解データ生成装置。
【請求項3】
前記正解データ書込部による前記記憶装置への記憶がなされた後、前記形状変化処理部は、前記手書き文字の画像に、直前の形状変化処理における形状変化量とは異なる形状変化量で、前記形状変化処理を実施する、請求項2に記載の手書き文字認識用正解データ生成装置。
【請求項4】
前記形状変化処理は、前記手書き文字の画像に、歪曲収差処理を実施する第1の処理と、前記手書き文字の画像に、ピンチエフェクト(Pinch Effect)処理を実施する第2の処理とのうちの少なくとも1つを含む、請求項1乃至3のうちいずれか1項に記載の手書き文字認識用正解データ生成装置。
【請求項5】
手書き文字の認識用に使用される正解データを自動的に生成する装置によって実施される方法であって、
前記装置が、
所定の文字について正しく書かれたと判定された手書き文字の画像に、形状変化処理を実施し、
前記形状変化処理された前記画像が、前記所定の文字として、文字認識装置によって解釈可能であるか否かを判定し、
解釈可能ではないと判定した場合、形状変化量を下げて、前記形状変化処理を再度実施する、
手書き文字認識用正解データ生成方法。
【請求項6】
前記装置はさらに、
前記解釈可能であると判定された画像を、前記正解データの画像として、記憶装置に記憶させる、請求項5に記載の手書き文字認識用正解データ生成方法。
【請求項7】
前記記憶装置への記憶がなされた後、前記手書き文字の画像に、直前の形状変化処理における形状変化量とは異なる形状変化量で、前記形状変化処理を実施する、請求項6に記載の手書き文字認識用正解データ生成方法。
【請求項8】
前記形状変化処理は、前記手書き文字の画像に、歪曲収差処理を実施する第1の処理と、前記手書き文字の画像に、ピンチエフェクト(Pinch Effect)処理を実施する第2の処理とのうちの少なくとも1つを含む、請求項5乃至7のうち何れか1項に記載の手書き文字認識用正解データ生成方法。
【請求項9】
手書き文字の認識用に使用される正解データを自動的に生成するためのプログラムであって、
所定の文字について正しく書かれたと判定された手書き文字の画像に、形状変化処理を実施する機能、
前記形状変化処理された前記画像が、前記所定の文字として、文字認識装置によって解釈可能であるか否かを判定する機能、
解釈可能ではないと判定した場合、形状変化量を下げて、前記形状変化処理を再度実施する機能
をプロセッサに実現させるためのプログラム。
【請求項10】
前記解釈可能であると判定された画像を、前記正解データの画像として、記憶装置に記憶させる機能をさらに前記プロセッサに実現させるための請求項9に記載のプログラム。
【請求項11】
前記記憶装置への記憶がなされた後、前記手書き文字の画像に、直前の形状変化処理における形状変化量とは異なる形状変化量で、前記形状変化処理を実施する機能をさらに前記プロセッサに実現させるための請求項10に記載のプログラム。
【請求項12】
前記形状変化処理は、前記手書き文字の画像に、歪曲収差処理を実施する第1の処理と、前記手書き文字の画像に、ピンチエフェクト(Pinch Effect)処理を実施する第2の処理とのうちの少なくとも1つを含む、請求項9乃至11のうち何れか1項に記載のプログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、手書きされた文字の認識のための正解データを自動的に生成するのに好適な、手書き文字認識用正解データ生成装置、方法、およびプログラムに関する。
【背景技術】
【0002】
手書き文字を、OCRによって認識することは、広く行われている。
【0003】
OCRは、予め提供された正解データとの一致性に基づいて、手書き文字を認識している。
【0004】
したがって、OCRによる手書き文字の認識率を高めるためには、できるだけ多くの正解データを、OCRに提供する必要がある。
【0005】
できるだけ多くの正解データをOCRに提供するために、実際の手書き文字を収集し、収集した手書き文字を、正解データとしてOCRに提供することが考えられる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2018-165948号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、手書き文字は、筆記者毎に形状が異なるために、収集すること自体が困難である。加えて、手書き文字は、筆記者が同じであっても、筆記者の気分や体調によって異なる形状になるなど、1つとして全く同じ文字が存在することはなく、極めて多くのバリエーションが存在する。これは、手書き文字の収集を益々困難にしている。
【0008】
このように、各バリエーションに応じた手書き文字を収集することは容易ではない。これによって、手書き文字に対応する十分な量の適切な正解データを、OCRに提供することができず、OCRによる手書き文字の認識精度の向上が阻害されているという問題がある。
【0009】
本発明はこのような事情に鑑みてなされたものであり、手書き文字のOCR認識のために使用される正解データを、実際の手書き文字から自動的に大量に生成することが可能な手書き文字認識用正解データ生成装置、方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
上記の目的を達成するために、本発明では、以下のような手段を講じる。
【0011】
請求項1の発明は、手書き文字の認識用に使用される正解データを自動的に生成する装置であって、所定の文字について正しく書かれたと判定された手書き文字の画像に、形状変化処理を実施する形状変化処理部と、前記形状変化処理された前記画像が、前記所定の文字として、文字認識装置によって解釈可能であるか否かを判定し、解釈可能ではないと判定した場合、前記形状変化処理部に対して、形状変化量を下げて、前記形状変化処理を再度実施させる判定部とを備えている。
【0012】
請求項2の発明は、記憶装置と、前記判定部によって、前記解釈可能であると判定された画像を、前記正解データの画像として、前記記憶装置に記憶させる正解データ書込部とをさらに備えた、請求項1に記載の手書き文字認識用正解データ生成装置である。
【0013】
請求項3の発明は、前記正解データ書込部による前記記憶装置への記憶がなされた後、前記形状変化処理部は、前記手書き文字の画像に、直前の形状変化処理における形状変化量とは異なる形状変化量で、前記形状変化処理を実施する、請求項2に記載の手書き文字認識用正解データ生成装置である。
【0014】
請求項4の発明は、前記形状変化処理は、前記手書き文字の画像に、歪曲収差処理を実施する第1の処理と、前記手書き文字の画像に、ピンチエフェクト(Pinch Effect)処理を実施する第2の処理とのうちの少なくとも1つを含む、請求項1乃至3のうちいずれか1項に記載の手書き文字認識用正解データ生成装置である。
【0015】
請求項5の発明は、手書き文字の認識用に使用される正解データを自動的に生成する装置によって実施される方法であって、前記装置が、所定の文字について正しく書かれたと判定された手書き文字の画像に、形状変化処理を実施し、前記形状変化処理された前記画像が、前記所定の文字として、文字認識装置によって解釈可能であるか否かを判定し、解釈可能ではないと判定した場合、形状変化量を下げて、前記形状変化処理を再度実施する、手書き文字認識用正解データ生成方法である。
【0016】
請求項6の発明は、前記装置がさらに、前記解釈可能であると判定された画像を、前記正解データの画像として、記憶装置に記憶させる、請求項5に記載の手書き文字認識用正解データ生成方法である。
【0017】
請求項7の発明は、前記記憶装置への記憶がなされた後、前記手書き文字の画像に、直前の形状変化処理における形状変化量とは異なる形状変化量で、前記形状変化処理を実施する、請求項6に記載の手書き文字認識用正解データ生成方法である。
【0018】
請求項8の発明は、前記形状変化処理が、前記手書き文字の画像に、歪曲収差処理を実施する第1の処理と、前記手書き文字の画像に、ピンチエフェクト(Pinch Effect)処理を実施する第2の処理とのうちの少なくとも1つを含む、請求項5乃至7のうち何れか1項に記載の手書き文字認識用正解データ生成方法である。
【0019】
請求項9の発明は、手書き文字の認識用に使用される正解データを自動的に生成するためのプログラムであって、所定の文字について正しく書かれたと判定された手書き文字の画像に、形状変化処理を実施する機能、前記形状変化処理された前記画像が、前記所定の文字として、文字認識装置によって解釈可能であるか否かを判定する機能、解釈可能ではないと判定した場合、形状変化量を下げて、前記形状変化処理を再度実施する機能をプロセッサに実現させるためのプログラムである。
【0020】
請求項10の発明は、前記解釈可能であると判定された画像を、前記正解データの画像として、記憶装置に記憶させる機能をさらに前記プロセッサに実現させるための請求項9に記載のプログラムである。
【0021】
請求項11の発明は、前記記憶装置への記憶がなされた後、前記手書き文字の画像に、直前の形状変化処理における形状変化量とは異なる形状変化量で、前記形状変化処理を実施する機能をさらに前記プロセッサに実現させるための請求項10に記載のプログラムである。
【0022】
請求項12の発明は、前記形状変化処理は、前記手書き文字の画像に、歪曲収差処理を実施する第1の処理と、前記手書き文字の画像に、ピンチエフェクト(Pinch Effect)処理を実施する第2の処理とのうちの少なくとも1つを含む、請求項9乃至11のうち何れか1項に記載のプログラムである。
【発明の効果】
【0023】
本発明の手書き文字認識用正解データ生成装置、方法、およびプログラムによれば、手書き文字のOCR認識のために使用される正解データを、実際の手書き文字から自動的に大量に生成することが可能となる。
【図面の簡単な説明】
【0024】
図1図1は、本発明の実施形態に係る手書き文字認識用正解データ生成方法が適用された手書き文字認識用正解データ生成装置の電子回路構成例を示すブロック図である。
図2図2は、「頑張り」という文字について、正しく書かれたと予め判定されている手書き文字の一例を示す画像である。
図3図3は、第1および第2の処理を実施するためのサブモジュールを備えた形状変化処理モジュールの構成例を示す図である。
図4A図4Aは、図2に示す「頑」という手書き文字から派生して作成された画像の例を示す図である。
図4B図4Bは、図2に示す「張」という手書き文字から派生して作成された画像の例を示す図である。
図4C図4Cは、図2に示す「り」という手書き文字から派生して作成された画像の例を示す図である。
図5図5は、手書き文字認識用正解データ生成装置の動作例を示すフローチャートである。
【発明を実施するための形態】
【0025】
以下に、本発明の実施形態を、図面を参照して説明する。
【0026】
図1は、本発明の実施形態に係る手書き文字認識用正解データ生成方法が適用された手書き文字認識用正解データ生成装置の電子回路構成例を示すブロック図である。
【0027】
手書き文字認識用正解データ生成装置10は、手書き文字のOCR認識用に使用される正解データを自動的に生成する装置であって、その電子回路は、バス11によって互いに接続されたCPU12、記録媒体読取部14、メモリ20、および記憶装置30を備えている。
【0028】
メモリ20は、手書き文字画像取得モジュール21、形状変化処理モジュール22、判定モジュール23、および正解データ書込モジュール24を記憶している。
【0029】
これらモジュール21~24のプログラムは、メモリ20に予め記憶されていてもよいし、あるいはUSBやメモリカード等の外部記録媒体13から記録媒体読取部14を介してメモリ20に読み込まれて記憶されたものであってもよい。これらモジュール21~24のプログラムは、書き換えできないようになっている。
【0030】
メモリ20には、このようなユーザ書き換え不可能なエリアの他に、書き換え可能なデータを記憶するエリアとして、書込可能データエリア29が確保されている。
【0031】
CPU12は、コンピュータであって、メモリ20に記憶されている各モジュール21~24のプログラムに従い回路各部の動作を制御する。
【0032】
記憶装置30は、例えばSSD(Solid State Drive)やHDD(Hard Disk Drive)等からなり、正解データデータベース32(以降、「正解データDB32」と称する)を記憶する。
【0033】
正解データDB32は、後述するように正解データ書込モジュール23によって書き込まれた正解データの画像を記憶する。
【0034】
手書き文字画像取得モジュール21は、所定の文字について正しく書かれたと予め判定されている手書き文字の画像を、外部記録媒体13から取得する。
【0035】
図2は、「頑張り」という文字について、正しく書かれたと予め判定されている手書き文字の一例を示す画像である。
【0036】
外部記録媒体13には、このように、正しく書かれたと予め判定されている手書き文字の画像が記録されている。外部記録媒体13に記録されているこの画像は、記録媒体読取部14によって読み取られる。手書き文字画像取得モジュール21は、記録媒体読取部14によって読み取られたこの画像を取得することによって、所定の文字について正しく書かれたと予め判定されている手書き文字の画像を取得することができる。図2のような文字を取得した場合、「頑」、「張」、「り」という各手書き文字の画像を取得することができる。
【0037】
また、図示していないが、手書き文字を画像にスキャンするスキャン装置を、手書き文字認識用正解データ生成装置10に内蔵または外付けすることによって、手書き文字画像取得モジュール21が、このスキャン装置から、所定の文字について正しく書かれたと判定された手書き文字の画像を直接取得するようにしてもよい。
【0038】
形状変化処理モジュール22は、手書き文字画像取得モジュール21によって取得された画像に、様々な形状変化処理を実施する。手書き文字画像取得モジュール21によって、図2のように「頑」、「張」、「り」という3つの文字に対する各画像が取得された場合、形状変化処理モジュール22は、「頑」、「張」、「り」という3つの画像に対してそれぞれ様々な形状変化処理を実施することができる。
【0039】
これら形状変化処理は、手書き文字画像取得モジュール21によって取得された画像に、歪曲収差処理を実施する第1の処理と、同画像に、ピンチエフェクト(Pinch Effect)処理を実施する第2の処理とを含む。第1の処理と第2の処理とを組み合わせる処理も含む。しかしながら、形状変化処理は、これらに限定されるものではなく、手書き文字画像取得モジュール21によって取得された画像の形状を変更することができる任意の処理をさらに実施したり、あるいは、第1の処理および第2の処理と適宜組み合わせて実施してもよい。
【0040】
このような形状変化処理を行うために、形状変化処理モジュール22は、第1および第2の処理を実施するためのサブモジュールを備えている。
【0041】
図3は、第1および第2の処理を実施するためのサブモジュールを備えた形状変化処理モジュールの構成例を示す図である。
【0042】
図3に例示する形状変化処理モジュール22は、第1の処理を実施する歪曲収差処理サブモジュール220と、第2の処理を実施するピンチエフェクト(Pinch Effect)サブモジュール221とを備えている。
【0043】
形状変化処理モジュール22は、第1の処理や第2の処理のような形状変化処理を実施することによって、実際の手書き文字から派生された画像を作成することができる。
【0044】
図4Aは、図2に示す「頑」という手書き文字から派生して作成された画像の例を示す図である。
【0045】
図4Bは、図2に示す「張」という手書き文字から派生して作成された画像の例を示す図である。
【0046】
図4Cは、図2に示す「り」という手書き文字から派生して作成された画像の例を示す図である。
【0047】
判定モジュール23は、形状変化処理モジュール22によって形状変化処理された画像が、所定の文字として、図示しないOCR文字認識装置によって解釈可能であるか否かを判定する。
【0048】
この判定は、例えば、形状変化処理モジュール22によって形状変化処理された画像を、実際にOCRによって認識し、正しい文字に認識された場合には、解釈可能であると判定し、認識されなかった場合には、解釈可能ではないと判定することができるが、このような判定方法に限定される訳ではない。
【0049】
判定モジュール23は、解釈可能ではないと判定した場合、形状変化処理モジュール22に対して、手書き文字画像取得モジュール21によって取得された画像に対して、直前に行われた形状変化処理における形状変化量よりも少ない形状変化量で、形状変化処理を再度実施させる。
【0050】
すなわち、形状変化処理モジュール22によって第1の処理が実施された画像が、解釈可能ではないと判定された場合、形状変化処理モジュール22は、第1の処理で適用された歪曲量よりも低い歪曲量で、第1の処理を実施する。また、形状変化処理モジュール22によって第2の処理が実施された画像が、解釈可能ではないと判定された場合、形状変化処理モジュール22は、第2の処理で適用されたピンチエフェクト量よりも低いピンチエフェクト量で、第2の処理を実施する。形状変化処理モジュール22によって第1および第2の処理が実施された画像が、解釈可能ではないと判定された場合、形状変化処理モジュール22は、第1の処理で適用された歪曲量よりも低い歪曲量で第1の処理を実施し、第2の処理で適用されたピンチエフェクト量よりも低いピンチエフェクト量で、第2の処理を実施する。
【0051】
このように形状変化処理が再実施された画像に対しても、判定モジュール23は、所定の文字として解釈可能であるか否かを判定する。このような形状変化処理モジュール22による形状変化処理と、判定モジュール23による判定処理とを繰り返すことによって、形状変化処理モジュール22による最初の形状変化処理によって解釈可能ではないと判定された場合であっても、最終的には、所定の文字として解釈可能な、適切な画像を得ることができる。
【0052】
正解データ書込モジュール24は、判定モジュール23によって、解釈可能であると判定された画像を、正解データの画像として、記憶装置30の正解データDB32に記憶させる。
【0053】
その後、形状変化処理モジュール22は、同じ手書き文字の画像に、直前の形状変化処理における形状変化量とは異なる形状変化量で、つまり、形状変化量を変えて、形状変化処理を実施する。
【0054】
このように形状変化処理がなされた画像に対しても、判定モジュール23は、所定の文字として、前述したようにOCR文字認識装置によって解釈可能であるか否かを判定する。そして、解釈可能ではないと判定した場合、形状変化処理モジュール22に対して、手書き文字画像取得モジュール21によって取得された画像に対して、直前に行われた形状変化処理における形状変化量よりも少ない形状変化量で、形状変化処理を再度実施させる。
【0055】
このように形状変化処理が再実施された画像に対しても、判定モジュール23は、所定の文字として解釈可能であるか否かを判定する。このような形状変化処理モジュール22による形状変化処理と、判定モジュール23による判定処理とを繰り返すことによって、形状変化処理モジュール22による最初の形状変化処理によって解釈可能ではないと判定された場合であっても、最終的には、所定の文字として解釈可能な、適切な画像を得ることができる。
【0056】
正解データ書込モジュール24は、判定モジュール23によって、解釈可能であると判定された画像を、正解データの画像として、記憶装置30の正解データDB32に記憶させる。
【0057】
このようにして、同じ手書き文字に対して、形状変化処理モジュール22による形状変化処理、判定モジュール23による判定処理、および正解データ書込モジュール24による書込処理を何度も繰り返すことによって、手書き文字認識用正解データ生成装置10は、手書き文字のOCR認識のために使用される正解データを、実際の手書き文字に基づいて、自動的に大量に生成し、正解データDB32に記憶することが可能となる。
【0058】
このようにして実際の手書き文字に基づいて生成された、すなわち、実際の手書き文字の特徴が継承された大量の正解データが、OCRによる文字認識のために使用されるので、手書き文字に対するOCRによる文字認識率の向上を図ることができる。
【0059】
次に、以上のように構成した手書き文字認識用正解データ生成装置10の動作例について説明する。
【0060】
図5は、手書き文字認識用正解データ生成装置の動作例を示すフローチャートである。
【0061】
手書き文字認識用正解データ生成装置10によって、手書き文字認識用の正解データを生成するためには、先ず、手書き文字画像取得モジュール21によって、所定の文字について正しく書かれたと予め判定されている手書き文字の画像が取得される(S1)。
【0062】
所定の文字について正しく書かれたと予め判定されている手書き文字の画像は、外部記録媒体13から記録媒体読取部14を介して、または、手書き文字認識用正解データ生成装置10に内蔵または外付けされたスキャン装置から取得される。
【0063】
図2には、「頑」、「張」、「り」という3つの文字について、正しく書かれたと予め判定されている手書き文字の一例を示す画像が示されている。
【0064】
このように手書き文字画像取得モジュール21によって取得された各画像に対して、形状変化処理モジュール22によって、様々な形状変化処理が実施される(S2)。
【0065】
これら形状変化処理としては、歪曲収差処理を実施する第1の処理や、ピンチエフェクト処理を実施する第2の処理が含まれる。
【0066】
形状変化処理モジュール22による形状変化処理によって、第1の処理や第2の処理のような形状変化処理が実施されることによって、実際の手書き文字から派生された画像が作成される(S3)。
【0067】
形状変化処理モジュール22によって形状変化処理されることにより得られた画像は、判定モジュール23によって、所定の文字として、OCR文字認識装置によって解釈可能であるか否かが判定される(S4)。
【0068】
この判定は、例えば、形状変化処理モジュール22によって形状変化処理された画像が、実際にOCRによって認識され、正しい文字に認識されるか否かに基づいてなされる。
【0069】
そして、判定モジュール23によって、解釈可能ではないと判定された場合(S4:No)、形状変化処理モジュール22は、手書き文字画像取得モジュール21によって取得された画像に対して、直前に行われた形状変化処理における形状変化量よりも少ない形状変化量で、形状変化処理を再度実施するように、判定モジュール23によって指示され(S5)、ステップS4の処理が行われる。これによって、ステップS4において一旦は解釈可能ではないと判定された場合(S4:No)であっても、最終的には、所定の文字として解釈可能な、適切な画像が得られるようになる。
【0070】
ステップS4において、判定モジュール23によって、解釈可能であると判定された場合(S4:Yes)、形状変化処理モジュール22によって形状変化処理された画像は、正解データの画像として、正解データ書込モジュール24によって、記憶装置30の正解データDB32に記憶される(S6)。
【0071】
その後、同じ手書き文字から別の正解データを生成する場合(S7:Yes)、ステップS2の処理に戻って、同じ手書き文字の画像に対して、形状変化処理モジュール22によって、直前の形状変化処理(前回のステップS2)における形状変化量とは異なる形状変化量で、つまり、形状変化量を変えて、形状変化処理が実施される。
【0072】
以降は前述したステップS3からステップS6までの処理が、同じ手書き文字から別の正解データを生成しなくなる場合(S7:No)まで繰り返される。
【0073】
このようにして、同じ手書き文字に対して、形状変化処理モジュール22による形状変化処理、判定モジュール23による判定処理、および正解データ書込モジュール24による書込処理が何度も繰り返されることによって、手書き文字のOCR認識のために使用される正解データが、実際の手書き文字に基づいて、自動的に大量に生成され、正解データDB32に記憶される。
【0074】
なお、ステップS7において、同じ手書き文字から別の正解データを生成しない場合(S7:No)の判定基準としては、例えば、同じ手書き文字から所定数(例えば、100個)の正解データが生成された場合とすることができるが、これに限定されるものではない。
【0075】
上述したように、本発明の実施形態に係る手書き文字認識用正解データ生成方法が適用された手書き文字認識用正解データ生成装置によれば、手書き文字のOCR認識のために使用される正解データを、実際の手書き文字から自動的に大量に生成することが可能となる。
【0076】
このように生成された正解データは、実際の手書き文字の特徴が継承されている。したがって、このような正解データを、OCRによる文字認識に使用することによって、従来OCRによる文字認識が困難であった手書き文書であっても、高い精度で、文字を認識することが可能となる。
【0077】
以上、本発明を実施するための最良の形態について、添付図面を参照しながら説明したが、本発明はかかる構成に限定されない。特許請求の範囲の発明された技術的思想の範疇において、当業者であれば、各種の変更例及び修正例に想到し得るものであり、それら変更例及び修正例についても本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0078】
10 手書き文字認識用正解データ生成装置
11 バス
12 CPU
13 外部記録媒体
14 記録媒体読取部
20 メモリ
21 手書き文字画像取得モジュール
22 形状変化処理モジュール
23 判定モジュール
24 正解データ書込モジュール
29 書込可能データエリア
30 記憶装置
220 歪曲収差処理サブモジュール
221 ピンチエフェクト処理サブモジュール

図1
図2
図3
図4A
図4B
図4C
図5