【課題を解決するための手段】
【0010】
これらの目的は、第1の独立請求項の技術的特性を示す、文字ストリング画像の中の文字をセグメント化するための方法を用いた本発明に従って達成される。本発明による文字ストリング画像の中の文字をセグメント化する方法は、
a)背景と対照を成すピクセルの第1の出発ポイント座標を決定するステップと、
b)最大文字幅と、最大文字幅に対応する文字ストリング画像の部分の特性とに応じた、可能性のある文字幅のリストを生成するステップと、
c)第1の出発ポイント座標と、第1の幅とに対応する文字ストリング画像の第2の部分を決定するステップと、
d)文字ストリング画像の第2の部分に対して分類方法を適用して、第1の幅についてのエラーの可能性(likelihood of error)と、候補文字とを提供するステップと、
e)速度と正確さとの間のトレードオフによって決定される第1のしきい値と、エラーの可能性を比較するステップと、
f)第1の幅に対応するエラーの可能性が、しきい値の値よりも低い場合に、第1の幅に対応する文字として候補文字を選択するステップと
を含んでいる。
この方法の利点は、ライン・セグメント化と、文字分類とが、文字ごとに組み合わされたプロセスにされることである。文字ストリング画像のライン・セグメント化と、文字分類とを実行するステップの必要とされる数が、著しく低減されるので、これは、低減された算出時間の形の大きな利点を生み出す。その結果は、本方法の速度と、正確さとの増大である。
【0011】
本発明による他の実施例においては、本方法は、第1のしきい値の値よりも高い第2のしきい値の値とエラーの可能性を比較するステップをさらに含んでおり、第1のしきい値の値とエラーの可能性を比較するステップは、エラーの可能性が、第2のしきい値の値よりも低い場合にだけ実行される。
【0012】
第2のしきい値の値は、肯定的な結果をもたらす機会を有していない候補についての高速なフィルタリングを可能にするという利点を有する。
【0013】
本発明による別の実施例においては、本方法は、第1の幅に対応するエラーの可能性が、第2のしきい値の値よりも低い場合に、次の文字についての出発ポイントを算出するステップと、次の文字の算出された出発ポイントをメモリに保持するステップとをさらに含む。
【0014】
本発明による別の実施例においては、本方法は、第1の幅に対応するエラーの可能性が、第1のしきい値の値よりも低い場合に、データベースに含まれる文字統計値をアップデートするステップをさらに含んでいる。
【0015】
このデータベースは、テキストの中の文字と、参照文字とについての最大サイズと平均サイズとについての情報を含んでいる。これらの値は、可能性のある文字幅のリストの生成における文字の幅を推定するときに、本方法の速度と正確さとを改善するために使用される。
【0016】
本発明による別の実施例においては、可能性のある文字幅のリストは、最も可能性の高いものから、より可能性の低いものへとソートされ、最も可能性の高い幅は、データベースに記憶される文字についての推定された最大幅よりも大きくない、最大数の接続された構成部分を含む最も広い幅であるような幅である。
【0017】
本発明による別の実施例においては、可能性のある文字幅のリストのうちの2つのより可能性の低い幅は、平均グローバル幅と、平均グローバル幅の2分の1とであり、平均グローバル幅は、文字ストリング画像の中の第1の文字についての文字ストリング画像の高さであり、また平均グローバル幅は、文字ストリング画像の中の後続の文字についての、データベースに記憶される以前の平均グローバル幅と平均文字幅とに基づいて、算出される。
【0018】
これの利点は、アジア文字のサイズが、ラテン文字のサイズのおおよそ2倍であるため、平均グローバル幅は、アジア文字を識別するのに対し、平均グローバル幅の2分の1は、ラテン文字を識別し、それゆえに、この手段により、ライン・セグメント化方法を、ラテン文字と、アジア文字と、それらの組合せとに適用できることである。
【0019】
本発明による別の実施例においては、可能性のある文字幅のリストの以前の幅に対応するエラーの可能性が、第2のしきい値の値よりも高い場合に、本方法は、
a)出発ポイント座標に対応し、且つリストの次の幅に対応する文字ストリング画像の第2の部分を決定するステップと、
b)文字ストリング画像の第2の部分に分類方法を適用して、この幅についてのエラーの可能性を提供と、候補文字とを提供するステップと、
c)データベースに記憶されるしきい値の値とエラーの可能性を比較するステップと、
d)この幅に対応するエラーの可能性が、しきい値の値よりも低くなるまで、又は可能性のある文字幅のリストの中に含まれるすべての幅が処理されてしまうまで、ステップa)と、ステップb)と、ステップc)とを反復するステップと、
e)幅に対応するエラーの可能性が、第1のしきい値の値よりも低い場合に、幅に対応する文字として文字候補を選択するステップと
をさらに含む。
【0020】
問題解決手法が見出されていない限り、また問題解決手法が見出されるまで、ライン・セグメント化と、文字分類とが、次々に、組み合わされ、実行される。これは、そのような方法を実行するために必要とされるステップの数を低減させることを可能にしており、また本方法の正確さを改善させもする。
【0021】
本発明による別の実施例においては、文字ストリング画像は、縦方向の文字ストリング画像であり、すべての幅は、高さである。
【0022】
アジア文字は、ラインに沿って書かれるが、列に沿って書かれる可能性もある。本方法は、確かにラインだけには限定されず、また文字の幅を高さに変更することだけにより、ラインに簡単に適合される可能性があり、また逆の場合も同様である。
【0023】
別の実施例においては、本方法は、成功した反復時に平均グローバル幅値で文字統計データベースをアップデートするステップをさらに含んでいる。
【0024】
本発明による別の実施例においては、可能性のある文字幅のリストを生成するステップは、与えられたポイント・サイズと、最大の参照文字の幅と、参照文字の平均幅と、参照文字の間の平均間隔のサイズとについて、参照文字を含むデータベースから取り出されるデータに基づいている。
【0025】
本発明の別の実施例においては、データベースは、それらの文字の統計値についての推定値をさらに含んでおり、データベースは、成功した反復のたびにアップデートされる。
【0026】
本発明の別の実施例においては、最大の文字幅は、アジア文字についての最大文字幅である。
【0027】
本発明の別の実施例においては、コンピュータ・プログラム製品は、コンピューティング・デバイスに、入力画像の中の文字ストリング画像をセグメント化させるための制御ロジックを記憶しているコンピュータ使用可能媒体を備えており、その制御ロジックは、
a)背景と対照を成すピクセルの第1の出発ポイント座標を決定するための第1の制御読取り可能プログラム・コード手段と、
b)最大文字幅と、最大文字幅に対応する文字ストリング画像の部分の特性とに応じた、可能性のある文字幅のリストを生成するための第2の制御読取り可能プログラム・コード手段と、
c)可能性のある文字幅のリストの上の第1の出発ポイント座標と第1の幅とに対応する文字ストリング画像の第2の部分を決定するための第3の制御読取り可能プログラム・コード手段と、
d)文字ストリング画像の第2の部分に対して分類方法を適用して、第1の幅についてのエラーの可能性と、候補文字とを提供するための第4の制御読取り可能プログラム・コード手段と、
e)速度と正確さとの間のトレードオフによって決定される第1のしきい値とエラーの可能性を比較するための第5の制御読取り可能プログラム・コード手段と、
f)第1の幅に対応するエラーの可能性が、しきい値の値よりも低い場合に、第1の幅に対応する文字として候補文字を選択するための第6の制御読取り可能プログラム・コード手段と
を備えている。
【0028】
本発明は、さらに、以下の説明と、添付の図面とを用いて、明らかにされる。