特許6080259 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電産サンキョー株式会社の特許一覧

特許6080259文字切り出し装置及び文字切り出し方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
12
13
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6080259

(24)【登録日】2017年1月27日

(45)【発行日】2017年2月15日

(54)【発明の名称】文字切り出し装置及び文字切り出し方法

(51)【国際特許分類】

G06K 9/34 20060101AFI20170206BHJP

G06K 9/38 20060101ALI20170206BHJP

【ＦＩ】

G06K9/34

G06K9/38 C

【請求項の数】6

【全頁数】20

(21)【出願番号】特願2013-21483(P2013-21483)

(22)【出願日】2013年2月6日

(65)【公開番号】特開2014-153820(P2014-153820A)

(43)【公開日】2014年8月25日

【審査請求日】2016年1月8日

(73)【特許権者】

【識別番号】000002233

【氏名又は名称】日本電産サンキョー株式会社

(74)【代理人】

【識別番号】100115303

【弁理士】

【氏名又は名称】岩永和久

(72)【発明者】

【氏名】中村宏

【審査官】佐藤実

(56)【参考文献】

【文献】特開２００８−９７５９０（ＪＰ，Ａ）

【文献】特開平９−３２６００９（ＪＰ，Ａ）

【文献】特開平６−５２３５７（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｋ９／００ − ９／７６

(57)【特許請求の範囲】

【請求項1】

情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し部を有する文字切り出し装置であって、
前記文字切り出し部は、
前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成部と、
前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り位置決定部と、
前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理部と、
各文字の画像データを抽出する文字切り出し実行部と、を備えたことを特徴とする文字切り出し装置。

【請求項2】

前記二値化処理部が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする請求項１記載の文字切り出し装置。

【請求項3】

前記文字区切り位置決定部が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする請求項１又は２記載の文字切り出し装置。

【請求項4】

情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し方法であって、
前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成工程と、
前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り処理工程と、
前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理工程と、
各文字の画像データを抽出する文字切り出し処理工程と、を備えたことを特徴とする文字切り出し方法。

【請求項5】

前記二値化処理工程が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする請求項４記載の文字切り出し方法。

【請求項6】

前記文字区切り処理工程が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする請求項４又は５記載の文字切り出し方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、紙やプラスチック等の情報記録媒体上に記載された文字列を撮像して得られた画像データを処理することによって文字列を認識する文字列認識技術に係り、特に、撮像された画像内の文字列の区切り位置を検索して文字を認識する文字切り出し装置及び文字切り出し方法に関する。

【背景技術】

【0002】

従来から、キャッシュカード、従業者証、社員証、会員証、学生証、外国人登録証及び運転免許証等の各種証明書において、情報記録媒体（以下、「媒体」という）、上に記載された記載事項（例えば、文字列）をＯＣＲ（ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ）等により画像データとして読み取り、記載事項の文字認識を行う技術が知られている。一般に、ＯＣＲ処理では、スキャナにより媒体上の文字が光学的に読み取られ、読み取った文字画像を切り出し、この文字画像と予め用意されている文字パターンとを比較するパターンマッチングを行い、パターン同士の適合する割合が高く、よくマッチする文字パターンを抽出することにより１文字１文字の画像が認識される。

【0003】

ＯＣＲ処理において文字認識を行う場合には、一般に、行区切り位置（文字列の切り出し位置）の特定を行い、位置決定された文字列において、文字間の区切り位置を特定して、文字列から各文字を切り出す必要がある。一方、各種証明書には、媒体上に記載される文字の記入領域に線図形等（媒体上に書かれた文字を強調するために、アンダーラインや文字の背景に点、線、網掛け等を規則正しく並べた模様）を装飾された文字列が存在するものがある。一般的なＯＣＲ処理では、文字領域に線図形等が存在すると、文字の切り出し位置を間違えることにより、文字の認識ができない場合がある。また、文字を認識できたとしても、一般的なＯＣＲ処理では、文字領域に存在する線図形等の影響を受けて、文字の正確な認識率が著しく低下してしまう。そのため、従来より、認識対象となる文字を含む画像が線図形等を含む画像の場合に、その線図形等を除去することが行われている。

【0004】

従来、このような文字領域に線図形等が存在する文字列から各文字を切り出す文字切り出し装置としては、例えば、文字列の背景に斜線を有する運転免許証の免許証番号において文字認識をする際に、背景に斜線が入った５つ目から８つ目の文字列を正確かつ効率的に読み取る技術が開示されている（特許文献１参照）。特許文献１に示す文字切り出し装置は、スキャナにより取得された免許証番号部分の画像において、背景に斜線が入った５つ目から８つ目の文字画像について、斜線がほぼ水平になる角度に文字画像を回転し、回転した文字画像より、水平方向に線を構成する黒画素成分（斜線成分）を除去し、その文字画像の特徴ベクトルを抽出し、回転文字画像専用に設定された第２辞書を用いて文字認識を行う。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２００８−２３４２９１号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、特許文献１に示す文字切り出し装置では、背景に斜線が入った文字画像を回転する操作すなわち座標変換を行う処理時間の増大につながる。また、特許文献１に示す文字切り出し装置では、標準の文字辞書とは別に回転文字用の辞書（第２辞書）を備えなくてはならないため、記憶域が余分に必要となる。さらに斜線部分の文字を４５度回転して斜線部分が水平となるようにし、この水平線の部分を特徴ベクトルから除去することで斜線の影響を排除しようとしているが、斜線や文字印刷位置の状態によっては、完全にマスクすることができず、辞書との照合が安定的に行えない恐れがある。

【0007】

上述した文字切り出し装置は、複雑な演算を行うため構成が複雑になり、処理時間も増大する。その結果、特許文献１に示す文字切り出し装置では、従来より性能のよい（大型の）コンピュータを用いないと充分な処理速度を実現できず、たとえば、従来の（パーソナルコンピュータ程度の比較的小型の）コンピュータでは充分な処理速度の実現が困難であるという問題がある。

【0008】

そこで、本発明の目的は、証明書等の媒体上に記載された文字を読み取る際に、文字の記入領域に線図形等が存在する場合でも、簡単な構成で正確な文字切り出しが可能になり、実時間性を満足する文字切り出し装置及び文字切り出し方法を提供することにある。

【課題を解決するための手段】

【0009】

以上のような課題を解決するために、本発明は、以下のものを提供する。

【0010】

（１）情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し部を有する文字切り出し装置であって、前記文字切り出し部は、前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成部と、前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り位置決定部と、前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理部と、各文字の画像データを抽出する文字切り出し実行部と、を備えたことを特徴とする文字切り出し装置。

【0011】

本発明によれば、線図形等が存在する文字列を撮像して得られた多値画像データにおいて、最小画素値曲線作成部が文字列方向と直交する方向に配置された画素列を構成する画素の中で最小画素値を抽出して最小画素値曲線を作成し、この最小画素値曲線に基づき、文字区切り位置決定部が文字の区切り位置を決定すると共に、二値化処理部が線図形等を示す最小画素値を検出して該最小画素値に基づく二値化しきい値を用いて前記多値画像データの二値化処理を行い、文字切り出し実行部が各文字の画像データを抽出するから、証明書等の情報記録媒体上に記載された文字を読み取る際に、文字の記入領域に線図形等が存在していても、簡単な構成で正確な文字切り出しが可能になる。

【0012】

本発明の文字切り出し装置は、文字の記入領域に線図形等が存在していても、座標変換などの計算負荷が大きい処理をすることなく確実に文字を切り出すことができるから、パーソナルコンピュータ程度の比較的小型のコンピュータを用いても実時間性を満足することが可能になる。

【0013】

（２）前記二値化処理部が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする。

【0014】

本発明によれば、二値化処理部が文字と文字との間に形成された空白区間における最小画素値曲線の最小画素値を検出するから、空白区間に斜線や模様などの線図形等が描かれていても、線図形等の存在する部分の最小画素値を求めることができ、この最小画素値を二値化しきい値として多値画像データの二値化処理を行うことにより、線図形等を構成する画素は確実に二値化しきい値を上回り、線図形等を構成する画素が黒領域にマップされることはない。従がって、二値化によって背景に描かれた線図形等を確実に排除することができ、文字認識にとって望ましい二値化を行うことが可能になる。

【0015】

（３）前記文字区切り位置決定部が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする。

【0016】

本発明によれば、文字区切り位置決定部が仮の二値化しきい値を算出して多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定するから、文字の記入領域に線図形等が存在していても、確実に文字区間と空白区間の境界を決定することが可能になる。

【0017】

（４）情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し方法であって、前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成工程と、前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り処理工程と、前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理工程と、各文字の画像データを抽出する文字切り出し処理工程と、を備えたことを特徴とする文字切り出し方法。

【0018】

本発明によれば、線図形等が存在する文字列を撮像して得られた多値画像データにおいて、最小画素値曲線作成工程で文字列方向と直交する方向に配置された画素列を構成する画素の中で最小画素値を抽出して最小画素値曲線を作成し、この最小画素値曲線に基づき、文字区切り処理工程で文字の区切り位置を決定すると共に、二値化処理工程で線図形等を示す最小画素値を検出して該最小画素値に基づく二値化しきい値を用いて前記多値画像データの二値化処理を行い、文字切り出し処理工程で各文字の画像データを抽出するから、証明書等の情報記録媒体上に記載された文字を読み取る際に、文字の記入領域に線図形等が存在していても、簡単な構成で正確な文字切り出しが可能になる。

【0019】

本発明の文字切り出し方法は、文字の記入領域に線図形等が存在していても、座標変換などの計算負荷が大きい処理をすることなく確実に文字を切り出すことができるから、パーソナルコンピュータ程度の比較的小型のコンピュータを用いても実時間性を満足することが可能になる。

【0020】

（５）前記二値化処理工程が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする。

【0021】

本発明によれば、二値化処理工程が文字と文字との間に形成された空白区間における最小画素値曲線の最小画素値を検出するから、空白区間に斜線や模様などの線図形等が描かれていても、線図形等の存在する部分の最小画素値を求めることができ、この最小画素値を二値化しきい値として多値画像データの二値化処理を行うことにより、線図形等を構成する画素は確実に二値化しきい値を上回り、線図形等を構成する画素が黒領域にマップされることはない。従がって、二値化によって背景に描かれた線図形等を確実に排除することができ、文字認識にとって望ましい二値化を行うことが可能になる。

【0022】

（６）前記文字区切り処理工程が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする。

【0023】

本発明によれば、文字区切り処理工程で仮の二値化しきい値を算出して多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定するから、文字の記入領域に線図形等が存在していても、確実に文字区間と空白区間の境界を決定することが可能になる。

【発明の効果】

【0024】

本発明によれば、運転免許証などの証明書等に記載された線図形等が存在する文字列を多値画像データとして読み取って文字認識する際に、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成し、この最小画素値曲線から線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求めて多値画像データの二値化処理を行うから、文字の記入領域に線図形等が存在していても、簡単な構成で正確な文字切り出しが可能になり、実時間性を満足することが可能となる。

【図面の簡単な説明】

【0025】

【図1】本実施形態に係る文字切り出し装置としての文字認識装置の全体構成を示すブロック図である。

【図2】運転免許証の画像の一例を示す図である。

【図3】文字認識装置における文字認識部の機能構成を示すブロック図である。

【図4】文字認識装置における文字列切り出し部の機能構成を示すブロック図である。

【図5】文字認識装置における文字切り出し部の機能構成を示すブロック図である。

【図6】本実施形態に係る文字切り出し装置としての文字認識装置の動作を説明するためのフローチャートである。

【図7】本実施形態に係る文字列切り出し処理を示すフローチャートである。

【図8】本実施形態に係る文字切り出し処理を示すフローチャートである。

【図9】本実施形態に係る文字区切り処理を示すフローチャートである。

【図10】本実施形態に係る二値化処理を示すフローチャートである。

【図11】運転免許証番号の画像の一例を説明する説明図である。

【図12】運転免許証番号の文字列の画像から計算される射影パターンの一例を示す図である。

【図13】斜線除去処理が施された運転免許証番号の画像の一例を示す図である。

【発明を実施するための形態】

【0026】

以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。

【0027】

図１は、本実施形態に係る文字切り出し装置としての文字認識装置の全体構成を示すブロック図である。

【0028】

図１において、１００は文字認識装置であり、画像の文字認識処理などを行うデータ処理部１と、画像を入力するスキャナ等の画像入力部２と、処理後の画像を表示する画像表示部３と、から構成されている。

【0029】

データ処理部１において、４は画像メモリであり、画像入力部２から入力される画像データを記憶する。５はＣＰＵ等からなる制御部であり、画像入力部２から供給される信号に従って画像データを生成する。６は画像データ等を記憶する記憶部であり、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）等で構成される。記憶部６には、氏名、住所、運転免許証番号等の項目毎に各領域の画像を抽出するための各領域を示す情報（以下「画像情報抽出情報」という）が格納されている。また、記憶部６には、どの項目の画像情報（画像データ）を抽出するかを選択するための情報（以下「項目選択情報」という）が格納されている。

【0030】

８は文字認識部であり、文字領域として抽出された領域に対し、文字認識処理を行う。１０は、画像表示部３とのインターフェースとなる出力インターフェース（Ｉ／Ｆ）部である。なお、文字認識部８における処理は、制御部５が記憶部６に記憶されているコンピュータプログラムを実行することによって実現されてもよい。

【0031】

画像入力部２は、運転免許証４０に対して照射される光の反射光に基づいて画像読取を行う。画像入力部２は、光電変換して、反射した光量をアナログ電気信号に変換するＣＣＤラインセンサ等の密着型の１次元撮像素子（図示略）と、アナログ電気信号を２５６階調の多値（デジタル）画像データに変換するＡ／Ｄ変換器（図示略）と、ノイズ除去、画像の平滑化（画素ごとの濃度値の細かい変動を取り除き、滑らかな画像とする処理）、画像の鮮鋭化（画像の濃度値の変化を強調する処理）などの前処理を行う前処理部（図示略）とを有する。画像表示部３は、ディスプレー等の表示パネルを備える。なお、画像表示部３は、表示パネルに代えてプリンタ等を備える構成であってもよい。

【0032】

図２は、運転免許証４０の画像の一例を示す図である。図示のように、運転免許証４０には、利用者の氏名や住所、生年月日等の各種情報が枠線ｆ内に記載されているとともに、識別番号（識別文字列）である運転免許証番号（図２中の「第１２３４５６７８９００１号」）が記載されている。

【0033】

識別文字は、文字の大きさ（幅や高さ）がほぼ同じであり、文字と文字との間にはスペース（空白区間）が形成されている。例えば、運転免許証４０の運転免許証番号等がある。識別文字には、文字、数字、記号等も含まれる。また、本実施の形態では、図２及び図１１に示すように、実際の運転免許証番号の５桁目の数字ｃ（５）＝「８」から８桁目の数字ｃ（８）＝「５」には、文字に赤色の斜線がかかっている。そのため、この斜線がかかった箇所は反射光の強度が低いため、多値画像データにした場合、黒を示す０よりは明るい値を示している。

【0034】

［文字認識部］
図３は、文字認識装置における文字認識部８の機能構成を示すブロック図である。

【0035】

文字認識部８は、文字列切り出し部８１と、文字切り出し部８２と、特徴抽出部８３と、特徴比較部８４と、特徴辞書格納部８５と、類似文字認識部８６と、を有し、画像入力部２によって読み取られた画像から文字を認識する。なお、これらの各部は、運転免許証４０上の文字列を認識する文字列認識手段の一例として機能する。

【0036】

文字列切り出し部８１は、記憶部６に記憶された項目選択情報（免許証番号領域Ｐ１）に従って項目を選択するとともに、記憶部６に記憶された画像情報抽出情報に従って、選択した項目に対応する領域を特定する。文字列切り出し部８１は、特定した領域に対応する画像データを画像メモリ４から読み出す。また、本実施の形態では、多階調（２５６階調）の濃淡画像である。なお、この画像メモリ４は、ＲＡＭ、ＳＤＲＡＭ、ＤＤＲＳＤＲＡＭ、ＲＤＲＡＭなど、画像データを記憶しうるものであれば如何なるものであってもよい。文字列切り出し部８１は、画像入力部２により読み取られた画像において、識別文字列が記されているべき領域からの反射光の分布を検出することによって文字列の画像データを検出する。文字列切り出し部８１は文字切り出し装置の検出部の一例である。

【0037】

図４は、文字認識装置における文字列切り出し部の機能構成を示すブロック図である。

【0038】

図４に示すように、文字列切り出し部８１は、射影ヒストグラム作成部８１１と、原点位置検出部８１２と、文字列切り出し実行部８１３と、を備えている。さらに、射影ヒストグラム作成部８１１は、Ｘ軸射影ヒストグラム作成部及びＹ軸射影ヒストグラム作成部を有する。また、原点位置検出部８１２は、運転免許証４０の枠線ｆ（Ｘ軸方向に延びる線分ｆｘとＹ軸方向に延びる線分ｆｙ）を検出する枠線検出部と、線分ｆｘと線分ｆｙとの延長線上の交点（原点位置）ｆｏを示す画素を検出する原点位置検出部と、を有する。たとえば、１画素は"０"（黒画素）から"２５５"（白画素）までの２５６階調（８ビット）の輝度値を持つ。画像データの図に対して最も左上の画素を原点（０，０）とする。この原点位置となる画素からＸ軸方向、Ｙ軸方向の座標を用いて、免許証番号が記載されているＰ１の領域を示す四隅の画素位置（座標）が設定されている。

【0039】

文字列切り出し部８１の射影ヒストグラム作成部８１１は、運転免許証４０における情報記録領域を示す枠線ｆを、水平方向及び垂直方向における濃度ヒストグラムを算出して検出する。なお、文字列切り出し部８１は、運転免許証４０に枠線ｆが存在しない場合には運転免許証４０の端を検出してもよい。また、搬送時の搬送手段のガイド面（運転免許証４０を搭載する面）に色等をつけて運転免許証との境界位置を明確にしてもよい。なお、射影ヒストグラム作成部８１１は、外形矩形領域を設定して、高さ方向の位置を切り出すようにしてもよい。

【0040】

文字列切り出し実行部８１３は、予め設定されている免許証番号領域Ｐ１の多値画像データを画像メモリ４から抽出する。画像情報抽出部（図示略）は、射影計算部（図示略）によって検出された枠線ｆの画素位置を基準として、免許証番号領域Ｐ１の四隅の画素の位置等を指定する。文字列切り出し実行部８１３は、運転免許証４０の外形と情報記録領域を示す枠線ｆ及びその近傍までの範囲を算出する。なお、本実施の形態では、図１１に示す矩形画像は、免許証番号領域Ｐ１において、「第」と「号」との文字の間に記載されている免許証番号「１２３４５６７８９００１」を用いて説明している。

【0041】

図５は、文字認識装置における文字切り出し部の機能構成を示すブロック図である。

【0042】

文字切り出し部８２は、文字列切り出し部８１によって検出された文字列の画像データについて、垂直方向に射影計算を行う。そして、求められた垂直射影プロファイルを用いて、文字と文字との間のスペース（空白区間）を識別し、文字の切り出しを行う。なお、詳細については後述する。この処理により、認識対象となっている文字の外接矩形領域（上下左右の座標値）が求められる。

【0043】

文字切り出し部８２は、最小画素値曲線作成部８２１と、文字区切り位置決定部８２２と、二値化処理部８２３と、文字切り出し実行部８２４と、を備えている。

【0044】

最小画素値曲線作成部８２１は、図１１に示すように、切り出された免許証番号領域Ｐ１の画像データを用いて、文字列方向（Ｘ軸方向）と直交する垂直方向（Ｙ軸方向）に配置された画素列の中で、最も小さい画素値を抽出して、図１２に示すような最小画素値曲線を作成する。文字切り出し部８２は、最小画素値曲線作成部８２１によって算出された曲線を用いて、免許証番号領域Ｐ１から免許証番号（文字列）を構成する各番号（文字）の両端の位置を切り出す。

【0045】

最小画素値曲線作成部８２１は、水平方向（Ｘ軸方向）と直交する垂直方向（Ｙ軸方向）に配列した画素列の中で最小画素値から、文字列の両端の位置を検出する。すなわち、Ｘ軸のある位置ＸａにおけるＹ軸方向（垂直方向）に配列された画素（画素列）の中で、最小画素値を検出し、その最小画素値を、ある位置Ｘａおける最小画素値として求める。より具体的には、文字が形成されている画素列では画素列の中で１画素でも黒を示す０があれば、その位置における最小画素値は０となり、文字が形成されていない画素列における最小画素値は白（２５５）となる。これらをＸ軸方向に画素列ごとに最小画素値をもとめたのが、図１２に示す最小画素値曲線である。

【0046】

文字区切り位置決定部８２２は、文字列を構成する各文字の位置を検出して各文字を抽出する。具体的には、文字列を構成する文字の中で、最両端に位置する文字を抽出する。抽出した両端の各文字の中心位置を検出し、左端文字の中心位置と右端文字の中心位置との差を求め、その差を「文字列の文字数」から１を引いた数で等分する。実施例では、文字列が免許証番号であり、免許証番号は１２文字であるため、１１等分して各文字の中心位置を検出する。本実施の形態では、文字区切り位置決定部８２２は、項目選択情報（免許証番号領域Ｐ１）内の多値画像データに基づき、仮の二値化しきい値を計算する仮二値化しきい値計算部と、項目選択情報（免許証番号領域Ｐ１）内の免許証番号の両端に位置する文字を抽出する両端文字抽出部と、項目選択情報（免許証番号領域Ｐ１）内に記載されている文字列を構成する各文字（免許証番号）の中心位置を検出する文字中心位置検出部と、各文字の両端位置を検出する文字両端位置検出部と、項目選択情報（免許証番号領域Ｐ１）内に記載されている文字列の全文字数を計数する文字数計数部と、を有している。

【0047】

また、文字区切り位置決定部８２２には、各文字両端位置検出部（図示略）と、文字数計数部（図示略）と、を備えている。
各文字両端位置検出部は、左から２番目の文字から右端の１つ手前の文字までの各文字について、各文字の両端位置を検出する。文字数計数部は、各文字の両端位置が所定の範囲（文字幅）に入っているか否かを判定する。実施例では、文字数計数部は、切り出された文字に従って、識別文字列が記されているべき領域内にある文字の数が予め定められた数と一致するか否かを判定している。文字数計数部は、識別文字列が記されているべき領域内にある文字の数が予め定められた数と一致すると判定された場合には、運転免許証４０の画像の方向が正立方向であると判定する。

【0048】

二値化処理部８２３は、媒体上に記載される文字の記入領域に線図形等（媒体上に書かれた文字を強調するために、アンダーラインや文字の背景に点、線、網掛け等を規則正しく並べた模様）を装飾された文字列の中で、線図形等を示す多値画像データを検出する。本実施の形態では、二値化処理部８２３は、最小画素値検出部と、二値化しきい値計算部と、を有している。このような二値化処理部８２３は、切り出された項目選択情報（免許証番号領域Ｐ１）の多値画像データを用いて、文字列方向（Ｘ軸方向）と直交する垂直方向（Ｙ軸方向）に配置された画素列の中で、最も小さい画素値を抽出して最小画素値曲線を作成する。最小画素値曲線中で、線図形等が形成されている領域の中で、最小画素値を検出して、この最小画素値を二値化閾値として、二値化処理する。

【0049】

図３において、特徴抽出部８３は、上述した切り出された１文字の領域を任意のサブ領域に分割（例えば、切り出された１文字の領域を５×５の領域に分割し、そのうち１個の領域をサブ領域とする）し、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合を求め、それらを要素とする特徴ベクトルを生成する。

【0050】

特徴比較部８４は、特徴抽出部８３で求められた特徴ベクトルを、予めこの媒体で使用される全文字について求めておいた基準特徴ベクトルと比較して、類似度（例えば正規化相関係数）が最も高いものをその文字が該当する候補文字に設定する。なお、基準特徴ベクトルは、予め特徴辞書格納部８５に格納されているものであって、特徴比較が行われる際に、特徴辞書格納部８５から類似度が高い文字のデータが読み出され、特徴比較が行われる。

【0051】

類似文字認識部８６は、特徴比較部８４によって設定された候補文字を、媒体に用いられた文字として認識する。なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部８６において、特徴ベクトルから導き出せる２次的な特徴量を利用して、類似文字の判別を行う。例えば、任意に分割したサブ領域を左側半分と右側半分との２領域の左右線対称に分けて、部分特徴ベクトルを構成してそれらの間の類似性を調べたり、同様に上半分と下半分との２領域の上下線対称に分けて、類似性を調べたりしてもよい。また、左右線対称や上下線対称と同様に点対称で類似性を調べてもよい。

【0052】

［文字認識装置の全体の動作］
次に、本実施形態に係る文字認識装置の全体的な動作について図６に関連付けて説明する。図６は、本実施形態に係る文字切り出し装置としての文字認識装置の動作を説明するためのフローチャートである。

【0053】

文字認識装置１００は、運転免許証４０に記載されている１２文字の運転免許証番号を読み取って文字コードに変換し、文字認識を行うことを主な処理内容としている。この処理は、図１に示す画像入力部２に運転免許証４０が差し込まれることを契機として開始される。画像入力部２は、運転免許証４０が差し込まれる差込口（図示略）を有しており、利用者によって運転免許証４０が画像入力部２に差し込まれると、差し込まれた運転免許証４０を媒体搬送機構（図示略）の搬送ガイドに沿って搬送し、撮像素子（図示略）を通過するときの反射光が光電変換され、Ａ（analog）／Ｄ（digital）変換された後、画素ごとに多階調（例えば、２５６階調）の輝度値が画像メモリ４に取り込まれる。

【0054】

運転免許証４０の運転免許証番号（ＯＣＲ文字記録）領域Ｐ１に印刷された運転免許証番号（ＯＣＲ文字列）は、画像入力部２の媒体搬送機構の搬送ガイドに沿って運転免許証４０が動かされると、１次元撮像素子によってその文字パターンが読み取られて光電変換さる（ステップＳＴ１）。

【0055】

文字認識装置１００のデータ処理部１は、画像入力部２で読み取られた画像に含まれる各画素の輝度値（画像データ）を画像メモリ４に記憶する（ステップＳ２）。

【0056】

次に、文字認識部８において、画像入力部２によって読み取られ、画像メモリ４に記憶された画像から文字を認識する。先ず、文字列切り出し部８１において、文字列の切り出し（行切り出し）が行われる（ステップＳＴ３）。具体的には、本実施形態に係る文字列切り出し部８１において、後述で詳細に説明するが、文字列切り出し処理について図７に関連付けて説明する。

【0057】

次いで、文字切り出し部８２において、文字切り出しが行われる（ステップＳＴ４）。具体的には、後述で詳細に説明するが、文字切り出し処理について図８に関連付けて説明する。
また、後述で詳細に説明するが、図８の文字区切り処理の詳細について、図９に関連付けて説明する。

【0058】

次に、文字切り出し部８２の二値化処理部８２３において、文字区切り処理が実行された後、文字切り出し処理のための二値化処理を実行する。切り出された項目選択情報（免許証番号領域Ｐ１）の多値画像データを用いて、文字列方向（Ｘ軸方向）と直交する垂直方向（Ｙ軸方向）に配置された画素列の中で、最も小さい画素値を抽出して最小画素値曲線を作成する。最小画素値曲線に基づき、文字列の中で装飾された線図形等が形成されている領域内で、最小画素値を検出して、この最小画素値を二値化閾値として、二値化処理する。

【0059】

次いで、特徴抽出部８３において、特徴抽出が行われる（ステップＳＴ５）。具体的には、特徴抽出部８３において、上述した切り出された１文字の領域が任意のサブ領域に分割（例えば、切り出された１文字の領域を５×５の領域に分割され、そのうち１個の領域がサブ領域とされる）され、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合が求められ、それらを要素とする特徴ベクトルが生成される。

【0060】

次いで、特徴比較部８４において、特徴比較が行われる（ステップＳＴ６）。具体的には、特徴比較部８４において、ステップＳＴ５で求めた特徴ベクトルが、予めこの媒体で使用される全文字について求められて予め特徴辞書格納部８５に格納されている基準特徴ベクトルと比較されて、類似度（例えば、正規化相関係数）が最も高いものをその文字が該当する候補文字に設定される。

【0061】

最後に、文字認識が行われる（ステップＳＴ７）。具体的には、ステップＳＴ６の特徴比較によって設定された候補文字が、媒体に用いられた文字として認識される。なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部８６において、特徴ベクトルから導き出せる２次的な特徴量を利用して、類似文字の判別が行われる。

【0062】

たとえば、任意に分割したサブ領域を左側半分と右側半分との２領域の左右線対称に分けて、部分特徴ベクトルを構成してそれらの間の類似性を調べたり、同様に上半分と下半分との２領域の上下線対称に分けて、類似性を調べたりしてもよい。また、左右線対称や上下線対象と同様に点対称で類似性を調べてもよい。

【0063】

また、本実施形態の文字認識装置１００は、運転免許証のみならず、カード、パスポート、あらゆる媒体への適用が可能である。

【0064】

なお、以上詳細に説明した方法は、上記手順に応じたプログラムとして形成し、ＣＰＵ等のコンピュータで実行するように構成することも可能である。また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー（登録商標）ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。

【0065】

［文字列切り出し処理］
次に、文字列切り出し処理について図７に関連付けて説明する。図７は、本実施形態に係る文字列切り出し処理を示すフローチャートである。

【0066】

文字列切り出し部８１は、射影ヒストグラム作成部８１１が、画像入力部２によって読み取られた運転免許証４０全体の多値画像データについて全体の射影を検出し、Ｘ方向（水平方向）射影、Ｙ方向（垂直方向）射影を求める（ステップＳＴ３１）。

【0067】

射影ヒストグラム作成部８１１は、Ｘ軸射影ヒストグラム作成部及びＹ軸射影ヒストグラム作成部を有し、運転免許証４０における情報記録領域を示す枠線ｆを、水平方向及び垂直方向における濃度ヒストグラムを算出して検出する。なお、文字列切り出し部８１は、運転免許証４０に枠線ｆが存在しない場合には運転免許証４０の端を検出してもよい。また、搬送時の搬送手段のガイド面（運転免許証４０を搭載する面）に色等をつけて運転免許証との境界位置を明確にしてもよい。

【0068】

次に、文字列切り出し部８１は、原点位置検出部８１２が、Ｘ方向射影及びＹ方向射影から運転免許証４０の枠線ｆを検出して運転免許証４０の画像の領域を特定する（ステップＳＴ３２）。原点位置検出部８１２は、枠線ｆを構成する線分ｆｘと線分ｆｙとの延長線上の交点を求め、画像データの原点位置ｆｏを検出する（ステップＳＴ３３）。

【0069】

具体的には、原点位置検出部８１２は、運転免許証４０の枠線ｆ（Ｘ軸方向に延びる線分ｆｘとＹ軸方向に延びる線分ｆｙ）を検出する枠線検出部と、線分ｆｘと線分ｆｙとの延長線上の交点（原点位置）ｆｏを示す画素を検出する原点位置検出部と、を有する。たとえば、１画素は"０"（黒画素）から"２５５"（白画素）までの２５６階調（８ビット）の輝度値を持つ。画像データの図に対して最も左上の画素を原点（０，０）とする。この原点位置となる画素からＸ軸方向、Ｙ軸方向の座標を用いて、免許証番号が記載されているＰ１の領域を示す四隅の画素位置（座標）が設定されている。

【0070】

次いで、文字列切り出し部８１は、文字列切り出し実行部８１３が、運転免許証４０の画像データから運転免許証番号が記載されている免許証番号領域Ｐ１を決定し、その領域Ｐ１の画像データを抽出する（ステップＳＴ３４）。運転免許証番号は、図２に示すように、０〜９までの数字の組み合わせによる１２文字（１２桁数）で構成されている。例えば、図２に示す運転免許証４０では、「第１２３４５６７８９００１号」で運転免許証番号が表されている。なお、説明する上で、最右端の数字「１」を１桁目の数字として、ｃ（１）とし、最左端の数字「１」を１２桁目の数字として、ｃ（１２）とし、その間の数字を、右側から、ｃ（２）、ｃ（３）・・・・・ｃ（１１）とする。

【0071】

［文字切り出し処理］
次に、文字切り出し処理について図８に関連付けて説明する。図８は、本実施形態に係る文字切り出し処理を示すフローチャートである。

【0072】

文字切り出し部８２は、最小画素値曲線作成部８２１が、免許証番号領域Ｐ１において、文字列方向（Ｘ軸方向）と直交する垂直方向（Ｙ軸方向）に配置された画素列を構成する画素の中で、最も小さい画素値を抽出して、図１２に示すような最小画素値曲線を作成する（ステップＳＴ４１）。

【0073】

すなわち、Ｘ軸のある位置ＸａにおけるＹ軸方向（垂直方向）に配列された画素（画素列）の中で、最小画素値を検出し、その最小画素値を、ある位置Ｘａおける最小画素値として求める。より具体的には、文字が形成されている画素列では画素列の中で１画素でも黒を示す０があれば、その位置における最小画素値は０となり、文字が形成されていない画素列における最小画素値は白（２５５）となる。これらをＸ軸方向に画素列ごとに最小画素値をもとめたのが、図１２に示す最小画素値曲線である。また、本実施の形態では、図２及び図１１に示すように、運転免許証番号の５桁目の数字ｃ（５）＝「８」から８桁目の数字ｃ（８）＝「５」には、文字に赤色の斜線がかかっており、この斜線がかかった箇所は反射光の強度が低いため、多値画像データにした場合、黒を示す０よりは明るい値を示している。

【0074】

文字切り出し部８２は、文字区切り位置決定部８２２が最小画素値曲線に基づいて仮の二値化しきい値を算出し、文字列の両端文字を抽出し、両端文字から各文字の中心位置を算出し、各文字の中心位置から各文字の両端位置を検出した後、文字数の計数を行う。そして、免許証番号領域Ｐ１内の文字の数が予め定められた数と一致するか否かを判定する（ステップＳＴ４２）。この文字区切り処理についての詳細は後述する。

【0075】

文字区切り位置決定部８２２において文字区切り処理が実行された後、二値化処理部８２３において文字切り出し処理のための二値化処理を実行する（ステップＳＴ４３）。そして、文字切り出し実行部８２４は、二値化処理によって背景の線図形等が除去された各文字の外接矩形領域の画像データを抽出する（ステップＳＴ４４）。この二値化処理の詳細についても後述する。

【0076】

［文字区切り処理］
図８の文字区切り処理（ステップＳ４２）の詳細について、図９に示すフローチャートを参照しつつ説明する。図９は、本実施形態に係る文字区切り処理を示すフローチャートである。

【0077】

先ず、文字区切り位置決定部８２２は、仮二値化しきい値計算部が、切り出された免許証番号領域Ｐ１の矩形画像（図１１を参照）に含まれる各画素の画素値を用いて、仮の二値化しきい値を計算する（ステップＳＴ４２１１）。なお、本実施の形態では、図１１に示す矩形画像は、免許証番号領域Ｐ１において、「第」と「号」との文字の間に記載されている免許証番号「１２３４５６７８９００１」を用いて説明している。

【0078】

二値化処理は、具体的には文字区切り位置決定部８２２が画像メモリ４の多値画像データ全体を走査し、二値化のための輝度のしきい値を設定した後に、しきい値以上の輝度を持つ画素を白画素（"１"のデータ）、しきい値未満の輝度を持つ画素を黒画素（"０"のデータ）とすることにより行なわれる。ここにしきい値の設定方法として、たとえば田村秀行監修、日本工業技術センター編、「コンピュータ画像処理入門」，総研出版，１９８８年，ｐ．６６〜ｐ．６９に述べられている方法（判別分析法、ｐ−タイル法、モード法など）を用いることができる。本実施例においてはその中の判別分析法が用いられる。一般的に、判別分析法は異なる輝度値を持つ画素の集合をしきい値（ｔｈ）により２つのクラス（ｔｈ以上とｔｈ未満）に分割したと仮定したとき、各々のクラス間の分散が最大になるようにしきい値（ｔｈ）を設定する方法である。本実施例では、仮の二値化しきい値ｂｔｈ＝５０と計算で求められている。

【0079】

図１２は、このようにして生成されたヒストグラムの一例を示している。図１２において、横軸はＸ軸方向の（画像メモリ上の画素）位置を示し、縦軸はＸ軸方向に配列されている画素の中での最小画素値を示す。この例では、黒色の画素値を「０」とし、白色の画素値を「２５５」としている。

【0080】

両端文字抽出部は、射影Ｐ（ｘ）を左方からスキャンして、運転免許証番号の左端位置Ｘｓ_ｌを求める（ステップＳＴ４２１２）。実施例では、両端文字抽出部は、射影Ｐ（ｘ）を左方からスキャンしていき、最小画素値が仮の二値化しきい値（ｂｔｈ＝５０）より小さくなる位置であって左方から２番面の位置を検出している。

【0081】

図２に示す運転免許証の実施例では、左方からスキャンした場合に、運転免許証番号の左側に「第」の文字が記載されているが、文字列切り出し実行部８１３で処理され、この文字の位置でも度数が閾値よりも低くなるため、両端文字抽出部は、最小画素値が仮の二値化しきい値（ｂｔｈ＝５０）よりも小さくなる位置であって、左方から２番目の位置を運転免許証番号の左端位置として検出する。両端文字抽出部は、図１１における最左端の数字ｃ（１２）＝「１」の左端位置をＸｓ_ｌとしている。

【0082】

ステップＳＴ４２１２の処理を終えると、両端文字抽出部は、位置Ｘｓ_ｌを開始点として射影Ｐ（ｘ）をスキャンし、最上位桁数字の右端位置Ｘｓ_ｒを求める（ステップＳＴ４２１３）。最上位桁数字は、図１１に示す運転免許証番号の中で最左端の数字ｃ（１２）＝「１」を示している。具体的には、例えば、両端文字抽出部は、位置Ｘｓ_ｌを開始点として射影Ｐ（ｘ）をスキャンし、最小画素値が仮の二値化しきい値（ｂｔｈ＝５０）以上となる位置を右端位置Ｘｓ_ｒとする。

【0083】

次いで、各文字の文字中心位置検出部は、以下の式（１）を用いて、最上位桁数字の中央位置Ｘｃ（１２）を求める（ステップＳＴ４２１４）。
Ｘｃ（１２）＝（Ｘｓ_ｌ＋Ｘｓ_ｒ）／２ …（１）

【0084】

次いで、両端文字抽出部は、以下の式（２）を用いて、運転免許証番号の概略右端位置Ｘｅ_ｒを求める（ステップＳＴ４２１５）。式（２）において、Ｄｘは運転免許証番号の１２桁の文字列のＸ軸方向の幅を表す値であり、予め設定された値である。
Ｘｅ_ｒ＝Ｘｓ_ｌ＋Ｄｘ …（２）

【0085】

次いで、両端文字抽出部は、位置Ｘｅ_ｒを開始点として射影Ｐ（ｘ）を右方からスキャンして最下位桁数字の左端位置Ｘｅ_ｌを求める（ステップＳＴ４２１６）。最下位桁数字は、図１１に示す運転免許証番号の中で最右端の数字ｃ（１）＝「１」を示している。この処理は、具体的には、例えば、両端文字抽出部が、Ｘｅ_ｒを開始点として射影Ｐ（ｘ）を右方からスキャンし、最小画素値が仮の二値化しきい値（ｂｔｈ＝５０）以上となる位置を左端位置Ｘｅ_ｌとする。

【0086】

次いで、各文字の文字中心位置検出部は、以下の式（３）を用いて、最下位桁数字の中央位置Ｘｃを求める（ステップＳＴ４２１７）。
Ｘｃ（１）＝（Ｘｅ_ｌ＋Ｘｅ_ｒ）／２ …（３）

【0087】

さらに、各文字の文字中心位置検出部は、以下の式（４）を用いて、文字間隔の現実値Ｄｃを求める（ステップＳＴ４２１８）。
Ｄｃ＝（Ｘｃ（１）−Ｘｃ（１２））／１１ …（４）

【0088】

次いで、文字中心位置検出部は、２桁から１１桁までのｋ桁における各文字の中央位置Ｘｃ（ｋ）を、以下の式（５）を用いて算出する（ステップＳＴ４２１９）。ただし、以下の式（５）において、ｋ＝２，…１１とする。
Ｘｃ（ｋ）＝Ｘｃ（１）−（ｋ−１）＊Ｄｃ …（５）

【0089】

次いで、文字中心位置検出部は、各文字のそれぞれについて、文字の中央位置Ｘｃ（ｋ）から文字の端の位置までの最大許容距離を設定する（ステップＳＴ４２２０）。本実施形態では、文字中心位置検出部は、最大許容距離として文字間隔の現実値Ｄｃを設定する。

【0090】

次いで、文字両端位置検出部及び文字数計数部はステップＳＴ４２２１からステップＳＴ４２２８の処理を行うことによって、免許証番号領域Ｐ１に存在する文字の数が１２であるか否かを判定する。ステップＳＴ４２２１からステップＳＴ４２２８において、カウンタは、左から何番目の文字かを示すカウンタであり、エラーカウンタは、エラーの回数を示すカウンタである。また、最大許容距離は、文字の中央位置から文字の右端位置までの許容される最大の距離を示す。先ず、文字数計数部は、カウンタに１を設定するとともに、エラーカウンタにゼロを設定する（ステップＳＴ４２２１）。

【0091】

次いで、文字両端位置検出部は、カウンタによって示される文字の中央位置Ｘｃ（カウンタ）から射影Ｐ（ｘ）を右方向に最大許容距離までスキャンし、輝度値が仮の二値化しきい値以上となる位置を検出することによって、カウンタによって示される文字の右端位置を検出する（ステップＳＴ４２２２）。

【0092】

ステップＳＴ４２２２の処理において、最大許容距離の範囲内に文字の右端位置が検出されなかった場合は、ステップＳＴ４２２３において「ＮＯ」と判断し、文字数計数部はエラーカウンタをインクリメントする（ステップＳＴ４２２４）。

【0093】

また、文字両端位置検出部は、カウンタによって示される文字の中央位置Ｘｃ（カウンタ）から射影Ｐ（ｘ）を左方向に最大許容距離までスキャンし、輝度値が仮の二値化しきい値以上となる位置を検出することによって、カウンタによって示される文字の左端位置を検出する（ステップＳＴ４２２５）。ステップＳＴ４２２５の処理において、最大許容距離の範囲内に文字の左端位置が検出されなかった場合は、ステップＳＴ４２２６において「ＮＯ」と判断し、文字数計数部はエラーカウンタをインクリメントする（ステップＳＴ４２２７）。

【0094】

次いで、文字数計数部は、カウンタの値が１２であるか否かを判定し（ステップＳＴ４２２８）、判定結果が否定的である場合には（ステップＳＴ４２２８；ＮＯ）、カウンタをインクリメントし（ステップＳＴ４２２９）、ステップＳＴ４２２２の処理に戻る。

【0095】

一方、ステップＳＴ４２２８において判定結果が肯定的である場合には（ステップＳＴ４２２８；ＹＥＳ）、文字数計数部は、エラーカウンタがゼロであるか否かを判定し（ステップＳＴ４２３０）、エラーカウンタがゼロである場合には（ステップＳＴ４２３０；ＹＥＳ）、文字数は１２であると判定する（ステップＳＴ４２３１）。一方、エラーカウンタがゼロでない場合には（ステップＳＴ４２３０；ＮＯ）、文字数は１２でないと判定する（ステップＳＴ４２３２）。

【0096】

［二値化処理］
文字区切り位置決定部８２２において文字区切り処理が実行された後、二値化処理部８２３において文字切り出し処理のための二値化処理を実行する。

【0097】

図２及び図１１に示すように、運転免許証番号の５桁目の数字ｃ（５）＝「８」から８桁目の数字ｃ（８）＝「５」には、文字に赤色の斜線がかかっており、この斜線がかかった箇所は反射光の強度が低いため、仮の二値化しきい値によっては斜線の箇所も文字として検出されてしまい、文字の検出が適切になされない場合がある。そのため、文字の検出を適切に行うべく、二値化処理部８２３が以下の処理を行って、斜線部分の画素値の中で最小画素値を検出して、その画素値を正式な二値化しきい値として決定している。

【0098】

先ず、二値化処理部８２３は、上述した仮の二値化しきい値（ｂｔｈ＝５０）を定め、射影Ｐ（ｘ）がこの仮の二値化しきい値ｂｔｈよりも高い区間を空白区間と判定する。この空白区間は、文字（数字）と文字（数字）の間の区間と考えられる。すなわち、この空白区間には、文字を示す画素はなく、斜線部分を示す画素値と斜線がない画素値とのいずれかであると考えられる。

【0099】

次いで、二値化処理部８２３は、各空白区間における射影Ｐ（ｘ）の最小画素値を求める。図１２において、Ｓ１からＳ１２は免許証番号の数字が形成された文字区間であり、たとえばＳ１とＳ２との間は、文字が形成されていない空白区間となっている。そこで、本実施例では、５桁目の数字ｃ（５）＝「８」から８桁目の数字ｃ（８）＝「５」までの文字に斜線がかかっている区間において、Ｓ４とＳ５との間、Ｓ５とＳ６との間、Ｓ６とＳ７との間、Ｓ７とＳ８との間について、各区間の最小画素値を検出する。この各区間での最小画素値が検出された後、二値化処理部８２３は、これら全区間の中で、最小となる画素値を検出する。そして、二値化処理部８２３は、この最小画素値を二値化しきい値として用いる。

【0100】

この態様によれば、斜線がかけられている箇所を含む区間における射影Ｐ（ｘ）の最小画素値を二値化しきい値として用いるため、斜線がかけられている箇所は確実に二値化しきい値を上回る。そのため、斜線がかけられている箇所が文字区間として検出されることがない。

【0101】

上述の実施形態において、文字区切り位置決定部８２２に係る処理を実行した後に、運転免許証番号の文字にかかった斜線部分を取り除く処理を行うようにしてもよい。この場合の処理方法について、図１０乃至図１３を参照しつつ説明する。

【0102】

図１１は、運転免許証番号の画像の一例を説明する説明図である。図２及び図１１に示すように、免許証番号は５桁目の数字ｃ（５）＝「８」から８桁目の数字ｃ（８）＝「５」までの文字に赤色の斜線が施されている。この斜線を除去して文字を取り出す二値化処理について以下に説明する。

【0103】

図１０は、本実施形態に係る二値化処理を示すフローチャートである。最小画素値検出工程は、図１２において、空白区間（特に、斜線がかけられているＳ４とＳ５の間・・・Ｓ７とＳ８の間）における最小画素値を検出する。ここで、Ｘ射影は通常のＸ射影ではなく、特別な射影計算を行う。すなわち、射影算出部は、文字領域画像をＳ（ｉ，ｊ）と表すとき、Ｓｍｉｎ（Ｘ）＝ｍｉｎ（Ｓ（ｉ，Ｘ））を求める。これは直線ｘ＝ｉにおける最小画素値である。このＳｍｉｎ（Ｘ）を図１２に示す（ステップＳＴ４３１）。

【0104】

二値化しきい値検出工程は、Ｓｍｉｎ（Ｘ）に基づいて、二値化しきい値を求める。二値化しきい値検出工程は、先ず、仮の二値化しきい値ｂｔｈを定める。例えば、ｂｔｈ＝５０とする（図１２参照）。二値化しきい値検出工程は、Ｓｍｉｎ（Ｘ）において、関数値がｂｔｈを下回ればその区間を文字区間Ｂと判定し、上回ればその区間を空白区間Ｗと判定する。ここで、斜線とＳｍｉｎ（Ｘ）との関係に注目すると、斜線は５文字目から８文字目にかけて施されており、これは図１２における空白区間のうち、斜線がかかる部分の関数値はそうでない部分よりも小さいことがわかる。この斜線がかかる５個の連続する空白区間（図１２の影をつけた部分；Ｓ４とＳ５の間・・・Ｓ７とＳ８の間）について、Ｓｍｉｎ（Ｘ）の最小画素値を求め、これを二値化しきい値BinThreshとする。図１２の例では、BinThresh＝５２となる（ステップＳＴ４３２）。

【0105】

二値化処理工程は、この二値化しきい値BinThreshを用いて文字領域画像の二値化を行う（ステップＳＴ４３３）。その結果、図１３に示す画像が得られる。図１３に示すように、二値化によってもとの文字領域画像の斜線が除去されていることがわかる。この方式では、斜線の存在する部分の最小画素値を求め、これを二値化の閾値としているため、斜線の部分は確実に閾値を上回ることが保証されている。したがって二値化によって斜線画素が黒領域にマップされることはないので、文字認識にとって望ましい二値化を行うことができる（ステップＳＴ４３４）。

【0106】

（本実施例の主な効果）
本発明の文字切り出し装置及び文字切り出し方法は、運転免許証に記載された文字領域に斜線が存在する文字列を画像データとして読み取って文字認識する際に、画像データを回転する操作、すなわち座標変換を伴わないため計算負荷が軽く、装置のコストを低く抑えつつ、処理時間の短縮につなげることができる。また、本装置は、回転文字用の辞書を備えなくてよいので、余分な記憶域が不要となる。さらに、本発明は、文字と文字との間に形成された空白区間における斜線部分の最小画素値を求めてこれを閾値とするため、斜線画素が黒領域にマップされることが確実に排除されるため、文字認識にとって望ましい二値化画像を得ることができる。

【0107】

（他の実施形態）
上述した実施形態は、本発明の実施の一例に過ぎず、以下のように変形させてもよい。また、上述した実施形態及び以下に示す変形例は、必要に応じて組み合わせて実施してもよい。

【0108】

上述の実施形態では、図２に示すような、免許証番号領域Ｐ１に運転免許証番号が存在するような画像の方向を「正立方向」と呼び、一方、画像が１８０度回転した状態で運転免許証番号が領域Ｐ２に位置するような画像の方向を「倒立方向」と呼ぶ。なお、本実施の形態では、免許証が正しい方向で挿入されることを前提としているが、例えば、方向を間違えた場合には、免許証番号領域Ｐ１に運転免許証番号が存在しないので、運転免許証の方向が誤っていると判定するように設定してもよい。

【0109】

上述の実施形態において、文字認識部８は、制御部５が記憶部６等の記憶媒体に記憶されたコンピュータプログラムを読み出して実行することによって実現されてもよい。この場合、このコンピュータプログラムは、磁気記録媒体（磁気テープ、磁気ディスク（ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＦＤ（ＦｌｅｘｉｂｌｅＤｉｓｋ））など）、光記録媒体（光ディスクなど）、光磁気記録媒体、半導体メモリなどのコンピュータ読取可能な記録媒体に記憶した状態で提供し得る。また、インターネット等の通信回線を介して文字切り出し装置としての文字認識装置にダウンロードさせてもよい。

【符号の説明】

【0110】

１…データ処理部、２…画像入力部、３…画像表示部、４…画像メモリ、５…制御部、６…記憶部、８…文字認識部、１０…出力インターフェース部、４０…運転免許証、８１…文字列切り出し部、８２…文字切り出し部、８３…特徴抽出部、８４…特徴比較部、８５…特徴辞書格納部、８６…類似文字認識部、１００…文字認識装置、８１１…射影ヒストグラム作成部、８１２…原点位置検出部、８１３…文字列切り出し実行部、８２１…最小画素値曲線作成部、８２２…文字区切り位置決定部、８２３…二値化処理部、８２４…文字切り出し実行部

【図1】