特許7487984 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社オプトエレクトロニクスの特許一覧

特許7487984文字列読取方法、文字列読取装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-05-13

(45)【発行日】2024-05-21

(54)【発明の名称】文字列読取方法、文字列読取装置及びプログラム

(51)【国際特許分類】

G06V 30/12 20220101AFI20240514BHJP

G06V 30/14 20220101ALI20240514BHJP

【ＦＩ】

G06V30/12 Z

G06V30/14 340K

【請求項の数】 19

(21)【出願番号】P 2023147753

(22)【出願日】2023-09-12

【審査請求日】2024-02-05

【早期審査対象出願】

(73)【特許権者】

【識別番号】391062872

【氏名又は名称】株式会社オプトエレクトロニクス

(74)【代理人】

【識別番号】100123881

【弁理士】

【氏名又は名称】大澤豊

(74)【代理人】

【識別番号】100134625

【弁理士】

【氏名又は名称】大沼加寿子

(72)【発明者】

【氏名】丑木崇

【審査官】真木健彦

(56)【参考文献】

【文献】特開２０１４－０７１６９８（ＪＰ，Ａ）

【文献】特開平１１－２３２３８１（ＪＰ，Ａ）

【文献】特開２０１９－１２９１６７（ＪＰ，Ａ）

【文献】特開２０１６－２２４６０２（ＪＰ，Ａ）

【文献】国際公開第１９９６／０２７１６６（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｖ３０／１２

Ｇ０６Ｖ３０／１４

Ｇ０６Ｖ３０／００

(57)【特許請求の範囲】

【請求項1】

文字列読取装置が実行する文字列読取方法であって、
画像取得部により読取対象物の画像を取得する画像取得手順と、
前記画像中から読み取って出力すべき文字列のフォーマットを取得するフォーマット取得手順と、
前記文字列読取装置が特定可能な文字のうち、取得した前記フォーマットで規定される文字を全て含む一群の文字のみを特定することを文字認識条件として設定する文字認識条件設定手順と、
取得した前記画像中の文字列を、設定した前記文字認識条件に従って認識する文字列認識手順と、
前記認識で得た第１文字列のうち、取得した前記フォーマットに合致する箇所の第２文字列を出力用に取得する文字列取得手順とを備える文字列読取方法。

【請求項2】

請求項１に記載の文字列読取方法であって、
前記文字列認識手順は、
前記画像中に含まれる図形を認識する図形認識手順と、
認識した前記図形のうち１の図形又は複数の図形の組み合わせにより構成される文字候補を特定する文字候補特定手順と、
特定された前記文字候補の特徴を前記一群の文字の各々の特徴と対比して得た一致率に基づき該文字候補がどの文字かを特定し、どの文字とも特定されなかった文字候補を不定の文字と認識する文字特定手順とを備え、
概ね直線状に連続して配列されている、特定された前記文字及び前記不定の文字を、それらの文字で構成された文字列と認識する手順であることを特徴とする文字列読取方法。

【請求項3】

請求項１に記載の文字列読取方法であって、
前記文字列取得手順において、前記認識で得た第１文字列のうち前記取得したフォーマットに合致する箇所が複数あった場合、それらのうち、前記文字列認識手順における認識で文字の特徴との一致率が最も高かった箇所を前記第２文字列として取得することを特徴とする文字列読取方法。

【請求項4】

請求項３に記載の文字列読取方法であって、
前記文字列取得手順で前記フォーマットに合致する箇所が複数あった場合に、誤読の可能性がある旨を報知する報知手順を備えることを特徴とする文字列読取方法。

【請求項5】

請求項１に記載の文字列読取方法であって、
前記文字列取得手順において、前記認識で得た第１文字列のうち前記取得したフォーマットに合致する箇所が複数あった場合、それらのうち、前記第１文字列における文字の配列方向で見て、取得した前記画像の中央を含む箇所を前記第２文字列として取得することを特徴とする文字列読取方法。

【請求項6】

請求項５に記載の文字列読取方法であって、
前記文字列取得手順で前記フォーマットに合致する箇所が複数あった場合に、誤読の可能性がある旨を報知する報知手順を備えることを特徴とする文字列読取方法。

【請求項7】

請求項１に記載の文字列読取方法であって、
前記フォーマット取得手順において、出力すべき文字列のフォーマットを複数取得し、
前記文字認識条件設定手順において、取得した前記複数のフォーマットのいずれかで規定される文字を全て含む一群の文字のみを特定することを文字認識条件として設定し、
前記文字列取得手順において、前記認識で得た第１文字列のうち、取得した前記複数のフォーマットの少なくとも１つに合致する箇所を、前記第２文字列の候補として取得することを特徴とする文字列読取方法。

【請求項8】

請求項７に記載の文字列読取方法であって、
前記文字列取得手順において、取得した前記候補の中で、前記取得に当たり最も長い文字数に亘り前記フォーマットとの合致が検出された候補を、前記第２文字列として取得することを特徴とする文字列読取方法。

【請求項9】

請求項１に記載の文字列読取方法であって、
前記フォーマットは、文字列の加工規則を含むことができ、
前記取得したフォーマットが前記加工規則を含む場合に、前記第２文字列を該加工規則に従って加工し、加工後の文字列を出力する出力手順を備えることを特徴とする文字列読取方法。

【請求項10】

文字列読取装置であって、
読取対象物の画像を取得する画像取得部と、
前記画像中から読み取って出力すべき文字列のフォーマットを取得するフォーマット取得部と、
当該文字列読取装置が認識可能な文字のうち、取得した前記フォーマットで規定される文字を全て含む一群の文字のみを認識すべきことを文字認識条件として設定する文字認識条件設定部と、
取得した前記画像中の文字列を、設定した前記文字認識条件に従って認識する文字列認識部と、
前記認識で得た第１文字列のうち、取得した前記フォーマットに合致する箇所の第２文字列を出力用に取得する文字列取得部とを備える文字列読取装置。

【請求項11】

請求項１０に記載の文字列読取装置であって、
前記文字列認識部は、
前記画像中に含まれる図形を認識する図形認識部と、
認識した前記図形のうち１の図形又は複数の図形の組み合わせにより構成される文字候補を特定する文字候補特定部と、
特定された前記文字候補の特徴を前記一群の文字の各々の特徴と対比して得た一致率に基づき該文字候補がどの文字かを特定し、どの文字とも特定されなかった文字候補を不定の文字と認識する文字特定部とを備え、
概ね直線状に連続して配列されている、特定された前記文字及び前記不定の文字を、それらの文字で構成された文字列と認識することを特徴とする文字列読取装置。

【請求項12】

請求項１０に記載の文字列読取装置であって、
前記文字列取得部は、前記認識で得た第１文字列のうち前記取得したフォーマットに合致する箇所を複数発見した場合、それらのうち、前記文字列認識部による認識で文字の特徴との一致率が最も高かった箇所を前記第２文字列として取得することを特徴とする文字列読取装置。

【請求項13】

請求項１２に記載の文字列読取装置であって、
前記文字列取得部が前記フォーマットに合致する箇所を複数発見した場合に、誤読の可能性がある旨を報知する報知部を備えることを特徴とする文字列読取装置。

【請求項14】

請求項１０に記載の文字列読取装置であって、
前記文字列取得部は、前記認識で得た第１文字列のうち前記取得したフォーマットに合致する箇所を複数発見した場合、それらのうち、前記第１文字列における文字の配列方向で見て、取得した前記画像の中央を含む箇所を前記第２文字列として取得することを特徴とする文字列読取装置。

【請求項15】

請求項１４に記載の文字列読取装置であって、
前記文字列取得部が前記フォーマットに合致する箇所を複数発見した場合に、誤読の可能性がある旨を報知する報知部を備えることを特徴とする文字列読取装置。

【請求項16】

請求項１０に記載の文字列読取装置であって、
前記フォーマット取得部が、出力すべき文字列のフォーマットを複数取得し、
前記文字認識条件設定部が、取得した前記複数のフォーマットのいずれかで規定される文字を全て含む一群の文字のみを特定することを文字認識条件として設定し、
前記文字列取得部が、前記認識で得た第１文字列のうち、取得した前記複数のフォーマットの少なくとも１つに合致する箇所を、前記第２文字列の候補として取得することを特徴とする文字列読取装置。

【請求項17】

請求項１６に記載の文字列読取装置であって、
前記文字列取得部が、取得した前記候補の中で、前記取得に当たり最も長い文字数に亘り前記フォーマットとの合致が検出された候補を、前記第２文字列として取得することを特徴とする文字列読取装置。

【請求項18】

請求項１０に記載の文字列読取装置であって、
前記フォーマットは、文字列の加工規則を含むことができ、
前記取得したフォーマットが前記加工規則を含む場合に、前記第２文字列を該加工規則に従って加工し、加工後の文字列を出力する出力部を備えることを特徴とする文字列読取装置。

【請求項19】

請求項１乃至９のいずれか一項に記載の文字列読取方法を、前記画像取得部を制御するプロセッサに実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

この発明は、画像取得部により読取対象物の画像を取得し、その取得した画像中の文字列を読み取る文字列読取方法、このような文字列の読み取りを行う文字列読取装置及びコンピュータに上記の文字列読取方法を実行させるためのプログラムに関する。

【背景技術】

【0002】

従来から、ＯＣＲ（光学的文字認識：Optical Character Recognition）を用いて、撮像した画像中に含まれる文字列を読み取ることが行われている。また、この読み取りに際し、誤った読み取りが行われた可能性をオペレータに報知することも行われている。
例えば、特許文献１には、文字列の属性を定義づけた複数の読取フォーマットを記憶しておき、文字列認識において認識された文字列に合致する第１の読取フォーマットを検索すると共に、第１の読取フォーマットに合致する文字列が部分文字列として合致する第２の読取フォーマットも検索し、このような第２の読取フォーマットがあった場合には誤読の可能性を報知することが記載されている。

【0003】

特許文献２には、文字列が複数並んだ文字列群であって、異なる文字列に含まれる文字同士が、文字列内の文字の並び方向に直行する方向に沿って列をなすように配置された文字列群を読み取る場合に、上記列をなす文字の文字数の計算結果に応じて誤認識の有無を判定し誤認識した文字に関する情報を報知することが記載されている。
特許文献３には、文字認識における文字画像と文字テンプレートとの一致率が所定の範囲に入る場合に、その文字画像の認識結果を誤読の可能性がある文字として報知することが記載されている。

【先行技術文献】

【特許文献】

【0004】

【文献】特許第６４０３４１７号公報

【文献】特開２０２０－２４４９２号公報

【文献】特許第６５２４８００号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

特に可搬性のある読取装置を用いる場合、読取対象の文字列を撮像する環境は様々であり、このため画像を理想的な条件で撮像できないことも多く、正確な読み取りには限界がある。従って、誤読が生じた可能性がある場合にはオペレータにこれを通知できることが好ましい。誤読が生じる場合でも、オペレータが読取対象の文字列と読み取り結果とを目視で対比すれば、誤読の判別は容易であり、読取結果の修正も可能であるためである。

【0006】

一方で、正確な読み取りが行われている場合にも誤読の可能性を通知してしまうと、オペレータが通知を無視するようになってしまうことも考えられる。従って、適切な頻度で通知を行うことが求められる。
また、誤読自体の発生率もなるべく下げることが求められる。もちろん、読み取り自体に失敗する率も、下げることが求められる。

【0007】

この発明は、このような事情に鑑みてなされたものであり、簡便で負荷の小さい処理により、撮像画像中の文字を認識する文字認識の精度を向上させることを目的とする。

【課題を解決するための手段】

【0008】

以上の目的を達成するため、この発明の文字列読取方法は、文字列読取装置が実行する文字列読取方法に、画像取得部により読取対象物の画像を取得する画像取得手順と、上記画像中から読み取って出力すべき文字列のフォーマットを取得するフォーマット取得手順と、上記文字列読取装置が特定可能な文字のうち、取得した上記フォーマットで規定される文字を全て含む一群の文字のみを特定することを文字認識条件として設定する文字認識条件設定手順と、取得した上記画像中の文字列を、設定した上記文字認識条件に従って認識する文字列認識手順と、上記認識で得た第１文字列のうち、取得した上記フォーマットに合致する箇所の第２文字列を出力用に取得する文字列取得手順とを設けたものである。

【0009】

このような文字列読取方法において、上記文字列認識手順が、上記画像中に含まれる図形を認識する図形認識手順と、認識した上記図形のうち１の図形又は複数の図形の組み合わせにより構成される文字候補を特定する文字候補特定手順と、特定された上記文字候補の特徴を上記一群の文字の各々の特徴と対比して得た一致率に基づき該文字候補がどの文字かを特定し、どの文字とも特定されなかった文字候補を不定の文字と認識する文字特定手順とを備え、概ね直線状に連続して配列されている、特定された上記文字及び上記不定の文字を、それらの文字で構成された文字列と認識する手順であるとよい。

【0010】

また、上記のいずれかの文字列読取方法において、上記文字列取得手順において、上記認識で得た第１文字列のうち上記取得したフォーマットに合致する箇所が複数あった場合、それらのうち、上記文字列認識手順における認識で文字の特徴との一致率が最も高かった箇所を上記第２文字列として取得するとよい。
さらに、上記文字列取得手順で上記フォーマットに合致する箇所が複数あった場合に、誤読の可能性がある旨を報知する報知手順を備えるとよい。

【0011】

あるいは、上記のいずれかの文字列読取方法において、上記認識で得た第１文字列のうち上記取得したフォーマットに合致する箇所が複数あった場合、それらのうち、上記第１文字列における文字の配列方向で見て、取得した上記画像の中央を含む箇所を上記第２文字列として取得するとよい。
さらに、上記文字列取得手順で上記フォーマットに合致する箇所が複数あった場合に、誤読の可能性がある旨を報知する報知手順を備えるとよい。

【0012】

また、上記のいずれかの文字列読取方法において、上記フォーマット取得手順で、出力すべき文字列のフォーマットを複数取得し、上記文字認識条件設定手順において、取得した上記複数のフォーマットのいずれかで規定される文字を全て含む一群の文字のみを特定することを文字認識条件として設定し、上記文字列取得手順において、上記認識で得た第１文字列のうち、取得した上記複数のフォーマットの少なくとも１つに合致する箇所を、上記第２文字列の候補として取得するとよい。

【0013】

さらに、上記文字列取得手順において、取得した上記候補の中で、上記取得に当たり最も長い文字数に亘り上記フォーマットとの合致が検出された候補を、上記第２文字列として取得するとよい。
また、上記のいずれかの文字列読取方法において、上記フォーマットは、文字列の加工規則を含むことができ、上記取得したフォーマットが上記加工規則を含む場合に、上記第２文字列を該加工規則に従って加工し、加工後の文字列を出力する出力手順を備えるとよい。

【0014】

また、この発明は、簡便で負荷の小さい処理により、撮像画像中の文字を認識する文字認識において誤読の可能性をオペレータに適切に報知できるようにすることを目的とした、以下の文字列読取方法も提供する。
この文字列読取方法は、画像取得部により読取対象物の画像を取得する画像取得手順と、上記画像中から読み取って出力すべき文字列のフォーマットを１又は複数取得するフォーマット取得手順と、取得した上記画像中の文字列を認識する文字列認識手順と、上記認識で得た第１文字列のうち、取得した上記１又は複数のフォーマットの１つである第１フォーマットに合致する箇所の第２文字列を、出力用に取得する文字列取得手順と、上記文字列取得手順で報知基準文字数未満の文字数の第２文字列を取得した場合に、誤読の可能性がある旨を報知する報知手順とを備えるものである。

【0015】

このような文字列読取方法が、取得した上記１又は複数のフォーマットが規定する文字列の最大文字数に基づき上記報知基準文字数を定める設定手順を備えるとよい。
あるいは、取得した上記１又は複数のフォーマットが規定する文字列の最大文字数を上記報知基準文字数と定める設定手順を備えるとよい。
また、上記のいずれかの文字列読取方法において、取得した上記１又は複数のフォーマットの少なくとも１つが、複数の区間に区切られた文字列を規定し、上記報知基準文字数は該区間ごとに定められ、上記報知手順が、上記文字列取得手順で、少なくとも１つの区間において該区間の文字数が該区間の報知基準文字数未満となっている第２文字列を取得した場合に誤読の可能性がある旨を報知する手順であるとよい。

【0016】

さらに、取得した上記１又は複数のフォーマットが規定する文字列の、上記各区間における最大文字数に基づき、上記各区間の上記報知基準文字数を定める設定手順を備えるとよい。
あるいは、取得した上記１又は複数のフォーマットが規定する文字列の、上記区間における最大文字数をそれぞれ、上記各区間の上記報知基準文字数と定める設定手順を備えるとよい。

【0017】

また、上記のいずれかの文字列読取方法が、文字列読取装置が実行する文字列読取方法であって、上記文字列読取装置が特定可能な文字のうち、取得した上記１又は複数のフォーマットで規定される文字を全て含む一群の文字のみを特定することを文字認識条件として設定する文字認識条件設定手順を備え、上記文字列認識手順において、上記取得した画像中の文字列を、設定した上記文字認識条件に従って認識するとよい。

【0018】

また、この発明は、撮像画像中の文字を認識する文字認識において誤読の可能性をオペレータに適切に報知できるようにすることを目的とした、以下の文字列読取方法も提供する。
この文字列読取方法は、画像取得部により読取対象物の画像を取得する画像取得手順と、取得した上記画像中に含まれる図形を認識する図形認識手順と、認識した上記図形の中から文字列を認識する文字列認識手順と、上記認識した文字列の内部又は近傍に文字を構成しない図形があると判断した場合に、誤読の可能性がある旨を報知する報知手順とを備えるものである。

【0019】

このような文字列読取方法が、上記文字列認識手順の上記認識で得た第１文字列のうち全部又は一部である第２文字列を、出力用に取得する文字列取得手順を備え、上記報知手順が、上記第２文字列の内部又は近傍に上記文字を構成しない図形があると判断した場合に、誤読の可能性がある旨を報知する手順であるとよい。
また、上記のいずれかの文字列読取方法において、上記文字列認識手順が、上記文字列を構成する文字の、配列方向と垂直な向きのサイズである高さを求める手順を備え、上記報知手順における上記判断において、上記高さ方向のサイズが、上記認識した文字列を構成する文字のサイズと比べて所定閾値以上小さい図形を無視するとよい。

【0020】

また、上記のいずれかの文字列読取方法において、上記文字列認識手順が、上記文字列を構成する文字の、配列方向と垂直な向きのサイズである高さを求める手順を備え、上記報知手順における上記判断において、上記高さ方向のサイズが、上記認識した文字列を構成する文字のサイズと比べて所定閾値以上大きい図形を無視するとよい。
また、上記のいずれかの文字列読取方法において、上記図形認識手順が、上記画像中に含まれる図形の、背景に対するコントラストを求める手順を備え、上記報知手順における上記判断において、上記認識した文字列を構成する図形と比べて背景に対するコントラストが所定閾値以上異なる図形を無視するとよい。

【0021】

また、上記のいずれかの文字列読取方法において、上記図形認識手順が、上記画像中に含まれる図形の、エッジのシャープさを求める手順を備え、上記報知手順における上記判断において、上記認識した文字列を構成する図形と比べてエッジのシャープさが所定閾値以上異なる図形を無視するとよい。
また、上記のいずれかの文字列読取方法において、上記文字列認識手順が、どの文字かを特定できた文字以外に、どの文字か特定できない文字候補も文字列を構成する文字として認識する手順であり、上記認識した文字列の端部から連続して並ぶ文字候補は上記文字を構成しない図形であるとして上記報知手順における上記判断を行うとよい。

【0022】

また、上記のいずれかの文字列読取方法が、文字列読取装置が実行する文字列読取方法であって、上記画像中から読み取って出力すべき文字列のフォーマットを取得するフォーマット取得手順と、上記文字列読取装置が特定可能な文字のうち、取得した上記フォーマットで規定される文字を全て含む一群の文字のみを特定することを文字認識条件として設定する文字認識条件設定手順とを備え、上記文字列認識手順において、上記取得した画像中の文字列を、設定した上記文字認識条件に従って認識し、上記文字列取得手順において、上記第１文字列のうち取得した上記フォーマットに合致する箇所を上記第２文字列として取得するとよい。

【0023】

また、上記のいずれかの文字列読取方法が、上記画像中から読み取って出力すべき文字列のフォーマットを１又は複数取得するフォーマット取得手順を備え、上記文字列取得手順において、上記第１文字列のうち、取得した上記１又は複数のフォーマットの１つである第１フォーマットに合致する箇所を上記第２文字列として取得し、上記報知手順が、上記文字列取得手順で報知基準文字数未満の文字数の第２文字列を取得した場合にも、誤読の可能性がある旨を報知する手順であるとよい。

【0024】

さらに、文字列読取装置が実行する文字列読取方法であって、上記文字列読取装置が特定可能な文字のうち、取得した上記１又は複数のフォーマットで規定される文字を全て含む一群の文字のみを特定することを文字認識条件として設定する文字認識条件設定手順を備え、上記文字列認識手順において、上記取得した画像中の文字列を、設定した上記文字認識条件に従って認識するとよい。

【0025】

また、この発明は、以上説明した方法の態様で実施する他、装置、システム、プログラム、プログラムを記録した記録媒体等、任意の態様で実施することができる。

【発明の効果】

【0026】

以上のような本発明の構成によれば、簡便で負荷の小さい処理により、撮像画像中の文字を認識する文字認識の精度を向上させることができる。

【図面の簡単な説明】

【0027】

【図1】図１は、この発明の文字列読取装置の第１実施形態である読取装置１００のハードウェア構成を示すブロック図である。

【図2】図２は、図１に示した読取装置１００が備える機能の構成を示す機能ブロック図である。

【図3】図３は、図１に示した読取装置が用いる出力フォーマットの例を示す図である。

【図4】図４は、読取装置１００のＣＰＵ１２１が実行する、文字列の読み取りに関する処理のフローチャートである。

【図5】図５は、図４に示した文字認識条件設定処理のフローチャートである。

【図6】図６は、図４に示した文字列認識処理のフローチャートである。

【図7】図７は、図４に示した出力文字列抽出処理のフローチャートである。

【図8】図８Ａ乃至図８Ｆは、図６の文字列認識処理により行われる文字認識の効果について説明するための図である。

【図9】図９Ａ乃至図９Ｃは、図７の出力文字列抽出処理により行われる出力文字列の抽出の効果について説明するための図である。

【図10】図１０は、この発明の文字列読取装置の第２実施形態である読取装置１００が備える機能の構成を示す、図２と対応する機能ブロック図である。

【図11】図１１は、第２実施形態の読取装置１００のＣＰＵ１２１が実行する、図４と対応する処理のフローチャートである。

【図12】図１２は、図１１に示した文字列認識処理のフローチャートである。

【図13】図１３Ａ及び図１３Ｂは、図１１の処理による誤読の可能性の報知について説明するための図である。

【図14】図１４Ａ及び図１４Ｂも、図１１の処理による誤読の可能性の報知について説明するための図である。

【図15】図１５は、この発明の文字列読取装置の第３実施形態である読取装置１００が備える機能の構成を示す、図２と対応する機能ブロック図である。

【図16】図１６Ａ乃至図１６Ｄは、文字を構成しない図形の例を示す図である。

【図17】図１７は、第３実施形態の読取装置１００のＣＰＵ１２１が実行する、図４と対応する処理のフローチャートである。

【図18】図１８は、図１７に示した図形存在判定処理のフローチャートである。

【図19】図１９Ａ乃至図１９Ｄは、図１７の処理による誤読の可能性の報知について説明するための図である。

【図20】図２０は、この発明の文字列読取装置の第４実施形態である読取装置１００が備える機能の構成を示す、図２と対応する機能ブロック図である。

【図21】図２１は、第４実施形態の読取装置１００のＣＰＵ１２１が実行する、図４と対応する処理のフローチャートである。

【図22】図２２は、図２１に示した出力文字列抽出処理のフローチャートである。

【図23】図２３は、この発明の文字列読取装置の第５実施形態である読取装置１００が備える機能の構成を示す、図２と対応する機能ブロック図である。

【図24】図２４は、第５実施形態の読取装置１００のＣＰＵ１２１が実行する、図４と対応する処理のフローチャートである。

【発明を実施するための形態】

【0028】

この発明の実施形態について、図面を参照しながら説明する。
〔第１実施形態：図１乃至図９Ｃ〕
まず、この発明の第１実施形態について説明する。
図１は、文字列読取装置の第１実施形態である読取装置１００のハードウェア構成を示すブロック図である。

【0029】

図１に示す読取装置１００は、読取対象１０１上の、光反射率が周囲と異なる文字列１０２を光学的に読み取るための装置であって、その読み取りに際して、読取対象１０１を撮像する撮像装置でもある。また、読取装置１００は、読取対象１０１上の、光反射率が周囲と異なる記号により示される１次元や２次元のコード記号を光学的に読み取るための光学的情報読取装置としての機能を備えていてもよい。
読取対象１０１は、静的に文字列１０２を担持する記録担体であってもよいし、動的にコード記号を表示する表示器であってもよい。

【0030】

図１に示すように、この読取装置１００は、光学部１１０、制御部１２０、操作部１３１、通知部１３２及び表示部１３３を備える。
これらのうち光学部１１０は、撮像センサ１１１、レンズ１１２、パルスＬＥＤ（発光ダイオード）１１３を備え、文字列１０２を含む読取対象１０１の画像を光学的に撮像するための撮像装置である。

【0031】

撮像センサ１１１は、読取対象１０１等の撮像対象の画像を撮像するための撮像部であり、例えばＣＭＯＳ（相補性金属酸化膜半導体）イメージセンサにより構成することができる。また、撮像センサ１１１は、撮像によりイメージセンサの各画素に蓄積した電荷に基づき、各画素の階調値を示す画像データを生成し、制御部１２０へ出力することができる。この撮像センサ１１１において、画素は二次元的に配置されている。

【0032】

レンズ１１２は、撮像センサ１１１上に撮像対象からの反射光を結像させるための光学系である。
パルスＬＥＤ１１３は、撮像センサ１１１による撮像対象へ照明光を照射するための照明部である。

【0033】

次に、制御部１２０は、ＣＰＵ１２１と、ＣＰＵ１２１が実行するプログラムや各種テーブル等のデータを記憶したＲＯＭ１２２と、ＣＰＵ１２１が各種の処理を実行する際の作業領域として使用するＲＡＭ１２３と、外部装置と通信を行うための通信Ｉ／Ｆ１２４とを備えている。

【0034】

ＣＰＵ１２１は、ＲＡＭ１２３を作業領域としてＲＯＭ１２２に記憶されたプログラムを実行することにより、光学部１１０、操作部１３１、通知部１３２及び表示部１３３を含む読取装置１００全体の動作を制御して、図２を用いて後述するものを始めとする、種々の機能を実現する。この機能には、撮像センサ１１１が撮像した画像の画像データに含まれる文字列１０２の識別、表示、外部への出力あるいは蓄積、誤読の可能性の検出及び報知などの処理が含まれ得る。
通信Ｉ／Ｆ１２４は、文字列１０２の識別結果を利用するデータ処理装置など、種々の外部装置と通信するためのインタフェースである。

【0035】

操作部１３１は、オペレータの操作を受け付けるためのボタンやトリガ等の操作手段である。通知部１３２は、オペレータヘの各種通知を行うための通知手段である。具体的な通知の方法としては、ディスプレイによるメッセージやデータの表示、ランプの点灯や点滅、スピーカによる音の出力等が考えられるが、これに限られることはない。表示部１３３は、読取装置１００が識別した文字列を表示するための表示手段であり、液晶ディスプレイ等により構成することができる。通知部１３２と表示部１３３とを共通のハードウェアとしてもよい。

【0036】

読取装置１００を外部装置からの制御あるいは自律制御により自動で動作させる場合には、操作部１３１、通知部１３２及び表示部１３３を設けなくてもよい。
以上の読取装置１００は、例えば手持ち型や据え置き型の、文字読取装置又は文字読取機能付きコード記号読取装置として構成することができるが、これらに限られることはない。ハードウェアの全部又は一部として、スマートフォンやパーソナルコンピュータのような、汎用のコンピュータを用いてもよい。

【0037】

以上の読取装置１００において、特徴的な点の一つは、画像中に含まれる文字列を認識する手法である。次に、この点について説明する。
まず、読取装置１００が備える文字列１０２の読み取りに関連する機能について説明する。
図２は、その機能の構成を示す機能ブロック図である。

【0038】

図２に示すように、読取装置１００は、撮像部１４１、図形認識部１４２、文字列認識部１４３、文字抽出部１４４、文字加工部１４５、出力部１４６、出力フォーマット設定部１４７、文字認識条件設定部１４８の機能を備える。これらの各部の機能は、ここで説明する例では、ＣＰＵ１２１がソフトウェアを実行することにより光学部１１０をはじめとする読取装置１００の各部を制御することにより実現するが、その一部又は全部を専用の制御回路により実現してもよい。

【0039】

図２に示す撮像部１４１は、光学部１１０を制御して撮像を行わせ、撮像で得られた画像データを取得し、取得した画像データを図形認識部１４２に渡す画像取得部の機能を備える。撮像の条件は、適宜公知の手法に従って定めればよい。

【0040】

図形認識部１４２は、撮像部１４１から渡された画像データ中に存在する図形を認識し、その認識した図形の情報を文字列認識部１４３に渡す機能を備える。図形の認識は、例えば画像中で画素値が急激に変動するエッジの位置を検出し、閉ループを形成するエッジで囲まれた領域が図形であると認識することで、行うことができる。その他、画像を２値化した上で背景と異なる値の画素が連続する箇所をラベリングする等、任意の公知の手法を採用することもできる。図形を認識した際、その位置（存在領域）、サイズ、典型的な画素値、エッジのシャープさを算出して記憶しておくとよい。図形の周囲の背景の典型的な画素値も、合わせて記憶しておくとよい。
図形認識部１４２は、認識した各図形のデータを文字列認識部１４３に渡す。

【0041】

文字列認識部１４３は、図形認識部１４２から渡された図形のデータに基づき、撮像部１４１が撮像した画像中に存在する文字列を認識し、その認識した文字列を文字抽出部１４４に渡す機能を備える。
文字列の認識は、例えば以下のように行うことができる。

【0042】

まず、同程度の大きさの図形が一列に並んでいる領域を抽出する。読取対象の文字列が特定の方向、例えば水平方向に並んでいると期待できる場合には、概ねその方向に並ぶ領域のみ抽出してもよい。
そして、抽出した領域内の１の図形や、近くに存在する複数の図形の組み合わせを文字候補図形として認識し、文字候補図形と予め登録されている文字とで特徴量を比較して、その文字候補図形が、最も一致率の高かった文字であると認識する。
そして、抽出した領域内で認識できた文字を繋げた文字列を、抽出した領域内に存在する文字列であると認識する。

【0043】

この処理において認識可能な文字は、特徴量の比較に用いる文字のみである。そして、特徴量の比較には、読取装置１００にデータが登録されている全ての文字を用いてもよい。しかし、読取装置１００では、文字認識条件として、登録されている文字の中でどの文字を特徴量の比較に用いるかを設定できるようにしている。例えば、数字のみを特徴量の比較に用いれば、画像中に他の文字が存在したとしても、その中で数字のみを、特定の文字として認識することができる。この点が、この実施形態の特徴の１つである。
また、文字候補図形のうち、どの文字の特徴量とも一致率の低いものは、どの文字であるか不明な不定の文字として認識することができる。ただし、例えば幅や高さが同じ領域内で認識できた文字とある程度異なる文字候補図形は、文字でない図形と認識してもよい。

【0044】

文字認識条件設定部１４８が上記の文字認識条件の設定を行う。その詳細は後述する。
文字抽出部１４４は、文字列認識部１４３から渡された文字列から、出力すべき文字列を抽出して文字加工部１４５に渡す文字列取得部の機能を備える。
文字加工部１４５は、文字抽出部１４４から渡された出力すべき文字列を、必要に応じて加工して、出力部１４６に渡す機能を備える。
出力部１４６は、通信Ｉ／Ｆ１２４や通知部１３２を用いて、文字加工部１４５から渡された文字列のデータを、データ処理装置等の外部装置へ出力すると共に、読取成功をオペレータに報知する機能を備える。オペレータヘの報知の方法は、ブザーや振動など、任意の方法で行うことができるし、報知不要の場合には行わなくてもよい。また、出力部１４６は、文字加工部１４５から渡された文字列を、表示部１３３に表示させる機能を備えてもよい。

【0045】

文字抽出部１４４における文字列の抽出及び文字加工部１４５における文字列の加工は、出力フォーマットに従って行う。
出力フォーマット設定部１４７がフォーマット取得部として機能し、オペレータの操作に従い又は自動的に、予め登録されている出力フォーマットのうち、どの出力フォーマットを使用するかを選択して設定する。

【0046】

図３に、出力フォーマットの例を示す。
図３に示すように、出力フォーマットは、文字抽出部１４４において抽出する出力すべき文字列を規定する抽出文字列と、その抽出文字列を加工して生成する、最終的に出力部１４６から出力する文字列を規定する加工後出力文字列とを含む。ＩＤは、個々の出力フォーマットを特定するための識別情報である。
読取装置１００は、このような出力フォーマットを任意の数記憶しており、出力フォーマット設定部１４７は、この中から１又は複数の任意の出力フォーマットを選択して、使用する旨を設定できる。

【0047】

抽出文字列及び加工後出力文字列は、例えば文字の種類と文字数により規定することができる。また、加工後出力文字列は、抽出文字列に従って抽出された文字列をどのように加工して出力するかを示す加工規則を、例えば抽出文字列のうちどの部分を出力するかにより規定することができる。
例えば、ＩＤ＝１の出力フォーマットでは、出力すべき文字列として数字４文字を抽出することが抽出文字列において規定され、また、この数字４文字を加工せずに出力することが加工後出力文字列において規定されている。抽出文字列と加工後出力文字列が同じであることは、文字加工部１４５における加工が不要であることを示す。

【0048】

文字の種類としては、数字や英字（英語アルファベット、大文字と小文字を分けてもよい）、記号といった、一般的に用いられる種類の他、上述の「不定の文字」も用いることができる。
例えば、ＩＤ＝２の出力フォーマットでは、出力すべき文字列として不定の文字３文字と数字４文字とが連続する文字列を抽出することが抽出文字列において規定され、また、このうち数字４文字の箇所を取り出す加工をして出力することが加工後出力文字列において規定されている。

【0049】

また、任意の文字を組み合わせて構成した文字群を、文字の種類として用いることもできる。アルファベットの「Ａ」、「Ｂ」、「Ｃ」の３文字を種類Ｘとして、抽出文字列を「種類Ｘが３文字」と規定する等である。さらに、ＩＤ＝３及びＩＤ＝４の出力フォーマットに見られるように、「ＩＤ：」といった固定の文字列が含まれる旨を規定することができる。ＩＤ＝３の抽出文字列は、「ＩＤ：」の後ろに数字が４文字続く文字列を規定している。
加工後出力文字列として、抽出文字列に何らかの文字を追加して出力することを規定してもよい。ＩＤ＝４の出力フォーマットでは、抽出文字列の数字４文字の前に、「ＩＤ：」の文字列を追加する加工をして出力することを規定している。

【0050】

また、１の出力フォーマットに、抽出文字列を複数規定してもよい。この場合、文字列認識部１４３から渡された文字列から、いずれかの抽出文字列に一致する箇所を抽出すべき旨を規定したことになる。さらに、抽出文字列の規定として、特殊な組み合わせで数字や記号等が並ぶことを規定できるようにしてもよい。例えば日付の書式を規定するフォーマットを作成する場合にこれを用いる。

【0051】

ＩＤ＝８の出力フォーマットにおける抽出文字列では、「ＹＹＹＹ」及び「ＹＹ」がそれぞれ、西暦の年を４桁及び２桁で表す数字列を示し、「ＭＭ」は暦の月を２桁又は１桁で表す数字列を示し、「ＤＤ」は暦の日を２桁又は１桁で表す数字列を示す。「／」、「－」、「□（スペース）」は、年月日を区切る区切り文字を示す。この場合、ＭＭやＤＤはどんな数字でもよいわけではなく、日付を表す組み合わせとして不適当な、例えばＭＭ＝０２、ＤＤ＝３１といった組み合わせの場合には抽出文字列に合致しないと判断する。

【0052】

このような複雑な出力フォーマットも、文字抽出部１４４が文字列の抽出に用いるアルゴリズム次第では採用可能である。
なお、ＩＤ＝８の加工後出力文字列では、抽出文字列のいずれに基づき文字列が抽出された場合でも、抽出された文字列を「ＹＹＹＹ－ＭＭ－ＤＤ」の書式に加工して出力すべきことが規定されている。

【0053】

また、後述の文字認識条件の設定に用いるため、抽出文字列と対応付けて、その抽出文字列の規定に従って特定の文字として抽出される可能性がある文字の情報を、出力フォーマットに含めておいてもよい。
例えば、抽出される可能性がある文字は、ＩＤ＝１の出力フォーマットでは数字のみである。ＩＤ＝５～７の出力フォーマットでは、英字と数字である。

【0054】

なお、不定の文字は、特定の文字ではないし、これを狙って検出することもできないので、「抽出される可能性がある文字」には含めない。従って、ＩＤ＝２の出力フォーマットでも、抽出される可能性がある文字は数字のみである。
ＩＤ＝３のように抽出文字列が固定の文字列を含む場合、その固定の文字列を構成する文字も、「抽出される可能性がある文字」になる。従って、ＩＤ＝３の出力フォーマットでは、抽出される可能性がある文字は、数字に加え、「Ｉ」、「Ｄ」、「：」の３文字である。

【0055】

また、ＩＤ＝８の出力フォーマットで抽出される可能性がある文字は、数字に加え、「／」、「－」、「□（スペース）」の３文字である。ここでは文字としてのどの文字であるかのみを考慮すればよいので、ＩＤ＝８における「Ｙ」や「Ｍ」や「Ｄ」も、単なる数字であると考えることができる。

【0056】

図２の説明に戻ると、文字認識条件設定部１４８は、出力フォーマット設定部１４７により設定されている出力フォーマットに基づき、文字列認識部１４３における文字列認識でどの文字を特定するかを規定する文字認識条件を設定する機能を備える。文字認識条件設定部１４８は、設定されている出力フォーマットが規定する抽出文字列に従って抽出される可能性がある文字を全て認識し得るように文字認識条件を設定する。

【0057】

例えば、抽出される可能性がある文字が数字のみであれば、少なくとも数字を全て認識し得るように文字認識条件を設定する。このためには、例えば、文字列認識において、少なくとも数字全てを文字候補図形と対比すべきことを設定する。このような設定を行うと、文字列認識において、画像中に含まれる数字は全て認識可能であるが、数字以外の文字は特定の文字として認識できないことになる（不定の文字として認識されることはあり得る）。一方、数字のみ認識できれば、文字抽出部１４４における、出力すべき文字列の抽出には支障がない。

【0058】

なお、数字に加え、数字以外の文字も文字候補図形と対比したとしても、数字の認識は可能と考えられ、このような設定も妨げられない。この場合でも、文字抽出部１４４における、出力すべき文字列の抽出には支障がない。
すなわち、読取装置１００が文字候補図形と対比すべきデータを保持している文字（すなわち特定可能な文字）のうち、使用する出力フォーマット中の抽出文字列で規定される文字を全て含む一群の文字のみを特定することを、文字認識条件として設定すればよい。

【0059】

文字候補図形と対比すべき一群の文字は、数字や英字といった一般的に用いられる種類を用いて規定する他、１文字ずつ任意に文字を特定して設定可能である。「Ｉ」、「Ｄ」、「：」といった特定の文字を追加したり、逆に除外したりすることができる。英字の中でＡ～Ｃのみなど、範囲を用いて規定することもできる。

【0060】

また、使用する出力フォーマットが複数設定されている場合は、それらのいずれかに従って抽出される可能性がある文字を全て含むように、上記一群の文字の範囲を定める。
例えば、ＩＤ＝３とＩＤ＝５の出力フォーマットを用いる場合、ＩＤ＝３の出力フォーマットに従って抽出され得る「Ｉ」、「Ｄ」、「：」、数字と、ＩＤ＝５の出力フォーマットに従って抽出され得る英字及び数字との和集合である、英字と数字と「：」を全て含むように、上記一群の文字の範囲を定める。

【0061】

次に、図４乃至図７を用いて、以上説明してきた機能を実現するための処理について説明する。ここで説明する処理は、この発明の文字列読取方法の第１実施形態に係る処理である。
まず図４に、読取装置１００において文字読取モードがＯＮになった場合にＣＰＵ１２１が実行する処理のフローチャートを示す。

【0062】

この処理において、ＣＰＵ１２１はまず、使用する出力フォーマットが設定されているか否か判断する（Ｓ１１）。過去の図４の処理で出力フォーマットが設定されていれば、この判断はＹｅｓとなる。一方、設定されていなければ、ＣＰＵ１２１は出力フォーマットの選択を受け付け、選択された出力フォーマットを取得して、その出力フォーマットを使用することを設定する（Ｓ１２）。予め用意されている出力フォーマットだけでなく、新たに作成したものを設定できるようにしてもよい。
以上のステップＳ１２の処理が、出力フォーマット取得手順の処理であり、出力フォーマット設定部１４７の機能と対応する。

【0063】

その後、ＣＰＵ１２１は文字認識条件設定処理を実行し、使用する出力フォーマットに応じた文字認識条件を設定する（Ｓ１３）。
この文字認識条件設定処理は、例えば図５に示すものである。

【0064】

図５の処理ではＣＰＵ１２１はまず、使用する出力フォーマットのいずれかで抽出文字列に数字が規定されていれば（Ｓ３１のＹｅｓ）、特定すべき文字、すなわち文字列認識において文字候補図形と対比すべき文字に、数字を追加する（Ｓ３２）。図５の処理開始時点では、特定すべき文字は定められていないとする。

【0065】

以下、同様に、英字、記号、区切り文字のそれぞれについて、使用する出力フォーマットのいずれかで抽出文字列に規定されていれば、特定すべき文字にその文字種を追加する（Ｓ３３～Ｓ３８）。区切り文字は、ここでは「／」、「－」、スペースの３文字とするが、これに限られない。また、上述したように、文字の種類毎だけでなく１文字単位で、特定すべき文字に対する追加や削除を行えるようにしてもよい。
以上の後ＣＰＵ１２１は、ステップＳ３８までの処理により定められる、特定すべき文字を規定した文字認識条件を作成し、有効にして（Ｓ３９）、元の処理に戻る。
以上の図５の処理が、文字認識条件設定手順の処理であり、文字認識条件設定部１４８の機能と対応する。

【0066】

図４の説明に戻ると、ステップＳ１３の後、またはステップＳ１１でＹｅｓの場合、ＣＰＵ１２１は、読取開始のトリガを検出するまで待機する（Ｓ１４）。このトリガとしては例えば、オペレータによる操作部１３１の操作や、通信Ｉ／Ｆ１２４に接続された外部装置から送信される信号を用いることができる。
トリガを検出すると、ＣＰＵ１２１は光学部１１０を制御して撮像を行い、画像データを取得する（Ｓ１５）。ステップＳ１５の処理は、画像取得手順の処理であり、撮像部１４１の機能と対応する。

【0067】

次に、ＣＰＵ１２１はステップＳ１５で取得した画像データに対し、文字列認識処理を行う（Ｓ１６）。
この文字列認識処理は、例えば図６に示すものである。

【0068】

図６の処理ではＣＰＵ１２１はまず、画像中で画素値が急激に変動するエッジを検出し、閉ループのエッジで囲まれた箇所を図形と認識する（Ｓ５１）。ここで認識される図形には文字を構成するものも、そうでないものも含まれる。このステップＳ５１の処理は、図形認識手順の処理であり、図形認識部１４２の機能と対応する。
次に、ＣＰＵ１２１は概ね一定の高さで直線状に配列されている図形のグループを、画像の中央に近い位置から順に探索する（Ｓ５２）。読み取りたい文字列は概ね一定の高さの文字が直線状に配列されたものであると想定されるので、このようなグループを構成する図形は、配列された文字を構成する図形の候補と考えられる。

【0069】

ここでいう高さとは、図形の配列方向と直交する方向である。また、例えば図８Ｂに示す「ｉ」や「：」のように、１文字が複数の図形で構成される場合には、小さいサイズの図形も文字を構成する可能性がある。従って、個々の図形の高さは領域の高さに近似している必要はないし、グループ内の全ての図形が直線状に並んでいる必要もない。

【0070】

また、中央に近い位置から順に探索するのは、読取装置１００のオペレータは、読み取りたい文字列が撮像範囲の中央に来るように読取装置１００や読取対象１０１を移動させて読み取りを実行することが通常と考えられるためである。中央に近い位置から順に探索することで、最初に検出して後述のように図７の出力文字列抽出処理に進む文字列が、オペレータが読み取りたい文字列である可能性を高めることができる。しかし、中央に近い位置から探索することは必須ではない。逆に、ステップＳ５１の図形の認識も、グループの探索と合わせて画像の中央に近い位置から順に行ってもよい。

【0071】

いずれにせよ、ステップＳ５２の探索で新たなグループを検出すると（Ｓ５３のＹｅｓ）、ステップＳ５４以下の処理に進む。
そして、ＣＰＵ１２１はまず、検出したグループ内の未確定の図形を端から１つ選択して処理対象とする（Ｓ５４）。文字の記載順と同じく、左書きが想定される場合には左端から選択すればよい。

【0072】

次に、ＣＰＵ１２１は、処理対象の図形の特徴と、文字認識条件で規定される特定すべき文字の特徴とをそれぞれ比較する（Ｓ５５）。この比較は、画像同士で行っても、画像から算出される特徴量同士で行ってもその両方でもよい。
そして、比較結果の一致率が、文字の特定に十分な値として定めた閾値を超えた文字があった場合（Ｓ５６のＹｅｓ）、ＣＰＵ１２１は、処理対象の図形はその中で一致率が最も高かった文字であると認識し、図形と文字の対応関係及び一致率を記憶する（Ｓ５７）。

【0073】

一方、ステップＳ５６でＮｏの場合、処理対象の図形を文字と認識することはできない。この場合、ＣＰＵ１２１は、グループ内の次の図形を処理対象の図形に結合すると、処理対象の図形全体の幅が規定値を超えるか否か判断する（Ｓ５８）。規定値は、例えば、標準的な文字が取り得る上限の縦横比を、領域の高さに乗じて求めることができる。
ステップＳ５８でＮｏの場合、現在の処理対象の図形を次の図形と結合させても文字候補となり得ることから、それらを結合させて次の処理対象とし（Ｓ５９）、ステップＳ５５に戻って処理を繰り返す。

【0074】

ステップＳ５８でＹｅｓの場合、処理対象の図形を次の図形と結合させると文字ではなくなってしまうと考えられることから、結合をせずに処理対象の図形の取り扱いを決定すべく、処理対象の図形の高さが所定範囲内か否か判断する（Ｓ６０）。この所定範囲は、例えば、領域中の高さに対する文字の高さの比率として標準的な文字が取り得る値を、領域の高さに乗じて求めることができる。また、領域内での図形の高さ方向の位置を合わせて考慮してもよい。「・」など、高さの極めて小さい文字もあり得るためである。

【0075】

ステップＳ６０でＹｅｓである場合、ＣＰＵ１２１は、処理対象の図形はどの文字であるかを特定できないだけで何らかの文字であると判断し、処理対象の図形は不定の文字であると認識する（Ｓ６１）。文字認識条件により特定すべき文字を絞っているので、特定できない文字があることは当然に想定される。また、そもそも読取装置１００に登録されていない文字も、特定することができない文字となる。

【0076】

一方、ステップＳ６０でＮｏである場合、ＣＰＵ１２１は、処理対象の図形は文字でないと判断し、そのように認識する（Ｓ６２）。
以上のステップＳ５７、Ｓ６１、Ｓ６２の何れかの処理により、処理対象の図形に関する処理が完了するので、処理はステップＳ６３に進み、グループ内に次の図形がある限りは（Ｓ６３のＹｅｓ）、ステップＳ５４に戻って処理を繰り返す。

【0077】

ステップＳ６３でＮｏとなると、ＣＰＵ１２１は、ここまでに認識した各文字を配置順に繋げて、ステップＳ５３で検出したグループと対応する文字列として認識する。また、文字列内の文字間に、認識できた文字と同程度の幅の空白がある場合、その空白を空白文字（スペース）として認識する（Ｓ６４）。ｎを自然数として、文字のｎ倍程度の幅の空白をｎ個の空白文字として認識してもよい。
ステップＳ６４の後は、すなわち、画像中に文字列を１つ認識すると、文字列認識処理は一旦終了し、元の処理に戻る。
ステップＳ５２の探索で新たなグループが検出できない場合、ステップＳ５３の判断がＮｏとなる。所定時間、所定試行回数等を基準とすればよい。この場合も、文字列認識処理は終了し、元の処理に戻る。
ステップＳ５２乃至Ｓ６４の処理は、文字列認識手順の処理であり、文字列認識部１４３の機能と対応する。この処理は、文字候補特定手順と文字特定手順の処理を含むものである。

【0078】

図４の説明に戻ると、ステップＳ１６の後ＣＰＵ１２１は、ステップＳ１６で新たな文字列を認識していれば（Ｓ１７のＹｅｓ）、認識した文字列を処理対象として、出力文字列抽出処理を行う（Ｓ１８）。
この出力文字列抽出処理は、例えば図７に示すものである。

【0079】

図７の処理ではＣＰＵ１２１はまず、ステップＳ１２で設定されている各出力フォーマットにつき、ステップＳ１６で新たに認識された文字列（第１文字列）の中で、設定されている各出力フォーマットが規定する抽出文字列の条件の少なくとも１つに合致する箇所を全て検出し、出力文字列（第２文字列）の候補リストに入れる（Ｓ８１）。このとき、処理対象の文字列中に条件に合致する箇所がない場合には、候補は１つも検出されない。逆に、複数の箇所が検出されることもある。また、候補リストには、条件に合致した箇所の文字列と対応付けてどの出力フォーマットの条件に合致したかの情報も登録しておき、ステップＳ８９で出力する。

【0080】

ステップＳ８１で検出した候補リストの要素が１つだけであれば（Ｓ８２のＹｅｓ）、ＣＰＵ１２１は該当の１つの候補を出力文字列として採用し（Ｓ８９）、出力文字列抽出処理を終了して元の処理に戻る。必須ではないが、想定通りの読み取りが行われた場合にステップＳ８２がＹｅｓになるように出力フォーマットを設定することが、誤読防止の観点からは好ましい。

【0081】

一方、ステップＳ８２でＮｏの場合、ＣＰＵ１２１は、候補リストから、文字数が最大でない要素を除外する（Ｓ８３）。逆に言えば、文字数が最大の要素のみを候補リストに残す。そして、候補リストに残った要素が１つだけであれば（Ｓ８４のＹｅｓ）、ＣＰＵ１２１は該当の１つの候補を出力文字列として採用し（Ｓ８９）、元の処理に戻る。

【0082】

ステップＳ８３及びＳ８４の処理により、複数の出力フォーマットについてそれぞれ該出力フォーマットと合致する箇所があったとしても、最も長い範囲で第１文字列と一致する出力フォーマットと合致する出力文字列として抽出することができる。
長い範囲で第１文字列と合致する出力フォーマットは、短い範囲で合致する出力フォーマットに比べ、誤読が原因で誤って合致している可能性が低いと考えられるし、出力文字列の候補となる箇所も少ないと考えられるので、優先的に採用することで、オペレータが実際に読み取りたい箇所を出力文字列として適切に抽出できると考えられる。

【0083】

一方、ステップＳ８４でＮｏになるのは、文字数が同じ要素が複数あり、文字数ではこれらを区別できない場合である。典型的には、第１文字列中に、抽出文字列の文字数が最大の出力フォーマットと合致する箇所が複数箇所あった場合である。
ステップＳ８４でＮｏになると、ＣＰＵ１２１は、候補リストから、文字列中の文字の配列方向で見て、画像の中央を含まない要素を除外する（Ｓ８５）。逆に言えば、画像の中央を含む要素のみを候補リストに残す。そして、候補リストに残った要素が１つだけであれば（Ｓ８６のＹｅｓ）、ＣＰＵ１２１は該当の１つの候補を出力文字列として採用し（Ｓ８９）、元の処理に戻る。このことで、第１文字列中に出力フォーマットと合致する箇所が複数あった場合に、画像の中央に近い箇所を出力文字列として抽出することができる。

【0084】

ステップＳ８５では、例えば文字が水平方向に配列されている場合、水平方向で見て文字列が画像の中央の位置を含んでいれば、垂直方向では画像の中央の位置を含んでいなくても、「中央を含む」と判断する。
オペレータが読み取り対象の文字列１０２を撮像する場合、実際に読み取りたい箇所が撮像範囲の中央に来るように撮像することが想定されるので、画像の中央に近い箇所の候補を優先的に採用することで、見切り等で生じた意図しない一致箇所ではなく、実際に読み取りたい箇所を出力文字列として適切に抽出できると考えられる。画像全体で中央に近い文字列を優先することは図６のステップＳ５２で考慮しているので、Ｓ８５では文字の配列方向の位置のみを考慮すれば足りる。

【0085】

一方、ステップＳ８６でＮｏになるのは、画像の中央を含む要素が複数あり、文字数でも中央か否かでもこれらを区別できない場合である。典型的には、例えば抽出文字列が数字４文字であるのに対し、認識された文字列中に「１２３４５」のように数字５文字が連続する箇所が含まれ、このうち「１２３４」と「２３４５」のように少し（この例では１文字）ずれた複数の箇所が検出され、そのいずれもが画像の中央を含む場合である。この場合、どちらの箇所がより中央に近いかを数値上区別することはできるが、このような微妙な違いがオペレータの意図を反映しているとは限らない。そこで、図７の処理では、「中央を含む」の基準で区別できない場合には、位置以外の基準での区別を試みている。

【0086】

ステップＳ８６でＮｏになると、ＣＰＵ１２１は、候補リストから、文字列認識時の一致率が最大でない要素を除外する（Ｓ８７）。逆に言えば、一致率が最大の要素のみを候補リストに残す。そして、候補リストに残った要素が１つだけであれば（Ｓ８８のＹｅｓ）、ＣＰＵ１２１は該当の１つの候補を出力文字列として採用し（Ｓ８９）、元の処理に戻る。このことで、第１文字列中に出力フォーマットと合致する箇所が複数あった場合に、一致率が最も高かった箇所を出力文字列として抽出することができる。

【0087】

要素に複数の文字が含まれる場合、要素全体の一致率は、それら複数の文字に関する値に基づき、平均値、最大値など、適宜な手法で定めればよい。また、一致率の大小を比べる場合、所定誤差範囲内は一致とみなしたり、値をクラス分けした上で同クラスに属する要素は一致率が同じとみなしたりしてもよい。
一般に、誤読が発生した箇所では一致率が低くなると考えらえるため、このように一致率が高い候補を優先的に採用することで、誤読の発生により出力フォーマットと対応する箇所が想定外に複数生じてしまっているケースでも、文字が正しく認識された箇所を出力文字列として抽出できると考えられる。

【0088】

ステップＳ８８でもＮｏとなるのは、文字数、画像中の位置及び一致率のいずれによっても区別できない要素が複数ある場合である。この場合、妥当な出力文字列を一意に特定できないため、抽出エラーを返して（Ｓ９０）、元の処理に戻る。
なお、ステップＳ８１で検出された候補がゼロである場合も、ステップＳ８２、Ｓ８４、Ｓ８６、及びＳ８８の判断は全てＮｏとなる。この場合も、ステップＳ９０で抽出エラーを返して元の処理に戻ればよい。この場合の抽出エラーは、複数の要素（候補）が区別できなかった場合と別のエラーとしてもよい。
以上の図７の処理が、文字列取得手順の処理であり、文字抽出部１４４の機能と対応する。

【0089】

図４の説明に戻ると、ステップＳ１８の後ＣＰＵ１２１は、出力文字列抽出処理での抽出が成功したか否か判断する（Ｓ１９）。この判断は、抽出エラーの場合にＮｏとなり、出力文字列が採用できていればＹｅｓとなる。
ステップＳ１９でＮｏの場合、処理はステップＳ１６に戻り、再度文字列認識処理を行う。このとき、それまでに行ったステップＳ５１の図形認識の結果やステップＳ５２の探索の履歴は適宜活用する。この処理で新たな文字列が認識されれば、ステップＳ１７がＹｅｓとなるのでその文字列を処理対象としてステップＳ１８の出力文字列抽出処理を再度実行する。
一方、ステップＳ１７でＮｏであれば、ステップＳ１５に戻り再度撮像からやり直す。所定のリトライ回数を超えた場合には、読み取りエラーを返してステップＳ１４に戻ってもよい。

【0090】

ステップＳ１９でＹｅｓの場合、ＣＰＵ１２１は、図７の処理で採用した出力文字列を、対応する出力フォーマット中の加工後出力文字列の規定に従い必要に応じて加工する（Ｓ２０）。この処理は加工手順の処理であり、文字加工部１４５の機能と対応する。
そして、ＣＰＵ１２１は、加工後の出力文字列のデータを出力して（Ｓ２１）、１回の読み取りに係る処理を終了し、ステップＳ１４に戻って処理を繰り返す。ステップＳ２１の処理は出力手順の処理であり、出力部１４６の機能と対応する。

【0091】

次に、図８Ａ乃至図９Ｃを用いて第１実施形態の効果について説明する。
まず一例として、図８Ａに示すような、「ｉｄ：」の文字に続けて数字４桁の番号（図８Ａの例では「１２３４」）が文字列２１として印刷された読取対象物から、数字４桁の番号を読み取る場合を考える。

【0092】

この場合、文字列２１を撮像した画像に対して図６のステップＳ５１のように図形認識を行うと、正しく認識された場合、各文字の輪郭で構成される図８Ｂに示すような図形グループ２２が検出される。この図形グループ２２は図８Ｃに示すように概ね高さｈの領域内において直線状に配列された図形により構成されるものであり、図形グループ２２は図６のステップＳ５２の探索で検出される。
そして、この図形グループ２２に対して図６のステップＳ５４乃至Ｓ６４の処理により文字列認識を行うことで、文字列２１を構成する各文字及びそれらにより構成される文字列を認識することができる。しかし、この時用いる文字認識条件により、実際に認識される文字列は異なる。

【0093】

図８Ｃは、英字と数字を特定する旨の文字認識条件を用いた場合の認識例である。
文字認識処理において、左端の「ｉ」を構成する２つの図形（点と棒）はステップＳ５９で結合されて１つの文字候補図形（ステップＳ５５での処理対象）２３ａとなり、「：」を構成する２つの図形（２つの点）も同様に結合されて１つの文字候補図形２３ｂとなる。「ｄ」や「４」も、外側の輪郭に囲まれる図形と内側の輪郭に囲まれる図形は別の図形だが、ここでは１つの文字候補図形として認識する。

【0094】

あるいは、他の図形（輪郭）の内部に包含される別の図形があった場合に、先に外側の図形のみを処理対象として図６のステップＳ５５で文字の特徴と比較し、その結果一致率が閾値以上（かつ最大）になった文字があれば、その時点で、外側の図形と内側の図形の双方を、当該文字を構成する図形として確定させてしまうことも考えられる。また、外側の図形と内側の図形の組を再度文字の特徴と比較し、その結果により一致率（及び文字との対応関係）を更新することも考えられる。

【0095】

いずれにせよ、英字と数字は図６のステップＳ５６で正解の文字との一致率が閾値を超えると考えられるので、「ｉ」、「ｄ」、「１」、「２」、「３」、「４」の文字は正しく特定される。図８Ｃにはこの時の一致率の値の一例も示している。一方、「：」はステップＳ５５で比較する文字に含まれないことから、ステップＳ５６はＮｏとなり、最終的にステップＳ６１で不定の文字であると認識される。図８Ｃでは不定の文字は「？」で示している。従って、文字列２１は、「ｉｄ？１２３４」の文字列と認識される。

【0096】

一方、図８Ｄは、数字を特定する旨の文字認識条件を用いた場合の認識例である。
この場合、「１」、「２」、「３」、「４」の文字は正しく特定されるが、「：」に加え「ｉ」と「ｄ」も、ステップＳ５５で比較する文字に含まれないことから、不定の文字として認識される。従って、文字列２１は、「？？？１２３４」の文字列と認識される。

【0097】

ここで、読み取りたい文字列は数字４桁であることから、出力フォーマットは図３に示したＩＤ＝１のものを用いることができる。
そうすると、図８Ｃと図８Ｄのいずれの場合も、認識された文字列中に出力フォーマットの抽出文字列と合致する箇所は「１２３４」の１箇所のみであるから、これを出力文字列として抽出し、出力することができる。もちろん、記号まで特定することとしても同様である。

【0098】

しかし、設定された出力フォーマットから、実際の読み取りたい文字は数字のみであることがわかるので、文字認識条件として数字のみを特定することを設定しておけば、文字認識処理における、特にステップＳ５５の処理負荷を低減し、より少ない負荷で、文字認識を行うことができる。
また、撮像条件によっては、撮像時のブレや白飛び、影の映り込み等により、実際の文字列２１とやや異なる画像が撮像され、図形認識の結果も実際の文字とやや異なる形状となる場合もある。

【0099】

図８Ｅ及び図８Ｆは、符号２３ｄで示すように、「１」の文字が実際とやや異なる形状の図形として認識された場合の例である。この形状は、「１」よりもむしろ英字の「Ｉ」の文字に近い（一致率が高い）とする。
この場合、英字と数字を特定する旨の文字認識条件が設定されていると、図８Ｅに示すように「１」の文字が「Ｉ」と認識されてしまう。そうすると、文字列２１は、「ｉｄ？Ｉ２３４」と認識され、出力フォーマットの出力文字列と合致する箇所がないことになる。

【0100】

一方、数字を特定する旨の文字認識条件が設定されていると、「Ｉ」との比較は行わないため、「１」との一致率が最大となると考えられる。この一致率がステップＳ５６の閾値を超える程度であれば、図８Ｆに示すように「１」が正しく認識されることになり、図８Ｃや図８Ｄの場合と同様に、「１２３４」を抽出して出力することができる。

【0101】

このように、文字認識条件を設定し、出力フォーマットに基づき特定の文字であると識別する必要がある文字に絞って図形との対比を行うことで、撮像条件が理想的でない場合でも、出力すべき文字を正しく認識し、実質的な文字認識の精度を上げることができる。
なお、対比する文字を数字に絞ることで、図８Ｅのケースと逆に、例えば「ｉ」を「１」と誤認識する可能性が多少上がることも考えられる。しかし、図８Ａ乃至図８Ｆの例では、この誤認識が起こり、「１ｄ？１２３４」の文字列が認識されたとしても、出力される文字列に影響はない。
こういった誤認識が問題になりそうなケースでは、後述する第２乃至第４実施形態の誤認識の可能性報知の機能と組み合わせることで、誤認識による利便性低下を抑えつつ、精度向上や処理負荷低減の効果を享受できる。

【0102】

また、数字４桁が単独で印刷されている箇所と区別して文字列２１中の数字４桁を読み取りたい場合、図３のＩＤ＝２の出力フォーマットを用いることもできる。この場合、図８Ｄ及び図８Ｆのように文字列２１が「？？？１２３４」と認識されると、その全体が抽出文字列と整合し、出力文字列として抽出される。そして、加工後出力文字列に沿って数字４文字の「１２３４」の部分のみの文字列に加工して出力することができる。

【0103】

単に「１２３４」のみの文字列を読み取っても、不定の文字列がないため抽出文字列と整合しないので、出力文字列として抽出されることはない。
このように、英字や記号を特定の文字として認識しない場合でも、不定の文字として認識することで、英字や記号の存在を前提とした抽出が可能となる。

【0104】

なお、「ｉ」や「：」の文字は誤認識が発生しやすく、正しく「不定の文字」として認識されない可能性もある。このことを考慮し、抽出文字列を、「任意の１文字＋不定の文字１～２文字＋数字４文字」といったように規定することも考えられる。「任意の１文字」は、不定の文字でも特定の文字（例えば「１」）でもよい、という意味である。「不定の文字１～２文字」は、「：」が認識されず、文字列２１が「１？１２３４」のように認識されるケースを考慮したものである。

【0105】

次に、図９Ａのように読取対象１０１上に２段で記載された文字列を両方読み取りたい場合を考える。上段は英字３文字＋数字４文字で、下段は数字４文字のみである。この場合、抽出文字列が「英字３文字＋数字４文字」と規定されている出力フォーマット（フォーマットＡ１）と「数字４文字」と規定されている出力フォーマット（フォーマットＡ２）を設定しておき、上段と下段の文字列に順次照準を合わせてそれぞれ読取開始トリガを与えることで、上段と下段の文字列をそれぞれ読みとることができる。

【0106】

例えば、下段の文字列を読み取りたい場合、符号２１の位置付近が撮像範囲の中央に来る状態で読み取りを行うことが通常と考えられる。そうすると、図６のステップＳ５２で下段の文字列に該当する図形のグループがまず抽出され、ステップＳ５４以降で認識された「５６７８」の文字列を先に処理対象として、図７の処理を行う。そうすると、フォーマットＡ１，Ａ２の双方が有効であり、認識された文字列をステップＳ８１でこれら双方と対比したとしても、出力文字列の候補リストに入るのは符号２２で示す「５６７８」の１つのみであるので、これが出力文字列として採用される。

【0107】

一方、上段の文字列を読み取りたい場合、符号２３の位置付近が撮像範囲の中央に来る状態で読み取りを行うことが通常と考えられる。そうすると、図６のステップＳ５２で上端の文字列に該当する図形のグループがまず抽出され、ステップＳ５４以降で認識された「ＡＢＣ１２３４」の文字列を先に処理対象として、図７の処理を行う。出力文字列の候補リストには、フォーマットＡ１と対応する符号２４の「ＡＢＣ１２３４」とフォーマットＡ２と対応する符号２５の「１２３４」の２つが入る。しかし、ステップＳ８３の処理で「１２３４」が除外されて候補が１つとなるので、「ＡＢＣ１２３４」が出力文字列として採用される。
このように、図７のステップＳ８２の処理を行うことで、複数の出力フォーマットに当てはまってしまうような文字列があった場合でも、オペレータの意図に合った読み取りを適切に行うことができる。

【0108】

次に、図９Ｂのように一行に記載された文字列の一部分のみを読み取りたい場合を考える。この文字列は英字３文字＋数字４文字だが、そのうち数字４文字の部分を読み取りたいとする。この場合、抽出文字列が「数字４文字」と規定されている出力フォーマット（フォーマットＢ）を設定しておけばよい。
また、符号２６で示すような文字列全体の中心付近や、符号２７で示すような読み取りたい箇所の中心付近が撮像範囲の中央に来る状態で読み取りを行うことが通常と考えられる。

【0109】

そうすると、図６のステップＳ５２で文字列全体に該当する図形のグループが抽出される。ステップＳ５４以降で正しく文字が認識されたとすると、「ＡＢＣ１２３４」の文字列を処理対象として、図７の処理を行う。そして、フォーマットＢに該当して出力文字列の候補リストに入るのは、符号２８で示す「１２３４」の１つのみであるので、これが出力文字列として採用される。

【0110】

一方、例えば図６の文字列認識処理において、図９Ｂに破線で示すように「Ｃ」の開口部が繋がって撮影され、「Ｃ」の文字が「０」と誤認識されたとする。そうすると、図７の処理の対象となるのは「ＡＢ０１２３４」の文字列であり、出力文字列の候補リストには、符号２８で示す「１２３４」の他、符号２９で示す「０１２３」も入ることになる。
これらは文字数が等しいためステップＳ８３では双方残るし、画像の中央が符号２６と２７のいずれであっても、文字列中に画像の中央を含むのでステップＳ８５でも双方残る。しかし、「０１２３」中の「０」は誤認識のため一致率が低いと考えられ、ステップＳ８７では「０１２３」が除外されて、符号２８で示す「１２３４」のみが候補リストに残り、出力文字列として採用されることになる。

【0111】

このように、図７のステップＳ８７の処理を行うことで、誤読により意図せず出力フォーマットに当てはまってしまう箇所が生じた場合でも、その箇所が出力文字列として採用される可能性を下げ、オペレータの意図に合った読み取りを高頻度で行うことが期待できる。

【0112】

次に、図９Ｃのように一行に記載された文字列の一部分のみを読み取りたい場合を考える。この文字列は英字３文字＋数字３文字＋ハイフン＋数字４文字だが、そのうち末尾の数字４文字の部分を読み取りたいとする。この場合も、抽出文字列が「数字４文字」のフォーマットＢを設定しておけばよい。
この場合には、読み取りたい箇所に比して記載された文字列が長いため、符号３１で示すような読み取りたい箇所の中心付近が撮像範囲の中央に来る状態で読み取りを行うことが通常と考えられる。

【0113】

この場合でも、図６のステップＳ５２では文字列全体に該当する図形のグループが抽出され、文字列全体を処理対象として、図７の処理を行う。そして、文字列が正しく認識されれば、フォーマットＢに該当して出力文字列の候補リストに入るのは符号３２で示す「４５６７」の１つのみであるので、これが出力文字列として採用される。

【0114】

一方、図９Ｂの場合と同様に「Ｃ」の文字が「０」と誤認識されたとすると、出力文字列の候補リストには、符号３２で示す「４５６７」の他、符号３３で示す「０１２３」も入ることになる。
これらは文字数が等しいためステップＳ８３では双方残るが、「０１２３」は文字列中に画像の中央を含まないのでステップＳ８５で除外され、符号３２で示す「４５６７」のみが候補リストに残り、出力文字列として採用されると考えられる。
このように、図７のステップＳ８５の処理を行うことでも、誤読により意図せず出力フォーマットに当てはまってしまう箇所が出力文字列として採用される可能性を下げ、オペレータの意図に合った読み取りを高頻度で行うことが期待できる。

【0115】

なお、図７の処理において、出力文字列を採用するに当たり、文字数、一致率、画像中の位置の３つの要素を考慮しているが、このうち一部を考慮するのみでも、そのことによる効果を得ることができる。また、各要素を考慮する順序は、図７に示した順が好ましいが、異なる順序としてもよい。

【0116】

〔第２実施形態：図１０乃至図１４Ｂ〕
次に、この発明の第２実施形態について説明する。
第２実施形態の読取装置１００は、文字認識条件を使用しない点と、出力文字列抽出処理で抽出した文字列の文字数（桁数）が報知基準文字数未満である場合に誤読の可能性を報知するようにした点が第１実施形態と異なる。その他の点は第１実施形態と共通であるので、相違点に関連する事項について説明し、共通箇所の説明は適宜に省略する。また、第２実施形態の説明において、第１実施形態の構成と共通の又は対応する箇所には第１実施形態と共通の符号を用いる。この点は第３実施形態以降も同様である。

【0117】

まず、第２実施形態の読取装置１００が備える文字列１０２の読み取りに関連する機能について説明する。
図１０は、その機能の構成を示す、図２と対応する機能ブロック図である。
図１０に示すように、第２実施形態の読取装置１００は、図２の文字認識条件設定部１４８に代えて、基準文字数設定部１５１、文字数判定部１５２、報知部１５３を備える。また、文字列認識部１４３は、文字認識条件を用いずに文字列認識を行うが、この点については図１２を用いて後述する。

【0118】

基準文字数設定部１５１は、使用する旨が設定されている出力フォーマットに基づき、誤読可能性の報知を行うか否かの基準とする報知基準文字数を設定する機能を備える。
文字数判定部１５２は、文字抽出部１４４が抽出した出力文字列の文字数を取得し、これが設定されている報知基準文字数未満である場合に、報知部１５３に対して誤読可能性の報知を指示する機能を備える。
報知部１５３は、文字数判定部１５２からの指示に基づき通知部１３２を制御して、光や音、メッセージやマークの表示等の任意の手段により、今回の読み取りにおいて文字列の誤読が発生した可能性がある旨を、読取装置１００のオペレータに報知する機能を備える。この報知は、出力部１４６による文字列の出力あるいは読み取り成功の報知と同期して行うとよい。

【0119】

次に、図１１及び図１２を用いて、以上説明してきた機能を実現するための処理について説明する。ここで説明する処理は、この発明の文字列読取方法の第２実施形態に係る処理である。
まず図１１に、読取装置１００において文字読取モードがＯＮになった場合にＣＰＵ１２１が実行する、図４と対応する処理のフローチャートを示す。

【0120】

図１１の処理は、ステップＳ１２の後にステップＳ１３が無い点と、ステップＳ１６に代えてステップＳ１６′を実行する点と、ステップＳ１９でＹｅｓの場合にステップＳ２０の前にステップＳ１０１乃至Ｓ１０３を実行する点が、図４と異なるのみである。
まず、ステップＳ１３が無い点は、文字認識条件を用いないことと対応する。

【0121】

ステップＳ１６′の文字列認識処理は図１２に示すものであるが、この処理は図６の処理とほぼ共通であり、ステップＳ５５に代えてステップＳ５５′を実行する点が異なるのみである。その相違も、文字認識条件を考慮しない点が異なるのみである。ステップＳ５５′では、処理対象の図形の特徴と、特定すべき各文字の特徴とをそれぞれ比較する。
特定すべき文字は、例えば、読取装置１００がデータを持っている文字全てである。しかし、常に全ての文字と比較することまでは必須ではなく、オペレータの設定により、特定すべき文字を一部に限ることも妨げられない。文字認識条件を考慮しないため、使用する出力フォーマットに応じて特定すべき文字を動的に定める必要がないだけである。

【0122】

また、図１１の処理で、ステップＳ１９でＹｅｓの場合、ＣＰＵ１２１は、ステップＳ１８の出力文字列抽出処理で使用した各出力フォーマットが規定する抽出文字列の文字数に基づき報知基準文字数を設定する（Ｓ１０１）。ステップＳ１０１の処理は、設定手順の処理であり、基準文字数設定部１５１の機能と対応する。

【0123】

次に、ＣＰＵ１２１は、出力文字抽出処理で報知基準文字数未満の文字列を抽出した場合には（Ｓ１０２のＹｅｓ）、通知部１３２を制御してオペレータへ誤読の可能性がある旨を報知する（Ｓ１０３）。ステップＳ１０２及びＳ１０３の処理は報知手順の処理であり、文字数判定部１５２及び報知部１５３の機能と対応する。
その後、処理はステップＳ２０に進む。ステップＳ１０２でＮｏであれば、報知は行わずにステップＳ２０へ進む。

【0124】

以上の処理により行う誤読可能性の報知は、基本的には、複数の出力フォーマットを使用する場合を想定し、抽出文字列の文字数が少ない方の出力フォーマットに従った出力が行われた場合に、誤読により想定していない位置の文字列が出力された可能性を報知するものである。しかし、報知基準文字数の設定により、より複雑な条件での報知も可能である。次に、図１３Ａ乃至図１４Ｂ及び表１乃至表３を参照しつつ、この点について説明する。

【0125】

まず一例として、抽出文字列が「英字３文字＋数字３文字」のフォーマットＣと、「数字４文字」のフォーマットＤの２つの出力フォーマットを使用する場合を考える。
このとき、図１３Ａに示すように画像の撮像範囲４０内に配列された文字列「ＡＢＣ１２３」を撮像し、その画像が正しく文字列認識された場合、その全体の文字列４１がフォーマットＣに合致し、出力文字列として抽出される。また、フォーマットＤに合致する出力文字列は存在しない。

【0126】

他方、図１３Ｂに破線で示すように「Ｃ」の開口部が繋がって撮影され、これが「０」と誤認識されたとすると、文字列は「ＡＢ０１２３」と認識される。そうすると、フォーマットＣに合致する出力文字列はなく、破線で示す文字列４２がフォーマットＤに合致する。従って、誤読が起こったために、本来無いはずの、フォーマットＤに合致する文字列が出力されてしまうことになる。
しかし、例えば「１２３４」といった文字列を読み取った場合には、フォーマットＤに合致する文字列を出力することが通常であり、フォーマットＤに合致する文字列が出力されたこと自体を異常と捉えることはできない。

【0127】

そこで、第２実施形態においては、フォーマットＤ（の抽出文字列）に合致する出力文字列を抽出した場合に、誤読が発生した可能性をオペレータに報知し、オペレータが、実際に読み取った文字列１０２と、出力された読取結果とを対比して、読み取りが正しく行われたかを確認できるようにしている。オペレータが誤読に気づけば、オペレータは容易に再度の読み取りを行ったり、読取装置１００や出力先のデータ処理装置を操作して読み取り結果を修正したりすることができる。

【0128】

上述のフォーマットＤのようなケースは、典型的には、複数の出力フォーマットを使用する場合であって、抽出文字列の文字数が少ない方の出力フォーマットに従った出力が行われた場合に発生し得る。文字数が多い方の出力フォーマットに従った出力が行われた場合でも、誤読が全く起こっていないとまでは言えないが、頻度は低いと考えらえる。例えば、数字４文字を読もうとしているにも関わらず、「ＡＢ０１２３」のように当該４文字以外の文字が含まれる文字列を読み取り、かつ、「０」を「Ｃ」と誤読するようなケースに限られるためである。

【0129】

そこで、この実施形態では、抽出された出力文字列の文字数に注目し、この文字数が、報知基準文字数未満である場合に誤読の可能性を報知するようにしている。報知基準文字数は、使用する各出力フォーマットの抽出文字列の中で最も長いものの文字数（上記の例ではフォーマットＣの６文字）とすればよい。
この基準で報知を行うと、例えば「１２３４」といった文字列を読み取ってフォーマットＤに合致する文字列が正常に出力される場合でも誤読の可能性を報知することになる。しかし、例えば手持ちタイプの読取装置１００の場合には、オペレータが報知に応じて実際の文字列１０２と読み取り結果とを対比して確認することは容易であり、正常出力の場合に誤読の可能性を報知してしまうことは、大きな問題とはならない。それよりも、報知に応じて誤読を発見し、これを修正できることの方が重要である。

【0130】

ここまでの説明では、出力フォーマットにおける抽出文字列の長さが固定である例を扱ったが、抽出文字列の長さは可変の場合もある。例えば、「数字４～６文字」といった抽出文字列を規定することもできる。
この場合は、使用する出力フォーマットが１つだけであっても、誤読の可能性を報知すべき場合がある。例えば、「１２３４５」といった数字５文字の文字列を認識し、これが出力フォーマットに合致するとして出力した場合であっても、実際には読みとろうとした文字列は「１２３４５６」であり、このうち「６」が見切れていた、というケースも考えられる。

【0131】

従って、最大文字数である６文字よりも短い文字列が出力フォーマット（の抽出文字列）に合致し、出力文字列として採用、抽出された場合には、上述のフォーマットＤの場合と同様な考え方により、誤読の可能性を報知することが好ましい。
従って、抽出文字列の長さが可変の場合、抽出文字列の最大長を報知基準文字数として、図１１の処理を行うとよい。
また、例えば正しい読み取りで出力文字列が５文字になることが頻繁にあり、４文字の場合のみ報知を行うことが好ましい場合もある。この場合、報知基準文字数を、最大長そのものでなく、それよりも短い値の５文字に設定してもよい。

【0132】

また、図３のＩＤ＝８の出力フォーマット（日付フォーマット）のように、抽出文字列が複数の区間に区切られている場合、その区間ごとに報知基準文字数を定めることができるようにしてもよい。この場合、図１１のステップＳ１０２の判断において、出力文字列と報知基準文字数との比較は当該区間ごとに行い、少なくとも１つの区間で、出力文字列の文字数が報知基準文字数未満であった場合に、判断結果をＹｅｓとするとよい。

【0133】

例えば、図３の日付フォーマットでは、抽出文字列全体の最長文字数は、「ＹＹＹＹ／ＭＭ／ＤＤ」等の場合の１０文字である。しかし、区切り文字「／」で区切られた区間ごとにみると、一番左の年の区間は４文字、真ん中の月の区間は２文字、一番右の日の区間は２文字である。これらをそのまま区間ごとの報知基準文字数とすることもできる。
しかし、年については、「ＹＹ」との表記が想定されていることもあり、４桁の内下２桁のみ読み取れれば上２桁が見切れていても問題ないケースが多いと考えられる。従って、年の区間は２文字を報知基準文字数とすることも考えられる。そして、単純に年の箇所を２文字として抽出文字列全体の最長文字数を考えると、８文字となる。しかし、全体として８文字の出力文字列が抽出された場合、誤読の可能性を報知したいケースもある。

【0134】

例えば、文字列認識処理で、図１４Ａ及び図１４Ｂに示すような文字列４３や文字列４４を認識した場合である。スペースを□で表すと、文字列４３は「２０２０□１□２」、文字列４４は「２０２０□１２」である。少なくとも文字列４３は日付フォーマットに合致し、日のＤＤが０文字であることを許容すれば、文字列４４も合致する。
他方、区切り文字がスペースの場合、文字列を撮像する角度によっては、スペースの有無や数を正確に認識することが難しい場合もある。従って、文字列４３や文字列４４を認識した場合、実際の文字列がどちらであるのか判断がつきにくい。すなわち、誤読の可能性があり、報知したい。

【0135】

しかし、文字列４３の文字数は８文字であるので、上述のように抽出文字列全体で報知基準文字数を８文字と設定してあると、誤読可能性を報知しないことになる。
これに対し、区間ごとに報知基準文字数を２文字／２文字／２文字のように設定すれば、文字列４３と文字列４４のいずれの場合も、誤読可能性を報知できる。文字列４３では、月と日が各１文字であり、文字列４４は日が０文字であり、それぞれ該当区間の報知基準文字数未満であるためである。

【0136】

このように、報知基準文字数を抽出文字列の区間ごとに定められるようにすることで、より柔軟に誤読可能性の報知の有無を制御することができる。
また、以下の表１乃至表３に示すように、抽出文字列が、複数の区間においてそれぞれ可変の文字数を取る出力フォーマットもあり得る。また、区間の数が異なる出力フォーマットを同時に使用する場合もあり得る。以下、これらの場合に考えられる報知基準文字数の定め方について説明する。

【0137】

【表1】

【0138】

表１に記載の出力フォーマットＮｏ．１とＮｏ．２を使用する場合、「－」を区切り文字とすると、各区間の最大文字数は、表の２行目に記載の通りである。報知基準文字数例＃１は、単純に区間毎に各出力フォーマットの中で最大の文字数を採ったものである。Ｎｏ．１の３つ目の区間は存在しないため０文字としている。

【0139】

しかし、この報知基準文字数に従って誤読可能性を報知すると、Ｎｏ．２の出力フォーマットに合致する最大文字数の文字列を読み取った場合以外は、常に報知を行うことになり、報知が頻繁すぎると考えられる。一方で、３番目の区間に文字がある出力フォーマットが１つだけの場合、オペレータは、３番目の区間に文字がある文字列を読み取る場合、正常に読取ができたか通常よりも注意を払うと考えられるし、読み取り結果における３番目の区間の文字数には特に注意を払うと考えられる。

【0140】

そこで、３番目の、すなわち、１つの出力フォーマットのみが文字を規定する区間については、報知基準文字数を定めなくてもよい。報知基準文字数例＃２がこの例である。この場合、３番目の区間については、図１１のステップＳ１０２の判断を行わず、３番目の区間の文字数が少ないことをトリガとする誤読可能性の報知は行わない。
このようにすることで、誤読可能性の報知頻度をリーズナブルな範囲に留めることができる。

【0141】

【表2】

【0142】

表２のケースでは、３番目の区間に各出力フォーマットの中で最大の文字数を採って４文字の報知基準文字数を定めると、Ｎｏ．１又はＮｏ．２の出力フォーマットに従ってどのような出力文字列を抽出した場合でも、誤読可能性を報知することになってしまう。そこで、表２のケースでは、３番目の、すなわち、１つの出力フォーマットのみが文字を規定する区間に報知基準文字数を定めないことの妥当性が、表１のケースよりも高い。

【0143】

【表3】

【0144】

表３のケースでは、全ての区間において、複数の出力フォーマットが文字を規定する。従ってこの場合は、全ての区間において、各出力フォーマットの中で最大の文字数を採って報知基準文字数を定めることが好ましい。このようにすると、表３のケースでは、Ｎｏ．１乃至Ｎｏ．３のいずれかの出力フォーマットに従ってどのような出力文字列を抽出した場合でも誤読の可能性を報知することになる。しかし、表３のような出力フォーマットの設定は、それだけ誤読が発生しやすいものであり、これを適切に反映した報知を行っていると捉えることができる。

【0145】

以上のように、この実施形態の読取装置１００は、文字抽出部１４４が抽出した出力文字列が、報知基準文字数未満である場合に誤読の可能性を報知するようにしたことで、簡単な処理により、適切な頻度で誤読の可能性をオペレータに報知することができる。

【0146】

〔第３実施形態：図１５乃至図１９Ｄ〕
次に、この発明の第３実施形態について説明する。
第３実施形態の読取装置１００は、文字認識条件を使用しない点と、文字列認識で認識した文字列の内部又は近傍に文字を構成しない図形がある場合に誤読の可能性を報知するようにした点とが第１実施形態と異なる。その他の点は第１実施形態と共通であるので、相違点に関連する事項について説明し、共通箇所の説明は適宜に省略する。

【0147】

まず、第３実施形態の読取装置１００が備える文字列１０２の読み取りに関連する機能について説明する。
図１５は、その機能の構成を示す、図２と対応する機能ブロック図である。
図１５に示すように、第３実施形態の読取装置１００は、図２の文字認識条件設定部１４８に代えて、図形位置判定部１６１及び報知部１６２を備える。また、文字列認識部１４３は、文字認識条件を用いずに文字列認識を行うが、この点は第２実施形態と同様である。

【0148】

図形位置判定部１６１は、図形認識部１４２が認識した図形、文字列認識部１４３が認識した文字列（第１文字列）及び、文字抽出部１４４が第１文字列から抽出した出力文字列（第２文字列）の情報を取得し、これらの情報に基づき、第２文字列の内部又は近傍に、文字を構成しない図形があると判断した場合に、報知部１６２に対して誤読可能性の報知を指示する機能を備える。
報知部１６２の機能は、第２実施形態の報知部１５３と同様である。

【0149】

ここで、文字を構成しない図形とは例えば、図６の文字列認識処理において、ステップＳ５３で検出されたグループに含まれないか、またはステップＳ６２で文字ではないと認識された図形である。ステップＳ５１で認識された図形のうち、ステップＳ５７又はＳ６１で特定の文字又は不定の文字であると認識されなかった図形と言ってもよい。

【0150】

図１６Ａ乃至図１６Ｄに、このような、文字を構成しない図形の例を示す。
図１６Ａ乃至図１６Ｄのいずれも、撮像部１４１が撮像した画像５０内に、文字列認識処理により文字列５３が認識され、これがそのまま出力文字列としても抽出された例である。文字列５３を構成する具体的な文字は、図によって異なる。文字列５３の中で、図形により構成される個別の文字５１は、符号を付していないものも含め実線で囲んで示している。文字間のスペースに認識される空白文字５２は、破線で示している。

【0151】

そして、画像５０内には、これらの他、符号５５で示すような文字を構成しない図形が含まれ得る。図形５５が存在し得る位置や、図形５５が取り得るサイズは様々である。図１６Ａ及び図１６Ｂの例では図形５５は文字列５３の近傍に位置し、図１６Ｃ及び図１６Ｄの例では図形５５は文字列５３の内部に位置する。
なお、誤読可能性の報知に当たり、図形５５が文字列の内部にあるか近傍にあるかを区別する必要性は低い。文字列認識処理においてステップＳ５３で検出したグループの図形が配列されている領域と一部でも重なる図形５５は、その領域に存在する文字列５３の内部にあると考えても差し支えない。

【0152】

このような文字を構成しない図形５５は、読取対象１０１に付着したゴミ、読取対象１０１上の模様や罫線、読取対象１０１に形成された影や凹凸、撮像時の白飛び等により発生し得る。いずれの原因であっても、認識した文字列５３の近傍にこのような図形５５がある場合、図形５５の存在が障害となって文字列５３を構成する文字の認識が正常に行えていない可能性や、存在する文字の一部を図形として認識できなかった結果、残りが文字を形成しない図形５５として認識されている可能性や、複数の文字が繋がって１つの図形と認識された結果、文字とは認識されなかった可能性等が示唆される。これらはいずれも誤読につながると考えられる。

【0153】

特に、文字抽出部１４４が抽出した出力文字列の内部又は近傍に文字を構成しない図形５５がある場合には、出力に直接反映される箇所で誤読が発生している可能性があり、読み取り結果として正しくない出力がなされる危険性が高い。
従って、第３実施形態においては、文字抽出部１４４が抽出した出力文字列の内部又は近傍に文字を構成しない図形５５がある場合に、誤読の可能性を報知することで、オペレータに適切に注意喚起をするようにしている。

【0154】

次に、図１７及び図１８を用いて、図１９Ａ乃至図１９Ｄも参照しつつ、以上説明してきた機能を実現するための処理について説明する。ここで説明する処理は、この発明の文字列読取方法の第３実施形態に係る処理である。
まず図１７に、読取装置１００において文字読取モードがＯＮになった場合にＣＰＵ１２１が実行する、図４と対応する処理のフローチャートを示す。

【0155】

図１７の処理は、ステップＳ１２の後にステップＳ１３が無い点と、ステップＳ１６に代えてステップＳ１６′を実行する点と、ステップＳ１９でＹｅｓの場合にステップＳ２０の前にステップＳ１２１乃至Ｓ１２３を実行する点が、図４と異なるのみである。
これらのうち、ステップＳ１３が無い点と、ステップＳ１６に代えてステップＳ１６′を実行する点は、第２実施形態で説明した図１１の場合と同様である。

【0156】

また、ステップＳ１９でＹｅｓの場合、ＣＰＵ１２１は、図形存在判定処理を実行する（Ｓ１２１）。この処理は、例えば図１８に示すものである。
図１８の図形存在判定処理において、ＣＰＵ１２１はまず、ステップＳ１７の出力文字列抽出処理で処理対象とした文字列のうち、文字列の端部から連続して存在する不定の文字であって、かつ、図７のステップＳ８９で採用された出力文字列に含まれない不定の文字につき、当該不定の文字を構成する図形を、文字を構成しない図形に加える（Ｓ１４１）。

【0157】

不定の文字を構成する図形は、基本的には文字を構成する図形と考えられる。特に、図１９Ｃに符号５８で示すように、特定された文字に挟まれる位置に認識された不定の文字は、単に文字を特定できないだけで、特定された文字を含めて一連の文字列を構成する何らかの文字である可能性が高いと考えられる。
一方、図１９Ｃに符号５７で示すように文字列の端部に認識された不定の文字は、符号５８の場合と比べ、特定された文字を含む一連の文字列を構成しない可能性も想定され、ゴミや模様等がたまたま文字のサイズと合致したため不定の文字と認識された可能性も無視できない。これは、文字列の端部だけでなく、端部から連続して存在し、特定された文字に挟まれていない不定の文字全てに当てはまる。図１９Ｂに符号５７で示す左から３文字の不定の文字が、これに該当する。

【0158】

そこで、図１８の処理では、このような不定の文字は実質的に文字を構成しない図形であるとして、図形の存在を判定する。このとき、不定の文字が複数の図形で構成されていた場合に、その図形１つずつを別々の図形として扱って以下の処理に進むか、その複数の図形をまとめて１つの図形として扱って以下の処理に進むかは、どちらも考えられる。
ただし、出力フォーマットの抽出文字列に不定の文字が規定されている場合、抽出される出力文字列にも不定の文字が含まれる。出力文字列に含まれる不定の文字は、存在することが予め想定されていた文字であり、誤読の結果認識されてしまったものではないと考えられる。そこでステップＳ１４１では、このような不定の文字を構成する図形は、文字を構成しない図形には含めない扱いとしている。

【0159】

次にＣＰＵ１２１は、処理対象の文字列の内部又は近傍に存在する、文字を構成しない図形を特定する（Ｓ１４２）。例えば、文字列中のいずれかの文字から所定距離以内に一部でも入る図形を、文字列の内部又は近傍にある図形として特定することが考えられる。所定距離の数字は、処理対象の文字列の文字認識に影響を与える可能性が無視できない程度の距離を、実験や経験則から求めて適宜に設定することが考えられる。例えば、読み取りたい文字列中の最大の文字間隔を基準に設定することが考えられる。内部と近傍を区別する必要性が低いのは上述の通りである。

【0160】

その後ＣＰＵ１２１は、ステップＳ１４２で特定した図形から、高さ方向（図８のｈ方向）のサイズが、出力文字列のサイズｈと比べて閾値Ｔ１（＜１）倍以下である小さい図形を除外する（Ｓ１４３）。高さ方向のサイズとは、出力文字列の高さ方向のサイズである。
図１９Ｄに符号６１で示すような、文字を構成する点よりも小さいサイズの図形は、文字を構成しない状態で存在していても文字認識に与える影響は小さいと考えられるので、少なくともこのような図形を除外するようにＴ１の値を定めるとよい。また、読み取る文字のフォント等に応じて、文字に含まれる最小の点よりもある程度小さいサイズが閾値となるようにＴ１の値を定めることも考えられる。あるいは、Ｔ１の値を１／２とすることも考えられる。多少余裕をもって、もう少し小さい１／３等の値にしてもよい。

【0161】

また、ＣＰＵ１２１は、ステップＳ１４２で特定した図形から、出力文字列を構成する図形と比べて背景に対するコントラストが所定閾値以上異なる図形や、エッジのシャープさが所定閾値以上異なる図形も除外する（Ｓ１４４，Ｓ１４５）。
これらに該当する図形も、文字を構成する図形と特徴が大きく異なる場合には文字認識に与える影響は小さいと考えられるし、文字以外の図形に分類されているとしても特別おかしな点はないので、除外する。各閾値は、どの程度コントラストやエッジのシャープさが異なれば文字認識に与える影響が無視できるかに基づき定めればよい。

【0162】

次に、ＣＰＵ１２１は、ステップＳ１４２で特定した図形から、高さ方向のサイズが、出力文字列のサイズｈと比べて閾値Ｔ２（＞１）倍以上である大きい図形を除外してもよい（Ｓ１４６）。高さ方向のサイズとは、出力文字列の高さ方向のサイズである。
高さ方向のサイズが大きい図形としては、図１９Ｄに符号５４ａ，５４ｂで示すように高さ方向に近接する位置に複数の文字列がある場合に、符号５９ａ，５９ｂで示すように高さ方向に隣接する複数の文字がつながった状態で１つの図形として認識されたものが考えられる。このような図形が存在する場合、誤読が発生している可能性が高い。

【0163】

一方、符号６０で示すような、罫線や模様を認識したと想定される図形も考えられる。このような図形は、文字の近傍にあると多くの場合、符号５９ａ、５９ｂの図形に比べて、誤読をもたらす可能性はさらに高いと考えられる。
しかし、例えば読取対象１０１がライン上や網目状の模様を有する場合など、符号６０で示すような図形を誤読可能性報知のトリガとしてしまうと、非常に高い頻度で報知を行うことになってしまう場合がある。このような場合においては、大きい図形を除外することで、報知の頻度を妥当な範囲に収めることも考えられる。

【0164】

このときに用いるＴ２の値としては、例えば２が考えられる。３以上の文字が繋がって認識されるケースは稀と考えられ、符号５９ａ、５９ｂのような図形の高さ方向のサイズは、概ね文字列の高さの２倍以下と考えられるためである。
なお、大きい図形を報知対象とするか否か、すなわちステップＳ１４６の処理を行うか否かを、オペレータが任意に設定できるようにしてもよい。この点は、ステップＳ１４３乃至Ｓ１４５の処理の各々についても同様である。

【0165】

いずれにせよ、ＣＰＵ１２１は、ステップＳ１４７の時点でステップＳ１４２で特定した図形が残っていれば、誤読の可能性を報知することを決定して（Ｓ１４８）、元の処理に戻る。残っていなければ、そのまま元の処理に戻る。

【0166】

図１７の説明に戻る。図１８の図形存在判定処理の後、ＣＰＵ１２１は、図１８の処理で誤読の可能性を報知することを決定した場合には（Ｓ１２２のＹｅｓ）、通知部１３２を制御してオペレータへ誤読の可能性がある旨を報知する（Ｓ１２３）。
その後、処理はステップＳ２０に進む。ステップＳ１２２でＮｏであれば、報知は行わずにステップＳ２０へ進む。
ステップＳ１２１乃至Ｓ１２３の処理は報知手順の処理であり、図形位置判定部１６１及び報知部１６２の機能と対応する。

【0167】

以上の処理により、図形認識及び文字列認識の結果に基づき誤読の可能性が認められる場合に、これを適切にオペレータに報知することができる。
なお、ここで説明した処理では、出力文字列抽出処理で抽出した出力文字列の内部又は近傍に文字を構成しない図形がある場合に報知を行うこととした。しかし、文字列認識処理で認識した文字列の内部又は近傍に文字を構成しない図形がある場合にも報知を行うようにしてもよい。

【0168】

最終的に出力に反映されるのは出力文字列であるが、出力文字列以外の箇所であっても、文字列認識部１４３における文字列認識処理の時点で文字の誤認識が発生していると、出力文字列を適切に抽出できないことを通じて、最終的な出力も誤ったものになる可能性があるためである。

【0169】

例えば、図１９Ａにおいて、符号５４が文字列認識処理で認識された文字列、符号５３がその中から抽出された出力文字列である場合を考える。このとき、出力文字列５３の内部又は近傍だけで考えると、図形５５のみが、内部又は近傍にあって文字を構成しない図形だが、文字列５４の内部又は近傍で考えると、図形５５に加えて図形５６も、内部又は近傍にあって文字を構成しない図形に該当する。
この範囲に文字を構成しない図形が存在する場合にも、誤読の可能性を報知してもよい。

【0170】

なお、図１８のステップＳ１４３乃至Ｓ１４６の処理の一部又は全部を省略することも可能である。ステップＳ１４３乃至Ｓ１４６で除外される図形も、文字認識に全く影響を与えないわけではないので、このような図形を除外せずに、誤読可能性報知のトリガとしてもよい。

【0171】

また、文字列の端部に不定の文字がある場合にそれを必ず「文字を構成しない図形」であると扱うとすると、誤読可能性報知の頻度が高くなりすぎることも考えられる。そこで、例えば図１９Ｄに符号５９ａ，５９ｂで示したような隣接する複数の文字がつながった状態で１つの図形として認識されたもの除き、不定の文字は、文字を構成する図形であると扱うようにしてもよい。例えば、不定の文字の高さ方向のサイズが、文字列を構成する文字のサイズを概ね等しい場合（サイズ差が所定閾値以下である場合）には、文字を構成する図形であると扱うことが考えられる。

【0172】

〔第４実施形態：図２０乃至図２２〕
次に、この発明の第４実施形態について説明する。
第４実施形態の読取装置１００は、出力文字列抽出処理中の一定段階で候補リストに要素が複数あった場合に誤読の可能性を報知するようにした点が第１実施形態と異なる。その他の点は第１実施形態と共通であるので、相違点に関連する事項について説明し、共通箇所の説明は適宜に省略する。

【0173】

まず、第４実施形態の読取装置１００が備える文字列１０２の読み取りに関連する機能について説明する。
図２０は、その機能の構成を示す、図２と対応する機能ブロック図である。
図２０に示すように、第４実施形態の読取装置１００は、図２の構成に加え、報知要否判定部１６３及び報知部１６２を備える。
報知要否判定部１６３は、文字抽出部１４４から、誤読可能性の報知要否を示す情報を受け取り、報知要の場合に報知部１６２に対して誤読可能性の報知を指示する機能を備える。報知部１６２の機能は、第３実施形態の場合と同様である。

【0174】

次に、図２１及び図２２を用いて、以上の機能を実現するための処理について説明する。ここで説明する処理は、この発明の文字列読取方法の第４実施形態に係る処理である。
まず図２１に、読取装置１００において文字読取モードがＯＮになった場合にＣＰＵ１２１が実行する、図４と対応する処理のフローチャートを示す。

【0175】

図２１の処理は、ステップＳ１８に代えてステップＳ１８′を実行する点と、ステップＳ１９でＹｅｓの場合にステップＳ２０の前にステップＳ１２２及びＳ１２３を実行する点が、図４と異なるのみである。
ステップＳ１８′の出力文字列抽出処理は図２２に示すものであるが、この処理は図７の処理に、破線で示すステップＳＡ１、ＳＡ２、ＳＢ、ＳＣを追加したものである。

【0176】

これらのうちステップＳＢは、文字数では出力文字列の候補を１つに絞れず、画像の中央を含むか否かの基準で絞ることを試みる場合に、誤読の可能性を報知することを決定する処理である。ステップＳＣは、同様に、一致率の基準で候補を絞ることを試みる場合に、誤読の可能性を報知することを決定する処理である。

【0177】

第１実施形態で図９Ｂ及び図９Ｃを用いて説明したように、誤読が起きた場合には、これらの基準で候補を１つに絞らざるを得ないことが発生しやすい。また、文字列認識は正確であっても、画像の中央を含むか否かや一致率の基準で候補を絞ると、撮像の位置や正確さによって、複数の候補のいずれが出力文字列として採用されるかが比較的変動しやすいため、オペレータの意図した出力文字列が得られない可能性が無視できない状況であると言える。
ステップＳＢ及びＳＣは、このような場合に、オペレータに誤読の可能性を報知し、読み取り結果をよく確認してもらうために設けた処理である。

【0178】

また、ステップＳＡ１及びＳＡ２は、設定されている出力フォーマットが１つだけであるにも関わらず、当初のステップＳ８１での検出で候補が複数あった場合に、誤読の可能性を報知することを決定する処理である。
複数の出力フォーマットが設定されている場合には、図９Ａの例で説明した上段の文字列の読み取りのように、それら複数の出力フォーマットについてそれぞれ出力文字列の候補が検出され、その後、文字数の基準で１つに絞られることを想定した設定であることもしばしばである。しかし、出力フォーマットが１つであるにも関わらずステップＳ８１で候補が複数検出されるのは、図９Ｂや図９Ｃの例で説明したような、誤読等の想定外の自体が発生したためである可能性が無視できない。

【0179】

ステップＳＡ１及びＳＡ２は、このような場合にもオペレータに誤読の可能性を報知し、読み取り結果をよく確認してもらうようにするために設けた処理である。
これらのステップＳＡ１とＳＡ２の組、及びステップＳＢ、ＳＣは、一部のみ設けてもよい。

【0180】

また、図２１のステップＳ１２２及びＳ１２３の処理は、図１７のステップＳ１２２及びＳ１２３と同趣旨であり、誤読の可能性を報知するか否かの判断を、ステップＳ１８′の図２２の処理で誤読の可能性を報知することが決定されたか否かに基づき行う点が異なるのみである。

【0181】

以上の処理により、出力文字列の候補の検出状況や絞り込みの状況に基づき誤読の可能性が認められる場合に、これを適切にオペレータに報知することができる。
なお、図２２の処理では、処理の開始時点で、過去に行った誤読の可能性を報知することの決定をリセットしなくてよい。抽出エラーが生じた場合に、次に認識された文字列を処理対象として再度図２２の処理を行う場合もあるが、このようなケースでも、誤読が生じやすいと考えられるので、２度目以降の図２２の処理ではステップＳ８２の段階で出力文字列の候補が１つに絞られていても、誤読の可能性を報知することも有用である。
しかし、このことは必須ではなく、図２２の処理の開始時点で報知の決定をリセットしてもよい。いずれにせよ、ステップＳ１２３で報知を行った後は、報知の決定をリセットする。

【0182】

また、図２１の処理にはステップＳ１３が含まれ、第４実施形態では文字認識条件を用いているが、これは必須ではない。第２、第３実施形態の場合と同様、文字認識条件を使わないようにし、ステップＳ１３を実行せず、ステップＳ１６に代えてステップＳ１６′で図１２の文字列認識処理を行うようにしてもよい。

【0183】

〔第５実施形態：図２３，図２４〕
次に、この発明の第５実施形態について説明する。
第５実施形態の読取装置１００は、第１乃至第３実施形態で説明した、文字認識条件を用いた文字列認識、文字抽出部１４４が抽出した出力文字列の文字数に基づく誤読可能性の報知、出力文字列の内部又は近傍に文字を構成しない図形がある場合の誤読可能性報知の機能を兼ね備えたものである。そこで、各実施形態の記載を引用しつつ説明する。

【0184】

まず、第５実施形態の読取装置１００が備える文字列１０２の読み取りに関連する機能について説明する。
図２３は、その機能の構成を示す、図２と対応する機能ブロック図である。
図２３に示すように、第５実施形態の読取装置１００は、図２に示した各部に加えて、図１０に示した基準文字数設定部１５１、文字数判定部１５２及び、図１５に示した図形位置判定部１６１及び報知部１６２を備える。各部の機能は、これらの図に示したものと同様であるので、詳細な説明は省略する。図１０の報知部１５３の機能は、報知部１６２により実現できる。

【0185】

次に、図２４を用いて、以上の機能を実現するための処理について説明する。ここで説明する処理は、この発明の文字列読取方法の第５実施形態に係る処理である。
図２４は、読取装置１００において文字読取モードがＯＮになった場合にＣＰＵ１２１が実行する、図４と対応する処理のフローチャートを示す。

【0186】

図２４の処理は、図４の処理に、図１１と同様なステップＳ１０１乃至Ｓ１０３の処理を追加し（Ｓ１２３がＳ１０３と同じ処理である）、さらに、ステップＳ１０２でＮｏの場合に、図１７と同様なステップＳ１２１乃至Ｓ１２３の処理を追加したものである。
以上の処理を行うことで、第１乃至第３実施形態で説明した機能を全て実現することができる。このことにより、それらの機能による効果を全て実現することができる。
また、ステップＳ１８の出力文字列抽出処理として図２２の処理を行うことで、さらに第４実施形態の機能も組み合わせ、その効果を実現することも可能である。

【0187】

また、例えば、第１実施形態の文字認識条件の利用と、第３実施形態の認識された文字列の内部又は近傍に文字を構成しない図形がある場合の誤読可能性の報知とを組み合わせることで、以下のような効果が追加的に得られる。
まず、数字４文字のみの文字列を読み取るつもりで抽出文字列が「数字４文字」となっている出力フォーマットを設定している場合を考える。このとき、「ＢＯＯＩＮＧ」という文字列は、正しく認識されれば出力フォーマットに合致しないが、例えば「ＢＯＯＩ」の部分が「８００１」と誤認識されてしてしまうと、文字列は「８００１ＮＧ」と認識され、「８００１」の部分が出力フォーマットに合致して出力文字列として抽出されて出力され、誤読み取りとなってしまう。他に文字を構成しない図形がなければ、誤読の可能性も報知されない。

【0188】

ここで、文字認識条件として「数字のみ」が設定されていたとすると、上記の誤認識が生じた場合でも文字列は「８００１？？」と認識され、出力文字列となる「８００１」の隣に、文字を構成しない図形として認識される不定の文字があるので、誤読の可能性を報知し、オペレータに注意を喚起できる。
すなわち、文字認識条件を適切に設定し、読み取りに必要のない文字を認識しないようにすることで、意図しない誤認識で出力フォーマットに合致する箇所が生じてしまうケースにおいて、その近傍に不定の文字が存在する可能性を高めることができ、文字を構成しない図形がある場合の誤読可能性の報知の機能を、一層有意義に使えるようになる。

【0189】

〔変形例〕
以上で実施形態の説明を終了するが、この発明において、装置の具体的な構成、具体的な処理の手順、出力フォーマットをはじめとするデータの形式、具体的なデータや文字列の内容、取り扱う文字の種類等は、実施形態で説明したものに限るものではない。
例えば、英語以外のアルファベットや、日本語の平仮名、片仮名、漢字を読み取る場合も、上述した各実施形態の機能は同様に発揮することができる。
また、第４実施形態では、第１、第２、第３実施形態で説明した機能を全て備えた読取装置１００について説明したが、これらのうち任意の２つの実施形態の機能を備えた読取装置１００も同様に構成することができる。
また、上述した各実施形態の読取装置１００の機能を、複数の装置に分散させて設け、例えば図２等に示した機能の一部を接続先のデータ処理装置に設ける構成とすることも、妨げられない。

【0190】

また、読取対象１０１の画像の取得を、撮像により行うことは必須ではない。フラットベッド式のスキャナや、手で読み取り対象の上を滑らせるハンディスキャナ等を用いて、スキャンにより画像を取得する場合であっても、その他の任意の方法で画像を取得する場合であっても、上述した実施形態を適用可能である。

【0191】

また、この発明のプログラムの実施形態は、１のコンピュータに、あるいは複数のコンピュータを協働させて、所要のハードウェアを制御させ、上述した実施形態における読取装置１００の機能を実現させ、あるいは上述した実施形態にて説明した処理を実行させるためのプログラムである。

【0192】

このようなプログラムは、はじめからコンピュータに備えるＲＯＭや他の不揮発性記憶媒体（フラッシュメモリ，ＥＥＰＲＯＭ等）などに格納しておいてもよい。メモリカード、ＣＤ、ＤＶＤ、ブルーレイディスク等の任意の不揮発性記録媒体に記録して提供することもできる。さらに、ネットワークに接続された外部装置からダウンロードし、コンピュータにインストールして実行させることも可能である。

【0193】

また、以上説明してきた実施形態及び変形例の構成が、相互に矛盾しない限り任意に組み合わせて実施可能であり、また、一部のみを取り出して実施することができることは、勿論である。

【符号の説明】

【0194】

４０…撮像範囲、５０…画像、１００…読取装置、１０１…読取対象、１０２…文字列、１１０…光学部、１１１…撮像センサ、１１２…レンズ、１１３…パルスＬＥＤ、１２０…制御部、１３１…操作部、１３２…通知部、１３３…表示部、１４１…撮像部、１４２…図形認識部、１４３…文字列認識部、１４４…文字抽出部、１４５…文字加工部、１４６…出力部、１５１…基準文字数設定部、１５２…文字数判定部、１５３，１６２…報知部、１６１…図形位置判定部

【要約】

【課題】簡便で負荷の小さい処理により、撮像画像中の文字を認識する文字認識の精度を向上させる。
【解決手段】撮像部１４１が読取対象物の画像を取得し、出力フォーマット設定部１４７が、その取得した画像中から読み取って出力すべき文字列のフォーマットを設定し、文字列認識部１４３が特定可能な文字のうち、設定した上記フォーマットで規定される文字を全て含む一群の文字のみを特定することを文字認識条件として文字認識条件設定部１４８が設定し、文字列認識部１４３が、上記取得した画像中の文字列を、その設定した文字認識条件に従って認識し、文字抽出部１４４が、その認識で得た第１文字列のうち、設定した上記フォーマットに合致する箇所の第２文字列を出力用に取得する。
【選択図】図２