特許7580550 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機インフォメーションシステムズ株式会社の特許一覧

特許7580550文字認識装置、文字認識方法及び文字認識プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-10-31

(45)【発行日】2024-11-11

(54)【発明の名称】文字認識装置、文字認識方法及び文字認識プログラム

(51)【国際特許分類】

G06V 30/24 20220101AFI20241101BHJP

G06V 30/14 20220101ALI20241101BHJP

H01L 21/02 20060101ALI20241101BHJP

【ＦＩ】

G06V30/24 620B

G06V30/14 340B

H01L21/02 A

【請求項の数】 18

(21)【出願番号】P 2023164081

(22)【出願日】2023-09-27

【審査請求日】2023-09-27

(73)【特許権者】

【識別番号】394013002

【氏名又は名称】三菱電機インフォメーションシステムズ株式会社

(74)【代理人】

【識別番号】110002491

【氏名又は名称】弁理士法人クロスボーダー特許事務所

(72)【発明者】

【氏名】和田知也

(72)【発明者】

【氏名】山足光義

(72)【発明者】

【氏名】中尾尭理

(72)【発明者】

【氏名】西濱令

【審査官】鈴木圭一郎

(56)【参考文献】

【文献】特開２０１８－１７３８１８（ＪＰ，Ａ）

【文献】特開２０１８－０１８３６６（ＪＰ，Ａ）

【文献】欧州特許出願公開第２８３００２４（ＥＰ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｖ３０／２４

Ｇ０６Ｖ３０／１４

Ｈ０１Ｌ２１／０２

(57)【特許請求の範囲】

【請求項1】

カメラにより対象物を撮影して、前記対象物の複数の画像データを取得する画像取得部と、
前記画像取得部によって取得された前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取る読取部と、
前記正解桁数の各桁を対象の桁として、前記読取部によって前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定する推定部と
を備え、
前記読取部は、
前記対象の画像データから複数の文字を検知し、検知された前記複数の文字のうち指定側の文字を１桁目の文字に設定し、ｉ＝１から前記複数の文字がいずれかの桁の文字として設定されるまで、ｉ桁目の文字と隣接する文字との間の距離が基準距離以内の場合には、前記隣接する文字をｉ＋１桁目の文字に設定した上でｉに１加算し、ｉ桁目の文字と隣接する文字との間の距離が前記基準距離よりも長い場合には、前記ｉ桁目の文字の隣の基準幅のスペースを欠損文字としてｉ＋１桁目の文字に設定した上でｉに１加算することにより、前記各桁の文字を読み取り、
前記複数の文字がいずれかの桁の文字として設定された状態において、文字が設定された桁数が正解桁数よりも少ない場合には、前記複数の文字のうち最も指定側の文字と、文字を認識する領域の前記指定側の端部との距離である第１距離を計算するとともに、前記複数の文字のうち最も指定側と逆側の文字と、文字を認識する領域の前記指定側と逆側の端部との距離である第２距離を計算して、前記第１距離が前記第２距離よりも長い場合には、前記最も指定側の文字の前記指定側の基準幅のスペースを欠損文字として設定し、前記第２距離が前記第１距離よりも長い場合には、前記最も指定側と逆側の文字の前記指定側と逆側の基準幅のスペースを欠損文字として設定する文字認識装置。

【請求項2】

カメラにより対象物を撮影して、前記対象物の複数の画像データを取得する画像取得部と、
前記画像取得部によって取得された前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取る読取部と、
前記正解桁数の各桁を対象の桁として、前記読取部によって前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定する推定部と
を備え、
前記読取部は、
前記対象の画像データから複数の文字を検知し、検知された前記複数の文字のうち指定側の文字を１桁目の文字に設定し、ｉ＝１から前記複数の文字がいずれかの桁の文字として設定されるまで、ｉ桁目の文字と隣接する文字との間の距離が基準距離以内の場合には、前記隣接する文字をｉ＋１桁目の文字に設定した上でｉに１加算し、ｉ桁目の文字と隣接する文字との間の距離が前記基準距離よりも長い場合には、前記ｉ桁目の文字の隣の基準幅のスペースを欠損文字としてｉ＋１桁目の文字に設定した上でｉに１加算することにより、前記各桁の文字を読み取り、
前記複数の文字がいずれかの桁の文字として設定された状態において、文字が設定された桁数が正解桁数よりも少ない場合には、前記複数の文字のうち最も指定側の文字と、文字を認識する領域の前記指定側の端部との距離である第１距離を計算するとともに、前記複数の文字のうち最も指定側と逆側の文字と、文字を認識する領域の前記指定側と逆側の端部との距離である第２距離を計算して、前記第１距離が前記第２距離よりも長い場合には、ｊ＝１，．．．，ｉの各ｊ桁目に設定された文字をｊ＋１桁目の文字に設定し直すとともに、前記最も指定側の文字の前記指定側の基準幅のスペースを欠損文字として１桁目の文字に設定し、前記第２距離が前記第１距離よりも長い場合には、前記最も指定側と逆側の文字の前記指定側と逆側の基準幅のスペースを欠損文字としてｉ＋１桁目に設定する文字認識装置。

【請求項3】

【請求項4】

前記画像取得部は、前記対象物の画像データを１枚ずつ順に取得し、
前記読取部は、前記画像取得部によって取得された前記画像データを順に前記対象の画像データとして前記各桁の文字を読み取り、
前記推定部は、前記対象の桁について同じ文字が基準回数読み取られた場合に、前記対象の桁の文字を読み取られた文字として推定する
請求項１～３のいずれかに記載の文字認識装置。

【請求項5】

前記読取部は、２つの文字が検知された領域の重複度が基準割合よりも高い場合には、前記２つの文字のうち確信度の低い方の文字を除去した上で、前記各桁の文字を読み取る請求項１～３のいずれかに記載の文字認識装置。

【請求項6】

前記文字認識装置は、さらに、
記憶装置に記憶された複数の正解文字列から、事前に指定された全ての指定桁が、前記推定部によって推定された文字と同じ文字である正解文字列を特定する点検部
を備える請求項４に記載の文字認識装置。

【請求項7】

前記画像取得部は、背景画像の変化により前記対象物が前記カメラの撮影領域に設定されたことが認識されると前記画像データの取得を開始し、前記点検部によって前記正解文字列が特定されると前記画像データの取得を終了する
請求項６に記載の文字認識装置。

【請求項8】

前記文字認識装置は、さらに、
記憶装置に記憶された複数の正解文字列から、前記推定部によって文字が推定された全ての桁が、推定された文字と同じ文字である正解文字列を候補文字列として特定する点検部
を備える請求項４に記載の文字認識装置。

【請求項9】

前記画像取得部は、背景画像の変化により前記対象物が前記カメラの撮影領域に設定されたことが認識されると前記画像データの取得を開始し、前記点検部によって特定された前記候補文字列が１つになると前記画像データの取得を終了する
請求項８に記載の文字認識装置。

【請求項10】

前記文字認識装置は、さらに、
前記画像取得部によって取得された画像データに、文字を認識する領域である認識領域を示したガイドを重畳させて表示する表示部
を備える請求項１～３のいずれかに記載の文字認識装置。

【請求項11】

前記読取部は、前記ガイドが示す前記認識領域部分から文字列を読み取る
請求項１０に記載の文字認識装置。

【請求項12】

前記文字認識装置は、さらに、
画像データと直近に取得された画像データである読取開始判定用背景画像との特徴の類似度が第２閾値以上あるときに、前記読取部に対して読み取りを開始するように制御する読取制御部
を備える請求項１～３のいずれかに記載の文字認識装置。

【請求項13】

コンピュータが、カメラにより対象物を撮影して、前記対象物の複数の画像データを取得し、
コンピュータが、前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取り、
コンピュータが、前記正解桁数の各桁を対象の桁として、前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定し、
コンピュータが、前記対象の画像データから複数の文字を検知し、検知された前記複数の文字のうち指定側の文字を１桁目の文字に設定し、ｉ＝１から前記複数の文字がいずれかの桁の文字として設定されるまで、ｉ桁目の文字と隣接する文字との間の距離が基準距離以内の場合には、前記隣接する文字をｉ＋１桁目の文字に設定した上でｉに１加算し、ｉ桁目の文字と隣接する文字との間の距離が前記基準距離よりも長い場合には、前記ｉ桁目の文字の隣の基準幅のスペースを欠損文字としてｉ＋１桁目の文字に設定した上でｉに１加算することにより、前記各桁の文字を読み取り、
コンピュータが、前記複数の文字がいずれかの桁の文字として設定された状態において、文字が設定された桁数が正解桁数よりも少ない場合には、前記複数の文字のうち最も指定側の文字と、文字を認識する領域の前記指定側の端部との距離である第１距離を計算するとともに、前記複数の文字のうち最も指定側と逆側の文字と、文字を認識する領域の前記指定側と逆側の端部との距離である第２距離を計算して、前記第１距離が前記第２距離よりも長い場合には、前記最も指定側の文字の前記指定側の基準幅のスペースを欠損文字として設定し、前記第２距離が前記第１距離よりも長い場合には、前記最も指定側と逆側の文字の前記指定側と逆側の基準幅のスペースを欠損文字として設定する文字認識方法。

【請求項14】

コンピュータが、カメラにより対象物を撮影して、前記対象物の複数の画像データを取得し、
コンピュータが、前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取り、
コンピュータが、前記正解桁数の各桁を対象の桁として、前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定し、
コンピュータが、前記対象の画像データから複数の文字を検知し、検知された前記複数の文字のうち指定側の文字を１桁目の文字に設定し、ｉ＝１から前記複数の文字がいずれかの桁の文字として設定されるまで、ｉ桁目の文字と隣接する文字との間の距離が基準距離以内の場合には、前記隣接する文字をｉ＋１桁目の文字に設定した上でｉに１加算し、ｉ桁目の文字と隣接する文字との間の距離が前記基準距離よりも長い場合には、前記ｉ桁目の文字の隣の基準幅のスペースを欠損文字としてｉ＋１桁目の文字に設定した上でｉに１加算することにより、前記各桁の文字を読み取り、
コンピュータが、前記複数の文字がいずれかの桁の文字として設定された状態において、文字が設定された桁数が正解桁数よりも少ない場合には、前記複数の文字のうち最も指定側の文字と、文字を認識する領域の前記指定側の端部との距離である第１距離を計算するとともに、前記複数の文字のうち最も指定側と逆側の文字と、文字を認識する領域の前記指定側と逆側の端部との距離である第２距離を計算して、前記第１距離が前記第２距離よりも長い場合には、ｊ＝１，．．．，ｉの各ｊ桁目に設定された文字をｊ＋１桁目の文字に設定し直すとともに、前記最も指定側の文字の前記指定側の基準幅のスペースを欠損文字として１桁目の文字に設定し、前記第２距離が前記第１距離よりも長い場合には、前記最も指定側と逆側の文字の前記指定側と逆側の基準幅のスペースを欠損文字としてｉ＋１桁目に設定する文字認識方法。

【請求項15】

【請求項16】

カメラにより対象物を撮影して、前記対象物の複数の画像データを取得する画像取得処理と、
前記画像取得処理によって取得された前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取る読取処理と、
前記正解桁数の各桁を対象の桁として、前記読取処理によって前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定する推定処理と
を行う文字認識装置としてコンピュータを機能させ、
前記読取処理では、
前記対象の画像データから複数の文字を検知し、検知された前記複数の文字のうち指定側の文字を１桁目の文字に設定し、ｉ＝１から前記複数の文字がいずれかの桁の文字として設定されるまで、ｉ桁目の文字と隣接する文字との間の距離が基準距離以内の場合には、前記隣接する文字をｉ＋１桁目の文字に設定した上でｉに１加算し、ｉ桁目の文字と隣接する文字との間の距離が前記基準距離よりも長い場合には、前記ｉ桁目の文字の隣の基準幅のスペースを欠損文字としてｉ＋１桁目の文字に設定した上でｉに１加算することにより、前記各桁の文字を読み取り、
前記複数の文字がいずれかの桁の文字として設定された状態において、文字が設定された桁数が正解桁数よりも少ない場合には、前記複数の文字のうち最も指定側の文字と、文字を認識する領域の前記指定側の端部との距離である第１距離を計算するとともに、前記複数の文字のうち最も指定側と逆側の文字と、文字を認識する領域の前記指定側と逆側の端部との距離である第２距離を計算して、前記第１距離が前記第２距離よりも長い場合には、前記最も指定側の文字の前記指定側の基準幅のスペースを欠損文字として設定し、前記第２距離が前記第１距離よりも長い場合には、前記最も指定側と逆側の文字の前記指定側と逆側の基準幅のスペースを欠損文字として設定する文字認識プログラム。

【請求項17】

カメラにより対象物を撮影して、前記対象物の複数の画像データを取得する画像取得処理と、
前記画像取得処理によって取得された前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取る読取処理と、
前記正解桁数の各桁を対象の桁として、前記読取処理によって前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定する推定処理と
を行う文字認識装置としてコンピュータを機能させ、
前記読取処理では、
前記対象の画像データから複数の文字を検知し、検知された前記複数の文字のうち指定側の文字を１桁目の文字に設定し、ｉ＝１から前記複数の文字がいずれかの桁の文字として設定されるまで、ｉ桁目の文字と隣接する文字との間の距離が基準距離以内の場合には、前記隣接する文字をｉ＋１桁目の文字に設定した上でｉに１加算し、ｉ桁目の文字と隣接する文字との間の距離が前記基準距離よりも長い場合には、前記ｉ桁目の文字の隣の基準幅のスペースを欠損文字としてｉ＋１桁目の文字に設定した上でｉに１加算することにより、前記各桁の文字を読み取り、
前記複数の文字がいずれかの桁の文字として設定された状態において、文字が設定された桁数が正解桁数よりも少ない場合には、前記複数の文字のうち最も指定側の文字と、文字を認識する領域の前記指定側の端部との距離である第１距離を計算するとともに、前記複数の文字のうち最も指定側と逆側の文字と、文字を認識する領域の前記指定側と逆側の端部との距離である第２距離を計算して、前記第１距離が前記第２距離よりも長い場合には、ｊ＝１，．．．，ｉの各ｊ桁目に設定された文字をｊ＋１桁目の文字に設定し直すとともに、前記最も指定側の文字の前記指定側の基準幅のスペースを欠損文字として１桁目の文字に設定し、前記第２距離が前記第１距離よりも長い場合には、前記最も指定側と逆側の文字の前記指定側と逆側の基準幅のスペースを欠損文字としてｉ＋１桁目に設定する文字認識プログラム。

【請求項18】

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、ウェハ等の対象物に示されたＩＤ等の文字列を読み取る技術に関する。ＩＤは、ＩＤｅｎｔｉｆｉｅｒの略である。

【背景技術】

【0002】

ウェハ等の対象物に対して加工を行う際には、対象物が正しいかを目視で点検している。しかし、対象物に示された文字が小さい、照明の反射で文字が見づらい等が原因となり、目視による点検に誤りが生じ易い。その結果、誤った対象物に対して加工を行ってしまう可能性がある。また、目視での点検をするために、作業員を別途割り当てる必要がある等、点検に手間と工数とがかかっている。

【0003】

特許文献１には、ウェハを回転台に載せ、ウェハの切欠部の位置に基づきＩＤの記載位置を特定することが記載されている。特許文献１では、回転台によりウェハを回転させてＩＤの記載位置をカメラの撮影領域に移動させ、ＩＤを読み取っている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２００６－２６１５０１号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

特許文献１では、ＩＤの記載位置を特定して、回転台によりＩＤの記載位置をカメラの撮影領域に移動させることにより、ＩＤを精度よく読み取り可能にしている。しかし、特許文献１では、回転台にウェハを載せる必要があり、ウェハが間違っていた場合の手戻りが大きい。また、特許文献１では、回転台によりウェハを回転させるため、ウェハを機材である回転台に接触させており、ウェハに傷が付く可能性がある。また回転台に載せた後にウェハに傷が発見された場合に、傷が回転台の載せる前後のどちらで付いたかの判別ができず、責任の切り分けが困難になる。
本開示は、回転台等を用いることなく、対象物に示された文字列を精度よく読み取り可能にすることを目的とする。

【課題を解決するための手段】

【0006】

本開示に係る文字認識装置は、
カメラにより対象物を撮影して、前記対象物の複数の画像データを取得する画像取得部と、
前記画像取得部によって取得された前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取る読取部と、
前記正解桁数の各桁を対象の桁として、前記読取部によって前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定する推定部と
を備える。

【発明の効果】

【0007】

本開示では、複数の画像データから正解桁数の各桁について文字を読み取り、桁毎に文字を推定する。これにより、回転台等を用いて文字列が示された位置が正確に特定できていなくても、精度よく文字列を読み取り可能になる。

【図面の簡単な説明】

【0008】

【図1】実施の形態１に係る文字認識装置１０の構成図。

【図2】実施の形態１に係る文字認識装置１０の全体的な処理のフローチャート。

【図3】実施の形態１に係る正解桁数３２と正解文字列３３と指定桁３４との例を示す図。

【図4】実施の形態１に係る文字認識装置１０の使用方法の説明図。

【図5】実施の形態１に係る画面表示処理及び認識領域表示処理の説明図。

【図6】実施の形態１に係る推定画像表示処理の説明図。

【図7】実施の形態１に係る推定文字表示処理の説明図。

【図8】実施の形態１に係る読取処理のフローチャート。

【図9】実施の形態１に係る重複除去処理の説明図。

【図10】実施の形態１に係る欠損充足処理のフローチャート。

【図11】実施の形態１に係る欠損設定処理の説明図。

【図12】実施の形態１に係る欠損充足処理の説明図。

【図13】実施の形態１に係る余白計算処理の説明図。

【図14】実施の形態１に係る左側設定処理の説明図。

【図15】実施の形態１に係る右側設定処理の説明図。

【図16】実施の形態１に係る推定処理及び点検処理の説明図。

【図17】実施の形態１に係る文字確定処理の説明図。

【図18】変形例１に係るガイドの説明図。

【発明を実施するための形態】

【0009】

実施の形態１．
＊＊＊構成の説明＊＊＊
図１を参照して、実施の形態１に係る文字認識装置１０の構成を説明する。
文字認識装置１０は、コンピュータである。
文字認識装置１０は、プロセッサ１１と、メモリ１２と、ストレージ１３と、通信インタフェース１４とのハードウェアを備える。プロセッサ１１は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。

【0010】

プロセッサ１１は、プロセッシングを行うＩＣである。ＩＣはＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔの略である。プロセッサ１１は、具体例としては、ＣＰＵ、ＤＳＰ、ＧＰＵである。ＣＰＵは、ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略である。ＤＳＰは、ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒの略である。ＧＰＵは、ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略である。

【0011】

メモリ１２は、データを一時的に記憶する記憶装置である。メモリ１２は、具体例としては、ＳＲＡＭ、ＤＲＡＭである。ＳＲＡＭは、ＳｔａｔｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙの略である。ＤＲＡＭは、ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙの略である。

【0012】

ストレージ１３は、データを保管する記憶装置である。ストレージ１３は、具体例としては、ＨＤＤである。ＨＤＤは、ＨａｒｄＤｉｓｋＤｒｉｖｅの略である。また、ストレージ１３は、ＳＤ（登録商標）メモリカード、ＣｏｍｐａｃｔＦｌａｓｈ（登録商標）、ＮＡＮＤフラッシュ、フレキシブルディスク、光ディスク、コンパクトディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク、ＤＶＤといった可搬記録媒体であってもよい。ＳＤは、ＳｅｃｕｒｅＤｉｇｉｔａｌの略である。ＤＶＤは、ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋの略である。

【0013】

通信インタフェース１４は、外部の装置と通信するためのインタフェースである。通信インタフェース１４は、具体例としては、Ｅｔｈｅｒｎｅｔ（登録商標）、ＵＳＢ、ＨＤＭＩ（登録商標）のポートである。ＵＳＢは、ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓの略である。ＨＤＭＩは、Ｈｉｇｈ－ＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅの略である。

【0014】

文字認識装置１０は、通信インタフェース１４を介して、カメラ４１と、表示装置４２と接続されている。カメラ４１は、対象物を撮影するための撮影装置である。表示装置４２は、読取結果等を表示するためのＬＣＤ等のディスプレイである。ＬＣＤは、ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙの略である。

【0015】

文字認識装置１０は、機能構成要素として、画像取得部２１と、読取制御部２２と、読取部２３と、推定部２４と、点検部２５と、表示部２６とを備える。文字認識装置１０の各機能構成要素の機能はソフトウェアにより実現される。
ストレージ１３には、文字認識装置１０の各機能構成要素の機能を実現するプログラムが格納されている。このプログラムは、プロセッサ１１によりメモリ１２に読み込まれ、プロセッサ１１によって実行される。これにより、文字認識装置１０の各機能構成要素の機能が実現される。

【0016】

ストレージ１３には、背景画像３１と、正解桁数３２と、複数の正解文字列３３と、指定桁３４とが記憶される。

【0017】

図１では、プロセッサ１１は、１つだけ示されていた。しかし、プロセッサ１１は、複数であってもよく、複数のプロセッサ１１が、各機能を実現するプログラムを連携して実行してもよい。

【0018】

＊＊＊動作の説明＊＊＊
図２から図１７を参照して、実施の形態１に係る文字認識装置１０の動作を説明する。
実施の形態１に係る文字認識装置１０の動作手順は、実施の形態１に係る文字認識方法に相当する。また、実施の形態１に係る文字認識装置１０の動作を実現するプログラムは、実施の形態１に係る文字認識プログラムに相当する。

【0019】

実施の形態１では、数十枚等のひとまとまりの対象物に対してＩＤに応じた加工を行うことを想定する。ここでは、各対象物には、同じ桁数の、対象物毎に異なるＩＤが示されているとする。

【0020】

図２を参照して、実施の形態１に係る文字認識装置１０の全体的な処理を説明する。
図２の処理の前提として、ユーザによって、背景画像３１と、正解桁数３２と、複数の正解文字列３３と、指定桁３４とがストレージ１３に設定される。
背景画像３１は、カメラ４１の撮影領域にウェハ等の対象物がない状態で、カメラ４１によって撮影を行い得られた画像データである。正解桁数３２は、対象物に示された文字列の桁数である。実施の形態１では、正解桁数３２は、対象物に示されたＩＤの桁数である。正解文字列３３は、対象物の示された文字列である。実施の形態１では、正解文字列３３は、対象物に示されたＩＤであり、全ての対象物に示されたＩＤそれぞれが正解文字列３３として設定される。指定桁３４は、推定が必須の１つ以上の桁である。実施の形態１では、指定桁３４は、ＩＤを一意に特定するために必須な１つ以上の桁である。例えば、ひとまとまりの対象物に割り振られたＩＤが７桁であり、上位２桁は共通しているとする。この場合には、指定桁３４として、７桁のうち下５桁が指定される。
正解桁数３２と正解文字列３３と指定桁３４とは、例えば、図３に示すように、１つのデータとして設定されていてもよい。図３では、正解桁数３２が示す桁数の桁毎に、正解の文字と、指定桁３４が示す必須な桁であるか否かとが示されている。上位２桁（１桁目と、２桁目）はＩＤのうち共通している部分のため必須判断ではＦａｌｓｅ（必須ではない）とし、下位５桁はＩＤの特定のための必須な桁となるため、Ｔｒｕｅ（必須である）と定義される。

【0021】

実施の形態１では、図４に示すように、カメラ４１の撮影領域に、作業員が手で対象物を移動させ、カメラ４１によって得られた対象物の画像データから対象物に示された文字列であるＩＤを読み取る。作業員は、対象物に傷が付かないように保護用の手袋等を着用した上で、対象物を保持する。読み取られたＩＤが意図したＩＤであった場合に、対象物に対して加工が行われる準備が完了した状態になる。

【0022】

（ステップＳ１０１：背景読込処理）
読取制御部２２は、ストレージ１３から背景画像３１を読み込む。

【0023】

（ステップＳ１０２：第１画像取得処理）
画像取得部２１は、カメラ４１によって撮影領域を撮影して得られた画像データを取得する。なお、カメラ４１には、事前に解像度等が指定されているとする。

【0024】

（ステップＳ１０３：画像表示処理）
図５の（Ａ）に示すように、表示部２６は、ステップＳ１０２で取得された画像データに、文字を認識する認識領域を示したガイドを重畳させて表示装置４２に表示する。ガイドは、事前に左上の（ｘ，ｙ）座標と、右下の（ｘ，ｙ）座標とが指定されているとする。

【0025】

（ステップＳ１０４：認識領域表示処理）
図５の（Ｂ）に示すように、表示部２６は、ステップＳ１０２で取得された画像データのうち、ガイドが示す認識領域部分の画像を表示装置４２に表示する。

【0026】

（ステップＳ１０５：背景判定処理）
読取制御部２２は、ステップＳ１０２で取得された画像データと、ステップＳ１０１で読み込まれた背景画像３１とを比較する。読取制御部２２は、画像データと背景画像３１との差分が第１閾値以上であるか否かを判定する。
読取制御部２２は、差分が第１閾値以上である場合には、カメラ４１の撮影領域に対象物が入ったとして、処理をステップＳ１０６に進める。一方、読取制御部２２は、差分が第１閾値未満である場合には、カメラ４１の撮影領域に対象物が入っていないとして、処理をステップＳ１０２に戻す。処理がステップＳ１０２に戻された場合には、ステップＳ１０２で新たに画像データが取得される。

【0027】

（ステップＳ１０６：前画像設定処理）
読取制御部２２は、直近に取得された画像データを読取開始判定用背景画像に設定する。直近に取得された画像データとは、ステップＳ１０２で取得された画像データ、又は、後述するステップＳ１０７で取得された画像データである。

【0028】

（ステップＳ１０７：第２画像取得処理）
画像取得部２１は、カメラ４１によって撮影領域を撮影して得られた画像データを取得する。

【0029】

（ステップＳ１０８：前画像判定処理）
読取制御部２２は、ステップＳ１０７で取得された画像データと、ステップＳ１０６で設定された読取開始判定用背景画像とを比較する。読取制御部２２は、画像データと読取開始判定用背景画像との特徴の類似度が第２閾値未満であるか否かを判定する。
読取制御部２２は、特徴の類似度が第２閾値未満である場合には、文字列であるＩＤの位置を認識領域に合わせている最中であるとして、処理をステップＳ１０６に戻す。一方、読取制御部２２は、特徴の類似度が第２閾値以上である場合には、文字列であるＩＤの位置を認識領域に合わせ終わったとして、処理をステップＳ１０９に進める。

【0030】

（ステップＳ１０９：読取処理）
読取部２３は、直近に取得された画像データを対象の画像データとして、正解桁数３２の各桁について、その桁の文字を対象の画像データから読み取る。
ステップＳ１０９の処理の実行が１度目の場合には、直近に取得された画像データは、ステップＳ１０７で取得された画像データである。ステップＳ１０９の処理が２度目以降の場合には、直近に取得された画像データは、ステップＳ１１４で取得された画像データである。

【0031】

（ステップＳ１１０：推定処理）
推定部２４は、正解桁数３２の各桁を対象の桁として、これまでにステップＳ１０９で読み取られた対象の桁の文字から対象の桁の文字を推定する。

【0032】

（ステップＳ１１１：推定画像表示処理）
図６の（Ａ）に示すように、表示部２６は、ステップＳ１０９で読み取りに用いられた画像データを表示する。また、図６の（Ｂ）に示すように、表示部２６は、ステップＳ１０９で読み取りに用いられた画像データのうち、ガイドが示す認識領域部分の画像を表示装置４２に表示する。

【0033】

（ステップＳ１１２：推定文字表示処理）
図７に示すように、表示部２６は、ステップＳ１１０で推定された文字を表示する。ここでは、推定が済んでいる桁の文字だけが表示され、推定が済んでいない桁の文字は空欄が表示される。

【0034】

（ステップＳ１１３：点検処理）
点検部２５は、正解文字列３３及び指定桁３４を用いて推定が済んだか点検する。
点検部２５は、推定が済んだ場合には、処理を終了する。一方、点検部２５は、推定が済んでいない場合には、処理をステップＳ１０２に戻す。
ステップＳ１１３で点検部２５は、正解文字列３３のうち、必須判断がＴｒｕｅと定義された指定桁３４の推定が完了しているかを点検する。なお必須項目がＦａｌｓｅを含む正解桁数３２全体を点検するように構成してもよい。

【0035】

図８を参照して、実施の形態１に係る読取処理（図２のステップＳ１０９）を説明する。
（ステップＳ２０１：第１切出処理）
読取部２３は、対象の画像データから、認識領域の中心位置を基準として、物体検知モデルの入力サイズの部分画像を切り出す。例えば、読取部２３は、認識領域の中心位置を中心位置とする入力サイズの部分画像を切り出す。
物体検知モデルは、画像データを入力として、文字を検知する学習済モデルである。物体検知モデルは、入力とする画像データのサイズである入力サイズが定められている。

【0036】

（ステップＳ２０２：第１文字認識処理）
読取部２３は、ステップＳ２０１で切り出された部分画像を、物体検知モデルに入力する。
物体検知モデルは、入力された画像データから文字を検知し、検知された文字の位置と、検知された文字の認識結果とを出力する。ここでは、文字の位置として、検知された文字を囲った矩形の検知枠が出力されるとする。文字の認識結果は、検知された文字がどの文字であるかと、認識の確信度とを示す。

【0037】

（ステップＳ２０３：範囲外除去処理）
読取部２３は、ステップＳ２０２で物体検知モデルによって検知された文字のうち、認識領域外の文字を除去する。具体的には、読取部２３は、検知枠の基準割合以上が認識領域外にある文字を除去する。これにより、認識領域内の文字だけが残る。

【0038】

（ステップＳ２０４：重複除去処理）
読取部２３は、２つの文字が検知された領域の重複度が基準割合よりも高い場合には、２つの文字のうち確信度の低い方の文字を除去する。
図９を参照して具体的に説明する。物体検知モデルから出力された検知枠に重なりがある場合がある。検知枠が少しずれており、隣り合う文字の検知枠が重なってしまう場合もあるが、１つの文字が複数回検出されてしまい検知枠が重なる場合もある。読取部２３は、隣り合う文字の検知枠が重なってしまった場合には、検知枠をそのままにする。一方、読取部２３は、１つの文字が複数回検出されてしまった場合については、１つの検知枠だけを残して残りの検知枠を除去する。つまり、図９の検知枠Ｕと検知枠Ｖとが重なっている部分に関しては、検知枠をそのままにする。一方、読取部２３は、図９の検知枠Ｘと検知枠Ｙとが重なっている部分に関しては、一方の検知枠を除去する。
これを実現するために、読取部２３は、検知枠同士のＩｏＵを計算する。ＩｏＵは、ＩｎｔｅｒｓｅｃｔｉｏｎｏｖｅｒＵｎｉｏｎの略である。そして、読取部２３は、ＩｏＵが除去閾値以上の場合には、確信度が低い方の検知枠を除去する。

【0039】

（ステップＳ２０５：変数設定処理）
読取部２３は、変数Ａに正解桁数３２を設定する。読取部２３は、変数ＢにステップＳ２０３及びステップＳ２０４の処理を経て残っている検知枠の数を設定する。読取部２３は、変数ｉに初期値として１を設定する。

【0040】

（ステップＳ２０６：検知枠数判定処理）
読取部２３は、変数Ａと変数Ｂとを比較する。読取部２３は、変数Ａ＝変数Ｂの場合には、正解桁数３２と同じ数の文字が検知されているとして、処理をステップＳ２０７に進める。読取部２３は、変数Ａ＞変数Ｂの場合には、検知されていない欠損文字があるとして、処理をステップＳ２０８に進める。読取部２３は、変数Ａ＜変数Ｂの場合には、不適切な検知が行われているとして、読取処理を止めるとともに推定処理等をスキップして、処理をステップＳ１０２に戻る。

【0041】

（ステップＳ２０７：結果設定処理）
読取部２３は、検出された文字を指定側（実施の形態１では、左側とする）から順に、各桁の文字に設定する。つまり、読取部２３は、最も左側の文字を１桁目の文字に設定する。読取部２３は、左側から２番目の文字を２桁目の文字に設定する。これを繰り返し、最も指定側と逆側（実施の形態１では右側）の文字を正解桁数３２が示す桁数目の文字に設定する。

【0042】

（ステップＳ２０８：欠損充足処理）
読取部２３は、欠損文字の位置を特定する。
具体的には、読取部２３は、検出された複数の文字のうち指定側（実施の形態１では左側）の文字を１桁目の文字に設定する。読取部２３は、ｉ＝１から順に、ｉ桁目の文字と右側の隣接する文字との間の距離が基準距離以内の場合には、隣接する文字をｉ＋１桁目の文字に設定する。読取部２３は、ｉ桁目の文字と隣接する文字との間の距離が基準距離よりも長い場合には、ｉ桁目の文字の隣の基準幅のスペースを欠損文字としてｉ＋１桁目の文字に設定する。

【0043】

（ステップＳ２０９：結果出力処理）
読取部２３は、正解桁数３２の各桁について読み取った文字を推定部２４に出力する。

【0044】

図１０を参照して、実施の形態１に係る欠損充足処理（図８のステップＳ２０８）を説明する。
（ステップＳ３０１：平均幅計算処理）
読取部２３は、ステップＳ２０３及びステップＳ２０４の処理を経て残っている検知枠の幅の平均値と高さの平均値と検知枠左上の縦方向の座標（ｙ軸）の平均値とを計算する。読取部２３は、幅の平均値を基準距離に設定する。

【0045】

（ステップＳ３０２：１桁目設定処理）
読取部２３は、検出された複数の文字のうち指定側の文字を１桁目の文字に設定する。

【0046】

（ステップＳ３０３：枠間距離計算処理）
読取部２３は、変数ｉを用いて、左側からｉ番目の検知枠と、左側からｉ＋１番目の検知枠との間の距離を計算する。

【0047】

（ステップＳ３０４：距離判定処理）
読取部２３は、ステップＳ３０３で計算された距離が、基準距離以内であるかを判定する。
読取部２３は、計算された距離が基準距離以内である場合には、処理をステップＳ３０５に進める。一方、読取部２３は、計算された距離が基準距離よりも長い場合には、処理をステップＳ３０６に進める。

【0048】

（ステップＳ３０５：ｉ＋１桁目設定処理）
読取部２３は、左側からｉ＋１番目の検知枠の文字をｉ＋１桁目の文字に設定する。

【0049】

（ステップＳ３０６：欠損設定処理）
図１１のｉ＝１のケースのように、読取部２３は、左側からｉ番目の検知枠の右側の基準幅のスペースであって、左側からｉ番目の検知枠と同じ高さ範囲のスペースを欠損文字としてｉ＋１桁目に設定する。ここでは、基準幅は、ステップＳ３０１で計算された幅の平均値とする。この際、読取部２３は、欠損文字として設定したスペースに検知枠を設定する。
読取部２３は、対象の画像データから、ｉ＋１桁目に設定されたスペースの部分画像を切り出す。

【0050】

（ステップＳ３０７：第２文字認識処理）
読取部２３は、ステップＳ３０６で切り出された部分画像を、文字認識モデルに入力する。
文字認識モデルは、入力された画像データに示された文字を認識し、認識結果を出力する。文字認識モデルは、例えば、ＣＮＮによって構成される。ＣＮＮは、ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋの略である。つまり、文字認識モデルは、物体検知モデルとは異なり、文字の位置を検知したりはしない。一方で、文字認識モデルは、物体検知モデルよりも高精度に文字を認識できる可能性がある。
読取部２３は、文字認識モデルによって文字が認識された場合には、ｉ＋１桁目に認識された文字を設定する。一方、読取部２３は、文字認識モデルによって文字が認識されなかった場合には、ｉ＋１桁目は欠損文字のままとする。

【0051】

（ステップＳ３０８：インクリメント処理）
読取部２３は、変数ｉに１加算する。

【0052】

（ステップＳ３０９：変数判定処理）
読取部２３は、変数ｉ＝変数Ａであるか否かを判定する。読取部２３は、変数ｉ＝変数Ａである場合には、処理を終了する。一方、読取部２３は、変数ｉ＝変数Ａでない場合には、処理をステップＳ３１０に進める。

【0053】

（ステップＳ３１０：枠判定処理）
読取部２３は、左側からｉ番目の検知枠よりも右側に検知枠があるか否かを判定する。読取部２３は、検知枠がある場合には、処理をステップＳ３０３に戻す。一方、読取部２３は、検知枠がない場合には、処理をステップＳ３１１に進める。検知枠がない場合とは、検知された全ての文字がいずれかの桁の文字として設定されたことを意味する。

【0054】

図１２に示すように、ステップＳ３０３からステップＳ３１０の処理が繰り返し実行されることにより、最も左側の検知枠と、最も右側の検知枠との間の欠損が順次特定される。しかし、最も左側の検知枠よりも左側と、最も右側の検知枠よりも右側との欠損については、ステップＳ３０３からステップＳ３１０の処理では特定されない。そこで、ステップＳ３１１からステップＳ３１７の処理により、最も左側の検知枠よりも左側と、最も右側の検知枠よりも右側との欠損が特定される。

【0055】

（ステップＳ３１１：余白計算処理）
図１３に示すように、読取部２３は、最も左側にある検知枠から、認識領域の左側の端部までの距離を第１距離として計算する。また、読取部２３は、最も右側にある検知枠から、認識領域の右側の端部までの距離を第２距離として計算する。

【0056】

（ステップＳ３１２：左右判定処理）
読取部２３は、ステップＳ３１１で計算された第１距離と第２距離とのどちらが長いかを判定する。
読取部２３は、第１距離が長い場合には、処理をステップＳ３１３に進める。一方、読取部２３は、第２距離が長い場合には、処理をステップＳ３１４に進める。なお、読取部２３は、第１距離と第２距離とが同じ長さの場合には、ステップＳ３１３とステップＳ３１４とのうち、事前に定められた方に処理を進める。ここでは、読取部２３は、第１距離と第２距離とが同じ長さの場合には、処理をステップＳ３１４に進めるものとする。

【0057】

（ステップＳ３１３：左側設定処理）
図１４に示すように、読取部２３は、ステップＳ３０２とステップＳ３０５とステップＳ３０６とで、これまでにｊ＝１，．．．，ｉの各ｊ桁目に設定された文字を、ｊ＋１桁目の文字に設定し直す。そして、読取部２３は、最も左側の検知枠の左側の基準幅のスペースであって、最も左側の検知枠と同じ高さ範囲のスペースを欠損文字として１桁目に設定する。この際、読取部２３は、欠損文字として設定したスペースに検知枠を設定する。
読取部２３は、対象の画像データから、１桁目に設定されたスペースの部分画像を切り出す。切り出すときは、ステップＳ３０１で算出した縦方向の左上座標の平均値から幅の平均値と高さの平均値とから特定されるスペースを切り出す。

【0058】

（ステップＳ３１４：右側設定処理）
図１５に示すように、読取部２３は、最も右側の検知枠の右側の基準幅のスペースであって、最も右側の検知枠と同じ高さ範囲のスペースを欠損文字としてｉ＋１桁目に設定する。この際、読取部２３は、欠損文字として設定したスペースに検知枠を設定する。
読取部２３は、対象の画像データから、ｉ＋１桁目に設定されたスペースの部分画像を切り出す。

【0059】

（ステップＳ３１５：第３文字認識定処理）
読取部２３は、ステップＳ３１３又はステップＳ３１４で切り出された部分画像を、文字認識モデルに入力する。読取部２３は、文字認識モデルによって文字が認識された場合には、ステップＳ３１３又はステップＳ３１４の欠損文字に代えて、認識された文字を設定する。一方、読取部２３は、文字認識モデルによって文字が認識されなかった場合には、欠損文字のままとする。

【0060】

（ステップＳ３１６：インクリメント処理）
読取部２３は、変数ｉに１加算する。

【0061】

（ステップＳ３１７：変数判定処理）
読取部２３は、変数ｉ＝変数Ａであるか否かを判定する。読取部２３は、変数ｉ＝変数Ａである場合には、処理を終了する。一方、読取部２３は、変数ｉ＝変数Ａでない場合には、処理をステップＳ３１１に戻す。

【0062】

図１６を参照して、実施の形態１に係る推定処理（図２のステップＳ１１０）及び点検処理（図２のステップＳ１１３）を説明する。
ステップＳ４０１からステップＳ４０２の処理が推定処理に対応する。ステップＳ４０３からステップＳ４０５の処理が点検処理に対応する。

【0063】

（ステップＳ４０１：読取文字記録処理）
推定部２４は、正解桁数３２の桁毎に、ステップＳ１０９で読み取られた文字をメモリ１２に記録する。

【0064】

（ステップＳ４０２：文字確定処理）
推定部２４は、正解桁数３２の各桁を対象の桁として、対象の桁について同じ文字が基準回数読み取られた場合に、対象の桁の文字を読み取られた文字として推定する。例えば、図１７に示すように、基準回数を４とする。この場合には、推定部２４は、対象の桁について、ステップＳ４０１で記録された文字を参照して、同じ文字が４個存在する場合には、対象の桁の文字がその文字であると推定する。
推定部２４は、文字が推定された桁については、文字確定済として、次からのステップＳ４０２では処理対象外とする。

【0065】

（ステップＳ４０３：正解比較処理）
点検部２５は、ステップＳ４０２で文字確定済となった桁について、推定された文字と、複数の正解文字列３３それぞれにおける文字とを比較する。

【0066】

（ステップＳ４０４：終了判定処理）
点検部２５は、指定桁３４が示す全ての桁について文字が一致する正解文字列３３が特定されたか、又は、設定時間が経過したかのいずれかの状態であるかを判定する。点検部２５は、いずれかの状態である場合には、処理をステップＳ４０５に進める。一方、点検部２５は、いずれの状態でもない場合には、処理を図２のステップ１１４に進める。

【0067】

（ステップＳ４０５：正解判定処理）
指定桁３４が示す全ての桁について文字が一致する正解文字列３３が特定された場合には、表示部２６は特定された正解文字列３３を表示装置４２に表示して、処理を終了する。一方、指定桁３４が示す全ての桁について文字が一致する正解文字列３３が特定されていない場合には、表示部２６は正解を特定できない旨を表示装置４２に表示して、処理を終了する。

【0068】

＊＊＊実施の形態１の効果＊＊＊
以上のように、実施の形態１に係る文字認識装置１０は、複数の画像データから正解桁数３２の各桁について文字を読み取り、桁毎に文字を推定する。これにより、回転台等を用いて文字列が示された位置が正確に特定できていなくても、精度よく文字列を読み取り可能になる。
また実施の形態において、ガイドが示す認識領域部分のみの文字列を読み取るように構成するので、文字の推定の精度向上が見込まれる。さらにガイドは、対象物の形状やＩＤの桁数等により、円や楕円等任意の形状にすることができる。

【0069】

実施の形態１に係る文字認識装置１０は、検出できなかった欠損文字を特定する。これにより、桁毎に文字を読み取ることが可能である。

【0070】

実施の形態１に係る文字認識装置１０は、欠損文字については、文字認識モデルにより文字認識を行う。これにより、物体検知モデルでは認識できなかった文字についても、認識できる可能性がある。そのため、文字の認識精度が高くなり、対象物に示された文字列を早期に特定可能になる。

【0071】

実施の形態１に係る文字認識装置１０は、検知された領域の重複が大きい場合には、確信度が低い方の文字を除去する。これにより、１つの文字が重複して検知されてしまい、桁がずれることが防止される。

【0072】

実施の形態１に係る文字認識装置１０は、推定された各桁の文字を、正解文字列３３の対応する桁の文字と比較することにより、推定された文字列に対応する正解文字列３３を特定する。そして、実施の形態１に係る文字認識装置１０は、推定された文字列に対応する正解文字列３３が特定されると画像データの取得を終了する。これにより、不要に処理を繰り返すことがない。

【0073】

実施の形態１に係る文字認識装置１０は、背景画像の変化により対象物がカメラ４１の撮影領域に設定されたことが認識されると、画像データの取得を開始する。これにより、簡便に処理を開始することが可能である。対象物がカメラ４１の撮影領域に設定されたかを判定するため、画像データと背景画像３１との差分を取るために用いる第１閾値は、画像データと背景画像３１との差分が確認できる閾値となる。また対象物がカメラ４１の撮影領域に固定されたかを判定するため、画像データと読取開始判定用背景との差分を取るために用いる第２閾値は、画像データと読取開始判定用背景画像との差分が確認できる閾値となる。第１閾値及び第２閾値は、動的に変更することも可能である。

【0074】

＊＊＊他の構成＊＊＊
＜変形例１＞
実施の形態１では、図２のステップＳ１０３で画像データに、文字を認識する認識領域を示したガイドを重畳させて表示した。図１８に示すように、ガイドは、認識領域だけでなく、１桁目の位置を示してもよい。ガイドが１桁目の位置を示すことにより、１桁目の文字が正しい位置に設定される可能性が高くなる。そのため、実際の１桁目の文字が１桁目の文字として認識される可能性が高くなる。

【0075】

そこで、実際の１桁目の文字が１桁目の文字として認識されることを前提としてもよい。この場合には、図１０の処理を簡略化することができる。具体的には、ステップＳ３１１からステップＳ３１３の処理を省略することができる。これは、初めに１桁目として特定された文字よりも左側に文字は存在しないことが前提となるためである。したがって、ステップＳ３１１からステップＳ３１７の処理では、右側に欠損文字があるとして、順次特定されることになる。

【0076】

＜変形例２＞
実施の形態１では、図１６のステップＳ４０４で、点検部２５は、指定桁３４が示す全ての桁について文字が一致する正解文字列３３が特定されたかを判定した。しかし、図１６のステップＳ４０３で点検部２５は、ステップＳ４０２で文字確定済となった全ての桁について、文字が一致する正解文字列３３を候補文字列として特定するようにしてもよい。そして、図１６のステップＳ４０４で点検部２５は、指定桁３４が示す全ての桁について文字が一致する正解文字列３３が特定されたかを判定することに代えて、特定された候補文字列が１つになったか否かを判定してもよい。
なお、変形例２の処理を採用する場合には、指定桁３４は不要である。

【0077】

変形例２の処理を採用した場合において、図１６のステップＳ４０４で設定時間が経過したと判定された場合には、表示部２６は、特定されている複数の候補文字列を表示してもよい。

【0078】

＜変形例３＞
実施の形態１では、各機能構成要素がソフトウェアで実現された。しかし、変形例３として、各機能構成要素はハードウェアで実現されてもよい。この変形例３について、実施の形態１と異なる点を説明する。

【0079】

各機能構成要素がハードウェアで実現される場合には、文字認識装置１０は、プロセッサ１１とメモリ１２とストレージ１３とに代えて、電子回路１５を備える。電子回路１５は、各機能構成要素と、メモリ１２と、ストレージ１３との機能とを実現する専用の回路である。

【0080】

電子回路１５としては、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックＩＣ、ＧＡ、ＡＳＩＣ、ＦＰＧＡが想定される。ＧＡは、ＧａｔｅＡｒｒａｙの略である。ＡＳＩＣは、ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔの略である。ＦＰＧＡは、Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙの略である。
各機能構成要素を１つの電子回路１５で実現してもよいし、各機能構成要素を複数の電子回路１５に分散させて実現してもよい。

【0081】

＜変形例４＞
変形例４として、一部の各機能構成要素がハードウェアで実現され、他の各機能構成要素がソフトウェアで実現されてもよい。

【0082】

プロセッサ１１とメモリ１２とストレージ１３と電子回路１５とを処理回路という。つまり、各機能構成要素の機能は、処理回路により実現される。

【0083】

また、以上の説明における「部」を、「回路」、「工程」、「手順」、「処理」又は「処理回路」に読み替えてもよい。

【0084】

以下、本開示の諸態様を付記としてまとめて記載する。
（付記１）
カメラにより対象物を撮影して、前記対象物の複数の画像データを取得する画像取得部と、
前記画像取得部によって取得された前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取る読取部と、
前記正解桁数の各桁を対象の桁として、前記読取部によって前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定する推定部と
を備える文字認識装置。
（付記２）
前記画像取得部は、前記対象物の画像データを１枚ずつ順に取得し、
前記読取部は、前記画像取得部によって取得された前記画像データを順に前記対象の画像データとして前記各桁の文字を読み取り、
前記推定部は、前記対象の桁について同じ文字が基準回数読み取られた場合に、前記対象の桁の文字を読み取られた文字として推定する
付記１に記載の文字認識装置。
（付記３）
前記読取部は、前記対象の画像データから複数の文字を検知し、検知された前記複数の文字のうち指定側の文字を１桁目の文字に設定し、ｉ＝１から前記複数の文字がいずれかの桁の文字として設定されるまで、ｉ桁目の文字と隣接する文字との間の距離が基準距離以内の場合には、前記隣接する文字をｉ＋１桁目の文字に設定した上でｉに１加算し、ｉ桁目の文字と隣接する文字との間の距離が前記基準距離よりも長い場合には、前記ｉ桁目の文字の隣の基準幅のスペースを欠損文字としてｉ＋１桁目の文字に設定した上でｉに１加算することにより、前記各桁の文字を読み取る
付記１又は２に記載の文字認識装置。
（付記４）
前記読取部は、前記複数の文字がいずれかの桁の文字として設定された状態において、文字が設定された桁数が正解桁数よりも少ない場合には、前記複数の文字のうち最も指定側の文字と、文字を認識する領域の前記指定側の端部との距離である第１距離を計算するとともに、前記複数の文字のうち最も指定側と逆側の文字と、文字を認識する領域の前記指定側と逆側の端部との距離である第２距離を計算して、前記第１距離が前記第２距離よりも長い場合には、前記最も指定側の文字の前記指定側の基準幅のスペースを欠損文字として設定し、前記第２距離が前記第１距離よりも長い場合には、前記最も指定側と逆側の文字の前記指定側と逆側の基準幅のスペースを欠損文字として設定する
付記３に記載の文字認識装置。
（付記５）
前記読取部は、前記第１距離が前記第２距離よりも長い場合には、ｊ＝１，．．．，ｉの各ｊ桁目に設定された文字をｊ＋１桁目の文字に設定し直すとともに、前記最も指定側の文字の前記指定側の基準幅のスペースを欠損文字として１桁目の文字に設定し、前記第２距離が前記第１距離よりも長い場合には、前記最も指定側と逆側の文字の前記指定側と逆側の基準幅のスペースを欠損文字としてｉ＋１桁目に設定する
付記４に記載の文字認識装置。
（付記６）
前記読取部は、前記欠損文字とされたスペースの部分画像を前記画像データから切り出して、前記部分画像から文字が読み取れた場合には、読み取れた文字を前記欠損文字の代わりに設定する
付記３から５までのいずれか１項に記載の文字認識装置。
（付記７）
前記読取部は、２つの文字が検知された領域の重複度が基準割合よりも高い場合には、前記２つの文字のうち確信度の低い方の文字を除去した上で、前記各桁の文字を読み取る付記３から６までのいずれか１項に記載の文字認識装置。
（付記８）
前記文字認識装置は、さらに、
記憶装置に記憶された複数の正解文字列から、事前に指定された全ての指定桁が、前記推定部によって推定された文字と同じ文字である正解文字列を特定する点検部
を備える付記２に記載の文字認識装置。
（付記９）
前記画像取得部は、背景画像の変化により前記対象物が前記カメラの撮影領域に設定されたことが認識されると前記画像データの取得を開始し、前記点検部によって前記正解文字列が特定されると前記画像データの取得を終了する
付記８に記載の文字認識装置。
（付記１０）
前記文字認識装置は、さらに、
記憶装置に記憶された複数の正解文字列から、前記推定部によって文字が推定された全ての桁が、推定された文字と同じ文字である正解文字列を候補文字列として特定する点検部
を備える付記２に記載の文字認識装置。
（付記１１）
前記画像取得部は、背景画像の変化により前記対象物が前記カメラの撮影領域に設定されたことが認識されると前記画像データの取得を開始し、前記点検部によって特定された前記候補文字列が１つになると前記画像データの取得を終了する
付記１０に記載の文字認識装置。
（付記１２）
前記文字認識装置は、さらに、
前記画像取得部によって取得された画像データに、文字を認識する領域である認識領域を示したガイドを重畳させて表示する表示部
を備える付記１から１１までのいずれか１項に記載の文字認識装置。
（付記１３）
前記読取部は、前記ガイドが示す前記認識領域部分から文字列を読み取る
付記１２に記載の文字認識装置。
（付記１４）
前記文字認識装置は、さらに、
画像データと直近に取得された画像データである読取開始判定用背景画像との特徴の類似度が第２閾値以上あるときに、前記読取部に対して読み取りを開始するように制御する読取制御部
を備える付記１から１３のいずれか１項に記載の文字認識装置。
（付記１５）
コンピュータが、カメラにより対象物を撮影して、前記対象物の複数の画像データを取得し、
コンピュータが、前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取り、
コンピュータが、前記正解桁数の各桁を対象の桁として、前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定する文字認識方法。
（付記１６）
カメラにより対象物を撮影して、前記対象物の複数の画像データを取得する画像取得処理と、
前記画像取得処理によって取得された前記複数の画像データそれぞれを対象の画像データとして、前記対象物に示されている文字列の桁数である正解桁数の各桁について、その桁の文字を前記対象の画像データから読み取る読取処理と、
前記正解桁数の各桁を対象の桁として、前記読取処理によって前記複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定する推定処理と
を行う文字認識装置としてコンピュータを機能させる文字認識プログラム。

【0085】

以上、本開示の実施の形態及び変形例について説明した。これらの実施の形態及び変形例のうち、いくつかを組み合わせて実施してもよい。また、いずれか１つ又はいくつかを部分的に実施してもよい。なお、本開示は、以上の実施の形態及び変形例に限定されるものではなく、必要に応じて種々の変更が可能である。

【符号の説明】

【0086】

１０文字認識装置、１１プロセッサ、１２メモリ、１３ストレージ、１４通信インタフェース、２１画像取得部、２２読取制御部、２３読取部、２４推定部、２５点検部、２６表示部、３１背景画像、３２正解桁数、３３正解文字列、３４指定桁、４１カメラ、４２表示装置。

【要約】

【課題】回転台等を用いることなく、対象物に刻印された文字列を精度よく読み取り可能にする。
【解決手段】画像取得部２１は、カメラ４１により対象物を撮影して、対象物の複数の画像データを取得する。読取部２３は、複数の画像データそれぞれを対象の画像データとして、対象物に刻印されている文字列の桁数である正解桁数の各桁について、その桁の文字を対象の画像データから読み取る。推定部２４は、正解桁数の各桁を対象の桁として、複数の画像データそれぞれから読み取られた対象の桁の文字から対象の桁の文字を推定する。
【選択図】図１