IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニックi−PROセンシングソリューションズ株式会社の特許一覧

特許7464252ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム
<>
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図1
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図2
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図3
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図4
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図5
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図6
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図7
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図8
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図9
  • 特許-ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-01
(45)【発行日】2024-04-09
(54)【発明の名称】ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラム
(51)【国際特許分類】
   G06V 30/14 20220101AFI20240402BHJP
   G06T 1/00 20060101ALI20240402BHJP
   G06T 7/00 20170101ALI20240402BHJP
   G06T 7/90 20170101ALI20240402BHJP
【FI】
G06V30/14 360C
G06T1/00 510
G06T7/00 650B
G06T7/90 D
【請求項の数】 16
(21)【出願番号】P 2020022473
(22)【出願日】2020-02-13
(65)【公開番号】P2021128520
(43)【公開日】2021-09-02
【審査請求日】2023-01-26
(73)【特許権者】
【識別番号】320008672
【氏名又は名称】i-PRO株式会社
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】田中 哲夫
(72)【発明者】
【氏名】木下 英俊
(72)【発明者】
【氏名】山宮 修吾
(72)【発明者】
【氏名】山畠 利彦
【審査官】▲広▼島 明芳
(56)【参考文献】
【文献】特開2018-120445(JP,A)
【文献】特開2002-042055(JP,A)
【文献】特開2019-046225(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/00 - 30/424
G06T 1/00 - 7/90
G06V 10/00 - 20/90
(57)【特許請求の範囲】
【請求項1】
車両を撮像するカメラによって行われるナンバープレート画像補正方法であって、
撮像された撮像画像からナンバープレートを含むナンバープレート領域を抽出し、
前記ナンバープレート領域に含まれる複数の画素のそれぞれを抽出して、前記複数の画素の色空間における画素値を、均等色空間であるL*u*v*色空間における画素値に変換し、
変換された前記複数の画素の前記L*u*v*色空間における画素値をu*v*平面上にプロットし、
前記u*v*平面上にプロットされた前記複数の画素値のそれぞれに基づく近似直線を算出し、
前記u*v*平面上にプロットされた前記複数の画素値と前記近似直線との間の距離が所定距離内であるか否かを判定し、
前記所定距離内でないと判定された前記L*u*v*色空間における画素値を有する画素を前記ナンバープレートの背景画素と判定して、前記背景画素の画素を白色または前記白色に近しい色の画素値に変換して出力する、
ナンバープレート画像補正方法。
【請求項2】
変換された前記複数の画素の前記L*u*v*色空間における画素値のうち、L*値が40以下の画素をプロットする、
請求項に記載のナンバープレート画像補正方法。
【請求項3】
前記所定距離は、前記u*v*平面上における30である、
請求項に記載のナンバープレート画像補正方法。
【請求項4】
前記ナンバープレート領域の一部の領域を含む部分領域に含まれる複数の部分画素を抽出して、前記複数の部分画素の色空間における画素値を前記L*u*v*色空間における画素値に変換し、
変換された前記L*u*v*色空間における画素値のL*値に基づくヒストグラムを作成し、
前記ヒストグラムにおいて最小階調値および最大階調値を抽出し、
抽出された前記最小階調値および前記最大階調値に基づいて、前記ナンバープレート領域に含まれる前記L*u*v*色空間における画素値のL*値を正規化する、
請求項に記載のナンバープレート画像補正方法。
【請求項5】
前記部分領域は、前記ナンバープレート領域の短辺および長辺の長さの少なくとも1/2を含む領域である、
請求項に記載のナンバープレート画像補正方法。
【請求項6】
変換された前記L*u*v*色空間における画素値が正規化された前記L*値>45であるか否かを判定し、前記L*値>45であると判定された前記L*u*v*色空間における画素値を有する画素を、前記ナンバープレートの背景画素と判定する、
請求項に記載のナンバープレート画像補正方法。
【請求項7】
変換された前記L*u*v*色空間における画素値がu*値<-25またはu*値>5であるか否かを判定し、前記u*値<-25または前記u*値>5であると判定された前記L*u*v*色空間における画素値を有する画素を、前記ナンバープレートの背景画素と判定する、
請求項に記載のナンバープレート画像補正方法。
【請求項8】
車両を撮像するカメラに、
撮像された撮像画像からナンバープレートを含むナンバープレート領域を抽出するステップと、
前記ナンバープレート領域に含まれる複数の画素のそれぞれを抽出して、前記複数の画素の色空間における画素値を、均等色空間であるL*u*v*色空間における画素値に変換するステップと、
変換された複数の画素の前記L*u*v*色空間における画素値をu*v*平面上にプロットするステップと、
前記u*v*平面上にプロットされた前記複数の画素値のそれぞれに基づく近似直線を算出するステップと、
前記u*v*平面上にプロットされた前記複数の画素値と前記近似直線との間の距離が所定距離内であるか否かを判定するステップと、
前記所定距離内でないと判定された前記L*u*v*色空間における画素値を有する画素を前記ナンバープレートの背景画素と判定して、前記背景画素の画素を白色または前記白色に近しい色の画素値に変換して出力するステップと、を実現させるための、
ナンバープレート画像補正プログラム。
【請求項9】
パスポートを撮像するカメラによって行われるパスポート画像補正方法であって、
撮像された撮像画像から前記パスポートを含むパスポート領域を抽出し、
前記パスポート領域に含まれる複数の画素のそれぞれを抽出して、前記複数の画素の色空間における画素値を、均等色空間であるL*u*v*色空間における画素値に変換し、
変換された前記複数の画素の前記L*u*v*色空間における画素値をu*v*平面上にプロットし、
前記u*v*平面上にプロットされた前記複数の画素値のそれぞれに基づく近似直線を算出し、
前記u*v*平面上にプロットされた前記複数の画素値と前記近似直線との間の距離が所定距離内であるか否かを判定し、
前記所定距離内でないと判定された前記画素値を有する画素を前記パスポートの背景画素と判定して、前記背景画素の画素を白色または前記白色に近しい色の画素値に変換して出力する、
パスポート画像補正方法。
【請求項10】
変換された前記複数の画素の前記L*u*v*色空間における画素値のうち、L*値が40以下の画素をプロットする、
請求項に記載のパスポート画像補正方法。
【請求項11】
前記所定距離は、前記u*v*平面上における30である、
請求項に記載のパスポート画像補正方法。
【請求項12】
前記パスポート領域の一部の領域を含む部分領域に含まれる複数の部分画素を抽出して、前記複数の部分画素の色空間における画素値を前記L*u*v*色空間における画素値に変換し、
変換された前記L*u*v*色空間における画素値のL*値に基づくヒストグラムを作成し、
前記ヒストグラムにおいて最小階調値および最大階調値を抽出し、
抽出された前記最小階調値および前記最大階調値に基づいて、前記パスポート領域に含まれる前記L*u*v*色空間における画素値のL*値を正規化する、
請求項に記載のパスポート画像補正方法。
【請求項13】
前記部分領域は、前記パスポート領域の短辺および長辺の長さの少なくとも1/2を含む領域である、
請求項1に記載のパスポート画像補正方法。
【請求項14】
変換された前記L*u*v*色空間における画素値が正規化された前記L*値>45であるか否かを判定し、前記L*値>45であると判定された前記L*u*v*色空間における画素値を有する画素を、前記パスポートの背景画素と判定する、
請求項1に記載のパスポート画像補正方法。
【請求項15】
変換された前記L*u*v*色空間における画素値がu*値<-25またはu*値>5であるか否かを判定し、前記u*値<-25または前記u*値>5であると判定された前記L*u*v*色空間における画素値を有する画素を、前記パスポートの背景画素と判定する、
請求項に記載のパスポート画像補正方法。
【請求項16】
パスポートを撮像するカメラに、
撮像された撮像画像から前記パスポートを含むパスポート領域を抽出するステップと、
前記パスポート領域に含まれる複数の画素のそれぞれを抽出して、前記複数の画素の色空間における画素値を、均等色空間であるL*u*v*色空間における画素値に変換するステップと、
変換された前記複数の画素のL*u*v*色空間における画素値をu*v*平面上にプロットするステップと、
前記u*v*平面上にプロットされた前記複数の画素値のそれぞれに基づく近似直線を算出するステップと、
前記u*v*平面上にプロットされた前記複数の画素値と前記近似直線との間の距離が所定距離内であるか否かを判定するステップと、
前記所定距離内でないと判定された前記L*u*v*色空間における画素値を有する画素を前記パスポートの背景画素と判定して、前記背景画素の画素を白色または前記白色に近しい色の画素値に変換して出力するステップと、を実現させるための、
パスポート画像補正プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラムに関する。
【背景技術】
【0002】
特許文献1には、車両のナンバープレートである被写体を撮像し、撮像素子と被写体との間の傾きに起因する撮像画像の歪みを補正する画像補正方法が開示されている。画像補正方法は、固定された撮像素子を有するカメラによって被写体を撮像し、撮像画像全体から車両のエッジを抽出し、抽出されたエッジから水平に近い方のエッジを選択して直線成分を抽出し、撮像素子の辺と直線成分との傾き角と、撮像素子における水平面と平行な辺とナンバープレートの水平方向の線とのなす角度とを算出し、撮像画像の歪みを補正した画像に変換するとともに、この補正された撮像画像からナンバープレートの番号を認識する。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2013-251005号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述した特許文献1の画像補正方法の構成では、撮像画像の歪みを補正し、補正後の撮像画像からナンバープレートの番号を画像処理により認識することができる。しかし、特許文献1では、例えば近年使用が開始された図柄入りナンバープレート等のように文字および絵の両方が描かれたナンバープレートを対象としてナンバープレートの番号を認識することは考慮されていない。ナンバープレートの情報を正しく認識できず、このため車両の監視精度が低下する可能性があった。
【0005】
本開示は、上述した従来の事情に鑑みて案出され、撮像画像に映る対象物の文字情報を的確に認識し、カメラの撮像エリアの監視精度の低下を抑制するナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラムの提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示は、車両を撮像するカメラによって行われるナンバープレート画像補正方法であって、撮像された撮像画像からナンバープレートを含むナンバープレート領域を抽出し、前記ナンバープレート領域に含まれる複数の画素のそれぞれを抽出して、前記複数の画素の色空間における画素値を、均等色空間であるL*u*v*色空間における画素値に変換し、変換された前記複数の画素の前記L*u*v*色空間における画素値をu*v*平面上にプロットし、前記u*v*平面上にプロットされた前記複数の画素値のそれぞれに基づく近似直線を算出し、前記u*v*平面上にプロットされた前記複数の画素値と前記近似直線との間の距離が所定距離内であるか否かを判定し、前記所定距離内でないと判定された前記L*u*v*色空間における画素値を有する画素を前記ナンバープレートの背景画素と判定して、前記背景画素の画素を白色または前記白色に近しい色の画素値に変換して出力する、ナンバープレート画像補正方法を提供する。
【0007】
また、本開示は、車両を撮像するカメラに、撮像された撮像画像からナンバープレートを含むナンバープレート領域を抽出するステップと、前記ナンバープレート領域に含まれる複数の画素のそれぞれを抽出して、前記複数の画素の色空間における画素値を、均等色空間であるL*u*v*色空間における画素値に変換するステップと、変換された複数の画素の前記L*u*v*色空間における画素値をu*v*平面上にプロットするステップと、前記u*v*平面上にプロットされた前記複数の画素値のそれぞれに基づく近似直線を算出するステップと、前記u*v*平面上にプロットされた前記複数の画素値と前記近似直線との間の距離が所定距離内であるか否かを判定するステップと、前記所定距離内でないと判定された前記L*u*v*色空間における画素値を有する画素を前記ナンバープレートの背景画素と判定して、前記背景画素の画素を白色または前記白色に近しい色の画素値に変換して出力するステップと、を実現させるための、ナンバープレート画像補正プログラムを提供する。
【0008】
また、本開示は、パスポートを撮像するカメラによって行われるパスポート画像補正方法であって、撮像された撮像画像から前記パスポートを含むパスポート領域を抽出し、前記パスポート領域に含まれる複数の画素のそれぞれを抽出して、前記複数の画素の色空間における画素値を、均等色空間であるL*u*v*色空間における画素値に変換し、変換された前記複数の画素の前記L*u*v*色空間における画素値をu*v*平面上にプロットし、前記u*v*平面上にプロットされた前記複数の画素値のそれぞれに基づく近似直線を算出し、前記u*v*平面上にプロットされた前記複数の画素値と前記近似直線との間の距離が所定距離内であるか否かを判定し、前記所定距離内でないと判定された前記画素値を有する画素を前記パスポートの背景画素と判定して、前記背景画素の画素を白色または前記白色に近しい色の画素値に変換して出力する、パスポート画像補正方法を提供する。
【0009】
また、本開示は、パスポートを撮像するカメラに、撮像された撮像画像から前記パスポートを含むパスポート領域を抽出するステップと、前記パスポート領域に含まれる複数の画素のそれぞれを抽出して、前記複数の画素の色空間における画素値を、均等色空間であるL*u*v*色空間における画素値に変換するステップと、変換された前記複数の画素のL*u*v*色空間における画素値をu*v*平面上にプロットするステップと、前記u*v*平面上にプロットされた前記複数の画素値のそれぞれに基づく近似直線を算出するステップと、前記u*v*平面上にプロットされた前記複数の画素値と前記近似直線との間の距離が所定距離内であるか否かを判定するステップと、前記所定距離内でないと判定された前記L*u*v*色空間における画素値を有する画素を前記パスポートの背景画素と判定して、前記背景画素の画素を白色または前記白色に近しい色の画素値に変換して出力するステップと、を実現させるための、パスポート画像補正プログラムを提供する。
【発明の効果】
【0010】
本開示によれば、撮像画像に映る対象物の文字情報を的確に認識し、カメラの撮像エリアの監視精度の低下を抑制できる。
【図面の簡単な説明】
【0011】
図1】実施の形態1に係るカメラの内部構成例を示す図
図2】実施の形態1に係るカメラの動作手順例を示すフローチャート
図3】L*値の正規化手順例を示すフローチャート
図4】L*値の正規化手順例を説明する図
図5】u*v*平面上における近似直線の算出手順例を示すフローチャート
図6】ナンバープレートにおける近似直線の算出手順例を説明する図
図7】パスポートにおける近似直線の算出手順例を説明する図
図8】実施の形態1に係るカメラの画像処理手順例を示すフローチャート
図9】ナンバープレートにおける画像処理例を示す図
図10】パスポートにおける画像処理例を示す図
【発明を実施するための形態】
【0012】
以下、適宜図面を参照しながら、本開示に係るナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラムの構成および作用を具体的に開示した実施の形態1を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になることを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるものであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
【0013】
図1は、実施の形態1に係るカメラC1の内部構成例を示す図である。実施の形態1に係るカメラC1は、文字認識を実行したい対象物(ナンバープレート、パスポート等の文字情報を含むもの)を撮像可能に設置されたカメラであり、例えば監視カメラ、あるいはPC(Personal Computer)、タブレット端末、スマートフォン等に設けられたカメラであってもよい。なお、実施の形態1におけるカメラC1について、ナンバープレートまたはパスポートの撮像画像を画像処理して文字認識を実行する例を示すが、対象物はこれに限定されないことは言うまでもない。
【0014】
実施の形態1に係るカメラC1は、撮像された撮像画像に映る対象物(例えば、ナンバープレートあるいはパスポート)を検出し、検出された対象物の全体(全域)が映る領域を画像処理する。カメラC1は、画像処理後の対象領域に含まれる文字情報を認識し、認識結果を出力する。なお、認識される文字情報は、予めユーザにより指定あるいは設定された場所の文字情報であってもよいし、対象物に含まれるすべての文字情報であってもよい。さらに文字情報は、文字に限定されず、数字、記号等を含んでよい。カメラC1は、通信部10と、プロセッサ11と、メモリ12と、撮像部13とを備える。
【0015】
通信部10は、外部接続装置(例えば、レコーダ、PC、タブレット端末、スマートフォン等)との間でデータ通信可能に接続される。通信部10は、プロセッサ11から入力された画像処理された対象画像、あるいはこの対象画像と文字認識結果とを外部接続端末(不図示)へ送信する。
【0016】
プロセッサ11は、例えばCPU(Central Processing unit)またはFPGA(Field Programmable Gate Array)を用いて構成され、メモリ12と協働して、各種の処理および制御を行う。具体的には、プロセッサ11はメモリ12に保持されたプログラムおよびデータを参照し、そのプログラムを実行することにより、各部の機能を実現する。
【0017】
プロセッサ11は、撮像部13によって撮像され、入力された撮像画像から対象物を検出し、この対象物の全体を含む対象領域を切り出す。例えば、プロセッサ11は、対象物がナンバープレートである場合には、車両が撮像された撮像画像から対象物としてのナンバープレートを検出し、検出されたナンバープレートの対象領域(ナンバープレート領域の一例)を切り出す。また、例えばプロセッサ11は、対象物がパスポートである場合には、撮像画像からパスポートを検出し、検出されたパスポートの対象領域(パスポート領域の一例)を切り出す。
【0018】
プロセッサ11は、切り出された対象物の対象領域に含まれる複数の画素のそれぞれに基づいて、対象領域に含まれる複数の画素のそれぞれが文字または背景のいずれであるかを判定する。ここで、プロセッサ11は、対象領域に含まれる複数の画素をRGB色空間(第1の色空間の一例)の画素値からL*u*v*色空間(第2の色空間の一例)の画素値に変換する。プロセッサ11は、複数の画素のそれぞれをRGB色空間の画素値からL*u*v*色空間の画素値に変換することで、上述した判定処理において画素ごとの色差を色の距離(数値)として算出できる。
【0019】
ここで、L*u*v*色空間について説明する。L*u*v*色空間は、所謂CIE 1976 色空間、またはCIE Luv色空間であって、国際照明委員会(CIE=Commission internationale de l’eclairage(フランス語))によって採択された色空間であり、色差の均一性を有する。L*u*v*色空間の画素値は、XYZ色空間(所謂、CIE 1931 XYZ色空間)の画素値を所定の数式を用いて変換することにより、算出できる。
【0020】
また、XYZ色空間の画素値は、sRGB色空間の画素値を所定の変換行列により変換することにより算出できる。ここで、sRGB色空間は、国際電気標準会議(IEC=International Electrotechnical Commission)により標準化された色空間である。さらにsRGB色空間の画素値は、RGB色空間の画素値を所定の変換行列により変換することで算出できる。
【0021】
つまり、プロセッサ11は、RGB色空間の画素値を複数の色空間への変換処理を介してL*u*v*色空間の画素値に変換できる。具体的に、プロセッサ11は、RGB色空間の画素値をsRGB色空間の画素値に変換し、さらにsRGB色空間の画素値をXYZ色空間の画素値に変換した後、XYZ色空間の画素値をL*u*v*色空間の画素値に変換することで、RGB色空間の画素値をL*u*v*色空間の画素値に変換できる。
【0022】
なお、実施の形態1に係るカメラC1は、RGB色空間の画素値をL*u*v*色空間の画素値に変換する例について説明するが、撮像画像から抽出されるYUV色空間の画素値をRGB色空間の画素値に変換し、RGB色空間の画素値を上述した手順でL*u*v*色空間の画素値に変換してもよい。
【0023】
プロセッサ11は、L*u*v*色空間における画素値および色の距離に基づいて、複数の画素のそれぞれが文字部分または背景部分のいずれの画素であるかを判定する。プロセッサ11は、判定の結果、対象領域に含まれる画素のうち背景部分と判定された画素を、文字の色と識別可能な色な白色または白色に近しい色の画素値に階調変換する画像処理を実行する。なお、ここで実行される階調変換は、例えばガンマ変換である。プロセッサ11は、対象物の対象領域に含まれる文字情報を認識し、認識結果を通信部10に出力する。なお、プロセッサ11は、画像処理後の対象物の対象領域の画像と認識結果とを対応付けて通信部10に出力してもよい。
【0024】
メモリ12は、例えばプロセッサ11の各処理を実行する際に用いられるワークメモリとしてのRAM(Random Access Memory)と、プロセッサ11の動作を規定したプログラムおよびデータを格納するROM(Read Only Memory)とを有する。RAMには、プロセッサ11により生成あるいは取得されたデータもしくは情報が一時的に保存される。ROMには、プロセッサ11の動作を規定するプログラムが書き込まれている。また、メモリ12は、カメラC1の初期設定として算出された近似直線に関する情報を記憶する。
【0025】
撮像部13は、少なくともレンズ(不図示)とイメージセンサ(不図示)とを有して構成される。イメージセンサは、例えばCCD(Charged-coupled device)あるいはCMOS(Complementary metal-oxide-semiconductor)などの固体撮像素子であり、撮像面に結像した光学像を電気信号に変換する。撮像部13は、撮像された撮像画像をプロセッサ11に出力する。
【0026】
図2は、実施の形態1に係るカメラC1の動作手順例を示すフローチャートである。なお、図2のステップSt4に示す画像処理は、図3図6および図8に示すフローチャートを用いて詳細に説明する。
【0027】
プロセッサ11は、撮像された対象物(例えば、ナンバープレート、パスポート等)の撮像画像を、撮像部13からの入力により取得する(St1)。
【0028】
プロセッサ11は、撮像画像からユーザにより予め設定された対象物を検出する(St2)。
【0029】
プロセッサ11は、撮像画像から検出された対象領域を切り出し(St3)、切り出された対象物の対象領域に画像処理を実行する(St4)。
【0030】
プロセッサ11は、画像処理後の対象物の対象領域から予めユーザ操作により設定された各文字塊(例えば、図9および図10に示すテーブルTBn21,TBp21に含まれる項目情報であって、ナンバープレートの車両番号、パスポートの旅券情報等)を抽出して、文字認識を実行する(St5)。
【0031】
プロセッサ11は、認識された文字情報を認識結果として通信部10に出力する(St6)。なお、ここでプロセッサ11は、画像処理後の対象物の対象領域の画像と認識結果とを対応付けて出力してもよい。
【0032】
図3および図4を参照して、L*u*v*色空間に変換された画素の画素値について、L*値を正規化する正規化手順について説明する。図3は、L*値の正規化手順例を示すフローチャートである。図4は、L*値の正規化手順例を説明する図である。
【0033】
まず、プロセッサ11は、図2に示すステップSt3の処理において切り出された対象物(ナンバープレート)の対象領域ARn1において、対角線の交点(中央)位置(不図示)と、対象物の対象領域ARn1(ナンバープレート領域の一例)の幅Wおよび高さHとを算出する。
【0034】
プロセッサ11は、対象領域ARn1の中央位置を同じく中央位置として、例えば幅W/2および高さH/2の領域を部分領域ARn2として設定し、部分領域ARn2に含まれる複数の画素を抽出する(St4-11)。なお、部分領域ARn2の大きさは、幅W/2および高さH/2に限定されない。部分領域ARn2は、対象物(ナンバープレートあるいはパスポート等)以外の部分の画素(つまり、車体、パスポートを載置するテーブル等)を含まない領域、かつ文字部分の画素を含む領域が設定されることが好ましい。よって、カメラC1は、文字認識を行いたい対象物ごとに部分領域の大きさ、部分領域の中央位置等を任意に設定されてよい。
【0035】
なお、部分領域ARn2として設定される領域は、上述した対象領域ARn1の幅W/2および高さH/2の領域に限定されないことは言うまでもない。部分領域ARn2は、例えば対象領域ARn1の幅W/3および高さH/3の領域であってもよいし、対象領域ARn1の幅W/3および高さH/2の領域であってもよい。
【0036】
また、部分領域ARn2は、カメラC1が撮像する対象物によって領域の位置を変更してもよい。例えば、部分領域は、対象領域の四隅のうち右下の角から幅W/3および高さH/3の領域であってもよい。
【0037】
カメラC1は、部分領域ARn2を設定することにより、対象物以外の領域の画素を抽出することを抑制できる。さらに、カメラC1は、部分領域ARn2を設定することにより、対象物が斜めに歪んで撮像された撮像画像であっても、同様に対象物以外の領域の画素を抽出することを抑制できる。
【0038】
プロセッサ11は、抽出された各画素の画素値をRGB色空間の画素値からL*u*v*色空間の画素値に変換する(St4-12)。
【0039】
プロセッサ11は、変換された部分領域ARn2に含まれる画素のL*u*v*色空間における画素値のうち、明度を示すL*値について、ヒストグラムHG0を作成する(St4-13)。なお、図5に示すヒストグラムHG0は、部分領域ARn2に含まれる画素のL*値に基づく明度の分布を示す。ヒストグラムHG0は、横軸が明度(L*値)を示し、右端に近づくほど明るく、左端に近づくほど暗くなる。
【0040】
プロセッサ11は、部分領域ARn2に含まれる画素のうちL*値のヒストグラムHG0に用いられていない未処理の画素があるか否かを判定する(St4-14)。
【0041】
プロセッサ11は、ステップSt4-14の処理において、部分領域ARn2に含まれる画素のうちL*値のヒストグラムHG0に用いられていない未処理の画素がある場合(St4-14,YES)、部分領域ARn2における未処理の画素を抽出し(St4-16)、この抽出された未処理の画素の画素値をRGB色空間の画素値からL*u*v*色空間の画素値に変換する。
【0042】
一方、プロセッサ11は、ステップSt4-14の処理において、部分領域ARn2含まれる画素のうちL*値のヒストグラムHG0に用いられていない未処理の画素がない場合(St4-14,NO)、作成されたL*値のヒストグラムHG0における最小階調値L*minおよび最大階調値L*maxをそれぞれ抽出する(St4-15)。
【0043】
プロセッサ11は、対象領域内に含まれるすべての画素を抽出し、抽出されたすべての画素をRGB色空間の画素値からL*u*v*色空間の画素値に変換する(St4-17)。
【0044】
プロセッサ11は、抽出された最小階調値L*minおよび最大階調値L*maxに基づいて、すべての画素のL*値について、最小階調値L*minをL*=0(ゼロ)、最大階調値L*maxをL*=100として正規化する(St4-18)。図5には、ヒストグラムHG0を正規化した正規化ヒストグラムHG1のイメージ図を示す。
【0045】
ここで、L*値の正規化処理の効果について説明する。実施の形態1に係るカメラC1によって撮像された撮像画像に映る対象物は、時間,天候等の条件により、文字部分の明度(つまりL*値)が異なる。よって、カメラC1は、実際に撮像された撮像画像のうち、部分領域ARn2に含まれる画素についてL*値のヒストグラムHG0を作成して正規化することにより、画素が対象物の文字部分の画素か背景部分の画素かをより的確に判定できる。
【0046】
図5を参照して、対象物の文字の色を示す近似直線を算出する算出手順について説明する。図5は、L*u*v*色空間の画素値のうちu*v*平面上における文字部分の色を示す近似直線の算出手順例を示すフローチャートである。算出された近似直線は、図8に示すフローチャートのステップSt4-31における処理において、画素が文字部分であるか否かの判定に用いられる。
【0047】
プロセッサ11は、メモリ12に既に算出済みの近似直線に関する情報が記憶されているか否かを判定する(St4-21)。プロセッサ11は、メモリ12に算出済みの近似直線に関する情報が記憶されていると判定した場合(St4-21,YES)、ステップSt4-17の処理において変換されたすべての画素について、画素の画素値(u*,v*)と算出された近似直線との間の距離を画素ごとに算出する(St4-27)。
【0048】
一方、プロセッサ11は、メモリ12に算出済みの近似直線に関する情報が記憶されていないと判定した場合(St4-21,NO)、ステップSt4-22の処理に移行し、近似直線を算出する。ここで、図5に示す対象物の文字の色を示す近似直線を算出する処理(ステップSt4-22~ステップSt4-26の処理)は、カメラC1が設置された際の初期設定として算出されてメモリ12に記憶される。ここで、メモリ12に記憶される近似直線に関する情報は、算出された近似直線の式および線分である近似直線の両端の座標(u*,v*)情報であり、次回以降の撮像画像の画像処理においてプロセッサ11により参照される。
【0049】
プロセッサ11は、図2に示すステップSt3の処理において切り出された対象物の対象領域に文字認識処理を実行し、文字であると識別された文字部分に含まれる画素を抽出する(St4-22)。
【0050】
プロセッサ11は、抽出された文字部分に含まれる画素の画素値を、RGB色空間の画素値からL*u*v*色空間の画素値に変換する(St4-23)。
【0051】
プロセッサ11は、L*u*v*色空間におけるu*v*平面上に、変換された画素をプロットする(St4-24)。
【0052】
なお、ここでプロセッサ11は、画素のL*u*v*色空間における画素値のうち、明度を示すL*値が文字部分の明度を示す所定の閾値(例えば40)以下であるか否か(つまり、画素の色が暗いかどうか)を判定してもよい。プロセッサ11は、L*値が所定の閾値(例えばL*値≦40)であると判定された画素のみをu*v*平面上にプロットしてよい。
【0053】
さらに、実施の形態1に係るカメラC1が撮像する対象物の文字の色は、例えばナンバープレート、パスポート等のように黒に近い暗い色である例を示すが、これに限定されないことは言うまでもない。例えば、背景が黒色であって文字が白色、背景が赤であって文字が暗い緑等の場合、上述した閾値40はユーザにより設定が適宜変更されてよい。
【0054】
プロセッサ11は、対象物の対象領域のうち、2つ以上の複数の画素のそれぞれがプロットされたか否かを判定する(St4-25)。
【0055】
プロセッサ11は、ステップSt4-25の処理において、2つ以上の複数の画素のそれぞれがプロットされている(St4-25,YES)場合、u*v*平面上にプロットされた複数の画素の画素値(u*,v*)のそれぞれに基づいて、これらの画素の画素値の近似直線を算出する(St4-26)。
【0056】
一方、プロセッサ11は、ステップSt4-25の処理において、2つ以上の複数の画素のそれぞれがプロットされていない(St4-25,NO)場合、ステップSt4-22における処理に移行し、対象物の対象領域の文字部分に含まれる画素を抽出する(St4-26)。
【0057】
プロセッサ11は、ステップSt4-17の処理において変換されたすべての画素について、画素の画素値(u*,v*)と算出された近似直線との間の距離を画素ごとに算出する(St4-27)。
【0058】
ここで、図6および図7を参照して、図5に示す対象物の文字の色を示す近似直線の算出手順をより詳細に説明する。図6は、ナンバープレートにおける近似直線SLnの算出手順例を説明する図である。図7は、パスポートにおける近似直線SLpの算出手順例を説明する図である。なお、図6および図7に示す各数値は一例であって、これに限定されないことは言うまでもない。
【0059】
まず、ナンバープレートにおける近似直線SLnの算出手順例について説明する。カメラC1は、車両を撮像し、撮像された撮像画像からナンバープレートを検出するとともに、ナンバープレートの全体を含んで切り出した対象領域画像を生成する。プロセッサ11は、対象領域画像の文字部分を検出し、検出された文字部分から任意の9画素を抽出する。なお、抽出される画素数は、文字と判定されるL*値を有する2以上の画素数であればよい。
【0060】
変換テーブルTBnは、抽出された9画素についてRGB色空間の画素値、および変換されたL*u*v*色空間の画素値のそれぞれを、L*u*v*色空間の画素値のL*値について降順にソートしたテーブルである。L*値は、変換テーブルTBnの右側に示すL*値(明度)の指標のように、L*値(明度)が大きくなるほど明るくなり、L*値が小さくなるほど暗くなる。
【0061】
ここで、実施の形態1に係るカメラC1がナンバープレートを撮像する例において、対象物としてのナンバープレートの文字の色は一般的に黒色等の暗い色である。よって、変換テーブルTBnに含まれる9画素(L*u*v*色空間)のうちL*値が所定の閾値40より大きい画素は、ナンバープレートの背景部分の画素であると判定する。なお、背景部分の画素と判定されるL*値の閾値は、40に限定されないことは言うまでもない。閾値は、カメラC1の性能あるいは周囲の環境(日当たり等)に応じてユーザにより任意の値に設定されてよい。
【0062】
グラフGPnは、L*u*v*色空間におけるu*v*平面を示し、変換テーブルTBnに示す9画素をプロットしたグラフである。なお、L*u*v*色空間におけるu*軸は、u*の値(以降、「u*値」と表記)が-(マイナス)方向に大きくなるほど緑色が濃くなる。また、L*u*v*色空間におけるv*軸は、v*の値(以降、「v*値」と表記)が+(プラス)方向に大きくなるほど黄色が濃くなる。ここで、グラフGPn上にプロットされた9つの画素点Pt1,Pt2,Pt3,Pt4,Pt5,Pt6,Pt7,Pt8,Pt9のそれぞれについて説明する。
【0063】
画素点Pt1は、RGB色空間における画素値(R,G,B)=(255,255,255)、およびL*u*v*色空間における画素値(L*,u*,v*)=(100.00,0.00,0.00)で示される画素である。
【0064】
画素点Pt2は、RGB色空間における画素値(R,G,B)=(210,220,212)、およびL*u*v*色空間における画素値(L*,u*,v*)=(86.82,-5.16,5.02)で示される画素である。
【0065】
画素点Pt3は、RGB色空間における画素値(R,G,B)=(75,88,78)、およびL*u*v*色空間における画素値(L*,u*,v*)=(36.03,-6.45,6.08)で示される画素である。
【0066】
画素点Pt4は、RGB色空間における画素値(R,G,B)=(27,43,30)、およびL*u*v*色空間における画素値(L*,u*,v*)=(15.77,-6.20,6.45)で示される画素である。
【0067】
画素点Pt5は、RGB色空間における画素値(R,G,B)=(45,66,49)、およびL*u*v*色空間における画素値(L*,u*,v*)=(25.79,-9.49,9.80)で示される画素である。
【0068】
画素点Pt6は、RGB色空間における画素値(R,G,B)=(31,54,34)、およびL*u*v*色空間における画素値(L*,u*,v*)=(20.22,-9.54,10.78)で示される画素である。
【0069】
画素点Pt7は、RGB色空間における画素値(R,G,B)=(39,63,41)、およびL*u*v*色空間における画素値(L*,u*,v*)=(24.15,-10.56,12.53)で示される画素である。
【0070】
画素点Pt8は、RGB色空間における画素値(R,G,B)=(37,59,38)、およびL*u*v*色空間における画素値(L*,u*,v*)=(22.52,-9.54,11.78)で示される画素である。
【0071】
画素点Pt9は、RGB色空間における画素値(R,G,B)=(19,40,21)、およびL*u*v*色空間における画素値(L*,u*,v*)=(13.89,-7.49,8.85)で示される画素である。
【0072】
プロセッサ11は、複数の画素点Pt1~Pt9のそれぞれのうち、L*値>40である複数の画素点Pt1,Pt2のそれぞれをナンバープレートの背景部分の画素と判定する。また、プロセッサ11は、複数の画素点Pt1~Pt9のそれぞれのうち、L*値≦40である複数の画素点Pt3~Pt9のそれぞれをナンバープレートの文字部分の画素と判定する。
【0073】
プロセッサ11は、ナンバープレートの文字部分の画素であると判定された複数の画素点Pt3~Pt9のそれぞれに基づく近似直線SLnを算出する。図6に示す例において、近似直線SLnは、v*=-1.3912×(u*)-2.3133と算出される。
【0074】
エリアARNは、近似直線SLpから所定の距離Dpを示す範囲であって、図8に示すステップSt4-31で用いられる閾値TH4である。距離Dpは、近似直線SLnが示す文字の色からの距離Dp内の色弁域(同じ色に見える領域)を示す。これにより、エリアARPに含まれない画素は、文字部分の画素に基づいて算出された近似直線SLnの色弁域外の画素であるため、ナンバープレートの背景部分の画素であると判定される。一方、エリアARPに含まれる画素は、文字部分の画素に基づいて算出された近似直線SLnの色弁域内の画素であるため、ナンバープレートの文字部分の画素であると判定される。
【0075】
プロセッサ11は、ナンバープレートの対象領域において抽出された画素について、エリアARN内、つまり閾値TH4(距離Dn)である場合、その画素をナンバープレートの文字部分と判定する。なお、距離Dnおよび閾値TH4は、図6に示す例において閾値TH4(距離Dn)=30であるが、これに限定されないことは言うまでもない。
【0076】
次に、パスポートにおける近似直線SLpの算出手順例について説明する。カメラC1は、撮像された撮像画像からパスポートを検出するとともに、パスポートの全体を含んで切り出した対象領域画像を生成する。プロセッサ11は、対象領域画像の文字部分を検出し、この文字部分から任意の9画素を抽出する。なお、抽出される画素数は、文字と判定されるL*値を有する2以上の画素数であればよい。
【0077】
変換テーブルTBpは、抽出された9画素についてRGB色空間の画素値、および変換されたL*u*v*色空間の画素値のそれぞれを、L*u*v*色空間の画素値のL*値について降順にソートしたテーブルである。L*値は、変換テーブルTBpの右側に示すL*値(明度)の指標のように、L*値(明度)が大きくなるほど明るくなり、L*値が小さくなるほど暗くなる。
【0078】
グラフGPpは、L*u*v*色空間におけるu*v*平面を示し、変換テーブルTBnに示す9画素をプロットしたグラフである。なお、L*u*v*色空間におけるu*軸は、u*値が+(プラス)方向に大きくなるほど赤色が濃くなる。また、L*u*v*色空間におけるv*軸は、v*値が+(プラス)方向に大きくなるほど黄色が濃くなる。ここで、グラフGPp上にプロットされていない2つの画素点と、グラフGPp上にプロットされた7つの画素点Pt11,Pt12,Pt13,Pt14,Pt15,Pt16,Pt17のそれぞれについて説明する。
【0079】
なお、図7に示す例においてプロセッサ11は、抽出された画素について、L*u*v*色空間のL*値を算出した後、L*値>40であるか否かを判定する。プロセッサ11は、L*値>40と判定された画素を背景部分の画素と判定し、u*v*平面上にプロットしない。
【0080】
変換テーブルTBpのうち最もL*値が大きい画素は、RGB色空間における画素値(R,G,B)=(255,255,255)、およびL*u*v*色空間における画素値(L*,u*,v*)=(100.00,0.00,0.00)で示される画素である。この画素は、L*値>40であるため、グラフGPnにおいてプロットが省略されている。
【0081】
変換テーブルTBpのうち2番目にL*値が大きい画素は、RGB色空間における画素値(R,G,B)=(182,174,153)、およびL*u*v*色空間における画素値(L*,u*,v*)=(71.23,5.99,16.79)で示される画素である。この画素は、L*値>40であるため、グラフGPnにおいてプロットが省略されている。
【0082】
画素点Pt11は、RGB色空間における画素値(R,G,B)=(79,70,48)、およびL*u*v*色空間における画素値(L*,u*,v*)=(30.05,6.55,15.46)で示される画素である。
【0083】
画素点Pt12は、RGB色空間における画素値(R,G,B)=(50,40,17)、およびL*u*v*色空間における画素値(L*,u*,v*)=(16.68,6.42,12.51)で示される画素である。
【0084】
画素点Pt13は、RGB色空間における画素値(R,G,B)=(43,32,15)、およびL*u*v*色空間における画素値(L*,u*,v*)=(13.11,6.16,8.91)で示される画素である。
【0085】
画素点Pt14は、RGB色空間における画素値(R,G,B)=(39,29,10)、およびL*u*v*色空間における画素値(L*,u*,v*)=(11.50,5.43,8.82)で示される画素である。
【0086】
画素点Pt15は、RGB色空間における画素値(R,G,B)=(26,17,0)、およびL*u*v*色空間における画素値(L*,u*,v*)=(5.61,3.49,5.79)で示される画素である。
【0087】
画素点Pt16は、RGB色空間における画素値(R,G,B)=(20,10,0)、およびL*u*v*色空間における画素値(L*,u*,v*)=(3.30,2.81,3.32)で示される画素である。
【0088】
画素点Pt17は、RGB色空間における画素値(R,G,B)=(14,5,0)、およびL*u*v*色空間における画素値(L*,u*,v*)=(1.82,1.99,1.78)で示される画素である。
【0089】
プロセッサ11は、複数の画素点Pt11~Pt17のそれぞれをパスポートの文字部分の画素と判定する。
【0090】
プロセッサ11は、ナンバープレートの文字部分の画素であると判定された複数の画素点Pt11~Pt17のそれぞれに基づく近似直線SLpを算出する。図7に示す例において、近似直線SLnは、v*=-2.4186×(u*)-3.265と算出される。
【0091】
エリアARPは、近似直線SLpから所定の距離Dpを示す範囲であって、図8に示すステップSt4-31で用いられる閾値TH4である。距離Dpは、近似直線SLpが示す文字の色からの距離Dp内の色弁域(同じ色に見える領域)を示す。これにより、エリアARPに含まれない画素は、文字部分の画素に基づいて算出された近似直線SLpの色弁域外の画素であるため、パスポートの背景部分の画素であると判定される。一方、エリアARPに含まれる画素は、文字部分の画素に基づいて算出された近似直線SLpの色弁域内の画素であるため、パスポートの文字部分の画素であると判定される。
【0092】
プロセッサ11は、パスポートの対象領域から抽出された画素について、エリアARP内、つまり閾値TH4(距離Dp)である場合、その画素をパスポートの文字部分と判定する。なお、距離Dpおよび閾値TH4は、図7に示す例において閾値TH4(距離Dp)=30であるが、これに限定されないことは言うまでもない。
【0093】
図8を参照して、プロセッサ11による対象物の対象領域への画像処理手順について説明する。図8は、実施の形態1に係るカメラC1の画像処理手順例を示すフローチャートである。
【0094】
プロセッサ11は、図3に示すステップSt4-17で変換された画素のu*値、ステップSt4-18で正規化されたL*値、およびメモリ12に記録された近似直線と各画素との間の距離のそれぞれを用いて、対象物の対象領域に含まれるすべての画素について、以下の4つの判定処理を実行する(St4-31)。
【0095】
プロセッサ11は、1つ目の判定処理として、ステップSt4-18において正規化されたL*値が閾値TH1より大きいか否かを判定する。ここで、閾値TH1は、ユーザ操作により設定された明度であって、例えば閾値TH1=45である。なお、この閾値TH1は、上述の例に限定されず、対象物ごとに設定されてよい。これにより、プロセッサ11は、L*値が示す明度が文字の色でないか否かを判定する。
【0096】
プロセッサ11は、2つ目の判定処理として、ステップSt4-17において変換されたu*値が閾値TH2より小さいか否かを判定する。ここで、閾値TH2は、ユーザ操作により設定された値であって、例えば対象物がナンバープレートの場合では閾値TH2=-25、対象物がナンバープレートの場合では閾値TH2=-5である。なお、この閾値TH2は、上述の例に限定されず、対象物ごとに設定されてよい。これにより、プロセッサ11は、u*値が文字の色でないか否かを判定する。
【0097】
プロセッサ11は、3つ目の判定処理として、ステップSt4-17において変換されたu*値が閾値TH3より大きいか否かを判定する。ここで、閾値TH3は、ユーザ操作により設定された値であって、例えば対象物がナンバープレートの場合では閾値TH3=20、対象物がナンバープレートの場合では閾値TH3=5である。なお、この閾値TH3は、上述の例に限定されず、対象物ごとに設定されてよい。これにより、プロセッサ11は、u*値が文字の色でないか否かを判定する。
【0098】
プロセッサ11は、4つ目の判定処理として、対象領域に含まれる画素の画素値と近似直線との間の距離が閾値TH4より大きいか否かを判定する。ここで、閾値TH4は、ユーザ操作により設定された色弁域であって、例えば閾値TH4=30である。なお、この閾値TH4は、上述の例に限定されず、対象物ごとに設定されてよい。これにより、プロセッサ11は、抽出された画素が文字の色でないか否かを判定する。
【0099】
プロセッサ11は、上述した4つの判定処理の結果、画素がL*値>閾値TH1、u*値<閾値TH2、u*値>閾値TH3、または距離>閾値TH4のいずれかの条件を満たすと判定した場合(St4-31,YES)、この画素を背景の画素と判定し、白色または白色に近しい色に変換して出力する(St4-32)。なお、ここでいう距離は、最短距離を示し、u*v*平面上における画素から近似直線に向かって引かれた垂線の長さである。
【0100】
プロセッサ11は、上述した4つの判定処理の結果、画素がL*値>閾値TH1、u*値<閾値TH2、u*値>閾値TH3、または距離>閾値TH4のいずれの条件も満たさないと判定した場合(St4-31,NO)、この画素を文字部分の画素と判定し、そのまま出力する(St4-33)。
【0101】
プロセッサ11は、対象領域に含まれるすべての画素のうち、ステップSt4-31における判定処理が未処理の画素があるか否かを判定する(St4-34)。
【0102】
プロセッサ11は、判定処理が未処理の画素があると判定した場合(St4-34,YES)、この未処理の画素を抽出して、ステップSt4-31の処理に戻る。プロセッサ11は、抽出された画素への4つの判定処理を実行する。
【0103】
一方、プロセッサ11は、判定処理が未処理の画素がないと判定した場合(St4-34,NO)、対象領域への画像処理を終了するとともに、ステップSt5の処理に移行し、画像処理後の対象物の対象領域の画像を用いて各文字塊を抽出する。
【0104】
以上により、実施の形態1に係るカメラC1は、対象物の文字認識する文字部分の背景に図柄、イラスト、色等があっても、対象領域に含まれる画素のうち背景部分の画素を白色または白色に近しい色に変換した画像を生成できる。これにより、実施の形態1に係るカメラC1は、撮像画像に映る対象物の文字情報をより的確に文字認識できる。
【0105】
図9は、ナンバープレートにおける画像処理例を示す図である。図9には、対象物としてのナンバープレートの対象領域ARn10、画像処理後のナンバープレートの対象領域ARn21および文字認識結果としてのテーブルTBn21を示す。
【0106】
対象領域ARn10は、ユーザ操作により設定された文字認識対象としての複数の文字情報ARn11,ARn12,ARn13,ARn14のそれぞれを含む。
【0107】
文字情報ARn11は、車両が使用される本拠の管轄地域の情報である。文字情報ARn12は、車両の車種を示す分類番号である。文字情報ARn13は、分類番号が示す車種の用途を示す用途種別文字である。文字情報ARn14は、所謂車両番号であって、車両を識別するための一連指定番号である。なお、これらの文字情報が示す情報は、国によって異なるため、上述した例に限定されない。
【0108】
カメラC1は、対象領域ARn10に含まれるすべての画素について、背景と判定された画素を白色または白色に近しい色に変換した対象領域ARn21を生成して出力するとともに、複数の文字情報ARn11~ARn14のそれぞれの文字を認識した認識結果を出力する。対象領域ARn21は、画像処理後のナンバープレートの対象領域の画像である。また、テーブルTBn21は、対象領域ARn21を用いて文字認識された認識結果である。
【0109】
テーブルTBn21は、各文字情報ARn11~ARn14のそれぞれに対応する項目「地域」、項目「分類番号」、項目「用途種別文字」、項目「一連指定番号(車両番号)」を含む。図9に示す例においてカメラC1は、文字認識の結果、項目「地域」を「高知」、項目「分類番号」を「599」、項目「用途種別文字」を「あ」、項目「一連指定番号(車両番号)」を「20-46」と認識し、出力する。
【0110】
なお、図9では説明を簡単にするために文字認識結果をテーブルTBn21で示すが、カメラC1は、各項目の認識結果を項目の情報と対応付けて出力してよい。
【0111】
図10は、パスポートにおける画像処理例を示す図である。図10には、対象物としてのパスポートの対象領域ARp10、画像処理後のパスポートの対象領域ARp21および文字認識結果としてのテーブルTBp21を示す。
【0112】
対象領域ARp10は、ユーザ操作により設定された文字認識対象としての文字情報ARp11を含む。
【0113】
文字情報ARp11は、パスポートに記載された文書の種類、発行国のコード、パスポートの番号、姓、名、国籍、生年月日等の各情報をまとめた旅券情報である。
【0114】
カメラC1は、対象領域ARp10に含まれるすべての画素について、背景と判定された画素を白色または白色に近しい色に変換した対象領域ARp21を生成して出力するとともに、文字情報ARp11の文字を認識した認識結果を出力する。対象領域ARp21は、画像処理後のパスポートの対象領域の画像である。また、テーブルTBp21は、対象領域ARp21を用いて文字認識された認識結果である。
【0115】
テーブルTBp21は、文字情報ARp11を「P<JPNGAIMU<<HANAKO<<<<<<<<<<<<<<<<<<<<<<<<<<NH11060029JPN8805056F2011079<<<<<<<<<<<<<<08」と認識し、出力する。なお、カメラC1は、各情報のそれぞれに対応する項目ごとに文字認識してもよい。例えば、カメラC1は、項目「文書の種類」を「P」、項目「発行国のコード」を「JPN」、項目「パスポートの番号」を「NH11060029」、項目「姓」を「GAIMU」、項目「名」を「HANAKO」、項目「国籍」を「JPN」のように認識し、各項目の認識結果を項目の情報と対応付けて出力してよい。
【0116】
以上により、実施の形態1に係るカメラC1による車両あるいはパスポートを撮像した撮像画像の画像補正方法は、撮像された撮像画像から対象物(ナンバープレートあるいはパスポート)を含む対象領域ARn10,ARp10を抽出し、対象領域ARn10,ARp10に含まれる複数の画素のそれぞれを抽出して、複数の画素のRGB色空間(第1の色空間の一例)における画素値をL*u*v*色空間(第2の色空間の一例)における画素値に変換し、変換されたL*u*v*色空間における画素値が所定の条件(例えば、閾値TH1~TH4のうち少なくともいずれか)を満たすか否かを判定し、所定の条件を満たすと判定されたL*u*v*色空間における画素値を有する画素を対象領域の背景画素と判定して、背景画素の画素を白色に近しい色の画素値に階調変換して出力する。
【0117】
これにより、実施の形態1に係るカメラC1は、撮像画像の背景画素を白色または白色に近しい色の画素に変換し、文字部分の画素をそのまま出力することで、撮像画像に映るナンバープレートまたはパスポート等の対象物の文字情報を的確に認識可能な画像を生成できる。よって、カメラC1は、生成された撮像画像に基づいて、撮像エリアの監視精度の低下を抑制できる。
【0118】
また、L*u*v*色空間の一例としての第2の色空間は、均等色空間である。実施の形態1に係るカメラC1は、画像処理において、対象領域に含まれる複数の画素をRGB色空間の画素値から均等色空間であるL*u*v*色空間の画素値に変換することで、画素ごとの色差を色の距離(数値)として算出できる。これにより、実施の形態1に係るカメラC1は、色の違いを色の距離(数値)として画像処理できるため、背景画素をより高精度に検出可能になるとともに、文字認識により適した画像処理を実行できる。
【0119】
また、実施の形態1に係るカメラC1は、変換された複数の画素のL*u*v*色空間における画素値をu*v*平面上にプロットし、u*v*平面上にプロットされた複数の画素値のそれぞれに基づく近似直線(例えば、図6に示す近似直線SLn、図7に示す近似直線SLp)を算出し、u*v*平面上にプロットされた複数の画素値と近似直線との間の距離が閾値TH4を満たすか否か(つまり、u*v*平面上においてプロットされた画素がエリアARN,ARP内に位置するか否か)を判定する。なお、実施の形態1に係るカメラC1の例において、閾値TH4は、対象物が車両のナンバープレートであってもパスポートであっても閾値TH4=30であるが、これに限定されないことは言うまでもない。カメラC1は、所定距離内でないと判定した画素値を有する画素を対象物(ナンバープレートあるいはパスポート)の背景画素と判定して、この背景画素を白色に近しい色の画素値に変換して出力する。これにより、実施の形態1に係るカメラC1は、撮像画像の背景画素をより高精度に検出し、検出された背景画素を白色に近しい色の画素に変換して出力することで、撮像画像に映るナンバープレートまたはパスポート等の対象物の文字情報を的確に認識可能な画像を生成できる。また、カメラC1は、生成された画像に基づく文字認識を実行することで、より的確にナンバープレートの情報あるいはパスポートの情報を取得できるため、撮像エリア内の監視精度の低下を抑制できる。
【0120】
また、実施の形態1に係るカメラC1は、変換された複数の画素のL*u*v*色空間における画素値のうち、L*値が40以下の画素(L*u*v*色空間)をプロットする。これにより、実施の形態1に係るカメラC1は、近似直線の算出に用いられる複数の画素のそれぞれから文字の色でないと容易に予測される色を示す画素を取り除くことができる。したがって、カメラC1は、閾値TH4を満たすか否かの判定の際に用いられる近似直線(例えば、図6に示す近似直線SLn、図7に示す近似直線SLp)が示す文字情報の色の検出精度を高めることができる。
【0121】
また、実施の形態1に係るカメラC1において、u*v*平面上における距離が30以内に位置する画素を文字部分の画素を判定する。これにより、実施の形態1に係るカメラC1は、均等色空間であるL*u*v*色空間に変換された複数の画素のそれぞれが、文字部分の色の画素に基づいて算出された近似直線(例えば、図6に示す近似直線SLn、図7に示す近似直線SLp)と近しい色であるか否かを判定できる。
【0122】
また、実施の形態1に係るカメラC1は、対象領域ARn10,ARp10の一部の領域を含む部分領域(図4に示す部分領域ARn2)に含まれる複数の部分画素を抽出して、複数の部分画素のRGB色空間における画素値をL*u*v*色空間における画素値に変換し、変換されたL*u*v*色空間における画素値のL*値に基づくヒストグラムを作成し、ヒストグラムにおいて最小階調値および最大階調値を抽出し、抽出された最小階調値および最大階調値に基づいて、対象領域ARn10,ARp10に含まれるL*u*v*色空間における画素値のL*値を正規化する。これにより、実施の形態1に係るカメラC1は、撮像画像に映る対象物が撮像された際の周囲の環境(例えば、朝、昼、夕方、晴天、雨天)等の影響を受けていても、対象物の文字部分の画素をより的確に抽出できる。また、カメラC1は、部分領域に含まれる部分画素に基づいて、L*値のヒストグラムを作成できるため、対象領域外の誤抽出された画素に基づくL*値のヒストグラムの作成をより抑制できる。
【0123】
また、実施の形態1に係るカメラC1は、対象領域ARn10,ARp10の短辺および長辺の長さの少なくとも1/2を含む部分領域ARn2を設定する。これにより、実施の形態1に係るカメラC1は、カメラC1の設置角度あるいは被写体として対象物の位置等により、撮像画像に映る対象物が歪んでいる場合であっても、対象領域以外の画素の誤抽出をより抑制して、L*値のヒストグラムを作成できる。
【0124】
また、実施の形態1に係るカメラC1は、正規化されたL*値のヒストグラムにおいて、L*値>45(つまり、閾値TH1)を満たす画素を背景部分の画素と判定する。これにより、実施の形態1に係るカメラC1は、撮像画像に映る対象物が撮像された際の周囲の環境(例えば、朝、昼、夕方、晴天、雨天)等の影響を受けていても、対象物の背景部分の画素を撮像画像ごとに抽出できる。なお、実施の形態1に係るカメラC1の例において、閾値TH1は、対象物が車両のナンバープレートであってもパスポートであっても閾値TH1=45であるが、これに限定されないことは言うまでもない。
【0125】
また、実施の形態1に係るカメラC1は、変換されたL*u*v*色空間における画素値において、対象物がナンバープレートの場合にはu*値<-25(つまり、ナンバープレートにおける閾値TH2)またはu*値>5(つまり、ナンバープレートにおける閾値TH3)を満たす画素を背景部分の画素と判定し、対象物がパスポートの場合にはu*値<-5(つまり、パスポートにおける閾値TH2)またはu*値>20(つまり、パスポートにおける閾値TH3)を満たす画素を背景部分の画素と判定する。これにより、実施の形態1に係るカメラC1は、背景画素と判定する画素値のうちu*値を対象物ごとに設定して判定できる。
【産業上の利用可能性】
【0126】
本開示は、撮像画像に映る対象物の文字情報を的確に認識し、カメラの撮像エリアの監視精度の低下を抑制するナンバープレート画像補正方法、ナンバープレート画像補正プログラム、パスポート画像補正方法、およびパスポート画像補正プログラムの提示として有用である。
【符号の説明】
【0127】
10 通信部
11 プロセッサ
12 メモリ
13 撮像部
C1 カメラ
SLp,SLn 近似直線
Pt1,Pt2,Pt3,Pt4,Pt5,Pt6,Pt11,Pt12,Pt13,Pt14,Pt15,Pt16,Pt17 画素点
ARn1,ARn10,ARp10 対象領域
ARn2 部分領域
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10