特許第6163344号(P6163344)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ゼロックス コーポレイションの特許一覧

特許6163344ナンバープレート画像の確実なクロッピング
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6163344
(24)【登録日】2017年6月23日
(45)【発行日】2017年7月12日
(54)【発明の名称】ナンバープレート画像の確実なクロッピング
(51)【国際特許分類】
   G06K 9/20 20060101AFI20170703BHJP
   G08G 1/017 20060101ALI20170703BHJP
   G08G 1/04 20060101ALI20170703BHJP
   G06T 7/40 20170101ALI20170703BHJP
【FI】
   G06K9/20 340L
   G08G1/017
   G08G1/04 C
   G06T7/40
【請求項の数】4
【全頁数】18
(21)【出願番号】特願2013-77654(P2013-77654)
(22)【出願日】2013年4月3日
(65)【公開番号】特開2013-222461(P2013-222461A)
(43)【公開日】2013年10月28日
【審査請求日】2016年3月18日
(31)【優先権主張番号】13/448,976
(32)【優先日】2012年4月17日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】596170170
【氏名又は名称】ゼロックス コーポレイション
【氏名又は名称原語表記】XEROX CORPORATION
(74)【代理人】
【識別番号】100079049
【弁理士】
【氏名又は名称】中島 淳
(74)【代理人】
【識別番号】100084995
【弁理士】
【氏名又は名称】加藤 和詳
(72)【発明者】
【氏名】アーロン・マイケル・バリー
(72)【発明者】
【氏名】クロード・フィリオン
(72)【発明者】
【氏名】ウラディーミル・コジーツキー
(72)【発明者】
【氏名】ラジャ・バーラ
(72)【発明者】
【氏名】ジガン・ファン
【審査官】 千葉 久博
(56)【参考文献】
【文献】 特開2006−309402(JP,A)
【文献】 特開2005−182236(JP,A)
【文献】 米国特許出願公開第2007/0292029(US,A1)
【文献】 加藤武彦, 外8名,”自動ナンバープレート読取装置の開発”,SEIテクニカルレビュー,住友電気工業株式会社,2012年 7月31日,第181号,p.99-103
(58)【調査した分野】(Int.Cl.,DB名)
G06K 9/18−9/44,9/54−9/60
G06T 7/00−7/90
G08G 1/017,1/04
(57)【特許請求の範囲】
【請求項1】
ナンバープレート画像をロッピングする方法であって、
画像ベースの分類子を用いて、前記ナンバープレート画像の第1の詳細を特定するステップと、
諧調度ベース分類子を用いて、前記ナンバープレート画像の第2の詳細を特定するステップと、
前記特定された第1の詳細、及び前記特定された第2の詳細を用いて、前記ナンバープレート画像内のナンバープレートを識し、特定するステップと、を含み、
前記第1の詳細には、ノイズ源が含まれ、前記ノイズ源には、残余プレートローテーション、前記ナンバープレート画像内の文字のせん断、ナンバープレートステッカー、前記ナンバープレート上の文字を部分的に覆うナンバープレートのフレーム、前記ナンバープレート上の文字を部分的に覆うナンバープレートのステッカー、部分的な文字の遮蔽、トレーラヒッチボール、濃淡差、が含まれる、
方法。
【請求項2】
前記画像ベースの分類子を用いて、前記ナンバープレート画像の第1の詳細を特定するステップには、前記ナンバープレート画像上の文字の位置を定することが含まれる、請求項1に記載の方法。
【請求項3】
前記第1の詳細には、文字、字、記号、号、ロゴ、ナンバープレートの縁、淡差のナンバープレートの縁、検知不能なプレートの縁、及び前記ナンバープレートの外側の無関係なエッジ情報のうちの少なくとも1つが含まれる、請求項1に記載の方法。
【請求項4】
前記諧調度ベース類子を用いて、前記ナンバープレート画像の前記第2の詳細を特定するステップには、ナンバープレートエッジ効果、ナンバープレートのフレーム、ナンバープレートの縁のアーチファクト、及び字のせん断に対する安定性に関する前記第2の詳細を微調整して、分割及び文字認識の結果を改善することがさらに含まれる、請求項1に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、データ処理システム及びその方法に関する。本発明の実施形態はさらに、ナンバープレート認識技術に関する。また実施形態は、ナンバープレート及びナンバープレートのデータのクロッピング、及び正確な認識に関する。
【背景技術】
【0002】
自動ナンバープレート認識(「ALPR」)システムは、ビデオカメラや静止カメラにより撮影された画像内から車両ナンバープレートの番号を見つけ出し、読み取るために、警備員や警察官により使用されている。しかし、実在するほとんどのナンバープレート画像内には、例えば、暗い影、不均一な照明(車両と車両との間、昼間と夜間との間等の)、厄介な光学幾何形状(傾斜、せん断、投影歪み等)、文字の一部を覆うプレートのフレーム、及び/又はステッカー、部分的な文字の遮蔽(例えば、トレーラのヒッチボール)、僅かな濃淡差、及び一般的な画像ノイズ(ごま塩ノイズ等)等の複数の厄介なノイズ源が存在する。実際のノイズの条件のもとでは、ナンバープレートの文字を含む部分画像だけを正確に抽出することは非常に難しい。
【0003】
この問題で特に難しい点は、ナンバープレートの部分画像を水平クロッピングすることに関連したものである。例えば、縁のアーチファクト、ロゴや特別な記号、及び実際のナンバープレート領域の外側にある目立つ画像コンテンツは、特に厄介である。これらの無関係な画像アーチファクトは大抵の場合、有効な文字(特に「1」)と識別することが簡単ではなく、その後の文字区分や文字認識に大きな影響を与える。
【0004】
従来から、提案される方法は、ぴったりと合う水平クロッピングを行うために用いられる程きめの細かくはなく、その代り、不正確で、大ざっぱなプレートの位置確認(即ち、「プレートは、この辺のどこかにある」のような結果)に依存している。従来の位置確認の方法で用いる分類子は、個々の記号や文字よりは、むしろナンバープレート全体を認識するために構築されている。
【発明の概要】
【発明が解決しようとする課題】
【0005】
したがって、ナンバープレートを確実にクロッピングし、正確に認識して、ノイズ源、及び干渉アーチファクトを撃退する方法及びシステムが必要となる。
【課題を解決するための手段】
【0006】
ナンバープレートを確実にクロッピングし、正確に認識して、ノイズ源や干渉アーチファクトを撃退する、方法、システム、及びコンピュータ使用可能有形記憶装置を開示する。画像ベースの分類子、及び諧調度ベースのクロッピングを用いて、ナンバープレート画像、及びその部分画像をぴったりと合わせてクロッピングすることができる。画像ベースの分類子により、画像内の有効な文字の位置を特定することができる。画像ベースの分類子は、例えば、残余プレートローテーション、及び画像内の文字のせん断等の複数のノイズ源が存在するため、画像の縁を「大ざっぱ」にしか分類しない。諧調度ベースのクロッピングを用いた追加の処理ステップを行って、ナンバープレート画像の縁を微調整する。この諧調度ベースのクロッピングにより、分割及びナンバープレートの文字認識結果に大きな影響を及ぼす可能性のある、不要な縁のアーチファクトを取り除く。
【図面の簡単な説明】
【0007】
図1図1は、開示した実施形態による、固定データを処理するために使用することができる例示的なデータ処理装置の例示的なブロック図である。
図2図2は、開示した実施形態による、オペレーティングシステム、アプリケーションソフトウェア、及びユーザインターフェースを含む例示的なソフトウェアシステムの例示的な概略図である。
図3図3は、開示した実施形態による、ナンバープレート文字の分割を実行するための例示的な処理の流れを示す、例示的なブロック図である。
図4図4は、開示した実施形態による、傾斜が取り除かれ、垂直方向にクロッピングされた(「TRVC」)状態のナンバープレートを示す例示的な写真画像である。
図5図5は、開示した実施形態による、干渉アーチファクトを示す例示的な写真画像である。
図6図6は、開示した実施形態による、実際のナンバープレート領域の外側の無関係な画像コンテンツを示す例示的な写真画像である。
図7図7は、開示した実施形態による、ナンバープレート画像を正確にクロッピングするための投影分割を示す例示的なグラフ図である。
図8図8は、開示した実施形態による、ナンバープレートに水平クロッピングを行うための諧調度ベースの方法を示す例示的な写真画像である。
図9図9は、開示した実施形態による、ナンバープレート縁が不明瞭のため失敗した諧調度ベースのクロッピングを示す例示的な写真画像である。
図10図10は、開示した実施形態による、ナンバープレート縁が不明瞭のため失敗した諧調度ベースのクロッピングを示す例示的な写真画像である。
図11図11A図11Dは、開示した実施形態による、ナンバープレート位置確認のために用いた画像ベースの分類子に関連した失敗モードを示す、例示的な写真画像である。
図12図12は、開示した実施形態による、開示したナンバープレートのクロッピング方法を示す例示的な高レベルのフローチャートである。
図13図13は、開示した実施形態による、特別な記号により失敗した諧調度ベースのクロッピングを示す例示的な写真画像である。
図14図14は、開示した実施形態による、分類子ベースの方法を用いて、特別な記号を正確に退けた様子を示す例示的な写真画像である。
図15図15は、開示した実施形態による、画像ベースの分類子を用いて、ナンバープレート画像のクロッピング成功した様子を示す例示的な写真画像である。
図16図16は、開示した実施形態による、プレートの縁のアーチファクトにより失敗した分類子ベースのクロッピングを示す例示的な写真画像である。
図17図17は、開示した実施形態による、プレートの縁のアーチファクトにより失敗した分類子ベースのクロッピングを示す例示的な写真画像である。
図18図18は、開示した実施形態による、誤り検出により失敗した分類子ベースのクロッピングを示す例示的な写真画像である。
図19図19は、開示した実施形態による、諧調ベースのクロッピングの座標微調整を示す例示的な高レベルのフローチャートである。
図20図20は、開示した実施形態による、左右の階調の連結成分(CC)、及び所望のクロッピング座標を示す例示的なグラフ図である。
図21図21は、開示した実施形態による、正確にクロッピングされたナンバープレートの画像を示す例示的な写真画像である。
図22図22は、開示した実施形態による、正確にクロッピングされたナンバープレートの画像を示す例示的な写真画像である。
図23図23は、開示した実施形態による、正確にクロッピングされたナンバープレートの画像を示す例示的な写真画像である。
図24図24は、開示した実施形態による、正確にクロッピングされたナンバープレートの画像を示す例示的な写真画像である。
【発明を実施するための形態】
【0008】
当業者が理解されるように、開示した実施形態のうちの1つ以上を、方法、システム、或いは、コンピュータプログラム使用可能媒体、又はコンピュータプログラム製品として具体化することが可能である。したがって、開示している実施形態は、いくつかの例では、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、又はソフトウェアの様態とハードウェアの様態を組み合わせた実施形態の形態をとり、本明細書では、これらは全て全体を通して「モジュール」と呼ぶ。さらに、開示した実施形態は、コンピュータ使用可能媒体、コンピュータプログラム製品、コンピュータプログラムコードを格納するコンピュータ可読有形記憶装置の形態をとることができ、このコンピュータプログラムコードは、プログラム命令を含み、このプログラム命令は、その媒体内で具体化されるコンピュータ使用可能プログラムコードを有するコンピュータ使用可能記憶媒体上で、プロセッサにより実行可能である。全ての好適なコンピュータ可読媒体を用いることができ、その中にはハードディスク、USBフラッシュドライブ、DVD、CDーROM、光記憶装置、磁気記憶装置等が含まれる。
【0009】
本発明における動作を実行するためのコンピュータプログラムコードを、オブジェクト指向のプログラム言語(例えば、Java(登録商標)、C++、等)で書き込むことができる。しかし、本発明における動作を実行するためのコンピュータプログラムコードを、従来の「C」プログラム言語等の手続き型プログラム言語で、又は、Visual Basic等のプログラム環境で書き込むこともできる。
【0010】
プログラムコードを、独立型ソフトウェアパッケージとして、完全にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上、且つ、部分的に遠隔のコンピュータ上で、又は完全に遠隔のコンピュータ上で実行することができる。後者のシナリオでは、遠隔コンピュータを、ローカルエリアネットワーク(LAN)、又はワイドエリアネットワーク(WAN)、例えば、WiFi、Wimax、802.xx、及び移動体通信ネットワーク等の無線データネットワークを通してユーザのコンピュータに接続することができる、又は、ほとんど第三者にサポートするネットワーク(例えばインターネットサービスプロバイダを介してインターネットを通して)を通して、外部のコンピュータと接続することもできる。
【0011】
本発明の実施形態による方法、システム、コンピュータプログラム製品、及びデータ構造のフローチャート図、及び/又はブロック図を参照して、開示されている実施形態を以下に説明する。図内の各ブロック、及びブロックの組合せは、コンピュータプログラムの命令により実行可能であることは理解されよう。これらのコンピュータプログラム命令を汎用コンピュータのプロセッサ、専用コンピュータのプロセッサ、又はその他のプログラマブルデータ処理装置に供給して、コンピュータのプロセッサ、又はその他のプログラマブルデータ処理装置を介して実行される命令により、ブロック、又は複数のブロック内で規定された機能/動作を実行する手段が得られるよう、装置を設定することができる。
【0012】
図1には、サンプルデータ処理装置100のブロック図が示され、このデータ処理装置100は、改善されたナンバープレートの認識方法及びそのシステムをために用いることができる。データ処理装置100は、開示した実施形態に従って用いることができる、多くの利用可能なデータ処理装置、及び/又はコンピュータ装置のうちの一例を示す。データ処理装置100、及びその構成部品は、一般に説明のためにだけ提示されており、開示した実施形態の特徴の限定にはならないことを理解されたい。
【0013】
図1に示す通り、メモリ105、大容量記憶装置107(ハードディスク等)、プロセッサ(CPU)110、リードオンリーメモリ(ROM)115、ランダムアクセスメモリ(RAM)120は、一般にデータ処理装置100内のシステムバス125に接続される。メモリ105をROM、RAM、それらの組合せ、又は単純に一般メモリユニットとして実装することができる。モジュール111は、ルーチン、及び/又はサブルーチンの形態をとるソフトウェアモジュールを含み、このソフトウェアモジュールが本発明の機能を実行し、さらにメモリ105内に格納され、次いで、プロセッサ110を介して検索され処理されて、特定の作業を実行することができる。キーボード、マウス、又はその他のポインティングディバイス等の、ユーザ入力装置140を、PCI(ペリフェラル・コンポーネント・インターコネクト)バス145に接続することができる。
【0014】
データ処理装置100は、CPU110、ROM115、及びRAM120を含むことができ、これらもまたPCIのホストブリッジ135を通して、データ処理装置100のPCI(ペリフェラル・コンポーネント・インターコネクト)ローカルバス145に接続する。PCIホストブリッジ135は、低遅延経路を提供することができ、プロセッサ110は、この低遅延経路を通して、バスメモリ内、及び/又は入力/出力(I/O)アドレス空間内のどこかにマッピングされたPCI装置に直接アクセスすることができる。PCIホストブリッジ135は、高帯域幅経路を提供することもでき、これによりPCI装置が直接RAM120にアクセスすることができる。
【0015】
通信アダプタ155、スモール・コンピュータ・システム・インターフェース(SCSI)150及び拡張バスブリッジ170もPCIローカルバス145に接続することができる。この通信アダプタ155を用いて、データ処理装置100とネットワーク165とを接続させることができる。SCSI150を用いて、高速のSCSIディスクドライブ160を制御することができる。PCI−ISAバスブリッジ等の拡張バスブリッジ170を用いて、ISAバス175をPCIローカルバス145に接続することができる。但し、PCIローカルバス145は、モニタ130とさらに接続することができ、このモニタ130が、ディスプレイ(例えば、ビデオモニタ)として機能して、ユーザに対するデータ及び情報を表示し、且つ、対話形式のグラフィカル・ユーザ・インターフェース(GUI)185を表示する。ユーザは、GUI 185上で適切なキー作動させて、データファイルのオプションを選択する。但し、用語「GUI」とは一般に、コンピュータのモニタ画面上に映像として表示されるアイコン、メニュー、及びダイアログボックスを用いて、プログラム、ファイル、オプション等を表す環境の一種類のことを指す。
【0016】
本明細書に記載する実施形態を、オペレーティングシステム、及び1つ以上のモジュールと関連させて実装することができる。これらのモジュールが、例えば、コンピュータシステムの電子構成要素等のハードウェアモジュールを構成することができる。このようなモジュールは、ソフトウェアモジュールを構成することもできる。コンピュータプログラミングの技術において、一般にソフトウェア「モジュール」を、特定の作業を行う、又は特定な抽象データ型を実装する、ルーチン及びデータ構造の集まりとして実装することがでる。
【0017】
ソフトウェアモジュールは、一般に画像処理装置の記憶場所に格納可能な命令媒体を含むことができ、一般的には2つのパートで構成される。第1のパートでは、ソフトウェアモジュールは、別のモジュール、又はルーチンからアクセス可能な定数、データ型、変数、ルーチン等を表示することができる。第2のパートでは、ソフトウェアモジュールは、非公開(即ち、おそらくそのモジュールだけがアクセス可能な)にすることができ、且つ、そのモジュールが基づいたルーチン又はサブルーチンを実際に実行するソースコードを含む実装手段として設定することができる。したがって、本明細書で用いられる用語「モジュール」とは、一般にソフトウェアモジュール、又はその実装手段のことを指すことができる。そのようなモジュールを、単独で用いて、又はいくつか用いて、プログラム製品を形成することができ、このプログラム製品は、伝送媒体、及び/又は、記録可能媒体を含む信号搬送媒体を介して実装可能である。そのような本発明の機能を具体化することができるモジュールの一例として、図2に示すナンバープレート認識モジュール155が挙げられる。
【0018】
本発明の実施形態を、完全機能的なデータ処理システム(コンピュータシステム等)と関連して説明しているが、当業者なら理解されるように、本発明の実施形態のメカニズムは、様々な形態のプログラム製品として配信させることができ、本発明は、実際に配信を実行するために用いられる特定な種類の信号搬送媒体に関係なく平等に適用されるということに留意することが重要である。信号搬送媒体の例には、記憶媒体、即ちCDーROM等の記録可能型媒体、及びアナログ通信リンクやデジタル通信リンク等の伝送型媒体が含まれるが、これらには限定されない。
【0019】
図2には、ソフトウェアシステム150の概略図が示され、このソフトウェアシステム150は、開示した実施形態を実行するためのオペレーティングシステム、アプリケーションソフトウェア、及びユーザインターフェースを含む。コンピュータソフトウェアシステム150は、図1に示すデータ処理システム100の動作に関する。メモリ105、及び大容量記憶装置107内に格納されるソフトウェアアプリケーション152は、カーネル、又はオペレーティングシステム151、及びシェル、又はインターフェース153を含む。データ処理システム100により実行するために、ソフトウェアアプリケーション152等の1つ以上のアプリケーションプログラムを「読み込む」ことができる(即ち、大容量記憶装置107からメインメモリ105に移動させる)。図2に示す通り、データ処理システム100は、ユーザからのコマンド、及びデータを、インターフェース153を通して受信する。次いで、ユーザからのコマンド入力が、オペレーティングモジュール151、及び/又は、アプリケーションモジュール152から命令に従ってデータ処理システム100により実行される。
【0020】
インターフェース153は、ナンバープレートを表示し認識する役割も果たし、そこでは、ユーザが追加のコマンドを入力することができる、又はセッションを終了させることができる。ある実施形態では、オペレーティングシステム151、及びインターフェース153を、「Windows(登録商標)」システムと関連して実行することができる。もちろん、その他の種類のシステムでも実行可能であることは言うまでもない。例えば、従来の「Windows(登録商標)」システムよりむしろ、例えば、Linux(登録商標)等の別のオペレーションシステムも、オペレーティングシステム151、及びインターフェース153に対して用いることも可能である。ソフトウェアアプリケーション152は、ナンバープレート認識モジュールを含むことができる。ソフトウェアアプリケーション152を、インターフェース153、及び種々の構成要素、及び本明細書に記載するその他のモジュールや機構と通信するよう設定することもできる。
【0021】
本明細書で使用する用語モジュールは、特定の作業を行う、又は特定の抽象データ型を実行するルーチンやデータ構造の集まりのことを指すことに留意されたい。モジュールは、次の2つのパート、別のモジュール又は別のルーチンがアクセス可能な定数、データ型、変数、及びルーチンを表示するインターフェースと、非公開であり(そのモジュールだけがアクセス可能)モジュール内のルーチンを実際に実行するソースコードを含む実装手段と、から構成され得る。またモジュールという用語は、単にアプリケーション、文書処理、会計、在庫管理、音楽プログラムの予定管理等の、特定な作業の実行を支援するよう設計されたコンピュータプログラムを指すこともできる。
【0022】
一般にプログラムモジュールは、特定の作業を行う、又は抽象データ型を実行するルーチン、プログラム、オブジェクト、構成要素、データ構造等を含む。さらに、当業者なら理解されようが、開示した方法及びシステムを、例えば、携帯型装置、マルチプロセッサシステム、マイクロプロセッサベースの、又はプログラマブル大衆消費電子製品、ネットワークに接続するPC、ミニコンピュータ、メインフレームコンピュータ等のその他のコンピュータのシステム構成を用いて実施することも可能である。
【0023】
図3には、開示した実施形態による、ナンバープレートの文字分割を実行するための例示的な処理の流れの例示的なブロック図200が示される。201で示す通り、ALPR処理では、ブロックナンバープレートの画像を取得する。次いで、ブロック202で示す通り、このナンバープレートをローカライズする。ブロック203で示す通り、計算負荷を最小にし、ナンバープレートの画像内に存在する無関係なノイズ削減するため、ぴったりと合う境界ボックス(「TBB」)内の部分画像を抽出により特定する。ナンバープレートTBBの部分画像からのナンバープレートの文字の抽出には、次の動作、例えば、傾斜の除去、垂直クロッピング、及び水平クロッピングが含まれる。ブロック204で示す通り、文字を分割することで、その後の、ブロック205で示す文字認識に劇的な効果を及ぼす。分割204に関する課題は、文字認識205、及びブロック206で示すナンバープレートの管轄地域の特定を非常に正確に行うことができる、確実で、非常に正確で、計算効率のよい方法を提供することである。
【0024】
図4には、開示した実施形態による、傾斜が取り除かれ垂直方向にクロッピングされた(「TRVC」)状態の、例示的なナンバープレートの写真画像250が示される。図4に示すような画像こそ、確実な水平クロッピングの方法を必要とする画像である。水平クロッピングは、次の事象に、例えば、ナンバープレートの縁アーチファクト、ロゴ、特別な記号、及びその他のナンバープレート自体の中の非有効な文字コンテンツ、並びに実際のナンバープレート領域の外側で目立つ画像コンテンツの影響を受ける恐れがある。
【0025】
図5には、開示した実施形態による、例示的な干渉アーチファクトの写真画像300が示される。ナンバープレート、プレートのフレームと、車両の背景画像と、の間の大きな濃淡差のよる画像内のハードエッジにより、縁のアーチファクは発生し得る。しかし、文字分割の過程では、大抵の場合これらの縁を実際の文字と区別することが難しい。ほとんどの場合、これらの縁が、有効な「1」と極めて類似し得る。その結果、これらの縁の存在により、実際の文字に関する分割カットが歪んでしまうこと、及び/又は、この縁のコンテンツが文字として分割結果に含まれてしまうことうちの1つ以上のことが発生する恐れがある。したがって、ナンバープレートの画像を水平クロッピングすることで、ナンバープレートの縁、及び/又はプレートのフレームと無関係な縁を適切に取り除かれなければ、文字分割、及びその後の認識においてエラーが発生する恐れがある。図5に示す通り、有効な文字とナンバープレートの縁との間の距離の長さを変更することで、特別な記号やロゴ、及びナンバープレートのフレームの共用部分が存在することで、特に厄介な縁のアーチファクトを分離し取り除くことができる。
【0026】
図6には、開示した実施形態による、実際のナンバープレート領域の外側の無関係な画像コンテンツの例示的な写真画像350が示される。図6に示す通り、実際のナンバープレート領域の外側に存在する大量の無関係な画像コンテンツ(即ち、ノイズ源)は、適切にナンバープレートをクロッピングし、文字を分割するための、特に厄介なもう1つの問題である。質感ベースの方法、又は完全に諧調度ベース方法だけを用いて、ナンバープレートの文字を分割すること、有効なナンバープレートの文字コンテンツを識別することが難しくなる。上記に概説したノイズ源が、適切に取り除かれなければ、分割が不完全となり、最終的に文字認識の過程でエラーが発生する。
【0027】
図7には、開示した実施形態による、ナンバープレート画像を水平寸法で正確にクロッピングするための投影分割の例示的なグラフ図400が示される。ナンバープレート画像を水平寸法で正確にクロッピングするために、投影分割を用いて、ナンバープレートの文字を分割することができる。投影分割では、画像の縦列に沿って、平均値(即ちヒストグラム401)をとる。次いで、得られたデータの山と谷の分析結果を用いて、ナンバープレートコンテンツと背景402との間の切れ目らしき場所を特定する。クロッピングを行うための、投影分割は、次の、不均一な照明、ナンバープレートと車両の背景との間の僅かな濃淡差、画像内のナンバープレートの過度のせん断、ナンバープレート領域の外側の目立つ画像コンテンツのような実在のノイズに対して著しく安定しているわけではないため問題がある。
【0028】
図8には、開示した実施形態による、ナンバープレートの水平クロッピングに関する、諧調度ベースの成功した方法の例示的な写真画像450が示される。この諧調度ベースの方法は、ナンバープレートの水平クロッピングにも応用可能である。図8には、元のTRVC画像が451で示され、続いて二値化した諧調度452(ナンバープレートの縁の検知結果)が示され、そして最後に、この諧調度情報453を用いてクロッピングした画像が示される。
【0029】
図9には、開示した実施形態による、無関係な縁のコンテンツにより失敗した諧調度ベースのクロッピングの例示的な写真画像500が示される。この諧調度ベースの技術では、ナンバープレート領域の外側の目立つ縁コンテンツにより、水平クロッピングの縁を正確には特定しない。
【0030】
図10には、開示した実施形態による、不明瞭なナンバープレートの縁により失敗した諧調度ベースのクロッピングの例示的な写真画像が示される。ナンバープレートと背景画像との間の濃淡差が僅かだと、諧調度ベースのクロッピングは失敗する。
【0031】
図11A図11Dには、開示した実施形態による、ナンバープレートの位置確認のための画像ベースの分類子に関連した、いくつかの失敗モードの例示的な写真画像600が示される。画像ベースの分類子のいくつかの形態に依存するクロッピング技術を用いることもできる。画像ベース分類子は、プレートのローカライジング(即ち元画像の領域内のプレートの存在の検知)には非常に適し得るが、ナンバープレートの部分画像の正確な水平クロッピングには適し得ない。このことは、成功した位置確認の例の中から、クロッピング失敗モードがいくつか見られることから容易に確認することができる。例えば、画像602、603は、文字が欠け、画像601、604は、縁のアーチファクトを含んでいる。
【0032】
図12には、開示した実施形態による、開示したナンバープレートのクロッピングの方法を示す例示的な高レベルフローチャート650が示される。開示された実施形態では、有効なナンバープレート領域を特定し、水平クロッピングを行う方法が提供される。この方法は、画像内の縁のアーチファクト、ロゴ、特別な記号、及び有効なナンバープレート領域の外側の目立つ画像コンテンツに対して安定している。正確な水平クロッピングにより、その後の文字分割ステップ、及び文字の認識ステップの正確さが著しく改善される。
【0033】
ブロック651で示す通り、ナンバープレートの特定は開始される。次に、ブロック652で示す通り、候補のプレート画像を垂直方向にクロッピングしながら、その画像から傾斜を取り除く。ブロック653で示す通り、分類子テンプレートの標準垂直寸法に各ROIをサイズ変更する。次に、ブロック654で示す通り、画像ベースの分類子を適用し、候補のナンバープレート画像を走査して、候補の文字位置を特定する。この分類子が、有効な文字の検知器として機能して、文字画像が存在しそうな画像のサブセットを示す。有効なナンバープレートの部分画像の最も左の検知文字と、最も右の検知文字とにより境界されると仮定することができる。文字の数655が最小数656を超える場合、ブロック657で示す通り、検知文字の位置で大ざっぱな水平クロッピングを実行する。このステップの後で、ブロック658で示す通り、諧調度ベースの縁検知を適用して、残余の縁のアーチファクトを取り除く。次いでブロック661で示す通り、特定処理は終了する。文字の数655が最小数659を超えない場合、ブロック660で示す通り、このROIを無効とマークする。その後、ブロック661で示す通り、この処理は終了する。
【0034】
図15には、開示した実施形態による、画像ベースの分類子を用いて、成功したナンバープレート画像のクロッピングの例示的な写真画像800が示される。画像ベースの分類子を訓練して、有効な文字/記号と、その他のナンバープレート/車両のコンテンツとを区別させることができる。例えば、好ましい実施形態では、Sparse Network of Winnows(「SNoW」)の分類子を用いて、有効な記号の位置を特定し、その位置結果に基づいて、ナンバープレートをクロッピングする。SNoWベースの分類子が、実行時間で計算効率を維持しながら、高次元特徴を活用する。有効なナンバープレートの文字、ナンバープレートの縁と、プレート上の特別な記号又はロゴとの間の様々な距離を処理するためには、SNoWベースの技術の方が諧調度ベースのアプローチよりも確実である(図13の例示的な写真画像700と、図14の例示的な写真画像750に示す通り)。SNoWベースの方法では、クロッピングに関して必要なぴったりと合う位置確認を行うことができる。開示した実施形態では、逐次平均量子化変換(「SMQT」)を用いて生成されるローカル画像の特徴上で動作するSNoWベースの機械学習の分類子アーキテクチャーを、有効な文字位置を検知するときに用いる。SMQTの特徴は、例えば、一般にナンバープレートの画像内で見られる強力な照明の変化等のスケール、及びオフセットノイズに対して安定している。
【0035】
図16及び図17には、開示した実施形態による、プレートの縁のアーチファクトのために失敗した分類子ベースのクロッピングの例示的な写真画像850、900がそれぞれ示される。
【0036】
図18には、開示した実施形態による、誤り検出により失敗した分類子ベースのクロッピングの例示的な写真画像950が示される。濃淡差が極端に僅かな条件でも、有効な文字を検知する必要があるため、分類子ベースの方法では誤り検出が起こり得る。より具体的には、暗い照明の条件のもとでは、ナンバープレートの周りの領域内の垂直なコンテンツは大抵「1」又は「誤り検出」と間違われる可能性がある。
【0037】
画像ベースの文字検知器は、ロゴ、特別な記号、及びその他のプレート領域の外側の目立つ画像コンテンツを廃棄することができる。しかし、図16及び図17で示す通り、この種類の分類子は、縁のアーチファクトをうまく処理することができない。これらの残余アーチファクトを取り除くため、本発明では諧調度ベースの分析ステップを適用して、画像ベースの分類子から得られたクロッピングの縁を微調整する。
【0038】
図19には、開示した実施形態による、クロッピング座標を諧調ベースで微調整することに関する例示的な高レベルのフローチャート1000が示される。ブロック1001で示す通り、微調整の処理が開始される。ブロック1002で示す通り、2Dメディアンフィルタを用いて画像を滑らかにした後、ブロック1003で示す通り、各画素位置でエッジ画像の諧調度を算出する。次いで、水平(x)成分と垂直(y)成分との荷重和を用いて、以下の通り諧調度大きさを算出する。
【0039】
【数1】
【0040】
但し、画素位置(x,y)おいて、G(x,y)は、全ての重み付けされた諧調度の大きさであり、g(x,y)は、未処理の水平の諧調度の大きさであり、g(x,y)は、未処理の垂直の諧調度の大きさである。好ましい実施形態では、この合計のx成分とy成分に関する重み、即ちαとαとを、それぞれ10.0と1.0とに設定する。次いで、等式(1)内の諧調度行列を正規化し二値画像(即ち、エッジ画像)に変換する。ブロック1004で示す通り、結合成分(「CC」)を特定しスクリーニングを実行して、最も可能性のあるプレートの縁のブロブ(blob)を判定する。この一連の枝刈り工程は、次のような特性を有する。例えば、
【0041】
縁のアーチファクトは、短すぎるものは破棄して、垂直方向にクロッピングされた画像内の上から下まで延在していなければならない。
【0042】
縁のエッジは、大きく傾いているものは破棄して、実質的に垂直でなければならない。
【0043】
プレートの縁による、CCのアスペクト比(即ち、高さを幅で割った値)は、所定の閾値を超えなければならない。その幅と比較して、十分に高くないものは全て破棄する。
【0044】
枝刈り終了後、ブロック1005で示す通り、候補のプレートの縁/エッジのCCを用いて、位置情報に基づいて、ナンバープレートの左と右の縁と思われる部分を特定する。ゼロ以上の縁のアーチファクトの全ての組合せを、プレートの左右で残すことができる(例えば、左ではなに見つからず、右ではアーチファクトが1つ見つかる、複数のアーチファクトが左右両方で見つかる等)。ブロック1006で示す通り、画像の中心線に沿った縁のアーチファクトで最も左のエッジ座標、及び縁のアーチファクトで最も右のエッジ座標を推定する。それらの水平中心座標に基づいて、CCを分類する。次に、その中心座標がプレートの中心より小さいCCを「左の縁」と分類し、プレートの中心以上のCCを全て「右の縁」と分類する。この時点で、ゼロ以上のCCが、左の縁のグループ内と右の縁のグループ内の両方に存在する可能性がある。少なくとも1つの左の縁のCCが存在する場合、等式(2)により、最も大きな諧調度を選択する。ブロック1007で示す通り、このクロッピング座標をその画像に関する左右のクロッピング座標として用いることができる。プレートの濃淡値は、背景の濃淡値より高いものと仮定する。暗が明に変遷する大きな諧調度の部分を検索する。
【0045】
【数2】
【0046】
但し、G(x,y)は、画素位置(x,y)での画像諧調度の水平(x)成分の大きさであり、iは結合成分のブロブの指数であり、Sは、結合成分CCの領域内に含まれる画像の画素のサブセットである。左の縁が見つからない場合、画像分類子のステップでは、生成される画像の左側に沿ってクロッピングは行われない。
【0047】
プレートの右の縁のクロッピング座標も、暗が明に変遷する最も大きな諧調度の部分を検索することを除外して、同様に求めることができる。
【0048】
【数3】
【0049】
等式(2)と等式(3)の両方とも、プレートの縁と思われるエッジの分析から得られる結合成分の指数を表す。ブロック1008で示す通り、クロッピング処理は終了する。
【0050】
図20には、開示した実施形態による、選択された左右の階調度のCC、及び所望のクロッピング座標の例示的なグラフ図1050が示される。所望のクロッピング座標を得るために、特定したCCのブロブの縁の内側(ナンバープレートの内側に向かって)で、画像の中心線に沿った水平座標を見出す。
【0051】
図21図22図23、及び図24には、開示した実施形態による、正確にクロッピングされたナンバープレート画像の例示的な写真画像1100、1150、1200、1250がそれぞれ示される。これらの場合では、図中の一連の部分画像はそれぞれ、1)元のTRVC画像1101、1151、1201、1251、2)画像分類子段階での出力画像1102、1152、1202、1252、3)諧調度ベース分析の一部であるエッジ画像103、1153、1203、1253、4)画像分類子と諧調度情報の両方を用いて得られたクロッピング済みのTBB画像1104、1154、1204、1254である。
【0052】
上述の内容に基づいて、複数の異なる実施形態、好ましい実施形態、及び代替的な実施形態が、本明細書で開示されていることを理解されたい。例えば、ある実施形態では、ナンバープレート画像の確実なクロッピングを行う方法が開示される。この方法は、画像ベースの分類子を用いて、ナンバープレート画像の第1の詳細を特定するステップと、諧調度ベース分類子を用いて、ナンバープレート画像の第2の詳細を特定するステップと、特定された第1の詳細、及び特定された第2の詳細を用いて、ナンバープレートの画像内のナンバープレートを正確に認識し、特定するステップと、を含むことができる。
【0053】
別の実施形態では、画像ベースの分類子を用いて、ナンバープレート画像の第1の詳細を特定するステップには、大ざっぱにナンバープレート画像上の文字の位置を特定するステップが含まれ得る。第1の詳細には、文字、有効な文字、記号、特別な記号、ロゴ、ナンバープレートの縁、僅かな濃淡差のナンバープレートの縁、検知不能なプレートの縁、及びナンバープレートの外側の無関係なエッジ情報のうちの少なくとも1つが含まれ得る。第1の詳細にはまた、ノイズ源も含まれ得、このノイズ源には、残余プレートローテーション、ナンバープレート画像内の文字のせん断、暗い影、不均一な照明、厄介な光幾何学形状、傾斜、せん断、投影歪み、ナンバープレートのフレーム、ナンバープレートのステッカー、ナンバープレート上の文字を部分的に覆うナンバープレートのフレーム、ナンバープレート上の文字を部分的に覆うナンバープレートのステッカー、部分的な文字の遮蔽、トレーラのヒッチボール、僅かな濃淡差、一般的なナンバープレート画像ノイズ、及びごま塩ノイズのうちの少なくとも1つが含まれ得る。
【0054】
他の実施形態では、諧調度ベースの分類子を用いて、ナンバープレートの画像の第2の詳細を特定するステップには、ナンバープレートのエッジ効果、ナンバープレートのフレーム、ナンバープレートの縁のアーチファクト、及び過度の文字のせん断に対する安定性に関する第2の詳細を微調整して、分割及び文字認識の結果を改善するステップが含まれ得る。第2の詳細には、文字、有効な文字、記号、特別な記号、ロゴ、ナンバープレートの縁、僅かな濃淡差のナンバープレートの縁、検知不能なプレートの縁、ナンバープレートの外側の無関係なエッジ情報のうちの少なくとも1つが含まれ得る。
【0055】
さらに他の実施形態では、この方法は、画像ベースの分類子、及び諧調度ベース分類子を用いて、ナンバープレート画像をぴったりと合わせてクロッピングして、ナンバープレートの部分画像を生成するステップであって、ナンバープレート画像を水平クロッピングして、ナンバープレート画像内のノイズ源、及び干渉アーチファクトを撃退するステップと、ナンバープレート部分画像からロゴを取り除くステップ、ナンバープレート部分画像から記号を取り除くステップ、及びナンバープレート部分画像を文字認識に提出する前に、ナンバープレート部分画像からアーチファクトにフラッギングするステップのうちの少なくとも1ステップと、ナンバープレートの部分画像上の諧調度ベースの分類子を用いて、ナンバープレートの縁のアーチファクトを特定して、有効なナンバープレートの文字を誤って破棄することなく、ナンバープレートの縁のアーチファクトを取り除くため正確に判定するステップと、ナンバープレートの画像を保存するステップと、ナンバープレート画像をローカライジングするステップと、を含むことができる。
【0056】
別の実施形態では、この方法は、ぴったりと合う境界ボックスナンバープレートの部分画像を抽出して、ナンバープレートの画像内のノイズの存在を削減するステップと、ぴったりと合う境界ボックスナンバープレート部分画像から、傾斜の削除、垂直クロッピング、及び水平クロッピングのうちの少なくとも1つを介して、ナンバープレートの文字を抽出するステップと、ナンバープレート文字を認識し、ナンバープレートを特定する、確実な、非常に正確で、計算効率のよい方法のために、ぴったりと合う境界ボックスのナンバープレートの部分画像内のナンバープレートの文字を分割するステップと、Sparse network of Winnowsの分類子を用いて、第1の詳細及び第2の詳細を特定し、このSparse network of Winnowsの分類子が、ナンバープレート上の文字間の様々な距離、ナンバープレートの縁、記号、特別な記号、及びナンバープレート上のロゴのうちの少なくとも1つを撃退するステップと、を含むことができる。
【0057】
他の実施形態では、ナンバープレート画像を確実にクロッピングするためのシステムが開示される。このシステムは、プロセッサ、プロセッサに接続したデータバス、及びコンピュータプログラムコードを格納したコンピュータ使用可能有形記憶装置を含むことができ、このコンピュータプログラムコードが、ナンバープレート画像の確実なクロッピングのために、プロセッサにより実行可能なプログラム命令を含む。このプログラム命令には、画像ベースの分類子を用いて、ナンバープレート画像の第1の詳細を特定するためのプログラム命令と、諧調度ベースの分類子を用いて、ナンバープレート画像の第2の詳細を特定するためのプログラム命令と、特定された第1の詳細、及び特定された第2の詳細を用いて、ナンバープレート画像内のナンバープレートを正確に認識するためのプログラム命令と、が含まれ得る。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24