【文献】
熊野信太郎 外4名,コンテナ番号認識装置の開発,電子情報通信学会論文誌,社団法人電子情報通信学会,2001年 6月 1日,Vol. J84-D-II, No. 6,pp. 1073-1083
(58)【調査した分野】(Int.Cl.,DB名)
チェックデジットを含んで構成されるコンテナ番号を読み取るコンテナ番号読取り方法を、コンピュータによって実行可能なプログラムとして実施するコンテナ番号読取りプログラムであって、
前記コンテナに付された前記コンテナ番号の文字領域を撮影した画像を白と黒との二値の画像に変換して、二値画像を作成する二値画像作成機能と、
前記二値画像作成機能により作成された前記二値画像の中から、前記コンテナ番号の文字領域の画像を一文字単位で抽出する文字領域抽出機能と、
前記文字領域抽出機能により抽出された前記文字領域の画像のうち、前記コンテナ番号の英字部の文字領域の画像に含まれている英字を、あらかじめ備えた英字辞書に基づいて文字認識し、文字認識した前記コンテナ番号の英字部の文字列から前記コンテナの所有者を示す所有者コードを判別する所有者コード判別機能と、
それぞれのコンテナの所有者を示す所有者コード別の数字辞書をあらかじめ備え、所有者コード別の前記数字辞書の中から、前記所有者コード判別機能により判別された前記所有者コードに該当する数字辞書を選択する数字辞書選択機能と、
前記文字領域抽出機能により抽出された前記文字領域の画像のうち、前記チェックデジットを除く残りの数字部の文字領域の画像に含まれている数字を、前記数字辞書選択機能により選択した前記数字辞書に基づいて、文字認識する数字認識機能と、
それぞれのコンテナの所有者を示す所有者コード別のパラメータをあらかじめ備え、所有者コード別の前記パラメータの中から、前記所有者コード判別機能により判別された前記所有者コードに該当するパラメータを選択して、選択した前記パラメータを用いて、前記文字領域抽出機能により抽出された前記文字領域の画像のうち、前記チェックデジットの文字領域の画像において該チェックデジットに付されている矩形枠を除去する枠線除去機能と、
前記枠線除去機能により前記矩形枠が除去された状態の文字領域の画像に含まれている前記チェックデジットを、前記数字辞書選択機能により選択した前記数字辞書に基づいて文字認識するチェックデジット認識機能と
を有することを特徴とするコンテナ番号読取りプログラム。
【背景技術】
【0002】
従来から、各種物品の表面に記録された記号等を自動的に読取る装置が様々な分野において利用されている。このような種類の装置は、物品に記録された記号等を光学的に取り込み、図形データとして確保した後、記号の寸法、面積等に基づいて、読取り対象に適合しない図形を除去し、文字認識処理等の画像処理を行って、個々の図形データを英数字等の記号として識別するものである。
【0003】
例えば、物品の表面に記録された記号等を自動的に読取る装置の一つに、コンテナの表面に表記された記号列(文字列)、すなわち、コンテナ番号を読取るコンテナ番号読取り装置がある。特許文献1の特開平10−105647号公報「コンテナ番号読取り装置及びコンテナ番号読取り方法」等に記載された現状の技術におけるコンテナ番号読取り装置は、以下のような、仕組みを採用している。すなわち、まず、光学的に取得した原画像に対して二値化処理を施して「二値画像」を生成する。しかる後、生成した「二値画像」の中から、文字等の記号の特徴量に適合する領域を、文字等の記号を表す領域として抽出し、該特徴量に適合しないものを不要領域と判定して除去する。そして、不要領域が除去され、文字等の記号のみが残った画像に対して認識処理を施し、コンテナ番号を表す文字(記号)として識別する。
【0004】
以下に、前記特許文献1等の本発明に関連する現状の技術におけるコンテナ番号読取り方法の具体的な処理の流れについて、
図9のフローチャートを参照しながら詳細に説明する。
図9は、本発明に関連する現状の技術におけるコンテナ番号読取り方法の具体的な処理の流れを示す字にフローチャートである。
【0005】
図9のフローチャートにおいて、コンテナの表面に表記されている記号列(文字列)すなわちコンテナ番号を含む領域を撮影した原画像に対して閾値処理を行い、「二値画像」を作成する(ステップB1)。作成した「二値画像」の一例を
図4に示す。すなわち、
図4は、コンテナ表面に表記されたコンテナ番号を撮影した原画像から作成した「二値画像」の例を示す模式図である。
図4に示す「二値画像」は、あらかじめ設定した閾値を用いて白と黒との二値の画像に変換して、コンテナ番号が含まれた白黒画像が表示されている。ここでは、コンテナ番号が、4個の英字と7個の数字からなる11個の文字数で構成されている場合を示している。この
図4に示す例においては、例えば、11個の“ABCU1234567”の文字列を含む画像が「二値画像」として作成されている。なお、11個の“ABCU1234567”の文字列を含む画像のうち、最後の第11番目の文字“7”には、正しく文字認識がなされたか否かを最終的にチェックするための特別の文字であることを示すために、矩形形状の枠が付されている。
【0006】
図9のフローチャートの説明に戻って、次に、ステップB1において作成した「二値画像」の中から、文字が含まれていると見做される矩形形状の画像領域を「文字領域」候補の包含矩形として1文字ずつ順次抽出する(ステップB2)。
【0007】
しかる後、包含矩形として抽出した全ての「文字領域」候補に関し、ステップB4以降の処理が完了したか否かを確認する(ステップB3)。全ての「文字領域」候補に関する処理が完了した場合には(ステップB3の「YES」)、コンテナ番号の読取り処理を終了する。一方、まだ、「文字領域」候補毎の全ての処理が完了していない場合には(ステップB3の「NO」)、ステップB4以降の処理を実施する。
【0008】
ステップB4においては、まず、ステップB2において抽出した「文字領域」候補のうち、まだ処理をしていないいずれかを取り出し、取り出した「文字領域」候補の包含矩形に関する特徴量が、文字等の記号の特徴量に適合するものか否かを確認することにより、該包含矩形が、文字等の記号を含む領域すなわち「文字領域」であるか否かを判定する(ステップB4)。取り出した該包含矩形に文字等の記号の特徴量に適合しているものが含まれていなく、取り出した包含矩形は正しい「文字領域」ではないと判定した場合には(ステップB4の「NO」)、「不要領域」と認識して、「文字領域」候補から削除する処理を行った後(ステップB9)、ステップB3に戻って、次の「文字領域」候補の確認処理に復帰する。
【0009】
一方、確認した特徴量として、文字等の記号の特徴量に適合したものが含まれていて、取り出した包含矩形が正しい「文字領域」であると判定した場合には(ステップB4の「YES」)、当該「文字領域」に関する画像をバッファに保存する(ステップB5)。しかる後、バッファに保存した当該「文字領域」に関する画像の個数を確認する(ステップB6)。保存した「文字領域」に関する画像の個数が、第1番目から数えて、コンテナ番号の文字数である11個の文字数に達していなかった場合には(ステップB6の「11文字でない」)、後続するコンテナ番号に関する「文字領域」の画像をさらに追加して保存するために、ステップB3に戻って、次の「文字領域」候補の確認処理に復帰する。なお、保存した「文字領域」に関する画像の個数が第1番目から数えて11個に達していた場合であっても、コンテナ番号以外の文字等の記号に関する画像を読み捨てるために、ステップB3に戻って、次の「文字領域」候補の確認処理に復帰する。
【0010】
ステップB6において、バッファに保存した「文字領域」に関する画像の個数が、コンテナ番号の文字数である11個の文字数に達していた場合には(ステップB6の「11文字」)、次に、保存した11個の「文字領域」それぞれの画像に含まれている文字等の記号を認識する処理を行うために、「英数字」辞書を選択する(ステップB7)。そして、選択した該「英数字」辞書を使用して、第1番目から第11番目までの11個の「文字領域」それぞれの画像に関して「英数字」の文字等の記号を認識する処理を行った後(ステップB8)、ステップB3に戻る。
【発明の概要】
【発明が解決しようとする課題】
【0012】
前述したように、本発明に関連する現状の技術におけるコンテナ番号読取り方法においては、原画像を二値化して得られた「二値画像」の中から不要領域部分を除去した上で、一つの「英数字」辞書のみを用いて、文字等の記号を認識する処理を行っている。
【0013】
ところで、コンテナの表面に表記されるコンテナ番号は、前述したように、英字4文字、数字7文字の合計11個の文字列からなっていて、先頭の英字4文字は、コンテナの所有者を示す所有者コードを表し、第11文字目の文字はチェックデジットを表している。また、チェックデジットを表す文字には、
図4に示したように、通常、矩形枠がチェックデジット枠として付されている。
【0014】
ここで、所有者コードとは、コンテナを所有する会社別に割り振られたコードであり、コンテナに付されるコンテナ番号のパターンに関しては、コンテナを所有する会社別に、使用される文字フォント、チェックデジット枠の太さが異なっている。また、チェックデジットとは、コンテナ番号を表す文字列を正確に認識することができたか否かを最終的に判定するために利用する数字のことであり、他の一般の文字と区別するために、矩形形状の矩形枠(チェックデジット枠)により囲んで表記されている。つまり、チェックデジットは、文字列の認識が正しいか否かを最終的に判定するために用いられるので、コンテナ番号として並ぶ第1番目から第10番目の他の一般の文字列と同様に認識されることが必要である。
【0015】
しかしながら、本発明に関連する現状の技術におけるコンテナ番号読取り方法の場合、チェックデジットを含む文字等の記号列について認識する際の誤認識の確率が高くなってしまう状況にある。誤認識を引き起こす第1の理由は、前述したように、所有者コード別にコンテナ番号の文字フォント、第11番目のチェックデジットに矩形形状の矩形枠として付されるチェックデジット枠の太さが異なっているので、コンテナ番号の記号列を安定して抽出することができないためである。
【0016】
また、誤認識を引き起こす第2の理由は、チェックデジットに付された矩形枠(チェックデジット枠)の線の太さがコンテナの所有者別に異なっているので、該矩形枠(チェックデジット枠)を確実に除去した状態でチェックデジットの認識処理を行うことができないためである。つまり、チェックデジットに付された矩形枠(チェックデジット枠)の部分が不要領域として除去されない場合には、チェックデジットの文字を表す記号パターンが該矩形枠のパターンを含む状態になる。したがって、チェックデジットの文字の部分については、文字等の記号の特徴量として本来あるべき基本パターンとは一致しなくなってしまい、結果として、文字認識を行った際に、該矩形枠の部分が原因となって、正確な認識結果を得ることができなくなってしまう。
【0017】
[本発明の目的]
本発明は、以上のような事情を考慮してなされたものであり、チェックデジットを含むコンテナ番号の認識率を高めることが可能なコンテナ番号読取り装置、コンテナ番号読取り方法およびコンテナ番号読取りプログラムを提供することを、その目的としている。
【課題を解決するための手段】
【0018】
前述の課題を解決するため、本発明によるコンテナ番号読取り装置、コンテナ番号読取り方法およびコンテナ番号読取りプログラムは、主に、次のような特徴的な構成を採用している。
【0019】
(1)本発明によるコンテナ番号読取り装置は、
チェックデジットを含んで構成されるコンテナ番号を読み取るコンテナ番号読取り装置であって、
前記コンテナに付された前記コンテナ番号の文字領域を撮影した画像を白と黒との二値の画像に変換して、二値画像を作成する二値画像作成手段と、
前記二値画像作成手段により作成された前記二値画像の中から、前記コンテナ番号の文字領域の画像を一文字単位で抽出する文字領域抽出手段と、
前記文字領域抽出手段により抽出された前記文字領域の画像のうち、前記コンテナ番号の英字部の文字領域の画像に含まれている英字を、あらかじめ備えた英字辞書に基づいて文字認識し、文字認識した前記コンテナ番号の英字部の文字列から前記コンテナの所有者を示す所有者コードを判別する所有者コード判別手段と、
それぞれのコンテナの所有者を示す所有者コード別の数字辞書をあらかじめ備え、所有者コード別の前記数字辞書の中から、前記所有者コード判別手段により判別された前記所有者コードに該当する数字辞書を選択する数字辞書選択手段と、
前記文字領域抽出手段により抽出された前記文字領域の画像のうち、前記チェックデジットを除く残りの数字部の文字領域の画像に含まれている数字を、前記数字辞書選択手段により選択した前記数字辞書に基づいて、文字認識する数字認識手段と、
それぞれのコンテナの所有者を示す所有者コード別のパラメータをあらかじめ備え、所有者コード別の前記パラメータの中から、前記所有者コード判別手段により判別された前記所有者コードに該当するパラメータを選択して、選択した前記パラメータを用いて、前記文字領域抽出手段により抽出された前記文字領域の画像のうち、前記チェックデジットの文字領域の画像において該チェックデジットに付されている矩形枠を除去する枠線除去手段と、
前記枠線除去手段により前記矩形枠が除去された状態の文字領域の画像に含まれている前記チェックデジットを、前記数字辞書選択手段により選択した前記数字辞書に基づいて文字認識するチェックデジット認識手段と
を有することを特徴とする。
【0020】
(2)本発明によるコンテナ番号読取り方法は、
チェックデジットを含んで構成されるコンテナ番号を読み取るコンテナ番号読取り方法であって、
前記コンテナに付された前記コンテナ番号の文字領域を撮影した画像を白と黒との二値の画像に変換して、二値画像を作成する二値画像作成ステップと、
前記二値画像作成ステップにおいて作成された前記二値画像の中から、前記コンテナ番号の文字領域の画像を一文字単位で抽出する文字領域抽出ステップと、
前記文字領域抽出ステップにおいて抽出された前記文字領域の画像のうち、前記コンテナ番号の英字部の文字領域の画像に含まれている英字を、あらかじめ備えた英字辞書に基づいて文字認識し、文字認識した前記コンテナ番号の英字部の文字列から前記コンテナの所有者を示す所有者コードを判別する所有者コード判別ステップと、
それぞれのコンテナの所有者を示す所有者コード別の数字辞書をあらかじめ備え、所有者コード別の前記数字辞書の中から、前記所有者コード判別ステップにおいて判別された前記所有者コードに該当する数字辞書を選択する数字辞書選択ステップと、
前記文字領域抽出ステップにおいて抽出された前記文字領域の画像のうち、前記チェックデジットを除く残りの数字部の文字領域の画像に含まれている数字を、前記数字辞書選択ステップにおいて選択した前記数字辞書に基づいて、文字認識する数字認識ステップと、
それぞれのコンテナの所有者を示す所有者コード別のパラメータをあらかじめ備え、所有者コード別の前記パラメータの中から、前記所有者コード判別ステップにおいて判別された前記所有者コードに該当するパラメータを選択して、選択した前記パラメータを用いて、前記文字領域抽出ステップにおいて抽出された前記文字領域の画像のうち、前記チェックデジットの文字領域の画像において該チェックデジットに付されている矩形枠を除去する枠線除去ステップと、
前記枠線除去ステップにおいて前記矩形枠が除去された状態の文字領域の画像に含まれている前記チェックデジットを、前記数字辞書選択ステップにおいて選択した前記数字辞書に基づいて文字認識するチェックデジット認識ステップと
を有することを特徴とする。
【0021】
(3)本発明によるコンテナ番号読取りプログラムは、
チェックデジットを含んで構成されるコンテナ番号を読み取るコンテナ番号読取り方法を、コンピュータによって実行可能なプログラムとして実施するコンテナ番号読取りプログラムであって、
前記コンテナに付された前記コンテナ番号の文字領域を撮影した画像を白と黒との二値の画像に変換して、二値画像を作成する二値画像作成機能と、
前記二値画像作成機能により作成された前記二値画像の中から、前記コンテナ番号の文字領域の画像を一文字単位で抽出する文字領域抽出機能と、
前記文字領域抽出機能により抽出された前記文字領域の画像のうち、前記コンテナ番号の英字部の文字領域の画像に含まれている英字を、あらかじめ備えた英字辞書に基づいて文字認識し、文字認識した前記コンテナ番号の英字部の文字列から前記コンテナの所有者を示す所有者コードを判別する所有者コード判別機能と、
それぞれのコンテナの所有者を示す所有者コード別の数字辞書をあらかじめ備え、所有者コード別の前記数字辞書の中から、前記所有者コード判別機能により判別された前記所有者コードに該当する数字辞書を選択する数字辞書選択機能と、
前記文字領域抽出機能により抽出された前記文字領域の画像のうち、前記チェックデジットを除く残りの数字部の文字領域の画像に含まれている数字を、前記数字辞書選択機能により選択した前記数字辞書に基づいて、文字認識する数字認識機能と、
それぞれのコンテナの所有者を示す所有者コード別のパラメータをあらかじめ備え、所有者コード別の前記パラメータの中から、前記所有者コード判別機能により判別された前記所有者コードに該当するパラメータを選択して、選択した前記パラメータを用いて、前記文字領域抽出機能により抽出された前記文字領域の画像のうち、前記チェックデジットの文字領域の画像において該チェックデジットに付されている矩形枠を除去する枠線除去機能と、
前記枠線除去機能により前記矩形枠が除去された状態の文字領域の画像に含まれている前記チェックデジットを、前記数字辞書選択機能により選択した前記数字辞書に基づいて文字認識するチェックデジット認識機能と
を有することを特徴とする。
【発明の効果】
【0022】
本発明のコンテナ番号読取り装置、コンテナ番号読取り方法およびコンテナ番号読取りプログラムによれば、以下のような効果を奏することができる。
【0023】
すなわち、本発明においては、コンテナに付されたコンテナ番号の英字部の文字列からコンテナの所有者を示す所有者コードを判別した後、それぞれの所有者コード別に用意された「数字辞書」の中から、判別した前記所有者コードに該当する「数字辞書」を選択して、コンテナ番号の数字部の文字列の認識処理を行うこと、また、それぞれの所有者コード別に用意されたパラメータの中から、判別した前記所有者コードに該当するパラメータを用いて、チェックデジットに付された矩形枠(チェックデジット枠)を除去する処理を施した後に、チェックデジットの認識処理を行うことにしている。而して、コンテナに付されるコンテナ番号が、コンテナの所有会社毎に、異なる文字フォントで表記されている場合であっても、また、異なる線幅の矩形枠(チェックデジット枠)を用いて表記されたチェックデジットを含むコンテナ番号であっても、該コンテナ番号の認識率を高めることが可能になるという効果が得られる。
【発明を実施するための形態】
【0025】
以下、本発明によるコンテナ番号読取り装置、コンテナ番号読取り方法およびコンテナ番号読取りプログラムの好適な実施形態について添付図を参照して説明する。なお、以下の説明においては、本発明によるコンテナ番号読取り装置およびコンテナ番号読取り方法について説明するが、かかるコンテナ番号読取り方法をコンピュータにより実行可能なコンテナ番号読取りプログラムとして実施するようにしても良いし、あるいは、コンテナ番号読取りプログラムをコンピュータにより読み取り可能な記録媒体に記録するようにしても良いことは言うまでもない。また、以下の各図面に付した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、本発明を図示の態様に限定することを意図するものではないことも言うまでもない。
【0026】
(本発明の特徴)
本発明の実施形態の説明に先立って、本発明の特徴についてその概要をまず説明する。本発明は、
コンテナに付されたコンテナ番号として最終的なチェック用に用いるチェックデジットが含まれているコンテナ番号を読み取るコンテナ番号読取り装置において、
前記コンテナに付された前記コンテナ番号を含む画像に対して、該コンテナの所有者コードを判別し、所有者コード別にあらかじめ用意された数字辞書のうち、判別した前記所有者コードの数字辞書を選択する数字辞書選択手段と、
前記コンテナ番号を含む画像中に含まれる前記チェックデジットの図形を、所有者コード別にあらかじめ用意された「収縮処理パラメータ」および「膨張処理パラメータのうち、判別した前記所有者コードのパラメータを適用することができるサイズに正規化した図形に生成する正規化処理手段と、
判別した前記所有者コードの「収縮処理パラメータ」を用いて、前記正規化処理手段によって正規化させた前記チェックデジットに関する図形を収縮させる収縮処理手段と、
前記収縮処理手段によって収縮された図形を、判別した前記所有者コードの「膨張処理パラメータを用いて、膨張させる膨張処理手段と、
膨張処理手段によって膨張させた前記チェックデジットに関する図形から不要領域を除去する不要領域除去手段と
を少なくとも有していることを主要な特徴としている。
【0027】
而して、コンテナの所有者毎に文字フォントが異なっていても、対応する数字辞書を用いてコンテナ番号を正しく認識することができ、かつ、矩形枠(チェックデジット枠)の線幅がコンテナの所有者毎に異なっていても、前記不要領域除去手段によって生成された画像中の図形を基にして、チェックデジットを確実に認識することができ、コンテナ番号の認識率を高めることができる。
【0028】
(本発明の実施形態の構成例)
次に、本発明の実施形態におけるコンテナ番号読取り装置の装置構成について、
図1を参照しながら説明する。
図1は、本発明の実施形態におけるコンテナ番号読取り装置の装置構成の一例を示す装置構成図である。
【0029】
図1の装置構成図に示すように、本実施形態におけるコンテナ番号読取り装置10は、コンテナ番号領域撮影部1、二値画像作成部2、文字領域抽出部3、特徴量判定部4、文字数確認部5、所有者コード判別部6、数字辞書選択部7、数字認識部8、チェックデジット認識部8A、および、枠線除去部9、を少なくとも備えて構成される。
【0030】
コンテナ番号領域撮影部1は、コンテナに表記されている記号列(文字列)すなわちコンテナ番号を含む領域を撮影した原画像を取得する機能を有している。また、二値画像作成部2は、コンテナ番号領域撮影部1によって取得された前記原画像に対して、あらかじめ設定した閾値を用いて白と黒との二値の画像に変換して、「二値画像」を作成する機能を有している。また、文字領域抽出部3は、二値画像作成部2によって作成された「二値画像」の中から、文字が含まれていると見做される矩形形状の画像領域を「文字領域」候補の包含矩形として1文字ずつ順次抽出する機能を有している。
【0031】
また、特徴量判定部4は、文字領域抽出部3によって包含矩形として抽出された全ての「文字領域」候補に関し、あらかじめ定めた順番に、まだ処理をしていない次の「文字領域」候補を順番に取り出し、取り出した「文字領域」候補の包含矩形の画像に関する特徴量が、文字等の記号の特徴量に適合するものか否かを確認することにより、該包含矩形の画像が、文字等の記号を含む領域すなわち「文字領域」の画像であるか否かを判定する機能を有している。そして、取り出した包含矩形に文字等の記号の特徴量に適合したものが含まれていて、取り出した該包含矩形の画像が「文字領域」の画像であると判定した場合には、当該「文字領域」に関する画像をバッファに保存する機能を有している。さらに、取り出した包含矩形に文字等の記号の特徴量に適合しているものが含まれていなく、取り出した該包含矩形の画像は「文字領域」の画像ではないと判定した場合には、当該「文字領域」に関する画像を「不要領域」の画像と認識して、「文字領域」候補の画像から削除する処理を行う機能を有している。
【0032】
また、文字数確認部5は、特徴量判定部4においてバッファに保存した「文字領域」に関する画像の個数を確認する機能を有している。そして、保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第4番目までの4文字すなわち所有者コードを示す英字部の文字数であるか否かを判定する機能、第5番目から第10番目までの6文字すなわちコンテナ番号の数字部のうち最終のチェックデジットを除いた残りの文字数であるか否かを判定する機能、および、第11番目の文字(数字)すなわちチェックデジットの文字であるか否かを判定する機能を有している。
【0033】
また、所有者コード判別部6は、文字数確認部5によって判定された第1番目〜第4番目の英字部の「文字領域」それぞれの画像の文字列(すなわち、コンテナの所有者を示す英字の文字列)を認識するために、あらかじめ備えられた「英字辞書」を用いて、第1番目〜第4番目の「文字領域」それぞれの画像に含まれている英字の文字認識処理を行い、合計4個の英字を認識した結果を用いて、所有者コードを判別する機能を有している。
【0034】
また、数字辞書選択部7は、コンテナ番号に該当する文字列を含む11個の「文字領域」のうち、第5番目〜第11番目の数字部の「文字領域」の各領域に含まれている合計7個の数字のフォントやチェックデジット枠の太さが、コンテナを所有する会社毎に異なっているので、コンテナの所有者を示す所有者コード別にそれぞれに対応する「数字辞書」をあらかじめ備えていて、所有者コード判別部6において判定された所有者コードに該当する「数字辞書」を選択する機能を有している。
【0035】
また、数字認識部8は、数字辞書選択部7により選択された「数字辞書」を用いて、コンテナ番号に該当する文字列を含む11個の「文字領域」のうち、第5番目〜第10番目の「文字領域」それぞれの画像に含まれている数字の文字認識処理を行う機能を有している。また、チェックデジット認識部8Aは、コンテナ番号に該当する文字列を含む11個の「文字領域」のうち、第11番目の「文字領域」の画像に含まれている矩形枠(チェックデジット枠)付きのチェックデットから、後述の枠線除去部9により該矩形枠を除去した後のチェックデジット(数字)について、数字辞書選択部7により選択された「数字辞書」を用いて、文字認識処理を行う機能を有している。つまり、チェックデジット認識部8Aは、コンテナ番号の認識対象の数字の位置が違うだけで、数字認識部8と同じ機能を有するものであり、数字認識部8をチェックデジット認識部8Aの代わりに用いることにして、チェックデジット認識部8Aを別個に配備しない構成にしても構わない。
【0036】
また、枠線除去部9は、コンテナ番号に該当する文字列を含む11個の「文字領域」のうち、第11番目の「文字領域」に含まれている数字すなわちチェックデジットは、前述した
図4に示したように、矩形形状からなるチェックデジット枠(矩形枠)で囲まれた表記になっているので、該チェックデジット枠を除去して、数字のみが表記された「文字領域」の画像に変換する機能を有している。つまり、第11番目のチェックデジットの数字を文字認識する際には、まず、枠線除去部9によって、チェックデジット枠を除去した数字のみが表記された画像に変換した後、チェックデジット認識部8A(あるいは数字認識部8)によって、該画像に含まれている数字(チェックデジット)の文字認識を行う。
【0037】
ここで、枠線除去部9は、前述のようなチェックデジット枠の除去を行うために、
図1に示すように、正規化処理部91、収縮処理部92、膨張処理部93、および、不要領域除去部94、を少なくとも含んで構成されている。
【0038】
正規化処理部91は、コンテナ番号に該当する文字列を含む11個の「文字領域」のうち、第11番目の数字(チェックデジット)が含まれている「文字領域」の画像を、所有者コード毎にあらかじめ用意されているパラメータ(すなわち「収縮処理パラメータ」および「膨張処理パラメータ」)のうち、所有者コード判別部6によって判別された所有者コードのパラメータに対応することができるサイズに正規化した図形すなわち正規化画像として生成する機能を有している。
【0039】
また、収縮処理部92は、所有者コード毎にあらかじめ用意されている正規化画像用の「収縮処理パラメータ」(正規化画像に対して最適な状態に設定された「収縮処理パラメータ」)の中から、所有者コード判別部6によって判別された所有者コードに該当する「収縮処理パラメータ」を選択して、正規化処理部91により正規化した正規化画像に対して収縮処理すなわち図形を収縮させ線の太さを細くする処理を施して、収縮後画像を作成する機能を有している。なお、本実施形態においては、矩形枠(チェックデジット枠)を形成している矩形の線の線幅(線の太さ)は、チェックデジットの文字を形成している線の線幅よりも細く設定されていることを前提としている。したがって、収縮処理部92において或る程度以上に収縮を施した場合には、チェックデジットの文字を形成している線に関しては繋がった状態を維持していても、矩形枠(チェックデジット枠)を形成している線については切断(あるいは除去)された箇所が存在する状態になる。
【0040】
ここで、「収縮処理パラメータ」のうち、「収縮処理」は、正規化画像を1画素分狭くする処理を意味し、「パラメータ」は、主に前記「収縮処理」を繰り返す回数を意味している。したがって、チェックデジットの「文字領域」の正規化画像に対して最適な値になるように、所有者コード別のそれぞれの「収縮処理パラメータ」をあらかじめ設定しておく。かくのごとき「収縮処理パラメータ」を適用した収縮処理を行うことにより、収縮後画像として、チェックデジットの文字を形成している線には切断(または除去)された箇所がなく、元の正規化画像と同様、繋がっている状態になるが、チェックデジット枠を形成している線には切断(または除去)された箇所が存在するという、良好な結果を得ることができる。
【0041】
また、膨張処理部93は、所有者コード毎にあらかじめ用意されている正規化画像用の「膨張処理パラメータ」(正規化画像に対して最適な状態に設定された「膨張処理パラメータ」)の中から、所有者コード判別部6によって判別された所有者コードに該当する「膨張処理パラメータ」を選択して、収縮処理部92により収縮させた収縮後画像に対して膨張処理すなわち図形を膨張させ線の太さを太くする処理を施して、膨張後画像を作成する機能を有している。なお、チェックデジットの文字を形成している線に関しては収縮後画像においても繋がった状態になっているので、膨張後画像においては元の正規化画像と同じ線の太さの画像の状態に戻るが、チェックデジット枠を形成している線については収縮後画像において切断(あるいは除去)された箇所が存在する状態になっているので、膨張後画像においても切断(あるいは除去)された箇所が存在する状態になる。
【0042】
ここで、「膨張処理パラメータ」のうち、「膨張処理」は、収縮後画像を1画素分広くする処理を意味し、「パラメータ」は、主に前記「膨張処理」を繰り返す回数を意味している。チェックデジットの「文字領域」の正規化画像に対して最適な値になるように、所有者コード別のそれぞれの「膨張処理パラメータ」をあらかじめ設定しておく。かくのごとき「膨張処理パラメータ」を適用した膨張処理を行うことにより、膨張後画像として、チェックデジットの文字を形成している線には切断(または除去)された箇所がなく、元の正規化画像と同様、繋がっている状態になるが、チェックデジット枠を形成している線には切断(または除去)された箇所が存在するという、良好な結果を得ることができる。
【0043】
また、不要領域除去部94は、膨張処理部93により膨張させた膨張後画像に不要領域(すなわち一部が切断または除去されたチェックデジット枠の画像領域)が残っていた場合には除去し、チェックデジット枠の枠線を完全に除去した、枠線除去後画像を作成する機能を有している。つまり、不要領域除去部94は、読取りの対象とする文字(記号)の特徴量を条件として、該特徴量に該当しない画像の領域を不要領域として除去する機能を有している。言い換えると、不要領域除去部94は、文字(記号)の特徴量を条件とすることにより、一部が切断または除去されたチェックデジット枠の画像の中に表記されている文字(記号)を表す図形部分は、当該特徴量の条件を満たすので、そのまま残す処理を施し、その他の部分を表す図形部分つまり切断または除去されたチェックデジット枠を表す図形部分については、当該特徴量の条件を満足していないので、全て除去する処理を施すことになる。
【0044】
(本発明の実施形態の動作の説明)
次に、本発明の実施形態の一例として
図1に示したコンテナ番号読取り装置10の動作について、詳細に説明する。なお、本実施形態においては、コンテナの表面または背面に、4桁の英字と7桁の数字との合計11個の文字列から構成されるコンテナ番号が表記されているものとする。そして、本実施形態の以下の説明においては、コンテナから読み取ったコンテナ番号が、
図4として前述したように、“ABCU1234567””の11桁の文字列からなっていたものと仮定する。そして、4桁の英字“ABCU”は、所有者コードを示す文字列であり、後続する7桁の数字列“1234567”のうち最後の7桁目の数字“7”はチェックデジットであって、チェックデジット枠として矩形枠によって囲まれているものとしている。また、チェックデジット枠の線の線幅(線の太さ)は、チェックデジットを表記している線の線幅(通常、コンテナ番号における他の文字を表記している線の線幅と同じ幅)よりも細くなっているものと仮定する。
【0045】
図2は、
図1に示したコンテナ番号読取り装置10の動作の一例を説明するためのフローチャートであり、本発明に係るコンテナ番号読取り方法の一例を示している。
【0046】
図2のフローチャートにおいて、コンテナの表面または背面に表記されている記号列(文字列)すなわちコンテナ番号を含む領域をコンテナ番号領域撮影部1によって撮影した原画像に対して、二値画像作成部2において、あらかじめ設定した閾値を用いて、白と黒との二値の画像に変換して、「二値画像」を作成する(ステップA1)。ここで、作成した「二値画像」の一例を、前述したように、
図4の模式図に示している。すなわち、4個の英字と7個の数字とからなる11個の文字数で構成されたコンテナ番号として、“ABCU1234567”の文字列を含む画像が「二値画像」として作成される。なお、
図4の模式図に示すように、11個の“ABCU1234567”の文字列を含む画像のうち、最後の第11番目の文字“7”(すなわち、7桁の数字列の最後の第7番目の数字“7”)には、前述したように、正しく文字認識がなされたか否かを最終的にチェックするための特別の文字であることを示すために、矩形形状の枠(チェックデジット枠)が付されている。
【0047】
次に、文字領域抽出部3において、二値画像作成部2において作成された「二値画像」の中から、文字が含まれていると見做される矩形形状の画像領域を「文字領域」候補の包含矩形として1文字ずつ順次抽出する(ステップA2)。
【0048】
しかる後、「文字領域」候補の包含矩形それぞれの画像の特徴量が、文字等の記号の特徴量に適合しているか否かを調べるために、特徴量判定部4を起動する。特徴量判定部4においては、まず、包含矩形として抽出した全ての「文字領域」候補に関し、ステップA4以降の処理が完了したか否かを確認する(ステップA3)。全ての「文字領域」候補に関する処理が完了した場合には(ステップA3の「YES」)、コンテナ番号の読取り処理を終了する。一方、まだ、「文字領域」候補毎の全ての処理が完了していない場合には(ステップA3の「NO」)、ステップA4以降の処理を実施する。
【0049】
ステップA4においては、ステップA2において抽出した「文字領域」候補のうち、あらかじめ定めた順番に、まだ処理をしていない次の「文字領域」候補を順番に取り出し、取り出した「文字領域」候補の包含矩形の画像に関する特徴量が、文字等の記号の特徴量に適合するものか否かを確認することにより、該包含矩形の画像が、文字等の記号を含む領域すなわち「文字領域」の画像であるか否かを判定する(ステップA4)。取り出した該包含矩形に文字等の記号の特徴量に適合しているものが含まれていなく、取り出した包含矩形の画像は「文字領域」の画像ではないと判定した場合には(ステップA4の「NO」)、「不要領域」の画像と認識して、「文字領域」候補の画像から削除する処理を行った後(ステップA16)、ステップA3に戻って、次の「文字領域」候補の確認処理に復帰する。
【0050】
一方、確認した特徴量として、文字等の記号の特徴量に適合したものが含まれていて、取り出した包含矩形の画像が「文字領域」の画像であると判定した場合には(ステップA4の「YES」)、当該「文字領域」に関する画像をバッファに保存する(ステップA5)。しかる後、文字数確認部5を起動して、バッファに保存した当該「文字領域」に関する画像の個数を確認する(ステップA6)。保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第4番目までの4文字ではなかった場合には(ステップA6の「4文字でない」)、ステップA11の処理に移行する。
【0051】
これに対して、保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第4番目までの4文字であった場合には(ステップA6の「4文字」)、コンテナ番号の英字の文字数である所有者コードの文字数であるので、所有者コード別の「数字辞書」の中から、該当する「数字辞書」を選択することができるように、所有者コード判別部6を起動する。所有者コード判別部6は、まず、あらかじめ備えられている「英字辞書」を選択して(ステップA7)、選択した「英字辞書」を用いて、第1番目〜第4番目の英字部の「文字領域」それぞれの画像に含まれている英字の文字認識処理を行う(ステップA8)。
【0052】
そして、第1番目〜第4番目の「文字領域」の各領域に含まれている合計4個の英字を認識した結果を用いて、所有者コード判別部6は、所有者コードを判別し(ステップA9)、判別した所有者コードを数字辞書選択部7に引き継ぐ。通常、コンテナ番号のうち、後続する第5番目〜第11番目の数字部の「文字領域」の各領域に含まれている合計7個の数字のフォントやチェックデジット枠の太さは、前述したように、コンテナを所有する会社毎に、異なっているので、数字辞書選択部7は、コンテナの所有者を示す所有者コード毎に、それぞれに対応する「数字辞書」をあらかじめ備えている。数字辞書選択部7は、所有者コード毎に用意されている「数字辞書」の中から、所有者コード判別部6から引き継いだ所有者コードに該当する「数字辞書」を選択する(ステップA10)。しかる後、後続の第5番目〜第11番目の数字部の「文字領域」の各領域に関する画像を取り出すために、ステップA3に戻って、次の「文字領域」候補の確認処理に復帰する。
【0053】
ステップA3に復帰すると、特徴量判定部4において、前述したような、ステップA3におけるバッファに保存した全ての「文字領域」候補に関する完了判定処理、ステップA4における特徴量確認処理を繰り返す。しかる後、文字数確認部5において、保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第4番目までの4文字ではないと判定されると(ステップA6の「4文字でない」)、次に、保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第10番目までの10文字であるか否かを確認する(ステップA11)。保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第10番目までの10文字ではなかった場合には(ステップA11の「10文字でない」)、ステップA13の処理に移行する。
【0054】
これに対して、保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第10番目までの10文字であった場合には(ステップA11の「10文字」)、コンテナ番号の所有者コードの文字数である4文字に後続する第1桁目の数字に始まって第6桁目の数字に至るまでの数字部の「文字領域」の画像がバッファに保存された状態になっている。したがって、数字認識部8を起動して、ステップA10において数字辞書選択部7により選択された「数字辞書」を用いて、第5番目〜第10番目の数字部の「文字領域」それぞれの画像に含まれている数字の文字認識処理を行う(ステップA12)。つまり、7桁のコンテナ番号の数字のうち、最終の第7桁目の数字(チェックデジット)を除いて、第1桁目から第6桁目までの6個の数字に関する図形の認識処理が行われる。しかる後、最終の第7桁目の数字(チェックデジット)に関する「文字領域」の画像を取り出すために、ステップA3に戻って、次の「文字領域」候補の確認処理に復帰する。
【0055】
ステップA3に復帰すると、特徴量判定部4において、前述したような、ステップA3におけるバッファに保存した全ての「文字領域」候補に関する完了判定処理、ステップA4における特徴量確認処理を繰り返す。しかる後、文字数確認部5において、保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第4番目までの4文字ではないと判定され(ステップA6の「4文字でない」)、かつ、第1番目から数えて第10番目までの10文字ではないと判定されると(ステップA11の「10文字でない」)、次に、保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第11番目までの11文字であるか否かを確認する(ステップA13)。保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第11番目までの11文字ではなかった場合には(ステップA13の「11文字でない」)、コンテナ番号以外の文字等の記号に関する画像を読み捨てるために、ステップA3の処理に移行する。
【0056】
一方、保存した「文字領域」に関する画像の個数すなわち文字数が、第1番目から数えて第11番目までの11文字であった場合には(ステップA13の「11文字」)、コンテナ番号の最終の第11番目の数字すなわちチェックデジットに至るまでの全ての「文字領域」の画像がバッファに保存された状態になっている。ここで、第11番目の「文字領域」に含まれる数字すなわちチェックデジットは、前述した
図4に示したように、矩形形状からなるチェックデジット枠で囲まれた表記になっているので、枠線除去部9を起動して、該チェックデジット枠を除去して、数字のみが表記された「文字領域」の画像に変換する(ステップA14)。なお、枠線除去部9の動作の詳細については、後述する
図3を用いて詳しく説明する。
【0057】
しかる後、チェックデジット認識部8Aを起動して、ステップA10において数字辞書選択部7により選択された「数字辞書」を用いて、第11番目の文字すなわちチェックデジット枠除去後の「文字領域」の画像に含まれている数字の文字認識処理を行い、チェックデジットの値を把握する(ステップA15)。なお、チェックデジット認識部8Aは、コンテナ番号の認識対象となる数字部の「文字領域」の画像の位置は異なるものの、数字認識部8と全く同一の機能を有するものであり、チェックデジット認識部8Aの代わりに数字認識部8を用いて、チェックデジットの図形を認識する処理を行うようにしても良い。以上に説明したように、ステップA15の処理においては、チェックデジットを表す数字“7”に付されていたチェックデジット枠が除去された上で、文字(記号)認識が行われるので、チェックデジットを示す数字“7”を正確に認識することができる。その結果、コンテナ番号を表すチェックデジットを含む記号列(文字列)に関する認識率を大幅に向上させることができる。
【0058】
次に、
図2のフローチャートのステップA14に記載した枠線除去部9の詳細な動作について、
図3のフローチャートを用いて説明する。
図3は、
図2のフローチャートのステップA14に記載した枠線除去部9の詳細な動作の一例を説明するためのフローチャートであり、本発明に係るコンテナ番号読取り方法の枠線除去ステップに関する動作の一例を示している。
【0059】
図3のフローチャートにおいて、枠線除去部9は、まず、正規化処理部91を起動して、コンテナ番号の最終の第11番目の数字(チェックデジット)が含まれている「文字領域」の画像を基にして、所有者コード別にあらかじめ用意されている「収縮処理パラメータ」および「膨張処理パラメータ」のうち、ステップA9において所有者コード判別部6により判別された所有者コードに該当する「収縮処理パラメータ」および「膨張処理パラメータ」に対応することができるサイズに正規化した図形すなわち正規化画像として生成する(ステップA141)。
図5は、
図4に示したコンテナ番号に関する二次画像のうち最後のチェックデジットの「文字領域」の画像を正規化処理部91において正規化した図形の一例を示す模式図である。
【0060】
しかる後、収縮処理部92を起動して、所有者コード毎にあらかじめ用意されている正規化画像用の「収縮処理パラメータ」(正規化画像に対して最適な状態に設定された「収縮処理パラメータ」)の中から、ステップA9において所有者コード判別部6により判別された所有者コードに該当する「収縮処理パラメータ」を選択して(ステップA142)、ステップA141において正規化処理部91により正規化した正規化画像に対して収縮処理すなわち図形を収縮させ線の太さを細くする処理を施して、収縮後画像を作成する(ステップA143)。
【0061】
この結果、チェックデジット枠を形成している矩形の線の線幅は、チェックデジットの文字を形成している線の線幅よりも細く設定されているので、チェックデジットの文字を形成している線に関しては繋がった状態になっていても、チェックデジット枠を形成している線については切断(あるいは除去)された箇所が存在する状態になる。
図6は、
図5に示したチェックデジットに関する正規化画像を収縮処理部92により収縮させた図形の一例を示す模式図であり、矩形形状のチェックデジット枠を形成している線が、矩形形状の一部が除去された状態になっている。
【0062】
ここで、「収縮処理パラメータ」のうち、「収縮処理」は、正規化画像を1画素分狭くする処理を意味し、「パラメータ」は、主に前記「収縮処理」を繰り返す回数を意味している。ステップA142において、チェックデジットの「文字領域」の正規化画像に対して最適な値に設定された所有者コード別の「収縮処理パラメータ」があらかじめ設定されているので、収縮後画像として
図6に示したような良好な結果が得られる。
【0063】
次いで、膨張処理部93を起動して、所有者コード毎にあらかじめ用意されている正規化画像用の「膨張処理パラメータ」(正規化画像に対して最適な状態に設定された「膨張処理パラメータ」)の中から、ステップA9において所有者コード判別部6により判別された所有者コードに該当する「膨張処理パラメータ」を選択して(ステップA144)、ステップA143において収縮処理部92により収縮させた収縮後画像に対して膨張処理すなわち図形を膨張させ線の太さを太くする処理を施して、膨張後画像を作成する(ステップA145)。
【0064】
この結果、チェックデジットの文字を形成している線に関しては収縮後画像においても繋がった状態になっているので、膨張後画像においては正規化画像と同じ線の太さの画像の状態に戻るが、チェックデジット枠を形成している線については収縮後画像において切断(あるいは除去)された箇所が存在する状態になっているので、膨張後画像においても切断(あるいは除去)された箇所が存在する状態になる。
図7は、
図6に示したチェックデジットに関する収縮後画像を膨張処理部93により膨張させた図形の一例を示す模式図であり、矩形形状のチェックデジット枠を形成している線が、矩形形状の一部が除去された状態のままになっている。
【0065】
ここで、「膨張処理パラメータ」のうち、「膨張処理」は、収縮後画像を1画素分広くする処理を意味し、「パラメータ」は、主に前記「膨張処理」を繰り返す回数を意味している。ステップA144において、チェックデジットの「文字領域」の正規化画像に対して最適な値に設定された所有者コード別の「膨張処理パラメータ」があらかじめ設定されているので、膨張後画像として
図7に示したような良好な結果が得られる。
【0066】
しかる後、不要領域除去部94を起動して、ステップA145において膨張処理部93により膨張させた膨張後画像に不要領域(すなわち一部が切断または除去されたチェックデジット枠(矩形枠)の画像領域)が残っていた場合には除去し、チェックデジット枠(矩形枠)の枠線を完全に除去した、枠線除去後画像を作成する(ステップA146)。つまり、不要領域除去部94は、読取りの対象とする文字(記号)の特徴量を条件として、該特徴量に該当しない画像の領域を不要領域として除去する。言い換えると、不要領域除去部94は、文字(記号)の特徴量を条件とすることにより、一部が切断または除去されたチェックデジット枠の画像の中に表記されている文字(記号)を表す図形部分すなわちチェックデジットを示す図形部分は、当該特徴量の条件を満たすので、そのまま残す処理を施し、その他の部分を表す図形部分つまり切断または除去されたチェックデジット枠を表す図形部分については、当該特徴量の条件を満足していないので、全て除去する処理を施している。
図8は、
図7に示したチェックデジットに関する膨張後画像の不要領域を不要領域除去部94により除去させた図形の一例を示す模式図であり、膨張後画像に残っていた不要領域(すなわち、一部が切断または除去されたチェックデジット枠(矩形枠))を完全に除去した枠線除去後画像を示している。
【0068】
以上に詳細に説明したように、本実施形態のコンテナ番号読取り装置およびコンテナ番号読取り方法においては、以下のような効果を奏することができる。
【0069】
すなわち、本実施形態においては、コンテナに付されたコンテナ番号の英字部の文字列からコンテナの所有者を示す所有者コードを判別した後、それぞれの所有者コード別に用意された「数字辞書」の中から、判別した前記所有者コードに該当する「数字辞書」を選択して、コンテナ番号の数字部の文字列の認識処理を行うこと、また、それぞれの所有者コード別に用意されたパラメータの中から、判別した前記所有者コードに該当するパラメータを用いて、チェックデジットに付された矩形枠(チェックデジット枠)を除去する処理を施した後に、チェックデジットの認識処理を行うことにしている。而して、コンテナに付されるコンテナ番号が、コンテナの所有会社毎に、異なる文字フォントで表記されている場合であっても、また、異なる線幅の矩形枠(チェックデジット枠)を用いて表記されたチェックデジットを含むコンテナ番号であっても、該コンテナ番号の認識率を高めることが可能になるという効果が得られる。
【0070】
以上、本発明の好適な実施形態の構成を説明した。しかし、かかる実施形態は、本発明の単なる例示に過ぎず、何ら本発明を限定するものではないことに留意されたい。本発明の要旨を逸脱することなく、特定用途に応じて種々の変形変更が可能であることが、当業者には容易に理解できよう。