(58)【調査した分野】(Int.Cl.,DB名)
前記宛先領域パターンデータベースは、宛先領域パターンとして、前記宛先領域候補内の、前記番号キーワードの位置情報と、前記住所キーワードの位置情報と、が登録される、
請求項1に記載の宛先認識装置。
前記宛先領域パターンデータベースは、宛先領域パターンとして、前記宛先領域候補内の、前記特定キーワードの位置情報と、前記番号キーワードの位置情報と、前記住所キーワードの位置情報と、が登録される、
請求項4に記載の宛先認識装置。
前記宛先領域パターンデータベースは、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報が、前記宛先領域パターン学習処理部により、前記宛先領域パターンデータベースに登録された登録済宛先領域パターンと照合され、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報が、前記登録済宛先領域パターンのいずれとも一致しない場合、新規の宛先領域パターンとして、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報が、前記宛先領域パターンデータベースに登録される、
請求項1乃至請求項6のいずれか1項に記載の宛先認識装置。
前記宛先領域パターンデータベースは、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報が、前記宛先領域パターン学習処理部により、前記宛先領域パターンデータベースに登録された登録済宛先領域パターンと照合され、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報と一致する登録済宛先領域パターンが存在する場合、前記一致する登録済宛先領域パターンの内容が更新される、
請求項1乃至請求項6のいずれか1項に記載の宛先認識装置。
前記宛先領域候補検出処理部によって検出された宛先領域候補から、番号キーワード及び住所キーワードを検出し、前記検出した番号キーワード及び住所キーワードの位置関係を示す情報である第3の情報を生成し、前記生成した第3の情報を、前記宛先領域パターンデータベースに登録された登録済宛先領域パターンと照合し、前記宛先領域候補検出処理部によって検出された宛先領域候補全ての中から、宛先住所とする宛先領域候補の文字列を選択する宛先住所判定処理部と、
前記宛先住所判定処理部による照合により、前記宛先住所判定処理部で生成された第3の情報と一致する登録済宛先領域パターンが存在する場合、前記一致する登録済宛先領域パターンの番号キーワード及び住所キーワードの位置関係を示す情報が、照合結果として記憶される照合結果記憶部と、
を具備する、請求項7または請求項8に記載の宛先認識装置。
前記宛先領域パターンデータベースは、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報が、前記宛先領域パターン学習処理部により、前記宛先領域パターンデータベースに登録された登録済宛先領域パターンと照合され、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報が、前記登録済宛先領域パターンのいずれとも一致しない場合、新規の宛先領域パターンとして、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報が、この第1の情報またはこの第2の情報の出現回数に対応したスコア値とともに、前記宛先領域パターンデータベースに登録される、
請求項1乃至請求項6のいずれか1項に記載の宛先認識装置。
前記宛先領域パターンデータベースは、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報が、前記宛先領域パターン学習処理部により、前記宛先領域パターンデータベースに登録された登録済宛先領域パターンと照合され、前記宛先領域パターン学習処理部で生成された第1の情報または前記宛先領域パターン学習処理部で生成された第2の情報と一致する登録済宛先領域パターンが存在する場合、前記一致する登録済宛先領域パターンに対応するスコア値が、宛先領域パターンの出現回数に対応して更新される、
請求項1乃至請求項6のいずれか1項に記載の宛先認識装置。
前記宛先領域候補検出処理部によって検出された宛先領域候補から、番号キーワード及び住所キーワードを検出し、前記検出した第3の情報を生成し、前記生成した第3の情報を、前記宛先領域パターンデータベースに前記スコア値とともに登録された登録済宛先領域パターンと照合し、前記宛先領域候補検出処理部によって検出された宛先領域候補全ての中から、前記スコア値に基づき、宛先住所とする宛先領域候補の文字列を選択する宛先住所判定処理部と、
前記宛先住所判定処理部による照合により、前記宛先住所判定処理部で生成された第3の情報と一致する登録済宛先領域パターンが存在する場合、前記一致する登録済宛先領域パターンの番号キーワード及び住所キーワードの位置関係を示す情報が、前記一致する登録済宛先領域パターンのスコア値とともに、照合結果として記憶される照合結果記憶部と、
を具備する、請求項11または請求項12に記載の宛先認識装置。
【発明を実施するための形態】
【0009】
以下、本発明を実施するための実施形態について、図面を参照して説明する。
【0010】
図1を参照して、本発明の実施形態に係る宛先認識装置100の構成について説明する。
図1は、本発明の実施形態に係る宛先認識装置100の構成例を示す機能ブロック図である。
【0011】
実施形態の宛先認識装置100は、主に宛先認識装置100の運用前に実行される、宛先領域パターン学習処理に用いられる機能部群と、宛先認識装置100の運用時に実行される、宛先住所判定処理に用いられる機能部群と、を有する。
【0012】
宛先領域パターン学習処理に用いられる機能部群は、配達対象物区分機等に用いられる宛先認識装置100の運用前に、運用時に必要なデータを蓄積するための処理を行うものである。この宛先領域パターン学習処理は、画像読取部11、画像記憶部31、画像読取制御部21、宛先領域候補検出処理部22、番号キーワード入力受付部12、番号キーワード・対応住所辞書部32、宛先領域パターン学習処理部23、及び宛先領域パターンデータベース33を用いる。
【0013】
画像読取部11は、郵便書状や小包等の配達対象物の表面の画像を撮像するものである。画像読取部11は、例えば、スキャナやカメラ等であり、配達対象物の表面を1つずつ撮像し、撮像された配達対象物の表面の画像のデータである画像データPを生成する。画像読取部11は、画像読取制御部21により、制御される。
【0014】
画像記憶部31は、画像読取部11により生成された画像データPが、画像読取制御部21により、記憶されるものである。また、画像記憶部31に記憶された画像データPは、後述する宛先領域候補検出処理部22により、参照される。また、画像記憶部31に記憶された画像データPは、後述する番号キーワード入力受付部12により、参照される。
【0015】
画像読取制御部21は、これら画像読取部11と、画像記憶部31と、の動作を制御するものである。
【0016】
宛先領域候補検出処理部22は、画像記憶部31に記憶された画像データPを参照し、参照した画像データPから、宛先が記載された領域の候補となる、文字列が含まれる領域である宛先領域候補Cを検出するものである。また、宛先領域候補検出処理部22は、後述する宛先領域パターン学習処理部23へ、検出した宛先領域候補Cの情報を出力する。
【0017】
番号キーワード入力受付部12は、画像記憶部31に記憶された画像データP毎に、日本の「郵便番号」やアメリカの「ZIPコード」等の、住所区域毎に割り当てられた番号である番号キーワードの入力を受け付けるものである。
【0018】
オペレータは、画像記憶部31に記憶された画像データPを参照し、参照した画像データPから、宛先領域と判断した宛先領域候補Cに含まれる番号キーワードを、キーボード等のユーザインタフェースを用いて番号キーワード入力受付部12へ入力する。
【0019】
また、番号キーワード入力受付部12は、後述する宛先領域パターン学習処理部23へ、入力された番号キーワードの情報を出力する。
【0020】
番号キーワード・対応住所辞書部32は、番号キーワード及びその番号キーワードに対応する対応住所が予め記憶されるものである。例えば、日本の場合は、「郵便番号」から、「○○市○○町」までの対応住所が特定できる。アメリカの場合は、「ZIPコード」から、「○○シティ」までの対応住所が特定できる。
【0021】
番号キーワード・対応住所辞書部32には、これら番号キーワード及び対応住所の対応関係が記憶されている。番号キーワード・対応住所辞書部32は、後述する宛先領域パターン学習処理部23により参照され、後述する宛先領域パターン学習処理部23へ出力された番号キーワードの情報が、対応する対応住所と、照合される。
【0022】
宛先領域パターン学習処理部23は、主に、後述する位置関係情報Rを生成し、後述する宛先領域パターンデータベース33へ、後述する宛先領域パターンAを登録させるものである。
【0023】
まず、宛先領域パターン学習処理部23は、宛先領域候補検出処理部22が検出した各宛先領域候補Cから、オペレータが番号キーワード入力受付部12に入力した番号キーワードの検出を行う。オペレータが番号キーワード入力受付部12に入力した番号キーワードを有する宛先領域候補Cは、宛先領域に該当する可能性が最も高いためである。
【0024】
宛先領域パターン学習処理部23は、さらに、番号キーワードを有する宛先領域候補Cに対し、番号キーワード・対応住所辞書部32を参照し、オペレータが番号キーワード入力受付部12に入力した番号キーワードと、番号キーワード・対応住所辞書部32に記憶されている番号キーワード及び対応住所を照合し、対応住所を取得する。
【0025】
宛先領域パターン学習処理部23は、さらに、番号キーワード・対応住所辞書部32から取得した番号キーワードの対応住所のうちの、「市」、「町」、「ストリート」、「建物」、「私書箱」等の、住所を構成する用語である住所キーワードの検出を行う。
【0026】
宛先領域パターン学習処理部23は、さらに、番号キーワード及び対応住所の住所キーワードを有する宛先領域候補Cから、「To」、「様」、「殿」「Mr」等の、文字列が宛先住所であることを示唆する用語である特定キーワードの検出を行う。宛先領域候補Cには、特定キーワードが含まれる場合も、含まれない場合もある。
【0027】
そして、宛先領域パターン学習処理部23は、番号キーワード及び対応住所の住所キーワードを有する宛先領域候補Cから、番号キーワード及び住所キーワードの位置関係を示す情報を生成する。オペレータが番号キーワード入力受付部12に入力した番号キーワード及び対応住所の住所キーワードを有する宛先領域候補Cが、複数検出された宛先領域候補Cのうち、宛先領域に該当する可能性が最も高いためである。なお、特定キーワードが宛先領域候補Cに含まれる場合は、宛先領域パターン学習処理部23は、特定キーワードと番号キーワードと住所キーワードとの位置関係を示す情報を生成する。番号キーワード及び住所キーワードの位置関係を示す情報と、特定キーワードと番号キーワードと住所キーワードとの位置関係を示す情報と、を総称して、以降、位置関係情報Rと称する。
【0028】
位置関係情報Rは、すなわち、宛先領域候補Cに含まれるキーワード同士の互いの位置関係を示す情報を示す。例として、宛先領域候補に特定キーワードが含まれる場合は、位置関係情報Rは、番号キーワードから特定キーワードや各住所キーワードまでの方向や距離等を表した相対位置関係を示す。この他に、特定キーワード、番号キーワード、各住所キーワードの座標を表したそれぞれの位置情報の組み合わせで表現してもよい。
【0029】
そして、宛先領域パターン学習処理部23は、生成した位置関係情報Rの型を、後述する宛先領域パターンデータベース33へ、宛先領域パターンAとして、登録または更新させる。
【0030】
宛先領域パターンデータベース33は、位置関係情報Rの型である宛先領域パターンAが、例えば、宛先領域パターンAを識別する番号である宛先領域パターン番号と、宛先領域パターンAが宛先領域パターン学習処理で所定の期間内に出現する回数が多いか否かを表すスコア値とともに、宛先領域パターン学習処理部23により登録または更新されるものである。なお、宛先領域パターンデータベース33は、スコア値を含まない場合もある。
【0031】
宛先領域パターンAは、すなわち、番号キーワード及び住所キーワードの位置関係を示す情報の型や、特定キーワードと番号キーワードと住所キーワードとの位置関係を示す情報の型である。
【0032】
また、スコア値は、宛先領域パターン学習時の所定の期間内に、その宛先領域パターンAが何回出現かによって、随時更新される値である。ここで、所定の期間とは、この宛先認識装置が使用され始めてからこれまでの全ての期間でもよいし、特定の期間でもよい。またここでは、出現回数が多い宛先領域パターンAほど、スコア値が高い。
【0033】
このため、頻出の、すなわちスコア値が高い宛先領域パターンAほど、宛先領域である尤度が高いと言える。すなわち、後述する宛先住所判定処理において、複数の宛先領域候補Cから、複数の宛先領域パターンAと一致する複数の位置関係情報Rが生成された場合、これら複数の宛先領域候補Cのうち、スコア値が最も高い宛先領域パターンAと一致する位置関係情報Rを生成した宛先領域候補Cが、宛先領域である尤度が最も高い。このため、このスコア値が最も高い宛先領域パターンAを検出した宛先領域候補Cの文字列が、宛先住所として出力されることとなる。
【0034】
宛先領域パターンデータベース33は、宛先領域パターン学習処理部23により参照される。すなわち、宛先領域パターン学習処理部23によって生成された位置関係情報Rの型が、この位置関係情報Rの型と一致する、宛先領域パターンデータベース33に登録されている宛先領域パターンAと照合される。
【0035】
宛先領域パターン学習処理部23によって生成された位置関係情報Rの型が、宛先領域パターンデータベース33に未登録であった場合、この未登録の位置関係情報Rの型は、新規な宛先領域パターンAとして、宛先領域パターン学習処理部23によって、宛先領域パターンデータベース33に登録される。
【0036】
一方、宛先領域パターン学習処理部23によって生成された位置関係情報Rの型が、宛先領域パターンデータベース33に登録済みであった場合、この登録済みの宛先領域パターンAのスコア値に所定の数値を加算することで、宛先領域パターン学習処理部23によって、宛先領域パターンデータベース33のデータの内容が更新される。
【0037】
以上の機能部群による宛先領域パターン学習処理により、宛先領域パターンAのデータが、宛先領域パターンデータベース33に蓄積される。
【0038】
宛先住所判定処理に用いられる機能部群は、前述した宛先領域パターン学習処理に用いられる機能部群によって宛先領域パターンAのデータが宛先領域パターンデータベース33に蓄積された後に、配達対象物区分機等に用いられる宛先認識装置100の運用時の宛先住所判定処理を行うものである。この宛先住所判定処理は、画像読取部11、画像記憶部31、画像読取制御部21、宛先領域候補検出処理部22、番号キーワード・対応住所辞書部32、宛先住所判定処理部24、宛先領域パターンデータベース33、照合結果記憶部34、宛先領域候補絞込結果記憶部35、及び宛先住所出力部13を用いる。なお、宛先領域候補絞込結果記憶部35は、省略されたり使用されなかったりする場合もある。
【0039】
ここで、画像読取部11と、画像記憶部31と、画像読取制御部21と、宛先領域候補検出処理部22と、番号キーワード・対応住所辞書部32と、宛先領域パターンデータベース33とは、宛先領域パターン学習処理に用いられる機能部群と宛先住所判定処理に用いられる機能部群と共通で用いられる。これらのうち、画像読取部11と、画像記憶部31と、画像読取制御部21とは、宛先領域パターン学習処理の実行時と、宛先住所判定処理の実行時とで、構成及び機能が同様のため、ここでは説明を省略する。
【0040】
宛先領域候補検出処理部22は、画像記憶部31に記憶された画像データPを参照し、参照した画像データPから宛先領域候補Cを検出するものである。宛先領域候補検出処理部22は、後述する宛先住所判定処理部24へ、検出した宛先領域候補Cの情報を出力する。
【0041】
番号キーワード・対応住所辞書部32は、後述する宛先住所判定処理部24により参照され、後述する宛先住所判定処理部24により検出された番号キーワードの情報が、対応する対応住所と、照合される。
【0042】
宛先住所判定処理部24は、主に、位置関係情報Rを生成し、宛先領域候補Cの文字列から宛先住所となる文字列を選択し、後述する宛先住所出力部13へ宛先住所の出力をするものである。また、宛先住所判定処理部24は、後述する宛先領域候補絞込処理を実行する場合の、処理主体である。
【0043】
まず、宛先住所判定処理部24は、宛先領域候補検出処理部22が検出した各宛先領域候補Cから、番号キーワード及び住所キーワードの検出を行う。すなわち、まず、宛先住所判定処理部24は、番号キーワードの検出を行う。宛先住所判定処理部24は、さらに、番号キーワードを有する宛先領域候補Cに対し、番号キーワード・対応住所辞書部32を参照し、検出された番号キーワードと、番号キーワード・対応住所辞書部32に記憶されている番号キーワード及び対応住所を照合し、対応住所を取得する。宛先領域パターン学習処理部23は、さらに、番号キーワード・対応住所辞書部32の参照から取得された番号キーワードの対応住所のうちの、住所キーワードの検出を行う。
【0044】
宛先住所判定処理部24は、さらに、番号キーワード及び対応住所の住所キーワードを有する宛先領域候補Cから、特定キーワードの検出を行う。特定キーワードは、宛先領域候補Cに含まれる場合も、含まれない場合もある。
【0045】
そして、宛先住所判定処理部24は、各宛先領域候補Cのうち、番号キーワード及び対応住所の住所キーワードを有する宛先領域候補C全てから、位置関係情報Rをそれぞれ生成する。
【0046】
宛先住所判定処理部24は、生成した位置関係情報Rの型を、順次、宛先領域パターンデータベース33に登録された宛先領域パターンA及びそのスコア値と、照合する。なお、宛先領域パターンデータベース33は、スコア値を含まない場合もある。
【0047】
宛先住所判定処理部24は、この照合結果を、後述する照合結果記憶部34へ、記憶させる。照合結果とは、すなわち、宛先住所判定処理部24が生成した位置関係情報Rの型と一致する宛先領域パターンAが宛先領域パターンデータベース33にあった場合、その宛先領域パターンA全てに対し、例えば、その宛先領域パターン番号や、その宛先領域パターンのスコア値とそのスコア値が高い順に順位付けした順位の情報を、記憶するものである。
【0048】
そして、宛先住所判定処理部24は、位置関係情報Rの生成を宛先領域候補C全てに対し終了すると、後述する照合結果記憶部34を参照し、例えば、スコア値が最も高い宛先領域パターンAと一致する位置関係情報Rを生成した宛先領域候補Cの文字列を選択し、これを宛先住所と判定する。宛先住所判定処理部24は、後述する宛先住所出力部13へ、この宛先住所を出力する。
【0049】
宛先領域パターンデータベース33は、前述した宛先領域パターン学習処理により、宛先領域パターンAがスコア値とともに登録されるものである。宛先領域パターンデータベース33は、宛先住所判定処理部24により参照される。すなわち、宛先住所判定処理部24で生成された位置関係情報Rの型が、この位置関係情報Rの型と一致する、宛先領域パターンデータベース33に登録されている宛先領域パターンAと照合される。
【0050】
なお、宛先住所判定処理部24は、後述する宛先領域候補絞込処理を実行する場合のように、「From」、「Return」、「転送」等の、文字列が差出人の住所等、宛先住所以外であることを示唆する用語であるNGキーワードの検出を行う場合もある。この宛先領域候補絞込処理を、例えば、宛先住所判定処理に先立って行うことで、宛先領域候補Cを予め絞り込むことが可能となる。この宛先領域候補絞込処理を行う段階において、処理対象となる宛先領域候補を、第1次宛先領域候補C’と称する。
【0051】
この場合、宛先住所判定処理部24は、後述する宛先領域候補絞込結果を、後述する宛先領域候補絞込結果記憶部35へ、記憶させる。宛先領域候補絞込結果とは、すなわち、第1次宛先領域候補C’全てに対し、NGキーワードの有無の情報を、記憶するものである。
【0052】
照合結果記憶部34は、宛先住所判定処理部24が宛先領域パターンデータベース33を参照した結果が、宛先住所判定処理部24により記憶されるものである。すなわち、宛先住所判定処理部24が生成した位置関係情報Rの型と一致する宛先領域パターンAが宛先領域パターンデータベース33にあった場合、その宛先領域パターンA全てに対し、例えば、その宛先領域パターン番号や、その宛先領域パターンのスコア値とそのスコア値が高い順に順位付けした順位の情報を、記憶する。これら照合結果は、宛先住所判定処理部24によって参照される。
【0053】
宛先領域候補絞込結果記憶部35は、宛先領域候補検出処理部22が検出した各第1次宛先領域候補C’に対して、後述する宛先領域候補絞込処理を実行する際に、宛先住所判定処理部24がNGキーワードの検出を行った結果、すなわちNGキーワードの有無の情報が、宛先住所判定処理部24により記憶されるものである。
【0054】
宛先住所出力部13は、例えば、照合結果記憶部34に記憶された宛先領域パターンAとそのスコア値のうち、スコア値が最も高い、または、スコア値の高さの順位が1位である、宛先領域パターンAと一致する位置関係情報Rが生成された宛先領域候補Cの文字列を、宛先住所として、宛先住所判定処理部24から受け取るものである。
【0055】
なお、宛先住所出力部13は、受け取った宛先住所を、さらに、直接配達対象物区分機側へ出力してもよいし、宛先認識装置100が備える受け渡し用のデータベースへ出力してもよい。
【0056】
以上の機能部群による宛先住所判定処理により、配達対象物の宛先認識が実行される。なお、宛先認識装置100は、インターフェース部10と、制御部20と、記憶部30と、を備える。インターフェース部10は、画像読取部11と、番号キーワード入力受付部12と、宛先住所出力部13と、を備える。制御部20は、画像読取制御部21と、宛先領域候補検出処理部22と、宛先領域パターン学習処理部23と、宛先住所判定処理部24と、を備える。記憶部30は、画像記憶部31と、番号キーワード・対応住所辞書部32と、宛先領域パターンデータベース33と、照合結果記憶部34と、宛先領域候補絞込結果記憶部35と、を備える。
【0057】
ここで、制御部20の画像読取制御部21と、宛先領域候補検出処理部22と、宛先領域パターン学習処理部23と、宛先住所判定処理部24の機能部は、例えば、CPU(Central Processing Unit)等のプロセッサが記憶部30に格納されたプログラムを実行することで機能するソフトウェア機能部である。また、これらの機能部のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、各種インターフェース等のハードウェアを含んでもよい。
【0058】
ここで、
図2を参照して、宛先領域パターンAを学習する処理について説明する。
図2は、宛先領域パターン学習処理の流れの一例を示すフローチャートである。この宛先領域パターンAを学習する処理の開始前に、画像読取部11と、画像記憶部31と、画像読取制御部21と、によって実現される機能を実行する機能部群としての画像取得部により、配達対象物の画像データPが取得される。
【0059】
宛先領域候補検出処理部22は、画像記憶部31に記憶された画像データPを解析し、宛先領域候補Cとなるものを全て検出する(ステップS101)。検出方法は任意の方法が用いられる。例えば、文字候補の並び方から行候補を抽出し、さらに行候補の並び方から宛先領域候補Cを検出する方法が用いられる。この他に、隣接する文字候補を連結させ、連結結果を宛先領域候補Cとして検出する方法が用いられてもよい。
【0060】
各宛先領域候補Cには、0からn(nは自然数)までの通し番号が振られる。これを初期値0からセットされた変数iで表す。宛先領域パターン学習処理部23は、0番目の宛先領域候補Cから、順に処理を行う(ステップS102)。
【0061】
宛先領域パターン学習処理部23は、事前にオペレータにより番号キーワード入力受付部12へ入力された番号キーワードが、処理対象の宛先領域候補Cから検出されるか否かの判定を行う(ステップS103)。
【0062】
番号キーワードが検出されなかった場合(ステップS103でNO)、宛先領域パターン学習処理部23は、宛先領域候補検出処理部22により検出された全ての宛先領域候補Cに対して宛先領域パターン学習処理が終了したか否かの判定を行う(ステップS112)。全ての宛先領域候補Cに対しての処理が終了していない場合(ステップS112でNO)、i+1番目の宛先領域候補Cに対する処理に進む(ステップS113)。
【0063】
一方、番号キーワードが検出された場合(ステップS103)、宛先領域パターン学習処理部23は、その番号キーワードを有する宛先領域候補Cに対し、番号キーワード・対応住所辞書部32を参照し、オペレータが番号キーワード入力受付部12に入力した番号キーワードと、番号キーワード・対応住所辞書部32に記憶されている番号キーワード及び対応住所とを照合し、対応住所を取得する(ステップS104)。
【0064】
続いて、宛先領域パターン学習処理部23は、その番号キーワードを有する宛先領域候補Cから、その対応住所のうちの住所キーワードが検出されるか否かの判定を行う(ステップS105)。
【0065】
住所キーワードが検出されなかった場合(ステップS105でNO)、宛先領域パターン学習処理部23は、宛先領域候補検出処理部22により検出された全ての宛先領域候補Cに対して宛先領域パターン学習処理が終了したか否かの判定を行う(ステップS112)。全ての宛先領域候補Cに対しての処理が終了していない場合(ステップS112でNO)、i+1番目の宛先領域候補Cに対しての処理に進む(ステップS113)。
【0066】
一方、住所キーワードが検出された場合(ステップS105でYES)、宛先領域パターン学習処理部23は、その番号キーワード及び対応住所の住所キーワードを有する宛先領域候補Cから、さらに、特定キーワードが検出されるか否かの判定を行う(ステップS106)。
【0067】
特定キーワードが検出されなかった場合(ステップS106でNO)、宛先領域パターン学習処理部23は、番号キーワード及び住所キーワードの位置関係を示す情報を生成する(ステップS107)。一方、特定キーワードが検出された場合(ステップS106でYES)、宛先領域パターン学習処理部23は、特定キーワードと番号キーワードと住所キーワードとの位置関係を示す情報を生成する(ステップS108)。すなわち、ステップS107またはステップS108において、宛先領域パターン学習処理部23は、位置関係情報Rを、生成する。
【0068】
続いて、宛先領域パターン学習処理部23は、生成した位置関係情報Rの型を、宛先領域パターンデータベース33に登録されている宛先領域パターンAと照合し、一致する宛先領域パターンAがあるか否かを判定する(ステップS109)。
【0069】
照合の結果、生成した位置関係情報Rの型が、登録済みの宛先領域パターンAのいずれとも一致しない場合(ステップS109でNO)、宛先領域パターン学習処理部23は、その位置関係情報Rの型を、宛先領域パターンデータベース33に、新規の宛先領域パターンAとして登録する(ステップS110)。
【0070】
一方、生成した位置関係情報Rの型が、登録済みの宛先領域パターンAと一致する場合(ステップS109でYES)、宛先領域パターン学習処理部23は、その登録済みの宛先領域パターンAのスコア値に所定の数値を加算する。これにより、その宛先領域パターンAのデータの内容が更新される(ステップS111)。なお、スコア値の加算方式は、任意の方式が用いられる。
【0071】
続いて、宛先領域パターン学習処理部23は、宛先領域候補検出処理部22により検出された全ての宛先領域候補Cに対して宛先領域パターン学習処理が終了したか否かの判定を行う(ステップS112)。全ての宛先領域候補Cに対する処理が終了していない場合(ステップS112でNO)、i+1番目の宛先領域候補Cに対する処理に進む(ステップS113)。
【0072】
一方、全ての宛先領域候補Cに対する処理が終了している場合(ステップS112でYES)、宛先領域パターン学習処理を終了する。
【0073】
以上により、画像取得部により取得された、ある配達対象物の画像データPに対する宛先領域パターン学習処理を終了する。この宛先領域パターン学習処理を繰り返すことによって、宛先領域パターンデータベース33に宛先領域パターンAのデータが蓄積される。
【0074】
次に、
図3を参照して、宛先住所を判定する処理について説明する。
図3は、宛先住所判定処理の流れの一例を示すフローチャートである。この処理を実行するには、前述した宛先領域パターン学習処理が一定量の配達対象物に対して実行され、宛先領域パターンデータベース33が十分なデータ量を蓄積していることが前提となる。
【0075】
この宛先住所を判定する処理の開始前に、画像読取部11と、画像記憶部31と、画像読取制御部21と、によって実現される機能を実行する機能部群としての画像取得部により、配達対象物の画像データPが取得される。
【0076】
宛先領域候補検出処理部22は、画像記憶部31に記憶された画像データPを解析し、宛先領域候補Cとなるものを全て検出する(ステップS201)。
【0077】
各宛先領域候補Cには、0からn(nは自然数)までの通し番号が振られる。これを初期値0からセットされた変数iで表す。宛先住所判定処理部24は、0番目の宛先領域候補Cから、順に処理を行う(ステップS202)。
【0078】
宛先住所判定処理部24は、番号キーワード及び対応住所の住所キーワードが、処理対象の宛先領域候補Cから検出されるか否かの判定を行う(ステップS203)。なお、具体的には、まず、宛先住所判定処理部24は、処理対象の宛先領域候補Cから番号キーワードの検出を行い、番号キーワード・対応住所辞書部32を参照して、検出された番号キーワードの対応住所を取得し、さらに、処理対象の宛先領域候補Cからこの対応住所の住所キーワードの検出を行う。
【0079】
番号キーワード及び対応住所の住所キーワードが検出されなかった場合(ステップS203でNO)、宛先住所判定処理部24は、宛先領域候補検出処理部22により検出された全ての宛先領域候補Cに対して宛先住所判定処理が終了したか否かの判定を行う(ステップS209)。全ての宛先領域候補Cに対しての処理が終了していない場合(ステップS209でNO)、i+1番目の宛先領域候補Cに対する処理に進む(ステップS211)。
【0080】
一方、番号キーワード及び住所キーワードが検出された場合(ステップS203でYES)、宛先住所判定処理部24は、その番号キーワード及び対応住所の住所キーワードを有する宛先領域候補Cから、さらに、特定キーワードが検出されるか否かの判定を行う(ステップS204)。
【0081】
特定キーワードが検出されなかった場合(ステップS204でNO)、宛先住所判定処理部24は、番号キーワード及び住所キーワードの位置関係を示す情報を生成する(ステップS205)。一方、特定キーワードが検出された場合(ステップS204でYES)、宛先住所判定処理部24は、特定キーワードと番号キーワードと住所キーワードとの位置関係を示す情報を生成する(ステップS206)。すなわち、ステップS205またはステップS206において、宛先領域パターン学習処理部23は、位置関係情報Rを、生成する。
【0082】
続いて、宛先住所判定処理部24は、生成した位置関係情報Rの型を、宛先領域パターンデータベース33に登録されている宛先領域パターンAと照合し、一致する宛先領域パターンAがあるか否かを判定する(ステップS207)。
【0083】
照合の結果、生成した位置関係情報Rの型が、登録済みの宛先領域パターンAのいずれとも一致しない場合(ステップS207でNO)、宛先住所判定処理部24は、宛先領域候補検出処理部22により検出された全ての宛先領域候補Cに対する宛先住所判定処理が終了したか否かの判定を行う(ステップS209)。全ての宛先領域候補Cに対する処理が終了していない場合(ステップS209でNO)、i+1番目の宛先領域候補Cに対する処理に進む(ステップS211)。
【0084】
一方、生成した位置関係情報Rの型と一致する宛先領域パターンAが存在した場合(ステップS207でYES)、宛先住所判定処理部24は、その照合結果を、照合結果記憶部34に記憶させる(ステップS208)。具体的には、例えば、一致した宛先領域パターンAに対して、宛先領域パターン番号とスコア値を、スコア値の順位とともに、照合結果記憶部34に記憶させる。なお、スコア値の順位は、記憶されなくてもよい。
【0085】
続いて、宛先住所判定処理部24は、宛先領域候補検出処理部22により検出された全ての宛先領域候補Cに対して宛先住所判定処理が終了したか否かの判定を行う(ステップS209)。全ての宛先領域候補Cに対する処理が終了していない場合(ステップS209でNO)、i+1番目の宛先領域候補Cに対する処理に進む(ステップS211)。
【0086】
一方、全ての宛先領域候補Cに対する処理が終了している場合(ステップS209でYES)、宛先住所判定処理部24は、照合結果記憶部34に記憶された宛先領域パターンAのうち、例えば、スコア値が最も高いもの、すなわち順位が高いもの、を検出した宛先領域候補Cの文字列を選択し、これを宛先住所と判定して、宛先住所出力部13へ、出力する(ステップS210)。
【0087】
以上により、宛先住所判定処理を終了する。すなわち、運用前に学習した宛先領域パターンAとのそのスコア値から、宛先住所が判定される。
【0088】
ここで、
図4を参照して、宛先領域パターン学習処理及び宛先住所判定処理に共通して用いられる、宛先領域パターンデータベース33に登録されるデータについて説明する。
図4は、宛先領域パターンデータベース33に登録されるデータの一例である。
【0089】
宛先領域パターンデータベース33には、例えば、位置関係情報Rの型である宛先領域パターンAが、宛先領域パターン番号とスコア値とともに登録されている。宛先領域パターン番号とは、各宛先領域パターンAに付与された識別番号である。
【0090】
なお、ここでは位置関係情報Rの概念を示す図として表記している。実際には、位置関係情報Rは、宛先領域パターンAを構成する各キーワードの方向や距離等を表した相対位置関係で表現してもよいし、各キーワードの座標を表したそれぞれの位置情報で表現してもよい。
図5中の位置関係情報Rについても、同様である。
【0091】
この例では、宛先領域パターン番号002の宛先領域パターンAが、スコア値が最も高い。宛先領域パターン学習処理部23において最も多く出現しているということである。例えば、宛先住所判定処理において、宛先領域パターン番号002と一致する位置関係情報Rが生成された場合、この宛先領域パターン番号002と一致する位置関係情報Rを生成した宛先領域候補Cの文字列が、宛先住所である尤度が高いということが分かる。
【0092】
次に、
図5を参照して、宛先住所判定処理に用いられる、照合結果記憶部34に記憶されるデータについて説明する。
図5は、照合結果記憶部34に記憶されるデータの一例である。
【0093】
照合結果記憶部34には、例えば、宛先住所判定処理部24が位置関係情報Rを生成した各宛先領域候補Cに対する照合の結果、一致した全ての宛先領域パターンAの宛先領域パターン番号及びスコア値が、スコア値の順位とともに記憶される。なお、スコア値の順位は、記憶されなくてもよい。
【0094】
この例では、宛先領域候補0番から宛先領域候補4番の5つ(またはそれ以上)あった宛先領域候補Cのうち、登録済宛先領域パターンAと一致する位置関係情報Rが生成されたものが、宛先領域候補0番と宛先領域候補4番である。そしてそれぞれのスコア値を順位付けすると、宛先領域候補4番の方が、順位が高い(スコア値が高い)。そのため、この例の場合、宛先領域候補4番の文字列が選択され、これが宛先住所であると判定され、宛先住所出力部13に、宛先住所として出力される(
図3におけるステップS210)。
【0095】
次に、
図6を用いて、宛先住所判定処理の際に宛先領域候補Cを絞り込むための処理について説明する。
図6は、宛先領域候補絞込処理の流れの一例を示す図である。この処理を、例えば、宛先住所判定処理に先立って行うことで、
図2におけるステップS201で処理対象とする宛先領域候補Cを予め絞り込むことが可能となる。
【0096】
まず、宛先領域候補検出処理部22は、画像記憶部31に記憶された画像データPを解析し、第1次宛先領域候補C’となるものを全て検出する(ステップS301)。
【0097】
各第1次宛先領域候補C’には、0からn(nは自然数)までの通し番号が振られる。これを初期値0からセットされた変数iで表す。宛先住所判定処理部24は、0番目の第1次宛先領域候補C’から、順に処理を行う(ステップS302)。
【0098】
宛先住所判定処理部24は、NGキーワードが、処理対象の第1次宛先領域候補C’から検出されるか否かの判定を行う(ステップS303)。
【0099】
NGキーワードが検出された場合(ステップS303でYES)、宛先住所判定処理部24は、その第1次宛先領域候補C’の通し番号及び、NGキーワードが検出されたという情報を、宛先領域候補絞込結果記憶部35に記憶させる(ステップS304)。
【0100】
一方、NGキーワードが検出されなかった場合、宛先住所判定処理部24は、全ての第1次宛先領域候補C’に対して宛先領域候補絞込処理が終了したか否かの判定を行う(ステップS305)。全ての第1次宛先領域候補C’に対する処理が終了していない場合(ステップS305でNO)、i+1番目の第1次宛先領域候補C’に対する処理に進む(ステップS307)。
【0101】
全ての第1次宛先領域候補C’に対する処理が終了している場合(ステップS305でYES)、宛先住所判定処理部24は、第1次宛先領域候補C’のうち、NGキーワードを有する第1次宛先領域候補C’を、宛先領域には該当しない非宛先領域と判定し、宛先領域候補Cから除外する。こうして、宛先住所判定処理部24は、第1次宛先領域候補C’から、宛先領域候補Cを、絞り込んで選定する(ステップS306)。
【0102】
以上により、宛先領域候補絞込処理を終了する。前述した宛先住所判定処理と併用される場合、この選定された宛先領域候補Cが、宛先住所判定処理のステップS201における宛先領域候補Cとして用いられ、宛先住所判定処理が実行される。
【0103】
宛先領域候補絞込処理が宛先住所判定処理に先立って行われることで、非宛先領域であるため確実に対象外の宛先領域候補Cについて宛先住所判定処理を実行しなくて済むため、宛先住所判定処理の精度が上がる。さらに、宛先住所判定処理の処理対象の宛先領域候補Cの数が減るため、宛先住所判定処理の完了までの時間が短縮される。
【0104】
次に、
図7を参照して、宛先領域候補絞込処理に用いられる、宛先領域候補絞込結果記憶部35に記憶されるデータについて説明する。
図7は、宛先領域候補絞込結果記憶部35に記憶されるデータの一例である。
【0105】
宛先領域候補絞込結果記憶部35には、各第1次宛先領域候補C’に対し、NGキーワードの有無の情報が記憶されている。この例では、宛先住所判定処理部24が、第1次宛先領域候補C’5つに対してNGキーワードの検出を行った結果、NGキーワードが無いものが、第1次宛先領域候補0番、第1次宛先領域候補3番、第1次宛先領域候補4番である。よって、この例の場合、NGキーワードが有る第1次宛先領域候補1番及び第1次宛先領域候補2番は、非宛先領域と判定される。このため、第1次宛先領域候補0番、第1次宛先領域候補3番、第1次宛先領域候補4番のみが、宛先領域候補Cとして選定されることとなる。
【0106】
ここで、
図8及び
図9を参照して、本発明の実施形態に係る宛先認識装置100を用いた宛先領域パターン学習処理と、宛先住所判定処理と、宛先領域候補絞込処理の例について説明する。
【0107】
図8は、宛先領域候補検出処理部22が、配達対象物の画像データPから宛先領域候補Cを検出する例を示す図である。
図8の例は、宛先領域パターン学習処理と、宛先住所判定処理と、宛先領域候補絞込処理との全てにおいて共通する。
【0108】
図8は、配達対象物の、宛先情報を含む面の、画像データPである。ここでは、宛先情報を示す宛先領域以外に、差出人の住所情報を示す差出人領域と、切手が貼られた切手領域と、を含む配達対象物を例とする。
【0109】
図8に示すように、まず、文字列が含まれる領域の全てが、宛先領域候補Cとして検出される。すなわち
図8は、
図2に示す宛先領域パターン学習処理のステップS101または
図3に示す宛先住所判定処理のステップS201において検出される宛先領域候補C、または、
図6に示す宛先領域候補絞込処理のステップS301において検出される第1次宛先領域候補C’の例である。
図8の例では、宛先領域候補C(または第1次宛先領域候補C’。以下省略する。)の領域を、破線で囲んで示す。
【0110】
検出された各宛先領域候補Cは、
図2に示す宛先領域パターン学習処理のステップS102または
図3に示す宛先住所判定処理のステップS202、または、
図6に示す宛先領域候補絞込処理のステップS302において、3つの宛先領域候補Cに対して、それぞれ、0番、1番、2番、と通し番号が振られる。
【0111】
なお、この例では、宛先領域候補0番は、NGキーワードであるFromで始まる、差出人の住所情報を示す差出人領域である。宛先領域候補1番は、切手にAIR MAILと印字された、切手領域である。宛先領域候補2番は、特定キーワードであるToで始まる、宛先領域である。
【0112】
図9は、宛先領域パターン学習処理部23、または宛先住所判定処理部24が、番号キーワード及び対応住所の住所キーワードが検出された宛先領域候補Cから、位置関係情報Rを生成する例を説明するための図である。
図9は、宛先領域パターン学習処理と、宛先住所判定処理とに共通する例である。
【0113】
図9(a)は、配達対象物の、宛先情報を含む面の、画像データPである。ここでは、宛先領域候補Cが1つのみであり、宛先領域が記されている配達対象物を例とする。また、
図9(b)は、前記宛先領域候補Cから生成された位置関係情報Rの例である。これは、位置関係情報Rの型である、宛先領域パターンデータベース33に登録される宛先領域パターンAと共通する。
【0114】
図9(a)は、宛先領域候補Cの中から、番号キーワード及び対応住所の住所キーワードが検出される様子の一例である。すなわち
図9(a)は、宛先領域パターン学習処理のステップS103からステップS105、または宛先住所判定処理のステップS203において、検出される番号キーワード及び対応住所の住所キーワードの例である。
【0115】
また
図9(b)は、宛先領域パターン学習処理部23、または宛先住所判定処理部24が生成する位置関係情報Rの一例である。
図9(b)は、宛先領域パターンデータベース33に登録される、前記位置関係情報Rの型である宛先領域パターンAの一例でもある。
【0116】
宛先領域パターン学習処理の場合、
図9(a)の番号キーワード及び対応住所の住所キーワードを有する宛先領域候補Cから生成された、
図9(b)の位置関係情報Rの型が、宛先領域パターンAとして新規登録(ステップS110)、または更新(ステップS111)する対象となる。
【0117】
例えばオペレータが入力した番号キーワードが「22222」であった場合、宛先領域候補Cの1つから、ZIPコード「22222」が検出される(
図9(a)の番号キーワード、ステップS103)。その後、ZIPコード「22222」の対応住所「X City, IA USA」が、番号キーワード・対応住所辞書部32から、取得される(ステップS104)。続いて、住所キーワードである「X City」、「IA」、「USA」が検出される(
図9(a)の住所キーワード、ステップS105)。
【0118】
こうして
図9(a)で検出された番号キーワードと3つの住所キーワードから、
図9(b)に示す、位置関係情報Rを生成することができ(ステップS107)、この位置関係情報Rの型が、宛先領域パターンデータベース33に未登録のものであった場合、宛先領域パターンデータベース33に、宛先領域パターンAとして、宛先領域パターン番号が割り振られて新規登録される(ステップS110)。一方、この位置関係情報Rの型が、宛先領域パターンデータベース33に登録済みのものであった場合、宛先領域パターンデータベース33において、その宛先領域パターンAのスコア値に所定の数値を加算することで、そのデータの内容が更新される(ステップS111)。
【0119】
または、宛先住所判定処理の場合、
図9(a)の番号キーワード及び対応住所の住所キーワードを有する宛先領域候補Cから生成された、
図9(b)の位置関係情報Rの型が、宛先領域パターンデータベース33に登録済みの宛先領域パターンAと照合される対象となる(ステップS207)。
【0120】
宛先領域候補Cの1つから、番号キーワード及び対応住所の住所キーワードである「22222」、「X City」、「IA」、「USA」が検出される(
図9(a)の番号キーワード及び対応住所の住所キーワード、ステップS203)。
【0121】
そして
図9(a)で検出された番号キーワードと3つの住所キーワードから、
図9(b)に示す、位置関係情報Rを生成することができ(ステップS205)、宛先領域パターンデータベース33に登録済みの宛先領域パターンAの中から、一致する宛先領域パターンAが照合される(ステップS207)。
【0122】
以上説明した実施形態によれば、配達対象物の宛先認識を行う際に、複数の宛先領域候補Cの中から、学習により構築された宛先領域パターンデータベース33を基に、宛先住所である尤度が高い宛先領域候補Cの文字列を選択し、より高い精度で宛先住所を特定できる。
【0123】
また、運用前の宛先領域パターン学習によって、運用時の宛先住所判定時に、オペレータが不要となり、または業務が大幅に減らせ、宛先認識装置100の自動化が実現できる。
【0124】
さらに、実施形態の宛先認識装置100は、運用地域毎の宛先認識装置100毎に宛先領域パターン学習を行えば、いずれの地域であっても、学習を行った運用対象の地域で使用可能となる。
【0125】
また、宛先領域パターン学習処理と、宛先住所判定処理の両者を同時に実行する実施形態も想定される。
【0126】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。