IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニックIPマネジメント株式会社の特許一覧

特許7422342文字認識装置、文字認識システムおよび文字認識方法
<>
  • 特許-文字認識装置、文字認識システムおよび文字認識方法 図1
  • 特許-文字認識装置、文字認識システムおよび文字認識方法 図2
  • 特許-文字認識装置、文字認識システムおよび文字認識方法 図3
  • 特許-文字認識装置、文字認識システムおよび文字認識方法 図4
  • 特許-文字認識装置、文字認識システムおよび文字認識方法 図5
  • 特許-文字認識装置、文字認識システムおよび文字認識方法 図6
  • 特許-文字認識装置、文字認識システムおよび文字認識方法 図7
  • 特許-文字認識装置、文字認識システムおよび文字認識方法 図8
  • 特許-文字認識装置、文字認識システムおよび文字認識方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-01-18
(45)【発行日】2024-01-26
(54)【発明の名称】文字認識装置、文字認識システムおよび文字認識方法
(51)【国際特許分類】
   G08G 1/017 20060101AFI20240119BHJP
   G06V 30/00 20220101ALI20240119BHJP
   G06V 30/14 20220101ALI20240119BHJP
   G08G 1/04 20060101ALI20240119BHJP
【FI】
G08G1/017
G06V30/00 Z
G06V30/14 340J
G08G1/04 C
【請求項の数】 13
(21)【出願番号】P 2023066363
(22)【出願日】2023-04-14
【審査請求日】2023-07-18
(73)【特許権者】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】長谷川 嶺
(72)【発明者】
【氏名】齋藤 優麻
(72)【発明者】
【氏名】山本 大貴
(72)【発明者】
【氏名】山本 将司
(72)【発明者】
【氏名】松本 健太郎
【審査官】貞光 大樹
(56)【参考文献】
【文献】特開2017-33371(JP,A)
【文献】特開2020-135535(JP,A)
【文献】米国特許出願公開第2021/0406926(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G08G 1/00 - 1/16
G06T 7/00 - 7/90
G06V 10/00 - 30/424
(57)【特許請求の範囲】
【請求項1】
トレイラが撮影された撮影画像を取得し、前記撮影画像の中から前記トレイラを管理する複数の組織それぞれに特有の図形を認識する図形認識部と、
所定の図形とトレイラIDの位置とが紐づいたトレイラID情報を保存するデータベースから前記トレイラID情報を取得し、認識した前記図形が前記トレイラID情報の図形に該当するか照合する照合部と、
前記照合部による照合結果に基づき、前記撮影画像から前記トレイラIDが映る領域を抽出する抽出部と、を備える、
文字認識装置。
【請求項2】
抽出された前記領域から文字列を認識する文字列認識部を、さらに備える、
請求項1に記載の文字認識装置。
【請求項3】
前記文字列認識部は、認識した前記文字列が該当する前記トレイラID情報の前記トレイラIDの形式と一致するか否かを判定する、
請求項2に記載の文字認識装置。
【請求項4】
前記文字列認識部は、前記文字列が前記トレイラIDの形式に一致すると判定した場合、トレイラステーションに存在するトレイラの前記トレイラIDを管理する入退場管理データベースに前記トレイラIDを登録する、
請求項3に記載の文字認識装置。
【請求項5】
前記文字列認識部は、前記文字列が前記トレイラIDの形式に一致しないと判定した場合、再撮影した撮影画像を取得し前記図形を認識させる指示を前記図形認識部に送信する、
請求項4に記載の文字認識装置。
【請求項6】
前記照合部は、前記組織特有の図形が文字列を含む場合であっても、前記文字列を用いた照合を行わず、前記文字列を図形と見做して前記照合を行う、
請求項に記載の文字認識装置。
【請求項7】
前記図形は、前記組織特有の絵、写真、記号またはロゴタイプの情報である、
請求項に記載の文字認識装置。
【請求項8】
前記図形は、前記組織特有の色彩または模様の情報である、
請求項に記載の文字認識装置。
【請求項9】
前記トレイラID情報は、前記トレイラIDの向き、前記トレイラIDの形式、前記トレイラIDのフォント、前記トレイラIDが記載されている前記トレイラの面の情報または前記トレイラIDの文字列の大きさおよび色の少なくとも1つの情報が前記図形に紐づいた情報である、
請求項1に記載の文字認識装置。
【請求項10】
前記抽出部は、前記トレイラID情報に含まれる前記トレイラIDの位置および前記トレイラIDの向きの情報から前記領域を決定する、
請求項1に記載の文字認識装置。
【請求項11】
前記抽出部は、前記撮影画像の中の前記トレイラの大きさを認識し、前記トレイラの大きさから前記領域の大きさを決定する、
請求項10に記載の文字認識装置。
【請求項12】
トレイラを撮影する少なくとも1つの撮影デバイスと、
前記撮影デバイスが撮影した撮影画像を取得し、前記撮影画像の中から前記トレイラを管理する複数の組織それぞれに特有の図形を認識する図形認識部と、
所定の図形とトレイラIDの位置とが紐づいたトレイラID情報を保存するデータベースから前記トレイラID情報を取得し、認識した前記図形が前記トレイラID情報の図形に該当するか照合する照合部と、
前記照合部による照合結果に基づき、前記撮影画像から前記トレイラIDが映る領域を抽出する抽出部と、を備える、
文字認識システム。
【請求項13】
文字認識装置が、トレイラが撮影された撮影画像を取得し、
前記文字認識装置が、前記撮影画像の中から前記トレイラを管理する複数の組織それぞれに特有の図形を認識し、
前記文字認識装置が、所定の図形とトレイラIDの位置とが紐づいたトレイラID情報を保存するデータベースから前記トレイラID情報を取得し、
前記文字認識装置が、認識した前記図形が前記トレイラID情報の図形に該当するか照合し、
前記文字認識装置が、照合結果に基づき、前記撮影画像から前記トレイラIDが映る領域を抽出する、
文字認識方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、文字認識装置、文字認識システムおよび文字認識方法に関する。
【背景技術】
【0002】
特許文献1には、ナンバープレート認識処理を行うナンバープレート認識システムが開示されている。当該ナンバープレート認識システムは、所定の走行路を走行する車両の車種を判別するための車種判別用画像を撮影する車種判別用カメラと、車両の背面画像を撮影する背面撮影用カメラと、を有する。また、ナンバープレート認識システムは、車種判別用画像に基づいて車両の車種を判別する車種判別部と、車種の判別結果に基づいて、背面画像のパラメータを選択し、パラメータに対応する背面画像に基づいて、車両のナンバープレート認識処理を行うナンバープレート認識部と、を有する。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-164461号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年、トレイラを用いた物流が盛んになってきており、各トレイラの所在を効率的に管理したいというニーズが高まってきている。ここで、トレイラとは牽引車両(トラクタとも呼ぶ)によって牽引される被牽引車両を意味する。一般的にトレイラには、トレイラの識別に係るIdentification(以下、「ID」と称する)が記載されているため、車両等を撮影した撮影画像からこのIDを認識することで、トレイラを効率的に管理することができると考えられる。しかし、撮影画像には様々な文字も含まれていることがあり、認識に成功した文字列がトレイラの識別に係るIDであるとは限らない。そのため、撮影対象物であるトレイラ等が様々な大きさ、色、デザインの文字列を複数含む場合において、複数の文字列の中からトレイラの識別に係るIDを精度よく検出したいというニーズがある。以下、トレイラの識別に係るIDをトレイラIDと称する。
【0005】
特許文献1では、判別した車両の車種の情報を利用してナンバープレートの認識処理を行う。しかしながら、トラクタの車種とトレイラIDが記載位置等には相関性が乏しいため、この技術はトレイラIDの識別には利用困難である。例えば、トレイラは、会社ごとにデザインが決まっていることが多いが、複数の会社が同一の車種のトラクタを使用している場合には、車種が分かってもトレイラのデザインまたはトレイラIDの位置等を特定することはできない。
【0006】
本開示は、上述した従来の状況に鑑みて案出され、複数の文字列の中からトレイラIDと考えられる文字列を精度よく検出することを目的とする。
【課題を解決するための手段】
【0007】
本開示は、トレイラが撮影された撮影画像を取得し、前記撮影画像の中から前記トレイラを管理する複数の組織それぞれに特有の図形を認識する図形認識部と、所定の図形とトレイラIDの位置とが紐づいたトレイラID情報を保存するデータベースから前記トレイラID情報を取得し、認識した前記図形が前記トレイラID情報の図形に該当するか照合する照合部と、前記照合部による照合結果に基づき、前記撮影画像から前記トレイラIDが映る領域を抽出する抽出部と、を備える、文字認識装置を提供する。
【0008】
また、本開示は、トレイラを撮影する少なくとも1つの撮影デバイスと、前記撮影デバイスが撮影した撮影画像を取得し、前記撮影画像の中から前記トレイラを管理する複数の組織それぞれに特有の図形を認識する図形認識部と、所定の図形とトレイラIDの位置とが紐づいたトレイラID情報を保存するデータベースから前記トレイラID情報を取得し、認識した前記図形が前記トレイラID情報の図形に該当するか照合する照合部と、前記照合部による照合結果に基づき、前記撮影画像から前記トレイラIDが映る領域を抽出する抽出部と、を備える、文字認識システムを提供する。
【0009】
また、本開示は、文字認識装置が、トレイラが撮影された撮影画像を取得し、前記文字認識装置が、前記撮影画像の中から前記トレイラを管理する複数の組織それぞれに特有の図形を認識し、前記文字認識装置が、所定の図形とトレイラIDの位置とが紐づいたトレイラID情報を保存するデータベースから前記トレイラID情報を取得し、前記文字認識装置が、認識した前記図形が前記トレイラID情報の図形に該当するか照合し、前記文字認識装置が、照合結果に基づき、前記撮影画像から前記トレイラIDが映る領域を抽出する、文字認識方法を提供する。
【0010】
なお、これらの包括的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
【発明の効果】
【0011】
本開示によれば、複数の文字列の中からトレイラIDと考えられる文字列を精度よく検出することができる。
【図面の簡単な説明】
【0012】
図1】トレイラに含まれる文字列を示す図
図2】実施の形態1に係る文字認識システムのブロック図
図3】文字認識装置が実行する処理のフローチャート
図4】トレイラIDと推定される属性とトレイラIDではないと推定される属性とを示す図
図5】文字列がトレイラIDと推定されるか否かの分類に係るフローチャート
図6】トレイラの表面のデザインの一例を示す図
図7】実施の形態2に係る文字認識システムのブロック図
図8】トレイラID情報LTの一例を示す図
図9】トレイラIDを認識する処理のフローチャート
【発明を実施するための形態】
【0013】
以下、図面を適宜参照して、本開示に係る文字認識装置、文字認識システムおよび文字認識方法を具体的に開示した実施の形態について、詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。例えば、すでによく知られた事項の詳細説明および実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の記載の主題を限定することは意図されていない。
【0014】
<実施の形態1に至る経緯>
特開2008-217347号公報に係る特許文献2には、入力画像からナンバープレート領域候補の四辺形を複数検出して、ナンバープレート領域候補に含まれる文字領域の文字認識を実行するナンバープレート認識装置が開示されている。ナンバープレート認識装置は、各ナンバープレート領域候補の文字認識結果と四辺形の情報とに基づいて、検出された複数のナンバープレート領域候補の中から出力するナンバープレート領域候補を選択する。ナンバープレート認識装置は、当該選択されたナンバープレート領域候補に関する情報を出力する。
【0015】
近年、トレイラを用いた物流が盛んになってきており、各トレイラの所在を効率的に管理したいというニーズが高まってきている。ここで、トレイラとはトラクタによって牽引される被牽引車両を意味する。一般的にトレイラには、トレイラIDが記載されているため、車両等を撮影した撮影画像からこのトレイラIDを認識することで、トレイラを効率的に管理することができると考えられる。しかし、撮影画像には様々な文字も含まれていることがあり、認識に成功した文字列がトレイラIDであるとは限らない。そのため、撮影対象物であるトレイラ等が様々な大きさ、色、デザインの文字列を複数含む場合において、複数の文字列の中からトレイラIDを検出し撮影対象物を識別したいというニーズがある。
【0016】
特許文献1では、所定条件を満たす四辺形をナンバープレート領域候補となる四辺形と判断する。しかしながら、トレイラIDには、現状統一された規格は定められていないため、位置、大きさまたは文字数等は定まっていない。そのため、特許文献1と同様の技術を適用しても、撮影対象物の任意の位置に記載される多様な文字列の中から、トレイラIDを検出することは困難である。
【0017】
そこで、以下の実施の形態1では、複数の文字列の中からトレイラIDと考えられる文字列を検出する文字認識装置および文字認識方法の例を説明する。
【0018】
<実施の形態1>
図1を参照して、トレイラTRに含まれる文字列を説明する。図1は、トレイラTRに含まれる文字列を示す図である。
【0019】
トレイラTRは、トラクタLEによって牽引される車両Vの貨物部分である。トレイラTRには、トレイラIDの他に会社名、電話番号、トレイラの高さを示す数字、Uniform Resource Locator(以下、「URL」と称する)、単語またはテキスト等に係る文字列が記載されている。なお、トレイラTRに記載される文字列は、上述した例に限られない。
【0020】
文字列ST1,ST2,ST3,ST4は、会社名を示す文字列である。文字列ST1,ST2,ST3,ST4は、斜体の文字装飾が施されている文字列である。
【0021】
文字列ST5は、英単語で示される文字列であり会社名を示す文字列ST2の下に記載される。
【0022】
文字列ST6,ST7は、トラクタLEを識別する番号に係る文字列である。
【0023】
文字列ST8は、トレイラIDを示す文字列である。文字列ST8は、トレイラTRのコーナ(つまり、トレイラTRの筐体をなす面の境界部分であり、トレイラTRの側面に位置し重力方向に長い部分)に縦書きに記載されている。
【0024】
このように、トレイラTRには複数の文字列が記載されている。
【0025】
近年、物流の業界が盛んになるに伴い、多数のトレイラTRを効率的に管理する必要性が高まっている。例えば、複数のトレイラTRが集合する場所で、それぞれのトレイラTRを識別する必要がある。しかしながら、トレイラTRには複数の文字列(例えば、文字列ST1,ST2,ST5,ST8)が存在するため、複数の文字列の中からトレイラIDを検出するのは難しいという課題がある。
【0026】
次に、図2を参照して、実施の形態1に係る文字認識システム1のブロック図を説明する。図2は、実施の形態1に係る文字認識システム1のブロック図である。
【0027】
文字認識システム1は、撮影デバイス10、データベース20、表示デバイス30および文字認識装置40を少なくとも含む。
【0028】
撮影デバイス10は、トレイラを撮影するデバイスである。撮影デバイス10は、少なくとも光学素子としてのレンズ(不図示)とイメージセンサ(不図示)とを有して構成される。レンズは、撮影デバイス10の撮影した領域の画角内からの対象物により反射された光を入射してイメージセンサの受光面(言い換えると、撮影面)に対象物の光学像を結像する。イメージセンサは、例えばCharged Coupled Device(以下、「CCD」と称する)あるいはComplementary Metal Oxide Semiconductor(以下、「CMOS」と称する)などの固体撮影素子である。イメージセンサは、所定時間(例えば1/30(秒))ごとに、レンズを介して撮影面に結像した光学像を電気信号に変換する。例えば、所定時間が1/30(秒)である場合、撮影デバイス10のフレームレートは30fpsとなる。また、撮影デバイス10は、上述した所定時間ごとに、電気信号に所定の信号処理を施すことで画像データ(映像データ)を生成してもよい。なお、画像データは静止画であり、映像データは動画である。撮影デバイス10は、画像データ(映像データ)を文字認識装置40に出力する。以下、画像データおよび映像データのことを撮影画像と称する。
【0029】
データベース20は、記憶媒体(例えばフラッシュメモリ、Hard Disk Drive(以下、「HDD」と称する)、Solid State Drive(以下、「SSD」と称する))を用いて構成される。データベース20は、文字列の属性がトレイラIDと推定されるものであるか否かを分類したテーブル(図4参照および以下分類テーブルと称する)が保存されている。また、データベース20は、文字認識装置40で実行される文字列がトレイラIDであるか否かに係る判定の結果が書き込まれる。なお、データベース20は、文字認識装置40に組み込まれてもよい。
【0030】
表示デバイス30は、文字認識装置40で実行される文字列がトレイラIDであるか否かに係る判定の結果が表示される。表示デバイス30は、例えば、タッチパネルディスプレイ、ディスプレイまたは携帯電話等である。表示デバイス30は、文字認識装置40と一体に構成されてもよい。
【0031】
文字認識装置40は、プロセッサ41、通信I/F42およびメモリ43を少なくとも含む。文字認識装置40は、例えば、Personal Computer(以下、「PC」と称する)である。
【0032】
プロセッサ41は、例えばCentral Processing Unit(以下、「CPU」と称する)、Digital Signal Processor(以下、DSPと称する)、Graphical Processing Unit(以下、「GPU」と称する)もしくはField Programmable Gate Array(以下、「FPGA」と称する)である。プロセッサ41は、文字認識装置40の全体的な動作を司るコントローラとして機能する。プロセッサ41は文字認識装置40の各部の動作を統括するための制御処理、文字認識装置40の各部との間のデータの入出力処理、データの演算処理およびデータの記憶処理を行う。プロセッサ41は、メモリ43に記憶されたプログラムに従って動作する。プロセッサ41は、動作時にメモリ43を使用し、プロセッサ41が生成または取得したデータをメモリ43に一時的に保存する。プロセッサ41は、メモリ43に記憶されたプログラムおよびデータを用いることで、文字列検出部41A、文字列認識部41B、属性判定部41CおよびトレイラID推定部41Dのそれぞれの機能を実現する。
【0033】
検出部の一例としての文字列検出部41Aは、撮影デバイス10から取得した撮影画像の中から文字列を検出する。文字列検出部41Aは、機械学習等の公知の技術を用いて文字列を検出する。
【0034】
認識部の一例としての文字列認識部41Bは、文字列検出部41Aによって検出された文字列の文字認識を行う。文字列認識部41Bは、Optical Character Recognition(以下、「OCR」と称する)等の公知の技術を用いて文字列を文字認識する。
【0035】
判定部の一例としての属性判定部41Cは、文字列検出部41Aによって認識された文字列の属性を判定する。属性とは、例えば、文字の書き方、文字列の位置または文字列の示す内容等である。属性については後述する。
【0036】
判定部の一例としてのトレイラID推定部41Dは、検出および認識された各文字列がトレイラIDであるか否かを属性に基づいて推定する。トレイラID推定部41Dは、属性に基づき文字列がトレイラIDである可能性の高さをスコアとして算出する。トレイラID推定部41Dは、文字列を、トレイラIDと推定されるものと、トレイラIDではないと推定されるものと、算出したスコアからトレイラIDである可能性が高いものと、算出したスコアからトレイラIDである可能性が低いものとに分類する。トレイラID推定部41Dは、分類した文字列をトレイラIDである可能性が高いと考えられる順(例えば、スコアが高い順)にソートする(つまり、並び替える)。トレイラID推定部41Dは、推定の結果、文字列を分類した結果またはソートした結果を通信I/F42に出力する。
【0037】
通信I/F42は、文字認識装置40と撮影デバイス10と、文字認識装置40とデータベース20とおよび文字認識装置40と表示デバイス30との間で無線または有線で通信を行うインターフェース回路である。ここでI/Fは、インターフェースのことを表す。文字認識装置40と撮影デバイス10と、文字認識装置40とデータベース20とおよび文字認識装置40と表示デバイス30との通信は、ネットワークを介してもよい。通信I/F42による通信方式は、例えば、Wide Area Network(以下、「WAN」と称する)、Local Area Network(以下、「LAN」と称する)、Long Term Evolution(以下、「LTE」と称する)、4G、5G等の移動体通信、電力線通信、近距離無線通信(例えばBluetooth(登録商標)通信)または携帯電話用の通信等である。
【0038】
メモリ43は、例えばRandom Access Memory(以下、「RAM」と称する)とRead Only Memory(以下、「ROM」と称する)とを用いて構成され、文字認識装置40の動作に必要なプログラム、さらには、動作中に生成されたデータを一時的に保持する。RAMは、例えば、文字認識装置40の動作中に使用されるワークメモリである。ROMは、例えば、文字認識装置40を制御するためのプログラムを予め記憶して保持する。
【0039】
次に、図3を参照して、文字認識装置40が実行する処理のフローチャートを説明する。図3は、文字認識装置40が実行する処理のフローチャートである。図3に係るフローチャートの各処理は、プロセッサ41によって実行される。
【0040】
プロセッサ41は、撮影デバイス10から撮影画像を取得する(ステップSt100)。
【0041】
プロセッサ41は、ステップSt100の処理で取得した撮影画像から文字列を検出する(ステップSt101)。
【0042】
プロセッサ41は、ステップSt101の処理で検出された文字列を文字認識する(ステップSt102)。
【0043】
プロセッサ41は、ステップSt102の処理で認識された文字列の属性を判定する(ステップSt103)。
【0044】
プロセッサ41は、データベース20に保存されている分類テーブルを読み込む(ステップSt104)。なお、ステップSt104の処理は省略されてもよい。
【0045】
プロセッサ41は、ステップSt103の処理で判定された属性に基づき、文字列がトレイラIDであるか否かを推定する。プロセッサ41は、ステップSt101の処理で検出された複数の文字列全てについてトレイラIDであるか否かを推定し、トレイラIDと推定される文字列とトレイラIDではないと推定される文字列とを分類する(ステップSt105)。ステップSt105の処理については、図5で詳述する。
【0046】
プロセッサ41は、ステップSt105の処理で分類された文字列をデータベース20に出力し書き込む(ステップSt106)。
【0047】
プロセッサ41は、ステップSt105の結果を表示デバイス30に出力する(ステップSt107)。なお、ステップSt107の処理は省略されてもよい。
【0048】
次に、図4を参照して、トレイラIDと推定される属性とトレイラIDではないと推定される属性とを説明する。図4は、トレイラIDと推定される属性とトレイラIDではないと推定される属性とを示す図である。
【0049】
図4に示される分類テーブルは、各属性がトレイラIDであると推定される属性であるか、トレイラIDではないと推定される属性であるかについて分類されたテーブルである。
【0050】
「文字の書き方」に係る各属性がトレイラIDであると推定されるものかトレイラIDではないと推定されるものかを説明する。
【0051】
文字列が縦書きであることは、トレイラIDであると推定される属性の1つである。一般的に、社名、電話番号、URL等の情報が縦書きで記載される可能性は低く、また、ナンバープレートの文字も横書きで記載するよう規定されている。そのため、トレイラID以外の文字が縦書きで記載される可能性は低く、縦書きの文字列はトレイラIDである可能性が高い。
【0052】
文字列に含まれる文字が同一のサイズである、等間隔である、単色であるまたはゴシック系のフォントであることは、その文字列はトレイラIDであると推定される属性の1つである。トレイラIDは、その性質上、宣伝的な目的で使用される可能性は低いため、特殊なデザイン等が採用される可能性は低く、単純な態様で記載されることが多い。そのため、文字列が上述したような単純な態様で記載されていることは、その文字列がトレイラIDであると推定する根拠となり得る。
【0053】
文字列が長方形の中に書かれていることはトレイラIDであると推定される属性の1つである。トレイラの色とトレイラIDとが類似の色の場合、視認性を向上するための措置が行われることがある。この措置として、トレイラIDの背景として文字列の色とは別の色の長方形を描かれることがある。そのため、文字列が長方形の中に書かれていることは、その文字列がトレイラIDであると推定する根拠となり得る。また、他の措置としては、文字の縁取り等が考えられるが、デザインよりも視認性を重視するトレイラIDに採用される可能性は低い。
【0054】
文字列がユーザ(例えば、文字認識装置40を管理する人物)により予め定めらえた所定のサイズよりも大きいことは、トレイラIDであると推定される属性の1つである。トレイラIDは、視認性を重視して大きく記載されることが多いためである。
【0055】
文字列がトレイラに対して所定の倍率であることは、トレイラIDであると推定される属性の1つである。トレイラIDは、視認性を重視して大きく記載されることが多いためである。
【0056】
文字列が飾り系のフォントまたは斜体のフォントであることは、トレイラIDではないと推定される属性の1つである。トレイラIDは、IDそのものを視認させるために記載される文字列であるため、書体等を必要以上に複雑にする必要はないためである。
【0057】
次に、「文字の位置」に係る各属性がトレイラIDであると推定されるものかトレイラIDではないと推定されるものかを説明する。
【0058】
文字列がナンバープレートより上に位置することは、トレイラIDであると推定される属性の1つである。トレイラIDが、一般的に車体の下部に配置されるナンバープレートよりも低い位置に記載される可能性は低いためである。なお、ナンバープレートの位置を検知する手法は様々なものが知られているため、詳細は省略する。
【0059】
文字列がトレイラのコーナに縦書きに記載されることはトレイラIDであると推定される属性の1つである。トレイラのコーナは、意識しなくては視認しにくい箇所であるため、会社名または電話番号等の公に発信したい情報を記載する位置としては選ばれにくい。そのため、この箇所に記載されている文字列は、トレイラIDのように業者が特殊な用途に用いる文字列である可能性が高い。なお、縦書きの文字列がトレイラIDである可能性が高いことは上述した通りである。なお、本実施の形態ではコーナに縦書きで記載されていることを属性の例としているが、文字列の方向を問わず、文字列がコーナに記載されていることをトレイラIDであると推定される属性として用いてもよい。上述の通り、コーナに記載されていること自体が特殊な用途の文字列であることを示唆しているためである。
【0060】
文字列がトラクタLEに記載されていることは、トレイラIDではないと推定される属性の1つである。トレイラはトラクタを付け替えて移動させることが可能であるため、トラクタにトレイラを識別する文字列であるトレイラIDを記載する可能性は低いためである。
【0061】
文字列が会社のロゴ、マーク、文字列の上または下に記載されることはトレイラIDではないと推定される属性の1つである。会社のロゴ等の周辺に記載されている文字列は、電話番号または宣伝文句など、公衆に向けて発信すべき情報である可能性が高く、トレイラIDのような業者向けの情報が記載される可能性は低いためである。
【0062】
次に、「文字列の示す内容」に係る各属性がトレイラIDであると推定されるものかトレイラIDではないと推定されるものかを説明する。
【0063】
文字列が大文字および数字のみからなることは、トレイラIDであると推定される属性の1つである。大文字と小文字など混同し易い文字が混ざった文字列をIDとして使用すると、同一の発音で異なるIDが複数存在することとなり混乱を招くため、IDとして使用する文字の種類は限定することが一般的なためである。ここで、大文字と小文字とでは視認性の観点から大文字が採用されることが多く、また、より多くのIDを生成するために数字も併用されることが一般的であるため、文字列が大文字および数字のみからなることはトレイラIDであると推定する根拠となり得る。なお、実施の形態1では大文字および数字のみからなる文字列をトレイラIDであると推定される属性の1つとしているが、トレイラIDとして大文字、小文字または数字のいずれか一種のみからなる文字列が使用される傾向があることが既知であれば、文字列がその文字種からなることをトレイラIDであると推定される属性の1つとしてもよい。また、文字列に漢字やハングルなどの一部の言語でしか使用されない文字種が含まれていないことを、トレイラIDであると推定される属性の1つとしてもよい。特にグローバルな運送を行う場合、限られた言語でしか読み取れない文字をトレイラIDとして使用する可能性は低いためである。
【0064】
文字数がユーザによって予め定められた所定の範囲内であることは、トレイラIDであると推定される属性の1つである。文章等と異なり、トレイラIDを構成する文字数は限られた文字数であることが多いためである。
【0065】
文字列が会社ごとの特定のルールに即していることは、トレイラIDであると推定される属性の1つである。会社ごとのルールが既知であれば、そのルールに合致している文字列がトレイラIDである可能性が高いためである。
【0066】
文字列がコンテナIDであることは、トレイラIDではないと推定される属性の1つである。コンテナIDとは、所定の規定にしたがって記載される、コンテナの管理および識別に用いられるコードである。実施の形態1では、コンテナIDは、ISO6346で規定されている国際規格のコードであるものとする。コンテナIDはコンテナを管理するために用いられるIDであり業者間で統一的な規格が定められている文字列である。各業者が自ら使用するトレイラIDとしてこの規格に合致するトレイラIDを採用すると業者間でのコンテナの管理に支障をきたすため、トレイラIDの態様として、コンテナIDの規格に一致する態様が採用される可能性は低い。したがって、文字列がコンテナIDであることは、トレイラIDではないと推定する根拠となり得る。
【0067】
文字列がトレイラの高さを示すものであることは、トレイラIDではないと推定される属性の1つである。なお、文字列がトレイラの高さを文字列であるか否かは、単位を示す文字の有無や数値の桁数などから判断できる。また、トレイラ以外の物の高さ(例えばトラクタの高さ)を示す文字列等が記載されている可能性がある場合には、文字列がトラクタの高さを示すものであることを、トレイラIDではないと推定される属性として用いてもよい。
【0068】
文字列が一般名称であることは、トレイラIDではないと推定される属性の1つである。トレイラIDは、他の文字列との混同を防ぐため、意味のない文字列として構成されることが多いためである。
【0069】
文字列が会社名であることは、トレイラIDではないと推定される属性の1つである。トレイラIDは、他の文字列との混同を防ぐため、意味のない文字列として構成されることが多いためである。ここで、文字列が会社名であるか否かは、例えば、認識した文字列を会社名のデータベースと比較することによって推定することができる。なお、トレイラIDのユニーク性を確保するため、トレイラIDの一部に会社名が含まれる場合もある。そのため、会社名が含まれるトレイラIDが存在することが予めわかっている場合には、文字列が会社名であることを、トレイラIDではないと推定される属性から除いてもよい。
【0070】
文字列が電話番号であることは、トレイラIDではないと推定される属性の1つである。なお、文字列が電話番号であるか否かは、認識された文字列の桁数や、ハイフンの有無などのフォーマット、または、文字列の内容と電話番号のデータベースとの比較によって推定することができる。
【0071】
文字列がナンバープレートであることは、トレイラIDではないと推定される属性の1つである。ナンバープレートに記載してもよい文字列は法律等で規制されていることが多く、トレイラIDが記載されている可能性は低いためである。
【0072】
文字列が撮影画像に記載される日時および時刻等に係るタイムスタンプであることは、トレイラIDではないと推定される属性の1つである。
【0073】
図4に示す星マークを付与した属性(文字列が縦書きであること、文字列がコンテナIDであること)は、文字列がトレイラIDであるか否かを推定される場合に、他の属性よりも優先的に判断される属性である。ここで、優先的に判断される属性は、他の属性または属性の組み合わせよりも、トレイラIDを高確率で識別できる可能性が高い属性であってよい。実施の形態1で、縦書きであること、および、コンテナIDであることをこの属性として用いている理由は以下のとおりである。まず、コンテナに記載されている文字列は一般的には横書きが多く、縦書きの文字列が社名等を示す文字列である可能性は低い。そのため、縦書きの文字列を選定することでトレイラIDである可能性の低い文字列を除外できる。ただし、コンテナIDは、縦書きで記載される可能性のあることが知られているため、縦書きであることのみではコンテナIDは排除しきれない場合がある。しかし、コンテナIDは、規格に定められた態様で記載する必要があるため、その態様に合致しているか否かに基づいて、文字列がコンテナIDであるか否かを確実に判断することができる。すなわち、縦書きであり、かつ、コンテナIDではない文字列は、高い確率でトレイラIDであると推定することができる。
【0074】
図4に示す二重丸を付与した属性(文字列がトレイラの高さを表すこと、文字列が一般名詞、会社名、電話番号、ナンバープレートまたはタイムスタンプであること)は、文字列がいずれかの属性に当てはまる場合、トレイラIDではないと判定される属性である。
【0075】
次に、図5を参照して、文字列がトレイラIDと推定されるか否かの分類に係る処理を説明する。図5は、文字列がトレイラIDと推定されるか否かの分類に係るフローチャートである。図5のフローチャートに係る各処理はプロセッサ41によって実行される。
【0076】
プロセッサ41は、文字列がコンテナIDであるか否かを判定する(ステップSt200)。プロセッサ41は、文字列がコンテナIDであると判定する場合(ステップSt200,YES)、文字列はトレイラIDではないと判定する(ステップSt207)。
【0077】
プロセッサ41は、文字列がコンテナIDではないと判定する場合(ステップSt200,NO)、文字列が縦書きであるか否かを判定する(ステップSt201)。
【0078】
プロセッサ41は、文字列が縦書きであると判定する場合(ステップSt201,YES)、文字列がトレイラIDであると判定する(ステップSt202)。
【0079】
プロセッサ41は、文字列が縦書きではないと判定する場合(ステップSt201,NO)、文字列の示す内容がトレイラID以外か否かを判定する(ステップSt203)。つまり、プロセッサ41は、ステップSt203の処理で、文字列が図4のテーブルで二重丸を付与した各属性に該当するものであるか否かに係る判定を行う。
【0080】
プロセッサ41は、図4のテーブルで二重丸を付与した属性のいずれかに文字列が該当する(つまり、文字列がトレイラID以外)と判定すると(ステップSt203,YES)、当該文字列はトレイラIDではないと判定する(ステップSt207)。
【0081】
プロセッサ41は、図4のテーブルで二重丸を付与した属性のいずれにも文字列が該当しない(つまり、文字列がトレイラID以外ではない)と判定すると(ステップSt203,NO)、図4のテーブルの記号を付与していない属性(以下、通常属性と称する)を用いて文字列がトレイラIDである可能性が高いか否かを判定する(ステップSt204)。プロセッサ41は、例えば、文字列がトレイラIDである可能性の高さをスコアとして算出する。プロセッサ41は、例えば、文字列がトレイラIDと推定される通常属性に該当する場合はスコアを加点し、文字列がトレイラIDでないと推定される通常属性に該当する場合はスコアを減点する。なお、スコアの算出方法は上述した例に限られず、スコアは、加算、減算および乗算を組み合わせて算出されてもよい。スコアが高いほど文字列がトレイラIDである可能性が高くなる。プロセッサ41は、算出したスコアに基づき文字列をソート(例えば、スコアが高い順に並べる)してもよい。
【0082】
プロセッサ41は、通常属性を用いて文字列がトレイラIDである可能性が高いと判定する場合(ステップSt204,YES)、当該文字列はトレイラIDである可能性が高いと分類する(ステップSt205)。プロセッサ41は、例えば、算出したスコアが予め定められた閾値以上である場合、文字列はトレイラIDである可能性が高いと判定する。また、プロセッサ41は、トレイラIDである可能性が高いと判定した文字列をスコア順にソート(つまり、スコアが高いもしくは低い順に並べる)してもよい。
【0083】
プロセッサ41は、通常属性を用いて文字列がトレイラIDである可能性が低いと判定する場合(ステップSt204,NO)、当該文字列はトレイラIDである可能性が低いと分類する(ステップSt206)。プロセッサ41は、例えば、算出したスコアが予め定められた閾値未満である場合、文字列はトレイラIDである可能性が低いと判定する。また、プロセッサ41は、トレイラIDである可能性が低いと判定した文字列をスコア順にソート(つまり、スコアが高いもしくは低い順に並べる)してもよい。
【0084】
<その他変形例>
上述した実施の形態における、トレイラIDであると推定される属性とトレイラIDでないと推定される属性は一例であり、他の条件に基づいてトレイラIDであると推定される属性およびトレイラIDでないと推定される属性を採用してもよい。また、トレイラIDであると推定される属性とトレイラIDでないと推定される属性とを逆転させて等価な意味を持つ属性として用いてもよい。例えば、文字列が縦書きであることをトレイラIDであると推定する属性として用いることに替えて、文字列が横書きであることをトレイラIDでないと推定される属性として用いてもよい。
【0085】
上述した実施の形態では、文字列が縦書きであること、および、文字列がコンテナIDであることを、他の属性よりも優先的に判断される属性として例示している。しかし、いずれか一方の属性や、他の属性を、優先的に判断される属性として用いてもよい。上述した通り、文字列が縦書きであり、かつ、文字列がコンテナIDである場合、その文字列は高確率でトレイラIDであると言える。しかし、例えば、縦書きの文字列にはコンテナIDが含まれていないことが既知である場合には、文字列が縦書きであることのみを優先的に判断される属性としてもよい。また、例えば、トレイラIDが特殊な態様で記載されていることが既知である場合には、それらの属性を優先的に判断される属性として利用することでより効率的にトレイラIDを認識することができる。
【0086】
(実施の形態1のまとめ)
以上の実施の形態1の記載により、下記技術が開示される。
【0087】
<技術1>
実施の形態1に係る文字認識装置(例えば、文字認識装置40)は、撮影デバイス(例えば、撮影デバイス10)によって撮影されたトレイラを含む撮影画像から少なくとも1つの文字列を認識する認識部(例えば、文字列認識部41B)と、認識部によって認識された文字列の属性を判定する属性判定部(例えば、属性判定部41C)と、属性判定部により判定された文字列の属性に基づき、文字列がトレイラIDであるか否か推定するトレイラID推定部(例えば、トレイラID推定部41D)と、を備える。
【0088】
これにより、実施の形態1に係る文字認識装置は、トレイラに複数の文字列が様々な大きさ、フォントまたは書き方で任意の位置に記載されている場合に、複数の文字列の中からトレイラIDと考えられる文字列を検出することができる。つまり、文字認識装置は、トレイラに記載された複数の文字列の中から高精度にトレイラIDを検出することができる。
【0089】
<技術2>
技術1に記載の文字認識装置において、トレイラID推定部は、文字列の書き方が縦書きであり、かつ、文字列の示す内容が所定の規定にしたがったコンテナIDでない場合、文字列をトレイラIDであると推定する。
【0090】
これにより、実施の形態1に係る文字認識装置は、文字列がコンテナIDであるか否かを、所定の規格によって定められた態様に合致しているか否かに基づいて確実に判断することができる。文字認識装置は、コンテナIDが縦書きで記載されている場合に、その文字列を高い確率でトレイラIDではないと推定することができる。つまり、文字認識装置は、複数の文字列の中からコンテナIDを高い確率で排除しトレイラIDと考えられる文字列を高精度に検出することができる。
【0091】
<技術3>
技術1または2に記載の文字認識装置において、トレイラID推定部は、文字列の書き方が縦書きであり、かつ、文字列の示す内容がISO6346で規定されているコンテナIDでない場合、文字列を前記トレイラIDであると推定する。
【0092】
これにより、実施の形態1に係る文字認識装置は、複数の文字列の中からコンテナIDを排除しトレイラIDと考えられる文字列を高精度に検出することができる。
【0093】
<技術4>
技術1から3のいずれか1つに記載の文字認識装置において、トレイラID推定部は、文字列の書き方が縦書きでなく、かつ文字列の示す内容が前記コンテナIDでなく、かつ文字列の示す内容がトレイラID以外を示すものである場合、文字列を前記トレイラIDではないと推定する。
【0094】
これにより、実施の形態1に係る文字認識装置は、コンテナIDではない任意の横書きの文字列において、文字列の示す内容がトレイラID以外の場合に、当該文字列を排除することができる。つまり、文字認識装置は、トレイラID以外を示す文字列をトレイラIDと誤検出してしまうのを防ぐことができる。
【0095】
<技術5>
技術1から4のいずれか1つに記載の文字認識装置において、トレイラID以外を示すものは、文字列が、トレイラの高さを示す、一般名称を示す、会社名を示す、電話番号を示す、ナンバープレートを示すまたは撮影デバイスによって撮影画像に埋め込まれる時刻を示すものである。
【0096】
これにより、実施の形態1に係る文字認識装置は、トレイラID以外を示す文字列をトレイラIDと誤検出してしまうのを防ぐことができる。
【0097】
<技術6>
技術1から5のいずれか1つに記載の文字認識装置において、トレイラID推定部は、文字列の書き方が縦書きでなく、かつ文字列の示す内容がコンテナIDでなく、かつ文字列の示す内容がトレイラID以外を示すものでない場合、文字の書き方に係る属性と文字列の位置に係る属性と文字列の示す内容がトレイラIDであると推定される属性とに基づきトレイラIDである可能性が高いか否かを推定する。
【0098】
これにより、実施の形態1に係る文字認識装置は、トレイラに記載される複数の文字列を、トレイラIDである可能性が高いか否かで高精度に分類することができる。
【0099】
<技術7>
技術1から6のいずれか1つに記載の文字認識装置において、トレイラID推定部は、文字列がトレイラIDである可能性の高さをスコアとして算出する。
【0100】
これにより、実施の形態1に係る文字認識装置は、トレイラに記載された文字列をトレイラIDである可能性の高さでスコア付けて分類することができる。
【0101】
<技術8>
技術1から7のいずれか1つに記載の文字認識装置において、トレイラID推定部は、全ての文字が同一のサイズでありかつ等間隔である場合、文字列をトレイラIDである可能性が高いと推定する。
【0102】
これにより、実施の形態1に係る文字認識装置は、トレイラに記載される複数の文字列の中からトレイラIDである可能性が高い文字列を抽出することができる。
【0103】
<技術9>
技術1から8のいずれか1つに記載の文字認識装置において、トレイラID推定部は、文字列が文字装飾を施されている場合、文字列を前記トレイラIDである可能性は低いと判定する。
【0104】
これにより、実施の形態1に係る文字認識装置は、トレイラに記載される複数の文字列の中からトレイラIDである可能性が低い文字列を抽出し排除することができる。
【0105】
<技術10>
技術1から9のいずれか1つに記載の文字認識装置において、トレイラID推定部は、文字列がナンバープレートよりも上に位置するもしくは文字列が前記トレイラ内に位置する場合、文字列をトレイラIDである可能性が高いと推定する。
【0106】
これにより、実施の形態1に係る文字認識装置は、トレイラに記載される複数の文字列の中からトレイラIDである可能性が高い文字列を抽出することができる。
【0107】
<技術11>
技術1から10のいずれか1つに記載の文字認識装置において、トレイラID推定部は、文字列がトラクタに記載されているもしくは会社のロゴの上または下に記載されている場合、文字列をトレイラIDである可能性は低いと推定する。
【0108】
これにより、実施の形態1に係る文字認識装置は、トレイラに記載される複数の文字列の中からトレイラIDである可能性が低い文字列を抽出し排除することができる。
【0109】
<技術12>
技術1から11のいずれか1つに記載の文字認識装置において、トレイラID推定部は、文字列が大文字および数字のみからなる場合、文字列の文字数が所定の文字数以下である場合または文字列が会社ごとの特定のルールに即している場合、文字列をトレイラIDである可能性が高いと推定する。
【0110】
これにより、実施の形態1に係る文字認識装置は、トレイラに記載される複数の文字列の中からトレイラIDである可能性が高い文字列を抽出することができる。
【0111】
<技術13>
技術1から12のいずれか1つに記載の文字認識装置において、トレイラID推定部は、所定の規定にしたがったコンテナIDである場合、文字列はトレイラIDではないと推定する。
【0112】
これにより、実施の形態1に係る文字認識装置は、トレイラに記載される複数の文字列の中からコンテナIDであると推定される文字列を排除することができる。
【0113】
<技術14>
技術1から13のいずれか1つに記載の文字認識装置において、属性は、文字の書き方、文字列の位置または文字列が示す内容である。
【0114】
これにより、実施の形態1に係る文字認識装置は、トレイラに記載される複数の文字列を各属性に基づきトレイラIDであるか否かを推定することができる。つまり、文字認識装置は、複数の文字列の中から高精度にトレイラIDを検出することができる。
【0115】
<技術15>
技術1から14のいずれかひとつに記載の文字認識装置において、トレイラID推定部は、推定結果を表示デバイスに出力する。
【0116】
これにより、実施の形態1に係る文字認識装置は、文字認識装置を使用するユーザに対し、トレイラIDを用いてトレイラを識別することを支援することができる。
【0117】
<実施の形態2に至る経緯>
特許文献1には、ナンバープレート認識処理を行うナンバープレート認識システムが開示されている。当該ナンバープレート認識システムは、所定の走行路を走行する車両の車種を判別するための車種判別用画像を撮影する車種判別用カメラと、車両の背面画像を撮影する背面撮影用カメラと、を有する。また、ナンバープレート認識システムは、車種判別用画像に基づいて車両の車種を判別する車種判別部と、車種の判別結果に基づいて、背面画像のパラメータを選択し、パラメータに対応する背面画像に基づいて、車両のナンバープレート認識処理を行うナンバープレート認識部と、を有する。
【0118】
近年、トレイラを用いた物流が盛んになってきており、各トレイラの所在を効率的に管理したいというニーズが高まってきている。ここで、トレイラとは牽引車両(トラクタとも呼ぶ)によって牽引される被牽引車両を意味する。一般的にトレイラには、トレイラIDが記載されているため、車両等を撮影した撮影画像からこのトレイラIDを認識することで、トレイラを効率的に管理することができると考えられる。しかし、撮影画像には様々な文字も含まれていることがあり、認識に成功した文字列がトレイラIDであるとは限らない。そのため、撮影対象物であるトレイラ等が様々な大きさ、色、デザインの文字列を複数含む場合において、複数の文字列の中からトレイラIDを精度よく検出したいというニーズがある。
【0119】
特許文献1では、判別した車両の車種の情報を利用してナンバープレートの認識処理を行う。しかしながら、トラクタの車種とトレイラIDとが記載位置等には相関性が乏しいため、この技術はトレイラIDの識別には利用困難である。例えば、トレイラは、会社ごとにデザインが決まっていることが多いが、複数の会社が同一の車種のトラクタを使用している場合には、車種が分かってもトレイラのデザインまたはトレイラIDの位置等を特定することはできない。
【0120】
上述の通り、トレイラのデザインは会社ごとに決まっていることが多いため、会社を特定することができればトレイラIDがトレイラのどこに記載されているか把握することが可能と考えられる。しかしながら、画像の解像度によっては文字列を正確に抽出すること自体が難しく、また、会社名以外にトレイラIDを含む多種多様な文字列の中から会社名を示す文字列を正確に特定することも難しい。そのため、トレイラに記載されている会社名等を認識して会社名を特定することは一般的には困難であるという課題がある。
【0121】
そこで、以下の実施の形態2では、複数の文字列の中からトレイラIDと考えられる文字列を精度よく検出する文字認識装置、文字認識システムおよび文字認識方法の例を説明する。
【0122】
<実施の形態2>
複数のトレイラは、倉庫または各地(例えば、出発地点、目的地点または中継地点等)に存在するターミナル等に集合することがある。以下、複数のトレイラが集合する地点のことをトレイラステーションと称する。一般的にトレイラには、トレイラIDが記載されているため、トレイラIDを用いてトレイラステーション内に存在するトレイラを管理できると考えられる。このように、トレイラIDを用いてトレイラステーションへのトレイラの入退場を管理したいというニーズがある。
【0123】
図6を参照して、トレイラの表面のデザインの一例を説明する。図6は、トレイラの表面のデザインの一例を示す図である。
【0124】
車両Aは、A社のトレイラTRAをトラクタLEが牽引する車両である。トレイラTRAは、文字列P1,P2,P4と図形P3とを含む。
【0125】
文字列P1は、重力方向に対してトレイラTRAの上部に横向きで記載されている文字列である。文字列P1は、「ABC Company」という会社名またはサービス名等を表す文字列である。
【0126】
文字列P2は、重力方向に対してトレイラTRAの右端に縦書きで記載されている文字列である。文字列P2は、「123-ABC」というトレイラIDを表す文字列である。
【0127】
文字列P4は、重力方向に対してトレイラTRAの下部に横書きで記載されている文字列である。文字列P4は、「0120-XXX-XXX」という電話番号を表す文字列である。
【0128】
図形P3は、トレイラTRAの中央に描かれているA社固有のマークである。
【0129】
車両Bは、B社のトレイラTRBをトラクタLEが牽引する車両である。トレイラTRBは、文字列P5,P7,P8と図形P6とを含む。
【0130】
文字列P5は、重力方向に対してトレイラTRBの上部に横書きで記載されている文字列である。文字列P5は、「RS-678」というトレイラIDを表す文字列である。
【0131】
文字列P7は、重力方向に対してトレイラTRBの下部に横書きで記載されている文字列である。文字列P7は、「XYZ Store」という会社名またはサービス名等を表す文字列である。
【0132】
文字列P8は、重力方向に対してトレイラTRBの右下部に横書きで記載されている文字列である。文字列P8は、「53’」というトレイラTRBの高さを表す文字列である。
【0133】
図形P6は、トレイラTRBの中央に描かれているB社固有のマークである。
【0134】
このように、トレイラTRの表面には、会社名、電話番号、トレイラTRの高さまたはトレイラID等の文字列が記載される。なお、トレイラTRの表面に記載される文字列は上述した例に限られず、スローガン、キャッチコピー、URL、メールアドレスまたは任意の文章等の文字列が記載されてもよい。なお、図6に示したトレイラTRの表面のデザインは一例であり限定されない。
【0135】
トレイラIDのフォントおよびフォーマットは、会社ごとに異なる。例えば、A社のトレイラIDは、「RS-678」でありアルファベット2文字の後に数値3桁が続く文字列であり、B社のトレイラIDは、「123-ABC」であり数字3桁の後にアルファベット3文字が続く文字列でありフォーマットが異なる。なお、上述したトレイラIDのフォーマットは一例であり文字の数および種類は限定されない。
【0136】
なお、図6では、会社固有の図形とトレイラIDとが同一面に記載される場合を説明したが、異なる面に記載される場合もある。
【0137】
トレイラTRに記載される会社固有の図形は、例えば、絵、写真、記号またはロゴタイプである。なお、トレイラTRの会社固有の情報は上述した図形に限られず、トレイラTRの表面の一部または全体に描かれる色彩的なデザイン(例えば、赤および青の縞模様等)またはトレイラTRの表面の一部または全体に描かれる模様(例えば、ドット模様等)であってもよい。なお、トレイラTRに記載される会社固有の図形は、上述した例に限られず、会社を特定可能なデザインであればよい。また、トレイラTRの管理者に固有の図形は、会社に限られず、法人、公共団体、組合または個人等に固有の図形であってもよい。以下、説明の便宜上、トレイラTRの管理者に固有の図形は、会社に固有の図形として説明する。
【0138】
このように、トレイラTRの表面に記載される文字列および図形は、内容、向き、大きさおよび位置(つまりデザイン)が会社ごとに決まっている。例えば、図6の例において、A社のトレイラTRAは、トレイラID(文字列P2)がトレイラTRAの右端に縦書きで記載されるデザインである。B社のトレイラTRBは、トレイラID(文字列P5)がトレイラTRBの上端に横書きで記載されるデザインである。つまり、トレイラTRの会社を特定することができれば、トレイラIDがトレイラTRのどの領域に存在するか予め把握することが可能である。
【0139】
一般的に、撮影画像から文字を認識する場合、文字認識技術は、低解像度の画像に対しては精度良く所望の文字列を抽出するのが難しい。また、文字認識技術は、画像に文字が多数存在する場合、誤認識する可能性が高い。一方、撮影画像から図形を認識する場合、図形認識技術は、低解像度の画像に対しても比較的高精度に図形の認識を行うことができ、画像から特定の図形を認識するのが容易であるというメリットがある。このような理由から、トレイラTRに記載された図形を認識し、会社を特定することでトレイラTR内におけるトレイラIDの位置を把握した上でトレイラIDの検出を行うことで高精度にトレイラIDを検出することができると考えられる。以下では、図形認識を利用したトレイラIDの検出方法について詳しく説明する。
【0140】
次に、図7を参照して、実施の形態2に係る文字認識システム2のシステム構成図を説明する。図7は、実施の形態2に係る文字認識システム2のブロック図である。
【0141】
文字認識システム2は、撮影デバイス50、文字認識装置60、ID情報データベース100および入退場管理データベース200を含む。
【0142】
撮影デバイス50は、トレイラTRを撮影するデバイスである。撮影デバイス50は、例えば、トレイラステーションに車両が入退場する際のゲートに設けられる。入場ゲートと退場ゲートとが別々に設けられる場合、撮影デバイス50は、入場ゲートと退場ゲートとにそれぞれ設置されてもよい。また、撮影デバイス50は、トレイラTRの表面を様々な角度から撮影する場合、1つのゲートに複数の撮影デバイス50を設けてもよい。この場合、トレイラTRの側面、背面または上面の中から入退場を管理する管理者等によって予め定められた撮影対象の面が撮影可能なように、撮影デバイス50はゲートに設置される。なお、撮影デバイス50は、トレイラステーションのゲートに限られず、トレイラステーションに向かう道路またはトレイラステーション内の所定の位置等に設けられてもよい。
【0143】
撮影デバイス50は、少なくとも光学素子としてのレンズ(不図示)とイメージセンサ(不図示)とを有して構成される。レンズは、撮影デバイス50の撮影した領域の画角内からの対象物により反射された光を入射してイメージセンサの受光面(言い換えると、撮影面)に対象物の光学像を結像する。イメージセンサは、例えばCCDあるいはCMOSなどの固体撮影素子である。イメージセンサは、所定時間(例えば1/30(秒))ごとに、レンズを介して撮影面に結像した光学像を電気信号に変換する。例えば、所定時間が1/30(秒)である場合、撮影デバイス50のフレームレートは30fpsとなる。また、撮影デバイス50は、上述した所定時間ごとに、電気信号に所定の信号処理を施すことで撮影画像を生成してもよい。撮影デバイス50は、撮影画像を文字認識装置60に出力する。また、撮影デバイス50は、可視光カメラまたは赤外線カメラ等である。撮影デバイス50は、可視光カメラおよび赤外線カメラを組み合わせ、昼間は可視光カメラを用いて、曇り、雨または夜間等の暗くて撮影困難な時間帯は赤外線カメラを用いてもよい。また、撮影デバイス50と併せて照明も設けられてもよく、暗くて撮影困難な時間帯は照明で車両を照らして車両を撮影してもよい。
【0144】
文字認識装置60は、通信I/F61、プロセッサ62およびメモリ63を含む。文字認識装置60は、例えば、PCまたはサーバ装置等である。
【0145】
通信I/F61は、撮影デバイス50と文字認識装置60と、ID情報データベース100と文字認識装置60とおよび入退場管理データベース200と文字認識装置60との間で無線または有線で通信を行うインターフェース回路である。なお、撮影デバイス50と文字認識装置60と、ID情報データベース100と文字認識装置60とおよび入退場管理データベース200と文字認識装置60との間の通信はネットワークを介してもよい。通信I/F61による通信方式は、有線通信または無線通信である。具体的には、無線通信は、WAN、LAN、LTE、4G、5G等の移動体通信、電力線通信、近距離無線通信(例えばBluetooth(登録商標)通信)または携帯電話用の通信等であってよい。なお、無線通信の方式は上述した例に限られない。
【0146】
プロセッサ62は、例えば、CPU、DSP、GPUもしくはFPGAである。プロセッサ62は、文字認識装置60の全体的な動作を司るコントローラとして機能する。プロセッサ62は文字認識装置60の各部の動作を統括するための制御処理、文字認識装置60の各部との間のデータの入出力処理、データの演算処理およびデータの記憶処理を行う。プロセッサ62は、メモリ63に記憶されたプログラムに従って動作する。プロセッサ62は、動作時にメモリ63を使用し、プロセッサ62が生成または取得したデータをメモリ63に一時的に保存する。プロセッサ62は、メモリ63に記憶されたプログラムおよびデータを用いることで、図形認識部62A、特有図形照合部62B、ID領域抽出部62Cおよび文字列認識部62Dのそれぞれの機能を実現する。
【0147】
図形認識部62Aは、撮影デバイス50から受信または取得した撮影画像からトレイラTRに記載されている会社特有の図形(以下、特有図形と称する)を認識する。図形認識部62Aは、公知のArtificial Intelligence(以下、「AI」と称する)技術等によって実現される物体認識技術を用いて特有図形を認識する。図形認識部62Aは、認識した特有図形の情報(例えば、撮影画像から特有図形が映る領域を切り出した画像データ)を特有図形照合部62Bに出力する。なお、図形認識部62Aの特有図形の認識方法は上述した例に限られず他の公知の技術を用いて実行されてもよい。
【0148】
照合部の一例としての特有図形照合部62Bは、ID情報データベース100から取得したトレイラID情報と、図形認識部62Aから受信した特有図形の情報とを照合し、特有図形がトレイラID情報のどの情報に該当するかを判別する。特有図形照合部62Bは、判別した結果をID領域抽出部62Cに出力する。
【0149】
また、特有図形照合部62Bは、ID情報データベース100から取得した会社ごとのトレイラIDに関する情報(以下、トレイラID情報と称する)を用いてテンプレートマッチング等の公知の画像処理技術を用いて特有図形を認識してもよい。トレイラID情報に関しては図8で説明する。なお、特有図形照合部62Bは、トレイラID情報を用いてテンプレートマッチング等の公知の画像処理技術を用いて特有図形を認識する場合、図形認識部62Aは特有図形照合部省略され、撮影画像のトレイラTRがトレイラID情報のどの情報に該当するか判別してもよい。
【0150】
抽出部の一例としてのID領域抽出部62Cは、特有図形照合部62Bから受信した照合結果に基づき、撮影画像の中からトレイラIDと推定される文字列が記載されている領域を抽出する。また、ID領域抽出部62Cは、特有図形照合部62Bから受信した照合結果に基づき、撮影画像の中にトレイラIDと推定される文字列が記載されていると考えられる領域にマークをつけてもよい。マークは、文字列認識部62DがトレイラIDと推定される文字列が記載されている領域が認識できるものであれば何でもよく、例えば、点、四角形の線、円形の線または星等の任意の形のマーク等である。ID領域抽出部62Cは、抽出した結果(例えば、撮影画像の中から一部を切り出した画像データ)を文字列認識部62Dに出力する。
【0151】
文字列認識部62Dは、ID領域抽出部62Cから受信した抽出結果をOCR等の公知の文字認識技術を用いて文字列を認識しトレイラIDを検出する。文字列認識部62Dは、検出したトレイラIDの情報を入退場管理データベース200に出力する。例えば、検出したトレイラIDがトレイラステーションに入場する車両のトレイラIDである場合、文字列認識部62Dは、入退場管理データベース200に登録するもしくはトレイラステーションに存在する旨の情報と紐づけて入退場管理データベース200に登録する。また、検出したトレイラIDがトレイラステーションから退場する車両のトレイラIDである場合、文字列認識部62Dは、入退場管理データベース200からトレイラステーションに入場した際に登録されたトレイラIDの情報を削除するまたはトレイラステーションから退場した旨の情報と紐づけて入退場管理データベース200に登録する。
【0152】
なお、プロセッサ62は、実施の形態1で説明した属性判定部41CおよびトレイラID推定部41Dを含んでもよい。
【0153】
メモリ63は、例えばRAMとROMとを用いて構成され、文字認識装置60の動作に必要なプログラム、さらには、動作中に生成されたデータを一時的に保持する。RAMは、例えば、文字認識装置60の動作中に使用されるワークメモリである。ROMは、例えば、文字認識装置60を制御するためのプログラムを予め記憶して保持する。
【0154】
ID情報データベース100は、記憶媒体(例えばフラッシュメモリ、HDD、SSD)を用いて構成される。ID情報データベース100は、トレイラID情報が保存されている。なお、ID情報データベース100は、文字認識装置60に組み込まれてもよい。また、ID情報データベース100は、クラウド上のストレージであってもよい。なお、ID情報データベース100は、トレイラID情報を保存できる媒体であればよく上記に限られない。
【0155】
入退場管理データベース200は、記憶媒体(例えばフラッシュメモリ、HDD、SSD)を用いて構成される。入退場管理データベース200は、トレイラステーションに存在するトレイラTRの情報またはトレイラステーションに入退場するトレイラTRの情報を保存する。なお、入退場管理データベース200は、文字認識装置60に組み込まれてもよい。また、入退場管理データベース200は、クラウド上のストレージであってもよい。なお、入退場管理データベース200は、トレイラTRの情報を保存できる媒体であればよく上記に限られない。
【0156】
次に、図8を参照して、トレイラID情報LTの一例について説明する。図8は、トレイラID情報LTの一例を示す図である。
【0157】
トレイラID情報LTは、特有図形に対して、トレイラIDのトレイラTR表面における記載位置の座標(以下、「ID記載位置座標」と称する)、トレイラIDの向きおよびトレイラIDのフォーマット等の情報が紐づけられたデータである。なお、図8に示すトレイラID情報LTは一例であり、限定されない。
【0158】
ID記載位置座標は、特有図形に対する相対座標である。ID記載位置座標は、例えば、特有図形のあるトレイラTRの面に設定したXY座標において、特有図形の略中心を(X,Y)=(0,0)とした場合のXY座標である。図8に示す番号1の例では、ID記載位置座標は、(X、Y)=(50,50)であり、特有図形からX軸正方向に50、Y軸正方向に50移動した位置を示す。番号2の例では、(X、Y)=(-20,40)であり、特有図形からX軸負方向に20、Y軸正方向に40移動した位置を示す。なお、ID記載位置座標のXY座標は、例えば、トレイラIDが内部に含まれる所定の大きさの枠(不図示)の中心座標でもよいし、枠が四角形の場合は任意の端点の座標でもよい。当該枠の形状は、四角形に限られず円形等であってもよい。また、トレイラIDに対する枠の大きさは、トレイラIDが内部に含まれる最小の大きさでもよいし、最小の大きさから数~数十%拡大した大きさでもよい。
【0159】
また、ID記載位置座標は、トレイラTRの1つの面(例えば、特有図形の存在する面)に対して設けられたXY座標に対する座標であってもよい。例えば、トレイラTRの側面の重力方向に対して左上端を(X,Y)=(0,0)とした場合のXY座標である。
【0160】
また、トレイラIDが特有図形と異なる面に記載される場合、ID記載位置座標は、トレイラIDが記載されるトレイラTRの面に設定されたXY座標に対する座標であってもよい。
【0161】
また、トレイラIDがトレイラTRのコーナ(つまり、トレイラTRの筐体をなす面の境界部分であり、トレイラTRの側面に位置し重力方向に長い部分)に縦書きに記載されている場合、ID記載位置座標は、トレイラIDが記載されるコーナのトレイラTRにおける位置の情報であってもよい。なお、トレイラIDは、トレイラTRの筐体をなす面の境界部分であり、重力方向に対して垂直に長い方向に横書きに記載されてもよい。
【0162】
また、ID記載位置座標は、XY座標の情報ではなく、「top」、「left」、「width」および「height」等で表される矩形情報であってもよい。
【0163】
また、ID記載位置座標は、XY座標の情報ではなく、トレイラTRの1つの面内におけるトレイラIDが存在するおよその領域の情報であってもよい。例えば、トレイラIDがトレイラTRの右端に記載される場合、ID記載位置座標は、記載面の中心位置から重力方向に伸ばした線に対して右側の領域にトレイラIDが存在するという情報である。
【0164】
また、ID記載位置座標は、トレイラIDが記載されている面に関する情報であってもよい。ID記載位置座標は、例えば、特有図形と同一の面にトレイラIDが記載されている、トレイラTRの背面にトレイラIDが記載されているまたは特有図形が記載された面の対向する面にトレイラIDが記載されている等の情報である。なお、トレイラIDが記載されている面に関する情報のID記載位置座標は、上述した例に限られない。
【0165】
トレイラIDの向きは、重力方向に対してトレイラIDが記載される向きを表す。トレイラIDの向きは、例えば、縦書きまたは横書きである。なお、トレイラIDの向きは、縦書きまたは横書きに限られず、重力方向に対して所定の角度(つまり、重力方向に対して斜め)の直線状の向きであってもよい。
【0166】
トレイラIDのフォーマットは、トレイラIDを形成する文字列の形式を表す。つまり、トレイラIDのフォーマットは、数字、英文字および「-」等の記号がどのような配列となっているかを表す。また、トレイラIDのフォーマットは、各英文字が大文字であるか小文字であるかに関する情報を含んでもよい。
【0167】
また、トレイラID情報において特有図形に紐づけられる情報は、ID記載位置座標)、トレイラIDの向きおよびトレイラIDのフォーマットに限られず、トレイラIDのフォント、大きさ、色、トレイラIDが記載されている面またはトレイラIDの探索範囲の情報もさらに紐づけられてもよい。
【0168】
また、同じ会社が複数のパターンのデザインのトレイラTRを使用している場合には、1つの特有図形に複数のトレイラIDの情報が紐づけられてもよい。
【0169】
トレイラID情報は、入退場時とは別の時(例えば、止まっている時等)に予め撮影されたトレイラTRの撮影画像を用いてユーザによって手作業で構築されてもよいし、過去に入退場時に撮影された撮影画像を図形認識および文字認識した結果を用いて自動で構築されてもよい。また、トレイラID情報にない新しいトレイラTRの情報を文字認識装置60が検出した場合、文字認識装置60は新たにID情報データベース100に登録しトレイラID情報を更新してもよい。
【0170】
次に、図9を参照して、トレイラIDを認識する処理について説明する。図9は、トレイラIDを認識する処理のフローチャートである。図9のフローチャートの各処理は、プロセッサ62によって実行される。
【0171】
図形認識部62Aは、通信I/F61を介して撮影デバイス50からトレイラTRの撮影画像を受信する(ステップSt300)。例えば、トレイラステーションの所定の位置(例えば、ゲート付近)に設けられたセンサ(例えば、赤外線センサ)によって車両Vが検出されたことに起因して撮影デバイス50はトレイラTRを撮影し図形認識部62Aに撮影画像を送信する。また、トレイラステーションの所定の位置に設けられたセンサによって車両Vが検出されたことに起因して図形認識部62Aが撮影デバイス50に撮影する信号を出力し、撮影画像を取得してもよい。また、センサは撮影デバイス50に組み込まれてもよい。また、撮影デバイス50は、画角に移動体が入ったことをトリガに撮影を実行し図形認識部62Aに撮影画像を出力してもよい。
【0172】
図形認識部62Aは、ステップSt300の処理で受信した撮影画像の中から特有図形を認識する(ステップSt301)。図形認識部62Aは、例えば、物体検出等の公知の技術を用いて特有図形を認識する。
【0173】
図形認識部62Aは、特有図形が検出されたか否かを判定する(ステップSt302)。
【0174】
図形認識部62Aは、特有図形が検出されていないと判定した場合(ステップSt302,NO)、ステップSt306の処理を実行する。
【0175】
図形認識部62Aは、特有図形が検出されたと判定した場合(ステップSt302,YES)、撮影画像の中から特有図形が含まれる領域を抽出した画像データを生成する。なお、図形認識部62Aは、特有図形が検出されたと判定した場合、撮影画像に対し特有図形の存在する領域にマークを付けた画像データを生成してもよい。図形認識部62Aは、生成した画像データを特有図形照合部62Bに出力する。
【0176】
特有図形照合部62Bは、ID情報データベース100からトレイラID情報を取得し、図形認識部62Aから受信した特有図形の画像データをトレイラID情報と照合する(ステップSt303)。特有図形照合部62Bは、ステップSt303の処理の照合結果に該当するトレイラID情報をID領域抽出部62Cに出力する。
【0177】
ID領域抽出部62Cは、ID記載位置座標を基に探索範囲を設定する。ID領域抽出部62Cは、例えば、ID記載位置座標の座標から予め定められた面積の領域を探索範囲とする。ID領域抽出部62Cは、ID記載位置座標の座標とトレイラIDの向きとトレイラIDの大きさとの情報から探索範囲を設定してもよい。ID領域抽出部62Cは、撮影画像の中のトレイラIDの大きさを算出し、算出した値と、ID記載位置座標と、トレイラIDの向きの情報から探索範囲を設定してもよい。ID領域抽出部62Cは、ID記載位置座標の情報に基づき、トレイラTRの面の重力方向に対する上半分、右側1/3の領域またはコーナ等に探索範囲を設定してもよい。ID領域抽出部62Cは、設定した探索範囲の情報を文字列認識部62Dに出力する。
【0178】
文字列認識部62Dは、設定した探索範囲を文字認識し文字列を検出する(ステップSt304)。
【0179】
文字列認識部62Dは、トレイラID情報に含まれるトレイラIDのフォーマットと、ステップSt304の処理で検出した文字列のフォーマットとを比較して一致するか否かを判定する(ステップSt305)。
【0180】
文字列認識部62Dは、トレイラID情報に含まれるトレイラIDのフォーマットと、ステップSt304の処理で検出した文字列のフォーマットとを比較して一致しない(つまり、ステップSt304の処理で検出された文字列はトレイラIDではないと推定される)と判定した場合(ステップSt305,NO)、現在再撮影がn回目であるか否かを判定する(ステップSt306)。ここで、nは1以上の整数であり、トレイラステーションのトレイラTRを管理する者等のユーザによって予め定められた数値である。
【0181】
文字列認識部62Dは、再撮影がn回目ではないと判定した場合(ステップSt306,NO)、図形認識部62AにステップSt300の処理を再び実行させる。
【0182】
文字列認識部62Dは、再撮影がn回目であると判定した場合(ステップSt306,YES)、プロセッサ62は、撮影画像全体を文字認識し実施の形態1で説明した文字列の属性からトレイラIDを推定する方法でトレイラIDを推定する(ステップSt307)。文字列認識部62Dは、ステップSt307の処理を実行した後、ステップSt308の処理を実行する。
【0183】
文字列認識部62Dは、トレイラID情報に含まれるトレイラIDのフォーマットと、ステップSt304の処理で検出した文字列のフォーマットとを比較して一致する(つまり、ステップSt304の処理で検出された文字列はトレイラIDであると推定される)と判定した場合(ステップSt305,YES)、入退場管理データベース200にトレイラIDの情報を送信し書き込む(ステップSt308)。
【0184】
これにより、文字認識システム2は、特有図形を認識しトレイラID情報を基にトレイラIDが記載されている領域を文字認識することで、撮影画像に映るトレイラTRの中からトレイラIDを高精度に認識することができる。
【0185】
なお、図形認識部62Aは、ステップSt301の処理で、文字列からなるロゴタイプに関しても文字ではなく文字でできた図形として扱い、文字認識技術は用いずに物体検出等の図形認識技術を用いて特有図形を認識する。例えば、図形認識部62Aは、ロゴタイプに「A」が含まれている場合、これを「Aという文字」ではなく「三角形状の図形」として取り扱う。しかしながら、図形認識部62Aは、上述したロゴタイプに対して図形認識技術と併せ、補助的に文字認識技術を用いて特有図形を認識してもよい。これにより、文字認識システム2は、高精度に特有図形を認識することで、トレイラIDを高精度に検出することができる。
【0186】
また、文字認識システム2は、トレイラTRを複数回撮影してもよい。文字認識システム2は、複数回撮影した撮影画像の中からトレイラTRが最もよく映っている撮影画像を選定してトレイラIDの認識に用いてもよい。最もよく映っている撮影画像とは、例えば、トレイラTRの全体が映っている、トレイラTRがブレていないまたはトレイラTRの特有図形および文字列にピントが合っている等の撮影画像である。なお、これらの条件に満たす撮影画像が複数存在する場合には、最もよく映っている画像のみではなく、条件を満たす撮影画像を複数用いてトレイラIDの認識に用いてもよい。この場合、例えば、複数の撮影画像それぞれから認識されたトレイラIDから、多数決で正しいトレイラIDを決定してもよい。文字認識システム2は、トレイラIDの認識に適した撮影画像がない(トレイラIDと推定される文字列がない、ブレている、トレイラTRの全体が映っていない等)場合、トレイラTRを再撮影してもよい。
【0187】
また、トレイラTRとトラクタLEとが異なる会社のものであることがあるため、文字認識システム2は、撮影画像の中から画像認識等の公知のAI技術を用いてまずトレイラTRを検出し、トレイラTRの部分から特有図形を認識してもよい。これにより、トラクタLEに記載された他社の特有図形を誤って認識してしまうのを防ぐことができる。
【0188】
また、特有図形照合部62Bは、トレイラID情報をID情報データベース100から取得しテンプレートマッチング等の公知の画像処理技術を用いて特有図形を認識する場合、ステップSt303の処理は省略され、特有図形照合部62Bが認識した特有図形がトレイラID情報のどの情報に該当するか判別してもよい。この場合、特有図形照合部62Bは、判別したトレイラID情報をID領域抽出部62Cに出力する。
【0189】
また、同じ会社が複数のパターンのデザインのトレイラTRを有し、1つの特有図形に対し複数のトレイラIDの情報が紐づけられている場合、特有図形照合部62Bは照合した全てのトレイラID情報をID領域抽出部62Cに出力する。ID領域抽出部62Cは、全てのトレイラID情報を用いて探索範囲を複数設定し、全ての探索範囲で文字認識を行う。ID領域抽出部62Cは、検出した全ての文字列と、トレイラID情報のフォーマットとを比較することで最もトレイラIDである可能性が高い文字列をトレイラIDであると推定する。
【0190】
また、特有図形照合部62Bは、トレイラID情報からトレイラIDが特有図形と異なる面に記載されている旨の情報を取得した場合、撮影デバイス50に対応するトレイラTRの面を再び撮影させてもよいし、撮影デバイス50から受信した複数の撮影画像の中から対応するトレイラTRの面が映った撮影画像を選定してID領域抽出部62Cに出力してもよい。
【0191】
また、文字列認識部62Dが設定した探索範囲にトレイラIDと推定される文字列がなく、プロセッサ62がステップSt307の処理を実行しトレイラIDを推定した場合、文字認識装置60は、ステップSt301の処理で認識された特有図形の情報とステップSt307の処理で得られたトレイラIDに関する情報とを紐づけてID情報データベース100に保存されるトレイラID情報を更新してもよい。この場合、文字認識装置60は、特有図形とステップSt307の処理で得られたトレイラIDの探索範囲に関する情報とに相関があると確認できた場合にのみトレイラID情報を更新してもよい。ここで、文字認識装置60は、相関の有無を、例えば、同じ特有図形に対応するトレイラIDが、同様の探索範囲から所定の回数または頻度以上検出されたか否かで判定してもよい。
【0192】
また、文字認識システム2は、特有図形の認識に用いられる撮影画像を生成するための撮影デバイス50(以下、「図形認識用撮影デバイス」と称する)と、トレイラIDの認識に用いられる撮影画像を生成するための撮影デバイス50(以下、「文字認識用撮影デバイス」と称する)とを別々に有してもよい。図形認識よりも文字認識に用いられる撮影画像の方が高解像度であることが求められるため、文字認識用撮影デバイスを、図形認識用撮影デバイスよりも高解像度に撮影できる撮影デバイスにすることで、より高精度にトレイラIDを検出することができる。
【0193】
また、文字列認識部62Dは、入退場管理データベース200に対し、認識されたトレイラIDの情報だけでなく、トレイラIDが認識された日時、会社名または撮影画像等の情報も併せて入退場管理データベース200に出力してもよい。また、トレイラステーションに入退場するゲートが複数箇所に設けられる場合、文字列認識部62Dは、ゲートの情報も併せて入退場管理データベース200に出力してもよい。
【0194】
(実施の形態2の変形例)
上述した実施の形態2では、会社特有の図形を用いてトレイラIDの探索範囲を絞り込んでいた。しかし、図形に替えて会社名を示す文字列を用いてもよい。上述した通り、文字列の認識は図形の認識と比べて、低解像度の場合には精度が出にくい等の課題はあるが、この課題が解決される前提条件が整っているようであれば、この変形例の構成でも十分にトレイラIDを認識することができる。前提条件の例としては、会社名が他の文字列と比べて非常に大きくトレイラに記載されていたり、常に一定の場所に記載されていたりするなど、会社名を示す文字列がトレイラに特に認識し易い態様で記載されている場合が考えられる。
【0195】
上述した実施の形態2では、会社とトレイラIDが記載される位置等に相関関係があることを利用して、トレイラIDの探索範囲を絞り込んでいた。しかし、トレイラIDの記載位置と相関関係のある組織は、会社には限らない。例えば、複数の会社が共同してトレイラを管理している場合や、非営利目的で運営されている法人などの「会社」に該当しない組織が自己の組織向けの荷物等を運ぶトレイラを管理している場合もある。この場合、これらの組織とトレイラIDが記載される位置等に相関関係があると考えられる。すなわち、トレイラを管理する組織であれば、その組織とトレイラIDが記載される位置等とには相関関係があると考えられるので、その組織特有の図形等を用いてトレイラIDの探索範囲を絞り込むようにしてもよい。
【0196】
(実施の形態2のまとめ)
以上の実施の形態2の記載により、下記技術が開示される。
【0197】
<技術1>
実施の形態2に係る文字認識装置(例えば、文字認識装置60)は、トレイラが撮影された撮影画像を取得し、撮影画像の中から図形を認識する図形認識部(例えば、図形認識部62A)と、所定の図形とトレイラIDの位置とが紐づいたトレイラID情報を保存するデータベース(例えば、ID情報データベース100)からトレイラID情報を取得し、認識した図形がトレイラID情報の図形に該当するか照合する照合部(例えば、特有図形照合部62B)と、照合部による照合結果に基づき、撮影画像からトレイラIDが映る領域を抽出する抽出部と、を備える。
【0198】
これにより、実施の形態2に係る文字認識装置は、トレイラに記載される図形を認識した結果を用いてデータベースに予め登録されたトレイラID情報の中から該当する情報を選定することができる。文字認識装置は、選定した情報を用いて撮影画像からトレイラIDを認識するための探索範囲を絞り込むことができる。これにより、文字認識装置は、誤ってトレイラIDと異なる文字列をトレイラIDとして認識するのを防ぎ高精度にトレイラIDを認識することができる。
【0199】
<技術2>
技術1に記載の文字認識装置において、抽出された領域から文字列を認識する文字列認識部を、さらに備える。
【0200】
これにより、実施の形態2に係る文字認識装置は、トレイラID情報に含まれるトレイラにおけるトレイラIDの位置情報を探索範囲として文字列を認識することで高精度にトレイラIDを認識することができる。
【0201】
<技術3>
技術1または2に記載の文字認識装置において、文字列認識部は、認識した文字列が該当するトレイラID情報のトレイラIDの形式と一致するか否かを判定する。
【0202】
これにより、実施の形態2に係る文字認識装置は、トレイラID情報のトレイラIDの形式を用いて認識した文字列がトレイラIDであるか否かを判定することで、トレイラIDではない文字列の誤認識を抑制することができる。例えば、文字認識装置は、探索範囲に複数の文字列が存在する場合または会社が新しいデザインのトレイラを導入した場合等に、誤って異なる文字列をトレイラIDとして認識することを防ぐことができる。
【0203】
<技術4>
技術1から3のいずれか1つに記載の文字認識装置において、文字列認識部は、文字列がトレイラIDの形式に一致すると判定した場合、トレイラステーションに存在するトレイラのトレイラIDを管理する入退場管理データベースにトレイラIDを登録する。
【0204】
これにより、実施の形態2に係る文字認識装置は、トレイラステーションに入退場するトレイラの情報を管理することができる。
【0205】
<技術5>
技術1から4のいずれか1つに記載の文字認識装置において、文字列認識部は、文字列がトレイラIDの形式に一致しないと判定した場合、再撮影した撮影画像を取得し図形を認識させる指示を図形認識部に送信する。
【0206】
これにより、実施の形態2に係る文字認識装置は、認識した文字列がトレイラIDの形式に一致せずトレイラIDである可能性が低い場合、再び撮影した撮影画像を用いてトレイラIDの認識を行うことができ高精度にトレイラIDを認識することができる。これにより、文字認識装置は、トレイラステーションに存在するトレイラを高精度に管理することができる。
【0207】
<技術6>
技術1から5のいずれか1つに記載の文字認識装置において、図形は、トレイラを管理する複数の組織それぞれに特有の図形である。
【0208】
これにより、実施の形態2に係る文字認識装置は、それぞれの組織とトレイラIDが記載される位置等との相関関係を利用してトレイラIDの探索範囲を絞り込むことができる。
【0209】
<技術7>
技術1から6のいずれか1つに記載の文字認識装置において、照合部は、組織特有の図形が文字列を含む場合であっても、文字列を用いた照合を行わず、前記文字列を図形と見做して前記照合を行う。
【0210】
これにより、実施の形態2に係る文字認識装置は、低解像度の画像に対して精度良く文字列を認識するのが難しい文字認識技術ではなく、低解像度の画像に対しても高精度に図形を認識できる図形認識技術を用いることで、文字列を含む特有の図形を高精度に認識することができる。
【0211】
<技術8>
技術1から7のいずれか1つに記載の文字認識装置において、図形は、組織特有の絵、写真、記号またはロゴタイプの情報である。
【0212】
これにより、実施の形態2に係る文字認識装置は、組織ごとに異なる様々な形状の図形に対応してトレイラIDの認識を行うことができる。
【0213】
<技術9>
技術1から8のいずれか1つに記載の文字認識装置において、図形は、組織特有の色彩または模様の情報である。
【0214】
これにより、実施の形態2に係る文字認識装置は、トレイラの面の一部もしくは全体に施された模様または色彩の情報にも対応してトレイラIDの認識を行うことができる。
【0215】
<技術10>
技術1から9のいずれか1つに記載の文字認識装置において、トレイラID情報は、トレイラIDの向き、トレイラIDの形式、トレイラIDのフォント、トレイラIDが記載されているトレイラの面の情報またはトレイラIDの文字列の大きさおよび色の少なくとも1つの情報が図形に紐づいた情報である。
【0216】
これにより、実施の形態2に係る文字認識装置は、トレイラID情報に含まれる種々の情報を用いることで、探索範囲を設定可能になり、また検出した文字列がトレイラIDであるか否かを判定可能になるため高精度にトレイラIDを認識することができる。
【0217】
<技術11>
技術1から10のいずれか1つに記載の文字認識装置において、抽出部は、トレイラID情報に含まれるトレイラIDの位置およびトレイラIDの向きの情報から領域を決定する。
【0218】
これにより、実施の形態2に係る文字認識装置は、決定した領域において文字認識を行い文字列を抽出することで、高精度にトレイラIDを認識することができる。
【0219】
<技術12>
技術1から11のいずれか1つに記載の文字認識装置において、抽出部は、撮影画像の中のトレイラの大きさを認識し、トレイラの大きさから領域の大きさを決定する。
【0220】
これにより、実施の形態2に係る文字認識装置は、トレイラIDの探索範囲を撮影画像に映るトレイラに対応して適切に設定することができる。これにより、文字認識装置は、大きすぎる範囲を設定しトレイラIDではない複数の文字列もトレイラIDと同時に検出することでトレイラIDの認識の精度が低下するのを防ぐことができる。また、文字認識装置は、小さすぎる範囲を設定しトレイラIDが検出されずトレイラIDの認識の精度が低下するのを防ぐことができる。
【0221】
以上、添付図面を参照しながら実施の形態について説明したが、本開示はかかる例に限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても本開示の技術的範囲に属すると了解される。また、発明の趣旨を逸脱しない範囲において、上述した実施の形態における各構成要素を任意に組み合わせてもよい。
【産業上の利用可能性】
【0222】
本開示の技術は、複数の文字列の中からトレイラIDと考えられる文字列を精度よく検出する文字認識装置、文字認識システムおよび文字認識方法として有用である。
【符号の説明】
【0223】
TR,TRA,TRB トレイラ
LE トラクタ
V,A,B 車両
ST1,ST2,ST3,ST4,ST5,ST6,ST7,ST8,P1,P2,P4,P5,P7,P9 文字列
P3,P6 図形
LT トレイラID情報
1,2 文字認識システム
10,50 撮影デバイス
20 データベース
30 表示デバイス
40,60 文字認識装置
41,62 プロセッサ
41A 文字列検出部
41B 文字列認識部
41C 属性判定部
41D トレイラID推定部
42,61 通信I/F
43,63 メモリ
62A 図形認識部
62B 特有図形照合部
62C ID領域抽出部
62D 文字列認識部
100 ID情報データベース
200 入退場管理データベース
【要約】      (修正有)
【課題】複数の文字列の中からトレイラIDと考えられる文字列を精度よく検出する文字認識装置、文字認識システムおよび文字認識方法を提供する。
【解決手段】文字認識システム2において、文字認識装置60は、牽引車両によって牽引される被牽引車両であるトレイラが撮影された撮影画像を取得し、撮影画像の中から図形を認識する図形認識部62Aと、所定の図形とトレイラIDの位置とが紐づいたトレイラID情報を保存するID情報データベース100からトレイラID情報を取得し、認識した図形がトレイラID情報の図形に該当するか照合する特有図形照合部62Bと、特有図形照合部62Bによる照合結果に基づき、撮影画像からトレイラIDが映る領域を抽出するID領域抽出部62Cと、を備える。
【選択図】図7
図1
図2
図3
図4
図5
図6
図7
図8
図9