IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ あやたかシステム開発株式会社の特許一覧

特許7510221コンテナ番号を認識するための端末、システム、方法及びプログラム
<>
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図1
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図2
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図3
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図4
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図5
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図6
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図7
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図8
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図9
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図10
  • 特許-コンテナ番号を認識するための端末、システム、方法及びプログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-06-25
(45)【発行日】2024-07-03
(54)【発明の名称】コンテナ番号を認識するための端末、システム、方法及びプログラム
(51)【国際特許分類】
   G06V 30/166 20220101AFI20240626BHJP
【FI】
G06V30/166
【請求項の数】 7
(21)【出願番号】P 2023198559
(22)【出願日】2023-11-22
【審査請求日】2023-11-28
【早期審査対象出願】
(73)【特許権者】
【識別番号】523442932
【氏名又は名称】あやたかシステム開発株式会社
(74)【代理人】
【識別番号】100177220
【弁理士】
【氏名又は名称】小木 智彦
(72)【発明者】
【氏名】金子 愼太郎
【審査官】▲柳▼谷 侑
(56)【参考文献】
【文献】特開2016-119059(JP,A)
【文献】特開2021-149736(JP,A)
【文献】中国特許出願公開第104657731(CN,A)
【文献】特表2022-514859(JP,A)
【文献】特開平9-297813(JP,A)
【文献】特開平4-336683(JP,A)
【文献】特開2004-171337(JP,A)
【文献】特開平6-259598(JP,A)
【文献】特開平10-240432(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/166
(57)【特許請求の範囲】
【請求項1】
コンテナ番号を認識するための端末であって、
コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得する取得部と、
取得した前記画像において前記コンテナ番号全体の領域を検知し、当該領域において最上部の文字から最下部の文字までの各文字を検知する検知部と、
前記最上部の文字及び前記最下部の文字の座標から傾きを判定し、当該傾きを補正する傾き補正部と、
検知した前記各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズ補正するサイズ補正部と、
前記サイズを補正した前記各文字を横並びに結合し、前記各文字を前記コンテナ番号として認識する認識部と、
を備える端末。
【請求項2】
認識した前記コンテナ番号を横書きで表示する表示部をさらに備える請求項1に記載の端末。
【請求項3】
前記コンテナ番号全体の領域と、当該領域における各文字とを学習して、学習済みモデルを作成する学習部をさらに備える請求項1に記載の端末。
【請求項4】
前記学習済みモデルに基づいて、取得した前記画像において、前記コンテナ番号全体の領域を推測し、当該領域において、最上部の文字から最下部の文字までの各文字を推測する推測部をさらに備える請求項3に記載の端末。
【請求項5】
コンテナ番号を認識するためのシステムであって、
コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得する取得部と、
取得した前記画像において前記コンテナ番号全体の領域を検知し、当該領域において最上部の文字から最下部の文字までの各文字を検知する検知部と、
前記最上部の文字及び前記最下部の文字の座標から傾きを判定し、当該傾きを補正する傾き補正部と、
検知した前記各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズ補正するサイズ補正部と、
前記サイズを補正した前記各文字を横並びに結合し、前記各文字を前記コンテナ番号として認識する認識部と、
を備えるシステム。
【請求項6】
コンピュータシステムによって実行されるコンテナ番号を認識するための方法であって、
コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得するステップと、
取得した前記画像において前記コンテナ番号全体の領域を検知し、当該領域において最上部の文字から最下部の文字までの各文字を検知するステップと、
前記最上部の文字及び前記最下部の文字の座標から傾きを判定し、当該傾きを補正するステップと、
検知した前記各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズ補正するステップと、
前記サイズを補正した前記各文字を横並びに結合し、前記各文字を前記コンテナ番号として認識するステップと、
を備える方法。
【請求項7】
コンピュータに、
コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得するステップ、
取得した前記画像において前記コンテナ番号全体の領域を検知し、当該領域において最上部の文字から最下部の文字までの各文字を検知するステップ、
前記最上部の文字及び前記最下部の文字の座標から傾きを判定し、当該傾きを補正するステップ、
検知した前記各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズ補正するステップ、
前記サイズを補正した前記各文字を横並びに結合し、前記各文字をコンテナ番号として認識するステップ、
を実行させるコンピュータ読み取り可能なプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテナ番号を認識するための端末、システム、方法及びプログラムに関する。
【背景技術】
【0002】
国際的に流通している海上コンテナには、コンテナ番号と呼ばれる管理用コードが一意的に付され、コンテナ側面に表示されている。コンテナ番号は、コンテナの所有者、シリアル番号、国籍コード、構造区分などを示し、国際的に標準化されている。このため、鉄道、トラック、船舶、航空機などの異なる輸送機関を組み合わせたインターモーダル輸送において、一度も製品をコンテナから出したり荷台やパレットに積み直したりすることなく運ぶことが可能となる。
【0003】
このようなインターモーダル輸送においては、関係者が多岐にわたり複雑なため、コンテナの所在管理を行うことが重要となる。そのため、工場、保税倉庫、バンプール、コンテナヤード、輸送機関、販社倉庫などのコンテナが載置される場所では、コンテナ側面に縦書き又は横書きで表示されたコンテナ番号を読み取ることにより、コンテナの位置やステータスを管理することが可能となる。
【0004】
このため、近年では、コンテナ番号が横書きで表示されたコンテナについては、コンテナ番号が写った画像を取得し、取得した画像を認識して、コンテナ番号を特定する技術が利用されている(特許文献1)。
【0005】
また、従来から、縦書きで表示された文字列が写った画像から、文字列を認識して読み取る技術はある(非特許文献1)。
【先行技術文献】
【特許文献】
【0006】
【文献】国際公開第2022/180701号パンフレット
【非特許文献】
【0007】
【文献】CNETJapan,“縦書きも認識、日本語テキストの抽出に適したウェブサービス3選”,[online],平成29年8月29日,朝日インタラクティブ株式会社,[令和5年10月2日検索],インターネット <URL:https://japan.cnet.com/article/35088018/>
【発明の概要】
【発明が解決しようとする課題】
【0008】
ところで、特許文献1の技術では、コンテナ番号が縦書きで表示されているものは文字認識できないため、作業者が手打ち入力をする必要がある。
【0009】
また、非特許文献1の技術では、縦書の文字列が斜め方向まっすぐである場合、縦書きの文字列を認識することができない。
【0010】
そこで、本発明者らは、文字認識をする際に、文字それぞれを検知する処理を、縦方向の文字数分繰り返すことによって、全ての縦書きの文字を検知すれば、文字が一定方向にまっすぐ揃っていなくても、認識することが可能となることに着目した。
【0011】
本発明は、これらの課題に鑑み、コンテナ番号が縦書きである場合に読み取ることが可能なコンテナ番号を認識するための端末、システム、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0012】
本発明では、以下のような解決手段を提供する。
【0013】
本発明の第1の特徴によれば、コンテナ番号を認識するための端末であって、
コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得する取得部と、
取得した前記画像において、前記コンテナ番号全体の領域を検知し、当該領域において最上部の文字から最下部の文字までの各文字を検知する検知部と、
前記最上部の文字及び前記最下部の文字の座標から傾きを判定し、当該傾きを補正する傾き補正部と、
検知した前記各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズ補正するサイズ補正部と、
前記サイズを補正した前記各文字を横並びに結合し、前記各文字を前記コンテナ番号として認識する認識部と、
を備える端末を提供する。
【0014】
本発明の第1の特徴によれば、コンテナに縦書きでコンテナ番号が表示されていても、コンテナ番号を読み取ることができることから、作業者はコンテナ番号を紙に手書きしたり、端末に入力したりする必要がなくなるため、コンテナに横書きでコンテナ番号が表示されている場合同様、コンテナの所在管理が容易となる。
【0015】
本発明の第2の特徴は、第1の特徴に係る発明であって、
認識した前記コンテナ番号を横書きで表示する表示部をさらに備える端末を提供する。
【0016】
本発明の第2の特徴によれば、コンテナに縦書きでコンテナ番号が表示されていても、端末上では、コンテナ番号が横書きで表示されることから、管理するコンテナすべてのコンテナ番号を横書きに統一して管理することが可能となる。
【0017】
本発明の第3の特徴は、第1の特徴に係る発明であって、
前記コンテナ番号全体の領域と、当該領域における各文字とを学習して、学習済みモデルを作成する学習部をさらに備える端末を提供する。
【0018】
本発明の第3の特徴によれば、コンテナ番号全体の領域特有の特徴量と、当該領域において最上部の文字から最下部の文字までの各文字特有の特徴量とを学習して学習済みモデルを作成することにより、コンテナ番号全体の領域と、当該領域における各文字の自動検出精度を高めることが可能となる。
【0019】
本発明の第4の特徴は、第3の特徴に係る発明であって、
前記学習済みモデルに基づいて、取得した前記画像において、前記コンテナ番号全体の領域を推測し、当該領域において、最上部の文字から最下部の文字までの各文字を推測する推測部をさらに備える端末を提供する。
【0020】
本発明の第5の特徴によれば、定置したカメラ等によって遠目でコンテナ番号全体を含む画像を撮像した場合でも、学習データによって、撮像した画像から文字認識ができることから、さらに正確な文字認識が可能となる。
【0021】
本発明は、端末のカテゴリであるが、システム等の他のカテゴリにおいても、そのカテゴリに応じた同様の作用・効果を発揮する。
【発明の効果】
【0022】
本発明によれば、コンテナ番号が縦書きである場合に読み取ることが可能なコンテナ番号を認識するための端末、システム、方法及びプログラムを提供することが可能となる。
【図面の簡単な説明】
【0023】
図1】本発明の一実施形態であるコンテナ番号を認識するための端末1の概要を説明するための図である。
図2】本実施形態のコンテナ番号を認識するための端末1の構成図である。
図3】本実施形態のコンテナ番号を認識するための端末1が実行するコンテナ番号認識処理のフローチャートである。
図4】本実施形態のコンテナ番号を認識するための端末1が実行する文字検知処理を説明するための図である。
図5】本実施形態のコンテナ番号を認識するための端末1が実行する傾き補正処理を説明するための図である。
図6】本実施形態のコンテナ番号を認識するための端末1が実行するサイズ補正処理のフローチャートである。
図7】本実施形態のコンテナ番号を認識するための端末1が実行する文字認識処理のフローチャートである。
図8】本実施形態のコンテナ番号を認識するための端末1が実行する学習処理を説明するための図である。
図9】本発明の本実施形態の別の態様であるコンテナ番号を認識するためのシステム2の概要を説明するための図である。
図10】本実施形態の別の態様のコンテナ番号を認識するためのシステム2の構成図である。
図11】本実施形態の別の態様のコンテナ番号を認識するためのシステム2が実行するコンテナ番号認識処理のフローチャートである。
【発明を実施するための形態】
【0024】
以下、本発明を実施するための最良の形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
【0025】
[コンテナ番号を認識するための端末1の概要]
本発明の一実施形態であるコンテナ番号を認識するための端末1の概要について、図1に基づいて説明する。図1は、本発明の一実施形態であるコンテナ番号を認識するための端末1の概要を説明するための図である。
【0026】
コンテナ番号を認識するための端末1は、例えば、ハンディターミナル、スマートフォン、タブレット端末等の携帯端末、スマートグラス等のヘッドマウントディスプレイやスマートウォッチといったウェアラブル端末等の端末であり、カメラ等のカラー動画及び/又は静止画等の画像を撮影する撮像デバイスを備える。
【0027】
端末1は、例えば、1台の端末装置で実現されてもよいし、複数の端末装置で実現されてもよく、クラウドコンピュータのように仮想的な装置で実現されてもよい。
【0028】
次に、コンテナ番号を認識するための端末1が実行する処理の概要について説明する。
まず、端末1は、コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得する(ステップS1)。具体的には、端末1は、ユーザーが端末1を用いて撮影したコンテナに表示されたコンテナ番号が写った画像を取得する。
【0029】
次に、端末1は、取得した画像において、コンテナ番号全体の領域100を検知し、当該領域において最上部の文字から最下部の文字までの各文字110を検知する(ステップS2)。具体的には、端末1は、取得した画像に写った縦書きのコンテナ番号全体を含めた領域を検知し、検知した領域内に含まれる文字を最上部から最下部まで1字ずつ検知して画像から抽出する。文字の検知及び抽出方法については、特に限定しない。
【0030】
また、ステップS2において、端末1は、学習済みモデル200に基づいて、取得した画像において、コンテナ番号全体の領域100を推測し、当該領域100において最上部の文字から最下部の文字までの各文字110を推測してもよい。具体的には、端末1は、予め機械学習して作成した学習済みモデル200に基づいて、取得した画像に写っているコンテナ番号全体の領域100を推測して抽出し、抽出した画像に含まれる各文字110を推測する。コンテナ番号全体の領域100及び各文字110の推測方法と抽出方法については、特に限定しない。機械学習については後述する。
【0031】
ステップS2においては、端末1は、学習済みモデル200と検知結果又は推測結果に基づいて、検知又は推測したコンテナ番号全体の領域100特有の特徴量と、検知又は推測した各文字110特有の特徴量とを、機械学習によって再学習させて、学習済みモデル200を更新してもよい。尚、この機械学習による再学習は、ステップS2以降であれば、いずれのタイミングで行なってもよいし、端末1がユーザーからの入力を受け付けることによって行ってもよい。機械学習については後述する。
【0032】
次に、端末1は、最上部の文字及び最下部の文字の座標から傾きを判定し、当該傾きを補正する(ステップS3)。具体的には、端末1は、最上部の文字と最下部の文字からコンテナ番号の文字列の傾きを求め、文字列の中心を原点とした二次元座標において、文字列が垂直に縦並びとなるように文字列を補正する。
【0033】
次に、端末1は、検知した各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズを補正する(ステップS4)。具体的には、端末1は、認識した各文字の高さの平均値を算出し、各文字の高さが平均値となるように各文字を拡大又は縮小する。
【0034】
次に、端末1は、サイズを補正した各文字を横並びに結合し、コンテナ番号を認識する(ステップS5)。具体的には、端末1は、サイズを補正した縦並びの文字列を転置することによって、文字列を横並びにし、各文字を文字データとして認識する。端末1は、認識した文字データを、自身の表示部17に横書きで出力してもよい。尚、文字データの認識方法については、特に限定されない。
【0035】
以上が、コンテナ番号を認識するための端末1が実行する処理の概要である。
【0036】
[コンテナ番号を認識するための端末1のシステム構成]
図2に基づいて、本実施形態のコンテナ番号を認識するための端末1のシステム構成について説明する。
【0037】
端末1は、例えば、1台の端末装置で実現されてもよいし、複数の端末装置で実現されてもよい。
【0038】
端末1は、例えば、ハンディターミナル、スマートフォン、タブレット端末等の携帯端末、スマートグラス等のヘッドマウントディスプレイやスマートウォッチといったウェアラブル端末等の端末であり、カメラ等のカラー動画及び/又は静止画等の画像を撮影する撮像デバイスを備える。
【0039】
端末1は、制御部及び処理部として、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を備えており、制御部は、後述の処理部、撮像部、通信部、入力部、出力部、記憶部に実行命令を出し、処理部は、データの計算を行い、計算結果の判定などを行う。
【0040】
撮像部は、動画及び/又は静止画等の画像を撮影するためのデバイスを備える。カラー画像が撮影できれば、特に限定されない。
【0041】
端末1は、通信部として、他の端末や装置等と通信可能にするためのデバイスを備える。通信方式は、無線であっても有線であってもよい。
【0042】
端末1は、入力部として、ユーザーが端末1を操作するために必要な機能を備えるものとする。入力を実現するための例として、タッチパネル機能を実現する液晶ディスプレイ、キーボード、マウス、ペンタブレット、装置上のハードウェアボタン、音声認識を行うためのマイク等を備えることが可能である。入力方法により、本発明は特に機能が限定されるものではない。
【0043】
端末1は、出力部として、ユーザーが端末1を操作するために必要な機能を備えるものとする。出力を実現するための例として、液晶ディスプレイ、PCのディスプレイ、プロジェクター等の表示部17への投影等の表示と、音声出力等の形態が考えられる。出力方法により、本発明は特に機能が限定されるものではない。
【0044】
端末1は、記憶部として、ハードディスクや半導体メモリ、記録媒体、メモリカード等によるデータのストレージを備える。データの保存先は、クラウドサービスやデータベース等であってもよい。
【0045】
制御部は、処理部と協働して取得部10、検知部11、傾き補正部12,サイズ補正部13、認識部14、推測部15、学習部16を実現する。
【0046】
以上が、コンテナ番号を認識するための端末1のシステム構成である。
【0047】
[コンテナ番号認識処理]
図3に基づいて、コンテナ番号を認識するための端末1が実行するコンテナ番号認識処理について説明する。図3は、コンテナ番号を認識するための端末1が実行するコンテナ番号認識処理のフローチャートを示す図である。コンテナ番号認識処理は、図3に示すように、ステップS11~S15で構成され、上述のステップS1~S5に対応する。
【0048】
まず、端末1の取得部10は、コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得する(ステップS11)。具体的には、取得部10は、ユーザーが端末1の撮像部を用いて撮影したコンテナに表示されたコンテナ番号が写った画像を取得する。画像は、カラー画像であれば、動画でも静止画でもよい。
【0049】
次に、端末1の検知部11は、取得した画像においてコンテナ番号全体の領域100を検知し、当該領域において最上部の文字から最下部の文字までの各文字110を検知する(ステップS12)。具体的には、図4に示すように、検知部11は、ステップS11で取得した画像に写った縦書きのコンテナ番号全体を含めた矩形領域100を検知し、検知した領域内に含まれる文字を最上部から最下部まで1字ずつ検知し、各文字110が全体に及ぶように矩形状に囲んで抽出、つまり各文字110を含む矩形状の画像を抽出する。文字の検知及び抽出方法については、特に限定しない。本実施形態では、領域100を矩形で検知しているが、他の形状で検知してもよい。また、各文字110を矩形状で囲んでいるが、他のいかなる形状で囲んでもよい。
【0050】
また、ステップS12において、端末1の推測部15は、端末1の記憶部に記憶される学習済みモデル200に基づいて、取得した画像において、コンテナ番号全体の矩形領域100を推測し、当該矩形領域100において最上部の文字から最下部の文字までの各文字110を推測してもよい。具体的には、端末1の推測部15は、予め機械学習して作成した学習済みモデル200に基づいて、取得した画像に写っているコンテナ番号全体の矩形状に囲んだ領域100を推測して抽出し、抽出した画像に含まれる各文字110を含む区名城の画像を推測する。機械学習の種類や方法については、特に問わない。コンテナ番号全体の領域100及び各文字110の推測方法と抽出方法については、特に限定しない。機械学習については後述する。
【0051】
ステップS12においては、端末1の学習部16は、学習済みモデル200と検知結果又は推測結果に基づいて、検知又は推測したコンテナ番号全体の領域100特有の特徴量と、検知又は推測した各文字110特有の特徴量とを、機械学習によって再学習させて、学習済みモデル200を更新してもよい。尚、この機械学習による再学習は、ステップS12以降であれば、いずれのタイミングで行なってもよいし、端末1がユーザーからの入力を受け付けることによって行ってもよい。機械学習については後述する。
【0052】
次に、端末1の傾き補正部12は、最上部の文字及び最下部の文字の座標から傾きを判定し、当該傾きを補正する(ステップS13)。具体的には、図5に示すように、傾き補正部12は、ステップS12で抽出した最上部文字を含む矩形画像の中心C1と、最下部文字を含む矩形画像の中心C2と、文字列の中心C0とを特定し、文字列の中心C0を原点(0,0)とした二次元座標XYにおいて、最上部文字のC1の座標(X1,Y1)と、最下部文字のC2の座標(X2,Y2)を求める。そして、最上部文字のC1と最下部文字のC2を直線で結んで、直線の傾きmを求めることにより、文字列の中心C0、すなわち原点(0,0)を通る垂線を求める。これにより、最上部文字列のC1の座標が(0,Y1’)、最下部文字の中心C2の座標が(0,Y2’)となり、その結果、傾いた縦書きの文字列が、まっすぐ縦書きの文字列に補正される。
【0053】
次に、端末1のサイズ補正部13は、検知した各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズを補正する(ステップS14)。具体的には、図6に示すように、サイズ補正部13は、ステップS13で補正した縦書きの文字列において、各文字を囲んだ矩形の高さを画素数で測定し、測定した各文字の矩形高さの平均値を算出する。そして、各文字の高さが平均値となるように各文字の矩形画像を拡大又は縮小する。
【0054】
次に、端末1の認識部14は、サイズを補正した各文字を横並びに結合し、コンテナ番号を認識する(ステップS15)。具体的には、図7に示すように、認識部14は、ステップS14でサイズを補正した縦並びの文字列を、行から列に転置することによって、文字列を横並びにした後、各文字を文字データとして認識する。端末1の出力部は、認識した文字データを、表示部17に横書きで出力してもよい。尚、文字データの認識方法については、特に限定されない。
【0055】
以上が、コンテナ番号認識処理である。
【0056】
[学習処理]
図8に基づいて、コンテナ番号を認識するための端末1が実行する学習処理について説明する。図8は、コンテナ番号を認識するための端末1が実行する学習処理のフローチャートを示す図である。
【0057】
端末1の取得部10は、学習用画像を取得する(ステップS31)。具体的には、取得部10は、撮影したコンテナに表示されたコンテナ番号が写った画像を取得する。画像は、カラー画像であれば、動画でも静止画でもよい。尚、学習用画像は、別の端末、コンピュータ又は装置からデータ通信等を介して取得してもよい。
【0058】
端末1の学習部16は、取得した学習用画像を解析する(ステップS32)。具体的には、学習部16は、取得した画像に写った縦書きのコンテナ番号全体を含めた矩形領域100を検知して画像解析し、当該矩形領域100に特有の特徴量を抽出する。さらに、検知した矩形領域100内に含まれる文字を最上部から最下部まで1字ずつ検知して画像解析し、各文字110に特有の特徴量を抽出する。なお、学習部16は、端末1の入力部がユーザーからの入力を受け付けることによって、取得した学習用画像の解析を実行してもよい。
【0059】
端末1の学習部16は、解析結果に基づいて、機械学習を実行する(ステップS33)。具体的には、学習部16は、機械学習として、ステップS32で抽出した特徴量を教師とした教師あり学習を実行する。ステップS32で抽出した特徴量は、多層構造のニューラルネットワークによって自動的に定義して学習する深層学習(ディープラ-ニング)で学習してもよい。
【0060】
端末1の学習部16は、学習結果に基づいて、コンテナ番号認識用学習済みモデル200を作成する(ステップS34)。具体的には、学習部16は、学習した矩形領域100特有の特徴量と各文字110特有の特徴量を組み込んだコンテナ番号認識用の学習済みモデル200を作成する。
【0061】
端末1の学習部16は、作成した学習済みモデル200を、自身の記憶部に記憶する(ステップS35)。
【0062】
以上が、学習処理である。
【0063】
コンテナ番号を認識するための端末1によれば、コンテナに縦書きでコンテナ番号が表示されていても、コンテナ番号を読み取ることができることから、作業者はコンテナ番号を紙に手書きしたり、端末に入力したりする必要がなくなるため、コンテナに横書きでコンテナ番号が表示されている場合同様、コンテナの所在管理が容易となる。
【0064】
また、コンテナ番号を認識するための端末1によれば、コンテナに縦書きでコンテナ番号が表示されていても、端末上では、コンテナ番号が横書きで表示されることから、管理するコンテナすべてのコンテナ番号を横書きに統一して管理することが可能となる。
【0065】
また、コンテナ番号を認識するための端末1によれば、コンテナ番号全体の領域100と、当該領域100において最上部の文字から最下部の文字までの各文字110とを学習して学習済みモデル200を作成することにより、コンテナ番号全体の領域100と、当該領域における各文字110の自動検出精度を高めることが可能となる。
【0066】
さらに、コンテナ番号を認識するための端末1によれば、定置したカメラ等によって遠目でコンテナ番号全体を含む画像を撮像した場合でも、学習データによって、撮像した画像から文字認識ができることから、さらに正確な文字認識が可能となる。
【0067】
[本実施形態の別の態様]
[コンテナ番号を認識するためのシステム2の概要]
本発明の本実施形態の別の態様であるコンテナ番号を認識するためのシステム2の概要について、図9に基づいて説明する。図9は、本発明の本実施形態の別の態様であるコンテナ番号を認識するためのシステム2の概要を説明するための図である。なお、上述の一態様と同一の機能及び構成については同一の符号を付し、説明を省略する。本態様が上述の一態様と異なるのは、コンピュータ3と撮像装置4で構成されたコンテナ番号を認識するためのシステム2である点である。
【0068】
コンテナ番号を認識するためのシステム2は、上述したように、コンピュータ3と撮像装置4で構成される。
【0069】
コンピュータ3は、例えば、デスクトップパソコンやノートパソコンやサーバ等のコンピュータ、スマートフォンやタブレット端末等の携帯端末、スマートグラス等のヘッドマウントディスプレイやスマートウォッチといったウェアラブル端末等である。
【0070】
コンピュータ3は、例えば、1台の端末装置で実現されてもよいし、複数の端末装置で実現されてもよく、クラウドコンピュータのように仮想的な装置で実現されてもよい。
【0071】
撮像装置4は、例えば、動画及び/又は静止画等の画像を撮影するカメラであり、カラー画像が撮影できれば、特に限定されない。
【0072】
コンピュータ3と撮像装置4とは、公衆回線網等を介して、データ通信可能に接続されており、必要なデータや情報の送受信を実行する。
【0073】
次に、コンテナ番号を認識するためのシステム2が実行する処理の概要について説明する。
まず、コンピュータ3は、コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得する(ステップS6)。具体的には、コンピュータ3は、ユーザーが撮像装置4を用いて撮影したコンテナに表示されたコンテナ番号が写った画像を撮像装置4から取得する。
【0074】
次に、コンピュータ3は、取得した画像においてコンテナ番号全体の領域を検知し、当該領域において最上部の文字から最下部の文字までの各文字を検知する(ステップS7)。本ステップは、上述の一態様のステップS2と同様の処理であるが、コンピュータ3が端末1の代わりに処理を実施する点で異なる。
【0075】
次に、コンピュータ3は、最上部の文字及び最下部の文字の座標から傾きを判定し、当該傾きを補正する(ステップS8)。本ステップは、上述の一態様のステップS3と同様の処理であるが、コンピュータ3が端末1の代わりに処理を実施する点で異なる。
【0076】
次に、コンピュータ3は、検知した各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズを補正する(ステップS9)。本ステップは、上述の一態様のステップS4と同様の処理であるが、コンピュータ3が端末1の代わりに処理を実施する点で異なる。
【0077】
次に、コンピュータ3は、サイズを補正した各文字を横並びに結合し、コンテナ番号を認識する(ステップS10)。本ステップは、上述の一態様のステップS5と同様の処理であるが、コンピュータ3が端末1の代わりに処理を実施する点で異なる。
【0078】
以上が、コンテナ番号を認識するためのシステム2が実行する処理の概要である。
【0079】
[コンテナ番号を認識するためのシステム2のシステム構成]
図10に基づいて、上述の一態様のコンテナ番号を認識するためのシステム2のシステム構成について説明する。
【0080】
コンピュータ3は、例えば、デスクトップパソコンやノートパソコンやサーバ等のコンピュータ、スマートフォンやタブレット端末等の携帯端末、スマートグラス等のヘッドマウントディスプレイやスマートウォッチといったウェアラブル端末等である。
【0081】
コンピュータ3は、例えば、1台の端末装置で実現されてもよいし、複数の端末装置で実現されてもよく、クラウドコンピュータのように仮想的な装置で実現されてもよい。
【0082】
コンピュータ3は、制御部及び処理部として、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を備えており、制御部は、後述の処理部、通信部、入力部、出力部、記憶部に実行命令を出し、処理部は、データの計算を行い、計算結果の判定などを行う。
【0083】
コンピュータ3は、通信部として、他の端末や装置等と通信可能にするためのデバイスを備える。通信方式は、無線であっても有線であってもよい。
【0084】
撮像装置4は、例えば、動画及び/又は静止画等の画像を撮影するカメラであり、カラー画像が撮影できれば、特に限定されない。
【0085】
コンピュータ3は、入力部として、ユーザーが端末1を操作するために必要な機能を備えるものとする。入力を実現するための例として、タッチパネル機能を実現する液晶ディスプレイ、キーボード、マウス、ペンタブレット、装置上のハードウェアボタン、音声認識を行うためのマイク等を備えることが可能である。入力方法により、本発明は特に機能が限定されるものではない。
【0086】
コンピュータ3は、出力部として、ユーザーが端末1を操作するために必要な機能を備えるものとする。出力を実現するための例として、液晶ディスプレイ、PCのディスプレイ、プロジェクター等の表示部17への投影等の表示と、音声出力等の形態が考えられる。出力方法により、本発明は特に機能が限定されるものではない。
【0087】
コンピュータ3は、記憶部として、ハードディスクや半導体メモリ、記録媒体、メモリカード等によるデータのストレージを備える。データの保存先は、クラウドサービスやデータベース等であってもよい。
【0088】
制御部は、処理部と協働して取得部10、検知部11、傾き補正部12,サイズ補正部13、認識部14、推測部15、学習部16を実現する。
【0089】
撮像装置4は、制御部として、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を備えており、制御部は、後述の処理部、撮像部、通信部、入力部、出力部、記憶部に実行命令を出し、処理部は、データの計算を行い、計算結果の判定などを行う。
【0090】
撮像装置4は、例えば、動画及び/又は静止画等の画像を撮影するために必要な機能を備えるものとし、カラー画像が撮影できれば、特に限定されない。
【0091】
撮像装置4は、通信部として、他の端末や装置等と通信可能にするためのデバイスを備える。通信方式は、無線であっても有線であってもよい。
【0092】
撮像装置4は、入力部として、ユーザーが撮像装置4を操作するために必要な機能を備えるものとする。入力を実現するための例として、タッチパネル機能を実現する液晶ディスプレイ等を備えることが可能である。入力方法により、本発明は特に機能が限定されるものではない。
【0093】
撮像装置4は、出力部として、ユーザーが撮像装置4を操作するために必要な機能を備えるものとする。出力を実現するための例として、液晶ディスプレイ等の形態が考えられる。出力方法により、本発明は特に機能が限定されるものではない。
【0094】
撮像装置4は、記憶部として、ハードディスクや半導体メモリ、記録媒体、メモリカード等によるデータのストレージを備える。データの保存先は、クラウドサービスやデータベース等であってもよい。
【0095】
コンピュータ3と撮像装置4とは、公衆回線網等を介して、データ通信可能に接続されており、必要なデータや情報の送受信を実行する。
【0096】
以上が、コンテナ番号を認識するためのシステム2のシステム構成である。
【0097】
[コンテナ番号認識処理]
コンテナ番号を認識するためのシステム2が実行するコンテナ番号認識処理について説明する。図11は、コンテナ番号を認識するためのシステム2が実行するコンテナ番号認識処理のフローチャートを示す図である。コンテナ番号認識処理は、図11に示すように、ステップS21~S25で構成され、上述のステップS6~S10に対応する。
【0098】
まず、コンピュータ3の取得部10は、コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得する(ステップS21)。具体的には、取得部10は、ユーザーが撮像装置4を用いて撮影したコンテナに表示されたコンテナ番号が写った画像を撮像装置4から取得する。上述の一態様とは、コンピュータ3が、ユーザーが撮像装置4を用いて撮影したコンテナに表示されたコンテナ番号が写った画像を取得する点が異なる取得部10は、撮像装置4が撮影した画像を、コンピュータ3の通信部により通信網を介して取得してもよいし、外部メディアにより記憶部に格納されることにより取得してもよい。
【0099】
次に、コンピュータ3の検知部11は、取得した画像においてコンテナ番号全体の領域を検知し、当該領域において最上部の文字から最下部の文字までの各文字を検知する(ステップS22)。本ステップは、上述の一態様のステップS12と同様の処理であるが、コンピュータ3が端末1の代わりに処理を実施する点で異なる。
【0100】
次に、コンピュータ3の傾き補正部12は、最上部の文字及び最下部の文字の座標から傾きを判定し、当該傾きを補正する(ステップS23)。本ステップは、上述の一態様のステップS13と同様の処理であるが、コンピュータ3が端末1の代わりに処理を実施する点で異なる。
【0101】
次に、コンピュータ3のサイズ補正部13は、検知した各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズを補正する(ステップS24)。本ステップは、上述の一態様のステップS14と同様の処理であるが、コンピュータ3が端末1の代わりに処理を実施する点で異なる。
【0102】
次に、コンピュータ3の認識部14は、サイズを補正した各文字を横並びに結合し、コンテナ番号を認識する(ステップS25)。本ステップは、上述の一態様のステップS15と同様の処理であるが、コンピュータ3が端末1の代わりに処理を実施する点で異なる。
【0103】
以上が、コンテナ番号認識処理である。
【0104】
[学習処理]
コンテナ番号を認識するためのシステム2が実行する学習処理については、上述の一態様とは、コンピュータ3が、ユーザーが撮像装置4を用いて撮影したタイヤのシリアル番号の全体像が写った画像を取得する点が異なるのみであるため、説明を省略する。
【0105】
コンテナ番号を認識するためのシステム2によれば、上述の一態様同様、コンテナに縦書きでコンテナ番号が表示されていても、コンテナ番号を読み取ることができることから、作業者はコンテナ番号を紙に手書きしたり、端末に入力したりする必要がなくなるため、コンテナに横書きでコンテナ番号が表示されている場合同様、コンテナの所在管理が容易となる。
【0106】
また、コンテナ番号を認識するためのシステム2によれば、上述の一態様同様、コンテナに縦書きでコンテナ番号が表示されていても、端末上では、コンテナ番号が横書きで表示されることから、管理するコンテナすべてのコンテナ番号を横書きに統一して管理することが可能となる。
【0107】
また、コンテナ番号を認識するためのシステム2によれば、上述の一態様同様、コンテナ番号全体の領域100と、当該領域100において最上部の文字から最下部の文字までの各文字110とを学習して学習済みモデル200を作成することにより、コンテナ番号全体の領域100と、当該領域における各文字110の自動検出精度を高めることが可能となる。
【0108】
また、コンテナ番号を認識するためのシステム2によれば、上述の一態様同様、定置したカメラ等によって遠目でコンテナ番号全体を含む画像を撮像した場合でも、学習データによって、撮像した画像から文字認識ができることから、さらに正確な文字認識が可能となる。
【0109】
さらに、コンテナ番号を認識するための端末1の代わりに、上述の一態様同様とは異なり、コンテナ番号を認識するためのシステムとして、デスクトップパソコン、ノートパソコン、サーバ等のコンピュータ3と、カラー動画及び/又は静止画等の画像を撮影するカメラ等の撮像装置4とで実現できることから、一定の場所に撮像装置4を設置することによって、その場所にコンテナが載置又は通過するなどした際に、遠隔操作により、コンテナ番号を含む領域100を撮影した画像を、コンピュータ3が取得してコンテナ番号を認識することができ、ユーザーが一定場所に出向く手間と時間を省くことが可能となる。
【0110】
上述した手段、機能は、コンピュータ(CPU、情報処理装置、各種端末を含む)が、所定のプログラムを読み込んで、実行することによって実現される。プログラムは、例えば、単数又は複数の端末からネットワーク経由で提供される(クラウドサービス、SaaS:ソフトウェア・アズ・ア・サービス)形態で提供される。また、プログラムは、例えば、コンピュータが読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体からプログラムを読み取って内部記録装置又は外部記録装置に転送し記録して実行する。また、そのプログラムを、例えば、磁気ディスク、光ディスク、光磁気ディスク等の記録装置(記録媒体)に予め記録しておき、その記録装置から通信回線を介して端末に提供するようにしてもよい。
【0111】
以上、本発明の実施形態について説明したが、本発明は上述したこれらの実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
【符号の説明】
【0112】
1 端末、2 システム、3 コンピュータ、4 撮像装置、10 取得部、11 検知部、12 傾き補正部、13 サイズ補正部、14 認識部、15 推測部、16 学習部、17 表示部、100 領域、110 各文字、200 学習済みモデル
【要約】      (修正有)
【課題】コンテナ番号が縦書きである場合に読み取って認識する端末、システム、方法及びプログラムを提供する。
【解決手段】コンテナ番号を認識するための端末1は、コンテナに表示された縦書きのコンテナ番号全体を含む画像を取得する取得部と、取得した前記画像において前記コンテナ番号全体の領域を検知し、当該領域において最上部の文字から最下部の文字までの各文字を検知する検知部と、前記最上部の文字及び前記最下部の文字の座標から傾きを判定し、当該傾きを補正する傾き補正部と、検知した前記各文字のサイズの平均値を算出し、当該平均値に前記各文字のサイズに補正するサイズ補正部と、前記サイズを補正した前記各文字を横並びに結合し、前記各文字を前記コンテナ番号として認識する認識部と、を備える。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11