(58)【調査した分野】(Int.Cl.,DB名)
前記合成部は、前記複数の画像データそれぞれを処理対象データとして、光の当たり方に応じて、前記処理対象データの一部のデータである部分データを抽出し、抽出された部分データを合成して前記合成データを生成する
請求項4に記載の文字認識装置。
【発明を実施するための形態】
【0009】
実施の形態1.
実施の形態1では、電力量計50の名板51に示された文字情報を認識する文字認識装置10について説明する。しかし、文字認識装置10は、電力量計50に示された文字情報に限らず、ガス、水道等の使用量計に示された文字情報を認識する装置であってもよいし、他の対象物に示された文字情報を認識する装置であってもよい。
【0010】
***構成の説明***
図1から
図3を参照して、実施の形態1に係る文字認識装置10の構成を説明する。
図1に示すように、文字認識装置10は、撮影装置20と計算機30とを備える。
撮影装置20と計算機30とは、ケーブルを介して接続され、通信可能になっている。なお、撮影装置20と計算機30とは、通信可能であればよく、無線ネットワークといった他の手段によって接続されていてもよい。
【0011】
図1に示すように、撮影装置20は、筐体21と、画像取得装置22と、光源23と、治具24とを備える。
筐体21は、正面211側が開口している。画像取得装置22は、筐体21の背面212側に、正面211の方の画像データを取得するように設けられる。画像取得装置22は、具体例としては、カメラである。光源23は、筐体21の側面213に、筐体21の内側の方向、かつ、正面211の開口面と平行な方向を光軸が向くように配置される。光源23は、具体例としては、LED、電球である。治具24は、筐体21の正面211側の上側の側面213に、筐体21の正面211側の先端から突出して設けられる。
【0012】
図2に示すように、筐体21は、側面213が光を透過、拡散させる透過拡散素材で形成された内層214と、外部の光を遮断する遮断素材で形成された外層215とを有する。透過拡散素材は、具体例としては、白色のアクリル板である。遮断素材は、具体例としては、黒色のアクリル板である。内層214と外層215とは、正面から見た場合に四隅に配置された、不透明な素材で形成された支柱216により互いに固定される。
図2では、筐体21の下側の側面213に光源23であるLEDが設けられている。
図2では、6個のLEDが、下側の側面213に横一列に並べて上向きに配置されている。各LEDから放射された光は、透過拡散素材で形成された内層214で反射を繰り返し、電力量計50の表面に照射される。
筐体21の下側にはスペーサ217が設けられ、スペーサ217によって空けられた隙間からケーブル218が筐体21内に挿入され、光源23であるLEDに接続される。
なお、
図2では、画像取得装置22が省略されている。また、
図2には、筐体21の各部の寸法が示されている。現状の電力量計50に対しては、この寸法にすることにより、文字認識の精度を高めることができるが、この寸法に限定されることなく、対象物の寸法に応じて適宜設計すればよい。
【0013】
図3に示すように、計算機30は、ハードウェア構成として、プロセッサ31と、記憶装置32と、インタフェース33とを備える。プロセッサ11は、信号線を介して他のハードウェアである記憶装置32及びインタフェース33と接続され、これら他のハードウェアを制御する。
プロセッサ31は、プロセッシングを行うIC(Integrated Circuit)である。プロセッサ11は、具体例として、CPU(Central Processing Unit)である。
記憶装置32は、メモリ321と、ストレージ322とを備える。メモリ321は、具体例としては、RAM(Random Access Memory)である。ストレージ322は、具体例としては、HDD(Hard Disk Drive)である。また、ストレージ322は、SD(Secure Digital)メモリカード、CF(CompactFlash)、NANDフラッシュ、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ(登録商標)ディスク、DVDといった可搬記憶媒体であってもよい。
インタフェース33は、撮影装置20といった外部装置を接続するための装置である。インタフェース33は、具体例としては、USB(Universal Serial Bus)、HDMI(登録商標,High−Definition Multimedia Interface)のポートである。
【0014】
計算機30は、機能構成として、名板抽出部41と、文字認識部42と、情報蓄積部43とを備える。文字認識部42は、メータ値取得部421と、情報取得部422とを備える。
名板抽出部41と、文字認識部42と、情報蓄積部43と、メータ値取得部421と、情報取得部422との各部の機能は、ソフトウェアによって実現される。記憶装置32のストレージ322には、計算機30の各部の機能を実現するプログラムが記憶されている。このプログラムは、プロセッサ31によりメモリ321に読み込まれ、プロセッサ31によって実行される。これにより、計算機30の各部の機能が実現される。
なお、計算機30の各部の機能のうち一部又は全部は、ハードウェアによって実現されてもよい。この場合、その機能は、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックIC、GA(Gate Array)、ASIC(Application Specific Integrated Circuit)、FPGA(Field−Programmable Gate Array)によって実現される。
【0015】
***動作の説明***
図1、
図4及び
図5を参照して、実施の形態1に係る文字認識装置10の動作を説明する。
図1及び
図4を参照して、実施の形態1に係る撮影装置20の動作を説明する。
図1に示すように、撮影装置20は、筐体21の正面211側が電力量計50側に向けられ、治具24が電力量計50の上に乗せられる。そして、撮影装置20の筐体21の正面211側の先端部分で、電力量計50の周囲を囲うように撮影装置20が設置される。この状態で、利用者から画像取得指示が入力されると、光源23が点灯し、画像取得装置22により電力量計50の画像データを取得する。すると、
図4に示すような画像データが取得される。
【0016】
図5を参照して、実施の形態1に係る計算機30の動作を説明する。
図5に示す処理は、撮影装置20により画像データが取得されると開始される。
【0017】
ステップS11の名板抽出処理では、名板抽出部41は、画像取得装置22により取得された画像データにおける名板51領域部分の名板データを抽出する。
具体的には、名板抽出部41は、予め定められストレージ322に記憶された輝度範囲にある画像データ中の画素群のうち、最大の領域の画素群を名板データとして抽出する。又は、名板抽出部41は、予め定められストレージ322に記憶された名板51の参照画像とパターンマッチングを行い、類似度が最も高い領域の画素群を名板データとして抽出する。
【0018】
ステップS12のカウンタ抽出処理では、文字認識部42のメータ値取得部421は、ステップS11で抽出された名板データにおける、メータ数値が示されたカウンタ領域部分のカウンタデータを抽出する。
具体的には、メータ値取得部421は、黒の画素を多く有する領域を複数個所検出し、検出された領域のうちカウンタとして尤度が高い領域の画素群をカウンタデータとして抽出する。メータ値取得部421は、検出された領域についてのカウンタとしての尤度を、名板51における領域の位置と、カウンタの参照画像とのパターンマッチングとの少なくともいずれかにより行う。
【0019】
ステップS13の数字検出処理では、メータ値取得部421は、ステップS12で抽出されたカウンタデータから数値領域を検出する。
具体的には、メータ値取得部421は、カウンタデータの右側の領域から、数字文字の領域を検出することにより、最も小さい桁の数値の領域を検出する。カウンタの中には、最も下の位の値の領域だけが他の位の値の領域と異なり、白地に黒文字の場合がある。そのため、メータ値取得部421は、黒地に白文字の場合と、白地に黒文字の場合との両方の場合について検出を行う。そして、メータ値取得部421は、検出された最も小さい桁の数値の領域から左側に順に文字領域を検出する。
メータ値取得部421は、各画素についてXY座標軸にヒストグラムを計算し、立ち上がりを検出する射影変換法と、白文字及び黒文字の連結成分を抽出する連結成分分析といった手法を用いて文字領域を検出する。
【0020】
ステップS14のメータ値認識処理では、メータ値取得部421は、ステップS13で検出された領域から文字認識することにより、メータ値を取得する。情報蓄積部43は、取得されたメータ値をストレージ322に書き込む。
具体的には、メータ値取得部421は、予め定められストレージ322に記憶された数値画像とのパターンマッチングといった手法により文字認識を実現する。
【0021】
ステップS15の単位検出処理では、文字認識部42の情報取得部422は、ステップS11で抽出された名板データにおける、各情報についての単位を検出する。
具体的には、情報取得部422は、予め定められストレージ322に記憶された単位画像とのパターンマッチングといった手法により単位を検出する。
【0022】
ステップS16の文字検出処理では、情報取得部422は、ステップS15で検出された単位の周辺の文字領域を検出する。
具体的には、情報取得部422は、ステップS15で検出された単位の周辺の領域について、ステップS13と同様の手法を用いて文字領域を検出する。
【0023】
ステップS17の文字認識処理では、情報取得部422は、ステップS16で検出された領域から文字認識することにより、名板51に示された文字情報を取得する。情報蓄積部43は、取得された文字情報を、ステップS14で取得されたメータ値と関連付けてストレージ322に書き込む。
具体的には、メータ値取得部421は、予め定められストレージ322に記憶された数値画像及び文字画像とのパターンマッチングといった手法により文字認識を実現する。パターンマッチングに用いられる画像は、電力量計50に示される情報に応じて予め用意してストレージ322に記憶しておけばよい。
【0024】
***実施の形態1の効果***
以上のように、実施の形態1に係る文字認識装置10は、光源23が筐体21の側面213に、筐体21の内側の方向、かつ、正面211の開口面と平行な方向を光軸が向くように配置される。そのため、光源23から放射された光は、透過拡散素材で掲載された内層214で反射を繰り返し、電力量計50の表面に一様に照射される。
その結果、撮影装置20により取得された画像データには、名板51部分への光が当たっていない、あるいは、光源23が映りこんでしまい、いわゆる白飛びしているといった状況が生じにくく、文字認識の精度が高くなる。
【0025】
実施の形態2.
実施の形態2は、光源23が移動可能になっている点が実施の形態1と異なる。実施の形態2では、この異なる点を説明する。
【0026】
***構成の説明***
図6を参照して、実施の形態2に係る撮影装置20の構成を説明する。
撮影装置20は、
図1に示す構成に加え、移動装置25を備える。
移動装置25は、光源23を筐体21の前後方向(
図6のX方向)に移動させる。移動装置25は、具体例としては、光源23に取り付けられたラックアンドピニオン、又は、ボールねじとレールとモータとにより構成された機構である。
【0027】
***動作の説明***
図6及び
図7を参照して、実施の形態2に係る撮影装置20の動作を説明する。
実施の形態1に係る撮影装置20と同様に、画像取得装置22により電力量計50の画像データが取得される。この場合、電力量計50の名板51と、画像取得装置22と、光源23との位置関係によっては、
図7に示すように、光源23から放射された光が画像データに映りこんでしまう可能性がないとは言えない。
図7では、光が映りこんだ部分がハッチングで示されている。
そこで、光源23から放射された光が画像データに映りこんでしまった場合には、利用者からの指示に応じて移動装置25が動作し、光源23を移動させる。そして、光源23が移動された後に、再び実施の形態1に係る撮影装置20と同様に、画像取得装置22により電力量計50の画像データが取得される。これにより、
図4に示すような画像データが取得される。
なお、利用者による指示は、撮影装置20のボタン等を直接操作して入力されてもよいし、計算機30を介して入力されてもよい。
【0028】
***実施の形態2の効果***
以上のように、実施の形態2に係る文字認識装置10は、光源23を移動させることにより、電力量計50の名板51と、画像取得装置22と、光源23との位置関係を変える。これにより、光源23から放射された光が画像データに映りこむことを防止できる。その結果、文字認識の精度が高くなる。
【0029】
実施の形態3.
実施の形態3は、光源23の位置を制御する機能を有する点が実施の形態2と異なる。実施の形態3では、この異なる点を説明する。
【0030】
***構成の説明***
図8を参照して、実施の形態3に係る計算機30の構成を説明する。
計算機30は、
図3に示す構成に加え、移動制御部44を備える。移動制御部44の機能は、他の機能と同様にソフトウェアにより実現されても、ハードウェアにより実現されてもよい。
移動制御部34は、画像データを取得する対象物である電力量計50の名板51に対する光の当たり方に応じて、移動装置25を制御して光源23の位置を設定する。
【0031】
***動作の説明***
図9を参照して、実施の形態3に係る計算機30の動作を説明する。
ステップS31の処理は、
図5のステップS11の処理と同じである。ステップS35からステップS40の処理は、
図5のステップS12からステップS17の処理と同じである。
【0032】
ステップS32の画像判定処理では、移動制御部44は、ステップS31で抽出された名板データに対する光の当たり方が適正であるか否かを判定する。
具体的には、移動制御部44は、名板データにおける輝度の分散を計算し、計算された分散が閾値以下であるか否かを判定する。移動制御部44は、分散が閾値以下である場合には、光の当たり方が適正であると判定し、分散が閾値より高い場合には、光の当たり方が不適正であると判定する。
【0033】
ステップS33の分岐処理では、移動制御部44は、ステップS32で光の当たり方が適正であると判定された場合には、処理をステップS35に進める。一方、ステップS32で光の当たり方が不適正であると判定された場合には、処理をステップS34に進める。
【0034】
ステップS34の光源移動処理では、移動制御部44は、光源23を移動させる。
具体例としては、移動制御部44は、初期状態として光源23を筐体21の背面212側に配置しておき、ステップS34が実行される度に、基準距離だけ正面211側に光源23を移動させる。
【0035】
***実施の形態3の効果***
以上のように、実施の形態3に係る文字認識装置10は、名板51に対する光の当たり方に応じて光源23の位置が制御される。これにより、利用者の操作によらず、光源23から放射された光が画像データに映りこむことを防止できる。その結果、文字認識の精度が高くなる。
【0036】
実施の形態4.
実施の形態4は、光源23を点灯させる位置を変えながら画像データを取得して、取得された画像データを合成する点が実施の形態1と異なる。実施の形態4では、この異なる点を説明する。
【0037】
***構成の説明***
図10を参照して、実施の形態4に係る撮影装置20の構成を説明する。
撮影装置20は、筐体21の前後方向に複数の光源23を備える点が、
図1に示す構成と異なる。
【0038】
図11を参照して、実施の形態4に係る計算機30の構成を説明する。
計算機30は、
図3に示す構成に加え、点灯制御部45と、合成部46とを備える。点灯制御部45と、合成部46との機能は、他の機能と同様にソフトウェアにより実現されても、ハードウェアにより実現されてもよい。
点灯制御部45は、光源23を点灯させる位置を変えながら、画像取得装置22に画像データを取得させることにより、複数の画像データを取得させる。ここでは、点灯制御部45は、点灯させる光源23を変えることにより、光源23を点灯させる位置を変える。
合成部46は、複数の画像データを合成して合成データを生成する。
【0039】
***動作の説明***
図12及び
図13を参照して、実施の形態4に係る計算機30の動作を説明する。
図12の処理は、利用者から画像取得指示が入力される開始される。
【0040】
ステップS44からステップS49の処理は、
図5のステップS12からステップS17の処理と同じである。
【0041】
ステップS41の撮影処理では、点灯制御部45は、点灯させる光源23を順に変えながら、画像取得装置22に画像データを取得させる。これにより、異なる光源23が点灯した状態で取得された複数の画像データが取得される。
【0042】
ステップS42の合成処理では、合成部46は、ステップS41で取得された複数の画像データそれぞれを処理対象データとして、光の当たり方に応じて、処理対象データの一部のデータである部分データを抽出する。具体的には、合成部46は、処理対象データにおける画素毎の輝度から、光源23から放射された光の映り込みがない領域の画素群を部分データとして抽出する。そして、合成部46は、抽出された部分データを合成して合成データを生成する
【0043】
ステップS43の名板抽出処理では、名板抽出部41は、ステップS42の合成処理で生成された合成データにおける名板51部分の名板データを抽出する。
【0044】
図13に示す画像データU,Vが画像取得装置22によって取得されたとする。画像データUは、メータ値周辺に光が映りこんでおり、画像データVは、下部のNo周辺に光が映りこんでいる。しかし、画像データU,Vのうち、光が映りこんでいない部分を合成することにより、画像データWのように名板51部分に光が映りこんでいない画像データを得ることができる。
【0045】
***実施の形態4の効果***
以上のように、実施の形態4に係る文字認識装置10は、光源23を点灯させる位置を変えながら画像データを取得して、取得された画像データを合成する。これにより、名板51部分へ光が斑なく当たった画像データを得ることができ、文字認識の精度が高くなる。
【0046】
***他の構成***
実施の形態4では、光源23を点灯させる位置を変えた。しかし、点灯させる光源23の数を変えてもよい。
【0047】
実施の形態4では、撮影装置20が複数の光源23を備えた。しかし、実施の形態2のように光源23を移動可能にし、点灯制御部45が光源23を移動させることにより、光源23を点灯させる位置を変えながら画像データを取得してもよい。
【0048】
実施の形態5.
実施の形態5は、計算機30が画像取得装置22を有する点が実施の形態1と異なる。実施の形態5では、この異なる点を説明する。
【0049】
***構成の説明***
図14を参照して、実施の形態5に係る文字認識装置10の構成を説明する。
画像取得装置22は、撮影装置20ではなく、計算機30が備えている。計算機30は、スマートフォンといった画像取得装置22が一体になったコンピュータである。
文字認識装置10は、撮影装置20の筐体21の背面212に、計算機30が備える画像取得装置22配置されて、撮影装置20に計算機30が取り付けられる。筐体21の背面212には孔が開けられており、画像取得装置22はこの孔を介して正面211側の画像データを取得する。
【0050】
***実施の形態5の効果***
以上のように、実施の形態5に係る文字認識装置10は、画像取得装置22を計算機30側に持たせ、撮影装置20と計算機30とを一体にすることが可能である。これにより、画像データの取得の操作性が高くなる。
また、計算機30を介して光源23を制御する必要がない場合には、撮影装置20と計算機30とをケーブル等によって接続する必要がなくなる。