(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-08
(45)【発行日】2024-10-17
(54)【発明の名称】情報端末、文字認識方法及び文字認識プログラム
(51)【国際特許分類】
G06V 30/12 20220101AFI20241009BHJP
【FI】
G06V30/12 C
G06V30/12 B
G06V30/12 J
(21)【出願番号】P 2022140707
(22)【出願日】2022-09-05
【審査請求日】2023-08-24
【前置審査】
(73)【特許権者】
【識別番号】000002853
【氏名又は名称】ダイキン工業株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】山上 悟史
(72)【発明者】
【氏名】柳本 聡
【審査官】菊池 伸郎
(56)【参考文献】
【文献】特開2000-207487(JP,A)
【文献】特開2017-016549(JP,A)
【文献】特開2020-086922(JP,A)
【文献】特開2013-161277(JP,A)
【文献】特開2016-119059(JP,A)
【文献】特開2012-221095(JP,A)
【文献】特開2013-190952(JP,A)
【文献】特開2018-173818(JP,A)
【文献】特開2024-002740(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00-7/90
G06V 10/00-40/70
(57)【特許請求の範囲】
【請求項1】
制御部を有する情報端末であって、
前記制御部は、
撮影されたフレーム画像を取得する処理と、前記フレーム画像を文字認識することで得られる文字認識結果であって、命名規則に則って記載されたと判定された文字列である文字認識結果を記憶部に記憶する処理とを繰り返し、
フレーム画像の撮影を終了させる、前記情報端末に対する所定の操作を受け付けた場合
であって、前記所定の操作を受け付けた際のフレーム画像に基づく文字認識結果が前記記憶部に記憶されなかった場合に、
前記所定の操作を受け付けた際のフレーム画像よりも前のフレーム画像に基づいて前記記憶部に記憶され
た文字列により、文字認識結果を確定する、
情報端末。
【請求項2】
前記撮影されたフレーム画像をリアルタイムに表示する際に、前記文字認識することで得られる文字認識結果を重畳して表示する、
請求項1に記載の情報端末。
【請求項3】
前記制御部は、
表示する前記フレーム画像を第1の時間間隔で更新し、
重畳して表示する文字認識結果を前記第1の時間間隔よりも長い第2の時間間隔で更新する、
請求項2に記載の情報端末。
【請求項4】
前記制御部は、
前記撮影されたフレーム画像に文字認識結果として記憶する項目が複数含まれる場合、前記文字認識することで得られる各項目の文字認識結果を、項目単位で記憶部に記憶し、
フレーム画像の撮影を終了させる、前記情報端末に対する所定の操作を受け付けた場合
であって、前記所定の操作を受け付けた際のフレーム画像に基づく文字認識結果が前記記憶部に記憶されなかった場合に、
前記所定の操作を受け付けた際のフレーム画像よりも前のフレーム画像に基づいて前記記憶部に記憶された文字列により、項目単位で文字認識結果を確定する、
請求項1に記載の情報端末。
【請求項5】
前記制御部は、
確定した前記文字認識結果を表示部に表示したことに応じて、表示した前記文字認識結果が修正された場合に、修正された前記文字認識結果を記憶部に記憶する、
請求項1に記載の情報端末。
【請求項6】
前記制御部は、
機器の銘板が撮影されたフレーム画像を文字認識することで、文字認識結果として、機種名及び製造番号を得る、
請求項1に記載の情報端末。
【請求項7】
前記制御部は、
前記文字認識することで得られる文字認識結果を第1記憶部に記憶し、
フレーム画像の撮影を終了させる、前記情報端末に対する所定の操作を受け付けたことで確定した文字認識結果を第2記憶部に記憶する、
請求項1に記載の情報端末。
【請求項8】
前記制御部は、
前記文字認識することで文字認識結果が得られるごとに、前記第1記憶部に記憶されている文字認識結果を更新する、
請求項7に記載の情報端末。
【請求項9】
前記制御部は、
前記第1記憶部に記憶された文字認識結果が得られたフレーム画像を、前記文字認識結果と関連付けて前記第1記憶部に記憶し、
前記第2記憶部に記憶された文字認識結果が得られたフレーム画像を、前記文字認識結果と関連付けて前記第2記憶部に記憶する、
請求項7に記載の情報端末。
【請求項10】
情報端末の制御部が、
撮影されたフレーム画像を取得する処理と、前記フレーム画像を文字認識することで得られる文字認識結果であって、命名規則に則って記載されたと判定された文字列である文字認識結果を記憶部に記憶する処理とを繰り返す工程と、
フレーム画像の撮影を終了させる、前記情報端末に対する所定の操作を受け付けた場合
であって、前記所定の操作を受け付けた際のフレーム画像に基づく文字認識結果が前記記憶部に記憶されなかった場合に、
前記所定の操作を受け付けた際のフレーム画像よりも前のフレーム画像に基づいて前記記憶部に記憶された文字列により、文字認識結果を確定する工程と
を実行する文字認識方法。
【請求項11】
情報端末の制御部に、
撮影されたフレーム画像を取得する処理と、前記フレーム画像を文字認識することで得られる文字認識結果であって、命名規則に則って記載されたと判定された文字列である文字認識結果を記憶部に記憶する処理とを繰り返す工程と、
フレーム画像の撮影を終了させる、前記情報端末に対する所定の操作を受け付けた場合
であって、前記所定の操作を受け付けた際のフレーム画像に基づく文字認識結果が前記記憶部に記憶されなかった場合に、
前記所定の操作を受け付けた際のフレーム画像よりも前のフレーム画像に基づいて前記記憶部に記憶された文字列により、文字認識結果を確定する工程と
を実行させるための文字認識プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報端末、文字認識方法及び文字認識プログラムに関する。
【背景技術】
【0002】
空調機器等の各種現場機器に付された機器銘板を、情報端末等を用いて撮影し、文字認識処理を行うことで、現場機器の機器データを取得する技術が知られている。当該技術によれば、例えば、保守作業者は、機器銘板を撮影するだけで、現場調査を行った現場機器の機器データを管理することができる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
一方で、現場で撮影する場合、撮影状況によっては、文字認識処理が適切に行われず、誤認識が発生することで、機器データの一部または全部について正しい機器データを取得することができないといった事態が生じ得る。このような場合、保守作業者は、撮影をやり直す必要があり、保守作業者にとっては作業負荷が高い。
【0005】
本開示は、撮影により現場機器の機器データを取得する際の作業者の作業負荷を低減させる。
【課題を解決するための手段】
【0006】
本開示の第1の態様は、制御部を有する情報端末であって、
前記制御部は、
撮影されたフレーム画像を取得する処理と、前記フレーム画像を文字認識することで得られる文字認識結果を記憶部に記憶する処理とを繰り返し、
前記情報端末に対する所定の操作を受け付けた場合に、文字認識結果を確定する。
【0007】
本開示の第1の態様によれば、撮影により現場機器の機器データを取得する際の作業者の作業負荷を低減させることができる。
【0008】
また、本開示の第2の態様は、第1の態様に記載の情報端末であって、
前記撮影されたフレーム画像をリアルタイムに表示する際に、前記文字認識することで得られる文字認識結果を重畳して表示する。
【0009】
また、本開示の第3の態様は、第2の態様に記載の情報端末であって、
前記制御部は、
表示する前記フレーム画像を第1の時間間隔で更新し、
重畳して表示する文字認識結果を前記第1の時間間隔よりも長い第2の時間間隔で更新する。
【0010】
また、本開示の第4の態様は、第1乃至第3のいずれかの態様に記載の情報端末であって、
前記制御部は、
前記撮影されたフレーム画像に文字認識結果として記憶する項目が複数含まれる場合、前記文字認識することで得られる各項目の文字認識結果を、項目単位で記憶部に記憶し、
前記情報端末に対する所定の操作を受け付けた場合に、項目単位で文字認識結果を確定する。
【0011】
また、本開示の第5の態様は、第1乃至第4のいずれかの態様に記載の情報端末であって、
前記制御部は、
確定した前記文字認識結果を表示部に表示したことに応じて、表示した前記文字認識結果が修正された場合に、修正された前記文字認識結果を記憶部に記憶する。
【0012】
また、本開示の第6の態様は、第1乃至第5のいずれかの態様に記載の情報端末であって、
前記制御部は、
機器の銘板が撮影されたフレーム画像を文字認識することで、文字認識結果として、機種名及び製造番号を得る。
【0013】
また、本開示の第7の態様は、第1乃至第6のいずれかの態様に記載の情報端末であって、
前記制御部は、
前記文字認識することで得られる文字認識結果を第1記憶部に記憶し、
前記情報端末に対する所定の操作を受け付けたことで確定した文字認識結果を第2記憶部に記憶する。
【0014】
また、本開示の第8の態様は、第7の態様に記載の情報端末であって、
前記制御部は、
前記文字認識することで文字認識結果が得られるごとに、前記第1記憶部に記憶されている文字認識結果を更新する。
【0015】
また、本開示の第9の態様は、第1乃至第8のいずれかの態様に記載の情報端末であって、
前記文字認識結果は、前記文字認識することで得られる結果のうち、前記制御部が保存条件を満たすと判定した結果である。
【0016】
また、本開示の第10の態様は、第9の態様に記載の情報端末であって、
前記制御部は、
前記文字認識することで所定の項目について得られる結果が、予め定められた文字列であった場合に、前記保存条件を満たすと判定し、前記所定の項目について得られる結果を、前記所定の項目の文字認識結果として前記記憶部に記憶する。
【0017】
また、本開示の第11の態様は、第7の態様に記載の情報端末であって、
前記制御部は、
前記第1記憶部に記憶された文字認識結果が得られたフレーム画像を、前記文字認識結果と関連付けて前記第1記憶部に記憶し、
前記第2記憶部に記憶された文字認識結果が得られたフレーム画像を、前記文字認識結果と関連付けて前記第2記憶部に記憶する。
【0018】
また、本開示の第12の態様は、文字認識方法であって、
情報端末の制御部が、
撮影されたフレーム画像を取得する処理と、前記フレーム画像を文字認識することで得られる文字認識結果を記憶部に記憶する処理とを繰り返す工程と、
前記情報端末に対する所定の操作を受け付けた場合に、文字認識結果を確定する工程とを実行する。
【0019】
本開示の第12の態様によれば、撮影により現場機器の機器データを取得する際の作業者の作業負荷を低減させることができる。
【0020】
また、本開示の第13の態様は、文字認識プログラムであって、
情報端末の制御部に、
撮影されたフレーム画像を取得する処理と、前記フレーム画像を文字認識することで得られる文字認識結果を記憶部に記憶する処理とを繰り返す工程と、
前記情報端末に対する所定の操作を受け付けた場合に、文字認識結果を確定する工程とを実行させる。
【0021】
本開示の第13の態様によれば、撮影により現場機器の機器データを取得する際の作業者の作業負荷を低減させることができる。
【図面の簡単な説明】
【0022】
【
図2】各フレーム画像に対して文字認識処理を行うことで得られた文字認識結果の一例を示す図である。
【
図3】情報端末のハードウェア構成の一例を示す図である。
【
図4】情報端末の機能構成の一例を示す第1の図である。
【
図6】認識部から抽出部までの処理の具体例を示す図である。
【
図8】第1記憶制御部の処理の流れを示すフローチャートである。
【
図9】第2記憶制御部の処理の流れを示すフローチャートである。
【
図10A】表示部により表示されるフレーム画像及びバウンディングボックスの表示例を示す第1の図である。
【
図10B】表示部により表示されるフレーム画像及びバウンディングボックスの表示例を示す第2の図である。
【
図11】情報端末による文字認識処理の流れを示すフローチャートである。
【
図12】情報端末の機能構成の一例を示す第2の図である。
【発明を実施するための形態】
【0023】
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省く。
【0024】
[第1の実施形態]
<情報端末の利用例>
はじめに、第1の実施形態に係る情報端末の利用例について説明する。
図1は、情報端末の利用例を示す図である。
図1の左側に示すように、情報端末120は、例えば、現場機器110の側面等に付された機器銘板111から、機器データを読み取るシーン等において利用される。
【0025】
情報端末120によれば、例えば、保守作業者130が現場調査を行い、調査結果を不図示のサーバ装置等に登録する際、調査対象である現場機器110を特定するための機器データを、保守作業者130が手入力する手間を省くことができる。また、保守作業者130が機器データを誤入力するのを防止することができる。
【0026】
なお、本実施形態では、現場機器110が空調機器の室外機であり、情報端末120が携帯端末であるとして説明する。ただし、現場機器110は空調機器の室外機に限定されるものではなく、空調機器の室外機以外のユニットであってもよいし、空調機器以外の現場機器であってもよい。また、情報端末120は携帯端末に限定されず、光学的文字認識機能を有する端末であれば、携帯端末以外の情報端末であってもよい。
【0027】
図1の右側は、保守作業者130が機器銘板111を撮影したことで、情報端末120の表示画面に、撮影画像121が表示された様子を示している。
図1の右側に示すように、撮影画像121には、機器銘板111に対応する画像領域122が含まれる。
【0028】
現場機器110が空調機器の室外機の場合、画像領域122に表示される機器銘板111には、例えば、
・室外機であることを示す記載、
・冷房と暖房とを兼用する室外機であることを示す記載、
・機種についての記載(ラベル、機種コードデータ)、
・製造番号についての記載(ラベル、製造番号データ)、
・製品質量についての記載(ラベル、質量データ)、
・電源仕様についての記載(ラベル、相数データ、電圧データ、周波数データ)、
・圧縮機電動機の出力についての記載(ラベル、消費電力量データ)、
・管理番号についての記載(ラベル、管理コードデータ)、
・冷媒の量及び種類についての記載(ラベル、冷媒量データ、冷媒種コード)、
・設計圧力についての記載(ラベル、圧力データ)、
・製造年月についての記載(ラベル、製造年月データ)、
等が含まれる(
図1では、「*」として省略して示している)。また、実際の機器銘板111の記載には、アルファベットや数字、記号、漢字(現場機器110が設置された国の言語)など、多くの文字種が含まれる。
【0029】
なお、本実施形態では、情報端末120を用いて現場機器110を撮影する際、保守作業者130が撮影を開始してから、シャッタ操作を行うまでの間、動画像データとして撮影する。また、本実施形態では、動画像データに含まれる各フレーム画像に対して文字認識処理を行う。
【0030】
<文字認識処理の一例>
次に、保守作業者130が現場機器110を動画像データとして撮影し、情報端末120が各フレーム画像に対して文字認識処理を行った場合の文字認識結果について説明する。
図2は、各フレーム画像に対して文字認識処理を行うことで得られた文字認識結果の一例を示す図である。
【0031】
図2において、縦軸201は時間軸を表しており、
図2の例は、動画像データに含まれる各フレーム画像のうち、時刻=T
1、T
2、T
3において撮影されたフレーム画像を示している(符号211~213)。
【0032】
また、
図2の例は、動画像データに含まれる各フレーム画像に対して、文字認識処理を行うことで、現場機器110の機種名、製造番号、製造年月についての文字認識結果を、機器データとして取得した様子を示している(符号221~223)。
【0033】
具体的には、
図2の例は、時刻=T
1において撮影されたフレーム画像1の場合、機種名、製造番号については文字認識処理を行うことで文字認識結果が得られたことを示している。一方、製造年月については文字認識処理を行うことで文字認識結果が得られなかったことを示している。
【0034】
また、
図2の例は、時刻=T
2において撮影されたフレーム画像2の場合、機種名、製造番号、製造年月のいずれについても文字認識処理を行うことで文字認識結果が得られ、機器データが取得できたことを示している。
【0035】
更に、
図2の例は、時刻=T
3において撮影されたフレーム画像3の場合、製造番号については文字認識処理を行うことで文字認識結果が得られたことを示している。一方、機種名、製造年月については文字認識処理を行うことで、文字認識結果が得られなかったことを示している。
【0036】
このように、現場機器110を動画像データとして撮影した場合、保守作業者130が気付かないような撮影中のわずかな撮影状況の違いによって、文字認識結果が得られる場合と、得られない場合とがある。
【0037】
換言すると、シャッタ操作が行われたタイミングで、複数の対象項目(複数の認識対象の項目)全てについて文字認識結果が得られる可能性は高くはない。そこで、本実施形態に係る情報端末120では、シャッタ操作が行われるまでの間に撮影されたフレーム画像それぞれに対して文字認識処理を行う。そして、本実施形態に係る情報端末120では、いずれかのフレーム画像において全ての対象項目について文字認識結果が得られた場合に、機器データとして取得する。
【0038】
これにより、シャッタ操作が行われたタイミングで取得されたフレーム画像に対してのみ文字認識処理を行う場合と比較して、機器データを取得できる可能性を高めることができる。この結果、本実施形態に係る情報端末120によれば、撮影により現場機器の機器データを取得する際の保守作業者の作業負荷を低減させることができる。
【0039】
<情報端末のハードウェア構成>
次に、情報端末120のハードウェア構成について説明する。
図3は、情報端末のハードウェア構成の一例を示す図である。
図2に示すように、情報端末120は、プロセッサ301、メモリ302、補助記憶装置303、ユーザインタフェース装置304、撮像装置305、通信装置306を有する。なお、情報端末120の各ハードウェアは、バス307を介して相互に接続されている。
【0040】
プロセッサ301は、CPU(Central Processing Unit)等の各種演算デバイスを有する。プロセッサ301は、各種プログラム(例えば、後述する文字認識プログラム等)をメモリ302上に読み出して実行する。
【0041】
メモリ302は、ROM(Read Only Memory)、RAM(Random Access Memory)等の主記憶デバイスを有する。プロセッサ301とメモリ302とは、いわゆるコンピュータを形成し、プロセッサ301が、メモリ302上に読み出した各種プログラムを実行することで、当該コンピュータは各種機能を実現する。
【0042】
補助記憶装置303は、各種プログラムや、各種プログラムがプロセッサ301によって実行される際に用いられる各種データ(例えば、後述するフレーム画像、ライブラリ、修正テーブル、機器データルール、文字認識結果等)を格納する。
【0043】
ユーザインタフェース装置304は、例えば、保守作業者130が各種操作を行うための操作機能と、情報端末120により実行される各種処理の処理結果を表示する表示機能とを有する。
【0044】
撮像装置305は、機器銘板111を撮影し、撮影画像121を生成する。通信装置306は、ネットワークを介して外部装置(例えば、不図示のサーバ装置)と通信を行うための通信デバイスである。
【0045】
なお、補助記憶装置303にインストールされる各種プログラムは、例えば、通信装置306を介してネットワークからダウンロードされることで、インストールされる。
【0046】
<情報端末の機能構成>
次に、情報端末120の機能構成について説明する。
図4は、情報端末の機能構成の一例を示す第1の図である。上述したように、情報端末120には、文字認識プログラムがインストールされており、当該プログラムが実行されることで、情報端末120は、
・操作受付部401、
・取得部402、
・認識部403、
・修正部404、
・抽出部405、
・判定部406、
・バウンディングボックス生成部407、
・第1記憶制御部408、
・第2記憶制御部409、
・表示部410、
・手動修正部411、
として機能する。
【0047】
操作受付部401は、情報端末120に対する保守作業者130の各種操作のうち、撮影開始の操作と、シャッタ操作とを受け付ける。また、操作受付部401は、撮影開始の操作を受け付けた場合、取得部402に、撮影開始の指示を通知する。
【0048】
一方、操作受付部401は、シャッタ操作を受け付けた場合、取得部402に、撮影終了の指示を通知するとともに、第2記憶制御部409に、シャッタ操作があったことを通知する。
【0049】
取得部402は、操作受付部401より撮影開始の指示が通知されると、撮像装置305を動作させ、動画像として所定のフレーム周期(所定周期の一例)で撮影された撮影画像データの取得を開始する。取得部402は、取得した撮影画像データに含まれる各フレーム画像を表示部410に通知するとともに、各フレーム画像を間引いて、認識部403に通知する。更に、取得部402は、認識部403に通知した各フレーム画像を、フレーム画像記憶部421に記憶する。なお、取得部402によるこれらの処理は、操作受付部401から撮影終了の指示が通知されるまで、繰り返し実行される。
【0050】
認識部403は、取得部402より通知された各フレーム画像に対して、ライブラリ記憶部422を参照しながら文字認識処理を行い、認識した文字を修正部404に通知する。なお、ライブラリ記憶部422には、アルファベット、数字、記号を文字認識するためのライブラリが格納されているものとする。
【0051】
修正部404は、認識部403より通知された文字のうち、文字認識処理において誤認識された文字を、修正テーブル記憶部423を参照しながら特定し、特定した文字を、正しい文字に修正する。また、修正部404は、修正後の文字を抽出部405に通知する。なお、修正テーブル記憶部423には、機器銘板を撮影した撮影画像データに含まれるフレーム画像に対して文字認識処理を行った場合の、誤認識しやすい文字と、当該文字を正しく認識した場合の文字とが予め対応付けられた修正テーブルが記憶されている。
【0052】
抽出部405は、修正部404より通知された修正後の文字から、文字列を抽出し、抽出した文字列を、それぞれの位置及びサイズとともに判定部406に通知する。なお、抽出部405は、修正後の文字について、1行分を1つの文字列として抽出する。所定文字数分の空欄が含まれる場合、改行することで、1行を判定する。ただし、本実施形態において抽出部405は、数字の後に空欄がある場合には改行しない。
【0053】
判定部406は、抽出部405より通知された文字列が、それぞれ、対象項目(本実施形態では、機種名、製造番号、製造年月が認識対象の項目)の命名規則に則って記載されたか否か(保存条件を満たすか否か)を判定する。なお、機器データルール保持部424には、対象項目の文字列を構成する文字種、文字数、並び順を定めた命名規則が保持されており、判定部406は、機器データルール保持部424を参照することで、対象項目の命名規則に則って記載されたか否かを判定する。
【0054】
また、判定部406は、判定の結果、対象項目の命名規則に則って記載されたと判定した場合には、
・抽出部405より通知された文字列のうち、命名規則に則って記載されたと判定した文字列(文字認識結果)と、
・該文字列の位置及びサイズと、
を、バウンディングボックス生成部407に通知する。
【0055】
また、判定部406は、判定の結果、全ての対象項目が、対応する命名規則に則って記載されたと判定した場合には、対応する命名規則に則って記載された各文字列(各文字認識結果)を、各対象項目と関連付けて第1記憶制御部408に通知する。更に、判定部406は、抽出部405より通知された位置及びサイズを、各対象項目と関連付けて第1記憶制御部408に通知する。
【0056】
バウンディングボックス生成部407は、判定部406より通知された、文字列の位置及びサイズに基づいて、バウンディングボックス(文字列の位置及びサイズを示す情報)を生成する。また、バウンディングボックス生成部407は、生成したバウンディングボックスを、判定部406より通知された文字列(文字認識結果)とともに、表示部410に通知する。
【0057】
第1記憶制御部408は、判定部406より、全ての対象項目についての文字認識結果が通知されると、機器データとして、位置及びサイズとともに、対象項目と関連付けて第1記憶部425に記憶する。また、第1記憶制御部408は、判定部406より、全ての対象項目についての文字認識結果が通知されると、対応するフレーム画像を、フレーム画像記憶部421より読み出し、第1記憶部425に記憶する。
【0058】
なお、第1記憶制御部408は、第1記憶部425に、既に、対象項目についての文字認識結果が、対応する位置及びサイズ、フレーム画像とともに記憶されている場合には、上書きして記憶する。これにより、第1記憶部425には、撮影中に繰り返し通知される全ての対象項目についての文字認識結果のうち、最新の文字認識結果が、対応する位置及びサイズ、フレーム画像とともに記憶されることになる。
【0059】
第2記憶制御部409は、操作受付部401よりシャッタ操作があったことが通知されると、第1記憶部425から、最新の文字認識結果と、対応する位置及びサイズ、フレーム画像とを読み出し、第2記憶部426に記憶する。これにより、第2記憶制御部409は、確定した文字認識結果等を第2記憶部426に記憶することができる。換言すると、本実施形態において、シャッタ操作は、文字認識結果等を確定させるための操作ということができる。
【0060】
また、第2記憶制御部409は、確定した文字認識結果、位置及びサイズを、バウンディングボックス生成部407に通知する。また、第2記憶制御部409は、確定したフレーム画像を、表示部410に通知する。
【0061】
更に、第2記憶制御部409は、確定した文字認識結果、位置及びサイズ、フレーム画像を通知したことに応じて、手動修正部411より、文字認識結果が手動で修正されることで得られた修正後の文字列が通知された場合、これを受け取る。そして、第2記憶制御部409は、受け取った修正後の文字列を、第2記憶部426に上書きして記憶する。
【0062】
表示部410は、取得部402より、所定のフレーム周期で通知される各フレーム画像を、ユーザインタフェース装置304に表示する。なお、表示部410では、所定のフレーム周期で通知される各フレーム画像を表示する際、バウンディングボックス生成部407から通知されるバウンディングボックス及び文字認識結果を重畳する。表示部410が各フレーム画像に重畳するバウンディングボックス及び文字認識結果は、所定のフレーム周期よりも長い周期で更新される。上述したように、取得部402は、各フレーム画像を間引いて、認識部403に通知しているため、バウンディングボックスが生成される周期は、所定のフレーム周期より長くなるからである。
【0063】
また、表示部410は、シャッタ操作が行われたことで、第2記憶制御部409から通知されたフレーム画像に、バウンディングボックス生成部407から通知されたバウンディングボックス及び文字認識結果を重畳する。更に、表示部410は、バウンディングボックス及び文字認識結果を重畳したフレーム画像を、ユーザインタフェース装置304に表示する。
【0064】
つまり、表示部410は、
・撮影中、リアルタイムにフレーム画像を表示し、所定のフレーム周期より長い周期で、対象項目に重畳されたバウンディングボックス及び文字認識結果を更新し、
・シャッタ操作が行われた際には、確定したフレーム画像と、確定した位置及びサイズに基づき生成されたバウンディングボックスと、確定した文字認識結果とを表示する。
【0065】
手動修正部411は、シャッタ操作が行われたことで、表示部410により、確定した文字認識結果及び確定したフレーム画像が表示されたことに応じて、手動で修正指示が入力された場合に、これを受け付ける。また、手動修正部411は、手動で修正された修正後の文字列を、第2記憶制御部409に通知する。
【0066】
<情報端末全体の動作例>
次に、情報端末120全体の動作例について説明する。
図5は、情報端末全体の動作例を示す図である。
【0067】
図5において、"フレーム画像1"~"フレーム画像5"は、取得部402により取得されたフレーム画像を示している。具体的には、撮影開始の指示が入力されることで"フレーム画像1"が取得され、"フレーム画像5"が撮影された直後に、シャッタ操作が行われた様子を示している。
【0068】
また、
図5の例は、このうち、"フレーム画像1"、"フレーム画像3"、"フレーム画像5"が、フレーム画像記憶部421に記憶された様子を示している。
【0069】
なお、
図5の例によれば、情報端末120のユーザインタフェース装置304に表示されるフレーム画像は、第1の時間間隔aで更新される。また、情報端末120のユーザインタフェース装置304にフレーム画像に重畳して表示されるバウンディングボックス及び文字認識結果は、少なくとも第2の時間間隔bで更新される(a<b)。
【0070】
また、
図5において、"認識結果1(NG)"は、"フレーム画像1"に対して、認識部403~判定部406の各部が処理を実行し、"フレーム画像1"に含まれる文字列のいずれかが、対象項目の命名規則に則って記載されていないと判定された様子を示している。この場合、第1記憶部425には、"認識結果1(NG)"及び"フレーム画像1"は記憶されない。
【0071】
一方、
図5において、"認識結果3(OK)"は、"フレーム画像3"に対して、認識部403~判定部406の各部が処理を実行し、"フレーム画像3"に含まれる文字列が、対象項目の命名規則に則って記載されていると判定された様子を示している。この場合、第1記憶部425には、"認識結果3(OK)"(文字認識結果)及び"フレーム画像3"が記憶される(なお、
図5の例では、位置及びサイズについては省略している)。
【0072】
また、
図5において、"認識結果5(OK)"は、"フレーム画像5"に対して、認識部403~判定部406の各部が処理を実行し、"フレーム画像5"に含まれる文字列が、対象項目の命名規則に則って記載されていると判定された様子を示している。この場合、第1記憶部425には、"認識結果5(OK)" (文字認識結果)及び"フレーム画像5"が上書きして記憶される。
【0073】
また、
図5の例は、シャッタ操作が行われた時点で、第1記憶部425に記憶されている"認識結果5(OK)" (文字認識結果)及び"フレーム画像5"が、第2記憶部426に記憶された様子を示している。
【0074】
<情報端末の各機能部の処理の詳細>
次に、情報端末の各機能部(ここでは、認識部403、修正部404、抽出部405、判定部406、第1記憶制御部408、第2記憶制御部409)の処理の詳細について説明する。
【0075】
(1)認識部403から抽出部405までの処理の詳細
はじめに、認識部403から抽出部405までの処理の詳細について説明する。
図6は、認識部から抽出部までの処理の具体例を示す図である。
【0076】
上述したように、ライブラリ記憶部422には、アルファベット、数字、記号を文字認識するためのライブラリが格納されている。このため、認識部403は、フレーム画像に対して文字認識処理を行った際、フレーム画像内にアルファベット、数字、記号が含まれていた場合には、フレーム画像内のアルファベット、数字、記号を文字認識する。また、認識部403は、フレーム画像内にアルファベット、数字、記号以外の文字が含まれていた場合には、アルファベット、数字、記号のいずれかとして文字認識する。具体的には、認識部403は、フレーム画像内にアルファベット、数字、記号以外の文字が含まれていた場合には、当該文字と似ているアルファベット、数字、記号として文字認識する。
【0077】
図6において、符号610は、認識部403は、フレーム画像に対して文字認識処理を行うことで得られた文字を示している。
【0078】
続いて、修正部404は、符号610に示す文字の中から、誤認識された文字を判定する。具体的には、修正部404は、符号610に示す文字において、対象項目として使用されることのないアルファベット、数字、記号が含まれていた場合、それらのアルファベット、数字、記号は誤認識されたと判定して修正する。
【0079】
上述したように、修正部404は、修正テーブル記憶部423に記憶された修正テーブル(文字修正ルールの一例。例えば、修正テーブル600)を参照しながら、誤認識されたと判定したアルファベット、数字、記号を修正する。なお、上述したように、修正テーブル600には、誤認識しやすい文字(修正前の文字)と、当該文字を正しく認識した場合の文字(修正後文字)とが予め対応付けられている。
図6において、符号620は、符号610に示す文字のうち、誤認識された文字が修正された修正後の文字を示している(なお、符号620は、紙面の都合上、更に、1行分を1つの文字列として抽出するために改行した状態を示している)。
【0080】
続いて、抽出部405は、符号620に示す文字について、1行分を1つの文字列として順次抽出し、判定部406に通知する。
図6において、符号630は、符号620に示す文字の中から文字列として、"ARR63UP"が抽出された様子を示している。
【0081】
また、抽出部405は、抽出した文字列の改行前のフレーム画像内での位置及びサイズを順次算出し、抽出された文字列(符号630)とともに、判定部406に通知する。
図6において、符号631は、抽出された文字列(符号630)の改行前のフレーム画像内での位置及びサイズが算出された様子を示している。
【0082】
(2)判定部406の処理の詳細
次に、判定部406の処理の詳細について説明する。
図7は、判定部の処理の具体例を示す図である。
【0083】
上述したように、機器データルール保持部424には、対象項目の命名規則700が保持されている。判定部406は、機器データルール保持部424に保持された命名規則700を参照することで、抽出部405から順次通知された文字列(符号630参照)が、対象項目の命名規則に則って記載されたか否かを判定する。
【0084】
図7の例は、符号630に示す文字列が通知され、判定部406が、命名規則700内の"機種コードデータ"の命名規則に基づいて定められた判定基準を参照した様子を示している。判定部406では、符号630に示す文字列である"ARR63UP"が判定基準に合致しているため、"機種コードデータ"の命名規則に則って記載されたと判定する。
【0085】
このため、判定部406は、"機種名"の文字列(文字認識結果)と、その位置及びサイズとを(符号710、711参照)、バウンディングボックス生成部407(
図7において不図示)に通知する。
【0086】
なお、
図7の例では、判定部406に順次通知された文字列の中に、
・命名規則700内の"機種コードデータ"の命名規則に基づいて定められた判定基準に合致する文字列
はあったが、
・命名規則700内の"製造番号データ"の命名規則に基づいて定められた判定基準に合致する文字列、及び、
・命名規則700内の"製造年月データ"の命名規則に基づいて定められた判定基準に合致する文字列、
はなかったとする。このため、判定部406は、第1記憶制御部408に対して認識結果(NG)を通知する。
【0087】
一方、
図7の例では示していないが、判定部406に順次通知された文字列の中に、
・命名規則700内の"機種コードデータ"の命名規則に基づいて定められた判定基準に合致する文字列、
・命名規則700内の"製造番号データ"の命名規則に基づいて定められた判定基準に合致する文字列、及び、
・命名規則700内の"製造年月データ"の命名規則に基づいて定められた判定基準に合致する文字列、
がいずれもあったとする。この場合、判定部406は、
・全ての対象項目についての文字認識結果(認識結果(OK))、
・"機種名"の文字列(文字認識結果)、"製造番号"の文字列(文字認識結果)、"製造年月"の文字列(文字認識結果)それぞれの位置及びサイズ、
を第1記憶制御部408に通知する。
【0088】
(3)第1記憶制御部408の処理の詳細
次に、第1記憶制御部408の処理の詳細について説明する。
図8は、第1記憶制御部の処理の流れを示すフローチャートである。
【0089】
図8に示すように、ステップS801において、第1記憶制御部408は、判定部406から文字認識結果(認識結果(OK))、位置及びサイズ、または認識結果(NG)を取得する。
【0090】
ステップS802において、第1記憶制御部408は、フレーム画像記憶部421を参照し、取得した文字認識結果に対応するフレーム画像を取得する。
【0091】
ステップS803において、第1記憶制御部408は、文字認識結果(認識結果(OK))、位置及びサイズを取得した場合には、取得した文字認識結果を対象項目と関連付けて、機器データとして、第1記憶部425に記憶する。また、第1記憶制御部408は、取得した位置及びサイズを、対象項目と関連付けて第1記憶部425に記憶する。更に、第1記憶制御部408は、取得したフレーム画像を、取得した文字認識結果と関連付けて第1記憶部425に記憶する。
【0092】
なお、既に、第1記憶部425に、文字認識結果、位置及びサイズ、フレーム画像が記憶されている場合、第1記憶制御部408は、上書きして記憶する。
【0093】
(4)第2記憶制御部409の処理の詳細
次に、第2記憶制御部409の処理の詳細について説明する。
図9は、第2記憶制御部の処理の流れを示すフローチャートである。
【0094】
図9に示すように、ステップS901において、第2記憶制御部409は、第1記憶部425に機器データとして記憶されている最新の文字認識結果を特定する。
【0095】
ステップS902において、第2記憶制御部409は、特定した文字認識結果と、対応する位置及びサイズと、対応するフレーム画像とを第1記憶部425から読み出し、第2記憶部426に記憶することで、文字認識結果等を確定する。
【0096】
ステップS903において、第2記憶制御部409は、第2記憶部426に記憶された、確定したフレーム画像を、表示部410に通知する。
【0097】
ステップS904において、第2記憶制御部409は、第2記憶部426に記憶された、確定した文字認識結果、位置及びサイズを、バウンディングボックス生成部407に通知する。
【0098】
<表示部の表示例>
次に、表示部410に表示されるフレーム画像及びバウンディングボックスの表示例について説明する。
図10A、
図10Bは、表示部により表示されるフレーム画像及びバウンディングボックスの表示例を示す第1及び第2の図である。
【0099】
図10Aの例は、保守作業者130が撮影開始の操作を行ったことで、時刻=T
1で符号1011に示すフレーム画像1が表示された様子を示している。また、
図10Aの例は、フレーム画像1に対する文字認識処理では、"機種名"、"製造番号"については文字認識結果が取得されたが、"製造年月"については文字認識結果が取得されなかったことを示している(符号1021参照)。このため、フレーム画像1には、"機種名"、"製造番号"の文字列にバウンディングボックスが表示されるとともに、文字認識結果が表示されることになる。
【0100】
また、
図10Aの例は、時刻=T
2で符号1012に示すフレーム画像2が表示された様子を示している。フレーム画像2に対しては文字認識処理が行われないため、フレーム画像1に対して文字認識処理が行われることで取得された文字認識結果がそのまま表示される。つまり、フレーム画像2には、"機種名"、"製造番号"の文字列にバウンディングボックスが表示されるとともに、文字認識結果が表示されることになる。
【0101】
また、
図10Aの例は、時刻=T
3で符号1013に示すフレーム画像3が表示された様子を示している。フレーム画像3に対する文字認識処理では、"機種名"、"製造番号"、"製造年月"について文字認識結果が取得されたことを示している(符号1023参照)。このため、フレーム画像3には、"機種名"、"製造番号"、"製造年月"の文字列にバウンディングボックスが表示されるとともに、文字認識結果が表示されることになる。
【0102】
続いて、
図10Bの例は、時刻=T
4で符号1014に示すフレーム画像4が表示された様子を示している。フレーム画像4に対しては文字認識処理が行われないため、フレーム画像3に対して文字認識処理が行われることで取得された文字認識結果がそのまま表示される。つまり、フレーム画像4には、"機種名"、"製造番号"、"製造年月"の文字列にバウンディングボックスが表示されるとともに、文字認識結果が表示されることになる。
【0103】
また、
図10Bの例は、時刻=T
5で符号1015に示すフレーム画像5が表示された様子を示している。フレーム画像5に対する文字認識処理では、"機種名"、"製造番号"、"製造年月"について文字認識結果が取得されたことを示している(符号1025参照)。このため、フレーム画像5には、"機種名"、"製造番号"、"製造年月"の文字列にバウンディングボックスが表示されるとともに、文字認識結果が表示されることになる。
【0104】
また、
図10Bの例は、時刻=T
5の直後に、保守作業者130がシャッタ操作を行った様子を示している。この時点では、第1記憶部425に、最新の文字認識結果として、フレーム画像5に対して文字認識処理が行われることで取得された文字認識結果が記憶されており、対応するフレーム画像としてフレーム画像5が記憶されている。そして、当該最新の文字認識結果及び当該フレーム画像5が第2記憶部426に記憶されることになる。このため、シャッタ操作が行われた後には、時刻=T
5で表示されたフレーム画像、バウンディングボックス、文字認識結果と同じフレーム画像、バウンディングボックス、文字認識結果が表示されることになる(符号1016)。
【0105】
<文字認識処理>
次に、情報端末120全体の文字認識処理の流れについて説明する。
図11は、情報端末による文字認識処理の流れを示すフローチャートである。
【0106】
ステップS1101において、情報端末120は、保守作業者130による撮影開始の操作を受け付ける。
【0107】
ステップS1102において、情報端末120は、動画像データの撮影を開始し、フレーム画像を取得するとともに、取得したフレーム画像を表示する。
【0108】
ステップS1103において、情報端末120は、取得したフレーム画像を間引いてフレーム画像記憶部421に記憶する。
【0109】
ステップS1104において、情報端末120は、取得したフレーム画像を間引いて文字認識処理を行う。
【0110】
ステップS1105において、情報端末120は、文字認識処理を行うことで認識した文字を修正する。
【0111】
ステップS1106において、情報端末120は、修正後の文字の中から文字列を抽出する。
【0112】
ステップS1107において、情報端末120は、抽出した文字列が、対象項目の命名規則に則って記載されたか否かを判定する。
【0113】
ステップS1108において、情報端末120は、命名規則に則って記載されていないと判定した場合には(ステップS1108においてNOの場合には)、ステップS1110に進む。
【0114】
一方、ステップS1108において、情報端末120は、命名規則に則って記載されていると判定した場合には(ステップS1108においてYESの場合には)、ステップS1109に進む。
【0115】
ステップS1109において、情報端末120は、命名規則に則って記載されていると判定した文字列(文字認識結果)を、バウンディングボックスとともに表示する。
【0116】
ステップS1110において、情報端末120は、第1記憶制御処理を行う。なお、第1記憶制御処理の詳細は、
図8を用いて既に説明済みであるため、ここでは、説明を省略する。
【0117】
ステップS1111において、情報端末120は、シャッタ操作があったか否かを判定する。ステップS1111において、シャッタ操作がなかったと判定した場合には(ステップS1111においてNOの場合には)、ステップS1102に戻る。
【0118】
一方、ステップS1111において、シャッタ操作があったと判定した場合には(ステップS1111においてYESの場合には)、ステップS1112に進む。
【0119】
ステップS1112において、情報端末120は、第2記憶制御処理を行う。なお、第2記憶制御処理の詳細は、
図9を用いて既に説明済みであるため、ここでは、説明を省略する。
【0120】
ステップS1113において、情報端末120は、確定した文字認識結果を、確定したフレーム画像に、バウンディングボックスとともに重畳して表示する。
【0121】
<まとめ>
以上の説明から明らかなように、第1の実施形態に係る情報端末120は、
・撮影された動画像データに含まれる各フレーム画像を取得する処理と、フレーム画像に対して文字認識処理を行うことで取得される文字認識結果を第1記憶部に記憶する処理とを繰り返す。
・保守作業者によるシャッタ操作を受け付けた場合に、文字認識結果を確定する。
【0122】
このように、動画像データの撮影中に、各フレーム画像に対して文字認識処理を行い、シャッタ操作が行われた時点で、正しく取得した文字認識結果を確定する。これにより、第1の実施形態によれば、保守作業者は、機器データを取得するための撮影をやり直す必要がなくなる。
【0123】
この結果、第1の実施形態によれば、撮影により現場機器の機器データを取得する際の作業者の作業負荷を低減させることができる。
【0124】
[第2の実施形態]
上記第1の実施形態では、動画像データの撮影中に機器データが正しく取得できたか否かに関わらず、保守作業者は、シャッタ操作を行うことができたが、機器データが正しく取得できるまで、シャッタ操作を行うことができないように構成してもよい。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
【0125】
<情報端末の機能構成>
図12は、情報端末の機能構成の一例を示す第2の図である。
図4を用いて説明した第1の実施形態に係る情報端末120の機能構成との相違点は、操作受付部1201の機能が、操作受付部401の機能とは異なる点である。
【0126】
第2の実施形態に係る情報端末120において、操作受付部1201は、保守作業者130による撮影開始の操作を受け付けて、取得部402に撮影開始の指示を通知するとともに、第1記憶部425の監視を開始する。
【0127】
具体的には、操作受付部1201は、第1記憶部425に、対象項目(機種名、製造番号、製造年月)についての文字認識結果が記憶されたか否かを監視する。そして、操作受付部1201は、文字認識結果が記憶されていないと判定した場合には、保守作業者130によるシャッタ操作を受け付けない。一方、操作受付部1201は、文字認識結果が記憶されたと判定した場合には、保守作業者130によるシャッタ操作を受け付け、第2記憶制御部409にシャッタ操作があったことを通知する。
【0128】
<まとめ>
以上の説明から明らかなように、第2の実施形態に係る情報端末120は、撮影開始の操作が行われた後、機器データが正しく取得できるまで、シャッタ操作を行うことができないように構成する。
【0129】
これにより、第2の実施形態によれば、保守作業者は、撮影のやり直しを確実になくすことができる。
【0130】
[その他の実施形態]
上記第1及び第2の実施形態では、文字認識結果を確定させるための操作として、シャッタ操作を割り当てる場合について説明したが、文字認識結果を確定させるための操作には、シャッタ操作以外の操作を割り当ててもよい。
【0131】
また、上記第1及び第2の実施形態では、シャッタ操作を行うことで、動画像データの撮影を終了し、文字認識結果を確定させることとした。しかしながら、動画像データの撮影終了及び文字認識結果の確定は、第1記憶部425に、対象項目についての文字認識結果が記憶されたことを条件に自動的に実行されるように構成してもよい。
【0132】
また、上記第1及び第2の実施形態では、全ての対象項目について文字認識結果が得られた場合に、第1記憶部425に記憶するものとして説明した。しかしながら、第1記憶部425に記憶する方法はこれに限定されない。例えば、上記第1及び第2の実施形態のように、対象項目が複数含まれ、かつ、対象項目のいずれかについて文字認識結果が取得された場合、当該取得された文字認識結果を、対応する対象項目の文字認識結果として上書きするように構成してもよい。つまり、対象項目単位で個別に文字認識結果を記憶するように構成してもよい。
【0133】
また、上記第1及び第2の実施形態では、機器銘板から機器データを読み取る場合について説明したが、機器データを読み取る対象は、機器銘板に限定されない。あるいは、機器銘板から読み取る対象は、機器データに限定されない。更に、撮像装置が撮影する対象は機器銘板に限定されず、特定の文字列が含まれていれば、機器銘板以外であってもよい。
【0134】
また、上記第1及び第2の実施形態では、現場機器が空調機器の室外機である場合の機器データルールについて例示したが、現場機器が異なる場合には、異なる現場機器に応じた機器データルールが用いられるものとする。同様に、上記第1及び第2の実施形態では、現場機器が空調機器の室外機である場合のラベルについて例示したが、現場機器が異なる場合には、異なる現場機器に応じたラベルが用いられるものとする。
【0135】
また、上記第1及び第2の実施形態では、説明の便宜上、表示されるフレーム画像に、当該フレーム画像から取得された文字認識結果を重畳表示するものとして説明した。しかしながら、文字認識結果を取得して重畳するまでには、一定の時間を要するため、文字認識結果が取得されたフレーム画像と、取得された文字認識結果が重畳されるフレーム画像とは、一致していなくてもよい。
【0136】
以上、実施形態を説明したが、特許請求の範囲の趣旨及び範囲から逸脱することなく、形態や詳細の多様な変更が可能なことが理解されるであろう。
【符号の説明】
【0137】
110 :現場機器
111 :機器銘板
120 :情報端末
121 :撮影画像
305 :撮像装置
401 :操作受付部
402 :取得部
403 :認識部
404 :修正部
405 :抽出部
406 :判定部
407 :バウンディングボックス生成部
408 :第1記憶制御部
409 :第2記憶制御部
410 :表示部
411 :手動修正部
1201 :操作受付部