IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ NECソリューションイノベータ株式会社の特許一覧

特開2024-126079文字列認識支援装置、文字列認識支援方法、プログラム及び記録媒体
<>
  • 特開-文字列認識支援装置、文字列認識支援方法、プログラム及び記録媒体 図1
  • 特開-文字列認識支援装置、文字列認識支援方法、プログラム及び記録媒体 図2
  • 特開-文字列認識支援装置、文字列認識支援方法、プログラム及び記録媒体 図3
  • 特開-文字列認識支援装置、文字列認識支援方法、プログラム及び記録媒体 図4
  • 特開-文字列認識支援装置、文字列認識支援方法、プログラム及び記録媒体 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024126079
(43)【公開日】2024-09-20
(54)【発明の名称】文字列認識支援装置、文字列認識支援方法、プログラム及び記録媒体
(51)【国際特許分類】
   G06V 30/10 20220101AFI20240912BHJP
【FI】
G06V30/10
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023034229
(22)【出願日】2023-03-07
(71)【出願人】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】100115255
【弁理士】
【氏名又は名称】辻丸 光一郎
(74)【代理人】
【識別番号】100201732
【弁理士】
【氏名又は名称】松縄 正登
(74)【代理人】
【識別番号】100154081
【弁理士】
【氏名又は名称】伊佐治 創
(74)【代理人】
【識別番号】100227019
【弁理士】
【氏名又は名称】安 修央
(72)【発明者】
【氏名】堀場 裕司
(72)【発明者】
【氏名】竹内 拓也
(72)【発明者】
【氏名】遠山 貴大
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AA05
5B064AB02
5B064AB03
5B064AB08
5B064BA01
5B064DA19
(57)【要約】
【課題】 文字列認識用画像の撮像条件のばらつきを抑制できる文字列認識支援装置を提供する。
【解決手段】 本発明の文字列認識支援装置は、画像取得部、文字列候補領域設定部、評価値算出部、及び画像選択部を含み、
前記画像取得部は、文字列認識対象画像を取得し、
前記文字列候補領域設定部は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出部は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記画像選択部は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択する。
【選択図】 図1

【特許請求の範囲】
【請求項1】
画像取得部、文字列候補領域設定部、評価値算出部、及び画像選択部を含み、
前記画像取得部は、文字列認識対象画像を取得し、
前記文字列候補領域設定部は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出部は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択部は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択する、文字列認識支援装置。
【請求項2】
前記文字列候補領域設定部は、基準文字列情報を用いて前記文字列認識対象画像に対し、前記文字列候補領域を設定する、請求項1記載の文字列認識支援装置。
【請求項3】
前記評価値算出部は、前記評価値として、文字列を構成する文字の一致数、文字認識の確信度、及び撮像条件の値からなる群から選択された少なくとも一つを算出する、請求項1又は2記載の文字列認識支援装置。
【請求項4】
前記画像選択部は、前記評価値が閾値未満の状況が所定条件を満たす場合、前記評価値に基づいて文字列認識用画像を選択する、請求項1又は2に記載の文字列認識支援装置。
【請求項5】
文字列認識部を含み、
前記文字列認識部は、前記文字列認識用画像から文字列認識を行う、請求項1又は2に記載の文字列認識支援装置。
【請求項6】
画像取得工程、文字列候補領域設定工程、評価値算出工程、及び画像選択工程を含み、
前記画像取得工程は、文字列認識対象画像を取得し、
前記文字列候補領域設定工程は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出工程は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択工程は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択する、文字列認識支援方法。
【請求項7】
前記文字列候補領域設定工程は、基準文字列情報を用いて前記文字列認識対象画像に対し、前記文字列候補領域を設定する、請求項6記載の文字列認識支援方法。
【請求項8】
前記評価値算出工程は、前記評価値として、文字列を構成する文字の一致数、文字認識の確信度、及び撮像条件の値からなる群から選択された少なくとも一つを算出する、請求項6又は7記載の文字列認識支援方法。
【請求項9】
画像取得手順、文字列候補領域設定手順、評価値算出手順、及び画像選択手順を含み、
前記画像取得手順は、文字列認識対象画像を取得し、
前記文字列候補領域設定手順は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出手順は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択手順は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択し、
前記各手順を、コンピュータに実行させるためのプログラム。
【請求項10】
画像取得手順、文字列候補領域設定手順、評価値算出手順、及び画像選択手順を含み、
前記画像取得手順は、文字列認識対象画像を取得し、
前記文字列候補領域設定手順は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出手順は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択手順は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択し、
前記各手順を、コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字列認識支援装置、文字列認識支援方法、プログラム及び記録媒体に関する。
【背景技術】
【0002】
生産ラインを流れる製品について、誤出荷、取り違えなどを防止するために製品を個別に管理する必要がある。この際、バーコードやRFID等のタグを取り付けて管理されることが一般的に行われている。他方、鉄鋼製品等、製品加工時の環境が過酷な製品では、タグの耐久性が足りず、取り付けることができない。この場合、製品に直接文字を印字(例えば、刻印印字、スタンプ印字、ステンシル吹き付け等)して管理が行われている(例えば、特許文献1等)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-164940号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
このような状況において、画像認識により製品の識別情報を取得するため、製品の画像を撮像するが、文字認識の精度には、画像の撮像条件が密接に関わる。この点は、画像認識により物品の識別情報を管理している様々な分野において同様である。このため、撮像条件のばらつきを抑制する手法が求められている。
【0005】
そこで本発明は、文字列認識用画像の撮像条件のばらつきを抑制できる文字列認識支援装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
前記目的を達成するために、本発明の文字列認識支援装置は、
画像取得部、文字列候補領域設定部、評価値算出部、及び画像選択部を含み、
前記画像取得部は、文字列認識対象画像を取得し、
前記文字列候補領域設定部は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出部は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択部は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択する。
【0007】
本発明の文字列認識支援方法は、
画像取得工程、文字列候補領域設定工程、評価値算出工程、及び画像選択工程を含み、
前記画像取得工程は、文字列認識対象画像を取得し、
前記文字列候補領域設定工程は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出工程は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択工程は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択する。
【0008】
本発明のプログラムは、画像取得手順、文字列候補領域設定手順、評価値算出手順、及び画像選択手順を含み、
前記画像取得手順は、文字列認識対象画像を取得し、
前記文字列候補領域設定手順は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出手順は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択手順は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択し、
前記各手順を、コンピュータに実行させるためのプログラムである。
【0009】
本発明の記録媒体は、
画像取得手順、文字列候補領域設定手順、評価値算出手順、及び画像選択手順を含み、
前記画像取得手順は、文字列認識対象画像を取得し、
前記文字列候補領域設定手順は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出手順は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択手順は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択し、
前記各手順を、コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0010】
本発明によれば、文字列認識用画像の撮像条件のばらつきを抑制できる。
【図面の簡単な説明】
【0011】
図1図1は、実施形態1の文字列認識支援装置の一例の構成を示すブロック図である。
図2図2は、実施形態1の文字列認識支援装置のハードウェア構成の一例を示すブロック図である。
図3図3は、実施形態1の文字列認識支援装置における処理の一例を示すフローチャートである。
図4図4は、実施形態2の文字列認識支援装置の一例の構成を示すブロック図である。
図5図5は、実施形態2の文字列認識支援装置における処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0012】
次に、本発明の実施形態について図を用いて説明する。本発明は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。
【0013】
[実施形態1]
本実施形態の文字列認識支援装置について、図1を用いて説明する。図1は、本実施形態の文字列認識支援装置10の一例の構成を示すブロック図である。図1に示すように、文字列認識支援装置10(以下、「本装置10」ともいう)は、画像取得部11、文字列候補領域設定部12、評価値算出部13、及び画像選択部14を含む。また、図示していないが、本装置10は、例えば、記憶部、入力部、及び出力部を含んでもよい。
【0014】
本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。また、本装置10は、通信回線網を介して、後述する外部装置と接続可能である。通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等があげられる。無線通信としては、例えば、Wi-Fi(登録商標)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置10は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。本装置10は、対象物を撮像可能な撮像端末(例えば、カメラ付きのスマートフォン、タブレット端末等)であってもよいし、前記撮像端末と通信可能な装置であってもよい。さらに、本装置10は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。
【0015】
図2に、本装置10のハードウェア構成のブロック図を例示する。本装置10は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、出力装置106、通信デバイス107等を含む。本装置10の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。
【0016】
中央処理装置101は、コントローラ(システムコントローラ、I/Oコントローラ等)等により、他の構成と連携動作し、本装置10の全体の制御を担う。本装置10において、中央処理装置101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、中央処理装置101が、画像取得部11、文字列候補領域設定部12、評価値算出部13、及び画像選択部14として機能する。本装置10は、演算装置として、CPU、GPU(Graphics Processing Unit)、APU(Accelerated Processing Unit)等の他の演算装置を備えてもよいし、これらの組合せを備えてもよい。
【0017】
バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、外部記憶装置(外部データベース等)、プリンタ、外部入力装置、外部表示装置、スピーカ等の音声出力装置、カメラ等の外部撮像装置、および加速度センサ、地磁気センサ、方向センサ等の各種センサ等があげられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、ユーザの端末等の他の装置と接続することもできる。
【0018】
メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。中央処理装置101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ102が読み込み、中央処理装置101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。
【0019】
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。本装置10が、例えば、前記記憶部を含む場合、記憶装置104が前記記憶部として機能する。記憶装置104は、例えば、後述する文字列認識対象画像、文字列候補領域、評価値、閾値、文字列認識用画像、基準文字列情報の少なくとも一つを記憶していてもよい。
【0020】
本装置10において、メモリ102及び記憶装置104は、ログ情報、外部データベース(図示せず)や外部の装置から取得した情報、本装置10によって生成した情報、本装置10が処理を実行する際に用いる情報等の種々の情報を記憶することも可能である。なお、少なくとも一部の情報は、例えば、メモリ102及び記憶装置104以外の外部サーバに記憶されていてもよいし、複数の端末にブロックチェーン技術等を用いて分散して記憶されていてもよい。
【0021】
本装置10は、例えば、さらに、入力装置105、出力装置106を備える。入力装置105は、例えば、タッチパネル、トラックパッド、マウス等のポインティングデバイス;キーボード;カメラ、スキャナ等の撮像手段;ICカードリーダ、磁気カードリーダ等のカードリーダ;マイク等の音声入力手段;等があげられる。出力装置106は、例えば、LEDディスプレイ、液晶ディスプレイ等の表示装置;スピーカ等の音声出力装置;プリンタ;等があげられる。本実施形態1において、入力装置105と出力装置106とは、別個に構成されているが、入力装置105と出力装置106とは、タッチパネルディスプレイのように、一体として構成されてもよい。
【0022】
つぎに、本実施形態の文字列認識支援方法の一例を、図3のフローチャートに基づき説明する。本実施形態の文字列認識支援方法は、例えば、図1から図2に示す文字列認識支援装置10を用いて、次のように実施する。なお、本実施形態の文字列認識支援方法は、図1から図2の文字列認識支援装置10の使用には限定されない。
【0023】
まず、文字列認識支援装置10の画像取得部11は、文字列認識対象画像を取得する(S1、画像取得工程)。前記文字列認識対象画像は、例えば、文字列の認識を行う候補となる画像であり、文字列を含む画像であってもよいし、文字列を含まない画像であってもよいし、文字列を含むか否か不明な画像でもよい。前記文字列は、例えば、既知の文字列であってもよいし、未知の文字列であってもよいが、既知の文字列であることが好ましい。前記文字列が含む文字は、特に制限されず、例えば、英字、数字、記号、ひらがな、カタカナ、漢字、その他の文字およびこれらの組み合わせがあげられる。前記文字列の具体例としては、例えば、生産ラインにおける製品を識別する情報(シリアルナンバー、製造番号、ロット番号等)があげられる。前記文字列認識対象画像に含まれる文字列は、例えば、通常のOCR処理によっては文字認識が困難な文字を含むことが好ましい。「通常のOCR処理によっては文字認識が困難な文字」とは、特に制限されず、例えば、ステンシル吹付、スタンプ印字、または刻印印字等の手段によって印字された文字、または手書き文字等があげられる。画像取得部11は、本装置10が備えるカメラ等の撮像装置により、前記文字列認識対象画像を取得してもよいし、通信回線網を介して本装置外部の撮像装置から前記文字列認識対象画像を取得してもよい。前記文字列認識対象画像は、例えば、動画でもよいし静止画でもよく、また、撮像済みの画像でもよいし、撮像プレビュー画像でもよい。前記文字列認識対象画像が撮像プレビュー画像である場合、画像取得部11は、例えば、前記撮像プレビュー画像をリアルタイムに取得する。画像取得部11は、例えば、取得した前記文字列認識対象画像を記憶装置104またはメモリ102に記憶してもよい。
【0024】
つぎに、文字列候補領域設定部12は、前記文字列認識対象画像に対し、文字列候補領域を設定する(S2、文字列候補領域設定工程)。文字列候補領域設定部12は、例えば、前記文字列認識対象画像が文字を含むか否かを認識し、認識した前記文字を含む領域を前記文字列候補領域として設定できる。文字列候補領域設定部12は、例えば、深層学習を利用した処理により前記文字を認識してもよいし、公知の画像処理手法を利用して前記文字を認識してもよい。前記深層学習を利用した文字の認識は、例えば、本装置10が含むGPUにより実行してもよいし、CPUにより実行してもよいし、CPUGPUにより実行してもよい。また、文字列候補領域設定部12は、例えば、基準文字列情報を用いて前記文字列認識対象画像に対し、前記文字列候補領域を設定してもよい。前記基準文字列情報は、例えば、前記文字列認識対象画像に含まれる可能性のある文字列のテンプレートの情報である。前記基準文字列情報は、例えば、1種類でもよいし2種類以上の複数であってもよいが、2種類以上の複数であることが好ましい。この場合、文字列候補領域設定部12は、例えば、前記文字列認識対象画像と前記基準文字列情報とを比較し、前記文字列認識対象画像において、前記基準文字列情報の少なくとも一つと一致する可能性のある領域を前記文字列候補領域として設定できる。前記基準文字列情報は、例えば、前記記憶部に記憶されていてもよいし、外部のデータベースに記憶されていてもよい。文字列候補領域設定部12は、例えば、設定した文字列候補領域について、バインディングボックス等を表示して視覚的に表示可能であってもよい。この場合、文字列候補領域設定部12は、例えば、認識した文字の周囲に所定の大きさの余白を設定し、前記余白を含む文字周辺の領域を前記文字列候補領域として設定できる。前記余白の大きさは、特に制限されず、任意の大きさが設定できる。前記文字列候補領域が文字及び文字の余白を含むことにより、例えば、文字列が含む文字の一部が文字列候補領域から外れることを抑制できる。文字列候補領域設定部12は、例えば、設定した前記文字列候補領域を記憶装置104またはメモリ102に記憶してもよい。この場合、例えば、文字列候補領域設定部12は、前記文字列候補領域と、文字列候補領域を設定した文字列認識対象画像とを紐づけて記憶できる。
【0025】
つぎに、評価値算出部13は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出する(S3、評価値算出工程)。前記評価値は、前記文字列候補領域の文字認識適性を示す指標である。評価値算出部13は、例えば、前記評価値として、文字列を構成する文字の一致数、文字認識の確信度、及び撮像条件の値からなる群から選択された少なくとも一つを算出することが好ましい。前記文字列を構成する文字の一致数および前記文字認識の確信度は、例えば、深層学習を利用した処理により、前記文字列候補領域を評価して前記確信度を算出してもよいし、テンプレートマッチング等の公知のパターンマッチング処理を用いた画像処理方法により、前記文字列候補領域の文字列候補と基準文字列情報とを比較することにより算出してもよい。前記基準文字列情報は、例えば、前述の通りである。前記深層学習を利用した処理は、例えば、テンプレートマッチングに類似する構造の深層学習ネットワークを用いることにより実行できる。評価値算出部13は、例えば、前記文字列候補領域と前記基準文字列情報とを比較して、例えば、前記文字列候補領域が含む文字列を構成する各文字について、前記基準文字情報を構成する文字との一致数を算出できる。評価値算出部13は、例えば、前記パターンマッチング処理により、前記文字列候補領域の文字列候補と基準文字列情報との類似度を算出し、算出した類似度(確信度ともいう)を、前記評価値として算出できる。前記撮像条件の値は、特に制限されず、例えば、前記文字列認識対象画像の撮像品質を示す指標である。前記撮像条件の具体例としては、例えば、エッジ強度、及びコントラスト等の値があげられる。評価値算出部13は、例えば、前記評価値として、例えば、前記文字列認識対象画像の背景画像と、文字列認識対象画像の文字領域の濃淡値をそれぞれ算出し、前記濃淡値の差を前記コントラストとして算出できる。また、評価値算出部13は、例えば、前記評価値として、前記文字列認識対象画像の画素値の変化の大きさをエッジ強度として算出できる。評価値算出部13が算出する評価値は、例えば、1種類でもよいが、2種類以上の複数であることが好ましく、文字列を構成する文字の一致数、文字認識の確信度、及び撮像条件の値の組み合わせであることがさらに好ましい。評価値算出部13は、例えば、算出した前記評価値を記憶装置104またはメモリ102に記憶してもよい。この場合、評価値算出部13は、例えば、前記文字列候補領域と、文字列候補領域を設定した文字列認識対象画像とを紐づけて記憶できる。
【0026】
つぎに、画像選択部14は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択する(S4、画像選択工程)。前記閾値は、特に制限されず、例えば、前記評価値の種類毎に設定できる。前記評価値が前記文字認識の確信度を含む場合、前記閾値は、例えば、前記テンプレートマッチングの確信度の任意の値を設定できる。具体例として、前記テンプレートマッチングの確信度が0~1.0で算出される場合、前記閾値は、例えば、0.4以上、0.5以上、0.6以上、0.65以上、0.7以上、又は0.8以上に設定できる。前記評価値が前記文字の一致数を含む場合、前記閾値は、例えば、前記文字の一致数の絶対値を設定してもよいし、文字列全体に対する一致した文字の割合を設定してもよい。前記評価値が前記撮像条件の値を含む場合、前記閾値は、例えば、前記文字列認識対象画像における、背景画像と文字領域の濃淡値の差を設定できる。具体例として、前記撮像条件がエッジ強度である場合、例えば、前記濃淡値の差の閾値を20以上に設定できる。また、前記撮像条件がコントラストである場合、前記濃淡値の差の閾値を10以上に設定できる。前記評価値が複数の種類の指標を含む場合、画像選択部14は、例えば、全ての評価値が閾値以上である文字列認識対象画像を文字列認識用画像として選択してもよいし、一部の評価値が閾値以上である文字列認識対象画像を文字列認識用画像として選択してもよい。画像選択部14が、例えば、複数の評価値に基づいて文字列認識用画像を選択することでより適切な画像を前記文字列認識用画像として選択できる。また、前記文字列認識対象画像がプレビュー画像である場合、画像選択部14は、前記閾値以上の文字列認識対象画像を、前記文字列認識用画像として選択し、選択した画像を撮像してもよい。画像選択部14は、例えば、選択した前記文字列認識用画像を記憶装置104またはメモリ102に記憶してもよい。
【0027】
また、画像選択部14は、例えば、前記評価値が閾値未満の状況が所定条件を満たす場合、前記評価値に基づいて文字列認識用画像を選択してもよい。前記「状況が所定条件を満たす場合」は、例えば、文字列認識用画像の撮像時間が所定時間を超えた場合、文字列認識対象画像の撮影回数が所定回数を超えた場合、前記文字列認識用画像のデータの大きさが所定の大きさを超えた場合等があげられる。前記評価値に基づく選択は、例えば、前記評価値が最も高い画像を選択してもよいし、前記評価値が高い順に複数の画像を選択してもよい。
【0028】
本装置10は、例えば、前記出力部により、選択した前記文字列認識用画像を出力してもよい。この場合、本装置10は、例えば、前記文字列認識用画像を本装置10の出力装置106に出力してもよいし、外部装置に出力してもよい。前記外部装置は、例えば、文字認識機能を有する装置があげられる。また、本装置10は、例えば、実施形態2で後述する文字列認識部に前記文字列認識用画像を出力してもよい。
【0029】
本実施形態の文字列認識支援装置10によれば、文字列認識対象画像の評価値を算出し、前記評価値に基づいて文字認識用画像を選択できる。このため、本実施形態の文字列認識支援装置10によれば、文字列認識用画像の撮像条件のばらつきを抑制できる。
【0030】
[実施形態2]
実施形態2は、本発明の文字列認識支援装置の他の例である。
【0031】
本実施形態の文字列認識支援装置は、実施形態1の文字列認識支援装置10の構成に加えて、文字列認識部を含むこと以外は前記実施形態1の文字列認識支援装置10と同様であり、その説明を援用できる。本実施形態の文字列認識支援装置10Aは、例えば、文字列認識部を含み、前記文字列認識部は、前記文字列認識用画像から文字列認識を行う。
【0032】
図4は、本実施形態の文字列認識支援装置10Aの一例の構成を示すブロック図である。図4に示すように、文字列認識支援装置10Aは、実施形態1の文字列認識支援装置10の構成に加えて、文字列認識部15を含む。文字列認識支援装置10Aのハードウェア構成は、図2の文字列認識支援装置10のハードウェア構成において、中央処理装置101が、図1の文字列認識支援装置10の構成に代えて、図4の文字列認識支援装置10Aの構成を備える以外は同様である。以下、文字列認識部15の処理を説明する。文字列認識部15の処理は、例えば、前記実施形態1で説明した図3のフローチャートにおける任意の位置に適宜挿入できるが、図5に示すように、S4の後に挿入されることが好ましい。
【0033】
まず、前記実施形態1の文字列認識支援方法におけるS1~S4と同様にして、S1~S4を実施し、文字列認識用画像を選択する。
【0034】
つぎに、文字列認識部15は、前記文字列認識用画像から文字列認識を行う(S5、文字列認識工程)。前記文字列認識は、例えば、深層学習を利用した処理により前記文字列を認識してもよいし、一般の文字列認識処理(例えば、光学文字列認識(Optical character recognition:OCR))と同様にして実施してもよい。前記深層学習を利用した文字列の認識は、例えば、本装置10Aが含むGPUにより実行してもよいし、CPUにより実行してもよいし、CPUGPUにより実行してもよい。
【0035】
本発明の文字列認識支援装置によれば、文字列認識対象画像の評価値を算出し、前記評価値に基づいて選択した文字認識用画像から文字列を認識できる。このため、本実施形態の文字列認識支援装置10によれば、文字列認識用画像の撮像条件のばらつきを抑制でき、結果的に、文字認識の精度を向上できる。また、例えば、生産ライン等において、中間品や製品等の管理番号の認識を画像処理により行う場合、管理番号を含む画像の撮像条件が安定しないと文字認識の精度が出ず、作業員のフラストレーションがたまり、さらに撮像条件が不安定になるという悪循環が発生する場合がある。このような場合において、本発明の文字列認識支援装置によれば、文字列候補領域の評価値に基づいて文字列認識用画像を選択できるため、文字認識の精度を向上させることが可能となる。
【0036】
[実施形態3]
本実施形態のプログラムは、前述の文字列認識支援方法の各工程を、コンピュータに実行させるためのプログラムである。具体的に、本実施形態のプログラムは、コンピュータに、画像取得手順、文字列候補領域設定手順、評価値算出手順、及び画像選択手順を実行させるためのプログラムである。
【0037】
前記画像取得手順は、文字列認識対象画像を取得し、
前記文字列候補領域設定手順は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出手順は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記画像選択手順は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択する。
【0038】
また、本実施形態のプログラムは、コンピュータを、画像取得手順、文字列候補領域設定手順、評価値算出手順、及び画像選択手順として機能させるプログラムということもできる。
【0039】
本実施形態のプログラムは、前記本発明の文字列認識支援装置および文字列認識支援方法における記載を援用できる。前記各手順は、例えば、「手順」を「処理」と読み替え可能である。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体は、特に制限されず、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、ハードディスク(HD)、フラッシュメモリー(例えば、SSD(Solid State Drive)、USBフラッシュメモリー、SD/SDHCカード等)、光ディスク(例えば、CD‐R/CD‐RW、DVD‐R/DVD‐RW、BD‐R/BD‐RE等)、光磁気ディスク(MO)、フロッピー(登録商標)ディスク(FD)等があげられる。また、本実施形態のプログラム(例えば、プログラミング製品、又はプログラム製品ともいう)は、例えば、外部のコンピュータから配信される形態であってもよい。前記「配信」は、例えば、通信回線網を介した配信でもよいし、有線で接続された装置を介した配信であってもよい。本実施形態のプログラムは、配信された装置にインストールされて実行されてもよいし、インストールされずに実行されてもよい。
【0040】
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。
【0041】
<付記>
上記の実施形態の一部または全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
画像取得部、文字列候補領域設定部、評価値算出部、及び画像選択部を含み、
前記画像取得部は、文字列認識対象画像を取得し、
前記文字列候補領域設定部は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出部は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択部は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択する、文字列認識支援装置。
(付記2)
前記文字列候補領域設定部は、基準文字列情報を用いて前記文字列認識対象画像に対し、前記文字列候補領域を設定する、付記1記載の文字列認識支援装置。
(付記3)
前記評価値算出部は、前記評価値として、文字列を構成する文字の一致数、文字認識の確信度、及び撮像条件の値からなる群から選択された少なくとも一つを算出する、付記1又は2記載の文字列認識支援装置。
(付記4)
前記画像選択部は、前記評価値が閾値未満の状況が所定条件を満たす場合、前記評価値に基づいて文字列認識用画像を選択する、付記1から3のいずれかに記載の文字列認識支援装置。
(付記5)
文字列認識部を含み、
前記文字列認識部は、前記文字列認識用画像から文字列認識を行う、付記1から4のいずれかに記載の文字列認識支援装置。
(付記6)
画像取得工程、文字列候補領域設定工程、評価値算出工程、及び画像選択工程を含み、
前記画像取得工程は、文字列認識対象画像を取得し、
前記文字列候補領域設定工程は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出工程は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択工程は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択する、文字列認識支援方法。
(付記7)
前記文字列候補領域設定工程は、基準文字列情報を用いて前記文字列認識対象画像に対し、前記文字列候補領域を設定する、付記6記載の文字列認識支援方法。
(付記8)
前記評価値算出工程は、前記評価値として、文字列を構成する文字の一致数、文字認識の確信度、及び撮像条件の値からなる群から選択された少なくとも一つを算出する、付記6又は7記載の文字列認識支援方法。
(付記9)
前記画像選択工程は、前記評価値が閾値未満の状況が所定条件を満たす場合、前記評価値に基づいて文字列認識用画像を選択する、付記6から8のいずれかに記載の文字列認識支援方法。
(付記10)
文字列認識工程を含み、
前記文字列認識工程は、前記文字列認識用画像から文字列認識を行う、付記6から9のいずれかに記載の文字列認識支援方法。
(付記11)
画像取得手順、文字列候補領域設定手順、評価値算出手順、及び画像選択手順を含み、
前記画像取得手順は、文字列認識対象画像を取得し、
前記文字列候補領域設定手順は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出手順は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択手順は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択し、
前記各手順を、コンピュータに実行させるためのプログラム。
(付記12)
前記文字列候補領域設定手順は、基準文字列情報を用いて前記文字列認識対象画像に対し、前記文字列候補領域を設定する、付記11記載のプログラム。
(付記13)
前記評価値算出手順は、前記評価値として、文字列を構成する文字の一致数、文字認識の確信度、及び撮像条件の値からなる群から選択された少なくとも一つを算出する、付記11又は12記載のプログラム。
(付記14)
前記画像選択手順は、前記評価値が閾値未満の状況が所定条件を満たす場合、前記評価値に基づいて文字列認識用画像を選択する、付記11から13のいずれかに記載のプログラム。
(付記15)
文字列認識手順を含み、
前記文字列認識手順は、前記文字列認識用画像から文字列認識を行う、付記11から14のいずれかに記載のプログラム。
(付記16)
画像取得手順、文字列候補領域設定手順、評価値算出手順、及び画像選択手順を含み、
前記画像取得手順は、文字列認識対象画像を取得し、
前記文字列候補領域設定手順は、前記文字列認識対象画像に対し、文字列候補領域を設定し、
前記評価値算出手順は、前記文字列候補領域が設定された文字列認識対象画像の評価値を算出し、
前記評価値は、前記文字列候補領域の文字認識適性を示す指標であり、
前記画像選択手順は、前記評価値が閾値以上の文字列認識対象画像を文字列認識用画像として選択し、
前記各手順を、コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
(付記17)
前記文字列候補領域設定手順は、基準文字列情報を用いて前記文字列認識対象画像に対し、前記文字列候補領域を設定する、付記16記載の記録媒体。
(付記18)
前記評価値算出手順は、前記評価値として、文字列を構成する文字の一致数、文字認識の確信度、及び撮像条件の値からなる群から選択された少なくとも一つを算出する、付記16又は17記載の記録媒体。
(付記19)
前記画像選択手順は、前記評価値が閾値未満の状況が所定条件を満たす場合、前記評価値に基づいて文字列認識用画像を選択する、付記16から18のいずれかに記載の記録媒体。
(付記20)
文字列認識手順を含み、
前記文字列認識手順は、前記文字列認識用画像から文字列認識を行う、付記16から19のいずれかに記載の記録媒体。
【産業上の利用可能性】
【0042】
本発明によれば、文字列認識対象画像の評価値を算出し、前記評価値に基づいて文字認識用画像を選択できる。このため、本発明によれば、文字列認識用画像の撮像条件のばらつきを抑制できる。したがって、本発明は、文字認識を利用する分野において広く有用である。
【符号の説明】
【0043】
10 文字列認識支援装置
11 画像取得部
12 文字列候補領域設定部
13 評価値算出部
14 画像選択部
15文字列認識部
101 中央処理装置
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 出力装置
107 通信デバイス

図1
図2
図3
図4
図5