(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023066725
(43)【公開日】2023-05-16
(54)【発明の名称】磁気インク文字認識方法およびそれを実行する磁気インク文字認識システム
(51)【国際特許分類】
G06V 30/24 20220101AFI20230509BHJP
G06V 30/14 20220101ALI20230509BHJP
【FI】
G06K9/62 620D
G06K9/20 360A
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2021177487
(22)【出願日】2021-10-29
(71)【出願人】
【識別番号】000104652
【氏名又は名称】キヤノン電子株式会社
(72)【発明者】
【氏名】奥村 晴彦
【テーマコード(参考)】
5B029
5B064
【Fターム(参考)】
5B029AA04
5B029BB07
5B029CC09
5B029CC22
5B064BA03
5B064DA03
5B064DA27
5B064EA11
(57)【要約】 (修正有)
【課題】学習により磁気インク文字認識の認識率を向上させる磁気インク文字認識方法及びそれを実行する磁気インク文字認識システムを提供する。
【解決手段】磁気インク文字認識方法は、磁気インク文字出力波形データとを紐づけたデータを用いて学習が実行された学習モデルを用いて、シート搬送装置を搬送されるシートに印刷された磁気インク文字の文字認識を行う認識ステップS2002と、シート搬送装置のオペレータに磁気インク文字認識の結果を確認させる確認ステップにおいてオペレータが入力した修正内容に基づいて磁気インク文字認識の結果を修正する修正ステップS2005と、修正ステップにおいて修正された磁気インク文字認識の結果を学習用データとして機械学習ステップS2009が実行された学習モデルを用いて、シート搬送装置を搬送されるシートに印刷された磁気インク文字認識を行う修正後認識ステップとを有する。
【選択図】
図9
【特許請求の範囲】
【請求項1】
シート搬送装置を搬送されるシートに印字された磁気インク文字を磁気処理部により認識する磁気インク文字認識方法であって、
前記磁気インク文字と前記磁気インク文字に対応する磁気インク文字出力波形データとを紐づけたデータを学習用データとして学習モデルにて機械学習を行う学習ステップと、
前記学習ステップで機械学習が実行された学習モデルを用いて、前記シート搬送装置を搬送されるシートに印刷された磁気インク文字の文字認識を行う認識ステップと、
前記シート搬送装置のオペレータに磁気インク文字認識の結果を確認させる確認ステップにおいて前記オペレータが入力した修正内容に基づいて磁気インク文字認識の結果を修正する修正ステップと、
前記修正ステップにおいて修正された磁気インク文字認識の結果を前記学習用データとして機械学習が実行された前記学習モデルを用いて、前記シート搬送装置を搬送されるシートに印刷された磁気インク文字認識を行う修正後認識ステップと
を有することを特徴とする磁気インク文字認識方法。
【請求項2】
シート搬送装置を搬送されるシートに印字された磁気インク文字を磁気処理部により認識する磁気インク文字認識方法であって、
前記磁気インク文字と前記磁気インク文字に対応する磁気インク文字出力波形データとを紐づけたデータと、前記シート搬送装置を搬送されるシートの読み取り画像とを学習用データとして学習モデルにて機械学習を行う学習ステップと、
前記学習ステップで機械学習が実行された学習モデルを用いて、前記シート搬送装置を搬送されるシートに印刷された磁気インク文字認識を行う認識ステップと
を有することを特徴とする磁気インク文字認識方法。
【請求項3】
前記学習用データとして、シートの状態に関する情報を含むことを特徴とする請求項1または2に記載の磁気インク文字認識方法。
【請求項4】
前記シートの状態に関する情報は、前記シートに印字された磁気インク文字のフォントの種類であることを特徴とする請求項3に記載の磁気インク文字認識方法。
【請求項5】
前記学習用データは、前記シート搬送装置を搬送される前記シートの搬送状態を検知するシート搬送状態検知手段が取得したシート搬送状態情報を含むことを特徴とする請求項1から4のいずれか一項に記載の磁気インク文字認識方法。
【請求項6】
請求項1から5のいずれか一項に記載の磁気インク文字認識方法を実行する磁気インク文字認識システムであって、
前記学習モデルを外部装置から受け付ける入力手段を備え、前記学習ステップで機械学習が実行された前記学習モデルを用いて磁気インク文字認識を行うことを特徴とする磁気インク文字認識システム。
【請求項7】
前記学習用データを外部装置に出力する出力手段を備えることを特徴とする請求項6に記載の磁気インク文字認識システム。
【請求項8】
前記学習用データは、前記シート搬送装置の機種識別情報を含むことを特徴とする請求項6または7に記載の磁気インク文字認識システム。
【請求項9】
前記機種識別情報は、前記シート搬送装置のシリーズ名、機種名、シート搬送速度情報、シート給紙タイミング、搬送路の搬送ローラ位置情報、装置特有の構成情報、のいずれかを含むことを特徴とする請求項8に記載の磁気インク文字認識システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、小切手や手形等のシートに印刷されている磁気インク文字を読み取るための磁気インク文字認識方法およびそれを実行する磁気インク文字認識システムや磁気インク文字認識装置に関する。
【背景技術】
【0002】
店舗での支払いや、銀行での取引などにおいては、小切手等を用いて決済が行われることがある。小切手による精算処理では、小切手の下欄に印刷された金融機関番号、支店番号、口座番号、金額等の磁気インク文字を読み取り、読み取ったデータを所定の機関に照会し、小切手の有効性を確認する。そのため小切手の精算処理において磁気インク文字の読取精度はとても重要となってくる。
【0003】
磁気インク文字を読み取るための装置として、磁気インク文字認識(MICR:Magnetic Ink Character Recognition)装置がある。磁気インク文字認識装置は、磁気インク文字に含まれる磁気情報を磁気ヘッドで読み取り、読み取った磁気情報を基に文字を認識する。
【0004】
このような装置においては、磁気インク文字の印字状態(細い、太い、傾いて印字、かすれ、磁気インクミスト、原稿折れ、等)によってMICR波形が規定された波形とは異なる状態となり、誤読又は読取不能となってしまうことがある。
【0005】
そこで、「認識不能な磁気インク文字の存在及びその位置を正確に把握でき、オペレータによる修正入力が容易な磁気インク文字データの処理方法」が提案されている(特許文献1)。
【0006】
特許文献1では、「磁気インク文字は人間及び機械の双方により読取可能な特殊形状の文字であるため、機械が認識不能な文字であっても、オペレータ等による読取りが可能である。」と示されている。
【0007】
また、「誤読率を改善した高速読取処理が可能な磁気インク読取装置及び読取方法」として、「光学文字読取装置による検証処理速度及び検証精度を向上させた磁気インク読取装置及び読取方法」が提案されている(特許文献2)。
【0008】
磁気読取装置により読み取ったデータの読取状況に応じて、誤読可能性の高い読取データのみについて光学文字読取装置による検証処理を実行することにより、無駄な検証処理をなくして全体として高速読取処理を可能にするとともに磁気文字の誤読を防止するとしている。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2004-94629号公報
【特許文献2】特許4438387号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
特許文献1は、認識不能な磁気インク文字の存在及びその位置を正確に把握でき、オペレータによる修正入力が容易となるとしている。しかし、磁気インク文字の誤読又は読取不能を低減し、認識率を向上する方法に関しては述べられていない。
【0011】
特許文献2は、誤読可能性の高い読取データのみについて光学文字読取装置による検証処理を実行することにより、無駄な検証処理をなくして全体として高速読取処理を可能にするとともに磁気文字の誤読を防止するとしている。しかし、光学文字読取を併用することが記載されているのみであり、磁気インク文字の認識率をさらに向上することについては記載がない。
【課題を解決するための手段】
【0012】
上記を鑑み、本発明に係る磁気インク文字認識方法は、
シートに印字された磁気インク文字を認識する磁気インク文字認識方法であって、
前記磁気インク文字情報と、前記磁気インク文字に対応する磁気インク文字出力波形データを、少なくとも1文字以上、紐づけて学習用データとし、前記学習用データを用いて学習を行う学習手段を備え、前記学習手段で学習済の学習済辞書を用いて磁気インク文字認識を行うことを特徴とする。
【0013】
また、前記学習用データは、オペレータによる修正前後の文字の少なくとも一方を含むことが好ましい。
【0014】
また、前記磁気インク文字を印字した前記シートの画像を取得する画像取得手段を備え、前記学習用データは、前記シートに印字された磁気インク文字に対応する画像情報を含むことが好ましい。
【0015】
また、前記磁気インク文字を印字した前記シートの搬送状態を検知するシート搬送状態検知手段を備え、前記学習用データは、前記シートに印字された磁気インク文字に対応するシート搬送状態情報を含むことが好ましい。
【0016】
また、前記シートに印字された磁気インク文字を認識する磁気インク文字認識装置であって、前記磁気インク文字と、前記磁気インク文字に対応する磁気インク文字出力波形データを、少なくとも1文字以上出力する出力手段と、前記学習済辞書を入力する入力手段を備え、前記学習済辞書を用いて磁気インク文字認識を行うことが好ましい。
【0017】
また、前記シートに印字された磁気インク文字に対応する画像情報と、前記シートに印字された磁気インク文字に対応するシート搬送状態情報の少なくとも一方をさらに出力する出力手段を備えることが好ましい。
【0018】
また、前記学習用データを用いて学習を行う学習手段を備え、前記学習手段で学習済の学習済辞書を用いて磁気インク文字認識を行うことが好ましい。
【0019】
また、前記磁気インク文字認識装置から出力された学習用データを用いて磁気インク文字認識を学習する学習手段を備え、前記学習手段で学習した学習済辞書を用いて磁気インク文字認識を行うことが好ましい。
【発明の効果】
【0020】
本発明によれば、学習により磁気インク文字認識の認識率を向上させることができる。
【図面の簡単な説明】
【0021】
【
図1】本発明の実施形態の一例である磁気インク文字認識装置を説明するための斜視図
【
図6】磁気インク文字認識装置の回路構成を示すブロック図
【
図7】磁気インク文字の学習用データ生成方法1のフローチャート
【
図8】学習用データおよび学習済MICR辞書の運用方法の説明図
【
図9】磁気インク文字の学習用データ生成方法2のフローチャート
【
図10】シート搬送状態検知部を有する磁気インク文字認識装置の内部構成図
【発明を実施するための形態】
【0022】
(実施例1)
<1、磁気インク文字認識装置の説明>
図1は、本発明の実施形態の一例である磁気インク文字認識装置を説明するための斜視図である。
図1に示すように、本実施形態の磁気インク文字認識装置300は、通信ケーブル302等を介して読み取り動作制御を行うアプリケーションとスキャナデバイスドライバとを備えたホストコンピュータ301に接続される。磁気インク文字認識装置300は、シート90が複数枚セットされる給紙部100と、シート90が排紙される第1排紙部102及び第2排紙部103とを備えている。
【0023】
図2はシート(小切手)90の一例を示す図である。シート90には、
図2に示すように所定の領域に磁気インク文字で磁気記録情報91が印字されている。小切手の場合、磁気記録情報91は
図2の左から「補助自行欄(2)」、「補助自行欄(1)」、「交換所欄(交換番号、機関コード)」、「自行データ欄」(店No・小切手No・口座No)」、「金額欄」に分けられ、各欄に磁気インク文字が印字される。
【0024】
磁気インク文字は例えば、E13B、CMC7などが用いられる。
図3は磁気インク文字の例として、E13Bフォント文字の一覧を示している。
【0025】
図4は、文字が「8」の場合の磁気出力波形の例を示している。文字が「8」の場合、p1、p2の位置ではプラス側にピークが出る。 また、p3の位置ではマイナス側にピークが出る。また、p4の位置ではプラス側にピークが出る。p5、p6の位置ではマイナス側にピークが出る。文字によってピークの発生するタイミングと出力レベルが異なるため、各文字の磁気波形出力の特徴から磁気インク文字認識(MICR:Magnetic Ink Character Recognition)をすることができる。
【0026】
図5は、磁気インク文字認識装置300の内部構造を説明するための内部構成図であり、
図1の磁気インク文字認識装置300を上方から見た上面断面図である。また、
図6は、磁気インク文字認識装置300の回路構成を示すブロック図である。
【0027】
磁気インク文字認識装置300は、シート90が複数枚セットされるとともに、セットされたシート90を給紙する給紙ローラ104を有する給紙部100と、シート90を排紙する第1排紙部102及び第2排紙部103とを備える。
【0028】
図5に示すように、給紙部100にセットされたシート90の束(以下、シート束という)は、押圧板(押圧部材)101によって給紙ローラ104に押圧され、給紙ローラ104に当接するシート90が該給紙ローラ104の駆動により給送ローラ105側に給紙される。
【0029】
押圧板101は、装置本体に回動可能に支持されており、バネ111により給紙ローラ104側に付勢され、この付勢力によりシート束を給紙ローラ104側に押圧するようになっている。
【0030】
給送ローラ105側に給紙されたシート90は、給送ローラ105によって搬送されつつ、重送の場合は分離ローラ107によって一枚ずつに分離されて搬送路110に給送される。
【0031】
搬送路110には、シート90を一定速で搬送するための搬送ローラ対201(201a、201b)、シート90を検知するレジストセンサ112、シートの搬送状態を検出するシート搬送状態検知センサ109、重送搬送を検知する重送検知センサ113、シート90の磁気記録情報91を読み取る磁気ヘッド106、磁気ヘッド106にシート90を押し当てるローラ207、シート90を一定速で搬送するための搬送ローラ対201と同速度で回転する搬送ローラ対202(202a、202b)、シート90全体の画像を読み取る画像読取センサ108、及び磁気ヘッド106での読取結果に応じて振り分け排紙する排紙ポケット102、103が上流側から下流側に向けて順番に配置されている。また、搬送路110に沿って、搬送ローラ対202の下流側にも複数の搬送ローラが配置されているが、説明は省略する。
【0032】
なお、シート搬送状態検知センサ109は、例えば、エンコーダーの付いた回転部材でシート90の搬送速度を検出する。あるいは、シート90の搬送速度を検出可能な光学的センサで構成されるが、詳しくは後述する他の実施例において説明する。
【0033】
磁気ヘッド106で読み取られた磁気記録情報91は
図6に示す磁気処理部10で処理される。また画像読取センサ108で読み取られた画像情報は、画像処理部20で処理される。
【0034】
取得した情報に従って、シート90を第1排紙部102又は第2排紙部103へ排紙するように不図示の切り替えフラッパと対応する搬送ローラを駆動し、排紙ポケット102、103に振り分ける。本実施例は排紙ポケット数が2つの例を示すが、排紙ポケット数を限定するものではない。本実施例では、磁気処理部10および画像処理部20によって取得された情報に対して照合を行った結果、いずれかで成功した場合には排紙ポケット102に排紙し、いずれも失敗した場合に排紙ポケット103に排紙する。
【0035】
本実施例では磁気インク文字認識装置300内で処理を完結する例を示している。
別の方法として、磁気ヘッド106で読み取られた磁気記録情報91及び画像読取センサ108で読み取られた画像情報をホストコンピュータ301に送信し、ホストコンピュータ301で磁気処理、画像処理を行い、その結果を磁気インク文字認識装置300に対して送信し、磁気インク文字認識装置300は、それに基づいて排紙ポケットへシート90を排紙処理するようにしてもよい。
【0036】
図6に示すように、磁気インク文字認識装置300は、磁気処理部10、画像処理部20、CPU31、外部インターフェース32、データ/アドレスバス33、メモリ34、給紙搬送制御部40、学習部60、搬送路110を有する。
【0037】
給紙搬送制御部40は
図5で説明した給紙部100、搬送路110、排紙部102、排紙部103各部におけるシート90の搬送制御を行う。具体的には給紙ローラ104、給送ローラ105、搬送ローラ対201、202などの駆動制御を実行する。
【0038】
磁気処理部10は、給送搬送制御部40によって搬送されるシート90の磁気記録情報91を検出する。磁気処理部10は、磁気ヘッド106、磁気記録情報処理部11、MICR辞書部12、及びMICR判定部13で構成される。磁気ヘッド106は、搬送路110を矢印D方向に搬送されるシート90の特定の位置に印刷された磁気インク文字(磁気記録情報91)の磁気情報を微小な電気信号に変換する。磁気記録情報処理部11は、磁気ヘッド106からの微小な電気信号に対して、電気信号の増幅、A/D変換、及び平滑化等の処理を施す。この結果、例えば
図4に示す出力波形を取得できる。
【0039】
メモリ34は磁気インク文字認識装置300の制御プログラムの格納と、磁気記録情報取得部10からの磁気記録情報、画像取得部20からの画像情報の一時記録、に用いられる。
【0040】
MICR判定部13は、磁気記録情報処理部11から出力された磁気記録情報に対して、MICR辞書部12に記憶されたMICR辞書を参照してMICR判定を行う。磁気インク文字認識結果はデータ/アドレスバス33を経由してメモリ34に一時記録され、外部インターフェース32を経由してホスト装置301に出力される。
【0041】
画像処理部20は、給送搬送制御部40によって矢印D方向に搬送されるシート90の画像を光学的に取得し、処理を行う。画像処理部20は、画像読取センサ108、画像情報処理部21を備える。画像読取センサ108は、例えばCISやCCDで構成される。画像情報処理部21は、画像読取センサ108からの出力をデジタルデータに変換し、各種画像処理を施す。
【0042】
各種画像処理を施された画像情報はデータ/アドレスバス33を経由してメモリ34に一時記録され、外部インターフェース32を経由してホスト装置301に出力される。
【0043】
<磁気インク文字の学習用データ生成方法の説明>
図7のフローチャートを用いて、磁気インク文字の学習用データ生成方法に関して説明する。例えば、
図4に示す磁気インク文字出力波形と対応する数字を学習用データとして取得する。波形データは時間に対する出力電圧を示すデジタルデータとして得られる。
【0044】
まず、シート90の磁気記録情報91を磁気ヘッド106で読み取る(S1001)。次に、磁気記録情報処理部11で処理された磁気記録情報に対して、MICR辞書部12に記憶されたMICR辞書を参照してMICR判定を行う(S1002)。
【0045】
次に、メモリ34にあらかじめ確保した所定のメモリ領域に、磁気インク文字出力波形データと、MICR判定部13で判定した磁気インク文字を格納する(S1003)。
図4の例では、下部に示す出力波形からMICR判定部13で磁気インク文字として「8」と判定し、出力波形データとともにその判定結果を格納する。
【0046】
ホスト装置301は磁気インク文字認識装置300のCPU31と外部インターフェース32、及びデータ/アドレスバス33を経由して通信する。ホスト装置301は学習用データを取得するため、磁気インク文字認識装置300に対し、学習用データ取得コマンドを発行する(S1004)。
【0047】
磁気インク文字認識装置300はメモリ34に格納した磁気インク文字出力波形データと、認識した磁気インク文字「8」を紐づけて学習用データとして出力する(S1005)。例えば、磁気インク文字出力波形データを含むファイルのファイル名に、磁気インク文字「8」を意味する表示を含むようにする。
【0048】
<ホスト装置での学習>
ホスト装置301では磁気インク文字認識装置300から取得した学習用データを用いて学習する(S1006)。ホスト装置301での学習は例えば機械学習を用いる。機械学習として例えばニューラルネットワークを用いた深層学習が使用可能である。
【0049】
ニューラルネットワークを用いた深層学習の場合、磁気インク文字出力波形のデジタルデータを音声波形データなどで行われている深層学習と同様に用いて学習することが出来る。また、オペレータがOKと判断した磁気インク文字を教師データとして用いることが出来る。ニューラルネットワークを用いた深層学習は公知の方法が使用できる。
【0050】
時間に対する出力電圧として得られる磁気インク文字出力波形のデジタルデータは、全てのデジタルデータを学習用に用いても良い。
【0051】
また、ピークなどの特徴点近傍のみ詳細にデータを残し、変化の少ない部分はデータを間引くなどしてデータ量を低減するようにしてもよい(学習用データ圧縮方法1)。
【0052】
また、各ピークの出力電圧と各ピークの時間間隔を用いて磁気インク文字出力波形を再現できるようにしてデータ量を低減するようにしてもよい(学習用データ圧縮方法2)。他にも学習用データ圧縮方法は各種考えられ、学習用データ圧縮方法1、学習用データ圧縮方法2に限定するものではない。
【0053】
ホスト装置301では磁気インク文字出力波形のデジタルデータと認識した磁気インク文字を用いて学習を繰り返し、MICR認識用の学習済推論モデル(以後、「学習済MICR辞書」と称す)を作成する。なお、磁気インク文字認識装置300が複数台接続される場合には、それら複数の装置から取得した教師データを利用してよい。
【0054】
<磁気インク文字認識装置への学習済MICR辞書の入出力>
ホスト装置301で作成された学習済MICR辞書の磁気インク文字認識装置300への入力は以下のように行われる。ホスト装置301は磁気インク文字認識装置300に対して学習済MICR辞書入力コマンドを発行する。磁気インク文字認識装置300は外部インターフェース32、及びデータ/アドレスバス33を経由してホスト装置301から学習済MICR辞書を受信し、磁気記録情報取得部10にあるMICR辞書を置き換える。
【0055】
MICR辞書を直接書き換える方法以外に、学習済MICR辞書をメモリ34に記憶し、その後MICR辞書を書き換えるようにしてもよい。
【0056】
また、MICR辞書を書き換える前に、従来のMICR辞書をメモリ34に退避するようにしてもよい。新しい学習済MICR辞書に何らかの問題が見つかった場合、メモリ34に記憶した従来のMICR辞書に戻すことで、容易に従来の状態に復旧できる。
【0057】
さらに、複数のMICR辞書をメモリ34に記憶し、使用するMICR辞書をオペレータが選択できるようにしてもよい。
【0058】
この様に、ホスト装置301側に学習済MICR辞書を持つことで、磁気インク文字認識装置300を故障などの理由で交換する場合に、学習済MICR辞書を磁気インク文字認識装置300に新たに入力することができるので、装置の置き替えをしても容易に学習済MICR辞書を利用することができる。
【0059】
本実施例では磁気インク文字認識装置300とホスト装置301を接続し、ホスト装置301で学習する例を示したが、ホスト装置301をネットワークに接続し、ネットワーク上で学習するようにしてもよい。この場合、ネットワークのトラフィックを考慮し、先述の学習用データ圧縮方法1や学習用データ圧縮方法2の例に示すように学習用データを圧縮するのが好ましい。
【0060】
また、磁気インク文字認識装置300が学習できるように学習部60を設けるようにしてもよい。この場合、磁気インク文字認識装置300が単独で学習する。学習部60は例えば、DSPやCPUで構成されるニューラルネットワークで構成される。
【0061】
磁気インク文字認識装置300が単独で学習する場合、学習済MICR辞書をホスト装置に出力することで装置の置き換えが容易となる。ホスト装置301は磁気インク文字認識装置300に対して学習済MICR辞書出力コマンドを発行する。磁気インク文字認識装置300は外部インターフェース32、及びデータ/アドレスバス33を経由してホスト装置301にMICR辞書を出力する。
【0062】
磁気インク文字認識装置300入れ替え後、すでに説明済の入力方法で学習済MICR辞書を入力することで、装置の置き換えをしても容易に学習済MICR辞書を利用することができる。
【0063】
また、ホスト装置301を経由することなく直接LANなどのネットワークに接続する構成として、ネットワーク上やクラウド上で学習することや、学習済MICR辞書を入出力するようにしても本発明の範疇である。
【0064】
さらに、ホスト装置301やネットワークへの接続以外にも、外部メモリを磁気インク文字認識装置300に接続し、外部メモリと学習済MICR辞書を入出力する場合も本発明の範疇である。
【0065】
本実施例では磁気インク文字認識装置300にMICR辞書部12とMICR判定部13がある構成で説明したが、MICR辞書部12とMICR判定部13の機能をホスト装置301やネットワーク302上に設け、磁気インク文字認識装置300がMICR判定しないでホスト装置301やネットワーク302上でMICR判定する場合も本発明の範疇である。
【0066】
本実施例ではホスト装置301とコマンドをやり取りして波形データを出力する例を示したが、磁気インク文字と波形データをLOG情報として出力するようにして、ホスト装置301で学習用データを作るようにしてもよい。
【0067】
<学習用データおよび学習済MICR辞書の運用方法>
図8を用いて、学習用データおよび学習済MICR辞書の運用方法を説明する。学習を行う方法として以下の運用が可能である。
(1)磁気インク文字認識装置メーカが学習を進める。
(2)磁気インク文字認識装置メーカ出荷後、各銀行で学習を進める。
(3)各銀行の学習用データを磁気インク文字認識装置メーカが入手し、磁気インク文字認識装置メーカが再び学習を進める。
【0068】
<磁気インク文字認識装置メーカが学習を進める場合>
磁気インク文字認識装置メーカ400が学習を進める場合、磁気インク文字認識装置メーカ400が所有する小切手等を用いて学習用データZ1(411)を作成する。磁気インク文字認識装置メーカ400は学習用データZ1(411)を用いて学習済MICR辞書Z1(412)を得る。磁気インク文字認識装置メーカ400は学習済MICR辞書Z1(412)を磁気インク文字認識装置300に入力し、銀行等に出荷する。
【0069】
<磁気インク文字認識装置メーカ出荷後、各銀行で学習を進める場合>
各銀行での学習に関して説明する。本実施例では銀行A(500)は銀行本店A1(510)、銀行支店A2(520)、銀行支店A3(530)で組織されているとする。支店は2支店の場合で説明するが、限定するものではない。
【0070】
銀行本店A1(510)では、銀行内の小切手等を用いて学習用データA1(511)を作成する。銀行本店A1(510)では作成された学習用データA1(511)を用いて学習済MICR辞書A1(512)を得る。
【0071】
同様に銀行支店A2(520)では、銀行内の小切手等を用いて学習用データA2(521)を作成する。銀行支店A2(520)では作成された学習用データA2(521)を用いて学習済MICR辞書A2(522)を得る。
【0072】
同様に銀行支店A3(530)でも銀行内の小切手等を用いて学習用データA3(531)を作成する。銀行支店A3(530)では作成された学習用データA3(531)を用いて学習済MICR辞書A3(532)を得る。
【0073】
学習済MICR辞書は本店や支店で独自に学習することが出来る。これらの学習用データや学習済MICR辞書は本店や支店で共有することが可能である。
【0074】
さらに、例えば銀行本店A1(511)が銀行支店A2(521)や銀行支店A3(530)で作成した学習用データA2(521)と学習用データA3(531)を収集し、銀行本店A1(511)で学習用データとして使用することで、学習済MICR辞書A1(512)の磁気インク文字認識率がさらに向上する。
【0075】
このとき、磁気インク文字認識率が向上した学習済MICR辞書A1(512)を各支店に配布することで、本店および各支店において磁気インク文字認識率を向上することが可能となる。
【0076】
なお、この場合、銀行本店A1(511)、銀行支店A2(521)、および銀行支店A3(530)で使用される磁気インク文字認識装置300に接続されるホストコンピュータ301で実行されるスキャンアプリケーションが、上述したMICR辞書部12やMICR判定部13の機能を有するように構成し、スキャンアプリケーション上で、指定した本店、支店に学習用データや学習済MICR辞書を送信可能に構成されていることが好ましい。
【0077】
このように、銀行内部に閉じた状態で学習することで、機密情報を管理した上で、磁気インク文字認識率を向上した学習済MICR辞書を得ることが出来る。
【0078】
<各銀行の学習用データを磁気インク文字認識装置メーカが入手し、磁気インク文字認識装置メーカが再び学習を進める場合>
銀行A(500)だけでなく銀行B(600)も同様に銀行B(600)内で学習できる。しかし、銀行A(500)と銀行B(600)は別銀行であるため、学習用データをお互い共有することは無い。
【0079】
シート90に印字された磁気インク文字は、店No、小切手No、口座No、金額等の機密情報を含む。このため磁気インク文字認識装置メーカ出荷後に各銀行で作成した学習用データを用いて学習をするには機密情報に関して配慮する必要がある。つまり、機密情報が含まれる状態で学習用データを磁気インク文字認識装置メーカに提供することはできない。
【0080】
そこで、機密情報が含まれない状態となるように、処理を行うことが望ましい。例えば、1文字ずつに切り出すようにすればよい。
【0081】
つまり、「1文字の磁気インク文字」と「1文字分の波形データ」とすれば機密情報は含まれない状態となる。例えば数字の「8」と「8の波形データ」のみであり、機密情報性は無い。
【0082】
このため、銀行A(500)や銀行B(600)から磁気インク文字認識装置メーカ(400)に1文字分の学習用データがランダムに並んだ状態、もしくはランダムな順序で出力された各学習用データが提供されることで、磁気インク文字認識装置メーカ(400)では生産開始後(420)にも学習を行うことが出来る。
【0083】
各銀行から提供された各学習用データをまとめて学習用データZ2(421)とする。磁気インク文字認識装置メーカ(400)は学習用データZ2(421)を用いて学習済MICR辞書Z2(422)を得る。この時点で、学習済MICR辞書Z2(422)は最も磁気インク文字認識率が向上した辞書と期待できる。
【0084】
このようにして得た学習済MICR辞書Z2(422)を銀行A(500)や銀行B(600)に再配布することが可能である。磁気インク文字認識装置メーカ(400)と各銀行で学習用データを共有することで、銀行A(500)や銀行B(600)は自行で得た学習済MICR辞書より磁気インク文字認識率が向上した学習済MICR辞書を得ることが出来る。
【0085】
銀行から磁気インク文字認識装置メーカに各学習用データを提供する方法を説明する。磁気インク文字認識装置メーカはクラウド上にセキュリティーで保護された専用のサイトを設ける。銀行はIDやパスワードを用い磁気インク文字認識装置メーカの設けた専用サイトへアクセスする。この専用サイトにおいて、上述したような学習用データをランダムに並び替える処理を実行しても良い。
【0086】
銀行は収集した学習用データのまま、あるいはデータ量を圧縮した学習用データをクラウド上の専用サイトにアップする。学習用データの送信方法としては一般的に用いられている公知のファイル交換方法を用いることが出来る。
【0087】
このようにして、磁気インク文字認識装置メーカは各銀行から学習用データを入手し、学習を行う。
【0088】
磁気インク文字認識装置メーカは学習済MICR辞書をクラウド上の専用サイトにアップする。各銀行はサイトにアップされている学習済MICR辞書をダウンロードし、各装置に入力することで、最も磁気インク文字認識率が向上した学習済MICR辞書を使用可能となる。
【0089】
銀行からの学習用データの提供を促進するため、学習用データをアップした銀行のみ、最新の学習済MICR辞書をダウンロードできるようにしてもよい。
【0090】
各銀行間や、銀行と製造メーカ間で学習データを共有する場合、チェックの種類をさらに紐づけることが好ましい。例えば、磁気インク文字としてE13B、CMC7等、複数のフォントが市場では使われている。そこで、学習用データに使用フォントの情報を紐づけて学習する。このようにチェックの種類を紐づけて学習することで、磁気インク文字認識率がさらに向上する。具体的には学習用データに磁気インク文字種類を追加し、機械学習の入力パラメータとして使用すればよい。
【0091】
また、学習済MICR辞書がどのフォントを元に学習したものであるかを識別できることが好ましい。例えば、学習済MICR辞書にフォント形式を紐づけする。学習済MICR辞書をファイルやモデルとして管理する場合にファイル名やモデル名にフォント形式を含ませる。例えば銀行支店AがE13Bを主に使用する地域で、銀行支店BがCMC7を主に使用する地域の場合、どのフォントを元に学習したものであるかを識別できるようにすることで、各銀行に適した学習済MICR辞書を提供することができる。また、学習用データに磁気インク文字認識装置300が使用されている地域を追加し、機械学習の入力パラメータとして使用してもよい。使用されている地域の情報は、磁気インク文字認識装置300に接続されるホストコンピュータ301で実行されるスキャンアプリケーションに対してユーザが指定できるようにしても良いし、磁気インク文字認識装置300の製造番号などの識別情報がメモリ34に記憶されており、地域ごとに製造番号などに対して付与される地域コードを参照することによって取得しても良い。
【0092】
本実施例では、「1文字の磁気インク文字」と「1文字分の波形データ」を学習用データに使用する例を示したが、「1文字以上の磁気インク文字」と「1文字分以上の波形データ」を学習用データとして使用するようにしてもよい。例えば、「シート90に印字された磁気インク文字全て」と「シート90に印字された磁気インク文字全ての波形データ」を学習用データとして使用するように変更することが出来る。
【0093】
例えば、未読や誤読となった文字の前後1文字分を加え、「3文字の磁気インク文字」と「3文字分の波形データ」を学習用データとして使用するなど、1文字を超える所定文字数を単位として学習用データとして使用するようにしてもよい。
【0094】
本実施例では銀行を例に説明しているが、銀行に限定するものではない。
【0095】
本実施例では磁気インク文字認識装置300を例に説明しているが、磁気インク文字認識機能を備えたドキュメントスキャナーやMFP等の複合機も本発明の範疇である。
【0096】
本実施例では磁気インク文字認識装置300に画像処理部20が存在する例で説明しているが、画像処理部20が存在しない磁気インク文字認識装置も本発明の範疇である。
【0097】
(実施例2)
<磁気インク文字の学習用データ生成方法2>
【0098】
実施例1とは異なる方法による、学習用データ生成方法に関して説明する。実施例2では、オペレータによる修正前後の文字を紐づけ、学習用データとする実施例を示す。
【0099】
磁気インク文字認識装置300では磁気インク文字の印字状態(細い、太い、傾いて印字、かすれ、磁気インクミスト、原稿折れ、等)によってMICR波形が規定された波形とは異なる状態となり、読取不能となってしまうことがある。
【0100】
読取不能となった場合、磁気インク文字認識装置300は読取不能となった文字を所定の記号に変換し、読取不能となった文字が存在することをホスト装置301が備えるモニターに表示して確認させ、オペレータに修正を促す。なお、MICR波形からでは磁気インク文字が読み取れなかった場合であっても、画像読取センサ108によって取得した画像に対してOCR処理を実行し、その結果磁気インク文字の判別ができた場合にはそれを採用し、OCR処理によっても文字を検知できなかった場合に読取不能と判断し、所定の記号に変換するようにしても良い。
【0101】
オペレータはホスト装置301が備えるモニターに表示された結果を確認し、読取不能となった文字の存在を認識する。オペレータは実際の小切手等や、読取られた小切手等の画像を見比べ、読取不能となった文字を認識し、正しい文字に修正する。
【0102】
本実施例では読取不能となった磁気インク文字出力波形と、オペレータによる修正内容を反映して正しい文字に修正された修正後の文字を学習用データとして用いる。
【0103】
図9は実施例2におけるフローチャートである。まず、シート90の磁気記録情報91を磁気ヘッド106で読み取る(S2001)。次に、磁気記録情報処理部11で処理された磁気記録情報91に対して、MICR辞書部12に記憶されたMICR辞書を参照してMICR判定を行う(S2002)。
【0104】
次に、メモリ34にあらかじめ確保した所定のメモリ領域に、磁気インク文字出力波形データと、MICR判定部13で判定した磁気インク文字を格納する(S2003)。
図4の例では、磁気インク文字として「8」を格納する。
【0105】
ホスト装置301は磁気インク文字認識装置300のCPU31と外部インターフェース32、及びデータ/アドレスバス33を経由して通信する。
【0106】
磁気インク文字認識装置300はホスト装置301に対してMICR判定結果を送信し、ホスト装置301はMICR判定結果をホスト装置301が備えるモニターに表示する(S2004)。
【0107】
オペレータはホスト装置301が備えるモニターに表示された、読取不能となった文字の存在を認識できる。オペレータは実際の小切手等や、読取られた小切手等の画像と見比べ、読取不能となった文字を認識し、正しい文字に修正する。また、オペレータが誤読した文字を見つけた場合、誤読した文字を修正する(S2005のY)。
【0108】
もし、オペレータが文字を修正しなかった場合、学習用データを取得することなく、終了する(S2005のN)。
【0109】
もし、オペレータが文字を修正した場合、ホスト装置301から磁気インク文字認識装置300に対し、学習用データ取得コマンドを発行する(S2006)。
【0110】
磁気インク文字認識装置300はメモリ34に格納した磁気インク文字出力波形データを学習用データとして出力する(S2007)。例えば、磁気インク文字出力波形データを含むファイルのファイル名に、磁気インク文字「8」を意味する表示を含むようにする。
【0111】
ホスト装置301では、磁気インク文字出力波形データに対し、修正前後の磁気インク文字を学習用データとして出力する(S2008)。
【0112】
ホスト装置301では磁気インク文字認識装置300から取得した学習用データを用いて学習する(S2009)。学習方法は実施例1と同様に行う。以後は、オペレータによる修正を反映した学習用データを用いて学習されたMICR辞書を用いて磁気インク文字認識を実行する(修正後認識ステップ)。
【0113】
本実施例ではオペレータが修正した場合、磁気インク文字認識装置300から磁気インク文字出力波形データを取得するように説明したが、あらかじめ磁気インク文字出力波形データをホスト装置301に出力しておき、ホスト装置301側で学習用データを作成するようにしてもよい。
【0114】
本実施例によれば、その時点でMICR辞書部12が使用している学習済MICR辞書だと誤認識してしまう出力波形データに対しての教師データ(正解データ)を得ることができ、この学習用データに基づいて再度機械学習することにより、学習済MICR辞書の判定精度を効率的に向上させることができる。
【0115】
(実施例3)
<画像情報を学習データに含める>
【0116】
実施例3では、画像情報を学習データに含めるようにした。
【0117】
図6を用いて説明する。
図6に示すように本実施例の磁気インク文字認識装置300は画像処理部20を有する。ホスト装置301はシート90の画像情報における磁気インク文字を
図3に示すような画像情報に対して光学的文字認識(OCR)をする。
【0118】
OCR用の画像情報とOCR後の文字情報を、実施例1、実施例2に示した学習用データと紐付ける(学習用データの入力パラメータとして使用する)。
【0119】
ファイル名を例えば、
磁気インク文字の波形データファイル名:
MICR_〔磁気インク文字〕_〔通しナンバー〕
OCR用の画像データファイル名:
OCR_〔OCR後の文字情報〕_〔通しナンバー〕
とする。
【0120】
具体的には
磁気インク文字が8の場合、ファイル名:
MICR_8_1
OCR後の文字が8の場合、ファイル名:
OCR_8_1
とする。
【0121】
通しナンバーを一致させることで、学習用データとして画像情報を紐付けることが出来る。このようにして得られた学習用データを用いて学習を行い、学習済MICR辞書を得る。
【0122】
本実施例ではファイル名の通しナンバーを一致させることで情報を紐付けるようにしたが、これに限定するものではない。学習用データとして紐付けることが出来れば手段は限定されない。例えば、全ての情報を一つのファイルにまとめるようにしてもかまわない。
【0123】
画像情報を学習データに含めること以外は実施例1、実施例2と同様であるので説明は割愛する。
【0124】
また、実施例2と組み合わせて、オペレータによる文字の修正があった場合に、その文字の出力波形データと、画像情報と、OCR結果と、修正後の文字とを紐づけて学習用データとして使用しても良い。この場合、画像情報に現れる特徴(文字の擦れや欠けなど)を踏まえた学習済MICR辞書を得ることができ、MICRの判定精度を向上することができる。
【0125】
なお、本実施形態においては、すべてのシート90に対してMICR結果の判別結果に関わらずOCR結果を取得するように構成することが好ましいが、これに限られない。すなわち、MICR結果から磁気インク文字の判別が不可能であった場合のみ画像読取センサ108による画像の取得を行い、OCRによる判別を試みるように構成しても良い。この場合、MICRによる判別が可能な限りにおいては、スループットを向上させることができる。
【0126】
(実施例4)
<シート搬送状態情報を学習データに含める>
【0127】
磁気インク文字認識装置300ではシート90の搬送状態によって磁気インク文字出力波形が規定された波形とは異なる状態となり、読取不能となってしまうことがある。速度変動の要因としては搬送用ローラの摩耗によるシート90の滑りや、搬送路上の汚れ、異物、突起等によりシート90先端に衝撃がかかる場合等が考えられる。
【0128】
そこで、実施例4では、シート搬送状態情報を学習用データに含めるようにした。
【0129】
図10を用いてシート搬送状態情報の取得方法に関して説明する。実施例1と異なるのは、シート搬送状態検知センサ109の出力に基づいて、搬送されているシートの搬送状態を検知するシート搬送状態検知部50の結果を学習用データに含めることであり、それ以外は共通しているため、共通部分の説明は省略する。
【0130】
シート搬送状態検知部50は、給送搬送制御部40によって搬送されるシート90の搬送状態をシート搬送状態検知センサ109の出力に基づいて検知する。シート搬送状態検知部50に含まれるシート搬送状態検知処理部51は、シート搬送状態検知センサ109からの出力をデジタルデータに変換し、データ/アドレスバス33を経由してシート90の搬送状態検知結果をCPU31に出力する。
【0131】
メモリ34はシート搬送状態検知部50からのシート搬送状態検知情報の一時記録に用いられる。
【0132】
シート搬送状態検知センサ109は、例えば、エンコーダーの付いた回転部材でシートの搬送速度を検出する。あるいは、シートの搬送速度を検出可能な光学的センサで構成される。シート搬送状態検知センサ109は、シートの搬送速度を検出できればよく、手段を限定するものではない。
【0133】
図11はシート搬送状態検知センサ109からの出力をデジタルデータに変換した例である。
図11(a)はシート90の速度変動が無かった場合を示す。
図11(b)はシート90の速度変動が有った場合を示す。
【0134】
図11(a)でt1はシート90の先端がシート搬送状態検知センサ109に到達した時間を示す。t3はシート90の後端がシート搬送状態検知センサ109に到達した時間を示す。
図11(a)ではt1の時点でシート90は速度V0に達しており、その後、t3まで速度変動が無かったことを示す(Vout1)。
【0135】
図11(b)でt2はシート90がシート搬送状態検知センサ109を通過中であり、t2の直前で何らかの原因で速度変動が発生した時間である。t2における速度はV1まで下がったことを示している(Vout2)。
【0136】
この場合、t2の時間において磁気インク文字出力波形が規定された波形とは異なる状態となる可能性がある。
【0137】
t2を含む時間において磁気インク文字「8」を読んでいたとすると、
図11(b)のVdataで示す時間(速度変動があった時間間隔)に対する速度変動を示すシート搬送状態検知情報を学習用データとして出力する。
【0138】
ファイル名を例えば、
磁気インク文字の波形データファイル名:
MICR_〔磁気インク文字〕_〔通しナンバー〕
OCR用の画像データファイル名:
OCR_〔OCR後の文字情報〕_〔通しナンバー〕
Vdata用のデータファイル名:
Vdata_〔Vdataの速度変動情報〕_〔通しナンバー〕
とする。
【0139】
具体的には
磁気インク文字が8の場合、ファイル名:
MICR_8_1
OCR後の文字が8の場合、ファイル名:
OCR_8_1
Vdata時間の文字が8の場合、ファイル名:
Vdata_8_1
とする。
【0140】
通しナンバーを一致させることで、学習用データとして画像情報を紐付けることが出来る。このVdata用のデータ内部に、t2を含む時間間隔において速度変動があったことを示す情報が含まれている。なお、t2を含む時間間隔の代わりに、磁気インク文字の「8」のどこを読んでいる状態で速度変動があったかを示すパラメータに変換したデータを保持しても良い。
【0141】
本実施例ではOCR用の画像データファイル名を含める場合で説明したが、磁気インク文字の波形データとVdata用のデータのみ紐付けしてもよい。
【0142】
さらに、OCR時のシート搬送状態検知情報も学習用データとして出力するようにしてもよい。
【0143】
さらに、OCR後の文字がオペレータにより修正された場合、オペレータによる修正結果の文字をOCR用の画像データに紐づけるようにしてもよい。
【0144】
ニューラルネットワークを用いた深層学習では、入力層として例えば磁気インク文字の波形、OCR画像、シート搬送状態情報を入力して学習する。磁気インク文字認識装置が学習済MICR辞書を用いて磁気インク文字を認識する際は、磁気インク文字の波形、OCR画像、シート搬送状態情報が学習済MICR辞書の入力層に入力される構成として提供される。
【0145】
(実施例5)
<機種識別情報を学習用データに含める>
【0146】
磁気インク文字認識装置のシリーズや機種で、異なる構成となる場合がある。例えば、シート搬送速度が異なる、搬送路の搬送ローラ位置が異なる、シート給紙タイミングが異なる、その他にもシリーズや機種特有の構成が考えられる。
【0147】
つまり、磁気インク文字出力波形はシリーズや機種で特有な出力となる可能性がある。
【0148】
例えば、シート搬送速度が速いと、磁気インク文字出力波形は時間軸方向に縮小される。シート搬送速度が遅いと、磁気インク文字出力波形は時間軸方向に拡大される。
【0149】
また、搬送路の搬送ローラ位置が異なる例として、分離ローラ107の位置と磁気ヘッド106の距離が異なる場合がある。この場合、給紙時のシート分離時に発生するシートへのショックのタイミングが異なる。この結果、シートの異なる位置で磁気インク文字出力波形が変動する可能性がある。一方、同一機種の場合、分離ローラ107の位置と磁気ヘッド106の距離はほぼ同じなので、磁気インク文字出力波形は機種毎にほぼ同様の変動となる。
【0150】
また、シートの処理枚数が機種で異なる場合がある。例えば、1分間に60枚給紙可能な装置と、1分間に30枚給紙可能な装置では、シート給紙タイミング(シートの給紙間隔)を変えることが考えられる。シート給紙タイミングが異なると、給紙時のシート分離時に発生するシートへのショックのタイミングが異なる。この結果、シートの異なる位置で磁気インク文字出力波形が変動する可能性がある。一方、同一機種の場合、シート給紙タイミングはほぼ同じなので、磁気インク文字出力波形は機種毎にほぼ同様の変動となる。
【0151】
その他にもシリーズや機種特有の構成が磁気インク文字出力波形に影響する。
【0152】
そこで本実施例においては、シリーズ名、機種名、製造番号、シート搬送速度情報、シート給紙タイミング、搬送路の搬送ローラ位置情報、等の機種識別情報を学習用データに含めるようにした。
【0153】
具体的には、学習用データのファイル名にシリーズ名、機種名、シート搬送速度情報、シート給紙タイミング、搬送路の搬送ローラ―位置情報、等の機種識別情報を付加する。
【0154】
ニューラルネットワークを用いた深層学習では、入力層として例えばシリーズ名、機種名、シート搬送速度情報、シート給紙タイミング、搬送路の搬送ローラ位置情報、等の機種識別情報を入力して学習する。学習を行う際は機種識別情報別に学習を行うことが望ましい。
【0155】
磁気インク文字認識装置が学習済MICR辞書を用いて磁気インク文字を認識する際は、機種識別情報別に学習を行った学習済MICR辞書を、機種識別情報に合致する磁気インク文字認識装置に入力して磁気インク文字認識を行うことで、磁気インク文字認識率が向上する。
【0156】
機種識別情報は本実施例で示したような、機種特有の構成情報、機種特有の制御情報を含む。
【0157】
本実施例では画像取得部を有する磁気インク文字認識装置の例を示したが、画像読取部が無い磁気記録情報のみを取得する磁気インク文字認識装置も本発明の範疇である。
【0158】
本実施例ではシート搬送装置として磁気インク文字認識装置の例を示したが、MFP等の複合機能を有する装置に適応した場合も本発明の範疇である。
【0159】
また、上記実施例では、磁気インク文字認識装置300と、外部インターフェース32を経由して接続されたホスト装置301によって磁気インク文字認識システムを構成したが、これに限られず、すべての構成を磁気インク文字認識装置に設けても良いし、その一部の機能をさらに別の情報処理装置によって実現するシステムとして構成してもよい。
【0160】
以上、本発明の磁気インク文字認識装置について説明したが、本発明は上記実施形態に限定されず、各実施形態を組み合わせても良いし、本発明の主旨を逸脱しない範囲において、種々の改良や変更をすることができる。
【符号の説明】
【0161】
10 磁気処理部
11 磁気記録情報処理部
12 MICR辞書部
11 MICR判定部
20 画像処理部
21 画像情報処理部
40 給紙搬送制御部
50 シート搬送状態検知部
51 シート搬送状態検知処理部
60 学習部
90 シート
91 磁気記録情報
106 磁気ヘッド
108 画像読取センサ
109 シート搬送状態検出センサ
110 搬送路
300 磁気インク文字認識装置
301 ホスト装置