(58)【調査した分野】(Int.Cl.,DB名)
帳票のイメージデータとそのイメージデータを文字認識して取得した文字データとを比較して、オペレータが文字データの修正もしくは確認する作業を行う帳票処理システムであって、
あらかじめ、形状が似ている文字を類似文字として定義しておき、帳票の文字認識結果に対して、その帳票の文字データに含まれる文字のうち前記類似文字が多いか少ないかを示す情報とオペレータの作業の習熟度レベルの情報とに基づき、習熟度レベルが高いオペレータは、前記類似文字が多い帳票を担当し、習熟度レベルが低いオペレータは、前記類似文字が少ない帳票を担当するように、前記帳票の担当オペレータを定めて前記帳票の文字データの修正もしくは確認する作業を行わせることを特徴とする帳票処理システム。
帳票のイメージデータとそのイメージデータを文字認識して取得した文字データとを比較して、オペレータに文字データの修正もしくは確認する作業を行わせるサーバであって、
あらかじめ、形状が似ている文字を類似文字として定義しておき、帳票の文字認識結果に対して、その帳票の文字データに含まれる文字のうち前記類似文字が多いか少ないかを示す情報とオペレータの作業の習熟度レベルの情報とに基づき、習熟度レベルが高いオペレータは、前記類似文字が多い帳票を担当し、習熟度レベルが低いオペレータは、前記類似文字が少ない帳票を担当するように、前記帳票の担当オペレータを定めて前記帳票の文字データの修正もしくは確認する作業を行わせることを特徴とするサーバ。
【実施例1】
【0011】
図1は第1の実施例における帳票処理システムの構成を示すブロック図である。
【0012】
1は帳票読取装置であり、金融機関等の営業店もしくは事務センタ等に設置されるものであり、通信回線9を介して他の装置と相互に通信可能に接続されている。
【0013】
2は表示部であり、CRT、液晶ディスプレイ等の表示手段である。
【0014】
3は入力部であり、キーボード、マウス等の入力手段である。
【0015】
5は制御部であり、CPU等の演算および制御手段等で構成されたものであり、記憶部6に格納された制御プログラムに基づいて帳票読取装置1全体の動作を制御する。
【0016】
また、制御部5は後述するスキャナ装置7に対して帳票のイメージデータの読取りを指示すると共にそのスキャナ装置7が読取ったイメージデータを取得する機能を有しており、その機能は記憶部6に格納したスキャナ装置7に動作指示を行うためのプログラムによって実現される。
【0017】
また、制御部5は帳票のイメージデータを識別するシーケンス番号を採番する採番手段、帳票のイメージデータから帳票に記載された文字をOCR認識(光学式文字認識)により認識し、その認識した内容をもとに帳票上の記載文字を示す文字データに変換する文字認識手段、文字データに含まれる文字の内、別の文字と誤認識される可能性の高い文字(類似文字という)の割合(類似文字率という)を算出する類似文字率算出手段を備えている。
【0018】
なお、類似文字率は、類似文字率「%」=類似文字の文字数÷全文字数×100による式で算出される。
【0019】
6は記憶部であり、帳票読取装置1全体の動作を制御する制御プログラムやスキャナ装置7に動作指示を行うためのプログラム等を格納する他、スキャナ装置7で読取った帳票の枚数、読取ったそれぞれの帳票のイメージデータ等を記憶する。
【0020】
また記憶部6は、誤認識される可能性の高い類似文字をテーブルとして、例えば
図2のように格納している。
【0021】
ここで、類似文字のテーブルに含まれる文字の一例を
図2の類似文字の一例を示す表を用いて説明する。
【0022】
図2に示すように誤認識の可能性が高い組合せの文字例として、数字同士では「1」と「7」、「0」と「6」と「9」等、アルファベット同士では「E」と「F」、「O」と「Q」、「a」と「d」、「c」と「e」等、記号同士では「“」と「‘」等、ひらがな同士では「き」と「さ」、「め」と「ぬ」等、カタカナ同士では「エ」と「コ」、「ク」と「リ」等、漢字同士では「因」と「困」、「侍」と「待」等が挙げられる。
【0023】
また、数字とアルファベットの組合せでは「1」と「i」、「0」と「Q」、「8」と「B」等、数字と記号の組合せでは「1」と「!」等、アルファベットと記号の組合せでは「I」と「!」、「O」と「。」等、ひらがなとカタカナの組合せでは「い」と「ハ」、「り」と「リ」等、カタカナと漢字の組合せでは「ロ」と「口」等が挙げられる。
【0024】
7はスキャナ装置であり、CCD(Charge Coupled Device)カメラ等で構成され、帳票のイメージデータを読取る機能を有する。
【0025】
このスキャナ装置7は図示しない帳票吸入部に載置された帳票を図示しない帳票分離搬送手段により1枚ずつ分離して搬送し、その帳票のイメージデータを読取ることができるようになっている。すなわち、帳票吸入部に載置された複数の帳票を連続して読取ることができるようになっている。
【0026】
尚、スキャナはOCR一体型のものでもよい。
【0027】
スキャナ装置7で読取る帳票は、例えば、口座開設依頼書の他に各種届けを申し込む諸届け帳票、投資信託購入募集申込書等の投信帳票、および外貨預金申込書等である。尚、所定の形式を有するものはもとより、非定型の帳票でもよい。
【0028】
8は帳票DB(データベース)サーバであり、図示しない通信手段を備えており、通信回線9を介して帳票読取装置1等の他の装置と相互に通信可能に接続されている。
【0029】
8aはサーバ制御部であり、サーバ記憶部8bに格納された帳票DBサーバ8を制御する制御プログラムに従って、帳票DBサーバ8の各部を制御して各種処理を遂行する。
【0030】
サーバ記憶部8bは、帳票DBサーバ8を制御する制御プログラムを格納すると共に、帳票読取装置1から受信したイメージデータ及び文字データの情報を管理する帳票データテーブルや、後述するオペレータの業務に対する習熟度としてのオペレータランクを管理するオペレータテーブル等を記憶している。
【0031】
ここで、
図3は帳票データテーブルの構成を示す説明図である。
【0032】
帳票データテーブルは、
図3に示すように、シーケンス番号、帳票画像、認識結果データ、類似文字率、入力データの項目からなる。
【0033】
シーケンス番号は、上記帳票読取装置1の制御部5が採番した番号である。
【0034】
帳票画像は、帳票のイメージデータである。
【0035】
認識結果データは、上記帳票読取装置1の制御部5が光学式文字認識によって画像データから変換した文字データである。
【0036】
類似文字率は、上記帳票読取装置1の制御部5が前記類似文字率算出手段によって算出される文字データの全文字数に対する類似文字の割合である。
【0037】
入力データは、認識結果データに対して、オペレータが後述のオペレータ端末で誤認識の文字を訂正入力した文字データである。
【0038】
ここで、
図4はオペレータテーブルの構成を示す説明図である。
【0039】
オペレータテーブルは、
図4に示すように、オペレータIDとオペレータランクの項目からなり、オペレータIDはオペレータ端末10を操作するオペレータを特定する識別子である。
【0040】
オペレータランクは、オペレータの業務に対する習熟度であり、A〜Cの3段階としてAを経験豊富なオペレータ、Bを一般的なオペレータ、Cを経験の浅いオペレータと分類する。
【0041】
なお、オペレータランクは、経験年数で定めるようにしてもよく、またそれまでのオペレータの実績に基づいて定めるようにしてもよい。
【0042】
10はオペレータ端末であり、通信回線9を介して帳票読取装置1、帳票DBサーバ8と通信可能に接続される。
【0043】
11は端末表示部であり、CRT、液晶ディスプレイ等の表示手段である。
【0044】
12は端末入力部であり、キーボード、マウス等の入力手段である。
【0045】
13は端末記憶部であり、磁気ディスク、半導体メモリ等の記憶手段である。この端末記憶部13にはオペレータ端末10全体の動作を制御する制御プログラム(ソフトウェア)を記憶する。
【0046】
14は端末制御部であり、CPU等の演算および制御手段等で構成されたものであり、端末記憶部13に格納された制御プログラム(ソフトウェア)に基づいて各部の動作を制御する。
【0047】
このように帳票処理システムは帳票読取装置1、帳票DBサーバ8、通信回線9およびオペレータ端末10等で構成されている。
【0048】
また、本実施例では1台の帳票DBサーバ8に対して複数のオペレータ端末10が通信可能に接続されているものとする。
【0049】
上述した構成の作用について、
図5に示す帳票のスキャン処理を示すフローチャートを用い、Sで示すステップに従って説明する。
【0050】
係員は、顧客から預かった帳票を画像読取装置1のスキャナ装置7の帳票吸入部に載置し、入力部3によってイメージデータ読取りのための入力を行う。
【0051】
S1、画像読取装置1の制御部5は、イメージデータ読取りのための入力がなされたことを認識すると、図示しない帳票吸入部に載置された帳票を搬送してスキャナ装置7によってイメージデータを読取ってそのイメージデータを記憶部6に記憶する。
【0052】
S2、制御部5は、帳票から読取ったイメージデータを文字認識手段により文字データに変換し、その文字データを記憶部6に記憶する。
【0053】
S3、制御部5は、記憶部6に格納している類似文字のテーブルを参照し、イメージデータから変換した文字データに含まれている類似文字の数を計数する。
【0054】
S4、制御部5は、文字データに含まれる全文字数を計数し、その全文字数と上記ステップS3で計数した類似文字の数を用い、前記類似文字率算出手段によって類似文字率を算出し、その類似文字率を記憶部6に記憶する。
【0055】
S5、制御部5は、シーケンス番号を採番すると共に、記憶したイメージデータ、文字データ、類似文字率を読み出し、そのシーケンス番号、イメージデータ、文字データ、類似文字率を関連づけて構成した帳票データを通信回線9を介して帳票DBサーバ8に送信する。
【0056】
S6、帳票DBサーバ8は、受信した帳票データを格納すると共に、その帳票データの内容をもとに帳票データテーブルを更新し、帳票のスキャン処理を終了する。
【0057】
次に、オペレータに帳票の記載内容を確認させる帳票内容確認処理について、
図6に示す帳票内容確認処理の手順を示すフローチャートを用い、SAで示すステップに従って説明する。
【0058】
ここでは、オペレータが帳票の記載内容確認のために、オペレータ端末10の端末入力部12によって確認データを要求する入力操作を行ったものとする。
【0059】
SA1、オペレータ端末10の端末制御部14は、オペレータの端末入力部12による確認データを要求する入力操作がなされたことを認識すると、端末記憶部13に記憶しているオペレータIDを読み出し、そのオペレータIDを付したデータ要求電文を通信回線9を介して帳票DBサーバ8に送信する。
【0060】
SA2、帳票DBサーバ8のサーバ制御部8aは、受信したデータ要求電文のオペレータIDをもとに、サーバ記憶部8bに格納しているオペレータテーブルを参照して該当するオペレータランクを特定する。
【0061】
SA3、サーバ制御部8aは、帳票データテーブルから入力データが未入力であり、かつ上記で特定したオペレータランクに従ってオペレータ端末10に送信対象のイメージデータ及び文字データを含む帳票データを抽出する。
【0062】
ここで、
図7は帳票データテーブルから帳票データを抽出するまでの流れを示す説明図であり、(a)はシーケンス番号順に帳票データを並べた状態、(b)は類似文字率順に帳票データを並べた状態を示す。
【0063】
サーバ制御部8aは、帳票データテーブルの帳票データを
図7(a)に示すシーケンス番号順から、
図7(b)に示す類似文字率順に並べ替える。
【0064】
そして、上記ステップSA2で特定したオペレータランクがAの場合には、類似文字率が最も大きい帳票データを帳票データテーブルから抽出する。つまり
図7(b)に示す類似文字順においては、最も大きい類似文字率17%であるシーケンス番号3の帳票データを抽出する。
【0065】
また、オペレータランクがBの場合には、帳票データテーブルにおいて、類似文字率順に帳票データを並べたときの順番が真ん中の帳票データを抽出、つまり
図7(b)に示す類似文字順における、順番が真ん中のシーケンス番号5の帳票データを抽出する。
【0066】
さらに、オペレータランクがCの場合には、類似文字率が最も小さい帳票データを抽出、つまり
図7(b)に示す類似文字順においては、最も小さい類似文字率1%であるシーケンス番号4の帳票データを抽出する。
【0067】
なお、帳票データテーブルから抽出できる帳票データが1つしかない場合は、その残った帳票データを抽出することは言うまでも無い。
【0068】
SA4、サーバ制御部8aは、抽出した帳票データからイメージデータと文字データ、シーケンス番号を読み出し、読み出したイメージデータと文字データ、シーケンス番号を関連づけて確認データとし、その確認データを通信回線9を介してオペレータ端末10に送信する。
【0069】
SA5、オペレータ端末10の端末制御部14は、受信した確認データのシーケンス番号を端末記憶部13に記憶し、また確認データのイメージデータと文字データとを端末表示部11に表示すると共に、イメージデータによって顧客が帳票に記載した内容を確認させ、文字データ中の誤認識された文字や記載内容の確認及びその訂正を促す確認指示画面を表示する。
【0070】
これにより、オペレータはイメージデータと文字データとを比較することで、帳票上の記載内容をもとに文字データの確認を行うと共に、文字データ中に誤認識の文字があれば、その訂正入力を行う。
【0071】
SA6、端末制御部14は記憶したシーケンス番号を読み出し、訂正入力がなされた文字データを入力データとし、その入力データにシーケンス番号を付して通信回線9を介し、帳票DBサーバ8に送信する。
【0072】
SA7、帳票DBサーバ8のサーバ制御部8aは、受信したシーケンス番号をもとに、記憶している帳票データを読み出してその帳票データに受信した入力データを加え、帳票データテーブルの内容を更新し、帳票内容確認処理を終了する。
【0073】
これにより、本発明は、習熟度が高いオペレータには類似文字が多い帳票の処理をさせ、習熟度が低いオペレータには類似文字が少ない帳票の処理をさせることができるので、類似文字を誤って処理してしまうという人為的ミスの発生を低減させることができるという効果が得られる。
【0074】
以上説明したように、本実施例では、文字認識手段によって帳票のイメージデータから変換した文字データをオペレータが確認及び訂正を行う場合に、文字データに含まれる類似文字の割合を算出してその類似文字率を帳票データに含めて記憶しておき、オペレータ端末にイメージデータ及び文字データを送信する際に、オペレータのスキルレベルから熟練したオペレータに対しては、類似文字率の割合が高い帳票データのイメージデータ及び文字データを送信し、経験の浅いオペレータに類似文字率の割合が小さい帳票データのイメージデータ及び文字データを送信するため、イメージデータから文字データに変換した際に誤認識されてしまった類似文字の訂正抜け等の人為的ミスの可能性を低減させることができる。