【解決手段】本情報処理装置は、入力項目ごとに文字列が記入された書類から文字認識処理によって文字情報を取得する取得手段と、前記文字認識処理による認識結果の正しさを示す認識確度を入力項目ごとに算出する算出手段と、前記文字列と前記文字情報とを入力項目ごとに対応付けた確認画面を出力する出力手段と、を備え、前記出力手段は、書類の入力項目と後続処理による確認の有無とを対応付ける記憶部を参照して、前記認識確度が基準値以上である入力項目のうち、前記後続処理による確認の対象である入力項目については前記確認画面への出力を抑制する。
【発明を実施するための形態】
【0009】
<実施形態>
実施形態に係る情報処理装置は、例えば、以下の構成を有する。本実施形態に係る情報処理装置は、
入力項目ごとに文字列が記入された書類から文字認識処理によって文字情報を取得する取得手段と、
前記文字認識処理による認識結果の正しさを示す認識確度を入力項目ごとに算出する算出手段と、
前記文字列と前記文字情報とを入力項目ごとに対応付けた確認画面を出力する出力手段と、を備え、
前記出力手段は、書類の入力項目と後続処理による確認の有無とを対応付ける記憶部を参照して、前記認識確度が基準値以上である入力項目のうち、前記後続処理による確認の対象である入力項目については前記確認画面への出力を抑制する。
【0010】
情報処理装置は、例えば、パーソナルコンピュータやサーバ装置である。情報処理装置は、画像取得装置によって書類をデジタル画像化した書類画像を取得する。画像取得装置は、例えば、スキャナやデジタルカメラである。画像取得装置は、情報処理装置に接続されてもよいし、他の装置に接続されていてもよい。すなわち、画像取得装置が取得した書類画像を情報処理装置が取得できればよい。
【0011】
取得手段は、OCR等の文字認識処理を書類画像に対して行うことで、入力項目それぞれに記入された文字列をデジタル情報化した文字情報を取得する。算出手段は、文字認識処理による認識結果の正しさを示す認識確度を入力項目ごとに算出する。算出手段は、例えば、入力項目に記入された文字それぞれについて文字認識処理による認識結果の正しさを示す確信度を算出し、入力項目に含まれる文字の確信度のうち最も低い確信度を入力項目の認識確度とすることができる。確信度の算出方法には限定はなく、公知の様々な技術を適用可能である。本情報処理装置は、出力手段が確認画面を出力することで、入力項目ごとに文字認識処理によって正しい文字情報が取得できたか否かを判断するオペレータの支援を行うことができる。
【0012】
ここで、出力手段は、認識確度が基準値以上である入力項目のうち、後続処理による確認の対象である入力項目については確認画面への出力を抑制する。基準値は、文字認識処理によって文字が正しく認識されている蓋然性が高いことを示す基準値である。ここで、「抑制する」とは、確認画面に当該入力項目を出力しない(非表示とする)ことの他、当該入力項目をグレーアウトして出力する等の、オペレータによる確認の対象とする入力項目とは異なる態様で出力することを含む。後続処理において確認対象となる入力項目については当該後続処理で文字認識処理の結果についても確認することができる。そこで、本情報処理装置は、出力手段が当該入力項目の確認画面への出力を抑制することで上記オペレータの確認対象とする入力項目を削減し、文字認識処理の認識結果を目視確認するオペレータ作業負担を軽減することができる。
【0013】
実施形態に係る情報処理装置は、さらに、次の特徴を備えてもよい。前記出力手段は、さらに、前記認識確度が前記基準値より大きい確信値以上である入力項目についても、前記確認画面への出力を抑制する。ここで、確信値は、文字認識処理が確実に実行されてい
ることを示す値である。このような特徴を備えることで、本情報処理装置は、オペレータの確認対象とする入力項目を削減し、上記オペレータの作業負担を軽減することができる。
【0014】
以上説明した技術は、情報処理方法および情報処理プログラムとして把握することも可能である。
【0015】
以下、図面を参照して、実施形態についてさらに説明する。以下に示す実施形態の構成は例示であり、開示の技術は実施形態の構成に限定されない。
【0016】
図1は、実施形態に係る相続事務支援システムの構成を例示する図である。
図1に例示される相続事務支援システム500は、金融機関における相続事務を支援するシステムである。相続事務支援システム500は、作業端末1、スキャナ2および管理サーバ3を含む。作業端末1と管理サーバ3とは、ネットワークN1によって相互に通信可能に接続される。
【0017】
作業端末1は、顧客からの相続手続きの依頼を受け付ける金融機関の職員が操作する情報処理装置である。作業端末1は、例えば、デスクトップ型パーソナルコンピュータ、ノートブック型パーソナルコンピュータあるいはタブレット型コンピュータである。作業端末1にはスキャナ2が有線または無線で接続される。作業端末1は、相続人等が記入した相続手続きに係る書類(以下、相続手続書類と称する)をスキャナ2で読み込むことで、相続手続書類をデジタル化したデジタル画像を取得する。作業端末1は、取得したデジタル画像に対してOCRを実行することで、相続手続書類に記入された文字情報を取得する。なお、相続手続書類は、手書きで記入されることが多い。作業端末1は、「情報処理装置」の一例である。
【0018】
スキャナ2は、相続手続書類をデジタル画像として取得する画像取得装置である。スキャナ2は、作業端末1に接続される。相続手続書類をデジタル画像として取得できる装置であれば、スキャナ2に代えて他の装置(例えば、デジタルカメラ等)が作業端末1に接続されてもよい。
【0019】
管理サーバ3は、金融機関の顧客に係る情報や相続事務に係る手続きフローを記憶する情報処理装置である。管理サーバ3は、例えば、サーバ装置である。
【0020】
(ハードウェア構成)
図1には、相続事務支援システム500に含まれる作業端末1および管理サーバ3のハードウェア構成も例示されている。以下、
図1を参照して、作業端末1および管理サーバ3のハードウェア構成について説明する。
【0021】
(作業端末1のハードウェア構成)
作業端末1は、Central Processing Unit(CPU)101、主記憶部102、補助記憶部103、通信部104、表示部105および接続部106を含む。CPU101、主記憶部102、補助記憶部103、通信部104、表示部105および接続部106は、接続バスによって相互に接続されている。
【0022】
CPU101は、マイクロプロセッサユニット(MPU)、プロセッサとも呼ばれる。CPU101は、単一のプロセッサに限定される訳ではなく、マルチプロセッサ構成であってもよい。また、単一のソケットで接続される単一のCPU101がマルチコア構成を有していても良い。CPU101が実行する処理のうち少なくとも一部は、CPU101以外のプロセッサ、例えば、Digital Signal Processor(DS
P)、Graphics Processing Unit(GPU)、数値演算プロセッサ、ベクトルプロセッサ、画像処理プロセッサ等の専用プロセッサで行われても良い。また、CPU101が実行する処理のうち少なくとも一部は、集積回路(IC)、その他のデジタル回路によって実行されてもよい。また、CPU101の少なくとも一部にアナログ回路が含まれても良い。集積回路は、Large Scale Integrated circuit(LSI)、Application Specific Integrated Circuit(ASIC)、プログラマブルロジックデバイス(PLD)を含む。PLDは、例えば、Field−Programmable Gate Array(FPGA)を含む。CPU101は、プロセッサと集積回路との組み合わせであっても良い。組み合わせは、例えば、マイクロコントローラユニット(MCU)、System−on−a−chip(SoC)、システムLSI、チップセットなどと呼ばれる。情報処理装置100では、CPU101が補助記憶部103に記憶されたプログラムを主記憶部102の作業領域に展開し、プログラムの実行を通じて周辺装置の制御を行う。これにより、情報処理装置100は、所定の目的に合致した処理を実行することができる。主記憶部102および補助記憶部103は、作業端末1が読み取り可能な記録媒体である。
【0023】
主記憶部102は、CPU101から直接アクセスされる記憶部として例示される。主記憶部102は、Random Access Memory(RAM)およびRead
Only Memory(ROM)を含む。
【0024】
補助記憶部103は、各種のプログラムおよび各種のデータを読み書き自在に記録媒体に格納する。補助記憶部103は外部記憶装置とも呼ばれる。補助記憶部103には、オペレーティングシステム(Operating System、OS)、各種プログラム、各種テーブル等が格納される。OSは、通信部104を介して接続される外部装置等とのデータの受け渡しを行う通信インターフェースプログラムを含む。外部装置等には、例えば、コンピュータネットワーク等で接続された、他の情報処理装置および外部記憶装置が含まれる。なお、補助記憶部103は、例えば、ネットワーク上のコンピュータ群であるクラウドシステムの一部であってもよい。
【0025】
補助記憶部103は、例えば、Erasable Programmable ROM(EPROM)、ソリッドステートドライブ(Solid State Drive、SSD)、ハードディスクドライブ(Hard Disk Drive、HDD)等である。また、補助記憶部103は、例えば、Compact Disc(CD)ドライブ装置、Digital Versatile Disc(DVD)ドライブ装置、Blu−ray(登録商標) Disc(BD)ドライブ装置等である。また、補助記憶部103は、Network Attached Storage(NAS)あるいはStorage Area Network(SAN)によって提供されてもよい。
【0026】
通信部104は、例えば、ネットワークN1とのインターフェースである。通信部104は、ネットワークN1を介して他の情報処理装置と通信を行う。
【0027】
表示部105は、例えば、CPU101で処理されるデータや主記憶部102に記憶されるデータを表示する。表示部105としては、例えば、Cathode Ray Tube(CRT)ディスプレイ、Liquid Crystal Display(LCD)、Plasma Display Panel(PDP)、Electroluminescence(EL)パネル、有機ELパネル等を挙げることができる。
【0028】
接続部106は、外部装置を接続するインターフェースである。接続部106が外部装置を接続する方式は、有線であっても無線であってもよい。接続部106は、例えば、U
niversal Serial Bus(USB)、IEEE1394、Small Computer System Interface(SCSI)、Bluetooth(登録商標)等を挙げることができる。
【0029】
(管理サーバ3のハードウェア構成)
管理サーバ3は、作業端末1と同様に、CPU101、主記憶部102、補助記憶部103および通信部104を備える。
【0030】
<相続事務支援システム500の処理ブロック>
図2は、実施形態に係る相続事務支援システムの処理ブロックの一例を示す図である。
図2では、作業端末1および管理サーバ3の処理ブロックが例示されている。以下、
図2を参照して、実施形態に係る相続事務支援システムの処理ブロックの一例について説明する。
【0031】
(管理サーバ3の処理ブロック)
管理サーバ3は、
図2に例示するように、管理データベース31(図中では、データベースをDBと記載)を備える。管理サーバ3は、主記憶部102に実行可能に展開されたコンピュータプログラムをCPU101が実行することで、上記管理サーバ3の、管理データベース31等の各部としての処理を実行する。
【0032】
管理データベース31は、相続手続書類の各入力項目について、原簿照会の対象となるか否かを管理するデータベースである。原簿照会は、相続手続きにあたり対象となる預貯金等の口座の情報を確認するために行われるものであり、預貯金等の口座を管理するデータベースである原簿に対して口座番号を検索キーとして口座情報を呼び出し、原簿に記録された口座情報と相続手続きの申し出があった情報とが合致するか否かを確認する。原簿には口座番号の他、預貯金者の氏名、生年月日、住所等の預貯金等の情報が登録されている。なお、原簿照会は口座番号だけでなく、例えば、氏名など、原簿に記録されている他の情報の項目により検索することも可能である。
図3は、実施形態において管理データベースに記憶される原簿照会管理テーブルの一例を示す図である。
図3に例示される原簿照会管理テーブル311は、「入力項目」と「原簿対比」の各項目を含む。「入力項目」には、相続手続書類B1の入力項目を示す情報が格納される。「原簿照会」は、相続手続書類B1の各入力項目について原簿照会の対象であるか否かを示す情報が格納される。「原簿照会」において、「対象」は原簿照会の対象であることを示し、「非対称」は原簿照会の対象ではないことを示す。
図3に例示する原簿照会管理テーブル311は、例えば、入力項目「被相続人住所」は原簿照会の対象であり、入力項目「代表相続人住所」は原簿照会の対象ではないことを示している。
【0033】
(作業端末1の処理ブロック)
作業端末1は、
図2に例示されるように、取得部11、算出部12、第1判定部13、第2判定部14および出力部15を備える。作業端末1は、主記憶部102に実行可能に展開されたコンピュータプログラムをCPU101が実行することで、上記作業端末1の、取得部11、算出部12、第1判定部13、第2判定部14および出力部15等の各部としての処理を実行する。
【0034】
取得部11は、相続手続書類をデジタル化したデジタル画像をスキャナ2から取得する。取得部11は、取得したデジタル画像に対してOCRを実行することで、相続手続書類に記入された文字列を情報処理装置で編集可能な文字情報として取得する。
【0035】
ここで、取得部11がOCRの対象とする相続手続書類の一例について説明する。
図4は、相続手続書類の一例を示す図である。
図4に例示される相続手続書類B1は、「被相
続人」、「代表相続人」、「配偶者」、「子」に係る情報を記入する入力欄を有する。被相続人に係る情報を記入する入力欄には、「住所」、「カナ氏名」、「氏名」、「生年月日」、「死亡年月日」の各入力項目が設けられる。代表相続人に係る情報を記入する入力欄には、「住所」、「カナ氏名」、「氏名」、「電話番号」の各入力項目が設けられる。配偶者に係る情報を記入する入力欄には、「氏名」、「死亡・海外居住の別」、「死亡年月日」の各入力項目が設けられる。子に係る情報を入力する入力欄には、「氏名」、「未成年・死亡・海外居住の別」、「死亡年月日」の各入力項目が設けられる。相続手続書類B1では、各入力項目に対して、代表相続人等により手書きで文字列が記入される。
【0036】
取得部11は、
図4に例示される相続手続書類B1に対してOCRを実行することで、例えば、「被相続人」の「カナ氏名」に記入された文字列から情報処理装置で編集可能な文字情報「ユウチョ タロウ」を取得する。取得部11は、「取得手段」の一例である。
【0037】
算出部12は、各入力項目について、取得部11による文字認識処理の認識結果の正しさを示す確信度を文字ごとに算出する。算出部12は、例えば、「被相続人」の「住所」に記入された各文字(東、京、都、〇、〇、△、△、1、−、1、8、−、1)に対して確信度を算出する。算出部12は、算出した確信度のうち、最も低い確信度を当該入力項目の認識確度とすることができる。算出部12による確信度の算出方法には限定はなく、公知の様々な技術を適用可能である。算出部12は、「算出手段」の一例である。
【0038】
第1判定部13は、算出部12が算出した認識確度が第1閾値以上であるか否かを判定する。認識確度が第1閾値以上である場合には、例えば、取得部11が取得した文字情報と相続手続書類B1に記入された文字列とが一致する可能性が高くなる。第1閾値は、「基準値」の一例である。
【0039】
第2判定部14は、管理サーバ3の管理データベース31を参照して、相続手続書類B1の読み取り後に実行される原簿照会の対象となる入力項目であるか否かを判定する。原簿照会は、「後続処理」の一例である。
【0040】
出力部15は、相続手続書類B1に記入された文字列の画像と、取得部11が取得した文字情報とを入力項目ごとに対応付けた確認画面を表示部105に出力する。ここで、出力部15は、第1判定部13によって認識確度が第1閾値以上であると判定され、かつ、第2判定部14によって原簿照会の対象であると判定された入力項目については、確認画面への出力を抑制する。確認画面への出力の抑制は、例えば、当該入力項目を非表示とする、当該入力項目をグレーアウトする等の処理によって実行される。
【0041】
図5は、実施形態において、出力部が出力する確認画面の一例を示す図である。
図5に例示される確認画面D1は、左ウィンドウD11と右ウィンドウD12とを含む。左ウィンドウD11には、相続手続書類B1の全体を示す画像が表示される。右ウィンドウD12には、相続手続書類B1に記入された文字列の画像と、取得部11が取得した文字情報とが入力項目ごとに対応付けて表示される。
【0042】
右ウィンドウD12では、入力項目ごとに「スキャン画像」と「認識結果」が対応付けて表示される。「スキャン画像」には、スキャナ2が相続手続書類B1を読み込んだデジタル画像のうち、入力項目に相当する部分の画像が表示される。「認識結果」には、取得部11が文字認識処理によって取得した文字列が表示される。「認識結果」に表示された文字列は編集可能である。そのため、作業端末1を操作する職員は、「スキャン画像」と「認識結果」とを対比して認識結果の修正作業を行うことができる。
【0043】
図5の例では、例えば、「被相続住所」において、相続手続書類B1には「東京都〇O
区△△1-18-1」と記入されているものが、認識結果としては「東京都〇O区△△1-16-1」と誤認識されていることが理解できる。また、例えば、「被相続人氏名」において、相続手続書類B1には「郵貯 太郎」と記入されているものが、認識結果としては「郵貯 大郎」と誤認識されていることが理解できる。
【0044】
確認画面D1において、出力部15が出力を抑制した入力項目はグレーアウトで表示されている。
図5の例では、出力部15は、「被相続人カナ氏名」および「被相続人生年月日」の入力項目の出力を抑制している。すなわち、「被相続人カナ氏名」および「被相続人生年月日」の入力項目については、認識確度が第1閾値より高く、かつ、原簿照会による確認対象となっている。
【0045】
<処理フロー>
図6は、実施形態における作業端末の処理フローの一例を示す図である。以下、
図6を参照して、作業端末1の処理フローの一例について説明する。
【0046】
P1では、取得部11は、スキャナ2から相続手続書類B1のデジタル画像を取得する。P2では、取得部11は、P1で取得したデジタル画像に対してOCRを実行し、相続手続書類B1の各入力項目に記入された文字列を情報処理装置で編集可能な文字情報として取得する。
【0047】
P3では、算出部12は、P2で実行したOCRの認識結果の正しさを示す確信度を文字ごとに算出する。算出部12は、算出した確信度のうち、最も低い確信度を入力項目の認識確度とする。
【0048】
P4では、第1判定部13は、P3で算出した認識確度が第1閾値以上であるか否かを判定する。第1閾値以上である場合(P4でYES)、処理はP5に進められる。第1閾値未満である場合(P4でNO)、処理はP7に進められる。
【0049】
P5では、第2判定部14は、管理サーバ3の管理データベース31を参照して、入力項目が原簿照会の対象であるか否かを判定する。原簿照会の対象である場合(P5でYES)、処理はP6に進められる。原簿照会の対象ではない場合(P5でNO)、処理はP7に進められる。
【0050】
P6では、出力部15は、当該入力項目を確認画面D1への表示を抑制する対象と判定する。P7では、出力部15は、当該入力項目を確認画面D1へ表示する対象と判定する。
【0051】
P8では、出力部15は、確認画面D1を作業端末1の表示部105に出力する。ここで、出力部15は、P6で表示を抑制する対象と判定した入力項目については、確認画面D1への出力を抑制する。
【0052】
<実施形態の作用効果>
実施形態では、作業端末1は、認識確度が第1閾値より高く、かつ、原簿照会において確認される入力項目については、確認画面D1への出力を抑制する。そのため、実施形態に係る相続事務支援システム500は、OCRの結果を確認する職員が確認を要する入力項目の数を減少させることができ、職員の確認負荷を低減することができる。すなわち、本実施形態に係る相続事務支援システム500は、文字認識処理の認識結果を目視確認する作業負担を軽減することができる。
【0053】
<変形例>
実施形態では、認識確度が第1閾値より高く、かつ、原簿照会において確認される入力項目の確認画面D1への出力が抑制されたが、第1閾値より高い第2閾値以上である入力項目については、原簿照会の有無にかかわらず、確認画面D1への出力が抑制されてもよい。この場合、第1判定部13が、第2閾値と認識確度との比較をさらに実行する。そして、出力部15が、認識確度が第2閾値以上であると判定された入力項目については、確認画面D1への出力を抑制すればよい。第2閾値は、「確信値」の一例である。
【0054】
実施形態では、管理サーバ3が管理データベース31を備えるが、管理データベース31を作業端末1が備えてもよい。管理データベース31は、作業端末1がアクセス可能であれば、作業端末1および管理サーバ3のいずれとも異なる装置が備えてもよい。
【0055】
以上で開示した実施形態や変形例はそれぞれ組み合わせることができる。
【0056】
<<コンピュータが読み取り可能な記録媒体>>
コンピュータその他の機械、装置(以下、コンピュータ等)に上記いずれかの機能を実現させる情報処理プログラムをコンピュータ等が読み取り可能な記録媒体に記録することができる。そして、コンピュータ等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
【0057】
ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、Compact Disc Read Only Memory(CD−ROM)、Compact Disc−Recordable(CD−R)、Compact Disc−ReWriterable(CD−RW)、Digital Versatile Disc(DVD)、ブルーレイディスク(BD)、Digital Audio Tape(DAT)、8mmテープ、フラッシュメモリなどのメモリカード等がある。また、コンピュータ等に固定された記録媒体としてハードディスクやROM等がある。