(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-30
(45)【発行日】2024-05-10
(54)【発明の名称】会計支援装置、会計支援プログラム及び会計支援方法
(51)【国際特許分類】
G06Q 40/12 20230101AFI20240501BHJP
【FI】
G06Q40/12
(21)【出願番号】P 2020019330
(22)【出願日】2020-02-07
【審査請求日】2022-12-14
(73)【特許権者】
【識別番号】504283633
【氏名又は名称】辻・本郷税理士法人
(73)【特許権者】
【識別番号】514181185
【氏名又は名称】株式会社スキャる
(74)【代理人】
【識別番号】100090033
【氏名又は名称】荒船 博司
(74)【復代理人】
【識別番号】110001254
【氏名又は名称】弁理士法人光陽国際特許事務所
(74)【代理人】
【識別番号】100093045
【氏名又は名称】荒船 良男
(72)【発明者】
【氏名】上野 裕史
(72)【発明者】
【氏名】大條 耕造
(72)【発明者】
【氏名】ブレンダン ウィルソン
【審査官】青柳 光代
(56)【参考文献】
【文献】特開2015-118488(JP,A)
【文献】特開2017-010312(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定手段と、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定手段と
、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定手段と、
を備え、
前記第1特定手段は、前記日付列以外で整数の記載を含む行の数が最大である列を、前記残高列と特定し、
前記第4特定手段は、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定することを特徴とする会計支援装置。
【請求項2】
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定手段と、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定手段と
、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定手段と、
を備え、
前記第1特定手段は、前記日付列以外で整数の記載を含む行の数が最大である列であり、かつ、整数の記載を含む行の数が前記日付列における日付の記載を含む行の数と一致するか、又は近似する列を、前記残高列と特定し、
前記第4特定手段は、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定することを特徴とする会計支援装置。
【請求項3】
前記第2特定手段によって特定された列の組み合わせから、入金額が記載された列である入金列と、出金額が記載された列である出金列と、を特定する第3特定手段を備え、
前記第3特定手段は、前記残高列における上下に位置する整数の記載の差から、前記残高列以外の列における整数の記載が入金額又は出金額のいずれに該当するかを特定し、前記入金列と、前記出金列と、を特定することを特徴とする請求項1
又は2に記載の会計支援装置。
【請求項4】
前記第2特定手段によって特定された組み合わせと、前記第
3特定手段によって特定された前記入金列と前記出金列との組み合わせと、の一致につき判定する一致判定手段と、
を備えることを特徴とする請求項
3に記載の会計支援装置。
【請求項5】
コンピュータを、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定手段、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定手段、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定手段、として機能させ、
前記第1特定手段は、前記日付列以外で整数の記載を含む行の数が最大である列を、前記残高列と特定し、
前記第4特定手段は、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定する会計支援プログラム。
【請求項6】
コンピュータを、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定手段、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定手段、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定手段、として機能させ、
前記第1特定手段は、前記日付列以外で整数の記載を含む行の数が最大である列であり、かつ、整数の記載を含む行の数が前記日付列における日付の記載を含む行の数と一致するか、又は近似する列を、前記残高列と特定し、
前記第4特定手段は、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定する会計支援プログラム。
【請求項7】
会計支援装置が実行する会計支援方法であって、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定ステップと、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定ステップと、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定ステップを、含み、
前記第1特定ステップは、前記日付列以外で整数の記載を含む行の数が最大である列を、前記残高列と特定し、
前記第4特定ステップは、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定する会計支援方法。
【請求項8】
会計支援装置が実行する会計支援方法であって、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定ステップと、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定ステップと、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定ステップを、含み、
前記第1特定ステップは、前記日付列以外で整数の記載を含む行の数が最大である列であり、かつ、整数の記載を含む行の数が前記日付列における日付の記載を含む行の数と一致するか、又は近似する列を、前記残高列と特定し、
前記第4特定ステップは、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定する会計支援方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、会計支援装置、会計支援プログラム及び会計支援方法に関する。
【背景技術】
【0002】
ユーザの取引を示す通帳の記載内容を種々の会計処理に用いるためには、その記載内容を文字コードに変換し、電子的なデータにした上で、当該データから、会計処理に必要な記載を抽出する必要がある。
そこで、従来、税理士、公認会計士等は、通帳の記載内容を逐一読み取り、会計処理に必要な記載を抽出した上で、手作業でコンピュータに入力していた。
【0003】
しかし、このような手作業による会計処理に必要な記載の抽出及び入力は、非常に手間が掛かる上に、入力ミスが生じることが避け難く、精度の上でも十分なものとは言い難かった。
そこで、OCR(光学文字認識、Optical Character Recognition/Reader)ソフトウェアを用いて、通帳の記載内容を文字コードに変換した上で、変換結果から、会計処理に必要となる記載内容を自動的に抽出することを目的としたシステムが知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
通帳の記載から会計処理に必要となる記載を抽出するに際しては、各取引につき入金又は出金のいずれに係る取引かを特定の上、入金額及び出金額を抽出することが求められることがある。そのためには、通帳の各列のうち、いずれの列が入金が記載された列に該当し、いずれの列が出金が記載された列に該当するかを、正確に特定することが重要となる。
従来、このような入金が記載された列及び出金が記載された列の特定は、例えば、「支払」、「預り」等の所定のキーワードが記憶されたテーブルを参照の上、当該キーワードを含む列を、入金が記載された列又は出金が記載された列として特定するといった手法がとられていたが、通帳の記載形式は金融機関ごとに区々であることから、このような従来の手法のみでは、通帳の各列のうちいずれの列が入金額が記載された列に該当し、いずれの列が出金額が記載された列に該当するかにつき、必ずしも正確に特定できるわけではなかった。
【0006】
本発明の課題は、通帳の記載から会計処理に必要となる記載を抽出するに際して、入金額及び出金額の記載の特定に誤りが生じる可能性を低減することができる会計支援装置、会計支援プログラム及び会計支援方法を提供することである。
【課題を解決するための手段】
【0007】
上記課題を解決するために、請求項1に記載の発明は、会計支援装置において、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定手段と、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定手段と、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定手段と、
を備え、
前記第1特定手段は、前記日付列以外で整数の記載を含む行の数が最大である列を、前記残高列と特定し、
前記第4特定手段は、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定することを特徴とする。
【0008】
上記課題を解決するために、請求項2に記載の発明は、会計支援装置において、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定手段と、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定手段と、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定手段と、
を備え、
前記第1特定手段は、前記日付列以外で整数の記載を含む行の数が最大である列であり、かつ、整数の記載を含む行の数が前記日付列における日付の記載を含む行の数と一致するか、又は近似する列を、前記残高列と特定し、
前記第4特定手段は、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定することを特徴とする。
【0009】
請求項3に記載の発明は、請求項1又は2に記載の会計支援装置において、
前記第2特定手段によって特定された列の組み合わせから、入金額が記載された列である入金列と、出金額が記載された列である出金列と、を特定する第3特定手段を備え、
前記第3特定手段は、前記残高列における上下に位置する整数の記載の差から、前記残高列以外の列における整数の記載が入金額又は出金額のいずれに該当するかを特定し、前記入金列と、前記出金列と、を特定することを特徴とする。
【0010】
請求項4に記載の発明は、請求項3記載の会計支援装置において、
前記第2特定手段によって特定された組み合わせと、前記第3特定手段によって特定された前記入金列と前記出金列との組み合わせと、の一致につき判定する一致判定手段と、
を備えることを特徴とする。
【0014】
請求項5記載の発明は、会計支援プログラムにおいて、
コンピュータを、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定手段、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定手段、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定手段、として機能させ、
前記第1特定手段は、前記日付列以外で整数の記載を含む行の数が最大である列を、前記残高列と特定し、
前記第4特定手段は、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定する。
請求項6記載の発明は、会計支援プログラムにおいて、
コンピュータを、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定手段、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定手段、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定手段、として機能させ、
前記第1特定手段は、前記日付列以外で整数の記載を含む行の数が最大である列であり、かつ、整数の記載を含む行の数が前記日付列における日付の記載を含む行の数と一致するか、又は近似する列を、前記残高列と特定し、
前記第4特定手段は、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定する。
【0015】
請求項7記載の発明は、会計支援装置が実行する会計支援方法であって、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定ステップと、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定ステップと、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定ステップを、含み、
前記第1特定ステップは、前記日付列以外で整数の記載を含む行の数が最大である列であり、かつ、整数の記載を含む行の数が前記日付列における日付の記載を含む行の数と一致するか、又は近似する列を、前記残高列と特定し、
前記第4特定ステップは、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定する。
請求項8記載の発明は、会計支援装置が実行する会計支援方法であって、
通帳の記載内容を文字コードに変換したデータである変換結果テキストデータから、残高が記載された列である残高列を特定する第1特定ステップと、
前記変換結果テキストデータから、2つの列の組み合わせのうち、整数の記載を含む行の数の和が、前記残高列における整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定する第2特定ステップと、
前記変換結果テキストデータから、日付が記載された列である日付列を特定する第4特定ステップを、含み、
前記第1特定ステップは、前記日付列以外で整数の記載を含む行の数が最大である列であり、かつ、整数の記載を含む行の数が前記日付列における日付の記載を含む行の数と一致するか、又は近似する列を、前記残高列と特定し、
前記第4特定ステップは、前記変換結果テキストデータのそれぞれと、形式データ記憶部に記憶された日付形式データに係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータに対応する座標データから、日付列を特定する。
【発明の効果】
【0016】
本発明によれば、通帳の記載から会計処理に必要となる記載を抽出するに際して、入金額及び出金額の記載の特定に誤りが生じる可能性を低減することができる会計支援装置、会計支援プログラム及び会計支援方法を提供することができる。
【図面の簡単な説明】
【0017】
【
図1】実施形態に係る会計支援システムの構成及びデータの流れを示すブロック図である。
【
図2】実施形態に係る会計支援システムにおける動作の流れの概略を示すフローチャートである。
【
図3】通帳画像の一例を示す図である。なお、「お取引内容」の列における「振込」という記載の後には、実際には取引先を示す固有名詞が片仮名で記載されているが、本図においてはその記載を省略している。
【発明を実施するための形態】
【0018】
以下、
図1から
図3に基づいて、本発明の実施形態である会計支援システム100について説明する。ただし、本発明の技術的範囲は図示例に限定されるものではない。
【0019】
[第1 構成の説明]
会計支援システム100は、後述のように、通帳の画像データ(通帳画像データD2)の記載内容を文字コードに変換の上、変換結果から会計処理に必要となる所定の項目に係るデータを抽出し、ユーザUによる会計処理を支援するためのシステムであり、
図1に示すように、通帳画像データD2の記載内容の文字コードへの変換、変換結果からの所定の項目に係るデータの抽出等を行う会計支援装置1と、会計支援システム100のユーザUがそれぞれ使用し、通帳画像データD2の会計支援装置1への送信等を行うユーザ端末2と、を備えて構成されている。
また、会計支援装置1と各ユーザ端末2との間は、通信ネットワークCを介して接続されている。
なお、会計支援システム100を利用するユーザUとしては、自ら会計処理を行う自然人及び法人の他、これら自然人及び法人から会計処理を依頼された税理士、公認会計士等が広くが含まれる。
【0020】
[1 会計支援装置]
会計支援装置1は、例えば、会計支援システム100を運営・管理する企業等に設置されたPC(Personal Computer)、WS(Work Station)等の情報機器であり、
図1に示すように、制御部11と、記憶部12と、通信部13と、表示部14と、操作部15と、を備えて構成されている。
【0021】
[(1) 制御部]
制御部11は、会計支援装置1の動作を制御する部分であり、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を備えて構成され、RAMの作業領域に展開されたROMや記憶部12に記憶されたプログラムとCPUとの協働により、会計支援装置1の各部を統括制御する。
【0022】
[(2) 記憶部]
記憶部12は、会計支援装置1の運用に必要となる各種情報が記憶される部分であり、例えば、HDD(Hard Disk Drive)、半導体メモリ等により構成され、プログラムデー
タ等の会計支援装置1の運用に必要となるデータを、制御部11から読み書き可能に記憶する。
【0023】
記憶部12には、後述のように、ユーザUに係るデータであるユーザデータD1が記憶されるユーザデータ記憶部121と、通帳画像のデータである通帳画像データD2が記憶される変換対象データ記憶部122と、通帳画像データD2の文字コードへの変換を行った結果に係るデータである変換結果テキストデータD3、変換結果テキストデータD3の通帳画像における座標に係るデータである座標データD4、変換結果テキストデータD3及び座標データD4に基づき電子データにより通帳画像を復元したデータである通帳画像復元データD5並びに変換結果テキストデータD3につき日付、残高金額、入金額又は出金額のいずれかに分類した分類に係るデータである分類データD7が記憶される変換結果データ記憶部123と、日付の記載の特定に用いられる記載形式に係るデータである日付形式データD6が記憶される形式データ記憶部124と、後述の通帳画像データの登録から変換結果の出力までのプロセスにおける会計支援装置1への指令内容が組み合わされたプログラムである通帳画像処理エンジン125と、文書の画像を文字コードの列に変換する一般的なOCR(光学文字認識、Optical Character Recognition/Reader)に係るソフトウェアであるOCRソフトウェア126と、が備えられている。
【0024】
なお、OCRソフトウェア126そのものが記憶部12内に備えられていることは必須ではなく、例えばクラウド型のOCRサービスを利用して、所定のクラウドサーバ上に備えられたOCRソフトウェアを使用するようにし、記憶部12内には、このようなOCRサービスを利用するための、URL、パスワード等の情報のみが記憶されているようにしてもよい。
【0025】
[(3) 通信部]
通信部13は、会計支援装置1とユーザ端末2等との間の通信に用いられる部分であり、例えば、通信用IC(Integrated Circuit)及び通信コネクタなどを有する通信インターフェイスであり、制御部11の制御の元、所定の通信プロトコルを用いて、通信ネットワークCを介したデータ通信を行う。
【0026】
[(4) 表示部]
表示部14は、例えば、LCD(Liquid Crystal Display)等のディスプレイを備え、制御部11から出力された表示制御信号に基づいた画像を表示画面に表示する。
【0027】
[(5) 操作部]
操作部15は、例えば、文字入力キー、数字入力キー、その他各種機能に対応付けられたキーなどを有するキーボード、マウス等のポインティングデバイス等を備え、例えば、会計支援システム100を運営・管理する企業等の従業員からの操作入力を受け付けて、操作入力に応じた操作信号を制御部11へと出力する。なお、操作部15は、例えば、表示部14と一体的に形成されたタッチパネル等であってもよい。
【0028】
[2 ユーザ端末]
ユーザ端末2は、会計支援システム100の複数のユーザUがそれぞれ使用するPC、スマートフォン、タブレット端末等の通信端末であり、例えば、
図1に示すように、会計支援装置1と同様に、制御部21と、記憶部22と、通信部23と、表示部24と、操作部25と、を備えて構成されている。
【0029】
[3 通信ネットワーク]
通信ネットワークCは、例えば、インターネット、電話回線網、携帯電話通信網等であり、会計支援装置1とユーザ端末2との間を接続する。
通信ネットワークCとしては、会計支援装置1とユーザ端末2との間を繋ぎ、これらの間でのデータの送受信を行うことが可能なものであれば特に限定されない。
【0030】
[第2 動作の説明]
以下、実施形態に係る会計支援システム100の使用時の流れについて、
図1から
図3に基づいて説明する。なお、以下においては、
図3に示すように通帳画像の上下及び左右を定め、かつ、通帳の横(左右)方向をX軸方向、縦(上下)方向をY軸方向と定め、通帳画像におけるX軸方向の位置をX座標、通帳画像におけるY軸方向の位置をY座標と定めて説明する。
また、通帳画像において、複数個の文字列が左右方向に並んだものを「行」、通帳画像において、複数個の文字列が上下方向に並んだものを「列」とする。ただし、特定の「列」における「行」とされた場合には、上記のような「行」のうち当該「列」に含まれる部分のみを指すものとする。
なお、「文字列」については、このような「行」及び「列」の定義とは関係なく、単に複数の文字が連なったものを指す。
【0031】
会計支援システム100の使用時の流れは、
図2に示すように、ステップS1からステップS12の12個のステップからなる。以下、それぞれについて詳細に説明する。
【0032】
[1 ステップS1:ユーザデータの登録]
会計支援システム100を使用するユーザU(法人である場合にはその担当従業等)は、システム使用開始前に、まずユーザデータD1の登録を行う。具体的には、ユーザUは、ユーザ端末2の操作部25を用いて、例えば、氏名(法人である場合には会社名等)、連絡先、システム使用時のID、パスワード等を含む所定の情報からなるユーザデータD1を入力する。
ユーザデータD1の入力は、例えば、会計支援装置1の制御部11が、通信部13から通信ネットワークCを介して、必要項目の入力欄が設けられた所定の入力フォームに係るデータをユーザ端末2へと送信させ、これを受信したユーザ端末2において、制御部21が当該入力フォームを表示部24に表示させ、ユーザUが、操作部25を用いて、これに入力することによって行われるようにすればよい。
【0033】
ユーザデータD1が入力されると、ユーザ端末2においては、制御部21が、入力されたユーザデータD1を、通信部23から通信ネットワークCを介して会計支援装置1に送信し、通信部13によってこれを受信した会計支援装置1においては、制御部11が、受信したユーザデータD1を、記憶部12のユーザデータ記憶部121に記憶させる。
【0034】
なお、ユーザUによるユーザデータD1の入力を要するのは、ユーザUが会計支援システム100の利用を開始する前の一度のみであり、それ以降ユーザUは、連絡先、システム使用時のID、パスワード等のユーザデータD1に含まれる情報に変更があった場合にのみ、変更部分につき入力すればよい。
【0035】
[2 ステップS2:通帳画像データの登録]
会計支援システム100を使用するユーザUは、システムの使用時には、まず、通帳画像データD2の登録を行う。
通帳画像データD2は、例えば、
図3に示す通帳画像Gのような、金融機関が発行する通帳の特定の頁を画像データ化したデータであり、PDF、JPEG等、一般的な所定のデジタル静止画像データに係るファイル形式の画像を用いることができる。
【0036】
ユーザUは、例えば、紙媒体である通帳を、一般的なイメージスキャナを用いてスキャンしてデジタル静止画像情報化することで、ユーザ端末2において通帳画像データD2を作成の上、通帳画像データD2を、通信部23から通信ネットワークCを介して会計支援装置1に送信する。
【0037】
通信部13によって通帳画像データD2を受信した会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、受信した通帳画像データD2を、当該ユーザに係るユーザデータD1と紐付けて、記憶部12の変換対象データ記憶部122に記憶させる。
【0038】
なお、上記のような過程を経ることなく、例えば、会計支援システム100を運営・管理する企業等の従業員によって、会計支援装置1に接続されたイメージスキャナ等を用いて、ユーザUから預かった通帳の原本又はそのコピーをスキャンすることで、会計支援装置1が、ユーザ端末2を介することなく通帳画像データD2を取得するようにしてもよい。
【0039】
[3 ステップS3:通帳画像の変換]
続いて、会計支援装置1において、通帳画像データD2に対するOCRソフトウェア126による文字コードへの変換処理がなされる。当該処理は、通帳画像処理エンジン125に従って、制御部11によって行われる。
【0040】
具体的には、会計支援装置1の制御部11は、OCRソフトウェア126を用いて、通帳画像データD2の記載につき文字コードに変換し、通帳画像データD2に含まれる複数の文字列がそれぞれ文字コードに変換されたデータである変換結果テキストデータD3と、それぞれの変換結果テキストデータD3に係る文字列の通帳画像データD2上における座標(各文字列が通帳画像データD2上において存在する位置のX座標及びY座標)に係るデータである座標データD4と、を作成し、取得する。
【0041】
なお、上記のように、OCRソフトウェア126を会計支援装置1の記憶部12に備えることなく、クラウド型の所定のOCRサービスを利用するようにしてもよい。
この場合、記憶部12内には、このようなOCRサービスを利用するためのURL、パスワード等の情報のみが記憶されており、制御部11は、通帳画像処理エンジン125に従い、通信部13から通信ネットワークCを介して、OCRソフトウェア126が備えられた所定のクラウドサーバに通帳画像データD2を送信し、当該クラウドサーバ上において通帳画像データD2の変換処理が行われた後、通信部13により、通信ネットワークCを介して、当該クラウドサーバから変換結果テキストデータD3及び座標データD4を取得することとなる。
【0042】
変換結果テキストデータD3及び座標データD4を取得すると、制御部11は、通帳画像処理エンジン125に従い、変換結果テキストデータD3と対応する座標データD4とを紐付けて、また、全データを元となった通帳画像データD2と紐付けて、記憶部12の変換結果データ記憶部123に記憶させる。
【0043】
[4 ステップS4:元画像の復元]
続いて、会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、変換結果テキストデータD3につき、座標データD4に係る座標に従って配置することで、通帳画像データD2に係る通帳画像と同様に変換結果テキストデータD3に係る文字コードを配置し、通帳画像データD2に係る通帳画像を電子データにより復元したデータである通帳画像復元データD5を作成する。
これによって、通帳画像復元データD5は、例えば
図3に係る通帳画像Gを、文字コードによって各文字列の配置を含めて再現したものとして作成されることとなる。
通帳画像復元データD5を作成すると、制御部11は、通帳画像処理エンジン125に従い、作成した通帳画像復元データD5を、元となった通帳画像データD2と紐付けて、記憶部12の変換結果データ記憶部123に記憶させる。
【0044】
[5 ステップS5:日付列の特定]
続いて、会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、通帳画像復元データD5から、日付に係る記載の位置を特定し、日付に係る記載を含む変換結果テキストデータD3を含む列である日付列Hを特定する。
【0045】
具体的には、まず、変換結果テキストデータD3のそれぞれと、記憶部12の形式データ記憶部124に記憶された日付形式データD6に係る日付の記載として抽出すべき記載形式と、を対照の上、形式が一致する場合に、当該変換結果テキストデータD3を、日付に係る記載を含むものとして抽出する。
【0046】
日付形式データD6としては、例えば、複数の数字が「/」又は「-」で区切られた形式や、複数の数字が「年」、「月」及び「日」で区切られた形式等、日付として抽出すべき記載形式が記憶されており、変換結果テキストデータD3の内容が、当該形式と一致する記載を含む場合に、日付に係る記載として抽出されることとなる。
図3に示した通帳画像Gの例であれば、一番左の列の各行の記載が、全て複数の数字が「-」で区切られた形式であることから、日付形式データD6にこのような記載形式が含まれている場合、このような複数の数字が「-」で区切られた記載を含む変換結果テキストデータD3が、日付に係る記載を含むものとして抽出されることとなる。
【0047】
続いて、制御部11は、日付に係る記載を含むものとして抽出された変換結果テキストデータD3に対応する座標データD4から、日付列Hを特定する。
すなわち、通帳においては、日付の記載は全て同一の列に存在することから、通帳画像復元データD5において、上記のようにして抽出された変換結果テキストデータD3が、X座標において重なり、Y座標において重ならないようにして配置された変換結果テキストデータD3の列を、日付列Hとして特定することとなる。
例えば、
図3に示す通帳画像Gにおいては、左端の列が、日付列Hとして特定されることとなる。
【0048】
[6 ステップS6:整数含有列の特定]
続いて、会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、通帳画像復元データD5から、日付以外の整数の記載の位置を特定し、日付以外の整数の記載を含む変換結果テキストデータD3を含む列である整数含有列Nを特定する。
【0049】
具体的には、まず、変換結果テキストデータD3から、ステップS5において日付に係る記載を含むものとして抽出されたもの以外で、整数の記載を含む変換結果テキストデータD3を、日付以外の整数の記載を含むものとして抽出する。
【0050】
続いて、制御部11は、日付以外の整数の記載を含むものとして抽出された変換結果テキストデータD3に対応する座標データD4から、整数含有列Nを特定する。
すなわち、日付以外の整数の記載を含むものとして抽出された変換結果テキストデータD3と、X座標において重なり、Y座標において重ならないようにして配置された変換結果テキストデータD3の列を、整数含有列Nとして特定することとなる。
例えば、
図3に示す通帳画像Gにおいては、右から4列が、整数含有列N(N1からN4)として特定されることとなる。なお、左から2列目についても、具体的な取引に係る記載のうち10行目に「061」という記載を含むことから、整数含有列Nとして特定されることとなる。
【0051】
[7 ステップS7:各列の整数記載を含む行の数の特定]
続いて、会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、ステップS6において特定された各整数含有列N(
図3に示す通帳画像GにおいてはN1からN4)における整数の記載を含む行の数を特定する。
具体的には、ステップS6において同一の整数含有列Nに含まれるものとして特定された変換結果テキストデータD3のうち、整数の記載を含むものの数を特定することで、各整数含有列Nにおける整数の記載を含む行の数を特定する。
【0052】
[8 ステップS8:残高列の特定]
続いて、会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、ステップS6において特定された整数含有列Nから、通帳における残高が記載されている列である残高列Zを特定する。
【0053】
具体的には、通帳における残高の記載は、取引内容が入金の行及び出金の行のいずれにも存在することから、日付列Hを除けば、全ての列の中で、残高列Zが最も多くの整数の記載を含む行を有することとなる。
そこで、ステップS7において特定された各整数含有列Nにおける整数の記載を含む行の数に基づき、整数の記載を含む行の数が最も多い整数含有列Nを、残高の記載がなされている列である残高列Zと特定する。
【0054】
また、残高は、基本的に通帳の全ての取引に係る行に記載されることから、残高列Zにおける整数の記載を含む行の数は、ステップS5で特定された日付列Hにおける日付の記載を含む行の数と一致するか、少なくとも近似した数となる。
したがって、残高列Zの特定に誤りが生じる可能性をさらに低減するため、整数の記載を含む行の数が最も多い整数含有列Nにおける整数の記載を含む行の数と、日付列Hにおける日付の記載を含む行の数とを比較し、これらが一致する場合か、又はこれらが近似する場合(すなわち差が所定の数未満の場合)にのみ、残高列Zと特定されるようにしてもよい。
【0055】
なお、残高列Zにおける整数の記載を含む行の数と、日付列Hにおける日付の記載を含む行の数とは通常一致するが、稀に、例えば、通帳繰り越しで次の通帳に繰り越す場合等には、当該行には、日付の記載は存在するが、残高の記載は存在しないことがある。したがって、このような行を含む場合には、残高列Zにおける整数の記載を含む行の数と、日付列Hにおける日付の記載を含む行の数とが一致しないこととなる。
しかしながら、上記のように、日付の記載は存在するが、残高の記載は存在しない行が生じるのは稀であることから、残高列Zにおける整数の記載を含む行の数と、日付列Hにおける日付の記載を含む行の数とは、少なくとも近似した値となる。したがって、上記のような手法を用いることで、残高列Zの特定に誤りが生じる可能性をさらに低減することが可能となる。
【0056】
[9 ステップS9:入金列と出金列のペアの特定]
続いて、会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、ステップS6において特定された整数含有列Nから、通帳における入金額が記載されている列である入金列Iと、通帳における出金額が記載されている列である出金列Oと、のペアを特定する。
【0057】
具体的には、通帳における取引の各行の記載は、基本的に入金又は出金のいずれかに該当し、具体的な入金額又は出金額のいずれかに係る整数の記載がなされることとなる。すなわち、残高列Zにおける整数の記載を含む行の数と、入金列Iにおける整数の記載を含む行の数及び出金列Oにおける整数の記載を含む行の数の和と、は通常一致することとなる。
【0058】
ただし、
図3に示す通帳画像Gにおける具体的な取引に係る記載のうち1行目の、取引内容が「繰越」となっている行のように、稀に、残高の記載はなされているが、入金額又は出金額の記載はなされていない行も存在することから、このような行を含む場合には、残高列Zにおける整数の記載を含む行の数と、入金列Iにおける整数の記載を含む行の数及び出金列Oにおける整数の記載を含む行の数の和と、が一致しないこととなる。
しかしながら、上記のように、残高の記載は存在するが、入金額又は出金額の記載は存在しない行が生じるのは稀であることから、残高列Zにおける整数の記載を含む行の数と、入金列Iにおける整数の記載を含む行の数及び出金列Oにおける整数の記載を含む行の数の和と、は少なくとも近似した値となる。
【0059】
そこで、制御部11は、ステップS8において残高列Zとして特定されたもの以外の整数含有列Nから2列を抽出した組を全パターン作成の上、これら各組に含まれる整数の記載を含む行の数の和を算出し、当該和が、残高列Zにおける整数の記載を含む行の数と一致する組を、入金列Iと出金列Oとのペアと特定する。また、一致する組が存在しない場合には、整数の記載を含む行の数の和が、残高列Zにおける整数の記載を含む行の数と最も近似する組を、入金列Iと出金列Oとのペアと特定する。
【0060】
図3に係る通帳画像Gにおいては、左から3番目の列(整数含有列N2)及び左から4番目の列(整数含有列N3)の整数の記載を含む行の数を足すと23行となり、右から1番目のステップS8において残高列Zと特定された列の整数の記載を含む行の数(24行)と一致しないものの、最も近似することから、これら2列が、入金列Iと出金列Oとのペアと特定されることとなる。
【0061】
[10 ステップS10:入金列及び出金列の特定]
続いて、会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、ステップS9において特定された入金列Iと出金列Oとのペアのうち、いずれの列が入金列Iに該当し、いずれの列が出金列Oに該当するかにつき特定する。
【0062】
具体的には、まず、残高列Zの各行に記載の整数につき、一つ上の行に記載の整数を引き、その差を算出する。
例えば、
図3に示す通帳画像Gにおいては、残高列Zの残高の記載のうち4行目に記載の整数は「65,260,412」であり、その上の3行目に記載の整数は、「65,271,468」である。したがって、4行目に記載の整数から、その上の3行目に記載の整数を引いた差は、「-11,056」となる。
また、残高列Zの残高の記載のうち9行目に記載の整数は「62,928,466」であり、その上の8行目に記載の整数は、「62,600,466」である。したがって、9行目に記載の整数から、その上の8行目に記載の整数を引いた差は、「328,000」となる。
【0063】
ここで、通帳におけるある行の取引内容が出金であれば、残高が減少することから、残高列Zの当該行に記載の整数から、一つ上の行に記載の整数を引いた差は、マイナスとなる。
これに対し、通帳におけるある行の取引内容が入金であれば、残高が増加することから、残高列Zの当該行に記載の整数から、一つ上の行に記載の整数を引いた差は、プラスとなる。
したがって、上記差がマイナスとなる行に記載の残高以外の整数は出金、上記差がプラスとなる行に記載の残高以外の整数は入金となることから、入金列Iと出金列Oとのペアから、いずれが入金列Iに該当し、いずれが出金列Oに該当するかを特定することができる。
【0064】
なお、入金列Iと出金列Oとのペアから、いずれが入金列Iに該当し、いずれが出金列Oに該当するかを特定する方法は、上記のものには限られない。
例えば、上記とは反対に、残高列Z中の2行につき、上の行に記載の整数から下の行に記載の整数を引いて差を算出するようにしてもよい。この場合、当該差がプラスなら下の行に記載の残高以外の整数は出金、当該差がマイナスなら下の行に記載の残高以外の整数は入金となることから、入金列Iと出金列Oとのペアから、いずれが入金列Iに該当し、いずれが出金列Oに該当するかを特定することができる。
【0065】
また、記憶部12の形式データ記憶部124に、例えば、出金列Oであれば「支払」、入金列Iであれば「預り」等の所定のキーワードを含む列といった形で、入金列I及び出金列Oとして特定すべき列の記載形式に係るデータを記憶しておき、当該データを使用して、入金列Iと出金列Oとのペアから、いずれが入金列Iに該当し、いずれが出金列Oに該当するかを特定するようにしてもよい。
【0066】
[(11) ステップS11:特定結果の記録]
続いて、会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、ステップS10までで特定された日付列H、残高列Z、入金列I及び出金列Oのそれぞれに含まれる変換結果テキストデータD3につき、日付、残高金額、入金額又は出金額のいずれに該当するかに係るデータである分類データD7を、記憶部12の変換結果データ記憶部123に、対応する変換結果テキストデータD3と紐付けて記憶させる。
すなわち、変換結果データ記憶部123には、日付列H、残高列Z、入金列I及び出金列Oのいずれかに含まれる変換結果テキストデータD3については、これと紐付けられるようにして、通帳画像データD2上における座標に係るデータである座標データD4に加えて、日付、残高金額、入金額又は出金額のいずれに該当するかに係るデータである分類データD7が記憶されることとなる。
【0067】
[(12) ステップS12:変換結果の出力]
続いて、会計支援装置1においては、制御部11が、通帳画像処理エンジン125に従い、記憶部12の変換結果データ記憶部123の記憶内容に基づき、通帳の行ごと、すなわち一つの取引ごとに、日付と、入金額又は出金額と、残高金額と、をまとめた出力用データD8を作成する。すなわち、座標データD4に含まれるY座標を利用し、分類データD7において日付、残高金額、入金額又は出金額のいずれかに分類された変換結果テキストデータD3から、Y座標が重なるものを抽出することによって、出力用データD8を作成する。
【0068】
出力用データD8には、例えば、
図3に示す通帳画像Gであれば、具体的な取引に係る記載のうち1行目について、「日付:平成31年8月10日、残高:65,283,306円」というデータが含まれることとなり、具体的な取引に係る記載のうち2行目について、「日付:平成31年8月10日、出金:1,609円、残高:65,281,697円」というデータが含まれることとなる。このようなデータが、通帳画像Gの具体的な取引に係る記載がなされた全行分作成されることとなる。
【0069】
出力用データD8を作成すると、制御部11は、通帳画像処理エンジン125に従い、出力用データD8を、通信部13から通信ネットワークCを介して、ユーザ端末2へと送信する。
通信部23によって出力用データD8を受信したユーザ端末2においては、制御部21が、出力用データD8の内容を、表示部24に表示する。
【0070】
[第3 効果の説明]
本実施形態に係る会計支援システム100によれば、会計支援装置1において、通帳画像データD2を文字コードに変換したデータである変換結果テキストデータD3から、残高が記載された列である残高列Zを特定し、さらに、変換結果テキストデータD3から、整数の記載を含む行の数の和が、残高列Zにおける整数の記載を含む行の数と一致するか、又は最も近似する整数含有列Nの組み合わせを特定する。
これによって、少なくともこのような組み合わせとなり得ない列を、入金列I又は出金列Oとして特定してしまうことを防止することが可能となることから、通帳の記載から会計処理に必要となる記載を抽出するに際して、入金額及び出金額の記載の特定に誤りが生じる可能性を低減することができる。
なお、例えば、取引内容の記載がなされた列に整数の記載を含む行が複数存在するようなケースにおいては、例外的に、整数の記載を含む行の数の和が残高列Zにおける整数の記載を含む行の数と一致するか、又は最も近似する整数含有列Nの組み合わせが、入金列Iと出金列Oとの組み合わせとならず、本実施形態における特定方法が機能しないケースが生じる可能性は必ずしも否定できない。しかしながら、このようなケースは稀であることから、本実施形態によって、入金額及び出金額の記載の特定に誤りが生じる可能性を皆無とすることはできないとしても、少なくとも低減することはできる。
【0071】
また、整数の記載を含む行の数の和が、残高列Zにおける整数の記載を含む行の数と一致するか、又は最も近似する残高列Z以外の整数含有列Nの組み合わせを特定した上で、さらに、残高列Zの上下に位置する整数の記載の差から、前記組み合わせのいずれが入金列Iに該当し、いずれが出金列Oに該当するかを特定することで、幅広い記載形式の通帳について、入金列I及び出金列Oを特定することが可能となる。
【0072】
また、変換結果テキストデータD3から、日付が記載された列である日付列Hを特定することで、通帳の記載から会計処理に必要となる記載を抽出するに際して、入金額及び出金額の記載に加え、日付の記載についても特定することが可能となる。
【0073】
また、日付列H以外で整数の記載を含む行の数が最大である列を残高列Zと特定することで、幅広い記載形式の通帳について、残高列Zを特定することが可能となる。
また、日付列H以外で整数の記載を含む行の数が最大である列における整数の記載を含む行の数と、日付列Hにおける日付の記載を含む行の数とを比較し、これらが一致する場合か、又はこれらが近似する場合にのみ、残高列Zと特定されるようにすることで、残高列Zの特定に誤りが生じる可能性をさらに低減することができる。
【0074】
[第4 変形例]
以下、上記実施形態の変形例につき説明する。
【0075】
[1 変形例1]
上記実施形態においては、ステップS4における通帳画像復元データD5の作成後、最初に日付列Hを特定し、日付列H以外の整数の記載を含む列を整数含有列Nとして特定した上で、このような整数含有列Nから、残高列Z、入金列I及び出金列Oを特定する場合につき説明したが、これと異なり、最初に日付列Hを特定しない構成とすることも可能である。
【0076】
すなわち、制御部11が、通帳画像復元データD5の作成後、通帳画像処理エンジン125に従い、まず、日付列Hを含めて整数含有列Nを特定した上で、このような整数含有列Nから、例えば、残高列Zとして特定すべき所定の記載形式が記憶されたデータ等を用いて、残高列Zを特定する。
続いて、残高列Z以外の整数含有列Nから、整数の記載を含む行の数の和が、残高列Zにおける整数の記載を含む行の数と一致するか、又は最も近似する整数含有列Nの組み合わせを特定し、このような組み合わせの中から、入金列I及び出金列Oを特定する。
日付列Hについては、特定を要する場合には、例えば、上記の後に、残高列Z、入金列I及び出金列Oを除いた整数含有列Nから、日付形式データD6を用いて特定するようにすればよい。
【0077】
この場合、残高列Zの特定のためにも所定の記載形式に係るデータ等を用いる必要性が生じることから好ましくはないものの、整数の記載を含む行の数の和が、残高列Zにおける整数の記載を含む行の数と一致するか、又は最も近似する整数含有列Nの組み合わせとなり得ない列を、入金列I又は出金列Oとして特定してしまうことを防止できる点に変わりはないことから、通帳の記載から会計処理に必要となる記載を抽出するに際して、入金額及び出金額の記載の特定に誤りが生じる可能性を低減することができる。
【0078】
[2 変形例2]
上記実施形態においては、変換結果テキストデータD3から、2つの整数含有列Nの組み合わせのうち、整数の記載を含む行の数の和が、残高列Zにおける整数の記載を含む行の数と一致するか、又は最も近似する組み合わせを特定した上で、特定された組み合わせの中から、入金列I及び出金列Oを特定する場合につき説明したが、これとは異なり、別途入金列I及び出金列Oを特定した上で、特定の誤りを検出するために、このような入金列I及び出金列Oの組み合わせが、整数の記載を含む行の数の和が残高列Zにおける整数の記載を含む行の数と一致するか、又は最も近似する整数含有列Nの組み合わせと一致するかにつき判定するようにしてもよい。
【0079】
すなわち、制御部11が、通帳画像処理エンジン125に従い、例えば、出金列Oであれば「支払」、入金列Iであれば「預り」等の所定のキーワードを含む列といった形で、入金列I及び出金列Oとして特定すべき列の記載形式が記憶されたデータを用いる等の任意の方法を用いて、入金列I及び出金列Oを特定した上で、このような特定結果に係る入金列Iと出金列Oとの組み合わせが、整数の記載を含む行の数の和が、残高列Zにおける整数の記載を含む行の数と一致するか、又は最も近似する整数含有列Nの組み合わせと一致するかにつき判定するようにする。
【0080】
この場合も、入金列I及び/又は出金列Oの特定に誤りがあった場合、これらの組み合わせが、整数の記載を含む行の数の和が残高列Zにおける整数の記載を含む行の数と一致するか、又は最も近似する整数含有列Nの組み合わせと一致しなくなることから、入金列I及び/又は出金列Oの特定の誤りを検出することが可能となり、通帳の記載から会計処理に必要となる記載を抽出するに際して、入金額及び出金額の記載の特定に誤りが生じる可能性を低減することができる。
【符号の説明】
【0081】
100 会計支援システム
1 会計支援装置
11 制御部(第1特定手段、第2特定手段、第3特定手段、第4特定手段、第5特定手段、一致判定手段)
12 記憶部
121 ユーザデータ記憶部
122 変換対象データ記憶部
123 変換結果データ記憶部
124 形式データ記憶部
125 通帳画像処理エンジン(会計支援プログラム)
126 OCRソフトウェア
13 通信部
14 表示部
15 操作部
2 ユーザ端末
21 制御部
22 記憶部
23 通信部
24 表示部
25 操作部
C 通信ネットワーク
D1 ユーザデータ
D2 通帳画像データ
D3 変換結果テキストデータ
D4 座標データ
D5 通帳画像復元データ
D6 日付形式データ
D7 分類データ
D8 出力用データ
G 通帳画像
H 日付列
N 整数含有列
Z 残高列
I 入金列
O 出金列