(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022029398
(43)【公開日】2022-02-17
(54)【発明の名称】データ処理装置、データ処理方法及びデータ処理プログラム
(51)【国際特許分類】
G06Q 40/00 20120101AFI20220209BHJP
【FI】
G06Q40/00 400
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2020205033
(22)【出願日】2020-12-10
(62)【分割の表示】P 2020542356の分割
【原出願日】2020-08-04
(71)【出願人】
【識別番号】516380407
【氏名又は名称】ファーストアカウンティング株式会社
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【弁理士】
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】葛 鴻鵬
(72)【発明者】
【氏名】松田 顕
(72)【発明者】
【氏名】小俣 智
(72)【発明者】
【氏名】森 啓太郎
【テーマコード(参考)】
5L055
【Fターム(参考)】
5L055BB63
(57)【要約】
【課題】経理担当者の確認作業を軽減する。
【解決手段】データ処理装置1は、証憑データを取得するデータ取得部151と、証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する領域特定部152と、表示領域に表示されている数値である表示数値を特定する数値特定部153と、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、領域特定部152が表示領域を正しく特定できたか否かを判定する判定部154と、判定部154が表示領域を正しく特定できていないと判定した場合に、領域特定部152が特定した表示領域を示す情報を表示部に表示させる受付部156と、を有する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
証憑データを取得するデータ取得部と、
前記証憑データにおける数値に対応する複数の項目を含む表示領域を特定する領域特定部と、
前記表示領域に表示されている数値である表示数値を特定する数値特定部と、
特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部と、
前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部と、
を有するデータ処理装置。
【請求項2】
前記判定部は、所定列に表示されている複数の前記表示数値と、前記所定列に表示されている複数の前記表示数値を合計した数値を示す表示合計値とを特定し、前記所定列に表示されている複数の前記表示数値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定する、
請求項1に記載のデータ処理装置。
【請求項3】
前記判定部は、所定行に表示されている複数の前記表示数値と、前記所定行に表示されている複数の前記表示数値に基づいて所定の演算を行った結果を示す表示演算値とを特定し、前記所定行に表示されている複数の前記表示数値の演算値と、前記表示演算値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定する、
請求項2に記載のデータ処理装置。
【請求項4】
前記判定部は、複数行のそれぞれにおいて表示されている複数の表示数値の演算値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定する、
請求項2又は3に記載のデータ処理装置。
【請求項5】
前記表示領域の少なくとも一部を囲う一以上の枠線を前記証憑データに重畳して表示部に表示させ、前記一以上の枠線のうち、いずれかの枠線の選択を受け付ける受付部をさらに有し、
前記数値特定部は、選択された前記枠線に含まれる領域内の前記表示数値を再度特定する、
請求項1から4のいずれか一項に記載のデータ処理装置。
【請求項6】
前記証憑データに含まれている複数の文字列を特定し、前記複数の文字列のうち、正しく認識されている蓋然性が閾値以上である複数の認識文字列の位置に基づいて前記一以上の枠線を作成する枠線作成部をさらに有する、
請求項5に記載のデータ処理装置。
【請求項7】
前記データ取得部が過去に取得した前記証憑データと、当該証憑データに対して正しいと判定された前記表示領域に対応する枠線とを教師データとして学習し、前記証憑データの入力に対して、複数の前記枠線を出力するモデルを記憶する記憶部を有し、
前記受付部は、前記データ取得部が取得した前記証憑データを前記モデルに入力し、前記モデルから出力された複数の前記枠線を前記証憑データに重畳して表示部に表示させる、
請求項5又は6に記載のデータ処理装置。
【請求項8】
コンピュータが実行する、
証憑データを取得するステップと、
前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定するステップと、
前記表示領域に表示されている数値である表示数値を特定するステップと、
特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記表示領域を特定するステップにおいて前記表示領域を正しく特定できたか否かを判定するステップと、
前記表示領域を正しく特定できていないと判定した場合に、前記表示領域を特定するステップにおいて特定された前記表示領域を示す情報を表示部に表示させるステップと、
を有するデータ処理方法。
【請求項9】
コンピュータを、
証憑データを取得するデータ取得部、
前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する領域特定部、
前記表示領域に表示されている数値である表示数値を特定する数値特定部、
特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部、及び、
前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる、
データ処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、証憑データを処理するデータ処理装置、データ処理方法及びデータ処理プログラムに関する。
【背景技術】
【0002】
請求書等の証憑データの画像データから商品名及び金額を読み取り、読み取った商品名及び金額に基づいて仕訳データを作成する会計処理システムが知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
証憑データの画像データでは、金額の表示領域が小さいことから金額の位置を正しく読み取れないことがある。この場合には、証憑データ内の金額が正しく読み取られないため、証憑データを管理するシステムに、正しい金額が登録されない。その結果、正しい金額が登録されたのかを経理担当者が逐一確認する必要があり、業務効率が低下していた。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、経理担当者の確認作業を軽減することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係るデータ処理装置は、証憑データを取得するデータ取得部と、前記証憑データにおける数値に対応する複数の項目を含む表示領域を特定する領域特定部と、前記表示領域に表示されている数値である表示数値を特定する数値特定部と、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部と、前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部と、を有する。
【0007】
前記判定部は、所定列に表示されている複数の前記表示数値と、前記所定列に表示されている複数の前記表示数値を合計した数値を示す表示合計値とを特定し、前記所定列に表示されている複数の前記表示数値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定してもよい。
【0008】
前記判定部は、所定行に表示されている複数の前記表示数値と、前記所定行に表示されている複数の前記表示数値に基づいて所定の演算を行った結果を示す表示演算値とを特定し、前記所定行に表示されている複数の前記表示数値の演算値と、前記表示演算値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定してもよい。
【0009】
前記判定部は、複数行のそれぞれにおいて表示されている複数の表示数値の演算値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定してもよい。
【0010】
前記データ処理装置は、前記表示領域の少なくとも一部を囲う一以上の枠線を前記証憑データに重畳して表示部に表示させ、前記一以上の枠線のうち、いずれかの枠線の選択を受け付ける受付部をさらに有し、前記数値特定部は、選択された前記枠線に含まれる領域内の前記表示数値を再度特定してもよい。
【0011】
前記データ処理装置は、前記証憑データに含まれている複数の文字列を特定し、前記複数の文字列のうち、正しく認識されている蓋然性が閾値以上である複数の認識文字列の位置に基づいて前記一以上の枠線を作成する枠線作成部をさらに有してもよい。
【0012】
前記データ取得部が過去に取得した前記証憑データと、当該証憑データに対して正しいと判定された前記表示領域に対応する枠線とを教師データとして学習し、前記証憑データの入力に対して、複数の前記枠線を出力するモデルを記憶する記憶部を有し、前記受付部は、前記データ取得部が取得した前記証憑データを前記モデルに入力し、前記モデルから出力された複数の前記枠線を前記証憑データに重畳して表示部に表示させてもよい。
【0013】
本発明の第2の態様に係るデータ処理方法は、コンピュータが実行する、証憑データを取得するステップと、前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定するステップと、前記表示領域に表示されている数値である表示数値を特定するステップと、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記表示領域を特定するステップにおいて前記表示領域を正しく特定できたか否かを判定するステップと、前記表示領域を正しく特定できていないと判定した場合に、前記表示領域を特定するステップにおいて特定された前記表示領域を示す情報を表示部に表示させるステップと、を有する。
【0014】
本発明の第3の態様に係るデータ処理プログラムは、コンピュータを、証憑データを取得するデータ取得部、前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する領域特定部、前記表示領域に表示されている数値である表示数値を特定する数値特定部、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部、及び、前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部、として機能させる。
【発明の効果】
【0015】
本発明によれば、経理担当者の確認作業を軽減することができるという効果を奏する。
【図面の簡単な説明】
【0016】
【
図1】データ処理装置の概要を説明するための図である。
【
図2】被請求者が受領する請求書の一例を示す図である。
【
図4】請求書情報データベースの一例を示す図である。
【
図5】請求書データに複数の枠線が重畳して表示された例を示す図である。
【
図6】データ処理装置における処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0017】
[データ処理装置1の概要]
図1は、データ処理装置1の概要を説明するための図である。データ処理装置1は、スキャナ又はデジタルカメラ等の読取装置2が証憑を読み取ることによって生成された証憑データを取得し、証憑データに含まれる文字列を解析した結果を用いて証憑を管理するための装置であり、例えばコンピュータである。データ処理装置1は、1台のコンピュータにより構成されていてもよく、複数のコンピュータにより構成されていてもよい。証憑は、例えば、請求書や発注書等の、商品の単価、数量、金額等の商品に関する数値が示された証憑である。本実施形態では、証憑が請求書である場合を例として説明を進める。
【0018】
図2は、被請求者としてのデータ処理装置1のユーザが受領する請求書の一例を示す図である。
図2に示す請求書には、請求書を発行した事業者、すなわち取引における代金を請求する請求者の名称、住所、連絡先が記載されている。また、請求書には、件名(
図2に示す2020年1月分)、請求の対象となる商品の単価、個数及び商品の合計金額(すなわち小計)、複数の商品の合計金額(すなわち請求額)が記載されている。データ処理装置1は、これら請求書に記載された情報と、読取装置2が請求書を読み取ることによって生成された請求書データを取得した取得日とを関連付けて請求書情報データベースに登録して管理する。
【0019】
データ処理装置1は、請求書に記載された数値に関する情報を取得するにあたり、請求書の表示領域のうち、商品の単価、個数、小計、請求額等の数値に対応する複数の項目を含む表示領域を特定する。データ処理装置1は、表示領域に表示されている数値である表示数値を特定し、特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを判定する。データ処理装置1は、表示領域を正しく特定できていないと判定した場合に、表示領域を示す情報を表示部に表示させる。
【0020】
このようにすることで、ユーザは、正しい金額が登録されない場合に、表示領域を確認し、表示領域が正しくないことにより表示数値を特定できなかったのか、表示領域内で表示数値を正しく特定できなかったのかを確認し、その後の対応をとることができる。これにより、データ処理装置1は、ユーザの確認作業を軽減することができる。
【0021】
[データ処理装置1の機能構成及び動作]
図3は、データ処理装置1の機能構成を示す図である。データ処理装置1は、通信部11と、操作部12と、表示部13と、記憶部14と、制御部15とを有する。制御部15は、データ取得部151と、領域特定部152と、数値特定部153と、判定部154と、枠線作成部155と、受付部156と、登録部157と、学習部158とを有する。
【0022】
通信部11は、ネットワーク(例えばイントラネット又はインターネット)に接続するための通信インターフェースであり、読取装置2からデータを受信したり、他のコンピュータとの間でデータを送受信したりするための通信コントローラを有する。
【0023】
操作部12は、請求書に重畳して表示された一以上の枠線のうち、いずれかの枠線をユーザが選択する操作を行ったり、文字列や数値を訂正したりするためのキーボード、マウス及びディスプレイ等のデバイスを有する。
表示部13は、情報を表示するディスプレイである。表示部13は、制御部15の指示に基づいて情報を表示する。
【0024】
記憶部14は、例えばROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部14は、制御部15が実行するプログラムを記憶する。また、記憶部14は、読取装置2が請求書を読み取ることによって生成された請求書データを記憶する。記憶部14は、さらに、請求書データから抽出された情報を管理する請求書情報データベースを記憶する。
【0025】
図4は、請求書情報データベースの一例を示す図である。
図4に示すように請求書情報データベースは、請求書を発行した事業者を識別する発行事業者名と、請求書の発行日と、請求書データが取得された取得日と、請求書の件名と、複数の商品それぞれの品名と、複数の商品それぞれの単価、購入数、及び購入金額とが関連付けられている。請求書情報データベースにおいては、請求書を特定するための請求書識別情報(例えば請求書番号)がさらに含まれていてもよい。
【0026】
制御部15は、例えばCPU(Central Processing Unit)である。制御部15は、記憶部14に記憶されたプログラムを実行することにより、データ取得部151と、領域特定部152、数値特定部153、判定部154、枠線作成部155、受付部156、登録部157、及び学習部158として機能する。
【0027】
データ取得部151は、読取装置2が請求書を読み取ることによって生成した請求書データを取得する。データ取得部151は、読取装置2から請求書データを直接取得してもよいし、データ処理装置1と通信可能に接続されている端末から請求書データを取得してもよい。
【0028】
領域特定部152は、請求書データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する。領域特定部152は、例えばOCR処理を実行することにより、請求書データが示す請求書に含まれている文字列を特定する。領域特定部152は、特定した文字列のうち、数字に対応する複数の項目に対応する文字列の位置を特定する。数字に対応する複数の項目は、
図2に示す例では、単価、個数、金額、合計である。領域特定部152は、例えば、数値に対応する複数の項目を含む矩形領域を数値に対応する表示領域として特定する。
【0029】
数値特定部153は、領域特定部152が特定した表示領域に表示されている数値である表示数値を特定する。具体的には、数値特定部153は、領域特定部152が特定した表示領域に表示されている表示数値を、当該数値に対応する項目と関連付けて特定する。数値特定部153は、請求書において、横に並んでいる複数の表示数値を一つの組み合わせとして特定する。数値特定部153は、
図2に示す例において、単価「550」、個数「10」、金額「5500」を一つの組み合わせとして複数の表示数値を特定する。また、数値特定部153は、合計「11,100」を、請求書が示す請求合計金額として特定する。
【0030】
判定部154は、数値特定部153が特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、領域特定部152が表示領域を正しく特定できたか否かを判定する。具体的には、判定部154は、所定列に表示されている複数の表示数値と、所定列に表示されている複数の表示数値を合計した数値を示す表示合計値とを特定し、所定列に表示されている複数の表示数値の合計値と、表示合計値とが一致しない場合に、表示領域を正しく特定できていないと判定する。
【0031】
図2に示す例では、判定部154は、「金額」列に表示されている複数の表示数値の合計値である縦計を算出する。そして、判定部154は、算出した縦計と、「合計」に対応して表示されている請求合計金額とが一致するか否かを判定する。判定部154は、縦計と、請求合計金額とが一致しない場合に、表示領域を正しく特定できていないと判定する。
図2に示す例において、数値特定部153が、「金額」に対応して、「4,400」、「1,200」のみ特定し、「5,500」の数値の特定ができなかった場合、判定部154は、縦計「5,600」と、請求合計金額「11,100」とが一致せず、表示領域を正しく特定できていないと判定する。このようにすることで、判定部154は、複数商品の全てに対応する金額を漏れなく取得できているか否かを判定することができる。
【0032】
また、判定部154は、所定行に表示されている複数の表示数値と、所定行に表示されている複数の表示数値に基づいて所定の演算を行った結果を示す表示演算値とを特定し、所定行に表示されている複数の表示数値の演算値と、表示演算値とが一致しない場合に、表示領域を正しく特定できていないと判定する。
【0033】
図2に示す例では、判定部154は、「単価」に対応する表示数値と、「個数」に対応する表示数値との乗算値を横計演算値(表示演算値)として特定する。また、判定部154は、「金額」が、「単価」と「個数」とを乗算した結果を示す横計に対応する表示数値である横計表示数値と特定する。判定部154は、数値特定部153が特定した、各行のそれぞれに対し、算出した横計演算値と、当該横計演算値に対応する横計表示数値とが一致するか否かを判定する。判定部154は、横計演算値と横計表示数値とが一致しない場合に、表示領域を正しく特定できていないと判定する。このようにすることで、判定部154は、商品に対応する項目「単価」、「個数」、「金額」に対応する表示数値を正しく取得できているか否かを判定することができる。
【0034】
さらに、判定部154は、複数行のそれぞれにおいて表示されている複数の表示数値の演算値の合計値、すなわち横計演算値の合計値と、表示合計値とが一致しない場合に、表示領域を正しく特定できていないと判定する。このようにすることで、判定部154は、全ての商品に対応する項目「単価」、「個数」、「金額」に対応する表示数値を漏れなく取得できているか否かを判定することができる。
【0035】
枠線作成部155は、請求書データに重畳して表示させる一以上の枠線を作成する。例えば、記憶部14に、過去に取得した請求書データと、当該請求書データに対して正しいと判定された表示領域を囲う矩形形状の枠線の表示位置とを教師データとして学習し、請求書データの入力に対して、複数の枠線を示す枠線情報を出力するモデルを記憶する。枠線情報は、例えば、請求書データにおける枠線の表示位置及び大きさを示す情報である。
【0036】
枠線作成部155は、判定部154が表示領域を正しく特定できていないと判定した場合に、記憶部14に記憶されているモデルに、データ取得部151が取得した請求書データを入力し、当該モデルから出力された複数の枠線情報を取得する。そして、枠線作成部155は、取得した枠線情報に基づいて複数の枠線を作成する。
【0037】
なお、枠線作成部155は、記憶部14に記憶されているモデルに、データ取得部151が取得した請求書データを入力することにより、複数の枠線を取得したが、これに限らない。枠線作成部155は、請求書データに含まれている複数の文字列を特定し、複数の文字列のうち、正しく認識されている蓋然性が閾値以上である複数の認識文字列の位置に基づいて、請求書データに重畳して表示させる一以上の枠線を作成してもよい。
【0038】
例えば、枠線作成部155は、請求書データに含まれている複数の文字列として、商品名に対応する文字列を特定する。
図2に示す例では、枠線作成部155は、「コピー用紙」、「インク」、「ボールペン」を特定する。枠線作成部155は、請求書情報データベースに既に格納されている品名のうち、特定した商品名に一致又は類似する品名を特定する。そして、枠線作成部155は、請求書データから特定した商品名と、当該商品名に一致又は類似する品名との類似度を、商品名が正しく認識されている蓋然性を示す指標として算出する。
【0039】
請求書では、商品名の近傍に単価、個数、金額等の、数値が表示されている蓋然性が高い。このため、枠線作成部155は、算出した類似度が所定の閾値以上の複数の商品名の表示位置を囲うとともに、請求書データにおいて、当該複数の商品名の右側の表示位置を囲う一以上の枠線を作成する。このようにすることで、データ処理装置1は、数値が表示されている蓋然性が高い領域を囲う枠線を作成することができる。
【0040】
受付部156は、表示制御部として機能し、判定部154が表示領域を正しく特定できていないと判定した場合に、領域特定部152が特定した表示領域を示す情報を表示部13に表示させる。例えば、受付部156は、判定部154が表示領域を正しく特定できていないと判定した場合に、請求書データに重畳して、領域特定部152が特定した表示領域の境界を示す枠線を表示部13に表示させる。さらに、受付部156は、判定部154が表示領域を正しく特定できていないことを示す警告情報を表示部13に表示させ、ユーザから表示数値を囲う枠線を表示させ、表示数値を再度特定するかの指示を受け付ける。なお、受付部156は、表示領域の境界を示す枠線を表示部13に表示させたが、これに限らず、表示領域をハイライト表示させる等、他の領域とは異なる態様で表示させてもよい。
【0041】
受付部156は、ユーザから表示数値を再度特定する指示を受け付けると、枠線作成部155が作成した、当該表示領域の少なくとも一部を囲う一以上の枠線を請求書データに重畳して表示部13に表示させる。そして、受付部156は、操作部12を介して、一以上の枠線のうち、いずれかの枠線の選択をユーザから受け付ける。
【0042】
図5は、請求書データに複数の枠線が重畳して表示された例を示す図である。
図5に示す例では、請求書データに2つの枠線L1、L2が表示されていることが確認できる。ユーザは、枠線L1、L2のうち、数値を正しく囲っている枠線を選択する。
図5に示す例では、枠線L1が数値を正しく囲っていることから、ユーザは、枠線L1を選択するものとする。なお、受付部156は、操作部12を介して、ユーザから枠線の選択を受け付けた後に、選択された枠線の調整を受け付けるようにしてもよい。
【0043】
数値特定部153は、受付部156がユーザから選択を受け付けると、選択された枠線に含まれる領域内の表示数値を再度特定する。数値特定部153は、請求書データにおいて、選択された枠線に囲まれる領域内のOCR処理を領域特定部152に行わせる。数値特定部153は、選択された枠線に囲まれる領域内において特定された数値を表示数値として特定する。その後、判定部154は、数値特定部153が再度特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを再度判定する。
【0044】
登録部157は、判定部154が表示領域を正しく特定できたと判定すると、複数の表示数値を請求書情報データベースに記憶させる。登録部157は、判定部154が表示領域を正しく特定できたと判定すると、ユーザから、複数の表示数値を請求書情報データベースに記憶させる登録指示を受け付けてもよい。そして、登録部157は、登録指示を受け付けたことに応じて、請求書情報データベースに複数の表示数値を記憶させてもよい。
【0045】
学習部158は、複数の枠線を示す枠線情報を出力するモデルの学習を行う。例えば、学習部158は、受付部156が枠線の選択を受け付けた場合、登録部157が複数の表示数値を請求書情報データベースに記憶させた後、データ取得部151が取得した請求書データと、選択された枠線を示す枠線情報とを教師データとして、当該教師データに含まれる請求書データの入力に対し、当該枠線情報を出力するようにモデルの学習を行う。
【0046】
また、学習部158は、判定部154が、一度目の判定で表示領域を正しく特定できたと判定すると、登録部157が複数の表示数値を請求書情報データベースに記憶させた後、データ取得部151が取得した請求書データと、表示領域を囲う枠線を示す枠線情報とを教師データとして、当該教師データに含まれる請求書データの入力に対し、当該枠線情報を出力するようにモデルの学習を行う。このようにすることで、データ処理装置1においては、複数の表示数値が請求書情報データベースに登録されればされるほどモデルが学習することができるので、表示数値を囲う枠線がモデルから出力される確率を高めることができる。
【0047】
[データ処理装置1における処理の流れ]
図6は、データ処理装置1における処理の流れを示すフローチャートである。
まず、データ取得部151は、読取装置2が請求書を読み取ることによって生成した請求書データを取得する(S1)。
【0048】
続いて、領域特定部152は、請求書データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する(S2)。
続いて、数値特定部153は、領域特定部152が特定した表示領域に表示されている数値である表示数値を特定する(S3)。
【0049】
続いて、判定部154は、数値特定部153が特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを判定する(S4)。判定部154は、表示領域を正しく特定できたと判定すると、S9に処理を移し、表示領域を正しく特定できていないと判定すると、S5に処理を移す。
【0050】
S5において、受付部156は、表示領域の領域を示す枠線を表示部13に表示させ、ユーザに、表示領域が正しく特定されなかったことを通知する。その後、枠線作成部155は、請求書データに重畳して表示させる一以上の枠線を作成する(S6)。
続いて、受付部156は、枠線作成部155が作成した、表示領域の少なくとも一部を囲う一以上の枠線を請求書データに重畳して表示部13に表示させ(S7)、操作部12を介して、一以上の枠線のうち、いずれかの枠線の選択をユーザから受け付ける(S8)。受付部156は、枠線の選択を受け付けるとS3に処理を移す。
【0051】
S9において、登録部157は、判定部154が表示領域を正しく特定できたと判定すると、複数の表示数値を請求書情報データベースに記憶させる。
続いて、学習部158は、複数の枠線を示す枠線情報を出力するモデルの学習を行う(S10)。
【0052】
[データ処理装置1による効果]
以上説明したように、データ処理装置1は、証憑データとしての請求書データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定し、表示領域に表示されている数値である表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを判定する。そして、データ処理装置1は、表示領域を正しく特定できていないと判定した場合に、表示領域を示す情報を表示部に表示させる。
【0053】
このようにすることで、ユーザは、表示領域を確認し、表示領域が正しくないことにより表示数値を特定できなかったのか、表示領域内で表示数値を正しく特定できなかったのかを確認し、その後の対応をとることができる。これにより、データ処理装置1は、ユーザの確認作業を軽減することができる。
【0054】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0055】
1 データ処理装置
2 読取装置
11 通信部
12 操作部
13 表示部
14 記憶部
15 制御部
151 データ取得部
152 領域特定部
153 数値特定部
154 判定部
155 枠線作成部
156 受付部
157 登録部
158 学習部