IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ファーストアカウンティング株式会社の特許一覧

特開2022-77944データ処理装置、データ処理方法及びプログラム
<>
  • 特開-データ処理装置、データ処理方法及びプログラム 図1
  • 特開-データ処理装置、データ処理方法及びプログラム 図2
  • 特開-データ処理装置、データ処理方法及びプログラム 図3
  • 特開-データ処理装置、データ処理方法及びプログラム 図4
  • 特開-データ処理装置、データ処理方法及びプログラム 図5
  • 特開-データ処理装置、データ処理方法及びプログラム 図6
  • 特開-データ処理装置、データ処理方法及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022077944
(43)【公開日】2022-05-24
(54)【発明の名称】データ処理装置、データ処理方法及びプログラム
(51)【国際特許分類】
   G06Q 20/14 20120101AFI20220517BHJP
   G06Q 40/00 20120101ALI20220517BHJP
【FI】
G06Q20/14
G06Q40/00 400
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021027022
(22)【出願日】2021-02-24
(62)【分割の表示】P 2020564009の分割
【原出願日】2020-11-12
(71)【出願人】
【識別番号】516380407
【氏名又は名称】ファーストアカウンティング株式会社
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【弁理士】
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】葛 鴻鵬
(72)【発明者】
【氏名】松田 顕
(72)【発明者】
【氏名】小俣 智
(72)【発明者】
【氏名】森 啓太郎
(72)【発明者】
【氏名】佐藤 貴亮
(72)【発明者】
【氏名】坂倉 央
【テーマコード(参考)】
5L055
【Fターム(参考)】
5L055AA33
(57)【要約】
【課題】請求書データの確認作業の負担を軽減する。
【解決手段】データ処理装置1は、請求書を示す請求書データを取得するデータ取得部151と、データ取得部151が取得した請求書データと同じ属性を有し、データ取得部151が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、データ取得部151が取得した請求書データに明細データが含まれているか否かを判定する判定部153と、判定部153による請求書データに明細データが含まれているか否かの判定結果を出力する出力部155と、を有する。
【選択図】図3

【特許請求の範囲】
【請求項1】
請求書を示す請求書データを取得するデータ取得部と、
前記データ取得部が取得した請求書データと同じ属性を有し、前記データ取得部が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、前記データ取得部が取得した請求書データに明細データが含まれているか否かを判定する判定部と、
前記判定部による前記請求書データに明細データが含まれているか否かの判定結果を出力する出力部と、
を有するデータ処理装置。
【請求項2】
前記請求書データから前記請求書の発行元を抽出する抽出部をさらに有し、
前記判定部は、前記抽出部が抽出した前記請求書の発行元が同一の前記過去請求書データの前記判定履歴に基づいて、前記請求書データに前記明細データが含まれているか否かを判定する、
請求項1に記載のデータ処理装置。
【請求項3】
前記請求書データからテキスト情報を抽出する抽出部と、
前記請求書データに明細データが含まれていると前記判定部が判定すると、前記抽出部が抽出したテキスト情報に基づいて前記明細データを生成する生成部と、
をさらに有する、
請求項1又は2に記載のデータ処理装置。
【請求項4】
前記判定部は、前記請求書データに明細データが含まれていると判定すると、前記過去請求書データに対する前記明細データの生成履歴に基づいて、前記請求書データに対して前記明細データを生成するか否かを判定し、
前記生成部は、前記明細データを生成すると前記判定部が判定すると、前記明細データを生成する、
請求項3に記載のデータ処理装置。
【請求項5】
前記テキスト情報には、前記請求書の発行元、商品又はサービスの名称が含まれており、
前記判定部は、前記テキスト情報に含まれている前記請求書の発行元と、商品又はサービスの名称との少なくともいずれかが同一の前記過去請求書データの前記生成履歴に基づいて、前記明細データを生成するか否かを判定する、
請求項4に記載のデータ処理装置。
【請求項6】
前記判定部は、前記テキスト情報に含まれている一以上の情報と、前記請求書の発行先が同一の前記過去請求書データの前記生成履歴に基づいて、前記明細データを生成するか否かを判定する、
請求項4又は5に記載のデータ処理装置。
【請求項7】
ユーザの操作に応じて前記生成部が生成した明細データを訂正する訂正部をさらに有し、
前記判定部は、過去に取得された請求書の請求書データから前記生成部が生成した過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、前記生成部が生成した明細データをユーザが確認する必要があるか否かを判定し、
前記出力部は、前記生成部が生成した明細データをユーザが確認する必要があるか否かを示す判定結果を出力する、
請求項3から6のいずれか一項に記載のデータ処理装置。
【請求項8】
前記ユーザが確認する必要があるか否かの判定に用いる前記明細データの信頼度の閾値を設定する設定部をさらに有し、
前記判定部は、前記過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、前記明細データの信頼度を特定し、特定した信頼度が前記設定部が設定した前記閾値を超えるか否かに基づいて、前記明細データをユーザが確認する必要があるか否かを判定する、
請求項7に記載のデータ処理装置。
【請求項9】
コンピュータが実行する、
請求書を示す請求書データを取得するステップと、
取得した請求書データと同じ属性を有し、過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、取得した請求書データに明細データが含まれているか否かを判定するステップと、
取得した請求書データに明細データが含まれているか否かの判定結果を出力するステップと、
を有するデータ処理方法。
【請求項10】
コンピュータを、
請求書を示す請求書データを取得するデータ取得部、
前記データ取得部が取得した請求書データと同じ属性を有し、前記データ取得部が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、前記データ取得部が取得した請求書データに明細データが含まれているか否かを判定する判定部、及び、
前記判定部による前記請求書データに明細データが含まれているか否かの判定結果を出力する出力部、
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、証憑データを処理するデータ処理装置、データ処理方法及びプログラムに関する。
【背景技術】
【0002】
請求書の画像データから商品名及び金額を含む明細を読み取り、読み取った明細を示す明細データに基づいて仕訳データを作成する会計処理システムが知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2018-173935号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
請求書の画像データに明細が含まれていない場合に明細を読み取ろうとすると、誤認識が発生してしまう。このため、担当者が、請求書の画像データからの読み取りが正常に行われたか否かを逐一確認する必要があり、確認作業が煩雑であった。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、請求書データの確認作業の負担を軽減することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係るデータ処理装置は、請求書を示す請求書データを取得するデータ取得部と、前記データ取得部が取得した請求書データと同じ属性を有し、前記データ取得部が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、前記データ取得部が取得した請求書データに明細データが含まれているか否かを判定する判定部と、前記判定部による前記請求書データに明細データが含まれているか否かの判定結果を出力する出力部と、を有する。
【0007】
前記データ処理装置は、前記請求書データから前記請求書の発行元を抽出する抽出部をさらに有し、前記判定部は、前記抽出部が抽出した前記請求書の発行元が同一の前記過去請求書データの前記判定履歴に基づいて、前記請求書データに前記明細データが含まれているか否かを判定してもよい。
【0008】
前記データ処理装置は、前記請求書データからテキスト情報を抽出する抽出部と、前記請求書データに明細データが含まれていると前記判定部が判定すると、前記抽出部が抽出したテキスト情報に基づいて前記明細データを生成する生成部と、をさらに有してもよい。
【0009】
前記判定部は、前記請求書データに明細データが含まれていると判定すると、前記過去請求書データに対する前記明細データの生成履歴に基づいて、前記請求書データに対して前記明細データを生成するか否かを判定し、前記生成部は、前記明細データを生成すると前記判定部が判定すると、前記明細データを生成してもよい。
【0010】
前記テキスト情報には、前記請求書の発行元、商品又はサービスの名称が含まれており、前記判定部は、前記テキスト情報に含まれている前記請求書の発行元と、商品又はサービスの名称との少なくともいずれかが同一の前記過去請求書データの前記生成履歴に基づいて、前記明細データを生成するか否かを判定してもよい。
【0011】
前記判定部は、前記テキスト情報に含まれている一以上の情報と、前記請求書の発行先が同一の前記過去請求書データの前記生成履歴に基づいて、前記明細データを生成するか否かを判定してもよい。
【0012】
前記データ処理装置は、ユーザの操作に応じて前記生成部が生成した明細データを訂正する訂正部をさらに有し、前記判定部は、過去に取得された請求書の請求書データから前記生成部が生成した過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、前記生成部が生成した明細データをユーザが確認する必要があるか否かを判定し、前記出力部は、前記生成部が生成した明細データをユーザが確認する必要があるか否かを示す判定結果を出力してもよい。
【0013】
前記データ処理装置は、前記ユーザが確認する必要があるか否かの判定に用いる前記明細データの信頼度の閾値を設定する設定部をさらに有し、前記判定部は、前記過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、前記明細データの信頼度を特定し、特定した信頼度が前記設定部が設定した前記閾値を超えるか否かに基づいて、前記明細データをユーザが確認する必要があるか否かを判定してもよい。
【0014】
本発明の第2の態様に係るデータ処理方法は、コンピュータが実行する、請求書を示す請求書データを取得するステップと、取得した請求書データと同じ属性を有し、過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、取得した請求書データに明細データが含まれているか否かを判定するステップと、取得した請求書データに明細データが含まれているか否かの判定結果を出力するステップと、を有する。
【0015】
本発明の第3の態様に係るプログラムは、コンピュータを、請求書を示す請求書データを取得するデータ取得部、前記データ取得部が取得した請求書データと同じ属性を有し、前記データ取得部が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、前記データ取得部が取得した請求書データに明細データが含まれているか否かを判定する判定部、及び、前記判定部による前記請求書データに明細データが含まれているか否かの判定結果を出力する出力部、として機能させる。
【発明の効果】
【0016】
本発明によれば、請求書データの確認作業の負担を軽減することができるという効果を奏する。
【図面の簡単な説明】
【0017】
図1】第1実施形態に係るデータ処理装置の概要を説明するための図である。
図2】被請求者が受領する請求書の一例を示す図である。
図3】第1実施形態に係るデータ処理装置の機能構成を示す図である。
図4】請求書情報データベースの一例を示す図である。
図5】第1実施形態に係る読取結果画面の一例を示す図である。
図6】第1実施形態に係るデータ処理装置における処理の流れを示すフローチャートである。
図7】第3実施形態に係るデータ処理装置の機能構成を示す図である。
【発明を実施するための形態】
【0018】
<第1実施形態>
[データ処理装置1の概要]
図1は、第1実施形態に係るデータ処理装置1の概要を説明するための図である。データ処理装置1は、スキャナ又はデジタルカメラ等の読取装置2が請求書を読み取ることによって生成された請求書の画像データである請求書データを取得し、請求書データに含まれる文字列を解析した結果を用いて請求書を管理するための装置であり、例えばコンピュータである。データ処理装置1は、1台のコンピュータにより構成されていてもよく、複数のコンピュータにより構成されていてもよい。
【0019】
図2は、被請求者としてのデータ処理装置1のユーザが受領する請求書の一例を示す図である。図2に示す請求書には、請求書を発行した事業者、すなわち取引における代金を請求する取引先の名称、住所、連絡先が表示されている。また、請求書には、件名(図2に示す2020年1月分)、請求の対象となる商品の単価、個数及び商品の合計金額(すなわち小計)、複数の商品の合計金額(すなわち請求額)が表示されている。また、請求書には、代金の振込先、支払期日が表示されている。データ処理装置1は、これら請求書に表示された情報と、読取装置2が請求書を読み取ることによって生成された請求書データを取得した取得日とを関連付けて請求書情報データベースに登録して管理する。
【0020】
データ処理装置1は、請求書データを取得すると、当該請求書データと同じ属性を有し、過去に取得した請求書データに明細データが含まれているか否かを判定し、判定結果を出力する。属性は、明細データが含まれているか否かとの相関性がある、請求書データが示す請求書に含まれている少なくとも一以上の情報の種類であり、例えば請求書の取引先名、振込先口座番号、担当者名、商品名又はサービス名である。同じ属性を有するとは、例えば、請求書データの内容を示す少なくとも一つの種類の情報が同一であることを意味する。このようにすることで、ユーザは判定結果を確認することにより、判定結果が出力されない場合に比べて、請求書データに明細が含まれているか否かを容易に判断することができる。これにより、データ処理装置1は、請求書データの確認作業の負担を軽減することができる。
【0021】
[データ処理装置1の機能構成及び動作]
図3は、第1実施形態に係るデータ処理装置1の機能構成を示す図である。データ処理装置1は、通信部11と、操作部12と、表示部13と、記憶部14と、制御部15とを有する。制御部15は、データ取得部151と、抽出部152と、判定部153と、生成部154と、出力部155と、訂正部156と、登録部157とを有する。
【0022】
通信部11は、ネットワーク(例えばイントラネット又はインターネット)に接続するための通信インターフェースであり、読取装置2からデータを受信したり、他のコンピュータとの間でデータを送受信したりするための通信コントローラを有する。
【0023】
操作部12は、請求書から読み取った文字列や数値を訂正したりするためのキーボード、マウス及びディスプレイ等のデバイスを有する。
表示部13は、情報を表示するディスプレイである。表示部13は、制御部15の指示に基づいて情報を表示する。
【0024】
記憶部14は、例えばROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部14は、制御部15が実行するプログラムを記憶する。また、記憶部14は、読取装置2が請求書を読み取ることによって生成された請求書データを記憶する。記憶部14は、さらに、請求書データから抽出された情報を管理する請求書情報データベースを記憶する。
【0025】
図4は、請求書情報データベースの一例を示す図である。請求書情報データベースは、図4(a)に示す鑑データと、図4(b)に示す明細データとを含んでいる。鑑データは、請求書を識別するための請求書IDと、請求書を発行した取引先を識別する取引先名と、請求書の発行日と、請求書データが取得された取得日と、代金の支払期日と、請求金額と、請求書の件名とを関連付けたデータである。明細データは、請求書IDと、複数の商品それぞれの品名と、複数の商品それぞれの単価、購入数、及び購入金額とを関連付けたデータである。鑑データは、例えば、データの出力先となる会計システム(不図示)において単一仕訳を行うために用いられる。明細データは、例えば、データの出力先となる会計システムにおいて複合仕訳を行うために用いられる。
【0026】
制御部15は、例えばCPU(Central Processing Unit)である。制御部15は、記憶部14に記憶されたプログラムを実行することにより、データ取得部151、抽出部152、判定部153、生成部154、出力部155、訂正部156、及び登録部157として機能する。
【0027】
データ取得部151は、読取装置2が請求書を読み取ることにより生成された請求書データを取得する。データ取得部151は、読取装置2から請求書データを直接取得してもよいし、データ処理装置1と通信可能に接続されている端末から請求書データを取得してもよい。
【0028】
抽出部152は、OCR処理を実行することにより、請求書データから、請求書に含まれているテキスト情報を抽出する。テキスト情報には、請求書の発行元(取引先)、発行先、発行日、支払期日、請求金額が少なくとも含まれている。また、請求書に明細が含まれている場合、テキスト情報には、商品又はサービスの名称、単価、数量、小計が含まれている。抽出部152は、請求書に含まれているテキスト情報の中から、請求書の発行元を示す発行元情報を抽出する。
【0029】
判定部153は、データ取得部151が取得した請求書データに明細データが含まれているか否かを判定する。判定部153は、データ取得部151が取得した請求書データと同じ属性を有し、データ取得部151が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、データ取得部151が取得した請求書データに明細データが含まれているか否かを判定する。例えば、判定部153は、データ取得部151が取得した請求書データから抽出部152が抽出した発行元情報が示す発行元が過去に発行した過去請求書データの判定履歴に基づいて、取得した請求書データに明細データが含まれているか否かを判定する。
【0030】
具体的には、判定部153は、記憶部14に記憶されている第1分類モデルを用いて、取得した請求書データに明細データが含まれているか否かを判定する。第1分類モデルは、例えば、請求書データと発行元情報が入力されると、当該請求書データに明細データが含まれているか否かを示す情報を出力するニューラルネットワークのモデルである。
【0031】
第1分類モデルは、データ取得部151が過去に取得した過去請求書データと、当該過去請求書データの発行元情報と、過去請求書データに明細データが含まれているか否かの判定結果とを含む教師データに基づいて学習することにより生成され、記憶部14に記憶される。判定部153は、データ取得部151が取得した請求書データと、抽出部152が抽出した発行元情報とを第1分類モデルに入力し、第1分類モデルから出力された判定結果を取得することにより、取得した請求書データに明細データが含まれているか否かを判定する。
【0032】
なお、判定部153は、第1分類モデルを用いて請求書データに明細データが含まれているか否かを判定したが、これに限らない。判定部153は、請求書の発行元を示す発行元情報と、当該発行元が発行した請求書の請求書データに明細データが含まれているか否かの判定結果とを関連付けた判定履歴情報を参照し、抽出部152が請求書データから抽出した発行元情報が示す発行元に関連付けられている判定結果に基づいて、取得した請求書データに明細データが含まれているか否かを判定してもよい。
【0033】
また、判定部153は、請求書データに明細データが含まれていると判定すると、過去請求書データに対する明細データの生成履歴に基づいて、請求書データに対して明細データを生成するか否かを判定する。判定部153は、抽出部152が抽出したテキスト情報に含まれている請求書の発行元と、商品又はサービスの名称との少なくともいずれかが同一の過去請求書データの明細データの生成履歴に基づいて、明細データを生成するか否かを判定する。
【0034】
例えば、判定部153は、記憶部14に記憶されている第2分類モデルを用いて、取得した請求書データに明細データが含まれているか否かを判定する。第2分類モデルは、例えば、発行元情報と、抽出部152が抽出したテキスト情報に含まれている商品又はサービスの名称とが入力されると、明細データを作成するか否かを示す情報を出力するニューラルネットワークのモデルである。
【0035】
第2分類モデルは、データ取得部151が過去に取得した過去請求書データの発行元情報と、過去請求書データに含まれている一以上の商品又はサービスの名称と、過去請求書データから明細データを作成するか否かの判定結果とを含む教師データに基づいて学習することにより生成され、記憶部14に記憶されているものとする。判定部153は、請求書データに明細データが含まれていると判定すると、抽出部152が抽出した発行元情報と、テキスト情報に含まれる一以上の商品又はサービスの名称とを第2分類モデルに入力し、第2分類モデルから出力された判定結果を取得することにより、明細データを生成するか否かを判定する。
【0036】
なお、判定部153は、第2分類モデルを用いて、明細データを生成するか否かを判定したが、これに限らない。判定部153は、記憶部14に記憶されている請求書情報データベースを参照し、取得した請求書データの発行元と同一の発行元の過去請求書データに対応する明細データが存在するか否かを判定することにより、明細データを生成するか否かを判定してもよい。
【0037】
また、判定部153は、テキスト情報に含まれている一以上の情報と、請求書の発行先が同一の過去請求書データの生成履歴に基づいて、取得した請求書データから明細データを生成するか否かを判定してもよい。例えば、判定部153は、テキスト情報に含まれている発行元と、請求書の発行先が同一の過去請求書データの生成履歴に基づいて、取得した請求書データから明細データを生成するか否かを判定してもよい。このようにすることで、例えば、ユーザが属する組織の複数の拠点のそれぞれに発送された請求書をまとめて読み取る場合に、請求書データから明細データを生成するか否かを請求書に対応する拠点別に判定することができる。
【0038】
生成部154は、抽出部152が抽出したテキスト情報に基づいて鑑データを生成する。例えば、生成部154は、データ取得部151が取得した請求書データの請求書IDを生成するとともに、現在の日付を請求書の取得日とする。また、生成部154は、抽出部152が抽出したテキスト情報から、請求書の発行元である取引先の取引先名、発行日、支払期日、請求金額を特定する。生成部154は、これら請求書ID、取引先名、発行日、取得日、支払期日、請求金額を関連付けた鑑データを生成する。
【0039】
生成部154は、判定部153により請求書データに明細データが含まれていると判定されるとともに、請求書データから明細データを生成すると判定されると、請求書データから明細データを生成する。生成部154は、抽出部152が抽出したテキスト情報から、請求書に含まれる一以上の商品又はサービスそれぞれの名称、単価、数量、小計を特定する。生成部154は、鑑データを生成するときに生成した請求書IDと、特定した一以上の商品又はサービスそれぞれの名称、単価、数量、小計とを関連付けた明細データを生成する。
【0040】
出力部155は、生成部154が生成した鑑データを表示部13に出力する。出力部155は、生成部154が明細データを生成した場合、明細データを表示部13に出力する。出力部155は、判定部153による請求書データに明細データが含まれているか否かの判定結果を表示部13に出力する。出力部155は、判定部153による請求書データに明細データが含まれているか否かを示すテキスト情報又は画像を表示部13に出力する。出力部155は、請求書データを表示部13に出力してもよい。
【0041】
例えば、出力部155は、鑑データと、請求書データに明細データが含まれているか否かの判定結果とを少なくとも含む読取結果画面を表示部13に出力する。図5は、第1実施形態に係る読取結果画面の一例を示す図である。図5に示す例では、画面の右側に請求書データが表示されているとともに、画面の左側に、請求書データから生成した鑑データが表示されていることが確認できる。また、図5に示す例では、請求書データに明細データが含まれていないと判定部153が判定したことにより、「請求書に明細が含まれていません」という判定結果を示すテキスト情報が表示されていることが確認できる。ユーザは、表示部13に出力された判定結果を確認することにより、請求書データに明細データが含まれているか否かを容易に確認することができる。
【0042】
訂正部156は、ユーザの操作に応じて、生成部154が生成した鑑データ及び明細データの少なくともいずれかを訂正する。例えば、図5に示す例では、鑑データの訂正を受け付ける訂正ボタンが表示されている。例えば、訂正ボタンが押下されると、訂正部156は、図5に示す鑑データの訂正を受け付ける。訂正部156は、訂正を受け付けると、読取結果画面に訂正結果を反映する。また、訂正部156は、訂正を受け付けると、訂正履歴を示す訂正履歴情報を生成する。例えば、訂正部156は、請求書IDと、訂正前のデータと、訂正後のデータとを関連付けた訂正履歴情報を生成し、記憶部14に記憶させる。
【0043】
登録部157は、ユーザの操作に応じて、生成部154が生成した鑑データを請求書情報データベースに登録する。また、登録部157は、生成部154が生成した明細データを生成した場合、ユーザの操作に応じて、明細データを請求書情報データベースに登録する。図5に示す例では、請求書情報データベースへの登録を受け付ける登録ボタンが表示されている。登録部157は、登録ボタンが押下されると、読取結果画面に表示されている鑑データを請求書情報データベースに登録する。また、登録部157は、読取結果画面に明細データが表示されている場合、登録ボタンが押下されると、読取結果画面に表示されている明細データも請求書情報データベースに登録する。
【0044】
[データ処理装置1における処理の流れ]
続いて、データ処理装置1における処理の流れを説明する。図6は、第1実施形態に係るデータ処理装置1における処理の流れを示すフローチャートである。
まず、データ取得部151は、読取装置2が請求書を読み取ることによって生成した請求書データを取得する(S1)。
続いて、抽出部152は、請求書データに含まれているテキスト情報を抽出する(S2)。
【0045】
続いて、判定部153は、請求書データに明細データが含まれているか否かを判定する(S3)。判定部153は、請求書データに明細データが含まれていると判定すると、S4に処理を移し、判定部153は、請求書データに明細データが含まれていないと判定すると、S7に処理を移す。
【0046】
続いて、判定部153は、請求書データから明細データを生成するか否かを判定する(S4)。判定部153は、請求書データから明細データを生成すると判定すると、S5に処理を移し、判定部153は、請求書データから明細データを生成しないと判定すると、S7に処理を移す。
【0047】
生成部154は、判定部153が請求書データに明細データが含まれていると判定し、請求書データから明細データを生成すると判定すると、鑑データ及び明細データを生成する(S5)。そして、出力部155は、鑑データ、明細データ、及び判定部153による請求書データに明細データが含まれているか否かの判定結果を含む読取結果画面を表示部13に出力する(S6)。
【0048】
一方、生成部154は、判定部153が請求書データに明細データが含まれていないと判定した場合、又は請求書データから明細データを生成しないと判定した場合、明細データを生成せずに鑑データのみを生成する(S7)。そして、出力部155は、鑑データ、及び判定部153による請求書データに明細データが含まれているか否かの判定結果を含む読取結果画面を表示部13に出力する(S8)。
【0049】
その後、訂正部156は、ユーザの操作に応じて、読取結果画面に表示されている鑑データの訂正を受け付ける。また、訂正部156は、読取結果画面に明細データが表示されている場合には、ユーザの操作に応じて、読取結果画面に表示されている明細データの訂正を受け付ける(S9)。なお、S9の処理は、ユーザの訂正操作に応じて行われるものであり、常に行われるものではないものとする。
【0050】
その後、登録部157は、ユーザの操作に応じて、生成部154が生成した鑑データを請求書情報データベースに登録する。また、登録部157は、生成部154が生成した明細データを生成した場合、ユーザの操作に応じて、当該データを請求書情報データベースに登録する(S10)。
【0051】
[第1実施形態に係るデータ処理装置1による効果]
以上説明したように、第1実施形態に係るデータ処理装置1は、取得した請求書データと同じ属性を有し、過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、取得した請求書データに明細データが含まれているか否かを判定する。そして、データ処理装置1は、請求書データに明細データが含まれているか否かの判定結果を出力する。このようにすることで、ユーザは判定結果を確認することにより、請求書データに明細が含まれているか否かを容易に判断することができる。これにより、データ処理装置1は、請求書データの確認作業の負担を軽減することができる。
【0052】
<第2実施形態>
[明細データを人が確認する必要があるかを示す情報を出力する]
続いて、第2実施形態に係るデータ処理装置1について説明する。第2実施形態に係るデータ処理装置1は、明細データを人が確認する必要があるかを示す情報を出力する機能を有する。以下、第2実施形態に係るデータ処理装置1の説明を行う。なお、第1実施形態と同じ部分については適宜説明を省略する。
【0053】
第2実施形態に係る判定部153は、過去に取得された請求書の請求書データから生成部154が生成した過去明細データと、当該過去明細データに対する訂正部156による訂正履歴とに基づいて、生成部154が生成した明細データをユーザが確認する必要があるか否かを判定する。
【0054】
例えば、判定部153は、記憶部14に記憶されている第3分類モデルを用いて、取得した請求書データに明細データが含まれているか否かを判定する。第3分類モデルは、明細データが入力されると、明細データをユーザが確認する必要があるか否かを示す情報を出力するニューラルネットワークのモデルである。
【0055】
第3分類モデルは、データ取得部151が過去に取得した過去請求書データの過去明細データと、当該過去明細データをユーザが確認する必要があったか否かを示す情報とを含む教師データに基づいて学習することにより生成される。過去明細データを確認する必要があったか否かを示す情報は、過去明細データの訂正履歴があるか否かに基づいて生成される。判定部153は、生成部154が生成した明細データを第3分類モデルに入力し、第3分類モデルから出力された判定結果を取得することにより、明細データをユーザが確認する必要があるか否かを判定する。
【0056】
なお、判定部153は、第3分類モデルを用いて明細データをユーザが確認する必要があるか否かを判定したが、これに限らない。判定部153は、データ取得部151が取得した請求書データから抽出された発行元が過去に発行した過去請求書データに対応する過去明細データの訂正履歴が記憶部14に記憶されている否かに基づいて、生成された明細データをユーザが確認する必要があるか否かを判定してもよい。
【0057】
また、判定部153は、生成された明細データをユーザが確認する必要があるか否かを判定したが、これに限らず、生成された鑑データをユーザが確認する必要があるか否かも判定してもよい。この場合、判定部153は、データ取得部151が取得した請求書データから抽出された発行元が過去に発行した過去請求書データに対応する過去鑑データの訂正履歴が記憶部14に記憶されている否かに基づいて、生成された鑑データをユーザが確認する必要があるか否かを判定する。
【0058】
出力部155は、生成部154が生成した明細データをユーザが確認する必要があるか否かを示す判定結果を出力する。例えば、出力部155は、鑑データと、明細データと、明細データをユーザが確認する必要があるか否かの判定結果とを少なくとも含む読取結果画面を表示部13に出力する。なお、生成部154が生成した鑑データをユーザが確認する必要があるか否かを判定部153が判定した場合、出力部155は、鑑データをユーザが確認する必要があるか否かの判定結果を読取結果画面に含めるようにしてもよい。
【0059】
[第2実施形態に係るデータ処理装置1による効果]
以上説明したように、第2実施形態に係るデータ処理装置1は、過去に取得された請求書の請求書データから生成された過去明細データと、当該過去明細データに対する訂正部156による訂正履歴とに基づいて、生成部154が生成した明細データをユーザが確認する必要があるか否かを判定し、判定結果を出力する。このようにすることで、ユーザは明細データを注意して確認するべきか否かを容易に判断することができるので、請求書データの確認作業の負担をさらに軽減することができる。
【0060】
<第3実施形態>
[明細データの信頼度に基づいてユーザが確認する必要があるか否かを判定する]
続いて、第3実施形態に係るデータ処理装置1について説明する。第3実施形態に係るデータ処理装置1は、生成した明細データの信頼度に基づいて、明細データを人が確認する必要があるかを示す情報を出力する点で第2実施形態と異なる。
【0061】
図7は、第3実施形態に係るデータ処理装置1の機能構成を示す図である。第3実施形態に係るデータ処理装置1の制御部15は、設定部158をさらに有する。
第3実施形態において、第3分類モデルは、生成部154が生成した明細データをユーザが確認する必要があることを示す情報として、明細データの信頼度を出力する。
【0062】
設定部158は、ユーザが確認する必要があるか否かの判定に用いる明細データの信頼度の閾値を設定する。例えば、設定部158は、操作部12を介してユーザから明細データの信頼度の閾値の指定を受け付けることにより、明細データの信頼度の閾値を設定する。
【0063】
判定部153は、過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、生成部154により生成された明細データの信頼度を特定する。具体的には、判定部153は、生成された明細データを第3分類モデルに入力し、第3分類モデルから信頼度を取得する。判定部153は、特定した信頼度が、設定部158が設定した閾値を超えるか否かに基づいて、明細データをユーザが確認する必要があるか否かを判定する。
【0064】
出力部155は、第2実施形態と同様に、鑑データと、明細データと、明細データをユーザが確認する必要があるか否かの判定結果とを少なくとも含む読取結果画面を表示部13に出力する。
【0065】
[第3実施形態に係るデータ処理装置1による効果]
以上説明したように、第3実施形態に係るデータ処理装置1は、ユーザが確認する必要があるか否かの判定に用いる明細データの信頼度の閾値を設定し、明細データの信頼度を特定し、特定した信頼度が、設定された閾値を超えるか否かに基づいて、明細データをユーザが確認する必要があるか否かを判定する。このようにすることで、ユーザは例えば閾値を高い値に調整することにより、信頼度が高い明細データを人が確認する必要がないものと判定部153に判定させ、信頼度が相対的に低く、ユーザが確認する必要があると判定部153が判定した明細データをユーザに重点的に確認させることができる。
【0066】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、請求書データは、読取装置2が読み取ることにより作成されたデータであることとしたが、これに限らず、コンピュータが作成したpdfファイル等の電子データであってもよい。また、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0067】
1 データ処理装置
2 読取装置
11 通信部
12 操作部
13 表示部
14 記憶部
15 制御部
151 データ取得部
152 抽出部
153 判定部
154 生成部
155 出力部
156 訂正部
157 登録部
158 設定部

図1
図2
図3
図4
図5
図6
図7