(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023020842
(43)【公開日】2023-02-09
(54)【発明の名称】データ処理装置、データ処理方法及びプログラム
(51)【国際特許分類】
G06Q 30/04 20120101AFI20230202BHJP
G06Q 20/14 20120101ALI20230202BHJP
【FI】
G06Q30/04
G06Q20/14
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022011577
(22)【出願日】2022-01-28
(62)【分割の表示】P 2021544224の分割
【原出願日】2021-07-28
(71)【出願人】
【識別番号】516380407
【氏名又は名称】ファーストアカウンティング株式会社
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【弁理士】
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】葛 鴻鵬
(72)【発明者】
【氏名】松田 顕
(72)【発明者】
【氏名】小俣 智
(72)【発明者】
【氏名】森 啓太郎
(72)【発明者】
【氏名】佐藤 貴亮
(72)【発明者】
【氏名】林 大輔
【テーマコード(参考)】
5L049
5L055
【Fターム(参考)】
5L049BB11
5L055AA32
(57)【要約】
【課題】経理担当者の請求書の確認作業の負担を軽減する。
【解決手段】データ処理装置1は、新規請求書を示す新規請求書データを取得するデータ取得部131と、新規請求書データから、新規請求書に含まれる一以上のテキスト情報を抽出する抽出部132と、抽出部132が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定する判定部133と、判定部133による判定結果を示す判定結果情報を出力する出力部134と、を有する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
新規請求書を示す新規請求書データを取得するデータ取得部と、
前記新規請求書データから、前記新規請求書に含まれる一以上のテキスト情報を抽出する抽出部と、
前記抽出部が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する判定部と、
前記判定部による判定結果を示す判定結果情報を出力する出力部と、
を有するデータ処理装置。
【請求項2】
過去に発行された請求書を示す過去請求書データと、前記過去請求書データから前記抽出部が抽出した一以上のテキスト情報である一以上の過去テキスト情報と、前記過去請求書データに対応する請求書が源泉徴収の対象であるか否かを示す判定用情報とを関連付けて記憶する記憶部を有し、
前記判定部は、前記抽出部が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、前記新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている前記過去請求書データに関連付けられている前記判定用情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する、
請求項1に記載のデータ処理装置。
【請求項3】
前記判定部は、前記抽出部が抽出した前記請求対象名又は前記請求元の職種に対応するテキスト情報それぞれの特徴を示す特徴情報と、複数の前記過去請求書データそれぞれに関連付けられている前記請求対象名又は前記請求元の職種に対応する過去テキスト情報それぞれの特徴を示す過去特徴情報とを抽出し、前記特徴情報と特徴が類似する前記過去特徴情報を有する前記過去請求書データに関連付けられている前記判定用情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する、
請求項2に記載のデータ処理装置。
【請求項4】
前記記憶部は、前記新規請求書の宛先の企業を宛先とする前記過去請求書データである自社過去請求書データ、及び前記新規請求書の宛先の企業と異なる企業を宛先とする前記過去請求書データである他社過去請求書データのそれぞれと、一以上の前記過去テキスト情報と、複数の当該過去請求書データに対応する前記判定用情報とを関連付けて記憶し、
前記判定部は、前記抽出部が抽出した複数のテキスト情報に源泉徴収が必要であることを示す文字列が含まれておらず、かつ前記新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている前記自社過去請求書データが前記記憶部に記憶されていない場合、前記新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている前記他社過去請求書データに関連付けられた前記判定用情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する、
請求項2又は3に記載のデータ処理装置。
【請求項5】
請求書の請求元を示す請求元情報と、当該請求書に対して源泉徴収が必要であるか否かを示す要否情報とを関連付けて記憶する記憶部を有し、
前記判定部は、前記抽出部が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、前記新規請求書データが示す請求元情報に関連付けられて前記記憶部に記憶されている要否情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する、
請求項1から4のいずれか一項に記載のデータ処理装置。
【請求項6】
前記判定部は、前記抽出部が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、前記新規請求書データが示す請求元の名称、及び振込先口座名の少なくともいずれかに基づいて前記新規請求書データが示す請求元が個人事業主であるか法人であるかを判定し、当該判定結果に基づいて前記新規請求書に対して源泉徴収が必要であるか否かを判定する、
請求項1から5のいずれか一項に記載のデータ処理装置。
【請求項7】
請求書の請求元を示す請求元情報と、当該請求書に対して源泉徴収が必要であるか否かを示す要否情報とを関連付けた情報を記憶する記憶部を有し、
前記判定部は、前記新規請求書データが示す請求元情報に関連付けて前記要否情報が前記記憶部に記憶されていない場合に、前記抽出部が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する、
請求項1に記載のデータ処理装置。
【請求項8】
請求書の請求元を示す請求元情報と、当該請求書に対して源泉徴収が必要であるか否かを示す要否情報とを関連付けて記憶するとともに、過去に発行された請求書を示す過去請求書データと、前記過去請求書データから前記抽出部が抽出した一以上のテキスト情報である一以上の過去テキスト情報と、前記過去請求書データに対する請求書が源泉徴収の対象であるか否かを示す判定用情報とを関連付けて記憶する記憶部を有し、
前記判定部は、前記新規請求書データが示す請求元情報に前記要否情報が関連付けられて前記記憶部に記憶されていない場合、前記新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている前記過去請求書データに関連付けられた前記判定用情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する、
請求項1に記載のデータ処理装置。
【請求項9】
コンピュータが実行する、
新規請求書を示す新規請求書データを取得するステップと、
前記新規請求書データから、前記新規請求書に含まれる複数のテキスト情報を抽出するステップと、
抽出された一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定するステップと、
前記判定するステップにおける判定結果を示す判定結果情報を出力するステップと、
を有するデータ処理方法。
【請求項10】
コンピュータを、
新規請求書を示す新規請求書データを取得するデータ取得部、
前記新規請求書データから、前記新規請求書に含まれる複数のテキスト情報を抽出する抽出部、
前記抽出部が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する判定部、及び、
前記判定部による判定結果を示す判定結果情報を出力する出力部、
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、請求書データを処理するデータ処理装置、データ処理方法及びプログラムに関する。
【背景技術】
【0002】
請求書を示す請求書データから金額を読み取り、読み取った金額に基づいて支払処理を行うシステムが知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
請求書の送付元が個人事業主等である場合、請求書を受け取った法人は源泉税を徴収する必要がある。しかしながら、請求書の内容によっては、源泉税を徴収する必要があるにもかかわらず、源泉税に関する項目が記載されていない場合もある。このため、経理担当者は、源泉税を徴収する必要があるかを確認する必要があり負担がかかっていた。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、経理担当者の請求書の確認作業の負担を軽減することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係るデータ処理装置は、新規請求書を示す新規請求書データを取得するデータ取得部と、前記新規請求書データから、前記新規請求書に含まれる一以上のテキスト情報を抽出する抽出部と、前記抽出部が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する判定部と、前記判定部による判定結果を示す判定結果情報を出力する出力部と、を有する。
【0007】
前記データ処理装置は、過去に発行された請求書を示す過去請求書データと、前記過去請求書データから前記抽出部が抽出した一以上のテキスト情報である一以上の過去テキスト情報と、前記過去請求書データに対応する請求書が源泉徴収の対象であるか否かを示す判定用情報とを関連付けて記憶する記憶部を有し、前記判定部は、前記抽出部が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、前記新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている前記過去請求書データに関連付けられている前記判定用情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0008】
前記判定部は、前記抽出部が抽出した前記請求対象名又は前記請求元の職種に対応するテキスト情報それぞれの特徴を示す特徴情報と、複数の前記過去請求書データそれぞれに関連付けられている前記請求対象名又は前記請求元の職種に対応する過去テキスト情報それぞれの特徴を示す過去特徴情報とを抽出し、前記特徴情報と特徴が類似する前記過去特徴情報を有する前記過去請求書データに関連付けられている前記判定用情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0009】
前記記憶部は、前記新規請求書の宛先の企業を宛先とする前記過去請求書データである自社過去請求書データ、及び前記新規請求書の宛先の企業と異なる企業を宛先とする前記過去請求書データである他社過去請求書データのそれぞれと、一以上の前記過去テキスト情報と、複数の当該過去請求書データに対応する前記判定用情報とを関連付けて記憶し、前記判定部は、前記抽出部が抽出した複数のテキスト情報に源泉徴収が必要であることを示す文字列が含まれておらず、かつ前記新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている前記自社過去請求書データが前記記憶部に記憶されていない場合、前記新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている前記他社過去請求書データに関連付けられた前記判定用情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0010】
前記データ処理装置は、請求書の請求元を示す請求元情報と、当該請求書に対して源泉徴収が必要であるか否かを示す要否情報とを関連付けて記憶する記憶部を有し、前記判定部は、前記抽出部が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、前記新規請求書データが示す請求元情報に関連付けられて前記記憶部に記憶されている要否情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0011】
前記判定部は、前記抽出部が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、前記新規請求書データが示す請求元の名称、及び振込先口座名の少なくともいずれかに基づいて前記新規請求書データが示す請求元が個人事業主であるか法人であるかを判定し、当該判定結果に基づいて前記新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0012】
前記データ処理装置は、請求書の請求元を示す請求元情報と、当該請求書に対して源泉徴収が必要であるか否かを示す要否情報とを関連付けた情報を記憶する記憶部を有し、前記判定部は、前記新規請求書データが示す請求元情報に関連付けて前記要否情報が前記記憶部に記憶されていない場合に、前記抽出部が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0013】
前記データ処理装置は、請求書の請求元を示す請求元情報と、当該請求書に対して源泉徴収が必要であるか否かを示す要否情報とを関連付けて記憶するとともに、過去に発行された請求書を示す過去請求書データと、前記過去請求書データから前記抽出部が抽出した一以上のテキスト情報である一以上の過去テキスト情報と、前記過去請求書データに対する請求書が源泉徴収の対象であるか否かを示す判定用情報とを関連付けて記憶する記憶部を有し、前記判定部は、前記新規請求書データが示す請求元情報に前記要否情報が関連付けられて前記記憶部に記憶されていない場合、前記新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている前記過去請求書データに関連付けられた前記判定用情報に基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0014】
本発明の第2の態様に係るデータ処理方法は、コンピュータが実行する、新規請求書を示す新規請求書データを取得するステップと、前記新規請求書データから、前記新規請求書に含まれる複数のテキスト情報を抽出するステップと、抽出された一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定するステップと、前記判定するステップにおける判定結果を示す判定結果情報を出力するステップと、を有する。
【0015】
本発明の第3の態様に係るプログラムは、コンピュータを、新規請求書を示す新規請求書データを取得するデータ取得部、前記新規請求書データから、前記新規請求書に含まれる複数のテキスト情報を抽出する抽出部、前記抽出部が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、前記新規請求書に対して源泉徴収が必要であるか否かを判定する判定部、及び、前記判定部による判定結果を示す判定結果情報を出力する出力部、として機能させる。
【発明の効果】
【0016】
本発明によれば、経理担当者の請求書の確認作業の負担を軽減することができるという効果を奏する。
【図面の簡単な説明】
【0017】
【
図1】本実施形態に係るデータ処理装置の概要を説明するための図である。
【
図2】被請求者が受領する請求書の一例を示す図である。
【
図3】本実施形態に係るデータ処理装置の機能構成を示す図である。
【
図6】本実施形態に係るデータ処理装置における処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0018】
[データ処理装置1の概要]
図1は、本実施形態に係るデータ処理装置1の概要を説明するための図である。データ処理装置1は、法人、役所又は個人等に送られてきた新規請求書の画像データである新規請求書データを取得し、請求書データに含まれる文字列を解析した結果を用いて請求書データに含まれる情報を出力する装置であり、例えばコンピュータである。データ処理装置1は、新規請求書データに含まれるテキスト情報を解析した結果を用いて新規請求書に対して源泉徴収が必要であるか否かを判定し、判定結果を出力する。請求書データは、例えば紙で受領した請求書をスキャナ又はデジタルカメラ等の読取装置2で読み取られることにより作成されるが、ネットワークを介して請求書の発行元から受信したデータであってもよい。
【0019】
データ処理装置1は、例えばインターネット等の通信ネットワークを介してユーザ端末3と通信可能に接続されている。ユーザ端末3は、例えば請求書データに基づく経理処理を担当する経理担当者が使用するコンピュータである。データ処理装置1は、1台のコンピュータにより構成されていてもよく、複数のコンピュータにより構成されていてもよい。また、
図1においてデータ処理装置1に通信可能に接続されているユーザ端末3が1台のみ示されているが、データ処理装置1は、複数の企業のそれぞれが使用する複数のユーザ端末3に通信可能に接続されていてもよい。
【0020】
図2は、被請求者が受領する請求書の一例を示す図である。請求書には、複数の項目それぞれに対応する文字列が記載されている。例えば、
図2に示す請求書には、請求書を発行した事業者、すなわち取引における代金を請求する請求者の名称、住所、連絡先が記載されている。また、請求書には、件名(
図2に示す2020年1月分)、請求対象としての商品等の請求対象名、請求対象の単価、個数及び請求対象の合計金額(すなわち小計)、複数の請求対象の合計金額(すなわち請求額)が記載されている。データ処理装置1は、被請求者が使用するユーザ端末3を介して請求書データを取得する。
【0021】
データ処理装置1は、取得した新規請求書データから、新規請求書に含まれる一以上のテキスト情報を抽出する。データ処理装置1は、抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定する。
図2に示す例では、抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列である「弁護士」という文字列が含まれていることから、データ処理装置1は、新規請求書に対して源泉徴収が必要であると判定する。そして、データ処理装置1は、判定結果を示す判定結果情報をユーザ端末3に出力する。
【0022】
このようにすることで、被請求者である経理担当者は、出力された判定結果情報を確認することにより、新規請求書に対して源泉徴収が必要であるか否かを把握することができる。これにより、データ処理装置1は、経理担当者の請求書の確認作業の負担を軽減することができる。
【0023】
[データ処理装置1の機能構成及び動作]
図3は、本実施形態に係るデータ処理装置1の機能構成を示す図である。データ処理装置1は、通信部11と、記憶部12と、制御部13とを有する。制御部13は、データ取得部131と、抽出部132と、判定部133と、出力部134と、登録部135とを有する。
【0024】
通信部11は、ネットワーク(例えばイントラネット又はインターネット)に接続するための通信インターフェースであり、ユーザ端末3から請求書データを受信したり、他のコンピュータとの間でデータを送受信したりするための通信コントローラを有する。
【0025】
記憶部12は、例えばROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部12は、制御部13が実行するプログラムを記憶する。記憶部12は、制御部13を、データ取得部131、抽出部132、判定部133、出力部134、及び登録部135として機能させるプログラムを記憶する。
【0026】
また、記憶部12は、過去に発行された請求書である過去請求書を示す過去請求書データと、過去請求書データから抽出された一以上のテキスト情報である一以上の過去テキスト情報と、過去請求書データに対応する過去請求書が源泉徴収の対象であるか否かを示す判定用情報とを関連付けて記憶してもよい。当該判定用情報は、源泉徴収が必要であることを示す文字列が新規請求書データに含まれていない場合に、源泉徴収の要否の判定に用いられる。記憶部12は、新規請求書の宛先の企業を宛先とする過去請求書データである自社過去請求書データ、及び新規請求書の宛先の企業と異なる企業を宛先とする過去請求書データである他社過去請求書データのそれぞれと、一以上の過去テキスト情報と、複数の当該過去請求書データに対応する判定用情報とを関連付けて記憶してもよい。
【0027】
例えば、記憶部12は、過去請求書を示す過去請求書データと、請求書の宛先の企業を識別する請求先企業IDと、一以上の過去テキスト情報と、判定用情報とを関連付けた源泉徴収判定用情報を記憶する。
図4は、源泉徴収判定用情報の一例を示す図である。
図4に示すように、源泉徴収判定用情報は、過去請求書データと、過去請求書の宛先の企業を示す請求先企業IDと、一以上の過去テキスト情報と、項目名が「源泉徴収」である判定用情報とが関連付けていることが確認できる。
【0028】
また、
図4に示す例では、過去テキスト情報として、請求書の発行日、請求元を示す取引先、請求書に記載されている請求対象名が含まれていることが確認できる。また、
図4に示す例では、判定用情報は、過去請求書に対して源泉徴収が必要なことを示す「有」、又は、過去請求書に対して源泉徴収が不要なことを示す「無」のいずれかが格納されていることが確認できる。なお、判定用情報は、
図4に示す例に限らず、過去請求書に対して源泉徴収が必要か否かを示す記号や数値が格納されていてもよい。また、新規請求書の宛先の企業の企業IDが「C0123」であるとすると、
図4に示す源泉徴収判定用情報には、当該企業IDとは異なる企業ID「C2876」に関連する過去請求書データも記憶されていることが確認できる。
【0029】
また、記憶部12は、請求書の請求元を示す請求元情報と、当該請求書に対して源泉徴収が必要であるか否かを示す要否情報とを関連付けて記憶してもよい。例えば、記憶部12は、請求書の請求元を示す請求元情報と、要否情報とを少なくとも関連付けた取引先マスタを記憶する。
【0030】
図5は、取引先マスタの一例を示す図である。
図5に示すように、取引先マスタは、請求書の請求先である企業の企業IDである請求先企業IDと、請求元情報としての取引先ID及び取引先(請求元)の名称と、要否情報とを含んでいる。データ処理装置1は、取引先マスタを参照することにより、新規請求書に含まれる請求元情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定することができる。
【0031】
制御部13は、例えばCPU(Central Processing Unit)である。制御部13は、記憶部12に記憶されたプログラムを実行することにより、データ取得部131、抽出部132、判定部133、出力部134、及び登録部135として機能する。
【0032】
データ取得部131は、新規請求書を示す新規請求書データを取得する。具体的には、データ取得部131は、通信部11を介して、被請求者が使用するユーザ端末3から、被請求者を識別する企業IDと、新規請求書データとを取得する。データ処理装置1に複数の企業の複数のユーザ端末3が接続されている場合、データ取得部131は、複数の企業のそれぞれが使用する複数のユーザ端末3のそれぞれから、当該ユーザ端末3を使用している企業に対応する企業IDと新規請求書データとを取得する。
【0033】
データ取得部131は、通信部11を介して、ユーザ端末3から新規請求書データの格納先を示す格納先情報を含む取得指示を受信してもよい。そして、データ取得部131は、取得指示を受信したことに応じて、取得指示に含まれる格納先情報に基づいて、被請求者の取引先が使用する外部装置から、新規請求書データを取得してもよい。
【0034】
抽出部132は、新規請求書データから、新規請求書に含まれる一以上のテキスト情報を抽出する。例えば、抽出部132は、データ取得部131が取得した新規請求書データに対してOCR処理を実行することにより、新規請求書データが示す新規請求書に含まれている一以上のテキスト情報を抽出する。
【0035】
抽出部132が抽出するテキスト情報には、例えば、新規請求書に対応する取引先名(請求元名)、取引先の住所、取引先の銀行口座の口座名及び口座番号、請求書発行日、費用計上日、支払金額、請求書番号、新規請求書の発行先(請求先)の住所、取引された商品、手数料、取引先が請求先から徴収する源泉税等を含む請求対象名、請求対象の単価、請求対象の数量が含まれている。
【0036】
判定部133は、抽出部132が新規請求書データから抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定する。源泉徴収が必要であることを示す文字列は、例えば、「源泉税」、「源泉取得税」、「源泉徴収税」等の源泉徴収を示す文字列である。源泉徴収が必要であることを示す文字列は、「弁理士」又は「税理士」のような特定の資格の名称を示す文字列であってもよい。
【0037】
例えば、判定部133は、抽出部132が新規請求書データから抽出した一以上のテキスト情報のうち、請求対象名を示すテキスト情報を参照して、源泉徴収が必要であることを示す文字列が含まれているか否かを判定してもよいし、抽出部132が新規請求書データから抽出した一以上のテキスト情報の全てを参照して、源泉徴収が必要であることを示す文字列が含まれているか否かを判定してもよい。判定部133は、抽出部132が新規請求書データから抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれている場合、新規請求書に対して源泉徴収が必要であると判定する。
【0038】
判定部133は、抽出部132が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれていない場合、新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている過去請求書データに関連付けられている判定用情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定する。
【0039】
具体的には、判定部133は、抽出部132が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれていない場合、抽出部132が抽出した一以上のテキスト情報に基づいて、新規請求書データが示す請求対象名及び請求元の職種の少なくともいずれかを特定する。例えば、判定部133は、抽出部132が抽出したテキスト情報に含まれる請求対象名を特定する。
【0040】
また、判定部133は、抽出部132が抽出したテキスト情報に含まれる取引先に基づいて請求元の職種を示すテキスト情報を特定する。例えば、判定部133は、抽出された取引先を参照し、源泉徴収を必要とする所定の職種に対応する文字列が含まれている場合に、請求元の職種を特定する。源泉徴収を必要とする所定の職種は、例えば、弁護士、弁理士、公認会計士、税理士であり、所定の職種に対応する文字列は、例えば、法律事務所、特許事務所、会計事務所、税理士事務所、これらに類似する文字列である。
【0041】
続いて、判定部133は、記憶部12に記憶されている源泉徴収判定用情報を参照し、データ取得部131が取得した企業IDと一致する請求先企業IDと関連付けられている自社過去請求書データを特定する。判定部133は、特定した自社過去請求書データのうち、特定した請求対象名を含むか、特定した請求元の職種に対応する文字列を取引先に含む自社過去請求書データを特定し、特定した自社過去請求書データに関連付けられている判定用情報を特定する。そして、判定部133は、特定した判定用情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定する。
【0042】
ここで、判定部133は、新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている自社過去請求書データが複数存在する場合には、源泉徴収が必要であることを示す判定用情報に関連付けられている自社過去請求書データの数と、源泉徴収が不要であることを示す判定用情報に関連付けられている自社過去請求書データの数とを算出してもよい。そして、判定部133は、算出した数量が多い自社過去請求書データに関連付けられている判定用情報に基づいて、源泉徴収が必要であるか否かを判定してもよい。このようにすることで、データ処理装置1は、初めての取引先から新規請求書を受領した場合であっても、当該新規請求書に類似する過去請求書の過去請求書データに関連する判定用情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定することができる。
【0043】
また、判定部133は、抽出部132が抽出した請求対象名又は請求元の職種に対応するテキスト情報それぞれの特徴を示す特徴情報と、複数の過去請求書データそれぞれに関連付けられている請求対象名又は請求元の職種に対応する過去テキスト情報それぞれの特徴を示す過去特徴情報とを抽出し、特徴情報と特徴が類似する過去特徴情報を有する過去請求書データに関連付けられている判定用情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0044】
この場合、判定部133は、抽出部132が新規請求書データから抽出した請求対象名又は取引先の特徴を示す特徴情報を抽出する。判定部133は、Word2vecやtfidfを用いて特徴情報を抽出する。同様に、判定部133は、複数の自社過去請求書データから抽出した請求対象名又は取引先の特徴情報を過去特徴情報として抽出する。
【0045】
そして、判定部133は、新規請求書データから抽出した特徴情報と類似する一以上の過去特徴情報を有する自社過去請求書データに関連付けられている判定用情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定する。ここで、判定部133は、過去特徴情報を予め抽出し、過去請求書データに関連付けて記憶部12に記憶させておいてもよい。このようにすることで、データ処理装置1は、新規請求書データの請求対象名又は請求元の職種に対応するテキスト情報と一致又は類似する過去テキスト情報を有する過去請求書データがない場合であっても、当該テキスト情報と特徴が類似する過去テキスト情報を有する自社過去請求書データに基づいて、源泉徴収が必要であるか否かを判定することができる。
【0046】
判定部133は、抽出部132が抽出した複数のテキスト情報に源泉徴収が必要であることを示す文字列が含まれておらず、かつ新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている自社過去請求書データが記憶部12に記憶されていない場合、新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている他社過去請求書データに関連付けられた判定用情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0047】
具体的には、判定部133は、抽出部132が抽出した複数のテキスト情報に源泉徴収が必要であることを示す文字列が含まれておらず、自社過去請求書データに基づいて源泉徴収が必要であるか否かを判定できなかった場合、記憶部12に記憶されている源泉徴収判定用情報を参照し、データ取得部131が取得した企業IDと一致しない請求先企業IDと関連付けられている他社過去請求書データを特定する。
【0048】
判定部133は、特定した他社過去請求書データのうち、新規請求書データから特定した請求対象名を請求対象名に含むか、特定した請求元の職種に対応する文字列を取引先に含む他社過去請求書データを特定し、特定した他社過去請求書データに関連付けられている判定用情報を特定する。そして、判定部133は、特定した判定用情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定する。このようにすることで、データ処理装置1は、被請求者が新たに取引を行う取引先から初めて受領した請求書の請求書データに類似する自社過去請求書データが存在しない場合であっても、当該請求書に対して源泉徴収が必要であるか否かを判定することができる。
【0049】
なお、判定部133は、抽出部132が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、新規請求書データと請求対象名又は請求元の職種が同一又は類似の過去請求書データに基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定したが、これに限らない。
【0050】
判定部133は、抽出部132が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、新規請求書データが示す請求元情報に関連付けられて記憶部12に記憶されている要否情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0051】
具体的には、判定部133は、抽出部132が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、記憶部12に記憶されている取引先マスタを参照し、データ取得部131が新規請求書データとともに取得した企業IDと一致する請求先企業IDと、抽出部132が抽出したテキスト情報に含まれる新規請求書データが示す請求元情報が示す取引先とに関連付けられている要否情報を特定する。判定部133は、特定した要否情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定する。このようにすることで、データ処理装置1は、被請求者が取引先マスタにおいて請求元に対して源泉徴収が必要であるか否かを登録している場合には、取引先マスタに基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定することができる。
【0052】
なお、判定部133は、データ取得部131が新規請求書データとともに取得した企業IDと一致する請求先企業IDに関連付けられている要否情報を参照することとしたが、これに限らず、データ取得部131が新規請求書データとともに取得した企業IDと一致しない請求先企業IDに関連付けられている要否情報を参照して、新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0053】
また、判定部133は、抽出部132が抽出した複数のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、新規請求書データが示す請求元の名称、及び振込先口座名の少なくともいずれかに基づいて新規請求書データが示す請求元が個人事業主であるか法人であるかを判定し、当該判定結果に基づいて新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0054】
例えば、判定部133は、新規請求書データが示す請求元の名称に法人であることを示す「会社」や「株式」といった文字列が含まれていない場合、新規請求書データが示す請求元が個人事業主であると判定し、当該文字列が含まれている場合、新規請求書データが示す請求元が法人であると判定する。また、判定部133は、請求元の名称と振込先口座名との一致率が所定の閾値未満である場合、新規請求書データが示す請求元が個人事業主であると判定し、請求元の名称と振込先口座名との一致率が所定の閾値である場合、新規請求書データが示す請求元が法人であると判定する。
【0055】
また、記憶部12に、氏名を示す氏名辞書データを記憶させておき、判定部133が、氏名辞書データに、請求元の名称又は振込先口座名と一致又は類似する氏名が存在するか否かに基づいて、新規請求書データが示す請求元が個人事業主であるか否かを判定してもよい。判定部133は、新規請求書データが示す請求元が個人事業主であると判定すると、新規請求書に対して源泉徴収が必要な可能性があると判定し、新規請求書データが示す請求元が法人であると判定すると、新規請求書に対して源泉徴収が不要であると判定する。データ処理装置1がこのような判定結果を出力することで、経理担当者が、新規請求書データが示す請求元が個人事業主である場合に、源泉徴収が必要な可能性があるということを見落としにくくなる。
【0056】
出力部134は、判定部133による判定結果を示す判定結果情報を出力する。例えば、出力部134は、抽出部132が抽出した一以上のテキスト情報により構成されるデータセットと、判定部133による判定結果を示す判定結果情報と、新規請求書データとを表示する解析結果画面を、新規請求書データの取得元のユーザ端末3に出力し、当該解析結果画面をユーザ端末3に表示させる。
【0057】
例えば、データ取得部131が
図2に示す請求書に対応する請求書データを新規請求書データとして取得し、判定部133が当該新規請求書データの請求元に源泉徴収が必要であることを示す文字列である「弁護士」が含まれていることにより源泉徴収が必要と判定したとする。この場合、解析結果画面には、
図2に示す請求書を示す新規請求書データと、源泉徴収が必要であることを示す判定結果情報とが表示される。これにより、ユーザ端末3を使用する経理担当者は、新規請求書データに対して、源泉税に関する項目が記載されていない場合であっても、判定結果情報を確認して、新規請求書データに対して源泉徴収が必要であることを把握することができる。
【0058】
ここで、出力部134は、解析結果画面に対し、源泉徴収の要否の判定の理由を示す情報を含めるようにしてもよい。例えば、出力部134は、抽出部132が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていることにより源泉徴収が必要と判定された場合に、「源泉徴収に対応する文字列あり」というテキスト情報を解析結果画面に表示させてもよい。また、出力部134は、新規請求書データと請求対象名又は請求元の職種が類似する過去請求書データに基づいて源泉徴収が必要と判定された場合に、「源泉徴収が必要な過去請求書データと請求対象名又は請求元の職種が類似」というテキスト情報を解析結果画面に表示させてもよい。このようにすることで、被請求者は、判定の理由を確認するとともに、新規請求書データを確認して、判定結果が正しいか否かを判断しやすくなる。
【0059】
登録部135は、データ取得部131が取得した新規請求書データと、判定部133による判定結果とを関連付けて、源泉徴収判定用情報として記憶部12に記憶させる。例えば、登録部135は、出力部134が解析結果画面をユーザ端末3に出力した後、ユーザ端末3から、新規請求書データの判定結果が正しいか否かを示す情報の入力を受け付ける。
【0060】
登録部135は、新規請求書データの判定結果が正しいことを示す情報の入力を受け付けると、新規請求書データと、データ取得部131が取得した企業IDと、抽出部132が抽出した一以上のテキスト情報と、判定結果とを関連付けて、源泉徴収判定用情報として記憶部12に記憶させる。登録部135は、新規請求書データの判定結果が正しくないことを示す情報の入力を受け付けると、判定結果を訂正する。登録部135は、新規請求書データと、データ取得部131が取得した企業IDと、抽出部132が抽出した一以上のテキスト情報と、訂正後の判定結果とを関連付けて、源泉徴収判定用情報として記憶部12に記憶させる。
【0061】
[データ処理装置1における処理の流れ]
図6は、本実施形態に係るデータ処理装置1における処理の流れの一例を示すフローチャートである。
まず、データ取得部131は、ユーザ端末3から、読取装置2が新規請求書を読み取ることによって生成した新規請求書データを取得する(S1)。
続いて、抽出部132は、新規請求書データから一以上のテキスト情報を抽出する(S2)。
【0062】
続いて、判定部133は、抽出部132が新規請求書データから抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かを判定する(S3)。判定部133は、源泉徴収が必要であることを示す文字列が含まれると判定すると、S4に処理を移し、新規請求書に対して源泉徴収が必要と特定する。判定部133は、源泉徴収が必要であることを示す文字列が含まれていないと判定すると、S5に処理を移す。
【0063】
続いて、判定部133は、新規請求書データと類似する過去請求書データが存在するか否かを判定する(S5)。例えば、判定部133は、新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている過去請求書データが存在するか否かを判定することにより、新規請求書データと類似する過去請求書データが存在するか否かを判定する。
【0064】
判定部133は、類似する過去請求書データが存在すると判定すると、S6に処理を移し、類似する過去請求書データに関連する判定用情報に基づいて、新規請求書に対して源泉徴収が必要か否かを判定する。判定部133は、類似する過去請求書データが存在しないと判定するとS7に処理を移す。
【0065】
続いて、判定部133は、新規請求書の請求元に対応する、源泉徴収が必要であるか否かを示す要否情報が存在するか否かを判定する(S7)。具体的には、判定部133は、記憶部12に記憶されている取引先マスタを参照し、新規請求書データが示す請求元情報に要否情報が関連付けられているか否かを判定することにより、新規請求書の請求元に対応する要否情報が存在するか否かを判定する。判定部133は、要否情報が存在すると判定すると、S8に処理を移し、新規請求書の請求元に対応する要否情報に基づいて、新規請求書に対して源泉徴収が必要か否かを判定する。判定部133は、新規請求書の請求元に対応する要否情報が存在しないと判定すると、S9に処理を移す。
【0066】
続いて、判定部133は、請求元が個人事業主であるか否かに基づいて、新規請求書に対して源泉徴収が必要か否かを判定する(S9)。例えば、判定部133は、新規請求書データが示す請求元の名称、及び振込先口座名の少なくともいずれかに基づいて新規請求書データが示す請求元が個人事業主であるか法人であるかを判定する。そして、判定部133は、請求元が個人事業主であると判定すると、新規請求書に対して源泉徴収が必要な可能性があると判定し、請求元が法人であると判定すると、新規請求書に対して源泉徴収が不要と判定する。
【0067】
続いて、出力部134は、判定部133による判定結果を示す判定結果情報を出力する(S10)。
続いて、登録部135は、データ取得部131が取得した新規請求書データと、判定部133による判定結果とを関連付けて、源泉徴収判定用情報として記憶部12に記憶させることにより、源泉徴収判定用情報を登録する(S11)。
【0068】
[変形例]
上述のフローチャートでは、判定部133は、抽出部132が抽出した一以上のテキスト情報に源泉徴収が必要であることを示す文字列が含まれていない場合、新規請求書データが示す請求元情報に関連付けられて記憶部12に記憶されている要否情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定したが、これに限らない。判定部133は、
図6に示す順番とは異なる順番でS1-S9の処理を行うことにより、新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0069】
例えば、判定部133は、まず、新規請求書データが示す請求元情報に関連付けられて記憶部12に記憶されている要否情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。そして、判定部133は、新規請求書データが示す請求元情報に関連付けて要否情報が記憶部12に記憶されていない場合に、抽出部132が抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0070】
また、判定部133は、新規請求書データが示す請求元情報に関連付けて要否情報が記憶部12に記憶されていない場合に、新規請求書データが示す請求対象名又は請求元の職種と同一又は類似の請求対象名又は請求元の職種を示すテキスト情報が含まれている過去請求書データに関連付けられた判定用情報に基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定してもよい。
【0071】
また、登録部135は、データ取得部131が取得した新規請求書データと、判定部133による判定結果とを関連付けて、源泉徴収判定用情報として記憶部12に記憶させることとしたが、これに限らない。登録部135は、ユーザ端末3から、過去請求書データと、企業IDと、過去請求書データに含まれる一以上のテキスト情報と、判定用情報とを関連付けた源泉徴収判定用情報を取得し、取得した源泉徴収判定用情報を記憶部12に記憶させてもよい。
【0072】
[本実施形態に係るデータ処理装置1による効果]
以上説明したように、本実施形態に係るデータ処理装置1は、新規請求書を示す新規請求書データを取得し、当該新規請求書データから、新規請求書から抽出した一以上のテキスト情報に、源泉徴収が必要であることを示す文字列が含まれるか否かに基づいて、新規請求書に対して源泉徴収が必要であるか否かを判定し、判定結果を示す判定結果情報を出力する。このようにすることで、被請求者である経理担当者は、出力された判定結果情報を確認することにより源泉税を徴収する必要があるかを把握することができる。これにより、データ処理装置1は、経理担当者の請求書の確認作業の負担を軽減することができる。
【0073】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0074】
1 データ処理装置
2 読取装置
3 ユーザ端末
11 通信部
12 記憶部
13 制御部
131 データ取得部
132 抽出部
133 判定部
134 出力部
135 登録部