IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ファーストアカウンティング株式会社の特許一覧

特開2024-144106データ処理装置、データ処理方法及びプログラム
<>
  • 特開-データ処理装置、データ処理方法及びプログラム 図1
  • 特開-データ処理装置、データ処理方法及びプログラム 図2
  • 特開-データ処理装置、データ処理方法及びプログラム 図3
  • 特開-データ処理装置、データ処理方法及びプログラム 図4
  • 特開-データ処理装置、データ処理方法及びプログラム 図5
  • 特開-データ処理装置、データ処理方法及びプログラム 図6
  • 特開-データ処理装置、データ処理方法及びプログラム 図7
  • 特開-データ処理装置、データ処理方法及びプログラム 図8
  • 特開-データ処理装置、データ処理方法及びプログラム 図9
  • 特開-データ処理装置、データ処理方法及びプログラム 図10
  • 特開-データ処理装置、データ処理方法及びプログラム 図11
  • 特開-データ処理装置、データ処理方法及びプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024144106
(43)【公開日】2024-10-11
(54)【発明の名称】データ処理装置、データ処理方法及びプログラム
(51)【国際特許分類】
   G06V 30/412 20220101AFI20241003BHJP
   G06Q 40/12 20230101ALI20241003BHJP
【FI】
G06V30/412
G06Q40/12
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2024005421
(22)【出願日】2024-01-17
(62)【分割の表示】P 2023519782の分割
【原出願日】2023-03-29
(71)【出願人】
【識別番号】516380407
【氏名又は名称】ファーストアカウンティング株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(72)【発明者】
【氏名】葛 鴻鵬
(72)【発明者】
【氏名】松田 顕
(72)【発明者】
【氏名】小俣 智
(72)【発明者】
【氏名】森 啓太郎
(72)【発明者】
【氏名】早川 将和
【テーマコード(参考)】
5B029
【Fターム(参考)】
5B029BB02
5B029CC21
5B029CC26
(57)【要約】      (修正有)
【課題】複数の証憑を同時に読み取って作成された画像データに基づいて、証憑に含まれる文字列が示す情報を適切に処理するデータ処理装置、データ処理方法及びプログラムを提供する。
【解決手段】データ処理装置及び画像読取装置を有するデータ処理システムにおいて、データ処理装置1は、複数の証憑を同時に読み取ることにより作成された証憑画像データを、画像処理装置からか又は他の装置から取得するデータ取得部131と、証憑画像データに基づいて、複数の証憑に共通に含まれている共通文字列を特定する文字列特定部132と、複数の証憑に含まれている共通文字列以外の少なくとも一部の複数の文字列を、共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部133と、を有する。
【選択図】図2
【特許請求の範囲】
【請求項1】
複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部と、
前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定する文字列特定部と、
複数の前記証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部と、
を有するデータ処理装置。
【請求項2】
前記データ作成部は、前記共通文字列が含まれている複数の前記証憑に含まれているデータを含み、前記共通文字列が含まれていない前記証憑に含まれているデータを含まない前記処理済データを作成する、
請求項1に記載のデータ処理装置。
【請求項3】
前記データ作成部は、第1の前記共通文字列が含まれている複数の前記証憑に含まれているデータに基づく第1の前記処理済データと、第2の前記共通文字列が含まれている複数の前記証憑に含まれているデータに基づく第2の前記処理済データと、を作成する、
請求項1に記載のデータ処理装置。
【請求項4】
前記共通文字列は、複数の前記証憑に共通する発行者名、又は複数の前記証憑に共通する同一業種の発行者名であり、
前記データ作成部は、当該発行者名が含まれる複数の前記証憑に含まれている前記共通文字列以外のデータが前記発行者名に関連付けられた前記処理済データを作成する、
請求項1に記載のデータ処理装置。
【請求項5】
前記共通文字列は、複数の前記証憑に共通する発行時期を示す文字列であり、
前記データ作成部は、前記共通文字列に対応する発行時期が含まれる複数の前記証憑に含まれている前記共通文字列以外のデータが前記発行時期に関連付けられた前記処理済データを作成する、
請求項1に記載のデータ処理装置。
【請求項6】
前記共通文字列は、複数の前記証憑に共通する発行時期を示す文字列であり、
前記データ作成部は、前記共通文字列に対応する発行時期が含まれる複数の前記証憑それぞれに含まれる金額を示す文字列を、前記発行時期の順番に配置した前記処理済データを作成する、
請求項1に記載のデータ処理装置。
【請求項7】
前記複数の証憑それぞれは、購入商品名と、購入商品の金額と、が記載された領収書であり、
前記共通文字列は、前記購入商品名を示す文字列であり、
前記データ作成部は、前記購入商品名と、前記購入商品名ごとに前記金額を合算した合計額とが関連付けられた前記処理済データを作成する、
請求項1に記載のデータ処理装置。
【請求項8】
前記データ作成部は、前記購入商品名に対応する勘定科目と前記合計額とが関連付けられた前記処理済データを作成する、
請求項7に記載のデータ処理装置。
【請求項9】
前記データ作成部は、前記複数の証憑に含まれている複数の文字列が所定の条件を満たしていない場合に、警告を示すデータを作成する、
請求項1に記載のデータ処理装置。
【請求項10】
前記データ作成部は、前記複数の証憑に含まれている前記複数の文字列の間に所定の関連性がない場合に、前記警告を示すデータを作成する、
請求項9に記載のデータ処理装置。
【請求項11】
前記証憑における所定文字列の位置と前記証憑の領域との関係を示す領域データを記憶する記憶部をさらに有し、
前記文字列特定部は、特定した前記共通文字列に関連付けられた前記領域データを参照することにより特定した、前記複数の証憑それぞれの領域内に含まれている複数の文字列を、前記複数の証憑それぞれに記載されている複数の証憑別文字列として特定し、
前記データ作成部は、前記文字列特定部が特定した前記複数の証憑別文字列にさらに基づいて前記処理済データを作成する、
請求項1から10のいずれか一項に記載のデータ処理装置。
【請求項12】
前記領域データは、前記所定文字列の位置を基準として、前記証憑の少なくとも2つの頂点又は3つの辺の位置を示すデータであり、
前記文字列特定部は、前記領域データに基づいて特定した前記証憑の3つの辺に囲まれた領域内の前記複数の証憑別文字列を特定する、
請求項11に記載のデータ処理装置。
【請求項13】
前記領域データは、前記証憑の中心よりも上方にある第1の前記所定文字列の位置と、前記証憑の中心よりも下方にある第2の前記所定文字列の位置と、を基準として、前記証憑の4つの頂点又は4つの辺の位置を示すデータであり、
前記文字列特定部は、前記領域データに基づいて特定した前記証憑の4つの辺に囲まれた領域内の前記複数の証憑別文字列を特定する、
請求項11に記載のデータ処理装置。
【請求項14】
コンピュータが実行する、
複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するステップと、
前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定するステップと、
前記複数の証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するステップと、
を有するデータ処理方法。
【請求項15】
コンピュータを、
複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部と、
前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定する文字列特定部と、
前記複数の証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部と、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理装置、データ処理方法及びプログラムに関する。
【背景技術】
【0002】
従来、レシート、領収書又は請求書等の証憑を読み取った画像データに基づいて、仕訳データを作成する装置が知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-071991号公報
【特許文献2】特開2016-186773号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載された装置で証憑画像データに基づく処理済データを作成するためは、ユーザが証憑を1枚ずつ読み取る操作をする必要があった。特許文献2に記載されているように、ユーザがフラットベッドスキャナ又はデジタルカメラを用いて複数の証憑をまとめて読み取る操作をすることにより、複数の証憑をまとめて処理することは可能になる。この場合、ユーザが読み取らせた複数の証憑の中に、処理をする対象でない証憑が含まれているとしても、当該証憑に記載された文字列も処理の対象にされてしまうという問題があった。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、複数の証憑を同時に読み取って作成された画像データに基づいて、証憑に含まれる文字列が示す情報を適切に処理できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様のデータ処理装置は、複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部と、前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定する文字列特定部と、複数の前記証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部と、を有する。
【0007】
前記データ作成部は、前記共通文字列が含まれている複数の前記証憑に含まれているデータを含み、前記共通文字列が含まれていない前記証憑に含まれているデータを含まない前記処理済データを作成してもよい。
【0008】
前記データ作成部は、第1の前記共通文字列が含まれている複数の前記証憑に含まれているデータに基づく第1の前記処理済データと、第2の前記共通文字列が含まれている複数の前記証憑に含まれているデータに基づく第2の前記処理済データと、を作成してもよい。
【0009】
前記共通文字列は、複数の前記証憑に共通する発行者名、又は複数の前記証憑に共通する同一業種の発行者名であり、前記データ作成部は、当該発行者名が含まれる複数の前記証憑に含まれている前記共通文字列以外のデータが前記発行者名に関連付けられた前記処理済データを作成してもよい。
【0010】
前記共通文字列は、複数の前記証憑に共通する発行時期を示す文字列であり、前記データ作成部は、前記共通文字列に対応する発行時期が含まれる複数の前記証憑に含まれている前記共通文字列以外のデータが前記発行時期に関連付けられた前記処理済データを作成してもよい。
【0011】
前記共通文字列は、複数の前記証憑に共通する発行時期を示す文字列であり、前記データ作成部は、前記共通文字列に対応する発行時期が含まれる複数の前記証憑それぞれに含まれる金額を示す文字列を、前記発行時期の順番に配置した前記処理済データを作成してもよい。
【0012】
前記複数の証憑それぞれは、購入商品名と、購入商品の金額と、が記載された領収書であり、前記共通文字列は、前記購入商品名を示す文字列であり、前記データ作成部は、前記購入商品名と、前記購入商品名ごとに前記金額を合算した合計額とが関連付けられた前記処理済データを作成してもよい。
【0013】
前記データ作成部は、前記購入商品名に対応する勘定科目と前記合計額とが関連付けられた前記処理済データを作成してもよい。
【0014】
前記データ作成部は、前記複数の証憑に含まれている複数の文字列が所定の条件を満たしていない場合に、警告を示すデータを作成してもよい。
【0015】
前記データ作成部は、前記複数の証憑に含まれている前記複数の文字列の間に所定の関連性がない場合に、前記警告を示すデータを作成してもよい。
【0016】
前記データ処理装置は、前記証憑における所定文字列の位置と前記証憑の領域との関係を示す領域データを記憶する記憶部をさらに有し、前記文字列特定部は、特定した前記共通文字列に関連付けられた前記領域データを参照することにより特定した、前記複数の証憑それぞれの領域内に含まれている複数の文字列を、前記複数の証憑それぞれに記載されている複数の証憑別文字列として特定し、前記データ作成部は、前記文字列特定部が特定した前記複数の証憑別文字列にさらに基づいて前記処理済データを作成してもよい。
【0017】
前記領域データは、前記所定文字列の位置を基準として、前記証憑の少なくとも2つの頂点又は3つの辺の位置を示すデータであり、前記文字列特定部は、前記領域データに基づいて特定した前記証憑の3つの辺に囲まれた領域内の前記複数の証憑別文字列を特定してもよい。
【0018】
前記領域データは、前記証憑の中心よりも上方にある第1の前記所定文字列の位置と、前記証憑の中心よりも下方にある第2の前記所定文字列の位置と、を基準として、前記証憑の4つの頂点又は4つの辺の位置を示すデータであり、前記文字列特定部は、前記領域データに基づいて特定した前記証憑の4つの辺に囲まれた領域内の前記複数の証憑別文字列を特定してもよい。
【0019】
本発明の第2の態様のデータ処理方法は、コンピュータが実行する、複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するステップと、前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定するステップと、前記複数の証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するステップと、を有する。
【0020】
本発明の第3の態様のプログラムは、コンピュータを、複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部と、前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定する文字列特定部と、前記複数の証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部と、として機能させるためのプログラムである。
【発明の効果】
【0021】
本発明によれば、複数の証憑を同時に読み取って作成された画像データに基づいて、証憑に含まれる文字列が示す情報を適切に処理できるようになるという効果を奏する。
【図面の簡単な説明】
【0022】
図1】データ処理システムSの概要を説明するための図である。
図2】データ処理装置1の構成を示す図である。
図3】領域データの一例を示す図である。
図4】領域データの他の例を示す図である。
図5】複数の証憑を読み取ることにより作成された証憑画像データの例を示す図である。
図6】複数の証憑を読み取ることにより作成された証憑画像データの例を示す図である。
図7】データ作成部133が作成した仕訳データの例を示す図である。
図8】データ作成部133が作成した仕訳データの他の例を示す図である。
図9】データ作成部133が証憑の作成順に文字列が配置された処理済データを作成した例を示す図である。
図10】データ作成部133が作成した複数の処理済データの例を示す図である。
図11】データ処理装置1の処理の流れを示すフローチャートである。
図12】データ作成部133が実行する処理(S15)の流れを示すフローチャートである。
【発明を実施するための形態】
【0023】
[データ処理装置システムSの概要]
図1は、データ処理システムSの概要を説明するための図である。データ処理システムSは、領収書、レシート、納品書又は請求書等の証憑を複数枚まとめて読み取った複数の証憑に記載されているデータを処理するためのシステムである。複数の証憑それぞれは、例えば、発行者名と、発行年月日と、購入商品名と、購入商品の金額と、が記載された領収書である。データ処理システムSは、データ処理装置1及び画像読取装置2を有しており、データ処理装置1は、例えば、画像読取装置2が読み取った複数の証憑に共通して記載されている文字列(例えば、発行者名、発行年月)等に基づいて分類された処理済データを作成する。
【0024】
画像読取装置2は、例えばフラットベッドタイプのスキャナ又はデジタルカメラである。データ処理装置1は、証憑画像データを画像読取装置2から直接取得してもよく、他の装置(例えばコンピュータ)から証憑画像データを取得してもよい。以下、証憑が店舗で発行されたレシートである場合を例にして説明する。
【0025】
[データ処理装置1の構成]
図2は、データ処理装置1の構成を示す図である。データ処理装置1は、例えばコンピュータであり、証憑を処理して処理済データを作成する企業で使用される。データ処理装置1は、クラウドサーバであってもよい。
【0026】
データ処理装置1は、通信部11と、記憶部12と、制御部13と、を有する。制御部13は、データ取得部131と、文字列特定部132と、データ作成部133と、を有する。
【0027】
通信部11は、外部装置(例えば画像読取装置2)から証憑画像データを受信するための通信インターフェースを有する。通信部11は、受信した証憑画像データをデータ取得部131に入力する。また、通信部11は、データ作成部133が作成した処理済データを外部装置(例えば、ディスプレイ、プリンタ又は経理担当者が使用するコンピュータ)に送信する。
【0028】
記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)及びSSD(Solid State Drive)等の記憶媒体を有する。記憶部12は、制御部13が実行するプログラムを記憶する。また、記憶部12は、通信部11が受信した証憑画像データを一時的に記憶する。記憶部12は、制御部13が処理済データを作成するために使用する各種のデータを記憶する。
【0029】
記憶部12は、例えば、文字列特定部132が証憑に含まれている複数の文字列を特定するために用いる文字列辞書を記憶する。文字列辞書は、文字列特定部132が文字列として認識するべき単語を含む辞書データである。文字列辞書においては、複数の単語それぞれに対して単語の種別を示す情報が含まれていてもよい。単語の種別は、例えば組織名(店名を含む)、商品名、住所、又は請求書専用用語(例えば「消費税」、「合計」)である。文字列辞書においては、1つの単語に複数の種別が関連付けられていてもよい。
【0030】
記憶部12は、証憑の発行者名、発行者のロゴ、店名等のように、証憑の発行者を特定する文字列、年月日のように証憑の発行時期を示す文字列、又は商品名を示す文字列に関連付けて、複数の証憑に共通に含まれる共通文字列に対応するルールを記憶してもよい。共通文字列は、例えば、複数の証憑に共通する発行者名、証憑の発行時期、又は商品名である。
【0031】
共通文字列に対応するルールは、例えば、複数の証憑に共通する発行者ごと、証憑の発行時期ごと、又は商品ごとに、証憑に記載された共通文字列以外の文字列を含む処理済データをデータ作成部133が作成するためのルールである。共通文字列に対応するルールは、証憑の発行者の業種ごとにデータ作成部133が処理済データを作成するためのルールであってもよい。なお、発行時期は、年、月、日、曜日のいずれかにより表される。発行時期として年、月、日、曜日のいずれを使用するかは、データ処理装置1を用いて処理済データを作成するユーザ(例えば経理担当者)により設定されてもよい。
【0032】
記憶部12は、複数の異なる組織が発行した複数の証憑それぞれに関連付けて、証憑における所定文字列の位置と証憑の領域との関係を示す領域データを記憶してもよい。領域データは、共通文字列の位置を基準として、証憑の少なくとも2つの頂点又は3つの辺の位置を示すデータである。領域データは、証憑の中心よりも上方にある第1の所定文字列の位置と、証憑の中心よりも下方にある第2の所定文字列の位置と、を基準として、証憑の4つの頂点又は4つの辺の位置を示すデータであってもよい。所定文字列は、証憑の発行者を示す文字列であり、発行者名、発行者を示すマーク、発行者に特有のキャッチフレーズ等である。
【0033】
図3は、領域データの一例を示す図である。図3(a)に示すように、領域データにおいては、例えば、証憑の発行者名(例えば店名)を示す文字列の左端から証憑の左の辺までの距離D1と、発行者名を示す文字列の右端から証憑の右の辺までの距離D2とが含まれている。図3(b)に示すように、領域データにおいて、発行者名を示す第1の所定文字列の上端から証憑の上の辺までの距離D3と、店名と異なる第2の所定文字列(例えば「合計」)の下端から証憑の下の辺までの距離D4とが含まれていてもよい。1つの組織が発行した証憑であっても距離D1~距離D4にばらつきがある場合、領域データには、距離D1~距離D4の範囲を示す値が含まれていてもよい。
【0034】
図4は、領域データの他の例を示す図である。図4(a)に示す領域データにおいては、発行者名を示す文字列の左上から証憑の左上の頂点までの横方向の距離D1と縦方向の距離D3、及び発行者名を示す文字列の右上から証憑の右上の頂点までの横方向の距離D2と縦農方向の距離D3が含まれている。2つの頂点を結ぶ線分は証憑の上の辺になり、2つの頂点それぞれを通り、2つの頂点を結ぶ線分と直交する2つの線分が証憑の左右の辺になる。
【0035】
図4(b)に示す領域データにおいては、第2の所定文字列である「合計」の左下から証憑の左下の頂点までの横方向の距離D5と縦方向の距離D4、及び「合計」の右下から証憑の右下の頂点までの横方向の距離D6と縦方向の距離D4がさらに含まれている。4つの頂点により形成される四辺形が証憑の輪郭線になる。
【0036】
記憶部12は、データ作成部133が仕訳データを作成するために使用される仕訳用データを記憶してもよい。仕訳用データにおいては、文房具費、食料費、通信費等の勘定科目と、商品名又はサービス名とが関連付けられている。
【0037】
制御部13は、例えばCPU(Central Processing Unit)を有する。制御部13は、記憶部12に記憶されたプログラムを実行することにより、データ取得部131、文字列特定部132及びデータ作成部133として機能する。
【0038】
データ取得部131は、通信部11を介して各種のデータを取得する。データ取得部131は、例えば、複数の証憑を同時に読み取ることにより作成された証憑画像データを画像読取装置2から取得する。データ取得部131は、取得した証憑画像データを文字列特定部132に入力する。
【0039】
データ取得部131は、通信部11を介して、ユーザの指示を示す指示データを取得してもよい。指示データは、例えば、共通文字列の種別を指定するデータである。指示データは、データ作成部133に実行させる処理の内容を示すデータであってもよい。指示データは、共通文字列に対応するルールを指定するデータであってもよい。データ取得部131は、指示データの内容を文字列特定部132又はデータ作成部133に通知する。データ取得部131は、指示データの内容を記憶部12に記憶させてもよい。
【0040】
文字列特定部132は、OCR(Optical Character Recognition)処理を実行することにより、データ取得部131が取得した証憑画像データに基づいて、証憑画像に含まれている複数の文字を特定する。文字列特定部132は、記憶部12に記憶された文字列辞書を参照することにより、特定した複数の文字に基づいて複数の文字列を特定する。
【0041】
文字列特定部132は、特定した複数の文字列のうち、複数の証憑に共通に含まれている共通文字列を特定する。文字列特定部132は、証憑画像データに複数存在する文字列を共通文字列の候補として特定する。文字列特定部132は、共通文字列の候補のうち、例えば、複数の証憑に共通する発行者を示す文字列を共通文字列として特定する。文字列特定部132は、文字列辞書における単語の種別が会社名になっている単語と一致する文字列を、複数の証憑の発行者を示す共通文字列として特定する。共通文字列は、複数の証憑に共通する発行時期を示す文字列であってもよい。
【0042】
文字列特定部132は、特定した複数の共通文字列の候補それぞれの間の距離が、1枚の証憑の大きさの最小値として記憶部12に記憶された大きさが示す証憑の縦方向の最小長以上であり、かつ横方向の最小長以上であることを条件として、共通文字列として特定してもよい。このようにすることで、文字列特定部132は、「円」のように、1枚の証憑に複数含まれている文字列を共通文字列として特定せず、複数の証憑それぞれに1つだけ含まれている文字列を共通文字列として特定することができる。
【0043】
文字列特定部132は、特定した共通文字列に関連付けられた領域データを参照することにより、特定した複数の共通文字列それぞれに対応する複数の証憑それぞれの領域を特定してもよい。文字列特定部132は、特定した複数の証憑それぞれの領域内に含まれている複数の文字列を、複数の証憑それぞれに記載されている複数の証憑別文字列として特定する。
【0044】
文字列特定部132は、例えば、図3に示した領域データに基づいて特定した証憑の3つの辺に囲まれた領域内の複数の証憑別文字列を特定する。文字列特定部132は、領域データに基づいて特定した証憑の4つの辺に囲まれた領域内の複数の証憑別文字列を特定してもよい。
【0045】
図5及び図6は、複数の証憑を読み取ることにより作成された証憑画像データの例を示す図である。図5においては、「Aショップ」により発行された4枚のレシート(領収書)の画像が含まれている。このような場合、文字列特定部132は、「Aショップ」という共通文字列と「合計」という共通文字列とを特定し、図3又は図4に示した領域データを参照することにより、各証憑の領域として、領域R1、R2、R3、R4を特定する。文字列特定部132は、各領域に含まれている証憑別文字列を特定する。文字列特定部132がこのようにして領域を特定することにより、証憑画像データにおいて各証憑の輪郭線が不明瞭な場合であっても、各証憑の領域を正しく特定できる。その結果、文字列特定部132は、各証憑に対応する証憑別文字列を正しく特定することができる。
【0046】
図6においては、領域R1、R2に含まれているレシートの発行者が「Aショップ」であり、領域R3、R4に含まれているレシートの発行者が「B商店」である。このような場合、文字列特定部132は、共通文字列「Aショップ」に対応する領域として領域R1、R2を特定し、「B商店」に対応する領域として領域R3、R4を特定する。文字列特定部132は、共通文字列「2023年3月」又は「合計」が含まれている領域として、領域R1~R4を特定してもよい。文字列特定部132は、特定した領域ごとに特定した証憑別文字列を、共通文字列に関連付けてデータ作成部133に通知する。
【0047】
データ作成部133は、複数の証憑に含まれている共通文字列以外の少なくとも一部の複数の文字列(すなわち、文字列特定部132が特定した複数の証憑別文字列)を、共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成する。
【0048】
一例として、共通文字列が、複数の証憑に共通する発行者名、又は複数の証憑に共通する同一業種の発行者名である場合、データ作成部133は、当該発行者名が含まれる複数の証憑に含まれている共通文字列以外のデータが発行者名に関連付けられた処理済データを作成する。データ作成部133は、例えば、共通文字列として特定された「Aショップ」に対応するルールにおいて抽出するべき文字列として定められた複数の文字列を、ルールにおいて定められた形式に配置した表形式の処理済データを作成する。
【0049】
データ作成部133は、例えば、複数の証憑に共通する発行者を示す共通文字列が含まれている複数の証憑に含まれているデータを含み、共通文字列が含まれていない証憑に含まれているデータを含まない処理済データを作成する。図5に示す例の場合、データ作成部133は、発行者が「Aショップ」の4枚のレシートそれぞれに含まれている文字列を含む処理済データを作成する。図6に示す例の場合、データ作成部133は、発行者が「Aショップ」の3枚のレシートそれぞれに含まれている文字列を含み、発行者が「B商店」のレシートに含まれている文字列を含まない処理済データを作成する。
【0050】
「Aショップ」と「B商店」の業種が「コンビニエンスストア」である場合、データ作成部133は、「コンビニエンスストア」に関連付けられた処理済データとして、発行者が「Aショップ」の3枚のレシートそれぞれに含まれている文字列と、発行者が「B商店」のレシートに含まれている文字列とを含む処理済データを作成してもよい。処理済データが業種ごとに作成される場合、データ作成部133は、業種に対応するルールに基づいて処理することにより処理済データを作成してもよい。
【0051】
ここで、「Aショップ」に対応するルールが、「税率が10%の商品の仕訳データを作成する」であるとする。この場合、データ作成部133は、複数の領域R1~R4に含まれている文字列から、税率10%に対応する商品を示す文字列を抽出し、抽出した文字列に対応する金額に基づいて仕訳データを作成する。
【0052】
図7は、データ作成部133が作成した仕訳データの例を示す図である。図7(a)は、図5に示す証憑画像データに基づいてデータ作成部133が作成した仕訳データであり、図7(b)は、図6に示す証憑画像データに基づいて作成した仕訳データである。
【0053】
図5に示す証憑画像データの場合、データ作成部133は、税率10%に対応する商品を示す文字列として、領域R1における「ボールペン ¥120」、「付箋紙 ¥300」、領域R2における「コピー用紙 ¥500」、領域R4における「プリンタインク ¥1250」を抽出する。データ作成部133は、記憶部12に記憶された仕訳用データを参照し、「ボールペン」と「付箋紙」の合計額420円を勘定科目「文具費」として分類し、「コピー用紙」と「プリンタインク」の合計額1750円を勘定科目「印刷費」として分類することにより、図7(a)に示す仕訳データを作成する。
【0054】
図6に示す証憑画像データの場合、データ作成部133は、税率10%に対応する商品を示す文字列として、領域R1における「ボールペン ¥120」、「付箋紙 ¥300」、領域R2における「コピー用紙 ¥500」を抽出する。データ作成部133は、記憶部12に記憶された仕訳用データを参照し、「ボールペン」と「付箋紙」の合計額420円を勘定科目「文具費」として分類し、「コピー用紙」の500円を勘定科目「印刷費」として分類することにより、図7(b)に示す仕訳データを作成する。
【0055】
文字列特定部132が、複数の証憑に共通する発行時期を示す文字列を共通文字列として特定し、データ作成部133が、共通文字列に対応する発行時期が含まれる複数の証憑に含まれている共通文字列以外のデータが発行時期に関連付けられた処理済データを作成してもよい。
【0056】
図8は、図6に示した証憑画像データに基づいてデータ作成部133が作成した仕訳データの他の例を示す図である。図8に示す仕訳データは、共通文字列として発行時期(年月)が指定され、文字列特定部132が共通文字列として2023年3月を特定した場合に作成されている。ここで、共通文字列が発行時期である場合のルールが、「共通文字列に対応する時期に発行された証憑に含まれている商品を勘定科目に分類して仕訳データを作成する」であるとする。
【0057】
この場合、データ作成部133は、図6に示す証憑画像データの領域R1~R4に対応する全てのレシートに記載された商品を、それぞれに対応する勘定科目に分類することにより、図8に示す仕訳データを作成する。証憑画像データの一部に2023年3月以外の年月に発行された証憑が含まれている場合、データ作成部133は、当該証憑に対応する証憑別文字列に基づかない仕訳データを作成する。
【0058】
データ作成部133は、共通文字列に対応する発行時期が含まれる複数の証憑それぞれに含まれる金額を示す文字列を、証憑の発行時期の順番に配置した処理済データを作成してもよい。図9は、図5又は図6に示した証憑画像データに基づいてデータ作成部133が証憑の作成順に文字列が配置された処理済データを作成した例を示す図である。図9に示す処理済データにおいては、証憑の発行時期(年月日)と、商品名と、金額と、消費税額とが関連付けられている。データ作成部133がこのような処理済データを作成することで、証憑画像データに含まれている複数の証憑の内容を、ユーザが容易に把握できる。このように発行時期の順番に文字列が配置された処理済データは、出張時の精算をする際に好適である。
【0059】
共通文字列が発行時期である場合、データ作成部133は、予め登録された商品と金額とを抜き出した処理済データを作成してもよい。予め登録された商品は、例えば、社員が会社に請求することが認められている商品である。データ作成部133がこのような処理済データを作成することで、ユーザ(例えば経理担当者)が、社員が費用を立て替えて商品を購入した場合の複数のレシートに記載された費用のうち、社員に支払うべき費用を容易に把握することができる。
【0060】
共通文字列が、購入商品名を示す文字列である場合、データ作成部133は、購入商品名と、購入商品名ごとに金額を合算した合計額とが関連付けられた処理済データを作成してもよい。データ作成部133は、例えば、購入商品名に対応する勘定科目と合計額とが関連付けられた処理済データを作成する。
【0061】
図5又は図6に示した証憑画像データの例の場合、文字列特定部132が「お茶」を共通文字列として特定し、データ作成部133は、領域R1に含まれている「お茶」の500円と、領域R3に含まれている「お茶」の200円とを合算し、「お茶」と「700円」とが関連付けられた処理済データを作成する。データ作成部133は、他の商品名と金額とがさらに含まれる処理済データを作成してもよい。データ作成部133がこのような処理済データを作成することで、ユーザは、複数の証憑に同一名の商品が含まれている場合に、当該商品の合計金額を容易に把握することができる。
【0062】
データ作成部133は、第1の共通文字列が含まれている複数の証憑に含まれているデータに基づく第1の処理済データと、第2の共通文字列が含まれている複数の証憑に含まれているデータに基づく第2の処理済データと、を作成してもよい。共通文字列は、証憑の発行者名であってもよく、発行時期であってもよく、商品名であってもよい。
【0063】
図10は、図6に示した証憑画像データに基づいてデータ作成部133が作成した複数の処理済データの例を示す図である。図10(a)は、第1の共通文字列「Aショップ」が含まれている領域R1、R2に対応するレシートに基づく第1の処理済データの例を示す。図10(b)は、第2の共通文字列「B商店」が含まれている領域R3、R4に対応するレシートに基づく第2の処理済データの例を示す。
【0064】
複数の証憑に、発行時期が2023年3月の証憑と、発行時期が2023年4月の証憑とが混在している場合、データ作成部133は、第1の共通文字列「2023年3月」が含まれている複数のレシートに基づく第1の処理済データと、第2の共通文字列「2023年4月」が含まれている複数のレシートに基づく第2の処理済データとを作成してもよい。このように、データ作成部133が複数の共通文字列それぞれに対応する処理済データを作成することで、ユーザのニーズに合わせて複数の証憑に含まれている文字列が分類された複数の処理済データが作成されるので、ユーザが証憑に含まれているデータを活用しやすくなる。
【0065】
データ作成部133は、複数の証憑に含まれている複数の文字列が所定の条件を満たしていない場合に、警告を示すデータを作成してもよい。所定の条件は、ユーザにより指定された条件又は予め記憶部12に記憶された条件である。データ作成部133は、例えば、複数の証憑に含まれている複数の文字列の間に所定の関連性がない場合に、警告を示すデータを作成する。
【0066】
一例として、データ作成部133は、図6に示した証憑画像データのように、一部の複数の証憑(領域R1、R2の証憑)に含まれている共通文字列(例えば「Aショップ」)が他の証憑(領域R3、R4の証憑)に含まれていない場合に、警告を示すデータを作成する。データ作成部133は、通信部11を介して、所定の条件が満たされていないことを示す警告文を出力してもよく、警告が記載された処理済データを出力してもよい。
【0067】
データ作成部133は、一部の証憑に含まれている一部の商品が属する勘定科目が、他の証憑に含まれている商品が属する勘定科目と異なっている場合に、警告データを作成してもよい。例えば、データ作成部133は、証憑画像データに文房具のレシートが複数含まれており、1枚だけタクシー代のレシートが含まれている場合に警告データを作成する。データ作成部133は、証憑に記載されている住所、又は記憶部12に記憶された発行者名に対応する住所に基づいて、複数の証憑の発行者(例えば店舗)の場所間の距離が閾値以上である場合に警告データを作成してもよい。
【0068】
データ作成部133は、所定の条件を満たしていない証憑を特定するための情報を含む警告データを出力してもよい。図6に示した証憑画像データの場合、データ作成部133は、例えば、領域R3、R4を他の領域と異なる表示態様で表示した画像データを警告データとして出力してもよい。
【0069】
[データ処理装置1における処理の流れ]
図11は、データ処理装置1の処理の流れを示すフローチャートである。図11に示すフローチャートは、複数の証憑を受け取ったユーザが画像読取装置2を用いて複数の証憑を読み取った時点から開始している。
【0070】
データ取得部131は、画像読取装置2が作成した証憑画像データを取得する(S11)。文字列特定部132は、証憑画像データに含まれている共通文字列を特定する(S12)。文字列特定部132は、領域データを参照することにより、特定した共通文字列に対応する複数の証憑領域を特定する(S13)。続いて、文字列特定部132は、特定した複数の証憑領域それぞれに含まれる複数の文字列を証憑別文字列として特定する(S14)。
【0071】
続いて、データ作成部133は、特定された複数の文字列に基づく処理を実行する(S15)。データ作成部133が実行する処理の詳細については後述する。データ作成部133は、処理の結果に基づいて処理済データを作成し(S16)、通信部11を介して、作成した処理済データを出力する(S17)。
【0072】
図12は、データ作成部133が実行する処理(S15)の流れを示すフローチャートである。データ作成部133は、データ取得部131が取得した指示データに基づいて、複数の文字列を発行者別に処理するか否かを判定する(S151)。データ作成部133は、複数の文字列を発行者別に処理すると判定した場合(S151においてYES)、同一の発行者が発行した証憑に含まれている商品を示す文字列及び金額を示す文字列に基づいて、仕訳処理を実行する(S152)。
【0073】
データ作成部133は、複数の文字列を発行者別に処理せず、発行時期別に処理すると判定した場合(S151においてNO、S153においてYES)、発行時期が同一の複数の証憑に含まれている商品を示す文字列及び金額を示す文字列に基づいて、仕訳処理を実行する(S154)。データ作成部133は、発行時期別に処理しないと判定した場合(S153においてNO)、証憑画像データに含まれる全ての商品を示す文字列及び金額を示す文字列に基づいて、仕訳処理を実行する(S155)。
【0074】
[データ処理装置1による効果]
以上説明したように、データ処理装置1は、複数の証憑を同時に読み取ることにより作成された証憑画像データに基づいて、複数の証憑に共通に含まれている共通文字列を特定する文字列特定部132と、複数の証憑に含まれている共通文字列以外の少なくとも一部の複数の文字列を、共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部133と、を有する。
【0075】
以上、実施の形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0076】
1 データ処理装置
2 画像読取装置
11 通信部
12 記憶部
13 制御部
131 データ取得部
132 文字列特定部
133 データ作成部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12