(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-09-05
(45)【発行日】2024-09-13
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06Q 40/12 20230101AFI20240906BHJP
【FI】
G06Q40/12
(21)【出願番号】P 2024502234
(86)(22)【出願日】2024-01-15
(86)【国際出願番号】 JP2024000846
【審査請求日】2024-01-15
【早期審査対象出願】
(73)【特許権者】
【識別番号】516380407
【氏名又は名称】ファーストアカウンティング株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(72)【発明者】
【氏名】藤武 将人
(72)【発明者】
【氏名】松田 顕
【審査官】山崎 誠也
(56)【参考文献】
【文献】国際公開第2021/260865(WO,A1)
【文献】特開2022-063939(JP,A)
【文献】特開2022-190557(JP,A)
【文献】特開2024-002548(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
取引に関する書類の電子データである書類データを取得する取得部と、
複数の種別の異なる書類の書類データを含む複数の
書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データ
であって、前記書類の種別ごとに異なる種類の情報を含む前記要約データを生成する要約生成部と、
書類データが示す書類の種別と当該書類データから抽出した前記要約データとを入力すると、クラスタを生成する機械学習モデルを記憶する記憶部と、
前記複数の要約データを前記機械学習モデルに入力することにより、前記複数の要約データを関連する案件ごとに分割したクラスタを生成するクラスタ生成部と、
を有する情報処理装置。
【請求項2】
取引に関する書類の電子データである書類データを取得する
とともに、関連する案件を判定する対象の書類データである対象書類データを取得する、取得部と、
複数の種別の異なる書類の書類データを含む複数の
書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成する
とともに、対象書類データに対応する前記要約データである対象要約データを生成する、要約生成部と、
前記複数の要約データを関連する案件ごとに分割したクラスタを生成するクラスタ生成部と、
前記クラスタ生成部が生成したクラスタに基づいて、前記対象要約データに対応する書類が関連する案件を特定する特定部と、
前記特定部が特定した案件に関連する書類データを出力する出力部と、
を有する情報処理装置。
【請求項3】
取引に関する書類の電子データである書類データを取得する取得部と、
複数の種別の異なる書類の書類データを含む複数の
書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成する要約生成部と、
前記複数の要約データを関連する案件ごとに分割したクラスタを生成するクラスタ生成部と、
表示対象の書類データの選択を受付ける受付部と、
前記受付部が受付けた書類データが属するクラスタと所定の関係にある書類データを、当該書類データと関連する候補である候補書類データとして特定する特定部と、
前記表示対象の書類データと、前記候補書類データと、を関連付けて出力する出力部と、
を有する情報処理装置。
【請求項4】
取引に関する書類の電子データである書類データを取得する取得部と、
複数の種別の異なる書類の書類データを含む複数の
書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成する要約生成部と、
前記複数の要約データを関連する案件ごとに分割したクラスタを生成するクラスタ生成部と、
仕訳対象の書類データの選択を受付ける受付部と、
前記仕訳対象の書類データと、当該書類データが属するクラスタに対応する他の書類データと、に含まれる情報に基づいて仕訳対象の書類データが示す取引を仕訳した仕訳データを生成する仕訳データ生成部と、
を有する情報処理装置。
【請求項5】
前記仕訳データ生成部は、仕訳対象の書類データに含まれる項目と、当該書類データが属する前記クラスタに対応する他の書類データに含まれる所定の項目であって、当該
他の書類データの書類の種別に対応する前記所定の項目と、に基づいて
仕訳対象の書類データが示す取引を仕訳した仕訳データを生成する、
請求項
4に記載の情報処理装置。
【請求項6】
取引に関する書類の電子データである書類データを取得する取得部と、
複数の種別の異なる書類の書類データを含む複数の書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成する要約生成部と、
前記複数の要約データを関連する案件ごとに分割したクラスタを生成するクラスタ生成部と、
書類データと、当該書類データが示す取引についての仕訳を示す仕訳データを関連付けて記憶する記憶部と、
仕訳対象の書類データの選択を受付ける受付部と、
前記仕訳対象の書類データと、当該書類データが属する前記クラスタと所定の関係にあるクラスタに属する書類データに関連付けられた前記仕訳データと、に基づいて、前記仕訳対象の書類データについての前記仕訳データを生成する仕訳データ生成部と、
を有する情報処理装置。
【請求項7】
コンピュータが実行する、
取引に関する書類の電子データである書類データを取得するステップと、
複数の種別の異なる書類の書類データを含む複数の書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データ
であって、前記書類の種別ごとに異なる種類の情報を含む前記要約データを生成するステップと、
書類データが示す書類の種別と当該書類データから抽出した前記要約データとを入力すると、クラスタを生成する機械学習モデルに、前記複数の要約データを入力することにより、前記複数の要約データを関連する案件ごとに分割したクラスタを生成するステップと、
を有する情報処理方法。
【請求項8】
コンピュータが実行する、
取引に関する書類の電子データである書類データを取得するステップと、
複数の種別の異なる書類の書類データを含む複数の書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成するステップと、
前記複数の要約データを関連する案件ごとに分割したクラスタを生成するステップと、
関連する案件を判定する対象の書類データである対象書類データを取得するステップと、
対象書類データに対応する前記要約データである対象要約データを生成するステップと、
クラスタを生成するステップにおいて生成されたクラスタに基づいて、前記対象要約データに対応する書類が関連する案件を特定するステップと、
特定された案件に関連する書類データを出力するステップと、
を有する情報処理方法。
【請求項9】
コンピュータに、
取引に関する書類の電子データである書類データを取得するステップと、
複数の種別の異なる書類の書類データを含む複数の書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データ
であって、前記書類の種別ごとに異なる種類の情報を含む前記要約データを生成するステップと、
書類データが示す書類の種別と当該書類データから抽出した前記要約データとを入力すると、クラスタを生成する機械学習モデルに、前記複数の要約データを入力することにより、前記複数の要約データを関連する案件ごとに分割したクラスタを生成するステップと、
を実行させるプログラム。
【請求項10】
コンピュータに、
取引に関する書類の電子データである書類データを取得するステップと、
複数の種別の異なる書類の書類データを含む複数の書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成するステップと、
前記複数の要約データを関連する案件ごとに分割したクラスタを生成するステップと、
関連する案件を判定する対象の書類データである対象書類データを取得するステップと、
対象書類データに対応する前記要約データである対象要約データを生成するステップと、
クラスタを生成するステップにおいて生成されたクラスタに基づいて、前記対象要約データに対応する書類が関連する案件を特定するステップと、
特定された案件に関連する書類データを出力するステップと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
予め教師データに基づいた機械学習を行い、取引明細情報に対応した勘定科目の組み合わせを選定することを学習したAI(Artificial Intelligence)を用いて仕訳を行う会計処理装置が知られている(例えば特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、先行技術が対象とする会計処理においては、仕訳の前処理として経理担当者が関連する書類を参照して納品の事実を確認するとともに、契約又は発注内容、納品内容及び請求内容が一致することを確認し、不適正な経理処理が無いかを確認する必要があり、社内に散在する書類の確認作業に手間がかかっていた。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、取引書類の確認の手間を削減できるよう、取引における関連書類を容易に紐づけできるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様の情報処理装置においては、取引に関する書類の電子データである書類データを取得する取得部と、複数の種別の異なる書類の書類データを含む複数の前記書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成する要約生成部と、前記複数の要約データを関連する案件ごとに分割したクラスタを生成するクラスタ生成部と、を有する。
【0007】
前記要約生成部は、前記書類データに含まれる取引内容を示す情報であって、同一の取引を示す他の書類データにおける取引内容と関連付けるための情報を抽出した要約データを生成してもよい。
【0008】
前記要約生成部は、前記書類の種別ごとに異なる種類の情報を含む前記要約データを生成し、前記情報処理装置は、書類データが示す書類の種別と当該書類データから抽出した前記要約データとを入力すると、前記クラスタを生成する機械学習モデルを記憶する記憶部をさらに有し、前記クラスタ生成部は、前記複数の要約データを前記機械学習モデルに入力し、前記クラスタを生成してもよい。
【0009】
前記取得部は、関連する案件を判定する対象の書類データである対象書類データをさらに取得し、前記要約生成部は、対象書類データに対応する前記要約データである対象要約データを生成し、前記情報処理装置は、前記クラスタ生成部が生成したクラスタに基づいて、前記対象要約データに対応する書類が関連する案件を特定する特定部と、前記特定部が特定した案件に関連する書類データを出力する出力部と、をさらに有してもよい。
【0010】
表示対象の書類データの選択を受付ける受付部をさらに有し、前記情報処理装置は、前記受付部が受付けた書類データが属するクラスタと所定の関係にある書類データを、当該書類データと関連する候補である候補書類データとして特定する特定部と、前記表示対象の書類データと、前記候補書類データと、を関連付けて出力する出力部と、をさらに有してもよい。
【0011】
仕訳対象の書類データの選択を受付ける受付部と、前記仕訳対象の書類データと、当該書類データが属するクラスタに対応する他の書類データと、に含まれる情報に基づいて前記書類データが示す取引を仕訳した仕訳データを生成する仕訳データ生成部と、をさらに有してもよい。
【0012】
前記仕訳データ生成部は、仕訳対象の書類データに含まれる項目と、当該書類データが属する前記クラスタに対応する他の書類データに含まれる所定の項目であって、当該書類データの書類の種別に対応する前記所定の項目と、に基づいて前記書類データが示す取引を仕訳した仕訳データを生成してもよい。
【0013】
書類データと、当該書類データが示す取引についての仕訳を示す仕訳データを関連付けて記憶する記憶部と、仕訳対象の書類データの選択を受付ける受付部と、前記仕訳対象の書類データと、当該書類データが属する前記クラスタと所定の関係にあるクラスタに属する書類データに関連付けられた前記仕訳データと、に基づいて、前記仕訳対象の書類データについての前記仕訳データを生成する仕訳データ生成部と、をさらに有してもよい。
【0014】
本発明の第2の態様の情報処理方法においては、コンピュータが実行する、取引に関する書類の電子データである書類データを取得するステップと、複数の種別の異なる書類の書類データを含む複数の前記書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成するステップと、前記複数の要約データを関連する案件ごとに分割したクラスタを生成するステップと、を有する。
【0015】
本発明の第3の態様のプログラムにおいては、コンピュータに、取引に関する書類の電子データである書類データを取得するステップと、複数の種別の異なる書類の書類データを含む複数の前記書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成するステップと、前記複数の要約データを関連する案件ごとに分割したクラスタを生成するステップと、を実行させる。
【発明の効果】
【0016】
本発明によれば、取引における関連書類を容易に紐づけすることができる。
【図面の簡単な説明】
【0017】
【
図1】情報処理システムSの概要を説明するための図である。
【
図2】情報処理装置1の構成を示すブロック図である。
【
図4】クラスタ情報のデータ構造の一例を示す図である。
【
図5】情報処理装置1における処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0018】
[情報処理システムSの概要]
図1は、情報処理システムSの概要を説明するための図である。
図1(a)を参照して情報処理システムSの構成を説明する。情報処理システムSは、取引書類を授受し、授受した取引書類を処理するためのシステムである。情報処理システムSは、情報処理装置1及び情報端末2を有する。
【0019】
情報処理装置1は、取引書類を電子的にやりとりし、取引書類を処理するための装置である。情報処理装置1は、一例としてサーバである。情報処理装置1は、取引書類を蓄積し、蓄積した取引書類をクラスタリングすることで、同一の取引に関連する書類を関連付ける。情報処理装置1は、クラスタに属する他の取引書類の情報に基づいて、受領した請求書等を仕訳してもよい。
【0020】
情報端末2は、経理処理の担当者が使用する端末である。情報端末2は、一例として、スマートフォン、タブレット又はパーソナルコンピュータである。情報端末2は、一例として、情報処理装置1に処理対象の書類を送信する。一例として、情報端末2は、情報処理装置1からの制御に基づいて画面を表示し、ユーザの操作内容を情報処理装置1に送信する。
【0021】
図1(b)を参照して情報処理システムSにおける処理を説明する。情報処理装置1は、書類データを取得する。書類データは、取引に関する書類を電子化した電子データである。書類データは、一例として、見積書、稟議書、契約書、発注書、納品書及び請求書等を電子化したデータである。
【0022】
書類データには取引書類の関連付けるために必要のない情報が含まれる。一例として、見積書においては、見積もりの担当者の情報、見積書番号、見積もりの有効期間等の情報が含まれるが、これらは取引書類の紐づけには必ずしも必要ではない情報である。また、契約書おいては、取引書類の紐づけには影響しない様々な条項(例えば、損害賠償、損害遅延金、危険負担、解除等の条項)が含まれうる。そこで、このような情報を取り除いて書類同士の関連性を判定することでより書類同士の関連付けの精度を向上させることができる。
【0023】
情報処理装置1は、取得した書類データに基づいて要約データD2を生成する。要約データD2は、書類データに含まれる情報のうち、取引の内容であって、他の書類データと関連付けるための情報を抽出した情報である。要約データD2は、同一の取引について発行された異なる種別の書類データを関連付けるための情報を抽出して生成されたデータである。すなわち、要約データD2は、同一の取引について発行された他の書類データにおける取引内容と関連付けるための情報を含む。要約データD2は、複数の種別の異なる書類の書類データを含む複数の書類データそれぞれから各書類を関連付けるための情報を含む。要約データD2は、一例として、取引の相手方、取引日、書類発行日、取引対象物及び数量等の情報を含む。
【0024】
情報処理装置1は、生成した要約データに基づいて、関連する案件ごとに分割したクラスタ(C1、C2、C3、C4)を生成する。情報処理装置1は、取引書類から生成された要約データ同士の類似度に基づいてクラスタを生成する。この結果、取引の当事者や対象物が同じで日付が近い書類は関連する取引書類と推定されることから、情報処理装置1は、一連の取引(案件とも言う)ごとに取引書類(要約データ)を分割したクラスタを生成することができる。
【0025】
情報処理装置1は、情報端末2から受付けた書類データの選択に基づいて、当該書類データと同一のクラスタに属する書類データを選択された書類データと関連付けて情報端末2に表示させてもよい。
【0026】
情報処理システムSがこのように構成されることで、取引における関連書類を容易に紐づけすることができる。という効果を奏する。
【0027】
[情報処理装置1の構成]
図2は、情報処理装置1の構成を示すブロック図である。情報処理装置1は、通信部11、記憶部12及び制御部13を有する。制御部13は、取得部131、要約生成部132、クラスタ生成部133、特定部134、出力部135、受付部136及び仕訳データ生成部137を有する。
【0028】
通信部11は、ネットワークを介して他の装置とデータの送受信をするための通信インターフェースである。記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、SSD(Solid State Drive)、ハードディスクドライブ等を含む記憶媒体である。記憶部12は、制御部13が実行するプログラムを予め記憶している。記憶部12は、複数の書類データそれぞれから抽出した要約データを入力すると、複数の要約データそれぞれが属するクラスタを生成する機械学習モデルを記憶する。当該機械学習モデルは、書類データが示す書類の種別をさらに入力として受付けてもよい。
【0029】
制御部13は、例えばCPU(Central Processing Unit)等のプロセッサである。制御部13は、記憶部12に記憶されたプログラムを実行することにより、取得部131、要約生成部132、クラスタ生成部133、特定部134、出力部135、受付部136及び仕訳データ生成部137として機能する。
【0030】
取得部131は、取引に関する書類の電子データである書類データを取得する。取得部131は、一例として不図示の外部装置から書類データを取得してもよいし、記憶部12が記憶する書類データを取得してもよい。取得部131は、情報端末2が書類データをアップロードすることで、書類データを取得してもよい。取得部131は、書類の種別と関連付けて書類データを取得してもよいし、書類データに含まれる項目に基づいて取得した書類の種別を特定してもよい。
【0031】
要約生成部132は、複数の種別の異なる書類の書類データを含む複数の書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成する。
図3は、要約データの一例を示す図である。要約データは、一例として、取引の目的(Why)書類番号、納品予定日(When)、取引の相手方(Who)、取引の対象物(What)、取引量(How many)取引金額(How much)等の5W2Hを示す情報を含む。要約データは受領した書類の種別に応じて異なる項目が含まれていてもよい。要約データは、見積番号、契約書番号、起案番号、決済番号、納品番号、請求書番号等の取引に関連する書類同士を関連付けるための情報を含んでいてもよい。
【0032】
一例として、書類の種別ごとに要約データとして抽出すべき情報が予め定められていてもよい。この場合、記憶部12は、書類の種別と、書類の種別ごとに要約データにおいて抽出すべき項目と、を関連付けた項目情報を記憶する。要約生成部132は、項目情報を参照し、取得部131が取得した書類データに対応する項目を抽出し、要約データを生成する。
【0033】
また、記憶部12は、書類の種別を含む書類データと、書類の種別ごとに抽出する項目を教師データとして学習した学習済みモデルであって、書類データを入力すると要約データを生成する学習済みモデルを記憶していてもよい。この場合、要約生成部132は、当該学習済みモデルに書類データを入力することで、要約データを生成する。
【0034】
クラスタ生成部133は、複数の要約データを関連する案件ごとに分割したクラスタを生成する。一例として、クラスタ生成部133は、それぞれの要約データから特徴量を抽出し、抽出した特徴量同士の類似度に基づいて、クラスタリングを行い、案件ごとに分割したクラスタを生成する。一例として、クラスタ生成部133は、既知のコサイン類似度に基づいて、クラスタを生成する。特徴量は、要約データそれぞれの特徴を示すベクトルデータである。一例として、クラスタ生成部133は、特徴量空間におけるクラスタの中心からの当該書類の特徴量の距離が所定の閾値以内となるようクラスタを分割する。クラスタ生成部133は、一例として、複数の要約データを入力すると、それぞれの要約データをクラスタに分割する機械学習モデルを用いてクラスタリングを行う。クラスタ生成部133は、書類データと、当該書類データが属するクラスタと、を関連付けて出力してもよい。
【0035】
クラスタ生成部133は、書類データと当該書類データとが属するクラスタと、を関連付けたクラスタ情報を記憶部12に記憶させてもよい。
図4は、クラスタ情報のデータ構造の一例を示す図である。クラスタ情報においては、「書類データID」、「クラスタID」、「書類種別」を含む。クラスタ情報においては、それぞれの書類の要約データに含まれる情報が含まれていてもよい。「書類データID」は、書類データを識別するためのID(IDentification)である。「クラスタID」は、当該書類データが属するクラスタを識別するためのIDである。「書類種別」は、当該書類データの種別である。
【0036】
情報処理装置1がこのように構成されることで、取引における関連書類を容易に紐づけすることができるという効果を奏する。
【0037】
入力された書類データに要約データを生成するために不足する情報がある場合、要約生成部132は、他の項目に基づいて、不足する項目のデータを生成してもよい。この場合、記憶部12が記憶する項目情報においては、要約データに含まれる項目同士の関係の定義(例えば計算式)を記憶している。項目同士の関係の定義においては例えば、消費税額は、小計額に消費税率を乗じたものであることが定義されている。そして、取得した書類データに不足する項目が有る場合、要約生成部132は、項目情報に含まれる項目同士の関係の定義に基づいて、当該不足する項目を補足するためのデータを生成する。例えば、書類データにおいて消費税額の項目が不足する場合、小計額に消費税率を乗じて消費税額を算出し、算出した消費税額の項目を追加した要約データを生成する。
【0038】
クラスタ生成部133は、取引の相手方、取引金額、取引の時期等の条件に基づいて、要約データをフィルタリングしてもよい。一例として、クラスタ生成部133は、対象の要約データのうち、同一の取引の相手方に対応する要約データを抽出し、抽出した要約データを対象にクラスタリングを行う。このようにクラスタ生成部133が構成されることで、関連する案件を紐づける精度が向上する。
【0039】
書類の種別ごとに異なる情報が含まれているため、要約データは書類の種別ごとに異なる情報を含んでいてもよい。要約生成部132は、書類の種別ごとに異なる種類の情報を含む要約データを生成する。例えば、「契約書」から抽出した要約データは、取引の相手方、取引の対象物、契約単価、契約期間等を含む。「発注書」から抽出した要約データは、発注日、取引の相手方、取引の対象物、発注数量を含む。「請求書」から抽出した要約データは、発注日、納品日、取引の相手方、取引の対象物、取引数量、単価、請求金額等を含む。クラスタ生成部133は、書類の種別を含む要約データを機械学習モデルに入力し、クラスタを生成する。
【0040】
クラスタの生成後に取得された書類データに関連する書類データを出力するよう情報処理装置1が構成されてもよい。
【0041】
取得部131は、関連する案件を判定する対象の書類データである対象書類データを取得する。要約生成部132は、上述のとおり、対象書類データに対応する要約データである対象要約データを生成する。
【0042】
特定部134は、クラスタ生成部133が生成したクラスタに基づいて、対象要約データに対応する書類が関連する案件を特定する。一例として、特定部134は、クラスタを生成した機械学習モデルに対象要約データを入力することで、当該要約データが属するクラスタを出力させ、対象要約データが属するクラスタを特定する。
【0043】
出力部135は、特定部134が特定した案件に関連する書類データを出力する。一例として、出力部135は、対象要約データに属するクラスタとして特定部134が特定したクラスタに属する他の書類データを表示するための画面を情報端末2に表示させる。
【0044】
類似するクラスタに属する書類データをユーザが閲覧できるよう情報処理装置1が構成されてもよい。
【0045】
受付部136は、表示対象の書類データの選択を受付ける。受付部136は、表示対象の書類データの選択を受付けるための画面を情報端末2に表示させる。ユーザは情報端末2を操作し、表示対象の書類データを選択するための操作をする。受付部136は、情報端末2からユーザが選択した書類データを示す情報を取得する。
【0046】
特定部134は、受付部136が受付けた書類データが属するクラスタと所定の関係にある書類データを、当該書類データと関連する候補である候補書類データとして特定する。具体的には、特定部134は、選択された表示対象の書類と所定の距離以内のクラスタに属する書類データを候補書類データとして特定する。
【0047】
出力部135は、表示対象の書類データと、候補書類データと、を関連付けて出力する。出力部135は、表示対象の書類データと特定部134が特定した候補書類データと、を表示するための画面を情報端末2に表示させる。
【0048】
受付部136は、仕訳対象の書類データの選択を受付ける。受付部136は、仕訳対象の書類の選択を受付けるための画面を情報端末2に表示させ、ユーザの選択操作を受付ける。仕訳データ生成部137は、仕訳対象の書類データと、当該書類データが属するクラスタに対応する他の書類データと、に含まれる情報に基づいて書類データが示す取引を仕訳した仕訳データを生成する。具体的には、仕訳データ生成部137は、仕訳対象の書類データに含まれる項目と、当該書類データが属するクラスタに対応する他の書類データに含まれる所定の項目であって、当該書類データの書類の種別に対応する所定の項目と、に基づいて書類データが示す取引を仕訳した仕訳データを生成する。一例として、記憶部12は、仕訳データの作成を行う際、他の書類から抽出すべき項目を記憶している。一例として、記憶部12は、稟議書に含まれる経理コードや契約の目的を取得することを記憶している。仕訳データ生成部133は、記憶部12を参照し、他の書類から抽出する項目を特定し、仕訳対象の書類データと同一のクラスタに属する書類データを参照し、当該項目を取得する。そして、仕訳データ生成部137は、仕訳対象の書類データに含まれる金額等の項目と、他の書類から取得した経理コード等の項目に基づいて、仕訳データを作成する。出力部135は、作成された仕訳データを情報端末2に表示させてもよい。
【0049】
一例として、記憶部12は、複数の種別の異なる書類データと、正解の仕訳データを教師データとして学習した学習済みモデルであって、複数の種別の異なる書類データを入力として、仕訳データを出力するよう学習された学習済みモデルを記憶していてもよい。仕訳データ生成部137は、仕訳対象の書類データと、当該書類データと同一のクラスタに属する書類データと、を学習済みモデルに入力し、仕訳データを出力させてもよい。
【0050】
連続する取引の場合、既に仕訳を行った請求書が同一のクラスタに属する場合がある。そこで、同一のクラスタに属する他の書類データに基づいて、書類データの仕訳処理をするよう情報処理装置1が構成されてもよい。
【0051】
この場合、記憶部12は、書類データと、当該書類データが示す取引についての仕訳を示す仕訳データを関連付けて記憶する。一例として、記憶部12は、書類データIDと、当該書類データIDが示す書類データについて作成された仕訳データと、を関連付けて記憶している。仕訳データにおいては、一例として、摘要、勘定科目、各種の経理コード等を含む。
【0052】
仕訳データ生成部137は、仕訳対象の書類データと、当該書類データが属するクラスタと所定の関係にあるクラスタに属する書類データに関連付けられた仕訳データと、に基づいて、仕訳対象の書類データについての仕訳データを生成する。仕訳データ生成部137は、記憶部12を参照し、選択された書類データと同一のクラスタに属する書類データに作成済みの仕訳データがあるか否かを判定する。同一のクラスタに属する書類データについて作成された仕訳データがある場合、仕訳データ作成部137は、記憶部12が記憶する同一のクラスタに属する書類データについて作成済みの仕訳データに基づいて、選択された仕訳対象の書類データが示す取引についての仕訳データを作成する。仕訳データ生成部137は、同一のクラスタに属する書類データに加えて、クラスタ同士の距離が所定の閾値以内にあるクラスタに属する書類データについて作成された仕訳データに基づいて、仕訳対象の書類データが示す取引についての仕訳データを作成してもよい。
【0053】
情報処理装置1がこのように構成されることで、仕訳作業を行う手間を軽減することができる。
【0054】
[情報処理装置1における処理の流れ]
図5は、情報処理装置1における処理の流れを示すフローチャートである。
図5に示すフローチャートは、クラスタリングを行う指示を受付けた時点から開始している。
【0055】
取得部131は、複数の書類データを取得する(S01)。要約生成部132は、取得した複数の書類データそれぞれの要約データを生成する(S02)。クラスタ生成部133は、要約生成部132が生成した要約データを関連する案件ごとに分割したクラスタを生成する(S03)。
【0056】
受付部136は、表示対象の書類データの選択を受付ける(S04)。出力部135は、選択された書類データと同一のクラスタに属する書類データとを関連付けて情報端末2に表示させる(S05)。そして情報処理装置1は、処理を終了する。
【0057】
[本実施の形態における効果]
以上説明したとおり、情報処理装置1においては、取引における関連書類を容易に紐づけすることができるという効果を奏する。
【0058】
以上、実施の形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0059】
1 情報処理装置
2 情報端末
11 通信部
12 記憶部
13 制御部
131 取得部
132 要約生成部
133 クラスタ生成部
134 特定部
135 出力部
136 受付部
137 仕訳データ生成部
【要約】
取引に関する書類の電子データである書類データを取得する取得部131と、複数の種別の異なる書類の書類データを含む複数の書類データそれぞれから各書類を関連付けるための情報を抽出した要約を示す複数の要約データを生成する要約生成部132と、複数の要約データを関連する案件ごとに分割したクラスタを生成するクラスタ生成部133と、を有する情報処理装置1である。要約生成部132は、書類データに含まれる取引内容を示す情報であって、同一の取引を示す他の書類データにおける取引内容と関連付けるための情報を抽出した要約データを生成してもよい。