(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024151586
(43)【公開日】2024-10-25
(54)【発明の名称】会計データ変換装置、会計データ変換方法、学習装置、学習方法、及びプログラム
(51)【国際特許分類】
G06Q 40/12 20230101AFI20241018BHJP
【FI】
G06Q40/12
G06Q40/12 420
【審査請求】有
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023065047
(22)【出願日】2023-04-12
(11)【特許番号】
(45)【特許公報発行日】2023-12-05
(71)【出願人】
【識別番号】322006076
【氏名又は名称】弥生株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】牛尾 哲朗
【テーマコード(参考)】
5L040
5L055
【Fターム(参考)】
5L040BB00
5L040BB64
5L055BB00
5L055BB64
(57)【要約】 (修正有)
【課題】取引データに対応する会計データを生成する会計データ変換装置、会計データ変換方法、学習装置、学習方法及びプログラムを提供する。
【解決手段】会計管理システム10において、会計データ変換装置は、ユーザ82との取引の摘要を含む取引データを取得する取引データ取得部と、前記取引データに含まれる前記摘要に固有表現が含まれる場合に、前記摘要に含まれる前記固有表現を、固有表現であることを示す固有情報に変更するデータ変更部と、前記データ変換部によって前記固有表現が前記固有情報に変換された前記取引データに基づいて、前記取引データに対応する勘定科目を選択する科目選択部と、前記科目選択部によって選択された前記勘定科目を含む、前記取引データに対応する会計データを生成する会計データ生成部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
取引の摘要を含む取引データを取得する取引データ取得部と、
前記取引データに含まれる前記摘要に固有表現が含まれる場合に、前記摘要に含まれる前記固有表現を、固有表現であることを示す固有情報に変更するデータ変更部と、
前記データ変更部によって前記固有表現が前記固有情報に変更された前記取引データに基づいて、前記取引データに対応する勘定科目を選択する科目選択部と、
前記科目選択部によって選択された前記勘定科目を含む、前記取引データに対応する会計データを生成する会計データ生成部と
を備える会計データ変換装置。
【請求項2】
前記データ変更部は、前記摘要に含まれる前記固有表現が、複数種類の固有情報のうちのいずれの固有情報に対応するかを判定し、前記摘要に含まれる前記固有表現を、対応する前記固有情報に変更する、請求項1に記載の会計データ変換装置。
【請求項3】
前記データ変更部は、前記摘要に含まれる前記固有表現が、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、及び固有物名のいずれに対応するかを判定する、請求項2に記載の会計データ変換装置。
【請求項4】
前記データ変更部は、前記取引データに含まれる前記摘要に前記固有表現が含まれる場合に、前記摘要の前記固有表現以外の部分に基づいて、前記摘要に含まれる前記固有表現を前記固有情報に変更するか否かを判定し、変更すると判定した場合に、前記摘要に含まれる前記固有表現を前記固有情報に変更する、請求項1から3のいずれか一項に記載の会計データ変換装置。
【請求項5】
前記データ変更部によって前記固有表現が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成部
を更に備え、
前記科目選択部は、前記学習モデル生成部によって生成された前記学習モデルに、前記取引データに含まれる前記摘要を入力し、前記学習モデルから出力された前記勘定科目を選択する、請求項1から3のいずれか一項に記載の会計データ変換装置。
【請求項6】
コンピュータを、
取引の摘要を含む取引データを取得する取引データ取得部、
前記取引データに含まれる前記摘要に固有表現が含まれる場合に、前記摘要に含まれる前記固有表現を、固有表現であることを示す固有情報に変更するデータ変更部、
前記データ変更部によって前記固有表現が前記固有情報に変更された前記取引データに基づいて、前記取引データに対応する勘定科目を選択する科目選択部、及び
前記科目選択部によって選択された前記勘定科目を含む、前記取引データに対応する会計データを生成する会計データ生成部
として機能させるためのプログラム。
【請求項7】
コンピュータによって実行される会計データ変換方法であって、
取引の摘要を含む取引データを取得する取引データ取得段階と、
前記取引データに含まれる前記摘要に固有表現が含まれる場合に、前記摘要に含まれる前記固有表現を、固有表現であることを示す固有情報に変更するデータ変更段階と、
前記データ変更段階において前記固有表現が前記固有情報に変更された前記取引データに基づいて、前記取引データに対応する勘定科目を選択する科目選択段階と、
前記科目選択段階において選択した前記勘定科目を含む、前記取引データに対応する会計データを生成する会計データ生成段階と
を備える会計データ変換方法。
【請求項8】
取引の摘要に固有表現が含まれる場合に、前記摘要に含まれる前記固有表現を、固有表現であることを示す固有情報に変更するデータ変更部と、
前記データ変更部によって前記固有表現が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成部と
を備える学習装置。
【請求項9】
コンピュータを、
取引の摘要に固有表現が含まれる場合に、前記摘要に含まれる前記固有表現を、固有表現であることを示す固有情報に変更するデータ変更部、及び
前記データ変更部によって前記固有表現が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成部
として機能させるためのプログラム。
【請求項10】
コンピュータによって実行される学習方法であって、
取引の摘要に固有表現が含まれる場合に、前記摘要に含まれる前記固有表現を、固有表現であることを示す固有情報に変更するデータ変更段階と、
前記データ変更段階において前記固有表現が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成段階と
を備える学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、会計データ変換装置、会計データ変換方法、学習装置、学習方法、及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、取引の内容を表す取引データと当該取引の内容を仕訳した勘定科目を含む過去の仕訳データとを用いて、取引の内容を所定の勘定科目へ仕訳するための対応関係を表す仕訳ルールの作成を支援する仕訳ルール作成支援装置について記載されている。
[先行技術文献]
[特許文献]
[特許文献1]特開2019-191749号公報
【発明の概要】
【0003】
本発明の第1の態様によれば、会計データ変換装置が提供される。前記会計データ変換装置は、取引の摘要を含む取引データを取得する取引データ取得部を備えてよい。前記会計データ変換装置は、前記取引データに含まれる前記摘要に固有表現が含まれる場合に、前記摘要に含まれる前記固有表現を、固有表現であることを示す固有情報に変更するデータ変更部を備えてよい。前記会計データ変換装置は、前記データ変換部によって前記固有表現が前記固有情報に変換された前記取引データに基づいて、前記取引データに対応する勘定科目を選択する科目選択部を備えてよい。前記会計データ変換装置は、前記科目選択部によって選択された前記勘定科目を含む、前記取引データに対応する会計データを生成する会計データ生成部を備えてよい。
【0004】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0005】
【
図1】会計管理システム10の一例を概略的に示す。
【
図2】学習装置100の機能構成の一例を概略的に示す。
【
図3】学習装置100による処理の流れの一例を概略的に示す。
【
図4】会計データ変換装置200の機能構成の一例を概略的に示す。
【
図5】会計データ変換装置200による処理の流れの一例を概略的に示す。
【
図6】学習装置100又は会計データ変換装置200として機能するコンピュータ1200のハードウェア構成の一例を概略的に示す。
【発明を実施するための形態】
【0006】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0007】
図1は、会計管理システム10の一例を概略的に示す。会計管理システム10は、学習装置100及び会計データ変換装置200を備える。学習装置100と会計データ変換装置200とは、異なる装置であってよい。学習装置100と会計データ変換装置200とは、一つの装置によって実現されてもよい。学習装置100は、複数の装置によって実現されてもよい。会計データ変換装置200は、複数の装置によって実現されてもよい。
【0008】
会計管理システム10は、業務サービス提供装置20を更に備えてもよい。業務サービス提供装置20は、学習装置100及び会計データ変換装置200とは異なる装置であってよい。業務サービス提供装置20と学習装置100とが、一つの装置によって実現されてもよい。業務サービス提供装置20と会計データ変換装置200とが、一つの装置によって実現されてもよい。業務サービス提供装置20、学習装置100、及び会計データ変換装置200が一つの装置によって実現されてもよい。
【0009】
会計管理システム10は、会計サービス提供装置30を更に備えてもよい。会計サービス提供装置30は、学習装置100及び会計データ変換装置200とは異なる装置であってよい。会計サービス提供装置30と学習装置100とが、一つの装置によって実現されてもよい。会計サービス提供装置30と会計データ変換装置200とが、一つの装置によって実現されてもよい。会計サービス提供装置30、学習装置100、及び会計データ変換装置200が一つの装置によって実現されてもよい。
【0010】
学習装置100、会計データ変換装置200、業務サービス提供装置20、及び会計サービス提供装置30が一つの装置によって実現されてもよい。ここでは、学習装置100、会計データ変換装置200、業務サービス提供装置20、及び会計サービス提供装置30が異なる装置である場合を主に例に挙げる。
【0011】
学習装置100、会計データ変換装置200、業務サービス提供装置20、及び会計サービス提供装置30は、ネットワーク50を介して通信する。ネットワーク50は、クラウドネットワークを含んでよい。ネットワーク50は、インターネットを含んでよい。ネットワーク50は、移動体通信ネットワークを含んでもよい。ネットワーク50は、LAN(Local Area Network)等の専用網を含んでもよい。学習装置100と会計データ変換装置200とは、ネットワーク50を介さずに、直接通信してもよい。
【0012】
業務サービス提供装置20は、取引の主体であるユーザ82の取引データを管理する。ユーザ82は、事業者である。ユーザ82は、個人事業主であっても、法人であってもよい。取引データは、取引日、取引先、税区分、金額、収入であるか支出であるかを示す収支識別データ、消費税額、及び摘要を含んでよい。業務サービス提供装置20は、例えば、ユーザ82の通信端末80から、ユーザ82の取引データを受信する。
【0013】
業務サービス提供装置20は、ネットワーク50を介して通信端末80と通信してよい。通信端末80は、通信可能な端末であれば任意の端末であってよい。例えば、通信端末80は、スマートフォン等の携帯電話、タブレット端末、及びPC(Personal Computer)等である。業務サービス提供装置20は、ユーザ82の取引データを、ユーザ82の会計情報を管理する会計事務所等から取得してもよい。
【0014】
業務サービス提供装置20は、取引データを学習装置100に提供してよい。学習装置100は、業務サービス提供装置20から、ユーザ82の取引データを受信してよい。学習装置100は、さらに、ユーザ82の取引データに対して実際に仕訳が行われて生成された、取引データに対応する会計データを取得する。当該会計データは、取引に対応する勘定科目を含む。
【0015】
学習装置100は、取得したデータを用いた機械学習を実行することによって、仕訳を行う学習モデルを生成する。従来、取引の摘要と、取引に対応する勘定科目とを学習データとして、BERTのような自然言語処理モデルのパラメータを調整することによって、取引の摘要から取引に対応する勘定科目を推論する学習モデルが生成されていた。
【0016】
本実施形態に係る学習装置100は、取引の摘要に固有表現が含まれる場合に、摘要に含まれる固有表現を、固有表現であることを示す固有情報に変更し、変更後の摘要と、取引に対応する勘定科目とを学習データとして、取引の摘要から取引に対応する勘定科目を推論する学習モデルを生成する。例えば、学習装置100は、摘要を複数の単語に分割した上で、単語毎に固有表現であるか否かを判定して、固有表現であると判定した単語を固有情報に変更する。
【0017】
固有情報は、固有表現であることを示すことができれば、どのような情報であってもよい。例えば、固有情報は、「_固有表現_」というワードである。
【0018】
固有表現の例として、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、及び固有物名等が挙げられる。学習装置100は、例えば、摘要に地名が含まれる場合に、当該地名を「_固有表現_」に変更する。
【0019】
学習装置100は、例えば、摘要を形態素解析して、固有表現の抽出を行い、固有表現を「_固有表現_」に変更する。具体例として、摘要が「ETC 特別料金(東京→大阪)」である場合、学習装置100は、摘要を、「ETC」、「特別」、「料金」、「(」、「東京」、「→」、「大阪」、「)」に分解する。そして、学習装置100は、東京と大阪が地名であると判定して、「東京」及び「大阪」の両方を「_固有表現_」に変更する。学習装置100は、変更後の「ETC」、「特別」、「料金」、「(」、「_固有表現_」、「→」、「_固有表現_」、「)」を、学習に用いる。
【0020】
人名や地名等の固有表現は無数のパターンがあり、学習しづらい面があると同時に、その固有表現自体に仕訳に有益な情報が含まれていないケースが多い。本実施形態に係る学習装置100によれば、例えば、「ETC 特別料金(東京→大阪)」、「ETC 特別料金(名古屋→京都)」、「ETC 特別料金(鹿児島→熊本)」が、すべて同じデータに集約されることになる。これにより、データクレンジングの効果が得られる。また、新規摘要への対応容易性の向上に貢献することが出来る。
【0021】
学習装置100は、複数種類の固有情報を用いてもよい。学習装置100は、摘要に含まれる固有表現が、複数種類の固有情報のうちのいずれの固有情報に対応するかを判定し、摘要に含まれる表現を、対応する固有情報に変更する。例えば、学習装置100は、摘要に含まれる固有表現が地名であると判定した場合に、当該固有表現を「_地名_」に変更する。複数種類の固有情報を用いることによって、一つの固有情報を用いる場合と比較して、いわゆる文脈を学習に反映できる可能性があり、勘定科目の正解率を向上させることができる場合がある。なお、勘定科目の正解とは、取引に対して適切な勘定科目であり、正解率とは、適切な勘定科目を選択する確率である。
【0022】
会計データ変換装置200は、学習装置100によって生成された学習モデルを、学習装置100から受信して記憶する。会計データ変換装置200は、業務サービス提供装置20から、ユーザ82の取引データを受信する。
【0023】
会計データ変換装置200は、学習装置100から受信して記憶している学習モデルを用いて、会計データ変換装置200から取得した取引データに対応する会計データを生成する。会計データ変換装置200は、取引データに含まれる摘要を学習モデルに入力し、学習モデルから出力された勘定科目を選択し、選択した勘定科目を含む会計データを生成してよい。会計データ変換装置200は、生成した会計データを、会計サービス提供装置30に出力してよい。
【0024】
会計サービス提供装置30は、会計データ変換装置200から取得した会計データを管理する。会計データ変換装置200は、ユーザ82の会計データを用いて、ユーザ82に対して会計サービスを提供する。
【0025】
図2は、学習装置100の機能構成の一例を概略的に示す。学習装置100は、データ取得部102、データ記憶部104、データ変更部106、学習モデル生成部108、及び学習モデル送信部110を備える。
【0026】
データ取得部102は、各種データを取得する。データ取得部102は、ユーザ82の取引データを取得する。データ取得部102は、業務サービス提供装置20から取引データを取得してよい。
【0027】
データ取得部102は、ユーザ82の取引データに対して実際に仕訳が行われて生成された、取引に対応する勘定科目を含む、取引データに対応する会計データを取得する。データ取得部102は、業務サービス提供装置20から当該会計データを取得してよい。データ取得部102は、業務サービス提供装置20以外から当該会計データを取得してもよい。
【0028】
データ取得部102は、取得したデータから生成した学習データを学習データ記憶部104に記憶させる。学習データは、取引の摘要と、当該取引に対応する勘定科目とを含む。
【0029】
データ変更部106は、データ記憶部104が記憶する学習データに含まれる取引の摘要に対して、データ変更処理を実行する。
【0030】
データ変更部106は、例えば、摘要に固有表現が含まれているか否かを判定し、含まれている場合に、固有表現を固有情報に変更する。データ変更部106は、固有表現の種類に関わらず、固有表現を、固定の固有情報に変更してよい。
【0031】
データ変更部106は、固有表現を、固有表現の種類に応じた固有情報に変更してもよい。データ変更部106は、摘要に含まれる固有表現が、複数種類の固有情報のうちのいずれの固有情報に対応するかを判定し、摘要に含まれる固有表現を、対応する固有情報に変更してよい。例えば、データ変更部106は、摘要に含まれる固有表現が、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、及び固有物名のいずれに対応するかを判定する。データ変更部106は、例えば、予め登録された固有表現の辞書データを用いることによって、摘要に固有表現が含まれるかと、固有表現の種類とを判定してよい。
【0032】
データ変更部106は、摘要に固有表現が含まれる場合に、摘要の固有表現以外の部分に基づいて、摘要に含まれる固有表現を固有情報に変更するか否かを判定し、変更すると判定した場合に、摘要に含まれる固有表現を固有情報に変更し、変更しないと判定した場合、摘要に含まれる固有表現を固有情報に変更しないようにしてもよい。
【0033】
例えば、データ変更部106は、摘要に固有表現以外の単語が含まれていない場合、すなわち、摘要の中に固有表現のみが含まれている場合、固有表現を固有情報に変更しないと判定する。
【0034】
例えば、データ変更部106は、摘要に固有表現及び他の単語が含まれる場合において、摘要における固有表現の割合が、予め定められた閾値より高い場合、固有表現を固有情報に変更しないと判定する。
【0035】
データ変更部106は、固有情報に変更する固有表現と、固有情報に変更しない固有表現とが登録された登録データを予め記憶しておき、当該登録データを用いて、摘要に含まれる固有表現を固有情報に変更するか否かを判定してもよい。当該登録データは、例えば、会計管理システム10の管理者等によって登録される。会計管理システム10を利用することによって、固有情報に変更した方がよい固有表現、固有情報に変更しない方がよい固有表現の知見が蓄積されることになり、会計管理システム10の管理者等は、当該知見に基づいて、登録データを生成し得る。
【0036】
データ記憶部104は、データ変更部106によって学習データの内容が変更された場合に、変更後の学習データに加えて、変更前の学習データを記憶してよい。
【0037】
学習モデル生成部108は、学習データ記憶部104に記憶されている学習データを用いた機械学習によって、取引の摘要を入力とし、取引に対応する勘定科目を出力とする学習モデルを生成する。
【0038】
学習モデル生成部108は、データ変更部106によって摘要の固有表現が固有情報に変更された学習データを用いた機械学習によって学習モデルを生成してよい。当該学習モデルを、変更後学習モデルと記載する場合がある。
【0039】
学習モデル生成部108は、摘要のうち、固有情報の推論結果への影響が、摘要のうちの他の単語と比較して低くなるように、学習を実行してもよい。例えば、学習モデル生成部108は、固有情報に紐づく重み行列の初期値を、他の単語に紐づく重み行列の初期値と比較して小さくしてよい。例えば、学習モデル生成部108は、固有情報に紐づく重み行列の学習率を、他の単語に紐づく重み行列の学習率と比較して低くしてよい。例えば、学習データの総量が少ない等の理由によって学習モデルの学習が十分に行えない場合、固有情報の出現による推論への影響が不当に大きくなってしまう場合があるが、これらによって、その影響を適切に低減することができる。
【0040】
学習モデル生成部108は、固有情報の推論結果への影響が、摘要のうちの他の単語と比較して低くなるようにしつつ、固有情報の種類毎の推論結果への影響が変わるように学習を実行してもよい。例えば、学習モデル生成部108は、固有情報に紐づく重み行列の初期値を、固有情報の種類毎に変更する。例えば、学習モデル生成部108は、固有情報に紐づく重み行列の学習率を、固有情報の種類毎に変更する。
【0041】
学習モデル生成部108は、学習データを用いて、予め記憶しておいた自然言語処理モデルのパラメータを更新することによって、取引の摘要を入力とし、勘定科目を出力とする学習モデルを生成してもよい。すなわち、学習モデルは、学習データを用いてパラメータが更新された自然言語処理モデルであってよい。学習モデル生成部108は、摘要を自然言語処理モデルに入力させて、取引データに対応する勘定科目を選択し、学習データと選択結果とを比較して、自然言語処理モデルのパラメータを更新してよい。学習モデル生成部108は、選択結果が、学習データに含まれる勘定科目と一致するようになるように、自然言語処理モデルのパラメータを更新する。
【0042】
学習モデル生成部108は、出力する勘定科目が、借方の勘定科目であるのか、貸方の勘定科目であるのかを示す貸借データを更に自然言語処理モデルに入力させてもよい。取引に対応する借方の勘定科目と貸方の勘定科目とは異なることになり、貸借データを自然言語処理モデルに入力することによって、この相違を反映した学習を実行することができ、勘定科目の正解率を向上させることができる。学習モデル生成部108が生成する学習モデルは、借方の勘定科目、及び貸方の勘定科目の両方を出力してもよい。この場合、学習モデル生成部108は、借方の勘定科目及び貸方の勘定科目の両方を示す貸借データを自然言語処理モデルに入力してもよいし、貸借データを自然言語処理モデルに入力しないようにしてもよい。
【0043】
学習モデル生成部108は、データ変更部106によって摘要の固有表現が固有情報に変更された学習データと、変更前の学習データとの両方を用いた機械学習によって学習モデルを生成してもよい。当該学習モデルを、変更前後学習モデルと記載する場合がある。
【0044】
学習モデル生成部108は、データ変更部106によって摘要の固有表現が固有情報に変更された学習データを用いた機械学習による学習モデルと、変更前の学習データを用いた機械学習による学習モデルとの両方を生成してもよい。前者を変更後学習モデル、後者を変更前学習モデルと記載する場合がある。
【0045】
学習モデル送信部110は、学習モデル生成部108によって生成された学習モデルを会計データ変換装置200に送信する。学習モデル生成部108によって、変更後学習モデルが生成された場合、学習モデル送信部110は、変更後学習モデルを会計データ変換装置200に送信する。学習モデル生成部108によって、変更前後学習モデルが生成された場合、学習モデル送信部110は、変更前後学習モデルを会計データ変換装置200に送信する。学習モデル生成部108によって、変更後学習モデル及び変更前学習モデルが生成された場合、学習モデル送信部110は、変更後学習モデル及び変更前学習モデルを会計データ変換装置200に送信する。
【0046】
図3は、学習モデル生成部108による処理の流れの一例を概略的に示す。
【0047】
ステップ(ステップをSと省略して記載する場合がある。)102では、データ取得部102が、学習データを取得してデータ記憶部104に記憶させる。S202では、データ変更部106が、データ記憶部104に記憶されている学習データに対して、データ変更処理を実行する。
【0048】
S106では、学習モデル生成部108が、S104においてデータ変更処理が施された学習データを用いて、自然言語処理モデルのパラメータを更新する。学習モデル生成部108は、学習データに含まれる摘要を自然言語処理モデルに入力させて、勘定科目を選択し、学習データに含まれる勘定科目と選択結果とを比較して、自然言語処理モデルのパラメータを更新する。学習モデル生成部108は、選択結果が、学習データに含まれる勘定科目と一致するようになるように、自然言語処理モデルのパラメータを更新する。
【0049】
図4は、会計データ変換装置200の機能構成の一例を概略的に示す。会計データ変換装置200は、学習モデル取得部202、学習モデル記憶部204、取引データ取得部206、データ変更部208、科目選択部210、会計データ生成部212、及び会計データ出力部214を備える。
【0050】
学習モデル取得部202は、摘要を入力とし、勘定科目を出力とする学習モデルを取得する。学習モデル取得部202は、学習装置100から学習モデルを取得してよい。学習モデル取得部202は、学習装置100以外から学習モデルを取得してもよい。学習モデル記憶部204は、学習モデル取得部202が取得した学習モデルを記憶する。
【0051】
取引データ取得部206は、取引データを取得する。取引データ取得部206は、勘定科目を推論する対象となる取引データを取得してよい。取引データ取得部206は、例えば、業務サービス提供装置20から取引データを取得する。取引データ取得部206は、例えば、通信端末80から取引データを取得する。
【0052】
データ変更部208は、取引データ取得部206が取得した取引データに対するデータ変更処理を実行する。
【0053】
データ変更部208は、例えば、取引データに含まれる摘要に固有表現が含まれているか否かを判定し、含まれている場合に、固有表現を固有情報に変更する。データ変更部208は、固有表現の種類に関わらず、固有表現を固定の固有情報に変更してよい。
【0054】
データ変更部208は、固有表現を、固有表現の種類に応じた固有情報に変更してもよい。データ変更部208は、摘要に含まれる固有表現が、複数種類の固有情報のうちのいずれの固有情報に対応するかを判定し、摘要に含まれる固有表現を、対応する固有情報に変更してよい。例えば、データ変更部208は、摘要に含まれる固有表現が、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、及び固有物名のいずれに対応するかを判定する。データ変更部208は、例えば、予め登録された固有表現の辞書データを用いることによって、摘要に固有表現が含まれるかと、固有表現の種類とを判定してよい。
【0055】
データ変更部208は、摘要に固有表現が含まれる場合に、摘要の固有表現以外の部分に基づいて、摘要に含まれる固有表現を固有情報に変更するか否かを判定し、変更すると判定した場合に、摘要に含まれる固有表現を固有情報に変更し、変更しないと判定した場合、摘要に含まれる固有表現を固有情報に変更しないようにしてもよい。
【0056】
例えば、データ変更部208は、摘要に固有表現以外の単語が含まれていない場合、すなわち、摘要の中に固有表現のみが含まれている場合、固有表現を固有情報に変更しないと判定する。
【0057】
例えば、データ変更部208は、摘要に固有表現及び他の単語が含まれる場合において、摘要における固有表現の割合が、予め定められた閾値より高い場合、固有表現を固有情報に変更しないと判定する。
【0058】
データ変更部208は、固有情報に変更する固有表現と、固有情報に変更しない固有表現とが登録された登録データを予め記憶しておき、当該登録データを用いて、摘要に含まれる固有表現を固有情報に変更するか否かを判定してもよい。当該登録データは、例えば、会計管理システム10の管理者等によって登録される。会計管理システム10を利用することによって、固有情報に変更した方がよい固有表現、固有情報に変更しない方がよい固有表現の知見が蓄積されることになり、会計管理システム10の管理者等は、当該知見に基づいて、登録データを生成し得る。
【0059】
科目選択部210は、取引データ取得部206が取得した取引データが示す取引に対応する勘定科目を選択する。科目選択部210は、取引データ取得部206が取得した取引データに含まれる摘要に基づいて、取引データに対応する勘定科目を選択してよい。
【0060】
科目選択部210は、取引データに含まれる摘要に固有表現が含まれている場合、データ変更部208によって固有表現が固有情報に変更された取引データに基づいて、取引データに対応する勘定科目を選択してよい。科目選択部210は、学習モデル記憶部204に記憶されている学習モデルを用いて、勘定科目を選択してよい。例えば、科目選択部210は、データ変更部208によって固有表現が固有情報に変更された摘要を、学習モデル記憶部204に記憶されている学習モデルに入力し、学習モデルから出力された勘定科目を選択する。
【0061】
科目選択部210は、摘要のうち、固有情報の推論結果への影響が、摘要のうちの他の単語と比較して低くなるように、選択を実行してもよい。例えば、科目選択部210は、固有情報に対して、摘要のうちの他の単語の重みよりも低い重みを適用して学習モデルに入力する。これにより、固有情報を推論に活かしつつ、固有情報に必要以上に依存してしまうことを防ぐことができる。
【0062】
科目選択部210は、固有情報の推論結果への影響が、摘要のうちの他の単語と比較して低くなるようにしつつ、固有情報の種類毎の推論結果への影響が変わるように、選択を実行してもよい。例えば、科目選択部210は、固有情報の種類毎に異なる重みを適用して学習モデルに入力する。
【0063】
科目選択部210は、借方の勘定科目を選択するのか、貸方の勘定科目を選択するのかにさらに基づいて、取引データに対応する勘定科目を選択してもよい。この場合、科目選択部210は、摘要に加えて、貸借データを学習モデルに入力してよい。科目選択部210は、例えば、ユーザ82の指示に従って、借方の勘定科目を選択するのか、貸方の勘定科目を選択するのかを選択してよい。科目選択部210は、取引データの取込元によって、借方の勘定科目を選択するのか、貸方の勘定科目を選択するのかを選択してもよい。
【0064】
学習モデル記憶部204に記憶されている変更後学習モデルを用いて勘定科目を選択する場合であって、取引データ取得部206が取得した取引データに含まれる摘要に固有表現が含まれている場合、科目選択部210は、データ変更部208によって固有表現が固有情報に変更された摘要を、変更後学習モデルに入力し、変更後学習モデルから出力された勘定科目を選択してよい。
【0065】
学習モデル記憶部204に記憶されている変更前後学習モデルを用いて勘定科目を選択する場合であって、取引データ取得部206が取得した取引データに含まれる摘要に固有表現が含まれている場合、科目選択部210は、データ変更部208によって固有表現が固有情報に変更された摘要を変更前後学習モデルに入力しても、変更されていない元の摘要を変更前後学習モデルに入力してもよい。科目選択部210は、固有表現が固有情報に変更された摘要を変更前後学習モデルに入力した結果と、変更される前の摘要を変更前後学習モデルに入力した結果に基づいて、勘定科目を選択してもよい。科目選択部210は、例えば、変更後の摘要を入力して変更前後学習モデルから出力された勘定科目と、変更される前の摘要を入力して変更前後学習モデルから出力された勘定科目のうち、確度がより高い勘定科目を選択する。科目選択部210は、例えば、変更後の摘要を入力して変更前後学習モデルから出力された勘定科目の確度と、変更される前の摘要を入力して変更前後学習モデルから出力された勘定科目の確度に、異なる重み付けをしたうえで、確度がより高い勘定科目を選択するようにしてもよい。
【0066】
学習モデル記憶部204に記憶されている変更後学習モデル及び変更前学習モデルを用いて勘定科目を選択する場合であって、取引データ取得部206が取得した取引データに含まれる摘要に固有表現が含まれている場合、科目選択部210は、データ変更部208によって固有表現が固有情報に変更された摘要を変更後学習モデルに入力し、変更されていない元の摘要を変更前学習モデルに入力してよい。科目選択部210は、変更後学習モデルから出力された勘定科目と、変更前学習モデルから出力された勘定科目とに基づいて、取引データに対応する勘定科目を選択してよい。例えば、科目選択部210は、変更後学習モデルから出力された勘定科目と、変更前学習モデルから出力された勘定科目のうち、確度がより高い勘定科目を選択する。科目選択部210は、例えば、変更後学習モデルから出力された勘定科目の確度と、変更前学習モデルから出力された勘定科目の確度に、異なる重み付けをしたうえで、確度がより高い勘定科目を選択するようにしてもよい。科目選択部210は、まず、データ変更部208によって固有表現が固有情報に変更された摘要を変更後学習モデルに入力し、変更後学習モデルから出力された勘定科目の確度が予め定められた確度より高い場合には、当該勘定科目を、取引データに対応する勘定科目として選択し、予め定められた確度より低い場合に、変更されていない元の摘要を変更前学習モデルに入力して、変更前学習モデルから出力された勘定科目を、取引データに対応する勘定科目として選択するようにしてもよい。
【0067】
会計データ生成部212は、取引データ取得部206が取得した取引データに対応する会計データを生成する。会計データ生成部212は、科目選択部210によって選択された勘定科目を含む会計データを生成する。
【0068】
会計データ出力部214は、会計データ生成部212によって生成された会計データを出力する。会計データ出力部214は、会計サービス提供装置30に対して会計データを出力してよい。会計データ出力部214は、通信端末80に対して会計データを出力してもよい。
【0069】
上述したように、学習装置100と会計データ変換装置200とは、一つの装置によって実現されてもよい。この場合、会計データ変換装置200は、データ取得部102、データ記憶部104、データ変更部106、及び学習モデル生成部108を更に備えてよい。なお、データ変更部106とデータ変更部208とは、共通化されてもよい。
【0070】
図5は、会計データ変換装置200による処理の流れの一例を概略的に示す。ここでは、複数の取引データのそれぞれに対応する会計データを生成する場合の処理の流れについて説明する。
【0071】
S202では、取引データ取得部206が取引データを取得する。S204では、データ変更部208が、S202において取引データ取得部206が取得した取引データに含まれる摘要に、固有表現が含まれるか否かを判定する。含まれると判定した場合、S206に進み、含まれないと判定した場合、S208に進む。S206では、データ変更部208が、摘要に含まれる固有表現を固有情報に変更する。
【0072】
S208では、科目選択部210が、S202において取引データ取得部206が取得した取引データに対応する勘定科目を選択する。科目選択部210は、取引データに含まれる摘要、及び、データ変更部208によって固有表現が固有情報に変更された摘要の少なくともいずれかを用いて、勘定科目を選択する。
【0073】
S210では、会計データ生成部212が、S202において取引データ取得部206が取得した取引データに対応する、S208において科目選択部210が選択した勘定科目を含む会計データを生成する。
【0074】
対象となるすべての取引データについて会計データの生成が終了した場合(S212でYES)、S214に進み、終了していない場合(S212でNO)、S202に戻る。S214では、会計データ出力部214が、生成された会計データを会計サービス提供装置30に出力する。
【0075】
図6は、学習装置100又は会計データ変換装置200として機能するコンピュータ1200のハードウェア構成の一例を概略的に示す。コンピュータ1200にインストールされたプログラムは、コンピュータ1200を、本実施形態に係る装置の1又は複数の「部」として機能させ、又はコンピュータ1200に、本実施形態に係る装置に関連付けられるオペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ1200に、本実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ1200に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU1212によって実行されてよい。
【0076】
本実施形態によるコンピュータ1200は、CPU1212、RAM1214、及びグラフィックコントローラ1216を含み、それらはホストコントローラ1210によって相互に接続されている。コンピュータ1200はまた、通信インタフェース1222、記憶装置1224、DVDドライブ1226、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ1220を介してホストコントローラ1210に接続されている。DVDドライブ1226は、DVD-ROMドライブ及びDVD-RAMドライブ等であってよい。記憶装置1224は、ハードディスクドライブ及びソリッドステートドライブ等であってよい。コンピュータ1200はまた、ROM1230及びキーボードのようなレガシの入出力ユニットを含み、それらは入出力チップ1240を介して入出力コントローラ1220に接続されている。
【0077】
CPU1212は、ROM1230及びRAM1214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ1216は、RAM1214内に提供されるフレームバッファ等又はそれ自体の中に、CPU1212によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス1218上に表示されるようにする。
【0078】
通信インタフェース1222は、ネットワークを介して他の電子デバイスと通信する。記憶装置1224は、コンピュータ1200内のCPU1212によって使用されるプログラム及びデータを格納する。DVDドライブ1226は、プログラム又はデータをDVD-ROM1227等から読み取り、記憶装置1224に提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
【0079】
ROM1230はその中に、アクティブ化時にコンピュータ1200によって実行されるブートプログラム等、及び/又はコンピュータ1200のハードウェアに依存するプログラムを格納する。入出力チップ1240はまた、様々な入出力ユニットをUSBポート、パラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ1220に接続してよい。
【0080】
プログラムは、DVD-ROM1227又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもある記憶装置1224、RAM1214、又はROM1230にインストールされ、CPU1212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ1200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ1200の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。
【0081】
例えば、通信がコンピュータ1200及び外部デバイス間で実行される場合、CPU1212は、RAM1214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース1222に対し、通信処理を命令してよい。通信インタフェース1222は、CPU1212の制御の下、RAM1214、記憶装置1224、DVD-ROM1227、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
【0082】
また、CPU1212は、記憶装置1224、DVDドライブ1226(DVD-ROM1227)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM1214に読み取られるようにし、RAM1214上のデータに対し様々なタイプの処理を実行してよい。CPU1212は次に、処理されたデータを外部記録媒体にライトバックしてよい。
【0083】
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU1212は、RAM1214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM1214に対しライトバックする。また、CPU1212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU1212は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0084】
上で説明したプログラム又はソフトウエアモジュールは、コンピュータ1200上又はコンピュータ1200近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ1200に提供する。
【0085】
本実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び/又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び/又はアナログハードウェア回路を含んでよく、集積回路(IC)及び/又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ(FPGA)、及びプログラマブルロジックアレイ(PLA)等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。
【0086】
コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROM又はフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(登録商標)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0087】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、及び「C」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。
【0088】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0089】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0090】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0091】
10 会計管理システム、20 業務サービス提供装置、30 会計サービス提供装置、50 ネットワーク、80 通信端末、82 ユーザ、100 学習装置、102 データ取得部、104 データ記憶部、106 データ変更部、108 学習モデル生成部、110 学習モデル送信部、200 会計データ変換装置、202 学習モデル取得部、204 学習モデル記憶部、206 取引データ取得部、208 データ変更部、210 科目選択部、212 会計データ生成部、214 会計データ出力部、1200 コンピュータ、1210 ホストコントローラ、1212 CPU、1214 RAM、1216 グラフィックコントローラ、1218 ディスプレイデバイス、1220 入出力コントローラ、1222 通信インタフェース、1224 記憶装置、1226 DVDドライブ、1227 DVD-ROM、1230 ROM、1240 入出力チップ
【手続補正書】
【提出日】2023-09-15
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
取引の摘要を含む取引データを取得する取引データ取得部と、
前記取引データに含まれる前記摘要を複数の単語に分割した上で、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、又は固有物名を含む固有表現の辞書データを用いて、単語毎に、固有表現であるか否かを判定し、固有表現であると判定した単語を、固有表現であることを示す固有情報に変更するデータ変更部と、
前記データ変更部によって、前記固有表現であると判定された単語が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、前記固有情報の推論結果への影響が前記摘要のうちの他の単語と比較して低くなるように学習を実行して、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成部と、
前記データ変更部によって前記固有表現であると判定された単語が前記固有情報に変更された前記取引データに基づいて、前記取引データに対応する勘定科目を選択する科目選択部であって、前記データ変更部によって、前記固有表現であると判定された単語が前記固有情報に変更された前記摘要を、前記学習モデル生成部によって生成された前記学習モデルに入力し、前記学習モデルから出力された前記勘定科目を選択する科目選択部と、
前記科目選択部によって選択された前記勘定科目を含む、前記取引データに対応する会計データを生成する会計データ生成部と
を備える会計データ変換装置。
【請求項2】
前記データ変更部は、前記摘要に含まれる前記固有表現であると判定した単語が、複数種類の固有情報のうちのいずれの固有情報に対応するかを判定し、前記摘要に含まれる前記固有表現であると判定した単語を、対応する前記固有情報に変更する、請求項1に記載の会計データ変換装置。
【請求項3】
前記データ変更部は、前記摘要に含まれる前記固有表現であると判定した単語が、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、及び固有物名のいずれに対応するかを判定する、請求項2に記載の会計データ変換装置。
【請求項4】
前記データ変更部は、前記摘要の前記固有表現以外の部分に基づいて、前記摘要に含まれる前記固有表現を前記固有情報に変更するか否かを判定し、変更すると判定した場合に、前記摘要に含まれる前記固有表現であると判定した単語を前記固有情報に変更する、請求項1から3のいずれか一項に記載の会計データ変換装置。
【請求項5】
コンピュータを、
取引の摘要を含む取引データを取得する取引データ取得部、
前記取引データに含まれる前記摘要を複数の単語に分割した上で、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、又は固有物名を含む固有表現の辞書データを用いて、単語毎に、固有表現であるか否かを判定し、固有表現であると判定した単語を、固有表現であることを示す固有情報に変更するデータ変更部、
前記データ変更部によって、前記固有表現であると判定された単語が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、前記固有情報の推論結果への影響が前記摘要のうちの他の単語と比較して低くなるように学習を実行して、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成部、
前記データ変更部によって前記固有表現であると判定された単語が前記固有情報に変更された前記取引データに基づいて、前記取引データに対応する勘定科目を選択する科目選択部であって、前記データ変更部によって、前記固有表現であると判定された単語が前記固有情報に変更された前記摘要を、前記学習モデル生成部によって生成された前記学習モデルに入力し、前記学習モデルから出力された前記勘定科目を選択する科目選択部、及び
前記科目選択部によって選択された前記勘定科目を含む、前記取引データに対応する会計データを生成する会計データ生成部
として機能させるためのプログラム。
【請求項6】
コンピュータによって実行される会計データ変換方法であって、
取引の摘要を含む取引データを取得する第1取引データ取得段階と、
前記第1取引データ取得段階において取得した前記取引データに含まれる前記摘要を複数の単語に分割した上で、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、又は固有物名を含む固有表現の辞書データを用いて、単語毎に、固有表現であるか否かを判定し、固有表現であると判定した単語を、固有表現であることを示す固有情報に変更する第1データ変更段階と、
前記第1データ変更段階において、前記固有表現であると判定された単語が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、前記固有情報の推論結果への影響が前記摘要のうちの他の単語と比較して低くなるように学習を実行して、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成段階と、
取引の摘要を含む取引データを取得する第2取引データ取得段階と、
前記第2取引データ取得段階において取得した前記取引データに含まれる前記摘要を複数の単語に分割した上で、前記辞書データを用いて、単語毎に、固有表現であるか否かを判定し、固有表現であると判定した単語を、固有表現であることを示す固有情報に変更する第2データ変更段階と、
前記第2データ変更段階において前記固有表現であると判定された単語が前記固有情報に変更された前記取引データに基づいて、前記取引データに対応する勘定科目を選択する科目選択段階であって、前記第2データ変更段階において、前記固有表現であると判定された単語が前記固有情報に変更された前記摘要を、前記学習モデル生成段階において生成された前記学習モデルに入力し、前記学習モデルから出力された前記勘定科目を選択する科目選択段階と、
前記科目選択段階において選択した前記勘定科目を含む、前記取引データに対応する会計データを生成する会計データ生成段階と
を備える会計データ変換方法。
【請求項7】
取引の摘要を複数の単語に分割した上で、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、又は固有物名を含む固有表現の辞書データを用いて、単語毎に、固有表現であるか否かを判定し、固有表現であると判定した単語を、固有表現であることを示す固有情報に変更するデータ変更部と、
前記データ変更部によって前記固有表現であると判定された単語が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、前記固有情報の推論結果への影響が前記摘要のうちの他の単語と比較して低くなるように学習を実行して、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成部と
を備える学習装置。
【請求項8】
コンピュータを、
取引の摘要を複数の単語に分割した上で、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、又は固有物名を含む固有表現の辞書データを用いて、単語毎に、固有表現であるか否かを判定し、固有表現であると判定した単語を、固有表現であることを示す固有情報に変更するデータ変更部、及び
前記データ変更部によって前記固有表現であると判定された単語が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、前記固有情報の推論結果への影響が前記摘要のうちの他の単語と比較して低くなるように学習を実行して、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成部
として機能させるためのプログラム。
【請求項9】
コンピュータによって実行される学習方法であって、
取引の摘要を複数の単語に分割した上で、組織名、人名、地名、日付表現、時間表現、金額表現、割合表現、又は固有物名を含む固有表現の辞書データを用いて、単語毎に、固有表現であるか否かを判定し、固有表現であると判定した単語を、固有表現であることを示す固有情報に変更するデータ変更段階と、
前記データ変更段階において前記固有表現であると判定された単語が前記固有情報に変更された前記摘要と、前記取引に対応する勘定科目とを含む学習データを用いて、前記固有情報の推論結果への影響が前記摘要のうちの他の単語と比較して低くなるように学習を実行して、取引の摘要を入力とし、前記取引に対応する勘定科目を出力する学習モデルを生成する学習モデル生成段階と
を備える学習方法。