(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024027339
(43)【公開日】2024-03-01
(54)【発明の名称】情報処理方法
(51)【国際特許分類】
G06Q 40/12 20230101AFI20240222BHJP
【FI】
G06Q40/00 400
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022130067
(22)【出願日】2022-08-17
(71)【出願人】
【識別番号】513040384
【氏名又は名称】株式会社マネーフォワード
(74)【代理人】
【識別番号】110003133
【氏名又は名称】弁理士法人近島国際特許事務所
(72)【発明者】
【氏名】堀 哲也
(72)【発明者】
【氏名】近藤 豊峰
【テーマコード(参考)】
5L055
【Fターム(参考)】
5L055BB64
(57)【要約】
【課題】ローカル言語で表現された文字列であって、勘定科目を示す文字列の勘定科目を推定可能な情報処理方法を提供する。
【解決手段】情報処理方法は、第1の言語で表現された文字列と、当該文字列に対して正解ラベルとして付与される勘定科目と、を機械学習することによって得られる学習済みモデルを用いて、勘定科目を推定する。第1の言語とは異なる第2の言語によって表現された文字列であって第2の言語における勘定科目を示す文対象字列を取得し(S2)、対象文字列を、第1の言語に機械翻訳した翻訳結果を取得し(S7)、翻訳結果と、学習済みモデルと、を用いて、対象文字列に対応する、正解ラベルとして付与された勘定科目を推定する(S8)。
【選択図】
図5
【特許請求の範囲】
【請求項1】
第1の言語で表現された文字列と、当該文字列に対して正解ラベルとして付与される勘定科目と、を機械学習することによって得られる学習済みモデルを用いて、コンピュータに勘定科目を推定させる情報処理方法であって、
前記第1の言語とは異なる第2の言語によって表現された文字列であって前記第2の言語における勘定科目を示す対象文字列を取得し、
前記対象文字列を、前記第1の言語に機械翻訳した翻訳結果を取得し、
前記翻訳結果と、前記学習済みモデルと、を用いて、前記対象文字列に対応する、前記正解ラベルとして付与された勘定科目を推定する、
ことを特徴とする情報処理方法。
【請求項2】
前記第1の言語は、英語である、
ことを特徴とする請求項1記載の情報処理方法。
【請求項3】
前記正解ラベルとして付与される勘定科目は、日本語で表現された勘定科目である、
ことを特徴とする請求項1記載の情報処理方法。
【請求項4】
前記翻訳結果は、前記コンピュータが、翻訳サーバと通信することによって、取得する、
ことを特徴とする請求項1記載の情報処理方法。
【請求項5】
前記第1の言語で表現された文字列は、前記第1の言語とは異なる言語で表現された勘定科目を、前記第1の言語に機械翻訳した文字列である、
ことを特徴とする請求項1記載の情報処理方法。
【請求項6】
前記第1の言語及び第2の言語とは異なる第3の言語によって表現された文字列であって前記第3の言語における勘定科目を示す他の対象文字列を取得し、
前記他の対象文字列を、前記第1の言語に機械翻訳した翻訳結果を取得し、
前記他の対象文字列を、前記第1の言語に機械翻訳した翻訳結果と、前記学習済みモデルと、を用いて、前記他の対象文字列に対応する、前記正解ラベルとして付与された勘定科目を推定する、
ことを特徴とする請求項1記載の情報処理方法。
【請求項7】
前記学習済みモデルを用いて推定される前記正解ラベルとして付与された勘定科目は、連結財務諸表で使用される連結勘定科目である、
ことを特徴とする請求項1乃至5のいずれか1項記載の情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法に関する。
【背景技術】
【0002】
有価証券報告書を提出している企業や、大会社には、連結決算を行うことが、会社法によって義務付けられている。連結決算では、国内外の子会社及び関連会社を含めた企業グループ全体として決算が行われ、企業グループ全体の貸借対照表や損益計算書などの連結財務諸表が作成される。
上記連結財務諸表は、各会社ごとの個別財務諸表を合算して作成されるが、この合算作業を行う前提として、上記個別財務諸表の勘定科目を連結財務諸表にて使用される連結勘定科目に統一する必要がある。
近年、キーワードと勘定科目とを対応づけた対応テーブルを備え、当該テーブルを参照して勘定科目を自動的に仕訳するものが存在しているが(特許文献1参照)、このような連結会計における勘定科目の合わせ込み作業を自動化したものでは無く、上記勘定科目の合わせ込み作業は、作業者によって手作業で行われていた。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特に、海外の子会社や関連会社の個別財務諸表は、現地国の言語(以下、ローカル言語という)で記載されている場合があり、上記勘定科目の合わせ込み作業を、非常に煩雑なものとしていた。
【0005】
そこで、本発明の一つの目的は、ローカル言語で表現された文字列であって、勘定科目を示す文字列の勘定科目を推定可能な情報処理方法を提供することである。
【課題を解決するための手段】
【0006】
本発明の一態様は、第1の言語で表現された文字列と、当該文字列に対して正解ラベルとして付与される勘定科目と、を機械学習することによって得られる学習済みモデルを用いて、コンピュータに勘定科目を推定させる情報処理方法であって、前記第1の言語とは異なる第2の言語によって表現された文字列であって前記第2の言語における勘定科目を示す対象文字列を取得し、前記対象文字列を、前記第1の言語に機械翻訳した翻訳結果を取得し、前記翻訳結果と、前記学習済みモデルと、を用いて、前記対象文字列に対応する、前記正解ラベルとして付与された勘定科目を推定する、ことを特徴とする情報処理方法である。
【発明の効果】
【0007】
本発明によれは、ローカル言語で表現された文字列であって、勘定科目を示す文字列の勘定科目を推定可能な情報処理方法を提供することができる。
【図面の簡単な説明】
【0008】
【
図1】本実施の形態に係る会計処理システムのブロック図。
【
図2】(a)は参照データの一例を示す図、(b)は英語で表現された文字列であって勘定科目を示す文字列の取得方法を示す図。(c)は参照データを取得する別の方法を示す図。
【発明を実施するための形態】
【0009】
以下、図面に沿って本発明の実施の形態について説明する。
【0010】
(会計処理システムの概略構成)
まず、本実施の形態に係る会計処理システム1の構成について説明をする。会計処理システム1は、ユーザに対して連結財務諸表作成サービスを含む会計処理サービスを提供するシステムであり、会計処理サーバ2と、翻訳サーバ3と、端末装置5と、を備えている。これら会計処理サーバ2、翻訳サーバ3及び端末装置5は、インターネット等のネットワーク6を介して通信可能に接続されており、上記会計処理サービスは、ユーザがインターネットを介し会計処理サーバ2にアクセスすることによって、いわゆるクラウドサービスとして提供される。
【0011】
端末装置5は、例えば、パーソナルコンピュータや携帯端末等のユーザ端末であり、ウェブブラウザや専用のアプリによって会計処理サーバ2にアクセスすることができる。翻訳サーバ3は、クラウドサービスの形で翻訳サービスを提供する外部コンピュータシステムであり、会計処理サーバ2から送信されてきた文字列を第1の言語(本実施の形態では英語)に翻訳し、その翻訳結果を会計処理サーバ2に送信するように構成されている。
【0012】
会計処理サーバ2は、国内外の子会社および関連会社の個別財務諸表を取り込んで連結財務諸表を作成可能な会計処理システムであり、制御部10と、記憶部20と、通信部30と、を備えている。通信部30は、ネットワーク6を介して端末装置5及び翻訳サーバ3と暗号化された通信を行うための通信インターフェースである。
【0013】
記憶部20は、制御部10が実行するためのプログラムや、各種会計データなどを記憶しており、RAM(Random Access Memory)やROM(Read Only Memory)などによって構成されている。記憶部20は、個別会計データ記憶部21と、連結会計データ記憶部22と、参照データ記憶部23と、学習データ記憶部24と、学習済みモデル記憶部25と、マスタ記憶部26と、を備えており、個別会計データ記憶部21には、各グループ会社ごとの個別財務諸表データ及び取引明細データなど、連結財務諸表の作成に必要なデータが記憶される。
【0014】
例えば、海外子会社のデータの場合、個別財務諸表データ及び取引明細データとして、海外子会社が使用している会計ソフトから出力されたローカル言語(第1の言語とは異なる第2の言語)で表現された個別財務諸表データ及び取引明細データが記憶される。また、詳しくは後述するが、ローカル言語で表現された個別財務諸表データ及び取引明細データがインポートされる場合、個別会計データ記憶部21には、これら個別財務諸表データ及び取引明細データのテキストデータが翻訳サーバ3にて英語に翻訳された翻訳データがインポートデータと関連付けられて記憶される。
【0015】
連結会計データ記憶部22には、個別会計データ記憶部21に記憶されている各社の個別財務諸表データ及び取引明細データに基づいて作成された連結財務諸表データなどが記憶される。
【0016】
参照データ記憶部23には、機械学習を行う際の学習データの元となるデータが記憶される。より詳しくは、本実施の形態では、英語で表現された文字列(第1の言語で表現された文字列)と、この英語で表現された文字列が分類される連結勘定科目と、のデータセットが多数、記憶されている。なお、連結勘定科目とは、連結財務諸表の作成の際に使用される勘定科目であり、予めマスタ記憶部26の連結勘定科目マスタに登録されている勘定科目である。本実施の形態では、この連結勘定科目が機械学習における正解ラベルとして使用されている。また、以下の説明においては、個別財務諸表データ及び取引明細データにて使用されている勘定科目のことを、個別勘定科目というものとする。このように、連結勘定科目と個別勘定科目とは、使用されている範囲(グループ)が異なっており、例えば、連結勘定科目を第1のグループの勘定科目とした場合、個別勘定科目は、会社ごとに第2のグループの勘定科目、第3のグループの勘定科・・・というように複数の異なるグループの勘定科目が含まれている。
【0017】
また、上述した英語で表現された文字列は、一般に公開されている財務諸表データの勘定科目のデータから収集することが可能である。即ち、英語で表現された文字列は、英語で公開されている財務諸表データの勘定科目のデータを用いることができる。また、英語以外の言語で公開されている財務諸表データの勘定科目のデータを英語に機械翻訳した文字列を用いることができる。
【0018】
例えば、
図2(a)は、参照データ記憶部23に記憶されている参照データの一例であるが、英語で記載された文字列として、英語の勘定科目名に関する情報を含んでおり、勘定科目名(英)における「Bank Deposits」の文字列は、
図2(b)に示すように、ベトナム語で公開されていた財務諸表の勘定科目名を機械翻訳で英語に機械翻訳して取得したものである。すなわち、
図2(a)における、勘定科目名(英)は機械翻訳結果を示すものと考えることもできる。
図2(a)及び
図2(b)に示されるように、ベトナム語の勘定科目を機械翻訳することによって得られた英語の文字列は、必ずしも英語における勘定科目を適切に示すとは限らない。本実施形態における機械学習では、機械翻訳によって得られた英語の文字列に対して、連結勘定科目としての日本語の勘定科目を正解ラベルとして付与している。別の言い方をすれば、本実施形態では、複数のベトナム語の文字列であって、それぞれがベトナム語の勘定科目を示す文字列をそれぞれ英語に機械翻訳する。そして、本実施形態の機械学習によれば、英語に機械翻訳された結果である複数の文字列のそれぞれに対して、日本語の勘定科目をそれぞれ正解ラベルとして付与することによって学習済みモデルを生成することができる。また、上述した例では、ベトナム語の勘定科目名を示す文字列を英語に機械翻訳して学習する例を例示したが、本開示はこれに限定されるべきではない。例えば、勘定科目名を示す文字列ではなく、取引データにおける摘要欄のデータなどを使用しても良い。具体的には、
図2(c)に示すように、ベトナム語の摘要欄の記載を英訳した「Subway」の文字列と、これと対応する連結勘定科目名である「旅費交通費」とをセットにし、参照データとして参照データ記憶部23に記憶しても良い。
【0019】
また、上記英語で公開されている財務諸表データの勘定科目や、英語以外の言語で公開されている財務諸表データの勘定科目については、ウェブスクレイピングなどによって自動的に収集するようにしても良い。更に、ウェブスクレイピングされた英語以外の言語で公開されている財務諸表データの勘定科目については、翻訳サーバ3によって自動で翻訳まで行うようにしても良い。更に、参照データとしては、過去にユーザが使用した勘定科目のデータも当然に使用することができる。また、例えば、EDINETの勘定科目リストなどの公開データも参照データとすることができる。
【0020】
学習データ記憶部24には、参照データに基づいて生成される学習データが記憶される。
図3は、上記学習データの一例を示しており、分類される個別勘定科目の特徴量と、連結勘定科目との情報を含んでいる。
【0021】
学習済みモデル記憶部25には、学習データ記憶部24に記憶されている学習データを用いて機械学習された学習済みモデルが記憶される。
【0022】
制御部10は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)などから構成されており、記憶部20に記憶されているプログラムを実行することにより、会計データ取得部11、翻訳データ生成部12、特徴量生成部13、勘定科目推定部15、科目変換マスタ生成部16、データ編集部17、機械学習実行部18、連結財務諸表生成部19として機能する(
図1参照)。
【0023】
会計データ取得部11は、子会社や関連会社の個別財務諸表データや取引明細データなどのデータを取得するように構成されている。具体的には、会計データ取得部11は、CSVデータなどによって端末装置5から入力された個別財務諸表データや取引明細データなどのデータを受付け、個別会計データ記憶部21に記憶させる。また、上記個別財務諸表データや取引明細データなどのデータが、画像データ(例えばテキストデータを含まないもしくは読み込めないPDFデータを含む)として入力された場合、会計データ取得部11は、入力されたデータにOCR処理を施し、テキスト化されたデータを個別会計データ記憶部21に記憶させる。
【0024】
翻訳データ生成部12は、会計データ取得部11が取得した個別財務諸表データや取引明細データが、英語以外の言語にて表現されているか否かを特定する。そして、個別財務諸表データや取引明細データが英語以外の言語にて表現されている場合、この英語以外の言語にて表現されている個別財務諸表データや取引明細データ内のテキストデータを、翻訳サーバ3へと送信し、英語に翻訳されたテキストデータ(翻訳データ、翻訳結果)を翻訳サーバ3から受信して取得する。取得した翻訳データは、個別会計データ記憶部21に記憶される。なお、翻訳サーバ3に送信されるデータは、必ずしも個別財務諸表データや取引明細データに内包されている全てのテキストデータである必要は無く、少なくとも個別勘定科目に係るデータが含まれていれば良い。また、上記翻訳データの取得は、翻訳サーバ3が提供するAPI(Application Program Interface)によって行われてもよい。
【0025】
特徴量生成部13は、参照データ記憶部23内の英語で表現された文字列(
図2(a)の勘定科目(英)の欄のデータなど)や、翻訳データ生成部12が取得した翻訳データに含まれる英語で表現された個別勘定科目名の特徴量を生成する。具体的には、特徴量生成部13は、特徴量を生成するにあたり、まず、英語で表現された文字列に対して形態素分析を行い、文字列を単語分割する。次に、特徴量生成部13は、分割された各単語の重みを算出し、この算出された各単語の重みを当該勘定科目の特徴量とする。
【0026】
図3は、学習データ記憶部24に記憶されている学習データの一例を示す図である。上述した特徴量生成部13によって求められた、参照データ記憶部23内の英語で表現された文字列の特徴量は、
図3に示すように、対応する連結勘定科目と関連付けられて、学習データとして学習データ記憶部24に記憶される。また、翻訳データに含まれる英語で表現された個別勘定科目名の特徴量は、分類する個別勘定科目の特徴量として取り扱われる。
【0027】
なお、単語の重みの算出は、どのような手法を採用しても良いが、tf-idf(term frequency inverse document frequency)のように、単語の頻度によって重みを算出するようにしても良く、例えば、参照データ全体における各単語の頻度などに基づいて単語の重みを算出しても良い。
【0028】
勘定科目推定部15は、特徴量生成部13が生成した個別勘定科目の特徴量を、学習済みモデル記憶部25に入力することによって、個別勘定科目を特定の連結勘定科目に分類する(即ち、対応する連結勘定科目を推定する)。
【0029】
科目変換マスタ生成部16は、勘定科目推定部15が推定した連結勘定科目に基づいて、個別勘定科目を連結勘定科目に変換するための科目変換マスタデータを生成する。科目変換マスタデータは、勘定科目コード、入力された個別勘定科目名、英語に翻訳された個別勘定科目名、対応する連結勘定科目名、勘定科目名の登録の有無などの情報を含んでおり(
図4参照)、マスタ記憶部26の科目変換マスタに格納される。
【0030】
また、科目変換マスタデータは、個別勘定科目を連結勘定科目に変換するのみならず、勘定科目推定部15が推定した連結勘定科目が正しいかどうかをユーザが確認し、正しい個別勘定科目と連結勘定科目との対応関係を確定させるためにも使用される。
図4は、科目変換マスタの表示画面の一例であるが、ユーザによる連結勘定科目の登録が済んでいない、即ち、勘定科目推定部15が推定し、ユーザによる確認が行われていない連結勘定科目には、連結勘定科目名の先頭に未登録状態を示すアイコン(
図4の例では雲印)が付与されている。
【0031】
データ編集部17は、勘定科目推定部15によって推定された連結勘定科目を登録もしくは修正する。例えば、
図4の画面における「登録」のアイコンがユーザによりクリックされると、データ編集部17は、勘定科目名の登録の有無のデータを「無」から「有」に変更して、個別勘定科目と連結勘定科目の対応関係を確定させる。ユーザがサジェストされた連結勘定科目を変更した場合には、データ編集部17は、個別勘定科目と連結勘定科目の対応関係を修正する。なお、データ編集部17は、連結勘定科目の登録が行われると、登録された英語の勘定科目名と連結勘定科目名とのデータセットを、参照データ記憶部23に記憶させる。
【0032】
機械学習実行部18は、学習データ記憶部24に記憶されている学習データにもとづいて機械学習を実行することにより、個別勘定科目を連結勘定科目に分類するための学習済みモデルを生成する。機械学習のアルゴリズムは、どのようなものを用いても良いが、例えば、SVM(Support Vector Machine)や、ランダムフォレスト(Random Forest)などを用いることができる。
【0033】
連結財務諸表生成部19は、科目変換マスタを用いて個別勘定科目を連結勘定科目へと変換した個別財務諸表データ及び取引明細データを合算して、連結精算表、連結財務諸表データ及び連結取引明細データを生成し、連結会計データ記憶部22に記憶させる。
【0034】
(連結勘定科目の推定処理)
ついで、連結勘定科目への推定処理について、海外子会社からローカル言語で表現された個別財務諸表データ及び取引明細データ(以下、個別会計データという)をインポートする場合を例に取って、説明をする。
図5に示すように、連結財務諸表を作成するに際して、ユーザから海外子会社の個別会計データがインポートされると(
図5のS1、S2)、会計処理サーバ2は、まず、個別財務諸表データ及び取引明細データが英語以外の言語で表現されているか否かを判定する。
【0035】
そして、個別財務諸表データ及び取引明細データがローカル言語にて表現されている場合、会計処理サーバ2は、これら個別財務諸表データ及び取引明細データ内の個別勘定科目のテキストを含むデータを翻訳サーバ3に送信する(S3)。
【0036】
翻訳サーバ3は、ローカル言語にて表現された個別勘定科目のテキストデータを受信すると(S4)、受信した個別勘定科目のテキストデータを英語に翻訳し(S5)、翻訳済みの個別勘定科目のデータを会計処理サーバ2へと送信する(S6)。
【0037】
会計処理サーバ2は、英語に翻訳された個別勘定科目のデータを受信すると(S7)、英語で表現された文字列であって個別勘定科目を示す対象文字列に対して形態素分析を行うと共に、形態素分析された各単語の重みから個別勘定科目の特徴量を生成する。そして、求められた個別勘定科目の特徴量を学習済みモデルに入力することによって、ローカル言語にて表現された個別勘定科目を、連結勘定科目マスタに記憶されている連結勘定科目の内の特定の連結勘定科目に分類する(S8)。
【0038】
ローカル言語にて表現された個別勘定科目に対応する連結勘定科目が推定されると、会計処理サーバ2は、個別勘定科目と連結勘定科目の対応関係を科目変換マスタに登録する(S9)。科目変換マスタが作成/更新されると、ユーザは、科目変換マスタを開き、サジェストされた個別勘定科目と連結勘定科目との対応関係が正しいか否かを確認し、正しい場合には、個別勘定科目と連結勘定科目との対応関係を確定させ、誤っている場合には、対応する連結勘定科目を修正した上で個別勘定科目と連結勘定科目との対応関係を確定させる(S10)。
【0039】
より具体的には、
図4に示す科目変換マスタの表示画面を例に取ると、ユーザは、先頭に雲印が付与されている連結勘定科目名が、元となる個別勘定科目名の連結勘定科目名として相応しいか否かを、英語に翻訳された勘定科目名を参照しつつ判断する。そして、対応する連結勘定科目名として相応しい場合には、「登録」のアイコンをクリックして登録し、相応しく無い場合には、修正する連結勘定科目名のセルをクリックして、プルダウンされた候補から適切な連結勘定科目名を選択して修正した後、登録する。
【0040】
上述したように、本実施の形態では、ローカル言語で表現された個別勘定科目を連結勘定科目に分類するに際して、前処理として、機械翻訳を用いて、ローカル言語で表現された個別勘定科目を英語へと翻訳している。このため、個別勘定科目が、学習済みモデルの学習に使用された言語である英語とは異なるローカル言語で表現されていたとしても、当該学習済みモデルを使用して、対応する連結勘定科目を推定することができる。
【0041】
特に、近年のグローバル化によって、連結財務諸表を作成する際には、複数の海外の国にある子会社、関連会社の財務諸表を連結することも珍しくないが、上述した本実施の形態に係る情報処理方法を用いた場合、このような、複数の海外の国にある子会社、関連会社の財務諸表が、それぞれの国の言語で表現されていたとしても、同一の学習済みモデルを使用して、各ローカル言語で表現された個別勘定科目の連結勘定科目を推定することができる。
【0042】
例えば、英語(第1の言語の一例)とは異なるベトナム語(第2の言語の一例)によって表現された個別勘定科目の連結勘定科目を推定する場合であっても、ベトナム語で表現された文字列であって個別勘定科目を示す対象文字列を英語に機械翻訳した翻訳結果と、上記学習済みモデルと、を用いて対応する連結勘定科目を推定することができる。例えば、ベトナム語で表現された対象文字列であって、ベトナム語における勘定科目を示す対象文字列を機械翻訳することによって得られた英語の文字列を学習済みモデルに入力すると、学習済みモデルは、学習段階で正解ラベルとして付与された複数の日本語の勘定科目の中から、当該対象文字列に対応するであろう一つの勘定科目(日本語)を出力(推定)することができる。また、タイ語(第1及び第2の言語とは異なる第3の言語の一例)によって表現された個別勘定科目の連結勘定科目を推定する場合であっても、タイ語で表現された文字列であって個別勘定科目を示す対象文字列を英語に機械翻訳した翻訳結果と、上記学習済みモデルと、を用いて対応する連結勘定科目を推定することができる。
【0043】
更に、機械学習の段階においても、学習データの元となる英語で表現された勘定科目に関する文字列として、英語以外の言語で公開されている財務諸表にて使用されている勘定科目を英語に機械翻訳した文字列を使用することができる。このため、機械学習の学習用のデータの収集が容易となり、学習用のデータの量を増やすことによって、学習済みモデルの精度を向上させることができる。
【0044】
加えて、このような情報処理方法を用いた場合、個別勘定科目を表現している言語を機械学習に使用された言語に合わせるフェーズと、連結勘定科目の推定を行うフェーズと、が分離されているため、上述したように、原則として、どのグループ会社の個別財務諸表も同一の学習済みモデルを使用して、個別勘定科目を連結勘定科目へと変換する。このため、一つの会社の個別財務諸表をインポートして勘定科目の変換をおこなった際の機械学習の成果を、他のグループ会社の個別財務諸表の個別勘定科目を連結勘定科目へと変換する場合に、使用している言語や、会計システムの相違に拘らず、享受することができる。なお、機械学習実行部18による機械学習は、少なくとも、前回個別財務諸表のインポートから次の個別財務諸表のインポートの間に一度は実行される。
【0045】
また、機械翻訳をする場合の翻訳先の言語に英語を選択したことによって、翻訳先の言語を日本語のような英語以外の言語にした場合と比較して、精度良く機械翻訳を行うことができる。機械翻訳の精度は、英語への翻訳が最も精度が高いと考えられるからである。特に翻訳元の言語が、マイナーな言語の場合、翻訳先の言語を英語にすると機械翻訳の精度が高い。このため、個別勘定科目の翻訳精度、学習データの元となる英語で表現された文字列であって勘定科目に関する文字列の翻訳精度のそれぞれが高いものとなる。また、英語は、元々、単語間の区切りが明確であるため、単語分割の処理が日本語などの言語と比較して容易であることも相俟って、個別勘定科目に対応する連結勘定科目を高い精度で推定することができる。
【0046】
なお、上述した実施の形態では、第1の言語として、英語を例示して説明したが、第1の言語としては、英語以外の他の言語でも良い。第1の言語としては、翻訳サーバ3の翻訳エンジンの精度が高い言語が望ましいが、例えば、日本語やドイツ語などの言語であっても良い。
【0047】
また、上述した説明では、
図2に示すように、参照データに格納されている連結勘定科目を日本語で表現しているが、どのような言語であても良く、例えば、この連結勘定科目は機械翻訳の翻訳先言語(第1の言語、本実施の形態では英語)であっても良い。この場合、学習済みモデルから出力される連結勘定科目も、例えば、上記の例であれば英語となるが、この英語の連結勘定科目と最終的に科目変換マスタの表示画面で表示したい言語の連結勘定科目との対応を連結勘定科目マスタに記憶していれば、画面表示時に変換することができる。
【0048】
また、ローカル言語の一例として、ベトナム語(第2の言語の一例)や、タイ語(第3の言語の一例)を例示して説明をしたが、翻訳サーバ3の翻訳エンジンが機械翻訳できる言語であれば、どのようなローカル言語で記載された個別勘定科目であっても、連結勘定科目に分類することができる。
【0049】
更に、上述した実施の形態では、ローカル言語で表現された個別勘定科目を連結勘定科目に分類することを一例として説明したが、本願発明は、これに限られず、例えば、ローカル言語で記載されている取引データの摘要欄の記載から、当該取引データを所望のグループの勘定科目に仕訳けすることに使用することもできる。
【0050】
更に、上述した会計処理サーバ2や、翻訳サーバ3は、一つのコンピュータに限らず、複数のコンピュータの組み合わせによって構成されていても良い。また、会計処理サーバ2、翻訳サーバ及び端末装置5を接続するネットワーク6は、必ずしもインターネットである必要は無く、少なくとも一部がイントラネットにとって接続されていても良い。
【符号の説明】
【0051】
S2:第2の言語によって表現された文字列であって第2言語における勘定科目を示す文字列を取得、S7:翻訳結果を取得、S8:勘定科目を推定