(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6799981
(24)【登録日】2020年11月26日
(45)【発行日】2020年12月16日
(54)【発明の名称】会計処理装置、会計処理方法及び会計処理プログラム
(51)【国際特許分類】
G06Q 40/00 20120101AFI20201207BHJP
【FI】
G06Q40/00 420
【請求項の数】3
【全頁数】13
(21)【出願番号】特願2016-186069(P2016-186069)
(22)【出願日】2016年9月23日
(62)【分割の表示】特願2016-93978(P2016-93978)の分割
【原出願日】2014年7月14日
(65)【公開番号】特開2017-16696(P2017-16696A)
(43)【公開日】2017年1月19日
【審査請求日】2017年7月12日
【審判番号】不服2019-5780(P2019-5780/J1)
【審判請求日】2019年5月2日
(73)【特許権者】
【識別番号】513056101
【氏名又は名称】フリー株式会社
(74)【代理人】
【識別番号】100174078
【弁理士】
【氏名又は名称】大谷 寛
(72)【発明者】
【氏名】坂本 登史文
【合議体】
【審判長】
渡邊 聡
【審判官】
速水 雄太
【審判官】
相崎 裕恒
(56)【参考文献】
【文献】
特許第5503795(JP,B1)
【文献】
米国特許出願公開第2013/0232042(US,A1)
【文献】
米国特許出願公開第2009/0222365(US,A1)
【文献】
特開2011−170490(JP,A)
【文献】
特開2007−304643(JP,A)
【文献】
特開2004−192564(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q10/00-99/00
(57)【特許請求の範囲】
【請求項1】
ウェブサーバにおけるクラウドコンピューティングによる会計処理を行うための会計処理装置であって、
前記ウェブサーバは、
ウェブ明細データを取引ごとに識別し、
各取引を、前記各取引の取引内容の記載に含まれる複数の日本語のキーワードに基づいて、ラーンド・データベースを参照して、特定の勘定科目に自動的に仕訳し、
前記複数の日本語のキーワードに基づいて参照される前記ラーンド・データベースは、前記ウェブサーバに蓄積された、それぞれが各ユーザーによる勘定科目の修正結果である複数のユーザーのユーザールールを用いた機械学習により生成されることを特徴とする会計処理装置。
【請求項2】
ウェブサーバが提供するクラウドコンピューティングによる会計処理を行うための会計処理方法であって、
前記ウェブサーバが、ウェブ明細データを取引ごとに識別するステップと、
前記ウェブサーバが、各取引を、前記各取引の取引内容の記載に含まれる複数の日本語のキーワードに基づいて、ラーンド・データベースを参照して、特定の勘定科目に自動的に仕訳するステップと
を含み、
前記複数の日本語のキーワードに基づいて参照される前記ラーンド・データベースは、前記ウェブサーバに蓄積された、それぞれが各ユーザーによる勘定科目の修正結果である複数のユーザーのユーザールールを用いた機械学習により生成されることを特徴とする会計処理方法。
【請求項3】
ウェブサーバが提供するクラウドコンピューティングによる会計処理を行うための会計処理プログラムであって、前記ウェブサーバに、
ウェブ明細データを取引ごとに識別するステップと、
各取引を、前記各取引の取引内容の記載に含まれる複数の日本語のキーワードに基づいて、ラーンド・データベースを参照して、特定の勘定科目に自動的に仕訳するステップと
を含み、
前記複数の日本語のキーワードに基づいて参照される前記ラーンド・データベースは、前記ウェブサーバに蓄積された、それぞれが各ユーザーによる勘定科目の修正結果である複数のユーザーのユーザールールを用いた機械学習により生成されることを特徴とする方法を実行させるための会計処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、会計処理装置(accounting apparatus)、会計処理方法及び会計処理プログラムに関し、より詳細には、クラウドコンピューティングによる会計処理を行うための会計処理装置、会計処理方法及び会計処理プログラムに関する。
【背景技術】
【0002】
企業会計は、慣習として発達した企業会計原則に則り実施されることがルールとなっており、当該原則の一つに、損益計算書(P/L)につき「発生主義」の原則がある。発生主義(accrual basis)とは、現金の実際の収入及び支出とは関係なく、収益又は費用の事実が発生した時点で、計上しなければならないとする原則である。これは、収益及び費用を、現金の受渡しの時点で認識する現金主義(cash basis)とは反対の概念である。
【0003】
各企業は、一定期間の収入及び支出を計算し、利益又は損失を算出する決算を行い、決算で作成された賃借対照表(B/S)、損益計算書(P/L)等の財務諸表を会社法の規定に基づき公告することが定められている。特に、日本では、金融商品取引法適用会社については、決算に関して時間的制約が強く、上場企業であれば四半期決算、非上場企業であっても四半期決算又は半年ごとの中間決算が求められる。諸外国においても決算の必要性は同様である。
【0004】
このように、定期的な決算処理が必要であり、かつ、発生主義の原則の下で損益計算書の作成が必須であると、決算期に過大な負担がかかることを避けるために、決算期に振り返って損益計算書を作成するのではなく、日々の業務の中で生じる収益及び費用を、常に、発生主義の原則に沿って言わばデイリーベースで処理していくことが必要となり、実務上もそのように処理がなされている。
【0005】
たとえば、大企業においては、会計処理のための社内システムがあり、発生した取引を勘定科目に仕訳して仕訳データとして登録する作業を、各部門の担当者が日常の業務として行っている。このように仕訳した仕訳データを蓄積していき仕訳帳データ及び総勘定元帳データを作成することによって、各決算期にスピーディーな財務諸表(決算書)の作成が可能となっている。作成された総勘定元帳データから賃借対照表、損益計算書等の財務諸表の作成については、市販の会計ソフトが用いられる場合が多い。
【発明の概要】
【発明が解決しようとする課題】
【0006】
市販の会計ソフトは、このような企業会計実務に対応するために必要な機能を備えているものの、様々な企業の需要に応えることのできる汎用ソフトであることの欠点も抱えている。
【0007】
すなわち、会計処理を要する企業のすべてに対して、発生主義の原則に沿った会計処理をデイリーベースで行うスピード感が求められるわけではないのである。出願人は、大企業ではなく、中小企業、個人事業主等に焦点を当てると、市販の会計ソフトは、その実情に合った機能を提供し得ていないことを見出した。日本を含め、中小企業、個人事業主等に求められる決算は年に一度だけというのが一般的であり、この決算時には法の定めに従い遅滞なく公告を行う必要があるものの、年に一度の決算時に発生主義の原則に沿った仕訳帳データ及び総勘定元帳データが得られれば足りるのであって、デイリーベースの仕訳処理は不要といってよい。
【0008】
本発明は、このような問題点に鑑みてなされたものであり、その目的は、中小企業、個人事業主等、発生主義の原則に従うべき時期的制約が緩やかである事業者に対し、簡便かつ安価な会計処理装置、会計処理方法及び会計処理プログラムを提供することにある。
【課題を解決するための手段】
【0009】
このような目的を達成するために、本発明の第1の態様は、クラウドコンピューティングによる会計処理を行うための会計処理装置であって、ユーザーにクラウドコンピューティングを提供するウェブサーバを備え、前記ウェブサーバは、ウェブ明細データを取引ごとに識別し、各取引を、前記各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳し、日付、取引内容、金額及び勘定科目を少なくとも含む仕訳データを作成し、作成された前記仕訳データは、ユーザーが前記ウェブサーバにアクセスするコンピュータに送信され、前記コンピュータのウェブブラウザに、仕訳処理画面として表示されることを特徴とする。
【0010】
本発明の第2の態様は、第1の態様において、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度は、キーワードごとに正規化されていることを特徴とする。
【0011】
本発明の第3の態様は、第1又は第2の態様において、前記仕訳は、勘定科目ごとに、各キーワードが有する出現頻度をスコアとして合計して、最も高いスコアの勘定科目に自動的に仕訳をすることを特徴とする。
【0012】
本発明の第4の態様は、第3の態様において、一文字の記号又は数字のみのキーワードは、前記スコアの合計において考慮しないことを特徴とする。
【0013】
本発明の第5の態様は、第1から第4のいずれかの態様において、前記仕訳処理画面は、勘定科目を変更するためのメニューを有することを特徴とする。
【0014】
本発明の第6の態様は、第5の態様において、ユーザーが、自動的に仕訳された勘定科目を前記メニューから選択して修正した場合に、取引内容の記載と修正された勘定科目との対応づけを、ユーザーごとのユーザールールとして、前記会計処理装置の記憶部に格納することを特徴とする。
【0015】
本発明の第7の態様は、第6の態様において、前記出現頻度は、前記記憶部に格納された、複数のユーザーのユーザールールに基づいて定められることを特徴とする。
【0016】
本発明の第8の態様は、第7の態様において、前記出現頻度は、各ユーザールールに含まれる取引内容の記載をキーワードに分節し、各キーワードにつき、修正された勘定科目の出現回数のカウントをインクリメントして定められることを特徴とする。
【0017】
本発明の第9の態様は、第1から第8のいずれかの態様において、前記キーワードは、形態素であることを特徴とする。
【0018】
本発明の第10の態様は、第9の態様において、形態素への分節は、ドメイン処理を要することなく行われることを特徴とする。
【0019】
本発明の第11の態様は、ウェブサーバが提供するクラウドコンピューティングによる会計処理を行うための会計処理方法であって、前記ウェブサーバが、ウェブ明細データを取引ごとに識別するステップと、前記ウェブサーバが、各取引を、前記各取引の取引内容
の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳するステップと、前記ウェブサーバが、日付、取引内容、金額及び勘定科目を少なくとも含む仕訳データを作成するステップとを含み、作成された前記仕訳データは、ユーザーが前記ウェブサーバにアクセスするコンピュータに送信され、前記コンピュータのウェブブラウザに、仕訳処理画面として表示されることを特徴とする。
【0020】
本発明の第12の態様は、ウェブサーバが提供するクラウドコンピューティングによる会計処理を行うための会計処理プログラムであって、前記ウェブサーバに、ウェブ明細データを取引ごとに識別するステップと、各取引を、前記各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳するステップと、日付、取引内容、金額及び勘定科目を少なくとも含む仕訳データを作成するステップとを含み、作成された前記仕訳データは、ユーザーが前記ウェブサーバにアクセスするコンピュータに送信され、前記コンピュータのウェブブラウザに、仕訳処理画面として表示されることを特徴とする方法を実行させるための会計処理プログラムである。
【発明の効果】
【0021】
本発明の一態様によれば、ウェブ明細データから識別された各取引を、当該各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳することにより、発生主義の原則に従うべき時期的制約が緩やかである事業者に対し、簡便かつ安価な会計処理装置、会計処理方法及び会計処理プログラムを提供することができる。
【図面の簡単な説明】
【0022】
【
図1】本発明の一実施形態に係る会計処理装置を示す図である。
【
図2】本発明の一実施形態に係る仕訳処理画面を示す図である。
【
図3】自動的に分類された勘定科目の修正時の仕訳処理画面を示す図である。
【
図4】作成された仕訳データの一覧を示す図である。
【発明を実施するための形態】
【0023】
以下、図面を参照して本発明の実施形態を詳細に説明する。
【0024】
(本発明の概要)
本発明は、デイリーベースではなく、事後的に、ウェブ明細データ(online/web statement data)を分析して仕訳処理を行って仕訳帳データを作成する。
【0025】
図1に、本発明の一実施形態に係る会計処理装置を示す。会計処理装置100は、ユーザーにクラウドコンピューティングを提供するウェブサーバ110と、ウェブサーバ110と仮想プライベートネットワーク(VPN)技術により接続されたデータベース120と、データベース120とVPN技術により接続されたスクレイピングサーバ130とを備える。
【0026】
ユーザーは、PC、スマートフォン、タブレット等のコンピュータ140のウェブブラウザを用いて、ウェブサーバ110のURLにアクセスする。ウェブサーバ110は、取り込んだウェブ明細データを取引ごとに識別し、各取引を、各取引の取引内容の記載(description)に基づいて、特定の勘定科目に自動的に仕訳する。金額が正のときは収入、負のときは支出といった仕訳が可能である。ウェブサーバ110は、この際、取引内容の記載を形態素(morpheme)に分節し、各形態素に対応づけられた1又
は複数の勘定科目の出現頻度(occurence rate)を参照して、取引内容の記載が表す勘定科目を推測する。作成された仕訳データは、たとえば日付、取引内容、金額及び勘定科目を少なくとも含み、こうした仕訳データの蓄積が仕訳帳データとなる。
【0027】
なお、ここで「形態素」とは、意味を持つ最小の言語単位をいい、以下、当該用語をもって説明を行うが、本発明においては、必ずしも最小の言語単位ではなく、より広い言語単位のキーワードへの分節を行ってもよい。
【0028】
出現頻度及び仕訳データは、ウェブサーバ110に格納してもよいが、データベース120に格納してもよい。
【0029】
ウェブサーバ110は、作成した仕訳データを含むHTMLプログラムをコンピュータ140に送信し、これは、コンピュータ140のウェブブラウザによって仕訳処理画面として表示され、ユーザーに提示される。本発明の各機能は、Ruby及びMySQLによって実装することができ、一部をHTML中のJavaScript(登録商標)によって実装することができる(たとえば、後述する
図3のコンボボックス301)。つまり、ウェブサーバ110は、Ruby等の言語で記述されたプログラムを実行することにより、各機能を実行する手段として動作し、単一のサーバであっても複数のサーバにより構成されていてもよい。
【0030】
図2に、本発明の一実施形態に係る仕訳処理画面を示す。取り込んだウェブ明細データを取引ごとに識別し、各取引につき、日付欄201(「2014/6/22」)、金額欄202(「-1,530」)、取引内容を示す概要欄203(「ジーユー(登録商標)」)、勘定科目欄204(「消耗品費」)、勘定科目とは別個の区分を設ける摘要タグ欄(図示せず)等が表示されている。
【0031】
ウェブ明細データの取り込みは、ユーザーがCSV等の形式のファイルを自らアップロードすることも可能であるが、本発明の一実施形態では、インターネット上から自動的に取得するウェブ明細データ取得部をさらに設けることができる。具体的には、データベース120とVPN技術により接続されたスクレイピングサーバ130を配置し、ユーザーが登録し、ウェブサーバ110ないしデータベース120に格納された口座番号及びパスワードを読み出して、ウェブスクレイピングによって、金融機関151、クレジットカード会社152、決済業者(例:電子マネーSuica(登録商標))(図示せず)等から各種のウェブ明細データを取得することができる。取得されたウェブ明細データは、ウェブサーバ110ないしデータベース120に格納され、仕訳処理の際に読み出される。
【0032】
また、ウェブスクレイピングではなく、領収書等をカメラで撮影してウェブサーバ110に送信することによって、ウェブ明細データを取得してもよい。この際、スマートフォン、タブレット等の携帯端末用のアプリとして実装すれば、領収書等をアプリに読み込むと、自動的にユーザーのアカウントに取り込まれるようにすることができる。アプリ開発を促すために、ウェブ明細データを取り込むためのAPIを提供することもできる。また、領収書等の電子データを電子メールで受信する場合があるが、この場合に、受信アドレスにユーザーのアカウントと関連づけられたアカウントが含まれるようにすれば、領収書等の電子データを解析してウェブ明細データとして取り込むこともできる。電子データとしては、PDF、画像ファイル、テキストファイル等が挙げられる。また、ウェブサーバ110が受信するのではなく、メールサーバ(図示せず)で受信・解析を行い、得られたウェブ明細データをウェブサーバ110に送信してもよい。また、領収書の他、請求書をカメラで撮影してウェブサーバ110に送信することによって、負債が発生したことの記録も可能である。たとえば、請求書を受け取った時点で、それをカメラ撮影及びOCRにより電子化し、負債として仕訳して登録しておくことで、実際に支払を行わなければならないことのリマインダーとなるし、実際に支払を行ったときには、どの支払予定に対して支払を行ったのかを銀行明細と支払予定との間でマッチングを行うことで管理することができる。このような支払予定(買掛金、未払金等)の消し込みを簡単に行うことや、発生主義にも対応することへのニーズもあり、領収書の画像取り込みも有益な機能である。加えて、このような領収書、請求書等の画像取り込みは、それぞれの仕訳への画像データの紐付けを可能とし、証憑管理を容易にする。また、領収書等の一般的な会計書類のほか、たとえば、電子メールに記載された会計データ、SNS上の投稿に記載された会計データ等、インターネット上でユーザーと関連づけられた会計データを分析して当該ユーザーのアカウントに取り込まれるようにしてもよい。このようにすることで、現金により支払をした際等に支出の管理が容易になる。
【0033】
多くの場合、複数の金融機関、クレジットカード会社、決済業者等が提供する複数の種類のウェブ明細データがウェブサーバ110に取り込まれ、その種類ごとに取引処理画面200に表示してもよいし、
図2に示すように日付の順に表示してもよい。
【0034】
また、
図2では、各取引につき、表示された内容をユーザーが確認して「登録」ボタンを押下することで、仕訳データが作成され、記憶されるように示されているが、「登録」ボタンの押下を不要にして、ウェブサーバ110が自動的に作成した仕訳データをそのまま記憶し、取引処理画面200では、必要な修正のみを行うようにしてもよい。
【0035】
図3に、自動的に分類された勘定科目の修正時の仕訳処理画面を示す。勘定科目欄204がクリックされると、仕訳処理画面200は、他の選択肢を示すプルダウンメニュー等のコンボボックス301を表示する。各選択肢には、ヘルプ302を付けることで経理の知識がなくてもカンタンに適切な勘定科目を選択することができる。コンボボックス301を、図示したような、入れ子式のインタラクティブなもの、すなわちユーザーの選択に応じて更に下位の選択肢が示されるものにすると、ユーザーを感覚的にナビゲートして適切な勘定科目に辿り着かせることができる。
【0036】
修正した結果は、ユーザーごとのユーザールールとしてウェブサーバ110ないしデータベース120に保存され、次回からは、その取引内容に対して修正された勘定科目を表示するようにすることができる。このようにして蓄積された修正結果は、後述するように、各形態素に対応づけられた1又は複数の勘定科目の出現頻度の機械学習による学習済み(ラーンド)データベース(learned DB)の生成に用いられ、これはスタンドアロンアプリケーションではなく、クラウド技術であるからこそ可能となるものである。
【0037】
摘要タグ欄等についても、勘定科目と同様に自動的に摘要タグを割り当てて表示することが可能であり、その場合には、勘定科目欄204と同様にプルダウンメニュー等のコンボボックスの表示、修正結果の保存・利用を行うことができる。
【0038】
上記のように作成された仕訳データは、
図4に示すように、コンピュータ140のウェブブラウザ上で一覧表示させることができる。
【0039】
(仕訳処理の詳細)
本発明において、取引内容の記載が表す勘定科目の推測・推論(inference)は、取引内容の記載を形態素に分節し、各形態素に対応づけられた1又は複数の勘定科目の出現頻度を参照して、当該取引内容の記載が表す勘定科目を推測する。
【0040】
ここで、取引内容の記載が「損害保険ジャパン(登録商標)保険料(インターネット)」の場合を例を考える。この記載を形態素に分かち書きすると、「損害」、「保険」、「ジャパン」、「保険料」、「インターネット」の5つに分節される。ウェブサーバ110は、各形態素につき、ラーンド・データベースから、当該形態素に対応づけられた1又は複数の勘定科目の出現頻度を読み出す。各形態素が有する出現頻度は、たとえば以下のようになる。簡単のため、出現確率が0.01未満のものについては省略している。
【0042】
上記例では、各形態素が有する出現頻度は、合計が1.0となるように正規化された出現確率になっている。正規化を行うと、精度向上を図ることができる。たとえば概要欄203に「○×薬局神田駅東口店」との記載が現れた場合、正規化せずに出現回数を足し合わせると、「○×」や「薬局」よりも「駅」の方がウェブ明細データに含まれる回数が圧倒的に多いため、形態素「駅」から推測される勘定科目である「旅費交通費」が割り当てられることになる。ウェブ明細データに含まれる回数が多い形態素に推測結果が引っ張られてしまうのである。他方、正規化を行うと、形態素「薬局」の有する出現確率は勘定科目「消耗品費」が形態素「駅」による勘定科目「旅費交通費」よりも高い値を示し、「薬局」がウェブ明細データに含まれる回数が「駅」よりは少なくとも、正しく「消耗品費」を推論することができる。
【0043】
ウェブサーバ110は、一態様において、各形態素が有する出現確率を、勘定科目ごとにスコアとして合計する。計算の結果、最も高いスコアの勘定科目を推測結果として割り当てる。上記例では、「ジャパン」は「仕入高」の勘定科目、「インターネット」は「通信費」の勘定科目を最も推測させるが、合計スコアからは「保険料」最も高いスコアの勘
定科目であり、これが割り当てられることとなる。
【0044】
本発明では、未知の取引内容の記載についても、自動的な仕訳をすることができる。取引内容の記載に含まれる各形態素についての予め生成された出現頻度を用いて、初めて処理を行う場合であっても、最も確からしい勘定科目に分類することができる。たとえば、「XYZ損保」という新たな損害保険会社が設立され、これが取引内容の記載に初めて現れた場合、ウェブサーバ110は、これを処理したことがない。しかしながら、ウェブサーバ110は、「XYZ」及び「損保」に分節し、たとえば、「XYZ」についてはラーンド・データベースに出現頻度の登録がなく、「損保」については以下の登録がある場合、推測結果として「保険料」を割り当てることができる。左側が勘定科目、右側が正規化された出現頻度、すなわち出現確率である。
【0046】
本発明では、取引相手を取引内容の記載から特定して、その上で仕訳を行うのではなく、取引内容の記載が表す勘定科目を推測するために必要な限りにおいて情報を抽出すれば足りることに着目している。新会社の設立や、既存の会社の社名変更等への対応は、勘定科目の自動仕訳においてデータベースの定期的メンテナンスを要求するおそれがあるが、本発明では、勘定科目を説明することのできる形態素が取引内容の記載に含まれていれば確からしい勘定科目への分類が可能である。
【0047】
このことは、取引内容の記載がカード会社、決済会社等によって揺らぎがあるという表記ゆれの問題に対して同様である。たとえば、セブンイレブンという事業者は、「セブンイレブン」、「セブン−イレブン」、「セブン―イレブン」等のように、ウェブ明細データ上、一定の表記が必ずしも用いられない。このような場合に、本発明では、いずれの表記についても、同様に「雑費」の勘定科目を推測することができる。たとえば、「セブン−イレブン」の表記が取引内容の記載に現れたとしても、これは「セブン」と「イレブン」に分節され、各形態素につき、以下のような出現頻度がラーンド・データベースから取得される。なお、出現確率が0.05未満のものについては省略している。
【0049】
各形態素が有する出現確率をスコアとして合計すると、勘定科目「雑費」について0.63509というスコアが最も高い値となり、これが推測結果として割り当てられる。この結果は、表記が「セブンイレブン」であっても「セブン−イレブン」であっても同一であり、表記ゆれを補正するための名寄せや、多様な表記に対応するためのドメイン処理が施された特殊な形態素解析用辞書(たとえば、IPA辞書以外のもの)が不要である。このことは、取引内容の記載が表す勘定科目を推測するためには、取引相手自体の特定ではなく、各形態素の説明力を分析することが極めて効率的であることを示している。
【0050】
また、「セブン−イレブン」のハイフン、「水道料4月分」の4などは、複数の勘定科目に出現確率が薄く存在し、いずれの勘定科目にもスパイクが出ないため、スコア計算にあたり考慮せずに除去してもよい。これにより、計算効率向上を図ることができる。
【0051】
(ラーンド・データベースの詳細)
形態素「インターネット」を例として、ラーンド・データベースの生成につき説明する。
【0052】
ユーザーが、ウェブブラウザ上の仕訳処理画面において、勘定科目を変更するためのメニュー301により、推測結果を修正すると、取引内容の記載と修正された勘定科目との対応づけが、ユーザーごとのユーザールールとして、会計処理装置100の記憶部に格納される。
【0053】
そして、一態様においては、各ユーザールールに含まれる取引内容の記載をキーワードに分節し、各キーワードにつき、修正された勘定科目の出現回数のカウントをインクリメントすることにより、出現頻度を、複数のユーザーのユーザールールに基づいて定めることができる。
【0054】
下記表には、複数のユーザーによる修正結果を示している。
【0056】
上記修正結果において、各取引内容の記載を形態素解析し、各形態素の出現頻度を算出すると以下のようになる。出現確率については、各形態素につき、下記表に挙げられている勘定科目のみが、各形態素に対応づけられているものとして、正規化を行っている。
【0058】
したがって、形態素「インターネット」には、勘定科目「通信費」、「保険料」及び「新聞図書費」が対応づけられ、それぞれの出現頻度として、0.60、0.35及び0.05を有する。
【0059】
ラーンド・データベースの生成に用いられるユーザールールは、現在使用されているユーザールールとしてもよいし、ログを含めてもよいし、ログのみとしてもよい。集合知(collective intelligence)を用いることにより、データベースの構築・メンテナンスの負担を軽減することができる。現在使用されているユーザールールのみに基づいてラーンド・データベースを構成すると、周囲のユーザーがどのようなマッチングを行っているかをリアルタイムで反映して推測結果を提示することができる。
【0060】
リアルタイムで反映することの1つのメリットとして、一度、あるユーザーが仕訳を行えば、まったく新しい取引についても、全ユーザーに対して更新された推論アルゴリズムが適用されることになり汎用性があり、運営上はメンテナンスが不要となり、ユーザーエキスペリエンスとしては自動仕訳精度の向上を図ることができる。
【0061】
また、ラーンド・データベースの精度向上のために、ユーザーのセグメント化を行うこともできる。業種、個人・法人の違い等により、セグメント化することにより、同一のキーワードをセグメントに応じて適切に仕訳することができる。たとえば、「○×問屋」との記載が概要欄203に現れた場合、小売業等の法人では「仕入」に該当し、個人事業主では「消耗品」に該当するといったケースが考えられる。また、金額欄202に応じたセグメント化も考えられる。たとえば、10万円未満の「ヨドバシカメラ」は「消耗品」と、10万円以上は「固定資産」にするといったことが考えられる。
【符号の説明】
【0062】
100 会計処理装置
110 ウェブサーバ
120 データベース
130 スクレイピングサーバ
140 コンピュータ
151 金融機関
152 クレジットカード会社
200 取引処理画面
201 日付欄
202 金額欄
203 概要欄
204 勘定科目欄
301 コンボボックス
302 ヘルプ