(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-07
(45)【発行日】2024-11-15
(54)【発明の名称】会計監査支援装置及び会計監査支援方法
(51)【国際特許分類】
G06Q 40/12 20230101AFI20241108BHJP
G06N 20/00 20190101ALI20241108BHJP
【FI】
G06Q40/12
G06N20/00 130
(21)【出願番号】P 2023135880
(22)【出願日】2023-08-23
【審査請求日】2024-02-02
(73)【特許権者】
【識別番号】503093062
【氏名又は名称】有限責任あずさ監査法人
(74)【代理人】
【識別番号】240000327
【氏名又は名称】弁護士法人クレオ国際法律特許事務所
(72)【発明者】
【氏名】白木 研吾
(72)【発明者】
【氏名】須崎 公介
【審査官】関 博文
(56)【参考文献】
【文献】特開2021-043840(JP,A)
【文献】特開2019-067086(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
会計不正のリスクを機械学習モデルを使用して評価するための会計監査支援装置であって、
機械学習に使用可能な複数の訓練レコードを用いて機械学習モデルを生成する学習モデル生成部と、
複数の訓練レコードからなる第1データセットを用いて前記学習モデル生成部によって生成された基本モデル及び前記第1データセットから少なくとも1レコードを除外した第2データセットを用いて前記学習モデル生成部によって生成された複数の検証モデルが記憶された学習モデル記憶部と、
監査対象となる新規レコードに対して、前記基本モデルによる前記新規レコードの出力と、除外するレコードが異なる複数の前記検証モデルによる前記新規レコードの出力とを比較した影響度を算出する影響度算出部と、
前記影響度に基づいて前記新規レコードに類似する訓練レコードを特定する類似データ特定部とを備えたことを特徴とする会計監査支援装置。
【請求項2】
前記影響度は、前記基本モデルによる出力と前記検証モデルによる出力との差分であって、前記差分が最も大きくなる前記検証モデルから除外された訓練レコードが、前記新規レコードに最も類似するとして特定されることを特徴とする請求項1に記載の会計監査支援装置。
【請求項3】
コンピュータ処理によって、会計不正のリスクを機械学習モデルを使用して評価するための会計監査支援方法であって、
複数の訓練レコードからなる第1データセットを用いて機械学習させることで基本モデルを生成するステップと、
前記第1データセットから少なくとも1レコードを除外した第2データセットを用いて機械学習させることで検証モデルを生成するステップと、
前記第2データセットとは異なる訓練レコードを除外したデータセットを用いて機械学習させることで別の検証モデルを生成することを、所望する回数にわたって行うステップと、
監査対象となる新規レコードに対して、前記基本モデルによる出力と複数の前記検証モデルによる出力との差分をそれぞれ算出するステップと、
前記差分が最も大きくなる前記検証モデルから除外された前記訓練レコードを、前記新規レコードに最も類似するとして特定するステップとを備えたことを特徴とする会計監査支援方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、会計不正のリスクを機械学習モデルを使用して評価するための会計監査支援装置及び会計監査支援方法に関するものである。
【背景技術】
【0002】
内部監査や外部監査などの会計監査業務においては、財務諸表などの会計書類に記載された内容に対して、架空取引など不正な取引が存在していないかなどの分析を行い、チェックをすることが行われる(特許文献1,2など参照)。
【0003】
また、特許文献3に開示されているように、機械学習による成果を利用して、コンピュータ処理によって会計不正のリスクを評価させようという試みもある。ここで、機械学習の学習過程で行われる計算は複雑化しており、高い精度での評価を実現できるメリットはあるが、その評価の判断根拠を人間が容易に理解することは困難であることが多い。
【0004】
そこで特許文献3では、機械学習モデルによって出力された評価に対して、機械学習に利用した説明変数となる勘定科目のうち、どの勘定科目が異常となっているかを、SHAP値を算出することで特定できるようにしている。
【先行技術文献】
【特許文献】
【0005】
【文献】特許第7052135号公報
【文献】特開2019-179531号公報
【文献】特許第7216854号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、評価結果に与えた影響が大きい勘定科目が特定されただけでは、架空取引などの会計不正の具体的な状況が把握しにくく、結局は会計監査業務に精通した経験豊富な会計士が、特定された勘定科目の数値に基づいて会計不正の詳細を解明していく必要がある。一方、監査対象に類似する過去の事例が特定できれば、公表された過去の不正手口を参照しやすく、監査手続きの深化につながる。
【0007】
そこで本発明は、監査対象に類似する過去の事例を容易に特定することが可能になる会計監査支援装置及び会計監査支援方法を提供することを目的としている。
【課題を解決するための手段】
【0008】
前記目的を達成するために、本発明の会計監査支援装置は、会計不正のリスクを機械学習モデルを使用して評価するための会計監査支援装置であって、機械学習に使用可能な複数の訓練レコードを用いて機械学習モデルを生成する学習モデル生成部と、複数の訓練レコードからなる第1データセットを用いて前記学習モデル生成部によって生成された基本モデル及び前記第1データセットから少なくとも1レコードを除外した第2データセットを用いて前記学習モデル生成部によって生成された複数の検証モデルが記憶された学習モデル記憶部と、監査対象となる新規レコードに対して、前記基本モデルによる前記新規レコードの出力と、除外するレコードが異なる複数の前記検証モデルによる前記新規レコードの出力とを比較した影響度を算出する影響度算出部と、前記影響度に基づいて前記新規レコードに類似する訓練レコードを特定する類似データ特定部とを備えたことを特徴とする。
【0009】
ここで、前記影響度は、前記基本モデルによる出力と前記検証モデルによる出力との差分であって、前記差分が最も大きくなる前記検証モデルから除外された訓練レコードが、前記新規レコードに最も類似するとして特定される構成であることが好ましい。
【0010】
また、会計監査支援方法の発明は、会計不正のリスクを機械学習モデルを使用して評価するための会計監査支援方法であって、複数の訓練レコードからなる第1データセットを用いて機械学習させることで基本モデルを生成するステップと、前記第1データセットから少なくとも1レコードを除外した第2データセットを用いて機械学習させることで検証モデルを生成するステップと、前記第2データセットとは異なる訓練レコードを除外したデータセットを用いて機械学習させることで別の検証モデルを生成することを、所望する回数にわたって行うステップと、監査対象となる新規レコードに対して、前記基本モデルによる出力と複数の前記検証モデルによる出力との差分をそれぞれ算出するステップと、前記差分が最も大きくなる前記検証モデルから除外された前記訓練レコードを、前記新規レコードに最も類似するとして特定するステップとを備えたことを特徴とする。
【発明の効果】
【0011】
このように構成された本発明の会計監査支援装置及び会計監査支援方法は、機械学習に使用した複数の訓練レコードの中から、監査対象となる新規レコードに類似する訓練レコードを特定することができる。
【0012】
このため、監査対象に類似する過去の事例を容易に特定することができる。要するに、個々の訓練レコードの中から、会計不正のリスクの評価結果に与える影響が大きい訓練レコードが特定できれば、過去の不正事例を参照することができるようになる。類似するとして特定された過去事例は、過去の不正手口が公表されているので、それを参照することで監査手続きの深化につなげることができる。
【図面の簡単な説明】
【0013】
【
図1】本実施の形態の会計監査支援装置の構成を説明するブロック図である。
【
図2】本実施の形態の会計監査支援方法の処理の流れを説明するフローチャートである。
【
図3】本実施の形態の会計監査支援方法の概要を模式的に示した説明図である。
【
図4】機械学習に使用する訓練レコードの説明変数を例示した説明図である。
【
図5】訓練レコードのデータセットを例示した説明図である。
【
図6】監査対象となる新規レコードの基本モデルによる出力を例示した説明図である。
【
図7】新規レコードの基本モデルによる出力と検証モデルによる出力とのスコア差分を例示した説明図である。
【
図8】訓練レコードの属性を例示した説明図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本実施の形態の会計監査支援装置1の構成を説明するブロック図である。また、
図2は、本実施の形態の会計監査支援方法の処理の流れを説明するフローチャートである。
【0015】
本実施の形態の会計監査支援装置1は、内部監査や外部監査などの会計監査の監査対象となる会社の新規レコード(例えば決算年月単位)に対して、会計不正のリスクを機械学習モデルを使用して評価するための装置である。ここで、会計不正のリスクの評価には、現時点での不正検知と、将来の不正予測との両方の意味が含まれる。
【0016】
本実施の形態の会計監査支援装置1では、
図1に示すように、入力装置2や記憶部4などから入力されたデータに基づいて演算処理部3で処理を行い、表示装置5などに評価結果などを表示させる。
【0017】
会計監査支援装置1の演算処理部3は、機械学習に使用する訓練データを設定する訓練データ設定部31と、訓練データに含まれる訓練レコードを用いて機械学習モデルを生成する学習モデル生成部32と、新規レコードに対する訓練レコードの影響度を算出する影響度算出部33と、新規レコードに類似する訓練レコードを特定する類似データ特定部34と、表示装置5への表示内容などを制御する表示制御部35とによって、主に構成される。
【0018】
各種データの入力を行うための入力装置2は、パーソナルコンピュータ(PC)、ノートパソコン、タブレット端末、ウェアラブル端末、スマートフォンなどに接続又は装備されたデータ入力手段である。入力装置2には、例えば、キーボード、マウス、タッチパネル、タッチパッド、スキャナ、音声入力用のマイク、カメラなどが該当する。
【0019】
一方、表示装置5には、液晶ディスプレイ、有機EL(Electro- Luminescence)ディスプレイ、プリンタなどが使用できる。
【0020】
さらに、記憶部4は、演算処理部3における処理に使用する訓練データや、演算処理によって生成されたデータなどを記録させる記憶媒体で、ハードディスク、ソリッドステートドライブ(SSD)、フラッシュメモリ(SDメモリーカードなど)、磁気ディスク、光ディスクなどが該当する。また、ネットワークで接続されるサーバなどの外部のオンラインストレージ(クラウドストレージ)を、記憶部4として使用することもできる。ここで、学習モデル生成部32によって生成された機械学習モデルを記憶させる記憶媒体の領域を、学習モデル記憶部41という符号を付けて区別して説明する。
【0021】
演算処理部3は、ハードウェアとしては、CPU(Central Processing Unit)、MPU(Micro-processing unit)、GPU(Graphics Processing Unit)などによって構成され、RAM(Random Access Memory)やROM(Read Only Memory)などのメモリを備えている。
【0022】
演算処理部3は、コンピュータにインストールされたアプリケーションによって各種機能を実行させることができる。また、インターネットなどのネットワークを介して接続されたサーバなどに、演算処理部3の一部又は全部を実行させることもできる。ネットワークは、インターネット、WAN(Wide Area Network)、有線LAN(Local Area Network)、無線LAN(Wi-Fi)、プロバイダ装置、無線基地局、専用回線などの一部又は全部によって構成される。
【0023】
演算処理部3の訓練データ設定部31では、機械学習に使用可能な記憶部4に記憶された複数の訓練レコードの中から、機械学習モデルを生成するために使用する訓練レコードを任意に設定することができる。
【0024】
そして、学習モデル生成部32では、訓練データ設定部31で設定された複数の訓練レコードからなる第1データセットを用いて機械学習させることで、基本モデルを生成する。本実施の形態では、第1データセットを機械学習に使用可能なすべての訓練レコードの集合として説明する。
【0025】
ここで、
図3は、本実施の形態の会計監査支援方法の概要を模式的に示した説明図である。例えば
図3の左側に示したように、ID(識別子)が1からNまでのN個の訓練レコードが、記憶部4に記憶されていたとする。なお、記憶部4には、別の訓練レコードが記憶されていてもよい。
【0026】
そして、訓練データ設定部31では、N個の訓練レコード(Nレコード)を、機械学習に使用するすべての訓練レコード(全訓練レコード)として設定し、学習モデル生成部32によって機械学習モデルを生成させる。この機械学習モデルを、「基本モデル」と呼ぶこととする。
【0027】
また、学習モデル生成部32では、第1データセット(全訓練レコード)から少なくとも1つの訓練レコード(1レコード)を除外した第2データセットを用いて機械学習させることで、検証モデルを生成する。
【0028】
「第2データセット」という名称は、第1データセットから除外された訓練レコードがあるデータセットの総称で、除外する訓練レコードが異なれば、それに対応する第2データセットがそれぞれ設定される。
【0029】
例えば
図3の右側には、全訓練レコード(Nレコード)からID(識別子)が1の訓練レコード(レコード(1))を除外した第2データセット(N-1レコード)を用いて、機械学習モデルとなる検証モデルを生成させる場合を例示している。
【0030】
続いて、ID(識別子)が2の訓練レコード(レコード(2))を全訓練レコード(Nレコード)から除外した別のデータセットによって機械学習モデルを生成することもでき、この場合は、IDが1の訓練レコードを除外した場合とは異なる検証モデルが生成されることになる。
【0031】
このように全訓練レコード(Nレコード)から除外する訓練レコードのIDを少なくとも1つ決め、その除外された訓練データ(データセット)によって機械学習をさせれば、その訓練データに対応する機械学習ごとの検証モデルが生成されることになる。そこで、これらの除外された訓練レコードがあるデータセットの総称として、「第2データセット」という名称を使用する。
【0032】
このため検証モデルは、設定された第2データセットの数だけ生成されることになる。要するに、訓練レコードを1つずつ除外する場合は、除外する訓練レコード毎に検証モデルが生成される。また、複数の訓練レコードを除外したデータセットを設定する場合は、除外する訓練レコードの組み合わせが変われば、検証モデルも異なることになる。
【0033】
以上のようにして学習モデル生成部32によって生成された学習済みの機械学習モデル(基本モデル、複数の検証モデル)は、学習モデル記憶部41に記憶される。そして、後述する影響度算出部33などの演算時に読み込まれて利用される。
【0034】
影響度算出部33では、監査対象となる新規レコードに対して、全訓練レコードを使用して生成させた基本モデルを用いて、会計不正のリスクの評価結果となるリスクスコア(以下、単に「スコア」ということもある。)を出力する。
【0035】
基本モデルを用いて出力されるスコアは、新規レコードの会計不正リスクを示す値ではあるが、この値を見ただけでは、どのような手口で会計不正が行われているのかがはっきりとせず、具体的な監査のアクションにはつながりにくい。
【0036】
そこで、本実施の形態の会計監査支援装置1では、全訓練レコード(第1データセット)に含まれる訓練レコードの中の指定されたレコードの影響度を、影響度算出部33によって算出する。
【0037】
具体的には、影響度算出部33では、上述のようにして生成させた複数の検証モデルについても、会計不正のリスクの評価結果となるリスクスコアを出力する。要するに、全訓練レコードから除外する訓練レコードが異なる複数の第2データセットに対してそれぞれ生成された検証モデルを用いて、新規レコードのスコアをそれぞれ出力する。
【0038】
影響度算出部33で検証モデルのスコアを算出することにより、除外された訓練レコードのリスクスコアに対する影響度を把握することができるようになる。要するに、基本モデルによる新規レコードのスコアと、検証モデルによる新規レコードのスコアとを比較することで、検証モデルによって裏付けられる各訓練レコードの影響度を算出する。
【0039】
図3を参照しながら説明すると、まず全訓練レコードを使用して生成された基本モデルに対して、新規データとして監査対象となる会社のある決算年月(s)の新規レコードを入力すると、スコア(h
(full)(x
(s)))が算出される。
【0040】
一方、IDが1である訓練レコードを除外した検証モデルについても、新規レコード(s)の入力によってスコア(h(-1)(x(s)))が算出される。この検証モデルのスコアの算出は、生成させた検証モデルの数だけ行うことができる。
【0041】
そして、影響度は、基本モデルによるスコア(h(full)(x(s)))と検証モデルによるスコア(例えばh(-1)(x(s)))との差分(例えばI(1→s)= h(full)(x(s)) - h(-1)(x(s)))として求めることができる。要するにこの差分は、除外された訓練レコード(例えばID=1のレコード)の影響度を示していることになる。
【0042】
このようにして検証モデルごとに影響度を算出すると、それぞれの検証モデルから除外された訓練レコードについて、新規レコードに対して与えている影響の度合いを把握することができるようになる。
【0043】
類似データ特定部34では、影響度算出部33によって算出された影響度に基づいて、新規レコードに類似する訓練レコードを特定する。例えば、基本モデルによって出力されたリスクとの差分が最も大きくなる検証モデルを特定し、その検証モデルから除外された訓練レコードを、新規レコードに最も類似する訓練レコードとして特定する。
【0044】
表示制御部35では、影響度算出部33によって算出された各検証モデルによる影響度や、類似データ特定部34によって特定された訓練レコードなどについて、表示装置5への出力形式などの制御を行う。
【0045】
以下、本実施の形態の会計監査支援方法の処理の流れについて、
図2に示したフローチャートを参照しながら説明する。
【0046】
まずステップS1では、記憶部4に記憶されたデータの中から機械学習に使用可能なすべての訓練レコードを読み込み、訓練データ設定部31において全訓練レコードの設定を行う。例えば
図3の左側に示したように、機械学習に使用可能なN個の訓練レコードを読み込んだ場合に、全訓練レコード(Nレコード)を訓練データとして設定する。
【0047】
N個の訓練レコードにはそれぞれ識別子(ID)が付されており、説明変数xと不正ラベルyというタグの組み合わせになっている。
図4には、会計不正リスクを評価する際に、機械学習に使用する訓練レコードの説明変数として有効と考えられる項目を例示している。
【0048】
例えば、財務諸表に記載されている、棚卸資産回転期間、棚卸資産純資産比率、棚卸資産総資産比率、売上債権増減率、売上高成長率、売上債権増減率を売上高成長率で除した比率、売上債権増減額、売上債権回転期間、売上債権回転期間増減率、有形固定資産残高、のれん純資産割合、繰延税金資産の利益剰余金割合、海外売上高比率、売上高営業利益率、営業外損益、売上高営業外損益率、営業利益営業活動によるキャッシュフロー率、有形固定資産比率などの項目が、説明変数として利用できる。
【0049】
図5は、複数の訓練レコードからなるデータセットを例示した説明図である。1つの会社のレコードであっても、決算年月が異なれば、別の訓練レコードとして利用することができる。訓練レコードは、上記した説明変数の項目の中から選ばれた説明変数(x1-x4)の値と、その訓練レコードに付与された不正ラベルyとの組み合わせになっている。要するに、説明変数(x1-x4)の値を入力した場合の解が不正ラベルyになるという教師データである。ここでは、会計不正があったレコードに付与する不正ラベルyを1とし、会計不正がなかったレコードには不正ラベルyとして0を付与している。
【0050】
このようにして説明できる全訓練レコードを用いて、ステップS1では、学習モデル生成部32によって機械学習を行うことで基本モデルを生成し、学習モデル記憶部41に記憶させる。
【0051】
続いてステップS2では、訓練データ設定部31において全訓練レコードから除外する訓練レコードの設定を行う。例えば
図3の右側に示したように、全訓練レコードからID=1の訓練レコードを除外した訓練データ(N-1レコード)をデータセットとして設定する。
【0052】
そしてステップS3では、訓練データ(N-1レコード)を用いて学習モデル生成部32によって機械学習を行うことで1つ目の検証モデルを生成し、学習モデル記憶部41に記憶させる。
【0053】
ステップS4では、異なる訓練レコードを除外した別のデータセットを用いた検証モデルを生成するか否かの判定を行う。通常は、複数の検証モデルを生成するので、最初のステップS4の通過時には、「YES」に進むことになる。少なくとも不正ラベルyが1となっている訓練レコードについては、それぞれ全訓練レコードから除外したデータセットを設定し、それぞれの検証モデルを生成させる。
【0054】
ステップS4で「NO」に進んだ後には、ステップS5において、監査対象となる新規レコードの基本モデルによるスコアを算出する。
図6は、監査対象となる新規レコードの基本モデルによる出力を例示した説明図である。この例では、監査対象となる会社であるz社の決算年月2023年3月の財務諸表から抜き出された新規レコード(説明変数x1-x4の値)を入力したときに、基本モデルによって演算させた評価結果が、0.326という不正スコアとして出力されたことを示している。
【0055】
この不正スコアは、会計不正がある場合を1としたときの会計不正のリスクの評価結果と言えるが、この数値だけでは、どのよう不正手口による会計不正が行われている可能性があるかといった、具体的な検討を行うことは難しい。
【0056】
そこでステップS6では、新規レコードの検証モデルによるスコアの算出を行う。ここで、検証モデルは、ステップS2,S3によって生成された数だけ使用される。
図7は、新規レコードの基本モデルによる出力と検証モデルによる出力とのスコア差分を例示した説明図である。
【0057】
図7の「A)スコア」欄の基本モデルは、すべて同じ値(不正スコア0.326)となっている。一方、「B)スコア」欄の検証モデルは、検証モデルごとに異なる不正スコアの値となっている。
【0058】
そこでステップS7では、基本モデルと検証モデルとのスコアの差分を算出する。そして、
図7に示したように、スコア差分(A-B)の値の大きい検証モデルから順に並べる。
【0059】
ここで、検証モデルは、全訓練レコードからある訓練レコードを除外したデータセットによる機械学習モデルであるため、除外した訓練レコードがそれぞれのデータセットで1つの場合は、会社名と決算年月で検証モデルを表すことができる。
【0060】
例えば、スコア差分(A-B)が最も大きくなった差分順位1位の検証モデルは、a社の決算年月2006年9月の訓練レコードを除外したデータセットから生成されており、この訓練レコードの新規レコードに対する影響度の大きさを示していると言える。
【0061】
そこでステップS8では、監査対象となる新規レコードに最も類似する訓練レコードとして、a社の決算年月2006年9月の訓練レコードを特定する。要するに、類似データ特定部34によって差分順位を付けて、
図7に例示したように示された一覧表の出力は、スコア差分という影響度に基づいて新規レコードに最も類似する訓練レコードを特定していることになる。
【0062】
会計監査業務を行う者は、このようにして特定されたa社の決算年月2006年9月の過去の不正事例を検討することで、新規レコードに対する具体的な監査のアクションにつなげることができるようになる。
【0063】
ここまでは、説明を簡単にするために、検証モデルは、全訓練レコードから1つずつ訓練レコードを除外して生成させる場合について説明したが、全訓練レコードから複数の訓練レコードを除外したデータセットを用いて検証モデルを作成することもできる。
【0064】
例えば、全訓練レコードから1レコードを除外した検証モデルでは、顕著なスコア差分が出にくい場合があるので、その場合は、複数の訓練レコードを組み合わせて全訓練レコードから除外した検証モデルを生成して、スコア差分の算出を行うことを検討する。
【0065】
しかしながら複数の訓練レコードを組み合わせる場合は、網羅的に行うと計算負荷が膨大になるため、組み合わせの仕方を限定することで、計算コストを抑えることが好ましい。例えば、同じ会社や同業種といったグループでまとめるなどして、有意義な組み合わせにすることができる。
【0066】
図8は、訓練レコードの属性を例示した説明図である。例えば、同じ会社の組での影響を見る場合は、該当する会社の訓練レコードをまとめて除外した検証モデルを生成してスコア差分を計算する。
図8を参照しながら説明すると、a社の影響度を検証したい場合は、レコードIDが(1),(2),(3)の訓練レコードをまとめて除外して検証モデルを生成する。また、b社の影響度を検証したい場合は、レコードIDが(4),(5),(6)の訓練レコードをまとめて除外して検証モデルを生成する。さらに、c社の影響度を検証したい場合は、レコードIDが(7),(8)の訓練レコードをまとめて除外して検証モデルを生成する。そして、d社の影響度を検証したい場合は、レコードIDが(9),(10)の訓練レコードをまとめて除外して検証モデルを生成する。
【0067】
一方、同業種の組での影響を見る場合は、該当する業種の訓練レコードをまとめて除外した検証モデルを生成してスコア差分を計算する。
図8を参照しながら説明すると、業種Aの影響度を検証したい場合は、レコードIDが(1),(2),(3),(4),(5),(6)の訓練レコードをまとめて除外して検証モデルを生成する。また、業種Bの影響度を検証したい場合は、レコードIDが(7),(8)の訓練レコードをまとめて除外して検証モデルを生成する。さらに、業種Cの影響度を検証したい場合は、レコードIDが(9),(10)の訓練レコードをまとめて除外して検証モデルを生成する。
【0068】
次に、本実施の形態の会計監査支援装置1及び会計監査支援方法の作用について説明する。
このように構成された本実施の形態の会計監査支援装置1及び会計監査支援方法は、機械学習に使用した複数の訓練レコードの中から、監査対象となる新規レコードに類似する訓練レコードを特定する類似データ特定部34を備えている。
【0069】
このため、監査対象に類似する過去の事例を容易に特定することができる。要するに、個々の訓練レコードの中から、新規レコードの評価結果に与える影響が大きい訓練レコードが特定できれば、過去の不正事例を参照することができるようになる。
【0070】
類似するとして特定された過去事例は、過去の不正手口が公表されているので、それを参照することで監査手続きの深化につなげることができる。会計上の不正リスクの解釈にあたっては、一般に会計不正は、その手口等が調査報告書等において外部に公表されているケースも多く、類似と判定された過去事例の会計データの関連性に納得できることが多いことから、有効であると考えられる。
【0071】
また、検証モデルを生成する際には、除外するレコードを過去に不正事例があったものだけに限定することで、機械学習モデルの生成に要する計算コストを抑えることが可能になる。要するに、過去の不正事例のみに限定しても、過去の類似事例(不正レコード)を特定したいという目的を満たすことができるためである。
【0072】
以上、図面を参照して、本発明の実施の形態を詳述してきたが、具体的な構成は、この実施の形態に限らず、本発明の要旨を逸脱しない程度の設計的変更は、本発明に含まれる。
【0073】
例えば、前記実施の形態では、説明変数として財務諸表に記載されている項目を例に説明したが、これに限定されるものではなく、各種の会計書類に記載されるような様々なデータを説明変数にすることができる。
【符号の説明】
【0074】
1 :会計監査支援装置
32 :学習モデル生成部
33 :影響度算出部
34 :類似データ特定部
41 :学習モデル記憶部
【要約】
【課題】監査対象に類似する過去の事例を容易に特定することが可能になる会計監査支援装置を提供する。
【解決手段】会計不正のリスクを機械学習モデルを使用して評価するための会計監査支援装置1である。
そして、機械学習に使用可能な複数の訓練レコードを用いて機械学習モデルを生成する学習モデル生成部32と、複数の訓練レコードからなる第1データセットを用いて生成された基本モデル及び第1データセットから少なくとも1レコードを除外した第2データセットを用いて生成された複数の検証モデルが記憶された学習モデル記憶部41と、監査対象となる新規レコードに対して、基本モデルによる出力と、除外するレコードが異なる複数の検証モデルによる出力とを比較した影響度を算出する影響度算出部33と、影響度に基づいて新規レコードに類似する訓練レコードを特定する類似データ特定部34とを備えたことを特徴とする。
【選択図】
図1