IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人 筑波大学の特許一覧

特開2023-44131不正会計検出方法、その装置及びそのプログラム
<>
  • 特開-不正会計検出方法、その装置及びそのプログラム 図1
  • 特開-不正会計検出方法、その装置及びそのプログラム 図2
  • 特開-不正会計検出方法、その装置及びそのプログラム 図3
  • 特開-不正会計検出方法、その装置及びそのプログラム 図4
  • 特開-不正会計検出方法、その装置及びそのプログラム 図5
  • 特開-不正会計検出方法、その装置及びそのプログラム 図6
  • 特開-不正会計検出方法、その装置及びそのプログラム 図7
  • 特開-不正会計検出方法、その装置及びそのプログラム 図8
  • 特開-不正会計検出方法、その装置及びそのプログラム 図9
  • 特開-不正会計検出方法、その装置及びそのプログラム 図10
  • 特開-不正会計検出方法、その装置及びそのプログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023044131
(43)【公開日】2023-03-30
(54)【発明の名称】不正会計検出方法、その装置及びそのプログラム
(51)【国際特許分類】
   G06Q 40/12 20230101AFI20230323BHJP
【FI】
G06Q40/00 420
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021152001
(22)【出願日】2021-09-17
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り ▲1▼2020年9月25日 刊行物「行動計量学」にて発表 ▲2▼2021年6月30日 「AI活用人材育成講座」にて発表
(71)【出願人】
【識別番号】504171134
【氏名又は名称】国立大学法人 筑波大学
(74)【代理人】
【識別番号】110001737
【氏名又は名称】弁理士法人スズエ国際特許事務所
(72)【発明者】
【氏名】東海林 和雄
(72)【発明者】
【氏名】尾▲碕▼ 幸謙
(72)【発明者】
【氏名】中村 亮介
【テーマコード(参考)】
5L055
【Fターム(参考)】
5L055BB64
(57)【要約】
【課題】 会計データの不正手段の種類に対応して、不正会計を検出する不正会計検出方法、その装置及びそのプログラムを提供することにある。
【解決手段】 不正会計検出方法は、不正会計を検出する対象会計データを取得し(S101)、前記対象会計データにおける不正手段の種類に対応する複数の勘定科目の会計数値による複数の非不正会計データとのマハラノビス距離を演算し(S104)、前記複数の勘定科目の会計数値及び前記マハラノビス距離に基づいて、前記対象会計データが不正会計であることを検出する(S105)。
【選択図】図2
【特許請求の範囲】
【請求項1】
不正会計を検出する対象会計データを取得し、
前記対象会計データにおける不正手段の種類に対応する複数の勘定科目の会計数値による複数の非不正会計データとのマハラノビス距離を演算し、
前記複数の勘定科目の会計数値及び前記マハラノビス距離に基づいて、前記対象会計データが不正会計であることを検出すること
を含むことを特徴とする不正会計検出方法。
【請求項2】
前記複数の勘定科目は、前記不正手段の種類による不正会計がされた複数の不正会計データと複数の非不正会計データの各勘定科目の代表値の差に基づいて決定されること
を特徴とする請求項1に記載の不正会計検出方法。
【請求項3】
前記代表値の差は、平均値の差の効果量を用いること
を特徴とする請求項2に記載の不正会計検出方法。
【請求項4】
前記会計数値は、前記対象会計データ以外の会計データと比較するために基準化された数値であること
を特徴とする請求項1に記載の不正会計検出方法。
【請求項5】
前記会計数値は、売上高で基準化されたこと
を特徴とする請求項4に記載の不正会計検出方法。
【請求項6】
機械学習による学習済みモデルを用いて、前記対象会計データが不正会計であることを検出すること
を特徴とする請求項1に記載の不正会計検出方法。
【請求項7】
不正会計を検出する対象会計データを入力する対象会計データ入力手段と、
前記対象会計データ入力手段により入力された前記対象会計データにおける不正手段の種類に対応する複数の勘定科目の会計数値による複数の非不正会計データとのマハラノビス距離を演算するマハラノビス距離演算手段と、
前記複数の勘定科目の会計数値及び前記マハラノビス距離演算手段により演算された前記マハラノビス距離に基づいて、前記対象会計データが不正会計であることを検出する不正会計検出手段と
を備えることを特徴とする不正会計検出装置。
【請求項8】
コンピュータが、不正会計を検出する対象会計データを取得し、
前記コンピュータが、前記対象会計データにおける不正手段の種類に対応する複数の勘定科目の会計数値による複数の非不正会計データとのマハラノビス距離を演算し、
前記コンピュータが、前記複数の勘定科目の会計数値及び前記マハラノビス距離に基づいて、前記対象会計データが不正会計であることを検出すること
を含むように機能させることを特徴とする不正会計検出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、不正会計を検出する不正会計検出方法に関する。
【背景技術】
【0002】
一般に、不正会計を検出する方法が知られている。例えば、財務諸表の変数の異常を検出するために、訓練用データを用いてL1正則化項を離散的に変化させながらグラフィカルlassoによる回帰分析処理を行って訓練済みモデルを取得して、不正の蓋然性が高い会計データを検出することが開示されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-81975号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、不正会計の不正手段には、様々な種類がある。既存の不正会計の検出方法では、不正の蓋然性が高いことが検出できたとしても、それがどのような不正であるかまでは特定されない。このため、会計データの不正箇所を特定するには、多くの労力を要する。
本発明の目的は、会計データの不正手段の種類に対応して、不正会計を検出する不正会計検出方法、その装置及びそのプログラムを提供することにある。
【課題を解決するための手段】
【0005】
本発明の観点に従った不正会計検出方法は、不正会計を検出する対象会計データを取得し、前記対象会計データにおける不正手段の種類に対応する複数の勘定科目の会計数値による複数の非不正会計データとのマハラノビス距離を演算し、前記複数の勘定科目の会計数値及び前記マハラノビス距離に基づいて、前記対象会計データが不正会計であることを検出することを含む。
【発明の効果】
【0006】
本発明によれば、会計データの不正手段の種類に対応して、不正会計を検出する不正会計検出方法、そのシステム及びそのプログラムを提供することができる。
【図面の簡単な説明】
【0007】
図1】本発明の実施形態に係る不正会計検出装置の構成を示す構成図。
図2】本実施形態に係る不正会計検出装置で実行される不正会計検出方法の手順を示すフロー図。
図3】本実施形態に係る基準化処理部における各勘定科目の会計数値を基準化した数値を示す概略図。
図4】本実施形態に係る複数の勘定科目による違和感をイメージ化したイメージ図。
図5】本実施形態に係る不正会計判断部による判断結果の例を示す概略図。
図6】本実施形態に係る不正会計検出方法における複数の勘定科目の選択方法の手順を示すフロー図。
図7】本実施形態に係る不正会計群の一例を示す概略図。
図8】本実施形態に係る非不正会計群の一例を示す概略図。
図9】本実施形態に係る勘定科目の効果量及び共分散行列の一例を示す概略図。
図10】本実施形態に係る不正会計検出方法における違和感を数値化した一例を示す概略図。
図11】本実施形態に係る不正会計検出モデルを機械学習により生成する構成を示す構成図。
【発明を実施するための形態】
【0008】
(実施形態)
図1は、本発明の実施形態に係る不正会計検出装置1の構成を示す構成図である。図2は、本実施形態に係る不正会計検出装置1で実行される不正会計検出方法の手順を示すフロー図である。なお、図面における同一部分には同一符号を付して、重複する説明を適宜省略する。
【0009】
不正会計検出装置1は、財務諸表等の会計データについて、特定の不正手段による不正会計がされているか否かを検出するための装置である。不正会計検出装置1は、主にコンピュータで構成される。コンピュータは、1つに限らず、ネットワークで構成されてもよい。
【0010】
例えば、不正手段は、売上過大(過少)計上、経費過少(過大)計上、架空(簿外)資産計上、架空(簿外)負債計上、又は、純資産過大計上等である。以降では、検出目的の不正手段の種類は、主に売上過大計上として説明する。なお、不正会計検出装置1は、検出する不正手段の種類が選択できるようにしてもよいし、特定の不正手段のみを検出するようにしてもよい。
【0011】
不正会計検出装置1は、入力部11、基準化処理部12、勘定科目選択部13、マハラノビス距離演算部14、不正会計判断部15、出力部16、及び、非不正会計データ群記憶部ST1を備える。
【0012】
入力部11は、不正会計を検出する対象である対象会計データDTを不正会計検出装置1に入力するための入力機器である。対象会計データDTは、財務諸表等の会計情報をデータ化したものである。例えば、入力部11は、キーボード、マウス、データ入力が可能なディスプレイ、各種メディアの読取部、又は、ネットワークと接続するためのネットワークインタフェース等である。入力部11により対象会計データDTが入力されることで、不正会計検出装置1は、対象会計データDTを取得する(ステップS101)。
【0013】
基準化処理部12は、入力部11により入力された対象会計データDTを他の会計データと比較するために基準化する処理を行う(ステップS102)。基準化処理部12は、基準化した対象会計データDTを勘定科目選択部13に出力する。具体的には、図3に示すように、基準化処理部12は、各勘定科目の会計数値を売上高で割ることで基準化する。これにより、各勘定科目の会計数値は、売上高に対する割合又は比を示す。
【0014】
なお、ここでは、売上高を用いて、対象会計データDTを基準化したが、他の会計データと比較できるようにするのであれば、どのように基準化してもよい。例えば、会計数値を総資産で割り、総資産に対する割合で示すことで、対象会計データDTを基準化してもよい。また、不正手段が売上過大計上の場合、売上高で会計数値を基準化するのが望ましいが、売上原価、特定の経費科目、又は、特定の資産・負債・純資産等のうち不正手段の対象とされた勘定科目を基準にした基準化をしてもよい。
【0015】
さらに、基準化処理部12は、無くてもよい。例えば、入力部11により入力される対象会計データDTが基準化されていてもよいし、他の会計データと統計的に比較が可能であれば、基準化をするための演算処理がされなくてもよい。
【0016】
勘定科目選択部13は、不正手段の種類に対応して決定された複数の勘定科目を選択し、選択した各勘定科目の会計数値を取得する(ステップS103)。勘定科目選択部13は、選択した複数の勘定科目のデータをマハラノビス距離演算部14及び不正会計判断部15に出力する。
【0017】
なお、勘定科目選択部13は、2以上のいくつの勘定科目を選択してもよい。また、勘定科目選択部13は、対象会計データDTの全ての勘定科目を選択してもよい。例えば、入力部11により入力される対象会計データDTには、予め選択された勘定科目のみが含まれていてもよい。
【0018】
例えば、選択される勘定科目は、荷造運賃、有形固定資産、土地等、流動資産、預り金等、償却対象有形固定資産、投資キャッシュフロー、流動負債、無形資産、当期株式発行額、短期借入金、負債合計、期末受注残高、資産合計、ソブトウェア、財務キャッシュフロー、期末現金等残高、営業債権、現金預金、又は、役員報酬などの任意の組合せである。
【0019】
例えば、勘定科目選択部13により選択される複数の勘定科目は、不正手段の種類により、実務家がその会計数値の組合せに対して、非不正会計の場合と比べて得られる違和感を持つような歪みが生じやすい勘定科目の組合せである。選択される複数の勘定科目は、不正会計の検出を行う度に決定されてもよいし、予め設定されていてもよい。
【0020】
マハラノビス距離演算部14は、勘定科目選択部13により選択された複数の勘定科目について、非不正会計データ群記憶部ST1に記憶された非不正会計データ群とのマハラノビス距離を演算する(ステップS104)。マハラノビス距離演算部14は、演算したマハラノビス距離を不正会計判断部15に出力する。
【0021】
次に、マハラノビス距離について説明する。マハラノビス距離は、実務家が複数の歪んだ勘定科目を同時に捉えたときに、非不正会計の場合と比べて得られる違和感を数値化したものである。図4は、この違和感をイメージ化したものである(図4は、東海林和雄、外2名、「日本の上場企業における売上過大計上による不正会計の検知--マハラノビス距離を用いた機械学習による方法--」、日本行動計量学会、行動計量学、第47巻第2号(通巻93号)、2020年、129頁の図1から引用した)。図4では、流動資産、無形固定資産、及び、営業キャッシュフローの3変数について、非不正会計企業の平均ベクトルの位置が「非不正会計」と示されている。一方で、ある不正会計企業は「不正会計」と示された箇所に位置する。この非不正会計の平均ベクトルと「不正会計」の「距離」を違和感として数値化したものが、マハラノビス距離に相当する。マハラノビス距離は、次式により求まる。
【0022】
【数1】
【0023】
非不正会計データ群記憶部ST1には、予め不正会計でない多数の非不正会計データが記憶されている。なお、実際には、不正会計でないことを完全に把握することは困難であるため、非不正会計データ群記憶部ST1には、記憶された時点において、不正会計であると判明していない会計データであれば、非不正会計データとしてもよい。また、マハラノビス距離演算部14における演算に用いるために、非不正会計データ群記憶部ST1には、複数の非不正会計データに基づいて演算された演算結果が記憶されていてもよい。
【0024】
不正会計判断部15は、勘定科目選択部13により選択された複数の勘定科目、及び、マハラノビス距離演算部14により演算されたマハラノビス距離を説明変数として、対象会計データDTが不正会計であるか否か判断する(ステップS105)。不正会計判断部15は、説明変数を引数として、判断用関数を用いて、対象会計データDTが不正会計か否かを判断する。
【0025】
例えば、図5に示すように、不正会計判断部15は、流動資産、純資産及び違和感(マハラノビス距離)に基づいて、不正確率を求める。不正会計判断部15は、不正確率が所定以上(例えば、5割以上)であれば、不正会計であると判断し、そうでなければ、不正会計でないと判断する。不正会計判断部15は、対象会計データDTが不正会計であるか否かを示す判断結果を出力部16に出力する。なお、不正会計判断部15は、判断結果を不正確率で示してもよい。
【0026】
判断用関数は、予め不正会計判断部15に設定されていてもよいし、対象会計データDT毎に、不正会計判断部15で自動的に作成されるようにしてもよい。また、判断用関数は、対象会計データDT毎に、用いる説明変数又は条件式等を任意に変更してよい。さらに、判断用関数は、人為的に作成されたプログラム等でもよいし、コンピュータを用いた機械学習による学習済みの予測モデルを実行するプログラム等でもよいし、人とコンピュータが共に介在して作成されたプログラム等でもよい。
【0027】
出力部16は、不正会計判断部15による判断結果を提示する。例えば、出力部16は、ディスプレイへの表示、プリンタの印刷、各種メディアへの書き込み、又は、ネットワーク等を介した他のデバイスへの送信をする。
【0028】
図6は、本実施形態に係る不正会計検出方法における複数の勘定科目の選択方法の手順を示すフロー図である。図7は、複数の不正会計データ(不正会計群)の一例を示す。図8は、複数の非不正会計データ(非不正会計群)の一例を示す。
【0029】
まず、検出目的の特定の種類の不正会計が行われた不正会計データを収集する(ステップS201)。例えば、検出目的の不正会計の種類が売上過大計上である場合、売上過大計上が行われた不正会計データを収集する。
【0030】
次に、不正会計とされていない非不正会計データを収集する(ステップS202)。ここで、企業には、一般に公正妥当と認められた会計原則(例えば、会計基準(Generally Accepted Accounting Principles, GAAP)等)の範囲内で行われる利益調整が認められている。したがって、利益調整された会計データは、不正会計データではない。ここで、不正会計の検出精度を高めるには、利益調整もされていない純正処理の会計データを非不正会計データとして収集することが望ましいが、非不正会計データとして利益調整された会計データが含まれてもよい。
【0031】
ここでは、図7に示す不正会計群と図8に示す非不正会計群が収集されたものとする。図7及び図8に示すように、不正会計群と非不正会計群の各勘定科目について、平均及び標準偏差を求める。次に、次式により、図9に示すように、各勘定科目について、不正会計データ群と非不正会計データ群との間の効果量(Cohen’s d又は絶対値)を求める(ステップS203)。
【0032】
【数2】
【0033】
上式により求めた効果量を歪みの大きさと捉え、各勘定科目について、歪みがあるか否かを判定する。判定結果が「歪みあり」とされた勘定科目が説明変数として選択される(ステップS204)。例えば、効果量が0.8以上を歪みがあると捉えた場合、図9に示すように、売上原価及び流動負債が歪みのある勘定科目となる。したがって、売上原価及び流動負債が選択される。また、選択された売上原価及び流動負債からマハラノビス距離を求めるための共分散行列が求まる。
【0034】
ここで、一般に、2群の差を調べるためには、2群の平均値の差のt検定が用いられる。t検定は、効果の有無を調べるための有意性検定であり、サンプルサイズが非常に大きいと、必ず有意になる。このため、本実施形態では、効果の大きさを示す効果量を用いている。ここでは、効果量の大きさは、ある勘定科目の値に関する他の会計情報との違いの大きさである。
【0035】
なお、効果量に限らず、t検定など他の統計量を用いてもよい。また、2群の差を調べるための各群の代表値は、平均値に限らず、中央値又は最頻値でもよいし、その他のどのような統計量を用いてもよい。
【0036】
図10は、図7及び図8に示す各企業について、売上原価及び流動負債によるマハラノビス距離を違和感として数値化したものである。図10に示すように、不正会計群の方が非不正会計群よりも違和感の数字が全体的に大きくなる傾向がみられる。
【0037】
図11を参照して、不正会計検出モデルを機械学習により生成する方法について説明する。
【0038】
不正会計検出モデルを生成する構成は、訓練データ生成部21、機械学習部22、収集データ記憶部ST2、及び、訓練データ記憶部ST3を備える。なお、不正会計検出モデルを生成する構成は、不正会計検出装置1の一部として実装されてもよいし、不正会計検出装置1とは別の装置(別のコンピュータ)として構成されてもよい。
【0039】
不正会計検出モデルは、不正会計検出装置1の不正会計判断部15において、対象会計データDTが不正会計であるか否かを判断するための判断用関数として用いられる。
【0040】
機械学習をさせるために用いる訓練データを収集するために、複数の企業の複数年分(N社・年分)の財務諸表等の会計データ群FSを収集する。また、収集した会計データ群FSの各会計データが不正会計とされているか否かを確認するために、不正会計に関する公表資料等の公表データ群PDを収集する。なお、個々の会計データが不正会計であるかどうかは、どのような情報に基づいて判断してもよい。
【0041】
収集した会計データ群FS及び公表データ群PDに基づいて、収集データCDを生成する。収集データCDは、収集データ記憶部ST2に記憶される。収集データCDには、1回分(例えば、1つの企業の1年分)の会計データが1つの訓練データを生成するための1つのデータ群として格納される。1つのデータ群には、v個の勘定科目の会計数値を示すv個の変数1~v、及び、不正会計か否かを示す変数が含まれる。不正会計か否かを示す変数は、「Y,N」又は「1,0」等の2値で示される。
【0042】
なお、不正会計か否かを示す変数の代わりに、不正手段の種類を示す多値の変数を用いてもよい。具体的には、非不正会計の他に、「売上過大計上、売上過少計上、経費過大計上、経費過少計上、架空資産計上、簿外資産計上、架空負債計上、簿外負債計上、純資産過大計上」を「イ、ロ、ハ、ニ、ホ、ヘ、ト、チ、リ」として、不正手段の種類を変数で表してもよい。
【0043】
訓練データ生成部21は、収集データ記憶部ST2に記憶された収集データCDに基づいて、訓練データを生成する。訓練データ生成部21は、生成した訓練データを訓練データ記憶部ST3に記憶する。
【0044】
訓練データは、説明変数として、検出目的の不正手段の種類に対応して決定された複数の勘定科目の会計数値、及び、この複数の勘定科目の会計数値による複数の非不正会計データとのマハラノビス距離を含み、目的変数として、不正会計か否かを示す変数を含む。なお、訓練データ生成部21は、会計数値を基準化する演算処理をしてもよいし、基準化された会計数値が収集データ記憶部ST2に記憶されていてもよい。
【0045】
機械学習部22は、訓練データ記憶部ST3に記憶された訓練データに基づいて、会計データが不正会計であるか否かを予測する不正会計検出モデルを構築するための機械学習を行う。機械学習部22は、説明変数から目的変数を導き出すように、教師あり学習を行う。なお、目的変数を不正手段の種類を示す多値の変数とした場合、不正会計検出モデルは、予測する結果として、不正会計である場合の不正手段の種類を提示してもよい。
【0046】
機械学習部22で行われる機械学習のアルゴリズムは、ランダムフォレストが望ましいが、どのように機械学習が行われてもよい。例えば、機械学習のアルゴリズムは、ロジスティック回帰、L1ロジスティック回帰、L2ロジスティック回帰、サポートベクターマシン(線形、ガウシアン、多項式)、ニューラルネットワーク、ディープラーニング、ブースティング、又は、決定木等でもよく、これらを任意に組み合わせてもよい。
【0047】
このようにして、機械学習部22は、機械学習を行うことにより、不正会計検出モデルを生成する。生成された不正会計検出モデルは、そのまま不正会計判断部15の判断用関数として適用してもよいし、強化学習により更新されることを前提とした初期値の関数として用いてもよいし、人為的に修正されてもよい。
【0048】
本実施形態によれば、不正手段の種類に対応して複数の勘定科目を決定し、決定した複数の勘定科目の会計数値及び非不正会計群とのマハラノビス距離に基づいて、会計データが不正会計であることを検出することで、不正会計の検出精度を向上することができる。
【0049】
なお、本発明は上述した実施形態に限定されず、構成要素を削除、付加又は変更等をしてもよい。また、複数の実施形態について構成要素を組合せ又は交換等をすることで、新たな実施形態としてもよい。このような実施形態が上述した実施形態と直接的に異なるものであっても、本発明と同様の趣旨のものは、本発明の実施形態として説明したものとして、その説明を省略している。
【符号の説明】
【0050】
1…不正会計検出装置、11…入力部、12…基準化処理部、13…勘定科目選択部、14…マハラノビス距離演算部、15…不正会計判断部、16…出力部、21…訓練データ生成部、22…機械学習部、ST1…非不正会計データ群記憶部、ST2…収集データ記憶部、ST3…訓練データ記憶部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11