【文献】
Nanxi Wang,Bankruptcy Prediction Using Machine Learning,Journal of Mathematical Finance,2017年,Vol.7,p.908-918
(58)【調査した分野】(Int.Cl.,DB名)
予測対象企業について、複数の財務項目の実績数値により構成された財務数値データから、前記財務数値データが表現されたグラフの画像データを作成するグラフ作成部と、
画像データを分類可能な計算モデルを用いた予測モデルに対し、前記グラフ作成部により作成された前記画像データを入力して演算を行い、前記予測対象企業の財務状況の変化に関する予測結果を出力する予測部とを備えた、予測システム。
前記グラフ作成部は、前記複数の財務項目が収まる数値範囲から、上限側又は下限側の少なくとも一方を省略して狭めた数値範囲で、前記グラフの画像データを作成する、請求項2に記載の予測システム。
前記グラフ作成部は、前記財務数値データの中に前記実績数値が欠損している財務項目が含まれている場合、前記欠損が残った財務数値データから、前記グラフの画像データを作成する、請求項2乃至4の何れか1つに記載の予測システム。
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、企業の財務状況予測のための予測モデルを機械学習によって作成するために、企業の財務数値データを入手しても、全ての財務項目の実績数値が埋まっているとは限らない。財務項目によっては実績数値が欠損している場合(欠損値が存在している場合)がある。このような場合に、欠損値が残る財務数値データをそのまま機械学習の学習用データ(訓練データ)に用いると、機械学習により作成される予測モデルの予測精度に悪影響を与え、十分な予測精度を確保できない虞がある。そのため、実績数値が欠損している財務項目に対し、適切な数値を算出して当てはめる欠損値処理が必要となる。しかし、この欠損値処理には比較的大きな手間を要する。
【0007】
また、企業の財務状況予測にあたって予測対象企業の財務数値データを入手する場合においても、実績数値が欠損している財務項目が含まれている場合がある。このような場合に、欠損値が残る財務数値データをそのまま予測モデルに入力しても、適切な予測結果を得ることができない虞がある。
【0008】
本発明は、このような事情に鑑みてなされたものであり、企業の財務数値データの中に欠損値が含まれている場合であっても、少ない手間で十分な予測精度の財務状況予測を実現することを目的とする。
【課題を解決するための手段】
【0009】
上述の課題を解決するべく、第1の発明は、複数の財務項目の実績数値により構成された企業の財務数値データから、前記財務数値データが表現されたグラフの画像データを作成するグラフ作成部と、複数の企業の各々について、グラフ作成部により作成された画像データと、財務数値データの対象期間後における企業の財務状況の変化に対応した学習用ラベルとが対応付けられた学習用データを取得し、複数の企業についての学習用データを用いた機械学習によって、予測対象企業の財務状況の変化に関する予測結果を出力する予測モデルを作成又は更新する機械学習部とを備えた、機械学習装置である。
【0010】
第2の発明は、予測対象企業について、複数の財務項目の実績数値により構成された財務数値データから、財務数値データが表現されたグラフの画像データを作成するグラフ作成部と、画像データを分類可能な計算モデルを用いた予測モデルに対し、グラフ作成部により作成された画像データを入力して演算を行い、予測対象企業の財務状況の変化に関する予測結果を出力する予測部とを備えた、予測システムである。
【0011】
第3の発明は、第2の発明において、グラフ作成部は、複数の財務項目が収まる数値範囲から、上限側又は下限側の少なくとも一方を省略して狭めた数値範囲で、グラフの画像データを作成する。
【0012】
第4の発明は、第2又は第3の発明において、グラフ作成部は、複数の財務項目の各々について実績数値を棒グラフで表したグラフの画像データを作成する。
【0013】
第5の発明は、第2乃至第4の何れか1つの発明において、グラフ作成部は、財務数値データの中に実績数値が欠損している財務項目が含まれている場合、欠損が残った財務数値データから、グラフの画像データを作成する。
【0014】
第6の発明は、第2乃至第5の何れか1つの発明において、財務数値データにおける各財務項目には、実績数値がパーセント表示される項目が用いられ、グラフ作成部は、各財務項目についてパーセント表示の実績数値が表されたグラフの画像データを作成する。
【0015】
第7の発明は、第2乃至第6の何れか1つの発明において、予測モデルは、予測対象企業の倒産リスクを予測するモデルである。
【0016】
第8の発明は、コンピュータに、予測対象企業について、複数の財務項目の実績数値により構成された財務数値データから、財務数値データが表現されたグラフの画像データを作成するグラフ作成ステップと、画像データを分類可能な計算モデルを用いた予測モデルに対し、グラフ作成部により作成された画像データを入力して演算を行い、予測対象企業の財務状況の変化に関する予測結果を出力する予測ステップとを実行させるためのプログラムである。
【発明の効果】
【0017】
第1の発明では、財務数値データをそのまま学習用データとして用いず、財務数値データが表現されたグラフの画像データを作成して、その画像データを学習用データとして用いて機械学習を行う。ここで、本願発明者は、企業の財務状況予測において、企業の財務数値データに欠損値が含まれる場合であっても、上述の機械学習により十分な予測精度の予測モデルを作成できることを確認している。また、財務数値データからのグラフの画像データの作成は、コンピュータで容易に行うことができ、上述の欠損値処理に比べて手間が少ない。第1の発明によれば、企業の財務数値データに欠損値が含まれる場合であっても、少ない手間で十分な予測精度の財務状況予測を実現することができる。
【0018】
第2及び第8の各発明では、予測対象企業の財務数値データが表現されたグラフの画像データを作成して、その画像データを予測モデルに入力する。ここで、本願発明者は、企業の財務状況予測において、予測対象企業の財務数値データに欠損値が含まれる場合であっても、上述の画像データへの変換によって十分な予測精度が得られることを確認している。また、グラフの画像データの作成は、上述したように手間が少ない。第2及び第8の各発明によれば、企業の財務数値データの中に欠損値が含まれる場合であっても、少ない手間で十分な予測精度の財務状況予測を実現することができる。
【発明を実施するための形態】
【0020】
以下、本発明の実施形態を詳細に説明する。なお、以下の実施形態は、本発明の一例であって、本発明、その適用物、あるいはその用途の範囲を制限することを意図するものではない。
【0021】
[1.機械学習装置の構成]
機械学習装置10は、複数の企業の各々についての財務数値データ13に対し所定のデータ処理を施し、そのデータ処理が施された学習用データを用いたニューラルネットワークの機械学習によって、予測対象企業の財務状況の変化に関する予測結果を出力する予測モデル(学習済みモデル)を作成する装置である。所定のデータ処理は、財務数値データ13を、その財務数値データ13が表現されたグラフ(以下、「企業財務グラフ」という。)の画像データ20(例えば、拡張子png又はjpegなどの画像データ)に変換する処理である。また、本実施形態では、予測モデルが、予測対象企業の倒産リスクを予測するモデルであり、予測対象企業が倒産するか否かを予測結果として出力する。なお、機械学習装置10は、新たな財務数値データ13を学習用データとして用いて、予測モデルの更新を行うことも可能である。
【0022】
機械学習装置10は、GPU及びメモリーを備えた、1つ又は複数のコンピュータ(パーソナルコンピュータ、サーバー等)により構成されている。本実施形態では、ニューラルネットワークとして、畳み込みニューラルネットワーク(Convolutional Neural Network:以下、「CNN」と言う。)が採用されている。なお、画像の分類に適用可能なニューラルネットワークであれば、CNN以外のものを採用してもよい。また、機械学習とは、ニューラルネットワークのパラメータ(重み、バイアス)を最適化する処理である。なお、機械学習装置10は、GPUとCPUの両方を備えたコンピュータにより構成されていてもよいし、CPUを備えたコンピュータにより構成されていてもよい。
【0023】
機械学習装置10は、
図1に示すように、財務数値データ13を格納するデータ記憶部12と、財務数値データ13から企業財務グラフの画像データ20を作成するグラフ作成部14と、画像データ20を学習用データとして用いた機械学習によって予測モデルを作成する機械学習部16と、機械学習部16による学習結果に基づいてニューラルネットワークのパラメータを更新するパラメータ更新部26とを備えている。データ記憶部12は、メモリーにより構成されている。メモリーには、CNNを含む学習用プログラムも格納されている。グラフ作成部14と機械学習部16とパラメータ更新部26とは、コンピュータのGPUが学習用プログラムを実行及び解釈することによって実現される機能ブロックである。
【0024】
データ記憶部12は、複数の企業P〜P−x(例えば500程度の企業)について単年度の財務数値データ13が配列された表データ15(
図2参照)を格納している。各企業の財務数値データ13は、複数種類(例えば190種類)の財務項目A〜Zの実績数値により構成されている。財務項目は、企業の財務状態を表す項目である。全ての財務項目A〜Zには、パーセント表示される財務指標が用いられている。財務項目A〜Zとしては、例えば、売上高増加率、営業利益率、自己資本比率、総資産利益率、株主資本利益率などを用いることができる。表データ15では、ほとんどの財務項目A〜Zに対し実績数値が入力されているが、一部に実績数値が欠損している財務項目がある。
【0025】
また、表データ15では、互いに関連する財務項目が連続して並ぶように、財務項目A〜Zの配列順番(
図2における縦方向の配列順番)が定められている。なお、互いに関連する財務項目の一例は、例えば、総資産利益率と株主資本利益率のように利益率に関する財務項目同士である。
【0026】
また、表データ15に記述された全ての企業P〜P−xは、存続企業と倒産企業とに分けられる。
図2に示す表データ15の最終行には、各企業P〜P−xに対し、存続企業であるか倒産企業であるかを示す学習用ラベルが付されている。学習用ラベルは、財務数値データ13の対象期間後における企業の財務状況の変化(悪化したか否か)に対応した内容となっている。なお、表データ15では、存続企業と倒産企業ともに複数の企業の財務数値データ13が準備されている。また、表データ15における各倒産企業の財務数値データ13の対象期間は、例えば倒産した年度の1つ前の年度である。
【0027】
グラフ作成部14は、データ記憶部12から企業の財務数値データ13を取得し、その財務数値データ13が表された1つの企業財務グラフの画像データ20(
図3参照)を作成する。グラフ作成部14は、データ記憶部12に格納されている全ての企業について財務数値データ13を取得し、企業毎に企業財務グラフの画像データ20を作成する。なお、
図3に示す画像データ20では、各棒グラフBをグレースケールで表現しているが、各棒グラフBをカラーで表現してもよい。
【0028】
企業財務グラフでは、各財務項目A〜Zに対して棒グラフBが用いられている。横軸上では各財務項目A〜Zの位置が定められている。実績数値が存在する財務項目A〜Zについて、全ての財務項目A〜Zの棒グラフBは横軸に沿って順番に並んでいる。実績数値が欠損している財務項目については棒グラフBが表示されない。また、企業財務グラフの縦軸は、各財務項目A〜Zの実績数値の大きさを表す。なお、
図3では、画像データ20について、横のピクセル数がX(例えば、X=500)で表され、縦のピクセル数がY(例えばY=200)で表されている。
【0029】
具体的に、企業財務グラフでは、各棒グラフBの長さが各財務項目A〜Zの数値の大きさを表す。
図3に示す波線Dをゼロとして、プラスの財務項目は波線Dより上側に延び、マイナスの財務項目は波線Dより下側に延びている。また、企業財務グラフでは、横軸上において隣り合う財務項目A〜Zの棒グラフBが隙間なく並んでいる。また、企業財務グラフにおける財務項目A〜Zの順番は、表データ15における財務項目A〜Zの配列順番と同じである。そのため、企業財務グラフでは、互いに関連する財務項目の棒グラフBが連続して並ぶ。なお、波線Dは、説明のために
図3に記載しているが、画像データ20では記載を省略する。画像データ20では縦軸も横軸も記載されていない。また、画像データ20では凡例や軸目盛などの他の要素も記載されていない。
【0030】
また、企業財務グラフの縦軸について、財務項目A〜Zが収まる数値範囲(財務項目A〜Zの中における最小値から最大値までの範囲)よりも狭く、マイナスの下限値からプラスの上限値までのゼロを含む数値範囲(例えば−30%〜80%)に調整している。縦軸の数値範囲は、上限値(80%)の方が下限値(−30%)よりも絶対値が大きい。グラフ作成部14は、複数の財務項目が収まる数値範囲から、上限側(80%〜最大値)と下限側(最小値〜−30%)の両方を省略して狭めた数値範囲で、企業財務グラフの画像データ20を作成する。
【0031】
機械学習部16は、上述したように、畳み込みニューラルネットワークにより構成されている。機械学習部16は、複数組の畳み込み層17及びプーリング層18と、多層ニューラルネットワーク構造19とを備えている。多層ニューラルネットワーク構造19は、ネットワーク構造とパラメータ(重みとバイアス)とを有し、学習前は各パラメータに初期値が設定されている。
【0032】
畳み込み層17は、入力された画像データ20(全画素)に対し畳み込み演算を行うことによって複数の一次特徴マップ21を抽出する。畳み込み演算では、例えば縦サイズも横サイズも5ピクセルのフィルタが用いられる。フィルタの横サイズは棒グラフBの幅と同程度にしている。また、ストライドは1ピクセルに、パディングは0ピクセルに設定されている。ストライドは棒グラフBの幅より小さくしている。なお、フィルタのサイズ、ストライド、及びパディングは、この段落の数値に限定されない。
【0033】
プーリング層18は、畳み込み層17から出力された複数の一次特徴マップ21の各々に対しプーリング(例えばマックスプーリング)を行う。マックスプーリングは、特徴マップの全ピクセルにおける最大値を代表値として採用する処理である。プーリング層18では、一次特徴マップ21よりピクセル数が少ない二次特徴マップ22が、一次特徴マップ21と同数作成される。
【0034】
プーリング層18の後段には、2組目の畳み込み層及びプーリング層が設けられている(図示省略)。2組目の畳み込み層及びプーリング層では、各二次特徴マップ22に対する畳み込み演算によって三次特徴マップが抽出され、三次特徴マップに対するプーリング(例えばマックスプーリング)により四次特徴マップが作成される。機械学習部16では、畳み込み演算とプーリングとが複数回繰り返される。最終段のプーリング層18では、直前の畳み込み層17から出力されたN−1次特徴マップ23に対するプーリング(例えばマックスプーリング)によりN次特徴マップ24が作成される。
【0035】
多層ニューラルネットワーク構造19は、
図4に示すように、全結合層29と出力層30とを備えている。全結合層29には、最終段のプーリング層18から出力された複数のN次特徴マップ24が入力される。全結合層29は、複数の層から構成されており、各層は複数のユニット(ニューロン素子)により構成されている。出力層30は1つユニットにより構成されている。全結合層29では、隣り合う層間において前側層の各ユニットが後側層の全ユニットと繋がり、最終層の各ユニットは出力層30のユニットに繋がる。
【0036】
全結合層29及び出力層30では、ユニットの出力値yが、式1によって表される。式1において、f( )は活性化関数(例えばシグモイド関数)、xnは前側層のn番目のユニットからの入力信号(入力値)、wnは前側層のn番目のユニットからの入力信号に対する重み、bはバイアス(閾値)を表す。多層ニューラルネットワーク構造19では、誤差逆転伝搬法による学習により各層の重みwnとバイアスbとを更新する。
式1:y=f(w1×x1+w2×x2+・・・+wn×xn−b)
【0037】
[2.機械学習装置の動作]
図5を参照しながら、コンピュータにより構成される機械学習装置10の動作について説明する。なお、データ記憶部12には多数の企業の財務数値データ13が格納されているものとする。また、データ記憶部12には、各パラメータに初期値が設定された畳み込みニューラルネットワークが格納されている。
【0038】
機械学習装置10では、学習用プログラムを実行することによって機械学習方法を構成する情報処理が開始される。まずステップS51において、グラフ作成部14は、データ記憶部12から企業の財務数値データ13を取得する。次に、ステップS52において、グラフ作成部14は、ステップ51において取得された財務数値データ13から企業財務グラフの画像データ20を作成する。なお、クラブ作成部14は、財務数値データ13の中に実績数値が欠損している財務項目が含まれている場合、その財務項目に数値データを入れずに、企業財務グラフの画像データ20を作成する。つまり、欠損値を含む財務数値データ13がそのまま用いられる。グラフ作成部14は、データ記憶部12から全ての企業の財務数値データ13を取得し、企業毎に企業財務グラフの画像データ20を作成する。
【0039】
次に、ステップS53において、機械学習部16は、企業毎に、企業財務グラフの画像データ20と学習用ラベルとを取得する。そして、機械学習部16は、全ての企業について、企業財務グラフの画像データ20を畳み込みニューラルネットに入力して演算を行い、その企業財務グラフに対応する学習用ラベルの値(例えば、倒産企業=0、存続企業=1)に対する出力層30の出力値の誤差を出力する。次に、機械学習部16は、全ての企業についての誤差の集計値がゼロに近づくように各パラメータを算出する。パラメータ更新部26は、メモリーにおけるニューラルネットワークの各パラメータを、機械学習部16による算出値に更新する。以上により、予測モデルの学習済みモデルが得られ、
図5に示すフローチャートの処理は終了する。
【0040】
[3.予測システムの構成]
予測システム40は、
図6に示すように、予測対象企業の財務数値データ13を受け付けるデータ受付部41と、データ受付部41によって受け付けられた予測対象企業の財務数値データ13から企業財務グラフの画像データ20を作成するグラフ作成部42と、学習済みの予測モデル(機械学習装置10によって作成された予測モデル)を格納するモデル記憶部43と、グラフ作成部42において作成された企業財務グラフの画像データ20を予測モデルに入力して予測対象企業の倒産予測を行う予測部44と、予測部44による予測結果を画面に表示させるための表示部46とを備えている。なお、予測システム40は、GPU及びメモリーを備えた、1つ又は複数のコンピュータ(パーソナルコンピュータ等)によって構成されている。
【0041】
モデル記憶部43は、メモリーにより構成されている。データ受付部41とグラフ作成部42と予測部44と表示部46とは、コンピュータのGPUが予測モデル(CNN)を含む倒産予測プログラムを実行及び解釈することによって実現される機能ブロックである。グラフ作成部42は、機械学習装置10のグラフ作成部14と同じ処理を行う。
【0042】
データ受付部41は、倒産予測プログラムの実行中に、ユーザが予測モデルに入力した予測対象企業の財務数値データ13を受け付ける部分である。例えばプログラムの起動画面においてユーザが予測対象企業の財務数値データ13に対し入力操作を行うと、データ受付部41は、財務数値データ13を受け付ける。そして、グラフ作成部42は、データ受付部41によって受け付けられた財務数値データ13を取得し、企業財務グラフの画像データ20を作成する。
【0043】
予測部44は、グラフ作成部42によって作成された企業財務グラフの画像データ20を取得すると共に、モデル記憶部43から予測モデル(ネットワーク構造及び各パラメータ)を読み出す。そして、予測部44は、企業財務グラフの画像データ20を予測モデルに入力して予測モデルの演算を行う。これにより、予測モデルの出力層30から、予測対象企業が存続するか倒産するかを表す予測結果(数値)が出力される。
【0044】
[4.予測システムの動作]
図7を参照しながら、コンピュータにより構成される予測システム40の動作について説明する。なお、予測システム40は、インターネット又は記録媒体を介して、予測対象企業の財務数値データ13を取得してメモリーに格納している。
【0045】
予測システム40では、倒産予測プログラムを実行することによって倒産予測方法を構成する情報処理が開始される。倒産予測プログラムの実行により、まず倒産予測プログラムの起動画面が立ち上がる。そして、ユーザの操作によって予測対象企業の財務数値データ13が予測モデルへの入力データとして選択されると、ステップS71において、データ受付部41が、予測対象企業の財務数値データ13を受け付ける。
【0046】
次に、ステップS72(グラフ作成ステップ)において、グラフ作成部42は、ステップ71において取得された財務数値データ13から企業財務グラフの画像データ20を作成する。クラブ作成部42は、財務数値データ13の中に実績数値が欠損している財務項目が含まれている場合は、その財務項目に数値データを入れずに、企業財務グラフの画像データ20を作成する。
【0047】
次に、ステップS73(予測ステップ)において、予測部44は、ステップS72において作成された企業財務グラフの画像データ20を取得すると共に、モデル記憶部43から予測モデル(ネットワーク構造及び各パラメータ)を読み出す。そして、予測部44は、企業財務グラフの画像データ20を予測モデルに入力して予測モデルの演算を行う。これにより、予測モデルの出力層30から、予測結果を表す数値が出力される。表示部46は、その数値を「倒産」又は「存続」の文字データに変換し、コンピュータの画面上に表示させる。以上により、
図7に示すフローチャートの処理は終了する。
【0048】
ここで、機械学習装置10により実際に作成された予測モデル(以下、「作成モデル」という。)の予測精度について、本願発明者による評価方法及び評価結果を説明する。評価には、多数の企業の財務数値データ13と共に、各財務数値データ13に対応する企業が実際に存続しているか又は倒産しているかを表す実情報とを用いた。評価は、作成モデルに対し各企業の財務数値データ13を入力して演算を行い、実情報(存続又は倒産)に対する作成モデルの出力の正答率を算出することにより行った。なお、財務数値データ13には欠損値が含まれていた。
【0049】
なお、グラフ作成部14によって作成された画像データ20のサイズは、横方向のピクセル数Xが680ピクセル、縦方向のピクセル数Yが280ピクセルであった。また、画像データ20における縦軸の数値範囲については、3通りの下限値(−10%、−20%、−30%)と、3通りの上限値(80%、90%、100%)とを組み合わせた9通りを選択した。表1は、作成モデルについて各数値範囲の正答率(予測結果)を表している。表1に示すように、低くても約70%の正答率が得られ、−30%〜80%の数値範囲を選択した時には約95%の正答率が得られた。
【0051】
[5.実施形態の効果など]
本実施形態では、財務数値データ13が表現された企業財務グラフの画像データ20を学習用データとして用いて機械学習を行うことで、企業の財務数値データ13に欠損値が含まれる場合であっても、少ない手間で十分な予測精度の倒産予測を実現することができる。また、財務数値データ13の実績数値を正規化しなくても、十分な予測精度の倒産予測を実現することができる。なお、財務数値データ13の実績数値を正規化した数値データから、企業財務グラフの画像データ20を作成することも可能である。
【0052】
また、本実施形態では、予測モデルへの入力データとして、財務数値データ13が可視化された画像データ20が用いられる。そのため、ニューラルネットワークにおけるブラックボックスの問題が生じにくく、予測結果に影響を与える財務項目を把握しやすくなる。
【0053】
また、本実施形態では、企業財務グラフの縦軸の数値範囲について、各財務項目が収まる数値範囲から、上限側と下限側を省略した企業財務グラフの画像データ20を作成している。これにより、倒産予測への影響が高い領域を中心に機械学習又は倒産予測が行われるため、予測精度を向上させることができる。なお、企業財務グラフの縦軸の数値範囲は、上限側と下限側のうち上限側だけを省略してもよいし、下限側だけを省略してもよい。
【0054】
また、本実施形態では、横軸上において隣り合う財務項目の棒グラフBが隙間なく並ぶ企業財務グラフの画像データ20を作成している。そのため、無駄な画素が減少し、予測精度を向上させることができる。
【0055】
また、本実施形態では、縦軸と横軸の両方の記載を省略した企業財務グラフの画像データ20を作成している。そのため、倒産予測に関係がない軸の情報がニューラルネットワークへの入力データに含まれないため、予測精度を向上させることができる。なお、企業財務グラフは、縦軸と横軸のうち縦軸だけを省略してもよいし、横軸だけを省略してもよい。
【0056】
[6.その他の変形例]
上記実施形態では、各企業について単年度分の財務数値データ13を使用したが、複数年度分の財務数値データを使用してもよい。この場合、例えば、
図8に示すように、企業財務グラフの画像データ20は、各年度の財務数値データ13から作成した企業財務グラフを横軸に沿って連続的に並べた画像データ31とすることができる。また、各財務項目を棒グラフBで表現せずに、
図9に示すように、各財務項目について複数年分(倒産の5年前から1年前までの5年分)の実績数値の時系列変化を折れ線グラフLによって表した画像データ32を作成してもよい。欠損値がある財務項目については、欠損値の年度で折れ線グラフLが切れており、その年度とその前後の年度とを結ぶ線は表示されない。なお、
図9に示す画像データ20は、各折れ線グラフLをグレースケールで表現しているが、各折れ線グラフLをカラーで表現してもよい。
【0057】
また、上記実施形態では、財務数値データ13の中に欠損値が含まれている場合、欠損値処理を行わずに企業財務グラフの画像データ20を作成したが、欠損値処理を行った後に企業財務グラフの画像データ20を作成してもよい。
【0058】
また、上記実施形態では、全ての財務項目についてパーセント表示される財務項目を用いたが、パーセント表示されない財務項目(例えば、売上高、営業利益)を用いてもよい。
【0059】
また、上記実施形態において、機械学習に用いる倒産企業の財務数値データ13について、例えば倒産した年度の1つ前の年度のデータだけを用いているが、このようなデータに限定されず、例えば倒産した年度の2つ前の年度のデータが混在していてもよい。
【0060】
また、上記実施形態において、機械学習装置10によって、予測対象企業が成長するか否かを予測する予測モデルを作成してもよく、予測システム40は、予測対象企業が成長するか否かを予測結果として出力してもよい。この場合、学習用データとしては、例えば、財務数値データ13の対象期間後に株価が上昇した成長企業と、それ以外の企業とに分類して学習用ラベルを付けて機械学習を行ってもよい。また、財務数値データ13の対象期間後に売上高と経常増益率の両方が上昇した企業を成長企業とすることもでき、経常増益率の代わりに、経常利益、営業利益、又は粗利益などを用いることもできる。
【0061】
また、上記実施形態において、マルチラベルに対応可能なニューラルネットワークを予測モデル(例えば、出力層30に複数のユニットが設けられたニューラルネットワーク)に用いてもよい。この場合、学習用データとしては、例えば、倒産企業と、成長企業(例えば、株価が所定レベル以上に上昇した企業)と、これら以外の企業とに分類して学習用ラベルを付けて機械学習を行ってもよい。
【0062】
また、上記実施形態において、倒産した年度の1つ前の年度(n年度)の財務数値データ13だけを用いて機械学習した第1予測モデルと、倒産した年度の2つ前の年度(n−1年度)の財務数値データ13だけを用いて機械学習した第2予測モデルとを生成してもよい。この場合、第1予測モデルと第2予測モデルとの各々に対し予測対象企業の財務数値データ13を入力することで、1年後に倒産するか否か又は2年後に倒産するか否かを予測することができる。
【0063】
また、上記実施形態において、予測モデルは、予測対象企業の倒産確率(又は成長確率)を算出するように構成されていてもよい。この場合、例えば、多層ニューラルネットワーク構造19の後段に、出力層30の出力値に基づいて予測対象企業の倒産確率を算出する確率算出部を設ける。例えば、出力層30の出力値がゼロの場合に「100%倒産」と予測され、出力値が1の場合に「100%存続」と予測される場合に、ゼロと出力値との差に基づいて倒産確率を算出する。
【解決手段】機械学習装置は、複数の財務項目の実績数値により構成された企業の財務数値データ13から、財務数値データ13が表現されたグラフの画像データ20を作成するグラフ作成部14と、複数の企業の各々について、グラフ作成部14により作成された画像データ20と、財務数値データ13の対象期間後における企業の財務状況の変化に対応した学習用ラベルとが対応付けられた学習用データを取得し、複数の企業についての学習用データを用いた機械学習によって、予測対象企業の財務状況の変化に関する予測結果を出力する予測モデルを作成又は更新する機械学習部16とを備えている。