(58)【調査した分野】(Int.Cl.,DB名)
前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムを比較し、各階級についての第1の差分値を算出するようにさらに構成された、請求項1に記載の推計装置。
前記第1の画像データについて算出された前記各階級についての前記第1の差分値と、第2の画像データに関連付けられる対応する第2の差分値とを比較し、前記第1の画像データに含まれる前記第1のヒストグラムおよび前記第2のヒストグラムの差分のパターンが、前記第2の画像データのうちのどの画像データによって示される前記差分のパターンと類似度が高いかを判定することによって、前記顧客の経営状況を予測するようにさらに構成された、請求項4に記載の推計装置。
前記第1の差分値と前記第2の差分値とを比較することおよび前記類似度が高いかを判定することは、人工知能(AI)によって実行される、請求項5に記載の推計装置。
前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別することは、前記第1の画像データに基づいて実行されるように構成された、請求項1に記載の推計装置。
前記第1のヒストグラムおよび前記第2のヒストグラムの差分の大きさを識別することは、前記第1の画像データについて算出された各階級の差分値に基づいて実行されるようにさらに構成された、請求項1に記載の推計装置。
前記第1の度数分布データおよび前記第2の度数分布データを比較することによって、前記顧客が成長段階にあるのか、あるいは衰退段階にあるのかを推測するようにさらに構成された、請求項1に記載の推計装置。
【発明を実施するための形態】
【0016】
(全体構成)
以下、本発明の実施形態について詳細に説明する。
図1は、本発明の実施形態に係る推計装置100を含むシステム全体の構成図である。推計装置100は、銀行システム110と相互に通信可能に接続される。推計装置100は、
図1に示されるように、銀行システム110と異なるエンティティとして構成されることが可能であり、あるいは、銀行システム110の内部機能として構成されることが可能である。
【0017】
銀行システム110は、インターネットおよび専用線などの既知のネットワークを介して、1または複数の顧客端末120、1または複数のATM130、および1または複数の他行システム140と相互に通信可能に接続される。
図1において、顧客端末120、ATM130、および他行システム140は、1つずつしか示されていないが、これらは複数存在し得る。
【0018】
本明細書では、推計装置100を1つの装置として説明するが、推計装置100によって実行される様々な処理を複数の装置で分散して実行するように構成してもよい。
【0019】
推計装置100は、複数の経営状況パターンに関連付けられる様々な融資先の口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに関連付けられるそれぞれの度数分布データを生成し、格納する。1つの融資先に関連付けられる口座が複数存在する場合、推計装置100は、それらを名寄せ処理して1つにまとめた上で度数分布データを生成することができる。
【0020】
推計装置100は、生成された度数分布データを使用して、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成し、格納する。推計装置100は、生成された画像データを人工知能(AI)に機械学習させることもできる。
【0021】
また、推計装置100は、経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測する対象の顧客の顧客口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに関連付けられるそれぞれの度数分布データを生成する。なお、当該顧客の顧客口座が複数存在する場合、推計装置100は、それらを名寄せ処理して1つにまとめた上で度数分布データを生成することができる。
【0022】
推計装置100は、生成された度数分布データを使用して、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成する。推計装置100は、生成した画像データと、格納されている画像データとを比較し、予測する対象の顧客がどの経営状況パターン(成長、正常、デフォルト)に相当する可能性が高いかを予め定められた基準に従って判定する。また、推計装置100は、生成した画像データをAIに提供し、生成した画像データと機械学習させた画像データとをAIに比較させて、予測する対象の顧客がどの経営状況パターンに相当する可能性が高いかを判定させることができる。推計装置100は、これらの判定結果を出力することができる。
【0023】
銀行システム110は、銀行における勘定系システムに相当し、顧客口座に対する処理、為替処理、ATM(Automated Teller's Machine:現金自動預け払い機)ネットワークや対外システムとの接続処理を制御する。銀行システム110は、顧客端末120からのアクセスに応答して、指定された顧客口座の入出金明細を提供し、また、顧客端末120からの資金移動(振込、振替)指示に基づいて対応する顧客口座からの資金移動を実行する。銀行システム110は、ATM130からのアクセスに応答して、指定された顧客口座の残高情報を提供し、また、ATM130からの資金移動指示に基づいて対応する顧客口座からの資金移動を実行する。銀行システム110は、顧客からの振込依頼に基づいて他行システム140に振込依頼電文を送信し、また、他行システム140から顧客口座宛の振込依頼電文を受信する。銀行システム110は、顧客端末120、ATM130および他行システム140からの指示に基づいて顧客口座に対する入出金処理を行い、入出金明細データを生成し、格納する。
【0024】
顧客端末120は、銀行システム110にアクセス可能な、顧客によって操作されるコンピュータである。顧客端末120は、例えば、パーソナルコンピュータ(PC)、スマートフォン、タブレット型端末などの通信機能を備えたコンピュータとすることができるが、特定の装置に限定されることはない。顧客端末120は、銀行システム110にアクセスし、指定した顧客口座の入出金明細データを受信し、また、顧客口座から指定した口座への資金移動指示を銀行システム110に送信することができる。
【0025】
ATM130は、顧客の操作に応答して、指定された顧客口座の残高を銀行システム110から受信して表示することができ、あるいは、顧客によって入力された情報に基づいて生成した資金移動指示を銀行システム110に送信することができる。
【0026】
他行システム140は、他の金融機関が運用する銀行システムであり、勘定系システムを備える。他行システム140は、銀行システム110から振込依頼電文を受信し、指定された宛先口座に対する入金処理を行い、また、指定された口座から出金処理を行うとともに振込依頼電文を生成し、銀行システム110に送信する。
【0027】
(システム構成)
図2は、本発明の実施形態に係る推計装置100のシステム構成図である。
図2に示すように、推計装置100は、一般的なコンピュータと同様に、バス210などによって相互に接続された制御部201、主記憶部202、補助記憶部203、インターフェース(IF)部204および出力部205を備える。また、推計装置100は、ファイル/データベースなどの形式で、顧客マスタ206、入出金明細207、学習数値データ208、および学習画像データ209を備える。なお、推計装置100および銀行システム110が異なるエンティティである場合、顧客マスタ206および入出金明細207は、銀行システム110から受信され、同期処理されてよい。
【0028】
制御部201は、中央処理装置(CPU)とも呼ばれ、推計装置100の各構成要素の制御やデータの演算を行い、また、補助記憶部203に格納されている各種プログラムを主記憶部202に読み出して実行する。主記憶部202は、メインメモリとも呼ばれ、受信した各種データ、コンピュータ実行可能な命令および当該命令による演算処理後のデータなどを記憶する。補助記憶部203は、ハードディスク(HDD)などに代表される記憶装置であり、データやプログラムを長期的に保存する際に使用される。
【0029】
図2の実施形態は、制御部201、主記憶部202および補助記憶部203を同一のコンピュータの内部に設ける実施形態について説明するが、他の実施形態として、推計装置100は、制御部201、主記憶部202および補助記憶部203を複数個使用することにより、複数のコンピュータによる並列分散処理を実現するように構成することもできる。また、他の実施形態として、推計装置100のための複数のサーバを設置し、複数サーバが一つの補助記憶部203を共有する実施形態にすることも可能である。
【0030】
IF部204は、他のシステムや装置との間でデータを送受信する際のインターフェースの役割を果たし、また、システムオペレータから各種コマンドや入力データ(各種マスタ、テーブルなど)を受け付けるインターフェースを提供する。出力部205は、処理されたデータを表示する表示画面や当該データを印刷するための印刷手段などを提供する。
【0031】
顧客マスタ206は、顧客情報を格納するマスタファイルである。
図3は、本発明の実施形態に係る顧客マスタ206のデータ構造の一例を示す図である。顧客マスタ206は、顧客ID301、顧客情報302、顧客口座識別情報303、業種304、およびステータス305を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。
【0032】
顧客ID301は、顧客を識別する識別子である。顧客情報302は、顧客名称、住所、連絡先などの顧客情報を示す。顧客口座識別情報303は、顧客が開設している1または複数の口座を識別する情報を示す。顧客は、その経営形態によって、顧客口座を1つだけ開設している場合や、異なる本支店に複数の口座を開設している場合もある。顧客開設口座が複数存在する場合、推計装置100は、複数の口座を名寄せ処理した上で、名寄せ後の口座データを使用することができる。
【0033】
業種304は、顧客に関連付けられる業種を示す。業種は、経済産業省によって定められた分類に従ったものでもよいし、あるいは業界団体などで任意に定めた分類に従ったものでもよく、特に限定されることはない。ステータス305は、金融機関によって予め定められた基準に従って判定された、顧客の経営状況(例えば、成長、正常、デフォルトなど)を示す。
【0034】
図2に戻って説明すると、入出金明細207は、顧客口座に対する入出金明細データを格納する。
図4は、本発明の実施形態に係る入出金明細207のデータ構造の一例を示す図である。入出金明細207は、口座識別子401、取引年月日402、入出金区分403、金額404、残高405、および摘要406を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。
【0035】
口座識別子401は、顧客口座を識別する識別子であり、例えば、銀行コード、支店コード、預金種目、口座番号などに基づく識別子である。取引年月日402は、入金取引または出金取引が行われた年月日を示す。入出金区分403は、行われた取引が入金取引であるのか、または出金取引であるのかを示す。金額404は、取引金額を示す。残高405は、入金取引または出金取引後の顧客口座の残高情報を示す。摘要406は、入金取引または出金取引に対する説明(例えば、振込、被振込など)を示す。
【0036】
図2に戻って説明すると、学習数値データ208は、推計装置100によって生成された度数分布データを格納する。度数分布データは、複数の経営状況パターンに関連付けられる様々な融資先の口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに基づいて生成される。第1の期間と第2の期間の長さは、同一であってもよいし、異なっていてもよい。例えば、既にデフォルトしてしまった企業について言えば、業績が悪化している期間(第2の期間)が相当程度短い場合もある。
【0037】
図5は、本発明の実施形態に係る学習数値データ208のデータ構造の一例を示す図である。学習数値データ208は、業種501、経営状況パターン502、変数503、期間504、階級505、および度数506を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。
【0038】
業種501は、融資先の業種を示す。業種501によって示される分類は、業種304によって示される分類と同一である。経営状況パターン502は、融資先の経営状況(例えば、成長、正常、デフォルト)を示す。変数503は、入出金明細データに含まれる変数を示す。変数は、例えば、残高、入金額、出金額、取引件数、振込件数および金額、被振込件数および金額などであってよい。期間504は、度数分布データがどの期間の度数分布データであるのかを示す。例えば、期間504は、第1の期間、第2の期間を示し、第1の期間、第2の期間はそれぞれ、具体的な期間(From To)を示してもよい。階級505は、度数分布データを生成する際のデータ区分を示す。度数506は、それぞれの階級に属する値の数を示す。
【0039】
図2に戻って説明すると、学習画像データ209は、学習数値データ208に格納されている度数分布データを使用して生成されたヒストグラム(度数分布図)を含む画像データを格納する。
図6は、本発明の実施形態に係る学習画像データ209のデータ構造の一例を示す図である。学習画像データ209は、業種501、経営状況パターン502、変数503、画像データ601および差分情報602を含むことができるが、これらのデータ項目に限定されることはなく他のデータ項目も含むことが可能である。
【0040】
業種501、経営状況パターン502、および変数503は、
図5を参照しながら説明した通りなので、詳細な説明は省略する。画像データ601は、業種501、経営状況パターン502、および変数503に関連付けられる期間504によって示されるそれぞれの期間の階級505および度数506のデータに基づいて生成されたヒストグラムを含む画像データを示す。例えば、デフォルトした融資先について、期間504によって第1の期間(正常期間)および第2の期間(悪化期間)が示されている場合、画像データには、第1の期間に関連付けられるヒストグラムおよび第2の期間に関連付けられるヒストグラムが含まれる。差分情報602は、第1のヒストグラムおよび第2のヒストグラムを比較した結果である、各階級について算出された差分値の情報を示す。
【0041】
(処理フロー:画像データ生成処理および機械学習処理)
図7は、推計装置100によって実行される画像データ生成処理および機械学習処理を説明する図である。本処理フローを参照しながら、推計装置100が、複数の経営状況パターンに関連付けられる様々な融資先の口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに関連づけられるそれぞれの度数分布データを生成し、生成されたそれぞれの度数分布データを使用して、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成する処理を説明する。また、本処理フローを参照しながら、推計装置100が、生成された画像データを機械学習する処理を説明する。
【0042】
S701にて、推計装置100は、処理対象として指定された業種およびステータスの情報を受信する。業種およびステータスの指定は、推計装置100に接続されたオペレータ端末(不図示)から行われてもよい。推計装置100は、顧客マスタ206にアクセスし、受信した業種およびステータスの情報に関連付けられる顧客口座識別情報303の情報を読み出し、処理対象の顧客口座を識別する。
【0043】
S702にて、推計装置100は、入出金明細207にアクセスし、処理対象として識別された顧客口座に関連付けられる入出金明細データを読み出す。
【0044】
S703にて、推計装置100は、読み出された入出金明細データに含まれる変数(例えば、残高)ごとに、予め定められた第1の期間および第2の期間の入出金明細データに基づくそれぞれの度数分布データを生成する。第1の期間および第2の期間は、金融機関よって予め定められていて良く、第1の期間および第2の期間は、同じ長さの期間であっても異なる長さの期間であってもよい。例えば、デフォルト(債務不履行)となってしまった企業に関しては、経営状況が悪化する前の正常期間の1年間を第1の期間とし、経営状況が悪化し始めてデフォルトとなってしまうまでの悪化期間(Nヶ月:Nは自然数)を第2の期間としてよい。推計装置100は、生成した度数分布データを学習数値データ208に格納する。度数分布データの階級505の値は、任意に定められてよい。
【0045】
S704にて、推計装置100は、学習数値データ208に格納されているそれぞれの度数分布データを読み出し、業種501、経営状況パターン502および変数503ごとにヒストグラムを含む画像データを生成する。画像データは、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む。また、推計装置100は、第1のヒストグラムおよび第2のヒストグラムを比較し、各階級についての差分値を算出する。生成された画像データおよび各階級についての差分値は、業種501、経営状況パターン502および変数503に関連付けられて、推計装置100によって学習画像データ209の画像データ601および差分情報602にそれぞれ格納される。
【0046】
ここで、
図9を参照しながら、S703およびS704の処理を説明する。
図9(a)〜(c)は、第1のヒストグラムおよび第2のヒストグラムを含む画像データを生成する過程を例示する図である。
図9(a)に示すように、推計装置100は、第1の期間(例えば、正常期間)および第2の期間(例えば、悪化期間)における、ある変数の時系列変動の値から第1の度数分布データおよび第2の度数分布データを生成する。推計装置100は、第1の度数分布データおよび第2の度数分布データに基づいて第1の期間の第1のヒストグラムおよび第2の期間の第2のヒストグラムを生成する。推計装置100は、第1のヒストグラムおよび第2のヒストグラムを
図9(b)に例示するように重ね合わせるとともに、各階級についての差分値を算出する。
図9(c)に示すように、推計装置100は、第1のヒストグラムおよび第2のヒストグラムを含む画像データを生成する。生成された画像データおよび算出された差分値は、上述したように、学習画像データ209に格納される。
【0047】
S705にて、推計装置100は、学習画像データ209に格納されている画像データおよび差分情報を人工知能(AI)に機械学習させることができる。推計装置100は、様々な機械学習の手法を利用することができる。例えば、推計装置100は、機械学習の一手法であるディープラーニング(深層学習)を利用することもでき、その深層学習モデルの中でも、畳み込みニューラルネットワーク(CNN)を用いることもできる。
【0048】
(処理フロー:予測処理)
図8は、推計装置100によって実行される予測処理を説明する図である。本処理フローを参照しながら、推計装置100が、分析対象となる顧客の顧客口座の入出金明細データに含まれる変数のそれぞれについて、予め定められた第1の期間と第2の期間のデータに基づいて生成されたそれぞれの度数分布データを使用して複数のヒストグラムを含む画像データを生成し、生成された画像データと、学習画像データ209に格納されている画像データとを比較することによって、分析対象の顧客がどの経営状況パターンに相当する可能性が高いかを判定する処理を説明する。また、本処理フローでは、AIによって、画像データ同士の比較処理や分析対象の顧客がどの経営状況パターンに相当する可能性が高いかの判定処理が行われてもよい。
【0049】
S801にて、推計装置100は、分析対象として指定された顧客の顧客ID301を受信する。顧客ID301の指定は、推計装置100に接続されたオペレータ端末(不図示)から行われてもよい。推計装置100は、顧客マスタ206にアクセスし、分析対象として指定された顧客の顧客ID301に関連付けられる顧客口座識別情報303に基づいて分析対象の顧客口座を識別する。推計装置100は、顧客ID301に関連付けられる業種304の情報も取得する。
【0050】
S802にて、推計装置100は、入出金明細207にアクセスし、分析対象として識別された顧客口座に関連付けられる入出金明細データを読み出す。
【0051】
S803にて、推計装置100は、読み出された入出金明細データに含まれる変数(例えば、残高)ごとに、予め定められた第1の期間および第2の期間の入出金明細データに基づく度数分布データを生成する。第1の期間および第2の期間は、
図7を参照しながら説明した第1の期間および第2の期間と同一である。生成された度数分布データは、第1の期間に関連付けられる第1の度数分布データおよび第2の期間に関連付けられる第2の度数分布データを含む。
【0052】
S804にて、推計装置100は、S803にて生成された第1の度数分布データおよび第2の度数分布データに基づいて、第1の期間に関連付けられる第1のヒストグラムおよび第2の期間に関連付けられる第2のヒストグラムを含む画像データを生成する。生成される画像データは、
図9(c)に例示されるような画像データであってよい。また、推計装置100は、生成された画像データに含まれる第1のヒストグラムおよび第2のヒストグラムを比較し、各階級についての差分値を算出する。
【0053】
S805にて、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データに含まれる第1のヒストグラムおよび第2のヒストグラムの差分の大きさを識別する。この識別処理は、画像ベースで行われてもよく、あるいは当該画像データについて算出された各階級の差分値に基づいて行われてもよい。推計装置100は、識別された差分の大きさが予め定められた閾値以上であるかどうかを判定する。閾値は、顧客の業種などによって変動してよい。差分の大きさが予め定められた閾値以上である場合(すなわち、第1の期間と第2の期間とで経営状況の目立った変化が発生している場合)、S806に処理が進み、閾値未満である場合(すなわち、第1の期間と第2の期間に目立った経営状況の変化は発生していない場合)、本処理フローは終了となる。
【0054】
S806にて、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データと、学習画像データ209に格納されている対応する業種501および変数503(例えば、残高)に関連付けられる1または複数の画像データとを比較する。学習画像データ209は、対応する業種501および変数503に関連付けられる複数の経営状況パターン502(例えば、成長、正常、デフォルト)の画像データを有する。この比較処理により、推計装置100は、分析対象の顧客に関連付けられる画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンが、学習画像データ209に格納されているどの画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンと類似度が高いかを判定し、分析対象の顧客の経営状況を予測することができる。すなわち、類似度が高いと判定された画像データに関連付けられる経営状況パターンによって、推計装置100は、分析対象の顧客が、成長段階にあるのか、正常段階にあるのか、あるいはデフォルトに向かいつつある段階にあるのかを予測することができる。なお、類似度が高いかどうかを判定する基準は、融資元企業によって任意に定めることができ、その基準は、融資先の業種ごとに定めることが可能である。
【0055】
本発明の実施形態では、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データについて算出された各階級についての差分値と、学習画像データ209に格納されている対応する業種501および変数503(例えば、残高)に関連付けられる1または複数の画像データの差分情報602に含まれる各階級についての差分値とを比較する。この比較処理により、推計装置100は、分析対象の顧客に関連付けられる画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンが、学習画像データ209に格納されているどの画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンと類似度が高いかを判定し、分析対象の顧客の経営状況を予測することができる。
【0056】
本発明の実施形態では、推計装置100は、S804にて生成された、分析対象の顧客に関連付けられる画像データを人工知能(AI)に提供し、予め機械学習された画像データとの比較をAIに実行させ、分析対象の顧客に関連付けられる画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンが、機械学習された画像データのうちどの画像データによって示される第1のヒストグラムおよび第2のヒストグラムの差分のパターンと類似度が高いかを判定させることによって、分析対象の顧客の経営状況を予測することができる。すなわち、推計装置100は、分析対象の顧客の経営状況を、AIによって類似度が高いと判定された画像データに関連付けられる経営状況パターン(例えば、成長、正常、デフォルト)に相当する可能性が高いと判定することができる。また、推計装置100は、AIに比較を実行させる際、S804にて算出された各階級についての差分値をAIにさらに提供することもでき、かかる場合、AIは、画像データと差分値との両方に基づいて類似度を判定することができる。
【0057】
本発明の実施形態では、推計装置100は、S803にて生成された度数分布データのうち、第1の期間に関連付けられる第1の度数分布データと第2の期間に関連付けられる第2の度数分布データとを比較することによって分析対象の顧客が成長段階にあるのか、あるいは衰退段階にあるのかを推測することができる。より詳細に言えば、推計装置100は、第2の度数分布データに基づいて算出された第2の平均値を、第1の度数分布データに基づいて算出された第1の平均値で除し、1よりも大きい値が得られた場合に成長段階にあると判定し、1よりも小さい値が得られた場合に衰退段階にあると判定することができる。なお、平均値としては採用するのは、第1の期間および第2の期間のそれぞれの変数(例えば、残高、入金額、出金額など)の実データであってもよい。
【0058】
上述したような処理によって、推計装置100は、特定の融資先の口座の動態データに基づく画像データを、蓄積された画像データあるいは機械学習された画像データに基づいて分析することにより、財務数値データを利用していた従来よりも早い段階で経営状況の大幅な変動、とりわけ、デフォルトの発生有無を予測することができるようになる。
【0059】
以上、例示的な実施形態を参照しながら本発明の原理を説明したが、本発明の要旨を逸脱することなく、構成および細部において変更する様々な実施形態を実現可能であることを当業者は理解するだろう。すなわち、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。