IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 楽天株式会社の特許一覧

<>
  • 特開-審査装置、方法及びプログラム 図1
  • 特開-審査装置、方法及びプログラム 図2
  • 特開-審査装置、方法及びプログラム 図3
  • 特開-審査装置、方法及びプログラム 図4
  • 特開-審査装置、方法及びプログラム 図5
  • 特開-審査装置、方法及びプログラム 図6
  • 特開-審査装置、方法及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024001669
(43)【公開日】2024-01-10
(54)【発明の名称】審査装置、方法及びプログラム
(51)【国際特許分類】
   G06Q 40/03 20230101AFI20231227BHJP
【FI】
G06Q40/02 300
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022100485
(22)【出願日】2022-06-22
(71)【出願人】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】100145838
【弁理士】
【氏名又は名称】畑添 隆人
(74)【代理人】
【識別番号】100103137
【弁理士】
【氏名又は名称】稲葉 滋
(74)【代理人】
【識別番号】100216367
【弁理士】
【氏名又は名称】水谷 梨絵
(72)【発明者】
【氏名】梅田 卓志
(72)【発明者】
【氏名】ジェーン アシュリー
(72)【発明者】
【氏名】河崎 麻里子
(72)【発明者】
【氏名】山下 智彦
(72)【発明者】
【氏名】呉 垠
【テーマコード(参考)】
5L055
【Fターム(参考)】
5L055BB15
(57)【要約】
【課題】属性データの蓄積が不十分なユーザについても、適正な審査を提供することを課題とする。
【解決手段】審査装置1に、ユーザに係る入力データを第一機械学習モデルに入力することで得られた出力に基づいて、ユーザの第一スコアを取得する第一スコア取得部22と、ユーザに係る入力データを第二機械学習モデルに入力することで得られた出力に基づいて、ユーザの第二スコアを取得する第二スコア取得部23と、対象ユーザを含むユーザ群のセグメンテーションを行うことで、対象ユーザが属するユーザセグメントを特定するユーザセグメント特定部24と、対象ユーザが属するユーザセグメントに応じて、対象ユーザの第一スコア及び/又は第二スコアに基づいて対象ユーザの審査結果を決定する審査結果決定部26と、を備えた。
【選択図】図2

【特許請求の範囲】
【請求項1】
ユーザに係る入力データを第一機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第一スコアを取得する第一スコア取得手段と、
前記ユーザに係る入力データを第二機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第二スコアを取得する第二スコア取得手段と、
対象ユーザを含むユーザ群のセグメンテーションを行うことで、該対象ユーザが属するユーザセグメントを特定するユーザセグメント特定手段と、
前記対象ユーザが属する前記ユーザセグメントに応じて、該対象ユーザの第一スコア及び/又は第二スコアに基づいて該対象ユーザの審査結果を決定する審査結果決定手段と、
を備える審査装置。
【請求項2】
前記第一スコア取得手段は、前記ユーザに係る入力データを、第一の種類の取引におけるユーザの属性と該ユーザの信用度との関係を学習することで生成された第一機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第一スコアを取得し、
前記第二スコア取得手段は、前記ユーザに係る入力データを、前記第一の種類の取引とは異なる第二の種類の取引におけるユーザの属性と該ユーザのリスクとの関係を学習することで生成された第二機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第二スコアを取得する、
請求項1に記載の審査装置。
【請求項3】
前記第一スコア取得手段は、前記ユーザに係る入力データを、所定以上の期間及び/又は所定以上の額に係る前記第一の種類の取引の審査用の機械学習モデルである第一機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第一スコアを取得し、
前記第二スコア取得手段は、前記ユーザに係る入力データを、前記第一の種類の取引に比べて短い期間及び/又は少ない額に係る前記第二の種類の取引の審査用の機械学習モデルである第二機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第二スコアを取得する、
請求項2に記載の審査装置。
【請求項4】
前記第一スコア取得手段は、前記第一の種類の取引と同じ種類の他の取引の状況を含む属性データを入力値とし該ユーザに係る信用度を示す値を出力値とする教師データを用いて生成及び/又は更新された前記第一機械学習モデルを用いて、該ユーザの第一スコアを取得する、
請求項3に記載の審査装置。
【請求項5】
前記第二スコア取得手段は、前記第二の種類の取引と同じ種類の他の取引の状況を含む属性データを入力値とし該ユーザに係るリスクを示す値を出力値とする教師データを用いて生成及び/又は更新された前記第二機械学習モデルを用いて、該ユーザの第二スコアを取得する、
請求項3に記載の審査装置。
【請求項6】
前記第一スコア取得手段又は前記第二スコア取得手段は、勾配ブースティング決定木に基づく機械学習フレームワークを用いて生成及び/又は更新された機械学習モデルを用いて、前記第一スコア又は前記第二スコアを推定する、
請求項1に記載の審査装置。
【請求項7】
前記ユーザセグメントにおける前記第一スコアと前記第二スコアとの相関の強さに基づいて、該ユーザセグメントが前記第一スコアと前記第二スコアとの間に所定の基準以上の相関を有する第一ユーザセグメントであるか、又は所定の基準未満の相関を有する第二ユーザセグメントであるかを判定する相関判定手段を更に備え、
前記審査結果決定手段は、前記対象ユーザが属するユーザセグメントが前記第二ユーザセグメントであると判定された場合に、前記第一スコア及び第二スコアのうちより高い信用度又はより低いリスクを示すスコアに基づいて、該対象ユーザの審査結果を決定する、
請求項2に記載の審査装置。
【請求項8】
前記審査結果決定手段は、前記対象ユーザが属するユーザセグメントが前記第一ユーザセグメントであると判定された場合、前記第一の種類の取引については前記第一スコアに基づいて、該対象ユーザの審査結果を決定する、
請求項7に記載の審査装置。
【請求項9】
前記審査結果決定手段は、前記対象ユーザが属するユーザセグメントが前記第一ユーザセグメントであると判定された場合、前記第二の種類の取引については前記第二スコアに基づいて、該対象ユーザの審査結果を決定する、
請求項7に記載の審査装置。
【請求項10】
前記第二機械学習モデルの出力値は、前記対象ユーザが前記商品及び/又はサービスを後払い決済で購入した場合に後払い決済の精算が該対象ユーザによって正しく履行されないリスクに応じて変化する判定用スコアである、
請求項9に記載の審査装置。
【請求項11】
コンピュータが、
ユーザに係る入力データを第一機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第一スコアを取得する第一スコア取得ステップと、
前記ユーザに係る入力データを第二機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第二スコアを取得する第二スコア取得ステップと、
対象ユーザを含むユーザ群のセグメンテーションを行うことで、該対象ユーザが属するユーザセグメントを特定するユーザセグメント特定ステップと、
前記対象ユーザが属する前記ユーザセグメントに応じて、該対象ユーザの第一スコア及び/又は第二スコアに基づいて該対象ユーザの審査結果を決定する審査結果決定ステップと、
を実行する方法。
【請求項12】
コンピュータを、
ユーザに係る入力データを第一機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第一スコアを取得する第一スコア取得手段と、
前記ユーザに係る入力データを第二機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第二スコアを取得する第二スコア取得手段と、
対象ユーザを含むユーザ群のセグメンテーションを行うことで、該対象ユーザが属するユーザセグメントを特定するユーザセグメント特定手段と、
前記対象ユーザが属する前記ユーザセグメントに応じて、該対象ユーザの第一スコア及び/又は第二スコアに基づいて該対象ユーザの審査結果を決定する審査結果決定手段と、
として機能させるプログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ユーザに関する審査を支援するための技術に関する。
【背景技術】
【0002】
従来、端末装置から店舗のトランザクション情報等の通知を受け、トランザクション情報等を学習済モデルに投入して分類結果を取得し、この分類結果に基づいて融資スコアを算出した後、融資スコアと各金融機関の融資条件情報に基づいて融資情報を生成し、各金融機関の融資情報及び事業者に通知すべきリコメンド情報を端末装置に通知する融資情報提供装置が提案されている(特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-160949号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来、ユーザに対する融資や信用取引等のための審査において、機械学習モデルを用いたユーザの信用スコアの決定が、審査の適正化という観点で重要視されている。また、従来、融資スコアが高くなるモデルへの入力データの組み合わせをリコメンド情報として選択する技術が提案されている(特許文献1を参照)。しかし、従来提案されている技術は、審査の適正化という観点で一定の効果を奏するものの、信用情報等の属性データの蓄積が不十分なユーザの審査を適正に行う点において改善の余地があった。
【0005】
本開示は、上記した問題に鑑み、属性データの蓄積が不十分なユーザについても、適正な審査を提供することを課題とする。
【課題を解決するための手段】
【0006】
本開示の一例は、ユーザに係る入力データを第一機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第一スコアを取得する第一スコア取得手段と、前記ユーザに係る入力データを第二機械学習モデルに入力することで得られた出力に基づいて、該ユーザの第二スコアを取得する第二スコア取得手段と、対象ユーザを含むユーザ群のセグメンテーションを行うことで、該対象ユーザが属するユーザセグメントを特定するユーザセグメント特定手段と、前記対象ユーザが属する前記ユーザセグメントに応じて、該対象ユーザの第一スコア及び/又は第二スコアに基づいて該対象ユーザの審査結果を決定する審査結果決定手段と、を備える審査装置である。
【0007】
本開示は、審査装置、システム、コンピュータによって実行される方法又はコンピュータに実行させるプログラムとして把握することが可能である。また、本開示は、そのようなプログラムをコンピュータその他の装置、機械等が読み取り可能な記録媒体に記録したものとしても把握できる。ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的又は化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。
【発明の効果】
【0008】
本開示によれば、属性データの蓄積が不十分なユーザについても、適正な審査を提供することが可能となる。
【図面の簡単な説明】
【0009】
図1】実施形態に係る情報処理システムの構成を示す概略図である。
図2】実施形態に係る審査装置の機能構成の概略を示す図である。
図3】実施形態における審査処理の概要を示す図である。
図4】実施形態において採用される機械学習モデルの決定木の概念を簡略図である。
図5】実施形態に係る機械学習処理の流れを示すフローチャートである。
図6】実施形態に係る審査処理の流れを示すフローチャートである。
図7】バリエーションに係る審査装置の機能構成の概略を示す図である。
【発明を実施するための形態】
【0010】
以下、本開示に係る審査装置、方法及びプログラムの実施の形態を、図面に基づいて説明する。但し、以下に説明する実施の形態は、実施形態を例示するものであって、本開示に係る審査装置、方法及びプログラムを以下に説明する具体的構成に限定するものではない。実施にあたっては、実施の態様に応じた具体的構成が適宜採用され、また、種々の改良や変形が行われてよい。本開示に係る技術では、後述する実施形態、バリエーションの夫々における構成の少なくとも一部を適宜、互いに採用することができる。
【0011】
本実施形態では、本開示に係る技術を、ユーザに関して融資の審査を提供するシステムにおいて実施した場合の実施の形態について説明する。但し、本開示に係る技術は、ユーザに関する何らかの審査を支援するための技術について広く用いることが可能であり、本開示の適用対象は、実施形態において示した例に限定されない。
【0012】
<システムの構成>
図1は、本実施形態に係る情報処理システムの構成を示す概略図である。本実施形態に係る情報処理システムでは、審査装置1と、1又は複数のサービス提供システム5と、が互いに通信可能に接続されている。ユーザは、サービス提供システム5によって提供されるサービスの利用者であり、ユーザ端末からサービス提供システム5にアクセスすることでサービスの提供を受ける。
【0013】
審査装置1は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、EEPROM(Electrically Erasable and Programmable Read Only Memory)やHDD(Hard Disk Drive)等の記憶装置14、NIC(Network Interface Card)等の通信ユニット15、等を備えるコンピュータである。但し、審査装置1の具体的なハードウェア構成に関しては、実施の態様に応じて適宜省略や置換、追加が可能である。また、審査装置1は、単一の筐体からなる装置に限定されない。審査装置1は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。
【0014】
審査装置1は、ユーザ毎に当該ユーザに関する取引の審査を行い、サービス提供システム5に対して審査結果を提供する。サービス提供システム5は、審査装置1から提供された、任意のユーザを対象とした審査の結果に応じて、当該ユーザ(以下、「対象ユーザ」。)に対して融資等のサービスを提供するか否か(取引を行うか否か)を決定することが可能である。
【0015】
サービス提供システム5は、CPU、ROM、RAM、記憶装置、通信ユニット、入力装置、出力装置等(図示は省略する)を備えるコンピュータである。また、これらのシステム及び端末は、いずれも、単一の筐体からなる装置に限定されない。これらのシステム及び端末は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。
【0016】
サービス提供システム5によって提供されるサービスは、例えば、ローン等の融資審査サービス、クレジットカード/後払い決済サービス、オンラインショッピングサービス、オンライン予約サービス、電子マネー決済サービス、オペレーションセンターサービス、又は地図情報サービス等である。なお、「後払い決済」には、所謂Buy Now Pay Later(BNPL)と称されるサービスに限定されず、あらゆる後払いによる商品/サービスの購入が含まれてよいものとする。
【0017】
サービス提供システム5によって提供されるサービスは本実施形態における例示に限定されない。そして、サービス提供システム5は、サービスの提供に際してユーザの属性データを審査装置1に通知する。ここで、ユーザの属性データには当該ユーザによるサービスの利用履歴データが含まれる。サービスの利用履歴データの内容はサービスの内容に応じて様々であり、例えば、ユーザの位置情報の履歴データ、クレジットカード利用額/後払い決済利用額の支払履歴データ、電子マネー利用履歴データ、取引履歴データ(商品等の購入履歴データを含む)、予約履歴データ、オペレーションセンターからのユーザに対するオペレーション履歴データ等が含まれてよい。
【0018】
ここで、属性データは、例えば、スコア(例えば、0以上1以下の連続的な値)又はラベル(例えば、有無や是非に応じた二値)等のデータ形式で表されるデータが含まれる。但し、属性データのフォーマットは本開示における例示に限定されない。また、属性データには、例えば、オンラインサービス利用状況、ポイントを含む電子的バリューの利用状況等、オンラインサービスにおけるキャンセル率が含まれてよいし、後払い決済におけるデフォルト(債務不履行)を示すデータも含まれてよい。
【0019】
属性データには、事実属性(factual attribute)データと、推定属性(inferred attribute)データとが含まれてよい。ここで、事実属性データとは、ユーザ自身から提供されることで得られたユーザ提供データやユーザについて収集された履歴データ等に基づいて、当該ユーザについて事実であると確認可能な属性データである。また、推定属性データとは、ユーザ提供データや履歴データ、事実属性データ等をVAE(Variational Autoencoder)に入力する等の方法で推定されて得られる属性データである。
【0020】
なお、ここで用いられるVAEは、VAE前半のエンコーダが出力した潜在ベクトルをVAE後半のデコーダに入力することで、エンコーダに入力された値(ここでは、事実属性データを含む訓練データ)を異なる形式で表現するものである。ユーザ提供データとしては、例えば、ユーザ自身によって登録された氏名やメールアドレス、電話番号、住所、勤務先、就学先等を含む登録データや、アンケート等にユーザ自身が回答した結果得られたデータが挙げられる。履歴データとしては、例えば、上述した、サービス提供システム5によって提供される電子商取引サービスの利用履歴データが挙げられる。事実属性データは、先述のユーザ提供データや履歴データが、マーケティング及び/又は分析目的に適したデータ形式に変換されたデータであることが好ましい。例えば、利用履歴データに基づいて得ることができる事実属性データとして、ユーザが頻繁に利用する商品/サービスのジャンル/カテゴリやブランドの他、ユーザが頻繁に訪れる商業地や行楽地、観光地等が挙げられる。即ち、本実施形態において、属性データは、機械学習技術を用いて推定又は予測されたユーザの性格、行動傾向、ユーザペルソナ等を含む。
【0021】
本実施形態において、各属性データには、重みが設定される。重みは、スコアの算出にあたって属性データが用いられる際の、属性データとスコアとの相関性の高さを示すものであり、後述する機械学習部27によってスコアの適切性が評価される毎に、モデルのパラメータが、スコアがより適切な値となるように調整される。各属性データと対応する重みは、例として、後述の決定木モデル等のスコア算出のためのモデルにおける各ノード(各回帰木)と対応する重みに相当し、スコアが算出される過程で適宜、決定される。なお、スコアは、例として、各ノードの重みに基づいて決定される。
【0022】
ここで、属性データ群には、デモグラフィック属性、ビヘイビオラル属性、又はサイコグラフィック属性が含まれてよい。デモグラフィック属性は、例えば、ユーザの性別(ジェンダー)、家族構成、年齢等であり、ビヘイビオラル属性は、サービスの利用履歴データに基づいてよく、例えば、キャッシング利用有無、リボ払い利用有無、所定の口座に係る入出金履歴、賭博又はくじを含む何らかの商品/サービスに係る商取引履歴(オンラインマーケットプレイス等におけるオンライン取引履歴を含んでよい)、位置情報や場所情報を用いたユーザの移動履歴等であり、サイコグラフィック属性は、例えば、賭博又はくじに係る趣向等である。但し、利用可能なユーザの属性は、本実施形態における例示に限定されない。例えば、オペレーションセンターサービス等からの「オペレーション(架電等)に要する時間」、「クレジットカード利用額/後払い決済利用額」も、属性として用いられてよい。なお、デモグラフィック属性に類する属性がユーザ提供データ又は履歴データを根拠とする属性に基づいて推定された属性であってよい。同様に、ビヘイビオラル属性に類する属性がユーザ提供データ又は履歴データを根拠とする属性に基づいて推定された属性であってよい。サイコグラフィック属性は、ユーザによる意思入力の結果を一例として含むユーザ提供データを根拠とする属性であってよい。
【0023】
図2は、本実施形態に係る審査装置1の機能構成の概略を示す図である。審査装置1は、記憶装置14に記録されているプログラムが、RAM13に読み出され、CPU11によって実行されて、審査装置1に備えられた各ハードウェアが制御されることで、属性決定部21、第一スコア取得部22、第二スコア取得部23、ユーザセグメント特定部24、相関判定部25、審査結果決定部26、及び機械学習部27を備える審査装置として機能する。なお、本実施形態及び後述するバリエーションでは、審査装置の備える各機能は、汎用プロセッサであるCPU11によって実行されるが、これらの機能の一部又は全部は、1又は複数の専用プロセッサによって実行されてもよい。
【0024】
属性決定部21は、ユーザ自身から提供されたユーザ提供データ及び/又は当該ユーザの履歴データに基づいて、当該ユーザについて事実であると確認可能な事実属性データを決定する。本実施形態において、属性決定部21は、ユーザ提供データ及び/又は履歴データを集計する、マップ等の他のデータを参照して該当する属性を決定する、ユーザ提供データ及び/又は履歴データをそのまま用いる、等の手法を用いて、当該ユーザに係る事実属性データを決定する。なお、本実施形態では、ユーザに係る事実属性データをユーザ提供データ及び/又は該ユーザの履歴データに基づいて決定する方法を採用しているが、ユーザに係る事実属性データはその他の方法で取得されてもよい。
【0025】
また、属性決定部21は、少なくとも、ユーザについて決定された1又は複数の事実属性データを含む入力データに基づいて、当該ユーザについて推定された推定属性データを決定する。本実施形態において、属性決定部21は、ユーザに係る1又は複数の事実属性データを含む入力データを機械学習モデルである属性推定モデルに入力して得られた出力値に基づいて、推定属性データを決定してよい。なお、本実施形態において、属性推定モデルからの出力値はユーザが所定の属性を有する蓋然性を示す値であり、属性決定部21は、属性推定モデルから得られた出力値が所定の範囲内にある場合に、ユーザが当該属性を有すると決定する。ユーザが所定の属性を有すると決定された場合、属性決定部21は、ユーザについて推定された属性データのラベルを、属性の有無又は属性の種類を示す値に設定する。また、属性データはラベルではなくスコアで示されてもよい。この場合、属性決定部21は、ユーザについて推定された推定属性データのスコアに、推定された属性が適用され得る度合い(確率)を示す値を設定する。当該度合いは、属性推定モデルの出力値であってよい。
【0026】
第一スコア取得部22は、ユーザに係る入力データを第一機械学習モデルに入力することで得られた出力(例えば、0を最小値、1を最大値として正規化/規格化されたスコア)に基づいて、当該ユーザの第一スコアを取得する。より具体的には、第一スコア取得部22は、ユーザに係る入力データを、第一カテゴリの取引(第一の種類の取引)におけるユーザの属性と当該ユーザの信用度との関係を学習することで生成された第一機械学習モデルに入力することで得られた出力に基づいて、当該ユーザの第一スコアを取得する。本開示において、第一カテゴリの取引とは、所定以上の期間及び/又は所定以上の額に係る取引を指す。即ち、第一カテゴリの取引としては、例えば、長期ローン又は高額ローン等の、比較的長期及び/又は高額の取引が挙げられる。
【0027】
本実施形態において、第一機械学習モデルは、第一カテゴリの取引と同じ種類の他の取引(例えば、他の長期ローン又は高額ローン等)の状況を含む属性データを入力値とし当該ユーザに係る信用度を示す値(第一スコア)を出力値とする教師データを用いて生成及び/又は更新される。そして、第一機械学習モデルは、第一カテゴリの取引において、融資をしてよいか否か、又はデフォルト確率と対応するような審査結果を出力する、審査用の機械学習モデルである。このため、第一機械学習モデルには、従前の高額融資審査モデルにおける入力データの種別が適宜採用されてもよい。
【0028】
第一機械学習モデルへの入力データは、上述した事実属性データ及び/又は推定属性データを含む属性データ群を含む。入力データには、例として、年収、勤務先業種、生年月日、生活状況(居住期間(例えば、月単位)、勤務期間(例えば、月単位)、(既契約の他のローン等の)借入状況/返済状況等が含まれる。
【0029】
第二スコア取得部23は、ユーザに係る入力データを第二機械学習モデルに入力することで得られた出力(例えば、0を最小値、1を最大値として正規化/規格化されたスコア)に基づいて、当該ユーザの第二スコアを取得する。より具体的には、第二スコア取得部23は、ユーザに係る入力データを、第一カテゴリの取引とは異なる第二カテゴリの取引(第二の種類の取引)におけるユーザの属性と当該ユーザのリスクとの関係を学習することで生成された第二機械学習モデルに入力することで得られた出力に基づいて、当該ユーザの第二スコアを取得する。本開示において、第二カテゴリの取引とは、第一カテゴリの取引に比べて短い期間及び/又は少ない額に係る取引を指す。即ち、第二カテゴリの取引としては、例えば、後払い決済、クレジットカード利用、短期ローン又は少額ローン等の、比較的短期及び/又は少額の取引が挙げられる。
【0030】
本実施形態において、第二機械学習モデルは、第二カテゴリの取引と同じ種類の他の取引(例えば、他の後払い決済、クレジットカード利用、短期ローン又は少額ローン等)の状況を含む属性データを入力値とし、当該ユーザが支払いを行わずに(当該ユーザについて債権が回収されずに)デフォルトとなる蓋然性に基づくリスクを示す値(第二スコア)を出力値とする教師データを用いて生成及び/又は更新される。リスクの表現方法は限定されず、様々な指標が採用されてよいが、例えば、リスクは、デフォルトとなる確率を用いて表現することが出来る。また、リスクを示す指標には、デフォルトとなる確率以外の指標が採用されてよい。例えば、リスクをクラス(ランク)分けし、いずれのクラス(ランク)であるかを指標として用いてもよい。即ち、第二機械学習モデルは、例えば、第二カテゴリの取引である後払い決済で対象ユーザが商品及び/又はサービスを購入した場合に後払い決済の精算が当該対象ユーザによって正しく履行されないリスクに応じて変化するスコア、又は、同じく第二カテゴリの取引であるクレジットカード決済で対象ユーザが商品及び/又はサービスを購入した場合のデフォルト確率に関連するスコア、等を出力する、審査用の機械学習モデルである。
【0031】
このため、第二機械学習モデルには、クレジットカード審査等の少額融資の審査モデルにおける入力データの種別が適宜採用されてよい。また、第二機械学習モデルには、BNPL(Buy-Now-Pay-Later、後払い決済)の審査モデルが採用されてよい。BNPL審査モデルを第二機械学習モデルとして採用する場合、何かしらの信用スコアやユーザ属性を、本開示における最終的な審査結果の決定の用に供してよい。
【0032】
第二機械学習モデルにおいても、第一機械学習モデルと同様、事実属性データ及び/又は推定属性データを含む属性データ群を適宜、入力データとして採用することができる。入力データには、例として、年収、生活状況(勤務先業種、勤務形態(リモートワークが可能か否か等))、クレジットカード利用状況等が含まれる。
【0033】
ユーザセグメント特定部24は、対象ユーザを含むユーザ群のセグメンテーションを行うことで、当該対象ユーザが属するユーザセグメントを特定する。ここで、セグメンテーションは、ユーザ群に含まれるユーザの属性データを参照して、共通する属性データを有するユーザを同じユーザセグメントに入れることで実行される。例えば、年収、勤務先業種、性別及び年齢層が共通するユーザが、同じユーザセグメントに入れられる。ここで、セグメンテーションの際に参照されるユーザ属性は限定されないが、例えば第一機械学習モデルの入力データと第二機械学習の入力データとの間で共通する属性(換言すれば、第一機械学習モデル及び第二機械学習モデルのいずれにおいても入力データとして用いられる属性)をセグメンテーションに用いることで、後述する相関の判定行うことが容易となる。また、セグメンテーションには、ルールベースのセグメンテーションが用いられてもよいし、機械学習モデルによる推論ベースのセグメンテーションが用いられてもよい。また、セグメンテーションは、ユーザ群に対して一般的なクラスタリング手法を用いたクラスタリングを実行し、クラスタリングの結果を参照することで行われてもよい。
【0034】
相関判定部25は、ユーザセグメントにおける第一スコアと第二スコアとの相関の強さに基づいて、当該ユーザセグメントが第一スコアと第二スコアとの間に所定の基準以上の相関を有する第一ユーザセグメントであるか、又は所定の基準未満の相関を有する(本開示では、相関が無いものも含む。)第二ユーザセグメントであるかを判定する。即ち、相関判定部25は、所定の基準に従って、ユーザが属するユーザセグメントが、第一スコアと第二スコアとの相関が強いユーザセグメントであるか、又は第一スコアと第二スコアとの相関が弱いユーザセグメントであるかを判定する。より具体的には、例えば、相関判定部25は、任意のユーザセグメントについて、過去に算出された第一スコアの統計値(例えば、平均値や中央値)と、過去に算出された第二スコアの統計値(例えば、平均値や中央値)との差分を算出し、当該差分が所定の基準以上である場合には当該ユーザセグメントを第一ユーザセグメントであると判定し、当該差分が所定の基準未満である場合には当該ユーザセグメントを第二ユーザセグメントであると判定することが出来る。但し、ユーザセグメントにおける第一スコアと第二スコアとの相関の具体的な判定手段は、本開示における例示に限定されない。
【0035】
例えば、セグメントを構成するユーザ群が50-60代の男性である場合、例えば信用情報機関により決定される信用情報に基づくスコアである第一スコアの高さと、例えば少額決済用の審査モデルからの出力に基づくスコアである第二スコアの高さとは相関が強い(correlated)と仮定される。一方で、セグメントを構成するユーザ群が20-30代の男性である場合、第一スコアと第二スコアとの相関は弱いか又は相関が無い(NOT correlated)と仮定される。これは、20-30代のような若年層は、信用情報の蓄積が十分でないために第一スコアの精度が十分でなく、例えば少額決済のような若年層の利用頻度が高い用途の審査モデルによる第二スコアの精度が十分であるという傾向が強いことに由来している。
【0036】
審査結果決定部26は、対象ユーザが属するユーザセグメントに応じて、当該対象ユーザの第一スコア及び/又は第二スコアに基づいて当該対象ユーザの審査結果を決定する。本実施形態において、審査結果決定部26は、対象ユーザが属するユーザセグメントが第一ユーザセグメントであると判定された場合、第一カテゴリの取引については第一スコアに基づいて、第二カテゴリの取引については第二スコアに基づいて、当該対象ユーザの審査結果を決定する。即ち、本実施形態では、第一スコアと第二スコアとの相関が強い第一ユーザセグメントに属するユーザの場合、第一スコアが審査に不利に働く値である場合に、第二スコアにかかわらず、最終的な審査結果がマイナスの形で決定される(例えば、融資が下りない等)。
【0037】
一方、審査結果決定部26は、対象ユーザが属するユーザセグメントが第二ユーザセグメントであると判定された場合、第一スコア及び第二スコアのうちより高い信用度又はより低いリスクを示すスコアに基づいて、当該対象ユーザの審査結果を決定する。換言すれば、本実施形態において、審査結果決定部26は、特定のユーザセグメントが第一スコアと第二スコアとの相関が弱いか又は相関が無い第二ユーザセグメントである場合、当該ユーザセグメントにユーザが属するときに、第一スコアが審査に不利に働く値である場合であっても、第二スコアに基づけば信用が十分であると判定可能な値であるような場合に、最終的な審査結果がプラスの形で決定される(審査が有利に働くよう審査結果が決定される)。これは、第一スコアが高く表面上は信用が不足していると判定されるような場合であっても、より信頼がおけるスコア(第二スコア)でそのユーザが信用に足るという結果を示す場合には、審査結果がプラスの形で決定されることを意味する。
【0038】
図3は、本実施形態における審査処理の概要を示す図である。即ち、本実施形態では、対象ユーザの審査を行う際、審査用の機械学習モデルにより出力された第一スコアと、他の用途の機械学習モデルにより出力された第二スコアと、に基づき、当該ユーザのローン審査結果が決定されるが、この際、ユーザセグメント毎の第一スコア及び第二スコアの相関の強弱に応じて、審査結果決定部26による審査結果の決定ロジックが決定され、審査結果が出力される。
【0039】
但し、第一スコア及び/又は第二スコアに基づいて当該対象ユーザの審査結果を決定する具体的な手法は本実施形態における開示に限定されない。例えば、審査結果決定部26は、第一スコア及び第二スコアに基づいて算出された第三スコアに基づいて、当該対象ユーザの審査結果を決定してもよい。より具体的には、例えば、審査結果決定部26は、対象ユーザが属するユーザセグメントが第一ユーザセグメントであると判定された場合、第一カテゴリの取引については第一スコアの重みを大きく、第二スコアの重みを小さく設定して算出された第三スコアに基づいて、第二カテゴリの取引については第一スコアの重みを小さく、第二スコアの重みを大きく設定して算出された第三スコアに基づいて、当該対象ユーザの審査結果を決定してもよい。また、例えば、審査結果決定部26は、対象ユーザが属するユーザセグメントが第二ユーザセグメントであると判定された場合、第一スコア及び第二スコアのうちより高い信用度又はより低いリスクを示すスコアの重みを大きく、他方のスコアの重みを小さく設定して算出された第三スコアに基づいて、当該対象ユーザの審査結果を決定してもよい。
【0040】
機械学習部27は、第一スコア取得部22による第一スコア取得に用いられる機械学習モデル、及び第二スコア取得部23による第二スコア取得に用いられる機械学習モデルを生成及び/又は更新する。第一スコア取得のための機械学習モデルは、対象ユーザに係る1又は複数のユーザ属性のデータが入力された場合に、当該ユーザに係る信用度を示す第一スコアを出力する機械学習モデルである。また、第二スコア取得のための機械学習モデルは、対象ユーザに係る1又は複数のユーザ属性のデータが入力された場合に、当該ユーザが支払いを行わずにデフォルトとなる蓋然性に基づくリスクの程度を示す第二スコアを出力する機械学習モデルである。
【0041】
第一スコア取得のための機械学習モデルの生成及び/又は更新にあたって、機械学習部27は、ユーザ毎に、当該ユーザの属性データ群を入力値とし当該ユーザに係るスコアを出力値として定義した教師データを作成する。そして、機械学習部27は、当該教師データに基づいて、第一機械学習モデルを生成及び/又は更新する。上述の通り、第一機械学習モデルに入力される属性データ群には、事実属性データ及び推定属性データが含まれ、対応するユーザのスコアと組み合わせられて、教師データとして機械学習部27に入力される。教師データに設定されるスコアは、ルールベースで決定されたスコアであってよく、マニュアルで設定された(アノテーションがなされた)スコアであってもよい。また、第一機械学習モデルによって過去に出力された後で、管理者等によって修正されたスコアであってもよい。
【0042】
第二スコア取得のための機械学習モデル生成及び/又は更新にあたって、機械学習部27は、ユーザの属性毎に、所定の属性を有する複数のユーザのデフォルト発生率に係る統計量(本実施形態では、平均値。但し、例えば最頻値や中央値等の統計的指標が用いられてもよい。)を、当該属性を有するユーザのリスクの程度を示す第二スコアとして定義した教師データに基づいて、機械学習モデルを作成する。算出された第二スコアは、対応するユーザの事実属性データ及び推定属性データを含む属性データ群と組み合わせられて、教師データとして機械学習部27に入力される。
【0043】
本開示に係る技術を実装するにあたり第一機械学習モデル又は第二機械学習モデル等として採用可能な機械学習モデル生成/更新のフレームワークは、例として、アンサンブル学習アルゴリズムに基づく。当該フレームワークには、例えば、勾配ブースティング決定木(Gradient Boosting Decision Tree:GBDT)に基づく機械学習フレームワーク(例えば、LightGBM)が採用されてよい。換言すると、当該フレームワークは、前後の弱学習器(弱分類器)間で正解と予測値との誤差を引き継がせるような決定木モデルに基づく機械学習フレームワークが採用されてよい。ここでの予測値とは、例として、スコアの予測値を指す。なお、当該フレームワークは、LightGBMの他、XGBoostやCatBoost等のブースティング手法を採用してよい。決定木を用いるフレームワークによれば、ニューラルネットワークを用いるフレームワークと比較して少ないパラメータ調整の手間で、比較的高い性能を有する機械学習モデルを生成/更新することができる。但し、本開示に係る技術を実装するにあたり採用可能な機械学習モデル生成/更新のフレームワークは、本実施形態における例示に限定されない。例えば、学習器として勾配ブースティング決定木に代えてランダムフォレスト等の他の学習器が採用されてよいし、ニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用されてもよい。また、特にニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用される場合には、アンサンブル学習が採用されなくてもよい。
【0044】
図4は、本実施形態において採用される機械学習モデルの決定木の概念を簡略図である。決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークを採用する場合、決定木の各ノードの分岐条件の最適化が行われる。具体的には、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークでは、一つの親のノードから分岐した二つの子のノードの夫々が示す属性を有するユーザ群についてスコアを夫々算出し、このスコアの差分が大きくなるように(例えば、差分が最大になるように、又は所定の閾値以上になるように)、即ち、二つの子のノードがきれいに分岐するように、親のノードの分岐条件が最適化される。例えば、ノードの分岐条件として示される属性が年齢である場合、分岐の閾値に設定される年齢を変更したり、分岐条件を年齢以外の属性に変更したりしてもよい。このようにして、決定木の全ノードの分岐条件を再帰的に最適化することで、属性データ群に基づくスコアの推定精度を向上させることができる。
【0045】
<処理の流れ>
次に、本実施形態に係る審査装置によって実行される処理の流れを説明する。なお、以下に説明する処理の具体的な内容及び処理順序は、本開示を実施するための一例である。具体的な処理内容及び処理順序は、本開示の実施の形態に応じて適宜選択されてよい。
【0046】
図5は、本実施形態に係る機械学習処理の流れを示すフローチャートである。本フローチャートに示された処理は、定期的に、又は管理者によって指定されたタイミングで実行される。
【0047】
本実施形態において、機械学習処理では、第一機械学習モデル及び第二機械学習モデルが生成及び/又は更新される。機械学習部27は、過去に蓄積されたユーザ毎の属性データ群と、対応するユーザについて予め決定された第一スコアと、の組み合わせを含む教師データを作成する(ステップS101)。そして、機械学習部27は、作成された教師データを用いて、第一機械学習モデルを生成及び/又は更新する(ステップS102)。また、機械学習部27は、過去に蓄積されたユーザ毎の属性データ群と、対応するユーザについて予め決定された第二スコアと、の組み合わせを含む教師データを作成する(ステップS103)。そして、機械学習部27は、作成された教師データを用いて、第二機械学習モデルを生成及び/又は更新する(ステップS104)。その後、本フローチャートに示された処理は終了する。
【0048】
図6は、本実施形態に係る審査処理の流れを示すフローチャートである。本フローチャートに示された処理は、定期的に、又は指定されたタイミングで、対象となるユーザ毎に実行される。
【0049】
ステップS201からステップS203では、第一スコア及び第二スコアが取得される。属性決定部21は、対象ユーザの属性データ群を取得する(ステップS201)。そして、第一スコア取得部22は、ステップS201で取得された属性データ群のうち、第一機械学習モデルに対応する入力データを第一機械学習モデルに入力し、出力された値に基づいて、当該ユーザに設定される第一スコアを取得する(ステップS202)。また、第二スコア取得部23は、ステップS201で取得された属性データ群のうち、第二機械学習モデルに対応する入力データを第二機械学習モデルに入力し、出力された値に基づいて、当該ユーザに設定される第二スコアを取得する(ステップS203)。その後、処理はステップS204へ進む。
【0050】
ステップS204及びステップS205では、対象ユーザが属するユーザセグメントが特定され、当該ユーザセグメントにおける第一スコアと第二スコアとの相関が判定される。ユーザセグメント特定部24は、対象ユーザを含むユーザ群のセグメンテーションを行うことで、当該対象ユーザが属するユーザセグメントを特定する(ステップS204)。対象ユーザが属するユーザセグメントが特定されると、相関判定部25は、特定されたユーザセグメントにおける第一スコアと第二スコアとの相関の強さに基づいて、当該ユーザセグメントが第一スコアと第二スコアとの間に所定の基準以上の相関を有する第一ユーザセグメントであるか、又は所定の基準未満の相関を有する第二ユーザセグメントであるかを判定する(ステップS205)。当該ユーザセグメントが第一ユーザセグメントであると判定された場合(ステップS205のYES)、処理はステップS206へ進む。一方、当該ユーザセグメントが第二ユーザセグメントであると判定された場合(ステップS205のNO)、処理はステップS207へ進む。
【0051】
ステップS206では、対象カテゴリに係るスコアに基づいて、当該対象ユーザの審査結果が決定される。審査結果決定部26は、対象ユーザが属するユーザセグメントが第一ユーザセグメントであると判定された場合、本審査処理が第一カテゴリの取引について実行されたものである場合には第一スコアに基づいて、本審査処理が第二カテゴリの取引について実行されたものである場合には第二スコアに基づいて、当該対象ユーザの審査結果を決定する。その後、処理はステップS208へ進む。
【0052】
ステップS207では、より高い信用度又はより低いリスクを示すスコアに基づいて、当該対象ユーザの審査結果が決定される。審査結果決定部26は、ステップS205において、対象ユーザが属するユーザセグメントが第二ユーザセグメントであると判定された場合に、第一スコア及び第二スコアのうちより高い信用度又はより低いリスクを示すスコアに基づいて、当該対象ユーザの審査結果を決定する。その後、処理はステップS208へ進む。
【0053】
ステップS208では、審査結果が出力される。審査結果決定部26は、ステップS206又はステップS207における審査結果を出力する。その後、本フローチャートに示された処理は終了する。
【0054】
<効果>
本実施形態によれば、例えば若年層のような信用情報の蓄積が不十分なユーザセグメントに属する任意のユーザを対象としたローン審査等をより高い精度で支援することができる。また、本実施形態によれば、異なる入力データ・モデルの組み合わせにより異なる信用スコア間の相関を考慮することで、より適正にユーザの審査を支援することができる。
【0055】
<バリエーション>
以下、上記説明した実施形態のバリエーションとして、審査装置1bが対象ユーザの属性データ群に基づいて第二スコアを決定するバリエーションを説明する。ここで、本バリエーションに係る審査装置1bのシステム構成及び本バリエーションにおいて用いられるユーザの属性データの例は、上記説明した実施形態と概略同様であるため、説明を省略する(図1を参照)。
【0056】
図7は、バリエーションに係る審査装置1bの機能構成の概略を示す図である。本バリエーションにおいて、審査装置1bは、上記説明した実施形態において説明した、属性決定部21、第一スコア取得部22、第二スコア取得部23、ユーザセグメント特定部24、相関判定部25、審査結果決定部26、及び機械学習部27に加えて、商品関連データ取得部28を備える。
【0057】
商品関連データ取得部28は、対象ユーザが取引に係る融資を受けて購入しようとする商品/サービスの商品関連データを取得する。ここで、商品関連データ取得部28は、商品関連データとして、商品/サービスの属性データ、及び当該商品/サービスを販売する店舗(オンライン店舗を含む。)の属性データの少なくともいずれかを取得する。ここで、商品関連データは商品/サービスに関連する情報であればよく、商品関連データとして取得されるデータは限定されないが、商品/サービスの属性データとしては、例えば、価格や商品/サービスカテゴリ/ジャンル等が挙げられ、店舗の属性データとしては、例えば、店舗価格帯や店舗カテゴリ/ジャンル等が挙げられる。更に、商品関連データには、対象商品/サービスの取引に付随するビジネスルールや取引の種類も含まれてよい。ここで、ビジネスルールや取引の種類には、当該商品/サービスに関連する商慣習や取引に付随する契約の内容、商品/サービスの引き渡し態様(配送方法や店舗での受け渡し等)が含まれてよい。
【0058】
そして、本バリエーションにおいて、第二スコア取得部23は、第二機械学習モデルの出力に基づいて、対象ユーザによる商品及び/又はサービスの購入についての融資の承認又は却下を判定するための第二スコアを取得する。ここで、第二機械学習モデルは商品関連データ毎に適宜、学習されていてよい。
【0059】
より具体的には、対象商品/サービスの商品関連データが取得されると、第二スコア取得部23は、対象ユーザの属性データを、機械学習部27によって生成又は更新された最新の第二機械学習モデルに入力することで、出力値として、対象ユーザが対象商品/サービスを融資で購入した場合に融資の精算が当該対象ユーザによって正しく履行されないリスクに応じて変化する第二スコアを得る。第二スコアが得られた後の処理については、上記実施形態において説明した処理と同様であるため、説明を省略する。
【0060】
<その他のバリエーション>
以下、上記説明した実施形態のバリエーションとして、審査装置1が第一機械学習モデル及び第二機械学習モデルを含むn個の複数の機械学習モデル(第一~第n機械学習モデル)のそれぞれの出力(第一~第nスコア)に基づいて、ユーザの審査結果を決定してよい(n>1)。また、第一~第n機械学習モデルへの入力データは、上述の第一機械学習モデルへの入力データであってよく、第二機械学習モデルへの入力データであってよい。
【0061】
第一~第n機械学習モデルは、取引に係る期間及び/又は額に応じて分類される第一~第nカテゴリの取引におけるユーザの属性と当該ユーザの信用度との関係を学習することで生成されてよい。また、第一~第n機械学習モデルは、期間又は額に限らず、金利、担保の有無、返済方式等のその他の特徴に応じて分類される第一~第nカテゴリの取引におけるユーザの属性と当該ユーザの信用度との関係を学習することで生成されてよい。
【0062】
審査装置1は、対象ユーザが属するユーザセグメントに応じて、当該対象ユーザの第一~第nスコアに基づいて当該対象ユーザの審査結果を決定する。審査装置1は、対象ユーザが属するユーザセグメントに応じて、第一~第nスコアの何れかに基づいて審査結果を決定してよく、重み付けされた第一~第nスコアに基づいて審査結果を決定してよい。
【符号の説明】
【0063】
1 審査装置

図1
図2
図3
図4
図5
図6
図7