(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-22
(45)【発行日】2024-10-30
(54)【発明の名称】情報処理システム、方法及びプログラム
(51)【国際特許分類】
G06Q 40/03 20230101AFI20241023BHJP
【FI】
G06Q40/03
(21)【出願番号】P 2022056451
(22)【出願日】2022-03-30
【審査請求日】2023-09-27
(73)【特許権者】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】100145838
【氏名又は名称】畑添 隆人
(74)【代理人】
【識別番号】100103137
【氏名又は名称】稲葉 滋
(74)【代理人】
【識別番号】100216367
【氏名又は名称】水谷 梨絵
(72)【発明者】
【氏名】山下 智彦
(72)【発明者】
【氏名】町田 大樹
(72)【発明者】
【氏名】呉 垠
(72)【発明者】
【氏名】オシュ スブラタ
(72)【発明者】
【氏名】河崎 麻里子
(72)【発明者】
【氏名】ジェーン アシュリー
(72)【発明者】
【氏名】梅田 卓志
【審査官】加内 慎也
(56)【参考文献】
【文献】特開2020-071835(JP,A)
【文献】特開2020-149363(JP,A)
【文献】特開2020-035395(JP,A)
【文献】特開2019-185595(JP,A)
【文献】特開2020-021231(JP,A)
【文献】特開2020-021151(JP,A)
【文献】特開2021-026401(JP,A)
【文献】特開2013-101443(JP,A)
【文献】米国特許出願公開第2021/0217080(US,A1)
【文献】特許第6761508(JP,B1)
【文献】井上 健太郎,検証!成果出す業務革新ビフォー・アフター CRMで勝つ! クレディセゾン,日経情報ストラテジー 2005年11月号,日本,日経BP社 Nikkei Business Publications,Inc.,2005年09月26日,No.163 ,p.88-91
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
所定のアクションの実行をユーザに促すための該ユーザに対する所定のオペレーションが、該ユーザが前記アクションを実行するか否かに与える効果を
、複数のユーザのうち前記オペレーションを受けたユーザによる前記アクションの実行率に係る統計量と、前記複数のユーザのうち前記オペレーションを受けなかったユーザによる前記アクションの実行率に係る統計量とに基づく因果スコアとして、該ユーザにかかる属性データ群に基づき推定する効果推定手段と、
前記ユーザが前記アクションを実行しない蓋然性に基づくリスクを、前記属性データ群に基づき推定するリスク推定手段と、
推定された前記効果及び前記リスクに基づいて、前記属性データ群を拡張する属性拡張手段と、
拡張された前記属性データ群に基づいて、前記ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、
を備える情報処理システム。
【請求項2】
前記効果推定手段は、前記ユーザに係る1又は複数の属性の入力に対して、該ユーザに対する前記オペレーションの効果を示す
前記因果スコアを出力する効果推定モデルを用いて、前記オペレーションの効果を推定する、
請求項1に記載の情報処理システム。
【請求項3】
前記効果推定モデルは、所定の属性を有する複数のユーザのうち前記オペレーションを受けたユーザによる前記アクションの実行率に係る統計量と、前記複数のユーザのうち前記オペレーションを受けなかったユーザによる前記アクションの実行率に係る統計量とに基づくスコアを、前記属性を有するユーザに対する前記オペレーションの効果を示す
前記因果スコアとして定義した教師データに基づいて、作成される、
請求項2に記載の情報処理システム。
【請求項4】
前記効果推定手段は、所定のアクションの実行をユーザに促すための該ユーザに対する第一のオペレーションが、該ユーザが前記アクションを実行するか否かに与える第一の効果、及び、前記所定のアクションの実行をユーザに促すための該ユーザに対する第二のオペレーションが、該ユーザが前記アクションを実行するか否かに与える第二の効果を推定し、
前記属性拡張手段は、推定された前記第一の効果、前記第二の効果及び前記リスクに基づいて、前記属性データ群を拡張する、
請求項1から3のいずれか一項に記載の情報処理システム。
【請求項5】
前記リスク推定手段は、前記ユーザに係る1又は複数の属性の入力に対して、該ユーザについて債権が回収されずにデフォルトとなる確率を示すリスク指標を出力するリスク推定モデルを用いて、前記リスクを推定する、
請求項1から4のいずれか一項に記載の情報処理システム。
【請求項6】
前記ユーザスコア推定手段は、前記ユーザの属性データ群をユーザスコア推定モデルに入力することで、該ユーザに設定されるユーザスコアを推定する、
請求項1から5のいずれか一項に記載の情報処理システム。
【請求項7】
前記ユーザスコア推定手段は、勾配ブースティング決定木に基づく機械学習フレームワークを用いて生成された前記ユーザスコア推定モデルを用いて、前記ユーザスコアを推定する、
請求項6に記載の情報処理システム。
【請求項8】
前記ユーザスコア推定手段は、ユーザのデモグラフィック属性を含む属性データ群を入力値とし該ユーザに係る前記ユーザスコアを出力値とする教師データを用いて生成された前記ユーザスコア推定モデルを用いて、前記ユーザに設定されるユーザスコアを推定する、
請求項7に記載の情報処理システム。
【請求項9】
コンピュータが、
所定のアクションの実行をユーザに促すための該ユーザに対する所定のオペレーションが、該ユーザが前記アクションを実行するか否かに与える効果を
、複数のユーザのうち前記オペレーションを受けたユーザによる前記アクションの実行率に係る統計量と、前記複数のユーザのうち前記オペレーションを受けなかったユーザによる前記アクションの実行率に係る統計量とに基づく因果スコアとして、該ユーザにかかる属性データ群に基づき推定する効果推定ステップと、
前記ユーザが前記アクションを実行しない蓋然性に基づくリスクを、前記属性データ群に基づき推定するリスク推定ステップと、
推定された前記効果及び前記リスクに基づいて、前記属性データ群を拡張する属性拡張ステップと、
拡張された前記属性データ群に基づいて、前記ユーザに設定されるユーザスコアを推定するユーザスコア推定ステップと、
を実行する方法。
【請求項10】
コンピュータを、
所定のアクションの実行をユーザに促すための該ユーザに対する所定のオペレーションが、該ユーザが前記アクションを実行するか否かに与える効果を
、複数のユーザのうち前記オペレーションを受けたユーザによる前記アクションの実行率に係る統計量と、前記複数のユーザのうち前記オペレーションを受けなかったユーザによる前記アクションの実行率に係る統計量とに基づく因果スコアとして、該ユーザにかかる属性データ群に基づき推定する効果推定手段と、
前記ユーザが前記アクションを実行しない蓋然性に基づくリスクを、前記属性データ群に基づき推定するリスク推定手段と、
推定された前記効果及び前記リスクに基づいて、前記属性データ群を拡張する属性拡張手段と、
拡張された前記属性データ群に基づいて、前記ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ユーザに関するスコアを算出するための技術に関する。
【背景技術】
【0002】
従来、ユーザの行動を示す行動情報を取得するユーザ情報取得部と、行動情報に基づいて、将来のユーザの融資に対する返済能力に関する信用度を判定する信用度判定部と、を備える判定装置が提案されている(特許文献1を参照)。また、金融機関が融資先の信用度を自動的に判定する融資先信用度判定プログラムが知られている(例えば、特許文献2を参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2021-174039号公報
【文献】特開2021-140210号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来、ユーザの行動履歴に基づいてユーザの信用度等を表すユーザスコアを算出する技術が提案されている。また、ユーザスコアの算出に際して、ユーザに係るリスクを考慮して算出を行うことも提案されている。しかし、ユーザスコアの算出に際して当該ユーザの属性として扱われる属性データは主としてユーザが置かれた環境やユーザによる自発的な行動を示すもの等に留まっており、ユーザスコアの正確性を向上させるにあたって改善の余地があった。
【0005】
本開示は、上記した問題に鑑み、ユーザに対するオペレーションに起因する当該ユーザの行動変容をユーザスコアの推定に反映することを課題とする。
【課題を解決するための手段】
【0006】
本開示の一例は、所定のアクションの実行をユーザに促すための該ユーザに対する所定のオペレーションが、該ユーザが前記アクションを実行するか否かに与える効果を、該ユーザにかかる属性データ群に基づき推定する効果推定手段と、前記ユーザが前記アクションを実行しない蓋然性に基づくリスクを、前記属性データ群に基づき推定するリスク推定手段と、推定された前記効果及び前記リスクに基づいて、前記属性データ群を拡張する属性拡張手段と、拡張された前記属性データ群に基づいて、前記ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、を備える情報処理システムである。
【0007】
本開示は、情報処理装置、システム、コンピュータによって実行される方法又はコンピュータに実行させるプログラムとして把握することが可能である。また、本開示は、そのようなプログラムをコンピュータその他の装置、機械等が読み取り可能な記録媒体に記録したものとしても把握できる。ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的又は化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。
【発明の効果】
【0008】
本開示によれば、ユーザに対するオペレーションに起因する当該ユーザの行動変容をユーザスコアの推定に反映することが可能となる。
【図面の簡単な説明】
【0009】
【
図1】第1実施形態に係る情報処理システムの構成を示す概略図である。
【
図2】第1実施形態に係る情報処理装置の機能構成の概略を示す図である。
【
図3】第1実施形態に係る因果スコアの推定処理に関する簡略図である。
【
図4】第1実施形態に係るリスク指標の推定処理に関する簡略図である。
【
図5】第1実施形態に係るユーザスコアの推定処理に関する簡略図である。
【
図6】第1実施形態において採用される機械学習モデルの決定木の概念を簡略図である。
【
図7】第1実施形態に係る機械学習処理の流れを示すフローチャートである。
【
図8】第1実施形態に係るユーザスコア推定処理の流れを示すフローチャートである。
【
図9】第2実施形態に係るユーザスコアの推定処理に関する簡略図である。
【
図10】第2実施形態に係るユーザスコアの推定処理に関する簡略図である。
【発明を実施するための形態】
【0010】
<第1実施形態>
以下、本開示に係る情報処理装置、方法及びプログラムの実施の形態を、図面に基づいて説明する。但し、以下に説明する実施の形態は、実施形態を例示するものであって、本開示に係る情報処理装置、方法及びプログラムを以下に説明する具体的構成に限定するものではない。実施にあたっては、実施の態様に応じた具体的構成が適宜採用され、また、種々の改良や変形が行われてよい。
【0011】
本実施形態では、本開示に係る技術を、ユーザに関連する何らかの尺度(例えば、信用等)を示すユーザスコア241を管理するユーザスコア管理システムのために実施した場合の実施の形態について説明する。但し、本開示に係る技術は、ユーザスコア241を推定するための技術について広く用いることが可能であり、本開示の適用対象は、実施形態において示した例に限定されない。
【0012】
<システムの構成>
図1は、本実施形態に係る情報処理システムの構成を示す概略図である。本実施形態に係るシステムでは、情報処理装置1と、1又は複数のサービス提供システム5と、が互いに通信可能に接続されている。ユーザは、サービス提供システム5によって提供されるサービスの利用者であり、ユーザ端末からサービス提供システム5にアクセスすることでサービスの提供を受ける。
【0013】
情報処理装置1は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、EEPROM(Electrically Erasable and Programmable Read Only Memory)やHDD(Hard Disk Drive)等の記憶装置14、NIC(Network Interface Card)等の通信ユニット15、等を備えるコンピュータである。但し、情報処理装置1の具体的なハードウェア構成に関しては、実施の態様に応じて適宜省略や置換、追加が可能である。また、情報処理装置1は、単一の筐体からなる装置に限定されない。情報処理装置1は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。
【0014】
情報処理装置1は、ユーザ毎にユーザスコア241を管理し、サービス提供システム5に対してユーザスコア241を提供する。サービス提供システム5は、情報処理装置1から提供されたユーザスコア241に応じて、対象ユーザに対するサービスをカスタマイズすることが可能である。
【0015】
サービス提供システム5は、CPU、ROM、RAM、記憶装置、通信ユニット、入力装置、出力装置等(図示は省略する)を備えるコンピュータである。また、これらのシステム及び端末は、いずれも、単一の筐体からなる装置に限定されない。これらのシステム及び端末は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。
【0016】
サービス提供システム5によって提供されるサービスは、例えば、地図情報サービスやクレジットカード/後払い決済サービス、電子マネー決済サービス、オンラインショッピングサービス、オンライン予約サービス、オペレーションセンターサービス等である。なお、「後払い決済」には、所謂Buy Now Pay Later(BNPL)等と称されるサービスに限定されず、あらゆる後払いによる商品/サービスの購入が含まれるものとする。サービス提供システム5によって提供されるサービスは本実施形態における例示に限定されない。そして、サービス提供システム5は、サービスの提供に際してユーザから取得された当該ユーザの属性データ群200を情報処理装置1に通知する。ここで、ユーザの属性データ群200には当該ユーザによるサービスの利用履歴データが含まれる。サービスの利用履歴データの内容はサービスの内容に応じて様々であり、例えば、ユーザの位置情報の履歴データ、クレジットカード利用額/後払い決済利用額の支払履歴データ、電子マネー利用履歴データ、取引履歴データ、予約履歴データ、オペレーションセンターからのユーザに対するオペレーション履歴データ等が含まれてよい。
【0017】
本実施形態に係るシステムでは、サービス提供システム5として、オペレーションセンター管理システム5aと、クレジットカード/後払い決済管理システム5bと、が互いに通信可能に接続されている。オペレーションセンターには、オペレーションセンター管理システム5aによる指示に従ってオペレーションを行うためのオペレーション端末(図示は省略する)が設置され、オペレータは、オペレーション端末を操作して、ユーザに対するオペレーションを行う。ユーザは、クレジットカード/後払い決済の利用者であり、金融機関等を介してクレジットカード利用額/後払い決済利用額の入金を行い、クレジットカード利用額/後払い決済利用額の支払履歴データは、クレジットカード/後払い決済管理システム5bを介してオペレーションセンター管理システム5aに通知される。
【0018】
オペレーションセンター管理システム5aは、支払いが遅延しているクレジットカード利用額及び/又は後払い決済利用額の支払いを督促して債権を回収するためのオペレーションセンターを管理するためのシステムである。通常、クレジットカード利用額/後払い決済利用額の支払いは、毎月の引き落とし日にユーザの口座から引き落とされる、又は指定日までにユーザから入金される、等の方法で行われるが、ユーザの口座の残高が不足していたり、ユーザが指定日までの入金を行わなかったり等の理由でクレジットカード利用額/後払い決済利用額の支払いが規定日までに完了しない場合がある。このため、従来、クレジットカード利用額/後払い決済利用額の支払いをユーザに督促して債権を回収するために、オペレーションセンター(コールセンター)からの顧客に対する架電やメッセージ送信等のオペレーションが行われている。
【0019】
一般的には、デフォルト(債務不履行)を回避するために、ユーザに対するオペレーションは有効であり、オペレーションの量を増やすほど債権の回収率は上がる。しかし一方で、オペレーションの量を増やすほど、オペレーションのための人件費やシステム利用料、システム維持費用等のコストが増大する。そこで、本開示に係るシステムでは、上記した問題に鑑み、債権の回収率を下げることなく、オペレーションに係るコストを抑制するための技術を採用している。なお、本実施形態では、主として所定のオペレーションがユーザへの架電である例について説明するが、所定のオペレーションの内容は限定されず、ユーザに所定のアクションを促すための種々のオペレーションであってよい。
【0020】
図2は、本実施形態に係る情報処理装置1の機能構成の概略を示す図である。情報処理装置1は、記憶装置14に記録されているプログラムが、RAM13に読み出され、CPU11によって実行されて、情報処理装置1に備えられた各ハードウェアが制御されることで、効果推定部21、リスク推定部22、属性拡張部23、ユーザスコア推定部24、及び機械学習部25を備える情報処理装置として機能する。なお、本実施形態及び後述する他の実施形態では、情報処理装置1の備える各機能は、汎用プロセッサであるCPU11によって実行されるが、これらの機能の一部又は全部は、1又は複数の専用プロセッサによって実行されてもよい。
【0021】
図3は、実施形態に係る因果スコアの推定処理に関する簡略図である。効果推定部21は、所定のアクションの実行をユーザに促すための当該ユーザに対する所定のオペレーションが、当該ユーザがアクションを実行するか否かに与える効果を推定する。本実施形態において、所定のアクションは、支払いが遅延しているクレジットカード利用額/後払い決済利用額の支払いである。なお、具体的な支払手段は限定されず、指定口座への振込や指定窓口での支払等であってよい。また、本実施形態において、所定のオペレーションは、支払いが遅延しているクレジットカード利用額/後払い決済利用額の支払いのための督促の架電である。なお、ユーザに対する架電は、録音又は機械音声を用いた自動架電であってもよいし、オペレータ(人間)がユーザと会話する架電であってもよい。そして、本実施形態において、効果推定部21は、対象ユーザに係る1又は複数のユーザ属性を含む属性データ群200の入力に対して、当該ユーザに対するオペレーションの効果を示す因果スコア(causality score)211を出力する効果推定モデル210を用いて、オペレーションの効果を推定する。
【0022】
図4は、実施形態に係るリスク指標221の推定処理に関する簡略図である。リスク推定部22は、ユーザが上記説明した所定のアクションを実行しない蓋然性に基づくリスクを推定する。リスクの表現方法は限定されず、様々な指標が採用されてよいが、例えば、リスクは、債権が回収されずにデフォルトとなる確率を用いて表現することが出来る。そして、本実施形態において、リスク推定部22は、対象ユーザに係る1又は複数のユーザ属性を含む属性データ群200の入力に対して、当該ユーザについて債権が回収されずにデフォルトとなる確率を示すリスク指標221を出力するリスク推定モデル220を用いて、ユーザがアクションを実行しない蓋然性に基づくリスクを推定する。但し、リスクは、リスク推定モデル220を用いずに、例えば所定のルールに従って推定されてもよい。例えば、リスクは、ユーザ属性又はユーザ属性の組合せ毎に予め対応する値を保持しておき、この値を読み出すことで取得されてもよい。また、リスクを示す指標には、デフォルトとなる確率以外の指標が採用されてよい。例えば、リスクをクラス(ランク)分けし、いずれのクラス(ランク)であるかを指標として用いてもよい。
【0023】
属性拡張部23は、ユーザにかかる属性データ群200を拡張する。ユーザにかかる属性データ群200には、オペレーションセンター管理システム5a及びクレジットカード/後払い決済管理システム5bから取得された利用履歴データを含む属性データが含まれるが、この際、属性拡張部23は、推定された効果(本実施形態では、因果スコア211)及びリスク(本実施形態では、リスク指標221)に基づいて、ユーザにかかる属性データ群200を拡張する。なお、本実施形態において、属性拡張部23は、推定された因果スコア211及びリスク指標221をそのままユーザにかかる属性データ群200の一部として決定し、属性データ群200を拡張する。但し、属性拡張部23は、推定された因果スコア211及びリスク指標221に対して何らかの加工(正規化やランク化、ラベル化等)を施して属性データとしてもよいし、推定された因果スコア211及びリスク指標221を用いて算出された他の種類のスコアを属性データとしてもよい。また、他の種類のスコアの算出には、他の機械学習モデルが介在してもよい。
【0024】
ここで、属性拡張部23によって拡張される属性データ群200には、デモグラフィック属性、ビヘイビオラル属性、又はサイコグラフィック属性が含まれてよい。デモグラフィック属性は、例えば、ユーザの性別(ジェンダー)、家族構成、年齢等であり、ビヘイビオラル属性は、サービスの利用履歴データに基づいてよく、例えば、キャッシング利用有無、リボ払い利用有無、所定の口座に係る入出金履歴、賭博又はくじを含む何らかの商品に係る商取引履歴(オンラインマーケットプレイス等におけるオンライン取引履歴を含んでよい)等であり、サイコグラフィック属性は、例えば、賭博又はくじに係る趣向等である。但し、利用可能なユーザの属性は、本実施形態における例示に限定されない。例えば、オペレーションセンター等からの「オペレーション(架電等)に要する時間」、「クレジットカード利用額/後払い決済利用額」も、属性として用いられてよい。
【0025】
そして、属性データ群200には、上記した属性データに加えて更に、効果推定部21によって効果推定モデル210を用いて推定された因果スコア211と、リスク推定部22によってリスク推定モデル220を用いて推定されたリスク指標221とが含まれる。
【0026】
図5は、実施形態に係るユーザスコアの推定処理に関する簡略図である。ユーザスコア推定部24は、属性データ群200に基づいて、ユーザに設定されるユーザスコア241を推定する。本実施形態において、ユーザスコア推定部24は、ユーザの属性データ群200をユーザスコア推定モデル240に入力することで、当該ユーザに設定されるユーザスコア241を推定する。ここで、ユーザスコア推定モデル240の出力値は、例として、0を最小値、1を最大値として正規化/規格化されたユーザスコア241である。
【0027】
機械学習部25は、ユーザスコア推定部24によるユーザスコア推定に用いられるユーザスコア推定モデル240と、効果推定部21による効果推定に用いられる効果推定モデル210と、リスク推定部22によるリスク推定に用いられるリスク推定モデル220と、を生成及び/又は更新する。ユーザスコア推定モデル240は、対象ユーザに係る1又は複数の属性データ(属性データ群200)が入力された場合に、ユーザに関連する何らかの尺度(例えば、信用等)を示すユーザスコア241を出力する機械学習モデルである。また、効果推定モデル210は、対象ユーザに係る1又は複数のユーザ属性のデータが入力された場合に、当該ユーザに対するオペレーションの効果の多寡を示す因果スコア211を出力する機械学習モデルである。また、リスク推定のためのリスク推定モデル220は、対象ユーザに係る1又は複数のユーザ属性のデータが入力された場合に、当該ユーザがアクションを実行しない蓋然性に基づくリスクの程度を示すリスク指標221を出力する機械学習モデルである。
【0028】
ユーザスコア推定モデル240の生成及び/又は更新にあたって、機械学習部25は、ユーザ毎に、当該ユーザのデモグラフィック属性を含む属性データ群200を入力値とし当該ユーザに係るユーザスコア241を出力値として定義した教師データに基づいて、ユーザスコア推定モデル240を作成する。上述の通り、ユーザスコア推定モデル240に入力される属性データ群200には、効果推定部21によって推定された因果スコア211及びリスク推定部22によって推定されたリスク指標221が属性データ群200に含まれ、対応するユーザのユーザスコア241と組み合わせられて、教師データとして機械学習部25に入力される。教師データに設定されるユーザスコア241は、ルールベースで決定されたユーザスコアであってよく、マニュアルで設定された(アノテーションがなされた)ユーザスコアであってもよい。また、ユーザスコア推定モデル240によって過去に出力された後で、管理者等によって修正されたユーザスコアであってもよい。
【0029】
本開示に係る技術を実装するにあたり効果推定モデル210、リスク推定モデル220、ユーザスコア推定モデル240等として採用可能な機械学習モデル生成のフレームワークは、例として、アンサンブル学習アルゴリズムに基づく。当該フレームワークには、例えば、勾配ブースティング決定木(Gradient Boosting Decision Tree:GBDT)に基づく機械学習フレームワーク(例えば、LightGBM)が採用されてよい。換言すると、当該フレームワークは、前後の弱学習器(弱分類器)間で正解と予測値との誤差を引き継がせるような決定木モデルに基づく機械学習フレームワークが採用されてよい。ここでの予測値とは、例として、ユーザスコア241の予測値を指す。なお、当該フレームワークは、LightGBMの他、XGBoostやCatBoost等のブースティング手法を採用してよい。決定木を用いるフレームワークによれば、ニューラルネットワークを用いるフレームワークと比較して少ないパラメータ調整の手間で、比較的高い性能を有する機械学習モデルを生成することが出来る。但し、本開示に係る技術を実装するにあたり採用可能な機械学習モデル生成のフレームワークは、本実施形態における例示に限定されない。例えば、学習器として勾配ブースティング決定木に代えてランダムフォレスト等の他の学習器が採用されてよいし、ニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用されてもよい。また、特にニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用される場合には、アンサンブル学習が採用されなくてもよい。
【0030】
図6は、本実施形態において効果推定モデル210、リスク推定モデル220、ユーザスコア推定モデル240等として採用される機械学習モデルの決定木の概念を簡略化して示す図である。決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークを採用する場合、決定木の各ノードの分岐条件の最適化が行われる。具体的には、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークでは、一つの親のノードから分岐した二つの子のノードの夫々が示す属性を有するユーザ群についてユーザスコア241を夫々算出し、このユーザスコア241の差分が大きくなるように(例えば、差分が最大になるように、又は所定の閾値以上になるように)、即ち、二つの子のノードがきれいに分岐するように、親のノードの分岐条件が最適化される。例えば、ノードの分岐条件として示される属性が年齢である場合、分岐の閾値に設定される年齢を変更したり、分岐条件を年齢以外の属性に変更したりしてもよい。また、例えば、ユーザスコア推定モデル240におけるノードの分岐条件として示される属性が因果スコア211である場合、分岐の閾値に設定される因果スコア211の多寡を変更したり、分岐条件を因果スコア211以外の属性に変更したりしてもよい。また、例えば、ノードの分岐条件として示される属性がリスク指標221である場合、分岐の閾値に設定されるリスク指標221の多寡やクラス(ランク)を変更したり、分岐条件をリスク指標221以外の属性に変更したりしてもよい。このようにして、決定木の全ノードの分岐条件を再帰的に最適化することで、属性データ群200に基づくユーザスコア241の推定精度を向上させることができる。
【0031】
効果推定モデル210の生成及び/又は更新にあたって、機械学習部25は、オペレーションセンター管理システム5a及びクレジットカード/後払い決済管理システム5bから取得したデータに基づいて、ユーザの属性毎に、所定の属性を有する複数のユーザのうちオペレーションを受けたユーザによるアクションの実行率(債権の回収率)に係る統計量と、複数のユーザのうちオペレーションを受けなかったユーザによるアクションの実行率に係る統計量とに基づくスコアを、当該属性を有するユーザに対するオペレーションの効果を示す因果スコア211として定義した教師データ(機械学習用データ)を作成する。そして、機械学習部25は、当該教師データに基づいて、効果推定モデル210を作成する。本実施形態では、例として、オペレーションの内容がユーザへの架電であった場合、「(ユーザが架電された場合における債権の回収率)-(ユーザが架電されなかった場合における債権の回収率)」の式により各統計量の差分に基づく因果スコア211が算出され、算出された因果スコア211が対応するユーザの属性データと組み合わせられて、教師データとして機械学習部25に入力される。なお、本実施形態では、統計量として平均値を用いる例を説明する。但し、統計量としては例えば最頻値や中央値等の統計的指標が用いられてもよい。ここで、アクションの実行率に係る統計量は、各ユーザの所定期間(例えば、所定の月)内の過去の債権回収率に基づいてよい。また、本実施形態では、各統計量の差分に基づく因果スコア211を算出することとしているが、当該差分に統計的な有意差が認められない場合には、因果スコア211をゼロ又は略ゼロとしてよい。ここで、当該有意差の存否の判定には既存の統計的手法が採用されてよい。例えば、各月のユーザの平均回収率等の集合について標準誤差や信頼区間を考慮し、架電の有無による回収率の変化について統計的有意性を考慮することが出来る。このようにすることで、同一グループ内のユーザによる平均回収率のばらつきを考慮して因果スコア211を推定(算出)することが可能となる。
【0032】
教師データの作成にあたって、一度架電されたユーザは、以後架電されなかったユーザにはなり得ないため、1のユーザについては、当該ユーザが架電された場合の回収率と架電されなかった場合の回収率とのいずれか一方のみを取得可能である。このため、架電の効果の教師データは、共通の属性を有するユーザ群毎に作成される。即ち、ある共通の属性を有するユーザからなるユーザ群に対する架電の効果を示す因果スコア211は、例えば、当該共通の属性を有する複数のユーザを架電される第1サブユーザ群と架電されない第2サブユーザ群とに分け、架電された第1サブユーザ群からの債権の回収率の平均値と架電されなかった第2サブユーザ群からの債権の回収率の平均値とを夫々算出し、これらの回収率の平均値の差分を上述した式に基づいて算出することによって取得される。例えば、架電された第1サブユーザ群からの債権の回収率の平均値が80%であり、架電されなかった第2サブユーザ群からの債権の回収率の平均値が70%である場合、当該ユーザ群に対する架電の効果を示す因果スコア211は、「10」である。
【0033】
また、効果推定モデル210の生成又は更新においても、採用可能な機械学習モデル生成のフレームワークは限定されないが、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークが採用されてよいことは、上記説明したユーザスコア推定モデル240の生成及び/又は更新と同様である。
【0034】
リスク推定モデル220の生成及び/又は更新にあたって、機械学習部25は、オペレーションセンター管理システム5a及びクレジットカード/後払い決済管理システム5bから取得したデータに基づいて、ユーザの属性毎に、所定の属性を有する複数のユーザのデフォルト発生率に係る統計量(本実施形態では、平均値。但し、例えば最頻値や中央値等の統計的指標が用いられてもよい。)を、当該属性を有するユーザのリスクの程度を示すリスク指標221として定義した教師データを作成する。そして、機械学習部25は、当該教師データに基づいて、リスク推定モデル220を作成する。算出されたリスク指標221は、対応するユーザの属性データと組み合わせて、教師データとして機械学習部25に入力される。また、リスク推定モデル220の生成又は更新においても、採用可能な機械学習モデル生成のフレームワークは限定されないが、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークが採用されてよいことは、上記説明したユーザスコア推定モデル240の生成及び/又は更新と同様である。
【0035】
<処理の流れ>
次に、本実施形態に係る情報処理システムによって実行される処理の流れを説明する。なお、以下に説明する処理の具体的な内容及び処理順序は、本開示を実施するための一例である。具体的な処理内容及び処理順序は、本開示の実施の形態に応じて適宜選択されてよい。
【0036】
図7は、本実施形態に係る機械学習処理の流れを示すフローチャートである。本フローチャートに示された処理は、管理者によって指定されたタイミングで実行される。
【0037】
ステップS101及びステップS102では、効果推定モデル210が生成及び/又は更新される。機械学習部25は、オペレーションセンター管理システム5a及び/又はクレジットカード/後払い決済管理システム5bにおいて過去に蓄積された、ユーザの属性データ、オペレーション履歴データ、及びクレジットカード利用額/後払い決済利用額の支払履歴データに基づいて、複数のユーザ属性(属性データ群200)の夫々について因果スコア211を算出し、ユーザ属性(属性データ群200)と因果スコア211との組み合わせを含む教師データを作成する(ステップS101)。ここで、オペレーション履歴データは、ユーザ毎に、当該ユーザに対してオペレーションが行われたか否かを把握することが可能なデータを含み、支払履歴データは、ユーザ毎に、当該ユーザのクレジットカード利用額/後払い決済利用額の支払有無(デフォルトの有無)を把握することが可能なデータを含む。そして、機械学習部25は、作成された教師データを効果推定モデル210に入力し、効果推定部21による効果推定に用いられる効果推定モデル210を生成又は更新する(ステップS102)。その後、処理はステップS103へ進む。
【0038】
ステップS103及びステップS104では、リスク推定に用いられるリスク推定モデル220が生成及び/又は更新される。機械学習部25は、オペレーションセンター管理システム5a及び/又はクレジットカード/後払い決済管理システム5bにおいて過去に蓄積された、ユーザの属性データ、オペレーション履歴データ、及びクレジットカード利用額/後払い決済利用額の支払履歴データに基づいて、複数のユーザ属性(属性データ群200)の夫々についてリスク指標221を算出し、ユーザ属性(属性データ群200)とリスク指標221との組み合わせを含む教師データを作成する(ステップS103)。そして、機械学習部25は、作成された教師データをリスク推定モデル220に入力し、リスク推定部22によるリスク推定に用いられるリスク推定モデル220を生成又は更新する(ステップS104)。その後、処理はステップS105へ進む。
【0039】
ステップS105及びステップS106では、ユーザスコア推定モデル240が生成及び/又は更新される。機械学習部25は、オペレーションセンター管理システム5a及び/又はクレジットカード/後払い決済管理システム5bにおいて過去に蓄積されたユーザ毎の属性データ群200と、対応するユーザについて予め決定されたユーザスコア241と、の組み合わせを含む教師データを作成する(ステップS105)。そして、機械学習部25は、作成された教師データをユーザスコア推定モデル240に入力し、ユーザスコア推定部24によるユーザスコア推定に用いられるユーザスコア推定モデル240を生成又は更新する(ステップS106)。その後、本フローチャートに示された処理は終了する。
【0040】
図8は、本実施形態に係るユーザスコア推定処理の流れを示すフローチャートである。本フローチャートに示された処理は、管理者によって指定されたタイミングで、対象となるユーザ毎に実行される。
【0041】
ステップS201及びステップS202では、オペレーションの効果及びユーザがアクションを実行しない蓋然性に基づくリスクが推定される。リスク推定部22は、複数のユーザの夫々について、ステップS104で生成及び/又は更新されたリスク推定モデル220に対して対象ユーザに係る1又は複数のユーザ属性のデータ(属性データ群200)を入力し、当該リスク推定モデル220からの出力として、当該ユーザに対応するリスク指標221を取得する(ステップS201)。また、効果推定部21は、複数のユーザの夫々について、ステップS102で生成及び/又は更新された効果推定モデル210に対して対象ユーザに係る1又は複数のユーザ属性のデータ(属性データ群200)を入力し、当該効果推定モデル210からの出力として、当該ユーザに対応する因果スコア211を取得する(ステップS202)。その後、処理はステップS203へ進む。
【0042】
ステップS203及びステップS204では、ユーザスコア241が推定され、出力される。属性拡張部23は、ステップS201及びステップS202で推定された因果スコア211及びリスク指標221に基づいて、ユーザにかかる属性データ群200を拡張する(ステップS203)。なお、本実施形態では因果スコア211及びリスク指標221がそのまま属性データ群200の一部(新たなユーザ属性)として決定(追加)されることで属性データ群200が拡張されるため、属性拡張部23は、対象ユーザについてオペレーションセンター管理システム5aやクレジットカード/後払い決済管理システム5bから取得される等して予め保持されている属性データ群200にステップS201及びステップS202で推定された因果スコア211及びリスク指標221を追加することで、当該ユーザの属性データ群200拡張する。そして、ユーザスコア推定部24は、ステップS203で拡張された属性データ群200に基づいてユーザスコア241を推定し、オペレーションセンター管理システム5aに対して出力する(ステップS204)。本実施形態において、ユーザスコア推定部24は、対象ユーザの因果スコア211及びリスク指標221を含む属性データ群200をユーザスコア推定モデル240に入力し、出力された値を当該ユーザに設定されるユーザスコア241として取得する。但し、ユーザスコア241の推定方法は、本実施形態における例示に限定されない。例えば、ユーザスコア241は、属性データ群200を機械学習モデルではない所定の関数に入力して算出された値を含むものであってもよい。その後、本フローチャートに示された処理は終了する。
【0043】
ユーザ毎に設定されたユーザスコア241は、オペレーションセンター管理システム5a及びクレジットカード/後払い決済管理システム5b等のサービス提供システム5に対して提供され、サービス提供システム5によって対象ユーザに対して提供されるサービスのカスタマイズ等に活用される。例えば、オペレーションセンター管理システム5aは、ユーザスコア241に従って対象ユーザへのオペレーションを管理し、オペレーション端末は、オペレーションセンター管理システム5aによって出力された指示に従ってオペレーションを実行する。
【0044】
<効果>
本実施形態によれば、ユーザに対するオペレーションに起因する当該ユーザの行動変容をユーザスコア241の推定に反映することが可能となる。また、様々なユーザ属性データを用いることで、対象ユーザについて一部の属性データが存在しない場合であっても、精度の高いユーザスコア241を推定(算出)することが可能となる。
【0045】
<第2実施形態>
上記説明した実施形態では、推定された因果スコア211及びリスク指標221に基づき拡張された属性データ群200に基づき、対象ユーザのユーザスコア241を推定する例について説明したが、推定された因果スコア211及びリスク指標221は属性データ群200の拡張の用のみに供されるとは限らず、例えば、以下のような利用方法が挙げられる。なお、上記説明した第1実施形態と概略同様の構成については、説明を省略する。
【0046】
図9は、第2実施形態に係るユーザスコアの推定処理に関する簡略図である。ユーザスコア推定部24は、因果スコア211および/またはリスク指標221に応じて、複数のユーザスコア推定モデル(第1ユーザスコア推定モデル240A、第2ユーザスコア推定モデル240B、第3ユーザスコア推定モデル240C、・・・第nユーザスコア推定モデル240N(nは整数))から1のユーザスコア推定モデル240を選択し決定し、属性データ群200に基づきユーザスコア241(ユーザスコア241A、ユーザスコア241B、ユーザスコア241C、・・・ユーザスコア241N)を推定する。ここで、n>1であってよく、n=2であってよく、n=3であってよく、nが示すユーザスコア推定モデル240の数量に制限はない。また、ここで、入力される属性データ群200は、因果スコアおよび/またはリスク指標221によって拡張されたものであってよく、因果スコアおよび/またはリスク指標221によって拡張されていないものであってもよい。また、各ユーザスコア推定モデル240は、因果スコア211および/またはリスク指標221が共通または類似する教師データでトレーニング(学習処理)がなされている。スコア推定対象のユーザにかかる因果スコア211および/またはリスク指標221が所定の範囲内の因果スコア211および/またはリスク指標221を示す場合、当該の範囲内の因果スコア211および/またはリスク指標221に応じて予めトレーニングされたユーザスコア推定モデル240を用いて、ユーザスコア241を推定する。
【0047】
図10は、第2実施形態に係るユーザスコアの推定処理に関する簡略図である。ユーザスコア推定部24は、属性データ群200をユーザスコア推定モデル240に入力することで得られたユーザスコア241を、スコア推定対象のユーザにかかる因果スコア211および/またはリスク指標221に基づき調整、修正、補正、変更等してユーザスコア241Dを決定してよい。ここで、ユーザスコア推定部24は、因果スコア211が所定の閾値を超過する場合、ユーザスコア推定モデル240が出力したユーザスコア241の上方修正を行い、ユーザスコア241Dを決定してよい。一方、ユーザスコア推定部24は、リスク指標221が所定の閾値を超過する場合、ユーザスコア推定モデル240が出力したユーザスコア241の下方修正を行い、ユーザスコア241Dを決定してよい。ユーザスコア推定モデル240が出力したユーザスコア231の修正等に際し、出力されたユーザスコア241に適用する係数、付加されるスコア等は、因果スコア211および/またはリスク指標221と所定の閾値との差分等によって適宜、決定されてよい。
【0048】
<その他のバリエーション>
上記説明した実施形態では、ユーザに対するオペレーションが架電である例について説明したが、ユーザに対するオペレーションの種類は、架電に限定されない。例えば、ユーザに対するオペレーションの種類として、メッセージ送信が採用されてもよい。なお、ここでメッセージ送信のための手段は限定されず、電子メールシステム、ショートメッセージサービス(SMS)、又はソーシャルネットワーキングサービス(SNS)のメッセージ送受信サービス等が利用されてよい。
【0049】
また、上記説明した実施形態では、1種類のオペレーション(架電)について推定された効果に基づいて属性データ群200が拡張される例について説明したが、属性データ群200は、複数種類のオペレーション(例えば、架電およびメッセージ送信)の夫々について推定された効果に基づいて拡張されてもよく、当該効果に基づいてユーザスコア241を決定してよい。この場合、効果推定部21は、所定のアクションの実行をユーザに促すための当該ユーザに対する第一のオペレーション(例えば、架電)が、当該ユーザがアクションを実行するか否かに与える第一の効果、及び、所定のアクションの実行をユーザに促すための当該ユーザに対する第二のオペレーション(例えば、メッセージ送信)が、当該ユーザがアクションを実行するか否かに与える第二の効果を推定し、属性拡張部23は、推定された第一の効果(第1因果スコア)、第二の効果(第2因果スコア)及びリスクのそれぞれに基づいて、ユーザにかかる属性データ群200を拡張してよく、ユーザスコア推定モデル240の決定とユーザスコア241の推定を行ってよい。このとき、効果推定部21は、第1因果スコア及び第2因果スコアに基づき因果スコア211を決定してもよい。具体的には、効果推定部21は、例えば、第1因果スコア及び第2因果スコアの加重平均を因果スコア211として算出してよい。
【0050】
この場合、オペレーションの効果を推定するための効果推定モデル210も、オペレーションの種類毎に生成及び更新される。例えば、第一のオペレーションが架電であり第二のオペレーションがメッセージ送信である場合、架電の効果推定モデル210、及びメッセージ送信の効果推定モデル210が生成及び更新されてよい。
【0051】
また、上記説明した実施形態では、オペレーションを受けたサブユーザ群のアクション実行率と、オペレーションを受けなかったサブユーザ群のアクション実行率との差分を因果スコア211として用いる例について説明したが、因果スコア211には、その他の方法で算出されたものが用いられてもよい。例えば、効果推定のための効果推定モデル210の生成及び/又は更新にあたって、機械学習部25は、ユーザの属性毎に、所定の属性を有する複数のユーザのうちオペレーションに対する所定のリアクションを行なったユーザによるアクションの実行率に係る統計量と、複数のユーザのうち所定のリアクションを行わなかったユーザによるアクションの実行率に係る統計量とに基づくスコアを、当該属性を有するユーザに係る因果スコア211として定義した教師データに基づいて、効果推定モデル210を作成してもよい。例として、本バリエーションでは、「(ユーザが所定のリアクションを行った場合における債権の回収率)-(ユーザが所定のリアクションを行わなかった場合における債権の回収率)」の式により、因果スコア211が算出される。
【0052】
ここで、所定のリアクションは、例えば、架電に対するダイヤルプッシュ等によるユーザの応答、又は架電に対するユーザからの折り返し電話に伴うオペレータとの通話、メッセージに対する返信、メッセージの既読化等である。更に、リアクションの内容として、支払いに対する肯定的な回答や、支払予定日の回答の有無等が考慮されてよい。ユーザによるリアクションが音声によるリアクションであった場合には、ユーザの音声に基づいてユーザの感情等を判定し、リアクションが肯定的であったか否かを判定することも可能である。
【0053】
また、上記説明した推定された因果スコア211及びリスク指標221に基づき、属性データ群200が拡張される例と、ユーザスコア推定モデル240またはユーザスコア241の決定が行われる例と、を示したが、因果スコア211及びリスク指標221に代えて、因果スコア211及びリスク指標221に基づく1の何らかの別の指標(スコア)に基づき、属性データ群200は拡張されてよく、ユーザスコア推定モデル240またはユーザスコア241の決定が行われてよい。このとき、当該1の何らかの別の指標(スコア)は、情報処理装置1により、重み付けされた因果スコア211及びリスク指標のそれぞれに基づいてルールベースで決定されてよく、何らかの機械学習モデルに対して拡張されていない属性データ群200と、重み付けされた因果スコア211及びリスク指標のそれぞれと、を入力することで決定されてよい。
【符号の説明】
【0054】
1 情報処理装置