IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ラクテン アジア プライベート リミテッドの特許一覧

<>
  • 特開-情報処理装置、方法及びプログラム 図1
  • 特開-情報処理装置、方法及びプログラム 図2
  • 特開-情報処理装置、方法及びプログラム 図3
  • 特開-情報処理装置、方法及びプログラム 図4
  • 特開-情報処理装置、方法及びプログラム 図5
  • 特開-情報処理装置、方法及びプログラム 図6
  • 特開-情報処理装置、方法及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024042826
(43)【公開日】2024-03-29
(54)【発明の名称】情報処理装置、方法及びプログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20240322BHJP
【FI】
G06Q50/10
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022147702
(22)【出願日】2022-09-16
(11)【特許番号】
(45)【特許公報発行日】2023-10-20
(71)【出願人】
【識別番号】522369337
【氏名又は名称】ラクテン アジア プライベート リミテッド
(74)【代理人】
【識別番号】100145838
【弁理士】
【氏名又は名称】畑添 隆人
(74)【代理人】
【識別番号】100103137
【弁理士】
【氏名又は名称】稲葉 滋
(72)【発明者】
【氏名】クマール ガーラヴ
(72)【発明者】
【氏名】クシリサガ ヴィシャール
(72)【発明者】
【氏名】山下 智彦
(72)【発明者】
【氏名】町田 大樹
(72)【発明者】
【氏名】呉 垠
(72)【発明者】
【氏名】オシュ スブラタ
(72)【発明者】
【氏名】河崎 麻里子
(72)【発明者】
【氏名】ジェーン アシュリー
(72)【発明者】
【氏名】梅田 卓志
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC11
(57)【要約】
【課題】ユーザの属性全般を統一的に信用スコアに反映するための情報処理を実現することを課題とする。
【解決手段】情報処理装置に、ユーザ自身から提供されたユーザ提供データ又は該ユーザの履歴データに基づいて、該ユーザについて事実であると確認可能な事実属性を決定する事実属性決定部と、少なくともユーザに係る事実属性を含むユーザ関連データに基づいて、該ユーザについて推定された推定属性を決定する推定属性決定部と、ユーザに係る事実属性及び推定属性を含む属性データ群に基づいて、ユーザに設定される信用スコアを推定する信用スコア推定部と、を備えた。
【選択図】図2

【特許請求の範囲】
【請求項1】
ユーザ自身から提供されたユーザ提供データ又は該ユーザの履歴データに基づいて、該ユーザについて事実であると確認可能な事実属性を決定する事実属性決定手段と、
少なくとも前記ユーザに係る前記事実属性を含むユーザ関連データに基づいて、該ユーザについて推定された推定属性を決定する推定属性決定手段と、
前記ユーザに係る前記事実属性及び推定属性を含む属性データ群に基づいて、前記ユーザに設定される信用スコアを推定する信用スコア推定手段と、を備え、
前記信用スコア推定手段は、前記属性データ群を信用スコア推定モデルに入力して得られた出力値に基づいて、該ユーザに設定される信用スコアを推定し、
前記信用スコア推定手段は、前記属性データ群を入力値とし、該属性データ群が共通するユーザに係る後払い決済の支払履歴に基づいて決定された前記信用スコアを出力値とする教師データを用いて生成及び/又は更新された前記信用スコア推定モデルを用いて、前記ユーザに設定される信用スコアを推定する、
情報処理装置。
【請求項2】
前記推定属性決定手段は、前記事実属性を含むユーザ関連データを属性推定モデルに入力して得られた出力値に基づいて、前記推定属性を決定する、
請求項1に記載の情報処理装置。
【請求項3】
前記推定属性決定手段は、前記事実属性を含むユーザ関連データを入力値とし該事実属性に係るユーザが所定の推定属性を有する蓋然性を示す値を出力値とする前記属性推定モデルから得られた出力値が所定の範囲内にある場合に、該ユーザが該推定属性を有すると決定する、
請求項2に記載の情報処理装置。
【請求項4】
前記推定属性決定手段の前記属性推定モデルは、前記事実属性を含むユーザ関連データが入力されることで、出力値として対象ユーザのベクトル表現が得られる表現ネットワークと、該表現ネットワークから得られた該対象ユーザのベクトル表現が入力されることで、出力値として該対象ユーザが所定の推定属性を有する蓋然性を示す値が得られる予測ネットワークと、を有する、
請求項3に記載の情報処理装置。
【請求項5】
前記推定属性決定手段の前記属性推定モデルは、前記事実属性を含むユーザ関連データが入力されることで、出力値として対象ユーザについての複数のベクトル表現が得られる表現ネットワークと、前記表現ネットワークから得られた該対象ユーザの複数のベクトル表現が結合されて入力されることで、出力値として該対象ユーザが所定の推定属性を有する蓋然性を示す値が得られる予測ネットワークと、を有する、
請求項3に記載の情報処理装置。
【請求項6】
前記信用スコア推定手段は、勾配ブースティング決定木に基づく機械学習フレームワークを用いて生成及び/又は更新された前記信用スコア推定モデルを用いて、前記信用スコアを推定する、
請求項1に記載の情報処理装置。
【請求項7】
コンピュータが、
ユーザ自身から提供されたユーザ提供データ又は該ユーザの履歴データに基づいて、該ユーザについて事実であると確認可能な事実属性を決定する事実属性決定ステップと、
少なくとも前記ユーザに係る前記事実属性を含むユーザ関連データに基づいて、該ユーザについて推定された推定属性を決定する推定属性決定ステップと、
前記ユーザに係る前記事実属性及び推定属性を含む属性データ群に基づいて、前記ユーザに設定される信用スコアを推定する信用スコア推定ステップと、を実行し、
前記信用スコア推定ステップでは、前記属性データ群を信用スコア推定モデルに入力して得られた出力値に基づいて、該ユーザに設定される信用スコアを推定し、
前記信用スコア推定ステップでは、前記属性データ群を入力値とし、該属性データ群が共通するユーザに係る後払い決済の支払履歴に基づいて決定された前記信用スコアを出力値とする教師データを用いて生成及び/又は更新された前記信用スコア推定モデルを用いて、前記ユーザに設定される信用スコアを推定する、
方法。
【請求項8】
コンピュータを、
ユーザ自身から提供されたユーザ提供データ又は該ユーザの履歴データに基づいて、該ユーザについて事実であると確認可能な事実属性を決定する事実属性決定手段と、
少なくとも前記ユーザに係る前記事実属性を含むユーザ関連データに基づいて、該ユーザについて推定された推定属性を決定する推定属性決定手段と、
前記ユーザに係る前記事実属性及び推定属性を含む属性データ群に基づいて、前記ユーザに設定される信用スコアを推定する信用スコア推定手段と、として機能させ、
前記信用スコア推定手段は、前記属性データ群を信用スコア推定モデルに入力して得られた出力値に基づいて、該ユーザに設定される信用スコアを推定し、
前記信用スコア推定手段は、前記属性データ群を入力値とし、該属性データ群が共通するユーザに係る後払い決済の支払履歴に基づいて決定された前記信用スコアを出力値とする教師データを用いて生成及び/又は更新された前記信用スコア推定モデルを用いて、前記ユーザに設定される信用スコアを推定する、
プログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ユーザに関する評価を支援するための技術に関する。
【背景技術】
【0002】
従来、ユーザの行動を示す行動情報を取得するユーザ情報取得部と、行動情報に基づいて、将来のユーザの融資に対する返済能力に関する信用度を判定する信用度判定部と、を備える判定装置が提案されている(特許文献1を参照)。
【0003】
また、従来、オンラインストアにアクセスしたユーザの端末装置から電話番号を含むユーザ識別情報を取得する識別情報取得部と、ユーザの注文データを取得する注文データ取得部と、取得した電話番号を用いて認証された認証情報を端末装置から取得する認証情報取得部と、取得した注文データを用いてユーザの注文決済の可否を判定する判定部とを備える注文決済装置が提案されている(特許文献2を参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2021-174039号公報
【特許文献2】特開2020-098491号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来、ユーザの履歴データに基づいてユーザの信用度等を表すユーザスコアを算出する技術が提案されている。しかし、ユーザスコアの算出に際しては主として対象ユーザの履歴データ等から直接的に事実として把握される情報が当該ユーザの属性として扱われており、例えば、推定されるユーザペルソナ(ユーザの人物像や行動傾向)を含むユーザの属性全般を統一的に活用したユーザスコア算出を実現するという点において改善の余地があった。
【0006】
本開示は、上記した問題に鑑み、ユーザの属性全般を統一的にユーザスコアに反映するための情報処理を実現することを課題とする。
【課題を解決するための手段】
【0007】
本開示の一例は、ユーザ自身から提供されたユーザ提供データ又は該ユーザの履歴データに基づいて、該ユーザについて事実であると確認可能な事実属性を決定する事実属性決定手段と、少なくとも前記ユーザに係る前記事実属性を含むユーザ関連データに基づいて、該ユーザについて推定された推定属性を決定する推定属性決定手段と、前記ユーザに係る前記事実属性及び推定属性を含む属性データ群に基づいて、前記ユーザに設定される信用スコアを推定する信用スコア推定手段と、を備える情報処理装置である。
【0008】
本開示は、情報処理装置、システム、コンピュータによって実行される方法又はコンピュータに実行させるプログラムとして把握することが可能である。また、本開示は、そのようなプログラムをコンピュータその他の装置、機械等が読み取り可能な記録媒体に記録したものとしても把握できる。ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的又は化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。
【発明の効果】
【0009】
本開示によれば、ユーザの属性全般を統一的にユーザスコアに反映するための情報処理を実現することが可能となる。
【図面の簡単な説明】
【0010】
図1】実施形態に係る情報処理装置の構成を示す概略図である。
図2】実施形態に係る情報処理装置の機能構成の概略を示す図である。
図3】実施形態に係る推定属性の決定処理の概略を示す図である。
図4】実施形態に係るユーザスコア推定処理の簡略図である。
図5】実施形態において採用される機械学習モデルの決定木の概念を簡略図である。
図6】実施形態に係る機械学習処理の流れを示すフローチャートである。
図7】実施形態に係るユーザスコア推定処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、本開示に係る情報処理装置、方法及びプログラムの実施の形態を、図面に基づいて説明する。但し、以下に説明する実施の形態は、実施形態を例示するものであって、本開示に係る情報処理装置、方法及びプログラムを以下に説明する具体的構成に限定するものではない。実施にあたっては、実施の態様に応じた具体的構成が適宜採用され、また、種々の改良や変形が行われてよい。本発明は、後述する実施形態、バリエーションの夫々における構成の少なくとも一部を適宜、互いに採用することができる。
【0012】
本実施形態では、本開示に係る技術を、ユーザに関連する何らかの尺度(例えば、信用等)を示すユーザスコアの管理及び/又は活用のために実施した場合の実施の形態について説明する。但し、本開示に係る技術は、ユーザスコアの推定等のユーザ評価を支援するための技術について広く用いることが可能であり、本開示の適用対象は、実施形態において示した例に限定されない。
【0013】
<システムの構成>
図1は、本実施形態に係る情報処理システムの構成を示す概略図である。本実施形態に係る情報処理システムでは、情報処理装置1と、1又は複数のサービス提供システム5と、が互いに通信可能に接続されている。ユーザは、サービス提供システム5によって提供されるサービスの利用者であり、ユーザ端末からサービス提供システム5にアクセスすることでサービスの提供を受ける。
【0014】
情報処理装置1は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、EEPROM(Electrically Erasable and Programmable Read Only Memory)やHDD(Hard Disk Drive)等の記憶装置14、NIC(Network Interface Card)等の通信ユニット15、等を備えるコンピュータである。但し、情報処理装置1の具体的なハードウェア構成に関しては、実施の態様に応じて適宜省略や置換、追加が可能である。また、情報処理装置1は、単一の筐体からなる装置に限定されない。情報処理装置1は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。
【0015】
情報処理装置1は、ユーザ毎にユーザスコアを管理し、サービス提供システム5に対してユーザスコアを提供する。サービス提供システム5は、情報処理装置1から提供されたユーザスコアに応じて、対象ユーザに対するサービスをカスタマイズすることが可能である。
【0016】
サービス提供システム5は、CPU、ROM、RAM、記憶装置、通信ユニット、入力装置、出力装置等(図示は省略する)を備えるコンピュータである。また、これらのシステム及び端末は、いずれも、単一の筐体からなる装置に限定されない。これらのシステム及び端末は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。
【0017】
サービス提供システム5によって提供されるサービスは、例えば、オンラインショッピングサービス、オンライン予約サービス、クレジットカード/後払い決済サービス、電子マネー決済サービス、オペレーションセンターサービス、又は地図情報サービス等である。なお、「後払い決済」には、所謂Buy Now Pay Later(BNPL)と称されるサービスに限定されず、あらゆる後払いによる商品/サービスの購入が含まれてよいものとする。
【0018】
サービス提供システム5によって提供されるサービスは本実施形態における例示に限定されない。そして、サービス提供システム5は、サービスの提供に際してユーザ関連データを情報処理装置1に通知する。ここで、ユーザ関連データには当該ユーザによるサービスの利用履歴データが含まれる。サービスの利用履歴データの内容はサービスの内容に応じて様々であり、例えば、ユーザの位置情報の履歴データ、クレジットカード利用額/後払い決済利用額の支払履歴データ、電子マネー利用履歴データ、取引履歴データ(商品等の購入履歴データを含む)、予約履歴データ、オペレーションセンターからのユーザに対するオペレーション履歴データ等が含まれてよい。
【0019】
従来、ユーザの履歴データに基づいてユーザの信用度等を表すユーザスコアを算出する技術が提案されている。しかし、ユーザスコアの算出に際しては主として対象ユーザの履歴データ等から直接的に事実として把握される情報が当該ユーザの属性として扱われており、ユーザの属性全般を統一的に活用したユーザスコア算出を実現するという点において改善の余地があった。特に、従来手法は、事実として把握される情報のそれぞれが断片的であることに起因して、各情報から導かれるインサイトを統一的に単一の指標(ユーザスコア)に反映させる点において改善の余地があった。
【0020】
上記の事項に鑑み、本開示に係る情報処理装置では、クレジットカード利用等の信用取引関連のデータのみに基づくことなく、幅広い用途に用いることが可能なユーザスコアを得ることとしている。このため、本開示に係る情報処理装置では、ユーザ属性データ等を入力として、ユーザスコアを出力する機械学習モデルを用いる。なお、ここで入力として用いられる属性データには、後払い決済におけるデフォルト(債務不履行)を示すデータも含まれてよい。様々な属性データを入力として用いることで、本開示に係る情報処理装置によれば、ユーザの属性全般が統一的に反映されることで生成された普遍的(universal)且つ一般化された(generalized)ユーザスコアを算出し、算出されたユーザスコアを、ユーザデータを殆ど持たないか又はユーザデータの使用が限定されているようなサービス(例えば、新規のサービス)においても用いることが可能となるため、例えば、コールドスタート問題に対処できる可能性がある。なお、本実施形態は、「属性データ」を単に「属性」と読み替えることができる。
【0021】
ここで、ユーザ属性データには、事実属性データ及び推定属性データが含まれる。属性データは、例えば、スコア(例えば、0以上1以下の連続的な値)又はラベル(例えば、有無や是非に応じた二値)等のデータ形式で表されるデータが含まれる。但し、属性データのフォーマットは本開示における例示に限定されない。
【0022】
事実属性データは、ユーザ自身から提供されることで得られたユーザ提供データやユーザについて収集された履歴データ等に基づいて、当該ユーザについて事実であると確認可能な事実属性(factual attribute)を示すデータである。ユーザ提供データとしては、例えば、ユーザ自身によって登録された氏名やメールアドレス、電話番号、住所、勤務先、就学先等を含む登録データや、アンケート等にユーザ自身が回答した結果得られたデータが挙げられる。履歴データとしては、例えば、上述した、サービス提供システム5によって提供される電子商取引サービスの利用履歴データが挙げられる。事実属性データは、先述のユーザ提供データや履歴データが、マーケティング及び/又は分析目的に適したデータ形式に変換されたデータであることが好ましい。例えば、利用履歴データに基づいて得ることができる事実属性データとして、ユーザが頻繁に利用する商品/サービスのジャンル/カテゴリやブランドの他、ユーザが頻繁に訪れる商業地や行楽地、観光地等が挙げられる。
【0023】
ユーザ提供データは、登録された氏名やメールアドレス等に応じた何らかのカテゴリを事実属性として扱ってよい。事実属性は、例えば、登録されたメールアドレスがフリーメールに類されるものであるか否かを示す何らかのカテゴリであってよく、登録された電話番号と対応する地理的エリア、モバイルキャリア又は所定のモバイルキャリアであるか否かを示す何らかのカテゴリであってよく、登録された勤務先と対応する業種又は業態を示す何らかのカテゴリであってよく、登録された就学先と対応する校種、進学率又は偏差値帯を示す何らかのカテゴリであってよい。
【0024】
本実施形態は、利用履歴データに基づいて得ることができる事実属性(事実属性データ)として、上記電子商取引サービスにおいてサービス提供者が確認し得る、所定期間中の以下の状況を例示することができる。事実属性は、例として、商品又はサービスに関する取引状況、商品又はサービスに関する注文状況、商品又はサービスに関する注文取消状況、商品又はサービスに関する契約状況、商品又はサービスに関する予約状況、商品又はサービスに関する利用状況、商品又はサービスに関する出品状況、商品又はサービスに関する落札状況、商品又はサービスに関するページ又はサイトの閲覧状況、ポイントを含む電子的バリューの取得状況、ポイントを含む電子的バリューの利用状況、クーポン又はバウチャーの取得状況、クーポン又はバウチャーの利用状況、銀行口座における入出金状況、及び、クレジットカードを含む決済手段の利用状況が挙げられる。
【0025】
また、推定属性データは、ユーザ提供データや履歴データ、事実属性データ等に基づいて推定されることで得られる推定属性(inferred attribute)を示すデータである。本実施形態において、推定属性データは、機械学習技術を用いて推定又は予測されたユーザの性格等を含む。推定属性データは、ターゲティングに用いられた場合にユーザの行動(振る舞い)に影響する属性についてのデータであることが好ましい。
【0026】
本実施形態は、推定属性として、電子商取引サービスに限らない取引サービスにおいて所定期間中、ユーザが取り得る以下の行動(振る舞い)とその確率を例示することができる。推定属性が示すユーザの行動は、例として、所定の有形物又は無形物のいずれかである事物の所有、管理又は保護、所定の種別の事物の所有、管理又は保護、所定の事物又は行為に関する興味又は趣味、所定の機能を有する事物の所有、管理又は保護、所定の外観を呈する事物の所有、管理又は保護、所定額以上の価値を伴う事物の所有、管理又は保護、所定額以上の金額の決済を伴う商品又はサービスの取引、所定額以上の金額の決済を伴う外食及び飲酒等の消費行動、所定距離以上の移動を伴う外食及び飲酒等の消費行動、所定人数以上の同伴者を伴う外食及び飲酒等の消費行動、所定額以上の金額の決済を伴う旅行等の移動、所定距離以上の旅行等の移動を伴う決済、所定人数以上の同伴者を伴う旅行等の移動、所定額以上の金額の決済を伴う宿泊、所定距離以上の移動を伴う宿泊、所定人数以上の同伴者を伴う宿泊、所定額以上の金融商品の購入又は契約、所定額以上の金額の決済を伴う金融取引、所定額以上の金額に関する預貯金又は入出金、及び、所定額以上の金額に関する債務不履行が挙げられる。また、本実施形態は、推定属性として、後述のデモグラフィック属性、ビヘイビオラル属性及びサイコグラフィック属性の一部を例示してもよい。
【0027】
本実施形態において、各属性データには、重みが設定される。重みは、ユーザスコアの算出にあたって属性データが用いられる際の、属性データとユーザスコアとの相関性の高さを示すものであり、後述する機械学習部24によってユーザスコアの適切性が評価される毎に、モデルのパラメータが、ユーザスコアがより適切な値となるように調整される。各属性データと対応する重みは、例として、後述の決定木モデル等のユーザスコア算出のためのモデルの各ノード(各回帰木)と対応する重みに相当し、ユーザスコアが算出される過程で適宜、決定される。なお、ユーザスコアは、例として、各ノードの重みに基づいて決定される。
【0028】
ここで、属性データ群には、デモグラフィック属性、ビヘイビオラル属性、又はサイコグラフィック属性が含まれてよい。デモグラフィック属性は、例えば、ユーザの性別(ジェンダー)、家族構成、人種、国籍、年齢等であり、ビヘイビオラル属性は、サービスの利用履歴データに基づいてよく、例えば、キャッシング利用有無、リボ払い利用有無、所定の口座に係る入出金履歴、賭博又はくじを含む何らかの商品/サービスに係る商取引履歴(オンラインマーケットプレイス等におけるオンライン取引履歴を含んでよい)、位置情報や場所情報を用いたユーザの移動履歴等であり、サイコグラフィック属性は、例えば、賭博又はくじに係る趣向等である。但し、利用可能なユーザの属性は、本実施形態における例示に限定されない。例えば、オペレーションセンターサービス等からの「オペレーション(架電等)に要する時間」、「クレジットカード利用額/後払い決済利用額」も、属性として用いられてよい。
【0029】
デモグラフィック属性及びビヘイビオラル属性は、事実属性として扱われてよい。サイコグラフィック属性は、推定属性として扱われてよい。なお、デモグラフィック属性に類する属性がユーザ提供データ又は履歴データを根拠とする事実属性に基づいて推定された推定属性であってよい。同様に、ビヘイビオラル属性に類する属性がユーザ提供データ又は履歴データを根拠とする事実属性に基づいて推定された推定属性であってよい。サイコグラフィック属性は、ユーザによる意思入力の結果を一例として含むユーザ提供データを根拠とする事実属性であってよい。
【0030】
図2は、本実施形態に係る情報処理装置1の機能構成の概略を示す図である。情報処理装置1は、記憶装置14に記録されているプログラムが、RAM13に読み出され、CPU11によって実行されて、情報処理装置1に備えられた各ハードウェアが制御されることで、事実属性決定部21、推定属性決定部22、ユーザスコア推定部23、及び機械学習部24を備える情報処理装置として機能する。なお、本実施形態及び後述する他の実施形態では、情報処理装置1の備える各機能は、汎用プロセッサであるCPU11によって実行されるが、これらの機能の一部又は全部は、1又は複数の専用プロセッサによって実行されてもよい。
【0031】
事実属性決定部21は、ユーザ自身から提供されたユーザ提供データ及び/又は当該ユーザの履歴データに基づいて、当該ユーザについて事実であると確認可能な事実属性データを決定する。本実施形態において、事実属性決定部21は、ユーザ提供データ及び/又は履歴データを集計する、マップ等の他のデータを参照して該当する属性を決定する、ユーザ提供データ及び/又は履歴データをそのまま用いる、等の手法を用いて、当該ユーザに係る事実属性データを決定する。なお、本実施形態では、ユーザに係る事実属性データをユーザ提供データ及び/又は該ユーザの履歴データに基づいて決定する方法を採用しているが、ユーザに係る事実属性データはその他の方法で取得されてもよい。
【0032】
推定属性決定部22は、少なくとも、事実属性決定部21によって対象ユーザについて決定された1又は複数の事実属性データを含むユーザ関連データに基づいて、当該ユーザについて推定された推定属性データを決定する。本実施形態において、推定属性決定部22は、対象ユーザに係る1又は複数の事実属性データを含むユーザ関連データを機械学習モデルである属性推定モデルに入力して得られた出力値に基づいて、推定属性を決定する。なお、本実施形態において、属性推定モデルからの出力値は対象ユーザが所定の推定属性を有する蓋然性を示す値であり、推定属性決定部22は、属性推定モデルから得られた出力値が所定の範囲内にある場合に、対象ユーザが当該推定属性を有すると決定する。対象ユーザが所定の推定属性を有すると決定された場合、推定属性決定部22は、対象ユーザについて推定された属性データのラベルを、属性の有無又は属性の種類を示す値に設定する。また、推定属性データはラベルではなくスコアで示されてもよい。この場合、推定属性決定部22は、対象ユーザについて推定された属性データのスコアに、推定された属性が適用され得る度合い(確率)を示す値を設定する。当該度合いは、属性推定モデルの出力値であってよい。
【0033】
図3は、実施形態に係る推定属性の決定処理の概略を示す図である。事実属性データを含むデータを属性推定モデルへの入力値として他の属性を推定する具体的な手法は限定されないが、本実施形態では、表現ネットワーク(Representation Network)及び予測ネットワーク(Prediction Network)の2層のネットワークを用いて、属性データの推定を行う例を説明する。
【0034】
1.表現ネットワークのモデル生成及び/又は更新
本実施形態において、機械学習部24は、少なくとも事実属性データを含む訓練データを用いた教師なし機械学習でVAE(Variational Autoencoder)モデルを複数生成及び/又は更新する。なお、VAEは、VAE前半のエンコーダが出力した潜在ベクトルをVAE後半のデコーダに入力することで、エンコーダに入力された値(ここでは、事実属性データを含む訓練データ)を異なる形式で表現するものである。
【0035】
2.表現ネットワークによる学習済ベクトル表現生成
推定属性決定部22は、対象ユーザ関連データ(少なくとも対象ユーザの事実属性データを含む)を上記複数のVAEモデルに入力することでユーザ毎に複数の出力値(ベクトル表現)を得、これらを結合したものを対象ユーザの学習済ベクトル表現(pre-trained vector representation)とする。即ち、ここでは、ユーザの事実属性データ等に応じた複数種類のベクトル表現を獲得しそれらを結合することで、後述する予測ネットワークのモデルの入力値として用いられるユーザの学習済ベクトル表現を得る。このため、結合されるベクトル表現(出力値)は、VAE後半のデコーダが出力する変化された事実属性データ等であってもよいし、VAE前半のエンコーダの出力値に相当するユーザの潜在ベクトルであってもよい。また、本実施形態では、ベクトル表現を得るためにVAEを用いる例を挙げているが、ベクトル表現は、ユーザの事実属性データ等をモデルに入力したときに得られる(エンコードすることで得られる)何かしらのベクトル表現であればよい。
【0036】
3.予測ネットワークのモデル生成及び/又は更新
機械学習部24は、予測/推定したい推定属性データ毎に、ユーザ毎の学習済ベクトル表現を入力値、ユーザアンケート等で取得された正解属性を出力値とする教師データを用いて教師あり機械学習で予測ネットワークのモデルを生成及び/又は更新する。
【0037】
4.予測ネットワークによる推定属性データ推定
推定属性決定部22は、予測/推定したい推定属性データのために生成/更新された予測ネットワークのモデルに対象ユーザの学習済ベクトル表現を入力することで、対象ユーザの属性データの推定値(図中の「推定属性(1~n)」)を得る。当該推定値は、例えば、対象ユーザ(入力された事実属性データ等の組み合わせと対応するユーザ)が各推定属性(ユーザペルソナ)を有するか否かの蓋然性が予測(predict)された値である。予測された蓋然性(値)が例えば所定の閾値を超過する等したとき、そのユーザはその推定属性を有すると解釈することができ、この解釈結果に従って、対象ユーザの推定属性データが決定される。
【0038】
ユーザスコア推定部23は、対象ユーザに係る事実属性及び推定属性を含む属性データ群に基づいて、対象ユーザに設定されるユーザスコアを推定する。この際、ユーザスコア推定部23は、決定された事実属性及び/又は推定属性に対して何らかの加工(正規化やランク化、ラベル化等)を施して属性データ群の一部としてもよいし、決定された事実属性及び/又は推定属性を用いて算出された他の種類のスコア又はラベルを属性データ群の一部としてもよい。ここで、他の種類のスコア又はラベルの算出には、他の機械学習モデルが介在してもよい。
【0039】
なお、ユーザスコア推定部23は、対象ユーザに係る事実属性を少なくとも含む属性データ群に基づきユーザスコアを推定してもよく、対象ユーザに係る推定属性を少なくとも含む属性データ群に基づきユーザスコアを推定してもよい。また、ユーザスコア推定部23は、ユーザスコア推定モデルにおいて所定の閾値を超過する重みを示したノードと対応する属性を少なくとも含む属性データ群に基づきユーザスコアを推定してもよく、ユーザスコア推定モデルにおいて所定の閾値を超過する重みを示したノードと対応する事実属性を少なくとも含む属性データ群に基づきユーザスコアを推定してもよく、ユーザスコア推定モデルにおいて所定の閾値を超過する重みを示したノードと対応する推定属性を少なくとも含む属性データ群に基づきユーザスコアを推定してもよい。
【0040】
図4は、実施形態に係るユーザスコア推定処理の簡略図である。本実施形態において、ユーザスコア推定部23は、ユーザの属性データ群をユーザスコア推定モデルに入力することで、当該ユーザに設定されるユーザスコアを推定(算出)する。ここで、ユーザスコア推定モデルの出力値は、例として、0を最小値、1を最大値として正規化/規格化されたユーザスコアである。
【0041】
機械学習部24は、ユーザスコア推定部23によるユーザスコア推定に用いられるユーザスコア推定モデルを生成及び/又は更新する。ユーザスコア推定用機械学習モデルは、対象ユーザに係る1又は複数の属性データ(属性データ群)が入力された場合に、ユーザに関連する何らかの尺度(例えば、信用等)を示すユーザスコアを出力する機械学習モデルである。
【0042】
ユーザスコア推定モデルの生成及び/又は更新にあたって、機械学習部24は、ユーザ毎に、当該ユーザの属性データ群を入力値とし当該ユーザに係るユーザスコアを出力値として定義した教師データを作成する。そして、機械学習部24は、当該教師データに基づいて、ユーザスコア推定モデルを生成及び/又は更新する。上述の通り、ユーザスコア推定モデルに入力される属性データ群には、事実属性決定部21によって決定された事実属性データと、事実属性データを含むユーザ関連データに基づいて推定属性決定部22によって推定された推定属性データが含まれ、対応するユーザのユーザスコアと組み合わせられて、教師データとして機械学習部24に入力される。教師データに設定されるユーザスコアは、ルールベースで決定されたユーザスコアであってよく、マニュアルで設定された(アノテーションがなされた)ユーザスコアであってもよい。また、ユーザスコア推定モデルによって過去に出力された後で、管理者等によって修正されたユーザスコアであってもよい。
【0043】
また、教師データにおいては、出力値として、ユーザに係る過去の支払履歴に基づくデータ(例えば、後払い決済におけるデフォルトを示すデータ)が、ユーザスコアに代えて用いられてもよい。即ち、機械学習部24は、ユーザ毎に、属性データ群を入力値とし、当該属性データ群に対応する1又は複数のユーザ(即ち、同じ属性の組合せを有する1又は複数のユーザ)の過去の支払履歴(例えば、支払の有無、返済の有無、又はデフォルトの有無等)に基づくデータを出力値として定義した教師データを作成する。ここで、支払履歴に基づくデータの形式は限定されないが、例えば支払履歴に基づくラベルであってもよい。より具体的には、支払履歴に基づくラベルとして、0(未払い)又は1(支払い実績あり)のラベルを用いることが出来る。また、支払履歴に基づくラベルとして、属性データ群が共通するユーザ群における支払い有無の統計値に応じて0~1の範囲の連続値を用いることが出来る。なお、このような教師データを用いる場合、機械学習モデルから出力されるデータ(例えば、支払履歴ラベルが0又は1である場合には、ラベルの正しさを示す尤度データ。支払履歴ラベルが連続値である場合には、ラベル自体。)をそのままユーザスコアとしてもよいし、機械学習モデルから出力されるデータに正規化/規格化等の何らかの加工を施してユーザスコアとしてもよい。
【0044】
本開示に係る技術を実装するにあたりユーザスコア推定モデル等として採用可能な機械学習モデル生成/更新のフレームワークは、例として、アンサンブル学習アルゴリズムに基づく。当該フレームワークには、例えば、勾配ブースティング決定木(Gradient Boosting Decision Tree:GBDT)に基づく機械学習フレームワーク(例えば、LightGBM)が採用されてよい。換言すると、当該フレームワークは、前後の弱学習器(弱分類器)間で正解と予測値との誤差を引き継がせるような決定木モデルに基づく機械学習フレームワークが採用されてよい。ここでの予測値とは、例として、ユーザスコアの予測値を指す。なお、当該フレームワークは、LightGBMの他、XGBoostやCatBoost等のブースティング手法を採用してよい。決定木を用いるフレームワークによれば、ニューラルネットワークを用いるフレームワークと比較して少ないパラメータ調整の手間で、比較的高い性能を有する機械学習モデルを生成/更新することができる。但し、本開示に係る技術を実装するにあたり採用可能な機械学習モデル生成/更新のフレームワークは、本実施形態における例示に限定されない。例えば、学習器として勾配ブースティング決定木に代えてランダムフォレスト等の他の学習器が採用されてよいし、ニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用されてもよい。また、特にニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用される場合には、アンサンブル学習が採用されなくてもよい。
【0045】
図5は、本実施形態においてユーザスコア推定モデル等として採用される機械学習モデルの決定木の概念を簡略図である。決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークを採用する場合、決定木の各ノードの分岐条件の最適化が行われる。具体的には、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークでは、一つの親のノードから分岐した二つの子のノードの夫々が示す属性を有するユーザ群についてユーザスコアを夫々算出し、このユーザスコアの差分が大きくなるように(例えば、差分が最大になるように、又は所定の閾値以上になるように)、即ち、二つの子のノードがきれいに分岐するように、親のノードの分岐条件が最適化される。例えば、ノードの分岐条件として示される属性が年齢である場合、分岐の閾値に設定される年齢を変更したり、分岐条件を年齢以外の属性に変更したりしてもよい。このようにして、決定木の全ノードの分岐条件を再帰的に最適化することで、属性データ群に基づくユーザスコアの推定精度を向上させることができる。
【0046】
また、推定属性決定部22が属性推定モデルを用いて属性データ群の少なくとも一部を決定する場合、機械学習部24は更に、推定属性決定部22による、事実属性データに基づく推定属性データの決定に用いられる属性推定モデルを生成及び/又は更新する。上述の通り、本実施形態において属性データの推定は表現ネットワーク及び予測ネットワークの2層のネットワークを用いて行われ、属性推定モデルの生成及び/又は更新の詳細については、上記「1.表現ネットワークのモデル生成及び/又は更新」及び「3.予測ネットワークのモデル生成及び/又は更新」において説明した通りである。但し、属性推定モデルの生成及び/又は更新において採用可能な機械学習モデル生成/更新のフレームワークは限定されない。例えば、上記説明したユーザスコア推定モデルと同様、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークが採用されてもよい。
【0047】
<処理の流れ>
次に、本実施形態に係る情報処理装置によって実行される処理の流れを説明する。なお、以下に説明する処理の具体的な内容及び処理順序は、本開示を実施するための一例である。具体的な処理内容及び処理順序は、本開示の実施の形態に応じて適宜選択されてよい。
【0048】
図6は、本実施形態に係る機械学習処理の流れを示すフローチャートである。本フローチャートに示された処理は、定期的に、又は管理者によって指定されたタイミングで実行される。
【0049】
本実施形態において、機械学習処理では、ユーザスコア推定モデルが生成及び/又は更新される。機械学習部24は、過去に蓄積されたユーザ毎の属性データ群と、対応するユーザについて予め決定されたユーザスコアと、の組み合わせを含む教師データを作成する(ステップS101)。そして、機械学習部24は、作成された教師データをユーザスコア推定モデルに入力し、ユーザスコア推定部23によるユーザスコア推定に用いられるユーザスコア推定モデルを生成及び/又は更新する(ステップS102)。その後、本フローチャートに示された処理は終了する。
【0050】
図7は、本実施形態に係るユーザスコア推定処理の流れを示すフローチャートである。本フローチャートに示された処理は、定期的に、又は指定されたタイミングで、対象となるユーザ毎に実行される。
【0051】
ステップS201及びステップS202では、事実属性データ及び推定属性データが決定される。事実属性決定部21は、対象ユーザのユーザ提供データ及び/又は履歴データに基づいて、対象ユーザに係る事実属性データを決定する(ステップS201)。そして、推定属性決定部22は、少なくともステップS201で決定された事実属性データに基づいて、対象ユーザに係る推定属性データを決定する(ステップS202)。その後、処理はステップS203へ進む。
【0052】
ステップS203及びステップS204では、ユーザスコアが決定され、出力される。ユーザスコア推定部23は、ステップS201で決定された事実属性データ及びステップS202で決定された推定属性データを含む属性データ群を決定する(ステップS203)。そして、ユーザスコア推定部23は、ステップS203で決定された属性データ群をユーザスコア推定モデルに入力し、出力された値を当該ユーザに設定されるユーザスコアとして取得する(ステップS204)。但し、ユーザスコアの推定方法は、本実施形態における例示に限定されない。例えば、ユーザスコアは、属性データ群を機械学習モデルではない所定の関数や統計モデル等に入力して算出された値を含むものであってもよい。その後、本フローチャートに示された処理は終了する。
【0053】
ユーザ毎に設定されたユーザスコアは、サービス提供システム5等の他のシステムに対して提供され、サービス提供システム5等の他のシステムによって対象ユーザに対して提供されるサービスに活用される。例えば、サービス提供システム5は、信用情報機関のデータがないユーザに対しても、ユーザスコアに基づいて低リスクユーザを特定し、個人向け融資や保険サービスの案内を行うことができる。また、サービス提供システム5は、クレジットカードの申込者のうち、信用情報機関のデータがないユーザについても、ユーザスコアに基づいて審査を行うことが可能となる。
【0054】
<効果>
本実施形態によれば、ユーザの属性全般を統一的にユーザスコアに反映するための情報処理を実現することが可能となり、また、信用取引関連のデータのみに基づくことなく、幅広い用途に用いることが可能なユーザスコアを得ることが可能となる。
【符号の説明】
【0055】
1 情報処理装置

図1
図2
図3
図4
図5
図6
図7