(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023159664
(43)【公開日】2023-11-01
(54)【発明の名称】情報処理装置、情報処理方法、および情報処理プログラム
(51)【国際特許分類】
G06Q 30/0201 20230101AFI20231025BHJP
【FI】
G06Q30/02 300
【審査請求】有
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022069509
(22)【出願日】2022-04-20
(11)【特許番号】
(45)【特許公報発行日】2023-10-02
(71)【出願人】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】塚本 浩司
(72)【発明者】
【氏名】田中 康貴
(72)【発明者】
【氏名】市丸 朋史
(72)【発明者】
【氏名】兼平 慎一
(72)【発明者】
【氏名】伊佐次 隼士
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB05
(57)【要約】
【課題】利用者の履歴情報を用いて生成される学習モデルを適切に生成すること。
【解決手段】情報処理装置は、除外部と、学習部とを備える。除外部は、第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する。学習部は、除外部によって第2の条件を満たす履歴情報が除外された利用者の履歴情報を用いて、学習モデルを生成する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外部と、
前記除外部によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、学習モデルを生成する学習部と、を備える
ことを特徴とする情報処理装置。
【請求項2】
前記履歴情報は、
検索クエリの履歴情報である
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
特定の属性を有する複数の利用者で共通性の高い検索クエリを前記第1の条件を満たす利用者の履歴情報として絞り込む絞り込み部を備える
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記学習部は、
前記除外部によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、利用者の履歴情報を含む情報を入力とし属性スコアを出力する属性推定モデルを生成する推定モデル生成部を備える
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記除外部は、
前記属性毎に異なる前記第1の条件で絞り込まれた利用者の履歴情報から前記属性毎に異なる前記第2の条件を満たす履歴情報を除外し、
前記推定モデル生成部は、
前記属性毎に前記除外部によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、前記属性毎の属性スコアを出力する前記属性推定モデルを生成し、
前記学習部は、
前記属性推定モデルから出力される前記属性毎の属性スコアを含む情報を入力とし、前記利用者の特定の行動に関する予測スコアを出力とする予測モデルを生成する予測モデル生成部を備える
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記予測モデルは、
前記属性推定モデルから出力される属性スコアを入力とし、貸し倒れリスクに関するスコアを出力とする貸し倒れ予測モデルである
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記学習部は、
前記第2の条件を満たす履歴情報を除外した後の履歴情報に含まれる情報を素性とする前記属性推定モデルで得られる属性スコアと前記第2の条件を満たす履歴情報を除外する前の履歴情報に含まれる情報を素性とする前記属性推定モデルで得られる属性スコアとの差を前記属性毎に算出し、前記差が予め定められた値以上である属性スコアを用いずに前記予測モデルを生成する
ことを特徴とする請求項5または6に記載の情報処理装置。
【請求項8】
前記除外部は、
除外対象の情報をリスト化した拒否リストを用いて、前記第1の条件で絞り込まれた利用者の履歴情報から前記第2の条件を満たす履歴情報を除外する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記除外部は、
非除外対象の情報をリスト化した許可リストを用いて、前記第1の条件で絞り込まれた利用者の履歴情報から前記第2の条件を満たす履歴情報を除外する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項10】
前記拒否リストにおいて、
前記除外対象の情報はベクトル化されており、
前記除外部は、
前記除外対象の情報とベクトルが類似する情報を前記第2の条件を満たす履歴情報として除外する
ことを特徴とする請求項8に記載の情報処理装置。
【請求項11】
前記許可リストにおいて、
前記非除外対象の情報はベクトル化されており、
前記除外部は、
前記非除外対象の情報とベクトルが類似しない情報以外の情報を前記第2の条件を満たす履歴情報として除外する
ことを特徴とする請求項9に記載の情報処理装置。
【請求項12】
前記第2の条件を満たすとして前記除外部によって除外される情報は、
前記利用者に対して配慮が必要な情報である要配慮個人情報である
ことを特徴とする請求項8~11のいずれか1つに記載の情報処理装置。
【請求項13】
前記第2の条件を満たすとして前記除外部によって除外される情報は、
貸し倒れと特定の関係を有しておらず且つ前記利用者に対して配慮が必要な情報である要配慮個人情報である
ことを特徴とする請求項6に記載の情報処理装置。
【請求項14】
コンピュータが実行する情報処理方法であって、
第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外工程と、
前記除外工程によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、学習モデルを生成する学習工程と、を含む
ことを特徴とする情報処理方法。
【請求項15】
第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外手順と、
前記除外手順によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、学習モデルを生成する学習手順と、をコンピュータに実行させる
ことを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、および情報処理プログラムに関する。
【背景技術】
【0002】
従来、利用者の履歴情報を含む利用者情報を用いた機械学習によって学習モデルを生成する技術が知られている。例えば、特許文献1には、利用者の履歴情報から利用者が債務不履行を起こすか否かに関する指標値を算出する学習モデルを生成する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、利用者の履歴情報には、種々の情報が含まれており、利用者の履歴情報をそのまま用いて学習モデルを生成すると、差別的な判断などが行われる場合があり、改善の余地がある。
【0005】
本願は、上記に鑑みてなされたものであって、利用者の履歴情報を用いて生成される学習モデルを適切に生成することができる情報処理装置、情報処理方法、および情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る情報処理装置は、除外部と、学習部とを備える。除外部は、第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する。学習部は、除外部によって第2の条件を満たす履歴情報が除外された利用者の履歴情報を用いて、学習モデルを生成する。
【発明の効果】
【0007】
実施形態の一態様によれば、利用者の履歴情報を用いて生成される学習モデルを適切に生成することができるという効果を奏する。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施形態に係る情報処理装置が行う情報処理方法を説明するための図である。
【
図2】
図2は、実施形態に係る情報処理システムの構成の一例を示す図である。
【
図3】
図3は、実施形態に係る情報処理装置の構成の一例を示す図である。
【
図4】
図4は、実施形態に係る利用者情報記憶部に記憶される利用者情報テーブルの一例を示す図である。
【
図5】
図5は、実施形態に係る情報処理装置の処理部による情報処理の一例を示すフローチャートである。
【
図6】
図6は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る情報処理装置、情報処理方法、および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、および情報処理プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
〔1.情報処理の一例〕
まず、
図1を参照し、実施形態に係る情報処理装置が行う情報処理方法について説明する。
図1は、実施形態に係る情報処理装置が行う情報処理方法を説明するための図である。
【0011】
図1に示す情報処理装置1は、各利用者U
1,U
2,・・・,U
nの端末装置と連携し、オンラインで各種のサービスを各利用者U
1,U
2,・・・,U
nに提供する情報処理装置であり、1以上のサーバまたはクラウドシステムなどにより実現される。以下において、利用者U
1,U
2,・・・,U
nの各々を個別に区別に示す場合、利用者Uと記載する場合がある。
【0012】
例えば、情報処理装置1が提供するサービスは、検索サービス、決済サービス、インターネット接続、SNS(Social Networking Service)、電子商取引(EC:Electronic Commerce)、オンラインゲーム、オンラインバンキング、オンライントレーディング、宿泊・チケット予約、動画・音楽配信、ニュース、地図、ルート検索、経路案内、路線情報、運行情報、天気予報などのサービスを提供してもよい。情報処理装置1は、上記のようなサービスを提供する各種サーバと連携し、サービスを仲介してもよいし、サービスの処理を担当してもよい。
【0013】
情報処理装置1は、各利用者Uの情報である利用者情報を記憶する記憶部を有しており、各利用者Uの利用者情報に基づいて、学習モデルを生成する。利用者情報には、利用者Uによる上述したサービスの利用履歴などの情報を含む履歴情報、利用者Uの属性情報などが含まれる。
【0014】
利用者Uの属性情報は、例えば、利用者Uの年齢、性別、職業、居住地などのデモグラフィック属性の情報である。利用者Uの履歴情報は、利用者Uの検索クエリの履歴情報である検索履歴情報、利用者Uの決済サービスの利用履歴情報である決済履歴情報、および利用者Uがアクセスしたウェブページの履歴情報である閲覧履歴情報などを含むが、これらの情報以外を含んでいてもよい。
【0015】
情報処理装置1によって生成される学習モデルは、例えば、利用者Uの利用者情報などを入力とし、利用者Uの特定の行動に関する予測スコアを出力とする予測モデルであり、例えば、利用者情報から決済サービスにおける貸し倒れリスクに関するスコアである貸し倒れスコアを出力とする貸し倒れ予測モデルである。以下において、情報処理装置1によって生成される学習モデルが貸し倒れ予測モデルであるものとして説明するが、情報処理装置1によって生成される学習モデルは、検索履歴情報に基づいて生成される学習モデルであればよく、貸し倒れ予測モデルに限定されない。
【0016】
図1に示すように、情報処理装置1は、記憶部に記憶された利用者情報に含まれる履歴情報から抽出する履歴情報を第1の条件で属性毎に絞り込む絞り込み処理を行う(ステップS1)。属性は、例えば、サイコグラフィック属性であり、例えば、ゴルフ、野球、サッカー、ファッション、旅行、政治、経済、テクノロジーなどといった利用者Uの興味関心の対象となり得る対象である。なお、以下において、情報処理装置1が第1の条件で絞り込んだ履歴情報を第1履歴情報と記載する場合がある。
【0017】
第1の条件は、例えば、特定の属性を有する複数の利用者Uで共通性の高い検索クエリの履歴情報であるといった条件である。例えば、情報処理装置1は、属性がゴルフである場合、ゴルフ場で決済したり、ゴルフ用品を購入したりした利用者Uを、ゴルフに興味関心を有する利用者U、すなわち属性「ゴルフ」を有する利用者Uとして特定する。そして、情報処理装置1は、属性「ゴルフ」を有する複数の利用者Uで共通性の高い検索クエリの履歴情報を抽出する。
【0018】
属性「ゴルフ」を有する複数の利用者Uで共通性の高い検索クエリは、例えば、検索ワードとして「ゴルフ場予約」、「ゴルフボール」、「ゴルフウェア」、「アイアン」、または「ドライバー」などを含む検索クエリである。情報処理装置1は、複数の利用者Uでの共通性が高い順に予め設定された数の検索ワードを抽出し、抽出した複数の検索ワードを第1履歴情報とする。
【0019】
情報処理装置1は、例えば、同一の検索ワードを検索した利用者Uの数、および同一の検索ワードを含む検索クエリの数などに基づいて、複数の利用者Uでの共通性を検索ワード毎に判定する。
【0020】
例えば、情報処理装置1は、同一の検索ワードを検索した利用者Uの数、および同一の検索ワードを含む検索クエリの数などを重み付けして加算して得られる値を、複数の利用者Uでの共通性を示す値として算出する。情報処理装置1は、共通性を示す値が高い順に予め設定された数の検索ワードを抽出し、抽出した複数の検索ワードを第1履歴情報とする。
【0021】
次に、情報処理装置1は、第1履歴情報から第2の条件を満たす履歴情報を除外する処理を属性毎に行う除外処理を行う(ステップS2)。第2の条件は、例えば、除外対象の情報をリスト化した拒否リストに含まれるといった条件、または非除外対象の情報をリスト化した許可リストに含まれないといった条件である。なお、以下において、情報処理装置1が第2の条件を満たす履歴情報を除外した履歴情報を第2履歴情報と記載する場合がある。
【0022】
第2の条件を満たす履歴情報は、例えば、利用者Uに対して配慮が必要な情報である要配慮個人情報である。拒否リストには、除外対象の情報として、例えば、要配慮個人情報が含まれる。また、許可リストには、非除外対象の情報として、例えば、要配慮個人情報に該当しない情報が含まれる。要配慮個人情報は、例えば、個人情報保護法に定義される情報、またはセンシティブな情報である。
【0023】
拒否リストや許可リストにおいて、除外対象の情報や非除外対象の情報は、ベクトル化されていてもよい。この場合、第2の条件は、例えば、拒否リストに含まれる除外対象の情報とベクトルが類似するといった条件、または許可リストに含まれる非除外対象の情報とベクトルが類似しないといった条件である。
【0024】
次に、情報処理装置1は、ステップS2で第2の条件を満たす履歴情報を除外した履歴情報である第2履歴情報および決済サービスを過去に利用した複数の利用者Uの利用者情報などを用いて、貸し倒れ予測モデルを生成する学習モデル生成処理を行う(ステップS3)。
【0025】
ステップS3の処理において、情報処理装置1は、属性推定モデル生成処理(ステップS3-1)と予測モデル生成処理(S3-2)を行う。情報処理装置1は、ステップS3-1の属性推定モデル生成処理において、第2履歴情報に含まれる複数の検索ワードを素性に含み且つ属性毎の属性スコアを出力する属性推定モデルを生成する。属性スコアは、属性推定モデルでの推定対象となる属性を利用者Uが有する可能性が高いほど高くなるが、かかる例に限定されない。
【0026】
属性毎の属性推定モデルは、例えば、属性「ゴルフ」の属性推定モデル、属性「野球」の属性推定モデル、属性「サッカー」の属性推定モデル、属性「ファッション」の属性推定モデル、属性「旅行」の属性推定モデルなどである。属性推定モデルの素性には、例えば、属性情報なども含まれるが、かかる例に限定されない。
【0027】
情報処理装置1は、ステップS3-2の予測モデル生成処理において、決済サービスを過去に利用した利用者Uの利用者情報と属性推定モデルで得られる属性毎の属性スコアとを含む情報を学習用情報として、属性推定モデルで属性スコアが得られる各属性を素性に含む貸し倒れ予測モデルを生成する。
【0028】
過去に利用した利用者Uの利用者情報は、例えば、利用者Uの属性情報、利用者Uの閲覧履歴情報、および利用者Uの決済サービスの履歴情報などを含む。決済サービスの履歴情報は、貸し倒れの有無を示す情報を含む。貸し倒れの有無を示す情報は、ステップS3-2の予測モデル生成処理において、ラベルデータ(正解データ)として用いられる。
【0029】
情報処理装置1は、第2の条件を満たす履歴情報を除外した後の履歴情報である第2履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアと第2の条件を満たす履歴情報を除外する前の履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアと差であるスコア差を属性毎に算出する。
【0030】
そして、情報処理装置1は、上述したスコア差が予め定められた値以上である属性の属性スコアを用いずに貸し倒れ予測モデルを生成することもできる。これにより、要配慮個人情報などを除外することによって、属性スコアの精度が悪くなる属性推定モデルが出力する属性スコアが考慮されないことから、貸し倒れスコアの精度が悪化することを抑制することができる。
【0031】
このように、実施形態に係る情報処理装置1では、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報を除外し、第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、属性推定モデルや貸し倒れ予測モデルなどの学習モデルを生成する。これにより、情報処理装置1は、利用者Uの履歴情報を用いて生成される学習モデルを適切に生成することができる。
【0032】
以下、このような処理を行う情報処理装置1を含む情報処理システムの構成などについて、詳細に説明する。
【0033】
〔2.情報処理システムの構成〕
図2は、実施形態に係る情報処理システムの構成の一例を示す図である。
図2に示すように、実施形態に係る情報処理システム100は、情報処理装置1と、端末装置2
1,2
2,・・・,2
nとを含む。
【0034】
端末装置21は、利用者U1によって用いられ、端末装置22は、利用者U2によって用いられ、端末装置2nは、利用者Unによって用いられる。以下において、端末装置21,22,・・・,2nの各々を個別に区別せずに示す場合、端末装置2と記載する場合がある。
【0035】
情報処理装置1および端末装置2は、ネットワークNを介して、有線または無線により互いに通信可能に接続される。なお、
図2に示す情報処理システム100には、情報処理装置1が複数含まれてもよい。
【0036】
端末装置2は、例えば、デスクトップ型PC(Personal Computer)、ノート型PC、タブレット端末、携帯電話機、またはPDA(Personal Digital Assistant)などである。なお、端末装置2は、上記例に限定されなくともよく、例えば、スマートウォッチまたはウェアラブルデバイス(Wearable Device)などであってもよい。
【0037】
〔3.情報処理装置1の構成〕
図3は、実施形態に係る情報処理装置1の構成の一例を示す図である。
図3に示すように、情報処理装置1は、通信部10と、記憶部11と、処理部12とを有する。
【0038】
〔3.1.通信部10〕
通信部10は、例えば、NIC(Network Interface Card)などによって実現される。そして、通信部10は、ネットワークNと有線または無線で接続され、他の各種装置との間で情報の送受信を行う。例えば、通信部10は、端末装置2との間でネットワークNを介して情報の送受信を行う。
【0039】
〔3.2.記憶部11〕
記憶部11は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置によって実現される。記憶部11は、利用者情報記憶部20を有する。
【0040】
〔3.2.1.利用者情報記憶部20〕
利用者情報記憶部20は、利用者Uに関する各種利用者情報を記憶する。
図4は、実施形態に係る利用者情報記憶部20に記憶される利用者情報テーブルの一例を示す図である。
図4に示す例では、利用者情報記憶部20に記憶される利用者情報テーブルは、「利用者ID」、「利用者名」、「属性情報」、および「履歴情報」といった項目の情報を含む。
【0041】
「利用者ID」は、利用者Uを識別する識別子である。「利用者名」は、利用者Uの名称を示す情報である。「属性情報」は、「利用者ID」に対応付けられた利用者Uの属性に関する属性情報である。例えば、属性情報は、利用者Uの性別、年齢、職業、居住地などのデモグラフィック属性の情報である。なお、上述した属性情報は、一例に過ぎず、例えば、興味・関心、ライフスタイルなどのサイコグラフィック属性の情報などの様々な情報が含まれてもよい。
【0042】
「履歴情報」は、サービスの利用履歴などの情報を含む履歴情報であり、例えば、利用者Uの決済履歴情報、利用者Uの検索履歴情報、および利用者Uの閲覧履歴情報などを含む。
【0043】
利用者Uの決済履歴情報は、例えば、決済サービスを用いた利用者Uの決済履歴の情報である。決済サービスは、後払い決済サービスであり、例えば、クレジットカードを用いた決済サービス、後払い電子マネーを用いた決済サービス、請求書後払いサービス、後払いアプリを用いた決済サービス、キャリア決済サービスなどであるが、かかる例に限定されない。
【0044】
利用者Uの決済履歴情報には、利用者Uへの貸し出し日時、貸し出し額、および貸し倒れの有無などを示す情報が含まれる。貸し出し額の情報は、利用者Uに貸し出された金額を示す情報である。決済サービスにおいて、決済期限を徒過しても返済されない場合に貸し倒れがあると判定されて、貸し倒れありとする情報が利用者Uの決済履歴情報に設定され、決済期限までに返済された場合に貸し倒れがないと判定されて、貸し倒れなしとする情報が利用者Uの決済履歴情報に設定される。
【0045】
利用者Uの決済履歴情報には、利用者Uが決済サービスを用いてオンライン、実店舗、または実施設などにおいて購入した商品に関する購入履歴情報、および利用者Uが決済サービスを用いてオンライン、実店舗、または実施設などにおいて有料で利用したサービスに関するサービス利用履歴情報などが含まれる。
【0046】
購入履歴情報には、利用者Uが購入した商品の情報、購入費用の情報、購入日時、購入店舗の情報などが含まれる。サービス利用履歴情報には、利用者Uが利用したサービスの情報、利用費用の情報、利用日時、利用店舗の情報などが含まれる。
【0047】
利用者Uの検索履歴情報は、例えば、検索サイトでのウェブコンテンツの検索履歴の情報、各種のウェブサイトでの検索履歴の情報などである。利用者Uの検索履歴情報は、例えば、検索サイトやポータルサイトでのウェブコンテンツの検索履歴の情報などである。
【0048】
利用者Uの閲覧履歴情報は、利用者Uのウェブコンテンツの閲覧履歴の情報であり、例えば、利用者Uの物件情報の閲覧履歴、コンビニエンスストアやスーパーマーケットなどの店舗のチラシの閲覧情報などの種々の情報を含む。
【0049】
なお、利用者情報には、利用者Uの移動履歴情報も含まれていてもよい。利用者Uの移動履歴情報は、利用者Uの移動履歴の情報であり、例えば、単位時間毎の利用者Uの位置の情報を含む。なお、利用者Uの移動履歴情報は、訪問した店舗や施設などの情報であってもよい。
【0050】
〔3.3.処理部12〕
処理部12は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)またはMPU(Micro Processing Unit)などのプロセッサによって、情報処理装置1内部の記憶装置(例えば、記憶部11)に記憶されている各種プログラム(情報処理プログラムの一例)がRAMを作業領域として実行されることにより実現される。また、処理部12は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により一部または全部が実現されてもよい。
【0051】
図3に示すように、処理部12は、取得部30と、表示処理部31と、絞り込み部32と、除外部33と、学習部34とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、処理部12の内部構成は、
図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
【0052】
〔3.3.1.取得部30〕
取得部30は、各種情報を取得する。取得部30は、記憶部11から各種の情報を取得する。取得部30は、利用者情報記憶部20から各種の情報を取得する。
【0053】
また、取得部30は、例えば、外部装置3から利用者Uの情報である利用者情報を取得し、取得した利用者情報を利用者情報記憶部20に記憶することもできる。
【0054】
〔3.3.2.表示処理部31〕
表示処理部31は、各種情報を表示部14に表示する。例えば、表示処理部31は、入力部13への操作者による入力操作に応じた情報を表示部14に表示させることができる。
【0055】
また、表示処理部31は、絞り込み部32によって処理された情報、除外部33によって処理された情報、および学習部34によって処理された情報を表示部14に表示させることができる。なお、
図1に示す例では、表示部14は、情報処理装置1と別体で設けられるが、情報処理装置1に含まれる構成であってもよい。
【0056】
〔3.3.3.絞り込み部32〕
絞り込み部32は、利用者情報記憶部20に記憶された利用者情報に含まれる履歴情報から抽出する履歴情報を第1の条件で属性毎に絞り込む絞り込み処理を行う。絞り込み対象となる属性は、例えば、サイコグラフィック属性であり、例えば、ゴルフ、野球、サッカー、ファッション、旅行、政治、経済、テクノロジーなどといった利用者Uの興味関心の対象となり得る対象である。
【0057】
第1の条件は、例えば、絞り込み対象となる属性を有する複数の利用者Uで共通性の高い履歴情報であるといった条件である。ここで、共通性の高い履歴情報とは、例えば、共通性の高い検索クエリの履歴情報である。
【0058】
絞り込み部32は、例えば、履歴情報に含まれる検索履歴情報に基づいて、絞り込み対象となる属性を有する複数の利用者Uを属性毎に判定する。例えば、絞り込み部32は、絞り込み対象となる属性がゴルフである場合、ゴルフ場で決済したり、ゴルフ用品を購入したりした利用者Uを、ゴルフに興味関心を有する利用者U、すなわち属性「ゴルフ」を有する利用者Uとして特定する。
【0059】
また、絞り込み部32は、例えば、履歴情報に含まれる決済履歴情報に代えてまたは加えて、履歴情報に含まれる閲覧履歴情報に基づいて、絞り込み対象となる属性を有する複数の利用者Uを属性毎に判定することもできる。例えば、絞り込み部32は、絞り込み対象となる属性がゴルフである場合、ゴルフに関するウェブコンテンツを頻繁に閲覧する利用者Uを、属性「ゴルフ」を有する利用者Uとして特定することができる。
【0060】
そして、絞り込み部32は、属性「ゴルフ」を有する複数の利用者Uで共通性の高い検索クエリの履歴情報を抽出する。属性「ゴルフ」を有する複数の利用者Uで共通性の高い検索クエリは、例えば、検索ワードとして「ゴルフ場予約」、「ゴルフボール」、「ゴルフウェア」、「アイアン」、または「ドライバー」などを含む検索クエリである。絞り込み部32は、複数の利用者Uでの共通性が高い順に予め設定された数の検索ワードを抽出し、抽出した複数の検索ワードを第1履歴情報とする。
【0061】
絞り込み部32は、例えば、同一の検索ワードを検索した利用者Uの数である第1の数、および同一の検索ワードを含む検索クエリの数である第2の数などに基づいて、複数の利用者Uでの共通性を検索ワード毎に判定する。第1の数は、絞り込み対象となる属性を有する複数の利用者Uのうち同一の検索ワードを検索した利用者Uの数である。また、第2の数は、絞り込み対象となる属性を有する複数の利用者Uの検索クエリのうち同一の検索ワードを含む検索クエリの数である。
【0062】
例えば、絞り込み部32は、第1の数および第2の数などを重み付けして加算して得られる値を、複数の利用者Uでの共通性を示す値として算出する。絞り込み部32は、共通性を示す値が高い順に予め設定された数の検索ワードを抽出し、抽出した複数の検索ワードを第1履歴情報とする。
【0063】
なお、絞り込み部32は、例えば、履歴情報に含まれる検索履歴情報に代えてまたは加えて、履歴情報に含まれる閲覧履歴情報などを絞り込み対象とすることもでき、その他の履歴情報を絞り込み対象とすることもできる。絞り込み対象が閲覧履歴情報の場合、絞り込み部32は、例えば、ウェブコンテンツまたはウェブコンテンツに含まれるワードを絞り込み対象とすることができる。
【0064】
〔3.3.4.除外部33〕
除外部33は、絞り込み部32によって第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外して第2履歴情報を得る。
【0065】
第2の条件は、例えば、除外対象の情報をリスト化した拒否リストに含まれるといった条件、または非除外対象の情報をリスト化した許可リストに含まれないといった条件である。第2の条件は、属性毎に設定される。すなわち、拒否リストや許可リストは属性毎に設定される。
【0066】
第2の条件を満たす履歴情報は、例えば、利用者Uに対して配慮が必要な情報である要配慮個人情報である。拒否リストには、除外対象の情報として、例えば、要配慮個人情報が含まれる。また、許可リストには、非除外対象の情報として、例えば、要配慮個人情報に該当しない情報が含まれる。
【0067】
要配慮個人情報は、例えば、個人情報保護法に定義される情報を含む履歴情報、またはセンシティブな履歴情報である。個人情報保護法に定義される要配慮個人情報は、本人の人種、信条、社会的身分、病歴、犯罪の経歴、犯罪により害を被った事実その他本人に対する不当な差別、偏見その他の不利益が生じないようにその取扱いに特に配慮を要する記述などが含まれる個人情報である。例えば、要配慮個人情報は、特定の病衣着に関する検索履歴である。また、センシティブな情報は、例えば、貧困などの経済状況に関する検索などである。
【0068】
なお、除外部33は、センシティブな情報であっても、例えば、年収などといった経済状況に関する情報であり与信審査に必要とされる記述が含まれる情報は、貸し倒れと特定の関係を有する情報として、第2の条件を満たす履歴情報に含めないことができる。これにより、貸し倒れ予測モデルから出力される貸し倒れスコアの精度が悪化することを抑制することができる。
【0069】
拒否リストや許可リストにおいて、除外対象の情報や非除外対象の情報は、ベクトル化されていてもよい。この場合、第2の条件は、例えば、拒否リストに含まれる除外対象の情報とベクトルが類似するといった条件、または許可リストに含まれる非除外対象の情報とベクトルが類似しないといった条件である。この場合、除外部33は、第1履歴情報に含まれる各検索ワードをベクトル化し、ベクトル化した検索ワードと拒否リストや許可リストと比較する。
【0070】
除外対象の情報や非除外対象の情報は、例えば、Word2Vecなどの自然言語処理方法によってベクトル化される。例えば、除外対象の情報や非除外対象の情報は、興味関心モデルを用いてベクトル化される。興味関心モデルは、予め定められた条件を満たす2以上の検索ワードを類似する特徴を有するものとして複数の検索ワードの各々が有する特徴を学習することによって学習済みモデルである。
【0071】
予め定められた条件を満たす2以上の検索ワードは、同一検索クエリに含まれる複数の検索ワード、または同一の利用者Uによって予め定められた時間内に端末装置2から送信される複数の検索クエリに含まれる検索ワードである。学習済みモデルは、例えば、再帰的ニューラルネットワークとも呼ばれるRNN(Recurrent Neural Network)の一種であるLSTM(Long Short-Term Memory)をベクトル生成(例えば、分散表現生成)に用いたDSSM(Deep Structured Semantic Model)の技術を用いて生成されるが、かかる例に限定されない。
【0072】
なお、除外部33は、例えば、履歴情報に含まれる検索履歴情報に代えてまたは加えて、履歴情報に含まれる閲覧履歴情報などを除外処理の対象とすることもでき、その他の履歴情報を除外処理の対象とすることもできる。絞り込み対象が閲覧履歴情報の場合、除外部33は、例えば、ウェブコンテンツまたはウェブコンテンツに含まれるワードを除外処理の対象とすることができる。
【0073】
〔3.3.5.学習部34〕
学習部34は、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報が除外された履歴情報および決済サービスを過去に利用した複数の利用者Uの利用者情報などの情報を用いて、属性毎の属性スコアを出力する属性推定モデルおよび貸し倒れ予測モデルを生成する。
【0074】
学習部34は、推定モデル生成部40と、予測モデル生成部41とを備える。以下において、推定モデル生成部40および予測モデル生成部41の各々について説明する。
【0075】
〔3.3.5.1.推定モデル生成部40〕
推定モデル生成部40は、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報が除外された履歴情報である第2履歴情報を用いて、属性毎の属性スコアを出力する属性推定モデルを生成する。
【0076】
属性毎の属性スコアを出力する属性推定モデルは、属性毎の属性推定モデルを含む構成であるが、複数の属性の属性スコアを出力する単一の属性推定モデルであってもよく、その他の構成であってもよい。属性毎の属性推定モデルは、属性毎に互いに異なる第2履歴情報を用いて生成される。
【0077】
属性毎の属性推定モデルは、例えば、属性「ゴルフ」の属性推定モデル、属性「野球」の属性推定モデル、属性「サッカー」の属性推定モデル、属性「ファッション」の属性推定モデル、属性「旅行」の属性推定モデルなどである。
【0078】
推定モデル生成部40は、属性推定モデルの対象となる属性の第2履歴情報に含まれる複数の検索ワードを含む複数の情報を各々素性として含む属性推定モデルを属性毎に生成する。属性スコアは、属性推定モデルでの推定対象となる属性を利用者Uが有する可能性が高いほど高くなるが、かかる例に限定されない。属性毎の属性推定モデルは、属性毎に抽出された互いに異なる第2履歴情報に含まれる検索ワードを素性とするモデルである。
【0079】
推定モデル生成部40は、推定対象となる属性を有する複数の利用者Uの利用者情報を含む学習用情報に基づいて、例えば、推定対象となる属性を有する利用者Uの検索履歴に検索履歴が類似する利用者Uの属性スコアが高くなるように、属性推定モデルを機械学習によって生成する処理を属性毎に行う。
【0080】
例えば、推定モデル生成部40は、属性「ゴルフ」を有する複数の利用者Uの利用者情報を含む学習用情報に基づいて、属性「ゴルフ」を有する利用者Uの検索履歴に検索履歴が類似する利用者Uの属性スコアが高くなるように、属性「ゴルフ」の属性推定モデルを生成する。
【0081】
学習用情報に含まれる利用者情報は、例えば、利用者Uの検索クエリの履歴情報、利用者Uの属性情報、および利用者Uの閲覧履歴情報などを含み、属性推定モデルの素性には、第2履歴情報に加えて、利用者Uの属性情報および閲覧履歴情報などが含まれるが、かかる例に限定されない。例えば、学習用情報に含まれる利用者情報は、利用者Uの属性情報および利用者Uの閲覧履歴情報の一方または両方を含まない情報であってもよく、その他の情報が含まれていてもよい。
【0082】
〔3.3.5.2.予測モデル生成部41〕
予測モデル生成部41は、属性推定モデルから出力される属性毎の属性スコアを含む情報を入力とし、利用者Uの特定の行動に関する予測スコアを出力とする予測モデルを生成する。
【0083】
予測モデルは、例えば、属性推定モデルから出力される属性毎の属性スコアを含む情報を入力とし、貸し倒れリスクに関するスコアを出力とする貸し倒れ予測モデルであるが、かかる例に限定されない。例えば、予測モデルは、広告をクリックする可能性を示すスコアを出力するモデルや商品を購入する可能性を示すスコアを出力するモデルであってもよい。
【0084】
予測モデル生成部41は、例えば、決済サービスを過去に利用した複数の利用者Uの利用者情報と属性推定モデルから出力される属性毎の属性スコアとを含む学習用情報を用いて、貸し倒れ予測モデルを生成する。貸し倒れ予測モデルの素性は、例えば、利用者Uの属性情報、利用者Uの閲覧履歴情報、および属性推定モデルで属性スコアが得られる各属性を含む。
【0085】
過去に利用した利用者Uの利用者情報であって学習用情報に含まれる利用者情報は、例えば、利用者Uの属性情報、利用者Uの閲覧履歴情報、および利用者Uの決済サービスの履歴情報などを含む。決済サービスの履歴情報は、貸し倒れの有無を示す情報を含む。貸し倒れの有無を示す情報は、ラベルデータ(正解データ)として用いられる。なお、貸し倒れ予測モデルの素性には、属性推定モデルで属性スコアが得られる属性が含まれていればよく上述した例に限定されない。
【0086】
予測モデル生成部41は、決済サービスを過去に利用した複数の利用者Uの利用者情報を属性毎の属性推定モデルに入力し、属性毎の属性推定モデルから出力される属性毎の属性スコアを取得する。
【0087】
そして、予測モデル生成部41は、決済サービスを過去に利用した各利用者Uの属性毎の属性スコアを含む情報と、決済サービスを過去に利用した各利用者Uの貸し倒れの有無を示す情報とに基づいて、利用者Uの属性毎の属性スコアを含む情報を入力とし貸し倒れスコアを出力とする貸し倒れ予測モデルを生成する。
【0088】
予測モデル生成部41は、第2の条件を満たす履歴情報を除外した後の履歴情報である第2履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアと第2の条件を満たす履歴情報を除外する前の履歴情報含まれる情報を素性とする属性推定モデルで得られる属性スコアと差であるスコア差を属性毎に算出する。
【0089】
そして、予測モデル生成部41は、上述したスコア差が予め定められた値以上である属性の属性スコアを用いずに貸し倒れ予測モデルを生成することもできる。これにより、要配慮個人情報などを除外することによって、属性スコアの精度が悪くなる属性推定モデルが出力する属性スコアが考慮されないことから、貸し倒れスコアの精度が悪化することを抑制することができる。
【0090】
〔4.処理手順〕
次に、実施形態に係る情報処理装置1の処理部12による情報処理の手順について説明する。
図5は、実施形態に係る情報処理装置1の処理部12による情報処理の一例を示すフローチャートである。
【0091】
図5に示すように、情報処理装置1の処理部12は、対象となる複数の属性のうち1つの属性を選択する(ステップS10)。次に、処理部12は、ステップS10で選択した属性について、履歴情報から抽出する履歴情報を第1の条件で絞り込む絞り込み処理を行う(ステップS11)。第1の条件は、ステップS10で選択した属性を有する複数の利用者Uで共通性の高い検索クエリの履歴情報が含まれるといった条件である。
【0092】
次に、処理部12は、ステップS11において第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外処理を行う(ステップS12)。第2の条件は、例えば、除外対象の情報をリスト化した拒否リストに含まれるといった条件、または除外対象の情報をリスト化した許可リストに含まれないといった条件である。
【0093】
次に、処理部12は、未選択の属性があるか否かを判定する(ステップS13)。処理部12は、未選択の属性があると判定した場合(ステップS13:Yes)、処理をステップS10に移行する。
【0094】
処理部12は、未選択の属性がないと判定した場合(ステップS13:No)、属性毎に第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、属性毎の属性スコアを出力する属性推定モデルを生成する(ステップS14)。
【0095】
そして、処理部12は、属性推定モデルから出力される属性毎の属性スコアを含む情報を入力とし、利用者Uの特定の行動に関する予測スコアを出力とする予測モデルを生成する(ステップS15)。処理部12は、ステップS14の処理が終了した場合、
図5に示す処理を終了する。
【0096】
〔5.変形例〕
処理部12は、第2履歴情報に含まれる複数の検索ワードをベクトル化して、属性毎に属性スコアを出力する属性推定モデルを生成することもできる。この場合、利用者Uの検索履歴に含まれる複数の検索ワードはベクトル化されて属性推定モデルに入力される。
【0097】
上述した例では、処理部12は、属性毎の属性スコアを出力する属性推定モデルを生成し、かかる属性推定モデルによって出力される属性毎の属性スコアを用いて予測モデルを生成するが、属性推定モデルを生成せずに、第2履歴情報を素性とする予測モデルを生成することもできる。
【0098】
〔6.ハードウェア構成〕
上述してきた実施形態に係る情報処理装置1は、例えば
図6に示すような構成のコンピュータ80によって実現される。
図6は、実施形態に係る情報処理装置1の機能を実現するコンピュータ80の一例を示すハードウェア構成図である。コンピュータ80は、CPU81、RAM82、ROM(Read Only Memory)83、HDD(Hard Disk Drive)84、通信インターフェイス(I/F)85、入出力インターフェイス(I/F)86、およびメディアインターフェイス(I/F)87を有する。
【0099】
CPU81は、ROM83またはHDD84に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM83は、コンピュータ80の起動時にCPU81によって実行されるブートプログラムや、コンピュータ80のハードウェアに依存するプログラムなどを記憶する。
【0100】
HDD84は、CPU81によって実行されるプログラム、および、かかるプログラムによって使用されるデータなどを記憶する。通信インターフェイス85は、ネットワークN(
図2参照)を介して他の機器からデータを受信してCPU81へ送り、CPU81が生成したデータを、ネットワークNを介して他の機器へ送信する。
【0101】
CPU81は、入出力インターフェイス86を介して、ディスプレイやプリンタなどの出力装置、および、キーボードまたはマウスなどの入力装置を制御する。CPU81は、入出力インターフェイス86を介して、入力装置からデータを取得する。また、CPU81は、入出力インターフェイス86を介して生成したデータを出力装置へ出力する。
【0102】
メディアインターフェイス87は、記録媒体88に記憶されたプログラムまたはデータを読み取り、RAM82を介してCPU81に提供する。CPU81は、かかるプログラムを、メディアインターフェイス87を介して記録媒体88からRAM82上にロードし、ロードしたプログラムを実行する。記録媒体88は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)などの光学記録媒体、MO(Magneto-Optical disk)などの光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリなどである。
【0103】
例えば、コンピュータ80が実施形態に係る情報処理装置1として機能する場合、コンピュータ80のCPU81は、RAM82上にロードされたプログラムを実行することにより、処理部12の機能を実現する。また、HDD84には、記憶部11内のデータが記憶される。コンピュータ80のCPU81は、これらのプログラムを記録媒体88から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
【0104】
〔7.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0105】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0106】
例えば、上述した情報処理装置1は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットホームなどをAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
【0107】
また、上述してきた実施形態および変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0108】
〔8.効果〕
上述してきたように、実施形態に係る情報処理装置1は、除外部33と、学習部34とを備える。除外部33は、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報を除外する。学習部34は、除外部33によって第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、学習モデルを生成する。これにより、情報処理装置1は、利用者Uの履歴情報を用いて生成される学習モデルを適切に生成することができる。
【0109】
また、履歴情報は、検索クエリの履歴情報である。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される学習モデルを適切に生成することができる。
【0110】
また、情報処理装置1は、特定の属性を有する複数の利用者Uで共通性の高い検索クエリを第1の条件を満たす利用者Uの履歴情報として絞り込む絞り込み部32を備える。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される学習モデルを適切に生成することができる。
【0111】
また、学習部34は、除外部33によって第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、利用者Uの履歴情報を含む情報を入力とし属性スコアを出力する属性推定モデルを生成する推定モデル生成部40を備える。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される学習モデルをさらに適切に生成することができる。
【0112】
また、除外部33は、属性毎に異なる第1の条件で絞り込まれた利用者Uの履歴情報から属性毎に異なる第2の条件を満たす履歴情報を除外する。推定モデル生成部40は、属性毎に除外部33によって第2の条件を満たす履歴情報が除外された利用者Uの履歴情報を用いて、属性毎の属性スコアを出力する属性推定モデルを生成する。学習部34は、属性推定モデルから出力される属性毎の属性スコアを含む情報を入力とし、利用者Uの特定の行動に関する予測スコアを出力とする予測モデルを生成する予測モデル生成部41を備える。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される予測モデルをさらに適切に生成することができる。
【0113】
また、予測モデルは、属性推定モデルから出力される属性スコアを入力とし、貸し倒れリスクに関するスコアを出力とする貸し倒れ予測モデルである。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される貸し倒れ予測モデルを適切に生成することができる。
【0114】
また、学習部34は、第2の条件を満たす履歴情報を除外した後の履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアと第2の条件を満たす履歴情報を除外する前の履歴情報に含まれる情報を素性とする属性推定モデルで得られる属性スコアとの差を属性毎に算出し、差が予め定められた値以上である属性スコアを用いずに予測モデルを生成する。これにより、情報処理装置1は、利用者Uの検索クエリの履歴情報を用いて生成される学習モデルを適切に生成することができる。
【0115】
また、除外部33は、除外対象の情報をリスト化した拒否リストを用いて、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報を除外する。これにより、情報処理装置1は、第2の条件を満たす履歴情報を容易に除外することができる。
【0116】
また、除外部33は、非除外対象の情報をリスト化した許可リストを用いて、第1の条件で絞り込まれた利用者Uの履歴情報から第2の条件を満たす履歴情報を除外する。これにより、情報処理装置1は、第2の条件を満たす履歴情報を容易に除外することができる。
【0117】
また、拒否リストにおいて、除外対象の情報はベクトル化されており、除外部33は、除外対象の情報とベクトルが類似する情報を第2の条件を満たす履歴情報として除外する。これにより、情報処理装置1は、第2の条件を満たす履歴情報を容易に除外することができる。
【0118】
また、許可リストにおいて、非除外対象の情報はベクトル化されており、除外部33は、非除外対象の情報とベクトルが類似しない情報以外の情報を第2の条件を満たす履歴情報として除外する。これにより、情報処理装置1は、第2の条件を満たす履歴情報を容易に除外することができる。
【0119】
また、第2の条件を満たすとして除外部によって除外される情報は、利用者Uに対して配慮が必要な情報である要配慮個人情報である。これにより、情報処理装置1は、差別的な判断を抑制した学習モデルを適切に生成することができる。
【0120】
また、第2の条件を満たすとして除外部によって除外される情報は、貸し倒れと特定の関係を有しておらず且つ利用者Uに対して配慮が必要な情報である要配慮個人情報である。これにより、情報処理装置1は、差別的な判断を抑制した学習モデルを適切に生成することができる。
【0121】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0122】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0123】
1 情報処理装置
2,21,22,・・・,2n 端末装置
3 外部装置
10 通信部
11 記憶部
12 処理部
13 入力部
14 表示部
20 利用者情報記憶部
30 取得部
31 表示処理部
32 絞り込み部
33 除外部
34 学習部
40 推定モデル生成部
41 予測モデル生成部
100 情報処理システム
N ネットワーク
【手続補正書】
【提出日】2023-09-06
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
特定の属性を有する複数の利用者で共通性の高い検索クエリの履歴情報を第1の条件を満たす利用者の履歴情報として絞り込む絞り込み部と、
除外対象の情報をリスト化した拒否リストまたは非除外対象の情報をリスト化した許可リストを用いて、前記絞り込み部によって前記第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外部と、
前記除外部によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を含む情報を入力とし属性スコアを出力する属性推定モデルを生成する学習部と、を備える
ことを特徴とする情報処理装置。
【請求項2】
前記除外部は、
前記属性毎に異なる前記第1の条件で絞り込まれた利用者の履歴情報から前記属性毎に異なる前記第2の条件を満たす履歴情報を除外し、
前記学習部は、
前記属性毎に前記除外部によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を用いて、前記属性毎の属性スコアを出力する前記属性推定モデルを生成する推定モデル生成部と、
前記属性推定モデルから出力される前記属性毎の属性スコアを含む情報を入力とし、前記利用者の特定の行動に関する予測スコアを出力とする予測モデルを生成する予測モデル生成部と、を備える
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記予測モデルは、
前記属性推定モデルから出力される属性スコアを入力とし、貸し倒れリスクに関するスコアを出力とする貸し倒れ予測モデルである
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記予測モデル生成部は、
前記第2の条件を満たす履歴情報を除外した後の履歴情報に含まれる情報を素性とする前記属性推定モデルで得られる属性スコアと前記第2の条件を満たす履歴情報を除外する前の履歴情報に含まれる情報を素性とする前記属性推定モデルで得られる属性スコアとの差を前記属性毎に算出し、前記差が予め定められた値以上である属性スコアを用いずに前記予測モデルを生成する
ことを特徴とする請求項2または3に記載の情報処理装置。
【請求項5】
前記拒否リストにおいて、
前記除外対象の情報はベクトル化されており、
前記除外部は、
前記除外対象の情報とベクトルが類似する情報を前記第2の条件を満たす履歴情報として除外する
ことを特徴とする請求項1~3のいずれか1つに記載の情報処理装置。
【請求項6】
前記許可リストにおいて、
前記非除外対象の情報はベクトル化されており、
前記除外部は、
前記非除外対象の情報とベクトルが類似しない情報以外の情報を前記第2の条件を満たす履歴情報として除外する
ことを特徴とする請求項1~3のいずれか1つに記載の情報処理装置。
【請求項7】
前記第2の条件を満たすとして前記除外部によって除外される情報は、
前記利用者に対して配慮が必要な情報である要配慮個人情報である
ことを特徴とする請求項1~3のいずれか1つに記載の情報処理装置。
【請求項8】
前記第2の条件を満たすとして前記除外部によって除外される情報は、
貸し倒れと特定の関係を有しておらず且つ前記利用者に対して配慮が必要な情報である要配慮個人情報である
ことを特徴とする請求項1~3のいずれか1つに記載の情報処理装置。
【請求項9】
コンピュータが実行する情報処理方法であって、
特定の属性を有する複数の利用者で共通性の高い検索クエリの履歴情報を第1の条件を満たす利用者の履歴情報として絞り込む絞り込み工程と、
除外対象の情報をリスト化した拒否リストまたは非除外対象の情報をリスト化した許可リストを用いて、前記絞り込み工程によって前記第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外工程と、
前記除外工程によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を含む情報を入力とし属性スコアを出力する属性推定モデルを生成する学習工程と、を含む
ことを特徴とする情報処理方法。
【請求項10】
特定の属性を有する複数の利用者で共通性の高い検索クエリの履歴情報を第1の条件を満たす利用者の履歴情報として絞り込む絞り込み手順と、
除外対象の情報をリスト化した拒否リストまたは非除外対象の情報をリスト化した許可リストを用いて、前記絞り込み手順によって前記第1の条件で絞り込まれた利用者の履歴情報から第2の条件を満たす履歴情報を除外する除外手順と、
前記除外手順によって前記第2の条件を満たす履歴情報が除外された前記利用者の履歴情報を含む情報を入力とし属性スコアを出力する属性推定モデルを生成する学習手順と、をコンピュータに実行させる
ことを特徴とする情報処理プログラム。