IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士フイルム株式会社の特許一覧

特開2023-183308情報処理方法、情報処理システム及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023183308
(43)【公開日】2023-12-27
(54)【発明の名称】情報処理方法、情報処理システム及びプログラム
(51)【国際特許分類】
   G06F 16/907 20190101AFI20231220BHJP
   G06N 20/00 20190101ALI20231220BHJP
   G06Q 30/0601 20230101ALI20231220BHJP
【FI】
G06F16/907
G06N20/00
G06Q30/06 330
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2022096849
(22)【出願日】2022-06-15
(71)【出願人】
【識別番号】306037311
【氏名又は名称】富士フイルム株式会社
(74)【代理人】
【識別番号】100083116
【弁理士】
【氏名又は名称】松浦 憲三
(74)【代理人】
【識別番号】100170069
【弁理士】
【氏名又は名称】大原 一樹
(74)【代理人】
【識別番号】100128635
【弁理士】
【氏名又は名称】松村 潔
(74)【代理人】
【識別番号】100140992
【弁理士】
【氏名又は名称】松浦 憲政
(72)【発明者】
【氏名】佐藤 政寛
(72)【発明者】
【氏名】谷口 友紀
(72)【発明者】
【氏名】大熊 智子
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175DA10
5B175FB03
5L049BB22
(57)【要約】
【課題】導入先ドメインと異なるドメインのデータセットを用いて学習がされた複数のモデルを適用して、ドメインシフトに対してロバストな推薦アイテムリストを生成し得る、情報処理方法、情報処理システム及びプログラムを提供する。
【解決手段】情報処理システムが、導入先ドメインと異なる1つ以上のドメインおけるデータセットを用いて学習された複数のモデルのそれぞれから1つ以上の候補アイテムを取得し、取得した複数の候補アイテムの中から、互いにドメインが異なる複数の候補アイテムを推薦アイテムとして選択して、複数の推薦アイテムが含まれる推薦アイテムリストであり、ドメインシフトに対するロバスト性能を有する推薦アイテムリストを生成する。
【選択図】図14
【特許請求の範囲】
【請求項1】
1つ以上のプロセッサを備える情報処理システムが、ユーザーに対して複数のアイテムを推薦する推薦アイテムリストを生成する情報処理方法であって、
前記情報処理システムが、
導入先ドメインと異なる1つ以上のドメインにおけるデータセットを用いて学習された複数のモデルのそれぞれから1つ以上の候補アイテムを取得し、
前記取得した複数の前記候補アイテムの中から、互いにドメインが異なる複数の前記候補アイテムを推薦アイテムとして選択して、複数の前記推薦アイテムが含まれる推薦アイテムリストであり、ドメインシフトに対するロバスト性能を有する推薦アイテムリストを生成する情報処理方法。
【請求項2】
前記情報処理システムが、
前記候補アイテムのそれぞれに対するユーザーの行動を予測した予測値を算出し、
前記導入先ドメインと異なる複数のドメインのそれぞれにおける同一の前記候補アイテムの前記予測値から算出される統計値の順位に基づいて、前記複数の候補アイテムから前記推薦アイテムを選択する請求項1に記載の情報処理方法。
【請求項3】
前記情報処理システムが、
前記推薦アイテムリストの候補となる複数の候補リストのそれぞれについて、前記導入先ドメインと前記複数のドメインのそれぞれとの属性の近さに応じた評価値を導出し、
前記評価値の最小値が最大となる前記候補リストを、前記推薦アイテムリストとする請求項1に記載の情報処理方法。
【請求項4】
前記情報処理システムが、前記導入先ドメインと属性が近いドメインのデータを用いて学習した前記モデルの前記候補アイテムに対してユーザーが肯定的に行動するとし、かつ、前記導入先ドメインと属性が遠いドメインのデータを用いて学習した前記モデルの前記候補アイテムに対してユーザーが否定的に行動するとして、前記ユーザーの行動を確定的に試行して前記候補リストごとの前記評価値を算出する請求項3に記載の情報処理方法。
【請求項5】
前記情報処理システムが、前記導入先ドメインと属性が近いドメインのデータセットを学習データとして用いて学習した前記モデルの前記候補アイテムに対してユーザーが第1確率で肯定的な行動を行うとし、かつ、前記導入先ドメインと属性が遠いドメインのデータセットを学習データとして用いて学習した前記モデルの前記候補アイテムに対してユーザーが第2確率で肯定的な行動を行うとして、前記ユーザーの行動を確率的に試行して前記候補リストごとの前記評価値を算出する請求項3に記載の情報処理方法。
【請求項6】
前記情報処理システムが、
前記複数のモデルのそれぞれについて、データセットが学習データとして適用された第1ドメインにおいて評価した評価結果から前記第1確率を推定し、
前記複数の推薦モデルのそれぞれについて、前記第1ドメインと異なる第2ドメインにおいて評価した評価結果から前記第2確率を推定する請求項5に記載の情報処理方法。
【請求項7】
前記情報処理システムが、前記導入先ドメインにおいてユーザーに対して前記候補リストが提示された際のユーザーの行動に基づき、前記評価値を算出する請求項3に記載の情報処理方法。
【請求項8】
前記情報処理システムが、前記候補リストに含まれる前記候補アイテムの順位に応じて前記候補アイテムごとに規定される重みであり、評価条件に応じて規定される重みを適用して、前記候補リストごとの前記評価値を算出する請求項3に記載の情報処理方法。
【請求項9】
前記情報処理システムが、前記複数の前記候補リストのそれぞれから、1つ以上の前記候補アイテムを選択する請求項3から8のいずれか一項に記載の情報処理方法。
【請求項10】
前記情報処理システムが、前記複数の候補リストのうち、非類似の前記候補リストを優先して前記推薦アイテムとされる前記候補アイテムを選択する請求項1から8のいずれか一項に記載の情報処理方法。
【請求項11】
前記情報処理システムが、同一のユーザーに対して複数回の前記推薦アイテムリストを提示する際に、前記提示ごとに前記推薦アイテムリストに含まれる複数の前記推薦アイテムの並び順を入れ替える請求項1から8のいずれか一項に記載の情報処理方法。
【請求項12】
前記情報処理システムが、複数回の前記推薦アイテムリストを提示する際に、前記提示ごとに前記推薦アイテムリストに含まれる複数の前記推薦アイテムの並び順を入れ替える請求項1から8のいずれか一項に記載の情報処理方法。
【請求項13】
前記情報処理システムが、互いに異なるドメインにおけるデータセットを学習データとして学習された学習済みモデルを前記複数のモデルとして適用する請求項1から8のいずれか一項に記載の情報処理方法。
【請求項14】
前記情報処理システムが、導入先ドメインと異なる1つのドメインにおける互いに異なる特徴量セットを学習データとして学習された学習済みモデルを前記複数の推薦モデルとして適用する請求項1に記載の情報処理方法。
【請求項15】
ユーザーに対して1つ以上のアイテムを推薦する推薦アイテムリストを生成する情報処理システムであって、
1つ以上のプロセッサと、
前記1つ以上のプロセッサに実行させるプログラムが記憶される1つ以上のメモリと、
を備え、
前記1つ以上のプロセッサは、前記プログラムの命令を実行して、
導入先ドメインと異なる1つ以上のドメインにおけるデータセットを用いて学習された複数のモデルのそれぞれから1つ以上の候補アイテムを取得し、
前記取得した複数の前記候補アイテムの中から、互いにドメインが異なる複数の前記候補アイテムを推薦アイテムとして選択して、複数の前記推薦アイテムが含まれる推薦アイテムリストであり、ドメインシフトに対するロバスト性能を有する推薦アイテムリストを生成する情報処理システム。
【請求項16】
ユーザーに対して1つ以上のアイテムを推薦する推薦アイテムリストを生成するプログラムであって、
コンピュータが、
導入先ドメインと異なる1つ以上のドメインにおけるデータセットを用いて学習された複数のモデルのそれぞれから1つ以上の候補アイテムを取得する機能、及び
前記取得した複数の前記候補アイテムの中から、互いにドメインが異なる複数の前記候補アイテムを推薦アイテムとして選択して、複数の前記推薦アイテムが含まれる推薦アイテムリストであり、ドメインシフトに対するロバスト性能を有する推薦アイテムリストを生成する機能を実現させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は情報処理方法、情報処理システム及びプログラムに関する。
【背景技術】
【0002】
多くのアイテムの中からユーザーが自分に合ったベストなものを選ぶことは、時間的にも認知能力的にも難しい。例えば、ECサイトのユーザーであれば、アイテムはECサイトで扱っている商品であり、文書情報管理システムのユーザーであればアイテムは格納されている文書情報である。
【0003】
非特許文献1及び非特許文献2には、ユーザの選択の補助を目的として、アイテムの中から選択候補を提示する技術である情報推薦技術に関する研究について記載されている。なお、ECサイトのECはElectronic Commerceの省略語である。
【0004】
一般に、情報推薦システムは導入先の施設で収集したデータを基に学習する。しかし、学習データに対応する施設と異なる施設に情報推薦システムを導入すると、モデルの予測精度が低下してしまう問題がある。未知の他施設では機械学習モデルがうまく機能しない問題はドメインシフトと呼ばれ、非特許文献3及び非特許文献4に記載されるように、ドメインシフトに対するロバスト性向上の研究であるdomain generalizationが、近年、画像認識を中心に研究が活発化している。しかし、情報推薦技術において、domain generalizationは研究事例が存在しない。
【0005】
情報推薦システムに適用される学習モデルを学習する際に、情報推薦システムの導入
先施設のデータが得られない場合であっても、情報推薦システムが導入される際に導入
先施設のデータが得られていれば、そのデータを用いて学習モデルを評価して、複数の
候補の学習モデルからベストの学習モデルの選択が可能である。
【0006】
しかし、学習モデルが導入される際においても導入先施設のデータが存在しない場合
、又は導入先施設のデータが存在していても、導入先施設のデータへのアクセスができ
ない場合は、上記した複数の候補の学習モデルからのベストの学習モデルの選択は困難
である。
【0007】
非特許文献5は、複数のドメインのそれぞれに対応する学習モデルについて、それぞ
れの予測結果の平均値を用いてドメインシフトに対してロバストな予測を目指す推薦技
術が記載される。
【0008】
非特許文献6は、情報推薦技術における予測モデルの一種である、協調フィルタリン
グモデルについて、例えば、複数の予測の平均値を適用するなど、複数の予測を組み合
わせて、予測精度の向上を試みる手法が記載される。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】Dietmar Jannach、Markus Zanker、Alexander Felfernig、Gerhard Friedrich著、田中克己、角谷和俊訳「情報推薦システム入門-理論と実践‐」共立出版、2012年
【非特許文献2】Deepak K. Agarwal, Bee-Chung Chen著「推薦システム:統計的機械学習の理論と実践」共立出版、2018年
【非特許文献3】Jindong Wang1、Cuiling Lan1、Chang Liu1、Yidong Ouyang2、Tao Qin著“Generalizing to Unseen Domains: A Survey on Domain Generalization”Microsoft Research, Beijing, China、2021年
【非特許文献4】Kaiyang Zhou、Ziwei Liu、Yu Qiao、Tao Xiang、Chen Change Loy著“Domain Generalization in Vision: A Survey”Central University of Finance and Economics, Beijing, China、2021年
【非特許文献5】Zheng Xu, Wen Li, Li Niu, and Dong Xu著"Exploiting Low-rank Structure from Latent Domains for Domain Generalization" School of Computer Engineering, Nanyang Technological University, Singapore、2014年
【非特許文献6】Michael Jahrer、Andreas Toscher、Robert Legenstein著"Combining predictions for accurate recommender systems"、2010年
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、学習モデルが適用される情報推薦システムの導入前の評価においても、情報推薦システムの導入先施設のデータが使用できない場合は、導入先施設のデータに基づく導入先施設に対するベストの情報推薦システムの提供は困難である。しかし、学習データに対応する施設と導入先施設が異なる場合であっても、ドメインシフトに対してロバストであり、導入先施設において高性能の情報推薦を実現したいという要求が存在する。
【0011】
非特許文献5に記載の推薦技術は、画像処理を想定した手法であり情報推薦技術に適していない。具体的には、非特許文献5に記載の情報推薦技術は、単一の予測の出力を前提としており、複数の予測を出力する情報推薦技術には適していない。
【0012】
非特許文献6に記載の手法では、複数の協調フィルタリングモデルは、同一のドメインのデータを用いて学習がされており、ドメインシフトに対してロバストではない。また、非特許文献6に記載の手法は、ドメイン汎化性を目指したものではない。
【0013】
本発明はこのような事情に鑑みてなされたもので、導入先ドメインと異なるドメインのデータセットを用いて学習がされた複数のモデルを適用して、ドメインシフトに対してロバストな推薦アイテムリストを生成し得る、情報処理方法、情報処理システム及びプログラムの提供を目的とする。
【課題を解決するための手段】
【0014】
本開示の第1態様に係る情報処理方法は、1つ以上のプロセッサを備える情報処理システムが、ユーザーに対して複数のアイテムを推薦する推薦アイテムリストを生成する報処理方法であって、情報処理システムが、導入先ドメインと異なる1つ以上のドメインにおけるデータセットを用いて学習された複数のモデルのそれぞれから1つ以上の候補アイテムを取得し、取得した複数の候補アイテムの中から、互いにドメインが異なる複数の候補アイテムを推薦アイテムとして選択して、複数の推薦アイテムが含まれる推薦アイテムリストであり、ドメインシフトに対するロバスト性能を有する推薦アイテムリストを生成する情報処理方法である。
【0015】
第1態様に係る情報処理方法によれば、導入先ドメインと異なるドメインのデータセットを用いて学習がされた複数のモデルを適用して、ドメインシフトに対してロバストな推薦アイテムリストを生成し得る。
【0016】
導入先の例として、導入先の施設が挙げられる。施設とは、複数のユーザーが行動する集団である。施設の例として、企業又はECサイトなどが挙げられる。
【0017】
第2態様に係る情報処理方法は、第1態様に係る情報処理方法において、情報処理システムが、候補アイテムのそれぞれに対するユーザーの行動を予測した予測値を算出し、導入先ドメインと異なる複数のドメインのそれぞれにおける同一の候補アイテムの予測値から算出される統計値の順位に基づいて、複数の候補アイテムから推薦アイテムを選択してもよい。
【0018】
かかる態様によれば、候補アイテムごとの予測値に基づき、複数の候補アイテムの中から推薦アイテムを選択し得る。
【0019】
ユーザーの行動を予測した予測値の例として、ユーザーが肯定的な行動を行う確率が挙げられる。
【0020】
第3態様に係る情報処理方法は、第1態様又は第2態様に係る情報処理方法において、情報処理システムが、推薦アイテムリストの候補となる複数の候補リストのそれぞれについて、導入先ドメインと複数のドメインのそれぞれとの属性の近さに応じた評価値を導出し、評価値の最小値が最大となる候補リストを、推薦アイテムリストとしてもよい。
【0021】
かかる態様によれば、候補リストの評価値に基づいて、複数の候補リストの中から推薦アイテムリストを選択し得る。
【0022】
第4態様に係る情報処理方法は、第3態様に係る情報処理方法において、情報処理システムが、導入先ドメインと属性が近いドメインのデータを用いて学習したモデルの候補アイテムに対してユーザーが肯定的に行動するとし、かつ、導入先ドメインと属性が遠いドメインのデータを用いて学習したモデルの候補アイテムに対してユーザーが否定的に行動するとして、ユーザーの行動を確定的に試行して候補リストごとの評価値を算出してもよい。
【0023】
かかる態様によれば、ユーザーの行動を確定的に試行して算出された評価値に基づいて、複数の候補リストの中から推薦アイテムリストを選択し得る。
【0024】
第5態様に係る情報処理方法は、第3態様に係る情報処理方法において、情報処理システムが、導入先ドメインと属性が近いドメインのデータセットを学習データとして用いて学習したモデルの候補アイテムに対してユーザーが第1確率で肯定的な行動を行うとし、かつ、導入先ドメインと属性が遠いドメインのデータセットを学習データとして用いて学習したモデルの候補アイテムに対してユーザーが第2確率で肯定的な行動を行うとして、ユーザーの行動を確率的に試行して候補リストごとの評価値を算出してもよい。
【0025】
かかる態様によれば、ユーザーの行動を確率的に試行して算出された評価値に基づいて、複数の候補リストの中から推薦アイテムリストを選択し得る。
【0026】
第6態様に係る情報処理方法は、第5態様に係る情報処理方法において、情報処理システムが、複数のモデルのそれぞれについて、データセットが学習データとして適用された第1ドメインにおいて評価した評価結果から第1確率を推定し、複数の推薦モデルのそれぞれについて、第1ドメインと異なる第2ドメインにおいて評価した評価結果から第2確率を推定してもよい。
【0027】
第7態様に係る情報処理方法は、第3態様に係る情報処理方法において、情報処理システムが、導入先ドメインにおいてユーザーに対して候補リストが提示された際のユーザーの行動に基づき、評価値を算出してもよい。
【0028】
第8態様に係る情報処理方法は、第3態様から第7態様のいずれか一態様に係る情報処理方法において、情報処理システムが、候補リストに含まれる候補アイテムの順位に応じて候補アイテムごとに規定される重みであり、評価条件に応じて規定される重みを適用して、候補リストごとの評価値を算出してもよい。
【0029】
かかる態様によれば、候補アイテムごとの重みに応じた評価値を算出し得る。
【0030】
第9態様に係る情報処理方法は、第3態様から第8態様のいずれか一態様に係る情報処理方法において、情報処理システムが、複数の候補リストのそれぞれから、1つ以上の候補アイテムを選択してもよい。
【0031】
かかる態様によれば、推薦アイテムとして、出所が異なる候補アイテムが選択される。これにより、推薦アイテムリストにおけるドメインシフトに対する一定のロバスト性能を担保し得る。
【0032】
第10態様に係る情報処理方法は、第1態様から第8態様のいずれか一態様に係る情報処理方法において、情報処理システムが、複数の候補リストのうち、非類似の候補リストを優先して推薦アイテムとされる候補アイテムを選択してもよい。
【0033】
かかる態様によれば、互いに類似する複数の候補リストのそれぞれからの推薦アイテムの選択が回避される。これにより、複数の推薦アイテムにおけるドメインシフトに対する一定のロバスト性能を担保し得る。
【0034】
かかる態様において、モデルの類似度を算出し、モデルの類似度に基づいて候補アイテムの類似又は非類似を判定してもよい。
【0035】
第11態様に係る情報処理方法は、第1態様から第8態様のいずれか一態様に係る情報処理方法において、情報処理システムが、同一のユーザーに対して複数回の推薦アイテムリストを提示する際に、提示ごとに推薦アイテムリストに含まれる複数の推薦アイテムの並び順を入れ替えてもよい。
【0036】
かかる態様によれば、各回の提示における推薦アイテムリストについて、一定の平均化が実現され得る。
【0037】
第12態様に係る情報処理方法は、第1態様から第8態様のいずれか一態様に係る情報処理方法において、情報処理システムが、複数回の推薦アイテムリストを提示する際に、提示ごとに推薦アイテムリストに含まれる複数の推薦アイテムの並び順を入れ替えてもよい。
【0038】
かかる態様において、ユーザーごとに複数の推薦アイテムの並び順を入れ替えてもよい。
【0039】
第13態様に係る情報処理方法は、第1態様から第12態様のいずれか一態様に係る情報処理方法において、情報処理システムが、互いに異なるドメインにおけるデータセットを学習データとして学習された学習済みモデルを複数のモデルとして適用してもよい。
【0040】
かかる態様によれば、複数のモデルのそれぞれが異なるドメインに依存する。これにより、推薦アイテムリストにおけるドメインシフトに対する一定のロバスト性能を担保し得る。
【0041】
第14態様に係る情報処理方法は、第1態様に係る情報処理方法において、情報処理システムが、導入先ドメインと異なる1つのドメインにおける互いに異なる特徴量セットを学習データとして学習された学習済みモデルを複数の推薦モデルとして適用してもよい。
【0042】
かかる態様によれば、異なるドメインのデータセットの入手が難しい場合であっても、学習データが異なる複数のモデルから候補アイテムを取得し得る。これにより、推薦アイテムリストにおけるドメインシフトに対する一定のロバスト性能を担保し得る。
【0043】
本開示の第15態様に係る情報処理システムは、ユーザーに対して1つ以上のアイテムを推薦する推薦アイテムリストを生成する情報処理システムであって、1つ以上のプロセッサと、1つ以上のプロセッサに実行させるプログラムが記憶される1つ以上のメモリと、を備え、1つ以上のプロセッサは、プログラムの命令を実行して、導入先ドメインと異なる1つ以上のドメインにおけるデータセットを用いて学習された複数のモデルのそれぞれから1つ以上の候補アイテムを取得し、取得した複数の候補アイテムの中から、互いにドメインが異なる複数の候補アイテムを推薦アイテムとして選択して、複数の推薦アイテムが含まれる推薦アイテムリストであり、ドメインシフトに対するロバスト性能を有する推薦アイテムリストを生成する情報処理システムである。
【0044】
第15態様に係る情報処理システムによれば、第1態様に係る情報処理方法と同様の作用効果を得ることが可能である。第2態様から第14態様に係る情報処理方法の構成要件は、他の態様に係る情報処理装置の構成要件へ適用し得る。
【0045】
本開示の第16態様に係るプログラムは、ユーザーに対して1つ以上のアイテムを推薦する推薦アイテムリストを生成するプログラムであって、コンピュータが、導入先ドメインと異なる1つ以上のドメインにおけるデータセットを用いて学習された複数のモデルのそれぞれから1つ以上の候補アイテムを取得する機能、及び取得した複数の候補アイテムの中から、互いにドメインが異なる複数の候補アイテムを推薦アイテムとして選択して、複数の推薦アイテムが含まれる推薦アイテムリストであり、ドメインシフトに対するロバスト性能を有する推薦アイテムリストを生成する機能を実現させるプログラムである。
【0046】
第16態様に係るプログラムによれば、第1態様に係る情報処理方法と同様の作用効果を得ることが可能である。第2態様から第14態様に係る情報処理方法の構成要件は、他の態様に係るプログラムの構成要件へ適用し得る。
【発明の効果】
【0047】
本発明によれば、導入先ドメインと異なるドメインのデータセットを用いて学習がされた複数のモデルを適用して、ドメインシフトに対してロバストな推薦アイテムリストを生成し得る。
【図面の簡単な説明】
【0048】
図1図1は典型的な推薦システムの概念図である。
図2図2は推薦システムの構築に広く用いられている教師あり機械学習の例を示す概念図である。
図3図3は推薦システムの典型的な導入フローを示す説明図である。
図4図4は導入先の施設のデータが得られない場合における推薦システムの導入プロセスの説明図である。
図5図5はドメイン適用によるモデルの学習を行う場合の説明図である。
図6図6は学習済み学習モデルの性能を評価するステップを含む推薦システム導入フローの説明図である。
図7図7は機械学習に用いる学習用データと評価用データの例を示す説明図である。
図8図8はデータセットの違いに起因するモデルの性能の違いを模式的に示すグラフである。
図9図9は学習ドメインと導入先ドメインとが異なる場合の推薦システム導入フローの例を示す説明図である。
図10図10は導入先の施設のデータがない場合の課題を示す説明図である。
図11図11は典型的な推薦アイテムリストの模式図である。
図12図12は推薦アイテムリスト評価の第1例における評価結果を示す模式図である。
図13図13は推薦アイテムリスト評価の第2例における評価結果を示す模式図である。
図14図14は実施形態に係る情報処理方法の概要の説明図である。
図15図15は推薦アイテムリスト評価の具体例を示す模式図である。
図16図16は推薦アイテムリスト評価の他の具体例を示す模式図である。
図17図17は実施形態に係る情報処理システムのハードウェア構成の例を概略的に示すブロック図である。
図18図18は実施形態に係る情報処理システムの機能的構成を示す機能ブロック図である。
図19図19は実施形態に係る情報処理方法の手順を示すフローチャートである。
図20図20は第1実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図21図21は第2実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図22図22は第3実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図23図23は第4実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図24図24は第5実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図25図25は第6実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図26図26は第7実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図27図27は第8実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図28図28は第9実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図29図29は第10実施形態に係る推薦アイテムリスト生成方法を示す模式図である。
図30図30は第11実施形態に係る推薦アイテムリスト生成方法を適用して生成された推薦アイテムリストの一例を示す模式図である。
図31図31は第11実施形態に係る推薦アイテムリスト生成方法を適用して生成された推薦アイテムリストの他の例を示す模式図である。
図32図32は複数のモデルの第1具体例の説明図である。
図33図33は複数のモデルの第2具体例の説明図である。
図34図34は変数の一覧表である。
【発明を実施するための形態】
【0049】
以下、添付図面に従って本発明の好ましい実施形態について詳説する。本明細書では、同一の構成要素には同一の参照符号を付して、重複する説明は適宜省略する。
【0050】
[情報推薦技術の概説]
本実施形態では、推薦システムに用いるモデルの学習及び評価に用いるユーザーの行動履歴のデータに関して、異なるドメインのデータを生成する方法について説明する。はじめに、情報推薦技術の概要と複数ドメインのデータの必要性について具体例を示して概説する。情報推薦技術は、ユーザーに対してアイテムを推薦するための技術である。なお、推薦はサジェストと称され得る。
【0051】
図1は典型的な推薦システムの概念図である。推薦システム10は、ユーザーの情報と、コンテキストの情報とを入力として受け付け、コンテキストに応じて当該ユーザーに推薦するアイテムの情報を出力する。コンテキストは、様々な状況を意味し、例えば、曜日、時間帯、または天気などがあり得る。アイテムは、例えば、本、動画及び飲食店など、様々な対象があり得る。
【0052】
推薦システム10は、複数のアイテムを同時に推薦するのが一般的である。図1では、推薦システム10が3つのアイテムIT1、アイテムIT2及びアイテムIT3を推薦する例が示されている。推薦したアイテムIT1、アイテムIT2及びアイテムIT3に対してユーザーがポジティブな反応をすると、一般に推薦は成功したとみなされる。ポジティブな反応とは、例えば、購入、視聴及び訪問などである。このような推薦技術は、例えば、ECサイトや飲食店を紹介するグルメサイトなどにおいて広く活用されている。
【0053】
図2は推薦システムの構築に広く用いられている教師あり機械学習の例を示す概念図である。推薦システム10は、機械学習の技術を用いて構築される。一般に、過去のユーザーの行動履歴を基に正例および負例を用意して、ユーザーとコンテキストとの組み合わせを予測モデル12に入力し、予測誤差が小さくなるように予測モデル12を訓練する。例えば、ユーザーが閲覧した閲覧アイテムを正例、閲覧しなかった非閲覧アイテムを負例とする。予測誤差が収束するまで機械学習が行われ、目標とする予測性能が獲得される。
【0054】
こうして訓練された学習済みの予測モデル12を用いて、ユーザーとコンテキストの組合せに対して予測される閲覧確率が高いアイテムを推薦する。学習済みの予測モデル12は、訓練済みの予測モデル12と同義である。
【0055】
例えば、学習済みの予測モデル12に対し、あるユーザーAとコンテキストβとの組合せを入力すると、予測モデル12は、ユーザーAがコンテキストβの条件の下で、図1に示すアイテムIT3等の文書を閲覧する確率が高いと推論し、ユーザーAに対してアイテムIT3に近いアイテムを推薦する。なお、推薦システム10の構成によっては、コンテキストを考慮せずにユーザーに対してアイテムを推薦することも多い。
【0056】
〔推薦システムの開発に用いるデータの例〕
ユーザーの行動履歴は、機械学習における正解データと等しいものである。厳密には、過去の行動履歴から次の行動を推論するというタスク設定と理解されるが、過去の行動履歴を基に潜在的な特徴量を学習するのが一般的である。
【0057】
ユーザーの行動履歴としては、例えば、本の購入履歴、動画の視聴履歴、または飲食店の訪問履歴などがあり得る。
【0058】
また、主要な特徴量としては、ユーザー属性と、アイテム属性とがある。ユーザー属性は、例えば、性別、年代、職業、家族構成、および居住エリアなど、様々な要素があり得る。アイテム属性は、例えば、本のジャンル、値段、動画のジャンル、長さ、飲食店のジャンル、場所など様々な要素があり得る。
【0059】
[モデルの構築と運用]
図3は推薦システムの典型的な導入フローを示す説明図である。ここでは、ある施設に推薦システムを導入する際の典型的なフローを示す。推薦システムの導入は、ステップ1として、目的の推薦タスクを行うモデル14を構築し、ステップ2として、構築したモデル14を導入して運用する。
【0060】
モデル14を構築するとは、機械学習モデルの場合、学習用のデータを用いてモデル14の学習を行い、実用レベルの推薦性能を満たす予測モデルである推薦モデルを作成することを含む。モデル14を運用するとは、例えば、ユーザーとコンテキストとの組合せの入力に対して、学習済みのモデル14から推薦アイテムリストの出力を得ることである。
【0061】
モデル14の構築には、学習用のデータが必要である。図3に示すように、一般に推薦システムのモデル14は、導入先の施設で収集したデータを基に学習が行われる。導入先の施設から収集されたデータを用いて学習を行って、モデル14は導入先の施設のユーザーの振る舞いを学習し、導入先の施設のユーザーに対して精度のよい推薦アイテムの予測が可能である。
【0062】
しかし、様々な事情に起因して、導入先の施設のデータが得られない場合がある。例えば、企業の社内システムにおける文書情報推薦システム及び病院の院内システムにおける文書情報推薦システムなどの場合、推薦モデルを開発する企業が導入先の施設のデータにアクセスできないことがあり得る。導入先の施設のデータが得られない場合、代わりに、異なる施設で収集されたデータをもとに学習する必要がある。
【0063】
図4は導入先の施設のデータが得られない場合における推薦システムの導入プロセスの説明図である。導入先の施設とは異なる施設で収集されたデータを用いて学習したモデル14を挿入先の施設で運用すると、施設間のユーザーの振る舞いの違いなどにより、モデル14の予測精度が低下してしまう問題がある。
【0064】
学習した施設と異なる未知の他施設では機械学習モデルがうまく機能しない問題は、広義にはモデル14を学習したソースドメインと、モデル14を適用するターゲットドメインが異なるドメインシフトの問題に対するロバスト性を向上させるという技術課題として把握される。ドメイン汎化に関連する問題設定として、ドメイン適用がある。これはソースドメインとターゲットドメインの両方のデータを用いて学習する方法である。ターゲットドメインのデータが存在するにもかかわらず異なるドメインのデータを使う目的は、ターゲットドメインのデータ量が少なく学習に不十分であるのを補うためである。
【0065】
なお、ドメイン汎化は、英語表記を用いてDomain generalizationと称され得る。ドメイン適用は、英語表記を用いてDomain adaptationと称され得る。
【0066】
図5はドメイン適用によるモデルの学習を行う場合の説明図である。ターゲットドメインである導入先の施設で収集されたデータのデータ量は、異なる施設で収集されたデータよりもデータ量に比べて相対的に少ないものの、両方のデータを用いて学習を行うことにより、モデル14は、導入先の施設のユーザーの振る舞いについてもある程度の精度で予測することが可能になる。
【0067】
[ドメインの説明]
上記の施設の違いはドメインの違いの一種である。情報推薦におけるdomain adaptationの研究に関する文献であるIvan Cantador et al, Chapter 27:"Cross-domain Recommender System"では、ドメインの違いが以下の4つに分類されている。
【0068】
〔アイテム属性レベル〕
例えば、コメディ映画とホラー映画は別ドメイン。なお、アイテム属性レベルは、英語表記を用いてItem attribute levelと称され得る。
【0069】
〔アイテムタイプレベル〕
例えば、映画と連続テレビドラマは別ドメイン。なお、アイテムタイプレベルは、英語表記を用いてItem type levelと称され得る。
【0070】
〔アイテムレベル〕
例えば、映画と本は別ドメイン。なお、アイテムレベルは、英語表記を用いてItem levelと称され得る。
【0071】
〔システムレベル〕
例えば、映画館の映画とテレビ放映の映画は別ドメイン。なお、システムレベルは、英語表記を用いてSystem levelと称され得る。
【0072】
図5等に示す施設の違いは、上記の4つの分類のうちのシステムレベルのドメインに該当する。
【0073】
フォーマルにドメインを定義すると、ドメインは目的変数Yと説明変数Xの同時確率分布P(X,Y)で規定され、Pd1(X,Y)≠Pd2(X,Y)の場合に、d1とd2とは異なるドメインである。
【0074】
同時確率分布P(X,Y)は、説明変数の分布P(X)と条件付き確率分布P(Y|X)との積、又は目的変数の分布P(Y)と条件付き確率分布P(Y|X)との積で表すことができる。
【0075】
P(X,Y)=P(Y|X)P(X)=P(X|Y)P(Y)
【0076】
したがって、P(X)、P(Y)、P(Y|X)及びP(X|Y)のうち1つ以上が変わると異なるドメインとなる。
【0077】
[ドメインシフトの典型パターン]
〔共変量シフト〕
説明変数の分布P(X)が異なる場合、共変量シフトと呼ばれる。例えば、データセット間でユーザー属性の分布が異なる場合、より具体的には男女比率が異なる場合などが共変量シフトに該当する。なお、共変量シフトは、英語表記を用いてCovariate shiftと称され得る。
【0078】
〔事前確率シフト〕
目的変数の分布P(Y)が異なる場合、事前確率シフトと呼ばれる。例えば、データセット間で平均閲覧率や平均購入率が異なる場合などが事前確率シフトに該当する。なお、事前確率シフトは、英語表記を用いてPrior probability shiftと称され得る。
【0079】
〔コンセプトシフト〕
条件付き確率分布P(Y|X)及びP(X|Y)が異なる場合、コンセプトシフトと呼ばれる。例えば、ある企業の研究開発部門がデータ分析資料を読む確率がP(Y|X)にあたるが、これがデータセット間で異なる場合などがコンセプトシフトに該当する。なお、コンセプトシフトは、英語表記を用いてConcept shiftと称され得る。
【0080】
ドメイン適応あるいはドメイン汎化性の研究は、上記いずれかのパターンを主要因として想定しているものと、特にどのパターンが主要因であるかを考慮せずにP(X,Y)が変化していることへの対処を考えるものと、がある。なお、前者の場合、特に、共変量シフトを想定しているものが多い。
【0081】
[ドメインシフトが影響する理由]
予測又は分類のタスクを行う予測分類モデルは、説明変数Xと目的変数Yの関係性に基づいて推論を行うため、P(Y|X)が変化すれば当然、予測性能及び分類性能の少なくともいずれかは低下する。また、予測分類モデルを機械学習する際には学習データ内において予測誤差及び分類誤差の少なくともいずれかの最小化を行うが、例えば、説明変数がX=X_1になる頻度が、X=X_2になる頻度と比較して大きい場合、つまりP(X=X_1)>P(X=X_2)である場合、X=X_1のデータの方がX=X_2のデータと比較して多いので、X=X_1の誤差低減はX=X_2の誤差低減より優先して学習される。そのためP(X)が施設間で変化する場合も、予測誤差及び分類誤差の少なくともいずれかは低下する。
【0082】
ドメインシフトは、情報推薦に限らず、いろいろなタスクのモデルについて問題になり得る。例えば、社員の退職リスクを予測するモデルについて、ある企業のデータを用いて学習した予測モデルを別の企業で運用する場合にドメインシフトが問題になり得る。
【0083】
また、細胞の抗体生産量を予測するモデルについて、ある抗体のデータを用いて学習したモデルを、別の抗体で運用する場合にドメインシフトが問題になり得る。また、顧客の声を分類するモデル、例えば、VOCを商品機能、サポート対応及びその他に分類するモデルについて、ある商品に関するデータを用いて学習した分類モデルを別の商品で運用する場合にドメインシフトが問題になり得る。なお、VOCは、顧客の声の英語表記であるVoice of Customerの省略語である。
【0084】
[モデルの導入前評価について]
学習したモデル14を実際の施設等に導入する前に、モデル14の性能評価を行うことが多い。性能評価は導入の可否判断や、モデルあるいは学習手法などの研究開発のために必要である。
【0085】
図6は学習済み学習モデルの性能を評価するステップを含む推薦システム導入フローの説明図である。図6では、図5で説明したモデル14を学習するステップ1と、モデル14を運用するステップ2との間に、ステップ1.5として、モデル14の性能を評価するステップが追加されている。その他の構成は図5と同様である。
【0086】
図6に示すように、一般的な推薦システム導入のフローでは、導入先の施設で収集されたデータを学習用データと評価用データとに分割することが多い。評価用データを用いてモデル14の予測性能を確認してから、モデル14の運用が開始される。
【0087】
しかし、ドメイン汎化のモデル14を構築する場合は、学習用データと評価用データは異なるドメインである必要がある。さらに、ドメイン汎化においては、学習用データについても複数ドメインのデータを用いることが好ましく、学習に使えるドメインが多い方がより好ましい。
【0088】
[汎化性について]
図7は機械学習に用いる学習用データと評価用データの例を示す説明図である。あるドメインd1の同時確率分布Pd1(X,Y)から得られるデータセットは、学習用データと、評価用データとに分けられる。学習用データと同一ドメインの評価用データを第1の評価用データといい、図7において評価用データ1と表記する。また、ドメインd1と異なるドメインd2の同時確率分布Pd2(X,Y)から得られるデータセットを用意し、これを評価用データとして用いる。学習用データと異なるドメインの評価用データを第2の評価用データといい、図7において評価用データ2と表記する。
【0089】
ドメインd1の学習用データを用いてモデル14の学習が行われ、ドメインd1の第1の評価用データと、ドメインd2の第2の評価用データとのそれぞれを用いて学習済みのモデル14の性能が評価される。
【0090】
図8はデータセットの違いに起因するモデルの性能の違いを模式的に示すグラフである。学習用データ内でのモデル14の性能を性能Aとし、第1の評価用データでのモデル14の性能を性能Bとし、第2の評価用データでのモデル14の性能を性能Cとする場合、通常は、図8に示すように、性能A>性能B>性能Cという関係になる。
【0091】
モデル14の汎化性能の高さは、一般には、性能Bが高いこと又は性能AとBの差が小さいことを指す。つまり、モデル14の汎化性能の高さは、学習用データに過剰適合せずに、学習していないデータに対しても予測の性能が高いことを目指している。
【0092】
本明細書におけるドメイン汎化性の文脈では、性能Cが高いこと又は性能Bと性能Cの差が小さいことを指す。つまり、学習に用いたドメインと異なるドメインでも、変わらずに高い性能が出ることを目指している。
【0093】
モデル14の学習を行う際に、導入先の施設のデータを用いることができないものの、導入の際に導入先の施設において収集されたデータが得られる場合は、導入先の施設において得られたデータを用いてモデルの性能を評価し得る。評価の結果に基づいて複数の候補モデルの中から最適なモデルを選択して導入先の施設に適用することが考えられる。図9にその例を示す。
【0094】
図9は学習ドメインと導入先ドメインとが異なる場合の推薦システム導入フローの例を示す説明図である。図9に示すように、導入先の施設とは異なる施設で収集されたデータを用いて、複数のモデルを学習し得る。ここでは、それぞれ異なる施設で収集されたデータセットDS1、データセットDS2及びデータセットDS3を用いて、モデルM1、モデルM2及びモデルM3の学習が行われる例を示す。例えば、モデルM1はデータセットDS1を用いて訓練され、モデルM2はデータセットDS2を用いて訓練され、モデルM3はデータセットDS3を用いて訓練される。なお、モデルM1、モデルM2及びモデルM3それぞれの学習に用いるデータセットは、異なる施設で収集された複数のデータセットの組み合わせであってもよい。例えば、モデルM1はデータセットDS1とデータセットDS2とを混合したデータセットを用いて訓練されてもよい。
【0095】
こうして、複数のモデルM1、モデルM2及びモデルM3を学習した後、導入先の施設で収集されたデータDtgを用いて、モデルM1、モデルM2及びモデルM3のそれぞれの性能を評価する。図9において、モデルM1、モデルM2及びモデルM3のそれぞれの下に示すA、B及びCの記号は、モデルM1、モデルM2及びモデルM3のそれぞれの評価結果を表している。A評価は、導入基準を満たす良好な予測性能であることを示す。B評価はA評価よりも劣る性能であることを示す。C評価はB評価よりもさらに劣る性能であり、導入に適していないことを示す。
【0096】
例えば、図9のように、モデルM1の評価結果がA評価であり、モデルM2の評価結果がB評価であり、モデルM3の評価結果がC評価であったとする。導入先の施設にとって最適なモデルとしてモデルM1が選択され、モデルM1を適用した推薦システム10が導入されることになる。
【0097】
[課題]
図9を用いて説明したように、モデルを学習する際に導入先の施設のデータが得られない場合も、モデルが導入される際に導入先の施設で収集されたデータがあれば、そのデータを用いてモデルを評価してベストなモデルを選択することができる。
【0098】
しかし、導入先の施設へのモデルの導入の際に導入先の施設のデータがない場合、又は導入先の施設へのモデルの導入の際に導入先の施設のデータがあっても、導入先の施設のデータへアクセスできない場合は、モデルを選択することができない。
【0099】
図10は導入先の施設のデータがない場合の課題を示す説明図である。図10に示すように、導入先の施設のデータがない場合、モデルM1、モデルM2及びモデルM3のそれぞれを評価することができず、ベストなモデルを選択することができない。
【0100】
このように、導入先の施設のデータが、モデルを導入する前の評価においても利用できない場合は、導入先の施設に対してベストなモデルを選択することができない。このような場合においても、導入先の施設において高性能なレコメンドをすることが望まれる。学習ドメインと導入先ドメインとが異なるため、ドメインシフトにロバストなレコメンドを実現することが課題である。本実施形態では、複数のモデルを活用して推薦アイテムの提示が可能な情報処理方法および情報処理システムを提供する。
【0101】
[推薦アイテムリストの評価]
図11は典型的な推薦アイテムリストの模式図である。図11には、5つの推薦アイテムであるアイテム1からアイテム5までを含む推薦アイテムリストIL100を図示する。
【0102】
図11に示す推薦アイテムリストIL100は、予め規定されるランキング順に従って上から下へ向かって5つの推薦アイテムITが並べられる。アイテム1からアイテム5までのそれぞれに付した1から5まで数値は、推薦アイテムリストIL100における推薦アイテムの相対的な順位を表している。
【0103】
推薦アイテムリストIL100は、ユーザーが望む推薦アイテムが含まれている場合は、ユーザーの役に立つ。ユーザーが望む推薦アイテムの一例として、閲覧など、ユーザーが肯定的な行動を行う推薦アイテムが挙げられる。
【0104】
推薦アイテムが上から下へ向かって並べられる場合、ユーザーは上から順に推薦アイテムを見る傾向がある。ユーザーは全ての推薦アイテムを見ずに、推薦アイテムリストを途中までしか見ないことがある。そうすると、ユーザーが望む推薦アイテムは、相対的に上位であることが望ましい。
【0105】
図12は推薦アイテムリスト評価の第1例における評価結果を示す模式図である。図12には、推薦アイテムリストの評価指標として、hit rateを例示する。図12には、推薦アイテムリストIL110、推薦アイテムリストIL112及び推薦アイテムリストIL114のそれぞれに対する評価値を図示する。
【0106】
hit rateは、推薦アイテムリストIL110、推薦アイテムリストIL112及び推薦アイテムリストIL114のそれぞれについて、それぞれに含まれる推薦アイテムITのうち1つでもヒットする場合は、評価値が1とされる。また、hit rateは、推薦アイテムリストIL110等に含まれる推薦アイテムITのいずれもヒットしない場合は、評価値が0とされる。ここでいう推薦アイテムITがヒットするとは、推薦アイテムITに対してユーザーが肯定的な行動をすることを意味している。
【0107】
例えば、推薦アイテムリストIL110のアイテム3は、ヒットした推薦アイテムITであることを表す印が図示される。同様に、推薦アイテムリストIL114のアイテム2は、ヒットした推薦アイテムITであることを表す印が図示される。
【0108】
推薦アイテムリストIL110等の評価指標としてhit rateが適用される場合、推薦アイテムリストIL110及び推薦アイテムリストIL114の評価値は1であり、推薦アイテムリストIL110の評価値は0である。
【0109】
図13は推薦アイテムリスト評価の第2例における評価結果を示す模式図である。図13には、推薦アイテムリストの評価指標として、reciprocal rankを例示する。reciprocal rankは、順位の逆数を重みとして用いて、各推薦アイテムITを重み付けして評価する。
【0110】
図13には、推薦アイテムリストIL110ではアイテム3がヒットし、推薦アイテムリストIL112ではアイテム1からアイテム5までのいずれもヒットせず、推薦アイテムリストIL114ではアイテム3がヒットした場合を例示する。
【0111】
推薦アイテムリストIL110は、重みが1/3のアイテム3がヒットされており、アイテム1、アイテム2、アイテム4及びアイテム5がヒットしていない。したがって、推薦アイテムリストIL110の評価値は1/3である。
【0112】
また、推薦アイテムリストIL114は、重みが1/2のアイテム2がヒットされており、アイテム1及びアイテム3からアイテム5までがヒットしていない。したがって、推薦アイテムリストIL110の評価値は1/2である。
【0113】
更に、ユーザーがアイテム1からアイテム5までのいずれもヒットしていない推薦アイテムリストIL112の評価値は0ある。なお、分数を適用した重み及び評価値は、小数を適用してもよい。
【0114】
他の評価指標の例としてdiscounted cumulative gainが挙げられる。discounted cumulative gainは、重みとして1/log(1+順位)が適用される。すなわち、重みが用いられる評価指標の重みは、順位が上位のアイテムには、相対的に大きい重みが適用される。
【0115】
[実施形態に係る情報処理方法の概要]
図14は実施形態に係る情報処理方法の概要の説明図である。図14には、ドメインD101のデータセットDS101を用いて学習をしたモデルM101、ドメインD102のデータセットDS102を用いて学習をしたモデルM102及びドメインD104のデータセットDS103を用いて学習をしたモデルM103が存在し、導入先の施設のドメインが不明である場合を図示する。
【0116】
モデルM101は、アイテム45及びアイテム26が含まれる複数の候補アイテムPITを出力する。複数の候補アイテムPITは予測値の順に並べられる。候補アイテムPITの予測値は、候補アイテムPITに対して、閲覧及び購入など、ユーザーが肯定的な行動を取る確率を適用し得る。モデルM101において、アイテム45の予測値は0.6であり、アイテム26の予測値は0.4である。
【0117】
モデルM102は、アイテム35及びアイテム36が含まれる複数の候補アイテムPITを出力する。アイテム35の予測値は0.7であり、アイテム69の予測値は0.3である。
【0118】
モデルM103は、アイテム49及びアイテム12が含まれる複数の候補アイテムPITを出力する。アイテム49の予測値は0.5であり、アイテム12の予測値は0.4である。
【0119】
図14に示す候補アイテムPITへ付した数値は、モデルM101、モデルM102及びモデルM103から出力される候補アイテムPITに共通する候補アイテムPITの識別番号である。なお、モデルM101から出力される候補アイテムPITは、モデルM101から出力される推薦アイテムリストとして把握し得る。
【0120】
複数の多様なドメインのデータセットを用いて複数のモデルの準備がされている場合、導入先の施設のドメインは複数のモデルのいずれかのドメインに属性が近いと仮定される。ここで、モデルのドメインとは、モデルを学習する際に適用されたデータセットの提供先のドメインを意味する。ドメインの属性が近いとは、ユーザーの年齢層、性別及び職業など、ドメインの性質として把握されるドメインの属性が同一又はドメインの属性に共通点が存在する場合を表す。
【0121】
導入先の施設のドメインに属性が近いドメインのデータセットを用いて学習がされたモデルは、高精度の推薦を実施し得る。しかし、複数のドメインのいずれが導入先の施設のドメインと属性が近いかはわからない。
【0122】
そこで、複数のモデルのいずれが導入先の施設のドメインと属性が近い場合であっても、高性能の推薦アイテムリストを生成したい。ここでいう高性能とは、少なくともドメインシフトに対するロバスト性能を有することを意味する。
【0123】
[導入先の施設のドメインを適用した推薦アイテムリストの評価]
図15は推薦アイテムリスト評価の具体例を示す模式図である。同図には、評価指標としてhit rateが適用される例を示す。同図に示す推薦アイテムリストIL120は、モデルM102のみから出力された複数の候補アイテムPITから選択された、推薦アイテムIT201、推薦アイテムIT202、推薦アイテムIT203、推薦アイテムIT204、推薦アイテムIT205及び推薦アイテムIT206が含まれる。推薦アイテムIT201から推薦アイテムIT206は、ユーザーが肯定的な行動を取る予測値の順に、上から並べられている。
【0124】
推薦アイテムリストIL120について、モデルM101に対応するドメインが導入先の施設のドメインの属性と近い場合、推薦アイテムIT201から推薦アイテムIT206までのいずれもヒットしないと予測される。そうすると、推薦アイテムリストIL120の評価値は0となる。推薦アイテムリストIL120について、モデルM103に対応するドメインが導入先の施設のドメインの属性と近い場合も同様である。
【0125】
一方、推薦アイテムリストIL120について、モデルM102に対応するドメインが導入先の施設のドメインの属性と近い場合、推薦アイテムIT201から推薦アイテムIT206までの全てがヒットすると予測される。そうすると、推薦アイテムリストIL120の評価値は1となる。
【0126】
推薦アイテムリストIL122は、モデルM101、モデルM102及びモデルM103のそれぞれから出力された候補アイテムPITから選択された、複数の推薦アイテムITが含まれる。具体的には、推薦アイテムリストIL122は、モデルM101から出力される推薦アイテムIT101及び推薦アイテムIT102が含まれる。
【0127】
また、推薦アイテムリストIL122は、モデルM102から出力される推薦アイテムIT201及び推薦アイテムIT202及びモデルM103から出力される推薦アイテムIT301及び推薦アイテムIT302が含まれる。
【0128】
推薦アイテムリストIL122は、上から順に、モデルM101の最上位の推薦アイテムIT101、モデルM102の最上位の推薦アイテムIT201、モデルM103の最上位の推薦アイテムIT301、モデルM103の第2位の推薦アイテムIT302、モデルM102の第2位の推薦アイテムIT202及びモデルM101の第2位の推薦アイテムIT102の順に、複数の推薦アイテムITが上から並べられる。
【0129】
モデルM101に対応するドメインが導入先の施設のドメインの属性と近い場合、推薦アイテムリストIL122の評価値は1である。モデルM102に対応するドメインが導入先の施設のドメインの属性と近い場合、及びモデルM103に対応するドメインが導入先の施設のドメインの属性と近い場合も、推薦アイテムリストIL122の評価値は1である。
【0130】
すなわち、モデルM102の候補アイテムPITのみから偏って選択された推薦アイテムITが含まれる推薦アイテムリストIL120は、モデルM102が導入先のドメインと属性が近い場合に高性能であるが、モデルM101又はモデルM103が導入先のドメインと属性が近い場合は、モデルM102が導入先のドメインと属性が近い場合と比較して性能が低下する。
【0131】
他方、モデルM101の候補アイテムPIT、モデルM102の候補アイテムPIT及びモデルM103の候補アイテムPITのそれぞれから、バランスよく選択された推薦アイテムITが含まれる推薦アイテムリストIL122は、上記のいずれの場合も高性能である。
【0132】
図16は推薦アイテムリスト評価の他の具体例を示す模式図である。同図には、評価指標としてreciprocal rankが適用される例を示す。推薦アイテムIT201等に付した分数は、推薦アイテムITごとの評価指標の重みである。
【0133】
モデルM101に対応するドメインが導入先の施設のドメインの属性と近い場合、推薦アイテムリストIL120の評価値は0である。同様に、モデルM103に対応するドメインが導入先の施設のドメインの属性と近い場合も、推薦アイテムリストIL120の評価値は0である。また、モデルM102に対応するドメインが導入先の施設のドメインの属性と近い場合、推薦アイテムリストIL120の評価値は2.45である。
【0134】
モデルM101に対応するドメインが導入先の施設のドメインの属性と近い場合、推薦アイテムリストIL122の評価値は1.17である。モデルM102に対応するドメインが導入先の施設のドメインの属性と近い場合、推薦アイテムリストIL122の評価値は0.70である。モデルM103に対応するドメインが導入先の施設のドメインの属性と近い場合、推薦アイテムリストIL122の評価値は0.58である。
【0135】
評価指標としてhit rateが適用されると同様に、任意の推薦モデルの推薦アイテムITに偏って選択された推薦アイテムITが含まれる推薦アイテムリストIL120に対して、複数の推薦モデルの推薦アイテムITがバランスよく選択された推薦アイテムITが含まれる推薦アイテムリストIL122は高性能である。
【0136】
[好ましい推薦アイテム選択の具体例]
好ましい推薦アイテム選択の具体例として、小売店舗向けの推薦システムを考える。推薦モデルの学習データとして、店舗S1における購買履歴のデータセットDS11、店舗S2における購買履歴のデータセットDS12及び店舗S3における購買履歴のデータセットDS13が利用可能である。各店舗における購買履歴は各店舗におけるユーザーの行動履歴である。
【0137】
新規にオープンする店舗S4に導入される推薦システムを開発する際に、導入先の施設である店舗S4における購買履歴のデータセットは存在しない。また、店舗S4のドメインの属性が、店舗S1、店舗S2又は店舗S3のいずれの属性に近いかは不明である。
【0138】
店舗S1、店舗S2及び店舗S3のそれぞれにおけるデータセットDS11、データセットDS12及びデータセットDS13を用いて学習を実施したモデルM11、モデルM12及びモデルM13を用意する。モデルM11、モデルM12及びモデルM13は、モデルベースの協調フィルタリングの一種である行列分解モデルを用いる。行列の次元数は100とする。
【0139】
モデルM11、モデルM12及びモデルM13は、購買の有無の予測に対するlog lossを指標として、stochastic gradient descentを適用して学習する。なお、log loss は、Logarithmic Lossと称され得る。また、stochastic gradient descentは、確率的勾配降下法と称され得る。
【0140】
次に、モデルM11、モデルM12及びモデルM13を用いて、複数のユーザーのそれぞれに対する推薦アイテムリストIL11、推薦アイテムリストIL12及び推薦アイテムリストIL13を生成する。推薦アイテムリストIL11、推薦アイテムリストIL12及び推薦アイテムリストIL13の大きさは6とする。推薦アイテムリストIL11等の大きさはとは、推薦アイテムリストIL11等に含まれる推薦アイテムITの数を意味する。
【0141】
推薦アイテムリストILの評価指標としてreciprocal rankを適用し、モデルM11、モデルM12又はモデルM13のいずれかが高性能となるようにする。具体的には、全体の3分の1のユーザーには、推薦アイテムリストILの1位の推薦アイテムIT及び6位の推薦アイテムITとして、モデルM11の推薦アイテムITから選択される。
【0142】
また、推薦アイテムリストILの2位の推薦アイテムIT及び5位の推薦アイテムITとして、モデルM12の推薦アイテムITから選択され、3位の推薦アイテムIT及び4位の推薦アイテムITとして、モデルM13の推薦アイテムITから選択される。
【0143】
更に、上記の全体の3分の1のユーザーと異なる、全体の3分の1のユーザーには、推薦アイテムリストILの1位の推薦アイテムIT及び6位の推薦アイテムITとして、モデルM12の推薦アイテムITから選択される。推薦アイテムリストILの2位の推薦アイテムIT及び5位の推薦アイテムITは、モデルM13の推薦アイテムITから選択し、3位の推薦アイテムIT及び4位の推薦アイテムITは、モデルM11の推薦アイテムITから選択される。
【0144】
残りの全体の3分の1のユーザーには、推薦アイテムリストILの1位の推薦アイテムIT及び6位の推薦アイテムITは、モデルM13の推薦アイテムITから選択される。推薦アイテムリストILの2位の推薦アイテムIT及び5位の推薦アイテムITは、モデルM11の推薦アイテムITから選択され、3位の推薦アイテムIT及び4位の推薦アイテムITは、モデルM12の推薦アイテムITから選択される。
【0145】
すなわち、モデルM11の推薦アイテムIT、モデルM12の推薦アイテムIT及びモデルM13の推薦アイテムITは、推薦アイテムリストILを構成する推薦アイテムITの候補である候補アイテムとされる。推薦アイテムリストILは、複数の候補アイテムの中から、予め規定される選択条件に基づき選択された推薦アイテムITが含まれる。
【0146】
これにより、店舗S4のドメインが、モデルM11、モデルM12及びモデルM13のいずれのドメインと属性が近い場合であっても、推薦アイテムリストILは、hit rate 及びreciprocal rankなどの複数の評価指標において同程度の評価値が得られ、同程度の性能となる。したがって、上記した推薦アイテムリストILが出力される推薦システムは、ドメインシフトに対するロバストな推薦を実現し得る。
【0147】
[情報処理システムの構成例]
次に、ドメインシフトに対するロバスト性能を有する推薦システムに適用される情報処理システムの構成例について説明する。図17は実施形態に係る情報処理システムのハードウェア構成の例を概略的に示すブロック図である。
【0148】
情報処理装置100は、コンピュータのハードウェアとソフトウェアとを用いて実現される。情報処理装置100の物理的形態は特に限定されず、サーバコンピュータであってもよいし、ワークステーションであってもよく、パーソナルコンピュータ又はタブレット端末などであってもよい。ここでは、1台のコンピュータを用いて情報処理装置100の処理機能を実現する例を述べるが、情報処理装置100の処理機能は、複数台のコンピュータを用いて構成されるコンピュータシステムによって実現してもよい。
【0149】
情報処理装置100は、プロセッサ102、非一時的な有体物であるコンピュータ可読媒体104、通信インターフェース106、入出力インターフェース108及びバス110を備える。
【0150】
プロセッサ102は、CPU(Central Processing Unit)を含む。プロセッサ102はGPU(Graphics Processing Unit)を含んでもよい。プロセッサ102は、バス110を介してコンピュータ可読媒体104、通信インターフェース106及び入出力インターフェース108と接続される。
【0151】
プロセッサ102は、コンピュータ可読媒体104に記憶された各種のプログラム及びデータ等を読み出し、各種の処理を実行する。プログラムという用語は、プログラムモジュールの概念を含み、プログラムに準じる命令を含む。
【0152】
コンピュータ可読媒体104は、例えば、主記憶装置であるメモリ112及び補助記憶装置であるストレージ114を備える記憶装置である。ストレージ114は、例えば、ハードディスク装置、ソリッドステートドライブ装置、光ディスク、光磁気ディスク及び半導体メモリなどを用いて構成される。ストレージ114は、上記したデバイスの適宜の組み合わせを用いて構成されてもよい。ストレージ114には、各種プログラム及びデータ等が記憶される。
【0153】
なお、ハードディスク装置は、英語表記Hard Disk Driveの省略語を用いてHDDと称され得る。ソリッドステートドライブ装置は、英語表記Solid State Driveを用いてSSDと称され得る。
【0154】
メモリ112は、プロセッサ102の作業領域として使用される領域及びストレージ114から読み出されたプログラム及び各種のデータを一時的に記憶する領域が含まれる。ストレージ114に記憶されているプログラムがメモリ112にロードされ、プログラムの命令をプロセッサ102が実行して、プロセッサ102は、プログラムで規定される各種の処理を行う手段として機能する。
【0155】
メモリ112は、プロセッサ102を用いて実行される推薦アイテムリスト生成プログラム120などの各種のプログラムおよび各種のデータ等が記憶される。推薦アイテムリスト生成プログラム120は、複数のプログラムを含み得る。
【0156】
すなわち、推薦アイテムリスト生成プログラム120は、複数の推薦モデルから複数の候補アイテムを取得し、複数の候補アイテムから予め規定される推薦アイテムリストの大きさに対応する数の候補アイテムを推薦アイテムとして選択する。推薦アイテムリスト生成プログラム120は、複数の候補アイテムから推薦アイテムを選択する際に、予め規定される選択条件を適用し得る。
【0157】
また、推薦アイテムリスト生成プログラム120は、推薦アイテムに対して規定の整列条件を適用して推薦アイテムを並べて、ユーザーへ提示される推薦アイテムリストを生成する。
【0158】
候補アイテムを取得する際に、メモリ112へ記憶される複数のモデルのそれぞれから候補アイテムを取得してもよいし、情報処理装置100の外部の装置に記憶される複数のモデルのそれぞれから候補アイテムを取得してもよい。
【0159】
メモリ112は、複数のモデルの学習を行う学習プログラムが記憶されてもよい。プロセッサ102は、学習プログラムを実行して複数のモデルの学習を行ってもよい。メモリ112は、複数のモデルの学習を行う際に用いられる学習データが記憶されてもよい。
【0160】
メモリ112は、候補アイテム記憶部140を備える。候補アイテム記憶部140は、推薦アイテムリスト生成プログラム120が用いる候補アイテムが記憶される。
【0161】
メモリ112は、推薦アイテムリスト記憶部142を備える。推薦アイテムリスト記憶部142は、プロセッサ102が推薦アイテムリスト生成プログラム120を実行して生成される推薦アイテムリストが記憶される。
【0162】
通信インターフェース106は、有線又は無線を適用して外部装置との通信処理を行い、外部装置との間で情報のやり取りを行う。情報処理装置100は、通信インターフェース106を介して通信回線に接続される。
【0163】
通信回線は、ローカルエリアネットワークであってもよいし、ワイドエリアネットワークであってもよく、これらの組み合わせであってもよい。なお、通信回線の図示を省略する。通信インターフェース106は、オリジナルデータセットなど様々なデータの入力を受け付けるデータ取得部の役割を担うことができる。
【0164】
情報処理装置100は、入力装置152及び表示装置154を備える。入力装置152及び表示装置154は、入出力インターフェース108を介してバス110に接続される。入力装置152は、例えば、キーボード、マウス、マルチタッチパネル、その他のポインティングデバイス及び音声入力装置等が適用され得る。入力装置152は、上記したキーボード等の適宜の組み合わせであってよい。
【0165】
表示装置154は、例えば、液晶ディスプレイ、有機ELディスプレイ及びプロジェクタ等が適用される。表示装置154は、上記した液晶ディスプレイ等の適宜の組み合わせであってよい。なお、タッチパネルのように入力装置152と表示装置154とが一体的に構成されてもよく、タッチパネル式のタブレット端末のように、情報処理装置100と入力装置152と表示装置154とが一体的に構成されてもよい。有機ELディスプレイは、organic electro-luminescenceの省略語であるOELと称され得る。なお、有機ELディスプレイのELは、Electro-Luminescenceの省略語である。
【0166】
図18は実施形態に係る情報処理システムの機能的構成を示す機能ブロック図である。情報処理装置100は、候補アイテム取得部160、推薦アイテム選択部162及び推薦アイテムリスト生成部164を備える。
【0167】
候補アイテム取得部160は、複数の推薦モデルのそれぞれから複数の候補アイテムを取得する。候補アイテム取得部160は、複数の候補アイテムを候補アイテム記憶部140へ記憶する。
【0168】
推薦アイテム選択部162は、候補アイテム取得部160を用いて取得された複数の候補アイテムの中から、推薦アイテムリストのサイズに応じた数の候補アイテムを推薦アイテムとして選択する。
【0169】
推薦アイテムリスト生成部164は、推薦アイテム選択部162を用いて選択された複数の推薦アイテムを用いて、推薦アイテムリストを生成する。推薦アイテムリスト生成部164は、推薦アイテムリストを推薦アイテムリスト記憶部142へ記憶する。
【0170】
[情報処理方法の手順]
図19は実施形態に係る情報処理方法の手順を示すフローチャートである。候補アイテム取得工程S10では、図18に示す候補アイテム取得部160は複数の候補アイテムを取得する。候補アイテム取得工程S10において、候補アイテム取得部160は取得した複数の候補アイテムを候補アイテム記憶部140へ記憶する。候補アイテム取得工程S10の後に推薦アイテム選択工程S12へ進む。
【0171】
候補アイテム取得工程S10において、ユーザーが肯定的な行動を行う確率を表す予測値が候補アイテムごとに算出され、モデルごとに複数の候補アイテムが予測値の降順に並べられたリストを取得してもよい。
【0172】
推薦アイテム選択工程S12では、推薦アイテム選択部162は、候補アイテム取得工程S10において取得された複数の候補アイテムの中から、推薦アイテムとされる候補アイテムを選択する。推薦アイテム選択工程S12の後に推薦アイテムリスト生成工程S14へ進む。
【0173】
推薦アイテムリスト生成工程S14では、推薦アイテムリスト生成部164は、推薦アイテム選択工程S12において選択された複数の推薦アイテムを用いて、推薦アイテムリストを生成する。推薦アイテムリスト生成工程S14において、推薦アイテムリスト生成部164は、推薦アイテムリストを推薦アイテムリスト記憶部142へ記憶する。推薦アイテムリスト生成工程S14の後に、情報処理装置100は情報処理方法の手順を終了させる。
【0174】
推薦アイテムリスト生成工程S14において、選択された推薦アイテムを含む複数の候補リストを評価する候補リスト評価工程及び候補リストの評価結果に応じては、複数の候補リストから推薦アイテムリストを選択する推薦アイテムリスト選択工程が実行されてもよい。
【0175】
[第1実施形態に係る推薦アイテムリスト生成方法]
図20は第1実施形態に係る推薦アイテムリスト生成方法を示す模式図である。以下に、上記した情報処理方法及び情報処理システムを適用して推薦アイテムリストを生成しする推薦アイテムリスト方法について詳細に説明する。
【0176】
第1実施形態に係る推薦アイテムリスト生成方法では、まず、図17に示すプロセッサ102は、推薦アイテムリスト生成プログラム120を実行して、モデルM101、モデルM102及びモデルM103のそれぞれから候補アイテムPITを取得する。図20には、モデルM101、モデルM102及びモデルM103のそれぞれから、2つの候補アイテムPITが取得される例を示す。
【0177】
プロセッサ102は、モデルM101、モデルM102及びモデルM103のそれぞれから1つ以上の候補アイテムPITを取得し、結果的に複数の候補アイテムPITを取得する。取得された複数の候補アイテムPITは、候補アイテム記憶部140へ記憶される。
【0178】
次に、プロセッサ102は、モデルM101、モデルM102及びモデルM103のそれぞれについて、取得した複数の候補アイテムPITが、モデルごとの推薦アイテムの予測値の順に並べられたリストを生成する。プロセッサ102は、予め算出された予測値を用いてもよいし、予測値を算出してもよい。
【0179】
ここで、予測値とは、閲覧及び購入など、推薦アイテムごとのユーザーが肯定的に行動する確率を適用し得る。図20に示す例では、モデルM101について、予測値が0.6のアイテム45と、予測値が0.4のアイテム26が、上から予測値の降順に並べられる。
【0180】
同様に、モデルM102について、予測値が0.7のアイテム35と、予測値が0.3のアイテム69が、上から予測値の降順に並べられる。モデルM103について、予測値が0.5のアイテム45と、予測値が0.4のアイテム12が、上から予測値の降順に並べられる。
【0181】
候補アイテムPIT及び推薦アイテムITに付した数値は、識別番号である。モデルM101の候補アイテムPITとして図示されるアイテム26は、モデルM102及びモデルM103のそれぞれにおいて、予測値が下位の候補アイテムとして存在し得る。アイテム69及びアイテム12についても同様である。
【0182】
次に、プロセッサ102は、モデルM101、モデルM102及びモデルM103のそれぞれから最上位の候補アイテムPITを推薦アイテムITとして選択し、ドメインシフトに対するロバスト性能を有する推薦アイテムリストIL100を生成する。図20に示す例では、推薦アイテムITとして、アイテム45、アイテム35及びアイテム49を含む推薦アイテムリストIL100を例示する。
【0183】
第1実施形態に適用される推薦アイテムリスト生成プログラム120は、モデルごとの候補アイテムの予測値を取得する予測値取得プログラムが含まれる。また、推薦アイテムリスト生成プログラム120は、モデルごとの候補アイテムの予測値の順に並べられたリストを生成するリスト生成プログラムが含まれる。各リストから上位の候補アイテムを選択するアイテム選択プログラムが含まれる。なお、情報の取得には、情報の生成という概念が含まれ得る。
【0184】
[第2実施形態に推薦アイテムリスト生成方法]
図21は第2実施形態に係る推薦アイテムリスト生成方法を示す模式図である。第2実施形態に係る推薦アイテムリスト生成方法では、図17のプロセッサ102は、候補アイテムPITごとの予測値の統計値を算出し、算出された統計値が各候補アイテムPITの予測値とする。プロセッサ102は、複数の候補アイテムPITから、候補アイテムPITごとの予測値の統計値が大きい順に、推薦アイテムリストのサイズに応じた数の推薦アイテムITとされる候補アイテムPITを選択する。
【0185】
なお、図21に示すモデルM101、モデルM102及びモデルM103のいずれか1つは高精度であるとする。モデルが高精度であるとは、予測が上位の候補アイテムは、実際にユーザーが閲覧することを意味する。予測が上位の候補アイテムの例として、予測値が相対的に大きい候補アイテムが挙げられる。図22等を用いて説明する他の実施形態についても同様である。
【0186】
例えば、モデルM101、モデルM102及びモデルM103のそれぞれについて、アイテムの識別番号が1から100までの100の候補アイテムを取得する場合を考える。プロセッサ102は、モデルごとの各候補アイテムの予測値の統計値を算出する。統計値は、平均値、最大値及び中央値など任意の統計指標を用いて計算された値を適用し得る。平均値は算術平均値を適用し得る。図21には、モデルごとの各候補アイテムの予測値の平均値が算出される場合を示す。
【0187】
例えば、モデルM101のアイテム1の予測値、モデルM102のアイテム1の予測値及びモデルM103のアイテム1の予測値の平均値として0.28が算出される。同様に、モデルM101のアイテム2の予測値、モデルM102のアイテム2の予測値及びモデルM103のアイテム2の予測値の平均値として0.05が算出される。このようにして、アイテム1からアイテム100までの全ての候補アイテムPITについて予測値の平均値が算出され、算出された予測値の平均値が各候補アイテムの予測値とされる。
【0188】
次に、プロセッサ102は、平均値が適用される予測値の降順に上から、アイテム1からアイテム100までを整列させ、最上位の候補アイテムPITから順に推薦アイテムリストIL100のサイズに応じた数の候補アイテムPITを推薦アイテムITとし選択する。図21には、アイテム45、アイテム35及びアイテム49が推薦アイテムITへ適用される推薦アイテムリストIL100を図示する。
【0189】
第2実施形態に適用される推薦アイテムリスト生成プログラム120は、予測値取得プログラム、リスト生成プログラム及びアイテム選択プログラムに加えて、アイテムごとの予測値の統計値を取得する統計値取得プログラムが含まれる。
【0190】
[第3実施形態に推薦アイテムリスト生成方法]
図22は第3実施形態に係る推薦アイテムリスト生成方法を示す模式図である。第3実施形態に係る推薦アイテムリスト生成方法では、図17のプロセッサ102は、モデルごとの候補アイテムPITが予測値の降順に並べられたリストを取得し、各モデルのリストの最上位からk位までの候補アイテムPITを推薦アイテムITとして選択する。推薦アイテムリストIL102のサイズは、k×モデルの数である。換言すると、プロセッサ102は、推薦アイテムリストIL102のサイズに対応する数をモデルの数で除算した数の候補アイテムPITを推薦アイテムITとして選択する。なお、kは2以上の正の整数である。
【0191】
図22には、モデルM101における予測値が最上位のアイテム45、モデルM102における予測値が最上位のアイテム35、モデルM103における予測値が最上位のアイテム49が、推薦アイテムリストIL102の推薦アイテムITとし選択される例を示す。
【0192】
図22に示す推薦アイテムリストIL102は、モデルM101が高精度の場合はアイテム45がヒットする。また、推薦アイテムリストIL102は、モデルM102が高精度の場合はアイテム35がヒットし、モデルM103が高精度の場合はアイテム49がヒットする。
【0193】
第3実施形態に適用される推薦アイテムリスト生成プログラム120は、第1実施形態と同様に、予測値取得プログラム、リスト生成プログラム及びアイテム選択プログラムが含まれる。
【0194】
[第4実施形態に係る推薦アイテムリスト生成方法]
図23は第4実施形態に係る推薦アイテムリスト生成方法を示す模式図である。第4実施形態に係る推薦アイテムリスト生成方法では、図17のプロセッサ102は、モデルごとの候補アイテムが予測値の降順に並べられたリストを取得する。
【0195】
推薦アイテムリストIL104のサイズが、モデルの数と比較して大きい場合は、推薦アイテムリストIL104における推薦アイテムITの順位に応じた重みが考慮され、バランスよく推薦アイテムITが並べられる。
【0196】
プロセッサ102は、上記した推薦アイテムリストIL104を生成する手順を適用して、推薦アイテムリストIL104の候補となる複数の候補リストを生成する。プロセッサ102は、複数の候補リストのそれぞれについて、導入先の施設のドメインと各モデルに対応するドメインとの相性に応じて変化する評価値を算出する。なお、候補リストは図24に候補リストPIL100等として図示する。
【0197】
ここで、導入先の施設のドメインと各モデルに対応するドメインとの相性とは、導入先の施設のドメインと各モデルに対応するドメインとの属性の近さとして把握し得る。例えば、導入先の施設のドメインと各モデルに対応するドメインとの間の類似度が相対的に大きい場合は、相性がよく、属性が近いとしてもよい。プロセッサ102は、候補リストごとの評価値の最小値を比較して、評価値の最小値が最大となる候補リストを推薦アイテムリストIL104として決定する。
【0198】
第4実施形態に適用される推薦アイテムリスト生成プログラム120は、第4実施形態に適用される予測値取得プログラム、リスト生成プログラム及びアイテム選択プログラムが含まれる。
【0199】
また、推薦アイテムリスト生成プログラム120は、推薦アイテムリストIL104の候補となる複数の候補リストを生成する候補リスト生成プログラム、評価値を算出する評価値算出プログラムが含まれる。
【0200】
[第5実施形態に係る推薦アイテムリスト生成方法]
図24は第5実施形態に係る推薦アイテムリスト生成方法を示す模式図である。第5実施形態に係る推薦アイテムリスト生成方法として、第4実施形態に係る推薦アイテムリスト生成方法における候補リストの評価の具体例を示す。
【0201】
図17のプロセッサ102は、導入先の施設のドメインが、複数のモデルのうち、どのモデルと属性が近いかに応じて、推薦アイテムリストに対する仮想的なユーザーの行動を規定する。すなわち、ドメインの属性が近いユーザーは、100パーセントの確率で閲覧等の肯定的な行動を行うとして、ユーザーの行動を確定的に試行する。
【0202】
プロセッサ102は、複数のモデルから取得した推薦アイテムの並び順が変えられた複数の候補リストを生成し、複数の候補リストのそれぞれについて複数の仮想的なユーザー行動ごとに、予め規定される評価指標の評価値を算出する。図24には、複数の候補リストとして、候補リストPIL100及び候補リストPIL102を示す
図24には、候補リストPIL100について、図23のモデルM101、モデルM102及びモデルM103のそれぞれが、導入先の施設のドメインに属性が近い場合の評価値を算出する例を模式的に示す。
【0203】
候補リストPIL100は、モデルM101の1位のアイテム、モデルM102の1位のアイテム、モデルM103の1位のアイテム、モデルM101の2位のアイテム、モデルM102の2位のアイテム、モデルM103の2位のアイテムの順に6つの推薦アイテムITが並べられる。
【0204】
また、候補リストPIL102は、モデルM101の1位のアイテム、モデルM102の1位のアイテム、モデルM103の1位のアイテム、モデルM103の2位のアイテム、モデルM102の2位のアイテム、モデルM101の2位のアイテムの順に6つの推薦アイテムITが並べられる。
【0205】
図24には、候補リストPIL100及び候補リストPIL102の評価指標として、reciprocal rankが例示される。候補リストPIL100について、モデルM101が導入先の施設のドメインに属性が近い場合の評価値は、1+(1/4)=1.25と計算される。同様に、モデルM102が導入先の施設のドメインに属性が近い場合の評価値は0.70と計算され、モデルM103が導入先の施設のドメインに属性が近い場合の評価値は0.50と計算される。候補リストPIL100の評価値の最小値は0.50である。
【0206】
また、候補リストPIL102について、モデルM101が導入先の施設のドメインに属性が近い場合の評価値は1.17である。モデルM102が導入先の施設のドメインに属性が近い場合の評価値は0.70である。モデルM103が導入先の施設のドメインに属性が近い場合の評価値は0.58である。候補リストPIL100の評価値の最小値は0.58である。
【0207】
候補リストPIL100の評価値の最小値0.50と、候補リストPIL102の評価値の最小値0.58とを比較すると、候補リストPIL102の評価値0.58の方か大きいので、候補リストPIL102は、複数の候補リストの中でベストなものであり、推薦アイテムリストILとされる。
【0208】
候補リストにおける推薦アイテムのベストの並べ方は、候補リストのサイズ、モデルの数及び評価指標に応じて規定し得る。候補リストの評価値は、1人以上の任意のユーザーについて計算されればよく、複数のユーザーのそれぞれについて計算しなくてもよい。
【0209】
第5実施形態に適用される推薦アイテムリスト生成プログラム120は、評価値算出プログラムとして、評価条件ごとの評価値の最小値が最大となる候補リストを判定する候補リスト判定プログラムが含まれる。
【0210】
[第6実施形態に係る推薦アイテムリスト生成方法]
図25は第6実施形態に係る推薦アイテムリスト生成方法を示す模式図である。第6実施形態に係る推薦アイテムリスト生成方法として、第4実施形態に係る推薦アイテムリスト生成方法における候補リストの評価の他の具体例を示す。
【0211】
図25には、候補リストPIL100及び候補リストPIL102の評価指標として、reciprocal rankが例示される。第6実施形態では、推薦アイテムリストに対する仮想的なユーザーの行動として、ドメインの属性が近いユーザーは、40パーセントの確率で閲覧等の肯定的な行動を行い、ドメインの属性が遠いユーザーは、20パーセントの確率で閲覧等の肯定的な行動を行うとする確率的な仮想ケースを考える。
【0212】
候補リストPIL100について、モデルM101が導入先の施設のドメインに属性が近い場合の評価値は、1×0.4+(1/2)×0.2+(1/3)×0.2+(1/4)×0.4+(1/5)×0.2+(1/6)×0.2=0.74と計算される。
【0213】
同様に、モデルM102が導入先の施設のドメインに属性が近い場合の評価値は0.63と計算され、モデルM103が導入先の施設のドメインに属性が近い場合の評価値は0.59と計算される。候補リストPIL100の評価値の最小値は0.59である。
【0214】
また、候補リストPIL102について、モデルM101が導入先の施設のドメインに属性が近い場合の評価値は0.72と計算され、モデルM102が導入先の施設のドメインに属性が近い場合の評価値は0.63と計算され、モデルM103が導入先の施設のドメインに属性が近い場合の評価値は0.61と計算される。候補リストPIL102の評価値の最小値は0.61である。候補リストPIL102は、推薦アイテムリストILとされる。
【0215】
[第7実施形態に係る推薦アイテムリスト生成方法]
図26は第7実施形態に係る推薦アイテムリスト生成方法を示す模式図である。第7実施形態に係る推薦アイテムリスト生成方法として、第6実施形態に係る推薦アイテムリスト生成方法におけるユーザー行動の確率を推定する方法の一例を示す。
【0216】
ドメインの属性が近いユーザーが肯定的な行動を行う確率を第1確率とし、ドメインの属性が遠いユーザーが非定的な行動を行う確率を第2確率とする。モデルM101について、学習に適用された第1ドメインのデータセットDS100を用いて、モデルM101の予測値の順にアイテムを並べたリストが評価され、閲覧率が導出される。例えば、閲覧率は0.4である。
【0217】
また、学習に適用された第1ドメインと異なる第2ドメインのデータセットDS102を用いて、モデルM101の予測値の順にアイテムを並べたリストが評価され、閲覧率が導出される。例えば、閲覧率は0.2である。
【0218】
モデルM101の第1確率として、学習に適用されたドメインのデータセットDS100を用いたモデルM101の予測値の順にアイテムを並べたリストの閲覧率が適用される。
【0219】
また、モデルM101の第2確率として、学習に適用された第1ドメインと異なる第2ドメインのデータセットDS102を用いたモデルM101の予測値の順にアイテムを並べたリストの閲覧率が適用される。
【0220】
同様にして、モデルM102の第1確率として、学習に適用された第1ドメインのデータセットDS110を用いたモデルM102の予測値の順にアイテムを並べたリストの閲覧率0.4を適用し得る。
【0221】
また、モデルM102の第2確率として、学習に適用された第1ドメインと異なる第2ドメインのデータセットDS112を用いたモデルM102の予測値の順にアイテムを並べたリストの閲覧率を0.2適用し得る。図17に示すモデルM103など、他のモデルについても同様に、閲覧率を用いて第1確率及び第2確率を規定し得る。
【0222】
図26には、モデルM101とモデルM102との第1確率が同一となる例を示すが、モデルM101とモデルM102との第1確率は異なっていてもよい。第2確率についても同様である。
【0223】
例えば、第2確率は上記のとおり算出し、学習に適用された第1ドメインのデータセットを用いて導出された閲覧率と、学習に適用された第1ドメインと異なる第2ドメインのデータセットを用いて導出された閲覧率との算術平均値を第1確率としてもよい。
【0224】
上記の第1確率の導出は、導入先の施設のドメインと属性が近いドメインの閲覧率は、導入先の施設のドメインの閲覧率とは同一とはならず、導入先の施設のドメインの閲覧率と導入先の施設のドメインと属性が遠いドメインの閲覧率とのと間になるという考えに基づいている。
【0225】
[第8実施形態に係る推薦アイテムリスト生成方法]
図27は第8実施形態に係る推薦アイテムリスト生成方法を示す模式図である。推薦システムの運用において、同一のユーザーに対して複数回の推薦情報を提供する機会が生じ得る。第8実施形態に係る推薦アイテムリスト生成方法では、同一のユーザーに対する推薦アテムリストが生成されるたびに、推薦アイテムの並び順が入れ替えられる。これにより、1人のユーザーに対して平均的には一定以上の品質の推薦情報を提供し得る。なお、推薦アテムリストの生成ごとの推薦アイテムの並び順の入れ替えは、提示ごとの推薦アイテムの並び順の入れ替えの一例である。
【0226】
図27には、同一のユーザーに対する1回目の推薦アイテムリストIL120及び2回目の推薦アイテムリストIL122を図示する。また、同図には、1回目の推薦アイテムリストIL120の評価値及び2回目の推薦アイテムリストIL122のそれぞれの評価値を示す。評価指標は、reciprocal rankが適用される。
【0227】
1回目の推薦アイテムリストIL120の評価値は、図24に示す候補リストPIL102における候補アイテムPITと同一の配置順が適用され、6つの推薦アイテムITが並べられる。推薦アイテムリストIL120についての評価値は、図24に示す候補リストPIL102の評価値と同一であり、ここでの説明は省略する。
【0228】
2回目の推薦アイテムリストIL122は、モデルM103の1位のアイテム、モデルM102の1位のアイテム、モデルM101の1位のアイテム、モデルM101の2位のアイテム、モデルM102の2位のアイテム、モデルM103の2位のアイテムの配置順が適用される。
【0229】
推薦アイテムリストIL122について、モデルM101が導入先の施設のドメインに属性が近い場合の評価値は0.58である。モデルM102が導入先の施設のドメインに属性が近い場合の評価値は0.70である。モデルM103が導入先の施設のドメインに属性が近い場合の評価値は1.17である。
【0230】
推薦アイテムリストIL120と推薦アイテムリストIL122とのモデルM101が導入先の施設のドメインに属性が近い場合の評価値の平均値は、(1.17+0.58)/2=0.87である。モデルM102が導入先の施設のドメインに属性が近い場合の評価値の平均値は0.70であり、モデルM103が導入先の施設のドメインに属性が近い場合の評価値の平均値は0.87である。推薦アイテムリストIL120と推薦アイテムリストIL122との評価値の平均値の最小値は0.70である。
【0231】
一方、同一のユーザーに対して、複数回にわたって推薦アイテムリストIL120又は推薦アイテムリストIL122が提供される場合、評価値の平均値の最小値は0.58となる。したがって、第8実施形態に係る推薦アイテムリスト生成方法は、どのモデルのドメインが導入先の施設とドメインの属性と近いかという評価条件について、評価条件ごとの評価値の平均値の最小値の最大化を実現し得る。
【0232】
[第9実施形態に係る推薦アイテムリスト生成方法]
図28は第9実施形態に係る推薦アイテムリスト生成方法を示す模式図である。第9実施形態に係る推薦アイテムリスト生成方法では、推薦アイテムリストを構成する推薦アイテムの並び順がユーザーごとに入れ替えられる。なお、図28に示すユーザー1は、第1ユーザーであり、ユーザー2は第2ユーザーである。また、ユーザーごとの推薦アイテムの並び順の入れ替えは、提示ごとの推薦アイテムの並び順の入れ替えの一例である。
【0233】
図28には、第1ユーザーに対して推薦アイテムリストIL120が提示され、第2ユーザーに対して推薦アイテムリストIL122が提示される例を示す。なお、図28に示す推薦アイテムリストIL120及び推薦アイテムリストIL122は、図27に示す推薦アイテムリストIL120及び推薦アイテムリストIL122と同一である。
【0234】
なお、図28に示す評価値の具体例は、図27に示す1回目を第1ユーザーに置き換え、かつ、2回目を第2ユーザーに置き換えた場合に相当する。ここでは、評価値の具体例についての説明を省略する。
【0235】
第9実施形態に係る推薦アイテムリスト生成方法は、ユーザーごとに推薦アイテムリストにおける推薦アイテムの並び順を変えて、全てのユーザーについて、平均的には一定以上の品質の推薦情報を提供し得る。各ユーザーに対して1回ずつの推薦アイテムリストを提示する場合においても、推薦アイテムリストにおける推薦アイテムの並び順が変えられるとよい。
【0236】
[第10実施形態に係る推薦アイテムリスト生成方法]
図29は第10実施形態に係る推薦アイテムリスト生成方法を示す模式図である。第10実施形態に係る推薦アイテムリスト生成方法では、複数のモデルについて、類似性が高いモデルが存在する場合に、類似するモデルの一方の候補アイテムから推薦アイテムが選択され、他方のモデルの候補アイテムから推薦アイテムが非選択とされる。すなわち、非類似のモデルから得られる候補アイテムリストから優先して、推薦アイテムが選択される。
【0237】
なお、類似するモデルのそれぞれから得られる候補リストは、類似する候補リストの一例であり、非類似のモデルのそれぞれから得られる候補リストは、非類似の候補リストの一例である。
【0238】
図29には、類似性の高いモデルとして、モデルM102及びモデルM104を例示する。推薦アイテムリストIL136は、モデルM101の候補アイテムが選択される推薦アイテムIT131及びモデルM103の候補アイテムが選択される推薦アイテムIT133が含まれる。
【0239】
また、推薦アイテムリストIL136は、モデルM102の候補アイテム又はモデルM104の候補アイテムが選択される推薦アイテムIT122が含まれる。図29には、推薦アイテムIT132として、モデルM102のアイテム35又はモデルM104のアイテム35が選択される場合を例示する。
【0240】
モデルの類似性は、ドメイン間の類似性及び生成される推薦アイテムリストの類似性等に基づいて判定しうる。例えば、図29に示すモデルM101からモデルM104までの学習データに対応するドメインの類似性の評価には、以下の手順を適用し得る。
【0241】
まず、各ドメインの特性をユーザー属性とアイテム属性とのデータセットから抽出する。例えば、ユーザー属性からユーザーの平均年齢を抽出する。アイテム属性からアイテムの平均価格を抽出する。データセットから抽出されるドメインの特性は、説明変数などのメタデータから抽出される統計値及び分布等であってよい。
【0242】
次に、各ドメインの特性をデータセットとは別の外部情報から抽出する。例えば、データセット外の関連情報として、ドメインである施設の床面積、施設が所在する市町村の世帯平均年収等を抽出する。
【0243】
次に、上記の処理において得られた特性を表す複数の種類の数値を用いて、各ドメインの特性を多次元ベクトルとして表す。例えば、各ドメインの特性を、ユーザーの平均年齢、アイテムの平均価格、施設の床面積及び所在施設の世帯平均年収を変数とする4次元の特性ベクトルとして表現する。
【0244】
次に、上記したベクトル空間における特性ベクトルの類似度を求める。特性ベクトルの類似度を評価するにあたり、特性ベクトルの各次元の値を規格化し、各次元の値の数値範囲を揃える。
【0245】
次に、各ドメインの特性ベクトル間のユークリッド距離を求める。特性ベクトル間のユークリッド距離が予め規定される距離未満となるドメイン同士は、類似するドメインと判定し得る。なお、モデルの類似性の判定は上記の例に限定されない。例えば、各ドメインの特性を多次元ベクトルとして、外部情報をパラメータとせず、説明変数のみをパラメータとする態様を適用してもよい。
【0246】
図17に示す推薦アイテムリスト生成プログラム120は、ドメイン間の類似性に基づいて、候補アイテムから推薦アイテムを選択する選択プログラムを含み得る。選択プログラムは、ドメイン間の類似性は判定する類似性判定プログラムを含み得る。
【0247】
[第11実施形態に係る推薦アイテムリスト生成方法]
図30は第11実施形態に係る推薦アイテムリスト生成方法を適用して生成された推薦アイテムリストの一例を示す模式図である。第11実施形態に係る推薦アイテムリスト生成方法は、ユーザーに応じて推薦アイテムのランキング順に基づく重みが規定される。
【0248】
同図には、6つの推薦アイテムITである推薦アイテム1から推薦アイテム6までを含む推薦アイテムリストIL140を例示する。推薦アイテムリストIL140における推薦アイテム1等の上位の推薦アイテムはよく閲覧するが、推薦アイテム6等の下位の推薦アイテムはあまり閲覧しないユーザーを想定し、ランキング順が下位へ向かうと減衰が相対的に大きくなる重みとして、ランキング順の逆数の2乗が適用される例を示す。
【0249】
図31は第11実施形態に係る推薦アイテムリスト生成方法を適用して生成された推薦アイテムリストの他の例を示す模式図である。同図には図31に示すIL140とは、ランキング順に基づく重みが異なる推薦アイテムリストIL142を図示する。
【0250】
推薦アイテムリストIL142は、推薦アイテム1等の上位の推薦アイテムITから、推薦アイテム6等の下位の推薦アイテムまでを網羅して閲覧するユーザーを想定し、ランキング順が下位へ向かうと減衰が相対的に小さくなる重みとして、ランキング順の逆数の平方根が適用される例を示す。
【0251】
[複数のモデルの第1具体例]
図32は複数のモデルの第1具体例の説明図である。候補アイテムを出力する互いに異なる複数のモデルは、異なるドメインにおけるデータセットを学習データとして適用して学習が実施される。
【0252】
同図には、ドメインD101のデータセットDS101を用いて学習がされた学習済みモデルであるモデルM101、ドメインD102のデータセットDS102を用いて学習がされた学習済みモデルであるモデルM102及びドメインD103のデータセットDS103を用いて学習がされた学習済みモデルであるモデルM103を図示する。
【0253】
[複数のモデルの第2具体例]
図33は複数のモデルの第2具体例の説明図である。互いに異なる複数のドメインからデータセットを取得できずに、1つのドメインD100からデータセットDS100を取得する場合を考える。
【0254】
1つのドメインから取得されたデータセットについて、互いに異なる複数の特徴量セットを抽出し、互いに異なる複数の特徴量セットを学習データとして学習を実施して、互いに異なる複数のモデルを生成する。
【0255】
同図には、1つのドメインのデータセットから抽出された第1特徴量セットを用いて生成されるモデルM201、第2特徴量セットを用いて生成されるモデルM202及び第3特徴量セットを用いて生成されるモデルM203を図示する。なお、図33に図示される特徴量セット1、特徴量セット2及び特徴量セット3のそれぞれは、第1特徴量セット、第2特徴量セット及び第3特徴量セットに対応する。
【0256】
図34は変数の一覧表である。同図には説明変数とし得る変数として、ユーザー属性、アイテム属性及びコンテキストが例示される。同図には、ユーザー属性1として呼吸器科等の所属診療科が例示され、ユーザー属性2として医師等の職種が例示される。
【0257】
また、同図には、アイテム属性1としてCT等の検査種類が例示され、アイテム属性2として患者性別が例示され、コンテキスト1として入院の有無が例示され、コンテキスト2として、アイテム作成からの経過時間が例示される。なお、CTはComputed Tomographyの省略語である。
【0258】
例えば、図33のモデルM201の学習データに適用される特徴量セットとして、所属診療科以外の説明変数を適用し得る。モデルM201は、所属診療科と閲覧との関係が変わった場合でも一定のロバスト性能を有する。
【0259】
モデルM202の学習データに適用される特徴量セットとして、職種以外の説明変数を適用し得る。モデルM202は、職種と閲覧との関係が変わった場合でも一定のロバスト性能を有する。
【0260】
モデルM203の学習データに適用される特徴量セットとして、入院の有無以外の説明変数を適用し得る。モデルM202は、入院の有無と閲覧との関係が変わった場合でも一定のロバスト性能を有する。
【0261】
ドメインシフトに起因して、説明変数と目的変数との関係の一部が変化すると想定される。しかし、どの説明変数の目的変数との関係が変化するのかの把握は困難である。そこで、どの説明変数の目的変数との関係が変化した場合であっても、複数のモデルのいずれ
かが適切となる複数のモデルが準備される。
【0262】
[実施形態の作用効果]
実施形態に係る情報処理装置及び情報処理方法は、以下の作用効果を得ることが可能である。
【0263】
〔1〕
ユーザーに対して複数の推薦アイテムを推薦する情報推薦を実施する情報処理装置において、互いに異なる複数のモデルであり、異なるデータセットを学習データに用いて学習がされた複数のモデルのそれぞれから1つ以上の候補アイテムが取得される。複数の候補アイテムの中から異なるモデルの候補アイテムが含まれる複数の候補アイテムが推薦アイテムとして選択される。
【0264】
これにより、ドメインシフトに対してロバスト性能を有する推薦アイテムリストが生成される。
【0265】
〔2〕
複数のモデルごとに候補アイテムの予測値の降順に候補アイテムが並べられ、各モデルの最上位の候補アイテムから順に推薦アイテムが選択される。これにより、各モデルからバランスよく推薦アイテムとなる候補アイテムが選択される。
【0266】
〔3〕
推薦アイテムリストのサイズがモデル数よりの大きい場合、推薦アイテムが選択される際に候補アイテムのランキング順に基づく重みが考慮される。
【0267】
〔4〕
候補アイテムごとの各モデルにおける予測値の統計値が候補アイテムの予測値とされる。予測値の降順に推薦アイテムが選択される。これにより、各モデルからバランスよく推薦アイテムとなる候補アイテムが選択される。
【0268】
〔5〕
各モデルから選択された1つ以上の推薦アイテムが含まれる複数の推薦アイテムから構成される候補リストが複数生成され、複数の候補リストのそれぞれについて、導入先の施設のドメインと各モデルのドメインとの属性の近さが異なる複数の評価値が算出される。評価条件ごと評価値の最小値が最大となる候補リストが抽出され、推薦アイテムリストとされる。これにより、候補リストの評価値に基づき、ドメインシフトに対してロバスト性能を有する推薦アイテムリストが抽出される。
【0269】
〔6〕
同一のユーザーに対して複数回の推薦アイテムリストを提供する場合に、各回の推薦アイテムリストにおける推薦アイテムの並び順が変えられる。これにより、対象のユーザーに対して平均的には一定の品質の推薦アイテムリストが提供される。
【0270】
〔7〕
ユーザーごとに推薦アイテムリストにおける推薦アイテムの並び順が変えられる。これにより、全てのユーザーに対して平均的には一定の品質の推薦アイテムリストが提供される。
【0271】
〔8〕
複数のモデルのうち、類似性が相対的に高い複数のモデルでは、それぞれの候補アイテムのいずれかが推薦アイテムとして選択される。これにより、各モデルからバランスよく推薦アイテムとなる候補アイテムが選択される。
【0272】
〔9〕
ユーザーの特性に応じて、候補リストのランキング順に応じた重みが変えられる。これにより、ユーザーの特性が考慮された候補リストの評価値が算出される。
【0273】
〔10〕
複数のモデルのそれぞれは、互いに異なるドメインのデータセットを用いて学習がされる学習済みモデルが適用される。これにより、多種多様なドメインに対応し得る候補アイテムが取得される。
【0274】
〔11〕
複数のモデルのそれぞれは、1つのドメインのデータセットおいて互いに異なる複数の特徴量セットを用いて学習がされる学習済みモデルが適用される。これにより、複数のドメインのデータセットが利用できない場合であっても、多種多様なドメインに対応し得る候補アイテムが取得される。
【0275】
本発明の技術的範囲は、上記の実施形態に記載の範囲には限定されない。各実施形態における構成等は、本発明の趣旨を逸脱しない範囲で、各実施形態の間で適宜組み合わせることができる。
【符号の説明】
【0276】
10 推薦システム
12 予測モデル
14 モデル
100 情報処理装置
102 プロセッサ
104 コンピュータ可読媒体
106 通信インターフェース
108 入出力インターフェース
110 バス
112 メモリ
114 ストレージ
120 推薦アイテムリスト生成プログラム
140 候補アイテム記憶部
142 推薦アイテムリスト記憶部
152 入力装置
154 表示装置
160 候補アイテム取得部
162 推薦アイテム選択部
164 推薦アイテムリスト生成部
D101 ドメイン
D102 ドメイン
D103 ドメイン
DS1 データセット
DS2 データセット
DS3 データセット
DS101 データセット
DS102 データセット
DS103 データセット
DS110 データセット
DS112 データセット
Dtg データ
IT 推薦アイテム
IT1 アイテム
IT2 アイテム
IT3 アイテム
IT101 推薦アイテム
IT102 推薦アイテム
IT131 推薦アイテム
IT132 推薦アイテム
IT133 推薦アイテム
IT201 推薦アイテム
IT202 推薦アイテム
IT203 推薦アイテム
IT204 推薦アイテム
IT205 推薦アイテム
IT206 推薦アイテム
IT301 推薦アイテム
IT302 推薦アイテム
IL 推薦アイテムリスト
IL100 推薦アイテムリスト
IL102 推薦アイテムリスト
IL104 推薦アイテムリスト
IL110 推薦アイテムリスト
IL112 推薦アイテムリスト
IL114 推薦アイテムリスト
IL120 推薦アイテムリスト
IL122 推薦アイテムリスト
IL136 推薦アイテムリスト
IL140 推薦アイテムリスト
IL142 推薦アイテムリスト
M1 モデル
M2 モデル
M3 モデル
M101 モデル
M102 モデル
M103 モデル
M201 モデル
M202 モデル
PIL100 候補リスト
PIL102 候補リスト
PIT 候補アイテム
S10からS14 情報処理方法の各工程
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34