2023-182380 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

2023-182380機械学習方法、情報処理システム、情報処理装置、サーバーおよびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023182380

(43)【公開日】2023-12-26

(54)【発明の名称】機械学習方法、情報処理システム、情報処理装置、サーバーおよびプログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20231219BHJP

【ＦＩ】

G06N20/00

【審査請求】未請求

【請求項の数】20

【出願形態】ＯＬ

(21)【出願番号】P 2022095950

(22)【出願日】2022-06-14

(71)【出願人】

【識別番号】306037311

【氏名又は名称】富士フイルム株式会社

(74)【代理人】

【識別番号】100083116

【弁理士】

【氏名又は名称】松浦憲三

(74)【代理人】

【識別番号】100170069

【弁理士】

【氏名又は名称】大原一樹

(74)【代理人】

【識別番号】100128635

【弁理士】

【氏名又は名称】松村潔

(74)【代理人】

【識別番号】100140992

【弁理士】

【氏名又は名称】松浦憲政

(72)【発明者】

【氏名】佐藤政寛

(72)【発明者】

【氏名】谷口友紀

(72)【発明者】

【氏名】大熊智子

(57)【要約】

【課題】情報推薦に用いる予測モデルを学習する際に複数の施設のデータを施設外において共有できない場合であっても、未知の他施設に対して性能が高いモデルを生成することができる機械学習方法、情報処理システム、情報処理装置、サーバーおよびプログラムを提供する。
【解決手段】１つ以上のプロセッサを含む情報処理システムが、複数の施設のそれぞれにおいて収集された施設ごとのデータを用いて施設ごとにユーザーのアイテムに対する行動を予測するローカルモデルを学習し、施設ごとに学習したローカルモデルのパラメータのモデル間の差を評価し、評価の結果に基づき、モデル間の差が小さくなるようにローカルモデルの学習を補正する。
【選択図】図１５

【特許請求の範囲】

【請求項1】

１つ以上のプロセッサを含む情報処理システムが実行する機械学習方法であって、
前記情報処理システムが、
複数の施設のそれぞれにおいて収集された施設ごとのデータを用いて前記施設ごとにユーザーのアイテムに対する行動を予測するローカルモデルを学習することと、
前記施設ごとに学習した前記ローカルモデルのパラメータのモデル間の差を評価することと、
前記評価の結果に基づき、前記モデル間の差が小さくなるように前記ローカルモデルの学習を補正することと、
を含む、機械学習方法。

【請求項2】

前記ローカルモデルの学習を補正することは、前記モデル間の差が小さくなるように前記パラメータを変更することを含む、
請求項１に記載の機械学習方法。

【請求項3】

前記ローカルモデルは交差特徴量を含み、
前記情報処理システムが、前記ローカルモデルの学習を補正する際に、前記交差特徴量の重みである前記パラメータの前記モデル間の差が小さくなるように前記パラメータを変更することを含む、
請求項２に記載の機械学習方法。

【請求項4】

前記ローカルモデルの学習を補正することは、前記ローカルモデルに含まれる複数の特徴量のうち前記パラメータの前記モデル間の差が相対的に小さい特徴量を選択し、前記パラメータの前記モデル間の差が相対的に大きい特徴量を前記ローカルモデルから削除することにより、前記ローカルモデルを変更することを含む、
請求項１に記載の機械学習方法。

【請求項5】

前記ローカルモデルは交差特徴量を含み、
前記情報処理システムが、前記ローカルモデルの学習を補正する際に、前記交差特徴量を含む前記複数の特徴量のうち前記交差特徴量の重みである前記パラメータの前記モデル間の差が相対的に小さい交差特徴量を選択し、前記パラメータの前記モデル間の差が相対的に大きい交差特徴量を削除することを含む、
請求項４に記載の機械学習方法。

【請求項6】

前記交差特徴量の重みは、各特徴量のエンベディング表現の関係によって表現される、請求項３または５に記載の機械学習方法。

【請求項7】

前記各特徴量のエンベディング表現の関係は、前記各特徴量を示すベクトルの内積である、請求項６に記載の機械学習方法。

【請求項8】

前記ローカルモデルは、ユーザー間およびアイテム間の少なくとも一方の関係性を基にした近傍ベースの協調フィルタリングを行うモデルであり、前記ローカルモデルの前記パラメータは、前記ユーザー間および前記アイテム間の少なくとも一方の前記関係性を示す相関係数を含む、
請求項１から５のいずれか一項に記載の機械学習方法。

【請求項9】

前記情報処理システムが、前記ローカルモデルの学習を補正する際に、前記モデル間で前記相関係数の差を小さくするように前記相関係数を変更することを含む、
請求項８に記載の機械学習方法。

【請求項10】

前記情報処理システムが、前記ローカルモデルの学習を補正する際に、前記ローカルモデルに含まれる複数の前記関係性のうち前記モデル間において前記相関係数の差が相対的に小さい関係性を選択し、前記モデル間において前記相関係数の差が相対的に大きい関係性を前記ローカルモデルから削除することを含む、
請求項８に記載の機械学習方法。

【請求項11】

前記情報処理システムは、
前記複数の施設のそれぞれに対応する前記ローカルモデルの学習を実行する複数の情報処理装置と、
電気通信回線を介して前記複数の情報処理装置のそれぞれと通信可能に接続されるサーバーと、を含み、
前記情報処理装置と前記サーバーとの間で前記施設ごとの前記データを通信することなく、前記ローカルモデルの前記パラメータおよび前記パラメータの更新量のうち少なくとも一方を通信する連合学習によって前記学習が行われる、
請求項１から５のいずれか一項に記載の機械学習方法。

【請求項12】

前記サーバーが、
前記複数の情報処理装置のそれぞれから前記ローカルモデルの前記パラメータを取得し、
前記ローカルモデルの前記パラメータの前記モデル間の差を評価し、
前記複数の情報処理装置のそれぞれに対して前記学習を補正する指示を行い、
前記複数の情報処理装置のそれぞれが、
前記指示に基づき前記ローカルモデルの前記パラメータの変更および特徴量の選択のうち少なくとも一方を行う、
請求項１１に記載の機械学習方法。

【請求項13】

前記ローカルモデルは、ユーザー間およびアイテム間の少なくとも一方の関係性を基にした近傍ベースの協調フィルタリングを行うモデルであり、前記ローカルモデルの前記パラメータは、前記ユーザー間および前記アイテム間の少なくとも一方の前記関係性を示す相関係数を含む、
請求項１１に記載の機械学習方法。

【請求項14】

１つ以上のプロセッサを含む情報処理システムであって、
前記１つ以上の前記プロセッサが、
複数の施設のそれぞれにおいて収集された施設ごとのデータを用いて前記施設ごとにユーザーのアイテムに対する行動を予測するローカルモデルを学習し、
前記施設ごとに学習した前記ローカルモデルのパラメータのモデル間の差を評価し、
前記評価の結果に基づき、前記モデル間の差が小さくなるように前記ローカルモデルの学習を補正する、
情報処理システム。

【請求項15】

前記複数の施設のそれぞれに対応する前記ローカルモデルの学習を実行する複数の情報処理装置と、
電気通信回線を介して前記複数の情報処理装置のそれぞれと通信可能に接続されるサーバーと、を含み、
前記複数の情報処理装置と前記サーバーとの間で前記施設ごとの前記データを通信することなく、前記ローカルモデルの前記パラメータおよび前記パラメータの更新量のうち少なくとも一方を通信する連合学習によって前記学習が行われる、
請求項１４に記載の情報処理システム。

【請求項16】

１つ以上の第１プロセッサと１つ以上の第１記憶装置とを含む情報処理装置であって、
前記１つ以上の前記第１プロセッサが、
第１施設において収集された第１データを用いて前記第１施設におけるユーザーのアイテムに対する行動を予測する第１ローカルモデルを学習し、
前記学習した前記第１ローカルモデルのパラメータをサーバーに送信し、
前記サーバーから、前記第１施設とは異なる第２施設において収集された第２データを用いて学習された第２ローカルモデルのパラメータとのモデル間の差が小さくなるように前記第１ローカルモデルの学習を補正する指示を受信し、
前記受信した前記指示に基づき前記第１ローカルモデルを更新する、
情報処理装置。

【請求項17】

１つ以上の第２プロセッサと１つ以上の第２記憶装置とを含むサーバーであって、
前記１つ以上の前記第２プロセッサが、
複数の施設のそれぞれに対応する複数の情報処理装置のそれぞれにおいて学習されたローカルモデルのパラメータを取得し、
前記施設ごとの前記ローカルモデルの前記パラメータのモデル間の差を評価し、
前記評価の結果に基づき、前記複数の情報処理装置のそれぞれに対して前記モデル間の差が小さくなるように前記ローカルモデルの学習を補正する指示を送信する、
サーバー。

【請求項18】

コンピュータに、
複数の施設のそれぞれにおいて収集された施設ごとのデータを用いて前記施設ごとにユーザーのアイテムに対する行動を予測するローカルモデルを学習する機能と、
前記施設ごとに学習した前記ローカルモデルのパラメータのモデル間の差を評価する機能と、
前記評価の結果に基づき、前記モデル間の差が小さくなるように前記ローカルモデルの学習を補正する機能と、
を実現させるプログラム。

【請求項19】

コンピュータに、
第１施設において収集された第１データを用いて前記第１施設におけるユーザーのアイテムに対する行動を予測する第１ローカルモデルを学習する機能と、
前記学習した前記第１ローカルモデルのパラメータをサーバーに送信する機能と、
前記サーバーから、前記第１施設とは異なる第２施設において収集された第２データを用いて学習された第２ローカルモデルのパラメータとのモデル間の差が小さくなるように前記第１ローカルモデルの学習を補正する指示を受信する機能と、
前記受信した前記指示に基づき前記第１ローカルモデルを更新する機能と、
を実現させるプログラム。

【請求項20】

コンピュータに、
複数の施設のそれぞれに対応する複数の情報処理装置のそれぞれにおいて学習されたローカルモデルのパラメータを取得する機能と、
前記施設ごとの前記ローカルモデルの前記パラメータのモデル間の差を評価する機能と、
前記評価の結果に基づき、前記複数の情報処理装置のそれぞれに対して前記モデル間の差が小さくなるように前記ローカルモデルの学習を補正する指示を送信する機能と、
を実現させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、機械学習方法、情報処理システム、情報処理装置、サーバーおよびプログラムに係り、特に、ドメインシフトにロバストな推薦を行う情報推薦技術および機械学習技術に関する。

【背景技術】

【0002】

ＥＣ（Electronic Commerce）サイトあるいは文書情報管理システムなど、様々なアイテムをユーザー（利用者）に提供するシステムにおいて、多くのアイテムの中からユーザーが自分に合ったベストなものを選ぶことは、時間的にも認知能力的にも難しい。ＥＣサイトにおけるアイテムは、ＥＣサイトで扱っている商品であり、文書情報管理システムにおけるアイテムは、システムに格納されている文書情報である。

【0003】

ユーザーによるアイテムの選択を補助するために、多くのアイテムの中から選択候補を提示する技術である情報推薦技術が研究されている。一般に、推薦システムをある施設等に導入する場合、導入先の施設等で収集したデータを基に推薦システムのモデルを学習する。しかし、学習に用いたデータが収集された施設と異なる施設に同じ推薦システムを導入すると、モデルの予測精度が低下してしまう問題がある。未知の他施設では機械学習モデルがうまく機能しない問題はドメインシフトと呼ばれ、ドメインシフトに対するロバスト性向上の研究であるドメイン汎化（Domain Generalization）に関して、近年、画像認識分野を中心に研究が活発化している。しかし、情報推薦技術においてドメイン汎化はまだ研究事例がほとんどない。

【0004】

機械学習の分野において、学習に用いるデータの秘匿性などの理由から、施設外にデータを持ち出すことができないことが多い。そのような場合に、データを各施設に留めたまま、人工知能（Artificial Intelligence：ＡＩ）のモデルのパラメータなどの受け渡しのみでモデルを学習する連合学習（Federated learning）の技術が研究されている。情報推薦の分野においても連合学習についての研究が行われている。例えば、非特許文献１では、グローバルモデルを訓練してから、ローカルモデルを訓練するアルゴリズムが提案されている。

【0005】

また、特許文献１には、病院の患者データのようにプライバシ等の観点から利用できるデータに制約がある場合に、ローカルプライベートデータの代わりに、各施設で疑似的なデータであるプロキシデータを生成してグローバルサーバーに共有する構成が記載されている。特許文献２に記載の技術によれば、秘匿性の高い実データ（プライベートデータ）を共有することなく、プロキシデータを用いてグローバルモデルを学習できる。

【0006】

特許文献２には、複数施設のデータを用いて特徴量選択を行う構成が記載されている。特許文献２に記載の技術は、推薦システムを想定しており、施設間で共通のユーザーサンプルのデータを基に勾配ブースティング回帰木（eXtreme Gradient Boosting：ＸＧＢｏｏｓｔ）などのツリーモデルの特徴量重要度を用いている。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特表２０１９－５２６８５１号公報

【特許文献2】特開２０２１－１２１９２２号公報

【非特許文献】

【0008】

【非特許文献1】A. Jalalirad, Marco Scavuzzo, Catalin Capota, Michael R. Sprague,“A Simple and Efficient Federated Recommender System”（BDCAT 2019）

【非特許文献2】Quande Liu, Cheng Chen, Jing Qin, Qi Dou, Pheng-Ann Heng,“FedDG: Federated Domain Generalization on Medical Image Segmentation via Episodic Learning in Continuous Frequency Space"(CVPR 2021)

【非特許文献3】Ivan Cantador, Ignacio Fenandez-Tobias, Shlomo Bwrkovsky, Paolo Cremonesi, Chapter 27:"Cross-domain Recommender System"(2015 Springer)

【発明の概要】

【発明が解決しようとする課題】

【0009】

非特許文献１および特許文献１－２に記載の手法はいずれも、学習に用いたデータが収集された施設（学習した施設）でのモデルの予測性能向上をめざしており、学習していない未知の施設に対するモデルの性能を担保できない。従来の連合学習の手法において、未知の他のドメインに対するロバスト性が担保できないという課題、すなわち、未知のドメインではモデルの性能が低下する、という課題については非特許文献２に示されている。

【0010】

非特許文献２は、医療画像セグメンテーションを行うモデルのドメイン汎化に関する内容であり、連合学習の上記課題に対し、画像信号を周波数空間に変換し、さらに振幅と位相とに分解する。振幅は画像スタイルなどの低次情報に対応し、位相は画像の意味に関連する高次情報に対応すると仮定して、振幅の分布をローカルモデル間で交換しながら学習することによりドメインシフトにロバストな連合学習を実現している。

【0011】

しかし、非特許文献２に記載の手法は画像データ固有の仮定に基づいており、情報推薦技術には適用できない。

【0012】

本開示はこのような事情に鑑みてなされたものであり、情報推薦に用いる予測モデルを学習する際に複数の施設のデータを施設外において共有できない場合であっても、未知の他施設に対して性能が高いモデルを生成することができる機械学習方法、情報処理システム、情報処理装置、サーバーおよびプログラムを提供することを目的とする。

【課題を解決するための手段】

【0013】

本開示の第１態様に係る機械学習方法は、１つ以上のプロセッサを含む情報処理システムが実行する機械学習方法であって、情報処理システムが、複数の施設のそれぞれにおいて収集された施設ごとのデータを用いて施設ごとにユーザーのアイテムに対する行動を予測するローカルモデルを学習することと、施設ごとに学習したローカルモデルのパラメータのモデル間の差を評価することと、評価の結果に基づき、モデル間の差が小さくなるようにローカルモデルの学習を補正することと、を含む。

【0014】

第１態様によれば、複数の施設のデータを集約することなく、施設ごとにそれぞれのデータを用いて施設単位でローカルモデルの学習を行うことができる。各施設において学習されたローカルモデルのパラメータの受け渡しにより、複数の施設のローカルモデルの情報を集約し、各ローカルモデルのパラメータのモデル間の差が評価される。そして、モデル間の差が小さくなるように、各ローカルモデルについての学習が補正される。このような処理の繰り返しにより、各ローカルモデルのモデル間の差は次第に小さくなっていく。モデル間の差が許容可能なレベルに小さくなるまで、各ローカルモデルの学習と補正とを繰り返すことで、施設によらない普遍的な関係性が学習され、施設の違いに対してロバストな性能を持つモデルが得られる。第１態様に係る機械学習方法は、情報推薦に適用されるモデルを生産する方法（製造方法）として理解することができる。

【0015】

モデルは、プロセッサに予測の機能を実現させるプログラムの概念を含む。情報処理システムは、例えば、複数のコンピュータを含むコンピュータシステムであってもよい。第１態様に係る機械学習方法は、分散コンピューティングによって実施されてもよい。施設は、例えば、企業、病院、店舗、行政機関、あるいはＥＣサイトなど、複数のユーザーを含んで構成される集団の概念を含む。複数の施設のそれぞれは互いに異なるドメインとなり得る。

【0016】

「ローカルモデルの学習を補正する」というの場合の「補正」は、学習したローカルモデルに対して変更を加えることの意味を含む。「変更」は「修正」の概念を含む。補正は、ローカルモデルのパラメータを変更することであってもよいし、ローカルモデルにおける特徴量を取捨選択することであってもよく、これらの組み合わせであってもよい。

【0017】

本開示の第２態様に係る機械学習方法は、第１態様の機械学習方法において、ローカルモデルの学習を補正することは、モデル間の差が小さくなるようにパラメータを変更することを含む構成であってもよい。

【0018】

本開示の第３態様に係る機械学習方法は、第２態様の機械学習方法において、ローカルモデルは交差特徴量を含み、情報処理システムが、ローカルモデルの学習を補正する際に、交差特徴量の重みであるパラメータのモデル間の差が小さくなるようにパラメータを変更することを含む構成であってもよい。

【0019】

本開示の第４態様に係る機械学習方法は、第１態様から第３態様のいずれか１つの態様に係る機械学習方法において、ローカルモデルの学習を補正することは、ローカルモデルに含まれる複数の特徴量のうちパラメータのモデル間の差が相対的に小さい特徴量を選択し、パラメータのモデル間の差が相対的に大きい特徴量をローカルモデルから削除することにより、ローカルモデルを変更することを含む構成であってもよい。

【0020】

情報処理システムは、例えば、パラメータのモデル間の差が基準値よりも大きい特徴量をローカルモデルから削除してもよいし、パラメータのモデル間の差が最も大きい特徴量あるいは差の大きい順に上位のいくつかの特徴量をローカルモデルから削除してもよい。

【0021】

本開示の第５態様に係る機械学習方法は、第４態様に係る機械学習方法において、ローカルモデルは交差特徴量を含み、情報処理システムが、ローカルモデルの学習を補正する際に、交差特徴量を含む複数の特徴量のうち交差特徴量の重みであるパラメータのモデル間の差が相対的に小さい交差特徴量を選択し、パラメータのモデル間の差が相対的に大きい交差特徴量を削除することを含む構成であってもよい。交差特徴量は特徴量の一形態である。

【0022】

本開示の第６態様に係る機械学習方法は、第３態様または第５態様に係る機械学習方法において、交差特徴量の重みは、各特徴量のエンベディング表現の関係によって表現される構成であってもよい。

【0023】

本開示の第７態様に係る機械学習方法は、第６態様に係る機械学習方法において、各特徴量のエンベディング表現の関係は、各特徴量を示すベクトルの内積であってもよい。

【0024】

本開示の第８態様に係る機械学習方法は、第１態様から第７態様のいずれか１つの態様に係る機械学習方法において、ローカルモデルは、ユーザー間およびアイテム間の少なくとも一方の関係性を基にした近傍ベースの協調フィルタリングを行うモデルであり、ローカルモデルのパラメータは、ユーザー間およびアイテム間の少なくとも一方の関係性を示す相関係数を含む構成であってもよい。

【0025】

本開示の第９態様に係る機械学習方法は、第８態様に係る機械学習方法において、情報処理システムが、ローカルモデルの学習を補正する際に、モデル間で相関係数の差を小さくするように相関係数を変更することを含む構成であってもよい。

【0026】

本開示の第１０態様に係る機械学習方法は、第８態様または第９態様に係る機械学習方法において、情報処理システムが、ローカルモデルの学習を補正する際に、ローカルモデルに含まれる複数の関係性のうちモデル間において相関係数の差が相対的に小さい関係性を選択し、モデル間において相関係数の差が相対的に大きい関係性をローカルモデルから削除することを含む構成であってもよい。

【0027】

本開示の第１１態様に係る機械学習方法は、第１態様から第１０態様のいずれか１つの態様において、情報処理システムは、複数の施設のそれぞれに対応するローカルモデルの学習を実行する複数の情報処理装置と、電気通信回線を介して複数の情報処理装置のそれぞれと通信可能に接続されるサーバーと、を含み、情報処理装置とサーバーとの間で施設ごとのデータを通信することなく、ローカルモデルのパラメータおよびパラメータの更新量のうち少なくとも一方を通信する連合学習によって学習が行われる構成であってもよい。

【0028】

本開示の第１２態様に係る機械学習方法は、第１１態様に係る機械学習方法において、サーバーが、複数の情報処理装置のそれぞれからローカルモデルのパラメータを取得し、ローカルモデルのパラメータのモデル間の差を評価し、複数の情報処理装置のそれぞれに対して学習を補正する指示を行い、複数の情報処理装置のそれぞれが、指示に基づきローカルモデルのパラメータの変更および特徴量の選択のうち少なくとも一方を行う構成であってもよい。

【0029】

本開示の第１３態様に係る機械学習方法は、第１１態様または第１２態様に係る機械学習方法において、ローカルモデルは、ユーザー間およびアイテム間の少なくとも一方の関係性を基にした近傍ベースの協調フィルタリングを行うモデルであり、ローカルモデルのパラメータは、ユーザー間およびアイテム間の少なくとも一方の関係性を示す相関係数を含む構成であってもよい。

【0030】

本開示の第１４態様に係る情報処理システムは、１つ以上のプロセッサを含む情報処理システムであって、１つ以上のプロセッサが、複数の施設のそれぞれにおいて収集された施設ごとのデータを用いて施設ごとにユーザーのアイテムに対する行動を予測するローカルモデルを学習し、施設ごとに学習したローカルモデルのパラメータのモデル間の差を評価し、評価の結果に基づき、モデル間の差が小さくなるようにローカルモデルの学習を補正する。

【0031】

第１４態様に係る情報処理システムは、情報推薦に適用される予測モデルを生成するための機械学習システムとして理解することができる。情報処理システムは、集中システムであってもよいし、分散システムであってもよい。

【0032】

第１４態様に係る情報処理システムにおいて、上述した第２態様から第１３態様のいずれか１つの態様に係る情報処理方法と同様の具体的態様を含む構成とすることができる。

【0033】

本開示の第１５態様に係る情報処理システムは、第１４態様に係る情報処理システムにおいて、複数の施設のそれぞれに対応するローカルモデルの学習を実行する複数の情報処理装置と、電気通信回線を介して複数の情報処理装置のそれぞれと通信可能に接続されるサーバーと、を含み、複数の情報処理装置とサーバーとの間で施設ごとのデータを通信することなく、ローカルモデルのパラメータおよびパラメータの更新量のうち少なくとも一方を通信する連合学習によって学習が行われる構成であってもよい。

【0034】

本開示の第１６態様に係る情報処理装置は、１つ以上の第１プロセッサと１つ以上の第１記憶装置とを含む情報処理装置であって、１つ以上の第１プロセッサが、第１施設において収集された第１データを用いて第１施設におけるユーザーのアイテムに対する行動を予測する第１ローカルモデルを学習し、学習した第１ローカルモデルのパラメータをサーバーに送信し、サーバーから、第１施設とは異なる第２施設において収集された第２データを用いて学習された第２ローカルモデルのパラメータとのモデル間の差が小さくなるように第１ローカルモデルの学習を補正する指示を受信し、受信した指示に基づき第１ローカルモデルを更新する。

【0035】

互いに異なる複数の第１施設のそれぞれに対して第１６態様に係る情報処理装置が配置され得る。情報処理装置は、サーバーと連携して第１ローカルモデルの学習を行う学習装置として機能し得る。

【0036】

第１６態様に係る情報処理装置において、上述した第２態様から第１３態様のいずれか１つの態様に係る情報処理方法と同様の具体的態様を含む構成とすることができる。

【0037】

本開示の第１７態様に係るサーバーは、１つ以上の第２プロセッサと１つ以上の第２記憶装置とを含むサーバーであって、１つ以上の第２プロセッサが、複数の施設のそれぞれに対応する複数の情報処理装置のそれぞれにおいて学習されたローカルモデルのパラメータを取得し、施設ごとのローカルモデルのパラメータのモデル間の差を評価し、評価の結果に基づき、複数の情報処理装置のそれぞれに対してモデル間の差が小さくなるようにローカルモデルの学習を補正する指示を送信する。

【0038】

第１７態様によれば、複数の情報処理装置のそれぞれにおいて学習された各ローカルモデルのパラメータがサーバーに集約され、サーバーにおいて、施設ごとのローカルモデルのパラメータのモデル間の差が評価される。サーバーは、モデル間の差が小さくなるように各ローカルモデルの学習を補正するように各情報処理装置における学習の動作を制御する。サーバーは、複数の情報処理装置のそれぞれにおけるローカルモデルの学習を統括的に制御する中央サーバーの役割を果たし得る。サーバーは、複数の情報処理装置のそれぞれにおいて学習された複数のローカルモデルのパラメータを集約して、グローバルモデルを生成してもよい。

【0039】

第１７態様に係る情報処理装置において、上述した第２態様から第１３態様のいずれか１つの態様に係る情報処理方法と同様の具体的態様を含む構成とすることができる。

【0040】

本開示の第１８態様に係るプログラムは、コンピュータに、複数の施設のそれぞれにおいて収集された施設ごとのデータを用いて施設ごとにユーザーのアイテムに対する行動を予測するローカルモデルを学習する機能と、施設ごとに学習したローカルモデルのパラメータのモデル間の差を評価する機能と、評価の結果に基づき、モデル間の差が小さくなるようにローカルモデルの学習を補正する機能と、を実現させる。

【0041】

第１８態様におけるコンピュータには、分散システムの概念が含まれる。第１８態様に係るプログラムにおいて、上述した第２態様から第１３態様のいずれか１つの態様に係る情報処理方法と同様の具体的態様を含む構成とすることができる。

【0042】

本開示の第１９態様に係るプログラムは、コンピュータに、第１施設において収集された第１データを用いて第１施設におけるユーザーのアイテムに対する行動を予測する第１ローカルモデルを学習する機能と、学習した第１ローカルモデルのパラメータをサーバーに送信する機能と、サーバーから、第１施設とは異なる第２施設において収集された第２データを用いて学習された第２ローカルモデルのパラメータとのモデル間の差が小さくなるように第１ローカルモデルの学習を補正する指示を受信する機能と、受信した指示に基づき第１ローカルモデルを更新する機能と、を実現させる。

【0043】

第１９態様に係るプログラムにおいて、上述した第２態様から第１３態様のいずれか１つの態様に係る情報処理方法と同様の具体的態様を含む構成とすることができる。

【0044】

本開示の第２０態様に係るプログラムは、コンピュータに、複数の施設のそれぞれに対応する複数の情報処理装置のそれぞれにおいて学習されたローカルモデルのパラメータを取得する機能と、施設ごとのローカルモデルのパラメータのモデル間の差を評価する機能と、評価の結果に基づき、複数の情報処理装置のそれぞれに対してモデル間の差が小さくなるようにローカルモデルの学習を補正する指示を送信する機能と、を実現させる。

【0045】

第２０態様に係るプログラムにおいて、上述した第２態様から第１３態様のいずれか１つの態様に係る情報処理方法と同様の具体的態様を含む構成とすることができる。

【発明の効果】

【0046】

本開示によれば、施設ごとに学習されるローカルモデルのパラメータのモデル間の差を評価し、モデル間の差を小さくするように各ローカルモデルの学習を補正するため、複数の施設のデータを施設外において共有できない場合であっても、施設の違いに対してロバストな性能を持つモデルを生成することが可能になる。これにより、学習に用いたデータを収集した施設とは異なる未知の他施設に対しても性能が高いモデルを得ることができる。

【図面の簡単な説明】

【0047】

【図1】図１は、典型的な推薦システムの概念図である。

【図2】図２は、推薦システムの構築に広く用いられている教師あり機械学習の例を示す概念図である。

【図3】図３は、推薦システムの典型的な導入フローを示す説明図である。

【図4】図４は、導入先の施設のデータが得られない場合における推薦システムの導入フローの説明図である。

【図5】図５は、ドメイン適応によるモデルの学習を行う場合の説明図である。

【図6】図６は、学習したモデルの性能を評価するステップを含む推薦システム導入フローの説明図である。

【図7】図７は、機械学習に用いる学習用データと評価用データの例を示す説明図である。

【図8】図８は、データセットの違いによるモデルの性能の違いを模式的に示すグラフである。

【図9】図９は、一般的な連合学習の概念図である。

【図10】図１０は、連合学習においてグローバルモデルを訓練した後にローカルモデルを訓練する仕組みの概念図である。

【図11】図１１は、本開示の実施形態に係る機械学習方法の概要を示す説明図である。

【図12】図１２は、実施形態に係る機械学習システムの全体構成の例を示すブロック図である。

【図13】１３は、ローカル学習装置として機能する情報処理装置のハードウェア構成の例を示すブロック図である。

【図14】図１４は、グローバルサーバーのハードウェア構成の例を示すブロック図である。

【図15】図１５は、実施形態に係る機械学習システムによって行われる機械学習方法の第１例の概要を示す説明図である。

【図16】図１６は、実施形態に係る機械学習方法の第１例を示すフローチャートである。

【図17】図１７は、ローカル学習装置として機能する情報処理装置の機能的構成の例１を示す機能ブロック図である。

【図18】図１８は、グローバルサーバーの機能的構成の例１を示す機能ブロック図である。

【図19】図１９は、機械学習システムによって行われる機械学習方法の第２例の概要を示す説明図である。

【図20】図２０は、ドメインｄ１におけるユーザー属性とアイテム属性のそれぞれのベクトル表現の例を示す説明図である。

【図21】図２１は、ローカル学習装置として機能する情報処理装置の機能的構成の例２を示す機能ブロック図である。

【図22】図２２は、グローバルサーバーの機能的構成の例２を示す機能ブロック図である。

【図23】図２３は、ある企業１におけるユーザーのアイテムに対する行動履歴のデータの例を示す図表である。

【発明を実施するための形態】

【0048】

以下、添付図面に従って本発明の好ましい実施形態について説明する。

【0049】

《情報推薦技術の概説》
はじめに、情報推薦技術の概要と課題について具体例を示して概説する。情報推薦技術は、ユーザーに対してアイテムを推薦（サジェスト）するための技術である。

【0050】

図１は、典型的な推薦システム１０の概念図である。推薦システム１０は、ユーザーの情報と、コンテキストの情報とを入力として受け付け、コンテキストに応じて当該ユーザーに推薦するアイテムの情報を出力する。コンテキストは、様々な「状況」を意味し、例えば、曜日、時間帯、または天気などがあり得る。アイテムは、例えば、本、動画、飲食店など、様々な対象があり得る。

【0051】

推薦システム１０は、複数のアイテムを同時に推薦するのが一般的である。図１では、推薦システム１０が３つのアイテムＩＴ１、ＩＴ２、ＩＴ３を推薦する例が示されている。推薦したアイテムＩＴ１、ＩＴ２、ＩＴ３に対してユーザーがポジティブな反応をすると、一般に推薦は成功したとみなされる。ポジティブな反応とは、例えば、購入、視聴、または訪問などである。このような推薦技術は、例えば、ＥＣサイトや飲食店を紹介するグルメサイトなどにおいて広く活用されている。

【0052】

推薦システム１０は、機械学習の技術を用いて構築される。図２は、推薦システム１０の構築に広く用いられている教師あり機械学習の例を示す概念図である。一般には、過去のユーザーの行動履歴を基に正例および負例を用意して、ユーザーとコンテキストとの組み合わせを予測モデル１２に入力し、予測誤差が小さくなるように予測モデル１２を訓練する。例えば、ユーザーが閲覧した閲覧アイテムを正例、閲覧しなかった非閲覧アイテムを負例とする。予測誤差が収束するまで機械学習が行われ、目標とする予測性能が獲得される。

【0053】

こうして訓練された学習済み（訓練済み）の予測モデル１２を用いて、ユーザーとコンテキストの組合せに対して予測される閲覧確率が高いアイテムを推薦する。例えば、学習済みの予測モデル１２に対し、あるユーザーＡとコンテキストβとの組合せを入力すると、予測モデル１２は、ユーザーＡがコンテキストβの条件の下でアイテムＩＴ３のような文書を閲覧する確率が高いと推論し、当該ユーザーＡに対してアイテムＩＴ３に近いアイテムを推薦する。なお、推薦システム１０の構成によっては、コンテキストを考慮せずにユーザーに対してアイテムを推薦することも多い。

【0054】

〔推薦システムの開発に用いるデータの例〕
ユーザーの行動履歴は、機械学習における「正解データ」と略等しいものである。厳密には、過去の行動履歴から次の（未知の）行動を推論するというタスク設定と理解されるが、過去の行動履歴を基に潜在的な特徴量を学習するのが一般的である。

【0055】

ユーザーの行動履歴としては、例えば、本の購入履歴、動画の視聴履歴、または飲食店の訪問履歴などがあり得る。

【0056】

また、主要な特徴量としては、ユーザー属性と、アイテム属性とがある。ユーザー属性は、例えば、性別、年代、職業、家族構成、および居住エリアなど、様々な要素があり得る。アイテム属性は、例えば、本のジャンル、値段、動画のジャンル、長さ、飲食店のジャンル、場所など様々な要素があり得る。

【0057】

〔モデルの構築と運用〕
図３は、推薦システムの典型的な導入フローを示す説明図である。ここでは、ある施設に推薦システムを導入する際の典型的なフローを示す。推薦システムの導入は、まず、目的の推薦タスクを行うモデル１４を構築し（ステップ１）、その後、構築したモデル１４を導入して運用する（ステップ２）。モデル１４を「構築する」とは、機械学習モデルの場合、学習（訓練）用のデータを用いてモデル１４の学習を行い、実用レベルの推薦性能を満たす予測モデル（推薦モデル）を作成することを含む。モデル１４を「運用する」とは、例えば、ユーザーとコンテキストとの組合せの入力に対して、学習済みのモデル１４から推薦アイテムリストの出力を得ることである。

【0058】

モデル１４の構築には、学習用のデータが必要である。図３に示すように、一般に推薦システムのモデル１４は、導入先の施設で収集したデータを基に学習が行われる。導入先の施設から収集されたデータを用いて学習を行うことにより、モデル１４は導入先の施設のユーザーの振る舞いを学習し、導入先の施設のユーザーに対して精度のよい推薦アイテムの予測が可能である。

【0059】

しかし、様々な事情により、導入先の施設のデータが得られない場合がある。例えば、企業の社内システムや病院の院内システムにおける文書情報推薦システムなどの場合、推薦モデルを開発する企業が導入先の施設のデータにアクセスできないことが多い。導入先の施設のデータが得られない場合、代わりに、異なる施設で収集されたデータをもとに学習する必要がある。

【0060】

図４は、導入先の施設のデータが得られない場合における推薦システムの導入フローの説明図である。導入先の施設とは異なる施設で収集されたデータを用いて学習したモデル１４を挿入先の施設で運用すると、施設間のユーザーの振る舞いの違いなどにより、モデル１４の予測精度が低下してしまう問題がある。

【0061】

学習した施設と異なる未知の他施設では機械学習モデルがうまく機能しない問題は、広義にはモデル１４を学習したソースドメインと、モデル１４を適用するターゲットドメインが異なるドメインシフトの問題に対するロバスト性を向上させるという技術課題として把握される。ドメイン汎化（Domain generalization）に関連する問題設定として、ドメイン適応（Domain adaptation）がある。これはソースドメインとターゲットドメインの両方のデータを用いて学習する方法である。ターゲットドメインのデータが存在するにもかかわらず異なるドメインのデータを使う目的は、ターゲットドメインのデータ量が少なく学習に不十分であるのを補うためである。

【0062】

図５は、ドメイン適応によるモデル１４の学習を行う場合の説明図である。ターゲットドメインである導入先の施設で収集されたデータのデータ量は、異なる施設で収集されたデータよりもデータ量に比べて相対的に少ないものの、両方のデータを用いて学習を行うことにより、モデル１４は、導入先の施設のユーザーの振る舞いについてもある程度の精度で予測することが可能になる。

【0063】

〔ドメインの説明〕
上記の「施設」の違いはドメインの違いの一種である。情報推薦におけるドメイン適応の研究に関する文献である非特許文献３（Ivan Cantador et al, Chapter 27:"Cross-domain Recommender System"）では、ドメインの違いが以下の４つに分類されている。

【0064】

［１］アイテム属性レベル（Item attribute level）：例えば、コメディ映画とホラー映画は別ドメイン。

【0065】

［２］アイテムタイプレベル（Item type level）：例えば、映画と連続テレビドラマは別ドメイン。

【0066】

［３］アイテムレベル（Item level）：例えば、映画と本は別ドメイン。

【0067】

［４］システムレベル（System level）：例えば、映画館の映画とテレビ放映の映画は別ドメイン。

【0068】

図５等に示す「施設」の違いは、上記の４分類のうちの［４］システムレベルのドメインに該当する。

【0069】

フォーマルにドメインを定義すると、ドメインは目的変数Ｙと説明変数Ｘの同時確率分布Ｐ（Ｘ，Ｙ）で規定され、Ｐｄ１（Ｘ，Ｙ）≠ Ｐｄ２(Ｘ，Ｙ)のとき、ｄ１とｄ２は異なるドメインである。

【0070】

同時確率分布Ｐ（Ｘ，Ｙ）は、説明変数の分布Ｐ（Ｘ）と条件付き確率分布Ｐ（Ｙ｜Ｘ）との積、又は目的変数の分布Ｐ（Ｙ）と条件付き確率分布Ｐ（Ｙ｜Ｘ）との積で表すことができる。

【0071】

Ｐ（Ｘ，Ｙ）＝Ｐ（Ｙ｜Ｘ）Ｐ（Ｘ）＝Ｐ（Ｘ｜Ｙ）Ｐ（Ｙ）
したがって、Ｐ（Ｘ）、Ｐ（Ｙ）、Ｐ（Ｙ｜Ｘ）及びＰ（Ｘ｜Ｙ）のうち１つ以上が変わると異なるドメインとなる。

【0072】

〔ドメインシフトの典型パターン〕
［共変量シフト］説明変数の分布Ｐ（Ｘ）が異なる場合、共変量シフト（Covariate shift）と呼ばれる。例えば、データセット間でユーザー属性の分布が異なる場合、より具体的には男女比率が異なる場合などが共変量シフトに該当する。

【0073】

［事前確率シフト］目的変数の分布Ｐ（Ｙ）が異なる場合、事前確率シフト（Prior probability shift）と呼ばれる。例えば、データセット間で平均閲覧率や平均購入率が異なる場合などが事前確率シフトに該当する。

【0074】

［コンセプトシフト］条件付き確率分布Ｐ（Ｙ｜Ｘ）及びＰ（Ｘ｜Ｙ）が異なる場合、コンセプトシフト（Concept shift）と呼ばれる。例えば、ある企業の研究開発部門がデータ分析資料を読む確率がＰ（Ｙ｜Ｘ）にあたるが、これがデータセット間で異なる場合などがコンセプトシフトに該当する。

【0075】

ドメイン適応あるいはドメイン汎化性の研究は、上記いずれかのパターンを主要因として想定しているものと、特にどのパターンが主要因であるかを考慮せずにＰ（Ｘ，Ｙ）が変化していることへの対処を考えるものと、がある。なお、前者の場合、特に、共変量シフトを想定しているものが多い。

【0076】

〔ドメインシフトが影響する理由〕
予測あるいは分類のタスクを行う予測／分類モデルは、説明変数Ｘと目的変数Ｙの関係性に基づいて推論を行うため、Ｐ（Ｙ｜Ｘ）が変化すれば当然、予測／分類性能は低下する。また、予測／分類モデルを機械学習する際には学習データ内において予測／分類誤差の最小化を行うが、例えば、説明変数がＸ＝Ｘ_１になる頻度が、Ｘ＝Ｘ_２になる頻度より大きいとき、つまりＰ（Ｘ＝Ｘ_１）＞Ｐ（Ｘ＝Ｘ_２）であるとき、Ｘ＝Ｘ_１のデータの方がＸ＝Ｘ_２のデータより多いので、Ｘ＝Ｘ_１の誤差低減はＸ＝Ｘ_２の誤差低減より優先して学習される。そのためＰ（Ｘ）が施設間で変化する場合も、予測／分類性能は低下する。

【0077】

ドメインシフトは、情報推薦に限らず、いろいろなタスクのモデルについて問題になり得る。例えば、社員の退職リスクを予測するモデルについて、ある企業のデータを用いて学習した予測モデルを別の企業で運用する場合にドメインシフトが問題になり得る。

【0078】

また、細胞の抗体生産量を予測するモデルについて、ある抗体のデータを用いて学習したモデルを、別の抗体で運用する場合にドメインシフトが問題になり得る。また、顧客の声（Voice of Customer：ＶＯＣ）を分類するモデル、例えば、ＶＯＣを「商品機能」、「サポート対応」、および「その他」に分類するモデルについて、ある商品に関するデータを用いて学習した分類モデルを別の商品で運用する場合にドメインシフトが問題になり得る。

【0079】

〔モデルの導入前評価について〕
学習したモデル１４を実際の施設等に導入する前に、モデル１４の性能評価を行うことが多い。性能評価は導入の可否判断や、モデルあるいは学習手法などの研究開発のために必要である。

【0080】

図６は、学習したモデル１４の性能を評価するステップを含む推薦システム導入フローの説明図である。図６では、図５で説明したステップ１（モデル１４を学習するステップ）とステップ２（モデル１４を運用するステップ）との間に、「ステップ１．５」として、モデル１４の性能を評価するステップが追加されている。その他の構成は図５と同様である。図６に示すように、一般的な推薦システム導入のフローでは、導入先の施設で収集されたデータを学習用データと評価用データとに分割することが多い。評価用データを用いてモデル１４の予測性能を確認してから、モデル１４の運用が開始される。

【0081】

しかし、ドメイン汎化のモデル１４を構築する場合は、学習用データと評価用データは異なるドメインである必要がある。さらに、ドメイン汎化においては、学習用データについても複数ドメインのデータを用いることが好ましく、学習に使えるドメインが多い方がより好ましい。

【0082】

〔汎化性について〕
図７は、機械学習に用いる学習用データと評価用データの例を示す説明図である。あるドメインｄ１の同時確率分布Ｐｄ１（Ｘ，Ｙ）から得られるデータセットは、学習用データと、評価用データとに分けられる。学習用データと同一ドメインの評価用データを「第１の評価用データ」といい、図７において「評価用データ１」と表記する。また、ドメインｄ１と異なるドメインｄ２の同時確率分布Ｐｄ２（Ｘ，Ｙ）から得られるデータセットを用意し、これを評価用データとして用いる。学習用データと異なるドメインの評価用データを「第２の評価用データ」といい、図７において「評価用データ２」と表記する。

【0083】

ドメインｄ１の学習用データを用いてモデル１４の学習が行われ、ドメインｄ１の第１の評価用データと、ドメインｄ２の第２の評価用データとのそれぞれを用いて学習済みのモデル１４の性能が評価される。

【0084】

図８は、データセットの違いによるモデルの性能の違いを模式的に示すグラフである。学習用データ内でのモデル１４の性能を性能Ａ、第１の評価用データでのモデル１４の性能を性能Ｂ、第２の評価用データでのモデル１４の性能を性能Ｃとすると、通常は、図８のように、性能Ａ＞性能Ｂ＞性能Ｃのような関係になる。

【0085】

モデル１４の汎化性能の高さは一般には、性能Ｂが高いこと、または性能ＡとＢの差が小さいことを指す。つまり、学習用データに過剰適合せずに、学習していないデータに対しても予測の性能が高いことを目指している。

【0086】

本明細書におけるドメイン汎化性の文脈では、性能Ｃが高いこと、または性能Ｂと性能Ｃの差が小さいことを指す。つまり、学習に用いたドメインと異なるドメインでも、変わらずに高い性能が出ることを目指している。

【0087】

〔課題の説明〕
本実施形態では、情報推薦を行うシステムに適用されるモデルを学習する際に複数の施設のそれぞれにおいて収集されたデータを各施設から持ち出すことができない場合を想定し、学習に用いるデータが収集される施設とは異なる未知の他の施設においても高性能な情報推薦を実現できるドメインシフトにロバストなモデルを得る手段を提供する。

【0088】

図９は、一般的な連合学習の概念図である。ここでは、複数の施設の例として施設１から施設３の３つの施設を例に示す。施設の数は２以上の任意の数であってよい。施設の種類は問わず、例えば、企業であってもよいし、病院であってもよいし、小売店などの店舗などであってもよい。以下、施設を区別するインデックス番号ｋを用いて、「施設ｋ」などと表記する。

【0089】

各施設ｋにおいて収集されたデータをその施設に留めたまま、施設ごとにローカルモデルＬＭｋの学習が行われる。各施設ｋにおいてローカルモデルＬＭｋの学習処理を実行する情報処理装置（以下、ローカル学習装置という。）は、図示せぬ電気通信回線を介してグローバルサーバーと通信可能に接続される。グローバルサーバーは、各ローカルモデルＬＭｋのパラメータを収集してパラメータを統合し、グローバルモデルＧＭを生成する。グローバルサーバーは、グローバルモデルＧＭのパラメータを各施設ｋのローカル学習装置に送り、ローカルモデルＬＭｋのパラメータに反映させることができる。このような連合学習では、全施設に共通のグローバルモデルＧＭの性能向上を目指す方法と、施設ごとのローカルモデルＬＭｋの性能向上を目指す方法とがある。

【0090】

図１０は、連合学習においてグローバルモデルＧＭを訓練した後にローカルモデルＬＭｋを訓練する仕組みの概念図である。図１０の左側はグローバルモデルＧＭの学習プロセスであるグローバルエポックを表しており、図１０の右側は個々のローカルモデルＬＭｋの学習プロセスであるローカルエポックを表している。

【0091】

グローバルエポックにおいてグローバルサーバーＧＳＶは、個々のローカルモデルＬＭｋのパラメータを集約（例えば、平均）して、グローバルモデルＧＭを学習する。その後のローカルエポックにおいて、各施設ｋのローカル学習装置は、グローバルモデルＧＭとのパラメータのやり取り（受け渡し）を遮断し、施設ごとに個々のローカルモデルＬＭｋを学習する。

【0092】

図１０のような方法は、個々の施設ｋでのローカルモデルＬＭｋの性能向上を目指しており、施設ｋ以外の他の（未知の）施設に対するモデルの性能は担保されない。

【0093】

〔実施形態に係る機械学習方法の概要〕
図１１は、本開示の実施形態に係る機械学習方法の概要を示す説明図である。図１１において、各ローカルモデルＬＭｋの学習を行った施設ｋとは異なる未知の施設（学習されていない施設）を施設ＵＦと表記している。

【0094】

本実施形態では、未知の施設ＵＦに対する性能が高くなるようにモデルを学習する。そのために、複数の施設ｋのローカルモデルＬＭｋ間の差が小さくなるように各ローカルモデルＬＭｋの学習の仕方を制御する。具体的な制御の方法の例は後述するが、基本的な考え方は下記のとおりである。すなわち、情報推薦に適用するモデルにおける説明変数と目的変数との関係性には、各施設固有のものと施設によらない普遍的なものとがある。施設固有の関係性を基にした予測を各ローカルモデルＬＭｋが学習すると、ローカルモデルＬＭｋ間の差が大きくなる。逆に、施設によらない普遍的な関係性を基にした予測を各ローカルモデルＬＭｋが学習した場合は、ローカルモデルＬＭｋ間の差が小さくなる。そのため、本実施形態においては、異なる施設のローカルモデルＬＭｋ間の差が小さくなるように学習を制御することで、施設によらない普遍的な関係性を学習するように誘導する。これにより、施設の違いに対してロバストな予測性能を持つモデルを得ることができる。

【0095】

〔機械学習システムの構成例〕
図１２は、実施形態に係る機械学習システム５０の全体構成の例を示すブロック図である。機械学習システム５０は、複数の施設ｋ（ｋ＝１，２，・・・ｎ）のそれぞれに対応した複数のローカル学習装置ＬＴｋと、電気通信回線５２を介して各ローカル学習装置ＬＴｋと通信可能に接続されるグローバルサーバーＧＳＶと、を含む。電気通信回線５２は、インターネットなどのワイドエリアネットワークを含む構成であってよい。機械学習システム５０は、本開示における「情報処理システム」の一例である。

【0096】

ローカル学習装置ＬＴｋは、施設ｋにて収集されたローカルデータＬＤｋを用いて施設ｋごとにローカルモデルＬＭｋを学習する処理を行う情報処理装置である。ローカル学習装置ＬＴｋは、例えば、施設ｋのローカルエリアネットワーク上に構築されるサーバーであってもよいし、あるいは施設ｋ内のデータにアクセス可能な端末装置であってもよい。

【0097】

ローカルデータＬＤｋは、施設ｋにおける複数のユーザーの複数のアイテムに対する行動履歴を含む。各施設ｋのローカルデータＬＤｋは、施設ｋの外部へ持ち出しが制限されており、異なる施設間でデータを共有することができないものとする。各施設ｋのローカルデータＬＤｋは、それぞれの施設ｋにおいて保持され、グローバルサーバーＧＳＶは、ローカル学習装置ＬＴｋや他の施設ｋ内の装置からローカルデータＬＤｋを受け取ることができない。ローカルデータＬＤｋは本開示における「施設ごとのデータ」の一例である。

【0098】

ローカルモデルＬＭｋは、ユーザーのアイテムに対する行動を予測するように、ローカルデータＬＤｋを学習データとして用いて訓練される学習モデルである。各ローカル学習装置ＬＴｋは、ローカルモデルＬＭｋのパラメータ更新を行うパラメータ演算部６２と、通信部６４とを備える。パラメータ演算部６２は、パラメータの更新量を算出する処理と、パラメータを更新する処理とを行う。通信部６４は、電気通信回線５２に接続してグローバルサーバーＧＳＶとの間で情報の受け渡しを行う通信インターフェースを含む。

【0099】

グローバルサーバーＧＳＶは、通信部７２と、モデル間差評価部７４と、学習補正部７８と、グローバルモデル生成部８０と、を含む。通信部７２は、電気通信回線５２に接続して各ローカル学習装置ＬＴｋとの間で情報の受け渡しを行う通信インターフェースを含む。モデル間差評価部７４は、ローカル学習装置ＬＴｋから受信したローカルモデルＬＭｋの情報を基にモデル間差を評価する処理を行う。モデル間差評価部７４は、複数のローカルモデルＬＭｋのパラメータ値を用いてモデル間差の評価に必要な演算を行うパラメータ演算部７５を含む。学習補正部７８は、モデル間差評価部７４による評価結果に基づきローカル学習装置ＬＴｋによる学習を補正する制御等を行う。

【0100】

グローバルモデル生成部８０は、モデル間差評価部７４による評価結果に基づき複数のローカルモデルＬＭｋからグローバルモデルを生成する処理を行う。

【0101】

［ローカル学習装置の構成例］
図１３は、ローカル学習装置ＬＴｋとして機能する情報処理装置１００のハードウェア構成の例を示すブロック図である。情報処理装置１００は、コンピュータのハードウェアとソフトウェアとを用いて実現できる。情報処理装置１００の物理的形態は特に限定されず、サーバーであってもよいし、ワークステーションであってもよく、パーソナルコンピュータあるいはタブレット端末などであってもよい。ここでは、１台のコンピュータを用いて情報処理装置１００の処理機能を実現する例を述べるが、情報処理装置１００の処理機能は、複数のコンピュータを用いて構成されるコンピュータシステムによって実現してもよい。

【0102】

情報処理装置１００は、プロセッサ１０２と、非一時的な有体物であるコンピュータ可読媒体１０４と、通信インターフェース１０６と、入出力インターフェース１０８と、バス１１０と、を含む。

【0103】

プロセッサ１０２は、ＣＰＵ（Central Processing Unit）を含む。プロセッサ１０２はＧＰＵ（Graphics Processing Unit）を含んでもよい。プロセッサ１０２は、バス１１０を介してコンピュータ可読媒体１０４、通信インターフェース１０６および入出力インターフェース１０８と接続される。プロセッサ１０２は、コンピュータ可読媒体１０４に記憶された各種のプログラムおよびデータ等を読み出し、各種の処理を実行する。プログラムという用語は、プログラムモジュールの概念を含み、プログラムに準じる命令を含む。プロセッサ１０２は本開示における「第１プロセッサ」の一例である。コンピュータ可読媒体１０４は本開示における「第１記憶装置」の一例である。

【0104】

コンピュータ可読媒体１０４は、例えば、主記憶装置であるメモリ１１２および補助記憶装置であるストレージ１１４を含む記憶装置である。ストレージ１１４は、例えば、ハードディスクドライブ（Hard Disk Drive：ＨＤＤ）装置、ソリッドステートドライブ（Solid State Drive：ＳＳＤ）装置、光ディスク、光磁気ディスク、もしくは半導体メモリ、またはこれらの適宜の組み合わせを用いて構成される。ストレージ１１４には、各種プログラムやデータ等が記憶される。

【0105】

メモリ１１２は、プロセッサ１０２の作業領域として使用され、ストレージ１１４から読み出されたプログラムおよび各種のデータを一時的に記憶する記憶部として用いられる。ストレージ１１４に記憶されているプログラムがメモリ１１２にロードされ、プログラムの命令をプロセッサ１０２が実行することにより、プロセッサ１０２は、プログラムで規定される各種の処理を行う手段として機能する。

【0106】

メモリ１１２には、プロセッサ１０２によって実行されるローカル学習プログラム１３０、およびローカルモデルＬＭｋなどの各種のプログラムおよび各種のデータ等が記憶される。なお、ローカルモデルＬＭｋは、ローカル学習プログラム１３０の中に含まれてもよい。メモリ１１２は、ローカルデータ記憶部１３６を含む。ローカルデータ記憶部１３６は、施設ｋで収集されたローカルデータＬＤｋを含むデータセット（以下、ローカルデータセットという。）が記憶される記憶領域である。

【0107】

ローカル学習プログラム１３０は、ローカルデータＬＤｋを用いて、施設ｋにおいて予測性能が向上するようにローカルモデルＬＭｋを学習する処理を実行させるプログラムである。

【0108】

通信インターフェース１０６は、有線または無線により外部装置との通信処理を行い、外部装置との間で情報のやり取りを行う。情報処理装置１００は、通信インターフェース１０６を介して不図示の通信回線に接続される。通信回線は、ローカルエリアネットワークであってもよいし、ワイドエリアネットワークであってもよく、これらの組み合わせであってもよい。通信インターフェース１０６は、例えば、グローバルサーバーＧＳＶでの演算結果およびグローバルサーバーＧＳＶからの各種指示、ならびにローカルデータセットなど様々なデータの入力を受け付けるデータ取得部の役割を担うことができる。また、通信インターフェース１０６は、ローカルモデルＬＭｋのモデルパラメータを含むローカルモデル情報をグローバルサーバーＧＳＶに送信するデータ出力部の役割を担う。

【0109】

情報処理装置１００は、入力装置１５２と表示装置１５４とを備えていてもよい。入力装置１５２および表示装置１５４は入出力インターフェース１０８を介してバス１１０に接続される。入力装置１５２は、例えば、キーボード、マウス、マルチタッチパネル、もしくはその他のポインティングデバイス、もしくは、音声入力装置、またはこれらの適宜の組み合わせであってよい。表示装置１５４は、例えば、液晶ディスプレイ、有機ＥＬ（organic electro-luminescence:ＯＥＬ）ディスプレイ、もしくは、プロジェクタ、またはこれらの適宜の組み合わせであってよい。なお、タッチパネルのように入力装置１５２と表示装置１５４とが一体的に構成されてもよく、タッチパネル式のタブレット端末のように、情報処理装置１００と入力装置１５２と表示装置１５４とが一体的に構成されてもよい。

【0110】

[グローバルサーバーＧＳＶの構成例]
図１４は、グローバルサーバーＧＳＶのハードウェア構成の例を示すブロック図である。グローバルサーバーＧＳＶのハードウェア構成は、図１３で説明した情報処理装置１００のハードウェア構成と同様であってよい。グローバルサーバーＧＳＶは、プロセッサ３０２、コンピュータ可読媒体３０４、通信インターフェース３０６、入出力インターフェース３０８、およびバス３１０を含む。コンピュータ可読媒体３０４は、メモリ３１２とストレージ３１４とを含む。また、グローバルサーバーＧＳＶは、入力装置３５２および表示装置３５４を含んでもよい。それぞれのハードウェア構成は、図１３に示した構成の対応する要素と同様であってよい。

【0111】

グローバルサーバーＧＳＶは本開示における「サーバー」の一例である。プロセッサ３０２は本開示における「第２プロセッサ」の一例である。コンピュータ可読媒体３０４は本開示における「第２記憶装置」の一例である。

【0112】

メモリ３１２には、プロセッサ３０２によって実行されるモデル間差評価プログラム３３０、学習制御プログラム３３２、グローバルモデル生成プログラム３３４およびグローバルモデルＧＭなどの各種のプログラムおよび各種のデータ等が記憶される。

【0113】

モデル間差評価プログラム３３０は、各ローカルモデルＬＭｋのモデルパラメータを含むローカルモデル情報を取得して、取得したローカルモデル情報を基に複数のローカルモデルＬＭｋのモデル間差を評価する処理を実行させるプログラムである。学習制御プログラム３３２は、モデル間差の評価結果を基に各ローカルモデルＬＭｋモデル間の差が小さくなるように各施設ｋにおけるローカルモデルＬＭｋの学習を制御する処理を実行させるプログラムである。学習制御プログラム３３２による学習の制御には、ローカルモデルＬＭの予測誤差に基づく学習を補正する概念が含まれる。具体的な補正方法（制御方法）の例は後述する。

【0114】

グローバルモデル生成プログラム３３４は、各ローカル学習装置ＬＴｋから受信したローカルモデル情報に基づき、グローバルモデルＧＭを生成する処理を実行させるプログラムである。

【0115】

〔機械学習方法の第１例：正則化アプローチ〕
図１５は、実施形態に係る機械学習システム５０によって行われる機械学習方法の第１例の概要を示す説明図である。ここでは、ドメイン汎化性のための正則化（ドメイン正則化）の例を示す。図１５では、説明の便宜上、施設ｋのローカルモデルＬＭｋの予測式が次式（１）により表現される場合を示す。

【0116】

ｙ＝ｗ１_ｄｋ＊ｘ１＋ｗ２_ｄｋ＊ｘ２（１）
式中のｘ１とｘ２のそれぞれは説明変数と関係する特徴量である。ｗ１_ｄｋとｗ２_ｄｋは、特徴量ｘ１、ｘ２のそれぞれの重みを示すパラメータである。なお、ローカルモデルＬＭｋは式（１）の表現に限らず、さらに多数の特徴量と重みとの組み合わせを含む構成であってよい。

【0117】

機械学習システム５０は、以下のステップ１からステップ３を繰り返して実行する。

【0118】

［ステップ１］
ステップ１では、ローカル学習装置ＬＴｋがそれぞれの施設ｋのローカルデータＬＤｋを用いて学習を行いローカルモデルＬＭｋのパラメータを更新する。ローカル学習装置ＬＴｋは、ローカルモデルＬＭｋの予測誤差に基づき予測誤差を小さくするようにパラメータを更新する。

【0119】

［ステップ２］
ステップ２では、グローバルサーバーＧＳＶが各ローカルモデルＬＭｋのパラメータを取得し、各ローカルモデルＬＭｋについて、他のローカルモデルの平均値とのパラメータの差を計算する。例えば、グローバルサーバーＧＳＶは、ローカルモデルＬＭ１のパラメータｗ１_ｄ１について、他のローカルモデルＬＭ２とＬＭ３の平均値（ｗ１_ｄ２＋ｗ１_ｄ３）／２との差を計算する。また、グローバルサーバーＧＳＶは、ローカルモデルＬＭ１のパラメータｗ２_ｄ１について、他のローカルモデルＬＭ２とＬＭ３の平均値（ｗ２_ｄ２＋ｗ２_ｄ３）／２との差を計算する。ローカルモデルＬＭ２、ＬＭ３についても同様に、グローバルサーバーＧＳＶは、他のローカルモデルの平均値とのパラメータの差を計算する。ここで計算されるパラメータの差の値は、ドメイン正則化のために導入されるロス成分の偏微分の値に相当する。

【0120】

［ステップ３］
ステップ３では、グローバルサーバーＧＳＶが各特徴量のパラメータの差が小さくなるように、ローカルモデルＬＭｋに指示を与える。例えば、グローバルサーバーＧＳＶは、ローカルモデルＬＭ１のパラメータｗ１_ｄ１について、ｗ１_ｄ１－α（ｗ１_ｄ１－(ｗ１_ｄ２＋ｗ１_ｄ３)／２）の値に更新するように、ローカル学習装置ＬＴ１に対して指示する。αは学習レート（学習速度）を表すハイパーパラメータである。

【0121】

また、グローバルサーバーＧＳＶは、ローカルモデルＬＭ１のパラメータｗ２_ｄ１について、ｗ２_ｄ１－α（ｗ２_ｄ１－(ｗ２_ｄ２＋ｗ２_ｄ３)／２）の値に更新するように、ローカル学習装置ＬＴ１に指示する。

【0122】

グローバルサーバーＧＳＶは、パラメータの更新量である「－α（ｗ１_ｄ１－(ｗ１_ｄ２＋ｗ１_ｄ３)／２）」の値および「－α（ｗ２_ｄ１－(ｗ２_ｄ２＋ｗ２_ｄ３)／２）」の値をローカル学習装置ＬＴ１に指示してもよいし、更新後のパラメータ値「ｗ１_ｄ１－α（ｗ１_ｄ１－(ｗ１_ｄ２＋ｗ１_ｄ３)／２）」の値および「ｗ２_ｄ１－α（ｗ２_ｄ１－(ｗ２_ｄ２＋ｗ２_ｄ３)／２）」の値をローカル学習装置ＬＴ１に指示してもよい。また、グローバルサーバーＧＳＶは、パラメータの更新量の算出に用いる値、例えば「ｗ１_ｄ１－(ｗ１_ｄ２＋ｗ１_ｄ３)／２」および「ｗ２_ｄ１－(ｗ２_ｄ２＋ｗ２_ｄ３)／２」、または「(ｗ１_ｄ２＋ｗ１_ｄ３)／２」および「(ｗ２_ｄ２＋ｗ２_ｄ３)／２」などの値をローカル学習装置ＬＴ１に指示し、ローカル学習装置ＬＴ１側でパラメータの更新量を算出してもよい。

【0123】

グローバルサーバーＧＳＶは、他のローカルモデルＬＭ２、ＬＭ３についても同様に、各特徴量のパラメータの差が小さくなるようにローカルモデルのパラメータを更新させる指示を行う。

【0124】

ステップ３の指示に従い、ステップ１において、各ローカルモデルＬＭｋのパラメータが更新される。機械学習システム５０は、ステップ１～３を繰り返し、所定の終了条件を満たした場合に、ステップ４に移行する。終了条件は、例えば、予め定めたイテレーションの回数に達すること、あるいは、モデル間の差が許容範囲内に入ること、などであってよい。

【0125】

［ステップ４］
ステップ４では、グローバルサーバーＧＳＶがローカルモデルＬＭ１－ＬＭ３に基づき、グローバルモデルＧＭを構築する。グローバルモデルＧＭの構築方法として、例えば、次のような方法１～３があり得る。

【0126】

方法１：すべてのローカルモデルＬＭｋが同じパラメータに収束するまでステップ１－３を繰り返し、すべてのローカルモデルＬＭｋを同じパラメータに収束させてから、いずれかのモデルをグローバルモデルＧＭとして採用する。

【0127】

方法２：すべてのローカルモデルＬＭｋを平均したものをグローバルモデルＧＭとして採用する。

【0128】

方法３：すべてのローカルモデルＬＭｋの中からパラメータ差分の小ささと、予測性能の高さとに基づいて、最適なローカルモデルをグローバルモデルＧＭとして選定する。または、パラメータ差分と、予測性能の評価値とを用いて重み付き平均をとり、重み付き平均されたモデルをグローバルモデルＧＭとして採用する。

【0129】

図１５における施設１は本開示における「第１施設」の一例であり、ローカルデータＬＤ１およびローカルモデルＬＭ１は本開示における「第１データ」および「第１ローカルモデル」の一例である。施設１に対して他の施設２および施設３のそれぞれは本開示における「第２施設」の一例であり、ローカルデータＬＤ２およびローカルデータＬＤ３のそれぞれは本開示における「第２データ」の一例である。また、ローカルモデルＬＭ１に対して他のローカルモデルＬＭ２およびローカルモデルＬＭ３のそれぞれは本開示における「第２ローカルモデル」の一例である。

【0130】

施設２および施設３に関しても同様であり、施設２および施設３のそれぞれは本開示における「第１施設」の一例である。

【0131】

［ドメイン汎化性のための正則化のロス関数の例］
施設１のローカルモデルＬＭ１についての学習に適用されるロス関数Ｌは、例えば、次式（２）のように、予測誤差部分とドメイン正則化部分とを含んで構成される。

【0132】

Ｌ＝（ｙ－ｙ_true）²
＋(ｗ１_ｄ１－（ｗ１_ｄ２＋ｗ１_ｄ３）／２)²
＋(ｗ２_ｄ１－（ｗ２_ｄ２＋ｗ２_ｄ３）／２)² （２）
式（２）の右辺の第１項は予測誤差部分のロス成分であり、第２項および第３項はドメイン正則化部分のロス成分である。

【0133】

ここで、目的変数ｙの予測式は、式（３）で表される。

【0134】

ｙ＝ｗ１_ｄ１＊ｘ１＋ｗ２_ｄ１＊ｘ２（３）
式（２）中のｙ_trueは、学習データにおける目的変数の正解の値（教師信号）である。

【0135】

ローカルモデルＬＭ１の学習に際しては、式（２）に示すロス関数Ｌを各パラメータｗ１_ｄ１、ｗ２_ｄ１で偏微分をとり、それぞれのパラメータを更新する。ロス関数Ｌの偏微分の値も当然、予測誤差部分とドメイン正則化部分とに分かれる。

【0136】

式（２）の予測誤差部分は、学習データのｙ_trueを含むため、ローカル学習装置ＬＴ１側で計算する必要がある。これに対し、ドメイン正則化部分はグローバルサーバーＧＳＶにて計算してもよいし、ローカル学習装置ＬＴ１側で計算してもよい。図１５の説明では、グローバルサーバーＧＳＶ側がドメイン正則化部分を計算してローカル学習装置ＬＴ１側に指示を出す例を示している。

【0137】

パラメータの更新方法としては、大きく分けて以下の２通りがあり得る。

【0138】

ケース１：予測誤差部分とドメイン正則化部分との偏微分を合わせて更新する態様。

【0139】

ケース２：予測誤差部分の偏微分に基づく更新と、ドメイン正則化部分の偏微分に基づく更新とを交互に実施する態様。

【0140】

図１５では、ケース２の方法について示している。ここでの「交互」の意味は、１サンプル単位で「交互」という意味ではなく、一定サンプル数（例えば、１００サンプル）は予測誤差のみで更新し、次にドメイン正則化で更新し、その後はまた一定サンプル数は予測誤差のみで更新・・・を交互に繰り返す、という意味である。ケース２の方法について、図１６のフローチャートを示して具体例を説明する。

【0141】

図１６は、実施形態に係る機械学習方法の第１例を示すフローチャートである。ステップＳ１０において、グローバルサーバーＧＳＶは、複数の施設１－３に対するそれぞれのローカルモデルＬＭ１－ＬＭ３のパラメータを初期値に設定する。例えば、平均値０、標準偏差０．１の正規分布によりランダム値に設定してよい。

【0142】

ステップＳ１１において、ローカル学習装置ＬＴ１は、施設１のデータからランダムに１つ選択し、ローカルモデルＬＭ１のパラメータｗ1_ｄ１とｗ２_ｄ１を予測誤差が小さくなるように更新する。ローカル学習装置ＬＴ１は、この更新処理を例えば１００回繰り返す。

【0143】

ステップＳ１２において、ローカル学習装置ＬＴ２は、施設２のデータからランダムに１つ選択し、ローカルモデルＬＭ２のパラメータｗ１_ｄ２とｗ２_ｄ２を予測誤差が小さくなるように更新する。ローカル学習装置ＬＴ１は、この更新処理を例えば１００回繰り返す。

【0144】

ステップＳ１３において、ローカル学習装置ＬＴ３は、施設３のデータからランダムに１つ選択し、ローカルモデルＬＭ３のパラメータｗ１_ｄ３とｗ２_ｄ３を予測誤差が小さくなるように更新する。ローカル学習装置ＬＴ３は、この更新処理を例えば１００回繰り返す。

【0145】

ステップＳ１１からステップＳ１３は、各施設のローカル学習装置ＬＴ１－ＬＴ３において並行して実施されてよい。また、ステップＳ１１～Ｓ１３が実施されるタイミングは、施設ごとに自由に設定されてよく、ステップＳ１１～Ｓ１３の実施順は限定されない。

【0146】

その後、ステップＳ１４において、各ローカル学習装置ＬＴｋは、ローカルモデルＬＭ１－ＬＭ３のパラメータをグローバルサーバーＧＳＶに送信する。

【0147】

ステップＳ１５において、グローバルサーバーＧＳＶは、取得した各ローカルモデルＬＭｋのパラメータを基に、ローカルモデルＬＭ１のパラメータと、ローカルモデルＬＭ２及びＬＭ３のパラメータとの差が小さくなるように、ローカルモデルＬＭ１のパラメータを更新する。

【0148】

ステップＳ１６において、グローバルサーバーＧＳＶは、取得した各ローカルモデルＬＭｋのパラメータを基に、ローカルモデルＬＭ２のパラメータと、ローカルモデルＬＭ３及びＬＭ１のパラメータとの差が小さくなるように、ローカルモデルＬＭ２のパラメータを更新する。

【0149】

ステップＳ１７において、グローバルサーバーＧＳＶは、取得した各ローカルモデルＬＭｋのパラメータを基に、ローカルモデルＬＭ３のパラメータと、ローカルモデルＬＭ１及びＬＭ２のパラメータとの差が小さくなるように、ローカルモデルＬＭ３のパラメータを更新する。

【0150】

ステップＳ１５－ステップＳ１７では、グローバルサーバーＧＳＶが受信したパラメータを基に、各ローカルモデルＬＭｋのパラメータの変更量を求め、グローバルサーバーＧＳＶ内でパラメータを更新して、更新したパラメータを各ローカル学習装置ＬＴｋに送信してローカルモデルＬＭｋ内のパラメータも更新する。

【0151】

ステップＳ１８において、グローバルサーバーＧＳＶは、パラメータが収束したか否かを判定する。ステップＳ１８の判定結果がＮｏ判定である場合、つまり、パラメータが収束していなければ、ステップＳ１１に戻り、ステップＳ１１～ステップＳ１７を繰り返す。

【0152】

一方、ステップＳ１８の判定結果がＹｅｓ判定である場合、つまり、パラメータが収束している場合、図１６のフローチャートを終了する。

【0153】

［情報処理装置１００の機能的構成の例１］
図１７は、ローカル学習装置ＬＴｋとして機能する情報処理装置１００の機能的構成の例１を示す機能ブロック図である。図１７に示す情報処理装置１００は、グローバルサーバーＧＳＶの指示に従い、図１５および図１６で説明したように、ドメイン正則化によってモデル間の差を小さくするように、ローカルモデルＬＭｋの学習を行う。

【0154】

情報処理装置１００は、データ取得部２２０と、データ保存部２２２と、ローカル学習部２３０と、データ出力部２５０と、を含む。データ取得部２２０は、施設ｋにおいて収集されたローカルデータＬＤｋを取得する。なお、情報処理装置１００がローカルデータＬＤｋを収集する機能を備えてもよい。また、データ取得部２２０は、グローバルサーバーＧＳＶから学習補正指示などの各種データを取得する。

【0155】

データ取得部２２０を介して取得されたローカルデータＬＤｋはデータ保存部２２２に保存される。ローカルデータ記憶部１３６（図１３参照）はデータ保存部２２２に含まれる。

【0156】

ローカル学習部２３０は、サンプリング部２３２と、ローカルモデルＬＭｋと、ロス演算部２３４と、オプティマイザ２３６とを含み、ローカルデータＬＤｋを用いてローカルモデルＬＭｋの学習を行う。サンプリング部２３２は、ローカルデータＬＤｋのデータセットから学習データをサンプリングする。例えば、確率的勾配降下法（stochastic gradient descent：ＳＧＤ）によりパラメータの最適化を行う場合において、サンプリング部２３２は、学習の１ステップごとに学習用のデータセットから１レコードを選択する。この操作は、ローカルモデルＬＭｋの予測誤差が収束するまで繰り返される。

【0157】

サンプリング部２３２によってサンプリングされた学習データはローカルモデルＬＭｋに入力され、ローカルモデルＬＭｋから入力データに応じた予測結果が出力される。ローカルモデルＬＭｋは、ユーザーのアイテムに対する行動を予測する数理モデルとして構築される。なお、サンプリング部２３２は、データセットの中からローカルモデルＬＭｋの入力として用いるレコードを確率的にサンプリングするので確率的なゆらぎの範囲では学習に使われる回数にばらつきはあり得る。

【0158】

ロス演算部２３４は、ローカルモデルＬＭｋから出力される予測（推論）結果と、入力データに対応付けされている正解データ（教師データ）とを基に、両者間の損失値（ロス）を算出する。

【0159】

オプティマイザ２３６は、ローカルモデルＬＭｋが出力する予測結果が正解データに近づくように、ロスの演算結果に基づき、ローカルモデルＬＭｋのパラメータの更新量を決定し、ローカルモデルＬＭｋのパラメータの更新処理を行う。オプティマイザ２３６は、パラメータの更新量を算出するパラメータ更新量演算部２３７と、パラメータの更新処理を行うパラメータ更新部２３８と、を含む。オプティマイザ２３６は、勾配降下法などのアルゴリズムに基づきパラメータの更新を行う。

【0160】

ローカル学習部２３０は、１サンプルずつ学習データを取得してパラメータを更新してもよいし、複数の学習データをまとめたミニバッチの単位で学習データの取得とパラメータの更新とを実施してもよい。

【0161】

こうして、ローカルデータＬＤｋのデータセットからサンプリングされた学習データを用いて機械学習が行われることにより、ローカルモデルＬＭｋのパラメータが最適化され、目標とする予測性能を持つローカルモデルＬＭｋが生成される。

【0162】

ローカルモデルＬＭｋのモデルパラメータを含むローカルモデル情報は、データ出力部２５０を介してグローバルサーバーＧＳＶに送られる。

【0163】

また、ローカル学習部２３０は、グローバルサーバーＧＳＶから受信した学習補正指示に従い、ローカルモデルＬＭｋのパラメータを更新する。グローバルサーバーＧＳＶからの学習補正指示がパラメータの更新量の指示を含む場合、パラメータ更新部２３８はグローバルサーバーＧＳＶから指示された更新量でローカルモデルＬＭｋのパラメータを更新する。グローバルサーバーＧＳＶからの学習補正指示がロス関数の一部の値あるいはパラメータ更新量の演算に用いる値などの指示を含む場合、ロス演算部２３４および／またはパラメータ更新量演算部２３７は、グローバルサーバーＧＳＶから指示された値を用いてロスの値および／またはパラメータ更新量を算出する。そして、パラメータ更新部２３８はグローバルサーバーＧＳＶから指示された値を基にローカルモデルＬＭｋのパラメータを更新する。

【0164】

なお、図１２に示したパラメータ演算部６２は、ロス演算部２３４とパラメータ更新量演算部２３７とを含み、図１２に示した通信部６４はデータ取得部２２０とデータ出力部２５０として機能し得る。

【0165】

［グローバルサーバーＧＳＶの機能的構成の例１］
図１８は、グローバルサーバーＧＳＶの機能的構成の例１を示す機能ブロック図である。図１８に示すグローバルサーバーＧＳＶは、図１６および図１７で説明したように、ドメイン正則化によってモデル間の差を小さくするようにローカルモデルＬＭｋの学習を制御する。

【0166】

グローバルサーバーＧＳＶは、データ取得部４２０と、データ保存部４２２と、グローバル学習部４３０と、データ出力部４５０と、を含む。データ取得部４２０は、各施設ｋのローカル学習装置ＬＴｋからローカルモデルＬＭｋのパラメータを含むローカルモデル情報を取得する。データ取得部４２０は、ローカルモデルＬＭｋのパラメータのみを取得してもよいし、ローカルモデルＬＭｋの特定に必要な全ての情報（例えば、ローカルモデルＬＭｋのコピー）を取得してもよい。

【0167】

データ取得部４２０を介して取得された各ローカルモデルＬＭｋのパラメータの値はデータ保存部４２２に保存される。

【0168】

グローバル学習部４３０は、モデル間差評価部７４と、学習補正部７８と、グローバルモデル生成部８０と、を含む。モデル間差評価部７４は、ドメイン正則化演算部７６を含む。ドメイン正則化演算部７６は、図１６のステップ２として説明したように、ロス関数Ｌにおけるドメイン正則化部分の演算を行う。

【0169】

学習補正部７８は、モデル間差評価部７４による演算結果を基に、ローカルモデルＬＭｋの学習を補正する指示を行う。例えば、学習補正部７８は、ドメイン正則化演算部７６により算出したドメイン正則化部分の偏微分の値と共にローカルモデルＬＭｋのパラメータの更新を指示する制御信号としての学習補正指示を出力する。学習補正部７８からの学習補正指示はデータ出力部４５０を介してローカル学習装置ＬＴｋに送信される。

【0170】

グローバルモデル生成部８０は、取得したローカルモデルＬＭｋのパラメータに基づき、グローバルモデルＧＭを構築する。グローバルモデル生成部８０は、図１５で説明したステップ１からステップ３の繰り返しにより各ローカルモデルＬＭｋのパラメータが収束した後に、グローバルモデルＧＭを生成する。

【0171】

また、グローバルモデル生成部８０は、ローカルモデルＬＭｋのパラメータが収束していない段階においても、ローカルモデルＬＭｋの最新のパラメータを用いて暫定的なグローバルモデルＧＭを生成し、ローカルモデルＬＭｋのパラメータの更新に応じて、グローバルモデルＧＭのパラメータを更新してもよい。グローバルモデルＧＭのモデルパラメータはデータ出力部４５０を介してローカル学習装置ＬＴｋ等の外部装置に送信することができる。

【0172】

［ドメイン正則化と一般的な正則化との違いについて]
本実施形態におけるドメイン汎化性のための「正則化」は、機械学習において一般的な正則化（例えば、Ｌ１正則化など）とは概念が異なる。一般的な正則化に関して、例えば、ラッソ（Ｌａｓｓｏ）回帰のモデルを例に示すと、モデルとロス関数は、例えば、それぞれ、式（４）と式（５）のように表現することができる。

【0173】

ｙ＝ｗ１＊ｘ１＋ｗ２＊ｘ２（４）
Ｌ＝（ｙ－ｙ_true）²＋｜ｗ１｜＋｜ｗ２｜（５）
この場合、式（５）の右辺の第１項は予測誤差部分である。第２項と第３項のように、重要でないパラメータが小さく（ゼロに）なるようなロスを導入することが、一般的な正則化である。

【0174】

これに対して、ドメイン汎化性のための正則化（ドメイン正則化）は、例えば、ドメイン１の予測モデルが式（６）、ドメイン２の予測モデルが式（７）のように表現される場合、例えば式（８）のようなロス関数が用いられる。

【0175】

ｙ＝ｗ１_ｄ１＊ｘ１＋ｗ２_ｄ１＊ｘ２（６）
ｙ＝ｗ１_ｄ２＊ｘ１＋ｗ２_ｄ２＊ｘ２（７）
Ｌ＝（ｙ－ｙ_true）²
＋｜ｗ１_ｄ１－ｗ１_ｄ２｜＋｜ｗ２_ｄ１－ｗ２_ｄ２｜（８）
式（８）の右辺の第２項と第３項のように、ドメイン正則化においては、ドメイン間のパラメータの差が小さくなるようなロスを導入することを指す。

【0176】

図１５の説明では、ドメイン間のパラメータの差を評価するために、式（８）の第２項と第３項の代わりに、式（２）の第２項と第３項のようなドメイン正則化部分を用いている。

【0177】

〔機械学習方法の第２例：特徴量選択アプローチ〕
図１９は、機械学習システム５０によって行われる機械学習方法の第２例の概要を示す説明図である。ここでは、モデルにおける特徴量を選択することにより、モデル間の差を小さくする例を示す。図１９において、図１５と異なる点を説明する。図１９のステップ１は、図１５のステップ１と同様である。図１５のステップ２～３の代わりに、ステップ２Ｂ～ステップ３Ｂが実施される。

【0178】

[ステップ２Ｂ]
ステップ２Ｂでは、グローバルサーバーＧＳＶが各ローカルモデルＬＭｋのパラメータを取得し、各特徴量の重み（パラメータ）のモデル間の差を算出する。グローバルサーバーＧＳＶは、例えば、次式（９）により、特徴量ｘ１の重みのモデル間の差を算出する。

【0179】

Ｄｉｆｆ_ｗ１＝｜ｗ１_ｄ１－ｗ１_ｄ２｜＋｜ｗ１_ｄ２－ｗ１_ｄ３｜＋｜ｗ１_ｄ３－ｗ１_ｄ１｜（９）
同様に、次式（１０）により、特徴量ｘ２の重みのモデル間の差を算出する。

【0180】

Ｄｉｆｆ_ｗ２＝｜ｗ２_ｄ１－ｗ２_ｄ２｜＋｜ｗ２_ｄ２－ｗ２_ｄ３｜＋｜ｗ２_ｄ３－ｗ２_ｄ１｜（１０）
ここでは、２つの特徴量ｘ１、ｘ２の重みを例示するが、実際にはさらに多数の特徴量のそれぞれの重みについてモデル間の差が算出される。

【0181】

[ステップ３Ｂ]
ステップ３Ｂでは、グローバルサーバーＧＳＶはモデル間の重みの差が小さい特徴量を選択する（残す）ようにローカルモデルＬＭｋに指示する。また、グローバルサーバーＧＳＶはモデル間の重みの差が大きい特徴量は除外するようにローカルモデルＬＭｋに指示する。モデル間の重みの差が大きい特徴量はドメインシフトに対する普遍性が低いためである。

【0182】

例えば、図１９のように、特徴量ｘ２の重みのモデル間の差が非常に大きい場合、グローバルサーバーＧＳＶは、ローカルモデルＬＭｋに対して特徴量ｘ２を除外する指示を出す。

【0183】

〔モデル表現と交差特徴量について〕
推薦技術の場合、特徴量間の相互作用が重要なことが多いため、交差特徴量も考慮することが好ましい。例えば、ローカルモデルＬＭｋは、次式（１１）のように表現され得る。

【0184】

ｙ＝（ｗ_１１_ｄ１＊ｘ_ｕ１＊ｘ_ｉ１＋ｗ_１２_ｄ１＊ｘ_ｕ１＊ｘ_ｉ２＋ｗ_１３_ｄ１＊ｘ_ｕ１＊ｘ_ｉ３）＋（ｗ_２１_ｄ１＊ｘ_ｕ２＊ｘ_ｉ１＋ｗ_２２_ｄ１＊ｘ_ｕ２＊ｘ_ｉ２＋ｗ_２３_ｄ１＊ｘ_ｕ２＊ｘ_ｉ３）＋（ｗ_３１_ｄ１＊ｘ_ｕ３＊ｘ_ｉ１＋ｗ_３２_ｄ１＊ｘ_ｕ３＊ｘ_ｉ２＋ｗ_３３_ｄ１＊ｘ_ｕ３＊ｘ_ｉ３）＋（ｗ_ｕ１_ｄ１＊ｘ_ｕ１＋ｗ_ｕ２_ｄ１＊ｘ_ｕ２＋ｗ_ｕ３_ｄ１＊ｘ_ｕ３）＋（ｗ_ｉ１_ｄ１＊ｘ_ｉ１＋ｗ_ｉ２_ｄ１＊ｘ_ｉ２＋ｗ_ｉ３_ｄ１＊ｘ_ｉ３）（１１）
式（１１）中のｘ_ｕ１、ｘ_ｕ２およびｘ_ｕ３のそれぞれは、あるユーザーｕがユーザー属性１、２、３に該当していればそれぞれの値が１、そうでなければ０になる。また、式（１１）中のｘ_ｉ１、ｘ_ｉ２およびｘ_ｉ３のそれぞれは、あるアイテムｉがアイテム属性１、２、３に該当していればそれぞれの値が１、そうでなければ０になる。

【0185】

例えば、ユーザーによるアイテムの購入予測を行うモデルの場合、式（１１）の右辺の第１項から第９項までの和の部分「（ｗ_１１_ｄ１＊ｘ_ｕ１＊ｘ_ｉ１＋ｗ_１２_ｄ１＊ｘ_ｕ１＊ｘ_ｉ２＋ｗ_１３_ｄ１＊ｘ_ｕ１＊ｘ_ｉ３）＋（ｗ_２１_ｄ１＊ｘ_ｕ２＊ｘ_ｉ１＋ｗ_２２_ｄ１＊ｘ_ｕ２＊ｘ_ｉ２＋ｗ_２３_ｄ１＊ｘ_ｕ２＊ｘ_ｉ３）＋（ｗ_３１_ｄ１＊ｘ_ｕ３＊ｘ_ｉ１＋ｗ_３２_ｄ１＊ｘ_ｕ３＊ｘ_ｉ２＋ｗ_３３_ｄ１＊ｘ_ｕ３＊ｘ_ｉ３）」は、あるユーザー属性のユーザーがあるアイテム属性のアイテムを購入する確率が高いかどうかを評価する部分である。

【0186】

式（１１）の右辺の第１０項から第１２項までの和の部分「（ｗ_ｕ１_ｄ１＊ｘ_ｕ１＋ｗ_ｕ２_ｄ１＊ｘ_ｕ２＋ｗ_ｕ３_ｄ１＊ｘ_ｕ３）」は、あるユーザー属性のユーザーは購入率が高いかどうかを評価する部分である。式（１１）の右辺の第１３項から第１５項までの和の部分「（ｗ_ｉ１_ｄ１＊ｘ_ｉ１＋ｗ_ｉ２_ｄ１＊ｘ_ｉ２＋ｗ_ｉ３_ｄ１＊ｘ_ｉ３）」は、あるアイテム属性のアイテムは購入されやすいかどうかを評価する部分である。

【0187】

図１５を用いて説明したドメイン正則化のロスは、交差特徴量の重みに対しても同様に定義できる。例えば、ロス関数におけるドメイン正則化部分として、次式（１２）のようなドメイン正則化のロスを導入し得る。

【0188】

(ｗ_１１_ｄ１－（ｗ_１１_ｄ２＋ｗ_１１_ｄ３)／２）²＋(ｗ_１２_ｄ１－（ｗ_１２_ｄ２＋ｗ_１２_ｄ３)／２)²＋ … ．（１２）
また、交差特徴量に対する特徴量選択については、例えば、|ｗ_３２_ｄ１－（ｗ_３２_ｄ２＋ｗ_３２_d３)／２|が大きい場合、ｘ_ｕ３＊ｘ_ｉ２の組合せ（交差特徴量）を予測モデルから除外する。この場合、式（１１）から交差特徴量ｘ_ｕ３＊ｘ_ｉ２の項が削除され、次式（１３）のような予測式となる。

【0189】

ｙ＝（ｗ_１１_ｄ１＊ｘ_ｕ１＊ｘ_ｉ１＋ｗ_１２_ｄ１＊ｘ_ｕ１＊ｘ_ｉ２＋ｗ_１３_ｄ１＊ｘ_ｕ１＊ｘ_ｉ３）＋（ｗ_２１_ｄ１＊ｘ_ｕ２＊ｘ_ｉ１＋ｗ_２２_ｄ１＊ｘ_ｕ２＊ｘ_ｉ２＋ｗ_２３_ｄ１＊ｘ_ｕ２＊ｘ_ｉ３）＋（ｗ_３１_ｄ１＊ｘ_ｕ３＊ｘ_ｉ１＋ｗ_３３_ｄ１＊ｘ_ｕ３＊ｘ_ｉ３）＋（ｗ_ｕ１_ｄ１＊ｘ_ｕ１＋ｗ_ｕ２_ｄ１＊ｘ_ｕ２＋ｗ_ｕ３_ｄ１＊ｘ_ｕ３）＋（ｗ_ｉ１_ｄ１＊ｘ_ｉ１＋ｗ_ｉ２_ｄ１＊ｘ_ｉ２＋ｗ_ｉ３_ｄ１＊ｘ_ｉ３）（１３）

【0190】

〔交差特徴量の重み表現の例１〕
交差特徴量の重みを、個々の特徴量のエンベディング（embedding）表現をもとに算出してもよい。例えば、ドメインｄ１におけるユーザー属性１のベクトルをＶｋ_ｕ^１_ｄ１、アイテム属性２のベクトルをＶ_ｉ^２_ｄ１とする場合、ユーザー属性１とアイテム属性２の交差特徴量の重みｗ_１２_ｄ１は、次式（１４）で表すことができる。

【0191】

ｗ_１２_ｄ１＝ｆ（Ｖｋ_ｕ^１_ｄ１，Ｖｋ_ｉ^２_ｄ１)
＝Ｖｋ_ｕ^１_ｄ１・Ｖｋ_ｉ^２_ｄ１（１４）
ｆは任意の関数であり、例えば、内積であってもよい。

【0192】

他の交差特徴量の重みも同様の表現が可能である。

【0193】

図２０に、ドメインｄ１におけるユーザー属性とアイテム属性のそれぞれのベクトル表現の例を示す。ここでは、ユーザー属性１～３とアイテム属性１～３の例を示し、それぞれの属性が５次元のベクトルで表現される例を示す。

【0194】

この場合、交差特徴量の重みは、式（１４）と同様に、２つの属性ベクトルの組合せによる関数、例えば、内積により表現される。他のドメインｄ２、ｄ３・・・でも同様の表現が可能である。

【0195】

〔交差特徴量の重み表現の例２〕
モデルの予測式に用いる特徴量ｘ１、ｘ２は属性データに限らず、ユーザーやアイテムにＩＤレベルで対応していてもよい。例えば、ユーザーＩＤがｕでアイテムＩＤがｉのとき、ＩＤレベルの交差特徴量は、次式（１５）で表される。

【0196】

ｙ＝ｗ_ｕｉ_ｄ１＝θｕ_ｄ１・φｉ_ｄ１（１５）
θｕ_ｄ１とφｉ_ｄ１は、ドメインｄ１におけるユーザーＩＤがｕのベクトルとアイテムＩＤがｉのベクトルを表す。

【0197】

ユーザーＩＤがｕ_aでアイテムＩＤがｉ_aのとき、ＩＤレベルの交差特徴量は、次式（１６）で表される。

【0198】

ｙ＝ｗ_ｕ_aｉ_a_ｄ１＝θｕ_a_ｄ１・φｉ_a_ｄ１（１６）
また、予測式は、ＩＤレベルの交差特徴量と属性レベルでの交差特徴量を組み合わせてもよい。例えば、予測式は、次式（１７）のように表現してもよい。

【0199】

ｙ＝ｗ_ｕｉ_ｄ１
＋（ｗ_１１_ｄ１＊ｘ_ｕ１＊ｘ_ｉ１＋ｗ_１２_ｄ１＊ｘ_ｕ１＊ｘ_ｉ２＋ｗ_１３_ｄ１＊ｘ_ｕ１＊ｘ_ｉ３）＋（ｗ_２１_ｄ１＊ｘ_ｕ２＊ｘ_ｉ１＋ｗ_２２_ｄ１＊ｘ_ｕ２＊ｘ_ｉ２＋ｗ_２３_ｄ１＊ｘ_ｕ２＊ｘ_ｉ３）＋（ｗ_３１_ｄ１＊ｘ_ｕ３＊ｘ_ｉ１＋ｗ_３２_ｄ１＊ｘ_ｕ３＊ｘ_ｉ２＋ｗ_３３_ｄ１＊ｘ_ｕ３＊ｘ_ｉ３）＋（ｗ_ｕ１_ｄ１＊ｘ_ｕ１＋ｗ_ｕ２_ｄ１＊ｘ_ｕ２＋ｗ_ｕ３_ｄ１＊ｘ_ｕ３）＋（ｗ_ｉ１_ｄ１＊ｘ_ｉ１＋ｗ_ｉ２_ｄ１＊ｘ_ｉ２＋ｗ_ｉ３_ｄ１＊ｘ_ｉ３）（１７）
他のドメインｄ２、ｄ３、・・・でも同様である。

【0200】

［情報処理装置１００の機能的構成の例２］
図２１は、ローカル学習装置ＬＴｋとして機能する情報処理装置１００の機能的構成の例２を示す機能ブロック図である。図２１に示す情報処理装置１００は、グローバルサーバーＧＳＶの指示に従い、図１９で説明した特徴量選択によってモデル間の差を小さくするように、ローカルモデルＬＭｋの学習を行う。図２１に示す構成について、図１７と共通する要素には同一の符号を付し、重複する説明は省略する。図２１に示す情報処理装置１００は、図１７のローカル学習部２３０の代わりに、ローカル学習部２３０Ｂを含む。ローカル学習部２３０Ｂは、グローバルサーバーＧＳＶからの学習補正指示に基づきローカルモデルＬＭｋの特徴量を選択する特徴量選択部２３３を含む。特徴量選択部２３３は、グローバルサーバーＧＳＶからの学習補正指示に基づき、モデル間でパラメータ差が相対的に大きい特徴量を削除してローカルモデルＬＭｋを更新する処理を行う。その他の構成は、図１７と同様であってよい。

【0201】

情報処理装置１００は、図１７で説明したドメイン正則化によるパラメータの更新処理と、特徴量選択によるモデルの更新処理との両方を実施してもよい。

【0202】

［グローバルサーバーＧＳＶの機能的構成の例２］
図２２は、グローバルサーバーＧＳＶの機能的構成の例２を示す機能ブロック図である。図２２に示すグローバルサーバーＧＳＶは、特徴量ごとにモデル間のパラメータ差を評価して、パラメータ差の大きい特徴量を削除するように特徴量の選択を行う。図２２に示す構成について、図１８と共通する要素には同一の符号を付し、重複する説明は省略する。図２２に示すグローバルサーバーＧＳＶは、図１８のグローバル学習部４３０の代わりに、グローバル学習部４３０Ｂを含む。グローバル学習部４３０Ｂのモデル間差評価部７４は、特徴量ごとにモデル間のパラメータ差（重みのモデル間の差）を評価する特徴量別パラメータ差演算部７７を含む。特徴量別パラメータ差演算部７７は、図１９のステップ２Ｂの処理を行う。また、学習補正部７８は、特徴量別パラメータ差演算部７７の演算結果に基づき、特徴量を選択する特徴量選択部７９を含む。特徴量選択部７９は、図１９のステップ３Ｂの処理を行う。その他の構成は、図１９と同様であってよい。

【0203】

なお、グローバル学習部４３０Ｂにおいて、特徴量が選択された補正後のローカルモデルＬＭｋを生成し、この特徴量選択が行われたローカルモデルＬＭｋをローカル学習装置ＬＴｋ側に返してもよい。この場合、情報処理装置１００は、保持しているローカルモデルＬＭｋをグローバルサーバーＧＳＶから受信したローカルモデルＬＭｋに更新する。図２１で説明した情報処理装置１００の特徴量選択部２３３の処理機能は、グローバルサーバーＧＳＶの特徴量選択部７９に含まれていてもよい。

【0204】

グローバルサーバーＧＳＶは、図１８で説明したドメイン正則化の演算処理と、特徴量選択の処理との両方を実施してもよい。

【0205】

〔具体的な適用例〕
ここでは、企業向けの社内文書推薦システムの場合を考える。学習および評価用のデータとして、企業１、企業２および企業３のそれぞれの行動履歴（ここでは文書の閲覧履歴）データがあるものとする。図２３は、企業１におけるユーザーのアイテムに対する行動履歴のデータの例である。ここでの「アイテム」は文書である。図２３に示すテーブルは、「時間」、「ユーザーＩＤ」、「アイテムＩＤ」、「ユーザー属性１」、「ユーザー属性２」、「アイテム属性１」「アイテム属性２」および「閲覧有無」のカラムを含む。

【0206】

「時間」は、アイテムを閲覧した日時である。「ユーザーＩＤ」は、ユーザーを特定する識別符号であり、各ユーザーに対して固有のＩＤ（identification）が定義されている。アイテムＩＤはアイテムを特定する識別符号であり、各アイテムに対して固有のＩＤが定義されている。「ユーザー属性１」は例えばユーザーの所属部門である。「ユーザー属性２」は例えばユーザーの年代である。「アイテム属性１」は例えばアイテムの分類カテゴリーとしての文書種類である。「アイテム属性２」は例えばアイテムのファイルタイプである。「閲覧有無」は閲覧された場合（閲覧有り）の値が「１」となる。なお、閲覧していないアイテムは膨大なため、閲覧したアイテム（閲覧有無＝１）のみレコードに記録するのが一般的である。

【0207】

図２３における「閲覧有無」は目的変数Ｙの一例であり、「ユーザー属性１」、「ユーザー属性２」、「アイテム属性１」、および「アイテム属性２」のそれぞれは説明変数Ｘの一例である。説明変数Ｘの種類数およびその組み合わせについては、図２３の例に限らない。説明変数Ｘとして、さらに不図示のコンテキスト１、コンテキスト２、ユーザー属性３、およびアイテム属性３などを含んでもよい。

【0208】

企業２および企業３についてもそれぞれ同様の行動履歴のデータがある。各企業のデータを外部に持ち出すことはできないことを想定する。この場合、まず企業ごとにローカルな予測モデル（ローカルモデル）を学習する。特徴量としてユーザー属性１（所属部門）、ユーザー属性２（年代）、アイテム属性１（文書種類）、およびアイテム属性２（ファイルタイプ、を用い、交差特徴量も用いたロジスティック回帰モデルを用いる。

【0209】

学習はＳＧＤを用い、指定された学習レートにより、指定された回数の更新を行う。学習した結果、個々のローカルモデルＬＭｋごとに各特徴量の重みが求まる。

【0210】

次に、各ローカルモデルＬＭｋをグローバルサーバーＧＳＶに転送する。このとき、学習に用いたデータは転送しない。

【0211】

グローバルサーバーＧＳＶでは、企業１のローカルモデルＬＭ１の各重みについて、企業２のローカルモデルＬＭ２の各重みと企業３のローカルモデルＬＭ３の各重みの平均との差をとる。グローバルサーバーＧＳＶは、この差に一定値をかけた値を、企業１のローカルモデルＬＭ１から差し引くように指示する。または、差し引いたパラメータを企業１のローカルモデルＬＭ１に返す。企業２のローカルモデルＬＭ２と企業３のローカルモデルＬＭ３に対しても同様の操作を行う。

【0212】

上記のローカルモデル学習とパラメータ修正のステップを、予測誤差と重みの差が収束するまで繰り返し行う。これにより、各企業固有の特性ではなく、普遍的な特性による予測モデルが構築される。

【0213】

例えば、企業１は年代が高いほど文書閲覧率が高いが、企業２と企業３にその傾向が見られない場合、年代と閲覧率の関係は普遍性のない特性のため予測モデルの重みは小さくなる。つまり、企業１の年代に対する重みが小さくなり、その分普遍的な特性を持つ特徴量に重みが割り振られる。一方、営業部門だと商品カタログを閲覧する確率が高いという傾向は企業１―３で共通である場合、企業１－３のローカルモデルＬＭ１－ＬＭ３のいずれも、この交差特徴量に対する重みが高いため、重みは保持される。

【0214】

〔モデル表現について〕
説明変数Ｘと目的変数Ｙの同時確率分布を表現する手段は、特に限定されず、例えば、行列分解（Matrix Factorization）、ロジスティック回帰（logistic regression）、あるいはナイーブベイズ（Naive Bayes）などを適用し得る。任意の予測モデルの場合も、出力スコアを確率Ｐ（Ｙ｜Ｘ）に近くなるようにキャリブレーションを行うことで、同時確率分布表現の手段に利用できる。例えば、ＳＶＭ（Support Vector Machine）、ＧＤＢＴ（Gradient Boosting Decision Tree）、および任意のアーキテクチャのニューラルネットワークモデルなども利用可能である。

【0215】

〔近傍ベースの協調フィルタリングへの応用〕
ユーザーのアイテムに対する行動を予測する手法として、ユーザー間やアイテム間の関係性を基にした近傍ベースの協調フィルタリングを適用してもよい。協調フィルタリングは、例えば、アイテムＡを閲覧している人はアイテムＢも閲覧している、というような相関を用いる手法である。その場合、アイテムＡを閲覧した人はアイテムＢも閲覧しているという、アイテムＡとアイテムＢとの相関がドメインによって普遍的かどうかに対して、ドメイン正則化や特徴量選択を適用する。つまり、相関係数が近くなるように制約したり、相関係数が大きく異なる関係性は予測モデルの特徴量から除外したりする。

【0216】

［近傍ベースの協調フィルタリングの例］
近傍ベースの協調フィルタリングの場合、ユーザーがアイテムを閲覧する確率の予測値ｙは、例えば、次式（１８）で表現される。

【0217】

ｙ＝Σ ｓ_ｉｊ_ｄ１ × ｒ_ｕｊ（１８）
式（１８）中のｒ_ｕｊは、ユーザーｕがアイテムｊとインタラクション（ここでは閲覧）していたら「１」、インタラクションしていなければ「０」の値をとる。

【0218】

ｓ_ｉｊ_ｄ１は、ドメインｄ１におけるアイテムｉとアイテムｊの相関係数である。

【0219】

つまり、ユーザーｕがアイテムｉを閲覧する確率の予測であるｙは、アイテムｉと相関の高いアイテムをユーザーｕが過去に閲覧しているほど大きくなる。

【0220】

ｓ_ｉｊ_ｄ１は、例えばジャッカード指数による計算方法では、次の式（１９）により求められる。

【0221】

（アイテムｉとｊの両方を閲覧したユーザー数）/（アイテムｉとｊの少なくてもいずれかは閲覧したユーザー数）（１９）

【0222】

［近傍ベースの協調フィルタリングの場合における特徴量選択の例］
ドメイン間でｓ_ｉｊが大きく異なる場合は、そのアイテム間の相関を予測式から除外する（ｓ_ｉｊを０にする）ことが好ましい。例えば、次式（２０）の値が一定値以上であればｓ_ｉｊ_ｄ１、ｓ_ｉｊ_ｄ２、およびｓ_ｉｊ_ｄ３を予測式から除外し（すなわち値を０にし）、一定値未満であれば除外しない（これら相関係数を元のまま用いる）。

【0223】

|ｓ_ｉｊ_ｄ１－ｓ_ｉｊ_ｄ２|＋|ｓ_ｉｊ_ｄ２－ｓ_ｉｊ_ｄ３|＋|ｓ_ｉｊ_ｄ３－ｓ_ｉｊ_ｄ１| （２０）

【0224】

〔コンピュータを動作させるプログラムについて〕
情報処理装置１００およびグローバルサーバーＧＳＶにおける処理機能の一部または全部をコンピュータに実現させるプログラムを、光ディスク、磁気ディスク、もしくは、半導体メモリその他の有体物たる非一時的な情報記憶媒体であるコンピュータ可読媒体に記録し、この情報記憶媒体を通じてプログラムを提供することが可能である。

【0225】

またこのような有体物たる非一時的なコンピュータ可読媒体にプログラムを記憶させて提供する態様に代えて、インターネットなどの電気通信回線を利用してプログラム信号をダウンロードサービスとして提供することも可能である。

【0226】

さらに、情報処理装置１００およびグローバルサーバーＧＳＶにおける処理機能の一部または全部をクラウドコンピューティングによって実現してもよく、また、ＳａａＳ（Software as a Service）として提供することも可能である。

【0227】

〔各処理部のハードウェア構成について〕
情報処理装置１００におけるパラメータ演算部６２、通信部６４、データ取得部２２０、ローカル学習部２３０、サンプリング部２３２、特徴量選択部２３３、ロス演算部２３４、パラメータ更新量演算部２３７、およびパラメータ更新部２３８、ならびに、グローバルサーバーＧＳＶにおける通信部７２、モデル間差評価部７４、パラメータ演算部７５、ドメイン正則化演算部７６、特徴量別パラメータ差演算部７７、学習補正部７８、特徴量選択部７９、およびグローバルモデル生成部８０などの各種の処理を実行する処理部（processing unit）のハードウェア的な構造は、例えば、次に示すような各種のプロセッサ（processor）である。

【0228】

各種のプロセッサには、プログラムを実行して各種の処理部として機能する汎用的なプロセッサであるＣＰＵ、ＧＰＵ、ＦＰＧＡ（Field Programmable Gate Array）などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Programmable Logic Device：ＰＬＤ）、ＡＳＩＣ（Application Specific Integrated Circuit）などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路などが含まれる。

【0229】

１つの処理部は、これら各種のプロセッサのうちの１つで構成されていてもよいし、同種または異種の２つ以上のプロセッサで構成されてもよい。例えば、１つの処理部は、複数のＦＰＧＡ、あるいは、ＣＰＵとＦＰＧＡの組み合わせ、またはＣＰＵとＧＰＵの組み合わせによって構成されてもよい。また、複数の処理部を１つのプロセッサで構成してもよい。複数の処理部を１つのプロセッサで構成する例としては、第一に、クライアントやサーバーなどのコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組み合わせで１つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第二に、システムオンチップ（System On Chip：ＳｏＣ）などに代表されるように、複数の処理部を含むシステム全体の機能を１つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサを１つ以上用いて構成される。

【0230】

さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子などの回路素子を組み合わせた電気回路（circuitry）である。

【0231】

〔実施形態による利点〕
上述した実施形態によれば、複数の施設のデータを施設外において共有できない場合であっても、施設の違いに対してロバストな性能を持つモデルを学習することが可能である。本実施形態によれば、モデルを学習する際に、各施設のデータを施設からに持ち出すことができない場合にも、施設の特性によらない普遍的なモデルを生成することが可能であり、ドメインシフトにロバストな推薦アイテムリストの提供を実現することが可能になる。

【0232】

〔実施形態の変形例〕
上述した実施形態では、連合学習の例を説明したが、複数のローカルモデルＬＭｋのモデル間の差が小さくなるように制約条件を付して学習を行うことによってモデルにドメイン汎化性を持たせるという本開示の技術は、連合学習に限らない。例えば、複数の施設のデータの共有が可能である場合、あるいは、データの持ち出しが可能である場合などにおいて、１つ以上のコンピュータを含むシステムが、複数の施設のそれぞれのデータを用いて施設ごとのローカルモデルＬＭｋの学習を行い、それらのモデル間の差が小さくなるように、それぞれの学習を制御することにより、ドメイン汎化性を持つモデルを生成してもよい。

【0233】

〔他の応用例〕
図２３では企業における文書の閲覧を例に説明したが、本開示の適用範囲はこの例に限らない。例えば、病院などの医療施設におけるに医用画像や各種の文書等の閲覧、小売店の店舗におけるユーザーの購買行動、あるいはコンテンツ提供サイトにおける動画等のコンテンツの視聴など、用途を問わず、様々なアイテムに関するユーザーの行動予測を行うモデルについて本開示の技術を適用できる。

【0234】

〔その他〕
本開示は上述した実施形態に限定されるものではなく、本開示の技術的思想の趣旨を逸脱しない範囲で種々の変形が可能である。

【符号の説明】

【0235】

１０推薦システム
１２予測モデル
１４モデル
５０機械学習システム
５２電気通信回線
６２パラメータ演算部
６４通信部
７２通信部
７４モデル間差評価部
７５パラメータ演算部
７６ドメイン正則化演算部
７７特徴量別パラメータ差演算部
７８学習補正部
７９特徴量選択部
８０グローバルモデル生成部
１００情報処理装置
１０２プロセッサ
１０４コンピュータ可読媒体
１０６通信インターフェース
１０８入出力インターフェース
１１０バス
１１２メモリ
１１４ストレージ
１３０ローカル学習プログラム
１３６ローカルデータ記憶部
１５２入力装置
１５４表示装置
２２０データ取得部
２２２データ保存部
２３０ローカル学習部
２３０Ｂローカル学習部
２３２サンプリング部
２３３特徴量選択部
２３４ロス演算部
２３６オプティマイザ
２３７パラメータ更新量演算部
２３８パラメータ更新部
２５０データ出力部
３０２プロセッサ
３０４コンピュータ可読媒体
３０６通信インターフェース
３０８入出力インターフェース
３１０バス
３１２メモリ
３１４ストレージ
３３０モデル間差評価プログラム
３３２学習制御プログラム
３３４グローバルモデル生成プログラム
３５２入力装置
３５４表示装置
４２０データ取得部
４２２データ保存部
４２２データ保存部
４３０グローバル学習部
４３０Ｂグローバル学習部
４５０データ出力部
ＩＴ１アイテム
ＩＴ２アイテム
ＩＴ３アイテム
Ｍ１モデル
Ｍ２モデル
Ｍｎモデル
ＬＤ１、ＬＤ２、ＬＤ３、ＬＤｋ、ＬＤｎローカルデータ
ＬＭ１、ＬＭ２、ＬＭ３、ＬＭｋ、ＬＭｎローカルモデル
ＬＴ１、ＬＴ２、ＬＴ３、ＬＴｋ、ＬＴｎローカル学習装置
Ｓ１０～Ｓ１８機械学習方法のステップ

【図1】