(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-27
(54)【発明の名称】インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20231220BHJP
G06N 3/04 20230101ALI20231220BHJP
【FI】
G06N20/00
G06N3/04 100
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023509864
(86)(22)【出願日】2022-06-01
(85)【翻訳文提出日】2023-02-10
(86)【国際出願番号】 CN2022096599
(87)【国際公開番号】W WO2023087667
(87)【国際公開日】2023-05-25
(31)【優先権主張番号】202111402589.4
(32)【優先日】2021-11-19
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100106518
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100189555
【氏名又は名称】徳山 英浩
(72)【発明者】
【氏名】呉 学超
(72)【発明者】
【氏名】曹 前
(72)【発明者】
【氏名】何 暁輝
(72)【発明者】
【氏名】白 雲龍
(57)【要約】
本開示は、インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラムを提供し、データ処理、機械学習の技術分野に関する。方法は、ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、且つソースドメインの第2のユーザデータと第2のリソースデータとを取得することと、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することと、暗黙的特徴に基づいて、ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングすることとを含む。本開示の技術案において、暗黙的特徴の形式によってソースドメインデータを引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避することができ、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【特許請求の範囲】
【請求項1】
ソートモデルトレーニング方法であって、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、かつソースドメインの第2のユーザデータと第2のリソースデータとを取得することと、
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することと、
前記暗黙的特徴に基づいて、前記ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングすることと、を含む
ソートモデルトレーニング方法。
【請求項2】
前記第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定することと、
前記明示的特徴と前記暗黙的特徴とに基づいて、ソートモデルをトレーニングすることと、をさらに含む
請求項1に記載のソートモデルトレーニング方法。
【請求項3】
前記第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定することは、
前記ターゲットドメインの数が複数である場合、同一の特徴符号化方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴符号化方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得し、各ターゲットドメインの第1の明示的ユーザ特徴のフォーマットが同一であり、各ターゲットドメインの第1の明示的リソース特徴のフォーマットが同一であることと、
ターゲットドメイン毎に、前記第1の明示的ユーザ特徴と前記第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得ることと、を含む
請求項2に記載のソートモデルトレーニング方法。
【請求項4】
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、協調フィルタリング方式を採用して前記第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出することと、
協調フィルタリング方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出することと、
前記第1の暗黙的ユーザ特徴と前記第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得ることと、
前記スティッチングユーザ特徴に基づいて、暗黙的特徴を特定することと、を含む
請求項1に記載のソートモデルトレーニング方法。
【請求項5】
前記第1の暗黙的ユーザ特徴と前記第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得ることは、
前記重複ユーザの第2のユーザデータの数と前記第1のユーザデータの数とに基づいて、前記第2の暗黙的ユーザ特徴に対応する第1の重みを特定することと、
前記第1の暗黙的ユーザ特徴と、前記第2の暗黙的ユーザ特徴と、前記第1の重みとに基づいて、スティッチングユーザ特徴を得ることと、を含む
請求項4に記載のソートモデルトレーニング方法。
【請求項6】
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがあると特定した場合、協調フィルタリング方式を採用して前記第1のリソースデータに対して第1の暗黙的リソース特徴を抽出することと、
協調フィルタリング方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出することと、
前記第1の暗黙的リソース特徴と前記第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得ることと、
前記スティッチングリソース特徴に基づいて、暗黙的特徴を特定することと、を含む
請求項1に記載のソートモデルトレーニング方法。
【請求項7】
前記第1の暗黙的リソース特徴と前記第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得ることは、
前記重複リソースの第2のリソースデータの数と前記第1のリソースデータの数とに基づいて、前記第2の暗黙のリソース特徴に対応する第2の重みを特定することと、
前記第1の暗黙的リソース特徴と、前記第2の暗黙的リソース特徴と、前記第2の重みとに基づいて、スティッチングリソース特徴を得ることと、を含む
請求項6に記載のソートモデルトレーニング方法。
【請求項8】
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、グラフニューラルネットワークを採用して前記第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
前記第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出することと、
前記第1の連携暗黙的特徴と第2の連携暗黙的特徴とに基づいて、暗黙的特徴を特定することと、を含む
請求項1に記載のソートモデルトレーニング方法。
【請求項9】
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがあると特定した場合、グラフニューラルネットワークを採用して前記第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
前記第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出することと、
前記第1の連携暗黙的特徴と第3の連携暗黙的特徴とに基づいて、暗黙的特徴を特定することと、を含む
請求項1に記載のソートモデルトレーニング方法。
【請求項10】
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがないと特定し、かつ前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがないと特定すると、前記第1のユーザデータと第1のリソースデータとに基づいて、暗黙的特徴を特定することをさらに含む
請求項1に記載のソートモデルトレーニング方法。
【請求項11】
前記明示的特徴と前記暗黙的特徴とに基づいて、ソートモデルをトレーニングすることは、
前記明示的特徴と前記暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、第1のスティッチング特徴を得て、前記第1のスティッチング特徴に対応するサンプルラベルを取得することと、
前記第1のスティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングすることと、を含む
請求項2に記載のソートモデルトレーニング方法。
【請求項12】
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得することと、
前記ユーザデータとリソースデータとに基づいて、暗黙的特徴を得ることと、
前記暗黙的特徴を前記ソートモデルに入力し、前記ソートモデルのソート結果に基づいて前記リソースデータから前記推奨すべきユーザにマッチングした推奨すべきリソースを特定することと、をさらに含む
請求項1に記載のソートモデルトレーニング方法。
【請求項13】
インテリジェント推奨方法であって、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得することと、
前記ユーザデータとリソースデータとに基づいて、暗黙的特徴を得ることと、
前記暗黙的特徴をソートモデルに入力し、前記ソートモデルのソート結果に基づいて前記リソースデータから前記推奨すべきユーザにマッチングした推奨すべきリソースを特定することと、を含み、
前記ソートモデルは請求項1~12のいずれか一項に記載のソートモデルトレーニング方法によってトレーニングされたものである、
インテリジェント推奨方法。
【請求項14】
ソートモデルトレーニング装置であって、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、かつソースドメインの第2のユーザデータと第2のリソースデータとを取得するためのデータ取得モジュールと、
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定するための特徴特定モジュールと、
前記暗黙的特徴に基づいて、前記ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングするための第1のトレーニングモジュールと、を含む
ソートモデルトレーニング装置。
【請求項15】
第2のトレーニングモジュールをさらに含み、
前記第2のトレーニングモジュールは、
前記第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定し、
前記明示的特徴と前記暗黙的特徴とに基づいて、ソートモデルをトレーニングするために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項16】
前記第2のトレーニングモジュールは、
前記第1のユーザデータと第1のリソースデータとに基づいて明示的特徴を特定する時に、
前記ターゲットドメインの数が複数である場合、同一の特徴符号化方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴符号化方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得し、各ターゲットドメインの第1の明示的ユーザ特徴のフォーマットが同一であり、各ターゲットドメインの第1の明示的リソース特徴のフォーマットが同一であり、
ターゲットドメイン毎に、前記第1の明示的ユーザ特徴と前記第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得るために用いられる、
請求項15に記載のソートモデルトレーニング装置。
【請求項17】
前記特徴特定モジュールは、第1の抽出手段と、第2の抽出手段と、第1のスティッチング手段と、第1の特定手段とを含み、
前記第1の抽出手段は、前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、協調フィルタリング方式を採用して前記第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出するために用いられ、
前記第2の抽出手段は、協調フィルタリング方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出するために用いられ、
前記第1のスティッチング手段は、前記第1の暗黙的ユーザ特徴と前記第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得るために用いられ、
前記第1の特定手段は、前記スティッチングユーザ特徴に基づいて、暗黙的特徴を特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項18】
前記第1のスティッチング手段は、
前記重複ユーザの第2のユーザデータの数と前記第1のユーザデータの数とに基づいて、前記第2の暗黙的ユーザ特徴に対応する第1の重みを特定し、
前記第1の暗黙的ユーザ特徴と、前記第2の暗黙的ユーザ特徴と、前記第1の重みとに基づいて、スティッチングユーザ特徴を得るために用いられる、
請求項17に記載のソートモデルトレーニング装置。
【請求項19】
前記特徴特定モジュールは、第3の抽出手段と、第4の抽出手段と、第2のスティッチング手段と、第2の特定手段とを含み、
前記第3の抽出手段は、前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがあると確定した場合、協調フィルタリング方式を採用して前記第1のリソースデータに対して第1の暗黙的リソース特徴を抽出するために用いられ、
前記第4の抽出手段は、協調フィルタリング方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出するために用いられ、
前記第2のスティッチング手段は、前記第1の暗黙的リソース特徴と前記第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得るために用いられ、
前記第2の特定手段は、前記スティッチングリソース特徴に基づいて、暗黙的特徴を特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項20】
前記第2のスティッチング手段は、
前記重複リソースの第2のリソースデータの数と前記第1のリソースデータの数とに基づいて、前記第2の暗黙的リソース特徴に対応する第2の重みを特定し、
前記第1の暗黙的リソース特徴と、前記第2の暗黙的リソース特徴と、前記第2の重みとに基づいて、スティッチングリソース特徴を得るために用いられる、
請求項19に記載のソートモデルトレーニング装置。
【請求項21】
前記特徴特定モジュールは、具体的に、
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、グラフニューラルネットワークを採用して前記第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出し、
前記第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出し、
前記第1の連携暗黙的特徴と第2の連携暗黙的特徴とに基づいて、暗黙的特徴を特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項22】
前記特徴特定モジュールは、具体的に、
前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがあると特定した場合、グラフニューラルネットワークを採用して前記第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出し、
前記第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出し、
前記第1の連携暗黙的特徴と第3の連携暗黙的特徴とに基づいて、暗黙的特徴を特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項23】
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがないと特定し、かつ前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがないと特定すると、前記第1のユーザデータと第1のリソースデータとに基づいて、暗黙的特徴を特定するための特徴特定モジュールをさらに含む、
請求項14に記載のソートモデルトレーニング装置。
【請求項24】
前記第1のトレーニングモジュールは、具体的に、
前記明示的特徴と前記暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、第1のスティッチング特徴を得て、前記第1のスティッチング特徴に対応するサンプルラベルを取得し、
前記第1のスティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングするために用いられる、
請求項15に記載のソートモデルトレーニング装置。
【請求項25】
推奨モジュールをさらに含み、
前記推奨モジュールは、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得し、
前記ユーザデータとリソースデータとに基づいて、暗黙的特徴を得て、
前記暗黙的特徴を前記ソートモデルに入力し、前記ソートモデルのソート結果に基づいて前記リソースデータから前記推奨すべきユーザにマッチングした推奨すべきリソースを特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項26】
インテリジェント推奨装置であって、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得するための第1の取得モジュールと、
前記ユーザデータとリソースデータとに基づいて、暗黙的特徴を得るための第2の取得モジュールと、
前記暗黙的特徴をソートモデルに入力し、前記ソートモデルのソート結果に基づいて、前記リソースデータから前記推奨すべきユーザにマッチングした推奨すべきリソースを特定するためのリソース特定モジュールと、を含み、
前記ソートモデルは、請求項1~12のいずれか一項に記載のソートモデルトレーニング方法によってトレーニングされたものである、
インテリジェント推奨装置。
【請求項27】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続するメモリとを含み、
前記メモリに、前記少なくとも1つのプロセッサによって実行され得るコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサによって実行されることで、前記少なくとも1つのプロセッサが請求項1~13のいずれか一項に記載の方法を実行することができる、
ことを特徴とする電子機器。
【請求項28】
コンピュータに請求項1~13のいずれか一項に記載の方法を実行させるためのコンピュータコマンドを記憶している、
ことを特徴とする非一時的なコンピュータ読取可能な記憶媒体。
【請求項29】
プロセッサにより実行される場合に、請求項1~13のいずれか一項に記載の方法を実現するコンピュータプログラムを含むコンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、2021年11月19日に中国特許庁に提出した、出願号が202111402589.4、名称が「インテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法及び装置」の中国特許出願の優先権を要求し、そのすべての内容は引用により本願に組み込まれる。
【0002】
本開示はコンピュータ技術分野に関し、特にデータ処理、機械学習の技術分野に関する。
【背景技術】
【0003】
クロスドメイン推奨(cross-domain recommendation)とは、推奨システムがより豊富なドメインからの相対的豊富な情報を利用して、より疎らなドメインにおける推奨パフォーマンスを向上させることを指す。従来技術において、ソースドメインのサンプルをターゲットドメインのトレーニングに加えることで、ターゲットドメインサンプルが疎らである問題を解決する。しかし、ソースドメインとターゲットドメインとのサンプル分布が一致していないため、「ネガチブトランスファー」現象を招来し、さらにモデルによる推奨過程での推奨効果に影響を及ぼす。
【発明の概要】
【0004】
本開示は、インテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法及び装置を提供した。
【0005】
本開示の一局面によれば、ソートモデルトレーニング方法を提供し、前記方法は、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、かつソースドメインの第2のユーザデータと第2のリソースデータとを取得することと、
ターゲットドメインとソースドメインとは重複がある場合、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することと、
暗黙的特徴に基づいて、ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングすることと、を含む。
【0006】
本開示の別の局面によれば、インテリジェント推奨方法を提供し、前記方法は、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得することと、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得ることと、
暗黙的特徴をソートモデルに入力し、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定することと、を含み、
ただし、ソートモデルは本開示のいずれかの実施例のトレーニング方法によってトレーニングされたものである。
【0007】
本開示の別の局面によれば、ソートモデルトレーニング装置を提供し、前記装置は、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、かつソースドメインの第2のユーザデータと第2のリソースデータとを取得するデータ取得モジュールと、
第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定する特徴特定モジュールと、
暗黙的特徴に基づいて、ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングする第1のトレーニングモジュールと、を含む。
【0008】
本開示の別の局面によれば、インテリジェント推奨装置を提供し、前記装置は、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得する第1の取得モジュールと、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得る第2の取得モジュールと、
暗黙的特徴をソートモデルに入力し、ソートモデルのソート結果に基づいて、リソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定するリソース特定モジュールと、を含み、
ただし、ソートモデルは、本開示のいずれかの実施例のトレーニング装置によってトレーニングされたものである。
【0009】
本開示の別の局面によれば、
少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサと通信接続するメモリとを含み、
該メモリに、該少なくとも1つのプロセッサによって実行され得るコマンドが記憶されており、該コマンドが該少なくとも1つのプロセッサによって実行されることで、該少なくとも1つのプロセッサが本開示のいずれかの実施例における方法を実行することができる、
電子機器を提供した。
【0010】
本開示の別の局面によれば、コンピュータに本開示のいずれかの実施例における方法を実行させるためのコンピュータコマンドを記憶している非一時的なコンピュータ読取可能な記憶媒体を提供した。
【0011】
本開示の別の局面によれば、プロセッサにより実行される場合に、本開示のいずれかの実施例における方法を実現するコンピュータプログラムを含むコンピュータプログラム製品を提供した。
【0012】
本開示は、インテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法及び装置を提供し、ソースドメインのデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0013】
理解されるべきこととして、本部分に記載された内容は、本開示の実施例のキーポイント又は重要な特徴を示すことを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明により容易に理解される。
【図面の簡単な説明】
【0014】
ここで、図面は、本技術案をよりよく理解するために用いられ、本開示を限定するものではない。
【0015】
【
図1】
図1は、本開示の一実施例におけるソートモデルトレーニング方法のフローチャートである。
【
図2】
図2は、本開示の一実施例におけるソートモデルトレーニング方法のフローチャートである。
【
図3】
図3は、本開示の一実施例におけるインテリジェント推奨方法のフローチャートである。
【
図4】
図4は、本開示の一実施例におけるソートモデルトレーニング装置の模式図である。
【
図5】
図5は、本開示の一実施例における特徴特定モジュールの模式図である。
【
図6】
図6は、本開示の一実施例におけるインテリジェント推奨装置の模式図である。
【
図7】
図7は、本開示の実施例のソートモデルトレーニング方法又はインテリジェント推奨方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0016】
以下、図面を参照して本開示の例示的な実施例を説明する。ここで、より理解しやすいために本開示の実施例の様々な詳細は含まれ、それらが例示的なものであると考えられるべきである。したがって、当業者であれば、ここで記載される実施例に対して様々な変更・修正を行うことができ、本開示の範囲及び精神から逸脱することはないと分るべきである。同様に、明確かつ簡潔に説明するために、以下の記載において周知の機能や構成に対する説明を省略する。
【0017】
本開示の実施例は、インテリジェント推奨用のソートモデルトレーニング方法を提供し、
図1は、本開示の一実施例のソートモデルトレーニング方法のフローチャートであり、該方法は、ソートモデルトレーニング装置に適用可能であり、例えば、該装置は、端末又はサーバ又は他の処理装置に配置されて実行する場合、ソートモデルトレーニング等を実行することができる。ここで、端末は、ユーザ装置(UE、User Equipment)、モバイル装置、携帯電話、コードレス電話、パーソナルデジタルアシスタント(PDA、Personal Digital Assistant)、ハンドヘルド装置、コンピューティング装置、車載装置、ウェアラブル装置等であってもよい。幾つかの可能な実現形態において、該方法は、さらにプロセッサがメモリに記憶されたコンピュータ可読命令を呼び出す方式によって実現することができる。
図1に示すように、以下のステップを含む。
【0018】
ステップS101において、ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、且つソースドメインの第2のユーザデータと第2のリソースデータとを取得する。
【0019】
ここで、ターゲットドメイン、ソースドメインは、いずれかの業務シーン又は業務製品であってもよく、ソースドメイン、ターゲットドメインの数は、1つであってもよく、複数であってもよく、本開示ではこれを限定しない。ソースドメインと比べて、ターゲットドメインは、トレーニング済みのソートモデルが適用されるドメインである。
【0020】
端末又はサーバは、予め作成されたターゲットドメインデータベースとソースドメインデータベースのそれぞれから、ターゲットドメインのデータとソースドメインのデータを取得し、第1のユーザデータ、第2のユーザデータは、ユーザの基本データ(例えば、ユーザID、年齢、性別等)、ユーザ行為シーケンスデータ(ユーザの使用行為記録、例えば、一定の時間内にユーザがあるカテゴリの文章を連続的に閲覧すること)、ユーザのリクエストデータ(リクエストを送信するIPアドレス、リクエストを送信する端末情報等)を含んでもよいが、これらに限られない。第1のリソースデータ、第2のリソースデータは、リソースID、リソースカテゴリ(例えば、文章のタイトル、カテゴリ等)、及び業務シーンに相関するデータ(例えば、教育類、生活類の業務シーン等)を含むが、これらに限られない。
【0021】
ステップS102において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定する。
【0022】
ここで、ターゲットドメインのユーザデータ及びリソースデータ、ソースドメインのユーザデータ及びリソースデータに基づいて、共に暗黙的特徴を特定し、暗黙的特徴は明確な物理的意味のない特徴ベクトルであってよい。
【0023】
ステップS103において、暗黙的特徴に基づいて、ソートモデルをトレーニングする。
【0024】
ターゲットドメインのデータとソースドメインのデータとに基づいて得られた暗黙的特徴によって、ソートモデルのトレーニングサンプルセットを構築し、ソートモデルをトレーニングする。ここで、ソートモデルは、ターゲットドメインのユーザに対してリソース推奨を行うために用いられる。
【0025】
本開示の実施例が提供したソートモデルトレーニング方法は、ソースドメインのデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0026】
一つの可能な実現形態において、ソートモデルトレーニング方法は、
第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定することと、
明示的特徴と暗黙的特徴とに基づいて、ソートモデルをトレーニングすることと、をさらに含む。
【0027】
実際の応用において、データ統計等の方式によって、ターゲットドメインにおける第1のユーザデータと第1のリソースデータとに対してユーザ特徴及びリソース特徴を抽出して、ターゲットドメインの明示的特徴としてよく、明示的特徴は明確な物理的意味を有する特徴であってよく、例えば、数字でユーザの年齢等を表す。ターゲットドメインのデータに基づいて得られた明示的特徴、及びターゲットドメインのデータとソースドメインのデータとに基づいて得られた暗黙的特徴を利用して、ソートモデルのトレーニングサンプルセットを構築して、ソートモデルをトレーニングし、ここで、ソートモデルは、ターゲットドメインのユーザに対してリソース推奨を行うために用いられる。
【0028】
本開示の実施例において、明示的特徴と暗黙的特徴とに基づいてソートモデルをトレーニングし、トレーニングサンプルの特徴情報を豊富にして、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0029】
本開示の技術案において、ターゲットドメインの数が複数である場合、如何にして明示的特徴を特定するかについて、具体的には、以下の実施例の通りである。
【0030】
一つの可能な実現形態において、第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定することは、
ターゲットドメインの数が複数である場合、同一の特徴符号化方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴符号化方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得し、各ターゲットドメインの第1の明示的ユーザ特徴のフォーマットが同一であり、各ターゲットドメインの第1の明示的リソース特徴のフォーマットが同一であることと、
ターゲットドメイン毎に、第1の明示的ユーザ特徴と第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得ることと、を含む。
【0031】
実際の応用において、ターゲットドメインが複数であり、即ち、トレーニング済みのソートモデルが複数のターゲットドメインに共通に使用されるものであれば、各ターゲットドメインに同一の特徴抽取ロジックを配置して、抽取された特徴に対して同一の符号化方式を採用して、統一した特徴フォーマットを得ることで、異なるターゲットドメインの特徴を類似する特徴空間にマッピングさせ、各ターゲットドメインのデータ分布を近づける。例えば、抽取された一つ目のターゲットドメインのユーザAの年齢特徴が26であり、抽取された二つ目のターゲットドメインのユーザBの年齢特徴が30であり、この2つのユーザ特徴を抽出するロジックが同一であり、さらに、この2つのユーザ特徴を同一の符号化方式で符号化して、同一のフォーマットの特徴を得る。同一の特徴符号化方式を採用して各ターゲットドメインのユーザデータから明示的ユーザ特徴を取得し、且つ同一の特徴符号化方式を採用して各ターゲットドメインのリソースデータから明示的リソース特徴を取得し、ターゲットドメイン毎に、明示的ユーザ特徴と明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして最終の明示的特徴を得る。
【0032】
ここで、第1のスティッチング方式は、明示的ユーザ特徴と明示的リソース特徴とを横方向にスティッチングすることであってもよく、例えば、明示的ユーザ特徴が128次元ベクトルであり、明示的リソース特徴が100次元ベクトルであり、明示的ユーザ特徴ベクトルと明示的リソース特徴ベクトルとを横方向にスティッチングして、128+100=228次元の明示的特徴ベクトルを得る。
【0033】
本開示の実施例において、複数のターゲットドメインのデータを採用することは、サンプル数を増加させ、単一のターゲットドメインのトレーニングサンプルのデータが疎らである問題を解決することができる。同一の特徴符号化方式を採用して各ターゲットドメインの明示的ユーザ特徴、明示的リソース特徴を取得することは、抽出された明示的特徴を類似する特徴空間をマッピングさせ、近いデータ分布を有し、異なるドメインのデータ連携トレーニングによるネガチブトランスファー現象を軽減することができる。
【0034】
一つの可能な実現形態において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
第1のユーザデータと第2のユーザデータとに基づいて、ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、協調フィルタリング方式を採用して第1のユーザデータに対して第1の暗黙的ユーザ特徴を特定することと、
協調フィルタリング方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出することと、
第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得ることと、
スティッチングユーザ特徴に基づいて、暗黙的特徴を特定することと、を含む。
【0035】
ここで、ターゲットドメインとソースドメインとは重複があることは、ターゲットドメインとソースドメインとのユーザ、リソースのうちの少なくとも一項に重複があることを含んでよく、第1のユーザデータと第2のユーザデータとに基づいて、ターゲットドメインとソースドメインとは重複ユーザがあるか否かを判定し、重複ユーザは、ソースドメインのユーザでもあり、ターゲットドメインのユーザでもあり、2つのドメインのそれぞれに対応する製品にいずれも使用記録があるユーザを含んでよく、例えば、ユーザAは検索類アプリケーションプログラムB1も使用し、ソーシャル類アプリケーションプログラムB2も使用すれば、ユーザAはアプリケーションプログラムB1とアプリケーションプログラムB2との重複ユーザである。
【0036】
ソースドメインとターゲットドメインとは重複ユーザがあれば、協調フィルタリング方式を採用して第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出し、第1の暗黙的ユーザ特徴は暗黙的UCF(User Collaborative Filtering)特徴であってよい。同様な暗黙的特徴抽出方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出し、ここで、重複ユーザの第2のユーザデータは重複ユーザのソースドメインでのユーザデータであってよい。第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングし、ここで、第2のスティッチング方式は、第1の暗黙的ユーザ特徴の特徴ベクトルと第2の暗黙的ユーザ特徴の特徴ベクトルとの2つの特徴ベクトルにおける対応位置の要素を加算することであってよく、例えば、第1の暗黙的ユーザ特徴が128次元ベクトルであり、第2の暗黙的ユーザ特徴も128次元ベクトルであれば、第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして得られたスティッチングユーザ特徴も128次元ベクトルである。
【0037】
ここで、スティッチングユーザ特徴を暗黙的特徴とするか、或いはスティッチングユーザ特徴を暗黙的特徴の1つの部分としてよく、代替的に、スティッチングユーザ特徴に基づいて、暗黙的特徴を特定することは、
協調フィルタリング方式を採用して第1のリソースデータに対して第1の暗黙的リソース特徴を抽出することと、
グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出することと、
第1の連携暗黙的特徴、第2の連携暗黙的特徴を第2のスティッチング方式に従ってスティッチングして、第1のスティッチング連携暗黙的特徴を得ることと、
第1の暗黙的リソース特徴と、第1のスティッチング連携暗黙的特徴と、スティッチングユーザ特徴とを第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得ることと、を含む。
【0038】
本開示の実施例において、ソースドメインとターゲットドメインとは重複ユーザがある場合、ソースドメインのユーザデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、トレーニングサンプルの特徴情報を豊富にし、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。そして、協調フィルタリングの方式を採用して暗黙的特徴を抽出することは、方法が簡単であり、ディープラーニングモデルによって暗黙的特徴を抽出することよりも、計算の複雑さがより低くなる。
【0039】
一つの可能な実現形態において、第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得ることは、
重複ユーザの第2のユーザデータの数と第1のユーザデータの数とに基づいて、第2の暗黙的ユーザ特徴に対応する第1の重みを特定することと、
第1の暗黙的ユーザ特徴と、第2の暗黙的ユーザ特徴と、第1の重みとに基づいて、スティッチングユーザ特徴を得ることと、を含む。
【0040】
実際の応用において、第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とをスティッチングする時、ソースドメインとターゲットドメインとのデータ規模に応じて、引き込まれるソースドメインデータの暗黙的ユーザ特徴の重みを特定し、第1の暗黙的ユーザ特徴、第2の暗黙的ユーザ特徴を重み付け演算して、スティッチングユーザ特徴を得る。
【0041】
ここで、第1のユーザデータの数は、ターゲットドメインから取得されたユーザデータのサンプル数であってよく、例えば、ターゲットドメインから100人のユーザに対応するユーザデータを取得し、該100人のユーザは200個のユーザデータに対応すれば、第1のユーザデータの数は200である。
【0042】
重複ユーザの第2のユーザデータの数は、重複ユーザのソースドメインでのサンプル数、即ちソースドメインに引き込まれたサンプル規模であってよい。例えば、ソースドメインとターゲットドメインとは100人の重複ユーザがあり、該100人の重複ユーザがソースドメインで100個のユーザデータに対応すれば、重複ユーザの第2のユーザデータの数が100である。該100人の重複ユーザがソースドメインで300個のユーザデータに対応すれば、重複ユーザの第2のユーザデータの数が300である。
【0043】
本開示の実施例において、ソースドメインデータとターゲットドメインデータとのサンプル規模によって、ソースドメインデータに対応する暗黙的特徴を引き込む重みを特定し、重み付け演算の方式によりソースドメインの暗黙的ベクトルを引き込み、トレーニングサンプルの特徴情報を豊富にした。
【0044】
一つの可能な実現形態において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがあると特定した場合、協調フィルタリング方式を採用して第1のリソースデータに対して第1の暗黙的リソース特徴を抽出することと、
協調フィルタリング方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出することと、
第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得ることと、
スティッチングリソース特徴に基づいて、暗黙的特徴を特定することと、を含む。
【0045】
実際の応用において、第1のリソースデータと第2のリソースデータとに基づいて、ターゲットドメインとソースドメインとは重複リソースがあるか否かを判定し、重複リソースは、ソースドメインのリソースでもあり、ターゲットドメインのリソースでもあるものを含んでよい。例えば、文章Cは検索類アプリケーションプログラムB1におけるリソースでもあり、ソーシャル類アプリケーションプログラムB2におけるリソースでもあれば、文章CはアプリケーションプログラムB1とアプリケーションプログラムB2との重複リソースである。
【0046】
ソースドメインとターゲットドメインとは重複リソースがあれば、協調フィルタリング方式を採用して第1のリソースデータに対して第1の暗黙的リソース特徴を抽出し、第1の暗黙的リソース特徴は暗黙的ICF(Item Collaborative Filtering)特徴であってよい。同様な暗黙的特徴抽出方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出し、ここで、重複リソースの第2のリソースデータは重複リソースのソースドメインでのリソースデータであってよい。第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングし、ここで、第2のスティッチング方式は、第1の暗黙的リソース特徴の特徴ベクトルと第2の暗黙的リソース特徴の特徴ベクトルとの2つの特徴ベクトルにおける対応位置の要素を加算することであってよく、例えば、第1の暗黙的リソース特徴が128次元ベクトルであり、第2の暗黙的リソース特徴も128次元ベクトルであれば、第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして得られたスティッチングリソース特徴も128次元ベクトルである。
【0047】
ここで、スティッチングリソース特徴を暗黙的特徴とするか、或いはスティッチングリソース特徴を暗黙的特徴の1つの部分としてよく、代替的に、スティッチングリソース特徴に基づいて、暗黙的特徴を特定することは、
協調フィルタリング方式を採用して第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出することと、
グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出することと、
第1の連携暗黙的特徴、第3の連携暗黙的特徴を第2のスティッチング方式に従ってスティッチングして、第2のスティッチング連携暗黙的特徴を得ることと、
第1の暗黙的ユーザ特徴と、第2のスティッチング連携暗黙的特徴と、スティッチングリソース特徴とを第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得ることと、を含む。
【0048】
本開示の実施例において、ソースドメインとターゲットドメインとは重複リソースがある場合、ソースドメインのリソースデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、トレーニングサンプルの特徴情報を豊富にし、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。そして、協調フィルタリングの方式を採用して暗黙的特徴を抽出することは、方法が簡単であり、ディープラーニングモデルによって暗黙的特徴を抽出することよりも、計算の複雑さがより低くなる。
【0049】
一つの可能な実現形態において、第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得ることは、
重複リソースの第2のリソースデータの数と第1のリソースデータの数とに基づいて、第2の暗黙的リソース特徴に対応する第2の重みを特定することと、
第1の暗黙的リソース特徴と、第2の暗黙的リソース特徴と、第2の重みとに基づいて、スティッチングリソース特徴を得ることと、を含む。
【0050】
実際の応用において、第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とをスティッチングする時、ソースドメインとターゲットドメインとのデータ規模に応じて、引き込まれるソースドメインデータの暗黙的リソース特徴の重みを特定し、第1の暗黙的リソース特徴、第2の暗黙的リソース特徴を重み付け演算して、スティッチングリソース特徴を得る。
【0051】
ここで、第1のリソースデータの数は、ターゲットドメインから取得されたリソースデータのサンプル数であってよく、例えば、ターゲットドメインから100個のリソースに対応するリソースデータを取得し、該100個のリソースは200個のリソースデータに対応すれば、第1のリソースデータの数は200である。
【0052】
重複リソースの第2のリソースデータの数は、重複リソースのソースドメインでのサンプル数、即ちソースドメインに引き込まれたサンプル規模であってよい。例えば、ソースドメインとターゲットドメインとは100個の重複リソースがあり、該100個の重複リソースがソースドメインで100個のリソースデータに対応すれば、重複リソースの第2のリソースデータの数が100である。該100個の重複リソースがソースドメインで300個のリソースデータに対応すれば、重複リソースの第2のリソースデータの数が300である。
【0053】
本開示の実施例において、ソースドメインデータとターゲットドメインデータとのサンプル規模によって、ソースドメインデータに対応する暗黙的特徴を引き込む重みを特定し、重み付け演算の方式によりソースドメインの暗黙的ベクトルを引き込み、トレーニングサンプルの特徴情報を豊富にした。
【0054】
一つの可能な実現形態において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出することと、
第1の連携暗黙的特徴と第2の連携暗黙的特徴とに基づいて、暗黙的特徴を特定することと、を含む。
【0055】
実際の応用において、ターゲットドメインとソースドメインとは重複ユーザがある場合、グラフニューラルネットワーク(Graph Neural Network,GNN)を採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出してよく、第1の連携暗黙的特徴は暗黙的GCF(Graph Collaborative Filtering)特徴であってよい。同様な暗黙的特徴抽出方式を採用して第1のリソースデータと重複ユーザの第2のユーザデータとに対して第2の連携暗黙的リソース特徴を抽出し、第1の連携暗黙的特徴と第2の連携暗黙的特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチング連携暗黙的特徴を得て、暗黙的特徴とする。又は、スティッチング連携暗黙的特徴を暗黙的特徴の一部とし、さらに暗黙的ユーザ特徴、スティッチングリソース特徴と第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得る。
【0056】
本開示の実施例において、グラフニューラルネットワークによって暗黙的特徴を抽出し、特徴抽出精度が高く、効果がよい。
【0057】
代替的に、ターゲットドメインとソースドメインとは重複ユーザもあるし、重複リソースもある場合、重複ユーザの第2のユーザデータと重複リソースの第2のリソースデータとを利用して、GNNによって連携暗黙的特徴を抽出し、該連携暗黙的特徴に基づいて、最終の暗黙的特徴を特定することができる。
【0058】
一つの可能な実現形態において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがあると特定した場合、グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出することと、
第1の連携暗黙的特徴と第3の連携暗黙的特徴とに基づいて、暗黙的特徴を特定することと、を含む。
【0059】
実際の応用において、ターゲットドメインとソースドメインとは重複リソースがある場合、GNNによって第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出してよく、第1の連携暗黙的特徴は暗黙的GCF(Graph Collaborative Filtering)特徴であってよい。同様な暗黙的特徴抽出方式を採用して第1のユーザデータと重複リソース的第2のリソースデータとに対して第3の連携暗黙的リソース特徴を抽出し、第1の連携暗黙的特徴と第3の連携暗黙的特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチング連携暗黙的特徴を得て、暗黙的特徴とする。又は、スティッチング連携暗黙的特徴を暗黙的特徴の一部とし、さらに暗黙的リソース特徴、スティッチングユーザ特徴と第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得る。
【0060】
本開示の実施例において、グラフニューラルネットワークによって暗黙的特徴を抽出し、特徴抽出精度が高く、効果がよい。
【0061】
一つの可能な実現形態において、
第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがないと特定し、且つ第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがないと特定すると、第1のユーザデータと第1のリソースデータとに基づいて、暗黙的特徴を特定することをさらに含む。
【0062】
実際の応用において、ターゲットドメインとソースドメインとは、重複ユーザもないし、重複リソースもない場合、第1のユーザデータと第1のリソースデータとに対して明示的特徴を抽出し、さらに協調フィルタリングの方式によって第1のユーザデータと第1のリソースデータとのそれぞれに対して第1の暗黙的ユーザ特徴と第1の暗黙的リソース特徴とを抽出し、さらにGNNによって第1のユーザデータと第1のリソースデータとに対して連携暗黙的特徴を抽出し、第1の暗黙的ユーザ特徴と、第1の暗黙的リソース特徴と、連携暗黙的特徴とをスティッチングして、暗黙的特徴を得る。明示的特徴と暗黙的特徴とをスティッチングしてモデルの1つのトレーニングサンプルを得る。
【0063】
本開示の実施例において、ターゲットドメインとソースドメインとは重複ユーザもないし、重複リソースもない場合、ターゲットドメインのユーザデータとリソースデータとを利用して暗黙的特徴を特定し、明示的特徴と暗黙的特徴とに基づいてトレーニングサンプルを構築し、このようにトレーニングされたソートモデルはリソース推奨で推定の正確性がより高くなる。
【0064】
一例において、以下の式(1)と(2)によって暗黙的ベクトルを算出することができる。
【0065】
【0066】
【0067】
ただし、
【数3】
はUCF、ICF、GCFベクトルを表し、
【数4】
は暗黙的特徴を表し,
【数5】
はターゲットドメインのデータの暗黙的特徴を表し,
【数6】
はソースドメインのデータの暗黙的特徴を表し、
【数7】
は第i個のターゲットドメインに引き込まれたソースドメインの暗黙的特徴の重みを表し、ターゲットドメインが複数ある場合、N
iは第i個のターゲットドメインのサンプル規模を表し、Mはソースドメインのサンプル規模を表す。
【0068】
一つの可能な実現形態において、明示的特徴と暗黙的特徴とに基づいて、ソートモデルをトレーニングすることは、
明示的特徴と暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、第1のスティッチング特徴を得て、第1のスティッチング特徴に対応するサンプルラベルを取得することと、
第1のスティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングすることと、を含む。
【0069】
実際の応用において、明示的特徴と暗黙的特徴とを第1のスティッチング方式に従ってスティッチングすることで得られた第1のスティッチング特徴を1つのトレーニングサンプルとし、このように複数のユーザデータと複数のリソースデータとに基づいて、複数のトレーニングサンプルを得て、トレーニングサンプル毎に、ソートモデルの具体的な適用シーンに応じて、サンプルラベルを配置し、例えば、サンプルラベルは、ユーザがクリックしたか否か、ユーザが閲覧した時間長さ、ユーザが消費したか否か等であってもよい。トレーニングサンプルとサンプルラベルとからなるトレーニングサンプルセットを利用してソートモデルをトレーニングする。
【0070】
本開示の実施例において、ターゲットドメインのデータに基づいて明示的特徴を特定し、ソースドメインとターゲットドメインとは重複がある場合、ソースドメインのデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、明示的特徴と暗黙的特徴とに基づいてソートモデルをトレーニングし、トレーニングサンプルの特徴情報を豊富にし、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0071】
一つの可能な実現形態において、方法は、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得することと、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得ることと、
暗黙的特徴をソートモデルに入力し、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定することと、をさらに含む。
【0072】
実際の応用において、ソートモデルをリソース推奨に用いて、協調フィルタリング及びGNNによって、ユーザデータとリソースデータとの各々に対応する暗黙的ユーザ特徴と暗黙的リソース特徴とをそれぞれ抽出し、第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得る。暗黙的特徴をソートモデルに入力して、ソートモデルのソート結果に基づいて、リソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定する。
【0073】
本開示の実施例において、ソートモデルのソート結果に基づいて推奨すべきユーザに対してリソース推奨を行い、ソートモデルはターゲットドメインデータとソースドメインデータとの暗黙的特徴に基づいてトレーニングされたものであり、該ソートモデルを使用してリソース推奨を行い、推奨効果を向上させることができる。
【0074】
図2は、本開示の一実施例におけるソートモデルトレーニング方法のフローチャートである。
図2に示すように、該方法は、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、且つソースドメインの第2のユーザデータと第2のリソースデータとを取得するステップS201と、
前記ターゲットドメインの数が複数である場合、同一の特徴抽取方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴抽取方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得するステップS202と、
ターゲットドメイン毎に、前記第1の明示的ユーザ特徴と前記第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得るステップS203と、
ターゲットドメインとソースドメインとは重複がある場合、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定するステップS204と、
明示的特徴と暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、スティッチング特徴を得て、スティッチング特徴に対応するサンプルラベルを取得するステップS205と、
スティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングするステップS206とを含む。
【0075】
本開示の実施例において、複数のターゲットドメインのデータを採用して、サンプル数を増加させ、単一のターゲットドメインのトレーニングサンプルのデータが疎らである問題を解決することができる。同一の特徴符号化方式を採用して各ターゲットドメインの明示的ユーザ特徴、明示的リソース特徴を取得して、抽出された明示的特徴を類似する特徴空間にマッピングさせ、近いデータ分布を有し、異なるドメインのデータ連携トレーニングによるネガチブトランスファー現象を減軽することができる。なお、ソースドメインとターゲットドメインとは重複がある場合、ソースドメインのデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、明示的特徴と暗黙的特徴とに基づいてソートモデルをトレーニングして、トレーニングサンプルの特徴情報を豊富にし、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0076】
本開示の実施例は、リソース推奨方法を提供し、
図3は本開示の一実施例におけるリソース推奨方法のフローチャートであり、該方法はリソース推奨装置に適用され、例えば、該装置は端末又はサーバ又は他の処理装置に配置されて実行する場合、ソートモデルトレーニング等を実行することができる。ここで、端末は、ユーザ装置(UE、User Equipment)、モバイル装置、携帯電話、コードレス電話、パーソナルデジタルアシスタント(PDA、Personal Digital Assistant)、ハンドヘルド装置、コンピューティング装置、車載装置、ウェアラブル装置等であってもよい。幾つかの可能な実現形態において、該方法は、さらにプロセッサがメモリに記憶されたコンピュータ可読命令を呼び出す方式によって実現することができる。
図3に示すように、インテリジェント推奨方法は、以下のステップを含む。
【0077】
ステップS301において、ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得する。
【0078】
ステップS302において、ユーザデータとリソースデータとに基づいて、暗黙的特徴を得る。
【0079】
ここで、協調フィルタリング及びGNNによってユーザデータとリソースデータとの各々に対応する暗黙的ユーザ特徴と暗黙的リソース特徴とをそれぞれ取得し、第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得る。
【0080】
ステップS303において、暗黙的特徴をソートモデルに入力して、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定する。
【0081】
ここで、ソートモデルは本開示のいずれかの実施例のトレーニング方法によってトレーニングされたものである。ソート結果は各推奨すべきユーザと各推奨すべきリソースとのマッチング程度に対応する確率であってもよく、各推奨すべきユーザと各推奨すべきリソースとがマッチングしたか否かであってもよい。
【0082】
本開示の実施例において、ソートモデルのソート結果に基づいて推奨すべきユーザに対してリソース推奨を行い、ソートモデルはターゲットドメインデータとソースドメインデータの暗黙的特徴に基づいてトレーニングされたものであり、該ソートモデルを使用してリソース推奨を行って、推奨効果を向上させることができる。
【0083】
図4は、本開示の一実施例におけるインテリジェント推奨用のソートモデルトレーニング装置の模式図である。
図4に示すように、インテリジェント推奨用のソートモデルトレーニング装置は、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、且つソースドメインの第2のユーザデータと第2のリソースデータとを取得するためのデータ取得モジュール401と、
第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定するための特徴特定モジュール402と、
暗黙的特徴に基づいて、ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングするための第1のトレーニングモジュール403と、を含む。
【0084】
一つの可能な実現形態において、装置は第2のトレーニングモジュールをさらに含み、第2のトレーニングモジュールは、
第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定し、
明示的特徴と暗黙的特徴とに基づいて、ソートモデルをトレーニングするために用いられる。
【0085】
一つの可能な実現形態において、第2のトレーニングモジュールは、
第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定する時に、
ターゲットドメインの数が複数である場合、同一の特徴符号化方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴符号化方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得し、各ターゲットドメインの第1の明示的ユーザ特徴のフォーマットが同一であり、各ターゲットドメインの第1の明示的リソース特徴のフォーマットが同一であり、
ターゲットドメイン毎に、第1の明示的ユーザ特徴と第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得るために用いられる。
【0086】
図5は、本開示の一実施例における特徴特定モジュールの模式図である。
図5に示すように、一つの可能な実現形態において、特徴特定モジュールは、第1の抽出手段501と、第2の抽出手段502と、第1のスティッチング手段503と、第1の特定手段504とを含み、
第1の抽出手段501は、第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、協調フィルタリング方式を採用して第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出するために用いられ、
第2の抽出手段502は、協調フィルタリング方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出するために用いられ、
第1のスティッチング手段503は、第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得るために用いられ、
第1の特定手段504は、スティッチングユーザ特徴に基づいて、暗黙的特徴を特定するために用いられる。
【0087】
一つの可能な実現形態において、第1のスティッチング手段503は、
重複ユーザの第2のユーザデータの数と第1のユーザデータの数とに基づいて、第2の暗黙的ユーザ特徴に対応する第1の重みを特定し、
第1の暗黙的ユーザ特徴と、第2の暗黙的ユーザ特徴と、第1の重みとに基づいて、スティッチングユーザ特徴を得るために用いられる。
【0088】
一つの可能な実現形態において、特徴特定モジュール402は、第3の抽出手段と、第4の抽出手段と、第2のスティッチング手段と、第2の特定手段とを含み、
第3の抽出手段は、第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがあると特定した場合、協調フィルタリング方式を採用して第1のリソースデータに対して第1の暗黙的リソース特徴を抽出するために用いられ、
第4の抽出手段は、協調フィルタリング方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出するために用いられ、
第2のスティッチング手段は、第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得るために用いられ、
第2の特定手段は、スティッチングリソース特徴に基づいて、暗黙的特徴を特定するために用いられる。
【0089】
一つの可能な実現形態において、第2のスティッチング手段は、
重複リソースの第2のリソースデータの数と第1のリソースデータの数とに基づいて、第2の暗黙的リソース特徴に対応する第2の重みを特定し、
第1の暗黙的リソース特徴と、第2の暗黙的リソース特徴と、第2の重みとに基づいて、スティッチングリソース特徴を得るために用いられる。
【0090】
一つの可能な実現形態において、特徴特定モジュール402、具体的に、
第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出し、
第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出し、
第1の連携暗黙的特徴と第2の連携暗黙的特徴とに基づいて、暗黙的特徴を特定するために用いられる。
【0091】
一つの可能な実現形態において、特徴特定モジュール402は、具体的に、
第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがあると特定した場合、グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出し、
第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出し、
第1の連携暗黙的特徴と第3の連携暗黙的特徴とに基づいて、暗黙的特徴を特定するために用いられる。
【0092】
一つの可能な実現形態において、特徴特定モジュールをさらに含み、特徴特定モジュールは、
第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがなく、かつ第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがないと特定すると、第1のユーザデータと第1のリソースデータとに基づいて、暗黙的特徴を特定するために用いられる。
【0093】
一つの可能な実現形態において、第1のトレーニングモジュール403は、具体的に、
明示的特徴と暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、第1のスティッチング特徴を得て、第1のスティッチング特徴に対応するサンプルラベルを取得し、
第1のスティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングするために用いられる。
【0094】
一つの可能な実現形態において、推奨モジュールをさらに含み、推奨モジュールは、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得し、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得て、
暗黙的特徴をソートモデルに入力して、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定するために用いられる。
【0095】
図6は、本開示の一実施例におけるインテリジェント推奨装置の模式図である。
図6に示すように、インテリジェント推奨装置は、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得するための第1の取得モジュール601と、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得るための第2の取得モジュール602と、
暗黙的特徴をソートモデルに入力して、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定するためのリソース特定モジュール603と、を含み、
ここで、ソートモデルは、本開示のいずれかの実施例のトレーニング方法によってトレーニングされたものである。
【0096】
本開示の実施例の各装置における各手段、モジュール又はサブモジュールの機能は、上記方法実施例における対応する説明を参照することができ、ここで説明を繰り返さない。
【0097】
本開示の技術案では、係られたユーザ個人情報の取得、記憶及び適用等は、いずれも関連法律や法規の規定に合致しており、公序良俗に反していない。
【0098】
本開示の別の局面によれば、
少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサと通信接続するメモリとを含み、
該メモリに、該少なくとも1つのプロセッサによって実行され得るコマンドが記憶されており、該コマンドが該少なくとも1つのプロセッサによって実行されることで、該少なくとも1つのプロセッサが本開示のいずれかの実施例における方法を実行することができる、
電子機器を提供した。
【0099】
本開示の別の局面によれば、コンピュータに本開示のいずれかの実施例における方法を実行させるためのコンピュータコマンドを記憶している非一時的なコンピュータ読取可能な記憶媒体を提供した。
【0100】
本開示の別の局面によれば、プロセッサにより実行される場合に、本開示のいずれかの実施例における方法を実現するコンピュータプログラムを含むコンピュータプログラム製品を提供した。
【0101】
図7は、本開示の実施例を実施可能な例示的な電子機器700の模式的なブロック図を示している。電子機器700は、様々な形式のデジタルコンピュータを示すことを目的とし、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ及び他の適切なコンピュータである。電子機器は、さらに様々な形式の移動装置を示してもよく、例えば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブル機器及び他の類似の演算装置である。本明細書に示された部材、それらの接続及び関係、並びにそれらの機能は、例示に過ぎず、本明細書に記載された及び/又は要求された本開示の実現を限定しない。
【0102】
図7に示すように、機器700は、計算手段701を含み、計算手段701は、リードオンリーメモリ(ROM)702に記憶されたコンピュータプログラム又は記憶手段708からランダムアクセスメモリ(RAM)703にロードされたコンピュータプログラムに基づいて、様々な適切な動作及び処理を実行してもよい。RAM703には、さらに機器700の操作に必要な様々なプログラム及びデータを記憶してもよい。計算手段701、ROM702、及びRAM703は、バス704を介して相互に接続される。入出力(I/O)インターフェース705も、バス704に接続される。
【0103】
機器700における複数の部品は、I/Oインターフェース705に接続され、例えばキーボード、マウス等の入力手段706と、例えば様々な種類のディスプレイ、スピーカ等の出力手段707と、例えば磁気ディスク、光ディスク等の記憶手段708と、例えばネットワークカード、モデム、無線通信トランシーバ等の通信手段709とを含む。通信手段709は、機器700がインターネット等のコンピュータネットワーク及び/又は各種の電気ネットワークを介して他の機器と情報・データをやり取りすることを可能にする。
【0104】
計算手段701は、処理及び演算能力を有する各種の汎用及び/又は専用の処理モジュールであってもよい。計算手段701の幾つかの例として、中央処理ユニット(CPU)、GPU(Graphics Processing Unit)、各種専用の人工知能(AI)演算チップ、各種機械学習モデルアルゴリズムをランニングする演算ユニット、DSP(Digital Signal Processor)、並びに任意の適切なプロセッサ、コントローラ、マイクロコントローラ等が挙げられるが、これらに限定されない。計算手段701は、前文で記載された各方法及び処理、例えばインテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法を実行する。例えば、幾つかの実施例において、インテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法は、例えば記憶手段708のような機械可読媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ROM 702及び/又は通信手段709を介して機器700にロード及び/又はインストールされてもよい。コンピュータプログラムがRAM703にロードされて計算手段701により実行される場合、前文に記載のインテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法の1つ又は複数のステップを実行してもよい。代替的に、他の実施例において、計算手段701は、他の任意の適切な方式(例えば、ファームウェアを介する)によりインテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法を実行するように構成されてもよい。
【0105】
本明細書で以上に説明されたシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、コンプレックスプログラマブルロジックデバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現されてもよい。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムにおいて実施され、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行され及び/又は解釈されることが可能であり、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に伝送することができることを含んでもよい。
【0106】
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせで作成されてもよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよく、それによって、プログラムコードがプロセッサ又はコントローラにより実行される時に、フローチャート及び/又はブロック図に規定された機能・操作が実施される。プログラムコードは、機器に完全に実行されてもよく、部分的に機器で実行されてもよく、独立したソフトウェアパッケージとして部分的に機器で実行され、かつ部分的に遠隔機器で実行されるか又は完全に遠隔機器又はサーバで実行されてもよい。
【0107】
本開示のコンテキストにおいて、機械可読媒体は、有形の媒体であってもよく、命令実行システム、装置又は電子機器に使用され、又は命令実行システム、装置又は電子機器と組み合わせて使用されるプログラムを含んで又は記憶してもよい。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子の、磁気的、光学的、電磁的、赤外線の、又は半導体システム、装置又は電子機器、又は上記内容の任意の適切な組み合わせを含んでもよいが、それらに限定されない。機械可読記憶媒体のより具体的な例としては、1つ以上の線による電気的接続、携帯式コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、コンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶装置、磁気記憶装置、又は上記内容の任意の適切な組み合わせを含む。
【0108】
ユーザとの対話を提供するために、コンピュータにここで説明されたシステム及び技術を実施させてもよく、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを備え、ユーザは、該キーボード及び該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置は、さらにユーザとの対話を提供してもよく、例えば、ユーザに提供されたフィードバックは、いかなる形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、かついかなる形式(音声入力、語音入力又は、触覚入力を含む)でユーザからの入力を受信してもよい。
【0109】
ここで説明されたシステム及び技術は、バックグラウンド部品を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア部品を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド部品を含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザが該グラフィカルユーザインタフェース又は該ネットワークブラウザを介してここで説明されたシステム及び技術の実施形態と対話することができる)、又はこのようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品のいずれかの組み合わせを含むコンピューティングシステムに実施されることが可能である。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によりシステムの部品を互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)及びインターネットを例示的に含む。
【0110】
コンピュータシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバ同士は、一般的に離れており、通常、通信ネットワークを介して対話する。クライアントとサーバとの関係は、該当するコンピュータ上でランニングし、クライアント-サーバの関係を有するコンピュータプログラムによって生成される。サーバは、クラウドサーバであってもよく、分散型システムのサーバであってもよく、又はブロックチェーンを組合せたサーバであってもよい。
【0111】
理解されるべきこととして、以上に示された様々な形式のフローを使用してもよく、操作を改めてソーティングしたり、追加したり又は削除してもよい。例えば、本開示に記載の各操作は、並列に実行されたり、順次に実行されたり、又は異なる順序で実行されてもよく、本開示に開示された技術案の所望の結果を実現することができれば、本明細書はここで限定されない。
【0112】
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション及び代替を行うことが可能であると理解すべきである。本開示の精神と原則内で行われる任意の修正、均等置換及び改良などは、いずれも本開示の保護範囲内に含まれるべきである。
【手続補正書】
【提出日】2023-02-10
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【発明の詳細な説明】
【技術分野】
【0001】
本願は、2021年11月19日に中国特許庁に提出した、出願号が202111402589.4、名称が「インテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法及び装置」の中国特許出願の優先権を要求し、そのすべての内容は引用により本願に組み込まれる。
【0002】
本開示はコンピュータ技術分野に関し、特にデータ処理、機械学習の技術分野に関する。
【背景技術】
【0003】
クロスドメイン推奨(cross-domain recommendation)とは、推奨システムがより豊富なドメインからの相対的豊富な情報を利用して、より疎らなドメインにおける推奨パフォーマンスを向上させることを指す。従来技術において、ソースドメインのサンプルをターゲットドメインのトレーニングに加えることで、ターゲットドメインサンプルが疎らである問題を解決する。しかし、ソースドメインとターゲットドメインとのサンプル分布が一致していないため、「ネガチブトランスファー」現象を招来し、さらにモデルによる推奨過程での推奨効果に影響を及ぼす。
【発明の概要】
【0004】
本開示は、インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラムを提供した。
【0005】
本開示の一局面によれば、ソートモデルトレーニング方法を提供し、前記方法は、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、かつソースドメインの第2のユーザデータと第2のリソースデータとを取得することと、
ターゲットドメインとソースドメインとは重複がある場合、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することと、
暗黙的特徴に基づいて、ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングすることと、を含む。
【0006】
本開示の別の局面によれば、インテリジェント推奨方法を提供し、前記方法は、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得することと、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得ることと、
暗黙的特徴をソートモデルに入力し、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定することと、を含み、
ただし、ソートモデルは本開示のいずれかの実施例のトレーニング方法によってトレーニングされたものである。
【0007】
本開示の別の局面によれば、ソートモデルトレーニング装置を提供し、前記装置は、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、かつソースドメインの第2のユーザデータと第2のリソースデータとを取得するデータ取得モジュールと、
第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定する特徴特定モジュールと、
暗黙的特徴に基づいて、ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングする第1のトレーニングモジュールと、を含む。
【0008】
本開示の別の局面によれば、インテリジェント推奨装置を提供し、前記装置は、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得する第1の取得モジュールと、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得る第2の取得モジュールと、
暗黙的特徴をソートモデルに入力し、ソートモデルのソート結果に基づいて、リソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定するリソース特定モジュールと、を含み、
ただし、ソートモデルは、本開示のいずれかの実施例のトレーニング装置によってトレーニングされたものである。
【0009】
本開示の別の局面によれば、
少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサと通信接続するメモリとを含み、
該メモリに、該少なくとも1つのプロセッサによって実行され得るコマンドが記憶されており、該コマンドが該少なくとも1つのプロセッサによって実行されることで、該少なくとも1つのプロセッサが本開示のいずれかの実施例における方法を実行することができる、
電子機器を提供した。
【0010】
本開示の別の局面によれば、コンピュータに本開示のいずれかの実施例における方法を実行させるためのコンピュータコマンドを記憶している非一時的なコンピュータ読取可能な記憶媒体を提供した。
【0011】
本開示の別の局面によれば、プロセッサにより実行される場合に、本開示のいずれかの実施例における方法を実現するコンピュータプログラムを提供した。
【0012】
本開示は、インテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法及び装置を提供し、ソースドメインのデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0013】
理解されるべきこととして、本部分に記載された内容は、本開示の実施例のキーポイント又は重要な特徴を示すことを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明により容易に理解される。
【図面の簡単な説明】
【0014】
ここで、図面は、本技術案をよりよく理解するために用いられ、本開示を限定するものではない。
【0015】
【
図1】
図1は、本開示の一実施例におけるソートモデルトレーニング方法のフローチャートである。
【
図2】
図2は、本開示の一実施例におけるソートモデルトレーニング方法のフローチャートである。
【
図3】
図3は、本開示の一実施例におけるインテリジェント推奨方法のフローチャートである。
【
図4】
図4は、本開示の一実施例におけるソートモデルトレーニング装置の模式図である。
【
図5】
図5は、本開示の一実施例における特徴特定モジュールの模式図である。
【
図6】
図6は、本開示の一実施例におけるインテリジェント推奨装置の模式図である。
【
図7】
図7は、本開示の実施例のソートモデルトレーニング方法又はインテリジェント推奨方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0016】
以下、図面を参照して本開示の例示的な実施例を説明する。ここで、より理解しやすいために本開示の実施例の様々な詳細は含まれ、それらが例示的なものであると考えられるべきである。したがって、当業者であれば、ここで記載される実施例に対して様々な変更・修正を行うことができ、本開示の範囲及び精神から逸脱することはないと分るべきである。同様に、明確かつ簡潔に説明するために、以下の記載において周知の機能や構成に対する説明を省略する。
【0017】
本開示の実施例は、インテリジェント推奨用のソートモデルトレーニング方法を提供し、
図1は、本開示の一実施例のソートモデルトレーニング方法のフローチャートであり、該方法は、ソートモデルトレーニング装置に適用可能であり、例えば、該装置は、端末又はサーバ又は他の処理装置に配置されて実行する場合、ソートモデルトレーニング等を実行することができる。ここで、端末は、ユーザ装置(UE、User Equipment)、モバイル装置、携帯電話、コードレス電話、パーソナルデジタルアシスタント(PDA、Personal Digital Assistant)、ハンドヘルド装置、コンピューティング装置、車載装置、ウェアラブル装置等であってもよい。幾つかの可能な実現形態において、該方法は、さらにプロセッサがメモリに記憶されたコンピュータ可読命令を呼び出す方式によって実現することができる。
図1に示すように、以下のステップを含む。
【0018】
ステップS101において、ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、且つソースドメインの第2のユーザデータと第2のリソースデータとを取得する。
【0019】
ここで、ターゲットドメイン、ソースドメインは、いずれかの業務シーン又は業務製品であってもよく、ソースドメイン、ターゲットドメインの数は、1つであってもよく、複数であってもよく、本開示ではこれを限定しない。ソースドメインと比べて、ターゲットドメインは、トレーニング済みのソートモデルが適用されるドメインである。
【0020】
端末又はサーバは、予め作成されたターゲットドメインデータベースとソースドメインデータベースのそれぞれから、ターゲットドメインのデータとソースドメインのデータを取得し、第1のユーザデータ、第2のユーザデータは、ユーザの基本データ(例えば、ユーザID、年齢、性別等)、ユーザ行為シーケンスデータ(ユーザの使用行為記録、例えば、一定の時間内にユーザがあるカテゴリの文章を連続的に閲覧すること)、ユーザのリクエストデータ(リクエストを送信するIPアドレス、リクエストを送信する端末情報等)を含んでもよいが、これらに限られない。第1のリソースデータ、第2のリソースデータは、リソースID、リソースカテゴリ(例えば、文章のタイトル、カテゴリ等)、及び業務シーンに相関するデータ(例えば、教育類、生活類の業務シーン等)を含むが、これらに限られない。
【0021】
ステップS102において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定する。
【0022】
ここで、ターゲットドメインのユーザデータ及びリソースデータ、ソースドメインのユーザデータ及びリソースデータに基づいて、共に暗黙的特徴を特定し、暗黙的特徴は明確な物理的意味のない特徴ベクトルであってよい。
【0023】
ステップS103において、暗黙的特徴に基づいて、ソートモデルをトレーニングする。
【0024】
ターゲットドメインのデータとソースドメインのデータとに基づいて得られた暗黙的特徴によって、ソートモデルのトレーニングサンプルセットを構築し、ソートモデルをトレーニングする。ここで、ソートモデルは、ターゲットドメインのユーザに対してリソース推奨を行うために用いられる。
【0025】
本開示の実施例が提供したソートモデルトレーニング方法は、ソースドメインのデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0026】
一つの可能な実現形態において、ソートモデルトレーニング方法は、
第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定することと、
明示的特徴と暗黙的特徴とに基づいて、ソートモデルをトレーニングすることと、をさらに含む。
【0027】
実際の応用において、データ統計等の方式によって、ターゲットドメインにおける第1のユーザデータと第1のリソースデータとに対してユーザ特徴及びリソース特徴を抽出して、ターゲットドメインの明示的特徴としてよく、明示的特徴は明確な物理的意味を有する特徴であってよく、例えば、数字でユーザの年齢等を表す。ターゲットドメインのデータに基づいて得られた明示的特徴、及びターゲットドメインのデータとソースドメインのデータとに基づいて得られた暗黙的特徴を利用して、ソートモデルのトレーニングサンプルセットを構築して、ソートモデルをトレーニングし、ここで、ソートモデルは、ターゲットドメインのユーザに対してリソース推奨を行うために用いられる。
【0028】
本開示の実施例において、明示的特徴と暗黙的特徴とに基づいてソートモデルをトレーニングし、トレーニングサンプルの特徴情報を豊富にして、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0029】
本開示の技術案において、ターゲットドメインの数が複数である場合、如何にして明示的特徴を特定するかについて、具体的には、以下の実施例の通りである。
【0030】
一つの可能な実現形態において、第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定することは、
ターゲットドメインの数が複数である場合、同一の特徴符号化方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴符号化方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得し、各ターゲットドメインの第1の明示的ユーザ特徴のフォーマットが同一であり、各ターゲットドメインの第1の明示的リソース特徴のフォーマットが同一であることと、
ターゲットドメイン毎に、第1の明示的ユーザ特徴と第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得ることと、を含む。
【0031】
実際の応用において、ターゲットドメインが複数であり、即ち、トレーニング済みのソートモデルが複数のターゲットドメインに共通に使用されるものであれば、各ターゲットドメインに同一の特徴抽取ロジックを配置して、抽取された特徴に対して同一の符号化方式を採用して、統一した特徴フォーマットを得ることで、異なるターゲットドメインの特徴を類似する特徴空間にマッピングさせ、各ターゲットドメインのデータ分布を近づける。例えば、抽取された一つ目のターゲットドメインのユーザAの年齢特徴が26であり、抽取された二つ目のターゲットドメインのユーザBの年齢特徴が30であり、この2つのユーザ特徴を抽出するロジックが同一であり、さらに、この2つのユーザ特徴を同一の符号化方式で符号化して、同一のフォーマットの特徴を得る。同一の特徴符号化方式を採用して各ターゲットドメインのユーザデータから明示的ユーザ特徴を取得し、且つ同一の特徴符号化方式を採用して各ターゲットドメインのリソースデータから明示的リソース特徴を取得し、ターゲットドメイン毎に、明示的ユーザ特徴と明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして最終の明示的特徴を得る。
【0032】
ここで、第1のスティッチング方式は、明示的ユーザ特徴と明示的リソース特徴とを横方向にスティッチングすることであってもよく、例えば、明示的ユーザ特徴が128次元ベクトルであり、明示的リソース特徴が100次元ベクトルであり、明示的ユーザ特徴ベクトルと明示的リソース特徴ベクトルとを横方向にスティッチングして、128+100=228次元の明示的特徴ベクトルを得る。
【0033】
本開示の実施例において、複数のターゲットドメインのデータを採用することは、サンプル数を増加させ、単一のターゲットドメインのトレーニングサンプルのデータが疎らである問題を解決することができる。同一の特徴符号化方式を採用して各ターゲットドメインの明示的ユーザ特徴、明示的リソース特徴を取得することは、抽出された明示的特徴を類似する特徴空間をマッピングさせ、近いデータ分布を有し、異なるドメインのデータ連携トレーニングによるネガチブトランスファー現象を軽減することができる。
【0034】
一つの可能な実現形態において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
第1のユーザデータと第2のユーザデータとに基づいて、ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、協調フィルタリング方式を採用して第1のユーザデータに対して第1の暗黙的ユーザ特徴を特定することと、
協調フィルタリング方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出することと、
第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得ることと、
スティッチングユーザ特徴に基づいて、暗黙的特徴を特定することと、を含む。
【0035】
ここで、ターゲットドメインとソースドメインとは重複があることは、ターゲットドメインとソースドメインとのユーザ、リソースのうちの少なくとも一項に重複があることを含んでよく、第1のユーザデータと第2のユーザデータとに基づいて、ターゲットドメインとソースドメインとは重複ユーザがあるか否かを判定し、重複ユーザは、ソースドメインのユーザでもあり、ターゲットドメインのユーザでもあり、2つのドメインのそれぞれに対応する製品にいずれも使用記録があるユーザを含んでよく、例えば、ユーザAは検索類アプリケーションプログラムB1も使用し、ソーシャル類アプリケーションプログラムB2も使用すれば、ユーザAはアプリケーションプログラムB1とアプリケーションプログラムB2との重複ユーザである。
【0036】
ソースドメインとターゲットドメインとは重複ユーザがあれば、協調フィルタリング方式を採用して第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出し、第1の暗黙的ユーザ特徴は暗黙的UCF(User Collaborative Filtering)特徴であってよい。同様な暗黙的特徴抽出方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出し、ここで、重複ユーザの第2のユーザデータは重複ユーザのソースドメインでのユーザデータであってよい。第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングし、ここで、第2のスティッチング方式は、第1の暗黙的ユーザ特徴の特徴ベクトルと第2の暗黙的ユーザ特徴の特徴ベクトルとの2つの特徴ベクトルにおける対応位置の要素を加算することであってよく、例えば、第1の暗黙的ユーザ特徴が128次元ベクトルであり、第2の暗黙的ユーザ特徴も128次元ベクトルであれば、第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして得られたスティッチングユーザ特徴も128次元ベクトルである。
【0037】
ここで、スティッチングユーザ特徴を暗黙的特徴とするか、或いはスティッチングユーザ特徴を暗黙的特徴の1つの部分としてよく、代替的に、スティッチングユーザ特徴に基づいて、暗黙的特徴を特定することは、
協調フィルタリング方式を採用して第1のリソースデータに対して第1の暗黙的リソース特徴を抽出することと、
グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出することと、
第1の連携暗黙的特徴、第2の連携暗黙的特徴を第2のスティッチング方式に従ってスティッチングして、第1のスティッチング連携暗黙的特徴を得ることと、
第1の暗黙的リソース特徴と、第1のスティッチング連携暗黙的特徴と、スティッチングユーザ特徴とを第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得ることと、を含む。
【0038】
本開示の実施例において、ソースドメインとターゲットドメインとは重複ユーザがある場合、ソースドメインのユーザデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、トレーニングサンプルの特徴情報を豊富にし、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。そして、協調フィルタリングの方式を採用して暗黙的特徴を抽出することは、方法が簡単であり、ディープラーニングモデルによって暗黙的特徴を抽出することよりも、計算の複雑さがより低くなる。
【0039】
一つの可能な実現形態において、第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得ることは、
重複ユーザの第2のユーザデータの数と第1のユーザデータの数とに基づいて、第2の暗黙的ユーザ特徴に対応する第1の重みを特定することと、
第1の暗黙的ユーザ特徴と、第2の暗黙的ユーザ特徴と、第1の重みとに基づいて、スティッチングユーザ特徴を得ることと、を含む。
【0040】
実際の応用において、第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とをスティッチングする時、ソースドメインとターゲットドメインとのデータ規模に応じて、引き込まれるソースドメインデータの暗黙的ユーザ特徴の重みを特定し、第1の暗黙的ユーザ特徴、第2の暗黙的ユーザ特徴を重み付け演算して、スティッチングユーザ特徴を得る。
【0041】
ここで、第1のユーザデータの数は、ターゲットドメインから取得されたユーザデータのサンプル数であってよく、例えば、ターゲットドメインから100人のユーザに対応するユーザデータを取得し、該100人のユーザは200個のユーザデータに対応すれば、第1のユーザデータの数は200である。
【0042】
重複ユーザの第2のユーザデータの数は、重複ユーザのソースドメインでのサンプル数、即ちソースドメインに引き込まれたサンプル規模であってよい。例えば、ソースドメインとターゲットドメインとは100人の重複ユーザがあり、該100人の重複ユーザがソースドメインで100個のユーザデータに対応すれば、重複ユーザの第2のユーザデータの数が100である。該100人の重複ユーザがソースドメインで300個のユーザデータに対応すれば、重複ユーザの第2のユーザデータの数が300である。
【0043】
本開示の実施例において、ソースドメインデータとターゲットドメインデータとのサンプル規模によって、ソースドメインデータに対応する暗黙的特徴を引き込む重みを特定し、重み付け演算の方式によりソースドメインの暗黙的ベクトルを引き込み、トレーニングサンプルの特徴情報を豊富にした。
【0044】
一つの可能な実現形態において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがあると特定した場合、協調フィルタリング方式を採用して第1のリソースデータに対して第1の暗黙的リソース特徴を抽出することと、
協調フィルタリング方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出することと、
第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得ることと、
スティッチングリソース特徴に基づいて、暗黙的特徴を特定することと、を含む。
【0045】
実際の応用において、第1のリソースデータと第2のリソースデータとに基づいて、ターゲットドメインとソースドメインとは重複リソースがあるか否かを判定し、重複リソースは、ソースドメインのリソースでもあり、ターゲットドメインのリソースでもあるものを含んでよい。例えば、文章Cは検索類アプリケーションプログラムB1におけるリソースでもあり、ソーシャル類アプリケーションプログラムB2におけるリソースでもあれば、文章CはアプリケーションプログラムB1とアプリケーションプログラムB2との重複リソースである。
【0046】
ソースドメインとターゲットドメインとは重複リソースがあれば、協調フィルタリング方式を採用して第1のリソースデータに対して第1の暗黙的リソース特徴を抽出し、第1の暗黙的リソース特徴は暗黙的ICF(Item Collaborative Filtering)特徴であってよい。同様な暗黙的特徴抽出方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出し、ここで、重複リソースの第2のリソースデータは重複リソースのソースドメインでのリソースデータであってよい。第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングし、ここで、第2のスティッチング方式は、第1の暗黙的リソース特徴の特徴ベクトルと第2の暗黙的リソース特徴の特徴ベクトルとの2つの特徴ベクトルにおける対応位置の要素を加算することであってよく、例えば、第1の暗黙的リソース特徴が128次元ベクトルであり、第2の暗黙的リソース特徴も128次元ベクトルであれば、第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして得られたスティッチングリソース特徴も128次元ベクトルである。
【0047】
ここで、スティッチングリソース特徴を暗黙的特徴とするか、或いはスティッチングリソース特徴を暗黙的特徴の1つの部分としてよく、代替的に、スティッチングリソース特徴に基づいて、暗黙的特徴を特定することは、
協調フィルタリング方式を採用して第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出することと、
グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出することと、
第1の連携暗黙的特徴、第3の連携暗黙的特徴を第2のスティッチング方式に従ってスティッチングして、第2のスティッチング連携暗黙的特徴を得ることと、
第1の暗黙的ユーザ特徴と、第2のスティッチング連携暗黙的特徴と、スティッチングリソース特徴とを第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得ることと、を含む。
【0048】
本開示の実施例において、ソースドメインとターゲットドメインとは重複リソースがある場合、ソースドメインのリソースデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、トレーニングサンプルの特徴情報を豊富にし、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。そして、協調フィルタリングの方式を採用して暗黙的特徴を抽出することは、方法が簡単であり、ディープラーニングモデルによって暗黙的特徴を抽出することよりも、計算の複雑さがより低くなる。
【0049】
一つの可能な実現形態において、第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得ることは、
重複リソースの第2のリソースデータの数と第1のリソースデータの数とに基づいて、第2の暗黙的リソース特徴に対応する第2の重みを特定することと、
第1の暗黙的リソース特徴と、第2の暗黙的リソース特徴と、第2の重みとに基づいて、スティッチングリソース特徴を得ることと、を含む。
【0050】
実際の応用において、第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とをスティッチングする時、ソースドメインとターゲットドメインとのデータ規模に応じて、引き込まれるソースドメインデータの暗黙的リソース特徴の重みを特定し、第1の暗黙的リソース特徴、第2の暗黙的リソース特徴を重み付け演算して、スティッチングリソース特徴を得る。
【0051】
ここで、第1のリソースデータの数は、ターゲットドメインから取得されたリソースデータのサンプル数であってよく、例えば、ターゲットドメインから100個のリソースに対応するリソースデータを取得し、該100個のリソースは200個のリソースデータに対応すれば、第1のリソースデータの数は200である。
【0052】
重複リソースの第2のリソースデータの数は、重複リソースのソースドメインでのサンプル数、即ちソースドメインに引き込まれたサンプル規模であってよい。例えば、ソースドメインとターゲットドメインとは100個の重複リソースがあり、該100個の重複リソースがソースドメインで100個のリソースデータに対応すれば、重複リソースの第2のリソースデータの数が100である。該100個の重複リソースがソースドメインで300個のリソースデータに対応すれば、重複リソースの第2のリソースデータの数が300である。
【0053】
本開示の実施例において、ソースドメインデータとターゲットドメインデータとのサンプル規模によって、ソースドメインデータに対応する暗黙的特徴を引き込む重みを特定し、重み付け演算の方式によりソースドメインの暗黙的ベクトルを引き込み、トレーニングサンプルの特徴情報を豊富にした。
【0054】
一つの可能な実現形態において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出することと、
第1の連携暗黙的特徴と第2の連携暗黙的特徴とに基づいて、暗黙的特徴を特定することと、を含む。
【0055】
実際の応用において、ターゲットドメインとソースドメインとは重複ユーザがある場合、グラフニューラルネットワーク(Graph Neural Network,GNN)を採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出してよく、第1の連携暗黙的特徴は暗黙的GCF(Graph Collaborative Filtering)特徴であってよい。同様な暗黙的特徴抽出方式を採用して第1のリソースデータと重複ユーザの第2のユーザデータとに対して第2の連携暗黙的リソース特徴を抽出し、第1の連携暗黙的特徴と第2の連携暗黙的特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチング連携暗黙的特徴を得て、暗黙的特徴とする。又は、スティッチング連携暗黙的特徴を暗黙的特徴の一部とし、さらに暗黙的ユーザ特徴、スティッチングリソース特徴と第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得る。
【0056】
本開示の実施例において、グラフニューラルネットワークによって暗黙的特徴を抽出し、特徴抽出精度が高く、効果がよい。
【0057】
代替的に、ターゲットドメインとソースドメインとは重複ユーザもあるし、重複リソースもある場合、重複ユーザの第2のユーザデータと重複リソースの第2のリソースデータとを利用して、GNNによって連携暗黙的特徴を抽出し、該連携暗黙的特徴に基づいて、最終の暗黙的特徴を特定することができる。
【0058】
一つの可能な実現形態において、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがあると特定した場合、グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出することと、
第1の連携暗黙的特徴と第3の連携暗黙的特徴とに基づいて、暗黙的特徴を特定することと、を含む。
【0059】
実際の応用において、ターゲットドメインとソースドメインとは重複リソースがある場合、GNNによって第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出してよく、第1の連携暗黙的特徴は暗黙的GCF(Graph Collaborative Filtering)特徴であってよい。同様な暗黙的特徴抽出方式を採用して第1のユーザデータと重複リソース的第2のリソースデータとに対して第3の連携暗黙的リソース特徴を抽出し、第1の連携暗黙的特徴と第3の連携暗黙的特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチング連携暗黙的特徴を得て、暗黙的特徴とする。又は、スティッチング連携暗黙的特徴を暗黙的特徴の一部とし、さらに暗黙的リソース特徴、スティッチングユーザ特徴と第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得る。
【0060】
本開示の実施例において、グラフニューラルネットワークによって暗黙的特徴を抽出し、特徴抽出精度が高く、効果がよい。
【0061】
一つの可能な実現形態において、
第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがないと特定し、且つ第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがないと特定すると、第1のユーザデータと第1のリソースデータとに基づいて、暗黙的特徴を特定することをさらに含む。
【0062】
実際の応用において、ターゲットドメインとソースドメインとは、重複ユーザもないし、重複リソースもない場合、第1のユーザデータと第1のリソースデータとに対して明示的特徴を抽出し、さらに協調フィルタリングの方式によって第1のユーザデータと第1のリソースデータとのそれぞれに対して第1の暗黙的ユーザ特徴と第1の暗黙的リソース特徴とを抽出し、さらにGNNによって第1のユーザデータと第1のリソースデータとに対して連携暗黙的特徴を抽出し、第1の暗黙的ユーザ特徴と、第1の暗黙的リソース特徴と、連携暗黙的特徴とをスティッチングして、暗黙的特徴を得る。明示的特徴と暗黙的特徴とをスティッチングしてモデルの1つのトレーニングサンプルを得る。
【0063】
本開示の実施例において、ターゲットドメインとソースドメインとは重複ユーザもないし、重複リソースもない場合、ターゲットドメインのユーザデータとリソースデータとを利用して暗黙的特徴を特定し、明示的特徴と暗黙的特徴とに基づいてトレーニングサンプルを構築し、このようにトレーニングされたソートモデルはリソース推奨で推定の正確性がより高くなる。
【0064】
一例において、以下の式(1)と(2)によって暗黙的ベクトルを算出することができる。
【0065】
【0066】
【0067】
ただし、
【数3】
はUCF、ICF、GCFベクトルを表し、
【数4】
は暗黙的特徴を表し,
【数5】
はターゲットドメインのデータの暗黙的特徴を表し,
【数6】
はソースドメインのデータの暗黙的特徴を表し、
【数7】
は第i個のターゲットドメインに引き込まれたソースドメインの暗黙的特徴の重みを表し、ターゲットドメインが複数ある場合、N
iは第i個のターゲットドメインのサンプル規模を表し、Mはソースドメインのサンプル規模を表す。
【0068】
一つの可能な実現形態において、明示的特徴と暗黙的特徴とに基づいて、ソートモデルをトレーニングすることは、
明示的特徴と暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、第1のスティッチング特徴を得て、第1のスティッチング特徴に対応するサンプルラベルを取得することと、
第1のスティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングすることと、を含む。
【0069】
実際の応用において、明示的特徴と暗黙的特徴とを第1のスティッチング方式に従ってスティッチングすることで得られた第1のスティッチング特徴を1つのトレーニングサンプルとし、このように複数のユーザデータと複数のリソースデータとに基づいて、複数のトレーニングサンプルを得て、トレーニングサンプル毎に、ソートモデルの具体的な適用シーンに応じて、サンプルラベルを配置し、例えば、サンプルラベルは、ユーザがクリックしたか否か、ユーザが閲覧した時間長さ、ユーザが消費したか否か等であってもよい。トレーニングサンプルとサンプルラベルとからなるトレーニングサンプルセットを利用してソートモデルをトレーニングする。
【0070】
本開示の実施例において、ターゲットドメインのデータに基づいて明示的特徴を特定し、ソースドメインとターゲットドメインとは重複がある場合、ソースドメインのデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、明示的特徴と暗黙的特徴とに基づいてソートモデルをトレーニングし、トレーニングサンプルの特徴情報を豊富にし、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0071】
一つの可能な実現形態において、方法は、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得することと、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得ることと、
暗黙的特徴をソートモデルに入力し、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定することと、をさらに含む。
【0072】
実際の応用において、ソートモデルをリソース推奨に用いて、協調フィルタリング及びGNNによって、ユーザデータとリソースデータとの各々に対応する暗黙的ユーザ特徴と暗黙的リソース特徴とをそれぞれ抽出し、第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得る。暗黙的特徴をソートモデルに入力して、ソートモデルのソート結果に基づいて、リソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定する。
【0073】
本開示の実施例において、ソートモデルのソート結果に基づいて推奨すべきユーザに対してリソース推奨を行い、ソートモデルはターゲットドメインデータとソースドメインデータとの暗黙的特徴に基づいてトレーニングされたものであり、該ソートモデルを使用してリソース推奨を行い、推奨効果を向上させることができる。
【0074】
図2は、本開示の一実施例におけるソートモデルトレーニング方法のフローチャートである。
図2に示すように、該方法は、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、且つソースドメインの第2のユーザデータと第2のリソースデータとを取得するステップS201と、
前記ターゲットドメインの数が複数である場合、同一の特徴抽取方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴抽取方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得するステップS202と、
ターゲットドメイン毎に、前記第1の明示的ユーザ特徴と前記第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得るステップS203と、
ターゲットドメインとソースドメインとは重複がある場合、第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定するステップS204と、
明示的特徴と暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、スティッチング特徴を得て、スティッチング特徴に対応するサンプルラベルを取得するステップS205と、
スティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングするステップS206とを含む。
【0075】
本開示の実施例において、複数のターゲットドメインのデータを採用して、サンプル数を増加させ、単一のターゲットドメインのトレーニングサンプルのデータが疎らである問題を解決することができる。同一の特徴符号化方式を採用して各ターゲットドメインの明示的ユーザ特徴、明示的リソース特徴を取得して、抽出された明示的特徴を類似する特徴空間にマッピングさせ、近いデータ分布を有し、異なるドメインのデータ連携トレーニングによるネガチブトランスファー現象を減軽することができる。なお、ソースドメインとターゲットドメインとは重複がある場合、ソースドメインのデータを暗黙的特徴の形式で、ソートモデルのトレーニングデータに引き込み、直接にソースドメインデータをトレーニングサンプルとすることによる「ネガチブトランスファー」現象を回避し、明示的特徴と暗黙的特徴とに基づいてソートモデルをトレーニングして、トレーニングサンプルの特徴情報を豊富にし、ソートモデルをリソース推奨に応用する推奨効果を向上させることができる。
【0076】
本開示の実施例は、リソース推奨方法を提供し、
図3は本開示の一実施例におけるリソース推奨方法のフローチャートであり、該方法はリソース推奨装置に適用され、例えば、該装置は端末又はサーバ又は他の処理装置に配置されて実行する場合、ソートモデルトレーニング等を実行することができる。ここで、端末は、ユーザ装置(UE、User Equipment)、モバイル装置、携帯電話、コードレス電話、パーソナルデジタルアシスタント(PDA、Personal Digital Assistant)、ハンドヘルド装置、コンピューティング装置、車載装置、ウェアラブル装置等であってもよい。幾つかの可能な実現形態において、該方法は、さらにプロセッサがメモリに記憶されたコンピュータ可読命令を呼び出す方式によって実現することができる。
図3に示すように、インテリジェント推奨方法は、以下のステップを含む。
【0077】
ステップS301において、ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得する。
【0078】
ステップS302において、ユーザデータとリソースデータとに基づいて、暗黙的特徴を得る。
【0079】
ここで、協調フィルタリング及びGNNによってユーザデータとリソースデータとの各々に対応する暗黙的ユーザ特徴と暗黙的リソース特徴とをそれぞれ取得し、第1のスティッチング方式に従ってスティッチングして、暗黙的特徴を得る。
【0080】
ステップS303において、暗黙的特徴をソートモデルに入力して、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定する。
【0081】
ここで、ソートモデルは本開示のいずれかの実施例のトレーニング方法によってトレーニングされたものである。ソート結果は各推奨すべきユーザと各推奨すべきリソースとのマッチング程度に対応する確率であってもよく、各推奨すべきユーザと各推奨すべきリソースとがマッチングしたか否かであってもよい。
【0082】
本開示の実施例において、ソートモデルのソート結果に基づいて推奨すべきユーザに対してリソース推奨を行い、ソートモデルはターゲットドメインデータとソースドメインデータの暗黙的特徴に基づいてトレーニングされたものであり、該ソートモデルを使用してリソース推奨を行って、推奨効果を向上させることができる。
【0083】
図4は、本開示の一実施例におけるインテリジェント推奨用のソートモデルトレーニング装置の模式図である。
図4に示すように、インテリジェント推奨用のソートモデルトレーニング装置は、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、且つソースドメインの第2のユーザデータと第2のリソースデータとを取得するためのデータ取得モジュール401と、
第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定するための特徴特定モジュール402と、
暗黙的特徴に基づいて、ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングするための第1のトレーニングモジュール403と、を含む。
【0084】
一つの可能な実現形態において、装置は第2のトレーニングモジュールをさらに含み、第2のトレーニングモジュールは、
第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定し、
明示的特徴と暗黙的特徴とに基づいて、ソートモデルをトレーニングするために用いられる。
【0085】
一つの可能な実現形態において、第2のトレーニングモジュールは、
第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定する時に、
ターゲットドメインの数が複数である場合、同一の特徴符号化方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴符号化方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得し、各ターゲットドメインの第1の明示的ユーザ特徴のフォーマットが同一であり、各ターゲットドメインの第1の明示的リソース特徴のフォーマットが同一であり、
ターゲットドメイン毎に、第1の明示的ユーザ特徴と第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得るために用いられる。
【0086】
図5は、本開示の一実施例における特徴特定モジュールの模式図である。
図5に示すように、一つの可能な実現形態において、特徴特定モジュールは、第1の抽出手段501と、第2の抽出手段502と、第1のスティッチング手段503と、第1の特定手段504とを含み、
第1の抽出手段501は、第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、協調フィルタリング方式を採用して第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出するために用いられ、
第2の抽出手段502は、協調フィルタリング方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出するために用いられ、
第1のスティッチング手段503は、第1の暗黙的ユーザ特徴と第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得るために用いられ、
第1の特定手段504は、スティッチングユーザ特徴に基づいて、暗黙的特徴を特定するために用いられる。
【0087】
一つの可能な実現形態において、第1のスティッチング手段503は、
重複ユーザの第2のユーザデータの数と第1のユーザデータの数とに基づいて、第2の暗黙的ユーザ特徴に対応する第1の重みを特定し、
第1の暗黙的ユーザ特徴と、第2の暗黙的ユーザ特徴と、第1の重みとに基づいて、スティッチングユーザ特徴を得るために用いられる。
【0088】
一つの可能な実現形態において、特徴特定モジュール402は、第3の抽出手段と、第4の抽出手段と、第2のスティッチング手段と、第2の特定手段とを含み、
第3の抽出手段は、第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがあると特定した場合、協調フィルタリング方式を採用して第1のリソースデータに対して第1の暗黙的リソース特徴を抽出するために用いられ、
第4の抽出手段は、協調フィルタリング方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出するために用いられ、
第2のスティッチング手段は、第1の暗黙的リソース特徴と第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得るために用いられ、
第2の特定手段は、スティッチングリソース特徴に基づいて、暗黙的特徴を特定するために用いられる。
【0089】
一つの可能な実現形態において、第2のスティッチング手段は、
重複リソースの第2のリソースデータの数と第1のリソースデータの数とに基づいて、第2の暗黙的リソース特徴に対応する第2の重みを特定し、
第1の暗黙的リソース特徴と、第2の暗黙的リソース特徴と、第2の重みとに基づいて、スティッチングリソース特徴を得るために用いられる。
【0090】
一つの可能な実現形態において、特徴特定モジュール402、具体的に、
第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出し、
第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出し、
第1の連携暗黙的特徴と第2の連携暗黙的特徴とに基づいて、暗黙的特徴を特定するために用いられる。
【0091】
一つの可能な実現形態において、特徴特定モジュール402は、具体的に、
第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがあると特定した場合、グラフニューラルネットワークを採用して第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出し、
第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出し、
第1の連携暗黙的特徴と第3の連携暗黙的特徴とに基づいて、暗黙的特徴を特定するために用いられる。
【0092】
一つの可能な実現形態において、特徴特定モジュールをさらに含み、特徴特定モジュールは、
第1のユーザデータと第2のユーザデータとに基づいてターゲットドメインとソースドメインとは重複ユーザがなく、かつ第1のリソースデータと第2のリソースデータとに基づいてターゲットドメインとソースドメインとは重複リソースがないと特定すると、第1のユーザデータと第1のリソースデータとに基づいて、暗黙的特徴を特定するために用いられる。
【0093】
一つの可能な実現形態において、第1のトレーニングモジュール403は、具体的に、
明示的特徴と暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、第1のスティッチング特徴を得て、第1のスティッチング特徴に対応するサンプルラベルを取得し、
第1のスティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングするために用いられる。
【0094】
一つの可能な実現形態において、推奨モジュールをさらに含み、推奨モジュールは、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得し、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得て、
暗黙的特徴をソートモデルに入力して、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定するために用いられる。
【0095】
図6は、本開示の一実施例におけるインテリジェント推奨装置の模式図である。
図6に示すように、インテリジェント推奨装置は、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得するための第1の取得モジュール601と、
ユーザデータとリソースデータとに基づいて、暗黙的特徴を得るための第2の取得モジュール602と、
暗黙的特徴をソートモデルに入力して、ソートモデルのソート結果に基づいてリソースデータから推奨すべきユーザにマッチングした推奨すべきリソースを特定するためのリソース特定モジュール603と、を含み、
ここで、ソートモデルは、本開示のいずれかの実施例のトレーニング方法によってトレーニングされたものである。
【0096】
本開示の実施例の各装置における各手段、モジュール又はサブモジュールの機能は、上記方法実施例における対応する説明を参照することができ、ここで説明を繰り返さない。
【0097】
本開示の技術案では、係られたユーザ個人情報の取得、記憶及び適用等は、いずれも関連法律や法規の規定に合致しており、公序良俗に反していない。
【0098】
本開示の別の局面によれば、
少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサと通信接続するメモリとを含み、
該メモリに、該少なくとも1つのプロセッサによって実行され得るコマンドが記憶されており、該コマンドが該少なくとも1つのプロセッサによって実行されることで、該少なくとも1つのプロセッサが本開示のいずれかの実施例における方法を実行することができる、
電子機器を提供した。
【0099】
本開示の別の局面によれば、コンピュータに本開示のいずれかの実施例における方法を実行させるためのコンピュータコマンドを記憶している非一時的なコンピュータ読取可能な記憶媒体を提供した。
【0100】
本開示の別の局面によれば、プロセッサにより実行される場合に、本開示のいずれかの実施例における方法を実現するコンピュータプログラムを提供した。
【0101】
図7は、本開示の実施例を実施可能な例示的な電子機器700の模式的なブロック図を示している。電子機器700は、様々な形式のデジタルコンピュータを示すことを目的とし、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ及び他の適切なコンピュータである。電子機器は、さらに様々な形式の移動装置を示してもよく、例えば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブル機器及び他の類似の演算装置である。本明細書に示された部材、それらの接続及び関係、並びにそれらの機能は、例示に過ぎず、本明細書に記載された及び/又は要求された本開示の実現を限定しない。
【0102】
図7に示すように、
電子機器700は、計算手段701を含み、計算手段701は、リードオンリーメモリ(ROM)702に記憶されたコンピュータプログラム又は記憶手段708からランダムアクセスメモリ(RAM)703にロードされたコンピュータプログラムに基づいて、様々な適切な動作及び処理を実行してもよい。RAM703には、さらに機器700の操作に必要な様々なプログラム及びデータを記憶してもよい。計算手段701、ROM702、及びRAM703は、バス704を介して相互に接続される。入出力(I/O)インターフェース705も、バス704に接続される。
【0103】
電子機器700における複数の部品は、I/Oインターフェース705に接続され、例えばキーボード、マウス等の入力手段706と、例えば様々な種類のディスプレイ、スピーカ等の出力手段707と、例えば磁気ディスク、光ディスク等の記憶手段708と、例えばネットワークカード、モデム、無線通信トランシーバ等の通信手段709とを含む。通信手段709は、機器700がインターネット等のコンピュータネットワーク及び/又は各種の電気ネットワークを介して他の機器と情報・データをやり取りすることを可能にする。
【0104】
計算手段701は、処理及び演算能力を有する各種の汎用及び/又は専用の処理モジュールであってもよい。計算手段701の幾つかの例として、中央処理ユニット(CPU)、GPU(Graphics Processing Unit)、各種専用の人工知能(AI)演算チップ、各種機械学習モデルアルゴリズムをランニングする演算ユニット、DSP(Digital Signal Processor)、並びに任意の適切なプロセッサ、コントローラ、マイクロコントローラ等が挙げられるが、これらに限定されない。計算手段701は、前文で記載された各方法及び処理、例えばインテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法を実行する。例えば、幾つかの実施例において、インテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法は、例えば記憶手段708のような機械可読媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ROM 702及び/又は通信手段709を介して電子機器700にロード及び/又はインストールされてもよい。コンピュータプログラムがRAM703にロードされて計算手段701により実行される場合、前文に記載のインテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法の1つ又は複数のステップを実行してもよい。代替的に、他の実施例において、計算手段701は、他の任意の適切な方式(例えば、ファームウェアを介する)によりインテリジェント推奨用のソートモデルトレーニング方法、インテリジェント推奨方法を実行するように構成されてもよい。
【0105】
本明細書で以上に説明されたシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、コンプレックスプログラマブルロジックデバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現されてもよい。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムにおいて実施され、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行され及び/又は解釈されることが可能であり、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に伝送することができることを含んでもよい。
【0106】
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせで作成されてもよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよく、それによって、プログラムコードがプロセッサ又はコントローラにより実行される時に、フローチャート及び/又はブロック図に規定された機能・操作が実施される。プログラムコードは、機器に完全に実行されてもよく、部分的に機器で実行されてもよく、独立したソフトウェアパッケージとして部分的に機器で実行され、かつ部分的に遠隔機器で実行されるか又は完全に遠隔機器又はサーバで実行されてもよい。
【0107】
本開示のコンテキストにおいて、機械可読媒体は、有形の媒体であってもよく、命令実行システム、装置又は電子機器に使用され、又は命令実行システム、装置又は電子機器と組み合わせて使用されるプログラムを含んで又は記憶してもよい。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子の、磁気的、光学的、電磁的、赤外線の、又は半導体システム、装置又は電子機器、又は上記内容の任意の適切な組み合わせを含んでもよいが、それらに限定されない。機械可読記憶媒体のより具体的な例としては、1つ以上の線による電気的接続、携帯式コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、コンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶装置、磁気記憶装置、又は上記内容の任意の適切な組み合わせを含む。
【0108】
ユーザとの対話を提供するために、コンピュータにここで説明されたシステム及び技術を実施させてもよく、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを備え、ユーザは、該キーボード及び該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置は、さらにユーザとの対話を提供してもよく、例えば、ユーザに提供されたフィードバックは、いかなる形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、かついかなる形式(音声入力、語音入力又は、触覚入力を含む)でユーザからの入力を受信してもよい。
【0109】
ここで説明されたシステム及び技術は、バックグラウンド部品を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア部品を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド部品を含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザが該グラフィカルユーザインタフェース又は該ネットワークブラウザを介してここで説明されたシステム及び技術の実施形態と対話することができる)、又はこのようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品のいずれかの組み合わせを含むコンピューティングシステムに実施されることが可能である。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によりシステムの部品を互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)及びインターネットを例示的に含む。
【0110】
コンピュータシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバ同士は、一般的に離れており、通常、通信ネットワークを介して対話する。クライアントとサーバとの関係は、該当するコンピュータ上でランニングし、クライアント-サーバの関係を有するコンピュータプログラムによって生成される。サーバは、クラウドサーバであってもよく、分散型システムのサーバであってもよく、又はブロックチェーンを組合せたサーバであってもよい。
【0111】
理解されるべきこととして、以上に示された様々な形式のフローを使用してもよく、操作を改めてソーティングしたり、追加したり又は削除してもよい。例えば、本開示に記載の各操作は、並列に実行されたり、順次に実行されたり、又は異なる順序で実行されてもよく、本開示に開示された技術案の所望の結果を実現することができれば、本明細書はここで限定されない。
【0112】
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション及び代替を行うことが可能であると理解すべきである。本開示の精神と原則内で行われる任意の修正、均等置換及び改良などは、いずれも本開示の保護範囲内に含まれるべきである。
【手続補正2】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ソートモデルトレーニング方法であって、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、かつソースドメインの第2のユーザデータと第2のリソースデータとを取得することと、
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することと、
前記暗黙的特徴に基づいて、前記ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングすることと、を含む
ソートモデルトレーニング方法。
【請求項2】
前記第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定することと、
前記明示的特徴と前記暗黙的特徴とに基づいて、ソートモデルをトレーニングすることと、をさらに含む
請求項1に記載のソートモデルトレーニング方法。
【請求項3】
前記第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定することは、
前記ターゲットドメインの数が複数である場合、同一の特徴符号化方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴符号化方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得し、各ターゲットドメインの第1の明示的ユーザ特徴のフォーマットが同一であり、各ターゲットドメインの第1の明示的リソース特徴のフォーマットが同一であることと、
ターゲットドメイン毎に、前記第1の明示的ユーザ特徴と前記第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得ることと、を含む
請求項2に記載のソートモデルトレーニング方法。
【請求項4】
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、協調フィルタリング方式を採用して前記第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出することと、
協調フィルタリング方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出することと、
前記第1の暗黙的ユーザ特徴と前記第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得ることと、
前記スティッチングユーザ特徴に基づいて、暗黙的特徴を特定することと、を含む
請求項1に記載のソートモデルトレーニング方法。
【請求項5】
前記第1の暗黙的ユーザ特徴と前記第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得ることは、
前記重複ユーザの第2のユーザデータの数と前記第1のユーザデータの数とに基づいて、前記第2の暗黙的ユーザ特徴に対応する第1の重みを特定することと、
前記第1の暗黙的ユーザ特徴と、前記第2の暗黙的ユーザ特徴と、前記第1の重みとに基づいて、スティッチングユーザ特徴を得ることと、を含む
請求項4に記載のソートモデルトレーニング方法。
【請求項6】
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがあると特定した場合、協調フィルタリング方式を採用して前記第1のリソースデータに対して第1の暗黙的リソース特徴を抽出することと、
協調フィルタリング方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出することと、
前記第1の暗黙的リソース特徴と前記第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得ることと、
前記スティッチングリソース特徴に基づいて、暗黙的特徴を特定することと、を含む
請求項1に記載のソートモデルトレーニング方法。
【請求項7】
前記第1の暗黙的リソース特徴と前記第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得ることは、
前記重複リソースの第2のリソースデータの数と前記第1のリソースデータの数とに基づいて、前記第2の暗黙のリソース特徴に対応する第2の重みを特定することと、
前記第1の暗黙的リソース特徴と、前記第2の暗黙的リソース特徴と、前記第2の重みとに基づいて、スティッチングリソース特徴を得ることと、を含む
請求項6に記載のソートモデルトレーニング方法。
【請求項8】
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、グラフニューラルネットワークを採用して前記第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
前記第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出することと、
前記第1の連携暗黙的特徴と第2の連携暗黙的特徴とに基づいて、暗黙的特徴を特定することと、を含む
請求項1に記載のソートモデルトレーニング方法。
【請求項9】
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定することは、
前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがあると特定した場合、グラフニューラルネットワークを採用して前記第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出することと、
前記第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出することと、
前記第1の連携暗黙的特徴と第3の連携暗黙的特徴とに基づいて、暗黙的特徴を特定することと、を含む
請求項1に記載のソートモデルトレーニング方法。
【請求項10】
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがないと特定し、かつ前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがないと特定すると、前記第1のユーザデータと第1のリソースデータとに基づいて、暗黙的特徴を特定することをさらに含む
請求項1に記載のソートモデルトレーニング方法。
【請求項11】
前記明示的特徴と前記暗黙的特徴とに基づいて、ソートモデルをトレーニングすることは、
前記明示的特徴と前記暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、第1のスティッチング特徴を得て、前記第1のスティッチング特徴に対応するサンプルラベルを取得することと、
前記第1のスティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングすることと、を含む
請求項2に記載のソートモデルトレーニング方法。
【請求項12】
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得することと、
前記ユーザデータとリソースデータとに基づいて、暗黙的特徴を得ることと、
前記暗黙的特徴を前記ソートモデルに入力し、前記ソートモデルのソート結果に基づいて前記リソースデータから前記推奨すべきユーザにマッチングした推奨すべきリソースを特定することと、をさらに含む
請求項1に記載のソートモデルトレーニング方法。
【請求項13】
インテリジェント推奨方法であって、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得することと、
前記ユーザデータとリソースデータとに基づいて、暗黙的特徴を得ることと、
前記暗黙的特徴をソートモデルに入力し、前記ソートモデルのソート結果に基づいて前記リソースデータから前記推奨すべきユーザにマッチングした推奨すべきリソースを特定することと、を含み、
前記ソートモデルは請求項
1に記載のソートモデルトレーニング方法によってトレーニングされたものである、
インテリジェント推奨方法。
【請求項14】
ソートモデルトレーニング装置であって、
ターゲットドメインの第1のユーザデータと第1のリソースデータとを取得し、かつソースドメインの第2のユーザデータと第2のリソースデータとを取得するためのデータ取得モジュールと、
前記第1のユーザデータと、第1のリソースデータと、第2のユーザデータと、第2のリソースデータとに基づいて、暗黙的特徴を特定するための特徴特定モジュールと、
前記暗黙的特徴に基づいて、前記ターゲットドメインのユーザに対してリソース推奨を行うためのソートモデルをトレーニングするための第1のトレーニングモジュールと、を含む
ソートモデルトレーニング装置。
【請求項15】
第2のトレーニングモジュールをさらに含み、
前記第2のトレーニングモジュールは、
前記第1のユーザデータと第1のリソースデータとに基づいて、明示的特徴を特定し、
前記明示的特徴と前記暗黙的特徴とに基づいて、ソートモデルをトレーニングするために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項16】
前記第2のトレーニングモジュールは、
前記第1のユーザデータと第1のリソースデータとに基づいて明示的特徴を特定する時に、
前記ターゲットドメインの数が複数である場合、同一の特徴符号化方式を採用して各ターゲットドメインの第1のユーザデータから第1の明示的ユーザ特徴を取得し、同一の特徴符号化方式を採用して各ターゲットドメインの第1のリソースデータから第1の明示的リソース特徴を取得し、各ターゲットドメインの第1の明示的ユーザ特徴のフォーマットが同一であり、各ターゲットドメインの第1の明示的リソース特徴のフォーマットが同一であり、
ターゲットドメイン毎に、前記第1の明示的ユーザ特徴と前記第1の明示的リソース特徴とを第1のスティッチング方式に従ってスティッチングして、明示的特徴を得るために用いられる、
請求項15に記載のソートモデルトレーニング装置。
【請求項17】
前記特徴特定モジュールは、第1の抽出手段と、第2の抽出手段と、第1のスティッチング手段と、第1の特定手段とを含み、
前記第1の抽出手段は、前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、協調フィルタリング方式を採用して前記第1のユーザデータに対して第1の暗黙的ユーザ特徴を抽出するために用いられ、
前記第2の抽出手段は、協調フィルタリング方式を採用して重複ユーザの第2のユーザデータに対して第2の暗黙的ユーザ特徴を抽出するために用いられ、
前記第1のスティッチング手段は、前記第1の暗黙的ユーザ特徴と前記第2の暗黙的ユーザ特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングユーザ特徴を得るために用いられ、
前記第1の特定手段は、前記スティッチングユーザ特徴に基づいて、暗黙的特徴を特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項18】
前記第1のスティッチング手段は、
前記重複ユーザの第2のユーザデータの数と前記第1のユーザデータの数とに基づいて、前記第2の暗黙的ユーザ特徴に対応する第1の重みを特定し、
前記第1の暗黙的ユーザ特徴と、前記第2の暗黙的ユーザ特徴と、前記第1の重みとに基づいて、スティッチングユーザ特徴を得るために用いられる、
請求項17に記載のソートモデルトレーニング装置。
【請求項19】
前記特徴特定モジュールは、第3の抽出手段と、第4の抽出手段と、第2のスティッチング手段と、第2の特定手段とを含み、
前記第3の抽出手段は、前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがあると確定した場合、協調フィルタリング方式を採用して前記第1のリソースデータに対して第1の暗黙的リソース特徴を抽出するために用いられ、
前記第4の抽出手段は、協調フィルタリング方式を採用して重複リソースの第2のリソースデータに対して第2の暗黙的リソース特徴を抽出するために用いられ、
前記第2のスティッチング手段は、前記第1の暗黙的リソース特徴と前記第2の暗黙的リソース特徴とを第2のスティッチング方式に従ってスティッチングして、スティッチングリソース特徴を得るために用いられ、
前記第2の特定手段は、前記スティッチングリソース特徴に基づいて、暗黙的特徴を特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項20】
前記第2のスティッチング手段は、
前記重複リソースの第2のリソースデータの数と前記第1のリソースデータの数とに基づいて、前記第2の暗黙的リソース特徴に対応する第2の重みを特定し、
前記第1の暗黙的リソース特徴と、前記第2の暗黙的リソース特徴と、前記第2の重みとに基づいて、スティッチングリソース特徴を得るために用いられる、
請求項19に記載のソートモデルトレーニング装置。
【請求項21】
前記特徴特定モジュールは、具体的に、
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがあると特定した場合、グラフニューラルネットワークを採用して前記第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出し、
前記第1のリソースデータと重複ユーザの第2のユーザデータとに基づいて、グラフニューラルネットワークを採用して第2の連携暗黙的特徴を抽出し、
前記第1の連携暗黙的特徴と第2の連携暗黙的特徴とに基づいて、暗黙的特徴を特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項22】
前記特徴特定モジュールは、具体的に、
前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがあると特定した場合、グラフニューラルネットワークを採用して前記第1のユーザデータと第1のリソースデータとに対して第1の連携暗黙的特徴を抽出し、
前記第1のユーザデータと重複リソースの第2のリソースデータとに基づいて、グラフニューラルネットワークを採用して第3の連携暗黙的特徴を抽出し、
前記第1の連携暗黙的特徴と第3の連携暗黙的特徴とに基づいて、暗黙的特徴を特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項23】
前記第1のユーザデータと第2のユーザデータとに基づいて前記ターゲットドメインとソースドメインとは重複ユーザがないと特定し、かつ前記第1のリソースデータと第2のリソースデータとに基づいて前記ターゲットドメインとソースドメインとは重複リソースがないと特定すると、前記第1のユーザデータと第1のリソースデータとに基づいて、暗黙的特徴を特定するための特徴特定モジュールをさらに含む、
請求項14に記載のソートモデルトレーニング装置。
【請求項24】
前記第1のトレーニングモジュールは、具体的に、
前記明示的特徴と前記暗黙的特徴とを第1のスティッチング方式に従ってスティッチングして、第1のスティッチング特徴を得て、前記第1のスティッチング特徴に対応するサンプルラベルを取得し、
前記第1のスティッチング特徴と、対応するサンプルラベルとに基づいて、ソートモデルをトレーニングするために用いられる、
請求項15に記載のソートモデルトレーニング装置。
【請求項25】
推奨モジュールをさらに含み、
前記推奨モジュールは、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得し、
前記ユーザデータとリソースデータとに基づいて、暗黙的特徴を得て、
前記暗黙的特徴を前記ソートモデルに入力し、前記ソートモデルのソート結果に基づいて前記リソースデータから前記推奨すべきユーザにマッチングした推奨すべきリソースを特定するために用いられる、
請求項14に記載のソートモデルトレーニング装置。
【請求項26】
インテリジェント推奨装置であって、
ターゲットドメインの推奨すべきユーザのユーザデータと推奨すべきリソースのリソースデータとを取得するための第1の取得モジュールと、
前記ユーザデータとリソースデータとに基づいて、暗黙的特徴を得るための第2の取得モジュールと、
前記暗黙的特徴をソートモデルに入力し、前記ソートモデルのソート結果に基づいて、前記リソースデータから前記推奨すべきユーザにマッチングした推奨すべきリソースを特定するためのリソース特定モジュールと、を含み、
前記ソートモデルは、請求項1~12のいずれか一項に記載のソートモデルトレーニング方法によってトレーニングされたものである、
インテリジェント推奨装置。
【請求項27】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続するメモリとを含み、
前記メモリに、前記少なくとも1つのプロセッサによって実行され得るコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサによって実行されることで、前記少なくとも1つのプロセッサが請求項1~
12のいずれか一項に記載の
ソートトレーニング方法又は請求項13に記載のインテリジェント推奨方法を実行することができる、
ことを特徴とする電子機器。
【請求項28】
コンピュータに請求項1~
12のいずれか一項に記載の
ソートトレーニング方法又は請求項13に記載のインテリジェント推奨方法を実行させるためのコンピュータコマンドを記憶している、
ことを特徴とする非一時的なコンピュータ読取可能な記憶媒体。
【請求項29】
プロセッサにより実行される場合に、請求項1~
12のいずれか一項に記載の
ソートトレーニング方法又は請求項13に記載のインテリジェント推奨方法を実現するコンピュータプログラ
ム。
【国際調査報告】