(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-24
(45)【発行日】2022-11-01
(54)【発明の名称】ユーザークリックモデルのトレーニング方法、装置、電子機器、及び記憶媒体
(51)【国際特許分類】
G06N 20/00 20190101AFI20221025BHJP
【FI】
G06N20/00
(21)【出願番号】P 2020095749
(22)【出願日】2020-06-01
【審査請求日】2020-06-01
(31)【優先権主張番号】2019109569947
(32)【優先日】2019-10-10
(33)【優先権主張国・地域又は機関】CN
【前置審査】
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(73)【特許権者】
【識別番号】521235408
【氏名又は名称】シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】ワン、リ
【審査官】久保 光宏
(56)【参考文献】
【文献】特開2015-88089(JP,A)
【文献】特開2013-33478(JP,A)
【文献】特開2012-118705(JP,A)
【文献】特開2014-203442(JP,A)
【文献】Yao Wu, et al.,"Collaborative Denoising Auto-Encoders for Top-N Recommender Systems",Proceedings of the Ninth ACM International Conference on Web Search and Data Mining (WSDM'16),ACM,2016年02月08日,Pages 153-162,ISBN: 978-1-4503-3716-8, <DOI: 10.1145/2835776.2835837>.
【文献】Deepak K. Agarwal(外1名)著, 島田直希(外1名)訳,「推薦システム-統計的機械学習の理論と実践-」,初版,日本,共立出版株式会社,2018年04月25日,第3~12頁,ISBN: 978-4-320-12430-1.
(58)【調査した分野】(Int.Cl.,DB名)
G06N3/00-99/00
CSDB(日本国特許庁)
IEEEXplore(IEEE)
(57)【特許請求の範囲】
【請求項1】
ユーザークリックモデルのトレーニング方法であって、
ネットワークのユーザーのログデータベースから複数の行為データを収集することであって、行為データ毎に予め設定された時間期間内のあるユーザーからのネットワークのリソースに対するフィードバック情報を含み、
予め確立されたヘッドリソースライブラリと、前記複数の行為データとに基づいて、前記複数の行為データに対応する複数のリソースアクセス特徴を生成し、
前記複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングする、ことを含み、
前記複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングすることは、
前記複数のリソースアクセス特徴のそれぞれについて、前記複数のリソースアクセス特徴の一部の有効データを隠すことで、対応するリソースアクセストレーニング特徴を得るステップと、
前記リソースアクセストレーニング特徴を前記ユーザークリックモデルに入力することで、前記ユーザークリックモデルが出力するリソースアクセス予測特徴を取得するステップと、
前記複数のリソースアクセス特徴と、対応する前記リソースアクセス予測特徴とに基づいて、クロスエントロピー関数値を算出するステップと、
前記クロスエントロピー関数値が0に等しいかどうかを判断するステップと、
0に等しくない場合、前記クロスエントロピー関数値が0に近づくように、前記ユーザークリックモデルのパラメーターを調整するステップと、
前記クロスエントロピー関数値が連続する予め設定された回数のトレーニングにおいて0に等しくなるまで、前記複数のリソースアクセス特徴を用いて、上記の各ステップに従って、前記ユーザークリックモデルを絶えずトレーニングして、前記ユーザークリックモデルのパラメーターを確定し、さらに、前記ユーザークリックモデルを確定するステップと、を含む
方法。
【請求項2】
予め確立されたヘッドリソースライブラリと、前記複数の行為データとに基づいて、前記複数の行為データに対応する複数のリソースアクセス特徴を生成することの前に、前記方法は、
グローバルリソースライブラリ内の各リソースの属性情報に応じて、前記グローバルリソースライブラリから、複数のヘッドリソースの識別子をフィルタリングし、
複数のヘッドリソース識別子によりヘッドリソースライブラリを構築する、
ことをさらに含む請求項1に記載の方法。
【請求項3】
グローバルリソースライブラリ内の各リソースの属性情報に応じて、前記グローバルリソースライブラリから、複数のヘッドリソースの識別子をフィルタリングすることは、
前記グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、前記グローバルリソースライブラリから、品質パラメーターが予め設定された品質パラメーター閾値よりも大きい複数のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすることと、
前記グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、前記グローバルリソースライブラリから、アクセス人気度が予め設定された人気度閾値よりも大きい複数のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすることと、
前記グローバルリソースライブラリ内の各リソースの区別度に応じて、前記グローバルリソースライブラリから、区別度が予め設定された区別度閾値よりも大きい複数のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすることであって、各前記リソースの区別度は、前記リソースに対応する異なるフィードバックのユーザー群れの数の分散(variance)に等しいことと、の少なくとも一つを含んでおり、
又は、
グローバルリソースライブラリ内の各リソースの属性情報に応じて、前記グローバルリソースライブラリから、複数のヘッドリソースの識別子をフィルタリングすることは、
前記グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、前記グローバルリソースライブラリから、品質パラメーターが最大となるTop N個のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすることと、
前記グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、前記グローバルリソースライブラリから、アクセス人気度が最大となるTop M個のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすることと、
前記グローバルリソースライブラリ内の各リソースの区別度に応じて、前記グローバルリソースライブラリから、区別度が最大となるTop W個のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすることと、の少なくとも一つを含んでおり、
N、M、Wは正の整数である、
請求項2に記載の方法。
【請求項4】
ネットワークのユーザーのログデータベースから複数の行為データを収集することは、
前記ログデータベースから、予めポイントの埋め込みが設定される明示的な収集方式、及び/又は、ユーザーからの各リソースに対するフィードバック情報を分析する暗黙的な収集方式により、前記複数の行為データを収集することを含む請求項1から3のいずれか一項に記載の方法。
【請求項5】
予め確立されたヘッドリソースライブラリと、前記複数の行為データとに基づいて、前記複数の行為データに対応する複数のリソースアクセス特徴を生成することは、
前記行為データのそれぞれにおける前記ユーザーからの前記ヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報を取得し、
前記行為データのそれぞれにおける前記ユーザーからの前記ヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報に基づいて、対応する前記複数のリソースアクセス特徴を生成して、合わせて複数の前記複数のリソースアクセス特徴を得る、ことを含む請求項1から4のいずれか一項に記載の方法。
【請求項6】
ユーザークリックモデルのトレーニング装置であって、
ネットワークのユーザーのログデータベースから複数の行為データを収集するための収集モジュールであって、行為データ毎に予め設定された時間期間内のあるユーザーからのネットワークのリソースに対するフィードバック情報を含む、収集モジュールと、
予め確立されたヘッドリソースライブラリと、前記複数の行為データとに基づいて、前記複数の行為データに対応する複数のリソースアクセス特徴を生成するための生成モジュールと、
前記複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングするためのトレーニングモジュールと、を含み、
前記トレーニングモジュールは、
前記複数のリソースアクセス特徴のそれぞれについて、前記複数のリソースアクセス特徴の一部の有効データを隠すことで、対応するリソースアクセストレーニング特徴を得るステップと、
前記リソースアクセストレーニング特徴を前記ユーザークリックモデルに入力することで、前記ユーザークリックモデルが出力するリソースアクセス予測特徴を取得するステップと、
前記複数のリソースアクセス特徴と、対応する前記リソースアクセス予測特徴とに基づいて、クロスエントロピー関数値を算出するステップと、
前記クロスエントロピー関数値が0に等しいかどうかを判断するステップと、
0に等しくない場合、前記クロスエントロピー関数値が0に近づくように、前記ユーザークリックモデルのパラメーターを調整するステップと、
前記クロスエントロピー関数値が連続する予め設定された回数のトレーニングで0に等しいまで、前記複数のリソースアクセス特徴を用いて、上記の各ステップに従って、前記ユーザークリックモデルを絶えずトレーニングして、前記ユーザークリックモデルのパラメーターを確定し、さらに、前記ユーザークリックモデルを確定するステップと、に用いられる
装置。
【請求項7】
前記装置は、
グローバルリソースライブラリ内の各リソースの属性情報に応じて、前記グローバルリソースライブラリから、複数のヘッドリソース識別子をフィルタリングするためのフィルタリングモジュールと、
前記複数のヘッドリソース識別子によりヘッドリソースライブラリを構築するための構築モジュールをさらに含む請求
項6に記載の装置。
【請求項8】
前記フィルタリングモジュールは、
前記グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、前記グローバルリソースライブラリから、品質パラメーターが予め設定された品質パラメーターの閾値よりも大きい複数のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすること、
前記グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、前記グローバルリソースライブラリから、アクセス人気度が予め設定された人気度閾値よりも大きい複数のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすること、
前記グローバルリソースライブラリ内の各リソースの区別度に応じて、前記グローバルリソースライブラリから、区別度が予め設定された区別度閾値よりも大きい複数のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすることであって、各前記リソースの区別度は、前記リソースに対応する異なるフィードバックのユーザー群れの数の分散(variance)に等しい、ことの少なくとも一つを実行するために用いられ、
又は、
前記フィルタリングモジュールは、
前記グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、前記グローバルリソースライブラリから、品質パラメーターが最大となるTop N個のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすること、
前記グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、前記グローバルリソースライブラリから、アクセス人気度が最大となるTop M個のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすること、
前記グローバルリソースライブラリ内の各リソースの区別度に応じて、前記グローバルリソースライブラリから、区別度が最大となるTop W個のリソース識別子をフィルタリングして、ヘッドリソースの識別子とすること、の少なくとも一つを実行するために用いられ、
N、M、Wは正の整数である請求
項7に記載の装置。
【請求項9】
前記収集モジュールは、
前記ログデータベースから、予めポイントの埋め込みが設定される明示的な収集方式、及び/又は、ユーザーからの各リソースに対するフィードバック情報を分析する暗黙的な収集方法により、前記複数の行為データを収集するために用いられる請求
項6から8のいずれか一項に記載の装置。
【請求項10】
前記生成モジュールは、
前記行為データのそれぞれにおける前記ユーザーからの前記ヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報を取得し、
前記行為データのそれぞれにおける前記ユーザーからの前記ヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報に基づいて、対応する前記複数のリソースアクセス特徴を生成して、合わせて複数の前記複数のリソースアクセス特徴を得るために用いられる請求
項6から9のいずれか一項に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピューターアプリケーション技術分野に関し、特に、人工知能技術分野に関し、具体的に、ユーザークリックモデルのトレーニング方法、装置、電子機器、及び記憶媒体に関する。
【背景技術】
【0002】
インターネットの普及に伴い、コンピューターや、携帯電話などは生活に不可欠な工具である。様々なコンテンツサービスは、Webサイトやアプリケーション(application、app)の形でユーザーにリーチし、ユーザーはWebサイトやアプリとインタラクトクラすることでクラウドバックグラウンドにデータをフィードバックする。これらのフィードバックデータは、クラウドアルゴリズムによってユーザークリックモデルとしてモデリングされることがあり、データの量が増えると、ユーザーモデルはユーザーをより深く特徴付け、これにより、ユーザークリックモデルに基づいてより良い推奨コンテンツを推測し、ユーザー体験を最適化する。
【0003】
既存のユーザークリックモデルのモデリング方案は、明示的なtag モデリング、及び暗黙的なベクトルモデリングがある。なお、明示的なtag モデリングの問題は、「ミリタリー」、「アニメ」、「バイドゥ」などのユーザーの好みを正確に記述するために極大な単語の袋が必要なことであり、単語の袋の各単語は、デザイナーが正確なデザインを持っている必要があり、 同時に、単語の袋内の異なる単語に交差関係と従属関係がある場合があり、単語の袋のデザイン分布が不均一又は不合理であると、最終的な効果に直接影響する。暗黙的なベクトルモデリングは、主に多次元ベクトルで、ユーザーとリソースの特性を同時に表現する。同一の特徴空間においてベクトルの類似性を算出することでユーザーの好みをシミュレートする方式は、ユーザーのクリックモデルを効果的に直接表すことはできず、プロキシの方式に過ぎない。
【0004】
従って、従来技術の欠点に基づいて、ユーザークリック情報を正確に予測できる、効率よいユーザークリックモデルを提供することは急務である。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本出願は、ユーザークリックモデルのトレーニング方法、装置、電子機器、及び記憶媒体を提供し、従来技術の欠点を補うために、効率よく、正確なユーザークリックモデルを提供し、さらに、ユーザーのクリック情報を正確に予測することができる。
【課題を解決するための手段】
【0006】
本出願は、ユーザークリックモデルのトレーニング方法を提供し、
ネットワークのユーザーのログデータベースから、予め設定された時間周期内のあるユーザーからのネットワークのリソースに対するフィードバック情報を含む複数の行為データを収集し、
予め確立されたヘッドリソースライブラリと、複数の行為データとに基づいて、複数の行為データに対応する複数のリソースアクセス特徴を生成し、
複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングする、ことを含む。
【0007】
さらに、任意選択で、予め確立されたヘッドリソースライブラリと、複数の行為データとに基づいて、複数の行為データに対応する複数のリソースアクセス特徴を生成する前に、方法は、
グローバルリソースライブラリ内の各リソースの属性情報に応じて、グローバルリソースライブラリから、複数のヘッドリソースの識別子をフィルタリングし、
複数のヘッドリソース識別子によりヘッドリソースライブラリを構築する、ことをさらに含む上記に記載の方法。
【0008】
さらに、任意選択で、グローバルリソースライブラリ内の各リソースの属性情報に応じて、グローバルリソースライブラリから、複数のヘッドリソースの識別子をフィルタリングすることは、
グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、グローバルリソースライブラリから、品質パラメーターが予め設定された品質パラメーター閾値よりも大きい複数のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、グローバルリソースライブラリから、アクセス人気度が予め設定された人気度閾値よりも大きい複数のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
グローバルリソースライブラリ内の各リソースの区別度に応じて、グローバルリソースライブラリから、区別度が予め設定された区別度閾値よりも大きい複数のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることとの少なくとも一つを含んでおり、
各リソースの区別度は、リソースに対応する異なるフィードバックのユーザー群れの数の分散に等しく、
又は、
グローバルリソースライブラリ内の各リソースの属性情報に応じて、グローバルリソースライブラリから、複数のヘッドリソースの識別子をフィルタリングすることは、
グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、グローバルリソースライブラリから、品質パラメーターが最大となるTop N個のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、グローバルリソースライブラリから、アクセス人気度が最大となるTop M個のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
グローバルリソースライブラリ内の各リソースの区別度に応じて、グローバルリソースライブラリから、区別度が最大となるTop W個のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることとの少なくとも一つを含んでおり、
N、M、Wは正の整数である上記に記載の方法。
【0009】
さらに、任意選択で、ネットワークのユーザーのログデータベースから複数の行為データを収集することは、
ログデータベースから、予めポイントの埋め込みが設定される明示的な収集方式、及び/又は、ユーザーからの各リソースに対するフィードバック情報を分析する暗黙的な収集方式により、複数の行為データを収集することを含む上記に記載の方法。
【0010】
さらに、任意選択で、予め確立されたヘッドリソースライブラリと、複数の行為データとに基づいて、複数の行為データに対応する複数のリソースアクセス特徴を生成することは、
行為データのそれぞれにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報を取得し、
各行為データにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報に基づいて、対応するリソースアクセス特徴を生成し、合わせて複数のリソースアクセス特徴を得る、ことを含む上記に記載の方法。
【0011】
さらに、任意選択で、複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングすることは、
リソースアクセス特徴のそれぞれについて、リソースアクセス特徴の一部の有効データを隠すことで、対応するリソースアクセストレーニング特徴を得て、
リソースアクセストレーニング特徴をユーザークリックモデルに入力することで、ユーザークリックモデルが出力するリソースアクセス予測特徴を取得し、
リソースアクセス特徴と、対応するリソースアクセス予測特徴とに基づいて、クロスエントロピー関数値を算出し、
クロスエントロピー関数値が0に等しいかどうかを判断し、
0に等しくない場合、クロスエントロピー関数値が0に近づくように、ユーザークリックモデルのパラメーターを調整し、
クロスエントロピー関数値が連続する予め設定された回数のトレーニングにおいて0に等しくなるまで、複数のリソースアクセス特徴を用いて、上記の方式に従って、ユーザークリックモデルを絶えずトレーニングし、ユーザークリックモデルのパラメーターを確定し、さらに、ユーザークリックモデルを確定する、ことを含む上記に記載の方法。
【0012】
本出願は、さらに、リソース推奨方法を提供し、
最近隣時間帯における特定のユーザーのリアルタイム行為データを収集し、
リアルタイム行為データと、予め確立されたヘッドリソースライブラリとに応じて、特定のユーザーのリアルタイムリソースアクセス特徴を取得し、
予めトレーニングされたユーザークリックモデル、リアルタイムリソースアクセス特徴、及びヘッドリソースライブラリに応じて、k個の予測リソース識別子を予測し、
k個の予測リソース識別子に基づいて、特定のユーザーに対してリソース推奨を行う、ことを含む。
【0013】
さらに、任意選択で、予めトレーニングされたユーザークリックモデル、リアルタイムリソースアクセス特徴、及びヘッドリソースライブラリに応じて、k個の予測リソース識別子を予測することは、
ユーザークリックモデルと、リアルタイムリソースアクセス特徴とに応じて、特定のユーザーの予測リソースアクセス特徴を予測し、
予測リソースアクセス特徴、リアルタイムリソースアクセス特徴、及びヘッドリソースライブラリに基づいて、k個の予測リソース識別子を取得する、ことを含む上記に記載の方法。
【0014】
本出願は、さらに、ユーザークリックモデルのトレーニング装置を提供し、
ネットワークのユーザーのログデータベースから、予め設定された時間周期内のあるユーザーからのネットワークのリソースに対するフィードバック情報を含む複数の行為データを収集するための収集モジュールと、
予め確立されたヘッドリソースライブラリと、複数の行為データとに基づいて、複数の行為データに対応する複数のリソースアクセス特徴を生成するための生成モジュールと、
複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングするためのトレーニングモジュールと、を含む。
【0015】
本出願は、さらに、リソース推奨装置を提供し、
最近隣の時間帯での特定のユーザーのリアルタイム行為データを収集するための収集モジュールと、
リアルタイム行為データと、予め確立されたヘッドリソースライブラリとに応じて、特定のユーザーのリアルタイムリソースアクセス特徴を取得するための取得モジュールと、
予めトレーニングされたユーザークリックモデル、リアルタイムリソースアクセス特徴、及びヘッドリソースライブラリに応じて、k個の予測リソース識別子を予測するための予測モジュールと、
k個の予測リソース識別子に基づいて、特定のユーザーに対してリソース推奨を行うための推奨モジュールと、を含む。
【0016】
本出願は、さらに、電子機器を提供し、
少なくとも一つのプロセッサー、
少なくとも一つのプロセッサーに通信接続されるメモリと、を含んでおり、
メモリには、少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、コマンドが少なくとも一つのプロセッサーによって実行されることで、上記のいずれか一項に記載のユーザークリックモデルのトレーニング、又は、上記のいずれか一項に記載のリソース推奨方法を少なくとも一つのプロセッサーに実行させることができる。
【0017】
本出願は、コンピューターに上記のいずれか一項に記載のユーザークリックモデルのトレーニング、又は、上記のいずれか一項に記載のリソース推奨方法を実行させるためのコンピューターコマンドが記憶されている非一時的コンピューター可読記録媒体ことを特徴とする記録媒体を提供する。
【0018】
上記の出願における一実施例は以下の利点又は有益な効果を有する。ネットワークのユーザーのログデータベースから複数の行為データを収集し、予め確立されたヘッドリソースライブラリと、複数の行為データとに基づいて、複数の行為データに対応する複数のリソースアクセス特徴を生成し、複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングすることにより、ロスのないモデリング方式を提供でき、従来技術のモデリング方式に比べて、ユーザークリックモデルの精度を効果的に最適化し、ユーザークリックモデルの正確性を向上させることができる。
【0019】
さらに、本出願は、グローバルリソースライブラリ内の各リソースの属性情報、例えば、品質パラメーター、アクセス人気度、及び/又は、区別度に応じて、グローバルリソースライブラリから複数のヘッドリソースの識別子をフィルタリングし、ヘッドリソースライブラリを構築することが可能であり、ユーザークリックモデル内の分布算出の中心点として、いくつかの代表的な価値があるリソースの識別子を選択してヘッドリソースを構成することができ、モデルを実際のシーンとより正確に組み合わせて、実際のシーンの行為データを用いてユーザークリックモデルをより正確にトレーニングし、さらに、ユーザークリックモデルの精度を向上させ、実際のシーンをより正確に予測することができる。
【0020】
さらに、本出願では、明示的収集と暗黙的な収集との二つの収集方式を用いて行為データを収集することが可能となり、行為データの収集効率を効果的に向上させ、行為データ収集コンテンツを充実させ、行為データの収集品質を確保することができる。
【0021】
さらに、本出願では、各行為データにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報を取得し、各行為データにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報に基づいて、対応するリソースアクセス特徴を生成することが可能であり、ネガティブフィードバックや他のことを考慮することなく、リソースアクセス特徴にポジティブフィードバック情報に対応する特徴のみを含ませ、モデルの注目のタイプを単純化し、トレーニング済みモデルの正確性を提供し、トレーニングされたユーザークリックモデルは、ユーザーが関心を持っているリソースをより精度よく予測することができる。
【0022】
本出願のリソース推奨方法は、上記の技術案を採用することで、正確性が非常に高い予測リソース識別子を取得することができ、より絞った推奨をユーザーへ行うことができ、これにより、推奨効率を向上させ、ユーザーの粘着性とユーザーエクスペリエンスを増強することができる。
【0023】
上記好適な方式が有する他の効果ついては、具体的な実施例に基づいて以下説明される。
【図面の簡単な説明】
【0024】
図面はこの方案をよりよく理解するためのものであり、本出願の制限を構成するものではない。
【
図5】本出願の実施例のユーザークリックモデルのトレーニング又はリソース推奨方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0025】
以下、図面に基づいて、本発明の例示的な実施例を記述する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。明らか、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
【0026】
図1は、本出願の第1の実施例で提供されるユーザークリックモデルのトレーニング方法のフローチャートである。
図1に示すように、本実施例のユーザークリックモデルのトレーニング方法は、具体的に、以下のステップを含むことができる。
【0027】
S101において、ネットワークのユーザーのログデータベースから、予め設定された時間周期内のあるユーザーからのネットワークのリソースに対するフィードバック情報を含む複数の行為データを収集する。
【0028】
本実施例のユーザークリックモデルのトレーニング方法は、ユーザークリックモデルのトレーニング装置であってもよく、上記ユーザークリックモデルのトレーニング装置は、電子エンティティ、例えば、大型のコンピューターデバイスであってもよいし、ソフトウェア集積されたアプリケーションシステムを用いてもよい。
【0029】
本実施例において、まず、ネットワークのユーザーのログデータベースから、複数の行為データを収集する必要があって、ユーザークリックモデルをトレーニングするトレーニングデータを構成する。行為データのそれぞれには、予め設定された時間周期内のあるユーザーからのネットワークのリソースに対するフィードバック情報を含み、さらに、予め設定された時間周期は、ニーズに応じて取られることができ、例えば、それは、数分間、数時間、又は数日であってもよく、ここで、それを限定しない。また、本実施例の行為データのフォーマットは、ユーザー識別子、リソース識別子、及びユーザーからの上記リソース識別子に対応するリソースに対するフィードバック情報として表してもよく、好きや、嫌いのようなフィードバック方法を含んでもよい。本実施例では、フィードバック情報を「好き」と「嫌い」に分けているが、ユーザーが好きなものは強いフィードバックが有り得て、ユーザーが無視するもの、嫌いなことを直接示すものは嫌いなフィードバックであると思われる。行為データのそれぞれには予め設定された時間期間内でリソースにアクセスする行為データを含むため、各行為データに含まれるリソース情報は複数であり得て、ユーザーからの上記行為データにおける各リソースに対するフィードバック情報を具体的に記録する。
【0030】
本実施例におけるネットワークのユーザーのログデータベースから複数の行為データを収集することは、予めポイントの埋め込みが設定される明示的な収集方式、及び/又は、ユーザーからの各リソースに対するフィードバック情報を分析する暗黙的な収集方式の少なくとも一つを含む。
【0031】
ポイントの埋め込みを合理的に設計することで、行為データを収集する場合に、ユーザーからの表示されたリソースに対する明示的なフィードバック情報を含めることができ、この際、ユーザーID、リソースID、及び表示されたフィードバック情報を直接収集して、上記ユーザーの一つの行為データを一緒に標識できる。ここで、明示的なフィードバック情報は、ユーザーからフィードバックされる、上記リソースが好き又は嫌いことである。
【0032】
暗黙的な収集におけるフィードバック情報は、一定の推論を通じて得られる必要があり、たとえば、収集された行為データに応じて、ユーザーがあるリソースを閲覧したか、リソースが推奨された後にユーザーがすぐに切り替えたか、及び、ユーザーがあるリソースのページに滞在する時間が予め設定された時間閾値を超えたかなどの少なくとも1つを分析することで示されてもよく、たとえば、ユーザーがリソースを閲覧した場合、上記ユーザーはこのリソースが好きであると考えられ、ユーザーがリソースを閲覧切れずに切り替えた場合、ユーザーはこのリソースが嫌いであると考えられる。また、ユーザーにリソースが推奨された後、ユーザーがクリックせずに直接切り替えた場合、ユーザーはこのリソースが嫌いであると考えられ、このリソースがユーザーに推奨された後、ユーザーが直接切り替えず、一定の時間だけ閲覧した場合、ユーザーはリソースが好きであると考えられる。また、例えば、ユーザーが各リソースのページに滞在する時間を検出することができ、時間が予めに設定された時間閾値を超えた場合、対応するユーザーはリソースが好きであると考えられ、そうでない場合、ユーザーはリソースが嫌いであると考えられる。
【0033】
いずれの収集方法を用いても、複数の行為データを収集することができ、行為データのそれぞれには、ユーザーID、ユーザーが予め設定された時間周期内でアクセスする複数のリソースID、及びユーザーからの各リソースに対するフィードバック情報を含んでもよい。
【0034】
S102において、予め確立されたヘッドリソースライブラリと、複数の行為データとに基づいて、複数の行為データに対応する複数のリソースアクセス特徴を生成する。
【0035】
本実施例では、予め確立されたヘッドリソースライブラリにおいて、リソース、粒度によりグローバルリソースライブラリから、代表的な価値がある複数のヘッドリソースの識別子を統計してフィルタリングする。例えば、代表的な価値がある複数のヘッドリソースの識別子は、リソースの属性情報に基づいて、グローバルリソースライブラリからフィルタリングした取得され得、リソースの属性情報には、リソースの品質パラメーター、アクセス人気度、区別度などを含んでもよい。例えば、上記ステップS102の前に、グローバルリソースライブラリ内の各リソースの属性情報に応じて、グローバルリソースライブラリから複数のヘッドリソースの識別子をフィルタリングし、次に、複数のヘッドリソース識別子によりヘッドリソースライブラリを構築することをさらに含むことができる。
【0036】
さらに、任意選択で、グローバルリソースライブラリ内の各リソースの属性情報に応じて、グローバルリソースライブラリから、複数のヘッドリソースの識別子をフィルタリングすることは、
(A)グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、グローバルリソースライブラリから、品質パラメーターが予め設定された品質パラメーターの閾値よりも大きい複数のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
(B)グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、グローバルリソースライブラリから、アクセス人気度が予め設定された人気度閾値よりも大きい複数のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
(C)グローバルリソースライブラリ内の各リソースの区別度に応じて、グローバルリソースライブラリから、区別度が予め設定された区別度閾値よりも大きい複数のリソース識別子をフィルタリングしヘッドリソースの識別子とすることとの少なくとも一つの方式を含み、なお、各リソースの区別度は、リソースに対応する異なるフィードバックのユーザー群れの数の分散に等しい。
【0037】
本実施例のグローバルリソースライブラリにおいて、各リソースの識別子、即ちIDだけでなく、各リソースの各属性情報、例えば、品質パラメーター、アクセス人気度、区別度なども記録されており、なお、各リソースの区別度は、このリソースに対応する異なるユーザー群れの数の分散に等しい。例えば、一定の群れのユーザーからの各リソースに対する好きなフィードバックと嫌いなフィードバックを統計することで、各リソースが好きなユーザーの数と嫌いなユーザーの数とに基づいて、相応する分散をとり、このリソースの区別度としてもよい。なお、各リソースの品質パラメーターについては、各リソースプロバイダー、リソースの完全性、スコア、推奨インデックスなどの情報を参照してもよく、上記リソースに総合的に設定されるパラメーター値である。たとえば、信用の厚いリソースのプロバイダーよって提供されるリソースの品質パラメーターは高くスコアリングでき、完全性の良いリソースの品質パラメーターも高くスコアリングでき、リソースのスコアが高いことは、ユーザーがリソースを承認する程度が高いことを意味し、リソースの品質が良いと考えられることができ、この場合、リソースの品質パラメーターも高くスコアリングでき、同様に、リソースの推奨インデックスが高い場合、品質パラメーターも高くスコアリングできる。例えば、リソースの品質パラメーターに影響を与える各パラメーターを参照して、重み付けて和を求め、それらを平均化して、総合的に分析して得られた上記リソースの品質パラメーターとしてもよい。もちろん、実際のアプリケーションにおいて、その中のあるパラメーターの値を品質パラメーターとしてもよいし、リソースの品質パラメーターを他の方式で得てもよいが、ここで繰り返して記述しない。また、リソースのアクセス人気度は、最近隣時間帯で各リソースがアクセスされた回数をとってもよい。
【0038】
又は、本実施例では、グローバルリソースライブラリから、複数のヘッドリソースの識別子をフィルタリングすることは、
(A')グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、グローバルリソースライブラリから、品質パラメーターが最大となるTop N個のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
(B') グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、グローバルリソースライブラリから、アクセス人気度が最大となるTop M個のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
(C') グローバルリソースライブラリ内の各リソースの区別度に応じて、グローバルリソースライブラリから、区別度が最大となるTop W個のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることとの少なくとも一つの方式をさらに含むことができる。
【0039】
本実施例のN、M及びWは、すべて正の整数であり、具体的には、数値はすべて等しくてもよく、部分的に等しくてもよく、又は完全に異なってもよく、ここで限定しない。
【0040】
本実施例では、上記の作成されたヘッドリソースライブラリと、取得された複数の行為データとに基づいて、具体的に、行為データにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報を取得し、行為データのそれぞれにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報に基づいて、対応するリソースアクセス特徴を生成し、合わせて複数のリソースアクセス特徴を得ることにより、複数の行為データに対応する複数のリソースアクセス特徴を生成することができる。
【0041】
例えば、本実施例のポジティブフィードバック情報は、ユーザーが、上記リソースが好きであることを示し、ユーザーが、上記リソースが嫌いであること、リソースを無視することについて、本実施例では考慮しないことが可能となる。ヘッドリソースライブラリに500個のヘッドリソース識別子を含む場合、各行為データのうち、500個のヘッドリソース識別子におけるリソース識別子に対応するリソースにアクセスするフィードバック情報がポジティブフィードバックであるかどうかを分析し、相応するポジティブ・ネガティブライブラリ情報と、対応するヘッドリソース識別子を保留することができる。そして、1 * 500ベクトルを生成でき、各列は一つのヘッドリソース識別子に対応し、ポジティブフィードバックを持つヘッドリソース識別子のみに対応する箇所に有効データ、例えば、1が埋められ、その他のユーザーにアクセスされなかったヘッドリソース識別子とネガティブフィードバックに対応するヘッドリソース識別子に対応する箇所にすべて0が埋められ、このようにすれば、この1 * 500ベクトルを用いて、上記ユーザーがヘッドリソースライブラリにアクセスするリソースアクセス特性を標識することができる。本実施形態の有効データは、ポジティブフィードバック情報に対応するヘッドリソース識別子に対応する箇所に埋められたデータを示し、それ以外の箇所のデータは0とマークされ、無効データである。
【0042】
ある行為データにおいて、対応するユーザーは、500個のヘッドリソース識別子のうちの20個のヘッドリソース識別子に対応するリソースにのみアクセスし、15個のヘッドリソース識別子に対応するリソースにアクセスするフィードバック情報は、ポジティブフィードバックであり、つまり、ユーザーはリソースが好きである。この場合、対応して生成された1 * 500のベクトルのうちの15個のポジティブフィードバックのヘッドリソース識別子のみに対応する箇所は1であり、他の位置は0である。もちろん、実際のアプリケーションにおいて、1の代わりに他の数値を使用することもできますが、ここで限定しない。また、実際のアプリケーションにおいて、各行為データにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報に基づいて、他の方式で、対応するリソースアクセス特徴を生成することもでき、ここで繰り返して記述しない。
【0043】
本実施例では、ユーザークリックモデル内の分布算出の中心点として、いくつかの代表的な価値があるリソースの識別子を選択してヘッドリソースを構成することができる。通常のクラスタリングとは異なり、これらの中心点はクラスタリング中心ではなく、ガウス分布のアンカーポイントにすぎず。これらのアンカーポイントそのものは学習可能なスコアを持ち、初期のアンカーポイントがよく選択されていなくても、アルゴリズムは自動的にバックプロパゲーションにより、高次元空間におけるこれらのアンカーポイントの分布と最大値を最適化する。本実施例の方式に従って、最も代表的な価値があるアンカーポイントを選択することで、モデルと実際のシーンをより正確に組み合わせることができる。
【0044】
S103において、複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングする。
【0045】
上記ステップは複数のリソースアクセス特徴を用いてユーザークリックモデルをトレーニングする。トレーニングの中で、リソースアクセス特徴の数が多いほど、トレーニングされるユーザークリックモデルが正確になり、例えば、この実施形態で収集されたリソースアクセス特徴の数は、100万以上のレベルに達し、ユーザークリックモデルの正確性を向上する。
【0046】
例えば、上記ステップは、複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングし、具体的には、以下のステップを含んでユーザークリックモデルをトレーニングすることができる。
【0047】
(a)リソースアクセス特徴のそれぞれについて、リソースアクセス特徴における一部の有効データを隠すことで、対応するリソースアクセストレーニング特徴を取得する。
【0048】
例えば、ヘッドリソースライブラリに含まれるヘッドリソース識別子が500である場合、対応するリソースアクセス特徴は1 * 500のベクトルであり、対応する行為データにおいてポジティブフィードバック情報を持つヘッドリソース識別子に対応する箇所に有効なデータ、例えば、1が埋められる。後続のトレーニングを容易にするために、このステップでは、リソースアクセス特徴の一部の有効データを隠すことができ、且つ、隠した後、上記ヘッドリソースの位置に対応するデータは0になる。つまり、ユーザーはこのヘッドリソース識別子に対応するリソースにアクセスしていないと考えられる。本実施例では、有効データは、リソースアクセス特徴に含まれる有効データの総数の一定の比例、たとえば、10%、20%、又は他の比率に従って隠されることができる。リソースアクセス特徴ごとにこのステップの処理を行うことにより、相応するリソースアクセストレーニング特徴を対応して得ることができる。又は、トレーニングデータが十分でない場合、トレーニングデータを充実させるために、いくつかのリソースアクセス特徴を、異なる隠し比に従っていくつかのリソースアクセストレーニング特徴をそれぞれ生成することもできる。
【0049】
(b)リソースアクセストレーニング特徴をユーザークリックモデルに入力することで、ユーザークリックモデルが出力するリソースアクセス予測特徴を取得する。
【0050】
(c)リソースアクセス特徴と、対応するリソースアクセス予測特徴とに基づいて、クロスエントロピー関数値を算出する。
【0051】
(d)クロスエントロピー関数値が0に等しいかどうかを判断し、0に等しくない場合、ステップ(e)を実行し、0に等しい場合、ステップ(f)を実行する。
【0052】
(e)クロスエントロピー関数値が0に近づくように、ユーザークリックモデルのパラメーターを調整する。
【0053】
(f)クロスエントロピー関数値が連続する予め設定された回数のトレーニングにおいて0に等しいかどうかを判断し、そうでない場合、ステップ(a)に戻って、複数のリソースアクセス特徴を継続して用い、上記の方式に従って、ユーザークリックモデルを絶えずトレーニングし、0に等しい場合、ユーザークリックモデルのパラメーターを確定し、さらに、ユーザークリックモデルを確定し、トレーニングが終了する。
【0054】
トレーニングの前に、ユーザークリックモデルの各パラメーターに初期値をランダムに付与することができる。トレーニングの中で、いずれかのリソースアクセストレーニング特徴をユーザークリックモデルに入力し、この場合、上記ユーザークリックモデルは、上記リソースアクセストレーニング特徴に基づいて、1つのリソースアクセス予測特徴を予測して出力する。リソースアクセストレーニング特徴のそれぞれは、リソースアクセス特徴に基づいて得られるものであるため、理論的には、ユーザークリックモデルを正確に予測したと、上記リソースアクセス予測特徴はこのリソースアクセス特徴と同じでなければならず、従って、この場合、リソースアクセス特徴と、対応するリソースアクセス予測特徴とに基づいて、クロスエントロピー関数値を算出し、クロスエントロピー関数値が0に等しいかどうかを判断し、0に等しくない場合、ユーザークリックモデルの予測が正確ではないことを示し、この場合、クロスエントロピー関数値が0に近づくように、ユーザークリックモデルのパラメーターを調整することができる。そして、上記の方式を用いてユーザークリックモデルを絶えずトレーニングし、ユーザークリックモデルのパラメーターを絶えず調整する。ある一回のトレーニングのクロスエントロピー関数の値がただたまに0に等しくなり、ユーザークリックモデルもうまくトレーニングされないことを回避するために、この実施形態では、クロスエントロピー関数値が連続する予め設定された回数のトレーニングにおいて0に等しいことをとって、 ユーザークリックモデルはトレーニングされたと考えられ、この場合、ユーザークリックモデルのパラメーターを確定し、さらに、ユーザークリックモデルを確定する。本実施例における連続する予め設定された回数は、実際の経験に応じて、例えば、50、100又は他の値が取られてもよい。
【0055】
一回に1つのデータをトレーニングすると、トレーニング時間が長くなり、トレーニング時間が長くなり、トレーニング効率が低下する可能性があり、実際のアプリケーションでは、一回に1組のデータを用いてユーザーのクリックモデルを同時にトレーニングすることもでき、トレーニングの原理は同じであるので、ここで繰り返して記述しない。
【0056】
本出願のユーザークリックモデルは、ユーザーの興味のあるポイントを多次元空間上の分布として暗黙的にモデリングし、上記ユーザークリックモデルは改善されたオートエンコーダモデルを用いて、ガウス平滑化を使用してユーザーの興味のあるポイントを重畳して交差させ、上記ニューラルネットワークモデルを用いてこれらの興味のあるポイント、及びその分布をモデリングする。
【0057】
本出願のユーザークリックモデルの原型はオートエンコーダモデルを用いて、オートエンコーダの圧縮層と伸張層との間に知覚層を追加する。具体的に、上記ユーザークリックモデルは、平均場理論によりリソースクリックの分布をフィッティングし、理論的には任意の分布についてのロスのないシミュレーションに達成するようになる。連続的なデータ入力を通じて、勾配降下のニューラルネットワーク最適化アルゴリズムによりモデルのトレーニングを完成させる。
【0058】
従来のtagモデリングと異なるのは、本出願のユーザークリックモデルが明示的な単語の袋のような人間の主観的意識を持つ信号を使用しないことであり、ユーザークリックモデルのオフセットを回避する。従来の暗黙的なベクトルモデリングと異なるのは、本出願においてユーザーを算出に直接使用されるベクトルにエンコードしないことであり、表示である文字表現は、そのもの情報の圧損及びロスがあり、情報の理論に応じて、1次元のベクトルの情報量はこのベクトルを表示可能なビット数に関連し、空間、及び表示能力は限られるためである。従って、本出願の技術は、ユーザークリックモデルのモデリング精度を最適化するとともに、上記精度を得るために必要なデータ量を減らし、クリック率を極大に向上させながら、クリック率の増加を得るために必要なコストを削減することができる。
【0059】
例えば、各コンテンツサービスプロバイダーのユニバーサル推奨システムでは、本出願のこのロスのないモデリング方式を運用して、ユーザーによる、リソースのクリック、採択、拒否などの行為を効果的にキャプチャし、ユーザークリックモデルに効率よく記録することにより、推奨製品の採択率を大幅に向上させながら、使用期間と及び活動度を増加させることができる。
【0060】
また、本出願では、トレーニング効率を向上するために、ユーザーのストリーミングログに基づいて、ストリーミング行為データを収集することで、トレーニング閉ループを確立することができる。例えば、ネットワークのユーザーのログデータベースから、各ユーザーのログデータを時系列に並べてもよく、行為データを収集する場合、同一のユーザーを時系列に従って前から後ろへストリーミング収集する。対応して、ステップS103において、トレーニングの中で、各行為データに対応するリソースアクセス特徴の時系列に従って、前から後ろへトレーニングをそれぞれ行い、このようにすれば、ユーザーの新しいインタラクション行為データは継続してフィードバックループに従ってトレーニングをトリガーできるようにし、ユーザークリックモデルを更新し、閉ループトレーニングを形成し、理論的には、トレーニング時間を短縮でき、ユーザークリックモデルのトレーニング効果を効果的に改善できる。
【0061】
本実施例のユーザークリックモデルのトレーニング方法は、ネットワークのユーザーのログデータベースから複数の行為データを収集し、予め確立されたヘッドリソースライブラリと、複数の行為データとに基づいて、複数の行為データに対応する複数のリソースアクセス特徴を生成し、複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングすることにより、ロスのないモデリング方式を提供でき、従来技術のモデリング方式に比べて、ユーザークリックモデルの精度を効果的に最適化し、ユーザークリックモデルの正確性を向上させることができる。
【0062】
さらに、本出願は、グローバルリソースライブラリ内の各リソースの属性情報、例えば、品質パラメーター、アクセス人気度、及び/又は、区別度に応じて、グローバルリソースライブラリから複数のヘッドリソースの識別子をフィルタリングし、ヘッドリソースライブラリを構築することが可能であり、ユーザークリックモデル内の分布算出の中心点として、いくつかの代表的な価値があるリソースの識別子を選択してヘッドリソースを構成することができ、モデルを実際のシーンとより正確に組み合わせて、実際のシーンの行為データを用いてユーザークリックモデルをより正確にトレーニングし、さらに、ユーザークリックモデルの精度を向上させ、実際のシーンをより正確に予測することができる。
【0063】
さらに、本出願では、明示的収集と暗黙的な収集との二つの収集方式を用いて行為データを収集することが可能となり、行為データの収集効率を効果的に向上させ、行為データ収集コンテンツを充実させ、行為データの収集品質を確保することができる。
【0064】
さらに、本出願では、各行為データにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報を取得し、各行為データにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報に基づいて、対応するリソースアクセス特徴を生成することが可能であり、ネガティブフィードバックや他のことを考慮することなく、リソースアクセス特徴にポジティブフィードバック情報に対応する特徴のみを含ませ、モデルの注目のタイプを単純化し、トレーニング済みモデルの正確性を提供し、トレーニングされたユーザークリックモデルは、ユーザーが関心を持っているリソースをより精度よく予測することができる。
【0065】
図2は、本出願の第2の実施例で提供されるリソース推奨方法のフローチャートである。
図2に示すように、本実施例のリソース推奨方法は、具体的に、以下のステップを含むことができる。
【0066】
S201において、最近隣時間帯での特定のユーザーのリアルタイム行為データを収集する。
【0067】
本実施例のリソース推奨方法は、上記の
図1に示す実施例でトレーニングされたユーザークリックモデルの一つのアプリケーションであり、実際のアプリケーションにおいて、上記のトレーニングされたユーザークリックモデルは、他のシーン、例えば、リソース分析、リソース統計などに応用することもでき、ここで一つずつ挙げない。
【0068】
本実施例のリソース推奨方法の実行本体はリソース推奨装置であってもよく、同様に、上記リソース推奨装置は、独立した電子エンティティであってもよいし、ソフトウェア集積されたアプリケーションシステムであってもよい。
【0069】
実際のアプリケーションでは、上記リソース推奨装置は、上記の
図1に示す実施例のユーザークリックモデルのトレーニング装置とは独立していてもよいし、ユーザークリックモデルのトレーニング装置と一体的に設置されてもよく、ここで限定されない。
【0070】
本実施例では、ユーザーの現在のリアルタイム行為データに基づいて、ユーザーが将来アクセスする可能性があるリソースを予測することで、絞って、目的のあるリソース推奨を行うことを実現するためである。
【0071】
まず、本実施例では、最近隣時間帯内の特定のユーザーのリアルタイム行為データを用いることができ、なお、最近隣時間帯は、現在の時刻よりも前の最近隣1分、3分、又はその他の時間の長さの時間帯であってもよく、具体的には、実際のニーズに応じて設置されてもよく、具体的なシーンにおけるリアルタイム要件を満たしなければならない。同様に、本実施例のリアルタイム行為データに含まれる情報は、上記の
図1に示す実施例に含まれる行為データと類似するので、詳細については、上記の
図1に示す実施例の行為データを参照し、ここで繰り返して記述しない。
【0072】
S202において、リアルタイム行為データと、予め確立されたヘッドリソースライブラリとに応じて、特定のユーザーのリアルタイムリソースアクセス特徴を取得する。
【0073】
本実施例で用いられる予め確立されたヘッドリソースライブラリは、上記の
図1に示す実施例と同じであり、上記の
図1に示す実施例におけるリソースアクセス特徴を取得する方法を参照して、本実施例のリアルタイムリソースアクセス特徴を取得し、詳細については、上記の
図1に示す実施例の記載を参照でき、ここで繰り返して記述しない。
【0074】
S203において、予めトレーニングされたユーザークリックモデル、リアルタイムリソースアクセス特徴、及びヘッドリソースライブラリに応じて、k個の予測リソース識別子を予測する。
本実施例におけるkは、任意の正の整数であってもよい。
【0075】
例えば、上記ステップS203であるユーザークリックモデル、リアルタイムリソースアクセス特徴、及びヘッドリソースライブラリに応じて、k個の予測リソース識別子を予測することは、具体的に、
(1)ユーザークリックモデルと、リアルタイムリソースアクセス特徴とに応じて、特定のユーザーの予測リソースアクセス特徴を予測するステップと、
(2)予測リソースアクセス特徴、リアルタイムリソースアクセス特徴、及びヘッドリソースライブラリに基づいて、k個の予測リソース識別子を取得するステップと、を含むことができる。
【0076】
具体的に、リアルタイムリソースアクセス特徴は短い時間帯に基づいて取得され、コンテンツは十分に豊富ではないため、本実施例では、リアルタイムリソースアクセス特徴に基づいて、ユーザークリックモデルを用いてユーザーがアクセス可能なリソースの特徴の全部を予測し、即ち、予測リソースアクセス特徴を得ることができる。例えば、同様に、ヘッドリソースライブラリに500個のヘッドリソース識別子含むことを例にとって、リアルタイムリソースアクセス特徴に20個の有効データのみを含む可能性があり、つまり、上記特定のユーザーからの最近隣時間帯でアクセスされた20個のヘッドリソースに対するフィードバック情報が好きであることを示し、この場合、ユーザークリックモデルを用いて、将来クリックする可能性があるヘッドリソースを予測する。ただし、上記ユーザークリックモデルは、将来クリックする可能性があるヘッドリソースの識別子を直接予測することはできず、これらのヘッドリソースの情報を予測リソースアクセス特徴に隠して、例えば、この場合、予測リソースアクセス特徴に含まれる有効データ、即ち、0ではないデータは100個であり得る。
【0077】
具体的に、予測リソースアクセス特徴、リアルタイムリソースアクセス特徴、及びヘッドリソースライブラリに基づいて、k個の予測リソース識別子を取得する場合に、予測リソースアクセス特徴をリアルタイムリソースアクセス特徴と照合することで、リアルタイムリソースアクセス特徴、予測リソースアクセス特徴に対して新しく増加する有効データを取得し、予測リソースアクセス特徴のうち新しく増加する全ての有効データを大きい順に並べて、top k個の有効データを取得し、予測リソースアクセス特徴のうちのヘッドリソースライブラリにおける上記top k個の有効データのそれぞれに対応するリソース識別子を取得し、k個の予測リソース識別子を得ることができる。上記の例において、予測リソースアクセス特徴に含まれる有効データが100個であると、リアルタイムリソースアクセス特徴の20個の有効データに対応する箇所の有効データを除いて、80個の新しく増加する有効データがあり、これらの80個の有効データを大きい順に並べ、top k個を取得し、kは、ニーズに応じて任意の正の整数、例えば、10、8又は他の数値をとってもよい。次に、ヘッドリソースライブラリに基づいて、予測リソースアクセス特徴のうちk個の有効データに対応するヘッドリソースの識別子を取得し、k個の予測リソース識別子とする。
【0078】
S204において、k個の予測リソース識別子に基づいて、特定のユーザーに対してリソース推奨を行う。
【0079】
本実施例のリソース推奨方法は、上記の技術案を採用することで、正確性が非常に高い予測リソース識別子を取得することができ、さらに、より絞った推奨をユーザーへ行うことができ、これにより、推奨効率を向上させ、ユーザーの粘着性とユーザーエクスペリエンスを増強することができる。
【0080】
図3は、本出願の第三実施例で提供されるユーザークリックモデルのトレーニング装置の構造図である。
図3に示すように、本実施例のユーザークリックモデルのトレーニング装置300は、具体的に、
ネットワークのユーザーのログデータベースから、予め設定された時間周期内のあるユーザーからのネットワークのリソースに対するフィードバック情報を含む複数の行為データを収集するための収集モジュール301と、
予め確立されたヘッドリソースライブラリと複数の行為データとに基づいて、複数の行為データに対応する複数のリソースアクセス特徴を生成するための生成モジュール302と、
複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングするためのトレーニングモジュール303と、を含むことができる。
【0081】
さらに、任意選択で、本実施例のユーザークリックモデルのトレーニング装置300において、
グローバルリソースライブラリ内の各リソースの属性情報に応じて、グローバルリソースライブラリから複数のヘッドリソースの識別子をフィルタリングするためのフィルタリングモジュール304と、
複数のヘッドリソース識別子によりヘッドリソースライブラリを構築するための構築モジュール305と、をさらに含む。
【0082】
さらに、任意選択で、フィルタリングモジュール304は、
グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、グローバルリソースライブラリから、品質パラメーターが予め設定された品質パラメーターの閾値よりも大きい複数のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、グローバルリソースライブラリから、アクセス人気度が予め設定された人気度閾値よりも大きい複数のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
グローバルリソースライブラリ内の各リソースの区別度に応じて、グローバルリソースライブラリから、区別度が予め設定された区別度閾値よりも大きい複数のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることとの少なくとも一つを実行するために用いられ、
各リソースの区別度は、リソースに対応する異なるフィードバックのユーザー群れの数の分散に等しく、
又は、
フィルタリングモジュール304は、
グローバルリソースライブラリ内の各リソースの品質パラメーターに応じて、グローバルリソースライブラリから、品質パラメーターが最大となるTop N個のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
グローバルリソースライブラリ内の各リソースのアクセス人気度に応じて、グローバルリソースライブラリから、アクセス人気度が最大となるTop M個のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることと、
グローバルリソースライブラリ内の各リソースの区別度に応じて、グローバルリソースライブラリから、区別度が最大となるTop W個のリソース識別子をフィルタリングし、ヘッドリソースの識別子とすることとの少なくとも一つを実行するために用いられ、
N、M、及びWは正の整数である。
【0083】
さらに、任意選択で、本実施例のユーザークリックモデルのトレーニング装置300において、収集モジュール301は、具体的に、
ログデータベースから、予めポイントの埋め込みが設定される明示的な収集方式及び/又は通過ユーザーによる各リソースのフィードバック情報を分析する暗黙的な収集方法により、複数の行為データを収集するために用いられる。
【0084】
さらに任意選択、本実施例のユーザークリックモデルのトレーニング装置300において、生成モジュール302は、具体的に、
行為データのそれぞれにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報を取得し、
行為データのそれぞれにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報に基づいて、対応するリソースアクセス特徴を生成し、合わせて複数のリソースアクセス特徴を得るために用いられる。
【0085】
さらに任意選択で、本実施例のユーザークリックモデルのトレーニング装置300において、トレーニングモジュール303は、具体的に、
リソースアクセス特徴のそれぞれについて、各リソースアクセス特徴の一部の有効データを隠すことで、対応するリソースアクセストレーニング特徴を取得し、
リソースアクセストレーニング特徴をユーザークリックモデルに入力することで、ユーザークリックモデルが出力するリソースアクセス予測特徴を取得し、
リソースアクセス特徴と、対応するリソースアクセス予測特徴とに基づいて、クロスエントロピー関数値を算出し、
クロスエントロピー関数値が0に等しいかどうかを判断し、
0に等しくない場合、クロスエントロピー関数値が0に近づくように、ユーザークリックモデルのパラメーターを調整し、
クロスエントロピー関数値が連続する予め設定された回数のトレーニングにおいて0に等しいまで、複数のリソースアクセス特徴を用いて、上記の方式に従って、ユーザークリックモデルを絶えずトレーニングし、ユーザークリックモデルのパラメーターを確定し、さらに、ユーザークリックモデルを確定するために用いられる。
【0086】
本実施例のユーザークリックモデルのトレーニング装置300は、上記のモジュールを用いることでユーザークリックモデルを実現する実現原理及び技術的効果は、上記の相関する方法実施例の実現と同じであるので、詳細については、上記の相関する方法実施例の記載を参照し、ここでは繰り返して記述しない。
【0087】
図4は、本出願の第4の実施例で提供されるリソース推奨装置の構造図である。
図4に示すように、本実施例のリソース推奨装置400は、具体的に、
最近隣時間帯での特定のユーザーのリアルタイム行為データを収集するための収集モジュール401と、
リアルタイム行為データと、予め確立されたヘッドリソースライブラリとに応じて、特定のユーザーのリアルタイムリソースアクセス特徴を取得するための取得モジュール402と、
予めトレーニングされたユーザークリックモデル、リアルタイムリソースアクセス特徴及びヘッドリソースライブラリに応じて、k個の予測リソース識別子を予測するための予測モジュール403と、
k個の予測リソース識別子に基づいて、特定のユーザーに対してリソース推奨を行うための推奨モジュール404と、を含むことができる。
【0088】
さらに任意選択で、本実施例のリソース推奨装置400において、予測モジュール403は、具体的に、
ユーザークリックモデルと、リアルタイムリソースアクセス特徴とに応じて、特定のユーザーの予測リソースアクセス特徴を予測し、
予測リソースアクセス特徴、リアルタイムリソースアクセス特徴、及びヘッドリソースライブラリに基づいて、k個の予測リソース識別子を取得する、ために用いられる。
【0089】
本実施例に係るリソース推奨装置400は、上記のモジュールを用いることでリソース推奨を実現する実現原理及び技術的効果は、上記の相関する方法実施例の実現と同じであるので、詳細については、上記の相関する方法実施例の記載を参照し、ここで繰り返して記述しない。
【0090】
本出願の実施例によれば、本出願は、さらに、電子機器及び可読記憶媒体を提供する。
【0091】
図5に示すように、本出願の実施例によるユーザークリックモデルのトレーニング又はリソース推奨方法の電子機器のブロック図である。電子機器は、様々な形式のデジタルコンピューター、例えば、ラップトップ、デスクトップ、ワークステーション、携帯情報端末、サーバー、ブレードサーバ、メインフレームコンピューター、及び他の適切なコンピューターであることが意図される。電子機器は、様々な種類のモバイル装置、例えば、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティング装置を示してもよい。ここで示した構成要素、これらの接続及び関係、ならびにこれらの機能は例示にすぎなく、本明細書において説明及び/又は請求される本出願の実現を限定することが意図されない。
【0092】
図5に示すように、上記電子機器は、一つ又は複数のプロセッサー501、メモリ502、及び各構成要素に接続するためのインターフェースを含み、高速インターフェース及び低速インターフェースを含む。各構成要素は、異なるバスで相互接続され、そして、共通マザーボードに、又は必要に応じて、他の方式で実装されてもよい。プロセッサーは、電子機器内で実行されるコマンドを処理してもよく、メモリに又はメモリ上で外部入力/出力装置(例えば、インターフェースに結合される表示装置)にグラフィカルユーザーインターフェースのグラフィカル情報を表示するコマンドを含む。他の実施形態において、において、複数のプロセッサー及び/又は複数のバスが、適宜、複数のメモリ及びメモリのタイプとともに用いられてもよい。同様に、複数の電子機器が接続されてもよく、それぞれの装置が(例えば、サーババンク、ブレードサーバの集まり、又はマルチプロセッサーシステムとして)必要な操作の一部を提供する。
図5において、一つのプロセッサー501を例にとる。
【0093】
メモリ502は、本出願で提供される非一時的コンピューター可読記録媒体である。なお、メモリは、少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、少なくとも一つのプロセッサーに本出願で提供されるユーザークリックモデルのトレーニング方法又はリソース推奨方法を実行させる。本出願の非一時的コンピューター可読記録媒体は、上記ココンピューターに本出願で提供されるユーザークリックモデルのトレーニング方法又はリソース推奨方法実行させるためのコンピューターコマンドが記憶されている。
【0094】
メモリ502は、非一時的コンピューター可読記録媒体として、非一時的ソフトウェアプログラム、非一時的コンピューター実行可能なプログラム、モジュール、例えば、本出願の実施例におけるユーザークリックモデルのトレーニング方法又はリソース推奨方法に対応するプログラムコマンド/モジュール(例えば、
図3に示すモジュールのそれぞれ及び
図4に示すモジュールのそれぞれ)を記憶するために用いられる。プロセッサー501は、メモリ302に記憶されている非一時的ソフトウェアプログラム、コマンド及びモジュールを実行することで、サーバーの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記の方法実施例におけるユーザークリックモデルのトレーニング方法又はリソース推奨方法を実現する。
【0095】
メモリ502は、記憶プログラム領域及び記憶データ領域を含んでもよく、記憶プログラム領域はオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶してもよく、記憶データ領域は電子機器の使用により作成されたデータなどを記憶してもよい。また、メモリ502は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的メモリを含んでもよく、例えば、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体記憶装置を含んでもよい。幾つかの実施例において、メモリ502は、プロセッサー501に対してリモートに設置されたメモリを選択的に含んでもよく、これらのリモートメモリは、ネットワークを介して電子機器に接続されてもよい。上記のネットワークの例には、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。
【0096】
ユーザークリックモデルのトレーニング方法又はリソース推奨方法の電子機器は入力装置503及び出力装置504をさらに含むことができる。プロセッサー501、メモリ502、入力装置503及び出力装置504はバス又は他の方式で接続されてもよく、
図5に、バスで接続されることを例にとる。
【0097】
入力装置503は、入力された数値又は文字情報を受信し、ユーザークリックモデルのトレーニング方法又はリソース推奨方法のユーザー設定及び機能制御に関連するキー信号入力を生成でき、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置504は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モーター)などを含むことができる。上記表示装置は、液晶ディスプレイ(LCD)、発光ダイオードディスプレイ(LED)、及びプラズマディスプレイを含み得るが、これらに限定されない。 いくつかの実施形態では、表示装置はタッチスクリーンであってもよい。
【0098】
本明細書に説明されるシステム及び技術的様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向け集積回路、コンピューターハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及びコマンドを受信し、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置にデータ及びコマンドを送信するようにつなげられた、特殊用途でもよく一般用途でもよい少なくとも一つのプログラマブルプロセッサーを含む、プログラム可能なシステム上で実行可能及び/又は解釈可能な一つ又は複数のコンピュータープログラムにおける実行を含んでもよい。
【0099】
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又は、コードとも称される)は、プログラマブルプロセッサーの機械コマンドを含み、高水準のプロセス及び/もしくはオブジェクト向けプログラミング言語、及び/又はアセンブリ/機械言語で実行されることができる。本明細書で用いられる「機械可読媒体」という用語は、機械可読信号としての機械コマンドを受け取る機械可読媒体を含むプログラマブルプロセッサーに機械コマンド及び/又はデータを提供するのに用いられる任意のコンピュータープログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、及びプログラマブル論理デバイス)を指す。「機械可読信号」という用語は、プログラマブルプロセッサーに機械コマンド及び/又はデータを提供するために用いられる任意の信号を指す。
【0100】
ユーザーとのインタラクトを提供するために、本明細書に説明されるシステムと技術は、ユーザーに対して情報を表示するためのディスプレイデバイス(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)、ユーザーがコンピューターに入力を与えることができるキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)を有するコンピューター上に実施されることが可能である。その他の種類の装置は、さらに、ユーザーとのインタラクションを提供するために使用されることが可能であり、例えば、ユーザーに提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック)であり得、ユーザーからの入力は、任意の形態で(音響、発話、又は触覚による入力を含む)受信され得る。
【0101】
本明細書に説明されるシステムと技術的実施形態は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド構成要素を含むコンピューティングシステム(例えば、グラフィカルユーザーインターフェースもしくはウェブブラウザを有するクライアントコンピューターであり、ユーザーは、上記グラフィカルユーザーインターフェースもしくは上記ウェブブラウザを通じて本明細書で説明されるシステムと技術的実施形態とインタラクションすることができる)、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。ステムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、ワイド・エリア・ネットワーク(WAN)、インターネットワークを含む。
【0102】
コンピューターシステムは、クライアントとサーバーを含み得る。クライアントとサーバーは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバーとの関係は、相応するコンピューター上で実行さ、互いにクライアント-サーバーの関係にあるコンピュータープログラムによって生じる。
【0103】
本出願の実施例の技術案によれば、ネットワークのユーザーのログデータベースから複数の行為データを収集し、予め確立されたヘッドリソースライブラリと、複数の行為データとに基づいて、複数の行為データに対応する複数のリソースアクセス特徴を生成し、複数のリソースアクセス特徴を用いて、ユーザークリックモデルをトレーニングすることにより、ロスのないモデリング方式を提供でき、従来技術のモデリング方式に比べて、ユーザークリックモデルの精度を効果的に最適化し、ユーザークリックモデルの正確性を向上させることができる。
【0104】
さらに、本出願は、グローバルリソースライブラリ内の各リソースの属性情報、例えば、品質パラメーター、アクセス人気度、及び/又は、区別度に応じて、グローバルリソースライブラリから複数のヘッドリソースの識別子をフィルタリングし、ヘッドリソースライブラリを構築することが可能であり、ユーザークリックモデル内の分布算出の中心点として、いくつかの代表的な価値があるリソースの識別子を選択してヘッドリソースを構成することができ、モデルを実際のシーンとより正確に組み合わせて、実際のシーンの行為データを用いてユーザークリックモデルをより正確にトレーニングし、さらに、ユーザークリックモデルの精度を向上させ、実際のシーンをより正確に予測することができる。
【0105】
さらに、本出願では、明示的収集と暗黙的な収集との二つの収集方式を用いて行為データを収集することが可能となり、行為データの収集効率を効果的に向上させ、行為データ収集コンテンツを充実させ、行為データの収集品質を確保することができる。
【0106】
さらに、本出願では、各行為データにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報を取得し、各行為データにおけるユーザーからのヘッドリソースライブラリ内のリソースに対するポジティブフィードバック情報に基づいて、対応するリソースアクセス特徴を生成することが可能であり、ネガティブフィードバックや他のことを考慮することなく、リソースアクセス特徴にポジティブフィードバック情報に対応する特徴のみを含ませ、モデルの注目のタイプを単純化し、トレーニング済みモデルの正確性を提供し、トレーニングされたユーザークリックモデルは、ユーザーが関心を持っているリソースをより精度よく予測することができる。
【0107】
本出願のリソース推奨方法は、上記の技術案を採用することで、正確性が非常に高い予測リソース識別子を取得することができ、より絞った推奨をユーザーへ行うことができ、これにより、推奨効率を向上させ、ユーザーの粘着性とユーザーエクスペリエンスを増強することができる。
【0108】
以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本出願に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本出願で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。
【0109】
上記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、本出願の保護範囲内に含まれるべきである。