(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-06
(45)【発行日】2023-02-14
(54)【発明の名称】モデルトレーニングシステムおよび方法および記憶媒体
(51)【国際特許分類】
G06N 20/00 20190101AFI20230207BHJP
G06F 16/955 20190101ALI20230207BHJP
G06F 16/907 20190101ALI20230207BHJP
G06F 21/62 20130101ALI20230207BHJP
【FI】
G06N20/00
G06F16/955
G06F16/907
G06F21/62 318
【外国語出願】
(21)【出願番号】P 2021121473
(22)【出願日】2021-07-26
(62)【分割の表示】P 2020529143の分割
【原出願日】2018-11-06
【審査請求日】2021-09-06
(31)【優先権主張番号】201711227185.X
(32)【優先日】2017-11-29
(33)【優先権主張国・地域又は機関】CN
【早期審査対象出願】
【前置審査】
(73)【特許権者】
【識別番号】521486206
【氏名又は名称】ホアウェイ クラウド コンピューティング テクノロジーズ カンパニー リミテッド
【氏名又は名称原語表記】Huawei Cloud Computing Technologies Co., Ltd.
【住所又は居所原語表記】Huawei Cloud Data Center,Jiaoxinggong Road,Qianzhong Avenue, Gui’an New District, Guizhou,550025,China
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】チェン、プ
(72)【発明者】
【氏名】リアオ、シャオボ
【審査官】加藤 優一
(56)【参考文献】
【文献】米国特許出願公開第2016/0335550(US,A1)
【文献】米国特許出願公開第2016/0019324(US,A1)
【文献】米国特許出願公開第2017/0178020(US,A1)
【文献】米国特許出願公開第2017/0329829(US,A1)
【文献】特表2014-532935(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00 -99/00
G06F 8/00 - 8/38
G06F 8/60 - 8/77
G06F 9/44 - 9/445
G06F 9/451
G06F 16/00 -16/958
G06F 21/62
(57)【特許請求の範囲】
【請求項1】
クラウドデータストレージプラットフォームとクラウドモデルトレーニングプラットフォームと
認証センタとを備える、クラウドサービスを提供するモデルトレーニングシステムであって、前記モデルトレーニングシステムは、アカウントおよびパスワードによりネットワークを介して、ユーザが使用するユーザ端末によって接続可能であり、
前記クラウドデータストレージプラットフォームは、
複数のトレーニングデータセットを格納する手順であって、前記複数のトレーニングデータセットは、少なくとも1つのデータプロバイダによって前記クラウドデータストレージプラットフォームにアップロードされる、手順
を行うように構成され、
前記クラウドモデルトレーニングプラットフォームは、
前記ユーザが使用する前記ユーザ端末からモデルトレーニング作成命令を受信し、
前記モデルトレーニング作成命令に従って、トレーニング対象のモデルを取得し、前記クラウドデータストレージプラットフォームに格納された前記複数のトレーニングデータセットから前記ユーザによって選択されたトレーニングデータセットを、前記選択されたトレーニングデータセットの前記ユーザへの呼び出しが承認されていることを条件に呼び出し、前記選択されたトレーニングデータセットを使用することによって、前記トレーニング対象のモデルをトレーニングし、トレーニング結果モデルを取得するように構成され
、
前記認証センタは、前記ユーザ端末から認証許可要求を受信するように構成され、前記認証許可要求は、前記選択されたトレーニングデータセットの支払い情報を含み、前記認証許可要求は、前記選択されたトレーニングデータセットの呼び出し許可を要求するために使用され、
前記支払い情報が、前記選択されたトレーニングデータセットの支払いに前記ユーザが成功したことを示す場合に、前記認証センタは、前記選択されたトレーニングデータセットの呼び出しのセキュリティ証明書として使用されるデータトークンを作成し、前記データトークンを前記ユーザ端末に送信するようにさらに構成され、前記データトークンは、前記ユーザ端末によって前記モデルトレーニング作成命令に追加されるために使用される、
システム。
【請求項2】
前記選択されたトレーニングデータセットは、前記ユーザが前記アカウントを用いて前記選択されたトレーニングデータセットの支払いに成功した後、有効期間の間に、前記ユーザへの呼び出しが承認される、請求項1に記載のシステム。
【請求項3】
前記クラウドデータストレージプラットフォームは、
前記少なくとも1つのデータプロバイダによって提供される前記複数のトレーニングデータセットの複数のラベルを受信する手順であって、各ラベルは、対応するトレーニングデータセットの内容を表すために使用される、手順
を行うように構成される、請求項1
または2に記載のシステム。
【請求項4】
前記システムは、データ検索プラットフォームをさらに備え、
前記データ検索プラットフォームは、
前記複数のトレーニングデータセットの情報を取得する手順であって、前記複数のトレーニングデータセットの前記情報は、各トレーニングデータセットのデータ所有者情報およびデータのアップロード日のいずれかまたは両方を含む、手順と、
各トレーニングデータセットの前記ラベルおよび前記情報の少なくとも1つに基づいて、データインデックステーブルを確立する手順と、
ユーザによって入力された検索命令を受信する手順であって、前記検索命令は検索キーワードを含む、手順と、
前記検索命令に従って、前記データインデックステーブルにおいてデータ検索を実行して検索結果を生成する手順であって、前記検索結果は、前記検索キーワードに対応するトレーニングデータセットの前記ラベルまたは前記情報を含む、手順と、
前記検索結果を前記ユーザに表示するために、前記検索結果を前記ユーザ端末に送信する手順と、
前記ユーザ端末によって送信される前記検索結果に対するデータ選択命令を受信する手順であって、前記データ選択命令は、前記検索結果から前記選択されたトレーニングデータセットを決定するように前記データ検索プラットフォームに命令するために使用される、手順と
を行うように構成される、
請求項
3に記載のシステム。
【請求項5】
クラウドモデルストレージプラットフォームをさらに備え、前記クラウドモデルストレージプラットフォームは、前記トレーニング対象のモデルを格納するように構成され、前記トレーニング対象のモデルは、モデルプロバイダまたは前記ユーザによって前記クラウドモデルストレージプラットフォームにアップロードされる、または前記クラウドモデルストレージプラットフォームによってモデルデータベースから取得され、
前記クラウドモデルトレーニングプラットフォームは、前記モデルトレーニング作成命令に従って前記トレーニング対象のモデルを前記クラウドモデルストレージプラットフォームから取得するようにさらに構成される、請求項1から
4のいずれか1項に記載のシステム。
【請求項6】
前記クラウドモデルトレーニングプラットフォームは、前記トレーニング結果モデルを取得した後、前記トレーニング結果モデルを前記クラウドモデルストレージプラットフォームに送信するように構成される、請求項
5に記載のシステム。
【請求項7】
データ監査システムをさらに備え、前記データ監査システムは、前記少なくとも1つのデータプロバイダによってアップロードされた前記複数のトレーニングデータセットに対して有効性を決定するように構成される、請求項1から
6のいずれか1項に記載のシステム。
【請求項8】
前記クラウドデータストレージプラットフォームは、第1のアクセスインターフェイスで構成され、前記第1のアクセスインターフェイスは、前記少なくとも1つのデータプロバイダによってアップロードされた前記複数のトレーニングデータセットを受信するために使用され、
前記クラウドデータストレージプラットフォームは、第2のアクセスインターフェイスで構成され、前記第2のアクセスインターフェイスは、前記ユーザによって入力される前記モデルトレーニング作成命令を受信するために使用される、
請求項1から
6のいずれか1項に記載のシステム。
【請求項9】
モデル推論プラットフォームをさらに備え、前記モデル推論プラットフォームは、
前記ユーザによって入力される推論要求を受信する手順であって、前記推論要求は処理されるべきデータを含む、手順と、
前記トレーニング結果モデルを呼び出し、前記処理されるべきデータをモデル推論のために前記トレーニング結果モデルにインポートする手順と、
を行うように構成される、請求項1から
8のいずれか1項に記載のシステム。
【請求項10】
前記選択されたトレーニングデータセットは、データルートで構成され、前記クラウドモデルトレーニングプラットフォームは、前記データルートに従って前記選択されたトレーニングデータセットを呼び出すようにさらに構成される、請求項1から
9のいずれか1項に記載のシステム。
【請求項11】
前記データルートは、前記選択されたトレーニングデータセットのユニフォームリソースロケータ(URL)パスを含む、請求項
10に記載のシステム。
【請求項12】
クラウドサービスを提供するモデルトレーニング方法であって、前記モデルトレーニング方法はクラウドサービスを提供するモデルトレーニングシステムに適用され、前記モデルトレーニングシステムは、アカウントおよびパスワードによりネットワークを介して、ユーザが使用するユーザ端末によって接続可能であり、クラウドデータストレージプラットフォーム
、認証センタ、およびクラウドモデルトレーニングプラットフォームが前記モデルトレーニングシステム上で実行され、前記モデルトレーニング方法は、
前記クラウドデータストレージプラットフォームによって、複数のトレーニングデータセットを格納する段階であって、前記複数のトレーニングデータセットは、少なくとも1つのデータプロバイダによって前記クラウドデータストレージプラットフォームにアップロードされる、段階と、
前記クラウドモデルトレーニングプラットフォームによって、前記ユーザが使用する前記ユーザ端末からモデルトレーニング作成命令を受信する段階と、
前記クラウドモデルトレーニングプラットフォームによって、トレーニング対象のモデルを取得する段階と、
前記クラウドモデルトレーニングプラットフォームによって、前記クラウドデータストレージプラットフォームに格納された前記複数のトレーニングデータセットから前記ユーザによって選択されたトレーニングデータセットを、前記選択されたトレーニングデータセットの前記ユーザへの呼び出しが承認されていることを条件に呼び出す段階と、
前記クラウドモデルトレーニングプラットフォームによって、前記選択されたトレーニングデータセットを使用することによって、前記トレーニング対象のモデルをトレーニングし、トレーニング結果モデルを取得する段階と
、
認証センタによって、前記ユーザ端末から認証許可要求を受信する段階であって、前記認証許可要求は、前記選択されたトレーニングデータセットの支払い情報を含み、前記認証許可要求は、前記選択されたトレーニングデータセットの呼び出し許可を要求するために使用される、段階と、
前記支払い情報が、前記選択されたトレーニングデータセットの支払いに前記ユーザが成功したことを示す場合に、前記認証センタによって、前記選択されたトレーニングデータセットの呼び出しのセキュリティ証明書として使用されるデータトークンを作成する段階と、
前記認証センタによって、前記データトークンを前記ユーザ端末に送信する段階であって、前記データトークンは、前記ユーザ端末によって前記モデルトレーニング作成命令に追加されるために使用される、段階と、
を備える、方法。
【請求項13】
前記選択されたトレーニングデータセットは、前記ユーザが前記アカウントを用いて前記選択されたトレーニングデータセットの支払いに成功した後、有効期間の間に、前記ユーザへの呼び出しが承認される、請求項
12に記載の方法。
【請求項14】
前記方法は、
前記クラウドデータストレージプラットフォームによって、前記少なくとも1つのデータプロバイダによって提供される前記複数のトレーニングデータセットの複数のラベルを受信する段階であって、各ラベルは、対応するトレーニングデータセットの内容を表すために使用される、段階
を備える、請求項
12または13に記載の方法。
【請求項15】
前記モデルトレーニングシステムは、データ検索プラットフォームをさらに有し、前記方法は、
前記データ検索プラットフォームによって、前記複数のトレーニングデータセットの情報を取得する段階であって、前記複数のトレーニングデータセットの前記情報は、各トレーニングデータセットのデータ所有者情報およびデータのアップロード日のいずれかまたは両方を含む、段階と、
前記データ検索プラットフォームによって、各トレーニングデータセットの前記ラベルおよび前記情報の少なくとも1つに基づいて、データインデックステーブルを確立する段階と、
前記データ検索プラットフォームによって、前記ユーザによって入力された検索命令を受信する段階であって、前記検索命令は検索キーワードを含む、段階と、
前記データ検索プラットフォームによって、前記検索命令に従って、前記データインデックステーブルにおいてデータ検索を実行する段階と、
前記データ検索プラットフォームによって、検索結果を生成する段階であって、前記検索結果は、前記検索キーワードに対応するトレーニングデータセットの前記ラベルまたは前記情報を含む、段階と、
前記データ検索プラットフォームによって、前記検索結果を前記ユーザに表示するために、前記検索結果を前記ユーザ端末に送信する段階と、
前記データ検索プラットフォームによって、前記ユーザ端末によって送信される前記検索結果に対するデータ選択命令を受信する段階であって、前記データ選択命令は、前記検索結果から前記選択されたトレーニングデータセットを決定するように前記データ検索プラットフォームに命令するために使用される、段階と
をさらに備える、請求項
14に記載の方法。
【請求項16】
クラウドモデルストレージプラットフォームによって、前記トレーニング対象のモデルを格納する段階であって、前記トレーニング対象のモデルは、モデルプロバイダまたは前記ユーザによって前記クラウドモデルストレージプラットフォームにアップロードされる、または前記クラウドモデルストレージプラットフォームによってモデルデータベースから取得される、段階と、
前記クラウドモデルトレーニングプラットフォームによって、前記モデルトレーニング作成命令に従って前記トレーニング対象のモデルを前記クラウドモデルストレージプラットフォームから取得する段階と、
をさらに備え、
前記クラウドモデルストレージプラットフォームは、クラウドサービスを提供する前記モデルトレーニングシステムで実行される、請求項
12から15のいずれか1項に記載の方法。
【請求項17】
前記クラウドモデルトレーニングプラットフォームによって、前記トレーニング結果モデルを取得した後、前記トレーニング結果モデルを前記クラウドモデルストレージプラットフォームに送信する段階をさらに備える、請求項
16に記載の方法。
【請求項18】
データ監査システムによって、前記少なくとも1つのデータプロバイダによってアップロードされた前記複数のトレーニングデータセットに対して有効性を決定する段階をさらに備え、
前記データ監査システムは、クラウドサービスを提供する前記モデルトレーニングシステムで実行される、請求項
12から17のいずれか1項に記載の方法。
【請求項19】
前記クラウドデータストレージプラットフォームは、第1のアクセスインターフェイスで構成され、前記第1のアクセスインターフェイスは、前記少なくとも1つのデータプロバイダによってアップロードされた前記複数のトレーニングデータセットを受信するために使用され、
前記クラウドデータストレージプラットフォームは、第2のアクセスインターフェイスで構成され、前記第2のアクセスインターフェイスは、前記ユーザによって入力される前記モデルトレーニング作成命令を受信するために使用される、
請求項
12から18のいずれか1項に記載の方法。
【請求項20】
モデル推論プラットフォームによって、前記ユーザによって入力される推論要求を受信する段階であって、前記推論要求は処理されるべきデータを含む、段階と、
前記モデル推論プラットフォームによって、前記トレーニング結果モデルを呼び出す段階と、
前記モデル推論プラットフォームによって、前記処理されるべきデータをモデル推論のために前記トレーニング結果モデルにインポートする段階と、
をさらに備え、
前記モデル推論プラットフォームは、クラウドサービスを提供する前記モデルトレーニングシステムで実行される、請求項
12から19のいずれか1項に記載の方法。
【請求項21】
前記選択されたトレーニングデータセットは、データルートで構成され、
前記クラウドモデルトレーニングプラットフォームによって、前記クラウドデータストレージプラットフォームに格納された前記選択されたトレーニングデータセットを呼び出す前記段階は、前記クラウドモデルトレーニングプラットフォームによって、前記データルートに従って前記選択されたトレーニングデータセットを呼び出す段階を含む、請求項
12から20のいずれか1項に記載の方法。
【請求項22】
前記データルートは、前記選択されたトレーニングデータセットのユニフォームリソースロケータ(URL)パスを含む、請求項
21に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、機械学習分野に関し、特に、モデルトレーニングシステムおよび方法および記憶媒体に関する。
【背景技術】
【0002】
深層学習は、人工知能やコンピュータービジョンなどの分野に広く適用されている。モデルトレーニングは深層学習で実行される必要がある。モデルトレーニングプロセスでは、モデル開発者は特定のモデルを設計し、データセットを使用して複数回の反復トレーニングを実行して、期待される要件を満たす深層学習モデルを取得する必要がある。データセットは、トレーニングされたモデルの安定性および精度が期待される要件を満たしているかどうかを判断するための鍵である。データセットは、データプロバイダによって提供される場合がある。
【0003】
この段階で、ユーザはデータプロバイダでデータのダウンロード許可を購入できる。データのダウンロード許可が承認された後、ユーザはデータをダウンロードしてデータをローカルに格納できる。モデルトレーニングを実行する必要がある場合、ローカルに格納されているダウンロードデータがモデルトレーニングシステムにコピーされ、モデルトレーニングが実装される。しかしながら、ローカルに格納されているダウンロードデータが漏洩するリスクは比較的大きくなる。
【発明の概要】
【0004】
本願は、トレーニングデータのリークのリスクを低減するためのモデルトレーニングシステムおよび方法、および記憶媒体を提供する。
【0005】
第1の態様によれば、本願は、クラウドデータストレージプラットフォームおよびクラウドモデルトレーニングプラットフォームを含むモデルトレーニングシステムを提供する。クラウドデータストレージプラットフォームは、トレーニングデータを格納し、トレーニングデータ呼び出し要求を受信し、データ呼び出し命令に対応するトレーニングデータを、トレーニングデータ呼び出し要求に基づいてクラウドモデルトレーニングプラットフォームにエクスポートするように構成される。クラウドモデルトレーニングプラットフォームは、モデルトレーニング作成命令を受信し、トレーニング対象のモデルを取得し、トレーニングデータ呼び出し要求を生成し、トレーニングデータ呼び出し要求をクラウドデータストレージプラットフォームに送信し、クラウドデータストレージプラットフォームからエクスポートされたトレーニングデータを使用して、トレーニング対象のモデルをトレーニングし、トレーニング結果モデルを取得するように構成される。
【0006】
第1の態様によれば、第1の態様の第1の可能な実装において、モデルトレーニングシステムは、データ検索プラットフォームおよび認証センタをさらに含み、クラウドデータストレージプラットフォームは、認証ゲートウェイを含む。データ検索プラットフォームはデータプロバイダによって提供されるトレーニングデータに基づいてデータインデックステーブルを確立し、検索命令を受信し、検索命令に従ってデータインデックステーブルでデータ検索を実行し、検索結果を生成し、そして、検索結果に対するユーザ端末のデータ選択命令を受信し、データ選択命令に従って認証センタへの認証許可要求を開始し、認証許可要求は、トレーニングデータのデータ識別子を含むように構成される。認証センタは、認証許可要求を受信し、認証許可要求に基づいてデータ識別子のデータトークンを作成し、データトークンを認証ゲートウェイとユーザ端末に送信するように構成される。クラウドモデルトレーニングプラットフォームは、トレーニングデータ呼び出し要求を認証ゲートウェイに送信し、トレーニングデータ呼び出し要求は、認証センタによってユーザ端末に配信されたデータトークンを含むようにさらに構成される。認証ゲートウェイは、第1の対応関係を確立し、第1の対応関係は、データ識別子とデータトークン間の1対1の対応関係であり、トレーニングデータ呼び出し要求を受信し、トレーニングデータ呼び出し要求のデータトークンに基づいてターゲットデータ識別子の第1の対応関係を検索し、ターゲットデータ識別子は、トレーニングデータ呼び出し要求のデータトークンに対応するデータ識別子であり、ターゲットデータ識別子に対応するトレーニングデータをクラウドモデルトレーニングプラットフォームにエクスポートするように構成される。
【0007】
第1の態様によれば、第1の態様の第2の可能な実装において、モデルトレーニングシステムはさらにデータ検索プラットフォームおよび認証センタを含み、クラウドデータストレージプラットフォームは認証ゲートウェイおよび少なくとも1つのデータストレージサーバを含む。データ検索プラットフォームは、データプロバイダによって提供されるトレーニングデータに基づいてデータインデックステーブルを確立し、検索命令を受信し、検索命令に従ってデータインデックステーブルでデータ検索を実行し、検索結果を生成し、 そして、検索結果に対するユーザ端末のデータ選択命令を受信し、データ選択命令に従って認証センタへの認証許可要求を開始し、認証許可要求は、トレーニングデータのデータ識別子を含むように構成される。認証センタは、認証許可要求を受信し、認証許可要求に基づいてデータ識別子のデータトークンを作成し、データトークンを認証ゲートウェイとユーザ端末に送信するように構成される。クラウドモデルトレーニングプラットフォームはさらに、トレーニングデータ呼び出し要求を認証ゲートウェイに送信するように構成され、トレーニングデータ呼び出し要求は、認証センタによってユーザ端末に配信されたデータトークンを含む。認証ゲートウェイは、第2の対応関係を確立し、第2の対応関係はデータトークンとデータルート間の対応関係であり、データルートにはトレーニングデータのユニフォームリソースロケーターパスが含まれ、トレーニングデータ呼び出し要求を受信し、トレーニングデータ呼び出し要求のデータトークンに基づいてターゲットデータルートの第2の対応関係を検索し、ターゲットデータルートはトレーニングデータ呼び出し要求のデータトークンに対応するデータルートであり、ターゲットデータストレージサーバにアクセスして、クラウドモデルトレーニングプラットフォームに、ターゲットデータストレージサーバのターゲットデータルートで示されるトレーニングデータをエクスポートし、ターゲットデータストレージサーバは、ターゲットデータルートに対応するデータストレージサーバであるように構成される。
【0008】
第1の態様の第2の可能な実装によれば、第1の態様の第3の可能な実装において、モデルトレーニングシステムは、アクセスルータをさらに含み、認証ゲートウェイは、ターゲットデータルートによって示されるトレーニングデータを、ターゲットデータストレージサーバからアクセスルータの予め設定された標準アクセスインターフェイスを介してエクスポートする。
【0009】
第1の態様の第1の可能な実装方式または第2の可能な実装方式によれば、第1の態様の第4の可能な実装方式において、認証ゲートウェイはさらに、更新決定パラメータを取得し、更新決定パラメータが更新条件を満たすかどうかを決定するように構成される、更新決定パラメータが更新条件を満たすと決定した場合、認証センタに更新要求を送信し、認証センタと同期してデータトークンを更新する。認証センタは、更新要求を受信し、更新要求に基づいてデータトークンを更新するようにさらに構成される。
【0010】
第1の態様の第4の可能な実装方式によれば、第1の態様の第5の可能な実装方式において、更新決定パラメータは、認証許可要求を拒否する回数を含む。認証ゲートウェイは、認証センタによる認証許可要求の処理プロセスを検出し、認証センタによる認証許可要求の拒否回数が更新条件の拒否回数更新閾値を超えたことを検出した場合、更新要求を認証センタに送信するようにさらに構成される。
【0011】
第1の態様の第5の可能な実装方式によれば、第1の態様の第6の可能な実装方式において、更新決定パラメータは、トレーニングデータを呼び出す回数を含む。認証ゲートウェイは、一定期間内のトレーニングデータの呼び出し回数を取得し、一定期間内の同じトレーニングデータの呼び出し回数が更新条件の呼び出し回数更新閾値を超えた場合に、認証センタに更新要求を送信するようにさらに構成される。
【0012】
第1の態様によれば、第1の態様の第7の可能な実装方式において、クラウドモデルトレーニングプラットフォームはさらに、トレーニングを通じてトレーニング結果モデルを取得した後、クラウドモデルトレーニングプラットフォーム内のトレーニング結果モデルのトレーニングに使用されるトレーニングデータおよびトレーニング対象のモデルを破棄するように構成される。
【0013】
第1の態様によれば、第1の態様の第8の可能な実施方式において、モデルトレーニングシステムは、データ監査システムをさらに含む。データ監査システムは、データプロバイダによってアップロードされたトレーニングデータの有効性検証を実行し、有効性検証に失敗したトレーニングデータをクラウドデータストレージプラットフォームに格納することを拒否するように構成される。
【0014】
第1の態様によれば、第1の態様の第9の可能な実装方式において、モデルトレーニングシステムは、クラウドモデルストレージプラットフォームをさらに含む。クラウドモデルストレージプラットフォームは、トレーニング対象のモデルを提供し、トレーニング結果モデルを格納するように構成される。
【0015】
第1の態様の第9の可能な実装方式によれば、第1の態様の第10の可能な実装方式において、モデルトレーニングシステムは、ミラープラットフォームおよびモデル推論プラットフォームをさらに含む。ミラープラットフォームは、モデル推論ランタイム環境を格納するように構成される。モデル推論プラットフォームは、推論要求を受信し、推論要求には、処理されるべきデータが含まれ、ミラープラットフォームからモデル推論ランタイム環境をロードし、クラウドモデルストレージプラットフォームからトレーニング結果モデルを呼び出し、モデル推論のために処理されるべきデータをトレーニング結果モデルにインポートするように構成される。
【0016】
第2の態様によれば、本願は、クラウドモデルトレーニングプラットフォームによって、トレーニング対象のモデルを取得するためのモデルトレーニング作成命令を受信する段階と、クラウドモデルトレーニングプラットフォームによって、トレーニングデータ呼び出し要求を生成し、トレーニングデータ呼び出し要求をクラウドデータストレージプラットフォームに送信して、クラウドデータストレージプラットフォームに格納されたトレーニングデータを呼び出す段階と、クラウドデータストレージプラットフォームによって、トレーニングデータ呼び出し要求を受信し、トレーニングデータ呼び出し要求に対応するトレーニングデータをクラウドモデルトレーニングプラットフォームにエクスポートし、クラウドモデルトレーニングプラットフォームにより、クラウドデータストレージプラットフォームからエクスポートされたトレーニングデータを使用して、トレーニング対象のモデルをトレーニングし、トレーニング結果モデルを取得する段階と、を含むモデルトレーニング方法を提供する。
【0017】
第2の態様によれば、第2の態様の第1の可能な実装方式において、モデルトレーニング方法はさらに、データ検索プラットフォームによって、データプロバイダによって提供されるトレーニングデータに基づいてデータインデックステーブルを確立する段階と、データ検索プラットフォームによって、検索命令を受信し、検索命令に従ってデータインデックステーブルでデータ検索を実行し、検索結果を生成する段階と、データ検索プラットフォームによって、ユーザ端末のデータ選択命令を受信し、データ選択命令に従って認証センタへの認証許可要求を開始する段階であって、認証許可要求は、トレーニングデータのデータ識別子を含む、段階と、認証センタによって、認証許可要求を受信し、認証許可要求に基づいてデータ識別子のデータトークンを作成し、データトークンを認証ゲートウェイおよびユーザ端末に配信する段階と、認証ゲートウェイによって送信されたデータトークンに基づく第1の対応関係を確立する段階であって、第1の対応関係は、データ識別子とデータトークンとの間の1対1の対応関係である、段階と、を備える。
【0018】
第2の態様の第1の可能な実装方式によれば、第2の態様の第2の可能な実装方式において、クラウドモデルトレーニングプラットフォームによって、トレーニングデータ呼び出し要求を生成し、トレーニングデータ呼び出し要求をクラウドデータストレージプラットフォームに送信する段階は、クラウドモデルトレーニングプラットフォームによってトレーニングデータ呼び出し要求を生成し、および認証ゲートウェイへトレーニングデータ呼び出し要求を送信する段階であって、トレーニングデータ呼び出し要求には、認証センタによってユーザ端末に配信されるデータトークンが含まれる、段階を含む。クラウドデータストレージプラットフォームによるトレーニングデータ呼び出し要求の受信、およびトレーニングデータ呼び出し要求に対応するトレーニングデータのクラウドモデルトレーニングプラットフォームへのエクスポートには、クラウドデータストレージプラットフォームの認証ゲートウェイによるトレーニングデータ呼び出し要求の受信、トレーニングデータ呼び出し要求のデータトークンに基づいてターゲットデータ識別子の第1の対応関係の検索、およびターゲットデータ識別子に対応するトレーニングデータをクラウドモデルトレーニングプラットフォームへのエクスポートが含まれ、ターゲットデータ識別子はトレーニングデータ呼び出し要求のデータトークンに対応するデータ識別子である。
【0019】
第2の態様によれば、第2の態様の第3の可能な実装方式において、モデルトレーニング方法は、データ検索プラットフォームによって、データプロバイダから提供されたトレーニングデータに基づいてデータインデックステーブルを確立する段階と、データ検索プラットフォームによって、検索命令を受信し、検索命令に従ってデータインデックステーブルでデータ検索を実行し、検索結果を生成し、検索結果を送信する段階と、データ検索プラットフォームによって、検索結果に対するユーザ端末のデータ選択命令を受信し、データ選択命令に従って認証センタへの認証許可要求を開始する段階であって、認証許可要求にはトレーニングデータのデータ識別子が含まれ、認証センタにより、認証許可要求を受信し、認証許可要求に基づいてデータ識別子のデータトークンを作成し、データトークンを認証ゲートウェイおよびユーザ端末に配信する段階と、認証ゲートウェイによって、配信されたデータトークンに基づいて第2の対応関係を確立し、第2の対応関係は、データトークンとデータルート間の対応関係であり、データルートにはトレーニングデータのユニフォームリソースロケーターパスが含まれる段階と、をさらに備える。
【0020】
第2の態様の第3の可能な実装方式によれば、第2の態様の第4の可能な実装方式において、クラウドモデルトレーニングプラットフォームによって、トレーニングデータ呼び出し要求を生成し、トレーニングデータ呼び出し要求をクラウドデータストレージプラットフォームに送信することには、クラウドモデルトレーニングプラットフォームによるトレーニングデータ呼び出し要求の生成、および認証ゲートウェイへのトレーニングデータ呼び出し要求の送信が含まれ、トレーニングデータ呼び出し要求には、認証センタによってユーザ端末に配信されるデータトークンが含まれる。クラウドデータストレージプラットフォームによるトレーニングデータ呼び出し要求の受信、およびトレーニングデータ呼び出し要求に対応するトレーニングデータのクラウドモデルトレーニングプラットフォームへのエクスポートには、以下が含まれる。クラウドデータストレージプラットフォームの認証ゲートウェイによってトレーニングデータ呼び出し要求を受信し、およびトレーニングデータ呼び出し要求内のデータトークンに基づいてターゲットデータルートの第2の対応関係を検索し、ここで、ターゲットデータルートは、トレーニングデータ呼び出し要求内のデータトークンに対応するデータルートであり、認証ゲートウェイによって、ターゲットデータストレージサーバにアクセスして、クラウドモデルトレーニングプラットフォームに、ターゲットデータストレージサーバ内のターゲットデータルートで示されるトレーニングデータをエクスポートし、ここで、ターゲットデータストレージサーバは、ターゲットデータルートに対応するデータストレージサーバである。
【0021】
第2の態様または第2の態様の第1の可能な実装方式から第4の可能な実装方式のいずれかによれば、第2の態様の第5の可能な実装方式において、モデルトレーニング方法は、認証ゲートウェイによって、更新決定パラメータを取得し、および更新決定パラメータが更新条件を満たすかどうかを決定し、更新決定パラメータが更新条件を満たすと決定した場合、認証ゲートウェイによって、更新要求を認証センタに送信し、認証センタによって更新要求を受信し、更新要求に基づいてデータトークンを更新し、認証ゲートウェイによって、認証センタと同期してデータトークンを更新することをさらに含む。
【0022】
第2の態様の第5の可能な実装方式によれば、第2の態様の第6の可能な実装方式では、更新決定パラメータは、認証許可要求を拒否する回数を含む。認証ゲートウェイによる更新決定パラメータの取得、および更新決定パラメータが更新条件を満たすかどうかの決定は、認証ゲートウェイによって、認証センタによる認証許可要求を処理するプロセスを検出し、認証センタによる認証許可要求を拒否する回数を取得し、認証センタによる認証許可要求を拒否する回数が更新条件の拒否回数更新閾値を超えているかどうかを判断することを含む。認証ゲートウェイが、更新決定パラメータが更新条件を満たすと決定した場合に、認証センタに更新要求を送信することは、認証センタによる認証許可要求の拒否回数が更新条件の拒否回数更新閾値を超えたことが検出された場合に、更新要求を認証センタに送信することを含む。
【0023】
第2の態様の第5の可能な実装方式によれば、第2の態様の第7の可能な実装方式では、更新決定パラメータは、トレーニングデータを呼び出す回数を含む。認証ゲートウェイが更新決定パラメータを取得すること、および更新決定パラメータが更新条件を満たすかどうかを決定することは、認証ゲートウェイが一定期間内にトレーニングデータの呼び出し回数を取得することと、一定期間内の同じトレーニングデータを呼び出し回数が、更新条件の呼び出し回数更新閾値を超えているかどうかを判断することを含む。認証ゲートウェイが、更新決定パラメータが更新条件を満たすと決定した場合に認証センタに更新要求を送信することは、一定期間内に同じトレーニングデータを呼び出す回数が更新条件の呼び出し回数更新閾値を超えた場合に、認証センタに更新要求を送信することを含む。
【0024】
第2の態様によれば、第2の態様の第8の可能な実装方式において、トレーニング結果モデルを取得するために、クラウドモデルトレーニングプラットフォームによって、クラウドデータストレージプラットフォームからエクスポートされたトレーニングデータを使用することによりトレーニング対象のモデルをトレーニングした後、この方法は、クラウドモデルトレーニングプラットフォームによって、クラウドモデルトレーニングプラットフォームでトレーニング結果モデルをトレーニングするために使用されるトレーニングデータおよびトレーニング対象のモデルを破棄することをさらに含む。
【0025】
第2の態様によれば、第2の態様の第9の可能な実装方式において、モデルトレーニング方法は、データ監査システムによって、データプロバイダによってアップロードされたトレーニングデータの有効性検証を実行することと、データ監査システムによって、有効性検証に失敗したトレーニングデータをクラウドデータストレージプラットフォームに格納することを拒否することをさらに含む。
【0026】
第2の態様によれば、第2の態様の第10の可能な実装方式において、トレーニング結果モデルを取得するために、クラウドモデルトレーニングプラットフォームによって、クラウドデータストレージプラットフォームからエクスポートされたトレーニングデータを使用することによりトレーニング対象のモデルをトレーニングした後、この方法はさらに、クラウドモデルストレージプラットフォームによってトレーニング結果モデルを格納することを含む。
【0027】
第2の態様の第10の可能な実装方式によれば、第2の態様の第11の可能な実装方式において、モデルトレーニング方法は、モデル推論プラットフォームによって、推論要求を受信することをさらに含み、推論要求には処理されるべきデータが含まれ、モデル推論プラットフォームによって、ミラープラットフォームからモデル推論ランタイム環境をロードし、クラウドモデルストレージプラットフォームからトレーニング結果モデルを呼び出し、モデル推論のために処理されるべきデータをトレーニング結果モデルにインポートする。
【0028】
第3の態様によれば、本願は、記憶媒体を提供し、記憶媒体はプログラムを記憶し、プログラムがプロセッサによって実行されるとき、前述の技術的解決手段のモデルトレーニング方法が実施される。
【0029】
本願は、深層学習シナリオに適用できるモデルトレーニングシステムおよび方法、および記憶媒体を提供する。モデルトレーニングシステムは、クラウドデータストレージプラットフォームおよびクラウドモデルトレーニングプラットフォームを含み得る。クラウドデータストレージプラットフォームはトレーニングデータを格納する。クラウドモデルトレーニングプラットフォームは、モデルトレーニングの実行をトリガするために、ユーザからモデルトレーニング作成命令を受信する。クラウドモデルトレーニングプラットフォームは、クラウドデータストレージプラットフォームに格納されているトレーニングデータを呼び出すために、クラウドデータストレージプラットフォームにトレーニングデータ呼び出し要求を送信する。クラウドモデルトレーニングプラットフォームは、取得したトレーニング対象のモデルと、クラウドデータストレージプラットフォームからエクスポートされたトレーニングデータを使用して、モデルトレーニングを実行する。本願では、クラウドデータストレージプラットフォームとクラウドモデルトレーニングプラットフォームは互いに独立しているため、トレーニングデータストレージとモデルトレーニングの2つの機能が分離されている。クラウドデータストレージプラットフォームとクラウドモデルトレーニングプラットフォームはどちらもクラウドシステムに基づいて実装され、モデルトレーニングプロセスはクラウドシステムで実行される。モデルトレーニングを実行するユーザは、トレーニングデータをローカルにダウンロードできない。そして、トレーニングデータは、クラウドデータストレージプラットフォームと、モデルトレーニングを実行しているクラウドモデルトレーニングプラットフォームに格納される。言い換えれば、ローカルユーザ側からトレーニングデータを漏洩させることができず、したがって、トレーニングデータが漏洩するリスクを低減できる。
【図面の簡単な説明】
【0030】
【
図1】本発明の実施形態によるモデルトレーニングシステムの適用シナリオの概略図である。
【0031】
【
図2】本発明の実施形態によるモデルトレーニングシステムの概略構造図である。
【0032】
【
図3】本発明の別の実施形態によるモデルトレーニングシステムの概略構造図である。
【0033】
【
図4】本発明のさらに別の実施形態によるモデルトレーニングシステムの概略構造図である。
【0034】
【
図5】本発明の実施形態によるモデルトレーニング方法のフローチャートである。
【0035】
【
図6】本発明の実施形態によるモデルトレーニング方法の特定の実装のフローチャートである。
【0036】
【
図7】本発明の実施形態によるモデルトレーニング方法の別の特定の実装のフローチャートである。
【発明を実施するための形態】
【0037】
本発明の実施形態は、深層学習(Deep Learning)シナリオに適用して、深層学習モデルのトレーニングおよび深層学習モデルの適用を実施することができるモデルトレーニングシステムおよび方法、および記憶媒体を提供する。たとえば、推論はトレーニングされた深層学習モデルを使用して実行される。本発明の実施形態におけるモデルトレーニングシステムは、クラウドにおけるモデルトレーニングおよびモデル推論などの機能を完了することができる。
図1は、本発明の実施形態によるモデルトレーニングシステムの適用シナリオの概略図である。
図1に示すように、モデルトレーニングシステムは、クラウドサービスシステムで実行することができ、クラウドサービスシステムは、クラウドシステムと、外部アクセスインターフェイスを提供するシステムクラスタゲートウェイとを含むことができる。ユーザは、アカウントとパスワードを使用して、ネットワークとユーザ端末を介してクラウドシステムにアクセスすることができる。クラウドシステムは、複数の内部ネットワーク相互作用サーバを含む。モデルトレーニングシステムは、データモデルリポジトリを使用することにより、トレーニングデータおよびトレーニングモデルを格納および提供することができる。モデルトレーニングシステムは、深層学習データベースを使用してモデルトレーニングシステムとユーザ間のマンマシン相互作用を実装でき、認証サービスシステムを使用してユーザとモデルトレーニングシステムの様々な権利の認証を完了し、トレーニングと推論システムを使用して、モデルトレーニングと推論を完了する。
【0038】
図2は、本発明の実施形態によるモデルトレーニングシステムの概略構造図である。
図2に示すように、モデルトレーニングシステムは、クラウドデータストレージプラットフォーム11およびクラウドモデルトレーニングプラットフォーム12を含む。
【0039】
クラウドデータストレージプラットフォーム11は、トレーニングデータを格納し、トレーニングデータ呼び出し要求を受信し、トレーニングデータ呼び出し要求に基づいて、データ呼び出し命令に対応するトレーニングデータをクラウドモデルトレーニングプラットフォーム12にエクスポートするように構成される。
【0040】
トレーニングデータは、トレーニングモデルに必要なデータである。クラウドデータストレージプラットフォーム11は、複数のトレーニングデータを格納してもよい。トレーニングデータは、複数のデータを含むデータセットと考えることができる。トレーニングデータは、画像、ビデオ、音声などを含むことができ、本明細書では限定されない。クラウドデータストレージプラットフォーム11がトレーニングデータを格納するとき、データ識別子がトレーニングデータに割り当てられてもよく、データ識別子はトレーニングデータを識別するために使用され、データ格納場所を検索するための識別子として使用されてもよい。一例では、異なるトレーニングデータ間を区別するために、トレーニングデータは独自のデータ識別子を有する。言い換えれば、異なるトレーニングデータのデータ識別子は異なる。
【0041】
クラウドデータストレージプラットフォーム11は、データプロバイダによってアップロードされたトレーニングデータを受信することができる。たとえば、データプロバイダは、ハイパーテキスト転送プロトコル(HyperText Transfer Protocol、HTTP)を使用して顧客を通じてクラウドシステムのバックエンドにアクセスし、クラウドデータストレージプラットフォーム11と情報を交換できる。一例では、クラウドデータストレージプラットフォーム11は、トレーニングデータをアップロードするための標準プロトコルをデータプロバイダに提供することができ、標準プロトコルは、データ形式、圧縮フォーマット、データタイプなどを含むことができる。クラウドデータストレージプラットフォーム11は、データプロバイダによってアップロードされたトレーニングデータを検出することができ、データプロバイダによってアップロードされたトレーニングデータが標準プロトコルに準拠しないと判断した場合、クラウドデータストレージプラットフォーム11は、標準プロトコルに準拠しないトレーニングデータの格納を拒否する可能性がある。
【0042】
クラウドデータストレージプラットフォーム11にバックアップ領域を設定することができ、バックアップ領域は、たとえば、誤操作によりデータを復元できないようなデータ事故を回避するためにトレーニングデータをバックアップするために使用できる。
【0043】
トレーニングデータ呼び出し要求は、クラウドモデルトレーニングプラットフォーム12によって生成および送信され、クラウドモデルトレーニングプラットフォーム12が呼び出すことを要求するトレーニングデータは、トレーニングデータ呼び出し要求に基づいて学習され得る。一例では、トレーニングデータ呼び出し要求は、データ識別子を含み得る。クラウドデータストレージプラットフォーム11は、トレーニングデータ呼び出し要求を受信し、トレーニングデータ呼び出し要求が呼び出しを要求するトレーニングデータを検索し得、呼び出しが要求されたトレーニングデータをクラウドモデルトレーニングプラットフォーム12にエクスポートし得、その結果、クラウドモデルトレーニングプラットフォーム12は、エクスポートされたトレーニングデータを使用してモデルトレーニングを実行する。
【0044】
クラウドモデルトレーニングプラットフォーム12は、トレーニング対象のモデルを取得するためのモデルトレーニング作成命令を受信し、トレーニングデータ呼び出し要求を生成し、トレーニングデータ呼び出し要求をクラウドデータストレージプラットフォーム11に送信し、クラウドデータストレージプラットフォーム11からエクスポートされたトレーニングデータを使用してトレーニング対象のモデルをトレーニングし、トレーニング結果モデルを取得するように構成されている。
【0045】
クラウドモデルトレーニングプラットフォーム12は、ユーザまたはモデルプロバイダによってアップロードされたトレーニング対象のモデルを取得してもよく、またはクラウドシステム内のモデルデータベースからトレーニング対象のモデルを取得してもよい。
【0046】
一例では、ユーザは、ハイパーテキスト転送プロトコルを使用して、ユーザ端末20を介してクラウドシステムのバックエンドにアクセスし、クラウドモデルトレーニングプラットフォーム12と情報を交換することができる。ユーザは、ユーザ端末20を使用してモデルトレーニング作成要求をクラウドモデルトレーニングプラットフォーム12に送信して、クラウドモデルトレーニングプラットフォーム12をトリガしてモデルトレーニングタスクを作成することができる。クラウドモデルトレーニングプラットフォーム12は、トレーニング対象のモデルおよびトレーニングデータを使用することによってモデルトレーニングを実行することができる。例えば、モデルトレーニングは、トレーニングされたモデル、すなわちトレーニング結果モデルを取得するために、トレーニングデータが複数回の反復トレーニングのためにトレーニング対象のモデルにインポートされることを意味し得る。
【0047】
ユーザ、データプロバイダ、またはモデルプロバイダは、ユーザ端末20を使用してもよいことに留意すべきである。
【0048】
本発明のこの実施形態におけるクラウドデータストレージプラットフォーム11は、
図1のデータモデルリポジトリの一部と見なすことができる。本発明のこの実施形態におけるクラウドモデルトレーニングプラットフォーム12は、
図1のトレーニングおよび推論システムの一部と見なすことができる。
【0049】
本発明のこの実施形態では、クラウドデータストレージプラットフォーム11とクラウドモデルトレーニングプラットフォーム12は互いに独立しているため、トレーニングデータストレージとモデルトレーニングの2つの機能が分離されている。クラウドデータストレージプラットフォーム11およびクラウドモデルトレーニングプラットフォーム12は、いずれもクラウドシステムに基づいて実装されており、クラウドシステムにおいてモデルトレーニングプロセスが実行される。モデルトレーニングを実行するユーザは、トレーニングデータをローカルにダウンロードできない。そして、トレーニングデータは、クラウドデータストレージプラットフォーム11と、モデルトレーニングを実行しているクラウドモデルトレーニングプラットフォーム12に格納される。言い換えれば、ローカルユーザ側からトレーニングデータを漏洩させることができず、したがって、トレーニングデータが漏洩するリスクを低減できる。
【0050】
図3は、本発明の別の実施形態によるモデルトレーニングシステムの概略構造図である。
図3は、
図2のクラウドデータストレージプラットフォーム11は、
図3の
権限ゲートウェイ111をさらに含み、
図3に示すモデルトレーニングシステムは、データ検索プラットフォーム13、認証センタ14、データ監査システム15、クラウドモデルストレージプラットフォーム16、
イメージプラットフォーム17、およびモデル推論プラットフォーム18をさらに含み得る点において
図2と異なる。
【0051】
データ検索プラットフォーム13は、データプロバイダによって提供されるトレーニングデータに基づいてデータインデックステーブルを確立するように構成される。ユーザは、データ検索プラットフォーム13を使用することにより、クラウドデータストレージプラットフォーム11に格納されたトレーニングデータを検索および照会することができる。
【0052】
一例では、データプロバイダがトレーニングデータをアップロードした後、データ検索プラットフォーム13は、トレーニングデータを分析および処理して、データセットサイズ、データセットスケール、データ所有者情報、およびデータのアップロード日などのトレーニングデータの基本データ情報を取得することができる。これにより、ユーザはトレーニングデータの基本情報を知ることができる。
【0053】
一例では、クラウドデータストレージプラットフォーム11は、データプロバイダがトレーニングデータをアップロードするときに、データプロバイダにトレーニングデータのラベルを提供することをさらに要求し得る。トレーニングデータのラベルは、トレーニングデータの特徴を表すことができる。具体的には、トレーニングデータのラベルは、トレーニングデータによって表されるコンテンツのキーワードであってもよい。たとえば、データプロバイダがトレーニングデータをアップロードする場合、トレーニングデータ用にマークされたラベルは「ナンバープレート」と「コンパクトカー」である。データインデックステーブルを確立するプロセスにおいて、データ検索プラットフォーム13はさらに、トレーニングデータのラベルをデータインデックステーブルに追加して、ユーザがトレーニングデータを検索するときに検索のためにトレーニングデータの特徴を使用できるようにする。
【0054】
データ検索プラットフォーム13は、検索命令を受信し、検索命令に従ってデータインデックステーブル内でデータ検索を実行し、検索結果を生成するように構成される。具体的には、検索命令には1つ以上の検索キーワードが含まれ得、検索キーワードに基づいてデータインデックステーブルのトレーニングデータのラベルの検索を実行することができる。検索結果は、トレーニングデータの名前、番号、およびキーワード、ならびにトレーニングデータ内のいくつかのデータ例などの、検索命令内の検索キーワードに関連するトレーニングデータに関する情報を含み得る。一例では、検索結果は、検索キーワードとの関連性の度合いに基づいて連続配置されたトレーニングデータに関する情報を含み得、それにより、ユーザは、検索キーワードに最も関連するトレーニングデータをより直感的に得ることができる。別の例では、一定量のトレーニングデータに関する情報が、検索キーワードに基づいて検索されたトレーニングデータに関する情報からスクリーニングを通じてランダムに選択され、ユーザに提供されてもよい。例えば、各検索中に生成される検索結果には、10個のトレーニングデータに関する情報が含まれている。データ検索プラットフォーム13は、検索結果をユーザ端末20に送信し得、ユーザ端末20は、検索結果を表示し得る。
【0055】
検索結果を受信した後、ユーザは、ユーザ端末20を使用して、検索結果のデータ選択命令をさらに送信してもよい。データ検索プラットフォームは、検索結果に対するユーザ端末20のデータ選択命令を受信し、データ選択命令に従って認証センタ14への認証許可要求を開始する。データ選択命令は、モデルトレーニングに必要なトレーニングデータを決定するために、検索結果における1つ以上のトレーニングデータに関する情報を選択するように命令するために使用され得る。
【0056】
モデルトレーニングに必要なトレーニングデータが決定された後、認証許可要求は認証センタ14に対して開始され、認証許可要求はトレーニングデータのデータ識別子を含み得、認証センタ14からトレーニングデータの呼び出し許可が要求される。
【0057】
本発明のこの実施形態におけるデータ検索プラットフォーム13は、
図1の深層学習データベースの少なくとも一部と見なすことができる。
【0058】
認証センタ14は、認証許可要求を受信し、認証許可要求に基づいてデータ識別子のデータトークンを作成し、そのデータトークンを権限ゲートウェイ111およびユーザ端末20に配信するように構成される。
【0059】
認証許可要求は、トレーニングデータの呼び出し許可を要求するために使用される。認証センタ14は、データ検索プラットフォーム13によって送信された認証許可要求を承認するかどうかを決定することができる。例えば、認証許可要求は、トレーニングデータの支払い情報を含み得る。支払い情報が、ユーザがトレーニングデータの支払いに成功したことを示す場合、認証センタ14は、認証許可要求を承認し、データ識別子のデータトークンを作成することができる。認証許可要求を承認した後、認証センタ14は、データ認証情報をさらに生成および格納することができる。データ認証情報は、ユーザ識別子およびデータ識別子を含み得る。例えば、データ認証情報は有効期間を有し得る。すなわち、ユーザが有効期間内に同じトレーニングデータを再度要求する場合、認証センタ14は、監査なしで認証許可要求を直接承認し得る。有効期間は、動作シナリオおよび動作要件に基づいて設定することができ、本明細書では限定されない。例えば、有効期間は1年または永続的な場合があります。
【0060】
データトークンは、操作のトレーニングデータを識別することができ、データ呼び出しのセキュリティ証明書として使用される。例えば、データトークンは、後続のプロセスのデータ呼び出し操作でトレーニングデータを識別する。一例では、データトークンはセキュリティプラグインとして実装されてもよい。認証センタ14は、作成されたデータトークンをユーザ端末20に配信するため、ユーザ端末20は、データトークンを使用して、権限ゲートウェイ111を使用して、データトークンに対応するトレーニングデータをクラウドデータストレージプラットフォーム11からエクスポートすることができる。加えて、認証センタ14は、作成したデータトークンを認証センタ14にさらに格納する。
【0061】
クラウドモデルトレーニングプラットフォーム12は、権限ゲートウェイ111にトレーニングデータ呼び出し要求を送信するようにさらに構成され、トレーニングデータ呼び出し要求は、認証センタ14によってユーザ端末20に配信されたデータトークンを含む。
【0062】
例えば、トレーニングデータを要求するとき、ユーザ端末20はデータトークンをモデルトレーニング作成命令に追加することができる。クラウドモデルトレーニングプラットフォーム12は、モデルトレーニング作成命令を解析して、ユーザ端末20に配信されるデータトークンを取得し、ユーザ端末20に配信されるデータトークンをトレーニングデータ呼び出し要求に追加することができる。クラウドモデルトレーニングプラットフォーム12は、トレーニングデータ呼び出し要求内のデータトークンを使用することにより、クラウドデータストレージプラットフォーム11からデータトークンに対応するトレーニングデータを呼び出す。
【0063】
実装では、クラウドデータストレージプラットフォーム11は、第3者のパブリックサーバとして具体的に実装されてもよい。第3者のパブリックサーバは、データプロバイダ、モデルプロバイダ、およびユーザに属しておらず、トレーニングデータを格納し、トレーニングデータをエクスポートするための共通サーバである。トレーニングデータは、データトークンとデータ識別子間の対応関係を使用することにより、認証を通じて呼び出すことができる。
【0064】
権限ゲートウェイ111は、第1の対応関係を確立するように構成され、第1の対応関係は、データ識別子とデータトークンとの間の対応関係である。データ識別子はデータトークンと1対1の対応関係を有しており、データトークンは独自である。言い換えれば、異なるデータ識別子は異なるデータトークンに対応する。権限ゲートウェイ111は、トレーニングデータ呼び出し要求を受信するとき、トレーニングデータ呼び出し要求内のデータトークンに基づいて、ターゲットデータ識別子の第1の対応関係を検索し、ここで、ターゲットデータ識別子は、トレーニングデータ呼び出し要求のデータトークンに対応するデータ識別子であり、ターゲットデータ識別子に対応するトレーニングデータをクラウドモデルトレーニングプラットフォーム12にエクスポートする。
【0065】
クラウドデータストレージプラットフォーム11がトレーニングデータ呼び出し要求を受信した後、権限ゲートウェイ111は、トレーニングデータ呼び出し要求内のデータトークンを権限ゲートウェイ111に格納されたデータトークンと比較する。トレーニングデータ呼び出し要求のデータトークンが権限ゲートウェイ111に格納されたデータトークンと一致できる場合、トレーニングデータの呼び出しが許可され、トレーニングデータ呼び出し要求のデータトークンに対応するトレーニングデータがエクスポートされる。
【0066】
モデルトレーニングプロセスでデータのセキュリティを確保し、トレーニングデータの不正使用を回避するために、データトークンは実際の状況に基づいて更新される場合がある。権限ゲートウェイ111は、更新決定パラメータを取得し、更新決定パラメータが更新条件を満たすかどうかを決定するように構成され得る。権限ゲートウェイ111は、更新決定パラメータが更新条件を満たすと決定した場合、認証センタ14に更新要求を送信し、認証センタ14と同期してデータトークンを更新する。認証センタ14は、更新要求を受信し、更新要求に基づいてデータトークンを更新する。
【0067】
更新決定パラメータは、認証許可要求を拒否する回数、トレーニングデータを呼び出す回数、およびデータトークンの存在期間などの1または複数のパラメータを含むことができる。
【0068】
例えば、更新決定パラメータには、認証許可要求を拒否する回数が含まれる。権限ゲートウェイ111は、認証センタ14による認証許可要求を処理するプロセスを検出して、認証センタ14による認証許可要求の拒否回数を取得することができる。権限ゲートウェイ111は、認証センタ14による認証許可要求の拒否回数が更新条件の拒否回数更新閾値を超えたことを検出すると、更新要求を認証センタ14に送信する。
【0069】
拒否回数更新閾値は、動作シナリオおよび動作要件に基づいて設定されてもよく、本明細書では限定されない。認証センタ14は、元のデータトークンを削除し、新しいデータトークンを生成し、新しいデータトークンをユーザ端末および権限ゲートウェイ111に配信し、その結果、権限ゲートウェイ111が認証センタ14と同期してデータトークンを更新できる。認証センタ14と権限ゲートウェイ111でデータトークンが更新された場合、トレーニングデータ呼び出し要求の実行を停止する必要がある。認証センタ14と権限ゲートウェイ111のデータトークンの更新が完了した後、トレーニングデータ呼び出し要求が実行される。データトークンの更新が完了した後、トレーニングデータ呼び出し要求に依然として元のデータトークンが含まれている場合、トレーニングデータ呼び出し要求内の元のデータトークンは無効であり、トレーニングデータを呼び出すことはできない。
【0070】
別の例では、更新決定パラメータは、トレーニングデータを呼び出す回数を含む。権限ゲートウェイ111は、一定期間内にトレーニングデータを呼び出す回数を取得することができる。権限ゲートウェイ111は、一定期間内に同じトレーニングデータを呼び出した回数が更新条件の呼び出し回数更新閾値を超えていると判断した場合、更新要求を認証センタ14に送信する。トレーニングデータを数える期間および呼び出し回数更新閾値は、動作シナリオおよび動作要件に基づいて設定され得、本明細書では限定されない。
【0071】
別の例では、更新決定パラメータは、データトークンの存在期間を含む。権限ゲートウェイ111は、データトークンの更新サイクル期間を設定し、データトークンの存在期間を記録することができる。権限ゲートウェイ111は、データトークンの存在期間が更新サイクル期間に達したと決定した場合、認証センタ14に更新要求を送信する。データトークンの更新サイクル期間は、動作シナリオおよび動作要件に基づいて設定することができ、本明細書では限定されない。
【0072】
更新決定パラメータおよび更新条件は、上記の例に限定されないことに留意すべきである。権限ゲートウェイ111は、代替的にユーザから更新方針構成命令を受信し、更新方針構成命令に従って更新決定パラメータおよび更新条件を設定してもよい。
【0073】
クラウドモデルストレージプラットフォーム16は、トレーニング対象のモデルを提供し、トレーニング結果モデルを格納するように構成される。クラウドモデルストレージプラットフォーム16は、モデルプロバイダによってアップロードされたモデル、またはトレーニングを通じてクラウドモデルトレーニングプラットフォーム12によって取得されたトレーニング結果モデルを格納することができる。
【0074】
一例では、トレーニングを通じてトレーニング結果モデルを取得した後、クラウドモデルトレーニングプラットフォーム12は、トレーニング結果モデルを格納のためにクラウドモデルストレージプラットフォーム16に送信し得、クラウドモデルトレーニングプラットフォーム12でトレーニング結果モデルをトレーニングするために使用されるトレーニングデータとトレーニング対象のモデルを破棄し、さらに、クラウドモデルトレーニングプラットフォーム12のトレーニング結果モデルを破棄して、クラウドモデルトレーニングプラットフォーム12のトレーニングデータ、トレーニング対象のモデル、およびトレーニング結果モデルの漏洩を防ぐ。
【0075】
一例では、クラウドデータストレージプラットフォーム11の前に、データ監査システム15は、データプロバイダによってアップロードされたトレーニングデータを受信する。データ監査システム15は、データプロバイダによってアップロードされたトレーニングデータに対して有効性検証を実行し、有効性検証に失敗したトレーニングデータをクラウドデータストレージプラットフォーム11に格納することを拒否するように構成される。例えば、データプロバイダによってアップロードされたトレーニングデータがクラウドデータストレージプラットフォーム11に格納されているトレーニングデータと重複している場合、またはデータプロバイダによってアップロードされたデータのデータ形式がクラウドデータストレージプラットフォーム11の標準プロトコルに準拠しない場合、データ監査システム15は、データプロバイダによってアップロードされたトレーニングデータが無効である、すなわち、アップロードされたトレーニングデータが有効性検証に失敗したと決定する。データプロバイダによってアップロードされたトレーニングデータが有効であるとデータ監査システム15が決定した場合、データ検索プラットフォーム13を使用することにより、格納命令をクラウドデータストレージプラットフォーム11に送信することができ、その結果、クラウドデータストレージプラットフォーム11は、データプロバイダによってアップロードされたトレーニングデータを永続的に記憶する。
【0076】
なお、データプロバイダがアップロードしたトレーニングデータの有効性検証の実行の方法は、上記方法に限定されないことに留意すべきである。データ監査システム15は、モデルトレーニングシステムで使用されるトレーニングデータの実際の有効性を確保することができる。
【0077】
イメージプラットフォーム17は、モデル推論ランタイム環境を格納するように構成される。具体的には、モデル推論ランタイム環境は、トレーニング結果モデルに対応するシステム環境およびランタイムフレームワーク環境を含み得る。
【0078】
モデル推論プラットフォーム18は、推論要求を受信することができ、推論要求は、処理されるべきデータを含む。推論要求は、ユーザ端末20によって送信されてもよい。例えば、ユーザ端末20は、アプリケーションプログラミングインターフェース(Application Programming Interface, API)を介してモデル推論プラットフォーム18に推論要求を送信することができる。推論要求を受信した後、モデル推論プラットフォーム18はイメージプラットフォーム17からモデル推論ランタイム環境をロードし、クラウドモデルストレージプラットフォーム16からトレーニング結果モデルを呼び出し、モデル推論のために処理されるべきデータをトレーニング結果モデルにインポートする。
【0079】
本発明のこの実施形態におけるデータ検索プラットフォームは、
図1の深層学習データベースの少なくとも一部と見なすことができる。本発明のこの実施形態における認証センタ14は、
図1の認証サービスシステムの少なくとも一部と見なすことができる。本発明のこの実施形態におけるモデル推論プラットフォーム18は、
図1のトレーニングおよび推論システムの一部と見なすことができる。
【0080】
図4は、本発明のさらに別の実施形態によるモデルトレーニングシステムの概略構造図である。
図4に示すモデルトレーニングシステムは、クラウドデータストレージプラットフォーム11が、データプロバイダの少なくとも1つのプライベートサーバとして実装され得る点において、
図3に示すモデルトレーニングシステムとは異なる。
【0081】
クラウドデータストレージプラットフォーム11が権限ゲートウェイ111および少なくとも1つのデータストレージサーバ112、すなわちプライベートサーバを含む場合、トレーニングデータは、データトークンとデータルートとの間の対応関係を使用することにより、認証を通じて呼び出され得る。
【0082】
データルートには、トレーニングデータのユニフォームリソースロケータ(Uniform Resource Locator、URL)パスを含めることができ、さらに、データアクセスメソッドと、クラウドデータストレージプラットフォーム11からトレーニングデータをエクスポートするための標準を含めることができる。トレーニングデータをアップロードするとき、データプロバイダはさらに、トレーニングデータに対応するデータルートをデータ検索プラットフォーム13にアップロードすることができる。
【0083】
データ検索プラットフォーム13は、データルートの有効性をさらに検出することができる。データルートが無効であると決定された場合、データルートの格納は拒否される。例えば、データ検索プラットフォーム13は、データルートにアクセスできないと判断した場合、またはデータルートの形式がモデルトレーニングシステムの予め設定された標準に準拠しないと判断した場合、データルートの格納を拒否する。例えば、データ検索プラットフォーム13は、権限ゲートウェイ111および認証センタ14に拒否命令を送信することができ、その結果、権限ゲートウェイ111および認証センタ14の両方がルートデータの格納を拒否する。
【0084】
権限ゲートウェイ111は、第2の対応関係を確立することができ、第2の対応関係は、データトークンとデータルートとの間の対応関係である。例えば、第2の対応関係は、データルートテーブルとして実装されてもよい。トレーニングデータには対応するデータルートがあり、トレーニングデータはデータトークンと1対1の対応関係を有しており、データトークンもまたデータルートと1対1の対応関係を有している。データ検索プラットフォーム13がデータインデックステーブルを確立するとき、対応するデータルートは、権限ゲートウェイ111に格納され得る。
【0085】
トレーニングデータ呼び出し要求を受信した後、権限ゲートウェイ111は、トレーニングデータ呼び出し要求内のデータトークンに基づいて、ターゲットデータルートの第2の対応関係を検索する。ターゲットデータルートは、トレーニングデータ呼び出し要求のデータトークンに対応するデータルートである。権限ゲートウェイ111は、データトークンに対応するデータルートに基づいてターゲットデータストレージサーバ112にアクセスし、クラウドモデルトレーニングプラットフォーム12にターゲットデータストレージサーバ112内のターゲットデータルートによって示されるトレーニングデータをエクスポートすることができる。ターゲットデータストレージサーバ112は、ターゲットデータルートに対応するデータストレージサーバ112である。
【0086】
データストレージサーバ112、すなわちプライベートサーバのトレーニングデータのセキュリティを確保するために、安全な暗号化されたリモートアクセスが確立されてもよい。一例では、モデルトレーニングシステムは、アクセスルータをさらに含み得る。権限ゲートウェイ111は、ターゲットデータルートによって示されるトレーニングデータを、ターゲットデータストレージサーバ112からアクセスルータ内の予め設定された標準アクセスインターフェイスを介してエクスポートする。例えば、標準アクセスインターフェイスは平穏なアクセスインターフェイスであり、restfulアクセスインターフェイスのパスがデータルートとして使用されてもよい。
【0087】
一例では、データストレージサーバ112内のトレーニングデータのセキュリティをさらに確保するために、権限ゲートウェイ111は、ランダムにデータトークンを選択し、データトークンの有効性を検証することができる。権限ゲートウェイ111がデータトークンが無効であると決定した場合、権限ゲートウェイ111は、データルートテーブルを更新してもよく、すなわち第2の対応関係を更新してもよく、具体的には第2の対応関係のデータトークンを更新する。
【0088】
図5は、本発明の実施形態によるモデルトレーニング方法のフローチャートである。先述の実施形態のモデルトレーニングシステムにモデルトレーニング方法を適用することができる。
図5に示すように、モデルトレーニング方法は、ステップS201からステップS204を含み得る。
【0089】
ステップS201において、クラウドモデルトレーニングプラットフォームは、トレーニング対象のモデルを取得するためのモデルトレーニング作成命令を受信する。
【0090】
ステップS202において、クラウドモデルトレーニングプラットフォームは、トレーニングデータ呼び出し要求を生成し、トレーニングデータ呼び出し要求をクラウドデータストレージプラットフォームに送信して、クラウドデータストレージプラットフォームに格納されたトレーニングデータを呼び出す。
【0091】
ステップS203において、クラウドデータストレージプラットフォームは、トレーニングデータ呼び出し要求を受信し、トレーニングデータ呼び出し要求に対応するトレーニングデータをクラウドモデルトレーニングプラットフォームにエクスポートする。
【0092】
ステップS204において、クラウドモデルトレーニングプラットフォームは、クラウドデータストレージプラットフォームからエクスポートされたトレーニングデータを使用することにより、トレーニング対象のモデルをトレーニングして、トレーニング結果モデルを取得する。
【0093】
ステップS201からステップS204の説明については、先述の実施形態におけるクラウドモデルトレーニングプラットフォームおよびクラウドデータストレージプラットフォームの関連する説明を参照されたい。
【0094】
本発明のこの実施形態では、クラウドデータストレージプラットフォームとクラウドモデルトレーニングプラットフォームは互いに独立しているため、トレーニングデータストレージとモデルトレーニングの2つの機能が分離されている。クラウドデータストレージプラットフォームとクラウドモデルトレーニングプラットフォームはどちらもクラウドシステムに基づいて実装され、モデルトレーニングプロセスはクラウドシステムで実行される。モデルトレーニングを実行するユーザは、トレーニングデータをローカルにダウンロードできず、トレーニングデータは、クラウドデータストレージプラットフォームと、モデルトレーニングを実行しているクラウドモデルトレーニングプラットフォームに格納される。言い換えれば、ローカルユーザ側からトレーニングデータを漏洩させることができず、したがって、トレーニングデータが漏洩するリスクを低減できる。
【0095】
図6は、本発明の実施形態によるモデルトレーニング方法の具体的な実装方式のフローチャートである。
図6に示すように、モデルトレーニング方法は、ステップS301からステップS315を含み得る。
【0096】
ステップ301において、データ監査システムは、データプロバイダによってアップロードされたトレーニングデータに対して有効性検証を実行する。
【0097】
ステップ302において、データ監査システムは、有効性検証に失敗したトレーニングデータをクラウドデータストレージプラットフォームに格納することを拒否する。
【0098】
ステップ303において、データ検索プラットフォームは、データプロバイダによって提供されたトレーニングデータに基づいてデータインデックステーブルを確立する。
【0099】
ステップ304において、データ検索プラットフォームは検索命令を受信し、検索命令に従ってデータインデックステーブル内でデータ検索を実行し、検索結果を生成する。
【0100】
ステップ305において、データ検索プラットフォームは、ユーザ端末のデータ選択命令を受信し、データ選択命令に従って認証センタへの認証許可要求を開始する。
【0101】
認証許可要求は、トレーニングデータのデータ識別子を含む。
【0102】
ステップ306において、認証センタは認証許可要求を受信し、認証許可要求に基づいてデータ識別子のデータトークンを作成し、データトークンをクラウドデータストレージプラットフォーム内の権限ゲートウェイおよびユーザ端末に配信する。
【0103】
ステップ307において、クラウドデータストレージプラットフォームの権限ゲートウェイは、配信されたデータトークンに基づいて第1の対応関係を確立する。
【0104】
第1の対応関係は、データ識別子とデータトークンの間の対応関係である。
【0105】
ステップ308において、クラウドモデルトレーニングプラットフォームは、トレーニング対象のモデルを取得するためのモデルトレーニング作成命令を受信する。
【0106】
ステップ309において、クラウドモデルトレーニングプラットフォームは、トレーニングデータ呼び出し要求を生成し、トレーニングデータ呼び出し要求をクラウドデータストレージプラットフォーム内の権限ゲートウェイに送信して、クラウドデータストレージプラットフォームに格納されたトレーニングデータを呼び出す。
【0107】
トレーニングデータ呼び出し要求には、認証センタからユーザ端末に配信されるデータトークンが含まれる。
【0108】
ステップ310において、クラウドデータストレージプラットフォームの権限ゲートウェイは、トレーニングデータ呼び出し要求を受信し、トレーニングデータ呼び出し要求のデータトークンに基づいてターゲットデータ識別子の第1の対応関係を検索し、ターゲットデータ識別子に対応するトレーニングデータをクラウドモデルトレーニングプラットフォームにエクスポートする。
【0109】
ターゲットデータ識別子は、トレーニングデータ呼び出し要求のデータトークンに対応するデータ識別子である。
【0110】
ステップ311において、クラウドモデルトレーニングプラットフォームは、クラウドデータストレージプラットフォームからエクスポートされたトレーニングデータを使用することにより、トレーニング対象のモデルをトレーニングして、トレーニング結果モデルを取得する。
【0111】
ステップ312において、クラウドモデルストレージプラットフォームは、トレーニング結果モデルを格納する。
【0112】
ステップ313において、クラウドモデルトレーニングプラットフォームは、クラウドモデルトレーニングプラットフォームでトレーニング結果モデルをトレーニングするために使用されるトレーニングデータおよびトレーニング対象のモデルを破棄する。
【0113】
ステップ314において、モデル推論プラットフォームは推論要求を受信し、推論要求は処理されるべきデータを含む。
【0114】
ステップ315において、モデル推論プラットフォームは、ミラープラットフォームからモデル推論ランタイム環境をロードし、クラウドモデルストレージプラットフォームからトレーニング結果モデルを呼び出し、処理されるべきデータをモデル推論のためにトレーニング結果モデルにインポートする。
【0115】
図7は、本発明の実施形態によるモデルトレーニング方法の別の特定の実装のフローチャートである。
図7は以下の点において
図6と異なる。
図6のステップS307は、
図7のステップS316に置き換えられてもよく、
図6のステップS310は、
図7のステップS317およびステップS318に置き換えられてもよい。
【0116】
ステップS316において、クラウドデータストレージプラットフォームの権限ゲートウェイが、配信されたデータトークンに基づいて第2の対応関係を確立する。
【0117】
第2の対応関係は、データトークンとデータルート間の対応関係である。データルートには、トレーニングデータのユニフォームリソースロケーターパスが含まれる。
【0118】
ステップS317において、クラウドデータストレージプラットフォームの権限ゲートウェイは、トレーニングデータ呼び出し要求を受信し、トレーニングデータ呼び出し要求内のデータトークンに基づいて、ターゲットデータルートの第2の対応関係を検索する。
【0119】
ターゲットデータルートは、トレーニングデータ呼び出し要求のデータトークンに対応するデータルートである。
【0120】
ステップS318において、クラウドデータストレージプラットフォーム内の権限ゲートウェイは、ターゲットデータストレージサーバにアクセスして、ターゲットデータストレージサーバ内のターゲットデータルートによって示されるトレーニングデータをクラウドモデルトレーニングプラットフォームにエクスポートする。
【0121】
ターゲットデータストレージサーバは、ターゲットデータルートに対応するデータストレージサーバである。
【0122】
一例では、トレーニングデータのセキュリティを確保するために、具体的なシナリオに基づいてデータトークンをさらに更新することができる。権限ゲートウェイは、更新決定パラメータを取得し、更新決定パラメータが更新条件を満たすかどうかを決定する。権限ゲートウェイは、更新決定パラメータが更新条件を満たしていると決定した場合、認証センタに更新要求を送信する。認証センタは更新要求を受信し、更新要求に基づいてデータトークンを更新する。権限ゲートウェイは、認証センタと同期してデータトークンを更新する。
【0123】
例えば、更新決定パラメータは、認証許可要求を拒否する回数を含む。データトークンを更新するプロセスは、具体的には、権限ゲートウェイは、認証センタによる認証許可要求を処理するプロセスを検出し、認証センタによる認証許可要求を拒否した回数を取得し、そして、認証センタによる認証許可要求の拒否回数が、更新条件の拒否回数更新閾値を超えているか否かを判定し、そして、認証センタによる認証許可要求の拒否回数が更新条件の拒否回数更新閾値を超えたことを検出すると、更新要求を認証センタに送信する。
【0124】
例えば、更新決定パラメータは、トレーニングデータを呼び出す回数を含む。データトークンの更新プロセスを更新するプロセスは、具体的には以下の通りである。権限ゲートウェイは、一定期間内にトレーニングデータを呼び出す回数を取得し、そして、一定期間内に同じトレーニングデータを呼び出す回数が、更新条件の呼び出し回数更新閾値を超えるかどうかを判定し、そして、一定期間内に同じトレーニングデータを呼び出した回数が更新条件の呼び出し回数更新閾値を超えた場合、更新要求を認証センタに送信する。
【0125】
前述の方法の実施形態におけるステップの説明については、前述のシステムの実施形態における関連する説明を参照されたい。
【0126】
本発明の実施形態はさらに、記憶媒体を提供することができ、この記憶媒体はプログラムを記憶し、プログラムがプロセッサによって実行されると、前述の実施形態のモデルトレーニング方法が実施される。
[項目1]
クラウドデータストレージプラットフォームとクラウドモデルトレーニングプラットフォームとを備える、クラウドサービスを提供するモデルトレーニングシステムであって、
上記クラウドデータストレージプラットフォームは、トレーニングデータを格納するように構成され、上記トレーニングデータは、データプロバイダによって上記クラウドデータストレージプラットフォームにアップロードされ、
上記クラウドモデルトレーニングプラットフォームは、ユーザによって入力されるモデルトレーニング作成命令を受信し、上記モデルトレーニング作成命令に従ってトレーニング対象のモデルを取得し、上記クラウドデータストレージプラットフォームに格納された上記トレーニングデータを呼び出し、上記トレーニングデータを使用することによって、上記トレーニング対象のモデルをトレーニングし、トレーニング結果モデルを取得するように構成される、システム。
[項目2]
認証センタをさらに備え、
上記認証センタは、上記ユーザによって入力される認証許可要求を受信するように構成され、上記認証許可要求は、上記トレーニングデータの権限を決定するために使用される、項目1に記載のシステム。
[項目3]
上記クラウドデータストレージプラットフォームは、上記データプロバイダによって提供される上記トレーニングデータのラベルを受信するようにさらに構成され、上記トレーニングデータの上記ラベルは、上記トレーニングデータのコンテンツを表すために使用される、項目1または2に記載のシステム。
[項目4]
データ検索プラットフォームをさらに備え、上記データ検索プラットフォームは、上記トレーニングデータの情報を取得するように構成され、上記トレーニングデータの上記情報は、上記トレーニングデータのデータ所有者情報および上記トレーニングデータのデータアップロード日のいずれかまたは両方を含む、項目3に記載のシステム。
[項目5]
上記データ検索プラットフォームは、
上記トレーニングデータの上記ラベルおよび上記トレーニングデータの上記情報の少なくとも1つに基づいてデータインデックステーブルを確立し、
上記ユーザによって入力される、検索キーワードを含む検索命令を受信し、
上記検索命令に従って上記データインデックステーブル内でデータ検索を実行し、上記検索キーワードに対応する上記トレーニングデータの上記ラベルまたは上記検索キーワードに対応する上記トレーニングデータの上記情報を含む検索結果を生成する、
ようにさらに構成される、項目4に記載のシステム。
[項目6]
上記データ検索プラットフォームは、
上記検索結果を上記ユーザに表示するために、上記検索結果をユーザ端末に送信することと、
上記ユーザ端末によって送信された上記検索結果のデータ選択命令を受信することであって、上記データ選択命令は、上記データ検索プラットフォームに、上記検索結果から上記トレーニングデータを決定するように命令するために使用される、受信することと、
を行うようにさらに構成される、項目5に記載のシステム。
[項目7]
クラウドモデルストレージプラットフォームをさらに備え、上記クラウドモデルストレージプラットフォームは、上記トレーニング対象のモデルを格納するように構成され、上記トレーニング対象のモデルは、モデルプロバイダまたは上記ユーザによって上記クラウドモデルストレージプラットフォームにアップロードされる、または上記クラウドモデルストレージプラットフォームによってモデルデータベースから取得され、
上記クラウドモデルトレーニングプラットフォームは、上記モデルトレーニング作成命令に従って上記トレーニング対象のモデルを上記クラウドモデルストレージプラットフォームから取得するようにさらに構成される、項目1から6のいずれか1項に記載のシステム。
[項目8]
上記クラウドモデルトレーニングプラットフォームは、上記トレーニング結果モデルを取得した後、上記トレーニング結果モデルを上記クラウドモデルストレージプラットフォームに送信するように構成される、項目7に記載のシステム。
[項目9]
データ監査システムをさらに備え、上記データ監査システムは、上記データプロバイダによってアップロードされた上記トレーニングデータに対して有効性を決定するように構成される、項目1から8のいずれか1項に記載のシステム。
[項目10]
上記クラウドデータストレージプラットフォームは、第1のアクセスインターフェイスで構成され、上記第1のアクセスインターフェイスは、上記データプロバイダによってアップロードされた上記トレーニングデータを受信するために使用され、
上記クラウドデータストレージプラットフォームは、第2のアクセスインターフェイスで構成され、上記第2のアクセスインターフェイスは、上記ユーザによって入力される上記モデルトレーニング作成命令を受信するために使用される、
項目1から9のいずれか1項に記載のシステム。
[項目11]
モデル推論プラットフォームをさらに備え、上記モデル推論プラットフォームは、
上記ユーザによって入力される推論要求を受信することであって、上記推論要求は処理されるべきデータを含む、受信することと、
上記トレーニング結果モデルを呼び出し、上記処理されるべきデータをモデル推論のために上記トレーニング結果モデルにインポートすることと、
を行うように構成される、項目1から10のいずれか1項に記載のシステム。
[項目12]
上記トレーニングデータは、データルートで構成され、上記クラウドモデルトレーニングプラットフォームは、上記データルートに従って上記トレーニングデータを呼び出すようにさらに構成される、項目1から11のいずれか1項に記載のシステム。
[項目13]
上記データルートは、上記トレーニングデータのユニフォームリソースロケータ(URL)パスを含む、項目12に記載のシステム。
[項目14]
クラウドサービスを提供するモデルトレーニング方法であって、
クラウドデータストレージプラットフォームによって、トレーニングデータを格納する段階であって、上記トレーニングデータは、データプロバイダによって上記クラウドデータストレージプラットフォームにアップロードされる、段階と、
クラウドモデルトレーニングプラットフォームによって、ユーザによって入力されるモデルトレーニング作成命令を受信する段階と、
上記クラウドモデルトレーニングプラットフォームによって、上記モデルトレーニング作成命令に従ってトレーニング対象のモデルを取得する段階と、
上記クラウドモデルトレーニングプラットフォームによって、上記クラウドデータストレージプラットフォームに格納された上記トレーニングデータを呼び出す段階と、
上記クラウドモデルトレーニングプラットフォームによって、上記トレーニングデータを使用することによって上記トレーニング対象のモデルをトレーニングし、トレーニング結果モデルを取得する段階と、
を備え、
上記クラウドデータストレージプラットフォームおよび上記クラウドモデルトレーニングプラットフォームは、クラウドサービスを提供するモデルトレーニングシステムで実行される、方法。
[項目15]
認証センタによって、上記ユーザによって入力される認証許可要求を受信する段階であって、上記認証許可要求は、上記トレーニングデータの権限を決定するために使用される、段階をさらに備え、
上記認証センタは、クラウドサービスを提供する上記モデルトレーニングシステムで実行される、項目14に記載の方法。
[項目16]
上記クラウドデータストレージプラットフォームによって、上記データプロバイダによって提供される上記トレーニングデータのラベルを受信する段階であって、上記トレーニングデータの上記ラベルは、上記トレーニングデータのコンテンツを表すために使用される、段階をさらに備える、項目14または15に記載の方法。
[項目17]
データ検索プラットフォームによって、上記トレーニングデータの情報を取得する段階であって、上記トレーニングデータの上記情報は、上記トレーニングデータのデータ所有者情報および上記トレーニングデータのデータアップロード日のいずれかまたは両方を含む、段階をさらに備え、
上記データ検索プラットフォームは、クラウドサービスを提供する上記モデルトレーニングシステムで実行される、項目16に記載の方法。
[項目18]
上記データ検索プラットフォームによって、上記トレーニングデータの上記ラベルおよび上記トレーニングデータの上記情報の少なくとも1つに基づいてデータインデックステーブルを確立する段階と、
上記データ検索プラットフォームによって、上記ユーザによって入力される検索命令を受信する段階であって、上記検索命令は、検索キーワードを含む、段階と、
上記データ検索プラットフォームによって、上記検索命令に従って上記データインデックステーブル内でデータ検索を実行する段階と、
上記データ検索プラットフォームによって、検索結果を生成する段階であって、上記検索結果は、上記検索キーワードに対応する上記トレーニングデータの上記ラベルまたは上記検索キーワードに対応する上記トレーニングデータの上記情報を含む、段階と、
をさらに備える、項目17に記載の方法。
[項目19]
上記データ検索プラットフォームによって、上記検索結果を上記ユーザに表示するために、上記検索結果をユーザ端末に送信する段階と、
上記データ検索プラットフォームによって、上記ユーザ端末によって送信された上記検索結果のデータ選択命令を受信する段階であって、上記データ選択命令は、上記データ検索プラットフォームに、上記検索結果から上記トレーニングデータを決定するように命令するために使用される、段階と、
をさらに備える、項目18に記載の方法。
[項目20]
クラウドモデルストレージプラットフォームによって、上記トレーニング対象のモデルを格納する段階であって、上記トレーニング対象のモデルは、モデルプロバイダまたは上記ユーザによって上記クラウドモデルストレージプラットフォームにアップロードされる、または上記クラウドモデルストレージプラットフォームによってモデルデータベースから取得される、段階と、
上記クラウドモデルトレーニングプラットフォームによって、上記モデルトレーニング作成命令に従って上記トレーニング対象のモデルを上記クラウドモデルストレージプラットフォームから取得する段階と、
をさらに備え、
上記クラウドモデルストレージプラットフォームは、クラウドサービスを提供する上記モデルトレーニングシステムで実行される、項目14から19のいずれか1項に記載の方法。
[項目21]
上記クラウドモデルトレーニングプラットフォームによって、上記トレーニング結果モデルを取得した後、上記トレーニング結果モデルを上記クラウドモデルストレージプラットフォームに送信する段階をさらに備える、項目20に記載の方法。
[項目22]
データ監査システムによって、上記データプロバイダによってアップロードされた上記トレーニングデータに対して有効性を決定する段階をさらに備え、
上記データ監査システムは、クラウドサービスを提供する上記モデルトレーニングシステムで実行される、項目14から21のいずれか1項に記載の方法。
[項目23]
上記クラウドデータストレージプラットフォームは、第1のアクセスインターフェイスで構成され、上記第1のアクセスインターフェイスは、上記データプロバイダによってアップロードされた上記トレーニングデータを受信するために使用され、
上記クラウドデータストレージプラットフォームは、第2のアクセスインターフェイスで構成され、上記第2のアクセスインターフェイスは、上記ユーザによって入力される上記モデルトレーニング作成命令を受信するために使用される、
項目14から22のいずれか1項に記載の方法。
[項目24]
モデル推論プラットフォームによって、上記ユーザによって入力される推論要求を受信する段階であって、上記推論要求は処理されるべきデータを含む、段階と、
上記モデル推論プラットフォームによって、上記トレーニング結果モデルを呼び出す段階と、
上記モデル推論プラットフォームによって、上記処理されるべきデータをモデル推論のために上記トレーニング結果モデルにインポートする段階と、
をさらに備え、
上記モデル推論プラットフォームは、クラウドサービスを提供する上記モデルトレーニングシステムで実行される、項目14から23のいずれか1項に記載の方法。
[項目25]
上記トレーニングデータは、データルートで構成され、
上記クラウドモデルトレーニングプラットフォームによって、上記クラウドデータストレージプラットフォームに格納された上記トレーニングデータを呼び出す上記段階は、上記クラウドモデルトレーニングプラットフォームによって、上記データルートに従って上記トレーニングデータを呼び出す段階を含む、項目14から24のいずれか1項に記載の方法。
[項目26]
上記データルートは、上記トレーニングデータのユニフォームリソースロケータ(URL)パスを含む、項目25に記載の方法。