(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-29
(45)【発行日】2024-08-06
(54)【発明の名称】データラベリングシステムおよび方法、ならびにデータラベリングマネージャ
(51)【国際特許分類】
G06F 9/50 20060101AFI20240730BHJP
【FI】
G06F9/50 120A
(21)【出願番号】P 2022566434
(86)(22)【出願日】2020-04-30
(86)【国際出願番号】 CN2020088395
(87)【国際公開番号】W WO2021217610
(87)【国際公開日】2021-11-04
【審査請求日】2023-01-19
(73)【特許権者】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian, Longgang District, Shenzhen, Guangdong 518129, P.R. China
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133569
【氏名又は名称】野村 進
(72)【発明者】
【氏名】▲劉▼ 新春
(72)【発明者】
【氏名】王 健
【審査官】三坂 敏夫
(56)【参考文献】
【文献】特表2017-524183(JP,A)
【文献】米国特許出願公開第2017/0308810(US,A1)
【文献】米国特許出願公開第2018/0114098(US,A1)
【文献】Amazon Machine Learning デベロッパーガイド,[online],Version Latest,Amazon,2016年08月02日,P69-70,P99-P104,[令和5年11月16日検索], インターネット<URL:https://docs.aws.amazon.com/ja_jp/machine-learning/latest/dg/machinelearning-dg.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 9/455-9/54
G06N 3/00 -99/00
(57)【特許請求の範囲】
【請求項1】
データラベリングマネージャ、ラベリングモデルストレージリポジトリ、および基本計算ユニットストレージリポジトリを含むデータラベリングシステムであって、
前記データラベリングマネージャは、クライアントから、第1のラベリングモデルの第1のモデル識別子を含むデータラベリング要求を受信し、前記基本計算ユニットストレージリポジトリから、前記第1のラベリングモデルに対応するターゲットモデル推論フレームワークを含む、ターゲット基本計算ユニットを取得し、前記ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを確立し、モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、前記第1のモデル識別子に対応する第1のストレージパス情報を取得し、前記第1のストレージパス情報は、前記第1のラベリングモデルの第1の基本パラメータデータのストレージパスを指示し、前記第1の基本パラメータデータは、前記第1のラベリングモデルにおける訓練可能なパラメータが訓練された後に取得された値を含む、ように構成され、
前記ターゲット計算ユニットは、前記第1のストレージパス情報に基づき、前記ラベリングモデルストレージリポジトリから、前記第1のラベリングモデルの前記第1の基本パラメータデータを取得し、前記ターゲットモデル推論フレームワークおよび前記第1の基本パラメータデータに基づき、前記第1のラベリングモデルを取得し、ラベリングされるべきデータを取得し、前記ラベリングされるべきデータを前記第1のラベリングモデルに入力して、前記ラベリングされるべきデータにラベリングするように構成される、
データラベリングシステム。
【請求項2】
前記データラベリング要求はハードウェアリソース割当て情報をさらに含み、前記データラベリングマネージャは、
前記ハードウェアリソース割当て情報に基づき、前記ターゲット基本計算ユニットに前記ハードウェアリソースを割り当てるように構成される、
請求項1に記載のデータラベリングシステム。
【請求項3】
前記データラベリングマネージャは、
前記クライアントから前記第1のモデル識別子および前記第1の基本パラメータデータを受信し、
前記第1の基本パラメータデータを前記ラベリングモデルストレージリポジトリに記憶し、
前記第1のモデル識別子および前記第1のストレージパス情報を対応させて記憶するようにさらに構成される、
請求項1または2に記載のデータラベリングシステム。
【請求項4】
前記データラベリング要求は、前記ラベリングされるべきデータの第1のデータ識別子をさらに含み、前記データラベリングマネージャは、
データ識別子とデータのストレージパス情報との間の記憶された対応関係から、前記ラベリングされるべきデータの前記第1のデータ識別子に対応する第2のストレージパス情報を取得するようにさらに構成され、
前記ターゲット計算ユニットは、
前記第2のストレージパス情報に基づき、前記ラベリングされるべきデータを取得するように構成される、
請求項1から3のいずれか一項に記載のデータラベリングシステム。
【請求項5】
前記データラベリング要求は、前記ターゲットモデル推論フレームワークのフレームワーク識別子をさらに含み、前記データラベリングマネージャは、
前記ターゲットモデル推論フレームワークの前記フレームワーク識別子に基づき、前記基本計算ユニットストレージリポジトリから、前記ターゲットモデル推論フレームワークを含む前記ターゲット基本計算ユニットを取得するように構成される、
請求項1から4のいずれか一項に記載のデータラベリングシステム。
【請求項6】
前記データラベリングマネージャは、
モデル識別子と基本計算ユニットとの間の記憶された対応関係に基づき、前記第1のモデル識別子に対応する前記ターゲット基本計算ユニットを取得するように構成される、
請求項1から5のいずれか一項に記載のデータラベリングシステム。
【請求項7】
前記データラベリングマネージャは、
前記ターゲット計算ユニットが、前記第1のラベリングモデルを使用することによって、前記ラベリングされるべきデータにラベリングするプロセスにおいて、前記クライアントから、ラベリングモデル置換要求を受信し、前記ラベリングモデル置換要求は、第2のラベリングモデルの第2のモデル識別子を含み、
モデル識別子と基本パラメータデータのストレージパス情報との間の前記記憶された対応関係から、前記第2のモデル識別子に対応する第3のストレージパス情報を取得するようにさらに構成され、前記第3のストレージパス情報は、前記第2のラベリングモデルの第2の基本パラメータデータのストレージパスを指示し、
前記ターゲット計算ユニットは、前記第3のストレージパス情報に基づき、前記第2のラベリングモデルの前記第2の基本パラメータデータを取得し、前記第1の基本パラメータデータを前記ターゲットモデル推論フレームワークの中にある前記第2の基本パラメータデータで置換して、前記第2のラベリングモデルを取得し、前記第2のラベリングモデルに、前記ラベリングされるべきデータの中のラベリングされていないデータを入力して、前記ラベリングされていないデータにラベリングするように構成される、
請求項1から6のいずれか一項に記載のデータラベリングシステム。
【請求項8】
クライアントから、第1のラベリングモデルの第1のモデル識別子を含むデータラベリング要求を受信するステップと、
前記第1のラベリングモデルに対応するターゲットモデル推論フレームワークを取得するステップと、
モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、前記第1のモデル識別子に対応する第1のストレージパス情報を取得するステップであって、前記第1のストレージパス情報は、前記第1のラベリングモデルの第1の基本パラメータデータのストレージパスを指示し、前記第1の基本パラメータデータは、前記第1のラベリングモデルにおける訓練可能なパラメータが訓練された後に取得された値を含む、第1のストレージパス情報を取得するステップと、
ラベリングされるべきデータのラベリングのためのユニットに前記第1のストレージパス情報を与えるステップと、
を含む、データラベリング方法であって、
前記第1の基本パラメータデータおよび前記ターゲットモデル推論フレームワークは、ラベリングされるべきデータにラベリングするための前記第1のラベリングモデルを形成するように使用される、
データラベリング方法。
【請求項9】
前記第1の基本パラメータデータはラベリングモデルストレージリポジトリに記憶され、ターゲットモデル推論フレームワークは基本計算ユニットストレージリポジトリに記憶される、請求項8に記載の方法。
【請求項10】
前記ターゲットモデル推論フレームワークを取得する前記ステップは、
前記基本計算ユニットストレージリポジトリからターゲット基本計算ユニットを取得するステップを含み、前記ターゲット基本計算ユニットは前記ターゲットモデル推論フレームワークを含む、請求項9に記載の方法。
【請求項11】
前記データラベリング要求は、前記ターゲットモデル推論フレームワークのフレームワーク識別子をさらに含み、前記基本計算ユニットストレージリポジトリからターゲット基本計算ユニットを取得する前記ステップは、
前記ターゲットモデル推論フレームワークの前記フレームワーク識別子に基づき、前記ターゲットモデル推論フレームワークを含む前記ターゲット基本計算ユニットを取得するステップを含む、
請求項10に記載の方法。
【請求項12】
前記基本計算ユニットストレージリポジトリからターゲット基本計算ユニットを取得する前記ステップは、
モデル識別子と基本計算ユニットとの間の記憶された対応関係に基づき、前記第1のモデル識別子に対応する前記ターゲット基本計算ユニットを取得するステップを含む、
請求項10に記載の方法。
【請求項13】
前記ターゲットモデル推論フレームワークを含むターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを確立するステップと、
前記ターゲット計算ユニットに前記第1のストレージパス情報を送信し、それにより、前記ターゲット計算ユニットは、前記第1のストレージパス情報に基づき前記第1の基本パラメータデータを取得し、前記ターゲットモデル推論フレームワークおよび前記第1の基本パラメータデータに基づき前記第1のラベリングモデルを取得する、前記第1のストレージパス情報を送信する、ステップと、
をさらに含む、請求項8から12のいずれか一項に記載の方法。
【請求項14】
前記クライアントから前記第1のモデル識別子および前記第1の基本パラメータデータを受信するステップと、
前記第1の基本パラメータデータをラベリングモデルストレージリポジトリに記憶するステップと、
前記第1のモデル識別子および前記第1のストレージパス情報を対応させて記憶するステップと、
をさらに含む、請求項8から13のいずれか一項に記載の方法。
【請求項15】
前記データラベリング要求は前記ラベリングされるべきデータの第1のデータ識別子をさらに含み、前記方法は、
データ識別子とデータのストレージパス情報との間の記憶された対応関係から、前記ラベリングされるべきデータの前記第1のデータ識別子に対応する第2のストレージパス情報を取得するステップと、
前記第2のストレージパス情報を送信し、それにより、前記第2のストレージパス情報を使用することによって前記ラベリングされるべきデータを取得するステップと、
をさらに含む、請求項8から14のいずれか一項に記載の方法。
【請求項16】
前記クライアントから、第2のラベリングモデルの第2のモデル識別子を含むラベリングモデル置換要求を受信するステップと、
モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、前記第2のモデル識別子に対応する第3のストレージパス情報を取得するステップであって、前記第3のストレージパス情報は、前記第2のラベリングモデルの第2の基本パラメータデータのストレージパスを指示するステップと、
前記第3のストレージパス情報を含むモデル置換命令を送信するステップであって、前記第3のストレージパス情報は、前記ターゲットモデル推論フレームワークの前記第1の基本パラメータデータを置換する前記第2のラベリングモデルの第2の基本パラメータデータを取得して前記第2のラベリングモデルを取得するために使用される、モデル置換命令を送信するステップと、
をさらに含む、請求項8から15のいずれか一項に記載の方法。
【請求項17】
データラベリング装置であって、
請求項8から16のいずれか一項に記載のデータラベリング方法を行うように構成される、
データラベリング装置。
【請求項18】
プロセッサと、少なくとも1つの命令を記憶するメモリとを含む、データラベリングマネージャであって、請求項8から16のいずれか一項に記載のデータラベリング方法を使用することによって行われる動作を実施するために、前記プロセッサによって前記命令がロードして実行される、データラベリングマネージャ。
【請求項19】
少なくとも1つの命令を記憶しているコンピュータ可読記憶媒体であって、プロセッサが、前記命令をロードして実行することにより、請求項8から16のいずれか一項に記載のデータラベリング方法を使用することによって行われる動作を実施する、コンピュータ可読記憶媒体。
【請求項20】
少なくとも1つの命令を含むコンピュータプログラムであって、請求項8から16のいずれか一項に記載のデータラベリング方法において行われる動作を実施するために、プロセッサによって、前記少なくとも1つの命令がロードして実行される、コンピュータプログラム。
【請求項21】
クライアントによって実行されるデータラベリング方法であって、
データラベリングシステムに、ラベリングされるべきデータを送信するステップと、
データラベリングシステムに、データラベリング要求を送信するステップであって、前記データラベリング要求は、前記ラベリングされるべきデータにラベリングするための第1のラベリングモデルの第1のモデル識別子を含み、前記第1のラベリングモデルは、第1の基本パラメータデータおよびターゲットモデル推論フレームワークを含
み、
前記データラベリング要求はさらに、前記ターゲットモデル推論フレームワークのフレームワーク識別子を運ぶ、データラベリング要求を送信するステップと、
前記データラベリングシステムから、前記ラベリングされるべきデータのラベリング結果データを受信するステップと、
を含む方法。
【請求項22】
クライアントによって実行されるデータラベリング方法であって、
データラベリングシステムに、ラベリングされるべきデータを送信するステップと、
データラベリングシステムに、データラベリング要求を送信するステップであって、前記データラベリング要求は、前記ラベリングされるべきデータにラベリングするための第1のラベリングモデルの第1のモデル識別子を含み、前記第1のラベリングモデルは、第1の基本パラメータデータおよびターゲットモデル推論フレームワークを含む、データラベリング要求を送信するステップと、
前記データラベリングシステムにラベリングモデル置換要求を送信するステップであって、前記ラベリングモデル置換要求は第2のラベリングモデルの第2のモデル識別子を運び、前記第2のラベリングモデルと前記第1のラベリングモデルとの両方が前記ターゲットモデル推論フレームワークに対応する、ステップと、
前記データラベリングシステムから、前記ラベリングされるべきデータのラベリング結果データを受信するステップと、
を含む方法。
【請求項23】
クライアントによって実行されるデータラベリング方法であって、
データラベリングシステムに、第1のラベリングモデルの第1の基本パラメータデータをアップロードするステップであって、前記第1の基本パラメータデータは、前記第1のラベリングモデルにおける訓練可能なパラメータが訓練された後に取得された値を含む、ステップと、
前記データラベリングシステムに、ラベリングされるべきデータを送信するステップと、
前記データラベリングシステムに、データラベリング要求を送信するステップであって、前記データラベリング要求は、前記ラベリングされるべきデータにラベリングするための前記第1のラベリングモデルの第1のモデル識別子を含み、前記第1のラベリングモデルは、前記第1の基本パラメータデータおよびターゲットモデル推論フレームワークを含む、データラベリング要求を送信するステップと、
前記データラベリングシステムから、前記ラベリングされるべきデータのラベリング結果データを受信するステップと、
を含む方法。
【請求項24】
クライアントによって実行されるデータラベリング方法であって、
前記クライアント上にラベリングモデルをアップロードするオプションを表示するステップと、
前記ラベリングモデルをアップロードするオプションを使用することによってデータラベリングシステムに、第1のラベリングモデルの第1の基本パラメータデータを送信するステップであって、前記第1の基本パラメータデータは、前記第1のラベリングモデルにおける訓練可能なパラメータが訓練された後に取得された値を含む、ステップと、
データラベリングシステムに、ラベリングされるべきデータを送信するステップと、
データラベリングシステムに、データラベリング要求を送信するステップであって、前記データラベリング要求は、前記ラベリングされるべきデータにラベリングするための第1のラベリングモデルの第1のモデル識別子を含み、前記第1のラベリングモデルは、第1の基本パラメータデータおよびターゲットモデル推論フレームワークを含む、データラベリング要求を送信するステップと、
前記データラベリングシステムから、前記ラベリングされるべきデータのラベリング結果データを受信するステップと、
を含む方法。
【請求項25】
前記データラベリング要求はハードウェアリソース割当て情報をさらに含み、前記方法は、
実際の要求に基づきユーザによって入力された必要なハードウェアリソース割当て情報に基づき前記ハードウェアリソース割当て情報を取得するステップをさらに含む、
請求項21
から24のいずれか一項に記載の方法。
【請求項26】
前記データラベリングシステムに、前記第1のラベリングモデルの前記第1の基本パラメータデータを送信するステップをさらに含む、請求項21
、22
、及び請求項21または22に従属する請求項25のいずれか一項に記載の方法。
【請求項27】
アップロードする前記ステップは、
前記データラベリングシステムに、前記第1のラベリングモデルの前記第1のモデル識別子および前記第1のラベリングモデルの前記第1の基本パラメータデータをアップロードするステップを含む、請求項23または請求項23に従属する請求項25に記載の方法。
【請求項28】
前記クライアント上にラベリングモデルをアップロードするオプションを表示するステップと、
ラベリングモデルをアップロードするオプションを使用することによって前記第1の基本パラメータデータを取得するステップであって、前記第1の基本パラメータデータは、ラベリングモデルをアップロードするオプションを使用するユーザによってアップロードされ、前記第1の基本パラメータデータは、前記第1のラベリングモデルにおける訓練可能なパラメータが訓練された後に取得された値を含む、前記第1の基本パラメータデータを取得するステップ、
をさらに含む、請求項2
6に記載の方法。
【請求項29】
前記クライアント上にラベリングモデルをアップロードするオプションを表示するステップであって、前記第1の基本パラメータデータは、前記ラベリングモデルをアップロードするオプションを使用するユーザによってアップロードされる、ステップ、
をさらに含む、請求項23に記載の方法。
【請求項30】
ラベリングモデルをアップロードするオプションを使用することによって前記第1の基本パラメータデータを取得するステップであって、前記第1の基本パラメータデータは、ラベリングモデルをアップロードするオプションを使用するユーザによってアップロードされる、前記第1の基本パラメータデータを取得するステップ、
をさらに含む、請求項24または請求項24に従属する請求項25に記載の方法。
【請求項31】
前記データラベリング要求はさらに、前記ターゲットモデル推論フレームワーク
のフレームワーク識別子を運ぶ、請求項2
2から24
、27、29、および30のいずれか一項、請求項22から24のいずれか一項に従属する請求項25、請求項22に従属する請求項26、および請求項22に従属する請求項28のいずれか一項に記載の方法。
【請求項32】
前記クライアント上にモデル推論フレームワーク選択インターフェースを表示するステップと、
前記モデル推論フレームワーク選択インターフェースを使用することによって前記ターゲットモデル推論フレームワークを取得するステップであって、前記ターゲットモデル推論フレームワークは、ユーザによって、前記モデル推論フレームワーク選択インターフェース上で選択される、前記ターゲットモデル推論フレームワークを取得するステップと、
をさらに含む、請求項
21、25、26、28、および31のいずれか一項に記載の方法。
【請求項33】
データラベリング要求を送信する前記ステップは、前記ターゲットモデル推論フレームワークを選択した後に、前記クライアント上でラベリング開始オプションを選択することによってトリガされる、請求項
32に記載の方法。
【請求項34】
前記データラベリング要求は前記ラベリングされるべきデータのデータ識別子をさらに含む、請求項21から
32のいずれか一項に記載の方法。
【請求項35】
前記データラベリングシステムにラベリングモデル置換要求を送信するステップをさらに含む方法であって、前記ラベリングモデル置換要求は第2のラベリングモデルの第2のモデル識別子を運び、前記第2のラベリングモデルと前記第1のラベリングモデルとの両方が前記ターゲットモデル推論フレームワークに対応する、
請求項21、23、24、または少なくとも請求項22に従属しない請求項2
5から
34のいずれか一項に記載の方法。
【請求項36】
請求項21から
34のいずれか一項に記載のデータラベリング方法を行うように構成された
クライアント。
【請求項37】
少なくとも1つの命令を記憶しているコンピュータ可読記憶媒体であって、請求項21から
35のいずれか一項に記載のデータラベリング方法を使用することによって行われる動作を実施するために、プロセッサによって前記命令がロードして実行される、コンピュータ可読記憶媒体。
【請求項38】
少なくとも1つの命令を含むコンピュータプログラムであって、請求項21から
35のいずれか一項に記載のデータラベリング方法において行われる動作を実施するために、プロセッサによって、前記少なくとも1つの命令がロードして実行される、コンピュータプログラム。
【請求項39】
ターゲット計算ユニットによって実行されるデータラベリング方法であって、
第1のラベリングモデルに対応する第1のストレージパス情報を受信するステップであって、前記第1のストレージパス情報が、前記第1のラベリングモデルの第1の基本パラメータデータのストレージパスを指示し、前記第1の基本パラメータデータは、前記第1のラベリングモデルにおける訓練可能なパラメータが訓練された後に取得された値を含む、第1のストレージパス情報を受信するステップと、
前記第1のラベリングモデルの第1の基本パラメータデータおよびターゲットモデル推論フレームワークを取得するステップと、
前記第1のラベリングモデルの前記第1の基本パラメータデータと前記ターゲットモデル推論フレームワークとを組み合わせことによって前記第1のラベリングモデルを取得するステップと、
ラベリングされるべきデータを取得して、前記第1のラベリングモデルに前記ラベリングされるべきデータを入力するステップと、
前記ラベリングされるべきデータにラベリングするステップと、
を含む、データラベリング方法。
【請求項40】
第1のラベリングモデルに対応する第1のストレージパス情報を受信するための手段であって、前記第1のストレージパス情報は、前記第1のラベリングモデルの第1の基本パラメータデータのストレージパスを指示し、前記第1の基本パラメータデータは、前記第1のラベリングモデルにおける訓練可能なパラメータが訓練された後に取得された値を含む、手段と、
前記第1のラベリングモデルの第1の基本パラメータデータおよびターゲットモデル推論フレームワークを取得するための手段と、
前記第1のラベリングモデルの前記第1の基本パラメータデータと前記ターゲットモデル推論フレームワークとを組み合わせることによって前記第1のラベリングモデルを取得するための手段と、
ラベリングされるべきデータを取得して、前記第1のラベリングモデルに前記ラベリングされるべきデータを入力するための手段と、
前記ラベリングされるべきデータにラベリングするための手段と、
を含む、データラベリング装置。
【請求項41】
請求項3
9に記載のデータラベリング方法を
行うように構成されたターゲット計算ユニット。
【請求項42】
少なくとも1つの命令を記憶しているコンピュータ可読記憶媒体であって、請求項3
9に記載のデータラベリング方法を使用することによって行われる動作を実施するために、プロセッサによって前記命令がロードして実行される、コンピュータ可読記憶媒体。
【請求項43】
少なくとも1つの命令を含むコンピュータプログラムであって、請求項3
9に記載のデータラベリング方法において実行される動作を実施するために、プロセッサによって、前記少なくとも1つの命令がロードして実行される、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、機械学習技術の分野に関し、詳細にはデータラベリングシステムおよび方法、ならびにデータラベリングマネージャに関する。
【背景技術】
【0002】
機械学習モデルは、モデルの確立およびモデルの訓練が行われた後のみ使用され得る。モデルの訓練中、通常、大量のサンプルデータを収集する必要があり、サンプルデータはラベリングされ、各サンプルデータおよび対応するラベリング結果は、確立されたモデルを訓練するための一群の訓練サンプルとして使用される。サンプルラベリングはモデルの訓練において必要であることが分かる。
【0003】
現在、ラベリングを必要とするユーザは、ラベリングされる必要のあるデータをデータラベリングシステムにアップロードしてもよく、次いで、データラベリングシステムは、統合されたラベリングモデルを使用することによって、ユーザがアップロードしたデータにラベリングし得る。データラベリングシステムにおけるラベリングモデルのために、当業者は、通常、訓練後得られたラベリングモデルを、ハードコーディングによって、データラベリングシステムに統合する。
【0004】
本出願を実施するプロセスにおいて、本発明者らには、従来技術には少なくとも以下の問題があることを見出している。
【0005】
現在のラベリングモデルは、当業者によるハードコーディングによってのみデータラベリングシステムに統合され得、サンプルデータは、ユーザのラベリングモデルを使用することによってラベリングされることはできない。現在のデータラベリングシステムでは、ユーザは、サンプルデータにベリングするためにユーザのラベリングモデルを使用することはできない。現在のデータラベリングシステムは、柔軟性が比較的劣り、当業者によって統合されたラベリングモデルのみが使用されることができることが分かる。
【発明の概要】
【課題を解決するための手段】
【0006】
本出願の実施形態は、データラベリングシステムの柔軟性が劣り、当業者によって統合されたラベリングモデルのみが使用されることができるという関連技術における課題を解決するために、データラベリングシステムおよび方法、ならびにデータラベリングマネージャを提供するものである。技術的解決策は以下の通りである。
【0007】
第1の態様によれば、データラベリングシステムが提供される。データラベリングシステムは、データラベリングマネージャ、ラベリングモデルストレージリポジトリ、および基本計算ユニットストレージリポジトリを含む。
【0008】
データラベリングマネージャは、クライアントによって送信された、第1のラベリングモデルのモデル識別子とハードウェアリソース割当て情報とを運ぶデータラベリング要求を受信し、基本計算ユニットストレージリポジトリから、第1のラベリングモデルに対応するターゲットモデル推論フレームワークおよびハードウェアドライバ呼出しツールを含む、ターゲット基本計算ユニットを取得し、ハードウェアリソース割当て情報に基づき、ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを確立し、モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第1のラベリングモデルのモデル識別子に対応する基本パラメータデータの第1のストレージパス情報を取得して、ターゲット計算ユニットに第1のストレージパス情報を送信するように構成される。
【0009】
ターゲット計算ユニットは、第1のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから、使用されるべきラベリングモデルの基本パラメータデータを取得し、第1のラベリングモデルの基本パラメータデータは、第1のラベリングモデルの訓練可能なパラメータが訓練された後に取得された値を含み、ターゲットモデル推論フレームワークと第1のラベリングモデルの基本パラメータデータとを組み合わせて第1のラベリングモデルを取得し、ラベリングされるべきデータを取得し、ラベリングされるべきデータを第1のラベリングモデルに入力して、ラベリングされるべきデータにラベリングするように構成される。
【0010】
本出願の実施形態において示される解決策では、データラベリングシステムは単一のサーバ上で実施され得る。たとえば、データラベリングマネージャは単一のサーバ上の機能モジュールであり、ラベリングモデルストレージリポジトリおよび基本計算ユニットストレージリポジトリは単一のサーバ上の記憶領域である。もちろん、データラベリングシステムは、あるいは、サーバクラスタでよく、データラベリングマネージャ、ラベリングモデルストレージリポジトリ、および基本計算ユニットストレージリポジトリは、サーバクラスタの別々のサーバに別個に配備されてよい。
【0011】
基本計算ユニットは、モデル推論フレームワーク、ハードウェアドライバ呼出しツール、および言語の実行をサポートする環境ファイルを含むプログラムでありうる。モデル推論フレームワークは、高速特徴埋め込み用の畳み込みアーキテクチャ(convolutional architecture for fast feature embedding、Caffe)、Tensorflow、PyTorch等でよい。これらのモデル推論フレームワークは、当業者によって、データラベリングシステムの基本計算ユニットストレージリポジトリに記憶され得る。ユーザは、ラベリング中に使用されるハードウェアリソースをさらに選択してよく、たとえば中央処理装置(central processing units、CPU)の数、グラフィック処理ユニット(graphics processing units)の数等を指定し得る。言い換えれば、ユーザは、データラベリングシステムによって既に割り当てられているハードウェアリソースの代わりに、実際の要求に基づきハードウェアリソースを指定することができる。このようにして、ユーザの要求がより良く満たされ得る。
【0012】
ユーザがラベリングの要求を有するとき、データラベリングシステムのデータラベリングマネージャは、ターゲットモデル推論フレームワークを含む基本計算ユニットを選択し、基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを構築し得る。
【0013】
次いで、ターゲット計算ユニットは、第1のラベリングモデルの基本パラメータデータを取得し、第1のラベリングモデルの基本パラメータデータとターゲットモデル推論フレームワークとを組み合わせて第1のラベリングモデルを取得し、次いで、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングする。本出願の実施形態において示される解決策では、ハードコーディングによってラベリングモデルをデータラベリングシステムに組み込む必要はなく、そのため、データラベリングシステムがより柔軟になって、より多くのラベリングモデルが利用可能であることが分かる。
【0014】
可能な実装形態では、データラベリングマネージャは、
クライアントによって送信された、第1のラベリングモデルのモデル識別子および基本パラメータデータを受信し、
ラベリングモデルストレージリポジトリに第1のラベリングモデルの基本パラメータデータを記憶し、第1のラベリングモデルのモデル識別子、および第1のラベリングモデルの基本パラメータデータの第1のストレージパス情報を対応させて記憶するように、さらに構成される。
【0015】
本出願の実施形態において示される解決策では、ユーザは、データラベリングシステムに第1のラベリングモデルの基本パラメータデータをアップロードする。データラベリングシステムのデータラベリングマネージャは、ユーザがアップロードした第1のラベリングモデルの基本パラメータデータを受信し、ユーザがアップロードした第1のラベリングモデルの基本パラメータデータをデータラベリングシステムのラベリングモデルストレージリポジトリに記憶し、第1のラベリングモデルのモデル識別子、および第1のラベリングモデルの基本パラメータデータの第1のストレージパス情報を対応させて記憶し得る。
【0016】
後に、ラベリングされるべきデータにラベリングするとき、ユーザは、自分がアップロードした第1のラベリングモデルの基本パラメータデータを選択し、自分がアップロードした第1のラベリングモデルの基本パラメータデータと、データラベリングシステムによって供給されたターゲットモデル推論フレームワークとを組み合わせて、第1のラベリングモデルを生成し得る。
【0017】
可能な実装形態では、データラベリング要求はさらに、ラベリングされるべきデータのデータ識別子を運び、データラベリングマネージャは、
データ識別子とデータのストレージパス情報との間の記憶された対応関係から、ラベリングされるべきデータのデータ識別子に対応する第2のストレージパス情報を取得して、
ターゲット計算ユニットに第2のストレージパス情報を送信するようにさらに構成され、
ターゲット計算ユニットは、
第2のストレージパス情報を使用することによって、ラベリングされるべきデータを取得するように構成される。
【0018】
可能な実装形態では、データラベリング要求はさらに、ターゲットモデル推論フレームワークのフレームワーク識別子を運び、データラベリングマネージャは、
ターゲットモデル推論フレームワークのフレームワーク識別子に基づき、基本計算ユニットストレージリポジトリから、ターゲットモデル推論フレームワークを含むターゲット基本計算ユニットを取得するように構成される。
【0019】
本出願の実施形態において示される解決策では、ユーザは、ラベリングモデルの基本パラメータデータをアップロードするとき、使用する必要があるモデル推論フレームワークをさらに選択し得る。データラベリングシステムのデータラベリングマネージャは、データラベリング要求を受信した後、ターゲットモデル推論フレームワークのものであり、データラベリング要求の中で運ばれるフレームワーク識別子に基づき、ターゲットモデル推論フレームワークを含むターゲット基本計算ユニットを選択する。
【0020】
可能な実装形態では、データラベリングマネージャは、
ターゲット計算ユニットが、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングするプロセスにおいて、クライアントによって送信されたラベリングモデル置換要求を受信し、ラベリングモデル置換要求は、第2のラベリングモデルのモデル識別子を運び、モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第2のラベリングモデルのモデル識別子に対応する基本パラメータデータの第3のストレージパス情報を取得して、ターゲット計算ユニットに、第3のストレージパス情報を運ぶモデル置換命令を送信するようにさらに構成され、
ターゲット計算ユニットは、ラベリングされていないラベリングされるべきデータのラベリングを停止し、第3のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリにおける第2のラベリングモデルの基本パラメータデータを取得し、ターゲットモデル推論フレームワークの中にある第1のラベリングモデルの基本パラメータデータを第2のラベリングモデルの基本パラメータデータで置換して、第2のラベリングモデルを取得し、第2のラベリングモデルと第1のラベリングモデルは同じモデル推論フレームワークに対応し、ラベリングされていないラベリングされるべきデータを第2のラベリングモデルに入力して、ラベリングされていないラベリングされるべきデータにラベリングするように構成される。
【0021】
本出願の実施形態において示される解決策では、ラベリングされるべきデータにラベリングするプロセスにおいて、ユーザは、ラベリングモデルの変更を選択してから、ラベリングされていないラベリングされるべきデータにラベリングしてもよい。たとえば、ユーザは、第1のラベリングモデルを10分間使用することによって、ラベリングされるべきデータにラベリングした後、ラベリングされていないラベリングされるべきデータに、第2のラベリングモデルを使用することによってラベリングする必要がある。この場合、ユーザは、データラベリングシステムにラベリングモデル置換要求を送信しうる。データラベリングシステムのデータラベリングマネージャは、ユーザのラベリングモデル置換要求に基づき、ターゲット計算ユニットに、ターゲットモデル推論フレームワークの中にある第1のラベリングモデルの基本パラメータデータを第2のラベリングモデルの基本パラメータデータで置換して第2のラベリングモデルを取得してから、第2のラベリングモデルを使用することによって、ラベリングされていないラベリングされるべきデータのラベリングを継続するように指示しうる。このプロセスでは、ラベリングされるべきデータの再アップロードが不要で、ユーザは新たなラベリングモデルを選択するだけでよく、そのためラベリングがより高効率になる。
【0022】
第2の態様によれば、データラベリング方法が提供され、この方法は、
クライアントによって送信された、第1のラベリングモデルのモデル識別子とハードウェアリソース割当て情報とを運ぶデータラベリング要求を受信するステップと、
基本計算ユニットストレージリポジトリから、第1のラベリングモデルに対応するターゲットモデル推論フレームワークおよびハードウェアドライバ呼出しツールを含む、ターゲット基本計算ユニットを取得するステップと、
ハードウェアリソース割当て情報に基づき、ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを確立するステップと、
モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第1のラベリングモデルのモデル識別子に対応する基本パラメータデータの第1のストレージパス情報を取得して、ターゲット計算ユニットに第1のストレージパス情報を送信し、それにより、ターゲット計算ユニットは、第1のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから、使用されるべきラベリングモデルの基本パラメータデータを取得し、ターゲットモデル推論フレームワークと第1のラベリングモデルの基本パラメータデータとを組み合わせて第1のラベリングモデルを取得し、ラベリングされるべきデータを取得し、ラベリングされるべきデータを第1のラベリングモデルに入力して、ラベリングされるべきデータにラベリングし、第1のラベリングモデルの基本パラメータデータは、第1のラベリングモデルの訓練可能なパラメータが訓練された後に取得された値を含む、ステップと、
を含む。
【0023】
可能な実施態様では、この方法は、
クライアントによって送信された、第1のラベリングモデルのモデル識別子および基本パラメータデータを受信するステップと、
ラベリングモデルストレージリポジトリに第1のラベリングモデルの基本パラメータデータを記憶し、第1のラベリングモデルのモデル識別子、および第1のラベリングモデルの基本パラメータデータの第1のストレージパス情報を対応させて記憶するステップと、
をさらに含む。
【0024】
可能な実装形態では、データラベリング要求はさらに、ラベリングされるべきデータのデータ識別子を運び、この方法は、
データ識別子とデータのストレージパス情報との間の記憶された対応関係から、ラベリングされるべきデータのデータ識別子に対応する第2のストレージパス情報を取得するステップと、
ターゲット計算ユニットに第2のストレージパス情報を送信するステップであって、それにより、ターゲット計算ユニットは、第2のストレージパス情報を使用することによって、ラベリングされるべきデータを取得する、第2のストレージパス情報を送信するステップと、
をさらに含む。
【0025】
可能な実装形態では、データラベリング要求はさらに、ターゲットモデル推論フレームワークのフレームワーク識別子を運び、基本計算ユニットストレージリポジトリからターゲット基本計算ユニットを取得するステップは、
ターゲットモデル推論フレームワークのフレームワーク識別子に基づき、基本計算ユニットストレージリポジトリから、ターゲットモデル推論フレームワークを含むターゲット基本計算ユニットを取得するステップを含む。
【0026】
可能な実施態様では、この方法は、
ターゲット計算ユニットが、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングするプロセスにおいて、クライアントによって送信されたラベリングモデル置換要求を受信し、前記ラベリングモデル置換要求は、第2のラベリングモデルのモデル識別子を運ぶ、ステップと、
モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第2のラベリングモデルのモデル識別子に対応する基本パラメータデータの第3のストレージパス情報を取得するステップと、
ターゲット計算ユニットに、第3のストレージパス情報を運ぶモデル置換命令を送信するステップであって、それにより、ターゲット計算ユニットは、ラベリングされていないラベリングされるべきデータのラベリングを停止し、第3のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから第2のラベリングモデルの基本パラメータデータを取得し、ターゲットモデル推論フレームワークの中にある第1のラベリングモデルの基本パラメータデータを第2のラベリングモデルの基本パラメータデータで置換して第2のラベリングモデルを取得し、ラベリングされていないラベリングされるべきデータを第2のラベリングモデルに入力して、ラベリングされていないラベリングされるべきデータにラベリングし、第2のラベリングモデルと第1のラベリングモデルは同じモデル推論フレームワークに対応する、ステップと、
をさらに含む。
【0027】
第3の態様によれば、データラベリング装置が提供され、この装置は、
クライアントによって送信された、第1のラベリングモデルのモデル識別子とハードウェアリソース割当て情報とを運ぶデータラベリング要求を受信するように構成された、受信モジュールと、
基本計算ユニットストレージリポジトリから、第1のラベリングモデルに対応するターゲットモデル推論フレームワークおよびハードウェアドライバ呼出しツールを含む、ターゲット基本計算ユニットを取得するように構成された、取得モジュールと、
ハードウェアリソース割当て情報に基づき、ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを確立するように構成された、割当てモジュールと、
モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第1のラベリングモデルのモデル識別子に対応する基本パラメータデータの第1のストレージパス情報を取得して、ターゲット計算ユニットに第1のストレージパス情報を送信し、それにより、ターゲット計算ユニットは、第1のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから、使用されるべきラベリングモデルの基本パラメータデータを取得し、ターゲットモデル推論フレームワークと第1のラベリングモデルの基本パラメータデータとを組み合わせて第1のラベリングモデルを取得し、ラベリングされるべきデータを取得し、ラベリングされるべきデータを第1のラベリングモデルに入力して、ラベリングされるべきデータにラベリングし、第1のラベリングモデルの基本パラメータデータは、第1のラベリングモデルの訓練可能なパラメータが訓練された後に取得された値を含む、ように構成された送信モジュールと、
を含む。
【0028】
可能な実装形態では、受信モジュールは、
クライアントによって送信された、第1のラベリングモデルのモデル識別子および基本パラメータデータを受信し、ラベリングモデルストレージリポジトリに第1のラベリングモデルの基本パラメータデータを記憶し、第1のラベリングモデルのモデル識別子、および第1のラベリングモデルの基本パラメータデータの第1のストレージパス情報を対応させて記憶するように、さらに構成される。
【0029】
可能な実装形態では、データラベリング要求はさらに、ラベリングされるべきデータのデータ識別子を運び、取得モジュールは、
データ識別子とデータのストレージパス情報との間の記憶された対応関係から、ラベリングされるべきデータのデータ識別子に対応する第2のストレージパス情報を取得して、
ターゲット計算ユニットに第2のストレージパス情報を送信し、それにより、ターゲット計算ユニットは、第2のストレージパス情報を使用することによって、ラベリングされるべきデータを取得する、ようにさらに構成される。
【0030】
可能な実装形態では、データラベリング要求はさらに、ターゲットモデル推論フレームワークのフレームワーク識別子を運び、取得モジュールは、
ターゲットモデル推論フレームワークのフレームワーク識別子に基づき、基本計算ユニットストレージリポジトリから、ターゲットモデル推論フレームワークを含むターゲット基本計算ユニットを取得するように構成される。
【0031】
可能な実装形態では、この装置は、
置換モジュールであって、ターゲット計算ユニットが、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングするプロセスにおいて、クライアントによって送信された、第2のラベリングモデルのモデル識別子を運ぶラベリングモデル置換要求を受信し、
モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第2のラベリングモデルのモデル識別子に対応する基本パラメータデータの第3のストレージパス情報を取得し、
ターゲット計算ユニットに、第3のストレージパス情報を運ぶモデル置換命令を送信し、それにより、ターゲット計算ユニットは、ラベリングされていないラベリングされるべきデータのラベリングを停止し、第3のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから第2のラベリングモデルの基本パラメータデータを取得し、ターゲットモデル推論フレームワークの中にある第1のラベリングモデルの基本パラメータデータを第2のラベリングモデルの基本パラメータデータで置換して第2のラベリングモデルを取得し、ラベリングされていないラベリングされるべきデータを第2のラベリングモデルに入力して、ラベリングされていないラベリングされるべきデータにラベリングし、第2のラベリングモデルと第1のラベリングモデルは同じモデル推論フレームワークに対応する、
ように構成された置換モジュールをさらに含む。
【0032】
第4の態様によれば、データラベリングマネージャが提供される。データラベリングマネージャは、プロセッサおよびメモリを含み、メモリは少なくとも1つの命令を記憶しており、プロセッサが、第2の態様によるデータラベリング方法を使用することによって行われる動作を実施するために、命令をロードして実行する。
【0033】
第5の態様によれば、コンピュータ可読記憶媒体が提供される。記憶媒体は少なくとも1つの命令を記憶しており、プロセッサが、第2の態様によるデータラベリング方法を使用することによって行われる動作を実施するために、命令をロードして実行する。
【0034】
本出願の実施形態において示される解決策では、ユーザは、ラベリングを要求するとき、データラベリングシステムにデータラベリング要求を送ってよく、データラベリングシステムのデータラベリングマネージャが、データラベリング要求を受信し、ラベリングモデルストレージリポジトリから第1のラベリングモデルの基本パラメータデータを取得し、基本計算ユニットリポジトリから、ターゲットモデル推論フレームワークを含むターゲット基本計算ユニットを取得し、ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを確立し得る。ターゲット計算ユニットは、ターゲットモデル推論フレームワークと第1のラベリングモデルの基本パラメータデータとを組み合わせて第1のラベリングモデルを取得し得る。次いで、ターゲット計算ユニットは、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングし得る。このように、ハードコーディングによってデータラベリングシステムにラベリングモデルを組み込む必要はなく、ラベリングモデルの基本パラメータデータのソースは、多様であり得、当業者によるコード組込みに限定されない。したがって、ラベリングモデルがより柔軟になり得、任意選択のラベリングモデルがより豊富になり、ユーザに、データラベリングサービスがより良く提供され得る。加えて、ユーザのラベリング要求をより良く満たすために、ハードウェアリソースはユーザによって指定される。
【図面の簡単な説明】
【0035】
【
図1】本出願の一実施形態による実装形態の環境の概略図である。
【
図2】本出願の一実施形態によるデータラベリングマネージャの概略構造図である。
【
図3】本出願の一実施形態によるデータラベリング方法の流れ図である。
【
図4】本出願の一実施形態によるラベリングモデルストレージリポジトリの概略図である。
【
図5】本出願の一実施形態によるデータラベリングシステムの概略図である。
【
図6】本出願の一実施形態による、データラベリングマネージャとターゲット計算ユニットとの間の相互作用の流れ図である。
【
図7】本出願の一実施形態によるデータラベリング装置の概略構造図である。
【発明を実施するための形態】
【0036】
本出願の実施形態は、データラベリング方法を提供する。この方法は、データラベリングシステムのデータラベリングマネージャによって実施され得る。データラベリングシステムは単一サーバまたはサーバクラスタでありうる。
図1は、本出願の一実施形態による実装形態の環境の概略図である。実装形態の環境は、クライアントおよびデータラベリングシステムを含み得る。ユーザは、クライアントを使用することによって、使用されるべきラベリングモデルを選択し、ラベリングされるべきデータをデータラベリングシステムにアップロードして、データラベリング要求を送信することができる。データラベリングシステムは、組み合わせによって、ユーザが選択したラベリングモデルを取得し、組み合わせによって取得されたラベリングモデルを使用することによって、ユーザがアップロードしたラベリングされるべきデータにラベリングすることができる。加えて、ユーザは、クライアントを使用することによってデータラベリングシステムにラベリングモデルの基本パラメータデータをさらにアップロードし、それにより、データラベリングシステムが、続いて、ユーザがアップロードした基本パラメータデータとモデル推論フレームワークとを組み合わせてラベリングモデルを取得し、ユーザがアップロードしたラベリングされるべきデータにラベリングしてもよい。
【0037】
図2に、前述のデータラベリングマネージャの概略構造図が示され得る。
図2を参照されたい。データラベリングマネージャは、プロセッサ210、受信器220、および送信器230を含み得る。受信器220および送信器230はプロセッサ210に接続され得る。受信器220および送信器230はネットワークインターフェースカードでありうる。受信器220は、クライアントによって送信されたデータラベリング要求等を受信するように構成され得る。送信器230は、クライアントにラベリング結果のデータを送信し得る。プロセッサ210は、データラベリングマネージャのコントロールセンタでありえ、様々なインターフェースおよび線を介して、受信器220や送信器230などのデータラベリングマネージャ全体のすべての部分に接続されている。本出願では、プロセッサ210はCPU(Central Processing Unit、中央処理装置)でありうる。任意選択で、プロセッサ210は1つまたは複数の処理ユニットを含み得る。プロセッサ210は、あるいは、デジタル信号プロセッサ、特定用途向け集積回路、フィールドプログラマブルゲートアレイ、他のプログラマブル論理デバイス等でよい。データラベリングマネージャは、メモリ
240をさらに含み得る。メモリ
240は、ソフトウェアプログラムおよびモジュールを記憶するように構成され得る。プロセッサ210は、メモリに記憶されたソフトウェアコードおよびモジュールを読み取ることにより、ラベリングされるべきデータにラベリングする。
【0038】
図3は、本出願の一実施形態によるデータラベリング方法の流れ図である。この方法のプロシージャは以下のステップを含み得る。
【0039】
ステップ301:クライアントによって送信されたデータラベリング要求を受信する。
【0040】
一実装形態では、ユーザは、クライアントにおいて、データラベリングシステムにあらかじめ登録されているターゲットアカウントにログインし得る。ユーザは、クライアントにおいてユーザのターゲットアカウントにログインした後、クライアントを使用することによって、ラベリングされるべきデータをアップロードすることができる。たとえば、ラベリングされるべきデータはピクチャでありうる。ユーザは、ラベリングされるべきデータをラベリングプラットフォームにアップロードする前に、ラベリングプラットフォームのデータ仕様に基づき、ラベリングされるべきデータを圧縮し、名前を付けてから、ラベリングされるべきデータをラベリングプラットフォームにアップロードすることができる。データラベリングシステムのデータラベリングマネージャは、クライアントによってアップロードされたラベリングされるべきデータを受信した後、ラベリングされるべきデータを記憶し、ラベリングされるべきデータのデータ識別子とストレージパス情報との間の対応関係を記憶し得る。
【0041】
クライアントが、データラベリングシステムに、ラベリングされるべきデータをアップロードした後、データラベリングシステムは、クライアントに、ラベリングされるべきデータのリストを送信し得る。ラベリングされるべきデータのリストは、ユーザがデータラベリングシステムにアップロードしたばかりのラベリングされるべきデータのデータ識別子を含み得、ユーザが以前にデータラベリングシステムにアップロードしたラベリングされるべきデータのデータ識別子をさらに含み得る。本明細書では、データ識別子は、ユーザがラベリングされるべきデータをアップロードする前のラベリングされるべきデータの名前であり得る。ユーザは、ラベリングされるべきデータのリストから、ラベリングする必要のある、ラベリングされるべきデータのデータ識別子を選択し得る。
【0042】
加えて、クライアント上に、ラベリングモデルをアップロードするオプションがさらに表示され得る。ユーザは、ラベリングモデルをアップロードするオプションを選択し、クライアントを使用することによって、データラベリングシステムにラベリングモデルの基本パラメータデータをアップロードし得る。ラベリングモデルの基本パラメータデータは、ラベリングモデルの訓練可能なパラメータ(重み)が訓練された後に取得された値を含む。ユーザによってアップロードされた基本パラメータデータは、ユーザが、データラベリングシステムのモデル仕様に基づき圧縮し、名前を付けて、データラベリングシステムにアップロードする、ラベリングモデルの基本パラメータデータであり得る。クライアントは、ラベリングモデルの基本パラメータデータをアップロードするとき、ターゲットアカウントのアカウント識別子と、ラベリングモデルのモデル識別子と、ラベリングモデルの基本パラメータデータとをデータラベリングシステムにアップロードし得る。データラベリングシステムは、クライアントがアップロードしたラベリングモデルの基本パラメータデータを、ラベリングモデルストレージリポジトリに記憶し、クライアントがアップロードしたラベリングモデルの基本パラメータデータに対応するモデル識別子、ターゲットアカウントのアカウント識別子、および基本パラメータデータのストレージパス情報を対応させて記憶し得る。
【0043】
クライアント上に、ラベリングモデル選択オプションがさらに表示され得る。ユーザがラベリングモデル選択オプションを選択した後、クライアントは、データラベリングシステムにラベリングモデルリスト取得要求を送信するようにトリガされる。ラベリングモデルリスト取得要求は、クライアントが現在ログインしているターゲットアカウントのアカウント識別子を運び得る。データラベリングシステムは、ラベリングモデルリスト取得要求を受信した後、パブリックラベリングモデルのモデル識別子と、ターゲットアカウントのアカウント識別子に対応するモデル識別子とを取得し、パブリックラベリングモデルのモデル識別子と、ターゲットアカウントのアカウント識別子に対応するモデル識別子とを、ターゲットアカウントに対応するラベリングモデルのリストとして使用して、クライアントにラベリングモデルのリストを返す。ユーザは、ラベリングモデルのリストから、使用されるべき第1のラベリングモデルのモデル識別子を選択し得る。
【0044】
ユーザは、ラベリングされるべきデータおよび第1のラベリングモデルを選択した後、クライアント上でラベリング開始オプションを選択して、データラベリングシステムにデータラベリング要求を送信するようにクライアントをトリガし得る。データラベリング要求は、ラベリングされるべきデータのデータ識別子および第1のラベリングモデルのモデル識別子を運び得る。データシステムのデータラベリングマネージャが、データラベリング要求を受信し得る。
【0045】
ステップ302:基本計算ユニットストレージリポジトリからターゲット基本計算ユニットを取得する。
【0046】
高速特徴埋め込み用の畳み込みアーキテクチャ(convolutional architecture for fast feature embedding、Caffe)、Tensorflow、およびPyTorchなどの複数のモデル推論フレームワークがあり得る。
【0047】
一実装形態では、ラベリングモデルの基本パラメータデータと、対応するモデル推論フレームワークとは、データラベリングシステムに別個に記憶されてよい。ラベリングモデルの基本パラメータデータはラベリングモデルストレージリポジトリに記憶されてよく、ラベリングモデルのモデル推論フレームワークは、基本計算ユニットにおいて圧縮されて基本計算ユニットストレージリポジトリに記憶されてよい。それぞれの基本計算ユニットは、少なくとも1つのモデル推論フレームワークを含み得、ハードウェアドライバを呼び出すToolKit、言語の実行をサポートするランタイム、データラベリングマネージャの相互作用モジュール等をさらに含み得る。
【0048】
第1のラベリングモデルに対応するターゲットモデル推論フレームワークを含むターゲット基本計算ユニットは、複数の方式で取得され得る。方式のうちいくつかは、説明のために以下に列挙される。
【0049】
方式1:データラベリングシステムは、ユーザが利用可能なすべてのラベリングモデルのモデル識別子と基本計算ユニットの識別子との間の対応関係を記憶してよい。
【0050】
パブリックラベリングモデルについては、パブリックラベリングモデルのモデル識別子と基本計算ユニットの識別子との間の対応関係は、データラベリングシステムの当業者によって設定され得る。ラベリングモデルのモデル識別子に対応する基本計算ユニットは、ラベリングモデルに対応するモデル推論フレームワークを含むべきである。ユーザがアップロードする基本パラメータデータに対応するラベリングモデルについては、ユーザは、ラベリングモデルの基本パラメータデータをアップロードするとき、ラベリングモデルに対応するモデル推論フレームワークを指定することができる。この場合、クライアントは、データラベリングシステムに、ユーザがアップロードした基本パラメータデータに対応するラベリングモデルのモデル識別子と、ユーザが指定したモデル推論フレームワークのフレームワーク識別子とを送信し、データラベリングシステムは、ユーザがアップロードした基本パラメータデータに対応するラベリングモデルのモデル識別子と、ユーザが指定したモデル推論フレームワークを含む基本計算ユニットの識別子とを対応させて記憶してもよい。
【0051】
データラベリングマネージャは、データラベリング要求を受信した後、データラベリング要求の中で運ばれるモデル識別子に基づき、対応する基本計算ユニットの識別子を決定し得る。ここで複数の基本計算ユニットの各識別子が決定された場合には、ターゲット基本計算ユニットの識別子は、各識別子からランダムに選択されてよい。
【0052】
次いで、データラベリングマネージャは、基本計算ユニットストレージリポジトリからターゲット基本計算ユニットを取得し得る。
【0053】
方式2:パブリックラベリングモデルのモデル識別子と基本計算ユニットの識別子との間の対応関係は、データラベリングシステムに記憶されうる。
【0054】
ユーザがクライアントを使用することによって第1のラベリングモデルを選択した後、ユーザが選択した第1のラベリングモデルがパブリックラベリングモデルであれば、ラベリング開始オプションが選択されて、データラベリングシステムにデータラベリング要求を送信するようにクライアントをトリガし得る。データラベリング要求は、ラベリングされるべきデータのデータ識別子および第1のラベリングモデルのモデル識別子を運びうる。データラベリングシステムのデータラベリングマネージャは、データラベリング要求の中にある第1のラベリングモデルのモデル識別子に基づき、パブリックラベリングモデルのモデル識別子と基本計算ユニットの識別子との間の対応関係から、ターゲット基本計算ユニットの識別子を取得し得、基本計算ユニットストレージリポジトリからターゲット基本計算ユニットをさらに取得し得る。
【0055】
ユーザが選択した第1のラベリングモデルが、ユーザがアップロードした基本パラメータデータに対応するラベリングモデルであるならば、クライアントはモデル推論フレームワーク選択インターフェースへとジャンプし得る。モデル推論フレームワークリストが機械学習選択インターフェースに表示され、モデル推論フレームワークリストは様々なモデル推論フレームワークのフレームワーク識別子を含み得る。ユーザは、実際の要求に基づき、ターゲットモデル推論フレームワークのフレームワーク識別子を選択することができる。ユーザは、ターゲットモデル推論フレームワークを選択した後、クライアント上でラベリング開始オプションを選択して、データラベリングシステムにデータラベリング要求を送信するようにクライアントをトリガし得る。データラベリング要求は、ラベリングされるべきデータのデータ識別子、ターゲットモデル推論フレームワークのフレームワーク識別子、および第1のラベリングモデルのモデル識別子を運び得る。この場合、データラベリングシステムは、モデル推論フレームワークのフレームワーク識別子と基本計算ユニットの識別子との間の対応関係を記憶し得る。この場合、データラベリングマネージャは、データラベリング要求の中のフレームワーク識別子に基づき、対応するターゲットモデル推論フレームワークの識別子を取得し得、基本計算ユニットストレージリポジトリからターゲット基本計算ユニットをさらに取得し得る。
【0056】
ステップ303:ハードウェアリソース割当て情報に基づき、ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを確立する。
【0057】
一実装形態では、クライアント上に、ハードウェアリソース割当てオプションがさらに表示され得る。ユーザは、ラベリング開始オプションを選択する前に、ハードウェアリソース割当てオプションをさらに選択して、ハードウェアリソース割当てインターフェースを始め得る。ハードウェアリソース割当てインターフェースにおいて、ユーザは、実際の要求に基づき、必要なハードウェアリソース割当て情報を入力することができる。ハードウェアリソース割当て情報は、CPUの数、グラフィック処理ユニット(Graphics Processing Units、GPU)の数等を含み得る。対応して、クライアントが送信するデータラベリング要求はさらに、ハードウェアリソース割当て情報を運び得る。データラベリングマネージャは、データラベリング要求を受信し後、データラベリング要求の中で運ばれるハードウェアリソース割当て情報に基づき、ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを構築し得る。
【0058】
ステップ304:モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第1のラベリングモデルのモデル識別子に対応する基本パラメータデータの第1のストレージパス情報を取得して、ターゲット計算ユニットに第1のストレージパス情報を送信する。このようにして、ターゲット計算ユニットが、第1のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから、使用されるべきラベリングモデルの基本パラメータデータを取得し、ターゲットモデル推論フレームワークと第1のラベリングモデルの基本パラメータデータとを組み合わせて第1のラベリングモデルを取得し、ラベリングされるべきデータを取得し、ラベリングされるべきデータを第1のラベリングモデルに入力して、ラベリングされるべきデータにラベリングする。
【0059】
一実装形態では、データラベリングマネージャは、第1のラベリングモデルのものであり、データラベリング要求の中で運ばれるモデル識別子を取得して、モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第1のラベリングモデルの基本パラメータデータの第1のストレージパス情報を取得し得る。次いで、データラベリングマネージャは、ターゲット計算ユニットに、第1のラベリングモデルの基本パラメータデータの第1のストレージパス情報を送信し得る。
【0060】
ターゲット計算ユニットは、第1のストレージパス情報を受信した後、第1のストレージパス情報に基づき、ラベリングモデルストレージリポジトリから第1のラベリングモデルの基本パラメータデータを取得し得る。
【0061】
ラベリングモデルストレージリポジトリにおいて、各ラベリングモデルの基本パラメータデータが、記憶のために、対応するラベリング推論スクリプトおよびラベリング推論スクリプトの依存ファイルとともに圧縮され得る。本明細書では、基本パラメータデータと、対応するラベリング推論スクリプトと、ラベリング推論スクリプトの依存ファイルとの組合せは、モデル基本ファイルと称されることがある。
【0062】
対応して、ターゲット計算ユニットは、第1のラベリングモデルの基本パラメータデータを取得するとき、第1のラベリングモデルの基本パラメータデータを含むターゲットモデル基本ファイルを取得し得る。当業者は、ラベリングモデルストレージリポジトリにおいてパブリックラベリングモデルのモデル基本ファイルをコンパイルして圧縮し得、ユーザは、データラベリングシステムのモデル仕様に基づき、クライアントを使用することによって、ユーザがアップロードしたラベリングモデルのモデル基本ファイルをコンパイルして圧縮する必要がある。
【0063】
モデル基本ファイルにおけるラベリング推論スクリプトは、ラベリングモデルをロードするインターフェース、ラベリングされるべきデータを前処理するインターフェース、データラベリングインターフェース、およびラベリング結果のデータを処理するインターフェースといったインターフェースを提供する必要がある。ラベリングモデルをロードするインターフェースは、メモリにラベリングモデルをロードするように使用され、ラベリングされるべきデータを前処理するインターフェースは、ラベリングされるべきデータのフォーマット変換などの前処理に使用され、それにより、ラベリングされるべきデータはラベリングモデルに適合することができ、データラベリングインターフェースは、並行ラベリングや順次ラベリングなど、ラベリングされるべきデータのラベリング方法を指示するように使用され、ラベリング結果のデータの処理インターフェースは、ラベリングモデルが出力したラベリング結果のデータが、ラベリング結果のデータに対するユーザのフォーマット要求を満たすように、フォーマット変換を行うように使用される。
【0064】
図4に示されるように、パブリックラベリングモデルのモデル基本ファイルと各ユーザによってアップロードされたラベリングモデルのモデル基本ファイルとは、ラベリングモデルストレージリポジトリに別個に記憶され得る。パブリックラベリングモデルのモデル基本ファイルは、ラベリングモデル1と、ラベリングモデル2と、ラベリングモデル3と、ラベリングモデル4との、基本モデルファイルを含み得る。ユーザ1がアップロードしたラベリングモデルの基本モデルファイルは、ラベリングモデル5とラベリングモデル6との基本モデルファイルを含む。ユーザ2がアップロードしたラベリングモデルの基本モデルファイルは、ラベリングモデル7とラベリングモデル8との基本モデルファイルを含む。
【0065】
ターゲット計算ユニットは、第1のラベリングモデルの基本パラメータデータを取得した後、ターゲットモデル推論フレームワークに基本パラメータデータを付加して第1のラベリングモデルを取得し得る。
【0066】
データラベリングマネージャは、ラベリングされるべきデータのものであり、データラベリング要求の中で運ばれるデータ識別子を取得して、このデータ識別子とデータのストレージパス情報との間の記憶された対応関係に基づき、ラベリングされるべきデータの第2のストレージパス情報を取得し得る。
【0067】
データラベリングマネージャは、ターゲット計算ユニットに、ラベリングされるべきデータの第2のストレージパス情報を送信しうる。ターゲット計算ユニットは、ラベリングされるべきデータの第2のストレージパス情報に基づき、ラベリングされるべきデータを取得し得る。
【0068】
次いで、ターゲット計算ユニットは、ターゲットモデル基本ファイルのラベリング推論スクリプトを実行し、ラベリング推論スクリプトの、ラベリングモデルをロードするインターフェースを呼び出して、メモリに第1のラベリングモデルをロードし得る。ラベリングされるべきデータが第1のラベリングモデルに入力される前に、ラベリングされるべきデータを前処理するために、ラベリング推論スクリプトの、ラベリングされるべきデータを前処理するインターフェースがさらに呼び出され得る。ここで、前処理はフォーマット変換処理でよく、すなわち、ラベリングされるべきデータは、第1のラベリングモデルを使用することによって、ラベリング可能なフォーマットに変換される。次いで、ラベリング推論スクリプトのデータラベリングインターフェースが呼び出されて、ラベリングされるべき前処理済みのデータが第1のラベリングモデルに入力される。次いで、第1のラベリングモデルは、ラベリングされるべきデータの各部分に対応するラベリング結果のデータを出力した後、ラベリング推論スクリプトのラベリング結果のデータの処理インターフェースが呼び出されて、ラベリング結果のデータに対するラベリング後の処理を行い得る。ここで、ラベリング後の処理は、たとえばJavaScriptオブジェクト表記法(JavaScript Object Notation、Json)フォーマットで出力されたラベリング結果のデータを拡張マークアップ言語(Extensible Markup Language、XML)フォーマットに変換するフォーマット変換処理でありうる。
【0069】
ラベリングが完了した後、ターゲット計算ユニットが、データラベリングマネージャにラベリング結果のデータを送ってもよく、次いでデータラベリングマネージャが、クライアントにラベリング結果のデータを返す。
【0070】
可能な実装形態では、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングするプロセスにおいて、ラベリングモデルが変更されてよく、ラベリングされるべきデータにラベリングするために、変更されたラベリングモデルが使用される。対応して、処理は以下の通りでありうる。
【0071】
クライアント上に、ラベリングモデル置換オプションが表示され得る。ユーザは、ラベリングモデル置換オプションを選択して、ラベリングモデル選択インターフェースに入り得る。ラベリングモデル選択インターフェースに、置換可能なラベリングモデルのリストが表示され得、第1のラベリングモデルと同じモデル推論フレームワークに対応するラベリングモデルのモデル識別子が含まれ得る。ユーザは、置換可能なラベリングモデルリストから、使用されるべき第2のラベリングモデルのモデル識別子を選択し得る。次いで、クライアントは、データラベリングシステムにラベリングモデル置換要求を送信しうる。
【0072】
データラベリングシステムのデータラベリングマネージャが、ラベリングモデル置換要求を受信し、ラベリングモデル置換要求は第2のラベリングモデルのモデル識別子を運ぶ。データラベリングマネージャは、モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第2のラベリングモデルのモデル識別子に対応する基本パラメータデータの第3のストレージパス情報を取得して、ターゲット計算ユニットにラベリングモデル置換命令を送信し、ラベリングモデル置換命令は、第3のストレージパス情報を運び得る。ターゲット計算ユニットは、ラベリングモデルの置換命令を受信すると、ラベリングされていないラベリングされるべきデータのラベリングを停止し、第3のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから第2のラベリングモデルの基本パラメータデータを取得する。もちろん、第2のラベリングモデルの基本パラメータデータを含むモデル基本ファイルも、ここで取得され得る。次いで、ターゲット計算ユニットは、第1のラベリングモデルのものであり、ターゲットモデル推論フレームワークの中にある基本パラメータデータを第2のラベリングモデルの基本パラメータデータで置換して第2のラベリングモデルを取得し得る。加えて、ターゲット計算ユニットは、第2のラベリングモデルの基本パラメータデータを含むモデル基本ファイルの中の取得されたラベリング推論スクリプトを実行し、第2のラベリングモデルを使用することによって、ラベリングされていないラベリングされるべきデータにラベリングし得る。
【0073】
可能な実装形態では、ラベリングモデルのラベリングをより正確にするために、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングした後、ラベリング結果のデータに対して、点検調節が手動で実行され得、点検調節の後に取得されるラベリング結果のデータは、出力サンプルデータや、入力サンプルデータとして第1のラベリングモデルに入力されるラベリングされるべきデータとして、使用される。第1のラベリングモデルは、第1のラベリングモデルの基本パラメータデータの中の訓練可能なパラメータの値を更新するために、出力サンプルデータおよび入力サンプルデータを使用することによって訓練され、第1のラベリングモデルを最適化する。
【0074】
以下は、データラベリングシステムにおけるデータラベリングマネージャとターゲット計算ユニットとの間の相互作用プロシージャを、
図6を参照しながら説明するものである。
図6を参照されたい。ラベリングプロセスにおいて、データラベリングマネージャとターゲット計算ユニットとの間の相互作用プロシージャは、以下のステップを含み得る。
【0075】
ステップ601:データラベリングマネージャが、ターゲット計算ユニットに、第1のラベリングモデルの基本パラメータデータの第1のストレージパス情報を送信する。
【0076】
ステップ602:ターゲット計算ユニットが、第1のストレージパス情報に基づき、ラベリングモデルストレージリポジトリから、第1のラベリングモデルの基本パラメータデータを含む第1の基本モデルファイルを取得し、第1の基本モデルファイルの中の第1のラベリングモデルの基本パラメータデータをターゲットモデル推論フレームワークに付加して、第1のラベリングモデルを生成する。
【0077】
ステップ603:データラベリングマネージャが、ターゲット計算ユニットに、ラベリングされるべきデータの第2のストレージパス情報を送信する。
【0078】
ステップ604:ターゲット計算ユニットが、第2のストレージパス情報に基づき、ラベリングされるべきデータを取得する。
【0079】
ステップ605:ターゲット計算ユニットが、第1の基本モデルファイルの中のラベリング推論スクリプトを実行し、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングする。
【0080】
ステップ606:ラベリングマネージャが、ターゲット計算ユニットにラベリングモデル置換命令を送信し、ラベリングモデル置換命令は、第2のラベリングモデルの基本パラメータデータの第3のストレージパス情報を運ぶ。
【0081】
ステップ607:ターゲット計算ユニットは、ラベリングされていないラベリングされるべきデータのラベリングを停止し、第3のストレージパス情報に基づき、ラベリングモデルストレージリポジトリから、第2のラベリングモデルの基本パラメータデータを含む第2の基本モデルファイルを取得し、ターゲットモデル推論フレームワークの中にある第1のラベリングモデルの基本パラメータデータを、第2の基本モデルファイルの中にある第2のラベリングモデルの基本パラメータデータで置換して第2のラベリングモデルを生成する。
【0082】
ステップ608:ターゲット計算ユニットは、第2の基本モデルファイルの中のラベリング推論スクリプトを実行し、第2のラベリングモデルを使用することによって、ラベリングされていないラベリングされるべきデータにラベリングする。
【0083】
本出願の実施形態において示される解決策では、ユーザは、ラベリングを要求するとき、データラベリングシステムにデータラベリング要求を送ってもよく、データラベリングシステムのデータラベリングマネージャが、データラベリング要求を受信し、ラベリングモデルストレージリポジトリから第1のラベリングモデルの基本パラメータデータを取得し、基本計算ユニットリポジトリから、ターゲットモデル推論フレームワークを含むターゲット基本計算ユニットを取得し、ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを構築し得る。ターゲット計算ユニットは、ターゲットモデル推論フレームワークと第1のラベリングモデルの基本パラメータデータとを組み合わせて第1のラベリングモデルを取得し得る。次いで、ターゲット計算ユニットは、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングし得る。このように、ハードコーディングによってデータラベリングシステムにラベリングモデルを組み込む必要はなく、ラベリングモデルの基本パラメータデータのソースは、多様であり得、当業者によるコード組込みに限定されない。したがって、ラベリングモデルがより柔軟になり得、任意選択のラベリングモデルがより豊富になる。加えて、ユーザのラベリング要求をより良く満たすために、ハードウェアリソースはユーザによって指定される。
【0084】
本出願の一実施形態は、データラベリングシステムをさらに提供するものである。
図5に示されるように、データラベリングシステムは、基本計算ユニット記憶領域、データラベリングマネージャ、およびラベリングモデルストレージリポジトリを含み得る
。
【0085】
データラベリングマネージャは、クライアントによって送信された、第1のラベリングモデルのモデル識別子とハードウェアリソース割当て情報とを運ぶデータラベリング要求を受信し、基本計算ユニットストレージリポジトリから、第1のラベリングモデルに対応するターゲットモデル推論フレームワークおよびハードウェアドライバ呼出しツールを含む、ターゲット基本計算ユニットを取得し、ハードウェアリソース割当て情報に基づき、ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを確立し、モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第1のラベリングモデルのモデル識別子に対応する基本パラメータデータの第1のストレージパス情報を取得して、ターゲット計算ユニットに第1のストレージパス情報を送信するように構成される。具体的には、データラベリングマネージャは、ステップ301~304および他の暗黙のステップにおいてデータラベリングマネージャによって実行される処理を実施してよく、データラベリングマネージャの特定の実装形態がここで再び説明されることはない。
【0086】
ターゲット計算ユニットは、第1のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから、使用されるべきラベリングモデルの基本パラメータデータを取得し、第1のラベリングモデルの基本パラメータデータは、第1のラベリングモデルの訓練可能なパラメータが訓練された後に取得された値を含み、ターゲットモデル推論フレームワークと第1のラベリングモデルの基本パラメータデータとを組み合わせて第1のラベリングモデルを取得し、ラベリングされるべきデータを取得して、ラベリングされるべきデータを第1のラベリングモデルに入力して、ラベリングされるべきデータにラベリングするように構成される。具体的には、ターゲット計算ユニットは、ステップ304においてターゲット計算ユニットによって実行される処理を実施してよく、ターゲット計算ユニットの特定の実装形態がここで再び説明されることはない。
【0087】
同一の技術的概念に基づき、本発明の一実施形態は、データラベリングマネージャの機能を実施するために、
図5に対応する実施形態で説明されたデータラベリングシステムを実施するように適用され得るデータラベリング装置をさらに提供する。
図7に示されるように、データラベリング装置は、受信モジュール710、取得モジュール720、割当てモジュール730、および送信モジュール740を含む。
【0088】
受信モジュール710は、クライアントによって送信された、第1のラベリングモデルのモデル識別子とハードウェアリソース割当て情報とを運ぶデータラベリング要求を受信するように構成される。具体的には、ステップ301における受信機能および他の暗黙のステップが実施され得る。
【0089】
取得モジュール720は、基本計算ユニットストレージリポジトリから、第1のラベリングモデルに対応するターゲットモデル推論フレームワークおよびハードウェアドライバ呼出しツールを含む、ターゲット基本計算ユニットを取得するように構成される。具体的には、ステップ302における取得機能および他の暗黙のステップが実施され得る。
【0090】
割当てモジュール730は、ハードウェアリソース割当て情報に基づき、ターゲット基本計算ユニットにハードウェアリソースを割り当てて、ターゲット計算ユニットを確立するように構成される。具体的には、ステップ303における割当て機能および他の暗黙のステップが実施され得る。
【0091】
送信モジュール740は、モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第1のラベリングモデルのモデル識別子に対応する基本パラメータデータのものである第1のストレージパス情報を取得して、ターゲット計算ユニットに第1のストレージパス情報を送信し、それにより、ターゲット計算ユニットは、第1のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから、使用されるべきラベリングモデルの基本パラメータデータを取得し、ターゲットモデル推論フレームワークと第1のラベリングモデルの基本パラメータデータとを組み合わせて第1のラベリングモデルを取得し、ラベリングされるべきデータを取得し、ラベリングされるべきデータを第1のラベリングモデルに入力して、ラベリングされるべきデータにラベリングし、第1のラベリングモデルの基本パラメータデータは、第1のラベリングモデルの訓練可能なパラメータが訓練された後に取得された値を含む、するように構成される。具体的には、ステップ304における送信機能および他の暗黙のステップが実施され得る。
【0092】
可能な実装形態では、受信モジュール710は、
クライアントによって送信された、第1のラベリングモデルのモデル識別子および基本パラメータデータを受信し、
ラベリングモデルストレージリポジトリに第1のラベリングモデルの基本パラメータデータを記憶し、第1のラベリングモデルのモデル識別子、および第1のラベリングモデルの基本パラメータデータの第1のストレージパス情報を対応させて記憶するように、さらに構成される。
【0093】
可能な実装形態では、データラベリング要求はさらに、ラベリングされるべきデータのデータ識別子を運び、取得モジュール720は、
データ識別子とデータのストレージパス情報との間の記憶された対応関係から、ラベリングされるべきデータのデータ識別子に対応する第2のストレージパス情報を取得して、
ターゲット計算ユニットに第2のストレージパス情報を送信し、それにより、ターゲット計算ユニットは、第2のストレージパス情報を使用することによって、ラベリングされるべきデータを取得する、ようにさらに構成される。
【0094】
可能な実装形態では、データラベリング要求はさらに、ターゲットモデル推論フレームワークのフレームワーク識別子を運び、取得モジュール720は、
ターゲットモデル推論フレームワークのフレームワーク識別子に基づき、基本計算ユニットストレージリポジトリから、ターゲットモデル推論フレームワークを含むターゲット基本計算ユニットを取得するように構成される。
【0095】
可能な実装形態では、この装置は、
置換モジュールをさらに含み、置換モジュールは、ターゲット計算ユニットが、第1のラベリングモデルを使用することによって、ラベリングされるべきデータにラベリングするプロセスにおいて、クライアントによって送信されたラベリングモデル置換要求を受信し、ラベリングモデル置換要求は、第2のラベリングモデルのモデル識別子を運び、
モデル識別子と基本パラメータデータのストレージパス情報との間の記憶された対応関係から、第2のラベリングモデルのモデル識別子に対応する基本パラメータデータの第3のストレージパス情報を取得して、
ターゲット計算ユニットに、第3のストレージパス情報を運ぶモデル置換命令を送信し、それにより、ターゲット計算ユニットは、ラベリングされていないラベリングされるべきデータのラベリングを停止し、第3のストレージパス情報を使用することによって、ラベリングモデルストレージリポジトリから第2のラベリングモデルの基本パラメータデータを取得して、ターゲットモデル推論フレームワークの中にある第1のラベリングモデルの基本パラメータデータを第2のラベリングモデルの基本パラメータデータで置換して第2のラベリングモデルを取得し、第2のラベリングモデルに、ラベリングされていないラベリングされるべきデータを入力して、ラベリングされていないラベリングされるべきデータにラベリングし、第2のラベリングモデルと第1のラベリングモデルは同じモデル推論フレームワークに対応する、するように構成される。
【0096】
前述の実施形態によるデータラベリング装置がデータにラベリングするときの、前述の機能モジュールの分割は単なる一例であることに留意されたい。実際の実装形態では、前述の機能は、様々なモジュールに割り当てられて、必要に応じて実施され得る。言い換えれば、データラベリングマネージャの内部構造は、上記で説明された機能のすべてまたは一部を実施するために別々の機能モジュールに分割される。加えて、前述の実施形態において提供されたデータラベリング装置とデータラベリング方法の実施形態とは、同一の概念に属するものである。特定の実装形態のプロセスについては方法の実施形態を参照されたい。ここで詳細が再び説明されることはない。
【0097】
前述の実施形態のうちすべてまたはいくつかは、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せを使用することによって実施され得る。実装形態のためにソフトウェアが使用されるとき、実施形態のうちすべてまたはいくつかは、コンピュータプログラム製品の形式で実施され得る。コンピュータプログラム製品は1つまたは複数のコンピュータ命令を含む。コンピュータプログラム命令がデバイスにロードされて実行されるとき、本発明の実施形態におけるプロシージャまたは機能のすべてまたは一部が生成される。コンピュータ命令はコンピュータ可読記憶媒体に記憶されてよく、またはコンピュータ可読記憶媒体から他のコンピュータ可読記憶媒体に伝送されてもよい。たとえば、コンピュータ命令は、ウェブサイト、コンピュータ、サーバ、またはデータセンタから、他のウェブサイト、コンピュータ、サーバ、またはデータセンタに、有線(たとえば同軸光ケーブル、光ファイバ、またはデジタル加入者線)または無線(たとえば、赤外線、無線、またはマイクロ波)の方式で伝送されてよい。コンピュータ可読記憶媒体は、デバイスによってアクセス可能な任意の使用可能な媒体でよく、あるいは、たとえば1つまたは複数の使用可能な媒体を組み込んだサーバまたはデータセンタといったデータ記憶デバイスでもよい。使用可能な媒体は、磁気媒体(たとえばフロッピーディスク、ハードディスクドライブ、磁気テープ等)、光媒体(たとえばデジタルビデオディスク(Digital Video Disk、DVD)等)、半導体媒体(たとえばソリッドステートドライブ等)でよい。
【0098】
当業者なら、前述の実施形態のステップのすべてまたは一部が、ハードウェアによって、または関連するハードウェアに命令するプログラムによって、実行され得ることを理解するであろう。プログラムは、コンピュータ可読記憶媒体に記憶され得る。前述の記憶媒体は、読取り専用メモリ、磁気ディスク、光ディスクなどでよい。
【0099】
前述の説明は本出願の単なる一実施形態であって、本出願を制限するように意図されたものではない。本出願の精神および原理から逸脱することなくなされる、あらゆる修正、等価な置換、または改善は、本出願の保護範囲に入るものとする。
【符号の説明】
【0100】
210 プロセッサ
220 受信器
230 送信器、メモリ
710 受信モジュール
720 取得モジュール
730 割当てモジュール
740 送信モジュール