(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-10-19
(54)【発明の名称】データ処理方法、装置、機器および記憶媒体
(51)【国際特許分類】
G06F 16/22 20190101AFI20221012BHJP
【FI】
G06F16/22
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021546329
(86)(22)【出願日】2020-10-15
(85)【翻訳文提出日】2021-08-06
(86)【国際出願番号】 CN2020121143
(87)【国際公開番号】W WO2022000851
(87)【国際公開日】2022-01-06
(31)【優先権主張番号】202010600582.2
(32)【優先日】2020-06-28
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(74)【代理人】
【識別番号】110001416
【氏名又は名称】特許業務法人 信栄特許事務所
(72)【発明者】
【氏名】▲張▼ 安▲ザン▼
(72)【発明者】
【氏名】曲 晶▲塋▼
(72)【発明者】
【氏名】▲劉▼ ▲偉▼
(72)【発明者】
【氏名】▲劉▼ ▲暢▼
(72)【発明者】
【氏名】▲陳▼ 正亮
(72)【発明者】
【氏名】万 ▲広▼弟
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA10
5B175FB03
(57)【要約】
本発明は、データ処理方法、装置、機器および記憶媒体を開示し、クラウドコンピューティングおよびクラウドプラットフォームの技術分野に関する。具体的な実現形態として、シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定し、前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートする。本発明によれば、データ処理の効率を向上させることができる。
【選択図】
図1a
【特許請求の範囲】
【請求項1】
シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定することと、
前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートすることとを含む、
データ処理方法。
【請求項2】
同一の前記物理データグループ内のデータスライスは異なるデータ記憶領域に記憶され、同一の前記データ記憶領域に異なる前記物理データグループ内のデータスライスが記憶されている、
請求項1に記載の方法。
【請求項3】
シーケンサから取得された第1データの論理情報に基づいて第1物理アドレスを確定することは、
データコントローラにより、前記シーケンサから取得された第1データの論理情報に基づいて前記第1データのメタデータを確定し、前記第1データのメタデータを前記シーケンサに送信することと、
データベースにより、前記シーケンサから取得された第1データのメタデータに基づいて前記第1物理アドレスを確定することとを含む、
請求項1に記載の方法。
【請求項4】
前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である、
請求項3に記載の方法。
【請求項5】
前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、前記シーケンサによって前記増分物理アドレスおよび前記全量物理アドレスに基づいて前記第1データをソートするために用いられる、
請求項1に記載の方法。
【請求項6】
データビルダから取得された第2データの論理情報に基づき、前記第2データに関連する物理データグループ内のデータスライスの物理アドレスである第2物理アドレスを確定することと、
前記第2物理アドレスを前記データビルダに送信し、前記データビルダによって前記第2物理アドレスに基づいて前記第2データを書き込むこととを更に含む、
請求項1に記載の方法。
【請求項7】
データビルダから取得された第2データの論理情報に基づいて第2物理アドレスを確定することは、
記憶コントローラにより、前記データビルダから取得された第2データの論理情報に基づいて前記第2データのメタデータを確定し、前記第2データのメタデータを前記データビルダに送信することと、
データベースにより、前記データビルダから取得された第2データのメタデータに基づいて前記第2物理アドレスを確定することとを含む、
請求項6に記載の方法。
【請求項8】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することを更に含む、
請求項1に記載の方法。
【請求項9】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することは、
前記物理データグループ内の元のデータスライスのリソース利用率が第1リソース利用率の閾値よりも大きいことを検出した場合、前記物理データグループ内の元のデータスライスのために関連する新しいデータスライスを作成することと、
前記元のデータスライス内のデータを前記元のデータスライスおよび前記新しいデータスライス内に分け、かつ、前記元のデータスライスおよび前記新しいデータスライスの物理アドレスのそれぞれを前記物理データグループ内のデータスライスの物理アドレスとすることとを含む、
請求項8に記載の方法。
【請求項10】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することは、
前記物理データグループ内のデータスライスのリソース利用率が第2リソース利用率の閾値よりも小さいことを検出した場合、前記物理データグループ内の少なくとも1つのデータスライスのデータを前記物理データグループ内の他のデータスライスに統合し、かつ、前記物理データグループ内のデータスライスの物理アドレスから前記少なくとも1つのデータスライスの物理アドレスを削除することを含む、
請求項8に記載の方法。
【請求項11】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することは、
前記物理データパケットにホットスポットデータが存在する場合、前記データ記憶リソース調整イベントを検出したことと、
前記物理データグループのために増分データスライスを作成し、前記ホットスポットデータを前記増分データスライスに書き込み、かつ、前記物理データグループ内の元のデータスライスを前記物理データグループの全量データスライスとすることと、
前記物理データグループ内の前記増分データスライスの物理アドレスを追加することとを含む、
請求項8に記載の方法。
【請求項12】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することは、
データ記憶領域のリソース利用率が第3リソース利用率の閾値よりも大きいことを検出した場合、新しいデータ記憶領域を作成することと、
前記新しいデータ記憶領域で前記物理データグループの新しいデータスライスを作成し、前記新しいデータ記憶領域の物理アドレスを前記物理データグループ内の新しいデータスライスの物理アドレスとすることとを含む、
請求項8に記載の方法。
【請求項13】
第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定することと、
前記第1物理アドレスに基づいて前記第1データをソートすることとを含む、
データ処理方法。
【請求項14】
第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて第1物理アドレスを確定することは、
前記第1データの論理情報を前記データ処理側におけるデータコントローラに送信し、前記データコントローラによって前記第1データの論理情報に基づいて前記第1データのメタデータを確定することと、
前記第1データのメタデータを前記データ処理側におけるデータベースに送信し、前記データベースによって前記第1データのメタデータに基づいて前記第1物理アドレスを確定することと、
を含む、
請求項13に記載の方法。
【請求項15】
前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である、
請求項14に記載の方法。
【請求項16】
前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、
前記第1物理アドレスに基づいて前記第1データをソートすることは、
前記増分物理アドレスに基づいて前記第1データを取得し、取得に失敗した場合、前記全量物理アドレスに基づいて前記第1データを取得することと、
取得した第1データをソートすることとを含む、
請求項13に記載の方法。
【請求項17】
シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定するための第1アドレス確定モジュールと、
前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートするための第1アドレス送信モジュールとを備える、
データ処理装置。
【請求項18】
同一の前記物理データグループ内のデータスライスは異なるデータ記憶領域に記憶され、同一の前記データ記憶領域に異なる前記物理データグループ内のデータスライスが記憶されている、
請求項17に記載の装置。
【請求項19】
前記第1アドレス確定モジュールは、
データコントローラにより、前記シーケンサから取得された第1データの論理情報に基づいて前記第1データのメタデータを確定し、前記第1データのメタデータを前記シーケンサに送信するための第1メタデータユニットと、
データベースにより、前記シーケンサから取得された第1データのメタデータに基づいて前記第1物理アドレスを確定するための第1アドレス確定ユニットとを備える、
請求項17に記載の装置。
【請求項20】
前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である、
請求項19に記載の装置。
【請求項21】
前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、前記シーケンサによって前記増分物理アドレスおよび前記全量物理アドレスに基づいて前記第1データをソートするために用いられる、
請求項17に記載の装置。
【請求項22】
データビルダから取得された第2データの論理情報に基づき、前記第2データに関連する物理データグループ内のデータスライスの物理アドレスである第2物理アドレスを確定するための第2アドレス確定モジュールと、
前記第2物理アドレスを前記データビルダに送信し、前記データビルダによって前記第2物理アドレスに基づいて前記第2データを書き込むための第2アドレス送信モジュールとを更に備える、
請求項17に記載の装置。
【請求項23】
前記第2アドレス確定モジュールは
記憶コントローラにより、前記データビルダから取得された第2データの論理情報に基づいて前記第2データのメタデータを確定し、前記第2データのメタデータを前記データビルダに送信するための第2メタデータユニットと、
データベースにより、前記データビルダから取得された第2データのメタデータに基づいて前記第2物理アドレスを確定するための第2アドレス確定ユニットとを備える、
請求項22に記載の装置。
【請求項24】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新するためのリソース調整モジュールを更に備える、
請求項17に記載の装置。
【請求項25】
前記リソース調整モジュールは、具体的に、
前記物理データグループ内の元のデータスライスのリソース利用率が第1リソース利用率の閾値よりも大きいことを検出した場合、前記物理データグループ内の元のデータスライスのために関連する新しいデータスライスを作成することと、
前記元のデータスライス内のデータを前記元のデータスライスおよび前記新しいデータスライス内に分け、かつ、前記元のデータスライスおよび前記新しいデータスライスの物理アドレスのそれぞれを前記物理データグループ内のデータスライスの物理アドレスとすることとに用いられる、
請求項24に記載の装置。
【請求項26】
前記リソース調整モジュールは、具体的に、
前記物理データグループ内のデータスライスのリソース利用率が第2リソース利用率の閾値よりも小さいことを検出した場合、前記物理データグループ内の少なくとも1つのデータスライスのデータを前記物理データグループ内の他のデータスライスに統合し、かつ、前記物理データグループ内のデータスライスの物理アドレスから前記少なくとも1つのデータスライスの物理アドレスを削除することに用いられる、
請求項24に記載の装置。
【請求項27】
前記リソース調整モジュールは、具体的に、
前記物理データパケットにホットスポットデータが存在する場合、前記データ記憶リソース調整イベントを検出したことと、
前記物理データグループのために増分データスライスを作成し、前記ホットスポットデータを前記増分データスライスに書き込み、かつ、前記物理データグループ内の元のデータスライスを前記物理データグループの全量データスライスとすることと、
前記物理データグループ内の前記増分データスライスの物理アドレスを追加することとに用いられる、
請求項24に記載の装置。
【請求項28】
前記リソース調整モジュールは、具体的に、
データ記憶領域のリソース利用率が第3リソース利用率の閾値よりも大きいことを検出した場合、新しいデータ記憶領域を作成することと、
前記新しいデータ記憶領域で前記物理データグループの新しいデータスライスを作成し、前記新しいデータ記憶領域の物理アドレスを前記物理データグループ内の新しいデータスライスの物理アドレスとすることとに用いられる、
請求項24に記載の装置。
【請求項29】
第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定するための論理情報送信モジュールと、
前記第1物理アドレスに基づいて前記第1データをソートするためのデータソートモジュールとを備える、
データ処理装置。
【請求項30】
前記論理情報送信モジュールは、
前記第1データの論理情報を前記データ処理側におけるデータコントローラに送信し、前記データコントローラによって前記第1データの論理情報に基づいて前記第1データのメタデータを確定するための論理情報送信ユニットと、
前記第1データのメタデータを前記データ処理側におけるデータベースに送信し、前記データベースによって前記第1データのメタデータに基づいて前記第1物理アドレスを確定するためのメタデータ送信ユニットとを備える、
請求項29に記載の装置。
【請求項31】
前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である、
請求項30に記載の装置。
【請求項32】
前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、
前記データソートモジュールは、具体的に、
前記増分物理アドレスに基づいて前記第1データを取得し、取得に失敗した場合、前記全量物理アドレスに基づいて前記第1データを取得し、取得した第1データをソートすることに用いられる、
請求項29に記載の装置。
【請求項33】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されたメモリとを備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、
前記命令は、前記少なくとも1つのプロセッサが請求項1~16のいずれか1項に記載の方法を実行可能であるように、前記少なくとも1つのプロセッサにより実行される、
電子機器。
【請求項34】
請求項1~16のいずれか1項に記載の方法をコンピュータに実行させるために用いられるコンピュータ命令が記憶された、
非一時的なコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、2020年06月28日に中国専利局に提出された出願番号が202010600582.2である中国特許出願に対して優先権を主張するものであり、該出願の全ての内容を引用により本発明に援用する。
【0002】
本発明は、インターネット技術分野に関し、特に、クラウドコンピューティングおよびクラウドプラットフォームの技術分野に関する。具体的には、データ処理方法、装置、機器および記憶媒体に関する。
【背景技術】
【0003】
現在、検索、推薦は、ユーザのコンテンツ消費の主流であり、イメージテキストコンテンツでも、ショートムービー、短時間動画およびロングムービー等の新しいメディアコンテンツでも、検索、推薦等の方式でユーザに効率的に配布するために、これらの超大規模の大量データを記憶してインデックス化する必要がある。コンテンツデータの急速な増加に伴い、従来のデータ管理方式の拡張可能性が制約され、より高い機械コスト、より高い運用維持コストによりネット上の高使用可能性および高性能を確保する必要がある。
【発明の概要】
【発明が解決しようとする課題】
【0004】
以下は、本文について詳細に説明する主題の概要である。本概要は、特許請求の範囲を制限するものではない。
【0005】
本発明は、データ処理用の方法、装置、機器および記憶媒体を提供する。
【課題を解決するための手段】
【0006】
本発明の一態様によれば、
シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライス(shard,シャード)の物理アドレスである第1物理アドレスを確定することと、
前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートすることと、を含む、
データ処理方法を提供する。
【0007】
本発明の一態様によれば、
第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定することと、
前記第1物理アドレスに基づいて前記第1データをソートすることと、を含む、
データ処理方法を提供する。
【0008】
本発明の一態様によれば、
シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定するための第1アドレス確定モジュールと、
前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートするための第1アドレス送信モジュールと、を備える、
データ処理装置を提供する。
【0009】
本発明の一態様によれば、
第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定するための論理情報送信モジュールと、
前記第1物理アドレスに基づいて前記第1データをソートするためのデータソートモジュールと、を備える、
データ処理装置を提供する。
【0010】
第5態様によれば、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されたメモリと、を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、
前記命令は、前記少なくとも1つのプロセッサが本発明の実施例のいずれか1項に記載のデータ処理方法を実行可能であるように、前記少なくとも1つのプロセッサにより実行される、
電子機器を提供する。
【0011】
第6態様によれば、本発明の実施例のいずれか1項に記載のデータ処理方法をコンピュータに実行させるために用いられるコンピュータ命令が記憶された、
非一時的なコンピュータ可読記憶媒体を提供する。
【発明の効果】
【0012】
本発明の実施例の技術により、データ処理の効率を向上させることができる。
【0013】
本発明に記載された内容は、本発明の実施例のキーとなるまたは重要な特徴を標識するためのものではなく、本発明の範囲を限定するものでもないことが理解されるべきである。本発明の他の特徴は、以下の明細書により容易に理解することができる。図面および詳細な説明を閲読し理解することで、他の態様も理解できる。
【図面の簡単な説明】
【0014】
図面は本形態をより良く理解するためのものであり、本発明を限定するものではない。
【0015】
【
図1a】本発明の実施例に係るデータ処理方法のフローチャートである。
【
図1b】本発明の実施例に係る物理リソースプールの構造模式図である。
【
図2a】本発明の実施例に係るデータ処理方法のフローチャートである。
【
図2b】本発明の実施例に係るデータ処理側の構造模式図である。
【
図3a】本発明の実施例に係るデータ処理方法のフローチャートである。
【
図3b】本発明の実施例に係るデータ処理側の構造模式図である。
【
図4】本発明の実施例に係るデータ処理方法のフローチャートである。
【
図5】本発明の実施例に係るデータ処理方法のフローチャートである。
【
図6】本発明の実施例に係るデータ処理装置の構造模式図である。
【
図7】本発明の実施例に係るデータ処理装置の構造模式図である。
【
図8】本発明の実施例に係るデータ処理システムの構造模式図である。
【
図9】本発明の実施例を実現するためのデータ処理方法の電子機器のブロック図である。
【発明を実施するための形態】
【0016】
以下、図面を参照しながら本発明の例示的な実施例について説明し、ここで、理解を容易にするために、本発明の実施例の様々な詳細を含み、それらが例示的なものに過ぎないと見なされるべきである。従い、当業者は、本発明の範囲および精神から逸脱することなく、ここで記載される実施例に対して様々な変更および修正を行うことができることを認識すべきである。それと同様に、明瞭かつ簡単にするために、以下の記述において公知の機能および構造についての説明を省略する。
【0017】
図1aは、本発明の実施例に係るデータ処理方法のフローチャートである。本実施例は、データのリソース占有率を向上させる場合に適用できる。本実施例で開示されたデータ処理方法は、電子機器により実行でき、具体的に、データ処理装置により実行でき、該装置は、ソフトウェアおよび/またはハードウェアの方式で実現でき、電子機器に設定されている。
図1aを参照し、本実施例に係るデータ処理方法は、以下のステップを含む。
【0018】
S110において、シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定する。
【0019】
ここで、シーケンサは、検索エンジンまたは推薦エンジンにおけるソートモジュールであってもよく、ユーザアクセス要求に応答してデータをリコールし、リコールしたデータをソートするために用いられる。リコールを容易にするために、第1データは、トラフィックコンテンツのフォワードインデックスデータまたは転置インデックスデータであってもよい。ここで、第1データの論理情報は、第1データの属するトラフィック分野におけるトラフィックカテゴリ情報であってもよい。商品および小説のようなトラフィック分野を例とし、商品は、購入、文章および有名人画像のようなトラフィックカテゴリを含んでもよく、小説も、ファンタジー、武侠および恋愛のようなトラフィックカテゴリを含んでもよい。
【0020】
本発明の実施例において、各トラフィック分野は、一意のダミーデータグループ(data group)を有することができ、且つ、トラフィック分野における異なるトラフィックカテゴリに異なる物理データグループをそれぞれ構築することができ、即ち、1つのダミーデータグループに複数の物理データグループが関連付けられてもよい。物理データグループは、関連するトラフィックカテゴリにおけるコンテンツデータを記憶するために用いられ、ダミーデータグループは論理的な概念であり、トラフィック分野における各トラフィックカテゴリの整理データ量を見やすいためのものであり、具体的なコンテンツデータがない。
【0021】
物理データグループのデータ量に基づき、1つの物理データグループは、1つのデータスライス(data shard)を含んでもよいし、複数のデータスライスを含んでもよく、各データスライスは、1セットのインデックスデータを記憶するために用いられる。データスライスに実際の物理記憶領域および計算されたCPU論理コアを割り当てることができ、データスライスは、独立してサービスを提供可能な最小単位である。なお、データスライスに割り当てられた物理記憶領域の物理アドレスは、データスライスの物理アドレスであり、例えば、データスライスが位置する物理記憶領域のid識別子およびIP(Internet Protocol、インターネットプロトコル)アドレスであってもよい。
【0022】
具体的には、シーケンサは、ユーザアクセス要求に応じてアクセス待ち第1データの論理情報を確定し、第1データの論理情報をデータ処理側に送信することができ、データ処理側は、第1データに関連する物理データグループを確定し、該物理データグループ内のデータスライスの物理アドレスを第1物理アドレスとする。ダミーデータグループ、物理データグループおよびデータスライスのような新しいデータ形態を提出し、新しいデータ形態間の関連関係を確定することにより、データの処理過程を簡略化してデータ処理効率を向上させることができる。且つ、その後のデータの動的なリソース調整が容易となり、リソース利用率を向上させることができる。
【0023】
S120において、前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートする。
【0024】
ここで、第1物理アドレスは、第1データに関連する物理データグループ内の1つのデータスライスの物理アドレスであってもよいし、複数のデータスライスの物理アドレスであってもよい。具体的には、シーケンサは、第1物理アドレスに関連するデータ記憶領域にアクセスして第1データをリコールし、リコールした第1データをソートすることができる。
【0025】
図1bは、本発明の実施例に係る物理リソースプールの構造模式図である。
図1bを参照し、物理リソースプールは、複数のデータ記憶領域(data store)を備えてもよく、1つのデータ容器(container)は、1つのデータ記憶領域を実行してもよいし、複数のデータ記憶領域を実行してもよい。リソースの異なる割り当てポリシーに基づき、1つのデータ記憶領域は、1つのデータスライスを記憶してもよいし、複数のデータスライスを記憶してもよく、且つ、記憶された複数のデータスライスは、異なる物理データグループに属してもよい。なお、データの記憶とデータ容器とがデカップリングされているため、データの動的管理が実現され、手動操作に依存する必要がなく、人件費が低下する。
【0026】
1つの好ましい実施形態において、同一の前記物理データグループ内のデータスライスは異なるデータ記憶領域に記憶され、同一の前記データ記憶領域に異なる前記物理データグループ内のデータスライスが記憶されている。アフィニティポリシーを採用することにより、データスライスを物理データグループに割り当てることは、データパケットまたはデータ記憶領域の制約を受ける必要がなく、リソース自体からデータ記憶領域をデータスライスに割り当てればよく、データ処理の利便性を向上させることができる。
【0027】
本発明の実施例の技術案は、新しいデータ形態でデータを処理し、データ処理の利便性を向上させ、データのリソース利用率を向上させることができる。
【0028】
図2aは、本発明の実施例に係るデータ処理方法のフローチャートである。本実施例は、上記実施例の基に提出された1つの好ましい形態である。
図2aを参照し、本実施例に係るデータ処理方法は、以下のステップを含む。
【0029】
S210において、データコントローラにより、前記シーケンサから取得された第1データの論理情報に基づいて前記第1データのメタデータを確定し、前記第1データのメタデータを前記シーケンサに送信する。
【0030】
図2bは、本発明の実施例に係るデータ処理側の構造模式図である。
図2bに示すように、データ処理側は、データコントローラ(data control panel)およびデータベースを備えてもよく、ここで、データコントローラは、物理データグループおよびデータスライスを管理するために使用でき、例えば、1つの物理データグループをいくつのデータスライスに分割する必要があるか、1つのデータスライスに必要な記憶リソースおよび計算リソースがいくつであるか。データ量、流量を調整する時、データコントローラは最適な割り当て形態を確定することができ、最適な割り当て形態に基づいて物理リソースの配置調整を動的に調整することが容易となる。具体的には、データコントローラは、DCP SDK(Software Development Kit、ソフトウェア開発キット)を介してインデックスデータ要求部分(例えば、シーケンサ)とインデックスデータ構築部分(例えば、以下のデータビルダ)と通信し、物理データグループ内のデータスライスの調整を行い、ユーザ要求と物理データグループとの関連関係を管理することができる。
【0031】
ここで、第1データのメタデータは第1データのメタデータ論理情報であってもよく、第1データのメタデータは異なり、第1データスライスは異なってもよく、即ち、第1物理アドレスは異なる。
【0032】
1つの好ましい実施形態において、第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である。具体的には、初期化過程において、物理データグループに関連するトラフィックカテゴリの推定データ量に基づき、物理データグループにn1個のデータスライスを割り当て、データ量の動的調整またはアクセス量の動的調整に伴い、該物理データグループ内のデータスライスをn2個に調整し、即ち、該物理データグループは2つの異なるデータスライスのバージョン情報を有する。なお、本発明の実施例は、物理データグループのデータスライスのバージョン数を具体的に限定せず、最新バージョンに準じてもよいし、全量バージョンと増分バージョンと合わせて使用してもよい。データスライスのバージョン情報により、データリソースの動的調整過程においてデータのリソースを迅速に確定することが容易となり、データの処理効率を向上させることができる。
【0033】
具体的には、データコントローラは、シーケンサから第1データの論理情報を取得し、予め設定された論理情報と物理データグループとの間の関連関係に基づき、第1データに関連する物理データグループ(第1物理データグループと略称できる)を確定し、第1物理データグループのメタデータを確定する。
【0034】
S220において、データベースにより、前記シーケンサから取得された第1データのメタデータに基づいて前記第1物理アドレスを確定する。
【0035】
図2bを参照し、データベースは、ダミーデータグループと物理データグループとデータスライスと物理アドレスとの間の関連関係、およびデータの論理情報とデータのメタデータとデータの物理アドレスとの間の関連関係を記憶するために用いられる。メタデータまたは論理情報を物理データとデータコントローラからデカップリングすることにより、データベースを介してリソースを迅速に管理することが容易となり、例えば、データベースを介してダミーデータグループのデータ量を迅速にクエリし、物理データグループ内の最新バージョンのデータスライスおよび最新バージョンのデータスライスの物理アドレスを迅速に取得する。
【0036】
具体的には、第1データのメタデータとデータベースに記憶された関連関係とをマッチングして第1物理アドレスを取得する。
【0037】
S230において、前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートする。
【0038】
本発明の実施例の技術案は、データコントローラとデータベースとの協働により、データ処理効率を更に向上させることができる。
【0039】
図3aは、本発明の実施例に係るデータ処理方法のフローチャートである。本実施例は、上記実施例の基に提出された1つの好ましい形態である。
図3aを参照し、本実施例に係るデータ処理方法は、以下のステップを含む。
【0040】
S310において、シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定する。
【0041】
S320において、前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートする。
【0042】
1つの好ましい実施形態において、前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、前記シーケンサによって前記増分物理アドレスおよび前記全量物理アドレスに基づいて前記第1データをソートするために用いられる。ここで、増分データスライスは、ホットスポットデータが割り当てる新しいデータスライスであってもよい。ホットスポットデータを新しいデータスライスに書き込むことにより、物理データグループ全体のデータ引き継ぎを行う必要がない。オンラインでアクセスするおよびオフラインでデータを構築する時、ホットスポットデータの物理アドレスを返し、シーケンサは、増分データスライスに優先的にアクセスすることができ、ホットスポットデータのアクセス効率を向上させる。且つ、非ホットスポットデータのコピー数を減少し、リソース占有を減少することができる。
【0043】
S330において、データビルダから取得された第2データの論理情報に基づき、前記第2データに関連する物理データグループ内のデータスライスの物理アドレスである第2物理アドレスを確定する。
【0044】
ここで、データビルダは、インデックスコンテンツビルダであってもよく、第2データの論理情報は、トラフィックカテゴリ情報であってもよい。具体的には、データビルダがトラフィック側から第2データ(即ち、トラフィックデータ)を取得してからデータ処理側に送信する第2データの論理情報は、第2データの属するトラフィック分野におけるトラフィックカテゴリ情報であってもよい。第2データは第1データであってもよいし、他のデータであってもよい。
【0045】
S340において、前記第2物理アドレスを前記データビルダに送信し、前記データビルダによって前記第2物理アドレスに基づいて前記第2データを書き込む。
【0046】
ここで、第2物理アドレスは、第2データに関連する物理データグループ(第2物理データグループと略称される)内の1つのデータスライスの物理アドレスであってもよいし、複数のデータスライスの物理アドレスであってもよい。具体的には、データビルダは、トラフィックデータに対してデータ解析、データフォーマット変換、ポリシー計算およびフィールド重み確定のような処理を行ってトラフィックデータのインデックスデータを取得し、インデックスデータを第2物理アドレスに関連するデータ記憶領域に書き込む。なお、第2物理アドレスは、複数のデータスライスの物理アドレスを有してもよく、ロードバランシングに基づいてインデックスデータを第2物理データグループの少なくとも1つのデータスライスに書き込むことができる。
【0047】
物理データグループ、データスライスのような新しいデータ形態に基づいてインデックスデータを書き込むことにより、インデックスデータの書き込む効率を向上させ、インデックスデータのアクセス効率を向上させることができる。なお、S310およびS320はデータアクセス動作で、S330およびS340はデータ構築動作であり、データアクセス動作とデータ構築動作との間は、トラフィックニーズに応じて協働して実行してもよい。
【0048】
1つの好ましい実施形態において、S330は、記憶コントローラにより、前記データビルダから取得された第2データの論理情報に基づいて前記第2データのメタデータを確定し、前記第2データのメタデータを前記データビルダに送信することと、データベースにより、前記データビルダから取得された第2データのメタデータに基づいて前記第2物理アドレスを確定することとを含む。
【0049】
図3bは、本発明の実施例に係るデータ処理側の構造模式図である。
図3bに示すように、データ処理側は、データコントローラ、データベースおよび記憶コントローラ(store control panel)を備えてもよく、ここで、記憶コントローラは、データコントローラのリソース割り当て形態に基づいて物理リソースの配置調整を動的に行うために用いられる。データコントローラでリソース割り当てを行い、記憶コントローラはリソース割り当てに応じて物理リソースを調整し、データベースは、リソース割り当て形態および物理リソース形態を記憶するために用いられ、即ち、データ制御ポリシーと、データ物理割り当てとメタデータとをデカップリングし、データ処理効率を更に向上させることができ、トラフィックは物理記憶に関心を持つ必要がなくなる。
【0050】
1つの好ましい実施形態において、第2データのメタデータは、前記第2データに関連する物理データグループ内のデータスライスのバージョン情報である。
【0051】
なお、トラフィック分野またはトラフィック分野におけるトラフィックカテゴリの初期化過程において、データコントローラはリソース割り当て形態を確定し、即ち、トラフィック分野のダミーデータグループ情報を確定し、ダミーデータグループに物理データグループを割り当て、物理データグループにデータスライスを割り当て、記憶コントローラは、リソース割り当て形態に応じて物理リソースを配置し、即ち、データスライスの物理アドレスを確定する。且つ、リソース割り当て形態および物理リソース配置情報、即ち、ダミーデータグループと物理データグループとデータスライスと物理アドレスとの間の関連関係を、ビルダまたはシーケンサが使用するようにデータベースに書き込む。
【0052】
本発明の実施例の技術案は、データ処理側がそれぞれシーケンサとデータビルダと協働し、ダミーデータグループ、物理データグループおよびデータスライス等のデータ形態でデータアクセスおよびデータ構築を行うことにより、データ処理の効率を向上させ、且つ、データ処理の利便性を向上させることができる。
【0053】
図4は、本発明の実施例に係るデータ処理方法のフローチャートである。
図4を参照し、本実施例に係るデータ処理方法は、以下のステップを含む。
【0054】
S410において、シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定する。
【0055】
S420において、前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートする。
【0056】
S430において、データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新する。
【0057】
データのリソース利用率または流量に基づき、データ記憶リソース調整イベントを生成するか否かを確定する。具体的には、取得されたデータ記憶領域のリソース利用率、データスライスのリソース利用率およびデータの人気度に基づき、物理リソースの拡張または縮小を行うか否かを確定する。データ処理側がデータコントローラ、データベースおよび記憶コントローラを備える場合、データコントローラはリソース調整形態を確定するために使用でき、記憶コントローラはリソース調整形態に応じて物理リソースを配置するために用いられる。データリソースを動的に更新することにより、データ規模が変化し、ユーザの消費流量が変化した場合、柔軟な適応を実現でき、システムの高使用可能性および高性能を確保した前提で、人力を投入する必要がなく、機械コストの大幅な低減を実現できる。
【0058】
1つの好ましい実施形態において、S430は、前記物理データグループ内の元のデータスライスのリソース利用率が第1リソース利用率の閾値よりも大きいことを検出した場合、前記物理データグループ内の元のデータスライスのために関連する新しいデータスライスを作成することと、前記元のデータスライス内のデータを前記元のデータスライスおよび前記新しいデータスライス内に分け、かつ、前記元のデータスライスおよび前記新しいデータスライスの物理アドレスのそれぞれを前記物理データグループ内のデータスライスの物理アドレスとすることとを含む。
【0059】
ここで、第1リソース利用率の閾値はリソース利用率の上限値であり、予め設定でき、例えば、85%であってもよい。物理データグループ内の元のデータスライスのリソース利用率が第1リソース利用率の閾値よりも大きいことを検出した場合、物理データグループのデータスライスを増加する。低コストのサービスを停止しないデータ引き継ぎを実現するために、データスライス数を倍数で拡張し、即ち、新しいデータスライス数が元のデータスライス数の整数倍であり、且つ、各元のデータスライスには、少なくとも1つの新しいデータスライスが関連付けられている。元のデータスライス内のデータを元のデータスライスおよび関連する新しいデータスライスに分けることにより、元のデータスライス内のいずれかのデータが更新された時、該データと該データの更新したデータとを共に同一のデータスライスに書き込むことができ、該データと該データの更新したデータとを異なるデータスライスに書き込むことによるデータバージョンの乱れを回避し、シーケンサは、重複除去動作を実行する必要がなく、即ち、シーケンサを簡略化する。
【0060】
データ引き継ぎ、即ち、データスライス拡張過程において、データビルダが新しいコンテンツデータを生成すると、新しいコンテンツデータをダブルライトし、即ち、新しいコンテンツデータを元のデータスライスと新しいデータスライスとの両方に書き込む。これにより、元のデータスライスと新しいデータスライスとの両方にいずれも新しいコンテンツデータがあり、即ち、データ引き継ぎ過程中およびデータ引き継ぎ終了後、いずれも新しいコンテンツデータにアクセスすることができる。なお、データ引き継ぎが終了すると、元のデータスライスおよび新しいデータスライスの物理アドレスのそれぞれを物理データグループ内のデータスライスの物理アドレスとし、即ち、物理データグループ内のデータスライスのバージョン情報を更新する。
【0061】
1つの好ましい実施形態において、S430は、前記物理データグループ内のデータスライスのリソース利用率が第2リソース利用率の閾値よりも小さいことを検出した場合、前記物理データグループ内の少なくとも1つのデータスライスのデータを前記物理データグループ内の他のデータスライスに統合し、かつ、前記物理データグループ内のデータスライスの物理アドレスから前記少なくとも1つのデータスライスの物理アドレスを削除することを含む。
【0062】
ここで、第2リソース利用率の閾値はリソース利用率の下限値であり、第1リソース利用率の閾値よりも小さい。物理データグループ内のデータスライスのリソース利用率が第2リソース利用率の閾値よりも小さいことを検出した場合、物理データグループ内の少なくとも1つのデータスライスのデータを物理データパケット内の他のデータスライスに統合し、かつ、物理データグループのデータスライス数を削減し、物理データグループのリソース占有を減少する。
【0063】
なお、データ引き継ぎ(即ち、データスライスの拡張または縮小)が終了すると、物理データグループ内のデータスライスの物理アドレスを調整し、対応して物理データグループ内のデータスライスのバージョン情報を更新する。
【0064】
1つの好ましい実施形態において、S430は、前記物理データパケットにホットスポットデータが存在する場合、前記データ記憶リソース調整イベントを検出したことと、前記物理データグループのために増分データスライスを作成し、前記ホットスポットデータを前記増分データスライスに書き込み、かつ、前記物理データグループ内の元のデータスライスを前記物理データグループの全量データスライスとすることと、前記物理データグループ内の前記増分データスライスの物理アドレスを追加することとを含む。
【0065】
ホットスポットデータを新しいデータスライスに書き込むことにより、物理データグループ全体のデータ引き継ぎを行う必要がない。オンラインでアクセスするおよびオフラインでデータを構築する時、データコントローラおよび記憶コントローラはホットスポットデータを検出し、ホットスポットデータの物理アドレスを返し、物理データグループ内の全量データの物理アドレスを返す必要がなく、アクセスおよび書き込みの効率を向上させる。且つ、非ホットスポットデータのコピー数を減少し、リソース占有を減少することができる。ある人気のあるファンタジー小説を例とし、ファンタジー小説に関連する物理データグループで該人気のあるファンタジー小説のために増分データスライスを構築し、該流行ファンタジー小説のアクセス効率を向上させることができる。
【0066】
1つの好ましい実施形態において、S430は、データ記憶領域のリソース利用率が第3リソース利用率の閾値よりも大きいことを検出した場合、新しいデータ記憶領域を作成することと、前記新しいデータ記憶領域で前記物理データグループの新しいデータスライスを作成し、前記新しいデータ記憶領域の物理アドレスを前記物理データグループ内の新しいデータスライスの物理アドレスとすることとを含む。
【0067】
ここで、第3リソース利用率の閾値はリソース利用率の上限値である。具体的には、データ記憶領域のリソースが少ないことを検出した場合、即ち、物理データグループに必要な物理記憶空間が、現在のデータ記憶領域が実際に提供可能な記憶空間の閾値を超えている場合、記憶コントローラは、新しいデータ記憶領域を動的に拡張し、動的データの再バランスを取り、データ記憶領域の動的調整を実現することができる。
【0068】
本発明の実施例の技術案は、データ規模またはユーザ流量が変化した場合、柔軟な適応性によりデータ調整を行うことで、データリソース利用率を向上させ、機械コストを低減する。
【0069】
図5は、本発明の実施例に係るデータ処理方法のフローチャートである。本実施例は、データアクセス効率を向上させる場合に適用できる。本実施例で開示されたデータ処理方法は、電子機器により実行でき、具体的には、データ処理装置により実行でき、該装置は、ソフトウェアおよび/またはハードウェアの方式で実現でき、電子機器に設定される。
図5を参照し、本実施例に係るデータ処理方法は、以下のステップを含む。
【0070】
S510において、第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定する。
【0071】
ここで、第1データの論理情報は、第1データの属するトラフィック分野におけるトラフィックカテゴリ情報であってもよい。商品および小説のようなトラフィック分野を例とし、商品は、購入、文章および有名人画像のようなトラフィックカテゴリを含んでもよく、小説も、ファンタジー、武侠および恋愛のようなトラフィックカテゴリを含んでもよい。
【0072】
具体的には、ユーザアクセス要求に応答して第1データの論理情報を確定し、前記第1データの論理情報をデータ処理側に送信してもよい。
【0073】
1つの好ましい実施形態において、S510は、前記第1データの論理情報を前記データ処理側におけるデータコントローラに送信し、前記データコントローラによって前記第1データの論理情報に基づいて前記第1データのメタデータを確定することと、前記第1データのメタデータを前記データ処理側におけるデータベースに送信し、前記データベースによって前記第1データのメタデータに基づいて前記第1物理アドレスを確定することとを含んでもよい。
【0074】
ここで、第1データのメタデータは第1データのメタデータ論理情報であってもよく、第1データのメタデータは異なり、第1データスライスは異なってもよく、即ち、第1物理アドレスは異なる。
【0075】
1つの好ましい実施形態において、前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である。具体的には、物理データグループの物理リソースの再調整後の度に、物理データグループ内のデータスライスのバージョン情報を更新する。
【0076】
S520において、前記第1物理アドレスに基づいて前記第1データをソートする。
【0077】
1つの好ましい実施形態において、前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、それに対応し、S520は、前記増分物理アドレスに基づいて前記第1データを取得し、取得に失敗した場合、前記全量物理アドレスに基づいて前記第1データを取得することと、取得した第1データをソートすることとを含む。
【0078】
具体的には、第1データがホットスポットデータである場合、第1データに増分データスライスを予め構築し、シーケンサは、増分データスライスに優先的にアクセスし、増分データスライスから第1データを取得することに失敗した場合、全量データスライスに再びアクセスする。増分データスライスから第1データを取得することが成功した場合、全量データスライスに再びアクセスする必要がなく、データアクセス効率を向上させる。なお、第1物理アドレスは、増分データスライスの増分物理アドレスのみを含んでもよい。
【0079】
本発明の実施例の技術案において、シーケンサは新しいデータ形態間の関係に基づいてデータにアクセスし、データアクセス効率を向上させることができ、且つ、ホットスポットデータの増分データスライスに優先的にアクセスすることにより、ホットスポットデータのアクセス効率を向上させ、リソース占有を低減することができる。
【0080】
図6は、本発明の実施例に係るデータ処理装置の構造模式図である。
図6を参照し、本発明の実施例はデータ処理装置600を開示し、該装置600は、データ処理側に設定でき、該装置600は、
シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定するための第1アドレス確定モジュール601と、
前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートするための第1アドレス送信モジュール602と、
を備えてもよい。
【0081】
好ましくは、同一の前記物理データグループ内のデータスライスは異なるデータ記憶領域に記憶され、同一の前記データ記憶領域に異なる前記物理データグループ内のデータスライスが記憶されている。
【0082】
好ましくは、第1アドレス確定モジュール601は、
データコントローラにより、前記シーケンサから取得された第1データの論理情報に基づいて前記第1データのメタデータを確定し、前記第1データのメタデータを前記シーケンサに送信するための第1メタデータユニットと、
データベースにより、前記シーケンサから取得された第1データのメタデータに基づいて前記第1物理アドレスを確定するための第1アドレス確定ユニットと、
を備える。
【0083】
好ましくは、前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である。
【0084】
好ましくは、前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、前記シーケンサによって前記増分物理アドレスおよび前記全量物理アドレスに基づいて前記第1データをソートするために用いられる。
【0085】
好ましくは、前記装置600は、
データビルダから取得された第2データの論理情報に基づき、前記第2データに関連する物理データグループ内のデータスライスの物理アドレスである第2物理アドレスを確定するための第2アドレス確定モジュールと、
前記第2物理アドレスを前記データビルダに送信し、前記データビルダによって前記第2物理アドレスに基づいて前記第2データを書き込むための第2アドレス送信モジュールと、
を更に備える。
【0086】
好ましくは、第2アドレス確定モジュールは、
記憶コントローラにより、前記データビルダから取得された第2データの論理情報に基づいて前記第2データのメタデータを確定し、前記第2データのメタデータを前記データビルダに送信するための第2メタデータユニットと、
データベースにより、前記データビルダから取得された第2データのメタデータに基づいて前記第2物理アドレスを確定するための第2アドレス確定ユニットと、
を備える。
【0087】
好ましくは、前記装置600は、
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新するためのリソース調整モジュールを更に備える。
【0088】
好ましくは、リソース調整モジュールは、具体的に、
前記物理データグループ内の元のデータスライスのリソース利用率が第1リソース利用率の閾値よりも大きいことを検出した場合、前記物理データグループ内の元のデータスライスのために関連する新しいデータスライスを作成することと、
前記元のデータスライス内のデータを前記元のデータスライスおよび前記新しいデータスライス内に分け、かつ、前記元のデータスライスおよび前記新しいデータスライスの物理アドレスのそれぞれを前記物理データグループ内のデータスライスの物理アドレスとすることと、
に用いられる。
【0089】
好ましくは、リソース調整モジュールは、具体的に、
前記物理データグループ内のデータスライスのリソース利用率が第2リソース利用率の閾値よりも小さいことを検出した場合、前記物理データグループ内の少なくとも1つのデータスライスのデータを前記物理データグループ内の他のデータスライスに統合し、かつ、前記物理データグループ内のデータスライスの物理アドレスから前記少なくとも1つのデータスライスの物理アドレスを削除すること、
に用いられる。
【0090】
好ましくは、リソース調整モジュールは、具体的に、
前記物理データパケットにホットスポットデータが存在する場合、前記データ記憶リソース調整イベントを検出したことと、
前記物理データグループのために増分データスライスを作成し、前記ホットスポットデータを前記増分データスライスに書き込み、かつ、前記物理データグループ内の元のデータスライスを前記物理データグループの全量データスライスとすることと、
前記物理データグループ内の前記増分データスライスの物理アドレスを追加することと、
に用いられる。
【0091】
好ましくは、リソース調整モジュールは、具体的に、
データ記憶領域のリソース利用率が第3リソース利用率の閾値よりも大きいことを検出した場合、新しいデータ記憶領域を作成することと、
前記新しいデータ記憶領域で前記物理データグループの新しいデータスライスを作成し、前記新しいデータ記憶領域の物理アドレスを前記物理データグループ内の新しいデータスライスの物理アドレスとすることと、
に用いられる。
【0092】
本発明の実施例の技術案は、データ処理側がそれぞれシーケンサおよびデータビルダと協働し、ダミーデータグループ、物理データグループおよびデータスライス等のデータ形態でデータアクセスおよびデータ構築を行うことにより、データ処理の効率を向上させ、且つ、データ処理の利便性を向上させることができる。且つ、データ規模またはユーザ流量が変化した場合、柔軟な適応性によりデータ調整を行うことで、データリソース利用率を向上させ、機械コストを低減する。
【0093】
図7は、本発明の実施例に係るデータ処理装置の構造模式図である。
図7を参照し、本発明の実施例はデータ処理装置700を開示し、該装置700はシーケンサに設定でき、該装置700は、
第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定するための論理情報送信モジュール701と、
前記第1物理アドレスに基づいて前記第1データをソートするためのデータソートモジュール702と、
を備えてもよい。
【0094】
好ましくは、論理情報送信モジュール701は、
前記第1データの論理情報を前記データ処理側におけるデータコントローラに送信し、前記データコントローラによって前記第1データの論理情報に基づいて前記第1データのメタデータを確定するための論理情報送信ユニットと、
前記第1データのメタデータを前記データ処理側におけるデータベースに送信し、前記データベースによって前記第1データのメタデータに基づいて前記第1物理アドレスを確定するためのメタデータ送信ユニットと、
を備える。
【0095】
好ましくは、前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である。
【0096】
好ましくは、前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含む。
【0097】
それに対応し、データソートモジュール702は、具体的に、前記増分物理アドレスに基づいて前記第1データを取得し、取得に失敗した場合、前記全量物理アドレスに基づいて前記第1データを取得することと、取得した第1データをソートすることとに用いられる。
【0098】
本発明の実施例の技術案において、シーケンサは、新しいデータ形態間の関係に基づいてデータにアクセスし、データアクセス効率を向上させることができ、且つ、ホットスポットデータの増分データスライスに優先的にアクセスすることにより、ホットスポットデータのアクセス効率を向上させ、リソース占有を低減することができる。
【0099】
図8は、本発明の実施例に係るデータ処理システムの構造模式図である。
図8を参照し、データ処理システムは、シーケンサと、データビルダと、データ処理側と、物理リソースプールと、容器管理装置とを備え、データ処理側は、データコントローラと、データベースと、記憶コントローラとを備える。
【0100】
ここで、シーケンサは、検索エンジンまたはプッシュエンジンにおけるソートモジュールであってもよく、データビルダは、コンテンツデータ、即ち、インデックスデータを構築するために用いられる。容器管理装置は、データ容器を管理するために用いられる。
【0101】
トラフィック分野の初期化過程において、データコントローラは、トラフィック分野のためにダミーデータグループを構築し、トラフィック分野におけるトラフィックカテゴリ毎に一意の物理データグループをそれぞれ構築し、該トラフィックカテゴリのデータ量に基づいてデータスライスを該トラフィックカテゴリに関連する物理データグループに割り当てる。データコントローラは、上記リソース割り当て情報をデータベースに書き込むことができ、記憶コントローラはデータベースにおけるリソース割り当て情報に基づいて物理リソースを配置し、具体的には、記憶コントローラは容器管理装置と協働してリソース割り当て情報における各データスライスのデータ記憶領域を確定し、即ち、各データスライスの物理アドレスを確定し、後のデータ書き込みまたはデータアクセスが使用するように物理リソース配置情報をデータベースに書き込んでもよい。
【0102】
データ書き込みの段階において、コンテンツビルダは、書き込み待ちデータの論理情報を記憶コントローラに送信し、記憶コントローラは、書き込み待ちデータのメタデータ、例えば、書き込み待ちデータに関連する物理スライスのバージョン情報を返す。コンテンツビルダはメタデータを用いてデータベースから書き込み待ちデータの物理アドレスを取得し、即ち、書き込み待ちデータに関連する物理データグループ内の各データスライスの物理アドレスを取得する。コンテンツビルダは、ロードバランシングに基づき、各データスライスの物理アドレスに応じて書き込み待ちデータをいずれかのデータスライスに書き込む。
【0103】
データアクセスの段階において、シーケンサは、アクセス待ちデータの論理情報をデータコントローラに送信し、データコントローラは、アクセス待ちデータのメタデータ、例えば、アクセス待ちデータに関連する物理スライスのバージョン情報を返す。シーケンサは、メタデータを用いてデータベースからアクセス待ちデータの物理アドレスを取得し、該物理アドレスを用いてアクセス待ちデータをリコールし、リコールしたデータをソートする。
【0104】
データコントローラまたは記憶コントローラは、データリソースを拡張または縮小する必要があることを検出した場合、具体的には、物理データパケット内のデータスライスのリソース利用率が上限に達したことを検出した場合、物理データグループのためにデータスライスを増加し、物理データパケット内のデータスライスのリソース利用率が下限よりも小さいことを検出した場合、物理データグループのためにデータスライスを削減し、データ記憶空間が不足であることを検出した場合、新しいデータ記憶領域を追加してもよい。
【0105】
データ管理と物理記憶とのデカップリングにより、データのクラウドネイティブアーキテクチャおよび完全な自動的なデータ管理方式を実現し、機械コストの低減および運用維持コストの大幅な低減を実現する。データの特徴に基づき、オンラインアクセスの実際のニーズに応じて適当な記憶媒体および記憶管理方式を選択し、データ規模、ユーザ消費流量が大きく変化した場合、柔軟な適応性によりデータ調整を行い、システムの高使用可能性および高性能を確保した前提で、手動操作に依存する必要がなく、機械コストの大幅な低減を実現できる。
【0106】
本発明の実施例の技術案は、データ処理側がそれぞれシーケンサとデータビルダと協働し、ダミーデータグループ、物理データグループおよびデータスライス等のデータ形態でデータアクセスおよびデータ構築を行うことにより、データ処理の効率を向上させ、且つ、データ処理の利便性を向上させることができる。且つ、データ規模またはユーザ流量が変化した場合、マルチソースの異種シナリオで、流量およびデータ量の大きな違いの前で、柔軟な適応性によりデータ調整を行うことで、データリソース利用率を向上させ、機械コストを低減する。
【0107】
本発明の実施例によれば、本発明は、電子機器および可読記憶媒体を更に提供する。
【0108】
図9に示すように、本発明の実施例によるデータ処理の方法の電子機器のブロック図である。電子機器は、ラップトップ型コンピュータ、デスクトップ型コンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレーム、および他の適切なコンピュータのような様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、携帯端末、携帯電話、スマートフォン、ウェララブル機器および他の類似する計算装置のような様々な形式の移動装置を表すこともできる。本発明に示されたコンポーネント、それらの接続、関係、およびそれらの機能は例示的なものに過ぎず、本発明に記載および/または要求される本発明の実現を限定するものではない。
【0109】
図9に示すように、該電子機器は、1つまたは複数のプロセッサ901と、メモリ902と、各コンポーネントを接続するように構成される高速インタフェースおよび低速インタフェースを含むインタフェースとを備える。各コンポーネントは、異なるバスで互に接続され、共通のマザーボードに取り付けられるかまたは必要に応じて他の方式で取り付けることができる。プロセッサは、電子機器内で実行される命令を処理することができ、メモリ内またはメモリ上に記憶されて外部の入力/出力装置(例えば、インタフェースにカップリングされた表示機器)にGUIのグラフィクス情報を表示するための命令を含む。他の実施形態において、必要がある場合、複数のプロセッサおよび複数本のバスと、複数のメモリとを共に使用することができる。それと同様に、複数の電子機器に接続することができ、各機器は、一部の必要な動作(例えば、サーバアレイ、ブレードサーバ群、またはマルチプロセッサシステムとする)を提供する。
図9において、1つのプロセッサ901と例とする。
【0110】
メモリ902は、本発明に係る非一時的なコンピュータ可読記憶媒体である。ここで、本発明に係るデータ処理の方法を前記少なくとも1つのプロセッサに実行させるために、前記メモリには少なくとも1つのプロセッサにより実行可能な命令が記憶されている。本発明の非一時的なコンピュータ可読記憶媒体はコンピュータ命令を記憶し、該コンピュータ命令は、本発明に係るデータ処理の方法をコンピュータに実行させるために用いられる。
【0111】
メモリ902は、非一時的なコンピュータ可読記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能プログラムおよびモジュール、例えば、本発明の実施例におけるデータ処理の方法に対応するプログラム命令/モジュール(例えば、
図6に示す第1アドレス確定モジュール601および第1アドレス送信モジュール602、また、
図7に示す論理情報送信モジュール701およびデータソートモジュール702)を記憶するように構成されてもよい。プロセッサ901は、メモリ902に記憶された非一時的なソフトウェアプログラム、命令およびモジュールを実行することにより、サーバの各機能アプリケーションおよびデータ処理を実行し、即ち、上記方法実施例におけるデータ処理の方法を実現する。
【0112】
メモリ902は、プログラム記憶エリアおよびデータ記憶エリアを備えてもよく、ここで、プログラム記憶エリアは、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができ、データ記憶エリアは、データ処理の電子機器の使用により作成されたデータ等を記憶することができる。また、メモリ902は、高速ランダムアクセスメモリを含んでもよく、少なくとも1つの磁気ディスク記憶機器、フラッシュメモリ、または他の非一時的な固体記憶機器のような非一時的なメモリを更に含んでもよい。いくつかの実施例において、メモリ902は、プロセッサ901に対してリモートに設けられたメモリを含むことが好ましく、これらリモートメモリは、ネットワークを介してデータ処理の電子機器に接続することができる。上記ネットワークの実例は、インターネット、イントラネット、ローカルエリアネットワーク、移動体通信ネットワークおよびその組み合わせを含んでもよいが、それらに限定されない。
【0113】
データ処理の電子機器は、入力装置903と、出力装置904とを更に備えてもよい。プロセッサ901、メモリ902、入力装置903および出力装置904は、バスまたは他の方式で接続することができ、
図9において、バスを介して接続することを例とする。
【0114】
入力装置903は、入力された数字または文字情報を受信し、データ処理の電子機器のユーザ設定および機能制御に関連するキー信号入力を生成することができ、例えば、タッチパネル、キーパッド、マウス、トラックパッド、タッチパッド、インジケータ、1つまたは複数のマウスボタン、トラックボール、ジョイスティック等の入力装置である。出力装置904は、表示機器、補助照明装置(例えば、LED)、および触覚フィードバック装置(例えば、振動モータ)等を含んでもよい。該表示機器は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、およびプラズマディスプレイを含んでもよいが、これらに限定されない。いくつかの実施形態において、表示機器はタッチパネルであってもよい。
【0115】
ここで説明するシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせで実現できる。これら各実施形態は以下を含んでもよい。1つまたは複数のコンピュータプログラムに実施され、該1つまたは複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行および/または解釈することができ、該プログラマブルプロセッサは、ストレージシステム、少なくとも1つの入力装置、および少なくとも1つの出力装置からデータおよび命令を受信し、且つデータおよび命令を、該ストレージシステム、該少なくとも1つの入力装置、および該少なくとも1つの出力装置に伝送することができる専用または汎用のプログラマブルプロセッサであってもよい。
【0116】
これら計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、且つ、高度なプロセスおよび/またはオブジェクト指向プログラミング言語、および/またはアセンブリ/機械言語を用いてこれら計算プログラムを実施することができる。本発明に使用されるように、「機械可読媒体」および「コンピュータ可読媒体」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するように構成される任意のコンピュータプログラム製品、機器、および/または装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブル論理機器(PLD))を意味し、機械可読信号としての機械命令を受信する機械可読媒体を含む。「機械可読信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するための任意の信号を意味する。
【0117】
ユーザとのインタラクションを提供するために、ここで説明するシステムおよび技術をコンピュータで実施することができ、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)と、ユーザがそれにより入力をコンピュータに提供することができるキーボードおよび指向装置(例えば、マウスまたはトラックボール)とを有する。他の種類の装置は、更にユーザとのインタラクションを提供するように構成されてもよい。例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、且つ、任意の形式(音入力、音声入力または、触覚入力を含む)でユーザからの入力を受信することができる。
【0118】
ここで説明するシステムおよび技術を、バックグラウンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、または中間コンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、またはフロントエンドコンポーネントを含むコンピューティングシステム(例えば、ユーザがそれによりここで説明するシステムおよび技術の実施形態とインタラクションできるグラフィカルユーザインタフェースまたはネットワークブラウザを有するユーザコンピュータ)、またはこのようなバックグラウンドコンポーネント、中間コンポーネント、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムに実施することができる。任意の形式または媒体のデジタルデータ通信(例えば、通信ネットワーク)により、システムのコンポーネントを互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、ブロックチェーンネットワーク、およびインターネットを含む。
【0119】
コンピュータシステムはクライアントおよびサーバを含んでもよい。クライアントとサーバとは、一般的に互いに離れ、且つ、通常、通信ネットワークを介してインタラクションを行う。対応するコンピュータで実行されて互いにクライアント-サーバ関係を持つコンピュータプログラムにより、クライアントとサーバとの関係を生成する。
【0120】
本発明の実施例の技術案は、データ処理側がシーケンサとデータビルダとをそれぞれ協働することにより、ダミーデータグループ、物理データグループおよびデータスライス等のデータ形態でデータアクセスおよびデータ構築を行い、データ処理の効率を向上させることができ、データ処理の利便性を向上させる。且つ、データ規模またはユーザ流量が変化した場合、柔軟な適応性によりデータ調整を行い、データリソース利用率を向上させ、機械コストを低減する。
【0121】
上記具体的な実施形態は、本発明の保護範囲を限定するものではない。当業者は、設計要求および他の要因に基づき、様々な修正、組み合わせ、サブ組み合わせおよび代替が可能であることを理解すべできる。本発明の精神および原則内で行われる任意の修正、均等置換および改良等は、いずれも本発明の保護範囲内に含まれているべきである。
【手続補正書】
【提出日】2021-08-06
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定することと、
前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートすることとを含む、
データ処理方法。
【請求項2】
同一の前記物理データグループ内のデータスライスは異なるデータ記憶領域に記憶され、同一の前記データ記憶領域に異なる前記物理データグループ内のデータスライスが記憶されている、
請求項1に記載の方法。
【請求項3】
シーケンサから取得された第1データの論理情報に基づいて第1物理アドレスを確定することは、
データコントローラにより、前記シーケンサから取得された第1データの論理情報に基づいて前記第1データのメタデータを確定し、前記第1データのメタデータを前記シーケンサに送信することと、
データベースにより、前記シーケンサから取得された第1データのメタデータに基づいて前記第1物理アドレスを確定することとを含む、
請求項1に記載の方法。
【請求項4】
前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である、
請求項3に記載の方法。
【請求項5】
前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、前記シーケンサによって前記増分物理アドレスおよび前記全量物理アドレスに基づいて前記第1データをソートするために用いられる、
請求項1に記載の方法。
【請求項6】
データビルダから取得された第2データの論理情報に基づき、前記第2データに関連する物理データグループ内のデータスライスの物理アドレスである第2物理アドレスを確定することと、
前記第2物理アドレスを前記データビルダに送信し、前記データビルダによって前記第2物理アドレスに基づいて前記第2データを書き込むこととを更に含む、
請求項1に記載の方法。
【請求項7】
データビルダから取得された第2データの論理情報に基づいて第2物理アドレスを確定することは、
記憶コントローラにより、前記データビルダから取得された第2データの論理情報に基づいて前記第2データのメタデータを確定し、前記第2データのメタデータを前記データビルダに送信することと、
データベースにより、前記データビルダから取得された第2データのメタデータに基づいて前記第2物理アドレスを確定することとを含む、
請求項6に記載の方法。
【請求項8】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することを更に含む、
請求項1に記載の方法。
【請求項9】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することは、
前記物理データグループ内の元のデータスライスのリソース利用率が第1リソース利用率の閾値よりも大きいことを検出した場合、前記物理データグループ内の元のデータスライスのために関連する新しいデータスライスを作成することと、
前記元のデータスライス内のデータを前記元のデータスライスおよび前記新しいデータスライス内に分け、かつ、前記元のデータスライスおよび前記新しいデータスライスの物理アドレスのそれぞれを前記物理データグループ内のデータスライスの物理アドレスとすることとを含む、
請求項8に記載の方法。
【請求項10】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することは、
前記物理データグループ内のデータスライスのリソース利用率が第2リソース利用率の閾値よりも小さいことを検出した場合、前記物理データグループ内の少なくとも1つのデータスライスのデータを前記物理データグループ内の他のデータスライスに統合し、かつ、前記物理データグループ内のデータスライスの物理アドレスから前記少なくとも1つのデータスライスの物理アドレスを削除することを含む、
請求項8に記載の方法。
【請求項11】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することは、
前記物理データパケットにホットスポットデータが存在する場合、前記データ記憶リソース調整イベントを検出したことと、
前記物理データグループのために増分データスライスを作成し、前記ホットスポットデータを前記増分データスライスに書き込み、かつ、前記物理データグループ内の元のデータスライスを前記物理データグループの全量データスライスとすることと、
前記物理データグループ内の前記増分データスライスの物理アドレスを追加することとを含む、
請求項8に記載の方法。
【請求項12】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新することは、
データ記憶領域のリソース利用率が第3リソース利用率の閾値よりも大きいことを検出した場合、新しいデータ記憶領域を作成することと、
前記新しいデータ記憶領域で前記物理データグループの新しいデータスライスを作成し、前記新しいデータ記憶領域の物理アドレスを前記物理データグループ内の新しいデータスライスの物理アドレスとすることとを含む、
請求項8に記載の方法。
【請求項13】
第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定することと、
前記第1物理アドレスに基づいて前記第1データをソートすることとを含む、
データ処理方法。
【請求項14】
第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて第1物理アドレスを確定することは、
前記第1データの論理情報を前記データ処理側におけるデータコントローラに送信し、前記データコントローラによって前記第1データの論理情報に基づいて前記第1データのメタデータを確定することと、
前記第1データのメタデータを前記データ処理側におけるデータベースに送信し、前記データベースによって前記第1データのメタデータに基づいて前記第1物理アドレスを確定することと、
を含む、
請求項13に記載の方法。
【請求項15】
前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である、
請求項14に記載の方法。
【請求項16】
前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、
前記第1物理アドレスに基づいて前記第1データをソートすることは、
前記増分物理アドレスに基づいて前記第1データを取得し、取得に失敗した場合、前記全量物理アドレスに基づいて前記第1データを取得することと、
取得した第1データをソートすることとを含む、
請求項13に記載の方法。
【請求項17】
シーケンサから取得された第1データの論理情報に基づき、前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定するための第1アドレス確定モジュールと、
前記第1物理アドレスを前記シーケンサに送信し、前記シーケンサによって前記第1物理アドレスに基づいて前記第1データをソートするための第1アドレス送信モジュールとを備える、
データ処理装置。
【請求項18】
同一の前記物理データグループ内のデータスライスは異なるデータ記憶領域に記憶され、同一の前記データ記憶領域に異なる前記物理データグループ内のデータスライスが記憶されている、
請求項17に記載の装置。
【請求項19】
前記第1アドレス確定モジュールは、
データコントローラにより、前記シーケンサから取得された第1データの論理情報に基づいて前記第1データのメタデータを確定し、前記第1データのメタデータを前記シーケンサに送信するための第1メタデータユニットと、
データベースにより、前記シーケンサから取得された第1データのメタデータに基づいて前記第1物理アドレスを確定するための第1アドレス確定ユニットとを備える、
請求項17に記載の装置。
【請求項20】
前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である、
請求項19に記載の装置。
【請求項21】
前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、前記シーケンサによって前記増分物理アドレスおよび前記全量物理アドレスに基づいて前記第1データをソートするために用いられる、
請求項17に記載の装置。
【請求項22】
データビルダから取得された第2データの論理情報に基づき、前記第2データに関連する物理データグループ内のデータスライスの物理アドレスである第2物理アドレスを確定するための第2アドレス確定モジュールと、
前記第2物理アドレスを前記データビルダに送信し、前記データビルダによって前記第2物理アドレスに基づいて前記第2データを書き込むための第2アドレス送信モジュールとを更に備える、
請求項17に記載の装置。
【請求項23】
前記第2アドレス確定モジュールは
記憶コントローラにより、前記データビルダから取得された第2データの論理情報に基づいて前記第2データのメタデータを確定し、前記第2データのメタデータを前記データビルダに送信するための第2メタデータユニットと、
データベースにより、前記データビルダから取得された第2データのメタデータに基づいて前記第2物理アドレスを確定するための第2アドレス確定ユニットとを備える、
請求項22に記載の装置。
【請求項24】
データ記憶リソース調整イベントを検出した場合、前記物理データグループの記憶リソースを更新し、かつ、前記物理データグループ内のデータスライスの物理アドレスを更新するためのリソース調整モジュールを更に備える、
請求項17に記載の装置。
【請求項25】
前記リソース調整モジュールは、具体的に、
前記物理データグループ内の元のデータスライスのリソース利用率が第1リソース利用率の閾値よりも大きいことを検出した場合、前記物理データグループ内の元のデータスライスのために関連する新しいデータスライスを作成することと、
前記元のデータスライス内のデータを前記元のデータスライスおよび前記新しいデータスライス内に分け、かつ、前記元のデータスライスおよび前記新しいデータスライスの物理アドレスのそれぞれを前記物理データグループ内のデータスライスの物理アドレスとすることとに用いられる、
請求項24に記載の装置。
【請求項26】
前記リソース調整モジュールは、具体的に、
前記物理データグループ内のデータスライスのリソース利用率が第2リソース利用率の閾値よりも小さいことを検出した場合、前記物理データグループ内の少なくとも1つのデータスライスのデータを前記物理データグループ内の他のデータスライスに統合し、かつ、前記物理データグループ内のデータスライスの物理アドレスから前記少なくとも1つのデータスライスの物理アドレスを削除することに用いられる、
請求項24に記載の装置。
【請求項27】
前記リソース調整モジュールは、具体的に、
前記物理データパケットにホットスポットデータが存在する場合、前記データ記憶リソース調整イベントを検出したことと、
前記物理データグループのために増分データスライスを作成し、前記ホットスポットデータを前記増分データスライスに書き込み、かつ、前記物理データグループ内の元のデータスライスを前記物理データグループの全量データスライスとすることと、
前記物理データグループ内の前記増分データスライスの物理アドレスを追加することとに用いられる、
請求項24に記載の装置。
【請求項28】
前記リソース調整モジュールは、具体的に、
データ記憶領域のリソース利用率が第3リソース利用率の閾値よりも大きいことを検出した場合、新しいデータ記憶領域を作成することと、
前記新しいデータ記憶領域で前記物理データグループの新しいデータスライスを作成し、前記新しいデータ記憶領域の物理アドレスを前記物理データグループ内の新しいデータスライスの物理アドレスとすることとに用いられる、
請求項24に記載の装置。
【請求項29】
第1データの論理情報をデータ処理側に送信し、前記データ処理側によって前記第1データの論理情報に基づいて前記第1データに関連する物理データグループ内のデータスライスの物理アドレスである第1物理アドレスを確定するための論理情報送信モジュールと、
前記第1物理アドレスに基づいて前記第1データをソートするためのデータソートモジュールとを備える、
データ処理装置。
【請求項30】
前記論理情報送信モジュールは、
前記第1データの論理情報を前記データ処理側におけるデータコントローラに送信し、前記データコントローラによって前記第1データの論理情報に基づいて前記第1データのメタデータを確定するための論理情報送信ユニットと、
前記第1データのメタデータを前記データ処理側におけるデータベースに送信し、前記データベースによって前記第1データのメタデータに基づいて前記第1物理アドレスを確定するためのメタデータ送信ユニットとを備える、
請求項29に記載の装置。
【請求項31】
前記第1データのメタデータは、前記第1データに関連する物理データグループ内のデータスライスのバージョン情報である、
請求項30に記載の装置。
【請求項32】
前記第1物理アドレスは、前記第1データに関連する物理データパケット内の全量データスライスの全量物理アドレスおよび増分データスライスの増分物理アドレスを含み、
前記データソートモジュールは、具体的に、
前記増分物理アドレスに基づいて前記第1データを取得し、取得に失敗した場合、前記全量物理アドレスに基づいて前記第1データを取得し、取得した第1データをソートすることに用いられる、
請求項29に記載の装置。
【請求項33】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されたメモリとを備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、
前記命令は、前記少なくとも1つのプロセッサが請求項1~16のいずれか1項に記載の方法を実行可能であるように、前記少なくとも1つのプロセッサにより実行される、
電子機器。
【請求項34】
請求項1~16のいずれか1項に記載の方法をコンピュータに実行させるため
のプログラム。
【国際調査報告】