特許7571026 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ゼロポイント　テクノロジーズ　アーベーの特許一覧

特許7571026コンピュータメモリにおける重複および値冗長性を排除するためのシステム、方法、および装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8(A)
8(B)
9(A)
9(B)
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-10-11

(45)【発行日】2024-10-22

(54)【発明の名称】コンピュータメモリにおける重複および値冗長性を排除するためのシステム、方法、および装置

(51)【国際特許分類】

G06F 12/02 20060101AFI20241015BHJP

【ＦＩ】

G06F12/02 530C

【請求項の数】 31

(21)【出願番号】P 2021538111

(86)(22)【出願日】2020-01-09

(65)【公表番号】

(43)【公表日】2022-02-28

(86)【国際出願番号】 SE2020050013

(87)【国際公開番号】W WO2020145874

(87)【国際公開日】2020-07-16

【審査請求日】2022-12-12

(31)【優先権主張番号】1950027-1

(32)【優先日】2019-01-11

(33)【優先権主張国・地域又は機関】SE

(73)【特許権者】

【識別番号】517401200

【氏名又は名称】ゼロポイントテクノロジーズアーベー

(74)【代理人】

【識別番号】100206335

【弁理士】

【氏名又は名称】太田和宏

(74)【代理人】

【識別番号】100116872

【弁理士】

【氏名又は名称】藤田和子

(74)【代理人】

【識別番号】100120857

【弁理士】

【氏名又は名称】渡邉聡

(72)【発明者】

【氏名】アレラキスアンジェロス

(72)【発明者】

【氏名】ステンストレームペール

【審査官】北村学

(56)【参考文献】

【文献】特表２０１２－５０５４４０（ＪＰ，Ａ）

【文献】特表２０１８－５２２４５７（ＪＰ，Ａ）

【文献】特開２０００－２１７０６３（ＪＰ，Ａ）

【文献】特開２００５－１２８８７５（ＪＰ，Ａ）

【文献】特開２０１７－０７３６１５（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

ＩＰＣＧ０６Ｆ１２／００－１２／１２８

Ｇ０６Ｆ３／０６

(57)【特許請求の範囲】

【請求項1】

マイクロプロセッサ（２１０）および１つまたは複数のメモリモジュール（１５１－１５３）を備えたコンピュータシステム（２００）内のコンピュータメモリ圧縮装置（２０５）が実行するコンピュータメモリ圧縮方法（１２００）であって、
アナライザユニット（２１４）が、重複メモリオブジェクトの発生および固有メモリオブジェクトにおけるデータ値の値冗長性に関するコンピュータメモリコンテンツを分析するステップ（１２１０）と、
符号化ユニット（２１２）が、前記重複メモリオブジェクトを排除し、残りの各固有メモリオブジェクトを前記残りの各固有メモリオブジェクトのデータ値のデータ値局所性を利用することで圧縮することによって、前記コンピュータメモリコンテンツを符号化するステップ（１２２０）と、
前記符号化ユニット（２１２）が、符号化された前記コンピュータメモリコンテンツの前記重複メモリオブジェクトまたは前記固有メモリオブジェクトを表すメタデータ（５００）を提供するステップ（１２３０）であって、前記メタデータ（５００）は、排除された重複メモリオブジェクト、残りの固有メモリオブジェクト、および残りの各固有メモリオブジェクトを圧縮するために使用される圧縮のタイプを反映する、ステップと、
ロケータユニット（２１１）が、前記メタデータ（５００）を使用して、符号化された前記コンピュータメモリコンテンツ内のメモリオブジェクトを位置特定するステップ（１２４０）と、
を含み、
前記メタデータ（５００）は、符号化された前記コンピュータメモリコンテンツの各メモリオブジェクトについて、
前記メモリオブジェクトが、排除された重複メモリオブジェクトであるか、それとも残りの固有メモリオブジェクトであるかを示す情報（５１０）と、
前記メモリオブジェクトが残りの固有メモリオブジェクトの場合、使用された圧縮のタイプを示す情報（５２０）と、前記残りの固有メモリオブジェクトへの固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）と、
前記メモリオブジェクトが排除された重複メモリオブジェクトの場合、前記排除された重複メモリオブジェクトと同一の非圧縮コンテンツを有する固有メモリオブジェクトへの固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）と、
を含み、
前記メタデータ（５００）は、符号化された前記コンピュータメモリコンテンツの、固有メモリオブジェクトである各メモリオブジェクトに対して、排除された重複メモリオブジェクトへの重複メモリオブジェクト参照（５４０、Ｄ＿ＰＴＲ）をさらに含み、その非圧縮コンテンツは、前記固有メモリオブジェクトと同一である、コンピュータメモリ圧縮方法。

【請求項2】

前記コンピュータメモリコンテンツ内の各個別メモリオブジェクトを処理するステップ（６００）であって、
シグネチャ（Ｓ）を作成するステップであって、前記シグネチャは前記メモリオブジェクトのデータ値の緻密表現である、ステップと、
ツリーデータ構造（４００）を横断して、作成された前記シグネチャ（Ｓ）を前記ツリーデータ構造（４００）で既に表現されているシグネチャと比較するステップと、
作成された前記シグネチャ（Ｓ）が前記ツリーデータ構造（４００）で表現されたシグネチャのいずれとも一致しない場合（６６０）、
前記ツリーデータ構造（４００）にノードを挿入するステップと、
挿入した前記ノードに作成した前記シグネチャ（Ｓ）を入力するステップと、
前記個別メモリオブジェクトに対する前記メタデータ（５００）を、それが固有メモリオブジェクトであることを示す情報（５１０）と、前記個別メモリオブジェクトに対する固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）とを用いて、生成するステップと、
作成された前記シグネチャ（Ｓ）が前記ツリーデータ構造（４００）内に表現されるシグネチャと一致する場合（６５０）、
前記個別メモリオブジェクトに対する前記メタデータ（５００）を、それが重複メモリオブジェクトであることを示す情報（５１０）と、前記ツリーデータ構造（４００）内で一致する前記シグネチャによって表現される固有メモリブロックに対する前記固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）とを用いて、生成するステップと、
前記ツリーデータ構造（４００）内で一致する前記シグネチャによって表現される前記固有メモリブロックの前記メタデータ（５００）を更新して、前記個別メモリオブジェクトに対する重複メモリオブジェクト参照（５４０、Ｄ＿ＰＴＲ）を導入するステップと、
を行うことによって、処理するステップ（６００）をさらに含む、請求項１に記載のコンピュータメモリ圧縮方法。

【請求項3】

作成された前記シグネチャ（Ｓ）が前記ツリーデータ構造（４００）内に表現されるシグネチャと一致する場合（６５０）、
前記個別メモリオブジェクトが、一致する前記シグネチャによって表現される前記固有メモリブロックと同一であるかどうかを決定するステップと、
前記個別メモリオブジェクトと、一致する前記シグネチャによって表現される前記固有メモリブロックとが同一でない場合：
前記ツリーデータ構造（４００）にノードを挿入するステップと、
挿入した前記ノードに作成した前記シグネチャ（Ｓ）を入力するステップと、
前記個別メモリオブジェクトに対するメタデータ（５００）を、それが固有メモリオブジェクトであることを示す情報（５１０）と、前記個別メモリオブジェクトに対する固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）とを用いて、生成するステップと、
をさらに含む、請求項２に記載のコンピュータメモリ圧縮方法。

【請求項4】

前記コンピュータメモリコンテンツ内の全てのメモリオブジェクトが処理された場合（６００）、
前記ツリーデータ構造（４００）を横断して、前記ツリーデータ構造（４００）の前記ノードによって表現される前記固有メモリオブジェクトの前記データ値の値頻度表を生成するステップと、
生成された前記値頻度表を使用して、エントロピーベースの圧縮スキームによって各固有メモリオブジェクトを圧縮するステップと、
をさらに含む、請求項２または３に記載のコンピュータメモリ圧縮方法。

【請求項5】

前記データ値のサイズは、前記メモリオブジェクトのサイズより小さく、前記メモリオブジェクトは、前記コンピュータメモリコンテンツよりも細かい粒度である、請求項１～４のいずれか一項に記載のコンピュータメモリ圧縮方法。

【請求項6】

前記コンピュータメモリコンテンツはコンピュータメモリのページであり、前記メモリオブジェクトはメモリブロックであり、各メモリブロックは複数のデータ値を含む、請求項５に記載のコンピュータメモリ圧縮方法。

【請求項7】

物理メモリページアドレス（ＰＡ）を有するメモリページ内のメモリブロックの読み取り要求を受信するステップと、
ルックアップテーブル（１０１０）からの圧縮メモリページアドレス（ＣＡ）を決定するステップと、
前記メモリブロックに対するメタデータを検索するステップ（１０２０）と、
前記圧縮メモリページアドレス（ＣＡ）と検索された前記メタデータの前記固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）からの圧縮メモリブロックアドレス（１０４０）を計算するステップと、
計算された前記圧縮メモリブロックアドレス（１０４０）での圧縮メモリブロック（１１０５）を検索するステップと、
前記メモリブロックに対して検索された前記メタデータからの圧縮のタイプを示す情報（５２０；１１２０、ＥＮＣ）を使用して、検索された前記圧縮メモリブロック（１１０５）を解凍するステップ（１１１０）と、
をさらに含む、請求項６に記載のコンピュータメモリ圧縮方法。

【請求項8】

当初メモリ位置における固有メモリブロック（８３０）の更新を含むライトバック要求を受信するステップと、
前記コンピュータメモリコンテンツの専用空きメモリ領域（８４０）内の新規メモリ位置（８７０）に更新する前に、前記固有メモリブロック（８３０）をコピーするステップと、
前記固有メモリブロック（８３０）にリンクされた重複メモリブロック（８１０、８２０）の前記メタデータを更新して、その前記重複メモリオブジェクト参照（５４０、Ｄ＿ＰＴＲ）が前記専用空きメモリ領域（８４０）内の前記新規メモリ位置（８７０）にリダイレクトされるようにするステップと、
前記ライトバック要求に従って、その当初メモリ位置（８３０）で前記固有メモリブロックを更新するステップと、
をさらに含む、請求項６または７に記載のコンピュータメモリ圧縮方法。

【請求項9】

前記専用空きメモリ領域（８４０）の開始アドレス（８０５）への参照（Ｆ＿ＰＴＲ）を含むメタデータを提供するステップと、
前記専用空きメモリ領域（８４０）内の前記新規メモリ位置（８７０）への前記固有メモリブロック（８３０）をコピーした後に、新規開始アドレス（８８０）を反映するように、前記参照（Ｆ＿ＰＴＲ）を更新するステップと、
をさらに含む、請求項８に記載のコンピュータメモリ圧縮方法。

【請求項10】

当初メモリ位置における固有メモリブロック（８３０）の更新を含むライトバック要求を受信するステップと、
重複排除メモリブロック（８２０）が固有メモリブロック（８３０）の重複であることを見つけるステップと、
前記固有メモリブロック（８３０）の前記シグネチャ（Ｓ）を使用することによって、見つかった前記重複排除メモリブロック（８２０）を前記ツリーデータ構造（４００）内で固有のものとしてプロモートするステップと、
専用空きメモリ領域（８４０）内の新規メモリ位置（８７０）への前記ライトバック要求に従って、前記固有メモリブロック（８３０）の更新されたコンテンツを書き込むステップと、
前記固有メモリブロック（８３０）の前記メタデータを更新して、前記固有メモリブロック（８３０）の前記固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）が前記専用空きメモリ領域（８４０）内の前記新規メモリ位置（８７０）にリダイレクトされるようにして、その一方で、前記固有メモリブロック（８３０）の重複メモリオブジェクト参照（５４０、Ｄ＿ＰＴＲ）は除去されるようにするステップと、
をさらに含む、請求項２に従属するときの請求項６または７に記載のコンピュータメモリ圧縮方法。

【請求項11】

前記専用空きメモリ領域（８４０）の開始アドレス（８０５）への参照（Ｆ＿ＰＴＲ）を含むメタデータを提供するステップと、
前記専用空きメモリ領域（８４０）の前記新規メモリ位置（８７０）への前記ライトバック要求に従って、前記固有メモリブロック（８３０）の更新された前記コンテンツの書き込み後に、新規開始アドレス（８８０）を反映するように前記参照（Ｆ＿ＰＴＲ）を更新するステップと、
をさらに含む、請求項１０に記載のコンピュータメモリ圧縮方法。

【請求項12】

重複メモリブロック（９２０）の更新を含むライトバック要求を受信するステップと、
更新された前記重複メモリブロックのコンテンツを、専用空きメモリ領域（９４０）内の新規固有メモリブロック（９８０）として格納するステップと、
前記重複メモリブロック（９２０）に以前にリンクされた固有メモリブロック（９１０）前記メタデータを更新して、前記固有メモリブロック（９１０）が、前記固有メモリブロック（９１０）と他の重複メモリブロック（９３０）との間のリンクを維持しつつ、前記重複メモリブロック（９２０）にリンクされなくなったことを反映するステップと、
をさらに含む、請求項６～１１のいずれか一項に記載のコンピュータメモリ圧縮方法。

【請求項13】

メモリページの圧縮率を経時的に監視するステップと、
前記圧縮率が所与の基準を満たさない場合、請求項１～７のいずれか一項に記載のコンピュータメモリ圧縮方法の機能を実行することによって、前記メモリページの再圧縮を実行するステップと、
をさらに含む、請求項８～１２のいずれか一項に記載のコンピュータメモリ圧縮方法。

【請求項14】

請求項１～７のいずれか一項に記載のコンピュータメモリ圧縮方法の機能を実行することによって、メモリページの再圧縮を定期的に実行し、圧縮率を改善するステップ
をさらに含む、請求項１２または１３に記載のコンピュータメモリ圧縮方法。

【請求項15】

前記データ値局所性を利用することによる前記圧縮は、
エントロピーベースの符号化と、
デルタ符号化と、
辞書ベースの符号化と、
パターンベースの符号化と
のうちの１つを含む、請求項１～１４のいずれか一項に記載のコンピュータメモリ圧縮方法。

【請求項16】

コンピュータメモリ圧縮装置（２０５）であって、
重複メモリオブジェクトの発生および固有メモリオブジェクトにおけるデータ値の値冗長性に関するコンピュータメモリコンテンツを分析するように構成されたアナライザユニット（２１４）と、
前記重複メモリオブジェクトを排除し、残りの各固有メモリオブジェクトを前記残りの各固有メモリオブジェクトのデータ値のデータ値局所性を利用することで圧縮することによって、前記コンピュータメモリコンテンツを符号化するように構成された符号化ユニット（２１２）であって、前記符号化ユニット（２１２）は符号化された前記コンピュータメモリコンテンツの前記重複メモリオブジェクトまたは前記固有メモリオブジェクトを表すメタデータ（５００）を提供するように、さらに構成され、前記メタデータ（５００）は、除去された重複メモリオブジェクト、残りの固有メモリオブジェクト、および残りの各固有メモリオブジェクトを圧縮するために使用される圧縮のタイプを反映する、符号化ユニット（２１２）と、
前記メタデータ（５００）を使用して、符号化された前記コンピュータメモリコンテンツ内にメモリオブジェクトを配置するように構成されたロケータユニット（２１１）と、
を備え、
前記メタデータ（５００）は、符号化された前記コンピュータメモリコンテンツの各メモリオブジェクトについて、
前記メモリオブジェクトが、排除された重複メモリオブジェクトであるか、それとも残りの固有メモリオブジェクトであるかを示す情報（５１０）と、
前記メモリオブジェクトが残りの固有メモリオブジェクトの場合、使用された圧縮のタイプを示す情報（５２０）と、前記残りの固有メモリオブジェクトへの固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）と、
前記メモリオブジェクトが排除された重複メモリオブジェクトの場合、前記排除された重複メモリオブジェクトと同一の非圧縮コンテンツを有する固有メモリオブジェクトへの固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）と、
を含み、
前記メタデータ（５００）は、符号化された前記コンピュータメモリコンテンツの、固有メモリオブジェクトである各メモリオブジェクトに対して、排除された重複メモリオブジェクトへの重複メモリオブジェクト参照（５４０、Ｄ＿ＰＴＲ）をさらに含み、その非圧縮コンテンツは、前記固有メモリオブジェクトと同一である、コンピュータメモリ圧縮装置。

【請求項17】

前記アナライザユニット（２１４）および前記符号化ユニット（２１２）は、前記コンピュータメモリコンテンツ内の各個別メモリオブジェクトを、
シグネチャ（Ｓ）を作成するステップであって、前記シグネチャは前記メモリオブジェクトのデータ値の緻密表現である、ステップと、
ツリーデータ構造（４００）を横断して、作成された前記シグネチャ（Ｓ）を前記ツリーデータ構造（４００）で既に表現されているシグネチャと比較するステップと、
作成された前記シグネチャ（Ｓ）が前記ツリーデータ構造（４００）で表現されたシグネチャのいずれとも一致しない場合（６６０）、
前記ツリーデータ構造（４００）にノードを挿入するステップと、
挿入した前記ノードに作成した前記シグネチャ（Ｓ）を入力するステップと、
前記個別メモリオブジェクトに対する前記メタデータ（５００）を、それが固有メモリオブジェクトであることを示す情報（５１０）と、前記個別メモリオブジェクトに対する前記固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）とを用いて、生成するステップと、
作成された前記シグネチャ（Ｓ）が前記ツリーデータ構造（４００）内に表現されるシグネチャと一致する場合（６５０）、
前記個別メモリオブジェクトに対する前記メタデータ（５００）を、それが重複メモリオブジェクトであることを示す情報（５１０）と、前記ツリーデータ構造（４００）内で一致する前記シグネチャによって表現される固有メモリブロックに対する前記固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）とを用いて、生成するステップと、
前記ツリーデータ構造（４００）内で一致する前記シグネチャによって表現される前記固有メモリブロックの前記メタデータ（５００）を更新して、前記個別メモリオブジェクトに対する重複メモリオブジェクト参照（５４０、Ｄ＿ＰＴＲ）を導入するステップと、
を行うことによって、処理する（６００）ように構成される、請求項１６に記載のコンピュータメモリ圧縮装置。

【請求項18】

前記アナライザユニット（２１４）および前記符号化ユニット（２１２）は、
作成された前記シグネチャ（Ｓ）が、前記ツリーデータ構造（４００）に表現されるシグネチャと一致する場合（６５０）、
前記個別メモリオブジェクトが、一致する前記シグネチャによって表現される前記固有メモリブロックと同一であるかどうかを決定するステップと、
前記個別メモリオブジェクトと、一致する前記シグネチャによって表現される前記固有メモリブロックとが同一でない場合：
前記ツリーデータ構造（４００）にノードを挿入するステップと、
挿入した前記ノードに作成した前記シグネチャ（Ｓ）を入力するステップと、
前記個別メモリオブジェクトに対するメタデータ（５００）を、それが固有メモリオブジェクトであることを示す情報（５１０）と、前記個別メモリオブジェクトに対する固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）とを用いて、生成するステップと、
行なうように、さらに構成される、請求項１７に記載のコンピュータメモリ圧縮装置。

【請求項19】

前記アナライザユニット（２１４）および前記符号化ユニット（２１２）は、前記コンピュータメモリコンテンツ内の全てのメモリオブジェクトが処理された場合（６００）、
前記ツリーデータ構造（４００）を横断して、前記ツリーデータ構造（４００）の前記ノードによって表現される前記固有メモリオブジェクトの前記データ値の値頻度表を生成するステップと、
生成された前記値頻度表を使用して、エントロピーベースの圧縮スキームによって各固有メモリオブジェクトを圧縮するステップと、
をさらに行うように構成される、請求項１８に記載のコンピュータメモリ圧縮装置。

【請求項20】

前記データ値のサイズは、前記メモリオブジェクトのサイズより小さく、前記メモリオブジェクトは、前記コンピュータメモリコンテンツよりも細かい粒度である、請求項１６～１９のいずれか一項に記載のコンピュータメモリ圧縮装置。

【請求項21】

前記コンピュータメモリコンテンツはコンピュータメモリのページであり、前記メモリオブジェクトはメモリブロックであり、各メモリブロックは複数のデータ値を含む、請求項２０に記載のコンピュータメモリ圧縮装置。

【請求項22】

デコンプレッサユニット（２１３；１１１０）をさらに備え、
物理メモリページアドレス（ＰＡ）を有するメモリページ内のメモリブロックの読み取り要求を受信するステップと、
ルックアップテーブル（１０１０）からの圧縮メモリページアドレス（ＣＡ）を決定するステップと、
前記メモリブロックに対するメタデータを検索するステップ（１０２０）と、
前記圧縮メモリページアドレス（ＣＡ）と検索された前記メタデータの前記固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）からの圧縮メモリブロックアドレス（１０４０）を計算するステップと、
計算された前記圧縮メモリブロックアドレス（１０４０）での圧縮メモリブロック（１１０５）を検索するステップと、
前記メモリブロックに対して検索された前記メタデータからの圧縮のタイプを示す情報（５２０；１１２０、ＥＮＣ）を使用して、検索された前記圧縮メモリブロック（１１０５）を解凍するステップと、
を行うように構成される、請求項２１に記載のコンピュータメモリ圧縮装置。

【請求項23】

当初メモリ位置における固有メモリブロック（８３０）の更新を含むライトバック要求を受信するステップと、
前記コンピュータメモリコンテンツの専用空きメモリ領域（８４０）内の新規メモリ位置（８７０）に更新する前に、前記固有メモリブロック（８３０）をコピーするステップと、
前記固有メモリブロック（８３０）にリンクされた重複メモリブロック（８１０、８２０）の前記メタデータを更新して、前記固有メモリブロック（８３０）の前記重複メモリオブジェクト参照（５４０、Ｄ＿ＰＴＲ）が前記専用空きメモリ領域（８４０）内の前記新規メモリ位置（８７０）にリダイレクトされるようにするステップと、
前記ライトバック要求に従って、その当初メモリ位置（８３０）で前記固有メモリブロックを更新するステップと、
をさらに行うように構成される、請求項２１または２２に記載のコンピュータメモリ圧縮装置。

【請求項24】

前記専用空きメモリ領域（８４０）の開始アドレス（８０５）への参照（Ｆ＿ＰＴＲ）を含むメタデータを提供するステップと、
前記専用空きメモリ領域（８４０）内の前記新規メモリ位置（８７０）への前記固有メモリブロック（８３０）をコピーした後に、新規開始アドレス（８８０）を反映するように、前記参照（Ｆ＿ＰＴＲ）を更新するステップと、
をさらに行うように構成される、請求項２３に記載のコンピュータメモリ圧縮装置。

【請求項25】

当初メモリ位置における固有メモリブロック（８３０）の更新を含むライトバック要求を受信するステップと、
重複排除メモリブロック（８２０）が固有メモリブロック（８３０）の重複であることを見つけるステップと、
前記固有メモリブロック（８３０）の前記シグネチャ（Ｓ）を使用することによって、見つかった前記重複排除メモリブロック（８２０）を前記ツリーデータ構造（４００）内で固有のものとしてプロモートするステップと、
専用空きメモリ領域（８４０）内の新規メモリ位置（８７０）への前記ライトバック要求に従って、前記固有メモリブロック（８３０）の更新されたコンテンツを書き込むステップと、
前記固有メモリブロック（８３０）の前記メタデータを更新して、前記固有メモリブロック（８３０）の前記固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）が前記専用空きメモリ領域（８４０）内の前記新規メモリ位置（８７０）にリダイレクトされるようにして、その一方で、前記固有メモリブロック（８３０）の重複メモリオブジェクト参照（５４０、Ｄ＿ＰＴＲ）は除去されるようにするステップと、
をさらに行うように構成される、請求項１７に従属するときの請求項２１または２２のいずれかに記載のコンピュータメモリ圧縮装置。

【請求項26】

前記専用空きメモリ領域（８４０）の開始アドレス（８０５）への参照（Ｆ＿ＰＴＲ）を含むメタデータを提供するステップと、
前記専用空きメモリ領域（８４０）の前記新規メモリ位置（８７０）への前記ライトバック要求に従って、前記固有メモリブロック（８３０）の更新された前記コンテンツの書き込み後に、新規開始アドレス（８８０）を反映するように前記参照（Ｆ＿ＰＴＲ）を更新するステップと、
をさらに行うように構成される、請求項２５に記載のコンピュータメモリ圧縮装置。

【請求項27】

重複メモリブロック（９２０）の更新を含むライトバック要求を受信するステップと、
更新された前記重複メモリブロックのコンテンツを、専用空きメモリ領域（９４０）内の新規固有メモリブロック（９８０）として格納するステップと、
前記重複メモリブロック（９２０）に以前にリンクされた固有メモリブロック（９１０）の前記メタデータを更新して、前記固有メモリブロック（９１０）が、前記固有メモリブロック（９１０）と他の重複メモリブロック（９３０）との間のリンクを維持しつつ、前記重複メモリブロック（９２０）にリンクされなくなったことを反映するステップと、
をさらに行うように構成される、請求項２１～２６のいずれか一項に記載のコンピュータメモリ圧縮装置。

【請求項28】

メモリページの圧縮率を経時的に監視するステップと、
前記圧縮率が所与の基準を満たさない場合、請求項１～７のいずれか一項に記載のコンピュータメモリ圧縮方法の機能を実行することによって、前記メモリページの再圧縮を実行するステップと、
をさらに行うように構成される、請求項２６または２７に記載のコンピュータメモリ圧縮装置。

【請求項29】

請求項１～６のいずれか一項に記載のコンピュータメモリ圧縮方法の機能を実行することによって、圧縮率を改善するために、メモリページの再圧縮を定期的に実行するように、
さらに構成される、請求項２６～２８のいずれか一項に記載のコンピュータメモリ圧縮装置。

【請求項30】

前記符号化ユニット（２１２）が、
エントロピーベースの圧縮と、
ベースデルタ即圧縮と、
のうちの１つを適用することで、データ値局所性を利用することによって圧縮するように構成される、請求項１６～２９のいずれか一項に記載のコンピュータメモリ圧縮装置。

【請求項31】

１つまたは複数のプロセッサ（Ｐ１、…、ＰＮ）と、
１つまたは複数のコンピュータメモリ（Ｍ１～ＭＫ、Ｃ１～Ｃ３）と、
請求項１６～３０のいずれか一項に記載のコンピュータメモリ圧縮装置（２０５）と、
を備える、コンピュータシステム（２００）。

【発明の詳細な説明】

【技術分野】

【0001】

この主題は、一般に、電子コンピュータ内のメモリにおけるデータ圧縮の分野に関する。

【背景技術】

【0002】

データ圧縮は、データの頻繁な収集を、データの頻繁でない収集よりも効率的に符号化することによって、データをより効率的に格納し、転送する一般的な技法である。一般に、多くの理由から、データをより効率的に格納し、転送することが興味深い。コンピュータメモリ、例えば、データおよび処理装置が動作するコンピュータ命令を保持するメモリにおいて、例えば、メインメモリまたはキャッシュメモリにおいて、前記データをより効率的に、例えば、Ｋ倍効率的に、格納することは、興味深いことである。その理由は、データをあるメモリと別のメモリとの間で転送するために潜在的に使用する通信容量をＫ分の１に減らし、コンピュータシステムの内部または間で、および／またはメモリ間で前記データを格納し、転送するために潜在的にエネルギー消費をＫ分の１にして減らし、前記メモリのサイズを潜在的にＫ分の１に減少させることができるからである。あるいは、データ圧縮を行わない場合よりも、利用可能なコンピュータメモリにＫ倍多くのデータを格納することができる。これは、より多くのメモリを追加する必要なしに、コンピュータの潜在的にＫ倍高い性能を達成するために興味深いことであり得る。このことは、コスト高になること、あるいはリソース制約のために単に望ましくないことがあり得る。別の例として、スマートフォン、タブレット、ラップ／デスクトップ、またはセットトップボックスのサイズおよび重量は、制限されることがある。その理由は、より大きい、または重いスマートフォン、タブレット、ラップ／デスクトップ、またはセットトップボックスは、エンドユーザにとってより価値が低く、したがって、そのような製品の市場価値を潜在的に低下させるからである。しかし、メモリ容量またはメモリ通信帯域幅がより大きくすると、製品の市場価値を潜在的に増大させることができる。なぜなら、メモリ容量またはメモリ通信帯域幅がより大きくなれば、製品の性能が向上し、したがって、有用性がより高くなるからである。

【0003】

要約すると、分離された装置または相互接続された装置を含むコンピュータ化された製品の一般的な状況では、データ圧縮は、潜在的に、性能を向上させ、エネルギー消費を低下させ、メモリ通信帯域幅を増加させ、あるいはメモリによって消費されるコストおよび面積を小さくすることができる。したがって、データ圧縮は、本明細書で言及されるもの以外の広範なコンピュータ化された製品において、幅広い有用性を有する。

【0004】

従来技術における圧縮メモリシステムは、通常、メモリページを作成するときに、ディスクから読み出すことによって、あるいはメモリ割り当てを介して、メモリページを圧縮する。圧縮は、ソフトウェアルーチンまたはハードウェアアクセラレータによる様々な周知の方法を使用して行うことができる。プロセッサがメモリからデータを要求するとき、データは、通常、プロセッサが要求する処理を行う前に、最初に解凍されなければならない。このような要求は、クリティカルなメモリアクセスパスに帰着する可能性があるため、解凍は、一般に、にハードウェアで加速されるので、メモリアクセス時間に与える影響は小さい。

【0005】

重複排除と呼ばれる１つの圧縮アプローチにおいて、そのアイデアは、同一のメモリオブジェクトを識別することである。例えば、メモリには同じページの５つの同一インスタンスが含まれていると仮定する。その場合、それらのうちの１つだけを保存する必要があり、残りの４つは、そのインスタンスだけを参照することができ、したがって、５倍の圧縮率を提供する。従来技術で知られている重複排除は、例えば、サイズが、通常、数キロバイト（ＫＢ）～数十キロバイト、あるいはそれ以上のオーダであるメモリページと、サイズが、通常、数十バイト、例えば、６４バイト（６４Ｂ）であるメモリブロックのような粒度の範囲の固定サイズオブジェクトに適用されてきた。他の従来技術は、可変サイズ格納ファイルのような可変粒子サイズを考慮している。いずれにせよ、重複排除の制限は、同一のメモリオブジェクトの発生の重複を除去することのみに基づいていることである。

【0006】

同一のオブジェクトを除去する場合、除去されたオブジェクトは、それと同一の唯一のオブジェクトへの参照を確立する必要がある。参照は、ポインタに関して、メモリオブジェクトの唯一のコピーを指すことであり、これはメモリ空間を消費する。したがって、重複排除は、著しい圧縮メタデータオーバヘッドにつながる可能性がある。例えば、１テラバイト＝２^４０バイトのメモリ内の６４Ｂ（＝２^６バイト）のメモリブロックに重複排除が適用されるとする。次に、重複排除されたメモリブロックの固有コピーを指すために、（４０－６＝）３４ビットの参照ポインタが必要である。

【0007】

従来技術から知られている代替の圧縮アプローチは、値冗長性（例えば、３２または６４ビットの単一ワードに関して）を活用する。例えば、他のものよりも一般的なメモリオブジェクトは、それほど一般的ではないメモリオブジェクトよりも少ないビット数で符号化される。一例として、エントロピーに基づく圧縮技法は、例えば、ハフマン符号化および算術符号化を含む従来技術において豊富である。他の圧縮技法には、ベースデルタ即（Ｂａｓｅ－Ｄｅｌｔａ－Ｉｍｍｅｄｉａｔｅ）圧縮が含まれ、この圧縮は、データオブジェクト、例えば、メモリページおよびブロックに格納された数値が互いに数値的に近く、それらの間の差を密に符号化することを利用する。

【0008】

重要なことは、重複を除去する重複排除と、値冗長性を除去するエントロピーベースの圧縮およびベースデルタ即圧縮のような値局所性を利用する圧縮技法とが、多くの方法で相補的であることである。例えば、ページベースの重複排除では、同一ページの単一コピーが格納されるのに対し、参照ポインタは固有コピーを参照するためにコピーから提供される。しかしながら、このような重複排除スキームでは、例えば、ページ内のワードレベル（例えば、３２ビットまたは６４ビットのエンティティ）で、より細かい粒度で存在する値冗長性は利用されない。重複排除を、値冗長性を低減する圧縮スキームと組み合わせることによって、重複を排除し、統計値の性質に基づいて固有コピー内の各データ値を符号化することによって、残りの固有コピーをはるかに密に格納することが可能である。本文書の目的は、本発明を開示して、重複および値冗長性を排除する、コンピュータメモリに適用される一群の圧縮技法の装置、システム、および方法を提供することである。

【発明の概要】

【発明が解決しようとする課題】

【0009】

重複排除を値局所性ベースの圧縮と組み合わせることによって、多くの技術的課題が開かれる。第一の課題は、重複を除去することによって、また値局所性ベースのアプローチを使用して、残りの固有コピー内のアイテムを圧縮することによって、圧縮性を組み合わせて向上する符号化を見つける方法である。重複排除と値局所性ベースの圧縮との組合せアプローチを用いて、圧縮メモリ内でメモリブロックを効率的に位置特定するために、メタデータの量を低く保ち、圧縮と解凍装置がメモリ待ち時間のオーバヘッドを低くすることを可能にする課題を開くことになる。それゆえ、第二の課題は、メタデータの量を低く抑えることも、メモリレイテンシのオーバヘッドを低く抑えることもできる圧縮と解凍の方法、装置、およびシステムを考え出すことである。操作時、データオブジェクトは、プロセッサの書き込みに応じて変化する。これは、重複の数に関しても、残りの固有コピーの値局所性の統計的性質に関しても、重複された固有のブロックの性質が変化するという効果を有する。第三の課題は、このような動的効果に照らして圧縮性を高く保つことができる方法、装置およびシステムを提供することである。開示される発明は、これらの課題および他の課題の全てに対処することが意図されている。

【課題を解決するための手段】

【0010】

本発明の第一の態様は、コンピュータメモリ圧縮方法である。この方法は、重複メモリオブジェクトの発生および固有メモリオブジェクトにおけるデータ値の値冗長性に関するコンピュータメモリコンテンツを分析するステップを含む。この方法は、また、前記重複メモリオブジェクトを除去し、残りの各固有メモリオブジェクトをそのデータ値のデータ値局所性を利用することで圧縮することによって、前記コンピュータメモリコンテンツを符号化するステップを含む。この方法は、さらに、符号化されたコンピュータメモリコンテンツのメモリオブジェクトを表すメタデータを提供するステップも含む。メタデータは、除去された重複メモリオブジェクト、残りの固有メモリオブジェクト、および残りの各固有メモリオブジェクトを圧縮するために使用される圧縮のタイプを反映する。この方法は、さらに、前記メタデータを使用して、符号化されたコンピュータメモリコンテンツ内のメモリオブジェクトを位置特定するステップも含む。

【0011】

本発明の第二の態様は、コンピュータメモリ圧縮装置である。この装置は、重複メモリオブジェクトの発生および固有メモリオブジェクトにおけるデータ値の値冗長性に関するコンピュータメモリコンテンツを分析するように構成されたアナライザユニットを備える。この装置は、また、前記重複メモリオブジェクトを除去し、残りの各固有メモリオブジェクトをそのデータ値のデータ値局所性を利用することで圧縮することによって、前記コンピュータメモリコンテンツを符号化するように構成された符号化ユニットを備える。符号化ユニットは、さらに、符号化されたコンピュータメモリコンテンツの前記メモリオブジェクトを表すメタデータを提供するように構成されている。メタデータは、除去された重複メモリオブジェクト、残りの固有メモリオブジェクト、および残りの各固有メモリオブジェクトを圧縮するために使用される圧縮のタイプを反映する。この装置は、さらに、前記メタデータを使用して、符号化されたコンピュータメモリコンテンツ内にメモリオブジェクトを位置特定するように構成されたロケータユニットも備える。

【0012】

開示された実施形態の他の態様、目的、特徴、および利点は、以下の詳細な開示、添付の従属請求項、および図面から明らかになる。

【0013】

一般に、この文書で記述されるようなデータ値局所性を利用することによる圧縮は、エントロピーベースの符号化、デルタ符号化、辞書ベースの符号化またはパターンベースの符号化を含み得るが、制限はない。

【0014】

一般に、特許請求の範囲において使用される全ての用語は、本明細書において特に明確に定義されない限り、本技術分野におけるそれらの通常の意味に従って解釈されるべきである。「１つの／その［要素、装置、構成要素、手段、ステップなど］」への言及は、いずれも、特に明記しない限り、要素、装置、構成要素、手段、ステップなどの少なくとも１つのインスタンスを指すものとしてオープンに解釈されるべきである。本明細書に開示される任意の方法のステップは、明示的に述べられない限り、開示される正確な順序で実行される必要はない。

【図面の簡単な説明】

【0015】

【図1】１つまたは複数の処理ユニットを有するマイクロプロセッサチップ、３つのレベルからなる例示的なキャッシュ階層、１つまたは複数のオフチップメモリに接続された１つまたは複数のメモリコントローラを備えるコンピュータシステムを示す。

【図2】メモリ内のデータおよび命令を圧縮するように構成された、図１のようなコンピュータシステムを示す。

【図3】重複排除および値冗長性除去圧縮方法を適用する前後の例示的なメモリページレイアウトを示す。

【図4】ページ内の固有ブロックを追跡するためのツリーベースのデータ構造の例示的なレイアウトを示す。

【図5】重複排除と他の圧縮方法との組合せを用いてメモリページを圧縮するためのメタデータ構造と、その使用例とを示す。

【図6】重複排除プロセスのフローグラフを示す。

【図7】値冗長性除去圧縮方法のフローグラフを示す。

【図8】固有メモリブロックの変更に応答する例示的なメモリの変化を示す。

【図9】重複排除されたメモリブロックの変更に応答する例示的なメモリの変化を示す。

【図10】重複排除および値冗長性除去圧縮方法を使用してメモリブロックの位置を確立するためのアドレス変換ユニットを示す。

【図11】重複排除および値冗長性除去圧縮を使用してメモリブロックを解凍するためのデコンプレッサユニットを示す。

【図12】コンピュータメモリ圧縮方法の一般的なフローチャートを示す。

【発明を実施するための形態】

【0016】

本文書は、コンピュータメモリにおける重複と値冗長性を排除する一群の圧縮アプローチを用いて、コンピュータメモリ内のデータを圧縮するためのシステム、方法、および装置を開示する。

【0017】

コンピュータシステム１００の例示的な実施形態を図１に示す。このシステムは、マイクロプロセッサ１１０と、Ｍ_１１５１、Ｍ_２１５２～Ｍ_Ｋ１５３と付された１つまたは複数のメモリモジュールと、を備える。マイクロプロセッサチップは、ディスクリートシステムであってもよいし、あるいは任意の利用可能な技術によるシステムオンチップ（ＳｏＣ）上に集積されていてもよい。マイクロプロセッサ１１０は、Ｐ_１１３１、Ｐ_２１３２～Ｐ_Ｎ１３３と付された１つまたは複数の処理ユニットを備え、これらは、ＣＰＵまたはコアと呼ばれることがあり、メモリ階層である。一方、メモリ階層は、複数のキャッシュレベル、例えば、図１に例示的に示され、Ｃ１、Ｃ２、およびＣ３と付された３つのレベルを含む。これらのレベルは、同じまたは異なるメモリ技術で、例えば、ＳＲＡＭ、ＤＲＡＭ、または、例えば、相変化メモリ（ＰＣＭ）を含む任意のタイプの不揮発性技術で実施することができる。キャッシュレベルの数は、異なる実施形態において変化することができ、例示的な実施形態１００は、最後のキャッシュレベルがＣ３１２０である３つのレベルを示す。これらのレベルは、ある種の相互接続手段（例えば、バスまたは任意の他の相互接続ネットワーク）を使用して接続される。例示的な実施形態では、レベルＣ１およびＣ２は、それぞれの処理ユニットＰ_ｉ（例えば、図１のＰ_１）に対してプライベートであり、それによってのみアクセス可能である。代替的な実施形態は、任意の数のプライベートなキャッシュレベルを有することができ、あるいは、代替として、全てのキャッシュレベルが、図１の第三のレベルＣ３１２０によって示されるように共有されることは、当業者には周知である。キャッシュ階層にデータを含めることに関して、任意の実施形態が可能であり、当業者には理解され得る。例えば、Ｃ１は、Ｃ２に含まれ得るが、Ｃ２は、レベルＣ３に関して包括的でないことがあり得る。当業者であれば、代替的な実施形態を理解することができる。図１のコンピュータシステム１００は、ＭＣＴＲＬ_１１４１、ＭＣＴＲＬ_２１４２～ＭＣＴＲＬ_Ｌ１４３と付された１つまたは複数のメモリコントローラを備える。最後のキャッシュレベル（図１のＣ３）は、メモリコントローラに接続され、メモリコントローラは、次に、１つまたは複数のメモリモジュールに接続される。メモリコントローラは、マイクロプロセッサチップ１１０上に統合することも、マイクロプロセッサチップ外に実装することもできる。最後に、コンピュータシステムは、１つまたは複数のタスクを実行する。タスクは、特定のシステムで実行できる任意のソフトウェアアプリケーション、またはその一部であり得る。

【0018】

コンピュータシステムは、図１の実施形態によって例示されるように、レベル（例えば、図１のＣ１、Ｃ２およびＣ３）に関係なく、Ｍ_１１５１～Ｍ_Ｋ１５３と付されたメモリおよびキャッシュメモリの容量が限られていることに悩まされることがある。キャッシュの容量が限られていると、メモリ階層内の次のレベルで処理されなければならないメモリ要求の割合が高くなり、性能の低下またはエネルギー消費の増大につながることがある。この問題を軽減するために、キャッシュ容量を増やすことを検討できる。これにより、メモリ階層内の次のレベルで処理する必要がある要求の数を減らすことができる。マイクロプロセッサチップ上のキャッシュレベルの容量を増加させると、多くの問題をもたらすことになる。第一に、キャッシュアクセス要求時間が増大し、性能の低下につながる可能性がある。第二に、より大きなキャッシュへのアクセス要求で消費されるエネルギーは、潜在的により高くなり得る。第三に、より大きなキャッシュレベルを実現するためにマイクロプロセッサチップ上でシリコンまたは同等の材料をより多く使うと、その代償として、処理能力がより少なくなることがある。したがって、上記のような問題を発生せずに、キャッシュ容量をより多くすることが望まれている。メモリ容量が限られていると、同様の問題が生じ、通常はメモリ階層の格納レベルとして実現されるメモリ階層の次のレベルで処理する必要があるメモリ要求そのものが増加することがある。このような格納レベルのアクセスは、より遅く、性能およびエネルギー消費においてかなりの損失をもたらす可能性がある。メモリ容量を増やすと、これらの欠点を軽減できる。しかしながら、メモリ容量を増やすことは、構成要素レベルでも、エネルギー消費の点でも、コンピュータシステムをコスト高にする可能性がある。さらに、メモリが多ければ多いほど、より多くの空間を消費し、これは、特に、例えば、モバイルコンピュータ（例えば、タブレット、スマートフォン、ウェアラブル、およびインターネットに接続された小型コンピュータ化装置）を含むフォームファクタ制約製品におけるコンピュータシステムの有用性を制限し得る。

【0019】

本発明の開示は、前述の例示的なメモリ階層圧縮のどのレベルで適用されるかが異なるいくつかの実施形態を考慮する。第一の実施形態は、本発明の圧縮方法がメインメモリに適用されることを考慮する。しかしながら、当業者であれば、他の実施形態を理解することができる。そのような実施形態も、本特許開示に明示的には含まれないが、企図されることが意図される。

【0020】

メインメモリ容量が限られているという課題を考慮する第一の開示された実施形態に関して、図１の例示的なシステムは、データおよび命令をメインメモリ内で圧縮できるように構成することができる。図２は、そのようなコンピュータシステム２００の一例を示す。追加されたものは、マイクロプロセッサチップ２１０上のコンピュータメモリ圧縮装置２０５である。コンピュータメモリ圧縮装置２０５は、４つの機能ブロックを備える。これらのブロックは、ロケータ（アドレス変換）ユニット２１１と、符号化（コンプレッサ）ユニット２１２と、デコンプレッサユニット２１３と、アナライザユニット２１４とを備えている。

【0021】

以下に詳細に説明するように、アナライザユニット２１４は、重複メモリオブジェクトの発生および固有メモリオブジェクトにおけるデータ値の値冗長性に関するコンピュータメモリコンテンツを分析するように構成されている。この点に関して、データ値は、通常、メモリオブジェクトよりも細かい粒度であり、メモリオブジェクトは、通常、コンピュータメモリコンテンツよりも細かい粒度である。コンピュータメモリコンテンツは、通常、コンピュータメモリのページであってもよく、メモリオブジェクトは、通常、メモリブロックであってもよく、各メモリブロックは、通常、メモリワードなどの複数のデータ値を含んでもよい。

【0022】

符号化ユニット２１２は、重複メモリオブジェクトを排除し、残りの各固有メモリオブジェクトをそのデータ値のデータ値局所性を利用することで圧縮することによって、コンピュータメモリコンテンツを符号化するように構成される。符号化ユニット２１２は、さらに、符号化されたコンピュータメモリコンテンツのメモリオブジェクトを表すメタデータ５００を提供するように構成される。メタデータは、排除された重複メモリオブジェクト、残りの固有メモリオブジェクト、および残りの各固有メモリオブジェクトを圧縮するために使用される圧縮のタイプを反映する。このようなメタデータの例は、例えば、図５の５００に見られる。ロケータユニット２１１は、メタデータを使用して、符号化されたコンピュータメモリコンテンツ内のメモリオブジェクトを位置特定するように構成される。

【0023】

対応する一般的なコンピュータメモリ圧縮方法１２００を図１２に示す。この方法は、重複メモリオブジェクトの発生および固有メモリオブジェクトにおけるデータ値の値冗長性に関するコンピュータメモリコンテンツを分析するステップ１２１０を含む。この方法は、さらに、重複メモリオブジェクトを排除し、残りの各固有メモリオブジェクトをそのデータ値のデータ値局所性を利用することで圧縮することによって、コンピュータメモリコンテンツを符号化するステップ１２２０を含む。この方法は、また、符号化されたコンピュータメモリコンテンツのメモリオブジェクトを表すメタデータ５００を提供するステップ１２３０を含む。この方法は、さらに、メタデータ５００を使用して、符号化された前記コンピュータメモリコンテンツ内のメモリオブジェクトを位置特定するステップ１２４０を含む。コンピュータメモリ圧縮方法１２００は、一般に、本明細書全体にわたって説明されるようなコンピュータメモリ圧縮装置２０５の構造的特徴および実施形態のいずれかまたは全てによって実行される機能に対応する機能ステップを含むことができる。

【0024】

コンピュータメモリ圧縮装置２０５は、一方の側でメモリコントローラに、また他方の側で最後のレベルのキャッシュＣ３に接続されている。アドレス変換ユニット２１１の目的は、従来の物理アドレスＰＡを圧縮アドレスＣＡに変換して、圧縮メモリ内のメモリブロックを位置特定することである。当業者であれば、従来のメモリページ（例えば、４ＫＢ）を圧縮メモリ内で任意のサイズに圧縮することができるので、このようなアドレス変換が必要であることを理解するであろう。符号化（コンプレッサ）ユニット２１２の目的は、修正され、最後のレベルのキャッシュから追い出されたメモリブロックを圧縮することである。メモリシステムの性能への影響を無視できるようにするには、圧縮を高速にする必要があり、通常は、専用のコンプレッサユニットによって加速される。同様に、メモリブロックがプロセッサによって要求され、キャッシュレベル、例えば、例示的な実施形態ではＣ１、Ｃ２およびＣ３のいずれをも利用可能でない場合、メモリブロックは、メモリから要求されなければならない。アドレス変換ユニット２１１は、ブロックを位置特定するが、キャッシュ階層、例えばＣ１にインストールされる前に、解凍されなければならない。デコンプレッサユニット２１３の目的は、このプロセスを加速して、メモリシステムの性能への影響を無視できるようにすることである。

【0025】

当業者であれば、コンプレッサおよびデコンプレッサユニットの機能は、使用されている圧縮アルゴリズムのタイプに依存することを理解することができる。一実施形態では、デルタ符号化（ベースデルタ即符号化など）を使用することができ、値そのものではなく、値とベース値との間の差が格納される。別の実施形態では、エントロピーベースの符号化（ハフマン符号化など）を使用することができ、この場合、他の値よりも頻繁な値は、より密な符号を使用する。第三の実施形態では、固有ブロックのみがメモリに格納される重複排除を使用することができる。本発明の開示の目的は、値冗長性を除去するために、全ての圧縮アルゴリズムをカバーすることである。

【0026】

図２に従う実施形態によれば、文書の残りの部分は、コンピュータメモリコンテンツ（例えば、メモリページ）を符号化する方法と、圧縮メモリ内のメモリオブジェクト（例えば、メモリブロック）を位置特定する方法と、個別メモリオブジェクト（例えば、メモリブロック）を圧縮および解凍する方法と、最後に、コンピュータメモリコンテンツ（例えば、メモリページ）を再圧縮して追加の重複および値冗長性を除去する方法に関して、重複排除および値冗長性除去圧縮に基づいて組み合わせた圧縮アプローチを使用して、装置、方法およびシステムを提供する構造を以下で述べる。

【0027】

（メモリページのデータ分析および符号化）
図３のエントロピーベースの圧縮と組み合わせた重複排除を使用して、メモリページをどのように圧縮するかの例示的な概要を提供する。しかしながら、デルタ符号化（例えば、ベースデルタ即符号化）のような他の値冗長性除去圧縮方法も可能であることに留意されたい。ページの例示的なレイアウト３００は、図３の左側に（Ａ）で示され、１、２、…、Ｎと番号が付され、従来の非圧縮コンピュータメモリ内の連続するメモリブロックアドレスに現れるＮ個のブロックを含み、３１０は第一のメモリブロックを表し、３２０は最後のメモリブロックを表す。重複排除の狙いは、重複ブロックを除去して、固有ブロックのみがメモリページに属するようにすることである。図３の中央に（Ｂ）で示すページ内のメモリブロックの例示的なレイアウト３００では、３４０および３５０によって表現されるメモリブロックは、重複である。重複したデータをメモリに格納する代わりに、後で詳述するように、固有ブロックへの参照（例えば、ポインタ）のみを格納する。メモリブロック３５０は、３７０と付されたポインタを使用して、メモリブロック２（３３０）を参照する。同様に、メモリブロック３４０は、３６０と付されたポインタを使用して、メモリブロック１を参照する。したがって、重複排除プロセスの後、メモリページには、個別のコンテンツを有し、固有メモリブロックと呼ばれるメモリブロックのみが含まれる。

【0028】

また、従来技術には、ハフマン符号化のように頻繁に使用されないデータよりも密度の高い頻繁に使用されるデータを符号化する圧縮方法、またはデルタ符号化（例えば、ベースデルタ即符号化）のように数値が類似していることを利用する圧縮方法が含まれる。これらの圧縮方法は、値冗長性除去圧縮方法と呼ばれる。値冗長性除去圧縮方法を使用してページを圧縮するためには、通常、ある粒度で、例えば、ワードレベル（例えば、６４ビット）で、全ての個々のデータ項目を分析する。値頻度分布は、ページ内の異なる値の相対的な発生を捕捉する。しかしながら、メモリページの元のコンテンツに簡単に適用すると、重複排除の前に、重複が存在すると、値分布が劇的に変化することがある。この理由から、提案された実施形態は、重複排除を最初に適用して、重複を除去し、その後、残りの固有メモリブロックの値分布を確立する。図３の（Ｃ）に見られる最も右側の例示的なレイアウトは、値冗長性除去圧縮を適用した後の結果を示す。１（３８０）および２（３９０）で示される固有メモリブロックのサイズは、ここでは、より小さくすることができる。なぜなら、値冗長性除去圧縮では、低頻度のデータ項目よりも密度の高い高頻度のデータ項目を符号化することができるからである。

【0029】

ここで、図３に例示されているように、組み合わせたアプローチがどのように実現されるかに注目する。これは、図４～図７に関連して説明する。前の段落で説明したように、重複排除と組み合わせて値冗長性除去圧縮の完全なポテンシャルを実現するためには、最初に、重複排除を行うことが重要である。一実施形態では、重複排除は、単一ページ内の全てのメモリブロックを順次分析することによって実現することができ、複数ページ内の全てのメモリブロックを考慮する可能性を排除するものではなく、それが固有であるかどうかを確立することを目的とする。この目的のために、分析される第一のメモリブロックは、常に固有のものとして分類される。図４に注目すると、例示的なツリーデータ構造４００は、全ての固有ブロックを記録する。ブロックが挿入される前に、従来技術から知られているブロックのシグネチャを作成する。シグネチャは、２つのメモリブロックのシグネチャが異なる場合、それらは同一ではないという特性を有するブロックの値の密な表現である。しかしながら、その逆は、成り立たないこともある。

【0030】

メモリブロックが固有であり、ツリーベースのデータ構造内に挿入されなければならないかどうかを確立するために、そのシグネチャを、まず、ツリーデータ構造４００内の最上位ノード４１０のシグネチャと比較する。同じである場合、２つのメモリブロックのコンテンツを比較するために、第二のテストを実行する。メモリブロックが同一である場合、重複ブロックが検出されている。これと同じ動作が、ツリーベースのデータ構造内の各ノードで実行される。しかしながら、シグネチャが同じでも、２つのブロックが同一でない場合は、新しいブロックを同じシグネチャで挿入する必要がある。これは、偽陽性を処理するために、以下の追加のテストを含むことができる。作成されたシグネチャＳがツリーデータ構造４００内に表現されるシグネチャと一致する場合６５０、
・前記個別メモリオブジェクトが、一致する前記シグネチャによって表現される前記固有メモリブロックと同一であるかどうかを決定するステップと、
・前記個別メモリオブジェクトと、一致する前記シグネチャによって表現される前記固有メモリブロックとが同一でない場合、
〇ツリーデータ構造４００にノードを挿入するステップと、
〇挿入したノードに作成したシグネチャＳを入力するステップと、
〇個別メモリオブジェクトに対するメタデータ５００を、それが固有メモリオブジェクトであることを示す情報５１０と、個別メモリオブジェクトに対する固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）とを用いて、生成するステップと、
を含む。

【0031】

一方、シグネチャが一致しない場合、探索（ｓｅａｒｃｈ）は、シグネチャが最上位ノード４１０のシグネチャよりも小さい場合、４６０でのテストに従って、ツリーの左分岐に進む。シグネチャが最上位ノードのシグネチャよりも大きい場合、探索は、テスト（ボックス４７０）に従って、ツリーの右分岐に進む。したがって、全てのノード４１０、４２０、４３０、４４０および４５０は、降順（左分岐）および昇順（右分岐）に編成され、探索時間を線形的ではなく対数的にする。重複はプロセス内で除去されるため、メモリブロックは、従来の非圧縮ページと同じアドレスに存在しない。このため、ブロックの新しい位置は、「ブロック位置＿ＢＬ」によって各ノードに示されるように、ツリーベースのデータ構造に記録される。

【0032】

重複排除プロセスの最終的な結果は、重複する全てのメモリブロックが排除されたことである。このため、図３に関連して説明したように、メモリブロックは、元の重複排除されていないページと同じ重複排除されたページ内の同じ位置に存在しない場合がある。このため、圧縮メモリ内のメモリブロックを位置特定する方法を支援し、後でさらに詳細化するには、重複排除プロセスでメタデータを生成する必要がある。

【0033】

図５は、左側の（Ａ）に、各メモリブロックのプロセスで生成される例示的なメタデータ５００が示されている。メタデータ５００は、タイプ（５１０）、ブロック符号化ＥＮＣ（５２０）、Ｕ＿ＰＴＲ（５３０）、およびＤ＿ＰＴＲ（５４０）の４つの構成要素からなる。タイプは、ブロックが固有か重複かを示す。ＥＮＣで示されるブロック符号化は、メモリブロックコンテンツに適用される圧縮アルゴリズムのタイプ、例えば、ハフマン符号化または算術符号化などを示す。メモリブロックが固有である場合は、それを位置特定するためのポインタが必要である。これは、Ｕ＿ＰＴＲ（５３０）で表現される。一方、ブロックが重複している場合は、固有コピーへのポインタが必要である。固有コピーと同様に、Ｕ＿ＰＴＲ（５３０）は、圧縮メモリ内の固有コピーを指す。

【0034】

図５の右側は、（Ｂ）において、ページ内の３つの選択されたメモリブロックの例示的なレイアウトを示し、ここでは、メモリブロック５７０は固有であり、メモリブロック５８０および５９０はメモリブロック５７０の重複である。ここで、重複のＵ＿ＰＴＲは、固有メモリブロック５７０を指す。しかしながら、動作中に、固有ブロックが変更されることが起こり得る。その場合、ボックス５８０および５９０によれば、重複ブロックと同じコンテンツを含まなくてもよい。このため、固有メモリブロックの観点から重複を追跡する必要がある。このために、Ｄ＿ＰＴＲで示されるポインタが設けられている。これらのポインタは、全ての重複メモリブロックを対応する固有メモリブロックと一緒にリンクするリンクデータ構造を確立する。この例では、固有メモリブロック５７０のＤ＿ＰＴＲ（５５０）は、重複メモリブロック５８０を指している。重複メモリブロックボックス５８０のＤ＿ＰＴＲは、他の重複メモリブロック５９０を指している。

【0035】

したがって、要約すると、メタデータ５００は、符号化されたコンピュータメモリコンテンツの各メモリオブジェクトについて、有利なことに、
・メモリオブジェクトが排除された重複メモリオブジェクトまたは残りの固有メモリオブジェクトであることを示す情報５１０と、
・メモリオブジェクトが固有メモリオブジェクトの場合、使用された圧縮のタイプを示す情報５２０と、固有メモリオブジェクトへの固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）と、
・メモリオブジェクトが重複メモリオブジェクトの場合、固有メモリオブジェクトへの固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）であって、その非圧縮コンテンツは重複メモリオブジェクトと同一である、固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）と、
を含む。

【0036】

有利なことに、メタデータ５００は、各メモリオブジェクトが固有メモリオブジェクトであるために、排除された重複メモリオブジェクトへの重複メモリオブジェクト参照５４０、Ｄ＿ＰＴＲをさらに含み、その非圧縮コンテンツは、固有メモリオブジェクトと同一である。

【0037】

ここで、１つのページ内の全てのメモリブロックを分析することによって、メモリブロックが重複排除されるプロセス全体を確立する（複数ページなどの他の粒度も適用可能である）。このプロセスは、図６のフローグラフに示されている。図４に関連して既に述べたように、メモリブロックを重複排除するプロセス６００は、最終的に全ての固有メモリブロックを含むツリーベースのデータ構造４００を使用する。プロセス６００は、ページの全てのメモリブロックを順次分析する。第一の決定ステップ６２０は、ページの全てのメモリブロックを訪問したかどうかを確認する。訪問していない場合、次のメモリブロックが考慮される。図４に関連して説明したように、そのブロックのシグネチャは、従来技術で知られている何らかの方法に従って作成され、一致が検出されない限り、シグネチャは、ツリー内の全てのノードと比較される。結局、２つの結果がある。ブロックが固有である場合、決定するステップ６４０でテストされるように、ブロックを６６０で挿入する。次いで、メモリブロック位置が、ページ内のメモリブロックの数とともに記録される。ブロックが固有でない場合、６５０において重複排除され、既にツリーベースのデータ構造に記録されている固有ブロックのブロック位置へのポインタが、図５に従って、メタデータのＵ＿ＰＴＲポインタに割り当てられる（５３０参照）。結果にかかわらず、次のアクションは、決定ステップ６２０に戻って、ページの次のメモリブロックを分析することである。

【0038】

図４～図６の説明から理解されるように、コンピュータメモリ圧縮装置２０５のアナライザユニット２１４および符号化ユニット２１２は、したがって、コンピュータメモリコンテンツ内の各個別メモリオブジェクトを、
・シグネチャＳを作成するステップであって、シグネチャはメモリオブジェクトのデータ値の緻密表現である、ステップと、
・ツリーデータ構造４００を横断して、作成された前記シグネチャＳをツリーデータ構造４００で既に表現されているシグネチャと比較するステップと、
・作成されたシグネチャＳがツリーデータ構造４００で表現されたシグネチャのいずれとも一致しない場合６６０、
〇ツリーデータ構造４００にノードを挿入するステップと、
〇挿入したノードに作成したシグネチャＳを入力するステップと、
〇個別メモリオブジェクトに対するメタデータ５００を、それが固有メモリオブジェクトであることを示す情報５１０と、個別メモリオブジェクトに対する固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）とを用いて、生成するステップと、
・作成されたシグネチャＳがツリーデータ構造４００内に表現されるシグネチャと一致する場合６５０、
〇前記個別メモリオブジェクトに対するメタデータ５００を、それが重複メモリオブジェクトであることを示す情報５１０と、ツリーデータ構造４００内で一致する前記シグネチャによって表現される固有メモリブロックに対する固有メモリオブジェクト参照（５３０、Ｕ＿ＰＴＲ）とを用いて、生成するステップと、
〇ツリーデータ構造４００内で一致する前記シグネチャによって表現される固有メモリブロックのメタデータ５００を更新して、前記個別メモリオブジェクトに対する重複メモリオブジェクト参照（５４０、Ｄ＿ＰＴＲ）を導入するステップと、
を行うことによって、処理する６００ように構成される。

【0039】

指摘したように、例えば、ワードレベルで、個々のデータ項目の値局所性を活用することを目的とする任意の圧縮方法の前に重複排除を適用することは、重複が値頻度分布を正しく表さないので重要である。この目的のために、固有ブロックの値頻度分布を確立するプロセスが必要とされている。このようなプロセス７００を図７に示す。全体的なプロセス７００の狙いは、図４のツリーベースのデータ構造４００に記録された全ての固有のメモリブロックを分析することである。プロセス７００は、ステップ７１０で開始する。全ての固有メモリブロックが訪問されていない限り（ステップ７２０）、プロセス７００は、各訪問された固有ブロックの値頻度を記録する。これは、ステップ７３０で、ハッシュテーブルに個々の各値の頻度を記録することによって行うことができる。最後に、全ての固有メモリブロックの値頻度を確立することができ、ハフマン符号化または算術符号化などの任意の値局所性ベースの圧縮方法に基づく符号化を、ステップ７４０で確立することができる。

【0040】

したがって、コンピュータメモリ圧縮装置２０５のアナライザユニット２１４および符号化ユニット２１２は、コンピュータメモリコンテンツ内の全てのメモリオブジェクトが処理された場合６００、
・ツリーデータ構造４００を横断して、ツリーデータ構造４００のノードによって表現される固有メモリオブジェクトのデータ値の値頻度表を生成するステップと、
・生成された値頻度表を使用して、エントロピーベースの圧縮スキームによって各固有メモリオブジェクトを圧縮するステップと、
を行なうように構成され得る。

【0041】

そのような一実施形態では、アナライザユニットは、例えばハフマン符号化または他のエントロピーベースの符号化技法を使用して符号化を確立するために、おそらくソフトウェアルーチンを使用して、後の分析に使用される各値の頻度を記録するハッシュテーブルを実装することができる。

【0042】

代替の実施形態では、デルタ符号化（例えば、ベースデルタ即符号化）を使用して、重複が除去された後に残る値を使用して、１つまたは複数のベース値を選択することができる。１つのアプローチでは、クラスタリング技法を使用して、重複が除去された後に、どのベース値がページ内の一意のコピー内の全ての値に最も近いかを分析することができる。

【0043】

したがって、代替として、コンピュータメモリ圧縮装置２０５のアナライザユニット２１４および符号化ユニット２１２は、前記コンピュータメモリコンテンツ内の全てのメモリオブジェクトが処理された場合６００、
・ツリーデータ構造４００を横断して、ツリーデータ構造４００のノードによって表現される固有メモリオブジェクトのデータ値の値頻度表を生成するステップと、
・生成された値頻度表を使用して、エントロピーベースの圧縮スキームによって各固有メモリオブジェクトを圧縮するステップと、
を行なうように構成され得る。

【0044】

（圧縮されたメモリ内のメモリブロックの位置特定）
次に、重複排除と値冗長性除去の組み合わせ圧縮技法を使用して、圧縮メモリ内でメモリブロックがどのように位置特定され、解凍されるかに注目する。図２に戻ると、ロケータ（アドレス変換）ユニット２１１のタスクは、従来の物理アドレスを圧縮アドレス空間内のアドレスに変換することであることを思い出されたい。図１０は、図２のロケータ（アドレス変換）ユニット２１１の詳細なレイアウト１０００を示す。これは、いくつかのページエントリを含み、その各エントリ１０１０がいくつかのフィールド、すなわち、物理アドレス１０１１および圧縮アドレス１０１２を含む。これらは、ページの物理アドレスおよび圧縮アドレスにそれぞれ対応する。図５の１０２１～１０２３に見られるように、各ページエントリは、各ブロックのメタデータＭＤ１、…、ＭＤＮに関連付けられている。メタデータの詳細については、前述したように、図５の左端（Ａ）を参照されたい。図５に示すように、メモリブロックが固有であるか重複排除されているかにかかわらず、Ｕ＿ＰＴＲは、圧縮アドレスＣＡに対するブロックの位置へのオフセットとして機能する。加算器１０３０は、Ｕ＿ＰＴＲと圧縮アドレスＣＡ１０１２との和を確立することによって、ブロックアドレス１０４０を形成する。

【0045】

図２のプロセッサの１つ（Ｐ_１～Ｐ_Ｎと表示される）が、キャッシュレベル（Ｃ_１、Ｃ_２またはＣ_３）のいずれかによって満たすことができない読み取り要求を発行すると、図２／図１０内のロケータ（アドレス変換）ユニット２１１／１０００によって処理され、物理アドレスＰＡは、ＰＡに関連付けられた圧縮アドレスＣＡを、要求されたブロックのメタデータと一緒に使用して、上記で説明したプロセスに従って変換される。しかしながら、書き込み要求がいずれのレベルのキャッシュでも満たされない場合、その書き込みによって、どのブロックが固有であるか、どのブロックが重複排除されるかに影響を与える可能性がある。図８の最も左のシナリオ（Ａ）を考察する。ここで、固有ブロックは、８３０で表される。８１０および８２０によって表される２つの重複排除されたブロックは、同じコンテンツを有し、それらのＵ＿ＰＴＲは、固有ブロック８３０を指す。重複排除されたメモリブロック８１０、８２０は、メモリブロック８２０に固有ブロックのＤ＿ＰＴＲ点を有し、メモリブロック８１０に同じブロックのＤ＿ＰＴＲ点を有することによって、固有ブロック８３０にリンクされる。

【0046】

次に、書き込み要求が固有メモリブロック８３０に宛てられていると仮定し、図８の最も右のシナリオ（Ｂ）に注目する。固有メモリブロック８３０の重複が存在するので、そのメモリブロックを保持することが望ましいことがある。これは、図８の８４０によって表される専用の空きメモリ領域を使用して行われる。これは、おそらく、ページ内で、固有メモリブロック８３０の古いコンテンツをコピーするためであるが、必ずしもそうである必要はない。その空きメモリ領域の現在の開始アドレス８０５は、参照によって、例えば、Ｆ＿ＰＴＲで示される専用ポインタによって指される。固有メモリブロック８３０の古いコンテンツは、８７０で見たように空き領域８４０にコピーされ、重複排除されたメモリブロック８１０、８２０のＵ＿ＰＴＲは、今や８７０に存在する古い固有メモリブロックを指す。さらに、Ｄ＿ＰＴＲは、重複排除されたメモリブロック８１０、８２０を８７０に存在する古い固有メモリブロックにリンクするように変更される。あるいは、ブロック８７０のＤ＿ＰＴＲのみがブロック８２０を指すように更新されるのに対し、Ｄ＿ＰＴＲの残りは図８の左端部分（Ａ）に見られるように残り、すなわち、リンクされたリストのヘッドのみが更新される。元の場所、すなわち、８３０に存在する固有のメモリブロックは、今度は、書き込み要求に従って、新しいコンテンツで更新することができる。Ｆ＿ＰＴＲは、８８０に示すように、空きメモリ領域の変更された開始アドレスを反映するようにも更新される。

【0047】

図８の固有メモリブロック８３０に宛てられた書き込み要求を処理する別の方法は、以下の通りである。しかしながら、図８の詳細な内容は、以下の説明を反映していないことに留意されたい。重複排除されたメモリブロック８２０は、固有メモリブロック８３０のシグネチャＳを使用することによって、ツリーデータ構造４００（図４参照）内で固有のものとしてプロモートされる。書き込み要求に従った固有メモリブロック８３０の更新されたコンテンツが、専用空きメモリ領域８４０に書き込まれる。８３０のＵ＿ＰＴＲは、新しいブロックが空きメモリ領域内のどこにあるかを示すように更新され、８３０のＤ＿ＰＴＲは、除去されるか、あるいは少なくとも、どこも示さないように更新される。なぜなら、ブロック８３０は、重複の検出されない固有ブロックだからである。Ｆ＿ＰＴＲは、書き込み後に、新規開始アドレスを反映するように更新される。

【0048】

次に、書き込み要求が重複排除されたブロックに宛てられたシナリオを考え、図９の最も左のシナリオに注目する。ここで、固有メモリブロック９１０と同じコンテンツを有する２つの重複排除メモリブロック９２０および９３０があり、Ｕ＿ＰＴＲおよびＤ＿ＰＴＲは、前の段落で説明したように、このケースを反映するようにセットアップされている。ここで、書き込み要求が、最も左のシナリオの重複排除されたブロック９２０に宛てられていると仮定する。重複排除されたブロックのコンテンツは変更されるため、そのコンテンツは固有メモリブロック９１０と同一ではない。代わりに、更新された重複排除されたブロックが９８０の空き領域に配置され、Ｄ＿Ｕと示される。ここで、ブロック９２０のＵ＿ＰＴＲは、新しい固有ブロック９８０を指すように変更され、そのブロックのＤ＿ＰＴＲは、重複排除ブロック９２０を指すようになる。さらに、以前に重複排除されたブロックを固有のブロック９１０にリンクしたＤ＿ＰＴＲが、他の重複排除されたブロック９３０を指すように変更され、そのブロックの９３０Ｕ＿ＰＴＲは、固有ブロック９１０を指すようになる。

【0049】

図８および図９の両方のシナリオにおいて、書込み動作は、既に存在しても存在しなくてもよい新しいブロックコンテンツを生成することに留意されたい。記載されたプロセスでは、新しいブロックが他の既存のブロックと同一であるかどうかを分析する試みはない。その結果、それらは、固有ブロックを追跡するツリー構造に挿入される必要はない。しかしながら、後の分析フェーズでは、重複排除のためのより多くの機会を見つけるために、新しく作成されたブロックを含む全てのブロックのコンテンツを再び訪問することができる。

【0050】

（メモリブロックの圧縮、解凍および再圧縮）
図５のメタデータの一部は、符号化（５２０のＥＮＣ）に使用される圧縮アルゴリズムを含む。ブロックがメモリから検索されると（ｒｅｔｒｉｅｖｅｄ）、解凍される。これは、図１１において、圧縮アルゴリズム（ＥＮＣ）のタイプおよびメモリからの解凍されたブロックを入力として取るデコンプレッサユニット１１１０によって示されている。圧縮アルゴリズムのタイプは、重複排除、エントロピーベースの圧縮、デルタ符号化（例えば、ベースデルタ即符号化）、または値冗長性を除去することを目的とする任意の他の圧縮方法とすることができる。

【0051】

ブロックが図２の例示的な実施形態の最後のレベルのキャッシュＣ３から交換される場合には、そのブロックは修正されていてもよく、その後ライトバック要求を生成してもよい。その後、メモリに書き戻す前に、圧縮する必要がある。図２のロケータ（アドレス変換）ユニット２１１に問い合わせが行われる。ブロックが属するページのメタデータのエントリがある場合、そのメタデータは、ブロックの圧縮に使用される圧縮アルゴリズムを符号化する。図８および図９のシナリオに戻って参照すると、ライトバック要求が固有ブロック（図８）または重複排除されたブロック（図９）に対するものであることが起こり得る。このような場合、アドレス変換ユニットとそれに関連するロジックは、メタデータを変更するのを支援し、このプロセスで生成される重複の数を減らすのに役立つ。

【0052】

図８～図１１の説明は、以下のように要約し、一般化することができる。コンピュータメモリ圧縮装置２０５は、有利なことに、
・物理メモリページアドレスＰＡを有するメモリページ内のメモリブロックの読み取り要求を受信するステップと、
・ルックアップテーブル１０１０からの圧縮メモリページアドレスＣＡを決定するステップと、
・メモリブロックに対するメタデータ１０２０を検索するステップと、
・圧縮メモリページアドレスＣＡと検索されたメタデータの固有メモリオブジェクト参照５３０、Ｕ＿ＰＴＲからの圧縮メモリブロックアドレス１０４０を計算するステップと、
・計算された圧縮メモリブロックアドレス１０４０での圧縮メモリブロック１１０５を検索するステップと、
・圧縮のタイプを示し、メモリブロックに対して検索された前記メタデータで利用可能な情報５２０；１１２０、ＥＮＣを使用して、デコンプレッサユニット２１３によって、検索された圧縮メモリブロック１１０５を解凍するステップ１１１０と、
を行うように構成することができる。

【0053】

図８を参照して説明されたように、コンピュータメモリ圧縮装置２０５は、有利なことに、
・当初メモリ位置における固有メモリブロック８３０の更新を含むライトバック要求を受信するステップと、
・コンピュータメモリコンテンツの専用空きメモリ領域８４０内の新規メモリ位置８７０に更新する前に、固有メモリブロック８３０をコピーするステップと、
・固有メモリブロック８３０にリンクされた重複メモリブロック８１０、８２０のメタデータを更新して、その前記重複メモリオブジェクト参照５４０、Ｄ＿ＰＴＲが専用空きメモリ領域８４０内の前記新規メモリ位置８７０にリダイレクトされるようにするステップと、
・ライトバック要求に従って、その当初メモリ位置８３０で固有メモリブロックを更新するステップと、
をさらに行うように構成される。

【0054】

また、コンピュータメモリ圧縮装置２０５は、有利なことに、
・専用空きメモリ領域８４０の開始アドレス８０５への参照Ｆ＿ＰＴＲを含むメタデータを提供するステップと、
・専用空きメモリ領域８４０内の新規メモリ位置８７０への固有メモリブロック８３０をコピーした後に、新規開始アドレス８８０を反映するように、前記参照Ｆ＿ＰＴＲを更新するステップと、
をさらに行うように構成され得る。

【0055】

図８の代替として説明したように、コンピュータメモリ圧縮装置２０５は、有利なことに、
・当初メモリ位置における固有メモリブロック８３０の更新を含むライトバック要求を受信するステップと、
・重複排除メモリブロック８２０が固有メモリブロック８３０の重複であることを見つけるステップと、
・固有メモリブロック８３０のシグネチャＳを使用することによって、見つかった重複排除メモリブロック８２０をツリーデータ構造４００内で固有のものとしてプロモートするステップと、
・専用空きメモリ領域８４０内の新規メモリ位置８７０へのライトバック要求に従って、固有メモリブロック８３０の更新されたコンテンツを書き込むステップと、
・固有メモリブロック８３０のメタデータを更新して、その前記固有メモリオブジェクト参照５３０、Ｕ＿ＰＴＲが専用空きメモリ領域８４０内の新規メモリ位置８７０にリダイレクトされるようにして、その一方で、その重複メモリオブジェクト参照５４０、Ｄ＿ＰＴＲは除去される、ステップと、
をさらに行うように構成され得る。

【0056】

また、コンピュータメモリ圧縮装置２０５は、有利なことに、
・専用空きメモリ領域８４０の開始アドレス８０５への参照Ｆ＿ＰＴＲを含むメタデータを提供するステップと、
・専用空きメモリ領域８４０の新規メモリ位置８７０へのライトバック要求に従って、固有メモリブロック８３０の更新されたコンテンツの書き込み後に、新規開始アドレス８８０を反映するように前記参照Ｆ＿ＰＴＲを更新するステップと、
をさらに行うように構成され得る。

【0057】

図９を参照して説明されたように、コンピュータメモリ圧縮装置２０５は、有利なことに、
・重複メモリブロック９２０の更新を含むライトバック要求を受信するステップと、
・更新された前記重複メモリブロックのコンテンツを、専用空きメモリ領域９４０内の新規固有メモリブロック９８０として格納するステップと、
・重複メモリブロック９２０に以前にリンクされた固有メモリブロック９１０のメタデータを更新して、固有メモリブロック９１０が、固有メモリブロック９１０と他の重複メモリブロック９３０との間のリンクを維持しつつ、重複メモリブロック９２０にリンクされなくなったことを反映するステップと、
をさらに行うように構成され得る。

【0058】

ライトバック要求の結果として、図８および図９に関連して説明したように、固有コピーおよび重複排除コピーが更新され、不必要な重複が起こらないようにするために使用される空き領域に最終的に入る。しかしながら、時間の経過とともに、これは、圧縮率が劣化するという効果を有し得る。一実施形態では、圧縮率は、常に監視される。事前に設定された閾値を超えると、ページの再圧縮を実行するために、重複の発生および値冗長性に関して、メモリページを分析することを目的としたプロセスが開始される。これらのプロセスは、図６および図７に示したものと同じであってもよい。別の実施形態では、ページは、再圧縮が必要であるかどうかを評価するために定期的に訪問される。必要と判断された場合には、図６および図７に示し、前の段落で説明したプロセスを起動する。

【0059】

したがって、コンピュータメモリ圧縮装置２０５は、有利なことに、
・メモリページの圧縮率を経時的に監視するステップと、
・圧縮率が所与の基準を満たさない場合、本明細書に記載のコンピュータメモリ圧縮方法１２００の機能を実行することによって、メモリページの再圧縮を実行するステップと、
をさらに行うように構成され得る。

【0060】

代替または追加として、コンピュータメモリ圧縮装置２０５は、メモリページの再圧縮を定期的に実行して、本文書に記載のコンピュータメモリ圧縮方法１２００の機能を実行することによって、圧縮率を改善するように、さらに構成され得る。

【0061】

本発明の態様は、例示的な実施形態を参照することによって本明細書で説明してきたが、本発明の態様は、開示された実施形態に限定されず、当業者によって実現され得る代替的な実施形態を網羅する。

【0062】

本発明の１つの代替態様は、データ項目の重複および値冗長性を排除することによって、コンピュータメモリデータを圧縮する目的で、コンピュータメモリデータを分析するためのシステムと見なすことができ、このシステムは、重複および値冗長性を排除する手段と、重複および値冗長性を排除した後にデータ項目を位置特定する手段と、前記圧縮方法を使用してデータ項目を圧縮および解凍する手段と、データ項目を再圧縮する手段とを備える。

【0063】

本発明の別の代替態様は、データ項目の重複および値冗長性を排除することによって、コンピュータメモリデータを圧縮する目的で、コンピュータメモリデータを分析するための方法と見なすことができ、この方法は、重複および値冗長性を排除するステップと、重複および値冗長性を排除した後にデータ項目を位置特定するステップと、前記圧縮方法を使用してデータ項目を圧縮および解凍するステップと、データ項目を再圧縮するステップとを含む。

【0064】

本発明のさらに別の代替態様は、データ項目の重複および値冗長性を排除することによって、コンピュータメモリデータを圧縮する目的で、コンピュータメモリデータを分析するための装置と見なすことができ、この装置は、重複および値冗長性を排除するステップと、重複および値冗長性を排除した後にデータ項目を位置特定するステップと、前記圧縮方法を使用してデータ項目を圧縮および解凍するステップと、データ項目を再圧縮するステップとを行うように構成される。

【0065】

開示された本発明のさらに別の代替態様は、メモリブロックの重複の発生に関して、および残りの固有のメモリブロックの値冗長性の発生に関して、メインメモリ内のページのコンテンツを分析する手段を有するデータ分析のためのシステムを含むものとして見ることができる。開示された発明は、また、メモリの重複および値冗長性を除去するための手段を有するシステムを含む。さらに、開示された発明は、重複および値冗長性が除去された後に個々のメモリブロックを位置特定する手段と、それを使用してメモリブロックを圧縮および解凍する手段とを有するシステムを含む。最後に、開示された発明は、メモリページを再圧縮する手段を有するシステムを含む。

【0066】

本発明のさらなる代替態様は、メモリブロックの重複の発生に関して、および残りの固有メモリブロック内の値の相対頻度に関して、メインメモリ内のページのコンテンツを分析する方法と、重複排除および値局所性ベースの符号化方法の両方を考慮してメモリブロックを符号化する方法と、重複排除および値局所性ベースの圧縮技法の組み合わせのファミリについて、圧縮メモリ内の個々のメモリブロックを位置特定する方法と、それを使用してメモリブロックを圧縮および解凍する方法として見ることができる。最後に、開示された発明は、メモリページを再圧縮するための方法を含む。

【0067】

他の本発明の代替態様は、メモリブロックの重複の発生に関して、および残りの固有メモリブロック内の値の相対頻度に関して、メインメモリ内のページのコンテンツを分析するように構成されたアナライザ装置と、残りの固有ブロック内の重複排除および値冗長性を考慮してメモリブロックを符号化するように構成されたデータ符号化装置と、重複排除および値局所性ベースの圧縮技法の組み合わせのファミリについて、圧縮メモリ内の個々のメモリブロックを位置特定するように構成されたメモリブロックロケータ装置と、それを使用してメモリブロックを圧縮および解凍するように構成された装置と、メモリページを再圧縮するように構成された装置として見ることができる。

【図1】