特許7555821 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ アンスティテュ　ミーヌ−テレコムの特許一覧

特許7555821データを符号化及び復号化する方法及び装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7a
7b
7c
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-09-13

(45)【発行日】2024-09-25

(54)【発明の名称】データを符号化及び復号化する方法及び装置

(51)【国際特許分類】

H03M 13/47 20060101AFI20240917BHJP

G06F 3/06 20060101ALI20240917BHJP

G11B 20/18 20060101ALI20240917BHJP

【ＦＩ】

H03M13/47

G06F3/06 305C

G11B20/18 532B

G11B20/18 572F

【請求項の数】 18

(21)【出願番号】P 2020555866

(86)(22)【出願日】2019-04-10

(65)【公表番号】

(43)【公表日】2021-08-26

(86)【国際出願番号】 EP2019059119

(87)【国際公開番号】W WO2019197482

(87)【国際公開日】2019-10-17

【審査請求日】2022-03-15

(31)【優先権主張番号】1853246

(32)【優先日】2018-04-13

(33)【優先権主張国・地域又は機関】FR

(73)【特許権者】

【識別番号】510229496

【氏名又は名称】アンスティテュ・ミーヌ・テレコム

(74)【代理人】

【識別番号】110001173

【氏名又は名称】弁理士法人川口國際特許事務所

(72)【発明者】

【氏名】バッコーシュ，ハナ

(72)【発明者】

【氏名】ブーカテム，ナディア

【審査官】吉江一明

(56)【参考文献】

【文献】特表２０１８－５０７４６２（ＪＰ，Ａ）

【文献】国際公開第２０１６／０５２６６５（ＷＯ，Ａ１）

【文献】Cheng Huang et al.，Erasure Coding in Windows Azure Storage，USENIX，2013年04月11日，https://www.usenix.org/system/files/conference/atc12/atc12-final181_0.pdf

【文献】Cheng Huang et al.，Pyramid Codes: Flexible Schemes to Trade Space for Access Efficiency in Reliable Data Storage Systems，PROC. SIXTH IEEE INTERNATIONAL SYMPOSIUM ON NETWORK COMPUTING AND APPLICATIONS 2007，2007年07月01日，https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/tr-2007-25.pdf

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０３Ｍ１３／４７

Ｇ０６Ｆ３／０６

Ｇ１１Ｂ２０／１８

ＩＥＥＥＸｐｌｏｒｅ

(57)【特許請求の範囲】

【請求項1】

（ｋ，ｒ）個のデータを符号化する方法であって、
－初期データａを同一サイズのｋ個のデータブロックａ_ｉに分割するステップ（３０２）と、
－前記ｋ個のデータブロックａ_ｉをデータブロックのｒ－１個の接続されていない部分集合Ｓ_ｊ（１≦ｊ≦ｒ－１）にグループ化するステップ（３０４）と、
－各部分集合Ｓ_ｊ毎に、前記部分集合Ｓ_ｊに割り当てられたデータブロックの一次結合として定義される一次関数ｇ_ｊ（ａ）を生成するステップ（６０６）と、
－前記ｋ個のデータブロックａ_ｉの一次結合としての一次パリティ関数ｆ_０（ａ）、及び各二次パリティ関数ｆ_ｊ（ａ）が前記一次パリティ関数ｆ_０（ａ）と一次関数ｇ_ｊ（ａ）の和として定義されるｒ－１個の二次パリティ関数を含むｒ個のパリティ関数を生成するステップ（６０４）とを含む方法。

【請求項2】

前記ｒ個のパリティ関数を生成するステップ（３０８）が、ｒ個の符号化ベクトルを生成するステップ（３０６）を含み、前記符号化ベクトルが、
－ｋ個の一次符号化係数ｃ_０，１～ｃ_０，ｋを含む一次符号化ベクトルＣ_０と、
－各二次符号化ベクトルがｋ個の二次符号化係数ｃ_ｊ，１～ｃ_ｊ，ｋを含むｒ－１個の二次符号化ベクトルＣ_ｊ（１≦ｊ≦ｒ－１）とを含む、請求項１に記載の方法。

【請求項3】

各一次符号化係数ｃ_０，ｉが非ゼロ乱数に対応し、二次符号化係数ｃ_ｊ，ｉが前記データブロックａ_ｉが前記部分集合Ｓ_ｊに属するか否かに応じて非ゼロ乱数又はゼロ乱数に対応している、請求項２に記載の方法。

【請求項4】

前記一次関数ｇ_ｊ（ａ）を生成するステップが、ｋ個のデータブロック（ａ_１，．．．，ａ_ｋ）及び前記二次符号化ベクトルＣ_ｊの前記ｋ個の二次符号化係数ｃ_ｊ，１～ｃ_ｊ，ｋから一次結合を生成するステップを含む、請求項３に記載の方法。

【請求項5】

ｋ＝１０且つｒ＝４である、請求項１～４のいずれか１項に記載の方法。

【請求項6】

ｋ＋ｒ個のデータを記憶する方法であって、ｋ個のシステム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝にｋ個のデータブロックａ_ｉ、及びｒ個のパリティ記憶装置Ｎ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝に、ｒ個のパリティ関数であって請求項１～５のいずれか１項に記載のデータ符号化方法に従い取得されたｒ個のパリティ関数を記憶するステップを含む少なくとも１個のステップを含む方法。

【請求項7】

請求項１～５のいずれか１項に記載のデータ符号化方法のステップの実行に適した手段を含む、データ符号化装置。

【請求項8】

ｋ個のデータブロックａ_ｉをｋ個のシステム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝に、及びｒ個のパリティ関数ｆ_ｊ（ａ）をｒ個のパリティ記憶装置Ｎ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝に記憶している複数の記憶装置のうち１個の記憶装置のコンテンツを再構築する方法であって、前記ｋ個のデータブロックａ_ｉ及びｒ個のパリティ関数が、請求項１～５のいずれか１項に記載の方法に従い取得され、前記再構築方法が少なくとも以下を含むステップ、すなわち、
－前記コンテンツを再構築する前記記憶装置がシステム化又はパリティ記憶装置であるか否かを判定するステップ（７１０）と、
－前記装置がシステム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝である場合、
－前記装置のデータブロックがどのデータ部分集合Ｓ_ｊに属するかを判定し（７１６）、
－前記パリティ記憶装置Ｎ_ｋ＋１及びＮ_{ｋ＋１＋ｊ}に記憶されている前記パリティ関数ｆ _ｊ（ａ）を取得し（７１８）、
－前記部分集合Ｓ_ｊに関連付けられた前記一次関数ｇ_ｊ（ａ）を計算し（７２０）、
－ブロックａ_ｉ以外の前記部分集合Ｓ_ｊのデータブロックを取得して（７２２）、
－前記システム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝のコンテンツを再構築するステップ（７２４）と、
－前記装置がパリティ記憶装置Ｎ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝である場合、前記記憶装置を識別する添え字ｉを判定して（７２６）、
－前記添え字ｉがｋ＋１に等しい場合、
・添え字ｉ＝ｋ＋２の前記パリティ記憶装置に記憶されている二次パリティ関数ｆ_１（ａ）及び部分集合Ｓ_１の前記データブロックａ_ｉを取得し（７２８）、
・前記部分集合Ｓ_１に関連付けられた一次関数ｇ_１（ａ）を計算して（７３０）前記一次パリティ関数ｆ_０（ａ）を復号化して、
・添え字ｉ＝ｋ＋１の前記パリティ記憶装置のコンテンツを再構築するステップと（７３２）、
－前記添え字ｉがｋ＋１よりも大きい場合、
・添え字ｉ＝ｋ＋１の前記パリティ記憶装置に記憶されている前記一次パリティ関数ｆ_０（ａ）及び部分集合Ｓ_{ｉ－ｋ＋１}の前記データブロックａ_ｉを取得し（７３４）、
・前記部分集合Ｓ_{ｉ－ｋ＋１}に関連付けられた一次関数ｇ_{ｉ－ｋ＋１}（ａ）を計算して（７３６）二次パリティ関数ｆ_{ｉ－ｋ＋１}（ａ）を復号化して、
・添え字ｉ＞ｋ＋１の前記パリティ記憶装置のコンテンツを再構築するステップ（７３８）とを含む方法。

【請求項9】

前記パリティ関数を取得するステップが、対応する記憶装置からデータ収集装置にデータを転送するステップを含む、請求項８に記載の方法。

【請求項10】

ｉ∈｛１，．．，ｋ｝であるシステム化ノードｉを再構築すべく前記部分集合Ｓ_ｊに関連付けられた前記一次関数ｇ_ｊ（ａ）を計算するステップが、パリティ記憶装置Ｎ_{ｋ＋１＋ｊ}に記憶されている前記二次パリティ関数から前記パリティ記憶装置Ｎ_ｋ＋１に記憶されている一次パリティ関数を減算するステップを含む、請求項８又は９に記載の方法。

【請求項11】

ｉ＝ｋ＋１であるパリティノードｉを再構築すべく前記部分集合Ｓ_１に関連付けられた前記一次関数ｇ_１（ａ）を計算するステップが、前記部分集合Ｓ_１のデータブロック及び符号化ベクトルＣ_１から一次結合を生成するステップを含み、ｉ∈｛ｋ＋２，．．，ｋ＋ｒ｝であるパリティノードｉを再構築すべく前記部分集合Ｓ_ｊに関連付けられた前記一次関数ｇ_ｊ（ａ）を計算するステップが、前記部分集合Ｓ_ｊのデータブロック及び二次符号化ベクトルＣ_ｊから一次結合を生成するステップを含む、請求項８～１０のいずれか１項に記載の方法。

【請求項12】

前記システム化記憶装置Ｎ _ｉの前記コンテンツを再構築するステップが、前記一次関数ｇ_ｊ（ａ）から前記データブロックａ_ｉを復号化するステップを含む、請求項８～１１のいずれか１項に記載の方法。

【請求項13】

ｉ＝ｋ＋１である前記パリティ記憶装置の前記コンテンツを再構築するステップが、前記計算された一次関数ｇ_１（ａ）から添え字ｉ＝ｋ＋１の前記パリティ記憶装置の前記二次パリティ関数を復号化するステップを含み、ｉ＞ｋ＋１である前記パリティ記憶装置の前記コンテンツを再構築するステップが、前記計算された一次関数ｇ_{ｉ－ｋ＋１}（ａ）から添え字ｉ＞ｋ＋１の前記パリティ記憶装置の前記二次パリティ関数を復号化するステップを含む、請求項８～１１のいずれか１項に記載の方法。

【請求項14】

ｋ個のデータブロックａ_ｉをｋ個のシステム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝に、及びｒ個のパリティ関数ｆ_ｊ（ａ）をｒ個のパリティ記憶装置Ｎ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝に記憶している複数の装置のうち１個の記憶装置のコンテンツを再構築する装置であって、前記ｋ個のデータブロック及びｒ個のパリティ関数が請求項１～５のいずれか１項に記載の方法に従い取得され、前記装置が、記憶装置のコンテンツを再構築する請求項８～１３のいずれか１項に記載の方法のステップの実行に適した手段を含む装置。

【請求項15】

プログラムを含むコンピュータプログラムであって、前記プログラムが、請求項１～５のいずれか１項に記載の方法のステップを実行可能にする符号命令を含み、及び／又は前記プログラムがコンピュータ上で実行された場合に請求項８～１３のいずれか１項に記載の方法のステップを実行可能にする符号命令を含むコンピュータプログラム。

【請求項16】

請求項７及び／又は請求項１４に記載の少なくとも１個の装置を含むＡＳＩＣ又はＦＰＧＡ型の集積回路。

【請求項17】

分散記憶システムにおける請求項８～１３のいずれか１項に記載のコンテンツ再構築方法の使用であって、前記分散記憶システムが請求項１～５のいずれか１項に記載の符号化方法に従い符号化されたデータを記憶可能な複数のデータ記憶ノードを含む使用。

【請求項18】

ローカル記憶システムにおける請求項８～１３のいずれか１項に記載のコンテンツ再構築方法の使用であって、前記ローカル記憶システムが請求項１～５のいずれか１項に記載の符号化方法に従い符号化されたデータを記憶可能なデータ記憶ディスクを含む使用。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データ記憶システム及びそのようなシステムにおける故障管理の一般的な分野に関する。より具体的には、本発明は、故障の発生後に記憶システムの修復に必要となるデータ読み込み／書き込み動作の最適化、及び転送されるデータ量の最適化を可能にする、データの符号化及び復号化方法及び装置に関する。

【背景技術】

【0002】

近年、ソーシャルネットワーク、電子メール、ファイル共有、及びビデオ共有等のアプリケーションの利用に起因してデジタルデータの量が顕著に増大している。従って、オンラインサービスを提供する企業は、数十ペタバイト（１ＰＢ＝１０^１５バイト）のデータ量を管理する必要がある。毎年指数的に増大し続けるこれらのデータ量を高い信頼性で記憶する必要がある。

【0003】

分散記憶システム（ＤＳＳ）は、開放的で信頼性の高い記憶ソリューションを提供すべく昨今広く利用されている。これらのアーキテクチャは、図１に示すように、データが分散して記憶されている複数の記憶ノード（１１０、１１２、１１４）を含んでいる。１個の記憶ノードは１個（１１２）又は複数個の記憶装置（１１０、１１４）を含んでいてよい。複数の記憶装置を含むノードの各記憶装置自体を記憶ノードと表記する。一般に、記憶装置は記憶ディスクである。コントローラ（１０２）は、通信ネットワーク（１０４）に結合されたコンピュータ（１０６）から受信したリクエストに基づくディスクの読み込み／書き込み動作を含むノードからの／ノードへの通信の管理を可能にする。

【0004】

今日、ディスク、装置又は記憶ノードの故障は稀でなく、数千個のノードについて毎日平均数十回もの故障が報告されるのは普通である。分散記憶システムは、１個又は複数個のノード或いは記憶装置又はディスクが故障した場合に、データの保護を保証しなければならない。

【0005】

データの信頼性及び利用可能性を保証すべく、標準的な実装において、故障時に消失したデータを取り出し可能にすべくデータの冗長性に基づくソリューションが組み込まれている。

【0006】

記憶システムに信頼性を付与することを可能にするいくつかの方法を以下に列挙する。

【0007】

複製は、最も広く利用されている方法の１つである。これは、複数の記憶ノードに跨る同一のデータブロックを複製するものである。一般に、同一のデータブロックはｎ個の異なるノードに記憶されているため、ｎ－１件の故障に耐えられるようになる。実際、各データブロックは３個の異なるノードに記憶されているため、２件の故障に耐えることが可能になる。たとえ複製が良好な故障耐性を提供するにせよ、３個のノードの場合に複製が２００％と推定される記憶オーバーヘッドが生じる短所がある。

【0008】

消去符号。このアプローチは、公知のリードソロモン（ＲＳ）符号の使用に基づいている。各データファイルは、ｋ個のデータブロックに分割され、これにｒ個のパリティ機能ブロックが追加されてｋ＋ｒ個のデータブロックが生成され、且つタームコードＲＳ（ｋ，ｒ）が用いられる。ｋ＋ｒ個のデータブロックは、ｋ＋ｒ個の異なるノードに記憶され、このうちｋ個のノードはｋ個の元ブロックを記憶し、ｒ個のパリティノードはｒ個のパリティ機能ブロックを記憶する。符号ＲＳ（ｋ，ｒ）は二つの基本的特性を有している。すなわち、ｋ＋ｒ個のブロックのうち任意のｋ個のデータブロックが元のデータを再生成するのに充分であり、故障の種類に依らずｒ件の故障に耐えられる。実際には、符号ＲＳ（１０，４）の場合、各データファイルは１０個のブロックに分割されて４個のパリティ機能ブロックが生成されるため、４件の故障まで耐えることが可能になる。ＲＳ符号は、複製と比較してより良好な記憶効率を提供し、符号ＲＳ（１０，４）について記憶オーバーヘッドが４０％と評価される。

【0009】

データ記憶システムにおいて、故障時には、データの再構築は、冗長ノードに記憶されているデータの読み込み、次いでネットワーク内で「プロバイダ」とも呼ばれるデータを供給しているノードから「新参者」とも呼ばれる新たな記憶ノードへのデータの転送を伴う。単一ノードの故障発生時において、複製の場合は単一のプロバイダだけが必要とされる場合も、符号ＲＳ（ｋ，ｒ）の場合にｋ個のプロバイダが必要となり、次いでｋ個のプロバイダからのネットワークを介したデータの転送が含まれる。単一の故障の修復は従って、数百テラバイト（ＴＢ）の読み込み及び送信を伴う可能性がある。また、帯域幅の観点からの修復及び読み出し／書き込みコストも顕著になり得る。

【0010】

以下に列挙するいくつかのソリューションは、修復フェーズ中に必要とされる帯域幅、すなわち「帯域幅修復」を削減するものである。

【0011】

再生成符号は一例である。文献「Ｎｅｔｗｏｒｋｃｏｄｉｎｇｆｏｒｄｉｓｔｒｉｂｕｔｅｄｓｔｏｒａｇｅｓｙｓｔｅｍｓ」，ＡｌｅｘａｎｄｒｏｓＧＤｉｍａｋｉｓ，ＰＢｒｉｇｈｔｅｎＧｏｄｆｒｅｙ，ＹｕｎｎａｎＷｕ，ＭａｒｔｉｎＪＷａｉｎｗｒｉｇｈｔ，ａｎｄＫａｎｎａｎＲａｍｃｈａｎｄｒａｎ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ５６（９）：４５３９－４５５１，２０１０に記述されているような主要なアイディアは、各ノードが、自身が利用できるデータブロックからのデータの一次結合を生成するものである。各プロバイダノードから転送されるデータの量は従って、各ノードに記憶されているデータの量よりも少なく、そのため修復に必要な帯域幅が削減される。しかし、再生成符号に関して、新ノードで取り出される情報は転送されたデータの一次結合であり、従って必ずしも消失したデータブロックに等しい訳ではない。

【0012】

正確な再生成符号が、消失したものと全く同一のデータブロックを取り出すために提案されている。文献「Ｏｐｔｉｍａｌｅｘａｃｔ－ｒｅｇｅｎｅｒａｔｉｎｇｃｏｄｅｓｆｏｒｄｉｓｔｒｉｂｕｔｅｄｓｔｏｒａｇｅａｔｔｈｅＭＳＲａｎｄＭＢＲｐｏｉｎｔｓｖｉａａｐｒｏｄｕｃｔ－ｍａｔｒｉｘｃｏｎｓｔｒｕｃｔｉｏｎ」，Ｒａｓｈｍｉ，ＫｏｒｌａｋａｉＶｉｎａｙａｋ，ＮｉｈａｒＢ．Ｓｈａｈ，ａｎｄＰ．ＶｉｊａｙＫｕｍａｒ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ５７（８）：５２２７－５２３９，２０１１に示すような主要なアイディアは、干渉アラインメントの概念を用いて不要なデータブロックを除去するものである。たとえ正確な再生成符号は修復用の帯域幅を大幅に削減可能にするにせよ、ディスク入出力（「Ｉ／Ｏオーバーヘッド」）のコストは最適化されない。実際に、単一の故障を修復するには、正確な再生成符号は全ての読み出し対象ノードに記憶されている全てのデータが読み込まれることを必要とする。

【0013】

修復帯域幅及びディスク入出力双方のコストを削減するためのソリューションが提案されている。

【0014】

例えば、文献「Ｈｉｅｒａｒｃｈｉｃａｌｃｏｄｅｓ：Ｈｏｗｔｏｍａｋｅｅｒａｓｕｒｅｃｏｄｅｓａｔｔｒａｃｔｉｖｅｆｏｒｐｅｅｒ－ｔｏ－ｐｅｅｒｓｔｏｒａｇｅｓｙｓｔｅｍｓ」，ＡｌｅｓｓａｎｄｒｏＤｕｍｉｎｕｃｏａｎｄＥｒｎｓｔＢｉｅｒｓａｃｋ，Ｐ２Ｐ’０８，８ｔｈＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＰｅｅｒ－ｔｏ－ＰｅｅｒＣｏｍｐｕｔｉｎｇ，ｐａｇｅｓ８９－９８に示すような階層的符号を用いる主要なアイディアは、元の符号よりも小さい符号から特定のパリティ関数を階層的に生成するものである。階層的符号（ｋ，ｒ）は、単一の故障を修復するために

【数1】

（ｋ／ｒ－１の整数部分）～ｋ個のデータブロックを読んでダウンロードする必要がある。しかし、階層的符号は従来のＲＳ符号の全てのプロパティを維持する訳ではない。実際、階層的符号（ｋ，ｒ）はｒ件の故障のいずれにも耐えられない。従って同じ冗長性でも信頼性が低いことが分かる。

【0015】

ヒッチハイカ符号は、ＲＳ符号と同じ特性を維持して、帯域幅及びディスクの入出力の観点から低いコストで故障の修復を実行可能にする符号である。「Ａｈｉｔｃｈｈｉｋｅｒ’ｓｇｕｉｄｅｔｏｆａｓｔａｎｄｅｆｆｉｃｉｅｎｔｄａｔａｒｅｃｏｎｓｔｒｕｃｔｉｏｎｉｎｅｒａｓｕｒｅ－ｃｏｄｅｄｄａｔａｃｅｎｔｅｒｓ」，ＫＶＲａｓｈｍｉ，ＮｉｈａｒＢＳｈａｈ，ＤｉｋａｎｇＧｕ，ＨａｉｒｏｎｇＫｕａｎｇ，ＤｈｒｕｂａＢｏｒｔｈａｋｕｒ，ａｎｄＫａｎｎａｎＲａｍｃｈａｎｄｒａｎ，ＡＣＭＳＩＧＣＯＭＭＣｏｍｐｕｔｅｒＣｏｍｍｕｎｉｃａｔｉｏｎＲｅｖｉｅｗ，４４（４）：３３１－３４２，２０１５に記述されている主要なアイディアは、単一の故障の修復に必要なデータブロックの個数を削減するものである。ヒッチハイカアプローチは、同一構造（ｋ，ｒ）を有する２個のＲＳサブ符号を考慮する。第２の符号及び第１の符号に依存する特定のパリティ関数は、第２のＲＳサブ符号内で生成される。これらのインターリーブされたパリティ関数によりデータブロック修復のために読み込まれて転送されるデータの量が削減可能になる。ヒッチハイカ符号（１０，４）により、修復帯域幅及びディスクの入出力コストの３０％～３５％が削減可能になる。

【0016】

以下の参照文献に帯域幅を削減するデータ符号化方法が提案されている。
－ＣｈｅｎｇＨｕａｎｇｅｔａｌ．：「ＥｒａｓｕｒｅＣｏｄｉｎｇｉｎＷｉｎｄｏｗｓＡｚｕｒｅＳｔｏｒａｇｅ」，ＵＳＥ－ＮＩＸ，１１Ａｐｒｉｌ２０１３（２０１３－０４－１１），ｐａｇｅｓ１－１２，ＸＰ０６１０１３９４１。このＬＲＣ（ｋ，ｌ，ｒ）法は、記憶ノードに記憶されるローカルパリティ関数の生成に基づいている。しかし、ＬＲＣ符号はローカルパリティ関数の追加的な記憶に起因して記憶オーバーヘッドをもたらす。
－ＣｈｅｎｇＨｕａｎｇｅｔａｌ．：「ＰｙｒａｍｉｄＣｏｄｅｓ：ＦｌｅｘｉｂｌｅＳｃｈｅｍｅｓｔｏＴｒａｄｅＳｐａｃｅｓｆｏｒＡｃｃｅｓｓＥｆｆｉｃｉｅｎｃｙｉｎＲｅｌｉａｂｌｅＤａｔａＳｔｏｒａｇｅｓｙｓｔｅｍｓ」，Ｐｒｏｃ．ＳｉｘｔｈＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｎＮｅｔｗｏｒｋＣｏｍｐｕｔｉｎｇａｎｄＡｐｐｌｉｃａｔｉｏｎｓ２００７，ＩＥＥＥ，１Ｊｕｌｙ２００７（２００７－０１－０７），ｐａｇｅｓ７９－８６，ＸＰ０３１１１９２８１，ＩＳＢＮ：９７８－０－７６９５－２９２２－６。この方法はＬＲＣ方法の代替方式を提案している。しかし、ＬＲＣ符号と同様に、ピラミッド符号は、従来の消去符号及びバビロン符号と比較して記憶オーバーヘッドをもたらす。

【0017】

これらのアプローチでは、従来の消去符号と同じ記憶効率を維持しながら帯域幅の削減を可能にするヒッチハイカ符号、再生成符号、及び階層的符号とは逆に、従来の消去符号と同じ記憶効率が得られない。

【0018】

新たな消去符号の定義に基づいて上で述べた方法とは逆に、ＢｌａｕｍＭａｒｉｏらによる特許出願ＵＳ２０１６／２１１８６９Ａ１号が提案するソリューションは、目的関数として異なる符号間で切り替え可能な複数の消去符号が組み込まれた動的記憶システムを提案している。当該システムは、ファイルの参照頻度の関数として修復帯域幅の削減又は記憶オーバーヘッドの削減のどちらかを決定する。当該システムは特に２個の符号すなわち（上述の）ＬＲＣ及び「プロダクト符号」（ＰＣ）をサポートする。

【0019】

１個以上のデータ記憶要素の故障に際して消失又は損傷したデータを、従来の消去符号と同じ記憶効率を維持しながら再構築するデータ符号化／復号化ソリューションに対するニーズがあり、且つ修復帯域幅コスト及びディスク入出力コストの観点から高まっている。

【0020】

更に、ＳＳＤ（固体ドライブ）ディスクの出現に伴い、記憶要素は益々高速化しており、各ディスクは読み出しモードで毎秒数十ギガバイトを生成することができる。記憶要素を接続するインターフェースのビットレートは従って特に重要であり、記憶システムのボトルネックとなる。従って、再構築に際して交換されるフローの削減が特に重要である。従って、故障の後で記憶システムを修復する際に転送されるデータの量の最適化を可能にするソリューションに対するニーズがある。

【0021】

本発明は、上述の各種のニーズについて述べる。

【先行技術文献】

【特許文献】

【0022】

【文献】米国特許出願公開第２０１６／２１１８６９号明細書

【非特許文献】

【0023】

【文献】「Ｎｅｔｗｏｒｋｃｏｄｉｎｇｆｏｒｄｉｓｔｒｉｂｕｔｅｄｓｔｏｒａｇｅｓｙｓｔｅｍｓ」，ＡｌｅｘａｎｄｒｏｓＧＤｉｍａｋｉｓ，ＰＢｒｉｇｈｔｅｎＧｏｄｆｒｅｙ，ＹｕｎｎａｎＷｕ，ＭａｒｔｉｎＪＷａｉｎｗｒｉｇｈｔ，ａｎｄＫａｎｎａｎＲａｍｃｈａｎｄｒａｎ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ５６（９）：４５３９－４５５１，２０１０

【文献】「Ｏｐｔｉｍａｌｅｘａｃｔ－ｒｅｇｅｎｅｒａｔｉｎｇｃｏｄｅｓｆｏｒｄｉｓｔｒｉｂｕｔｅｄｓｔｏｒａｇｅａｔｔｈｅＭＳＲａｎｄＭＢＲｐｏｉｎｔｓｖｉａａｐｒｏｄｕｃｔ－ｍａｔｒｉｘｃｏｎｓｔｒｕｃｔｉｏｎ」，Ｒａｓｈｍｉ，ＫｏｒｌａｋａｉＶｉｎａｙａｋ，ＮｉｈａｒＢ．Ｓｈａｈ，ａｎｄＰ．ＶｉｊａｙＫｕｍａｒ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ５７（８）：５２２７－５２３９，２０１１

【文献】「Ｈｉｅｒａｒｃｈｉｃａｌｃｏｄｅｓ：Ｈｏｗｔｏｍａｋｅｅｒａｓｕｒｅｃｏｄｅｓａｔｔｒａｃｔｉｖｅｆｏｒｐｅｅｒ－ｔｏ－ｐｅｅｒｓｔｏｒａｇｅｓｙｓｔｅｍｓ」，ＡｌｅｓｓａｎｄｒｏＤｕｍｉｎｕｃｏａｎｄＥｒｎｓｔＢｉｅｒｓａｃｋ，Ｐ２Ｐ’０８，８ｔｈＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＰｅｅｒ－ｔｏ－ＰｅｅｒＣｏｍｐｕｔｉｎｇ，ｐａｇｅｓ８９－９８

【文献】「Ａｈｉｔｃｈｈｉｋｅｒ’ｓｇｕｉｄｅｔｏｆａｓｔａｎｄｅｆｆｉｃｉｅｎｔｄａｔａｒｅｃｏｎｓｔｒｕｃｔｉｏｎｉｎｅｒａｓｕｒｅ－ｃｏｄｅｄｄａｔａｃｅｎｔｅｒｓ」，ＫＶＲａｓｈｍｉ，ＮｉｈａｒＢＳｈａｈ，ＤｉｋａｎｇＧｕ，ＨａｉｒｏｎｇＫｕａｎｇ，ＤｈｒｕｂａＢｏｒｔｈａｋｕｒ，ａｎｄＫａｎｎａｎＲａｍｃｈａｎｄｒａｎ，ＡＣＭＳＩＧＣＯＭＭＣｏｍｐｕｔｅｒＣｏｍｍｕｎｉｃａｔｉｏｎＲｅｖｉｅｗ，４４（４）：３３１－３４２，２０１５

【文献】ＣｈｅｎｇＨｕａｎｇｅｔａｌ．：「ＥｒａｓｕｒｅＣｏｄｉｎｇｉｎＷｉｎｄｏｗｓＡｚｕｒｅＳｔｏｒａｇｅ」，ＵＳＥ－ＮＩＸ，１１Ａｐｒｉｌ２０１３（２０１３－０４－１１），ｐａｇｅｓ１－１２，ＸＰ０６１０１３９４１

【文献】ＣｈｅｎｇＨｕａｎｇｅｔａｌ．：「ＰｙｒａｍｉｄＣｏｄｅｓ：ＦｌｅｘｉｂｌｅＳｃｈｅｍｅｓｔｏＴｒａｄｅＳｐａｃｅｓｆｏｒＡｃｃｅｓｓＥｆｆｉｃｉｅｎｃｙｉｎＲｅｌｉａｂｌｅＤａｔａＳｔｏｒａｇｅｓｙｓｔｅｍｓ」，Ｐｒｏｃ．ＳｉｘｔｈＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｎＮｅｔｗｏｒｋＣｏｍｐｕｔｉｎｇａｎｄＡｐｐｌｉｃａｔｉｏｎｓ２００７，ＩＥＥＥ，１Ｊｕｌｙ２００７（２００７－０１－０７），ｐａｇｅｓ７９－８６，ＸＰ０３１１１９２８１，ＩＳＢＮ：９７８－０－７６９５－２９２２－６

【発明の概要】

【発明が解決しようとする課題】

【0024】

本発明は、転送されるデータの量、及び故障の後で記憶システムの修復に必要とされる読み込み／書き込み動作を最適化可能にするデータ符号化及び復号化方法及び装置を提案することにより、公知の技術の限界を克服することを目的とする。

【課題を解決するための手段】

【0025】

有利には、本発明は、記憶効率及びｋ＋ｒ件の故障のうちｒ個の全てに耐えられる信頼性の特性を維持しながら、修復帯域幅及びディスク入出力コストの両方を削減可能にする。

【0026】

本発明の１つの目的はデータ符号化方法に関するものである。特に（ｋ，ｒ）個のデータを符号化する方法を提案し、方法は、
－初期データａをｋ個のデータブロックａ_ｉに分割するステップと、
－ｋ個のデータブロックをデータブロックのｒ－１個の部分集合Ｓ_ｊにグループ化するステップと、
－各部分集合Ｓ_ｊ毎に、前記部分集合Ｓ_ｊに割り当てられたデータブロックの一次結合として定義される一次関数ｇ_ｊ（ａ）を生成するステップと、
－ｋ個のデータブロックａ_ｉの一次結合としての一次パリティ関数ｆ_０（ａ）、及び各二次パリティ関数ｆ_ｊ（ａ）が一次パリティ関数ｆ_０（ａ）と一次関数ｇ_ｊ（ａ）の和として定義されるｒ－１個の二次パリティ関数を含む、ｒ個のパリティ関数を生成するステップとを含んでいる。

【0027】

修復帯域幅及びディスク入出力コストの両方を削減するソリューションを提案する。

【0028】

【数2】

【0029】

【0030】

以下の参照文献に帯域幅を削減するデータ符号化方法が提案されている。
－ＣｈｅｎｇＨｕａｎｇｅｔａｌ．：「ＥｒａｓｕｒｅＣｏｄｉｎｇｉｎＷｉｎｄｏｗｓＡｚｕｒｅＳｔｏｒａｇｅ」，ＵＳＥ－ＮＩＸ，１１Ａｐｒｉｌ２０１３（２０１３－０４－１１），ｐａｇｅｓ１－１２，ＸＰ０６１０１３９４１。このＬＲＣ（ｋ，ｌ，ｒ）法は、記憶ノードに記憶されるローカルパリティ関数の生成に基づいている。しかし、ＬＲＣ符号は、ローカルパリティ関数の追加的な記憶に起因して記憶オーバーヘッドをもたらす。
－ＣｈｅｎｇＨｕａｎｇｅｔａｌ．：「ＰｙｒａｍｉｄＣｏｄｅｓ：ＦｌｅｘｉｂｌｅＳｃｈｅｍｅｓｔｏＴｒａｄｅＳｐａｃｅｓｆｏｒＡｃｃｅｓｓＥｆｆｉｃｉｅｎｃｙｉｎＲｅｌｉａｂｌｅＤａｔａＳｔｏｒａｇｅｓｙｓｔｅｍｓ」，Ｐｒｏｃ．ＳｉｘｔｈＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｎＮｅｔｗｏｒｋＣｏｍｐｕｔｉｎｇａｎｄＡｐｐｌｉｃａｔｉｏｎｓ２００７，ＩＥＥＥ，１Ｊｕｌｙ２００７（２００７－０１－０７），ｐａｇｅｓ７９－８６，ＸＰ０３１１１９２８１，ＩＳＢＮ：９７８－０－７６９５－２９２２－６。この方法はＬＲＣ方法の代替方式を提案している。しかし、ＬＲＣ符号と同様に、ピラミッド符号は、従来の消去符号及びバビロン符号と比較して記憶オーバーヘッドをもたらす。

【0031】

【0032】

【0033】

１個以上のデータ記憶要素の故障に際して消失又は損傷したデータを、従来の消去符号と同じ記憶効率を維持しながら再構築するデータ符号化／復号化ソリューションに対するニーズがあり、且つ修復帯域幅コスト及びディスク入出力コストの観点から高まっていることが分かる。

【0034】

本符号化方法の代替的又は組み合わされた実施形態によれば、
－ｒ個のパリティ関数を生成するステップは、ｒ個の符号化ベクトルを生成するステップを含み、符号化ベクトルは、
－ｋ個の一次符号化係数ｃ_０，１～ｃ_０，ｋを含む一次符号化ベクトルＣ_０と、
－各二次符号化ベクトルがｋ個の二次符号化係数ｃ_ｊ，１～ｃ_ｊ，ｋを含むｒ－１個の二次符号化ベクトルＣ_ｊ（１≦ｊ≦ｒ－１）とを含み、
－各一次符号化係数ｃ_０，ｉは非ゼロ乱数に対応し、二次符号化係数ｃ_ｊ，ｉは当該データブロックａ_ｉが部分集合Ｓ_ｊに属するか否かに応じて非ゼロ又はゼロ乱数に対応しており、
－一次関数ｇ_ｊ（ａ）を生成するステップは、ｋ個のデータブロック（ａ_１，．．．，ａ_ｋ）と二次符号化ベクトルＣ_ｊの一次結合を生成するステップを含み、
－ｋ＝１０且つｒ＝４である。

【0035】

本発明のデータ符号化方法は、記憶装置の故障に続いて消失したデータを再構築する目的で複数の記憶装置にデータを分散させることに特に適している。また、ｋ＋ｒ個のデータを記憶する方法も請求項に記載しており、方法は、ｋ個のシステム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝にｋ個のデータブロックａ_ｉ、及びｒ個のパリティ記憶装置Ｎ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝に、ｒ個のパリティ関数であって請求項に記載のデータ符号化方法に従い取得されたｒ個のパリティ関数を記憶するステップを含む少なくとも１個のステップを含んでいる。

【0036】

本発明はまた、請求項に記載のデータ符号化方法のステップを実行する手段を含むデータ符号化装置も対象とする。

【0037】

本発明の別の目的は、請求項に記載の符号化方法により符号化されたデータを記憶する装置のコンテンツを再構築又は複製する方法に関する。特に、ｋ個のデータブロックａ_ｉをｋ個のシステム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝に、及びｒ個のパリティ関数ｆ_ｊ（ａ）をｒ個のパリティ記憶装置Ｎ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝に記憶している複数の記憶装置のうち１個の記憶装置のコンテンツを再構築する方法を請求項に記載しており、前記ｋ個のデータブロック及びｒ個のパリティ関数は、請求項に記載のデータ符号化方法に従い取得され、当該再構築方法は少なくとも以下を含むステップ、すなわち、
－コンテンツを再構築する記憶装置がシステム化又はパリティ記憶装置であるか否かを判定するステップと、
－前記装置がシステム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝である場合、
－前記装置のデータブロックがどのデータ部分集合Ｓ_ｊに属するかを判定し、
－パリティ記憶装置ｋ＋１及びｋ＋１＋ｊに記憶されている一次及び二次パリティ関数を取得し、
－部分集合Ｓ_ｊに関連付けられた一次関数ｇ_ｊ（ａ）を計算し、
－ブロックａ_ｉ以外の部分集合Ｓ_ｊのデータブロックを取得して、
－前記システム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝のコンテンツを再構築するステップと、
－前記装置がパリティ記憶装置Ｎ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝である場合、前記記憶装置を識別する添え字ｉを決定して、
－添え字ｉがｋ＋１に等しい場合、
・添え字ｉ＝ｋ＋２のパリティ記憶装置及び部分集合Ｓ_１のデータブロックａ_ｉに記憶されている二次パリティ関数ｆ_１（ａ）を取得し、
・部分集合Ｓ_１に関連付けられた一次関数ｇ_１（ａ）を計算して一次パリティ関数ｆ_０（ａ）を復号化して、
・添え字ｉ＝ｋ＋１の前記パリティ装置のコンテンツを再構築するステップと、
－添え字ｉがｋ＋１よりも大きい場合、
・添え字ｉ＝ｋ＋１のパリティ記憶装置及び部分集合Ｓ_{ｉ－ｋ＋１}のデータブロックａ_ｉに記憶されている一次パリティ関数ｆ_０（ａ）を取得し、
・部分集合Ｓ_{ｉ－ｋ＋１}に関連付けられた一次関数ｇ_{ｉ－ｋ＋１}（ａ）を計算して二次パリティ関数ｆ_{ｉ－ｋ＋１}（ａ）を復号化して、
・添え字ｉ＞ｋ＋１の前記パリティ装置のコンテンツを再構築するステップとを含んでいる。

【0038】

コンテンツ再構築方法は、記憶装置の故障に続いて消失したデータのコンテンツの再構築に特に適している。

【0039】

再構築方法の代替的又は組み合わされた実施形態によれば、
－パリティ関数を取得するステップは、対応する記憶装置からデータ収集装置にデータを転送するステップを含み、
－ｉ∈｛１，．．，ｋ｝であるシステム化ノードｉを再構築すべく部分集合Ｓ_ｊに関連付けられた一次関数ｇ_ｊ（ａ）を計算するステップは、記憶装置Ｎ_{ｋ＋１＋ｊ}に記憶されている二次パリティ関数から記憶装置Ｎ_ｋ＋１に記憶されている一次パリティ関数を減算するステップを含み、
－ｉ＝ｋ＋１であるパリティノードｉを再構築すべく部分集合Ｓ_１に関連付けられた一次関数ｇ_１（ａ）を計算するステップは、部分集合Ｓ_１のデータブロック及び符号化ベクトルＣ_１から一次結合を生成するステップを含み、
－ｉ∈｛ｋ＋２，．．，ｋ＋ｒ｝であるパリティノードｉを再構築すべく部分集合Ｓ_ｊに関連付けられた一次関数ｇ_ｊ（ａ）を計算するステップは、部分集合Ｓ_ｊのデータブロック及び符号化ベクトルＣ_ｊから一次結合を生成するステップを含み、
－前記システム化記憶装置のコンテンツを再構築するステップは、一次関数ｇ_ｊ（ａ）からデータブロックａ_ｉを復号化するステップを含み、
－ｉ＝ｋ＋１である前記パリティ記憶装置ｉのコンテンツを再構築するステップは、計算された一次関数ｇ_１（ａ）から添え字ｉ＝ｋ＋１の前記パリティ記憶装置の二次パリティ関数を復号化するステップを含み、
－ｉ＞ｋ＋１である前記パリティ記憶装置ｉのコンテンツを再構築するステップは、計算された一次関数ｇ_{ｉ－ｋ＋１}（ａ）から添え字ｉ＞ｋ＋１の前記パリティ装置の二次パリティ関数を復号化するステップを含んでいる。

【0040】

本発明はまた、ｋ個のデータブロックａ_ｉをｋ個のシステム化記憶装置Ｎ_ｉ，ｉ∈｛１，．．，ｋ｝に、及びｒ個のパリティ関数ｆ_ｊ（ａ）をｒ個のパリティ記憶装置Ｎ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝に記憶している複数の装置のうち１個の記憶装置のコンテンツを再構築する装置も対象としており、前記ｋ個のデータブロック及びｒ個のパリティ関数は請求項に記載の符号化方法に従い取得され、装置は、記憶装置のコンテンツを再構築する請求項に記載の方法のステップを実行する手段を含んでいる。

【0041】

本発明は、ＡＳＩＣ又はＦＰＧＡ型の集積回路等のハードウェア及び／又ソフトウェア要素に組み込まれていてよい。

【0042】

本発明はまた、請求項に記載の符号化方法のステップを実行可能にする符号命令を含む、及び／又は前記プログラムがコンピュータ上で実行された場合に請求項に記載のコンテンツ再構築方法のステップを実行可能にする符号命令を含むコンピュータプログラムにも関する。

【0043】

本発明は、請求項に記載の符号化方法及び／又はコンテンツ再構築方法を実行する符号命令を含むプログラムが記憶されているプロセッサ可読記憶媒体として入手可能であってよい。

【0044】

請求項に記載のコンテンツ再構築方法の有利な使用の１つは、請求項に記載の符号化方法に従い符号化されたデータを記憶可能な複数のデータ記憶ノードを含む分散記憶システムである。

【0045】

請求項に記載のコンテンツ再構築方法の別の有利な使用は、請求項に記載の符号化方法に従い符号化されたデータを記憶可能なデータ記憶ディスクを含むローカル記憶システムである。

【0046】

本発明の異なる態様及び利点を、以下の図面を参照しながら本発明の好適であるが非限定的な実装例の記述を精査することにより明らかになろう。

【図面の簡単な説明】

【0047】

【図1】一実施形態において本発明を実装可能にする分散システム環境を示す。

【図2】本発明の一実施形態におけるデータの記憶の表現を示す。

【図3】一実施形態における本発明の符号化方法のステップを示す。

【図4】本発明の原理による、一次符号化ベクトルの生成を示す。

【図5】本発明の原理による、二次符号化ベクトルの生成を示す。

【図6】本発明の原理による、一次パリティ関数及び二次パリティ関数の生成を示す。

【図7a】本発明の原理によるシステム化パリティノードの再構築ステップを示す。

【図7b】本発明の原理によるシステム化パリティノードの再構築ステップを示す。

【図7c】本発明の原理によるシステム化パリティノードの再構築ステップを示す。

【図8】異なる符号の性能レベルを比較する表である。

【発明を実施するための形態】

【0048】

以下の記述全体にわたり、表現「記憶ノード」は一般的な意味で用いられ、単一のディスクであるか、又はノードを形成する一群の記憶装置であるかに依らず、記憶実体を表記する。記述する本発明の複数の実施形態は、本発明を実装可能にする環境の一例に過ぎない図１に示す分散記憶システムの任意の変型例に適用できる。従って、本例は限定的でなく、記述する原理は、ファイルに又はオブジェクトに基づくか否かに依らず、クラウドシステム、データセンター、分散ファイルシステム等の、分散型であるか否かに依らない記憶システムが組み込まれた他の任意の環境にも適用できる。本発明はまた、「ディスクアレイ」等の非分散記憶システムに適用できる。更に、初期データから導出されたデータを記憶する記憶ノードを「システム化ノード」と呼び、パリティ関数を記憶する記憶ノードを「パリティノード」と呼ぶ。

【0049】

本発明の原理を分かり易くすべく、符号（ｋ＝１０，ｒ＝４）の特定の例について最初に符号化方法を記述し、次いで任意の符号（ｋ，ｒ）に一般化される。

【実施例】

【0050】

符号（１０，４）の例に関する符号化方法の記述
図２に、符号ｋ＝１０及びｒ＝４の例に基づく、本発明の符号化方法の適用によるデータの記憶の表現を示す。以下の記述において、本発明の符号化ステップは、表現「バビロン符号」又は「バビロン符号化」により表すことができる。初期データａがｋ＝１０個の部分（２００）又はａ_ｉ，ｉ∈｛１，．．，１０｝と表記するデータブロック（ａ_１，．．．，ａ_１０）に分割され、これにデータ（ａ_１，．．．，ａ_１０）の一次結合であって以下にｆ_０（ａ），ｆ_１（ａ），ｆ_２（ａ），ｆ_３（ａ）又はｆ_０（ａ）及びｆ_ｊ（ａ），ｊ∈｛１，２，３｝と表記するｒ＝４個のパリティブロック又はパリティ関数ｆ_０，ｆ_１，ｆ_２及びｆ_３が追加される。パリティ関数ｆ_０（ａ）は一次パリティ関数と呼ばれ、パリティ関数ｆ_ｊ（ａ）は二次パリティ関数と呼ばれる。一次及び二次パリティ関数は、本発明のバビロン符号化（２０２）により生成されて記憶ノード（２０４）に記憶される。

【0051】

システム化データブロックａ_１～ａ_１０は（Ｎ_１～Ｎ_１０）と表記する１０個の対応するシステム化記憶ノード（２０６）に記憶され、一次ｆ_０（ａ）及び二次ｆ_１（ａ）、ｆ_２（ａ）、ｆ_３（ａ）パリティ関数は、Ｎ_１１～Ｎ_１４と表記する４個の対応するパリティ記憶ノード（２０８）に記憶される。

【0052】

図３に、符号（ｋ＝１０，ｒ＝４）の一実施形態における本発明の符号化方法（３００）のステップを示す。本方法は第１のステップ（３０２）において初期データａを１０個のデータブロック（ａ_１，．．．，ａ_１０）に分割し、次いで次ステップ（３０４）において３個のデータ部分集合（Ｓ_１，Ｓ_２，Ｓ_３）を生成可能にする。各データ部分集合は、生成された１０個のブロックからの異なるデータブロックを含んでいる。一実施形態において、２個の部分集合（Ｓ_１，Ｓ_２）は各々３個のデータブロックを含み、第３の部分集合（Ｓ_３）は４個のデータブロックを含んでいる。第１の部分集合Ｓ_１は、初期データから取得された先頭３ブロック（ａ_１，ａ_２，ａ_３）を含み、第２の部分集合Ｓ_２は次の３ブロック（ａ_４，ａ_５，ａ_６）を含み、最後の部分集合Ｓ_３は残った最後の４ブロック（ａ_７，ａ_８，ａ_９，ａ_１０）を含んでいる。

【0053】

次のステップ（３０６）において、本方法は、４個のパリティノードに対応する長さ（ｋ＝１０）の４個の符号化ベクトルを生成可能にする。Ｃ_０～Ｃ_４と表記された符号化ベクトルは、一次符号化ベクトルＣ_０及び３個の二次符号化ベクトルＣ_１、Ｃ_２、Ｃ_３に対応している。

【0054】

図４及び５に、本発明の原理による符号化ベクトルの生成ステップを詳述する。

【0055】

図４に、一実施形態における一次符号化ベクトルＣ_０（４００）の生成を示す。一次符号化ベクトルＣ_０は、１０個の一次符号化係数ｃ_０，１～ｃ_０，１０を含み、各一次符号化係数ｃ_０，ｉ（４０２－ｉ）が非ゼロ乱数（４０４－ｉ）に対応している。

【0056】

図５に、一実施形態（５００）における二次符号化ベクトルＣ_ｊ（１≦ｊ≦３）の生成を示す。各二次符号化ベクトルＣ_ｊは、１０個の二次符号化係数ｃ_ｊ，１～ｃ_ｊ，１０を含んでいる。

【0057】

ベクトルＣ_ｊを生成すべく、本方法は各ブロックａ_ｉ毎に、ブロックａ_ｉが部分集合Ｓ_ｊに属するか否かを調べる（５０４－ｉ）。結果が肯定的な場合（ｙｅｓ分岐）、本方法は係数ｃ_ｊ，ｉに対し非ゼロ乱数（５０６－ｉ）を関連付けられるようにする。ブロックａ_ｉが部分集合Ｓ_ｊに属しない（ｎｏ分岐）場合、本方法は係数ｃ_ｊ，ｉに対しゼロ乱数（５０８－ｉ）を関連付けられるようにする。

【0058】

例えば、符号化ベクトルＣ_１を生成するために、本方法は各データブロックａ_１，ａ_２，．．ａ_１０が部分集合Ｓ_１に属するか否かを調べる。データブロックａ_１，ａ_２，ａ_３は部分集合Ｓ_１に属するため、本方法は従って係数ｃ_１，１，ｃ_１，２及びｃ_１，３に対して非ゼロ乱数を生成する。データブロックａ_４，．．．，ａ_１０はＳ_１に属しないため、本方法は係数ｃ_１，４．．．ｃ_１，１０に関連付けられたゼロ乱数を生成する。

【0059】

従って、部分集合Ｓ_１に対して、本方法は（ｃ_１，１，ｃ_１，２，ｃ_１，３，０，０，０，０，０，０，０）に等しい符号化ベクトルＣ_１を生成可能にし、ここでｃ_１，１、ｃ_１，２及びｃ_１，３は非ゼロ乱数である。

【0060】

部分集合Ｓ_２に対して、本方法は（０，０，０，ｃ_２，４，ｃ_２，５，ｃ_２，６，０，０，０，０）に等しい符号化ベクトルＣ_２を生成可能にし、ここでｃ_２，４、ｃ_２，５及びｃ_２，６は非ゼロ乱数である。

【0061】

部分集合Ｓ_３に対して、本方法は（０，０，０，０，０，０，ｃ_３，７，ｃ_３，８，ｃ_３，９，ｃ_３，１０）に等しい符号化ベクトルＣ_３を生成可能にし、ここでｃ_３，７、ｃ_３，８，ｃ_３，９及びｃ_３，１０は非ゼロ乱数である。

【0062】

図３に戻り、符号化ベクトルの生成ステップの後、本方法は、一次パリティ関数ｆ_０（ａ）及び３個の二次パリティ関数ｆ_１（ａ）、ｆ_２（ａ）及びｆ_３（ａ）を含むデータブロック（ａ_１，．．．，ａ_１０）の一次結合として４個のパリティ関数を生成する（３０８）ことを可能にする。

【0063】

図６に、本発明の原理による一次パリティ関数ｆ_０（ａ）及び二次パリティ関数ｆ_ｊ（ａ）ｊ∈｛１，２，３｝の生成を詳述する。一次パリティ関数（６０２）は１０個のデータブロック（ａ_１，．．．，ａ_１０）の一次結合であり、パリティノードＮ_１１に記憶されている。各データブロックａ_ｉには一次符号化ベクトルＣ_０（４００）の符号化係数ｃ_０，ｉが関連付けられている。一次パリティ関数ｆ_０（ａ）は、次式のように書くことができる。
－ｆ_０（ａ）＝ｃ_０，１＊ａ_１＋ｃ_０，２＊ａ_２＋ｃ_０，３＊ａ_３＋ｃ_０，４＊ａ_４＋ｃ_０，５＊ａ_５＋ｃ_０，６＊ａ_６＋ｃ_０，７＊ａ_７＋ｃ_０，８＊ａ_８＋ｃ_０，９＊ａ_９＋ｃ_０，１０＊ａ_１０
ここで係数ｃ_０，１，ｃ_０，２，．．．，ｃ_０，１０は非ゼロ乱数である。

【0064】

図６に示すように、３個の二次パリティ関数ｆ_ｊ（ａ）（１≦ｊ≦３）（６０４）を生成するために、本方法は最初に３個の一次関数ｇ_ｊ（ａ）（１≦ｊ≦３）（６０６）を生成する。各一次関数ｇ_ｊ（ａ）は、１０個のデータブロック（ａ_１，．．．，ａ_１０）と符号化ベクトルＣ_ｊ（１≦ｊ≦３）（５００）の一次結合である。

【0065】

一次関数ｇ_１（ａ）は１０個のデータブロック（ａ_１，．．．，ａ_１０）と符号化ベクトルＣ_１の一次結合により得られ、次式のように書くことができる。
－ｇ_１（ａ）＝ｃ_１，１＊ａ_１＋ｃ_１，２＊ａ_２＋ｃ_１，３＊ａ_３

【0066】

一次関数ｇ_２（ａ）は１０個のデータブロック（ａ_１，．．．，ａ_１０）と符号化ベクトルＣ_２の一次結合により得られ、次式のように書くことができる。
－ｇ_２（ａ）＝ｃ_２，４＊ａ_４＋ｃ_２，５＊ａ_５＋ｃ_２，６＊ａ_６

【0067】

同様に、一次関数ｇ_３（ａ）は１０個のデータブロック（ａ_１，．．．，ａ_１０）と符号化ベクトルＣ_３の一次結合により得られ、次式のように書くことができる。
－ｇ_３（ａ）＝ｃ_３，７＊ａ_７＋ｃ_３，８＊ａ_８＋ｃ_３，９＊ａ_９＋ｃ_３，１０＊ａ_１０

【0068】

関数ｇ_ｊ（ａ）（１≦ｊ≦３）が生成されたならば、本方法は二次パリティ関数ｆ_１（ａ）、ｆ_２（ａ）及びｆ_３（ａ）を生成可能にする。二次パリティ関数ｆ_１（ａ）は、一次パリティ関数ｆ_０（ａ）と一次関数ｇ_１（ａ）の和により得られ、次式のように表すことができる。
－ｆ_１（ａ）＝ｆ_０（ａ）＋ｇ_１（ａ）

【0069】

同様に、二次パリティ関数ｆ_２（ａ）は一次パリティ関数ｆ_０（ａ）と一次関数ｇ_２（ａ）の和により得られ、次式のように表すことができる。
－ｆ_２（ａ）＝ｆ_０（ａ）＋ｇ_２（ａ）

【0070】

同様に、二次パリティ関数ｆ_３（ａ）は一次パリティ関数ｆ_０（ａ）と一次関数ｇ_３（ａ）の和により得られ、次式のように表すことができる。
－ｆ_３（ａ）＝ｆ_０（ａ）＋ｇ_３（ａ）

【0071】

二次パリティ関数ｆ_１（ａ）、ｆ_２（ａ）、ｆ_３（ａ）は、各パリティノードＮ_１２、Ｎ_１３及びＮ_１４（２０８）に記憶されている。

【0072】

有利には、一次関数ｇ_１（ａ）、ｇ_２（ａ）、ｇ_３（ａ）及び一次パリティ関数ｆ_０（ａ）は、互いに一次独立であるように生成される。更に、これらの関数の任意の２個の和も他の関数とは一次独立である。最後に、有利には、全てのデータブロックが一次独立であるため、バビロン符号は同じ特性をＲＳ符号として維持する。

【0073】

図７ａ～７ｃに、本発明の原理による、故障を検知して、システム化ノード及びパリティノードのコンテンツを再構築するステップを示す。

【0074】

図７ａに示すように、本方法は、記憶システムの故障の検知に関する、故障の件数（７０４）を示す情報が利用できるときに開始される（７０２）。故障の件数が５以上である場合、修復方法は動作不可能なことがあり、システムに不具合がある（７０６）と考えられる。故障の件数が２～４である場合、故障した２、３又は４個のノードは、消去符号又はリードソロモン型の公知の修復方法（７０８）に従い再構築することができる。

【0075】

バビロン符号による請求項に記載の方法は、ローカル又は分散記憶システムの単一の記憶ノードが故障した場合に機能する。修復ステップは、他の記憶ノード内で、故障したノードに含まれていた消失データを取得して、新規な記憶ノードを同じデータで再構築可能にする。本方法は、故障が検知された後で、故障していた（７１０）ノードの性質、すなわちシステム化ノード又はパリティノードのいずれであるかを判定する。

【0076】

本発明の原理の理解を容易にすべく、且つ限定することなく、本再構築方法について最初に符号（ｋ＝１０，ｒ＝４）の特定の例を挙げて記述し、次いで任意の符号（ｋ，ｒ）に一般化する。

【0077】

符号（１０，４）を用いる記憶システムの例に関する本発明の復号化方法の記述
故障がシステム化ノードＮ_ｉ，ｉ∈｛１，．．，１０｝、すなわちデータブロックａ_ｉを記憶しているノードに関係している場合、再構築（７１２）は図７ｂに記述する方法のステップにより行われる。

【0078】

故障がパリティノードＮ_ｉ，ｉ∈｛_１１，．．，_１４｝、すなわちパリティ関数を記憶しているノードに関係している場合、再構築（７１４）は図７ｃに記述する方法のステップにより行われる。

【0079】

図７ｂに、本発明のシステム化ノードの再構築ステップを示す。

【0080】

本方法を説明するために、ノードＮ_１に位置するブロックａ_１が消失していて再構築する必要があると仮定する。第１のステップ（７１６）において、本方法は、故障したノードＮ_ｉのデータａ_ｉが属するデータの部分集合Ｓ_ｊ，ｊ∈［１，２，３］を判定可能にする。本例では、データブロックａ_１はデータ（ａ_１，ａ２，ａ３）を含む部分集合Ｓ_１に属する。次のステップ（７１８）において、本方法はノードＮ_１１に記憶されている一次パリティ関数ｆ_０（ａ）のデータの取得、及びノードＮ_１２に記憶されている識別された部分集合Ｓ_１の添え字に対応する二次パリティ関数ｆ_１（ａ）のデータの取得を可能にする。表現「データを取得する」を用いて記憶ノードからデータ収集装置へのデータ転送動作を表す。データ収集装置は、ノードの再構築方法を実行可能な汎用記憶システムコントローラに組み込まれていてよい。データの取得はまた、記憶ノード及びデータ収集装置のメモリ要素との間の読み出し／書き込み動作を含んでいる。

【0081】

データ収集ステップの後で、本方法は、取得されたデータからデータＳ_１の部分集合に関連付けられた一次関数ｇ_１（ａ）を計算することを可能にする（７２０）。一実施形態において、一次関数ｇ_ｊ（ａ）は、ノードＮ_１２に位置する二次パリティ関数ｆ_１（ａ）からノードＮ_１１に位置する一次パリティ関数ｆ_０（ａ）を減算することにより得られる。

【0082】

次のステップ（７２２）において、本方法は、消失したブロックａ_１以外の部分集合Ｓ_１のデータブロック（ａ_２，ａ_３）をロード可能にする。これらのデータを一次関数ｇ_１（ａ）から減算することにより、データａ_１が取得され、消失したデータブロックａ_１の一次記憶ノードＮ_１が再構築される（７２４）。

【0083】

ａ_１のノードの再構築は、１０個のブロックを要する従来のＲＳ符号とは異なり、４個のデータブロック｛ａ_２，ａ_３，ｆ_０（ａ），ｆ_１（ａ）｝だけを用いればよく、すなわち６０％の節減となる。同様に、ｉ∈｛１，２，３｝である任意のデータブロックａ_ｉのシステム化ノードの再構築もまた、添え字ｉ∈｛１，２，３｝＼｛ｉ｝を有する、すなわち、故障したノードＮ_ｉに対応する添え字ｉのデータブロック以外のデータブロックを用い、且つ一次パリティｆ_０（ａ）及び二次パリティｆ_１（ａ）関数のデータブロックを用いるため、４個のブロックだけを必要とする。

【0084】

ｉ∈｛４，５，６｝である任意のデータブロックａ_ｉのシステム化ノードの再構築は、添え字ｉ∈｛４，５，６｝＼｛ｉ｝を有するデータブロックを用い、且つ一次パリティｆ_０（ａ）及び二次パリティｆ_２（ａ）関数のデータブロックを用いるため４個のブロックを必要とする。

【0085】

ｉ∈｛７，８，９，１０｝である任意のデータブロックａ_ｉのシステム化ノードの再構築は、添え字ｉ∈｛７，８，９，１０｝＼｛ｉ｝を有するデータブロックを用い、且つ一次パリティｆ_０（ａ）及び二次パリティｆ_３（ａ）関数のデータブロックを用いるため、５個のブロックを必要とする。

【0086】

図７ｃに、本発明のパリティノードの再構築ステップを示す。

【0087】

ノードＮ_ｉ，ｉ∈［１１，１４］は、一次ｆ_０（ａ）及び二次ｆ_１（ａ）、ｆ_２（ａ）、ｆ_３（ａ）パリティ関数を含んでいる。本方法は最初に、修復対象のノードが一次パリティ関数ｆ_０（ａ）を含むＮ_１１であるか否かを判定する（７２６）。ｙｅｓの場合、本方法はデータｆ_１（ａ）とａ_１、ａ_２、ａ_３を含む部分集合Ｓ_１のデータをノードＮ_１２，Ｎ_１，Ｎ_２及びＮ_３から転送する（７２８）ことを可能にする。次のステップ（７３０）において、本方法は、データａ_１、ａ_２、ａ_３を用いて一次関数ｇ_１（ａ）の生成、次いでパリティ関数ｆ_１（ａ）から一次関数ｇ_１（ａ）を減算することによる一次パリティ関数ｆ_０（ａ）の復号化を可能にする。本方法は次いでノードＮ_１１を再構築可能にする。

【0088】

ノードｉ，ｉ∈｛１，．．，１０｝と同様に，Ｎ_１１の修復は、４個のデータブロック（ｆ_１（ａ），ａ_１，ａ_２，ａ_３）だけを必要とする。

【0089】

ステップ（７２６）に戻り、修復対象のノードがｉ∈［１２，１４］のようなパリティノードＮ_ｉである場合、本方法はパリティ関数ｆ_０（ａ）を含むノードＮ_１１のデータのロード（７３４）、及び部分集合Ｓ_ｉ－１１のデータのロードを可能にする。次のステップ（７３６）において、本方法は、部分集合Ｓ_ｉ－１１のデータを用いて一次関数ｇ_ｉ－１１（ａ）の生成、及び一次パリティ関数ｆ_０（ａ）と一次関数ｇ_ｉ－１１（ａ）の和を求めることにより、パリティ関数ｆ_ｉ－１１（ａ）の復号化を可能にする。本方法は次いで、ノードＮ_ｉ，ｉ∈［１２，１４］の再構築（７３８）を可能にする。

【0090】

従って、二次パリティ関数ｆ_１（ａ）を含むノードＮ_１２を再構築すべく、本方法はノードＮ_１１のパリティ関数ｆ_０（ａ）及び部分集合Ｓ_１のデータをロードする（ノードＮ_１からａ_１、ノードＮ_２からａ_２及びノードＮ_３からａ_３）ことを可能にする。第１段階において、部分集合Ｓ_１のデータａ_１、ａ_２、ａ_３を用いてパリティ関数ｇ_１（ａ）を生成する。次に、ｆ_０（ａ）とｇ_１（ａ）の和を求めることにより、二次パリティ関数ｆ_１（ａ）を復号化してノードＮ_１２を再構築する。

【0091】

同様に、二次パリティ関数ｆ_２（ａ）を含むノードＮ_１３を再構築すべく、本方法はパリティ関数ｆ_０（ａ）を含むノードＮ_１１のデータ及び部分集合Ｓ_２のデータのロードを可能にする。第１ステージにおいて、部分集合Ｓ_２のデータａ_４、ａ_５、ａ_６を用いてパリティ関数ｇ_２（ａ）を生成する。次に、ｆ_０（ａ）とｇ_２（ａ）の和を求めることにより、二次パリティ関数ｆ_２（ａ）を復号化してノードＮ_１３を再構築する。

【0092】

最後に、二次パリティ関数ｆ_３（ａ）を含むノードＮ_１４を再構築すべく、本方法はノードＮ_１１に含まれるパリティ関数ｆ_０（ａ）及び部分集合Ｓ_３のデータをロード可能にする。第１ステージにおいて、部分集合Ｓ_３のデータａ_７、ａ_８、ａ_９、ａ_１０を用いてパリティ関数ｇ_３（ａ）を生成する。次に、ｆ_０（ａ）とｇ_３（ａ）の和を求めることにより、二次パリティ関数ｆ_３（ａ）を復号化してノードＮ_１４を再構築する。

【0093】

ノードＮ_１２及びＮ_１３の修復は、各々４個のデータブロック｛ｆ_０（ａ），ａ_１，ａ_２，ａ_３｝及び｛ｆ_０（ａ），ａ_４，ａ_５，ａ_６｝だけを転送すればよく、ノードＮ_１４の修復は５個のデータブロック｛ｆ_０（ａ），ａ_７，ａ_８，ａ_９，ａ_１０｝の転送を必要とする点に注意されたい。

【0094】

従って、有利には、請求項に記載の再構築方法は、任意のノードｉ∈｛１，．．，１４｝の再構築に４又は５個のデータブロックだけを必要とする。これによりＲＳ符号と比較して帯域幅及び入出力が５０％～６０％削減可能になる。

【0095】

本発明の符号化方法の一般的原理を任意の符号（ｋ，ｒ）について以下に記述する。

【0096】

入力としてサイズＭのデータから開始して、本発明の一般的原理は、各ブロックのサイズがＭ／ｋであるｋ個のデータブロック（ａ_１，．．．，ａ_ｋ）にデータを分割する。ノードＮ_ｉに記憶されている各データブロックａ_ｉのサイズはｍ＝Ｍ／ｋに固定されている。

【0097】

以下の表記は以下の記述に適している。

【数3】

はＸの整数部を表し、

【数4】

はＸの切り上げ整数部を表す。

【0098】

バビロン符号化方法は、ｋ個のデータブロック（ａ_１，．．．，ａ_ｋ）をＳ_ｊ，１≦ｊ≦ｒ－１と表記する（ｒ－１）個の部分集合（Ｓ_１，Ｓ_２，．．．，Ｓ_ｒ－１）に分割するステップで開始される。ｋがｒ－１の倍数である場合、これらの部分集合は同一のサイズｋ／ｒ－１を有している。ｋがｒ－１の倍数でない場合、先頭ｒ－１－ｑ個の部分集合の各々はｔ_ｆ個のデータブロックを含み、残りｑ個の部分集合はｔ_ｃ個のデータブロックを含んでいて次式が成り立つ。

【数5】

【0099】

第１の部分集合Ｓ_１は、（ａ_１，．．，ａ_ｔｆ）に属するデータブロックを含んでいる。ｊ番目の部分集合Ｓ_ｊは（ａ_{（ｊ－１）ｔｆ＋１}，．．．，ａ_ｊｔｆ）に属するデータブロックを含んでいる（１≦ｊ≦ｒ－１）。

【0100】

本方法の第２のステップは、一次符号化ベクトルＣ_０及びｒ－１個の二次符号化ベクトルＣ_ｊ（１≦ｊ≦ｒ－１）を含んでいるｒ個の符号化ベクトルを生成する。

【0101】

一次符号化ベクトルＣ_０は、各一次符号化係数ｃ_０，ｉが非ゼロ乱数に対応するｋ個の符号化係数ｃ_０，１～ｃ_０，ｋを含んでいる。

【0102】

二次符号化ベクトルＣ_ｊはｋ個の符号化係数ｃ_ｊ，１～ｃ_ｊ，ｋを含んでいる。二次符号化ベクトルＣ_ｊを生成すべく、本方法は、各ブロックａ_ｉ毎に、ブロックａ_ｉが部分集合Ｓ_ｊに属するか否かを調べる。そうである場合、本方法は、係数ｃ_ｊ，ｉに非ゼロ乱数を関連付けられるようにし、ブロックａ_ｉが部分集合Ｓ_ｊに属していない場合、本方法は係数ｃ_ｊ，ｉにゼロ乱数を関連付けられるようにする。

【0103】

符号化ベクトルＣ_０～Ｃ_ｒ－１の構造は以下のように表される。
ｃ_０＝［ｃ_０，１，ｃ_０，２，．．，ｃ_０，ｋ］
ｃ_１＝［ｃ_１，１，ｃ_１，２，ｃ_１，ｔｆ，．．．．，０，．．，０］
ｃ_２＝［０，．．，０，ｃ_{２，ｔｆ＋１}，．．，ｃ_{２，２ｔｆ}，０，．．，０］
．．．
ｃ_ｒ－ｑ＝［０，．．，０，ｃ_{ｒ－ｑ，（ｒ－ｑ－１）ｔｆ＋１}，．．，ｃ_{ｒ－ｑ，（ｒ－ｑ）ｔｃ}，０，．．，０］
ｃ_{ｒ－ｑ＋１}＝［０，．．，０，ｃ_{ｒ－ｑ＋１，（ｒ－ｑ）ｔｃ＋１}，．．，ｃ_{ｒ－ｑ＋１，（ｒ－ｑ）ｔｃ}，０，．．，０］
．．．
ｃ_ｒ－１＝［０，．．，．．，．．，０，ｃ_{ｒ－１，ｒｔｃ＋１}，．．，ｃ_{ｒ－１，ｋ}］

【0104】

符号化ベクトルの生成ステップの後、本方法は、データ（ａ_１，．．．，ａ_ｋ）の一次結合であって、一次パリティ関数ｆ_０（ａ）及びｒ－１個の二次パリティ関数ｆ_１（ａ），．．，ｆ_ｒ－１（ａ）を含むｒ個のパリティ関数を生成可能にする。

【0105】

一次パリティ関数は、ｋ個のデータブロック（ａ_１，．．．，ａ_ｋ）の一次結合であって、添え字ｋ＋１、Ｎ_ｋ＋１のパリティノードに記憶されている。各データブロックａ_ｉには一次符号化ベクトルＣ_０の符号化係数ｃ_０，ｉが関連付けられている。一次パリティ関数ｆ_０（ａ）は、次式のように書くことができる。
－ｆ_０（ａ）＝ｃ_０，１＊ａ_１＋ｃ_０，２＊ａ_２＋．．．．．．ｃ_０，ｋ＊ａ_ｋ
ここに係数ｃ_０，１，ｃ_０，２，．．．，ｃ_０，ｋは非ゼロ乱数である。

【0106】

ｒ－１個の二次パリティ関数ｆ_ｊ（ａ）（１≦ｊ≦ｒ－１）を生成すべく、本方法は最初にｒ－１個の一次関数ｇ_ｊ（ａ）（１≦ｊ≦ｒ－１）の全てを生成可能にする。各一次関数ｇ_ｊ（ａ）は、ｋ個のデータブロック（ａ_１，．．．，ａ_ｋ）と符号化ベクトルＣ_ｊ（１≦ｊ≦ｒ－１）の一次結合である。一次関数ｇ_ｊ（ａ）（１≦ｊ≦ｒ－１）が生成されたならば、本方法は、一次パリティ関数ｆ_０（ａ）を一次関数ｇ_ｊ（ａ）に加算することにより二次パリティ関数ｆ_ｊ（ａ），１≦ｊ≦ｒ－１が得られるように、二次パリティ関数ｆ_１（ａ），ｆ_２（ａ）．．．ｆｒ－_１（ａ）を生成可能にする。
－ｆ_ｊ（ａ）＝ｆ_０（ａ）＋ｇ_ｊ（ａ）

【0107】

本発明の符号化により生成されたデータブロック及びパリティ関数は、ローカル又は分散記憶システムの記憶ノードに記憶される。ｋ個のデータブロック（ａ_１，．．．，ａ_ｋ）は、ｋ個のシステム化ノードＮ_ｉ，ｉ∈｛１，．．，ｋ｝に記憶され、パリティ関数により得られたｒ個のパリティブロックの各々は、以下の表に示すようにパリティノードＮ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝に記憶されている。

【0108】

【表1】

【0109】

有利には、一次関数ｇ_ｊ（ａ），１≦ｊ≦ｒ－１及び一次パリティ関数ｆ_０（ａ）は互いに一次独立であるように生成される。更に、これらの関数のうち任意の２個の和もまた他の関数とは一次独立である。最後に、有利には、全てのデータブロックが一次独立であり、バビロン符号はＲＳ符号と同じ特性を維持している。

【0110】

本発明の再構築方法の一般的原理を以下に任意の符号（ｋ，ｒ）について記述する。再構築方法は、記憶システムの故障の検知に関する情報が利用可能な場合に開始される。本方法はノードのコンテンツを複製すべく開始することができる。故障発生時の再構築方法は、ローカル又は分散記憶システム内の単一の記憶ノードが故障した場合に機能する。修復ステップは、他の記憶ノード内で、故障したノードに含まれていた消失データの取得、及び同じデータを用いた新たな記憶ノードの再構築を可能にする。

【0111】

故障が検知された場合、本方法は故障したノードの性質、すなわちシステム化ノード又はパリティノードのいずれであるかを判定する。

【0112】

故障がシステム化ノードＮ_ｉ，ｉ∈｛１，．．，ｋ｝、すなわちデータブロックａ_ｉを記憶しているノードに関する場合、再構築は以下に記述するケース１に従い行われる。

【0113】

故障がパリティノードＮ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝、すなわちパリティ関数を記憶しているノードに関する場合、再構築は以下に記述するケース２に従い行われる。

【0114】

－ケース１：ノードＮ_ｉ，ｉ∈｛１，．．，ｋ｝の再構築
ノードＮ_ｉに記憶されているａ_ｉ∈Ｓ_ｊ且つ（１≦ｊ＜ｒ）であるデータａ_ｉ（１≦ｉ≦ｋ）の修復を考慮するに、本方法は最初に添え字ｋ＋１のノードＮ（_ｋ＋１）及び添え字ｋ＋１＋ｊのノードＮ_{（ｋ＋１＋ｊ）}に含まれるデータを転送可能にする。次に、添え字ｋ＋１のノードＮ（_ｋ＋１）に記憶されているデータｆ_０（ａ）を、添え字ｋ＋１＋ｊのノードＮ_{（ｋ＋１＋ｊ）}に記憶されているデータｆ_ｊ（ａ）から減算して、部分集合Ｓ_ｊに関連付けられた一次関数ｇ_ｊ（ａ）を復旧する。本方法は次いで、部分集合Ｓ_ｊ＼｛ａ_ｉ｝の（すなわちデータブロックａ_ｉ以外の）データを転送可能にする。一次関数ｇ_ｊ（ａ）の使用により、消失したデータａ_ｉが復号化可能になる。ａ_ｉの再構築に必要なデータブロックの個数は従って、ｉが先頭（ｒ－１－ｑ）個の部分集合に属する場合、（ｔ_ｆ＋１）である。ｉが最後のｑ個の部分集合に属する場合、必要なデータブロックの総数は（ｔ_ｃ＋１）である。

【0115】

－ケース２：ノードＮ_ｉ，ｉ∈｛ｋ＋１，．．，ｋ＋ｒ｝の再構築
前のケースと同様に、ノードＮ_ｉ（ｋ＋１＜ｉ≦ｋ＋ｒ）を再構築すべく、本方法は添え字ｋ＋１のノードＮ_{（ｋ＋１）}に記憶されているデータｆ_０（ａ）及び部分集合Ｓ_{ｉ－ｋ＋１}に位置するデータを転送可能にする。一次関数ｇ_{ｉ－ｋ＋１}（ａ）は部分集合Ｓ_{ｉ－ｋ＋１}のデータから得られる。次に、復号化は、一次関数ｆ_０（ａ）及び一次関数ｇ_{ｉ－ｋ＋１}（ａ）を用いて二次関数ｆ_{ｉ－ｋ＋１}（ａ）（実際には、ｆ_{ｉ－ｋ＋１}（ａ）＝ｆ_０（ａ）＋ｇ_{ｉ－ｋ＋１}（ａ））を取得することにより実行される。（ｉ－ｋ＋１）が先頭（ｒ－１－ｑ）個のブロックに属するならば、修復に（ｔ_ｆ＋１）個のデータブロックを必要とする点に注意されたい。（ｉ－ｋ＋１）∈｛ｒ－ｑ，．．，ｒ－１｝ならば、修復に（ｔ_ｃ＋１）個のブロックを必要とする。

【0116】

一次パリティ関数ｆ_０（ａ）を含む添え字ｋ＋１のノードＮ_ｋ＋１の特定のケースの場合、本方法は一次関数ｇ_１（ａ）を生成すべく第１の部分集合Ｓ_１を転送可能にする。本方法は次いで、二次パリティ関数ｆ_１（ａ）を含む添え字ｋ＋２のノードＮ_ｋ＋２からデータを転送可能にする。二次パリティ関数ｆ_１（ａ）から一次関数ｇ_１（ａ）を減算することにより、一次パリティ関数ｆ_０（ａ）を復号化する（実際には、ｆ_０（ａ）＝ｆ_１（ａ）－ｇ_１（ａ））。（ｔ_ｆ＋１）個のデータブロックを用いることにより、一次パリティ関数ｆ_０（ａ）を含む添え字ｋ＋１のノードＮ_ｋ＋１のデータが取得される。

【0117】

一般に、再構築／修復のために転送及び読み出されるデータの平均値は、ノードの種類に依らず次式で与えられる。

【数6】

【0118】

記述が値ｒ≧３を例として挙げている点に注意されたい。値ｒ＝１の場合、バビロン符号は従来のＲＳ符号として機能する。値ｒ＝２の場合、データは２個の部分集合Ｓ_１及びＳ_２に分割され、Ｓ_１は先頭ｔ_ｓ個のブロックを含み、Ｓ_２は最後のｋ－ｔ_ｓ個のブロックを含み、ここで

【数7】

である。

【0119】

有利には、本発明の方法は再構築の処理に全てのノードを使用しなくて済むようにする。更に、再構築に寄与するノードは計算を実行する必要がなく、単に自身のコンテンツを復号化動作が実行されるデータ収集器に転送するだけでよい。データ収集器は、故障したノードを代替する新たな記憶ノードであってよい。

【0120】

更に有利には、バビロン符号化方法により、ｋ個のノードのデータブロックの全てが再構築に必要な行列に基づく方法と比較して再構築時間が削減される。

【0121】

図８は、異なる既知の符号の結果を本発明のバビロン符号により得られた結果と比較する性能レベルの比較表である。表（８００）において、第１列は比較された符号、すなわちＲＳ、再生器、精密再生器、階層的、ヒッチハイカ、及びバビロンの一覧を示す。

【0122】

全ての符号に対して、（ｋ＝１０，ｒ＝４）の構成を用いて符号化された同一サイズＭバイトのファイルを考察した。

【0123】

異なるパラメータ、すなわち修復に要する平均帯域幅（８０６）、ディスク入出力（８０８）及び故障耐性（８１０）に対して同一の記憶効率（７１％）の列（８０４）の各符号について評価が行われた。帯域幅及びディスク入出力は、元ファイルのサイズＭに対するパーセンテージとして表されている。表内のパーセンテージは、システム化ノード及びパリティノードの修復を考慮しながら計算された。

【0124】

結果は以下の通りである。
－ＲＳ符号の場合、単一の故障の修復にＭバイトの読み出し及び転送を要する。これはファイルの下のサイズの１００％に等しい。
－同一記憶効率の場合、再生器符号及び精密再生器符号が必要とする帯域幅が計算された。故障の修復に用いる帯域幅は平均３２．５％に等しい。しかし、ディスク入出力は最適化されていない。単一の故障を修復するには、再生器符号は、ノードに記憶されている全てのデータが転送される前に読み込まれることを必要とする。
－階層的符号は、帯域幅及びディスク入出力の両方を最適化する。ネットワーク内で読み込まれて転送されるデータの量は３３．５７％に等しい。しかし、階層的符号はＲＳ符号と同レベルの故障耐性を維持しない。実際、階層的符号を用いてどの４件の故障にも耐えられない。
－ヒッチハイカ符号は、ＲＳ符号と同レベルの故障耐性を維持しながら、帯域幅及びディスク入出力の両方の最適化を可能にする。この場合、読み込まれて転送されるデータの量は７６．４２％に等しい。
－バビロン符号は、単一の故障を帯域幅及びディスク入出力の両方の観点から修復するのに元ファイルのサイズの平均４３．５７％を必要とする。バビロン符号はまた、１４個のノードのうち任意の４件の故障に耐えられるようにする。

【0125】

本発明は、ハードウェア及び／又はソフトウェア要素により実装できる。本発明は、コンピュータ可読媒体上のコンピュータプログラム製品として利用可能であってよい。媒体は、電子、磁気、光学又は電磁気であってよい。一実施形態において、本方法はコンピュータにより実装される。コンピュータプログラム製品について記述され、前記コンピュータプログラムは、前記プログラムがコンピュータ上で動作した際に本方法の１個以上のステップを実行可能にする符号命令を含んでいる。一実施形態において、本発明を実装する装置は、１個以上のプロセッサで動作した際に上述の複数の実施形態の機能を実行するコンピュータプログラム（すなわち実行可能な複数の命令）により符号化されたコンピュータ可読記憶媒体（ＲＡＭ、ＲＯＭ、フラッシュメモリ又は他のメモリ技術、例えばディスク媒体又は他の非一時的コンピュータ可読記憶媒体）を含んでいる。本発明の実装に適したハードウェアアーキテクチャの一例として、一装置は、中央演算処理装置又はマイクロプロセッサ（ＣＰＵすなわちＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略）が接続された通信バス（当該プロセッサは「マルチコア」又は「多コア」であってよい）、本発明の実施に必要なプログラムを格納可能な読み出し専用メモリ（ＲＯＭ）、上述のプログラムの実行中に生成及び変更された変数及びパラメータの格納に適したレジスタを含むランダムアクセスメモリ又はキャッシュメモリ（ＲＡＭ）、データの送受信に適した通信又はＩ／Ｏ（入出力）インターフェースを含んでいてよい。本発明が再プログラム可能な計算機（例：ＦＰＧＡ回路）上にインストールされた場合、対応するプログラム（すなわち一連の命令）は着脱可能な記憶媒体（例：ＳＤカード、又はハードディスク、例えばＳＳＤ等の大容量ストレージ）又は着脱不可能な、揮発性又は不揮発性記憶媒体に記憶することができ、記憶媒体はコンピュータ又はプロセッサにより一部又は全部が読み出し可能である。コンピュータ可読媒体は、搬送可能又は通信可能或いは移動可能又は送信可能であってよい（すなわち、２Ｇ、３Ｇ、４Ｇ、Ｗｉｆｉ、ＢＬＥ、光ファイバー又は他の通信ネットワークを介して）。動作時に、上述の機能の任意の１個を実行するコンピュータプログラムへの言及は、単一のホストコンピュータで動作するアプリケーションプログラムに限定されない。逆に、ここでは、用語「コンピュータプログラム」及び「ソフトウェア」を、本明細書に記述する技術の態様を実行させるべく１個以上のプロセッサをプログラムするのに使用できる任意の種類のコンピュータ符号（例：アプリケーションソフトウェア、ファームウェア、マイクロコード、又はウェブサービス或いはＳＯＡ等の、又はプログラムインターフェースＡＰＩを介した他の任意の形式のコンピュータ命令）に言及すべく、一般的な意味で用いている。コンピュータ手段又はリソースは特に、恐らくピアツーピア及び／又は可視化技術と合わせて、又はこれらに従い分散（「クラウドコンピューティング」）されていてよい。ソフトウェアコードは、単一の計算装置で提供されるか又は複数の計算装置（恐らく当該装置の環境でアクセス可能）に分散されているかに依らず、任意の適当なプロセッサ（例：マイクロプロセッサ）又はプロセッサコア或いは一組のプロセッサ上で実行することができる。セキュリティ技術（暗号のプロセッサ、認証、暗号化、チップカード等）を用いてもよい。

【図1】