(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0014】
以下、本発明の実施の形態について、図面を参照して説明する。
【0015】
図1は、本実施形態におけるファイル配置先決定装置1の構成を示す機能ブロック図である。ファイル配置先決定装置1は、複数のファイル(データ、情報)を複数のストレージに分散して配置(格納)する際に、各ストレージの性能およびデータの価値に基づいて、配置先のストレージを決定する。なお、ファイルは、データまたは情報のまとまりである。データまたは情報は、ファイル単位に管理され、ストレージに配置される。
【0016】
本実施形態のファイル配置先決定装置1は、セッション占有比率設定部11と、総和値決定部12と、配置先決定部13と、ストレージ情報テーブル14と、ファイル情報テーブル15と、配置ファイルテーブル16とを備える。
【0017】
セッション占有比率設定部11は、複数のファイルにそれぞれ設定された価値を示すスコアに基づいて、各ファイルのセッション占有比率を設定する。なお、セッション占有比率設定部11は、各ファイルのスコアをスコア算出装置2から取得する。
【0018】
総和値決定部12は、性能レベルが異なる複数のストレージに対して、性能レベルに応じて複数のファイルのセッション占有比率の総和を配分し、各ストレージのセッション占有比率の総和値を決定する。本実施形態では、総和値決定部12は、複数のストレージでアクセス遅延が同じ場合の各ストレージのセッション数の比率を用いて、総和値を決定することとする。
【0019】
配置先決定部13は、複数のファイルのうちセッション占有比率が正の値の各ファイルについては、各ファイルのセッション占有比率を用いて、総和値の範囲内で複数のストレージのいずれかを配置先として決定する。本実施形態では、配置先決定部13は、セッション占有比率の高いファイルから順に配置先を決定し、また、容量が小さいストレージから順に、各ファイルのセッション占有比率が当該ストレージの総和値の範囲内か否かを判別することとする。
【0020】
また、配置先決定部13は、複数のファイルのうちセッション占有比率がゼロの各ファイルについては、複数のストレージの空き容量を用いて、複数のストレージのいずれかを配置先として決定する。
【0021】
ストレージ情報テーブル14は、各ファイルの配置先となる複数のストレージの情報(パラメータ)が設定されるテーブルである。ファイル情報テーブル15は、配置先決定の対象となる複数のファイルの情報(パラメータ)が設定されるテーブルであ。配置ファイルテーブル16は、ストレージ毎に生成されるテーブルであって、当該ストレージを配置先として決定したファイルに関する情報が設定される。
【0022】
スコア算出装置2は、各ファイルのデータの価値を評価し、各ファイルのデータの価値の定量化(スコアリング)を行う。本実施形態のスコア算出装置2は、各ファイルへのアクセス頻度だけでなく、ファイル属性、ユーザの操作内容などを用いて、ファイル毎にデータの価値を示す指標であるスコアを算出する。なお、ファイル属性には、ファイル作成者、ファイル種別、ディレクトリ情報などがある。操作内容には、アクセス頻度、アクセス方法(read、create、modifyなど)などがある。
【0023】
スコア算出装置2は、複数のストレージに分散して配置する対象となる各ファイルのスコアを、ファイル配置先決定装置1に提供する。これにより、ファイル配置先決定装置1は、ユーザの利用実態に即して各ファイルの配置先のストレージを適切に決定することができる。
【0024】
上記説明したファイル配置先決定装置1は、例えば、CPUと、メモリと、ハードディスク等の外部記憶装置などを備えた汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、CPUがメモリ上にロードされたファイル配置先決定装置1のプログラムを実行することにより、ファイル配置先決定装置1の各機能が実現される。また、ファイル配置先決定装置1のプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD−ROMなどのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。
【0025】
次に、本実施形態の処理について説明する。
【0026】
図2は、本実施形態におけるファイル(データ、情報)の配置先を決定する際の考え方を示す図である。本実施形態の分散配置方式は、各ファイルの価値を示すスコア、アクセス遅延およびストレージ容量を考慮し、高い価値のファイルより低い価値のファイルの方がアクセシビリティが良い事象が発生しないように、ストレージ全体の最適化を実現する。
【0027】
図2(a)は、性能レベルが異なる3つのストレージを例として示している。ここでは、性能レベルに応じて、ストレージを3つの階層(Tier1〜3)に分類している。本実施形態では、数値が小さいものほど性能が高いことを表している。
【0028】
図2(b)に示すように、アクセス頻度が高い高アクセスデータのファイルを高性能のTier1のストレージに配置し、アクセス頻度が低い低アクセスデータのファイルを低性能のTier3のストレージに配置した場合、ユーザアクセスにおける遅延が、Tier1のストレージの方がTier3のストレージより大きくなる場合が考えられる。すなわち、高アクセスデータを高性能のTier1のストレージに配置したにもかかわらず、高アクセスデータへのセッション数n2が多いため、低性能のTier3のストレージに配置した比較的少ないセッション数n1の低アクセスデータの方が低遅延でアクセス可能となる場合がある。
【0029】
そこで、
図2(c)に示すように、本実施形態の配置方式では、データへのアクセス頻度だけでなく、データの価値(スコア)、アクセス遅延およびストレージ容量を考慮して、性能レベルが異なる各ストレージに配置されたデータのアクセス遅延が均一になるようにデータの配置先を決定する。
【0030】
図3は、ストレージ情報テーブル14およびファイル情報テーブル15の一例を示す図である。
【0031】
図3(a)は、ストレージ情報テーブル14の一例を示す図である。図示するストレージ情報テーブル14は、ファイルの配置先となる対象のストレージ毎に、性能レベル(Tier)、容量(物理容量)、残容量、保存容量、1GB当たりのセッション数と遅延の関係などのパラメータが設定される。各ストレージにおける残容量は、全容量から全データ容量を減算して全残容量(=全容量−全データ容量)を算出し、各ストレージにおける容量の比率で分配する。
【0032】
図示する例では、全容量(700)から全データ容量(600)を減算した全残容量(100)を、1:2:4の比率で各ストレージに配分する。その結果、Tier1のストレージの残容量は14、Tier2のストレージの残容量は29、Tier3のストレージの残容量は57となる。全データ容量は、
図3(b)に示す全ファイルのサイズの総和である。
【0033】
各ストレージにおける保存容量は、容量から残容量を減算した値が設定される。また、セッション数(x)と遅延(y)の関係は、以下に示すとおりである。
【0034】
遅延(y)=傾き(a)×セッション数(x)
図3(b)は、ファイル情報テーブル15の一例を示す図である。図示するファイル情報テーブル15には、
図3(a)のストレージに配置する各ファイルの情報が設定される。
図3(b)のファイル情報テーブル15は、ファイル毎に、ファイル名と、スコアと、セッション占有比率と、サイズと、配置先として決定されたストレージ(Tier)などのパラメータが設定される。
【0035】
スコアは、各ファイルのデータの価値を示す指標であって、スコア算出装置2によりあらかじめ算出された値(ここでは、0〜100の範囲)が設定される。ファイル配置先決定装置1のセッション占有比率設定部11は、スコア算出装置から対象のファイルのスコアを取得し、ファイル情報テーブル15に設定する。
【0036】
セッション占有比率は、ユーザアクセスにおいてセッションを占有する比率をいう。本実施形態では、スコア/100をセッション占有比率とする。すなわち、価値が高い重要なデータのファイルほど、セッション占有比率が高くなる。例えば、スコア100の高価値データのファイルの場合、セッションを全時間帯で占有する比率を1とする。本実施形態では、データの価値(スコア)をセッション占有比率とみなし、各ストレージにおけるセッション数−遅延特性、残容量を考慮し、遅延および残容量比率が均一になるように各ファイルの配置先を決定する。サイズには、各ファイルのデータサイズが設定される。ここでは、全ファイルのデータ容量(サイズの総和)は、600である。
【0037】
図4は、ファイル配置先決定装置1の動作の概要を示すフローチャートである。
【0038】
ファイル配置先決定装置1の総和値決定部12は、各Tierのストレージにおけるセッション占有比率の総和値を算出する(S11)。すなわち、性能レベルが異なる複数のストレージに対して、性能レベルに応じて複数のファイルのセッション占有比率の総和を配分し、各ストレージのセッション占有比率の総和値を決定する。総和値は、各Tierのストレージに配置されるファイルのセッション占有比率の合計に対する基準値であって、配置されるファイルのセッション占有比率の合計が総和値の範囲内に収まるようにファイルを配置する。
【0039】
そして、配置先決定部13は、セッション占有比率が正の値(数)のファイルを対象として保存容量が最小のストレージから、算出した総和値の範囲内で、セッション占有比率が高いファイルから順に当該ファイルの配置先として決定する(S12)。
【0040】
そして、配置先決定部13は、セッション占有比率がゼロ(0)のファイルを対象として、S12の処理後で残りの保存容量(空き容量)が最大のストレージから、所定の順番で(例えば、ファイル名順に)当該ファイルの配置先として決定する(S13)。
【0041】
次に、
図4の各処理について詳細に説明する。
【0042】
図5は、
図4のS11の処理を説明するための説明図である。なお、S11の処理の前に、セッション占有比率設定部11は、スコア算出装置2から取得した各ファイルのスコア(価値)に基づいてセッション占有比率を算出し、ファイル情報テーブル15に設定している。
【0043】
総和値決定部12は、各Tierのストレージにおけるセッション占有比率の総和値(基準値)を、各Tierのセッション数−アクセス遅延特性を用いて、遅延の値yが各Tierのストレージで均一となるように算出する。具体的には、遅延yを同一とする際の各Tierのストレージにおけるセッション数xの比率を用いて、総和値を以下の式により算出する。
【0044】
総和値=全ファイルのセッション占有比率の総和×
(当該Tierのセッションxの比率/全Tierのセッション数xの比率の総和)
図3(a)に示すストレージ情報テーブル14の各ストレージについて、
図3(b)のファイルを配置する場合の総和値を具体的に説明する。ここで、遅延yが同じ場合の各Tierのストレージにおけるセッション数の比率は、Tier1:Tier2:Tier3=6:3:2であるものとする。この場合、各Tierのストレージの総和値は、以下のように算出される。
【0045】
Tier1の総和値=セッション占有比率の総和(5.6)×6/11=3.0545
Tier2の総和値=セッション占有比率の総和(5.6)×3/11=1.5272
Tier3の総和値=セッション占有比率の総和(5.6)×2/11=1.018
図6は、
図4のS12の処理の詳細を示すフローチャートである。
図6は、各ストレージに配置するファイルの一覧であるファイル情報テーブル15(
図3(b))の中で、セッション占有比率が正の値(数)のファイルを対象とした処理である。
【0046】
ファイル配置先決定装置1の配置先決定部13は、ファイル情報テーブル15(
図3(b))を参照し、配置先が未決定のファイルであって、セッション占有比率が最も高いファイルを選択する(S121)。
【0047】
配置先決定部13は、選択したファイルのセッション占有比率が、対象とするTierのストレージのこの時点の総和値の範囲内か否かを判別する(S122)。なお、対象とするTierのストレージは、この時点にて保存容量が最も小さいものから対象とする。
【0048】
総和値の範囲内の場合(S122:YES)、選配置先決定部13は、選択したファイルのサイズが対象Tierのストレージのこの時点の保存容量の範囲内であるか否かを判別する(S123)。なお、基本的には容量から残容量を除いた保存容量を用いてS123の判別を行うが、最終的には残容量と保存容量とを合算した物理容量を用いて判断するものとする。
【0049】
保存容量の範囲内の場合(S123:YES)、配置先決定部13は、対象TierのストレージをS121で選択したファイルの配置先(格納先)として決定する(S124)。そして、配置先決定部13は、対象Tierのストレージにおける総和値から決定したファイルのセッション占有比率を減算し、総和値を更新する(S125)。また、配置先決定部13は、対象Tierのストレージにおける保存容量から決定したファイルのサイズを減算し、保存容量を更新する(S126)。
【0050】
そして、対象Tierのストレージに未決定のファイルを格納できる保存容量(空き容量)がある場合であって(S127:YES)、セッション占有比率が正の値のファイルの配置先が全て決定していない場合(S128:NO)、S121に戻り、配置先が未決定のファイルであって、セッション占有比率が最も高い次のファイルを選択する。セッション占有比率が正の値のファイルの配置先が全て決定済みの場合は(S128:YES)、処理を終了する。
【0051】
一方、対象Tierのストレージの総和値を越える場合(S122:NO)、または、対象Tierのストレージの保存容量を超える場合(S123:NO)、次に保存容量の小さいTierのストレージを対象とし(S129)、S122に戻り以降の処理を行う。なお、全てのTierのストレージにおいて総和値を超える場合は(S130:YES)、総和値が最も小さいTierのストレージを、S121で選択したファイルの配置先として決定し、S125以降の処理を行う。
【0052】
また、対象Tierのストレージに未決定のファイルを格納できる保存容量(空き容量)がない場合(S128:NO)、残りのTierのストレージでセッション占有比率の総和値の再計算を行う(S132)。総和値の再計算については、以下に説明する具体例において後述する。
【0053】
図7は、
図3(a)に示す各ストレージに、
図3(b)に示すファイルを配置する場合の具体例を示す図である。図示するように、Tier1、Tier2、Tier3のそれぞれのストレージのセッション占有比率の総和値は、
図5で説明したとおり、3.0545、1.5272、1.018である。また、
図7では、ストレージ毎に配置ファイルテーブル16を備え、当該ストレージに配置先を決定したファイルを設定する。
【0054】
図7に示す例では、配置先決定部13は、
図3(b)のファイル一覧の中からセッション占有比率が最も高いファイルAを選択する(S121)。そして、配置先決定部13は、
図3(a)のストレージの中からこの時点で保存容量が最も小さいTier1のストレージを対象とし、ファイルAのセッション占有比率(1)が現時点では総和値(3.0545)の範囲内であり(S122:YES)、また、ファイルAのサイズ(30)が現時点の保存容量(86)の範囲内であるため(S123:YES)、ファイルAの配置先をTier1のストレージに決定し、当該ストレージの配置ファイルテーブル16にファイルAを設定する(S124)。そして、配置先決定部13は、セッション占有比率の総和値からファイルAのセッション占有比率(1)を減算し、総和値を更新し(S125)、保存容量からファイルAのサイズ(30)を減算して保存容量を更新する(S126)。
【0055】
そして、配置先決定部13は、次にセッション占有比率が大きいファイルBを選択し(S121)、ファイルBのセッション占有比率(0.9)が更新後のTier1の総和値(2.0545)の範囲内であると判別する(S122:YES)。ここで、ファイルBのサイズ(70)はこの時点のTier1の保存容量(56)を超えている。しかしながら、Tier1の物理的な空き容量は、80(保存容量(56)+残容量(14))である。そのため、ファイルBのサイズが現時点の保存容量の範囲内であるとみなし(S123:YES)、ファイルBの配置先をTier1のストレージに決定し、配置ファイルテーブル16にファイルBを設定する(S124)。また、セッション占有比率の総和値および保存容量を更新する(S125、S126)。
【0056】
この段階で、Tier1のストレージの保存容量は-14(物理的な空き容量が無い状態)であり、さらに未決定のファイルを配置可能な空きはないため(S127:NO)、残りのTier2およびTier3のストレージのセッション占有比率の総和値を再計算する(S132)。ファイルAおよびB以外の残りのファイルC〜Jのセッション占有比率の総和は3.7(=5.6−1.9)である。このセッション占有比率の総和を、Tier2とTier3のストレージのセッション数の比率で配分すると、Tier2の総和値は2.22(=3.7×3/5)で、Tier3の総和値は1.48(=3.7×2/5)となる。
【0057】
そして、配置先決定部13は、次にセッション占有比率が大きいファイルCを選択し(S121)、次に保存容量の小さいTier2を対象として、S122およびS123の処理を行い、ファイルCの配置先をTier2のストレージに決定する(S124〜S126)。
【0058】
残りのファイルD〜Jについても、
図6の処理を行うことで、
図7に示すようにファイルD、EはTier2のストレージを配置先に決定し、ファイルF〜JはTier3のストレージを配置先に決定する。
【0059】
図8は、
図4のS13の処理の詳細を示すフローチャートである。
図8は、ファイル情報テーブル15(
図3(b))の中で、セッション占有比率がゼロ(0)のファイルを対象とした処理である。
【0060】
配置先決定部13は、ファイル情報テーブル15を参照し、セッション占有比率がゼロのファイルを所定の順(例えば、ファイル名順)に選択する(S131)。
【0061】
そして、配置先決定部13は、選択したファイルの配置先を、全てのTierの中からこの時点で保存容量が最も大きいTierのストレージに決定し、当該Tierのストレージにおける保存容量から決定したファイルのサイズを減算し、保存容量を更新する(S132)。
【0062】
そして、配置先が未決定のファイルが存在する場合(S133:NO)、S131に戻り、ファイル情報テーブル15から次のファイルを選択し、以降の処理を行う。そして、全てのファイルの配置先を決定すると(S133:YES)、処理を終了する。
【0063】
以下に、
図8の処理を
図7の具体例を用いて説明する。
【0064】
なお、
図8の処理は、セッション占有比率が正の値のファイルA〜Jの配置先が決定した後に行われる。まず、配置先決定部13は、セッション占有比率がゼロのファイルKを選択し(S131)、この時点で保存容量が最も大きいTier3をファイルKの格納先として決定し、Tier3の配置ファイルテーブル16にファイルKを設定する。そして、配置先決定部13は、この時点の保存容量(73)からファイルKのサイズ(60)を減算して13に更新する(S132)。
【0065】
そして、配置先決定部13は、次にファイルLを選択し(S131)、この時点で保存容量が最も大きいTier2をファイルLの格納先として決定し、Tier2の配置ファイルテーブル16にファイルLを設定し、保存容量からファイルLのサイズ(30)を減算して21に更新する(S132)。ファイルMについても、同様の処理を行い、Tier2を格納先として決定する。
【0066】
図9〜
図11は、各Tierのストレージの容量が異なる場合に、
図3(b)に示すファイルを前述の配置先決定処理(
図4〜
図6、
図8)に従って配置先を決定した場合の具体例を示す図である。
【0067】
図9は、Tier1のストレージの容量が400で、Tier2のストレージの容量が200で、Tier3のストレージの容量が100の場合の具体例である。
図9では、以下のように各ファイルの格納先を決定する。
【0068】
(1)セッション占有比率が最も大きいファイルAの配置先を、保存容量が最小のTier3のストレージに決定する。
【0069】
(2)ファイルBの配置先としてTier3のストレージを候補とするが、セッション占有比率がこの時点のTier3のストレージの総和値を超えてしまうため、次に保存容量の小さいTier2のストレージを格納先として決定する。
【0070】
(3)ファイルCの配置先としてTier3、2のストレージを候補とするが、この時点でのTier2、3のストレージのセッション占有比率の総和値を超えてしまうため、Tier1を格納先として決定する。また、ファイルDの配置先として、ファイルCと同様に、Tier1を決定する。
【0071】
(4)ファイルEの配置先としてTier3のストレージを候補とするが、この時点でのTier3のストレージのセッション占有比率の総和値を超えてしまうため、Tier2を格納先として決定する。
【0072】
(5)ファイルFの配置先としてTier3、2のストレージを候補とするが、この時点でのTier3、2のストレージのセッション占有比率の総和値を超えてしまうため、Tier1を格納先として決定する。また、ファイルG〜Iの配置先として、ファイルFと同様に、Tier1を決定する。
【0073】
(6)ファイルJの配置先としてTier3、2、1のストレージを候補とするが、この時点でのTier3、2、1の全てのストレージのセッション占有比率の総和値を超えてしまう。そのため、この時点での総和値が最も小さいTier2を格納先として決定する。
【0074】
(7)ファイルK(セッション占有比率:0)の配置先として、この時点で保存容量が最も大きいTier3を決定する。
【0075】
(8)ファイルL(セッション占有比率:0)の配置先として、この時点で保存容量が最も大きいTier1を決定する。ファイルM(セッション占有比率:0)の配置先として、ファイルLと同様に、Tier1を決定する。
【0076】
図10は、Tier1のストレージの容量が200で、Tier2のストレージの容量が400で、Tier3のストレージの容量が100の場合の具体例である。
図11は、Tier1のストレージの容量が100で、Tier2のストレージの容量が400で、Tier3のストレージの容量が200の場合の具体例である。
図10および
図11の場合においても、
図3(b)に示すファイルを前述の配置先決定処理(
図4〜
図6、
図8)に従って図示するように配置先を決定する。
【0077】
以上説明した本実施形態では、各ファイルの価値を示すスコア、アクセス遅延およびストレージ容量を考慮し、ファイルの配置先を決定する。これにより、本実施形態では、性能の異なる複数のストレージにファイルを配置する際に、アクセス遅延が同じ程度になるようにファイルの配置先を決定することができる。すなわち、高い価値のファイルより低い価値のファイルの方がアクセシビリティが良い事象が発生しないように、ストレージ全体の最適化を実現することができる。
【0078】
また、本実施形態によりファイルをより効果的にストレージに移行することができる。また、ファイルのデータの価値を示すスコアに基づいて、各ファイルのセッション占有比率を設定するため、ユーザの利用実態に即したストレージ利用の効率化を図ることができる。また、遠隔ストレージにおけるアクセス遅延(ネットワーク遅延)も考慮しているため、階層化/遠隔分散ストレージへのファイル配置時におけるユーザレスポンスの向上が期待できる。また、本実施形態では、ユーザレスポンス(ユーザ体感品質)維持しつつ、ファイル配置先決定装置1がファイルの配置先を決定するため、データ管理者の負荷を低減し、データ保管管理に要するコストの低減を図ることができる。
【0079】
なお、本発明は上記実施形態に限定されるものではなく、その要旨の範囲内で数々の変
形が可能である。
【解決手段】ファイル配置先決定装置1であって、複数のファイルにそれぞれ設定されたスコアに基づいて、各ファイルのセッション占有比率を設定する設定手段11と、性能レベルが異なる複数のストレージに対して、性能レベルに応じて複数のファイルのセッション占有比率の総和を配分し、各ストレージのセッション占有比率の総和値を決定する総和値決定手段12と、セッション占有比率が正の値の各ファイルについて、セッション占有比率を用いて総和値の範囲内で複数のストレージのいずれかを配置先として決定する第1の配置先決定手段13と、セッション占有比率がゼロの各ファイルについて、複数のストレージの空き容量を用いて複数のストレージのいずれかを配置先として決定する第2の配置先決定手段13とを備える。