(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-08
(45)【発行日】2024-04-16
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06F 3/06 20060101AFI20240409BHJP
G06F 3/08 20060101ALI20240409BHJP
【FI】
G06F3/06 301W
G06F3/06 301K
G06F3/08 H
(21)【出願番号】P 2020060909
(22)【出願日】2020-03-30
【審査請求日】2023-02-08
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100106909
【氏名又は名称】棚井 澄雄
(74)【代理人】
【識別番号】100134544
【氏名又は名称】森 隆一郎
(74)【代理人】
【識別番号】100149548
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【氏名又は名称】伊藤 英輔
(72)【発明者】
【氏名】尾芦 禎秀
【審査官】松平 英
(56)【参考文献】
【文献】特表2012-523023(JP,A)
【文献】特開2017-156959(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/06-3/08
16/00-16/958
(57)【特許請求の範囲】
【請求項1】
受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置において、
前記受入データのブロック単位のハッシュ値を計算する計算手段と、
前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録する第1記録手段と、
優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、
最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと
、記憶手段が記憶している記憶データ
とが重複しているか否かを判定
した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定する判定手段と、
前記受入データが重複していないと判定された場合、前記更新を行う更新手段と、
を備える情報処理装置。
【請求項2】
前記アドレス情報に基づいて、連続する前記仮想アドレスの値に関連付けられた複数の前記物理アドレスを特定して、当該複数の物理アドレスの前記属性が同一であることを示す属性情報を記録する第2記録手段を備え、
前記第1記録手段は前記属性情報に基づいて管理情報を記録する
請求項1に記載の情報処理装置。
【請求項3】
前記受入データと
、前記記憶データ
とが重複していると判定された場合、前記管理情報に基づいて、当該記憶データと関連付けられた前記属性を優先情報として前記記憶手段に記録する第3記録手段と、
を備える請求項1又は請求項2に記載の情報処理装置。
【請求項4】
前記記憶手段は、SSD(Solid State Drive)である
請求項1から請求項3の何れか1項に記載の情報処理装置。
【請求項5】
受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置において、
前記受入データのブロック単位のハッシュ値を計算するステップと、
前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録するステップと、
優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、
最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと
、記憶手段が記憶している記憶データ
とが重複しているか否かを判定
した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定するステップと、
前記受入データが重複していないと判定された場合、前記更新を行うステップと、
を有する情報処理方法。
【請求項6】
受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置のコンピュータを、
前記受入データのブロック単位のハッシュ値を計算するステップと、
前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録するステップと、
優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、
最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと
、記憶手段が記憶している記憶データ
とが重複しているか否かを判定
した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定するステップと、
前記受入データが重複していないと判定された場合、前記更新を行うステップと、
として実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、LBA(Logical Block Addressing)の値が連続しているデータのブロックをシーケンシャルに検出してストレージに書き込む技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
受け入れたデータのブロックのハッシュ値を、記憶手段が記憶しているデータのブロックのハッシュ値と照らし合わせて、受け入れた当該データのうち、重複するデータを排除して当該記憶手段を更新する技術が知られている。しかし、受け入れたデータのブロックが多くなると多数のハッシュ値を照らし合わせる必要があり、重複を排除した記憶手段の更新において長い処理時間を要している。
本発明の目的は、上述した課題を解決する情報処理装置、情報処理方法及びプログラムを提供することにある。
【課題を解決するための手段】
【0005】
本発明に係る情報処理装置は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置において、前記受入データのブロック単位のハッシュ値を計算する計算手段と、前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録する第1記録手段と、優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと、記憶手段が記憶している記憶データとが重複しているか否かを判定した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定する判定手段と、前記受入データが重複していないと判定された場合、前記更新を行う更新手段と、を備える。
【0006】
本発明に係る情報処理方法は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置において、前記受入データのブロック単位のハッシュ値を計算するステップと、前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録するステップと、優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと、記憶手段が記憶している記憶データとが重複しているか否かを判定した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定するステップと、前記受入データが重複していないと判定された場合、前記更新を行うステップと、を有する。
【0007】
本発明に係るプログラムは、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置のコンピュータを、前記受入データのブロック単位のハッシュ値を計算するステップと、前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録するステップと、優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと、記憶手段が記憶している記憶データとが重複しているか否かを判定した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定するステップと、前記受入データが重複していないと判定された場合、前記更新を行うステップと、として実行させる。
【発明の効果】
【0008】
上記態様のうち少なくとも1つの態様によれば、更新の可能性の高いデータに対して優先的に重複の排除を行うことにより、当該排除にかかる処理を効率良く行うことができる。
【図面の簡単な説明】
【0009】
【
図1】一実施形態に係る情報処理装置の構成を示す概略ブロック図である。
【
図2】一実施形態に係るアドレス情報の一例を示す図である。
【
図3】一実施形態に係る属性情報の一例を示す図である。
【
図4】一実施形態に係る管理情報の一例を示す図である。
【
図5】一実施形態に係る優先情報の一例を示す図である。
【
図6】一実施形態に係るタイムスタンプの一例を示す図である。
【
図7】一実施形態に係る情報処理装置の動作を示すフローチャートである。
【
図8】少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
【発明を実施するための形態】
【0010】
〈第1の実施形態〉
《情報処理装置の構成》
以下、図面を参照しながら実施形態に係る情報処理装置10ついて詳しく説明する。
図1は、第1の実施形態に係る情報処理装置10の構成を示す概略ブロック図である。
情報処理装置10は、受入データのブロックのハッシュ値を照らし合わせて、重複するデータを排除して更新を行う装置である。
情報処理装置10は、入出力部101と、記録部102と、計算部103と、判定部104と、更新部105と、記憶部106を備える。
情報処理装置10は、図示しないサーバと有線又は無線で接続する。
【0011】
入出力部101は、サーバから受入データと仮想アドレスを受け入れる。また、入出力部101は更新完了を示す信号をサーバに出力する。上記受入データとは、入出力部101がサーバから受け入れるデータである。
計算部103は、入出力部101が受け入れた受入データのブロック単位のハッシュ値を計算する。計算部103は計算手段の一例である。
【0012】
記録部102は、アドレス情報200と、属性情報300と、管理情報400と、優先情報500と、タイムスタンプ600を記憶部106に記録する。記録部102は第1記録手段と、第2記録手段と、第3記録手段の一例である。
アドレス情報200と、属性情報300と、管理情報400と、優先情報500と、タイムスタンプ600のそれぞれと、記録部102の動作の詳細について、以下において説明する。
【0013】
図2は、アドレス情報200の一例を示す図である。アドレス情報200は、入出力部101がサーバから受け入れた仮想アドレスと記憶部106の領域を示す物理アドレスとが関連付けられた情報である。
記録部102は、更新部105により記憶部106の更新が行われた場合、当該更新が行われた記憶部106の物理アドレスと、当該更新に係る受入データのブロックに関連付けられた仮想アドレスを関連付けてアドレス情報200として記憶部106に記録する。
【0014】
図3は、属性情報300の一例を示す図である。属性情報300は、記憶部106の物理アドレスと、属性が関連付けられた情報である。
記録部102は、アドレス情報200に基づいて、連続する仮想アドレスの値に関連付けられた複数の物理アドレスを特定して属性情報300を記憶部106に記録する。例えば、アドレス情報200において仮想アドレスの値は1000から1002まで連続し、2000から2002まで連続する。そのため、記録部102は、仮想アドレスの値が1000から1002までに関連付けられた物理アドレスの0010と、0020と、0030を、同一の属性である「データA」と特定して、属性情報300として記憶部106に記録する。また、記録部102は、仮想アドレスの値が2000から2002までに関連付けられた物理アドレスの0010と、0020と、0040を、同一の属性である「データB」と特定して、属性情報300として記憶部106に記録する。すなわち、属性情報300は、複数の物理アドレスの0010と、0020と、0030とが、同一の属性の「データA」であることを示す。また、属性情報300は、複数の物理アドレスの0010と、0020と、0040とが、同一の属性の「データB」であることを示す。
【0015】
図4は、管理情報400の一例を示す図である。管理情報400は、物理アドレスと、当該物理アドレスの更新にかかる受入データのハッシュ値と、当該物理アドレスの属性が関連付けられた情報である。
記録部102は、属性情報300と、計算部103が計算したハッシュ値に基づいて管理情報400を記憶部106に記録する。例えば、物理アドレスの0010の領域に対して更新が行われた受入データのブロックのハッシュ値がxxxである場合、
図4に示すように管理情報400が特定される。また、記録部102は、物理アドレスの0010と関連付けられた属性情報300がデータAとデータBであるため、
図4に示すように管理情報を特定する。
【0016】
図5は、優先情報500の一例を示す図である。優先情報500は、情報処理装置10が優先して重複判定する属性を示す情報である。
記録部102は、判定部104により、受入データと記憶データが重複していると判定された回数が閾値以上である場合、管理情報400に基づいて、当該記憶データと関連付けられた属性を優先情報として記憶部106に記録する。上記記憶データとは記憶部106が記憶しているデータである。例えば、物理アドレスの0010の領域の記憶データと、受入データとが重複している1回判定され、物理アドレスの0030の領域の記憶データと、受入データとが重複していると1回判定されたとする。また、上記閾値は2回とする。この場合、物理アドレスの0010に関連付けられた属性はデータAとデータBであり、物理アドレスの0030に関連付けられた属性はデータAである。属性のデータAに対しては2回重複していると判定され、属性のデータBに対しては1回重複していると判定される。そのため、閾値である2回以上に重複判定された属性のデータAが有線情報として記憶部106に記録される。
【0017】
図6は、タイムスタンプ600の一例を示す図である。タイムスタンプ600は属性とタイムスタンプとを関連付けた情報である。タイムスタンプとは、属性に関連付けられた記憶データが最後に更新された時刻である。例えば、属性のデータAに関連付けられた記憶データが最後に更新された時刻が2020年3月10日10時である場合、
図6に示すようなタイムスタンプ600になる。
記録部102は、更新部105により記憶データの更新が行われた場合、管理情報400に基づいて当該記憶データが記憶された物理アドレスに関連付けられた属性と、当該更新が行われた時刻を関連付けてタイムスタンプ600として記憶部106に記録する。
【0018】
判定部104は、管理情報400と優先情報500及びタイムスタンプ600に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶データが重複しているか否かを判定する。判定部104は判定手段の一例である。判定部104の動作の一例を以下に説明する。
【0019】
判定部104は、受入データのハッシュ値と管理情報400に照らし合わせて受入データの属性を特定する。判定部104は特定した属性が優先情報500に存在するか否かを判定する。優先情報500に特定した属性が存在する場合、タイムスタンプ600に基づいて存在する属性の中において最新のタイムスタンプに係る属性を特定する。判定部104は、管理情報400に基づいて、最新のタイムスタンプに係る属性に関連付けられたハッシュ値を特定する。判定部104は受入データのハッシュ値と特定されたハッシュ値とを照らし合わせて、受入データと記憶データとが重複しているか否かを判定する。その後、判定部104は、優先情報500に存在する属性の中で、最新のタイムスタンプに係る属性ではない属性に係るハッシュ値を特定する。判定部104は特定されたハッシュ値と受入データのハッシュ値を照らし合わせて、受入データと記憶データとが重複しているか否かを判定する。
特定した属性が優先情報500に存在しないと判定された場合、判定部104は受入データのハッシュ値と管理情報400における全てのハッシュ値とを照らし合わせて、受入データと記憶データとが重複しているか否かを判定する。
【0020】
このように、判定部104は受入データの属性が優先情報500に存在する場合、当該属性に係るハッシュ値と、受入データのハッシュ値とを照らし合わせて受入データと記憶データの重複を判定することができる。すなわち、判定部104は管理情報400に存在する全てのハッシュ値に対して、受入データのハッシュ値を照らし合わせなくても受入データと記憶データとの重複を判定することができる。そのため、情報処理装置10は受入データと記憶データとの重複判定における情報処理を高速化することができる。
【0021】
更新部105は、判定部104により受入データが重複していないと判定された場合、当該受入データに基づいて記憶部106の更新を行う。更新部105は更新手段の一例である。また、更新部105は、判定部104により受入データが重複していると判定された場合、当該受入データと重複する記憶データの物理アドレスを示す参照アドレスを記憶部106に作成する。これにより、受入データと記憶データが重複している場合、記憶部106の更新が行われなくても、サーバは上記参照アドレスを用いて記憶データを参照することができる。すなわち、情報処理装置10のユーザは、記憶部106の更新の回数を減らすことができ、記憶部106の更新寿命をより長く保つことができる。
【0022】
記憶部106は、記憶データと、アドレス情報200と、属性情報300と、管理情報400と、優先情報500と、タイムスタンプ600を記憶する記憶装置である。記憶部106の例としては、SSDと、HDD(Hard Disk Drive)が挙げられる。
【0023】
《情報処理装置の動作》
以下、情報処理装置10の動作について説明する。
図7は、情報処理装置10の動作を示すフローチャートである。
【0024】
サーバは情報処理装置10に対して更新要求を送信する。情報処理装置10の入出力部101は、サーバからデータと仮想アドレスを受け入れる(ステップS1)。
計算部103は、受入データのブロック単位でハッシュ値を計算する(ステップS2)。
【0025】
判定部104は、ステップS2で計算されたハッシュ値を管理情報400に照らし合わせて属性を特定する(ステップS3)。この場合、判定部104は受入データに属する全てのブロックに係る属性を特定する必要はなく、1つのブロックに係る属性を特定しても良い。
【0026】
判定部104は、ステップS3で特定した属性を優先情報500に照らし合わせて、当該属性が優先情報500に存在するか否かを判定する(ステップS4)。
【0027】
属性が優先情報500に存在する場合(ステップS4:YES)、判定部104はタイムスタンプ600に基づいてタイムスタンプの順に、タイムスタンプ係る属性のハッシュ値と、受入データのハッシュ値とを照らし合わせて重複を判定する(ステップS5)。
【0028】
他方、属性が優先情報500に存在しない場合(ステップS4:NO)、判定部104は、管理情報400の全てのハッシュ値に受入データのハッシュ値を照らし合わせて、重複を判定する(ステップS6)。
【0029】
ステップS5又はステップS6により、受入データと記憶データの重複が判定された後、更新部105は受入データに基づいて更新を行う。又は、更新部105は参照アドレスを作成する(ステップS7)。
【0030】
このように、判定部104は受入データの属性が優先情報500に存在する場合、当該属性に係るハッシュ値と、受入データのハッシュ値とを照らし合わせて受入データと記憶データの重複を判定することができる。すなわち、判定部104は管理情報400に存在する全てのハッシュ値に対して、受入データのハッシュ値を照らし合わせなくても受入データと記憶データとの重複を判定することができる。そのため、情報処理装置10は受入データと記憶データとの重複判定における情報処理を高速化することができる。
【0031】
《作用・効果》
本発明に係る情報処理装置10は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報200に基づいて、当該物理アドレスの領域の更新を行う情報処理装置10において、受入データのブロック単位のハッシュ値を計算する計算手段と、物理アドレスの属性に基づいて、物理アドレスと当該物理アドレスの属性と当該物理アドレスの更新にかかる受入データのハッシュ値を関連付けた管理情報400を記録する第1記録手段と、優先して重複判定する属性を示す優先情報500に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶手段が記憶している記憶データが重複しているか否かを判定する判定手段と、受入データが重複していないと判定された場合、更新を行う更新手段を備える。
【0032】
情報処理装置10は優先情報500に基づいて記憶データと受入データとの重複を判定する。そのため、情報処理装置10は受入データと記憶データとの重複判定における情報処理を高速化することができる。
【0033】
また、情報処理装置10は、アドレス情報200に基づいて、連続する仮想アドレスの値に関連付けられた複数の物理アドレスを特定して、当該複数の物理アドレスの属性が同一であることを示す属性情報300を記録する第2記録手段を備え、第1記録手段は属性情報300に基づいて管理情報400を記録する。
【0034】
情報処理装置10は受入データの属性に係る入力が無くても、連続する仮想アドレスの値に関連付けられた複数の物理アドレスが同一の属性であることを特定する。そのため、情報処理装置10は当該属性に係る優先情報に基づいて、受入データと記憶データとの重複判定における情報処理を高速化することができる。
【0035】
また、情報処理装置10は、受入データと記憶データが重複していると判定された場合、管理情報400に基づいて、当該記憶データと関連付けられた属性を優先情報500として記憶手段に記録する第3記録手段を備える。
【0036】
情報処理装置10は受入データと記憶データが重複している回数などに基づいて優先情報500を記録する。そのため、情報処理装置10は当該属性に係る優先情報に基づいて、受入データと記憶データとの重複判定における情報処理を高速化することができる。
【0037】
また、情報処理装置10の記憶手段は、SSDである。
情報処理装置10は、効率良く受入データと記憶データの重複を排除することができ、更新寿命のあるSSDを長く使用することができる。
【0038】
本発明に係る情報処理方法は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報200に基づいて、当該物理アドレスの領域の更新を行う情報処理装置10において、受入データのブロック単位のハッシュ値を計算するステップと、物理アドレスの属性に基づいて、物理アドレスと当該物理アドレスの属性と当該物理アドレスの更新にかかる受入データのハッシュ値を関連付けた管理情報400を記録するステップと、優先して重複判定する属性を示す優先情報500に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶手段が記憶している記憶データが重複しているか否かを判定するステップと、受入データが重複していないと判定された場合、更新を行うステップを有する。
【0039】
情報処理方法のユーザは情報処理方法を用いることにより、優先情報500に基づいて記憶データと受入データとの重複を判定できる。そのため、情報処理方法のユーザは受入データと記憶データとの重複判定における情報処理を高速化することができる。
【0040】
本発明に係るプログラムは、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報200に基づいて、当該物理アドレスの領域の更新を行う情報処理装置10のコンピュータを、受入データのブロック単位のハッシュ値を計算するステップと、物理アドレスの属性に基づいて、物理アドレスと当該物理アドレスの属性と当該物理アドレスの更新にかかる受入データのハッシュ値を関連付けた管理情報400を記録するステップと、優先して重複判定する属性を示す優先情報500に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶手段が記憶している記憶データが重複しているか否かを判定するステップと、受入データが重複していないと判定された場合、更新を行うステップとして実行させる。
【0041】
プログラムのユーザはプログラムを実行させることにより、優先情報500に基づいて記憶データと受入データとの重複を判定できる。そのため、プログラムのユーザは受入データと記憶データとの重複判定における情報処理を高速化することができる。
【0042】
〈基本構成〉
以下、基本構成に係る情報処理装置10について説明する。
基本構成に係る情報処理装置10の構成は、第1の実施形態に係る情報処理装置10の構成と同様である。すなわち、基本構成に係る情報処理装置10は、入出力部101と、記録部102と、計算部103と、判定部104と、更新部105と、記憶部106を備える。
【0043】
基本構成に係る情報処理装置10は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報200に基づいて、当該物理アドレスの領域の更新を行う情報処理装置10において、受入データのブロック単位のハッシュ値を計算する計算手段と、物理アドレスの属性に基づいて、物理アドレスと当該物理アドレスの属性と当該物理アドレスの更新にかかる受入データのハッシュ値を関連付けた管理情報400を記録する第1記録手段と、優先して重複判定する属性を示す優先情報500に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶手段が記憶している記憶データが重複しているか否かを判定する判定手段と、受入データが重複していないと判定された場合、更新を行う更新手段を備える。
【0044】
情報処理装置10は優先情報500に基づいて記憶データと受入データとの重複を判定する。そのため、情報処理装置10は受入データと記憶データとの重複判定における情報処理を高速化することができる。
【0045】
〈コンピュータ構成〉
図8は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
コンピュータ1100は、プロセッサ1110、メインメモリ1120、ストレージ1130、インタフェース1140を備える。
上述の情報処理装置10は、コンピュータ1100に実装される。そして、上述した各処理部の動作は、プログラムの形式でストレージ1130に記憶されている。プロセッサ1110は、プログラムをストレージ1130から読み出してメインメモリ1120に展開し、当該プログラムに従って上記処理を実行する。また、プロセッサ1110は、プログラムに従って、上述した各記憶部に対応する記憶領域をメインメモリ1120に確保する。
【0046】
プログラムは、コンピュータ1100に発揮させる機能の一部を実現するためのものであってもよい。例えば、プログラムは、ストレージ1130に既に記憶されている他のプログラムとの組み合わせ、または他の装置に実装された他のプログラムとの組み合わせによって機能を発揮させるものであってもよい。なお、他の実施形態においては、コンピュータ1100は、上記構成に加えて、または上記構成に代えてPLD(Programmable Logic Device)などのカスタムLSI(Large Scale Integrated Circuit)を備えてもよい。PLDの例としては、PAL(Programmable Array Logic)、GAL(Generic Array Logic)、CPLD(Complex Programmable Logic Device)、FPGA(Field Programmable Gate Array)が挙げられる。この場合、プロセッサ1110によって実現される機能の一部または全部が当該集積回路によって実現されてよい。
【0047】
ストレージ1130の例としては、磁気ディスク、光磁気ディスク、半導体メモリ等が挙げられる。ストレージ1130は、コンピュータ1100のバスに直接接続された内部メディアであってもよいし、インタフェース1140または通信回線を介してコンピュータに接続される外部メディアであってもよい。また、このプログラムが通信回線によってコンピュータ1100に配信される場合、配信を受けたコンピュータ1100が当該プログラムをメインメモリ1120に展開し、上記処理を実行してもよい。少なくとも1つの実施形態において、ストレージ1130は、一時的でない有形の記憶媒体である。
【0048】
また、当該プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、当該プログラムは、前述した機能をストレージ1130に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【符号の説明】
【0049】
10 情報処理装置
101 入出力部
102 記録部
103 計算部
104 判定部
105 更新部
106 記憶部
200 アドレス情報
300 属性情報
400 管理情報
500 優先情報
600 タイムスタンプ
1100 コンピュータ
1110 プロセッサ
1120 メインメモリ
1130 ストレージ
1140 インタフェース