(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-27
(45)【発行日】2024-06-04
(54)【発明の名称】I/O性能を最適化するためのメモリ・コピーおよびメモリ・マッピング間の動的な切り替え
(51)【国際特許分類】
G06F 3/06 20060101AFI20240528BHJP
G06F 12/0866 20160101ALI20240528BHJP
【FI】
G06F3/06 301Y
G06F12/0866 100
(21)【出願番号】P 2022515916
(86)(22)【出願日】2020-09-03
(86)【国際出願番号】 IB2020058197
(87)【国際公開番号】W WO2021048709
(87)【国際公開日】2021-03-18
【審査請求日】2023-02-24
(32)【優先日】2019-09-11
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【氏名又は名称】太佐 種一
(72)【発明者】
【氏名】グプタ,ロケッシュ,モーハン
(72)【発明者】
【氏名】アッシュ,ケヴィン
(72)【発明者】
【氏名】リナルディ,ブライアン,アンソニー
(72)【発明者】
【氏名】アンダーソン,カイラー
(72)【発明者】
【氏名】カロス,マシュー
【審査官】松平 英
(56)【参考文献】
【文献】特開平07-013789(JP,A)
【文献】特表2013-539098(JP,A)
【文献】特開2007-079715(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/06-3/08
12/00-12/128
13/00-13/42
(57)【特許請求の範囲】
【請求項1】
I/O性能を向上させるためにメモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術間を動的に切り替える方法であって
、コンピュータが、
I/O要求を受信するステップと、
メモリ・コピー・データ転送技術を使用して前記I/O要求を実行するコストを計算するステップであって、前記メモリ・コピー・データ転送技術は、前記I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、永続的にマッピングされたメモリにコピーし、前記永続的にマッピングされたメモリは、バス・アドレス・ウィンドウに永続的にマッピングされる、計算するステップと、
メモリ・マッピング・データ転送技術を用いて前記I/O要求を実行するコストを計算するステップであって、前記メモリ・マッピング・データ転送技術は、前記I/O要求に関連付けられたキャッシュ・セグメントを、前記キャッシュ・メモリから、前記バス・アドレス・ウィンドウに一時的にマッピングする、計算するステップと、
前記メモリ・コピー・データ転送技術を用いることの方が、前記メモリ・マッピング・データ転送技術を用いることよりもコストが低い場合に、前記メモリ・コピー・データ転送技術を使用して、前記I/O要求に関連付けられたキャッシュ・セグメントを転送するステップと、
前記メモリ・マッピング・データ転送技術を用いることの方が、前記メモリ・コピー・データ転送技術を用いることよりもコストが低い場合に、前記メモリ・マッピング・データ転送技術を用いて前記I/O要求に関連付けられたキャッシュ・セグメントを転送するステップと
を実行する、方法。
【請求項2】
前記バス・アドレス・ウィンドウは、ペリフェラル・コンポーネント・インターコネクト(PCI)バス・アドレス・ウィンドウである、請求項1に記載の方法。
【請求項3】
前記メモリ・コピー・データ転送技術を使用してI/O要求を実行するコストを計算するステップは、前記永続的にマッピングされたメモリにコピーするキャッシュ・セグメントの数を計算するステップを含む、請求項1または2に記載の方法。
【請求項4】
前記メモリ・コピー・データ転送技術を使用してI/O要求を実行するコストを計算するステップは、前記キャッシュ・メモリおよび前記永続的にマッピングされたメモリ間のコピー・レイテンシを決定するステップを含む、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記キャッシュ・メモリおよび前記永続的にマッピングされたメモリ間の前記コピー・レイテンシを決定するステップは、前記キャッシュ・メモリおよび前記永続的にマッピングされたメモリの位置を決定するステップを含む、請求項4に記載の方法。
【請求項6】
前記メモリ・マッピング・データ転送技術を用いてI/O要求を実行するコストを計算するステップは、前記キャッシュ・メモリから前記バス・アドレス・ウィンドウへ前記I/O要求に関連付けられたキャッシュ・セグメントのマップおよびアンマップの少なくとも1つを行うのに必要な時間量を見積もるステップを含む、請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記キャッシュ・セグメントが前記キャッシュ・メモリにおいてすべて連続しているわけではない、請求項1~6のいずれか1項に記載の方法。
【請求項8】
I/O性能を向上させるためにメモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術間を動的に切り替えるためのコンピュータ・プログラムであって、
前記コンピュータに請求項1~7のいずれか一項に記載の方法を実行させる、コンピュータ・プログラム。
【請求項9】
請求項1~7のいずれか一項に記載の方法を
前記コンピュータに実行させるコンピュータ・プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項10】
I/O性能を向上させるためにメモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術間を動的に切り替えるシステムであって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに接続され、前記少なくとも1つのプロセッサ上での実行のための命令を格納するメモリと
を含み、前記命令は、前記少なくとも1つのプロセッサに、
I/O要求を受信することと、
メモリ・コピー・データ転送技術を使用して前記I/O要求を実行するコストを計算することであって、前記メモリ・コピー・データ転送技術は、前記I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、永続的にマッピングされたメモリにコピーし、前記永続的にマッピングされたメモリは、バス・アドレス・ウィンドウに永続的にマッピングされる、前記コストを計算することと、
メモリ・マッピング・データ転送技術を用いてI/O要求を実行するコストを計算することであって、前記メモリ・マッピング・データ転送技術は、前記I/O要求に関連付けられたキャッシュ・セグメントを、前記キャッシュ・メモリから、前記バス・アドレス・ウィンドウに一時的にマッピングする、前記コストを計算することと、
前記メモリ・コピー・データ転送技術を用いることの方が、前記メモリ・マッピング・データ転送技術を用いることよりもコストが低い場合に、前記メモリ・コピー・データ転送技術を使用して、前記I/O要求に関連付けられたキャッシュ・セグメントを転送することと、
前記メモリ・マッピング・データ転送技術を用いることの方が、前記メモリ・コピー・データ転送技術を用いることよりもコストが低い場合に、前記メモリ・マッピング・データ転送技術を用いて前記I/O要求に関連付けられたキャッシュ・セグメントを転送することと
を実行させる、システム。
【請求項11】
前記バス・アドレス・ウィンドウは、ペリフェラル・コンポーネント・インターコネクト(PCI)バス・アドレス・ウィンドウである、請求項10に記載のシステム。
【請求項12】
前記メモリ・コピー・データ転送技術を使用してI/O要求を実行するコストを計算することは、前記永続的にマッピングされたメモリにコピーするキャッシュ・セグメントの数を計算することを含む、請求項10または11に記載のシステム。
【請求項13】
前記メモリ・コピー・データ転送技術を使用してI/O要求を実行するコストを計算することは、前記キャッシュ・メモリおよび前記永続的にマッピングされたメモリ間のコピー・レイテンシを決定することを含む、請求項10~12のいずれか1項に記載のシステム。
【請求項14】
前記キャッシュ・メモリおよび前記永続的にマッピングされたメモリ間の前記コピー・レイテンシを決定することは、前記キャッシュ・メモリおよび前記永続的にマッピングされたメモリの位置を決定することを含む、請求項13に記載のシステム。
【請求項15】
前記メモリ・マッピング・データ転送技術を用いてI/O要求を実行するコストを計算することは、前記キャッシュ・メモリから前記バス・アドレス・ウィンドウへ前記I/O要求に関連付けられたキャッシュ・セグメントのマップおよびアンマップの少なくとも1つを行うのに必要な時間量を見積もることを含む、請求項10~14のいずれか1項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ストレージ・システムにおけるI/O性能を最適化するためのメモリ・コピー技術およびメモリ・マッピング技術間を動的に切り替えるためのシステムおよび方法に関する。
【背景技術】
【0002】
ペリフェラル・コンポーネント・インターコネクト(PCI)ホスト・ブリッジは、データ処理システム内においてプロセッサと入出力(I/O)サブシステムとの間の通信を可能とすることができる。PCIホスト・ブリッジは、プロセッサおよびI/Oサブシステム間で読み書きデータを転送できるようにデータ・バッファリング能力を提供する。I/Oサブシステムは、PCIバスに接続されたPCIデバイスのグループであってもよい。PCIバス上のPCIデバイスが、ダイレクト・メモリ・アクセス(DMA)を介して、システムメモリに読み取りまたは書き込みコマンドを発すると、PCIホスト・ブリッジは、DMAのPCIアドレスを、システムメモリのシステムメモリ・アドレスに翻訳する。
【0003】
PCIバス上の各PCIデバイスは、システムメモリ内に常駐する対応の翻訳制御エントリ(TCE)テーブルと関連付けられ得る。TCEテーブルは、PCIアドレスからシステムメモリ・アドレスへのTCE翻訳を実行するために利用され得る。DMAの読み取りまたは書き込み動作に応答して、対応のTCEテーブルが、TCE変換を提供するためにPCIホスト・ブリッジによって読み取られる。
【0004】
IBM(登録商標)DS8000(登録商標)エンタープライズ・ストレージ・システムのようなストレージ・システムにおいては、ストレージ・システムによって処理される各I/Oは、ストレージ・システムのキャッシュ・メモリを1回以上マッピングすることを必要とする。例えば、キャッシュ・メモリへの読み取りヒットは、ホストアダプタがDMAを介してキャッシュ・メモリを読み取ることができるようにTCEマッピングを作成することを必要とする。このTCEマッピングは、DMAが完了した後にアンマップされる。読み取りミスの場合には、2つのTCEマッピング、ストレージ・ドライブから読み取りデータを検索するためにキャッシュ・メモリおよびデバイスアダプタの間の1つのマッピング、および、読み取りデータをホストシステムに戻すためのキャッシュ・メモリおよびホストアダプタの間の第2のマッピング、が必要である。DMAが完了した後、TCEマッピングは、アンマップされ得る。IBMおよびDS/8000は、世界中の多くの管轄に登録されている、インターナショナル・ビジネス・マシーンズ・コーポレーションの商標である。
【0005】
以上の観点から、IBM(登録商標)DS8000(登録商標)エンタープライズ・ストレージ・システムのようなストレージ・システム内でデータを転送するための代替のデータ転送技術が必要とされる。さらに、IBM(登録商標)DS8000(登録商標)エンタープライズ・ストレージ・システムのようなストレージ・システムにおいてI/O性能を最適化するために、いくつかのデータ転送技術を動的に切り替えるためのシステムおよび方法が必要とされる。
【0006】
よって、上記課題を解決することが当該技術分野において求められている。
【発明の概要】
【0007】
第1の側面から見ると、本発明は、I/O性能を向上させるためにメモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術間を動的に切り替えるための方法を提供し、本方法は、I/O要求を受信するステップと、メモリ・コピー・データ転送技術を使用してI/O要求を実行するコストを計算するステップであって、メモリ・コピー・データ転送技術は、I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、永続的にマッピングされたメモリにコピーし、ここで、永続的にマッピングされたメモリは、バス・アドレス・ウィンドウに永続的にマッピングされる、計算するステップと、メモリ・マッピング・データ転送技術を用いてI/O要求を実行するコストを計算するステップであって、メモリ・マッピング・データ転送技術は、I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、バス・アドレス・ウィンドウに一時的にマッピングする、計算するステップと、メモリ・コピー・データ転送技術を用いることの方が、メモリ・マッピング・データ転送技術を用いることよりもコストが低い場合に、メモリ・コピー・データ転送技術を使用して、I/O要求に関連付けられたキャッシュ・セグメントを転送するステップと、メモリ・マッピング・データ転送技術を用いることの方が、メモリ・コピー・データ転送技術を用いることよりもコストが低い場合に、メモリ・マッピング・データ転送技術を用いてI/O要求に関連付けられたキャッシュ・セグメントを転送するステップとを含む。
【0008】
さらなる側面から見ると、本発明は、I/O性能を向上させるためにメモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術間を動的に切り替えるためのシステムが提供され、本システムは、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに接続され、少なくとも1つのプロセッサ上での実行のための命令を格納するメモリとを含み、命令は、少なくとも1つのプロセッサに、I/O要求を受信することと、メモリ・コピー・データ転送技術を使用してI/O要求を実行するコストを計算することであって、メモリ・コピー・データ転送技術は、I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、永続的にマッピングされたメモリにコピーし、永続的にマッピングされたメモリは、バス・アドレス・ウィンドウに永続的にマッピングされる、コストを計算することと、メモリ・マッピング・データ転送技術を用いてI/O要求を実行するコストを計算することであって、メモリ・マッピング・データ転送技術は、I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、バス・アドレス・ウィンドウに一時的にマッピングする、コストを計算すること、メモリ・コピー・データ転送技術を用いることの方が、メモリ・マッピング・データ転送技術を用いることよりもコストが低い場合に、メモリ・コピー・データ転送技術を使用して、I/O要求に関連付けられたキャッシュ・セグメントを転送することと、メモリ・マッピング・データ転送技術を用いることの方が、メモリ・コピー・データ転送技術を用いることよりもコストが低い場合に、メモリ・マッピング・データ転送技術を用いてI/O要求に関連付けられたキャッシュ・セグメントを転送することとを実行させる。
【0009】
さらなる側面から見ると、本発明は、I/O性能を向上させるためにメモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術間を動的に切り替えるためのコンピュータ・プログラム製品を提供し、コンピュータ・プログラム製品は、処理回路によって読み取り可能であり、本発明の方法のステップを実行するための処理回路による実行のための命令を格納するコンピュータ可読記憶媒体を含む。
【0010】
さらなる側面から見ると、本発明は、コンピュータ可読媒体に格納され、デジタル・コンピュータの内部メモリに読み込み可能なコンピュータ・プログラムを提供し、コンピュータ・プログラムは、プログラムがコンピュータ上で実行されたとき、本発明の方法のステップを実行するためのソフトウェア・コード部分を含む。
【0011】
さらなる側面から見ると、本発明は、I/O性能を向上させるためにメモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術間を動的に切り替えるためのコンピュータ・プログラム製品を提供し、コンピュータ・プログラム製品は、具体化されたコンピュータ・プログラム・コードを有するコンピュータ可読記憶媒体を含み、コンピュータ・プログラム・コードは、少なくとも1つのプロセッサによって実行されたとき、I/O要求を受信することと、メモリ・コピー・データ転送技術を使用してI/O要求を実行するコストを計算することであって、メモリ・コピー・データ転送技術は、I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、永続的にマッピングされたメモリにコピーし、永続的にマッピングされたメモリは、バス・アドレス・ウィンドウに永続的にマッピングされる、計算することと、メモリ・マッピング・データ転送技術を用いてI/O要求を実行するコストを計算するステップであって、メモリ・マッピング・データ転送技術は、I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、バス・アドレス・ウィンドウに一時的にマッピングする、計算することと、メモリ・コピー・データ転送技術を用いることの方が、メモリ・マッピング・データ転送技術を用いることよりもコストが低い場合に、メモリ・コピー・データ転送技術を使用して、I/O要求に関連付けられたキャッシュ・セグメントを転送することと、メモリ・マッピング・データ転送技術を用いることの方が、メモリ・コピー・データ転送技術を用いることよりもコストが低い場合に、メモリ・マッピング・データ転送技術を用いてI/O要求に関連付けられたキャッシュ・セグメントを転送することとを実行するように構成される。
【0012】
本発明は、現在の最先端に応答して、特に、現在利用可能なシステムおよび方法ではまだ完全に解決されていない技術分野における問題および必要性に応答して開発されたものである。したがって、本発明の実施形態は、メモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術間を動的に切り替えてI/O性能を向上させるために開発されたものである。本発明の特徴および利点は、以下の説明および特許請求の範囲からより十分に明らかになるか、または、以下に述べる本発明の実践によって学習され得る。
【0013】
上記と一貫して、I/O性能を向上させるためにメモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術間を動的に切り替えるための方法が開示される。本方法は、I/O要求を受信し、メモリ・コピー・データ転送技術を使用してI/O要求を実行するコストを計算する。メモリ・コピー・データ転送技術は、I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、永続的にマッピングされたメモリにコピーし、この永続的にマッピングされたメモリは、バス・アドレス・ウィンドウに永続的にマッピングされる。本方法は、メモリ・マッピング・データ転送技術を用いてI/O要求を実行するコストを計算する。メモリ・マッピング・データ転送技術は、I/O要求に関連付けられたキャッシュ・セグメントを、キャッシュ・メモリから、バス・アドレス・ウィンドウに一時的にマッピングする。本方法は、いずれの一方のコストが低いかに応じて、メモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送技術のうちの1つを使用してI/O要求に関連付けられたキャッシュ・セグメントを転送する。
【0014】
対応するシステムおよびコンピュータ・プログラム製品がまた開示され、かつ、特許請求される。
【0015】
本発明の利点を容易に理解するために、添付の図面に示された特定の実施形態を参照することによって、上記で簡単に説明した本発明のより具体的な説明を行う。これらの図面は、本発明の典型的な実施形態のみを示し、したがって、本発明の範囲を限定するものと見なされるべきではないことを理解し、本発明は、以下の添付の図面を用いて、追加の具体性および詳細とともに記載および説明される。
【図面の簡単な説明】
【0016】
【
図1】
図1は、本発明によるシステムおよび方法を実装することができるネットワーク環境の一例を示す高レベルブロック図である。
【
図2】
図2は、
図1のネットワーク環境において使用するためのストレージ・システムの一実施形態を示す高レベルブロック図である。
【
図3】
図3は、メモリ・マッピング・データ転送技術の一例を示す高レベルブロック図である。
【
図4】
図4は、メモリ・コピー・データ転送技術の一例を示す高レベルブロック図である。
【
図5】
図5は、特定のI/O要求についていずれのデータ転送技術を用いるかを決定する方法の一実施形態を示すフロー図である。
【
図6】
図6は、メモリ・マッピング・データ転送技術で使用するために割り当てられる“マッピング”ウィンドウおよびメモリ・コピー・データ転送技術で使用するために割り当てられる“コピー”ウィンドウを示す高レベルブロック図である。
【
図7】
図7は、I/O要求を処理するときの効率化を促進するために“マッピング”ウィンドウの数および“コピー”ウィンドウの数を動的に調整することを示す高レベルブロック図である。
【
図8】
図8は、メモリ・マッピング・データ転送技術に関連して使用される“マッピング”ウィンドウの数およびメモリ・コピー・データ転送技術に関連して使用される“コピー”ウィンドウの数を動的に最適化する方法の一実施形態を示すフロー図である。
【
図9】
図9は、メモリ・マッピング・データ転送技術に関連して使用される“マッピング”ウィンドウの数およびメモリ・コピー・データ転送技術に関連して使用される“コピー”ウィンドウの数を動的に最適化する方法の別の実施形態を示すフロー図である。
【
図10】
図10は、メモリ・マッピング・データ転送技術またはメモリ・コピー・データ転送技術のいずれを利用してI/O要求を処理するかを決定するための方法の一実施形態を示すフロー図である。
【発明を実施するための形態】
【0017】
本発明の構成要素は、本明細書の図面に一般的に記載され、図示されているように、多岐にわたる異なる構成にて配置され設計されてもよいことが容易に理解されよう。よって、図面に示されるような、本発明の実施形態の以下のより詳細な説明は、特許請求されるように本発明の範囲を限定することを意図するものではなく、本発明に従った目下企図される実施形態のいくつかの例を単に表すものに過ぎない。目下説明する実施形態は、同様の部分が同様の符番で示されている図面を参照することによって、最もよく理解されるであろう。
【0018】
本発明は、システム、方法もしくはコンピュータ・プログラム製品またはこれらの組み合わせとして実装されてもよい。コンピュータ・プログラム製品は、プロセッサに本発明の側面を実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読ストレージ媒体(単数または複数を含む。)を含んでもよい。
【0019】
コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用するための命令を保持し格納する有形のデバイスであってよい。コンピュータ可読ストレージ媒体は、例えば、これに限定されるものではないが、電子的ストレージ・システム、磁気ストレージ・システム、光学ストレージ・システム、電磁気ストレージ・システム、半導体ストレージ・システムまたは上記の任意の適切な組み合わせであってよい。コンピュータ可読ストレージ媒体のより具体的な非網羅的なリストとしては、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、リード・オンリー・メモリ(ROM)、消去可能プログラマブル・リード・オンリー・メモリ(EPROMまたはフラッシュメモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク・リード・オンリー・メモリ(CD-ROM)、デジタル・バーサタイル・ディスク(DVD)、メモリースティック、フロッピー(登録商標)ディスク、パンチカードまたは記録された命令を有する溝内の隆起構造のような機械的エンコードされたデバイス、および上記の任意の適切な組み合わせが含まれる。コンピュータ可読ストレージ媒体は、本明細書で使用されるように、電波、自由伝搬する電磁波、導波路または他の伝送媒体を伝搬する電磁波(たとえば、ファイバ光ケーブルを通過する光パルス)または、ワイヤを通して伝送される電気信号のような、それ自体が一時的な信号として解釈されるものではない。
【0020】
本明細書で説明されるコンピュータ可読プログラム命令は、例えばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワークもしくは無線ネットワークまたはこれらの組み合わせといったネットワークを介して、コンピュータ可読ストレージ媒体からそれぞれのコンピュータ/処理デバイスに、または、外部コンピュータまたは外部ストレージ・システムにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータもしくはエッジサーバまたはこれらの組み合わせを含んでもよい。各コンピュータ/処理デバイスにおけるネットワーク・アダプタ・カードまたはネットワーク・インタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、コンピュータ可読プログラム命令を、それぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体に格納するために転送する。
【0021】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、または、1以上のプログラミング言語の任意の組み合わせで書かれたソース・コードあるいはオブジェクト・コードであってよく、1以上のプログラミング言語は、Smalltalk(登録商標)、C++またはこれらに類するもなどのオブジェクト指向言語、Cプログラミング言語または類似のプログラミング言語などの従来型の手続型言語を含む。
【0022】
コンピュータ可読プログラム命令は、スタンド・アローンのソフトウェア・パッケージとして、全体としてユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上かつ部分的に遠隔のコンピュータ上で、または、完全に遠隔のコンピュータまたはサーバ上で実行されてもよい。後者のシナリオでは、遠隔のコンピュータは、ユーザのコンピュータに、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含む任意のタイプのネットワークを通じて接続されてもよく、あるいは接続は、(例えば、インターネット・サービス・プロバイダを用いてインターネットを通じて)外部コンピュータになされてもよい。いくつかの実施形態においては、電気的回路は、本発明の側面を実行するために、コンピュータ可読プログラム命令の状態情報を利用して、電気的回路を個別化することによって、コンピュータ可読プログラム命令を実行してもよく、この電気的回路は、例えば、プログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む。
【0023】
本発明の側面は、本明細書において、本発明の実施形態に従った方法、装置(システム)およびコンピュータ・プログラム製品のフローチャート図もしくはブロック図またはその両方を参照しながら、説明される可能性がある。フローチャート図もしくはブロック図またはその両方の各ブロック、および、フローチャート図もしくはブロック図またはその両方における複数のブロックの組み合わせは、コンピュータ可読プログラム命令によって実装されてもよいことが理解されよう。
【0024】
これらのコンピュータ可読プログラム命令は、汎用コンピュータ、特定用途コンピュータのプロセッサまたは他のプログラマブル・データ処理装置に提供され、コンピュータのプロセッサまたは他のプログラマブル・データ処理装置を介して実行される命令が、フローチャート図もしくはブロックまたはその両方のブロックまたは複数のブロックにおいて特定される機能/作用を実装するための手段を作成するように、マシンを生成する。これらのコンピュータ可読プログラム命令は、また、コンピュータ、プログラマブル・データ処理装置もしくは他のデバイスまたはこれらの組み合わせに特定のやり方で機能するよう指示できるコンピュータ可読ストレージ媒体に格納され、それに格納された命令を有するコンピュータ可読ストレージ媒体に、フローチャートもしくはブロックまたはその両方のブロックまたは複数のブロックで特定される機能/作用の側面を実装する命令を含む製品が含まれるようにする。
【0025】
コンピュータ可読プログラム命令は、また、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイスに読み込まれ、コンピュータ、他のプログラマブル・データ処理装置または他のデバイス上で一連の動作ステップを実行させて、コンピュータ、他のプログラマブル・データ処理装置または他のデバイス上で実行される命令が、フローチャートもしくはブロックまたはその両方のブロックまたは複数のブロックで特定される機能/作用の側面を実装するように、コンピュータ実装処理を生成することもできる。
【0026】
図1を参照すると、ネットワーク環境100の一例が示される。ネットワーク環境100は、本発明によるシステムおよび方法を実装することができる環境の一例を示すために提示される。ネットワーク環境100は、限定ではなく例として提示される。実際、本明細書で開示されるシステムおよび方法は、示されるネットワーク環境100に加えて、多岐にわたる異なるネットワーク環境に対して適用可能である可能性がある。
【0027】
図示されるように、ネットワーク環境100は、ネットワーク104によって相互接続された1以上のコンピュータ102,106を含む。ネットワーク104は、例えば、ローカル・エリア・ネットワーク(LAN)104、ワイド・エリア・ネットワーク(WAN)104、インターネット104、イントラネット104などを含んでもよい。ある実施形態においては、コンピュータ102,106は、クライアント・コンピュータ102およびサーバ・コンピュータ106(本明細書では“ホスト”106または"ホストシステム106とも参照される。)の両方を含んでもよい。概して、クライアント・コンピュータ102は、通信セッションを開始し、一方、サーバ・コンピュータ106は、クライアント・コンピュータ102からの要求を待機し、これに応答する。ある実施形態においては、コンピュータ102もしくはサーバ106またはこれらの両方は、1以上の内部または外部の直付け型のストレージ・システム112(例えば、ハード・ストレージ・ドライブ、ソリッド・ステート・ドライブ、テープ・ドライブなどのアレイ)に接続されてもよい。これらのコンピュータ102,106および直付け型ストレージ・システム112は、ATA、SATA、SCSI、SAS、Fibre Channelなどのプロトコルを用いて通信してもよい。
【0028】
ネットワーク環境100は、ある実施形態においては、ストレージエリア・ネットワーク(SAN)108または(例えば、ネットワーク取り付け型ストレージを使用する場合は)LAN108のような、サーバ106の背後にストレージ・ネットワーク108を含んでもよい。ネットワーク108は、ハード・ディスク・ドライブまたはソリッド・ステート・ドライブのアレイ110a、テープ・ライブラリ110b、個別のハード・ディスク・ドライブ110cまたはソリッド・ステート・ドライブ110c、テープ・ドライブ110d、CD-ROMライブラリなどの1以上のストレージ・システム110にサーバ106を接続してもよい。ストレージ・システム110にアクセスするために、ホストシステム106は、ホスト106上の1以上のポートからストレージ・システム110上の1以上のポートへ物理的接続を介して通信することができる。接続は、スイッチ、ファブリック、直接接続などを介してもよい。ある実施形態においては、サーバ106およびストレージ・システム110は、FibreChannel(FC)またはiSCSIなどのネットワーキング標準を使用して通信することができる。
【0029】
図2を参照すると、ハード・ディスク・ドライブ24もしくはソリッド・ステート・ドライブ204またはこれらの両方のアレイを含むストレージ・システム110aの一例が示される。本発明によるシステムおよび方法がストレージ・システム110a内で実装され得るため、このようなストレージ・システム110aの内部コンポーネントが示されている。図示するように、ストレージ・システム110aは、ストレージ・コントローラ200と、1以上のスイッチ202と、ハード・ディスク・ドライブ204もしくはソリッド・ステート・ドライブ(例えば、フラッシュ・メモリベースのドライブ204)またはこれらの組み合わせのような1以上のストレージ・ドライブ204とを含む。ストレージ・コントローラ200は、1以上のホストシステム106(例えば、z/OS(登録商標)、z/VM(登録商標)など)などのオペレーティング・システムを動作させるオープンシステムもしくはメインフレームサーバまたはこれらの両方106)が1以上のストレージ・ドライブ204におけるデータにアクセスすることを可能とする。z/OSおよびz/VMは、世界中の多くの管轄に登録されている、インターナショナル・ビジネス・マシーンズ・コーポレーションの商標である。
【0030】
選択された実施形態においては、ストレージ・コントローラ200は、1以上のサーバ206a,206bを含む。ストレージ・コントローラ200は、ストレージ・コントローラ200をそれぞれホストシステム106およびストレージ・ドライブ204に接続するためのホストアダプタ208およびデバイスアダプタ210を含んでもよい。複数のサーバ206a,206bは、接続されたホストシステム206にデータが常に利用可能であることを保証するための冗長性を提供してもよい。これにより、一方のサーバ206aが故障した場合に、他方のサーバ206bが、故障したサーバ206aに対するI/O負荷をピックアップし、ホストシステム106とストレージ・ドライブ204との間でI/Oが継続できるようにする。この処理は、”フェイルオーバ”と参照され得る。
【0031】
選択された実施形態においては、各サーバ206は、1以上のプロセッサ212およびメモリ214を含む。メモリ214は、揮発性メモリ(例えば、RAM)および不揮発性メモリ(例えば、ROM、EPROM、EEPROM、ハード・ディスク、フラッシュメモリなど)を含んでもよい。揮発性および不揮発性メモリは、ある実施形態においては、プロセッサ上で実行され、ストレージ・ドライブ204内のデータにアクセスするために使用されるソフトウェア・モジュールを格納してもよい。これらのソフトウェア・モジュールは、ストレージ・ドライブ204内の論理ボリュームに対する全ての読み書き要求を管理してもよい。
【0032】
ある実施形態においては、メモリ214は、DRAMキャッシュ216などのキャッシュ216を含む。ホスト106(例えば、オープンシステムまたはメインフレームサーバ)が、キャッシュ216に常駐していないデータの読み出し動作を実行するときはいつも、読み出しを実行するサーバ206は、ストレージ・ドライブ204からデータをフェッチし、再び必要になった場合に備えて、それをキャッシュ216に保存することができる。ホストシステム206によってデータが再度要求されると、サーバ206は、ストレージ・ドライブ204からデータをフェッチする代わりに、キャッシュ216からデータをフェッチし、これによって時間およびリソースの両方を節約する。同様に、ホストシステム106が書き込みを行う場合、書き込み要求を受信したサーバ206は、変更されたデータをキャッシュ216に格納し、後の時点で、変更されたデータをストレージ・ドライブ204にデステージするようにしてもよい。
【0033】
図2に示すものと同様のアーキテクチャを有するストレージ・システム110aの一例は、IBM(登録商標)DS8000(登録商標)エンタープライズ・ストレージ・システムである。DS8000(登録商標)は、連続動作をサポートするように設計されたディスクおよびソリッド・ステート・ストレージを提供する高性能で大容量のストレージ・コントローラである。それにもかかわらず、本明細書に開示される技術は、IBM(登録商標)DS8000(登録商標)エンタープライズ・ストレージ・システム110aに限定されるものではなく、システム110に関連する、製造業者、製品名またはコンポーネントまたはコンポーネント名には関係なく、任意の同等または類似のストレージ・システム110において実装されてもよい。本発明の1以上の実施形態から利益を得ることができる任意のストレージ・システムが、本発明の範囲内にあると考えられる。したがって、IBM(登録商標)DS8000(登録商標)は、限定ではなくただ例としてのみ提示される。
【0034】
図3を参照すると、概して、ペリフェラル・コンポーネント・インターコネクト(PCI)ホスト・ブリッジは、データ処理システム内でプロセッサと入出力(I/O)サブシステムとの間の通信を可能とし得る。PCIホスト・ブリッジは、読み書きデータをプロセッサおよびI/Oサブシステム間で転送することを可能にするデータ・バッファリング能力を提供する。I/Oサブシステムは、PCIバスに接続されたPCIデバイス(ホストアダプタもしくはデバイスアダプタまたはこれらの両方)のグループであってもよい。PCIバス上のPCIデバイスが、ダイレクト・メモリ・アクセス(DMA)を介してシステムメモリに読み取りまたは書き込みコマンドを発すると、PCIホスト・ブリッジは、DMAのPCIアドレスを、システムメモリのシステムメモリ・アドレスに翻訳することができる。
【0035】
PCIバス上の各PCIデバイスは、システムメモリ214内に常駐する、対応の翻訳制御エントリ(TCE)マッピング302と関連付けられ得る。TCEマッピング302は、PCIアドレスからシステムメモリ・アドレスへのTCE翻訳を実行するために利用され得る。DMAの読み取りまたは書き込み動作に応答して、対応のTCEマッピングが、TCE変換を提供するためにPCIホスト・ブリッジによって読み取られる。
【0036】
IBM(登録商標)DS8000(登録商標)エンタープライズ・ストレージ・システムのようなストレージ・システムにおいては、ストレージ・システムによって処理される各I/Oは、ストレージ・システム110のキャッシュ・メモリ216を1回以上マッピングすることを必要とする。例えば、キャッシュ・メモリ216への読み取りヒットは、ホストアダプタ208がDMAを介してキャッシュ・メモリ216を読み取ることができるようにTCEマッピング302を作成することを必要とする。このTCEマッピング302は、DMAが完了した後にアンマップされる。読み取りミスの場合には、2つのTCEマッピング、ストレージ・ドライブ204から読み取りデータを検索するためのキャッシュ・メモリ216およびデバイスアダプタ210の間の1つのマッピング302、および、読み取りデータをホストシステム106に戻すためのキャッシュ・メモリ216およびホストアダプタ208の間の第2のマッピング302、が必要である。DMAが完了した後、TCEマッピング302は、アンマップされてもよい。
【0037】
TCEマッピングおよびアンマッピングは、特に高いI/Oレートでは、時間的な点でコストがかかる可能性がある。TCEマッピングの必要性を回避する1つの方法は、キャッシュ・メモリ216のある部分を、永続的にマッピングされたままに維持する(すなわち、専用の永続的にマッピングされたメモリを使用する)ことである。I/Oが到着すると、要求されたデータが、キャッシュ・メモリ216からこの永続的にマッピングされたメモリ400にコピーされてもよい。次いで、TCEマッピング/アンマッピングを行う必要なく、この永続的にマッピングされたメモリ400からDMAが発生し得る。この技術は、TCEマッピング/アンマッピングを行うコスト(必要な時間)を除去するが、一のメモリ位置から他のメモリ位置へデータをコピーするためのコスト(例えば必要な時間)を導入する。このコストは、2つのメモリ位置の互いに相対的な場所に依存する可能性がある。場合によっては、コストは、TCEマッピング/アンマッピングを実行するよりも少ない可能性があるが、他の場合は、永続的にマッピングされたメモリ400にデータをコピーするより少ない可能性がある。
【0038】
以上の観点から、IBM(登録商標)DS8000(登録商標)エンタープライズ・ストレージ・システムのようなストレージ・システムにおいて、I/O性能を最適化するために、メモリ・コピー・データ転送技術およびメモリ・マッピング・データ転送間を動的に切り替えるシステムおよび方法が必要とされる。理想的には、関与するI/O動作に応じて、このようなシステムおよび方法は、最も効率的なデータ転送技術(つまり、メモリ・コピーおよびメモリ・マッピング)を利用することになる。
【0039】
図3は、TCEマッピングなどのメモリ・マッピング・データ転送技術の一例を示す高レベルブロック図である。図示するように、キャッシュ216は、1以上のキャッシュ・セグメント300、例えば、4キロバイトのセグメント300を含んでもよい。ある実施形態においては、”トラック”のようなデータ要素が、例えば17個のキャッシュ・セグメント300のような複数のキャッシュ・セグメント300から構成されてもよい。したがって、トラックが4キロバイトの17個のキャッシュ・セグメント300から構成される場合、トラックは、68キロバイトのデータを包含し得る。多くの場合、トラックに関連するキャッシュ・セグメント300は、キャッシュ216内で連続していなくてもよい。すなわち、トラックのキャッシュ・セグメント300は、キャッシュ216内の異なる位置に散発的またはランダムに配置されてもよい。よって、キャッシュ216内のトラック(すなわち、キャッシュ・セグメント300の連続したシーケンス)を読み書きするために、トラックは、対応するキャッシュ・セグメント300にマッピングされる必要がある。ある実施形態においては、マッピング302(例えば、TCEマッピング302)は、トラックに関連付けられたキャッシュ・セグメント300をバス・アドレス・ウィンドウ304にマッピングし、ホストアダプタ208もしくはデバイスアダプタ210またはこれらの両方がDMAを介してキャッシュ216からまたはキャッシュ216へトラックを転送することができるようにしてもよい。ある実施形態においては、マッピング302は、
図3に示すように、トラック内に配置された順序でキャッシュ・セグメント300を順序付けすることができる。
【0040】
図4は、メモリ・コピー・データ転送技術の一例を示す高レベルブロック図である。図示されているように、メモリ・コピー・データ転送技術は、キャッシュ・セグメント300をバス・アドレス・ウィンドウ304にマッピングする代わりに、まず、データ要素(例えば、トラック)に関連付けられたキャッシュ・セグメント300を、永続的にマッピングされたメモリ400にコピーすることができる。永続的にマッピングされたメモリ400は、キャッシュ216と同一のメモリ214(例えば、メモリチップ)にまたは異なるメモリ214(例えば、メモリチップ)に常駐してもよい。したがって、キャッシュ216から、永続的にマッピングされたメモリ400へのキャッシュ・セグメント300のコピーは、いくらかのコストを有し、その大きさは、キャッシュ216および永続的にマッピングされたメモリ400の位置およびそれらの間でデータをコピーするのに必要な時間に応じて変化する。ある実施形態においては、コピーされたキャッシュ・セグメント300は、それらがトラック内に存在するのと同じやり方で、永続的にマッピングされたメモリ400内で順序付けられ、それによって、ホストアダプタ208もしくはデバイスアダプタ210またはこれらの両方によってDMAを介して転送することができる、キャッシュ・セグメント300の連続した順序のグループを提供する。
【0041】
図5を参照すると、特定のI/O要求に対していずれのデータ転送技術を使用するかを決定するための方法500の一実施形態を示すフロー図が示されている。この方法500は、ストレージ・システム110によってI/O要求が受信される毎に実行されてもよい。図示のように、方法500は、最初にI/O要求を受信する(502)。方法500は、次に、
図3に記載されたメモリ・マッピング・データ転送技術のようなメモリ・マッピング・データ転送技術を使用してI/O要求を実行することに関連するコストを計算する(504)。ある実施形態においては、過去の統計を分析して、特定のデータのトラックをマップまたはアンマップするのにどれくらいの長さとなるかを決定することによってコストが計算されてもよい(504)。
【0042】
次に、方法500は、
図4に関連して記述されたメモリ・コピー・データ転送技術のようなメモリ・コピー・データ転送技術を使用してI/O要求を実行するコストを計算する(506)。ある実施形態においては、メモリ・コピー・データ転送技術を使用することに関連するコストは、永続的にマッピングされたメモリ400にコピーするキャッシュ・セグメント300の数を決定することによって計算される。ある実施形態においては、メモリ・コピー・データ転送技術は、データのフルトラック未満のデータをコピーするために使用され得るが、メモリ・マッピング・データ転送技術は、キャッシュ・セグメント300のフルトラックをマッピングする必要がある。よって、メモリ・コピー・データ転送技術は、より小さい転送(例えば、データのフルトラック未満)で、メモリ・マッピング・データ転送技術よりも効率的である可能性がある。メモリ・コピー・データ転送技術に関連するコストは、また、キャッシュ216および永続的にマッピングされたメモリ400の相対的な位置に依存する可能性がある。キャッシュ216および永続的にマッピングされたメモリ400が例えば同一メモリチップ上に位置する場合、データをコピーする時間が短くなるので、コストがより低くなる。一方、キャッシュ216および永続的にマッピングされたメモリ400が異なるメモリチップ上に位置する場合には、データをコピーするのに要する時間が長くなるので、コストがより高くなる。
【0043】
方法500は、次いで、メモリ・マッピング・データ転送技術のコストを、メモリ・コピー・データ転送技術のコストと比較する(508)。メモリ・マッピング・データ転送技術のコストがより大きい場合、方法500は、可能であれば、メモリ・コピー・データ転送技術を使用して、I/O要求に関連するデータをキャッシュ216へ/からホストアダプタ208もしくはデバイスアダプタ210またはこれらの両方に転送することができる。一方、メモリ・コピー・データ転送技術のコストがより大きい場合、方法500は、可能であれば、メモリ・マッピング・データ転送技術を使用して、I/O要求に関連するデータをキャッシュ216へ/からホストアダプタ208もしくはデバイスアダプタ210またはこれらの両方に転送することができる。
図10に関連してより詳細に説明されるように、メモリ・マッピング・データ転送技術またはメモリ・コピー・データ転送技術のいずれかの使用は、”マッピング”ウィンドウまたは”コピー”ウィンドウがデータを転送するために利用可能であるかどうかに依存する可能性がある。
図5のステップ510およびステップ512を実行する方法のより詳細な実施形態が、
図10に関連して説明される。
【0044】
図6を参照すると、ある実施形態においては、指定数の”マッピング”ウィンドウ600がメモリ・マッピング・データ転送技術を使用してデータを転送するために割り当てられ得て、指定数の”コピー”ウィンドウ602が、メモリ・コピー・データ転送技術を使用してデータを転送するために割り当てられ得る。各”マッピング”ウィンドウは、メモリ・マッピング・データ転送技術を使用してデータを転送するためのバス・アドレス・ウィンドウ304を提供することができ、各”コピー”ウィンドウは、メモリ・コピー・データ転送技術を使用してデータを転送するためのバス・アドレス・ウィンドウ304を提供することができる。先に述べたように、バス・アドレス・ウィンドウ304は、ホストアダプタ208もしくはデバイスアダプタ210またはこれらの両方に、アドレスバス上の一定量の連続したストレージ空間(例えば、トラック)を読み書きする手段を提供することができる。
【0045】
例えば、最初、合計2000個のウィンドウがデータを転送するために割り当てられ、これらの2000個のウィンドウのうち、1000個は、”マッピング”ウィンドウであり、他の1000個は”コピー”ウィンドウであると仮定する。”マッピング”ウィンドウは、メモリ・マッピング・データ転送技術がより効率的であるとみなされるI/O要求をサービスするために使用されてもよく、”コピー・ウィンドウ”は、メモリ・コピー・データ転送技術がより効率的であるとみなされるI/O要求をサービスするために使用されてもよい。ある数の”コピー”ウィンドウおよび”マッピング”ウィンドウが最初にデータを転送するために割り当てられる場合、本発明によるシステムおよび方法は、入ってくるI/O要求に従って各データ転送技術に割り当てられるそれぞれのウィンドウの数を動的に調整することができる。例えば、メモリ・コピー・データ転送技術を使用するように識別された入力I/O要求をサービスするのに十分ではない”コピー”ウィンドウが利用可能である場合、
図7に示すように、全ウィンドウのうちのより多くが”コピー”ウィンドウ602に割り当てられ、全ウィンドウのうちのより少なくが”マッピング”ウィンドウ600に割り当てられてもよい。このようにして、入ってくるI/O要求に対応して”コピー”ウィンドウの数および”マッピング”ウィンドウの数が動的に変更されてもよい。
【0046】
図8を参照すると、ウィンドウを割り当て、かつ、ウィンドウの割り当てを動的に変更するための方法800の一実施形態が示されている。図示するように、方法800は、最初に、メモリ・コピー・データ転送技術に関連して使用される第1の数の”コピー”ウィンドウと、メモリ・マッピング・データ転送技術に関連して使用される第2の数の”マッピング”ウィンドウとを割り当てる(802)。ある実施形態においては、ウィンドウを割り当てることは、ある量のメモリ214を割り当ててウィンドウを実装することを含んでもよい。例えば、2ギガバイトのメモリ214が、メモリ・マッピング・データ転送技術に関連するマッピング302に割り当てられた1ギガバイトと、メモリ・コピー・データ転送技術に関連付けられた永続的にマッピングされたメモリ400に割り当てられた1ギガバイトとでウィンドウに割り当てられてもよい。
【0047】
他の実施形態においては、割り当ては、全ウィンドウのある割合が”マッピング”ウィンドウであり、全ウィンドウの残りの割合が”コピー・ウィンドウ”であるとして総ウィンドウ数を含むことができる。ある実施形態においては、ウィンドウの総数またはウィンドウに割り当てられたメモリ214の総量が固定される。他の実施形態においては、ウィンドウの総数またはウィンドウに割り当てられたメモリ214の総量は、必要に応じて調整される。ウィンドウの最初の割り当ては、どれだけ多く必要かについての見積もりまたは推測に基づいてもよいし、または、過去に受信されたI/Oのタイプのような統計データに基づいてもよい。
【0048】
第1の数の”コピー”ウィンドウおよび第2の数の”マッピング”ウィンドウが割り当てられると、方法800は、可能であれば、I/O要求を処理するために最も効率的なデータ転送技術を使用して、一定期間にわたりI/O要求を処理する(804)。すなわち、メモリ・マッピング・データ転送技術がI/O要求を処理するより効率的であるとみなされる場合、方法800は、理想的には、メモリ・マッピング・データ転送技術および関連する”マッピング”ウィンドウを利用してI/O要求を処理する。同様に、メモリ・コピー・データ転送技術がI/O要求を処理するのがより効率的であるとみなされる場合、方法800は、理想的には、メモリ・コピー・データ転送技術および関連する"コピー・ウィンドウ"を利用してI/O要求を処理する。
【0049】
I/O要求を処理する間、方法800は、メモリ・コピー・データ転送技術が理想的には利用されるが、関連する"コピー・ウィンドウ"の不足のために利用できなかった回数を追跡する(806)。同様に、方法800は、メモリ・マッピング・データ転送技術が理想的に利用されるが、関連付けられた”マッピング”ウィンドウの不足のめに利用できなかった回数を追跡する(808)。各タイプのウィンドウが利用できなかった回数に基づいて、方法800は、”コピー”ウィンドウおよび”マッピング”ウィンドウの割り当てを動的に変更する(例えば、”マッピング”ウィンドウの数に対する相対的な”コピー”ウィンドウの数を変更する、または”コピー”ウィンドウもしくは”マッピング”ウィンドウまたはこれらの両方の数を増加または減少する。)。これは、あるタイプのウィンドウが必要であるが利用できない回数を最小化することを目標に実行することができる。
【0050】
図9を参照すると、ウィンドウを割り当て、かつ、ウィンドウの割り当てを動的に変更するための方法900の別の実施形態が示される。図示されるように、方法900は、最初、メモリ・コピー・データ転送技術に関連して使用される第1の数の”コピー”ウィンドウと、メモリ・マッピング・データ転送技術と関連して使用される第2の数の”マッピング”ウィンドウとを割り当てる。第1の数の”コピー”ウィンドウおよび第2の数の”マッピング”ウィンドウが割り当てられると、方法900は、可能であれば、I/O要求を処理するために最も効率的なデータ転送技術を使用して、ある期間にわたりI/O要求を処理する(904)。
【0051】
I/O要求が処理される間、方法900は、あるタイプのデータであるI/O要求の割合を追跡する(906)。例えば、方法900は、I/O要求のうちのどれだけの割合が順次I/O要求、大きなランダムI/O要求および小さなランダムI/O要求であるかを追跡することができる(906)。順次I/O要求および大きなランダムI/O要求は、典型的には、フルトラック・アクセスであり、よって、メモリ・マッピング・データ転送技術を使用してより効率的に処理することができる。小さなランダムI/O要求は、対照的に、フルトラック未満のアクセスを含み、よって、メモリ・コピー・データ転送技術を使用してより効率的に処理することができる。上記で説明したように、メモリ・コピー・データ転送技術は、フルトラック未満のデータをコピーするために使用され得るが、メモリ・マッピング・データ転送技術は、キャッシュ・セグメント300のフルトラックをマッピングする必要がある。
【0052】
各タイプであるI/O要求の割合に従って、方法900は、入ってくるI/O要求の組成およびタイプに適合するように、”コピー”ウィンドウの数および”マッピング”ウィンドウの数を動的に調整することができる。これにより、各入ってくるI/O要求について、可能な限り効率的なデータ転送技術が選択され、使用され得る。
【0053】
図10は、I/O要求を処理するためにメモリ・マッピング・データ転送またはメモリ・コピー・データ転送技術を利用するかどうかを決定する方法1000の一実施形態を示すフロー図である。ある実施形態においては、この方法1000は、
図5に示すステップ510,512に代替して使用される。図示するように、方法1000は、最初、受信されたI/O要求に対して、メモリ・コピー・データ転送技術を使用する方が、メモリ・マッピング・データ転送技術を使用するよりも低コストかどうかを決定する(1002)。もしそうであれば、方法1000は、”コピー”ウィンドウの利用可能な数が閾値(例えば、100)未満であり、かつ、”マッピング”ウィンドウの利用可能な数が閾値を超える(例えば、100)であり、かつ、メモリ・コピー・データ転送技術を使用することと、メモリ・マッピング・データ転送技術を使用することとの間のコスト差が、閾値(例えば、5マイクロ秒)以下であるかを判定する。これらの条件が満たされた場合、方法1000は、メモリ・マッピング・データ転送技術を使用して、I/O要求に関連するデータを転送する(1004)。本質的に、このステップ1004は、”コピー”ウィンドウが不足し、”マッピング”ウィンドウは不足しておらず、データ転送技術間のコスト差が大きすぎではない場合、メモリ・マッピング・データ転送技術を使用してI/O要求に関連するデータを転送する。そうでなければ、方法1000は、次のステップ1006へ進められる。
【0054】
ステップ1006において、”コピー”ウィンドウが利用可能ではなく、少なくとも1つの”マッピング”ウィンドウが利用可能である場合、方法1000は、メモリ・コピー・データ転送技術を使用することと、メモリ・マッピング・データ転送技術を使用することとのコスト差にかかわらず、メモリ・マッピング・データ転送技術を使用してI/O要求に関連するデータを転送する。本質的に、このステップ1006は、メモリ・コピー・データ転送技術を使用することがより効率的であろう場合であっても、それが利用可能な唯一のオプションである場合は、メモリ・マッピング・データ転送技術を使用して、I/O要求に関連するデータを転送する。そうでなければ、方法1000は、次のステップ1008へ進められる。
【0055】
ステップ1008において、”コピー”ウィンドウが利用可能ではなく”マッピング”ウィンドウ”が利用可能ではない場合は、方法1000は、次の利用可能なウィンドウ(”コピー”ウィンドウまたは”マッピング”ウィンドウ)を待ち(1008)、対応するデータ転送技術と共にこのウィンドウを使用して、I/O要求に関連するデータを転送する。これは、メモリ・コピー・データ転送技術を使用することと、メモリ・マッピング・データ転送技術を使用することとの間のコスト差に関係なく実行される。そうでなければ、方法1000は、次のステップ1010に進む。ステップ1010においては、方法1000は、”コピー”ウィンドウが利用可能であり、メモリ・コピー・データ転送技術を使用することが、メモリ・マッピング・データ転送技術を使用することもコストがかからないので、メモリ・コピー・データ転送技術を使用してI/O要求に関連するデータを転送する。
【0056】
ステップ1002において、メモリ・コピー・データ転送技術が、メモリ・マッピング・データ転送技術よりも低コストではない(メモリ・マッピング・データ転送技術がメモリ・コピー・データ転送技術よりも低コストであることを意味する)場合は、方法1000は、ステップ1012へ進められる。方法1000は、ステップ1012において、”マッピング”ウィンドウの利用可能な数が閾値(例えば、100)を下回り、かつ、”コピー”ウィンドウの利用可能な数が閾値(例えば、100)を超え、かつ、メモリ・マッピング・データ転送技術を使用することと、メモリ・コピー・データ転送技術を使用することとの間のコスト差が、閾値(例えば、5マイクロ秒)未満であるかどうかを判定する。これらの条件が満たされる場合、方法1000は、メモリ・コピー・データ転送技術を使用してI/O要求に関連するデータを転送する(1012)。本質的に、このステップ1012は、”マッピング”ウィンドウが不足しており、”コピー”ウィンドウが不足しておらず、データ転送技術間のコスト差が大きすぎない場合は、メモリ・コピー・データ転送技術を使用して、I/O要求に関連するデータを転送する。そうでなければ、方法1000は、次のステップ1014に進む。
【0057】
ステップ1014において、”マッピング”ウィンドウが利用可能ではないが、少なくとも1つの”コピー”ウィンドウが利用可能である場合、方法1000は、メモリ・マッピング・データ転送技術を使用することと、メモリ・コピー・データ転送技術を使用することとの間のコスト差に関係なく、メモリ・コピー・データ転送技術を使用してI/O要求に関連するデータを転送する(1014)。本質的に、このステップ1014は、メモリ・マッピング・データ転送技術を使用することがより効率的であろう場合であっても、利用可能な唯一のオプションであれば、メモリ・コピー・データ転送技術を使用してI/O要求に関連付けられたデータを転送する。そうでなければ、方法1000は、次のステップ1016に進む。
【0058】
ステップ1016において、”マッピング”ウィンドウまたは”コピー”ウィンドウが利用可能でない場合、方法1000は、次の利用可能なウィンドウ(”コピー”ウィンドウまたは”マッピング”ウィンドウ)を待ち(1016)、対応するデータ転送技術と共にこのウィンドウを使用してデータを転送する。これは、メモリ・マッピング・データ転送技術とメモリ・コピー・データ転送技術との間のコスト差に関係なく実行される。そうでなければ、方法1000は、次のステップ1018に進む。ステップ1018においては、方法1000は、”マッピング”ウィンドウが利用可能であり、メモリ・マッピング・データ転送技術を使用することの方がメモリ・コピー・データ転送技術を使用するよりもコストがかからないので、メモリ・マッピング・データ転送・データ転送技術を使用してI/O要求に関連するデータを転送する。
【0059】
図面におけるフローチャート図もしくはブロック図またはこれらの両方は、本発明の種々の実施形態に従ったシステム、方法およびコンピュータ使用可能媒体の可能な実装のアーキテクチャ、機能性および動作を示す。この点に関して、フローチャートまたはブロック図の各ブロックは、特定の論理機能を実装するための1以上の実行可能な命令を含む、モジュール、セグメントまたはコードの部分を表す可能性がある。いくつかの代替の実装では、ブロックにおいて言及された機能は、図面に示された順序から外れて生じる可能性があることに留意されたい。例えば、連続して示される2つのブロックは、実際には、実質的に同時に実行されてもよく、あるいは、複数のブロックは、関与する機能性に応じて逆の順序で実行されてもよい。ブロック図もしくはフローチャート図またはその両方の各ブロックおよびブロック図もしくはフローチャート図またはその両方の複数のブロックの組み合わせが、特定の機能または作用、または、特別な目的のハードウェアおよびコンピュータ命令の組み合わせを実行する特定目的ハードウェアベースのシステムによって実装されてもよいことに留意されたい。