特許6822887 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 三星電子株式会社の特許一覧

特許6822887高性能なロックレススケーラブルターゲットを提供するシステム及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6822887

(24)【登録日】2021年1月12日

(45)【発行日】2021年1月27日

(54)【発明の名称】高性能なロックレススケーラブルターゲットを提供するシステム及び方法

(51)【国際特許分類】

G06F 13/12 20060101AFI20210114BHJP

G06F 13/10 20060101ALI20210114BHJP

【ＦＩ】

G06F13/12 340B

G06F13/10 340A

【請求項の数】24

【全頁数】20

(21)【出願番号】特願2017-76841(P2017-76841)

(22)【出願日】2017年4月7日

(65)【公開番号】特開2017-191603(P2017-191603A)

(43)【公開日】2017年10月19日

【審査請求日】2020年3月30日

(31)【優先権主張番号】62/322,035

(32)【優先日】2016年4月13日

(33)【優先権主張国】US

(31)【優先権主張番号】15/209,566

(32)【優先日】2016年7月13日

(33)【優先権主張国】US

【早期審査対象出願】

(73)【特許権者】

【識別番号】390019839

【氏名又は名称】三星電子株式会社

【氏名又は名称原語表記】ＳａｍｓｕｎｇＥｌｅｃｔｒｏｎｉｃｓＣｏ．，Ｌｔｄ．

(74)【代理人】

【識別番号】110000051

【氏名又は名称】特許業務法人共生国際特許事務所

(72)【発明者】

【氏名】ゴラップディ，ヴェンカタバヌプラカシュ

(72)【発明者】

【氏名】ジャックラ，ヴィジェイ

【審査官】打出義尚

(56)【参考文献】

【文献】国際公開第２０１６／０６７３３９（ＷＯ，Ａ１）

【文献】国際公開第２０１４／０６３０６７（ＷＯ，Ａ１）

【文献】米国特許出願公開第２０１５／０１３４８４１（ＵＳ，Ａ１）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１３／１２

Ｇ０６Ｆ１３／１０

(57)【特許請求の範囲】

【請求項1】

複数のＣＰＵを含むデータストレージシステムのターゲットに格納されたデータにアクセスするためのコマンドを受信する段階と、
前記複数のＣＰＵの中の第１グループのＣＰＵ上でコマンドレシーバー経路及びコマンドトランスミッタ経路を各々含む複数の伝送スレッドを作動させる段階と、
前記複数のＣＰＵの中の第２グループのＣＰＵ上でコマンド発行経路及びコマンド完了経路を各々含む複数のデータ経路スレッドを作動させる段階と、
伝送スレッドの前記コマンドレシーバー経路を使用してＩ／Ｏコマンド発行キューにＩ／Ｏコマンドを配置し、データ経路スレッドの前記コマンド発行経路を使用して前記Ｉ／Ｏコマンドを処理する段階と、
前記データ経路スレッドの前記コマンド完了経路を使用してＩ／Ｏ完了キューにＩ／Ｏ完了通知を配置し、前記伝送スレッドの前記コマンドトランスミッタ経路を使用して前記Ｉ／Ｏ完了通知を処理する段階と、を有し、
前記Ｉ／Ｏコマンド発行キューは、第１キューアレイを含み、
前記第１キューアレイの各々は、前記第１グループのＣＰＵの各々のＣＰＵに対応し、
前記Ｉ／Ｏ完了キューは、第２キューアレイを含み、
前記第２キューアレイの各々は、前記第２グループのＣＰＵの各々のＣＰＵに対応することを特徴とする方法。

【請求項2】

前記伝送スレッドは、レシーバー及びトランスミッタを含み、
前記レシーバーは、Ｉ／Ｏコマンドを前記データ経路スレッドに伝送することを特徴とする請求項１に記載の方法。

【請求項3】

前記データ経路スレッドは、前記Ｉ／Ｏコマンドを前記ターゲットに伝送し、前記ターゲットから状態及びデータの中の少なくとも１つを受信し、前記伝送スレッドの前記トランスミッタに前記状態及びデータの中の少なくとも１つを伝送することを特徴とする請求項２に記載の方法。

【請求項4】

前記第１キューアレイは、前記データ経路スレッドに割り当られた前記第２グループのＣＰＵに対応する第１の複数のノードを含むことを特徴とする請求項１に記載の方法。

【請求項5】

前記第１の複数のノードは、ヘッダーノード、テールノード、及び前記第１キューアレイのキューを示す現在ノードを含み、
前記現在ノードから前記テールノードまでのノードは、消費者によって所有され、
前記第１キューアレイの残りのノードは、生産者によって所有されることを特徴とする請求項４に記載の方法。

【請求項6】

前記生産者は、イニシエーターであり、
前記消費者は、前記ターゲットであることを特徴とする請求項５に記載の方法。

【請求項7】

前記消費者は、前記データ経路スレッドの各々に固有のスレッド識別子を利用して前記キューへの排他的なアクセスを獲得することを特徴とする請求項６に記載の方法。

【請求項8】

前記第２キューアレイは、前記伝送スレッドに割り当られた前記第１グループのＣＰＵに対応する第２の複数のノードを含むことを特徴とする請求項１に記載の方法。

【請求項9】

前記第２の複数のノードは、ヘッダーノード、テールノード、及び前記第２キューアレイのキューを示す現在ノードを含み、
前記現在ノードから前記テールノードまでのノードは、消費者によって所有され、
前記第１キューアレイの残りのノードは、生産者によって所有されることを特徴とする請求項８に記載の方法。

【請求項10】

前記生産者は、前記ターゲットであり、
前記消費者は、イニシエーターであることを特徴とする請求項９に記載の方法。

【請求項11】

前記消費者は、前記伝送スレッドの各々に固有のスレッド識別子を利用して前記キューへの排他的なアクセスを獲得することを特徴とする請求項１０に記載の方法。

【請求項12】

前記Ｉ／Ｏコマンド発行キュー及び前記Ｉ／Ｏ完了キューの各々は、ＭＰＭＣ（ｍｕｌｔｉ−ｐｒｏｄｕｃｅｒｍｕｌｔｉ−ｃｏｎｓｕｍｅｒ）ロックレス・キューであり、
１つ以上の伝送スレッドからの作業要請は、特定のデータ経路スレッドに到達し、
特定の伝送スレッドからの作業要請は、１つ以上のデータ経路スレッドに到達し、
１つ以上のデータ経路スレッドからの作業要請は、特定の伝送スレッドに到達し、
特定のデータ経路スレッドからの作業要請は、１つ以上の伝送スレッドに到達することを特徴とする請求項１に記載の方法。

【請求項13】

複数のＣＰＵと、
複数のターゲットと、
Ｉ／Ｏフロー、Ｉ／Ｏコマンド発行キュー、及びＩ／Ｏ完了キューを処理するソフトウェアモジュールセットを格納するメモリと、を備え、
前記ソフトウェアモジュールセットは、
複数のＣＰＵを含むデータストレージシステムのターゲットに格納されたデータにアクセスするＩ／Ｏコマンドを受信し、
前記複数のＣＰＵの第１グループのＣＰＵの中の第１ＣＰＵ上でコマンドレシーバー経路及びコマンドトランスミッタ経路を各々含む複数の伝送スレッドを作動させ、
前記複数のＣＰＵの第２グループのＣＰＵの中の第２ＣＰＵ上でコマンド発行経路及びコマンド完了経路を各々含む複数のデータ経路スレッドを作動させ、
前記伝送スレッドの前記コマンドレシーバー経路は、Ｉ／Ｏコマンドを前記Ｉ／Ｏコマンド発行キューに配置し、
前記データ経路スレッドの前記コマンド発行経路は、前記Ｉ／Ｏコマンドを処理し、
前記データ経路スレッドの前記コマンド完了経路は、Ｉ／Ｏ完了通知を前記Ｉ／Ｏ完了キューに配置し、
前記伝送スレッドの前記コマンドトランスミッタ経路は、前記Ｉ／Ｏ完了通知を処理し、
前記Ｉ／Ｏコマンド発行キューは、第１キューアレイを含み、
前記第１キューアレイの各々は、前記第１グループのＣＰＵの各々のＣＰＵに対応し、
前記Ｉ／Ｏ完了キューは、第２キューアレイを含み、
前記第２キューアレイの各々は、前記第２グループのＣＰＵの各々のＣＰＵに対応することを特徴とするデータストレージシステム。

【請求項14】

前記伝送スレッドは、レシーバー及びトランスミッタを含み、
前記レシーバーは、Ｉ／Ｏコマンドを前記データ経路スレッドに伝送することを特徴とする請求項１３に記載のデータストレージシステム。

【請求項15】

前記データ経路スレッドは、前記Ｉ／Ｏコマンドを前記ターゲットに伝送し、前記ターゲットから状態及びデータの中の少なくとも１つを受信し、前記伝送スレッドの前記トランスミッタに前記状態及びデータの中の少なくとも１つを伝送することを特徴とする請求項１４に記載のデータストレージシステム。

【請求項16】

前記第１キューアレイは、前記データ経路スレッドに割り当られた前記第２グループのＣＰＵに対応する第１の複数のノードを含むことを特徴とする請求項１３に記載のデータストレージシステム。

【請求項17】

前記第１の複数のノードは、ヘッダーノード、テールノード、及び前記第１キューアレイのキューを示す現在ノードを含み、
前記現在ノードから前記テールノードまでのノードは、消費者によって所有され、
前記第１キューアレイの残りのノードは、生産者によって所有されることを特徴とする請求項１６に記載のデータストレージシステム。

【請求項18】

前記生産者は、イニシエーターであり、
前記消費者は、前記ターゲットであることを特徴とする請求項１７に記載のデータストレージシステム。

【請求項19】

前記消費者は、前記データ経路スレッドの各々に固有のスレッド識別子を利用して前記キューへの排他的なアクセスを獲得することを特徴とする請求項１８に記載のデータストレージシステム。

【請求項20】

前記第２キューアレイは、前記伝送スレッドに割り当られた前記第１グループのＣＰＵに対応する第２の複数のノードを含むことを特徴とする請求項１３に記載のデータストレージシステム。

【請求項21】

前記第２の複数のノードは、ヘッダーノード、テールノード、及び前記第２キューアレイのキューを示す現在ノードを含み、
前記現在ノードから前記テールノードまでのノードは、消費者によって所有され、
前記第１キューアレイの残りのノードは、生産者によって所有されることを特徴とする請求項２０に記載のデータストレージシステム。

【請求項22】

前記生産者は、前記ターゲットであり、
前記消費者は、イニシエーターであることを特徴とする請求項２１に記載のデータストレージシステム。

【請求項23】

前記消費者は、前記伝送スレッドの各々に固有のスレッド識別子を利用して前記キューへの排他的なアクセスを獲得することを特徴とする請求項２２に記載のデータストレージシステム。

【請求項24】

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データストレージシステムに関し、より詳しくは、高性能なロックレススケーラブルターゲットを提供するシステム及び方法に関する。

【背景技術】

【0002】

一般的なＳＡＮ（ｓｔｏｒａｇｅａｒｅａｎｅｔｗｏｒｋ）において、ターゲットは、持続的なデータストレージ空間（例えば、論理ユニットナンバー（ＬＵＮ：ｌｏｇｉｃａｌｕｎｉｔｎｕｍｂｅｒ）、名称空間（ｎａｍｅｓｐａｃｅ））を光ファイバーコネクション又はスイッチングネットワークを通じて１つ以上のイニシエーター（ｉｎｉｔｉａｔｏｒ）に露出させる。イニシエーターは、インターフェイスセッション（例えば、ＳＣＳＩ（ｓｍａｌｌｃｏｍｐｕｔｅｒｓｙｓｔｅｍｉｎｔｅｒｆａｃｅ）セッション）を開始して、コマンド（例えば、ＳＣＳＩコマンド）を伝送するエンドポイント（ｅｎｄｐｏｉｎｔ）を指す。ターゲットは、イニシエーターの作業要請を待って、入／出力（Ｉ／Ｏ）動作を遂行するエンドポイントを指す。一般的なコンピュータアーキテクチャにおいて、イニシエーターはクライアントと称され、ターゲットはサーバーと称される。１つのターゲットは複数のイニシエーターにサービスを提供し、イニシエーターに１つ以上のＬＵＮを提供する。

【0003】

ターゲットは、相互に合意されたＳＡＮプロトコルを通じて１つ以上のイニシエーターと通信する。ＳＡＮプロトコルの例としては、ＦＣＰ（ＦｉｂｒｅＣｈａｎｎｅｌＰｒｏｔｏｃｏｌ）、ｐＳＣＳＩ（ｐａｒａｌｌｅｌＳＣＳＩ）、ｉＳＣＳＩ（ｉｎｔｅｒｎｅｔＳＣＳＩ）、ＨｙｐｅｒＳＣＳＩ、ファイバチャンネル（ＦｉｂｒｅＣｈａｎｎｅｌ）、ＡＴＡ（ＡｄｖａｎｃｅｄＴｅｃｈｎｏｌｏｇｙＡｔｔａｃｈｍｅｎｔ）、ＳＡＴＡ（ＳｅｒｉａｌＡＴＡ）、ＡｏＥ（ＡＴＡｏｖｅｒＥｔｈｅｒｎｅｔ（登録商標））、ＩｎｆｉｎｉＢａｎｄ、及びＮＶＭｅ（Ｎｏｎ−ＶｏｌａｔｉｌｅＭｅｍｏｒｙＥｘｐｒｅｓｓ）ｏｖｅｒＦａｂｒｉｃｓを含むが、これらに限定されない。

【0004】

ＳＡＮプロトコルは、イニシエーターがターゲットにＩ／Ｏコマンドを伝送できるようにする。データセンターのデータストレージ装置は、ＳＡＮを通じて物理的及び／又は論理的に分散された複数のターゲットを含む。ＳＡＮプロトコルは、データストレージ装置がローカルに接続されたように見える錯覚をホストに提供しながら、データストレージ装置をターゲットのアレイに統合する。

【0005】

ストレージターゲットは、一般的に複数のコネクションを通じて複数のイニシエーターにバックエンド（ｂａｃｋｅｎｄ）ＬＵＮを露出させる。各々のイニシエーターは、１つ以上のコネクションをターゲットに開放し、ターゲット内の１つ以上のＬＵＮにアクセスする。入／出力（Ｉ／Ｏ）フローの観点から、データ経路内に確立された複数の同期点（ｓｙｎｃｈｒｏｎｉｚａｔｉｏｎｐｏｉｎｔ）は、特に、複数のセッションが同時に複数のＬＵＮにアクセスする場合、Ｉ／Ｏ性能に影響を及ぼす。

【0006】

フロントエンドＩ／Ｏスタック（ｆｒｏｎｔｅｎｄＩ／Ｏｓｔａｃｋ）でのデータ経路は、伝送プロトコル階層（ｌａｙｅｒ）とＳＣＳＩコア階層とに分けられる。伝送プロトコル階層での処理は、コネクション単位ベース（ｐｅｒ−ｃｏｎｎｅｃｔｉｏｎｂａｓｅｄ）であり、ＳＣＳＩコア階層での処理は、ＬＵＮ単位ベース（ｐｅｒ−ＬＵＮｂａｓｅｄ）である。

【0007】

伝送プロトコル階層での処理は、Ｉ／Ｏコマンドを特定のコネクションで発行（ｉｓｓｕｅ）することと、その特定のコネクションでＩ／Ｏコマンドを完了（ｃｏｍｐｌｅｔｅ）することとを含む。ＳＣＳＩコア階層での処理は、Ｉ／Ｏコマンドを特定のＬＵＮに発行することと、その特定のＬＵＮに発行されたＩ／Ｏコマンドを完了することとを含む。全体のＩ／Ｏ経路が伝送プロトコル階層のスレッドコンテキスト（ｔｈｒｅａｄｃｏｎｔｅｘｔ）で実行される場合、多様な同期点がＬＵＮレベルのみならず、コネクションレベルでも確立される、したがって、全体的なＩ／Ｏ性能に影響が及ぶ。これは、ＳＣＳＩコア階層でのＩ／ＯコンテキストがＬＵＮ固有であるのに対して、伝送プロトコル階層でのＩ／Ｏコンテキストはコネクション固有であるためである。

【先行技術文献】

【特許文献】

【0008】

【特許文献1】米国特許第７３５５３０５号明細書

【特許文献2】米国特許第７９５３８７８号明細書

【特許文献3】米国特許第８５６６８３３号明細書

【特許文献4】米国特許第７７２００６４号明細書

【特許文献5】米国特許第８１３９４８２号明細書

【特許文献6】米国特許第８１４９８５４号明細書

【特許文献7】米国特許第８１８０９７３号明細書

【特許文献8】米国特許出願公開第２００７／０１５６９７４号明細書

【特許文献9】米国特許出願公開第２０１１／０２５２１９８号明細書

【発明の概要】

【発明が解決しようとする課題】

【0009】

本発明は、上記従来の問題点に鑑みてなされたものであって、本発明の目的は、データストレージシステムにおいて、ロックレススケーラブルターゲットのためのシステム及び方法を提供することにある。

【課題を解決するための手段】

【0010】

上記目的を達成するためになされた本発明の一態様による方法は、データストレージシステムのターゲットにアクセスする方法であって、複数のＣＰＵを含むデータストレージシステムのターゲットに格納されたデータにアクセスするコマンドを受信する段階と、前記複数のＣＰＵの中の第１グループのＣＰＵ上でコマンドレシーバー経路及びコマンドトランスミッタ経路を各々含む複数の伝送スレッドを作動させる段階と、前記複数のＣＰＵの中の第２グループのＣＰＵ上でコマンド発行経路及びコマンド完了経路を各々含む複数のデータ経路スレッドを作動させる段階と、前記伝送スレッドの前記コマンドレシーバー経路を使用してＩ／Ｏコマンド発行キューにＩ／Ｏコマンドを配置し、前記データ経路スレッドの前記コマンド発行経路を使用して前記Ｉ／Ｏコマンドを処理する段階と、前記データ経路スレッドの前記コマンド完了経路を使用してＩ／Ｏ完了キューにＩ／Ｏ完了通知を配置し、前記伝送スレッドの前記コマンドトランスミッタ経路を使用して前記Ｉ／Ｏ完了通知を処理する段階と、を有し、前記Ｉ／Ｏコマンド発行キューは、第１キューアレイを含み、前記第１キューアレイの各々は、前記第１グループのＣＰＵのそれぞれのＣＰＵに対応し、前記Ｉ／Ｏ完了キューは、第２キューアレイを含み、前記第２キューアレイの各々は、前記第２グループのＣＰＵのそれぞれのＣＰＵに対応することを特徴とする。

【0011】

上記目的を達成するためになされた本発明の一態様によるデータストレージシステムは、複数のＣＰＵと、複数のターゲットと、Ｉ／Ｏフロー、Ｉ／Ｏコマンド発行キュー、及びＩ／Ｏ完了キューを処理するソフトウェアモジュールセットを格納するメモリと、を備え、前記ソフトウェアモジュールセットは、複数のＣＰＵを含むデータストレージシステムのターゲットに格納されたデータにアクセスするＩ／Ｏコマンドを受信し、前記複数のＣＰＵの第１グループのＣＰＵの中の第１ＣＰＵ上でコマンドレシーバー経路及びコマンドトランスミッタ経路を各々含む複数の伝送スレッドを作動させ、前記複数のＣＰＵの第２グループのＣＰＵの中の第２ＣＰＵ上でコマンド発行経路及びコマンド完了経路を各々含む複数のデータ経路スレッドを作動させ、前記伝送スレッドの前記コマンドレシーバー経路はＩ／Ｏコマンドを前記Ｉ／Ｏコマンド発行キューに配置し、前記データ経路スレッドの前記コマンド発行経路は、前記Ｉ／Ｏコマンドを処理し、前記データ経路スレッドの前記コマンド完了経路は、Ｉ／Ｏ完了通知を前記Ｉ／Ｏ完了キューに配置し、前記伝送スレッドの前記コマンドトランスミッタ経路は、前記Ｉ／Ｏ完了通知を処理し、前記Ｉ／Ｏコマンド発行キューは、第１キューアレイを含み、前記第１キューアレイの各々は、前記第１グループのＣＰＵのそれぞれのＣＰＵに対応し、前記Ｉ／Ｏ完了キューは、第２キューアレイを含み、前記第２キューアレイの各々は、前記第２グループのＣＰＵのそれぞれのＣＰＵに対応することを特徴とする。

【発明の効果】

【0012】

本発明によれば、データ経路で同期点及びロックの必要性を除去し、複数のセッションが同時に複数のＬＵＮをアクセスする場合にＩ／Ｏ性能を向上させることができる。

【図面の簡単な説明】

【0013】

【図1】本発明の一実施形態によるモノリシック（ｍｏｎｏｌｉｔｈｉｃ）スレッディングモデルにおけるデータ経路の例を示す図である。

【図2】本発明の一実施形態によるスレッディングモデルの例におけるデータ経路を示すブロック図である。

【図3】本発明の一実施形態による分割されたスレッディングモデルの例を示す図である。

【図4】本発明の一実施形態によるスレッディングモデルの例を示す概略図である。

【図5】本発明の一実施形態によるＳＰＳＣロックレス・キュー（ｓｉｎｇｌｅ−ｐｒｏｄｕｃｅｒｓｉｎｇｌｅ−ｃｏｎｓｕｍｅｒｌｏｃｋｌｅｓｓｑｕｅｕｅ）を示すブロック図である。

【図6】本発明の一実施形態によるＭＰＭＣロックレス・キュー（ｍｕｌｔｉ−ｐｒｏｄｕｃｅｒｍｕｌｔｉ−ｃｏｎｓｕｍｅｒｌｏｃｋｌｅｓｓｑｕｅｕｅ）の例を示すブロック図である。

【図7】本発明の一実施形態によるスレッディングモデルの例を示すブロック図である。

【図8】本発明の他の実施形態によるＭＰＭＣロックレス・キューの例を示すブロック図である。

【図9】本発明のさらに他の実施形態によるＭＰＭＣロックレス・キューの例を示すブロック図である。

【発明を実施するための形態】

【0014】

以下、本発明を実施するための形態の具体例を、図面を参照しながら詳細に説明する。本明細書で説明する特徴及び構成の各々は、高性能なロックレススケーラブルターゲット（ｌｏｃｋｌｅｓｓｓｃａｌａｂｌｅｔａｒｇｅｔ）を提供するための他の特徴及び構成と共に又は分離されて利用される。これらの追加的な特徴及び構成が分離されるか又は結合されて利用される代表的な例の詳細な説明は、単に本発明の一態様を具現するために当業者に開示するものである。したがって、発明の詳細な説明に記載した特徴の組合せは、広い意味で開示する必要はなく、代わりに特に代表的な実施形態を説明するために開示する。

【0015】

図面は、必ずしもスケール通りに示したものではなく、類似する構造又は機能の構成要素は、通常同じ参照番号で表示する。図面は、本明細書で説明する多様な実施形態の詳細な説明を可能にするために意図したものである。図面は、本明細書に記載したすべての構成を示すものではない。

【0016】

以下の説明では、単なる説明の目的のために、特定の名称を、本発明の完全な理解のために示す。しかし、このような特定の細部事項は、本発明を実施するために必須ではないことは当業者に明らかである。

【0017】

発明の詳細な説明の幾つかの部分は、アルゴリズム及びコンピュータメモリ内のデータビットに対する動作のシンボル表現で提示する。これらのアルゴリズム的な説明及び表現は、他の分野の通常の知識を有する技術者に作業の実体を効果的に伝達するために、データ処理分野の当業者によって使用される。ここで、アルゴリズムは、一般的に所望の結果を導く段階の一貫性のある手順である。段階は、物理量の物理的な操作が必要なものである。通常、必須ではないが、これらの量は、格納、伝達、結合、比較、及びその他の操作可能な電気信号又は磁気信号の形態を取る。これらの信号をビット、値、要素、シンボル、特徴、用語、数などと称することは、主に一般的な用法上の理由で便利である。

【0018】

しかし、これらの用語及び類似の用語の全ては、適切な物理量に関連し、単にこれらの量に適用される便宜的なラベルである。具体的に、以下の説明で、「処理」、「コンピューティング」、「計算」、「決定」、「表示」等の用語を使用する論議は、コンピュータシステムのレジスター及びメモリ内で物理（電気）量として表されるデータを、コンピュータシステムのメモリ及びレジスター、又は他の情報ストレージ、伝送装置又は表示装置内で物理量として示される他のデータに処置して変換するコンピュータシステム又は同様の電子コンピューティング装置の活動及びプロセスを示す。

【0019】

本明細書で説明するアルゴリズムは、本質的に任意の特定コンピュータ又は他の装置に関連しない。多様な汎用システム、コンピュータサーバー、又は個人用コンピュータは、本明細書の記載にしたがうプログラムと共に使用されるか、又は要求された方法の段階を遂行するための特化された装置を構成するのに便利である。このような多様なシステムのために要求される構造を以下で説明する。多様なプログラミング言語が本明細書に記載のように本発明を具現するのに使用される。

【0020】

また、代表的な実施形態及び従属請求項の多様な特徴は、本発明のさらに有用な実施形態を提供するために、特に明示的に列挙しない方式で結合される。また、エンティティーグループ（ｇｒｏｕｐｓｏｆｅｎｔｉｔｉｅｓ）のすべての値の範囲又は指示は、本発明の範囲を制限する目的のみならず、元の目的のための全ての可能な中間値又は中間エンティティーを開示する。また、明示的な基準及び図面に示した構成要素の寸法及び形状は、本発明がどのように実施されるのかを理解するのを助けるように設計されるが、実施形態に示した寸法及び形状に限定されない。

【0021】

図１は、本発明の一実施形態によるモノリシック（ｍｏｎｏｌｉｔｈｉｃ）スレッディングモデルにおけるデータ経路の例を示す図である。

【0022】

データ経路は、ｉＳＣＳＩレシーバー経路（ｉＳＣＳＩｒｅｃｅｉｖｅｒｐａｔｈ）１０１、ＳＣＳＩコマンド発行経路（ｃｏｍｍａｎｄｉｓｓｕｅｐａｔｈ）１０２、ＳＣＳＩコマンド完了経路（ｃｏｍｍａｎｄｃｏｍｐｌｅｔｉｏｎｐａｔｈ）１０３、及びｉＳＣＳＩトランスミッタ経路（ｔｒａｎｓｍｉｔｔｅｒｐａｔｈ）１０４のモノリシックシーケンスを含む。

【0023】

ストレージシステムは、複数の中央処理装置（ＣＰＵ：ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）（例えば、Ｎ個のＣＰＵ）を含み、当該ストレージシステムの各ＣＰＵは、データ経路のライフサイクルに亘ってそれぞれのデータ経路の確立、処理、管理、及び完了を担当する。

【0024】

データ経路（１０１〜１０４）のうち、ｉＳＣＳＩレシーバー経路１０１及びｉＳＣＳＩトランスミッタ経路１０４は、イニシエーターとＳＣＳＩターゲットとの間の伝送プロトコル（即ち、ｉＳＣＳＩ）で確立され、コネクション単位に基づく。例えば、ログイン／ログアウト、バッファ管理、及び作業管理処理（ｔａｓｋｍａｎａｇｅｍｅｎｔｈａｎｄｌｉｎｇ）は、コネクション単位に基づいてセッション／コネクションレベルで実行される。Ｉ／Ｏコマンドは、セッション／コネクションレベルでキューイング（ｑｕｅｕｅ）されて、追跡（ｔｒａｃｋ）される。

【0025】

データ経路（１０１〜１０４）のうち、ＳＣＳＩコマンド発行経路１０２及びＳＣＳＩコマンド完了経路１０３は、ＬＵＮレベルでＳＣＳＩターゲットとＬＵＮとの間に確立される。例えば、ターゲットストレージ装置へのＳＣＳＩコマンド及びターゲットストレージ装置からのＳＣＳＩコマンド並びにエラー処理は、ＬＵＮレベルで追跡される。図１に示すモノリシックスレッドモデルでは、ターゲットシステムの利用可能なＣＰＵリソースは、伝送プロトコル及びＳＣＳＩコアレベルプロトコルの両方を作動させるために共有される。モノリシックスレッディングモデルは、キャッシュ局所性（ｃａｃｈｅｌｏｃａｌｉｔｙ）を最大化しない。

【0026】

本発明は、別個のスレッドで独立に伝送プロトコル及びＳＣＳＩコアプロトコルを分割して処理する新規なスレッディングモデル（ｔｈｒｅａｄｉｎｇｍｏｄｅｌ）を提供する。

【0027】

本スレッディングモデルは、伝送プロトコルスレッドとＳＣＳＩコアスレッドとの間でロックレス・キュー設計（ｌｏｃｋｌｅｓｓｑｕｅｕｅｄｅｓｉｇｎ）を採用する。ロックレス・キュー設計は、伝送プロトコル及びＳＣＳＩコアプロトコルに対するスレッドを分割し、独立に作動させることによって、Ｉ／Ｏ性能を向上させる。

【0028】

ストレージシステムのＣＰＵリソースは、伝送プロトコル階層とＳＣＳＩコア階層との間で分配される。伝送プロトコルスレッドは、伝送プロトコル階層でのスレッド実行を処理するために割り当られたＣＰＵでのみスケジューリングされる。ＳＣＳＩコアスレッドは、ＳＣＳＩコア階層で作動するスレッドを処理するために割り当られたＣＰＵでのみスケジューリングされる。伝送プロトコルスレッドは、受信経路及び送信経路を処理する。ＳＣＳＩコアスレッドは、特定のＬＵＮに対するＩ／Ｏ要請及びその特定のＬＵＮに対するＩ／Ｏ完了（ｃｏｍｐｌｅｔｉｏｎ）を処理する。

【0029】

本発明のシステム及び方法は、複数のＬＵＮ及びそれらへのコネクションに対して高い拡張性（ｓｃａｌａｂｉｌｉｔｙ）を提供する。本発明のシステム及び方法は、さらにキャッシュ局所性を最大化するために伝送プロトコルスレッド及びＬＵＮスレッドを分離する。その上で、ロックレス・キュー設計は、複数のＬＵＮが複数のコネクションを通じてアクセスされた時、ロック衝突（ｌｏｃｋｃｏｎｔｅｎｔｉｏｎ）を除去する。

【0030】

本明細書ではｉＳＣＳＩターゲットについて説明するが、本発明は、システムリソースを効率的に利用することと、同期化ボトルネックを回避するために高性能なターゲットＩ／Ｏ性能を提供することとを活用できる何れのＳＡＮプロトコル（例えば、ＦＣＰ、ｐＳＣＳＩ、ｉＳＣＳＩ、ＨｙｐｅｒＳＣＳＩ、ＦｉｂｒｅＣｈａｎｎｅｌ、ＡＴＡ、ＳＡＴＡ、ＡｏＥ、ＩｎｆｉｎｉＢａｎｄ、及びＮＶＭｅｏｖｅｒＦａｂｒｉｃｓ）にも適用される。例えば、ＮＶＭｅｏｖｅｒＦａｂｒｉｃｓプロトコルで、ＳＣＳＩコア階層に相当するコア階層は、ＮＶＭｅキューイングインターフェイス（ＮＶＭｅＱｕｅｕｉｎｇｉｎｔｅｒｆａｃｅ）及びコマンドセットと称される。

【0031】

図２は、本発明の一実施形態によるスレッディングモデルの例におけるデータ経路を示すブロック図である。

【0032】

データ経路２００は、コネクション特定経路２５１とＬＵＮ特定経路２５２とに分離される。コネクション特定経路２５１は、レシーバー２０１及びトランスミッタ２１１を含む。イニシエーター（クライアント）のレシーバー２０１は、ホストから命令語（ｉｎｓｔｒｕｃｔｉｏｎ）を受信して、ｉＳＣＳＩコマンド２０２及び関連するデータ２０３を生成し、ターゲットとのコネクションを確立して、ＳＣＳＩＩ／Ｏモジュール２０４とＴＭ（ｔａｓｋｍａｎａｇｅｍｅｎｔ）Ｉ／Ｏモジュール２０５とを通じてターゲットにｉＳＣＳＩコマンド２０２及びデータ２０３を伝送する。

【0033】

ＬＵＮ特定経路２５２は、読出し、書込み、及びトリム（ｔｒｉｍ）のようなＳＣＳＩコマンドに関連するデータを格納するためのデータＣＤＢ（ｄａｔａｃｏｍｍａｎｄｄｅｓｃｒｉｐｔｏｒｂｌｏｃｋｓ）２２１、及び問合せ（ｉｎｑｕｉｒｙ）、読出し、及び容量のようなＳＣＳＩコマンドを格納するための制御ＣＤＢ（ｃｏｎｔｒｏｌＣＤＢ）２２２を含む。ｉＳＣＳＩコマンド２０２及びデータ２０３は、それぞれデータＣＤＢ２２１及び制御ＣＤＢ２２２に格納される。

【0034】

ＬＵＮ特定経路２５２は、ＳＣＳＩ管理コマンド（例えば、中断、ＬＵＮリセット）を格納するためのＴＭＩ／Ｏブロック２２３と、状態／データブロック２２４をさらに含む。ホストから受信したＴＭコマンドはＴＭＩ／Ｏブロック２２３に格納される。ターゲットから受信したターゲットの状態及び関連データは、状態／データブロック２２４に格納される。制御ＣＤＢ２２２は、特定の制御コマンドに対する状態及びデータを更新するために、状態／データブロック２２４に直接アクセスする。Ｉ／Ｏ完了のようなターゲットに対する状態／データ情報は、コネクション特定経路２５１のトランスミッタ２１１に返送される。

【0035】

図３は、本発明の一実施形態による分割されたスレッディングモデルの例を示す図である。

【0036】

ターゲットシステムは、ワークロード（ｗｏｒｋｌｏａｄ）の類型に基づいてｉＳＣＳＩ伝送プロトコルとＳＣＳＩコマンドとの間での処理のために分配された複数のＣＰＵを含む。コネクション特定スレッド（即ち、伝送プロトコルでのｉＳＣＳＩ）は、イニシエーターとＳＣＳＩターゲットとの間のｉＳＣＳＩレシーバー経路３０１及びｉＳＣＳＩトランスミッタ経路３０４を含む。コネクション特定スレッドは、コネクション単位に基づく。ＳＣＳＩコマンド発行経路３０２及びＳＣＳＩコマンド完了経路３０３は、ＬＵＮレベルで確立される。

【0037】

ターゲットシステムの複数の利用可能なＣＰＵの中で、Ｍ個のＣＰＵが、データ経路を確立し、イニシエーターとＳＣＳＩターゲットとの間のＳＣＳＩコマンドを伝送し、伝送プロトコル階層で確立されたデータ経路を完了するために割り当られる。一方、Ｎ個のＣＰＵが、ＳＣＳＩターゲットとＬＵＮとの間のＳＣＳＩコマンドを処理し、管理し、取り扱うために割り当られる。

【0038】

イニシエーターとＳＣＳＩターゲットとの間のｉＳＣＳＩプロトコルは、コネクション毎に確立されたコネクション特定スレッドを作動させ、ｉＳＣＳＩレシーバー経路３０１とｉＳＣＳＩトランスミッタ経路３０４とのシーケンスを含む。コネクション特定スレッドは１つ以上のＭ個のＣＰＵに割り当られる。

【0039】

ｉＳＩＣＳＩレシーバー経路３０１は、ＳＣＳＩコマンド発行経路３０２（即ち、ＳＣＳＩレシーバー）を含むＳＣＳＩＩ／Ｏ要請をキューイング（ｑｕｅｕｅ）する。ＳＣＳＩコマンドが完了した後、ＳＣＳＩターゲットはＳＣＳＩコマンド完了経路３０３（即ち、ＳＣＳＩトランスミッタ）をキューイングする。

【0040】

ＬＵＮ単位に基づいて確立されたＳＣＳＩコマンド発行経路３０２及びＳＣＳＩコマンド完了経路３０３は、Ｎ個のＣＰＵに割り当られる。ＳＣＳＩコマンドが完了した後、ＳＣＳＩターゲットは、イニシエーターとＳＣＳＩターゲットとの間の前に確立された伝送コネクション上のイニシエーターにＩ／Ｏ完了（例えば、ｉＳＣＳＩトランスミッタ経路３０４）をキューイングする。最後に、Ｉ／Ｏ完了は、イニシエーターとＳＣＳＩターゲットとの間のコネクション特定スレッドを確立したＣＰＵによって処理される。

【0041】

図４は、本発明の一実施形態によるスレッディングモデルの例を示す概略図である。本スレッディングモデルは、ｉＳＣＳＩレシーバー経路４０１、ｉＳＣＳＩトランスミッタ経路４０４、ＳＣＳＩコマンド発行経路４０２、及びＳＣＳＩコマンド完了経路４０３を含むデータ経路を提供する。

【0042】

Ｉ／Ｏコマンド発行経路で、ｉＳＣＳＩレシーバー経路４０１は、Ｉ／Ｏコマンド発行キュー４１０を使用してＩ／ＯコマンドをＳＣＳＩコマンド発行経路４０２に配置する。Ｉ／Ｏコマンド返送（ｒｅｔｕｒｎ）経路で、ＳＣＳＩコマンド完了経路４０３は、Ｉ／Ｏ完了キュー４１１を使用してＩ／Ｏ完了をｉＳＣＳＩトランスミッタ経路４０４に配置する。

【0043】

本実施形態で、Ｉ／Ｏコマンド発行キュー４１０及びＩ／Ｏ完了キュー４１１は、複数のコネクションからのＩ／Ｏコマンドが１つのＬＵＮに到達し、１つのコネクションからのＩ／Ｏコマンドが複数のＬＵＮに到達するＭＰＭＣ（ｍｕｌｔｉ−ｐｒｏｄｕｃｅｒａｎｄｍｕｌｔｉ−ｃｏｎｓｕｍｅｒ）ロックレス・キューである。

【0044】

本発明の一実施形態において、キューの文脈で、生産者（ｐｒｏｄｕｃｅｒ）はイニシエーターと称し、消費者（ｃｏｎｓｕｍｅｒ）はターゲットと称する。いくつかの実施形態で、生産者はターゲットと称し、消費者はイニシエーターと称する。例えば、ｉＳＣＳＩレシーバー経路４０１とｉＳＣＳＩトランスミッタ経路４０４とは生産者によって所有され、ＳＣＳＩコマンド発行経路４０２とＳＣＳＩコマンド完了経路４０３は消費者によって所有される。他の実施形態で、ＳＣＳＩコマンド発行経路４０２とＳＣＳＩコマンド完了経路４０３とは生産者によって所有され、ｉＳＣＳＩレシーバー経路４０１とｉＳＣＳＩトランスミッタ経路４０４とは消費者によって所有される。

【0045】

ＭＰＭＣキューで、生産者作業及び消費者作業は、複数のスレッドで作動する。例えば、生産者作業はｎ個のスレッドで作動し、消費者作業はｍ個のスレッドで作動する。特定の生産者スレッドを担当する複数の生産者が存在し、特定の消費者スレッドを担当する複数の消費者が存在する。

【0046】

Ｉ／Ｏ発行経路で、伝送プロトコル階層はＳＣＳＩコア階層への作業要請を生成する。この場合、伝送プロトコル階層は生産者であり、ＳＣＳＩコア階層は消費者である。一方、Ｉ／Ｏ完了経路で、ＳＣＳＩコア階層は伝送プロトコル階層への作業要請を生成する。この場合、ＳＣＳＩコア階層は生産者であり、伝送プロトコル階層は消費者である。

【0047】

コネクション単位である伝送プロトコル階層によって生成された作業要請は、複数のＬＵＮに伝達される。同様に、ＬＵＮ単位であるＳＣＳＩコア階層によって生成された作業要請は、複数のコネクションに伝達される。伝送プロトコル階層とＳＣＳＩコア階層との間の通信は一般的にロック（ｌｏｃｋ）を要求する同期点を含む。

【0048】

本発明の一実施形態によるシステムは、伝送プロトコル階層及びＳＣＳＩコア階層がロックレス方式でアクセスされるようにする。

【0049】

図５は、本発明の一実施形態によるＳＰＳＣ（ｓｉｎｇｌｅ−ｐｒｏｄｕｃｅｒｓｉｎｇｌｅ−ｃｏｎｓｕｍｅｒ）ロックレス・キューを示すブロック図である。

【0050】

ロックレス・キュー内の各ノードは、データコンテナ（ｄａｔａｃｏｎｔａｉｎｅｒ）及びポインターを含み、一連のノードがリンクされたリスト（ｌｉｎｋｅｄｌｉｓｔ）に連結される。

【0051】

本実施形態によれば、図４のＩ／Ｏコマンド発行キュー４１０及びＩ／Ｏ完了キュー４１１の各々は、図５に示すロックレス・キューを含む。ロックレス・キューは、ヘッドノード５０１及びテールノード５０３を含む。キュー内にただ１つのノードしか存在しない場合、ヘッドノード５０１とテールノード５０３とは同一である。現在ノード（ｃｕｒｒｅｎｔｎｏｄｅ）５０２は、リストの開始点を意味し、開始点から消費者はリストトラバーサル（ｌｉｓｔｔｒａｖｅｒｓａｌ）を開始し、ノードを消費する。いくつかの実施形態で、現在ノード５０２は、消費者開始又は消費者ヘッド（生産者によって所有されるヘッドノード５０１に対して）と称される。

【0052】

図５に示すリンクされたリストの各ノードは、データコンテナ５１１と、次のノードを示すポインター５１２とを含む。生産者は、新しいノード（例えば、新しいＩ／Ｏコマンドに対応するノード）を生成し、新しく生成されたノードをキューのテールノード５０３に連結して、新しいノードを示すようにテールノード５０３のポインターを更新する。このような方法で、新しいノードが既存のキューに加えられる。同様に、生産者は、消費されたノードをヘッドノード５０１から現在ノード５０２まで解放させる。

【0053】

システムリソースが利用可能である場合、生産者は、消費者によるノード消費処理から独立して、消費されたノードを解放させる。この意味で、生産者による、消費されたノードを解放するプロセスは、レイジー削除（ｌａｚｙｄｅｌｅｔｅ）と称される。ヘッドノード５０１から現在ノード５０２の前までのノードは生産者によって所有され、現在ノード５０２からテールノード５０３までのノードは消費者によって所有される。消費者は、現在ノード５０２からテールノード５０３までリストをトラバース（ｔｒａｖｅｒｓｅ）し、現在ノード５０２でアイテムを消費し、後続のノードに現在のポインターを更新する。もし現在のポインターがテールノード５０３を示す場合、消費者はノードを消費しない。

【0054】

本発明のロックレス・キューは、制御情報を保有してロックレスリストを管理する制御構造（ｃｏｎｔｒｏｌｓｔｒｕｃｔｕｒｅ）を提供する。生産者は先頭及び最後のポインターを所有する。生産者によって新しいノードがロックレスリストに加えられると、最後のポインターが更新される。生産者が消費されたノードを削除すると、先頭のポインターが更新される。消費者が現在ノード５０２からテールノード５０３までリストをトラバースするので、現在のポインターは消費者によって更新される。

【0055】

ロックレス・キューの現在のポインターの制御情報と所有権は、ロックレス・キューの制御構造を使用して生産者と消費者との間でシームレスに（ｓｅａｍｌｅｓｓｌｙ）交換されるので、本発明のロックレス・キューは、データ経路での同期点及びロックの必要性を除去し、特に、複数のセッションが同時に複数のＬＵＮをアクセスする場合、Ｉ／Ｏ性能を向上させる。

【0056】

図６は、本発明の一実施形態によるＭＰＭＣロックレス・キュー（ｍｕｌｔｉ−ｐｒｏｄｕｃｅｒｍｕｌｔｉ−ｃｏｎｓｕｍｅｒｌｏｃｋｌｅｓｓｑｕｅｕｅ）の例を示すブロック図である。ＭＰＭＣロックレス・キューは、Ｎ個のヘッドノード（ヘッド１〜ヘッドＮ）の制御アレイ６０１を含む。ここで、Ｎは生産者が作動させる予定のスレッド数である。

【0057】

生産者はＮ個のスレッドで作動させる予定であり、消費者はＭ個のスレッドで作動させる予定である。１つの生産者が複数のスレッドを作動させるので、生産者の数とスレッドの数（Ｎ）とは異なる。同様に、１つの消費者が複数のスレッドを作動させ、複数の生産者によって生産されたノードを消費できるので、消費者の数とスレッドの数（Ｍ）とは異なる。制御アレイ６０１で、生産者はノードを生成し、消費者はノードを消費する。Ｎ個のスレッドの各々に対応する制御構造はＳＰＳＣロックレス・キューを維持する。消費者はＮ個のスレッドの制御アレイ６０１を維持する。

【0058】

本実施形態において、ＭＰＭＣロックレス・キューは、スレッド識別子（ＩＤ）を利用してスレッドへの排他的なアクセスを提供する。

【0059】

例えば、所定のスレッド上で実行作動させる生産者は、対応するキュー内に新しいノードを生成する必要がある。新しいノードを追加する場合、生産者は、自分のスレッド識別子（ＩＤ）を制御アレイ６０１にインデックス（ｉｎｄｅｘ）することによって、キューに排他的にアクセスする。各々の生産者は、キューへの排他的なアクセスを獲得して新しいノードを生成するので、複数の生産者の間に競合がない。

【0060】

所定のスレッド上で作動させる消費者は、複数の生産者に属する複数のノードを消費する。同様に、各々の消費者は、制御アレイ６０１にあるキューに排他的にアクセスするので、複数の消費者の間に競合がない。

【0061】

図７は、本発明の一実施形態によるスレッディングモデルの例を示すブロック図である。本スレッディングモデルは、複数のｉＳＣＳＩコネクションスレッド７０１及び複数のＳＣＳＩＬＵＮスレッド７５１を含む。説明目的のために、ｉＳＣＳＩコネクションスレッド７０１は、３つのＣＰＵで作動し、ＳＣＳＩＬＵＮスレッド７５１は２つのＣＰＵで作動する。

【0062】

ｉＳＣＳＩコネクションスレッド７０１の各々は、ＳＣＳＩＬＵＮスレッド７５１を作動させるＣＰＵの各々に対応する２つのノード（即ち、ヘッド１ａ、ヘッド２ａ）を含む。ＳＣＳＩＬＵＮスレッド７５１の各々は、ｉＳＣＳＩコネクションスレッド７０１を作動させるＣＰＵの各々に対応する３つのノード（即ち、ヘッド１ｂ、ヘッド２ｂ、ヘッド３ｂ）を含む。本実施形態では、ｉＳＣＳＩコネクションスレッド７０１の各々をそれぞれ作動させるために割り当られた３つのＣＰＵ、及びＳＣＳＩＬＵＮスレッド７５１の各々をそれぞれ作動させるために割り当られた２つのＣＰＵを含むが、本スレッディングモデルは、本発明の技術的範囲から逸脱しない範囲内で、任意の数のｉＳＣＳＩコネクションスレッド及びＳＣＳＩＬＵＮスレッドに適用される。

【0063】

各々のｉＳＣＳＩコネクションスレッド（ＣＴ１、ＣＴ２、ＣＴ３）は、それぞれのＣＰＵ（ＣＰＵ１、ＣＰＵ２、ＣＰＵ３）に割り当られる。同様に、各々のＳＣＳＩＬＵＮスレッド（ＬＴ１、ＬＴ２）は、それぞれのＣＰＵ（ＣＰＵ４、ＣＰＵ５）に割り当られる。６個のｉＳＣＳＩコネクション（Ｃ１〜Ｃ６）は、ｉＳＣＳＩスレッド（ＣＴ１、ＣＴ２、ＣＴ３）によってサービスされる。４個のＬＵＮ（Ｌ１〜Ｌ４）は、ＳＣＳＩＬＵＮスレッド（ＬＴ１、ＬＴ２）によってサービスされる。

【0064】

生産者コネクションスレッド（例えば、ｉＳＣＳＩコネクションスレッド７０１）は、（処理される予定の）Ｉ／Ｏコマンドを、それぞれのＣＰＵ−ＩＤによってインデックスされたＬＵＮ単位のキューに直接生成する。ＳＣＳＩＬＵＮスレッド７５１は、（完了された）Ｉ／Ｏコマンドを、それぞれのＣＰＵ−ＩＤによってインデックスされるようにｉＳＣＳＩコネクションスレッド７０１によって生成されたＩ／Ｏコマンドにしたがって、コネクション単位のキューに直接生成する。

【0065】

消費者コネクションスレッド（例えば、ＳＣＳＩＬＵＮスレッド７５１）は、当該コネクションに属するＩ／Ｏコマンドを消費する。ＳＣＳＩＬＵＮスレッド７５１は、当該ＬＵＮに属するＩ／Ｏコマンドを消費する。

【0066】

ｉＳＣＳＩコネクションスレッド７０１（生産者）は、Ｉ／Ｏコマンドを個別のＳＣＳＩＬＵＮスレッド７５１（消費者）に直接発行し、ＳＣＳＩＬＵＮスレッド７５１（生産者）は、Ｉ／Ｏ完了を個別のｉＳＣＳＩコネクションスレッド７０１（消費者）に直接発行する。各々のＩ／Ｏコマンドは、特定のスレッドを作動させるプロセッサに固有のＣＰＵ−ＩＤによって識別され、それにより、独立して作動するスレッド間で同期点又はロックの必要性を除去する。

【0067】

図８は、本発明の他の実施形態によるＭＰＭＣロックレス・キューの例を示すブロック図である。Ｉ／Ｏ発行経路内で、生産者は伝送プロトコル階層であり、消費者はＳＣＳＩコア階層である。伝送プロトコルスレッド（例えば、図３のｉＳＣＳＩレシーバー経路３０１）は、Ｎ個のＣＰＵのＬＵＮアレイ８０１にアクセスする。ここで、Ｎは伝送プロトコルスレッドのために割り当られたＣＰＵの数である。

【0068】

アレイインデックスは、伝送プロトコルスレッドが作動中であるＣＰＵ番号（１〜Ｎ）を指す。アレイインデックスの各々は、ロックレスシングルリンクされたリスト（ｌｏｃｋｌｅｓｓｓｉｎｇｌｅｌｉｎｋｅｄｌｉｓｔ）を含み、このロックレスシングルリンクされたリストで、伝送プロトコルスレッドは特定のＬＵＮに発行されたＩ／Ｏコマンドの作業要請を生成する。

【0069】

ＳＣＳＩコアスレッド（例えば、図３のＳＣＳＩコマンド発行経路３０２）は、伝送プロトコルスレッドによってキューイングされる作業エントリを処理するＳＣＳＩコアＣＰＵで実行される。ＳＣＳＩコアスレッドは、対応するＳＣＳＩコアＣＰＵで作動するスレッド内にある現在ポインターを更新する。ＳＣＳＩモジュール（ＬＵＮ）は、図８に示すようなデータ構造を有し、Ｉ／Ｏ要請を生成して配置するためにｉＳＣＳＩモジュール（伝送プロトコル階層）にインターフェイスを提供する。

【0070】

図９は、本発明のさらに他の実施形態によるＭＰＭＣロックレス・キューの例を示すブロック図である。Ｉ／Ｏ完了経路内で、生産者はＳＣＳＩコア階層であり、消費者は伝送プロトコル階層である。ＬＵＮスレッド（例えば、図３のＳＣＳＩコマンド完了経路３０３）は、Ｍ個のＣＰＵのコネクション単位のアレイ９０１にアクセスする。ここで、ＭはＳＣＳＩコアスレッドのために割り当られたＣＰＵの数である。

【0071】

アレイインデックスは、ＳＣＳＩコアスレッドが作動中であるＣＰＵ番号（１〜Ｍ）を指す。アレイインデックスの各々は、ロックレスシングルリンクされたリストを含み、このロックレスシングルリンクされたリストで、ＳＣＳＩコアスレッドは特定のコネクションに対する完了されたＩ／Ｏコマンドの作業要請を生成する。

【0072】

対応するＣＰＵで実行される伝送プロトコルスレッド（例えば、図３のｉＳＣＳＩトランスミッタ経路３０４）は、すべてのＳＣＳＩコアスレッドによってキューイングされるＩ／Ｏコマンドを処理する。ｉＳＣＳＩスレッドは、対応する伝送プロトコルＣＰＵで作動するｉＳＣＳＩスレッド内にある現在のポインターを更新する。ｉＳＣＳＩモジュール（ｉＳＣＳＩコネクション）は、図９に示すようなデータ構造を有し、Ｉ／Ｏ完了を生成して配置するためにＳＣＳＩモジュール（ＳＣＳＩコア階層）にインターフェイスを提供する。

【0073】

本発明のシステム及び方法は、伝送処理とデータ（又はコア）処理とを分離する。本発明のシステム及び方法は、伝送処理及びデータ処理に内在する同期化問題を解決するＭＰＭＣ（ｍｕｌｔｉ−ｐｒｏｄｕｃｅｒ−ｍｕｌｔｉ−ｃｏｎｓｕｍｅｒ）ロックレス設計を具現する。本発明のシステム及び方法は、伝送処理とデータ処理との間のリソース（例えば、ＣＰＵ）共有を提供して、伝送階層及びコア階層の各々のリソースに対する互いに異なりかつ多様な要求に対応する。Ｉ／Ｏ書込み（ＩＯＷ）及びＣＰＵリソースの比率は、システム仕様に応じて異なる。

【0074】

本発明の一実施形態による方法は、複数のＣＰＵを含むデータストレージシステムのターゲットに格納されたデータにアクセスするコマンドを受信する段階と、複数のＣＰＵの中の第１グループのＣＰＵ上でコマンドレシーバー経路及びコマンドトランスミッタ経路を各々含む複数の伝送スレッドを実行する段階と、複数のＣＰＵの中の第２グループのＣＰＵ上でコマンド発行経路及びコマンド完了経路を各々含む複数のデータ経路スレッドを作動させる段階と、伝送スレッドのコマンドレシーバー経路を使用してＩ／Ｏコマンド発行キューにＩ／Ｏコマンドを配置し、データ経路スレッドのコマンド発行経路を使用してＩ／Ｏコマンドを処理する段階と、データ経路スレッドのコマンド完了経路を使用してＩ／Ｏ完了キューにＩ／Ｏ完了通知を配置し、伝送スレッドのコマンドトランスミッタ経路を使用してＩ／Ｏ完了通知を処理する段階と、を有し、Ｉ／Ｏコマンド発行キューは、第１キューアレイを含み、第１キューアレイの各々は、第１グループのＣＰＵのそれぞれのＣＰＵに対応し、Ｉ／Ｏ完了キューは、第２キューアレイを含み、第２キューアレイの各々は、第２グループのＣＰＵのそれぞれのＣＰＵに対応する。

【0075】

伝送スレッドは、レシーバー及びトランスミッタを含み、レシーバーはＩ／Ｏコマンドをデータ経路に伝送する。

【0076】

データ経路スレッドは、Ｉ／Ｏコマンドをターゲットに伝送し、ターゲットから状態及びデータの中の少なくとも１つを受信し、伝送スレッドのトランスミッタに状態及びデータの中の少なくとも１つを伝送する。

【0077】

第１キューアレイは、データ経路スレッドに割り当られた第２グループのＣＰＵに対応する第１の複数のノードを含む。

【0078】

第１の複数のノードはヘッダーノード、テールノード、及び第１キューアレイのキューを示す現在ノードを含み、現在ノードからテールノードまでのノードは、消費者によって所有され、第１キューアレイの残りのノードは生産者によって所有される。

【0079】

生産者はイニシエーターであり、消費者はターゲットである。

【0080】

消費者はデータ経路スレッドの各々に固有のスレッド識別子を利用してキューへの排他的なアクセスを獲得する。

【0081】

第２キューアレイは伝送スレッドに割り当られた第１グループのＣＰＵに対応する第２の複数のノードを含む。

【0082】

第２の複数のノードはヘッダーノード、テールノード、及び第２キューアレイのキューを示す現在ノードを含み、現在ノードからテールノードまでのノードは消費者によって所有され、第２キューアレイの残りのノードは生産者によって所有される。

【0083】

生産者はターゲットであり、消費者はイニシエーターである。

【0084】

消費者は、伝送スレッドの各々に固有のスレッド識別子を利用してキューへの排他的なアクセスを獲得する。

【0085】

Ｉ／Ｏコマンド発行キュー及びＩ／Ｏ完了キューの各々は、ＭＰＭＣ（ｍｕｌｔｉ−ｐｒｏｄｕｃｅｒｍｕｌｔｉ−ｃｏｎｓｕｍｅｒ）ロックレス・キューである。
１つ以上の伝送スレッドからの作業要請は、特定のデータ経路スレッドに到達し、特定の伝送スレッドからの作業要請は、１つ以上のデータ経路スレッドに到達する。同様に、１つ以上のデータ経路スレッドからの作業要請は、特定の伝送スレッドに到達し、特定のデータ経路スレッドからの作業要請は、１つ以上の伝送スレッドに到達する。

【0086】

本発明の一実施形態によるデータストレージシステムは、複数のＣＰＵと、複数のターゲットと、Ｉ／Ｏフロー、Ｉ／Ｏコマンド発行キュー、及びＩ／Ｏ完了キューを処理するソフトウェアモジュールセットを格納するメモリと、を備え、ソフトウェアモジュールセットは、複数のＣＰＵを含むデータストレージシステムのターゲットに格納されたデータにアクセスするＩ／Ｏコマンドを受信し、複数のＣＰＵの第１グループのＣＰＵの中の第１ＣＰＵ上でコマンドレシーバー経路及びコマンドトランスミッタ経路を各々含む複数の伝送スレッドを作動させ、複数のＣＰＵの第２グループのＣＰＵの中の第２ＣＰＵ上でコマンド発行経路及びコマンド完了経路を各々含む複数のデータ経路スレッドを作動させ、伝送スレッドのコマンドレシーバー経路は、Ｉ／ＯコマンドをＩ／Ｏコマンド発行キューに配置し、データ経路スレッドのコマンド発行経路は、Ｉ／Ｏコマンドを処理し、データ経路スレッドのコマンド完了経路は、Ｉ／Ｏ完了通知をＩ／Ｏ完了キューに配置し、伝送スレッドのコマンドトランスミッタ経路は、Ｉ／Ｏ完了通知を処理し、Ｉ／Ｏコマンド発行キューは、第１キューアレイを含み、第１キューアレイの各々は、第１グループのＣＰＵのそれぞれのＣＰＵに対応し、Ｉ／Ｏ完了キューは、第２キューアレイを含み、第２キューアレイの各々は、第２グループのＣＰＵのそれぞれのＣＰＵに対応する。

【0087】

伝送スレッドは、レシーバー及びトランスミッタを含み、レシーバーは、Ｉ／Ｏコマンドをデータ経路に伝送する。

【0088】

【0089】

第１キューアレイは、データ経路スレッドに割り当られた第２グループのＣＰＵに対応する第１の複数のノードを含む。

【0090】

第１の複数のノードは、ヘッダーノード、テールノード、及び第１キューアレイのキューを示す現在ノードを含み、現在ノードからテールノードまでのノードは、消費者によって所有され、第１キューアレイの残りのノードは、生産者によって所有される。

【0091】

生産者はイニシエーターであり、消費者は前ターゲットである。

【0092】

消費者は、データ経路スレッドの各々に固有のスレッド識別子を利用してキューへの排他的なアクセスを獲得する。

【0093】

第２キューアレイは、伝送スレッドに割り当られた第１グループのＣＰＵに対応する第２複数のノードを含む。

【0094】

第２の複数のノードは、ヘッダーノード、テールノード、及び第２キューアレイのキューを示す現在ノードを含み、現在のノードからテールノードまでのノードは、消費者によって所有され、第２キューアレイの残りのノードは、生産者によって所有される。

【0095】

生産者はターゲットであり、消費者はイニシエーターである。

【0096】

消費者は、伝送スレッドの各々に固有のスレッド識別子を利用してキューへの排他的なアクセスを獲得する。

【0097】

【0098】

以上、本発明による高性能なロックレススケーラブルターゲットを提供するためのシステム及び方法の多様な実施形態について説明したが。本発明は、上述の実施形態に限定されるものではなく、本発明が属する技術分野で通常の知識を有する者は、本発明の技術的範囲から逸脱しない範囲内で多様に変更実施することが可能である。

【符号の説明】

【0099】

１０１、３０１、４０１ｉＳＣＳＩレシーバー経路
１０２、３０２、４０２ＳＣＳＩコマンド発行経路
１０３、３０３，４０３ＳＣＳＩコマンド完了経路
１０４、３０４、４０４ｉＳＣＳＩトランスミッタ経路
２００データ経路
２０１レシーバー
２０２ｉＳＣＳＩコマンド
２０３データ
２０４ＳＣＳＩＩ／Ｏ（モジュール）
２０５ＴＭＩ／Ｏ（モジュール）
２１１トランスミッタ
２２１データＣＤＢ
２２２制御ＣＤＢ
２２３ＴＭＩ／Ｏ（ブロック）
２２４状態／データ（ブロック）
２５１コネクション特定経路
２５２ＬＵＮ特定経路
４１０Ｉ／Ｏコマンド発行キュー
４１１Ｉ／Ｏ完了キュー
５０１ヘッドノード
５０２現在ノード
５０３テールノード
５１１データコンテナ
５１２ポインター
６０１制御アレイ
７０１ｉＳＣＳＩコネクションスレッド
７５１ＳＣＳＩＬＵＮスレッド
８０１、９０１ＬＵＮアレイ

【図1】