特開2024-131004 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝メモリ株式会社の特許一覧

特開2024-131004クエリ処理の実行方式を最適化する方法及びデータベースシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024131004

(43)【公開日】2024-09-30

(54)【発明の名称】クエリ処理の実行方式を最適化する方法及びデータベースシステム

(51)【国際特許分類】

G06F 16/28 20190101AFI20240920BHJP

【ＦＩ】

G06F16/28

【審査請求】未請求

【請求項の数】20

【出願形態】ＯＬ

(21)【出願番号】P 2023041003

(22)【出願日】2023-03-15

(71)【出願人】

【識別番号】318010018

【氏名又は名称】キオクシア株式会社

(74)【代理人】

【識別番号】110000408

【氏名又は名称】弁理士法人高橋・林アンドパートナーズ

(72)【発明者】

【氏名】渡邉大毅

(72)【発明者】

【氏名】石原丈士

(72)【発明者】

【氏名】白川健治

【テーマコード（参考）】

5B175

【Ｆターム（参考）】

5B175AA02

5B175KA12

(57)【要約】

【課題】データベースシステムにおけるクエリ処理の新たな最適化方法を提供すること。
【解決手段】タスクグラフを用いてデータベースに対するクエリ処理を実行する方法であって、前記クエリ処理は、複数のタスクを含み、前記タスクグラフは、前記複数のタスクに対応する複数のノードと、前記ノードに対する入力及び出力を示すエッジと、を含む有向グラフであり、前記方法は、前記ノードの入力データ又は出力データの圧縮状態を含むプロパティを識別し、前記複数のノードの各々の処理コストを計算し、前記複数のノードに含まれる第１ノードは、出力対象に第１圧縮状態で対象データを出力し、前記複数のノードに含まれる第２ノードは、前記出力対象に前記第１圧縮状態とは異なる第２圧縮状態で前記対象データを出力することを含み、同一の前記タスクグラフには、前記第１ノード及び前記第２ノードが含まれる。
【選択図】図７

【特許請求の範囲】

【請求項1】

タスクグラフを用いてデータベースに対するクエリ処理を実行する方法であって、
前記クエリ処理は、複数のタスクを含み、
前記タスクグラフは、
前記複数のタスクに対応する複数のノードと、
前記ノードに対する入力及び出力を示すエッジと、を含む有向グラフであり、
前記方法は、
前記ノードの入力データ又は出力データの圧縮状態を含むプロパティを識別し、
前記複数のノードの各々の処理コストを計算し、
前記複数のノードに含まれる第１ノードは、出力対象に第１圧縮状態で対象データを出力し、
前記複数のノードに含まれる第２ノードは、前記出力対象に前記第１圧縮状態とは異なる第２圧縮状態で前記対象データを出力する
ことを含み、
同一の前記タスクグラフには、前記第１ノード及び前記第２ノードが含まれる、方法。

【請求項2】

前記処理コストの計算は、前記入力データ又は前記出力データの圧縮状態に基づいて行われる、請求項１に記載の方法。

【請求項3】

前記処理コストの計算は、前記複数のノードの各々に対して、対応する前記タスクに応じた処理時間を計算することを含む、請求項２に記載の方法。

【請求項4】

前記第１圧縮状態及び前記第２圧縮状態は、非圧縮状態を含む、請求項１に記載の方法。

【請求項5】

前記第１圧縮状態及び前記第２圧縮状態は、異なる圧縮方法で圧縮された複数の圧縮状態から選択された１の同一又は異なる圧縮状態を含む、請求項４に記載の方法。

【請求項6】

前記データベースは、複数の情報処理端末によって構成され、
前記複数の情報処理端末の各々は、複数の記憶装置を含み、
前記プロパティは、前記情報処理端末に係る情報及び前記記憶装置に係る情報を含む、請求項１に記載の方法。

【請求項7】

前記プロパティは、列指向のデータ圧縮フォーマットによって表される、請求項１に記載の方法。

【請求項8】

前記プロパティは、バイト指向のデータ圧縮フォーマットによって表される、請求項１に記載の方法。

【請求項9】

前記第１圧縮状態が非圧縮状態ではない場合、前記第１ノードに対して入力される入力データに含まれる付加情報に基づいて、前記出力対象において圧縮されたデータの伸張要否を判断する、請求項１に記載の方法。

【請求項10】

前記付加情報は、圧縮された前記入力データに係る情報を含むメタデータを含み、
前記メタデータは、前記入力データの最大値又は最小値を含む、請求項９に記載の方法。

【請求項11】

前記付加情報は、圧縮された前記入力データに係る情報を含むメタデータを含み、
前記メタデータは、前記入力データの和を含む、請求項９に記載の方法。

【請求項12】

前記処理コストの合計が最も小さい経路を実行経路として決定する、ことをさらに含む請求項１に記載の方法。

【請求項13】

前記決定された実行経路に基づいて前記クエリ処理を実行する、ことをさらに含む請求項１２に記載の方法。

【請求項14】

管理システムと、
ホストから受信したクエリに応じてデータベースに対するクエリ処理を実行するクエリ実行部と、を備えるデータベースシステムであって、
前記管理システムは、有向グラフを用いて前記クエリ実行部を制御し、
前記クエリ処理は、複数のタスクを含み、
前記有向グラフは、
前記複数のタスクに対応する複数のノードと、
前記ノードに対する入力及び出力を示すエッジと、を含み、
前記複数のノードは、第１ノード及び第２ノードを含み、
前記クエリ実行部は、
前記第１ノードにおいて、対象データを第１圧縮状態で出力対象に出力し、
前記第２ノードにおいて、前記対象データを前記第１圧縮状態とは異なる第２圧縮状態で前記出力対象に出力するように構成され、
前記管理システムは、
前記複数のノードの各々の処理コストを計算し、
前記処理コストに基づき、前記第１ノードを含む実行経路及び前記第２ノードを含む実行経路を含む複数の実行経路から１の実行経路を決定して実行計画を生成し、
前記実行計画に基づいて前記クエリ実行部を駆動するように構成されたデータベースシステム。

【請求項15】

前記処理コストの計算は、前記複数のノードに入力又は出力されるデータの圧縮状態に基づいて行われる、請求項１４に記載のデータベースシステム。

【請求項16】

前記処理コストの計算は、前記複数のノードの各々に対して、対応する前記タスクに応じた処理時間を計算することを含む、請求項１５に記載のデータベースシステム。

【請求項17】

前記第１圧縮状態及び前記第２圧縮状態は、非圧縮状態を含む、請求項１４に記載のデータベースシステム。

【請求項18】

前記第１圧縮状態及び前記第２圧縮状態は、異なる圧縮方法で圧縮された複数の圧縮状態から選択された１の同一又は異なる圧縮状態を含む、請求項１７に記載のデータベースシステム。

【請求項19】

前記データベースは、複数の情報処理端末によって構成され、
前記複数の情報処理端末の各々は、複数の記憶装置を含み、
前記管理システムは、前記ノードの入力データ又は出力データの圧縮状態を含むプロパティを有し、
前記プロパティは、前記情報処理端末に係る情報及び前記記憶装置に係る情報を含む、請求項１４に記載のデータベースシステム。

【請求項20】

前記プロパティは、列指向のデータ圧縮フォーマット又はバイト指向のデータ圧縮フォーマットによって表される、請求項１９に記載のデータベースシステム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示の一実施形態はデータベースに対するクエリ処理の実行方式を最適化する方法及びデータベースシステムに関する。

【背景技術】

【0002】

近年、不揮発性メモリを備えるメモリシステムが広く普及している。ソリッドステートドライブ（ＳＳＤ）を用いたメモリシステムは、データベースシステムにおける情報処理装置及びストレージとして使用されている。

【0003】

データベースシステムは、クエリ（処理要求）に応じて処理が実行される。例えば、リレーショナルデータベースではＳＱＬクエリ処理が行われる。ＳＱＬクエリ処理では、データの圧縮処理及び伸張処理を実行する位置（タイミング）、並びに圧縮されたデータを格納する装置を柔軟に変更できることが好ましい。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】米国特許第１０３４６５５１号明細書

【特許文献2】米国特許第１０２９６５２４号明細書

【特許文献3】米国特許第１１５２１１０１号明細書

【発明の概要】

【発明が解決しようとする課題】

【0005】

本開示は、データベースシステムにおけるクエリ処理の新たな最適化方法を提供することを目的とする。

【課題を解決するための手段】

【0006】

一実施形態に係る方法は、タスクグラフを用いてデータベースに対するクエリ処理を実行する方法であって、前記クエリ処理は、複数のタスクを含み、前記タスクグラフは、前記複数のタスクに対応する複数のノードと、前記ノードに対する入力及び出力を示すエッジと、を含む有向グラフであり、前記方法は、前記ノードの入力データ又は出力データの圧縮状態を含むプロパティを識別し、前記複数のノードの各々の処理コストを計算し、前記複数のノードに含まれる第１ノードは、出力対象に第１圧縮状態で対象データを出力し、前記複数のノードに含まれる第２ノードは、前記出力対象に前記第１圧縮状態とは異なる第２圧縮状態で前記対象データを出力することを含み、同一の前記タスクグラフには、前記第１ノード及び前記第２ノードが含まれる。

【0007】

一実施形態に係るデータベースシステムは、管理システムと、ホストから受信したクエリに応じて前記データベースに対するクエリ処理を実行するクエリ実行部と、を備えるデータベースシステムであって、前記管理システムは、有向グラフを用いて前記クエリ実行部を制御し、前記クエリ処理は、複数のタスクを含み、前記有向グラフは、前記複数のタスクに対応する複数のノードと、前記ノードに対する入力及び出力を示すエッジと、を含み、前記複数のノードは、第１ノード及び第２ノードを含み、前記クエリ実行部は、前記第１ノードにおいて、対象データを第１圧縮状態で出力対象に出力し、前記第２ノードにおいて、前記対象データを前記第１圧縮状態とは異なる第２圧縮状態で前記出力対象に出力するように構成され、前記管理システムは、前記複数のノードの各々の処理コストを計算し、前記処理コストに基づき、前記第１ノードを含む実行経路及び前記第２ノードを含む実行経路を含む複数の実行経路から１の実行経路を決定して実行計画を生成し、前記実行計画に基づいて前記クエリ実行部を駆動するように構成されている。

【図面の簡単な説明】

【0008】

【図1】一実施形態に係るデータベースシステムの構成を示すブロック図である。

【図2】一実施形態に係るタスクグラフを示す図である。

【図3】一実施形態に係るタスクグラフを示す図である。

【図4】一実施形態に係るタスクグラフを示す図である。

【図5】一実施形態に係る処理コストの計算方法を説明する図である。

【図6】一実施形態に係るタスクグラフを示す図である。

【図7】一実施形態に係るタスクグラフを示す図である。

【図8】一実施形態に係るデータベースシステムにおけるクエリ処理の実行方式を最適化するフローチャートである。

【図9】一実施形態に係るタスクグラフを示す図である。

【図10】一実施形態に係るタスクグラフを示す図である。

【発明を実施するための形態】

【0009】

以下、実施形態に係るデータベースシステムについて、図面を参照して具体的に説明する。以下の説明において、略同一の機能及び構成を有する構成要素に対して同一符号が付されており、重複する説明が省略される場合がある。以下に示す各実施形態は、この実施形態の技術的思想を具体化するための装置や方法を例示する。実施形態の技術思想は、構成要素の材質、形状、構造、配置等を下記のものに限定しない。実施形態の技術的思想は、特許請求の範囲に対して、種々の変更を加えたものであってもよい。

【0010】

以下の説明において、「タスクグラフ」とは、順序関係を有する複数のタスクが存在する場合に、各タスクの処理に必要なコストに関する情報を保持するとともに、当該複数のタスクの前後関係（先行後続関係）を矢印でつなぐことで、有向グラフとして表現する技術である。複数のタスクが順序関係を有するとは、例えば、タスクグラフにタスクＡ、Ｂ、Ｃが存在する場合、タスクＡ及びタスクＢを完了してからでないとタスクＣを実行することができないような関係を意味する。

【0011】

各タスクの処理内容を示す単位ブロックを「ノード」という。つまり、タスクグラフには、各々が複数のタスクの各々に対応する複数のノードが規定されている。換言すると、タスクとノードとは１対１の関係である。各ノードにおいて、タスクの処理に必要な時間や電力、サーバの使用料金などのコストを総称して「処理コスト」という。ノード間において、タスクの前後関係を示す矢印を「エッジ」という。つまり、エッジは各ノードに対する入力及び出力を示す。

【0012】

「データベース」とは、リレーショナルデータベース(ＲＤＢ)やそれ以外のデータベース(ＮｏＳＱＬ)を含む、構造化されたデータの集合のことを指す。「リレーショナルデータベース」とは、表形式の複数のデータを関連付けて使用できるように構成されたデータベースである。リレーショナルデータベースに対する操作命令はデータベース言語によって記述される。例えば、当該データベース言語として、構造化クエリ言語（ＳＱＬ）が用いられる。このＳＱＬによってデータベースが操作され、データベースに格納されたデータの追加、削除、検索（取り出し）が実行される。また「ＮｏＳＱＬ」とはリレーショナルデータベース以外の様々なデータベース、たとえばキーに対する値のセットを保持するＫｅｙ－Ｖａｌｕｅ型データベースなどであり、こうしたＮｏＳＱＬは、例えばＡｐａｃｈｅＣａｓｓａｎｄｒａにおけるＣＱＬなど、（しばしばＳＱＬとよく似ているが異なる）固有の言語を用いて操作することができる。以下の説明において、データベースに対してユーザが行いたい操作群をＳＱＬなどによって定義したものを単に「クエリ」といい、クエリに従って実行される処理を「クエリ処理」という。つまり、クエリ処理には複数のタスクが含まれている。

【0013】

「圧縮状態」とは、入力又は出力されるデータが圧縮されている状態か、圧縮されていない状態か示す情報を含む。さらに、データが圧縮された状態である場合、圧縮状態は、当該データがどのような手法で圧縮されているかを示す情報を含む。具体的には、圧縮状態は、データが辞書式圧縮によって圧縮されているか、バイト圧縮（例えば、「ｇｚｉｐ」）によって圧縮されているかといった情報を示す。つまり、圧縮状態は、異なる圧縮方法で圧縮された複数の圧縮状態から選択された１の圧縮状態であってもよい。

【0014】

「フィジカルプロパティ」又は「プロパティ」とは、あるタスクに係る処理（タスク処理）が実行された場合に、その処理の結果がどこに格納されているか、どのような圧縮状態か、を示すものである。つまり、フィジカルプロパティは、タスクグラフに含まれるタスクによって得られる処理結果に対して付与されている。例えば、リレーショナルデータベースが複数の情報処理端末（例えば、複数のサーバ）によって構成され、複数のサーバの各々が複数の記憶装置（例えば、ＳＳＤ（Solid State Drive）、ＤＲＡＭ（Dynamic Random Access Memory）、ＣＰＵ（Central Processing Unit））を含む場合、フィジカルプロパティには、対応するタスク処理の結果が格納されるサーバ及び記憶装置を特定する情報が含まれる。本実施形態では、フィジカルプロパティには、上記の情報に加えて、タスク処理の結果として格納されたデータの圧縮状態を示す情報が含まれる。上記のように、「フィジカルプロパティ」は、データフォーマットの概念を含む形式で表現される。

【0015】

［１．第１実施形態］
第１実施形態に係るデータベースシステムについて説明する。第１実施形態に係るデータベースシステム１０は、例えば、リレーショナルデータベースである。データベースシステム１０は、ホスト２０と通信を行い、ホスト２０からクエリを含むコマンドを受信し、当該クエリに応じてリレーショナルデータベースの機能を実現する。

【0016】

［１－１．データベースシステムの全体構成］
図１は、一実施形態に係るデータベースシステムの構成を示すブロック図である。図１に示すように、データベースシステム１０（DB Sys.）は、管理システム１１（Manager Sys.）及びクエリ実行部１２（Query Exe.）を含む。

【0017】

管理システム１１は、ホストインタフェース３１０（Host I/F）、タスクグラフ生成部３２０（Graph）及び実行計画決定部３３０（OPR）を含む。管理システム１１は、これらの機能部を協働させることによって、以下に説明するタスクグラフ（有向非巡回グラフ）を用いてクエリ実行部１２を制御する。なお、ホストインタフェース３１０、タスクグラフ生成部３２０及び実行計画決定部３３０の各機能部は、ハードウェア、ソフトウェアのいずれか又は両者を組み合せたものにて実現されることが可能である。また、各機能部での処理内容が、ホストインタフェース３１０、タスクグラフ生成部３２０、実行計画決定部３３０、として明確に区別されていることは必須では無い。ある処理の一部の処理が、別の機能部によって実行されてもよいし、各機能部がさらに細かい要素に分割されてもよい。

【0018】

ホストインタフェース３１０は、ホスト２０とホストインタフェース３１０との間のインタフェース規格に従った処理を実行する。ホストインタフェース３１０は、ホスト２０から受信したコマンド等を、内部バスを通じてタスクグラフ生成部３２０及び実行計画決定部３３０に送信する。ホストインタフェース３１０は、例えばクエリに従って実行された操作の結果をホスト２０に送信する。

【0019】

タスクグラフ生成部３２０は、ホスト２０から受信したクエリに基づいて、タスクグラフを生成する。例えば、タスクグラフ生成部３２０は、当該クエリを解析し、クエリに含まれる複数のタスクを特定し、当該複数のタスクの順序関係に基づいてタスクグラフを生成及び変形する。タスクグラフの生成方法及び変形方法は後で詳細に説明する。

【0020】

実行計画決定部３３０は、タスクグラフ生成部３２０によって生成されたタスクグラフと、各タスクにおける処理コストと、に基づいて、タスクグラフ上においてクエリ処理が効率良く実行される実行経路を決定する。換言すると、実行計画決定部３３０は、複数の実行経路から１の実行経路を決定して、クエリ処理の実行計画を生成し、当該実行計画に基づいてクエリ実行部１２を駆動する。上記の処理を、タスクグラフを用いたデータベースに対するクエリ処理の実行方式を最適化する処理ということができる。なお、処理コストの計算方法及びクエリ処理の実行方式を最適化する方法は後で詳細に説明する。

【0021】

上記の最適化とは、タスクグラフ上における複数の処理経路のうち、処理コストが最も小さい（例えば、処理コストの計算から導出される処理時間が最も短い）処理経路を選択することを意味してもよいが、必ずしも処理コストが最も小さい処理経路が選択されなくてもよい。例えば、処理コスト以外の事情を考慮して処理経路が選択されてもよい。具体的には、データベースシステム１０、ホスト２０又はクエリ処理を要求するユーザの都合に合わせて、処理コストが最も小さい処理経路以外の経路が選択されてもよい。

【0022】

クエリ実行部１２は、第１サーバ１００（Server 1）及び第２サーバ２００（Server 2）を含む。クエリ実行部１２は、第１サーバ１００及び第２サーバ２００を協働させることによって、ホスト２０から受信したクエリに応じた操作（クエリ処理）を実現する。

【0023】

第１サーバ１００は、データ保持用のストレージサーバである。第１サーバ１００は、ＣＰＵ１１０、ＤＲＡＭ１２０及びＳＳＤ１３０を有している。ＣＰＵ１１０は、例えばＳＲＡＭ（Static Random Access Memory）などのキャッシュメモリを備えている。以下の説明では、ＣＰＵ１１０のＳＲＡＭにデータが格納されることを、データがＣＰＵ１１０に格納されると表現する。つまり、第１サーバ１００は、データをＣＰＵ１１０、ＤＲＡＭ１２０及びＳＳＤ１３０に格納することができる。

【0024】

第２サーバ２００は、演算処理用のサーバである。第２サーバ２００は、ＣＰＵ２１０及びＤＲＡＭ２２０を有している。第２サーバ２００は、演算処理能力が高いサーバなので、ＳＳＤ等のストレージを備えていなくてよい。ＣＰＵ１１０と同様に、ＣＰＵ２１０も、例えばＳＲＡＭなどのキャッシュメモリを備えている。以下の説明では、ＣＰＵ２１０のレジスタやＳＲＡＭにデータが格納されることを、データがＣＰＵ２１０に格納されると表現する。つまり、第２サーバ２００は、データをＣＰＵ２１０及びＤＲＡＭ２２０に格納することができる。ＣＰＵ２１０はＣＰＵ１１０に比べて高速で演算処理を実行することができる。ＤＲＡＭ２２０の容量はＤＲＡＭ１２０の容量より大きい。なお、第２サーバ２００がＳＳＤを備えていてもよい。

【0025】

［１－２．タスクグラフの変形］
図２～図４を用いて、タスクグラフの生成及び変形について説明する。図２～図４は、一実施形態に係るタスクグラフを示す図である。これらの図を用いて、ホスト２０から受信したクエリに基づいて、タスクグラフ生成部３２０がタスクグラフを生成する過程を説明する。

【0026】

この例では、クエリ処理として、テーブルに記録されたデータに対してＩＤごとの和（ＳＵＭ）を計算し、その計算結果に対して特定のＩＤついて絞り込みを行う処理が例示されている。例えば、この場合のクエリは、「ＳＥＬＥＣＴＩＤ，ＳＵＭ（ＶＡＬＵＥ）ＦＲＯＭＴＡＢＬＥＧｒｏｕｐｂｙＩＤＨＡＶＩＮＧＩＤ＜１００」である。

【0027】

図２は、タスクグラフの変形を実行する前のデフォルトの処理順を示す。データベースシステム１０がホスト２０から上記のクエリを受信した場合、まず、図２に示すタスクグラフが生成される。図２では、クエリに記述された処理が記述された順に所定の１つの装置（サーバ）で実行される。図２では、各処理が第１サーバ１００上で実行される場合について説明する。

【0028】

図２に示すタスクグラフでは、まず第１サーバ１００のＳＳＤ１３０に格納されたテーブルの読み出し動作が実行される（Ｎ２０１；Read Table）。読み出されたデータは、読み出し動作の結果として、第１サーバ１００のＤＲＡＭ１２０に格納される（Ｎ２０２；TABLE）。当該データは、ＤＲＡＭ１２０からＣＰＵ１１０に転送される。

【0029】

ＣＰＵ１１０は、転送された当該データに対してＩＤごとにＳＵＭの計算を実行する（Ｎ２０３；SUM Cal.）。計算された結果は、Ｎ２０３の計算結果として、ＣＰＵ１１０に格納される（Ｎ２０４；SUM rslt）。そして、ＣＰＵ１１０は、この計算結果に対して特定のＩＤ（例えば、ＳＵＭの計算結果が１００未満のＩＤ）について絞り込み処理を実行する（Ｎ２０５；FILTER）ことで、最終結果が導出される（Ｎ２０６；RESULT）。この場合、最終結果は、ＣＰＵ１１０に格納されている。

【0030】

図２において、Ｎ２０１～Ｎ２０６の各ブロックをノードという。複数のノードのうち、矩形状のブロックで示されたノードをＡＮＤノードといい、略楕円形状のブロックで示されたノードをＯＲノードという。各ブロック間を繋ぐ矢印がエッジである。

【0031】

ＡＮＤノードは、データベースシステム１０がクエリ処理を実行する際における各処理単位を表す。例えば、ＡＮＤノードは、データの和の計算処理（SUM）、データの結合処理（JOIN）、及びデータの絞り込み処理（FILTER）を含む。図２の場合、Ｎ２０１、Ｎ２０３、Ｎ２０５がＡＮＤノードである。図２では、簡易的に各ＡＮＤノードには１のデータが入力される構成を例示したが、各ＡＮＤノードにはデータとは別に処理条件に係る情報が入力される。

【0032】

ＯＲノードは、論理的に等価な出力を行うＡＮＤノードをグループ化したものを表す。換言すると、ＯＲノードは、論理的に等価な処理によって得られた結果を表す。ＯＲノードの詳細は後述する。図２の場合、Ｎ２０２、Ｎ２０４、Ｎ２０６がＯＲノードである。

【0033】

図３は、デフォルトのタスクグラフに対してＬｏｇｉｃａｌな変形を実行した場合のタスクグラフを示す。Ｌｏｇｉｃａｌな変形とは、タスク処理の実行順序の入れ替えなどに関する変形ルールを適用したタスクグラフの変形を意味する。この場合、論理的に等価な最終結果が得られるように、各ＡＮＤノードの処理順が変更された複数の経路が導出される。

【0034】

図３に示すように、テーブルの読み出し動作の順序を変更することはできないので、図２のＮ２０１及びＮ２０２と同様に、テーブルの読み出し動作（Ｎ３０１；Read Table）及び読み出されたデータの格納（Ｎ３０２；TABLE）が実行される。一方、ＳＵＭの計算と絞り込み処理との順序を入れ替えることは可能なので、Ｎ３０２からの出力が分岐する。

【0035】

Ｎ３０３～Ｎ３０６は、図２のＮ２０３～Ｎ２０６と同じなので説明を省略する。図３では、Ｎ３０３～Ｎ３０５の経路と並列にＮ３１３～Ｎ３１５の経路が設けられている。いずれに経路であっても、Ｎ３０２でＤＲＡＭ１２０に格納されたデータは、ＤＲＡＭ１２０からＣＰＵ１１０に転送される。

【0036】

Ｎ３１３～Ｎ３１５の経路において、まずＣＰＵ１１０は当該データに対して特定のＩＤについて絞り込み処理を実行する（Ｎ３１３；FILTER）。絞り込まれたデータは、絞り込み処理の結果として、ＣＰＵ１１０に格納される（Ｎ３１４；FILTER rslt）。そして、ＣＰＵ１１０は、この絞り込み処理の結果に対して、ＩＤごとにＳＵＭの計算を実行する（Ｎ３１５；SUM Cal.）。上記の処理によって、最終結果が導出される（Ｎ３０６）。

【0037】

Ｎ３０３～Ｎ３０５の経路であっても、Ｎ３１３～Ｎ３１５の経路であっても、ＳＵＭの計算及び絞り込み処理の両方のタスク処理が実行されるため、Ｎ３０６（ＯＲノード）は論理的に等価な処理によって得られた結果である。これらの経路は論理的には等価であるが、タスクの処理順によってＣＰＵの処理速度及び処理量が異なる場合がある。したがって、これらの経路について処理コストの計算を行い、処理コストが小さい経路を選択することで、クエリ処理の実行方式を最適化することができる。

【0038】

図４は、Ｌｏｇｉｃａｌな変形が適用されたタスクグラフに対してＰｈｙｓｉｃａｌな変形を実行した場合のタスクグラフを示す。Ｐｈｙｓｉｃａｌな変形とは、タスク処理をどの情報処理装置で実行するか、タスク処理の結果として得られるデータをどの記憶装置に格納するか等に関する変形ルールを適用したタスクグラフの変形を意味する。Ｐｈｙｓｉｃａｌな変形において、タスク処理を実行する情報処理装置、及びタスク処理の結果を格納する記憶装置等の情報を表す「フィジカルプロパティ」がノードに付与されており、当該フィジカルプロパティに応じてタスクグラフがさらに展開する。この場合も、論理的に等価な最終結果が得られるように、各ＡＮＤノードの処理順が変更された複数の経路が導出される。図３に示すタスクグラフにおける両方の経路についてＰｈｙｓｉｃａｌな変形を実行した場合の経路は多岐に亘る。したがって、図４では、図３に示すタスクグラフのうちＮ３１３～Ｎ３１５の経路、かつ、最終結果が第２サーバ２００に格納される場合について例示した。

【0039】

上記のように、「フィジカルプロパティ」は、ＡＮＤノードの出力データが物理的にどのように格納されているかを定義する、当該データの属性を示す情報である。図４の場合、各タスク処理が第１サーバ１００又は第２サーバ２００で実行されるケースを考慮した複数の経路が導出される。

【0040】

図４では、フィジカルプロパティが、データが格納されているサーバ及び記憶装置のみを含む構成を例示したが、後述するように、本実施形態に係る変形が全て反映されたタスクグラフにおけるフィジカルプロパティは、上記の項目に加えてデータの圧縮状態に係る情報を含む。

【0041】

図４に示すように、テーブルの読み出し動作の順序を変更することはできないので、図２のＮ２０１及びＮ２０２及び図３のＮ３０１及びＮ３０２と同様に、テーブルの読み出し動作の実行（Ｎ４０１；Read Table）及び読み出されたデータの格納（Ｎ４０２；TABLE）が実行される。図４では、対象のノードの上に、括弧で表記されたフィジカルプロパティが付与されている。図４に示すように、例えばＮ４０２において、データは第１サーバ１００のＤＲＡＭ１２０に格納されている。

【0042】

ＤＲＡＭ１２０に格納されたデータは、第１サーバ１００で処理される場合と第２サーバ２００で処理される場合とがあるので、Ｎ４０２からの出力が分岐する。

【0043】

まず、タスクが第２サーバ２００で処理される場合について説明する。ＤＲＡＭ１２０に格納されたデータは、第２サーバ２００に転送される（Ｎ４０３；Trans. Sv2）。転送されたデータは、転送処理の結果として第２サーバ２００のＤＲＡＭ２２０に格納される（Ｎ４０４；TABLE）。当該データは、ＤＲＡＭ２２０からＣＰＵ２１０に転送される。

【0044】

図４のＮ４０５～Ｎ４０８の経路は、図３に示すＮ３０３～Ｎ３０６の経路と同じなので、説明を省略する。同様に、図４のＮ４１５～Ｎ４１７の経路は、図３に示すＮ３１３～Ｎ３１５の経路と同じなので、説明を省略する。なお、Ｎ４０６におけるＳＵＭの計算結果及びＮ４１６における絞り込み処理の結果は、いずれも第２サーバ２００のＣＰＵ２１０に格納される。

【0045】

次に、タスクが第１サーバ１００で処理される場合について説明する。この場合、ＤＲＡＭ１２０に格納されたデータは、ＣＰＵ１１０に転送される。ＣＰＵ１１０は当該データに対して特定のＩＤについて絞り込み処理を実行する（Ｎ４２３；FILTER）。絞り込まれたデータは、絞り込み処理の結果として、ＣＰＵ１１０に格納される（Ｎ４２４；FILTER rslt）。

【0046】

ＣＰＵ１１０に格納された上記データは、第２サーバ２００に転送される（Ｎ４２５；Trans. Sv2）。転送されたデータは、転送処理の結果として第２サーバ２００のＣＰＵ２１０に格納される（Ｎ４１６）。このデータ転送において、図４では第１サーバ１００のＣＰＵ１１０から第２サーバ２００のＣＰＵ２１０に直接データが転送されるように記述されているが、第１サーバ１００のＤＲＡＭ１２０及び第２サーバ２００のＤＲＡＭ２２０を介してＣＰＵ１１０からＣＰＵ２１０にデータが転送されてもよい。又は、上記のデータの転送先がＤＲＡＭ２２０であってもよい。

【0047】

Ｎ４０２から分岐した出力がＮ４０３、Ｎ４０４、Ｎ４１５、Ｎ４１６を経由する経路であっても、当該出力がＮ４２３、Ｎ４２４、Ｎ４２５、Ｎ４１６を経由する経路であっても、ＳＵＭの計算の前に絞り込み処理のタスクが実行されているため、Ｎ４１６（ＯＲノード）は論理的に等価な処理によって得られた結果である。

【0048】

上記の経路は論理的には等価であるが、タスクの処理順及びタスク処理が実行されるサーバによってＣＰＵの処理速度及び処理量が異なる場合がある。したがって、これらの経路について処理コストの計算を行い、処理コストが小さい経路を選択することで、クエリ処理の実行方式を最適化することができる。

【0049】

［１－３．処理コストの計算］
図５を用いて処理コストの計算方法の一例について説明する。図５に示すタスクグラフに記載されたノードは、図４に示すタスクグラフに記載されたノードと同じである。図５に示す処理コストの計算は、複数のノードの各々に対して、対応するタスク処理に応じた処理時間を計算することによって行われる。具体的には、図５では、読み出し対象であるテーブルに含まれる行のうち、タスク処理が実行される行数に対して、一行あたりの処理時間を乗じる方法で処理コストが計算される例を示す。図５において、各ＡＮＤノードの上に付与された「＃・・・」の文字は、各ＡＮＤノードに対応するタスク処理が実行されるサーバ及び当該タスク処理にかかる時間を示す。各ＯＲノードの上に付与された、四角の枠で囲まれた文字は、タスク処理が実行された結果として得られるデータの行数を示す。

【0050】

以下の説明において、第１サーバ１００において、一行のデータを読み出すために必要な時間は１μｓｅｃであり、一行のデータに対して絞り込みを実行するために必要な時間は３μｓｅｃであり、一行のデータに対してＳＵＭ計算を実行するために必要な時間は６μｓｅｃであるとして説明する。一方、第２サーバ２００において、一行のデータに対して絞り込みを実行するために必要な時間は１μｓｅｃであり、一行のデータに対してＳＵＭ計算を実行するために必要な時間は２μｓｅｃであるとして説明する。第１サーバ１００から第２サーバ２００に１行のデータを転送するために必要な時間は１０μｓｅｃであるとして説明する。

【0051】

第１サーバ１００のＳＳＤ１３０に格納されたテーブルに１００万行のデータが含まれている場合、Ｎ４０１におけるテーブルの読み出し動作に対する処理コストとして、１００万行に対して１μｓｅｃを乗じることによって１ｓｅｃの処理コストが計算される。つまり、Ｎ４０１において、「第１サーバ１００における１ｓｅｃ」の処理コストが算出される（#SV1_1sec）。上記の読み出し動作の結果、Ｎ４０２において、テーブルには１００万行のデータが含まれている（1M Rows）。

【0052】

上記の同様の計算方法によって各ノードについて処理コストを計算した結果が図５に示されている。Ｎ４０３において、「第１サーバ１００における１０ｓｅｃ」の処理コストが算出される（#SV1_10sec）。Ｎ４０５において、「第２サーバ２００における２ｓｅｃ」の処理コストが算出される（#SV2_2sec）。Ｎ４０７において、「第２サーバ２００における０．００１ｓｅｃ」の処理コストが算出される（#SV2_0.001sec）。Ｎ４１５において、「第２サーバ２００における１ｓｅｃ」の処理コストが算出される（#SV2_1sec）。Ｎ４１７において、「第２サーバ２００における０．２ｓｅｃ」の処理コストが算出される（#SV2_0.2sec）。Ｎ４２３において、「第１サーバ１００における３ｓｅｃ」の処理コストが算出される（#SV1_3sec）。Ｎ４２５において、「第１サーバ１００における１ｓｅｃ」の処理コストが算出される（#SV1_1sec）。なお、絞り込み処理（Ｎ４１５及びＮ４２３）が実行されることで、テーブルに含まれる行数は１００万行から１０万行に減少する。ＳＵＭの計算処理が実行されることで、テーブルに含まれる行数は１００万行から１０００行に減少する。

【0053】

図５において、左の経路（Ｎ４０５～Ｎ４０７を経由する経路）における処理コストの合計は１３．０００１ｓｅｃである。真ん中の経路（Ｎ４１５～Ｎ４１７を経由する経路）における処理コストの合計は１２．２ｓｅｃである。右の経路（Ｎ４２３～Ｎ４２５、Ｎ４１６、Ｎ４１７を経由する経路）における処理コストの合計は５．２ｓｅｃである。上記のように、各経路に対する処理コストを計算することができる。図５の例では、処理コストの合計が最も小さい右の経路を最適なクエリ処理の実行方式として決定することができる。

【0054】

図５に示すタスクグラフでは、データの圧縮状態は考慮されていないが、後述するように、タスクグラフがデータの圧縮状態に応じた経路を含む場合は、圧縮状態に基づいて各ノードにおける処理コストが計算される。

【0055】

図５では、単純にタスク処理が実行される行数に対して、一行あたりの処理時間を乗じる方法で処理コストが計算される例を示したが、処理コストの計算方法はこの方法に限定されない。例えば、上記の条件に代えて、又は上記の条件に加えて、メモリの使用量の制約を考慮して処理コストを計算してもよい。また、上記のように処理時間だけでなく、処理に係る装置の消費電力やサーバの使用料金などを同時に考慮して処理コストを計算してもよい。

【0056】

［１－４．圧縮状態を考慮したタスクグラフの変形］
図６及び図７を用いて、圧縮状態を考慮したタスクグラフの変形について説明する。図６に示すタスクグラフは、当該変形の前のタスクグラフであり、図４に記載された経路のうち、Ｎ４１５～Ｎ４１７を経由する経路及びＮ４２３～Ｎ４２５を経由する経路のみを含む。図７に示すタスクグラフは、上記の変形を適用した後のタスクグラフである。

【0057】

図６のＮ６０１～Ｎ６０４は、それぞれ図４のＮ４０１～Ｎ４０４に対応する。図６のＮ６０５～Ｎ６０７は、それぞれ図４のＮ４１５～Ｎ４１７に対応する。図６のＮ６０８は、図４のＮ４０８に対応する。図６のＮ６１３～Ｎ６１５は、それぞれ図４のＮ４２３～Ｎ４２５に対応する。上記のように、図６の各ノードは図４の各ノードと同じである。一方、図６において各ＯＲノードに付与されたフィジカルプロパティは、データが格納されているサーバ及び記憶装置に加えて、当該データの圧縮状態に係る情報を含む点において、図４に示すフィジカルプロパティと異なる。図６において、フィジカルプロパティの末尾に記載された「ＮＣ」は、データが非圧縮であることを意味する。

【0058】

図７は、図６のタスクグラフに対して圧縮状態を考慮した変形を実行した場合のタスクグラフを示す。圧縮状態を考慮した変形とは、データの読み出し動作又は書き込み動作を実行する際に、当該データの圧縮及び伸張を実行する変形と、データの転送を実行する際に、当該データの圧縮及び伸張を実行する変形とを含む。図７は、後者の変形が適用された例を示す。具体的には、圧縮状態を考慮した変形は、フィジカルプロパティにデータの圧縮状態に係る情報を追加することで、第１サーバ１００から第２サーバ２００にデータを転送する際に、非圧縮であるデータを転送してもよく、圧縮されたデータを転送してもよい、という変形ルールを適用した変形を意味する。

【0059】

図７のＮ７０１～Ｎ７０８は、それぞれ図６のＮ６０１～Ｎ６０８に対応する。図７のＮ７１３～Ｎ７１５は、それぞれ図６のＮ６１３～Ｎ６１５に対応する。Ｎ７０３及びＮ７１５における「Trans. SV2[NCPS]」は、第１サーバ１００から第２サーバ２００に非圧縮であるデータを転送することを意味する。

【0060】

図７では、上記のように圧縮状態を考慮した変形がなされた結果、第１サーバ１００から第２サーバ２００にデータを転送する処理（Ｎ７０２及びＮ７１４）からの出力が分岐している。図７に示すように、Ｎ７２３及びＮ７２４を経由する経路では、ＤＲＡＭ１２０に格納されたデータは、圧縮されて第２サーバ２００に転送される（Ｎ７２３；Trans. SV2[CPS]）。転送されたデータは、転送処理の結果として第２サーバ２００のＤＲＡＭ２２０に圧縮された状態で格納される（Ｎ７２４；TABLE）。圧縮されたデータを圧縮データといい、圧縮されていないデータ（又は、非圧縮であるデータ）を非圧縮データという場合がある。

【0061】

上記の場合、Ｎ７０３及びＮ７０４における処理コスト、及びＮ７２３及びＮ７２４における処理コストの計算は、これらのノードに対する入力データ又は出力データの圧縮状態に基づいて行われる。具体的には、第１サーバ１００のＤＲＡＭ１２０から第２サーバ２００のＤＲＡＭ２２０にデータを転送する場合、ＤＲＡＭ１２０からの出力データ又はＤＲＡＭ２２０への入力データが非圧縮であるか、又は圧縮されているかに基づいて、処理コストの計算が行われる。

【0062】

Ｎ７２４でＤＲＡＭ２２０に格納された圧縮データは、ＣＰＵ２１０に転送され、ＣＰＵ２１０において絞り込み処理が実行される（Ｎ７０５；FILTER）。Ｎ７０５の絞り込み処理を実行するために、上記の圧縮データは非圧縮データに伸張される。したがって、処理コストの計算を行う際に、Ｎ７２４からＮ７０５に延びるエッジは圧縮データの伸張に係る処理コストを含む。当該圧縮データの伸張は、ＣＰＵ２１０及びＤＲＡＭ２２０が協働することで実行される。

【0063】

Ｎ７０３を「第１ノード」といい、Ｎ７２３を「第２ノード」という場合がある。第１ノード及び第２ノードは、ともに論理的には同一のデータ、すなわちＴＡＢＬＥから読み出したデータと同じものを出力する。このデータを「対象データ」という場合がある。第１ノードの出力及び第２ノードの出力は、ともに第２サーバ２００のＤＲＡＭ２２０に送られる。この場合、これらの出力の対象であるＤＲＡＭ２２０を「出力対象」という場合がある。

【0064】

第１ノードから出力されるデータは非圧縮データであり、第２ノードから出力されるデータは圧縮データである。つまり、第１ノード及び第２ノードから出力されるデータは異なる圧縮状態である。第１ノードから出力されるデータの圧縮状態を「第１圧縮状態」といい、第２ノードから出力されるデータの圧縮状態を「第２圧縮状態」という場合がある。

【0065】

上記の場合、第１ノード（Ｎ７０３）は、出力対象（ＤＲＡＭ２２０）に第１圧縮状態（非圧縮である状態）で対象データを出力する、ということができる。同様に、第２ノード（Ｎ７２３）は、当該出力対象（ＤＲＡＭ２２０）に第２圧縮状態（圧縮された状態）で当該対象データを出力する、ということができる。なお、図７に示すように、タスクグラフは、上記の第１ノード及び第２ノードを同時に含んでいる。第１圧縮状態が圧縮された状態に対応し、第２圧縮状態が非圧縮である状態に対応してもよい。第１圧縮状態及び第２圧縮状態がともにデータが圧縮された状態を示す場合、第１圧縮状態及び第２圧縮状態は、同一の圧縮方法で圧縮された状態であってもよく、異なる圧縮方法で圧縮された状態であってもよい。上記の「タスクグラフが第１ノード及び第２ノードを同時に含む」とは、複数の変形ルールに従って変形するタスクグラフにおいて、ある変形ルールに従って変形されたタスクグラフであって、変形が終了した後の最終的なタスクグラフ（後述する図８のＳ８０５において「Ｙｅｓ」に進んだ場合のタスクグラフ）において、第１ノード及び第２ノードが含まれることを意味する。

【0066】

Ｎ７１４からの出力が分岐する点について、図７に示すように、Ｎ７３５及びＮ７３６を経由する経路では、ＣＰＵ１１０に格納されたデータ（絞り込み処理の結果）は、圧縮されて第２サーバ２００に転送される（Ｎ７３５；Trans. SV2[CPS]）。転送された当該データは、転送処理の結果として第２サーバ２００のＤＲＡＭ２２０に圧縮された状態で格納される（Ｎ７３６；FILTER rslt）。

【0067】

Ｎ７３６でＤＲＡＭ２２０に格納された圧縮データは、ＣＰＵ２１０に転送され、ＣＰＵ２１０においてＳＵＭの計算が実行される（Ｎ７０７；SUM Cal.）。Ｎ７０７の計算を実行するために、上記の圧縮データは非圧縮データに伸張される。したがって、処理コストの計算を行う際に、Ｎ７３６からＮ７０７に延びるエッジは圧縮データの伸張に係る処理コストを含む。

【0068】

上記の例では、サーバ間でデータを転送する場合に、圧縮データを転送する経路と非圧縮データを転送する経路とを生成する構成を例示したが、データを記憶装置に格納する際に圧縮データを格納する経路と非圧縮データを格納する経路とを生成してもよい。

【0069】

上記のように、本実施形態に係るタスクグラフによると、サーバ間でデータを転送する場合に、圧縮データを転送する経路と非圧縮データを転送する経路とについて処理コストを計算することができる。

【0070】

［１－５．クエリ処理の実行方式の最適化］
図８を用いてデータベースシステム１０の動作について説明する。当該動作は、ホスト２０がデータベースシステム１０に対してコマンドを発行することで開始される。データベースシステム１０は、ホスト２０から受信したコマンドに含まれるクエリを解析することで、クエリ処理の実行方式の最適化を開始する。

【0071】

まず、データベースシステム１０は、クエリによって規定された内容に従って、初期のタスクグラフを生成する（Ｓ８０１；Generating Graph）。本実施形態の場合、「ＳＥＬＥＣＴＩＤ，ＳＵＭ（ＶＡＬＵＥ）ＦＲＯＭＴＡＢＬＥＨＡＶＩＮＧＩＤ＜１００」というクエリに従って、図２に示すようなタスクグラフを生成する。

【0072】

続いて、データベースシステム１０は、タスク処理の実行順序の入れ替えに関する変形ルール（Ｌｏｇｉｃａｌな変形）を適用してタスクグラフを変形する（Ｓ８０２；Logical Change）。Ｌｏｇｉｃａｌな変形を適用することで、データベースシステム１０は、各ＡＮＤノードの処理順が変更された複数の経路を導出し、図３に示すようなタスクグラフを生成する。

【0073】

続いて、データベースシステム１０は、タスク処理をどの情報処理装置で実行するか、タスク処理の結果として得られるデータをどの記憶装置に格納するか等に関する変形ルール（Ｐｈｙｓｉｃａｌな変形）を適用してタスクグラフを変形する（Ｓ８０３；Physical Change）。Ｐｈｙｓｉｃａｌな変形を適用することで、データベースシステム１０は、各ノードに付与されたフィジカルプロパティに従って、各ＡＮＤノードの処理順が変更された複数の経路を導出し、図４に示すようなタスクグラフを生成する。

【0074】

続いて、データベースシステム１０は、サーバ間又は記憶装置間でデータを転送する際に、当該データの圧縮及び伸張を実行するか否かに関する変形ルールを適用してタスクグラフを変形する（Ｓ８０４；C/NC Change [trans. data]）。上記の変形を適用することで、データベースシステム１０は、各ノードに付与されたフィジカルプロパティに従って、分岐した複数の経路を導出し、図７に示すようなタスクグラフを生成する。

【0075】

上記のＳ８０４に係るタスクグラフの変形を適用する際に、データベースシステム１０は、各ノードに付与されたフィジカルプロパティを識別し、当該フィジカルプロパティに応じたタスクグラフの変形を行う。なお、上記のように、フィジカルプロパティは、各ノードの入力データ又は出力データの圧縮状態に係る情報を含む。

【0076】

データベースシステム１０は、Ｓ８０２～Ｓ８０４の変形を適用した後に、変形が終了したか否かの確認を行う（Ｓ８０５；Finish?）。全ての変形が終了していれば（Ｓ８０５の「Ｙｅｓ」）、データベースシステム１０は、次のステップに係る処理（Ｓ８０６）を実行する。一方、全ての変形が終了していなければ（Ｓ８０５の「Ｎｏ」）、データベースシステム１０は、再度Ｓ８０２～Ｓ８０４の変形を行う。

【0077】

Ｓ８０６では、データベースシステム１０は、タスクグラフにおける複数の経路に対して最適な実行経路の探索を行う（Ｓ８０６；Serching Pass）。具体的には、データベースシステム１０は、タスクグラフに含まれる複数のノードに対して処理コストを計算し、各ノードに対する処理コストに基づいて複数の経路の各々に対して処理コストの合計を計算する。データベースシステム１０は、例えば、処理コストの合計が最も小さい経路を、最適な実行経路として決定する。上記の条件に代えて又は上記の条件に加えて、メモリの使用量の制約及び処理に係る装置の消費電力やサーバの使用料金などのコストを同時に考慮して処理コストを計算してもよい。

【0078】

続いて、データベースシステム１０は、Ｓ８０６で決定された実行経路に基づいて、クエリ処理を実行する（Ｓ８０７；Executing Query）。データベースシステム１０は、クエリ処理を実行した結果をホスト２０に送信することで、上記のフローが終了する。

【0079】

上記のように、「フィジカルプロパティ」は、データフォーマットの概念を含む形式で表現される。当該データフォーマットの形式として、列指向のデータ圧縮フォーマット、又はバイト指向のデータ圧縮フォーマットが含まれる。列指向のデータ圧縮フォーマットは、例えば、ＡｐａｃｈｅＰａｒｑｕｅｔ又はＯＲＣである。バイト指向のデータ圧縮フォーマットは、例えば、ｇｚｉｐ又はｌｚ４である。

【0080】

以上のように、本実施形態に係るデータベースシステム１０によると、タスクグラフを用いたデータベースに対するクエリ処理の実行方式を最適化する際に、データの圧縮を行う場合とデータの圧縮を行う場合の両方の可能性を考慮したうえで当該最適化を行うことができる。

【0081】

［２．第２実施形態］
図９を用いて、第２実施形態に係るデータベースシステムについて説明する。第２実施形態に係るデータベースシステムの構成は第１実施形態に係るデータベースシステムと類似するので、共通点の説明を省略する。以下、第１実施形態に係るデータベースシステムと相違する点について主に説明する。

【0082】

［２－１．圧縮状態を考慮したタスクグラフの変形］
図９は、一実施形態に係るタスクグラフを示す図である。図９に示すタスクグラフは図７に示すタスクグラフと類似するが、図７におけるＮ７０３及びＮ７２３が統合されたＮ９０３が規定されている。同様に、図９では、図７におけるＮ７１５及びＮ７３５が統合されたＮ９１５が規定されている。図９に示すタスクグラフによって行われる処理は、図７に示すタスクグラフによって行われる処理と同じだが、両者のタスクグラフの記述方式が異なる。

【0083】

Ｎ９０３及びＮ９１５は、ともに第１サーバ１００から第２サーバ２００にデータを転送する際に、圧縮データが転送されるか又は非圧縮データが転送されるかを規定するノードである。図９の場合、Ｎ９０３及びＮ９１５の各々から分岐するエッジによって、出力されるデータが圧縮データなのか非圧縮データなのかを区別することができる。

【0084】

具体的には、Ｎ９０３からＮ９０４に延びるエッジは、非圧縮データが転送されることを意味する。一方、Ｎ９０３からＮ９２４に延びるエッジは、圧縮データが転送されることを意味する。同様に、Ｎ９１５からＮ９０６に延びるエッジは、非圧縮データが転送されることを意味する。一方、Ｎ９１５からＮ９３６に延びるエッジは、圧縮データが転送されることを意味する。

【0085】

上記のように、本実施形態では、１のノードから複数のエッジが延びている場合、経由するエッジによって圧縮データが転送されるか非圧縮データが転送されるかを規定する。つまり、タスクグラフにおいて、処理方法の分岐が、どのノードを経由するかによって表現されるのではなく、どのエッジを経由するかによって表現されてもよい。

【0086】

［３．第３実施形態］
図１０を用いて、第３実施形態に係るデータベースシステムについて説明する。第３実施形態に係るデータベースシステムの構成は第１実施形態に係るデータベースシステムと類似するので、共通点の説明を省略する。以下、第１実施形態に係るデータベースシステムと相違する点について主に説明する。

【0087】

［３－１．圧縮状態を考慮したタスクグラフの変形］
図１０は、一実施形態に係るタスクグラフを示す図である。図１０に示すタスクグラフは図７に示すタスクグラフと類似する。しかし、図７では、Ｎ７２４から延びるエッジはＮ７０５のみに接続されているのに対して、図１０では、Ｎ７２４に対応するＮ１０２４から延びるエッジは、Ｎ１００５及びＮ１０２５の２つのノードに接続されている点において、図１０に示すタスクグラフは図７に示すタスクグラフと相違する。

【0088】

図１０に示すように、Ｎ１０２４から延びるエッジは、Ｎ１００５だけでなくＮ１０２５にも接続されている。データベースシステム１０は、第２サーバ２００のＤＲＡＭ２２０に格納されたデータが圧縮データである場合に、Ｎ１０２５に対して入力されるデータに付加された付加情報に基づいて、Ｎ１０２５において圧縮されたデータを伸張する必要があるか否かを判断する。Ｎ１０２５において、データの伸張の要否を判断することができる場合、データを伸張することなく絞り込み処理を完了させることができる。

【0089】

例えば、圧縮データには、圧縮に係る情報を含むメタデータが付加されている場合がある。より具体的には、列指向のデータベースで用いられる形式であるＰａｒｑｕｅｔフォーマットでは、データを数百ＭＢ程度のｒｏｗｇｒｏｕｐと呼ばれる単位に分割したうえで、ｒｏｗｇｒｏｕｐごとに「そのｒｏｗｇｒｏｕｐ内に含まれるデータの最大値及び最小値の少なくともいずれか」がメタデータとして記録されている。

【0090】

そこで、例えば、「１００以上の値を有するデータのみを取り出す」という絞り込み処理を実行する場合、メタデータに記録されたデータの最大値が１２０であれば、上記の絞り込み処理を実行するために、圧縮されたデータを伸張する必要がある。一方で、メタデータに記録されたデータの最大値が８０であれば、対象のｒｏｗｇｒｏｕｐには有効なデータは含まれていない。したがって、このような場合、データベースシステム１０は、データを伸張することなく絞り込み処理が不要であることを判断することができる。

【0091】

上記のように、ノードに入力される付加情報に基づいて、圧縮されたデータの伸張要否を判断することで、より効率的な処理を実現することができる。

【0092】

本実施形態では、メタデータがデータの最大値及び最小値の少なくともいずれかを含む構成を例示したが、メタデータが上記データの和を含んでいてもよい。

【0093】

以上、本発明に係る実施形態について図面を参照しながら説明したが、本発明は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、本実施形態のデータベースシステムを基にして、当業者が適宜構成要素の追加、削除もしくは設計変更を行ったものも、本発明の要旨を備えている限り、本発明の範囲に含まれる。さらに、上述した各実施形態は、相互に矛盾がない限り適宜組み合わせが可能であり、各実施形態に共通する技術事項については、明示の記載がなくても各実施形態に含まれる。

【0094】

上述した各実施形態の態様によりもたらされる作用効果とは異なる他の作用効果であっても、本明細書の記載から明らかなもの、又は、当業者において容易に予測し得るものについては、当然に本発明によりもたらされるものと解される。

【符号の説明】

【0095】

１０：データベースシステム、１１：管理システム、１２：クエリ実行部、２０：ホスト、１００：第１サーバ、１１０：ＣＰＵ、１２０：ＤＲＡＭ、１３０：ＳＳＤ、２００：第２サーバ、２１０：ＣＰＵ、２２０：ＤＲＡＭ、３１０：ホストインタフェース、３２０：タスクグラフ生成部、３３０：実行計画決定部

【図1】