特許7196052 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＫＤＤＩ株式会社の特許一覧

特許7196052情報処理装置及び情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-12-16

(45)【発行日】2022-12-26

(54)【発明の名称】情報処理装置及び情報処理方法

(51)【国際特許分類】

G06N 99/00 20190101AFI20221219BHJP

G06F 13/10 20060101ALI20221219BHJP

G06N 10/00 20220101ALI20221219BHJP

G06F 3/06 20060101ALI20221219BHJP

【ＦＩ】

G06N99/00 180

G06F13/10 340A

G06N10/00

G06F3/06 302J

【請求項の数】 7

(21)【出願番号】P 2019214131

(22)【出願日】2019-11-27

(65)【公開番号】P2021086349

(43)【公開日】2021-06-03

【審査請求日】2021-11-17

(73)【特許権者】

【識別番号】000208891

【氏名又は名称】ＫＤＤＩ株式会社

(74)【代理人】

【識別番号】100166006

【弁理士】

【氏名又は名称】泉通博

(74)【代理人】

【識別番号】100154070

【弁理士】

【氏名又は名称】久恒京範

(74)【代理人】

【識別番号】100153280

【弁理士】

【氏名又は名称】寺川賢祐

(72)【発明者】

【氏名】黒川茂莉

(72)【発明者】

【氏名】斉藤和広

【審査官】加藤優一

(56)【参考文献】

【文献】特開平０８－０８７４７３（ＪＰ，Ａ）

【文献】特表２０１９－５２６０９１（ＪＰ，Ａ）

【文献】特開２０１９－０４６０３８（ＪＰ，Ａ）

【文献】特開２０１７－０７３１０６（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

Ｇ０６Ｆ３／０６

Ｇ０６Ｆ１３／１０

Ｇ０６Ｆ１７／００－１７／１８

Ｇ０６Ｔ７／００－７／９０

Ｇ０６Ｖ１０／００－２０／９０

Ｇ０６Ｖ３０／４１８

Ｇ０６Ｖ４０／１６

(57)【特許請求の範囲】

【請求項1】

データ容量が一定である複数のデータブロックが異なるアドレスを有する複数の記憶領域に配置される分散システムにおいて、所定期間に実行された処理に伴う前記データブロックの複数の記憶領域間の伝送頻度を示す伝送履歴を特定する伝送履歴特定部と、
前記複数の記憶領域のそれぞれの記憶容量を特定する記憶容量特定部と、
前記記憶容量特定部が特定した前記複数の記憶領域のそれぞれの記憶容量を超えないように前記複数のデータブロックを前記複数の記憶領域に配置する配置組合せに対応する複数の変数を含み、前記配置組合せに対して、前記分散システムが前記所定期間に実行された処理を再実行した場合における前記伝送頻度及び前記データブロックの伝送コストに基づく前記伝送コストの総コストが最小となる変数の値の組合せを特定する最適化関数であって、量子イジングマシンが評価可能な形式である、前記変数を二値変数のみで記述した二次多項式の最適化関数を作成する作成部と、
前記作成部が作成した前記最適化関数を前記量子イジングマシンに評価させ、前記総コストを最小に近づける複数の前記変数の値の組み合わせを特定させることにより、前記総コストが最小となるように前記配置組合せを特定する配置組合せ特定部と、
を備え、
前記作成部は、前記配置組合せに対応する前記複数のデータブロックのそれぞれの伝送元の記憶領域と、伝送先の記憶領域とを特定するための、第１の二値変数群を作成するとともに、前記配置組合せに対応する前記複数の記憶領域における前記複数のデータブロックの格納数を示す第２の二値変数群を作成し、前記第１の二値変数群と、前記第２の二値変数群とを含む前記最適化関数を作成する、
情報処理装置。

【請求項2】

前記作成部は、前記伝送頻度に基づいて、前記所定期間に実行された処理において伝送が行われた伝送元と伝送先との組合せに限定して、前記第１の二値変数群を作成する、
請求項１に記載の情報処理装置。

【請求項3】

前記作成部は、前記複数のデータブロックの各々を複数の記憶領域に複製して配置することを許容し、前記組合せを特定する最適化関数であって、量子イジングマシンが評価可能な形式の最適化関数を作成する、
請求項１又は２に記載の情報処理装置。

【請求項4】

前記作成部は、前記複数のデータブロックの各々を複数の記憶領域に複製して配置するときの複製数を第１の所定数以上第２の所定数以下とするように前記組合せを特定する最適化関数であって、量子イジングマシンが評価可能な形式の最適化関数を作成する、
請求項３に記載の情報処理装置。

【請求項5】

前記伝送履歴特定部は、所定期間に実行された処理に伴う前記データブロックの複数の記憶領域間の伝送頻度と、前記データブロックの伝送コストとを示す前記伝送履歴を特定し、
前記作成部は、前記配置組合せに対して、前記分散システムが前記所定期間に実行された処理を再実行した場合における前記伝送頻度及び前記伝送履歴が示す前記伝送コストに基づく前記伝送コストの総コストが最小となる変数の値の組合せを特定する前記最適化関数を作成する、
請求項１から４のいずれか１項に記載の情報処理装置。

【請求項6】

前記配置組合せ特定部が特定した前記配置組合せに基づいて前記複数のデータブロックを前記複数の記憶領域に配置させる配置制御部をさらに備える、
請求項１から５のいずれか１項に記載の情報処理装置。

【請求項7】

コンピュータが実行する、
データ容量が一定である複数のデータブロックが異なるアドレスを有する複数の記憶領域に配置される分散システムにおいて、所定期間に実行された処理に伴う前記データブロックの複数の記憶領域間の伝送頻度を示す伝送履歴を特定するステップと、
前記複数の記憶領域のそれぞれの記憶容量を特定するステップと、
特定された前記複数の記憶領域のそれぞれの記憶容量を超えないように前記複数のデータブロックを前記複数の記憶領域に配置する配置組合せに対応する複数の変数を含み、前記配置組合せに対して、前記分散システムが前記所定期間に実行された処理を再実行した場合における前記伝送頻度及び前記データブロックの伝送コストに基づく前記伝送コストの総コストが最小となる変数の値の組合せを特定する最適化関数であって、量子イジングマシンが評価可能な形式である、前記変数を二値変数のみで記述した二次多項式の最適化関数を作成するステップと、
作成した前記最適化関数を前記量子イジングマシンに評価させ、前記総コストを最小に近づける複数の前記変数の値の組み合わせを特定させることにより、前記総コストが最小となるように前記配置組合せを特定するステップと、
を有し、
前記作成するステップにおいて、前記コンピュータは、前記配置組合せに対応する前記複数のデータブロックのそれぞれの伝送元の記憶領域と、伝送先の記憶領域とを特定するための、第１の二値変数群を作成するとともに、前記配置組合せに対応する前記複数の記憶領域における前記複数のデータブロックの格納数を示す第２の二値変数群を作成し、前記第１の二値変数群と、前記第２の二値変数群とを含む前記最適化関数を作成する、
情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、分散システムにおいて用いられる複数のデータブロックの複数の記憶領域への配置組合せを特定する情報処理装置及び情報処理方法に関する。

【背景技術】

【0002】

従来、データをブロック単位で管理し、分散配置することにより、耐障害性とデータ処理の並列性とを高める技術があった（例えば、非特許文献１、非特許文献２参照）。

【先行技術文献】

【非特許文献】

【0003】

【文献】Ghemawat, S., Gobioff, H., and Leung, S. T., The Google file system, 2003.

【0004】

【文献】Shvachko, K., Kuang, H., Radia, S., and Chansler, R., The hadoop distributed file system, In MSST, Vol.10, pp.1-10, 2010.

【発明の概要】

【発明が解決しようとする課題】

【0005】

従来の技術において、データは予め定められたルールに従って複数の記憶領域に配置されていた。これに対し、配置されるデータはそれぞれ利用頻度が異なるものであり、利用頻度が高いデータの処理の実行速度を高めることが好ましい。そこで、データの利用頻度に基づいてデータを適した記憶領域に配置することが求められている。

【0006】

そこで、本発明はこれらの点に鑑みてなされたものであり、データの利用頻度に基づいてデータの配置に適した記憶領域を特定することができる情報処理装置及び情報処理方法を提供することを目的とする。

【課題を解決するための手段】

【0007】

本発明の第１の態様に係る情報処理装置は、複数のデータブロックが異なるアドレスを有する複数の記憶領域に配置される分散システムにおいて、所定期間に実行された処理に伴う前記データブロックの複数の記憶領域間の伝送頻度を示す伝送履歴を特定する伝送履歴特定部と、前記複数の記憶領域のそれぞれの記憶容量を特定する記憶容量特定部と、前記記憶容量特定部が特定した前記複数の記憶領域のそれぞれの記憶容量を超えないように前記複数のデータブロックを前記複数の記憶領域に配置する配置組合せに対応する複数の変数を含み、前記配置組合せに対して、前記分散システムが前記所定期間に実行された処理を再実行した場合における前記伝送頻度及び前記データブロックの伝送コストに基づく前記伝送コストの総コストが最小となる変数の値の組合せを特定する最適化関数であって、量子イジングマシンが評価可能な形式の最適化関数を作成する作成部と、前記作成部が作成した前記最適化関数を前記量子イジングマシンに評価させ、前記総コストを最小に近づける複数の前記変数の値の組み合わせを特定させることにより、前記総コストが最小となるように前記配置組合せを特定する配置組合せ特定部と、を備える。

【0008】

前記作成部は、変数として二値変数のみで記述された二次多項式を前記最適化関数として作成してもよい。
前記複数のデータブロックのそれぞれのデータ容量は一定であり、前記作成部は、前記配置組合せに対応する前記複数のデータブロックのそれぞれの伝送元の記憶領域と、伝送先の記憶領域とを特定するための、第１の二値変数群を作成するとともに、前記配置組合せに対応する前記複数の記憶領域における前記複数のデータブロックの格納数を示す第２の二値変数群を作成し、前記第１の二値変数群と、前記第２の二値変数群とを含む前記最適化関数を作成してもよい。

【0009】

前記作成部は、前記伝送頻度に基づいて、前記所定期間に実行された処理において伝送が行われた伝送元と伝送先との組合せに限定して、前記第１の二値変数群を作成してもよい。
前記作成部は、前記複数のデータブロックの各々の複数の記憶領域に複製して配置することを許容し、前記組合せを特定する最適化関数であって、量子イジングマシンが評価可能な形式の最適化関数を作成してもよい。
前記作成部は、前記複数のデータブロックの各々を複数の記憶領域に複製して配置するときの複製数を第１の所定数以上第２の所定数以下とするように前記組合せを特定する最適化関数であって、量子イジングマシンが評価可能な形式の最適化関数を作成してもよい。

【0010】

前記伝送履歴特定部は、所定期間に実行された処理に伴う前記データブロックの複数の記憶領域間の伝送頻度と、前記データブロックの伝送コストとを示す前記伝送履歴を特定し、前記作成部は、前記配置組合せに対して、前記分散システムが前記所定期間に実行された処理を再実行した場合における前記伝送頻度及び前記伝送履歴が示す前記伝送コストに基づく前記伝送コストの総コストが最小となる変数の値の組合せを特定する前記最適化関数を作成してもよい。
前記情報処理装置は、前記配置組合せ特定部が特定した前記配置組合せに基づいて前記複数のデータブロックを前記複数の記憶領域に配置させる配置制御部をさらに備えてもよい。

【0011】

本発明の第２の態様に係る情報処理方法は、コンピュータが実行する、複数のデータブロックが異なるアドレスを有する複数の記憶領域に配置される分散システムにおいて、所定期間に実行された処理に伴う前記データブロックの複数の記憶領域間の伝送頻度を示す伝送履歴を特定するステップと、前記複数の記憶領域のそれぞれの記憶容量を特定するステップと、特定された前記複数の記憶領域のそれぞれの記憶容量を超えないように前記複数のデータブロックを前記複数の記憶領域に配置する配置組合せに対応する複数の変数を含み、前記配置組合せに対して、前記分散システムが前記所定期間に実行された処理を再実行した場合における前記伝送頻度及び前記データブロックの伝送コストに基づく前記伝送コストの総コストが最小となる変数の値の組合せを特定する最適化関数であって、量子イジングマシンが評価可能な形式の最適化関数を作成するステップと、作成した前記最適化関数を前記量子イジングマシンに評価させ、前記総コストを最小に近づける複数の前記変数の値の組み合わせを特定させることにより、前記総コストが最小となるように前記配置組合せを特定するステップと、を備える。

【発明の効果】

【0012】

本発明によれば、データの利用頻度に基づいてデータの配置に適した記憶領域を特定することができるという効果を奏する。

【図面の簡単な説明】

【0013】

【図1】本実施形態に係る情報処理装置の概要を説明する図である。

【図2】本実施形態に係る情報処理装置の構成を示す図である。

【図3】実行結果情報の一例を示す図である。

【図4】伝送頻度行列に対応する表を示す図である。

【図5】伝送コスト行列に対応する表を示す図である。

【図6】記憶容量情報の一例を示す図である。

【図7】配置行列に対応する表を示す図である。

【図8】第１補助変数の一例を表で示した図である。

【図9】第２補助変数の一例を表で示した図である。

【図10】量子イジングマシンにより特定されたｘ_ｉｊに対応する配置行列に対応する表を示す図である。

【図11】情報処理装置における処理の流れを示すフローチャートである。

【発明を実施するための形態】

【0014】

［情報処理装置１の概要］
図１は、本実施形態に係る情報処理装置１の概要を説明する図である。情報処理装置１は、複数のデータブロックが異なるアドレスを有する複数の記憶領域に配置される分散システムにおいて、量子イジングマシンを用いて複数のデータブロックの複数の記憶領域への最適配置を特定するためのコンピュータである。

【0015】

本実施形態において、複数の記憶領域のそれぞれは、例えば複数のサーバのそれぞれに設けられており、分散システムが複数の記憶領域のそれぞれに記憶されているデータを使用する場合、データの処理に伴う処理コストが発生するものとする。処理コストとしては、伝送コスト及びＣＰＵの使用時間等が挙げられるが、本実施形態では、伝送コストに着目して説明を行う。

【0016】

情報処理装置１は、分散システムにおいて、所定期間に実行された処理に伴うデータブロックの複数の記憶領域間の伝送頻度と、データブロックの伝送コストとの履歴を示す伝送履歴情報を取得するとともに、複数の記憶領域のそれぞれの記憶容量を示す記憶容量情報を取得することにより、伝送履歴及び記憶容量を特定する（図１の（１）、（２））。

【0017】

情報処理装置１は、複数の記憶領域のそれぞれの記憶容量を超えないように複数のデータブロックを複数の記憶領域に配置する配置組合せに対して、所定期間に実行された処理を再実行した場合における伝送コストの総コストを算出する最適化関数を作成する（図１の（３））。最適化関数は、量子イジングマシンが評価可能な形式に作成される。情報処理装置１は、作成した最適化関数を量子イジングマシンに評価させることにより伝送コストの総コストが最小となるように配置組合せを特定する（図１の（４））。その後、情報処理装置１は、特定した配置組合せに基づいて、複数のデータブロックの配置制御を行う（図１の（５））。このようにすることで、情報処理装置１は、データの利用頻度に基づいて、複数の記憶領域における複数のデータブロックの配置に関する多数の組み合わせの中から好適な配置を特定することができる。
以下、情報処理装置１の構成について説明する。

【0018】

［情報処理装置１の構成例］
図２は、本実施形態に係る情報処理装置１の構成を示す図である。情報処理装置１は、記憶部１１と、制御部１２とを備える。

【0019】

記憶部１１は、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）及びＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等である。記憶部１１は、情報処理装置１を機能させるための各種プログラムを記憶する。例えば、記憶部１１は、情報処理装置１の制御部１２を、伝送履歴特定部１２１、記憶容量特定部１２２、作成部１２３、配置組合せ特定部１２４、及び配置制御部１２５として機能させるプログラムを記憶する。なお、本プログラムは、複数のプログラムから構成されていてもよい。

【0020】

制御部１２は、例えばＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）である。制御部１２は、記憶部１１に記憶されている各種プログラムを実行することにより、情報処理装置１に係る機能を制御する。制御部１２は、記憶部１１に記憶されているプログラムを実行することにより、伝送履歴特定部１２１、記憶容量特定部１２２、作成部１２３、配置組合せ特定部１２４、及び配置制御部１２５として機能する。

【0021】

伝送履歴特定部１２１は、複数のデータブロックが異なるアドレスを有する複数の記憶領域に配置される分散システムにおいて、所定期間に実行された処理に伴うデータブロックの複数の記憶領域間の伝送頻度と、データブロックの伝送コストとを示す伝送履歴を特定する。

【0022】

例えば、分散システムは、データブロックを使用した処理を実行させるための命令文としてのクエリの実行結果情報を所定の記憶領域に記憶している。図３は、実行結果情報の一例を示す図である。図３に示すように、実行結果情報は、所定期間に実行されたクエリと、当該クエリに対して使用されたデータブロックと、当該データブロックの伝送元の記憶領域のアドレスと、当該データブロックの伝送先の記憶領域のアドレスと、伝送元の記憶領域から伝送先の記憶領域にデータブロックを伝送した時のコストである伝送コストとを関連付けた情報である。伝送コストは、データブロックが、ネットワーク、メモリ又はＣＰＵを占有する時間に基づいて定められるものとする。

【0023】

所定の記憶領域には、所定期間に実行されたクエリに対応する実行結果情報が記憶されており、伝送履歴特定部１２１は、所定の記憶領域に記憶されている実行結果情報を取得することにより、データブロックの複数の記憶領域間の伝送頻度と、データブロックの伝送コストとを特定する。具体的には、伝送履歴特定部１２１は、取得した実行結果情報に基づいて、所定期間に実行された処理に伴うデータブロックの複数の記憶領域間の伝送頻度を示す伝送頻度行列Ｆと、データブロックの伝送コストを示す伝送コスト行列Ｃとを特定する。

【0024】

伝送頻度行列Ｆは、所定期間に実行されたクエリによる各データブロックの各アドレスの記憶領域への伝送頻度を示す。図４は、伝送頻度行列Ｆに対応する表を示す図である。図４に示す表において、行方向はデータブロックのインデックス、列方向は伝送先の記憶領域のアドレス（番地）を示している。ｉ行、ｋ列に対応する要素ｆ_ｉｋは、ｉ個目のデータブロックがｋ番地の記憶領域に伝送された回数である伝送頻度を示している。例えば、伝送頻度行列Ｆの要素ｆ_１２は、データブロックＡ（１番目のデータブロック）の２番地の記憶領域への伝送頻度が５回であることを示している。

【0025】

伝送コスト行列Ｃは、伝送元の記憶領域から伝送先の記憶領域への１データブロックあたりの伝送コストを示す。図５は、伝送コスト行列Ｃに対応する表を示す図である。図５に示す表において、行方向は伝送元の記憶領域のアドレス、列方向は伝送先の記憶領域のアドレスを示している。図５に示す表において、ｊ行、ｋ列に対応する要素ｃ_ｊｋは、ｊ番地の記憶領域からｋ番地の記憶領域への１データブロックあたりの伝送コストを示している。例えば、伝送コスト行列Ｃの要素ｃ_３２は、３番地の記憶領域から２番地の記憶領域にデータブロックを伝送した時の伝送コストが２であることを示している。

【0026】

伝送コストは、１）同じ番地でのデータブロックの読み込みに伴うコスト、２）同じ番地でのデータブロックの書き込みに伴うコスト、３）異なる番地でのデータブロックの読み込みに伴うコスト、４）異なる番地でのデータブロックの書き込みに伴うコストに分けて管理しても構わない。さらに、伝送頻度も１）～４）に対応する頻度を管理しても構わない。以降、説明を簡単にするため、これらを分けずに評価する。

【0027】

記憶容量特定部１２２は、複数の記憶領域のそれぞれの記憶容量を特定する。例えば、分散システムは、複数の記憶領域のそれぞれのアドレスと記憶容量とを関連付けた記憶容量情報を所定の記憶領域に記憶している。記憶容量特定部１２２は、所定の記憶領域に記憶されている記憶容量情報を取得することにより、複数の記憶領域のそれぞれの記憶容量を特定する。図６は、記憶容量情報の一例を示す図である。本実施形態では、記憶容量を、記憶領域に記憶可能なデータブロックの数で示している。図６に示すように、例えば、３番地の記憶領域の記憶容量は２であり、二つのデータブロックを記憶できることを示している。

【0028】

作成部１２３は、複数のデータブロックを複数の記憶領域に配置する配置組合せに対応する複数の変数を含み、配置組合せに対して、分散システムが所定期間に実行した処理を再実行した場合における伝送頻度行列Ｆが示す伝送頻度及び伝送コスト行列Ｃが示す伝送コストに基づく伝送コストの総コストが最小となる変数の値の組合せを特定する最適化関数を作成する。作成部１２３は、記憶容量特定部１２２が特定した複数の記憶領域のそれぞれの記憶容量を超えないように複数のデータブロックを複数の記憶領域に配置する配置組合せに対応する複数の変数を含む最適化関数を作成する。以下、作成部１２３による最適化関数の作成について詳細を説明する。

【0029】

まず、作成部１２３は、ｉ番目のデータブロックを、ｊ番地の記憶領域に配置するか否かを示す二値変数ｘ_ｉｊを定義し、複数のデータブロックのそれぞれを、ｊ番地の記憶領域に配置するか否かを示す配置行列Ｘを作成する。ｘ_ｉｊは、以下の式（１）で示される。

【数1】

【0030】

量子イジングマシンにおいて、最適化する変数であるスピンｓ_ｉｊは、＋１又は－１のいずれかをとる変数であるが、スピンｓ_ｉｊは、以下に示す式（２）のように１，０のいずれかをとる二値変数ｘ_ｉｊに変換することができる。したがって、二値変数ｘ_ｉｊを、量子イジングマシンにおいて最適化する変数とすることができる。

【数2】

【0031】

配置行列Ｘは、二値変数ｘ_ｉｊの集合｛ｘ_ｉｊ｝であることから、Ｘ＝｛ｘ_ｉｊ｝とも表現する。図７は、配置行列Ｘに対応する表を示す図である。図７に示すように、配置行列Ｘの要素である二値変数ｘ_ｉｊは、１か０のいずれかであることが確認できる。

【0032】

複数のデータブロックの各記憶領域への最適配置は、以下の式（３）、（４）により示される最適化問題を解くことにより特定される。

【数3】

【0033】

式（３）は、配置行列Ｘに基づいて所定期間に実行された処理を再実行した場合における、伝送頻度及び伝送コストに基づく総コストが最小となる配置行列Ｘを求める目的関数を示す。Ｃ_ｉｋ（Ｘ）は、ｉ番目のブロックを伝送先の記憶領域（ｋ番地の記憶領域）に伝送する伝送コストの総和を示している。

【0034】

式（４）は、各記憶領域に格納されるデータブロックの数がストレージ容量以下となることを示す制約条件を示している。式（３）に示す目的関数と式（４）が示す制約条件とを組み合わせることにより、伝送コストの総和が最小となる配置行列Ｘを求める最適化問題となる。

【0035】

さらに、複数のデータブロックのそれぞれについて、一つのデータブロックを複数の記憶領域に複製して配置することを許容し、データブロックの複製数を所定数ｒとする制約をかけてもよい。この場合、複数のデータブロックの各記憶領域への最適配置は、以下の式（３）、（４）、（５）により示される最適化問題を解くことにより特定される。

【数4】

【0036】

［二値変数の作成］
量子イジングマシンでは、全ての変数を、１と０とのいずれかをとる二値変数とする必要がある。作成部１２３は、式（３）、式（４）が示す最適化問題において、多数の値をとる部分について、二値変数で表現した、量子イジングマシンが評価可能な形式の最適化関数を作成する。

【0037】

［式（３）に関する二値変数の作成］
まず、作成部１２３は、式（３）に関する二値変数を定める。式（３）のＣ_ｉｋ（Ｘ）は、ｋ番地の記憶領域にｉ番目のデータブロックを伝送するときの伝送コストを示しているが、伝送元の記憶領域として複数の記憶領域を取り得る（多数の値をとる）。これに対し、作成部１２３は、配置組合せに対応する複数のデータブロックのそれぞれの伝送元の記憶領域と、伝送先の記憶領域とを特定するための第１の二値変数群としての第１補助変数ｖ_ｉｊｋを作成する。第１補助変数ｖ_ｉｊｋは、ｉ番目のブロックをｋ番地の記憶領域に伝送する場合における伝送元の記憶領域として、ｊ番地の記憶領域を用いる場合に１となり、ｊ番地の記憶領域を用いない場合に０となる変数である。

【0038】

図８は、第１補助変数の一例を表で示した図である。図８において、各要素には、括弧外の値と、括弧内の値とが示されている。括弧外の値は、第１補助変数ｖ_ｉｊｋの値を示している。括弧内の値は、配置行列Ｘの要素ｘ_ｉｊの値を示している。図８において、例えば、（ｉ，ｋ）が（２，３）であり、ｊが３である場合、１（１）と示されている。これは、３番地（ｋ＝３）の記憶領域に２番目（ｉ＝２）のデータブロックを伝送する場合の伝送元の記憶領域として、３番地（ｊ＝３）の記憶領域を用いることを示しているとともに、２番目（ｉ＝２）のデータブロックが３番目（ｊ＝３）の記憶領域に存在していることを示している。

【0039】

ここで、伝送頻度ｆ_ｉｋ、配置行列の要素ｘ_ｉｊ、第１補助変数ｖ_ｉｊｋは、以下の式（６）を満たしている必要がある。

【数5】

【0040】

式（６）において、ｆ_ｉｋ＞０という条件は、第１補助変数ｖ_ｉｊｋの数を節約するために設けられている。ｆ_ｉｋ＝０は、所定時間内に実行された処理により、ｉ番目のデータブロックがｋ番地の記憶領域に伝送されなかったことを示しており、ｆ_ｉｋ＝０に対応する第１補助変数ｖ_ｉｊｋについては、伝送コストを考慮する必要がない。このため、作成部１２３は、伝送頻度ｆ_ｉｋに基づいて、所定期間に実行された処理において伝送が行われた伝送元の記憶領域と伝送先の記憶領域との組合せに限定して、第１補助変数ｖ_ｉｊｋを作成する。図８に示す例では、第１補助変数ｖ_ｉｊｋが、図４に示すｆ_ｉｋ＞０に対応する第１補助変数ｖ_ｉｊｋに限定されていることが確認できる。

【0041】

このようにすることで、ｆ_ｉｋ＝０に対応する第１補助変数ｖ_ｉｊｋを作成しないことにより、第１補助変数ｖ_ｉｊｋの数を抑制することができる。量子イジングマシンにおいて扱える量子ビット数には制限があるところ、第１補助変数ｖ_ｉｊｋの数を抑制することで、第１補助変数ｖ_ｉｊｋの数がイジングマシンにおいて扱える量子ビット数を超え、イジングマシンにおいて処理が実行不能になることを抑制することができる。

【0042】

また、式（６）において、ｋ番地の記憶領域に伝送されたｉ番目のデータブロックについて、Σ_ｊｖ_ｉｊｋ＝１は、伝送元の記憶領域（ｊ番地の記憶領域）が、伝送先の記憶領域（ｋ番地の記憶領域）に対して一つに定まっている必要があることを示している。また、Σ_ｊｘ_ｉｊｖ_ｉｊｋ＝１は、伝送元の記憶領域（ｊ番地の記憶領域）にｉ番目のデータブロックが存在することを示している。図８に示す例において、例えば、（ｉ，ｋ）が（２，３）の行に着目すると、伝送元の記憶領域（ｊ番地の記憶領域）が、伝送先の記憶領域（ｋ＝３の記憶領域）に対し、３番地の記憶領域（ｊ＝３）に定まっているとともに、伝送元の記憶領域（３番地の記憶領域）に２番目のデータブロックが存在することが確認できる。

【0043】

第１補助変数ｖ_ｉｊｋを用いることにより、式（３）内のＣ_ｉｋ（Ｘ）は、以下の式（７）で表すことができる。

【数6】

【0044】

上述したように、ｃ_ｊｋは、伝送元の記憶領域（ｊ番地の記憶領域）から伝送先の記憶領域（ｋ番地の記憶領域）に一つのデータブロックを伝送する場合の伝送コストを示し、伝送頻度ｆ_ｉｋは、ｉ番目のブロックが伝送先の記憶領域（ｋ番地の記憶領域）に伝送される伝送頻度を示している。ここで、ｃ_ｊｋｆ_ｉｋには、要素ｊが含まれているため、図８に示す第１補助変数ｖ_ｉｊｋのように、ｊを一つに定めておき、ｖ_ｉｊｋとｃ_ｊｋｆ_ｉｋとを乗算することにより、Ｃ_ｉｋ（Ｘ）は、所定期間内に実行された全ての処理を再実行した場合における伝送コストの総コストとなる。

【0045】

また、第１補助変数ｖ_ｉｊｋは、配置行列Ｘの要素ｘ_ｉｊの制約を受けていることから、配置行列Ｘに関する関数であるといえる。式（７）により、式（１）は以下の式（８）で表すことができる。式（８）において、Ｖは、第１補助変数ｖ_ｉｊｋの集合｛ｖ_ｉｊｋ｝を示している。

【数7】

【0046】

［式（４）に関する二値変数の作成］
続いて、作成部１２３は、式（４）に関する二値変数を定める。式（４）のΣ_ｉｘ_ｉｊは、伝送元の複数の記憶領域のそれぞれに配置されるデータブロックの数を示しており、多数の正整数値を取り得る。これに対し、作成部１２３は、複数の記憶領域のそれぞれにおけるデータブロックの格納数を示す第２の二値変数群としての第２補助変数ｙ_ｊｍを作成する。第２補助変数ｙ_ｊｍは、記憶領域のそれぞれに対して記憶容量特定部１２２が特定した記憶容量以下の各正整数値（１≦ｍ≦ｔ_ｊ）に対して、以下の式（９）に示すように作成される。

【数8】

【0047】

図９は、第２補助変数ｙ_ｊｍの一例を表で示した図である。図９において、例えば、３行（ｊ＝３）の値は、３番地の記憶領域に配置されるデータブロックの数が１であることを示している。

【0048】

第２補助変数ｙ_ｊｍにより、式（４）は、以下に示す式（１０）に変換できる。

【数9】

【0049】

式（１０）は、各記憶領域に配置されるデータブロックの記憶容量の総和（データブロックの数）を示しているとともに、各記憶領域に配置されるデータブロックの記憶容量の総和が、各記憶領域の記憶容量以下となることを示している。なお、第２補助変数ｙ_ｊｍの集合｛ｙ_ｊｍ｝をＹとする。

【0050】

［最適化関数の作成］
続いて、作成部１２３は、第１補助変数ｖ_ｉｊｋ及び第２補助変数ｙ_ｊｍを含み、量子イジングマシンが解ける最適化関数Ｈを作成する。最適化関数Ｈの形式は、ＱＵＢＯ（ＱｕａｄｒａｔｉｃＵｎｃｏｎｓｔｒａｉｎｅｄＢｉｎａｒｙＯｐｔｉｍｉｚａｔｉｏｎ）と呼ばれ、二値変数のみで記述した制約なし二次多項式である。

【0051】

最適化関数Ｈは、例えば、式（５）、（６）、（７）、（１０）を組み合わせて、以下の式（１１）で示される。

【数10】

【0052】

式（７）は、Ｖの最適化の式であるが、式（６）、（１０）は、Ｘ、Ｙ、Ｖを含むため、Ｘ、Ｙ、Ｖが変化する変数群となる。したがって、最適化関数Ｈでは、これらの変数群Ｘ、Ｙ、Ｖについて最適化を行う。

【0053】

式（１１）の右辺における第４項、第５項は、式（６）、（１０）の制約式に対応した制約項である。式（６）、（１０）は、第１補助変数ｖ_ｉｊｋ及び第２補助変数ｙ_ｊｍの制約式であるところ、最適化関数では、これらの制約式について、（左辺－右辺）を二乗した形式とし、これの最小化を求める制約項を設け、最適化関数Ｈの解において、（左辺－右辺）＝０、すなわち、左辺＝右辺となり、制約式が示す制約が満たされるようにしている。同様に、第６項も、式（５）の制約式に対応した制約項であり、（左辺－右辺）を二乗した形式としている。第２項は、式（６）の制約式のΣ_ｊｖ_ｉｊｋ＝１に対応した制約項であり、第２項は（左辺－右辺）を二乗した形としている。一方、第３項は、式（５）の制約式のΣ_ｊｘ_ｉｊｖ_ｉｊｋ＝１に対応した制約項であるが、第２項＝０が満たされれば、（１－Σ_ｊｘ_ｉｊｖ_ｉｊｋ）は負の値になることはなく、また、これを二乗すると４次式となってしまうため、二乗しない。ここで、式（１１）におけるλ_０～λ_４は、制約項の係数であり、より強く満たすべき制約項を設定することができる。

【0054】

なお、式（１１）において、第３項及び第４項について、λ_２Σ_ｊ（Σ_ｉｘ_ｉｊ－Σ_{ｍ：１≦ｍ≦ｔｊ}ｙ_ｉｍ）と変換しても、同様の効果があることが知られている（この場合は、補助変数は式（９）とは異なる値をとるが、第３項及び第４項と同じ制約を満たすように制約する効果は維持される）。そこで、作成部１２３は、式（１１）に替えて、式（１２）を作成してもよい。このようにすることで、制約項の係数を少なくすることができるので、各制約項の係数を調整することが容易になる。

【数11】

【0055】

なお、上述の説明では、データブロックのデータ容量が一定であることとして説明したが、複数のデータブロックのそれぞれがｗ_ｉである場合には、作成部１２３は、以下の式（１３）を作成してもよい。式（１３）において、ｔ_ｊは、配置可能な最大のデータブロック数ではなく、データサイズを示し、ｃ_ｊｋは、単位データサイズ当たりの伝送コストを示すものとする。

【0056】

【数12】

【0057】

なお、上述の説明では、データブロックの複製数を所定数ｒとして説明したが、データブロックの複製数を第１の所定数以上第２の所定数以下としてもよい。例えば、複製数を１以上２以下とする場合は、式（１１）～（１３）の最終項を式（１４）のように変えればよい。

【数13】

【0058】

また、複製数を１以上３以下とする場合は、各データブロックの複製数を示す補助変数ｚ_ｉｌを導入し、式（１１）～（１３）の最終項を式（１５）のように変えればよい。考え方は、式（１２）における変形と同様である。

【数14】

【0059】

配置組合せ特定部１２４は、作成部１２３が作成した最適化関数を量子イジングマシンに評価させて準最適解を求めさせ、量子イジングマシンに総コストを最小に近づける複数の変数の組み合わせを特定させることにより、総コストが最小となるように配置組合せを特定する。図１０は、量子イジングマシンにより特定されたｘ_ｉｊに対応する配置行列Ｘに対応する表を示す図である。図１０に示されるように、各記憶領域の記憶容量よりも小さい範囲で各記憶領域にデータブロックが配置されることが確認できる。

【0060】

配置制御部１２５は、配置組合せ特定部１２４が特定した配置組合せに基づいて複数のデータブロックを複数の記憶領域に配置させる。これにより、データブロックの記憶領域への配置の最適化が行われる。例えば、配置制御部１２５は、最適化前の配置行列と、配置組合せ特定部１２４が特定した配置行列との差分に基づいて、各データブロックの配置を行う。

【0061】

配置制御部１２５は、データ処理に伴うデータ伝送時に、データの再配置を行うようにしてもよい。例えば、ｉ番目のデータブロックがｊ番地の記憶領域に配置されており、配置組合せ特定部１２４が特定した当該データブロックの配置先の記憶領域がｋ番地の記憶領域である場合、配置制御部１２５は、分散システムが当該データブロックをｋ番地に伝送する処理を実行する際に、データの再配置を行うようにしてもよい。また、配置制御部１２５は、分散システムの管理者が設定した時刻に、一斉に複数のデータブロックのそれぞれの再配置を行うようにしてもよい。

【0062】

［情報処理装置１における処理の流れ］
続いて、情報処理装置１における処理の流れの一例について説明する。図１１は、情報処理装置１における処理の流れを示すフローチャートである。
まず、伝送履歴特定部１２１は、所定期間に実行された処理に伴うデータブロックの複数の記憶領域間の伝送頻度と、データブロックの伝送コストとを示す伝送履歴を特定する（Ｓ１）。
続いて、記憶容量特定部１２２は、複数の記憶領域のそれぞれの記憶容量を特定する（Ｓ２）。

【0063】

続いて、作成部１２３は、複数のデータブロックを複数の記憶領域に配置する配置組合せを特定するための最適化関数を作成する（Ｓ３）。
続いて、配置組合せ特定部１２４は、Ｓ３において作成された最適化関数を量子イジングマシンに評価させ、伝送コストの総コストが最小となるように配置組合せを特定する（Ｓ４）。
配置制御部１２５は、配置組合せ特定部１２４が特定した配置組合せに基づいて複数のデータブロックを複数の記憶領域に配置させる（Ｓ５）。

【0064】

［本実施形態における効果］
以上の通り、本実施形態に係る情報処理装置１は、複数の記憶領域のそれぞれの記憶容量を超えないように複数のデータブロックを複数の記憶領域に配置する配置組合せに対応する複数の変数を含み、当該配置組合せに対して、分散システムが所定期間に実行された処理を再実行した場合における伝送頻度及び伝送コストに基づく伝送コストの総コストが最小となる変数の値の組合せを特定する最適化関数であって、量子イジングマシンが評価可能な形式の最適化関数を作成する。そして、情報処理装置１は、作成した最適化関数を量子イジングマシンに評価させ、総コストを最小に近づける複数の変数の値の組み合わせを特定させることにより、総コストが最小となるように配置組合せを特定する。このようにすることで、情報処理装置１は、データの利用頻度に基づいてデータの配置に適した記憶領域を特定することができる。

【0065】

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。

【0066】

例えば、上述の実施形態では、伝送コストは、伝送履歴特定部１２１が特定した伝送履歴に基づいて特定されることとしたが、これに限らない。情報処理装置１は、利用者から伝送コストを示す情報の入力を受け付けることにより、伝送コストを特定してもよい。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。

【符号の説明】

【0067】

１・・・情報処理装置、１１・・・記憶部、１２・・・制御部、１２１・・・伝送履歴特定部、１２２・・・記憶容量特定部、１２３・・・作成部、１２４・・・配置組合せ特定部、１２５・・・配置制御部

【図1】