(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-10
(45)【発行日】2024-06-18
(54)【発明の名称】情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム
(51)【国際特許分類】
G06F 17/11 20060101AFI20240611BHJP
G06F 17/10 20060101ALI20240611BHJP
G06N 99/00 20190101ALI20240611BHJP
【FI】
G06F17/11
G06F17/10 M
G06N99/00 180
(21)【出願番号】P 2021509661
(86)(22)【出願日】2020-03-27
(86)【国際出願番号】 JP2020014164
(87)【国際公開番号】W WO2020196866
(87)【国際公開日】2020-10-01
【審査請求日】2023-03-24
(31)【優先権主張番号】P 2019064588
(32)【優先日】2019-03-28
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(73)【特許権者】
【識別番号】301063496
【氏名又は名称】東芝デジタルソリューションズ株式会社
(74)【代理人】
【識別番号】100091487
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100120031
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100118876
【氏名又は名称】鈴木 順生
(74)【代理人】
【識別番号】100202429
【氏名又は名称】石原 信人
(72)【発明者】
【氏名】鈴木 賢
(72)【発明者】
【氏名】後藤 隼人
(72)【発明者】
【氏名】辰村 光介
【審査官】坂東 博司
(56)【参考文献】
【文献】特開2017-219979(JP,A)
【文献】特開2006-350673(JP,A)
【文献】国際公開第2016/194051(WO,A1)
【文献】Elizabeth Crosson et al.,Simulated Quantum Annealing Can Be Exponentially Faster than Classical Simulated Annealing,2016 IEEE 57th Annual Symposium on Foundations of Computer Science (FOCS),米国,IEEE,2016年10月09日,714-723,[online],[令和6年5月1日検索],インターネット <URL:https://ieeexplore.ieee.org/abstract/document/8782986 >,DOI:10.1109/FOCS.2016.81, Print ISSN:0272-5428
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/11
G06F 17/10
G06N 99/00
(57)【特許請求の範囲】
【請求項1】
第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新するように構成された情報処理装置であって、
記憶部と、
前記第1変数に対応する前記第2変数を重み付け加算することによって前記第1ベクトルを更新し、
更新された前記第1ベクトルを探索済ベクトルとして前記記憶部に保存し、
前記第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する前記第2変数に加算し、複数の前記第1変数を用いて問題項を計算し、前記問題項を前記第2変数に加算し、前記記憶部より前記探索済ベクトルを読み出し、更新対象の前記第1ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算し、前記補正項を前記第2変数に加算することによって前記第2ベクトルを更新するように構成された処理回路とを備える、
情報処理装置。
【請求項2】
前記処理回路は、複数の前記探索済ベクトルのそれぞれを用いて前記距離の前記逆数を計算し、複数の前記逆数を加算することによって前記補正項を計算するように構成されている、
請求項1に記載の情報処理装置。
【請求項3】
複数の前記処理回路を備え、
それぞれの前記処理回路は、他の前記処理回路が前記記憶部に保存した前記探索済ベクトルを読み出すように構成されている、
請求項1または2に記載の情報処理装置。
【請求項4】
複数の前記処理回路は、それぞれが前記第1ベクトルおよび前記第2ベクトルの異なるペアの更新処理を実行する、複数のグループに分けられている、
請求項3に記載の情報処理装置。
【請求項5】
複数の前記処理回路を備え、
それぞれの前記処理回路は、更新した前記第1ベクトルを他の前記処理回路に転送し、前記探索済ベクトルに代わり他の前記処理回路より受信した前記第1ベクトルを使って前記補正項を計算するように構成されている、
請求項1または2に記載の情報処理装置。
【請求項6】
前記処理回路は、更新された前記第2ベクトルを第3ベクトルとして前記記憶部に保存するように構成されている、
請求項1ないし5のいずれか一項に記載の情報処理装置。
【請求項7】
前記処理回路は、前記記憶部より前記探索済ベクトルと同一のイタレーションに更新された前記第3ベクトルを読み出し、前記探索済ベクトルおよび前記第3ベクトルに基づいて目的関数の値を計算するように構成されている、
請求項6に記載の情報処理装置。
【請求項8】
前記処理回路は、前記目的関数の値に基づいて前記第1ベクトルおよび前記第2ベクトルの更新を停止するか否かを判定するように構成されている、
請求項7に記載の情報処理装置。
【請求項9】
前記処理回路は、前記目的関数の値に基づき前記記憶部に保存された複数の前記探索済ベクトルよりいずれかの前記探索済ベクトルを選択し、選択した前記探索済ベクトルの正値である前記第1変数を第1値に変換し、負値である前記第1変数を前記第1値より小さい第2値に変換することによって解ベクトルを計算するように構成されている、
請求項8に記載の情報処理装置。
【請求項10】
前記処理回路が計算する前記問題項は、イジングモデルに基づいている、
請求項1ないし9のいずれか一項に記載の情報処理装置。
【請求項11】
前記処理回路が計算する前記問題項は、多体相互作用を含んでいる、
請求項10に記載の情報処理装置。
【請求項12】
第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新するように構成された情報処理システムであって、
記憶装置と、複数の情報処理装置とを備え、
それぞれの前記情報処理装置は、第1変数に対応する前記第2変数を重み付け加算することによって前記第1ベクトルを更新し、
更新された前記第1ベクトルを探索済ベクトルとして前記記憶装置に保存し、
前記第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する前記第2変数に加算し、複数の前記第1変数を用いて問題項を計算し、前記問題項を前記第2変数に加算し、前記記憶装置より前記探索済ベクトルを読み出し、更新対象の前記第1ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算し、前記補正項を前記第2変数に加算することによって前記第2ベクトルを更新するように構成されている、
情報処理システム。
【請求項13】
前記複数の情報処理装置は、それぞれが前記第1ベクトルおよび前記第2ベクトルの異なるペアの更新処理を実行する、複数のグループに分けられている、
請求項12に記載の情報処理システム。
【請求項14】
記憶部と、複数の処理回路とを使って第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新する情報処理方法であって、
前記複数の処理回路が第1変数に対応する前記第2変数を重み付け加算することによって前記第1ベクトルを更新するステップと、
前記複数の処理回路が更新された前記第1ベクトルを探索済ベクトルとして前記記憶部に保存するステップと、
前記複数の処理回路が前記第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する前記第2変数に加算するステップと、
前記複数の処理回路が複数の前記第1変数を用いて問題項を計算し、前記問題項を前記第2変数に加算するステップと、
前記複数の処理回路が前記記憶部より前記探索済ベクトルを読み出すステップと、
前記複数の処理回路が更新対象の前記第1ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、
前記複数の処理回路が前記補正項を前記第2変数に加算するステップとを含む、
情報処理方法。
【請求項15】
記憶装置と、複数の情報処理装置とを使って第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新する情報処理方法であって、
前記複数の情報処理装置が第1変数に対応する前記第2変数を重み付け加算することによって前記第1ベクトルを更新するステップと、
前記複数の情報処理装置が更新された前記第1ベクトルを探索済ベクトルとして前記記憶装置に保存するステップと、
前記複数の情報処理装置が前記第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する前記第2変数に加算するステップと、
前記複数の情報処理装置が複数の前記第1変数を用いて問題項を計算し、前記問題項を前記第2変数に加算するステップと、
前記複数の情報処理装置が前記記憶装置より前記探索済ベクトルを読み出すステップと、
前記複数の情報処理装置が更新対象の前記第1ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、
前記複数の情報処理装置が前記補正項を前記第2変数に加算するステップとを含む、
情報処理方法。
【請求項16】
第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新するプログラムであって、
第1変数に対応する前記第2変数を重み付け加算することによって前記第1ベクトルを更新するステップと、
更新された前記第1ベクトルを探索済ベクトルとして記憶部に保存するステップと、
前記第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する前記第2変数に加算するステップと、
複数の前記第1変数を用いて問題項を計算し、前記問題項を前記第2変数に加算するステップと、
前記記憶部より前記探索済ベクトルを読み出すステップと、
更新対象の前記第1ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、
前記補正項を前記第2変数に加算するステップとをコンピュータに実行させるプログラムを格納している、
非一時的なコンピュータ可読な記憶媒体。
【請求項17】
第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新するプログラムであって、
第1変数に対応する前記第2変数を重み付け加算することによって前記第1ベクトルを更新するステップと、
更新された前記第1ベクトルを探索済ベクトルとして記憶部に保存するステップと、
前記第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する前記第2変数に加算するステップと、
複数の前記第1変数を用いて問題項を計算し、前記問題項を前記第2変数に加算するステップと、
前記記憶部より前記探索済ベクトルを読み出すステップと、
更新対象の前記第1ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、
前記補正項を前記第2変数に加算するステップとをコンピュータに実行させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムに関する。
【背景技術】
【0002】
組合せ最適化問題とは、複数の組合せの中から目的に最も適した組合せを選ぶ問題である。組合せ最適化問題は、数学的には、「目的関数」と呼ばれる、複数の離散変数を有する関数を最大化させる問題、または、当該関数を最小化させる問題に帰着される。組合せ最適化問題は、金融、物流、交通、設計、製造、生命科学など各種の分野において普遍的な問題であるが、組合せ数が問題サイズの指数関数のオーダーで増える、いわゆる「組合せ爆発」のため、必ず最適解を求めることができるとは限らない。また、最適解に近い近似解を得ることすら難しい場合が多い。
【0003】
各分野における問題を解決し、社会のイノベーションおよび科学技術の進歩を促進するために、組合せ最適化問題の解を実用的な時間内で計算する技術の開発が求められている。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【文献】H. Goto, K. Tatsumura, A. R. Dixon, Sci. Adv. 5, eaav2372 (2019).
【文献】H. Goto, Sci. Rep. 6, 21686 (2016).
【文献】土屋、西山、辻田:分岐特性を用いた組合せ最適化問題の近似解法URL:http://www.ynl.t.u-tokyo.ac.jp/project/RobotBrainCREST/publications/pdf/tsuchiya/4_01.pdf
【文献】土屋、西山、辻田:決定論的アニーリングアルゴリズムの解析URL:http://www.ynl.t.u-tokyo.ac.jp/project/RobotBrainCREST/publications/pdf/tsuchiya/4_02.pdf
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の実施形態は、組合せ最適化問題の解を実用的な時間内で計算する情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムを提供する。
【課題を解決するための手段】
【0007】
本発明の実施形態としての情報処理装置は、第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新するように構成されている。情報処理装置は、記憶部と、処理回路とを備える。前記処理回路は、前記第1変数に対応する前記第2変数を重み付け加算することによって前記第1ベクトルを更新し、更新された前記第1ベクトルを探索済ベクトルとして前記記憶部に保存し、前記第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する前記第2変数に加算し、前記第1変数間の問題項を計算し、前記問題項を前記第2変数に加算し、前記記憶部より前記探索済ベクトルを読み出し、更新対象の前記第1ベクトルと前記探索済ベクトルとの間の距離の逆数を含む補正項を計算し、前記補正項を前記第2変数に加算することによって前記第2ベクトルを更新するように構成されている。
【図面の簡単な説明】
【0008】
【
図3】管理サーバの記憶部に保存されるデータの例を示す図。
【
図5】計算サーバのストレージに保存されるデータの例を示す図。
【
図6】時間発展によってシミュレーテッド分岐アルゴリズムの解を計算する場合における処理の例を示したフローチャート。
【
図7】補正項を含むアルゴリズムを使って求解を行う場合における処理の例を示したフローチャート。
【
図8】他の計算ノードで計算された第1ベクトルを使って効率的に求解を行う場合における処理の例を示したフローチャート。
【
図9】複数の計算ノードにおいて効率的にシミュレーテッド分岐アルゴリズムで求解を行う場合における処理の例を示したフローチャート。
【
図10】複数の計算ノードにおいて効率的にシミュレーテッド分岐アルゴリズムで求解を行う場合における処理の例を示したフローチャート。
【
図11】複数の計算ノードを含む情報処理システムの例を概念的に示した図。
【
図12】各計算ノードにおける拡張ハミルトニアンの値の変化の例を概念的に示した図。
【
図13】各計算ノードにおける拡張ハミルトニアンの値の変化の例を概念的に示した図。
【
図14】各計算ノードにおける拡張ハミルトニアンの値の変化の例を概念的に示した図。
【
図15】複数の計算方法において、最適解を得られるまでに必要な計算回数を示したヒストグラム。
【
図16】マルチプロセッサ構成の例を概略的に示した図。
【
図17】GPUを使った構成の例を概略的に示した図。
【
図18】組合せ最適化問題を解くために実行される全体的な処理の例を示したフローチャート。
【発明を実施するための形態】
【0009】
以下、図面を参照しながら、本発明の実施形態について説明する。また、図面において同一の構成要素は、同じ番号を付し、説明は、適宜省略する。
【0010】
図1は、情報処理システム100の構成例を示したブロック図である。
図1の情報処理システム100は、管理サーバ1と、ネットワーク2と、計算サーバ(情報処理装置)3a~3cと、ケーブル4a~4cと、スイッチ5と、記憶装置7を備えている。また、
図1には、情報処理システム100と通信可能なクライアント端末6が示されている。管理サーバ1、計算サーバ3a~3c、クライアント端末6および記憶装置7は、ネットワーク2を介して互いにデータ通信をすることができる。例えば、計算サーバ3a~3cは、記憶装置7にデータを保存したり、記憶装置7よりデータを読み出したりすることができる。ネットワーク2は、例えば、複数のコンピュータネットワークが相互に接続されたインターネットである。ネットワーク2は、通信媒体として有線、無線、または、これらの組合せを用いることができる。また、ネットワーク2で使われる通信プロトコルの例としては、TCP/IPがあるが、通信プロトコルの種類については特に問わない。
【0011】
また、計算サーバ3a~3cは、それぞれケーブル4a~4cを介してスイッチ5に接続されている。ケーブル4a~4cおよびスイッチ5は、計算サーバ間のインターコネクトを形成している。計算サーバ3a~3cは、当該インターコネクトを介して互いにデータ通信をすることも可能である。スイッチ5は、例えば、Infinibandのスイッチである。ケーブル4a~4cは、例えば、Infinibandのケーブルである。ただし、Infinibandのスイッチ/ケーブルの代わりに、有線LANのスイッチ/ケーブルを使ってもよい。ケーブル4a~4cおよびスイッチ5で使われる通信規格および通信プロトコルについては、特に問わない。クライアント端末6の例としては、ノートPC、デスクトップPC、スマートフォン、タブレット、車載端末などが挙げられる。
【0012】
組合せ最適化問題の求解では、処理の並列化および/または処理の分散化を行うことができる。したがって、計算サーバ3a~3cおよび/または計算サーバ3a~3cのプロセッサは、計算処理の一部のステップを分担して実行してもよいし、異なる変数について同様の計算処理を並列的に実行してもよい。管理サーバ1は、例えば、ユーザによって入力された組合せ最適化問題を各計算サーバが処理可能な形式に変換し、計算サーバを制御する。そして、管理サーバ1は、各計算サーバから計算結果を取得し、集約した計算結果を組合せ最適化問題の解に変換する。こうして、ユーザは、組合せ最適化問題の解を得ることができる。組合せ最適化問題の解は、最適解と、最適解に近い近似解とを含むものとする。
【0013】
図1には、3台の計算サーバが示されている。ただし、情報処理システムに含まれる計算サーバの台数を限定するものではない。また、組合せ最適化問題の求解に使われる計算サーバの台数についても特に問わない。例えば、情報処理システムに含まれる計算サーバは1台であってもよい。また、情報処理システムに含まれる複数の計算サーバのうち、いずれかの計算サーバを使って組合せ最適化問題の求解を行ってもよい。また、情報処理システムに、数百台以上の計算サーバが含まれていてもよい。計算サーバは、データセンターに設置されたサーバであってもよいし、オフィスに設置されたデスクトップPCであってもよい。また、計算サーバは異なるロケーションに設置された複数の種類のコンピュータであってもよい。計算サーバとして使われる情報処理装置の種類については特に問わない。例えば、計算サーバは、汎用的なコンピュータであってもよいし、専用の電子回路または、これらの組合せであってもよい。
【0014】
図2は、管理サーバ1の構成例を示したブロック図である。
図2の管理サーバ1は、例えば、中央演算処理装置(CPU)とメモリとを含むコンピュータである。管理サーバ1は、プロセッサ10と、記憶部14と、通信回路15と、入力回路16と、出力回路17とを備えている。プロセッサ10、記憶部14、通信回路15、入力回路16および出力回路17は、互いにバス20を介して接続されているものとする。プロセッサ10は、内部の構成要素として、管理部11と、変換部12と、制御部13とを含んでいる。
【0015】
プロセッサ10は、演算を実行し、管理サーバ1の制御を行う電子回路である。プロセッサ10は、処理回路の一例である。プロセッサ10として、例えば、CPU、マイクロプロセッサ、ASIC、FPGA、PLDまたはこれらの組合せを用いることができる。管理部11は、ユーザのクライアント端末6を介して管理サーバ1の操作を行うためのインタフェースを提供する。管理部11が提供するインタフェースの例としては、API、CLI、ウェブページなどが挙げられる。例えば、ユーザは、管理部11を介して組合せ最適化問題の情報の入力を行ったり、計算された組合せ最適化問題の解の閲覧および/またはダウンロードを行ったりすることができる。変換部12は、組合せ最適化問題を各計算サーバが処理可能な形式に変換する。制御部13は、各計算サーバに制御指令を送信する。制御部13が各計算サーバから計算結果を取得した後、変換部12は、複数の計算結果を集約し、組合せ最適化問題の解に変換する。また、制御部13は、各計算サーバまたは各サーバ内のプロセッサが実行する処理内容を指定してもよい。
【0016】
記憶部14は、管理サーバ1のプログラム、プログラムの実行に必要なデータ、およびプログラムによって生成されたデータを含む各種のデータを記憶する。ここで、プログラムは、OSとアプリケーションの両方を含むものとする。記憶部14は、揮発性メモリ、不揮発性メモリ、またはこれらの組合せであってもよい。揮発性メモリの例としては、DRAM、SRAMなどがある。不揮発性メモリの例としては、NANDフラッシュメモリ、NORフラッシュメモリ、ReRAM、またはMRAMが挙げられる。また、記憶部14として、ハードディスク、光ディスク、磁気テープまたは外部の記憶装置を使ってもよい。
【0017】
通信回路15は、ネットワーク2に接続された各装置との間でデータの送受信を行う。通信回路15は、例えば、有線LANのNIC(Network Interface Card)である。ただし、通信回路15は、無線LANなど、その他の種類の通信回路であってもよい。入力回路16は、管理サーバ1へのデータ入力を実現する。入力回路16は、外部ポートとして、例えば、USB、PCI-Expressなどを備えているものとする。
図2の例では、操作装置18が入力回路16に接続されている。操作装置18は、管理サーバ1に情報を入力するための装置である。操作装置18は、例えば、キーボード、マウス、タッチパネル、音声認識装置などであるが、これに限られない。出力回路17は、管理サーバ1からのデータ出力を実現する。出力回路17は、外部ポートとしてHDMI、DisplayPortなどを備えているものとする。
図2の例では、表示装置19が出力回路17に接続されている。表示装置19の例としては、LCD(液晶ディスプレイ)、有機EL(有機エレクトロルミネッセンス)ディスプレイ、またはプロジェクタがあるが、これに限られない。
【0018】
管理サーバ1の管理者は、操作装置18および表示装置19を使って、管理サーバ1のメンテナンスを行うことができる。なお、操作装置18および表示装置19は、管理サーバ1に組み込まれたものであってもよい。また、管理サーバ1に必ず操作装置18および表示装置19が接続されていなくてもよい。例えば、管理者は、ネットワーク2と通信可能な情報端末を用いて管理サーバ1のメンテナンスを行ってもよい。
【0019】
図3は、管理サーバ1の記憶部14に保存されるデータの例を示している。
図3の記憶部14には、問題データ14Aと、計算データ14Bと、管理プログラム14Cと、変換プログラム14Dと、制御プログラム14Eとが保存されている。例えば、問題データ14Aは、組合せ最適化問題のデータを含む。例えば、計算データ14Bは、各計算サーバから収集された計算結果を含む。例えば、管理プログラム14Cは、上述の管理部11の機能を実現するプログラムである。例えば、変換プログラム14Dは、上述の変換部12の機能を実現するプログラムである。例えば、制御プログラム14Eは、上述の制御部13の機能を実現するプログラムである。
【0020】
図4は、計算サーバの構成例を示したブロックである。
図4の計算サーバは、例えば、第1ベクトルおよび第2ベクトルの計算を単独で、または、他の計算サーバと分担して実行する情報処理装置である。
【0021】
図4には、例示的に計算サーバ3aの構成が示されている。他の計算サーバは、計算サーバ3aと同様の構成であってもよいし、計算サーバ3aと異なる構成であってもよい。
【0022】
計算サーバ3aは、例えば、通信回路31と、共有メモリ32と、プロセッサ33A~33Dと、ストレージ34と、ホストバスアダプタ35とを備えている。通信回路31、共有メモリ32、プロセッサ33A~33D、ストレージ34およびホストバスアダプタ35は、バス36を介して互いに接続されているものとする。
【0023】
通信回路31は、ネットワーク2に接続された各装置との間でデータの送受信を行う。通信回路31は、例えば、有線LANのNIC(Network Interface Card)である。ただし、通信回路31は、無線LANなど、その他の種類の通信回路であってもよい。共有メモリ32は、プロセッサ33A~33Dからアクセス可能なメモリである。共有メモリ32の例としては、DRAM、SRAMなどの揮発性メモリが挙げられる。ただし、共有メモリ32として、不揮発性メモリなどその他の種類のメモリが使われてもよい。共有メモリ32は、例えば、第1ベクトルおよび第2ベクトルを記憶するように構成されていてもよい。プロセッサ33A~33Dは、共有メモリ32を介してデータの共有を行うことができる。なお、必ず計算サーバ3aのすべてのメモリが共有メモリとして構成されていなくてもよい。例えば、計算サーバ3aの一部のメモリは、いずれかのプロセッサのみからアクセスできるローカルメモリとして構成されていてもよい。なお、共有メモリ32および後述するストレージ34は、情報処理装置の記憶部の一例である。
【0024】
プロセッサ33A~33Dは、計算処理を実行する電子回路である。プロセッサは、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field-Programmable Gate Array)、またはASIC(Application Specific Integrated Circuit)のいずれであってもよいし、これらの組合せであってもよい。また、プロセッサは、CPUコアまたはCPUスレッドであってもよい。プロセッサがCPUである場合、計算サーバ3aが備えるソケット数については、特に問わない。また、プロセッサは、PCI expressなどのバスを介して計算サーバ3aのその他の構成要素に接続されていてもよい。
【0025】
図4の例では、計算サーバが4つのプロセッサを備えている。ただし、1台の計算サーバが備えているプロセッサの数はこれとは異なっていてもよい。例えば、計算サーバによって実装されているプロセッサの数および/または種類が異なっていてもよい。ここで、プロセッサは、情報処理装置の処理回路の一例である。情報処理装置は、複数の処理回路を備えていてもよい。
【0026】
情報処理装置は、例えば、第1変数xi(i=1、2、・・・、N)を要素とする第1ベクトルおよび第1変数に対応する第2変数yi(i=1、2、・・・、N)を要素とする第2ベクトルを繰り返し更新するように構成されている。
【0027】
例えば、情報処理装置の処理回路は、第1変数に第2変数を重み付け加算することによって第1ベクトルを更新し、更新された第1ベクトルを探索済ベクトルとして記憶部に保存し、第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する第2変数に加算し、複数の第1変数を用いて問題項を計算し、問題項を第2変数に加算し、記憶部より探索済ベクトルを読み出し、更新対象の第1ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算し、補正項を第2変数に加算することによって第2ベクトルを更新するように構成されていてもよい。問題項は、イジングモデルに基づいて計算されるものであってもよい。ここで、第1変数は、必ず単調増加または単調減少しなくてもよい。例えば、(1)第1係数の値がしきい値T1(例えば、T1=1)より大きくなったときに組合せ最適化問題の解(解ベクトル)を求め、(2)その後、第1係数の値をしきい値T2(例えば、T2=2)より小さく設定した後に第1係数の値を再びしきい値T1より大きく設定し、組合せ最適化問題の解(解ベクトル)を求めることを繰り返してもよい。なお、問題項は、多体相互作用を含むものであってもよい。第1係数、問題項、探索済ベクトル、補正項、イジングモデル、多体相互作用の詳細については、後述する。
【0028】
情報処理装置では、例えば、プロセッサ単位で処理内容(タスク)の割り当てを行うことができる。ただし、処理内容の割り当てが行われる計算資源の単位を限定するものではない。例えば、計算機単位で処理内容の割り当てを行ってもよいし、プロセッサ上で動作するプロセス単位またはCPUスレッド単位で処理内容の割り当てを行ってもよい。
【0029】
以下では、再び
図4を参照し、計算サーバの構成要素を説明する。
【0030】
ストレージ34は、計算サーバ3aのプログラム、プログラムの実行に必要なデータ、およびプログラムによって生成されたデータを含む各種のデータを記憶する。ここで、プログラムは、OSとアプリケーションの両方を含むものとする。ストレージ34は、例えば、第1ベクトルおよび第2ベクトルを記憶するように構成されていてもよい。ストレージ34は、揮発性メモリ、不揮発性メモリ、またはこれらの組合せであってもよい。揮発性メモリの例としては、DRAM、またはSRAMなどがある。不揮発性メモリの例としては、NANDフラッシュメモリ、NORフラッシュメモリ、ReRAM、またはMRAMが挙げられる。また、ストレージ34として、ハードディスク、光ディスク、磁気テープまたは外部の記憶装置が使われてもよい。
【0031】
ホストバスアダプタ35は、計算サーバ間のデータ通信を実現する。ホストバスアダプタ35は、ケーブル4aを介してスイッチ5に接続されている。ホストバスアダプタ35は、例えば、HCA(Host Channel Adaptor)である。ホストバスアダプタ35、ケーブル4a、およびスイッチ5を使って高スループットを実現可能なインターコネクトを形成することにより、並列的な計算処理の速度を向上させることができる。
【0032】
図5は、計算サーバのストレージに保存されるデータの例を示している。
図5のストレージ34には、計算データ34Aと、計算プログラム34Bと、制御プログラム34Cとが保存されている。計算データ34Aは、計算サーバ3aの計算途中のデータまたは計算結果を含んでいる。なお、計算データ34Aの少なくとも一部は、共有メモリ32、プロセッサのキャッシュ、またはプロセッサのレジスタなど、異なる記憶階層に保存されていてもよい。計算プログラム34Bは、所定のアルゴリズムに基づき、各プロセッサにおける計算処理および、共有メモリ32およびストレージ34へのデータの保存処理を実現するプログラムである。制御プログラム34Cは、管理サーバ1の制御部13から送信された指令に基づき、計算サーバ3aを制御し、計算サーバ3aの計算結果を管理サーバ1に送信するプログラムである。
【0033】
次に、組合せ最適化問題の求解に関連する技術について説明する。組合せ最適化問題を解くために使われる情報処理装置の一例として、イジングマシンが挙げられる。イジングマシンとは、イジングモデルの基底状態のエネルギーを計算する情報処理装置のことをいう。これまで、イジングモデルは、主に強磁性体や相転移現象のモデルとして使われることが多かった。しかし、近年、イジングモデルは、組合せ最適化問題を解くためのモデルとしての利用が増えている。下記の式(1)は、イジングモデルのエネルギーを示している。
【数1】
ここで、s
i、s
jはスピンである、スピンは、+1または-1のいずれかの値をとる2値変数である。Nは、スピンの数である。h
iは、各スピンに作用する局所磁場である。Jは、スピン間における結合係数の行列である。行列Jは、対角成分が0である実対称行列となっている。したがって、J
ijは行列Jのi行j列の要素を示している。なお、式(1)のイジングモデルは、スピンについての2次式となっているが、後述するように、スピンの3次以上の項を含む拡張されたイジングモデル(多体相互作用を有するイジングモデル)を使ってもよい。
【0034】
式(1)のイジングモデルを使うと、エネルギーEIsingを目的関数とし、エネルギーEIsingを可能な限り小さくする解を計算することができる。イジングモデルの解は、スピンのベクトル(s1、s2、・・・、sN)の形式で表される。このベクトルを解ベクトルとよぶものとする。特に、エネルギーEIsingが最小値となるベクトル(s1、s2、・・・、sN)は、最適解とよばれる。ただし、計算されるイジングモデルの解は、必ず厳密な最適解でなくてもよい。以降では、イジングモデルを使ってエネルギーEIsingが可能な限り小さくなる近似解(すなわち、目的関数の値が可能な限り最適値に近くなる近似解)を求める問題をイジング問題とよぶものとする。
【0035】
式(1)のスピンsiは2値変数であるため、式(1+si)/2を使うことにより、組合せ最適化問題で使われる離散変数(ビット)との変換を容易に行うことができる。したがって、組合せ最適化問題をイジング問題に変換し、イジングマシンに計算を行わせることにより、組合せ最適化問題の解を求めることが可能である。0または1のいずれかの値をとる離散変数(ビット)を変数とする2次の目的関数を最小化する解を求める問題は、QUBO(Quadratic Unconstrained Binary Optimization、制約なし2値変数2次最適化)問題とよばれる。式(1)で表されるイジング問題は、QUBO問題と等価であるといえる。
【0036】
例えば、量子アニーラ、コヒーレントイジングマシン、または量子分岐マシンなどがイジングマシンのハードウェア実装として提案されている。量子アニーラは、超伝導回路を使って量子アニーリングを実現する。コヒーレントイジングマシンは、光パラメトリック発振器で形成されたネットワークの発振現象を利用する。量子分岐マシンは、カー効果を有するパラメトリック発振器のネットワークにおける量子力学的な分岐現象を利用する。これらのハードウェア実装は、計算時間の大幅な短縮を実現する可能性がある一方、大規模化や安定的な運用が難しいという課題もある。
【0037】
そこで、広く普及しているデジタルコンピュータを使ってイジング問題の求解を行うことも可能である。デジタルコンピュータは、上述の物理的現象を使ったハードウェア実装と比べ、大規模化と安定運用が容易である。デジタルコンピュータでイジング問題の求解を行うためのアルゴリズムの一例として、シミュレーテッドアニーリング(SA)が挙げられる。シミュレーテッドアニーリングをより高速に実行する技術の開発が行われている。ただし、一般のシミュレーテッドアニーリングはそれぞれの変数が逐次更新される逐次更新アルゴリズムであるため、並列化による計算処理の高速化は難しい。
【0038】
上述の課題を踏まえ、デジタルコンピュータにおける並列的な計算によって、規模の大きい組合せ最適化問題の求解を高速に行うことが可能なシミュレーテッド分岐アルゴリズムが提案されている。以降では、シミュレーテッド分岐アルゴリズムを使って組合せ最適化問題を解く情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムについて説明する。
【0039】
はじめに、シミュレーテッド分岐アルゴリズムの概要について述べる。
【0040】
シミュレーテッド分岐アルゴリズムでは、それぞれN個ある2つの変数x
i,y
i(i=1、2、・・・、N)について、下記の(2)の連立常微分方程式を数値的に解く。N個の変数x
iのそれぞれは、イジングモデルのスピンs
iに対応している。一方、N個の変数y
iのそれぞれは、運動量に相当している。変数x
i,y
iは、いずれも連続変数であるものとする。以下では、変数x
i(i=1、2、・・・、N)を要素とするベクトルを第1ベクトル、変数y
i(i=1、2、・・・、N)を要素とするベクトルを第2ベクトルとそれぞれよぶものとする。
【数2】
【0041】
ここで、Hは、下記の式(3)のハミルトニアンである。
【数3】
【0042】
なお、(2)では、式(3)のハミルトニアンHに代わり、下記の式(4)に示した、項G(x
1、x
2、・・・x
N)を含めたハミルトニアンH´を使ってもよい。ハミルトニアンHだけでなく項G(x
1、x
2、・・・x
N)も含む関数を拡張ハミルトニアンとよび、もとのハミルトニアンHと区別するものとする。
【数4】
以下では、項G(x
1、x
2、・・・x
N)が補正項である場合を例に処理を説明する。ただし、項G(x
1、x
2、・・・x
N)は、組合せ最適化問題の制約条件より導かれるものであってもよい。ただし、項G(x
1、x
2、・・・x
N)の導出方法と種類を限定するものではない。また、式(4)では、もとのハミルトニアンHに項G(x
1、x
2、・・・x
N)が加算されている。ただし、項G(x
1、x
2、・・・x
N)は、これとは異なる方法で拡張ハミルトニアンに組み込まれていてもよい。
【0043】
式(3)のハミルトニアンおよび(4)の拡張ハミルトニアンを参照すると、それぞれの項が第1ベクトルの要素x
iまたは第2ベクトルの要素y
iのいずれかの項になっている。下記の式(5)に示すように、第1ベクトルの要素x
iの項Uと、第2ベクトルの要素y
iの項Vに分けることが可能な拡張ハミルトニアンを使ってもよい。
【数5】
【0044】
シミュレーテッド分岐アルゴリズムの時間発展の計算では、変数xi,yi(i=1、2、・・・、N)の値が繰り返し更新される。そして、所定の条件が満たされたときに変数xiを変換することによってイジングモデルのスピンsi(i=1、2、・・・、N)を求めることができる。以下では、時間発展の計算が行われる場合を想定して処理の説明を行う。ただし、シミュレーテッド分岐アルゴリズムの計算は、時間発展以外の方式で行われてもよい。
【0045】
(2)および(3)において、係数Dは、離調(detuning)に相当する。係数p(t)は、上述の第1係数に相当し、ポンピング振幅(pumping amplitude)ともよばれる。時間発展の計算において、係数p(t)の値を更新回数に応じて単調増加させることができる。係数p(t)の初期値は0に設定されていてもよい。
【0046】
なお、以下では、第1係数p(t)が正値であり、更新回数に応じて第1係数p(t)の値が大きくなる場合を例に説明する。ただし、以下で提示するアルゴリズムの符号を反転し、負値の第1係数p(t)を使ってもよい。この場合、更新回数に応じて第1係数p(t)の値が単調減少する。ただし、いずれの場合においても、更新回数に応じて第1係数p(t)の絶対値が単調増加する。
【0047】
係数Kは、正のカー係数(Kerr coefficient)に相当する。係数cとして、定数係数を使うことができる。例えば、係数cの値を、シミュレーテッド分岐アルゴリズムによる計算の実行前に決めてもよい。例えば、係数cをJ(2)行列の最大固有値の逆数に近い値に設定することができる。例えば、c=0.5D√(N/2n)という値を使うことができる。ここで、nは、組合せ最適化問題に係るグラフのエッジ数である。また、a(t)は、時間発展の計算時においてp(t)とともに増加する係数である。例えば、a(t)として、√(p(t)/K)を使うことができる。なお、(3)および(4)における局所磁場のベクトルhiは、省略すること可能である。
【0048】
例えば、係数p(t)の値が所定の値を超えた時に、第1ベクトルにおいて、正値である変数xiを+1、負値である変数xiを-1にそれぞれ変換すると、スピンsiを要素とする解ベクトルを得ることができる。この解ベクトルは、イジング問題の解に相当する。なお、情報処理装置は、第1ベクトルおよび第2ベクトルの更新回数に基づき、上述の変換処理を実行し、解ベクトルを求めるか否かを判定してもよい。
【0049】
シミュレーテッド分岐アルゴリズムの計算を行う場合、シンプレクティック・オイラー法を使い、上述の(2)を離散的な漸化式に変換し、求解を行うことができる。下記の(6)は、漸化式に変換後のシミュレーテッド分岐アルゴリズムの例を示している。
【数6】
ここで、tは、時刻であり、Δtは、時間ステップ(時間刻み幅)である。なお、(6)では、微分方程式との対応関係を示すために、時刻tおよび時間ステップΔtが使われている。ただし、実際にアルゴリズムをソフトウェアまたはハードウェアに実装する際に必ず時刻tおよび時間ステップΔtが明示的なパラメータとして含まれていなくてもよい。例えば、時間ステップΔtを1とすれば、実装時のアルゴリズムから時間ステップΔtを除去することが可能である。アルゴリズムを実装する際に、明示的なパラメータとして時間tを含めない場合には、(4)において、x
i(t+Δt)をx
i(t)の更新後の値であると解釈すればよい。すなわち、上述の(4)における“t”は、更新前の変数の値、“t+Δt”は、更新後の変数の値を示すものとする。
【0050】
シミュレーテッド分岐アルゴリズムの時間発展を計算する場合、p(t)の値を初期値(例えば、0)から所定の値まで増加させた後における変数xiの符号に基づき、スピンsiの値を求めることができる。例えば、xi>0のときsgn(xi)=+1、xi<0のときsgn(xi)=-1となる符号関数を使うと、p(t)の値が所定の値まで増加したとき、変数xiを符号関数で変換することによってスピンsiの値を求めることができる。符号関数として、例えば、xi≠0のときに、sgn(xi)=xi/|xi|、xi=0のときにsgn(xi)=+1または-1になる関数を使うことができる。組合せ最適化問題の解(例えば、イジングモデルのスピンsi)を求めるタイミングについては、特に問わない。例えば、第1ベクトルおよび第2ベクトルの更新回数、第1係数pの値または目的関数の値がしきい値より大きくなったときに組合せ最適化問題の解(解ベクトル)を求めてもよい。
【0051】
図6のフローチャートは、時間発展によってシミュレーテッド分岐アルゴリズムの解を計算する場合における処理の例を示している。以下では、
図6を参照しながら処理を説明する。
【0052】
はじめに、計算サーバは、管理サーバ1より問題に対応する行列Jijおよびベクトルhiを取得する(ステップS101)。そして、計算サーバは、係数p(t)およびa(t)を初期化する(ステップS102)。例えば、ステップS102で係数pおよびaの値を0にすることができるが、係数pおよびaの初期値を限定するものではない。次に、計算サーバは、第1変数xiおよび第2変数yiを初期化する(ステップS103)。ここで、第1変数xiは、第1ベクトルの要素である。また、第2変数yiは、第2ベクトルの要素である。ステップS103で計算サーバは、例えば、擬似乱数によってxiおよびyiを初期化してもよい。ただし、xiおよびyiの初期化の方法を限定するものではない。また、これとは異なるタイミングに変数の初期化を行ってもよいし、少なくともいずれかの変数を複数回初期化してもよい。
【0053】
次に、計算サーバは、第1ベクトルの要素xiに対応する第2ベクトルの要素yiを重み付け加算することによって第1ベクトルを更新する(ステップS104)。例えば、ステップS104では、変数xiにΔt×D×yiを加算することができる。そして、計算サーバは、第2ベクトルの要素yiを更新する(ステップS105およびS106)。例えば、ステップS105では、変数yiにΔt×[(p-D-K×xi×xi)×xi]を加算することができる。ステップS106では、さらに変数yiに-Δt×c×hi×a-Δt×c×ΣJij×xjを加算することができる。
【0054】
次に、計算サーバは、係数pおよびaの値を更新する(ステップS107)。例えば、係数pに一定の値(Δp)を加算し、係数aを更新後の係数pの正の平方根に設定することができる。ただし、後述するように、これは係数pおよびaの値の更新方法の一例にしかすぎない。そして、計算サーバは、第1ベクトルおよび第2ベクトルの更新回数がしきい値未満であるか否かを判定する(ステップS108)。更新回数がしきい値未満である場合(ステップS108のYES)、計算サーバは、ステップS104~S107の処理を再度実行する。更新回数がしきい値以上である場合(ステップS108のNO)、第1ベクトルの要素xiに基づいて解ベクトルの要素であるスピンsiを求める(ステップS109)。ステップS109では、例えば、第1ベクトルにおいて、正値である変数xiを+1、負値である変数xiを-1にそれぞれ変換し、解ベクトルを得ることができる。
【0055】
なお、ステップS108の判定において、更新回数がしきい値未満である場合(ステップS108のYES)に第1ベクトルに基づきハミルトニアンの値を計算し、第1ベクトルおよびハミルトニアンの値を記憶してもよい。これにより、ユーザは、複数の第1ベクトルより最適解に最も近い近似解を選択することが可能となる。
【0056】
なお、
図6のフローチャートに示した少なくともいずれかの処理を並列的に実行してもよい。例えば、第1ベクトルおよび第2ベクトルのそれぞれが有するN個の要素の少なくとも一部が並列的に更新されるよう、ステップS104~S106の処理を並列的に実行してもよい。例えば、複数台の計算サーバを使って処理を並列化してもよい。複数のプロセッサによって処理を並列化してもよい。ただし、処理の並列化を実現するための実装および処理の並列化の態様を限定するものではない。
【0057】
上述のステップS105~S106に示した変数x
iおよびy
iの更新処理の実行順序は、一例にしかすぎない。したがって、これとは異なる順序で変数x
iおよびy
iの更新処理を実行してもよい。例えば、変数x
iの更新処理と変数y
iの更新処理が実行される順序が入れ替わっていてもよい。また、各変数の更新処理に含まれるサブ処理の順序も限定しない。例えば、変数y
iの更新処理に含まれる加算処理の実行順序が
図6の例とは異なっていてもよい。各変数の更新処理を実行するための前提となる処理の実行順序およびタイミングも特に限定しない。例えば、問題項の計算処理が、変数x
iの更新処理を含むその他の処理と並行で実行されていてもよい。変数x
iおよびy
iの更新処理、各変数の更新処理に含まれるサブ処理および問題項の計算処理が実行される順序およびタイミングが限定されない点は、以降に示す各フローチャートの処理についても、同様である。
【0058】
[効率的な解の探索]
シミュレーテッド分岐アルゴリズムを含む最適化問題の計算では、最適解またはそれに近い近似解(実用的な解という)を得ることが望ましい。ただし、計算処理(例えば、
図6の処理)の各試行で必ず実用的な解が得られるとは限らない。例えば、計算処理の試行後に得られる解が実用的な解ではなく局所解である可能性もある。また、問題に複数の局所解が存在している可能性もある。実用的な解が見つける確率を高めるために、複数の計算ノードのそれぞれに計算処理を実行させることが考えられる。また、計算ノードが繰り返し計算処理を実行し、複数回にわたって解を探索することも可能である。さらに、前者と後者の方法とを組み合わせてもよい。
【0059】
ここで、計算ノードは、例えば、計算サーバ(情報処理装置)、プロセッサ(CPU)、GPU、半導体回路、仮想計算機(VM)、仮想プロセッサ、CPUスレッド、プロセスである。計算ノードは、計算処理の実行主体となりうる何らかの計算資源であればよく、その粒度、ハードウェア/ソフトウェアの区別を限定するものではない。
【0060】
ただし、それぞれの計算ノードが独立的に計算処理を実行した場合、複数の計算ノードが解空間の重複した領域を探索してしまう可能性がある。また、計算処理が繰り返される場合、計算ノードが複数の試行において解空間の同じ領域を探索することもありうる。このため、複数の計算ノードで同じ局所解が計算されたり、繰り返し同じ局所解が計算されたりする。計算処理において解空間のすべての局所解を探索し、各局所解を評価することによって最適解を見つけることが理想的である。一方、解空間に局所解が多数存在しうることを考慮すると、情報処理装置/情報処理システムが効率的な求解処理を実行し、現実的な計算時間および計算量の範囲内で実用的な解を得ることが望まれる。
【0061】
例えば、計算ノードは、計算処理の途中において、計算した第1ベクトルを記憶部に保存することができる。以降の計算処理において、計算ノードは、記憶部より以前に計算した第1ベクトルx(m)を読み出す。ここで、mは、第1ベクトルの要素が得られたタイミングを示す番号である。例えば、初回に得られた第1ベクトルは、m=1に、2回目に得られた第1ベクトルは、m=2になる。そして、計算ノードは、以前に計算した第1ベクトルx(m)に基づく補正処理を実行する。これにより、解空間の重複する領域を探索することを避けることができ、同じ計算時間および計算量で解空間のより広い領域を探索することが可能となる。以下では、以前に計算された第1ベクトルを探索済みベクトルとよび、更新対象の第1ベクトルと区別するものとする。
【0062】
以下では、効率的な解の探索を行うための処理の詳細について説明する。
【0063】
例えば、上述の補正項G(x
1、x
2、・・・x
N)を使って補正処理を行うことができる。下記の式(7)は、第1ベクトルと探索済みベクトルとの間の距離の一例である。
【数7】
式(7)は、Q乗ノルムとよばれる。式(7)において、Qは任意の正値をとることができる。
【0064】
下記の式(8)は、式(7)のQを無限大にしたものであり、無限乗ノルムとよばれる。
【数8】
以下では、距離として二乗ノルムが使われている場合を例に説明する。ただし、計算で使用される距離の種類を限定するものではない。
【0065】
例えば、下記の式(9)に示すように、補正項G(x
1、x
2、・・・x
N)に第1ベクトルと探索済みベクトルとの間の距離の逆数を含めてもよい。
【数9】
この場合、計算途中の第1ベクトルが探索済みベクトルに接近すると、補正項G(x
1、x
2、・・・x
N)の値が大きくなる。これにより、探索済みベクトル近傍の領域を避けるように第1ベクトルの更新処理を実行することが可能となる。(9)は、計算に使うことができる補正項の一例にしかすぎない。したがって、計算では、(9)とは異なる形式の補正項が使われてもよい。
【0066】
下記の式(10)は、補正項を含む拡張ハミルトニアンH´の一例である。
【数10】
例えば、式(10)の係数c
Aとして任意の正値を使うことができる。また、k
Aについても、任意の正値を使うことができる。(10)の補正項は、これまでに得られたそれぞれの探索済みベクトルを使って計算した距離の逆数の和を含んでいる。すなわち、情報処理装置の処理回路は、複数の探索済ベクトルのそれぞれを用いて距離の逆数を計算し、複数の逆数を加算することによって補正項を計算するように構成されていてもよい。これにより、これまでに得られた複数の探索済みベクトル近傍の領域を避けるように第1ベクトルの更新処理を実行することできる。
【0067】
式(10)の拡張ハミルトニアンを使った場合、下記の(11)に示した連立常微分方程式をそれぞれN個ある2つの変数x
i,y
i(i=1、2、・・・、N)について、数値的に解く処理を実行することが可能である。
【数11】
【0068】
下記の(12)は、(10)をx
iについて偏微分したものを示している
【数12】
(10)の補正項の分母が二乗ノルムである場合、(12)の分母の計算では、平方根の計算が不要であるため、計算量を抑制することができる。例えば、第1ベクトルの要素数がN、記憶部が保持している探索済みベクトルの数がMである場合、N×Mの定数倍の計算量で補正項を求めることが可能である。
【0069】
シンプレクティック・オイラー法を使い、上述の(11)を離散的な漸化式に変換し、シミュレーテッド分岐アルゴリズムの計算を行うことができる。下記の(13)は、漸化式に変換後のシミュレーテッド分岐アルゴリズムの例を示している。
【数13】
(13)のアルゴリズムを使うと、探索済みベクトルに応じて適応的に第1ベクトルを更新することができる。
【0070】
(13)のうち、下記の(14)の項は、イジングエネルギーに由来する。この項の形式は、解きたい問題に応じて決まるため、問題項(problem term)とよぶものとする。
【数14】
後述するように、問題項は、(14)とは異なっていてもよい。
【0071】
図7のフローチャートは、補正項を含むアルゴリズムを使って求解を行う場合における処理の例を示している。以下では、
図7を参照しながら処理を説明する。
【0072】
はじめに、計算サーバは、係数p(t)、a(t)および変数mを初期化する(ステップS111)。例えば、ステップS111で係数pおよびaの値を0にすることができるが、係数pおよびaの初期値を限定するものではない。例えば、ステップS111で変数mを1に設定することができる。なお、図示されていないが、計算サーバは、
図7のフローチャートの処理が開始する前に管理サーバ1より問題に対応する行列J
ijおよびベクトルh
iを取得しているものとする。次に、計算サーバは、第1変数x
iおよび第2変数y
iを初期化する(ステップS112)。ここで、第1変数x
iは、第1ベクトルの要素である。また、第2変数y
iは、第2ベクトルの要素である。ステップS112で計算サーバは、例えば、擬似乱数によってx
iおよびy
iを初期化してもよい。ただし、x
iおよびy
iの初期化の方法を限定するものではない。
【0073】
そして、計算サーバは、第1変数xiに対応する第2変数yiを重み付け加算することによって第1ベクトルを更新する(ステップS113)。例えば、ステップS113では、変数xiにΔt×D×yiを加算することができる。次に、計算サーバは、第2変数yiを更新する(ステップS114~S116)。例えば、ステップS114では、yiにΔt×[(p-D-K×xi×xi)×xi]を加算することができる。ステップS115では、さらにyiに-Δt×c×hi×a-Δt×c×ΣJij×xjを加算することができる。ステップS115は、第2変数yiへの問題項の加算処理に相当する。ステップS116では、yiに(12)の補正項を加算することができる。補正項は、例えば、記憶部に保存されている探索済ベクトルおよび第1ベクトルに基づいて計算することが可能である。
【0074】
次に、計算サーバは、係数p(第1係数)およびaの値を更新する(ステップS117)。例えば、係数pに一定の値(Δp)を加算し、係数aを更新後の係数pの正の平方根に設定することができる。ただし、後述するように、これは係数pおよびaの値を更新方法の一例にしかすぎない。また、ループを継続するか否かの判定に変数tが使われる場合、変数tにΔtを加算してもよい。そして、計算サーバは、第1ベクトルおよび第2ベクトルの更新回数がしきい値未満であるか否かを判定する(ステップS118)。例えば、変数tの値をTと比較することによってステップS118の判定を行うことができる。ただし、その他の方法で判定を行ってもよい。
【0075】
更新回数がしきい値未満である場合(ステップS118のYES)、計算サーバは、ステップS113~S117の処理を再度実行する。更新回数がしきい値以上である場合(ステップS118のNO)、第1ベクトルを探索済ベクトルとして記憶部に保存し、mをインクリメントする(ステップS119)。そして、記憶部に保存された探索済ベクトルの数がしきい値Mth以上である場合、いずれかのmについて記憶部の探索済ベクトルを削除する(ステップS120)。なお、第1ベクトルを探索済ベクトルとして記憶部に保存する処理は、ステップS113の実行後からステップS117までの間の任意のタイミングに実行されてもよい。
【0076】
次に、計算サーバは、第1ベクトルおよび第2ベクトルを上述の式(6)のハミルトニアンに代入し、ハミルトニアンの値Eを計算する。そして、計算サーバは、ハミルトニアンの値Eがしきい値E0未満であるか否かを判定する(ステップS121)。ハミルトニアンの値Eがしきい値E0未満である場合(ステップS121のYES)、計算サーバは、第1変数xiに基づいて解ベクトルの要素であるスピンsiを求めることができる(図示せず)。例えば、第1ベクトルにおいて、正値である第1変数xiを+1、負値である第1変数xiを-1にそれぞれ変換し、解ベクトルを得ることができる。
【0077】
ステップS121の判定において、ハミルトニアンの値Eがしきい値E0未満でない場合(ステップS121のNO)、計算サーバは、ステップS111以降の処理を再度実行する。このように、ステップS121の判定では、最適解またはそれに近い近似解が得られたか否かの確認が行われている。このように、情報処理装置の処理回路は、ハミルトニアン(目的関数)の値に基づいて第1ベクトルおよび第2ベクトルの更新を停止するか否かを判定するように構成されていてもよい。
【0078】
ユーザは、問題の定式化で使われている符号および求解で求められている精度に応じてしきい値E0の値を決めることができる。定式化で使われる符号によってハミルトニアンの値が極小値をとる第1ベクトルが最適解となる場合があれば、ハミルトニアンの値が極大値をとる第1ベクトルが最適解となる場合もありうる。例えば、上述の(10)の拡張ハミルトニアンでは、値が極小値をとる第1ベクトルが最適解となる。
【0079】
なお、計算サーバは、任意のタイミングでハミルトニアンの値を計算してもよい。計算サーバは、ハミルトニアンの値ならびに、計算に使った第1ベクトルおよび第2ベクトルを記憶部に保存することができる。情報処理装置の処理回路は、更新された第2ベクトルを第3ベクトルとして記憶部に保存するように構成されていてもよい。また、処理回路は、記憶部より探索済ベクトルと同一のイタレーションに更新された第3ベクトルを読み出し、探索済ベクトルおよび第3ベクトルに基づいてハミルトニアン(目的関数)の値を計算するように構成されていてもよい。
【0080】
ユーザは、利用可能な記憶領域および計算資源の量に応じて、ハミルトニアンの値を計算する頻度を決めることができる。また、ステップS118のタイミングにおいて、記憶部に保存された第1ベクトル、第2ベクトルおよびハミルトニアンの値の組合せの数がしきい値を超えているか否かに基づきループ処理を継続するか否かの判定を行ってもよい。こうして、ユーザは、記憶部に保存された複数の探索済ベクトルより、最適解に最も近い探索済ベクトルを選択し、解ベクトルを計算することができる。
【0081】
情報処理装置の処理回路は、ハミルトニアン(目的関数)の値に基づき記憶部に保存された複数の探索済ベクトルよりいずれかの探索済ベクトルを選択し、選択した探索済ベクトルの正値である第1変数を第1値に変換し、負値である第1変数を第1値より小さい第2値に変換することによって解ベクトルを計算するように構成されていてもよい。ここで、第1値は、例えば、+1である。第2値は、例えば、-1である。ただし、第1値および第2値は、その他の値であってもよい。
【0082】
なお、
図7のフローチャートに示した少なくともいずれかの処理を並列的に実行してもよい。例えば、第1ベクトルおよび第2ベクトルがそれぞれ有するN個の要素の少なくとも一部が並列的に更新されるよう、ステップS113~S116の処理を並列的に実行してもよい。例えば、複数台の計算サーバを使って処理を並列化してもよい。複数のプロセッサによって処理を並列化してもよい。ただし、処理の並列化を実現するための実装および処理の並列化の態様を限定するものではない。
【0083】
図7のステップS120では、記憶部に保存されているいずれかの探索済ベクトルを削除する処理が実行されていた。ステップS120において、削除する探索済ベクトルをランダムに選択することができる。例えば、使用可能な記憶領域に制限がある場合、当該制限に基づき上述のしきい値Mthを決めることができる。また、使用可能な記憶領域の制限に関わらず、記憶部で保持する探索済ベクトルの数に上限を設けることにより、ステップS116(補正項の計算)における計算量を抑制することができる。具体的には、補正項の計算処理をN×Mthの定数倍の計算量以下で実行することが可能となる。
【0084】
ただし、計算サーバは、必ずステップS120の処理をスキップしてもよいし、ステップS120のタイミングでその他の処理が実行されてもよい。例えば、探索済ベクトルを別のストレージに移動させてもよい。また、計算資源が充分にある場合には、探索済ベクトルの削除処理を行わなくてもよい。
【0085】
ここでは、情報処理方法、記憶媒体およびプログラムの例について述べる。
【0086】
情報処理方法の第1の例では、記憶部と、複数の処理回路とを使って第1変数を要素とする第1ベクトルおよび第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新する。この場合、情報処理方法は、複数の処理回路が第1変数に対応する第2変数を重み付け加算することによって第1ベクトルを更新するステップと、複数の処理回路が更新された第1ベクトルを探索済ベクトルとして記憶部に保存するステップと、複数の処理回路が第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する第2変数に加算するステップと、複数の処理回路が複数の第1変数を用いて問題項を計算し、問題項を第2変数に加算するステップと、複数の処理回路が記憶部より探索済ベクトルを読み出すステップと、複数の処理回路が更新対象の第1ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、複数の処理回路が補正項を第2変数に加算するステップとを含んでいてもよい。
【0087】
情報処理方法の第2の例では、記憶装置と、複数の情報処理装置とを使って第1変数を要素とする第1ベクトルおよび第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新する。この場合、情報処理方法は、複数の情報処理装置が第1変数に対応する第2変数を重み付け加算することによって第1ベクトルを更新するステップと、複数の情報処理装置が更新された第1ベクトルを探索済ベクトルとして記憶装置に保存するステップと、複数の情報処理装置が第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する第2変数に加算するステップと、複数の情報処理装置が複数の第1変数を用いて問題項を計算し、問題項を第2変数に加算するステップと、複数の情報処理装置が記憶装置より探索済ベクトルを読み出すステップと、複数の情報処理装置が更新対象の第1ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、複数の情報処理装置が補正項を第2変数に加算するステップとを含んでいてもよい。
【0088】
プログラムは、例えば、第1変数を要素とする第1ベクトルおよび第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新する。この場合、プログラムは、第1変数に対応する第2変数を重み付け加算することによって第1ベクトルを更新するステップと、更新された第1ベクトルを探索済ベクトルとして記憶部に保存するステップと、第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する第2変数に加算するステップと、複数の第1変数を用いて問題項を計算し、問題項を第2変数に加算するステップと、記憶部より探索済ベクトルを読み出すステップと、更新対象の第1ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算するステップと、補正項を第2変数に加算するステップとをコンピュータに実行させるものであってもよい。また、記憶媒体は、上述のプログラムを格納した非一時的なコンピュータ可読な記憶媒体であってもよい。
【0089】
[並列システムにおける効率的な解の探索]
複数の計算ノードが並列的にシミュレーテッド分岐アルゴリズムを実行する場合にも上述の適応的な探索を適用することが可能である。ここで、計算ノードが計算処理の実行主体となりうる何らかの計算資源であればよく、粒度およびハードウェア/ソフトウェアの区別を限定しない点は、上述と同様である。複数の計算ノードに第1ベクトルおよび第2ベクトルの同じペアの更新処理を分担して実行させてもよい。この場合、複数の計算ノードは、同一の解ベクトルを計算するひとつのグループを形成しているといえる。また、複数の計算ノードが第1ベクトルおよび第2ベクトルの異なるペアの更新処理を実行するグループに分けられていてもよい。この場合、複数の計算ノードは、それぞれが異なる解ベクトルを計算する複数のグループに分けられているといえる。
【0090】
情報処理装置は、複数の処理回路を備えていてもよい。この場合、それぞれの処理回路は、第1ベクトルおよび第2ベクトルの異なるペアの更新処理を実行する、複数のグループに分けられていてもよい。それぞれの処理回路は、他の処理回路が記憶部に保存した探索済ベクトルを読み出すように構成されていてもよい。
【0091】
また、記憶装置7と、複数の情報処理装置とを含む情報処理システムによって第1変数を要素とする第1ベクトルおよび第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新してもよい。この場合、それぞれの情報処理装置は、第1変数に対応する第2変数を重み付け加算することによって第1ベクトルを更新し、更新された第1ベクトルを探索済ベクトルとして記憶装置7に保存し、第1変数を更新回数に応じて単調増加または単調減少する第1係数で重み付けし対応する第2変数に加算し、複数の第1変数を用いて問題項を計算し、問題項を第2変数に加算し、記憶装置7より探索済ベクトルを読み出し、更新対象の第1ベクトルと探索済ベクトルとの間の距離の逆数を含む補正項を計算し、補正項を第2変数に加算することによって第2ベクトルを更新するように構成されていてもよい。
【0092】
情報処理システムが複数の情報処理装置を含む場合、それぞれの情報処理装置は、第1ベクトルおよび第2ベクトルの異なるペアの更新処理を実行する、複数のグループに分けられていてもよい。それぞれの情報処理装置は、他の情報処理装置が記憶部に保存した探索済ベクトルを読み出すように構成されていてもよい。
【0093】
以下では、複数の計算ノードのそれぞれがシミュレーテッド分岐アルゴリズムを実行した場合に、効率的な解の探索が可能な処理の例について説明する。
【0094】
下記の式(15)は、補正項を含まないハミルトニアンの一例である。
【数15】
例えば、それぞれの計算ノードに上述の式(15)のハミルトニアンを使った解の計算を独立的に実行させると、複数の計算ノードが解空間の重複する領域を探索したり、複数の計算ノードが同一の局所解を得たりする可能性がある。
【0095】
そこで、異なる計算ノードが解空間の重複する領域を探索してしまうことを避けるために、下記の(16)のような補正項を使うことができる。
【数16】
(15)および(16)において、m1は、それぞれの計算ノードの計算で使われている変数または値を示している。一方、m2は、それぞれの計算ノードからみた他の計算ノードが計算で使っている変数を示している。例えば、(16)のベクトルx
(m1)は、自計算ノードで計算されている第1ベクトルである。一方、ベクトルx
(m2)は、その他の計算ノードで計算された第1ベクトルである。すなわち、(16)の補正項を使う場合、探索済ベクトルとして、その他の計算ノードで計算された第1ベクトルが使われる。また、(16)のc
Gおよびk
Gに任意の正値を設定することができる。c
Gとk
Gの値は、異なっていてもよい。
【0096】
例えば、(16)の補正項を式(15)に加算すると、下記の式(17)の拡張ハミルトニアンが得られる。
【数17】
ベクトルx
(m1)が解空間においてベクトルx
(m2)と近接すると、(16)および(17)に示した各補正項において分母の値が小さくなる。したがって、(16)の値が大きくなり、それぞれの計算ノードでは、ベクトルx
(m2)近傍の領域を避けるように第1ベクトルx
(m1)の更新処理が実行されるようになる。
【0097】
式(17)の拡張ハミルトニアンを使った場合、下記の(18)に示した連立常微分方程式をそれぞれN個ある2つの変数x
i,y
i(i=1、2、・・・、N)について、数値的に解く処理を実行することができる。
【数18】
【0098】
下記の(19)は、(17)の補正項をx
iについて偏微分したものである。
【数19】
(16)の補正項の分母が二乗ノルムである場合、(19)の分母の計算では、平方根の計算が不要であるため、計算量を抑制することができる。(19)の補正項は、Nを第1ベクトルの要素数、Mを他の計算ノードによる探索済ベクトルの数とすると、N×Mの定数倍の計算量で計算することが可能である。
【0099】
シンプレクティック・オイラー法を使い、上述の(18)を離散的な漸化式に変換し、シミュレーテッド分岐アルゴリズムの計算を行うことができる。下記の(20)は、漸化式に変換後のシミュレーテッド分岐アルゴリズムの例を示している。
【数20】
(20)のアルゴリズムも、上述の(14)の問題項を含んでいる。後述するように、(20)とは異なる形式の問題項を使ってもよい。
【0100】
例えば、情報処理装置は、複数の処理回路を備えていてもよい。それぞれの処理回路は、更新した第1ベクトルを記憶部に保存するように構成されていてもよい。これにより、各処理回路は、他の処理回路が計算した探索済ベクトルを使って補正項を計算することができる。また、それぞれの処理回路は、更新した第1ベクトルを他の処理回路に転送し、探索済ベクトルに代わり他の処理回路より受信した第1ベクトルを使って補正項を計算するように構成されていてもよい。
【0101】
図8のフローチャートは、他の計算ノードで計算された第1ベクトルを使って効率的に求解を行う場合における処理の例を示している。以下では、
図8を参照しながら処理を説明する。
【0102】
はじめに、計算サーバは、管理サーバ1より問題に対応する行列Jijおよびベクトルhiを取得し、係数p(t)、a(t)および変数tを初期化する(ステップS131)。例えば、ステップS131でp、aおよびtの値を0にすることができる。ただし、p、aおよびtの初期値を限定するものではない。次に、計算サーバは、m1=1~Mについて第1変数xi
(m1)および第2変数yi
(m1)を初期化する(ステップS132)。ここで、第1変数xi
(m1)は、第1ベクトルの要素である。第2変数yi
(m1)は、第2ベクトルの要素である。例えば、擬似乱数によってxi
(m1)およびyi
(m1)を初期化してもよい。ただし、xi
(m1)およびyi
(m1)の初期化の方法を限定するものではない。そして、計算サーバは、カウンタ変数m1に1を代入する(ステップS133)。ここで、カウンタ変数m1は、計算ノードを指定する変数である。ステップS133の処理により、計算処理を行う計算ノード#1が特定される。なお、ステップS131~S133の処理は、管理サーバ1など計算サーバ以外のコンピュータによって実行されてもよい。
【0103】
次に、計算ノード#(m1)は、第1変数xi
(m1)に対応する第2変数yi
(m1)を重み付け加算することによって第1ベクトルを更新し、更新された第1ベクトルを他の計算ノードと共有された記憶領域に保存する(ステップS134)。例えば、ステップS134では、xi
(m1)にΔt×D×yi
(m1)を加算することができる。例えば、他の計算ノードが他のプロセッサまたは他のプロセッサ上のスレッドである場合、共有メモリ32またはストレージ34に更新された第1ベクトルを保存することができる。また、他の計算ノードが計算サーバである場合、共有された外部ストレージに第1ベクトルを保存してもよい。他の計算ノードは、共有された記憶領域に保存された第1ベクトルを探索済ベクトルとして利用することができる。なお、ステップS134では、他の計算ノードに更新された第1ベクトルを転送してもよい。
【0104】
次に、計算ノード#(m1)は、第2変数yi
(m1)を更新する(ステップS135~S137)。例えば、ステップS135では、yi
(m1)にΔt×[(p-D-K×xi
(m1)×xi
(m1))×xi
(m1)]を加算することができる。ステップS136では、さらにyi
(m1)に-Δt×c×hi×a-Δt×c×ΣJij×xj
(m1)を加算することができる。ステップS136は、第2変数yiへの問題項の加算処理に相当する。そして、ステップS137では、変数yiに(19)の補正項を加算することができる。補正項は、例えば、第1ベクトルおよび共有された記憶領域に保存されている探索済ベクトルに基づいて計算される。そして、計算サーバは、カウンタ変数m1をインクリメントする(ステップS138)。
【0105】
次に、計算サーバは、カウンタ変数1がM以下であるか否かを判定する(ステップS139)。カウンタ変数m1がM以下である場合(ステップS139のYES)、ステップS134~ステップS138の処理を再び実行する。一方、カウンタ変数m1がMより大きい場合(ステップS139のNO)、計算サーバは、p、aおよびtの値を更新する(ステップS140)。例えば、pに一定の値(Δp)を加算し、aを更新後の係数pの正の平方根に設定し、tにΔtを加算することができる。ただし、後述するように、これはp、aおよびtの値の更新方法の一例にしかすぎない。そして、計算サーバは、第1ベクトルおよび第2ベクトルの更新回数がしきい値未満であるか否かを判定する(ステップS141)。例えば、変数tの値をTと比較することによってステップS141の判定を行うことができる。ただし、その他の方法で判定を行ってもよい。
【0106】
更新回数がしきい値未満である場合(ステップS141のYES)、計算サーバは、ステップS133の処理を実行し、指定された計算ノードがさらにステップS134以降の処理を実行する。更新回数がしきい値以上である場合(ステップS141のNO)、計算サーバまたは管理サーバ1は、第1変数xiに基づいて解ベクトルの要素であるスピンsiを求めることができる(図示せず)。例えば、第1ベクトルにおいて、正値である第1変数xiを+1、負値である第1変数xiを-1にそれぞれ変換し、解ベクトルを得ることができる。
【0107】
図8のフローチャートでは、計算ノード#1~計算ノード#Mがループによって逐次第1ベクトルおよび第2ベクトルの要素の更新処理を実行している。ただし、
図8のフローチャートにおけるステップS133、S138およびS139の処理をスキップし、代わりに複数の計算ノードにステップS134~S137の処理を並列的に実行させてもよい。この場合、複数の計算ノードを管理する構成要素(例えば、管理サーバ1の制御部13またはいずれかの計算サーバ)がステップS140およびS141の処理を実行することができる。これにより、全般的な計算処理を高速化させることができる。
【0108】
ステップS134~S137の処理を並列的に実行する複数の計算ノードの数Mを限定するものではない。例えば、計算ノードの数Mは、第1ベクトルおよび第2ベクトルがそれぞれ有する要素数(変数の数)Nに等しくてもよい。この場合、M個の計算ノードを使うことによってひとつの解ベクトルを得ることができる。
【0109】
また、計算ノードの数Mは、第1ベクトルおよび第2ベクトルがそれぞれ有する要素数Nと異なる数であってもよい。例えば、計算ノードの数Mは、第1ベクトルおよび第2ベクトルがそれぞれ有する要素数Nの正の整数倍であってもよい。この場合、複数の計算ノードを使うことによってM/N個の解ベクトルを得ることができる。そして、複数の計算ノードは、計算対象の解ベクトルごとにグループ分けされる。このように、それぞれ異なる解ベクトルの計算を行うようにグループ化されている計算ノードどうしで、探索済ベクトルを共有し、さらに効率的な計算処理を実現してもよい。すなわちベクトルx(m2)は、同じグループに属する計算ノードが計算した第1ベクトルであってもよい。また、ベクトルx(m2)は、異なるグループに属する計算ノードが計算した第1ベクトルであってもよい。なお、異なるグループに属する計算ノード間では、処理を同期させなくてもよい。
【0110】
なお、第1ベクトルおよび第2ベクトルがそれぞれ有するN個の要素の少なくとも一部が並列的に更新されるよう、ステップS134~S137の処理を並列的に実行してもよい。ここで、処理の並列化の実装および態様を限定するものではない。
【0111】
なお、計算ノードは、任意のタイミングで第1ベクトルおよび第2ベクトルに基づいてハミルトニアンの値を計算してもよい。ハミルトニアンは、(15)のハミルトニアンであってもよいし、(17)の補正項を含む拡張ハミルトニアンであってもよい。また、前者と後者の両方を計算してもよい。計算ノードは、第1ベクトル、第2ベクトルおよびハミルトニアンの値を記憶部に保存することができる。これらの処理は、ステップS141の判定が肯定的である場合、毎回実行されてもよい。また、ステップS141の判定が肯定的となったタイミングのうち、一部のタイミングで実行されてもよい。さらに、上述の処理は、その他のタイミングで実行されてもよい。ユーザは、利用可能な記憶領域および計算資源の量に応じて、ハミルトニアンの値を計算する頻度を決めることができる。ステップS141のタイミングにおいて、記憶部に保存された第1ベクトル、第2ベクトルおよびハミルトニアンの値の組合せの数がしきい値を超えているか否かに基づきループ処理を継続するか否かの判定を行ってもよい。こうして、ユーザは、記憶部に保存された複数の第1ベクトル(局所解)より、最適解に最も近い第1ベクトルを選択し、解ベクトルを計算することが可能となる。
【0112】
[スナップショットの利用]
以下では、第1ベクトルおよび第2ベクトルの異なるペアの計算を行っている計算ノードのグループを跨って探索済ベクトルの共有を行うときにも適用可能な処理のその他の例について説明する。計算ノードが計算処理の実行主体となりうる何らかの計算資源であればよい。このため、計算ノードの粒度およびハードウェア/ソフトウェアの区別を限定するものではない。
【0113】
図9および
図10のフローチャートは、複数の計算ノードにおいて効率的にシミュレーテッド分岐アルゴリズムで求解を行う場合における処理の例を示している。以下では、
図9および
図10を参照しながら処理を説明する。
【0114】
はじめに、計算サーバは、管理サーバ1より問題に対応する行列Jijおよびベクトルhiを取得し、各計算ノードにこれらのデータを転送する(ステップS150)。ステップS150では、管理サーバ1が直接各計算ノードに問題に対応する行列Jijおよびベクトルhiを転送してもよい。次に、計算サーバは、カウンタ変数m1に1を代入する(ステップS151)。なお、ステップS151をスキップしてもよい。この場合、複数の計算ノードでm1=1~Mについて並列的に後述するステップS152~S160の処理を実行してもよい。
【0115】
ループ処理の有無に関わらず、変数m1は、情報処理システム内のそれぞれの計算ノードの番号を示すものとする。また、m2は、それぞれの計算ノードからみたその他の計算ノードの番号を示しているものとする。計算ノードの数Mは、第1ベクトルおよび第2ベクトルがそれぞれ有する要素数Nに等しくてもよい。また、計算ノードの数Mは、第1ベクトルおよび第2ベクトルがそれぞれ有する要素数Nと異なる数であってもよい。さらに、計算ノードの数Mは、第1ベクトルおよび第2ベクトルがそれぞれ有する要素数Nの正の整数倍であってもよい。
【0116】
そして、各計算ノードは、変数t(m1)および係数p(m1)、a(m1)を初期化する(ステップS152)。例えば、ステップS131でp(m1)、a(m1)およびt(m1)の値を0にすることができる。ただし、p(m1)、a(m1)およびt(m1)の初期値を限定するものではない。次に、各計算ノードは、第1変数xi
(m1)および第2変数yi
(m1)を初期化する(ステップS153)。ここで、第1変数xi
(m1)は、第1ベクトルの要素である。第2変数yi
(m1)は、第2ベクトルの要素である。ステップS153で計算サーバは、例えば、擬似乱数によってxi
(m1)およびyi
(m1)を初期化してもよい。ただし、xi
(m1)およびyi
(m1)の初期化の方法を限定するものではない。
【0117】
そして、各計算ノードは、第1変数xi
(m1)に対応する第2変数yi
(m1)を重み付け加算することによって第1ベクトルを更新する(ステップS154)。例えば、ステップS154では、xi
(m1)にΔt×D×yi
(m1)を加算することができる。次に、各計算ノードは、第2変数yi
(m1)を更新する(ステップS155~S157)。例えば、ステップS155では、yi
(m1)にΔt×[(p-D-K×xi
(m1)×xi
(m1))×xi
(m1)]を加算することができる。ステップS156では、さらにyi
(m1)に-Δt×c×hi×a-Δt×c×ΣJij×xj
(m1)を加算することができる。ステップS156は、第2変数yiへの問題項の加算処理に相当する。そして、ステップS157では、第2変数yiに(19)の補正項を加算することができる。各計算ノードは、例えば、第1ベクトルおよび共有された記憶領域300に保存されている探索済ベクトルに基づいて補正項を計算する。ここで、探索済ベクトルは、異なる解ベクトルの計算を行っている計算ノードが保存したものであってもよい。また、探索済ベクトルは、同一の解ベクトルの計算を行っている計算ノードが保存したものであってもよい。
【0118】
次に、各計算ノードは、t(m1)、p(m1)およびa(m1)の値を更新する(ステップS158)。例えば、t(m1)にΔtを加算し、p(m1)に一定の値(Δp)を加算し、a(m1)を更新後の係数pの正の平方根に設定することができる。ただし、これはp(m1)、a(m1)およびt(m1)の値の更新方法の一例にしかすぎない。そして、各計算ノードは、記憶領域300に第1ベクトルのスナップショットを保存する(ステップS159)。ここで、スナップショットとは、ステップS159が実行されるタイミングにおける第1ベクトルの各要素xi
(m1)の値を含むデータのことをいうものとする。記憶領域300として、複数の計算ノードからアクセス可能な記憶領域を使うことができる。また、記憶領域300として、例えば、共有メモリ32、ストレージ34または外部ストレージ内の記憶領域を使うことができる。ただし、記憶領域300を提供するメモリまたはストレージの種類を限定するものではない。記憶領域300は、複数の種類のメモリまたはストレージの組合せであってもよい。なお、ステップS159で第1ベクトルと同じイタレーションで更新された第2ベクトルを記憶領域300に保存してもよい。
【0119】
次に、各計算ノードは、第1ベクトルおよび第2ベクトルの更新回数がしきい値未満であるか否かを判定する(ステップS160)。例えば、変数t(m1)の値をTと比較することによってステップS160の判定を行うことができる。ただし、その他の方法で判定を行ってもよい。
【0120】
更新回数がしきい値未満である場合(ステップS160のYES)、計算ノードは、ステップS154以降の処理を実行する。更新回数がしきい値以上である場合(ステップS160のNO)、計算サーバは、カウンタ変数m1をインクリメントする(ステップS161)。なお、ステップS161をスキップしてもよい。そして、計算サーバまたは管理サーバ1は、記憶領域300に保存された少なくともいずれかの探索済ベクトルをハミルトニアンの値に基づき選択し、解ベクトルを計算することができる(ステップS162)。ハミルトニアンは、(15)のハミルトニアンであってもよいし、(17)の補正項を含む目的関数であってもよい。また、前者と後者の両方を計算してもよい。なお、ハミルトニアンの値は、ステップS162とは異なるタイミングに計算されてもよい。その場合、計算ノードは、ハミルトニアンの値を第1ベクトルおよび第2ベクトルとともに記憶領域300に保存することができる。
【0121】
なお、ステップS159において、必ず毎回変数のスナップショットを記憶領域300に保存しなくてもよい。例えば、ステップS154~S159のループ処理の一部の回において、変数のスナップショットを記憶領域300に保存してもよい。これにより、記憶領域の消費を抑制することができる。
【0122】
いずれかの計算ノードで障害が発生し、計算処理が異常停止した場合、記憶領域300に保存された第1ベクトルおよび第2ベクトルのスナップショットを使ってデータを復旧し、計算処理を再開することが可能である。記憶領域300に第1ベクトルおよび第2ベクトルのデータを保存することは、情報処理システムの耐障害性および可用性の向上に寄与する。
【0123】
情報処理システムに複数の計算ノードが任意のタイミングで第1ベクトルの要素(および第2ベクトルの要素)を保存可能な記憶領域300を用意することにより、各計算ノードは、タイミングを問わずステップS157において(19)の補正項の計算および当該補正項の変数yiへの加算を行うことができる。(19)の補正項の計算では、ループ処理の異なるイタレーションに計算された第1ベクトルが混在していてもよい。このため、ある計算ノードが第1ベクトルを更新中である場合、他の計算ノードは、更新前の第1ベクトルを使って補正項の計算を行うことができる。これにより、複数の計算ノード間で処理の同期処理の頻度を減らしつつ、効率的に比較的短時間で組合せ最適化問題の求解を行うことが可能となる。
【0124】
図11は、複数の計算ノードを含む情報処理システムの例を概念的に示している。
図11には、計算ノード#1、計算ノード#2および計算ノード#3が示されている。計算ノード#1と計算ノード#2との間で互いに探索済の第1ベクトルに関する情報が交換されている。同様に、計算ノード#2と計算ノード#3との間においても互いに探索済の第1ベクトルに関する情報が交換されている。なお、図示されていないものの、計算ノード#1と計算ノード#3との間においても互いに探索済の第1ベクトルに関する情報を交換してもよい。計算ノード#1と計算ノード#3との間のデータ転送は、直接行われてもよいし、計算ノード#2を介して間接的に行われてもよい。これにより、複数の計算ノードにおいて重複した解空間における探索を行うことを避けることができる。
【0125】
図11には、3つの計算ノードが示されている。ただし、情報処理装置または情報処理システムが備える計算ノードの数は、これとは異なっていてもよい。また、計算ノード間の接続トポロジおよび計算ノード間でデータ転送が行われる経路を限定するものではない。例えば、計算ノードがプロセッサである場合、プロセッサ間通信または共有メモリ32を介してデータ転送を行ってもよい。また、計算ノードが計算サーバである場合、スイッチ5を含む計算サーバ間のインターコネクトを介してデータ転送を行ってもよい。なお、
図11の各計算ノードは、並行して
図9および
図10のフローチャートで説明した記憶領域300への第1ベクトルのスナップショットの保存処理を実行してもよい。
【0126】
図12~
図14は、各計算ノードにおける拡張ハミルトニアンの値の変化の例を概念的に示している。
図12には、計算ノード#1が計算した第1ベクトルx
(m1)と、計算ノード#2が計算した第1ベクトルx
(m2)と、拡張ハミルトニアンH´の値とが示されている。
【0127】
例えば、計算ノード#1が計算ノード#2より第1ベクトルx
(m2)のデータを取得したとする。この場合、計算ノード#1は、取得した第1ベクトルx
(m2)を使って(19)の補正項を計算し、第1ベクトルおよび第2ベクトルを更新することができる。その結果、
図13に示したように、計算ノード#1において計算ノード#2の第1ベクトルx
(m2)近傍において拡張ハミルトニアンの値が大きくなる。これにより、計算ノード#1において更新される第1ベクトルx
(m1)が解空間において計算ノード#2の第1ベクトルx
(m2)より離れた領域に向かう確率が高まる。
【0128】
また、計算ノード#2が計算ノード#1より第1ベクトルx
(m1)のデータを取得したとする。この場合、計算ノード#2は、取得した第1ベクトルx
(m1)を使って(19)の補正項を計算し、第1ベクトルおよび第2ベクトルを更新することができる。その結果、
図14に示したように、計算ノード#2において計算ノード#1の第1ベクトルx
(m1)近傍において拡張ハミルトニアンの値が大きくなる。これにより、計算ノード#2において更新される第1ベクトルx
(m2)が解空間において計算ノード#1の第1ベクトルx
(m1)より離れた領域に向かう確率が高まる。
【0129】
上述のように各計算ノードにおける第1ベクトルの更新状況に応じて拡張ハミルトニアンの値を調整することにより、複数の計算ノードで解空間の重複した領域の探索を避けることができる。このため、効率的に組合せ最適化問題の解を探索することが可能となる。
【0130】
図15のヒストグラムは、複数の計算方法において、最適解を得られるまでに必要な計算回数を示している。
図15では、48ノード96エッジのハミルトン閉路問題を解いた場合におけるデータが使われている。
図15の縦軸は、最適解が得られた頻度を示している。一方、
図15の横軸は、試行回数を示している。
図15において、“DEFAULT”は、式(3)のハミルトニアンを使って
図6のフローチャートの処理を実行した場合における結果に相当する。また、“ADAPTIVE”は、式(10)の拡張ハミルトニアンを使って
図8のフローチャートの処理を実行した場合における結果に相当する。さらに、“GROUP”は、式(10)の拡張ハミルトニアンを使って
図9および
図10のフローチャートの処理を実行した場合における結果に相当する。
【0131】
図15の縦軸には、異なる行列J
ijおよびベクトルh
iの組合せを1000セット用意したときに、所定の計算回数内で最適解が得られた頻度が示されている。“DEFAULT”の場合、計算回数は、
図6のフローチャートの処理の実行回数に相当する。一方、“ADAPTIVE”および“GROUP”の場合、計算回数は、式(10)における探索済ベクトルの数Mに相当する。
図15の例では、横軸の左側における頻度が高いほど、少ない計算回数で最適解が得られているといえる。例えば、“DEFAULT”の場合、10回以下の計算回数で最適解が得られた頻度は、約260である。一方、“ADAPTIVE”の場合、10回以下の計算回数で最適解が得られた頻度は、約280である。さらに、“GROUP”の場合、10回以下の計算回数で最適解が得られた頻度は、約430である。したがって、“GROUP”の条件の場合には、他の場合と比べて少ない計算回数で最適解が得られる確率が高くなっている。
【0132】
本実施形態に係る情報処理装置および情報処理システムでは、探索済のベクトルに関するデータに基づき解空間の重複した領域を探索することを避けることができる。このため、解空間のより広い領域について、解の探索を行い、最適解またはそれに近い近似解が得られる確率を高めることが可能である。また、本実施形態に係る情報処理装置および情報処理システムでは、処理を並列化することが容易であり、それによって計算処理を一層効率的に実行することが可能である。これにより、ユーザに組合せ最適化問題の解を実用的な時間内で計算する情報処理装置または情報処理システムを提供することができる。
【0133】
[多体相互作用の項を含む計算]
シミュレーテッド分岐アルゴリズムを使うことにより、3次以上の目的関数を有する組合せ最適化問題を解くことも可能である。2値変数を変数とする3次以上の目的関数を最小化する変数の組合せを求める問題は、HOBO(Higher Order Binary Optimization)問題とよばれる。HOBO問題を扱う場合、高次へ拡張されたイジングモデルにおけるエネルギー式として、下記の式(21)を使うことができる。
【数21】
ここで、J
(n)はn階テンソルであり、式(1)の局所磁場h
iと結合係数の行列Jを一般化させたものである。例えば、テンソルJ
(1)は、局所磁場h
iのベクトルに相当する。n階テンソルJ
(n)では、複数の添え字に同じ値があるとき、要素の値は0となる。式(21)では、3次の項までが示されているが、それより高次の項も式(21)と同様に定義することができる。式(21)は多体相互作用を含むイジングモデルのエネルギーに相当する。
【0134】
なお、QUBOと、HOBOはいずれも、制約なし多項式2値変数最適化(PUBO:Polynomial Unconstrained Binary Optimization)の1種であるといえる。すなわち、PUBOのうち、2次の目的関数を有する組合せ最適化問題は、QUBOである。また、PUBOのうち、3次以上の目的関数を有する組合せ最適化問題は、HOBOであるといえる。
【0135】
シミュレーテッド分岐アルゴリズムを使ってHOBO問題を解く場合、上述の式(3)のハミルトニアンHを下記の式(22)のハミルトニアンHに置き換えればよい。
【数22】
【0136】
また、式(22)より下記の式(23)に示した複数の第1変数を用いて問題項が導かれる。
【数23】
(23)の問題項z
iは、(22)の2番目の式を、いずれかの変数x
i(第1ベクトルの要素)について偏微分した形式をとっている。偏微分される変数x
iは、インデックスiによって異なる。ここで、変数x
iのインデックスiは、第1ベクトルの要素および第2ベクトルの要素を指定するインデックスに相当する。
【0137】
多体相互作用の項を含む計算を行う場合、上述の(20)の漸化式は、下記の(24)の漸化式に置き換わる。
【数24】
(24)は、(20)の漸化式をさらに一般化したものに相当する。同様に、上述の(13)の漸化式においても、多体相互作用の項を使ってもよい。
【0138】
上述に示した問題項は、本実施形態による情報処理装置が使うことができる問題項の例にしかすぎない。したがって、計算で使われる問題項の形式は、これらとは異なるものであってもよい。
【0139】
[アルゴリズムの変形例]
ここでは、シミュレーテッド分岐アルゴリズムの変形例について説明する。例えば、誤差の軽減または計算時間の短縮を目的に、上述のシミュレーテッド分岐アルゴリズムに各種の変形を行ってもよい。
【0140】
例えば、計算の誤差を軽減するために、第1変数の更新時に追加の処理を実行してもよい。例えば、更新によって第1変数xiの絶対値が1より大きくなったとき、第1変数xiの値をsgn(xi)に置き換える。すなわち、更新によってxi>1となったとき、変数xiの値は1に設定される。また、更新によってxi<-1となったとき、変数xiの値は-1に設定される。これにより、変数xiを使ってスピンsiをより高い精度で近似することが可能となる。このような処理を含めることにより、アルゴリズムは、xi=±1の位置に壁があるN粒子の物理モデルと等価になる。より一般的に述べると、演算回路は、値が第2値より小さい第1変数を第2値に設定し、値が第1値より大きい第1変数を第1値に設定するように構成されていてもよい。
【0141】
さらに、更新によってxi>1となったとき、変数xiに対応する変数yiに係数rfを乗算してもよい。例えば、-1<r≦0の係数rfを使うと、上記の壁は、反射係数rfの壁となる。特に、rf=0の係数rfを使った場合、アルゴリズムは、xi=±1の位置に完全非弾性衝突の起こる壁がある物理モデルと等価になる。より一般的に述べると、演算回路は、値が第1値より小さい第1変数に対応する第2変数、または、第2値より大きい第1変数に対応する第2変数を、もとの第2変数に、第2係数を乗じた値に更新するように構成されていてもよい。例えば、演算回路は、値が-1より小さい第1変数に対応する第2変数、または、値が1より大きい第1変数に対応する第2変数を、もとの第2変数に第2係数を乗じた値に更新するように構成されていてもよい。ここで、第2係数は上述の係数rfに相当する。
【0142】
なお、演算回路は、更新によってxi>1となったとき、変数xiに対応する変数yiの値を擬似乱数に設定してもよい。例えば、[-0.1,0.1]の範囲の乱数を使うことができる。すなわち、演算回路は、値が第2値より小さい第1変数に対応する第2変数の値、または、値が第1値より大きい第1変数に対応する第2変数の値を、擬似乱数に設定するように構成されていてもよい。
【0143】
以上のようにして|x
i|>1となることを抑止するように更新処理を実行すれば、(13)、(20)および(24)の非線形項K×x
i
2を除去しても、x
iの値が発散することはなくなる。したがって、下記の(25)に示したアルゴリズムを使うことが可能となる。
【数25】
【0144】
(25)のアルゴリズムでは、問題項において、離散変数ではなく、連続変数xが使われている。このため、本来の組合せ最適化問題で使われている離散変数との誤差が生ずる可能性がある。この誤差を軽減するために、下記の(26)のように、問題項の計算において、連続変数xの代わりに、連続変数xを符号関数で変換した値sgn(x)を使うことができる。
【数26】
(26)において、sgn(x)は、スピンsに相当する。
【0145】
(26)では、問題項の中の1階のテンソルを含む項の係数αを定数(例えば、α=1)にしてもよい。(26)のアルゴリズムでは、問題項で現れるスピンどうしの積が必ず-1または1のいずれかの値をとるため、高次の目的関数を有するHOMO問題を扱った場合、積演算による誤差の発生を防ぐことができる。上述の(26)のアルゴリズムのように、計算サーバが計算するデータは、さらに、変数si(i=1、2、・・・、N)を要素とするスピンのベクトル(s1,s2,・・・,sN)を含んでいてもよい。第1ベクトルのそれぞれの要素を符号関数で変換することにより、スピンのベクトルを得ることができる。
【0146】
[変数の更新処理の並列化の例]
以下では、シミュレーテッド分岐アルゴリズムの計算時における変数の更新処理の並列化の例について説明する。
【0147】
はじめに、PCクラスタへシミュレーテッド分岐アルゴリズムを実装した例について説明する。PCクラスタとは、複数台のコンピュータを接続し、1台のコンピュータでは得られない計算性能を実現するシステムである。例えば、
図1に示した情報処理システム100は、複数台の計算サーバおよびプロセッサを含んでおり、PCクラスタとして利用することが可能である。例えば、PCクラスタにおいては、MPI(Message Passing Interface)を使うことにより、情報処理システム100のような複数の計算サーバにメモリが分散して配置されている構成でも並列的な計算を実行することが可能である。例えば、MPIを使って管理サーバ1の制御プログラム14E、各計算サーバの計算プログラム34Bおよび制御プログラム34Cを実装することができる。
【0148】
PCクラスタで利用するプロセッサ数がQである場合、それぞれのプロセッサに、第1ベクトル(x
1,x
2,・・・,x
N)に含まれる変数x
iのうち、L個の変数の計算を行わせることができる。同様に、それぞれのプロセッサに、第2ベクトル(y
1,y
2,・・・,y
N)に含まれる変数y
iのうち、L個の変数の計算を行わせることができる。すなわち、プロセッサ#j(j=1,2,・・・,Q)は、変数{x
m|m=(j-1)L+1,(j-1)L+2,・・・,jL}および{y
m|m=(j-1)L+1,(j-1)L+2,・・・,jL}の計算を行う。また、プロセッサ#jによる{y
m|m=(j-1)L+1,(j-1)L+2,・・・,jL}の計算に必要な下記の(27)に示されたテンソルJ
(n)は、プロセッサ#jがアクセス可能な記憶領域(例えば、レジスタ、キャッシュ、メモリなど)に保存されるものとする。
【数27】
【0149】
ここでは、それぞれのプロセッサが第1ベクトルおよび第2ベクトルの一定数の変数を計算する場合を説明した。ただし、プロセッサによって、計算対象とする第1ベクトルおよび第2ベクトルの要素(変数)の数が異なっていてもよい。例えば、計算サーバに実装されるプロセッサによって性能差がある場合、プロセッサの性能に応じて計算対象とする変数の数を決めることができる。
【0150】
変数yiの値を更新するためには、第1ベクトル(x1,x2,・・・,xN)のすべての成分の値が必要となる。2値変数への変換は、例えば、符号関数sgn()を使うことによって行うことができる。そこで、Allgather関数を使い、第1ベクトル(x1,x2,・・・,xN)のすべての成分の値をQ個のプロセッサに共有させることができる。第1ベクトル(x1,x2,・・・,xN)については、プロセッサ間での値の共有が必要であるものの、第2ベクトル(y1,y2,・・・,yN)およびテンソルJ(n)については、プロセッサ間での値の共有を行うことは必須ではない。プロセッサ間でのデータの共有は、例えば、プロセッサ間通信を使ったり、共有メモリにデータを保存したりすることによって実現することができる。
【0151】
プロセッサ#jは、問題項{zm|m=(j-1)L+1,(j-1)L+2,・・・,jL}の値を計算する。そして、プロセッサ#jは、計算した問題項{{zm|m=(j-1)L+1,(j-1)L+2,・・・,jL}の値に基づき、変数{ym|m=(j-1)L+1,(j-1)L+2,・・・,jL}を更新する。
【0152】
上述の各式に示したように、問題項のベクトル(z1,z2,・・・,zN)の計算では、テンソルJ(n)と、ベクトル(x1,x2,・・・,xN)との積の計算を含む、積和演算が必要である。積和演算は、上述のアルゴリズムにおいて最も計算量の大きい処理であり、計算速度の向上においてボトルネックとなりうる。そこで、PCクラスタの実装では、積和演算を、Q=N/L個のプロセッサに分散して並列的に実行し、計算時間の短縮をはかることができる。
【0153】
図16は、マルチプロセッサ構成の例を概略的に示している。
図16の複数の計算ノードは、例えば、情報処理システム100の複数の計算サーバに相当する。また、
図16の高速リンクは、例えば、情報処理システム100のケーブル4a~4cおよびスイッチ5によって形成された計算サーバ間のインターコネクトに相当する。
図16の共有メモリは、例えば、共有メモリ32に相当する。
図16のプロセッサは、例えば、各計算サーバのプロセッサ33A~33Dに相当している。なお、
図16には複数の計算ノードが示されているが、単一計算ノードの構成を用いることを妨げるものではない。
【0154】
図16には、各構成要素に配置されるデータおよび構成要素間で転送されるデータが示されている。各プロセッサでは、変数x
i、y
iの値が計算される。また、プロセッサと共有メモリ間では、変数x
iが転送される。各計算ノードの共有メモリには、例えば、第1ベクトル(x
1,x
2,・・・,x
N)、第2ベクトル(y
1,y
2,・・・,y
N)のL個の変数、およびテンソルJ
(n)の一部が保存される。そして、計算ノード間を接続する高速リンクでは、例えば、第1ベクトル(x
1,x
2,・・・,x
N)が転送される。Allgather関数を使う場合、各プロセッサで変数y
iを更新するために、第1ベクトル(x
1,x
2,・・・,x
N)の全要素が必要となる。
【0155】
なお、
図16に示したデータの配置および転送は一例にしかすぎない。PCクラスタにおけるデータの配置方法、転送方法および並列化の実現方法については、特に問わない。
【0156】
また、GPU(Graphics Processing Unit)を使ってシミュレーテッド分岐アルゴリズムの計算を行ってもよい。
【0157】
図17は、GPUを使った構成の例を概略的に示している。
図17には、互いに高速リンクで接続された複数のGPUが示されている。それぞれのGPUには、共有メモリにアクセス可能な複数のコアが搭載されている。また、
図17の構成例では、複数のGPUが高速リンクを介して接続されており、GPUクラスタを形成している。例えば、GPUが
図1のそれぞれの計算サーバに搭載されている場合、高速リンクは、ケーブル4a~4cおよびスイッチ5によって形成された計算サーバ間のインターコネクトに相当する。なお、
図17の構成例では、複数のGPUが使われているが、ひとつのGPUを使った場合にも、並列的な計算を実行することが可能である。すなわち、
図17のそれぞれのGPUは、
図16のそれぞれの計算ノードに相当する計算を実行できる。すなわち、情報処理装置(計算サーバ)のプロセッサ(処理回路)は、Graphics Processing Unit(GPU)のコアであってもよい。
【0158】
GPUにおいて、変数xiおよびyi、ならびにテンソルJ(n)はデバイス変数として定義される。GPUは、変数yiの更新に必要なテンソルJ(n)と第1ベクトル(x1,x2,・・・,xN)の積を、行列ベクトル積関数によって並列的に計算することができる。なお、行列とベクトルの積演算を繰り返し実行することにより、テンソルとベクトルの積を求めることができる。また、第1ベクトル(x1,x2,・・・,xN)の計算と、第2ベクトル(y1,y2,・・・,yN)のうち、積和演算以外の部分については、それぞれのスレッドにi番目の要素(xi,yi)の更新処理を実行させ、処理の並列化を実現することができる。
【0159】
[組合せ最適化問題を解くための全体的な処理]
以下では、シミュレーテッド分岐アルゴリズムを用いて組合せ最適化問題を解くために実行される全体的な処理を説明する。
【0160】
図18のフローチャートは、組合せ最適化問題を解くために実行される全体的な処理の例を示している。以下では、
図18を参照しながら、処理を説明する。
【0161】
はじめに、組合せ最適化問題を定式化する(ステップS201)。そして、定式化された組合せ最適化問題をイジング問題(イジングモデルの形式)に変換する(ステップS202)。次に、イジングマシン(情報処理装置)によってイジング問題の解を計算する(ステップS203)。そして、計算された解を検証する(ステップS204)。例えば、ステップS204では、制約条件が満たされているか否かの確認が行われる。また、ステップS204で目的関数の値を参照し、得られた解が最適解またはそれに近い近似解であるか否かの確認を行ってもよい。
【0162】
そして、ステップS204における検証結果または計算回数の少なくともいずれかに応じて再計算をするか否かを判定する(ステップS205)。再計算をすると判定された場合(ステップS205のYES)、ステップS203およびS204の処理が再び実行される。一方、再計算をしないと判定された場合(ステップS205のNO)、解の選択を行う(ステップS206)。例えば、ステップS206では、制約条件の充足または目的関数の値の少なくともいずれかに基づき選択を行うことができる。なお、複数の解が計算されていない場合には、ステップS206の処理をスキップしてもよい。最後に、選択した解を組合せ最適化問題の解に変換し、組合せ最適化問題の解を出力する(ステップS207)。
【0163】
上述で説明した情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムを使うことにより、組合せ最適化問題の解を実用的な時間内で計算することが可能となる。これにより、組合せ最適化問題の求解がより容易となり、社会のイノベーションおよび科学技術の進歩を促進することが可能となる。
【0164】
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組合せてもよい。
【符号の説明】
【0165】
1 管理サーバ
2 ネットワーク
3a、3b、3c 計算サーバ
4a、4b、4c ケーブル
5 スイッチ
6 クライアント端末
10 プロセッサ
11 管理部
12 変換部
13 制御部
14 記憶部
14A 問題データ
14B 計算データ
14C 管理プログラム
14D 変換プログラム
14E、34C 制御プログラム
15、31 通信回路
16 入力回路
17 出力回路
18 操作装置
19 表示装置
20 バス
32 共有メモリ
33A、33B、33C、33D プロセッサ
34 ストレージ
34A 計算データ
34B 計算プログラム
35 ホストバスアダプタ