IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧 ▶ 東芝ソリューション株式会社の特許一覧

特許7474242情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム
<>
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図1
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図2
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図3
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図4
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図5
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図6
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図7
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図8
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図9
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図10
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図11
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図12
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図13
  • 特許-情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-16
(45)【発行日】2024-04-24
(54)【発明の名称】情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラム
(51)【国際特許分類】
   G06N 99/00 20190101AFI20240417BHJP
   G06N 10/00 20220101ALI20240417BHJP
   G06F 17/10 20060101ALI20240417BHJP
【FI】
G06N99/00 180
G06N10/00
G06F17/10 Z
【請求項の数】 18
(21)【出願番号】P 2021509697
(86)(22)【出願日】2020-03-30
(86)【国際出願番号】 JP2020014633
(87)【国際公開番号】W WO2020196915
(87)【国際公開日】2020-10-01
【審査請求日】2023-03-24
(31)【優先権主張番号】P 2019064277
(32)【優先日】2019-03-28
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(73)【特許権者】
【識別番号】301063496
【氏名又は名称】東芝デジタルソリューションズ株式会社
(74)【代理人】
【識別番号】100091487
【弁理士】
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【弁理士】
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100118876
【弁理士】
【氏名又は名称】鈴木 順生
(74)【代理人】
【識別番号】100202429
【弁理士】
【氏名又は名称】石原 信人
(72)【発明者】
【氏名】伊藤 透
(72)【発明者】
【氏名】後藤 隼人
(72)【発明者】
【氏名】辰村 光介
(72)【発明者】
【氏名】鈴木 賢
【審査官】藤原 敬利
(56)【参考文献】
【文献】特開2017-073106(JP,A)
【文献】GOTO, Hayato,Bifurcation-based adiabatic quantum computation with a nonlinear oscillator network,Scientific Reports,6:21686,2016年02月22日,pp.1-8,[検索日 2020.06.01], インターネット:<URL: https://www.nature.com/articles/srep21686.pdf>,<DOI: 10.1038/srep21686>
【文献】伊藤大輔 ほか,双極型ロジスティックカオスニューロンを用いたIsingネットワークの分岐,電子情報通信学会技術研究報告,一般社団法人電子情報通信学会,2015年10月18日,Vol.115, No.268,pp.59-62(NC2015-27),ISSN: 0913-5685
(58)【調査した分野】(Int.Cl.,DB名)
G06N 99/00
G06N 10/00
G06F 17/10
(57)【特許請求の範囲】
【請求項1】
第1ベクトルの要素である第1変数および第2ベクトルの要素である第2変数を記憶するように構成された記憶部と、
処理回路であって、
第1係数で重み付けした前記第2変数を時間ステップで乗算し、対応する前記第1変数に加算することによって前記第1変数を更新し、
前記第1変数を、前記時間ステップおよび第2係数で重み付けし対応する前記第2変数に加算し、複数の前記第1変数を用いて問題項を計算し、前記時間ステップを乗じた前記問題項を前記第2変数に加算することによって前記第2変数を更新し、
前記時間ステップを更新し、
前記第2係数を更新回数に応じて単調増加または単調減少させ
所定のタイミングにおいて組み合わせ最適化問題の解を少なくとも1以上の上記のいずれかの更新の結果より取得する、
ように構成された処理回路と
を備える情報処理装置。
【請求項2】
前記処理回路は、前記第1変数または前記第2変数の少なくともいずれかに基づいて第1候補値および第2候補値を計算し、前記第1候補値および前記第2候補値の平均値を前記時間ステップとして使い前記第1変数および前記第2変数を更新し、更新後の前記第1変数または前記第2変数の少なくともいずれかに基づいて前記第2候補値を更新し、再計算した前記平均値を前記時間ステップとして使い前記第1変数および前記第2変数を再び更新するように構成されている、
請求項1に記載の情報処理装置。
【請求項3】
前記処理回路が計算する前記第1候補値または前記第2候補値の少なくともいずれかは、前記第1変数の2次関数に反比例している、
請求項2に記載の情報処理装置。
【請求項4】
前記処理回路は、更新後の前記第2候補値と更新前の前記第2候補値との差が第1しきい値未満であると判定された後に、前記第2係数を更新するように構成されている、
請求項2または3に記載の情報処理装置。
【請求項5】
前記処理回路は、前記平均値を時間ステップとして使って前記第1変数および前記第2変数を更新する処理、前記第2候補値を更新する処理および前記平均値を再計算する処理の繰り返し回数が第2しきい値を超えた後に、前記第2係数を更新するように構成されている、
請求項2ないし4のいずれか一項に記載の情報処理装置。
【請求項6】
前記処理回路は、前記第1変数の更新処理を2回に分けて実行し、前記第1変数の1回目の更新処理と、前記第1変数の2回目の更新処理との間に前記第2変数の更新処理を実行するように構成されている、
請求項2ないし5のいずれか一項に記載の情報処理装置。
【請求項7】
前記処理回路における前記1回目の更新処理と、前記2回目の更新処理において、前記第1変数に加算される値が等しく設定されている、
請求項6に記載の情報処理装置。
【請求項8】
前記処理回路は、前記第1ベクトルに基づいて目的関数の値を計算し、前記記憶部に前記目的関数の値を保存するように構成されている、
請求項1に記載の情報処理装置。
【請求項9】
前記処理回路は、前記記憶部より異なるイタレーションで計算された前記目的関数の値を読み出し、複数の前記目的関数の値に基づいて、前記時間ステップを更新するように構成されている、
請求項8に記載の情報処理装置。
【請求項10】
前記処理回路が計算する前記問題項は、イジングモデルに基づいている、
請求項1ないし9のいずれか一項に記載の情報処理装置。
【請求項11】
前記処理回路が計算する前記問題項は、多体相互作用を含んでいる、
請求項10に記載の情報処理装置。
【請求項12】
複数の前記処理回路を備え、
それぞれの前記処理回路は、並列的に前記第1ベクトルの少なくとも一部および前記第2ベクトルの少なくとも一部を更新するように構成されている、
請求項1ないし11のいずれか一項に記載の情報処理装置。
【請求項13】
それぞれの前記処理回路は、並列的に前記問題項の少なくとも一部の計算処理を実行するように構成されている、
請求項12に記載の情報処理装置。
【請求項14】
第1ベクトルの要素である第1変数および第2ベクトルの要素である第2変数を記憶するように構成された記憶装置と、
情報処理装置であって、
第1係数で重み付けした前記第2変数を時間ステップで乗算し、対応する前記第1変数に加算することによって前記第1変数を更新し、
前記第1変数を、前記時間ステップおよび第2係数で重み付けし対応する前記第2変数に加算し、複数の前記第1変数を用いて問題項を計算し、前記時間ステップを乗じた前記問題項を前記第2変数に加算することによって前記第2変数を更新し、
前記時間ステップを更新し、
前記第2係数を更新回数に応じて単調増加または単調減少させ
所定のタイミングにおいて組み合わせ最適化問題の解を少なくとも1以上の上記のいずれかの更新の結果より取得する、
ように構成された情報処理装置と
を備える情報処理システム。
【請求項15】
複数の前記情報処理装置を備え、
それぞれの前記情報処理装置は、並列的に前記第1ベクトルの少なくとも一部および前記第2ベクトルの少なくとも一部を更新するように構成されている、
請求項14に記載の情報処理システム。
【請求項16】
第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新する情報処理方法であって、
処理回路が、
第1係数で重み付けした前記第2変数を時間ステップで乗算し、対応する前記第1変数に加算することによって前記第1変数を更新するステップと、
前記第1変数を、前記時間ステップおよび第2係数で重み付けし対応する前記第2変数に加算し、複数の前記第1変数を用いて問題項を計算し、前記時間ステップを乗じた前記問題項を前記第2変数に加算することによって前記第2変数を更新するステップと、
前記時間ステップを更新するステップと、
前記第2係数を更新回数に応じて単調増加または単調減少させるステップと
所定のタイミングにおいて組み合わせ最適化問題の解を少なくとも1以上の上記のいずれかの更新の結果より取得するステップと、
を含む情報処理方法。
【請求項17】
コンピュータに第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新させるプログラムであって、
第1係数で重み付けした前記第2変数を時間ステップで乗算し、対応する前記第1変数に加算することによって前記第1変数を更新するステップと、
前記第1変数を、前記時間ステップおよび第2係数で重み付けし対応する前記第2変数に加算し、複数の前記第1変数を用いて問題項を計算し、前記時間ステップを乗じた前記問題項を前記第2変数に加算することによって前記第2変数を更新するステップと、
前記時間ステップを更新するステップと、
前記第2係数を更新回数に応じて単調増加または単調減少させるステップと
所定のタイミングにおいて組み合わせ最適化問題の解を少なくとも1以上の上記のいずれかの更新の結果より取得するステップと、
を含む処理を前記コンピュータに実行させるプログラムを格納している、
非一時的なコンピュータ可読な記憶媒体。
【請求項18】
コンピュータに第1変数を要素とする第1ベクトルおよび前記第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新させるプログラムであって、
第1係数で重み付けした前記第2変数を時間ステップで乗算し、対応する前記第1変数に加算することによって前記第1変数を更新するステップと、
前記第1変数を、前記時間ステップおよび第2係数で重み付けし対応する前記第2変数に加算し、複数の前記第1変数を用いて問題項を計算し、前記時間ステップを乗じた前記問題項を前記第2変数に加算することによって前記第2変数を更新するステップと、
前記時間ステップを更新するステップと、
前記第2係数を更新回数に応じて単調増加または単調減少させるステップと
所定のタイミングにおいて組み合わせ最適化問題の解を少なくとも1以上の上記のいずれかの更新の結果より取得するステップと、
を含む処理を前記コンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムに関する。
【背景技術】
【0002】
組合せ最適化問題とは、複数の組合せの中から目的に最も適した組合せを選ぶ問題である。組合せ最適化問題は、数学的には、「目的関数」と呼ばれる、複数の離散変数を有する関数を最大化させる問題、または、当該関数を最小化させる問題に帰着される。組合せ最適化問題は、金融、物流、交通、設計、製造、生命科学など各種の分野において普遍的な問題であるが、組合せ数が問題サイズの指数関数のオーダーで増える、いわゆる「組合せ爆発」のため、必ず最適解を求めることができるとは限らない。また、最適解に近い近似解を得ることすら難しい場合が多い。
【0003】
各分野における問題を解決し、社会のイノベーションおよび科学技術の進歩を促進するために、組合せ最適化問題の解を高い精度で計算する技術の開発が求められている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2017-73106号公報
【非特許文献】
【0005】
【文献】H. Goto, K. Tatsumura, A. R. Dixon, Sci. Adv. 5, eaav2372 (2019).
【文献】H. Goto, Sci. Rep. 6, 21686 (2016).
【文献】土屋、西山、辻田:分岐特性を用いた組合せ最適化問題の近似解法URL:http://www.ynl.t.u-tokyo.ac.jp/project/RobotBrainCREST/publications/pdf/tsuchiya/4_01.pdf
【文献】土屋、西山、辻田:決定論的アニーリングアルゴリズムの解析URL:http://www.ynl.t.u-tokyo.ac.jp/project/RobotBrainCREST/publications/pdf/tsuchiya/4_02.pdf
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の実施形態は、組合せ最適化問題の解を高い精度で計算する情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムを提供する。
【課題を解決するための手段】
【0007】
本発明の実施形態としての情報処理装置は、第1ベクトルの要素である第1変数および第2ベクトルの要素である第2変数を記憶するように構成された記憶部と、第1係数で重み付けした前記第2変数を時間ステップで乗算し、対応する前記第1変数に加算することによって前記第1変数を更新し、前記第1変数を、前記時間ステップおよび第2係数で重み付けし対応する前記第2変数に加算し、複数の前記第1変数を用いて問題項を計算し、前記時間ステップを乗じた前記問題項を前記第2変数に加算することによって前記第2変数を更新し、前記時間ステップを更新し、前記第2係数を更新回数に応じて単調増加または単調減少させるように構成された処理回路とを備える。
【図面の簡単な説明】
【0008】
図1】情報処理システムの構成例を示した図。
図2】管理サーバの構成例を示したブロック図。
図3】管理サーバの記憶部に保存されるデータの例を示す図。
図4】計算サーバの構成例を示したブロック図。
図5】計算サーバのストレージに保存されるデータの例を示す図。
図6】時間発展によってシミュレーテッド分岐アルゴリズムの解を計算する場合における処理の例を示したフローチャート。
図7】変形例1によるアルゴリズムの例を示したフローチャート。
図8】シミュレーテッド分岐アルゴリズムのループ処理の繰り返し数(イタレーション数)に応じたハミルトニアンの値の変化の例を示したグラフ。
図9】シミュレーテッド分岐アルゴリズムの各イタレーションにおける第1変数および第2変数の値の例を示したグラフ。
図10】擬似コードによって時間反転対称な可変時間ステップを計算するアルゴリズムの例を示した図。
図11】変形例2によるアルゴリズムの例を示したフローチャート。
図12】マルチプロセッサ構成の例を概略的に示した図。
図13】GPUを使った構成の例を概略的に示した図。
図14】組合せ最適化問題を解くために実行される全体的な処理の例を示したフローチャート。
【発明を実施するための形態】
【0009】
以下、図面を参照しながら、本発明の実施形態について説明する。また、図面において同一の構成要素は、同じ番号を付し、説明は、適宜省略する。
【0010】
図1は、情報処理システム100の構成例を示したブロック図である。図1の情報処理システム100は、管理サーバ1と、ネットワーク2と、計算サーバ(情報処理装置)3a~3cと、ケーブル4a~4cと、スイッチ5と、記憶装置7を備えている。また、図1には、情報処理システム100と通信可能なクライアント端末6が示されている。管理サーバ1、計算サーバ3a~3c、クライアント端末6および記憶装置7は、ネットワーク2を介して互いにデータ通信をすることができる。例えば、計算サーバ3a~3cは、記憶装置7にデータを保存したり、記憶装置7よりデータを読み出したりすることができる。ネットワーク2は、例えば、複数のコンピュータネットワークが相互に接続されたインターネットである。ネットワーク2は、通信媒体として有線、無線、または、これらの組合せを用いることができる。また、ネットワーク2で使われる通信プロトコルの例としては、TCP/IPがあるが、通信プロトコルの種類については特に問わない。
【0011】
また、計算サーバ3a~3cは、それぞれケーブル4a~4cを介してスイッチ5に接続されている。ケーブル4a~4cおよびスイッチ5は、計算サーバ間のインターコネクトを形成している。計算サーバ3a~3cは、当該インターコネクトを介して互いにデータ通信をすることも可能である。スイッチ5は、例えば、Infinibandのスイッチである。ケーブル4a~4cは、例えば、Infinibandのケーブルである。ただし、Infinibandのスイッチ/ケーブルの代わりに、有線LANのスイッチ/ケーブルを使ってもよい。ケーブル4a~4cおよびスイッチ5で使われる通信規格および通信プロトコルについては、特に問わない。クライアント端末6の例としては、ノートPC、デスクトップPC、スマートフォン、タブレット、車載端末などが挙げられる。
【0012】
組合せ最適化問題の求解では、処理の並列化および/または処理の分散化を行うことができる。したがって、計算サーバ3a~3cおよび/または計算サーバ3a~3cのプロセッサは、計算処理の一部のステップを分担して実行してもよいし、異なる変数について同様の計算処理を並列的に実行してもよい。管理サーバ1は、例えば、ユーザによって入力された組合せ最適化問題を各計算サーバが処理可能な形式に変換し、計算サーバを制御する。そして、管理サーバ1は、各計算サーバから計算結果を取得し、集約した計算結果を組合せ最適化問題の解に変換する。こうして、ユーザは、組合せ最適化問題の解を得ることができる。組合せ最適化問題の解は、最適解と、最適解に近い近似解とを含むものとする。
【0013】
図1には、3台の計算サーバが示されている。ただし、情報処理システムに含まれる計算サーバの台数を限定するものではない。また、組合せ最適化問題の求解に使われる計算サーバの台数についても特に問わない。例えば、情報処理システムに含まれる計算サーバは1台であってもよい。また、情報処理システムに含まれる複数の計算サーバのうち、いずれかの計算サーバを使って組合せ最適化問題の求解を行ってもよい。また、情報処理システムに、数百台以上の計算サーバが含まれていてもよい。計算サーバは、データセンターに設置されたサーバであってもよいし、オフィスに設置されたデスクトップPCであってもよい。また、計算サーバは異なるロケーションに設置された複数の種類のコンピュータであってもよい。計算サーバとして使われる情報処理装置の種類については特に問わない。例えば、計算サーバは、汎用的なコンピュータであってもよいし、専用の電子回路または、これらの組合せであってもよい。
【0014】
図2は、管理サーバ1の構成例を示したブロック図である。図2の管理サーバ1は、例えば、中央演算処理装置(CPU)とメモリとを含むコンピュータである。管理サーバ1は、プロセッサ10と、記憶部14と、通信回路15と、入力回路16と、出力回路17とを備えている。プロセッサ10、記憶部14、通信回路15、入力回路16および出力回路17は、互いにバス20を介して接続されているものとする。プロセッサ10は、内部の構成要素として、管理部11と、変換部12と、制御部13とを含んでいる。
【0015】
プロセッサ10は、演算を実行し、管理サーバ1の制御を行う電子回路である。プロセッサ10は、処理回路の一例である。プロセッサ10として、例えば、CPU、マイクロプロセッサ、ASIC、FPGA、PLDまたはこれらの組合せを用いることができる。管理部11は、ユーザのクライアント端末6を介して管理サーバ1の操作を行うためのインタフェースを提供する。管理部11が提供するインタフェースの例としては、API、CLI、ウェブページなどが挙げられる。例えば、ユーザは、管理部11を介して組合せ最適化問題の情報の入力を行ったり、計算された組合せ最適化問題の解の閲覧および/またはダウンロードを行ったりすることができる。変換部12は、組合せ最適化問題を各計算サーバが処理可能な形式に変換する。制御部13は、各計算サーバに制御指令を送信する。制御部13が各計算サーバから計算結果を取得した後、変換部12は、複数の計算結果を集約し、組合せ最適化問題の解に変換する。また、制御部13は、各計算サーバまたは各サーバ内のプロセッサが実行する処理内容を指定してもよい。
【0016】
記憶部14は、管理サーバ1のプログラム、プログラムの実行に必要なデータ、およびプログラムによって生成されたデータを含む各種のデータを記憶する。ここで、プログラムは、OSとアプリケーションの両方を含むものとする。記憶部14は、揮発性メモリ、不揮発性メモリ、またはこれらの組合せであってもよい。揮発性メモリの例としては、DRAM、SRAMなどがある。不揮発性メモリの例としては、NANDフラッシュメモリ、NORフラッシュメモリ、ReRAM、またはMRAMが挙げられる。また、記憶部14として、ハードディスク、光ディスク、磁気テープまたは外部の記憶装置を使ってもよい。
【0017】
通信回路15は、ネットワーク2に接続された各装置との間でデータの送受信を行う。通信回路15は、例えば、有線LANのNIC(Network Interface Card)である。ただし、通信回路15は、無線LANなど、その他の種類の通信回路であってもよい。入力回路16は、管理サーバ1へのデータ入力を実現する。入力回路16は、外部ポートとして、例えば、USB、PCI-Expressなどを備えているものとする。図2の例では、操作装置18が入力回路16に接続されている。操作装置18は、管理サーバ1に情報を入力するための装置である。操作装置18は、例えば、キーボード、マウス、タッチパネル、音声認識装置などであるが、これに限られない。出力回路17は、管理サーバ1からのデータ出力を実現する。出力回路17は、外部ポートとしてHDMI、DisplayPortなどを備えているものとする。図2の例では、表示装置19が出力回路17に接続されている。表示装置19の例としては、LCD(液晶ディスプレイ)、有機EL(有機エレクトロルミネッセンス)ディスプレイ、またはプロジェクタがあるが、これに限られない。
【0018】
管理サーバ1の管理者は、操作装置18および表示装置19を使って、管理サーバ1のメンテナンスを行うことができる。なお、操作装置18および表示装置19は、管理サーバ1に組み込まれたものであってもよい。また、管理サーバ1に必ず操作装置18および表示装置19が接続されていなくてもよい。例えば、管理者は、ネットワーク2と通信可能な情報端末を用いて管理サーバ1のメンテナンスを行ってもよい。
【0019】
図3は、管理サーバ1の記憶部14に保存されるデータの例を示している。図3の記憶部14には、問題データ14Aと、計算データ14Bと、管理プログラム14Cと、変換プログラム14Dと、制御プログラム14Eとが保存されている。例えば、問題データ14Aは、組合せ最適化問題のデータを含む。例えば、計算データ14Bは、各計算サーバから収集された計算結果を含む。例えば、管理プログラム14Cは、上述の管理部11の機能を実現するプログラムである。例えば、変換プログラム14Dは、上述の変換部12の機能を実現するプログラムである。例えば、制御プログラム14Eは、上述の制御部13の機能を実現するプログラムである。
【0020】
図4は、計算サーバの構成例を示したブロックである。図4の計算サーバは、例えば、第1ベクトルおよび第2ベクトルの計算を単独で、または、他の計算サーバと分担して実行する情報処理装置である。
【0021】
図4には、例示的に計算サーバ3aの構成が示されている。他の計算サーバは、計算サーバ3aと同様の構成であってもよいし、計算サーバ3aと異なる構成であってもよい。
【0022】
計算サーバ3aは、例えば、通信回路31と、共有メモリ32と、プロセッサ33A~33Dと、ストレージ34と、ホストバスアダプタ35とを備えている。通信回路31、共有メモリ32、プロセッサ33A~33D、ストレージ34およびホストバスアダプタ35は、バス36を介して互いに接続されているものとする。
【0023】
通信回路31は、ネットワーク2に接続された各装置との間でデータの送受信を行う。通信回路31は、例えば、有線LANのNIC(Network Interface Card)である。ただし、通信回路31は、無線LANなど、その他の種類の通信回路であってもよい。共有メモリ32は、プロセッサ33A~33Dからアクセス可能なメモリである。共有メモリ32の例としては、DRAM、SRAMなどの揮発性メモリが挙げられる。ただし、共有メモリ32として、不揮発性メモリなどその他の種類のメモリが使われてもよい。共有メモリ32は、例えば、第1ベクトルおよび第2ベクトルを記憶するように構成されていてもよい。プロセッサ33A~33Dは、共有メモリ32を介してデータの共有を行うことができる。なお、必ず計算サーバ3aのすべてのメモリが共有メモリとして構成されていなくてもよい。例えば、計算サーバ3aの一部のメモリは、いずれかのプロセッサのみからアクセスできるローカルメモリとして構成されていてもよい。なお、共有メモリ32および後述するストレージ34は、情報処理装置の記憶部の一例である。
【0024】
プロセッサ33A~33Dは、計算処理を実行する電子回路である。プロセッサは、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field-Programmable Gate Array)、またはASIC(Application Specific Integrated Circuit)のいずれであってもよいし、これらの組合せであってもよい。また、プロセッサは、CPUコアまたはCPUスレッドであってもよい。プロセッサがCPUである場合、計算サーバ3aが備えるソケット数については、特に問わない。また、プロセッサは、PCI expressなどのバスを介して計算サーバ3aのその他の構成要素に接続されていてもよい。
【0025】
図4の例では、計算サーバが4つのプロセッサを備えている。ただし、1台の計算サーバが備えているプロセッサの数はこれとは異なっていてもよい。例えば、計算サーバによって実装されているプロセッサの数および/または種類が異なっていてもよい。ここで、プロセッサは、情報処理装置の処理回路の一例である。情報処理装置は、複数の処理回路を備えていてもよい。
【0026】
情報処理装置は、例えば、第1変数x(i=1、2、・・・、N)を要素とする第1ベクトルおよび第1変数に対応する第2変数y(i=1、2、・・・、N)を要素とする第2ベクトルを繰り返し更新するように構成されている。情報処理装置の記憶部は、第1ベクトルの要素である第1変数および第2ベクトルの要素である第2変数を記憶するように構成されていてもよい。
【0027】
例えば、情報処理装置の処理回路は、第1係数で重み付けした第2変数を時間ステップで乗算し、対応する第1変数に加算することによって第1変数を更新し、第1変数を、時間ステップおよび第2係数で重み付けし対応する第2変数に加算し、複数の第1変数を用いて問題項を計算し、時間ステップを乗じた問題項を第2変数に加算することによって第2変数を更新し、時間ステップを更新し、第2係数を更新回数に応じて単調増加または単調減少させるように構成されている。問題項は、イジングモデルに基づいて計算されるものであってもよい。また、問題項は、多体相互作用を含むものであってもよい。第1係数、第2係数、問題項、イジングモデルおよび多体相互作用の詳細については、後述する。
【0028】
情報処理装置では、例えば、プロセッサ単位で処理内容(タスク)の割り当てを行うことができる。ただし、処理内容の割り当てが行われる計算資源の単位を限定するものではない。例えば、計算機単位で処理内容の割り当てを行ってもよいし、プロセッサ上で動作するプロセス単位またはCPUスレッド単位で処理内容の割り当てを行ってもよい。
【0029】
以下では、再び図4を参照し、計算サーバの構成要素を説明する。
【0030】
ストレージ34は、計算サーバ3aのプログラム、プログラムの実行に必要なデータ、およびプログラムによって生成されたデータを含む各種のデータを記憶する。ここで、プログラムは、OSとアプリケーションの両方を含むものとする。ストレージ34は、例えば、第1ベクトルおよび第2ベクトルを記憶するように構成されていてもよい。ストレージ34は、揮発性メモリ、不揮発性メモリ、またはこれらの組合せであってもよい。揮発性メモリの例としては、DRAM、またはSRAMなどがある。不揮発性メモリの例としては、NANDフラッシュメモリ、NORフラッシュメモリ、ReRAM、またはMRAMが挙げられる。また、ストレージ34として、ハードディスク、光ディスク、磁気テープまたは外部の記憶装置が使われてもよい。
【0031】
ホストバスアダプタ35は、計算サーバ間のデータ通信を実現する。ホストバスアダプタ35は、ケーブル4aを介してスイッチ5に接続されている。ホストバスアダプタ35は、例えば、HCA(Host Channel Adaptor)である。ホストバスアダプタ35、ケーブル4a、およびスイッチ5を使って高スループットを実現可能なインターコネクトを形成することにより、並列的な計算処理の速度を向上させることができる。
【0032】
図5は、計算サーバのストレージに保存されるデータの例を示している。図5のストレージ34には、計算データ34Aと、計算プログラム34Bと、制御プログラム34Cとが保存されている。計算データ34Aは、計算サーバ3aの計算途中のデータまたは計算結果を含んでいる。なお、計算データ34Aの少なくとも一部は、共有メモリ32、プロセッサのキャッシュ、またはプロセッサのレジスタなど、異なる記憶階層に保存されていてもよい。計算プログラム34Bは、所定のアルゴリズムに基づき、各プロセッサにおける計算処理および、共有メモリ32およびストレージ34へのデータの保存処理を実現するプログラムである。制御プログラム34Cは、管理サーバ1の制御部13から送信された指令に基づき、計算サーバ3aを制御し、計算サーバ3aの計算結果を管理サーバ1に送信するプログラムである。
【0033】
次に、組合せ最適化問題の求解に関連する技術について説明する。組合せ最適化問題を解くために使われる情報処理装置の一例として、イジングマシンが挙げられる。イジングマシンとは、イジングモデルの基底状態のエネルギーを計算する情報処理装置のことをいう。これまで、イジングモデルは、主に強磁性体や相転移現象のモデルとして使われることが多かった。しかし、近年、イジングモデルは、組合せ最適化問題を解くためのモデルとしての利用が増えている。下記の式(1)は、イジングモデルのエネルギーを示している。
【数1】
ここで、s、sはスピンである、スピンは、+1または-1のいずれかの値をとる2値変数である。Nは、スピンの数である。hは、各スピンに作用する局所磁場である。Jは、スピン間における結合係数の行列である。行列Jは、対角成分が0である実対称行列となっている。したがって、Jijは行列Jのi行j列の要素を示している。なお、式(1)のイジングモデルは、スピンについての2次式となっているが、後述するように、スピンの3次以上の項を含む拡張されたイジングモデル(多体相互作用を有するイジングモデル)を使ってもよい。
【0034】
式(1)のイジングモデルを使うと、エネルギーEIsingを目的関数とし、エネルギーEIsingを可能な限り小さくする解を計算することができる。イジングモデルの解は、スピンのベクトル(s、s、・・・、s)の形式で表される。このベクトルを解ベクトルとよぶものとする。特に、エネルギーEIsingが最小値となるベクトル(s、s、・・・、s)は、最適解とよばれる。ただし、計算されるイジングモデルの解は、必ず厳密な最適解でなくてもよい。以降では、イジングモデルを使ってエネルギーEIsingが可能な限り小さくなる近似解(すなわち、目的関数の値が可能な限り最適値に近くなる近似解)を求める問題をイジング問題とよぶものとする。
【0035】
式(1)のスピンsは2値変数であるため、式(1+s)/2を使うことにより、組合せ最適化問題で使われる離散変数(ビット)との変換を容易に行うことができる。したがって、組合せ最適化問題をイジング問題に変換し、イジングマシンに計算を行わせることにより、組合せ最適化問題の解を求めることが可能である。0または1のいずれかの値をとる離散変数(ビット)を変数とする2次の目的関数を最小化する解を求める問題は、QUBO(Quadratic Unconstrained Binary Optimization、制約なし2値変数2次最適化)問題とよばれる。式(1)で表されるイジング問題は、QUBO問題と等価であるといえる。
【0036】
例えば、量子アニーラ、コヒーレントイジングマシン、または量子分岐マシンなどがイジングマシンのハードウェア実装として提案されている。量子アニーラは、超伝導回路を使って量子アニーリングを実現する。コヒーレントイジングマシンは、光パラメトリック発振器で形成されたネットワークの発振現象を利用する。量子分岐マシンは、カー効果を有するパラメトリック発振器のネットワークにおける量子力学的な分岐現象を利用する。これらのハードウェア実装は、計算時間の大幅な短縮を実現する可能性がある一方、大規模化や安定的な運用が難しいという課題もある。
【0037】
そこで、広く普及しているデジタルコンピュータを使ってイジング問題の求解を行うことも可能である。デジタルコンピュータは、上述の物理的現象を使ったハードウェア実装と比べ、大規模化と安定運用が容易である。デジタルコンピュータでイジング問題の求解を行うためのアルゴリズムの一例として、シミュレーテッドアニーリング(SA)が挙げられる。シミュレーテッドアニーリングをより高速に実行する技術の開発が行われている。ただし、一般のシミュレーテッドアニーリングはそれぞれの変数が逐次更新される逐次更新アルゴリズムであるため、並列化による計算処理の高速化は難しい。
【0038】
上述の課題を踏まえ、デジタルコンピュータにおける並列的な計算によって、規模の大きい組合せ最適化問題の求解を高速に行うことが可能なシミュレーテッド分岐アルゴリズムが提案されている。以降では、シミュレーテッド分岐アルゴリズムを使って組合せ最適化問題を解く情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムについて説明する。
【0039】
はじめに、シミュレーテッド分岐アルゴリズムの概要について述べる。
【0040】
シミュレーテッド分岐アルゴリズムでは、それぞれN個ある2つの変数x,y(i=1、2、・・・、N)について、下記の(2)の連立常微分方程式を数値的に解く。N個の変数xのそれぞれは、イジングモデルのスピンsに対応している。一方、N個の変数yのそれぞれは、運動量に相当している。変数x,yは、いずれも連続変数であるものとする。以下では、変数x(i=1、2、・・・、N)を要素とするベクトルを第1ベクトル、変数y(i=1、2、・・・、N)を要素とするベクトルを第2ベクトルとそれぞれよぶものとする。
【数2】
【0041】
ここで、Hは、下記の式(3)のハミルトニアンである。
【数3】
【0042】
なお、(2)では、式(3)のハミルトニアンHに代わり、下記の式(4)に示した、項G(x、x、・・・x)を含めたハミルトニアンH´を使ってもよい。ハミルトニアンHだけでなく項G(x、x、・・・x)も含む関数を拡張ハミルトニアンとよび、もとのハミルトニアンHと区別するものとする。
【数4】
以下では、項G(x、x、・・・x)が補正項である場合を例に処理を説明する。ただし、項G(x、x、・・・x)は、組合せ最適化問題の制約条件より導かれるものであってもよい。ただし、項G(x、x、・・・x)の導出方法と種類を限定するものではない。また、式(4)では、もとのハミルトニアンHに項G(x、x、・・・x)が加算されている。ただし、項G(x、x、・・・x)は、これとは異なる方法で拡張ハミルトニアンに組み込まれていてもよい。
【0043】
式(3)のハミルトニアンおよび(4)の拡張ハミルトニアンを参照すると、それぞれの項が第1ベクトルの要素xまたは第2ベクトルの要素yのいずれかの項になっている。下記の式(5)に示すように、第1ベクトルの要素xの項Uと、第2ベクトルの要素yの項Vに分けることが可能な拡張ハミルトニアンを使ってもよい。
【数5】
【0044】
シミュレーテッド分岐アルゴリズムの時間発展の計算では、変数x,y(i=1、2、・・・、N)の値が繰り返し更新される。そして、所定の条件が満たされたときに変数xを変換することによってイジングモデルのスピンs(i=1、2、・・・、N)を求めることができる。以下では、時間発展の計算が行われる場合を想定して処理の説明を行う。ただし、シミュレーテッド分岐アルゴリズムの計算は、時間発展以外の方式で行われてもよい。
【0045】
(2)および(3)において、係数Dは、上述の第1係数に相当し、離調(detuning)ともよばれる。係数p(t)は、上述の第2係数に相当し、ポンピング振幅(pumping amplitude)ともよばれる。時間発展の計算において、係数p(t)の値を更新回数に応じて単調増加させることができる。係数p(t)の初期値は0に設定されていてもよい。
【0046】
なお、以下では、第2係数p(t)が正値であり、更新回数に応じて第2係数p(t)の値が大きくなる場合を例に説明する。ただし、以下で提示するアルゴリズムの符号を反転し、負値の第2係数p(t)を使ってもよい。この場合、更新回数に応じて第2係数p(t)の値が単調減少する。ただし、いずれの場合においても、更新回数に応じて第2係数p(t)の絶対値が単調増加する。
【0047】
係数Kは、正のカー係数(Kerr coefficient)に相当する。係数cとして、定数係数を使うことができる。例えば、係数cの値を、シミュレーテッド分岐アルゴリズムによる計算の実行前に決めてもよい。例えば、係数cをJ(2)行列の最大固有値の逆数に近い値に設定することができる。例えば、c=0.5D√(N/2n)という値を使うことができる。ここで、nは、組合せ最適化問題に係るグラフのエッジ数である。また、a(t)は、時間発展の計算時においてp(t)とともに増加する係数である。例えば、a(t)として、√(p(t)/K)を使うことができる。なお、(3)および(4)における局所磁場のベクトルhは、省略すること可能である。
【0048】
例えば、係数p(t)の値が所定の値を超えた時に、第1ベクトルにおいて、正値である変数xを+1、負値である変数xを-1にそれぞれ変換すると、スピンsを要素とする解ベクトルを得ることができる。この解ベクトルは、イジング問題の解に相当する。なお、第1ベクトルおよび第2ベクトルの更新回数に基づき、上述の変換を実行し、解ベクトルを求めるか否かを判定してもよい。
【0049】
シミュレーテッド分岐アルゴリズムの計算を行う場合、シンプレクティック・オイラー法を使い、上述の(2)を離散的な漸化式に変換し、求解を行うことができる。下記の(6)は、漸化式に変換後のシミュレーテッド分岐アルゴリズムの例を示している。
【数6】
ここで、tは、時刻であり、Δtは、時間ステップ(時間刻み幅)である。なお、(6)では、微分方程式との対応関係を示すために、時刻tおよび時間ステップΔtが使われている。ただし、実際にアルゴリズムをソフトウェアまたはハードウェアに実装する際に必ず時刻tおよび時間ステップΔtが明示的なパラメータとして含まれていなくてもよい。例えば、時間ステップΔtを1とすれば、実装時のアルゴリズムから時間ステップΔtを除去することが可能である。アルゴリズムを実装する際に、明示的なパラメータとして時間tを含めない場合には、(4)において、x(t+Δt)をx(t)の更新後の値であると解釈すればよい。すなわち、上述の(4)における“t”は、更新前の変数の値、“t+Δt”は、更新後の変数の値を示すものとする。
【0050】
(6)のうち、3段目に記載された項は、イジングエネルギーに由来する。この項の形式は、解きたい問題に応じて決まるため、問題項(problem term)とよぶものとする。
【0051】
シミュレーテッド分岐アルゴリズムの時間発展を計算する場合、p(t)の値を初期値(例えば、0)から所定の値まで増加させた後における変数xの符号に基づき、スピンsの値を求めることができる。例えば、x>0のときsgn(x)=+1、x<0のときsgn(x)=-1となる符号関数を使うと、p(t)の値が所定の値まで増加したとき、変数xを符号関数で変換することによってスピンsの値を求めることができる。符号関数として、例えば、x≠0のときに、sgn(x)=x/|x|、x=0のときにsgn(x)=+1または-1になる関数を使うことができる。組合せ最適化問題の解(例えば、イジングモデルのスピンs)を求めるタイミングについては、特に問わない。例えば、第1ベクトルおよび第2ベクトルの更新回数、第2係数pの値または目的関数の値がしきい値より大きくなったときに組合せ最適化問題の解(解ベクトル)を求めてもよい。
【0052】
図6のフローチャートは、時間発展によってシミュレーテッド分岐アルゴリズムの解を計算する場合における処理の例を示している。以下では、図6を参照しながら処理を説明する。
【0053】
はじめに、計算サーバは、管理サーバ1より問題に対応する行列Jijおよびベクトルhを取得する(ステップS101)。そして、計算サーバは、係数p(t)およびa(t)を初期化する(ステップS102)。例えば、ステップS102で係数pおよびaの値を0にすることができるが、係数pおよびaの初期値を限定するものではない。次に、計算サーバは、第1変数xおよび第2変数yを初期化する(ステップS103)。ここで、第1変数xは、第1ベクトルの要素である。また、第2変数yは、第2ベクトルの要素である。ステップS103で計算サーバは、例えば、xおよびyをそれぞれ0で初期化してもよい。ただし、xおよびyの初期化の方法を限定するものではない。また、これとは異なるタイミングに第1変数xまたは第2変数yの初期化を行ってもよい。また、少なくともいずれかの変数を複数回初期化してもよい。
【0054】
次に、計算サーバは、第2ベクトルの要素yに基づき対応する第1ベクトルの要素xを更新する(ステップS104)。例えば、計算サーバは、ステップS104で第1ベクトルの要素xに対応する第2ベクトルの要素yを重み付け加算することによって第1ベクトルを更新する。例えば、ステップS104では、変数xにΔt×D×yを加算することができる。そして、計算サーバは、第2ベクトルの要素yを更新する(ステップS105およびS106)。例えば、ステップS105では、変数yにΔt×[(p-D-K×x×x)×x]を加算することができる。ステップS106では、さらに変数yに-Δt×c×h×a-Δt×c×ΣJij×xを加算することができる。
【0055】
次に、計算サーバは、係数pおよびaの値を更新する(ステップS107)。例えば、係数pに一定の値(Δp)を加算し、係数aを更新後の係数pの正の平方根に設定することができる。ただし、後述するように、これは係数pおよびaの値の更新方法の一例にしかすぎない。そして、計算サーバは、第1ベクトルおよび第2ベクトルの更新回数がしきい値未満であるか否かを判定する(ステップS108)。更新回数がしきい値未満である場合(ステップS108のYES)、計算サーバは、ステップS104~S107の処理を再度実行する。更新回数がしきい値以上である場合(ステップS108のNO)、第1ベクトルの要素xに基づいて解ベクトルの要素であるスピンsを求める(ステップS109)。ステップS109では、例えば、第1ベクトルにおいて、正値である変数xを+1、負値である変数xを-1にそれぞれ変換し、解ベクトルを得ることができる。
【0056】
なお、ステップS108の判定において、更新回数がしきい値未満である場合(ステップS108のYES)に第1ベクトルに基づきハミルトニアンの値を計算し、第1ベクトルおよびハミルトニアンの値を記憶してもよい。これにより、ユーザは、複数の第1ベクトルより最適解に最も近い近似解を選択することが可能となる。
【0057】
なお、図6のフローチャートに示した少なくともいずれかの処理を並列的に実行してもよい。例えば、第1ベクトルおよび第2ベクトルのそれぞれが有するN個の要素が並列的に更新されるよう、ステップS104~S106の少なくともいずれかの処理を並列的に実行してもよい。例えば、複数台の計算サーバを使って処理を並列化してもよい。複数のプロセッサによって処理を並列化してもよい。ただし、処理の並列化を実現するための実装および処理の並列化の態様を限定するものではない。
【0058】
上述のステップS105~S106に示した変数xおよびyの更新処理の実行順序は、一例にしかすぎない。したがって、これとは異なる順序で変数xおよびyの更新処理を実行してもよい。例えば、変数xの更新処理と変数yの更新処理が実行される順序が入れ替わっていてもよい。また、各変数の更新処理に含まれるサブ処理の順序も限定しない。例えば、変数yに対する加算処理の実行順序が図6の例とは異なっていてもよい。各変数の更新処理を実行するための前提となる処理の実行順序およびタイミングも特に限定しない。例えば、問題項の計算処理が、変数xの更新処理を含むその他の処理と並行で実行されていてもよい。変数xおよびyの更新処理、各変数の更新処理に含まれるサブ処理および問題項の計算処理が実行される順序およびタイミングが限定されない点は、以降に示す各フローチャートの処理についても、同様である。
【0059】
[可変時間ステップによるアルゴリズムの計算]
上述の図6のフローチャートにおいて、時間ステップΔtとして固定値を使うことができる。ただし、必ず固定値の時間ステップΔtを使わなくてもよい。例えば、Δtを可変時間ステップにしてもよい。可変時間ステップを使ってシミュレーテッド分岐アルゴリズムの計算を行うことにより、計算時間の抑制および/または計算精度の改善を実現することができる。
【0060】
ループ処理の各イタレーションにおいて、例えば、係数tの値を下記の(7)に基づいて更新することができる。
【数7】
ここで、nは、イタレーションの番号を示す正の整数である。(7)は、イタレーション(n-1)における係数tの値tn-1にΔtn-1を加算すると、次のイタレーションnにおける係数tの値tが得られることを示している。可変時間ステップが使われる場合、各イタレーションn=1,2,・・・においてΔtn-1の値が固定値ではなくなる。したがって、イタレーションによってΔtn-1は、異なる値をとりうる。
【0061】
例えば、ループ処理の継続可否の判定のために係数tを使うことができる。ただし、その他の方法によってループ処理の継続可否が判定される場合には、(7)の処理をスキップしてもよい。例えば、ハミルトニアンの値、係数pの値、係数aの値、イタレーションの回数の少なくともいずれかに基づいてループ処理の継続可否を判定してもよい。すなわち、シミュレーテッド分岐アルゴリズムの実行時に必ず係数tの更新処理を行わなくてもよい。
【0062】
下記の(8)は、可変時間ステップの更新方法の例を示している。
【数8】
(8)の方法を使うと、イタレーション(n-1)における時間ステップΔtn-1に、ハミルトニアンの値H´n-1およびH´n-2に基づく係数を乗算することによって次のイタレーションnで使う時間ステップΔtを得ることができる。ここで、H´n-1は、イタレーション(n-1)で計算されたハミルトニアンの値である。一方、H´n-2は、その前のイタレーション(n-2)で計算されたハミルトニアンの値である。
【0063】
(8)を使うと、ループ処理によってハミルトニアンの値が一定値(例えば、0)の近傍に収束するのにしたがって、時間ステップΔtの値が小さくなる。このため、ハミルトニアンの値が収束する前には、比較的大きい時間ステップを使い、計算量を削減することができる。一方、ハミルトニアンの値の収束が始まると、比較的小さい時間ステップが使われるため、高い精度で計算を行うことが可能となる。これにより、最適解に近い近似解を計算することができる。このように、少なくともひとつのイタレーションで計算されたハミルトニアンの値に基づいて時間ステップの値を更新してもよい。ただし、(8)とは異なる方法によって時間ステップを更新してもよい。
【0064】
図7のフローチャートは、変形例1によるアルゴリズムの例を示している。以下では、図7を参照しながら、処理を説明する。
【0065】
はじめに、計算サーバは、管理サーバ1より問題に対応する行列Jijおよびベクトルhを取得する(ステップS110)。そして、計算サーバは、係数p(t)、a(t)、nおよびΔtを初期化する(ステップS111)。例えば、ステップS111で係数pおよびaの値を0にすることができるが、係数pおよびaの初期値を限定するものではない。例えば、ステップS111でnを1に初期化することができる。ただし、nの初期値は、これとは異なっていてもよい。Δtは、時間ステップの初期値である。例えば、計算サーバは、Δtに任意の正の自然数を設定することができる。
【0066】
そして、計算サーバは、第1変数xおよび第2変数yを初期化する(ステップS112)。ここで、第1変数xは、第1ベクトルの要素である。また、第2変数yは、第2ベクトルの要素である。ステップS112で計算サーバは、例えば、xおよびyをそれぞれ0で初期化してもよい。また、計算サーバは、xおよびyをそれぞれ擬似乱数によって初期化してもよい。ただし、xおよびyの初期化の方法を限定するものではない。なお、これとは異なるタイミングに第1変数xまたは第2変数yの初期化を行ってもよい。また、少なくともいずれかの変数の初期化を複数回実行してもよい。
【0067】
次に、計算サーバは、記憶領域よりハミルトニアンの値H´n-1およびH´n-2を読み出し、時間ステップΔtを更新する(ステップS113)。例えば、上述の(8)の方法によって時間ステップΔtを更新することができる。ただし、その他の方法によって時間ステップΔtを更新してもよい。記憶領域として、例えば、共有メモリ32またはストレージ34が提供する記憶領域を使うことができる。ただし、外部の記憶装置またはクラウドストレージが提供する記憶領域を使ってもよく、記憶領域の場所を限定するものではない。なお、ステップS113が初めて実行されるタイミングでは、記憶領域にH´n-1およびH´n-2が保存されていない可能性がある。この場合、ステップS113の処理をスキップしてもよい。
【0068】
そして、計算サーバは、第2ベクトルの要素yに基づき対応する第1ベクトルの要素xを更新する(ステップS114)。例えば、計算サーバは、ステップS114で第1ベクトルの要素xに対応する第2ベクトルの要素yを重み付け加算することによって第1ベクトルを更新する。例えば、ステップS114では、変数xにΔt×D×yを加算することができる。そして、計算サーバは、第2ベクトルの要素yを更新する(ステップS115およびS116)。例えば、ステップS115では、変数yにΔt×[(p-D-K×x×x)×x]を加算することができる。ステップS116では、さらに変数yに-Δt×c×h×a-Δt×c×ΣJij×xを加算することができる。
【0069】
次に、計算サーバは、ハミルトニアンの値H´を計算し、それを記憶領域に保存する(ステップS117)。ハミルトニアンとして、上述の(1)のエネルギーの関数を計算してもよい。また、ハミルトニアンとして、上述の(3)または(4)を計算してもよい。また、その他の形式で定義されるハミルトニアンを使ってもよい。例えば、計算サーバは、ステップS117でハミルトニアンが計算されたイタレーションを示す番号とともにハミルトニアンの値H´を記憶領域に保存することができる。そして、計算サーバは、係数p、aおよびnの値を更新する(ステップS118)。例えば、係数pに一定の値(Δp)を加算し、係数aを更新後の係数pの正の平方根に設定することができる。また、ステップS118で係数nの値をインクリメントしてもよい。これにより、記憶領域に保存されたデータが生成されたイタレーションを識別することが可能となる。さらに、ステップS118では、tn-1にΔtを加算することによって係数tを計算してもよい。
【0070】
次に、計算サーバは、第1ベクトルおよび第2ベクトルの更新回数がしきい値未満であるか否かを判定する(ステップS119)。更新回数がしきい値未満である場合(ステップS119のYES)、計算サーバは、ステップS113~S118の処理を再度実行する。更新回数がしきい値以上である場合(ステップS119のNO)、第1ベクトルの要素xに基づいて解ベクトルの要素であるスピンsを求める(ステップS120)。ステップS120では、例えば、第1ベクトルにおいて、正値である変数xを+1、負値である変数xを-1にそれぞれ変換し、解ベクトルを得ることができる。
【0071】
なお、ステップS119の判定において、更新回数がしきい値未満である場合(ステップS119のYES)に第1ベクトルに基づきハミルトニアンの値を計算し、記憶領域に第1ベクトルおよびハミルトニアンの値を保存してもよい。これにより、ユーザは、複数の第1ベクトルより最適解に最も近い近似解を選択することが可能となる。そして、選択した第1ベクトルを解ベクトルに変換することができる。また、ループ処理の実行中など、これとは異なるタイミングにおいて解ベクトルの計算を行ってもよい。
【0072】
また、図7のフローチャートに示した少なくともいずれかの処理を並列的に実行してもよい。例えば、第1ベクトルおよび第2ベクトルがそれぞれ有するN個の要素が並列的に更新されるよう、ステップS114~S116の処理の少なくともいずれかを並列的に実行してもよい。例えば、複数台の計算サーバを使って処理を並列化してもよい。複数のプロセッサによって処理を並列化してもよい。ただし、処理の並列化を実現するための実装および処理の並列化の態様を限定するものではない。
【0073】
情報処理装置の処理回路は、第1ベクトルに基づいてハミルトニアン(目的関数)の値を計算し、記憶部にハミルトニアン(目的関数)の値を保存するように構成されていてもよい。また、情報処理装置の処理回路は、記憶部より異なるイタレーションで計算されたハミルトニアン(目的関数)の値を読み出し、複数のハミルトニアン(目的関数)の値に基づいて、時間ステップを更新するように構成されていてもよい。
【0074】
[時間反転対称な可変時間ステップ]
シミュレーテッド分岐アルゴリズムの実行時に可変時間ステップを使う場合、計算精度への影響を考慮して時間ステップΔtの更新方法を決めることが望まれる。例えば、ループ処理のイタレーション間における時間ステップΔtの変化量が大きくなると、計算処理の安定性が損なわれるおそれがある。このような場合の例を、下記の図8および図9を用いて説明する。
【0075】
図8は、シミュレーテッド分岐アルゴリズムのループ処理の繰り返し数(イタレーション数)に応じたハミルトニアンの値の変化の例を示している。図8の横軸は、アルゴリズムのイタレーション数を示している。図8の縦軸は、エネルギーの値を示している。例えば、エネルギーの値は、上述の(1)によって計算される。ただし、(1)以外の形式のエネルギー関数を使ってもよい。
【0076】
図9は、シミュレーテッド分岐アルゴリズムの各イタレーションにおける第1変数xおよび第2変数yの値の例を示している。図9の横軸は、第1変数xの値に相当する。一方、図9の縦軸は、第2変数yの値に相当する。シミュレーテッド分岐アルゴリズムを粒子の運動状態を記述する物理的なモデルであると解釈した場合、第1変数xは、当該粒子の位置を示す。一方、第2変数yは、粒子の運動量を示す。
【0077】
図8および図9の(a)では、時間ステップΔtの変化量を大きく設定し、上述の(8)および図7のアルゴリズムを実行した場合における結果を示している。図8の(a)を参照すると、エネルギーの値が振動をしながらイタレーション数の増加とともに大きくなっている。シミュレーテッド分岐アルゴリズムがハミルトン力学系の要件を満たしている場合、図8の(a)は、計算誤差の蓄積を示しているといえる。また、図9の(a)では、イタレーションによって第1変数xおよび第2変数yの軌道が変化しており、誤差の発生がみられる。
【0078】
このように、時間ステップΔtの変化量を大きくしすぎると、ハミルトン力学系にシンプレクティック・オイラー法を適用した場合におけるエネルギー保存のメリットを享受できなくなるおそれがある。したがって、図8および図9の(a)の場合に計算処理の安定性および精度を担保するためには、時間ステップΔtの変化量を一定の範囲内に抑えなくてはならない。このため、計算時間の短縮のために、時間ステップΔtを大きくとることが難しくなる可能性がある。
【0079】
上述では、シミュレーテッド分岐アルゴリズムがハミルトン力学系の要件を満たしている場合について説明したが、シミュレーテッド分岐アルゴリズムは、必ずハミルトン力学系の要件を満たしていなくてもよい。使用するアルゴリズムがハミルトン力学系の要件を満たしていない場合においても、計算処理の安定性および精度を考慮する必要がある点は、同様である。
【0080】
ハミルトン力学系にシンプレクティック・オイラー法を適用した場合、保存量は、時間ステップΔtに応じて定まる基準点について振動する。このため、時間ステップΔtを変化させると、振動の基準点が変化してしまう。このため、可変時間ステップΔtが時間反転に対称でない場合、イタレーションによってpなどの係数が変化していなくても、計算誤差が蓄積する可能性がある。一方、時間反転対称性がある可変時間ステップΔtを使うと、時間反転によって解空間における初期条件に復帰することが可能となるため、計算誤差の蓄積を防止することができる。
【0081】
そこで、情報処理装置および情報処理システムでは、時間反転対称性がある時間ステップΔtを使うことができる。これにより、計算処理の安定性および精度を改善させることができる。以下では、時間反転対称性がある可変時間ステップΔtの例について、説明する。
【0082】
例えば、下記の(9)で定義される時間ステップ幅Δtn,n+1を使うことができる。
【数9】
ここで、Δtc,nは、時間ステップ幅の第1候補値である。一方、Δtc,n+1は、時間ステップ幅の第2候補値である。第1候補値Δtc,nおよび第2候補値Δtc,n+1は、いずれも第1変数xまたは第2変数yの少なくともいずれかに基づいて計算される。Δtn,n+1のノーテーションにおけるn,n+1は、イタレーションnとイタレーション(n+1)の間に使われる時間ステップ幅であることを示している。
【0083】
(9)の第2候補値Δtc,n+1の計算を行うためには、Δtn,n+1を使う必要がある。このため、Δtn,n+1は、陰関数として定義されている。このため、(9)を満たす時間ステップΔtn,n+1の計算では、陰的解法を使うことができる。例えば、セルフコンシステントな陰関数が得られるよう、繰り返しを含む演算を実行することによって、Δtn,n+1の値を求めることができる。
【0084】
イタレーション(n+1)とイタレーションnの間に使われる時間ステップ幅Δtn+1,nを計算すると、上述のΔtn,n+1に等しくなる。Δtn,n+1=Δtn+1,nが成り立つため、時間ステップ幅が時間反転対称になっているといえる。
【0085】
なお、上述の(9)では、計算される時間ステップ幅Δtn,n+1が第1候補値Δtc,nおよび第2候補値Δtc,n+1の算術平均となっている。ただし、可変時間ステップの計算に使われる平均演算の種類を限定するものではない。例えば、第1候補値Δtc,nおよび第2候補値Δtc,n+1の幾何平均を計算することによって可変時間ステップを求めてもよい。また、第1候補値Δtc,nおよび第2候補値Δtc,n+1の調和平均を計算することによって可変時間ステップを求めてもよい。
【0086】
図10には、擬似コードによって時間反転対称な可変時間ステップを計算するアルゴリズムの例が示されている。図10の擬似コードは、一般的なプログラミング言語に類似する文法を使って記述されている。ただし、アルゴリズムの実装に使われるプログラミング言語の種類を限定するものではない。以下では、図10を参照しながら、アルゴリズムの例を説明する。
【0087】
図10の上部には、グローバル変数として、“a”、“b”、“dt0”および“thres“が定義されている。グローバル変数は、各関数内からも参照可能な変数である。ここで定義されたグローバル変数の組合せおよびグローバル変数の値は、例にしかすぎない。
【0088】
グローバル変数の下には、関数“t_evolution”が定義されている。関数“t_evolution”は、呼び出し時に第1変数、第2変数および時間ステップを引数として受け取り、1イタレーション分の時間発展後における第1変数および第2変数を返す。関数“t_evolution”は、処理が時間反転対称となるよう、第1変数の更新処理が2回に分けて実行されている。また、第2変数の更新処理は、2回の第1変数の更新処理の間に実行されている。すなわち、図10の例では、下記の(10)のアルゴリズムに基づいて時間発展の計算が行われている。
【数10】
なお、(10)のx[n+1/2]は、2回の更新処理のうち、第1回目の更新処理の後における第1変数の値を示している。ここで、時間反転対称とは、処理の実行順序が反転しても、実行される処理の内容が変わらないことを意味するものとする。
【0089】
関数“t_evolution”の下には、関数“generate_dt”が定義されている。関数“generate_dt”は、呼び出し時に第1変数および第2変数を引数として受け取り、第1変数または第2変数の少なくともいずれかに基づいて時間ステップの候補値を計算し、当該候補値を返す。関数“generate_dt”を使うことによって、セルフコンシステントな時間ステップを探索することができる。図10の例に示したように、処理回路が計算する時間ステップの候補値(第1候補値または第2候補値の少なくともいずれか)は、第1変数の2次関数に反比例していてもよい。例えば、図10のように、グローバル変数“a”、“b”および“dt0”ならびに、第1変数に基づいて時間ステップの候補値を計算してもよい。ただし、この計算方法は、一例にしかすぎない。例えば、第2変数に基づいて時間ステップの候補値を計算してもよい。また、第1変数と第2変数の両方を用いて時間ステップの候補値を計算してもよい。すなわち、時間ステップの第2候補値の計算に使われるアルゴリズムを限定するものではない。
【0090】
関数“generate_dt”の下には、関数“symmetric_dt” が定義されている。関数“symmetric_dt” は、呼び出し時に第1変数および第2変数を引数として受け取り、複数イタレーション分の時間発展を経た第1変数および第2変数、ならびに時間ステップ幅Δtn,n+1を返す。
【0091】
次に、関数“symmetric_dt”で実行される処理の詳細について述べる。
【0092】
はじめに、関数“symmetric_dt”の呼び出し時に受け取った第1変数(変数“x1”)および第2変数(変数“x2”)を引数として関数“generate_dt”を2回呼び出している。これにより、ローカル変数“dt1”および“dt2”に時間ステップの候補値が代入される。
【0093】
次に、forループの処理に進む。
【0094】
forループ内では、はじめに、変数“x1”、変数“y1”および(dt1+dt2)/2を引数として、関数“t_evolution”が呼び出される。これにより、1イタレーション分の時間発展後の第1変数の値がローカル変数“x2”に代入される。また、1イタレーション分の時間発展後の第2変数の値がローカル変数“y2”に代入される。そして、ローカル変数“x2”および“y2”を引数として、関数“generate_dt”が呼び出され、生成された時間ステップの候補値がローカル変数“_dt”に代入されている。
【0095】
次に、forループ内では、ローカル変数“dt2”の値とローカル変数“_dt”の値との差がしきい値“thres”未満であるか否かが判定されている(if文)。ローカル変数“dt2”の値とローカル変数“_dt”の値との差がしきい値未満である場合、ループ処理から抜け出す(break)。ローカル変数“dt2”の値とローカル変数“_dt”の値との差がしきい値以上である場合(else文)、ローカル変数“_dt”に格納されていた時間ステップの第2候補値がローカル変数“dt2”に代入される。すなわち、else文でローカル変数“dt2”の値が更新される。
【0096】
ループ処理内では、イタレーションによって(dt1+dt2)/2の値が変化する。このため、関数“t_evolution”の引数であるローカル変数“x1”および“y1”の値が変わらなくても、イタレーションによって時間発展後のローカル変数“x2”および“y2”の値が変化する。関数“generate_dt”は、更新されたローカル変数“x2”および“y2”を使って計算を行うため、時間ステップの第2候補値(図10の“_dt”)もイタレーションによって変化する。
【0097】
上述のforループ内の処理は、カウンタ変数の値が5になるか、if文の判定が肯定的になるまで繰り返される。すなわち、上述の処理が5回実行されるか、更新後の第2候補値(図10の“_dt”)の変化量が一定の範囲内に収束するまで、forループ内の処理が繰り返される。図10における繰り返し回数および収束判定は、例にしかすぎない。したがって、陰的解法における処理の繰り返し回数は、5とは異なる値であってもよい。また、更新後の第2候補値の収束判定に使われるしきい値を限定するものではない。
【0098】
forループの処理を抜けた後、関数“symmetric_dt”は、ローカル変数“x2”の値、“y2”の値、および(dt1+dt2)/2の値を返す。関数“symmetric_dt”が返すローカル変数“x2”の値は、時間発展後の第1変数xに相当する。一方、関数“symmetric_dt”が返すローカル変数“y2”の値は、時間発展後の第2変数yに相当する。また、関数“symmetric_dt”が返す(dt1+dt2)/2の値は、上述の(9)における時間ステップ幅Δtn,n+1に相当する。
【0099】
図10の下部には、第1変数x=1、第2変数y=0を引数として、上述の関数“symmetric_dt”が呼び出されている。x=1およびy=0は、関数“symmetric_dt”の呼び出し時における引数の値の一例にしかすぎない。シミュレーテッド分岐アルゴリズムの実行状況に応じて第1変数xおよび第2変数yは、これとは異なる値をとりうる。
【0100】
なお、図10のグローバル変数“a”は、上述の(6)のアルゴリズムにおける-D+p(t+Δt)に相当している。したがって、図10の擬似コードでは示されていないものの、更新回数に応じて第2係数pを単調増加または単調減少させるため、関数“symmetric_dt”の呼び出し前または呼び出し後にグローバル変数“a”の値を更新してもよい。
【0101】
図11のフローチャートは、変形例2によるアルゴリズムの例を示している。以下では、図11を参照しながら、処理を説明する。
【0102】
はじめに、計算サーバは、管理サーバ1より問題に対応する行列Jijおよびベクトルhを取得する(ステップS130)。そして、計算サーバは、係数p(t)、a(t)およびΔtを初期化する(ステップS131)。例えば、ステップS131で係数pおよびaの値を0にすることができるが、係数pおよびaの初期値を限定するものではない。Δtは、図10におけるグローバル変数“dt0”に相当する。例えば、計算サーバは、Δtに任意の正の自然数を設定することができる。
【0103】
そして、計算サーバは、第1変数xおよび第2変数yを初期化する(ステップS132)。ここで、第1変数xは、第1ベクトルの要素である。また、第2変数yは、第2ベクトルの要素である。ステップS132で計算サーバは、例えば、xおよびyをそれぞれ0で初期化してもよい。また、計算サーバは、xおよびyをそれぞれ擬似乱数によって初期化してもよい。ただし、xおよびyの初期化の方法を限定するものではない。また、これとは異なるタイミングに第1変数xまたは第2変数yの初期化を行ってもよい。また、少なくともいずれかの変数を複数回初期化してもよい。
【0104】
次に、計算サーバは、第1変数xまたは第2変数yの少なくともいずれかに基づき、候補値Δt1およびΔt2を生成する(ステップS133)。例えば、ステップS133では、図10の関数“generate_dt”を使うことができる。ただし、候補値Δt1およびΔt2の生成アルゴリズムを限定するものではない。
【0105】
そして、計算サーバは、第1変数x、第2変数yおよび(Δt1+Δt2)/2に基づき第1変数xおよび第2変数yの時間発展を時間反転対称に計算する(ステップS134)。ステップS134の処理により、第1変数xおよび第2変数yの値は更新される。例えば、ステップS134では、上述の(10)または図10の関数“t_evolution”を使って第1変数xおよび第2変数yを更新することができる。ただし、時間反転対称であるのであれば、これとは異なるアルゴリズムで第1変数xおよび第2変数yの更新を行ってもよい。なお、ステップS134では、(Δt1+Δt2)/2の代わりに、Δt1とΔt2の幾何平均またはΔt1とΔt2の調和平均を使ってもよい。また、ステップS134でΔt1とΔt2のその他の平均を使ってもよい。
【0106】
次に、計算サーバは、第1変数xまたは第2変数yの少なくともいずれかに基づき、候補値_Δtを生成する(ステップS135)。ステップS135においても、図10の関数“generate_dt”を使うことができる。ただし、その他のアルゴリズムによって候補値_Δtを生成してもよい。
【0107】
そして、計算サーバは、候補値_ΔtとΔt2との差がしきい値未満であるか否かを判定する(ステップS136)。候補値_ΔtとΔt2との差がしきい値以上である場合(ステップS136のNO)、計算サーバは、_Δtの値をΔt2に代入する(ステップS137)。そして、掲載サーバは、再度ステップS134~S136の処理を実行する。すなわち、ステップS136の判定が否定的である場合、図11の内側のループ処理が継続する。
【0108】
候補値_ΔtとΔt2との差がしきい値未満である場合(ステップS136のYES)、計算サーバは、係数pおよびaの値を更新する(ステップS138)。例えば、係数pに一定の値(Δp)を加算し、係数aを更新後の係数pの正の平方根に設定することができる。さらに、ステップS138では、tに(Δt1+Δt2)/2を加算することによって係数tを更新してもよい。なお、ステップS138では、(Δt1+Δt2)/2の代わりに、Δt1とΔt2の幾何平均またはΔt1とΔt2の調和平均を使ってもよい。また、ステップS138でΔt1とΔt2のその他の平均を使ってもよい。
【0109】
次に、計算サーバは、第1ベクトルおよび第2ベクトルの更新回数がしきい値未満であるか否かを判定する(ステップS139)。更新回数がしきい値未満である場合(ステップS139のYES)、計算サーバは、ステップS133以降の処理を再度実行する。すなわち、ステップS139の判定が肯定的である場合、図11の外側のループ処理が継続する。更新回数がしきい値以上である場合(ステップS139のNO)、第1ベクトルの要素xに基づいて解ベクトルの要素であるスピンsを求める(ステップS140)。ステップS140では、例えば、第1ベクトルにおいて、正値である変数xを+1、負値である変数xを-1にそれぞれ変換し、解ベクトルを得ることができる。
【0110】
なお、ステップS139の判定において、更新回数がしきい値未満である場合(ステップS139のYES)に第1ベクトルに基づきハミルトニアンの値を計算し、記憶領域に第1ベクトルおよびハミルトニアンの値を保存してもよい。これにより、ユーザは、複数の第1ベクトルより最適解に最も近い近似解を選択することが可能となる。また、ループ処理の実行中など、これとは異なるタイミングにおいて解ベクトルの計算を行ってもよい。
【0111】
また、図11のフローチャートに示した少なくともいずれかの処理を並列的に実行してもよい。例えば、第1ベクトルおよび第2ベクトルがそれぞれ有するN個の要素が並列的に更新されるよう、ステップS133~S136の処理の少なくとも一部を並列的に実行してもよい。例えば、複数台の計算サーバを使って処理を並列化してもよい。複数のプロセッサによって処理を並列化してもよい。ただし、処理の並列化を実現するための実装および処理の並列化の態様を限定するものではない。
【0112】
情報処理装置の処理回路は、第1変数または第2変数の少なくともいずれかに基づいて第1候補値および第2候補値を計算し、第1候補値および第2候補値の平均値を時間ステップとして使い第1変数および第2変数を更新し、更新後の第1変数または第2変数の少なくともいずれかに基づいて第2候補値を更新し、再計算した平均値を時間ステップとして使い第1変数および第2変数を再び更新するように構成されていてもよい。
【0113】
一方、情報処理装置の処理回路は、更新後の第2候補値と更新前の第2候補値との差が第1しきい値未満であると判定された後に、第2係数を更新するように構成されていてもよい。また、情報処理装置の処理回路は、平均値を時間ステップとして使って第1変数および第2変数を更新する処理、第2候補値を更新する処理および平均値を再計算する処理の繰り返し回数が第2しきい値を超えた後に、第2係数を更新するように構成されていてもよい。
【0114】
さらに、情報処理装置の処理回路は、第1変数の更新処理を2回に分けて実行し、第1変数の1回目の更新処理と、第1変数の2回目の更新処理との間に第2変数の更新処理を実行するように構成されていてもよい。処理回路における第1変数の1回目の更新処理と、第1変数の2回目の更新処理において、第1変数に加算される値が等しく設定されていてもよい。
【0115】
図8および図9の(b)は、時間反転対称な可変時間ステップを使った場合における結果を示している。図8の(b)を参照すると、エネルギーの値が一定の基準値の近傍で振動している。したがって、シミュレーテッド分岐アルゴリズムがハミルトン力学系の要件を満たしている場合、エネルギーが保存される。すなわち、計算誤差の発生が防止されていることがわかる。また、図9の(b)は、一定の軌道にしたがって第1変数xおよび第2変数yの値が変化しており、計算処理が安定していることを示している。
【0116】
時間反転対称な可変時間ステップを使う情報処理装置または情報処理システムを使うことにより、誤差の蓄積を抑制し、高い精度で組合せ最適化問題の解を計算することが可能となる。可変時間ステップを使うと、状況に応じて時間ステップを大きく設定することができるため、計算の精度および安定性を損なうことなく、計算時間を短縮することができる。
【0117】
ここでは、情報処理システム、情報処理方法、プログラムおよび記憶媒体の例について述べる。
【0118】
情報処理システムは、記憶装置と、情報処理装置とを備えていてもよい。記憶装置は、例えば、第1ベクトルの要素である第1変数および第2ベクトルの要素である第2変数を記憶するように構成されている。情報処理装置は、例えば、第1係数で重み付けした第2変数を時間ステップで乗算し、対応する第1変数に加算することによって第1変数を更新し、第1変数を、時間ステップおよび第2係数で重み付けし対応する第2変数に加算し、複数の第1変数を用いて問題項を計算し、時間ステップを乗じた問題項を第2変数に加算することによって第2変数を更新し、時間ステップを更新し、第2係数を更新回数に応じて単調増加または単調減少させるように構成されている。
【0119】
例えば、情報処理方法は、第1変数を要素とする第1ベクトルおよび第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新する。情報処理方法は、第1係数で重み付けした第2変数を時間ステップで乗算し、対応する第1変数に加算することによって第1変数を更新するステップと、第1変数を、時間ステップおよび第2係数で重み付けし対応する第2変数に加算し、複数の第1変数を用いて問題項を計算し、時間ステップを乗じた問題項を第2変数に加算することによって第2変数を更新するステップと、時間ステップを更新するステップと、第2係数を更新回数に応じて単調増加または単調減少させるステップとを含んでいてもよい。
【0120】
プログラムは、例えば、第1変数を要素とする第1ベクトルおよび第1変数に対応する第2変数を要素とする第2ベクトルを繰り返し更新させる。プログラムは、第1係数で重み付けした第2変数を時間ステップで乗算し、対応する第1変数に加算することによって第1変数を更新するステップと、第1変数を、時間ステップおよび第2係数で重み付けし対応する第2変数に加算し、複数の第1変数を用いて問題項を計算し、時間ステップを乗じた問題項を第2変数に加算することによって第2変数を更新するステップと、時間ステップを更新するステップと、第2係数を更新回数に応じて単調増加または単調減少させるステップとを含む処理をコンピュータに実行させてもよい。また、記憶媒体は、当該プログラムを格納する、非一時的なコンピュータ可読な記憶媒体であってもよい。
【0121】
[多体相互作用の項を含む計算]
シミュレーテッド分岐アルゴリズムを使うことにより、3次以上の目的関数を有する組合せ最適化問題を解くことも可能である。2値変数を変数とする3次以上の目的関数を最小化する変数の組合せを求める問題は、HOBO(Higher Order Binary Optimization)問題とよばれる。HOBO問題を扱う場合、高次へ拡張されたイジングモデルにおけるエネルギー式として、下記の式(11)を使うことができる。
【数11】
ここで、J(n)はn階テンソルであり、式(1)の局所磁場hと結合係数の行列Jを一般化させたものである。例えば、テンソルJ(1)は、局所磁場hのベクトルに相当する。n階テンソルJ(n)では、複数の添え字に同じ値があるとき、要素の値は0となる。式(11)では、3次の項までが示されているが、それより高次の項も式(11)と同様に定義することができる。式(11)は多体相互作用を含むイジングモデルのエネルギーに相当する。
【0122】
なお、QUBOと、HOBOはいずれも、制約なし多項式2値変数最適化(PUBO:Polynomial Unconstrained Binary Optimization)の1種であるといえる。すなわち、PUBOのうち、2次の目的関数を有する組合せ最適化問題は、QUBOである。また、PUBOのうち、3次以上の目的関数を有する組合せ最適化問題は、HOBOであるといえる。
【0123】
シミュレーテッド分岐アルゴリズムを使ってHOBO問題を解く場合、上述の式(3)のハミルトニアンHを下記の式(12)のハミルトニアンHに置き換えればよい。
【数12】
【0124】
また、式(12)より下記の式(13)に示した複数の第1変数を用いて計算される問題項が導かれる。
【数13】
(13)の問題項zは、(12)の2番目の式を、いずれかの変数x(第1ベクトルの要素)について偏微分した形式をとっている。偏微分される変数xは、インデックスiによって異なる。ここで、変数xのインデックスiは、第1ベクトルの要素および第2ベクトルの要素を指定するインデックスに相当する。
【0125】
多体相互作用の項を含む計算を行う場合、上述の(6)の漸化式は、下記の(14)の漸化式に置き換わる。
【数14】
(14)は、(6)の漸化式をさらに一般化したものに相当する。
【0126】
上述に示した問題項は、本実施形態による情報処理装置が使うことができる問題項の例にしかすぎない。したがって、計算で使われる問題項の形式は、これらとは異なるものであってもよい。情報処理装置の処理回路は、複数の第1変数を使った積和演算を実行することによって問題項を計算するように構成されていてもよい。さらに、積和演算の複数のパートに分け、各パートを異なる演算器(処理回路)に割り当て、複数の演算器で同時に処理を実行してもよい。これにより、積和演算を高速に実行することもできる。また、情報処理装置は、複数の処理回路を備えていてもよい。この場合、それぞれの処理回路は、問題項の少なくとも一部の計算処理を並列的に実行するように構成されていてもよい。
【0127】
[アルゴリズムの変形例]
ここでは、シミュレーテッド分岐アルゴリズムの変形例について説明する。例えば、誤差の軽減または計算時間の短縮を目的に、上述のシミュレーテッド分岐アルゴリズムに各種の変形を行ってもよい。
【0128】
例えば、計算の誤差を軽減するために、第1変数の更新時に追加の処理を実行してもよい。例えば、更新によって第1変数xの絶対値が1より大きくなったとき、第1変数xの値をsgn(x)に置き換える。すなわち、更新によってx>1となったとき、変数xの値は1に設定される。また、更新によってx<-1となったとき、変数xの値は-1に設定される。これにより、変数xを使ってスピンsをより高い精度で近似することが可能となる。このような処理を含めることにより、アルゴリズムは、x=±1の位置に壁があるN粒子の物理モデルと等価になる。より一般的に述べると、演算回路は、値が第2値より小さい第1変数を第2値に設定し、値が第1値より大きい第1変数を第1値に設定するように構成されていてもよい。
【0129】
さらに、更新によってx>1となったとき、変数xに対応する変数yに係数rfを乗算してもよい。例えば、-1<r≦0の係数rfを使うと、上記の壁は、反射係数rfの壁となる。特に、rf=0の係数rfを使った場合、アルゴリズムは、x=±1の位置に完全非弾性衝突の起こる壁がある物理モデルと等価になる。より一般的に述べると、演算回路は、値が第1値より小さい第1変数に対応する第変数、または、第2値より大きい第1変数に対応する第2変数を、もとの第2変数に、第2係数を乗じた値に更新するように構成されていてもよい。例えば、演算回路は、値が-1より小さい第1変数に対応する第変数、または、値が1より大きい第1変数に対応する第2変数を、もとの第2変数に第2係数を乗じた値に更新するように構成されていてもよい。ここで、第2係数は上述の係数rfに相当する。
【0130】
なお、演算回路は、更新によってx>1となったとき、変数xに対応する変数yの値を擬似乱数に設定してもよい。例えば、[-0.1,0.1]の範囲の乱数を使うことができる。すなわち、演算回路は、値が第2値より小さい第1変数に対応する第2変数の値、または、値が第1値より大きい第1変数に対応する第2変数の値を、擬似乱数に設定するように構成されていてもよい。
【0131】
以上のようにして|x|>1となることを抑止するように更新処理を実行すれば、(6)の非線形項K×x を除去しても、xの値が発散することはなくなる。したがって、下記の(15)に示したアルゴリズムを使うことが可能となる。
【数15】
【0132】
(15)のアルゴリズムでは、問題項において、離散変数ではなく、連続変数xが使われている。このため、本来の組合せ最適化問題で使われている離散変数との誤差が生ずる可能性がある。この誤差を軽減するために、下記の(16)のように、問題項の計算において、連続変数xの代わりに、連続変数xを符号関数で変換した値sgn(x)を使うことができる。
【数16】
(16)において、sgn(x)は、スピンsに相当する。
【0133】
(16)では、問題項の中の1階のテンソルを含む項の係数αを定数(例えば、α=1)にしてもよい。(16)のアルゴリズムでは、問題項で現れるスピンどうしの積が必ず-1または1のいずれかの値をとるため、高次の目的関数を有するHOMO問題を扱った場合、積演算による誤差の発生を防ぐことができる。上述の(16)のアルゴリズムのように、計算サーバが計算するデータは、さらに、変数s(i=1、2、・・・、N)を要素とするスピンのベクトル(s,s,・・・,s)を含んでいてもよい。第1ベクトルのそれぞれの要素を符号関数で変換することにより、スピンのベクトルを得ることができる。
【0134】
[変数の更新処理の並列化の例]
以下では、シミュレーテッド分岐アルゴリズムの計算時における変数の更新処理の並列化の例について説明する。
【0135】
はじめに、PCクラスタへシミュレーテッド分岐アルゴリズムを実装した例について説明する。PCクラスタとは、複数台のコンピュータを接続し、1台のコンピュータでは得られない計算性能を実現するシステムである。例えば、図1に示した情報処理システム100は、複数台の計算サーバおよびプロセッサを含んでおり、PCクラスタとして利用することが可能である。例えば、PCクラスタにおいては、MPI(Message Passing Interface)を使うことにより、情報処理システム100のような複数の計算サーバにメモリが分散して配置されている構成でも並列的な計算を実行することが可能である。例えば、MPIを使って管理サーバ1の制御プログラム14E、各計算サーバの計算プログラム34Bおよび制御プログラム34Cを実装することができる。
【0136】
PCクラスタで利用するプロセッサ数がQである場合、それぞれのプロセッサに、第1ベクトル(x,x,・・・,x)に含まれる変数xのうち、L個の変数の計算を行わせることができる。同様に、それぞれのプロセッサに、第2ベクトル(y,y,・・・,y)に含まれる変数yのうち、L個の変数の計算を行わせることができる。すなわち、プロセッサ#j(j=1,2,・・・,Q)は、変数{x|m=(j-1)L+1,(j-1)L+2,・・・,jL}および{y|m=(j-1)L+1,(j-1)L+2,・・・,jL}の計算を行う。また、プロセッサ#jによる{y|m=(j-1)L+1,(j-1)L+2,・・・,jL}の計算に必要な下記の(17)に示されたテンソルJ(n)は、プロセッサ#jがアクセス可能な記憶領域(例えば、レジスタ、キャッシュ、メモリなど)に保存されるものとする。
【数17】
【0137】
ここでは、それぞれのプロセッサが第1ベクトルおよび第2ベクトルの一定数の変数を計算する場合を説明した。ただし、プロセッサによって、計算対象とする第1ベクトルおよび第2ベクトルの要素(変数)の数が異なっていてもよい。例えば、計算サーバに実装されるプロセッサによって性能差がある場合、プロセッサの性能に応じて計算対象とする変数の数を決めることができる。
【0138】
変数yの値を更新するためには、第1ベクトル(x,x,・・・,x)のすべての成分の値が必要となる。2値変数への変換は、例えば、符号関数sgn()を使うことによって行うことができる。そこで、Allgather関数を使い、第1ベクトル(x,x,・・・,x)のすべての成分の値をQ個のプロセッサに共有させることができる。第1ベクトル(x,x,・・・,x)については、プロセッサ間での値の共有が必要であるものの、第2ベクトル(y,y,・・・,y)およびテンソルJ(n)については、プロセッサ間での値の共有を行うことは必須ではない。プロセッサ間でのデータの共有は、例えば、プロセッサ間通信を使ったり、共有メモリにデータを保存したりすることによって実現することができる。
【0139】
プロセッサ#jは、問題項{z|m=(j-1)L+1,(j-1)L+2,・・・,jL}の値を計算する。そして、プロセッサ#jは、計算した問題項{{z|m=(j-1)L+1,(j-1)L+2,・・・,jL}の値に基づき、変数{y|m=(j-1)L+1,(j-1)L+2,・・・,jL}を更新する。
【0140】
上述の各式に示したように、問題項のベクトル(z,z,・・・,z)の計算では、テンソルJ(n)と、ベクトル(x,x,・・・,x)との積の計算を含む、積和演算が必要である。積和演算は、上述のアルゴリズムにおいて最も計算量の大きい処理であり、計算速度の向上においてボトルネックとなりうる。そこで、PCクラスタの実装では、積和演算を、Q=N/L個のプロセッサに分散して並列的に実行し、計算時間の短縮をはかることができる。
【0141】
図12は、マルチプロセッサ構成の例を概略的に示している。図12の複数の計算ノードは、例えば、情報処理システム100の複数の計算サーバに相当する。また、図12の高速リンクは、例えば、情報処理システム100のケーブル4a~4cおよびスイッチ5によって形成された計算サーバ間のインターコネクトに相当する。図12の共有メモリは、例えば、共有メモリ32に相当する。図12のプロセッサは、例えば、各計算サーバのプロセッサ33A~33Dに相当している。なお、図12には複数の計算ノードが示されているが、単一計算ノードの構成を用いることを妨げるものではない。
【0142】
図12には、各構成要素に配置されるデータおよび構成要素間で転送されるデータが示されている。各プロセッサでは、変数x、yの値が計算される。また、プロセッサと共有メモリ間では、変数xが転送される。各計算ノードの共有メモリには、例えば、第1ベクトル(x,x,・・・,x)、第2ベクトル(y,y,・・・,y)のL個の変数、およびテンソルJ(n)の一部が保存される。そして、計算ノード間を接続する高速リンクでは、例えば、第1ベクトル(x,x,・・・,x)が転送される。Allgather関数を使う場合、各プロセッサで変数yを更新するために、第1ベクトル(x,x,・・・,x)の全要素が必要となる。
【0143】
なお、図12に示したデータの配置および転送は一例にしかすぎない。PCクラスタにおけるデータの配置方法、転送方法および並列化の実現方法については、特に問わない。
【0144】
また、GPU(Graphics Processing Unit)を使ってシミュレーテッド分岐アルゴリズムの計算を行ってもよい。
【0145】
図13は、GPUを使った構成の例を概略的に示している。図13には、互いに高速リンクで接続された複数のGPUが示されている。それぞれのGPUには、共有メモリにアクセス可能な複数のコアが搭載されている。また、図13の構成例では、複数のGPUが高速リンクを介して接続されており、GPUクラスタを形成している。例えば、GPUが図1のそれぞれの計算サーバに搭載されている場合、高速リンクは、ケーブル4a~4cおよびスイッチ5によって形成された計算サーバ間のインターコネクトに相当する。なお、図13の構成例では、複数のGPUが使われているが、ひとつのGPUを使った場合にも、並列的な計算を実行することが可能である。すなわち、図13のそれぞれのGPUは、図16のそれぞれの計算ノードに相当する計算を実行できる。すなわち、情報処理装置(計算サーバ)のプロセッサ(処理回路)は、Graphics Processing Unit(GPU)のコアであってもよい。
【0146】
GPUにおいて、変数xおよびy、ならびにテンソルJ(n)はデバイス変数として定義される。GPUは、変数yの更新に必要なテンソルJ(n)と第1ベクトル(x,x,・・・,x)の積を、行列ベクトル積関数によって並列的に計算することができる。なお、行列とベクトルの積演算を繰り返し実行することにより、テンソルとベクトルの積を求めることができる。また、第1ベクトル(x,x,・・・,x)の計算と、第2ベクトル(y,y,・・・,y)のうち、積和演算以外の部分については、それぞれのスレッドにi番目の要素(x,y)の更新処理を実行させ、処理の並列化を実現することができる。
【0147】
情報処理装置は、複数の処理回路を備えていてもよい。この場合、それぞれの処理回路は、並列的に第1ベクトルの少なくとも一部および第2ベクトルの少なくとも一部を更新するように構成されていてもよい。
【0148】
また、情報処理システムは、複数の情報処理装置を備えていてもよい。この場合、それぞれの処理回路は、並列的に第1ベクトルの少なくとも一部および第2ベクトルの少なくとも一部を更新するように構成されていてもよい。
【0149】
[組合せ最適化問題を解くための全体的な処理]
以下では、シミュレーテッド分岐アルゴリズムを用いて組合せ最適化問題を解くために実行される全体的な処理を説明する。
【0150】
図14のフローチャートは、組合せ最適化問題を解くために実行される全体的な処理の例を示している。以下では、図14を参照しながら、処理を説明する。
【0151】
はじめに、組合せ最適化問題を定式化する(ステップS201)。そして、定式化された組合せ最適化問題をイジング問題(イジングモデルの形式)に変換する(ステップS202)。次に、イジングマシン(情報処理装置)によってイジング問題の解を計算する(ステップS203)。そして、計算された解を検証する(ステップS204)。例えば、ステップS204では、制約条件が満たされているか否かの確認が行われる。また、ステップS204で目的関数の値を参照し、得られた解が最適解またはそれに近い近似解であるか否かの確認を行ってもよい。
【0152】
そして、ステップS204における検証結果または計算回数の少なくともいずれかに応じて再計算をするか否かを判定する(ステップS205)。再計算をすると判定された場合(ステップS205のYES)、ステップS203およびS204の処理が再び実行される。一方、再計算をしないと判定された場合(ステップS205のNO)、解の選択を行う(ステップS206)。例えば、ステップS206では、制約条件の充足または目的関数の値の少なくともいずれかに基づき選択を行うことができる。なお、複数の解が計算されていない場合には、ステップS206の処理をスキップしてもよい。最後に、選択した解を組合せ最適化問題の解に変換し、組合せ最適化問題の解を出力する(ステップS207)。
【0153】
上述で説明した情報処理装置、情報処理システム、情報処理方法、記憶媒体およびプログラムを使うことにより、組合せ最適化問題の解を実用的な時間内で計算することが可能となる。これにより、組合せ最適化問題の求解がより容易となり、社会のイノベーションおよび科学技術の進歩を促進することが可能となる。
【0154】
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組合せてもよい。
【符号の説明】
【0155】
1 管理サーバ
2 ネットワーク
3a、3b、3c 計算サーバ
4a、4b、4c ケーブル
5 スイッチ
6 クライアント端末
10 プロセッサ
11 管理部
12 変換部
13 制御部
14 記憶部
14A 問題データ
14B 計算データ
14C 管理プログラム
14D 変換プログラム
14E、34C 制御プログラム
15、31 通信回路
16 入力回路
17 出力回路
18 操作装置
19 表示装置
20 バス
32 共有メモリ
33A、33B、33C、33D プロセッサ
34 ストレージ
34A 計算データ
34B 計算プログラム
35 ホストバスアダプタ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14