(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-09
(45)【発行日】2022-08-18
(54)【発明の名称】サンプリング装置を使用して複数のモデルの物理量を推定する方法及びシステム
(51)【国際特許分類】
G06N 10/60 20220101AFI20220810BHJP
G06N 99/00 20190101ALI20220810BHJP
【FI】
G06N10/60
G06N99/00 180
【外国語出願】
(21)【出願番号】P 2021038119
(22)【出願日】2021-03-10
【審査請求日】2021-06-24
(32)【優先日】2020-03-10
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】518300652
【氏名又は名称】1キュービー インフォメーション テクノロジーズ インコーポレイテッド
【氏名又は名称原語表記】1QB INFORMATION TECHNOLOGIES INC.
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100221899
【氏名又は名称】高倉 みゆき
(72)【発明者】
【氏名】プーヤ ロナー
(72)【発明者】
【氏名】ナヴィッド ガダーマージー
(72)【発明者】
【氏名】ボーダン クルチツキー
(72)【発明者】
【氏名】アンナ レヴィット
【審査官】多賀 実
(56)【参考文献】
【文献】米国特許出願公開第2020/0057957(US,A1)
【文献】米国特許出願公開第2017/0255872(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 10/00-10/80
G06N 99/00
(57)【特許請求の範囲】
【請求項1】
基底ハミルトニアンを使用して少なくとも1つの標的ハミルトニアンの観測可能値の期待値を推定する方法であって、前記方法は、
a.基底ハミルトニアンの指標及び観測可能値の指標を取得するステップと、
b.前記基底ハミルトニアンを使用してサンプリング装置を設定するステップと、
c.前記サンプリング装置を使用して、前記基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得するステップと、
d.少なくとも1つの標的ハミルトニアンのリストの各標的ハミルトニアンに対して、
i.前記基底ハミルトニアンによって定められる前記確率分布から取得した前記複数のサンプルを使用して、前記標的ハミルトニアンに対応する前記観測可能値の期待値を推定し、
ii.前記標的ハミルトニアンに対応する前記観測可能値の推定期待値を提供するステップと、を含み、前記複数のサンプルの使用は、
1.前記標的ハミルトニアンと前記基底ハミルトニアンとの分配関数の比のサンプル推定値を計算することと、
2.前記標的ハミルトニアンによって定められる前記確率分布に関する前記観測可能値の期待値の非正規化推定値を計算することと、
3.分配関数の推定比及び非正規化推定期待値を使用して、前記標的ハミルトニアンによって定められる前記確率分布に関する前記観測可能値の前記期待値の推定値を計算することと、を含む、方法。
【請求項2】
パラメータ化標的ハミルトニアンによって表される標的ハミルトニアンのファミリーによって定められる自由エネルギーのパラメータ化された負の最大値及び最大値の引数を推定する方法であって、前記方法は、
g.基底ハミルトニアンのファミリーの指標を取得するステップと、
h.前記基底ハミルトニアンのファミリーから初期基底ハミルトニアンを選択するステップと、
i.パラメータ化標的ハミルトニアンの指標を取得するステップと、
j.第1の停止基準が満たされるまで、
i.現在の基底ハミルトニアンを更新し、
ii.前記現在の基底ハミルトニアンを使用してサンプリング装置を設定し、
iii.前記サンプリング装置を使用して、前記現在の基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得し、
i.初期パラメータ値を選択し、
v.第2の停止基準が満たされるまで、
1.パラメータ値を更新し、
2.前記パラメータ化標的ハミルトニアンを使用して前記パラメータ値に対応する標的ハミルトニアンの指標を取得し、
3.取得した前記基底ハミルトニアンによって定められる前記確率分布から取得した前記サンプルを使用して、前記パラメータ値に対応する標的ハミルトニアン分配関数と現在の基底ハミルトニアン分配関数の比を推定し、
4.前記標的ハミルトニアンの自由エネルギーを推定し、
5.推定比、取得した前記標的ハミルトニアンによって定められる前記自由エネルギー、及び対応するパラメータ値を提供するステップと、
k.前記パラメータ化標的ハミルトニアンによって定められる自由エネルギーのパラメータ化された負の少なくとも1つの最大値及び少なくとも1つの最大値の引数を推定するステップと、
l.自由エネルギーのパラメータ化された負の少なくとも1つの推定最大値及び少なくとも1つの推定最大値の引数を提供するステップと、を含む、方法。
【請求項3】
前記基底ハミルトニアンのファミリーが1つの基底ハミルトニアンを含む、請求項2に記載の方法。
【請求項4】
前記基底ハミルトニアンのファミリーが、パラメータ化基底ハミルトニアンによって表される、請求項2に記載の方法。
【請求項5】
前記現在の基底ハミルトニアンが、勾配ベースの方法に基づく少なくとも1つの最適化プロトコルを使用して更新される、請求項2に記載の方法。
【請求項6】
前記現在の基底ハミルトニアンが、微分不要法に基づく少なくとも1つの最適化プロトコルを使用して更新される、請求項2に記載の方法。
【請求項7】
前記現在の基底ハミルトニアンの更新が、勾配降下、確率勾配降下、最急降下、ベイズ最適化、ランダム検索及び局所検索からなる群から選択される方法に基づく少なくとも1つの最適化プロトコルを使用して実行される、請求項2に記載の方法。
【請求項8】
前記パラメータ値の更新が、勾配ベースの方法に基づく少なくとも1つの最適化プロトコルを使用して実行される、請求項2に記載の方法。
【請求項9】
前記パラメータ値の更新が、微分不要法に基づく少なくとも1つの最適化プロトコルを使用して実行される、請求項2に記載の方法。
【請求項10】
前記パラメータ値の更新が、勾配降下、確率勾配降下、最急降下、ベイズ最適化、ランダム探索及び局所探索からなる群から選択される少なくとも1つの方法に基づく最適化プロトコルを使用して実行される、請求項2に記載の方法。
【請求項11】
基底ハミルトニアンからのサンプルを使用して、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の最大値及び最大値の引数を推定する方法であって、前記方法は、
基底ハミルトニアンの指標を取得するステップと、
標的ハミルトニアンのファミリーの指標を取得するステップと、
前記基底ハミルトニアンを使用してサンプリング装置を設定するステップと、
前記サンプリング装置を使用して、前記基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得するステップと、
前記標的ハミルトニアンのファミリーを表す標的ハミルトニアンのリストの各標的ハミルトニアンに対して、
前記基底ハミルトニアンによって定められる前記確率分布から取得した前記サンプルを使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比を推定し、
推定比をリストに格納し、
前記推定比の前記リストを使用して、前記標的ハミルトニアンの前記ファミリーによって定められる自由エネルギーの負の少なくとも1つの最大値を推定し、
前記標的ハミルトニアンの前記ファミリーによって定められる自由エネルギーの負の少なくとも1つの推定最大値を提供するステップと、を含む、方法。
【請求項12】
サンプリング装置を使用して、標的ハミルトニアンと基底ハミルトニアンによって定められる2つのモデルのエントロピー間の差を推定する方法であって、前記方法は、
基底ハミルトニアンの指標を取得するステップと、
標的ハミルトニアンの指標を取得するステップと、
前記基底ハミルトニアンを使用してサンプリング装置を設定するステップと、
前記サンプリング装置を使用して、前記基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得するステップと、
取得した前記サンプルを使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比を推定するステップと、
請求項1の処理ステップd.i.1、d.i.2及びd.i.3を使用して、前記標的ハミルトニアンに対応するエネルギー観測可能値の期待値を推定するステップと、
前記標的ハミルトニアンに対応する前記エネルギー観測可能値の推定比及び推定期待値を使用して、前記標的ハミルトニアンに対応するエントロピーと前記基底ハミルトニアンに対応するエントロピー間の差を推定するステップと、
前記標的ハミルトニアンに対応するエントロピーと前記基底ハミルトニアンに対応するエントロピー間の推定差を提供するステップと、を含む、方法。
【請求項13】
前記観測可能値の前記推定期待値がエネルギー関数期待値を含む、請求項1に記載の方法。
【請求項14】
前記観測可能値の前記推定期待値がn点関数を含む、請求項1に記載の方法。
【請求項15】
前記サンプリング装置が、処理装置に動作可能に結合される量子プロセッサを含み、
さらに、サンプリング装置制御システムが、量子プロセッサ制御システムを含む、請求項1~14のいずれか一項に記載の方法。
【請求項16】
前記サンプリング装置が量子コンピュータを含む、請求項1~14のいずれか一項に記載の方法。
【請求項17】
前記サンプリング装置が量子アニーラを含む、請求項1~14のいずれか一項に記載の方法。
【請求項18】
前記サンプリング装置が、ノイズのある中規模量子デバイスを含む、請求項1~14のいずれか一項に記載の方法。
【請求項19】
前記サンプリング装置がトラップイオン量子コンピュータを含む、請求項1~14のいずれか一項に記載の方法。
【請求項20】
前記サンプリング装置が、超伝導ベースの量子コンピュータを含む、請求項1~14のいずれか一項に記載の方法。
【請求項21】
前記サンプリング装置が、スピンベースの量子ドットコンピュータを含む、請求項1~14のいずれか一項に記載の方法。
【請求項22】
前記サンプリング装置がデジタルアニーラを含む、請求項1~14のいずれか一項に記載の方法。
【請求項23】
前記サンプリング装置が、集積フォトニックコヒーレントイジングマシンを含む、請求項1~14のいずれか一項に記載の方法。
【請求項24】
前記サンプリング装置が、処理装置に動作可能に結合されるとともに、光エネルギー源からエネルギーを受け取って複数の光パラメトリック発振器を生成するように構成される光コンピューティング装置と、各々が複数の光パラメトリック発振器を制御可能に結合する複数の結合装置と、を含む、請求項1~14のいずれか一項に記載の方法。
【請求項25】
前記観測可能値の前記推定期待値を関数近似器として使用するステップをさらに含む、請求項1に記載の方法。
【請求項26】
前記自由エネルギーを関数近似器として使用するステップをさらに含む、請求項2~11のいずれか一項に記載の方法。
【請求項27】
ハミルトニアンの熱力学的特性を推定するステップと、前記熱力学的特性を関数近似器として使用するステップと、をさらに含む、請求項1に記載の方法。
【請求項28】
強化学習フレームワークにおけるトレーニング手順に対して請求項1~27のいずれか一項に記載の方法の使用方法であって、前記強化学習フレームワークは、
(i)少なくとも1つの効用関数の最適化を追求するエージェントと、
(ii)状態及び瞬時報酬を含む環境と、
(iii)行動を含む前記環境と前記エージェントとの相互作用と、を含み、
前記瞬時報酬は前記少なくとも1つの効用関数に寄与し、
前記使用方法は、前記少なくとも1つの効用関数を近似するステップと、提供される状態に対応する前記少なくとも1つの効用関数を最大化する行動を推定するステップと、を含む、使用方法。
【請求項29】
前記少なくとも1つの効用関数が、価値関数、Q関数及び一般化利点推定器からなる群から選択される、請求項28に記載の使用方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の1つ以上の実施形態は、サンプリング装置を使用して複数のモデルの物理量を推定することを対象としている。特に、本発明の1つ以上の実施形態は、これらのモデルからサンプリングするように構成することができない量子デバイスを使用して、異なるモデルの様々な観測可能値を推定することを可能にする。
【背景技術】
【0002】
今日の科学界では、様々な種類のノイズのある中規模量子(NISQ)デバイス、並びに他の物理学に着想される装置及びコンピュータが、絶えず開発、改良、発売されている。これらの機械が実行することができる便利なタスクの1つに確率的サンプリングがある。これは、物理モデルに対する様々な特性及び機能の推定及び評価に利用できる。特に、確率的サンプリングは機械学習法に使用することができる。これらの機械は、背後にある様々な量子及び/又は他の物理現象により、このタスクを大幅に高速化できるにもかかわらず、サイズ、接続性、深さ、及びこれらの機械に実装することができるモデルタイプを定める他の特徴などの多くの態様において、依然として限定されている。
【0003】
本明細書では、このようなコンピュータに実装されている限られたタイプのモデルに関連する少なくとも1つの限定を克服する少なくとも1つの方法及びシステムが必要であると認識されている。
【発明の概要】
【課題を解決するための手段】
【0004】
広義の態様によれば、基底ハミルトニアンを使用して少なくとも1つの標的ハミルトニアンの観測可能値の期待値を推定する方法が開示されており、本方法は、基底ハミルトニアンの指標及び観測可能値の指標を取得するステップと、基底ハミルトニアンを使用してサンプリング装置を設定するステップと、前記サンプリング装置を使用して、基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得するステップと、少なくとも1つの標的ハミルトニアンのリストの各標的ハミルトニアンに対して、基底ハミルトニアンによって定められる確率分布から取得した複数のサンプルを使用して標的ハミルトニアンに対応する観測可能値の期待値を推定し、標的ハミルトニアンに対応する観測可能値の推定期待値を提供するステップと、を含み、複数のサンプルの使用は、標的ハミルトニアンと基底ハミルトニアンとの分配関数の比のサンプル推定値を計算することと、標的ハミルトニアンによって定められる確率分布に関する観測可能値の期待値の非正規化推定値を計算することと、分配関数の推定比及び非正規化推定期待値を使用して、標的ハミルトニアンによって定められる確率分布に関する観測可能値の期待値の推定値を計算することと、を含む。
【0005】
広義の態様によれば、パラメータ化標的ハミルトニアンによって表される標的ハミルトニアンのファミリーによって定められる自由エネルギーのパラメータ化された負の最大値及び最大値の引数を推定する方法が開示され、本方法は、基底ハミルトニアンのファミリーの指標を取得するステップと、基底ハミルトニアンのファミリーから初期基底ハミルトニアンを選択するステップと、パラメータ化標的ハミルトニアンの指標を取得するステップと、第1の停止基準が満たされるまで、現在の基底ハミルトニアンを更新し、現在の基底ハミルトニアンを使用してサンプリング装置を設定し、サンプリング装置を使用して、現在の基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得し、初期パラメータ値を選択し、第2の停止基準が満たされるまで、パラメータ値を更新し、パラメータ化標的ハミルトニアンを使用してパラメータ値に対応する標的ハミルトニアンの指標を取得し、取得した基底ハミルトニアンによって定められる確率分布から取得したサンプルを使用して、パラメータ値に対応する標的ハミルトニアン分配関数と現在の基底ハミルトニアン分配関数の比を推定し、標的ハミルトニアンの自由エネルギーを推定し、推定比、取得した標的ハミルトニアンによって定められる自由エネルギー、及び対応するパラメータ値を提供するステップと、パラメータ化標的ハミルトニアンによって定められる自由エネルギーのパラメータ化された負の少なくとも1つの最大値及び少なくとも1つの最大値の引数を推定するステップと、自由エネルギーのパラメータ化された負の少なくとも1つの推定最大値及び少なくとも1つの推定最大値の引数を提供するステップと、を含む。
【0006】
1つ以上の実施形態によれば、基底ハミルトニアンのファミリーは、1つの基底ハミルトニアンを含む。
【0007】
1つ以上の実施形態によれば、基底ハミルトニアンのファミリーは、パラメータ化基底ハミルトニアンによって表される。
【0008】
1つ以上の実施形態によれば、現在の基底ハミルトニアンは、勾配ベースの方法に基づく少なくとも1つの最適化プロトコルを使用して更新される。
【0009】
1つ以上の実施形態によれば、現在の基底ハミルトニアンは、微分不要法に基づく少なくとも1つの最適化プロトコルを使用して更新される。
【0010】
1つ以上の実施形態によれば、現在の基底ハミルトニアンの更新は、勾配降下、確率勾配降下、最急降下、ベイズ最適化、ランダム探索及び局所探索からなる群から選択される方法に基づく少なくとも1つの最適化プロトコルを使用して実行される。
【0011】
1つ以上の実施形態によれば、パラメータ値の更新は、勾配ベースの方法に基づく少なくとも1つの最適化プロトコルを使用して実行される。
【0012】
1つ以上の実施形態によれば、パラメータ値の更新は、微分不要法に基づく少なくとも1つの最適化プロトコルを使用して実行される。
【0013】
1つ以上の実施形態によれば、パラメータ値の更新は、勾配降下、確率勾配降下、最急降下、ベイズ最適化、ランダム探索及び局所探索からなる群から選択される少なくとも1つの方法に基づく最適化プロトコルを使用して実行される。
【0014】
広義の態様によれば、基底ハミルトニアンからのサンプルを使用して、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の最大値及び最大値の引数を推定する方法が開示され、本方法は、基底ハミルトニアンの指標を取得するステップと、標的ハミルトニアンのファミリーの指標を取得するステップと、基底ハミルトニアンを使用してサンプリング装置を設定するステップと、サンプリング装置を使用して、基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得するステップと、標的ハミルトニアンのファミリーを表す標的ハミルトニアンのリストの各標的ハミルトニアンに対して:基底ハミルトニアンによって定められる確率分布から取得したサンプルを使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比を推定し、推定比をリストに格納し、推定比のリストを使用して、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の少なくとも1つの最大値を推定し、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の少なくとも1つの推定最大値を提供するステップと、を含む。
【0015】
広義の態様によれば、サンプリング装置を使用して、標的ハミルトニアンと基底ハミルトニアンによって定められる2つのモデルのエントロピー間の差を推定する方法が開示され、本方法は、基底ハミルトニアンの指標を取得するステップと、標的ハミルトニアンの指標を取得するステップと、基底ハミルトニアンを使用してサンプリング装置を設定するステップと、サンプリング装置を使用して、基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得するステップと、取得したサンプルを使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比を推定するステップと、上述の処理ステップを使用して、標的ハミルトニアンに対応するエネルギー観測可能値の期待値を推定するステップと、標的ハミルトニアンに対応するエネルギー観測可能値の推定比及び推定期待値を使用して、標的ハミルトニアンに対応するエントロピーと基底ハミルトニアンに対応するエントロピー間の差を推定するステップと、標的ハミルトニアンに対応するエントロピーと基底ハミルトニアンに対応するエントロピー間の推定差を提供するステップと、を含む。
【0016】
1つ以上の実施形態によれば、観測可能値の推定期待値はエネルギー関数期待値を含む。
【0017】
1つ以上の実施形態によれば、観測可能値の推定期待値はn点関数を含む。
【0018】
1つ以上の実施形態によれば、サンプリング装置は、処理装置に動作可能に結合される量子プロセッサを含み、さらに、サンプリング装置制御システムは、量子プロセッサ制御システムを含む。
【0019】
1つ以上の実施形態によれば、サンプリング装置は量子コンピュータを含む。
【0020】
1つ以上の実施形態によれば、サンプリング装置は量子アニーラを含む。
【0021】
1つ以上の実施形態によれば、サンプリング装置は、ノイズのある中規模量子デバイスを含む。
【0022】
1つ以上の実施形態によれば、サンプリング装置は、トラップイオン量子コンピュータを含む。
【0023】
1つ以上の実施形態によれば、サンプリング装置は、超伝導ベースの量子コンピュータを含む。
【0024】
1つ以上の実施形態によれば、サンプリング装置は、スピンベースの量子ドットコンピュータを含む。
【0025】
1つ以上の実施形態によれば、サンプリング装置はデジタルアニーラを含む。
【0026】
1つ以上の実施形態によれば、サンプリング装置は、集積フォトニックコヒーレントイジング(Ising)マシンを含む。
【0027】
1つ以上の実施形態によれば、サンプリング装置は、処理装置に動作可能に結合されるとともに、光エネルギー源からエネルギーを受け取って複数の光パラメトリック発振器を生成するように構成される光コンピューティング装置と、各々が複数の光パラメトリック発振器を制御可能に結合する複数のカップリング装置と、を含む。
【0028】
1つ以上の実施形態によれば、本方法は、観測可能値の推定期待値を関数近似器として使用するステップをさらに含む。
【0029】
1つ以上の実施形態によれば、本方法は、自由エネルギーを関数近似器として使用するステップをさらに含む。
【0030】
1つ以上の実施形態によれば、本方法は、ハミルトニアンの熱力学的特性を推定するステップと、熱力学的特性を関数近似器として使用するステップと、をさらに含む。
【0031】
広義の態様によれば、強化学習フレームワークにおけるトレーニング手順に対する上述した方法の使用方法が開示され、強化学習フレームワークは、(i)少なくとも1つの効用関数の最適化を追求するエージェントと、(ii)状態及び瞬時報酬を含む環境と、(iii)行動を含む環境とエージェントとの相互作用と、を含み、瞬時報酬は少なくとも1つの効用関数に寄与し、使用方法は、少なくとも1つの効用関数を近似するステップと、提供される状態に対応する少なくとも1つの効用関数を最大化する行動を推定するステップと、を含む。
【0032】
1つ以上の実施形態によれば、少なくとも1つの効用関数は、価値関数、Q関数及び一般化利点推定器からなる群から選択される。
【0033】
本明細書に開示される本発明の1つ以上の実施形態は、様々な理由から非常に有利である。より正確には、本明細書に開示される方法の1つ以上の実施形態の利点は、サンプリング装置の機能を拡張して、装置上で構成可能でないモデルの観測可能値の期待値を推定することである。
【0034】
本明細書に開示される方法の1つ以上の実施形態の別の利点は、エントロピーを使用して様々なモデルを比較できることである。
【0035】
本明細書に開示される方法の1つ以上の実施形態の別の利点は、1つのサンプリングのみを用いて、ハミルトニアンのファミリーの自由エネルギーの負の最大値及び最大値の引数を推定できることである。
【0036】
本明細書に開示される方法の1つ以上の実施形態の別の利点は、様々なサンプリング装置を使用して実装できることである。
【0037】
本明細書に開示される方法の別の利点は、強化学習に適用できることである。
【図面の簡単な説明】
【0038】
【
図1】量子デバイスを含むサンプリング装置に結合されるデジタルシステムを含むシステムの実施形態を示す図である。
【
図2】2つのハミルトニアンの分配関数の比に対するサンプル推定値を計算する方法の実施形態を示すフローチャートである。
【
図3】
図1に示すシステムを使用してハミルトニアンのリストに対応する観測可能値の期待値を推定する方法の実施形態を示すフローチャートである。
【
図4】基底ハミルトニアンによって定められる確率分布から取得したサンプルを使用して、標的ハミルトニアンに対応する観測可能値の期待値を推定する手順の実施形態を示すフローチャートである。
【
図5】標的ハミルトニアンと基底ハミルトニアンによって定められる2つのモデルのエントロピー間の差を推定する方法の実施形態を示すフローチャートである。
【
図6】パラメータ化標的ハミルトニアンによって表される標的ハミルトニアンのファミリーによって定められる、自由エネルギーのパラメータ化された負の最大値及び最大値の引数を推定する方法の実施形態を示すフローチャートである。
【
図7】標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の最大値及び最大値の引数を推定する方法の実施形態を示すフローチャートである。
【発明を実施するための形態】
【0039】
本発明を容易に理解できるように、本発明の実施形態を添付の図面に例示する。
【0040】
1つ以上の実施形態の以下の説明では、添付の図面への参照は、本発明を実施することができる一例を例示するためのものである。
【0041】
[用語]
「発明」等の用語は、明示的に別段の定めがない限り、「本願に開示される1つ以上の発明」を意味する。
【0042】
「態様」、「ある実施形態」、「実施形態」、「(複数の)実施形態」、「その実施形態」、「その(複数の)実施形態」、「1つ以上の実施形態」、「一部の実施形態」、「特定の実施形態」、「一実施形態」、「別の実施形態」等の用語は、明示的に別段の定めがない限り、「開示された発明の(全部ではないが)1つ以上の実施形態」を意味する。
【0043】
実施形態を説明中の「別の実施形態」又は「別の態様」の参照は、明示的に別段の定めがない限り、参照する実施形態が別の実施形態(例えば、参照される実施形態の前に記載された実施形態)と相互に排他的であることを意味しない。
【0044】
「含む」、「備える」及びこれらの変形の用語は、明示的に別段の定めがない限り、「含むが、これに限定されない」を意味する。
【0045】
原文「a」、「an」、「the」及び「少なくとも1つの」という用語は、明示的に別段の定めがない限り、「1つ以上」を意味する。
【0046】
「複数の」という用語は、明示的に別段の定めがない限り、「2つ以上の」を意味する。
【0047】
「本明細書において」という用語は、明示的に別段の定めがない限り、「参照により組み込まれるあらゆるものを含む本出願において」を意味する。
【0048】
「これにより(それにより)」という用語は、本明細書において、先に明示的に記載されている何かの意図された結果、目的又は結果のみを表現する項又は他の言葉のセットの前にのみ使用される。したがって、「これにより(それにより)」という用語が請求項において使用される場合、「これにより(それにより)」という用語が修飾する項又は他の言葉は、請求項の特定のさらなる限定を確立するものではなく、又は別の方法で請求項の意味若しくは範囲を制限するものでもない。
【0049】
「例えば(e.g.)」等の用語は、「例えば」を意味し、したがってこれらが説明する用語又は語句を限定しない。例えば、「コンピュータはインターネットを介してデータ(例えば、命令、データ構造)を送信する」という文において、「例えば」という用語は、「命令」はコンピュータがインターネットを介して送信することができる「データ」の一例であり、「データ構造」はコンピュータがインターネットを介して送信することができる「データ」の一例であることを説明する。しかし、「命令」と「データ構造」の両方は、単に「データ」の例であり、「命令」と「データ構造」以外の他のものも「データ」であり得る。
【0050】
「すなわち(i.e.)」等の用語は、「つまり」を意味し、したがってそれらが説明する用語又は句を限定する。
【0051】
本明細書で使用される「アナログコンピュータ」という用語は、通信バスを介して全てが互いに接続されている、量子プロセッサ、量子ビットの制御システム、カップリング装置及び読み出しシステムを含むシステムを意味する。
【0052】
本明細書で使用される「量子コンピュータ」及び「量子デバイス」という用語は、量子計算を実行するシステムを意味し、その計算には重ね合わせ及び絡み合い等の量子力学的現象を使用する。
【0053】
本明細書で使用される「強化学習」、「強化学習手順」及び「強化学習演算」という用語は、一般に、1つ以上の行動をとって環境との相互作用に対する累積報酬の何らかの概念を強化又は最大化する任意のシステム又は計算手順を指す。
【0054】
本明細書で使用される「サンプリング装置」という用語は、一般に、確率分布からサンプリングを実行するシステムを指す。
【0055】
本明細書で使用される「標的ハミルトニアン」及び「標的モデル」という用語は、一般に、対応する確率分布がサンプリング装置を使用してサンプリングされない対象のハミルトニアン/モデルを指す。
【0056】
本明細書で使用される「物理量」という用語は、一般に、測定によって定量化することができる物理系の特性を指す。
【0057】
発明の名称も要約も、本開示の発明の範囲を限定するものとして解釈されるべきではない。本願の発明の名称及び本願の表題は、便宜上にすぎず、本開示を限定するものとして解釈されるべきではない。
【0058】
本願には多くの実施形態が記載されており、例示のためにのみ提示される。開示の実施形態は、いかなる意味においても限定的ではなく、限定的であることを意図するものではない。本開示から容易に明らかであるように、本開示の発明は、多くの実施形態に広く適用可能である。当業者であれば、本開示の発明が構造的及び論理的な修正といった様々な修正及び変更の下で実施されてもよいことを認識するであろう。本開示の発明の特定の構成は、1つ以上の特定の実施形態及び/又は図面を参照して説明されることがあるが、このような構成は、明示的に別段の定めがない限り、これらが説明される1つ以上の特定の実施形態又は図面における使用に限定されないことを理解されたい。
【0059】
本発明の1つ以上の実施形態は、多くの方法で実装できることを理解されたい。本明細書では、これらの実装、又は本発明がとり得る任意の他の形態は、システム又は技術と呼ばれることがある。タスクを実行するように構成されていると記載されるプロセッサ又はメモリ等の構成要素は、所与の時間にタスクを実行するように一時的に構成される一般的な構成要素、又はタスクを実行するように製造される具体的な構成要素のいずれかを含む。
【0060】
これら全てを念頭に置いて、本発明の1つ以上の実施形態は、サンプリング装置を使用して複数のモデルの観測可能値の期待値を推定する方法を対象とする。
【0061】
[重要度サンプリングと比率トリック]
重要度サンプリングとは、1つの確率分布から生成されるサンプルを使用して、別の確率分布に関する不偏情報を抽出する一般的な手法である(参考:Statist. Sci. ,Volume 13, Number 2 (1998), 163-185. “Simulating normalizing constants: from importance sampling to bridge sampling to path sampling” by Andrew Gelman Xiao-Li Meng、“Efficient Multiple Importance Sampling Estimators” by Victor Elvira, Luca Martino, David Luengo, and Monica F. Bugallo. https://arxiv.org/pdf/1505.05391.pdf)。
【0062】
これは、典型的には標的分布よりも生成分布からサンプリングすることが容易である状況において有用である。重要度サンプリングの別の共通用途は、分散低減である。
【0063】
重要度サンプリングのより具体的な応用例は、2つの確率分布間の分配関数の比の評価である。重要度サンプリングのこの特別な使い方は、比率トリックと呼ばれる。当業者であれば、比率トリックが工学的及び科学的応用における重要なツールであることを理解するだろう。この比率トリックは、凝縮物質系の数値研究における絡み合いエントロピーの測定値にアクセスする方法を提供する。統計学及びコンピュータサイエンスでは、ボルツマンマシン等のエネルギーベースのグラフィカルモデルの性能評価に使用することができる。
【0064】
[物理学着想のコンピュータ]
物理学着想のコンピュータは、光パラメトリック発振器(OPO)及び集積フォトニックコヒーレントイジングマシン等の光コンピューティング装置、量子アニーラ又はゲートモデル量子コンピュータ等の量子コンピュータ、シミュレーテッドアニーリング、シミュレーテッド量子アニーリング、ポピュレーションアニーリング、量子モンテカルロ等の物理学着想の方法の実装、のうちの1つ以上を含むことができる。
【0065】
[量子デバイス]
任意のタイプの量子コンピュータが、本明細書に開示される技術の1つ以上の実施形態に適し得る。本明細書の記載によれば、好適な量子コンピュータは非限定的な例として以下を含むことができる。超伝導量子コンピュータ(量子ビットを小さな超伝導回路として実装-ジョセフソン接合)(Clarke, John, and Frank K. Wilhelm. "Superconducting quantum bits." Nature 453.7198 (2008): 1031)、トラップイオン量子コンピュータ(量子ビットをトラップイオンの状態として実装)(Kielpinski, David, Chris Monroe, and David J. Wineland. "Architecture for a large-scale ion-trap quantum computer." Nature 417.6890 (2002): 709)、光学格子量子コンピュータ(量子ビットを光学格子にトラップされた中性原子の状態として実装)(Deutsch, Ivan H., Gavin K. Brennen, and Poul S. Jessen. "Quantum computing with neutral atoms in an optical lattice." arXiv preprint quant-ph/0003022 (2000))、スピンベースの量子ドットコンピュータ(量子ビットをトラップ電子のスピン状態として実装)(Imamog, A., David D. Awschalom, Guido Burkard, David P. DiVincenzo, Daniel Loss, M. Sherwin, and A. Small. "Quantum information processing using quantum dot spins and cavity QED." arXiv preprint quant-ph/9904096 (1999))、空間ベースの量子ドットコンピュータ(量子ビットを二重量子ドットにおける電子の位置として実装)(Fedichkin, Leonid, Maxim Yanchenko, and K. A. Valiev. "Novel coherent quantum bit using spatial quantization levels in semiconductor quantum dot." arXiv preprint quant-ph/0006097 (2000))、結合量子細線(量子ビットを量子点接触で結合した量子細線のペアとして実装)(Bertoni, A., Paolo Bordone, Rossella Brunetti, Carlo Jacoboni, and S. Reggiani. "Quantum logic gates based on coherent electron transport in quantum wires." Physical Review Letters 84, no. 25 (2000): 5912)、核磁気共鳴量子コンピュータ(量子ビットを原子核スピンとして実装し、電波でプローブする)(Cory, David G., Mark D. Price, and Timothy F. Havel. "Nuclear magnetic resonance spectroscopy: An experimentally accessible paradigm for quantum computing." arXiv preprint quant-ph/9709001(1997))、固体NMR Kane量子コンピュータ(量子ビットをシリコン中のリンドナーの核スピン状態として実装)(Kane, Bruce E. "A silicon-based nuclear spin quantum computer." nature 393, no. 6681 (1998): 133)、電子対ヘリウム量子コンピュータ(量子ビットを電子スピンとして実装)(Lyon, Stephen Aplin. "Spin-based quantum computing using electrons on liquid helium." arXiv preprint cond-mat/0301581 (2006))、空洞量子電気力学ベースの量子コンピュータ(量子ビットを、高微分空洞に結合したトラップ原子の状態として実装)(Burell, Zachary. "An Introduction to Quantum Computing using Cavity QED concepts." arXiv preprint arXiv:1210.6512 (2012))、分子磁石ベースの量子コンピュータ(量子ビットをスピン状態として実装)(Leuenberger, Michael N., and Daniel Loss. "Quantum computing in molecular magnets." arXiv preprint cond-mat/0011415 (2001))、フラーレンベースのESR量子コンピュータ(量子ビットをフラーレンに包まれた原子又は分子の電子スピンとして実装)(Harneit, Wolfgang. "Quantum Computing with Endohedral Fullerenes." arXiv preprint arXiv:1708.09298 (2017))、線形光学量子コンピュータ(量子ビットを、ミラー、ビームスプリッタ及び位相調整器等の線形光学素子を通る光の異なるモードの処理状態として実装)(Knill, E., R. Laflamme, and G. Milburn. "Efficient linear optics quantum computation." arXiv preprint quant-ph/0006088 (2000))、ダイヤモンドベースの量子コンピュータ(量子ビットを、ダイヤモンド中の窒素-空孔中心の電子スピン又は核スピンとして実装)(Nizovtsev, A. P., S. Ya Kilin, F. Jelezko, T. Gaebal, Iulian Popa, A. Gruber, and Jorg Wrachtrup. "A quantum computer based on NV centers in diamond: optically detected nutations of single electron and nuclear spins." Optics and spectroscopy 99, no. 2 (2005): 233-244)、ボーズ-アインシュタイン凝縮ベースの量子コンピュータ(量子ビットを2成分のBECとして実装)(Byrnes, Tim, Kai Wen, and Yoshihisa Yamamoto. "Macroscopic quantum computation using Bose-Einstein condensates." arXiv preprint quantum-ph/1103.5512 (2011))、トランジスタベースの量子コンピュータ(量子ビットをナノフォトニック空洞に結合した半導体として実装)(Sun, Shuo, Hyochul Kim, Zhouchen Luo, Glenn S. Solomon, and Edo Waks. "A single-photon switch and transistor enabled by a solid-state quantum memory." arXiv preprint quant-ph/1805.01964 (2018))、希土類金属イオンドープ無機結晶ベースの量子コンピュータ(量子ビットを希土類金属イオンドープ無機結晶における原子基底状態超微細準位として実装)(Ohlsson, Nicklas, R. Krishna Mohan, and Stefan Kroll. "Quantum computer hardware based on rare-earth-ion-doped inorganic crystals." Optics communications 201, no. 1-3 (2002): 71-77)、金属様カーボンナノスフェアベースの量子コンピュータ(量子ビットを導電性カーボンナノスフェアの電子スピンとして実装)(Nafradi, Balint, Mohammad Choucair, Klaus-Peter Dinse, and Laszlo Forro. "Room temperature manipulation of long lifetime spins in metallic-like carbon nanospheres." arXiv preprint cond-mat/1611.07690 (2016))、及びD-Wave社の量子アニーラ(量子ビットを超伝導論理素子として実装)(Johnson, Mark W., Mohammad HS Amin, Suzanne Gildert, Trevor Lanting, Firas Hamze, Neil Dickson, R. Harris et al. "Quantum annealing with manufactured spins." Nature 473, no. 7346 (2011): 194-198)。
【0066】
[NISQ-ノイズのある中規模量子技術]
「ノイズのある中規模量子(NISQ)」という用語は、John Preskillが紹介したものである(John Preskill, “Quantum Computing in the NISQ era and beyond." arXiv:1801.00862)。ここで、「ノイズのある」とは、量子ビットに対する制御が不完全であることを意味し、「中規模」とは、量子ビットの数が50から数百までの範囲であり得ることを指す。NISQ量子デバイス、究極的には汎用量子コンピュータを構築する実現可能な候補として、超伝導量子ビット、人工原子、イオントラップ等から作られるいくつかの物理系を提案した。
【0067】
[量子アニーラ]
当業者であれば、量子アニーラが複数の製造された量子ビットからなる量子力学系であることを理解するだろう。
【0068】
各量子ビットには、局所磁場バイアスと呼ばれるバイアス源が誘導的に結合されている。1つ以上の実施形態では、バイアス源は、磁束を量子ビットに通して量子ビットの状態を制御するように使用される電磁装置である(米国特許出願公開第2006/0225165号明細書参照)。
【0069】
量子ビットの局所磁場バイアスは、プログラム可能かつ制御可能である。1つ以上の実施形態では、デジタル処理ユニットを含む量子ビット制御システムは、量子ビットの系に接続され、量子ビットの局所磁場バイアスをプログラミングして調整することができる。
【0070】
量子アニーラは、複数の量子ビットの複数のペア間の複数のカップリングをさらに含むことができる。1つ以上の実施形態では、2つの量子ビット間のカップリングは、両量子ビットに磁束を通す、両量子ビットに近接した装置である。同じ実施形態では、カップリングは、複合ジョセフソン接合によって遮断される超伝導回路で構成されてもよい。磁束は複合ジョセフソン接合を通り、結果として両量子ビットに磁束を通すことができる(米国特許出願公開第2006/0225165号明細書参照)。この磁束の強さは、量子イジング模型のエネルギーに二次的に寄与する。1つ以上の実施形態では、カップリング強度は、カップリング装置を両量子ビットに近接して調整することで強められる。
【0071】
カップリング強度は、制御可能かつプログラム可能であり得ることを理解されたい。1つ以上の実施形態では、デジタル処理ユニットを含む量子アニーラ制御システムは、複数のカップリングに接続され、量子アニーラのカップリング強度をプログラミングすることができる。
【0072】
1つ以上の実施形態では、量子アニーラは、初期設定から最終設定にかけて横磁場量子イジング模型の変換を行う。このような実施形態では、横磁場量子イジング模型の初期及び最終設定は、これらの対応する初期及び最終ハミルトニアンによって記述される量子系を提供する。
【0073】
量子アニーラは、このエネルギー関数の発見的な最適化装置として用いることができる。このようなアナログプロセッサの実施形態は、McGeoch, Catherine C. and Cong Wang, (2013), “Experimental Evaluation of an Adiabatic Quantum System for Combinatorial Optimization” Computing Frontiers,” May 14 16, 2013、及び米国特許出願公開第2006/0225165号明細書に開示されている。
【0074】
量子アニーラを使用して、有限温度における対応するイジング模型のボルツマン分布からサンプルを得ることができる(Bian, Z., Chudak, F., Macready, W. G. and Rose, G. (2010), “The Ising model: teaching an old problem new tricks”、及びAmin, M. H., Andriyash, E., Rolfe, J., Kulchytskyy, B., and Melko, R. (2016), “Quantum Boltzmann Machine” arXiv:1601.02036)。
【0075】
このサンプリング方法は量子サンプリングと呼ばれる。
【0076】
[光コンピューティング装置]
平衡状態近傍のイジング模型のボルツマン分布からサンプリングを実行することができるアナログシステムの別の実施形態は、光学装置である。
【0077】
1つ以上の実施形態では、光学装置は、米国特許出願公開第2016/0162798号明細書及び国際公開第2015/006494号パンフレットに開示されているような光パラメトリック発振器(OPO)のネットワークを含む。
【0078】
このような実施形態では、イジング模型の各スピンは、縮退して動作する光パラメトリック発振器(OPO)によってシミュレーションされる。
【0079】
縮退光パラメトリック発振器(OPO)は、発振閾値で二次相転移を起こす開放散系である。位相敏感増幅のため、縮退光パラメトリック発振器(OPO)は、上記閾値を超える振幅に対しては、ポンプ位相に関して0又はπのいずれかの位相で発振する可能性がある。上記位相はランダムであり、発振形成中の光パラメトリック下方変換に関連する量子ノイズの影響を受ける。したがって、縮退光パラメトリック発振器(OPO)は、その出力位相によって指定された2進数を自然に表す。この特性に基づいて、縮退光パラメトリック発振器(OPO)系を、イジングスピン系の物理的代表として利用することができる。各縮退光パラメトリック発振器(OPO)の位相はイジングスピンとして認識され、その振幅と位相は関係のあるスピン間のイジングカップリングの強さと符号によって決定される。
【0080】
縮退光パラメトリック発振器(OPO)は、強い光源によって励起するとき、イジング模型のスピン+1又は-1に対応する2つの位相状態のうちの一方をとる。相互結合を有するN個の実質的に同一の光パラメトリック発振器(OPO)のネットワークを同一の光源で励起して、イジングスピン系をシミュレーションした。ポンプを導入してから過渡期を経て、光パラメトリック発振器(OPO)のネットワークは、その熱平衡に近い定常状態に近づく。
【0081】
位相状態選択過程は、光パラメトリック発振器(OPO)の真空ゆらぎと相互結合に依存する。いくつかの実装では、ポンプが一定の振幅でパルス化され、他の実装では、ポンプ出力が徐々に増加し、さらに別の実装では、ポンプが他の方法で制御される。
【0082】
光学装置の1つ以上の実施形態では、イジング模型の複数のカップリングが、光パラメトリック発振器(OPO)間での光場のカップリングに使用される複数の構成可能なカップリングによってシミュレーションされる。構成可能なカップリングは、オフになるように構成されてもよく、又はオンになるように構成されてもよい。カップリングのオン及びオフは徐々に又は急激に行われてもよい。オンになるように構成されるとき、その構成は、イジング模型のカップリング強度に応じて、任意の位相又は振幅を提供することができる。
【0083】
各光パラメトリック発振器(OPO)出力は位相基準と干渉し、その結果は光検出器で捕捉される。光パラメトリック発振器(OPO)出力はイジング模型の配置を表す。例えば、イジング模型では、0位相は-1のスピン状態を表し、π位相は+1のスピン状態を表すことができる。
【0084】
1つ以上の実施形態によれば、スピンを有するイジング模型の場合、複数の光パラメトリック発振器(OPO)の共振空洞は、ポンプ源からのパルスの周期の倍に等しい往復時間を有するように構成される。本明細書で使用される往復時間は、説明した再帰経路の1つのパスに沿って光が伝播する時間を示す。共振空洞往復時間に等しい周期を有するパルス列のパルスは、互いに干渉することなく、同時に光パラメトリック発振器(OPO)を通って伝搬することができる。
【0085】
1つ以上の実施形態では、光パラメトリック発振器(OPO)のカップリングは、共振空洞に沿って割り当てられる複数の遅延線によって提供される。
【0086】
複数の遅延線は、カップリングの強度及び位相を同期的に制御する複数の変調器を含み、イジング模型をシミュレーションする光学装置のプログラムを可能にする。
【0087】
光パラメトリック発振器(OPO)のネットワークでは、遅延線及び対応する変調器によって、2つの光パラメトリック発振器(OPO)ごとにカップリングの振幅と位相を制御することができる。
【0088】
1つ以上の実施形態では、米国特許出願公開第2016/0162798号明細書に開示されているように、イジング模型からサンプリングすることができる最適な装置を、光パラメトリック発振器(OPO)のネットワークとして製造することができる。
【0089】
1つ以上の実施形態では、光パラメトリック発振器(OPO)のネットワーク及び光パラメトリック発振器(OPO)のカップリングは、市販のモードロックレーザ、並びにテレコムファイバ遅延線、変調器及び他の光学装置等の光学素子を使用して達成することができる。あるいは、光パラメトリック発振器(OPO)のネットワーク及び光パラメトリック発振器(OPO)のカップリングは、電気通信用途向けに開発されたファイバ技術等の光ファイバ技術を使用して実装することができる。カップリングはファイバで実現することができ、光カーシャッタで制御することができる。
【0090】
[集積フォトニックコヒーレントイジングマシン]
平衡状態近傍のイジング模型のボルツマン分布からサンプリングを実行することができるアナログシステムの別の実施形態は、米国特許出願公開第2018/0267937号明細書に開示された集積フォトニックコヒーレントイジングマシンである。
【0091】
1つ以上の実施形態では、集積フォトニックコヒーレントイジングマシンは、特定のイジング問題を解決するノードと接続ネットワークとの組合せである。このような実施形態では、ノードと接続ネットワークとの組み合わせにより、断熱的な光コンピュータを形成することができる。言い換えれば、ノードと接続ネットワークとの組み合わせにより、ノードに格納された値が定常状態に達したときにイジング問題を非決定的に解き、ノードと接続ネットワークのエネルギーを最小限に抑えることができる。最小エネルギーレベルでノードに格納された値は、特定のイジング問題を解決する値に関連付けられ得る。確率解は、イジング問題に対応するハミルトニアンによって定められるボルツマン分布からのサンプルとして使用することができる。
【0092】
このような実施形態では、システムは、複数のリング共振フォトニックノードと、ポンプ導波路を介して複数のリング共振フォトニックノードの各々に結合されて複数のリング共振フォトニックノードの各々にエネルギーを供給するポンプと、複数の2×2構築ブロックの要素を含む接続ネットワークと、を含み、複数のリング共振フォトニックノードの各々は値を格納し、2×2構築ブロックの各要素は、イジング問題の符号化に関連するパラメータで接続ネットワークを調整する複数の位相調整器を含み、接続ネットワークは、複数のリング共振フォトニックノードの各々に格納された値を処理し、複数のリング共振フォトニックノードの各々に格納された値によって、イジング問題が最小エネルギーレベルで解決される。
【0093】
[デジタルアニーラ]
デジタルアニーラは、Fujitsu(登録商標)によって開発されたようなデジタルアニーリングユニットを指す。
【0094】
[量子コンピュータを使用したボルツマン分布サンプリング]
量子コンピュータを使用した配位空間上で動作する古典エネルギー関数によって定められる古典ハミルトニアンからのボルツマン分布サンプリングを、様々な方法で実行することができる。ボルツマン分布サンプリングは、ギブス状態の準備を含むことができる。サンプリング手順の手法及びギブス状態の準備は、量子ハードウェアの特殊性に依存し得る。
【0095】
量子回路手法では、古典ハミルトニアンの変数にかかるボルツマン分布は、特定のアルゴリズムによって指定される量子回路ゲートの配列によって指示される補助ユニットとのコヒーレント相互作用から生じる。これらのアルゴリズムは、量子ビットの初期化、続いてこれらの量子ビットをユニタリ変換する演算のセット、そして最後に量子ビットの最終状態及びその処理の測定という3つの主要なステップを含む。
【0096】
ボルツマン分布サンプリングは、手順ハミルトニアン発展に基づき得ることを理解されたい。このような実施形態では、共通のサブルーチンは、変数に関連するシステム量子ビット、及び場合によっては補助量子ビットに対する手順ハミルトニアン時間発展の作用をエミュレートする。手順ハミルトニアンの選択は手順に依存し、サンプリングするボルツマン分布を定める古典ハミルトニアンから直接導出される。Anirban Narayan Chowdhury and Rolando D. Somma in "Quantum algorithms for Gibbs sampling and hitting-time estimation" (2017 arXiv:1603.02940)は、参照により本明細書に組み込まれるが、2倍の温度におけるボルツマン分布の式をユニタリ行列の線形セットに数学的に分解することで手順ハミルトニアンを導出している。したがってこれらのユニタリ行列は、古典ハミルトニアンから直接導かれ、導出された手順ハミルトニアンを定める。"Sampling from the thermal quantum Gibbs state and evaluating partition functions with a quantum computer" (2009 arXiv:0905.2199) by David Poulin and Pawel Wocjanは、参照により本明細書に組み込まれるが、導出された手順ハミルトニアンは、サンプリングするボルツマン分布を厳密に定める古典ハミルトニアンである。"The problem of equilibration and the computation of correlation functions on a quantum computer" (2000 arXiv:quant-ph/9810063) by Barbara M. Terhal and David P. DiVincenzoは、参照により本明細書に組み込まれるが、導出された手順ハミルトニアンは、古典ハミルトニアンと、補助量子ビットに作用する補助的非相互作用ハミルトニアンと、古典ハミルトニアン及び補助的非相互作用ハミルトニアンに存在する項を組み合わせて2つのサブシステムを結合するハミルトニアンと、を含む。本開示では、手順の口語的実装を考慮してもよい。対応する導出された手順ハミルトニアンのシミュレーションは、導出された手順ハミルトニアンに関する値を得るために質問される量子オラクルを採用することによって達成され得る。
【0097】
"The problem of equilibration and the computation of correlation functions on a quantum computer" (2000 arXiv:quant-ph/9810063) by Barbara M. Terhal and David P. DiVincenzoでは、全てのシステム量子ビットが全て0状態に初期化される。補助量子ビットの初期状態は、ギブス状態に準備される。具体的には、ランダムベルヌーイ過程を経て、各補助量子ビットは、関連する補助非相互作用補助ハミルトニアン項の固有値から決定される確率で、1又0の状態に独立して設定される。次いで、各補助量子ビットは、量子ビットのサンプリングされた2値状態に対応する2つの固有状態のいずれかに回転する。初期化後、全ての量子ビットは、導出された手順ハミルトニアン時間発展の作用下で十分に長い時間ユニタリ変換される。最後に、システム量子ビットの状態を測定して、古典ハミルトニアンによって定められるボルツマン分布からサンプルを得る。
【0098】
"Sampling from the thermal quantum Gibbs state and evaluating partition functions with a quantum computer" (2009 arXiv:0905.2199) by David Poulin and Pawel Wocjanでは、補助量子ビットは、スクラッチパッドとエネルギーレジスタの2つのサブカテゴリに細分化される。システム及びスクラッチパッドレジスタの一部である量子ビットは最大限に絡み合った状態で準備され、一方、エネルギーレジスタの量子ビットは0状態に設定される。次いで、システムとエネルギーレジスタの量子ビットに量子位相推定が適用される。この演算には、ハマダール変換、制御されたハミルトニアン時間発展及び量子フーリエ変換をサブルーチンとして組み込んでいる。結果として得られるシステムレジスタの状態は、無限温度におけるボルツマン状態に対応する。エネルギーレジスタの状態を条件として、追加の補助量子ビットに制御された回転を適用することによって、標的有限温度状態を得る。次いで、システム量子ビットと補助量子ビットに対して測定を行い、補助量子ビットが0の状態で事後選択測定を行うことによって、古典ハミルトニアンによって定められるボルツマン分布のサンプルを取得する。
【0099】
Anirban Narayan Chowdhury and Rolando D. Sommaによる"Quantum algorithms for Gibbs sampling and hitting-time estimation" (2017 arXiv:1603.02940)では、補助量子ビットはサブカテゴリに分けられる。補助スクラッチパッド量子ビットは、システム量子ビットと最大限に絡み合った状態で準備される。補助量子の別のセットは、最初は0の状態で準備される。これらの量子ビットは、システム量子ビットにユニタリの線形結合(LCU)演算を適用するときの制御セットとして使用される。この演算に対して、ユニタリの線形結合(LCU)の演算は、原始関数としての制御されたハミルトニアン時間発展演算に依存する。ユニタリの線形結合(LCU)回路を適用した後、ユニタリの線形結合(LCU)で使用される補助量子ビットとシステム量子ビットの状態を測定する。補助量子ビットが0の状態で事後選択測定を行うことによって、古典ハミルトニアンによって定められるボルツマン分布のサンプルを取得する。
【0100】
ボルツマン分布サンプリングは、量子ランダムウォークに基づき得ることを理解されたい。この手法は、古典ハミルトニアンによって定められるボルツマン分布からサンプリングするように設計される古典ランダムウォークの量子定式化に依存する。古典ランダムウォークは、非周期的で可逆的であると仮定されるマルコフ遷移演算子により数学的に定義される。"Efficient Quantum Walk Circuits for Metropolis-Hastings Algorithm" (2020 arXiv:1910.01659) by Jessica Lemieux, Bettina Heim, David Poulin, Krysta Svore and Matthias Troyerは、参照により本明細書に組み込まれるが、マルコフ遷移演算子を使用して量子ランダムウォーク演算子を定式化する。この定式化された量子ランダムウォーク演算子は、古典ハミルトニアン並びにn+1個の補助量子ビットの変数に関連したn個のシステム量子ビットを含む拡張系に作用する。全てのシステム量子ビットは計算基準で等しい重ね合わせの状態に初期化され、補助量子ビットは全て0の状態に設定される。量子演算子を十分な回数だけ全系に繰り返し適用する。システム量子ビットの測定によって、古典ハミルトニアンによって定められるボルツマン分布のサンプルを取得する。
【0101】
ボルツマン分布サンプリングは、量子アニーラを使用して実行できることを理解されたい。古典ハミルトニアンは、物理装置にカップリングの標的セットを設定することによって指定される。次いで、この系は、初期の非相互作用ハミルトニアンの準備が容易な基底状態で初期化される。この系は、初期ハミルトニアンとその環境の自然動力学の下で熱状態に緩和される。次に、ハミルトニアンカップリングは、初期値から古典ハミルトニアンの値にゆっくりと変化する。この遷移が起こると、系の状態は古典ハミルトニアンによって定められるボルツマン分布を追跡する。古典ハミルトニアンへのこの補間の最後に、状態を測定し、古典ハミルトニアンによって定められる基底ボルツマン分布の単一サンプルを生成する。さらなる詳細は"Adiabaticity in open quantum systems" (2016 arXiv:1508.05558) by Lorenzo Campos Venuti, Tameem Albash, Daniel A. Lida and Paolo Zanardiに見出すことができ、これは参照により本明細書に組み込まれる。
【0102】
[強化学習]
強化学習は、一般に、1つ以上の行動をとって、環境との相互作用に対する累積報酬の何らかの概念を強化又は最大化する任意のシステム又は計算手順を指す。強化学習(RL)を実行するエージェントは、環境内で1つ以上の行動をとり、したがって自身及び環境を様々な新しい状態に置くことから、「瞬時報酬」と呼ばれる正又は負の強化を受け取ることができる。
【0103】
エージェントの目標は、累積報酬の何らかの概念を強化又は最大化することであり得る。例えば、エージェントの目標は「割引報酬関数」又は「平均報酬関数」を強化又は最大化することであり得る。「Q関数」は、ある状態及びその状態で取った行動から得られる最大累積報酬を表すことができる。「価値関数」及び「一般化利点推定器」は、最適な又は最良の行動選択が与えられた状態から得られる最大累積報酬を表すことができる。強化学習(RL)は、累積報酬のこのような概念のうち任意の1つ以上を使用することができる。本明細書で使用されるように、任意のこのような関数は「累積報酬関数」と呼ばれることがある。したがって、最良の又は最適な累積報酬関数を計算することは、エージェントに対する最良の又は最適なポリシーを見つけることと同等であり得る。
【0104】
エージェント及びその環境との相互作用は、1つ以上のマルコフ決定過程(MDP)として定式化することができる。強化学習(RL)手順は、マルコフ決定過程(MDP)の正確な数学モデルの知識を仮定しなくてもよい。マルコフ決定過程(MDP)は、エージェントにとって完全に未知であってもよく、部分的に既知であってもよく、又は完全に既知であってもよい。強化学習(RL)手順は、マルコフ決定過程(MDP)の事前知識に関して、「モデルベース」又は「モデルフリー」の2つの範囲の間のスペクトルに位置し得る。このように強化学習(RL)手順は、マルコフ決定過程(MDP)の未知又は確率的性質のために、厳密な方法が実現不可能又は利用不可能であり得る大規模なマルコフ決定過程(MDP)を対象とすることができる。
【0105】
強化学習(RL)手順は、デジタル処理ユニットを使用して実装することができる。デジタル処理ユニットは、「ポリシー」を訓練し、記憶し、後に展開するエージェントを実装して、累積報酬を強化又は最大化することができる。ポリシーは可能な限り長い、又は所望の期間にわたって探索(例えば検索)することができる。このような最適化問題は、最適なポリシーの近似値を記憶することによって、累積報酬関数の近似値を記憶することによって、又はその両方によって解決することができる。場合によっては、強化学習(RL)手順は、このような関数の近似値の1つ以上のテーブルを記憶することができる。他の場合には、強化学習(RL)手順は、1つ以上の「関数近似器」を利用することができる。
【0106】
関数近似器の例としては、ディープニューラルネットワークのようなニューラルネットワーク、並びにボルツマンマシン、ヘルムホルツマシン及びホップフィールドネットワークなどの確率的グラフィックモデルが挙げられる。関数近似器は、累積報酬関数の近似のパラメータ化を作成することができる。そのパラメータ化に関する関数近似器の最適化は、累積報酬を強化又は最大化し、したがって、ポリシー勾配法のようなポリシーを強化又は最適化する方向にパラメータを摂動させること、又は時間差法のようなベルマンの最適基準を満たすように関数近似器を摂動させることによって構成することができる。
【0107】
トレーニング中、エージェントは、環境において行動をとり、環境に関する、及び生存若しくはより良い効用に対するポリシーの良好な選択又は最良の選択に関するより多くの情報を取得することができる。エージェントの行動は、例えば、特にトレーニングの初期段階ではランダムに生成されてもよく、又は、教師付き学習、模倣学習若しくは任意の他の機械学習手順などの別の機械学習パラダイムによって規定されてもよい。エージェントの行動は、強化された又は最適なポリシーが何であるかについてのエージェントの認識により近い行動を選択することによって洗練され得る。様々なトレーニング戦略は、探査と活用の間の選択に関して、オフポリシー方法とオンポリシー方法の2つの範囲の間のスペクトルに位置し得る。
【0108】
強化学習(RL)手順は、深層強化学習(DRL)手順を含むことができ、Mnih et al., Playing Atari with Deep Reinforcement Learning, arXiv:1312.5602 (2013)、Schulman et al., Proximal Policy Optimization Algorithms, arXiv:1707.06347 (2017)、Konda et al., Actor-Critic Algorithms, in Advances in Neural Information Processing Systems, pp. 1008-1014 (2000)及びMnih et al., Asynchronous Methods for Deep Reinforcement Learning, in International Conference on Machine Learning, pp. 1928-1937 (2016)に記載され、これらの各々は全体が参照により本明細書に組み込まれる。
【0109】
強化学習(RL)手順は、「近似動的プログラミング」又は「神経動的プログラミング」と呼ばれることもある。
【0110】
ここで
図1を参照すると、量子デバイス30を含むサンプリング装置に結合されるデジタルシステム8を含むシステムの実施形態を示す図が示されている。
【0111】
デジタルコンピュータ8は、任意のタイプのデジタルコンピュータとすることができることを理解されたい。
【0112】
1つ以上の実施形態では、デジタルコンピュータ8は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットPC、サーバ、スマートフォン等からなる群から選択される。また前述において、デジタルコンピュータ8は、広くプロセッサと呼ばれることもあることを理解されたい。
【0113】
図1に示す実施形態では、デジタルコンピュータ8は、マイクロプロセッサとも呼ばれる中央処理ユニット12と、表示装置14と、入力装置16と、通信ポート20と、データバス18と、メモリユニット22と、を含む。
【0114】
中央処理ユニット12を使用してコンピュータ命令を処理する。当業者であれば、中央処理ユニット12の様々な実施形態が提供できることを理解するだろう。
【0115】
1つ以上の実施形態では、中央処理ユニット12は、2.5GHzで動作する、Intel(登録商標)が製造するCPUコアi53210を含む。
【0116】
表示装置14を使用して、ユーザにデータを表示する。当業者であれば、様々なタイプの表示装置14が使用できることを理解するだろう。
【0117】
1つ以上の実施形態では、表示装置14は、標準的な液晶表示(LCD)モニタである。
【0118】
入力装置16は、デジタルコンピュータ8へのデータの入力に使用される。
【0119】
通信ポート20は、デジタルコンピュータ8とのデータの共有に使用される。
【0120】
通信ポート20は、例えばキーボード及びマウスをデジタルコンピュータ8に接続するユニバーサルシリアルバス(USB)ポートを含むことができる。
【0121】
通信ポート20は、デジタルコンピュータ8と量子デバイス30との接続を可能にする、IEEE802.3ポート等のデータネットワーク通信ポートをさらに含むことができる。
【0122】
当業者であれば、通信ポート20の様々な代替実施形態が提供できることを理解するだろう。
【0123】
メモリユニット22は、コンピュータ実行可能命令の格納に使用される。
【0124】
メモリユニット22は、システム制御プログラム(例えば、BIOS、オペレーティングシステムモジュール、アプリケーション等)を格納する高速ランダムアクセスメモリ(RAM)、及び読み出し専用メモリ(ROM)のようなシステムメモリを含むことができる。
【0125】
メモリユニット22は、1つ以上の実施形態では、オペレーティングシステムモジュールを含むことを理解されたい。
【0126】
オペレーティングシステムモジュールは、様々なタイプのものとすることができることを理解されたい。
【0127】
1つ以上の実施形態では、オペレーティングシステムモジュールは、Apple(登録商標)が製造するOSXカタリナである。
【0128】
図1に示す実施形態では、サンプリング装置は量子デバイス30を含む。サンプリング装置は、本明細書に記載される任意の物理学着想のコンピュータを含むことができることを理解されたい。1つ以上の実施形態では、サンプリング装置は、ノイズのある中規模量子デバイスを含む。サンプリング装置は、光パラメトリック発振器(OPO)、集積フォトニックコヒーレントイジングマシン、量子コンピュータ、量子アニーラ、ゲートモデル量子コンピュータ、並びにシミュレーテッドアニーリング、シミュレーテッド量子アニーリング、ポピュレーションアニーリング及び量子モンテカルロ等の物理学着想の方法の実装からなる群の少なくとも1つのメンバーを含むことができる。
【0129】
量子デバイス30は、量子回路制御システム24と、読み出し制御システム26と、量子プロセッサ28と、を含む。
【0130】
メモリユニット22は、量子デバイス30の量子プロセッサ28に実装されるハミルトニアンによって表される確率分布からサンプルを取得するアプリケーションをさらに含む。
【0131】
メモリユニット22は、図示しないが、量子デバイス30を使用するアプリケーションをさらに含むことができる。
【0132】
メモリユニット22は、図示しないが、量子プロセッサ28における単一量子ビットゲート及び2量子ビットゲートへの入力データのパターンを符号化する、対応する入力データ等の量子プロセッサデータをさらに含むことができる。
【0133】
量子プロセッサ28は、様々なタイプのものとすることができる。1つ以上の実施形態では、量子プロセッサ28は超伝導量子ビットを含む。
【0134】
読み出し制御システム26は、量子プロセッサ28の量子ビットの読み出しに使用される。実際に、本明細書に開示される方法で量子プロセッサを使用するためには、その量子力学状態において量子系の量子ビットを測定する読み出しシステムが必要であることを理解されたい。複数回の測定により、量子ビットの状態のサンプルが得られる。読み取りの結果は、デジタルコンピュータ8に供給される。量子回路構造は、量子回路制御システム24を介して制御される。
【0135】
読み出し制御システム26は、様々なタイプのものとすることができることを理解されたい。例えば、読み出し制御システム26は複数のdc‐SQUID磁力計を含むことができ、その各々は量子プロセッサ28の異なる量子ビットに誘導接続される。読み出し制御システム26は、電圧値又は電流値を提供することができる。1つ以上の実施形態では、dc‐SQUID磁力計は、当技術分野で周知のように、少なくとも1つのジョセフソン接合によって遮断される超伝導材料のループを含む。
【0136】
ここで
図2を参照すると、サンプリング装置を使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比を推定する方法の実施形態が示されている。
【0137】
処理ステップ200によれば、基底ハミルトニアンの指標を取得する。基底ハミルトニアンの指標は、様々なタイプのものとすることができることを理解されたい。1つ以上の実施形態では、基底ハミルトニアンの指標は、エネルギー関数を表す数学関数である。
【0138】
基底ハミルトニアンの指標は、様々な実施形態に従って取得できることを理解されたい。
【0139】
1つ以上の実施形態では、デジタルコンピュータ8を使用して基底ハミルトニアンの指標を取得する。基底ハミルトニアンの指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0140】
代替実施形態では、基底ハミルトニアンの指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0141】
代替実施形態では、基底ハミルトニアンの指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。一実施形態では、データネットワークはインターネットを含む。
【0142】
基底ハミルトニアンが物理モデル及びこのモデルに対応するボルツマン確率分布を定めることは、当業者であれば理解するだろう。より正確には、E
bが基底ハミルトニアンを定める。これは、配位空間上で動作する古典エネルギー関数によって定められる。所与の配置cに対して、基底ハミルトニアンは、エネルギーE
b(c)を表す実数を出力する。一実施形態では、配置cは2値ベクトルである。全ての可能な配置に対する基底ハミルトニアンに対応する確率分布は、ボルツマン分布によって指定される。
【数1】
【0143】
処理ステップ202によれば、取得した基底ハミルトニアンを使用してサンプリング装置を設定する。当業者であれば、サンプリング装置は、本明細書に記載される任意の物理学着想のコンピュータを含むことができることを理解するだろう。例えば、1つ以上の実施形態では、サンプリング装置はNISQ装置を含む。サンプリング装置は、
図1に示すシステムに関して本明細書に記載される任意のサンプリング装置のような、任意の適切なサンプリング装置とすることができることを理解されたい。サンプリング装置は、例えば本明細書の他の箇所に開示されるように、サンプリング装置のタイプに依存し得る様々な方法で設定できることを理解されたい。
【0144】
さらに
図2を参照すると、処理ステップ204によれば、サンプリング装置を使用して、基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得する。基底ハミルトニアンは、サンプリング装置で実装できるようなものであることを理解されたい。さらに複数のサンプルは、例えば本明細書の他の箇所に開示されるように、基底ハミルトニアンによって定められるボルツマン分布からのサンプリングに使用されるサンプリング装置のタイプ及び手順に依存し得る様々な方法で取得できることを理解されたい。
【0145】
所与のE
bに対して、サンプリング装置の出力は複数の
であり、N
sはサンプル数である。1つ以上の実施形態では、サンプル数N
sはユーザによって提供される。当業者であれば、サンプリング装置が量子コンピュータである1つ以上の実施形態において、量子ビットの状態を複数回測定することにより、基底ハミルトニアンによって定められる確率分布から複数のサンプルを得ることを理解するだろう。
【0146】
処理ステップ206によれば、標的ハミルトニアンの指標を取得する。指標は、エネルギー関数を表す数学関数であり得る。標的ハミルトニアンの指標は、様々な実施形態に従って取得できることを理解されたい。
【0147】
1つ以上の実施形態では、デジタルコンピュータ8を使用して標的ハミルトニアンの指標を取得する。標的ハミルトニアンの指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0148】
1つ以上の代替実施形態では、標的ハミルトニアンの指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0149】
1つ以上の代替実施形態では、標的ハミルトニアンの指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。1つ以上の実施形態では、データネットワークはインターネットを含む。
【0150】
より正確には、Etを標的ハミルトニアンとする。当業者であれば、分配関数とボルツマン確率分布の概念が標的ハミルトニアンに及ぶことを理解するだろう。しかし、基底ハミルトニアンとは異なり、標的ハミルトニアンによって定められる分布からのサンプリングにはサンプリング装置を使用しないことを当業者であれば理解するだろう。標的ハミルトニアンの配位空間は、基底ハミルトニアンの配位空間と同じであることを当業者であれば理解するだろう。
【0151】
さらに
図2を参照すると、処理ステップ208によれば、取得した
を使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比のサンプル推定値を計算する。このサンプルは、基底ハミルトニアンによって定められる確率分布からのものである。より正確には、基底ハミルトニアン分配関数と標的ハミルトニアン分配関数の比のサンプル推定値は、以下の等式を使用して計算される。
【数2】
【0152】
処理ステップ210によれば、推定比を提供する。推定比は、様々な実施形態に従って提供できることを理解されたい。1つ以上の実施形態では、推定比はメモリユニット22に格納される。1つ以上の代替実施形態では、推定比は表示装置14に表示される。1つ以上の代替実施形態では、推定比は、デジタルコンピュータ8に動作可能に接続される遠隔処理装置に提供される。実際に、以下でさらに説明するように、推定比は多くの実施形態で有利に使用できることを理解されたい。
【0153】
ここで
図3を参照すると、サンプリング装置を使用して、基底ハミルトニアンを使用して少なくとも1つの標的モデルの観測可能値の期待値を推定する方法の実施形態が示されている。本明細書に開示される方法は、基底ハミルトニアンによって定められる分布からサンプリングするように構成されるサンプリング装置により生成されるサンプルに基づいて、標的ハミルトニアンに対応する観測可能値の期待値の不偏推定値を提供することを理解されたい。
【0154】
当業者であれば、1つ以上の実施形態では、観測可能値がボルツマン分布のエネルギー関数であることを理解するだろう。さらに1つ以上の異なる実施形態では、観測可能値はn点関数であることを理解されたい。
【0155】
さらに
図3を参照すると、処理ステップ300によれば、基底ハミルトニアンの指標及び観測可能値Aの指標を取得する。基底ハミルトニアンの指標は、様々なタイプのものとすることができることを理解されたい。1つ以上の実施形態では、基底ハミルトニアンの指標は、エネルギー関数を表す数学関数である。
【0156】
基底ハミルトニアンの指標及び観測可能値の指標は、様々な実施形態に従って取得できることを理解されたい。
【0157】
1つ以上の実施形態では、デジタルコンピュータ8を使用して、基底ハミルトニアンの指標及び観測可能値の指標を取得する。基底ハミルトニアンの指標及び観測可能値の指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0158】
1つ以上の代替実施形態では、基底ハミルトニアンの指標及び観測可能値の指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0159】
1つ以上の代替実施形態では、基底ハミルトニアンの指標及び観測可能値の指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。1つ以上の実施形態では、データネットワークはインターネットを含む。
【0160】
基底ハミルトニアンが物理モデル及びこのモデルに対応するボルツマン確率分布を定めることは、当業者であれば理解するだろう。より正確には、E
bが基底ハミルトニアンを定める。これは、配位空間上で動作する古典エネルギー関数によって定められる。所与の配置cに対して、基底ハミルトニアンは、エネルギーE
b(c)を表す実数を出力する。1つ以上の実施形態では、配置cは2値ベクトルである。全ての可能な配置に対する基底ハミルトニアンに対応する確率分布は、ボルツマン確率分布によって指定される。
【数3】
【0161】
さらに
図3を参照すると、処理ステップ302によれば、基底ハミルトニアンを使用してサンプリング装置を設定する。サンプリング装置は様々なタイプのものとすることができることを理解されたい。当業者であれば、サンプリング装置は、本明細書に記載される任意の物理学着想のコンピュータを含むことができることを理解するだろう。例えば、1つ以上の実施形態では、サンプリング装置はNISQ装置を含む。サンプリング装置は、
図1に示すシステムに関して本明細書に記載される任意のサンプリング装置のような、任意の適切なサンプリング装置とすることができることを理解されたい。サンプリング装置は、例えば本明細書の他の箇所に開示されるように、サンプリング装置のタイプに依存し得る様々な方法で設定できることを理解されたい。
【0162】
処理ステップ304によれば、サンプリング装置を使用して、基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得する。基底ハミルトニアンは、サンプリング装置で実装できるようなものであることを当業者であれば理解するだろう。さらに複数のサンプルは、例えば本明細書の他の箇所に開示されるように、基底ハミルトニアンによって定められるボルツマン分布からのサンプリングに使用されるサンプリング装置のタイプ及び手順に依存し得る様々な方法で取得できることを理解されたい。
【0163】
所与のE
bに対して、サンプリング装置の出力は複数の
であり、N
sはサンプル数である。1つ以上の実施形態では、サンプル数N
sはユーザによって提供されることを理解されたい。当業者であれば、サンプリング装置が量子コンピュータである1つ以上の実施形態において、量子ビットの状態を複数回測定することにより、基底ハミルトニアンによって定められる確率分布から複数のサンプルを得ることを理解するだろう。
【0164】
処理ステップ306によれば、次の標的ハミルトニアンの指標を取得する。次の標的ハミルトニアンの指標は、エネルギー関数を表す数学関数であり得る。標的ハミルトニアンの指標は、様々な実施形態に従って取得できることを理解されたい。
【0165】
1つ以上の実施形態では、デジタルコンピュータ8を使用して次の標的ハミルトニアンの指標を取得する。次の標的ハミルトニアンの指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0166】
1つ以上の代替実施形態では、次の標的ハミルトニアンの指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0167】
1つ以上の代替実施形態では、次の標的ハミルトニアンの指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。1つ以上の実施形態では、データネットワークはインターネットを含む。
【0168】
より正確には、E
tを標的ハミルトニアンとする。基底ハミルトニアンについて上記で紹介したボルツマン確率分布とサンプルの概念は、標的ハミルトニアンにも及ぶ。しかし、基底ハミルトニアンとは異なり、標的ハミルトニアンによって定められる分布からのサンプリングにはサンプリング装置を使用しないことを当業者であれば理解するだろう。標的ハミルトニアンの配位空間は、基底ハミルトニアンの配位空間と同じであることを当業者であれば理解するだろう。当業者であれば、平衡状態における観測可能値を推定することは、様々な用途において有用であり得ることを理解するだろう。観測可能値は、配置cで評価されるベクトルを出力する関数A(c)で記述される。1つ以上の実施形態では、標的ハミルトニアンエネルギーE
t(c)が観測可能値である。標的ハミルトニアンによって定められる分布に関して、観測可能値の期待値の評価を対象とすることを理解されたい。期待値は、
【数4】
によって定められる。ここで左辺の表記は、対象となる観測可能値と、それが評価され得る確率分布を指定する。
【0169】
さらに
図3を参照すると、処理ステップ308によれば、基底ハミルトニアンによって定められる確率分布から取得したサンプルを使用して、標的ハミルトニアンに対応する観測可能値の期待値を推定する。より正確には、観測可能値の期待値の推定は、1つ以上の実施形態により、
図4に開示された方法に従って実行される。
【0170】
ここで
図4を参照すると、処理ステップ400によれば、基底ハミルトニアン分配関数と標的ハミルトニアン分配関数の比のサンプル推定値は、以下の等式を使用して計算される。
【数5】
【0171】
さらに
図4を参照すると、処理ステップ402によれば、標的ハミルトニアンによって定められる分布p
tに関する観測可能値Aの期待値の非正規化推定値は、
【数6】
によって計算する。
【0172】
さらに
図4を参照すると、処理ステップ404によれば、標的ハミルトニアンによって定められる分布p
tに関するAの期待値の不偏推定値は、処理ステップ400及び402による結果を使用して、
【数7】
によって計算する。
【0173】
ここで
図3に戻って参照すると、処理ステップ310によれば、標的ハミルトニアンに対応する観測可能値の推定期待値A
ptを提供する。標的ハミルトニアンに対応する観測可能値の推定期待値A
ptは、様々な実施形態に従って提供できることを理解されたい。1つ以上の実施形態では、標的ハミルトニアンに対応する観測可能値の推定期待値A
ptは、メモリユニット22に格納される。1つ以上の代替実施形態では、標的ハミルトニアンに対応する観測可能値の推定期待値A
ptは、表示装置14に表示される。1つ以上の代替実施形態では、標的ハミルトニアンに対応する観測可能値の推定期待値A
ptは、デジタルコンピュータ8に動作可能に接続される遠隔処理装置に提供される。実際に、以下でさらに説明するように、標的ハミルトニアンに対応する観測可能値の推定期待値A
ptは、多くの実施形態で有利に使用できることを理解されたい。
【0174】
標的ハミルトニアンのリストの最後に到達していない場合、処理ステップ304において、基底ハミルトニアンによって定められる確率分布から取得した配置サンプルの同じセット
を使用して、処理ステップ306、308及び310を繰り返す。1つ以上の実施形態では、観測可能値の推定期待値は、エネルギー期待値を含む。1つ以上の実施形態では、観測可能値の推定期待値は、n点関数を含む。
【0175】
1つ以上の実施形態では、本方法は、観測可能値の推定期待値を関数近似器として使用するステップをさらに含むことを理解されたい。さらに1つ以上の実施形態では、本方法は、ハミルトニアンの熱力学的特性を推定するステップと、熱力学的特性を関数近似器として使用するステップと、をさらに含むことを理解されたい。
【0176】
ここで
図5を参照すると、標的ハミルトニアンと基底ハミルトニアンによって定められる2つのモデルのエントロピー間の差を推定する方法の実施形態が示されている。
【0177】
より正確には、処理ステップ500によれば、基底ハミルトニアンの指標を取得する。基底ハミルトニアンの指標は、様々なタイプのものとすることができることを理解されたい。1つ以上の実施形態では、基底ハミルトニアンの指標は、エネルギー関数を表す数学関数である。
【0178】
基底ハミルトニアンの指標は、様々な実施形態に従って取得できることを理解されたい。
【0179】
1つ以上の実施形態では、デジタルコンピュータ8を使用して基底ハミルトニアンの指標を取得する。基底ハミルトニアンの指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0180】
1つ以上の代替実施形態では、基底ハミルトニアンの指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0181】
1つ以上の代替実施形態では、基底ハミルトニアンの指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。1つ以上の実施形態では、データネットワークはインターネットを含む。
【0182】
基底ハミルトニアンが物理モデル及びこのモデルに対応するボルツマン確率分布を定めることは、当業者であれば理解するだろう。より正確には、E
bが基底ハミルトニアンを定める。これは、配位空間上で動作する古典なエネルギー関数によって定められる。所与の配置cに対して、基底ハミルトニアンは、エネルギーE
b(c)を表す実数を出力する。1つ以上の実施形態では、配置cは2値ベクトルである。全ての可能な配置に対する基底ハミルトニアンに対応する確率分布は、ボルツマン分布によって指定される。
【数8】
【0183】
さらに
図5を参照すると、処理ステップ502によれば、標的ハミルトニアンの指標E
tを取得する。標的ハミルトニアンの指標は、エネルギー関数を表す数学関数であり得る。標的ハミルトニアンの指標は、様々な実施形態に従って取得できることを理解されたい。
【0184】
1つ以上の実施形態では、デジタルコンピュータ8を使用して標的ハミルトニアンの指標を取得する。標的ハミルトニアンの指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0185】
1つ以上の代替実施形態では、標的ハミルトニアンの指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0186】
1つ以上の代替実施形態では、標的ハミルトニアンの指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の代替実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。1つ以上の実施形態では、データネットワークはインターネットを含む。
【0187】
より正確には、Etを標的ハミルトニアンとする。当業者であれば分配関数とボルツマン確率分布の概念が標的ハミルトニアンに及ぶことを理解するだろう。しかし、基底ハミルトニアンとは異なり、標的ハミルトニアンによって定められる分布からのサンプリングにはサンプリング装置を使用しないことを当業者であれば理解するだろう。標的ハミルトニアンの配位空間は、基底ハミルトニアンの配位空間と同じであることを当業者であれば理解するだろう。
【0188】
さらに
図5を参照すると、処理ステップ504によれば、基底ハミルトニアンを使用してサンプリング装置を設定する。サンプリング装置は様々なタイプのものとすることができることを理解されたい。当業者であれば、サンプリング装置は、本明細書に記載される任意の物理学着想のコンピュータを含むことができることを理解するだろう。例えば、1つ以上の実施形態では、サンプリング装置はNISQ装置を含む。サンプリング装置は、
図1に示すシステムに関して本明細書に記載される任意のサンプリング装置のような、任意の適切なサンプリング装置とすることができることを理解されたい。サンプリング装置は、例えば本明細書の他の箇所に開示されるように、サンプリング装置のタイプに依存し得る様々な方法で設定できることを理解されたい。
【0189】
さらに
図5を参照すると、処理ステップ506によれば、サンプリング装置を使用して、基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得する。基底ハミルトニアンは、サンプリング装置で実装できるようなものであることを理解されたい。さらに複数のサンプルは、例えば本明細書の他の箇所に開示されるように、基底ハミルトニアンによって定められるボルツマン分布からのサンプリングに使用されるサンプリング装置のタイプ及び手順に依存し得る様々な方法で取得できることを理解されたい。
【0190】
所与のE
bに対して、サンプリング装置の出力は複数の
であり、N
sはサンプル数である。1つ以上の実施形態では、サンプル数N
sはユーザによって提供されることを理解されたい。当業者であれば、サンプリング装置が量子コンピュータである1つ以上の実施形態において、量子ビットの状態を複数回測定することにより、基底ハミルトニアンによって定められる確率分布から複数のサンプルを得ることを理解するだろう。
【0191】
さらに
図5を参照すると、処理ステップ508によれば、取得した
を使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比のサンプル推定値を計算する。このサンプルは、基底ハミルトニアンによって定められる確率分布からのものである。より正確には、基底ハミルトニアン分配関数と標的ハミルトニアン分配関数の比のサンプル推定値は、以下の等式を使用して計算される。
【数9】
【0192】
処理ステップ510によれば、本明細書に開示される観測可能値の期待値を推定する方法のいずれかを使用して、標的ハミルトニアンに対応するエネルギー観測可能値の期待値〈Et〉を推定する。
【0193】
さらに
図5を参照すると、処理ステップ512によれば、標的ハミルトニアンに対応するエネルギー観測可能値の推定比及び推定期待値を使用して、標的ハミルトニアンに対応するエントロピーと基底ハミルトニアンに対応するエントロピー間の差を推定する。より正確には、標的ハミルトニアンに対応するエントロピーと基底ハミルトニアンに対応するエントロピーとの差S
t-S
bは、以下の公式を使用して推定される。
【数10】
【0194】
さらに
図5を参照すると、処理ステップ514によれば、標的ハミルトニアンに対応するエントロピーと基底ハミルトニアンに対応するエントロピー間の差が提供される。標的ハミルトニアンに対応するエントロピーと基底ハミルトニアンに対応するエントロピー間の推定差は、様々な実施形態に従って提供できることを理解されたい。1つ以上の実施形態では、標的ハミルトニアンに対応するエントロピーと基底ハミルトニアンに対応するエントロピー間の推定差は、メモリユニット22に格納される。1つ以上の代替実施形態では、標的ハミルトニアンに対応するエントロピーと基底ハミルトニアンに対応するエントロピー間の推定差は、表示装置14に表示される。1つ以上の他の実施形態では、標的ハミルトニアンに対応するエントロピーと基底ハミルトニアンに対応するエントロピー間の推定差は、デジタルコンピュータ8に動作可能に接続される遠隔処理装置に提供される。
【0195】
ここで
図6を参照すると、サンプリング装置を使用して、パラメータ化標的ハミルトニアンによって表される標的ハミルトニアンのファミリーによって定められる、自由エネルギーのパラメータ化された負の最大値及び最大値の引数を推定する方法の実施形態が示されている。本明細書に開示される方法は、基底ハミルトニアンのファミリーから選択される基底ハミルトニアンによって定められる分布からサンプリングするように構成されるサンプリング装置により生成されるサンプルに基づいて、パラメータ化標的ハミルトニアンによって表される標的ハミルトニアンのファミリーによって定められる、自由エネルギーのパラメータ化された負の最大値及び最大値の引数の推定値を提供することを理解されたい。
【0196】
より正確には、処理ステップ600によれば、基底ハミルトニアンのファミリーの指標を取得する。1つ以上の実施形態では、基底ハミルトニアンのファミリーの指標は、エネルギー関数を表す数学関数のリストを含む。1つ以上の他の実施形態では、基底ハミルトニアンのファミリーの指標は、パラメータ化エネルギー関数を表す数学関数を含む。
【0197】
基底ハミルトニアンのファミリーの指標は、様々な実施形態に従って取得できることを理解されたい。
【0198】
1つ以上の実施形態では、デジタルコンピュータ8を使用して基底ハミルトニアンの指標を取得する。基底ハミルトニアンのファミリーの指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0199】
1つ以上の代替実施形態では、基底ハミルトニアンのファミリーの指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0200】
1つ以上の代替実施形態では、基底ハミルトニアンのファミリーの指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。1つ以上の実施形態では、データネットワークはインターネットを含む。
【0201】
さらに
図6を参照すると、処理ステップ602によれば、基底ハミルトニアンのファミリーから初期基底ハミルトニアンを選択し、現在の基底ハミルトニアンを初期基底ハミルトニアンに設定する。初期基底ハミルトニアンは、基底ハミルトニアンのファミリーから選択される任意の基底ハミルトニアンとすることができることを理解されたい。1つ以上の実施形態では、初期基底ハミルトニアンはランダムに選択される。1つ以上の代替実施形態では、初期基底ハミルトニアンはユーザによって選択される。1つ以上の実施形態では、基底ハミルトニアンのファミリーは1つの基底ハミルトニアンを含む。1つ以上の代替実施形態では、基底ハミルトニアンのファミリーは、パラメータ化基底ハミルトニアンによって表される。
【0202】
基底ハミルトニアンの各々が物理モデル及びこのモデルに対応するボルツマン確率分布を定めることは、当業者であれば理解するだろう。より正確には、E
bが基底ハミルトニアンを定める。これは、配位空間上で動作する古典エネルギー関数によって定められる。所与の配置cに対して、基底ハミルトニアンは、エネルギーE
b(c)を表す実数を出力する。1つ以上の実施形態では、配置cは2値ベクトルである。全ての可能な配置に対する基底ハミルトニアンに対応する確率分布は、ボルツマン分布によって指定される。
【数11】
【0203】
さらに
図6を参照すると、処理ステップ604によれば、パラメータ化標的ハミルトニアンの指標を取得する。パラメータ化標的ハミルトニアンの指標は、エネルギー関数を表す数学関数であり得ることを理解されたい。パラメータ化標的ハミルトニアンの指標は、様々な実施形態に従って取得できることを理解されたい。
【0204】
1つ以上の実施形態では、デジタルコンピュータ8を使用して、パラメータ化標的ハミルトニアンの指標を取得する。パラメータ化標的ハミルトニアンの指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0205】
1つ以上の代替実施形態では、パラメータ化標的ハミルトニアンの指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0206】
1つ以上の代替実施形態では、パラメータ化標的ハミルトニアンの指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。1つ以上の実施形態では、データネットワークはインターネットを含む。
【0207】
より正確には、Et,aをパラメータ化標的ハミルトニアンとする。ここで、標的ハミルトニアンはパラメータaによってパラメータ化される。パラメータは、離散値又は連続値のいずれかをとることができる要素を含む、任意の有限次元ベクトルとすることができることを理解されたい。
【0208】
基底ハミルトニアンに対して導入されたボルツマン確率分布とサンプルの概念は、パラメータ化標的ハミルトニアンに及ぶ。しかし、基底ハミルトニアンとは異なり、パラメータaの任意の値に対するパラメータ化標的ハミルトニアンによって定められる分布からのサンプリングには、サンプリング装置を使用しないことを当業者であれば理解するだろう。パラメータ化標的ハミルトニアンの配位空間は、パラメータaの任意の値に対する基底ハミルトニアンの配位空間と同じであることを当業者であれば理解するだろう。
【0209】
さらに
図6を参照すると、処理ステップ606によれば、現在の
を更新する。処理ステップ506が本方法の過程で初めて実行される場合、現在の基底ハミルトニアンは、処理ステップ602で選択された初期基底ハミルトニアンに設定されることを理解されたい。
【0210】
処理ステップ606が繰り返される場合、現在の基底ハミルトニアンは、1つ以上の実施形態による最適化プロトコルを使用して更新される。様々な最適化プロトコルを使用して現在の基底ハミルトニアンを更新できることを当業者であれば理解するだろう。1つ以上の非限定的な実施形態では、最適化プロトコルは、勾配降下、確率勾配降下、局所探索、ランダム探索、最急降下及びベイズ最適化からなる群から選択される少なくとも1つのメンバーである。1つ以上の実施形態では、現在の基底ハミルトニアンは、勾配ベースの方法に基づく少なくとも1つのプロトコルを使用して更新される。1つ以上の実施形態では、現在の基底ハミルトニアンは、微分不要法に基づく少なくとも1つの最適化プロトコルを使用して更新される。さらに、現在の基底ハミルトニアンは、処理ステップ616による推定比、処理ステップ618により推定された標的ハミルトニアンによって定められる自由エネルギー、及び対応する1つ以上のパラメータ値を使用して、最適化プロトコルを使用して更新されることを理解されたい。
【0211】
さらに
図6を参照すると、処理ステップ608によれば、現在の
を使用してサンプリング装置を設定する。サンプリング装置は様々なタイプのものとすることができることを理解されたい。実際に、当業者であれば、サンプリング装置は、本明細書に記載される任意の物理学着想のコンピュータを含むことができることを理解するだろう。例えば、1つ以上の実施形態によれば、サンプリング装置はNISQ装置を含む。サンプリング装置は、
図1に示すシステムに関して本明細書に記載される任意のサンプリング装置のような、任意の適切なサンプリング装置とすることができることを理解されたい。サンプリング装置は、例えば本明細書の他の箇所に開示されるように、サンプリング装置のタイプに依存し得る様々な方法で設定できることを理解されたい。
【0212】
さらに
図6を参照すると、処理ステップ610によれば、サンプリング装置を使用して、現在の基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得する。現在の基底ハミルトニアンは、サンプリング装置で実装できるようなものであることを理解されたい。さらに複数のサンプルは、例えば本明細書の他の箇所に開示されるように、基底ハミルトニアンによって定められるボルツマン分布からのサンプリングに使用されるサンプリング装置のタイプ及び手順に依存し得る様々な方法で取得できることを理解されたい。
【0213】
所与のE
bに対して、サンプリング装置の出力は複数の
であり、N
sはサンプル数である。1つ以上の実施形態では、サンプル数N
sはユーザによって提供されることを理解されたい。当業者であれば、サンプリング装置が量子コンピュータである1つ以上の実施形態において、量子ビットの状態を複数回測定することにより、基底ハミルトニアンによって定められる確率分布から複数のサンプルを得ることを理解するだろう。
【0214】
処理ステップ612によれば、パラメータ値を更新する。処理ステップ612が現在の基底ハミルトニアンに対して初めて処理される場合、パラメータ値は初期パラメータ値で更新されることを理解されたい。初期パラメータ値は様々な方法で選択することができる。1つ以上の実施形態では、初期パラメータ値はランダムに選択される。1つ以上の代替実施形態では、初期パラメータ値はユーザによって提供される。
【0215】
処理ステップ612が現在の基底ハミルトニアンに対して繰り返される場合、パラメータ値は、最適化プロトコルを使用して更新される。様々な最適化プロトコルを使用してパラメータ値を更新できることを当業者であれば理解するだろう。実際に、1つ以上の実施形態では、最適化プロトコルは、勾配降下、確率勾配降下、局所探索、ランダム探索、最急降下及びベイズ最適化からなる群から選択される少なくとも1つのメンバーであることを理解されたい。1つ以上の実施形態では、パラメータ値の更新は、勾配ベースの方法に基づく少なくとも1つの最適化プロトコルを使用して実行される。1つ以上の代替実施形態では、パラメータ値の更新は、微分不要法に基づく少なくとも1つの最適化プロトコルを使用して実行される。さらに、パラメータ値は、処理ステップ616による推定比、処理ステップ618により推定された標的ハミルトニアンによって定められる自由エネルギー、及び以前の1つ以上のパラメータ値を使用して、最適化プロトコルを使用して更新されることを理解されたい。1つ以上の実施形態では、パラメータ値は、現在のパラメータ値周りの局所探索を使用して更新される。
【0216】
さらに
図6を参照すると、処理ステップ614によれば、パラメータ値に対応する標的ハミルトニアンの指標を取得する。パラメータ値に対応する標的ハミルトニアンの指標は、パラメータ化標的ハミルトニアンを使用して取得できることを理解されたい。
【0217】
処理ステップ616によれば、取得した基底ハミルトニアンによって定められる確率分布の取得したサンプルを使用して、パラメータ値に対応する標的ハミルトニアン分配関数と現在の基底ハミルトニアン分配関数の比を推定する。パラメータ値に対応する標的ハミルトニアン分配関数と現在の基底ハミルトニアン分配関数の比に対するサンプル推定値が計算される。サンプル比は、取得した
を使用して計算される。このサンプルは、現在の基底ハミルトニアンによって定められる確率分布からのものである。より正確には、現在の基底ハミルトニアン分配関数とパラメータ値に対応する標的ハミルトニアン分配関数の比のサンプル推定値は、以下の等式を使用して計算される。
【数12】
【0218】
【0219】
さらに
図6を参照すると、処理ステップ620によれば、推定比、パラメータ値に対応する取得した標的ハミルトニアンによって定められる自由エネルギー、及びパラメータ値を提供する。
【0220】
決定ステップ622によれば、第1の停止基準が満たされない場合、処理ステップ610において、現在の基底ハミルトニアンによって定められる確率分布から取得した配置サンプルの同じセット
を使用して、処理ステップ612、614、616、618及び620を繰り返す。第1の停止基準は、様々なタイプのものとすることができることを理解されたい。1つ以上の実施形態では、第1の停止基準は、パラメータ値が特定の値に収束したことである。1つ以上の代替実施形態では、第1の停止基準は、処理ステップ612、614、616、618及び520を所与の回数繰り返すことである。
【0221】
第2の停止基準が満たされない場合、決定ステップ624によれば、処理ステップ606~620及び決定ステップ622を繰り返す。第2の停止基準は、様々なタイプのものとすることができることを理解されたい。1つ以上の実施形態では、第2の停止基準は、基底ハミルトニアンのファミリーを表すパラメータ化基底ハミルトニアンのパラメータが特定の値に収束したことである。1つ以上の代替実施形態では、第2の停止基準は、処理ステップ606~620及び決定ステップ622を所与の回数繰り返すことである。
【0222】
さらに
図6を参照すると、処理ステップ626によれば、パラメータ化標的ハミルトニアンによって定められる自由エネルギーのパラメータ化された負の少なくとも1つの最大値及び少なくとも1つの最大値の引数を推定する。当業者であれば、最大値及び最大値の引数は、様々な方法で推定できることを理解するだろう。1つ以上の実施形態では、最大値及び最大値の引数は、処理ステップ616中に推定比を比較することによって推定される。1つ以上の代替実施形態では、処理ステップ618中に推定される自由エネルギーの負の値は共に格納され、新しく推定された自由エネルギーの負の値がより大きい場合、処理ステップ618の繰り返し中に更新される。1つ以上の代替実施形態では、最後に推定された自由エネルギーの負の値が提供される。
【0223】
処理ステップ628によれば、パラメータ化標的ハミルトニアンによって定められる自由エネルギーのパラメータ化された負の少なくとも1つの推定最大値及び少なくとも1つの最大値の引数を提供する。パラメータ化標的ハミルトニアンによって定められる自由エネルギーのパラメータ化された負の少なくとも1つの推定最大値及び少なくとも1つの最大値の引数は、様々な実施形態に従って提供できることを理解されたい。1つ以上の実施形態では、パラメータ化標的ハミルトニアンによって定められる自由エネルギーのパラメータ化された負の少なくとも1つの推定最大値及び少なくとも1つの最大値の引数は、メモリユニット22に格納される。1つ以上の代替実施形態では、パラメータ化標的ハミルトニアンによって定められる自由エネルギーのパラメータ化された負の少なくとも1つの推定最大値及び少なくとも1つの最大値の引数は、表示装置14に表示される。1つ以上の代替実施形態では、パラメータ化標的ハミルトニアンによって定められる自由エネルギーのパラメータ化された負の少なくとも1つの推定最大値及び少なくとも1つの最大値の引数は、デジタルコンピュータ8に動作可能に接続される遠隔処理装置に提供される。
【0224】
ここで
図7を参照すると、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の最大値を推定する方法の実施形態が示されている。本明細書に開示される方法は、基底ハミルトニアンによって定められる分布からサンプリングするように構成されるサンプリング装置により生成されるサンプルに基づいて、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の最大値の推定値を提供する。
【0225】
さらに
図7を参照すると、処理ステップ700によれば、基底ハミルトニアンの指標を取得する。基底ハミルトニアンの指標は、様々なタイプのものとすることができることを理解されたい。1つ以上の実施形態では、基底ハミルトニアンの指標は、エネルギー関数を表す数学関数である。
【0226】
基底ハミルトニアンの指標は、様々な実施形態に従って取得できることを理解されたい。
【0227】
1つ以上の実施形態では、デジタルコンピュータ8を使用して基底ハミルトニアンの指標を取得する。基底ハミルトニアンの指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0228】
1つ以上の代替実施形態では、基底ハミルトニアンの指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0229】
1つ以上の代替実施形態では、基底ハミルトニアンの指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。1つ以上の実施形態では、データネットワークはインターネットを含む。
【0230】
基底ハミルトニアンが物理モデル及びこのモデルに対応するボルツマン確率分布を定めることは、当業者であれば理解するだろう。より正確には、E
bが基底ハミルトニアンを定める。これは、配位空間上で動作する古典エネルギー関数によって定められる。所与の配置cに対して、基底ハミルトニアンは、エネルギーE
b(c)を表す実数を出力する。1つ以上の実施形態では、配置cは2値ベクトルである。全ての可能な配置に対する基底ハミルトニアンに対応する確率分布は、ボルツマン分布によって指定される。
【数13】
【0231】
さらに
図7を参照すると、処理ステップ702によれば、標的ハミルトニアンのファミリーの指標を取得する。標的ハミルトニアンのファミリーの指標は、エネルギー関数を表す数学関数のリストを含むことができることを理解されたい。標的ハミルトニアンのファミリーの指標は、様々な実施形態に従って取得できることを理解されたい。
【0232】
1つ以上の実施形態では、デジタルコンピュータ8を使用して標的ハミルトニアンのファミリーの指標を取得する。標的ハミルトニアンのファミリーの指標は、デジタルコンピュータ8のメモリユニット22に格納できることを理解されたい。
【0233】
1つ以上の代替実施形態では、標的ハミルトニアンのファミリーの指標は、デジタルコンピュータ8と対話するユーザによって提供される。
【0234】
1つ以上の代替実施形態では、標的ハミルトニアンのファミリーの指標は、図示しないが、デジタルコンピュータ8に動作可能に結合される遠隔処理ユニットから取得する。遠隔処理ユニットは、様々な実施形態に従って、デジタルコンピュータ8に動作可能に結合することができる。1つ以上の実施形態では、遠隔処理ユニットは、データネットワークを介してデジタルコンピュータ8に結合される。データネットワークは、ローカルエリアネットワーク、メトロポリタンエリアネットワーク及びワイドエリアネットワークからなる群から選択することができる。1つ以上の実施形態では、データネットワークはインターネットを含む。
【0235】
さらに
図7を参照すると、処理ステップ704によれば、基底ハミルトニアンを使用してサンプリング装置を設定する。
【0236】
サンプリング装置は様々なタイプのものとすることができることを理解されたい。当業者であれば、サンプリング装置は、本明細書に記載される任意の物理学着想のコンピュータを含むことができることを理解するだろう。例えば、1つ以上の実施形態では、サンプリング装置はNISQ装置を含む。サンプリング装置は、
図1に示すシステムに関して本明細書に記載される任意のサンプリング装置のような、任意の適切なサンプリング装置とすることができることを理解されたい。サンプリング装置は、例えば本明細書の他の箇所に開示されるように、サンプリング装置のタイプに依存し得る様々な方法で設定できることを理解されたい。
【0237】
処理ステップ706によれば、サンプリング装置を使用して、基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得する。基底ハミルトニアンは、サンプリング装置で実装できるようなものであることを当業者であれば理解するだろう。さらに複数のサンプルは、例えば本明細書の他の箇所に開示されるように、基底ハミルトニアンによって定められるボルツマン分布からのサンプリングに使用されるサンプリング装置のタイプ及び手順に依存し得る様々な方法で取得できることを理解されたい。
【0238】
所与のE
bに対して、サンプリング装置の出力は複数の
配置サンプル
であり、N
sはサンプル数である。1つ以上の実施形態では、サンプル数N
sはユーザによって提供されることを理解されたい。当業者であれば、サンプリング装置が量子コンピュータである1つ以上の実施形態において、量子ビットの状態を複数回測定することにより、基底ハミルトニアンによって定められる確率分布から複数のサンプルを得ることを理解するだろう。
【0239】
処理ステップ708によれば、次の標的ハミルトニアンの指標を取得する。1つ以上の実施形態では、次の標的ハミルトニアンの指標は、エネルギー関数を表す数学関数である。
【0240】
より正確には、Etを標的ハミルトニアンとする。基底ハミルトニアンについて上記で紹介したボルツマン確率分布とサンプルの概念は、標的ハミルトニアンにも及ぶ。しかし、基底ハミルトニアンとは異なり、標的ハミルトニアンによって定められる分布からのサンプリングにはサンプリング装置を使用しないことを当業者であれば理解するだろう。標的ハミルトニアンの配位空間は、基底ハミルトニアンの配位空間と同じであることを当業者であれば理解するだろう。
【0241】
さらに
図7を参照すると、処理ステップ710によれば、基底ハミルトニアンによって定められる確率分布から取得したサンプルと以下の等式を使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比を推定する。
【数14】
【0242】
処理ステップ712によれば、推定比をリストに格納する。
【0243】
決定ステップ714によれば、標的ハミルトニアンのファミリーを表すリストの最後に到達したかどうかを見つけるテストを実行する。標的ハミルトニアンのファミリーを表すリストの最後に到達していない場合、処理ステップ606において基底ハミルトニアンによって定められる確率分布から取得した配置サンプルの同じセット
を使用して、処理ステップ708、710及び712を繰り返す。
【0244】
【0245】
1つ以上の代替実施形態では、最大推定比値は、格納し、処理ステップ710において標的ハミルトニアンのファミリーにおける標的ハミルトニアンに対して推定される次の比によって更新する。
【0246】
さらに
図7を参照すると、処理ステップ718によれば、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の少なくとも1つの推定最大値を提供する。標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の少なくとも1つの推定最大値は、様々な実施形態に従って提供できることを理解されたい。1つ以上の実施形態では、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の少なくとも1つの推定最大値は、メモリユニット22に格納される。1つ以上の代替実施形態では、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の少なくとも1つの推定最大値は、表示装置14に表示される。1つ以上の他の実施形態では、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の少なくとも1つの推定最大値は、デジタルコンピュータ8に動作可能に接続される遠隔処理装置に提供される。
【0247】
[強化学習アプリケーション]
強化学習(RL)は、累積報酬を表す効用関数の概念を最大化するために、ソフトウェアエージェントが環境においてどのように行動すべきかに関する機械学習の分野である。強化学習は、ゲーム理論、制御理論、オペレーションズリサーチ、情報理論、シミュレーションベースの最適化、マルチエージェントシステム、群知能、統計学及び遺伝的アルゴリズムのような多くの分野で研究されている。オペレーションズリサーチ及び制御の分野では、強化学習は、近似動的プログラミング又は神経動的プログラミングとも呼ばれる。経済学及びゲーム理論では、強化学習を用いて、有界合理性の下で均衡がどのように生じるかを説明することができる。
【0248】
環境は、通常、マルコフ決定過程(MDP)の形式で定義される。一実施形態は、米国特許出願番号第15/590614号に見出すことができ、本出願は参照により本明細書に組み込まれる。
【0249】
より正確には、強化学習フレームワークは、少なくとも1つのソフトウェアエージェントと、環境と、ソフトウェアエージェントと環境との相互作用と、を含む。さらに、環境は状態及び瞬時報酬を含み、エージェントと環境との相互作用は行動を含む。ソフトウェアエージェントは、累積瞬時報酬を表す少なくとも1つの効用関数を使用して、累積瞬時報酬を最大化することを目的とする。
【0250】
状態及び行動は、離散値及び連続値の両方をとることができることを理解されたい。状態及び行動の数は、任意の有限数とすることができる。
【0251】
当業者であれば、瞬時報酬は様々なタイプのものとすることができることを理解するだろう。実際、瞬時報酬を表す数は、離散的かつ連続的なものとすることができることを理解されたい。さらに、瞬時報酬は状態に依存することを理解されたい。それは、決定論的かつ確率論的なものであり得る。
【0252】
効用関数は、様々なタイプのものとすることができることを理解されたい。例えば、1つ以上の実施形態によれば、効用関数はQ関数である。1つ以上の代替実施形態では、効用関数は価値関数である。1つ以上の代替実施形態では、効用関数は一般化利点推定器である。
【0253】
強化学習フレームワークにおけるトレーニング手順は、様々なタイプのものとすることができることを当業者であれば理解するだろう。例えば、1つ以上の実施形態によれば、トレーニング手順は、TD学習アルゴリズム、Q学習アルゴリズム、Q学習ラムダアルゴリズム、状態行動報酬行動(SARSA)アルゴリズム、状態行動報酬状態行動(SARSA)ラムダアルゴリズム、深層Qネットワーク(DQN)アルゴリズム、深層決定方策勾配(DDPG)アルゴリズム、非同期アドバンテージアクタークリティック(A3C)アルゴリズム、ソフトアクタークリティック(SAC)アルゴリズム、正規化有利関数(NAF)を用いたQ学習アルゴリズム、信頼領域方策最適化(TRPO)アルゴリズム、近位方策最適化(PPO)アルゴリズム及び双子遅延深層決定方策勾配(TD3)アルゴリズムからなるアルゴリズム群から選択される少なくとも1つのアルゴリズムに基づいて実装される。
【0254】
上記のアルゴリズムのいずれかに基づくトレーニング手順において、関数近似技術が使用できることを理解されたい。関数近似技術は、
図3に関して本明細書に記載される任意の観測可能値など、任意の適切な近似器の使用を含むことができる。近似器は、
図3に関して本明細書に記載される任意の方法など、任意の方法を使用して推定できる。適切な近似器は、本明細書に記載される任意の熱力学的特性など、任意の熱力学的特性であり得る。1つ以上の実施形態では、関数近似器として使用される熱力学的特性は、自由エネルギーの負の値である。関数近似器は、効用関数の非明示的なパラメータ化表現を含む。1つ以上の実施形態では、関数近似器はボルツマンマシンの自由エネルギーである。この実施形態では、関数近似器の非明示的なパラメータはボルツマンマシンの重みであり、状態及び行動はボルツマンマシンの可視ノードによって表される。1つ以上の代替実施形態では、関数近似器は深層多層ボルツマンマシンの自由エネルギーであり、その可視ノードは、入力が状態及び行動を表すニューラルネットワークの出力であり、その重みは、関数近似器の非明示的なパラメータである。
【0255】
当業者であれば、トレーニング手順の過程で、効用関数を最大化する行動を推定するステップが使用できることを理解するだろう。より正確には、行動を表すパラメータに関して効用関数の少なくとも1つの最大値及び最大値の引数を見つける/推定するステップは、トレーニング手順におけるステップの実行に必要とされ得る。行動を表すパラメータに関して効用関数の少なくとも1つの最大値及び最大値の引数を推定するステップには、任意の方法が使用できることを当業者であれば理解するだろう。自由エネルギーの負の値が関数近似器として使用される1つ以上の実施形態では、
図6に関して本明細書に記載される任意の方法など、自由エネルギーの少なくとも1つの最大値及び最大値の引数を推定する任意の方法を使用することができる。このような実施形態では、標的ハミルトニアンは、行動を表すパラメータでパラメータ化される。
【0256】
したがって、強化学習フレームワークにおけるトレーニング手順に対する本明細書に開示される方法の1つ以上の実施形態の使用方法が開示され、強化学習フレームワークは、少なくとも1つの効用関数の最適化を追求するエージェントと、状態及び瞬時報酬を含む環境と、行動を含む環境とエージェントとの相互作用と、を含み、瞬時報酬は少なくとも1つの効用関数に寄与し、使用方法は、少なくとも1つの効用関数を近似するステップと、提供される状態に対応する少なくとも1つの効用関数を最大化する行動を推定するステップと、を含む。1つ以上の実施形態では、少なくとも1つの効用関数は、価値関数、Q関数及び一般化利点推定器からなる群から選択される。
【0257】
本明細書に開示される方法の1つ以上の実施形態は、様々な理由から非常に有利であることを理解されたい。
【0258】
より正確には、本明細書に開示される方法の1つ以上の実施形態の利点は、サンプリング装置の機能を拡張して、装置上で構成可能でないモデルの観測可能値を推定することである。
【0259】
本明細書に開示される方法の1つ以上の実施形態の別の利点は、エントロピーを使用して様々なモデルを比較できることである。
【0260】
本明細書に開示される方法の1つ以上の実施形態の別の利点は、1つのサンプリングのみを使用して、ハミルトニアンのファミリーの自由エネルギーの負の最大値及び最大値の引数を推定できることである。
【0261】
本明細書に開示される方法の1つ以上の実施形態の別の利点は、様々なサンプリング装置を使用して実装できることである。
【0262】
本明細書に開示される方法の別の利点は、強化学習に適用できることである。
【0263】
項1
基底ハミルトニアンを使用して少なくとも1つの標的ハミルトニアンの観測可能値の期待値を推定する方法であって、
a.基底ハミルトニアンの指標及び観測可能値の指標を取得するステップと、
b.前記基底ハミルトニアンを使用してサンプリング装置を設定するステップと、
c.前記サンプリング装置を使用して、前記基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得するステップと、
d.少なくとも1つの標的ハミルトニアンのリストの各標的ハミルトニアンに対して:
i.前記基底ハミルトニアンによって定められる前記確率分布から取得した前記複数のサンプルを使用して、前記標的ハミルトニアンに対応する前記観測可能値の期待値を推定し、
ii.前記標的ハミルトニアンに対応する前記観測可能値の推定期待値を提供するステップと、を含み、複数のサンプルの使用は、
1.前記標的ハミルトニアンと前記基底ハミルトニアンとの分配関数の比のサンプル推定値を計算することと、
2.前記標的ハミルトニアンによって定められる前記確率分布に関する前記観測可能値の期待値の非正規化推定値を計算することと、
3.分配関数の推定比及び非正規化推定期待値を使用して、前記標的ハミルトニアンによって定められる前記確率分布に関する前記観測可能値の前記期待値の推定値を計算することと、を含む、方法。
【0264】
項2
パラメータ化標的ハミルトニアンによって表される標的ハミルトニアンのファミリーによって定められる自由エネルギーのパラメータ化された負の最大値及び最大値の引数を推定する方法であって、
a.基底ハミルトニアンのファミリーの指標を取得するステップと、
b.前記基底ハミルトニアンのファミリーから初期基底ハミルトニアンを選択するステップと、
c.パラメータ化標的ハミルトニアンの指標を取得するステップと、
d.第1の停止基準が満たされるまで:
i.現在の基底ハミルトニアンを更新し、
ii.前記現在の基底ハミルトニアンを使用してサンプリング装置を設定し、
iii.前記サンプリング装置を使用して、前記現在の基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得し、
iv.初期パラメータ値を選択し、
v.第2の停止基準が満たされるまで:
1.パラメータ値を更新し、
2.前記パラメータ化標的ハミルトニアンを使用して前記パラメータ値に対応する標的ハミルトニアンの指標を取得し、
3.取得した基底ハミルトニアンによって定められる前記確率分布から取得したサンプルを使用して、前記パラメータ値に対応する標的ハミルトニアン分配関数と現在の基底ハミルトニアン分配関数の比を推定し、
4.前記標的ハミルトニアンの自由エネルギーを推定し、
5.推定比、取得した標的ハミルトニアンによって定められる前記自由エネルギー、及び対応するパラメータ値を提供するステップと、
e.前記パラメータ化標的ハミルトニアンによって定められる自由エネルギーのパラメータ化された負の少なくとも1つの最大値及び少なくとも1つの最大値の引数を推定するステップと、
f.自由エネルギーのパラメータ化された負の少なくとも1つの推定最大値及び少なくとも1つの推定最大値の引数を提供するステップと、を含む、方法。
【0265】
項3
前記基底ハミルトニアンのファミリーが1つの基底ハミルトニアンを含む、項2に記載の方法。
【0266】
項4
前記基底ハミルトニアンのファミリーが、パラメータ化基底ハミルトニアンによって表される、項2に記載の方法。
【0267】
項5
前記現在の基底ハミルトニアンが、勾配ベースの方法に基づく少なくとも1つの最適化プロトコルを使用して更新される、項2に記載の方法。
【0268】
項6
前記現在の基底ハミルトニアンが、微分不要法に基づく少なくとも1つの最適化プロトコルを使用して更新される、項2に記載の方法。
【0269】
項7
前記現在の基底ハミルトニアンの前記更新が、勾配降下、確率勾配降下、最急降下、ベイズ最適化、ランダム検索及び局所検索からなる群から選択される方法に基づく少なくとも1つの最適化プロトコルを使用して実行される、項2に記載の方法。
【0270】
項8
前記パラメータ値の前記更新が、勾配ベースの方法に基づく少なくとも1つの最適化プロトコルを使用して実行される、項2に記載の方法。
【0271】
項9
前記パラメータ値の前記更新が、微分不要法に基づく少なくとも1つの最適化プロトコルを使用して実行される、項2に記載の方法。
【0272】
項10
前記パラメータ値の前記更新が、勾配降下、確率勾配降下、最急降下、ベイズ最適化、ランダム探索及び局所探索からなる群から選択される少なくとも1つの方法に基づく最適化プロトコルを使用して実行される、項2に記載の方法。
【0273】
項11
基底ハミルトニアンからのサンプルを使用して、標的ハミルトニアンのファミリーによって定められる自由エネルギーの負の最大値及び最大値の引数を推定する方法であって、
基底ハミルトニアンの指標を取得するステップと、
標的ハミルトニアンのファミリーの指標を取得するステップと、
前記基底ハミルトニアンを使用してサンプリング装置を設定するステップと、
前記サンプリング装置を使用して、前記基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得するステップと、
前記標的ハミルトニアンのファミリーを表す標的ハミルトニアンのリストの各標的ハミルトニアンに対して:
前記基底ハミルトニアンによって定められる前記確率分布から取得したサンプルを使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比を推定し、
推定比をリストに格納し、
前記推定比の前記リストを使用して、前記標的ハミルトニアンの前記ファミリーによって定められる自由エネルギーの負の少なくとも1つの最大値を推定し、
前記標的ハミルトニアンの前記ファミリーによって定められる自由エネルギーの負の少なくとも1つの推定最大値を提供するステップと、を含む、方法。
【0274】
項12
サンプリング装置を使用して、標的ハミルトニアンと基底ハミルトニアンによって定められる2つのモデルのエントロピー間の差を推定する方法であって、
基底ハミルトニアンの指標を取得するステップと、
標的ハミルトニアンの指標を取得するステップと、
前記基底ハミルトニアンを使用してサンプリング装置を設定するステップと、
前記サンプリング装置を使用して、前記基底ハミルトニアンによって定められる確率分布から複数のサンプルを取得するステップと、
取得したサンプルを使用して、標的ハミルトニアン分配関数と基底ハミルトニアン分配関数の比を推定するステップと、
項1の処理ステップd.i.1、d.i.2及びd.i.3を使用して、前記標的ハミルトニアンに対応するエネルギー観測可能値の期待値を推定するステップと、
前記標的ハミルトニアンに対応する前記エネルギー観測可能値の推定比及び推定期待値を使用して、前記標的ハミルトニアンに対応するエントロピーと前記基底ハミルトニアンに対応するエントロピー間の差を推定するステップと、
前記標的ハミルトニアンに対応するエントロピーと前記基底ハミルトニアンに対応するエントロピー間の推定差を提供するステップと、を含む、方法。
【0275】
項13
前記観測可能値の前記推定期待値がエネルギー関数期待値を含む、項1に記載の方法。
【0276】
項14
前記観測可能値の前記推定期待値がn点関数を含む、項1に記載の方法。
【0277】
項15
前記サンプリング装置が、処理装置に動作可能に結合される量子プロセッサを含み、
さらに、サンプリング装置制御システムが、量子プロセッサ制御システムを含む、項1~14のいずれか一項に記載の方法。
【0278】
項16
前記サンプリング装置が量子コンピュータを含む、項1~14のいずれか一項に記載の方法。
【0279】
項17
前記サンプリング装置が量子アニーラを含む、項1~14のいずれか一項に記載の方法。
【0280】
項18
前記サンプリング装置が、ノイズのある中規模量子デバイスを含む、項1~14のいずれか一項に記載の方法。
【0281】
項19
前記サンプリング装置がトラップイオン量子コンピュータを含む、項1~14のいずれか一項に記載の方法。
【0282】
項20
前記サンプリング装置が、超伝導ベースの量子コンピュータを含む、項1~14のいずれか一項に記載の方法。
【0283】
項21
前記サンプリング装置が、スピンベースの量子ドットコンピュータを含む、項1~14のいずれか一項に記載の方法。
【0284】
項22
前記サンプリング装置がデジタルアニーラを含む、項1~14のいずれか一項に記載の方法。
【0285】
項23
前記サンプリング装置が、集積フォトニックコヒーレントイジングマシンを含む、項1~14のいずれか一項に記載の方法。
【0286】
項24
前記サンプリング装置が、処理装置に動作可能に結合されるとともに、光エネルギー源からエネルギーを受け取って複数の光パラメトリック発振器を生成するように構成される光コンピューティング装置と、各々が複数の光パラメトリック発振器を制御可能に結合する複数の結合装置と、を含む、項1~14のいずれか一項に記載の方法。
【0287】
項25
前記観測可能値の前記推定期待値を関数近似器として使用するステップをさらに含む、項1に記載の方法。
【0288】
項26
前記自由エネルギーを関数近似器として使用するステップをさらに含む、項2~11のいずれか一項に記載の方法。
【0289】
項27
ハミルトニアンの熱力学的特性を推定するステップと、前記熱力学的特性を関数近似器として使用するステップと、をさらに含む、項1に記載の方法。
【0290】
項28
強化学習フレームワークにおけるトレーニング手順に対する項1~27のいずれか一項に記載の方法の使用方法であって、前記強化学習フレームワークは、
(i)少なくとも1つの効用関数の最適化を追求するエージェントと、
(ii)状態及び瞬時報酬を含む環境と、
(iii)行動を含む前記環境と前記エージェントとの相互作用と、を含み、
前記瞬時報酬は前記少なくとも1つの効用関数に寄与し、
前記使用方法は、前記少なくとも1つの効用関数を近似するステップと、提供される状態に対応する前記少なくとも1つの効用関数を最大化する行動を推定するステップと、を含む、使用方法。
【0291】
項29
前記少なくとも1つの効用関数が、価値関数、Q関数及び一般化利点推定器からなる群から選択される、項28に記載の使用方法。