特開2025-10496 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ テラ　クアンタム　アーゲーの特許一覧

特開2025-10496量子コンピュータを用いて最適な動作を選択するためのシステム及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2025010496

(43)【公開日】2025-01-21

(54)【発明の名称】量子コンピュータを用いて最適な動作を選択するためのシステム及び方法

(51)【国際特許分類】

G06N 10/60 20220101AFI20250110BHJP

G06N 10/20 20220101ALI20250110BHJP

【ＦＩ】

G06N10/60

G06N10/20

【審査請求】有

【請求項の数】17

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2024098652

(22)【出願日】2024-06-19

(31)【優先権主張番号】23184242

(32)【優先日】2023-07-07

(33)【優先権主張国・地域又は機関】EP

(71)【出願人】

【識別番号】521124319

【氏名又は名称】テラクアンタムアーゲー

【氏名又は名称原語表記】ＴＥＲＲＡＱＵＡＮＴＵＭＡＧ

(74)【代理人】

【識別番号】100109210

【弁理士】

【氏名又は名称】新居広守

(72)【発明者】

【氏名】ハバウリー・ネイサン

(72)【発明者】

【氏名】コードザンガネー・モハンマド

(72)【発明者】

【氏名】ジョシ・アユシュ

(72)【発明者】

【氏名】トカレフ・イーゴリ

(72)【発明者】

【氏名】アブダラ・ルーカス

(72)【発明者】

【氏名】クルキン・アンドリー

(72)【発明者】

【氏名】キリアコウ・バジル

(72)【発明者】

【氏名】メルニコフ・アレクセイ

(57)【要約】（修正有）

【課題】複雑な多段階決定問題における最適な動作を予測する量子計算システム、方法及びプログラムを提供する。
【解決手段】現在の状態に基づいて最適な動作を決定するための量子計算システム２０は、第１の計算量子ビットと、第２の計算量子ビットと、第１の計算量子ビット及び第２の計算量子ビットに夫々作用する複数の量子ゲートを備える第１、第２の変分量子回路２６、２８と、を備え、複数の量子ゲートは夫々、計算量子ビットの状態を修正するための変分量子ゲート及び符号化ゲートを備え、符号化ゲートは、第１、第２の計算量子ビットにおいて、第１、第２の入力特徴ベクトル３０、３２をそれぞれ符号化し、第２の変分量子回路の量子ゲートは、第１の計算量子ビットに作用せず、第１、第２の計算量子ビットの量子状態をもつれさせるコヒーレント相互作用回路３４と、最適な動作を示す出力特徴ベクトルを決定するための測定部分３６と、を備える。
【選択図】図４

【特許請求の範囲】

【請求項1】

現在の状態に基づいて多段階決定問題における最適な動作を決定するための量子計算システム（２０）であって、前記量子計算システム（２０）が、
第１の計算量子ビットを備える第１の量子ビットレジスタ（２２）と、
第２の計算量子ビットを備える第２の量子ビットレジスタ（２４）と、
前記第１の計算量子ビットに作用する複数の量子ゲートを備える第１の変分量子回路（２６）と、
前記第２の計算量子ビットに作用する複数の量子ゲートを備える第２の変分量子回路（２８）と
を備え、
前記第１の変分量子回路（２６）の、及び前記第２の変分量子回路（２８）の、前記複数の量子ゲートが各々、前記第１の計算量子ビット及び前記第２の計算量子ビットの量子状態をそれぞれ修正するための変分量子ゲート（２６ａ，２８ａ）及び符号化ゲート（２６ｂ，２８ｂ）を備え、
前記第１の量子ビットレジスタ（２２）及び前記第２の量子ビットレジスタ（２４）の前記第１の計算量子ビット及び前記第２の計算量子ビットに対する前記変分量子ゲート（２６ａ，２８ａ）のパラメータ化された動作は、関連する変分パラメータに従ってパラメータ化され、
前記符号化ゲート（２６ｂ，２８ｂ）が、前記第１の計算量子ビット及び前記第２の計算量子ビットの前記量子状態において、第１の入力特徴ベクトル（３０）及び第２の入力特徴ベクトル（３２）をそれぞれ符号化するように構成され、
前記第２の変分量子回路（２８）の前記量子ゲートが、前記第１の計算量子ビットに作用せず、
前記量子計算システム（２０）が、
コヒーレント相互作用量子回路（３４）であって、前記コヒーレント相互作用量子回路（３４）が、前記第１の変分量子回路（２６）及び前記第２の変分量子回路（２８）によってそれぞれ作用される前記第１の計算量子ビット及び前記第２の計算量子ビットの前記量子状態を、もつれさせるための複数のマルチ量子ビットゲートを備える、コヒーレント相互作用量子回路（３４）と、
前記第１の計算量子ビット及び前記第２の計算量子ビットの一方又は両方の量子状態を測定することによって前記最適な動作を示す出力特徴ベクトル（３８）を決定するための測定部分（３６）と、を備える、
量子計算システム（２０）。

【請求項2】

前記第１の入力特徴ベクトル（３０）が、前記現在の状態に基づいており、前記第２の入力特徴ベクトル（３２）が、前記多段階決定問題の複数の異なる状態に有効なシナリオ情報に基づいており、
前記シナリオ情報が、前記多段階決定問題の段階のシーケンスにわたって特に一定又は滑らかな関数である、
請求項１に記載の量子計算システム（２０）。

【請求項3】

前記多段階決定問題が、相互接続されたノードのグラフ上に定義され、前記多段階決定問題が、現在のノードに基づく次のノードの選択に基づき、
前記現在の状態が、特に、前記現在のノードに関する情報を含み、前記シナリオ情報が、前記現在のノードから独立しており、及び／又は、
前記現在の状態及び／又は前記シナリオ情報が、経過時間に、及び／又は前記多段階決定問題を解決するために取られた段階の数に、基づいて変化する、
請求項２に記載の量子計算システム（２０）。

【請求項4】

前記多段階決定問題が、ナビゲーション問題であり、前記最適な動作が、エッジによって相互接続された交差点を特徴とする地図上の最適な進行方向を示し、
前記シナリオ情報が、交通摂動に関する、好ましくは前記交通摂動の空間的起源に関する情報を、特に符号化し、前記多段階決定問題が、前記交通摂動を考慮した避難ルーティングに関する、
請求項１に記載の量子計算システム（２０）。

【請求項5】

前記量子計算システム（２０）が、第１の計算量子ビットの第１の数と、第２の計算量子ビットの第２の数と、を含み、前記第１の数と前記第２の数とが、異なる、
請求項１に記載の量子計算システム（２０）。

【請求項6】

前記量子計算システム（２０）が、第３の変分量子回路（４０）を更に備え、前記第３の変分量子回路（４０）が、前記コヒーレント相互作用量子回路（３４）の出力量子状態に作用する、
請求項１に記載の量子計算システム（２０）。

【請求項7】

前記変分パラメータが、前記現在の状態に基づく多段階意思決定アルゴリズムの選択された行動を予測するための訓練アルゴリズムに基づいて訓練され、前記変分パラメータが、特に、ノードのグラフをナビゲートするためのナビゲーションアルゴリズムに基づいて訓練され、前記最適な動作が、前記ノードのグラフを最適にナビゲートするための予測された次のノードに基づき、
前記現在の状態が、特に、隣接ノードごとに隣接ノード情報を含み、前記隣接ノード情報が、好ましくは、
現在のノード座標と、
宛先ノード座標と、
開始ノード座標と、
前記現在のノードと前記隣接ノードとの間の移動時間を示すエッジ重み情報と、
前記隣接ノードと前記現在のノードとの間のユークリッド距離に関する距離情報と、
前記隣接ノードに関するエッジ中心性情報と、
前記現在のノード、前記隣接ノード、及び宛先ノードの座標に基づくコサインノルム情報と
のグループから選択された１つ又は複数の情報フィールドを含む、
請求項１に記載の量子計算システム（２０）。

【請求項8】

請求項１に記載の量子計算システム（２０）を備えるハイブリッド量子計算システム（４２）であって、
前記ハイブリッド量子計算システム（４２）が、古典的なハードウェア上に実装される第１の機械学習モデル（４４）を更に備え、
前記第１の機械学習モデル（４４）が、出力特徴ベクトル（３８）を取得するために前記第１の入力特徴ベクトル（３０）及び／又は前記第２の入力特徴ベクトル（３２）を処理するように構成され、
前記ハイブリッド量子計算システム（４２）が、組合せモジュール（５４）を更に備え、前記組合せモジュール（５４）が、前記第１の機械学習モデル（４４）の前記出力特徴ベクトル（３８）と、前記測定部分（３６）の出力特徴ベクトル（３８）と、を組み合わせ、組合せパラメータに基づいて前記最適な動作を示す出力状態を決定するように構成され、
前記変分パラメータ、機械学習パラメータ、及び前記組合せパラメータが、共通の訓練アルゴリズムに基づいて取得され、前記変分パラメータ、前記機械学習パラメータ、及び前記組合せパラメータが、前記最適な動作の予測を改善するために反復的に共に更新される、
ハイブリッド量子計算システム（４２）。

【請求項9】

前記組合せモジュール（５４）が、前記第１の機械学習モデルの前記出力特徴ベクトル（３８）と前記量子計算システム（２０）の前記測定部分（３６）とを組み合わせるための第２の機械学習モジュール（５４）を備える、
請求項８に記載のシステム（２０，４２）。

【請求項10】

前記第１の機械学習モデル（４４）が、前記第１の入力特徴ベクトル（３０）及び前記第２の入力特徴ベクトル（３２）をそれぞれ処理するための第１のサブモデル（４６）及び第２のサブモデル（４８，５０）を備え、特徴単位の変調層（５０）を更に備え、前記特徴単位の変調層（５０）が、前記第１のサブモデル（４６）の出力（５６）に作用し、前記特徴単位の変調層（５０）の重み及び／又はバイアスが、前記第２のサブモデル（４８，５０）の出力（５６）に基づいて変調され、
機械学習モデル（４４、５４）が、特に、前記特徴単位の変調層（５０）の出力（５６）を処理するように構成される第３のサブモデル（５２）を更に備える、
請求項８に記載のシステム（２０，４２）。

【請求項11】

前記ハイブリッド量子計算システム（４２）が、前記第１の機械学習モデル（４４）及び前記量子計算システム（２０）の前記最適な動作へのバランスのとれた寄与を促進するように選択された訓練ハイパーパラメータを用いた訓練に基づいて、特に、機械学習モデル（４４，５４）の前記パラメータを更新するため、及び前記量子計算システム（２０）の前記変分パラメータを更新するため、異なる学習率を用いた訓練に基づいて、取得される、
請求項８に記載のシステム（２０，４２）。

【請求項12】

請求項１から１１のいずれか一項に記載のシステム（２０，４２）を備えるナビゲーションシステム。

【請求項13】

現在の状態に基づいて多段階決定問題における最適な動作を予測するための請求項１から１１のいずれか一項に記載のシステム（２０，４２）を訓練するための方法であって、前記多段階決定問題の条件が、時間とともに発展し、前記方法が、
前記多段階決定問題のシナリオ情報及び現在の状態情報を決定するステップと、
スーパーバイザアルゴリズムに基づいて最適な段階を予測するステップと、
前記量子計算システム（２０）又は前記ハイブリッド量子計算システム（４２）によって前記最適な段階の予測を取得するステップと、
前記多段階決定問題の前記現在の状態及び前記条件を更新するステップと
によって、前記多段階決定問題の候補解を反復的に決定するステップと、
前記量子計算システム（２０）又は前記ハイブリッド量子計算システム（４２）によって予測された前記最適な段階の前記予測が前記スーパーバイザアルゴリズムによって予測された前記最適な段階に近付くように、最適化アルゴリズムに基づいて前記量子計算システム（２０）の前記変分パラメータを更新するステップと、を含む、
方法。

【請求項14】

前記スーパーバイザアルゴリズムが、前記現在の状態から始まる前記多段階決定問題の完全な解に基づいて、前記最適な段階を決定し、
前記条件が、前記完全な解を決定するために特に固定される、
請求項１３に記載の方法。

【請求項15】

機械可読命令を備えるコンピュータプログラムであって、前記コンピュータプログラムが処理ユニットによって実行されると、前記処理ユニットに請求項１から１１のいずれか一項に記載のシステムを実施させる、
コンピュータプログラム。

【請求項16】

機械可読命令を備えるコンピュータプログラムであって、前記コンピュータプログラムが処理ユニットによって実行されると、前記処理ユニットに請求項１２に記載のナビゲーションシステムを実施させる、
コンピュータプログラム。

【請求項17】

機械可読命令を備えるコンピュータプログラムであって、前記コンピュータプログラムが処理ユニットによって実行されると、前記処理ユニットに請求項１３に記載の方法を実施させる、
コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、量子コンピューティングの分野である。より正確には、本発明は、多段階決定問題に直面するエージェントの最適な動作を予測するための量子コンピューティングの使用に関する。

【背景技術】

【0002】

地震のような自然災害は、生命の損失及び物的損害を含む破壊的な影響をもたらす可能性がある。緊急避難手順は、そのようなシナリオでは重要であり、これらの手順を最適化することは、生命を守るために不可欠である。緊急避難時の最も一般的な輸送手段の１つは車であり、これらの車両が取るルートが安全で、効率的であることを保証することが重要である。

【0003】

地図を符号化するノードのグラフをナビゲートするための信頼できるアルゴリズムが存在するが、動的に変化する条件が導入される場合、最先端のアルゴリズムであっても最適なパスを発見するタスクは困難になる。具体的には、自然災害の場合、交通は、例えば、封鎖された道路及びローカルな交通渋滞を通して局所的に影響を受けるだけでなく、効率的なルーティングはまた、進行中の避難行動の一部として交通渋滞の発生を通して影響を受ける可能性がある。

【0004】

量子コンピュータは、計算を実施するために、その状態及び相互作用を制御し得る制御可能な量子力学システムのプラットフォームを提供する。計算は、制御可能な量子力学システム、例えば、古典的ビットの量子アナログとしての量子ビットの決定論的発展によって実現され、量子力学システムの状態を測定して計算の結果を決定することができる。

【0005】

これらの量子ビットに対する制御動作は量子ゲートと呼ばれる。単一の量子ビット（いわゆる単一量子ビットゲート）の状態の変化を引き起こすために、及び複数の量子ビット（いわゆるマルチ量子ビットゲート）に作用するために、量子ゲートは、例えば、複数の量子ビットの状態及びそれらの任意の組合せをもつれさせるために、量子ビットに対しコヒーレントに作用することができる。例えば、単一量子ビットゲートは、選択可能な値、例えばπ／２だけ電子のスピン状態の回転を引き起こしてもよい。マルチ量子ビットゲートは、２つの量子ビットの状態に対するコヒーレントＣＮＯＴ演算など、２つ以上の量子ビットに対してコヒーレントに作用し得る。計算を実施するため、並列で又はシーケンスで、量子コンピュータの量子ビットに複数の量子ゲートを適用することができる。最後に、量子ビットの状態は、計算の各可能な結果に対する確率を決定するために、量子ゲートのシーケンスを適用した後に繰り返し測定されてもよい。

【0006】

しかしながら、量子力学システムの重ね合わせ／もつれ状態は、本質的に揮発性であり（例えば、デコヒーレンスを被る）、これらのシステムの制御及び測定は、忠実度マージンの影響を受け、これにより、最先端の量子コンピュータは、制御可能な量子力学システムの数（量子ビット）と、連続的に実施される制御動作（量子ゲート）の数との両方において現在制限されている。

【0007】

これらの欠点にもかかわらず、近い将来に利用可能な量子プロセッサの有望な用途、すなわち、変分量子アルゴリズムなど、ノイズの多い中間規模量子（ＮＩＳＱ）デバイスが存在する。変分量子アルゴリズムでは、量子ゲートの動作は、変分パラメータに関してパラメータ化され、変分パラメータは、機械学習と同様に、古典的なコンピューティングリソースの助けを用いて体系的に変化されることがある。最適解に対する変分量子回路の出力にコストを帰属させるコスト関数を極端にするために変分パラメータを変化させることによって、変分量子回路の出力を「訓練」して、見えない問題に最適解を提供することができる。異なる量子ビット間の量子もつれは、「量子優位性」を提供するために、大きい内部状態空間へのアクセスを与えることがある。

【0008】

非特許文献１は、ノード及びエッジのグラフを通る最適なパスを決定するための一般的なアルゴリズムを開示している。

【先行技術文献】

【非特許文献】

【0009】

【非特許文献1】ＧｉａｃｏｍｏＮａｎｎｉｃｉｎｉａｎｄＬｅｏＬｉｂｅｒｔｉ．（“Ｓｈｏｒｔｅｓｔｐａｔｈｓｏｎｄｙｎａｍｉｃｇｒａｐｈｓ．ＩｎｔｅｒｎａｔｉｏｎａｌＴｒａｎｓａｃｔｉｏｎｓｉｎＯｐｅｒａｔｉｏｎａｌＲｅｓｅａｒｃｈ”，１５（５）：５５１－５６３，２００８）

【発明の概要】

【発明が解決しようとする課題】

【0010】

従来の最適化方法は、古典的なアルゴリズムに依存しており、緊急避難計画の最適化など、大規模な問題の複雑さを取り扱うことができない場合がある。更に、これらのアルゴリズムは、正確な予測を行うため、問題のランドスケープ全体及びダイナミクスに関する完全な知識を有することに、一般に依存する。

【課題を解決するための手段】

【0011】

この最先端技術を考慮して、本発明の目的は、特に問題に関する情報の（ローカルな）サブセットに基づいて、複雑な多段階決定問題に直面したとき、最適な動作を予測するための改善したシステムを提供することである。

【0012】

この目的は、独立請求項に記載の方法及びシステムによって解決される。従属請求項は、好ましい実施形態に関する。

【0013】

第１の態様によれば、本発明は、現在の状態に基づいて多段階決定問題における最適な動作を決定するための量子計算システムに関する。量子計算システムは、第１の計算量子ビットを備える第１の量子ビットレジスタと、第２の計算量子ビットを備える第２の量子ビットレジスタと、第１の計算量子ビットに作用する複数の量子ゲートを備える第１の変分量子回路と、第２の計算量子ビットに作用する複数の量子ゲートを備える第２の変分量子回路と、を備える。第１の変分量子回路の、及び第２の変分量子回路の、複数の量子ゲートは各々、第１の計算量子ビット及び第２の計算量子ビットの状態をそれぞれ修正するための変分量子ゲート及び符号化ゲートを備え、量子ビットレジスタの量子ビットに対する変分量子ゲートのパラメータ化された動作は、関連する変分パラメータに従ってパラメータ化される。符号化ゲートは、第１の計算量子ビット及び第２の計算量子ビットの量子状態において、第１の入力特徴ベクトル及び第２の入力特徴ベクトルをそれぞれ符号化するように構成され、第２の変分量子回路の量子ゲートは、第１の計算量子ビットに作用しない。本システムは、コヒーレント相互作用量子回路であって、コヒーレント相互作用量子回路が、第１の変分量子回路及び第２の変分量子回路によってそれぞれ作用される第１の計算量子ビット及び第２の計算量子ビットの量子状態をもつれさせるための複数のマルチ量子ビットゲートを備える、コヒーレント相互作用量子回路と、第１の計算量子ビット及び第２の計算量子ビットの一方又は両方の量子状態を測定することによって最適な動作を示す出力特徴ベクトルを決定するための測定部分と、更に備える。

【0014】

変分量子回路の現在の手法とは対照的に、第１及び第２の変分量子回路は、それぞれの変分パラメータに基づいて、第１及び第２の計算量子ビットを個別に処理するなどのために、量子ビットの異なるセットに独立して作用してもよい。第２の変分量子回路の量子ゲートは、第１の計算量子ビットに作用せず、第１の変分量子回路の量子ゲートは、第２の計算量子ビットに作用しなくてもよい。その後、コヒーレント相互作用回路は、第１及び第２の計算量子ビットの状態をもつれさせ、結果として得られるもつれた量子状態は、決定及び最適な動作のために処理され、測定されてもよい。第１及び第２の変分量子回路の分離は、ローカル情報及びグローバル情報に関連する情報の効率的な訓練及び処理を可能にすることがあり、第１及び第２の入力特徴ベクトルは、好ましくは、多段階決定問題の異なるダイナミクスを符号化するために使用される。例えば、第１の入力特徴ベクトルは、ローカル情報を第１の計算量子ビットに符号化する一方で、第２の入力特徴ベクトルは、グローバル情報を第２の計算量子ビットに符号化してもよい。

【0015】

好ましい実施形態では、第１の入力特徴ベクトルは、現在の状態に基づいており、第２の入力特徴ベクトルは、多段階決定問題の複数の異なる状態に有効なシナリオ情報に基づいている。

【0016】

現在の状態は、ローカル情報を符号化し、相互接続されたノードのグラフの１つのノードに対して有効など、多段階決定問題の所与の段階に対してのみ有効であってもよい。多段階決定問題のいくつかの状態、特に、多段階決定問題の根底にある相互接続されたノードのグラフの複数のノードに影響を及ぼし、並びに／あるいは多段階決定問題の複数の段階に有効であり得る情報を、シナリオ情報は符号化してもよい。例えば、シナリオ情報は、摂動の根本的な原因及び／又は起源、例えば、地震の空間的起源、テロ攻撃の報告された位置、又は同様の空間情報など、多段階決定問題に対する摂動に関する情報を符号化してもよい。

【0017】

第１及び第２の入力特徴ベクトルにおける情報は、データ再アップロード回路に基づいて、変分量子回路において符号化され、第１及び第２の変分量子回路は各々、変分量子ゲートの層及び符号化ゲートの層を備え、これらは、交互にそれぞれの計算量子ビットに適用されてもよい。

【0018】

第１の入力特徴ベクトル及び／又は第２の入力特徴ベクトル内の情報は、符号化ゲートの複数の層にわたって符号化され、符号化ゲートの対は、変分量子ゲートの層によって分離され、入力特徴ベクトルの値の符号化は、符号化ゲートの異なる層において繰り返されてもよい。符号化ゲートの複数の層にわたる入力特徴ベクトルの値の符号化の繰り返しは、データ再アップロードを模倣し、量子計算システムによる仮定されたメカニズムに対する内部フィッティング関数の順序を増加してもよい。追加的又は代替的に、大きい入力特徴ベクトルの値は、符号化ゲートの複数の層にわたって符号化され得る入力特徴サブベクトルに分離され、符号化ゲートの層は、入力特徴サブベクトルのうちの１つを符号化してもよい。

【0019】

好ましい実施形態では、シナリオ情報は、多段階決定問題の段階のシーケンスにわたって一定又は滑らかな関数である。

【0020】

例えば、シナリオ情報は、摂動に関連する空間情報、例えば、交通摂動の起源を提供してもよく、地震の強度、損傷の重大度、及び／又は影響を受けた領域のサイズなど、摂動に関する振幅情報を含んでもよい。

【0021】

いくつかの実施形態では、第１の変分量子回路は、現在の状態で符号化されたローカル情報に基づいて第１の計算量子ビットを処理し、第２の変分量子回路は、第２の計算量子ビットで符号化されたシナリオ情報を独立して処理してもよい。結果として得られる状態の測定値が、シナリオ情報において符号化された摂動を考慮して現在の状態に基づいて最適な動作を検索し得るように、結果として得られる量子状態を、もつれさせてもよい。第１及び第２の変分量子回路の分離により、変分量子回路は、シナリオ情報を効果的に一般化し、訓練アルゴリズムの収束を容易にすることを有効にする。

【0022】

好ましい実施形態では、多段階決定問題は、相互接続されたノードのグラフ上に定義され、多段階決定問題は、現在のノードに基づく次のノードの選択に基づく。

【0023】

多段階決定問題は、現在の状態のノードごとの進行に基づいて、ターゲット宛先ノードへのナビゲーションであってもよい。現在の状態は、現在のノードに基づいても、隣接するエッジ情報及び／又は隣接するノードのプロパティに基づいてもよい。更に、現在の状態は、現在の状態のコンテキスト情報を含んでもよく、これを、現実世界のプロパティに関連付けることができ、これは、相互接続されたノードのグラフでは表せない場合がある。例えば、コンテキスト情報は、ナビゲーションタスクの開始ノード及び終了ノードの座標など、エージェント及び／又はタスクコンテキストの空間座標を含んでもよい。

【0024】

好ましい実施形態では、現在の状態は、現在のノードに関する情報を含み、シナリオ情報は、現在のノードから独立している。

【0025】

現在の状態は、隣接ノード、エッジ重み、中心性情報、並びに現在の位置、開始位置、及びターゲット位置に関する空間情報など、現在のノードのローカル情報を符号化してもよい。シナリオ情報は、地震の位置であってもよい。

【0026】

好ましい実施形態では、現在の状態及び／又はシナリオ情報は、経過時間に、及び／又は多段階決定問題を解決するために取られた段階の数に、基づいて変化する。

【0027】

例えば、現在の状態は、経過時間及び／又は取られた段階の数に基づいて、動的に更新されたエッジ重みなど、動的情報に基づいてもよい。いくつかの実施形態では、経過時間及び／又は取られた段階の数に基づいて、現在の状態の変化を促進する動的情報は、現在の状態を現在のノードとして過小評価する可能性がある複数のノードに影響を及ぼす。いくつかの実施形態では、摂動の開始からの経過時間は入力データの一部である。システムは、動的に変化する問題環境における最適なルートの訓練セットに基づいて、動的情報を考慮するように訓練されてもよい。例えば、グラフ上のナビゲーション問題におけるグラフのエッジ重みなど、多段階決定問題の条件の展開は、摂動のシミュレーションに従って更新されてもよい。

【0028】

好ましい実施形態では、多段階決定問題はナビゲーション問題であり、最適な動作は、エッジによって相互接続された交差点を特徴とする地図上の最適な進行方向を示す。

【0029】

地震避難シナリオでは、震源に近く、交通渋滞が自然に収束する潜在的な出口に近い、エッジ重みが、増加する可能性があり（例えば、進行中の避難動態の一部としての交通渋滞の発生に基づいて）、対応する動的グラフがシミュレートされてもよい。訓練目的のために、例えば、訓練セットを生成するための異なる開始ノード、震源、及び出口条件に基づいて、複数の動的避難シナリオをシミュレートしてもよい。その後、システムは、複数の避難シナリオで訓練されてもよい。例えば、修正されたナビゲーションアルゴリズムは、ノード単位のナビゲーションを担当してもよく、グラフ情報（例えば、エッジ重み）は、シミュレーションアルゴリズムによる地震のシミュレーションに基づいて、ナビゲーションアルゴリズムによって決定された各段階の後に更新されてもよい。その後、システムは、動的シナリオで避難するための多段階決定問題の現在の状態に基づいて最適なノードを選択するように訓練されてもよく、古典的なヒューリスティックなルーティングアルゴリズムは、教師あり学習方式におけるスーパーバイザとして作用してもよい。

【0030】

好ましい実施形態では、シナリオ情報は、交通摂動に関する、特に、交通摂動の空間的起源に関する情報を符号化し、多段階決定問題は、交通摂動を考慮した避難ルーティングに関する。

【0031】

シナリオ情報は、動的に変化する避難シナリオにおいてエージェントが取る最適な動作を修正し得る震源座標及び／又は地震強度を符号化してもよい。シナリオ情報は、現在の状態に関連する情報よりも小さくてもよく、したがって、第２の計算量子ビットの数は、第１の計算量子ビットの数よりも小さくてもよい。

【0032】

好ましい実施形態では、量子計算システムは、第１の計算量子ビットの第１の数と、第２の計算量子ビットの第２の数と、を含み、第１の数と第２の数とは異なる。

【0033】

例えば、第２の数は、第１の数よりも小さくてもよい。

【0034】

コヒーレント相互作用回路は、第２の計算量子ビットに対する第２の変分量子回路の作用に基づいて、第１の計算量子ビットの任意の更なる計算に利用可能な量子状態空間を増加させるなどのために、第１の計算量子ビットの量子状態を、もつれさせることができる。

【0035】

好ましい実施形態では、システムは、第３の変分量子回路を更に備え、第３の変分量子回路は、コヒーレント相互作用量子回路の出力量子状態に作用する。

【0036】

第３の変分量子回路は、最適な動作を決定するための出力状態を生成するために、第１の計算量子ビット及び第２の計算量子ビットのもつれ状態を処理してもよい。第３の変分量子回路は、第１の計算量子ビット及び第２の計算量子ビットの全部又は一部に作用してもよい。いくつかの実施形態では、第３の変分量子回路の量子ゲートが作用する量子ビットの数は、第１の数と第２の数との和よりも小さい。第３の変分量子回路が第１及び第２の計算量子ビットのサブセットに作用するとき、第１及び第２の変分量子回路によって生成された量子状態の情報の凝縮が促進され、これは、計算量子ビットの異なるセットに第１の入力特徴ベクトル及び第２の入力特徴ベクトルとして提供される入力に、最適なラベルを帰属させるというタスクについて、変分パラメータの最適な組合せに向けた変分量子回路の収束を改善する可能性がある。

【0037】

好ましい実施形態では、変分パラメータは、現在の状態に基づく多段階意思決定アルゴリズムの選択された行動を予測するための訓練アルゴリズムに基づいて訓練され、変分パラメータは、特に、ノードのグラフをナビゲートするためのナビゲーションアルゴリズムに基づいて訓練され、最適な動作は、ノードのグラフを最適にナビゲートするための予測された次のノードに基づく。

【0038】

第１の入力特徴ベクトルは、エージェントの現在の状態に対応する、現在のノードなど、現在の状態に関する情報を符号化してもよい。第２の入力特徴ベクトルは、ノードのグラフの複数のノードについて、エッジ重み変動を示す摂動情報を符号化してもよい。最適な動作は、ターゲット（宛先）ノードにナビゲートするための予測された次のノードを示すラベルであってもよく、ターゲットノードは、第１の入力特徴ベクトル又は第２の入力特徴ベクトルで示されてもよい。

【0039】

好ましい実施形態では、現在の状態は、隣接ノードごとに隣接ノード情報を含む。隣接ノード情報は、現在のノード座標と、宛先ノード座標と、開始ノード座標と、現在のノードと隣接ノードとの間の移動時間を示すエッジ重み情報と、隣接ノードと現在のノードとの間のユークリッド距離に関する距離情報と、隣接ノードに関するエッジ中心性情報と、現在のノード、隣接ノード、及び宛先ノードの座標に基づくコサインノルム情報と、のグループから選択された１つ又は複数の情報フィールドを含む。

【0040】

現在のノード座標は、ノードのグラフによって抽象化され得る地図上のノードの空間位置を符号化してもよい。宛先ノード座標は、地図上の各隣接ノードの空間位置を符号化し、開始及び終了ノード座標は、開始位置、及びターゲットナビゲーションゴールの空間位置を、それぞれ符号化してもよい。エッジ重み情報は、隣接ノードの各ノードオプションまでの移動時間を示すなどのために、隣接ノードごとに提供され、エッジ中心性情報は、隣接ノードのそれぞれに接続されたエッジの数を符号化してもよい。コサインノルム情報は、現在のノードから隣接ノードのうちの１つへの変化が、ターゲットナビゲーションゴールから離れる、又はターゲットナビゲーションゴールに関して接線方向の、ターゲットナビゲーションゴールに向かう移動に関連するか否かの問題に関連する方向情報を示してもよい。例えば、方向情報は、現在のノードと隣接ノードとの間のベクトルと、現在のノードとターゲットナビゲーションゴールに関連付けられた終了ノードとの間のベクトルと、の間の角度及び／又はそれらの間のスカラー積に基づいてもよい。具体的には、コサイン距離を、以下のように定義することができる。

【0041】

【数1】

【0042】

ここで、ノードｐ、及び出口「ｅｘｉｔ」、及び隣接ノードｑについて、Ａ及びＢは、Ａ＝（ｑ_ｘ－ｐ_ｘ，ｑ_ｙ－ｐ_ｙ）、及びＢ＝（ｅｘｉｔ_ｘ－ｐ_ｘ，ｅｘｉｔ_ｙ－ｐ_ｙ）として定義することができる。

【0043】

ユークリッド距離情報は、現在のノードと隣接ノードとの間の分離距離に基づいてもよい。

【0044】

隣接ノードに関する情報は、媒介中心性情報を更に含んでもよい。媒介中心性は、最短経路に基づくグラフの中心性の尺度であり、ノードごとに、エッジを通過するこれらの最短経路の数を表す。媒介中心性が高いノードは、他のノード間の最短経路に沿って戦略的に配置され、グラフの接続性に大きな影響を与えることを意味する。

【0045】

訓練データにおいて、隣接ノードに関する情報は、例えば、変分量子回路への複数の隣接ノードに関する情報の取扱いに関して、対応する対称性を促進するなどのために、それぞれの入力特徴ベクトルにおける隣接ノードの順序を切り替えることによって強化されてもよい。

【0046】

第２の態様によれば、本発明は、第１の態様による量子計算システムを備えるハイブリッド量子計算システムに関する。システムは、古典的なハードウェア上に実装される第１の機械学習モデルを更に備え、第１の機械学習モデルは、出力特徴ベクトルを取得するために第１の入力特徴ベクトル及び／又は第２の入力特徴ベクトルを処理するように構成される。ハイブリッド量子計算システムは、組合せモジュールを更に備え、組合せモジュールは、第１の機械学習モデルの出力特徴ベクトルと、測定部分の出力特徴ベクトルと、を組み合わせ、組合せパラメータに基づいて最適な動作を示す出力状態を決定するように構成される。変分パラメータ、機械学習パラメータ、及び組合せパラメータは、共通の訓練アルゴリズムに基づいて取得され、変分パラメータ、機械学習パラメータ、及び組合せパラメータは、最適な動作の予測を改善するために反復的に共に更新される。

【0047】

本発明者らは、古典的なハードウェア上に実装され、０と１のバイナリ値に基づいて入力特徴ベクトルを処理し得る古典的な機械学習モデルと、第１の態様による量子計算システムと、の組合せが、訓練されたタスクに関する入力特徴ベクトルのラベリングを改善し、量子変分回路配置が、最適な動作の最適な選択のグローバルな態様に適合し、第１の機械学習モデルが、多段階決定問題を最適に解決する一部として、最適な選択のグローバルな態様からの偏差に影響されやすい可能性ある、ことを見出した。多段階決定問題の共同解決は、第１の機械学習モデル及び量子計算システムの共同訓練に依存し、量子計算システム及び機械学習モデルの個々の出力は、それ自体では最適な動作を示さないことがあるが、それらのそれぞれの出力特徴ベクトルの訓練された組合せは、最適な動作を予測するための中間結果から引き出されることがある。出力特徴ベクトルの組合せは、例えば、量子計算システムの連結された出力特徴ベクトルを処理する第２の機械学習モデルに、及び第１の機械学習モデルに、基づいて、出力特徴ベクトルの線形組合せであっても、又は出力特徴ベクトルの非線形組合せであってもよい。

【0048】

好ましい実施形態では、組合せモジュールは、第１の機械学習モデルの出力特徴ベクトルと量子計算システムの測定部分とを組み合わせるための第２の機械学習モジュールを備える。

【0049】

第１の機械学習モデルの出力特徴ベクトルを取得するために、第１のサブモデル及び第２のサブモデルの出力を組み合わせ得る前に、第１の機械学習モデルは、第１及び第２の特徴ベクトルをそれぞれ個別に処理するための第１及び第２のサブモデルの提供に基づいて、量子計算システムの構造を模倣してもよい。

【0050】

好ましい実施形態では、第１の機械学習モデルは、第１の特徴ベクトル及び第２の特徴ベクトルをそれぞれ処理するための第１のサブモデル及び第２のサブモデルを備え、特徴単位の変調層を更に備え、特徴単位の変調層は、第１のサブモデルの出力に作用し、特徴単位の変調層の重み及び／又はバイアスは、第２のサブモデルの出力に基づいて変調される。

【0051】

第１のサブモデル及び第２のサブモデルの出力は、第３のサブモデルを使用して、例えば、第１のサブモデル及び第２のサブモデルの組合せ出力、例えば、人工ニューロンの層であり得る特徴単位の変調層の出力、を受信する人工ニューラルネットワークを使用して、組み合わせられてもよい。

【0052】

好ましい実施形態では、機械学習モデルは、特徴単位の変調層の出力を処理するように構成される第３のサブモデルを更に備える。

【0053】

好ましい実施形態では、システムは、第１の機械学習モデル及び量子計算システムの最適な動作へのバランスのとれた寄与を促進するように選択された訓練ハイパーパラメータを用いた訓練に基づいて、特に、機械学習モデルのパラメータを更新するため、及び量子計算システムの変分パラメータを更新するため、様々な学習率を用いた訓練に基づいて、取得される。

【0054】

例えば、変分パラメータの学習率は、第１の機械学習モデルのパラメータを、例えば、重み及びバイアスを、更新するための学習率よりも大きくてもよく、又はいくつかの実施形態では小さくてもよい。

【0055】

第２の態様によるシステムはまた、第１の態様の好ましい実施形態の任意の特徴から利益を得ることがある。

【0056】

第３の態様によれば、本発明は、第１又は第２の態様によるシステムを備えるナビゲーションシステムに関する。

【0057】

第２の態様によるシステムはまた、第１の態様又は第２の態様の好ましい実施形態の任意の特徴から利益を得ることがある。

【0058】

第４の態様によれば、本発明は、現在の状態に基づいて多段階決定問題における最適な動作を予測するために、第１、第２、又は第３の態様のうちのいずれか１つによるシステムに従ってシステムを訓練するための方法に関し、多段階決定問題の条件は、時間とともに発展する。本方法は、多段階決定問題のシナリオ情報及び現在の状態情報を決定することと、スーパーバイザアルゴリズムに基づいて最適な段階を予測すること、システムによって最適な段階の予測を取得すること、並びに多段階決定問題の現在の状態及び条件を更新すること、によって、多段階決定問題の候補解を反復的に決定することと、を含む。本方法は、システムによって予測された最適な段階の予測がスーパーバイザアルゴリズムによって予測された最適な段階に近付くように、最適化アルゴリズムに基づいて量子計算システムの変分パラメータを更新すること、を更に含む。

【0059】

いくつかの実施形態では、本方法は、関連するシナリオ情報を有する別の多段階決定問題を選択すること、を更に含む。

【0060】

好ましい実施形態では、スーパーバイザアルゴリズムは、現在の状態から始まる多段階決定問題の完全な解に基づいて、最適な段階を決定する。

【0061】

スーパーバイザアルゴリズムは、多段階決定問題を解くための段階の最適なシーケンスを計算し、最適なシーケンスに基づいて次の最適な動作を予測してもよい。次いで、現在の状態は、次の最適な動作に基づいて更新され、条件は、次の最適な動作が実行された後に更新されてもよい。次いで、アルゴリズムは、多段階決定問題を解くために、段階の次の最適なシーケンスを決定し続けてもよい。

【0062】

好ましい実施形態では、条件は、完全な解決を決定するために固定される。

【0063】

条件は、予測された最適な動作を取った後に更新され、条件は、更新された現在の状態からのみ更新されてもよい。最適な動作のシーケンスは、データの訓練セットを決定するために記録され、量子計算システム及び／又はハイブリッド量子計算システムは、データの訓練セットに基づいて訓練されてもよい。例えば、スーパーバイザアルゴリズムによる多段階決定問題の解の段階ごとに、現在の状態情報を記録し、量子計算システム及び／又はハイブリッド量子計算システムを、現在の状態に基づいて、予測される最適な段階を予測するように訓練してもよい。

【0064】

第５の態様によれば、本発明は、機械可読命令を備える非一時的媒体に関し、機械可読命令は、処理システムによって実行されると、処理システムに、第１、第２、又は第３の態様のうちのいずれか１つによるシステムを実施させ、及び／又は第４の態様による方法を実施させる。

【0065】

本発明は、摂動を考慮してナビゲーション問題の分野の実施例に関して主に説明しているが、量子計算システム及び／又はハイブリッド量子計算システムは、ロボット工学の制御問題及び／又は迷路問題など、他の多段階決定問題を解決するために使用されてもよい。更に、量子計算システム及び／又はハイブリッド量子計算システムの構造はまた、クエリ駆動画像解析など、様々な情報種別に基づく問題に対して、第１の入力特徴ベクトル及び第２の特徴ベクトルに基づいて最適なラベルを決定するために使用されることがあり、第１の入力特徴ベクトルは、特徴の順序付きシーケンスに基づいてもよく、第２の入力特徴ベクトルは、特徴の２次元地図に基づいてもよく、又はその逆であってもよい。

【0066】

単一の処理ユニットを備えてもよい、又は機能的に接続され得る複数の処理ユニットを備えてもよい、処理システムを使用して、第１の態様、第２の態様及び／又は第３の態様によるシステムは、制御されてもよい。処理ユニットは、マイクロコントローラ、ＡＳＩＣ、ＰＬＡ（ＣＰＬＡ）、ＦＰＧＡ、又はソフトウェア、ハードウェア、ファームウェア、若しくはそれらの組合せに基づいて動作する処理デバイスを含む他の処理デバイス、を備えてもよい。処理デバイスは、統合メモリを含むか、又は外部メモリと通信するか、又はその両方とすることができ、センサ、デバイス、機器、集積論理回路、他のコントローラなどに接続するためのインターフェースを更に備えてもよく、インターフェースは、電気信号、光信号、無線信号、音響信号などの信号を受信又は送信するように構成されてもよい。

【0067】

量子計算システムは、量子ハードウェアに実装され、制御システムは、量子計算システムの仕様に基づいて、例えば、量子ビットを初期化し、ゲート回転を実施し、量子ハードウェアに実装された、いくつかの量子ビットにマルチ量子ビットゲートを適用することによって、量子ハードウェアを制御するための制御信号を決定してもよい。機械学習モデルは、古典的なハードウェアにおいて、例えば、ニューラルネットワークを実装するためのコンピュータ又は専用の古典的なハードウェアなどの処理システムにおいて、ニューラルネットワークとして実装されてもよい。

【図面の簡単な説明】

【0068】

本発明による方法及びシステムの特徴及び多くの利点は、添付の図面を参照して好ましい実施形態の詳細な説明から好適に理解されるであろう。

【図1】一実施例によるエッジによって相互接続されたノードのグラフに基づいて抽象化された地図を概略的に示す図である。

【図2】多段階決定問題の現在の状態に基づいて最適な動作を決定するための量子計算システムの一実施例を示す図である。

【図3】量子計算システムの別の実施例を概略的に示す図である。

【図4】図３に示す量子計算システムと機械学習モデルとを組み合わせたハイブリッド量子－古典計算システムの一実施例を示す図である。

【図5】図１～図４のシステムのための訓練データセットを生成する方法のフローチャートの一実施例を示す図である。

【図6】図４に示すハイブリッド量子－古典計算システムを訓練する方法の一実施例を示す図である。

【発明を実施するための形態】

【0069】

図１は、一実施例によるエッジによって相互接続されたノードのグラフに基づいて抽象化された地図１０を概略的に示している。グラフのエッジは、地図１０の通りに対応し、ノードは、街路システムの交差点に対応してもよい。地図１０では、開始位置１２を中空円で示しており、開始位置１２は、例えば、エッジ又はノードに関連付けられた開始状態に対応してもよい。エッジ上の開始位置１２を開始ノードに変換することも、その逆も可能であるように、エッジは、ノードと２つのエッジとに分解され得ることに留意されたい。ナビゲーションシステムは、例えば、例示的な地図１０に示すように複数の潜在的な出口１４から選択された出口１４に向かうノード及びエッジのグラフを通るパスを見つけることを担当してもよい。対応するナビゲーション問題について、例えば、ダイクストラアルゴリズム又はＡ＊アルゴリズムなど、複数のアルゴリズムが、最適なパスを決定するために知られており、これは、開始位置１２からターゲット目的地、出口１４のうちの一方に横断するためのノード及び／又はエッジの最適なシーケンスを示すことがある。エッジは、エッジ重みに関連付けられ、これは、次のノードに向かってエッジを横断するための走行距離及び／又は走行時間に関連してもよい。

【0070】

しかしながら、図示した実施例では、ナビゲーション問題は、地震１６の形態の交通摂動によって摂動され、これは、関連する中実の白抜き円によって示すように、地図１０の所与の領域に直接影響を及ぼすことがある。地震１６は、摂動の（推定された）空間的起源を示し得る震源１８に関連付けられてもよい。

【0071】

そのような場合、例えば、封鎖された道路及びローカルな交通渋滞に基づいて、震源１８の周囲の領域の交通は、地震１６の影響によって直接影響を受けることがある。更に、継続的な避難は、特に出口１４に近い共通の避難ルートに沿った交通量を増加させ、地震１６の発生後に動的に発展し、これは、ナビゲーションシステムの最適な避難パスの発見に悪影響を及ぼすことがある。具体的には、そのような動的に変化する環境では、現在位置に基づく最適な次のエッジの決定は、ノード及びエッジのグラフ上での最適なナビゲーションに関する多段階決定問題の一部として定期的に再評価する必要があり得る。

【0072】

図２は、多段階決定問題の現在の状態に基づいて、最適な動作決定するための量子計算システム２０の一実施例を示している。システムは、第１の計算量子ビットの第１の量子ビットレジスタ２２と、第２の計算量子ビットの第２の量子ビットレジスタ２４と、を備え、これらは、第１の変分量子回路２６及び第２の変分量子回路２８によってそれぞれ処理される。第１の変分量子回路２６及び第２の変分量子回路２８は各々、第１の計算量子ビット及び第２の計算量子ビットの状態を、それぞれ修正するための符号化ゲートを備え、更に、量子ビットに対する作用が変分パラメータによってパラメータ化される変分量子ゲートを各々備える。

【0073】

第１の変分量子回路２６及び第２の変分量子回路２８は各々、変分量子ゲートの複数の層を備え、変分量子ゲートの各層は、それぞれの量子ビットの各量子ビットに作用し、それぞれの量子ビットの状態をもつれさせるためのマルチ量子ビットゲートを備えてもよい。

【0074】

第１の変分量子回路２６及び第２の変分量子回路２８の符号化ゲートは、第１の計算量子ビット及び第２の計算量子ビットの状態で、第１の入力特徴ベクトル３０及び第２の入力特徴ベクトル３２を、それぞれ符号化してもよい。

【0075】

第１の入力特徴ベクトル３０は、現在のノード、隣接ノード、並びに地図上の位置情報、例えば、現在位置、開始位置１２、及び／又は選択された若しくは複数の出口１４の位置情報に関連する情報など、それぞれの多段階決定問題に基づいて現在の状態情報を符号化してもよい。第２の入力特徴ベクトル３２は、例えば、震源１８の位置、及び／又は地震１６の重大度など、地震１６に関連する摂動情報を符号化してもよい。

【0076】

第１の変分量子回路２６及び第２の変分量子回路２８が第１の計算量子ビット及び第２の計算量子ビットに作用した後、コヒーレント相互作用回路３４は、第１の計算量子ビット及び第２の計算量子ビットの結果として得られる量子状態を、もつれさせてもよい。例えば、第１の計算量子ビット及び第２の計算量子ビットのコヒーレントな重畳状態を準備し、例えば、更なる変分パラメータに従って、その重畳状態を処理し得る、マルチ量子ビットゲートを、コヒーレント相互作用回路３４は備えてもよい。

【0077】

第１の計算量子ビット及び／又は第２の計算量子ビットの結果として得られる量子状態は、例えば、適切な量子ビット状態検出器による量子ビットの射影測定に基づいて、測定部分３６において測定されてもよい。

【0078】

測定部分３６の測定状態に基づいて決定され得る、結果として得られる出力特徴ベクトル３８は、最適な動作を示し、例えば、地図１０の複数の隣接ノードから選択された次のノードを示すことがある。

【0079】

図３は、量子計算システム２０の別の実施例を概略的に示している。量子計算システム２０は、第１の変分量子回路２６及び第２の変分量子回路２８によってそれぞれ独立して処理される、第１の計算量子ビットの第１の量子ビットレジスタ２２と、第２の計算量子ビットの第２の量子ビットレジスタ２４と、を備える。第１の変分量子回路２６及び第２の変分量子回路２８が第１の計算量子ビット及び第２の計算量子ビットに作用した後、コヒーレント相互作用回路３４は、例えば、図３に示すように、第１の計算量子ビット及び第２の計算量子ビットのペア単位のＣＮＯＴ演算に基づいて、第１の計算量子ビット及び第２の計算量子ビットの結果として得られる量子状態を、もつれさせてもよい。コヒーレント相互作用回路３４が第１の計算量子ビットの状態を第２の計算量子ビットの状態ともつれさせた後に、第３の変分量子回路４０は、第１の計算量子ビットを処理し、結果として得られる量子状態は、測定部分３６によって測定されてもよい。

【0080】

第１の変分量子回路２６と第２の変分量子回路２８との両方は、単位Ｕ（θ）及びＶ（ｘ）として示す、変分量子ゲート２６ａ、２８ａの層と、符号化ゲート２６ｂ、２８ｂの層と、をそれぞれ備える。単位Ｕ（θ）は、対応する変分パラメータに基づいて、角度θだけ量子ビットの状態を所与の軸周りに回転させ得る複数の量子ゲートを備えてもよい。例えば、単位Ｕ（θ）の各々は、計算量子ビットごとに、単一量子ビット回転ゲートを備え、これは、ｎ個の計算量子ビットについて、それぞれの量子ビットの量子状態を、関連する角度、例えば、θ_１、θ_２、．．．、θ_ｎだけ回転させてもよい。角度の各々は、対応する変分パラメータに基づいてもよく、各層２６ａ、２８ａの変分パラメータは、変分量子ゲート２６ａ、２８ａの異なる層に対して異なってもよい。

【0081】

同様に、符号化ゲート２６ｂ、２８ｂの層は各々、第１及び第２の入力特徴ベクトル３０、３２の値を符号化するための複数の量子ゲートを備えてもよい。符号化ゲートの動作は、第１の変分量子回路２６の符号化ゲートのうちの一方に対する第１の入力特徴ベクトル３０の値に基づいてもよく、第２の変分量子回路２８の符号化ゲートのうちの一方に対する第２の入力特徴ベクトル３２の値に基づいてもよい。例えば、現在の状態は、符号化ゲート２６ｂ、２８ｂの６つの層にわたって符号化され得る３０個の値のベクトルに関連付けられてもよく、すなわち、符号化ゲート２６ｂ、２８ｂの各層は、それぞれの値に基づいて第１の量子ビットレジスタの５つの量子ビットの量子状態を回転させることによって入力特徴ベクトルの５つの値を符号化する。

【0082】

符号化ゲート２６ｂ、２８ｂの特定の層の適用は、例えば、第２の特徴ベクトル３２を符号化ゲート２８ｂの複数の層で複数回再アップロードするために、第１の変分量子回路２６及び／又は第２の変分量子回路２８の一部として繰り返えされてもよく、これは、変分量子ゲート２８ａの層の適用間の同じ回転に従って第２の計算量子ビットの量子状態を修正する。

【0083】

変分量子ゲート２６ａ、２８ａの層、及び符号化ゲート２６ｂ、２８ｂの層は、計算量子ビットの量子状態における入力特徴ベクトル３０、３２の特徴の符号化を改善するなどのために、交互に計算量子ビットの状態に作用してもよい。

【0084】

一実施例として、第２の入力特徴ベクトル３２は、震源１８の座標を含み、第１の入力特徴ベクトル３０は、ナビゲーション問題の現在の状態に関する情報を含み、これにより、第２の計算量子ビットの量子状態は、地震１６の位置に基づいて影響を受け、第１の計算量子ビットの状態は、ローカルで利用可能なナビゲーション情報に基づいて影響を受けることがある。

【0085】

コヒーレント相互作用回路３４によって生成されたもつれ状態は、対応する変分パラメータに基づいて量子状態に影響を及ぼし得る第３の変分量子回路４０に従って処理され、これは、対応する角度θに基づく複数の単一量子ビット回転、及び量子ビットをもつれさせるためのマルチ量子ビットゲートとして再び実施されてもよい。第３の変分量子回路４０はまた、変分量子ゲートの複数の層を備え、変分量子ゲートの各層は、関連する変分パラメータに基づいて量子ビットに作用する変分量子ゲートと、第３の変分量子回路４０によって処理される計算量子ビットの一部又は全部の間のもつれを引き起こすマルチ量子ビットゲートと、を備えてもよい（マルチ量子ビットゲートは、一般に、可変動作に関連付けられてもよい）。

【0086】

量子計算回路は、データの訓練セットに基づいて訓練され、データの訓練セットは、関連する避難シナリオのための複数の最適なルートを含み、各最適なルートは、例えば、最適な次のノードの選択に基づいて、複数の決定段階を含んでもよい。

【0087】

量子計算システム２０が、データの訓練セットの最適なルートを作成したスーパーバイザアルゴリズムによって予測された最適な動作を予測し得るように、変分パラメータは、複数の決定段階に基づいて最適化されてもよい。例えば、最適なノードに関してシステム２０によって予測ノードにコストを帰属させるコスト関数の勾配を、例えば、量子計算システム２０の偏導関数の測定に基づいて決定し、コストを最小化するために、変分パラメータを更新してもよい。第１の、第２の、及び第３の変分量子回路２６、２８、４０の変分パラメータは、次の最適な動作を効率的に決定する量子計算システム２０を得るなどのために、共に更新されるべきである。

【0088】

入力特徴を第１の入力特徴ベクトル３０及び第２の入力特徴ベクトル３２に分離すること、並びに第１の変分量子回路２６及び第２の変分量子回路２８によるそれらのそれぞれ独立した処理は、量子計算システム２０による摂動情報の取扱いを改善し、変分パラメータの最適極値への収束を改善し、これにより、例えば、地震１６を考慮した地図上のナビゲーション問題の場合に、複数の異なる可能な状態に影響を及ぼす摂動として、動的に展開する条件及び摂動を伴う対応する多段階決定問題に対して、最適な動作の質を改善し得ることが見出された。

【0089】

結果として、第１の入力特徴ベクトル３０において符号化され得る現在の状態に関するローカル情報と、第２の入力特徴ベクトル３２において符号化され得る交通摂動に関するシナリオ情報と、に実質的に基づいて、量子計算システム２０は、次の最適状態を予測するための多段階決定問題において使用されてもよい。

【0090】

図４は、図３に示す量子計算システム２０と、最適な動作の予測を改善するための機械学習モデル４４と、を組み合わせたハイブリッド量子－古典計算システム４２の一実施例を示している。

【0091】

機械学習モデル４４は、第１の入力特徴ベクトル３０及び第２の入力特徴ベクトル３２をそれぞれ処理するための第１のサブモデル４６及び第２のサブモデル４８を含む、人工ニューロンのニューラルネットワークとして実装される。第２のサブモデル４８の出力特徴ベクトルは、（第２の入力特徴ベクトル３２として符号化された）摂動に基づく特徴と、第１のサブモデル４６によって処理された局所的に利用可能な現在の状態情報に基づく特徴と、の間の相互作用を導入するなどのように、第１のサブモデル４６の人工ニューロン５０の中間層の重み及び／又はバイアスを修正する。結果として得られる特徴は、機械学習モデル４４の出力特徴ベクトルを決定するために、第３のサブモデル５２によって処理される。

【0092】

連結された出力特徴ベクトルを取得するために、機械学習モデル４４の結果として得られる出力特徴ベクトルを、量子計算システム２０の測定出力に基づく出力特徴ベクトルと連結することができる。その後、連結された出力特徴ベクトルは、組合せモジュール５４によって、機械学習モデル４４及び量子計算システム２０の出力特徴を組み合わせるために処理されてもよく、これは、人工ニューロンの別のニューラルネットワークに基づく第２の機械学習モデルとして実装されてもよい。

【0093】

ハイブリッド量子－古典計算システム４２の出力５６は、ナビゲーション問題を解決するための次の最適なノードを示すなど、システム４２の対応する訓練に基づく多段階決定問題の最適な動作を示し、例えば、車の動作を指示するエージェントは、エッジによって相互接続されたノードのグラフを横断するすべての中間段階で次のノード／エッジを選択することができる。

【0094】

本発明者らは、ハイブリッド量子－古典計算システム４２が、ハイブリッド量子－古典計算システム４２の個々の構成要素、すなわち、機械学習モデル４４又は量子計算システム２０自体に関して、改善された出力５６を生成し得ることを見出した。

【0095】

機械学習モデル４４及び第２の機械学習モデル５４のパラメータ（例えば、重み及び／又はバイアス）、並びに量子計算システム２０の変分パラメータは、訓練可能なパラメータの共同のセットとして共同の訓練アルゴリズム内で訓練されてもよく、現在の状態が、及び解かれる多段階決定問題に対する摂動として作用するシナリオ情報が、与えられると、アルゴリズムは、最適な動作の予測を最適化するためなど、訓練可能なパラメータを反復的に更新する。

【0096】

アルゴリズムは、第１及び第２の入力特徴ベクトル３０、３２を量子計算システム２０及び機械学習モデル４４に反復的に提供し、それぞれの出力特徴ベクトルは、第２の機械学習モデル５４に提供されてもよい。その後、アルゴリズムは、入力特徴ベクトル３０、３２の最適な動作のためのコスト関数の値に基づいて、変分パラメータ、及び機械学習モデル４４、５４のパラメータのパラメータ更新を決定してもよい。訓練可能なパラメータは、一般に、ハイブリッド量子－古典計算システム４２の出力５６に関連するコスト関数を極端にするために、反復的に共に更新される。

【0097】

通常、複数の予測された最適行動の勾配が決定され、訓練可能なパラメータは、最適な動作の複数の最適シーケンスに基づいて、例えば、複数のルートに基づいて、更新されてもよい。各最適な動作に帰属するコストは、教師あり学習アプローチにおいてスーパーバイザアルゴリズムによって決定された最適解に基づき、又は、強化学習に、例えば、ナビゲーション問題の解に帰属するコスト、例えば、開始位置１２から出口１４まで地図１０をナビゲートするために必要な時間に、基づき、時間は、予測されたシーケンスに従うときに、グラフの各エッジを横断するために必要な時間に基づいて計算されてもよい。

【0098】

訓練アルゴリズムでは、量子計算システム２０及び機械学習モデル４４の解へのバランスのとれた寄与を取得するための訓練中に、それぞれのモデルの収束時間を調整するなどのため、変分パラメータ、及び機械学習モデル４４のパラメータを更新するための学習率は、異なっていてもよい。

【0099】

以下では、ハイブリッド量子－古典計算システム４２の特定の適用、及び対応する訓練プロセスについて説明するが、当業者であれば、実施例の個々の態様が他の問題及びシナリオに適用され得ることを理解するであろう。

【0100】

図５は、訓練データセットを生成する方法のフローチャートの一実施例を示している。方法は、重み付けされた計算グラフとして都市などの地図１０を初期化すること（Ｓ１０）から開始し、相互接続されたノードのエッジを、そのエッジを横断するための移動時間を示す重みと関連付けてもよい。本方法は、データセットの所定のサイズに対して実施され、これは、地図１０上のｍ個の震源１８の位置の数と、地震シナリオごとに生成されるｎ個のパスの数と、に基づいて決定されてもよい（Ｓ１２）。その後、アルゴリズムは、地震１６ごとの座標をランダムに生成し、震源１８の座標は、データセット生成の一部として記憶されてもよい（Ｓ１６）。地震１６ごとに、アルゴリズムは、ｎ個の開始ノード及び対応する出口ノードをランダムに選択し、これは、指定された出口１４（Ｓ１６，Ｓ１８）のリストから選択され、開始及び出口ノードは、データセット内に記憶されてもよい。

【0101】

その後、開始及び出口ノードの対ごとに、震源１８の座標に基づいて、地図１０のエッジ重みを初期化してもよい（Ｓ２０）。次に、ダイクストラのアルゴリズムが、最適な次のノードを決定するために、現在のノードから指定された出口ノードまで実行され、次のノードは、選択された開始ノードと出口ノードの対間の現在生成されたパスの一部としてデータセットに保存される（Ｓ２２）。その後、現在のノードは、前のステップの予測された最適な次のノードに従って更新され（Ｓ２４）、地図１０の条件は、避難／地震シナリオの動的展開に従って更新され、現在のノードが地震シナリオのためにｎ個のパスのうちの１つを生成した出口ノードに等しくなるまで、ステップＳ２２及びＳ２４は、繰り返される。

【0102】

例示的な実施例として、地震シナリオは、震源１８の周囲の地震１６の影響に基づいて、及び出口１４の周囲の交通量の増加に基づく動的影響に基づいて、モデル化されてもよい。

【0103】

地震の静的な影響を、シミュレーションの開始時にエッジ重みを増加させることによってモデル化することができる。その後、地震は、継続的な動的効果を有し、近くのエッジ重みを増加させる一方で、効果の領域も時間とともに増加させることができる。出口ノード付近の移動の流れは、車がノードからノードに移動する間に、エッジ重みを動的に増加させてもよい。

【0104】

これらの３つの機構をシミュレートするために、３つの能動的独立モデルが同時に使用される。最初の２つのモデルは、ノード間の移動時間に対する地震の効果をシミュレートする。震源は、時間とともに増加する効果の円形領域を有すると考えられる。その半径は、損傷半径として表され、これは、ｒ_ｅｐｉ＝０．５＋√（０．０００２ｔ）として時間とともに成長し、ｔは、現在のノードに到達するために移動したノードの数である。第１のモデルは、初期効果をシミュレートし、エッジ重みを１回、すなわち、ｔ＝０の時点で増加させる。第２のモデルは、地震の進行中の効果をカバーし、経時的に効果の領域のエッジ重みを増加させる。

【0105】

これらのモデルの両方について、エッジ重みの増加は、与えられたエッジと、ｄ_ｅｐｉとして表す震源座標との間のそれぞれのユークリッド距離に依存することがある。この距離が小さいほど、増加は大きくなる。

【0106】

本発明者らの実験では、第１のモデルについてエッジ重みｗごとの更新関数を以下のように定義した。

【0107】

【数2】

【0108】

第２のモデルは、エッジ重みを以下のように更新した。

【0109】

【数3】

【0110】

交通の流れをシミュレートするために、第３のモデルを選択して、開始ノードから出口ノードまで移動する間に、出口ノード付近のエッジ重みを動的に増加させた。地震シミュレーションに関して、出口点は、半径ｒ_ｅｘｉｔによる効果の円形領域を有する。この半径は、時間とともに増加する。効果の領域内では、すべてのエッジ重みが増加する。各エッジの増加は、ｄ_ｅｘｉｔとして示す出口ノード座標までのそのユークリッド距離に依存する。この距離が小さいほど、増加は大きくなる。エッジ重みｗごとの対応する更新関数は、以下のように定義される。

【0111】

【数4】

【0112】

ここで、

【数5】

であり、ｔは、現在のノードに到達するための移動ノードの数である。

【0113】

したがって、データセットの任意のデータポイントを生成するたびに、ノードの重みを更新し、スーパーバイザアルゴリズムは、次のノードからの更新された重みを有する地図１０に基づいて、新規の最適パスを決定してもよい。量子計算システム２０及び／又はハイブリッド量子－古典計算システム４２を訓練するためのデータセットを生成するために、複数の地震シナリオをこのように処理してもよい。各地震シナリオは、固定震源１８の位置に関連付けられ、複数のナビゲーションパスが、例えば、開始位置１２と出口１４との異なる対に基づいて、同じ震源１８の位置に対して生成されてもよい。

【0114】

図６は、ハイブリッド量子－古典計算システム４２を訓練するための方法の一実施例を示している。訓練アルゴリズムでは、震源１８の座標は、ハイブリッド量子－古典計算システム４２の第２の部分、すなわち、機械学習モデル４４の第２の変分量子回路２８及び第２のサブモデル４８、による処理のために、第２の入力特徴ベクトル３２に符号化される。更に、現在の状態情報は、ハイブリッド量子－古典計算システム４２の第１の部分、すなわち、第１の変分量子回路２６及び機械学習モデル４４の第１のサブモデル４６、によって処理する第１の入力特徴ベクトル３０に符号化される。

【0115】

その後、アルゴリズムは、量子回路２６、２８、３４、４０を設定して、第１及び第２の入力特徴ベクトル３０、３２を処理し、測定部分３６から、対応する出力特徴ベクトル３８を取得してもよい。加えて、アルゴリズムは、対応する出力特徴ベクトルを取得するために古典的な機械学習モデル４４を順伝播し、量子計算システム２０及び機械学習モデル４４の出力特徴ベクトルは、組合せ層を使用して組み合わされてもよい。組合せ層は、量子計算システム２０及び機械学習モデル４４のそれぞれの出力に重みを帰属させる組合せパラメータに基づいて、それぞれの出力特徴ベクトルの線形組合せであってもよく、又は、例えば、基礎となる人工ニューロンネットワークの重み及びバイアスなどの訓練可能なパラメータに基づいて、ハイブリッド量子－古典計算システム４２の出力を生成し得る機械学習モデルであってもよい。ハイブリッド量子－古典計算システム４２の出力５６に基づいて、ラベルの予測を取得し、これは、複数の隣接ノードのうちの次のノードの予測を示してもよい。

【0116】

データセット内の予測されたラベル及び最適なラベルを比較し、損失関数及びその勾配を、予測と記憶された最適なラベルとの間の差に基づいて計算してもよい。

【0117】

前述の段階を、データセット内のすべてのデータ点に対して繰り返し、平均勾配を、すべてのデータ点にわたって計算してもよい。計算した勾配に基づいて、量子計算システム２０（すなわち、変分パラメータ）、機械学習モデル４４、及び組合せ層のすべての訓練可能なパラメータは、例えば、最適化アルゴリズム、例えば、適応モーメント推定など、勾配降下又は運動量ベースの勾配降下に基づいて、更新されてもよい。

【0118】

訓練アルゴリズムは、所定の反復回数が達成されるまで、又は予測されたラベルの品質が所定の品質閾値を満たすか又は超える（あるいは、以下である）まで繰り返されてもよい。

【0119】

ハイブリッド量子－古典計算システム４２は、ハイブリッド量子クラウド上に実現された量子計算システム２０に基づいて実現され、システム４２は、５４９個のエッジによって相互接続され、日本の古平町を表す３５７個のノードのグラフをナビゲートするように訓練された。地図１０の最小及び最大接続性は、２及び５である。１より大きい最小接続性を有することにより、グラフが完全に接続されることが保証される。グラフの各エッジは、道路を通る移動時間に比例する重みを有する。

【0120】

このアーキテクチャの出力５６は、ノード分類器のロジットレイヤとして作用する５つの数であり、５つの出力数の数は、実施例では５つの地図１０の最大接続性に基づいて選択された。最大数に対応する隣接ノードを次のノードとして選択した。震源１８の座標は、第２の入力特徴ベクトル２８として符号化され、ｘ座標及びｙ座標は、第２の量子ビットレジスタ２４の第１及び第２の量子ビットにそれぞれ符号化され、対応する符号化ゲートは、２つ「震源量子ビット」の各々に５回印加され、符号化ゲートは、変分量子ゲート２８ａの層と交互にされる。

【0121】

並行して、第１の量子ビットレジスタ２２内の５つの第１の計算量子ビットが第１の変分量子回路２６の動作に基づいて処理され、符号化ゲート２６ｂの層、及び変分量子ゲート２６ａの層が、第１の計算量子ビットに交互に適用され、符号化ゲート２６ｂの層は、現在の状態情報に基づいて第１の入力特徴ベクトルを符号化し、符号化ゲート２６ｂの異なる層は、第１の入力特徴ベクトル３０の異なるサブベクトルを符号化する。

【0122】

本実装形態の実施例では、２つの量子ビット、及びすべての第１の計算量子ビットに適用されるＮＯＴを使用して制御されるＣＮＯＴゲート３４を使用して、２つの「震源量子ビット」を、量子計算システム２０の現在の状態ベースの部分ともつれさせる。最後に、別の変分基本エンタングラ層４０が、第１の量子ビットレジスタ２２の第１の計算量子ビットに適用され、第１の計算量子ビットは、パウリＺ基底で測定される。測定部分３６の出力は、人工ニューロンの完全接続層を通して古典的な機械学習モデル４４の出力と連結される。

【0123】

更に、古典的な機械学習モデル４４は、それ自体同じデータセットに基づいて次のノードを予測するように訓練され、ハイブリッド量子－古典計算システム４２の比較として使用された。

【0124】

古典的な機械学習モデル４４は、それ自体で、最適な次のノードを予測する平均精度８７％、及び出口ノードへの到着率９５％に達し、訓練データセットを生成するために使用されるダイクストラのアルゴリズムを模倣する能力を示している。精度は、例えば、ａｃｃｕｒａｃｙ＝｜Σ_{ｗｅｉｇｈｔ}ｐａｔｈ_Ｄｉｊ－Σ_{ｗｅｉｇｈｔ}ｐａｔｈ_{ｍｏｄｅｌ}｜Σ_{ｗｅｉｇｈｔ}ｐａｔｈ_Ｄｉｊに従って、ノード単位のダイクストラアルゴリズム（ｐａｔｈ_Ｄｉｊ）による解に関する累積エッジ重み差に基づいて決定されてもよい。

【0125】

更に、古典的なモデル自体は、避難シナリオの更新された条件に基づいて各段階後の次のノードへの最適なパスを再計算するノード単位のダイクストラアルゴリズムと比較した場合、実行時間に関して２倍速いことが見出された。この実行時間の利点は、ダイクストラのアルゴリズムと比較して、モデルが次のノードを予測するためにかかる時間を指す。それぞれの分散を伴うダイクストラの平均実行時間は、μ_Ｄｉｊ＝１．３×１０^－３ｓ、σ_Ｄｉｊ＝４．２×１０^－４ｓである一方で、古典的なモデルは、μ_ＮＮ＝４．９×１０^－４ｓ及びσ_ＮＮ＝５．７×１０^－５ｓを達成する。

【0126】

ハイブリッド量子計算システム４２は、それ自体で古典的な機械学習モデル４４を大幅に改善し、９４％の平均精度を達成することが見出された。これは、平均して、ハイブリッド量子計算システム４２が、ノード単位のダイクストラの予測パスに近い、パス７％を予測することを意味する。更に、ハイブリッド量子計算システム４２は、それ自体で古典的な機械学習モデル４４よりも多くの成功したパスを予測することが見出され、更に、軌道全体を考慮すると、ダイクストラのアルゴリズムよりも速い又は等しい多くのパスを発見することが見出された。

【0127】

したがって、ハイブリッド量子－古典計算システム４２は、量子回路技術の予測可能な発展を考慮して、複雑な多段階決定問題に対して古典的な手法よりも改善し得る。更に、ハイブリッド量子－古典計算システム４２は、強化学習アルゴリズムに基づいて訓練され、これにより、ハイブリッド量子－古典計算システム４２は、上記の実施例で使用されるスーパーバイザアルゴリズムよりも優れているように更に訓練されてもよい。

【0128】

好ましい実施形態及び図面の説明は、本発明及びそれに関連する有益な効果を説明するために役立つものにすぎず、限定を暗示するものと理解されるべきではない。本発明の範囲は、添付の特許請求の範囲によってのみ決定されるべきである。

【符号の説明】

【0129】

１０地図
１２開始位置
１４出口
１６地震
１８震源
２０量子計算システム
２２第１の量子ビットレジスタ
２４第２の量子ビットレジスタ
２６第１の変分量子回路
２８第２の変分量子回路
３０第１の入力特徴ベクトル
３２第２の入力特徴ベクトル
３４コヒーレント相互作用回路
３６測定部分
３８量子計算システムの出力特徴ベクトル
４０第３の量子計算回路
４２ハイブリッド量子－古典計算システム
４４機械学習モデル
４６第１のサブモデル
４８第２のサブモデル
５０人工ニューロンの中間層
５２第３のサブモデル
５４第２の機械学習モデル
５６ハイブリッド量子－古典計算システムの出力

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【手続補正書】

【提出日】2024-09-18

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

【請求項4】

前記多段階決定問題が、ナビゲーション問題であり、前記最適な動作が、エッジによって相互接続された交差点を特徴とする地図上の最適な進行方向を示し、
前記シナリオ情報が、交通摂動に関する、好ましくは前記交通摂動の空間的起源に関する情報を、特に符号化し、前記多段階決定問題が、前記交通摂動を考慮した避難ルーティングに関する、
請求項２に記載の量子計算システム（２０）。

【請求項5】

【請求項6】

【請求項7】

【請求項8】

【請求項9】

前記組合せモジュール（５４）が、前記第１の機械学習モデルの前記出力特徴ベクトル（３８）と前記量子計算システム（２０）の前記測定部分（３６）とを組み合わせるための第２の機械学習モジュール（５４）を備える、
請求項８に記載のハイブリッド量子計算システム（４２）。

【請求項10】

【請求項11】

【請求項12】

請求項１から７のいずれか一項に記載の量子計算システム（２０）又は請求項８から１１のいずれか一項に記載のハイブリッド量子計算システム（４２）を備える、
ナビゲーションシステム。

【請求項13】

現在の状態に基づいて多段階決定問題における最適な動作を予測するための請求項１から７のいずれか一項に記載の量子計算システム（２０）又は請求項８から１１のいずれか一項に記載のハイブリッド量子計算システム（４２）を訓練するための方法であって、前記多段階決定問題の条件が、時間とともに発展し、前記方法が、
前記多段階決定問題のシナリオ情報及び現在の状態情報を決定するステップと、
スーパーバイザアルゴリズムに基づいて最適な段階を予測するステップと、
前記量子計算システム（２０）又は前記ハイブリッド量子計算システム（４２）によって前記最適な段階の予測を取得するステップと、
前記多段階決定問題の前記現在の状態及び前記条件を更新するステップと
によって、前記多段階決定問題の候補解を反復的に決定するステップと、
前記量子計算システム（２０）又は前記ハイブリッド量子計算システム（４２）によって予測された前記最適な段階の前記予測が前記スーパーバイザアルゴリズムによって予測された前記最適な段階に近付くように、最適化アルゴリズムに基づいて前記量子計算システム（２０）の前記変分パラメータを更新するステップと、を含む、
方法。

【請求項14】

【請求項15】

機械可読命令を備えるコンピュータプログラムであって、前記コンピュータプログラムが処理ユニットによって実行されると、前記処理ユニットに請求項１から７のいずれか一項に記載の量子計算システム（２０）又は請求項８から１１のいずれか一項に記載のハイブリッド量子計算システム（４２）を実施させる、
コンピュータプログラム。

【請求項16】

【請求項17】

【外国語明細書】