IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ビーエーエスエフ ソシエタス・ヨーロピアの特許一覧

特表2023-532979タンパク質設計及び最適化の媒体、方法、及びシステム
<>
  • 特表-タンパク質設計及び最適化の媒体、方法、及びシステム 図1
  • 特表-タンパク質設計及び最適化の媒体、方法、及びシステム 図2
  • 特表-タンパク質設計及び最適化の媒体、方法、及びシステム 図3
  • 特表-タンパク質設計及び最適化の媒体、方法、及びシステム 図4
  • 特表-タンパク質設計及び最適化の媒体、方法、及びシステム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-08-01
(54)【発明の名称】タンパク質設計及び最適化の媒体、方法、及びシステム
(51)【国際特許分類】
   G16B 15/20 20190101AFI20230725BHJP
【FI】
G16B15/20
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023500264
(86)(22)【出願日】2021-07-06
(85)【翻訳文提出日】2023-02-27
(86)【国際出願番号】 IB2021056049
(87)【国際公開番号】W WO2022009092
(87)【国際公開日】2022-01-13
(31)【優先権主張番号】63/048,414
(32)【優先日】2020-07-06
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】508020155
【氏名又は名称】ビーエーエスエフ ソシエタス・ヨーロピア
【氏名又は名称原語表記】BASF SE
【住所又は居所原語表記】Carl-Bosch-Strasse 38, 67056 Ludwigshafen am Rhein, Germany
(74)【代理人】
【識別番号】110002572
【氏名又は名称】弁理士法人平木国際特許事務所
(72)【発明者】
【氏名】リー,トン
(72)【発明者】
【氏名】スタンデン,ブライアン
(72)【発明者】
【氏名】カグリック,デヤン
(57)【要約】
例示的な実施形態は、指定された機能についてタンパク質を最適化又は改善するように構成されたタンパク質工学パイプラインに関する。そのようなタスクの問題空間は、最適化されているタンパク質の配列及びタンパク質が設計されている機能に基づいて急速に成長し得る。本明細書に記載の解決策は、量子コンピュータで実行されるタンパク質設計パイプラインと評価手順の組合せを適用することにより、問題空間を効率的に探索できるようにする。その結果、最適化されたタンパク質バリアントを生成するために、関心のある部位における1つ又は複数のアミノ酸置換を予測し得る。
【選択図】図1
【特許請求の範囲】
【請求項1】
コンピュータ実施方法であって、
プロセッサに、最適化するタンパク質配列を提供することと、
前記プロセッサに、前記タンパク質配列を有するタンパク質構造を提供することと、
前記プロセッサに、最適化するタンパク質特性を提供することと、
前記最適化するタンパク質特性に基づいてスコア付関数を定義することと、
前記プロセッサに、
修飾を受ける前記タンパク質配列中の位置若しくは前記位置で生じるアミノ酸の代替となるアミノ酸、前記位置に挿入されるアミノ酸、若しくは前記位置から削除されるアミノ酸又は
前記タンパク質配列中の1つ又は複数の位置に適用される標的回転異性体を探索するための回転異性体ライブラリ
の少なくとも1つを提供することと、
前記プロセッサにより、前記位置、アミノ酸置換、アミノ酸挿入、アミノ酸削除、又は前記回転異性体ライブラリからの回転異性体の少なくとも1つに基づいて探索空間を決定することと、
前記スコア付関数に基づいて量子計算アルゴリズムを使用して前記探索空間を探索することであって、前記探索は、前記タンパク質配列への点変異又は前記タンパク質配列への変異の組合せの少なくとも一方を識別することを含む、探索することと、
前記量子計算アルゴリズムの出力状態を提供することであって、前記出力状態は、最適化されたタンパク質の最適化されたタンパク質配列を示し、前記最適化されたタンパク質配列は、前記最適化するタンパク質特性に基づいて前記スコア付け関数に従って最適化される、提供することと、
を含む、方法。
【請求項2】
前記プロセッサに、関心のある予め定義された結合相手を提供することであって、前記最適化するタンパク質配列を有する前記タンパク質を提供することは、関心のある前記結合相手の構造又はアミノ酸配列に基づいてコンピュータベースのモデルを適用することを含む、提供すること又は
前記探索中、前記選択されたタンパク質に向けて結合相手を最適化すること
を更に含む請求項1に記載の方法。
【請求項3】
前記最適化するタンパク質特性について、前記最適化されたタンパク質を試験することと、
前記試験から実験データを生成することと、
人工知能方法を前記実験データに適用することであって、それにより、前記最適化されたタンパク質配列の構成と前記最適化するタンパク質特性との間の関連を学習し、前記構成は、二次元又は三次元タンパク質構造、アミノ酸配列、前記タンパク質をコードするDNA配列、又は二次元若しくは三次元タンパク質構造の一部分、特に触媒ドメイン若しくはタンパク質の1つ若しくは複数のドメインを含む、適用することと、
を更に含む請求項1又は2に記載の方法。
【請求項4】
前記人工知能方法は、機械学習方法を含む、請求項3に記載の方法。
【請求項5】
前記学習された関連に基づいて、前記探索空間に考慮するタンパク質配列、位置、アミノ酸置換、アミノ酸削除、アミノ酸挿入、又は回転異性体ライブラリを提供することを更に含む請求項3に記載の方法。
【請求項6】
利用可能な量子計算ハードウェアに基づいて、位置、アミノ酸置換、アミノ酸削除、アミノ酸挿入、又は回転異性体ライブラリを前記探索空間から排除することを更に含む請求項1~5の何れか一項に記載の方法。
【請求項7】
前記量子計算アルゴリズムは、前記スコア付け関数から決定される目標ハミルトニアンに基づいて、前記最適化されたタンパク質について前記探索空間を探索するように構成された量子アニーリングアルゴリズムである、請求項1~6の何れか一項に記載の方法。
【請求項8】
前記量子計算アルゴリズムは、量子インスパイアードアルゴリズム、デジタルアニーリングアルゴリズム、ゲートベース量子アルゴリズム、量子シミュレーションアルゴリズム、又は量子インスパイアード最適化の1つである、請求項1~7の何れか一項に記載の方法。
【請求項9】
前記量子計算アルゴリズムは、量子近似最適化アルゴリズム、グローバー適応探索、断熱量子計算、量子最小二乗フィッティング、量子半定値プログラミング、量子組合せ最適化、量子インスパイアード確率的回帰、量子インスパイアード進化アルゴリズム、量子モンテカルロ量子アニーリング、シミュレーテッド量子アニーリング、量子シミュレーテッドアニーリング、又は変分量子固有値ソルバを用いた量子シミュレーションの1つを含む、請求項1~8の何れか一項に記載の方法。
【請求項10】
人工知能又は機械学習アルゴリズムを介して、前記最適化するタンパク質特性に基づいて、前記最適化するタンパク質配列を決定することを更に含む請求項1~9の何れか一項に記載の方法。
【請求項11】
前記最適化されたタンパク質を実験的に試験することであって、それにより、実験データを生成し、前記実験データは前記最適化されたタンパク質の1つ又は複数の特性を測定し、前記1つ又は複数の特性は、
熱安定性、pH安定性、溶媒安定性、他の賦形剤への安定性、及び/又は用途での安定性に関する前記タンパク質の安定性;
発現性;
可溶性;
効能;
電荷分布;
タンパク質フォールディング;
活性;
結合、基、基質、立体特異性、及び/又はコファクタに関する特異性;
可逆性;
酵素動力学;
基質阻害;
生産物阻害;
プロテアーゼ分解への耐性;
新機能獲得;
結合剤への前記タンパク質の親和性;又は
類似の結合相手への前記タンパク質結合の特異性
の少なくとも1つを含む、実験的に試験することと、
前記実験データを前記人工知能又は前記機械学習アルゴリズムに提供することであって、それにより、前記最適化されたタンパク質の配列又は構造と、前記実験データにより測定された前記1つ又は複数の特性との間の関係を認識するように、前記人工知能又は前記機械学習アルゴリズムをトレーニングする、提供することと、
を更に含む請求項10に記載の方法。
【請求項12】
前記タンパク質を提供することは、前記最適化するタンパク質特性に基づいて開始タンパク質を、前記開始タンパク質のコンピュータベースのモデリングを介して識別することを含む、請求項1~11の何れか一項に記載の方法。
【請求項13】
前記最適化するタンパク質配列は、アミノ酸又はDNA配列を含む、請求項1~12の何れか一項に記載の方法。
【請求項14】
前記プロセッサに、前記タンパク質配列中の複数の位置に適用される複数の標的回転異性体を提供することを更に含む請求項1~13の何れか一項に記載の方法。
【請求項15】
前記プロセッサに、修飾を受ける前記タンパク質配列中の複数の位置又は前記位置で生じている前記アミノ酸を置換する複数のアミノ酸、前記位置に挿入される複数のアミノ酸、若しくは前記位置から削除される複数のアミノ酸を提供することを更に含む請求項1~14の何れか一項に記載の方法。
【請求項16】
前記量子計算アルゴリズムの前記出力状態は、複数の最適化されたタンパク質を示し、前記方法は、
前記プロセッサにより、前記複数の最適化されたタンパク質の最適化された各タンパク質をランク付けることと、
前記プロセッサにより、前記ランク付けられた複数の最適化されたタンパク質のサブセットを決定することと、
前記ランク付けられた複数の最適化されたタンパク質の前記サブセットのタンパク質の最適化を更に実行することと、
を更に含む請求項1~15の何れか一項に記載の方法。
【請求項17】
前記タンパク質の最適化を更に実行することは、量子計算パラダイムに従って最適化を実行することを含む、請求項16に記載の方法。
【請求項18】
前記タンパク質の最適化を更に実行することは、古典的な計算システムにより最適化を実行することを含む、請求項16に記載の方法。
【請求項19】
請求項1~18の何れか一項に記載の方法を実行するように構成された命令を記憶する非一時的コンピュータ可読媒体。
【請求項20】
請求項1~19の何れか一項に記載の方法に従って決定されたタンパク質配列を有するタンパク質。
【請求項21】
請求項1~18の何れか一項に従って最適化されたタンパク質をコードするDNA又はアミノ酸配列。
【請求項22】
非一時的コンピュータ可読媒体と、プロセッサとを備えた古典的な計算システムであって、前記プロセッサは
最適化するタンパク質配列を有するタンパク質を決定すること、
最適化するタンパク質特性を受信すること、
前記最適化するタンパク質特性に基づいてスコア付け関数を定義すること、
決定することであって、
修飾を受ける前記タンパク質配列中の位置、
前記位置で生じているアミノ酸を置換する置換アミノ酸、
前記位置におけるアミノ酸削除、
前記位置におけるアミノ酸挿入、又は
前記タンパク質配列に適用される標的回転異性体を探索するための回転異性体ライブラリ
の少なくとも1つを決定すること、及び
前記位置、アミノ酸置換、アミノ酸挿入、アミノ酸削除、又は前記タンパク質配列に適用される前記回転異性体ライブラリからの前記標的回転異性体の少なくとも1つに基づいて探索空間を決定すること
を行うように構成される、古典的な計算システムと、
複数の量子ビット、量子ビット制御デバイス、及び前記スコア付け関数に基づいて量子計算アルゴリズムを使用して前記探索空間を探索し、前記量子計算アルゴリズムの出力を提供するように構成された測定ユニットを備えた量子計算システムであって、前記出力は最適化されたタンパク質を示し、前記最適化されたタンパク質は、前記最適化するタンパク質特性に基づいて前記スコア付け関数に従って最適化される、量子計算システムと、
を備えたシステム。
【請求項23】
前記プロセッサは、請求項2~18の何れか一項に記載の方法を実行するように更に構成される、請求項22に記載のシステム。
【請求項24】
コンピュータ実施方法であって、
最適化するタンパク質配列を有するタンパク質を決定することと、
最適化するタンパク質特性を受信することと、
前記最適化するタンパク質特性に基づいてスコア付け関数を定義することと、
決定することであって、
修飾を受ける前記タンパク質配列中の位置、
前記位置で自然に生じているアミノ酸を置換する置換アミノ酸、
前記位置におけるアミノ酸削除、
前記位置におけるアミノ酸挿入、又は
タンパク質構造に適用される標的回転異性体を探索するための回転異性体ライブラリ
の少なくとも1つを決定することと、
前記位置、アミノ酸置換、アミノ酸挿入、アミノ酸削除、又は前記回転異性体ライブラリの少なくとも1つに基づいて探索空間を決定することと、
量子コンピュータで実行する量子入力信号を生成することであって、前記量子入力信号は、前記決定された探索空間及び前記スコア付け関数に基づく、生成することと、
前記量子コンピュータから量子出力信号を受信することであって、前記量子出力信号は、最適化されたタンパク質、前記最適化されたタンパク質のドメイン、又は前記最適化するタンパク質配列と前記最適化されたタンパク質との間で修飾されたアミノ酸を示し、前記最適化されたタンパク質は、前記最適化するタンパク質特性に基づいて前記スコア付け関数に従って最適化される、受信することと、
前記最適化されたタンパク質、前記最適化されたタンパク質のドメイン又は前記最適化するタンパク質配列と前記最適化されたタンパク質との間で修飾されたアミノ酸をユーザに提供することと、
を含む、方法。
【請求項25】
前記量子入力信号は、古典的なコンピュータで生成され、前記量子コンピュータは、前記量子入力信号に基づいて量子計算を実行して、前記タンパク質配列への点変異又は変異の組合せの少なくとも一方を識別し、前記方法は、
前記タンパク質配列への前記点変異又は変異の組合せの前記識別された少なくとも一方を前記古典的なコンピュータに提供することと、
前記点変異又は前記変異の組合せの前記識別された少なくとも一方に基づいて、前記最適化されたタンパク質を生成することと、
を更に含む、請求項24に記載の方法。
【請求項26】
関心のある予め定義された結合相手を受信することであって、前記最適化するタンパク質配列を有するタンパク質を決定することは、関心のある前記結合相手の構造又はアミノ酸配列に基づいて、コンピュータベースのモデルを適用することを含む、受信すること又は、
前記探索中、前記決定されたタンパク質に向けて結合相手を最適化すること、
を更に含む請求項24又は25に記載の方法。
【請求項27】
関心のある予め定義された結合相手を受信することであって、前記最適化するタンパク質配列を有するタンパク質を決定することは、前記最適化するタンパク質配列を経験的に決定することを含む、受信することを更に含む請求項24又は25に記載の方法。
【請求項28】
実験データを受信することであって、前記実験データは、前記最適化するタンパク質特性の測定値又はタンパク質構造を示す、受信することと、
前記実験データを用いてデータ駆動モデルをトレーニングすることであって、前記データ駆動モデルは、前記量子コンピュータ又は前記古典的コンピュータによって決定された、前記最適化されたタンパク質の構成と前記最適化するタンパク質特性との間の関連をモデリングし、前記構成は、二次元若しくは三次元タンパク質構造、アミノ酸配列、前記タンパク質をコードするDNA配列、又は二次元若しくは三次元タンパク質構造の一部分、特に触媒ドメイン若しくはタンパク質の1つ若しくは複数のドメインを含む、トレーニングすることと、
前記トレーニングされたデータ駆動モードを前記量子コンピュータに提供することと、
前記トレーニングされたデータ駆動モデルを使用して標的タンパク質配列を決定することと、
を更に含む請求項24~27の何れか一項に記載の方法。
【請求項29】
前記学習された関連に基づいて、タンパク質配列、タンパク質構造、位置、アミノ酸の分布、欠損、若しくは挿入、又は前記探索空間への回転異性体ライブラリからの回転異性体を提供することを更に含む請求項28に記載の方法。
【請求項30】
利用可能な量子計算ハードウェアに基づいて、位置、1つ若しくは複数のアミノ酸の置換、削除、若しくは挿入、又は回転異性体ライブラリからの回転異性体を前記探索空間から排除することを更に含む請求項24~29の何れか一項に記載の方法。
【請求項31】
前記量子コンピュータにより、前記スコア付け関数に基づいて量子計算アルゴリズムを使用して前記探索空間を探索することを更に含む請求項24~30の何れか一項に記載の方法。
【請求項32】
前記量子計算アルゴリズムは、前記スコア付け関数から定義される目標ハミルトニアンに基づいて、前記最適化されたタンパク質について前記探索空間を探索するように構成された量子アニーリングアルゴリズムである、請求項31に記載の方法。
【請求項33】
前記量子計算アルゴリズムは、量子インスパイアードアルゴリズム、デジタルアニーリングアルゴリズム、ゲートベース量子アルゴリズム、量子シミュレーションアルゴリズム、又は量子インスパイアード最適化である、請求項31に記載の方法。
【請求項34】
前記量子計算アルゴリズムは、量子近似最適化アルゴリズム、グローバー適応探索、断熱量子計算、量子最小二乗フィッティング、量子半定値プログラミング、量子組合せ最適化、量子インスパイアード確率的回帰、量子インスパイアード進化アルゴリズム、量子モンテカルロ量子アニーリング、シミュレーテッド量子アニーリング、量子シミュレーテッドアニーリング、又は変分量子固有値ソルバを用いた量子シミュレーションの1つを含む、請求項31に記載の方法。
【請求項35】
前記タンパク質を決定することは、人工知能又は機械学習アルゴリズムを介して、前記最適化するタンパク質特性に基づいてタンパク質を識別することを含む、請求項24~34の何れか一項に記載の方法。
【請求項36】
試験装置により生成された実験データを受信することであって、前記実験データは、
熱安定性、pH安定性、溶媒安定性、他の賦形剤への安定性、及び/又は用途での安定性に関する前記タンパク質の安定性;
発現性;
可溶性;
電荷分布;
タンパク質フォールディング;
活性;
効能;
結合、基、基質、立体特異性、及び/又はコファクタに関する特異性;
可逆性;
酵素動力学;
基質阻害;
生産物阻害;
プロテアーゼ分解への耐性;
新機能獲得;
結合剤への前記タンパク質の親和性;又は
類似の結合相手への前記タンパク質結合の特異性
の1つ又は複数を測定する、受信することと、
前記実験データを前記人工知能又は前記機械学習アルゴリズムに提供することであって、それにより、前記最適化されたタンパク質の構造又はアミノ酸配列と、前記実験データにより測定された前記特性との間の関係を認識するように、前記人工知能又は前記機械学習アルゴリズムをトレーニングする、提供することと、
前記標的タンパク質構造、修飾を受ける、前記標的タンパク質構造上の位置、前記位置で生じている前記アミノ酸を置換するアミノ酸、前記位置に挿入されるアミノ酸、若しくは前記位置から削除されるアミノ酸、又は前記標的タンパク質構造に適用される標的回転異性体を探索する前記回転異性体ライブラリの1つ又は複数を決定するとき、前記人工知能又は機械学習アルゴリズムを適用することと、
を更に含む請求項35に記載の方法。
【請求項37】
前記タンパク質を決定することは、適したタンパク質のコンピュータベースのモデリングを介して、前記最適化するタンパク質特性に基づいて前記適するタンパク質を識別することを含む、請求項24~36の何れか一項に記載の方法。
【請求項38】
前記最適化するタンパク質配列は、アミノ酸配列を含む、請求項24~37の何れか一項に記載の方法。
【請求項39】
前記探索空間を決定することは、前記タンパク質配列中の複数の位置に適用される複数の標的回転異性体を決定することを含む、請求項24~38の何れか一項に記載の方法。
【請求項40】
前記探索空間を決定することは、修飾を受ける前記タンパク質配列中の複数の位置又は前記位置で生じている前記アミノ酸を置換する複数のアミノ酸、前記位置に挿入される複数のアミノ酸、若しくは前記位置から削除される複数のアミノ酸を決定することを含む、請求項24~39の何れか一項に記載の方法。
【請求項41】
請求項24~40の何れか一項に記載の方法を実行するように構成された命令を記憶する非一時的コンピュータ可読媒体。
【請求項42】
請求項24~40の何れか一項に記載の方法に従って決定された、最適化されたタンパク質に従ったタンパク質配列を有するタンパク質。
【請求項43】
請求項24~40の何れか一項に従って最適化されたタンパク質をコードするDNA又はアミノ酸配列。
【請求項44】
古典的な計算システムであって、
非一時的コンピュータ可読媒体及び
プロセッサ回路
を備え、前記プロセッサ回路は、
最適化するタンパク質配列を有するタンパク質を決定することと、
最適化するタンパク質特性を受信することと、
前記最適化するタンパク質特性に基づいてスコア付け関数を定義することと、
決定することであって、
修飾を受ける前記タンパク質配列上の位置、又は
前記位置で自然に生じているアミノ酸を置換するアミノ酸、前記位置におけるアミノ酸削除、若しくは前記位置におけるアミノ酸挿入、又は
前記タンパク質配列に適用される標的回転異性体を探索するための回転異性体ライブラリ
の少なくとも1つを決定することと、
前記位置、アミノ酸置換、アミノ酸挿入、アミノ酸削除、又は前記回転異性体ライブラリの少なくとも1つに基づいて探索空間を決定することと、
を行うように構成される、古典的な計算システムと、
量子コンピュータで実行するために、前記決定された探索空間及びスコア付け関数に基づく量子制御信号を送信し、前記量子コンピュータから量子出力信号を受信するように構成されたインターフェースであって、前記量子出力信号は、最適化されたタンパク質、前記最適化されたタンパク質の部分、又は前記最適化するタンパク質と前記最適化されたタンパク質との間の修飾されたアミノ酸を示し、前記プロセッサは、前記最適化されたタンパク質を返すように更に構成される、インターフェースと、
を備える、システム。
【請求項45】
前記プロセッサは、請求項24~40の何れか一項に記載の方法を実行するように更に構成される、請求項44に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2020年7月6日付けで出願された「Media Methods and Systems for Protein Design and Optimization」という名称の米国仮特許出願第63/048,414号明細書の優先権を主張するものであり、この開示は全体的に、参照により本明細書に援用される。
【0002】
本開示は、タンパク質特性に従ってタンパク質を最適化する方法及びシステムに関し、特にタンパク質最適化に量子計算を利用することに関する。
【背景技術】
【0003】
特定の特性(例えば熱安定性、溶媒安定性、発現性、可溶性、特定の基質での活性)を有するか、又は特定のタンパク質機能を実行するようなタンパク質若しくはDNAを設計するプロセスは、重要であるが、かなり複雑な計算問題である。タンパク質設計は、改良すべき既存の初期タンパク質から開始し得る(しかし、場合によっては、完全に新しい、即ち最初から設計されたタンパク質構造が開始点として使用される)。次いで初期タンパク質は、初期タンパク質と比較して、改善若しくは新しい特性を示す修飾されたタンパク質又は指定された機能を実行する新しい若しくはより良好な能力を有するという目的で修飾される。
【0004】
タンパク質は、各々が独自の側鎖を有する20個の自然発生するアミノ酸の組合せで構成される。異なる側鎖は、タンパク質の特性又は指定された機能を実行する能力に対して異なる影響を有し得る。調整することができるタンパク質のアミノ酸配列内には多くの異なる位置が存在し得、典型的なタンパク質設計タスクは、数十、更には数百もの位置への変更を評価することを含み得る。
【0005】
問題を更に複雑にすることに、側鎖は様々な可能な離散立体構造(「回転異性体」と呼ばれる)に配列し得る。各位置で可能な数十~数千もの異なる回転異性体が存在し得る。
【0006】
したがって、調整された配列の様々な可能な組合せ及びそれらの可能な立体構造の悉皆的探索は、従来の計算システムの能力をすぐに超える。参照のために、好ましくは、可能な全ての回転異性体を有する初期アミノ酸配列に沿った可能な数十~数百もの位置の全てを試験したい。従来のコンピュータで利用可能なパワーを所与として、典型的な探索は、予め選択された回転異性体のライブラリを使用して概ね3~5個の位置を試験することによって実行される(しかし、回転異性体ライブラリが小さいか、又はフィルタリングされる場合、位置の数は増え得、一般に、より多くの位置の探索、より多くの置換の探索、又はより多くの回転異性体の探索の中から選ばなければならない)。幾つかの場合、非常に強力なスーパーコンピュータは、限られた数の回転異性体を有する6~7個の位置を探索することが可能であり得る。
【0007】
古典的なコンピュータは立体構造の全ての状態を一度にサンプリングすることができないため、組合せを基本的にランダムに試みるヒューリスティック法が開発された。例えば、シミュレーテッドアニーリングベースのヒューリスティックを使用して、利用可能な配列及び異性回転体空間を効率的に探索する従来のソフトウェアが開発されている。この手順は大域最適に収束する保証はないが、良好な解を比較的迅速に見つける傾向がある。不都合なことに、設計可能なタンパク質の数又は各位置での回転異性体可能性の数が増えるにつれて、配列及び回転異性体空間は、シミュレーテッドアニーリング手法には大きすぎる程、すぐに大きくなる。したがって、大きなタンパク質の設計タスクは、すぐに手に負えなくなる。
【0008】
その結果、タンパク質設計プロセスは、主観及び運に大きく頼り得る。タンパク質設計者は、所望の結果を達成するためにはどのタンパク質位置が最良に操作されるか及びそれらの位置にどの回転異性体ライブラリを適用すべきかについての自身の知識を適用しなければならず、2人の別々のタンパク質設計者は、どの位置及びどのライブラリをトライするかについて異なる意見を有し得る。更なる選択は、修飾されたタンパク質の計算にどのスコア付け関数を使用すべきか、どの組の置換を考慮すべきか、及びどの回転異性体置換を試験すべきかに関して行われ得る。これらの設計選択の上でシミュレーテッドアニーリングを適用する場合、それらの主観的に選ばれた組合せのサブセットのみがランダムに試験される。
【0009】
任意の特定の要素又は動作の考察を容易に識別するために、参照番号の左端の1つ又は複数の桁は、その要素が最初に紹介された図番を指す。
【図面の簡単な説明】
【0010】
図1】例示的な実施形態の実施に適した環境100を示す。
図2】一実施形態によるタンパク質設計パイプライン200を実施する例示的な論理を示すフローチャートである。
図3】一実施形態との併用に適した例示的な量子コンピュータを示す。
図4】一実施形態による例示的な量子アルゴリズムを示す。
図5】例示的な実施形態との併用に適した例示的な人工知能/機械学習(AI/ML)システムを示す。
【発明を実施するための形態】
【0011】
用語
本明細書で使用される場合:
「アミノ酸」とは、20個の自然発生するアミノ酸及び残基及び/又は修飾された、非天然、又は普通ではないアミノ酸及び残基の1つを指し得る。
【0012】
「人工知能」とは、人間の知能と同様に挙動するか、又は人間の知能の特性を示す計算構造を指し得る。
【0013】
最適化されたタンパク質の構成とタンパク質特性との間の「関連」とは、そのタンパク質がその特性を示す程度を表す、そのタンパク質とその特性との間の定性的又は定量的マッピングを指し得る。
【0014】
「結合相手」とは、典型的には静電力及び/又は疎水性効果を含む特異性の高い物理的接触を介して別のタンパク質分子と相互作用するタンパク質分子を指し得る。
【0015】
「古典的な計算システム」とは、計算の実行に量子干渉又は量子重ね合わせに頼らずに計算を実行する任意の計算システムを指し得る。
【0016】
「コンピュータベースモデル」とは、指定された条件下でシステムの挙動を予測するために評価又はシミュレートすることができるシステムの数学的表現を指し得る。
【0017】
「実験装置」とは、タンパク質の1つ又は複数の特性を測定するように構成されたデバイスを指し得る。
【0018】
「タンパク質をコードするDNA配列」とは、タンパク質の構造又は構成を定義するのに使用することができる遺伝情報を指し得る。
【0019】
「実験データ」とは、実験装置によって生成されたデータ、特に最適化の標的のタンパク質等のタンパク質の特性を測定するデータを指し得る。さらに、「実験」という用語は、本明細書において「経験データ」と同義で言及され得、例えばにおいて、実験データは「経験データ」と言及されることもでき、何かを経験的に決定することは、何かを実験的に決定することと見なすことができる。
【0020】
「機械学習」とは、コンピュータが経験を通してタスクを実行する能力を改善できるようにする一種のコンピュータアルゴリズムを指し得る。
【0021】
位置の「修飾」とは、所与の位置で生じているアミノ酸の変更を指し得る。修飾は、あるアミノ酸の別アミノ酸での置換、タンパク質構造へのアミノ酸の挿入、又はタンパク質構造における位置に存在するアミノ酸の削除を含み得る。修飾は点変異(即ち孤立していると見なされる上記特性の1つの変更)であってもよく、又は群と見なされる修飾の組合せであってもよい。
【0022】
「変異」とは、タンパク質配列中のアミノ酸の変更を指し得る。
【0023】
「最適化されたタンパク質」とは、最適化されたタンパク質が、最適化するタンパク質特性を高度に示すことを目的とした開始タンパク質構造の修飾から生じるタンパク質を指し得る。場合によっては、基本タンパク質構造は、タンパク質特性を第1の程度まで示し得、一方、最適化されたタンパク質は、そのタンパク質特性を、第1の程度よりも高い第2の程度まで示す。場合によっては、最適化されたタンパク質は、探索空間中の他のタンパク質よりも高い程度までタンパク質特性を示し得るが、これは必須ではなく、探索空間において改善又は極大を示すだけでも、タンパク質は最適化されたと見なすことができる。
【0024】
タンパク質構造上の「位置」とは、タンパク質構造内のアミノ酸の位置及び/又はタンパク質構造内のアミノ酸に関連する側鎖の位置を指し得る。
【0025】
「タンパク質」とは、アミノ酸残基の1つ又は複数の鎖からなる生体分子を指し得る。
【0026】
「タンパク質構成」とは、二次元若しくは三次元タンパク質構造、アミノ酸配列、タンパク質をコードするDNA配列、触媒ドメイン、又はタンパク質の1つ若しくは複数のドメインを指し得る。
【0027】
「最適化するタンパク質特性」とは、異なるタンパク質間で異なる測定可能な特性を指し得る。そのような特性は、タンパク質が所与の機能をいかに良好に実行するか、タンパク質が特定の特性を示す程度、又はタンパク質が所与の結合剤にいかに良好に結合するかを含み得る。最適化するタンパク質特性の例には、熱安定性、pH安定性、溶媒安定性、他の賦形剤への安定性、及び/又は用途での安定性に関するタンパク質の安定性;発現性;可溶性;電荷分布;タンパク質フォールディング;効能;活性;結合、基、基質、立体特異性、及び/又はコファクタに関する特異性;可逆性;酵素動力学;基質阻害;生産物阻害;プロテアーゼ分解への耐性;新機能獲得;結合剤へのタンパク質の親和性;又は類似の結合相手へのタンパク質結合の特異性があるが、これらに限定されない。
【0028】
「タンパク質構造」とは、タンパク質が自然にフォールドする独自の構造を指し得る。
【0029】
「量子アニーリング関数」とは、状態間の量子トンネリングを使用することにより、探索空間によって定義される1組の候補状態にわたり目的関数の最小を見つけるように構成されたアルゴリズムを指し得る。
【0030】
「量子計算アルゴリズム」とは、計算の実行に1つ又は複数の粒子の量子特性を利用する量子計算システムで動作可能なアルゴリズムを指し得る。量子計算アルゴリズムは、同等の古典的な計算アルゴリズムよりも高速又は効率的であってもよく、又はそうでなくてもよい。
【0031】
「量子計算ハードウェア」とは、量子コンピュータが処理する量子処理力がどれくらいか、量子コンピュータが記憶又は処理することができる情報はどれくらいか、及び/又は量子コンピュータがその処理力及び/又は記憶容量を利用することができる速度、効率、正確性、又は頻度はどれくらいかを定義する量子計算システムの特性を指し得る。量子計算ハードウェアの測定の幾つかの例には、量子コンピュータが操作することができる量子ビット数、量子ビットの構成又はアーキテクチャ、ハードウェアでのエラーレート、ハードウェアでのノイズ量、量子ビットのデコヒーレンス時間、及び量子ハードウェアの可用性又は活用性を制限し得る他の特徴がある。
【0032】
「量子計算システム」とは、量子計算を実行するために粒子の量子特性を使用する計算システムを指し得る。量子計算システムは、問題への複数の解を同時に確率的に評価するために、量子重ね合わせ及び/又はもつれ等の現象を利用し得る。
【0033】
「量子制御信号」とは、量子計算アルゴリズムを実行するに当たり量子コンピュータをガイドするために量子コンピュータに提供されるように構成された古典的な入力を指し得る。量子制御信号は、可能性の中でも特に、量子計算アルゴリズムが動作する入力データを含み得、量子計算アルゴリズムが探索する探索空間を定義し得、量子計算アルゴリズムの動作への制限を提供し得(例えば探索すべきではない値、互いと組み合わせて考慮若しくは変更されなければならない変数等)、修飾する初期タンパク質構造を提供し得、考慮すべき1つ若しくは複数の回転異性体ライブラリを指定し得、又は修飾に考慮すべきタンパク質構造における1つ若しくは複数の位置を識別し得る。
【0034】
「量子パラダイム」とは、量子プロセス又はアルゴリズム及び量子アルゴリズムを実行可能な任意の対応する量子ハードウェアを指し得る。量子パラダイムは、量子パラダイムを達成するために必要に応じて1つ又は複数の量子計算システム、量子制御信号、量子計算アルゴリズム、及び量子コンピュータハードウェアを含み得る。
【0035】
「回転異性体」とは、特定の結合の回りで分子の一部分を回転させることによって相互変換することができる分子の幾つかの異性体の何れかを指し得る。
【0036】
「回転異性体ライブラリ」とは、所与の目的(タンパク質の修飾等)での使用に利用可能な1組の回転異性体を定義するデータ構造を指し得る。回転異性体は、回転異性体ねじれ値及び確率等の回転異性体の特性を記述し得る。
【0037】
「スコア付け関数」とは、タンパク質構造等の所与の入力を、入力が予め定義された基準に準拠する程度(タンパク質構造が、最適化するタンパク質特性を示す程度等)を表すスコアにマッピングする数式又は数学的関係を指し得る。
【0038】
「探索空間」とは、最適化すべき機能のドメインを指し得る。探索空間は、探索問題への可能な全ての解を含んでもよく、又は可能な全ての解の限られたサブセットのみを含むように制約されてもよい。探索空間内の各点は、最適化問題への解候補として機能する構成(例えばタンパク質構造)に対応し得る。探索空間の点は、探索空間の「状態」と呼ぶこともできる。
【0039】
実施形態
上述したように、従来の計算システムは、所与のタンパク質設計プロセスの問題探索空間全体を探索することができない。しかしながら、量子コンピュータは、問題探索空間内の多くの、可能な場合には全ての選択肢を同時に評価することができるため、この種の問題を解くことが可能である。
【0040】
幾つかの例示的な実施形態では、探索空間は、タンパク質構造に沿った各位置で使用し得る可能な全てのアミノ酸置換及びそれらのアミノ酸の可能な異なる回転異性体の組合せによって定義される。置換可能なアミノ酸は、20個全ての天然アミノ酸並びに非天然アミノ酸、修飾されたアミノ酸、普通ではないアミノ酸、及び残基を含み得る。探索空間は、量子アニーリング、デジタルアニーリング、量子インスパイアードアルゴリズム、ゲートベース量子アルゴリズム、量子シミュレーション、及び量子インスパイアード最適化を利用して、改善された特性及び所望の特性を有する最適なタンパク質配列を生成する非常にエネルギーの低い状態を識別することによって探索される。しかしながら、例示的な実施形態が、量子アニーリング等の特定の量子アルゴリズムに限定されず、他の適した量子アルゴリズム、量子インスパイアードアルゴリズム、及び量子インスパイアード最適化(即ち量子近似最適化アルゴリズム(QAOA)、グローバー適応探索(GAS)、断熱量子計算、量子最小二乗フィッティング、量子半定値(quantum semidefinite)プログラミング、量子組合せ最適化、量子インスパイアード確率的回帰、量子インスパイアード進化アルゴリズム(QIEA)、量子モンテカルロ量子アニーリング、シミュレーテッド量子アニーリング、量子シミュレーテッドアニーリング、又は変分量子固有値ソルバを用いた量子シミュレーションを通したタンパク質候補を評価することによる)を用いて適用することもできることに留意する。簡潔にするために、「量子ベースの探索」という用語は、任意の量子アルゴリズム、量子インスパイアードアルゴリズム、量子インスパイアード最適化、又は任意の量子-古典的ハイブリッドアルゴリズム若しくは最適化を指すために本明細書で使用し得る。
【0041】
古典的なソルバ及びコンピュータシステムではなく量子計算を利用すること又は主な利点は、スケーリング及びサンプリングに関する。古典的なソルバは一度に1つの状態をサンプリングすることに頼るが、量子アニーリングは、探索空間の複数の状態を考慮することができ、それにより、単一のハミルトニアンに符号化された状態の重ね合わせ表現を介して複数の可能な解を同時に求め得る。これにより、古典的な方法と比較して、探索空間における疎なエネルギーランドスケープのより効率的なサンプリング方法が可能になり、問題及び探索空間のサイズが増大にするにつれて、はるかに良好にスケーリングすることができる。
【0042】
初期結果は、今日利用可能な限られた量子計算ハードウェアを用いてさえも、古典的な最適化及びアルゴリズムと比較して、探索空間が初期アミノ酸配列のはるかに多くの位置を含む状態で、可能な全ての回転異性体を使用して探索空間の量子ベースの探索を実行することができることを示唆する。これは、古典的なハードウェアを使用して達成することができることからの大きな改良を示す。
【0043】
量子ハードウェアが改良されるにつれて、本明細書に記載のタンパク質設計パイプラインを使用して、アミノ酸配列の可能な全ての位置と可能な全ての回転異性体の組合せを含む可能な探索空間全体を効率的に探索することができる。しかしながら、量子コンピュータ及び量子計算デバイスの現在の能力を用いてさえもなお、パイプライン量子探索は、アミノ酸配列上のより多くの位置及び回転異性体のより大きなライブラリでもって、古典的な技法よりも大きな探索空間を探索する方法を提供する。さらに、量子探索のパイプラインは、所望の結果をもたらす可能性が最も高いタンパク質構造の位置及び/又は考慮すべき特定の回転異性体にフォーカスしているため、量子探索は時間及び計算リソースの両方でより効率的に実行し得る。開始点を決定するため又は探索する探索空間のサブセットを決定するために、古典的なシステムは典型的には、主観的設計選択に頼る。代替的には、量子探索は、モデリングと、より多くの経験データ又は実験データが収集されにつれて且つ量子探索のより多くの最適化及び反復が実行されるにつれて時間と共に改良することができる経験データ又は実験データとに基づいて、探索空間の状態候補を更に識別することができる。
【0044】
幾つかの実施形態では、探索問題の許容可能な複雑性(即ち探索空間のサイズ、考慮される変数等)は、探索の実行に利用できるハードウェアに基づいて決まり得る。例えば、探索空間は、考慮されるタンパク質のアミノ酸位置の数及び回転異性体の数によって定義し得る。特定のレベルの量子計算ハードウェアを所与として、特定のサイズの探索空間を探索できることが分かり得る。したがって、探索問題の最大複雑性を識別し得(例えば、それを越えるとハードウェアが探索を効率的に実行することができなくなる複雑性閾値を表す値を計算することにより)、それを使用して、探索し得る位置及び回転異性体の数に制限を設定し得る。識別された最大複雑性は、タンパク質上の適切な領域を選択するに当たりオペレータを更にガイドし得、その結果、探索空間はより小さくなり、探索空間の探索はより効率的になる。幾つかの実施形態では、ユーザは、計算された複雑性閾値を使用して、複雑性限度内に留まるように、例えばより少数の回転異性体を用いてより多数の位置を探索することにより又はこの逆も同様に、複雑性の特定の要素を複雑性の他の要素に対してトレードオフし得る。
【0045】
幾つかの実施形態では、人工知能/機械学習(AI/ML)を適用して、タンパク質構造、タンパク質のアミノ酸配列内のアミノ酸の位置、及び回転異性体、及び/又はタンパク質特性又は機能間の関係を学習し得る。タンパク質構造、アミノ酸、回転異性体、タンパク質特性、及びタンパク質機能に関する情報は、モデル、文献、及び/又は経験/実験データから学習し得、最適化を実行するための初期構造としてどのタンパク質構造を使用すべきか、変更する候補としてどの構造位置を考慮すべきか、アミノ酸置換のどのサブセットか、及びそれらの位置においてどの回転異性体を考慮すべきかの判断を通知し得る。これは、モデル、文献、及び/又は経験/実験データから得られた情報を使用して、量子探索を実行する開始初期タンパク質構造及び探索空間を決定し、所望のタンパク質特徴及び/又は特性に従って最適化されたタンパク質構造を決定することとして要約することができる。場合によっては、タンパク質構造、アミノ酸、回転異性体等の関係を示す、得られたデータは、どの構造、位置、アミノ酸置換、及び/又は回転異性体を考慮すべきではないかの判断を通知し得る-例えば、タンパク質構造に沿った特定の位置における側鎖の変更が、所望の特性の極わずかな改善にしか繋がらず、又は他の点で悪影響を及ぼすことが分かっている場合、その特定の側鎖置換は、所与の探索空間から除去又は除外し得る。
【0046】
幾つかの実施形態では、タンパク質構造、アミノ酸、回転異性体等間の上記関係の理解は、フィードバックループにおいて更に改善し得る。まず、タンパク質の所与の所望の特性又は機能について、システムは、過去の経験データ又は文献に基づいて、試験又は合成する構造、位置、アミノ酸置換、及び/又は回転異性体を推奨し得る。次いで実験パイプラインを適用して、初期特性を改善する可能性が高いと思われる1つ又は複数の調整された最も可能性の高いタンパク質候補を識別し得る。例えば、調整されたタンパク質を作製し得、タンパク質への予備修飾を実行して、タンパク質構造又はタンパク質配列をよりよく理解し、タンパク質構造又はタンパク質配列中のどの位置が修飾の候補であるかを判断し得る。さらに、タンパク質修飾をin silicoで実行して、最適化を実行するためのタンパク質配列候補、タンパク質構造候補、及び配列修飾候補を決定し得る。文献探索を使用して、タンパク質候補を決定し、修飾する位置候補を決定することもできる。
【0047】
調整されたタンパク質候補を作製し、実験機器で試験して、実験データを生成し得る。次いで、AI/MLシステムによって実験データを分析し、タンパク質構造、位置、アミノ酸側鎖、及び回転異性体並びにタンパク質の特性/機能間の関係に関してAI/MLシステムの信頼レベルを更に改善し得る。タンパク質の特性又は機能は、タンパク質の最適化又は改善された特性を定義するのに使用し得る。タンパク質候補並びにそれらの特性及び機能のこの改善された理解を用いて、システムは、将来の実験、シミュレーション、最適化、及び/又は量子探索に異なる構造、位置、アミノ酸置換、又は回転異性体を推奨し得る。
【0048】
図1は、本明細書に記載されるタンパク質設計パイプラインの実施に適した例示的な環境100を示す。環境100は、探索問題の初期セットアップを実行するように構成された古典的コンピュータ102を含み得る。初期タンパク質構造、タンパク質の初期アミノ酸、タンパク質構造の位置の数、及び/又は探索空間に含める回転異性体の数等の探索をガイドする初期探索パラメータを決定するために、古典的コンピュータ104は、古典的コンピュータ102と直接又は間接的に通信するサーバ106によってサポートし得る。初期探索パラメータが古典的コンピュータ102によって確立されると、探索パラメータを使用して、量子コンピュータ104の入力を定義し得、量子コンピュータ104は量子探索を実行し、調整されたタンパク質候補を返す。調整されたタンパク質候補は、実験装置108によって合成され試験されて、調整されたタンパク質が予測又は所望の特性を示すか否かを判断し得る。調整されたタンパク質候補は、所望のタンパク質特性又は特徴に従って最適化する1つ又は複数の標的初期タンパク質を含み得る。
【0049】
探索問題をセットアップするために、古典的なコンピュータ102は、修飾及び/又は関心のある結合相手に適した初期タンパク質構造112及び/又は初期タンパク質配列を識別し得る。適した初期タンパク質構造は、例えば、所望の特性又は特徴に近いタンパク質特性を有する構造に関連し得る。適したタンパク質構造のそのような決定は、実験データ124又はコンピュータベースのモデル122に基づき得る。本明細書に記載の方法では、タンパク質の構造は、二次元若しくは三次元タンパク質構造、アミノ酸配列、タンパク質をコードするポリペプチドをコードするDNA、触媒ドメイン、又は酵素の1つ若しくは複数のドメイン等の幾つかの方法で表現し得る。
【0050】
初期タンパク質構造112は、サーバ106に記憶されたタンパク質ライブラリ120から選択される構造であり得る。代替的には、初期タンパク質構造112は、実験データ124に基づいて選択されなくてもよく、コンピュータベースのモデル122に基づいて動的に生成し得る。
【0051】
結合相手候補は、所与のタンパク質に結合する任意の適した分子であり得る。例えば、結合相手候補は、タンパク質、DNA若しくはRNA等の核酸、多糖類、小分子、又は別の高分子若しくは他の分子であり得る。場合によっては、結合相手を使用しなくてもよく、その場合、タンパク質候補は、任意の結合相手が存在しない場合、機能又は特性に最適化し得る。
【0052】
コンピュータベースのモデル122は、より詳細に後述するように、既存の類似構造に基づいて、類似構造なしでデノボ直接基づいて、関心のある結合相手及び既存の実験データ124に基づいて、又は任意の利用可能な学習された関係126に基づいて、1つ又は複数のタンパク質特性を有する初期タンパク質構造を予測し得る。幾つかの実施形態では、関心のあるタンパク質及び1つ又は複数の結合相手は、X線技法、分光法、結晶法、NMR、クライオ電子顕微鏡法、又は他の適した技法に基づいて識別し得る。
【0053】
古典的なコンピュータ102は、最適化する特性114を更に記憶し得る。最適化する特性114は、設計者が改善したい初期タンパク質の特性又は設計者が変えたい初期タンパク質の特徴を含み得る。例えば、最適化に適した特性114は、タンパク質の安定性(熱安定性、pH安定性、溶媒安定性、他の賦形剤への安定性、特定用途での安定性)、発現性、可溶性、電荷分布、タンパク質フォールディング、活性、特異性(例えば結合特異性、基特異性、基質特異性、立体特異性、若しくはコファクタ特異性)、可逆性、酵素動力学、基質阻害、生産物阻害、プロテアーゼ分解への耐性、新機能獲得、結合剤へのタンパク質の親和性、又は同様の結合相手へのタンパク質結合の特異性を含み得る。
【0054】
古典的なコンピュータ102は、修飾に適したタンパク質構造112に沿った選択された位置126又はタンパク質配列を更に記憶し得る。選択される位置116は、例えば、側鎖を取り付け得るタンパク質構造112若しくはタンパク質配列に沿った可能な全ての位置又はコンピュータベースのモデル122、学習された関係126、及び/又は最適化するのが望ましい特性114に影響する可能性が最も高いタンパク質構造112に沿った位置を示すユーザ入力によって決定されるそのような位置のサブセットを含み得る。場合によっては、タンパク質構造112又はタンパク質配列に沿った幾つかの位置は、クリティカルとしてフラグ付け得(例えばコンピュータベースのモデル122、学習された関係126、ユーザ入力等)、それにより、フラグが付された位置は、選択される位置116に考慮されるべきではない。例えば、保存されていることが分かっている位置又は触媒残基では、その位置のアミノ酸の修飾がタンパク質の所望の活性、機能、又は性能を破壊することを理解し得る。クリティカルとしてフラグが付されたあらゆる位置は、考慮から除外し得、それにより、探索空間を縮小できるようにする。代替又は追加として、位置は、探索目的で重要度高又は重要度低としてフラグ付け得る。例えば、モデリング、AI/ML等によって判断されるように、所望のタンパク質機能又は特性に大きな又は小さな影響を及ぼすことが分かっている位置が示され得る。
【0055】
クリティカル、重要度高、又は重要度低としてフラグ付けられた位置等のフラグが付された任意の位置は、ユーザインターフェース上でユーザに提示し得る。例えば、グラフィカルユーザインターフェースは、修飾されているタンパク質のモデルを示し得、1つ又は複数のタンパク質機能及び/又は特性にとってクリティカル、重要度高、又は重要度低であるモデル上の位置を強調表示、フラグ付け、又は他の方法で視覚的に区別し得る。幾つかの実施形態では、ユーザは、モデルの識別された位置の1つ又は複数を選択して、それらの位置についての詳細情報(例えば、選択された位置に関連するタンパク質特性又は機能についての任意の情報、選択された位置の修飾が特性又は機能を変える可能性が高い程度、最適化可能な特性又は機能に関して位置が試験された実験データ等)を受信し得る。記載された位置フラグ付け技法は、タンパク質最適化の分野以外で採用することもでき、代わりに、特定のタンパク質機能及び/又は特性にとって重要であるか、又は重要ではない位置を強調表示するのに使用することもできる。
【0056】
古典的なコンピュータ102はスコア付け関数118を更に記憶し得、スコア付け関数118は、(例えば)最適化する特性114に関するタンパク質の性能の程度又はタンパク質が最適化可能な標的特性を示す程度を表すスコアへの所与のタンパク質構造のマッピングを提供する。例えば、スコア付け関数118は、ハミルトニアンとして量子コンピュータ104によって適用又は適合することができるペア毎の回転異性体エネルギーマッピングとして表すことができる。タンパク質候補は、スコア付け関数118と突き合わせて量子コンピュータ104によって評価されて、どのタンパク質候補が最適であるか及びどのタンパク質が最適未満であり得るかを判断し得る。幾つかの実施形態では、スコア付け関数は、デルタデルタG(DDG)等のシステムエネルギー値を計算して、タンパク質のバリアントをランク付けし得るが、他のタイプのスコア付け関数を使用することも可能である。実施形態では、スコア付け関数は、タンパク質の分子及び結合の研究された相互作用に基づく統計又は知識ベースのスコア付け関数であり得る。統計又は知識ベースのスコア付け関数は、所与のタンパク質配列及びタンパク質構造で生じる幾つかの特定の相互作用(例えば、回転異性体の距離、回転異性体のタイプ、アミノ酸のタイプ、角度制約等)を含み得る。
【0057】
古典的なコンピュータ102は、選択された位置116において考慮すべき1組の回転異性体を選択することもできる。回転異性体は、サーバ106に記憶された回転異性体ライブラリ128からの1組の回転異性体であり得る。幾つかの実施形態では、特定の探索に提供される回転異性体ライブラリは、利用可能な量子ハードウェア、量子アルゴリズム、又は量子計算を実行するための量子パラダイムに基づいて、複数の回転異性体ライブラリから決定し得る。例えば、量子コンピュータ104上のハードウェアについての情報(例えば量子ビット数、アーキテクチャへの量子ビットの配置、量子ビットのモダリティ、量子ビットのコヒーレンス時間、量子コンピュータ104におけるノイズレベル等)により、古典的なコンピュータ102及び/又はサーバ106が、量子コンピュータ104によって扱うことができる探索空間の最大複雑性を表す複雑性値を計算することができる。探索に提供される1つ又は複数の回転異性体ライブラリは、探索空間の複雑性が計算された複雑性値を越えるポイントまで探索空間を増大させないように選択し得る。
【0058】
タンパク質構造112に沿ったより多数又はより少数の位置が探索空間に選択されるにつれて、複雑性スコア及び対応する利用可能な回転異性体ライブラリ128を調整することもできる。古典的なコンピュータ102は、複雑性についての情報をユーザインターフェースに提供し得、それにより、タンパク質設計者(即ちデバイスのユーザ)は、調整する位置を選択するにつれて行われるトレードオフを見ることができる。タンパク質設計者が、問題の所与の複雑性及び利用可能な量子ハードウェアで、より多くの回転異性体ライブラリをアクセス可能にしたい場合、設計者は、複雑性を下げ、より多くの回転異性体ライブラリを利用できるようにするために、探索空間に含まれる位置の数を少なくし、且つ/又は探索空間に含まれるアミノ酸置換のサブセットを小さくすることを選ぶことができ、又はこの逆も同様である。
【0059】
選択された位置116、アミノ酸置換の選択されたサブセット、及び利用可能な回転異性体ライブラリ128の回転異性体の選択された組は、量子コンピュータが考慮すべき探索空間130を定義する。探索空間130及びスコア付け関数118の表現は、評価のために量子コンピュータ104に提供し得る。
【0060】
量子アニーリングパラダイムでは、量子コンピュータ104は初期ハミルトニアン132を選択し得、量子コンピュータ104は、初期ハミルトニアン132に従ってそれ自体を構成し得る。典型的には、初期ハミルトニアン132は、量子コンピュータのハードウェア構成を所与として、達成が比較的簡単な量子コンピュータ104の構成を有するように選択される。初期ハミルトニアン132は、問題の目標ハミルトニアン134の表現にゆっくりと進化し、目標ハミルトニアン134は一般に、スコア付け関数118の表現であり、スコア付け関数118によって定義される。
【0061】
量子アニーリングアルゴリズムの重要な態様は、進化速度136であり、進化速度136は、初期ハミルトニアン132が目標ハミルトニアン134に進化することが許容された速度を定義する。進化速度136が速すぎる場合、進化中のハミルトニアンは、基底状態から出ることになり、目標ハミルトニアン134に進化するために、基底状態に戻ることができないことがある。しかしながら、進化速度136が遅すぎる場合、解くまでの時間が長くなり、それによっても、ハミルトニアンが目標ハミルトニアン134の所望の範囲内に進化し続けることが妨げられ得る。さらに、進化速度136が遅いと、解を達成することができる前に量子探索システムを非コヒーレンスに劣化させ得る、選択された量子ビットモダリティが比較的低いコヒーレンス時間を有するか、又は高レベルのノイズを有する場合、最適化の失敗に繋がり得る。したがって、進化速度136は、目標ハミルトニアン134の性質及び利用可能な量子ハードウェアの忠実度に応じて事例毎に選択されるべきである。場合によっては、進化速度136は、探索の過程にわたって変更することが許されていることがあり、基底状態と最低励起状態との間のエネルギーギャップが閾値よりも下がったため、システムがエネルギーギャップの遷移点に近づくにつれて遅くなるようにそれ自体を調整し得る。進化速度136は、基底状態と第1の励起状態との間のエネルギーギャップが閾値よりも大きい場合、探索の他の部分中、増大し得る。
【0062】
初期ハミルトニアン132が目標ハミルトニアン134に進化した後、量子コンピュータ104の状態を測定し得る。測定は一般に、構成がタンパク質構造を定義する量子ビットの状態(即ち各量子ビットは0又は1の何れかとして測定される)の特定の配置を反映する。生成された構造は、探索しているタンパク質を最適化(又は少なくとも改善)したものを表し得る。幾つかの実施形態では、偽陽性を排除し、且つ/又は考慮する複数のタンパク質候補を提供するために、量子探索アルゴリズムは複数回実行し得る。
【0063】
量子コンピュータについて図3を参照して本明細書でより詳細に考察し、量子アルゴリズムの一実施形態について図4を参照してより詳細に考察する。上記説明は1つの特定の量子計算パラダイム(即ち量子アニーリング)に特有であるが、他の任意のシステム及び方法は明確に説明された特定の実施態様に限定されないことに留意されたい。代わりに、記載される量子アニーリング例は、例示としてのみ提供され、他のタイプの量子アルゴリズム、例えばゲートベース量子計算ハードウェアには量子近似最適化アルゴリズム(QAOA)を用いてタンパク質設計パイプラインを適用してもよいことが企図される。本開示の教示に照らして、他のタイプの量子アルゴリズム及び量子コンピュータ104に適合するように古典的コンピュータ102からの入力を調整する方法を当業者は理解する。
【0064】
量子コンピュータ104が、考慮する1つ又は複数の出力タンパク質配列候補を提供した後、実験装置108を使用して、タンパク質配列候補を試験し、出力タンパク質配列候補のどれが、最適化する特性114に関して最良に実行するかを判断し得る。タンパク質配列候補を試験することは、データを生成し得、データはサーバ106に実験データ124として記憶し得る。実験データ124は、どの位置及びどのアミノ酸置換が、関心のあるタンパク質特性の調整により有効であるか、どの回転異性体ライブラリがそれらのタンパク質に影響する可能性がより高いか、特定の位置の回転異性体への変更が関心のあるタンパク質特性をいかに変えるか等についての洞察を提供し得る。
【0065】
サーバ106は、潜在的にはAI/MLシステムと併せて実験データを使用して、コンピュータベースのモデル122を構築し、且つ/又はタンパク質構造、位置、及び回転異性体並びに最適化する特性114間のルール又は学習された関係126を決定し得る。パイプラインのこの態様について図5を参照してより詳細に考察する。
【0066】
環境100の種々の構成要素は、インターネット、イントラネット、直接有線若しくは無線接続、又は別のタイプのネットワーク等の適したネットワーク110により一緒に接続することができ、又は他の方法で通信可能に結合することができる。
【0067】
図2は、本明細書に記載されるタンパク質設計パイプライン200のフローチャートである。図2のタンパク質設計パイプライン200は、図1の環境100によって実行し得、したがって、例示を目的として、環境100の要素を参照してタンパク質設計パイプライン200の態様を説明し得る。タンパク質設計パイプライン200はブロック202において開始され、システムは初期標的タンパク質構造及び/又は関心のある結合相手(例えば図1の初期タンパク質構造112)を選択する。幾つかの実施形態では、標的タンパク質構造は既知であり、他の実施形態では、標的タンパク質構造は既知ではなく、コンピュータベースのモデリング又は既存データのマイニング(例えばコンピュータベースのモデリング122及び実験データ124)を通してブロック204において決定されなければならない。システムは、関心のある結合相手に基づいて幾つかの異なるタンパク質構造をシミュレート又はモデリングし得、関心のある結合相手に結合する可能性が最も高い1つ又は複数のタンパク質構造を選択し得る。複数のタンパク質がシステムにより候補として選択される場合、選択されたタンパク質のリストをインターフェース上でユーザに提示して、ユーザが、更なる評価に向けて1つ又は複数のタンパク質を選択できるようにし得る。タンパク質候補は、モデリング及びシミュレーションに基づいてランク付きリストで表示し得、タンパク質のランクは、結合相手が使用されている場合、関心のある結合相手に結合するタンパク質の能力のシステム査定に基づく。
【0068】
幾つかの実施形態では、システムは、ブロック206において、既存のデータをコンピュータベースのモデリング122に組み込み得、又は既存のデータをマイニングのためのデータに組み込み得、既存のデータは、タンパク質設計パイプライン200がフィードバックループで実行されるにつれて生成されるタンパク質設計パイプライン200の前の反復からの過去データを含み得る。既存のデータ又は過去データは、タンパク質ライブラリ120からの標的タンパク質構造のリスト、関心のある結合相手に結合するタンパク質構造の能力についての情報、量子ハードウェア又は量子計算能力が限られている場合にシステムが複雑性の低いタンパク質構造を選択できるようにするタンパク質構造についての複雑性情報、タンパク質性能、構造-機能関係等を含み得る。
【0069】
ブロック208において、システムは、関心のある結合相手との決定された標的タンパク質構造の複雑な立体構造を決定し得る。ブロック210において、システムは、最適化する1つ又は複数のタンパク質特性を選択し得る。最適化するタンパク質特性は、用途に応じて変更し得るが、例示的な実施形態では、特異性、活性、発現性、可溶性、及び/又は安定性が最適化される。
【0070】
ブロック212において、システムは、変更に適格な初期タンパク質配列に沿った位置を選択し得る(即ちその位置のアミノ酸を異なるアミノ酸候補で置換し、アミノ酸を削除若しくは除去し、又はアミノ酸を追加若しくは挿入する)。システムは、タンパク質構造中の利用可能な全ての位置のリストで開始し得、リストは、可能性の中でも特に、予め定義されタンパク質ライブラリ120に記憶されてもよく、又はモデリング及びシミュレーションを通して動的に決定されてもよい。変更に適格な利用可能な位置のリストは、最適化するタンパク質特性に対する効果を有する可能性が最も高い位置についての古典的なコンピュータ102及び/又はサーバ106による査定に基づいてランク付けし得る。ランク付けは、モデリング、学習された関係126、利用可能な文献の探索等に基づいて決定し得、部分的にAI/MLの支援を用いて行われ得、図5を参照して更に説明し得る。
【0071】
場合によっては、システムは、ユーザが、最適化するタンパク質特性に影響する可能性が最も高いとユーザが信じるタンパク質配列の位置をフラグ付けられるようにし得る。フラグが付された位置は、モデリング及び/又は実験データを介して試験されて、それらがタンパク質特性に期待するように影響するか否かを判断し得る。期待するように影響する場合、モデリング及び/又は実験データからの結果として生じる情報は、更に使用するために、システムの実験データ、モデル、及び学習された関係に組み込まれる。このようにして、システムは、ドメイン知識をなお、試験を通した妥当性確認及び検証への対象としながら、所与のユーザの主観的な専門家のドメイン知識を組み込むことができる。
【0072】
幾つかの実施形態では、システムは、ユーザが20個の天然の可能性及び/又は非天然アミノ酸置換の中から1組のアミノ酸置換又は追加を選択できるようにするユーザインターフェースを提示し得る。代替又は追加として、システムは、適切なアミノ酸置換又は追加を自動的に選択し得る。これらの置換又は追加は、AI/MLアルゴリズムの結果、モデリング、実験データ、又は最適化されているタンパク質特性又は機能の改善に繋がる可能性が最も高い置換又は追加を識別する他の適した技法に基づいて自動的に選択又はユーザに自動的に推定し得る。幾つかの実施形態では、置換又は追加は、タンパク質特性又は機能の改善に繋がる可能性が最も高い置換又は追加に基づいてランク付けし得、置換及び/又は追加は、ユーザ選択のために、ランク付けられた順序で表示し得る。代替又は追加として、上位n個の結果のみを選択又は推奨し得、nは予め決定され且つ/又はカスタマイズ可能な整数である。さらに、システムは、量子計算能力及び/又は複雑性に応じてタンパク質の修飾範囲を制限するために、アミノ酸を修飾、削除、又は挿入する位置の数、回転異性体の数、及びアミノ酸数を制限し得る。
【0073】
場合によっては、幾つかの位置及び/又はアミノ酸置換又は削除は、クリティカルと見なされ得、変更から「閉め出」し得又は変更されないようにし得、したがって、探索空間から除去し得る。クリティカル位置及び/又はクリティカルアミノ酸又は削除は、実験データ、学習された関係、モデリング等に基づいて決定し得る。一般に、クリティカル位置及び/又はクリティカルアミノ酸置換又は削除は、タンパク質のフォールディング、安定性、可溶性、及び/又は性能に悪影響を及ぼさずには変更できない位置/アミノ酸又は変更が最適化するタンパク質特性にあまり影響しない位置等を含み得る。幾つかの実施形態では、位置は、他の試験からの類似配列の観測により、所与の位置での変更が標的特性又は機能にプラスの影響を与える可能性が低いことが示されている場合、変更から閉め出し得る。このために、進化データからの情報及び/又は実験データベースからのデータを使用して、探索空間からどの位置を閉め出すべきかを判断し得る。リスト又は位置/置換/削除がユーザに提示される前、クリティカル位置/閉め出された位置、クリティカルアミノ酸置換、及び/又は削除は、変更に適格な位置/置換/削除のリストから除外し得、又はクリティカル位置、クリティカルアミノ酸置換、及び/又は削除は、システムがこれらの位置をクリティカルと見なしているという理解を持って、ユーザが所望の場合に変更にそれらを選択することができるように、リストにおいて視覚的に区別し得る。
【0074】
幾つかの実施形態では、システムは、上述したように、選択された位置、アミノ酸置換、及び/又は削除を使用して、複雑性スコアを計算し得る。利用可能な全ての回転異性体が試験された場合、複雑性スコアは最初、探索空間の複雑性を表し得る。複雑性が量子コンピュータ104のハードウェア能力を超える場合、システムは、幾つかの回転異性体を考慮からプログラム的に除外し得、又はユーザが、どの位置、アミノ酸置換、アミノ酸削除、又は回転異性体ライブラリが探索空間に考慮され、又は考慮されないかを選択できるようにし得る。ユーザは、回転異性体ライブラリのプログラムによる選択を他の特定のライブラリと交換するようにオーバーライドし得る。考慮する回転異性体ライブラリを選択するとき、システムは、回転異性体ライブラリが、最適化すべきタンパク質特性に対して有意な効果を有する回転異性体を含む尤度と突き合わせた、回転異性体ライブラリが包含される場合の複雑性スコアへの増大量によって決定される、選択された回転異性体ライブラリによって追加される複雑性を加重し得る。
【0075】
ブロック214において、システムは、ブロック210において識別されたタンパク質特性を最適化するスコア付け関数を定義し得る。スコア付け関数は、入力としてタンパク質特性の測定値を受け入れ得、それらの値が特定のスコア付け基準を満たす程度を反映した、計算されたスコアを出力し得る。タンパク質特性は、特定の特性が他の特性よりも加重されるように又は特定の特性への改善が他の特性への改善よりも加重されるように、スコア付け関数によって重み付けし得る。幾つかの実施形態では、スコア付け関数は、最適化又はプロセス中、選択された範囲内の特定の特性が改善されるように変化する重み値を有し得る。例えば、特性への初期改善は、特定の最小閾値に達するように特性を促すよう重く加重し得る。最小閾値を超える場合、特性の改善にはより小さい重みを与え得、それにより、他の特性を優先付けることができる。関心のある異なる特性への改善のトレードオフを行うことができるように、複数の閾値又は重みの連続を定義し得る。さらに、スコア付け関数は、タンパク質特性の改善達成に関連するコストを考慮し得、スコア付け関数は、高コストの低価値改善に高い優先度が与えられないように、コストと突き合わせて改善を重み付けし得る。
【0076】
ブロック216において、システムは、探索に含める1つ又は複数の回転異性体ライブラリを選択し得る。上述したように、回転異性体ライブラリの包含から生じる探索空間の複雑性の変化を使用して、回転異性体ライブラリを考慮から排除し得、又は考慮されている位置及び/又はアミノ酸修飾の数を低減するようにユーザに強制し得る。逆に、所望の全ての回転異性体ライブラリが包含又は排除され、複雑性スコアにより、量子ハードウェアが探索を効率的に実行可能なままであることが示される場合、システムは、追加の位置及び/又はアミノ酸修飾を考慮し得ることをユーザに知らせ得る。これにより、ユーザは、探索空間において探索される位置及び/又はアミノ酸修飾の数を上げることができる。
【0077】
幾つかの実施形態では、ライブラリの回転異性体が最適化するタンパク質特性に影響する尤度に基づいて(例えばモデリング、実験データ、学習された関係、文献等に基づいて)、各回転異性体ライブラリの回転異性体スコアを計算し得る。回転異性体ライブラリは、回転異性体スコアに基づいてランク付き順序に配置し得る。所定の閾値未満のスコアを有する回転異性体ライブラリは、考慮から排除し得、排除されたライブラリを反映するように複雑性スコアを更新し得る。幾つかの実施形態では、回転異性体は、ユーザがより多数又はより少数の位置及び/又はアミノ酸修飾を考慮に選択するにつれて、動的に除外し得る。例えば、ユーザがより多くの位置及び/又はアミノ酸修飾を組み込む場合、計算される複雑性スコアが量子コンピュータ104の能力内になるまで、リスト内の最低スコアを有する回転異性体ライブラリを順次排除し得る。位置及び/又はアミノ酸修飾の数が低減する場合、回転異性体ライブラリを回転異性体ライブラリのスコアに基づく順序で探索空間に戻し得、それにより、より関連性の高い回転異性体ライブラリが最初に戻される。したがって、位置、アミノ酸修飾、及び回転異性体ライブラリが互いに鑑みて動的に調整されるにつれて、タンパク質設計パイプライン200は、ブロック212とブロック216との間で繰り返し得る。
【0078】
何れの時点でも、ユーザは、問題についてのそれら自体のドメイン知識又は最適化中のタンパク質の特性に基づいて、包含する1つ又は複数の回転異性体ライブラリを手動で選択し得る。ユーザが包含する回転異性体ライブラリを選択する場合、システムは、タンパク質設計プロセス中、回転異性体ライブラリを評価して、その回転異性体ライブラリの計算された回転異性体スコアを調整する必要があるか否かを判断し得る。例えば、所与の回転異性体ライブラリが最適化するタンパク質特性に影響する可能性は低いとシステムにより判断されたが、ユーザがそのライブラリの排除をオーバーライドし、そのライブラリからの回転異性体が調整されたタンパク質の良好な候補であると量子アルゴリズムにより判断された場合、この情報は実験データ124において反映し得、将来の最適化及びタンパク質設計パイプライン200の将来の反復に向けてコンピュータベースのモデル122及び/又は学習された関係126を調整するのに使用し得る。したがって、同じ又は同様の最適化問題について同じ回転異性体の回転異性体スコアが次に計算されるとき、そのスコアは前回よりも高い値であり得、その回転異性体ライブラリが探索空間内の考慮に包含される可能性を高くする。
【0079】
位置、アミノ酸修飾、及び回転異性体ライブラリの最終選択が行われると、これらの選択を使用して、タンパク質最適化問題の探索空間を定義し得る。探索空間は、ブロック212及びブロック216において行われた選択を所与として、位置、アミノ酸修飾、及び回転異性体の可能な様々な組合せの全ての多次元符号化を表し得る。ブロック218において、システムは、ブロック208からの準拠したタンパク質/結合相手にアクセスし、準拠したタンパク質上のブロック212において識別された位置にフラグを付し、準拠したタンパク質/結合相手、フラグが付されたタンパク質位置、ブロック214からのスコア付け関数、及び探索空間を量子コンピュータ104に提供し得る。量子コンピュータは、シミュレーテッド量子アニーリング、デジタルアニーリング、断熱量子計算、量子近似最適化アルゴリズム(QAOA)、ブローバー適応探索(GAS)、ゲートベース量子アルゴリズム、量子インスパイアードアルゴリズム、又は任意の他の適した量子アルゴリズム等の量子アルゴリズムを使用してこれらの入力を評価し得る。量子アニーリングを採用する特定の例について図4を参照して説明する。
【0080】
量子アルゴリズムの各実行に伴い、量子コンピュータ104は、最適化されたタンパク質の候補として、初期タンパク質/関心のある結合相手の変異したタンパク質を選択し得る。量子アルゴリズムは複数回実行されて、最適化されたタンパク質として複数の候補を選択し得る。幾つかの実施形態では、量子アルゴリズムの複数の実行で最適化されたタンパク質の同じ候補が識別され得、そうして識別された候補が最小値を表し、十分に最適化されたタンパク質を表す尤度が上がったことを示し得る。量子アルゴリズムの実行結果に基づいて、システムは、タンパク質候補のランク付きリスト(例えば、タンパク質候補が量子アルゴリズムによって識別された回数及び/又はスコア付け関数によって決定されたタンパク質候補のスコアに基づく順序でランク付けられる)を提示し得る。ユーザは、試験及び検証に関心のあるタンパク質としてタンパク質候補の1つ又は複数を選択し得、タンパク質がDNAレベルで最適化されている他の実施形態では、ユーザにDNA配列を提示し得、ユーザはDNA配列を選択して、最適化されたタンパク質候補を選択し得る。
【0081】
任意選択的には、関心のあるタンパク質バリアントは、ブロック220において、量子又は古典的アルゴリズムを使用して再ランク付けし得る。例えば、量子アルゴリズムが、所与のスコア付け関数を使用して、最適化されたタンパク質の関心のある特性候補の短いリストを生成した後、異なるスコア付け関数を使用して古典的ハードウェアでその短いリストを再ランク付けし得る。この再ランク付けにより、量子コンピュータは最も見込みのある候補を選択し、次いで古典的計算技法を使用して更に改善することができる。代替的には、タンパク質バリアントのリストは、異なるスコア付け関数を使用して量子コンピュータで再ランク付けし得る。別の実施形態では、古典的ハードウェアが、量子コンピュータによって適用されるのと同じスコア付け関数を使用して候補を再ランク付けし得る。これらの実施形態では、古典的コンピュータは、量子ランク付けが予期されたように実行されたことを検証し得る。さらに、タンパク質のリストは任意の回数ランク付け又は再ランク付けし得、各再ランク付けは量子パラダイム又は古典的アルゴリズムによって実行される。したがって、タンパク質のリストは、複数回再ランク付けされ抜粋されて、1つ又は複数の最適化されたタンパク質配列及び/又は構造を決定し得る。
【0082】
タンパク質バリアントの再ランク付けは、1つ又は複数の異なる量子パラダイム及び/又は古典的パラダイムを使用して複数回実行し得る。例えば、タンパク質バリアントの最初のランクは、量子アニーリングを使用して決定し得、上位n個のランクのタンパク質バリアントを次いで、第2の量子計算システムに渡すことができ、デジタルアニーリング又は別のパラダイム等の異なる量子計算パラダイムを使用して更に再ランク付けし得る。さらに、最適化プロセス全体を通して、最適化プロセスの異なる反復中、所望のタンパク質特性を有する最適化されたタンパク質配列及び/又は構造が決定されるまで、異なる量子及び/又は古典的パラダイム及びアルゴリズムを使用し得る。
【0083】
ブロック222において、システムは、タンパク質候補として最上位のタンパク質バリアント又は上位n個のタンパク質バリアントを選択し得、nは所定の整数である。上位のタンパク質バリアントは、ブロック218~220において決定されたランクに基づいて且つ/又はスコア付け関数によって決定されたスコアに基づいて選択し得る。ブロック224において、選択されたタンパク質候補は、適した実験装置により試験し得る。試験は、ブロック210において識別された最適化する特性に関するタンパク質候補の性能にフォーカスし得る。しかしながら、試験はこれらの特性に限定される必要はなく、ブロック224において他の特性を試験することも可能である。試験結果に基づいて、実験データを生成し得る。ブロック224において、実験データはデータライブラリに追加し得、次いで、図5を参照してより詳細に説明するように、AI/MLを受け得る。これにより、どのタンパク質及びアミノ酸修飾が重要又は非重要と見なされるか、どの回転異性体ライブラリがどのタンパク質特性に影響する可能性が高いか、タンパク質構造へのどの変更がどの特性に影響するか等の理解が上がり得る。この情報は、ブロック206においてパイプラインにフィードバックし得、それにより、将来の最適化問題はこの情報から恩恵を受けることができ、洞察を改良することができる。
【0084】
タンパク質設計パイプライン200は統合されて提示されているが、特定の利点を達成するために、タンパク質設計パイプライン200の各ブロックが別個に実行されてもよく、又は他のブロックの限られたサブセットと組み合わせて実行されてもよいことに留意する。例えば、量子アルゴリズムはより大きな探索空間を考慮できるようにし得るが、完全に古典的又は量子-古典ハイブリットの状況でブロック202~216及び220~226を別個に適用することができることが企図される。ブロック212を単なる一例として取り上げると、タンパク質設計位置、アミノ酸修飾、及び回転異性体の選択は、タンパク質設計及び最適化全般に適用可能な問題であり、量子コンピュータを使用して最適化を実行する状況のみで採用される必要はない。同様に、上記複雑性スコアは、古典的コンピュータが指定された探索空間を効率的に探索可能であるか否かの評価に適用することができ、利用可能な古典的ハードウェアを最良に利用するように位置、アミノ酸修飾、及び回転異性体ライブラリを選択できるようにする。さらに、タンパク質への変更とその結果としての、指定されたタンパク質特性の改善との間の関係の理解を改善するためのブロック222~226におけるAI/MLの使用は、タンパク質設計及び他の分野で多くの用途を有する。
【0085】
図3は、例示的な量子計算環境300を示すブロック図である。量子計算環境300は量子コンピュータ104を含み、量子コンピュータ104は、古典的な入力302を受信し、古典的入力302に基づいて量子アルゴリズムを実行し、古典的出力304を生成する。古典的出力304は、量子コンピュータ104が量子アルゴリズムを実行した後の量子コンピュータ104の状態の測定に基づき得る。
【0086】
一実施形態によれば、古典的入力302は、変更対象であるタンパク質構造の位置が示されたタンパク質構造を有するタンパク質を含み得る。古典的入力302は、タンパク質の一部分、例えば分離された結合部位、ポケット、又はタンパク質ドメインを含み得る。さらに、古典的入力302は、タンパク質の所望の特性を最適化するのに使用されるスコア付け関数を含み得る。古典的入力302は、任意選択的には、タンパク質のフラグ付けられた部分又はフラグ付けられた位置に追加することができる回転異性体を含む1つ又は複数の回転異性体ライブラリの識別情報を含み得、回転異性体ライブラリが提供されない場合、利用可能な全ての回転異性体を探索し得る。古典的入力302は、任意選択的には、示された位置に配置することができ、又はタンパク質の部分から除去することができるアミノ酸修飾の識別情報を含み得、アミノ酸修飾が提供されない場合、利用可能な全ての修飾を探索し得る。識別情報は、例えば許された修飾の表の形態であり得る。任意の実施形態において、古典的入力302は、量子コンピュータ104に初期パラメータ(例えば初期タンパク質構造及び/又は結合相手)及びタンパク質の特性又は特徴の最適化を実行する探索空間を提供し得る。
【0087】
古典的入力302は、量子コンピュータ104のハードウェアで解決すべき問題を符号化するのに使用される。一般に、量子コンピュータ104は幾つかの量子ビット306~314を含む。図3は5つのみの量子ビットを特定の配置で示すが、異なる構成のより多数又はより少数の量子ビットを用いて量子コンピュータを設計し得ることが理解される。
【0088】
量子ビット306~314は、量子ビットモダリティと呼ばれる幾つかの異なる方法で物理的に現れ得る。異なる各モダリティは、製造の容易さ、使用の容易さ、エラーレート及びコヒーレンス時間、結果の再現性等に関して異なる利点及び欠点を有する。上記タンパク質設計パイプライン200は一般に、広範囲の量子ビットモダリティにわたって適用可能である。
【0089】
量子ビット306~314は、量子ビット間の相互接続を定義する特定の量子ビットアーキテクチャ316に配置し得る。量子アルゴリズムでは、第1の量子ビットは、第2の量子ビットに作用するため、又は第2の量子ビットによる影響を受けるために、第2の量子ビットへの通信経路を必要とする。これらの通信経路は、特定の量子論理ゲートを実施するに当たり重要である。しかしながら、特に量子コンピュータの量子ビットのトポロジに関する量子コンピュータへの制約を所与として、あらゆる量子ビットが他のあらゆる量子ビットをアドレス指定可能であるわけではない。したがって、特定の量子ビットアーキテクチャ316は、実行することができるアルゴリズムのタイプ及び解くことができる問題のタイプを制限し得る。一般に、量子ビットは、特定の内部アーキテクチャを有する比較的小さな群に配置され、量子ビットの群は、外部接続を介して他の量子ビット群に接続される。量子ビットアーキテクチャ316の一例は、ブリティッシュコロンビア州Burnabyに所在のD-Wave Systems,Inc.により使用されるPegasusアーキテクチャである。上記タンパク質設計パイプライン200が、最適化及び探索問題に適した任意の既知の量子ビットアーキテクチャ316と併用し得ることが企図される。
【0090】
量子コンピュータ104は、汎用量子コンピュータであることができ、量子ビット306~4314の状態は、任意の既知の量子アルゴリズムを実施可能なユニバーサル論理ゲートによって操作される。しかしながら、タンパク質設計パイプライン200は、量子アニーリング又はデジタルアニーリングを実行するように特に構成されたコンピュータ等の専用量子コンピュータとの併用にも適する。そのような専用量子コンピュータの一例は、ブリティッシュコロンビア州Burnabyに所在のD-Wave Systems,Inc.からのD-Wave One、D-Wave Two、D-Wave 2X、D-Wave 2000Q、及びD-Wave Advantage量子アニーリングコンピュータ及び例えばFujitsuによって開発されたデジタルアニーラである。
【0091】
量子アルゴリズムが実行されると、量子ビット306~314は一般に、開始状態に初期化され(例えば初期ハミルトニアン132に基づいて)、次いで、実行中の量子アルゴリズムに従って操作される。各量子ビットの状態を変更するために、ハードウェア量子ビット制御ユニット320が提供される。使用される特定の量子ビット制御ユニット320は、操作される量子ビット306~314のモダリティに依存し得る。例えば、超伝導量子ビットは一般に、量子制御ユニット320として採用されるマイクロ波源により提供されるマイクロ波を用いて対処され、一方、捕獲イオンは、量子ビット制御ユニット320として実施されるマイクロ波又はレーザ等の光学系を使用して対処し得る。任意の実施形態において、量子ビット制御ユニット320は、各量子ビット306~314の状態を操作するためのハードウェアを含む。
【0092】
量子ビット制御ユニット320に加えて、量子コンピュータ104は、提示された問題への答えを返すために、量子ビットの状態を読み取る方法を必要とする。例えば、量子アニーリングプロセスの終わりに、量子ビットの状態(即ち0又は1)を目標ハミルトニアン134に従って配置し得、そうして配置された量子ビット状態の状態は、アルゴリズムが実行されるにつれて発見された最低エネルギー状態を表す位置/アミノ酸/回転異性体組合せの各々の選択を表し得る。したがって、量子ビット状態は、量子アルゴリズムの現在の実行に従って費用関数を最小化する変異タンパク質を表す。したがって、問題への答えを返すためには、量子ビット306~314の状態を読み取らなければならい。
【0093】
そのために、量子コンピュータ104はハードウェア測定ユニット318を含み得る。幾つかの実施態様では、量子ビットは、量子ビットが制御されるのと同じ技法を使用して読み取ることができ、量子ビット制御ユニット320及び測定ユニット318は同じであることができる。他の実施形態では、量子ビット制御ユニット320は測定ユニット318と異なり得る。異なるモダリティは情報を異なる方法で記憶し得るため、量子ビットモダリティに応じて異なるタイプの測定ユニットが採用される。例えば、超伝導量子ビットは、量子ビットの形成に使用されるジョセフソン接合の位相として状態を記憶し、測定ユニット318として磁力計又はマイクロ波共振器を用いて読み取ることができる。捕獲イオンは、イオンの電子の配置に量子状態を記憶し、指定された状態であるとき、光子を放出し、レーザによって励起する。捕獲イオンの状態は、捕獲イオンがある状態にあるときには光子を検出し、捕獲イオンが別の状態であるときには光子を受け取らない電荷結合素子(CCD)等の光学測定デバイスにより読み取ることができる。
【0094】
測定ユニット318により実行される測定に基づいて、量子アルゴリズムが実行された後、量子コンピュータ104は古典的出力304を提供する。古典的出力304は、古典的入力302を所与として、量子コンピュータ104が、最適化するタンパク質特性を改善する可能性が最も高いと判断した最適な回転異性体配向を有する変異タンパク質配列を含み得る。
【0095】
図4は、図22のタンパク質設計パイプライン200の例示的な実施形態との併用に適した例示的な量子アルゴリズム400の流れ図である。上述したように、図4を参照して説明する特定の実施態様は量子アニーリングアルゴリズムを含むが、タンパク質設計パイプライン200に他の量子アルゴリズムも適用可能である。
【0096】
図4及び図1を同時に参照すると、ブロック402において、量子コンピュータ104は、調整可能な位置のリストと共に、又はフラグの付いた位置におけるアミノ酸を変更するためにタンパク質構造上の位置にフラグが付いた状態で、初期タンパク質構造112を古典的コンピュータ102から受信し得る。量子コンピュータ104は、アミノ酸修飾のリスト、回転異性体ライブラリ、及びスコア付け関数を受信することもできる。
【0097】
ブロック404において、構造、位置、アミノ酸修飾、及び回転異性体ライブラリを使用して、探索空間を定義し得る。探索空間は、位置、アミノ酸修飾、及び回転異性体の種々の可能な組合せの、ベクトル空間又は他の適切な埋め込み等の表現であり得る。幾つかの実施形態では、探索空間は古典的コンピュータ102によって定義され、量子コンピュータ104に提供し得る。
【0098】
ブロック406において、スコア付け関数を使用して、目標ハミルトニアン134を定義し得る。一般に、スコア付け関数は、探索空間における任意の所与の点から、エネルギー状態を表し得る対応するスコアへのマッピングを提供する。ハミルトニアンも同様に、粒子の状態の所与の配置をエネルギー状態にマッチングする。スコア付け関数を所与として、目標ハミルトニアン134は、スコア付け関数が最大であるとき、ハミルトニアンが最高エネルギー状態であり、スコア付け関数が最小であるとき、最低エネルギー状態であるように構築し得る。場合によっては、所与のスコア付け関数の目標ハミルトニアン134は既知であり得、場合によっては、既存のハミルトニアンを変更する必要があり得、又は新たなハミルトニアンを決定する必要があり得る。選ばれる特定の目標ハミルトニアン134は、スコア付け関数及び最適化されている特性に依存し、したがって、目標ハミルトニアン134は事例毎に変わる。
【0099】
目標ハミルトニアン134に加えて、初期ハミルトニアン132を選ぶこともできる。初期ハミルトニアン132は、量子アルゴリズムが目標ハミルトニアン134にゆっくりと進化する開始ハミルトニアンである。そのために、既知の基底状態(即ち低エネルギー状態)を有する初期ハミルトニアン132が一般に選択され、初期ハミルトニアン132は、関わる量子ハードウェアを所与として、初期ハミルトニアン132の初期化が容易なように選択することもできる。ブロック408において、量子コンピュータ104は、初期ハミルトニアン132に従って量子ビット306~312の量子状態を初期化する。適した初期ハミルトニアン132は、全ての量子ビットが、全ての量子ビットに印加される大きな横方向X場と共整列するものであり得る。実施形態では、X場は、量子ビットに印加された場合、量子ビットを初期ハミルトニアン132の基底状態に初期化する方向に印加される磁場又は電場であり得る。特定の例では、適した初期ハミルトニアン132は、全ての量子ビットが0及び1の重ね合わせ状態に初期化されるものであり得る。
【0100】
ブロック10410において、量子コンピュータ104は初期ハミルトニアン132を目標ハミルトニアン134に進化させ得る。初期ハミルトニアン132の進化は、進化速度136に基づいてゆっくりと初期ハミルトニアン132を「オフ」に切り替え、目標ハミルトニアン134を「オン」にすることを含む。進化の目標は、基底状態から出ることなく初期ハミルトニアン132から目標ハミルトニアン134に移ることであるが、大半の場合、系は、システムノイズ及びランダウ-ツェナー遷移に起因して基底状態から出る。量子アニーリング手法では、散逸及び量子トンネリングは、系をより低いエネルギー状態、又は系が基底状態から出た場合には基底状態に戻すことに頼る。
【0101】
進化プロセス中、系の波動関数は、探索空間における異なる極小に及び、量子変動により、アルゴリズムはバリアを通ってトンネリングすることができ、それ故、より低いエネルギー状態に落ち着く。トンネリングの確率は、アニーリングハミルトニアンにおける横方向場の強度に依存する。横方向場(例えば電磁場)の強度は、トンネリングの確率を調整するように変更することができる。高トンネリング確率が可能なように設定される場合、アルゴリズムは、問題空間を更に遠くに移動する可能性がより高く、極小を越えてトンネリングする可能性がより高いが、所望の最小値から離れてトンネリングする可能性もあることを意味する。低トンネリング確率に向けて構成される場合、アルゴリズムは、問題空間をより短く移動し得、極小に落ち着く可能性が高く、これもまたアルゴリズムに最小値を逃させ得る。したがって、トンネリング確率は、問題ランドスケープ(即ち探索空間)の構成に応じて事例毎に設定し得る。
【0102】
初期ハミルトニアン132が目標ハミルトニアン134に進化した後、量子ビットの状態は最小値(即ち極小又は最小値)に落ち着くはずである。落ち着いた量子ビット状態は、スコア付け関数を最小化し、したがって、スコア付け関数によって包含される指定された特性についてタンパク質を最適化するように量子アルゴリズムによって決定されたタンパク質構成を表す探索空間内の位置を表す。したがって、ブロック412において、測定ユニット318は量子ビットの状態を測定し、ブロック414において、量子コンピュータ104は、古典的出力304の一部として、問題への答えとして探索空間内の対応する位置を返す。
【0103】
量子コンピュータを適用して探索をより効率的に実行することに加えて、人工知能/機械学習(AI/ML)を適用して、調整に選ばれた位置及び/又はアミノ酸修飾、追加、及び/又は削除、各位置で適用される回転異性体、異なるタンパク質構造及び/又は配列、及び結果として生成される最適化する特性114の変化間の関係を学習し得る。図5は、タンパク質設計を実行するためにAI/MLを適用するのに適したAI/ML環境500のブロック図である。本明細書に記載のように、AIアルゴリズム又は方法は、機械学習、深層学習、強化学習、又は別のAIアルゴリズム若しくはパラダイムの1つ又は複数を含み得る。
【0104】
AI/ML環境500は、AI/MLアルゴリズムを適用して、上記タンパク質パラメータ間の関係を学習する古典的又は量子計算デバイス等のAI/MLシステム502を含み得る。例えば、タンパク質パラメータ間の学習される関係は、タンパク質配列とタンパク質特性との間の関係、タンパク質構造とタンパク質特性との間の関係、タンパク質の変異とその結果として生成されるタンパク質特性との間の関係、及び/又は初期タンパク質配列、アミノ酸修飾、回転異性体、及びその結果として生成されるタンパク質特性間の関係を含み得る。
【0105】
AI/MLシステム502は、変異タンパク質が試験されるにつれて、実験装置108によって返される実験データ124を利用し得る。場合によっては、実験データ124は、データベース、ライブラリ、リポジトリ等からの予め存在する実験データを含み得る。実験データ124は、試験されたタンパク質の識別情報と、潜在的に、最適化する特性114の測定値を含むタンパク質の特性の測定値とを含み得る。実験データ124は、AI/MLシステム502を用いて収集(例えばAI/MLシステム502のストレージ508に記憶)されてもよく、AI/ML502からリモートであり、ネットワークインターフェース504を介してアクセスされてもよく、又はローカルデータとリモートデータとの組合せであってもよい。
【0106】
トレーニングデータ510は、実験装置から返された実験データ124を含み得、トレーニングデータ510は、ソフトウェアでタンパク質をモデリングしシミュレートすることにより学習されたデータ並びに配列-機能関係及び構造-機能関係についての情報を求めて科学文献及び学術文献を解析することにより学習されたデータによって補足し得る。
【0107】
上述したように、AI/MLシステム502はストレージ508を含み得、ストレージ508はハードドライブ、固体状態ストレージ、及び/又はランダムアクセスメモリを含み得る。ストレージはトレーニングデータ510を記憶し得、異なる試験結果を比較して、タンパク質の試験でどの位置及び/又はアミノ酸修飾が調整に選択されたか(即ち変更された位置512、置換513、挿入515、及び/又は削除519)、どの回転異性体がタンパク質の変更位置で使用されたか(即ち選択された回転異性体514)、及びタンパク質への変更/変異から生じた特性の測定値を識別し得る。一例では、特性の測定値は、特定516及び/又は安定性518、可溶性、発現性、生成されるタンパク質の活性を含み得るが、用途に応じて他の特性が測定されてもよい。
【0108】
トレーニングデータ510は、モデル524をトレーニングするために適用し得る。特定の用途に応じて、異なるタイプのモデル524が使用に適し得る。例えば、図示の例では、人工ニューラルネットワーク(ANN)が、関心のある特性について特定の値を生じさせるタンパク質構造、位置、アミノ酸置換、アミノ酸挿入、アミノ酸削除、及び回転異性体間の関連を学習するのに特によく適し得る。類似性及びメトリック距離学習もこの特定のタイプのタスクによく適し得るが、設計者の目標、利用可能なリソース(例えば古典的又は量子計算リソース)、利用可能な入力データ量等に応じて、異なるタイプのモデル524を使用してもよいことを当業者は認識しよう。
【0109】
任意の適したトレーニングアルゴリズム520を使用して、モデル524をトレーニングし得る。それにも関わらず、図5に示される例は、教師ありトレーニングアルゴリズム又は強化学習に特によく適し得る。教師ありトレーニングアルゴリズムでは、AI/MLシステム502は、変更された位置512、選択されたアミノ酸置換513、及び選択された回転異性体514をタンパク質構成として入力データにおいて適用し得、それに対して、その結果として生成されたタンパク質特性をマッピングして、入力データとタンパク質特性との間の関連を学習し得る。特性は、タンパク質構成のラベルとして使用し得る。強化学習シナリオでは、タンパク質構成は、モデル524によりリアルタイムで調整され、調整されたタンパク質の性能をシミュレートする別のモデルにより評価されてもよく、又はタンパク質構成は、タンパク質を合成して生成し、タンパク質の実験的検証を実行することにより評価されてもよい。AI/MLシステム502は、タンパク質特性の幾つか、全て、又は加重組合せを最大化しようとし得る。
【0110】
トレーニングアルゴリズム520はプロセッサ回路506を使用して適用し得、プロセッサ回路506は、ストレージ508内の論理及び構造に対して動作する適したハードウェア処理リソースを含み得る。トレーニングアルゴリズム520及び/又はトレーニングされたモデル524の作成は、少なくとも部分的にモデルハイパーパラメータ522に依存し得、例示的な実施形態では、モデルハイパーパラメータ522はハイパーパラメータ最適化論理530に基づいて自動的に選択し得、ハイパーパラメータ最適化論理530は、選択されたモデル524及び使用されるトレーニングアルゴリズム520に適する任意の既知のハイパーパラメータ最適化技法を含み得る。
【0111】
タンパク質についての新しい知識及びデータを収容し、実行された更なる実験からのデータを組み込むために、モデル524は時間の経過に伴って再トレーニングし得る。
【0112】
幾つかの実施形態では、トレーニングデータ510の幾つかを使用して、まず、モデル524をトレーニングし得、幾つかは検証サブセットとして保持し得る。検証サブセットを含まないトレーニングデータ510の部分は、モデル524のトレーニングに使用することができ、一方、検証サブセットは保持され、トレーニングされたモデル524を試験して、モデル524が新たなデータへの予測を一般化可能なことを確認し得る。
【0113】
モデル524がトレーニングされると、プロセッサ回路506により新たな入力データに適用し得る。新たな入力データは、現在のタンパク質設計問題(即ち最適化するタンパク質パラメータ、標的タンパク質、及び結合剤等)を含み得る。モデル524への新たな入力データは、トレーニングデータ510がモデル524に提供された方法をミラーリングした予め定義される入力データ構造526に従ってフォーマットし得る。入力データ構造526は、コードされる配列及び/又は構造情報を含み得る。モデル524は出力データ構造528を生成し得、出力データ構造528は、例えばタンパク質構造の予測、標的タンパク質特性に影響する可能性が最も高い位置、アミノ酸修飾、及び/又は回転異性体ライブラリ、又は変更すべきではないタンパク質特徴、及び/又はタンパク質の予測された特性、機能、又は特徴であり得る。
【0114】
出力データ構造528は、動作するタンパク質構造、位置、アミノ酸修飾、及び回転異性体ライブラリの推奨としてタンパク質設計パイプライン200に提供し得る。幾つかの実施形態では、出力データ構造528は、上述したように、それらの構造、位置、アミノ酸修飾、及び回転異性体ライブラリのスコア又はランクを提供し得る。
【0115】
上記説明は、入力/出力対を有する利用可能なトレーニングデータを所与として、教師あり学習技法を適用する特定の種類のAI/MLシステム502に関する。しかしながら、本発明は、特定のAI/MLパラダイムとの併用に限定されず、他のタイプのAI/ML技法を使用してもよい。例えば、幾つかの実施形態では、AI/MLシステム502は強化学習を適用し得、タンパク質設計パイプライン200においてタンパク質変更をユーザに推奨し、それらの変更がタンパク質特性にいかに影響するかを観測する。強化学習によって取得される情報から、AI/MLシステム502は、どの特性に影響を及ぼすためにどの変更を採用することができるかを定義するポリシー又は1組のルールを学習し得る。他のAI/ML技法、例えば進化アルゴリズムも、タンパク質設計パイプライン200との併用に企図される。
【0116】
上述したデバイスの構成要素及び特徴は、離散回路、特定用途向け集積回路(ASIC)、論理ゲート、及び/又はシングルチップアーキテクチャの任意の組合せを使用して実施し得る。さらに、デバイスの特徴は、マイクロコントローラ、プログラマブル論理アレイ及び/又はマイクロプロセッサ、又は適切な場合には上記の任意の組合せを使用して実施し得る。なお、ハードウェア要素、ファームウェア要素、及び/又はソフトウェア要素は本明細書では、集合的に又は個々に「論理」又は「回路」と呼ばれ得る。
【0117】
上述したブロック図で示される例示的なデバイスは、多くの潜在的な実施態様の1つの機能説明例を表し得ると理解される。したがって、添付図に示されるブロック機能の分割、省略、又は包含は、これらの機能を実施するハードウェア構成要素、回路、ソフトウェア、及び/又は要素が必ずしも実施形態において分割、省略、又は包含されることを暗示しない。
【0118】
少なくとも1つのコンピュータ可読記憶媒体は、実行されると、システムに、本明細書に記載される任意のコンピュータ実施方法を実行させる命令を含み得る。
【0119】
幾つかの実施形態は、「一実施形態」又は「実施形態」という表現をそれらの派生語と共に使用して説明されることがある。これらの用語は、実施形態と併せて説明された特定の特徴、構造、又は特性が少なくとも1つの実施形態に含まれることを意味する。本明細書の種々の箇所での「一実施形態において」という語句の出現は、必ずしも全てが同じ実施形態を指しているわけではない。さらに、別記される場合を除き、上記特徴は、任意の実施形態で一緒に使用可能であることが認識される。したがって、別個に考察された任意の特徴は、互いと適合しないと記される場合を除き、互いと組み合わせて採用し得る。
【0120】
本明細書で使用される表記及び用語を一般に参照すると、本明細書における詳細な説明は、コンピュータ又はコンピュータのネットワークで実行されるプログラム手順に関して提示し得る。これらの手順的説明及び表現は、仕事の本質を他の当業者に最も効率的に伝えるために当業者により使用される。
【0121】
手順は本明細書では及び一般に、所望の結果に繋がる自己矛盾のない一連の動作であると考えられる。これらの動作は、物理数量の物理的操作を必要とするものである。必ずしもそうである必要はないが、通常、これらの数量は、記憶、転送、結合、比較、及び他の方法での操作が可能な電気信号、磁気信号、又は光信号の形態をとる。時に、主に慣例を理由として、これらの信号をビット、qビット、量子ビット、値、要素、シンボル、文字、用語、数等と呼ぶことが時に便利なことが判明している。しかしながら、これらの用語及び同様の用語の全てが、適切な物理数量と関連付けられるべきであり、それらの数量に適用される単に好都合なラベルであることに留意されたい。
【0122】
さらに、実行される操作は多くの場合、一般に人間のオペレータによって実行される精神活動と一般に関連付けられる、加算又は比較等の用語で呼ばれる。人間のオペレータのそのような能力は、1つ又は複数の実施形態の一部をなす本明細書に記載される動作の何れでも必要ではなく、又は大半の場合で望ましくない。むしろ、動作は機械動作である。種々の実施形態の動作の実行に有用な機械は、汎用デジタルコンピュータ又は同様のデバイスを含む。
【0123】
幾つかの実施形態は、「結合された」及び「接続された」という表現をそれらの派生語と共に使用して説明されることがある。これらの用語は必ずしも、互いと同義として意図されるわけではない。例えば、幾つかの実施形態は、2つ以上の要素が互いと物理的に直接接触又は電気的に接触することを示すために、「接続された」及び/又は「結合された」という用語を使用して説明されることがある。しかしながら、「結合された」という用語は、2つ以上の要素が互いと直接接触せず、それでもなお互いと協働又は相互作用することを意味することもできる。
【0124】
種々の実施形態は、これらの動作を実行する装置又はシステムにも関する。この装置は、必要とされる目的に向けて特に構築されてもよく、又はコンピュータに記憶されたコンピュータプログラムにより選択的にアクティブ化若しくは再構成される汎用コンピュータを含んでもよい。本明細書に提示される手順は本質的に、特定のコンピュータ又は他の装置に関連しない。種々の汎用機械を本明細書の教示に従って書かれたプログラムと併用してもよく、又は必要とされる方法ステップを実行するようにより特化した装置を構築することが便利であることが判明することがある。多様なこれらの機械に求められる構造は、与えられる説明から明らかになる。
【0125】
読み手が技術開示の性質を迅速に突き止められるようにするために、開示の要約書が提供されることが強調される。要約書は、特許請求の範囲及びその意味を解釈又は限定するために使用されないという理解でもって提出される。加えて、上記詳細な説明では、開示を効率化するために、種々の特徴が1つの実施形態に一緒にまとめられることが分かる。開示のこの方法は、特許請求の範囲による実施形態が、各請求項で明記される特徴よりも多くの特徴を必要とすることの意図の反映として解釈されるべきではない。むしろ、以下の特許請求の範囲が反映するように、本発明の趣旨は、単一の開示される実施形態の全て未満の特徴にある。したがって、以下の特許請求の範囲はこれにより詳細な説明に組み込まれ、各請求項は別個の実施形態として自立する。添付の特許請求の範囲において、「含む(including)」及び「であって(in which)」という用語は、「含む(comprising)」及び「において(wherein)」という各用語の平易な英語均等物としてそれぞれ使用される。さらに、「第1の」、「第2の」、「第3の」等の用語は、単なるラベルとして使用され、数値要件をそれらの物体に課すことを意図しない。
【0126】
上記は、開示されるアーキテクチャの例を含む。当然ながら、構成要素及び/又は方法論の考えられるあらゆる組合せを記載することは可能ではなく、多くの更なる組合せ置換が可能なことを当業者は認識し得る。したがって、新規のアーキテクチャは、添付の特許請求の範囲の趣旨及び範囲内にある全てのそのような代替、変更、及び変形を包含することが意図される。
図1
図2
図3
図4
図5
【国際調査報告】