【実施例】
【0032】
DNA相互作用特異性のモジュラーおよび予測可能な性質は分子生物学操作とDNAナノテクノロジーにとって主要であるが、本来匹敵するものがなく、類似のプログラム可能な特異性をタンパク質で達成する方法は明らかでなかった。DNA塩基より多くの極性アミノ酸が存在し、それぞれは、異なる主鎖に関連して多数の側鎖立体構造をとることができ、無数のネットワークの可能性を可能にしている。本発明者らは、一般的な計算方法を開発した。HBNet(商標)は、入力主鎖構造(
図1A)において可能なすべての側鎖水素結合ネットワークを迅速に列挙するために開発された。
【0033】
計算効率のために全システムエネルギーが残基対間の相互作用の総和として一般に表され、したがって切断された水素結合のセットから結合された水素結合ネットワークを明確に区別することができないために、従来のタンパク質設計アルゴリズムは本目的に十分に適していない。HBNet(商標)は、極性側鎖のすべての対のすべての立体構造(回転異性体の状態)間の水素結合および立体反発相互作用を事前計算することから開始する。
これらのエネルギーは、ノードが残基位置であり、三次元空間において近い位置がエッジによって接続され、および各エッジについて2つの位置で異なる回転異性体の状態間の相互作用エネルギーを表すマトリクスがあるグラフデータ構造に保存される。次いで、HBNet(商標)はこのグラフをトラバースして、ほとんど立体反発を含まない低エネルギー水素結合によって接続された3つ以上の残基のすべてのネットワークを特定する(
図1B)。最も広範囲で最低エネルギーネットワーク(
図1C)は、残りの残基位置で以降の設計計算で一定に保たれる。水素結合を形成しない埋没したドナーおよびアクセプターを含むネットワーク(満たされてない)は、拒絶される(
図1D)。本方法ならびに設計計算を実施するためのスクリプトの詳細を本明細書に記載する。
【0034】
DNA二重ヘリックスの影響を受けて、ネットワークが同じ足場内で再利用されることを可能にするために、固有の繰り返し構造を有するタンパク質オリゴマーにおいて水素結合ネットワークのホストをつとめることを試みた。自然において豊富であり、多くのタンパク質設計研究の対象であり、パラメータ的に生成されることができるコイルドコイルに注目し、幾何学的な断面の繰り返しをもたらした。自然なコイルドコイおよび設計されたコイルドコイルにおいて、埋没した極性相互作用も特異性を変えることができるが、しかしこれらのケースのほとんどは、残りの極性原子が水またはイオンによって満たされた多くても1または2つの側鎖−側鎖水素結合を含み、標準的なコイルドコイルの比較的小さい断面の界面領域は可能なネットワークの多様性および位置を限定する。これらの限定を克服するために、ヘリックスの2つの同心環を有するオリゴマー構造に焦点を置いた(
図1E)。
【0035】
「二環」トポロジーは、Crickのコイルドコイルパラメタリゼーションの一般化を用いて、短いループで接続された内側ヘリックスおよび外側ヘリックスを含むらヘリカルヘアピン単量体サブユニットから構築した。広範囲の主鎖は、内側ヘリックスおよび外側ヘリックスの半径とヘリカル相、内側ヘリックスおよび外側ヘリックスの間のz−オフセット、および全体的なスーパーコイルねじれを系統的にサンプリングすることによって生成した(
図1E)。次いで、HBNet(商標)を使用して、分子間界面に広がり、重原子ドナーおよびアクセプターがすべて満たされ、および少なくとも3つの側鎖を有する、ネットワークのこれらの主鎖を探索した(
図1F、これらの厳しい要件のために、ごくわずかな主鎖だけがそのようなネットワークを支持することができるが、二環構造の自由度を系統的に変えることによって、何万もの主鎖を作成することが可能であり、HBNet(商標)の効率により、多数の主鎖からネットワークの探索が計算的に容易になる)。次いで、RosettaDesign(商標)を使用して、オリゴマーの周期対称と関連して残りの残基位置での回転異性体を最適化した(
図1G)。Rosetta(商標)を使用して、設計を、総オリゴマーエネルギーに基づいて、全原子力場、ネットワーク周辺に大きな空洞または不完全なパッキングを有する設計を除去するためのフィルタリングの順に並べた。上位にランクする設計をRosetta(商標)「フォールド・アンド・ドック」計算を使用して評価した。設計された標的構造に通じる漏斗様の形をしたエネルギー地形を有する設計を特定し、広範なスーパーヘリックスパラメータと水素結合ネットワークにわたる計114の二量体、三量体、および四量体の設計物を実験的特性評価のために選択した。
【0036】
選択した設計をコードする合成遺伝子を得て、タンパク質を大腸菌(Escherichia coli)において発現させた。発現し、可溶性だった設計物の約90%(101/114)を親和性クロマトグラフィーで精製し、次いでそれらのオリゴマー化状態をサイズ排除クロマトグラフィー多角度光散乱法(SEC−MALS)で評価した。101のうちの66が、設計されたオリゴマー化状態を有することがわかった。101の可溶性設計物は8種の異なるトポロジーにわたり、これらのうちスーパーコイル四量体は最大の埋没した界面領域を有し、埋没したドナーおよびアクセプターがすべて満たされた最少の設計物をもたらし、成功率が最低(13の可溶性設計物のうちわずか3が適切に集合した)であった。スーパーコイル四量体を除いて、72〜〜(63/88)は設計されたオリゴマー状態に集合し、これらのうち89%(56/63)がSECカラムから単一ピークとして溶出された。設計されたタンパク質はさらに、円偏光二色性(CD)分光法によって特徴が明らかにされ、試験したすべての設計物は、特徴的なα−ヘリックススペクトルを示し、アンフォールディング実験をモニターしたCDは、これらの90%超が95℃で安定していたことを示した(
図2)。試験したペプチドとしては、以下が挙げられる:
AXAX
TRTRSLREQEEIIRELERSLREQEELLRELERLQREGSSDEDVRELLREIKKLAREQKYLVEELKKLAREQKRQD(配列番号2);
XAAX
TRTEIIRELERSLREQERSLREQEELLRELERLQREGSSDEDVRELLREIKKLAREQKKLAREQKYLVEELKRQD(配列番号3);
XAXA
TRTEIIRELERSLREQEELAKRLKRSLREQERLQREGSSDEDVRKLAREQKELVEEIEKLAREQKYLVEELKRQD(配列番号4);および
XXAA
TRTEIIRELEELAKRLKRSLREQERSLREQERLQREGSSDEDVRKLAREQKKLAREQKELVEEIEYLVEELKRQD(配列番号5)
【0037】
ポリペプチド命名法:以下に示すポリペプチドの名称はオリゴマー化状態およびトポロジーを示し、以下の配列はトポロジーおよびオリゴマー化状態によって構成されている。最初の2つの文字は、スーパーコイル幾何学的形状を示し、「2L」は、左巻きのスーパーコイルをもたらす2層アミノ酸反復を指し、「3L」は、右巻きのスーパーコイルによる3層11残基繰り返しを指し、および「5L」は、5層18残基繰り返しおよび直線状のヘリックス(スーパーコイリングがない)によるねじれのない設計を指し、これに関連して「層」とは、スーパーコイル軸に沿って、独特の繰り返し幾何学的スライス(複数可)、もしくは複数の層の数である。中央の2文字はヘリックスの総数を示し、最後の2文字は対称性を示す。したがって、「2L6HC3」は、C3が対称の左巻き、6ヘリックス三量体を示す。下線部の残基は任意選択である。
【表2-1】
【表2-2】
【表2-3】
【表2-4】
【表2-5】
【表2-6】
【表2-7】
【表2-8】
【表2-9】
【表2-10】
【0038】
ヘリックスの外側の環のエネルギー的寄与を探索するために、ニ環設計の安定性を、内側環だけを有する対応する設計と比較し、水素結合ネットワーク残基を含む内側ヘリックスのコア界面位置を保持し、溶媒露出面の位置を二環設計の表面と同じ方法で再設計した。2L4HC2_9(
図2C)、スーパーコイルホモ二量体は折り畳まれており、熱安定性であり(
図2D);その内側ヘリックスペプチド、2L4HC2_9内側(
図2E)もホモダイマーコイルドコイルを形成するが、熱安定性は著しく低下している(
図2F)。2L6HC3_13(
図2G)、スーパーコイルホモ三量体も、折り畳まれて、熱安定性である(
図2H)が、しかし、単離して対応する内側の環ペプチド(
図2I)は、折り畳まれてなく(
図2J)かつ単量体である。この内側ヘリックスの配列は、正規のαまたはdヘプタッドのパッキング位置に4つのAsn残基を有し、ここでAsnが不安定であり、ならびに他のα位置およびd位置がそれぞれLeuとIleであるので、注目すべきである。これはホモ四量体を支持することが判明している。外側のヘリックスおよび設計された水素結合ネットワークの存在下で、二環設計物をx線結晶構造解析によって解明されるような意図される三量体構造に集合する(
図3A)。合わせて、これらの結果は、ヘリックス傾向が低く、非標準のヘリックスパッキングを有する内側ヘリックスに関連しても、ヘリックスの外側の環が熱安定性を増加させるだけでなく、コイルドコイルアセンブリを引き起こすことができ、より広い界面にわたりより大きな配列多様性を可能にすることを示唆する。
【0039】
構造特性解析
設計の正確性を評価するために、10の結晶構造をオリゴマー化状態の範囲、スーパーヘリックスパラメータ、および水素結合ネットワークにわたって判定した(
図3A〜F)。結晶が得られなかった設計は、小角X線散乱(SAXS)によって特性を明らかにした(
図4)。3つの左巻き三量体、4つの左巻き二量体、1つの左巻き四量体、およびねじれのない三角形三量体の構造を解析した。SAXSによって特性を明らかにされたさらなるトッポロジーとしては、ねじれのない正方形四量体(
図4A)および二量体(
図4B)ならびに平行右巻き(
図4C)または逆平行左巻き(
図4D)のいずれかのスーパーコイル幾何学形状を有する6ヘリックス二量体(2内側ヘリックス、1外側ヘリックス)が挙げられる。X線結晶構造解析で検証した5つの設計(
図3A、C〜F)もSAXSによって特性を明らかにし、次いで実験で決定したスペクトルが設計モデルから計算したスペクトルとほぼ一致することが明らかになり、極めて類似する構造が解に読み込まれることを示唆する。
【0040】
3つの左巻き三量体構造(2L6HC3_6、2L6HC3_12および2L6HC3_13)は、水素結合ネットワークのすべての主鎖Cα原子およびすべての重原子にわたり、サブオングストロームRMSDを有する設計モデルに非常に類似している(
図3A〜B)。これらの構造は、内側ヘリックスに対して0°、120°および240°、および外側ヘリックスに対して60°、180°、および300°のスーパーコイル相で構築され、ループは、外側N末端ヘリックスを内側C末端ヘリックス(外側ヘリックスから−60°で)に接続する。広範囲の9残基または12残基ネットワークは予定の水素結合を結晶構造で形成する(
図3、AおよびBの中央)。3つの埋没したアスパラギンが実質的に熱安定性の低下をもたらしたこれまでに設計された単環の三量体とは異なり、これらの二環三量体は95℃、および多数の埋没した極性残基を有する塩化グアニジニウム約4.5Mまで安定しており、2L6HC3_13は12の完全に埋没したアスパラギンを有し、2L6HC3_6は界面の小領域に限定され、6のアスパラギンと6のグルタミンとを含む24の埋もれた極性残基を有する。
【0041】
4つの左巻き二量体結晶構造(2L4HC2_9、2L4HC2_23、2L4HC2_11、および2L4HC2_24)はすべて、設計された平行二環トポロジーを有する。2つの二量体構造は、設計にほぼ一致する水素結合ネットワークを有し、2L4HC2_9(
図3D)および2L4HC2_23(
図3E)は、すべてのネットワーク残基重原子にわたり、それぞれ、0.39Åと0.92ÅのRMSDを有し、すべてのCα原子にわたり0.39Åと1.16ÅのRMSDを有する。他の2つ、2L4HC2_11と2L4HC2_24は、設計されたネットワーク側鎖を置換する水によって起こる、設計モデルからの多少の構造的偏差を有し、前者において、2つのネットワーク残基を架橋する埋没した水分子によって界面が約2Å移行し、後者において、主鎖は設計モデルとほぼ同一であるが、設計されたネットワークの側鎖は規則的な水分子に置換されている。これらの2つの例は、ネットワークの高い結合性および満足度(すべての極性原子が水素結合に関与する)の必要性を強調する。左巻き四量体構造は、設計された全体的なトポロジー(
図3C)を有し、SAXSデータは設計モデルにほぼ一致しているが、側鎖密度は低(3.8Å)解像度のために不確かであった。アミノ酸配列は、いかなる既知の配列にも無関係であり、Protein Data Bank(PDB)の構造ベースの検索でのトップヒットは、全く異なったヘリックスバンドル構造を有する。
【0042】
5つの逆平行6ヘリックス二量体(2L6Hanti_1−5)は可溶性であり、設計モデルと一致するSAXSデータを用いて、設計されたオリゴマー状態に集合した。設計2L6Hanti_3は、二量体界面に埋没したTyrを有する水素結合ネットワークを含有する(
図4D)。SAXSによって特性を明らかにされた3つの右巻き6ヘリックス二量体のうち、3L6HC2_4(
図4C)および3L6HC2_7は、設計モデルと一致した散乱を示したが、3L6HC2_2は示さなかった。3L6HC2_2は平行二量体を形成するように設計されたが、その結晶構造は、逆平行二量体界面を明らかにし、2つの設計の知識に光を当てた。第1の知識は、結合界面での分子間水素結合の重要性(2L6HC3_6の9と比較して3L6HC2_2の設計モデルは界面にわたりわずかに2つを有する(
図3B))、および第2の知識は、ネットワークを補完する有益な疎水性接触の重要性(3L6HC2_2設計モデルは界面に主としてアラニンを有する)。
【0043】
SAXSデータは、ねじれのない二量体、三量体および四量体の設計が目標の三角形立体構造および正方形立体構造に集合することを示唆する(
図4A〜B)。ギニエ解析および散乱ベクトルの低q領域の適合は、試験した7のねじれのない二量体が適切なオリゴマー状態にあり、そのうちの4は実験スペクトルと、設計モデルとの間に極めて近い一致があることを示している(
図4B)。3つのねじれのない四量体(5L8HC4_1、5L8HC4_2、および5L8HC4_6)に関するSAXSデータは、すべて対応する設計モデルとほぼ一致した。5L8HC4_6は、ネットワークの一端で埋没した水素結合を形成し、次いで溶媒に向かって外側に増殖し、表面のGluに結合する、Trpを含む特徴的なネットワークを有する(
図4A)。そのような均一な直線状のヘリックスを有するオリゴマーは本来存在せず、またはこれらのトポロジーはこれまでに設計されなかったと考えられる。
【0044】
2.36Åのねじれのない三量体(5L6HC3_1)の結晶構造は、すべてのCα原子にわたる設計モデルに対して、0.51ÅのRMSDを含む直線状のヘリックスを明らかにした(
図3F)。2つの水素結合ネットワーク(
図3F中央)、ならびにネットワーク周囲の疎水性パッキング残基(
図3F右)は、すべてのネットワーク重原子にわたり、結晶構造と、設計モデルとの間が、0.41Åと、0.48ÅのRMSDとでほぼ同一である。スーパーコイル三量体のように、これらのネットワークの各々は、各ヘリックスからの側鎖を含有し、ヘリックスが均一で対称的な等距離になるように構築された。ヘリックスは、結晶構造においてほぼ完全に直線状であり、スーパーコイルねじれ値は、ゼロの理想的な設計値:3本の内側ヘリックスに対してはω
0=−0.036°/残基および3本の外側ヘリックスに対してはω
0=−0.137°/残基に極めて近い。アミノ酸配列によるBlast検索は、10より良いE値で検索されたマッチはなく、PDB中の類似する構造の検索でヒットした上位には、長くのびた領域と隣接している3本のスーパーコイルヘリックスがある。
【0045】
成功対不成功のネットワーク設計の比較
いくつかの傾向は、成功した設計に目立って現れた。最初に、成功した設計では、ほとんどすべての埋没した極性基は、水素結合を形成した。すべての重原子ドナーおよびアクセプターが満たされた設計を選択したが、ネットワークは、満たされてない極性水素の数が変化した。全体的に満たされた極性基の最大の割合を有するネットワークは、水素結合の総数およびネットワークに寄与する側鎖の数の両方に関して結合性が比較的高い。最も高い結合性と構造の正確性とを有するネットワークは、断面界面全体にわたり、各ヘリックスは少なくとも1本の側鎖に寄与する(
図3A、3B、3E、3F)。設計2L6HC3_13にはさらに、2つの水素結合を形成するが、満たされてない極性水素を1つ有する単一対称Asnを含む2つの小さなネットワークもあり、結晶構造において、これらの残基は設計モデルから移動し、水分子に置換される。
【0046】
設計された水素結合ネットワークは、特異性を付与する
目標オリゴマー状態への特異性を付与する際の設計された水素結合ネットワークの役割を調べるために、HBNet(商標)なしで同じタンパク質骨格を用いて、対照設計計算を行い、疎水性界面を均一に得た。設計されたオリゴマー状態において総エネルギーが低いにもかかわらず、インシリコで、これらの設計はfold−and−dock計算および非対称ドッキング計算においてより明白な代替エネルギー最小値を示し、非極性パッキング相互作用の制限がはるかに少ない幾何学的形状と整合する。実験的に、これらの疎水性設計は、水素結合ネットワークを有するそれらの対応物よりも可溶性が少ない発現を示し、精製中、沈殿する傾向があった。SEC−MALSデータを収集するのに十分長く溶液中に残存したもののうち1つを除いてすべて、高分子量の凝集体を形成し、SECカラムから複数のピークとして溶出した。これらの結果は、設計された水素結合ネットワークが目標オリゴマー状態へ特性を付与し、および純粋に疎水性パッキングで観察された別の状態の縮重を解決する(この縮重は、従来の単環コイルドコイルよりも本明細書に記載の二環構造に対してかなり明白である。従来の単環コイルドコイルは、多くの残基の総疎水性が少なく、ヘリックス間界面領域が少ない)。
【0047】
in vivoで酵母ツーハイブリッドアッセイを用いて、さらに設計オリゴマーの相互作用特異性を探索した。ある範囲の二量体、三量体および四量体をコードする配列をオールバイオール結合アッセイで互いに交差させ(
図5)、設計されたタンパク質相互作用の結合が細胞増殖にとって必要なので、設計のための合成遺伝子を別々のベクター中でDNA結合ドメインおよび転写活性化ドメインの両方とともにインフレームでクローン化した。
水素結合ネットワークが疎水性界面領域を比較的小さい領域に分割する設計は、ヘリックス界面に大きな隣接する複数の疎水性パッチを含む設計よりもかなり特異的である(
図5AおよびB)。疎水性領域を最善に分割された設計は、ネットワークがオリゴマー界面全体にわたっており、各ヘリックスは少なくとも1つの側鎖に関与していた。この統一的な設計原理は、HBNet(商標)を使用して、容易に実施することができる。
【0048】
ネットワークの規則的配列構造がモジュラー、プログラム可能な方法で特異性を付与することができるかどうか試験するために、さらなる一連の三量体を設計した。各三量体は主鎖と疎水性パッキングモチーフを有し、唯一の違いは水素結合ネットワークの配置と構成であった。この設計は、2L6HC3_13(
図3A)および2L6HC3_6(
図3B)に基づいており、これらは同じスーパーヘリックスパラメータに由来したが、それぞれ「A」および「B」と呼ばれる固有のネットワークを有し、非極性残基のみを有する断面は「X」と表示される。この3文字表記を用いて、組合せ方法で新しい設計を生成し、スーパーコイルの4つの断面の繰り返し(
図5C)の各々で、A、BまたはX(
図4D)のいずれかを配置し、その後に以前と同じ設計戦略および選択プロセスが続いた。これらの組合せの設計のうち6つを合成し、5/6が折り畳まれ、熱安定性であり、in vitroで設計された三量体オリゴマー化状態に組み立てられることが判明した。2つの親設計(2L6HC3_13=AAXXと2L6HC3_6=XXBB)およびすべての疎水性対照(XXXX)とともに、これらの5つの設計は、オールバイオール酵母ツーハイブリッド結合実験で交差した(
図5E)。組合せ設計は、すべてが同じ主鎖および高い配列全体の類似性を有するとすると、著しい特異性のレベルを示すのに対して、疎水性対照は比較的乱雑であり、中心的な水素結合ネットワークは、特異性を媒介することに明らかに関与している。
【0049】
以前の新規タンパク質設計の試みは、新しい構造および相互作用を設計するためのジグソーパズル様疎水性コアパッキングに焦点を合わせた。高度に結合され、満たされた水素結合ネットワークを設計する多体問題とは異なり、疎水性パッキングは確立されたペアワイズの分解電位によって容易に捕捉され、したがって、大部分のタンパク質界面設計は主に疎水性であり、界面にわたり埋没した水素結合を設計する試みは常に失敗してきた。極性界面は特殊な例で設計されたが、一般化することが困難であり、多く界面設計の試みは、極性接点を最適化し、所望の特異性を達成するための指向進化を必要とした。HBNet(商標)は、水素結合ネットワークを正確に設計するための一般的な計算方法を提供する。埋没した満たされてない極性原子なしで、極性接点を正確に事前に構築するこの能力は、酵素設計、小分子結合、および極性タンパク質界面ターゲティングなどのタンパク質設計の課題において広範に有用であろう。
【0050】
二環構造は、Watson−Crickの塩基対形成のそれに類似したプログラム可能な相互作用特異性の可能性を有する新しい種類のタンパク質オリゴマーである。一方、Watson−Crickの塩基対形成は主に逆平行二重ヘリックスに限定されており、設計したタンパク質水素結合ネットワークは、ある範囲のオリゴマー化状態(二量体、三量体、四量体)およびスーパーコイル幾何学的形状を有する二環構造の特定が可能である。水素結合ネットワークを可能にするためにヘリックスの外側環を加えることで、広範囲にわたるヘテロオリゴマーおよびホモオリゴマーの特異性を有するコイルドコイルの設計性を示す、Keating、Woolfsonその他から洗練された研究に広がっている。設計モデルおよび結晶構造は、広範な水素結合ネットワーク構成および幾何学的形状が二環トポロジーの繰り返しで可能であり、熱安定性を犠牲にすることなく複数のネットワークを様々な位置で同じ主鎖に設計することでき、均一な形状だが直交結合界面を有する安定した構成要素を可能にすることを示す(
図5)。DNAナノテクノロジー分野では、比較的限られた一連の水素結合相互作用から、壮大な配列の形状および相互作用を構築できることが実証された。これで、両ポリマーの利点、すなわちDNA様プログラム可能性と調整可能な特異性、幾何学的形状可変との関連、相互作用の多様性、およびタンパク質に固有の触媒機能、を有する新しいタンパク質系材料を開発することが可能になろう。
【0051】
計算手法
水素結合ネットワーク方法(HBNet(商標))に基づくタンパク質設計に関連した計算手法を以下に詳述する。HBNet(商標)方法は、3ステップを含むことができる。第1のステップとして、徹底的であるが、効果的な探索は、所定の探索空間(特定の主鎖立体構造と見なされるすべてのアミノ酸の種類のすべての可能な側鎖回転異性体からなる)内で可能な水素結合ネットワークを特定する。第2のステップとして、Rosetta(商標)エネルギー関数、満足度(すべての埋もれた極性原子が水素結合に関与する)、およびユーザ定義の選択肢に基づいてネットワークをスコア化し、ランクを付ける。次いで、第3のステップとして、最良のネットワーク、または最良のネットワークの組合せを設計足場上に繰り返し配置し、足場内の残りの位置についてネットワーク周辺を設計し、回転異性体を最適化するためのいずれの以降のRosetta(商標)方法のための「シード」として役立つ制約とともに相対的な位置に保持する。
【0052】
ステップ1.所定の探索空間(
図1A〜B)においてすべての可能性がある水素結合ネットワークを特定するための徹底的な探索。
HBNet(商標)はRosetta(商標)の相互作用グラフ(IG)データ構造を利用し、最初に側鎖水素結合およびレナード−ジョーンズ(立体反発)エネルギー項だけでそれにデータを読み込む。グラフのノードは、すべての指示できる残基またはパック可能な残基の残基位置であり、エッジは、それらの残基間の推定上の相互作用を表し、相互作用する回転異性体のすべての対(すべてのアミノ酸の種類が考えられる)の間の二体エネルギーを保存するスパース行列を示している。水素結合と反発エネルギーを使用するだけで、好ましい(低エネルギー)水素結合幾何学的形状を有し、および立体的衝突がない、すべての回転異性体対の即時検索が可能になる。一部の実施形態において、モンテカルロまたは類似のランダム化方法を用いて、この回転異性体相互作用空間を探索することができる。
【0053】
別の実施形態において、回転異性体相互作用空間全体を探索することができる。回転異性体相互作用空間全体を通しての探索は、相互作用グラフの再帰的深さ優先探索または再帰的幅優先探索を用い、すべての適合する非衝突結合性の水素結合側鎖回転異性体を列挙して、行うことができる。探索はグラフのノードをばかりでなく、各エッジが指す行列も横断する(各ノード当たり複数の回転異性体、および各エッジに対して複数対の回転異性体)ので、このグラフのグラフ横断アルゴリズムの実行は、ネットワークの連結ノード(残基位置)を考慮することができ、ならびに各ノードでの特定の回転異性体の原子間の水素結合を考慮する。この後者の水素結合基準はこのグラフ横断アルゴリズムについての追加のステップと動作を必要とする。
【0054】
新しい水素結合回転異性体が考慮されるたびに、グラフ横断アルゴリズムは、そのネットワーク内のいずれの既存の回転異性体とも確実に衝突しないように回転異性体を確認することができる。それが受け入れられる場合、再帰的呼び出しはこの回転異性体で行われる。これらの再帰呼び出しは、停止状態に達する、すなわちさらなる水素結合相互作用が見つからない、またはネットワークが最初の開始残基の1つに戻って連結する、のいずれか、まで継続する。
【0055】
AsnおよびGlnなどの一部の極性アミノ酸は3つ以上の水素結合を形成することができ、水素結合ネットワークの分岐点となり、深さ優先探索はこれらの分岐アミノ酸を見逃す。これを説明すると、ルックバック機能は、1または複数の同一の回転異性体を共有するネットワークを特定し、衝突または対立する残基を調べた後、それらを完全なネットワークにマージする。冗長なネットワークを除去する。
【0056】
HBNet(商標)、(「HBNetStapleInterface(商標)」)の一例を書き込んだ。グラフ横断は分子間界面の残基位置で開始される。HBNet(商標)のこの実行により、2つの利点が提供される:第1に、界面位置のみで横断を開始することにより、検索空間が縮小され、実行時間の速度が上がる。第2に、界面でネットワークだけを確実に見つける。これは本研究における手法の目標であり、各ネットワークにおいて少なくとも2つの残基が異なるポリペプチド鎖に由来することを必要とすることで、ネットワークが分子間界面にわたることを確実にする。各開始残基について、HBNetStapleInterface(商標)は各エッジを繰り返し、各エッジで、ネットワークは、閾値(デフォルト=−0.75)よりも低い相互作用エネルギーで、回転異性体対のために開始される。相互作用エネルギーが水素結合および反発寄与だけからなっているので、正エネルギーは衝突を示し、負エネルギーは水素結合を示し、閾値を設定することで、好ましい(低エネルギー)幾何学的形状を有する水素結合と、より速い計算実行時間との両方の選択が可能になる。複数の再帰的ステップのために、実行時間は水素結合回転異性体対の数に依存して指数関数的(閾値がそれほど厳格に設定されないと、上昇する)である。
水素結合回転異性体対の総数は、入力構造の間で大きく異なり、事前に算出されることができないが、広範囲の実験的テストを介して、閾値は−0.65〜0.85の範囲で見いだされ、好ましい水素結合がもたらされ、および所定の入力構造について多数の可能なネットワークの下流設計を含む完全な設計の実行のために約0.2〜10分のオーダーで実行する。
【0057】
ステップ2.すべての水素結合のスコアとランク付け。
一旦すべての可能性があるネットワークが特定されると、特定されたネットワークはスコア化され、「最良の」ネットワークを決定するためにランクを付けられる。ネットワークごとに、埋没した極性原子は溶媒接触可能表面積(SASA)が特定され、埋没した重原子ドナーまたはアクセプターを有するが、水素結合を形成しない(満たされてない)ネットワークは除去される。次いで、残りのネットワークは、満たされてない極性水素の最小数に基づいて、ランクを付けられる。次いでネットワークは、バックグラウンド参照構造と関連して、互いにスコア化され、足場におけるすべての指示できる位置またはパック可能な位置は、ポリアラニン、足場上に配置されたネットワーク回転異性体に変異され、次いでネットワークは完全なRosetta(商標)エネルギー関数(talaris2013)でスコア化される。
【0058】
ステップ1の間、側鎖−主鎖水素結合は、主鎖が固定されているので(どんな所定の回転異性体に対しても側鎖−主鎖水素結合の数は一定である)、明示的に考慮されない。ステップ2の間、ネットワークが参照構造上に配置されるとき、側鎖−主鎖水素結合はスコア化され、したがって、満足度のために評価(埋没した極性原子のどれくらいが、水素結合に関与するか)に含まれる。したがって、それらが明示的に検索されなくても、HBNet(商標)は側鎖−主鎖水素結合を含むネットワークを捕える。主鎖極性原子へのさらなる水素結合を有するネットワークは一般に、結合性および満足度が改善されているという点で主鎖への水素結合がない類似したネットワークよりもよくスコア化する。
【0059】
ステップ3.最良スコアの水素結合ネットークそれぞれについて設計を行う。
ステップ2でランク付けした最良ネットワークを、入力足場上に繰り返し配置し、RosettaScripts(商標)へ、およびユーサーが定義した残りの残基位置の設計のために戻す。原子対制約は、ネットワークで水素結合を形成する各原子対に対して自動的にオンになる。これらの制約は、下流設計の間、ネットワーク残基が確実に相対位置に固定されることを確実にするように実行される設計の残部にわたって追跡される。HBNet(商標)も、以降のRosetta設計実行において同じ制約を指定するのに使用することができるRosetta(商標)制約(.cst)ファイルを出力する。
【0060】
Rosetta(商標)命名においてこれらの原子対「制約」は、制約が破られる場合(すなわち、水素結合が壊れている場合)回転異性体が移動可能であり、およびエネルギーペナルティが適用されるという点で実際に「拘束」である。 ネットワーク原子の座標を単に固定することとは対照的に、この手法はネットワーク回転異性体の小さい動きを可能にし、ネットワーク周辺にさらなる回転異性体をパッキングするためのより多くの解決策を可能にする。ネットワーク周辺のそのタイトパッキング、ならびにすべての埋没した重原子ドナーおよびアクセプターの満足度が明らかになった傾向は、設計の成功にとって最高であり、ネットワーク周辺の水素結合幾何学的形状は理想的だが、パッキングが不十分であり、および/またはドナー/アクセプターが満たされてないよりも、並みの水素結合幾何学形状を有するネットワークにおいてすべての極性原子を満たす水素結合を有することがより重要である。
【0061】
同じ界面で複数のネットワークを組み合わせることも考えられ、ユーザは指定することができる。1つの入力構造が1つの出力構造をもたらす(配列設計および組合せ側鎖の最適化によって判明した最低エネルギー解)典型的なRosetta(商標)設計とは異なり、この手法は、各入力構造について出力される数百もの設計の可能性を可能にする。
【0062】
探索空間を定義する(アミノ酸型および側鎖回転異性体がネットワーク検索中に許可される)
HBNet(商標)は所定の探索空間内でネットワークを探索するだけである(すべての可能なアミノ酸型のすべての可能な回転異性体が所定の入力主鎖のために考慮される)。これはユーザが定義することができる。HBNet(商標)は、RosettaScripts(商標)フレームワーク内ので「ムーバー」として機能し、「タスクオペレーション」を渡され、どの残基位置が固定される、パックできる(アミノ酸型は固定されるが、側鎖立体構造は固定されない)、および指示できる、すなわち指示できる位置について、タスクオペレーションもどのアミノ酸型が各位置で許可されるかを指定できる。どのようなタスクオペレーションがない場合でもデフォルト設定は、すべての残基が設計のために考慮され、すべての極性アミノ酸がネットワーク検索において考慮されることである。
【0063】
足場においてすべての位置は、指示できるように設定することがありえ、HBNet(商標)の場合、埋没位置(溶媒接触可能表面積(SASS)に基づいて定義される)はどのような非荷電極性アミノ酸であっても可能であり、溶媒露出位置はどのような極性アミノ酸であっても可能である。
【0064】
計算設計
同じ軸の周りの2つ以上のヘリックススーパーコイルのパラメータを独立して変えるために、Crickコイルドコイル・パラメータの一般化を使用し、前述のようにパラメータを定めた。各単量体サブユニットは、少なくとも1つの内側ヘリックスおよび外側ヘリックスを有する(
図1D)。第1の内側ヘリックスのスーパーコイル相(Δω
0 in)および第1の内側ヘリックスのz−オフセットを0に固定して、相対基準点として用い、
すべての他のパラメータは、スーパーコイルねじれ(ω
0)およびヘリックスねじれ(ω
1)を除いて内側ヘリックスと外側ヘリックスとの間で独立して変化した。これらの2つのパラメータを結合して、巻き方を決定するので、理想的な値をω
0とともにω
1のために用い、ω
1は大多数の設計で内側ヘリックスと外側ヘリックスとの間で一定に保持されている。左巻きスーパーコイルは、ω0<0およびω1=102.85から生じ、右巻きスーパーコイルはω
0>0およびω
1=98.18から生じ、直線状の束(スーパーコイル形状でない)はω0=0およびω1=100から生じる。2つの内側ヘリックスと1つの外側ヘリックスを有する、平行した6ヘリックス二量体設計(3L6HC2)の場合、外側ヘリックスのω0を内側ヘリックスのそれから偏向することができたが、右巻きスーパーコイルを維持するために正であることが必要とされた。
【0065】
スーパーコイル二量体主鎖の追加の組は、内側ヘリックスのピッチに適合させるために、以下の式によって外側ヘリックスのピッチを抑制することによって生成した。
【0066】
【数1】
式中:
ω’
0:外側ヘリックスのスーパーヘリックスねじれ
ω
0:内側ヘリックスのスーパーヘリックスねじれ
R’:外側ヘリックスRのスーパーヘリックス半径
R:外側ヘリックスのスーパーヘリックス半径
d:残基当たりの上昇(1.51に設定)
【0067】
ピッチを抑制することで、結果として外側ヘリックスがヘリックス束の全長にわたって内側へリックスへの多くの接触を維持することになり、異なる水素結合ネットワークおよびパッキング解決策が可能になる。
【0068】
HBNet(商標)は、Rosetta(商標)ソフトウェアスイートの一部としてC++で書かれている:HBNet(商標)は、モジュラーとして開発され、すべて対称的なRosetta(商標)アプリケーション、ならびにRosettaScripts(商標)XMLフレームワークと互換性があり、そのため、ほとんどの既存の設計プロトコルにプラグインすることが可能であり、ユーザは設計タスクに特異的な選択肢をカスタマイズすることができる。HBNet(商標)は抽象基底クラスとして書かれ、該クラスから特殊化した「ムーバー」クラスは、特定の設計例のために派生することができる。特に、本明細書に記載の「HBNetStapleInterface(商標)」のインスタンスは、分子間界面ABにわたる水素結合ネットワークを検索するために書かれた。
【0069】
表1は、設計計算、設計計算のために用いられるコマンドラインおよびフラグの例、ならびにカスタマイズしたスコア重み付け情報のために用いられるRosettaScripts(商標)XMLの例を示す。
【0070】
【表3-1】
【表3-2】
【表3-3】
【表3-4】
【表3-5】
【表3-6】
【0071】
設計計算
パラメータ的に生成した主鎖は、まず、理想的な主鎖生成によって加えられたどのようなねじりひずみでも軽減するために、Rosetta(商標)で直交座標空間の最小化を使用して、規則化する。トポロジーそれぞれについて、内側ヘリックスだけについて最初の探索を行って、最も好ましいコア側鎖パッキングをもたらしたパラメータ範囲を特定し、次いで、これらの内部ヘリックスパラメータ範囲と関連して外側ヘリックスパラメータを広範囲にわたってサンプリングして、何万もの主鎖を生成した。HBNet(商標)を使用して、分子間界面に広がり、重原子ドナーおよびアクセプターがすべて満たされ、および水素結合に寄与する少なくとも3つの側鎖を含有する水素結合ネットワークのためのこれらの主鎖を探索した。埋没した界面位置について、非荷電極性アミノ酸だけを考慮し、少なくとも部分的に溶媒に露出されていた残基位置については、すべての極性アミノ酸を考慮した。より微細なサンプリングは、好ましい水素結合ネットワークおよび疎水性パッキングの両方に適合し得る主鎖パラメータ周辺で行った。単量体サブユニットのヘリックスを単鎖に結合し、構築されたタンパク質を、HBNet(商標)と併用する対称的なRosetta(商標)配列設計計算を使用して設計した。
【0072】
設計を評価するための選択基準および測定基準
本明細書に記載の設計について、ステップ1の後に、大体約100,000のオーダーで、ネットワークを検出したが、あるとしても、ステップ2で概要を述べた基準のすべてをパスし、次いで先に進んだネットワークはわずかに少数であった。下流設計(ステップ3)の後、ネットワーク周辺のパッキングを評価した。下流設計の間、水素結合ネットワークは抑制されるので、制約がない場合ネットワークが損なわれずにどれほどよく存続しているかを測定するために、制約なしでモデルを最小化し、側鎖をリパックした。
【0073】
最後に、設計された構造が「フォールド・アンド・ドック」対称的なRosetta(商標)構造予測計算によってどれくらい綿密に再現されたかについて、モデルを評価した。伸長鎖から開始し、構築されたオリゴマーのエネルギーを、標的巡回対称群の単量体サブユニットに関連するリジッドボディトランスフォームに沿って単量体の内部自由度についてモンテカルロサンプリングによって最適化した。漏斗様の形をしたエネルギー地形を有する設計に優先順位は与えられ、ab initio予測された構造は設計された構造に収束され、インシリコで整合性チェックとして用いられ、アミノ酸配列が別の状態の形をとることができる可能性を調べる。複数のネットワークを有し、分子間界面での極性成分が高い多くの設計は、強い「漏斗状」を示さなかったが、しかし大きな「エネルギーギャップ」を示し、設計された構造が、最初の「フォールド・アンド・ドック」計算の間にサンプリングしたいずれの構造よりもエネルギーが有意に低かった。実験的試験の選択肢として、大きなエネルギーギャップを有する設計も考慮された。
【0074】
実験的検証のために選択された設計は、計算設計方法から生じる正確なアミノ酸配列で合成された。これに対する唯一の例外は、TyrまたはTrp残基が欠如している設計についであった。精製および濃度測定のためのA
280をモニターするために非界面位置で表面にTyrを加えた。さらに、数例において、荷電された表面残基を修飾して、緩衝液pHからタンパク質の推定等電点(pl)を離した。
【0075】
ループ閉鎖
単量体のヘリックスを単鎖に結合するために、高分解能結晶構造において、DSSPで特定された、5以下の残基からなるループを介して2つのヘリックス領域にわたるフラグメントで構成される主鎖試料の網羅的なデータベースを生成した。このデータベースで、最適化された重ね合わせアルゴリズムを使用して、フラグメントの末端残基の強固なアライメト、および目標をパラメトリックに設計された主鎖を介して、候補ループを特定した。
【0076】
そして、厳密なアライメント公差(0.35Å以内 RMSD)下の候補は、目標主鎖重原子座標への厳しい座標制約および整列した候補主鎖重原子座標への穏やかな座標制約の下、ねじれ空間の最小化により目標主鎖へ完全に整列した。次いで、候補ループ配列は、ループ主鎖のアライメントを介して生成されたソース構造データベースへの配列プロファイル制約の下で設計され、および最終ループ設計として最低スコアリング候補が選択された。
【0077】
構造分析
タンパク質BLAST(商標)探索をNational Center for Biotechnology Information (NCBI) Webサーバを使用して実行し、10.0のExpect閾値(E値カットオフ)およびBLOSUM62置換行列を用いて、すべての非冗長タンパク質配列(「nr」データベース)に対して探索した。
【0078】
結晶構造および設計モデルを、すべての重原子を用いる構造ベースのアライメントによって重ねた。このアライメントから、RMSDをすべてのα炭素原子にわたり、および水素結合ネットワーク残基の重原子にわたり計算した。
【0079】
我々の設計の構造的独自性を調べるために、MICANアライメントアルゴリズムを用いて、Protein Data Bank(PDB)の同じ対称性群のホモオリゴマーバイオユニットに対して探求した。
【0080】
結晶化二環構造についてのパラメ―タを計算するために、「グローバル対称」最適化オプションとともにコイルドコイルクリックパラメータ化(CCCP)Webサーバを使用し、目的の構造としては、すべて対称ホモオリゴマーである。パラメータが所定の構造の内側ヘリックスと外側ヘリックスとの間で変化したので、各結晶構造について、パラメータはヘリックスの内側環と外側環に対して別々に計算し、ヘリックスの内側環のすべてのヘリックス残基、またはヘリックスの外側環のすべてのヘリックス残基のいずれかに対応する.pdbファイルを入力した。
【0081】
図面のためのすべての構造画像は、PyMOL(商標)を使用して生成した。
【0082】
実験的方法
合成遺伝子の構築
合成遺伝子は、Genscript Inc.(Piscataway,N.J.,USA)から得たものであり、pET21−NESGまたはpET−28b+大腸菌発現ベクターのいずれかに送達して、各ベクターのNdel部位およびXhol部位に挿入した。pET21−NESG構築物については、合成DNAはC末端ヘキサヒスチジンタグとともにフレーム内にクローニングした。pET−28b+構築物については、合成DNAはN末端ヘキサヒスチジンタグおよびトロンビン切断部位とともにフレーム内にクローン化し、停止コドンはC末端に導入した。タンパク質発現のために、プラスミドを化学的にコンピテントな大腸菌BL21(DE3)StarまたはBL21(DE3)Star−pLysS細胞(Invitrogen)に形質転換した。酵母ツーハイブリッドアッセイのための構築物は、Gibsonアセンブリーによって形成し、挿入物は鋳型としてpET−21またはpET−28大腸菌発現ベクターからPCRによって生成したか、またはgBlocks(登録商標)(IDT)としての注文で生成した。すべてのプライマーおよびgBlocks(登録商標)は、Integrated DNA Technologies(IDT)からの注文であった。
【0083】
タンパク質発現および精製
50μg/mLのカルベニシリン(pET21−NESG)または30μg/mLのカナマイシン(pET−28b+)の存在下で、スターター培養物をLuria−Bertani(LB)培地で、37℃で一晩、または、Terrific Brothで、37℃で8時間のいずれかで増殖させた。スターター培養物を用いて、抗生物質含有500mLのLB、Terrific BrothまたはTerrific Broth II(MP Biomedicals)を播種した。培養物は0.6〜0.9のOD600で0.2〜0.5mMのIPTGで誘導し、18℃で一晩発現させた(その後多くの設計物も37℃で4時間発現させたが、収率に注目すべき相違はなかった)。細胞を、5000rcf、4℃で15分間遠心分離することによって収集して、溶解緩衝液(20 mMのTris、300mMのNaCl、20mMのイミダゾール、室温でpH8.0)に再懸濁させ、次いでリゾチーム、デオキシリボヌクレアーゼ、およびEDTAフリーカクテルプロテアーゼ阻害剤(Roche)または1mMのPMSFの存在下で超音波処理によって溶解した。可溶化液を4℃、18,000rpmで少なくとも30分間、遠心分離することによって清澄化させ、溶解緩衝液で前平衡させたNi−NTA(Qiagen)カラムに加えた。カラムを5カラム体積(CV)の洗浄緩衝液(20mMのTris、300mMのNaCl、30mMのイミダゾール、室温でpH8.0)で3回洗浄し、続いて3〜5CVの高塩分洗浄緩衝液(20mMのTris、1MのNaCl、30mMのイミダゾール、室温でpH8.0)で洗浄し、次いで5CVの洗浄緩衝液で洗浄した。タンパク質は、20mMのTris、300mMのNaCl、250mMのイミダゾールと共に、室温でpH8.0で溶出させた。タンパク質は、損なわれていないHisタグとともに、最初にSEC−MALSおよびCDで選別した。可能ならば、タグを切断し、試料を結晶構造解析、SAXS、およびGdmCl溶融のためにさらに精製した。
【0084】
pET−28構築物のN末端ヘキサヒスチジンタグを室温で4時間または一晩、制限グレードトロンビン(EMD Millipore 69671−3)を用いて切断し、酵素の試料液への希釈は1:5000を用いた。2時間後、SDS−PAGE分析によって完全な切断が観察され、少なくとも18時間までの時点で、疑似切断は観察されなかった。トロンビンを添加する前に、緩衝液を溶解緩衝液(20mMのTris、300mMのNaCl、20mMのイミダゾール)に取り替えた。切断後、試料をベンズアミジン樹脂カラム(GE Healthcare/Pharmacia,Fisher #45−000−280)に加え、樹脂を再懸濁させ、試料を章動させながらカラム上で30〜60分間インキュベートした。通過画分を収集し、1.5CVの溶解緩衝液でベンズアミジン樹脂を洗浄することによって追加試料を得た。1mMのPMSFを添加して、残存する遊離トロンビンも阻害した。次いで、試料を追加のNi−NTAカラムに移し、1.5のCVの溶解緩衝液で洗浄した。タンパク質は、Superdex 75 10/300カラム(GE Healthcare)を用いたFPLCサイズ排除クロマトグラフィー(SEC)によって、さらに精製した。SAXSのためのゲル濾過緩衝液は、20mMのTris,室温でpH8.150mMのNaClおよび2%グリセロールであった。結晶構造解析のために、20mMのTris、pH8.0、100mMのNaClを用いた。設計されたタンパク質のいずれもシステインを含まなかったので、還元剤は加えなかった。
【0085】
サイズ排除クロマトグラフィー、多角度光散乱(SEC−MALS)
SEC−MALS実験では、miniDAWN TREOS多角度静的光散乱に接続されたSuperdex 75 10/300カラムおよびOptilab T−rEX (領域拡張型屈折計)検出器(Wyatt Technology Corporation,Santa Barbara CA,USA)を使用した。タンパク質試料をTBS(pH 8.0)またはPBS(pH 7.4)に3〜5mg/mLの濃度で注入した。溶出種の重量平均モル質量(M
w)、ならびに数平均モル質量(M
n)を推定するために、ASTRATM(Wyatt Technologies)ソフトウェアを使用してデータを分析し、多分散指数(PDI)によって単分散性を評価した=M
w/M
n。
【0086】
円偏光二色性(CD)測定
CD波長走査(260〜195nm)および温度溶融(25〜95℃)は、JASCO J−1500またはAVIVモデル420 CD分光計を用いて測定した。温度溶融は222nmで吸収シグナルがモニターされ、4℃/分の加熱速度で実施した。タンパク質試料は、0.1cmのキュベットにリン酸緩衝食塩水(PBS)pH7.4中0.2〜0.5mg/mLであった。
【0087】
塩化グアニジニウム(GdmCl)滴定は、25℃、PBS pH7.4中で、自動滴定装置とともに同じ分光計上で実行し、スターラーバー付1cmキュベット中の0.025〜0.06mg/mL濃度のタンパク質を用いて222nmでモニターした。各滴定は、ステップごとに1分間の混合時間で少なくとも40の均一に分配された濃度点からなった。滴定剤溶液は、PBS+GdmCl中の同じ濃度タンパク質からなり、GdmCl濃度は屈折率によって決定した。
【0088】
内側ヘリックスペプチド
N末端アセチル化およびC末端アミド化によるペプチド2L4HC2_9_内側および2L6HC3_13_内側は、Genscript Inc.(Piscataway, N.J.,USA)からの注文であった。2L4HC2_9_内側=SSDYLRETIEELRERIRELEREIRRSNEEIERLREEKS(配列番号93)、および2L6HC3_13_内側=TERENNYRNEENNRKIEEEIREIKKEIKKNKERD(配列番号94)。CD実験のためにペプチドはPBS pH7.4に溶解し、さらにPBS pH7.4に透析した。
【0089】
タンパク質試料の結晶化
精製したタンパク質試料は、20mMのTris pH 8.0および100mMのNaCl中で約12mg/mlまで濃縮した。試料は、以下の結晶化スクリーンを利用して、Phoenix Robot(Art Robbins Instruments,Sunnyvale,CA)による疎行列法(JancarikおよびKim,1991)を使用して選別した:Berkeley Screen(Lawrence Berkeley National Laboratory)、Crystal Screen、 PEG/Ion、IndexおよびPEGRx(Hampton Research,Aliso Viejo,CA)。異なる設計物の結晶化のための最適条件が、以下の通り判明した。2L6HC3_6、0.2Mのフッ化ナトリウム、0.1MのMES pH5.5および20%のPEG 400;2L6HC3_12、2.2Mのマロン酸ナトリウム pH5.0;2L6HC3_13、0.06Mのクエン酸、0.04MのBIS−TRISプロパンpH4.1および16%のPEG 3,350;2L8HC4_12、0.2Mの酢酸ナトリウム三水和物、0.1MのTris塩酸塩pH8.5および30%のPEG 4,000;3L6HC2_2、0.1Mの酢酸ナトリウム三水和物pH4.5および3.0Mの塩化ナトリウム;2L4HC2_23、0.2Mの塩化リチウムおよび20%のPEG 3,350;2L4HC2_9、0.1Mのクエン酸三ナトリウム無水物 pH5.0、30%のPEG MME 550;2L4HC2_11、0.1MのTris pH8.5および2.0Mの硫酸アンモニウム;5L6HC3_1、0.1Mのクエン酸 pH3.5および3.0Mの塩化ナトリウム;および2L4HC2_24は20mg/mLまで濃縮され、0.1Mのクエン酸 pH3.5、2.0Mの硫酸アンモニウム中で結晶化した。結晶は、0.2μLのタンパク質溶液と0.2μLのリザーバー溶液の1:1混合物からなる滴下による、シッティングドロップ蒸気拡散法によって、1〜14日後に得られた。
【0090】
X線データ収集および構造決定
設計されたタンパク質の結晶は、15〜20%(v/v)のグリセロールを含有するリザーバー溶液中に入れ、次いで液体窒素中でフラッシュ冷却した。X線データセットは、Lawrence Berkeley National Laboratory(LBNL)でのAdvanced Light SourceのStructural Biologyビームライン5.0.1、8.2.1および8.2.2のためにBerkeley Centerで収集した。データセットは、HKL2000を用いてインデックスをつけ、縮小した。すべての設計構造は、初期の探索モデルとして設計モデルを用いたPhenixスイート内のプログラムPHASERによる分子置換法によって決定した。分子置換から得られた原子位置および結果として生じた電子密度マップを用いて、設計構造を構築し、結晶学的精密化およびモデルの再構築を開始した。構造精密化は、phenix.refineプログラムを使用して実行した。COOTを使用する手動再構築および水分子の付加により、最終モデルの構築が可能になった。結合長、角度および二面角のための理想的な幾何学的形状との平均二乗偏差の差は、Phenixで算出した。すべての最終モデルの全体の立体化学的性質は、プログラムMOLPROBITYを使用して評価した。
【0091】
小角X線散乱(SAXS)
試料は、室温でpH8.0の20mMのTris、150mMのNaClおよび2%、150mMのNaClと2%のグリセロール中でのゲル濾過によって精製し、カラムの空隙容量に先行する画分をバッファサブトラクションのためのブランクとして使用した。散乱計測は、Advanced Light SourceでSIBYLS 12.3.1 ビームラインで実行した。X線波長(λ)は、1Åであり、試料からMar165検出器までの距離は1.5mであり、0.01〜0.3Å−1の散乱ベクトルq(q=4πsinθ/λ、2θは散乱角である)の範囲に対応する。データセットは、12keVで0.5、1および6秒間の曝露を使用して収集した。低いqシグナルの飽和または放射線損傷をもたらす長い曝露の場合、データセットは、同じ試料からの低い曝露とマージした。濃度依存的効果を試験するために、試料ごとに、データを少なくとも2つの異なる濃度、3〜7mg/mL範囲の「高」濃度試料と、1〜2mg/mL範囲の「低」濃度試料とで収集した。データは、前述のようにScAtterソフトウェアパッケージを用いて分析した。濃度依存性を示さなかった試料については、信号対雑音およびギニエフィッティングに基づく最善のデータセットを分析のために使用した。FoXSを用いて、設計モデルを実験的な散乱プロファイルと比較し、適合(X)値の性質を算出した。設計モデルについて、発現ベクターによって導入された余分な残基をRosetta(商標)リモデルを用いて計算モデルに加えたので、設計配列は実験試料の配列と適合した。溶液中のこれらの余分なタグ残基の立体配座柔軟性をとらえるために、1設計当たり100の独立モデルを生成した。次いで、これらの100のモデルをRosetta(商標)によってクラスター化し、偏りを避けるために、最大のクラスターのクラスター中心を、実験データに適合するために用いる単一の代表的なモデルとして選択した。
【0092】
酵母ツーハイブリッド法
Gibsonアセンブリーを使用して、タンパク質バインダーをGAL4 DNA結合ドメインを有するプラスミド(pOBD2)およびまたはGAL4転写活性化ドメインを有するプラスミド(poAD)にクローン化し、次いで配列を確認した。試験したバインダーの対ごとに、修飾LiOAc形質転換プロトコルを用いて、酵母株PJ69−4aをプラスミドの適切な対で形質転換し、形質転換した酵母のレスキューおよび選択はトリプトファンおよびロイシンがない最小液体培地で行った。アッセイの前に、形質転換細胞を1:10で希釈し、トリプトファンおよびロイシンがない新鮮な最小培地で、16時間増殖させた。この最初のインキュベーションの後、再び細胞を1:10で希釈し、振盪させながら、96ウェルプレート中で増殖させた。今回の培地はトリプトファン、ロイシンおよびヒスチジンがない200μLの最小培地であった。DNA結合ドメインと転写活性化ドメインとの間のタンパク相互作用は細胞がヒスチジンの非存在下で増殖するのに必要であるので、相互作用の成功は増殖速度によって近づくことができる。細胞の光学密度(OD)を10分ごとに48時間にわたり測定し、増殖速度を60分ごとの間隔で算出した。1時間当たり(maxV)の最大増殖速度をバインダー対間の相互作用の代用として使用した。
【0093】
質量分析
ゲルバンドを単離し、重炭酸アンモニウムで洗浄し、60℃で15分間DTTで還元した。冷却後、還元チオール基をアルキル化するために、室温の暗所で15分間、ゲル部分をヨードアセトアミドで処理した。プロテアーゼ消化を、酵素に対する基質、濃度が10:1の配列グレードトリプシンで4時間、37℃で遂行した。LCMS/MS分析の前に、ペプチド試料を真空で乾燥し、0.1%ギ酸に再懸濁した。液体クロマトグラフィーは、C12樹脂を充填した3cmのカシルフリットトラップの下流にC18樹脂を充填した15cmのカラムにわたり60分間の勾配からなっていた。スペクトルは、データ依存性取得を用いてThermo Velos Pro質量分析計に収集した。各試料に3つの技術的反復で注入し、ペプチドはタンパク質推測のためにSEQUESTとPercolatorを使用し、続いてIDPickerで特定した。
【0094】
さらなる態様において、方法が提供される。コンピューティングデバイスは、1または複数の分子に関連した水素結合ネットワークのための探索空間を決定する。探索空間は、水素結合ネットワークに関連した複数の残基に関連した複数のエネルギー項を含む。コンピューティングデバイスは探索空間を探索して、複数のエネルギー項に基づいて1または複数の水素結合ネットワークを特定する。1または複数の特定された水素結合ネットワークのスコアに基づいて、コンピューティングデバイスは、特定された1または複数の水素結合ネットワークを選別して、1または複数の選別された水素結合ネットワークを特定する。コンピューティングデバイスは、1または複数の選別された水素結合ネットワークに関連した出力を生成する。
【0095】
別の態様において、コンピューティングデバイスが提供される。コンピューティングデバイスには、1または複数のデータプロセッサおよびコンピュータ読み取り可能な媒体が含まれる。コンピュータ読み取り可能な媒体は、実行されると、コンピューティングデバイスに機能を実行させる少なくともコンピュータ読み取り可能な命令を格納するように構成されている。機能としては、探索空間が水素結合ネットワークに関連した複数の残基に関連する複数のエネルギー項を含む場合、1または複数の分子に関連する水素結合ネットワークについての探索空間を決定すること;探索空間を探索して、複数のエネルギー項に基づいて1または複数の水素結合ネットワークを特定すること;1または複数の特定された水素結合ネットワークのスコアに基づいて、特定された1または複数の水素結合ネットワークを選別して、1または複数の選別した水素結合ネットワークを特定すること;および1または複数の選別した水素結合ネットワークに関連する出力を生成することが含まれる。
【0096】
別の態様において、コンピュータ読み取り可能な媒体が提供される。コンピュータ読み取り可能な媒体は、コンピューティングデバイスの1または複数のプロセッサによって実行されると、コンピューティングデバイスに機能を実行させる少なくともコンピュータ読み取り可能な命令を格納するように構成されている。機能としては、探索空間が水素結合ネットワークに関連した複数の残基に関連する複数のエネルギー項を含む場合、1または複数の分子に関連する水素結合ネットワークについての探索空間を決定すること;探索空間を探索して、複数のエネルギー項に基づいて1または複数の水素結合ネットワークを特定すること;1または複数の特定された水素結合ネットワークのスコアに基づいて、特定された1または複数の水素結合ネットワークを選別して、1または複数の選別された水素結合ネットワークを特定すること;および1または複数の選別された水素結合ネットワークに関連する出力を生成することが含まれる。
【0097】
別の態様において、装置が提供される。装置には、探索空間が水素結合ネットワークに関連した複数の残基に関連する複数のエネルギー項を含む場合、1または複数の分子に関連する水素結合ネットワークについての探索空間を決定する手段;探索空間を探索して、複数のエネルギー項に基づいて1または複数の水素結合ネットワークを特定する手段;1または複数の特定された水素結合ネットワークのスコアに基づいて、特定された1または複数の水素結合ネットワークを選別して、1または複数の選別した水素結合ネットワークを特定する手段;および1または複数の選別した水素結合ネットワークに関連する出力を生成する手段が含まれる。
【0098】
コンピューティング環境の例
図6は、コンピューティングネットワークの一例のブロック図である。本明細書に開示する上述の手法の一部またはすべて、例えば、これに限定されないが、ソフトウェア、Rosetta(商標)ソフトウェアスイート、RosettaDesign(商標)、Rosetta(商標)アプリケーション、および/または本明細書に記載の他のコンピュータソフトウェアとコンピュータハードウェアの一部として開示される、および/またはこれらによって実行される手法は、コンピューティングデバイスの一部でありえ、および/または該装置によって実行され得る。例えば、
図6は、ネットワーク606を介して、クライアントデバイス604a,604bおよび604c、ならびにタンパク質データベース608と通信するように構成されるタンパク質設計システム602を示す。一部の実施形態において、タンパク質設計システム602および/またはタンパク質データベース608は、本明細書に記載の方法および手法の一部またはすべてを実行するように構成されたコンピューティングデバイス、例えば、これに限定されないが、Rosetta(商標)の一部として、またはRosettaに関連している方法800および機能性であり得る。一部の実施形態において、タンパク質データベース608は、Rosetta(商標)に関連する、および/またはRosettaによって使用される情報を格納することができる。
【0099】
ネットワーク606は、LAN、ワイドエリアネットワーク(WAN)、企業内イントラネット、公衆インターネットまたはネットワーク化されたコンピューティングデバイス間に通信経路を提供するように構成されている任意の他のネットワーク種類に対応することができる。ネットワーク606は、1または複数のLAN、WAN、企業内イントラネットおよび/または公衆インターネットの組み合わせに対応することもできる。
【0100】
図6は3つのクライアントデバイス604a、604b、604cを示しているだけであるが、分散型アプリケーション・アーキテクチャは何十、何百または何千ものクライアントデバイスに対応することができる。さらに、クライアントデバイス604a、604b、604c(または任意の追加のクライアントデバイス)は、どんなコンピューティングデバイス、例えば、通常のラップトップコンピュータ、デスクトップコンピュータ、ネットワーク端末、無線通信装置(例えば、携帯電話またはスマートフォン)などであってもよい。一部の実施形態において、クライアントデバイス604a、604b、604cは、Rosetta(商標)ソフトウェアスイートの問題解決/使用専用にすることができる。他の実施形態において、クライアントデバイス604a、604b、604cは、多くのタスクを実行するように構成されている汎用コンピュータとして使用することができ、Rosetta(商標)の問題解決/使用専用である必要がない。さらに他の実施形態において、タンパク質設計システム602および/またはタンパク質データベース608の機能性の一部またはすべては、クライアントデバイス、例えばクライアントデバイス604a、604bおよび/または604cに組み込むことができる。
【0101】
コンピューティング環境アーキテクチャ
図7Aは、コンピューティングデバイス(例えば、システム)の一例のブロック図である。特に、
図7Aに示すコンピューティングデバイス700は、タンパク質設計システム602、クライアントデバイス604a、604b、604c、ネットワーク606、および/またはタンパク質データベース608のコンポーネントを含み、および/またはこれらのうちの1または複数の機能を実行し、および/または本明細書に記載の方法と手法、例えば、これに限定されないが方法800の一部またはすべてを実施するように構成されることができる。コンピューティングデバイス700は、ユーザインターフェイスモジュール701、ネットワーク通信インターフェイスモジュール702、1または複数のプロセッサ703、およびデータストレージ704を含むことができ、それらすべてはシステムバス、ネットワーク、または他の接続機構705を介して連結させることができる。
【0102】
ユーザインターフェイスモジュール701は、外部ユーザの入出力装置にデータを送信し、および/またはデータを受信するように動作可能であり得る。例えば、ユーザインターフェイスモジュール701は、ユーザ入力装置、例えば、キーボード、キーパッド、タッチスクリーン、コンピュータマウス、トラックボール、ジョイスティック、カメラ、音声認識モジュール、および/または他の類似の装置にデータを送信するおよび/またはそれらの装置からデータを受信するように構成することができる。ユーザインターフェイスモジュール701は、ユーザ表示装置、例えば、1または複数のブラウン管(CRT)、液晶ディスプレイ(LCD)、発光ダイオード(LED)、デジタルライトプロセッシング(DLP)技術、プリンタ、電球、および/または現在知られているもしくは後日開発されるいずれかの他の類似の装置に出力を提供するようにも構成されることができる。ユーザインターフェイスモジュール701は、可聴出力、例えばスピーカー、スピーカージャック、音声出力ポート、音声出力装置、イヤホーンおよび/または他の類似の装置を生成するようにも構成されることができる。
【0103】
ネットワーク通信インターフェイスモジュール702は、ネットワーク、例えば、
図6に示すネットワーク606を介して通信するように構成される1または複数の無線インターフェイス707および/または1または複数の有線インターフェイス708を含むことができる。無線インターフェイス707は、1または複数の無線送信機、受信機、および/またはトランシーバ、例えばブルートゥーストランシーバ、ジグビートランシーバ、Wi−Fiトランシーバ、WiMAXトランシーバおよび/または無線ネットワークを介して通信するように構成可能な他の類似の種類の無線トランシーバを含むことができる。有線インターフェイス708は、1または複数の有線送信機、受信機、および/またはトランシーバ、例えば、イーサネトトランシーバ、ユニバーサル・シリアル・バス(USB)トランシーバ、またはツイストペアケーブル、1または複数のワイヤケーブル、同軸ケーブル、ファイバ光リンク、もしくは有線ネットワークへの類似の物理接続を介して通信するように構成可能な類似のトランシーバを含むことができる。
【0104】
一部の実施形態において、ネットワーク通信インターフェイスモジュール702は、信頼性が高い、セキュリティ保護されたおよび/または、認証された通信を提供するように構成されることができる。本明細書に記載の通信のそれぞれについて、信頼性が高い通信(すなわち保証されたメッセージ配信)を確実にするための情報が、おそらくメッセージヘッダおよび/またはフッタの部分(例えば、パケット/メッセージシーケンシング情報、カプセル化ヘッダおよび/またはフッタ、サイズ/時間情報、ならびにCRCおよび/またはパリティーチェック値のような送信照合情報)として提供され得る。通信は、セキュリティ保護したものにし得る(例えば、エンコードもしくは暗号化され得る)、および/または1または複数の暗号化プロトコルおよび/またはアルゴリズム、例えば、これらに限定されないがDES、AES、RSA、Diffie−Hellmanおよび/またはDSAを使用して暗号解読/デコードされ得る。通信をセキュリティ保護したものにする(次いで暗号解読/デコードする)ために、他の暗号化プロトコルおよび/またはアルゴリズムも同様に、または本明細書に列挙したものに加えて使用することができる。
【0105】
プロセッサ703は、1または複数の汎用プロセッサおよび/または1もしくは複数の専用プロセッサ(例えば、デジタル信号プロセッサ、特定用途向け集積回路など)を含めることができる。プロセッサ703は、データストレージ704に含まれるコンピュータ読み取り可能なプログラム命令706および/または本明細書に記載の他の命令を実行するように構成されることができる。データストレージ704は、プロセッサ703の少なくとも1つで読み取られ、および/またはアクセスされることができる1または複数のコンピュータ読み取り可能な記憶媒体を含めることができる。1または複数のコンピュータ読み取り可能なストレージ媒体は、揮発性および/または不揮発性のストレージコンポーネント、例えば、光学ストレージ、磁気ストレージ、有機ストレージ、または他のメモリもしくはディスクストレージを含めることができ、全体または一部としてプロセッサ703の少なくとも1つと一体化されることができる。一部の実施形態において、データストレージ704は、単一の物理的装置(例えば、1台の光学ストレージ、磁気ストレージ、有機ストレージ、または他のメモリもしくはディスクストレージのユニット)を使用して実現されることができるが、他の実施形態において、データストレージ704は2台以上の物理的装置を使用して実現されることができる。
【0106】
データストレージ704は、コンピュータ読み取り可能なプログラム命令706およびおそらく追加データを含めることができる。例えば、一部の実施形態において、データストレージ704は、タンパク質設計システムおよび/またはタンパク質データベース、例えば、タンパク質設計システム602、タンパク質データベース608によって利用されるデータの一部またはすべてを格納することができる。一部の実施形態において、データストレ−ジ704は、本明細書に記載の方法および手法の少なくとも一部、および/または本明細書に記載の装置およびネットワークの機能性の少なくとも一部を実行するために必要とされるストレージを含めることができる。
【0107】
図7Bは、例示の実施形態によるクラウドベースサーバとして配置されたコンピューティングクラスタ709a、709b、709cのネットワーク606を表す。タンパク質設計システム602のためのデータおよび/またはソフトウェアは、プログラムロジックおよび/またはクラウドベースアプリケーションおよび/またはサービスのデータを格納する1または複数のクラウドベース装置に格納されることができる。一部の実施形態において、タンパク質設計システム602は、単一コンピューティングセンターに存在する単一コンピューティングデバイスであり得る。他の実施形態において、タンパク質設計システム602は、単一コンピューティングセンターにおいて、または多様な地理的位置に位置される複数のコンピューティングセンターに位置される複数のコンピューティングデバイスさえ含めることができる。
【0108】
一部の実施形態において、タンパク質設計システム602用のデータおよび/またはソフトウェアは、有形のコンピュータ読み取り可能な媒体(またはコンピュータ読み取り可能なストレージ媒体)に格納され、およびクライアントデバイス604a、604bおよび604c、および/または他のコンピューティングデバイスがアクセスできるコンピュータ読み取り可能な情報としてコードされることができる。一部の実施形態において、タンパク質設計システム602用のデータおよび/またはソフトウェアは、単一ディスクドライブまたは他の有形のストレージ媒体に格納されることができる、あるいは1または複数の多様な地理的位置に位置した複数のディスクドライブまたは他の有形のストレージ媒体に実現されることができる。
【0109】
図7Bは、例示の実施形態によるクラウドベースサーバシステムを表す。
図7Bにおいて、タンパク質設計システム602の機能は、3つのコンピューティングクラスタ709a、709bおよび709cの間で分散されることができる。コンピューティングクラスタ709aは、1または複数のコンピューティングデバイス700a、クラスタストレージアレイ710a、およびローカルクラスタネットワーク712aによって接続されるクラスタルータ711aを含めることができる。同様に、コンピューティングクラスタ709bは、1または複数のコンピューティングデバイス700b、クラスタストレージアレイ710b、およびローカルクラスタネットワーク712bによって接続されるクラスタルータ711bを含めることができる。同様に、コンピューティングクラスタ709cは、1または複数のコンピューティングデバイス700c、クラスタストレージアレイ710c、およびローカルクラスタネットワーク712cによって接続されるクラスタルータ711cを含めることができる。
【0110】
一部の実施形態において、コンピューティングクラスタ709a、709bおよび709cの各々は、同数のコンピューティングデバイス、同数のクラスタストレージアレイ、および同数のクラスタルータを有することができる。しかし、他の実施形態において、各コンピューティングクラスタは、異なる数のコンピューティングデバイス、異なる数のクラスタストレージアレイ、および異なる数のクラスタルータを有することができる。各コンピューティングクラスタにおけるコンピューティングデバイス、クラスタストレージアレイ、およびクラスタルータの数は、コンピューティングタスクまたは各コンピューティングクラスタに割り当てられるタスクに依存し得る。
【0111】
例えば、コンピューティングクラスタ709aにおいて、コンピューティングデバイス700aは、タンパク質設計システム602の種々のコンピューティングタスクを実行するように構成されることができる。一実施形態において、タンパク質設計システム602の種々の機能性は、1または複数のコンピューティングデバイス700a、700bおよび700cの間で分散されることができる。コンピューティングクラスタ709bおよび709cにおいてコンピューティングデバイス700bおよび700cは、コンピューティングクラスタ709aにおけるコンピューティングデバイス700aと同様に構成されることができる。一方では、一部の実施形態において、コンピューティングデバイス700a、700bおよび700cは、異なる機能を実行するように構成されることができる。
【0112】
一部の実施形態において、タンパク質設計システム602に関連したコンピューティングタスクおよび格納されたデータは、タンパク質設計システム602の処理要件、コンピューティングデバイス700a、700bおよび700cの処理能力、各コンピューティングクラスタにおけるコンピューティングデバイス間およびコンピューティングクラスタそれ自体の間のネットワーク結合のレイテンシ、および/または全体のシステムアーキテクチャのコスト、速度、フォールトトレランス、回復力、効率、および/または他の設計目標に寄与し得る他の要因に少なくとも部分的に基づいて、コンピューティングデバイス700a、700bおよび700cにわたって分散されることができる。
【0113】
コンピューティングクラスタ709a、709bおよび709cのクラスタストレージアレイ710a、710bおよび710cは、ハードディスク装置の群への読込みおよび書込みアクセスを管理するように構成されるディスクアレイコントローラを含むデータストレージアレイであり得る。単独でまたはそれぞれのコンピューティングデバイスと組み合わせて、ディスクアレイコントローラは、クラスタストレージアレイに格納されるデータのバックアップまたは冗長なコピーを管理して、1または複数のコンピューティングデバイスが1または複数のクラスタストレージアレイにアクセスするのを防止するディスクドライブまたは他のクラスタストレージアレイの障害および/もしくはネットワーク障害に対して保護するように構成されることができる。
【0114】
タンパク質設計システム602の機能がコンピューティングクラスタ709a、709bおよび709cのコンピューティングデバイス700a、700bおよび700cにわたり分散されることができる様式と同様に、これらのコンポーネントの種々の活性部分および/またはバックアップ部分はクラスタストレージアレイ710a、710bおよび710cにわたり分散されることができる。例えば、一部のクラスタストレージアレイは、タンパク質設計システム602のデータおよび/またはソフトウェアの一部を格納するように構成されることができるのに対して、他のクラスタストレージアレイはタンパク質設計システム602のデータおよび/またはソフトウェアの別の部分を格納することができる。さらに、一部のクラスタストレージアレイは、他のクラスタストレージアレイに格納されているデータのバックアップバージョンを格納するように構成されることができる。
【0115】
コンピューティングクラスタ709a、709bおよび709cにおけるクラスタルータ711a、711bおよび711cは、コンピューティングクラスタのために内部通信および外部通信を提供するように構成されるネットワーク機器を含めることができる。例えば、コンピューティングクラスタ709aにおけるクラスタルータ711aは、1または複数のインターネットスイッチングおよびルーティングデバイスを含めることができ、当該インターネットスイッチングおよびルーティングデバイスは、(i)ローカルクラスタネットワーク712aを介するコンピューティングデバイス700aとクラスタストレージアレイ701aとの間のローカルエリアネットワーク通信、および(ii)ネットワーク606へのワイドエリアネットワーク接続713aを介するコンピューティングクラスタ709aとコンピューティングクラスタ709bおよび709cとの間のワイドエリアネットワーク通信を提供するように構成される。クラスタルータ711bおよび711cは、クラスタルータ711aと同様のネットワーク機器を含めることができ、クラスタルータ711bおよび711cは、クラスタルータ711aがコンピューティングクラスタ709aに対して実行するのと同様のネットワーキング機能をコンピューティングクラスタ709bおよび709cに対して実行することができる。
【0116】
一部の実施形態において、クラスタルータ711a、711bおよび711cの構成は、コンピューティングデバイスおよびクラスタストレージアレイのデータ通信要件、クラスタルータ711a、711bおよび711cにおけるネットワーク機器のデータ通信能力、ローカルネットワーク712a,712b,712cのレイテンシおよびスループット、ワイドエリアネットワークリンク713a、713bおよび713cのレイテンシ、スループットおよびコスト、ならびに/またはモデレーションシステムアーキテクチャのコスト、速度、フォールトトレランス、回復力、効率および/または他の設計目標に寄与し得る他の要因に少なくとも部分的に基づき得る。
【0117】
操作方法の例
図8は、方法800の一例のフローチャートである。方法800は、少なくとも
図7Aと関連して記述されるコンピューティングデバイス700などのコンピューティングデバイスによって実施されることができる。
【0118】
方法800は、ブロック810で始めることができ、コンピューティングデバイスは1または複数の分子に関連する水素結合ネットワークについての探索空間を決定することができ、探索空間は、少なくとも上の「計算手法」のセクションで述べたように水素結合ネットワークに関連する複数の残基に関連する複数のエネルギー項を含める。
【0119】
一部の実施形態において、探索空間は、1または複数のエッジによって接続された複数のノードを有するグラフとして構成されることができ、複数のノードのうちの1つのノードは、複数の残基のうちの特定の残基に基づき、該特定の残基は残基位置を有し、および
少なくとも上の「計算手法」のセクションで述べたように、1または複数のエッジのうちの1つのエッジは、第1のノードと第2のノードとの間の可能性がある相互作用に基づき複数のノードのうちの第1のノードと第2のノードを接続する。これらの実施形態の特徴において、第1のノードは、複数の残基のうちの第1の残基に関連することができ、第2のノードは複数の残基のうちの第2の残基に関連し、および少なくとも上の「計算手法」のセクションで述べたように、第1のノードと第2のノードとの間の可能性がある相互作用は、第1の残基の回転異性体および/または第2の残基の回転異性体の間の可能性がある相互作用に関連する。これらの実施形態のさらなる特徴において、第1のノードと第2のノードとの間の可能性がある相互作用の間は、少なくとも上の「計算手法」のセクションで述べたように、第1の残基と第2の残基との間の相互作用エネルギーに関連し得る。これらの実施形態のさらに多くの特徴において、探索空間を決定することは以下を含めることができる:第1の残基と第2の残基の間の相互作用エネルギーが閾値相互作用エネルギー未満かを決定すること;および第1の残基と第2の残基の間の相互作用エネルギーが閾値未満であることを決定した後に、第1のノード、第2のノード、および第1のノードと第2のノードとの間の少なくとも1つのエッジを、少なくとも上の「計算手法」のセクションで述べたように、探索空間に加えることを含み得る。これらの実施形態のさらなる特徴において、第1のノードと第2のノードとの間の少なくとも1つのエッジは、少なくとも上の「計算手法」のセクションで述べたように、第1の残基と第2の残基との間の相互作用エネルギーについての情報を含めることができる。これらの実施形態のさらなる特徴において、第1の残基と第2の残基との間の相互作用エネルギーについての情報は、複数の相互作用エネルギー値を含めることができ、複数の相互作用エネルギー値中の各相互作用エネルギー値は、少なくとも上の「計算手法」のセクションで述べたように、第1の残基の特定の回転異性体および第2の残基の特定の回転異性体に関連している。
【0120】
別の実施形態において、探索空間を決定することは、第1の分子と第2の分子との間の分子間界面で少なくとも第1の残基位置および第2の残基位置を決定することであって、第1の残基位置が第1の分子の第1の残基に関連し、および第2の残基位置が第2の分子の第2の残基に関連している、残基位置を決定すること;および少なくとも上の「計算手法」のセクションで述べたように、少なくとも第1の残基位置および第2の残基位置に基づいて探索空間を決定することを含めることができる。これらの実施形態の一部において、第1の分子および第2の分子のうちの少なくとも1つは、少なくとも上の「計算手法」のセクションで述べたように、ポリペプチド鎖を含めることができる。
【0121】
ブロック820で、コンピューティングデバイスは、少なくとも上の「計算手法」のセクションで述べたように、複数のエネルギー項に基づいて1または複数の水素結合ネットワークを特定するために探索空間を探索することができる。一部の実施形態において、探索空間を探索することは、少なくとも上の「計算手法」のセクションで述べたように、探索空間のすべてを探索することを含める。これらの実施形態の特徴において、探索空間のすべてを探索することは、深さ優先探索を使用する。これらの実施形態の別の特徴において、探索空間のすべてを探索することは、少なくとも上の「計算手法」のセクションで述べたように、幅優先探索を使用して探索空間のすべてを探索することを含める。
【0122】
別の実施形態において、探索空間を探索することは、1または複数の初期の水素結合ネットワークを特定するために探索空間の第1の探索を実行すること;および少なくとも上の「計算手法」のセクションで述べたように、1または複数の初期の水素結合ネットワークの第1の水素結合ネットワークと、第2の水素結合ネットワークを少なくともマージすることによって1または複数の特定した水素結合ネットワークを特定することを含めることができる。これらの実施形態の特徴において、第1の水素結合ネットワークと第2の水素結合ネットワークとをマージすることは、第1の水素結合ネットワークと第2の水素結合ネットワークとが同一の回転異性体を共有するかどうか決定すること;および第1の水素結合ネットワークと第2の水素結合ネットワークとが同一の回転異性体を共有することを決定した後、少なくとも上の「計算手法」のセクションで述べたように、第1の水素結合ネットワークと第2の水素結合ネットワークとをマージすることを含めることができる。
【0123】
ブロック830で、少なくとも上の「計算手法」のセクションで述べたように、コンピューティングデバイスは、特定した1または複数の水素結合ネットワークを選別して、1または複数の特定した水素結合ネットワークのスコアに基づいて、1または複数の選別した水素結合ネットワークを特定することができる。一部の実施形態において、少なくとも上の「計算手法」のセクションで述べたように、1または複数の特定した水素結合ネットワークの特に特定した水素結合ネットワークについての特定のスコアは、この特定の水素結合ネットワークに関与する多くの極性原子に基づくことができる。別の実施形態において、少なくとも上の「計算手法」のセクションで述べたように、1または複数の特定した水素結合ネットワークの特に特定した水素結合ネットワークについての特定のスコアは、バックグラウンド参照構造に基づくことができる。これらの実施形態の特徴において、特に特定された水素結合ネットワークについての特定のスコアが1または複数の側鎖−主鎖水素結合に関連するスコアに基づくことができ、1または複数の側鎖−主鎖水素結合は、少なくとも上の「計算手法」のセクションで述べたように、バックグラウンド参照構造に関連することができる。さらに別の実施形態において、1または複数の特定した水素結合ネットワークの特に特定した水素結合ネットワークについての特定のスコアは、少なくとも上の「計算手法」のセクションで述べたように、エネルギー関数に基づくことができる。
【0124】
ブロック840で、1または複数の選別した水素結合ネットワークに関連した出力は、生成することができる。一部の実施形態において、1または複数の選別した水素結合ネットワークに関連した出力を生成することは、少なくとも上の「計算手法」のセクションで述べたように、選別した水素結合ネットワークに基づいて1または複数の分子を設計することを含めることができる。これらの実施形態の特徴において、選別した水素結合ネットワークに基づいて1または複数の分子を設計することは、少なくとも上の「計算手法」のセクションで述べたように、選別した水素結合ネットワークにおいて1または複数の回転異性体の1または複数の比較的小さい動きが可能になることを含める。
【0125】
別の実施形態において、1または複数の選別した水素結合ネットワークに関連した出力を生成することは、少なくとも上の「計算手法」のセクションで述べたように、1または複数の選別した水素結合ネットワークに関連した複数の出力を生成することを含めることができる。さらに他の実施形態において、1または複数の選別した水素結合ネットワークに関連した出力を生成することは、1または複数の選別した水素結合ネットワークに基づいている合成遺伝子を生成すること;合成遺伝子を用いてin vivoで特定のタンパク質を発現させること;および特定のタンパク質を精製することを含めることができる。これらの実施形態の特徴において、合成遺伝子を用いてin vivoで特定のタンパク質配列を発現させることは、少なくとも上の「実験的方法」のセクションで述べたように、合成遺伝子を含む1または複数の大腸菌(Escherichia coli)内で特定のタンパク質配列を発現させることを含める。
【0126】
本明細書に示す特徴は一例であり、かつ本発明の好ましい実施形態の例示考察の目的のためだけであり、本発明の種々の実施形態の原理および概念的態様についての最も有用で容易に理解される説明と思われるものを提供するために提示される。この点に関し、本発明の構造的な詳細を本発明の基本的理解に必要とされるよりも詳細に示す試みはなされていないが、当業者であれば、図面および/または実施例とともになされる説明により本発明のいくつかの形態が実際に実施される方法は明らかであろう。
【0127】
以下の諸例で明確かつ明白に修正されない限り、または意味の適用がいかなる解釈でも無意味もしくは本質的に無意味にする場合、上記の定義および説明は、いかなる将来の解釈も支配することを意味し、意図される。その用語の解釈がそれを無意味または本質的に無意味にする場合、その定義はWebster Dictionary、第3版、または当業者に既知の辞書、例えば、Oxford Dictionary of Biochemistry and Molecular Biology(Anthony Smith編,Oxford University Press,Oxford, 2004)から取得されるべきである。
【0128】
本明細書で用いる場合、特に明記しない限り、用語「a」および「an」は、「1つ」、「少なくとも1つ」または「1または複数」を意味すると解する。文脈によって必要とされない限り、本明細書で用いる単数形の用語は複数形を包含し、複数形の用語は単数形を包含する。
【0129】
説明およびクレーム全体にわたり、文脈上明白に他の意味に解すべき場合を除き、「含む」、「含んでいる」などの単語は、排他的または網羅的な意味ではなく包含的な意味に解釈されるものとする。すなわち、「含むが、それに限定されない」という意味である。さらに単数または複数を使用している言葉は、それぞれ複数または単数も含む。さらに、本出願で用いるとき、「本明細書に」、「上の」および「以下の」、ならびに類似の意味の言葉は、全体として本出願を指し、本出願のいかなる特定の部分を指すものではない。
【0130】
上記の説明は、本開示の実施形態の完全な理解、および説明を可能にする特定の詳細を提供する。しかし、当業者は、本開示がこれらの詳細なしで実行され得ることを理解するであろう。他の例において、周知の構造および機能は、本開示の実施形態の説明を不必要に不明瞭することを避けるために、詳細に示してなく、または説明していない。本開示の実施形態の説明は、網羅的である、または本開示を開示される正確な形態に限定することを意図しない。本開示の具体的な実施形態および実施例は、本明細書において例示を目的として記述されており、当技術分野の当業者が認識するように、種々の均等な修正は、本開示の範囲内で可能である。
【0131】
本明細書に引用されるすべての参考文献は、参照によって組み込まれる。本開示のさらなる実施形態を提供するために、必要に応じて、本開示の態様は、上記参考文献および出願のシステム、機能および概念を使用するよう修正され得る。これらおよび他の変更は、詳細な説明を考慮して本開示になされることができる。
【0132】
前述の実施形態のいずれかの特定の要素は、他の実施形態における要素と、組み合わせる、または置換されることが可能である。さらに、本開示の特定の実施形態に関連している利点は、これらの実施形態に関連して記述されているが、他の実施形態もそのような利点を示すこともありえ、すべての実施形態は本開示の範囲内に入る、そのような利点を示す必要がない。
【0133】
上記の詳細な説明は、添付の図面を参照して、開示されるシステム、デバイス、および方法の種々の特徴および機能を説明する。図面において、文脈が別段指示しない限り、類似の記号は一般的に、類似の成分を特定する。詳細な説明、図面および特許請求の範囲において記載の例示的な実施形態は、限定することを意味しない。他の実施形態を利用することができ、本明細書に示す主題の趣旨または範囲から逸脱することなく、本明細書に示す他の変更をすることができる。本明細書に一般的に記述され、図面に例示されている本開示の態様は多種多様な異なる構成で配置され、置換され、組み合わせられ、分離され、設計されることが可能であり、そのすべては本明細書に明確に可能とみなされている。
【0134】
図面におけるいずれかまたはすべてのラダー図、シナリオ、およびフローチャートに関して、および本明細書に記述の各ブロックおよび/または通信は、例示の実施形態により情報の処理および/または情報の送信を表し得る。他の実施形態は、これらの例示の実施形態の範囲内に包含される。これらの他の実施形態において、例えば、ブロックとして記載された機能、送信、通信、要求、応答および/またはメッセージは、実質的に同時または逆の順序も含めて、関連する機能性に応じて、示されたまたは記述された順序から外れた順序で実行してもよい。さらに、本明細書に記述のいずれのラダー図、シナリオおよびフローチャートを用いて、より多いもしくはより少ないブロックおよび/または機能を使用してもよく、またこれらラダー図、シナリオ、およびフローチャートは、部分的または全体的に互いに組み合わせてもよい。
【0135】
情報の処理を表すブロックは、本明細書に記載の方法または手法の特定の論理機能を実行するように構成することができる回路に対応してもよい。あるいは、またはさらに、情報の処理を表すブロックは、モジュール、セグメント、またはプログラムコードの一部(関連データを含めて)に対応してもよい。プログラムコードは、方法または手法において特定の論理機能または動作を実行するために、プロセッサで実行可能な1または複数の命令を含んでよい。プログラムコードおよび/または関連データは、ディスクもしくはハードドライブもしくは他のストレージ媒体を含むストレージデバイスなどの任意の種類のコンピュータ読み取り可能な媒体に格納してもよい。
【0136】
コンピュータ読み取り可能な媒体は、レジスタメモリ、プロセッサキャッシュ、およびランダムアクセスメモリ(RAM)などの、短期間データを記憶するコンピュータ読み取り可能な媒体などの、非一時的なコンピュータ読み取り可能な媒体も含めてよい。コンピュータ読み取り可能な媒体は、例えば、リードオンリーメモリ(ROM)、光学もしくは磁気ディスク、コンパクトディスク・リードオンリーメモリ(CD‐ROM)のような、二次もしくは持続的長期記憶装置などの、より長期間プログラムコードおよび/またはデータを格納する非一時的なコンピュータ読み取り可能な媒体も含めてよい。コンピュータ読み取り可能な媒体は、いかなる他の揮発性または不揮発性ストレージシステムであってもよい。コンピュータ読み取り可能な媒体は、例えば、コンピュータ読み取り可能なストレージ媒体、または有形のストレージデバイスと見なしてもよい。さらに、1または複数の情報送信を表すブロックは、同じ物理デバイス内のソフトウェアモジュールおよび/またはハードウェアモジュールの間の情報送信に対応することができる。しかし、他の情報送信は、異なる物理デバイス内のソフトウェアモジュールおよび/またはハードウェアモジュールの間にあり得る。
【0137】
本開示の多数の修正および変更は、上記の教示を考慮して可能である。
【0138】
本明細書に示す特徴は一例であり、かつ本発明の好ましい実施形態の例示考察の目的のためだけであり、本発明の種々の実施形態の原理および概念的態様についての最も有用で容易に理解される説明と思われるものを提供するために提示される。この点に関し、本発明の構造的な詳細を本発明の基本的理解に必要とされるよりも詳細に示す試みはなされていないが、当業者であれば、図面および/または実施例とともになされる説明により本発明のいくつかの形態が実際に実施される方法は明らかであろう。