IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ユナイテッド キングダム リサーチ アンド イノベーションの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-26
(54)【発明の名称】生体分子を提示する方法
(51)【国際特許分類】
   C12Q 1/6844 20180101AFI20240918BHJP
   C12N 9/12 20060101ALI20240918BHJP
   C12Q 1/6834 20180101ALI20240918BHJP
   C12N 15/13 20060101ALI20240918BHJP
   C12N 15/52 20060101ALI20240918BHJP
   C12Q 1/25 20060101ALI20240918BHJP
   C12Q 1/6869 20180101ALI20240918BHJP
【FI】
C12Q1/6844 Z ZNA
C12N9/12
C12Q1/6834 Z
C12N15/13
C12N15/52 Z
C12Q1/25
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024515532
(86)(22)【出願日】2022-09-06
(85)【翻訳文提出日】2024-05-02
(86)【国際出願番号】 EP2022074731
(87)【国際公開番号】W WO2023036772
(87)【国際公開日】2023-03-16
(31)【優先権主張番号】2112907.7
(32)【優先日】2021-09-10
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TRITON
2.TWEEN
3.PYTHON
(71)【出願人】
【識別番号】524089305
【氏名又は名称】ユナイテッド キングダム リサーチ アンド イノベーション
(74)【代理人】
【識別番号】100097456
【弁理士】
【氏名又は名称】石川 徹
(72)【発明者】
【氏名】ベンジャミン ポレブスキー
(72)【発明者】
【氏名】フィリップ ホリガー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA20
4B063QQ52
4B063QR08
4B063QS25
4B063QS39
(57)【要約】
本発明は、基質上、例えばフローセル表面上で生体分子を提示する方法に関する。本発明は、基質上で、XNA分子、RNA分子、及び/又はポリペプチドを、上流で、下流で、又は直接的に提示する方法に関する。本発明は更に、本発明の方法により取得された又は取得可能な生体分子を提示する基質に関する。
【選択図】なし
【特許請求の範囲】
【請求項1】
非DNA核酸分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させること、を含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化されたDNAプライマーであり、
該重合の生成物は、該プライマーを介して該基質上に固定化された非DNAヌクレオチド鎖であり、そして
該核酸ポリメラーゼは、DNAプライマーへ作用して一本鎖核酸テンプレートに相補的な非DNA核酸分子を合成可能なポリメラーゼである;及び
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法。
【請求項2】
前記第2の核酸はRNA分子である、請求項1に記載の方法。
【請求項3】
前記核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%同一性を有するアミノ酸配列を含み、そして該アミノ酸配列は、配列番号1のアミノ酸配列に関してY409及びE664変異を含む、請求項2に記載の方法。
【請求項4】
前記Y409変異はY409N又はY409Gであり、かつ前記E664変異はE664K又はE664Qである、請求項3に記載の方法。
【請求項5】
前記Y409変異はY409Gであり、かつ前記E664変異はE664Kである、請求項3に記載の方法。
【請求項6】
前記核酸ポリメラーゼのアミノ酸配列は、配列番号3を含む、請求項3に記載の方法。
【請求項7】
前記第2の核酸はXNA分子である、請求項1に記載の方法。
【請求項8】
前記XNA分子は、アラビノヌクレオチド、アラビノ核酸(ANA)ヌクレオチド、2'-フルオロアラビノ核酸(FANA)ヌクレオチド、2'-O-メチルリボ核酸(2'OMe)ヌクレオチド、2'-O-メトキシエチル(MOE)核酸ヌクレオチド、ホスホロチオアート 2'-O-メトキシエチル(PS-MOE)ヌクレオチド、ホスホロジアミダート モルホリノヌクレオチド、ロック核酸(LNA)ヌクレオチド、P-アルキルホスホナート核酸(phNA)ヌクレオチド、トレオース核酸(TNA)ヌクレオチド、ヘキシトール核酸(HNA)ヌクレオチド、2'-ヒドロキシヘキシトール(AtNA)ヌクレオチド、シクロヘキセン核酸(CeNA)ヌクレオチド、又は、3'-デオキシ-DNA(2'-5')ヌクレオチドを含む、請求項7に記載の方法。
【請求項9】
前記核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列を含み、更に、少なくとも1種のXNAヌクレオチド又はRNAヌクレオチドの重合を可能にする変異を含む、請求項1~8のいずれか1項に記載の方法。
【請求項10】
前記核酸ポリメラーゼのアミノ酸配列は、V93Q、D141A、E143A、及びA485Lの変異の1以上又は全てを含む、請求項9に記載の方法。
【請求項11】
前記ポリメラーゼは、TGK、TGLLK、2M、Bst、RT521、6G12、6G12521、C7、PGLVV、PGLVVWA、D4K、又はそのバリアントである、請求項1~10のいずれか1項に記載の方法。
【請求項12】
前記方法は、工程ii)a)の後に、前記第1の核酸を切断して前記ブリッジを直鎖化することを含む、請求項1~11のいずれか1項に記載の方法。
【請求項13】
更に、前記直鎖化した生成物を、重合に適した条件下で前記核酸ポリメラーゼと再接触させることを含む、請求項12に記載の方法。
【請求項14】
非DNA核酸分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させること、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化され、そして
該重合の生成物は、該プライマーを介して該基質上に固定化された非DNAヌクレオチド鎖である;
b)該第1の核酸を切断して前記ブリッジを直鎖化すること;及び
c)工程b)の該直鎖化した生成物を、重合に適した条件下で核酸ポリメラーゼと接触させること、を含む;並びに
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法。
【請求項15】
前記第2の核酸はRNA分子である、請求項14に記載の方法。
【請求項16】
前記ブリッジは温度によって変性する、請求項12~15のいずれか1項に記載の方法。
【請求項17】
前記第1の核酸は、ホルムアミドピリミジンDNAグリコシラーゼ(Fpg)で8-オキソグアニン部位で切断される、請求項12~16のいずれか1項に記載の方法。
【請求項18】
第3の核酸が、Fpgでの切断前に、前記第1の核酸と前記8-オキソグアニン部位でアニールされる、請求項17に記載の方法。
【請求項19】
工程ii)a)は、少なくとも5、10、12、15、20、又は25サイクルのブリッジ増幅を含む、請求項1~18のいずれか1項に記載の方法。
【請求項20】
前記第1の核酸は、工程iii)中で該第1の核酸を変性剤と接触させることにより除去される、請求項1~19のいずれか1項に記載の方法。
【請求項21】
前記変性剤は:
1~500 mM NaOH及び0~20 mM EDTA;又は
100 mM NaOH及び5 mM EDTA
を含むバッファである、請求項20に記載の方法。
【請求項22】
前記第2の核酸はRNA分子であって、ポリペプチドをコードしており、更に:
iv)該第2の核酸を、リボソームと、該コードされるポリペプチドの翻訳に適した条件下で接触させる工程、を含む、請求項1~21のいずれか1項に記載の方法。
【請求項23】
工程iv)の前記条件は、トリメチルアミンN-オキシド(TMAO)を含む、請求項22に記載の方法。
【請求項24】
前記コードされるポリペプチドは、抗体断片又は酵素である、請求項22又は23に記載の方法。
【請求項25】
前記コードされるポリペプチドは、一本鎖可変断片(scFv)、ペプチド、フィブロネクチンIII型ドメイン(FN3ドメイン)、単一ドメイン抗体(sdAb、ナノボディとしても知られる)、アフィボディ、ダルピン、フィノマー、OBody、又はアビマーである、請求項22~24のいずれか1項に記載の方法。
【請求項26】
ポリペプチドを基質上に提示する方法であって:
i)一本鎖可変断片(scFv)をコードしているアンチセンス配列を含む第1の核酸を用意する工程であり、ここで該第1の核酸は、基質上に固定化されており、かつ、その固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
該第1の核酸を、RNA重合に適した条件下で核酸ポリメラーゼと接触させることを含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化され、そして
該重合の生成物は、該プライマーを介して該基質上に固定化されたRNAヌクレオチド鎖である;
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程;及び
iv)該第2の核酸を、リボソームと、該コードされているscFvの翻訳に適した条件下で接触させる工程であって、工程iv)の該条件は、トリメチルアミンN-オキシド(TMAO)を含む、前記方法。
【請求項27】
前記TMAOは、0.05~1.5 M、0.05~1.2M、又は4 Mの濃度である、請求項23~26のいずれか1項に記載の方法。
【請求項28】
前記リボソーム-ポリペプチド複合体は、リボソーム提示バッファの適用により安定化される、請求項22~27のいずれか1項に記載の方法。
【請求項29】
前記リボソーム提示バッファは:
7 mMのMgCl2を超える;又は
8、9、10、15、20、25、30、40、50、60、70、80、90、若しくは100 mMのMgCl2若しくはMgAcと同等である;又は
8~100 mM、10~90 mM、15~85 mM、20~80 mM、25~75 mM、30~70 mM、35~65 mM、40~60 mM、45~55 mMのMgCl2と同等である;又は
8~100 mM、10~90 mM、15~85 mM、20~80 mM、25~75 mM、30~70 mM、35~65 mM、40~60 mM、若しくは45~55 mMのMgAcと同等である、マグネシウム濃度を有する、請求項28に記載の方法。
【請求項30】
前記第2の核酸はRNA分子であり、本方法によって提示ライブラリが作成されるように、複数のポリペプチドをコードしている複数の第1の核酸が工程i)で用意される、請求項1~29のいずれか1項に記載の方法。
【請求項31】
工程i)で用意される前記基質上に固定化された前記第1の核酸は:
1)テンプレート核酸を用意する工程;
2)該テンプレート核酸を、基質に固定化されたプライマーへハイブリダイズさせる工程;
3)該ハイブリダイズしたテンプレート核酸を、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触させて、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸を合成する工程;
4)該第1の核酸のブリッジ増幅を実施して、該第1の核酸のクラスターを生成する工程;及び
5)該第1の核酸の少なくとも一部をシーケンシングする工程、により生成される、請求項1~30のいずれか1項に記載の方法。
【請求項32】
前記ブリッジ増幅は:
32~35増幅サイクルを含み、
サイクルあたり60~120秒の伸長時間を有し、
2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含む、並びに/又は
95~99.9%ホルムアミド、任意で1~10 mM NaOH、及び任意で1~5 mM EDTAを含む変性バッファの使用を含む、請求項31に記載の方法。
【請求項33】
前記ブリッジ増幅は:
32増幅サイクルを含み、
サイクルあたり60秒の伸長時間を有し、
6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含む、並びに/又は、
98%ホルムアミド、10 mM NaOH、及び1 mM EDTAを含む変性バッファの使用を含む、請求項32に記載の方法。
【請求項34】
基質に結合した核酸のクラスターを調製する方法であって:
1)テンプレート核酸を用意する工程;
2)該テンプレート核酸を、基質に固定化されたプライマーへハイブリダイズさせる工程;
3)該ハイブリダイズしたテンプレート核酸を、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触させて、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸を合成する工程;並びに
4)該第1の核酸のブリッジ増幅を実施して、該第1の核酸のクラスターを生成する工程を含み、該ブリッジ増幅は32~35増幅サイクルで行われ、サイクルあたり60~120秒の伸長時間を有し、2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含み、及び、95~99.9%ホルムアミド、任意で1~10 mM NaOH、及び任意で1~5 mM EDTAを含む変性バッファの使用を含む、前記方法。
【請求項35】
前記ブリッジ増幅は:
32増幅サイクルを含み、
サイクルあたり60秒の伸長時間を有し、
6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含む、並びに/又は、
98%ホルムアミド、10 mM NaOH、及び1 mM EDTAを含む変性バッファの使用を含む、
請求項34に記載の方法。
【請求項36】
請求項1~21又は30~33のいずれか1項に記載の方法により取得された又は取得可能な、非DNA核酸分子を提示する基質。
【請求項37】
請求項1~6、9~21、又は30~33のいずれか1項に記載の方法により取得された又は取得可能な、RNA分子を提示する基質。
【請求項38】
請求項1、7~14、16~21、又は31~33のいずれか1項に記載の方法により取得された又は取得可能な、XNA分子を提示する基質。
【請求項39】
請求項22~33のいずれか1項に記載の方法により取得された又は取得可能な、ポリペプチド分子を提示する基質。
【請求項40】
基質上に固定化されたDNAプライマーを伸長して、一本鎖核酸テンプレートに相補的な非DNA核酸分子を合成するための、核酸ポリメラーゼの使用。
【請求項41】
前記核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%類似性又は同一性を有するアミノ酸配列を含み、かつY409及びE664変異を含み、ここで前記核酸テンプレートに相補的なRNA分子が重合される、請求項40記載の使用。
【請求項42】
前記核酸ポリメラーゼは、配列番号3のアミノ酸配列に対して少なくとも80%、90%、95%、99%、又は100%同一性を有し、かつ残基93、141、143、409、485、及び664は不変である配列を含む、請求項41記載の使用。
【請求項43】
前記核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、更に、少なくとも1種のXNAヌクレオチド又はRNAヌクレオチドの重合を可能にする変異を含むアミノ酸配列を含む、請求項40~42のいずれか1項に記載の使用。
【請求項44】
前記核酸ポリメラーゼのアミノ酸配列は、V93Q、D141A、E143A、及びA485Lの変異の1以上又全てを含む、請求項40~43のいずれか1項に記載の使用。
【請求項45】
前記ポリメラーゼは、TGK、TGLLK、2M、Bst、RT521、6G12、6G12521、C7、PGLVV、PGLVVWA、D4K、又はそのバリアントである、請求項40~44のいずれか1項に記載の使用。
【請求項46】
複数の生体分子を提示する基質をスクリーニングする方法であって、該基質は、請求項36~39のいずれか1項に記載の基質であり、かつ該生体分子はライブラリを形成する、前記方法。
【請求項47】
前記提示された非DNA核酸分子又はポリペプチド分子をスクリーニングする工程を更に含む、請求項1~33のいずれか1項に記載の方法。
【請求項48】
前記スクリーニングは、提示された生体分子、非DNA核酸分子、又はポリペプチド分子の、リガンド若しくは標的分子に対する親和性を測定すること、又は酵素機能を測定すること、を含む請求項46又は47に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
(発明の分野)
本発明は、基質上、例えばフローセル表面上で生体分子を提示する方法に関する。本発明は、基質上での、ゼノ核酸(XNA)分子、RNA分子、及び/又はポリペプチドの、上流で、下流で、又は直接的に提示する方法に関する。本発明は更に、本発明の方法により取得された又は取得可能な生体分子を提示する基質に関する。
【0002】
(本発明の背景)
生物学的分子のハイスルー分析、例えば結合親和性又は他の特性の分析を可能にするプラットフォームは、創薬にとって重要である。フローセルは、DNA分子を提示させ、次にそのDNA分子を照合すると位置情報及び配列情報の両方を得ることができる基質として一般的に使用されている。
【0003】
RNA分子又はポリペプチドを提示するフローセルを利用する試みがなされている。例えば、フローセルに固定化されたDNAクラスターを使用して、失速RNAポリメラーゼを介してDNAクラスターへ非共有結合しているRNAを生成する幾つかの方法がある。そしてそのRNAは翻訳され得る。このような方法には、WO2014/189768、Laytonらの文献(Laytonらの文献、2019, Molecular Cell 73, 1075 1082)、及びUS2019/0112730に開示されたものが含まれる。しかし、これらのアプローチには欠点が知られている。例えば、これらの複合体は、そのフローセルに共有結合しておらず、経時分解する可能性があり、アッセイにはシグナル消失正規化技術を使用する必要がある。更に、これら複合体を変性可能な条件が必要となる分析を行うことはできない。これら複合体は、例えば、高温、化学変性剤、低濃度又は高濃度のマグネシウムで解離してしまう。低濃度のマグネシウムは、この複合体からリボソームを解離させる。高濃度のマグネシウムは、この複合体からRNAポリメラーゼを解離する可能性がある。従って、これらの提示技術には限界がある。
【0004】
Svensenらは、Illumina DNAシーケンシング技術によって生成させた、フローセル結合した同じDNAストランドのクラスターを、相補的なRNAのクラスターに転換し、次にペプチドクラスターに転換する方法を報告している(Chembiochem. 2016 September 02;17(17): 1628-1635. doi:10.1002/cbic.201600298)。この方法は、ポリオウイルス3Dpolポリメラーゼによって使用できるように、フローセル結合したプライマーをリボヌクレオチドで改変する必要がある。生成されるRNAの収率は最適とはいえず、そのため生成ポリペプチドの収量は増大可能であろう。
【0005】
このように、当分野では、前述の問題を克服する生体分子の提示方法が求められている。
【0006】
Moriizumiらは、インビトロ翻訳に関する知見を提供している(Moriizumi, Yoshikiらの文献、「浸透圧調節物質で増強される再構成された翻訳システムのタンパク質合成活性(Osmolyte-enhanced protein synthesis activity of a reconstituted translation system)」ACS synthetic biology 8.3(2019): 557-567)。
【発明の概要】
【発明が解決しようとする課題】
【0007】
(発明の概要)
本発明者らは、本明細書で、ハイスループット創薬プラットフォームの作成を可能にする方法を提供する。本発明者らは、XNA、RNA、及びポリペプチドを含む生物学的分子の基質に結合したライブラリを作成し、これらのライブラリが、例えば結合親和性又は酵素活性の測定により、照合し得ることを示す。
【0008】
具体的には、本発明者らは、最大で108バリアントのライブラリのシーケンシング及びスクリーニングを、レプリケーション測定を含め2~3日間で行うことができた。配列機能のペア情報を、全てのライブラリバリアントについて作成することができる。
【0009】
このように、本明細書に開示されるプラットフォームは、今までなかった量の高分解能データを生成し、そのデータは、例えば治療薬をエンジニアリングする際に機械学習と組合せて使用することができる。
【0010】
本発明の態様では、非DNA核酸分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させること、を含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化されたDNAプライマーであり、
該重合の生成物は、該プライマーを介して該基質上に固定化された非DNAヌクレオチド鎖であり、そして
該核酸ポリメラーゼは、DNAプライマーへ作用して一本鎖核酸テンプレートに相補的な非DNA核酸分子を合成可能なポリメラーゼである;及び
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法が提供される。
【0011】
第2の核酸は、RNA分子でもよい。核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%同一性を有するアミノ酸配列を含み、そして該アミノ酸配列は、配列番号1のアミノ酸配列に関してY409及びE664変異を含むものでもよい。Y409変異はY409N又はY409Gでもよく、そしてE664変異はE664K又はE664Qでもよい。1の特別な実施態様では、前記Y409変異はY409Gであり、かつ前記E664変異はE664Kである。前記核酸ポリメラーゼのアミノ酸配列は、配列番号3を含み得る。
【0012】
第2の核酸は、XNA分子でもよい。例えば、XNA分子は、アラビノヌクレオチド、アラビノ核酸(ANA)ヌクレオチド、2'-フルオロアラビノ核酸(FANA)ヌクレオチド、2'-O-メチルリボ核酸(2'OMe)ヌクレオチド、2'-O-メトキシエチル(MOE)核酸ヌクレオチド、ホスホロチオアート 2'-O-メトキシエチル(PS-MOE)ヌクレオチド、ホスホロジアミダート モルホリノヌクレオチド、ロック核酸(LNA)ヌクレオチド、P-アルキルホスホナート核酸(phNA)ヌクレオチド、トレオース核酸(TNA)ヌクレオチド、ヘキシトール核酸(HNA)ヌクレオチド、2'-ヒドロキシヘキシトール(AtNA)ヌクレオチド、シクロヘキセン核酸(CeNA)ヌクレオチド、又は、3'-デオキシ-DNA(2'-5')ヌクレオチドを含み得る。
【0013】
核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、更に、少なくとも1種のXNAヌクレオチド又はRNAヌクレオチドの重合を可能にする変異を含む、アミノ酸配列を含み得る。核酸ポリメラーゼのアミノ酸配列は、V93Q、D141A、E143A、及びA485Lの変異の1以上又は全てを含み得る。特に、ポリメラーゼは、TGK、TGLLK、2M、Bst、RT521、6G12、6G12521、C7、PGLVV、PGLVVWA、D4K、又はそのバリアントでもよい。
【0014】
前記方法は、工程ii)a)の後に、第1の核酸を切断してブリッジを直鎖化することを含み得る。前記方法は更に、直鎖化した生成物を、重合に適した条件下で核酸ポリメラーゼと再接触させることを含み得る。
【0015】
本発明の別の態様では、非DNA核酸分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させること、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化され、そして
該重合の生成物は、該プライマーを介して該基質上に固定化された非DNAヌクレオチド鎖である;
b)該第1の核酸を切断して前記ブリッジを直鎖化すること;及び
c)工程b)の該直鎖化した生成物を、重合に適した条件下で核酸ポリメラーゼと接触させること、を含む;並びに
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法が提供される。
【0016】
第2の核酸は、RNA分子でもよい。前記ブリッジは、温度により変性されてもよい。
【0017】
第1の核酸は、ホルムアミドピリミジンDNAグリコシラーゼ(Fpg)で8-オキソグアニン部位で切断されてもよい。第3の核酸が、Fpgでの切断前に、第1の核酸と8-オキソグアニン部位でアニールされてもよい。
【0018】
工程ii)a)は、少なくとも5、10、12、15、20、又は25サイクルのブリッジ増幅(bridged polymerisation)を含み得る。第1の核酸は、工程iii)中で第1の核酸を変性剤と接触させることにより除去されてもよい。変性剤は、1~500 mM NaOH及び0~20 mM EDTA;又は100 mM NaOH及び5 mM EDTAを含むバッファでもよい。
【0019】
1の実施態様では、第2の核酸はRNA分子であって、ポリペプチドをコードしており、更に、前記方法はiv)第2の核酸を、リボソームと、該コードされるポリペプチドの翻訳に適した条件下で接触させる工程、を含む。工程iv)の前記条件は、トリメチルアミンN-オキシド(TMAO)を含み得る。TMAOは、0.05~1.5 M、0.05~1.2M、又は4 Mの濃度でもよい。
【0020】
本発明の態様では、ポリペプチドを基質上に提示する方法であって:
i)一本鎖可変断片(scFv)をコードしているアンチセンス配列を含む第1の核酸を用意する工程であり、ここで該第1の核酸は、基質上に固定化されており、かつ、その固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
該第1の核酸を、RNA重合に適した条件下で核酸ポリメラーゼと接触させることを含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化され、そして
該重合の生成物は、該プライマーを介して該基質上に固定化されたRNAヌクレオチド鎖である;
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程;及び
iv)該第2の核酸を、リボソームと、該コードされているscFvの翻訳に適した条件下で接触させる工程であって、工程iv)の該条件は、トリメチルアミンN-オキシド(TMAO)を含む、前記方法が提供される。
【0021】
リボソーム-ポリペプチド複合体は、リボソーム提示バッファの適用により安定化されてもよい。前記リボソーム提示バッファは、7 mMのMgCl2を超える;又は8、9、10、15、20、25、30、40、50、60、70、80、90、若しくは100 mMのMgCl2若しくはMgAcと同等である;又は8~100 mM、10~90 mM、15~85 mM、20~80 mM、25~75 mM、30~70 mM、35~65 mM、40~60 mM、45~55 mMのMgCl2と同等である;又は8~100 mM、10~90 mM、15~85 mM、20~80 mM、25~75 mM、30~70 mM、35~65 mM、40~60 mM、若しくは45~55 mMのMgAcと同等である、マグネシウム濃度を含み得る。
【0022】
1の実施態様では、前記第2の核酸はRNA分子であり、提示ライブラリが作成されるように、複数のポリペプチドをコードしている複数の第1の核酸が工程i)で用意される。前記コードされるポリペプチドは、抗体断片又は酵素でもよい。前記コードされるポリペプチドは、一本鎖可変断片(scFv)、ペプチド、フィブロネクチンIII型ドメイン(FN3ドメイン)、単一ドメイン抗体(sdAb、ナノボディとしても知られる)、アフィボディ、ダルピン(darpin)、フィノマー(fynomer)、OBody、又はアビマーでもよい。
【0023】
工程i)で用意される基質上に固定化された第1の核酸は:
1)テンプレート核酸を用意する工程;
2)該テンプレート核酸を、基質に固定化されたプライマーへハイブリダイズさせる工程;
3)該ハイブリダイズしたテンプレート核酸を、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触させて、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸を合成する工程;
4)該第1の核酸のブリッジ増幅を実施して、該第1の核酸のクラスターを生成する工程;及び
5)該第1の核酸の少なくとも一部をシーケンシングする工程、により生成されてもよい。
【0024】
1の実施態様では、ブリッジ増幅は:32~35増幅サイクルを含み、サイクルあたり60~120秒の伸長時間を有し、2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含む、並びに/又は、95~99.9%ホルムアミド、任意で1~10 mM NaOH、及び任意で1~5 mM EDTAを含む変性バッファの使用を含む。1の特別な実施態様では、ブリッジ増幅は、32増幅サイクルを含み、サイクルあたり60秒の伸長時間を有し、6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含む、並びに/又は、98%ホルムアミド、10 mM NaOH、及び1 mM EDTAを含む変性バッファの使用を含む。
【0025】
本発明の態様では、基質に結合した核酸のクラスターを調製する方法であって:
1)テンプレート核酸を用意する工程;
2)該テンプレート核酸を、基質に固定化されたプライマーへハイブリダイズさせる工程;
3)該ハイブリダイズしたテンプレート核酸を、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触させて、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸を合成する工程;及び
4)該第1の核酸のブリッジ増幅を実施して、該第1の核酸のクラスターを生成する工程を含み、該ブリッジ増幅は32~35増幅サイクルで行われ、サイクルあたり60~120秒の伸長時間を有し、2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含み、並びに、95~99.9%ホルムアミド、任意で1~10 mM NaOH、及び任意で1~5 mM EDTAを含む変性バッファの使用を含む、前記方法が提供される。
【0026】
1の実施態様では、ブリッジ増幅は、32増幅サイクルを含み、サイクルあたり60秒の伸長時間を有し、6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含む、並びに/又は、98%ホルムアミド、10 mM NaOH、及び1 mM EDTAを含む変性バッファの使用を含む。
【0027】
本発明の態様では、本明細書に開示される方法により取得された又は取得可能な非DNA核酸分子を提示する基質が提供される。本発明の態様では、本明細書に開示される方法により取得された又は取得可能なRNA分子を提示する基質が提供される。本発明の態様では、本明細書に開示される方法により取得された又は取得可能なXNA分子を提示する基質が提供される。本発明の態様では、本明細書に開示される方法により取得された又は取得可能なポリペプチド分子を提示する基質が提供される。
【0028】
本発明の態様では、基質上に固定化されたDNAプライマーを伸長して、一本鎖核酸テンプレートに相補的な非DNA核酸分子を合成するための、核酸ポリメラーゼの使用が提供される。核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%類似性又は同一性を有するアミノ酸配列を含み得、かつY409及びE664変異を含み得、そして、前記核酸テンプレートに相補的なRNA分子が重合され得る。核酸ポリメラーゼは、配列番号3のアミノ酸配列に対して少なくとも80%、90%、95%、99%、又は100%同一性を有し、かつ残基93、141、143、409、485、及び664は不変である配列を含み得る。核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列を含み、更に、少なくとも1種のXNAヌクレオチド又はRNAヌクレオチドの重合を可能にする変異を含むものでもよい。核酸ポリメラーゼのアミノ酸配列は、V93Q、D141A、E143A、及びA485Lの変異の1以上又全てを含み得る。特に、ポリメラーゼは、TGK、TGLLK、2M、Bst、RT521、6G12、6G12521、C7、PGLVV、PGLVVWA、D4K、又はそのバリアントでもよい。
【0029】
本発明の態様では、複数の生体分子を提示する基質をスクリーニングする方法であって、該基質は本明細書に開示されるいずれかであり、かつ該生体分子はライブラリを形成する、前記方法が提供される。
【0030】
本発明の別の態様では、本明細書に開示されるような非DNA核酸分子又はポリペプチドを提示する方法であって、前記提示された非DNA核酸分子又はポリペプチド分子をスクリーニングする工程を更に含む、前記方法が提供される。
【0031】
本明細書に開示されるスクリーニングは、提示された生体分子、非DNA核酸分子、又はポリペプチド分子の、リガンド若しくは標的分子に対する親和性を測定すること、又は酵素機能を測定すること、を含み得る。
【図面の簡単な説明】
【0032】
(図面の簡単な説明)
図1図1は、本発明によるポリペプチドのクラスターを基質上に提示する代表的なプロセスを示す。この図解では、次のプロセスをカバーしている。A)DNA分子のクラスターを生成し、その位置情報及び配列情報を得ること。1の態様では、本発明の方法は、本明細書に開示されるようなクラスターを生成する改良された方法に関する。この改良された方法は、300アミノ酸を超える長いポリペプチドの提示で使用するのに特に適している。B)DNAのクラスターを、エンジニアリングポリメラーゼ及び直鎖化工程によりRNAのクラスターへ変換すること。この直鎖化は、ブリッジ化RNAの合成中に蓄積されたトルクを解放し、長いRNA分子(>1.2kb)の全長合成を可能にする。C)記載された構造体設計に従ったRNAクラスター内にコードされたポリペプチドの、インビトロ翻訳及びリボソーム提示、並びに提示されたポリペプチドに対する結合親和性を測定するプロセス。D)シーケンシング及び結合データの下流解析。
【0033】
図2図2は、一本鎖可変断片(scFv)をコードしているRNA分子のライブラリをフローセル上で作成した例を示す。上のパネル「トルク開放なし」は、TGKポリメラーゼでのRNA合成12サイクル、その後FpgでDNAテンプレートの直鎖化。下のパネル「トルク開放あり」は、TGKポリメラーゼでのRNA合成12サイクル、その後FpgでのDNAテンプレート直鎖化2サイクル、更にTGKポリメラーゼでのRNA合成。画像は、蛍光オリゴヌクレオチドプローブのRNA3'末端への結合レベルを示す。上のパネル作成のための方法で達成されたRNA合成量は不完全であり、下のパネルの方法でははるかに高いレベルが達成された。
【0034】
図3図3は、リボソーム提示バッファ中のマグネシウム濃度の効果測定例を示す。幾つかの従来技術方法は、7 mM以下のMgCl2と同等のマグネシウム濃度に制限されており、その理由は高濃度では失速しているRNAP:RNA複合体が変性する可能性があるからである。本明細書に開示された方法は、マグネシウムをはるかに高濃度で使用し得る。図3は、低マグネシウム条件対高マグネシウム条件でのHer2結合(100 nM Her2-ビオチン及び100 nM AF532-ストレパビジン)のレベルを示す。高マグネシウム条件では、結合及び提示効率が5倍向上した。
【0035】
図4図4.ディープスクリーニングワークフロー。1)ディープスクリーニングを、ライブラリ調製から始め、ライブラリのタンパク質コード領域の両端への5'及び3'非翻訳領域(UTR)の付加を行う。次にアセンブルしたライブラリをクラスター化し、N28 UMIをHiSeq 2500上でシーケンシングすると、UMI配列及びフローセル上でのその物理的x-y座標の報告が得られる。2)次にシーケンシングしたフローセルを、DNAのクラスターをRNAのクラスターへ変換してDNAテンプレートを除去することにより、ディープスクリーニングに使用する。RNAクラスターを、Atto647N標識化オリゴで標識した後に、タンパク質へ翻訳してリボソーム提示を介してそのRNAへ結合する。提示に続いて、ビオチン化抗原及びAF532標識化ストレプトアビジンの高濃度での平衡結合によりオンチップ結合アッセイを行い、その後にカイネティック解離の実施を行う。3)結合アッセイでそのライブラリ内にヒットが報告された場合、新しいフローセル上で、シーケンシングランは、内部シーケンシングプライマーでUMI及びCDRのシーケンシングして実施される。次にCDRを、2つの実験間で共通のUMIを用いて、結合データとペアリングする。4)ペアリングしたCDR:結合データをヒットに関して分析し、及び又は、機械学習モデルを訓練し、ヒットを予測する。これは、その後のディープスクリーニングラウンド用ライブラリ、又は5)適切なフォーマットの特性評価用ヒット候補ショートリスト、のいずれかを作成するために使用できる。
【0036】
図5図5. A)選択のワークフロー。B)ライブラリ統計。C)300 nM HELでのR3 MACS及びR3 FACSライブラリの豊富性(Abundance)に対しディープスクリーニング統合した結合強度。ライブラリ平均強度を灰色破線で示し、緑色実線はライブラリバックグラウンドの2倍のヒットしきい値を示す。スピアマン順位相関定数0.361及び0.442はそれぞれ、豊富性とディープスクリーニング結合強度との間の相関性が低いことを示す。D)特性評価のヒット候補は、ライブラリ構造体の構成及びIDを示し、M1~23はR3 MACSライブラリに由来し、C1~8はR3 MACSライブラリのコロニー採取により特定したものであり、F1~10はR3 FACSライブラリに由来する。豊富性、CDR配列、ディープスクリーニングフィッティングした平衡結合KD及びOctetフィッティングしたカイネティクスKDも又、表示する。示された配列は、最初から表示順に配列番号41~150である。E)クローンM5、M6、M14、及びM15のディープスクリーニング平衡結合曲線及びカイネティック解離曲線。F)HEL-ビオチンをロードしたストレプトアビジンチップに対する、50 nMの同じ4つのクローンでのOctetカイネティクス。G)特性解析した全クローンについて、300 nM HELでのディープスクリーニング結合強度に対してプロットしたOctet KDにより、-0.697のスピアマン順位相関定数が示された。
【0037】
図6図6. A)直接的な親和性成熟実験の概要。B)ディープスクリーニングで選択されなかったL1L3ライブラリのライブラリ統計。C) 強度(ランク)により選別し、バックグラウンド正規化した0、100 pM及び1 nMでのhuIL-7のディープスクリーニング強度。D)IL70001及び上位19クローンであり、VL1及びVL3配列、333 pMでのhuIL-7の生のディープスクリーニング強度、OctetフィッティングしたKD及びIL7R IC50を示す。示された配列は、最初から表示順に、配列番号151~176である。E)huIL-7をロードしたストレプトアビジンチップに対する、50 nMでのIL70001、IL70100、IL70102、及びIL70105 FabのOctetカイネティクス。F)333 pMでhuIL-7の上位19クローンのディープスクリーニング平均強度を、フィッティングしたOctet KDに対してプロットしたもの。エラーバーは、平均値の標準誤差(SEM)である。灰色鉛直線は、333 pMでのhuIL-7の平均ライブラリ強度を示す。G)TF-1 STAT5 IL7Rα+γルシフェラーゼ阻害アッセイであり、IL70001、IL70100、IL70102、及びIL70105をアッセイの代表的範囲として示す。全ての阻害アッセイ曲線を、図15に示す。エラーバーは、標準偏差であり、n=2である。H)BLI/OctetフィッティングしたKDをIC50に対してプロットすると、親和性及び阻害(ρ=0.956、R2=0.901、log(y)=m×log(x)+c(灰色線)のフィッティング)の間の、強い非線形相関が明らかになった。
【0038】
図7図7は、特性解析した抗Her2一本鎖抗体(scFv)のライブラリを提示し、平衡結合親和性及びカイネティック解離速度を測定した実験を示す。A)クローンG98A、C6.5、ML3~9、H3B1、及びB1D2+A1の、CDR配列(VH3、VL1、及びVL3)及び結合親和性を示す構造体設計である。示された配列は、最初から表示順に配列番号177~184である。B)平衡結合及びカイネティック解離のフローセル画像。示された写真は、高濃度のHer2-ビオチン及び100 nMのAF532ストレプトアビジンでのフローセルの生画像、並びに、フローセルに結合バッファを100μl/分で注入してからの時間経過後のフローセルの生画像である。画像の最小/最大しきい値は、100/1000で同一に設定した。C)曲線を平衡結合及びカイネティック解離データにフィッティングし、A)のクローンに加えてハーセプチン(トラスツズマブ)も示す。これは、Her2-ビオチンの濃度に対してプロットした、処理した画像データと統合した結合シグナルの中央値を示す。平衡結合曲線をデータにフィッティングし、エラーバーを平均標準誤差(SEM)として示す。クローンあたり観察されるクラスター数が多数の場合は、SEMはプロットで視認不能である。2番目のグラフは、洗浄の時間経過に対してプロットした、処理した画像データと統合した結合シグナルの中央値を示す。二相の不均一系解離速度をデータにフィッティングし、エラーバーをSEMで示す。
【0039】
図8図8. G98Aの親和性成熟。A)G98Aの構造体概略図であり、そのCDR H3配列、及び、6つの走査ウィンドウNNSサブライブラリがどのように構造化されているかを示す(配列は配列番号177である)。B)ディープスクリーニングコンポーネントにおける159.8Mクラスターを示す実験統計であり、12のレプリケートを有する297kユニークバーコード及び236kユニークCDR VH3タンパク質配列を得た。示される配列は、配列番号177、180、185~187である。C)全236k VH3タンパク質配列を二次元投影し、100 nMのHer2での平均蛍光強度で色付けしたPCAプロット。赤点は、ライブラリに関するG98A野生型の位置を示す。D)G98A、ML3~9、及びディープスクリーニングで特定した3つの上位スコアリングクローンのCDR H3配列。配列の横は、ディープスクリーニング(DS)フィッティングした平衡結合KD及びOctetで特定した結合KDである。E)ディープスクリーニング平衡結合曲線及びカイネティック解離曲線であり、G98A、ML3~9及び3つの上位スコアリングクローンを示す。エラーバーはSEMである。F)G98A、ML3~9及び3つの上位スコアリングクローンの、Her2をロードしたoctetチップ上の各クローン20 nMでのOctetカイネティクス。
【0040】
図9図9.機械学習支援による抗体エンジニアリング。A)ディープスクリーニング第2ラウンド前の、3つの抗Her2シード配列のインシリコ変異導入、並びに13,121のランダム変異体及び11,916のML支援による変異体選択のために使用したワークフロー。示された配列は配列番号188~192である。B)選択したML変異体及びランダム変異体の5分間洗浄条件での評価により、ML変異体の結合分布は、ランダム変異体作製に比べて実質的に5倍シフトすることが明らかとなった。C)scFvとしてG98A、Her20006、13及び19のフローセルでの平衡結合及びカイネティック解離曲線。エラーバーはSEMである。D)Her2をロードしたチップの精製されたFabの濃度20 nMでのOctetによる結合カイネティクス。
【0041】
図10図10. 特性評価のためにMACSライブラリから選択した抗HELナノボディクローンに対する、ディープスクリーニングからの平衡結合曲線及びカイネティック解離曲線。曲線の各濃度条件は、ディープスクリーニング実験からの少なくとも12の測定値を表す。エラーバーはSEMである。平衡結合の平衡KD、曲線下面積(AUC)、並びに、二相系解離モデルの2つの解離速度及びAUCを報告する。
【0042】
図11図11. R3 MACSアウトプットから96コロニーの採取により選択した抗HELナノボディクローン、及び、R3 FACSライブラリスクリーニングで選択したクローンに対する、ディープスクリーニングからの平衡結合曲線及びカイネティック解離曲線。曲線内各濃度条件は、ディープスクリーニング実験からの少なくとも12の測定値を表す。エラーバーはSEMである。平衡結合の平衡KD、曲線下面積(AUC)、並びに、二相系解離モデルの2つの解離速度及びAUCを報告する。
【0043】
図12図12. MACSライブラリから選択した抗HELナノボディクローン(M1~M23)に対するOctet測定した結合及び解離カイネティクスであり、ナノボディクローンを50 nMで、HEL-ビオチンをロードしたストレプトアビジンチップへ結合させた。
【0044】
図13図13. 96コロニーの採取により選択した抗HELナノボディクローン(C1~C8)、及びMACSライブラリスクリーニングで選択した抗HELナノボディクローン(M1~M10)に対する、Octet測定した結合及び解離カイネティクスであり、ナノボディクローンを50 nMで、HEL-ビオチンをロードしたストレプトアビジンチップへ結合させた。
【0045】
図14図14. 特性評価のために選択した抗IL7 scFvクローンに対する、Octet測定した結合及び解離カイネティクス。ここで、各クローンは、scFvからFabへ転換し、発現し、精製し、そして50 nMへ標準化した。次にFabをhuIL7-ビオチンでプレロードしたストレプトアビジンチップへ結合させた。IL70001を除く全てのクローンに1:1モデルをフィッティングした。
【0046】
図15図15. TF-1 STAT5 IL7受容体(IL7R)α+γルシフェラーゼ阻害アッセイであり、IL7Rシグナル伝達発光を、全ての特性解析したクローンの対数モル濃度に対して個々にプロットした。エラーバーは標準偏差であり、n=2である。
【0047】
図16図16. TF-1 STAT5 IL7受容体(IL7R)α+γルシフェラーゼ阻害アッセイであり、IL7Rシグナル伝達発光を、全ての特性解析したクローンの対数モル濃度に対してプロットした。エラーバーは標準偏差であり、n=2である。
【0048】
図17図17. 特性評価のために選択した抗Her2 scFvに対する、ディープスクリーニングからの平衡結合曲線及びカイネティック解離曲線。曲線の各濃度条件は、「Her2affmat」(G98A~HER20011)又は「Her2 ML vs. Random」(HER20012~HER20026)いずれかのディープスクリーニング実験からの少なくとも12の測定値を表す。エラーバーはSEMである。平衡結合の平衡KD、曲線下面積(AUC)、並びに二相系解離モデルの2つの解離速度及びAUCを報告する。
【0049】
図18図18. 特性評価のために選択した抗Her2 scFvクローンに対する、Octet測定した結合及び解離カイネティクス。各クローンは、scFvからFabへ転換し、発現し、精製し、そして20 nMへ標準化した。次にFabをHer2-ビオチンでプレロードしたストレプトアビジンチップへ結合させた。G98Aを除く全てのクローンに1:1モデルをフィッティングした。
【0050】
図19図19は、FANAポリマー及び2'OMe-RNAポリマーの、基質上での提示及び機能的蛍光アッセイの成功を実証する。
【0051】
図20図20は、ペプチド、フィブロネクチンIII型(FN3)スキャフォールド、ナノボディ、及びscFvの、基質上での提示及び機能的蛍光アッセイの成功を実証する。
【0052】
図21図21は、本発明の方法によって提示し得る代表的なXNAを示す。
【発明を実施するための形態】
【0053】
(詳細な説明)
生体分子の基質上での提示を可能とする技術は、下流解析、例えばハイスループットスクリーニングを可能とするために重要である。本発明者らは、本明細書で非DNA核酸の基質上での提示を可能とする技術を提供する。
【0054】
1の態様では、本発明は、DNAプライマーから非DNA核酸を合成可能なポリメラーゼを使用して、基質上に固定化された生体分子を生成させる。
【0055】
従って、1の態様での本発明は、非DNA核酸分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させること、を含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化されたDNAプライマーであり、
該重合の生成物は、該プライマーを介して該基質上に固定化された非DNAヌクレオチド鎖であり、そして
該核酸ポリメラーゼは、DNAプライマーへ作用して一本鎖核酸テンプレートに相補的な非DNA核酸分子を合成可能なポリメラーゼである;及び
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法を提供する。
【0056】
結果的に生じる第2の核酸は、基質上に提示された一本鎖の非DNA核酸分子である。非DNA核酸の重合に適した条件は当分野で公知であり、例えばRNAヌクレオチド又はXNAヌクレオチド等の適切なヌクレオチドの準備が含まれる。
【0057】
幾つかの実施態様では、非DNA核酸はXNA分子である。XNA分子には、非天然型糖バックボーン、非天然型核酸塩基、非天然型リン酸ジエステル結合、非天然型結合、又は任意のそれらの組合せを有するヌクレオチド鎖が含まれる。XNAは、DNAプライマーへ作用してXNA分子の合成が可能なポリメラーゼによって重合され得るものでも良い。特に、XNAは、天然修飾核酸又は非天然核酸のいずれでもよく、それらのために天然又はエンジニアリングポリメラーゼが、DNAテンプレートからDNAプライマーを用いてポリヌクレオチドを合成可能である。適切なポリメラーゼを本明細書に記載する。
【0058】
例えば、XNA分子は、デオキシヌクレオチドの構造的アナログであり、糖部分の2'位にβ-ヒドロキシルが存在することによってのみ異なるアラビノヌクレオチドを含み得る。アラビノヌクレオチド分子は、アラビノ核酸(ANA)分子、又は2'-フルオロアラビノ核酸(FANA)分子でもよい。他の実施態様では、XNA分子は、2'-O-メチルリボ核酸(2'OMe)分子、2'-O-メトキシエチル(MOE)ヌクレオチド、ホスホロチオアート 2'-O-メトキシエチル(PS-MOE)ヌクレオチド、ホスホロジアミダート モルホリノオリゴヌクレオチド(PMO)、又はそれらの組合せでもよい。或いは、XNAは、P-アルキルホスホナート核酸(phNA)でもよい。phNAsでは、通常のリン酸ジエステル結合の非架橋酸素が、非荷電性アルキル置換基、特にメチル(Met)基又はエチル(Et))基で置換されている。他の実施態様では、XNA分子は、トレオース核酸(TNA)、ヘキシトール核酸(HNA)、2'ヒドロキシ-ヘキシトール(AtNA)、シクロヘキセン核酸(CeNA)、ロック核酸(LNA)、又は3'デオキシ-DNA(2'-5')でもよい。
【0059】
幾つかの実施態様では、非DNA核酸はRNA分子である。RNA分子は、天然体及び、非天然の修飾、例えばm6A、5-エチニル-U、ジアミノプリン、ホスホロチオアート、2'フルオロ、2'N3、2'NH2、3'O-メチル、及び非天然塩基対誘導体を含み得る。幾つかの実施態様では、RNA分子は修飾されていない。
【0060】
下表は、本発明の方法で提示し得るRNA及びXNAの例のリストである。
【表1】
*m6A、5-エチニル-U、ジアミノプリン、非天然塩基対等の修飾を含むRNAを含む。
【0061】
上表は、核酸ポリマー調製のための代表的なポリメラーゼのリストである。代表的なポリメラーゼを、更に本明細書で説明する。
【0062】
RNAを基質上に提示する実施態様では、第1の核酸はポリペプチドをコードしてもよい。例えば、第1の核酸は、タンパク質へ翻訳され得るRNA分子のためのテンプレートとして働くことのできるアンチセンス配列を含み得る。
【0063】
工程i)の第1の核酸は、基質上に生成されたクラスターの一部である核酸でもよい。例えば、核酸は、1の末端に第1のアダプターを、もう一方の末端に第2のアダプターを備え、それらアダプターの一つとハイブリダイズ可能な、固定化されたプライマーを介して基質へ結合されているDNA分子でもよい。その場合、この核酸を、例えば前述のプライマー、及びもう一つのアダプターとハイブリダイズ可能な第2の固定化されたプライマーを使用することによるブリッジ増幅を介してクラスターへと増幅することができる。このようにDNA分子のクラスターを生成する方法は当分野で公知であり、本発明ではそのような全ての方法の使用が包含される。特に好ましい方法を本明細書に開示する。
【0064】
「核酸クラスター」は当分野の用語であり、極めて近接して固定化された核酸分子の群をいう。極めて近接しているのは、通常、クラスターが単一の親分子からの増幅により生成されるためであり、そのためクラスターは同一配列を含む核酸からなる。クラスター形成技術の例には、ブリッジ増幅、及び結合平衡除外指数関数的増幅が含まれる。
【0065】
基質は、フローセル、ビーズ、スライド、又は膜の表面等の固体表面でもよい。特に、基質はフローセルでもよい。フローセルは、パターン化フローセルでも非パターン化フローセルでもよい。基質は、ガラス、クォーツ、シリカ、金属、セラミック、又はプラスチックを含み得る。基質表面は、ポリアクリルアミドマトリックス又はコーティングを含み得る。
【0066】
本明細書で使用される場合、用語「フローセル」は、当分野、特に合成によるシーケンシング分野における通常の意味を有することを意図している。代表的なフローセルには、限定されるものではないが、Illumina社(カリフォルニア州サンディエゴ)が市販しているGenome Analyzer(登録商標)、MiSeq(登録商標)、NextSeq(登録商標)、HiSeq(登録商標)、若しくはNovaSeq(登録商標)プラットフォーム用のフローセル、又はLife Technologies社(カリフォルニア州カールスバッド)が市販しているSOLiD(商標)若しくはIon Torrent(商標)シーケンシングプラットフォーム用のフローセルなど、核酸シーケンシング装置で使用されるものが含まれる。代表的なフローセル、並びにその製造及び使用方法は又、例えばWO2014/142841A1、米国特許出願公開番号2010/0111768A1及び米国特許番号8,951,781に記載されている。
【0067】
第1の核酸の少なくとも一部を、非DNA核酸分子を基質上に提示する方法の工程i)の前に、シーケンシングしてもよい。例えば、少なくとも1つのアダプターはバーコード配列を含み得るものであり、そのバーコードはシーケンシングされてもよい。このような各バーコード配列の基質上の配置は、公知のものでもよい。これら技術は当分野で公知である。
【0068】
基質への固定化とは、二本鎖の核酸を変性させるかもしれない条件下であっても、その核酸が基質に結合していることを意味する。例えば、核酸は、基質へ共有結合していてもよい。核酸は、ポリアクリルアミドコートされた基質上に固定化されてもよい。
【0069】
第1の核酸は、その固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている。この配置は、固定化されたプライマーと組合せることにより、ブリッジ増幅を可能とし得る。これらの配置は、当分野で標準的である。
【0070】
「核酸ブリッジ」は当分野の用語であり、その両末端で基質に結合した核酸をいう。通常は、末端の一方(例えば、5'末端)が基質に固定化され、もう一方の末端がハイブリダイゼーションによって、それ自身も基質に固定化されている相補性核酸に結合する。ブリッジ増幅は、そのテンプレートがブリッジであるときに生じる。
【0071】
本発明の実施態様では、固定化された第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させる。この重合のためのプライマーは、その基質上に同様に固定化されているDNAプライマーであり、その結果、重合中にブリッジが形成される。ポリメラーゼは、使用されるとDNAプライマーへ作用して該第1の核酸に相補的な非DNA分子を合成可能なものである。従って、重合生成物は、プライマーを介して基質上に固定化された非DNAヌクレオチド鎖である。
【0072】
DNAプライマーは、修飾された又は非DNAヌクレオチドを含み得る。しかし、DNAプライマーは、その3'末端にRNAヌクレオチドを含まず、従って、ポリメラーゼは、RNAプライマーを必要としないポリメラーゼである。特に、本発明の方法はIllumina社のP5及びP7アダプター等の市販アダプター/プライマーとの使用に適しており、かつ、この方法はプライマーをリボヌクレオチドで改変する必要がない。例えば、ポリオウイルス由来の3Dpolは、DNAプライマーへ作用できないRNA依存性RNAポリメラーゼである。
【0073】
DNAプライマーへ作用してXNAポリマーを合成可能なポリメラーゼが、Arangundy-Franklinらの文献(Nature Chemistry、11巻、533-542頁(2019))、WO2011/135280、及びWO2013/156786等の文献に開示されている。これら文献に開示されているのは、ウイルスポリメラーゼを除くpolBファミリーポリメラーゼのバックボーンでの変異が、そのポリメラーゼをXNAポリマー合成可能とし得ることである。特に、バックボーンは、古細菌のサーモコッカス及び/又はパイロコッカス属由来ポリメラーゼでもよい。
【0074】
ポリメラーゼは、XNA分子を重合することが可能となるように変異したT.gorgonarius由来のポリメラーゼバリアントでもよい。ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列を含み得る。ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、RNA又はXNAの重合を可能にする変異を含むアミノ酸配列を含み得る。
【0075】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、RNA分子又はXNA分子、例えば2'F-RNA、2'N3-RNA、2'NH2-RNA、又はPS-RNAを合成可能なポリメラーゼでもよい。このようなポリメラーゼには、WO2011/135280又はCozensらの文献(Cozens、Pinheiro、Vaisman、Woodgate、及びHolligerの文献「DNAからRNAへのポリメラーゼの短い適応経路 (A short adaptive path from DNA to RNA polymerases)」PNAS, 2012年5月22日、109(21)8067-8072;https://doi.org/10.1073/pnas.1120964109)(それぞれ参照により本明細書中に組み込まれている)に開示されているような、RNA分子又はXNA分子を合成可能などのようなポリメラーゼも含まれる。例えば、ポリメラーゼは、これら文献に開示されたD4N、TNQ、TNK、若しくはTGK、又はそのバリアントでもよい。特に、ポリメラーゼは、TGK又はそのバリアントでもよい。
【0076】
ポリメラーゼは、polBファミリー由来のポリメラーゼのバックボーン内のY409N又はY409G及びE664K又はE664Q(配列番号1に関して記載)に対応する変異を含み得る。特別な実施態様では、バックボーンは、ウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。
【0077】
ポリメラーゼは、RNAポリメラーゼを活性化させる追加的変異を含むT.gorgonarius(Tgo)由来のポリメラーゼのバリアントでもよい。野生型Tgoの配列を下記に示す。
【化1】
【0078】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関してY409及びE664変異を含むものでもよい。実施態様では、前記Y409変異はY409N又はY409Gであり、かつ前記E664変異はE664K又はE664Qである。特別な実施態様では、Y409変異及びE664変異は、i)Y409N及びE664Q、ii)Y409N及びE664k、又はiii)Y409G及びE664Kの組合せである。前記核酸ポリメラーゼのアミノ酸配列は、次の変異A485L、V93Q、D141A、及びE143Aの1以上又は全てを更に含み得る。
【0079】
V93Qはウラシル停止を解除することが知られている変異であり、D141A及びE143Aは3'-5'エキソヌクレアーゼ機能を低下させ、そして「Therminator」変異(A485L)は非天然基質の取り込みを促進することが知られている。これらの変異を含むTgoポリメラーゼの配列(以降「TgoT」と称する)を下記に示す。
【化2】
【0080】
ポリメラーゼは、次の変異: i)Y409N及びE664Q(TNQ)、ii)Y409N及びE664K(TNK)、又はiii)Y409G E664K(TGK)を含む配列番号2のものでもよい。
【0081】
1の好ましい実施態様では、前記核酸ポリメラーゼのアミノ酸配列は、下記のような配列番号1並びに変異V93Q、D141A、E143A、Y409G、A485L、及びE664K(TGK)を含む。
【化3】
【0082】
ポリメラーゼは、配列番号3のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、かつ残基93、141、143、409、485、及び664は不変である(即ち、変異V93Q、D141A、E143A、Y409G、A485L、及びE664Kは維持される)アミノ酸配列のものでもよい。
【0083】
特定の実施態様では、RNA分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、RNA重合に適した条件下で核酸ポリメラーゼと接触させること、を含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化されたDNAプライマーであり、
該重合の生成物は、該プライマーを介して該基質上に固定化されたRNAヌクレオチド鎖であり、そして
該核酸ポリメラーゼは、DNAプライマーへ作用して一本鎖核酸テンプレートに相補的なRNA分子を合成可能なポリメラーゼであり、かつ、配列番号3のアミノ酸配列に対して少なくとも80%、90%、95%、99%、又は100%同一性を有し、かつ残基93、141、143、409、485、及び664は不変である配列を含む;並びに
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む前記方法を提供する。この実施態様では、第2の核酸はRNAポリマーである。
【0084】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、XNA、例えばANA分子又はFANA分子等のアラビノヌクレオチドポリマーを合成可能なポリメラーゼでもよい。このようなポリメラーゼには、WO2013/156786A1(参照により本明細書中に組み込まれている)に開示されているような、アラビノヌクレオチドポリマー分子を合成可能ないずれのポリメラーゼも含まれる。1の特別な実施態様では、ポリメラーゼは、WO2013/156786A1に開示されたD4YKポリメラーゼでもよい。このようなポリメラーゼには、Pinheiroらの文献(「遺伝及び進化が可能な合成遺伝子ポリマー(Synthetic genetic polymers capable of heredity and evolution)」Science. 2012 Apr 20;336(6079):341-344)に開示されているような、ポリマーを合成可能ないずれのポリメラーゼも含まれる。例えば、ポリメラーゼは、文献に開示されたD4K又はそのバリアントでもよい。
【0085】
ポリメラーゼは、polBファミリー由来のポリメラーゼのバックボーン内のP657T、E658Q、K659H、Y663H、E664K、D669A、K671N、及びT676I(配列番号1に関して記載)に対応する変異を含むものでもよい。ポリメラーゼは、L403Pを更に含み得る。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)(配列番号1)由来のポリメラーゼのバリアントでもよい。
【0086】
L403P変異は、ポリメラーゼのAモチーフ内の、更なる有用な変異である。これは重合を促進する利点があり、より長いポリマー生成を補助することができる。これはアラビノヌクレオチドの重合を3倍から4倍、又はそれを超えて向上させることができる。適用によっては、この向上は10倍になり得る。
【0087】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異P657T、E658Q、K659H、Y663H、E664K、D669A、K671N、及びT676I、及び任意でL403Pを含むものでもよい。
【0088】
核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを更に含み得る。変異V93Q、D141A、E143A、及びA485Lについては、本明細書の別の場所に記載した。
【0089】
1の特別な実施態様では、DNAプライマーへ作用してアラビノヌクレオチドポリマーを合成可能である核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異P657T、E658Q、K659H、Y663H、E664K、D669A、K671N、T676I、V93Q、D141A、E143A、L403P、及びA485Lを含むものでもよい。
【0090】
1の特別な実施態様では、DNAプライマーへ作用してアラビノヌクレオチドポリマーを合成可能である核酸ポリメラーゼは、次のアミノ酸配列:
【化4】
(配列番号4;D4YK又はD4Kとしても知られる。)
を含むか、又はそのものでもよい。
【0091】
ポリメラーゼは、配列番号4のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、かつ残基93、141、143、403、485、657、658、659、663、664、669、671、及び676は不変である(即ち、変異V93Q、D141A、E143A、L403P、A485L、P657T、E658Q、K659H、Y663H、E664K、D669A、K671N、及びT676Iは維持される)アミノ酸配列のものでもよい。
【0092】
特定の実施態様では、アラビノヌクレオチドポリマーを基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、アラビノヌクレオチド重合に適した条件下で核酸ポリメラーゼと接触させること、を含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化されたDNAプライマーであり、
該重合の生成物は、該プライマーを介して該基質上に固定化されたアラビノヌクレオチド鎖であり、そして
該核酸ポリメラーゼは、DNAプライマーへ作用して一本鎖核酸テンプレートに相補的なアラビノヌクレオチドポリマーを合成可能なポリメラーゼであり、
かつ、配列番号4のアミノ酸配列に対して少なくとも80%、90%、95%、99%、又は100%同一性を有し、かつ残基93、141、143、403、485、657、658、659、663、664、669、671、及び676は不変である配列を含む;並びに
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法を提供する。この実施態様では、第2の核酸は、基質上に提示された一本鎖のアラビノヌクレオチドポリマーである。1の特別な実施態様では、基質上に提示されたアラビノヌクレオチドポリマーは、ANA分子又はFANA分子である。
【0093】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、XNA分子、例えば2'OMe、MOE、PS-MOE、又はLNAポリマーを合成可能なポリメラーゼでもよい。このようなポリメラーゼには、polBファミリー由来のポリメラーゼのバックボーン内のY409G、I521L、T541G、F545L、K592A、及びE664K(配列番号1に関して記載)に対応する変異を含むポリメラーゼを含む。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)由来のポリメラーゼのバリアントでもよい。
【0094】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異Y409G、I521L、T541G、F545L、K592A、及びE664Kを含むものでもよい。
【0095】
核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを更に含み得る。これらの変異については、本明細書の別の場所に記載した。
【0096】
1の特別な実施態様では、核酸ポリメラーゼは、DNAプライマーへ作用して、2'OMe、MOE、PS-MOE、又はLNAポリマーを合成可能であり、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、Y409G、A485L、I521L、T541G、F545L、K592A、及びE664Kを含むものでもよい。
【0097】
1の特別な実施態様では、核酸ポリメラーゼは、DNAプライマーへ作用して、2'OMe、MOE、PS-MOE、又はLNAポリマーを合成可能であり、下記アミノ酸配列:
【化5】
(配列番号20;2Mポリメラーゼとしても知られる。)
を含むか、又はそのものでもよい。
【0098】
ポリメラーゼは、配列番号20のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、かつ残基93、141、143、409、485、521、541、545、592、及び664は不変である(即ち、変異V93Q、D141A、E143A、Y409G、A485L、I521L、T541G、F545L、K592A、及びE664Kは維持される)アミノ酸配列のものでもよい。
【0099】
特定の実施態様では、2'-O-メチルリボヌクレオチドポリマー又は2'-O-メトキシエチルヌクレオチドポリマーを基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、2'-O-メチルリボヌクレオチド又は2'-O-メトキシエチルヌクレオチド重合に適した条件下で核酸ポリメラーゼと接触させること、を含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化されたDNAプライマーであり、
該重合の生成物は、該プライマーを介して該基質上に固定化された2'-O-メチルリボヌクレオチド又は2'-O-メトキシエチルヌクレオチド鎖であり、そして
該核酸ポリメラーゼは、DNAプライマーへ作用して一本鎖核酸テンプレートに相補的な2'-O-メチルリボヌクレオチド又は2'-O-メトキシエチルヌクレオチドを合成可能なポリメラーゼであり、
かつ、配列番号20のアミノ酸配列に対して少なくとも80%、90%、95%、99%、又は100%同一性を有し、かつ残基93、141、143、409、485、521、541、545、592、及び664は不変である配列を含む;並びに
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法を提供する。この実施態様では、第2の核酸は、基質上に提示された一本鎖の2'-O-メチルリボヌクレオチドポリマー又は2'-O-メトキシエチルヌクレオチドポリマーである。
【0100】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、2'NH2-RNA、2'O-メチル-RNA、3'デオキシ-DNA(2'-5')、又は3'O-メチル-RNAポリマーを合成可能なポリメラーゼでもよい。このようなポリメラーゼには、Cozensらの文献、(Cozens, Mutschler, Nelson, Houlihan, Taylor、及びHolligerの文献、「特定の位置異性2'-5'結合を有する核酸の酵素合成(Enzymatic Synthesis of Nucleic Acids with Defined Regioisomeric 2′‐5′ Linkages)」 Angew Chem Int Ed Engl. 2015 Dec 14;54(51): 15570-15573)(参照により本明細書中に組み込まれている)に開示されているような、ポリマーを合成可能ないずれのポリメラーゼも含まれる。例えば、ポリメラーゼは、文献に開示されたTGLLK又はそのバリアントでもよい。
【0101】
ポリメラーゼは、polBファミリー由来のポリメラーゼのバックボーン内のY409G、I521L、F545L、及びE664K(配列番号1に関して記載)に対応する変異を含むものでもよい。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)(配列番号1)由来のポリメラーゼのバリアントでもよい。
【0102】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異Y409G、I521L、F545L、及びE664Kを含むものでもよい。核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを更に含み得る。これらの変異については、本明細書の別の場所に記載した。
【0103】
1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、Y409G、A485L、I521L、F545L、及びE664Kを含むものでもよい(100%の同一性を有するポリメラーゼは、TGLLKと称することもある)。
【0104】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、XNAポリマー、例えばTNAポリマーを合成可能なポリメラーゼでもよい。このようなポリメラーゼには、Chen及びRomesberg(FEBS Lett. 2014 Jan 21;588(2): 219-229)又はPinheiroらの文献(「遺伝及び進化が可能な合成遺伝子ポリマー(Synthetic genetic polymers capable of heredity and evolution)」Science. 2012 Apr 20;336(6079): 341-344)(それぞれ参照により本明細書中に組み込まれている)に開示されているような、ポリマーを合成可能ないずれのポリメラーゼも含まれる。例えば、ポリメラーゼは、文献に開示されたRT521又はそのバリアントでもよい。これら文献で開示されたように、このポリメラーゼは、TNA以外のXNAポリマーを合成可能である。
【0105】
ポリメラーゼは、polBファミリー由来のポリメラーゼのバックボーン内のE429G、I521L、及びK726R(配列番号1に関して記載)に対応する変異を含むものでもよい。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)(配列番号1)由来のポリメラーゼのバリアントでもよい。
【0106】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異E429G、I521L、及びK726Rを含むものでもよい。前記核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを更に含み得る。これらの変異については、本明細書の別の場所に記載した。
【0107】
1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、E429G、A485L、I521L、及びK726Rを含むものでもよい(100%の同一性を有するポリメラーゼは、RT521と称することもある。)。
【0108】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、XNAポリマー、例えばHNAポリマーを合成可能なポリメラーゼでもよい。このようなポリメラーゼには、Taylorらの文献、(「合成遺伝子ポリマー由来触媒(Catalysts from synthetic genetic polymers)」 Nature. 2015 Feb 19;518(7539): 427-430)又はPinheiroらの文献、(「遺伝及び進化が可能な合成遺伝子ポリマー(Synthetic genetic polymers capable of heredity and evolution)」 Science. 2012 Apr 20;336(6079): 341-344)(それぞれ参照により本明細書中に組み込まれている)に開示されているような、該ポリマーを合成可能ないずれのポリメラーゼも含まれる。例えば、ポリメラーゼは、文献に開示された6G12又はそのバリアントでもよい。これら文献で開示されたように、このポリメラーゼは、HNA以外のXNAポリマーを合成可能である。
【0109】
ポリメラーゼは、polBファミリー由来のポリメラーゼのバックボーン内のV589A、E609K、I610M、K659Q、E664Q、Q665P、R668K、D669Q、K671H、K674R、T676R、A681S、L704P、及びE730G(配列番号1に関して記載)に対応する変異を含むものでもよい。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)(配列番号1)由来のポリメラーゼのバリアントでもよい。
【0110】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V589A、E609K、I610M、K659Q、E664Q、Q665P、R668K、D669Q、K671H、K674R、T676R、A681S、L704P、及びE730Gを含むものでもよい。前記核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを更に含み得る。これらの変異については、本明細書の別の場所に記載した。
【0111】
1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、A485L、V589A、E609K、I610M、K659Q、E664Q、Q665P、R668K、D669Q、K671H、K674R、T676R、A681S、L704P、及びE730Gを含むものでもよい(100%の同一性を有するポリメラーゼは、6G12と称することもある)。
【0112】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、XNAポリマー、例えばHNA、AtNA、CeNA、又はLNAポリマーを合成可能なポリメラーゼでもよい。このようなポリメラーゼには、Taylorらの文献、(「合成遺伝子ポリマー由来触媒(Catalysts from synthetic genetic polymers)」 Nature. 2015 Feb 19;518(7539): 427-430)又はMutschlerらの文献、(「ランダム配列遺伝子オリゴマープールは、ライゲーション及び組換えの本質的可能性を示す( Random-sequence genetic oligomer pools display an innate potential for ligation and recombination);eLife 2018;7:e43022 DOI: 10.7554/eLife.4302)(それぞれ参照により本明細書中に組み込まれている)に開示されているような、ポリマーを合成可能ないずれのポリメラーゼも含まれる。例えば、ポリメラーゼは、文献に開示された6G12 I521Lバリアント(「6G12521」)又はそのバリアントでもよい。
【0113】
ポリメラーゼは、polBファミリー由来のポリメラーゼのバックボーン内のI521L、V589A、E609K、I610M、K659Q、E664Q、Q665P、R668K、D669Q、K671H、K674R、T676R、A681S、L704P、及びE730G(配列番号1に関して記載)に対応する変異を含むものでもよい。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)(配列番号1)由来のポリメラーゼのバリアントでもよい。
【0114】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異I521L、V589A、E609K、I610M、K659Q、E664Q、Q665P、R668K、D669Q、K671H、K674R、T676R、A681S、L704P、及びE730Gを含むものでもよい。前記核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを更に含み得る。これらの変異については、本明細書の別の場所に記載した。
【0115】
1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、A485L、I521L、V589A、E609K、I610M、K659Q、E664Q、Q665P、R668K、D669Q、K671H、K674R、T676R、A681S、L704P、及びE730Gを含むものでもよい(100%の同一性を有するポリメラーゼは、6G12521と称することもある)。
【0116】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、XNAポリマー、例えばCeNa又はLNAポリマーを合成可能なポリメラーゼでもよい。このようなポリメラーゼには、Pinheiroらの文献、(「遺伝及び進化が可能な合成遺伝子ポリマー(Synthetic genetic polymers capable of heredity and evolution)」 Science. 2012 Apr 20;336(6079): 341-344)に開示されているような、該ポリマーを合成可能ないずれのポリメラーゼも含まれる。例えば、ポリメラーゼは、文献に開示されたPolC7(「C7」としても知られる)又はそのバリアントでもよい。
【0117】
ポリメラーゼは、polBファミリー由来のポリメラーゼのバックボーン内のE654Q、E658Q、K659Q、V661A、E664Q、Q665P、D669A、K671Q、T676K、及びR709K(配列番号1に関して記載)に対応する変異を含むものでもよい。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)(配列番号1)由来のポリメラーゼのバリアントでもよい。
【0118】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異E654Q、E658Q、K659Q、V661A、E664Q、Q665P、D669A、K671Q、T676K、及びR709Kを含むものでもよい。前記核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを更に含み得る。これらの変異については、本明細書の別の場所に記載した。
【0119】
1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、A485L、E654Q、E658Q、K659Q、V661A、E664Q、Q665P、D669A、K671Q、T676K、及びR709Kを含むものでもよい(100%の同一性を有するポリメラーゼは、C7と称することもある)。
【0120】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、XNA分子、例えばphNA、PMO、又はP-アルキル-moNA分子を合成可能なポリメラーゼでもよい。このようなポリメラーゼには、Arangundy-Franklinらの文献(Nature Chemistry、11巻、533-542頁(2019))(参照により本明細書中に組み込まれている)に開示されているような、phNA分子を合成可能ないずれのポリメラーゼも含まれる。特に、ポリメラーゼは、この文献に開示された「GV」、「GV2」、又は「PGV2」(「PGLVV」としても知られる)又はそのバリアントでもよい。
【0121】
ポリメラーゼは、polBファミリー由来のポリメラーゼのバックボーン内のE429G、D455P、K487G、I521L、R606V、R613V、及びK726R(配列番号1に関して記載)に対応する変異を含むものでもよい。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)(配列番号1)由来のポリメラーゼのバリアントでもよい。
【0122】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異E429G、D455P、K487G、I521L、R606V、R613V、及びK726Rを含むものでもよい。前記核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを更に含み得る。これらの変異については、本明細書の別の場所に記載した。
【0123】
1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、E429G、D455P、A485L、K487G、I521L、R606V、R613V、及びK726Rを含むものでもよい(100%の同一性を有するポリメラーゼは、PGV2又はPGLVVと称することもある)。
【0124】
核酸ポリメラーゼは、DNAプライマーへ作用して、一本鎖核酸テンプレートに相補的な、XNA分子、例えばphNA、PMO、又はP-アルキル-moNA分子を合成可能なポリメラーゼでもよい。1の実施態様では、ポリメラーゼは、polBファミリー由来のポリメラーゼのバックボーン内のN269W、E429G、D455P、K487G、I521L、V589A、R606V、R613V、及びK726R(配列番号1に関して記載)に対応する変異を含むものでもよい。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)(配列番号1)由来のポリメラーゼのバリアントでもよい。
【0125】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異N269W、E429G、D455P、K487G、I521L、V589A、R606V、R613V、及びK726Rを含むものでもよい。前記核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを更に含み得る。これらの変異については、本明細書の別の場所に記載した。
【0126】
1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、N269W、E429G、D455P、A485L、K487G、I521L、V589A、R606V、R613V、及びK726Rを含むものでもよい(100%の同一性を有するポリメラーゼは、PGLVVWAと称することもある)。
【0127】
別のポリメラーゼバックボーンを使用する場合、変異は当分野で周知の等価な位置に導入される。例えば、代表的ポリメラーゼ6G12に関して、下表は、代替バックボーンへの変異の導入がどのように行われ得るかを示す。表は、Pol6G12変異及び他のPolB内の構造的に等価な位置を示す。Pol6G12内で見られた変異は、基礎である野生型Tgoの配列に対して示す。よく研究されている他のBファミリーポリメラーゼ内の構造的に等価な残基が示される。等価な位置にマッピングされなかった残基はN.D.として示す。
【表2】
【0128】
変異は、言及される残基、モチーフ、又はドメインの、置換又はトランケーション又は欠失を指し得る。1の特別な実施態様では、変異は、ある種のアミノ酸残基による別の種のアミノ酸残基の置換である。
【0129】
ポリメラーゼは、ポリメラーゼ機能を維持するポリメラーゼ断片でもよい。
【0130】
工程ii)a)の重合に適した条件は、変性工程、アニーリング工程、及び増幅工程を含むサイクルでもよい。変性工程は、変性バッファ、例えば98%ホルムアミド及び/又はNaOHを含むバッファの適用でもよい。NaOHは、1 mM NaOH、好ましくは10 mM NaOH以上の濃度でもよい。変性バッファは又、EDTA、例えば1 mM EDTAを含み得る。アニーリング工程は、NTP又はポリメラーゼ無しの増幅バッファと同一の成分を含み得る、プレミックス型バッファ適用でもよい。例えば、プレミックス型バッファは、2 Mベタイン、20 mM Tris、10 mM硫酸アンモニウム、6 mM MgSO4、0.1% Triton-X、1.3% DMSO、及び18.1 U/ml RNAse阻害因子を、pH 8.8で含み得る。増幅工程は、基質に結合した核酸をポリメラーゼ、RNAヌクレオチド三リン酸、及び適切な増幅バッファと接触させることを含み得る。例えば、増幅バッファは、2Mベタイン、20 mM Tris、10 mM硫酸アンモニウム、6 mM MgSO4、0.1% Triton-X、1.3% DMSO、625 uM NTP、10 nM TGKポリメラーゼ、及び18.1 U/ml RNAse阻害因子を、pH 8.8で含み得る。別の例では、増幅バッファは、20 mM Tris-HCL、10 mM(NH4)2SO4、10 mM KCl、2 mM MgSO4、0.1% Triton X-100、200 uM faNTP、10 nM D4YK polを、pH 8.8で含み得る。三番目の例では、増幅バッファは、200 uM 2'OMe NTP、10 nM 2Mポリメラーゼ、2 Mベタイン、20 mM Tris、10 mM硫酸アンモニウム、6 mM MgSO4、0.1% Triton-X、1.3% DMSOを、pH 8.8で含み得る。幾つかの実施態様では、少なくとも5、10、12、15、20、又は25サイクルのブリッジ増幅が行われる。幾つかの実施態様では、RNAse阻害因子は、SuperaseIn、RNAseOUT、RNasein、RiboSafe若しくは、ポリメラーゼ活性を阻害しない他の市販製品でもよく、又は、これらのいずれかを含み得る。
【0131】
上記開示に加えて、本発明者らは、本発明の方法での非DNAポリマーの合成を改良する更なる工程を提供する。これら更なる工程は、特に、長い構造体に関する。理論によって拘束されるものではないが、本発明者らは、ブリッジ内での非DNAの合成中又はRNAの合成中に、dsDNA:RNA複合体(又は他の非DNA核酸複合体)がかなりの量のトルクを蓄積し始め、それによりポリメラーゼが減速し、最終的には停止するのではないかと考える。発明者らはこの問題を克服した。例えば、本発明のこの態様に関する改良を示す図2を参照されたい。
【0132】
従って、1の実施態様では、本方法は更に、最初の重合工程又はサイクルの後に行われて、第1の核酸が切断される工程を含む。この切断は、ブリッジが直鎖化されてトルクが解放されることを可能とする一方で、第1の核酸は維持される。ポリペプチドが提示される実施態様では、重合のさらなるラウンドへの干渉を回避するために、切断部位はポリペプチドをコードするオープンリーディングフレームの後にあるべきである。従って、第1の核酸内の切断部位は、コードされたポリペプチドに対応する第1の核酸内の配列に対して5'に位置する。特別な実施態様では、切断部位は、第1の核酸を基質に結合する固定化されたアダプター/プライマー内にある。
【0133】
幾つかの実施態様では、この工程は、500、600、700、800、900、1000、1100、1200、1300、1400、又は1500ヌクレオチド長を超える第1の核酸を含む方法に適用される。1の特別な実施態様では、この工程は、800又は900ヌクレオチド長を超える第1の核酸を伴う方法に適用される。これは、第2の核酸がRNA分子である実施態様に特に関連し、その理由は、RNA分子はポリペプチドをコードする可能性があり、従って一般的により長いからである。
【0134】
切断は、例えば新たに形成された核酸ストランドなどの他の成分を変化させない様式で、第1の核酸の標的とする切断を可能にするものであればいずれであってもよい。特別な実施態様では、切断部位は、第1の核酸を基質に結合するアダプター/プライマーに組み込まれてもよい。例えば、切断部位は、ウラシル特異的除去試薬(USER)酵素で切断可能な2-デオキシウリジンでもよい。あるいは、切断部位は、ホルムアミドピリミジンDNAグリコシラーゼ(Fpg)で切断可能な8-オキソグアニンでもよい。Fpgを使用して第1の核酸を切断する場合、本発明者らは、切断部位が二本鎖DNAである場合に切断効率が増加することを見出した。従って、1の特別な実施態様では、第3の核酸が切断部位にハイブリダイズする。第3の核酸は、切断部位にわたる配列に相補的なDNAオリゴ、例えばIlluminaP7アダプターの8-オキソグアニン部位にハイブリダイズ可能なDNAオリゴでもよい。第3の核酸の3'末端は、本方法の間、第3の核酸の伸長を予防するために修飾されてもよい。例えば、第3の核酸の3'末端はリン酸化されてもよい。
【0135】
切断後に、ブリッジは直鎖状に存在する。ブリッジが変性するまで、温度を上昇させてもよい。
【0136】
次に直鎖化した生成物を、重合に適した条件下でポリメラーゼと再接触させる。本発明者らは、これらの工程が重合効率を増大し、完全非DNA分子の高収率へと導くことを発見した。
【0137】
1の特別な実施態様では、第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させ、ここで、該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化され、そして少なくとも5、10、12、15、20、又は25サイクルのブリッジ増幅が行われる。実施態様の例では、12サイクルが行われるが、この数はさらに増加してもよい。ブリッジ化増幅サイクルの後、第1の核酸が切断されて、ブリッジが直鎖化される。次に、重合が再度行われる。直鎖化工程後の重合は変性工程を含む必要はなく、変性工程がないことにより、例えばDNA:RNA二本鎖の解離が回避される。
【0138】
切断、直鎖化、及び継続的重合の工程を、サイクルすることができる。例えば、2サイクル行ってもよい。他の実施態様では、3、4、5又はそれ以上のサイクルで行われる。
【0139】
このように、1の特別な実施態様では、RNA分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、RNA重合に適した条件下で核酸ポリメラーゼと接触させること、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化されたDNAプライマーであり、
該重合の生成物は、該プライマーを介して該基質上に固定化されたRNAである;
該核酸ポリメラーゼは、DNAプライマーへ作用して一本鎖核酸テンプレートに相補的なRNA分子を合成可能なポリメラーゼであり、本明細書に開示されるものを含む、及び
少なくとも5、10、12、15、20、又は25サイクルのブリッジ増幅が行われる;
b)該第1の核酸を切断して前記ブリッジを直鎖化すること;及び
c)工程b)の該直鎖化した生成物を、RNA重合に適した条件下でポリメラーゼと接触させること、
d)工程b)が行われた後の、工程c)を更に少なくとも1つのサイクル、を含む;並びに
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法が提供される。第1の核酸は、ポリペプチドをコードしているアンチセンス配列を含み得る。工程ii)b)の切断は、前記コードされるポリペプチド配列に対して5'の部位でもよい。
【0140】
基質に結合したテンプレートを使用した重合のための驚くほど有効な工程は、使用するポリメラーゼがDNAプライマーに作用できない場合にも適用可能である。例えば、重合、直鎖化、その次の追加的な重合の工程は又、例えばRNA又は非DNAプライマーに作用するポリメラーゼを利用する他の方法にも適用可能である。
【0141】
従って、本発明の態様では、非DNA核酸分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させること、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化され、そして
該重合の生成物は、該プライマーを介して該基質上に固定化されたヌクレオチド鎖である;
b)該第1の核酸を切断して前記ブリッジを直鎖化すること;及び
c)工程b)の該直鎖化した生成物を、重合に適した条件下でポリメラーゼと接触させること、を含む;並びに
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法が提供される。第2の核酸分子がRNAである実施態様では、第1の核酸は、ポリペプチドをコードするアンチセンス配列を含み得る。工程ii)b)の切断は、前記コードされるポリペプチド配列に対して5'の部位でもよい。
【0142】
上述の方法のさらなる詳細は、本明細書に開示のとおりでもよい。例えば、ブリッジ増幅のサイクル数及び/又は直鎖化及び再重合のサイクル数は、前述の文章中に記載したとおりでもよい。バッファは、前述の文章中に開示されたものでもよい。しかしながら、前記の通り、ポリメラーゼは本明細書に開示されるもののいずれであってもよいが、この方法は限定されず、ポリメラーゼは例えば3Dpolポリメラーゼでもよい。
【0143】
非DNA核酸分子を基質上に提示する方法の工程iii)では、第1の核酸が除去され、新たに合成された核酸分子が一本鎖の核酸分子として基質上に提示されて存在するようになる。第1の核酸を除去するために様々な技術が利用可能であり、1の特別な実施態様では、第1の核酸は変性剤の使用により除去される。例えば、変性剤は、1~500 mM、10~400 mM、25~300 mM、50~200 mM、又は75~125 mM NaOHを含むバッファでもよい。1の実施態様では、変性剤は、100 mM NaOHを含む。変性剤は、0~20 mM EDTAを含み得る。1の実施態様では、変性剤は、5 mM EDTAを含む。変性剤は、100 mM NaOH及び5 mM EDTAを含むことができ、基質-核酸複合体を、該バッファと接触させてもよい。特別な実施態様では、工程iii)はDNase1の使用を含まない。
【0144】
非DNA核酸分子を提示する方法は、従って、固定化された核酸分子をその表面上に備えた基質を生じる。本明細書で論ずるように、核酸分子は、クラスター内に存在してもよく、配列情報及び位置情報が取得し得る。提示される核酸分子は、ライブラリを形成してもよい。例えば、アプタマー、RNA、XNA、FANA、ANA、又は2'-OMeアプタマー等のライブラリ。ライブラリは、XNAzyme、例えば、FANAポリマー又は他のXNAポリマーからなるXNAzyme酵素のものでもよい。或いは、核酸分子それ自身を分析用に提示してもよい。例えば、分子の非DNA核酸分子への結合を、評価してもよい。
【0145】
XNAzyme、核酸オリゴ、例えばDNAオリゴの提示を含む実施態様では、XNAzymeがアダプターで妨害されないことを担保するために、5'及び3'アダプターをアニールしてもよい。
【0146】
幾つかの実施態様は、基質上に提示されるRNA分子を生じ、RNA分子はポリペプチドをコードしてもよい。本明細書で論ずるように、RNA分子は、クラスター内に存在してもよく、配列情報及び位置情報が取得し得る。RNAクラスターは、コードされるポリペプチドのライブラリを形成してもよい。幾つかの実施態様では、RNA分子は、1~25 kDaサイズのペプチド又はタンパク質をコードする。他の実施態様では、1~25 kDaサイズのペプチド又はタンパク質のライブラリが、提示される。例えば、ライブラリは、scFv、ペプチド、フィブロネクチンIII型ドメイン(FN3ドメイン)、又は単一ドメイン抗体(sdAb、ナノボディとしても知られる)のものでもよい。他の提示可能なスキャフォールドには、アフィボディ、ダルピン、フィノマー、OBody、又はアビマーが含まれる。
【0147】
ライブラリを得るための、RNA分子を基質上に提示する方法は、その固定化された第1の核酸は、複数のポリペプチドをコードしている複数の第1の核酸である基質から開始できる。第1の核酸は、クラスターとして存在し、少なくともそのクラスターの一部はシーケンシングされていてもよい。
【0148】
固定化された一本鎖のRNA分子が取得された場合、プローブは任意で一本鎖のRNA分子へアニールできる。例えば、第2の核酸の3'末端に相補的な核酸プローブが、第2の核酸にハイブリダイズしてもよい。ハイブリダイゼーション部位は、前記コードされるポリペプチドのオープンリーディングフレーム内でないことが好ましい。ハイブリダイゼーション部位は、プローブとリボソームとの間の立体的衝突を避けるために、オープンリーディングフレームの終止コドンから離れて配置してもよい。例えば、ハイブリダイゼーション部位は、終止コドンから少なくとも10、15、20、25、30、35、又は40ヌクレオチドでもよい。1の特別な実施態様では、ハイブリダイゼーション部位は終止コドンから少なくとも30ヌクレオチドである。プローブは、RNA合成を検証、可視化、定量化し得るように、例えば蛍光標識されてもよい。
【0149】
更なる実施態様では、本発明者らは、このようなポリメラーゼを使用して、例えばフローセルなどの基質上に固定化されたRNA分子のクラスター分子を生成し、更に次にそのRNAクラスターから翻訳されたポリペプチドの驚くべき有効な提示を示す。
【0150】
従って、本方法は、新たに形成されたRNA分子である第2の核酸を、リボソームと、コードされるポリペプチドの翻訳に適した条件下で接触させる工程、を更に含み得る。これは、RNA配列のインビトロ翻訳でそのポリペプチド自体を形成することを可能とする。
【0151】
提示されるポリペプチドは、標準アミノ酸を含み得る又はからなる。提示されるポリペプチドは、非標準アミノ酸を含み得る。提示されるポリペプチドは、非天然アミノ酸を含み得る。1の実施態様では、提示されるポリペプチドは、標準アミノ酸、非標準アミノ酸、及び/又は非天然アミノ酸の任意の組合せを含む。
【0152】
第2の核酸は、オープンリーディングフレームの5'にリボソーム結合部位を含み得る。例えば、第2の核酸は、シャイン・ダルガノ配列を含み得る。
【0153】
従来技術では、ハイスループットスクリーニング及び分析に適した様式で、多数のポリペプチドを表面上に提示する方法を提供する試みがなされてきた。しかし、これらの方法には欠点があり、特に効率が上がらないポリペプチドの翻訳、又は提示されたポリペプチドの不安定性の悩みがある。本発明者らは、本明細書において、基質上に提示されたRNA分子の翻訳のためのさらなる技術を提供し、従来技術の欠点を克服する。
【0154】
本発明者らは、特定のポリペプチドのインビトロ翻訳及びフォールディングが非効率的である可能性を証明した。これは、例えばscFv等の大きな折り畳まれたポリペプチドに、特に関連する。翻訳及びフォールディングを向上させるために、本発明者らは、トリメチルアミンN-オキシド(TMAO)をインビトロ翻訳バッファに含めることができることを確認した。特に、本発明者らは、0.05M~1.5MのTMAO濃度が、37℃でインビトロ翻訳を行う場合の収率を向上させることを確認した。さらに、インビトロ翻訳は、RNAse活性が最小又は全くないバッファ中で行われるべきである。
【0155】
従って、1の実施態様では、本方法は、第2の核酸を、リボソームと、該コードされるポリペプチドの翻訳に適した条件下で接触させる工程を含み、該条件は、トリメチルアミンN-オキシド(TMAO)を含む。TMAOは、0.05~1.5 M、又は0.05~1.2Mの濃度でもよい。TMAO濃度は、0.05 M~1.5 M、0.1 M~1.2 M、0.15 M~1 M、0.2 M~0.8 M、0.25 M~0.6 M、0.3 M~0.5 M、又は0.35 M~0.45 Mでもよい。1の実施態様では、TMAO濃度は約0.4 Mである。
【0156】
代替として、本発明者らは、ジメチルスルホキシド(DMSO)が翻訳バッファ内に存在する場合に、インビトロ翻訳を向上できることを見出した。例えば、10% DMSOを、翻訳バッファ内に含めてもよい。本発明者らは、scFvの翻訳中のDMSO含有時の向上さを見出したが、全種類のコードされたタンパク質の向上は確認できなかった。
【0157】
驚くべきことに、固定化されたRNA分子の翻訳のための有効な工程は又、他の方法へも適用可能である。従って、本発明の態様では、ポリペプチドを基質上に提示する方法であって:
i)ポリペプチドをコードしているアンチセンス配列を含む第1の核酸を用意する工程であり、ここで該第1の核酸は、基質上に固定化されており、かつ、その固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
該第1の核酸を、RNA重合に適した条件下で核酸ポリメラーゼと接触させることを含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化され、そして
該重合の生成物は、該プライマーを介して該基質上に固定化されたRNAヌクレオチド鎖である;
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程;及び
iv)該第2の核酸を、リボソームと、該コードされるポリペプチドの翻訳に適した条件下で接触させる工程であって、工程iv)の前記条件はTMAOを含む、前記方法が提供される。任意でTMAOは0.05 M~1.5 M又は0.05 M~1.2 Mの濃度である。1の実施態様では、TMAO濃度は0.4 Mである。
【0158】
上述の方法の更なる詳細は、本明細書に開示されるいずれでもよい。代替的には、TMAOは、DMSO、例えば10% DMSOで置き換えることができる。
【0159】
コードされるポリペプチドは、終止コドンで終了するオープンリーディングフレームとして存在してもよい。翻訳が終止コドンで停止すると、その後リボソームは安定化されるであろう。リボソームは、その複合体を、安定化バッファ、例えば少なくとも7 mM又はそれを超えるMgCl2と同等のMg濃度を有するバッファと接触させることによって安定化してもよい。
【0160】
7 mMを超えるMgCl2を含むリボソーム安定化バッファは、変性され得ないDNA-RNAP-RNA複合体に依存する従来技術の方法での使用は適切でない。しかし、本発明者らは、高いMg濃度は高い提示及び安定化効率に関係し、本方法での使用に適していることを発見した(例えば、図3参照)。例えば、本発明者らは、本発明の系において、7 mM MgCl2を50 mM MgAcと比較した場合に30倍のリボソーム提示効率の上昇を観察した。従って、安定化バッファは、8、9、10、15、20、25、30、40、50、60、70、80、90、若しくは100 mM MgCl2又はMgAcを含み得る。幾つかの実施態様では、バッファは、8、9、10、15、20、25、30、40、50、60、70、80、90、又は100 mM MgCl2若しくはMgAcと同等である又はそれを超えるマグネシウム濃度を有する。バッファは、7 mM MgCl2により提供されるものを超えるマグネシウム濃度を有し得る。幾つかの実施態様では、バッファは、8~100 mM、10~90 mM、15~85 mM、20~80 mM、25~75 mM、30~70 mM、35~65 mM、40~60 mM、又は45~55 mMのMgCl2若しくはMgAcである又はそれと同等であるマグネシウム濃度を有する。
【0161】
リボソーム安定化バッファは、前述のマグネシウム濃度を有するリン酸緩衝生理食塩水でもよい。バッファは、Tween 20又はTriton X-100を更に含み得る。
【0162】
1の特別な実施態様では、前記リボソーム提示バッファは、50 mM TrisAc(トリス(ヒドロキシメチル)アミノメタンアセテート)、150 mM NaCl、0.1% Tween 20、0.1% BSA、20U/ml RNase阻害因子、本明細書に開示されるマグネシウム濃度を含み得、かつpH 7.5でもよい。マグネシウム濃度は、50 mM MgAc(酢酸マグネシウム)により提供されてもよい。
【0163】
このような方法で、基質表面上に提示されたポリペプチドを生じる。本明細書で論ずるように、ポリペプチドのライブラリ、例えばscFv分子のライブラリが、この表面上に提示されてもよい。
【0164】
提示されるポリペプチドは、5~25 kDa、10~25 kDa、15~25 kDa、又は20~25 kDaでもよい。幾つかの実施態様では、提示されるポリペプチドは25 kDaを超えない。特別な実施態様では、ポリペプチドは、15kDaを超えてもよい。
【0165】
提示されたポリペプチドを有する基質表面は、洗浄されてブロックされてもよい。適切なブロッキング試薬には、ウシ血清アルブミン、カゼイン、組換えウシ血清アルブミン等が含まれる。
【0166】
ポリペプチドを提示する基質表面は、さらなる研究に使用し得る。例えば、表面が、標的結合タンパク質のライブラリ若しくは見込みのある標的結合タンパク質を提示する場合、候補標的、抗原、ペプチド、又はタンパク質をその表面に接触させて、提示された標的結合断片の結合特徴を決定できる。候補は蛍光標識されていてもよいし、他の様式で検出可能であってもよい。このように、提示されたライブラリを使用して、結合特性を分析できる。
【0167】
本発明は又、結合特性の測定に限定されるものではなく、本発明は他のいかなる特性の分析にも使用し得る。例えば、酵素のバリアントをコードするライブラリを調製し、そのライブラリを用いて酵素活性を分析することができる。
【0168】
1の特別な実施態様では、ポリペプチドを基質上に提示する方法であって:
i)ポリペプチド、例えばscFvをコードしているアンチセンス配列を含む第1の核酸を用意する工程であり、ここで該第1の核酸は、基質上に固定化されており、かつ、その固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
該第1の核酸を、RNA重合に適した条件下で核酸ポリメラーゼと接触させることを含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化されたDNAプライマーであり、
該重合の生成物は、該プライマーを介して該基質上に固定化されたRNAヌクレオチド鎖である;及び
該核酸ポリメラーゼは、DNAプライマーへ作用して一本鎖核酸テンプレートに相補的なRNA分子を合成可能なポリメラーゼ、例えばTGKである;
b)該第1の核酸を該コードされるポリペプチド配列に対して5'の部位で切断して該ブリッジを直鎖化すること;及び
c)工程b)の該直鎖化した生成物を、RNA重合に適した条件下でポリメラーゼと接触させること、を含む;
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程;並びに
iv)該第2の核酸を、リボソームと、該コードされるポリペプチドの翻訳に適した条件下で接触させる工程であって、工程iv)の該条件は、TMAOを任意で0.05~1.5 Mの濃度で含む、並びに
v)該リボソーム-ポリペプチド複合体は、リボソーム提示バッファで安定化される、任意で7 mMのMgCl2を超えるマグネシウム濃度を有する、前記方法が提供される。1の実施態様では、TMAO濃度は0.05 M~1.2 Mである。1の特別な実施態様では、TMAO濃度は0.4 Mである。
【0169】
本明細書で論ずるように、生体分子を基質上に提示する方法は、基質上に固定化された第1の核酸を提供することを含む。第1の核酸はクローンのクラスターの一部として存在してもよく、少なくともいくつかの配列情報及び位置情報が取得可能であろう。この様式で固定化された核酸を得るための方法、及び前述の情報を得るための方法は、当分野で公知である。しかし、本発明者らは、本明細書に開示される下流方法に最適化された、特に改良された方法を本明細書で提供する。特に、より長い、例えば長さ1.2 Kbp以上の固定化された核酸配列を作製可能なことが望まれる。本発明者らは、この長い構造体の製造のために改良された方法を提供する。
【0170】
このように、1の実施態様では、工程i)で用意される前記基質上に固定化された前記第1の核酸は:
1)ポリペプチド配列をコードしているテンプレート核酸を用意する工程;
2)該テンプレート核酸を、基質に固定化されたプライマーへハイブリダイズさせる工程;
3)該ハイブリダイズしたテンプレート核酸を、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触させて、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸を合成する工程;
4)該第1の核酸のブリッジ増幅を実施して、該第1の核酸のクラスターを生成する工程;及び
5)該第1の核酸の少なくとも一部をシーケンシングする工程、により生成される。
【0171】
テンプレート核酸は、その5'末端及び3'末端にアダプターオリゴヌクレオチドを有し得る。例えば、基質がIlluminaフローセルの場合、アダプターはP5及びP7アダプターでもよい。基質に固定化されたプライマーは、テンプレート核酸の少なくとも一部、例えばアダプターに相補的でもよい。
【0172】
結合したテンプレート核酸は次に、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触し、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸が合成される。このように、第1の核酸は、固定化されたプライマーの伸長物である。次に第1の核酸及びテンプレート核酸を変性して、基質に固定化された一本鎖の第1の核酸を生じ得る。
【0173】
次にブリッジ増幅を使用して、該第1の核酸のクローンクラスターを生成できる。ブリッジ増幅は、アニーリング工程、増幅工程、及び変性工程のサイクルを含み得る。例えば、増幅工程は、次の特徴:28~35増幅サイクル、1~120秒の伸長時間、2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファ、並びに、95~99.9%ホルムアミドを含む変性バッファ(1~10 mM NaOH及び1~5 mM EDTAが添加されても無くてもよい)を含む変性バッファを含み得る。
【0174】
本発明者らは、下流のRNA/ポリペプチド提示のために、この工程を特に最適化するために次の特徴:32~35増幅サイクル、60~120秒の伸長時間、2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファ、並びに、95~99.9%ホルムアミドを含む変性バッファ(1~10 mM NaOH及び1~5 mM EDTAが添加されても無くてもよい)を使用し得ることを発見した。
【0175】
このように、1の実施態様では、工程i)で用意される前記基質上に固定化された前記第1の核酸は:
1)ポリペプチド配列をコードしているテンプレート核酸を用意する工程;
2)該テンプレート核酸を、基質に固定化されたプライマーへハイブリダイズさせる工程;
3)該ハイブリダイズしたテンプレート核酸を、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触させて、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸を合成する工程;
4)該第1の核酸のブリッジ増幅を実施して、該第1の核酸のクラスターを生成する工程であって、該ブリッジ増幅は:32~35増幅サイクルを含み、サイクルあたり60~120秒の伸長時間を有し、2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含む、及び、95~99.9%ホルムアミド、任意で1~10 mM NaOH、及び任意で1~5 mM EDTAを含む変性バッファの使用を含む;並びに
5)該第1の核酸の少なくとも一部をシーケンシングする工程、により生成される。
【0176】
1の特別な実施態様では、ブリッジ増幅は32サイクルを含む。伸長時間は、60秒でもよい。増幅バッファは、6 mMのMgSO4と同等のMg濃度を含み得る。変性バッファは、98%ホルムアミド、10 mM NaOH、及び1 mM EDTAを含み得る。
【0177】
増幅バッファは、2 Mベタイン、20 mM Tris、10 mM硫酸アンモニウム、6 mM MgSO4、0.1% Triton-X、1.3% DMSO、200 uM dNTP、80 U/ml Bst 2.0、pH 8.8でもよい。
【0178】
ポリメラーゼは、Bst large断片、Bst 2.0ポリメラーゼ、又はBst 3.0ポリメラーゼ(New England Biolabs社)でもよい。
【0179】
クラスター生成後、二本鎖ブリッジを、当分野で公知の技術に従って直鎖化及び変性してもよい。次に、第1の核酸の少なくとも一部を、標準的様式でシーケンシングしてもよい。例えば、第1の核酸は、プライマー結合部位及びそれに続くユニーク分子識別子又はバーコード配列を含むことができ、該バーコード配列はシーケンシングされてもよい。バーコード配列は、15~30ヌクレオチドのランダムバーコードでもよい。
【0180】
シーケンシング後、シーケンシング産物を除去し得る。固定化されたホスファートの3'リン酸基を、更に本発明の方法を適用可能とするために脱保護してもよい。例えば、Illuminaフローセル及び試薬を使用する場合、P5プライマーの3'リン酸基を脱保護してもよい。脱保護のために酵素T4 PNKを使用し得る。
【0181】
上記のとおり、本発明者らは、特定の下流適用のために特に有用な、基質上に固定化された核酸分子のクラスターを生成する、最適化された方法を提供する。従って、本発明の態様では、基質に結合した核酸のクラスターを調製する方法であって:
1)ポリペプチド配列をコードしているテンプレート核酸を用意する工程;
2)該テンプレート核酸を、基質に固定化されたプライマーへハイブリダイズさせる工程;
3)該ハイブリダイズしたテンプレート核酸を、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触させて、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸を合成する工程;及び
4)該第1の核酸のブリッジ増幅を実施して、該第1の核酸のクラスターを生成する工程を含み、該ブリッジ増幅は32~35増幅サイクルで行われ、サイクルあたり60~120秒の伸長時間を有し、2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含み、並びに、95~99.9%ホルムアミド及び任意で1~10 mM NaOH、及び任意で1~5 mM EDTAを含む変性バッファの使用を含む、前記方法が提供される。
【0182】
1の特別な実施態様では、ブリッジ増幅は、32サイクルを含む。伸長時間は、60秒でもよい。増幅バッファは、6 mM MgSO4と同等のMg濃度を含み得る。変性バッファは、98%ホルムアミド、10 mM NaOH、及び1 mM EDTAを含み得る。
【0183】
本明細書に開示される、基質に結合した核酸のクラスターを調製する方法を使用して、少なくとも0.5、1、1.2又は1.5 Kbp長さの核酸を提示し得る。この方法を使用して、1~1.5 Kbp、1.1~1.3 Kbp、又は1.2 Kbp長さの核酸を提示し得る。
【0184】
本発明の態様では、本明細書に開示の方法のいずれかにより取得された又は取得可能な非DNA核酸分子、例えばXNA、FANA、2'OMe、又はRNA分子を提示する基質が提供される。
【0185】
本発明の態様では、本明細書に開示の方法のいずれかにより取得された又は取得可能なポリペプチドを提示する基質が提供される。
【0186】
本発明の別の態様では、基質上に固定化されたDNAプライマーを伸長して、一本鎖核酸テンプレートに相補的な非DNA核酸分子を合成するための、核酸ポリメラーゼの使用が提供される。
【0187】
本発明の方法に関連して開示される特徴は又、この本発明の態様にも適用し得る。たとえば、この特徴のいずれかは、RNAポリメラーゼ又はXNAポリメラーゼに関連する。
【0188】
例えば、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、更に、少なくとも1種のXNAヌクレオチド又はRNAヌクレオチドの重合を可能にする変異を含むアミノ酸配列を含み得る。核酸ポリメラーゼは、次の変異V93Q、D141A、E143A、及びA485Lの1以上又は全てを含み得る。
【0189】
特に、ポリメラーゼは、配列番号3のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、かつ残基93、141、143、409、485、及び664は不変である(即ち、変異V93Q、D141A、E143A、Y409G、A485L、及びE664Kは維持される)アミノ酸配列のものでもよい。ポリメラーゼは、配列番号4のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、かつ残基93、141、143、403、485、657、658、659、663、664、669、671、及び676は不変である(即ち、変異V93Q、D141A、E143A、L403P、A485L、P657T、E658Q、K659H、Y663H、E664K、D669A、K671N、及びT676Iは維持される)アミノ酸配列のものでもよい。ポリメラーゼは、配列番号20のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有し、かつ残基93、141、143、409、485、521、541、545、592、及び664は不変である(即ち、変異V93Q、D141A、E143A、Y409G、A485L、I521L、T541G、F545L、K592A、及びE664Kは維持される)アミノ酸配列のものでもよい。1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、Y409G、A485L、I521L、F545L、及びE664Kを含むものでもよい。1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、E429G、A485L、I521L、及びK726Rを含むものでもよい。1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、A485L、V589A、E609K、I610M、K659Q、E664Q、Q665P、R668K、D669Q、K671H、K674R、T676R、A681S、L704P、及びE730Gを含むものでもよい。1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、A485L、I521L、V589A、E609K、I610M、K659Q、E664Q、Q665P、R668K、D669Q、K671H、K674R、T676R、A681S、L704P、及びE730Gを含むものでもよい。1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、A485L、E654Q、E658Q、K659Q、V661A、E664Q、Q665P、D669A、K671Q、T676K、及びR709Kを含むものでもよい。1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、E429G、D455P、A485L、K487G、I521L、R606V、R613V、及びK726Rを含むものでもよい。ポリメラーゼは、Bstでもよい。ポリメラーゼは、PGLVVWAでもよい。1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、N269W、E429G、D455P、A485L、K487G、I521L、V589A、R606V、R613V、及びK726Rを含むものでもよい。
【0190】
本発明の更なる態様では、polBファミリー由来のポリメラーゼのバックボーン内のN269W、E429G、D455P、K487G、I521L、V589A、R606V、R613V、及びK726R(配列番号1に関して記載)に対応する変異を含む核酸ポリメラーゼが提供される。特別な実施態様では、バックボーンはウイルスポリメラーゼを除く任意のpolBポリメラーゼである。バックボーンは、古細菌サーモコッカス属及び/又はパイロコッカス属由来のポリメラーゼのものでもよい。ポリメラーゼは、T.gorgonarius(Tgo)(配列番号1)由来のポリメラーゼのバリアントでもよい。本発明のこの態様のポリメラーゼは、XNA分子、例えばphNA、PMO、又はP-アルキル-moNAポリマーの、効率良い重合に関連するものでもよい。本発明のこの態様のポリメラーゼは、核酸テンプレート、例えばDNAテンプレートに相補的なストランドとしての該ポリマーを合成可能であってもよい。
【0191】
ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異N269W、E429G、D455P、K487G、I521L、V589A、R606V、R613V、及びK726Rを含むものでもよい。前記核酸ポリメラーゼのアミノ酸配列は、次の変異V93Q、D141A、E143A、及びA485Lの1以上を更に含み得る。これらの変異については、本明細書の別の場所に記載した。
【0192】
1の特別な実施態様では、核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列であって、該アミノ酸配列は、配列番号1のアミノ酸配列に関して変異V93Q、D141A、E143A、N269W、E429G、D455P、A485L、K487G、I521L、V589A、R606V、R613V、及びK726Rを含むものでもよい。
【0193】
本発明の態様では、複数の生体分子を提示する基質をスクリーニングする方法であって、該基質は本明細書に開示される又は本明細書に開示される方法により取得可能なものであり、かつ該生体分子はライブラリを形成する、前記方法が提供される。ライブラリは、本明細書に開示されるいずれかでもよい。例えば、ライブラリは、親の核酸又はポリペプチド配列の複数のバリアントを含み得る。
【0194】
本明細書に開示されるスクリーニングは、提示された生体分子の、リガンド若しくは標的分子に対する親和性を測定すること、又は酵素機能を測定することを含み得る。例えば、スクリーニングは、提示された親のscFvのバリアント、又は他の結合ポリペプチドの、標的リガンドに対する親和性を測定することを含み得る。或いは、スクリーニングは、提示された親分子のバリアントの酵素機能、例えば基質に対する活性を測定することを含み得る。
【0195】
配列比較は、容易に入手可能な配列比較プログラムを用いて行うことができる。これらの公開され市販されているコンピュータプログラムは、2以上の配列間の配列同一性を計算することができる。
【0196】
当業者は、2つの核酸配列間の同一性パーセントの計算方法を理解するであろう。2つの核酸配列間の同一性パーセントを計算するために、最初に2つの配列のアラインメントを調製し、次に配列同一性値を計算しなければならない。2つの配列の同一性パーセントは、i)配列のアライメントに使用される方法、例えば、Needleman-Wunschアルゴリズム(例えば、Needle(EMBOSS)又はStretcher(EMBOSS)で適用する)、Smith-Watermanアルゴリズム(例えば、Water(EMBOSS)で適用する)、又はLALIGNアプリケーション(例えば、Matcher(EMBOSS)で適用する);及び(ii)アラインメント法で使用されるパラメータ、例えば、ローカルアラインメント対グローバルアラインメント、使用されるマトリックス、及びギャップに適用されるパラメータ、に応じて異なる値をとり得る。
【0197】
アラインメント後に2つの配列間の同一性パーセントを計算する多くの異なる方法がある。例えば、同一性の数を:(i)最短配列の長さ;(ii)アラインメントの長さ;(iii)配列の平均長さ;(iv)非ギャップ位置の数;又は(iv)オーバーハングを除いた同等位置の数、で割ってもよい。更に又、同一性パーセントも又、長さに強く依存することが認識されるであろう。従って、一対の配列が短いほど、より高い配列同一性が偶然に生じると予想し得る。
【0198】
次に、2つの核酸配列間の同一性パーセントの計算は、アラインメントは(N/T)×100となるように計算でき、Nはそれら配列が同一の残基を共有する位置の数であり、Tはギャップを含みオーバーハングを除いた比較位置の総数である。
【0199】
配列アライメントはペアワイズ配列アライメントでもよい。適切なサービスには、Needle(EMBOSS)、Stretcher(EMBOSS)、Water(EMBOSS)、Matcher(EMBOSS)、LALIGN、又はGeneWiseが含まれる。一例として、2つのアミノ酸配列間の類似性又は同一性は、Needle(EMBOSS)サービスを利用して、デフォルトのパラメーター、例えばマトリックス(BLOSUM62)、ギャップオープン(10)、ギャップエクステンド(0.5)、エンドギャップペナルティー(false)、エンドギャップオープン(10)、エンドギャップエクステンド(0.5)に設定して計算することができる。別の例では、2つのアミノ酸配列間の類似性又は同一性は、Matcher(EMBOSS)サービスを使用して、デフォルトのパラメータ、例えばマトリックス(BLOSUM62)、ギャップオープン(14)、ギャップエクステンド(4)、代替マッチ(1)に設定して計算することができる。一例として、2つの核酸配列間の同一性を、Needle(EMBOSS)サービスを使用して、デフォルトのパラメータ、例えばマトリックス(DNAfull)、ギャップオープン(10)、ギャップエクステンド(0.5)、エンドギャップペナルティ(false)、エンドギャップオープン(10)、エンドギャップエクステンド(0.5)に設定して計算することができる。別の例では、2つの核酸配列間の同一性を、Matcher(EMBOSS)サービスを使用して、デフォルトのパラメータ、例えばマトリックス(DNAfull)、ギャップオープン(16)、ギャップエクステンド(4)、代替マッチ(1)に設定して計算することができる。
【0200】
本明細書(添付の特許請求の範囲、要約及び図面を含む)に記載される全ての特徴、及び/又はこのように開示された任意の方法もしくはプロセスの全ての工程は、そのような特徴及び/又は工程の少なくともいくつかが互いに排他的である組合せを除き、任意の組合せで上記態様のいずれかと組合せることができる。
【0201】
本発明のより良い理解のために、及び本発明の実施態様がどのように実施され得るかを示すために、次に実施例を参照するが、これらは本発明を限定することを何ら意図するものではない。
【実施例
【0202】
(実施例)
治療用抗体は、特に炎症性疾患及びがんの臨床において変革的インパクトを与えるが、その開発には未だ集中的な時間及び費用が必要である。本明細書では、ディープスクリーニング、Illumina HiSeqプラットフォームを活用した、108を超えるレベルの個々の抗体-抗原相互作用での、並列シーケンシング、提示、及び迅速な親和性スクリーニングのための超高速スループットスクリーニングアプローチを報告する。ディープスクリーニングは、数十から数百の、低ナノモルから高ピコモルの異なるナノボディ(VHH)及び一本鎖Fv(scFv)抗体バリアントを発見可能とし、これら両者は酵母提示富化されたVHHライブラリからでも、及び、非選択の合成scFvレパートリーから直接のものでもよい。ディープスクリーニングを機械学習モデルと組合せて生成される大規模な抗体-抗原相互作用データセットは、元のレパートリーには存在しなかった新規な高親和性scFv抗体配列の、インシリコ予測を可能とする。ディープスクリーニングは、広範囲の標的に対する高親和性抗体の発見が、非常に加速されることを約束する。
【0203】
超並列アッセイは、生物医科学におけるスループット及びデータ生成速度の両方を非常に向上させる能力を提供する。レパートリー選択アプローチ及び直接的な生体分子スクリーニング戦略は、酵素触媒及び治療用抗体、ペプチド及び小分子薬の発見に重要であることが証明されており、これらを含めることにより、多くの疾患が標的となり得る。
【0204】
ハイスループットDNAオリゴヌクレオチド合成レベルでの多様化方法は高度に発達しており、様々な選択戦略(ファージ、酵母、及びリボソーム提示など)により、大規模な(1010)コンビナトリアル(ポリ)ペプチドレパートリーを処理して分画することができるが、これらは未だ可能な配列空間の一画分しかサンプリングしていない。更に又、全ての選択方法は(程度の差はあれ)、様々なレベルのタンパク質の発現、提示、フォールディング効率、並びに、宿主生物に対する可能性のある毒性に起因する、内在的かつ回避できないバイアスを有する。最後に、これら選択は一般的に、多様性が充分に低下して、次世代シーケンシング(NGS)によって遺伝子型の出現、豊富性、及び富化性を決定できるようになるまで、アウトプットの全体的情報がほとんど又は全く無しの「盲目的」状態で行われる。
【0205】
更に又、選択レパートリーのNGSが遺伝子型の分布及び富化性に関する情報を提供できるようになったとしても、遺伝子型の豊富性及び富化性の両方は(前述のバイアスのために)機能と弱くしか関連付けられないことを、複数の研究が示唆している。従って、シーケンシングデータから得られる遺伝子型分布は、特定の生分子レパートリーの全体的な表現型及び機能性マップの不完全な代理でしかなく、そのため、選択実験中に高機能であるが豊富性の低いクローンを発見することを有意に向上させるものではない。
【0206】
これら、欠点並びに遺伝子型と表現型の相関性の、より信頼性の高い全体像を得る要求のために、多数のハイスループットスクリーニング方法が開発されてきた。しかし、大多数のスクリーニングアプローチでは、その範囲、規模、及び情報アウトプットに限界がある。単離されたスクリーニング(ウェル当たり1つのクローン/化合物/医薬)のスケールはロボットを用いたとしても簡単ではなく、一方生物製剤では、各ウェルの配列組成は特に難しく、多くの場合特定のヒットに対してのみ行われる。既知の配列が表面上の決められた位置に印刷又は合成されるDNA、ペプチド、及びタンパク質のマイクロアレイでは、配列及び機能を関連付けた測定が可能だが、500kスポットを超える規模は、多くの研究室では不可能なほど高価であるために限定される傾向がある。
【0207】
変革をもたらす可能性のあるアプローチは、シーケンシングを機能性スクリーニングと直接融合することを目標とする。NGS技術はpolonyプラットフォーム及びIlluminaプラットフォーム上で、ランダム配列されたDNAクラスターからクローンDNAをシーケンシングすることによる極めて高い並列化に基づいている。これら両プラットフォームは、シーケンシング後のフローセル上に提示された、又はポリアクリルアミドマトリックス内で捕捉された、DNA、RNA及びポリペプチドの特性評価に活用される。これにより、最大で2×106のDNA-及びRNA:タンパク質、並びに、RNA:RNA及びタンパク質:タンパク質相互作用の同時照合が可能となった。
【0208】
本明細書では、このコンセプトを、抗体発見に特に焦点を当てた、最大で2×109クラスター/相互作用の多様可能性を有する、強力なIllumina HiSeqプラットフォームへ拡張しようと試みた。我々は、全体的平衡抗原結合データから直接、高親和性(低度のnMから中程度のpM)バインダーを発見することで、プレ選択した及び未選択の合成ナノボディ(VHH)及び一本鎖Fv(scFv)抗体ライブラリの両方の、高度に多様な提示及びスクリーニングを実証する。我々がディープスクリーニングと名付けた我々のアプローチは、高親和性抗体の発見を、数か月間から数日間へ促進する。我々は更に又、抗体-抗原相互作用パラメータの機械学習のための大規模なディープスクリーニングデータセットの有用性、及び抗体レパートリーディープスクリーニングデータからの高親和性抗体ヒット配列のインシリコ直接予測を実証する。
【0209】
(実施例1-リボソーム提示の実装及びHiSeq 2500でのディープスクリーニング)
我々の目標はIllumina HiSeqシーケンシングプラットフォーム上での超ハイスループット抗体スクリーニングを確認する、我々が「ディープスクリーニング」と呼ぶアプローチである。我々の目標を達成するためには、下記の通り、幾つかの技術的問題を克服する必要があった。
【0210】
Illumina次世代シーケンシングは、最大20億(2×109)のクローンDNAクラスターを含むフローセルを備えたHiSeq 2500である、高度な統合型機器で作動する。これらは、ブリッジ増幅と呼ばれるプロセスにより、個々の一本鎖(ss)DNAテンプレート分子からインサイチュ生成される。個々のクラスターは通常、直径約1μmのスポット内に約1,000のDNA分子アレイを含む。クラスターは整列されてから、Illuminaシーケンシングを使用して合成(SBS)技術により、並行シーケンシングされ、多数の配列及びその物理的x-y座標がアウトプットとして得られる。タンパク質相互作用のスクリーニングを実行するために、最初にDNAクラスターを、RNAクラスター、次にタンパク質クラスターに定量的に変換する方法論を開発する必要があった。この目的のために、効率の良いプライマー依存性DNAテンプレート化RNAポリメラーゼ活性を有するエンジニアリングポリメラーゼTGKを活用して、シーケンシング後のDNAクラスターをRNAクラスターへ転換した。具体的には、ペアエンドターンアラウンドプロセスを利用して、DNAブリッジテンプレートRNA合成を行い(図4)、これにより、表面結合したP5プライマーがDNAテンプレート上でRNA合成を繰り返して伸長する。DTRが完了すると、アルカリpHでの制限酵素切断及びDNA-RNA二重鎖変性によりテンプレートが除去され、P5プライマーによってフローセル表面に共有結合されたssRNAクラスターが形成される(図4)。これらは、直接照合するか、インビトロ翻訳(IVT)によりペプチドクラスター及びタンパク質クラスターに転換するかのいずれかが可能である。
【0211】
次に、RNAクラスターをポリペプチドへ翻訳し、得られたペプチド又はタンパク質をフローセル表面上に安定して提示する、ロバストなワークフローを開発した。5'結合されたRNAクラスターはヌクレアーゼ分解を受けやすいために、より標準的なS30 IVT 抽出物ではなく、再構成したPURExpress IVTシステムを使用し、それは有意な量のエンドヌクレアーゼ及びエキソヌクレアーゼを含有可能であった。具体的にはPURExpress ΔRF123、-T7 RNAPを使用したが、これは、T7 RNAポリメラーゼを欠くだけでなく全ての遊離因子(RF-1、RF-2、RF-3)を欠くものであり、所望のオープンリーディングフレーム(ORF)の前に、N28ユニーク分子識別子(UMI/バーコード)、翻訳開始シグナルを含む5'-UTRが先行し、その次には(リボソーム出口トンネルからORFコード化ドメインとの間を置くための)3'-伸長配列、及びリボソームを停止させる2つの終止コドンが続くRNA構造体に関連する(図4)。失速しているmRNA:リボソーム:初期ポリペプチド複合体は、数日間、周囲温度の高マグネシウムバッファ内で安定化させて、その間に、既知の配列(又は既知のユニーク分子識別子(UMI))を有する、最大で数億から数十億のタンパク質クラスターのフローセルアレイを照合して、抗原結合等の様々な機能アッセイができる。
【0212】
別の技術的課題が提起され、それは、HiSeq機器が定量測定用に設計されておらず、むしろその画像化システムが4色のチャネル間の蛍光強度シグナルのしきい値によりシーケンシング中のベースコールを決定するために設計されている特性によるためである。これは、結合相互作用の定量を測定する課題であり、我々は、異なる濃度における平衡結合シグナル強度を各UMIの冗長性(redundancy)と統合することによって、アルゴリズム的及び実験的に解決した。更に又、HiSeq 2500画像化プラットフォームでは、532 nm及び660 nmのレーザーを備えた落射蛍光ライン走査式顕微鏡を使用した。フローセルを画像化するライン走査式プロセスでは、機器が、フローセル表面に最初に位置を定めるために(シーケンシングラン中に予測されるであろう)660 nmチャネルの1つにおいて有意な量の照射されたシグナルを検出し、その後の走査中はフォーカスを維持する必要がある。この画像化モードは、高シグナルを示すクラスターが希少で、フォーカスのために充分なシグナルが得られない場合の結合相互作用のスクリーニングにはあまり適切ではない。我々は、660 nmチャネルでの蛍光標識DNAオリゴを3'末端へハイブリダイゼーションして全てのRNAクラスターを標識し、532 nmチャネルではクラスターシグナルが散発的であるか又は全く無い場合でも、フローセル全体をフォーカスした画像化を可能にすることにより、この問題を解決した。更にこのシグナルは、RNA合成効率/クラスターサイズの診断、及び同一クラスターからの機能的シグナル/タンパク質結合シグナルに対する正規化因子として利用し得る。最後に、同一機器内で全ての工程(シーケンシング、RNA合成及びタンパク質合成、並びに画像化を含む)が実施可能なので、実験、画像化、及びデータプロセスパイプラインがストリームライン化され、画像アラインメントの問題が回避される。実際、HiSeq光学ステージは優れたx-y再現性を有するため、各クラスターの蛍光定量前に、フローセル結合データとシーケンシング座標を効率的に関連付けることができる(図4)。従って、カスタム画像及びデータ解析パイプラインを使用することで、バーコード:遺伝子型ペアで、バーコード:表現型ペアをマッピングして、数百万のクローンについて遺伝子型:表現型結合を復元することができる。
【0213】
最後に、クラスターサイズ及びタンパク質発現レベルは変数であり、他の可能なアーチファクトとともに、ディープスクリーニングからの遺伝子型:表現型結合データセットにノイズを導入する可能性がある。この固有の変動性を補正するために、同じバーコードの複数のクラスターからの結合シグナルの冗長性測定を、統計的異常値棄却と共に利用して、信頼性の高いデータを得る。本明細書で記載される実装では、2レーンのHiSeq 2500 rapid runフローセルを、最大3×108の提示されたクラスターと共に利用し、12倍の冗長性を目的とする。フローセル上の冗長性を達成するために、UMIの付加後のライブラリを0.1~1 fmolの間でボトルネック化する。これにより、理論上の最大多様性は2.5×107 UMIとなる。
【0214】
上記より、ディープスクリーニングのワークフローは2段階で進行する。第1段階中、費用及び時間を理由としてN28 UMIバーコードを配列化する。次に、シーケンシング後のフローセル上でRNA合成を実施し、続いて、RNAクラスターをインビトロ翻訳(IVT)してタンパク質クラスターとし、それを平衡結合及びカイネティック解離アッセイでの標的結合について照合する。結合データ及びカイネティクスデータがフローセルの生画像の形で生成され、UMI及び平衡結合データをグループ分けする我々のデータ解析パイプラインで処理して、ライブラリ内の機能性を迅速に検証することが可能になる。結合が観察された場合、第2のシーケンシングランを実行して、ライブラリメンバー(完全又はその多様な断片)をシーケンシングし、それらをN28 UMIバーコード、及び従って結合データ、と関連付ける。シーケンシングされる可変領域の数及び長さに応じて、ディープスクリーニング実験は最短3日間で完了可能であり、データ処理も通常は数時間で完了可能である。
【0215】
(実施例2-リゾチームに対して希少で高親和性のナノボディの特定)
シーケンシング後のHiSeqフローセルの、RNAクラスター生成、タンパク質提示及び画像化に関する技術的問題が克服し、最初にナノボディライブラリのディープスクリーニングを探求した。ナノボディ(VHH)は、分子生物学及び構造生物学において重要なツールである。Kruse lab社が開発し、108の多様性が報告されている市販の酵母提示VHHライブラリを取得し、そのライブラリに対して、ポジティブ及びネガティブ磁気活性化細胞選別(MACS)及び蛍光活性化細胞選別(FACS)を数(2~3)回実施して、モデル抗原(鶏卵リゾチーム(HEL))への結合を選択した後に、HEL結合に関するディープスクリーニングをフローセル上のアウトプットに対して実施した(図5A)。バーコード化した結合データ処理において、統合されたクラスターの平均蛍光強度値を有する1,479(MACS)及び3,687(FACS)バーコードを特定し、これらはバックグラウンド結合シグナルを少なくとも2倍超えており(300 nM HELの場合)、それは真のHEL結合VHHクローンの存在を示した。見かけのHEL結合親和性(KD_app)を決定するために、HEL濃度の上昇(1、10、100及び300 nM)を含む平衡結合親和性滴定を実施した。300 nM HELでの結合に続き、解離速度の測定を行った(クラスターシグナルのディミング速度が、見かけの解離定数koff_appを提供する)。
【0216】
次に、ライブラリシーケンシングを実施して、3つのCDR配列(ナノボディ遺伝子型)をそれらの平衡結合シグナル及び解離速度(KD_app、koff_app)(ナノボディ表現型)と関連付け、379,300(MACS)及び39,900(FACS)のユニークCDRの組合せを得た(図5B)。ユニークCDRの組合せによってグループ分けした結合データは、合計で47(MACS)/53(FACS)推定VHHヒットを生じた(図5C)。
【0217】
ディープスクリーニングデータセットは、抗体発見プロセスの全体的分析を可能にする。酵母提示されたVHHのMACS及びFACS両方の選択のために、CDR豊富性と、高い平衡結合シグナル(親和性の代替として)(スピアマン順位相関定数が、300 nM HELでρ=0.361(MACS)、ρ=0.442(FACS))との間の低い相関性を観察する(図5C)。これは、MACS及び(より少ない程度ではあるが)FACSの両方の選択セットアップにおいて、効率悪く富化される高親和性クローンは、VHH酵母提示における強いバイアス(毒性、発現、フォールディング若しくは提示効率のばらつきを含む)又は、DNA /RNAレベルでバイアスのかかった増幅/転写)が原因であろうことを示唆する。従って、ディープスクリーニングによる両方のR3選択から、希少なバインダーを単離可能であった(推定ヒット頻度0.049%(MACS)又は0.834%(FACS)(上記参照)。
【0218】
しかし、この結論は、高い平衡結合シグナル(又は平衡結合KD:KD_app)は、バイオレイヤー干渉法(BLI)等の確立された生体物理学的技術により測定される「真の」 高親和性結合(KD)と相関するであろうとする推測に基づく。この仮説を評価するために、R3 MACS /FACS(それぞれの)スクリーニングから、広範囲の蛍光強度、平衡結合シグナル及び豊富性が観察された20のクローン(M1~M19及びM23)並びに10のクローン(F1~F10)を、特性評価のために選択した(図5D)。同時に、R3 MACS選択から96のランダムコロニーを、コロニーPCR及びサンガーシーケンシングのためにプレーティングして採取した。この特定された28のユニークCDR配列の内の4つは、既にMACS /FACSライブラリから特性評価用に選択されていた。残りの24(C1~C8)から別の8のクローンを選択して合計38クローンにし、発現させて、バイオレイヤー干渉法(BLI)による結合動力学の測定のために特性解析した(図5D~F、図10~13)。この特性解析で特定されたのは、解離定数(KD)が9~20 nM (M5(1.9×10-8 M)、M6(1.42×10-8 M)、及びM15(9.81×10-9 M))の3のVHHヒット、並びに、20~100 nMの範囲の低いKDを有する9のクローンであって、ランダム採取したコロニー由来の2つ(C1及びC2)を含むものであった(図5D、5E)。BLI測定から得られたKD値を、ディープスクリーニングから得られた統合された平均強度に対してプロットすると、300 nM HELでスピアマン順位相関係数ρ=-0.697が示された(図5G)。
【0219】
ディープスクリーニングとBLIとの違いを説明しうる多くの可能性要因がある一方で、これらの結果は、ナノボディの豊富性及び富化性の両方が、少なくともいくつかの選択実験では親和性と弱くしか相関できないことを示唆する。標準的なナノボディ選択ライブラリ及びプロトコルを使用したにもかかわらず、最も親和性の高いライブラリクローンをさらに富化するために、さらに数ラウンドが必要だろう。我々の結果は、ディープスクリーニングがこのプロセスを短縮し、まだ富化が低い場合(2.9×106スクリーニングで3、11、及び145 UMI)ですら、高親和性バインダー(M5、M6、M15)を発見可能であることを示唆する。実際、標準的手順で同じクローンを特定するには、労力と時間のかかるマイクロプレート発現、及び何万ものコロニーのスクリーニングが必要であろう。
【0220】
(実施例3- 選択なしで直接的なscFv抗体の親和性成熟)
プレ選択したライブラリから低ナノモルバインダーを特定するディープスクリーニングの能力を実証したので、次に、選択工程無しに、即ち、低親和性の親クローンの多様なレパートリーから直接、高親和性抗体を発見できるかどうかを探求した。
【0221】
親抗体IL70001から開始し、ヒトscFvライブラリからファージ提示によって単離して、複数の自己免疫性及びアレルギー性炎症性疾患に関連する、見込みのある医薬標的である、ヒトインターロイキン-7(huIL-7)に対するIC50がおおよそ7μMであることを測定した(図15~16)。Vk軽鎖CDR L1及びL3の両方を多様化して親和性成熟ライブラリを調製してから、この未選択ライブラリを直接、最初からスクリーニングにかけた(図6A)。
【0222】
ディープスクリーニング及びCDR L1及びL3シーケンシングにより、フローセル上に≧12レプリケートを備えた、2.4×106ユニークバーコードを含む1.7×108測定値、及びタンパク質空間中に1.9×105のユニークCDRの組合せを得た(図6B)。凝集問題のために、最大で1nMのhuIL-7結合データしか収集できなかったが、これらから173の見込みのあるユニークなヒットが明らかになった(図6C)。このインプットライブラリの非常な多様性にも拘らず、CDR L3ループ配列の全体的収束が観察され、CDR L1の中央の領域における有意な多様性は維持されており、CDR L3のIL-7パラトープへのより大きな寄与を反映すると推定される。以上より、深さ特性評価のためにサブセット(1 nM huIL-7での平衡結合シグナルにより判定された上位19クローン)及びIL70001を選択した(図6D)。これらを、scFv多量体化による親和性測定において可能性のある落とし穴を回避するために、Fab断片として再クローン化し、CHO細胞でFabを発現して精製し、結合動力学をBLIにより各Fabを50 nMで測定したところ、19の全ての抗IL-7 Fabは3 nM~429 pMのKD値を有することが明らかになった(図6D、3E、S6)。IL70001のKDは50nMよりかなり弱いので、測定された最大応答並びに結合及び解離の速度比は、解離定数(KD)の正確なフィッティングには不充分である。
【0223】
自己免疫性及びアレルギー性の炎症性疾患におけるIL-7の役割は、インターロイキン-7受容体(IL7R)との結合に依存する。従って、TF-1 STAT5 IL7Rα+γルシフェラーゼ細胞ベースのレポーターアッセイを用いて、我々の高親和性ヒットが、IL7の隔離によってIL7受容体(IL7R)のシグナル伝達を阻害する能力を持つかどうか評価を試みた。実際、阻害能(IC50)はIL70001よりも平均10,000倍上昇し、IL70105では37,000倍向上したことが観察された(図6G図15図16)。又、親和性と阻害の間に強い相関性が観察された(ρ=0.956、log(y)=m×log(x)+cのフィッティング用R2=0.901)(図6H)。
【0224】
このデータは、ディープスクリーニングが、治療関連の医薬標的に対して、未選択のVL1/VL3ライブラリから直接、複数のピコモル親和性抗体を迅速に特定できることを実証する。更に、抗体のフォーマットをscFvからFabに切り替えた場合ですら、フローセルシグナルとBLI測定された親和性との間に強い相関性が観察された(図6D図6F、ρ=-0.788)。又、親抗体からの親和性増大は、標的リガンドの阻害能に4桁の増大をもたらした。ディープスクリーニングによって親和性成熟における選択を回避することは、探索速度の大幅な向上をもたらし、そして中間の選択及びスクリーニングプロセスを必要とせずに、低親和性のリードから高親和性の(pM)親和性抗体への直接的なルートを提供する。さらに、単離されたFabクローンは、HP-SEC(高性能サイズ排除クロマトグラフィ)により、良好な発現プロファイル(0.25~0.59 mg/ml培養)及び優れた単量体性(12/19クローンが≧98%の単量体画分を示した)などの、望ましい一般的特性及び開発可能性の指標を示した。
【0225】
(実施例4-抗Her2 scFvの親和性成熟)
選択ライブラリ及び非選択のライブラリの両方から、高親和性ナノボディ及びscFvを迅速にスクリーニングして特定する能力が実証されたので、大規模かつ内部的に一貫性のあるディープスクリーニングデータセットを教師あり機械学習アプローチに活用して、より効率的なCDR配列空間の探求及び高親和性抗体の発見を可能とすることができるかどうかを更に探求しようとした。
【0226】
標的として、卵巣がん、胃がん及び肺がんと同様に、乳房がんの30%で過剰発現される細胞表面タンパク質チロシンキナーゼであるHER2(ERBB2)を選んだ。Her2は、治療効果の高い抗体トラスツズマブ(ハーセプチン)の標的であり、報告された結合親和性はおおよそ1 nMである。ハーセプチンscFv及び良く特性評価された親和性パネルである5のscFv(G98A、C6.5、ML3~9、H3B1、及びB1D2+A1)を使用したが、これらは報告された結合親和性(KD)が320 nM~15 pMの間であり、我々の実験のベンチマークである(図8A)。最初に、ハーセプチン及び抗HER2 scFv親和性パネルのフローセル上での提示を検証し(図8B)、平衡結合KD及びピーク強度によってこれらクローンを全体的にランク付けした(逆の順位であることが判明したB1D2+A1及びH3B1を除く)(図8C)。興味深いことに、ハーセプチンscFvは、親和性パネルクローンに比べて有意に高いピーク強度を示し(図8C;平衡KD app 6.35 nMを有する)、これはハーセプチンscFvのよく知られた望ましい発現、フォールディング、及び安定性によるものであると推定される。
【0227】
有効なscFv提示が実証されたので、親和性成熟ライブラリを構築するための出発点として、最小の親和性scFv G98A(KD=320 nM、100 nMでのHer2バックグラウンド結合シグナルより上の、かろうじて検出可能な結合を持つ親和性パネル由来のもの)を選択した。それにより、ウィンドウあたり4 NNSコドンの6つのG98A CDR H3走査ライブラリを構築した(図8A)。ディープスクリーニング及び次のCDRシーケンシングで、2.98×105ユニークバーコードを測定したが、これは(可能な6.2×106の)タンパク質空間内の2.4×105のユニークCDR H3配列をコードする(図8B)。これは見込みのあるCDR H3ライブラリ多様性のほんの一画分しかサンプリングしていないが、主成分分析(PCA)によりVH3配列空間を二次元に投影すると、機能が互いに局所的に近接した3つの適合ピークに高度に局在していること、及び、サンプリングされた大多数の変異は、試験した最高濃度(100 nM Her2)では検出可能な結合を持たないことが明らかになった(図8C)。3つの最高スコアクローン(100 nM Her2でのピーク強度で、洗浄工程あり)の検査で、公知のKDである1.0×10-9Mを持つ親和性パネルからのML3~9と密接に一致する結合曲線が得られた(図8D、8E、17)。フローセルデータと親和性との確立された相関性に基づくと、これらのクローン(HER20003、HER20004、及びHER20005)は、Her2に対して低いナノモルの親和性である可能性が高く、ディープスクリーニングのみで親和性が100倍向上したことを示唆している。次にこれら3つのクローンを、Fabに変換し、CHO細胞内で発現し、精製し、そしてOctetで結合動力学特性の解析をした。BLIデータに1:1モデルを適合させると、カイネティック結合親和性の測定値は、HER20003、HER20004、及びHER20005それぞれについて2.8 nM、3.4 nM、及び1.8 nMであり、ディープスクリーニング観察を支持するものであった(図8D、8F、18)。G98A及びML3~9を発現させて精製したが、G98Aの20 nMでの1:1モデル適合は、KD(46.9 nM)を生成し、これは公開文献の6.8倍であった。BLIでの最大応答シグナルはかなり低いため、このFab濃度では特異的結合がうまく捕捉されなかったと思われる。従って、公開文献のG98AのKD値(3.2×10-7 M)を参照することにする。
【0228】
このように、ディープスクリーニングは、抗Her2 G98A scFvのファージ提示親和性成熟を、3日間の実験1回で再現可能であった。しかし、この実験の動機は、親和性成熟が本来の目的ではなく、むしろ、機械学習用インプットとしての、CDR H3配列(遺伝子型)を結合親和性(表現型)(ここでは、2.4×105 CDR H3配列を含む)と結びつける大規模なデータセット(「HER2affmat」)の生成、及び、より高親和性のHer2バインダーのインシリコ予測であった。
【0229】
この目的のために、分類問題を作成することにより、Her2結合を予測する機械学習モデルを構築し、予測値を、5分間の洗浄工程からの蛍光強度しきい値により3つのカテゴリー(ヒット無し、低ヒット、高ヒット)に区分けした(図9A)。親クローンG98Aが、G98Aが強度190.05である低ヒットのカテゴリーのほぼ中心になるようなしきい値を選択し、充分低いナノモルバインダーの選択の釣り合いを取る目的で、ヒット無しのしきい値に150.0、及び高ヒットしきい値に250を選んだ。これらのしきい値により、「HER2affmat」データから、232,693のヒット無しVH配列、1,284の低ヒットVH配列、及び111の高ヒットVH配列を得た。我々の最良モデルから、ヒット無し、低ヒット、及び高ヒットのカテゴリーそれぞれに対してF1スコア0.993、0.329、及び0.480の許容し得る性能評価基準が得られた(表S2、S3)。低ヒット及び高ヒットのF1スコアは理想よりも低かったが、それらでは高い偽陽性率が優勢であり、これは、測定の連続空間にわたってクラス境界を定義することの難しさによるものと思われる。
【0230】
訓練したモデルにおいて、そのモデルを使用して、ランダムな変異導入と比較して、「HER2affmat」データセットで観察されたものよりも優れ、かつより多様な抗Her2結合配列を生成できるかどうかを探求した。この目的のために、「HER2affmat」データセットから3つのトップスコアを有するクローン(シード)(HER20003、HER20004、及びHER20005)を取り、それぞれのシードについてインシリコで1.98×106の変異VH3配列を生成した(図9A)。具体的には、全ての単一、二重、及び三重変異体、並びに最大で108の第4及び第5のオーダーの変異体をランダムに生成した。全ての5億9,400万の変異は、その次のディープスクリーニングラウンドのために、選択がなされる前に、このモデルによってスコアリングされた。
【0231】
ランダム変異導入に対するこのモデルを比較するために、各シード配列に対して、全ての単一変異体及び編集距離が2~5から最大で1000の変異体からランダム変異セットをコンパイルする選択スキームを考案し、13,121の変異のプール(「random/mut」)を得た。次に、高ヒットスコア<0.9を有する全配列を除去し、編集距離2~5から最大で1000の変異体をランダムに選択し、かつ、「random/mut」セット中のすでに選択されたそれらを拒絶することで、機械学習によって生成された変異のみの配列のプールをアセンブリした。これにより、11,916の変異のプール(「ml/mut」)がアセンブリされた(図9A)。
【0232】
結局、クローンG98A、ML3~9、HER20003、HER20004、及びHER20005が含まれる、オリゴヌクレオチドプールとして合成した合計25,042のCDR VH3配列が生じた。その次のディープスクリーニング(「HER2affmat」ライブラリと同一の条件)では、設計したライブラリからの25,037クローン中24,968(99.72%カバレッジ)、及びアレイ合成及びクローニング中のエラーによる余分な変異体174,700で、合計199,737のユニークなVH3配列がタンパク質空間に観察された。ML生成されたVH CDR3配列(「ml/mut」)は、ランダム変異導入(「random/mut」)と比較して、5分間の洗浄条件下で高強度クローンの分布が有意に上方にシフトした蛍光強度の顕著な向上を示し(図9B)、これは、我々の機械学習モデルが、「HER2affmat」データセットから高親和性Her2結合の突出した特徴を抽出することができ、かつ、それを用いて多数の新規Her2バインダーを正確に予測できたことを示す。
【0233】
我々の目的は、親であるG98A、HER20003、HER20004、HER20005クローンよりも高い親和性を持つ抗体を発見するために機械学習を活用することであったので、得られたディープスクリーニングデータを、ここでヒット無しカテゴリーの中心に置かれたG98A、及び、G98Aの1.5倍強度を有してヒットとしてクラス分けされたクローンの、バイナリ分類問題として探索した(図9B)。得られた分類しきい値により、全体的なヒット性能、MLクローン(「ml/mut」)の13.23% 、対、ランダム選択されたクローン(「random/mut」)2.31%、が示された(図9B、表S4)。シードからの編集距離あたりのヒット数の検査で、この機械学習モデルはランダム変異導入よりも配列空間サンプリングを2.6倍から23.3倍向上させ、平均5.7倍向上させたことが示された(表S4)。
【0234】
親和性決定のために、21の新たな抗Her2 scFvクローン(「HER2affmat」ライブラリから6、MLセット(「ml/mut」)から9、及びランダムセット(「random/mut」)から6)を選択して一価のFabに変換し、CHO細胞内で発現し、精製し、特性評価した(図17)。これらのクローンを、様々な基準(全濃度でのピーク蛍光強度、平衡結合曲線の形状、洗浄条件での蛍光強度)に基づいて選択し、親和性、発現率、及び単量体性とより相関性の高いパターンを特定した。
【0235】
3つのシード(HER20003、HER20004、及びHER20005)を含む 「HER2affmat」ライブラリのスクリーニングから得られた選択されたクローンは全て、8.58×10-10 M及び5.25×10-9 Mの間のKD値、並びに、単量体性の全般的向上(G98Aの93.5%から「HER2affmat」クローンの94.4~98.4%)を示し(図18)、そしてクローンHER20006及びHER20010は、G98Aに対して300倍の親和性向上を示した。ML/ランダムライブラリに存在するクローンの分析は、親和性の更なる向上を示し(強度値と結合曲線による)、MLセット由来のトップクローン(HER20013)は5,220倍の親和性向上(KD=6.07×10-11 M)を示し、MLセット由来の別の4つのクローン(HER20015、20、21、22)はG98Aに対して親和性で>1,000倍の向上を示した(図9C、9D、図18)。
【0236】
高強度クローンはランダムセットでは5倍希少であったが、それでもG98Aに対して親和性が>1,000倍の向上を示す2つのクローン(HER20024及び25)を特定した(それぞれ1.65×10-10 M及び2.83×10-10 M)。親和性増大に加え、ML及びランダムクローンの単量体性は、G98A単量体性に対して93.5%~98.1%の全体的向上が観察された。しかし、ディープスクリーニングデータと単量体性との間に強い相関性は特定できなかった。まとめると、これらの結果は、高親和性抗体バインダーを発見するために、ディープスクリーニングと最先端技術の機械学習モデルとを組合せることの並はずれた有効性を実証するものである。
【0237】
(実施例5-抗Her2 scFv親和性パネルの提示)
この実施例では、本明細書に記載の方法を用いて、Illuminaフローセル上で、3.2×10-7~1.5×10-11 Mの既知の親和性範囲を持つ抗Her2 scFvのライブラリをクラスター化した。次に28ヌクレオチドをシーケンシングし、それにより各クローンの既知のユニークバーコード及びフローセル表面上の各クラスターの空間位置が解明された。次に、インビトロ翻訳及びリボソーム提示を実施する前に、本方法に記載のRNA合成を実施及び検証した。リボソームを、50 mM MgAcを含むバッファを加えて安定化した後、0.1% BSAでブロックした。100 nMのAF532ストレプトアビジンの短時間インキュベーション及びバッファ洗浄の後、0 nMのコントロール画像を撮影した。次に、0.03 nM~100 nMのHer2-ビオチン及び100 nMのAF532ストレプトアビジンで、平衡結合親和性滴定を段階的様式で行い、各濃度におけるフローセルの画像を保存した後、この方法に記載のようにカイネティックオフレートを測定した。
【0238】
フローセルの生画像を我々のデータ解析パイプラインで処理することにより、各濃度における各クローンの平均値、中央値、SEM(平均値の標準誤差)を報告することができた。この実験全体のフローセル画像を図7Bに示し、各クローンの強度中央値を平衡結合親和性及びオフレート測定について図7Cで報告する。曲線を、この方法に記載のようにこれらデータにフィッティングし、そのフィッティング結果をHer2に対するSPRで検証された結合親和性とともに表4に示す。
【0239】
(表4)
【表3】
【0240】
この実施例でのフィッティング曲線は、先に特性評価された結果と完全には一致せず、これは不完全な飽和及び採用した方法の違いによると思われるが、そのデータ中には注目すべきいくつかの興味深い観察がある。特にハーセプチンの結合曲線は、H3B1及びB1D2+A1よりも遅い平衡結合速度を示しているが、Rmaxは有意に高い。ハーセプチンはよく発現され、よくフォールディングする点で、非常によく作用するscFvであることが文献で公知であるので、有意に高いRmaxは結合親和性及び発現/フォールディングの組合せによるものと思われる。いずれにせよ、クローンには明確な順位があり、それはデータで観察可能であり、低ナノモル結合親和性及び高ナノモル結合親和性を明確にすることができる。従って、このデータは、Illuminaフローセル上で一本鎖抗体の平衡結合及びオフレートを表示し、測定する能力を実証する。
【0241】
(実施例6-XNA-2'-フルオロアラビノ核酸(FANA)の提示)
シーケンシングに続き、フローセルを画像化し、オフセットを測定してその機器の異なる光路間の色収差歪みを補正可能とした。次にシーケンシング産物を、ホルムアミド洗浄65℃で変性し、続いてIllumina社の「End Deblock」プロトコルを、試薬「Cleavage Reagent Mix (CRM)」及び「Cleavage Wash Mix (CWM)」を使用して実行することにより、フローセル表面にまだ存在している色素末端ヌクレオチドを除去する。次にフローセル上に存在する一本鎖DNAテンプレートで、P5プライマーから3'リン酸基を「脱保護」又は除去する必要がある。これは「Fast Resynthesis Mix (FRM)」又はT4ポリヌクレオチドキナーゼ(T4 PNK)及びIllumina社の脱保護プロトコルを使用してなされる。
【0242】
P5グラフトしたプライマー上の遊離3'ヒドロキシル基で、ペアエンドターンアラウンドプロセスを再利用して、D4YKポリメラーゼを用いてサイクルしたRNAプライマー伸長を実施する。ここでD4YKは、DNAテンプレートにアニールされたDNAプライマー(グラフトされたP5)を受け取り、それをFANAリボヌクレオチド(faNTP)で伸長する。これは、フローセルを55℃まで加熱し、1×Thermopolバッファ(20 mM Tris-HCl、10 mM (NH4)2SO4、10 mM KCl、2 mM MgSO4、0.1% Triton X-100、200 uM faNTP、10 nM D4YK pol、pH 8.8)を用いて、変性ミックスの注入、アニーリング、伸長(各伸長工程のインキュベーション時間は900秒である)を12サイクル行うことにより行われる。
【0243】
12サイクルのFANA伸長に続き、グラフトしたP7プライマーの8-オキソG部位上にオリゴをアニールし、切断を行う(Illumina社のFLM2試薬又は200 U/ml Fpg、100 ul/ml BSA、及び1×NEバッファ1を使用)。
【0244】
DNA切断及び最終伸長の次に、DNA:FANA二重鎖を変性し、100 mM NaOH及び5 mM EDTAの混合液を使用してDNAテンプレートを洗い流した後、次にそのフローセルを2 mlの6 M GuHCl、10 mM Tris、pH 7.4、及び2 mlの5X SSC、0.1% Tween 20で洗浄する。フローセル上に存在する一本鎖FANAのクラスターで、100 nMのR2_atto647N及びP7'_surface_hybをFANAの各分子の3'末端でP7アダプターにアニールする。
【0245】
(実施例7 XNA-2'-O-メチルリボ核酸(2'OMe)の提示)
シーケンシングに続き、フローセルを画像化し、オフセットを測定してその機器の異なる光路間の色収差歪みを補正可能とした。次にシーケンシング産物を、ホルムアミド洗浄65℃で変性し、続いてIllumina社の「End Deblock」プロトコルを、試薬「Cleavage Reagent Mix (CRM)」及び「Cleavage Wash Mix (CWM)」を使用して実行することにより、フローセル表面にまだ存在している色素末端ヌクレオチドを除去する。次にフローセル上に存在する一本鎖DNAテンプレートで、P5プライマーから3'リン酸基を「脱保護」又は除去する必要がある。これは「Fast Resynthesis Mix (FRM)」又はT4ポリヌクレオチドキナーゼ(T4 PNK)及びIllumina社の脱保護プロトコルを使用してなされる。
【0246】
P5グラフトしたプライマー上の遊離3'ヒドロキシル基で、ペアエンドターンアラウンドプロセスを再利用して、2Mポリメラーゼを用いたサイクルRNAプライマー伸長を実施する。ここで2Mは、DNAテンプレートにアニールされたDNAプライマー(グラフトされたP5)を受け取り、それを2'O-メチルリボヌクレオチド(2'OMe NTP)で伸長する。これは、フローセルを55℃まで加熱し、TAM(TGK増幅ミックス;200 uM 2'OMe NTP、10 nM 2M pol、2 Mベタイン、20 mM Tris、10 mM硫酸アンモニウム、6 mM MgSO4、0.1% Triton-X、1.3% DMSO、pH 8.8)を用いて、変性ミックスの注入、アニーリング、伸長(各伸長工程のインキュベーション時間は3600秒である)を12サイクル行うことにより行われる。
【0247】
12サイクルの2'OMe伸長に続き、グラフトしたP7プライマーの8-オキソG部位上にオリゴをアニールし、切断を行う(Illumina社のFLM2試薬又は200 U/ml Fpg、100 ul/ml BSA、及び1×NEバッファ 1を使用)。
【0248】
DNA切断及び最終伸長の次に、DNA: 2'OMe二重鎖を変性し、100 mM NaOH及び5 mM EDTAの混合液を使用してDNAテンプレートを洗い流した後、次にそのフローセルを2 mlの6 M GuHCl、10 mM Tris、pH 7.4、及び2 mlの5X SSC、0.1% Tween 20で洗浄する。フローセル上に存在する一本鎖2'OMeのクラスターで、100 nMのR2_atto647N及びP7'_surface_hybを2'OMeの各分子の3'末端でP7アダプターにアニールする。
【0249】
(実施例8-検討)
より幅広く多様な抗体(及び、一般的には、生体分子)のレパートリーは、より完全な様式で可能性のあるエピトープの形状空間をカバーするために、より高い確率で高親和性バインダーを含むことは長い間認識されてきた。本明細書に開示される実験は、ハイスループットスクリーニングのためのIlluminaシーケンシングプラットフォームを再利用した多くのグループの先駆的な研究を基礎として構築されており、それは、単一ドメイン及び一本鎖抗体の効率的な提示を実証することにより、そして又2レーン rapid runフローセル上でのスクリーニング深さを3×108(そして、8レーンフローセル上で2×109が可能)まで拡張することによりなされた。これにより、2つの異なるヒト治療用標的(IL-7及びHer2)に対して、未選択のレパートリーから数百もの異なる高親和性バインダーを直接発見することができ、親和性が通常の2~3桁向上した。
【0250】
このスクリーニング深さで、抗原-結合パラトープの突出した特徴を明らかにすることができる。例えば、IL-7親和性成熟ライブラリの場合、高親和性バインダーは、高度な収束をCDR L3配列で示した一方、CDR L1は最高の親和性クローンのためのコンセンサス配列のサインが現れているにもかかわらず、より多様なまま残った。同様にHer2親和性成熟ライブラリの場合、高親和性バインダーは、3つのコアモチーフ周囲にある程度の収束を示した。
【0251】
我々の実験から得られた重要な観察は、個々の精製された一価抗体Fab断片(scFvから転換後)の、最先端の生体物理学的測定(バイオレイヤー干渉法、BLI)によって決定された「真の」結合親和性は、見込みのあるアビディティ効果、クラスタリング及び提示効率の違い、拡散関連性のフロー効果、並びにフローセルの不均質な特定などの交絡因子があるにも拘わらず、フローセル上の平衡抗原結合によって推定される順位及び相対的親和性とよく相関する(IL-7クローンではρ=-0.788である)ことである。抗体順位は、本明細書では一般的には利用していないが、抗原解離カイネティクスを利用することでさらに向上し、差別化し得る。将来的には、平衡結合及びオフレート測定を組合せることで、提示された全抗体ライブラリにわたる見かけの全体的な親和性測定値のコレクションが可能となるであろうし、そのコレクションは今度は、大規模かつ内部的に一貫性のあるデータセットを、望ましい結合動力学を持つ高親和性抗原結合に関連するCDR配列空間の機械学習支援サンプリングへ提供する。
【0252】
最先端技術の機械学習モデルを訓練することにより、ディープスクリーニングによって生成される実験の親和性成熟データセットを使用して抗Her2バインダーを予測する、機械学習の有用性を例示した(図9A)。MLモデルをランダム変異導入とヘッドトゥーヘッド比較で評価し、11,916のMLガイド抗Her2変異体セット及び13,121のランダム変異体セットを計算的に生成し、これをオリゴプールとして並べ、ディープスクリーニングにより結合を実験的に測定した。ここで、MLセットから得られた高強度バインダーの数は、ランダム変異導入と比較して、全体的に5倍増加し(図9B)、MLモデルは、変異数が増えるにつれて、ランダムよりも大きな向上を生じることを観察した(5変異で23倍、表S4)。15の高強度クローン(MLセットから9個、及びランダムセットから6)を特性解析し、2.26×10-9及び6.07×10-11 Mの間の結合親和性を観察したところ、MLクローンHER200013は、親クローンG98Aに対して結合親和性が5,200倍向上した(図9C、9D)。
【0253】
我々が初めてタンパク質配列の機械学習モデルの訓練及び機能の予測を行ったわけではないが、大多数の文献は、天然タンパク質クラスの膨大な進化の歴史中に包まれていた機能への改良を予測しようとしたものである。特異的抗原に対する結合のエンジニアリングは、更に実質的に困難であり、その理由は、情報が大規模なシーケンシングデータセット内に存在せず、かつ全てのMLモデルが抗原特異的配列に依存してデータセットを機能化しており、ディープスクリーニングが容易に生成可能なのはそのデータセットであるからである。
【0254】
興味深いことに、ディープスクリーニングによって単離された抗体は、高親和性の抗原結合特性を示すだけでなく、例えばFab又はIgGに変換しても親和性を保持すること、高度な単量体性、及びCHO細胞での高い発現収率など、治療薬にとって重要な他の望ましい「開発可能性」の特徴を示す。これらの特徴は、望ましい物理化学的特性のためのプレ選択をある程度行うことにより生じ、それは最小の(シャペロンを欠損している)翻訳装置を用いて発現させ、37℃で1時間発現及びフォールディングをさせることによるという仮説を立てた。ミスフォールド又は凝集しやすいscFvは、低い平衡結合シグナル強度となるために選択解除されるであろう。
【0255】
ヒトの免疫系は約109のB細胞を含み、それぞれが異なる抗体を提示しているため、どのような抗原のチャレンジにも対応する備えがあるはずである。齧歯類では、免疫レパートリーはさらに少ないが(107)、やはりその抗体は実質的にどのような非自己抗原にも対応し得る。ナイーブレパートリーをディープスクリーニングにより忠実に提示できれば、一つのレパートリーで、原理的にはどのような所望の標的に対するバインダーも生じ得る。しかし、免疫系中のそのような初期バインダーは、通常、遅いオンレート、速いオフレートカイネティクスを有する中程度の親和性(低マイクロモルから高ナノモル)であり、これは現在のディープスクリーニングの実装により捕捉するための問題である。これは、フローセルの画像化(2レーンフローセルは4分かかり、8レーンフローセルは16分かかる)は、多くの場合、低マイクロモルのバインダーの半減期(1μMの親和性バインダーの解離半減期は約4~30秒)よりも遅いためである。とはいえ、検出感度(実験的及びハードウェア)のさらなる向上により、将来はナイーブライブラリのスクリーニングが可能になるであろう。
【0256】
ディープスクリーニングは、現在HiSeq 2500プラットフォームに実装されているが、より高度なHiSeq 4000及びNovaSeqプラットフォームであって、クラスタリング及び画像化の原理は似ているが、ランダムなクラスタリングとは違ってパターン化されたフローセルを使用することへ拡張することに明らかな障害はない。又、現在は、シーケンシング、並びに、フローセル結合及び画像化の両方を同一の機器で実施しているが、MiSeqプラットフォームで実証されたように、外部の画像化も可能であり、広範囲のカラーチャネル及び蛍光画像化モードなどの利点があるので、同一のアッセイでタンパク質発現、非特異的結合及び競合結合の測定が可能になる可能性がある。
【0257】
結論として、ディープスクリーニングは、HiSeqプラットフォームのシーケンシング後のスクリーニングの能力を、数億から数十億の測定値の領域にまで拡大する。方法論の進歩に伴い、これは、選択されたVHH及び未選択のscFv抗体ライブラリの提示及び直接的スクリーニング、並びに、そのようなライブラリからのピコモルの親和性バインダーの発見を、数週間又は数ヶ月ではなく数日で行うことを可能にする。更に又、ディープスクリーニングによって生成される大規模な遺伝子型-表現型相関データセットは、効率的な機械学習、並びに、出発ライブラリには存在しなかった新規な高親和性抗体配列をもたらす、抗体CDR配列及び抗原結合空間のサンプリングを可能にする。ディープ・スクリーニング・プラットフォームの多くの応用、特に抗治療用抗体医薬の発見及び開発における適用が期待される。
【0258】
(方法)
(構造体設計)
シーケンシングしたDNAクラスターをIlluminaフローセル上で転写及び翻訳するために、我々のDNA構造体には次のエレメント: P5アダプター、その次に、28ntユニークバーコード、27nt非構造化スペーサー(5p UNS v2)、リボソーム結合部位、開始コドン、タンパク質コード領域、TolAK短リンカー、2x終止コドン、27nt非構造化スペーサー(3p UNS v2)、及びP7アダプター、が含まれる。
【0259】
(表1)
【表4】
【0260】
(抗Her2 scFvクローンの調製)
Her2_G98A、Her2_C6.5、Her2_ML3~9、Her2_H3B1、Her2_B1D2+A1及びハーセプチンを含む抗Her2 scFvクローンは、US8580263B2及びUS5772997Aに開示されている。これらのクローンは、3.2×10-7~1.5×10-11 Mの親和範囲をカバーし、前記構造体エレメントを含むように設計した。設計した構造体を、IDT(Integrated DNA Technologies社)のgBlockとして発注し、大腸菌にクローニングし、シングルコロニーを採取し、サンガーシーケンシングで検証し、PCRにより抽出した。
【0261】
直鎖状二本鎖のDNAを、10 nMとなるように希釈し、そしてKAPA Quantキット(KK4824、Roche社)を使用したqPCRにより濃度定量した。
【0262】
(表2)
【表5】
【0263】
(クラスター生成及びバーコードシーケンシング)
上記クローンのそれぞれ5%を含むライブラリを、Illumina HiSeq 2500で、通常、約200mリードを生じる、ペアエンドrapid runフローセル(PE-402-4002、HiSeq PE Rapidクラスターキットv2、Illumina社)を6 pMで使用してクラスター化した。これらのフローセルは完全にクラスター化されて、下流のRNA合成及びリボソーム提示工程において400mリードを上回る収量を得ることができるが、結合アッセイの正規化を可能とするために、蛍光性Atto 647Nオリゴを、各クラスターのP7アダプターにハイブリダイズすることを選択した。200mリードよりも高密度の場合、我々のHiSeq 2500は、全ての標識されたRNAクラスターを有するフローセルに、信頼性高くフォーカスして画像化することはできない。フィデューシャルを使用すれば高いクラスター密度が可能となるであろうが、RNA合成効率に関する情報を得られないであろう。
【0264】
標準的なIllumina DNAクラスター生成プロトコルを改変し、ブリッジ増幅サイクルの数を28~32に増加し、各増幅サイクルごとに60秒待機時間を追加した。更なる改変として、増幅ミックスを2 Mベタイン、20 mM Tris、10 mM硫酸アンモニウム、6 mM MgSO4、0.1% Triton-X、1.3% DMSO、200 uM dNTP、80 U/ml Bst 2.0、pH 8.8を含むものとし、変性ミックスを、98%ホルムアミド、10 mM NaOH、及び1 mM EDTAを含むものとした。これらの改変の組合せは、上限1.2kbまで可能な、一本鎖抗体等の長テンプレートから成長したクラスターのシグナルを大きく向上させることが示された。
【0265】
クラスタリング及びシーケンシングを、ペアエンド、シングルリードランで、リード1で28サイクル、及びリード2で0サイクルをインデックス作成無しに行い、かつHiSeqコントロールソフトウェア(HCS v. 2.2.68、Illumina社)を使用して実行を達成した。フローセル及びクラスタリング試薬を、HiSeq PE Rapidクラスターキットv2(PE-402-4002、Illumina社)から入手し、シーケンシング試薬を、HiSeq Rapid SBSキットv2(FC-402-4023、Illumina社)から入手した。
【0266】
(RNA合成)
フローセルの画像化シーケンシングによって、オフセットを測定して、機器の異なる光路間の色収差歪を正規化することが可能となる。HCSを終了し、HiSeqエンジニアリングソフトウェア(Archimedes Testソフトウェア v. 3.8.317.0、Illumina社)を開始し、機器を初期化し、ステージをホームにし、化学モジュール実行モードを「RapidRun」に設定し、フローセル温度を20℃に設定する。次に、120 ulのIllumina社のユニバーサルシーケンシングバッファ(USB)をフローセルに送液後、自動チルトし、アラインし、そしてフローセルを「Bruno Scan」モジュールを使用して画像化する。具体的には、表面を「デュアルレーン」に、走査速度は2.0 mm/秒に、Swathは「Dual Swath」に設定することにより行った。フローセル画像が保存され、オフセット及びその機器の異なる光路間の色収差歪みを測定可能とする。
【0267】
次にシーケンシング産物をホルムアミドウォッシュ(例えば、FDR-Illumina社の「Fast変性剤」)で65℃で変性し、続いて、Illumina社の「End Deblock」プロトコル、試薬「Cleavage Reagent Mix (CRM)」及び「Cleavage Wash Mix (CWM)」を使用し、フローセル表面上に残っている色素末端ヌクレオチドを全て取り除くことを実行した。フローセル上に存在する一本鎖DNAテンプレートでは、その次に「脱保護」又は、P5プライマーからの3'リン酸基除去が必要である。これは、「Fast Resynthesis Mix (FRM)」又はT4ポリヌクレオチドキナーゼ(T4 PNK)及びIllumina社の脱保護プロトコルを使用してなされる。
【0268】
P5グラフトしたプライマー上の遊離3'ヒドロキシル基で、ペアエンドターンアラウンドプロセスを再利用して、TGKポリメラーゼを用いてサイクルしたRNAプライマー伸長を実施する。ここでTGKは、DNAテンプレート(クラスターストランド)にアニールされたDNAプライマー(グラフトされたP5)を受け取り、それをリボヌクレオチド(NTP)で伸長する。これは、フローセルを55℃まで加熱し、TAM(TGK増幅ミックス;625 uM NTP、10 nM TGK、18 U/ml Superase In(AM2696、Thermo社)、2 Mベタイン、20 mM Tris、10 mM硫酸アンモニウム、6 mM MgSO4、0.1% Triton-X、1.3% DMSO、pH 8.8)を用いて、変性ミックス(FDR)の注入、アニーリング、伸長(各伸長工程のインキュベーション時間は1800秒である)を12サイクル行うことにより行われる。
【0269】
12サイクルのRNA伸長に続き、長いテンプレート(>800 nt又は>900 nt)では、TGKはストランドの合成を完成することができないことを観察した。これは、それぞれの5'末端を介して表面に共有結合しているDNA:RNA二本鎖内のトルクの積み上げが理由であると思われた。このトルクを開放するため、グラフトしたP7プライマー上野8-オキソG部位にかかるオリゴをアニールし、2サイクルの切断(Illumina社の「Fast Linearisation Mix 2」(FLM2)試薬又は200 U/ml Fpg、100 ul/ml BSA及び1×NEバッファ1を使用)及び伸長(TAMで)を、それぞれ37℃で30分間、及び55℃で1時間実施する。
【0270】
DNA切断及び最終伸長に続き、DNA:RNA二本鎖を変性させ、DNAテンプレートを、100 mM NaOH及び5 mM EDTA(又はIllumina社のFDRミックス)の混合物を使って洗い流した。その次に、フローセルを2 mlの6 M GuHCl、10 mM Tris、pH 7.4、及び2 mlの5X SSC、0.1% Tween 20でクリーニングする。フローセル上に存在する一本鎖のRNAクラスターで、100 nMのR2_atto647N及びP7'_surface_hybをRNAの各分子の3'末端でP7アダプターにアニールする。
【0271】
(表3)
【表6】
【0272】
(Illumina社フローセル上のリボソーム提示)
New England Biolabs(NEB)社のカスタムPURExpressキット(遊離因子1、2及び3を欠き、かつT7 RNAポリメラーゼを欠く)を使用して、リボソーム提示を実施した。具体的には、80 ulの溶液A、60 ulの溶液B、4 ulのジスルフィドエンハンサー1及び2(E6820S、NEB社)(必要であれば)、4 ulのSuperase In(AM2696、Thermo社)、10 ulの10 mM Tris、pH 7.0、4 MのトリメチルアミンN-オキシド及び10 ulのMillipore 水(必要であれば)を含む200 ulのマスターミックスを調製した。次に、フローセルの各レーンに、カスタム設計した低デッドボリュームマニホールドを使用して、90 ulのマスターミックスを泡が混入しないように注意して注入し、次にフローセルを37℃で 60分間、HiSeqでインキュベートした。インキュベーション期間終了後、フローセルを20℃まで冷却し、続いて洗浄し、レーン当たり1 mlのリボソーム提示バッファ(50 mM TrisAc(トリス(ヒドロキシメチル)アミノメタンアセテート)、150 mM NaCl、50 mM MgAc(酢酸マグネシウム)、0.1% Tween 20、1 U/mlのSuperase In(AM2696、ThermoFisher社)、pH 7.5)でリボソームを安定化させる。
【0273】
次に、提示バッファにより安定化させたリボソームに関して、フローセルを結合バッファ(リボソーム提示バッファ及び0.1% ウシ血清アルブミン(BSA)(A9647、Sigma-Aldrich社))を使用して、各注入間は10分あけて6× 250 ulで注入してブロックした。次に、100 nMのAF532ストレプトアビジン(S11224、ThermoFisher Scientific社)の結合バッファ溶液を注入し、これを20℃で30分間インキュベートし、次に1レーンあたり250 ulの結合バッファでフローセルを洗浄して画像化した。これらの画像は、バックグラウンド蛍光、非特異的な結合、及びシーケンシングで残った蛍光のためのベースラインとなる。
【0274】
(内部のシーケンシングプライマーを使ったCDRシーケンシング)
ディープスクリーニング提示実験が成功した後、内部シーケンシングプライマーでCDR配列を解明するために、同一のライブラリを使用して後続のシーケンシング実験をセットアップした。CDRシーケンシング実験は、HCSでカスタムレシピで行われ、そのレシピでは最初にIllumina社のリード1シーケンシングプライマーでN28 UMIを28サイクルシーケンシングし、続いてFDRでシーケンシング産物を65℃で変性させ、適切な内部シーケンシングプライマーをアニーリングし、可変領域をカバーするのに充分なサイクルでシーケンシングする。この実験で使用した全ての内部シーケンシングプライマーはIDT社から入手し、HPLCで精製し、100μMでIDTEに再懸濁した。
【0275】
(CDRの内部シーケンシングに使用したオリゴ)
【表7】
【0276】
(Her2の抗Her2 scFvへの結合親和性パネル)
平衡結合アッセイを、Her2-ビオチン(HE2-H822R、Acro biosystems社)の0.03 nM~100 nM希釈系列(結合バッファ中)、及び、100 nM AF532ストレプトアビジンの結合バッファ溶液を調製することにより実施する。結合アッセイの各工程は、1)Her2-ビオチンを1レーンあたり100ul注入し、2)40分間インキュベートし、3)結合バッファを1レーンあたり100 ulで洗浄し、4)100 nM AF532ストレプトアビジンを1レーンあたり100ul注入し、5)10分間インキュベートし、6)150 ul 1の結合バッファで洗浄し、そして7)フローセルを画像化する。このプロセスは最低濃度から最高濃度へと段階的に行われる。
【0277】
平衡結合実験に続き、結合バッファをフローセルへ一定の速度で注入し、一定の時点で画像化することにより、プソイドカイネティックオフレートを測定できる。この場合は、フローセルを5、10、20、60、120、及び240分間隔で画像化した。
【0278】
(画像処理)
2レーンのrapid runフローセルの走査1回で、4色チャネルの8 x 2048 x 160,000 ピクセルの16ビットtif画像が生成され、合計32枚の画像が得られる。HiSeq 2500は、発光フィルタ(558~32 nm、610-60 nm、687~20 nm、及び740~60 nm)セットを備えた532 nm及び660 nmレーザーを使用し、4倍の時間遅延積分(TDI)ライン走査式CCD検出器にパスアウトする。Alexa/Atto 647の「A」及び「C」チャネル、及びAlexa 532の「G」及び「T」チャネルからのシグナルを伴うこれらの色素が検出可能であり、「C」及び「T」チャネルについて最大のシグナル対ノイズ比が観察された。そのため、「C」及び「T」色チャネルを使用する分析のみを実施した。
【0279】
我々の画像処理パイプラインは、2048 x 160,000ピクセルの各画像を、独立に並列処理する16のタイルに分割することにより作動する。所与のタイル画像のために、最初に、形態的な開口部へ半径25ピクセルを有する円盤状構造のエレメントを適用することにより、不均一な照明補正を行い、その後そのタイル画像から形態的な開口部を除去する。次に、3 x 3ピクセルの正方形カーネルでタイル画像の形態拡張を行うことで最初に動作するピーク局所最大値関数を用いて、そのタイル画像に存在するクラスターの重心を検出する。その後、アルゴリズムはタイル画像の各ピクセルを移動し、タイル画像のピクセル画像が同一の拡張されたピクセルの値と等しいかどうか、そのピクセル強度が設定しきい値を超えているかどうかをチェックする。所与のピクセルがこれらの条件を満たす場合、それは重心とみなし、重心マップに追加する。この場合、ピクセル強度しきい値400又は600を使用する(この値は我々の機器用に手動で調整した)。このクラスター検出方法は単純で計算が速く、我々のニーズに全体的に充分である。
【0280】
「C」及び「T」画像上の検出クラスター座標を使用し、既知のシーケンシング座標に対して、OpenCVパッケージのDFT(離散フーリエ変換)位相相関関数を使用して、これらのアライメントを行う。顕微鏡ステージの再現性及びHiSeq内の光学的歪みには若干のばらつきがあるため、そのタイル画像を128 × 128ピクセルの非重複サブ画像に細分化することで、精緻なアライメントを行い、オフセットマップにその精緻なオフセットを保存する。
【0281】
精緻なオフセットマップを使用して、オフセット補正されたクラスター座標を重心とした9 × 9ピクセルのサブ画像を抽出することにより、シーケンシングデータから全ての既知のクラスターの強度を定量化する。次に、9 × 9ピクセルのサブ画像を、シグマ0.5の二次元ガウシアン点像分布関数(PSF)から構築された9 × 9ピクセルアレイで、エレメントごとの乗算を実施する。下式を、我々の二次元ガウシアンPSFを記述するために使用する。
【数1】
【0282】
エレメントごとの乗算後のピクセル値の合計を、クラスター強度として定義する。画像処理パイプラインは、フローセルの全てのスキャンから、「C」及び「T」チャネル上の全てのシーケンシングしたクラスターのクラスター強度を報告し、これをディスクに保存するか、又はデータベースに挿入する。
【0283】
(データ解析)
バーコード配列及び統合されたクラスター強度を、我々のカスタムデータ処理パイプラインを通して、ユニークバーコード配列によりマッチングしてグループ分けする。これは次に、絶対偏差中央値及びカットオフ2.0を使用して異常値棄却を実施する。全体統計を、各ユニークバーコード;平均値、中央値、標準偏差、平均値の標準誤差、最小強度及び最大強度等について報告する。これは、「C」チャネル及び「T」チャネルの両方について行い、RNAプローブシグナルに対するタンパク質結合シグナルの正規化を可能とする。
【0284】
更に詳細には、最初にデータ解析を開始し、全てのクラスターデータをその共通のN28 UMIによってグループ分けする。クラスターが画像化領域の外側にあることを理由とした拒絶を受けていない、少なくとも12のレプリケートが存在する場合、UMIは維持される。次にUMI並びに、UMI及びCDRシーケンシングデータを含み、UMI当たり少なくとも3つのCDRリードが存在する結合データをグループ分けする。グループ分けに続き、絶対偏差中央値の異常値棄却を実施して、T(532nm;タンパク質)色チャネル及びC(660nm;RNA)色チャネルの両方にある各UMIについて、平均値、中央値、標準偏差、及び平均値の標準誤差を計算する前に、CDRリードコンセンサスエラーを修正する(そして、コンセンサスが存在しない場合はUMIを排除する)。
【0285】
(平衡結合及び解離速度フィッティング)
ユニークバーコード及び異常値除去によりグループ分けされた結合データで、抗Her2 scFvライブラリの各メンバーについて中央値結合データをプロットし、平衡結合曲線を下式及び最小二乗フィットを用いてソルバーとして信頼領域反射アルゴリズムでフィッティングした。
【数2】
ここで、Fmaxは、所与のクローンの最大強度、Fminは、所与のクローンの最小強度、kdは、フィッティングさせるべき値であり、xは所与の中央値強度(y)のための抗原濃度である。
【0286】
カイネティックオフレートをフィッティングするため、下式をそのデータに最小二乗法及び信頼領域反射ソルバーを用いてフィッティングした。
【数3】
ここで、tは秒単位の時間、R1はコンポーネント1の初期応答レベル、kdiはコンポーネントiの解離速度定数、R0は解離開始時の全応答レベル、t0は解離開始時間である。
【0287】
平衡結合及び解離速度フィッティングは、代わりに下記の通り記載しても良い。
【0288】
フローセルベースの平衡結合曲線は、下式を用いてpython Package SciPyのcurve_fit()関数に実装されているように、最小二乗法を用いて所与のUMIの統合された平均強度にフィッティングされる。
【数4】
ここで、Fmaxは観測された最大強度、Fminは観測された最小強度、KDはフィッティングする予定の平衡結合定数であり、xは所与の測定濃度である。
【0289】
フローセルベースのカイネティック解離曲線は、次の二相系解離式を用いてpython Package SciPyのcurve_fit()関数に実装されているように、最小二乗法を用いてフィッティングされる。
【数5】
ここで、R0は解離開始時に観察された強度、R1はコンポーネント1の初期強度のフローティングパラメータ、tは秒単位の時間、t0は解離開始時間であり、kdiはコンポーネントiの解離速度定数である。
【0290】
(ナノボディ酵母表面提示選択)
ナノボディ酵母提示ライブラリは、>2.5×109細胞の冷凍ストック(EF0014-FP、Kerafast社)としてKruse laboratoryから入手した。ライブラリのアリコートを、最初に30℃で解凍し、次に1 Lの「Yglc4.5 -Trp」(3.8 g/L -Trp酵母ドロップアウト培地サプリメント(Y1876、Merck社)、6.7 g/L 酵母窒素ベース(Y0626、Merck社)、10 mL/L Pen-Strep(P4333、Merck社))で、230 RPM、30℃で一晩振盪して回収した。次に回収した培養液を3 Lの培地に展開し、48時間かけて定常期(OD600は20)まで増殖させた。培養液を3,500x gで5分間遠心分離し、10 % DMSOを補充した新鮮なYglc4.5 -Trpに再懸濁し、最終密度が1 mL当たり1010細胞になるようにした後、2 mLのアリコートを作り、-80℃で凍結した。
【0291】
第1選択ラウンド用のナイーブライブラリを調製するために、1つのアリコートを30℃で解凍し、2%のガラクトースを補充したYglc4.5-Trpの1 L接種に使用した。次にこの培養液を72時間24℃で増殖させた。発現は、FITC標識抗HA抗体(GG8-1F3.3.1、Miltenyi Biotech社)を用いたフローサイトメトリーで、第1選択ラウンドの前に確認した。10倍を超えるライブラリの多様性を示す細胞は、最初にストレプトアビジンマイクロビーズ(Miltenyi Biotech社)に対して、1時間4℃でPBS-T-BSA(0.1% Tween-20、0.1% BSA)中で選択解除した後、Miltenyi MACSマグネット上のビーズから分離した。次に、選択解除した細胞を、500 nM HEL-ビオチン(GTX82960-pro、GeneTex社)存在下で、1時間4℃でインキュベートした。ストレプトアビジンビーズを加え、さらに15分間インキュベートした後、Miltenyi MACSマグネット上で選択及び洗浄した。ビーズ及び結合された細胞を溶出し、ペレット化し、2%ガラクトースを補充した1LのYglc4.5-Trpに再懸濁した後に、72時間24℃で増殖させた。第2ラウンドは第1ラウンドと同様に行ったが、選択解除細胞は存在せず、かつHEL-ビオチンを300nMに減らし、その後ストレプトアビジンマイクロビーズを加え、MACSカラム上でパンニングし、洗浄し、細胞を回収した。
【0292】
第2ラウンドの後、リカバーした細胞を半分の体積に分割し、分割したそれぞれを用いてMACS(磁気活性化細胞選別)及びFACS(蛍光活性化細胞選別)による第3ラウンドを実施した。第3ラウンドのMACSは、HEL-ビオチンをさらに200nMに減らして第2ラウンドと同様に行い、その後回収、遠心分離及びプラスミドDNAのミニプレップ(D2004、Zymo Research社)による細胞の取得を行った。細胞を取得する前に、100 μLの細胞を段階希釈し、YPD寒天プレートにプレーティングして、コロニーのPCR及びサンガーシーケンシング用の96コロニーを採取可能とした。第3ラウンドのFACSは、細胞を200nMのHEL-ビオチンで、1時間4℃でインキュベートし、ペレット化して新鮮なPBS-T-BSAに再懸濁し、100μgのニュートラアビジンPE(A2660、ThermoFisher Scientific社)及び抗HA-FITC抗体の1:1000希釈液と15分間一緒にした後、Synergy 3セルソーター(Sony Biotechnology社)でソートし、二重標識(FITC/PE)イベントのゲーティングを行い、50,135の細胞を得た。ソートした細胞を回収し、第3ラウンドのMACSによりミニプレップした。
【0293】
(ナノボディライブラリ調製及びディープスクリーニング)
第3ラウンドのMACS及びFACS用のミニプレップを、プライマーを用いて、PCR増幅(Q5ポリメラーゼ; M0492、NEB社)を20サイクル行った。そのプライマーは、N末端フレームワーク領域、C末端HAタグとアニールし、5'フローセルアダプター(RBS+ATG; KF_olap.fwd)及び3'フローセルアダプター(TolAkリンカー; KF_olap.rev)と相同性を有する各プライマーの5'末端に20ヌクレオチドのオーバーハングを導入するものである。
【0294】
【表8】
【0295】
アダプターとの相同性を有する現ナノボディライブラリを、1%アガロースゲル上に流し、約449 bp(ライブラリが可変サイズのCDRループを含むため、おおよそ)のバンドをゲル抽出し、精製し、そしてnanodropで定量化した。次にライブラリを、0.2 pmolの5'アダプター、ナノボディライブラリ断片、及び3'アダプター、並びにHiFi DNAアセンブリマスターミックス(E2621、NEB社)と Gibsonアセンブリで、ディープスクリーニング提示構造体へとアセンブリし、50℃で30分間インキュベートする。次に、Gibsonアセンブリ反応物(推定効率100%)から300 amolの材料を取り出すことによりライブラリをボトルネック化し、Q5ポリメラーゼ及びoutnest P5及びP7プライマーを用いて25サイクルPCR増幅する。
【0296】
【表9】
【0297】
PCR産物を1%アガロースゲル上に流し、おおよそ800 bpのバンドをゲル抽出し、精製し、最初はnanodropで、次にqPCR(NEBNext library quant kit、E7630、NEB社)で定量した。
【0298】
定量化したライブラリはディープスクリーニングの準備ができ、2 nMとなるように希釈してから変性させ(10 μLのライブラリを10 μLの100 mM NaOHと混合し、室温で5分間インキュベートした)、rapid PEフローセルクラスタリングキット(PE-402-4002、Illumina社)から入手したHT1バッファで20 pMとなるように迅速に希釈した。次にそのライブラリを濃度6 pMに希釈し、その後HiSeq 2500のテンプレートスロットにロードし、上記のようにディープスクリーニング実験をセットアップした。
【0299】
ベースラインフローセル画像の取得に続き、HEL-ビオチンの濃度を連続的に増加させながら平衡結合アッセイを行った。各条件は具体的には、AF532ストレプトアビジン(S11224、ThermoFisher社)と1:1比で提示バッファ中20℃でプレ複合体化させた、120 μLのHEL-ビオチン(GTX82960-pro、GeneTex社)の注入、45分間20℃でのインキュベーション、200 μLの提示バッファでの洗浄、その後フローセルの完全画像化を含む。これは、1 nM、10 nM、100 nM、及び300 nMのHELと1:1量のAF532ストレプトアビジンについて実施した。最高濃度のHELに従い、カイネティック解離速度の測定を行った。これは、フローセル上に提示バッファを送液し、5分、10分、15分、20分、30分、60分、及び120分時に画像化することで達成した。次に生画像を前記のように処理した。
【0300】
(ナノボディ発現及びペリプラズム抽出)
ナノボディヒットを、シーケンシングしたCDR領域(実際の可変部の前後3ヌクレオチドを含む)の外側に変異が存在しないと仮定して計算的に構成した。構成したヒットを次にコドン最適化し、IDT社にgBlockとしてオーダーし、その後、Markus Seeger氏から贈呈された大腸菌ペリプラズム発現ベクターpSBinit(Addgene plasmid #110100; http://n2t.net/addgene:110100; RRID:Addgene_110100)にFXクローニングでクローニングした。シングルコロニーを採取し、サンガーシーケンシングによって正しいクローンかを検証した。検証後、シングルコロニーを5 mLのTB+25 μg/mLのクロラムフェニコールで37℃で一晩増殖させた後、1:100で5mLのTB(クロラムフェニコールと共に)に継代培養した。培養物は37℃で増殖し、0.05% w/v L-アラビノースでおよそ0.6~0.9のOD600で誘導した。培養物をさらに3.5時間増殖した後、2,500x gで20分間、4℃で遠心分離して、上清を捨てることにより収穫した。ペレットを250μLのTESバッファ(50mM Tris-HCl、pH7.2、0.1mM EDTA、20%スクロース)に再懸濁し(元の培養体積の1/20)、氷上で60分間インキュベートしてペリプラズム抽出を行った。上清を20,000x g、30分間、4℃で遠心分離して回収し、SDS pageでタンパク質収量を定量した。全てのクローンをSuperBlock PBS(37515、ThermoFisher Scientific社)中で500 nMの濃度に標準化してからBLIカイネティクス測定を行った。
【0301】
(ナノボディカイネティクス測定)
SuperBlock PBS中500 nMに標準化してあるペリプラズム抽出したナノボディを、さらに50 nMとなるように希釈した。バイオレイヤー干渉法(BLI)カイネティクスを、Octet Red384 (Sartorius社)で、非ロードのストレプトアビジンチップ(18-5136、Sartorius社)を用いて、各ナノボディクローンについて行ったリファレンス差分で実施した。カイネティクスは、次の工程を使用して測定した: 1)30秒間のセンサーチェック、2)400秒間のHEL-ビオチン25 μg/mLでロード、3)240秒間のベースライン測定、4)400秒間又は500秒間の各ナノボディ50 nMでの結合カイネティクス、5)600秒間の解離カイネティクス。全ての段階において、バッファとしてSuperBlock PBSを使用した。
【0302】
(バイオレイヤー干渉法データフィッティング)
BLIカイネティクスデータを、上記及び下記のカイネティクス測定セクションで説明されるように、Octet Red384機器で収集した。全ての場合において、ストレプトアビジンチップ(18-5136、Sartorius社)にビオチン化標的抗原をロードし、ベースラインシグナルまで洗浄した後に、一定濃度の各VHH又はFabクローンで結合した。オンレートカイネティクスを得た後に、チップを新鮮なバッファに浸して、オフレートカイネティクスを測定した。各クローンの測定データは、ストレプトアビジンのみのチップを参照して、ストレプトアビジンへの非特異的結合を除去した。
【0303】
1:1モデルを、カスタムpythonスクリプトを用いて最小二乗法で、全データに対しフィッティングした。
【0304】
結合速度は、下式に当てはまる。
【数6】
ここで、Rmaxはピーク応答、kdは推定される解離速度、Kaは決定される結合速度、Cはモル単位のFab濃度、tは秒単位の時間である。
【0305】
解離速度は、下式に当てはまる。
【数7】
ここで、Y0は結合段階終了時のRassocに等しく、Kdは決定される解離速度、tは秒単位の現在時、t0は解離段階開始時である。
【0306】
KD値は下式で計算される。
【数8】
【0307】
(IL-7ライブラリ調製及びディープスクリーニング)
非選択のIL-7 Vκ軽鎖CDR L1及びL3 scFvライブラリが調製され、pCANTAB6プラスミドでAstraZeneca社によりから我々に提供された。scFvライブラリを、Q5ポリメラーゼ並びに、5'及び3'提示アダプターと25ヌクレオチドの相同性を提供するプライマーを用いた20サイクルPCRによって抽出した。PCR産物を1%アガロースゲル上に流し、だいたい778 bpのバンドをゲル抽出し、精製した。ナノボディライブラリアセンブリと同様に、0.2 pmolの5'アダプター、scFvライブラリ断片、及び3'アダプター、並びにHiFi DNAアセンブリマスターミックス(E2621、NEB社)を組合せて、50℃で30分間インキュベートする。次に、Gibsonアセンブリ反応物(推定効率100%)から500 amolの材料を取り出し、Q5ポリメラーゼ及びoutnest P5及びP7プライマーを用いて25サイクルPCR増幅することにより、ライブラリをボトルネック化する。PCR産物を1%アガロースゲル上に流し、1.2 kbのバンドをゲル抽出し、精製し、最初はnanodropで、次にqPCR(NEBNext library quant kit、E7630、NEB社)で定量した。
【0308】
定量化したライブラリはディープスクリーニングの準備ができ、2 nMとなるように希釈してから変性させ(10 μLのライブラリを10 μLの100 mM NaOHと混合し、室温で5分間インキュベートした)、rapid PEフローセルクラスタリングキット(PE-402-4002、Illumina社)から入手したHT1バッファで20 pMとなるように迅速に希釈した。次にそのライブラリを濃度6 pMに希釈し、その後HiSeq 2500のテンプレートスロットにロードし、上記のようにディープスクリーニング実験をセットアップした。
【0309】
ベースラインフローセル画像の取得に続き、AF532ストレプトアビジン(S11224、ThermoFisher社)と1:1比(100 pM、333 pM、及び1 nM)でプレ複合体化したhu-IL7-ビオチンの濃度を連続的に増加させながら平衡結合アッセイを行った。この実験では、フローセル表面でのhu-IL-7の実質的な凝集が観察され、それにより1nM hu-IL-7の濃度を超えると画像化不能となり、その結果カイネティック解離測定値は得られなかった。画像は前記のように処理されてCDR配列が解明され、それは推定ヒットを特定するために使用した。
【0310】
(抗IL-7及び抗Her2 Fabの発現及び精製)
上位19の推定抗IL7ヒット(及びIL70001)並びに全26の抗Her2ヒット(G98A、及びML3~9を含む)をscFvからFab形式に転換し、重鎖及び軽鎖可変部を別々に合成し、それぞれ哺乳動物発現ベクターpEU10.1及びpEU4.4にクローニングした。ベクターを、PEI及びプロプライエタリ培地を用いてCHO(チャイニーズハムスター卵巣)細胞に一過性トランスフェクトした。発現されたFabを、清澄化した培養上清をCaptureSelect(商標)CH1-XLカラム(Life Technologies、ThermoFisher社、オランダ国)にロードし、DPBSで実行し、25 mM酢酸pH 3.6で溶出し、PD-10脱塩カラム(Cytiva社)を用いてDPBS pH 7.4にバッファ交換して精製した。濃度は、アミノ酸配列に基づく吸光係数を用いて分光光度法で決定した。タンパク質純度はSDS-PAGEで検証し、正しい分子量(MW)の検証はLC-MS分析で達成した。HP-SEC分析は、精製後に、各タンパク質70 μlをTSKgel G3000SWXL; 5 μm、7.8 mm x 300 mmカラムにロードして、流速1 ml/分、0.1 M 無水リン酸二ナトリウム(無水)+0.1 M硫酸ナトリウム、pH 6.8を泳動バッファとして使用して実施した。比較目的で、ゲルろ過標準品(BIORAD社、カタログ番号151-1901)も又使用した。
【0311】
(IL-7カイネティクス測定)
上位19ヒット及びIL70001の結合カイネティクスを、Octet BLI 及びストレプトアビジンコートチップ(18-5136、Sartorius社)を用いて測定した。全ての場合において、使用したバッファはDPBS(14190-169、Gibco社)+0.1% BSA+0.02% Tween-20であった。精製Fabを、最終濃度50 nMとなるように希釈した。カイネティクスは、次の工程を使用して測定した: 1)60秒間のセンサーチェック、2)30秒間のhu-IL7-ビオチン5 μg/mLでロード、3)60秒間のベースライン測定、4)300秒間の各Fab 50 nMでの結合カイネティクス、5)600秒間の解離カイネティクス。
【0312】
(TF-1 STAT5 IL7Rα+γ細胞ベースのレポーターアッセイ)
1mlの107/ml TF-1 STAT5 IL7α+γルシフェラーゼcG3細胞を含む2本のバイアルを液体窒素から取り出し、解凍し、そして40 mLの完全培地を含む1 x 50 mlのFalconチューブ(チューブあたりバイアル2本)に移し、5分間1,200 rpmで遠心分離した。上清を吸引し、細胞ペレットを40 mLのRPMI(11875093 ThermoFisher社)+10% FBS+1% ピルビン酸ナトリウムに再懸濁し、その後さらに5分間1,200 rpmで遠心分離し、次に以前と同様に上清を吸引した。最後に細胞を、40ml RPMI+10% FBS+1% ピルビン酸ナトリウムに再懸濁し、T175フラスコに入れ、37℃で24時間、5% CO2雰囲気下でインキュベートした。
【0313】
Hu-IL7(CHO発現)をRPMI+10% FCS+ピルビン酸ナトリウムで最大0.12 nMに調製し、これを次に1:100に希釈して最終体積20 mLとし、384ウェルプレートに添加した。精製Fabを希釈なしで384ウェルプレートに添加し、Bravoリキッドハンドリングプラットフォームを用いて完全RPMIに11点の二重3倍段階希釈を行った。24時間インキュベーション後に細胞を取り出し、1,200rpm、5分間の遠心分離でペレット化し、10 mLのRPMI+10%FCS+1%ピルビン酸ナトリウムに再懸濁した。細胞を数え、完全RPMIで希釈して濃度10,000細胞/20 μLにした。次に細胞(20μL)を3×384ウェルクリアアッセイプレートに加えた。10μLの滴定Fabを細胞に添加し、続いて10μLの120 pM Hu-IL7を添加した。その後、プレートを組織培養インキュベーター内で、6時間、37℃で5% CO2雰囲気下で保持した。100mLのSteady-Glo試薬(E2520、Promega社)を使用前に解凍し、40μLを384ウェルプレートの各ウェルに添加した。プレートを密封し、測定前にプレート振盪器で10分間インキュベートした。発光リーディングは、EnVisionプレートリーダーを用い、1秒パルスタイムで測定した。各Fabは二連で測定した。
【0314】
データをエクスポートし、カスタムPythonスクリプトを用いて処理し、平均データを、最小二乗法を用いて次式で定義される対数阻害因子応答曲線にフィッティングした。
【数9】
ここで、Yは応答、Bottomはシグモイド曲線の最小値での応答、Topはシグモイド曲線の最大値での応答、LogIC50は、TopとBottomの間の中間の応答を与える阻害因子の対数濃度であり、HillSlopeは曲線の急峻さを表す。
【0315】
(抗Her2親和性パネルのディープスクリーニング)
抗Her2 scFv親和性パネル及びハーセプチンタンパク質配列は、逆翻訳され、コドン最適化され、そして既知の28ヌクレオチドUMIを有するディープスクリーニング提示構造体を構成する。DNA構造体を、IDTのgBlockとして発注し、1構造体あたり1%の割合でrapid PEフローセル上にクラスター化し、フローセル上の残りのクラスターはPhiXコントロール(FC-110-3001、Illumina社)を含むものであった。このフローセルを28サイクルでシーケンシングし、前記のようにディープスクリーニング提示を行った。
【0316】
抗Her2 scFvクローンの核酸配列を表2に示す。
【0317】
成功した提示に続き、ビオチン化されたヒトHer2(HE2-H822R-25ug、Acro biosystems社)及びAF532ストレプトアビジン(S11224、ThermoFisher社)を使用して、平衡結合アッセイを実施した。この場合には、結合アッセイサイクルを、120 μLのHer2-ビオチンの注入、45分間20℃でのインキュベーション、200 μLの提示バッファでの洗浄、120 μLの100 nM AF532ストレプトアビジンの注入、10分間20℃でのインキュベーション、その後200 μLの提示バッファでの洗浄、及び画像化により実施した。平衡結合アッセイは、100 pM、333 pM、1 nM、3.33 nM、10 nM、33.3 nM、及び100 nM Her2-ビオチンで実施し、その後カイネティック解離アッセイを開始した。解離アッセイは、フローセル上に洗浄緩衝液を送液し、5分、10分、20分、60分、240分、及び420分時に画像化することで実施した。この実験から収集されたデータは前記のように処理し、既知のUMIでグループ化することにより集約統計が計算された。
【0318】
(抗Her2 scFv親和性成熟ライブラリ調製及びディープスクリーニング)
G98Aを親の出発クローンとしてCDR VH3親和性成熟ライブラリを構築した。これは、前のセクションのG98A gBlockを上位10の化学的にコンピテントな細胞(C404010、ThermoFisher社)にTOPOクローニング(450245、ThermoFisher社)し、6コロニーを採取し、これらを一晩5 mLのTB+50 μg/mLカナマイシンで増殖し、そして2 mLの培養液をミニプレップすることによって達成された。プラスミドは、M13フォワードプライマー及びリバースプライマーを用いるサンガーシーケンシングのために送られた。正しいコロニーの一つを、次の処理に進めた。
【0319】
VH3親和性成熟ライブラリを構築するために、最初にVH3の上流及び下流の領域を抽出する必要があった。これを、Q5ポリメラーゼを、プライマーセット1(G98A_olap.fwd及びG98A_5p_VH3.rev)並びにプライマーセット2(G98A_3p_VH3.fwd及びG98A_olap.rev)と共に使用した2つの反応の25サイクルである、プラスミドDNA のPCR増幅によって行った。次に両PCR産物を、DpnI(R0176L、NEB社)で1時間37℃で処理した後、PCRクリーンアップキット(T1030S、NEB社)で精製した。このプロセスにより、ディープスクリーニング提示構造体と相同性を持つG98Aクローンの上流及び下流断片が得られ、かつ野生型プラスミドDNAの混入は排除されていた。
【0320】
【表10】
【0321】
次に、Q5ポリメラーゼ、G98Aの上流及び下流断片、CDR VH3にわたる4個のNNSコドンの走査ウィンドウを生成する等モル量のVH3 NNSオリゴ、G98A olapフォワードプライマー及びリバースプライマーを用いて、PCRを20サイクル行い、Her2親和性成熟ライブラリをアセンブリした。次にこの生成物を、PCRクリーンアップキット(T1030S、NEB社)を使用してカラム精製した。次に、0.2 pmolの各断片及びNEB HiFiアセンブリマスターミックス(E2621、NEB社)でGibsonアセンブリを使用して50℃ 60分間、ディープスクリーニング5'及び3'アダプターを付加する。次に、Gibsonアセンブリ反応物(推定効率100%)から300 amolの材料を取り出すことによりライブラリをボトルネック化し、Q5ポリメラーゼ及びoutnest P5及びP7プライマーを用いて25サイクルPCR増幅する。PCR産物を、1%アガロースゲル上に流し、1.2 kb バンドをゲル抽出し、精製し、そして最初にnanodropで、次にqPCR(NEBNext library quant kit、E7630、NEB社)で定量化した。
【0322】
定量化したライブラリはディープスクリーニングの準備ができ、2 nMとなるように希釈してから変性させ(10 μLのライブラリを10 μLの100 mM NaOHと混合し、室温で5分間インキュベートした)、rapid PEフローセルクラスタリングキット(PE-402-4002、Illumina社)から入手したHT1バッファで20 pMとなるように迅速に希釈した。次にそのライブラリを濃度6 pMに希釈し、その後HiSeq 2500のテンプレートスロットにロードし、上記のようにディープスクリーニング実験をセットアップした。
【0323】
ベースラインフローセル画像の取得に続き、AF532ストレプトアビジン(S11224、ThermoFisher社)と1:1比(100 pM、333 pM、1 nM、3.33 nM、10 nM、33.3 nM、及び100 nM)でプレ複合体化した、ヒトHer2-ビオチン(HE2-H822R-25ug、Acro biosystems社)の濃度を連続的に増加させながら平衡結合アッセイを行った。この場合には、結合アッセイサイクルは、120 μLのHer2-ビオチン:AF532ストレプトアビジンのプレ複合体の注入、45分間20℃でのインキュベーション、200 μLの提示バッファでの洗浄、その後フローセルの画像化により実行した。最高100 nM 条件に従い、カイネティック解離アッセイを、フローセル上に提示バッファを送液し、5分、10分、20分、60分、120分、及び240分時に画像化することで実施した。次に画像を処理し、前記のように内部プライマーシーケンシングによってCDR配列を解明し、「HER2affmat」と呼ばれるCDR:結合データセットのアセンブリに使用した。
【0324】
(ML vs. Randomライブラリの調製及びディープスクリーニング)
各シード配列に対して、全ての単一変異体及び編集距離が2~5から最大で1000の変異体からランダム変異セットをコンパイルする選択スキームを考案し、13,121の変異のプール(「random/mut」)を得た。次に、高ヒットスコア<0.9を有する全配列を除去し、編集距離2~5から最大で1000の変異体をランダムに選択し、かつ、「random/mut」セット中のすでに選択されたそれらを拒絶することで、機械学習によって生成された変異のみの配列のプールをアセンブリした。これにより、11,916の変異のプール(「ml/mut」)をアセンブリした。配列を25,042 CDR VH3配列のオリゴプールに組み込み、Twist Bioscience社に発注した。「Her2 ML vs. Random」ライブラリを、「HER2affmat」ライブラリと同様にディープスクリーニングのためにアセンブルし、Q5ポリメラーゼ、G98Aの上流及び下流断片、をオリゴプール並びに、G98A olapフォワードプライマー及びリバースプライマーと組合せたものを用いて、PCRを20サイクル行った。次にこの生成物を、PCRクリーンアップキット(T1030S、NEB社)を使用してカラム精製した。次に、0.2 pmolの各断片及びNEB HiFiアセンブリマスターミックス(E2621、NEB社)でGibsonアセンブリを使用して50℃ 60分間、ディープスクリーニング5'及び3'アダプターを付加する。次に、Gibsonアセンブリ反応物(推定効率100%)から300 amolの材料を取り出すことによりライブラリをボトルネック化し、Q5ポリメラーゼ及びoutnest P5及びP7プライマーを用いて25サイクルPCR増幅する。PCR産物を、1%アガロースゲル上に流し、1.2 kb バンドをゲル抽出し、精製し、そして最初にnanodropで、次にqPCR(NEBNext library quant kit、E7630、NEB社)で定量化した。
【0325】
定量化したライブラリはディープスクリーニングの準備ができ、2 nMとなるように希釈してから変性させ(10 μLのライブラリを10 μLの100 mM NaOHと混合し、室温で5分間インキュベートした)、rapid PEフローセルクラスタリングキット(PE-402-4002、Illumina社)から入手したHT1バッファで20 pMとなるように迅速に希釈した。次にそのライブラリを濃度6 pMに希釈し、その後HiSeq 2500のテンプレートスロットにロードし、上記のようにディープスクリーニング実験をセットアップした。
【0326】
ベースラインフローセル画像の取得に続き、AF532ストレプトアビジン(S11224、ThermoFisher社)と1:1比(100 pM、333 pM、1 nM、3.33 nM、10 nM、33.3 nM、及び100 nM)でプレ複合体化した、ヒトHer2-ビオチン(HE2-H822R-25ug、Acro biosystems社)の濃度を連続的に増加させながら平衡結合アッセイを行った。この場合には、結合アッセイサイクルは、120 μLのHer2-ビオチン:AF532ストレプトアビジンのプレ複合体の注入、45分間20℃でのインキュベーション、200 μLの提示バッファでの洗浄、その後フローセルの画像化により実行した。最高100 nM 条件に従い、カイネティック解離アッセイを、フローセル上に提示バッファを送液し、5分、10分、20分、60分、120分、及び240分時に画像化することで実施した。次に画像を処理し、前記のように内部プライマーシーケンシングによってCDR配列を解明し、「Her2 ML vs. Random」と呼ばれるCDR:結合データセットのアセンブリに使用した。
【0327】
(抗Her2ヒットカイネティクス測定)
全ての抗Her2 Fabの結合カイネティクスを、Octet BLI 及びストレプトアビジンコートチップ(18-5136、Sartorius社)を用いて測定した。全ての場合において、使用したバッファはDPBS(14190-169、Gibco社)+0.1% BSA+0.02% Tween-20であった。精製Fabを、最終濃度20 nMとなるように希釈した。カイネティクスは、次の工程を使用して測定した: 1)60秒間のセンサーチェック、2)30秒間のヒトHer2-ビオチン(HE2-H822R-25ug、Acro biosystems社)を5 μg/mLでロード、3)60秒間のベースライン測定、4)300秒間の各Fab 20 nMでの結合カイネティクス、5)600秒間の解離カイネティクス(バッファ中)。
【0328】
(表S2. MLモデル訓練:試験混同行列)
【表11】
【0329】
(表S3. MLモデル訓練:試験適合率、再現率及びF1スコア)
【表12】
*適合率は、TP/(TP+FP)として定義する。
**再現率は、TP/(TP+FN)として定義する。
***F1スコアは、適合率及び再現率の調和平均として定義する。
【0330】
(表S4. ML vs. Random選択されたクローン;ヒット性能)
【表13】
*この合計はMLセットからシングル点突然変異を除いたものである。
【0331】
本発明は、下記非限定的条項であって、本発明の特別な態様及び実施態様を示す条項を参照して記載してもよい。
1. 非DNA核酸分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させること、を含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化されたDNAプライマーであり、
該重合の生成物は、該プライマーを介して該基質上に固定化された非DNAヌクレオチド鎖であり、そして
該核酸ポリメラーゼは、DNAプライマーへ作用して一本鎖核酸テンプレートに相補的な非DNA核酸分子を合成可能なポリメラーゼである;及び
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法。
2. 前記第2の核酸はRNA分子である、条項1に記載の方法。
3. 前記核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%同一性を有するアミノ酸配列を含み、そして該アミノ酸配列は、配列番号1のアミノ酸配列に関してY409及びE664変異を含み;任意で該Y409変異はY409Gであり、該E664変異はE664Kであり;及び、任意で該核酸ポリメラーゼのアミノ酸配列は、配列番号3を含む、条項2に記載の方法。
4. 前記第2の核酸はXNA分子である、条項1に記載の方法。
5. 前記XNA分子は、アラビノヌクレオチド、アラビノ核酸(ANA)ヌクレオチド、2'-フルオロアラビノ核酸(FANA)ヌクレオチド、2'-O-メチルリボ核酸(2'OMe)ヌクレオチド、2'-O-メトキシエチル(MOE)核酸ヌクレオチド、ホスホロチオアート 2'-O-メトキシエチル(PS-MOE)ヌクレオチド、ホスホロジアミダート モルホリノヌクレオチド、ロック核酸(LNA)ヌクレオチド、P-アルキルホスホナート核酸(phNA)ヌクレオチド、トレオース核酸(TNA)ヌクレオチド、ヘキシトール核酸(HNA)ヌクレオチド、2'-ヒドロキシヘキシトール(AtNA)ヌクレオチド、シクロヘキセン核酸(CeNA)ヌクレオチド、又は、3'-デオキシ-DNA(2'-5')ヌクレオチドを含む、条項4に記載の方法。
6. 前記核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列を含み、更に、少なくとも1種のXNAヌクレオチド又はRNAヌクレオチドの重合を可能にする変異を含む、条項1~5のいずれか1項に記載の方法。
7. 前記核酸ポリメラーゼのアミノ酸配列は、V93Q、D141A、E143A、及びA485Lの変異の1以上又全てを含む、条項6に記載の方法。
8. 前記ポリメラーゼは、TGK、TGLLK、2M、Bst、RT521、6G12、6G12521、C7、PGLVV、PGLVVWA、D4K、又はそのバリアントである、条項1~7のいずれか1項に記載の方法。
9. 前記方法は、工程ii)a)の後に、前記第1の核酸を切断して前記ブリッジを直鎖化することを含む、条項1~8のいずれか1項に記載の方法。
10. 更に、前記直鎖化した生成物を、重合に適した条件下で前記核酸ポリメラーゼと再接触させることを含む、条項9に記載の方法。
11. 非DNA核酸分子を基質上に提示する方法であって:
i)基質上に固定化された第1の核酸を用意する工程であり、ここで該第1の核酸はその固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
a)該第1の核酸を、重合に適した条件下で核酸ポリメラーゼと接触させること、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化され、そして
該重合の生成物は、該プライマーを介して該基質上に固定化された非DNAヌクレオチド鎖である;
b)該第1の核酸を切断して前記ブリッジを直鎖化すること;及び
c)工程b)の該直鎖化した生成物を、重合に適した条件下でポリメラーゼと接触させること、を含む;並びに
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程、を含む、前記方法。
12. 工程ii)a)は、少なくとも5、10、12、15、20、又は25サイクルのブリッジ増幅を含む、条項1~11のいずれか1項に記載の方法。
13. 前記第1の核酸は、工程iii)中で該第1の核酸を変性剤と接触させることにより除去され、ここで該変性剤は、100 mM NaOH及び5 mM EDTAを含むバッファである、条項1~12のいずれか1項に記載の方法。
14. 前記第2の核酸はRNA分子であって、ポリペプチドをコードしており、更に、iv)該第2の核酸を、リボソームと、該コードされるポリペプチドの翻訳に適した条件下で接触させる工程を含み、任意で工程iv)の該条件は、トリメチルアミンN-オキシド(TMAO)を含む、条項1~13のいずれか1項に記載の方法。
15. 前記コードされるポリペプチドは、一本鎖可変断片(scFv)、ペプチド、フィブロネクチンIII型ドメイン(FN3ドメイン)、単一ドメイン抗体(sdAb、ナノボディとしても知られる)、アフィボディ、ダルピン、フィノマー、OBody、又はアビマー条項14に記載の方法。
16.ポリペプチドを基質上に提示する方法であって、
i)一本鎖可変断片(scFv)をコードしているアンチセンス配列を含む第1の核酸を用意する工程であり、ここで該第1の核酸は、基質上に固定化されており、かつ、その固定化点に対して、5'末端が近位にあり3'末端が遠位にあるように方向づけられている;
ii)該第1の核酸に相補的な第2の核酸を生成する工程であり、該第2の核酸の生成工程は:
該第1の核酸を、RNA重合に適した条件下で核酸ポリメラーゼと接触させることを含み、ここで、
該重合のためのプライマーは、ブリッジが重合中に形成されるように該基質上に固定化され、そして
該重合の生成物は、該プライマーを介して該基質上に固定化されたRNAヌクレオチド鎖である;
iii)該第1の核酸を除去して、該基質上に該第2の核酸の提示を生じる工程;及び
iv)該第2の核酸を、リボソームと、該コードされているscFvの翻訳に適した条件下で接触させる工程であって、工程iv)の該条件は、トリメチルアミンN-オキシド(TMAO)を含む、前記方法。
17. 前記TMAOは、0.05~1.5 M、0.05~1.2M、又は4 Mの濃度である、条項14~16のいずれか1項に記載の方法。
18. 前記リボソーム-ポリペプチド複合体は、リボソーム提示バッファの適用により安定化される、条項14~17のいずれか1項に記載の方法であって、
該リボソーム提示バッファは:
7 mMのMgCl2を超える;又は
8、9、10、15、20、25、30、40、50、60、70、80、90、若しくは100 mMのMgCl2若しくはMgAcと同等である;又は
8~100 mM、10~90 mM、15~85 mM、20~80 mM、25~75 mM、30~70 mM、35~65 mM、40~60 mM、45~55 mMのMgCl2と同等である;又は
8~100 mM、10~90 mM、15~85 mM、20~80 mM、25~75 mM、30~70 mM、35~65 mM、40~60 mM、若しくは45~55 mMのMgAcと同等である、マグネシウム濃度を有する、前記方法。
19. 前記第2の核酸はRNA分子であり、提示ライブラリが作成されるように、複数のポリペプチドをコードしている複数の第1の核酸が工程i)で用意される、条項1~18のいずれか1項に記載の方法。
20. 工程i)で用意される前記基質上に固定化された前記第1の核酸は:
1)テンプレート核酸を用意する工程;
2)該テンプレート核酸を、基質に固定化されたプライマーへハイブリダイズさせる工程;
3)該ハイブリダイズしたテンプレート核酸を、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触させて、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸を合成する工程;
4)該第1の核酸のブリッジ増幅を実施して、該第1の核酸のクラスターを生成する工程;及び
5)該第1の核酸の少なくとも一部をシーケンシングする工程、により生成され;
任意で該ブリッジ増幅は:
32~35増幅サイクルを含み、
サイクルあたり60~120秒の伸長時間を有し、
2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含む、並びに/又は
95~99.9%ホルムアミド、任意で1~10 mM NaOH、及び任意で1~5 mM EDTAを含む変性バッファの使用を含む、条項1~19のいずれか1項に記載の方法。
21. 基質に結合した核酸のクラスターを調製する方法であって:
1)テンプレート核酸を用意する工程;
2)該テンプレート核酸を、基質に固定化されたプライマーへハイブリダイズさせる工程;
3)該ハイブリダイズしたテンプレート核酸を、該固定化されたプライマーの伸長に適した条件下で、ポリメラーゼと接触させて、該テンプレートに相補的なヌクレオチド鎖である該第1の核酸を合成する工程;及び
4)該第1の核酸のブリッジ増幅を実施して、該第1の核酸のクラスターを生成する工程を含み、該ブリッジ増幅は32~35増幅サイクルで行われ、サイクルあたり60~120秒の伸長時間を有し、2~6 mMのMgSO4と同等のMg濃度を有する増幅バッファの使用を含み、並びに、95~99.9%ホルムアミド、任意で1~10 mM NaOH、及び任意で1~5 mM EDTAを含む変性バッファの使用を含む、前記方法。
22. i)条項1~3、6~13、若しくは19~20のいずれか1項に記載の方法により取得された若しくは取得可能なRNA分子 ;
ii)条項1、4~13、若しくは20のいずれか1項に記載の方法により取得された若しくは取得可能なXNA分子;又は
iii)条項14~20のいずれか1項に記載の方法により取得された若しくは取得可能なポリペプチド分子、を提示する基質。
23. 基質上に固定化されたDNAプライマーを伸長して、一本鎖核酸テンプレートに相補的な非DNA核酸分子を合成するための、核酸ポリメラーゼの使用。
24. 前記核酸ポリメラーゼは、配列番号1のアミノ酸配列に対して少なくとも36%、50%、60%、70%、80%、90%、95%、99%、若しくは100%の類似性又は同一性を有するアミノ酸配列を含み、そして更に、少なくとも1種のXNAヌクレオチド又はRNAヌクレオチドの重合を可能にする変異を含む、条項23の使用。
25. 前記核酸ポリメラーゼは、配列番号3のアミノ酸配列に対して少なくとも80%、90%、95%、99%、又は100%同一性を有し、かつ残基93、141、143、409、485、及び664は不変である配列を含む、条項23又は条項24の使用。
図1
図1-2】
図2
図3
図4
図5
図6
図7
図8
図9
図10-1】
図10-2】
図10-3】
図11-1】
図11-2】
図11-3】
図12-1】
図12-2】
図12-3】
図13-1】
図13-2】
図13-3】
図14-1】
図14-2】
図14-3】
図15-1】
図15-2】
図16
図17-1】
図17-2】
図17-3】
図17-4】
図18-1】
図18-2】
図18-3】
図18-4】
図19
図20-1】
図20-2】
図21
【配列表】
2024534985000001.xml
【国際調査報告】