IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ノーティラス バイオテクノロジー インコーポレイテッドの特許一覧

<>
  • 特許-結合試薬を選択する方法 図1
  • 特許-結合試薬を選択する方法 図2
  • 特許-結合試薬を選択する方法 図3A
  • 特許-結合試薬を選択する方法 図3B
  • 特許-結合試薬を選択する方法 図4
  • 特許-結合試薬を選択する方法 図5A
  • 特許-結合試薬を選択する方法 図5B
  • 特許-結合試薬を選択する方法 図6
  • 特許-結合試薬を選択する方法 図7
  • 特許-結合試薬を選択する方法 図8
  • 特許-結合試薬を選択する方法 図9
  • 特許-結合試薬を選択する方法 図10
  • 特許-結合試薬を選択する方法 図11
  • 特許-結合試薬を選択する方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-06-12
(45)【発行日】2023-06-20
(54)【発明の名称】結合試薬を選択する方法
(51)【国際特許分類】
   G01N 33/53 20060101AFI20230613BHJP
   G01N 33/543 20060101ALI20230613BHJP
   C40B 30/04 20060101ALI20230613BHJP
【FI】
G01N33/53 D
G01N33/543 515A
C40B30/04
【請求項の数】 20
(21)【出願番号】P 2020509044
(86)(22)【出願日】2018-08-20
(65)【公表番号】
(43)【公表日】2020-11-05
(86)【国際出願番号】 US2018000364
(87)【国際公開番号】W WO2019036055
(87)【国際公開日】2019-02-21
【審査請求日】2021-08-19
(31)【優先権主張番号】62/547,699
(32)【優先日】2017-08-18
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】520144244
【氏名又は名称】ノーティラス・サブシディアリー・インコーポレイテッド
(74)【代理人】
【識別番号】100114188
【弁理士】
【氏名又は名称】小野 誠
(74)【代理人】
【識別番号】100119253
【弁理士】
【氏名又は名称】金山 賢教
(74)【代理人】
【識別番号】100124855
【弁理士】
【氏名又は名称】坪倉 道明
(74)【代理人】
【識別番号】100129713
【弁理士】
【氏名又は名称】重森 一輝
(74)【代理人】
【識別番号】100137213
【弁理士】
【氏名又は名称】安藤 健司
(74)【代理人】
【識別番号】100143823
【弁理士】
【氏名又は名称】市川 英彦
(74)【代理人】
【識別番号】100183519
【弁理士】
【氏名又は名称】櫻田 芳恵
(74)【代理人】
【識別番号】100196483
【弁理士】
【氏名又は名称】川嵜 洋祐
(74)【代理人】
【識別番号】100203035
【弁理士】
【氏名又は名称】五味渕 琢也
(74)【代理人】
【識別番号】100160749
【弁理士】
【氏名又は名称】飯野 陽一
(74)【代理人】
【識別番号】100160255
【弁理士】
【氏名又は名称】市川 祐輔
(74)【代理人】
【識別番号】100202267
【弁理士】
【氏名又は名称】森山 正浩
(74)【代理人】
【識別番号】100182132
【弁理士】
【氏名又は名称】河野 隆
(74)【代理人】
【識別番号】100146318
【弁理士】
【氏名又は名称】岩瀬 吉和
(74)【代理人】
【識別番号】100127812
【弁理士】
【氏名又は名称】城山 康文
(72)【発明者】
【氏名】マリック パラグ
(72)【発明者】
【氏名】エガーストン ジャレット
【審査官】倉持 俊輔
(56)【参考文献】
【文献】特表2017-504795(JP,A)
【文献】米国特許出願公開第2013/0310274(US,A1)
【文献】BUUS Soren et al.,High-resolution Mapping of Linear Antibody Epitopes Using Ultrahigh-density Peptide Microarrays,Molecular & Cellular Proteomics,2012年,Vol.13,pp.1790-1800
【文献】SJOBERG Roland et al.,Validation of affinity reagents using antigen microarrays,New Biotechnology,2012年06月,Vol.29, No.5,pp.555-563
(58)【調査した分野】(Int.Cl.,DB名)
C40B 30/04,
G01N 33/53,33/543,
C07K 16/00,
A61K 39/00
(57)【特許請求の範囲】
【請求項1】
複数の配列コンテキストにおいて所望のペプチドエピトープに結合する親和性試薬を選択するための方法であって、以下の工程を含む、方法:
複数の配列コンテキストを含むペプチドライブラリーを得る工程であって、各ペプチドは、配列αXβを有し、Xは所望のペプチドエピトープであり、隣接配列αおよびβの少なくとも1つが1つのアミノ酸を含む、工程、および
ペプチドライブラリーに対して一つ以上の親和性試薬をスクリーニングして、前記複数の配列コンテキスト中の所望のペプチドエピトープXに結合する親和性試薬を同定する工程。
【請求項2】
前記隣接配列αおよびβが前記ペプチドライブラリー中の複数の配列コンテキストにおいて異なる、請求項1に記載の方法。
【請求項3】
αおよびβのそれぞれが1アミノ酸からなる、請求項1に記載の方法。
【請求項4】
αおよびβのうち少なくとも1つがリンカーを含む、請求項1に記載の方法。
【請求項5】
αおよびβのうち少なくとも1つがさらに、N末端修飾、C末端修飾、正に荷電した基、負に荷電した基、疎水基および糖からなる群から選択される修飾を含む、請求項1に記載の方法。
【請求項6】
αおよびβのそれぞれが1~3アミノ酸からなる、請求項1に記載の方法。
【請求項7】
所望のペプチドエピトープXが2~7アミノ酸である、請求項1に記載の方法。
【請求項8】
選択される親和性試薬が、抗体、アプタマー、ペプタマー、ペプチド、およびFab断片からなる群より選択される、請求項1に記載の方法。
【請求項9】
以下の工程をさらに含む、請求項1記載の方法:
選択される親和性試薬を、所望のエピトープと同じ長さの複数のペプチドに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程。
【請求項10】
所望のエピトープと同じ長さの複数のペプチドが、所望のエピトープと同じ長さのペプチドの、可能性のあるすべてのバリエーションの90%に相当する、請求項9に記載の方法。
【請求項11】
以下の工程をさらに含む、請求項1に記載の方法:
選択される親和性試薬を、複数のペプチドに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程であって、該複数のペプチドの各ペプチドは、所望のペプチドエピトープと、1つまたは複数の隣接残基とを含む、工程。
【請求項12】
以下の工程をさらに含む、請求項9に記載の方法:
選択される親和性試薬を、第二の複数のペプチドに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程であって、該複数のペプチドの各ペプチドは、第二のエピトープと、1つまたは複数の隣接残基とを含む、工程。
【請求項13】
以下の工程をさらに含む、請求項1に記載の方法:
選択される親和性試薬を、所望のエピトープより短い複数のペプチドの複数のサブセットに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程。
【請求項14】
選択される親和性試薬を、所望のペプチドエピトープを含むタンパク質またはペプチドのパネルに対してスクリーニングすることによって、選択される親和性試薬を特徴付けする工程
をさらに含む、請求項1に記載の方法。
【請求項15】
選択される親和性試薬が、それが前記ペプチドライブラリーの10%超に結合する場合に、選択される、請求項1に記載の方法。
【請求項16】
選択される親和性試薬を、所望のペプチドエピトープを含まないタンパク質のパネルに対してスクリーニングすることによって、選択される親和性試薬を特徴付けする工程をさらに含む、請求項1に記載の方法。
【請求項17】
選択される親和性試薬が、それが前記ペプチドライブラリーの15%未満に結合する場合に、選択される、請求項1に記載の方法。
【請求項18】
選択される親和性試薬が、2アミノ酸~10アミノ酸の長さを有する無作為なペプチドのライブラリーに対してスクリーニングされ、かつ以下の工程をさらに含む、請求項1に記載の方法:
選択される親和性試薬によって結合される、前記無作為なペプチドのライブラリー中のペプチドを、同定する工程;および
選択される親和性試薬を、
1)それが、前記無作為なペプチドのライブラリー中の20個未満の異なるエピトープに結合し、かつ
2)それが、無作為なペプチドのライブラリー中の、所望のペプチドエピトープを含む5アミノ酸より長いすべてのペプチドの少なくとも10%に結合する場合に、選択する工程。
【請求項19】
選択される親和性試薬が、それが無作為なペプチドのライブラリー中の、所望のペプチドエピトープを含む5アミノ酸より長いすべてのペプチドの少なくとも15%に結合しない限り、選択されない、請求項18に記載の方法。
【請求項20】
以下の工程をさらに含む、請求項1に記載の方法:
親和性試薬を、ペプチドのライブラリーに対してスクリーニングすることによって、親和性試薬の結合を特徴付けする工程であって、ペプチドのライブラリーが、所望のペプチドエピトープより短いペプチド、所望のペプチドエピトープと同じ長さのペプチド、および所望のペプチドエピトープより長いペプチドを含む、工程;ならびに
結合されたペプチドの配列を同定する工程であって、それにより、親和性試薬の結合を特徴付けする工程。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は2017年8月18日出願の米国特許仮出願62/547,699号の恩典を主張するものであり、該仮出願は参照により本明細書に組み入れられる。
【背景技術】
【0002】
発明の背景
結合試薬の生成のための選択方法は、典型的には、1つのエピトープまたはタンパク質に対して高い親和性および特異性を有する結合試薬を選択するように、設計される。いくつかの応用に関しては、複数のエピトープに結合する結合試薬を選択することが、または1つのタンパク質もしくはエピトープに対して特異的というわけではない結合試薬の結合パターンを特徴付けすることが、有用であり得る。
【発明の概要】
【0003】
本開示は、親和性試薬を選択するための、および特徴付けするための、方法ならびにシステムを提供する。いくつかの態様において、本開示は、多様な配列コンテキストにおいて親和性試薬がエピトープに結合するように選択されるアプローチを、提供する。本明細書において記載される方法およびシステムはまた、親和性試薬の結合パターンを特徴付けするために、およびエピトープへの親和性試薬の結合における配列コンテキストの影響を特徴付けするために、使用されてよい。加えて、本明細書において記載される方法およびシステムは、同じ長さを有する複数のエピトープにわたる結合など、複数のエピトープにわたって結合する親和性試薬を特徴付けするために、および選択するために、使用されてよい。同じ長さの複数のエピトープにわたる無差別性を証明することによって、特定の親和性試薬が、該特定の親和性試薬が結合する複数のエピトープの少なくとも1つのエピトープを含むとして配列を同定するために、使用されてよい。
【0004】
本発明の1つの局面は、複数の配列コンテキストにおいて所望のペプチドエピトープに結合する親和性試薬を選択するための方法を提供する。方法は、ペプチドライブラリーを得る工程を含み、各ペプチドは、配列αXβおよび長さkを有し、Xは、長さmの所望のペプチドエピトープである。方法はまた、ペプチドライブラリーを、複数の特定の親和性試薬に曝露する工程を含む。方法はまた、ペプチドライブラリー中のどのペプチドが、該特定の親和性試薬によって結合されるのかを決定する工程を含む。加えて、方法は、特定の親和性試薬が、ペプチドライブラリー中の、閾値より多い数のペプチドに結合する場合に、該特定の親和性試薬を選択するために、ペプチドライブラリーを用いる工程を含む。
【0005】
本発明の1つの局面は、複数の配列コンテキストにおいて所望のペプチドエピトープに結合する親和性試薬を選択するための方法を提供する。方法は、ペプチドライブラリーを得る工程であって、各ペプチドは配列αXβを有し、Xは所望のペプチドエピトープであり、かつαおよびβのそれぞれはアミノ酸を含む、工程;ならびに親和性試薬を選択するためにペプチドライブラリーを用いる工程を、含む。いくつかの場合において、αおよびβのそれぞれは1アミノ酸からなる。いくつかの場合において、αおよびβのうち少なくとも1つはリンカーを含む。いくつかの場合において、αおよびβのうち少なくとも1つは修飾を含む。いくつかの場合において、複数の親和性試薬が、本明細書における方法を用いて選択される。いくつかの場合において、所望のペプチドエピトープXは2アミノ酸~7アミノ酸である。いくつかの場合において、選択される親和性試薬はアプタマーである。いくつかの場合において、選択される親和性試薬は抗体である。いくつかの場合において、方法は、選択される親和性試薬を、所望のエピトープと同じ長さの複数のペプチドに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程を、さらに含む。いくつかの場合において、所望のエピトープと同じ長さの複数のペプチドは、所望のエピトープと同じ長さのペプチドの、可能性のあるすべてのバリエーションの、90%に相当する。いくつかの場合において、方法は、選択される親和性試薬を、複数のペプチドに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程をさらに含み、ここで複数のペプチドの各ペプチドは、所望のエピトープと、1つまたは複数の隣接残基とを含む。いくつかの場合において、方法は、選択される親和性試薬を、第二の複数のペプチドに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程をさらに含み、ここで複数のペプチドの各ペプチドは、特徴付けする工程において同定される第二のエピトープと、1つまたは複数の隣接残基とを含む。いくつかの場合において、方法は、選択される親和性試薬を、所望のエピトープより短い複数のペプチドの複数のサブセットに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程を、さらに含む。いくつかの場合において、方法は、選択される親和性試薬を、3アミノ酸エピトープを含むタンパク質のパネルに対してスクリーニングすることによって、選択される親和性試薬を特徴付けする工程を、さらに含む。いくつかの場合において、選択される親和性試薬は、それがタンパク質の約10%超、約20%超、約30%超、約40%超、約60%超、約75%超、または約90%超に結合する場合に、保持される。いくつかの場合において、方法は、選択される親和性試薬を、3アミノ酸エピトープを含まないタンパク質のパネルに対してスクリーニングすることによって、選択される親和性試薬を特徴付けする工程を、さらに含む。いくつかの場合において、選択される親和性試薬は、それがタンパク質の約15%未満、約10%未満、約5%未満、約1%未満、約0.1%未満、または約0.01%未満に結合する場合に、保持される。
【0006】
いくつかの場合において、選択される親和性試薬は、2アミノ酸~10アミノ酸の長さを有する無作為なペプチドのライブラリーに対してスクリーニングされ、かつ以下の工程をさらに含む:選択される親和性試薬によって結合されるペプチドを、同定する工程;および選択される親和性試薬を、1) それが、kは中心エピトープの長さである数式 20 * (k-2) によって決定されるよりも少ないかまたはそれと等しい数のエピトープと結合し、かつ2) それが、エピトープを含むすべてのより長いペプチドの少なくとも10%と結合する場合に、保持する工程。親和性試薬は、長さkの特定の中心エピトープに結合するそれらの能力に基づいて選択されるので、特定の親和性試薬に結合することができるプロテオームのパーセンテージは、概して、特定の中心エピトープの長さkが増すにつれて低下するであろうことに、言及しておく。プロテオームの大きなパーセンテージに結合する親和性試薬を選択することが有益であり、かつしたがって、より短い長さkの中心エピトープを有し得る親和性試薬を同定する利点があるという、いくつかの態様が存在する一方で、たとえそれらがより小さなパーセンテージのプロテオームしかカバーしない可能性があるとしても、より特異的な親和性試薬を同定する、および選択することもまた、有益であり得る。特に、タンパク質同定の異なるシナリオに対処するために設計される、プールとしての、選択される親和性試薬を使用することが、有益であり得る。たとえば、選択される親和性試薬が、他の方法を用いて絞り込まれた少数の候補タンパク質の間を迅速に区別できる場合、それら選択される親和性試薬は、プールされた親和性試薬のセットとして使用するために、非常に有益であり得る。
【0007】
いくつかの場合において、選択される親和性試薬は、それが、エピトープを含むすべてのより長いペプチドの少なくとも15%、20%、30%、40%、50%、75%、90%、または95%に結合しない限り、保持されない。いくつかの場合において、方法は、ペプチドのライブラリーに対して親和性試薬をスクリーニングすることによって、親和性試薬の結合を特徴付けする工程であって、ペプチドのライブラリーが、所望のエピトープより短いペプチド、所望のエピトープと同じ長さのペプチド、および所望のエピトープより長いペプチドを含む、工程;ならびに結合されたペプチドの配列を同定する工程であって、それにより親和性試薬の結合を特徴付けする工程を、さらに含む。いくつかの場合において、親和性試薬は、固体の支持体などの、1つまたは複数の基材に固定化されており、かつここで、無作為なペプチドのライブラリーは、固定化された親和性試薬を通過する。いくつかの場合においては親和性試薬が固定化されており、他の場合においては標的が固定化されている。いくつかの場合において、固体の支持体はビーズであってよい。本発明の1つの局面は、親和性試薬のセットから親和性試薬を選択する方法を提供し、該方法は、親和性試薬のセットを、2アミノ酸~10アミノ酸の長さを有する無作為なペプチドのライブラリーに対してスクリーニングする工程;親和性試薬のセットの各親和性試薬によって結合されるペプチドを、同定する工程;および1) 20個未満の異なるエピトープに結合し、かつ2) エピトープを含むすべてのより長いペプチドの少なくとも10%に結合する親和性試薬を選択する工程を、含む。いくつかの場合において、親和性試薬は、それが、エピトープを含むすべてのより長いペプチドの少なくとも15%、20%、30%、40%、50%、75%、90%、または95%に結合しない限り、選択されない。本発明の1つの局面は、あるアミノ酸エピトープに特異的に結合し、19個より多い、他のアミノ酸エピトープには結合せず、かつαXβの形式の配列の少なくとも10%に結合する、親和性試薬を提供し、ここでXは所望のエピトープであり、かつαおよびβは任意のアミノ酸残基である。いくつかの場合において、親和性試薬は、αXβの形式の配列の少なくとも0.25%、0.5%、0.75%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、20%、30%、40%、50%、75%、または90%に結合する。
【0008】
本発明の1つの局面は、ある3アミノ酸エピトープに特異的に結合し、いかなる他の3アミノ酸エピトープにも結合せず、かつ、所望のエピトープの周囲の隣接配列にかかわらず実質的に類似の親和性で所望のエピトープに結合する、親和性試薬を提供する。いくつかの場合において、親和性試薬は、エピトープのサブセットに結合しない。本発明の別の局面は、3アミノ酸エピトープの既知のセットに優先的に結合する親和性試薬を提供し、ここで、他のエピトープと比較してこれらのエピトープに優先性を有すること、および隣接残基の影響下にあることが、決定されている。
【0009】
参照による組み入れ
本明細書において言及されるすべての刊行物、特許、および特許出願は、個々の刊行物、特許、または特許出願がそれぞれ、参照により組み入れられるように具体的にかつ個々に示された場合と同程度に、参照により本明細書に組み入れられる。
【図面の簡単な説明】
【0010】
本発明の新規な特徴は、特に添付の請求の範囲において表明される。本発明の特徴および利点のより良い理解は、本発明の原理が利用される例証の態様が表明される以下の詳細な説明、および添付される以下の図面の参照により、得られるであろう。
図1図1は、いくつかの態様にしたがった、親和性試薬の選択のための固定化された標的を、標的を含むペプチドの例示的なリストとともに示す。
図2図2は、いくつかの態様にしたがった、親和性試薬選択のプロセスのフローチャートを示す。
図3A図3Aは、いくつかの態様にしたがった、親和性試薬の特徴付けのプロセスにおける、スクリーニング工程の例示的なフローチャートを示す。
図3B図3Bは、いくつかの態様にしたがった、エピトープAAAへの親和性試薬の結合における隣接配列の影響を決定するためのスクリーニング工程を実施するための、5マーαXβペプチドのアレイを示す。
図4図4は、本明細書において提供される方法を遂行するためにプログラムされた、または別の状況ではそのように設定された、コンピューター制御システムを示す。
図5A図5は、異なる二次構造を有するより長い配列中に埋め込まれた、標的の例を示す。図5Aは、いくつかの態様にしたがった、アルファヘリックスペプチドの異なる領域中に埋め込まれた標的(チェック模様の四角形として示される)を有する、アルファヘリックスを形成するペプチドの例を示す。
図5B図5は、異なる二次構造を有するより長い配列中に埋め込まれた、標的の例を示す。図5Bは、いくつかの態様にしたがった、ベータシートを形成するペプチドの異なる領域中に埋め込まれた標的(無地の黒い四角形として示される)を有する、ベータシートを形成するペプチドの例を示す。
図6図6は、いくつかの態様にしたがった、アプタマー選択スクリーニングにおいて同定されたいくつかのアプタマーの、標的への結合を示す。
図7図7は、いくつかの態様にしたがった、同定されたアプタマーの予備的な特徴付けを示す。
図8図8は、いくつかの態様にしたがった、同定されたアプタマーの予備的な特徴付けを示す。
図9図9は、いくつかの態様にしたがった、合成されたペプチドの、質量分析での確認を示す。
図10図10は、いくつかの態様にしたがった、クラスター増幅の例を示す。
図11図11は、いくつかの態様にしたがった、蛍光標識されたペプチド標的の、フローセル上のアプタマークラスターへの結合を示す。
図12図12は、いくつかの態様にしたがった、ペプチド標的に対する、いくつかのアプタマーの結合親和性を示す。
【発明を実施するための形態】
【0011】
発明の詳細な説明
生命科学の全体にわたって、特異的なタンパク質、代謝物、細胞、または細胞インターフェースに結合できる親和性試薬の開発について、相当な関心が寄せられている。ごく最近では、親和性試薬の選択技術は、非天然のヌクレオチドおよびアミノ酸を含むように拡張されてきている。これらのアプローチの目的は、所定のエピトープに排他的に結合する試薬を開発することであった。
【0012】
結合の排他性は、親和性試薬として望ましい特性であるとみなされている。親和性試薬が、たった1つのタンパク質に結合し、他のタンパク質には最小限しか結合しないことを保証する、かなりの労力が費やされている。この例外は、ホスホチロシンなどの、機能上重要な残基に対して産生される抗体である。
【0013】
親和性試薬が直面する特別な難題の1つは、コンテキスト感受性であり得る。たとえば、親和性試薬は、コアエピトープに完全に結合し得るが、隣接残基次第で、良好な結合またはまったくの無結合についての偏りがあってよい。たとえば、ペプチド n-Glu-Gln-Lys-Leu-Ile-Ser-Glu-Glu-Asp-Leu に対する親和性試薬を生成する場合、該試薬は、n末端残基がGlyである場合に、それがSerである場合よりも良好に結合し得る。
【0014】
任意のタンパク質1つだけに対して特異的というわけではない親和性試薬の生成は、一般的には望ましいことではない可能性があるが、多くのタンパク質において生じ得る1つまたは複数のペプチドに対して特異的な親和性試薬を取得することが最適であり得る、特定の使用事例がある。
【0015】
「エピトープ」との語は、本明細書において使用されるように、親和性試薬によって認識される高分子、たとえばタンパク質またはペプチドなどの、一部を指し得る。いくつかの場合において、エピトープは、抗体によって認識されるタンパク質またはペプチドの、一部であり得る。いくつかの場合において、エピトープは、抗体断片によって認識されるタンパク質またはペプチドの、一部であり得る。いくつかの場合において、エピトープは、アプタマーによって認識されるタンパク質またはペプチドの、一部であり得る。いくつかの場合において、エピトープは、ペプチドによって認識されるタンパク質またはペプチドの、一部であり得る。
【0016】
「抗原性」との語は、本明細書において使用されるように、適応免疫を有するある種の産物のグループにまたは親和性試薬のあるクラスに特異的に結合する、化学的構造(抗原、ハプテン、エピトープ、もしくはアミノ酸配列のいずれか)の能力を、指し得る。「抗原性」との語は、「アプタマー原性(aptagenicity)」との語 -アプタマーによって認識されるべき化学的構造の能力- と、互換性をもって使用され得る。「抗原性」との語はまた、親和性試薬によって一般的に認識されるべき化学的構造の能力を指す「親和性試薬原性(affinity reagent-genicity)」との語と、互換性をもって使用され得る。
【0017】
親和性試薬の選択
新規な親和性試薬は、当技術分野において公知の、任意の方法によって作り出されてよい。親和性試薬を開発する方法は、指数的濃縮によるリガンドの系統進化(Systematic evolution of ligands by exponential enrichment)(SELEX)、ファージディスプレイ、酵母ディスプレイ、哺乳類細胞ディスプレイ、昆虫細胞ディスプレイ、リボソームディスプレイ、粒子ディスプレイ、ペプチマー(peptimer)進化、ペプチマー設計、および接種を含む。いくつかの例において、親和性試薬は、構造に基づく薬剤設計方法を用いて設計されてよい。構造に基づく薬剤設計(または直接的な薬剤設計)は、関心対象のエピトープの、および親和性試薬の結合部位の、三次元構造の知見を利用する。
【0018】
いくつかの場合において、本開示の親和性試薬は、配列コンテキストにかかわらず所望のエピトープに結合する能力に関して、選択されてよい。いくつかの態様において、親和性試薬は、タンパク質が変性されたコンテキストにある場合に所望のエピトープに結合するように、設計されてよい。いくつかの態様において、本開示の親和性試薬は、折りたたまれている、または折りたたまれていないコンテキスト中のタンパク質における所望のエピトープに結合する能力に関して、選択されてよい。いくつかの態様において、変性されたタンパク質は、タンパク質中にマイクロフォールディング(microfolding)を含んでよく、またはそれを生成してよい。いくつかの態様において、所望のエピトープAAAを認識するように選択される親和性試薬は、配列AAAを含むすべてのペプチドに、同様に良好に、またはほぼ同様に良好に、結合してよい。いくつかの場合において、本開示の親和性試薬は、エピトープの配列コンテキストに応じて異なる親和性で、所望のエピトープであってよい。いくつかの場合において、本開示の親和性試薬は、配列コンテキストにかかわらず、いくつかの異なるエピトープに結合してよい。いくつかの場合において、本開示の親和性試薬は、配列コンテキスト次第で異なる親和性で、いくつかの異なるエピトープに結合してよい。そのような親和性試薬の同定は、以下の3工程のスクリーニングプロセスによって達成されてよい:1) エピトープを含む標的への結合に関する、最初のスクリーニング、2) 親和性試薬の結合を特徴付けするための、ペプチドレベルの適格性スクリーニング、および3) 工程2において示された結合の特徴付けを確認するための、タンパク質レベルのスクリーニング。いくつかの場合において、工程3は、工程2の前に、または部分的に工程2の前に、実施されてよい。いくつかの場合において、工程2は省略され得、かつ工程3は、親和性試薬の結合を特徴付けするために十分であり得る。
【0019】
いくつかの場合において、所望のエピトープはペプチドであってよい。いくつかの場合において、いくつかの異なるエピトープが所望され得、この場合、親和性試薬は、該複数の所望のエピトープに結合するものが選択され得る。いくつかの場合において、所望の単数のエピトープまたは複数のエピトープは、Xとして示され得る。いくつかの場合において、エピトープは、非連続的なエピトープである。たとえば、エピトープは、1つおきのアミノ酸残基を含んでよい。別の例においては、エピトープは、タンパク質の二次構造または三次構造において互いに近位に位置するいくつかのアミノ酸残基を、たとえ該残基がタンパク質配列においては近位でないとしても、含んでよい。いくつかの場合において、エピトープは、連続的なエピトープである。いくつかの態様において、所望のエピトープXは、2、3、4、5、6、または7アミノ酸の、短いアミノ酸配列である。いくつかの場合において、Xは、いくつかの異なる短いアミノ酸配列を含む。いくつかの態様において、所望のエピトープXは、3アミノ酸配列、X1X2X3である。多様な配列コンテキストにおけるこの所望のエピトープに結合する親和性試薬は、所望のエピトープを含む標的に結合する親和性試薬についてのスクリーニングによって、同定されてよい。
【0020】
標的は、所望の配列、Xを含むペプチドを含んでよい。いくつかの場合において、標的は、すべて配列Xの、ペプチドのプールである。いくつかの態様において、標的は、配列αXβのペプチドのプールを含んでよく、ここでXは所望のエピトープであり、かつαおよびβは、ゼロ、1つ、または複数のアミノ酸の、任意の配列であってよい。たとえば、所望のエピトープXがAAAであるならば、標的ペプチドにおいて見いだされ得る配列の例は、以下を含み得る:AAAAA、AAAAC、CAAAA、CAAAC、およびCAAAD。いくつかの場合において、αおよびβは、それぞれ任意の1アミノ酸であってよい。いくつかの場合において、αおよびβのうち少なくとも1つは、2個の、3個の、4個の、5個の、6個の、7個の、8個の、9個の、10個の、または10個超のアミノ酸であってよい。いくつかの場合において、αおよびβのうち少なくとも1つは、リンカーまたはスペーサーを含んでよい。リンカーまたはスペーサーは、当技術分野において公知の任意のリンカーまたはスペーサーであってよい。いくつかの場合において、リンカーはアミノ酸リンカーである。いくつかの場合において、リンカーは、ポリエチレングリコール(PEG)、またはPEGポリマー鎖である。PEG鎖は、2個の、3個の、4個の、5個の、6個の、7個の、8個の、9個の、10個の、12個の、14個の、16個の、18個の、20個の、22個の、24個の、26個の、28個の、30個の、34個の、36個の、38個の、40個の、42個の、44個の、46個の、48個の、50個の、または50個超のPEGモエティからなってよい。いくつかの場合において、リンカーは炭素鎖であってよい。ペプチドはまた、N末端またはC末端修飾、たとえばキャッピングを含んでよい。いくつかの場合において、ペプチドは、たとえば、末端のアミド化(C末端)またはアセチル化(N末端)のように、電荷を除去するために修飾されてよい。いくつかの場合において、αXβペプチドは、非天然のアミノ酸を含んでよい。いくつかの場合において、αXβペプチドは、リンカーおよび官能基で修飾されてよい。たとえば、分子はF-L-αXβという構造であり得、ここでFは官能基であり、かつLはリンカーである。他の場合において、分子は、αXβ-L-Fという構造であり得、ここでFは官能基であり、かつLはリンカーである。いくつかの場合において、αおよびβは、それぞれグリシンであってよく、またはそれぞれ1つまたは複数のグリシン残基であってもよい。いくつかの態様において、残基は、それらのアプタマー原性(aptagenicity)を変化させるために修飾されてよい。たとえば、残基は、陽電荷を付加することによって;陰電荷を付加することによって;疎水基を付加することによって;糖を付加するように修飾することによって;または化学的多様性を増加させるような他の修飾によって、変化させてよい。
【0021】
ペプチドは、当技術分野において公知の任意の方法を用いて合成されてよい。MultiPep RSiシンセサイザー(Intavis, Germany)などの、ペプチド合成用のいくつかの商業用プラットフォームが存在する。ペプチドは、液相法または固相法を用いて合成されてよい。合成されたペプチドは、ペプチド分析のための、任意の公知の方法を用いて確認されてよい。たとえば、ペプチドは、質量分析、マトリックス支援レーザー脱離イオン化飛行時間型質量分析(MALDI-TOF)、マトリックス支援レーザー脱離イオン化法、AMS(加速器質量分析)、ガスクロマトグラフィーMS、液体クロマトグラフィーMS、誘導結合プラズマ質量分析(ICP-MS)、同位体比質量分析(IRMS)、イオン移動度分析MS、タンデムMS、熱イオン化質量分析(TIMS)、またはスパークソース質量分析(SSMS)を用いて確認されてよい。合成されたペプチドの濃度もまた、分光法によって評価されてよい。ペプチドの合成反応および確認の例は、実施例8において提供される。
【0022】
図1は、いくつかの態様にしたがった、親和性試薬の選択のための固定化された標的を、該標的を含むペプチドの例示的なリストとともに示す。図1の例においては、所望のエピトープはAAAであり、かつ標的のペプチドは配列αAAAβを含み、ここでαおよびβはそれぞれ1アミノ酸である。この例においては、標的は、可能性のあるαAAAβの配列それぞれを表す、400個の異なるペプチドを含み、ここでαおよびβは、それぞれ1アミノ酸である。
【0023】
このように、任意の所定の3マーエピトープに関して、5マーのプールを含む標的は、400個の異なる配列(αについて20種類の可能性、およびβについて20種類の可能性、ここでαおよびβのそれぞれは1アミノ酸である)を含んでよい。いくつかの場合において、標的は、αおよびβのそれぞれまたは両方が2以上のアミノ酸を含み得る、5アミノ酸より長いペプチドのプールを含んでよい。いくつかの場合において、αおよびβの一方は、ゼロアミノ酸を含んでよく、かつαまたはβの他方は、1つまたは複数のアミノ酸を含んでよい。いくつかの場合において、標的は、配列Xのペプチドを、追加のアミノ酸無しで含んでよい。
【0024】
いくつかの場合において、標的配列Xは、より長い配列中に埋め込まれていてよい。たとえば、標的配列Xは、15マーの中に埋め込まれていてよい。標的配列Xは、15マー中の任意の位置に埋め込まれていてよく、たとえば、3アミノ酸の標的配列Xの場合には、標的配列Xは、15マーの第1、2、3、4、5、6、7、8、9、10、11、12、または13位から始まってよい。埋め込まれた標的配列を含むペプチドは、溶液中で合成されてよく、またはたとえば、PEPperPRINTチップもしくは他のペプチドアレイなどのチップ上で、合成されてもよい。いくつかの態様において、埋め込まれた標的配列を含むペプチドは、単一分子タンパク質アレイ上に結合されてよく、またはそこで合成されてよい。より長い配列が、二次構造を形成するように、または二次構造を欠くように、選択されてよい。そのような二次構造の例は、アルファヘリックス、ベータシート、プロリンベンド、ターン、ループ、およびシステインブリッジを含む。いくつかの場合において、より長い配列は、非天然のアミノ酸、または他の基を含んでよい。
【0025】
最初の選択工程は、所望のエピトープを含む標的に対して、親和性試薬のライブラリーをスクリーニングする工程を含んでよい。親和性試薬ライブラリーは、無作為な配列を有する、または既知のタンパク質に結合するアプタマーの配列に類似した配列を有する、DNA、RNA、もしくはペプチドアプタマーを含んでよい。いくつかの場合において、アプタマーライブラリーは、商業用ライブラリーであってよい。いくつかの場合において、アプタマーライブラリーは、研究機関、大学、学術機関、または研究所から利用可能であり得る。いくつかの場合において、ライブラリーは、ビーズライブラリーを含んでよい。いくつかの場合において、アプタマーライブラリーは、既知の配列のライブラリーから、または無作為な配列から、生成されてよい。いくつかの場合において、アプタマーライブラリーは、たとえばステムループライブラリーなど、特定の構造を有するアプタマーを含んでよい。いくつかの場合において、アプタマーライブラリーは、切り替え可能なアプタマー -2つの立体構造の間を切り替えることができるアプタマー- を、含んでよい。たとえば、アプタマーは、第一の立体構造を形成するために金属イオン補因子を必要としてよく、EDTAまたはEGTAなどのキレート剤の添加は金属イオンを封鎖し、そしてアプタマーに異なる立体構造をとらせる。アプタマーの切り替えを誘発するために使用され得る他の因子は、光、pH、温度、磁場、および電流を含む。
【0026】
標的に対するアプタマーライブラリーのスクリーニングは、当技術分野において公知の任意の方法によって実施されてよい。1つの局面において、標的は、固体の支持体上に固定化されてよく、かつアプタマーは、低い特異性を有するアプタマーの結合を可能にする条件下で添加されてよい。未結合のアプタマーは、ストリンジェンシーを高めていく一連の洗浄を用いて、標的から洗い流されてよい。洗浄工程のあいだ標的に結合したままのアプタマーは、配列決定されてよく、そして、選択のさらなるラウンドのために増幅されるかまたは高い配列類似性を有する追加のアプタマーの設計のために使用されるかしてよい。標的結合、洗浄、配列決定、および増幅または新しいアプタマーの設計の、いくつかのラウンドは、所望の特異性および結合親和性のアプタマーが生成されるまで繰り返されてよい。アプタマーライブラリーはまた、ビーズに基づくアプローチを用いてスクリーニングされてよく、該アプローチは、ビーズそれぞれがアプタマーの複数のコピーを含むビーズを利用する。アプタマーライブラリーはまた、アレイに基づくアプローチを用いてスクリーニングされてよく、該アプローチはたとえば、ライブラリーの各アプタマーの複数のコピーをアレイ上にスポットすること、およびその後、標的が結合するスポットを評価することによる。アプタマーライブラリーはまた、粒子ディスプレイアプローチを用いてスクリーニングされてもよい。いくつかの態様において、アプタマーライブラリーは、単一分子タンパク質アレイを用いてスクリーニングされてよい。
【0027】
いくつかの場合において、同定される親和性試薬が結合する標的プールのパーセンテージは、たとえば、親和性試薬の結合したコピーの数を、結合に利用可能な標的ペプチドの数と比較することによって、測定されてよい。いくつかの態様において、親和性試薬は、標的を含むペプチドの10%、20%、30%、40%、50%、60%、70%、80%、または80%超に結合し得る。加えて、特定の親和性試薬が同定され、そして選択されたら、親和性試薬は検証されてよい。いくつかの態様において、選択される親和性試薬は、親和性試薬がそれに結合するとして特徴付けされたエピトープを含む複数の配列に対して、検証されてよい。いくつかの態様において、選択される親和性試薬は、該選択される親和性試薬を、単一分子タンパク質アレイ上の複数のタンパク質配列に対して評価することによって、検証されてよい。
【0028】
図2は、いくつかの態様にしたがった、親和性試薬選択のプロセスのフローチャートを示す。第一に、標的が得られ、そして固体の支持体上に固定化される。標的はその後、親和性試薬のライブラリーに曝露される。この例においては、親和性試薬はアプタマーである。未結合のアプタマーは標的から洗い流され、そして残りのアプタマーが溶出される。溶出されたアプタマーは、アプタマーを保存する様式で配列決定されてよく、または溶出されたアプタマーのアリコートが配列決定されてもよい。配列決定の結果に基づき、アプタマー1つもしくは小グループのアプタマーが、高度に濃縮されていて、強固な結合を示していて、そしてさらなるスクリーニングのために選択されるべきであるかどうか、または多くの異なるアプタマーが、軽い濃縮、これは溶出されたアプタマーが増幅され、そして標的へと再適用され得る、という状況であるが、これを示すかどうか、についての決定が下される。これらの工程は、所望の結合親和性を有するアプタマーが産生されるまで、繰り返されてよい。洗浄工程のストリンジェンシーは、その後の洗浄工程において増加させてよい。洗浄工程の長さは、低いオフ速度を有する親和性試薬を得るために、選択されてよい。
【0029】
他の局面において、最初の選択工程は、固体の支持体にライブラリーのアプタマーを固定化する工程、および標識された標的を添加する工程を含んでよい。固体の支持体は、スライド、ビーズ、磁気ビーズ、フローセル中の面であってよい。ライブラリーのアプタマーは、1コピーとして固定化されてよく、またはプールとして固定化されてもよい。たとえば、1つのアプタマーの複数のコピーは、固体の支持体のある領域上に固定化されてよく、一方で、他のアプタマーの複数のコピーは、前記固体の支持体の他の領域に固定化されてよい。いくつかの場合において、ライブラリーのアプタマーは、アダプターで修飾されてよく、かつオリゴでコートされた固体の支持体にハイブリダイズしてよい。クラスター増幅が、固体の支持体上の各アプタマーを局所的に増幅するために、その後使用されてよい。いくつかの場合において、固体の支持体はガラススライドである。いくつかの場合において、固体の支持体はフローセルである。いくつかの場合において、固体の支持体は、蛍光での画像化に適したフローセルである。いくつかの場合において、固体の支持体は、単数の磁気ビーズまたは複数の磁気ビーズである。複数の磁気ビーズの各磁気ビーズは、各ビーズがそれぞれ他のビーズとは異なるアプタマーでコートされるように、1種類の独自のアプタマーの、複数のコピーでコートされてよい。
【0030】
他の局面において、最初の選択工程は、標的を、該標的に対する抗体を産生することができる宿主動物に注入する工程を含んでよい。宿主動物は、抗体を産生することができる任意の動物、たとえばウサギ、ヤギ、マウス、ラット、ウマ、ウシ、ヒツジ、ラクダ、またはロバであってよい。抗体は、宿主動物の血清から回収されてよい。宿主動物からの血清は、そのまま使用されてよく、または抗体が、血清から精製されてもよい。抗体を精製する方法は、物理化学的分画、クラス特異的親和性、または抗原特異的親和性を含む。クラス特異的親和性は、免疫グロブリンに対して特異的な親和性を有する固定化された生物学的リガンドへの、抗体の結合を含んでよい。抗原特異的親和性は、標的に結合する抗体をプルダウンするための、固定化された標的の使用を含んでよい。精製された抗体は、血清からの抗体を同定するために配列決定されてよく、同定された抗体はその後、インビボまたはインビトロで合成されてよい。
【0031】
いくつかの場合において、免疫感作された宿主動物の血清から抗体を抽出する代わりに、脾臓が抽出されてよく、そして脾臓細胞が不死化されてよい。脾臓細胞を不死化するための1つの方法は、該細胞を骨髄腫細胞と融合させてハイブリドーマを形成させることであり得る。個々のクローンはハイブリドーマから単離され得、それらのそれぞれは単一のモノクローナル抗体を産生する。異なるモノクローナル抗体が、上述のものと類似の方法を用いて、標的に対してスクリーニングされてよい。手短に述べると、標的は、固体の支持体上に固定化されてよく、かつ抗体は、所望の親和性で結合する抗体を決定するために、ストリンジェンシーが高まる条件下で添加されてよい。選択されるモノクローナル抗体の配列は、タンパク質を配列決定することによって、またはそれを産生した細胞株からコード配列を配列決定することによって、導き出されてよい。
【0032】
いくつかの場合において、抗体は、ファージディスプレイを用いて選択されてよい。ファージライブラリーは、その表面上に抗体を発現し、かつ抗体を生成するための配列をコードする、各ファージとして得られてよい。ファージライブラリーは、ペプチド標的に適用されてよく、かつ、標的に結合しない抗体を発現かつコードするファージは、洗い流されてよい。標的に結合する抗体を発現かつコードするファージは、標的から溶出されてよい。溶出されたファージは、細胞にファージを感染させることによって増幅されてよく、かつ増幅されたファージは、反復の所望の回数で選択工程を繰り返すために、使用されてよい。続く反復は、ストリンジェンシーを高めていく洗浄緩衝液、または増していく洗浄時間を利用してよい。反復の所望の回数が完了したら、選択されたファージは、たとえば発現される抗体をコードするDNAを配列決定するためにファージを溶解することによって、分析されてよい。この配列は、選択された抗体を発現する細胞株を構築するために使用されてよい。
【0033】
いくつかの場合において、抗体、または他の親和性試薬は、細菌ディスプレイ、哺乳類細胞ディスプレイ、昆虫細胞ディスプレイ、または酵母ディスプレイを用いて選択されてよい。これらの方法は、上述のファージディスプレイと類似しているが、細菌の、哺乳類細胞の、昆虫細胞の、または酵母のライブラリーが得られる、ここでそれぞれの細菌、哺乳類細胞、昆虫細胞、または酵母細胞は、その表面に抗体を発現しており、かつ該抗体を生成するための配列をコードしている。選択方法は、ファージディスプレイに関して記載されるものと同じである。
【0034】
いくつかの態様において、親和性試薬は、同時並行して、多くの異なる標的に対して選択されてよい。たとえば、多くの異なる標的が、アレイ上の異なる位置に固定されてよく、そしてSELEX選択方法とともに使用されてよい。別の例においては、多くの異なる標的が、磁気ビーズに結合されてよく、そしてSELEX選択方法とともに使用されてよい。いくつかの態様において、親和性試薬は、単一分子タンパク質アレイ上の標的に対して選択されてよい。
【0035】
1つの態様において、Illumina型の次世代配列決定プラットフォームが、アプタマー選択のために適合されてよい。アプタマーライブラリーは、各末端においてアダプターで標識されてよく、そしてフローセル中でオリゴヌクレオチドとハイブリダイズさせてよい。固体状態での増幅が、アプタマーライブラリーの各開始アプタマーからアプタマークラスターを作製するために、使用される。そしてフローセルの面は、複数の核酸クラスターで覆われ得、そのそれぞれは、アプタマーライブラリーからの1つのアプタマーの、多数のコピーを含む。配列決定反応は、核酸ポリメラーゼ、プライマー、ならびに4つの異なる蛍光標識された可逆的ターミネーター(A、T、C、およびG)を用いて、フローセル上で進行させてよい。これは、フローセル中の各位置でのアプタマーの配列を提供してよい。各アプタマークラスターのアイデンティティが既知となったら、検出可能に標識された1つまたは複数のペプチド標的が、フローセルに添加されてよく、そしてアプタマークラスターとインキュベートされてよい。インキュベーションの期間の後、未結合の標的は洗い流され、そしてフローセルは、標的が結合する位置を決定するために、画像化される。洗浄工程の複数の段階が実施される時に、KD値が生成されてよい。特に、未結合の標的を除去するための最初の洗浄工程の後で、どの結合した標的が依然として存在するのかを同定するために、最初の画像が取得されてよい。最初の画像が取得された後で、第二の洗浄工程が、経過時間の間に未結合となった標的を除去するために実施されてよく、そして第二の画像が、その後取得されてよい。このプロセスは、それらが未結合となった時間に基づいて、多数の標的にわたってKD値が算定されるように、複数の段階にわたって繰り返されてよい。いくつかの例において、最初の洗浄工程の直後に、第二の洗浄工程が続いてよい。KD親和性決定は、たとえば、表面プラズモン共鳴またはバイオレイヤー干渉(BLI)技術を含む技術を用いて実施されてよい。
【0036】
いくつかの場合において、複数の同時並行する選択を実施するために、異なる区別可能な標識を有する、多くの異なる標的が、フローセルに添加されてよい。この方法の一例は、実施例7において提供される。
【0037】
いくつかの態様において、親和性試薬選択の容易性は、エピトープの配列/構造によって影響を受け得る。高い「免疫原性」、「抗原性」、「アプタマー原性(aptamergenicity)」、または「親和性試薬原性」を有するエピトープは、それに対する親和性試薬を設計することが、より容易であり得る。たとえば、非常に異なる化学的特性を有するアミノ酸残基を含むエピトープは、それに対する親和性試薬を選択することがより容易であり得る。GGGまたはAAAなどのエピトープは、KWKまたはDCYなどのエピトープよりも、それに対する親和性試薬を選択することがより困難であり得る。いくつかの態様において、エピトープは、修飾されたエピトープと相互作用する親和性試薬を同定するために、化学的バイオコンジュゲーションを用いるなどして修飾されてよい。アミノ酸KRDEYWCは、特に容易に修飾される。いくつかの態様において、その所望のエピトープと結合する親和性試薬を同定する際、親和性試薬を用いて同定することがより容易な構成要素を付加する化学反応でDYWを修飾することが、有益であり得る。特に、DYWは、陽電荷、またはその後該構成要素に適合させた親和性試薬を有し得る核酸を付加するように、修飾されてよい。このように、DYWエピトープは際立たせることが容易であり得る。さらに、修飾された所望のエピトープを同定するためにプラットフォームを進行させる場合、タンパク質試料(血液試料など)は、予想されるかつ特定の手法でDYWエピトープを修飾する化学反応に曝露されてよく、該化学反応はその後、特定の親和性試薬に対して評価されるべきタンパク質を用いて、陽電荷または核酸構成要素を有する修飾されたDYWエピトープに対応する未改変のDYWエピトープが、元のタンパク質試料中に存在していたかどうかを決定することを、可能にし得る。いくつかの態様において、DYWエピトープに対する化学反応は、可逆的であってよい。いくつかの態様において、DYWエピトープに対する化学反応は、不可逆的であってよい。このように、適合させたアッセイを、修飾されたDYWエピトープを同定するために進行させてよい。
【0038】
いくつかの場合において、潜在的な標的の集団は、標的エピトープの予測される「抗原性」または「親和性試薬原性」に基づいて、異なるグループへと分類されてよい。たとえば、いくつかの場合において、高い抗原性の標的と低い抗原性の標的との両方を、単一の同時並行する選択工程へと組み合わせることは、高い抗原性の標的に対する親和性試薬が、低い抗原性の標的に対する親和性試薬からのシグナルをかき消してしまうという結果をもたらし得る。予測される抗原性は、標的におけるアミノ酸残基の化学的特性に基づいていてよく、荷電した、およびより大きいアミノ酸は、より高い抗原性を有すると予想され得る。同じアミノ酸残基または化学的に類似するアミノ酸残基を2つ以上含む標的は、非常に異なる化学的特性を有するアミノ酸残基を含む標的よりも、低い抗原性を有し得る。いくつかの場合において、異なる標的の抗原性は、親和性試薬選択の最初のスクリーニングの結果に基づき、実験的に決定されてよい。
【0039】
親和性試薬の特徴付けスクリーニング
ペプチドの、特徴付けスクリーニングまたは適格性スクリーニングは、標的に結合するとして同定される、任意の親和性試薬において実施され得る。親和性試薬は、上述のようなスクリーニングにおいて同定されていてよく、または当技術分野において既知の任意の方法によって得られていてもよい。いくつかの態様において、第二の特徴付けスクリーニングは、親和性試薬の、可能性のある他の配列を上回る、所望のエピトープに対する特異性を決定するために、使用されてよい。第二のスクリーニングに関して、可能性のあるnマー配列のライブラリーは、親和性試薬が他の配列を認識するかどうかを決定するために、使用されてよい。いくつかの場合において、ライブラリーは、可能性のあるすべてのnマー配列の少なくとも80%、85%、90%、95%、96%、97%、98%、99%、99.9%、または99.9%超を含む。いくつかの場合において、ライブラリーは、可能性のあるすべてのnマー配列を含む。親和性試薬が3マーに結合すると考えられるのであれば、他の配列は、可能性のあるすべての3マー(203 = 8000)を表すように選択されてよい。いくつかの態様において、可能性のある関心対象のエピトープを表すように選択される配列は、隣接配列などの、他の配列中に埋め込まれていてよい。いくつかの態様において、所望のエピトープを表すように選択される配列は、隣接配列または化学的リンカーを有してよく、これらは、親和性試薬が所望のエピトープに接近することを可能にするよう、所望のエピトープが固体の基材から十分に離れた位置にあるように、固体の基材に結合する所望のエピトープのそばに付加される。親和性試薬が4マーに結合すると考えられるのであれば、他の配列は、可能性のあるすべての4マー(204 = 160,000)を表すように選択されてよい。1つの態様において、異なるnマーのプールが、マルチウェルプレートの異なるウェルに、または固体の支持体の異なる領域上に、固定化されてよい。親和性試薬はその後、ライブラリーとインキュベートされてよく、そして未結合の親和性試薬は穏やかに洗い落とされる。親和性試薬がライブラリーに結合している領域は、親和性試薬を視覚化するのに適した任意の方法によって、検出されてよい。いくつかの例において、親和性試薬は、タンパク質および/もしくは核酸に結合する色素もしくは試薬によって視覚化されてよく、または親和性試薬は、ライブラリーへの添加の前に、検出可能なモエティで標識されてもよい。いくつかの場合において、親和性試薬の標的への結合は、蛍光共鳴エネルギー移動(FRET)顕微鏡法、表面プラズモン共鳴(SPR)、生物発光共鳴エネルギー移動(BRET)、NanoBRET、バイオレイヤー干渉(BLI)、またはOctetによって検出されてよい。
【0040】
いくつかの場合において、親和性試薬の存在または非存在は、いくつかの異なる条件下 -たとえば洗浄の、異なるストリンジェンシー、これはたとえば、異なる洗浄緩衝液、異なる洗浄時間、異なる洗浄温度、または異なる撹拌レベルを用いて達成され得る- で、決定されてよい。いくつかの場合において、親和性試薬の結合は、結合の経時変化を生成するために、経時的に繰り返し測定されてよい。いくつかの場合において、異なる条件下および/または異なる時間で親和性試薬の結合を決定することは、標的に対する親和性試薬のKD、KON、またはKOFFの算出を可能にし得る。
【0041】
いくつかの態様において、異なる洗浄条件および検出条件が、たとえば所望のオン速度およびオフ速度または会合定数(KON)および解離定数(KOFF)などの、所望の特性を有する親和性試薬を同定するために、使用されてよい。いくつかの場合において、所望の親和性試薬は、遅いオフ速度を有してよい。親和性試薬のエピトープ結合反応の平衡は、以下の時に達する:
[親和性試薬]・[エピトープ]・KON = [親和性試薬-エピトープ]・KOFF
いくつかの場合において、好ましい親和性試薬は、約1 s-1未満、約10-1 s-1未満、約10-2 s-1未満、約10-3 s-1未満、約10-4 s-1未満、約10-5 s-1未満、約10-6 s-1未満、約10-7 s-1未満、約10-8 s-1未満、約10-9 s-1未満、または約10-10 s-1未満であるKOFF値を有してよい。いくつかの場合において、オフ速度は、オン速度よりも重要であり得る、これは、不十分なオン速度は、反応に添加される親和性試薬の量を増加させることによって、または洗浄前のインキュベーション時間を増加させることによって、補われ得るからである。いくつかの場合において、親和性試薬は、オフ速度が、1つまたは複数の洗浄工程のあいだ、および画像化工程が完了した後まで、親和性試薬が結合したままであることを可能にするのに十分であるように、選択される。いくつかの場合において、親和性試薬は、少なくとも約1分間、約2分間、約3分間、約4分間、約5分間、約6分間、約7分間、約8分間、約9分間、約10分間、約11分間、約12分間、約13分間、約14分間、約15分間、約16分間、約17分間、約18分間、約19分間、約20分間、約25分間、約30分間、約35分間、約40分間、約45分間、約50分間、約55分間、約60分間、または約60分間よりも長く、エピトープに結合したままであってよい。
【0042】
いくつかの場合において、好ましい親和性試薬は、ライブラリー中の3マーの1個のみに結合する。他の場合において、好ましい親和性試薬は、2個の、3個の、4個の、5個の、6個の、7個の、8個の、9個の、10個の、11個の、12個の、13個の、14個の、15個の、16個の、17個の、18個の、19個の、20個の、21個の、22個の、23個の、24個の、25個の、26個の、27個の、28個の、29個の、30個の、40個の、50個の、60個の、70個の、80個の、90個の、100個の、または100個超の、異なる3マーに結合してよい。いくつかの態様において、親和性試薬を洗い流す工程は、ストリンジェンシーを高めながら繰り返されてよく、かつ結合したままの親和性試薬は、各洗浄工程の後で検出されてよい。
【0043】
別の方法において、親和性試薬は、固体の支持体上に固定化されてよく、かつ可能性のあるすべてのnマーのプールが、親和性試薬に添加されてよく、未結合のnマーは、洗浄によって除去されてよく、かつ残っているnマーは、親和性試薬によって結合される配列を発見するために分析されてよい。繰り返されるスクリーニング工程は、異なるストリンジェンシーの洗浄段階を用いて実施されてよい。結合したnマーは、たとえば質量分析または高速液体クロマトグラフィー質量分析といった、任意の適切な方法を用いて同定されてよい。いくつかの場合において、無作為なnマーのプールが、可能性のあるすべてのnマーのプールの代わりに使用されてよい。無作為なnマーのプールが、特徴付けスクリーニングのために使用された場合、結合したnマーおよび未結合のnマーの両方が、同定されてよい。結合したnマーのプールにおいても未結合のnマーのプールにおいても表されなかった配列は、続く特徴付けスクリーニングにおける追跡調査のため、記録されてよい。いくつかの場合において、無作為なnマーのプールは、該プールが、可能性のあるnマー配列の少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または99%超を含むことを確実にするために、親和性試薬に適用する前に、特徴付けされてよい。いくつかの場合において、予備的な特徴付けスクリーニングが、無作為なnマーを用いて実施されてよく、かつ約30個未満、約25個未満、約20個未満、約15個未満、約10個未満、または約5個未満のnマーに結合する親和性試薬が、可能性のあるすべてのnマーのプールを用いるさらなる特徴付けのために、選択されてよい。
【0044】
ペプチドの、さらなる適格性スクリーニングが、親和性試薬が所望のエピトープに特異的に結合するかどうか、または親和性試薬がエピトープの下位部分に結合しているかどうかを決定するために、実施されてよい。たとえば、3マー配列AKDに対して特異的であると考えられる親和性試薬は、実際には二量体配列AKに対して特異的である可能性がある。したがって、各nマー親和性試薬に関して、スクリーニング段階は、すべての(n-1)マーのセットに対して実施されてよい。いくつかの場合において、特徴付けスクリーニングが実施されていて、かつ親和性試薬によって結合される、すべてのnマーのセットが既知であるならば、スクリーニングは、該親和性試薬によって結合されるnマー中に含まれる(n-1)マーだけに限定されてよい。たとえば、親和性試薬に結合される唯一の4マーがAAKDであれば、スクリーニングは、可能性のあるすべての3マーではなく、AAKおよびAKDに対して実施されてよい。親和性試薬が実際に(n-1)マーに結合するのであれば、(n-2)マーに対する追加のスクリーニングが、親和性試薬の特異性をさらに定義するために、実施されてよい。いくつかの場合において、(n-1)マーに結合する親和性試薬は、さらなるスクリーニングのために選択されなくてもよい。他の場合において、ただ1つの(n-1)マーに結合する親和性試薬が、選択されてよい。他の場合において、複数個の(n-1)マーに結合する親和性試薬が、さらなるスクリーニングのために保持されてよい。
【0045】
ペプチドの、追加の適格性スクリーニングが、親和性試薬の、その単数のエピトープまたは複数のエピトープに対する親和性における隣接配列の影響を決定するために、実施されてよい。この工程に関して、配列αXβのペプチドのライブラリー(ここでXは親和性試薬の単数のエピトープまたは複数のエピトープであり、かつαおよびβは1つまたは複数の任意のアミノ酸であり得る)が、作製されてよい。エピトープ1つだけに結合する親和性試薬の例において、そしてαおよびβがそれぞれ1アミノ酸であり、結合されるエピトープの配列が定まっているとすると、所望のエピトープの長さにかかわらず、400個の、可能性のあるαXβ配列が存在する。親和性試薬が2以上の異なるエピトープに結合する場合、またはαおよびβがそれぞれ、アミノ酸無しか、1つのアミノ酸か、もしくは複数のアミノ酸であり得る場合には、可能性のあるαXβの配列が多数存在し得る。いくつかの場合において、このスクリーニング工程において使用されるαXβペプチドのセットは、親和性試薬の選択のために使用される標的を含んでいたものと同じαXβペプチドのセットであってよい。親和性試薬は、αXβ配列のセットに対して、標準的なスクリーニング方法を用いてスクリーニングされてよい。親和性試薬が結合するαXβ配列のリストを、相対的な結合親和性とともに検討することは、親和性試薬の結合親和性における隣接配列の影響の決定を、可能にし得る。強い影響が示されるのであれば、さらなるスクリーニングが、より長い隣接配列を用いて実施されてよい、たとえば、配列の最初のライブラリーがペプチドαXβからなっていて、ここでαおよびβがそれぞれ1アミノ酸であれば、次のスクリーニングは、γXδからなるペプチドのライブラリーを用いて実施されてよく、ここでγおよびδはそれぞれ2アミノ酸を含む。
【0046】
図3Aは、いくつかの態様にしたがった、親和性試薬の特徴付けのプロセスにおけるスクリーニング工程の、例示的なフローチャートを示す。親和性試薬は、該親和性試薬の検出を容易にするために、蛍光標識で標識されている。親和性試薬はその後、可能性のあるすべての3マー配列を含むペプチドのプールに適用される。可能性のあるすべての3マー配列を含むペプチドのプールは、アレイとして固体の支持体上に固定化されてよい。いくつかの態様において、可能性のあるすべての3マー配列を含むペプチドのプールは、1つまたは複数の、単一分子タンパク質アレイ上に固定化されてよい。いくつかの態様において、複数の3マー配列は、固体の基材上に固定化されてよい。いくつかの態様において、複数の3マー配列は、単一分子タンパク質アレイ上に固定化されてよい。同時並行して実施され得るもう1つの工程においては、親和性試薬はその後、可能性のあるすべての2マー配列を含むペプチドのプールに適用される。親和性試薬によって結合されるすべての3マーペプチドおよび2マーペプチドが、同定される。可能性のあるすべての5マーペプチドを含む5マーペプチドのプールが得られ、ここで該5マーペプチドは、同定された、結合される3マーおよび2マーの配列を含む。例として、親和性試薬がエピトープAAAのみに結合することが既知であれば、可能性のあるすべての5マーペプチドのプールは、図3Bに示されるように、ペプチドαAAAβからなる。親和性試薬はその後、5マーペプチドのプールに適用され、そして3つのスクリーニング工程すべてからのデータが、親和性試薬の結合の特徴付けを提供するために、収集される。他の例において、工程は省略されてよく、または異なる順番で、異なって実施されてもよい。タンパク質の適格性スクリーニングは、親和性試薬が、ペプチドではなくタンパク質のコンテキストにおいて、所望の単数のエピトープまたは複数のエピトープに結合することを確認するために、実施されてよい。アイデンティティおよび配列が既知であるタンパク質が、固体の支持体上に固定化されてよく、そして親和性試薬に曝露されてよい。タンパク質は、精製されたタンパク質ストックから、固体の支持体に適用されてよく、または核酸プログラマブルタンパク質アレイ(Nucleic Acid-Programmable Protein Array)(NAPPA)などのプロセスによって、固体の支持体上で合成されてもよい。いくつかの場合において、このスクリーニングに使用されるタンパク質は、親和性試薬の、予測されるまたは既知の単数のエピトープもしくは複数のエピトープを含むタンパク質からなってよい。いくつかの場合において、このスクリーニングに使用されるタンパク質は、親和性試薬の、予測されるまたは既知の単数のエピトープもしくは複数のエピトープを含まないタンパク質からなってよい。いくつかの場合において、このスクリーニングに使用されるタンパク質は、親和性試薬の、予測されるまたは既知の単数のエピトープもしくは複数のエピトープを含むタンパク質と、これらのエピトープを含まないタンパク質との、両方からなってよい。親和性試薬の、異なるタンパク質への結合は、当技術分野において公知の任意の方法によって評価されてよい。たとえば、結合した親和性試薬は、親和性試薬に特異的な抗体によって、タンパク質もしくは核酸に結合する色素によって、またはスクリーニングの前に親和性試薬を検出可能なモエティで標識することによって、同定されてよい。結合したタンパク質および未結合のタンパク質が決定されたら、配列は、どのくらいの頻度で親和性試薬がその単数のエピトープまたは複数のエピトープに結合するのかを決定するために、および周囲のタンパク質配列に結合が影響を受けるかどうかを決定するために、比較されてよい。結合結果およびタンパク質配列は、最も可能性が高い結合部位を立証するために、機械学習アルゴリズムに送り込まれてよい。オフターゲット効果もまた、この方法によって決定されてよい。いくつかの場合において、エピトープに対する親和性試薬は、それが、エピトープを含むタンパク質の少なくとも約1%、2%、3%、5%、7%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または95%超に結合する場合に、選択されてよい。いくつかの場合において、エピトープに対する親和性試薬は、それが、エピトープを含まないタンパク質の、約50%未満、約40%未満、約30%未満、約20%未満、約10%未満、約5%未満、または5%未満に結合する場合に、選択されてよい。いくつかの場合において、複数の親和性試薬が、同じエピトープに対して選択されてよい。前記複数の親和性試薬は、まとめてプールされてよく、そしてプールされた親和性試薬として使用されてよい。
【0047】
既知のタンパク質との相互作用からの結合データを用いる、親和性試薬の特徴付け
プロテオーム(たとえばヒトプロテオーム、酵母プロテオーム、大腸菌(E. coli)プロテオーム)を含むタンパク質全体にわたる、特定の親和性試薬の結合親和性を特徴付けする手法を発見することは、有用である。Uniprotにおけるリファレンスプロテオームデータベース(https://www.uniprot.org/proteomes/UP000005640)中に定義される、約70,000個のカノニカルなタンパク質配列を検討する場合でさえも、ヒトプロテオーム中のタンパク質のセット全体にわたって、特定の親和性試薬のセットの結合親和性を特徴付けすることは、多大な労力を必要とし得る。さらに、プロテオフォームが検討される場合、同定され得るヒトプロテオーム中の別個のプロテオフォームの数は、数十万または数億に達し得る。そのため、多数の未知のタンパク質全体にわたって適用することができる手法において、親和性試薬の結合親和性を効率よく特徴付けすることは、有益である。いくつかの態様において、親和性試薬の結合親和性は、既知のタンパク質との親和性試薬の相互作用を評価することによって、生成される。いくつかの態様において、親和性試薬の結合親和性は、NCBIまたはUniprotからのリファレンスプロテオームなどの配列データベースに由来する配列を有するタンパク質との親和性試薬の相互作用を評価することによって、生成される。いくつかの態様において、本明細書において提供される方法において使用されるタンパク質配列は、無作為な配列を有するタンパク質のように、既知の天然の起源を有さなくてもよい。いくつかの態様において、非天然の配列を有するタンパク質のプリンティングは、本明細書において論じられるものなどのモデルに、追加の情報を提供するのに有用であり得る。いくつかの態様において、親和性試薬の、既知のタンパク質中の特定の標的に対する結合親和性は、既知のタンパク質中の標的の存在に基づいて、および既知のタンパク質中の標的のコピーの数に基づいて、評価されてよい。
【0048】
したがって、いくつかの場合において、本明細書において開示される親和性試薬などの親和性試薬は、既知のタンパク質のアレイに対して該親和性試薬をスクリーニングすることによって、特徴付けされてよい。既知のタンパク質に対する親和性試薬のスクリーニングから生成される結合データは、親和性試薬が結合する単数のエピトープまたは複数のエピトープが、未知のタンパク質中に存在するかどうかを評価するために使用され得る結合親和性情報を生成するために、使用されてよい。特に、各親和性試薬は、1つまたは複数のエピトープに結合してよい。さらに、各タンパク質は、それぞれ特定の親和性試薬に結合し得る複数のエピトープを含んでよい。特定の親和性試薬に結合する複数のエピトープを含むタンパク質に関して、該タンパク質は、特定のエピトープの複数のコピーを有していてよく、および/または別個のエピトープの複数のコピーを有していてもよい。そのため、いくつかの場合において、特定のタンパク質は、複数の親和性試薬分子に結合し得、ここで該複数の親和性試薬分子のそれぞれは、タンパク質中に存在する複数のエピトープの1つに結合する潜在性を有する。したがって、親和性試薬を特徴付けすること、およびタンパク質への結合を予測することの助けとなる情報は、未知のタンパク質を同定する方法に適用可能であり得る。いくつかの態様において、生成される結合データは、タンパク質データベース中にそれについての配列が表される未知のタンパク質を同定するために、使用されてよい。いくつかの態様において、結合データは、未知のタンパク質に関連する配列が同定されるまで、未知のタンパク質を特徴付けするために使用され得る特定のプロファイルを生成するために、使用されてよい。特に、親和性試薬の、既知のタンパク質のアレイにおけるタンパク質との相互作用から生成される結合データは、親和性試薬の、既知のタンパク質中の1つまたは複数のエピトープに対する結合親和性を決定するために、使用されてよい。これは、順番に、それらの1つまたは複数のエピトープの1つまたは複数のコピーを有するタンパク質に対してスクリーニングされる親和性試薬に関する結合親和性の評価において、使用されてよい。加えて、またはあるいは、親和性試薬の、1つまたは複数のエピトープに対する結合親和性は、該特徴付けされる1つまたは複数のエピトープと類似の他のエピトープもしくは同じエピトープを有するタンパク質に対してスクリーニングされる親和性試薬に関する結合親和性の評価において、使用されてよい。いくつかの態様において、既知のタンパク質のアレイにおけるタンパク質に対してスクリーニングされた親和性試薬の相互作用からの結合データは、既知のタンパク質のアレイ中の1つまたは複数のタンパク質中の、特定のタイプのエピトープの親和性の特徴、たとえば特定の長さの、可能性のある各エピトープ、完全なタンパク質配列の特定のサブセット中のエピトープ、折りたたまれているタンパク質構造の特定の位置におけるエピトープ、折りたたまれているタンパク質構造において非常に接近しやすいことが予測もしくは観測される各エピトープ、または実験的もしくはインシリコ結合スクリーニングから同定される各エピトープなどの親和性の特徴を決定するために、使用されてよい。いくつかの態様において、既知のタンパク質のアレイにおけるタンパク質に対してスクリーニングされた親和性試薬の相互作用からの結合データは、親和性試薬の、既知のタンパク質のアレイ中の1つまたは複数のタンパク質中の複数のエピトープに対する結合親和性を決定するために、使用されてよい。いくつかの態様において、既知のタンパク質のアレイにおけるタンパク質に対してスクリーニングされた親和性試薬の、相互作用からの結合データは、親和性試薬の、特定のエピトープの複数のコピーを有するタンパク質に対する結合親和性を決定するために、使用されてよい。
【0049】
既知のタンパク質のアレイに対して親和性試薬のスクリーニングを行うための方法は、後述される。後述のように、方法は、試験される親和性試薬が、少なくとも1つの3アミノ酸エピトープ(三量体)、または三量体の組み合わせに結合することを、規定してよい。しかしながら、該方法の態様は、二量体、4マー、5マー、6マー、7マー、より長いエピトープ、および非連続的なエピトープなど、三量体以外の異なる長さの、1つまたは複数のエピトープを含んでよい。いくつかの態様において、方法は、試験される親和性試薬が、少なくとも1つの二量体、または二量体の組み合わせに結合することを、規定してよい。いくつかの態様において、方法は、試験される親和性試薬が、少なくとも1つの二量体もしくは三量体、または二量体もしくは三量体の組み合わせに結合することを、規定してよい。いくつかの態様において、方法は、試験される親和性試薬が、二量体、三量体、4マー、5マー、6マー、7マー、7マーより長いnマー、および非連続的なエピトープからなる群より選択されるnマーの2個以上に結合することを、規定してよい。いくつかの態様において、方法は、試験される親和性試薬が、二量体、三量体、4マー、5マー、6マー、7マー、7マーより長いnマー、および非連続的なエピトープからなる群より選択されるnマーの3個以上に結合することを、規定してよい。いくつかの態様において、方法は、試験される親和性試薬が、二量体、三量体、4マー、5マー、6マー、7マー、7マーより長いnマー、および非連続的なエピトープからなる群より選択されるnマーの3個超に結合することを、規定してよい。
【0050】
本明細書において提供される方法を用いて、タンパク質の推定が算定されてよい。いくつかの態様において、タンパク質の推定は、たとえば、特定の親和性試薬の、タンパク質への結合測定;タンパク質の、可能性のある候補タンパク質のタンパク質配列に関連する情報;および各親和性試薬の各候補タンパク質への結合の予想される程度について、ある特定の程度の確実性を有する予測がそれから導き出され得る結合親和性情報というような情報などの、1つまたは複数の検討に基づいて、算定されてよい。いくつかの方法は、本明細書において記載されるように、親和性試薬の統計学的モデルを生成するために提供されるものであり、タンパク質との親和性試薬の結合の蓋然性が、該タンパク質の一次配列が与えられると、該モデルからコンピューターで計算され得る。
【0051】
いくつかの態様において、統計学的モデルは、複数の特定の親和性試薬の、複数の既知のタンパク質のそれぞれへの一連の結合測定を用いて、訓練されてよい。このアプローチは、直接の実験的測定が利用可能でない場合に、親和性試薬-タンパク質結合を予測するために使用されてよい。方法を、ヒトプロテオーム中のタンパク質に適用する場合、候補ヒトタンパク質の最小限のリストは、およそ20,000個のタンパク質を含み得る。さらに、スプライシング変種、多型、部分分解、および追加の非ヒトゲノムを考慮に入れることは、候補タンパク質を数十万または数億という数にまで速やかに膨張させ得る。
【0052】
方法
いくつかの態様において、既知のタンパク質配列のアレイが得られる。いくつかの態様において、既知のタンパク質のこのアレイは、純粋なタンパク質試料をチップ上にスポットすることによって、生成されてよい。いくつかの態様において、既知のタンパク質のこのアレイは、たとえば核酸プログラマブルタンパク質アレイ(NAPPA)を用いて、チップ上へタンパク質を直接的に翻訳することによって、生成されてよい。1つまたは複数の特定のアレイの全域にわたって分析され得る既知のタンパク質の数は、50個未満の異なるタンパク質配列を含んでよく、50個の異なるタンパク質配列を含んでよく、50個超のタンパク質配列を含んでよく、およそ100個の、150個の、200個の、250個の、300個の、350個の、400個の、500個の、600個の、700個の、800個の、900個の、1,000個の、2,000個の、3,000個の、5,000個の、10,000個の、15,000個の、20,000個の、または20,000個超のタンパク質配列を含んでもよい。一般的な概念として、より多くのタンパク質分析が分析されれば、開発中のモデルの正確性は上昇し得る。いくつかの態様において、分析され得る既知のタンパク質の数は、とりわけ、約300~約3000個の異なるタンパク質配列;約500~約2000個の異なるタンパク質配列;約600~約1500個の異なるタンパク質配列;約600~約1000個の異なるタンパク質配列;または約1000~3000個の異なるタンパク質配列であってよい。いくつかの態様において、既知の各タンパク質は、アレイ上の単一の位置において、複数のコピーとして存在してよい。いくつかの態様において、各タンパク質は、アレイの全域にわたって多数の位置で、複数のコピーとして存在してよい。いくつかの態様において、各タンパク質は、アレイの全域にわたって、2つの位置、3つの位置、4つの位置、5つの位置、6つの位置、7つの位置、8つの位置、8つより多い位置、または異なる数の組み合わせの位置に、存在してよい。いくつかの態様において、各タンパク質は、アレイの全域にわたって1つの、2つの、3つの、4つの、5つの、6つの、7つの、8つの、または8つより多い位置のそれぞれにおいて、約1000超コピー、約2000超コピー、約3000超コピー、約5000超コピー、約10,000超コピー、約20,000超コピー、約50,000超コピー、約100,000超コピー、約500,000超コピー、約1,000,000超コピー、約2,000,000超コピー、約5,000,000超コピー、約10,000,000超コピー、約100,000,000超コピー、約10億超コピー、約100億超コピー、約1000億超コピー、または1000億超コピーとして、存在してよい。さらに、いくつかの態様において、親和性試薬はまた、1つの位置につき1コピー、1つの位置につき2コピー、1つの位置につき3コピー、1つの位置につき4コピー、1つの位置につき5コピー、1つの位置につき10コピー、または1つの位置につき10コピー超など、特定の位置において少数のタンパク質を評価することによって、特徴付けされてもよい。いくつかの態様において、各特定の位置が、別の位置から、光学的検出または他の検出センサーに基づいて区別可能に離れている場合、位置は、別のものから区別され得る。
【0053】
いくつかの態様において、1つまたは複数の親和性試薬の、アレイ中の既知のタンパク質への結合は、蛍光標識された親和性試薬をアレイとハイブリダイズさせること、およびアレイ上の各スポットにおいて観測される蛍光を測定することによって、評価されてよい。いくつかの態様において、各スポットにおける各タンパク質のアイデンティティは、蛍光(結合の代理として)がタンパク質のアイデンティティへと写像され得るように、既知であってよい。
【0054】
いくつかの態様において、タンパク質中の特定のエピトープへの親和性試薬の結合の評価において、三量体エピトープが使用されてよい。しかしながら、いくつかの態様において、本明細書において論じられる方法は、三量体以外の異なる長さのエピトープへと拡張されてよい。いくつかの態様において、タンパク質レベルの蛍光測定は、それぞれの個々のエピトープからなど個々のエピトープから、蛍光測定への、細分化されている寄与を導き出すために、使用されてよい。いくつかの態様において、タンパク質結合は、タンパク質配列における8000個の可能性のある三量体のそれぞれの計測数と、それら三量体からの細分化されている蛍光との、線形結合として、モデル化されてよい。これは、以下のように表現され得る:
式中:
Fpr = タンパク質prについての測定(たとえば蛍光)
ct,pr = タンパク質prにおける三量体tの計測数
βt = 三量体tへの親和性試薬の結合からの、細分化されている蛍光
【0055】
いくつかの態様において、複数のタンパク質に対する親和性試薬についての測定は、線形方程式系を形成してよい:
式中:
は、各タンパク質について観測される測定(たとえば蛍光)を含む、長さNの列ベクトルである。
Cは、三量体計測数のN x 8000の行列であり、ここで各列は、測定される各タンパク質における特定の三量体についての計測数である。
は、可能性のある各三量体への試薬の結合からの、細分化されている蛍光の、長さ8000の列ベクトルである。
εは、バックグラウンドの結合、またはノイズフロアを補正するための、スカラー定数である。
【0056】
いくつかの態様において、本明細書において提供される方法は、非標準的なアミノ酸を含んでよく、および/または異なる長さのnマーをモデル化してよい。既知のNAPPAまたは類似の結合測定の場合は、
およびCは既知の変数であり、かつ
およびεの値は、線形回帰または関連するアプローチによって導き出され得る。特に、非負の最小二乗法、ならびに非負の最小絶対収縮および選択演算子(least absolute shrinkage and selection operator)(LASSO)回帰は、本明細書において記載される方法の検討のために好適であり得る。非負の最小二乗法は、解
が非負であるように束縛し、そして非負のLASSO回帰は、スパース性制約をさらに課す。LASSO回帰は、系が劣決定である場合に、つまり、測定される独特なタンパク質の数が、独特な三量体の数(この例においては8,000個)未満である場合に、特に効果的である。いくつかの態様において、各エピトープに由来する、細分化されている蛍光は、個々のエピトープへの特定の親和性試薬の結合キネティクスなどの、結合の特徴を判断するために、使用されてよい。いくつかの態様において、相対的な、細分化されている蛍光が、エピトープのそれぞれへの親和性試薬の相対的な結合親和性と比例する、とみなされてよい。いくつかの態様において、細分化されている蛍光は、フルオロフォア1つあたりの蛍光計測の数で割り、そして次に、アレイ上の1スポットあたりのタンパク質分子の予想される数で割ることにより、結合された部位の区画についての算出結果へと、変換されてよい。この方法のシミュレーションは、実施例5において提供され、ここで理論上の親和性試薬の結合親和性のセットは、720個のヒトタンパク質への親和性試薬の結合を予測するために使用され、そして予測される結合データはその後、可能性のあるそれぞれの三量体エピトープへの親和性試薬の親和性を決定するために、解釈される。
【0057】
タンパク質の親和性試薬への結合をモデル化するという態様から集められるデータは、タンパク質の一次配列からタンパク質の結合親和性を予測する他のモデルを訓練する助けとなるように、使用されてよい。いくつかの態様において、タンパク質の親和性試薬への結合をモデル化するという態様から集められるデータは、一次配列の派生物(たとえばアミノ酸組成、三量体の計測数、予測される三次元構造)からタンパク質の結合親和性を予測する他のモデルを訓練する助けとなるように、使用されてよい。いくつかの態様において、モデルは、異なる長さを有するエピトープ(たとえば1マー、2マー、4マー等)、または異なる長さを有するエピトープの混合物について論じられるものと類似したパラメーターを含んでよい。いくつかの態様において、モデルは、たとえば三量体の親和性を観測される蛍光に関連づける指数関数をともなう、非線形モデルや、またはタンパク質レベルの親和性を生成するために三量体レベルの親和性が乗じられる乗法モデルを、使用してよい。いくつかの態様において、ニューラルネットワークが、タンパク質の結合親和性を、タンパク質配列からまたは三量体の組成から予測するために、使用されてよい。加えて、サポートベクター回帰モデルが、タンパク質の結合親和性を、タンパク質配列からまたは三量体の組成から予測するために、使用されてよい。
【0058】
親和性試薬のタンパク質への結合における、二次構造の影響の評価
親和性試薬のタンパク質への結合は、ヘリックス、ターン、ループ、およびシートなどの二次構造要素の存在によって、影響を受け得る。いくつかの態様において、親和性試薬のエピトープへの結合が、二次構造の存在によってどのように変化するかを評価するために、ペプチドアレイおよびタンパク質構造データベースを活用するアプローチが使用されてよい。いくつかの態様において、アルファヘリックスおよびベータシートなど異なる二次構造を形成するタンパク質の領域を、ならびにその上関心対象のエピトープをも含むタンパク質の領域を、同定するために、既知のタンパク質の構造に関する情報が使用されてよい。いくつかの態様において、関心対象のエピトープは、同定される二次構造中にあってよい。いくつかの態様において、関心対象のエピトープは、同定される二次構造の近くにあってよい。いくつかの態様において、既知の二次構造を有するタンパク質領域は、合成されてよく、そして、親和性試薬の結合を、二次構造を有することが観測されていない異なるタンパク質領域と比較して評価するために、使用されてよい。いくつかの態様において、既知の二次構造を有するタンパク質領域は、スクランブル配列と比べて親和性試薬の結合を評価するために、合成され、そして使用されてよく、ここでスクランブル配列は、関心対象のエピトープと、構造化領域と同じアミノ酸組成だが異なるアミノ酸配列とを含む。
【0059】
いくつかの態様において、親和性試薬の、異なる二次構造への結合親和性を測定するための方法は、PEPperPRINTから利用可能であるものなどの、数百または数千のペプチドがプリントされたペプチドアレイを用いる工程を含んでよい。たとえば各ペプチドが10~30残基の長さを有する11,000個のペプチドを含むアレイがプリントされてよく、そしてその後、蛍光標識された親和性試薬とハイブリダイズさせてよい。アレイ上の各スポットにおいて測定される蛍光の量は、スポットに局在している、対応するペプチドへの、親和性試薬の結合親和性に比例している、とみなされてよい。いくつかの態様において、方法は、構造上の影響に関して試験するために提供されてよい。たとえば、アレイは、「構造的」ペプチド -たとえば関心対象のエピトープをもまた含む特定の二次構造を有すると予想され得る、15マーなどのペプチド- を含んでプリントされてよい。加えて、アレイは、あるいはまたは加えて、二次構造を有することが観測されていないけれども、同じ関心対象のエピトープをもまた含む、「非構造化」ペプチドを含むように、プリントされてよい。「非構造化」ペプチドは、二次構造に関連する1つまたは複数の配列部分を改変するように、特定の配列の一部分を改変することによって、構築されてよく、それにより、元のペプチドよりも少ない二次構造を有することが観測されるか、またはいかなる二次構造も有さないことが観測されるかいずれかの、改変された配列が、産生される。結合親和性の異なる指標(たとえば、蛍光の量、または親和性試薬とペプチドとの間の結合の別の指標)を測定することによって、1つまたは複数の関心対象のエピトープに関して、特定の親和性試薬の特定の結合親和性に、二次構造の要素の存在がどのように影響を及ぼし得るかについて、決定が下されてよい。
【0060】
構造化ペプチドの発見
いくつかの態様において、構造化ペプチドに関する配列は、構造化されていることが既知である内在性タンパク質の領域に由来してよい。いくつかの態様において、これらのペプチドは、関心対象の種についてのアノテーションされたタンパク質配列中の、エピトープのすべての出現を発見するため、リファレンスプロテオーム(たとえばUniprotヒトリファレンスプロテオーム)を最初に検索することによって、発見されてよい。関心対象の種についてのアノテーションされたタンパク質配列における、エピトープの出現が同定されたら、エピトープを含む配列の位置は、蛋白質構造データバンク(Protein Data Bank)(PDB)などのタンパク質データベースからの構造データと、相互参照されてよい。加えて、またはあるいは、エピトープを含む配列位置が、関心対象の構造モチーフ(たとえば二次構造)に関連するかどうかを決定するために、二次構造を予測するソフトウェアが使用されてよい。二次構造を予測するために使用され得るソフトウェアプログラムは、限定するものではないが、とりわけ、Rosetta (https://www.rosettacommons.org/software)、I-TASSER (https://zhanglab.ccmb.med.umich.edu/I-TASSER/)、およびPEP-FOLD (http://bioserv.rpbs.univ-paris-diderot.fr/services/PEP-FOLD/)を含む。
【0061】
構造データに関連する配列位置/配列部分が同定されたら、関心対象の構造モチーフ(たとえばベータシート、アルファヘリックス、ターン)に関連する配列部分中にないエピトープは、除去されてよい。さらに、構造要素中のエピトープの各例に関して、エピトープおよび構造化隣接配列は、エピトープのいずれかの側から抜粋されてよい。たとえば、ペプチドの冒頭にあるエピトープでのもの、ペプチドの中央付近にあるエピトープでのもの、およびペプチドの末端にあるエピトープでのもののように、いくつかの異なる抜粋が、各エピトープに関して実施されてよい。いくつかの場合において、ペプチドの長さが選択されてよく、たとえばペプチドの長さは、10個未満の、10個の、11個の、12個の、13個の、14個の、15個の、16個の、17個の、18個の、19個の、20個の、21個の、22個の、23個の、24個の、25個の、26個の、27個の、28個の、29個の、30個の、31個の、32個の、33個の、34個の、35個の、36個の、37個の、38個の、39個の、40個の、または40個超の残基であってよい。いくつかの態様において、可能性のあるエピトープの断片、および隣接配列が、選択されてよい。たとえば、3個の長さのエピトープかつ15個の長さのペプチドの場合、エピトープがペプチドの第1番目~第13番目の位置で開始されるかどうか次第で選択され得る、13種類の異なる配列が存在する。いくつかの場合において、ペプチドの、複数の長さが選択されてよい。さらに、抜粋された各ペプチド配列(エピトープ+構造化隣接配列)に関して、二次構造に関連する配列部分が、二次構造的な特徴を変化させるまたは除去するように改変されている、「非構造化」ペプチド。いくつかの態様において、1つまたは複数の隣接配列をシャッフルするが、エピトープは同じ位置に残しておくことによって、「非構造化」ペプチドが生成されてよい。配列のシャッフルは、配列における残基の順を変更する一方で組成を維持することを、含んでよい。加えて、組成は、配列における各残基の計測数としてみなされてよい。いくつかの態様において、配列のシャッフルは、配列における残基の順を無作為に変化させる一方で組成を維持することを、含んでよい。いくつかの態様において、「非構造化」ペプチドは、配列中の残基の順を非無作為に変化させる一方で配列の組成を維持することによって、生成されてよい。いくつかの態様において、「非構造化」ペプチドは、非天然のまたは修飾されているアミノ酸残基を配列中に組み込むことによって、生成されてよい。いくつかの態様において、「非構造化」ペプチドは、これらの方法の1つまたは複数を、組み合わせて適用して、順に適用して、またはエピトープに関連する1つまたは複数の隣接配列のサブセットに対して適用して、生成されてよい。いくつかの態様において、「非構造化」ペプチドの二次構造は、ペプチドを合成し、そして円二色性分光法などの方法を用いることによって、評価されてよい。
【0062】
構造化ペプチドの評価
構造化エピトープおよび非構造化エピトープを含むペプチドが上述のように同定されたら、アレイには、構造化ペプチドおよび非構造化ペプチドのそれぞれの多くの複製物がプリントされてよい。アレイはその後、蛍光標識された親和性試薬とハイブリダイズされてよい。アレイ上の各スポットにおいて測定される蛍光の量が測定され得、そして、対応のあるt検定、これは、構造化ペプチドと非構造化ペプチドとの間で蛍光測定を比較するが、これが、たとえば、二次構造に起因する、結合の有意な増加または低下があるかどうかを決定するために、実施されてよい。構造化ペプチドの蛍光が、非構造化ペプチドと比較して低下している場合、これは、親和性試薬の結合の、二次構造の要素に起因する、ある程度の破壊を示し得る。タンパク質折りたたみという難題のため、アレイ上にプリントされる際に、「構造化」ペプチドのすべてが、予測される「天然」の立体構造に折りたたまれるわけではない、という可能性がある。複数の異なる構造化ペプチド配列、および各エピトープについての豊富な断片の使用は、この難題に対処する助けとなり得る。同じエピトープを有する他のペプチドと比較して、結合親和性において有意な変化を示すいかなるペプチドも、さらなる研究のために選択されてよい。たとえば、ペプチドは、それが、予想される二次構造を採用しているかどうかを決定するために、円二色性分光法(CD分光法)によって評価されてよい。いくつかの場合において、親和性試薬とのハイブリダイゼーションに先立って二次構造を決定するために、CD分光法によってすべてのペプチドが評価されてよい。
【0063】
親和性試薬の結合における二次構造の影響を評価するための別の方法は、無細胞発現から、または細胞溶解物からのいずれかの、全長タンパク質を使用することであり得る。いくつかの場合において、高度に構造化されているタンパク質、たとえばプリオンタンパク質、アミロイドプラーク、またはタウ線維などは、組織試料から単離されてよい。たとえば、既知の二次構造を有する、異なる組み換えタンパク質の試料が、非構造化タンパク質、スクランブルタンパク質、または変性タンパク質と比較した、親和性試薬の構造化タンパク質への結合を評価するために、得られ、そして使用されてよい。上述のような方法は、選択される構造化タンパク質の構造化領域中に位置する任意のエピトープに関して、使用されてよい。タンパク質は、結合の評価を容易にするために固体の支持体に結合させてよく、または溶液中に維持されてもよく、そして親和性プルダウンなどの方法が、結合を評価するために使用されてよい。
【0064】
いくつかの場合において、ペプチドの適格性スクリーニング、およびタンパク質の適格性スクリーニングは、所望の特性を有する親和性試薬を選択するために実施されてよい。他の場合において、親和性試薬は、いずれかのスクリーニングを実施する前に選択されてよく、かつスクリーニングは、親和性試薬についての結合データを収集するために実施されてよい。
【0065】
スクリーニング工程および選択工程は、所定のnマーの、可能性のあるすべてのエピトープに対して、たとえば8000個すべての、可能性のある3マーに対して、実施されてよい。いくつかの場合において、スクリーニング工程は、可能性のあるnマーのサブセットに対してのみ実施されてよい。たとえば、すべての8000個の3マーに対する親和性試薬のスクリーニングの代わりに、800個の3マーが、所望のエピトープとして選択されてよく、そして他の7200個の3マーは、それに対してスクリーニングされなくてよい。
【0066】
いくつかの場合において、本明細書において記載される方法を用いて選択される親和性試薬は、プロテオーム中の、可能性のあるすべてのタンパク質の約50%に結合してよい。いくつかの場合において、異なる結合特性を有する複数の親和性試薬は、親和性試薬のプールが、プロテオーム中のすべてのタンパク質の約半分に結合するように、選択され、そしてまとめてプールされてよい。いくつかの場合において、親和性試薬のプールは、1つだけの親和性試薬の代わりに使用されてよい。
【0067】
親和性試薬は、タンパク質またはペプチドに再現性のある特異性をもって結合する、任意の試薬であり得る。たとえば親和性試薬は、抗体、抗体断片、アプタマー、またはペプチドであってよい。いくつかの例において、モノクローナル抗体が選ばれ得る。いくつかの例において、Fab断片などの抗体断片が選ばれ得る。いくつかの例において、アプタマーが選ばれ得る。いくつかの場合において、親和性試薬は、市販の抗体などの市販の親和性試薬であってよい。いくつかの場合において、望ましい親和性試薬は、有用な特徴を有するものを同定するために市販の親和性試薬をスクリーニングすることによって、選択されてよい。いくつかの場合において、親和性試薬は、タンパク質1つに結合するそれらの能力に関してスクリーニングされてよい。いくつかの場合において、親和性試薬は、エピトープまたはアミノ酸配列に結合するそれらの能力に関してスクリーニングされてよい。いくつかの場合において、親和性試薬のグループは、差異のある結合によって、類似のタンパク質(たとえば高度に類似の配列を有するもの)を集合的に区別する、それらの能力に関して、スクリーニングされてよい。いくつかの場合において、親和性試薬は、特定のタンパク質に対する結合特異性を増加させるため、結合がオーバーラップするという特徴を有するようにスクリーニングされてよい。親和性試薬のスクリーニングは、多様な、異なる様式で実施されてよい。一例は、NAPPAまたはエピトープタイリングアレイに対する親和性試薬をスクリーニングすることであり得る。いくつかの場合において、タンパク質標的に結合するよう設計されたタンパク質特異的親和性試薬が使用されてよい(たとえば市販の抗体またはアプタマー)。いくつかの場合において、複数の、タンパク質特異的親和性試薬またはエピトープ特異的親和性試薬が、結合測定を実施する前に混合されてよい。たとえば、結合測定の工程それぞれのため、タンパク質特異的親和性試薬の新しい混合物が、完全なセットから無作為に選択された、利用可能な親和性試薬のサブセットを含むように、選択されてよい。たとえば、それに続く各混合物は、親和性試薬の多くが複数の混合物中に存在することを期待して、同じ無作為な様式で生成されてよい。いくつかの場合において、タンパク質の同定は、タンパク質特異的親和性試薬の混合物を用いて、より速やかに達成されてよい。いくつかの場合において、タンパク質特異的親和性試薬のそのような混合物は、任意の個々の工程において、親和性試薬が結合する未知のタンパク質のパーセンテージを増加させ得る。親和性試薬の混合物は、すべての利用可能な親和性試薬の1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、またはそれより多くからなり得る。
【0068】
親和性試薬は、高い、中間の、または低い特異性を有してよい。いくつかの例において、親和性試薬は、いくつかの異なるエピトープを認識してよい。いくつかの例において、親和性試薬は、2以上の異なるタンパク質に存在するエピトープを認識してよい。いくつかの例において、親和性試薬は、多くの異なるタンパク質に存在するエピトープを認識してよい。いくつかの場合において、本開示の方法において使用される親和性試薬は、エピトープ1つだけに対して高度に特異的であってよい。いくつかの場合において、本開示の方法において使用される親和性試薬は、翻訳後修飾を含むエピトープ1つだけに対して高度に特異的であってよい。
【0069】
いくつかの態様において、標的アミノ酸配列を同定することに指向された親和性試薬は、本明細書において記載される方法において使用されるように、互いに区別されず互いに識別可能でもない異なる構成要素のグループを、実際に含んでよい。特に、同じ標的アミノ酸配列を同定するために使用され得る異なる構成要素は、同じ標的アミノ酸配列を同定するために、同じ検出モエティを使用してよい。たとえば、隣接配列にかかわらず三量体アミノ酸配列(AAA)に結合する親和性試薬は、隣接配列からのいかなる影響も無く三量体AAA配列に結合する1つだけのプローブでも、またはαAAAβの形式の異なる5アミノ酸エピトープにそのそれぞれが結合する、400個のプローブのグループでも、どちらを含んでもよく、ここでαおよびβは任意のアミノ酸であり得る。第二の場合のいくつかの場合において、400個のプローブは、そのそれぞれが等量存在するように組み合わされてよい。第二の場合のいくつかの場合において、400個のプローブは、どの所定の5アミノ酸エピトープも結合する確率が等しくなるよう、各プローブの特徴的な結合親和性によって各プローブの量が加重され得るように、組み合わされてよい。
【0070】
新規な親和性試薬は、当技術分野において公知の、任意の方法によって作り出されてよい。親和性試薬を開発する方法は、SELEX、ファージディスプレイ、および接種を含む。いくつかの例において、親和性試薬は、構造に基づく薬剤設計方法を用いて設計されてよい。構造に基づく薬剤設計(または直接的な薬剤設計)は、関心対象のエピトープの、および親和性試薬の結合部位の、三次元構造の知見を利用する。
【0071】
いくつかの場合において、親和性試薬は核酸バーコードで標識されてよい。いくつかの例において、核酸バーコードは、使用後に親和性試薬を精製するために使用されてよい。いくつかの例において、核酸バーコードは、繰り返しの使用のため親和性試薬を仕分けするために、使用されてよい。いくつかの場合において、親和性試薬は、使用後に親和性試薬を仕分けするために使用され得るフルオロフォアで標識されてよい。
【0072】
いくつかの場合において、核酸バーコードで標識された複数の親和性試薬は、多重化されてよく、かつその後相補的核酸プローブを用いて検出されてよい。親和性試薬の多重化されたグループは、別個の検出モエティを有する複数の相補的核酸を用いる単一のサイクルにおいて、検出されてよい。いくつかの場合において、親和性試薬の多重化されたグループは、検出モエティにコンジュゲートされた単一の相補的核酸を用いる複数のサイクルにおいて、検出されてよい。いくつかの場合において、親和性試薬の多重化されたグループは、別個の検出モエティにそれぞれコンジュゲートされた複数の相補的核酸を用いる複数のサイクルにおいて、検出されてよい。いくつかの場合において、親和性試薬の多重化されたグループは、検出モエティの別個のグループにそれぞれコンジュゲートされた複数の相補的核酸を用いる複数のサイクルにおいて、検出されてよい。
【0073】
いくつかの場合において、核酸バーコードで標識された1つまたは複数の親和性試薬は、結合されたタンパク質に架橋されてよい。1つまたは複数の親和性試薬がタンパク質に架橋されると、架橋された親和性試薬のアイデンティティを決定するために、バーコードが配列決定され得る。いくつかの場合において、複数の結合されたタンパク質が、1つまたは複数の親和性試薬に曝露されてよい。いくつかの場合において、複数の結合されたタンパク質が、1つまたは複数の親和性試薬に架橋される場合、結合された親和性試薬に関連付けられるバーコードは、複数の結合されたタンパク質のそれぞれに関連付けられる、架橋された親和性試薬のアイデンティティを決定するために、配列決定され得る。
【0074】
親和性試薬のファミリーは、親和性試薬の1つまたは複数の種類を含んでよい。たとえば、本開示の方法は、抗体、抗体断片、Fab断片、アプタマー、ペプチド、およびタンパク質の1つまたは複数を含む親和性試薬のファミリーを使用してよい。
【0075】
親和性試薬は修飾されてよい。修飾は、限定するものではないが、検出モエティの結合を含む。検出モエティは、直接的にまたは間接的に結合されてよい。たとえば検出モエティは、親和性試薬に直接的に共有結合されてよく、またはリンカーを介して結合されてよく、または相補的な核酸タグもしくはビオチン・ストレプトアビジンの対などの親和性反応を介して結合されてよい。軽い洗浄および親和性試薬の溶出に耐えることのできる結合方法が、選ばれ得る。
【0076】
検出モエティは、限定するものではないが、フルオロフォア、生物発光タンパク質、不変の領域およびバーコード領域を含む核酸セグメント、または磁気粒子などのナノ粒子を連結するための化学的テザーを含む。検出モエティは、励起または発光の異なるパターンを有する、いくつかの異なるフルオロフォアを含んでよい。
【0077】
検出モエティは、親和性試薬から切断可能であってよい。これは、もはや関心対象ではない親和性試薬から検出モエティが除去される工程でシグナル混入を減少させることを、可能にし得る。
【0078】
いくつかの場合において、親和性試薬は未修飾である。たとえば、親和性試薬が抗体であるならば、抗体の存在は原子間力顕微鏡によって検出されてよい。親和性試薬は未修飾であってよく、かつ、たとえば抗体を親和性試薬の1つまたは複数に対して特異的にさせることによって、検出されてよい。たとえば、もし親和性試薬がマウス抗体であるならば、マウス抗体は、抗マウス二次抗体を用いて検出されてよい。交代で、親和性試薬は、アプタマーに特異的な抗体によって検出されるアプタマーであってよい。二次抗体は、上述のように検出モエティで修飾されてよい。いくつかの場合において、二次抗体の存在は、原子間力顕微鏡によって検出されてよい。
【0079】
いくつかの例において、親和性試薬は、同じ修飾、たとえばコンジュゲートされた緑色蛍光タンパク質を含んでよく、または2以上の異なる種類の修飾を含んでよい。たとえば、各親和性試薬は、異なる励起波長または発光波長をそれぞれ有する、いくつかの異なる蛍光モエティの1つにコンジュゲートされてよい。いくつかの異なる親和性試薬は組み合わされ得、および/または識別され得るので、これは、親和性試薬の多重化を可能にし得る。1つの例において、第1の親和性試薬は緑色蛍光タンパク質にコンジュゲートされてよく、第2の親和性試薬は黄色蛍光タンパク質にコンジュゲートされてよく、かつ第3の親和性試薬は赤色蛍光タンパク質にコンジュゲートされてよく、したがってこれら3つの親和性試薬は多重化され得、かつそれらの蛍光によって同定され得る。さらなる例において、第1、第4、および第7の親和性試薬は緑色蛍光タンパク質にコンジュゲートされてよく、第2、第5、および第8の親和性試薬は黄色蛍光タンパク質にコンジュゲートされてよく、かつ第3、第6、および第9の親和性試薬は赤色蛍光タンパク質にコンジュゲートされてよい;この場合、第1、第2、および第3の親和性試薬はともに多重化され得、一方で第2、第4、および第7の、ならびに第3、第6、および第9の親和性試薬は、2つのさらなる多重化反応を形成する。ともに多重化され得る親和性試薬の数は、それらを区別するために使用される検出モエティ次第で変わり得る。たとえば、フルオロフォアで標識された親和性試薬の多重化は、独自性を有する、利用可能なフルオロフォアの数によって制限され得る。さらなる例としては、核酸タグで標識された親和性試薬の多重化は、核酸バーコードの長さによって決定されてよい。
【0080】
各親和性試薬の特異性は、アッセイにおける使用の前に決定され得る。親和性試薬の結合特異性は、既知のタンパク質を用いる対照実験において決定され得る。任意の適切な実験方法が、親和性試薬の特異性を決定するために使用されてよい。一例では、固体の支持体は、既知の位置に既知のタンパク質標準品が添加されてよく、そして複数の親和性試薬の特異性を評価するために使用されてよい。別の例においては、各親和性試薬の特異性が対照および標準品への結合から算定され得、そしてその後実験試料を同定するために使用され得るように、固体の支持体は、実験試料ならびに対照および標準品のパネルの両方を含んでよい。いくつかの場合において、未知の特異性を有する親和性試薬が、既知の特異性の親和性試薬とともに含まれてよく、既知の特異性の親和性試薬からのデータが、タンパク質を同定するために使用されてよく、かつ未知の特異性の親和性試薬の、同定されるタンパク質への結合のパターンが、それらの結合特異性を決定するために使用されてよい。どのタンパク質が個々の親和性試薬と結合したのかを評価するために、他の親和性試薬の既知の結合データを用いることによって、任意の個々の親和性試薬の特異性を再確認することもまた、可能である。したがって、親和性試薬パネルの複数の使用で、親和性試薬の特異性は、各反復のたびにますます純化され得る。特定のタンパク質に一意的に特異的な親和性試薬が使用され得るが、本明細書において記載される方法は、それらを必要としなくてもよい。加えて方法は、ある範囲の特異性において効果的であり得る。いくつかの例において、本明細書において記載される方法は、親和性試薬が、いかなる特定のタンパク質に対しても特異的というわけではないが、代わりにアミノ酸モチーフ(たとえばトリペプチドAAA)に対して特異的である場合に、特に有効であり得る。
【0081】
いくつかの例において、1つまたは複数の親和性試薬は、2個、3個、4個、5個、6個、7個、8個、9個、10個、または10個超のアミノ酸などの所定の長さのアミノ酸モチーフに結合するように、選ばれてよい。いくつかの例において、1つまたは複数の親和性試薬は、2アミノ酸から40アミノ酸までの異なる長さのある範囲のアミノ酸モチーフに結合するように、選ばれてよい。
【0082】
いくつかの例において、親和性試薬は、高い、中間の、または低い結合親和性を有するように選ばれてよい。いくつかの場合において、低いまたは中間の結合親和性を有する親和性試薬が選ばれ得る。いくつかの場合において、親和性試薬は、約10-3 Mの、約10-4 Mの、約10-5 Mの、約10-6 Mの、約10-7 Mの、約10-8 Mの、約10-9 Mの、約10-10Mの、またはより小さい解離定数を有してよい。いくつかの場合において、親和性試薬は、約10-10M超の、約10-9 M超の、約10-8 M超の、約10-7 M超の、約10-6 M超の、約10-5 M超の、約10-4 M超の、約10-3 M超の、約10-2 M超の、またはより大きい解離定数を有してよい。
【0083】
親和性試薬のいくつかは、リン酸化されたまたはユビキチン化されたアミノ酸配列などの修飾されたアミノ酸配列に結合するために、選ばれてよい。いくつかの例において、1つまたは複数の親和性試薬は、1つまたは複数のタンパク質によって含まれ得るエピトープのファミリーに対し広く特異的であるために、選ばれてよい。いくつかの例において、1つまたは複数の親和性試薬は、2以上の異なるタンパク質に結合してよい。いくつかの例において、1つまたは複数の親和性試薬は、それらの単数の標的または複数の標的に弱く結合してよい。たとえば、親和性試薬は、10%未満、10%未満、15%未満、20%未満、25%未満、30%未満、35%未満、または35%未満が、それらの単数の標的または複数の標的に結合し得る。いくつかの例において、1つまたは複数の親和性試薬は、それらの単数の標的または複数の標的に、中程度にまたは強固に結合してよい。たとえば、親和性試薬は、35%超、40%超、45%超、60%超、65%超、70%超、75%超、80%超、85%超、90%超、91%超、92%超、93%超、94%超、95%超、96%超、97%超、98%超、または99%超が、それらの単数の標的または複数の標的に結合し得る。
【0084】
弱い結合を補うために、過剰な親和性試薬が、固体の支持体に適用されてよい。親和性試薬は、約1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、または10:1で、試料タンパク質に対して過剰に適用されてよい。親和性試薬は、約1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、または10:1で、試料タンパク質におけるエピトープの予想される出現率に対して過剰に適用されてよい。
【0085】
親和性試薬はまた、磁気を帯びた構成要素を含んでよい。磁気を帯びた構成要素は、いくつかのまたはすべての結合した親和性試薬を同じ画像面またはzスタックで操作するために、有用であり得る。いくつかのまたはすべての親和性試薬を同じ画像面で操作することは、画像化データの質を改善し得、かつシステム中のノイズを減少させ得る。
【0086】
基材/固体の支持体
いくつかの態様において、ペプチドは、親和性試薬の選択工程またはスクリーニング工程を容易にするために、固体の支持体などの、機能化された基材に適用されてよい。図3Bは、エピトープAAAへの親和性試薬の結合における隣接配列の影響を決定するための、親和性試薬の特徴付けスクリーニングにおける使用のための、固体の支持体にコンジュゲートされた、アレイされたペプチドを有する固体の支持体の例を示す。いくつかの場合において、標的ペプチドは、固体の支持体に直接的に適用されてよい。いくつかの場合において、標的ペプチドは、固体の支持体上で合成または伸長させてよい。いくつかの場合において、ペプチドは、アレイまたはビーズなどの固体の支持体上で合成されてよい。たとえば、ペプチドアレイは、アレイ上の各位置において単一のペプチド配列の複数のコピーを含むように製造されてよい。カスタムペプチドマイクロアレイはまた、たとえばPEPperPRINTのように、商業的に購入されてもよい。
【0087】
基材は、固体の支持体を形成することができる任意の基材であってよい。本明細書において使用されるように、固体の支持体などの基材とは、ペプチドが共有結合または非共有結合できる、任意の固体の表面を指し得る。固体の支持体の非限定的な例は、粒子、ビーズ、スライド、装置の構成要素の表面、膜、フローセル、ウェル、チャンバー、マクロ流体チャンバー、ミクロ流体チャンバー、チャンネル、ミクロ流体チャンネル、または任意の他の表面を含む。固体の支持体の表面は、平面であり得るかもしくは湾曲され得、または他の形状を有し得、かつ平滑であり得るかもしくは凹凸を有し得る。固体の支持体の表面は、マイクロウェルを含んでよい。いくつかの態様において、固体の支持体は、ガラス、デキストランなどの炭水化物、ポリスチレンもしくはポリプロピレンなどのプラスチック、ポリアクリルアミド、ラテックス、シリコン、金などの金属、またはセルロースから構成され得、かつオリゴヌクレオチドの共有結合もしくは非共有結合を可能にするまたは増強するために、さらに修飾されてよい。たとえば、固体の支持体の表面は、マレイン酸モエティもしくはコハク酸モエティなどの特定の官能基での修飾によって機能化されてよく、またはアミノ基、チオール基、もしくはアクリレート基などの化学的な反応基での修飾によって、シラン化などによって、誘導体化されてもよい。適切なシラン試薬は、アミノプロピルトリメトキシシラン、アミノプロピルトリエトキシシラン、および4-アミノブチルトリエトキシシランを含む。固体の支持体は、N-ヒドロキシスクシンイミド(NHS)官能基で機能化されてよい。ガラス表面はまた、たとえばエポキシシラン、アクリレートシラン、またはアクリルアミドシランを用いて、アクリレートまたはエポキシなどの他の反応基で誘導体化され得る。オリゴヌクレオチド結合のための、固体の支持体および処理は、好ましくは、繰り返される結合、洗浄、画像化、および溶出の工程に対して安定である。いくつかの例において、固体の支持体は、スライドまたはフローセルであってよい。
【0088】
固体の支持体上の官能基の間隔は、規則正しくてもよく、または無作為でもよい。官能基の規則正しいアレイはフォトリソグラフィによって作製されてよい。規則正しいアレイ中の官能基は、官能基がそれぞれ、任意の他の官能基から少なくとも約200 nm、約250 nm、約300 nm、約350 nm、約400 nm、約450 nm、約500 nm、約550 nm、約600 nm、約650 nm、約700 nm、約750 nm、約800 nm、約850 nm、約900 nm、約950 nm、または約1000 nmであるように、配置されてよい。無作為な間隔の官能基は、官能基が、任意の他の官能基から平均して少なくとも約200 nm、約250 nm、約300 nm、約350 nm、約400 nm、約450 nm、約500 nm、約550 nm、約600 nm、約650 nm、約700 nm、約750 nm、約800 nm、約850 nm、約900 nm、約950 nm、または約1000 nmであるような密集状態で、提供されてよい。
【0089】
固体の支持体などの基材は、間接的に機能化されてよい。たとえば、固体の支持体はPEG化されてよく、かつ官能基は、PEG分子のすべて、またはPEG分子のサブセットに適用されてよい。
【0090】
基材は、金属、ガラス、プラスチック、セラミック、またはそれらの組み合わせを含む、任意の素材を含んでよい。いくつかの好ましい態様において、固体の支持体は、フローセルであり得る。フローセルは、単一の層、または複数の層から構成され得る。たとえばフローセルは、基部層(たとえばホウケイ酸ガラス製のもの)、基部層を覆うチャンネル層(たとえばエッチングされたシリコン製のもの)、およびカバーのまたは最上部の層を含み得る。それらの層がまとめられて組み立てられると、囲われたチャンネルが形成され得、そしてこれは、カバーの中を通って両端に入口/出口を有する。それぞれの層の厚さは可変であるが、好ましくは約1700 μιη未満である。層は、限定するものではないが、感光性ガラス、ホウケイ酸ガラス、溶融シリケート(fused silicate)、PDMS、またはシリコンを含む、当技術分野において公知の、任意の適した素材から構成され得る。異なる層は、同じ素材から、または異なる素材から、構成され得る。
【0091】
いくつかの態様において、フローセルは、フローセルの底部にチャンネルのための開口部を含み得る。フローセルは、別々に視覚化され得る位置において、多数の、結合する標的のコンジュゲーション部位を含み得る。いくつかの態様において、本発明の態様で使用されるさまざまなフローセルは、異なる数のチャンネル(たとえば1チャンネル、2以上のチャンネル、3以上のチャンネル、4以上のチャンネル、6以上のチャンネル、8以上のチャンネル、10以上のチャンネル、12以上のチャンネル、16以上のチャンネル、または16超のチャンネル)を含み得る。さまざまなフローセルは、異なる深さまたは幅のチャンネルを含み得、これらは1つのフローセル中のチャンネルの間で異なっていてよく、または異なるフローセルのチャンネルの間で異なっていてもよい。1つのチャンネルはまた、深さおよび/または幅が変化し得る。たとえば1つのチャンネルは、チャンネル中の1つまたは複数の場所で、約50 μιη未満の深さ、約50 μιηの深さ、約100 μιη未満の深さ、約100 μιηの深さ、約100 μιから約500 μιηの深さ、約500 μιηの深さ、または約500 μιη超の深さであり得る。チャンネルは、限定するものではないが、円形の、半円形の、長方形の、台形の、三角形の、または卵形の断面を含む、任意の断面形状を有し得る。
【0092】
ペプチドは、固体の支持体に、スポットされ、滴下され、ピペットされ、注がれ、洗浄され、またはそうでなければ適用されてよい。NHSエステルなどのモエティで機能化された固体の支持体の場合には、ペプチドの修飾は必要とされない。代わりのモエティ(たとえばスルフヒドリル、アミン、またはリンカーDNA)で機能化された固体の支持体の場合には、架橋試薬(たとえばスベリン酸ジスクシンイミジル、NHS、スルホンアミド)が使用されてよい。リンカーDNAで機能化された固体の支持体の場合には、標的のペプチドは、相補的なDNAタグで修飾されてよい。
【0093】
光活性化架橋剤は、試料の架橋を固体の支持体上の特定の区域に指向させるために、使用されてよい。光活性化架橋剤は、各試料を固体の支持体の既知の領域に結合させることによってペプチド試料の多重化を可能にするために、使用されてよい。光活性化架橋剤は、たとえばペプチドを架橋する前に蛍光タグを検出することによって、成功裏にタグ付けされたペプチドの特異的な結合を可能にし得る。光活性化架橋剤の例は、限定するものではないが、N-5-アジド-2-ニトロベンゾイルオキシスクシンイミド、スルホスクシンイミジル6-(4'-アジド-2'-ニトロフェニルアミノ)ヘキサノアート、スクシンイミジル4,4'-アジペンタノアート、スルホスクシンイミジル4,4'-アジペンタノアート、スクシンイミジル6-(4,4'-アジペンタンアミド)ヘキサノアート、スルホスクシンイミジル6-(4,4'-アジペンタンアミド)ヘキサノアート、スクシンイミジル2-((4,4'-アジペンタンアミド)エチル)-1,3'-ジチオプロピオナート、およびスルホスクシンイミジル2-((4,4'-アジペンタンアミド)エチル)-1,3'-ジチオプロピオナートを含む。
【0094】
ペプチドは、もう1つの残基によって基材に結合されてよい。いくつかの例において、ペプチドは、N末端、C末端、両方の末端を介して、または内部の残基を介して、結合されてよい。
【0095】
いくつかの態様において、各ペプチド配列は、固有の空間的なアドレスに関連付けられてよい。たとえば、ペプチドが空間的に分離される位置において固体の支持体に結合すると、各ペプチド配列には、座標などによる、指標付きのアドレスが割り当てられ得る。いくつかの例において、あらかじめ割り当てられる固有の空間的なアドレスの格子が、あらかじめ決定されていてよい。いくつかの態様において、各ペプチドの場所が、固体の支持体上の不動の目印に対して決定され得るように、固体の支持体は、容易に同定可能な不動の目印を含んでよい。いくつかの例において、固体の支持体は、表面上に永続的に記された、格子線および/もしくはおよび「起点」または他の基準を有してよい。いくつかの例において、固体の支持体の表面は、それによって、架橋されたペプチドの位置を特定する基準を提供するために、永続的にまたは半永続的に印が付けられていてよい。コンジュゲートされたペプチドの外縁などのパターンそれ自体の形状もまた、各スポットの固有の位置を決定するための基準として使用されてよい。
【0096】
タンパク質を同定するための、親和性試薬の使用
本開示の親和性試薬は、試料中のタンパク質を同定、および定量化するために、使用されてよい。いくつかの例において、アプローチは、以下の3つの局面を含み得る:1) タンパク質および/またはタンパク質断片がコンジュゲートできる、アドレス指定可能な基材;2) 親和性試薬のセット、たとえば各親和性試薬が多様な特異性を有するペプチドに結合し得るもの;ならびに3) 基材中の精確な空間的なアドレスにおけるタンパク質のアイデンティティを推定するために、親和性試薬の結合の特徴についての事前知識、基材中の各アドレスにおける親和性試薬の結合の特異的パターン、および/または混合物(たとえばヒトプロテオーム)中のタンパク質の可能性のある配列のデータベース、という組み合わせを使用することができる、ソフトウェア。いくつかの例において、精確な空間的なアドレスは、固有の空間的なアドレスであってよい。いくつかの態様において、試料中に存在し得る1つまたは複数のエピトープに対して再現性のある親和性を有する親和性試薬が、この方法とともに使用されてよい。アッセイごとに、異なるエピトープに結合する親和性試薬、またはアッセイごとに、エピトープに対する異なる親和性を有する親和性試薬は、この方法に適していない可能性がある。
【0097】
試料
試料は、タンパク質を含む任意の生物学的試料であってよい。試料は、組織もしくは細胞から、または組織もしくは細胞の環境から、採取されてよい。いくつかの例において、試料は、組織生検材料、血液、血漿、細胞外液、培養細胞、培地、破棄された組織、植物性物質、合成タンパク質、古細菌の、細菌の、および/もしくはウイルスの試料、菌糸組織、古細菌、または原生動物であり得る。いくつかの例において、タンパク質は、試料調製の間に、その一次供給源(細胞、組織、血液などの体液、環境試料等)から単離される。タンパク質は、その一次供給源から精製されてもよく、または精製されなくてもよい。いくつかの場合において、一次供給源は、さらなる処理の前にホモジナイズされる。いくつかの場合において、細胞は、RIPAバッファーなどの緩衝液を用いて溶解される。変性緩衝液もまた、この段階で使用されてよい。試料は、脂質および粒子状物質を除去するために、ろ過または遠心分離されてよい。試料はまた、核酸を除去するために精製されてよく、またはRNアーゼおよびDNアーゼで処理されてもよい。試料は、無傷のタンパク質、変性タンパク質、タンパク質断片、または部分的に分解したタンパク質を含んでよい。
【0098】
試料は、疾患または障害を有する対象から採取されてよい。疾患または障害は、感染性疾患、免疫障害もしくは免疫疾患、がん、遺伝性疾患、変性疾患、生活習慣病、損傷、希少疾患、または加齢に関する疾患であり得る。感染性疾患は、細菌、ウイルス、菌類、および/または寄生生物によって引き起こされ得る。がんの非限定的な例は、膀胱がん、肺がん、脳がん、黒色腫、乳がん、非ホジキンリンパ腫、子宮頸がん、卵巣がん、結腸直腸がん、膵臓がん、食道がん、前立腺がん、腎臓がん、皮膚がん、白血病、甲状腺がん、肝臓がん、および子宮がんを含む。遺伝性疾患または障害のいくつかの例は、限定するものではないが、嚢胞性線維症、シャルコー・マリー・トゥース病、ハンチントン病、ポイツ・ジェガース症候群、ダウン症候群、関節リウマチ、およびテイ・サックス病を含む。生活習慣病の非限定的な例は、肥満、糖尿病、動脈硬化症、心臓病、脳卒中、高血圧、肝硬変、腎炎、がん、慢性閉塞性肺疾患(copd)、聴覚の問題、および慢性背痛を含む。損傷のいくつかの例は、限定するものではないが、擦過傷、脳損傷、挫傷、火傷、震とう症、うっ血性心不全、建築現場での傷害、脱臼、動揺胸、骨折、血胸、椎間板ヘルニア、ヒップポインター、低体温症、裂傷、神経が圧迫された状態(pinched nerve)、気胸、肋骨骨折、坐骨神経痛、脊髄損傷、腱・靭帯・筋膜の損傷、外傷性脳損傷、およびむち打ち症を含む。試料は、疾患または障害を有する対象の処置の前および/または後に採取されてよい。試料は、処置の前および/または後に採取されてよい。試料は、処置中または処置計画の間に採取されてよい。複数の試料が、処置の効果を経時的にモニターするために、対象から採取されてよい。試料は、診断用抗体が利用可能ではない感染性疾患を有することが分かっている、またはそれが疑われる対象から、採取されてよい。
【0099】
試料は、疾患または障害を有することが疑われる対象から採取されてよい。試料は、疲労、悪心、体重減少、うずきおよび痛み、衰弱、または健忘などの、原因不明の症状を経験中である対象から、採取されてよい。試料は、原因が明らかな症状を有する対象から採取されてよい。試料は、家族の病歴、年齢、環境曝露、生活習慣上のリスク因子、もしくは他の公知のリスク因子の存在などの因子に起因する疾患または障害を発症するリスクのある対象から、採取されてよい。
【0100】
試料は、胚、胎児、または妊婦から採取されてよい。いくつかの例において、試料は、母親の血漿から単離されたタンパク質を含んでよい。いくつかの例において、試料は、母親の血液中の、循環する胎児細胞から単離されたタンパク質を含んでよい。いくつかの場合において、試料は、羊水から単離されたタンパク質を含んでよい。
【0101】
タンパク質は、エピトープ結合を妨害し得る修飾を除去するために処理されてよい。たとえばタンパク質は、翻訳後グリコシル化を除去するためにグリコシダーゼ処理されてよい。タンパク質は、タンパク質中のジスルフィド結合を還元するために還元剤で処理されてよい。タンパク質は、リン酸基を除去するためにホスファターゼで処理されてよい。除去され得る翻訳後修飾の、他の非限定的な例は、アセテート、アミド基、メチル基、脂質、ユビキチン、ミリストイル化、パルミトイル化、イソプレニル化またはプレニル化(たとえばファルネソールおよびゲラニルゲラニオール)、ファルネシル化、ゲラニルゲラニル化、グリピエーション(glypiation)、リポイル化、フラビンモエティ付着、ホスホパンテテイニル化、ならびにレチニリデンシッフ塩基形成を含む。試料はまた、翻訳後タンパク質修飾を保つために処理されてよい。いくつかの例において、ホスファターゼ阻害剤が試料に加えられてよい。いくつかの例において、ジスルフィド結合を保護するために酸化剤が加えられてよい。
【0102】
次に、タンパク質は完全にまたは部分的に変性されてよい。いくつかの態様において、タンパク質は完全に変性され得る。タンパク質は、界面活性剤、強酸もしくは強塩基、濃縮された無機塩、有機溶媒(たとえばアルコールもしくはクロロホルム)、放射線照射、または熱などの外部ストレスの適用によって変性されてよい。タンパク質は、変性緩衝液の添加により変性されてよい。タンパク質はまた、変性緩衝液中で、沈殿、凍結乾燥、および懸濁されてよい。タンパク質は、加熱により変性されてよい。タンパク質に化学的修飾を生じさせる可能性の低い変性方法が、選ばれ得る。
【0103】
試料のタンパク質は、より短いポリペプチドを産生するために、コンジュゲーションの前または後のいずれかで処理されてよい。残りのタンパク質は、断片を生成するためにプロテイナーゼKなどの酵素で部分的に消化してよく、または無傷のままにしておいてもよい。さらなる例において、タンパク質は、トリプシンなどのプロテアーゼに曝露されてよい。プロテアーゼの追加の例は、セリンプロテアーゼ、システインプロテアーゼ、スレオニンプロテアーゼ、アスパラギン酸プロテアーゼ、グルタミン酸プロテアーゼ、メタロプロテアーゼ、およびアスパラギンペプチドリアーゼを含んでよい。
【0104】
いくつかの場合において、極度に大きいおよび小さいタンパク質(たとえばタイチン)を除去することは有用となり得、そのようなタンパク質はろ過または他の適切な方法によって除去され得る。いくつかの例において、極度に大きいタンパク質は、400 kD、450 kD、500 kD、600 kD、650 kD、700 kD、750 kD、800 kD、または850 kDを超えるタンパク質を含んでよい。いくつかの例において、極度に大きいタンパク質は、約8,000アミノ酸、約8,500アミノ酸、約9,000アミノ酸、約9,500アミノ酸、約10,000アミノ酸、約10,500アミノ酸、約11,000アミノ酸、または約15,000アミノ酸を超えるタンパク質を含んでよい。いくつかの例において、小さいタンパク質は、約10 kD未満、9 kD未満、8 kD未満、7 kD未満、6 kD未満、5 kD未満、4 kD未満、3 kD未満、2 kD未満、または1 kD未満のタンパク質を含んでよい。いくつかの例において、小さいタンパク質は、約50アミノ酸未満、45アミノ酸未満、40アミノ酸未満、35アミノ酸未満、または約30アミノ酸未満のタンパク質を含んでよい。極度に大きいまたは小さいタンパク質は、サイズ排除クロマトグラフィーにより除去され得る。極度に大きいタンパク質は、サイズ排除クロマトグラフィーによって単離され、中間サイズのポリペプチドを産生するためにプロテアーゼで処理され、試料の中間サイズのタンパク質と再度組み合わされてよい。
【0105】
いくつかの場合において、タンパク質はサイズ順に整列されてよい。いくつかの場合において、タンパク質は、タンパク質をマイクロウェル中に分類することによって整列されてよい。いくつかの場合において、タンパク質は、タンパク質をナノウェル中に分類することによって整列されてよい。いくつかの場合において、タンパク質は、タンパク質をSDS-PAGEゲルなどのゲルを通過させることによって整列されてよい。いくつかの場合において、タンパク質は、サイズによる他の分画方法によって整列されてよい。いくつかの場合において、タンパク質は電荷に基づいて分離されてよい。いくつかの場合において、タンパク質は疎水性に基づいて分離されてよい。いくつかの場合において、タンパク質は、他の物理的な特徴に基づいて分離されてよい。いくつかの場合において、タンパク質は変性条件下で分離されてよい。いくつかの場合において、タンパク質は非変性条件下で分離されてよい。いくつかの場合において、分画されたタンパク質の異なる画分は、基材の異なる領域に配置されてよい。いくつかの場合において、分離されたタンパク質の異なる一部分は、基材の異なる領域に配置されてよい。いくつかの場合において、タンパク質試料は、SDS-PAGEゲルにおいて分離され、そして、タンパク質が連続体においてサイズによって分類されるように、SDS-PAGEゲルから基材へと転写されてよい。いくつかの場合において、タンパク質試料は、サイズに基づいて3つの画分に分類されてよく、かつ該3つの画分はそれぞれ、基材上の第1、第2、および第3の領域に適用されてよい。いくつかの場合において、本明細書において記載されるシステムおよび方法において使用されるタンパク質は、分類されていてよい。いくつかの場合において、本明細書において記載されるシステムおよび方法において使用されるタンパク質は、分類されていなくてよい。
【0106】
タンパク質は、試料を多重化することを可能にするために、たとえば同定可能なタグで、タグ付けされてよい。同定可能なタグのいくつかの非限定的な例は、以下を含む:フルオロフォアまたは核酸バーコード化された塩基リンカー。使用されるフルオロフォアは、GFP、YFP、RFP、eGFP、mCherry、tdtomato、FITC、Alexa Fluor 350、Alexa Fluor 405、Alexa Fluor 488、Alexa Fluor 532、Alexa Fluor 546、Alexa Fluor 555、Alexa Fluor 568、Alexa Fluor 594、Alexa Fluor 647、Alexa Fluor 680、Alexa Fluor 750、Pacific Blue、クマリン、BODIPY FL、Pacific Green、Oregon Green、Cy3、Cy5、Pacific Orange、TRITC、Texas Red、R-フィコエリスリン、アロフィコシアニン(Allophcocyanin)などの蛍光タンパク質、または当技術分野において公知の他のフルオロフォアを含んでよい。
【0107】
任意の数のタンパク質試料が多重化され得る。たとえば多重化された反応は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、約20、約25、約30、約35、約40、約45、約50、約55、約60、約65、約70、約75、約80、約85、約90、約95、約100、または100超の初期試料からのタンパク質を含んでよい。同定可能なタグは、各タンパク質を、その由来の試料に関して調べる手段を提供してよく、または異なる試料からのタンパク質を、固体支持体上の異なる区域に隔離するように誘導してもよい。
【0108】
基材
いくつかの態様において、タンパク質はその後、タンパク質を基材に化学的に付着させるために、機能化された基材に適用される。いくつかの場合において、タンパク質は、ビオチンの付着を介して基材に付着されてよい。いくつかの場合において、タンパク質は、核酸の付着を介して基材に付着されてよい。いくつかの態様において、タンパク質には仲介物質が適用されてよく、その後仲介物質は基材に付着する。いくつかの場合において、タンパク質は、その後に表面(たとえばチオール化された表面)の上に捕捉され得るビーズ(たとえば金ビーズ)にコンジュゲートされてよい。いくつかの場合において、タンパク質1つが各ビーズにコンジュゲートされてよい。いくつかの場合において、タンパク質はビーズにコンジュゲートされてよく(たとえばビーズ1つにつきタンパク質1つ)、かつビーズは表面上に捕捉されてよい(たとえばマイクロウェルおよび/またはナノウェル中で)。
【0109】
基材は、固体支持体を形成することができる任意の基材であってよい。本明細書において使用されるように、基材、または固体基材とは、タンパク質が共有結合的または非共有結合的に付着できる、任意の固体表面を指し得る。固体基材の非限定的な例は、粒子、ビーズ、スライド、装置の構成要素の表面、膜、フローセル、ウェル、チャンバー、マクロ流体チャンバーを含み、平面であるかもしくは湾曲しているか、または他の形状を有し得、かつ平滑であり得るかもしくは凹凸を有し得る。いくつかの場合において、基材の表面はマイクロウェルを含んでよい。いくつかの場合において、基材の表面はナノウェルを含んでよい。いくつかの場合において、基材の表面は、1つまたは複数のナノウェルと組み合わせた1つまたは複数のマイクロウェルを含んでよい。いくつかの態様において、基材は、ガラス、デキストランなどの糖類、ポリスチレンもしくはポリプロピレンなどのプラスチック、ポリアクリルアミド、ラテックス、シリコン、金などの金属、またはセルロースから構成され得、かつオリゴヌクレオチドの共有結合的もしくは非共有結合的付着を可能にするまたは増強するために、さらに修飾されてよい。たとえば、基材の表面は、マレイン酸モエティもしくはコハク酸モエティなどの特定の官能基での修飾によって機能化されてよく、またはアミノ基、チオール基、もしくはアクリレート基などの化学的な反応基での修飾によって、たとえばシラン化によって、誘導体化されてもよい。適切なシラン試薬は、アミノプロピルトリメトキシシラン、アミノプロピルトリエトキシシラン、および4-アミノブチルトリエトキシシランを含む。基材は、N-ヒドロキシスクシンイミド(NHS)官能基で機能化されてよい。ガラス表面はまた、たとえばエポキシシラン、アクリレートシラン、またはアクリルアミドシランを用いて、アクリレートまたはエポキシなどの他の反応基で誘導体化され得る。オリゴヌクレオチド付着のための基材および処理は、好ましくは、繰り返される結合、洗浄、画像化、および溶出の各工程に対して安定である。いくつかの例において、基材はスライドまたはフローセルであってよい。
【0110】
官能基の規則正しいアレイは、たとえばフォトリソグラフィ、ディップペンナノリソグラフィー、ナノインプリントリソグラフィ、ナノスフェアリソグラフィ、ナノボールリソグラフィ、ナノピラーアレイ、ナノワイヤリソグラフィ、走査型プローブリソグラフィ、熱化学リソグラフィ、熱走査型プローブリソグラフィ、局所酸化ナノリソグラフィ、分子自己集合、ステンシルリソグラフィ、または電子線リソグラフィによって作製されてよい。規則正しいアレイ中の官能基は、官能基がそれぞれ、任意の他の官能基から200ナノメートル(nm)未満であるように、または約200 nm、約225 nm、約250 nm、約275 nm、約300 nm、約325 nm、約350 nm、約375 nm、約400 nm、約425 nm、約450 nm、約475 nm、約500 nm、約525 nm、約550 nm、約575 nm、約600 nm、約625 nm、約650 nm、約675 nm、約700 nm、約725 nm、約750 nm、約775 nm、約800 nm、約825 nm、約850 nm、約875 nm、約900 nm、約925 nm、約950 nm、約975 nm、約1000 nm、約1025 nm、約1050 nm、約1075 nm、約1100 nm、約1125 nm、約1150 nm、約1175 nm、約1200 nm、約1225 nm、約1250 nm、約1275 nm、約1300 nm、約1325 nm、約1350 nm、約1375 nm、約1400 nm、約1425 nm、約1450 nm、約1475 nm、約1500 nm、約1525 nm、約1550 nm、約1575 nm、約1600 nm、約1625 nm、約1650 nm、約1675 nm、約1700 nm、約1725 nm、約1750 nm、約1775 nm、約1800 nm、約1825 nm、約1850 nm、約1875 nm、約1900 nm、約1925 nm、約1950 nm、約1975 nm、約2000 nm、もしくは2000 nm超であるように、配置されてよい。無作為な間隔の官能基は、官能基が、任意の他の官能基から平均して少なくとも約50 nm、約100 nm、約150 nm、約200 nm、約250 nm、約300 nm、約350 nm、約400 nm、約450 nm、約500 nm、約550 nm、約600 nm、約650 nm、約700 nm、約750 nm、約800 nm、約850 nm、約900 nm、約950 nm、約1000 nm、または100 nm超であるような密集状態で、提供されてよい。
【0111】
基材は、間接的に機能化されてよい。たとえば、基材はPEG化されてよく、かつ官能基がPEG分子のすべて、またはPEG分子のサブセットに適用されてよい。加えて、上述のように、いくつかの場合において、ビーズ(たとえば金ビーズ)がコンジュゲートされてよく、かつその後ビーズは、表面(たとえばチオール化された面)上に捕捉されてよい。いくつかの場合において、タンパク質1つが各ビーズにコンジュゲートされてよい。いくつかの場合において、タンパク質はビーズにコンジュゲートされてよく(たとえばビーズ1つにつきタンパク質1つ)、かつビーズは表面上に捕捉されてよい(たとえばマイクロウェルおよび/またはナノウェル中で)。
【0112】
基材は、マイクロスケールのまたはナノスケールの構造(たとえばマイクロウェル、ナノウェル、マイクロピラー、単一分子アレイ、ナノボール、ナノピラー、もしくはナノワイヤなどの規則正しい構造)のために適した技術を用いて、機能化されてよい。いくつかの場合において、基材は、異なるサイズのマイクロウェルを有してよい。いくつかの場合において、マイクロウェルは、1マイクロメートル(μm)であってよく、約2 μm、約3 μm、約4 μm、約5 μm、約6 μm、約7 μm、約8 μm、約9 μm、約10 μm、約15 μm、約20 μm、約25 μm、約30 μm、約35 μm、約40 μm、約45 μm、約50 μm、約55 μm、約60 μm、約65 μm、約70 μm、約75 μm、約80 μm、約85 μm、約90 μm、約95 μm、約100 μm、約105 μm、約110 μm、約115 μm、約120 μm、約125 μm、約130 μm、約135 μm、約140 μm、約145 μm、約150 μm、約155 μm、約160 μm、約165 μm、約170 μm、約175 μm、約180 μm、約185 μm、約190 μm、約195 μm、約200 μm、約205 μm、約210 μm、約215 μm、約220 μm、約225 μm、約230 μm、約235 μm、約240 μm、約245 μm、約250 μm、約255 μm、約260 μm、約265 μm、約270 μm、約275 μm、約280 μm、約285 μm、約290 μm、約295 μm、約300 μm、約305 μm、約310 μm、約315 μm、約320 μm、約325 μm、約330 μm、約335 μm、約340 μm、約345 μm、約350 μm、約355 μm、約360 μm、約365 μm、約370 μm、約375 μm、約380 μm、約385 μm、約390 μm、約395 μm、約400 μm、約405 μm、約410 μm、約415 μm、約420 μm、約425 μm、約430 μm、約435 μm、約440 μm、約445 μm、約450 μm、約455 μm、約460 μm、約465 μm、約470 μm、約475 μm、約480 μm、約485 μm、約490 μm、約495 μm、約500 μm、または500 μm超であってもよい。いくつかの場合において、基材は、サイズが5 μm~500 μmの範囲であるマイクロウェルを有してよい。いくつかの場合において、基材は、サイズが約5 μm~約500 μmの範囲であるマイクロウェルを有してよい。いくつかの場合において、基材は、サイズが10 μm~100 μmの範囲であるマイクロウェルを有してよい。いくつかの場合において、基材は、サイズが約10 μm~約100 μmの範囲であるマイクロウェルを有してよい。いくつかの場合において、基材は、異なるサイズのタンパク質が異なるサイズのマイクロウェル中に分類され得るように、ある範囲の異なるサイズのマイクロウェルを有してよい。いくつかの場合において、基材中のマイクロウェルは、サイズによって分布されてよい(たとえば、より大きいマイクロウェルが第1の領域に分布され、かつより小さいマイクロウェルが第2の領域に分布される)。いくつかの場合において、基材は、約10の異なるサイズのマイクロウェルを有してよい。いくつかの場合において、基材は、約20の異なるサイズ、約25の異なるサイズ、約30の異なるサイズ、約35の異なるサイズ、約40の異なるサイズ、約45の異なるサイズ、約50の異なるサイズ、約55の異なるサイズ、約60の異なるサイズ、約65の異なるサイズ、約70の異なるサイズ、約75の異なるサイズ、約80の異なるサイズ、約85の異なるサイズ、約90の異なるサイズ、約95の異なるサイズ、約100の異なるサイズ、または100超の異なるサイズの、マイクロウェルを有してよい。
【0113】
いくつかの場合において、基材は、異なるサイズのナノウェルを有してよい。いくつかの場合において、ナノウェルは、約100ナノメートル(nm)、約150 nm、約200 nm、約250 nm、約300 nm、約350 nm、約400 nm、約450 nm、約500 nm、約550 nm、約600 nm、約650 nm、約700 nm、約750 nm、約800 nm、約850 nm、約900 nm、約950 nmであるか、または950 nm~1マイクロメートルの間であってよい。いくつかの場合において、基材は、サイズが100 nm~1マイクロメートルの範囲であるナノウェルを有してよい。いくつかの場合において、基材は、サイズが100 nm~500 nmの範囲であるナノウェルを有してよい。いくつかの場合において、基材は、異なるサイズのタンパク質が異なるサイズのナノウェル中に分類され得るように、ある範囲の異なるサイズのナノウェルを有してよい。いくつかの場合において、基材中のナノウェルは、サイズによって分布されてよい(たとえば、より大きいナノウェルが第1の領域に分布され、かつより小さいナノウェルが第2の領域に分布される)。いくつかの場合において、基材は、約10の異なるサイズのナノウェルを有してよい。いくつかの場合において、基材は、約20の異なるサイズ、または30超の異なるサイズのナノウェルを有してよい。
【0114】
いくつかの場合において、基材は、異なるサイズのタンパク質が異なるサイズのナノウェルおよび/またはマイクロウェルに分類され得るように、ある範囲の異なるサイズのナノウェルおよび/またはマイクロウェルを有してよい。いくつかの場合において、基材中のナノウェルおよび/またはマイクロウェルは、サイズによって分布されてよい(たとえば、より大きいマイクロウェルが第1の領域に分布され、かつより小さいナノウェルが第2の領域に分布される)。いくつかの場合において、基材は、約10の異なるサイズのナノウェルおよび/またはマイクロウェルを有してよい。いくつかの場合において、基材は、約20の異なるサイズ、約25の異なるサイズ、約30の異なるサイズ、約35の異なるサイズ、約40の異なるサイズ、約45の異なるサイズ、約50の異なるサイズ、約55の異なるサイズ、約60の異なるサイズ、約65の異なるサイズ、約70の異なるサイズ、約75の異なるサイズ、約80の異なるサイズ、約85の異なるサイズ、約90の異なるサイズ、約95の異なるサイズ、約100の異なるサイズ、または100超の異なるサイズの、ナノウェルおよび/またはマイクロウェルを有してよい。
【0115】
基材は、金属、ガラス、プラスチック、セラミック、またはそれらの組み合わせを含む、任意の素材を含んでよい。いくつかの好ましい態様において、固体基材はフローセルであり得る。フローセルは、単一の層、または複数の層から構成され得る。たとえばフローセルは、基部層(たとえばホウケイ酸ガラス製のもの)、基部層を覆うチャンネル層(たとえばエッチングされたシリコン製のもの)、およびカバー層または最上部層を含み得る。それらの層が共に組み立てられると、囲われたチャンネルが形成され得、該チャネルは、カバーを通って両端に入口/出口を有する。それぞれの層の厚さは可変であるが、好ましくは約1700 μιη未満である。層は、限定するものではないが、感光性ガラス、ホウケイ酸ガラス、溶融シリケート(fused silicate)、PDMSまたはシリコンを含む、当技術分野において公知の任意の適した素材から構成され得る。異なる層は、同じ素材から、または異なる素材から、構成され得る。
【0116】
いくつかの態様において、フローセルは、フローセルの底部にチャンネルのための開口部を含み得る。フローセルは、別々に視覚化され得る位置において、何百万もの付着された標的コンジュゲーション部位を含み得る。いくつかの態様において、本発明の態様で使用されるさまざまなフローセルは、異なる数のチャンネル(たとえば1チャンネル、2以上のチャンネル、3以上のチャンネル、4以上のチャンネル、6以上のチャンネル、8以上のチャンネル、10以上のチャンネル、12以上のチャンネル、16以上のチャンネル、または16超のチャンネル)を含み得る。さまざまなフローセルは、異なる深さまたは幅のチャンネルを含み得、これらは1つのフローセル中のチャンネルの間で異なっていてよく、または異なるフローセルのチャンネルの間で異なっていてもよい。1つのチャンネルはまた、深さおよび/または幅が変化し得る。たとえば1つのチャンネルは、チャンネル中の1つまたは複数の場所で、約50 μιη未満の深さ、約50 μιηの深さ、約100 μιη未満の深さ、約100 μιηの深さ、約100 μιから約500 μιηの深さ、約500 μιηの深さ、または約500 μιη超の深さであり得る。チャンネルは、限定するものではないが、円形の、半円形の、長方形の、台形の、三角形の、または卵形の断面を含む、任意の断面形状を有し得る。
【0117】
タンパク質は、基材に、スポットされてよく、滴下されてよく、ピペットされてよく、注がれてよく、洗浄されてよく、または他の方法で適用されてよい。NHSエステルなどのモエティで機能化された基材の場合には、タンパク質の修飾は必要とされない。代わりのモエティ(たとえばスルフヒドリル、アミン、またはリンカー核酸)で機能化された基材の場合には、架橋試薬(たとえばスベリン酸ジスクシンイミジル、NHS、スルホンアミド)が使用されてよい。リンカー核酸で機能化された基材の場合には、試料のタンパク質は、相補的な核酸タグで修飾されてよい。
【0118】
いくつかの場合において、タンパク質は核酸にコンジュゲートされてよい。核酸を用いて核酸ナノボールが形成され得、それによりタンパク質に核酸ナノボールを連結させる。核酸ナノボールが基材に付着する場合、核酸に付着したタンパク質は、核酸ナノボールを介して基材に付着する。DNAナノボールは、基材に(たとえば吸着によってまたはコンジュゲーションによって)付着し得る。基材は、核酸ナノボールが付着できる、アミンで機能化された表面を有してよい。
【0119】
いくつかの場合において、核酸ナノボールは、機能的に活性な末端(たとえばマレイミド、NHS-エステル等)を有して形成されてよい。タンパク質はその後ナノボールにコンジュゲートされてよく、それによりタンパク質に核酸ナノボールを連結させる。核酸ナノボールが基材に付着する場合、核酸に付着したタンパク質は、核酸ナノボールを介して基材に付着する。DNAナノボールは、基材に(たとえば吸着によってまたはコンジュゲーションによって)付着し得る。基材は、核酸ナノボールが付着できる、アミンで機能化された表面を有してよい。
【0120】
光活性化架橋剤は、試料の架橋を基材上の特定の区域に指向させるために使用されてよい。光活性化架橋剤は、各試料を基材の既知の領域に付着させることによってタンパク質試料の多重化を可能にするために、使用されてよい。光活性化架橋剤は、たとえばタンパク質を架橋する前に蛍光タグを検出することによって、成功裏にタグ付けされたタンパク質の特異的な付着を可能にし得る。光活性化架橋剤の例は、限定するものではないが、N-5-アジド-2-ニトロベンゾイルオキシスクシンイミド、スルホスクシンイミジル6-(4'-アジド-2'-ニトロフェニルアミノ)ヘキサノアート、スクシンイミジル4,4'-アジペンタノアート、スルホスクシンイミジル4,4'-アジペンタノアート、スクシンイミジル6-(4,4'-アジペンタンアミド)ヘキサノアート、スルホスクシンイミジル6-(4,4'-アジペンタンアミド)ヘキサノアート、スクシンイミジル2-((4,4'-アジペンタンアミド)エチル)-1,3'-ジチオプロピオナート、およびスルホスクシンイミジル2-((4,4'-アジペンタンアミド)エチル)-1,3'-ジチオプロピオナートを含む。
【0121】
試料はまた、各試料の結合を基材上の別々の区域に制限することによって、多重化されてよい。たとえば、基材はレーンに編成されてよい。多重化のための別の方法は、試料を反復的に基材の全域に適用することであり、各試料適用の後、非特異的なタンパク質結合試薬または色素を利用するタンパク質検出工程が続く。いくつかの場合において、色素の例は、SYPRO(登録商標)Ruby、SYPRO(登録商標)Orange、SYPRO(登録商標)Red、SYPRO(登録商標)Tangerine、およびCoomassie(商標)Fluor Orangeなどの、蛍光タンパク質ゲル染色剤を含んでよい。
【0122】
試料の各添加後にすべてのタンパク質の位置を追跡することにより、基材上の各位置が最初にタンパク質を含んだ段階を決定することが可能であり、したがって当該タンパク質が由来する試料を決定することが可能である。この方法はまた、試料の各適用後の基材の飽和状態を決定し得、かつ基材上のタンパク質結合の最大化を可能にする。たとえば、機能化された位置の30%のみが、試料の第1の適用後にタンパク質によって占有されるとすると、その後、同じ試料の第2の適用、または異なる試料の適用のいずれかが、なされてよい。
【0123】
ポリペプチドは、もう1つの残基によって基材に付着されてよい。いくつかの例において、ポリペプチドは、N末端、C末端、両方の末端を介して、または内部の残基を介して、付着されてよい。
【0124】
永続的な架橋剤に加えて、いくつかの適用に関して光切断性リンカーを使用すること、およびそうすることによって分析後に基材からタンパク質を選択的に抽出することを可能にすることは、適切であり得る。いくつかの場合において、光切断性架橋剤は、いくつかの異なる多重化試料に使用されてよい。いくつかの場合において、光切断性架橋剤は、多重化された反応中の1つまたは複数の試料から使用されてよい。いくつかの場合において、多重化された反応は、永続的な架橋剤を介して基材に架橋された対照試料、および光切断性架橋剤を介して基材に架橋された実験試料を含んでよい。
【0125】
コンジュゲートされた各タンパク質は、コンジュゲートされた各タンパク質が光学的に解像可能であるように、コンジュゲートされた他のタンパク質それぞれから空間的に分離されてよい。タンパク質はしたがって、固有の空間的アドレスを用いて、個々にラベルされてよい。いくつかの態様において、これは、各タンパク質分子が他のタンパク質分子それぞれから空間的に分離されるように低い濃度のタンパク質および基材上の低い密度の付着部位を用いるコンジュゲーションによって、達成され得る。例として、光活性化架橋剤が使用される場合、タンパク質があらかじめ決定されている位置に付加されるように、光パターンが使用されてよい。
【0126】
いくつかの方法において、精製されたバルクタンパク質は、精製されたタンパク質を同定するために、基材にコンジュゲートされ、かつ本明細書において記載される方法を用いて処理されてよい。バルクタンパク質は、共に収集された、精製されたタンパク質を含んでよい。いくつかの例において、バルクタンパク質は、コンジュゲートされた各タンパク質または各バルクタンパク質が光学的に解像可能であるように、コンジュゲートされた他のタンパク質それぞれまたは他のバルクタンパク質それぞれから空間的に分離された位置にコンジュゲートされてよい。タンパク質またはバルクタンパク質は、したがって、固有の空間的アドレスを用いて個々にラベルされてよい。いくつかの態様において、これは、各タンパク質分子が他のタンパク質分子それぞれから空間的に分離されるように低い濃度のタンパク質および基材上の低い密度の付着部位を用いるコンジュゲーションによって、達成され得る。例として、光活性化架橋剤が使用される場合、1つまたは複数のタンパク質があらかじめ決定されている位置に付加されるように、光パターンが使用されてよい。
【0127】
いくつかの態様において、各タンパク質は、固有の空間的アドレスに関連付けられてよい。たとえば、タンパク質が空間的に分離される位置において基材に付着すると、各タンパク質には、座標などによる、インデックス付きアドレスが割り当てられ得る。いくつかの例において、あらかじめ割り当てられる固有の空間的アドレスの格子が、あらかじめ決定されていてよい。いくつかの態様において、各タンパク質の配置が基材上の固定マークに対して決定され得るように、基材は、容易に同定可能な固定マークを含んでよい。いくつかの例において、基材は、表面上に永続的に記された、格子線および/もしくはおよび「起点」または他の基準を有してよい。いくつかの例において、基材の表面は、架橋されたタンパク質の位置を特定するための基準を提供するために、永続的にまたは半永続的にマークが付けられていてよい。コンジュゲートされたポリペプチドの外縁などのパターンそれ自体の形状もまた、各スポットの固有の位置を決定するための基準として使用されてよい。
【0128】
基材はまた、コンジュゲートされたタンパク質標準物および対照を含んでよい。コンジュゲートされたタンパク質標準物および対照は、既知の位置にコンジュゲートされた、既知の配列のペプチドまたはタンパク質であってよい。いくつかの例において、コンジュゲートされたタンパク質標準物および対照は、アッセイにおける内部対照として役立ち得る。該タンパク質は、精製されたタンパク質ストックから基材へと適用されてよく、または核酸プログラマブルタンパク質アレイ(Nucleic Acid-Programmable Protein Array)(NAPPA)などの処理によって基材上で合成されてよい。
【0129】
いくつかの例において、基材は蛍光標準物を含んでよい。これらの蛍光標準物は、アッセイ間の蛍光シグナルの強度を較正するために使用されてよい。これらの蛍光標準物はまた、蛍光シグナルの強度を、ある区域に存在するフルオロフォアの数と相関させるために、使用されてもよい。蛍光標準物は、アッセイにおいて使用される異なる種類のフルオロフォアのいくつかまたはすべてを含んでよい。
【0130】
親和性試薬
基材に試料からのタンパク質がコンジュゲートされると、複数の親和性試薬測定を実施することが可能である。本明細書において記載される測定のプロセスは、本明細書において記載されるさまざまな親和性試薬を利用してよい。
【0131】
結合測定
修飾された親和性試薬のセットおよびコンジュゲートされた基材が与えられると、親和性試薬は、基材に反復的に適用されてよい。各測定サイクルは、いくつかの段階からなる。第1の段階において、親和性試薬が基材に適用され、該基材において親和性試薬はコンジュゲートされたタンパク質に吸着し得る。
【0132】
次に、非特異的結合を除去するために、基材は軽く洗浄され得る。この洗浄工程は、固定化されたタンパク質に結合した親和性試薬が溶出しない条件下で実施され得る。この工程で使用され得る緩衝液のいくつかの例は、リン酸緩衝生理食塩水、トリス緩衝生理食塩水、Tween20を添加したリン酸緩衝生理食塩水、およびTween20を添加したトリス緩衝生理食塩水を含む。
【0133】
吸着に続き、修飾された各親和性試薬の結合アドレスが、親和性試薬に直接的にコンジュゲートされているフルオロフォアの測定、または親和性試薬にコンジュゲートされている核酸鎖に対する相補核酸にコンジュゲートされているフルオロフォアの測定などによって決定される。検出方法は、検出モエティの選択によって決定される。フルオロフォアおよび生物発光モエティは光学的に検出され得、いくつかの場合において、二次検出試薬が必要とされる。基材上で固定化された各タンパク質の固有のアドレスは、結合測定の前に決定されてよく、または固定化されたタンパク質を含むアドレスのリストが、結合測定によって生成されてもよい。
【0134】
次に、親和性試薬は、よりストリンジェントな洗浄によって脱離され得る。この洗浄工程は、いくつかのまたはすべての親和性試薬を、固定化基材から除去し得る。いくつかの場合において、親和性試薬は除去を促進する目的で、低い~中間の結合親和性を有するように選ばれていてよい。使用された親和性試薬は、再使用のために再捕捉されてよく、または破棄されてもよい。例として、切断可能な検出モエティを有する親和性試薬が使用される場合、検出モエティは、この段階で切断され、かつ除去されてよい。ストリンジェントな洗浄に続き、いくつかの例において、残存する蛍光はどれも消光され得、さらによりストリンジェントな洗浄が、残りの親和性試薬を除去するために適用され得る。持ち越し/混入は、次の親和性試薬を適用する前に基材を再画像化することによって検出され得る。混入はまた、繰り返し生じるシグナルについて画像を連続してモニタリングすることによって検出されてもよい。これにより、分析の1サイクルが完結する。
【0135】
いくつかの態様において、蛍光タグ付けされた親和性試薬は、活性化波長の強い光への長時間の曝露により、消光されてよい。蛍光タグの消光は、親和性試薬を除去するための洗浄工程と置き換えてよい。いくつかの態様において、どのシグナルが先のn-1回のサイクルに由来するものだったのかを識別するためにn種のフルオロフォアを反復させることは、望ましいことであり得る。
【0136】
各親和性試薬のために、またはその多重化のために、サイクルを継続する。測定段階の結果は、各親和性試薬の結合座標、または各座標位置で結合した親和性試薬を列挙する、非常に大きな表であり、たとえば図10を参照のこと。
【0137】
分析
タンパク質同定の最後の工程は、座標に結合した親和性試薬についての情報から、基材の各座標における各タンパク質の、最も可能性が高いアイデンティティを決定するためのソフトウェアツールを含んでよい。ソフトウェアは、各親和性試薬の結合の特徴についての情報を利用してよい。たとえば、ある所与の親和性試薬が、トリペプチドエピトープAAAを含むタンパク質に選択的に結合するとする。各親和性試薬の結合の特徴、試料中のタンパク質のデータベース、および結合した座標のリスト、結合のパターンについての情報が与えられると、ソフトウェアツールは、アイデンティティの信頼性とともに、蓋然的なアイデンティティを各座標に割り当てる。親和性試薬とタンパク質との間の精確な1-1マッピングという極端な場合には、これは、単純なルックアップテーブルで達成され得る。しかしながら、結合がより複雑な場合には、これは適切な充足問題を解くことによって実施されてよい。結合の特徴が高度に複雑な場合には、期待値最大化アプローチが採用されてよい。
【0138】
ソフトウェアはまた、各親和性試薬が結合しなかったいくつかのまたはすべての位置のリストを利用し得、存在するタンパク質を決定するために、エピトープの非存在についてのこの情報を使用し得る。ソフトウェアはまた、親和性試薬が各アドレスに結合したこと、および結合しなかったことについての情報を利用し得る。したがってソフトウェアは、エピトープが存在していたこと、およびエピトープが存在していなかったことの両方についての情報を使用し得る。ソフトウェアはデータベースを含んでよい。データベースは、試料が得られた種におけるいくつかのまたはすべての既知のタンパク質の配列を含んでよい。たとえば、試料がヒト由来のものであることが既知であるとすると、いくつかのまたはすべてのヒトタンパク質の配列を有するデータベースが使用されてよい。試料の種が未知であるならば、いくつかのまたはすべてのタンパク質配列のデータベースが使用されてよい。データベースはまた、いくつかのまたはすべての既知のタンパク質変種および変異体タンパク質の配列、ならびにDNAフレームシフト変異から生じ得るいくつかのまたはすべての可能性のあるタンパク質の配列を含んでよい。データベースはまた、未成熟終止コドンからまたは分解から生じ得る、可能性のある切断型タンパク質の配列を含んでよい。
【0139】
ソフトウェアは、機械学習、深層学習、統計的学習、教師あり学習、教師なし学習、クラスタリング、期待値最大化、最尤推定、ベイズ推論、線形回帰、ロジスティック回帰、二項分類、多項分類、または他のパターン認識アルゴリズムなどの、1つまたは複数のアルゴリズムを含んでよい。たとえばソフトウェアは、(i)各親和性試薬の結合の特徴の情報、(ii)試料中のタンパク質のデータベースの情報、(iii)結合座標のリストの情報、および/または(iv)親和性試薬のタンパク質への結合のパターンの情報を(たとえば1つまたは複数のアルゴリズムの入力として)分析する1つまたは複数のアルゴリズムを、(a)各座標の蓋然的なアイデンティティならびに/または(b)信頼性(たとえばアイデンティティの信頼水準および/もしくは信頼区間)を(たとえば1つまたは複数のアルゴリズムの出力として)生成するまたは割り当てる目的のために、実施してよい。機械学習アルゴリズムの例は、サポートベクターマシン(SVM)、ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)、深層ニューラルネットワーク、カスケードニューラルネットワーク、k-近傍(k-NN)分類、ランダムフォレスト(RF)、ならびに他の種類の分類木および回帰木(CART)を含んでよい。
【0140】
ソフトウェアは、各アドレスにおけるタンパク質のアイデンティティがあらかじめ決定されている基材上で本開示の方法を実施することにより、訓練されてよい。たとえばソフトウェアは、核酸プログラマブルタンパク質アレイ(Nucleic Acid-Programmable Protein Array)またはエピトープタイリングアレイを訓練用データセットとして用いて、訓練されてよい。
【0141】
結合アッセイからの生データは、標識された親和性試薬の未知のタンパク質への結合測定がそれから導き出される、一連の画像を含んでよい。これらの結合測定は、アッセイされるタンパク質のアイデンティティを推定するために、その後使用されてよい。いくつかの態様において、これらの結合測定は、アッセイされる各タンパク質のアイデンティティを推定するために使用されてよい。いくつかの態様において、これらの結合測定は、アッセイされるタンパク質のアイデンティティに関連する特徴を提供するために使用されてよい。いくつかの態様において、タンパク質の推定は、以下の3種類の情報に基づいて決定されてよい:1) 親和性試薬の特定のタンパク質への結合測定、2) 候補タンパク質配列のリスト、および3) 各親和性試薬の各候補タンパク質への結合の予想される程度について、おおむね正確な予測がそれから導き出され得る、情報。本明細書において論じられる方法は、親和性試薬の統計学的モデルを提供するものであり、任意のタンパク質との親和性試薬の結合の蓋然性が、所定のタンパク質の一次配列が与えられると、該モデルからコンピューターで計算され得る。いくつかの態様において、統計学的モデルは、タンパク質の集団のそれぞれへの、親和性試薬の一連の結合測定を用いて、訓練されてよい。これらのタイプのアプローチは、直接の実験的測定が利用可能ではない場合に、親和性試薬とタンパク質との結合の、測定および/または特徴を予測するために、使用されてよい。たとえば、これらの方法は、タンパク質の集団中におけるタンパク質の数が、実験的測定を決定することが極端に時間またはコストがかかるものであるような場合に、使用されてよい。
【0142】
第一に、結合測定は、複数のポリペプチドまたはタンパク質に対する親和性試薬に関してもたらされてよい。これらの結合測定は、統計学的モデルを訓練するために使用され得るものであり、何らかの任意のタンパク質への親和性試薬の結合が、その一次配列が与えられると、該モデルから予測され得る。そのような測定をもたらすための方法は、限定するものではないが、ELISAアッセイ、フローサイトメトリーアッセイ、タンパク質アレイへの結合、ペプチドアレイへの結合、および表面プラズモン共鳴アッセイを含む。タンパク質の結合は、タンパク質配列におけるJエピトープのそれぞれの計測数と、該エピトープへの親和性試薬の結合の、タンパク質レベルの結合測定への細分化されている寄与との、線形結合として、モデル化されてよい。これは、以下のように表現され得る:
式中:
Mpr = 親和性試薬のタンパク質prへの結合測定
ct,pr = タンパク質prにおけるエピトープtの計測数
βt = エピトープtへの親和性試薬の、細分化されている結合の寄与
【0143】
複数のタンパク質に対する親和性試薬についての測定は、線形方程式系を形成する:
式中:
は、各タンパク質について観測される結合測定を含む長さNの列ベクトルである。
Cは、エピトープ計測数のN x Jの行列であり、ここで各列は、測定される各タンパク質における特定のエピトープについての計測数である。
は、試薬の、可能性のある各エピトープへの細分化されている結合の、長さJの列ベクトルである。
εは、バックグラウンドの結合、またはノイズフロアを補正するための、スカラー定数である。
【0144】
モデルを、非標準的なアミノ酸を含むように、または異なるタイプのエピトープ(たとえば、1残基、二量体、三量体、4マー、5マー)をモデル化するように、拡張することは容易である。既知のタンパク質への結合測定の場合は、
およびCは既知の変数であり、かつ
およびεの値は、線形回帰または関連するアプローチによって導き出され得る。特に、非負の最小二乗法、ならびに非負の最小絶対収縮および選択演算子(LASSO)回帰は、この問題に対して好適であり得る。非負の最小二乗法は、解
が非負であるように束縛し、そして非負のLASSO回帰は、スパース性制約をさらに課す。LASSO回帰は、系が劣決定である場合に、つまり、測定される独特なタンパク質の数が、独特なエピトープの数未満である場合に、特に効果的である。
が決定されたら、cの値を生成するためにタンパク質の配列における各エピトープを計数することによって、および結合親和性測定の予測を生成するために総和
を評価することによって、結合測定の予測が、任意のタンパク質についてなされ得る。
【0145】
これは、タンパク質の親和性試薬への結合をモデル化する手法の単なる一例である。これらのデータは、タンパク質の一次配列、または一次配列の派生物(たとえばアミノ酸組成、三量体の計測数、予測される三次元構造)のいずれかからタンパク質の結合親和性を予測する任意のモデルを訓練するために、使用されてよい。別の例は、非線形モデル、たとえば三量体の親和性を、観測されるタンパク質結合の測定に関連づける指数関数をともなうものや、またはタンパク質レベルの親和性を生成するために三量体レベルの親和性が乗じられる乗法モデルを用いる工程を、含み得る。別の例として、ニューラルネットワークが、タンパク質の結合親和性を、タンパク質配列からまたは三量体の組成から予測するために、使用され得る。加えて、サポートベクター回帰モデルが、タンパク質の結合親和性を、タンパク質配列からまたは三量体の組成から予測するために、使用され得る。
【0146】
試料の特徴の決定
デコーディングが完了すると、各アドレスにコンジュゲートされたタンパク質の蓋然的なアイデンティティが定義される。その結果として、混合物中のそれらの存在量が、計数観察により推定され得る。したがって、混合物中に存在する各タンパク質のリスト、およびそのタンパク質の観察数が、収集され得る。
【0147】
さらに、光切断性リンカー、または他の型の特異的に切断可能なリンカーが、タンパク質を基材に付着させるために使用されたならば、関心対象の特定のタンパク質は、その後基材から外され、さらなる調査のために収集されてよい。たとえば特定のタンパク質は、同定され、さらなる調査のために溶出されてよい。本開示の方法はまた、混合物から望ましいタンパク質を精製および/または単離する手段として役立ち得る。いくつかの場合において、該方法は、特定のアイソタイプまたは翻訳後修飾されたタンパク質を精製および/または単離することが可能であり得る。可能性のあるタンパク質および関連付けられる配列の完全なリストが利用可能ではない試料においては、本方法は、識別されるタンパク質グループ中の、異なるタンパク質を識別することが可能であり得、これらはその後さらなる調査のために溶出することができる。たとえば、腸マイクロバイオーム試料などの、多くの未知のタンパク質を含む高度に複雑な試料については、本明細書において記載される方法は、質量分析の前に試料を分画するために使用されてよい。いくつかの場合において、タンパク質は、いったんそれらのアイデンティティが判定できたら、基材から溶出されてよい。タンパク質が同定されたときにそれらを基材から除去することにより、そのアイデンティティがまだ判定できないタンパク質のためにその後の親和性試薬結合のラウンドを続けることが可能となり、かつバックグラウンドノイズおよび残りのラウンドについての標的外のシグナルが低下し得る。いくつかの例において、特定のタンパク質に特異性を有する1種または複数種の親和性試薬が、血液試料中の血清アルブミンまたは免疫グロブリンなどの多量に存在するタンパク質を同定するために、第1ラウンドとして使用されてよく、これらの多量に存在するタンパク質は、処理の初期に除去されてよい。いくつかの場合において、基材上のタンパク質のサブセットは、親和性試薬結合の各ラウンドの後に、または親和性試薬結合の2、3、4、5、6、7、8、9、10、15、20ラウンドごと、もしくは20を超えるラウンドごとの後に、除去されてよい。信号対雑音比は、タンパク質溶出の各ラウンドの後に増加し得る。
【0148】
いくつかの場合において、未同定のタンパク質は、それらの結合パターンに基づき、グループ化またはクラスター化されてよい。たとえば、いくつかの場合において、試料中に存在するタンパク質は、配列データベース中に示されていないことがある。未同定のタンパク質は、各グループが試料中の同じ配列を有する未知のタンパク質のセットを含むことを目的として、親和性プローブへのそれらの結合パターンに基づいてグループへとクラスター化されてよい。タンパク質の量は各グループについて推定されてよく、かつ、限定するものではないが、健康な状態と疾患状態との間での差次的な定量化、縦断分析、またはバイオマーカー発見を含む定量的分析に含めてよい。いくつかの場合において、未同定のグループは、質量分析による同定のために、基材から選択的に外されてよい。他の場合においては、未同定のグループは、信頼性のある同定を生成するために特異的に設計されたさらなる結合親和性測定実験を実施することによって、同定されてよい。
【0149】
いくつかの場合において、タンパク質またはタンパク質のセットが除去された後で、基材に追加の試料を加えることが可能であってよい。たとえば血清アルブミンは、試料中のタンパク質の約半分を占め得る、血清中に多量に存在するタンパク質であり、親和性試薬結合の第1ラウンド後に血清アルブミンを除去することは、基材にさらなる血液試料を添加することを可能にし得る。いくつかの態様において、基材に試料を固定化する前に、たとえば免疫沈降または親和性カラム精製を介して、多量に存在するタンパク質を除去することが選ばれ得る。
【0150】
タンパク質修飾は、本開示の方法を用いて同定され得る。たとえば翻訳後修飾は、酵素処理(たとえばホスファターゼ処理)を取り入れた、修飾に特異的な検出試薬を用いる検出の反復サイクルによって、同定されてよい。異なる修飾に特異的な親和性試薬が、固定化されたタンパク質におけるそのような修飾の非存在の存在を決定するために、使用されてよい。該方法はまた、各タンパク質が所与の修飾を有する例および有さない例の数の定量化を可能にする。
【0151】
タンパク質中の変異は、試料タンパク質の結合パターンと、予測されるタンパク質のアイデンティティとの間の不一致を照合することにより、検出されてよい。たとえば、1つの親和性試薬の結合を除いて既知のタンパク質の親和性試薬結合プロファイルと一致する、基材上の固定化されたタンパク質またはポリペプチドは、1アミノ酸置換を有し得る。親和性試薬は重複したエピトープを有し得るので、固定化されたタンパク質は、1アミノ酸置換だけを有していても、予測される親和性結合パターンとのいくつかの不整合を有し得る。未成熟終止コドンのフレームシフトを引き起こすDNA変異もまた、検出され得る。
【0152】
必要な親和性試薬の数は、試料中に存在するエピトープの総数より少なくてよい。たとえば、仮に、各親和性試薬が1つの独特な3ペプチドエピトープを認識するように親和性試薬が選択された場合、試料中の、可能性のあるエピトープすべてを認識するための親和性試薬の総セットは、20 x 20 x 20 = 8000種となる。しかしながら本開示の方法は、それら親和性試薬の、約100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、または6000種だけを、必要とし得る。いくつかの場合において、該方法は、約500、1000、2500、3000、3500、4000、4500、5000、5500、または6000種未満の親和性試薬だけを必要とし得る。図13は、各親和性試薬の結合能力の関数としての、独特なアミノ酸3マーに特異的なx種の親和性試薬のセットが与えられた場合に同定され得る公知のヒトタンパク質のパーセンテージを実証するシミュレーションの結果を示す。図13に示されるように、ヒトタンパク質の98%が、8000種の3マー親和性試薬、および10%の結合可能性で、一意的に同定され得る。
【0153】
本開示の方法は、高度に正確であり得る。本開示の方法は、約90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.9%、または99.9%超の正確性をもって各タンパク質を同定することが可能であり得る。
【0154】
本開示の方法は、約90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.9%、または99.9%超の信頼性をもって、各タンパク質のアイデンティティを予測することが可能であり得る。信頼度は、試料中の異なるタンパク質で異なっていてよい。たとえば、独自性の非常に高い配列を有するタンパク質は、他のタンパク質に高度に類似したタンパク質と比べ、より高い信頼性をもって同定され得る。いくつかの場合において、タンパク質は、あるタンパク質ファミリーの一員として、高い信頼性をもって同定され得るが、しかしながら該タンパク質の厳密なアイデンティティは、より低い信頼性をもって予測されてよい。いくつかの場合において、極度に大きいまたは極度に小さいタンパク質は、より中程度のサイズのタンパク質と比べ、より低い信頼性をもって予測されてよい。
【0155】
いくつかの場合において、タンパク質は、あるタンパク質ファミリーの一員として、高い信頼性をもって同定され得るが、しかしながら該タンパク質の厳密なアイデンティティは、より低い信頼性をもって予測されてよい。たとえば、1つのアミノ酸変異を含むタンパク質は、当該タンパク質の標準型から、高い信頼性をもって区別することが困難であり得る。この場合は、標準配列も1つのアミノ酸変異を含む型も高い信頼性を有さない可能性があるが、しかし、未知のタンパク質が、両方の配列を含むタンパク質グループの一員であることについて、高い信頼性が評価され得る。類似の状況が、タンパク質が、類似の配列を有する複数の関連するアイソフォームを有し得る例において、生じ得る。
【0156】
本開示の方法は、所与の試料中のいくつかのまたはすべてのタンパク質を同定することが可能であり得る。本開示の方法は、試料中のタンパク質の、約90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.9%、または99.9%超を同定することが可能であり得る。
【0157】
本開示の方法は、試料中のタンパク質を速やかに同定することが可能であり得る。本開示の方法は、1日あたり、フローセル1つにつき約100個超、約1000個超、約5000個超、約10000個超、約20,000個超、約30,000個超、約40,000個超、約50,000個超、約100,000個超、1,000,000個超、約10,000,000個超、約100,000,000個超、約1,000,000,000個超、約10,000,000,000個超、約100,000,000,000個超、約1,000,000,000,000個超のタンパク質を同定することが可能であり得る。本開示の方法は、1日あたり、フローセル1つにつき約1010個超、1011個超、1012個超、1013個超、1014個超、1015個超、1016個超、1017個超、または約1017個超のタンパク質を同定することが可能であり得る。本開示の方法は、1日あたり、フローセル1つにつき約1010~1012個、1011~1014個、1012~1016個、または1013~1017個のタンパク質を同定することが可能であり得る。本開示の方法は、1日あたり、フローセル1つにつき、約10 pg、約20 pg、約30 pg、約40 pg、約50 pg、約60 pg、約70 pg、約80 pg、約90 pg、約100 pg、約300 pg、約300 pg、約400 pg、約500 pg、約600 pg、約700 pg、約800 pg、約900 pg、約1 ng、約2 ng、約3 ng、約4 ng、約5 ng、約6 ng、約7 ng、約8 ng、約8 ng、約10 ng、約10 ng、約20 ng、約30 ng、約40 ng、約50 ng、約60 ng、約70 ng、約80 ng、約90 ng、約100 ng、約300 ng、約300 ng、約400 ng、約500 ng、約600 ng、約700 ng、約800 ng、約900 ng、約1 μg、約2 μg、約3 μg、約4 μg、約5 μg、約6 μg、約7 μg、約8 μg、約8 μg、約10 μg、約10 μg、約20 μg、約30 μg、約40 μg、約50 μg、約60 μg、約70 μg、約80 μg、約90 μg、約100 μg、約300 μg、約300 μg、約400 μg、約500 μg、約600 μg、約700 μg、約800 μg、約900 μgの、または約1 mg超のタンパク質中の、95%超のタンパク質を同定することが可能であり得る。
【0158】
本開示の方法は、実験的処置の後でプロテオームを評価するために使用され得る。本開示の方法は、治療的介入の効果を評価するために使用され得る。
【0159】
本開示の方法は、バイオマーカーの発見のために使用され得る。疾患を有する対象および疾患を有さない対象においてプロテオーム発現をモニターすることにより、バイオマーカーを同定し得る。疾患を発症する前の対象において、または疾患を発症するリスクのある対象において、プロテオーム発現をモニターすることにより、リスクを予測するバイオマーカーを同定し得る。対象のプロテオーム発現を評価することにより、対象の健康状態、またはある疾患もしくは障害を発症するリスクが示され得る。本開示の方法は、治療法を評価するために、または薬剤/治療法への応答者を非応答者から区別するために、使用され得る。本開示の方法は、個別化医療向けの特定の使用のためのものであり得る。
【0160】
本開示の方法は、疾患を診断するために使用され得る。異なる疾患または疾患段階は、タンパク質発現の異なるパネルに関連付けられてよい。タンパク質発現の異なるパネルが、所与の処置それぞれの異なる処置成果に関連付けられてよい。対象のプロテオーム発現データは、対象を診断するために、および/または最も適切な治療法を選択するために、使用され得る。
【0161】
本開示の方法は、試料が由来する個体または種を同定するために使用され得る。たとえば本開示の方法は、試料が、実際に主張される種または供給源に由来するのかどうかを決定するために使用され得る。本明細書において記載される方法は、タンパク質が豊富だが核酸に乏しい試料において、PCRに基づく方法に対して優位性を有し得る。たとえば、本開示の方法は、蜂蜜試料の由来を同定するのに有用であり得る。さらなる例としては、本開示の方法は、食品の安全性および食品の品質制御を評価するために使用され得る。
【0162】
本開示の方法は、可能性のあるタンパク質の数よりも少ない親和性試薬を用いて、タンパク質分子のプールからの任意のタンパク質1分子を同定するために、使用され得る。たとえば該方法は、親和性試薬のパネルを用いて、n種の可能性のあるタンパク質のプールからの未同定のタンパク質1分子を、閾値を上回る確実性をもって同定してよく、ここでパネル中の親和性試薬の数はmであり、かつmはn未満である。未同定のタンパク質は、既知のタンパク質配列および遺伝子配列に対応する既知のタンパク質であってよく、または既知のタンパク質配列も遺伝子配列もない未知のタンパク質であってもよい。未知のタンパク質の場合、この方法は、未知のタンパク質のシグネチャーを同定し得、したがって、アミノ酸配列ではなく、未知のタンパク質の存在および量を同定し得る。本開示の方法は、n種の可能性のあるタンパク質のプールから選択される未同定のタンパク質を同定することができる、m種の親和性試薬のパネルを選択するために使用され得る。本明細書において開示される方法はまた、m種の結合試薬を用いて、タンパク質の混合物中のn種のタンパク質を一意的に同定しかつ定量化することができ、かつここで各タンパク質は、m種の結合試薬のサブセットによる結合の独特なプロファイルによって同定される。さらに、mは、nの約2分の1未満、3分の1未満、4分の1未満、5分の1未満、6分の1未満、7分の1未満、10分の1未満、20分の1未満、50分の1未満、または100分の1未満であってよい。さらなる例としては、本開示は、親和性試薬のパネルが、少なくとも約100、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、12,000、14,000、16,000、18,000、20,000、25,000、30,000、35,000、40,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、2,000,000、3,000,000、4,000,000、または5,000,000個の異なるタンパク質のそれぞれを一意的に同定することができるよう、約100種未満、200種未満、300種未満、400種未満、500種未満、600種未満、700種未満、800種未満、900種未満、1000種未満、1500種未満、2000種未満、2500種未満、3000種未満、3500種未満、または4000種未満の親和性試薬のパネルを選択するために、使用されてよい。
【0163】
本開示の方法は、プロテオーム中のタンパク質の大部分を同定することが可能であり得る。本開示の方法は、哺乳類の、鳥類の、魚類の、両生類の、爬虫類の、脊椎動物の、無脊椎動物の、植物の、菌類の、細菌の、または古細菌のプロテオーム中の、タンパク質の大部分を同定することが可能であり得る。本開示の方法は、プロテオーム中のタンパク質の、約5%超、10%超、15%超、20%超、25%超、30%超、35%超、40%超、45%超、50%超、55%超、60%超、65%超、70%超、75%超、80%超、85%超、90%超、95%超、96%超、97%超、98%超、99%超を同定することが可能であり得る。
【実施例
【0164】
実施例1:独特な3マーペプチドに結合する抗体を用いるタンパク質の同定
プロテオームにおけるすべてのエピトープのセットのカバレッジのパーセンテージと、本開示の方法を用いて同定され得るプロテオームのパーセンテージとの間の関係性を決定するために、コンピューターによる実験を実施した。この実験のため、すべての3マーアミノ酸エピトープのセットを選択した。タンパク質修飾は考慮しなかった。20種の天然のアミノ酸が存在するので、すべての3マーエピトープの総セットは、20 x 20 x 20 = 8000種の、可能なエピトープとなる。シミュレーションのため、xを、1つの実験でスクリーニングされるエピトープの数として設定し、1から8000までのxの各値について、x種のエピトープのセットを無作為に選択し、同定され得るプロテオームのパーセンテージを算出した。図13は、このシミュレーションの結果を示す。
【0165】
実施例2:独特な3マーペプチドに結合する抗体を用いるタンパク質の同定
可同定性およびカバレッジにおける親和性試薬の数の影響力を決定するために、コンピューターによるさらなる実験を実施した。タンパク質の、可能性のあるカバレッジそれぞれについて、同定され得るプロテオームのパーセンテージ(y軸)を示すために、親和性試薬プールのサイズの範囲についてデータ系列を算出した。その結果は表1に示される。たとえば、100アミノ酸のタンパク質は、98個の3マーアミノ酸エピトープ「着地点」を有し、仮にそれら3マーアミノ酸エピトープの20%が結合される場合に、それはそのタンパク質を同定するために十分であり得るかまたは十分ではない可能性がある。図15に示すように、250種の3マー特異的親和性試薬の親和性試薬プールにより、仮に各タンパク質の着地点の20%が結合される場合、プロテオームのわずか約7%が同定され得る。8000種の親和性試薬の親和性試薬プールの場合は、20%の着地点が結合されると、プロテオームの約98%が同定され得る。
【0166】
(表1)可同定性 対 プロテオームのカバレッジにおける、3マーd-コードプローブ数の影響力
【0167】
実施例3:基材上にコンジュゲートされた発光タンパク質分子
蛍光タンパク質試料であるフィコエリスリンを、インキュベーションチャンバー内で4度で4時間、NHS-エステルでコートされたカバースリップに直接的にコンジュゲートした。蛍光タンパク質試料をその後、Hamamatsu orca flash 4.0カメラを備えたLeica DMi8上で、300 msの露光時間を用いて画像化した。図16Aおよび16Bは、結果として得られたキャプチャー画像を示す(明確性のため色は反転した)。図16Aおよび16Bに示されるように、暗いスポットはそれぞれ、タンパク質の存在を示す蛍光シグナルの区域を表す。図16B図16Aの拡大図である。図16B中の矢印は、バックグラウンドノイズから明確に識別可能な、タンパク質を表すシグナルを示す。
【0168】
第2のタンパク質試料である緑色蛍光タンパク質を変性させ、インキュベーションチャンバー内で4度で4時間、NHS-エステルでコートされたカバースリップに直接的にコンジュゲートした。最初の画像化は、ベースラインの残存蛍光を示さず、これは緑色蛍光タンパク質の完全な変性を示した。タンパク質をその後、Alexa-Fluor 647が付着している抗ペプチド抗体とインキュベートした。抗ペプチド抗体をその後、0.1% Tween-20でリンスした。これをその後、Andor NEO sCMOSカメラを備えたNikon Eclipse TiでTIRFを用いて画像化した。図17は、結果として得られたキャプチャー画像を示す(明確性のため色は反転した)。
【0169】
実施例4:タンパク質の同定
緑色蛍光タンパク質、RNASE1、LTF、およびGSTM1という、可能性のある4つのタンパク質のプロテオームを、図18に表す。この例においては、このプロテオームからの未知のタンパク質1分子を、基材上のある場所にコンジュゲートする。この未知のタンパク質を、9つの異なる親和性試薬のパネルによって順次調べる。該9つの異なる親和性試薬のそれぞれは、異なるアミノ酸三量体[AAA、AAC、AAD、AEV、GDG、QSA、LAD、TRK、DGD]を認識し、かつそれぞれは蛍光色素で標識されている。未知のタンパク質には親和性試薬DGD、AEV、LAD、GDG、およびQSAが結合することが決定される。このプロテオームの4つのタンパク質の配列の分析により、GFPのみが、これらの3アミノ酸モチーフの5つすべてを含むことが示され、これらのモチーフには、図18の配列において下線が引かれている。したがって、未知のタンパク質1分子がGFPタンパク質であることが決定される。
【0170】
実施例5:実施例の遂行
この実施例においては、アレイ上にそれぞれ3~5個の複製物が含まれる720個の独特なタンパク質を含む核酸プログラマブルタンパク質アレイ(NAPPA)への、親和性試薬の結合測定を検討する。いくつかの態様において、これらの複製物は、アレイの全域にわたって散在していてよい。結合は、蛍光標識された親和性試薬をアレイとハイブリダイズさせること、およびアレイ上の各スポットにおいて観測される蛍光を測定することによって、評価する。この実施例においては、各スポットにおける各タンパク質のアイデンティティは既知である。したがって、蛍光は、タンパク質のアイデンティティへと写像され得る。
【0171】
この実施例においては、タンパク質配列における8000個の可能性のある三量体のそれぞれの計測数と、該三量体への親和性試薬の結合に起因して観測される蛍光への細分化されている寄与との、線形結合として、タンパク質の結合測定(蛍光)をモデル化する。それは以下である:
式中:
Fpr = タンパク質prについての蛍光
ct,pr = タンパク質prにおける三量体tの計測数
βt = 三量体tへの親和性試薬の結合からの、細分化されている蛍光
【0172】
複数のタンパク質に対する親和性試薬についての測定は、線形方程式系を形成する:
式中:
は、各タンパク質について観測される蛍光を含む、長さNの列ベクトルである。
Cは、三量体計測数のN x 8000の行列であり、ここで各列は、測定される各タンパク質における特定の三量体についての計測数である。
は、可能性のある各三量体についての細分化されている蛍光の、長さ8000の列ベクトルである。
εは、バックグラウンドの結合、またはノイズフロアを補正するための、スカラー定数である。
【0173】
本明細書において記載されるモデルは、非標準的なアミノ酸を含むように、または異なる長さのnマーをモデル化するように、拡張されてよい。既知のNAPPAまたは類似の結合測定の場合は、
およびCは既知の変数であり、かつ
およびεの値は、線形回帰または関連するアプローチによって導き出され得る。特に、非負の最小二乗法、ならびに非負の最小絶対収縮および選択演算子(LASSO)回帰は、この問題に対して好適であり得る。非負の最小二乗法は、解
が非負であるように束縛し、そして非負のLASSO回帰は、スパース性制約をさらに課す。LASSO回帰は、系が劣決定である場合に、つまり、測定される独特なタンパク質の数が、独特な三量体の数(この例においては8,000個)未満である場合に、特に効果的であり得る。
【0174】
前述のNAPPAアレイへの結合は、以下の相対的な親和性を有する親和性試薬に関してシミュレートした:
すべての他の三量体への結合は、親和性0.00001が割り当てられた。
【0175】
NAPPAアレイ上での各タンパク質への結合は、記載される統計学的モデル、およびガウスノイズが適用され、予想される結合親和性の5%の標準偏差を有する、前述の結合親和性を用いて、予想される結合を算定することによって、シミュレートした。
【0176】
これらのシミュレートされたデータから、LASSOを使用して(LASSOスパース性パラメーターαを1e-3にセットして)、タンパク質結合測定から試薬の結合親和性を学習させた。学習された親和性は、以下のとおりであった:
ここで、すべての他の三量体は、ゼロの親和性を有する。
【0177】
この実施例は、該アプローチが、許容可能な量のノイズを有しながらも、親和性試薬結合の妥当な判断を下すことができることを示す。
【0178】
実施例6:KW親和性試薬の選択
4つの異なる標的エピトープ -KW、LFQ、IRN、およびEGE- のいずれかに結合するアプタマーを選択するために、親和性試薬の選択スクリーニングを行った。標的に結合するアプタマーを、アプタマーライブラリーから選択するために、アレイに基づく表面プラズモン共鳴画像化選択を使用した。予備的な検証を、標的KWに結合するアプタマーについて行った。図6は、表面プラズモン共鳴によって測定された、5つの上位ヒットの、KW標的への結合を示す。図7は、陰性対照ペプチドと比較した、最良の抗KWアプタマーの結合を示す。
【0179】
上位の抗KWアプタマーのエピトープ特異性を図6から決定するために、アプタマーを、蛍光標識し、そしてペプチドアレイに適用した。標識されたアプタマーのペプチドアレイへの結合に基づき、該アプタマーによって認識されるエピトープは、KWおよびKRであって両方に対して比較的類似の親和性を有していることが、決定された。結合データ、および予備的なモチーフ分析を、図8に示す。
【0180】
実施例7:高スループット配列決定・蛍光リガンド相互作用プロファイリング(High-throughput Sequencing Fluorescent Ligand Interaction Profiling)
高スループット配列決定・蛍光リガンド相互作用プロファイリングアッセイは、アプタマーライブラリーを得ること、およびライブラリーのアプタマーの両端にアダプター配列を組み込むことによって、行った。アダプターを有するアプタマーのライブラリーを、固定化されたオリゴプライマーを含むフローセルに適用し、そしてクラスター増幅を、図10に表されるように行った。クラスター増幅後、クラスター(それぞれアプタマーライブラリーからの1つのアプタマーを表す)は、可逆的色素ターミネーターを用いて配列決定した。クラスターはその後、配列決定試薬を除去するために変性させ、洗浄し、そしてそれらの天然のアプタマー立体構造へと折りたたまれるようにした。蛍光標識されたペプチド標的を、4種類の異なる濃度でクラスターに適用し、そして蛍光標識されたペプチド標的が結合したクラスターを示すために、画像化した。図11は、結合した、蛍光標識されたペプチド標的と、2つの異なる濃度とを有するフローセルの、代表的な画像を示す。蛍光データは、フローセル上に表されるアプタマーライブラリーの各アプタマーについての親和性測定を提供するために、配列決定データと組み合わせた。図12は、蛍光標識されたペプチド標的(LFQ)に対する、いくつかの異なるアプタマーの配列および結合親和性を示す。
【0181】
実施例8:ペプチド合成および検証
材料:
すべての試薬および溶媒は、ペプチド合成グレードのもの、または利用可能な最高純度のものであった。アミノ酸誘導体は、Aapptech(Louisville, KY USA)から入手し、かつペプチド合成用のすべての溶媒、SPE、およびRP±HPLCは、Acros Organics, USAから入手した。
【0182】
ペプチド合成:
ペプチドは、標準的なFmoc/tBu化学を採用して、MultiPep RSiシンセサイザー(Intavis, Germany)において合成した。アミノ酸誘導体は、N,N,N′,N′-テトラメチル-O-(1H-ベンゾトリアゾール-1-イル)ウロニウムヘキサフルオロホスファート(HBTU)(0.5M)によって活性化した。ペプチドを合成するために、標準的な合成プロトコルを、96ベッセルマイクロリアクションブロックにおいて採用した。リンクアミドレジン(Intavis, Germany)を、0.53 mmol/gのアミン含量で、ベッセル1つにつき2マイクロモル添加した。
【0183】
ペプチドを合成するために、以下の追加のシーケンスを使用した:
【0184】
Fmoc-リジン(ビオチン)(0.3M)を除き、すべてのアミノ酸誘導体を、DMF中の0.5M溶液として使用した。
【0185】
N-メチルピペリジンを、DMF中の2M溶液として使用し、無水酢酸を、DMF中の5%溶液(0.529M)として使用した。カップリングは各サイクルについて30分間続け、そして各ビルディングブロックについて2回繰り返した。アミノ酸は、完全なカップリングを確実にするため、アミンに対して10倍過剰で使用した。ペプチドは、トリフルオロ酢酸(TFA)中の5%水、2.5%トリイソプロピルシランの溶液を用いて、室温で2時間切断し、tert-ブチルメチルエーテルを用いて-20度で沈殿させ、そして冷tert-ブチルメチルエーテル(200 ul)を用いて3回洗浄した。乾燥させたペプチドは、1 mLの0.1%TFA水溶液(500マイクロリットル)中に溶解し、そして-20度で保管した。
【0186】
固相抽出
粗ペプチドは、マルチ96バキュームマニホールド(Waters, USA)を用いて、各ウェル中に40 mgのC18溶媒を含むSep-Pak C18マルチ96ウェルプレート(WAT054955)上で、精製した。溶出液は、2 mLのコレクションラック(WAT058956)に収集した。典型的なプロトコルにおいて、カートリッジまたはプレートは、1mlのMeOHを用いて洗浄し、そして、ペプチド試料を添加する前に、0.1%TFA水溶液を用いて調整した。ペプチドは、ほぼ定量的なペプチド結合を達成するために、バキューム無しで固定相にわたって溶液をゆっくりと通過させることによって、添加した。固相は、結合したペプチドが1 mLの70%アセトニトリル水溶液とともに溶出される前に、塩および他の極性不純物を除去するために、0.1%TFA水溶液を用いて洗浄した。溶媒は、Centrivapを用いて一晩蒸発させ、そしてペレットは、500マイクロリットルのDI水中に再溶解した。濃度は、Tecan Sparkプレートリーダーを用いて、水をブランクとして用い、そして200~1000 nmの範囲の吸収スペクトルを収集して、測定した。ペプチドの濃度を算定するために、214 nmでの吸収係数および減衰係数を使用した。ペプチドの濃度を測定するために、UV透過96ウェルプレート(ThermoFisher 8404)を使用した。
【0187】
質量分析:
マトリックス溶液は、Agilent Technologiesから購入した(Cat # G2037A)。試料は、1マイクロリットルのペプチドストック溶液、および1マイクロリットルのマトリックスを、MALDIサンプルプレート上に共にスポットすることによって調製し、そして試料を周囲条件下で乾燥させた。質量スペクトルは、MALDI-TOF質量分析計AB SCIEX 5800 TOF/TOFにおいて記録した。代表的な質量スペクトルを、図9に示す。
【0188】
コンピューター制御システム
本開示は、本開示の方法を遂行するためにプログラムされたコンピューター制御システムを提供する。図14は、タンパク質などの生体高分子を特徴付けし同定するためにプログラムされた、または他の方法で設定された、コンピューターシステム1401を示す。コンピューターシステム1401は、たとえば基材の固有の空間的アドレスでのシグナルを観察する工程;観察されたシグナルに基づき、固有の空間的アドレスにおける、生体高分子の一部分に連結された同定可能なタグの存在を決定する工程;生体高分子の一部分の特徴を決定するために、決定された同定可能なタグを、生体高分子の配列のデータベースと比較して評価する工程などの、試料を評価および分析する本開示のさまざまな局面を統制し得る。コンピューターシステム1401は、ユーザーの電子装置、または電子装置に対して遠隔に位置するコンピューターシステムであり得る。電子装置は携帯型電子装置であり得る。
【0189】
コンピューターシステム1401は中央処理装置(CPU、同じく本明細書における「プロセッサ」および「コンピュータープロセッサ」)1405を含み、これはシングルコアもしくはマルチコアプロセッサ、または並列処理のための複数のプロセッサであり得る。コンピューターシステム1401はまた、メモリーまたはメモリーロケーション1410(たとえばランダムアクセスメモリー、読み出し専用メモリー、フラッシュメモリー)、電子ストレージユニット1415(たとえばハードディスク)、1つまたは複数の他のシステムとの通信のための通信インターフェース1420(たとえばネットワークアダプター)、ならびにキャッシュ、他のメモリー、データストレージおよび/もしくは電子ディスプレイアダプターなどの周辺装置1425を含む。メモリー1410、ストレージユニット1415、インターフェース1420、および周辺装置1425は、マザーボードなどの通信バス(実線)を経由して、CPU 1405と通信する。ストレージユニット1415は、データを記憶するためのデータストレージユニット(またはデータレポジトリ)であり得る。コンピューターシステム1401は、通信インターフェース1420の補助を受けて、コンピューターネットワーク(「ネットワーク」)1430に機能的に連結され得る。ネットワーク1430は、インターネット(the Internet)、インターネット(an internet)および/もしくはエクストラネット、またはインターネット(the Internet)と通信するイントラネットおよび/もしくはエクストラネットであり得る。ネットワーク1430は、いくつかの場合において、電気通信および/またはデータネットワークである。ネットワーク1430は、クラウドコンピューティングなどの分散コンピューティングを可能にし得る1つまたは複数のコンピューターサーバーを含み得る。ネットワーク1430は、いくつかの場合において、コンピューターシステム1401の補助を受けて、コンピューターシステム1401に連結される装置がクライアントまたはサーバーとして機能することを可能にし得るピアトゥピアネットワークを実装し得る。
【0190】
CPU 1405は、プログラムまたはソフトウェアの形で具現化され得る、機械で読み取り可能な指示のシーケンスを実行することができる。指示は、メモリー1410などのメモリーロケーションにおいて記憶されてよい。指示はCPU 1405に向けられ得、これは次いで、本開示の方法を遂行するために、CPU 1405をプログラムし得るまたは他の方法で設定し得る。CPU 1405により実施される作業の例は、フェッチ、デコード、実行、およびライトバックを含み得る。
【0191】
CPU 1405は、集積回路などの回路の一部であり得る。システム1401の1つまたは複数の他の構成要素は、該回路に含まれ得る。いくつかの場合において、該回路は特定用途向け集積回路(ASIC)である。
【0192】
ストレージユニット1415は、ドライバー、ライブラリー、および保存されたプログラムなどのファイルを記憶可能である。ストレージユニット1415は、たとえば、ユーザープリファレンスおよびユーザープログラムといったユーザーデータを記憶可能である。コンピューターシステム1401は、いくつかの場合において、イントラネットまたはインターネット(the Internet)を経由してコンピューターシステム1401と通信する遠隔のサーバーに位置するものなどの、コンピューターシステム1401の外部の、1つまたは複数の追加のデータストレージユニットを含み得る。
【0193】
コンピューターシステム1401は、ネットワーク1430を経由して、1つまたは複数の遠隔のコンピューターシステムと通信可能である。たとえば、コンピューターシステム1401は、ユーザーの遠隔のコンピューターシステムと通信可能である。遠隔のコンピューターシステムの例は、パーソナルコンピューター(たとえば携帯型PC)、スレート型もしくはタブレット型PC(たとえばApple(登録商標)iPad、Samsung(登録商標)Galaxy Tab)、電話機、スマートフォン(たとえばApple(登録商標)iPhone、Androidが作動可能な装置、Blackberry(登録商標))、またはパーソナルデジタルアシスタントを含む。ユーザーは、ネットワーク1430を介してコンピューターシステム1401にアクセス可能である。
【0194】
本明細書において記載されるような方法は、たとえばメモリー1410上または電子ストレージユニット1415上などのコンピューターシステム1401の電子ストレージロケーション上に記憶された、機械(たとえばコンピュータープロセッサ)で実行可能なコードによって、遂行され得る。機械で実行可能なまたは機械で読み取り可能なコードは、ソフトウェアの形で提供され得る。使用の間に、コードはプロセッサ1405によって実行され得る。いくつかの場合において、コードはストレージユニット1415から引き出され得、そしてプロセッサ1405の速やかなアクセスのためにメモリー1410に記憶され得る。いくつかの状況においては、電子ストレージユニット1415は除外され得、かつ機械で実行可能な指示はメモリー1410に記憶される。
【0195】
コードはプリコンパイルされ得、かつコードを実行するために適合されたプロセッサを有する機械での使用のために設定され得るか、または実行時の最中にコンパイルされ得る。コードは、プリコンパイルされる様式または実行時にコンパイルされる(as-compiled)様式でコードを実行することを可能にするように選択され得るプログラミング言語で供給され得る。
【0196】
コンピューターシステム501などの、本明細書において提供されるシステムおよび方法の局面は、プログラミングの形で具現化され得る。技術のさまざまな局面が、機械で読み取り可能な媒体の一種類で運ばれるもしくは具現化される、典型的には機械(もしくはプロセッサ)で実行可能なコードおよび/もしくは関連付けられるデータの形である「物品」または「製品」として、みなされてよい。機械で実行可能なコードは、メモリー(たとえば読み出し専用メモリー、ランダムアクセスメモリー、フラッシュメモリー)またはハードディスクのような、電子ストレージユニット上に記憶され得る。「ストレージ」タイプの媒体は、コンピューター、プロセッサ、もしくは同様のものの有形メモリー、もしくはさまざまな半導体メモリー、テープドライブ、ディスクドライブおよび同様のものなどの関連するそのモジュールの、任意のものまたはすべてを含み得、これらはソフトウェアプログラミングの際にいつでも非一過性ストレージを提供し得る。ソフトウェアのすべてまたは一部分は、インターネット(the Internet)またはさまざまな他の電気通信ネットワークを経由して、時々通信してよい。そのような通信は、たとえば、1つのコンピューターまたはプロセッサから別のものへ、たとえば、マネージメントサーバーまたはホストコンピューターからアプリケーションサーバーのコンピュータープラットフォームへ、ソフトウェアを読み込ませることを可能にし得る。したがって、ソフトウェア要素を運び得る別の種類の媒体は、ローカル装置間の物理的なインターフェースを通過して使用されるもの、有線のおよび光学の固定電話ネットワークを経由して使用されるもの、ならびにさまざまなエアリンクを通じて使用されるものなどの、光波、電波、ならびに電磁波を含む。有線もしくは無線リンク、光学リンク、または同様のものなどの、そのような波を運ぶ物理的な要素もまた、ソフトウェアを運ぶ媒体としてみなされてよい。本明細書において使用されるように、非一過性で有形の「ストレージ」媒体に限定されない限り、コンピューターでまたは機械で「読み取り可能な媒体」などの語は、実行のためのプロセッサへの指示の提供に関与する、任意の媒体を指す。
【0197】
したがって、コンピューターで実行可能なコードなどの機械で読み取り可能な媒体は、限定するものではないが、有形のストレージ媒体、搬送波媒体、または物理的な伝達媒体を含む、多くの形をとり得る。不揮発性のストレージ媒体は、たとえば、任意のコンピューターまたは同様のものにおける任意のストレージ装置などや、図面において示されるデータベース等を実装するために使用され得るものなどの、光学もしくは磁気ディスクを含む。揮発性ストレージ媒体は、コンピュータープラットフォーム等のメインメモリーなどの、ダイナミックメモリーを含む。有形の伝達媒体は、コンピューターシステム中のバスを含む配線を含む、同軸ケーブル;銅線、および光ファイバーを含む。搬送波伝達媒体は、電気信号もしくは電磁信号の形、または無線周波(RF)での、および赤外線での(IR)データ通信の間に生成されるものなどの、音波もしくは光波の形をとってよい。コンピューターで読み取り可能な媒体の一般的な形態は、したがって、たとえば以下を含む:フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード紙テープ、穿孔のパターンを有する任意の他の物理的なストレージ媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、任意の他のメモリーチップもしくはカートリッジ、データもしくは指示を運ぶ搬送波、そのような搬送波を運ぶケーブルもしくはリンク、またはコンピューターが読み込み得るプログラミングコードおよび/もしくはデータからの、任意の他の媒体。コンピューターで読み取り可能な媒体のこれらの形態の多くが、実行のためにプロセッサへ1つまたは複数の指示の1つまたは複数のシーケンスを運ぶことに関与し得る。
【0198】
コンピューターシステム1401は、ユーザーインターフェース(UI)1440を含む電子ディスプレイ1435を含み得る、またはこれと通信し得る。UIの例は、限定するものではないが、グラフィカルユーザーインターフェース(GUI)およびウェブベースのユーザーインターフェースを含む。
【0199】
本開示の方法およびシステムは、1つまたは複数のアルゴリズムによって遂行され得る。アルゴリズムは、中央処理装置1405による実行に際し、ソフトウェアによって遂行され得る。アルゴリズムは、たとえばタンパク質の一部分などの、生体高分子の一部分の特徴および/またはアイデンティティを決定することができる。たとえばアルゴリズムは、候補のタンパク質の一部分などの候補の生体高分子の一部分の最も可能性のあるアイデンティティを決定するために、使用されてよい。
【0200】
いくつかの態様において、多くの異なるタンパク質中に存在する短いエピトープを認識するアプタマーまたはペプタマーは、デジタルアプタマーまたはデジタルペプタマーと称されてよい。本発明の1つの局面は、デジタルアプタマーまたはデジタルペプタマーのセットを提供し、ここで該セットは少なくとも約15種のデジタルアプタマーまたはデジタルペプタマーを含み、該15種のデジタルアプタマーまたはデジタルペプタマーのそれぞれは、連続した3または4または5アミノ酸からなる異なるエピトープに特異的に結合することが特徴付けられており、かつ各デジタルアプタマーまたはデジタルペプタマーは、該デジタルアプタマーまたはデジタルペプタマーが結合する同じエピトープを含む、複数の別個の異なるタンパク質を認識する。いくつかの態様において、デジタルアプタマーまたはデジタルペプタマーのセットは、連続した3アミノ酸からなるエピトープに結合する、100種のデジタルアプタマーまたはデジタルペプタマーを含む。いくつかの態様において、デジタルアプタマーまたはデジタルペプタマーのセットは、連続した4アミノ酸からなるエピトープに結合する、100種のデジタルアプタマーをさらに含む。いくつかの態様において、デジタルアプタマーまたはデジタルペプタマーのセットは、連続した5アミノ酸からなるエピトープに結合する、100種のデジタルアプタマーまたはデジタルペプタマーをさらに含む。いくつかの場合において、デジタル親和性試薬は、抗体、アプタマー、ペプタマー、ペプチド、またはFab断片であってよい。
【0201】
いくつかの態様において、デジタルアプタマーのセットは少なくとも約20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1000種のデジタルアプタマーを含む。いくつかの態様において、デジタルアプタマーのセットは、連続した4アミノ酸からなるエピトープに結合する、少なくとも1000種のデジタルアプタマーを含む。いくつかの態様において、デジタルアプタマーのセットは、連続した5アミノ酸からなるエピトープに結合する、少なくとも100種のデジタルアプタマーをさらに含む。デジタルアプタマーのセットは、連続した3アミノ酸からなるエピトープに結合する、少なくとも100種のデジタルアプタマーをさらに含む。いくつかの態様において、デジタルアプタマーのセットは表面上に固定化される。いくつかの態様において、表面はアレイである。
【0202】
別の局面において、本発明は、複数の異なるタンパク質を含む試料のタンパク質結合プロファイルを生成するための方法を提供し、該方法は、以下の工程を含む:結合を可能にする条件下で、試料を、デジタルアプタマーのセットに接触させる工程であって、デジタルアプタマーのセットは少なくとも約15種のデジタルアプタマーを含み、該15種のデジタルアプタマーのそれぞれは、連続した3または4または5アミノ酸からなる異なるエピトープに特異的に結合することが特徴付けられており、かつ各デジタルアプタマーは、該デジタルアプタマーが結合する同じエピトープを含む、複数の別個の異なるタンパク質を認識する、工程;任意で、未結合のタンパク質を除去する工程;およびタンパク質と該デジタルアプタマーとの結合を検出する工程であって、それによって該試料のタンパク質結合プロファイルが生成される、工程。
【0203】
いくつかの態様において、該方法は、結合を可能にする条件下で試料をデジタルアプタマーのセットに接触させる工程(a)の前に、試料をタンパク質切断剤で処理する工程を、さらに含む。
【0204】
別の局面において、本発明は、それぞれが複数のタンパク質を含む2つ以上の異なる試料のためのタンパク質結合プロファイルのライブラリーを含み、該方法は以下の工程を含む:結合を可能にする条件下で、試料をデジタルアプタマーのセットに接触させる工程であって、デジタルアプタマーのセットは少なくとも約15種のデジタルアプタマーを含み、該15種のデジタルアプタマーのそれぞれは、連続した3または4または5アミノ酸からなる異なるエピトープに特異的に結合することが特徴付けられており、かつ各デジタルアプタマーは、該デジタルアプタマーが結合する同じエピトープを含む、複数の別個の異なるタンパク質を認識する、工程;任意で、未結合のタンパク質を除去する工程;タンパク質とデジタルアプタマーとの結合を検出することによって、試験されている試料のタンパク質結合プロファイルを生成する工程であって、それによってタンパク質結合プロファイルが生成される、工程;および少なくとも2つの試料を用いて上記工程を繰り返す工程。
【0205】
いくつかの態様において、該方法は、結合を可能にする条件下で試料をデジタルアプタマーのセットに接触させる工程の前に、試料をタンパク質切断剤で処理する工程をさらに含む。
【0206】
別の局面において、本発明は、試験試料を特徴付けするための方法を含み、該方法は以下の工程を含む:結合を可能にする条件下で、試験試料をデジタルアプタマーのセットに接触させる工程であって、デジタルアプタマーのセットは少なくとも約15種のデジタルアプタマーを含み、該15種のデジタルアプタマーのそれぞれは、連続した3または4または5アミノ酸からなる異なるエピトープに特異的に結合することが特徴付けられており、かつ各デジタルアプタマーは、該デジタルアプタマーが結合する同じエピトープを含む、複数の別個の異なるタンパク質を認識する、工程;任意で、未結合のタンパク質を除去する工程;タンパク質とデジタルアプタマーとの結合を検出することによって、試験試料のタンパク質結合プロファイルを生成する工程;および試験試料を特徴付けするために、試験試料の生成されたタンパク質結合プロファイルを、参照試料のタンパク質結合プロファイルと比較する工程。
【0207】
別の局面において、本発明は、試験試料中の細菌、ウイルス、または細胞の有無を決定するための方法を含み、該方法は以下の工程を含む:結合を可能にする条件下で、試験試料をデジタルアプタマーのセットに接触させる工程であって、デジタルアプタマーのセットは少なくとも約15種のデジタルアプタマーを含み、該15種のデジタルアプタマーのそれぞれは、連続した3または4または5アミノ酸からなる異なるエピトープに特異的に結合することが特徴付けられており、かつ各デジタルアプタマーは、該デジタルアプタマーが結合する同じエピトープを含む、複数の別個の異なるタンパク質を認識する、工程;任意で、未結合のタンパク質を除去する工程;タンパク質とデジタルアプタマーとの結合を検出することによって、試験試料のタンパク質結合プロファイルを生成する工程であって、それによってタンパク質結合プロファイルが生成される、工程;および試験試料のタンパク質結合プロファイルを参照試料のタンパク質結合プロファイルと比較する工程であって、それによって試験試料中の細菌、ウイルス、または細胞の有無が比較により決定される、工程。
【0208】
別の局面において、本発明は、試料中の試験タンパク質を同定するための方法を含み、該方法は以下の工程を含む:試験タンパク質を含む、または試験タンパク質を含むことが疑われる試料を、少なくとも約15種のデジタルアプタマーを含むデジタルアプタマーのセットに接触させる工程であって、該15種のデジタルアプタマーのそれぞれは、連続した3または4または5アミノ酸からなる異なるエピトープに特異的に結合することが特徴付けられており、かつ各デジタルアプタマーは該デジタルアプタマーが結合する同じエピトープを含む、複数の別個の異なるタンパク質を認識する、工程;および試験タンパク質とデジタルアプタマーのセットとの結合を検出することによって、試験タンパク質のアイデンティティを決定する工程であって、少なくとも約6種のデジタルアプタマーが試験タンパク質に結合し;かつ結合の存在が、試験タンパク質中の少なくとも約6種のエピトープの存在を示し、少なくとも約6種のエピトープのアイデンティティが、試験タンパク質を同定するために使用される、工程。
【0209】
本発明の好ましい態様は本明細書において示されかつ記載されているが、そのような態様が、単なる例として提供されていることは、当業者には明らかである。本発明が、本明細書中に提供される特定の例によって限定されることを目的としているわけではない。本発明は上述の明細書を参照して記載されているが、本明細書における態様の説明および図面は、制限的な意味に解釈されるべきではない。無数の変更、改変、および置き換えが、本発明から逸脱することなく、今や当業者に想起されるであろう。さらに、本発明のすべての局面は、多様な条件および変数に左右される、本明細書において説明される特定の描写、構成、または相対的比率に限定されないことが、理解されるべきである。本明細書において記載される本発明の態様のさまざまな代替物が、本発明を実践する際に採用され得ることが、理解されるべきである。したがって、本発明はまた、任意のそのような代替物、修正形態、変更形態、または等価物を包含することが、企図される。添付の特許請求の範囲は、本発明の範囲を定義し、かつこれらの特許請求の範囲の範囲内の方法および構成、ならびにそれらの等価物がそれにより包含されることを、意図する。
本発明は一態様において以下を提供する。
[項目1]
複数の配列コンテキストにおいて所望のペプチドエピトープに結合する親和性試薬を選択するための方法であって、以下の工程を含む、方法:
ペプチドライブラリーを得る工程であって、各ペプチドは、配列αXβおよび長さkを有し、Xは、長さmの所望のペプチドエピトープである、工程;
ペプチドライブラリーを、複数の特定の親和性試薬に曝露する工程、
ペプチドライブラリー中のどのペプチドが、該特定の親和性試薬によって結合されるのかを決定する工程;ならびに
該特定の親和性試薬が、ペプチドライブラリー中の、閾値より多い数のペプチドに結合する場合に、該特定の親和性試薬を選択するために、ペプチドライブラリーを用いる工程。
[項目2]
ペプチドライブラリーが少なくとも50個のペプチドを含む、項目1に記載の方法。
[項目3]
ペプチドライブラリーが少なくとも100個のペプチドを含む、項目1に記載の方法。
[項目4]
ペプチドライブラリーが少なくとも1,000個のペプチドを含む、項目1に記載の方法。
[項目5]
長さkが、5、6、7、および8アミノ酸残基からなる群より選択される、項目1に記載の方法。
[項目6]
長さmが、2、3、および4アミノ酸残基からなる群より選択される、項目1に記載の方
法。
[項目7]
長さkが長さmと等しい、項目1に記載の方法。
[項目8]
αおよびβのそれぞれが少なくとも1アミノ酸を含む、項目1に記載の方法。
[項目9]
ペプチドライブラリー中の各ペプチドが、長さmの、独特な所望のペプチドエピトープ
を含む、項目1に記載の方法。
[項目10]
複数の配列コンテキストにおいて所望のペプチドエピトープに結合する親和性試薬を選択するための方法であって、以下の工程を含む、方法:
ペプチドライブラリーを得る工程であって、各ペプチドは配列αXβを有し、Xは所望のペプチドエピトープであり、かつαおよびβのそれぞれはアミノ酸を含む、工程;ならびに
親和性試薬を選択するために、ペプチドライブラリーを用いる工程。
[項目11]
αおよびβのそれぞれが1アミノ酸からなる、項目10に記載の方法。
[項目12]
αおよびβのうち少なくとも1つがリンカーを含む、項目10に記載の方法。
[項目13]
αおよびβのうち少なくとも1つが修飾を含む、項目10に記載の方法。
[項目14]
αおよびβのそれぞれが1~3アミノ酸からなる、項目10に記載の方法。
[項目15]
複数の親和性試薬が、項目1に記載の方法を用いて選択される、項目10に記載の方
法。
[項目16]
所望のペプチドエピトープXが2~7アミノ酸である、項目10に記載の方法。
[項目17]
選択される親和性試薬が、抗体、アプタマー、ペプタマー、ペプチド、およびFab断片
からなる群より選択される、項目10に記載の方法。
[項目18]
選択される親和性試薬が、デジタル抗体、デジタルアプタマー、デジタルペプタマー、デジタルペプチド、およびデジタルFab断片からなる群より選択される、項目10に記載
の方法。
[項目19]
以下の工程をさらに含む、項目10記載の方法:
選択される親和性試薬を、所望のエピトープと同じ長さの複数のペプチドに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程。
[項目20]
所望のエピトープと同じ長さの複数のペプチドが、所望のエピトープと同じ長さのペプチドの、可能性のあるすべてのバリエーションの90%に相当する、項目19に記載の方法

[項目21]
以下の工程をさらに含む、項目10に記載の方法:
選択される親和性試薬を、複数のペプチドに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程であって、該複数のペプチドの各ペプチドは、所望のエピトープと、1つまたは複数の隣接残基とを含む、工程。
[項目22]
以下の工程をさらに含む、項目18に記載の方法:
選択される親和性試薬を、第二の複数のペプチドに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程であって、該複数のペプチドの各ペプチドは、項目9の特徴付けする工程において同定される第二のエピトープと、1つまたは複数の隣接残基とを含む、工程。
[項目23]
以下の工程をさらに含む、項目10に記載の方法:
選択される親和性試薬を、所望のエピトープより短い複数のペプチドの複数のサブセットに対してスクリーニングすることによって、選択される親和性試薬の結合を特徴付けする工程。
[項目24]
選択される親和性試薬を、所望のエピトープを含むタンパク質のパネルに対してスクリーニングすることによって、選択される親和性試薬を特徴付けする工程
をさらに含む、項目10に記載の方法。
[項目25]
選択される親和性試薬を、所望のエピトープを含むペプチドのパネルに対してスクリーニングすることによって、選択される親和性試薬を特徴付けする工程
をさらに含む、項目10に記載の方法。
[項目26]
選択される親和性試薬が、それがタンパク質の約10%超に結合する場合に、保持される
、項目25に記載の方法。さらなる請求項を序列の下位の段に追加
[項目27]
選択される親和性試薬が、それがタンパク質の約20%超に結合する場合に、保持される、項目25に記載の方法。
[項目28]
選択される親和性試薬が、それがタンパク質の約30%超に結合する場合に、保持される、項目25に記載の方法。
[項目29]
選択される親和性試薬が、それがタンパク質の約40%超に結合する場合に、保持される、項目25に記載の方法。
[項目30]
選択される親和性試薬が、それがタンパク質の約50%超に結合する場合に、保持される、項目25に記載の方法。
[項目31]
選択される親和性試薬が、それがタンパク質の約75%超に結合する場合に、保持される、項目25に記載の方法。
[項目32]
選択される親和性試薬が、それがタンパク質の約90%超に結合する場合に、保持される、項目25に記載の方法。
[項目33]
選択される親和性試薬を、3アミノ酸エピトープを含まないタンパク質のパネルに対してスクリーニングすることによって、選択される親和性試薬を特徴付けする工程
をさらに含む、項目10に記載の方法。
[項目34]
選択される親和性試薬が、それがタンパク質の約15%未満に結合する場合に、保持される、項目33に記載の方法。
[項目35]
選択される親和性試薬が、それがタンパク質の約10%未満に結合する場合に、保持される、項目33に記載の方法。
[項目36]
選択される親和性試薬が、それがタンパク質の約5%未満に結合する場合に、保持される、項目33に記載の方法。
[項目37]
選択される親和性試薬が、それがタンパク質の約1%未満に結合する場合に、保持される、項目33に記載の方法。
[項目38]
選択される親和性試薬が、それがタンパク質の約0.1%未満に結合する場合に、保持される、項目33に記載の方法。
[項目39]
選択される親和性試薬が、それがタンパク質の約0.01%未満に結合する場合に、保持される、項目33に記載の方法。
[項目40]
あるアミノ酸エピトープに特異的に結合し、
kが中心エピトープの長さである数式 20 * (k-2) によって決定されるより多い数の他のアミノ酸エピトープには結合せず、かつ、
Xが所望のエピトープでありかつαおよびβが任意のアミノ酸残基であるαXβの形式の配列の少なくとも10%に結合する、
親和性試薬。
[項目41]
αXβの形式の配列の少なくとも15%に結合する、項目40に記載の親和性試薬。
[項目42]
αXβの形式の配列の少なくとも20%に結合する、項目40に記載の親和性試薬。
[項目43]
αXβの形式の配列の少なくとも30%に結合する、項目40に記載の親和性試薬。
[項目44]
αXβの形式の配列の少なくとも40%に結合する、項目40に記載の親和性試薬。
[項目45]
αXβの形式の配列の少なくとも50%に結合する、項目40に記載の親和性試薬。
[項目46]
αXβの形式の配列の少なくとも75%に結合する、項目40に記載の親和性試薬。
[項目47]
αXβの形式の配列の少なくとも90%に結合する、項目40に記載の親和性試薬。
[項目48]
ある3アミノ酸エピトープに特異的に結合し、
いかなる他の3アミノ酸エピトープにも結合せず、かつ、
所望のエピトープの周囲の隣接配列にかかわらず実質的に類似の親和性で所望のエピトープに結合する、
親和性試薬。
[項目49]
エピトープのサブセットに結合しない、前記請求項のいずれか一項に記載の親和性試薬。
[項目50]
選択される親和性試薬が、2アミノ酸~10アミノ酸の長さを有する無作為なペプチドの
ライブラリーに対してスクリーニングされ、かつ以下の工程をさらに含む、項目10に記載の方法:
選択される親和性試薬によって結合されるペプチドを、同定する工程;および
選択される親和性試薬を、
1)それが、20個未満の異なるエピトープに結合し、かつ
2)それが、該エピトープを含むすべてのより長いペプチドの少なくとも10%に結合する場合に、保持する工程。
[項目51]
選択される親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも15%に結合しない限り、保持されない、項目50に記載の方法。
[項目52]
選択される親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも20%に結合しない限り、保持されない、項目50に記載の方法。
[項目53]
選択される親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも30%に結合しない限り、保持されない、項目50に記載の方法。
[項目54]
選択される親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも40%に結合しない限り、保持されない、項目50に記載の方法。
[項目55]
選択される親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも50%に結合しない限り、保持されない、項目50に記載の方法。
[項目56]
選択される親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも75%に結合しない限り、保持されない、項目50に記載の方法。
[項目57]
選択される親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも90%に結合しない限り、保持されない、項目50に記載の方法。
[項目58]
選択される親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも95%に結合しない限り、保持されない、項目50に記載の方法。
[項目59]
以下の工程をさらに含む、項目10に記載の方法:
親和性試薬を、ペプチドのライブラリーに対してスクリーニングすることによって、親和性試薬の結合を特徴付けする工程であって、ペプチドのライブラリーが、所望のエピトープより短いペプチド、所望のエピトープと同じ長さのペプチド、および所望のエピトープより長いペプチドを含む、工程;ならびに
結合されたペプチドの配列を同定する工程であって、それにより、親和性試薬の結合を特徴付けする工程。
[項目60]
親和性試薬のセットから親和性試薬を選択する方法であって、以下の工程を含む、方法:
親和性試薬のセットを、2アミノ酸~10アミノ酸の長さを有する無作為なペプチドのライブラリーに対してスクリーニングする工程;
親和性試薬のセットの各親和性試薬によって結合されるペプチドを、同定する工程;および
1) 20個未満の異なるエピトープに結合し、かつ
2) エピトープを含むすべてのより長いペプチドの少なくとも10%に結合する親和性試薬を選択する工程。
[項目61]
親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも15%に結合しない限り、選択されない、項目60に記載の方法。
[項目62]
親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも20%に結合しない限り、選択されない、項目60に記載の方法。
[項目63]
親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも30%に結合しない限り、選択されない、項目60に記載の方法。
[項目64]
親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも40%に結合しない限り、選択されない、項目60に記載の方法。
[項目65]
親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも50%に結合しない限り、選択されない、項目60に記載の方法。
[項目66]
親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも75%に結合しない限り、選択されない、項目60に記載の方法。
[項目67]
親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも90%に結合しない限り、選択されない、項目60に記載の方法。
[項目68]
親和性試薬が、それが、エピトープを含むすべてのより長いペプチドの少なくとも95%に結合しない限り、選択されない、項目60に記載の方法。
[項目69]
親和性試薬が、1つまたは複数の基材に固定化されており、かつ無作為なペプチドのライブラリーが、固定化された親和性試薬を通過する、項目60に記載の方法。
[項目70]
ヒトプロテオーム中のすべてのタンパク質の5%~10%に結合する、切り替え可能なアプタマー。
[項目71]
ヒトプロテオーム中のすべてのタンパク質の5%~95%に結合する、切り替え可能なアプタマー。
[項目72]
ヒトプロテオーム中のすべてのタンパク質の10%~90%に結合する、切り替え可能なアプタマー。
[項目73]
ヒトプロテオーム中のすべてのタンパク質の20%~80%に結合する、切り替え可能なアプタマー。
[項目74]
ヒトプロテオーム中のすべてのタンパク質の30%~70%に結合する、切り替え可能なアプタマー。
ヒトプロテオーム中のすべてのタンパク質の40%~60%に結合する、切り替え可能なアプタマー。
[項目75]
ヒトプロテオーム中のすべてのタンパク質の5%~10%に結合する、切り替え可能なアプタマーを、同定する方法。
[項目76]
ヒトプロテオーム中のすべてのタンパク質の5%~95%に結合する、切り替え可能なアプタマーを、同定する方法。
[項目77]
ヒトプロテオーム中のすべてのタンパク質の10%~90%に結合する、切り替え可能なアプタマーを、同定する方法。
[項目78]
ヒトプロテオーム中のすべてのタンパク質の20%~80%に結合する、切り替え可能なアプタマーを、同定する方法。
[項目79]
ヒトプロテオーム中のすべてのタンパク質の30%~70%に結合する、切り替え可能なアプタマーを、同定する方法。
[項目80]
ヒトプロテオーム中のすべてのタンパク質の40%~60%に結合する、切り替え可能なアプタマーを、同定する方法。
[項目81]
ヒトプロテオーム中のすべてのタンパク質の5%~10%に結合する、親和性試薬。
[項目82]
ヒトプロテオーム中のすべてのタンパク質の5%~95%に結合する、親和性試薬。
[項目83]
ヒトプロテオーム中のすべてのタンパク質の10%~90%に結合する、親和性試薬。
[項目84]
ヒトプロテオーム中のすべてのタンパク質の20%~80%に結合する、親和性試薬。
[項目85]
ヒトプロテオーム中のすべてのタンパク質の30%~70%に結合する、親和性試薬。
[項目86]
ヒトプロテオーム中のすべてのタンパク質の40%~60%に結合する、親和性試薬。
[項目87]
ヒトプロテオーム中のすべてのタンパク質の5%~10%に結合する親和性試薬を同定する方法。
[項目88]
ヒトプロテオーム中のすべてのタンパク質の5%~95%に結合する親和性試薬を同定する方法。
[項目89]
ヒトプロテオーム中のすべてのタンパク質の10%~90%に結合する親和性試薬を同定する方法。
[項目90]
ヒトプロテオーム中のすべてのタンパク質の20%~80%に結合する親和性試薬を同定する方法。
[項目91]
ヒトプロテオーム中のすべてのタンパク質の30%~70%に結合する親和性試薬を同定する方法。
[項目92]
ヒトプロテオーム中のすべてのタンパク質の40%~60%に結合する親和性試薬を同定する方法。
[項目93]
特定の長さの、複数の独特な所望のペプチドエピトープへの、親和性試薬の結合を特徴付けするための方法であって、以下の工程を含む、方法:
複数のペプチドを有するペプチドライブラリーを得る工程であって、該複数のペプチドの各ペプチドは、長さmを有する独特な所望のペプチドエピトープ配列を含み、かつ、長mを有する、可能性のある別個のエピトープ配列の反復のサブセットが、ペプチドライブラリー中に表される、工程;
ペプチドライブラリーを、複数の特定の親和性試薬に曝露する工程、
ペプチドライブラリー中のどのペプチドが、該特定の親和性試薬によって結合されるのかを決定する工程;ならびに
該特定の親和性試薬が、ペプチドライブラリー中の、閾値より多い数のペプチドに結合する場合に、該特定の親和性試薬を選択するために、ペプチドライブラリーを用いる工程。
[項目94]
前記親和性試薬を選択するために、前記ペプチドライブラリーが変性状態で使用される、前記請求項のいずれか一項に記載の方法。
[項目95]
前記親和性試薬が、変性タンパク質における所望のエピトープに結合する能力に関してさらに評価され、かつ前記親和性試薬が、それが変性タンパク質において所望のエピトープに結合できる場合に、選択される、前記請求項のいずれか一項に記載の方法。
[項目96]
前記親和性試薬が、折りたたまれているコンテキストまたは折りたたまれていないコンテキストのいずれかのタンパク質において、所望のエピトープに結合する能力に関してさらに評価される、前記請求項のいずれか一項に記載の方法。
[項目97]
前記親和性試薬が、折りたたまれているコンテキストまたは折りたたまれていないコンテキストのいずれかのタンパク質において、所望のエピトープに結合する能力に関してさらに評価され、かつ前記親和性試薬が、それが、結合したタンパク質および未結合のタンパク質の両方において前記所望のエピトープに結合できる場合に、さらに選択される、前記請求項のいずれか一項に記載の方法。
[項目98]
前記親和性試薬が、マイクロフォールディング(microfolding)を含み得る変性タンパク質における所望のエピトープに結合する能力に関してさらに評価され、かつ前記親和性試薬が、それが、前記変性タンパク質における前記所望のエピトープに結合できる場合に、さらに選択される、前記請求項のいずれか一項に記載の方法。
[項目99]
前記親和性試薬が、多くの異なる配列コンテキストにおいて所望のエピトープに結合する能力に関してさらに評価され、かつ前記親和性試薬が、それが、所望のエピトープを含むすべてのペプチドに、同様に良好に、またはほぼ同様に良好に、結合できる場合に、さらに選択される、前記請求項のいずれか一項に記載の方法。
[項目100]
前記親和性試薬が、多くの異なる配列コンテキストにおいて所望のエピトープに結合する能力に関してさらに評価され、かつ前記親和性試薬が、それが、エピトープの配列コンテキストに応じて異なる親和性で前記所望のエピトープに結合する場合に、さらに選択される、前記請求項のいずれか一項に記載の方法。
[項目101]
前記親和性試薬が、多くの異なる配列コンテキストにおいて所望のエピトープに結合する能力に関してさらに評価され、かつ前記親和性試薬が、それが、前記所望のエピトープに、エピトープのすべての配列コンテキストにおいて同じ親和性で結合するわけではない場合に、さらに選択される、前記請求項のいずれか一項に記載の方法。
[項目102]
前記親和性試薬が、複数の独特なエピトープに結合する、前記請求項のいずれか一項に記載の方法。
[項目103]
前記親和性試薬が、配列コンテキストとは無関係に、複数の独特なエピトープに結合する、前記請求項のいずれか一項に記載の方法。
[項目104]
前記親和性試薬が、異なる配列コンテキストに基づいて異なる親和性で、所望のペプチドエピトープに結合する、前記請求項のいずれか一項に記載の方法。
[項目105]
前記親和性試薬が、複数の所望のペプチドエピトープに結合し、前記親和性試薬が、異なる配列コンテキストに基づいて異なる親和性で、前記複数の所望のペプチドエピトープのそれぞれに結合する、前記請求項のいずれか一項に記載の方法。
[項目106]
前記親和性試薬が、以下の工程を含むプロセスを用いて同定される、前記請求項のいずれか一項に記載の方法:
前記所望のペプチドエピトープを含む標的に結合するように、最初のスクリーニングを行う工程;
親和性試薬の結合を特徴付けするために、ペプチドレベルの適格性スクリーニングを行う工程;および
前記ペプチドレベルの適格性スクリーニングにおいて提供された結合の特徴付けを確認するために、タンパク質レベルのスクリーニングを行う工程。
[項目107]
前記タンパク質レベルのスクリーニングの少なくとも一部分が、前記ペプチドレベルの適格性スクリーニングの前に実施される、項目106に記載の方法。
[項目108]
前記親和性試薬が、以下の工程を含むプロセスを用いて同定される、前記請求項のいずれか一項に記載の方法:
前記所望のペプチドエピトープを含む標的に結合するように、最初のスクリーニングを行う工程;
親和性試薬の結合を特徴付けするために、タンパク質レベルのスクリーニングを行う工程;および
前記タンパク質レベルのスクリーニングにおいて提供された結合の特徴付けを確認するために、ペプチドレベルの適格性スクリーニングを行う工程。
[項目109]
前記ペプチドレベルの適格性スクリーニングの少なくとも一部分が、前記タンパク質レベルのスクリーニングの前に実施される、項目108に記載の方法。
[項目110]
前記親和性試薬が、以下の工程を含むプロセスを用いて同定される、前記請求項のいずれか一項に記載の方法:
前記所望のペプチドエピトープを含む標的に結合するように、最初のスクリーニングを行う工程;および
親和性試薬の結合を特徴付けするために、タンパク質レベルのスクリーニングを行う工程。
[項目111]
複数の配列コンテキストにおいて所望のペプチドエピトープに結合するアプタマーを選択するための方法であって、以下の工程を含む、方法:
ペプチドライブラリーを得る工程であって、各ペプチドは配列αXβを有し、Xは所望のペプチドエピトープであり、かつαおよびβのそれぞれはアミノ酸を含む、工程;ならびに
指数的濃縮によるリガンドの系統進化(Systematic evolution of ligands by exponential enrichment)を用いる選択工程において、標的としてペプチドライブラリーを、該標的に結合するアプタマーを選択するために、用いる工程;
前記選択されるアプタマーを、配列αXβのペプチドのパネルに対してスクリーニングする工程であって、Xは所望のペプチドエピトープであり、かつαおよびβのそれぞれはアミノ酸を含む、工程;ならびに
前記アプタマーを、それが前記ペプチド配列の少なくとも40個に結合する場合に、保持する工程。
図1
図2
図3A
図3B
図4
図5A
図5B
図6
図7
図8
図9
図10
図11
図12