IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テーウー ドレスデンの特許一覧

特許7397464DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法
<>
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図1
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図2
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図3A
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図3B
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図3C
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図3D
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図4
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図5
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図6
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図7
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図8
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図9
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図10
  • 特許-DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-05
(45)【発行日】2023-12-13
(54)【発明の名称】DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法
(51)【国際特許分類】
   C12N 15/10 20060101AFI20231206BHJP
   G01N 33/53 20060101ALI20231206BHJP
   C40B 20/04 20060101ALI20231206BHJP
   C40B 40/06 20060101ALI20231206BHJP
【FI】
C12N15/10 Z ZNA
G01N33/53 M
C40B20/04
C40B40/06
【請求項の数】 15
【外国語出願】
(21)【出願番号】P 2019142687
(22)【出願日】2019-08-02
(65)【公開番号】P2020054337
(43)【公開日】2020-04-09
【審査請求日】2022-05-09
(31)【優先権主張番号】18186948.8
(32)【優先日】2018-08-02
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】519282720
【氏名又は名称】テーウー ドレスデン
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【氏名又は名称】中西 基晴
(72)【発明者】
【氏名】イーシン・チャン
(72)【発明者】
【氏名】フランチェスコ・レッドダビデ
(72)【発明者】
【氏名】メィイン・キュイ
(72)【発明者】
【氏名】ヘレナ・アンドレード
(72)【発明者】
【氏名】シュテファン・ハイデン
【審査官】藤山 純
(56)【参考文献】
【文献】特表2015-533296(JP,A)
【文献】米国特許出願公開第2017/0198336(US,A1)
【文献】国際公開第2018/005720(WO,A1)
【文献】LI, Y. et al.,Quantitative PCR is a valuable tool to monitor the performance of DNA-encoded chemical library selections,Chembiochem,18(9),2017年03月16日,pp.848-852
【文献】JORG, S. and DARIO, N.,Dual-pharmacophore DNA-encoded chemical libraries,Current opinion in chemical biology,vol. 26,2015年,pp.99-103
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/10
G01N 33/53
C40B 20/04
C40B 40/06
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
DNAエンコードライブラリーを提供するための、下記を含む方法:
a)異なるDNAバーコード配列を含むことにより互いに異なる多数のDNA分子を合成し、その際、各DNAバーコード配列は少なくとも第1コーディング領域DNA配列を含み、第1コーディング領域DNA配列は少なくとも第1部分、第2部分および第3部分を含み、その際、第2部分は第1部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なる;そして
b)多数の異なるDNA分子のそれぞれを少なくとも1つの特定の物質に結合させて異なるDNA-物質コンジュゲートを形成し、その際、DNA-物質コンジュゲートは特定の物質およびそれらのDNA分子によって互いに異なる;
第1部分および第3部分は第1コーディング領域の第2部分に関する情報をエンコードし、その際、特定の第1部分および/または特定の第3部分は、DNAエンコードライブラリー中のすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードすることを特徴とする。
【請求項2】
i)第1コーディング領域DNA配列は少なくとも第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、その際、第1コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第1コーディング領域の第2部分についての情報をエンコードする;ならびに
ii)各バーコード配列は少なくとも第2コーディング領域DNA配列を含み、第2コーディング領域DNA配列は少なくとも第1部分、第2部分、第3部分、および第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第2コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第2コーディング領域の第2部分についての情報をエンコードする;
その際、特定のコーディング領域における第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする;
ことを特徴とする、請求項1に記載の方法。
【請求項3】
i)各バーコード配列は少なくとも第2コーディング領域DNA配列を含み、第2コーディング領域DNA配列は少なくとも第1部分、第2部分、第3部分、および第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第2コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第2コーディング領域の第2部分についての情報をエンコードする;ならびに
ii)各バーコード配列は少なくとも第3コーディング領域DNA配列を含み、第3コーディング領域DNA配列は少なくとも第1部分、第2部分、第3部分、および第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第3コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第3コーディング領域の第2部分についての情報をエンコードする;
その際、特定のコーディング領域における第1部分と第4部分の特定の組合わせは、第1部分によってエンコードされるDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする;
ことを特徴とする、請求項1または2に記載の方法。
【請求項4】
少なくとも1つのコーディング領域DNA配列が、少なくとも第1部分、第2部分、第3部分、第4部分および第5部分を含み、その際、第2部分は第4部分と第5部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、
その際、コーディング領域の第1部分と第4部分の組合わせおよび第5部分と第3部分の組合わせはコーディング領域の第2部分についての情報をエンコードし、
その際、第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードし、
その際、第5部分と第3部分の特定の組合わせは、第3部分単独によってエンコードされるDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする;
ことを特徴とする、請求項1~3のいずれか1項に記載の方法。
【請求項5】
多数の異なるDNA-物質コンジュゲートを含むDNAエンコードライブラリーであって、その際、DNA-物質コンジュゲートはそれらの物質およびそれらのDNA分子により互いに異なり、
その際、DNA-物質コンジュゲートのDNA分子は異なるDNAバーコード配列を含むことにより互いに異なり、その際、各DNAバーコード配列は少なくとも第1コーディング領域DNA配列を含み、第1コーディング領域DNA配列は少なくとも第1部分、第2部分および第3部分を含み、その際、第2部分は第1部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり;
第1コーディング領域の第1部分および第3部分は第2部分に関する情報をエンコードすることを特徴とし、その際、特定の第1部分および/または特定の第3部分は、DNAエンコードライブラリーのすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードすることを特徴とする、
前記DNAエンコードライブラリー
【請求項6】
i)第1コーディング領域DNA配列は少なくとも第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、その際、第1コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第1コーディング領域の第2部分についての情報をエンコードする;ならびに
ii)各バーコード配列は少なくとも第2コーディング領域DNA配列を含み、第2コーディング領域DNA配列は少なくとも第1部分、第2部分、第3部分、および第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第2コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第2コーディング領域の第2部分についての情報をエンコードする;
その際、特定のコーディング領域の第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする;
ことを特徴とする、請求項5に記載のDNAエンコードライブラリー。
【請求項7】
各バーコード配列は少なくとも第3コーディング領域DNA配列を含み、それは第2コーディング領域と同じDNA鎖上にあり、少なくとも第1部分、第2部分、第3部分、および第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第3コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第3コーディング領域の第2部分についての情報をエンコードし、その際、第2コーディング領域およ第3コーディング領域における第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする
ことを特徴とする、請求項6に記載のDNAエンコードライブラリー。
【請求項8】
少なくとも1つのコーディング領域DNA配列は、少なくとも第1部分、第2部分、第3部分、第4部分および第5部分を含み、その際、第2部分は第4部分と第5部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、
その際、コーディング領域の第1部分と第4部分の組合わせおよび第5部分と第3部分の組合わせはコーディング領域の第2部分についての情報をエンコードし、
その際、第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードし、
その際、第5部分と第3部分の特定の組合わせは、第3部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする;
ことを特徴とする、請求項5~7のいずれか1項に記載のDNAエンコードライブラリー。
【請求項9】
請求項5~8のいずれか1項に記載のDNAエンコードライブラリーをデコードする、下記を含む方法:
a)請求項5~8のうちの1つによるDNAエンコードライブラリーを鋳型として用いてqPCRを実施し、その際、下記のプライマーを使用する:
あらゆるDNA-物質コンジュゲートの第1コーディング領域を増幅するためのプライマーAおよびプライマーB;ならびに
第1コーディング領域の異なる第1部分にアニールする多数の異なるプライマーA-xN、および第1コーディング領域の異なる第3部分にアニールする多数の異なるプライマーB-yN;その際、プライマーA-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーAと同一の長さを有し、プライマーB-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーBと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは2から6までの整数である;
b)各プライマーA-xNおよび各プライマーB-Nの信号値の積を下記の方程式により計算する:
数値 (A-xN)=信号値[(A-xN)+B]・信号値[(A-xN)+(B-N)];および
数値(B-yN)=信号値[(B-yN)+A]・信号値[(B-yN)+(A-x],
その際、iは整数であり、特定のプライマーを規定し、“+”記号は2つのプライマーの組合わせを示し;その際、信号値は同一領域にアニールした異なるプライマーを用いたqPCR定量の全セットに関する存在量のパーセントである;そして
c)プライマー(A-xN)および(B-yN)のそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする。
【請求項10】
i)各プライマーA-xNおよび各プライマーB-yNについて得られた数値の積を下記の方程式により計算する:
数値(A-B)=数値(A-xN)・数値(B-yN)
ii)プライマー(A-xN)と(B-yN)の組合わせのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマー組合わせはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする;
ことを特徴とする、請求項9に記載の方法。
【請求項11】
qPCRが請求項6~8のいずれか1項に記載のDNAエンコードライブラリーを用いて実施されることを特徴とし、その方法は下記を含む:
i)下記のプライマーを用いてqPCRを実施する:
あらゆるDNA-物質コンジュゲートの第1コーディング領域を増幅するための第1コーディング領域プライマーAおよび第1コーディング領域プライマーB;ならびに
第1コーディング領域の異なる第1部分、または第1部分および第4部分にアニールする、多数の異なるプライマーA-xN、ならびに第1コーディング領域の異なる第3部分にアニールする多数の異なるプライマーB-yN;その際、A-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーAと同一の長さを有し、B-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーBと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10までの整数であり、yは2から6までの整数である;ならびに
あらゆるDNA-物質コンジュゲートの第2コーディング領域を増幅するための第2コーディング領域プライマーCおよび第2コーディング領域プライマーD;ならびに
第2コーディング領域の異なる第1部分、または第1部分および第4部分にアニールする、多数の異なるプライマーD-yN、ならびに第2コーディング領域の異なる第3部分にアニールする多数の異なるプライマーC-xN;その際、プライマーC-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーCと同一の長さを有し、プライマーD-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーDと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10までの整数であり、yは2から6までの整数である;
ii)各プライマーA-xN、各プライマーB-yN、各プライマーC-xNおよび各プライマーD-yNについて得られた信号値の積を下記の方程式により計算する:
数値(A-xN)=信号値[(A-xN)+B]・信号値[(A-xN)+(B-N)];
数値(B-yN)=信号値[(B-yN)+A]・信号値[(B-yN)+(A-xN)],
数値(C-xN)=信号値[(C-xN)+D]・信号値[(C-xN)+(D-yN],
数値(D-yN)=信号値[(D-yN)+C]・信号値[(D-yN)+(C-x],
その際、iは整数であり、特定のプライマーを規定し、“+”記号は2つのプライマーの組合わせを示し;その際、信号値は同一領域にアニールした異なるプライマーを用いたqPCR定量の全セットに関する存在量のパーセントである;そして
iii)プライマー(A-xN)、(B-yN)、(C-xN)および(D-yN)のそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする;
ことを特徴とする、請求項9または10に記載の方法。
【請求項12】
i)各プライマーA-xNおよび各プライマーB-yN、各プライマーA-xNおよび各プライマーD-N、ならびに各プライマーC-NおよびD-Nについて得られた数値の積を下記の方程式により計算する:
数値(A-B)=数値(A-xN)・数値(B-yN)
数値(A-D)=数値(A-xN)・数値(D-yN)
数値(C-D)=数値(C-xN)・数値(D-yN)
ii)各プライマーiについての数値(A-B)、(A-D)および(C-D)の積を下記の方程式により計算する:
数値=数値(A-B)・数値(A-D)・数値(C-D)
iii)得られた積である数値を比較し、その際、高い数値をもつプライマー組合わせiはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする;
請求項11に記載の方法。
【請求項13】
請求項7または8に記載のDNAエンコードライブラリーを鋳型として用いてqPCRを実施することを特徴とし、その方法は下記を含む:
i)下記のプライマーを用いてqPCRを実施する:
あらゆるDNA-物質コンジュゲートの第1コーディング領域を増幅するための、第1コーディング領域プライマーAおよび第1コーディング領域プライマーB;ならびに
第1コーディング領域の異なる第1部分、または第1部分および第4部分にアニールする、多数の異なるプライマーA-xN、ならびに第1コーディング領域の異なる第3部分にアニールする多数の異なるプライマーB-yN;その際、A-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーAと同一の長さを有し、Bは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーB-yNと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10までの整数であり、yは2から6までの整数である;ならびに
あらゆるDNA-物質コンジュゲートの第2コーディング領域を増幅するための、第2コーディング領域プライマーCおよび第2コーディング領域プライマーD;ならびに
第2コーディング領域の異なる第1部分、または第1部分および第4部分にアニールする、多数の異なるプライマーD-yN、ならびに第2コーディング領域の異なる第3部分にアニールする多数の異なるプライマーC-xN;その際、プライマーC-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーCと同一の長さを有し、プライマーD-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーDと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10までの整数であり、yは2から6までの整数である;
あらゆるDNA-物質コンジュゲートの第3コーディング領域を増幅するための、第3コーディング領域プライマーEおよび第3コーディング領域プライマーF;ならびに
第3コーディング領域の異なる第1部分にアニールする多数の異なるプライマーE-xN、および第3コーディング領域の異なる第3部分にアニールする多数の異なるプライマーF-yN;その際、プライマーE-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーEと同一の長さを有し、プライマーF-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーFと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10までの整数であり、yは2から6までの整数である;
ii)各プライマーA-xN、各プライマーB-yN、各プライマーC-xN、各プライマーD-yN、各プライマーE-xNおよび各プライマーF-yNの信号値の積を下記の方程式により計算する:
数値(A-xN)=信号値[(A-xN)+B]・信号値[(A-xN)+(B-N)];
数値(B-yN)=信号値[(B-yN)+A]・信号値[(B-yN)+(A-xN)],
数値(C-xN)=信号値[(C-xN)+D]・信号値[(C-xN)+(D-N)],
数値(D-yN)=信号値[(D-yN)+C]・信号値[(D-yN)+(C-xN)],
数値(E-xN)=信号値[(E-xN)+F]・信号値[(E-xN)+(F-yN],
数値(F-yN)=信号値[(F-yN)+E]・信号値[(F-yN)+(E-xN)],
その際、iは整数であり、特定のプライマーを規定し、“+”記号は2つのプライマーの組合わせを示し;その際、信号値は同一領域にアニールした異なるプライマーを用いたqPCR定量の全セットに関する存在量のパーセントである;そして
iii)プライマー(A-xN)、(B-yN)、(C-xN)、(D-yN)、(E-xN)および(-yN)のそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする;
請求項9~12のいずれか1項に記載の方法。
【請求項14】
i)各プライマーA-xNおよび各プライマーB-yNについて、各プライマーA-xNおよび各プライマーD-Nについて、各プライマーC-NおよびD-Nについて、各プライマーA-xNおよび-yNについて、各プライマー-xNおよびD-yNについて、ならびに各プライマー-xNおよび-yNについて得られた数値の積を下記の方程式により計算する:
数値(A-B)=数値(A-xN)・数値(B-yN)
数値(A-D)=数値(A-xN)・数値(D-yN)
数値(C-D)=数値(C-xN)・数値(D-yN)
数値(A-F)=数値(A-xN)・数値(F-yN)
数値(E-D)=数値(E-xN)・数値(D-yN)
数値(E-F)=数値(E-xN)・数値(F-yN)
ii)各プライマー組合わせiについて、数値(A-B)、(A-D)、(C-D)、(A-F)、(E-D)および(E-F)の積を下記の方程式により計算する:
数値=数値(A-B)・数値(A-D)・数値(C-D)・数値(A-F)・数値(E-D)・数値(E-F)
iii)得られた積である数値を比較し、その際、高い数値をもつプライマー組合わせiはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする;
請求項13に記載の方法。
【請求項15】
下記の計算:
数値i’=log10[数値(A-B)・数値(A-D)・数値(C-D)・数値(A-F)・数値(E-D)・数値(E-F)
による数値i’の計算を含むことを特徴とする、請求項14に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
DNAエンコードライブラリーを提供するための方法、DNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする方法を提示する。異なるDNAバーコード配列を含むことにより互いに異なる多数の異なるDNA分子を合成し、その際、各DNAバーコード配列は少なくとも、少なくとも第1部分、第2部分および第3部分を含む第1コーディング領域DNA配列を含み、その際、第2部分は第1部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なる。多数の異なるDNA分子のそれぞれは少なくとも、異なるDNA-物質コンジュゲートを形成する特定の物質に結合し、その際、DNA-物質コンジュゲートは特定の物質およびそれらのDNA分子により互いに異なり、その際、第1部分および第3部分は第1コーディング領域の第2部分に関する情報をエンコードし、その際、特定の第1部分および/または特定の第3部分はDNAエンコードライブラリー中のすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする。このDNAエンコードライブラリーは、たとえばそのライブラリーを用いて実施した濃縮(enrichment)実験後にそのライブラリーを既知のDNAエンコードライブラリーより速やかに、より経費の少ない方法でデコードすることができるという利点をもつ。
【背景技術】
【0002】
分子のプールから高親和性結合剤を同定することを目的とする薬物探索において、DNAエンコードライブラリー(DNA-encoded library)(“DEL”)を使用することが先行技術において知られている。理想的には、そのDELは細胞、たとえば適応免疫におけるT細胞およびB細胞の機能-情報関係、ならびにペプチド/タンパク質-ディスプレイ技術(たとえば、ファージディスプレイ、リボソームディスプレイ、酵母ディスプレイ)を模倣することができる。T細胞、B細胞および/またはファージにおいて、機能(たとえば細胞表面に発現しているタンパク質により仲介されるもの)および関連情報(たとえば遺伝情報によりコードされるもの)は共に個々の細胞内に拘束されている。特定の細胞混合物中に提示される個々の細胞が単一コピーしかない場合ですら、その機能-情報関係を調べることができる。
【0003】
DELは、それぞれが有機小分子と特定のDNA配列(いわゆる“DNAバーコード”)とのコンジュゲートである異なる分子のプールから構成され、よって機能(有機小分子の化学構造によるそれの機能)と情報(DNA配列によりコードされる、有機小分子についての情報)の直接的な物理的関係を明らかにする。それらのDNA配列は、種々の技術、たとえばサンガー(Sanger)シーケンシング、DNAアレイおよび/またはハイスループットシーケンシングを用いて関連化学構造を同定するように設計される。
【0004】
PCR(ポリメラーゼ連鎖反応)は主に選択した化合物を増幅するために用いられるが、PCRおよびリアルタイムPCR(rtPCR)は、たとえばある特定のDNAバーコードがDELをセレクション実験に用いる前および/または後に存在するか否か、あるいはどのような存在量で存在するかを調べるためのバリデーション法としても使用できる。セレクション実験は、有機小分子とDNAバーコードとの特定のコンジュゲートを、それらが1以上の希望するターゲットに結合した後にそれらのコンジュゲートを単離することに基づいて濃縮することを目的とする。それらのコンジュゲートが濃縮されるので、DELセレクション実験は特定のDNAバーコード、すなわちターゲット(単数または複数)に対する高い結合親和性をもつ有機小分子をコードするものを濃縮する実験とみなすことができる。
【0005】
ファージディスプレイ技術の場合と同様に、通常のDELセレクション実験は1ラウンドのセレクション(1回の操作)で数十ないし数百のDNAバーコード(DNA配列)を供給する。しかし、通常は特異性および有効性の高い有機分子(すなわち、ターゲットに対するkがpMないしnMの範囲にあるもの)を明らかにするファージディスプレイ技術と異なり、DELセレクション実験はしばしば、中等度の結合剤にすぎない有機小分子(たとえば、ターゲットに対するkが低ないし中等度のμM範囲にあるもの)をコードするDNAバーコードをも明らかにする。
【0006】
原則として、サンガーシーケンシングはDELセレクション実験で見出されたDNAバーコードをデコードするためのツールを提供する。
しかし、サンガーシーケンシングは、処理量が低い、すなわちDNAバーコードの“読取り”に多くの時間を消費し、したがって読出しが不経済であるという欠点をもつ。
【0007】
サンガーシーケンシングのさらなる欠点は、異なるDNA配列の複雑な混合物を分析する際のそれの感度が低いことである。100万の異なる化合物を含むDELを用いるDELセレクション実験を仮定すると、1つの化合物が通常は平均より1000倍多く濃縮され、100の配列がサンガーシーケンシングから得られるであろう。この場合、それの存在がサンガーシーケンシングによって明らかにされないという理由でその1つの特定の化合物がセレクション実験により同定されない機会、すなわち同定から漏れる機会は、おおよそ90%あるであろう。
【0008】
さらに、たとえ特定のDNAバーコード(たとえば、特定の有機小分子をコードするもの)が濃縮プロセスで1回出現するとしても、サンガーシーケンスはターゲットに結合する有機小分子をコードするものとしてそのDNAバーコードを同定することができる。しかし、サンガーシーケンシングはこの特定の有機小分子の同定がランダム事象(すなわち、偶発ヒット)であったかあるいは実際に統計的に有意(すなわち、真のヒット)であるかを解明することはできない。要するに、サンガーシーケンシングには、オーバーサンプリングなしに偽陽性を真陽性から識別することはできないという欠点もある。サンガーシーケンシングの概念におけるオーバーサンプリングは、デコーディングプロセス(読出し)におけるヒット同定について統計的に意味のある結果を得るために明らかにきわめて重要であるが、サンガーシーケンシングは効率的とはほど遠いことが明らかになった。
【0009】
DNAアレイは、DELセレクション実験で同定された結合剤のDNAバーコード配列をデコードするための別の解決策を提供する。各DNAバーコード配列は特定の物理的位置と関連付けられ、それの蛍光強度に従って評価されるので、その測定はサンガーシーケンシングを用いるオーバーサンプリングの必要性を回避する。
【0010】
しかし、完全相補配列は最高の信号強度をもたらすが、ミスマッチDNA配列相互作用に関連する強いバックグラウンドノイズは、大きなDNAバーコード配列ライブラリーをデコードするためにこの方法を使用する妨げとなる。たとえば、それぞれがDNAバーコード配列をもつわずか数百の化合物のライブラリーについて、特定のペアをミスマッチングおよびバックグラウンドノイズから識別するためには多大な努力を行なう必要がある。要するに、DNAアレイ同定方法も、偽陽性を真陽性から十分に識別することができないという欠点をもつ。言い換えると、この同定方法のシステムエラーは高い。
【0011】
ハイスループットシーケンシング(High throughput sequencing)(“HTS”)はセレクション実験後にDELをデコードするための標準法となった。HTSはサンガーシーケンシングに類似する原理を適用し、特定配列のカウントを濃縮の指標として用いる。比較的大きなサイズのDELを用いる場合ですら、HTSから生じる数百万の配列読みがオーバーサンプリングを可能にする。
【0012】
しかし、DNAバーコード配列のカウントと希望するターゲット(単数または複数)に結合した有機小分子に対する親和性測定値とは低い相関性を示すにすぎないことが見出されたので、DNAアレイ法と同様にHTSはセレクション実験の半定量分析を提供できるにすぎない。この確認された低い相関性はまだ十分には理解されていない。PCRおよびシーケンシングのプロセスに際してのバイアスが役割をもっている可能性はあるが、原則として、それはDNAバーコードの合成の質が低いことが原因である可能性がある。要するに、HTSは同定プロセスに際して多数の偽陽性ヒットを生じる傾向がある;すなわちこの同定方法の全体的誤差は高い。
【0013】
さらに、DELのサイズは近年次第に増大しているので、DELが数十億の化合物を含み始めた場合にはHTSはもはやオーバーサンプリングの要件を満たさないであろう。
さらに、HTSはこの数年でより安価になったけれども、それは多くの大学研究者にとって依然としてきわめて高価である。外注によるシーケンシング課題は普通は数週間かかるが、研究者はシーケンシング実験をコントロールできない。
【0014】
PCRおよびrtPCRは先行技術においてサンガーシーケンシング、DNAアレイおよびHTS同定方法の問題点を克服するために用いられている。PCRおよびrtPCRの両方の利点は、プライマー対を特定のコードのために設計できることである。言い換えると、あるプライマーは特定のコードに結合し(少なくとも部分的に)、他のあるプライマーは結合しないという意味で、それ自体が“コード”を保有することができる種々のプライマーを使用できる。さらに、rtPCRは、陽性対照と陰性対照の相違を解明し(リアルタイムで)、よって偽陽性と真陽性をより良く識別できるという、PCRに優る利点をもつ。
【0015】
しかし、rtPCRはDELセレクションプロセスの定量分析を提供するけれども、それは限られた数のコードおよび化合物について設計できるにすぎない。したがって、rtPCRはデノボセレクション実験の結果をデコードするためには使用できないという欠点をもつ。
【発明の概要】
【発明が解決しようとする課題】
【0016】
このことから出発して、本発明の目的は、DNAエンコードライブラリーを用いるセレクション実験において濃縮されたDNAバーコードをエンコードおよびデコードするための方法を提供することであり、その方法は先行技術の同定方法の欠点を克服すべきである。具体的には、その方法は容易であり、コスト効率が良く、定量的、高感度(すなわち、弱い結合剤をも明らかにできる)、高特異性(すなわち、偽陽性より多く真陽性を明らかにできる)であり、かつデノボセレクション実験をデコードするのに適切でなければならない。
【課題を解決するための手段】
【0017】
その目的は、DNAエンコードライブラリーを提供するための請求項1の特徴を備えた方法、請求項5の特徴を備えたDNAエンコードライブラリー、およびDNAエンコードライブラリーをデコードする請求項9の特徴を備えた方法により解決される。従属請求項の対象は本発明の有利な態様を示す。
【図面の簡単な説明】
【0018】
図1図1Aは、単一コーディング領域2をもつDNAコード1(コーディング領域III)についてのqPCR-マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。図1Bは、2つのコーディング領域、すなわちコーディング領域Iおよびコーディング領域IIをもつDNAコードについてのqPCR-マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。
図2図2は、3つのコーディング領域I、II、IIIをもつDNAコードについてのqPCR-マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。
図3A図3A、3Bおよび3Cは、3つの異なる鋳型としての3つのコーディング領域I、II、IIIをもつDNAバーコード、ならびにコーディング領域Iに結合するための20の異なる一次プライマーAおよび20の異なる一次プライマーB(参照:図3Aのマトリクス“A+Bを用いたQ-PCR”、列=異なるプライマーA、行(line)=異なるプライマーB)、コーディング領域IIに結合するための20の異なる一次プライマーCおよび20の異なる一次プライマーD(参照:図3Bのマトリクス“C+Dを用いたQ-PCR”、列=異なるプライマーC、行(line)=異なるプライマーD)、ならびにコーディング領域IIIに結合するための20の異なる一次プライマーEおよび20の異なる一次プライマーF(参照:図3Cのマトリクス“E+Fを用いたQ-PCR”、列=異なるプライマーE、行(line)=異なるプライマーF)を用いるqPCR後に得られたqPCRマトリクスを示す
図3B図3A、3Bおよび3Cは、3つの異なる鋳型としての3つのコーディング領域I、II、IIIをもつDNAバーコード、ならびにコーディング領域Iに結合するための20の異なる一次プライマーAおよび20の異なる一次プライマーB(参照:図3Aのマトリクス“A+Bを用いたQ-PCR”、列=異なるプライマーA、行(line)=異なるプライマーB)、コーディング領域IIに結合するための20の異なる一次プライマーCおよび20の異なる一次プライマーD(参照:図3Bのマトリクス“C+Dを用いたQ-PCR”、列=異なるプライマーC、行(line)=異なるプライマーD)、ならびにコーディング領域IIIに結合するための20の異なる一次プライマーEおよび20の異なる一次プライマーF(参照:図3Cのマトリクス“E+Fを用いたQ-PCR”、列=異なるプライマーE、行(line)=異なるプライマーF)を用いるqPCR後に得られたqPCRマトリクスを示す
図3C図3A、3Bおよび3Cは、3つの異なる鋳型としての3つのコーディング領域I、II、IIIをもつDNAバーコード、ならびにコーディング領域Iに結合するための20の異なる一次プライマーAおよび20の異なる一次プライマーB(参照:図3Aのマトリクス“A+Bを用いたQ-PCR”、列=異なるプライマーA、行(line)=異なるプライマーB)、コーディング領域IIに結合するための20の異なる一次プライマーCおよび20の異なる一次プライマーD(参照:図3Bのマトリクス“C+Dを用いたQ-PCR”、列=異なるプライマーC、行(line)=異なるプライマーD)、ならびにコーディング領域IIIに結合するための20の異なる一次プライマーEおよび20の異なる一次プライマーF(参照:図3Cのマトリクス“E+Fを用いたQ-PCR”、列=異なるプライマーE、行(line)=異なるプライマーF)を用いるqPCR後に得られたqPCRマトリクスを示す
図3D図3Dの表“E+F”の下に、得られた結果を棒グラフでも示す。
図4図4は、図3からのqPCRマトリクス“A+Bを用いたQ-PCR”(コーディング領域Iの増幅)および“C+Dを用いたQ-PCR”(コーディング領域IIの増幅)の結果、ならびに同様にプライマー対AとDを用いた二次PCR(IとIIの間のコーディング領域;図2を参照)の結果を示す。
図5図5は、方程式 数値コーディング領域I-II=数値マトリクス-A+D・数値マトリクス-A+B・数値マトリクス-C+Dに従って最高の積(参照:y軸上の任意単位における絶対値)を生じたコーディング領域I(A+B)とII(C+D)の36の異なる組合わせのプロットを示す。
図6図6は、鋳型としての3つのコーディング領域I、II、IIIをもつDNAバーコード、コーディング領域Iについての20の異なる一次プライマーAおよびB、コーディング領域IIについての20の異なる一次プライマーCおよびD、コーディング領域I-IIについての(同じ)20の異なる一次プライマーAおよびD、ならびにコーディング領域IIIについての20の異なる一次プライマーEおよびFを用いるqPCR後に得られたqPCRマトリクスの一部を示す。
図7図7は、それぞれがDNAバーコードでタグ付けされた306の化合物をもつ中等度DELについてのデコーディングプロセスを示す。
図8図8は、それぞれがDNAバーコードでタグ付けされた410の化合物をもつ大きなDELの例を示す。
図9図9は、それぞれがDNAバーコードでタグ付けされた420の化合物をもつきわめて大きなDELの他の例を示す。
図10図10は、DNAエンコードライブラリー(DEL)内のDNA-CBS-コンジュゲートを酵素である炭酸脱水素酵素IIを用いたセレクションによって濃縮した後の物質4-カルボキシベンゼンスルホンアミド(以下において:“CBS”)の同定を示す。
図11図11は、第1物質Sが第1コーディング領域DNA配列Iおよび第2コーディング領域DNA配列に化学的に共有結合しており、第2物質Sが第3コーディング領域DNA配列IIIに化学的に共有結合しているDNA-物質コンジュゲートを示す。
【発明を実施するための形態】
【0019】
本発明によれば、DNAエンコードライブラリー(DEL)を提供するための方法が提供され、その方法は下記を含み:
a)異なるDNAバーコード配列を含むことにより互いに異なる多数の異なるDNA分子を合成し、その際、各DNAバーコード配列は少なくとも、少なくとも第1部分、第2部分および第3部分を含む第1コーディング領域DNA配列を含み、その際、第2部分は第1部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なる;そして
b)多数の異なるDNA分子のそれぞれを少なくとも1つの特定の物質に結合させて異なるDNA-物質コンジュゲートを形成し、その際、DNA-物質コンジュゲートは特定の物質およびそれらのDNA分子によって互いに異なる;
第1部分および第3部分は第1コーディング領域の第2部分に関する情報をエンコードし、その際、特定の第1部分および/または特定の第3部分は、DNAエンコードライブラリー中のすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードすることを特徴とする。
【0020】
本発明方法により提供されるDNAエンコードライブラリー(“DEL”)の利点は、DNAバーコード配列の第1部分および第3部分の両方がそれぞれDEL内の特定のサブグループのDNA-物質コンジュゲートをコードすることである。qPCRにおいて、DNAバーコード配列の第1部分に結合するプライマーは、DELを用いて実施した前のセレクション実験において第1部分がエンコードするDNA-物質コンジュゲートのサブグループ(たとえば、転写因子)が濃縮されていれば、強い信号(強い増幅)を生じるであろう。DNAバーコード配列の第3部分について同じことが言える:すなわち、DNAバーコード配列の第3部分に結合するプライマーは、DELを用いて実施した前のセレクション実験において第3部分がエンコードするDNA-物質コンジュゲートのサブグループ(たとえば、ジンクフィンガータンパク質)が濃縮されていれば、強い信号(強い増幅)を生じるであろう。第1部分に結合するプライマーおよび第3部分に結合するプライマーの両方についてqPCR後に強い信号が得られれば、両方のサブグループに属するDNA-物質コンジュゲート(たとえば、ジンクフィンガー転写因子)が強く濃縮されたことが当業者には分かる。当業者は、本発明のDELおよび適切なプライマーを用いるqPCRのみによってこの情報を得る;すなわち、当業者はDNAシーケンシングを実施する必要がない。これによって、そのライブラリーを用いて実施したセレクション実験後に、はるかに迅速かつ安価なDNAエンコードライブラリーのデコーディングが可能になる。
【0021】
DNAエンコードライブラリーを用いて、バーコードの異なる第1部分に結合する異なる第1プライマーがマトリクスの行を形成しかつバーコードの異なる第2部分に結合する異なる第2プライマーがマトリクスの列である多数の二次元マトリクスを構築することができ、各プライマー対を用いたqPCR後の信号強度がマトリクスの各フィールド(行と列の交差点)に得られる。各プライマー対について得られた信号強度により、セレクション実験後のDNAバーコードの混合物、すなわちDELの、デコンボリューションが可能になる。DNAバーコードの混合物をデコンボリューションできることによって、同定方法の特異度、すなわち真陽性ヒットを偽陽性ヒットから識別する性能が著しく改善され、DNAシーケンシングを実施しなくても“ヒット”を迅速に判定できる。
【0022】
DNAシーケンシングを伴なわないqPCRの実施は経費が高くないので、完全デコーディング実験にはおおよそ50ユーロかかるにすぎないと推定される。よって、本発明方法で作製したDELはそのDELを用いた濃縮実験後のきわめてコスト効率の良い“ヒット”検出を可能にし、機器使用に必要な出資はごくわずかである。さらに、これまでに知られているDELと比較して、本発明のDELによればセレクション実験後の特定のDNAバーコードの存在量についてより定量的な情報を得ることができる。
【0023】
本発明方法は下記において特徴づけることができる:
i)第1コーディング領域DNA配列は少なくとも第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、その際、第1コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第1コーディング領域の第2部分についての情報をエンコードする;ならびに
ii)各バーコード配列は少なくとも、少なくとも第1部分、第2部分、第3部分、および第4部分を含む第2コーディング領域DNA配列を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第2コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第2コーディング領域の第2部分についての情報をエンコードする;
その際、特定のコーディング領域における第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする。
【0024】
本発明のこの態様において、DNAバーコードの第4部分にアニールするさらに他のプライマーを使用でき、かつ異なる4つの部分を備えたさらなるコーディング領域が存在するので、このDNAエンコードライブラリーを用いてより多くの二次元マトリクスを構築できる。1回のqPCR操作だけで、DELを用いたセレクション実験で濃縮された特定グループのDNA-物質コンジュゲートについてきわめて詳細な情報が得られる。
【0025】
さらに、本発明方法は下記において特徴づけることができる:
i)各バーコード配列は少なくとも、少なくとも第1部分、第2部分、第3部分、および第4部分を含む第2コーディング領域DNA配列を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第2コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第2コーディング領域の第2部分についての情報をエンコードする;ならびに
ii)各バーコード配列は少なくとも、少なくとも第1部分、第2部分、第3部分、および第4部分を含む第3コーディング領域DNA配列を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第3コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第3コーディング領域の第2部分についての情報をエンコードする;
その際、特定のコーディング領域における第1部分と第4部分の特定の組合わせは、第1部分によってエンコードされるDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする。
【0026】
さらなるコーディング領域、および少なくとも1つのコーディング領域を5つの部分に分離することを考慮すると、1回のqPCRにおいて、1回のqPCR操作内で、より多くの異なるプライマーを使用でき、DELを用いたセレクション実験において特定グループのDNA-物質コンジュゲートが濃縮されたきわめて詳細な情報を得ることができる。
【0027】
本発明の好ましい態様において、少なくとも1つのコーディング領域DNA配列、場合によりすべてのコーディング領域DNA配列が、少なくとも第1部分、第2部分、第3部分、第4部分および第5部分を含み、その際、第2部分は第4部分と第5部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、コーディング領域の第1部分と第4部分の組合わせおよび第5部分と第3部分の組合わせはコーディング領域、好ましくはすべてのコーディング領域の第2部分についての情報をエンコードし、その際、第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードし、その際、第5部分と第3部分の特定の組合わせは、第3部分単独によってエンコードされるDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする。
【0028】
この態様において、少なくとも1つのコーディング領域は3または4ではなく実際には5つの部分をもつので、少なくとも1つのコーディング領域を増幅するための各qPCRに合計4つのプライマーを使用できる。要するに、第1部分にアニールする1つのプライマー、第3部分にアニールする1つのプライマー、第4部分にアニールする1つのプライマー、および第5部分にアニールする1つのプライマーを使用できる。これにより合計量6つの二次元マトリクスが得られる。よって、1回のqPCRで、DELを用いたセレクション実験において特定グループのDNA-物質コンジュゲートが濃縮されたより詳細な情報が得られる。
【0029】
さらに、本発明によれば、DNAエンコードライブラリーが提供される。このDNAエンコードライブラリーは多数の異なるDNA-物質コンジュゲートを含み、その際、DNA-物質コンジュゲートはそれらの物質およびそれらのDNA分子により互いに異なり、その際、DNA-物質コンジュゲートのDNA分子は異なるDNAバーコード配列を含むことにより互いに異なり、その際、各DNAバーコード配列は少なくとも、少なくとも第1部分、第2部分および第3部分を含む第1コーディング領域DNA配列を含み、その際、第2部分は第1部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、第1コーディング領域の第1部分および第3部分は第2部分に関する情報をエンコードすることを特徴とし、その際、特定の第1部分および/または特定の第3部分は、DNAエンコードライブラリーのすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする。
【0030】
本発明のDNAエンコードライブラリーは下記において特徴づけることができる:
i)第1コーディング領域DNA配列は少なくとも第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、その際、第1コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第1コーディング領域の第2部分についての情報をエンコードする;ならびに
ii)各バーコード配列は少なくとも、少なくとも第1部分、第2部分、第3部分、および第4部分を含む第2コーディング領域DNA配列を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第2コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第2コーディング領域の第2部分についての情報をエンコードする;
その際、特定のコーディング領域の第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする。
【0031】
さらに、本発明のDNAエンコードライブラリーは下記において特徴づけることができる:各バーコード配列は少なくとも第3コーディング領域DNA配列を含み、それは第2コーディング領域と同じDNA鎖上にあり、少なくとも第1部分、第2部分、第3部分、および第4部分を含み、その際、第2部分は第4部分と第3部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、第3コーディング領域の第1部分と第4部分の組合わせおよび第1部分と第3部分の組合わせは両方とも第3コーディング領域の第2部分についての情報をエンコードし、その際、第2コーディング領域およ第3コーディング領域における第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする。
【0032】
本発明の好ましい態様において、DNAエンコードライブラリーは下記を特徴とする:少なくとも1つのコーディング領域DNA配列、場合によりすべてのコーディング領域DNA配列は、少なくとも第1部分、第2部分、第3部分、第4部分および第5部分を含み、その際、第2部分は第4部分と第5部分の間に位置し、第2部分はすべてのDNA分子間で少なくとも2つのヌクレオチドが異なり、その際、コーディング領域の第1部分と第4部分の組合わせおよび第5部分と第3部分の組合わせはコーディング領域、好ましくはすべてのコーディング領域の第2部分についての情報をエンコードし、その際、第1部分と第4部分の特定の組合わせは、第1部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードし、その際、第5部分と第3部分の特定の組合わせは、第3部分単独によってエンコードされるすべてのDNA-物質コンジュゲートのグループより小さな特定グループのDNA-物質コンジュゲートをユニークにコードする。
【0033】
さらなる好ましい態様において、DNAエンコードライブラリーはDNAエンコードライブラリーを提供するための本発明方法により作製でき、あるいは作製される。
さらに、本発明によれば、本発明のDNAエンコードライブラリーをデコードする方法が提供される。その方法は下記を含む:
a)請求項5~8のうちの1つによるDNAエンコードライブラリーを鋳型として用いてqPCRを実施し、その際、下記のプライマーを使用する:
あらゆるDNA-物質コンジュゲートの第1コーディング領域を増幅するためのプライマーAおよびプライマーB;ならびに
第1コーディング領域の異なる第1部分にアニールする多数の異なるプライマーA-xN、および第1コーディング領域の異なる第3部分にアニールする多数の異なるプライマーB-yN;その際、プライマーA-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーAと同一の長さを有し、プライマーB-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーBと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは2から6、好ましくは4までの整数である;
b)各プライマーA-xNおよび各プライマーB-Nの信号値の積を下記の方程式により計算する:
数値 (A-xN)=信号値[(A-xN)+B]・信号値[(A-xN)+(B-N)];および
数値(B-yN)=信号値[(B-yN)+A]・信号値[(B-yN)+(A-xn)],
その際、iは整数であり、特定のプライマーを規定し、“+”記号は2つのプライマーの組合わせを示し;その際、信号値は同一領域にアニールした異なるプライマーを用いたqPCR定量の全セットに関する存在量のパーセントである;そして
c)プライマー(A-xN)および(B-yN)のそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする。
【0034】
本発明のDNAエンコードライブラリーをデコードする方法は、その方法が下記を含むことにおいて特徴づけることができる:
i)各プライマーA-xNおよび各プライマーB-yNについて得られた数値の積を下記の方程式により計算する:
数値(A-B)=数値(A-xN)・数値(B-yN)
ii)プライマー(A-xN)と(B-yN)の組合わせのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマー組合わせはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする。
【0035】
さらに、本発明のDNAエンコードライブラリーをデコードする方法は、qPCRが本発明のDNAエンコードライブラリーを用いて実施されることにおいて特徴づけることができ、その方法は下記を含む:
i)下記のプライマーを用いてqPCRを実施する:
あらゆるDNA-物質コンジュゲートの第1コーディング領域を増幅するための第1コーディング領域プライマーAおよび第1コーディング領域プライマーB;ならびに
第1コーディング領域の異なる第1部分、または第1部分および第4部分にアニールする、多数の異なるプライマーA-xN、ならびに第1コーディング領域の異なる第3部分にアニールする多数の異なるプライマーB-yN;その際、A-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーAと同一の長さを有し、B-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーBと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10、好ましくは8までの整数であり、yは2から6、好ましくは4までの整数である;ならびに
あらゆるDNA-物質コンジュゲートの第2コーディング領域を増幅するための第2コーディング領域プライマーCおよび第2コーディング領域プライマーD;ならびに
第2コーディング領域の異なる第1部分、または第1部分および第4部分にアニールする、多数の異なるプライマーD-yN、ならびに第2コーディング領域の異なる第3部分にアニールする多数の異なるプライマーC-xN;その際、プライマーC-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーCと同一の長さを有し、プライマーD-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーDと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10、好ましくは8までの整数であり、yは2から6、好ましくは4までの整数である;
ii)各プライマーA-xN、各プライマーB-yN、各プライマーC-xNおよび各プライマーD-yNについて得られた信号値の積を下記の方程式により計算する:
数値(A-xN)=信号値[(A-xN)+B]・信号値[(A-xN)+(B-N)];
数値(B-yN)=信号値[(B-yN)+A]・信号値[(B-yN)+(A-xN)],
数値(C-xN)=信号値[(C-xN)+D]・信号値[(C-xN)+(D-n)],
数値(D-yN)=信号値[(D-yN)+C]・信号値[(D-yN)+(C-xn)],
その際、iは整数であり、特定のプライマーを規定し、“+”記号は2つのプライマーの組合わせを示し;その際、信号値は同一領域にアニールした異なるプライマーを用いたqPCR定量の全セットに関する存在量のパーセントである;そして
iii)プライマー(A-xN)、(B-yN)、(C-xN)および(D-yN)のそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする。
【0036】
本発明の好ましい態様において、本発明のDNAエンコードライブラリーをデコードする方法は下記を含む:
i)各プライマーA-xNおよび各プライマーB-yN、各プライマーA-xNおよび各プライマーD-N、ならびに各プライマーC-NおよびD-Nについて得られた数値の積を下記の方程式により計算する:
数値(A-B)=数値(A-xN)・数値(B-yN)
数値(A-D)=数値(A-xN)・数値(D-yN)
数値(C-D)=数値(C-xN)・数値(D-yN)
ii)各プライマーiについての数値(A-B)、(A-D)および(C-D)の積を下記の方程式により計算する:
数値=数値(A-B)・数値(A-D)・数値(C-D)
iii)得られた積である数値を比較し、その際、高い数値をもつプライマー組合わせiはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする。
【0037】
さらなる好ましい態様において、本発明のDNAエンコードライブラリーをデコードする方法は本発明のDNAエンコードライブラリーを鋳型として用いてqPCRを実施することを特徴とし、その方法は下記を含む:
i)下記のプライマーを用いてqPCRを実施する:
あらゆるDNA-物質コンジュゲートの第1コーディング領域を増幅するための、第1コーディング領域プライマーAおよび第1コーディング領域プライマーB;ならびに
第1コーディング領域の異なる第1部分、または第1部分および第4部分にアニールする、多数の異なるプライマーA-xN、ならびに第1コーディング領域の異なる第3部分にアニールする多数の異なるプライマーB-yN;その際、A-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーAと同一の長さを有し、Bは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーB-yNと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10、好ましくは8までの整数であり、yは2から6、好ましくは4までの整数である;ならびに
あらゆるDNA-物質コンジュゲートの第2コーディング領域を増幅するための、第2コーディング領域プライマーCおよび第2コーディング領域プライマーD;ならびに
第2コーディング領域の異なる第1部分、または第1部分および第4部分にアニールする、多数の異なるプライマーD-yN、ならびに第2コーディング領域の異なる第3部分にアニールする多数の異なるプライマーC-xN;その際、プライマーC-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーCと同一の長さを有し、プライマーD-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーDと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10、好ましくは8までの整数であり、yは2から6、好ましくは4までの整数である;
あらゆるDNA-物質コンジュゲートの第3コーディング領域を増幅するための、第3コーディング領域プライマーEおよび第3コーディング領域プライマーF;ならびに
第3コーディング領域の異なる第1部分にアニールする多数の異なるプライマーE-xN、および第3コーディング領域の異なる第3部分にアニールする多数の異なるプライマーF-yN;その際、プライマーE-xNは5’-末端においてx個のヌクレオチドを短縮することによるコーディング領域プライマーEと同一の長さを有し、プライマーF-yNは5’-末端においてy個のヌクレオチドを短縮することによるコーディング領域プライマーFと同一の長さを有し、NはA、T、GまたはCを表わし、xおよびyはそれらのプライマーの3’-末端におけるA、T、GまたはCのいずれかの総数を表わし、その際、xは6から10、好ましくは8までの整数であり、yは2から6、好ましくは4までの整数である;
ii)各プライマーA-xN、各プライマーB-yN、各プライマーC-xN、各プライマーD-yN、各プライマーE-xNおよび各プライマーF-yNの信号値の積を下記の方程式により計算する:
数値(A-xN)=信号値[(A-xN)+B]・信号値[(A-xN)+(B-N)];
数値(B-yN)=信号値[(B-yN)+A]・信号値[(B-yN)+(A-xN)],
数値(C-xN)=信号値[(C-xN)+D]・信号値[(C-xN)+(D-N)],
数値(D-yN)=信号値[(D-yN)+C]・信号値[(D-yN)+(C-xN)],
数値(E-xN)=信号値[(E-xN)+F]・信号値[(E-xN)+(F-yN],
数値(F-yN)=信号値[(F-yN)+E]・信号値[(F-yN)+(E-xN)],
その際、iは整数であり、特定のプライマーを規定し、“+”記号は2つのプライマーの組合わせを示し;その際、信号値は同一領域にアニールした異なるプライマーを用いたqPCR定量の全セットに関する存在量のパーセントである;そして
iii)プライマー(A-xN)、(B-yN)、(C-xN)、(D-yN)、(E-xN)および(-yN)のそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする。
【0038】
本発明のDNAエンコードライブラリーをデコードする方法は下記を含むことができる:
i)各プライマーA-xNおよび各プライマーB-yNについて、各プライマーA-xNおよび各プライマーD-Nについて、各プライマーC-NおよびD-Nについて、各プライマーA-xNおよび-yNについて、各プライマー-xNおよびD-yNについて、ならびに各プライマー-xNおよび-yNについて得られた数値の積を下記の方程式により計算する:
数値(A-B)=数値(A-xN)・数値(B-yN)
数値(A-D)=数値(A-xN)・数値(D-yN)
数値(C-D)=数値(C-xN)・数値(D-yN)
数値(A-F)=数値(A-xN)・数値(F-yN)
数値(E-D)=数値(E-xN)・数値(D-yN)
数値(E-F)=数値(E-xN)・数値(F-yN)
ii)各プライマー組合わせiについて、数値(A-B)、(A-D)、(C-D)、(A-F)、(E-D)および(E-F)の積を下記の方程式により計算する:
数値=数値(A-B)・数値(A-D)・数値(C-D)・数値(A-F)・数値(E-D)・数値(E-F)
iii)得られた積である数値を比較し、その際、高い数値をもつプライマー組合わせiはそのDNAエンコードライブラリー中に高い濃度で存在するDNA-物質コンジュゲートをコードする。
【0039】
好ましい態様において、本方法は下記の計算による数値i’の計算を含むことを特徴とする:
数値i’=log10[数値(A-B)・数値(A-D)・数値(C-D)・数値(A-F)・数値(E-D)・数値(E-F)]。
【0040】
以下の図面および実施例を参照して、本発明による対象をより詳細に説明する;それらは本発明の対象をここに示す特定の態様に限定することを意図したものではない。
図1Aは、単一コーディング領域2をもつDNAコード1(コーディング領域III)についてのqPCR-マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。EおよびFは一次プライマーであり、ExeおよびFxfは二次プライマーである。一次プライマーEは第1領域 #1の上流(すなわち、5’-末端側)に結合し、一次プライマーFは第3領域 #3の上流(すなわち、5’-末端側)に結合する。2つの一次プライマーE、Fのみを用いるqPCRは、コーディング領域IIIをもつDNAエンコードライブラリーのすべてのDNA-物質コンジュゲートのDNAバーコードを増幅する。少なくとも1つの一次プライマーE、F、および少なくとも1つの二次プライマーExe、Fxfを用いるqPCRを、“一次qPCR”と呼ぶ。図1Aは、3つのコード部分(サブコード)#1、#2、#3をもつ単一コーディング領域IIIを含むqPCR鋳型を示す。コーディング領域IIIの第2部分 #2の配列はユニークサブコードである。第1部分 #1と第3部分 #3のそれぞれの組合わせも、ユニークコードを表わすことができる。したがって、第2部分 #2の配列は第1部分 #1と第3部分 #3の組合わせに対応する。各コード部分(サブコード)#1、#2、#3について、いずれかの配列対間(たとえば、2つの異なるxe配列間)の数の差nは最小であるが、nは≧2でなければならない。これは、コード部分#1、#2、#3は互いに少なくとも2つのヌクレオチドが異なることを意味する。
【0041】
図1Bは、2つのコーディング領域、すなわちコーディング領域Iおよびコーディング領域IIをもつDNAコードについてのqPCR-マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。A、B、CおよびDは一次プライマーであり、Axa、Bxb、CxcおよびDxdは二次プライマーであり、AxayaおよびDxdydは三次プライマーである。少なくとも2つの三次プライマーの使用を含むqPCRを“三次PCR”と呼ぶ。図1Bは2つの異なるコーディング領域I、IIを含むqPCR鋳型を示し、その際、第1コーディング領域Iは4つのコード部分(サブコード)#1、#2、#3、#4をもち、第2コーディング領域IIも4つのコード部分(サブコード)#1、#2、#3、#4をもつ。各コーディング領域I、IIの第2部分 #2の配列はユニークサブコードを表わす。各コーディング領域I、IIの第1部分 #1と第3部分 #3のそれぞれの組合わせも各コーディング領域I、IIのユニークサブコードを表わすことができる。この場合、各コーディング領域I、IIの第2部分 #2の配列は、各コーディング領域I、IIの第1部分 #1の配列と第3部分 #3の配列の組合わせに対応する。第1部分 #1と第4部分 #4のそれぞれの組合わせも、1つのユニーク構築ブロックを表わすことができる。この場合、各コーディング領域I、IIの第2部分 #2の配列は、同様に各コーディング領域I、IIの第1部分 #1の配列と第4部分 #4の配列の組合わせに対応する。各コード部分(サブコード)#1、#2、#3、#4について、いずれかの配列対間(たとえば、2つの異なる#2配列間)の数の差nは最小であるが、nは≧2でなければならない。これは、各コード部分 #1、#2、#3、#4は他のコード部分 #1、#2、#3、#4と少なくとも2つのヌクレオチドが異なることを意味する。
【0042】
図2は、3つのコーディング領域I、II、IIIをもつDNAコードについてのqPCR-マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。A、B、CおよびDはそれぞれ一次プライマーである。Axa、Bxb、Cxc、Dxd、MxmおよびNxnはそれぞれ二次プライマーである。Axaya、Dxdyd、MxmymおよびNxnynはそれぞれ三次プライマーである。少なくとも2つの三次プライマーを用いるqPCRを“三次PCR”と呼ぶ。図2は3つの異なるコーディング領域I、II、IIIを含むqPCR鋳型を示し、その際、第1コーディング領域Iは4つのコード部分(サブコード)#1、#2、#3、#4をもち、第2コーディング領域IIも4つのコード部分(サブコード)#1、#2、#3、#4をもち、第3コーディング領域IIIは5つのコード部分(サブコード)#1、#2、#3、#4、#5をもつ。各コーディング領域I、II、IIIのそれぞれの第2コード部分 #2の配列はユニークサブコードである。コード部分 #1とコード部分 #3、コード部分 #1とコード部分 #4、およびコード部分 #1とコード部分 #5のそれぞれの組合わせもユニークサブコードを表わすことができる。たとえば、コード部分 #2の配列はコード部分 #1とコード部分 #3の組合わせに対応する。各コード部分(サブコード)について、いずれかの配列対間(たとえば、2つの異なるab配列間)の数の差nは最小であるが、nは≧2でなければならない。これは、各コード部分 #1、#2、#3、#4、#5は他のコード部分コード部分 #1、#2、#3、#4、#5と少なくとも2つのヌクレオチドが異なることを意味する。
【0043】
図3A、3Bおよび3Cは、3つの異なる鋳型としての3つのコーディング領域I、II、IIIをもつDNAバーコード、ならびにコーディング領域Iに結合するための20の異なる一次プライマーAおよび20の異なる一次プライマーB(参照:図3Aのマトリクス“A+Bを用いたQ-PCR”、列=異なるプライマーA、行(line)=異なるプライマーB)、コーディング領域IIに結合するための20の異なる一次プライマーCおよび20の異なる一次プライマーD(参照:図3Bのマトリクス“C+Dを用いたQ-PCR”、列=異なるプライマーC、行(line)=異なるプライマーD)、ならびにコーディング領域IIIに結合するための20の異なる一次プライマーEおよび20の異なる一次プライマーF(参照:図3Cのマトリクス“E+Fを用いたQ-PCR”、列=異なるプライマーE、行(line)=異なるプライマーF)を用いるqPCR後に得られたqPCRマトリクスを示す。マトリクスの代表的結果を図3Dの“E+F”に示す;それは最強の増幅信号をもつプライマー対をそれらの得られた(正規化)増幅信号と共に挙げる。その表から、最強の増幅信号はプライマー対E3とF3(25%)、E18とF11(20%)、E3とF11(15%)、E11とF3(15%)、およびE11とF17(15%)を用いて得られ、中等度の増幅信号はプライマー対E3とF17(10%)を用いて得られたことを導き出せる。図3Dの表“E+F”の下に、得られた結果を棒グラフでも示す。得られた結果から、たとえばプライマー対E3とF3が結合するDNA-物質コンジュゲートはDNAエンコードライブラリー(濃縮実験の後)中で高い濃度をもっていたこと、およびたとえばプライマー対E3とF17が結合するDNA-物質コンジュゲートはDNAエンコードライブラリー(濃縮実験の後)中でより低い濃度をもっていたことを導き出せる。信号をもたないプライマー対(たとえば、E1とF1)が結合するDNA-物質コンジュゲートはDNAエンコードライブラリー(濃縮実験の後)中に存在しなかったことも結論できる。それぞれ特定のDNAコーディング領域に結合した物質は分かっているので、この方法によって(DEL)セレクション実験後に高濃度で存在する物質を迅速に高感度で同定できる。
【0044】
図4は、図3からのqPCRマトリクス“A+Bを用いたQ-PCR”(コーディング領域Iの増幅)および“C+Dを用いたQ-PCR”(コーディング領域IIの増幅)の結果、ならびに同様にプライマー対AとDを用いた二次PCR(IとIIの間のコーディング領域;図2を参照)の結果を示す。プライマー対A+Dを用いたqPCRは、特定のプライマー対A11とD15(20%)、A11とD2(15%)、A2とD18(15%)について強い増幅信号、プライマー対A2とD8(10%)、A11とD18(10%)、A17とD18(10%)、A17とD15(10%)およびA17とD8(10%)について中等度の増幅信号を生じた。同定したAプライマーはそれぞれ特定のコーディング領域Iに結合し、同定したDプライマーは特定のコーディング領域IIに結合する。これは、強い信号を生じたプライマーAとDは、濃縮実験後にDNAエンコードライブラリーにおいて濃縮されていたにちがいないコーディング領域IおよびIIをコードすることを意味する。2つのコーディング領域IおよびIIは単一のDNA鎖上に位置するにちがいないことも結論できる;さもなければ増幅信号は得られなかったであろうから。プライマー対AとDを用いて得られた結果を他のプライマー対AとBおよびCとDの結果と組み合わせるために、それぞれ特定のプライマー対について得られた数値の積を方程式 数値コーディング領域I-II=数値マトリクス-A+D・数値マトリクス-A+B・数値マトリクス-C+Dにより計算する。高い増幅信号を生じた特定のプライマーA、B、CおよびDは、結果的に高い数値コーディング領域I-IIをもつ。こうして、得られた数値コーディング領域I-IIによって多量に存在するDNA-バーコードに結合したにちがいないプライマーを同定することができ、こうして(DEL)セレクション実験後に多量に存在していた物質(DNA-バーコードに結合したもの)を同定することができる。
【0045】
図5は、方程式 数値コーディング領域I-II=数値マトリクス-A+D・数値マトリクス-A+B・数値マトリクス-C+Dに従って最高の積(参照:y軸上の任意単位における絶対値)を生じたコーディング領域I(A+B)とII(C+D)の36の異なる組合わせのプロットを示す。このプロットにおいて、x軸上の数値2、4、23、29および32をもつコーディング領域IとIIの組合わせが最高スコアを達成したことを視覚同定できる。これらの数値は下記の5つの異なる組合わせのコーディング領域IとIIを表わす:A11B4-C19D2(no.2)、A11B17-C19D2(no.4)、A2B4-C10-D18(no.23)、A11B4-C19D15(no.29)およびA11B17-C19D15(no.32)。当然、どの物質(または複数の物質)がこれら5つの異なる組合わせをエンコードするかは分かっている。こうして、(DEL)セレクション実験で強く濃縮された5つの異なる(グルーブの)物質を同定することができる。
【0046】
図6は、鋳型としての3つのコーディング領域I、II、IIIをもつDNAバーコード、コーディング領域Iについての20の異なる一次プライマーAおよびB、コーディング領域IIについての20の異なる一次プライマーCおよびD、コーディング領域I-IIについての(同じ)20の異なる一次プライマーAおよびD、ならびにコーディング領域IIIについての20の異なる一次プライマーEおよびFを用いるqPCR後に得られたqPCRマトリクスの一部を示す。数値コーディング領域I-II=数値マトリクス-A+D・数値マトリクス-A+B・数値マトリクス-C+Dを計算した後、9つのプライマー対A17B17-C1D15、A2B4-C10D18、A11B4-C1D15、A11B4-C19D15、A11B4-C19D2、A11B17-C1D15、A11B17-C19D15、A11B17-C10D18およびA11B17-C19D2によりコードされるコーディング領域I-IIについて有意値が得られることが明らかになった。方程式 数値コーディング領域III=数値マトリクス-F+Eによってコーディング領域IIIについての最高値も決定され、コーディング領域IIIについて5つのプライマー対F3E3、F11E18、F3E11、F11E3およびF17E11によって高い数値が得られることが見出された。上記で同定した9つのコーディング領域I-IIが第1グループの9つの異なる物質をエンコードし、上記で同定した5つのコーディング領域IIIが第2グループの5つの異なる物質をエンコードするならば、第1グループのおよび第2グループの物質の組合わせがqPCR実験前に高い濃度で存在していたにちがいない、すなわち(DEL)セレクション実験によって強く濃縮されたにちがいないということになる。
【0047】
図7は、それぞれがDNAバーコードでタグ付けされた306の化合物をもつ中等度DELについてのデコーディングプロセスを示す。DELセレクション実験の前と後に、プライマー対EとF、プライマー対ExeとF、プライマー対EとFxf、プライマー対Exe1とFxf11、およびプライマー対Exe3とFxf17を用いる一次qPCRを実施した。セレクション前に得られたC値を図7の左のマトリクスに示し、セレクション後に得られたC値を中央のマトリクスに示し、△C値を右のマトリクスに示す。プライマー対EとFの△Cq値より低いプライマー対の△Cq値は、DNA-物質コンジュゲートの濃縮の指標となる。“△C”-マトリクスにみられるように、サブコーディング領域E-Fxf11は10.0の△C値をもち、それはサブコーディング領域E-Fについての13.1の△C値より低い(すなわち、対照より低い)。これは、サブコーディング領域E-Fxf11が濃縮されていたことを意味する。それの△C値10.0がサブコーディング領域E-Fについての13.1の△C値より低い(すなわち、対照より低い)サブコーディング領域Exe1-Fについても同じことが言える。こうして、一次qPCRの結果は、DELセレクション実験後に、プライマーExe1およびFxf11が結合するサブコーディング領域によってコードされる物質(単数または複数)はプライマーExe3およびFxf17が結合するサブコーディング領域によってコードされる物質より強く濃縮されていたことの指標となる。さらに、それらのデータを確認するために、プライマー対ExeとFxfを用いて二次qPCRを実施した。その二次qPCRによって、サブコーディング領域Exe1-Fxf11がサブコーディング領域Exe3-Fxf17より強く濃縮されることが確認された(参照:図7のマトリクス“△C”:列Exe1および行Fxf11のフィールドの数値は列Exe3および行Fxf17のフィールドの数値よりはるかに低く、かつ対照である列Eおよび行Fのフィールドの数値よりはるかに低い)。要するに、一次および二次qPCRは共に、Exe1-Fxf11サブコーディング領域に結合した物質(単数または複数)がDELセレクション実験後に強く濃縮されていたにちがいないことを立証する。
【0048】
図8は、それぞれがDNAバーコードでタグ付けされた410の化合物をもつ大きなDELの例を示す。これらのライブラリーはDNAの部分変性合成により作製された。図8は、1つの(一定の)プライマーEおよび多様な異なるプライマーFを用いる一次PCRを実施するためのセットアップを示し、その際、各プライマーFは特定のサブグループのライブラリー、具体的にはライブラリー(合計410の化合物をもつ)の1/4の化合物をコードし、その際、nは0から5までの整数である。これは以下のことを意味する:6つのプライマーFを用いるならば、第1プライマーFはライブラリーのすべての化合物の1/4、すなわちライブラリーのすべての化合物(=410=1048576の化合物)をコードし、プライマーFはライブラリーのすべての化合物の1/4のみ(=262144の化合物)をコードし、プライマーFはライブラリーのすべての化合物の1/16のみ(=65536の化合物)をコードし、プライマーFはライブラリーのすべての化合物の1/64のみ(=16384の化合物)をコードし、プライマーFはライブラリーのすべての化合物の1/256のみ(=4096の化合物)をコードし、プライマーFはライブラリーのすべての化合物の1/1024のみ(=1024の化合物)をコードする。これは、qPCRが実施された後、DEL実験において選択されたエンコードされた物質のグループを有意に絞り込めることを意味する;エンコードされた物質であってプライマーF(nは0~5である)で増幅できないものはqPCRにおいて信号を生じないからである。たとえば、プライマーEとプライマーFの組合わせが一次qPCRにおいて信号を生じることができなければ、すべての化合物のうち3/4、すなわち1048576の化合物のうち786432の化合物はそのqPCRによって増幅できず、よって一次qPCRの前のDELセレクション実験によって濃縮されなかったことが明らかである。よって、DELライブラリーのすべての化合物のうち残り1/4のみ(=262144の化合物)が、(DEL)セレクション実験で濃縮されていたことについて問題となる。
【0049】
図9は、それぞれがDNAバーコードでタグ付けされた420の化合物をもつきわめて大きなDELの他の例を示す。主な操作は図8に開示した410の化合物をもつDELに関するものと同じである。しかし、DELのサイズが大きいため、5より多い異なるプライマーFを用いて一次PCRを実施すれば有益である。具体的には、この場合にはnが0から10までの整数であれば有益である。これは、11のプライマーFを用いるならば、第1プライマーFはライブラリーのすべての化合物をコードし、最後のプライマーF10はライブラリーのすべての化合物のうち1/410のみ(=1048576の化合物)をコードすることを意味する。これは、qPCRを実施した後、DEL実験で選択されていたエンコードされた物質のグループが有意に狭まったことを意味する-たとえば、qPCRにおいてプライマーFで信号を生じないDNA-物質コンジュゲートのDNAバーコードは、そのDNAバーコードが420の化合物のうちDEL濃縮実験で濃縮されなかった3/4のグループ(≒8.2・1011の化合物)に属することを意味する。よって、関連する濃縮されたDNA-物質コンジュゲートのグループは420の化合物のうち1/4(≒2.7・1011の化合物)に狭まった。n=1からn=10まで増大する各プライマーFを用いると、関連化合物のグループはさらに狭まる。プライマーF10で見つかる増幅信号は、そのDNA-物質コンジュゲートが合計420の化合物(≒1.1・1012の化合物)のうち410のサブグループ(≒1・10の化合物)内にあることを意味する。
【0050】
図10は、DNAエンコードライブラリー(DEL)内のDNA-CBS-コンジュゲートを酵素である炭酸脱水素酵素IIを用いたセレクションによって濃縮した後の物質4-カルボキシベンゼンスルホンアミド(以下において:“CBS”)の同定を示す。3つのプライマー1b,2b,3bと対合する3つのプライマー1a,2a,3aを用いて小規模qPCRマトリクスを構築した。プライマー対1a,1bはライブラリーのDNA-物質コンジュゲートのすべてのDNA-バーコードにアニールし、よって全ライブラリーのDNAバーコードを増幅する能力をもつ。プライマー2aはDNA-CBS-コンジュゲートを含むサブ-ライブラリーをカバーし、プライマー2bはDNA-CBS-コンジュゲートを含む他のサブ-ライブラリーをカバーする。プライマー2aと2bの組合わせは専らCBSに割り当てることができる。プライマー3aはDNAバーコードにコンジュゲートしたテオブロミン(以下において:“Theo”)(=DNA-Theo-コンジュゲート)を含むサブ-ライブラリーをカバーし、プライマー3bはDNA-Theo-コンジュゲートを含む他のサブ-ライブラリーをカバーする。プライマー3aと3bの組合わせは専らTheoに割り当てることができる。△Cqは、セレクションの前と後のqPCRサイクルにおける差である。小さい数値は大きい濃縮を反映する。△Cq(1a-1b)>△Cq(2a-1b)≒△Cq(1a-2b)>△Cq(2a-2b)は、CBSが顕著に増強されていることを指摘した。△Cq(1a-1b)<△Cq(3a-1b)≒△Cq(1a-3b)≒△Cq(3a-3b)は、Theoが濃縮されていないことを示した。
【0051】
図11は、第1物質Sが第1コーディング領域DNA配列Iおよび第2コーディング領域DNA配列に化学的に共有結合しており、第2物質Sが第3コーディング領域DNA配列IIIに化学的に共有結合しているDNA-物質コンジュゲートを示す。各コーディング領域DNA配列I、II、IIIは、特定のプライマーが結合する(すなわち、qPCRに際してアニールする)ことができる第1部分 #1、および第3部分 #3をもつ。プライマーP2’(5’-gctgttccca cattgcgt-3’、SEQ-ID Nr.1)は第1コーディング領域DNA配列Iの第1部分 #1に結合し、プライマーP2Y(5’-ccttctggat tcggtcggag caccatc-3’、SEQ-ID Nr.2)は第1コーディング領域DNA配列Iの第3部分 #3に結合し、プライマーP2Y’(5’-gatggtgctc cgaccgaatc cagaagg-3’、SEQ-ID Nr.3)は第2コーディング領域DNA配列IIの第1部分 #1に結合し、プライマーP1Y(5’-ggaggtgtag acgacagagt atttgactgt cagg-3’、SEQ-ID Nr.4)は第2コーディング領域DNA配列IIの第3部分 #3に結合し、プライマーP4’(5’-cagatcgagc aactccac-3’、SEQ-ID Nr.5)は第3コーディング領域DNA配列IIIの第1部分 #1に結合し、プライマーP5(5’-tggtctcagc cgccctat-3’、SEQ-ID Nr.6)は第3コーディング領域DNA配列IIIの第3部分 #3に結合する。物質SがDNAエンコードライブラリーを用いたセレクション実験後に濃縮されていれば、プライマー対P2’およびP2Y、プライマー対P2Y’およびP1Y、ならびにプライマー対P4’およびP5を用いる増幅はそれぞれqPCRにおいて強い増幅信号を生じ、それによって物質Sの同定が可能になる。
【実施例
【0052】
実施例1 - 単一コーディング領域をもつDNAバーコードを含むDEL
単一コーディング領域のみを含むDNAコードについて、各コードは3つの部分、#1(第1部分)、#2(第2部分)および#3(第3部分)をコードする。それぞれの#2配列はユニークコードであり、一方、#1と#3の組合わせもユニークコードを表わすことができる(参照:たとえば図1A)。したがって、#2の配列は#1と#3の組合わせに対応する。
【0053】
各部分について、いずれかの配列対間(たとえば、2つの異なる#1配列間)の数の差nは最小であるが、nは≧2でなければならない。
実施例2 - 2つのコーディング領域をもつDNAバーコードを含むDEL
2つのコーディング領域を含むDNAコードについて、各サブコードは4つの部分、たとえば第1コーディング領域 #1(第1部分)、#2(第2部分)、#3(第3部分)および#4(第4部分)、ならびに第2コーディング領域 #1(第1部分)、#2(第2部分)、#3(第3部分)および#4(第4部分)をもつ(参照:たとえば図1B)。それぞれの#2(第2部分)配列はユニークサブコードであり、一方、#1、#3および#4のそれぞれの組合わせは#2に対応し、#1、#3および#4のそれぞれの組合わせは#2に対応する。
【0054】
各部分について、いずれかの配列対間(たとえば、2つの異なる#1配列間)の数の差nは最小であるが、nは≧2でなければならない。
実施例3 - 2つより多いコーディング領域をもつDNAバーコードを含むDEL
2つより多いコーディング領域をもつDNAコード(参照:たとえば図1Bまたは図2)について、両端の2つのサブコードを実施例2に従って設計し、それらの間のサブコード(単数または複数)を実施例1、実施例2または実施例4のいずれかに従って設計する。スプリット&プール(split-and-pool)法を用いて高品質DELを合成できる可能性はきわめて低い。したがって、4未満のサブコードを含むDELが好ましい。
【0055】
実施例4 - 5つのサブコードをもつDNAバーコードを含むDEL
このDELのDNAバーコードは5つの部分、#1(第1部分)、#2(第2部分)、#3(第3部分)、#4(第4部分)および#5(第5部分)をもつ。
【0056】
それぞれの#2配列(第2部分)はユニークサブコードであり、一方、#1と#3のそれぞれの組合わせもユニークサブコードを表わすことができる。したがって、#2の配列は#1と#3の組合わせに対応する。#1と#4のそれぞれの組合わせもユニークサブコードを表わすことができる。したがって、#2の配列は#1と#4の組合わせに対応する。#1と#5のそれぞれの組合わせもユニークサブコードを表わすことができる。したがって、#2の配列は#1と#5の組合わせに対応する。
【0057】
各部分について、いずれかの配列対間(たとえば、2つの異なる#1配列間)の数の差nは最小であるが、nは≧2でなければならない。
実施例5 - デコーディングプロセスの記載:1つの(サブ)コードのデコーディング
プライマーAをu個の異なるプライマーB-xbと共に用い、プライマーBをv個の異なるプライマーA-xaと共に用いて、第1コーディング領域Iについて一次qPCRマトリクスを構築する。したがって、得られるマトリクスのサイズはu・vである(参照:たとえば図3)。同じマトリクスを第2コーディング領域IIおよび第3コーディング領域IIIについても構築することができる。
【0058】
B-xbおよびA-xaの対を用いて第1コーディング領域Iについて二次qPCRマトリクスを構築するが、B-xbおよびA-xaは一次マトリクスにおける信号強度に従って選択される。同じ二次マトリクスを第2コーディング領域IIおよび第3コーディング領域IIIについて構築することができる。各構築ブロックについてのランキングをこうして結論することができる。
【0059】
2つのサブコードを含む配列について、A-xaおよびD-xdを用いて追加の二次qPCRマトリクスを構築することができるが、A-xaおよびD-xdは一次マトリクスにおける信号強度に従って選択される。
【0060】
2つのサブコードマトリクス(A-xa + B-xb、およびC-xc + D-xd)との組合わせで、組合わせのランキングを特定のアルゴリズム、たとえば
数値=数値 マトリクス-A+D・数値 マトリクス-A+B・数値 マトリクス-C+D
に基づいて結論することができ、その際、数値はDEL中の特定のDNAバーコードに関係しそれの量に比例する数値である。言い換えると、その数値は2つの構築ブロックおよび2つのサブコードを連結することによるコンビナトリアル合成から得られた個々のDNA配列(バーコード構造)に関係する。
【0061】
数値ランキングをさらに検証するために、A-xa-yaおよびD-xd-ydを用いて追加の三次qPCRマトリクスを構築することができるが、A-xa-yaおよびD-xd-ydは一次および二次マトリクスならびに得られる数値ランキングに従って選択される。
【0062】
A、DならびにすべてのA-xa-yaおよびD-xd-ydを用いて完全マトリクスを構築することもできるが、それは前記の方法より著しく経費がかかるであろう。
この方法は2より多いサブコードを含むDELについて十分な定量的デコーディング解を提供することはできない。しかし、各種の一次、二次および三次rtPCRマトリクスを組み合わせることにより、幾つかのサブコードを含むDNAコードに対応する特定の化合物iについての数値を提供することができる。すべてのフォワードおよびバックワードプライマーを組み合わせてマトリクスを構築することができる。
【0063】
たとえば、いずれかのプライマーA、A-xa、A-xa-yaをいずれかのプライマーB、B-xb、N、N-yn、N-xn-yn、D、D-xd、D-xd-ydと組み合わせて、QPCRマトリクスを構築することができる。特定の化合物についての数値を特定のアルゴリズム、たとえば
数値=log10(数値 マトリクス-A+D・数値 マトリクス-A+N・数値 マトリクス-M+D・数値 マトリクス-A+B・数値 マトリクス-C+D・数値 マトリクス-M+N
に従って計算することができ、その際、数値 マトリクス-A+D、数値 マトリクス-A+Nおよび数値 マトリクス-M+Dは二次もしくは三次マトリクスのいずれかからのものまたはそれらを組み合わせたものであってもよく、数値 マトリクス-A+B・数値 マトリクス-C+D・数値 マトリクス-M+Nは二次マトリクスからのものである。
【0064】
参照記号のリスト
DBC: DNAバーコード配列;
S: 物質;
I: 第1コーディング領域DNA配列;
II: 第2コーディング領域DNA配列;
III: 第3コーディング領域DNA配列;
#1: コーディング領域DNA配列の第1部分;
#2: コーディング領域DNA配列の第2部分;
#3: コーディング領域DNA配列の第3部分;
#4: コーディング領域DNA配列の第4部分;
#5: コーディング領域DNA配列の第5部分;
A、B、C、D、
E、F、M、N: 一次プライマー;
xa、Bxb、Cxc
xd、Exe、Fxf
xm、Nyn: 二次プライマー;
xaya、Dxdyd
xmym、Nxnyn: 三次プライマー;
1a、1b: すべてのDBSに結合する一次プライマー;
2a、2b: CBSのDBSのみに結合する二次プライマー;
3a、3b: Theoのみに結合する二次プライマー;
P2’: コーディング領域Iの第1部分 #1に結合するプライマー;
P2Y: コーディング領域Iの第3部分 #3にアニールするプライマー;
P2Y’:コーディング領域IIの第1部分 #1にアニールするプライマー;
P1Y: コーディング領域IIの第3部分 #3にアニールするプライマー;
P4’: コーディング領域IIIの第1部分 #1にアニールするプライマー;
P5: コーディング領域IIIの第3部分 #3にアニールするプライマー
図1
図2
図3A
図3B
図3C
図3D
図4
図5
図6
図7
図8
図9
図10
図11
【配列表】
0007397464000001.app