特許7397464 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ テーウー　ドレスデンの特許一覧

特許7397464ＤＮＡエンコードライブラリーを提供するための方法、ＤＮＡエンコードライブラリー、およびＤＮＡエンコードライブラリーをデコードする方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3A
3B
3C
3D
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-12-05

(45)【発行日】2023-12-13

(54)【発明の名称】ＤＮＡエンコードライブラリーを提供するための方法、ＤＮＡエンコードライブラリー、およびＤＮＡエンコードライブラリーをデコードする方法

(51)【国際特許分類】

C12N 15/10 20060101AFI20231206BHJP

G01N 33/53 20060101ALI20231206BHJP

C40B 20/04 20060101ALI20231206BHJP

C40B 40/06 20060101ALI20231206BHJP

【ＦＩ】

C12N15/10 Z ZNA

G01N33/53 M

C40B20/04

C40B40/06

【請求項の数】 15

【外国語出願】

(21)【出願番号】P 2019142687

(22)【出願日】2019-08-02

(65)【公開番号】P2020054337

(43)【公開日】2020-04-09

【審査請求日】2022-05-09

(31)【優先権主張番号】18186948.8

(32)【優先日】2018-08-02

(33)【優先権主張国・地域又は機関】EP

(73)【特許権者】

【識別番号】519282720

【氏名又は名称】テーウードレスデン

(74)【代理人】

【識別番号】100118902

【弁理士】

【氏名又は名称】山本修

(74)【代理人】

【識別番号】100106208

【弁理士】

【氏名又は名称】宮前徹

(74)【代理人】

【氏名又は名称】中西基晴

(72)【発明者】

【氏名】イーシン・チャン

(72)【発明者】

【氏名】フランチェスコ・レッドダビデ

(72)【発明者】

【氏名】メィイン・キュイ

(72)【発明者】

【氏名】ヘレナ・アンドレード

(72)【発明者】

【氏名】シュテファン・ハイデン

【審査官】藤山純

(56)【参考文献】

【文献】特表２０１５－５３３２９６（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１７／０１９８３３６（ＵＳ，Ａ１）

【文献】国際公開第２０１８／００５７２０（ＷＯ，Ａ１）

【文献】LI, Y. et al.，Quantitative PCR is a valuable tool to monitor the performance of DNA-encoded chemical library selections，Chembiochem，18(9)，2017年03月16日，pp.848-852

【文献】JORG, S. and DARIO, N.，Dual-pharmacophore DNA-encoded chemical libraries，Current opinion in chemical biology，vol. 26，2015年，pp.99-103

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｎ１５／１０

Ｇ０１Ｎ３３／５３

Ｃ４０Ｂ２０／０４

Ｃ４０Ｂ４０／０６

ＪＳＴＰｌｕｓ／ＪＭＥＤＰｌｕｓ／ＪＳＴ７５８０（ＪＤｒｅａｍＩＩＩ）

ＣＡｐｌｕｓ／ＭＥＤＬＩＮＥ／ＥＭＢＡＳＥ／ＢＩＯＳＩＳ（ＳＴＮ）

(57)【特許請求の範囲】

【請求項1】

ＤＮＡエンコードライブラリーを提供するための、下記を含む方法：
ａ）異なるＤＮＡバーコード配列を含むことにより互いに異なる多数のＤＮＡ分子を合成し、その際、各ＤＮＡバーコード配列は少なくとも第１コーディング領域ＤＮＡ配列を含み、第１コーディング領域ＤＮＡ配列は少なくとも第１部分、第２部分および第３部分を含み、その際、第２部分は第１部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なる；そして
ｂ）多数の異なるＤＮＡ分子のそれぞれを少なくとも１つの特定の物質に結合させて異なるＤＮＡ－物質コンジュゲートを形成し、その際、ＤＮＡ－物質コンジュゲートは特定の物質およびそれらのＤＮＡ分子によって互いに異なる；
第１部分および第３部分は第１コーディング領域の第２部分に関する情報をエンコードし、その際、特定の第１部分および／または特定の第３部分は、ＤＮＡエンコードライブラリー中のすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードすることを特徴とする。

【請求項2】

ｉ）第１コーディング領域ＤＮＡ配列は少なくとも第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、その際、第１コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第１コーディング領域の第２部分についての情報をエンコードする；ならびに
ｉｉ）各バーコード配列は少なくとも第２コーディング領域ＤＮＡ配列を含み、第２コーディング領域ＤＮＡ配列は少なくとも第１部分、第２部分、第３部分、および第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第２コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第２コーディング領域の第２部分についての情報をエンコードする；
その際、特定のコーディング領域における第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする；
ことを特徴とする、請求項１に記載の方法。

【請求項3】

ｉ）各バーコード配列は少なくとも第２コーディング領域ＤＮＡ配列を含み、第２コーディング領域ＤＮＡ配列は少なくとも第１部分、第２部分、第３部分、および第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第２コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第２コーディング領域の第２部分についての情報をエンコードする；ならびに
ｉｉ）各バーコード配列は少なくとも第３コーディング領域ＤＮＡ配列を含み、第３コーディング領域ＤＮＡ配列は少なくとも第１部分、第２部分、第３部分、および第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第３コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第３コーディング領域の第２部分についての情報をエンコードする；
その際、特定のコーディング領域における第１部分と第４部分の特定の組合わせは、第１部分によってエンコードされるＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする；
ことを特徴とする、請求項１または２に記載の方法。

【請求項4】

少なくとも１つのコーディング領域ＤＮＡ配列が、少なくとも第１部分、第２部分、第３部分、第４部分および第５部分を含み、その際、第２部分は第４部分と第５部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、
その際、コーディング領域の第１部分と第４部分の組合わせおよび第５部分と第３部分の組合わせはコーディング領域の第２部分についての情報をエンコードし、
その際、第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードし、
その際、第５部分と第３部分の特定の組合わせは、第３部分単独によってエンコードされるＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする；
ことを特徴とする、請求項１～３のいずれか１項に記載の方法。

【請求項5】

多数の異なるＤＮＡ－物質コンジュゲートを含むＤＮＡエンコードライブラリーであって、その際、ＤＮＡ－物質コンジュゲートはそれらの物質およびそれらのＤＮＡ分子により互いに異なり、
その際、ＤＮＡ－物質コンジュゲートのＤＮＡ分子は異なるＤＮＡバーコード配列を含むことにより互いに異なり、その際、各ＤＮＡバーコード配列は少なくとも第１コーディング領域ＤＮＡ配列を含み、第１コーディング領域ＤＮＡ配列は少なくとも第１部分、第２部分および第３部分を含み、その際、第２部分は第１部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり；
第１コーディング領域の第１部分および第３部分は第２部分に関する情報をエンコードすることを特徴とし、その際、特定の第１部分および／または特定の第３部分は、ＤＮＡエンコードライブラリーのすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードすることを特徴とする、
前記ＤＮＡエンコードライブラリー。

【請求項6】

ｉ）第１コーディング領域ＤＮＡ配列は少なくとも第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、その際、第１コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第１コーディング領域の第２部分についての情報をエンコードする；ならびに
ｉｉ）各バーコード配列は少なくとも第２コーディング領域ＤＮＡ配列を含み、第２コーディング領域ＤＮＡ配列は少なくとも第１部分、第２部分、第３部分、および第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第２コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第２コーディング領域の第２部分についての情報をエンコードする；
その際、特定のコーディング領域の第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする；
ことを特徴とする、請求項５に記載のＤＮＡエンコードライブラリー。

【請求項7】

各バーコード配列は少なくとも第３コーディング領域ＤＮＡ配列を含み、それは第２コーディング領域と同じＤＮＡ鎖上にあり、少なくとも第１部分、第２部分、第３部分、および第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第３コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第３コーディング領域の第２部分についての情報をエンコードし、その際、第２コーディング領域および第３コーディング領域における第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする
ことを特徴とする、請求項６に記載のＤＮＡエンコードライブラリー。

【請求項8】

少なくとも１つのコーディング領域ＤＮＡ配列は、少なくとも第１部分、第２部分、第３部分、第４部分および第５部分を含み、その際、第２部分は第４部分と第５部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、
その際、コーディング領域の第１部分と第４部分の組合わせおよび第５部分と第３部分の組合わせはコーディング領域の第２部分についての情報をエンコードし、
その際、第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードし、
その際、第５部分と第３部分の特定の組合わせは、第３部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする；
ことを特徴とする、請求項５～７のいずれか１項に記載のＤＮＡエンコードライブラリー。

【請求項9】

請求項５～８のいずれか１項に記載のＤＮＡエンコードライブラリーをデコードする、下記を含む方法：
ａ）請求項５～８のうちの１つによるＤＮＡエンコードライブラリーを鋳型として用いてｑＰＣＲを実施し、その際、下記のプライマーを使用する：
あらゆるＤＮＡ－物質コンジュゲートの第１コーディング領域を増幅するためのプライマーＡおよびプライマーＢ；ならびに
第１コーディング領域の異なる第１部分にアニールする多数の異なるプライマーＡ－ｘＮ、および第１コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＢ－ｙＮ；その際、プライマーＡ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＡと同一の長さを有し、プライマーＢ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＢと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは２から６までの整数である；
ｂ）各プライマーＡ－ｘＮおよび各プライマーＢ－ｙＮの信号値の積を下記の方程式により計算する：
数値（Ａ－ｘＮ）_ｉ＝信号値［（Ａ－ｘＮ）_ｉ＋Ｂ］・信号値［（Ａ－ｘＮ）_ｉ＋（Ｂ－ｙＮ）_ｉ］；および
数値（Ｂ－ｙＮ）_ｉ＝信号値［（Ｂ－ｙＮ）_ｉ＋Ａ］・信号値［（Ｂ－ｙＮ）_ｉ＋（Ａ－ｘＮ）_ｉ］，
その際、ｉは整数であり、特定のプライマーを規定し、“＋”記号は２つのプライマーの組合わせを示し；その際、信号値は同一領域にアニールした異なるプライマーを用いたｑＰＣＲ定量の全セットに関する存在量のパーセントである；そして
ｃ）プライマー（Ａ－ｘＮ）_ｉおよび（Ｂ－ｙＮ）_ｉのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする。

【請求項10】

ｉ）各プライマーＡ－ｘＮおよび各プライマーＢ－ｙＮについて得られた数値の積を下記の方程式により計算する：
数値（Ａ－Ｂ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｂ－ｙＮ）_ｉ；
ｉｉ）プライマー（Ａ－ｘＮ）_ｉと（Ｂ－ｙＮ）_ｉの組合わせのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマー組合わせはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする；
ことを特徴とする、請求項９に記載の方法。

【請求項11】

ｑＰＣＲが請求項６～８のいずれか１項に記載のＤＮＡエンコードライブラリーを用いて実施されることを特徴とし、その方法は下記を含む：
ｉ）下記のプライマーを用いてｑＰＣＲを実施する：
あらゆるＤＮＡ－物質コンジュゲートの第１コーディング領域を増幅するための第１コーディング領域プライマーＡおよび第１コーディング領域プライマーＢ；ならびに
第１コーディング領域の異なる第１部分、または第１部分および第４部分にアニールする、多数の異なるプライマーＡ－ｘＮ、ならびに第１コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＢ－ｙＮ；その際、Ａ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＡと同一の長さを有し、Ｂ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＢと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０までの整数であり、ｙは２から６までの整数である；ならびに
あらゆるＤＮＡ－物質コンジュゲートの第２コーディング領域を増幅するための第２コーディング領域プライマーＣおよび第２コーディング領域プライマーＤ；ならびに
第２コーディング領域の異なる第１部分、または第１部分および第４部分にアニールする、多数の異なるプライマーＤ－ｙＮ、ならびに第２コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＣ－ｘＮ；その際、プライマーＣ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＣと同一の長さを有し、プライマーＤ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＤと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０までの整数であり、ｙは２から６までの整数である；
ｉｉ）各プライマーＡ－ｘＮ、各プライマーＢ－ｙＮ、各プライマーＣ－ｘＮおよび各プライマーＤ－ｙＮについて得られた信号値の積を下記の方程式により計算する：
数値（Ａ－ｘＮ）_ｉ＝信号値［（Ａ－ｘＮ）_ｉ＋Ｂ］・信号値［（Ａ－ｘＮ）_ｉ＋（Ｂ－ｙＮ）_ｉ］；
数値（Ｂ－ｙＮ）_ｉ＝信号値［（Ｂ－ｙＮ）_ｉ＋Ａ］・信号値［（Ｂ－ｙＮ）_ｉ＋（Ａ－ｘＮ）_ｉ］，
数値（Ｃ－ｘＮ）_ｉ＝信号値［（Ｃ－ｘＮ）_ｉ＋Ｄ］・信号値［（Ｃ－ｘＮ）_ｉ＋（Ｄ－ｙＮ）_ｉ］，
数値（Ｄ－ｙＮ）_ｉ＝信号値［（Ｄ－ｙＮ）_ｉ＋Ｃ］・信号値［（Ｄ－ｙＮ）_ｉ＋（Ｃ－ｘＮ）_ｉ］，
その際、ｉは整数であり、特定のプライマーを規定し、“＋”記号は２つのプライマーの組合わせを示し；その際、信号値は同一領域にアニールした異なるプライマーを用いたｑＰＣＲ定量の全セットに関する存在量のパーセントである；そして
ｉｉｉ）プライマー（Ａ－ｘＮ）_ｉ、（Ｂ－ｙＮ）_ｉ、（Ｃ－ｘＮ）_ｉおよび（Ｄ－ｙＮ）_ｉのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする；
ことを特徴とする、請求項９または１０に記載の方法。

【請求項12】

ｉ）各プライマーＡ－ｘＮおよび各プライマーＢ－ｙＮ、各プライマーＡ－ｘＮおよび各プライマーＤ－ｙＮ、ならびに各プライマーＣ－ｘＮおよびＤ－ｙＮについて得られた数値の積を下記の方程式により計算する：
数値（Ａ－Ｂ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｂ－ｙＮ）_ｉ；
数値（Ａ－Ｄ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
数値（Ｃ－Ｄ）_ｉ＝数値（Ｃ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
ｉｉ）各プライマーｉについての数値（Ａ－Ｂ）_ｉ、（Ａ－Ｄ）_ｉおよび（Ｃ－Ｄ）_ｉの積を下記の方程式により計算する：
数値^ｉ＝数値（Ａ－Ｂ）_ｉ・数値（Ａ－Ｄ）_ｉ・数値（Ｃ－Ｄ）_ｉ
ｉｉｉ）得られた積である数値^ｉを比較し、その際、高い数値をもつプライマー組合わせｉはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする；
請求項１１に記載の方法。

【請求項13】

請求項７または８に記載のＤＮＡエンコードライブラリーを鋳型として用いてｑＰＣＲを実施することを特徴とし、その方法は下記を含む：
ｉ）下記のプライマーを用いてｑＰＣＲを実施する：
あらゆるＤＮＡ－物質コンジュゲートの第１コーディング領域を増幅するための、第１コーディング領域プライマーＡおよび第１コーディング領域プライマーＢ；ならびに
第１コーディング領域の異なる第１部分、または第１部分および第４部分にアニールする、多数の異なるプライマーＡ－ｘＮ、ならびに第１コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＢ－ｙＮ；その際、Ａ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＡと同一の長さを有し、Ｂは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＢ－ｙＮと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０までの整数であり、ｙは２から６までの整数である；ならびに
あらゆるＤＮＡ－物質コンジュゲートの第２コーディング領域を増幅するための、第２コーディング領域プライマーＣおよび第２コーディング領域プライマーＤ；ならびに
第２コーディング領域の異なる第１部分、または第１部分および第４部分にアニールする、多数の異なるプライマーＤ－ｙＮ、ならびに第２コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＣ－ｘＮ；その際、プライマーＣ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＣと同一の長さを有し、プライマーＤ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＤと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０までの整数であり、ｙは２から６までの整数である；
あらゆるＤＮＡ－物質コンジュゲートの第３コーディング領域を増幅するための、第３コーディング領域プライマーＥおよび第３コーディング領域プライマーＦ；ならびに
第３コーディング領域の異なる第１部分にアニールする多数の異なるプライマーＥ－ｘＮ、および第３コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＦ－ｙＮ；その際、プライマーＥ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＥと同一の長さを有し、プライマーＦ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＦと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０までの整数であり、ｙは２から６までの整数である；
ｉｉ）各プライマーＡ－ｘＮ、各プライマーＢ－ｙＮ、各プライマーＣ－ｘＮ、各プライマーＤ－ｙＮ、各プライマーＥ－ｘＮおよび各プライマーＦ－ｙＮの信号値の積を下記の方程式により計算する：
数値（Ａ－ｘＮ）_ｉ＝信号値［（Ａ－ｘＮ）_ｉ＋Ｂ］・信号値［（Ａ－ｘＮ）_ｉ＋（Ｂ－ｙＮ）_ｉ］；
数値（Ｂ－ｙＮ）_ｉ＝信号値［（Ｂ－ｙＮ）_ｉ＋Ａ］・信号値［（Ｂ－ｙＮ）_ｉ＋（Ａ－ｘＮ）_ｉ］，
数値（Ｃ－ｘＮ）_ｉ＝信号値［（Ｃ－ｘＮ）_ｉ＋Ｄ］・信号値［（Ｃ－ｘＮ）_ｉ＋（Ｄ－ｙＮ）_ｉ］，
数値（Ｄ－ｙＮ）_ｉ＝信号値［（Ｄ－ｙＮ）_ｉ＋Ｃ］・信号値［（Ｄ－ｙＮ）_ｉ＋（Ｃ－ｘＮ）_ｉ］，
数値（Ｅ－ｘＮ）_ｉ＝信号値［（Ｅ－ｘＮ）_ｉ＋Ｆ］・信号値［（Ｅ－ｘＮ）_ｉ＋（Ｆ－ｙＮ）_ｉ］，
数値（Ｆ－ｙＮ）_ｉ＝信号値［（Ｆ－ｙＮ）_ｉ＋Ｅ］・信号値［（Ｆ－ｙＮ）_ｉ＋（Ｅ－ｘＮ）_ｉ］，
その際、ｉは整数であり、特定のプライマーを規定し、“＋”記号は２つのプライマーの組合わせを示し；その際、信号値は同一領域にアニールした異なるプライマーを用いたｑＰＣＲ定量の全セットに関する存在量のパーセントである；そして
ｉｉｉ）プライマー（Ａ－ｘＮ）_ｉ、（Ｂ－ｙＮ）_ｉ、（Ｃ－ｘＮ）_ｉ、（Ｄ－ｙＮ）_ｉ、（Ｅ－ｘＮ）_ｉおよび（Ｆ－ｙＮ）_ｉのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする；
請求項９～１２のいずれか１項に記載の方法。

【請求項14】

ｉ）各プライマーＡ－ｘＮおよび各プライマーＢ－ｙＮについて、各プライマーＡ－ｘＮおよび各プライマーＤ－ｙＮについて、各プライマーＣ－ｘＮおよびＤ－ｙＮについて、各プライマーＡ－ｘＮおよびＦ－ｙＮについて、各プライマーＥ－ｘＮおよびＤ－ｙＮについて、ならびに各プライマーＥ－ｘＮおよびＦ－ｙＮについて得られた数値の積を下記の方程式により計算する：
数値（Ａ－Ｂ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｂ－ｙＮ）_ｉ；
数値（Ａ－Ｄ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
数値（Ｃ－Ｄ）_ｉ＝数値（Ｃ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
数値（Ａ－Ｆ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｆ－ｙＮ）_ｉ；
数値（Ｅ－Ｄ）_ｉ＝数値（Ｅ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
数値（Ｅ－Ｆ）_ｉ＝数値（Ｅ－ｘＮ）_ｉ・数値（Ｆ－ｙＮ）_ｉ；
ｉｉ）各プライマー組合わせｉについて、数値（Ａ－Ｂ）_ｉ、（Ａ－Ｄ）_ｉ、（Ｃ－Ｄ）_ｉ、（Ａ－Ｆ）_ｉ、（Ｅ－Ｄ）_ｉおよび（Ｅ－Ｆ）_ｉの積を下記の方程式により計算する：
数値^ｉ＝数値（Ａ－Ｂ）_ｉ・数値（Ａ－Ｄ）_ｉ・数値（Ｃ－Ｄ）_ｉ・数値（Ａ－Ｆ）_ｉ・数値（Ｅ－Ｄ）_ｉ・数値（Ｅ－Ｆ）_ｉ；
ｉｉｉ）得られた積である数値^ｉを比較し、その際、高い数値をもつプライマー組合わせｉはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする；
請求項１３に記載の方法。

【請求項15】

下記の計算：
数値^ｉ’＝ｌｏｇ_１０［数値（Ａ－Ｂ）_ｉ・数値（Ａ－Ｄ）_ｉ・数値（Ｃ－Ｄ）_ｉ・数値（Ａ－Ｆ）_ｉ・数値（Ｅ－Ｄ）_ｉ・数値（Ｅ－Ｆ）_ｉ］
による数値^ｉ’の計算を含むことを特徴とする、請求項１４に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

ＤＮＡエンコードライブラリーを提供するための方法、ＤＮＡエンコードライブラリー、およびＤＮＡエンコードライブラリーをデコードする方法を提示する。異なるＤＮＡバーコード配列を含むことにより互いに異なる多数の異なるＤＮＡ分子を合成し、その際、各ＤＮＡバーコード配列は少なくとも、少なくとも第１部分、第２部分および第３部分を含む第１コーディング領域ＤＮＡ配列を含み、その際、第２部分は第１部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なる。多数の異なるＤＮＡ分子のそれぞれは少なくとも、異なるＤＮＡ－物質コンジュゲートを形成する特定の物質に結合し、その際、ＤＮＡ－物質コンジュゲートは特定の物質およびそれらのＤＮＡ分子により互いに異なり、その際、第１部分および第３部分は第１コーディング領域の第２部分に関する情報をエンコードし、その際、特定の第１部分および／または特定の第３部分はＤＮＡエンコードライブラリー中のすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする。このＤＮＡエンコードライブラリーは、たとえばそのライブラリーを用いて実施した濃縮(enrichment)実験後にそのライブラリーを既知のＤＮＡエンコードライブラリーより速やかに、より経費の少ない方法でデコードすることができるという利点をもつ。

【背景技術】

【0002】

分子のプールから高親和性結合剤を同定することを目的とする薬物探索において、ＤＮＡエンコードライブラリー(DNA-encoded library)（“ＤＥＬ”）を使用することが先行技術において知られている。理想的には、そのＤＥＬは細胞、たとえば適応免疫におけるＴ細胞およびＢ細胞の機能－情報関係、ならびにペプチド／タンパク質－ディスプレイ技術（たとえば、ファージディスプレイ、リボソームディスプレイ、酵母ディスプレイ）を模倣することができる。Ｔ細胞、Ｂ細胞および／またはファージにおいて、機能（たとえば細胞表面に発現しているタンパク質により仲介されるもの）および関連情報（たとえば遺伝情報によりコードされるもの）は共に個々の細胞内に拘束されている。特定の細胞混合物中に提示される個々の細胞が単一コピーしかない場合ですら、その機能－情報関係を調べることができる。

【0003】

ＤＥＬは、それぞれが有機小分子と特定のＤＮＡ配列（いわゆる“ＤＮＡバーコード”）とのコンジュゲートである異なる分子のプールから構成され、よって機能（有機小分子の化学構造によるそれの機能）と情報（ＤＮＡ配列によりコードされる、有機小分子についての情報）の直接的な物理的関係を明らかにする。それらのＤＮＡ配列は、種々の技術、たとえばサンガー(Sanger)シーケンシング、ＤＮＡアレイおよび／またはハイスループットシーケンシングを用いて関連化学構造を同定するように設計される。

【0004】

ＰＣＲ（ポリメラーゼ連鎖反応）は主に選択した化合物を増幅するために用いられるが、ＰＣＲおよびリアルタイムＰＣＲ（ｒｔＰＣＲ）は、たとえばある特定のＤＮＡバーコードがＤＥＬをセレクション実験に用いる前および／または後に存在するか否か、あるいはどのような存在量で存在するかを調べるためのバリデーション法としても使用できる。セレクション実験は、有機小分子とＤＮＡバーコードとの特定のコンジュゲートを、それらが１以上の希望するターゲットに結合した後にそれらのコンジュゲートを単離することに基づいて濃縮することを目的とする。それらのコンジュゲートが濃縮されるので、ＤＥＬセレクション実験は特定のＤＮＡバーコード、すなわちターゲット（単数または複数）に対する高い結合親和性をもつ有機小分子をコードするものを濃縮する実験とみなすことができる。

【0005】

ファージディスプレイ技術の場合と同様に、通常のＤＥＬセレクション実験は１ラウンドのセレクション（１回の操作）で数十ないし数百のＤＮＡバーコード（ＤＮＡ配列）を供給する。しかし、通常は特異性および有効性の高い有機分子（すなわち、ターゲットに対するｋ_ＤがｐＭないしｎＭの範囲にあるもの）を明らかにするファージディスプレイ技術と異なり、ＤＥＬセレクション実験はしばしば、中等度の結合剤にすぎない有機小分子（たとえば、ターゲットに対するｋ_Ｄが低ないし中等度のμＭ範囲にあるもの）をコードするＤＮＡバーコードをも明らかにする。

【0006】

原則として、サンガーシーケンシングはＤＥＬセレクション実験で見出されたＤＮＡバーコードをデコードするためのツールを提供する。
しかし、サンガーシーケンシングは、処理量が低い、すなわちＤＮＡバーコードの“読取り”に多くの時間を消費し、したがって読出しが不経済であるという欠点をもつ。

【0007】

サンガーシーケンシングのさらなる欠点は、異なるＤＮＡ配列の複雑な混合物を分析する際のそれの感度が低いことである。１００万の異なる化合物を含むＤＥＬを用いるＤＥＬセレクション実験を仮定すると、１つの化合物が通常は平均より１０００倍多く濃縮され、１００の配列がサンガーシーケンシングから得られるであろう。この場合、それの存在がサンガーシーケンシングによって明らかにされないという理由でその１つの特定の化合物がセレクション実験により同定されない機会、すなわち同定から漏れる機会は、おおよそ９０％あるであろう。

【0008】

さらに、たとえ特定のＤＮＡバーコード（たとえば、特定の有機小分子をコードするもの）が濃縮プロセスで１回出現するとしても、サンガーシーケンスはターゲットに結合する有機小分子をコードするものとしてそのＤＮＡバーコードを同定することができる。しかし、サンガーシーケンシングはこの特定の有機小分子の同定がランダム事象（すなわち、偶発ヒット）であったかあるいは実際に統計的に有意（すなわち、真のヒット）であるかを解明することはできない。要するに、サンガーシーケンシングには、オーバーサンプリングなしに偽陽性を真陽性から識別することはできないという欠点もある。サンガーシーケンシングの概念におけるオーバーサンプリングは、デコーディングプロセス（読出し）におけるヒット同定について統計的に意味のある結果を得るために明らかにきわめて重要であるが、サンガーシーケンシングは効率的とはほど遠いことが明らかになった。

【0009】

ＤＮＡアレイは、ＤＥＬセレクション実験で同定された結合剤のＤＮＡバーコード配列をデコードするための別の解決策を提供する。各ＤＮＡバーコード配列は特定の物理的位置と関連付けられ、それの蛍光強度に従って評価されるので、その測定はサンガーシーケンシングを用いるオーバーサンプリングの必要性を回避する。

【0010】

しかし、完全相補配列は最高の信号強度をもたらすが、ミスマッチＤＮＡ配列相互作用に関連する強いバックグラウンドノイズは、大きなＤＮＡバーコード配列ライブラリーをデコードするためにこの方法を使用する妨げとなる。たとえば、それぞれがＤＮＡバーコード配列をもつわずか数百の化合物のライブラリーについて、特定のペアをミスマッチングおよびバックグラウンドノイズから識別するためには多大な努力を行なう必要がある。要するに、ＤＮＡアレイ同定方法も、偽陽性を真陽性から十分に識別することができないという欠点をもつ。言い換えると、この同定方法のシステムエラーは高い。

【0011】

ハイスループットシーケンシング(High throughput sequencing)（“ＨＴＳ”）はセレクション実験後にＤＥＬをデコードするための標準法となった。ＨＴＳはサンガーシーケンシングに類似する原理を適用し、特定配列のカウントを濃縮の指標として用いる。比較的大きなサイズのＤＥＬを用いる場合ですら、ＨＴＳから生じる数百万の配列読みがオーバーサンプリングを可能にする。

【0012】

しかし、ＤＮＡバーコード配列のカウントと希望するターゲット（単数または複数）に結合した有機小分子に対する親和性測定値とは低い相関性を示すにすぎないことが見出されたので、ＤＮＡアレイ法と同様にＨＴＳはセレクション実験の半定量分析を提供できるにすぎない。この確認された低い相関性はまだ十分には理解されていない。ＰＣＲおよびシーケンシングのプロセスに際してのバイアスが役割をもっている可能性はあるが、原則として、それはＤＮＡバーコードの合成の質が低いことが原因である可能性がある。要するに、ＨＴＳは同定プロセスに際して多数の偽陽性ヒットを生じる傾向がある；すなわちこの同定方法の全体的誤差は高い。

【0013】

さらに、ＤＥＬのサイズは近年次第に増大しているので、ＤＥＬが数十億の化合物を含み始めた場合にはＨＴＳはもはやオーバーサンプリングの要件を満たさないであろう。
さらに、ＨＴＳはこの数年でより安価になったけれども、それは多くの大学研究者にとって依然としてきわめて高価である。外注によるシーケンシング課題は普通は数週間かかるが、研究者はシーケンシング実験をコントロールできない。

【0014】

ＰＣＲおよびｒｔＰＣＲは先行技術においてサンガーシーケンシング、ＤＮＡアレイおよびＨＴＳ同定方法の問題点を克服するために用いられている。ＰＣＲおよびｒｔＰＣＲの両方の利点は、プライマー対を特定のコードのために設計できることである。言い換えると、あるプライマーは特定のコードに結合し（少なくとも部分的に）、他のあるプライマーは結合しないという意味で、それ自体が“コード”を保有することができる種々のプライマーを使用できる。さらに、ｒｔＰＣＲは、陽性対照と陰性対照の相違を解明し（リアルタイムで）、よって偽陽性と真陽性をより良く識別できるという、ＰＣＲに優る利点をもつ。

【0015】

しかし、ｒｔＰＣＲはＤＥＬセレクションプロセスの定量分析を提供するけれども、それは限られた数のコードおよび化合物について設計できるにすぎない。したがって、ｒｔＰＣＲはデノボセレクション実験の結果をデコードするためには使用できないという欠点をもつ。

【発明の概要】

【発明が解決しようとする課題】

【0016】

このことから出発して、本発明の目的は、ＤＮＡエンコードライブラリーを用いるセレクション実験において濃縮されたＤＮＡバーコードをエンコードおよびデコードするための方法を提供することであり、その方法は先行技術の同定方法の欠点を克服すべきである。具体的には、その方法は容易であり、コスト効率が良く、定量的、高感度（すなわち、弱い結合剤をも明らかにできる）、高特異性（すなわち、偽陽性より多く真陽性を明らかにできる）であり、かつデノボセレクション実験をデコードするのに適切でなければならない。

【課題を解決するための手段】

【0017】

その目的は、ＤＮＡエンコードライブラリーを提供するための請求項１の特徴を備えた方法、請求項５の特徴を備えたＤＮＡエンコードライブラリー、およびＤＮＡエンコードライブラリーをデコードする請求項９の特徴を備えた方法により解決される。従属請求項の対象は本発明の有利な態様を示す。

【図面の簡単な説明】

【0018】

【図1】図１Ａは、単一コーディング領域２をもつＤＮＡコード１（コーディング領域ＩＩＩ）についてのｑＰＣＲ－マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。図１Ｂは、２つのコーディング領域、すなわちコーディング領域Ｉおよびコーディング領域ＩＩをもつＤＮＡコードについてのｑＰＣＲ－マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。

【図2】図２は、３つのコーディング領域Ｉ、ＩＩ、ＩＩＩをもつＤＮＡコードについてのｑＰＣＲ－マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。

【図3A】図３Ａ、３Ｂおよび３Ｃは、３つの異なる鋳型としての３つのコーディング領域Ｉ、ＩＩ、ＩＩＩをもつＤＮＡバーコード、ならびにコーディング領域Ｉに結合するための２０の異なる一次プライマーＡおよび２０の異なる一次プライマーＢ（参照：図３Ａのマトリクス“Ａ＋Ｂを用いたＱ－ＰＣＲ”、列＝異なるプライマーＡ、行(line)＝異なるプライマーＢ）、コーディング領域ＩＩに結合するための２０の異なる一次プライマーＣおよび２０の異なる一次プライマーＤ（参照：図３Ｂのマトリクス“Ｃ＋Ｄを用いたＱ－ＰＣＲ”、列＝異なるプライマーＣ、行(line)＝異なるプライマーＤ）、ならびにコーディング領域ＩＩＩに結合するための２０の異なる一次プライマーＥおよび２０の異なる一次プライマーＦ（参照：図３Ｃのマトリクス“Ｅ＋Ｆを用いたＱ－ＰＣＲ”、列＝異なるプライマーＥ、行(line)＝異なるプライマーＦ）を用いるｑＰＣＲ後に得られたｑＰＣＲマトリクスを示す

【図3B】図３Ａ、３Ｂおよび３Ｃは、３つの異なる鋳型としての３つのコーディング領域Ｉ、ＩＩ、ＩＩＩをもつＤＮＡバーコード、ならびにコーディング領域Ｉに結合するための２０の異なる一次プライマーＡおよび２０の異なる一次プライマーＢ（参照：図３Ａのマトリクス“Ａ＋Ｂを用いたＱ－ＰＣＲ”、列＝異なるプライマーＡ、行(line)＝異なるプライマーＢ）、コーディング領域ＩＩに結合するための２０の異なる一次プライマーＣおよび２０の異なる一次プライマーＤ（参照：図３Ｂのマトリクス“Ｃ＋Ｄを用いたＱ－ＰＣＲ”、列＝異なるプライマーＣ、行(line)＝異なるプライマーＤ）、ならびにコーディング領域ＩＩＩに結合するための２０の異なる一次プライマーＥおよび２０の異なる一次プライマーＦ（参照：図３Ｃのマトリクス“Ｅ＋Ｆを用いたＱ－ＰＣＲ”、列＝異なるプライマーＥ、行(line)＝異なるプライマーＦ）を用いるｑＰＣＲ後に得られたｑＰＣＲマトリクスを示す

【図3C】図３Ａ、３Ｂおよび３Ｃは、３つの異なる鋳型としての３つのコーディング領域Ｉ、ＩＩ、ＩＩＩをもつＤＮＡバーコード、ならびにコーディング領域Ｉに結合するための２０の異なる一次プライマーＡおよび２０の異なる一次プライマーＢ（参照：図３Ａのマトリクス“Ａ＋Ｂを用いたＱ－ＰＣＲ”、列＝異なるプライマーＡ、行(line)＝異なるプライマーＢ）、コーディング領域ＩＩに結合するための２０の異なる一次プライマーＣおよび２０の異なる一次プライマーＤ（参照：図３Ｂのマトリクス“Ｃ＋Ｄを用いたＱ－ＰＣＲ”、列＝異なるプライマーＣ、行(line)＝異なるプライマーＤ）、ならびにコーディング領域ＩＩＩに結合するための２０の異なる一次プライマーＥおよび２０の異なる一次プライマーＦ（参照：図３Ｃのマトリクス“Ｅ＋Ｆを用いたＱ－ＰＣＲ”、列＝異なるプライマーＥ、行(line)＝異なるプライマーＦ）を用いるｑＰＣＲ後に得られたｑＰＣＲマトリクスを示す

【図3D】図３Ｄの表“Ｅ＋Ｆ”の下に、得られた結果を棒グラフでも示す。

【図4】図４は、図３からのｑＰＣＲマトリクス“Ａ＋Ｂを用いたＱ－ＰＣＲ”（コーディング領域Ｉの増幅）および“Ｃ＋Ｄを用いたＱ－ＰＣＲ”（コーディング領域ＩＩの増幅）の結果、ならびに同様にプライマー対ＡとＤを用いた二次ＰＣＲ（ＩとＩＩの間のコーディング領域；図２を参照）の結果を示す。

【図5】図５は、方程式数値_{コーディング領域Ｉ－ＩＩ}＝数値_{マトリクス－Ａ＋Ｄ}・数値_{マトリクス－Ａ＋Ｂ}・数値_{マトリクス－Ｃ＋Ｄ}に従って最高の積（参照：ｙ軸上の任意単位における絶対値）を生じたコーディング領域Ｉ（Ａ＋Ｂ）とＩＩ（Ｃ＋Ｄ）の３６の異なる組合わせのプロットを示す。

【図6】図６は、鋳型としての３つのコーディング領域Ｉ、ＩＩ、ＩＩＩをもつＤＮＡバーコード、コーディング領域Ｉについての２０の異なる一次プライマーＡおよびＢ、コーディング領域ＩＩについての２０の異なる一次プライマーＣおよびＤ、コーディング領域Ｉ－ＩＩについての（同じ）２０の異なる一次プライマーＡおよびＤ、ならびにコーディング領域ＩＩＩについての２０の異なる一次プライマーＥおよびＦを用いるｑＰＣＲ後に得られたｑＰＣＲマトリクスの一部を示す。

【図7】図７は、それぞれがＤＮＡバーコードでタグ付けされた３０６の化合物をもつ中等度ＤＥＬについてのデコーディングプロセスを示す。

【図8】図８は、それぞれがＤＮＡバーコードでタグ付けされた４^１０の化合物をもつ大きなＤＥＬの例を示す。

【図9】図９は、それぞれがＤＮＡバーコードでタグ付けされた４^２０の化合物をもつきわめて大きなＤＥＬの他の例を示す。

【図10】図１０は、ＤＮＡエンコードライブラリー（ＤＥＬ）内のＤＮＡ－ＣＢＳ－コンジュゲートを酵素である炭酸脱水素酵素ＩＩを用いたセレクションによって濃縮した後の物質４－カルボキシベンゼンスルホンアミド（以下において：“ＣＢＳ”）の同定を示す。

【図11】図１１は、第１物質Ｓが第１コーディング領域ＤＮＡ配列Ｉおよび第２コーディング領域ＤＮＡ配列に化学的に共有結合しており、第２物質Ｓが第３コーディング領域ＤＮＡ配列ＩＩＩに化学的に共有結合しているＤＮＡ－物質コンジュゲートを示す。

【発明を実施するための形態】

【0019】

本発明によれば、ＤＮＡエンコードライブラリー（ＤＥＬ）を提供するための方法が提供され、その方法は下記を含み：
ａ）異なるＤＮＡバーコード配列を含むことにより互いに異なる多数の異なるＤＮＡ分子を合成し、その際、各ＤＮＡバーコード配列は少なくとも、少なくとも第１部分、第２部分および第３部分を含む第１コーディング領域ＤＮＡ配列を含み、その際、第２部分は第１部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なる；そして
ｂ）多数の異なるＤＮＡ分子のそれぞれを少なくとも１つの特定の物質に結合させて異なるＤＮＡ－物質コンジュゲートを形成し、その際、ＤＮＡ－物質コンジュゲートは特定の物質およびそれらのＤＮＡ分子によって互いに異なる；
第１部分および第３部分は第１コーディング領域の第２部分に関する情報をエンコードし、その際、特定の第１部分および／または特定の第３部分は、ＤＮＡエンコードライブラリー中のすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードすることを特徴とする。

【0020】

本発明方法により提供されるＤＮＡエンコードライブラリー（“ＤＥＬ”）の利点は、ＤＮＡバーコード配列の第１部分および第３部分の両方がそれぞれＤＥＬ内の特定のサブグループのＤＮＡ－物質コンジュゲートをコードすることである。ｑＰＣＲにおいて、ＤＮＡバーコード配列の第１部分に結合するプライマーは、ＤＥＬを用いて実施した前のセレクション実験において第１部分がエンコードするＤＮＡ－物質コンジュゲートのサブグループ（たとえば、転写因子）が濃縮されていれば、強い信号（強い増幅）を生じるであろう。ＤＮＡバーコード配列の第３部分について同じことが言える：すなわち、ＤＮＡバーコード配列の第３部分に結合するプライマーは、ＤＥＬを用いて実施した前のセレクション実験において第３部分がエンコードするＤＮＡ－物質コンジュゲートのサブグループ（たとえば、ジンクフィンガータンパク質）が濃縮されていれば、強い信号（強い増幅）を生じるであろう。第１部分に結合するプライマーおよび第３部分に結合するプライマーの両方についてｑＰＣＲ後に強い信号が得られれば、両方のサブグループに属するＤＮＡ－物質コンジュゲート（たとえば、ジンクフィンガー転写因子）が強く濃縮されたことが当業者には分かる。当業者は、本発明のＤＥＬおよび適切なプライマーを用いるｑＰＣＲのみによってこの情報を得る；すなわち、当業者はＤＮＡシーケンシングを実施する必要がない。これによって、そのライブラリーを用いて実施したセレクション実験後に、はるかに迅速かつ安価なＤＮＡエンコードライブラリーのデコーディングが可能になる。

【0021】

ＤＮＡエンコードライブラリーを用いて、バーコードの異なる第１部分に結合する異なる第１プライマーがマトリクスの行を形成しかつバーコードの異なる第２部分に結合する異なる第２プライマーがマトリクスの列である多数の二次元マトリクスを構築することができ、各プライマー対を用いたｑＰＣＲ後の信号強度がマトリクスの各フィールド（行と列の交差点）に得られる。各プライマー対について得られた信号強度により、セレクション実験後のＤＮＡバーコードの混合物、すなわちＤＥＬの、デコンボリューションが可能になる。ＤＮＡバーコードの混合物をデコンボリューションできることによって、同定方法の特異度、すなわち真陽性ヒットを偽陽性ヒットから識別する性能が著しく改善され、ＤＮＡシーケンシングを実施しなくても“ヒット”を迅速に判定できる。

【0022】

ＤＮＡシーケンシングを伴なわないｑＰＣＲの実施は経費が高くないので、完全デコーディング実験にはおおよそ５０ユーロかかるにすぎないと推定される。よって、本発明方法で作製したＤＥＬはそのＤＥＬを用いた濃縮実験後のきわめてコスト効率の良い“ヒット”検出を可能にし、機器使用に必要な出資はごくわずかである。さらに、これまでに知られているＤＥＬと比較して、本発明のＤＥＬによればセレクション実験後の特定のＤＮＡバーコードの存在量についてより定量的な情報を得ることができる。

【0023】

本発明方法は下記において特徴づけることができる：
ｉ）第１コーディング領域ＤＮＡ配列は少なくとも第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、その際、第１コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第１コーディング領域の第２部分についての情報をエンコードする；ならびに
ｉｉ）各バーコード配列は少なくとも、少なくとも第１部分、第２部分、第３部分、および第４部分を含む第２コーディング領域ＤＮＡ配列を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第２コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第２コーディング領域の第２部分についての情報をエンコードする；
その際、特定のコーディング領域における第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする。

【0024】

本発明のこの態様において、ＤＮＡバーコードの第４部分にアニールするさらに他のプライマーを使用でき、かつ異なる４つの部分を備えたさらなるコーディング領域が存在するので、このＤＮＡエンコードライブラリーを用いてより多くの二次元マトリクスを構築できる。１回のｑＰＣＲ操作だけで、ＤＥＬを用いたセレクション実験で濃縮された特定グループのＤＮＡ－物質コンジュゲートについてきわめて詳細な情報が得られる。

【0025】

さらに、本発明方法は下記において特徴づけることができる：
ｉ）各バーコード配列は少なくとも、少なくとも第１部分、第２部分、第３部分、および第４部分を含む第２コーディング領域ＤＮＡ配列を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第２コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第２コーディング領域の第２部分についての情報をエンコードする；ならびに
ｉｉ）各バーコード配列は少なくとも、少なくとも第１部分、第２部分、第３部分、および第４部分を含む第３コーディング領域ＤＮＡ配列を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第３コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第３コーディング領域の第２部分についての情報をエンコードする；
その際、特定のコーディング領域における第１部分と第４部分の特定の組合わせは、第１部分によってエンコードされるＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする。

【0026】

さらなるコーディング領域、および少なくとも１つのコーディング領域を５つの部分に分離することを考慮すると、１回のｑＰＣＲにおいて、１回のｑＰＣＲ操作内で、より多くの異なるプライマーを使用でき、ＤＥＬを用いたセレクション実験において特定グループのＤＮＡ－物質コンジュゲートが濃縮されたきわめて詳細な情報を得ることができる。

【0027】

本発明の好ましい態様において、少なくとも１つのコーディング領域ＤＮＡ配列、場合によりすべてのコーディング領域ＤＮＡ配列が、少なくとも第１部分、第２部分、第３部分、第４部分および第５部分を含み、その際、第２部分は第４部分と第５部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、コーディング領域の第１部分と第４部分の組合わせおよび第５部分と第３部分の組合わせはコーディング領域、好ましくはすべてのコーディング領域の第２部分についての情報をエンコードし、その際、第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードし、その際、第５部分と第３部分の特定の組合わせは、第３部分単独によってエンコードされるＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする。

【0028】

この態様において、少なくとも１つのコーディング領域は３または４ではなく実際には５つの部分をもつので、少なくとも１つのコーディング領域を増幅するための各ｑＰＣＲに合計４つのプライマーを使用できる。要するに、第１部分にアニールする１つのプライマー、第３部分にアニールする１つのプライマー、第４部分にアニールする１つのプライマー、および第５部分にアニールする１つのプライマーを使用できる。これにより合計量６つの二次元マトリクスが得られる。よって、１回のｑＰＣＲで、ＤＥＬを用いたセレクション実験において特定グループのＤＮＡ－物質コンジュゲートが濃縮されたより詳細な情報が得られる。

【0029】

さらに、本発明によれば、ＤＮＡエンコードライブラリーが提供される。このＤＮＡエンコードライブラリーは多数の異なるＤＮＡ－物質コンジュゲートを含み、その際、ＤＮＡ－物質コンジュゲートはそれらの物質およびそれらのＤＮＡ分子により互いに異なり、その際、ＤＮＡ－物質コンジュゲートのＤＮＡ分子は異なるＤＮＡバーコード配列を含むことにより互いに異なり、その際、各ＤＮＡバーコード配列は少なくとも、少なくとも第１部分、第２部分および第３部分を含む第１コーディング領域ＤＮＡ配列を含み、その際、第２部分は第１部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、第１コーディング領域の第１部分および第３部分は第２部分に関する情報をエンコードすることを特徴とし、その際、特定の第１部分および／または特定の第３部分は、ＤＮＡエンコードライブラリーのすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする。

【0030】

本発明のＤＮＡエンコードライブラリーは下記において特徴づけることができる：
ｉ）第１コーディング領域ＤＮＡ配列は少なくとも第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、その際、第１コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第１コーディング領域の第２部分についての情報をエンコードする；ならびに
ｉｉ）各バーコード配列は少なくとも、少なくとも第１部分、第２部分、第３部分、および第４部分を含む第２コーディング領域ＤＮＡ配列を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第２コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第２コーディング領域の第２部分についての情報をエンコードする；
その際、特定のコーディング領域の第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする。

【0031】

さらに、本発明のＤＮＡエンコードライブラリーは下記において特徴づけることができる：各バーコード配列は少なくとも第３コーディング領域ＤＮＡ配列を含み、それは第２コーディング領域と同じＤＮＡ鎖上にあり、少なくとも第１部分、第２部分、第３部分、および第４部分を含み、その際、第２部分は第４部分と第３部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、第３コーディング領域の第１部分と第４部分の組合わせおよび第１部分と第３部分の組合わせは両方とも第３コーディング領域の第２部分についての情報をエンコードし、その際、第２コーディング領域およ第３コーディング領域における第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする。

【0032】

本発明の好ましい態様において、ＤＮＡエンコードライブラリーは下記を特徴とする：少なくとも１つのコーディング領域ＤＮＡ配列、場合によりすべてのコーディング領域ＤＮＡ配列は、少なくとも第１部分、第２部分、第３部分、第４部分および第５部分を含み、その際、第２部分は第４部分と第５部分の間に位置し、第２部分はすべてのＤＮＡ分子間で少なくとも２つのヌクレオチドが異なり、その際、コーディング領域の第１部分と第４部分の組合わせおよび第５部分と第３部分の組合わせはコーディング領域、好ましくはすべてのコーディング領域の第２部分についての情報をエンコードし、その際、第１部分と第４部分の特定の組合わせは、第１部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードし、その際、第５部分と第３部分の特定の組合わせは、第３部分単独によってエンコードされるすべてのＤＮＡ－物質コンジュゲートのグループより小さな特定グループのＤＮＡ－物質コンジュゲートをユニークにコードする。

【0033】

さらなる好ましい態様において、ＤＮＡエンコードライブラリーはＤＮＡエンコードライブラリーを提供するための本発明方法により作製でき、あるいは作製される。
さらに、本発明によれば、本発明のＤＮＡエンコードライブラリーをデコードする方法が提供される。その方法は下記を含む：
ａ）請求項５～８のうちの１つによるＤＮＡエンコードライブラリーを鋳型として用いてｑＰＣＲを実施し、その際、下記のプライマーを使用する：
あらゆるＤＮＡ－物質コンジュゲートの第１コーディング領域を増幅するためのプライマーＡおよびプライマーＢ；ならびに
第１コーディング領域の異なる第１部分にアニールする多数の異なるプライマーＡ－ｘＮ、および第１コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＢ－ｙＮ；その際、プライマーＡ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＡと同一の長さを有し、プライマーＢ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＢと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは２から６、好ましくは４までの整数である；
ｂ）各プライマーＡ－ｘＮおよび各プライマーＢ－ｙＮの信号値の積を下記の方程式により計算する：
数値（Ａ－ｘＮ）_ｉ＝信号値［（Ａ－ｘＮ）_ｉ＋Ｂ］・信号値［（Ａ－ｘＮ）_ｉ＋（Ｂ－ｙＮ）_ｉ］；および
数値（Ｂ－ｙＮ）_ｉ＝信号値［（Ｂ－ｙＮ）_ｉ＋Ａ］・信号値［（Ｂ－ｙＮ）_ｉ＋（Ａ－ｘｎ）_ｉ］，
その際、ｉは整数であり、特定のプライマーを規定し、“＋”記号は２つのプライマーの組合わせを示し；その際、信号値は同一領域にアニールした異なるプライマーを用いたｑＰＣＲ定量の全セットに関する存在量のパーセントである；そして
ｃ）プライマー（Ａ－ｘＮ）_ｉおよび（Ｂ－ｙＮ）_ｉのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする。

【0034】

本発明のＤＮＡエンコードライブラリーをデコードする方法は、その方法が下記を含むことにおいて特徴づけることができる：
ｉ）各プライマーＡ－ｘＮおよび各プライマーＢ－ｙＮについて得られた数値の積を下記の方程式により計算する：
数値（Ａ－Ｂ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｂ－ｙＮ）_ｉ；
ｉｉ）プライマー（Ａ－ｘＮ）_ｉと（Ｂ－ｙＮ）_ｉの組合わせのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマー組合わせはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする。

【0035】

さらに、本発明のＤＮＡエンコードライブラリーをデコードする方法は、ｑＰＣＲが本発明のＤＮＡエンコードライブラリーを用いて実施されることにおいて特徴づけることができ、その方法は下記を含む：
ｉ）下記のプライマーを用いてｑＰＣＲを実施する：
あらゆるＤＮＡ－物質コンジュゲートの第１コーディング領域を増幅するための第１コーディング領域プライマーＡおよび第１コーディング領域プライマーＢ；ならびに
第１コーディング領域の異なる第１部分、または第１部分および第４部分にアニールする、多数の異なるプライマーＡ－ｘＮ、ならびに第１コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＢ－ｙＮ；その際、Ａ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＡと同一の長さを有し、Ｂ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＢと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０、好ましくは８までの整数であり、ｙは２から６、好ましくは４までの整数である；ならびに
あらゆるＤＮＡ－物質コンジュゲートの第２コーディング領域を増幅するための第２コーディング領域プライマーＣおよび第２コーディング領域プライマーＤ；ならびに
第２コーディング領域の異なる第１部分、または第１部分および第４部分にアニールする、多数の異なるプライマーＤ－ｙＮ、ならびに第２コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＣ－ｘＮ；その際、プライマーＣ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＣと同一の長さを有し、プライマーＤ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＤと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０、好ましくは８までの整数であり、ｙは２から６、好ましくは４までの整数である；
ｉｉ）各プライマーＡ－ｘＮ、各プライマーＢ－ｙＮ、各プライマーＣ－ｘＮおよび各プライマーＤ－ｙＮについて得られた信号値の積を下記の方程式により計算する：
数値（Ａ－ｘＮ）_ｉ＝信号値［（Ａ－ｘＮ）_ｉ＋Ｂ］・信号値［（Ａ－ｘＮ）_ｉ＋（Ｂ－ｙＮ）_ｉ］；
数値（Ｂ－ｙＮ）_ｉ＝信号値［（Ｂ－ｙＮ）_ｉ＋Ａ］・信号値［（Ｂ－ｙＮ）_ｉ＋（Ａ－ｘＮ）_ｉ］，
数値（Ｃ－ｘＮ）_ｉ＝信号値［（Ｃ－ｘＮ）_ｉ＋Ｄ］・信号値［（Ｃ－ｘＮ）_ｉ＋（Ｄ－ｙｎ）_ｉ］，
数値（Ｄ－ｙＮ）_ｉ＝信号値［（Ｄ－ｙＮ）_ｉ＋Ｃ］・信号値［（Ｄ－ｙＮ）_ｉ＋（Ｃ－ｘｎ）_ｉ］，
その際、ｉは整数であり、特定のプライマーを規定し、“＋”記号は２つのプライマーの組合わせを示し；その際、信号値は同一領域にアニールした異なるプライマーを用いたｑＰＣＲ定量の全セットに関する存在量のパーセントである；そして
ｉｉｉ）プライマー（Ａ－ｘＮ）_ｉ、（Ｂ－ｙＮ）_ｉ、（Ｃ－ｘＮ）_ｉおよび（Ｄ－ｙＮ）_ｉのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする。

【0036】

本発明の好ましい態様において、本発明のＤＮＡエンコードライブラリーをデコードする方法は下記を含む：
ｉ）各プライマーＡ－ｘＮおよび各プライマーＢ－ｙＮ、各プライマーＡ－ｘＮおよび各プライマーＤ－ｙＮ、ならびに各プライマーＣ－ｘＮおよびＤ－ｙＮについて得られた数値の積を下記の方程式により計算する：
数値（Ａ－Ｂ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｂ－ｙＮ）_ｉ；
数値（Ａ－Ｄ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
数値（Ｃ－Ｄ）_ｉ＝数値（Ｃ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
ｉｉ）各プライマーｉについての数値（Ａ－Ｂ）_ｉ、（Ａ－Ｄ）_ｉおよび（Ｃ－Ｄ）_ｉの積を下記の方程式により計算する：
数値^ｉ＝数値（Ａ－Ｂ）_ｉ・数値（Ａ－Ｄ）_ｉ・数値（Ｃ－Ｄ）_ｉ
ｉｉｉ）得られた積である数値^ｉを比較し、その際、高い数値をもつプライマー組合わせｉはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする。

【0037】

さらなる好ましい態様において、本発明のＤＮＡエンコードライブラリーをデコードする方法は本発明のＤＮＡエンコードライブラリーを鋳型として用いてｑＰＣＲを実施することを特徴とし、その方法は下記を含む：
ｉ）下記のプライマーを用いてｑＰＣＲを実施する：
あらゆるＤＮＡ－物質コンジュゲートの第１コーディング領域を増幅するための、第１コーディング領域プライマーＡおよび第１コーディング領域プライマーＢ；ならびに
第１コーディング領域の異なる第１部分、または第１部分および第４部分にアニールする、多数の異なるプライマーＡ－ｘＮ、ならびに第１コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＢ－ｙＮ；その際、Ａ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＡと同一の長さを有し、Ｂは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＢ－ｙＮと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０、好ましくは８までの整数であり、ｙは２から６、好ましくは４までの整数である；ならびに
あらゆるＤＮＡ－物質コンジュゲートの第２コーディング領域を増幅するための、第２コーディング領域プライマーＣおよび第２コーディング領域プライマーＤ；ならびに
第２コーディング領域の異なる第１部分、または第１部分および第４部分にアニールする、多数の異なるプライマーＤ－ｙＮ、ならびに第２コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＣ－ｘＮ；その際、プライマーＣ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＣと同一の長さを有し、プライマーＤ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＤと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０、好ましくは８までの整数であり、ｙは２から６、好ましくは４までの整数である；
あらゆるＤＮＡ－物質コンジュゲートの第３コーディング領域を増幅するための、第３コーディング領域プライマーＥおよび第３コーディング領域プライマーＦ；ならびに
第３コーディング領域の異なる第１部分にアニールする多数の異なるプライマーＥ－ｘＮ、および第３コーディング領域の異なる第３部分にアニールする多数の異なるプライマーＦ－ｙＮ；その際、プライマーＥ－ｘＮは５’－末端においてｘ個のヌクレオチドを短縮することによるコーディング領域プライマーＥと同一の長さを有し、プライマーＦ－ｙＮは５’－末端においてｙ個のヌクレオチドを短縮することによるコーディング領域プライマーＦと同一の長さを有し、ＮはＡ、Ｔ、ＧまたはＣを表わし、ｘおよびｙはそれらのプライマーの３’－末端におけるＡ、Ｔ、ＧまたはＣのいずれかの総数を表わし、その際、ｘは６から１０、好ましくは８までの整数であり、ｙは２から６、好ましくは４までの整数である；
ｉｉ）各プライマーＡ－ｘＮ、各プライマーＢ－ｙＮ、各プライマーＣ－ｘＮ、各プライマーＤ－ｙＮ、各プライマーＥ－ｘＮおよび各プライマーＦ－ｙＮの信号値の積を下記の方程式により計算する：
数値（Ａ－ｘＮ）_ｉ＝信号値［（Ａ－ｘＮ）_ｉ＋Ｂ］・信号値［（Ａ－ｘＮ）_ｉ＋（Ｂ－ｙＮ）_ｉ］；
数値（Ｂ－ｙＮ）_ｉ＝信号値［（Ｂ－ｙＮ）_ｉ＋Ａ］・信号値［（Ｂ－ｙＮ）_ｉ＋（Ａ－ｘＮ）_ｉ］，
数値（Ｃ－ｘＮ）_ｉ＝信号値［（Ｃ－ｘＮ）_ｉ＋Ｄ］・信号値［（Ｃ－ｘＮ）_ｉ＋（Ｄ－ｙＮ）_ｉ］，
数値（Ｄ－ｙＮ）_ｉ＝信号値［（Ｄ－ｙＮ）_ｉ＋Ｃ］・信号値［（Ｄ－ｙＮ）_ｉ＋（Ｃ－ｘＮ）_ｉ］，
数値（Ｅ－ｘＮ）_ｉ＝信号値［（Ｅ－ｘＮ）_ｉ＋Ｆ］・信号値［（Ｅ－ｘＮ）_ｉ＋（Ｆ－ｙＮ）_ｉ］，
数値（Ｆ－ｙＮ）_ｉ＝信号値［（Ｆ－ｙＮ）_ｉ＋Ｅ］・信号値［（Ｆ－ｙＮ）_ｉ＋（Ｅ－ｘＮ）_ｉ］，
その際、ｉは整数であり、特定のプライマーを規定し、“＋”記号は２つのプライマーの組合わせを示し；その際、信号値は同一領域にアニールした異なるプライマーを用いたｑＰＣＲ定量の全セットに関する存在量のパーセントである；そして
ｉｉｉ）プライマー（Ａ－ｘＮ）_ｉ、（Ｂ－ｙＮ）_ｉ、（Ｃ－ｘＮ）_ｉ、（Ｄ－ｙＮ）_ｉ、（Ｅ－ｘＮ）_ｉおよび（Ｆ－ｙＮ）_ｉのそれぞれについて得られた積を比較し、その際、高い数値をもつプライマーはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする。

【0038】

本発明のＤＮＡエンコードライブラリーをデコードする方法は下記を含むことができる：
ｉ）各プライマーＡ－ｘＮおよび各プライマーＢ－ｙＮについて、各プライマーＡ－ｘＮおよび各プライマーＤ－ｙＮについて、各プライマーＣ－ｘＮおよびＤ－ｙＮについて、各プライマーＡ－ｘＮおよびＦ－ｙＮについて、各プライマーＥ－ｘＮおよびＤ－ｙＮについて、ならびに各プライマーＥ－ｘＮおよびＦ－ｙＮについて得られた数値の積を下記の方程式により計算する：
数値（Ａ－Ｂ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｂ－ｙＮ）_ｉ；
数値（Ａ－Ｄ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
数値（Ｃ－Ｄ）_ｉ＝数値（Ｃ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
数値（Ａ－Ｆ）_ｉ＝数値（Ａ－ｘＮ）_ｉ・数値（Ｆ－ｙＮ）_ｉ；
数値（Ｅ－Ｄ）_ｉ＝数値（Ｅ－ｘＮ）_ｉ・数値（Ｄ－ｙＮ）_ｉ；
数値（Ｅ－Ｆ）_ｉ＝数値（Ｅ－ｘＮ）_ｉ・数値（Ｆ－ｙＮ）_ｉ；
ｉｉ）各プライマー組合わせｉについて、数値（Ａ－Ｂ）_ｉ、（Ａ－Ｄ）_ｉ、（Ｃ－Ｄ）_ｉ、（Ａ－Ｆ）_ｉ、（Ｅ－Ｄ）_ｉおよび（Ｅ－Ｆ）_ｉの積を下記の方程式により計算する：
数値^ｉ＝数値（Ａ－Ｂ）_ｉ・数値（Ａ－Ｄ）_ｉ・数値（Ｃ－Ｄ）_ｉ・数値（Ａ－Ｆ）_ｉ・数値（Ｅ－Ｄ）_ｉ・数値（Ｅ－Ｆ）_ｉ；
ｉｉｉ）得られた積である数値^ｉを比較し、その際、高い数値をもつプライマー組合わせｉはそのＤＮＡエンコードライブラリー中に高い濃度で存在するＤＮＡ－物質コンジュゲートをコードする。

【0039】

好ましい態様において、本方法は下記の計算による数値^ｉ’の計算を含むことを特徴とする：
数値^ｉ’＝ｌｏｇ_１０［数値（Ａ－Ｂ）_ｉ・数値（Ａ－Ｄ）_ｉ・数値（Ｃ－Ｄ）_ｉ・数値（Ａ－Ｆ）_ｉ・数値（Ｅ－Ｄ）_ｉ・数値（Ｅ－Ｆ）_ｉ］。

【0040】

以下の図面および実施例を参照して、本発明による対象をより詳細に説明する；それらは本発明の対象をここに示す特定の態様に限定することを意図したものではない。
図１Ａは、単一コーディング領域２をもつＤＮＡコード１（コーディング領域ＩＩＩ）についてのｑＰＣＲ－マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。ＥおよびＦは一次プライマーであり、Ｅ_ｘｅおよびＦ_ｘｆは二次プライマーである。一次プライマーＥは第１領域＃１の上流（すなわち、５’－末端側）に結合し、一次プライマーＦは第３領域＃３の上流（すなわち、５’－末端側）に結合する。２つの一次プライマーＥ、Ｆのみを用いるｑＰＣＲは、コーディング領域ＩＩＩをもつＤＮＡエンコードライブラリーのすべてのＤＮＡ－物質コンジュゲートのＤＮＡバーコードを増幅する。少なくとも１つの一次プライマーＥ、Ｆ、および少なくとも１つの二次プライマーＥ_ｘｅ、Ｆ_ｘｆを用いるｑＰＣＲを、“一次ｑＰＣＲ”と呼ぶ。図１Ａは、３つのコード部分（サブコード）＃１、＃２、＃３をもつ単一コーディング領域ＩＩＩを含むｑＰＣＲ鋳型を示す。コーディング領域ＩＩＩの第２部分＃２の配列はユニークサブコードである。第１部分＃１と第３部分＃３のそれぞれの組合わせも、ユニークコードを表わすことができる。したがって、第２部分＃２の配列は第１部分＃１と第３部分＃３の組合わせに対応する。各コード部分（サブコード）＃１、＃２、＃３について、いずれかの配列対間（たとえば、２つの異なるｘｅ配列間）の数の差ｎは最小であるが、ｎは≧２でなければならない。これは、コード部分＃１、＃２、＃３は互いに少なくとも２つのヌクレオチドが異なることを意味する。

【0041】

図１Ｂは、２つのコーディング領域、すなわちコーディング領域Ｉおよびコーディング領域ＩＩをもつＤＮＡコードについてのｑＰＣＲ－マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。Ａ、Ｂ、ＣおよびＤは一次プライマーであり、Ａ_ｘａ、Ｂ_ｘｂ、Ｃ_ｘｃおよびＤ_ｘｄは二次プライマーであり、Ａ_ｘａｙａおよびＤ_ｘｄｙｄは三次プライマーである。少なくとも２つの三次プライマーの使用を含むｑＰＣＲを“三次ＰＣＲ”と呼ぶ。図１Ｂは２つの異なるコーディング領域Ｉ、ＩＩを含むｑＰＣＲ鋳型を示し、その際、第１コーディング領域Ｉは４つのコード部分（サブコード）＃１、＃２、＃３、＃４をもち、第２コーディング領域ＩＩも４つのコード部分（サブコード）＃１、＃２、＃３、＃４をもつ。各コーディング領域Ｉ、ＩＩの第２部分＃２の配列はユニークサブコードを表わす。各コーディング領域Ｉ、ＩＩの第１部分＃１と第３部分＃３のそれぞれの組合わせも各コーディング領域Ｉ、ＩＩのユニークサブコードを表わすことができる。この場合、各コーディング領域Ｉ、ＩＩの第２部分＃２の配列は、各コーディング領域Ｉ、ＩＩの第１部分＃１の配列と第３部分＃３の配列の組合わせに対応する。第１部分＃１と第４部分＃４のそれぞれの組合わせも、１つのユニーク構築ブロックを表わすことができる。この場合、各コーディング領域Ｉ、ＩＩの第２部分＃２の配列は、同様に各コーディング領域Ｉ、ＩＩの第１部分＃１の配列と第４部分＃４の配列の組合わせに対応する。各コード部分（サブコード）＃１、＃２、＃３、＃４について、いずれかの配列対間（たとえば、２つの異なる＃２配列間）の数の差ｎは最小であるが、ｎは≧２でなければならない。これは、各コード部分＃１、＃２、＃３、＃４は他のコード部分＃１、＃２、＃３、＃４と少なくとも２つのヌクレオチドが異なることを意味する。

【0042】

図２は、３つのコーディング領域Ｉ、ＩＩ、ＩＩＩをもつＤＮＡコードについてのｑＰＣＲ－マトリクスを作製するためにコーディングアルゴリズムがどのように作動するかを示す。Ａ、Ｂ、ＣおよびＤはそれぞれ一次プライマーである。Ａ_ｘａ、Ｂ_ｘｂ、Ｃ_ｘｃ、Ｄ_ｘｄ、Ｍ_ｘｍおよびＮ_ｘｎはそれぞれ二次プライマーである。Ａ_ｘａｙａ、Ｄ_ｘｄｙｄ、Ｍ_ｘｍｙｍおよびＮ_ｘｎｙｎはそれぞれ三次プライマーである。少なくとも２つの三次プライマーを用いるｑＰＣＲを“三次ＰＣＲ”と呼ぶ。図２は３つの異なるコーディング領域Ｉ、ＩＩ、ＩＩＩを含むｑＰＣＲ鋳型を示し、その際、第１コーディング領域Ｉは４つのコード部分（サブコード）＃１、＃２、＃３、＃４をもち、第２コーディング領域ＩＩも４つのコード部分（サブコード）＃１、＃２、＃３、＃４をもち、第３コーディング領域ＩＩＩは５つのコード部分（サブコード）＃１、＃２、＃３、＃４、＃５をもつ。各コーディング領域Ｉ、ＩＩ、ＩＩＩのそれぞれの第２コード部分＃２の配列はユニークサブコードである。コード部分＃１とコード部分＃３、コード部分＃１とコード部分＃４、およびコード部分＃１とコード部分＃５のそれぞれの組合わせもユニークサブコードを表わすことができる。たとえば、コード部分＃２の配列はコード部分＃１とコード部分＃３の組合わせに対応する。各コード部分（サブコード）について、いずれかの配列対間（たとえば、２つの異なるａｂ配列間）の数の差ｎは最小であるが、ｎは≧２でなければならない。これは、各コード部分＃１、＃２、＃３、＃４、＃５は他のコード部分コード部分＃１、＃２、＃３、＃４、＃５と少なくとも２つのヌクレオチドが異なることを意味する。

【0043】

図３Ａ、３Ｂおよび３Ｃは、３つの異なる鋳型としての３つのコーディング領域Ｉ、ＩＩ、ＩＩＩをもつＤＮＡバーコード、ならびにコーディング領域Ｉに結合するための２０の異なる一次プライマーＡおよび２０の異なる一次プライマーＢ（参照：図３Ａのマトリクス“Ａ＋Ｂを用いたＱ－ＰＣＲ”、列＝異なるプライマーＡ、行(line)＝異なるプライマーＢ）、コーディング領域ＩＩに結合するための２０の異なる一次プライマーＣおよび２０の異なる一次プライマーＤ（参照：図３Ｂのマトリクス“Ｃ＋Ｄを用いたＱ－ＰＣＲ”、列＝異なるプライマーＣ、行(line)＝異なるプライマーＤ）、ならびにコーディング領域ＩＩＩに結合するための２０の異なる一次プライマーＥおよび２０の異なる一次プライマーＦ（参照：図３Ｃのマトリクス“Ｅ＋Ｆを用いたＱ－ＰＣＲ”、列＝異なるプライマーＥ、行(line)＝異なるプライマーＦ）を用いるｑＰＣＲ後に得られたｑＰＣＲマトリクスを示す。マトリクスの代表的結果を図３Ｄの“Ｅ＋Ｆ”に示す；それは最強の増幅信号をもつプライマー対をそれらの得られた（正規化）増幅信号と共に挙げる。その表から、最強の増幅信号はプライマー対Ｅ３とＦ３（２５％）、Ｅ１８とＦ１１（２０％）、Ｅ３とＦ１１（１５％）、Ｅ１１とＦ３（１５％）、およびＥ１１とＦ１７（１５％）を用いて得られ、中等度の増幅信号はプライマー対Ｅ３とＦ１７（１０％）を用いて得られたことを導き出せる。図３Ｄの表“Ｅ＋Ｆ”の下に、得られた結果を棒グラフでも示す。得られた結果から、たとえばプライマー対Ｅ３とＦ３が結合するＤＮＡ－物質コンジュゲートはＤＮＡエンコードライブラリー（濃縮実験の後）中で高い濃度をもっていたこと、およびたとえばプライマー対Ｅ３とＦ１７が結合するＤＮＡ－物質コンジュゲートはＤＮＡエンコードライブラリー（濃縮実験の後）中でより低い濃度をもっていたことを導き出せる。信号をもたないプライマー対（たとえば、Ｅ１とＦ１）が結合するＤＮＡ－物質コンジュゲートはＤＮＡエンコードライブラリー（濃縮実験の後）中に存在しなかったことも結論できる。それぞれ特定のＤＮＡコーディング領域に結合した物質は分かっているので、この方法によって（ＤＥＬ）セレクション実験後に高濃度で存在する物質を迅速に高感度で同定できる。

【0044】

図４は、図３からのｑＰＣＲマトリクス“Ａ＋Ｂを用いたＱ－ＰＣＲ”（コーディング領域Ｉの増幅）および“Ｃ＋Ｄを用いたＱ－ＰＣＲ”（コーディング領域ＩＩの増幅）の結果、ならびに同様にプライマー対ＡとＤを用いた二次ＰＣＲ（ＩとＩＩの間のコーディング領域；図２を参照）の結果を示す。プライマー対Ａ＋Ｄを用いたｑＰＣＲは、特定のプライマー対Ａ１１とＤ１５（２０％）、Ａ１１とＤ２（１５％）、Ａ２とＤ１８（１５％）について強い増幅信号、プライマー対Ａ２とＤ８（１０％）、Ａ１１とＤ１８（１０％）、Ａ１７とＤ１８（１０％）、Ａ１７とＤ１５（１０％）およびＡ１７とＤ８（１０％）について中等度の増幅信号を生じた。同定したＡプライマーはそれぞれ特定のコーディング領域Ｉに結合し、同定したＤプライマーは特定のコーディング領域ＩＩに結合する。これは、強い信号を生じたプライマーＡとＤは、濃縮実験後にＤＮＡエンコードライブラリーにおいて濃縮されていたにちがいないコーディング領域ＩおよびＩＩをコードすることを意味する。２つのコーディング領域ＩおよびＩＩは単一のＤＮＡ鎖上に位置するにちがいないことも結論できる；さもなければ増幅信号は得られなかったであろうから。プライマー対ＡとＤを用いて得られた結果を他のプライマー対ＡとＢおよびＣとＤの結果と組み合わせるために、それぞれ特定のプライマー対について得られた数値の積を方程式数値_{コーディング領域Ｉ－ＩＩ}＝数値_{マトリクス－Ａ＋Ｄ}・数値_{マトリクス－Ａ＋Ｂ}・数値_{マトリクス－Ｃ＋Ｄ}により計算する。高い増幅信号を生じた特定のプライマーＡ、Ｂ、ＣおよびＤは、結果的に高い数値_{コーディング領域Ｉ－ＩＩ}をもつ。こうして、得られた数値_{コーディング領域Ｉ－ＩＩ}によって多量に存在するＤＮＡ－バーコードに結合したにちがいないプライマーを同定することができ、こうして（ＤＥＬ）セレクション実験後に多量に存在していた物質（ＤＮＡ－バーコードに結合したもの）を同定することができる。

【0045】

図５は、方程式数値_{コーディング領域Ｉ－ＩＩ}＝数値_{マトリクス－Ａ＋Ｄ}・数値_{マトリクス－Ａ＋Ｂ}・数値_{マトリクス－Ｃ＋Ｄ}に従って最高の積（参照：ｙ軸上の任意単位における絶対値）を生じたコーディング領域Ｉ（Ａ＋Ｂ）とＩＩ（Ｃ＋Ｄ）の３６の異なる組合わせのプロットを示す。このプロットにおいて、ｘ軸上の数値２、４、２３、２９および３２をもつコーディング領域ＩとＩＩの組合わせが最高スコアを達成したことを視覚同定できる。これらの数値は下記の５つの異なる組合わせのコーディング領域ＩとＩＩを表わす：Ａ１１Ｂ４－Ｃ１９Ｄ２（ｎｏ．２）、Ａ１１Ｂ１７－Ｃ１９Ｄ２（ｎｏ．４）、Ａ２Ｂ４－Ｃ１０－Ｄ１８（ｎｏ．２３）、Ａ１１Ｂ４－Ｃ１９Ｄ１５（ｎｏ．２９）およびＡ１１Ｂ１７－Ｃ１９Ｄ１５（ｎｏ．３２）。当然、どの物質（または複数の物質）がこれら５つの異なる組合わせをエンコードするかは分かっている。こうして、（ＤＥＬ）セレクション実験で強く濃縮された５つの異なる（グルーブの）物質を同定することができる。

【0046】

図６は、鋳型としての３つのコーディング領域Ｉ、ＩＩ、ＩＩＩをもつＤＮＡバーコード、コーディング領域Ｉについての２０の異なる一次プライマーＡおよびＢ、コーディング領域ＩＩについての２０の異なる一次プライマーＣおよびＤ、コーディング領域Ｉ－ＩＩについての（同じ）２０の異なる一次プライマーＡおよびＤ、ならびにコーディング領域ＩＩＩについての２０の異なる一次プライマーＥおよびＦを用いるｑＰＣＲ後に得られたｑＰＣＲマトリクスの一部を示す。数値_{コーディング領域Ｉ－ＩＩ}＝数値_{マトリクス－Ａ＋Ｄ}・数値_{マトリクス－Ａ＋Ｂ}・数値_{マトリクス－Ｃ＋Ｄ}を計算した後、９つのプライマー対Ａ１７Ｂ１７－Ｃ１Ｄ１５、Ａ２Ｂ４－Ｃ１０Ｄ１８、Ａ１１Ｂ４－Ｃ１Ｄ１５、Ａ１１Ｂ４－Ｃ１９Ｄ１５、Ａ１１Ｂ４－Ｃ１９Ｄ２、Ａ１１Ｂ１７－Ｃ１Ｄ１５、Ａ１１Ｂ１７－Ｃ１９Ｄ１５、Ａ１１Ｂ１７－Ｃ１０Ｄ１８およびＡ１１Ｂ１７－Ｃ１９Ｄ２によりコードされるコーディング領域Ｉ－ＩＩについて有意値が得られることが明らかになった。方程式数値_{コーディング領域ＩＩＩ}＝数値_{マトリクス－Ｆ＋Ｅ}によってコーディング領域ＩＩＩについての最高値も決定され、コーディング領域ＩＩＩについて５つのプライマー対Ｆ３Ｅ３、Ｆ１１Ｅ１８、Ｆ３Ｅ１１、Ｆ１１Ｅ３およびＦ１７Ｅ１１によって高い数値が得られることが見出された。上記で同定した９つのコーディング領域Ｉ－ＩＩが第１グループの９つの異なる物質をエンコードし、上記で同定した５つのコーディング領域ＩＩＩが第２グループの５つの異なる物質をエンコードするならば、第１グループのおよび第２グループの物質の組合わせがｑＰＣＲ実験前に高い濃度で存在していたにちがいない、すなわち（ＤＥＬ）セレクション実験によって強く濃縮されたにちがいないということになる。

【0047】

図７は、それぞれがＤＮＡバーコードでタグ付けされた３０６の化合物をもつ中等度ＤＥＬについてのデコーディングプロセスを示す。ＤＥＬセレクション実験の前と後に、プライマー対ＥとＦ、プライマー対Ｅ_ｘｅとＦ、プライマー対ＥとＦ_ｘｆ、プライマー対Ｅ_ｘｅ１とＦ_ｘｆ１１、およびプライマー対Ｅ_ｘｅ３とＦ_ｘｆ１７を用いる一次ｑＰＣＲを実施した。セレクション前に得られたＣ_ｑ値を図７の左のマトリクスに示し、セレクション後に得られたＣ_ｑ値を中央のマトリクスに示し、△Ｃ_ｑ値を右のマトリクスに示す。プライマー対ＥとＦの△Ｃｑ値より低いプライマー対の△Ｃｑ値は、ＤＮＡ－物質コンジュゲートの濃縮の指標となる。“△Ｃ_ｑ”－マトリクスにみられるように、サブコーディング領域Ｅ－Ｆ_ｘｆ１１は１０．０の△Ｃ_ｑ値をもち、それはサブコーディング領域Ｅ－Ｆについての１３．１の△Ｃ_ｑ値より低い（すなわち、対照より低い）。これは、サブコーディング領域Ｅ－Ｆ_ｘｆ１１が濃縮されていたことを意味する。それの△Ｃ_ｑ値１０．０がサブコーディング領域Ｅ－Ｆについての１３．１の△Ｃ_ｑ値より低い（すなわち、対照より低い）サブコーディング領域Ｅ_ｘｅ１－Ｆについても同じことが言える。こうして、一次ｑＰＣＲの結果は、ＤＥＬセレクション実験後に、プライマーＥ_ｘｅ１およびＦ_ｘｆ１１が結合するサブコーディング領域によってコードされる物質（単数または複数）はプライマーＥ_ｘｅ３およびＦ_ｘｆ１７が結合するサブコーディング領域によってコードされる物質より強く濃縮されていたことの指標となる。さらに、それらのデータを確認するために、プライマー対Ｅ_ｘｅとＦ_ｘｆを用いて二次ｑＰＣＲを実施した。その二次ｑＰＣＲによって、サブコーディング領域Ｅ_ｘｅ１－Ｆ_ｘｆ１１がサブコーディング領域Ｅ_ｘｅ３－Ｆ_ｘｆ１７より強く濃縮されることが確認された（参照：図７のマトリクス“△Ｃ_ｑ”：列Ｅ_ｘｅ１および行Ｆ_ｘｆ１１のフィールドの数値は列Ｅ_ｘｅ３および行Ｆ_ｘｆ１７のフィールドの数値よりはるかに低く、かつ対照である列Ｅおよび行Ｆのフィールドの数値よりはるかに低い）。要するに、一次および二次ｑＰＣＲは共に、Ｅ_ｘｅ１－Ｆ_ｘｆ１１サブコーディング領域に結合した物質（単数または複数）がＤＥＬセレクション実験後に強く濃縮されていたにちがいないことを立証する。

【0048】

図８は、それぞれがＤＮＡバーコードでタグ付けされた４^１０の化合物をもつ大きなＤＥＬの例を示す。これらのライブラリーはＤＮＡの部分変性合成により作製された。図８は、１つの（一定の）プライマーＥおよび多様な異なるプライマーＦ_ｎを用いる一次ＰＣＲを実施するためのセットアップを示し、その際、各プライマーＦ_ｎは特定のサブグループのライブラリー、具体的にはライブラリー（合計４^１０の化合物をもつ）の１／４^ｎの化合物をコードし、その際、ｎは０から５までの整数である。これは以下のことを意味する：６つのプライマーＦを用いるならば、第１プライマーＦ_ｏはライブラリーのすべての化合物の１／４^０、すなわちライブラリーのすべての化合物（＝４^１０＝１０４８５７６の化合物）をコードし、プライマーＦ_１はライブラリーのすべての化合物の１／４のみ（＝２６２１４４の化合物）をコードし、プライマーＦ_２はライブラリーのすべての化合物の１／１６のみ（＝６５５３６の化合物）をコードし、プライマーＦ_３はライブラリーのすべての化合物の１／６４のみ（＝１６３８４の化合物）をコードし、プライマーＦ_４はライブラリーのすべての化合物の１／２５６のみ（＝４０９６の化合物）をコードし、プライマーＦ_５はライブラリーのすべての化合物の１／１０２４のみ（＝１０２４の化合物）をコードする。これは、ｑＰＣＲが実施された後、ＤＥＬ実験において選択されたエンコードされた物質のグループを有意に絞り込めることを意味する；エンコードされた物質であってプライマーＦ_ｎ（ｎは０～５である）で増幅できないものはｑＰＣＲにおいて信号を生じないからである。たとえば、プライマーＥとプライマーＦ_１の組合わせが一次ｑＰＣＲにおいて信号を生じることができなければ、すべての化合物のうち３／４、すなわち１０４８５７６の化合物のうち７８６４３２の化合物はそのｑＰＣＲによって増幅できず、よって一次ｑＰＣＲの前のＤＥＬセレクション実験によって濃縮されなかったことが明らかである。よって、ＤＥＬライブラリーのすべての化合物のうち残り１／４のみ（＝２６２１４４の化合物）が、（ＤＥＬ）セレクション実験で濃縮されていたことについて問題となる。

【0049】

図９は、それぞれがＤＮＡバーコードでタグ付けされた４^２０の化合物をもつきわめて大きなＤＥＬの他の例を示す。主な操作は図８に開示した４^１０の化合物をもつＤＥＬに関するものと同じである。しかし、ＤＥＬのサイズが大きいため、５より多い異なるプライマーＦを用いて一次ＰＣＲを実施すれば有益である。具体的には、この場合にはｎが０から１０までの整数であれば有益である。これは、１１のプライマーＦを用いるならば、第１プライマーＦ_ｏはライブラリーのすべての化合物をコードし、最後のプライマーＦ_１０はライブラリーのすべての化合物のうち１／４^１０のみ（＝１０４８５７６の化合物）をコードすることを意味する。これは、ｑＰＣＲを実施した後、ＤＥＬ実験で選択されていたエンコードされた物質のグループが有意に狭まったことを意味する－たとえば、ｑＰＣＲにおいてプライマーＦ_１で信号を生じないＤＮＡ－物質コンジュゲートのＤＮＡバーコードは、そのＤＮＡバーコードが４^２０の化合物のうちＤＥＬ濃縮実験で濃縮されなかった３／４のグループ（≒８．２・１０^１１の化合物）に属することを意味する。よって、関連する濃縮されたＤＮＡ－物質コンジュゲートのグループは４^２０の化合物のうち１／４（≒２．７・１０^１１の化合物）に狭まった。ｎ＝１からｎ＝１０まで増大する各プライマーＦ_ｎを用いると、関連化合物のグループはさらに狭まる。プライマーＦ_１０で見つかる増幅信号は、そのＤＮＡ－物質コンジュゲートが合計４^２０の化合物（≒１．１・１０^１２の化合物）のうち４^１０のサブグループ（≒１・１０^６の化合物）内にあることを意味する。

【0050】

図１０は、ＤＮＡエンコードライブラリー（ＤＥＬ）内のＤＮＡ－ＣＢＳ－コンジュゲートを酵素である炭酸脱水素酵素ＩＩを用いたセレクションによって濃縮した後の物質４－カルボキシベンゼンスルホンアミド（以下において：“ＣＢＳ”）の同定を示す。３つのプライマー１ｂ，２ｂ，３ｂと対合する３つのプライマー１ａ，２ａ，３ａを用いて小規模ｑＰＣＲマトリクスを構築した。プライマー対１ａ，１ｂはライブラリーのＤＮＡ－物質コンジュゲートのすべてのＤＮＡ－バーコードにアニールし、よって全ライブラリーのＤＮＡバーコードを増幅する能力をもつ。プライマー２ａはＤＮＡ－ＣＢＳ－コンジュゲートを含むサブ－ライブラリーをカバーし、プライマー２ｂはＤＮＡ－ＣＢＳ－コンジュゲートを含む他のサブ－ライブラリーをカバーする。プライマー２ａと２ｂの組合わせは専らＣＢＳに割り当てることができる。プライマー３ａはＤＮＡバーコードにコンジュゲートしたテオブロミン（以下において：“Ｔｈｅｏ”）（＝ＤＮＡ－Ｔｈｅｏ－コンジュゲート）を含むサブ－ライブラリーをカバーし、プライマー３ｂはＤＮＡ－Ｔｈｅｏ－コンジュゲートを含む他のサブ－ライブラリーをカバーする。プライマー３ａと３ｂの組合わせは専らＴｈｅｏに割り当てることができる。△Ｃｑは、セレクションの前と後のｑＰＣＲサイクルにおける差である。小さい数値は大きい濃縮を反映する。△Ｃｑ（１ａ－１ｂ）＞△Ｃｑ（２ａ－１ｂ）≒△Ｃｑ（１ａ－２ｂ）＞△Ｃｑ（２ａ－２ｂ）は、ＣＢＳが顕著に増強されていることを指摘した。△Ｃｑ（１ａ－１ｂ）＜△Ｃｑ（３ａ－１ｂ）≒△Ｃｑ（１ａ－３ｂ）≒△Ｃｑ（３ａ－３ｂ）は、Ｔｈｅｏが濃縮されていないことを示した。

【0051】

図１１は、第１物質Ｓが第１コーディング領域ＤＮＡ配列Ｉおよび第２コーディング領域ＤＮＡ配列に化学的に共有結合しており、第２物質Ｓが第３コーディング領域ＤＮＡ配列ＩＩＩに化学的に共有結合しているＤＮＡ－物質コンジュゲートを示す。各コーディング領域ＤＮＡ配列Ｉ、ＩＩ、ＩＩＩは、特定のプライマーが結合する（すなわち、ｑＰＣＲに際してアニールする）ことができる第１部分＃１、および第３部分＃３をもつ。プライマーＰ２’（５’－ｇｃｔｇｔｔｃｃｃａｃａｔｔｇｃｇｔ－３’、ＳＥＱ－ＩＤＮｒ．１）は第１コーディング領域ＤＮＡ配列Ｉの第１部分＃１に結合し、プライマーＰ２Ｙ（５’－ｃｃｔｔｃｔｇｇａｔｔｃｇｇｔｃｇｇａｇｃａｃｃａｔｃ－３’、ＳＥＱ－ＩＤＮｒ．２）は第１コーディング領域ＤＮＡ配列Ｉの第３部分＃３に結合し、プライマーＰ２Ｙ’（５’－ｇａｔｇｇｔｇｃｔｃｃｇａｃｃｇａａｔｃｃａｇａａｇｇ－３’、ＳＥＱ－ＩＤＮｒ．３）は第２コーディング領域ＤＮＡ配列ＩＩの第１部分＃１に結合し、プライマーＰ１Ｙ（５’－ｇｇａｇｇｔｇｔａｇａｃｇａｃａｇａｇｔａｔｔｔｇａｃｔｇｔｃａｇｇ－３’、ＳＥＱ－ＩＤＮｒ．４）は第２コーディング領域ＤＮＡ配列ＩＩの第３部分＃３に結合し、プライマーＰ４’（５’－ｃａｇａｔｃｇａｇｃａａｃｔｃｃａｃ－３’、ＳＥＱ－ＩＤＮｒ．５）は第３コーディング領域ＤＮＡ配列ＩＩＩの第１部分＃１に結合し、プライマーＰ５（５’－ｔｇｇｔｃｔｃａｇｃｃｇｃｃｃｔａｔ－３’、ＳＥＱ－ＩＤＮｒ．６）は第３コーディング領域ＤＮＡ配列ＩＩＩの第３部分＃３に結合する。物質ＳがＤＮＡエンコードライブラリーを用いたセレクション実験後に濃縮されていれば、プライマー対Ｐ２’およびＰ２Ｙ、プライマー対Ｐ２Ｙ’およびＰ１Ｙ、ならびにプライマー対Ｐ４’およびＰ５を用いる増幅はそれぞれｑＰＣＲにおいて強い増幅信号を生じ、それによって物質Ｓの同定が可能になる。

【実施例】

【0052】

実施例１－単一コーディング領域をもつＤＮＡバーコードを含むＤＥＬ
単一コーディング領域のみを含むＤＮＡコードについて、各コードは３つの部分、＃１（第１部分）、＃２（第２部分）および＃３（第３部分）をコードする。それぞれの＃２配列はユニークコードであり、一方、＃１と＃３の組合わせもユニークコードを表わすことができる（参照：たとえば図１Ａ）。したがって、＃２の配列は＃１と＃３の組合わせに対応する。

【0053】

各部分について、いずれかの配列対間（たとえば、２つの異なる＃１配列間）の数の差ｎは最小であるが、ｎは≧２でなければならない。
実施例２－２つのコーディング領域をもつＤＮＡバーコードを含むＤＥＬ
２つのコーディング領域を含むＤＮＡコードについて、各サブコードは４つの部分、たとえば第１コーディング領域＃１（第１部分）、＃２（第２部分）、＃３（第３部分）および＃４（第４部分）、ならびに第２コーディング領域＃１（第１部分）、＃２（第２部分）、＃３（第３部分）および＃４（第４部分）をもつ（参照：たとえば図１Ｂ）。それぞれの＃２（第２部分）配列はユニークサブコードであり、一方、＃１、＃３および＃４のそれぞれの組合わせは＃２に対応し、＃１、＃３および＃４のそれぞれの組合わせは＃２に対応する。

【0054】

各部分について、いずれかの配列対間（たとえば、２つの異なる＃１配列間）の数の差ｎは最小であるが、ｎは≧２でなければならない。
実施例３－２つより多いコーディング領域をもつＤＮＡバーコードを含むＤＥＬ
２つより多いコーディング領域をもつＤＮＡコード（参照：たとえば図１Ｂまたは図２）について、両端の２つのサブコードを実施例２に従って設計し、それらの間のサブコード（単数または複数）を実施例１、実施例２または実施例４のいずれかに従って設計する。スプリット＆プール(split-and-pool)法を用いて高品質ＤＥＬを合成できる可能性はきわめて低い。したがって、４未満のサブコードを含むＤＥＬが好ましい。

【0055】

実施例４－５つのサブコードをもつＤＮＡバーコードを含むＤＥＬ
このＤＥＬのＤＮＡバーコードは５つの部分、＃１（第１部分）、＃２（第２部分）、＃３（第３部分）、＃４（第４部分）および＃５（第５部分）をもつ。

【0056】

それぞれの＃２配列（第２部分）はユニークサブコードであり、一方、＃１と＃３のそれぞれの組合わせもユニークサブコードを表わすことができる。したがって、＃２の配列は＃１と＃３の組合わせに対応する。＃１と＃４のそれぞれの組合わせもユニークサブコードを表わすことができる。したがって、＃２の配列は＃１と＃４の組合わせに対応する。＃１と＃５のそれぞれの組合わせもユニークサブコードを表わすことができる。したがって、＃２の配列は＃１と＃５の組合わせに対応する。

【0057】

各部分について、いずれかの配列対間（たとえば、２つの異なる＃１配列間）の数の差ｎは最小であるが、ｎは≧２でなければならない。
実施例５－デコーディングプロセスの記載：１つの（サブ）コードのデコーディング
プライマーＡをｕ個の異なるプライマーＢ－ｘｂと共に用い、プライマーＢをｖ個の異なるプライマーＡ－ｘａと共に用いて、第１コーディング領域Ｉについて一次ｑＰＣＲマトリクスを構築する。したがって、得られるマトリクスのサイズはｕ・ｖである（参照：たとえば図３）。同じマトリクスを第２コーディング領域ＩＩおよび第３コーディング領域ＩＩＩについても構築することができる。

【0058】

Ｂ－ｘｂおよびＡ－ｘａの対を用いて第１コーディング領域Ｉについて二次ｑＰＣＲマトリクスを構築するが、Ｂ－ｘｂおよびＡ－ｘａは一次マトリクスにおける信号強度に従って選択される。同じ二次マトリクスを第２コーディング領域ＩＩおよび第３コーディング領域ＩＩＩについて構築することができる。各構築ブロックについてのランキングをこうして結論することができる。

【0059】

２つのサブコードを含む配列について、Ａ－ｘａおよびＤ－ｘｄを用いて追加の二次ｑＰＣＲマトリクスを構築することができるが、Ａ－ｘａおよびＤ－ｘｄは一次マトリクスにおける信号強度に従って選択される。

【0060】

２つのサブコードマトリクス（Ａ－ｘａ＋Ｂ－ｘｂ、およびＣ－ｘｃ＋Ｄ－ｘｄ）との組合わせで、組合わせのランキングを特定のアルゴリズム、たとえば
数値^ｉ＝数値^ｉ _{マトリクス－Ａ＋Ｄ}・数値^ｉ _{マトリクス－Ａ＋Ｂ}・数値^ｉ _{マトリクス－Ｃ＋Ｄ}
に基づいて結論することができ、その際、数値^ｉはＤＥＬ中の特定のＤＮＡバーコードに関係しそれの量に比例する数値である。言い換えると、その数値^ｉは２つの構築ブロックおよび２つのサブコードを連結することによるコンビナトリアル合成から得られた個々のＤＮＡ配列（バーコード構造）に関係する。

【0061】

数値^ｉランキングをさらに検証するために、Ａ－ｘａ－ｙａおよびＤ－ｘｄ－ｙｄを用いて追加の三次ｑＰＣＲマトリクスを構築することができるが、Ａ－ｘａ－ｙａおよびＤ－ｘｄ－ｙｄは一次および二次マトリクスならびに得られる数値^ｉランキングに従って選択される。

【0062】

Ａ、ＤならびにすべてのＡ－ｘａ－ｙａおよびＤ－ｘｄ－ｙｄを用いて完全マトリクスを構築することもできるが、それは前記の方法より著しく経費がかかるであろう。
この方法は２より多いサブコードを含むＤＥＬについて十分な定量的デコーディング解を提供することはできない。しかし、各種の一次、二次および三次ｒｔＰＣＲマトリクスを組み合わせることにより、幾つかのサブコードを含むＤＮＡコードに対応する特定の化合物ｉについての数値^ｉを提供することができる。すべてのフォワードおよびバックワードプライマーを組み合わせてマトリクスを構築することができる。

【0063】

たとえば、いずれかのプライマーＡ、Ａ－ｘａ、Ａ－ｘａ－ｙａをいずれかのプライマーＢ、Ｂ－ｘｂ、Ｎ、Ｎ－ｙｎ、Ｎ－ｘｎ－ｙｎ、Ｄ、Ｄ－ｘｄ、Ｄ－ｘｄ－ｙｄと組み合わせて、ＱＰＣＲマトリクスを構築することができる。特定の化合物についての数値を特定のアルゴリズム、たとえば
数値^ｉ＝ｌｏｇ_１０（数値^ｉ _{マトリクス－Ａ＋Ｄ}・数値^ｉ _{マトリクス－Ａ＋Ｎ}・数値^ｉ _{マトリクス－Ｍ＋Ｄ}・数値^ｉ _{マトリクス－Ａ＋Ｂ}・数値^ｉ _{マトリクス－Ｃ＋Ｄ}・数値^ｉ _{マトリクス－Ｍ＋Ｎ}）
に従って計算することができ、その際、数値^ｉ _{マトリクス－Ａ＋Ｄ}、数値^ｉ _{マトリクス－Ａ＋Ｎ}および数値^ｉ _{マトリクス－Ｍ＋Ｄ}は二次もしくは三次マトリクスのいずれかからのものまたはそれらを組み合わせたものであってもよく、数値^ｉ _{マトリクス－Ａ＋Ｂ}・数値^ｉ _{マトリクス－Ｃ＋Ｄ}・数値^ｉ _{マトリクス－Ｍ＋Ｎ}は二次マトリクスからのものである。

【0064】

参照記号のリスト
ＤＢＣ：ＤＮＡバーコード配列；
Ｓ：物質；
Ｉ：第１コーディング領域ＤＮＡ配列；
ＩＩ：第２コーディング領域ＤＮＡ配列；
ＩＩＩ：第３コーディング領域ＤＮＡ配列；
＃１：コーディング領域ＤＮＡ配列の第１部分；
＃２：コーディング領域ＤＮＡ配列の第２部分；
＃３：コーディング領域ＤＮＡ配列の第３部分；
＃４：コーディング領域ＤＮＡ配列の第４部分；
＃５：コーディング領域ＤＮＡ配列の第５部分；
Ａ、Ｂ、Ｃ、Ｄ、
Ｅ、Ｆ、Ｍ、Ｎ：一次プライマー；
Ａ_ｘａ、Ｂ_ｘｂ、Ｃ_ｘｃ、
Ｄ_ｘｄ、Ｅ_ｘｅ、Ｆ_ｘｆ、
Ｍ_ｘｍ、Ｎ_ｙｎ：二次プライマー；
Ａ_ｘａｙａ、Ｄ_ｘｄｙｄ，
Ｍ_ｘｍｙｍ、Ｎ_ｘｎｙｎ：三次プライマー；
１ａ、１ｂ：すべてのＤＢＳに結合する一次プライマー；
２ａ、２ｂ：ＣＢＳのＤＢＳのみに結合する二次プライマー；
３ａ、３ｂ：Ｔｈｅｏのみに結合する二次プライマー；
Ｐ２’：コーディング領域Ｉの第１部分＃１に結合するプライマー；
Ｐ２Ｙ：コーディング領域Ｉの第３部分＃３にアニールするプライマー；
Ｐ２Ｙ’：コーディング領域ＩＩの第１部分＃１にアニールするプライマー；
Ｐ１Ｙ：コーディング領域ＩＩの第３部分＃３にアニールするプライマー；
Ｐ４’：コーディング領域ＩＩＩの第１部分＃１にアニールするプライマー；
Ｐ５：コーディング領域ＩＩＩの第３部分＃３にアニールするプライマー

【図1】