(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-08-23
(54)【発明の名称】RNAを用いたゲノム変化および遺伝子発現変化の検出および定量化の方法
(51)【国際特許分類】
C12Q 1/6827 20180101AFI20240816BHJP
C12Q 1/6869 20180101ALI20240816BHJP
C12Q 1/6876 20180101ALI20240816BHJP
C12Q 1/6851 20180101ALI20240816BHJP
C40B 40/06 20060101ALI20240816BHJP
C12Q 1/6886 20180101ALI20240816BHJP
【FI】
C12Q1/6827 Z ZNA
C12Q1/6869 Z
C12Q1/6876 Z
C12Q1/6851 Z
C40B40/06
C12Q1/6886 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024514609
(86)(22)【出願日】2022-05-26
(85)【翻訳文提出日】2024-04-22
(86)【国際出願番号】 SG2022050354
(87)【国際公開番号】W WO2023033713
(87)【国際公開日】2023-03-09
(31)【優先権主張番号】10202109756V
(32)【優先日】2021-09-06
(33)【優先権主張国・地域又は機関】SG
(81)【指定国・地域】
(71)【出願人】
【識別番号】524084078
【氏名又は名称】ルーセンス ライフ サイエンシズ プライベート リミテッド
(74)【代理人】
【識別番号】100102978
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100205707
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100160923
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100188433
【氏名又は名称】梅村 幸輔
(74)【代理人】
【識別番号】100128048
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100114340
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100214396
【氏名又は名称】塩田 真紀
(74)【代理人】
【識別番号】100121072
【氏名又は名称】川本 和弥
(74)【代理人】
【識別番号】100221741
【氏名又は名称】酒井 直子
(74)【代理人】
【識別番号】100114926
【氏名又は名称】枝松 義恵
(72)【発明者】
【氏名】チョードリー ユクティ
(72)【発明者】
【氏名】シェル チェイ イン
(72)【発明者】
【氏名】ホ ジア ミン
(72)【発明者】
【氏名】タン ミン-ハン
(72)【発明者】
【氏名】ヌゲ カオ チン
(72)【発明者】
【氏名】ピンウェハ パナパ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA19
4B063QQ03
4B063QQ52
4B063QQ53
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS34
4B063QX02
(57)【要約】
本発明は、生物学的サンプル中のRNAを用いてゲノムおよび遺伝子発現の変化を検出および定量化する方法に関する。開示される方法は、開示される方法から得られた配列アライメントのバリアント呼び出しを実施することにより、ゲノム変化の有無を判定する、および/または遺伝子発現の有無を判定する、および/または遺伝子発現のレベルを定量化する段階を含みうる。バリアント呼び出しは、開示される方法からの配列アライメントに基づいてコンセンサス読み取りと参照ゲノムとの間の差異を同定する段階; およびゲノム変化を含む配列アライメントの読み取り計数を判定する段階を含みうる。ゲノム変化は挿入(重複など)、欠失、単一ヌクレオチド変異、またはそれらの組み合わせでありうる。本方法はまた、複数の標的特異的フォワードおよびリバースプライマー対を用いて、変換されたcDNAに対して複数の多重化PCR反応を実施する段階を含む。1つの態様において、複数のプライマー対は、各標的遺伝子のエクソン-エクソン接合部にまたがる連続配列に相補的である。本出願はまた、そのキットも開示する。
【特許請求の範囲】
【請求項1】
以下の段階を含む、生物学的サンプル中のRNAを用いてゲノム変化を検出する、および/または遺伝子発現を検出する、および/または遺伝子発現のレベルを定量化する方法:
(a) 生物学的サンプルからRNAを抽出し、該RNAを相補的DNA(cDNA)に変換する段階;
(b) 変換されたcDNAに対して、複数の多重化PCR反応を、
(I)
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対であって、
該ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
フォワードプライマーが、ゲノム変化を起こしうる各標的遺伝子のエクソン接合部の約50塩基対
上流に位置する配列に相補的であり、
該ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、ゲノム変化を起こしうる各標的遺伝子のエクソン接合部の約50塩基対
下流に位置する配列に相補的であり、
該ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、その5'末端にバーコード配列を含み、該ゲノム変化を起こしうる各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なる、
複数のフォワードおよびリバースプライマー対、ならびに/または
(II)
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対であって、
(i) 該対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
フォワードプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
該対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる該配列の約100塩基対
下流の配列に相補的であり、
該対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(ii) 該対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
該対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
フォワードプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる該配列の約100塩基対
下流の配列に相補的であり、
該対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(iii) 該対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよび各リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる連続配列に相補的であり、
該対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なる、
複数のフォワードおよびリバースプライマー対、ならびに/または
(III)
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のプライマーセットであって、
各プライマーセットが、タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対を含み、
(i) 該タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各
フォワードプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
該タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる該配列の約100塩基対
下流の配列に相補的であり、
該タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なり、
(ii) 該タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
該タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
フォワードプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる該配列の約100塩基対
下流の配列に相補的であり、
該タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバース
プライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(iii) 該タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよび各リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる連続配列に相補的であり、
該タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なる、
複数のプライマーセット
を用いて実施し、それによって複数のアンプリコンを作製する段階;
(c) 段階(b)からの複数のアンプリコンを精製する段階;
(d) ユニバーサルインデックス付きアダプタープライマーを用いることにより段階(c)からの精製産物を増幅して、配列決定用ライブラリを作製する段階;
(e) 段階(d)から得られた配列決定用ライブラリを精製する段階;
(f) 段階(e)からの精製された配列決定用ライブラリを次世代配列決定用プラットフォーム上で多重配列決定に供して、複数の配列決定読み取りを得る段階;
(g) 段階(f)から得られた複数の配列決定読み取りから各配列のコンセンサス読み取りを導出する段階;
(h) 段階(g)から得られたコンセンサス読み取りと参照ゲノムとの配列アライメントを実施する段階であって、
(I) 配列アライメントが第1の遺伝子由来のエクソンの参照ゲノムとの部分的アライメントおよび第2の遺伝子由来のエクソンの参照ゲノムとの部分的アライメントをもたらすなら、次に、
(i) 配列アライメントをスプリット読み取りと判定し、
(ii) 融合接合を支持する段階(h)(I)(i)からのスプリット読み取りの数を計数/列挙し、そして
(iii) 段階(h)(I)(ii)からのスプリット読み取りの数が2つまたはそれ以上であるなら、その場合には第1の遺伝子および第2の遺伝子を融合パートナーと判定する、
(II) 配列アライメントが対照ハウスキーピング遺伝子の参照ゲノムとのアライメントをもたらすなら、次に、
(i) 配列アライメントを対照ハウスキーピング遺伝子のコンセンサス読み取りと判定し、
(ii) 段階(h)(II)(i)からの対照ハウスキーピング遺伝子のコンセンサス読み取り対を計数/列挙し、そして
(iii) 対照ハウスキーピング遺伝子の遺伝子発現のレベルを判定する、
(III) 配列アライメントがタンパク質発現に関連する標的遺伝子の参照ゲノムとのアライメントをもたらすなら、
(i) 配列アライメントをタンパク質発現に関連する標的遺伝子のコンセンサス読み取りと判定し、
(ii) 段階(h)(III)(i)からのタンパク質発現に関連する標的遺伝子のコンセンサス読み取り対を計数/列挙し、そして
(iii) タンパク質発現に関連する標的遺伝子の遺伝子発現のレベルを判定する、
段階;
(i) 段階(h)からの配列アライメントに基づいて、ゲノム変化の有無を判定する、および/または遺伝子発現の有無を判定する、および/または遺伝子発現のレベルを定量化する段階。
【請求項2】
RNAが、無細胞RNA(cfRNA)ならびに組織および/または細胞内に封入されたRNAからなる群より選択される、請求項1記載の方法。
【請求項3】
生物学的サンプルが、液体サンプル、組織サンプル、および細胞サンプルからなる群より選択される、請求項1または2記載の方法。
【請求項4】
液体サンプルが体液であり、任意で該体液が、血液、骨髄、脳脊髄液、腹膜液、胸水、リンパ液、腹水、漿液、喀痰、涙液、便、尿、唾液、乳管液、胃液および膵液からなる群より選択され、任意で該体液が血液であり、任意で該血液が血漿である、請求項3記載の方法。
【請求項5】
組織サンプルが凍結組織サンプルまたは固定組織サンプルであり、任意で該固定組織サンプルがホルマリン固定パラフィン包埋(FFPE)組織サンプルである、請求項3記載の方法。
【請求項6】
生物学的サンプルが、がんを有するおよび/またはがんを有すると疑われる対象から得られる、請求項1~5のいずれか一項記載の方法。
【請求項7】
がんが、白血病、肺がん、結腸直腸がん、乳がん、膵臓がん、前立腺がん、上咽頭がん、肝臓がん、胆管がん、食道がん、尿路上皮がん、および胃腸がんからなる群より選択される、請求項6記載の方法。
【請求項8】
がんが、転移性前立腺がん、転移性肺がん、転移性乳がん、および白血病からなる群より選択される、請求項6または7記載の方法。
【請求項9】
段階(a)において用いられるRNAの量が6 ng~100 ngである、請求項1~8のいずれか一項記載の方法。
【請求項10】
段階(a)が逆転写キットを用いて実施され、該逆転写キットが、逆転写を実施するための緩衝液、逆転写酵素、および複数のランダムプライマーを含む、請求項1~9のいずれか一項記載の方法。
【請求項11】
変換されたcDNAに対して実施される複数の多重化PCR反応が、3~15回のPCRサイクルを含む、請求項1~10のいずれか一項記載の方法。
【請求項12】
バーコード配列が、10~16個のランダムヌクレオチドを含むオリゴヌクレオチドである、請求項1~11のいずれか一項記載の方法。
【請求項13】
バーコード配列が、10個のランダムヌクレオチドを含むオリゴヌクレオチドである、請求項1~12のいずれか一項記載の方法。
【請求項14】
ゲノム変化を起こしうる標的遺伝子が、
融合を起こすことが知られている遺伝子のパートナー遺伝子由来のエクソンに融合された、該融合を起こすことが知られている遺伝子由来のエクソン
を含む、請求項1~13のいずれか一項記載の方法。
【請求項15】
融合を起こすことが知られている遺伝子が、ALK受容体チロシンキナーゼ、RETがん原遺伝子、ROSがん原遺伝子1、線維芽細胞増殖因子受容体1(FGFR1)、線維芽細胞増殖因子受容体2(FGFR2)、線維芽細胞増殖因子受容体3(FGFR3)、神経栄養受容体チロシンキナーゼ1(NTRK1)、神経栄養受容体チロシンキナーゼ2(NTRK2)、神経栄養受容体チロシンキナーゼ3(NTRK3)、ニューレグリン1(NRG1)、B-Rafがん原遺伝子、セリン/スレオニンキナーゼ(BRAF)、膜貫通セリンプロテアーゼ2(TMPRSS2)、METがん原遺伝子、受容体チロシンキナーゼ(MET)、上皮増殖因子受容体(EGFR)、エストロゲン受容体1(ESR1)、血小板由来増殖因子受容体アルファ(PDGFRA)、アンドロゲン受容体(AR)、RhoGEFおよびGTPaseのBCR活性化因子(BCR)、コア結合因子サブユニットベータ(CBFB)、リジンメチルトランスフェラーゼ2A(KMT2A)、ヌクレオホスミン1(NPM1)、PML核小体スキャフォールド(PML)、ならびにRUNXファミリー転写因子1(RUNX1)からなる群より選択される、請求項14記載の方法。
【請求項16】
融合を起こすことが知られている遺伝子のパートナー遺伝子が、EMAP様4(EML4)、キネシンファミリーメンバー5B(KIF5B)、コイルドコイルドメイン含有6(CCDC6)、CD74分子(CD74)、形質転換酸性コイルドコイル含有タンパク質3(TACC3)、エズリンEZR)、ETS転写因子ERG(ERG)、GTPaseドメインとアンキリンリピートとPHドメイン3を有するArfGAP(AGAP3)、A-キナーゼアンカリングタンパク質9(AKAP9)、KIAA1549、トロポミオシン3(TPM3)、転座プロモーター領域、核バスケットタンパク質(TPR)、ERからゴルジ調節因子への輸送(TFG)、ラミンA/C(LMNA)、BicCファミリーRNA結合タンパク質1(BICC1)、RAD51リコンビナーゼ(RAD51)、CD47分子(CD47)、Yes1関連転写調節因子(YAP1)、ETSバリアント転写因子1(ETV1)、ETSバリアント転写因子4(ETV4)、ETSバリアント転写因子5(ETV5)、ETSバリアント転写因子6(ETV6)、PAPOLAおよびCPSF1と相互作用する因子(FIP1L1)、セントリオリン(CNTRL)、ABLがん原遺伝子1、非受容体チロシンキナーゼ(ABL1)、AF4/FMR2ファミリーメンバー1(AFF1)、MDS1およびEVI1複合体遺伝子座(MECOM)、MLLT3スーパー伸長複合体サブユニット(MLLT3)、ミオシン重鎖11(MYH11)、PBXホメオボックス1(PBX1)、レチノイン酸受容体アルファ(RARA)、RUNX1パートナー転写共抑制因子1(RUNX1T1)からなる群より選択される、請求項14記載の方法。
【請求項17】
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、ならびに
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のプライマーセットの数が、少なくとも300である、請求項1~16のいずれか一項記載の方法。
【請求項18】
段階(b)において作製される複数のアンプリコンの長さが、90~110塩基対である、請求項1~17のいずれか一項記載の方法。
【請求項19】
段階(c)および/または(e)における精製が、複数の常磁性ビーズを用いて実施され、任意で該常磁性ビーズが、AMPure XPビーズ、SPRIビーズ、およびdynabeadsからなる群より選択される、請求項1~18のいずれか一項記載の方法。
【請求項20】
段階(g)が以下をさらに含む、請求項1~19のいずれか一項記載の方法:
(g)(I) 各配列決定読み取りからバーコード配列の存在を検出すること、
(g)(II) 同じバーコード配列を有する複数の配列決定読み取りに対してクラスタ再割り当てを実施して、複数のバーコードクラスタを作製することであって、ここで各バーコードクラスタが、同じアンプリコンからの、同じバーコード配列を有する読み取りを含む、こと、および
(g)(III) 各バーコードクラスタに対しコンセンサス呼び出しを実施して、各配列のコンセンサス読み取りを得ること。
【請求項21】
ゲノム変化の有無を判定する、および/または遺伝子発現の有無を判定する、および/または遺伝子発現のレベルを定量化する段階が、段階(h)からの配列アライメントのバリアント呼び出しを実施することをさらに含む、請求項1~13および17~20のいずれか一項記載の方法。
【請求項22】
バリアント呼び出しの段階が、以下を含む、請求項21記載の方法:
(i) 段階(h)からの配列アライメントに基づいてコンセンサス読み取りと参照ゲノムとの間の差異を同定すること; および
(ii) ゲノム変化を含む配列アライメントの読み取り計数を判定すること。
【請求項23】
ゲノム変化が、挿入、欠失、および単一ヌクレオチド変異からなる群より選択され、任意で該挿入が重複である、請求項21または22記載の方法。
【請求項24】
以下を含む、請求項1~23のいずれか一項記載の方法により生物学的サンプル中のRNAを用いてゲノム変化を検出する、および/または遺伝子発現を検出する、および/または遺伝子発現のレベルを定量化するためのキット:
- 請求項1において定義される
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、
- 請求項1において定義される
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、ならびに
- 請求項1において定義される
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のプライマーセット。
【請求項25】
以下をさらに含む、請求項24記載のキット:
- 複数の多重化PCR反応を実施するための緩衝液、
- 逆転写酵素、
- 逆転写を実施するための緩衝液、
- ランダムプライマー、
- DNAポリメラーゼ、および
- 複数のデオキシヌクレオシド三リン酸(dNTP)。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は核酸の検出および定量化に関する。特に、本発明はRNAの検出および定量化に関する。
【背景技術】
【0002】
背景
循環バイオマーカーは、がん検出、予後予測およびがん処置応答の予測に用いられる有望なツールである。これらの循環バイオマーカーには、通常、無細胞DNA(cfDNA)および循環腫瘍細胞などのDNAサンプルが含まれる。さまざまなRNA分子は、がんなどのさまざまな疾患の診断および予後推定のための潜在的なバイオマーカーでもあり、がんの早期診断、腫瘍進行モニタリングおよび治療応答の予測に有用であることが知られている。がん細胞は無細胞RNA(cfRNA)を体内循環に放出することも知られている。これらのがん関連cfRNAは、循環腫瘍RNA(ctRNA)としても知られ、がん患者の血清および血漿中に見出すことができる。cfDNAもcfRNAもともに有望ながんバイオマーカーであるが、体液中でのcfDNAの安定性のため、cfDNAの測定が従来的に好まれている。20年以上前に血漿および血清中にRNAが発見されたにもかかわらず、血液循環中に高濃度のリボヌクレアーゼが存在するため、DNAと比較して、血液中で断片化されるとそれ自体が不安定になる、RNAの相対的な不安定性を考慮し、血液中の細胞外RNAは極めて不安定であり、高度に断片化されているという一般的な認識がいまだにある。複数の研究により、がん患者の血清および血漿中に腫瘍特異的循環RNA(ctRNA)が存在することが立証されている。現在のcfRNAの非腫瘍学的臨床応用には、母親と胎児の両方における長期的な表現型変化をモニタリングするための、および胎児の在胎期間を評価するための母体および胎児cfRNA転写物の測定が含まれる。血液循環中では、cfRNAは遊離型、タンパク質もしくは脂質との結合型、またはさまざまなタイプの膜由来微小胞に保護されたエキソソームとして存在し、それらを非常に安定にしていることが知られている。血漿cfRNAは、RNA結合タンパク質によって保護されたRNAと、細胞外小胞内に含まれるRNAの混合物であると考えられる。cfRNAは血漿、血清およびその他多くの体液中で広く利用可能であり、その逆説的な安定性により、迅速、高感度かつ安価な診断のためのバイオマーカー開発の潜在的な候補となっている。さらに、ctRNAの検出は、ctDNAと同じ変異情報を提供するが、それに加えて、関心対象の標的遺伝子の発現レベルに関する定量的情報も提供することができ、腫瘍特異的転写物の過剰発現により対立遺伝子の頻度が低い変種の検出感度を潜在的に増加させることができる。最後に、制御不能な細胞増殖のためにさまざまなctRNA種の発現が調節不全となり、ctRNAはがん検出のための価値あるツールとなる可能性がある。現在、cfRNAの検出のための最も一般的な技法は、定量的リアルタイムポリメラーゼ連鎖反応(qRT-PCR)を用いることである。しかしながら、qRT-PCRを伴う方法は、低インプットサンプルをアッセイする場合、その感度によって制限されることが多い。NGSは、新規cfRNAを検出し、RNAアイソフォームを区別する能力があるため、より適している可能性がある。ハイブリダイゼーションに基づくライブラリ調製法では、ライブラリ構築段階中の酵素的ライゲーションによる配列特異的な偏りが、特に低分子RNAの分析中に、転写物の表現に偏りをもたらす。ハイブリダイゼーションキャプチャまたはアンプリコン配列決定などの標的指向型NGSアッセイは、(変換効率の低い全トランスクリプトーム分析とは対照的に)cfRNAの高感度定量も可能にしうる。
【0003】
多くのがん遺伝子はゲノム変化を示し、これらのゲノム変化事象が多種多様な腫瘍において発見されている。キナーゼの再構成を検出するために特別にデザインされた標的指向型DNAに基づく次世代配列決定技法は、発がん性キナーゼ融合を高い信頼性で効果的に検出することができる。しかしながら、遺伝子融合などの、ある種のゲノム変化を検出するためのそのようなDNAに基づくアッセイの能力には技術的限界がある。DNAに基づくアッセイは、パネル内で効果的にカバーされる典型的には短いイントロン内でゲノム再構成が起こる遺伝子での融合のみを同定することができる。臨床的に重要な融合の中には、非常に長いイントロンでの再構成によって生じるものもあり、それを完全にカバーすると、パネル上の残りの遺伝子をカバーすることが著しく損なわれるであろう。ゆえに、特定のイントロンのカバー率にはギャップがあり、その結果、潜在的な再構成の切断点の検出における盲点となる。DNAを用いた融合検出は、再構成が、mRNAレベルで発現される融合を生ずることの直接的証拠を提供するものではなく、ゲノムDNAレベルでは非正規と思われる再構成については特に問題となる。実際、肺がん組織サンプルでのある研究では、RNA配列決定を用いることにより、DNA配列決定では臨床的に作用しうる変異が陰性であった14%(36/254)の症例において変化が検出されたことが示されている。例えば、神経栄養受容体チロシンキナーゼ(NTRK)遺伝子(NTRK1/2/3)およびニューレグリン-1(NRG1)遺伝子が関与する遺伝子融合事象は、配列決定のコストおよび配列決定用パネル内の残りの遺伝子のカバー率を損なうことなしに、標的指向型DNA配列決定用パネルにおいて効果的にカバーすることができない。
【0004】
ゲノム変化事象の検出とは別に、関連するがんバイオマーカーのゲノム発現を非侵襲的に正確に定量化できることは、がん治療に対する応答を予測するのに、および適切な処置の決定を下すのに重要である。例えば、プログラム死リガンド1(PD-L1)の遺伝子発現レベルは、免疫療法に応答する可能性の高いがん患者を同定するために用いられる予測がんバイオマーカーである。PD-L1は、抗PD-1阻害剤(ペムブロリズマブおよびニボルマブ)、抗細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)阻害剤(イピリムマブおよびトレメリムマブ)ならびに抗プログラム死タンパク質1(PD-1)(アテゾリズマブ、デュルバルマブおよびアベルマブ)などの免疫チェックポイント遮断薬阻害剤に対する腫瘍の感受性を測定するための潜在的な予測バイオマーカーでもある。免疫チェックポイント阻害剤療法に応答する可能性を予測するのに有用な他の遺伝子バイオマーカーは、T細胞免疫グロブリンおよびムチンドメイン含有タンパク質3(TIM-3)、リンパ球活性化3(LAG-3)、ならびに細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)を含む。これらの標的バイオマーカーの発現を長期的かつ非侵襲的に定量化できることは、処置応答をモニタリングするのに、および処置の決定を下すのに非常に有用でありうる。
【0005】
従来のアッセイでは、日常的にDNAレベルでゲノム変化を検出するため、検出範囲が変異などのDNAゲノム変化およびゲノムコピー数変化の定量化に限定されている。
【0006】
したがって、上記の欠点の1つまたは複数を克服するか、または少なくとも改善する(がんなどの)疾患に関連する遺伝子発現およびゲノム変化事象を高感度に検出および定量化するための方法を提供する必要がある。RNA(循環無細胞RNA(cfRNA)など)のような代替サンプルインプットを用いて、構造的再構成などのゲノム変化および遺伝子発現を同時に検出するための方法を提供する必要がある。
【発明の概要】
【0007】
概要
1つの局面において、本開示は以下の段階を含む、生物学的サンプル中のRNAを用いてゲノム変化を検出する、および/または遺伝子発現を検出する、および/または遺伝子発現のレベルを定量化する方法に言及する:
(a) 生物学的サンプルからRNAを抽出し、RNAを相補的DNA(cDNA)に変換する段階;
(b) 変換されたcDNAに対して、複数の多重化PCR反応を、
(I) ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対であって、
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、ゲノム変化を起こしうる各標的遺伝子のエクソン接合部の約50塩基対上流に位置する配列に相補的であり、
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、ゲノム変化を起こしうる各標的遺伝子のエクソン接合部の約50塩基対下流に位置する配列に相補的であり、
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、ゲノム変化を起こしうる各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なる、
複数のフォワードおよびリバースプライマー対、ならびに/または
(II) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対であって、
(i) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対下流の配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(ii) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対下流の配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(iii) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよび各リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる連続配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なる、
複数のフォワードおよびリバースプライマー対、ならびに/または
(III) タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のプライマーセットであって、
各プライマーセットが、タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対を含み、
(i) タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対下流の配列に相補的であり、
タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なり、
(ii) タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対下流の配列に相補的であり、
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(iii) タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよび各リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる連続配列に相補的であり、
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なる、
複数のプライマーセット
を用いて実施し、それによって複数のアンプリコンを作製する段階;
(c) 段階(b)からの複数のアンプリコンを精製する段階;
(d) ユニバーサルインデックス付きアダプタープライマーを用いることにより段階(c)からの精製産物を増幅して、配列決定用ライブラリを作製する段階;
(e) 段階(d)から得られた配列決定用ライブラリを精製する段階;
(f) 段階(e)からの精製された配列決定用ライブラリを次世代配列決定用プラットフォーム上で多重配列決定に供して、複数の配列決定読み取りを得る段階;
(g) 段階(f)から得られた複数の配列決定読み取りから各配列のコンセンサス読み取りを導出する段階;
(h) 段階(g)から得られたコンセンサス読み取りと参照ゲノムとの配列アライメントを実施する段階であって、
(I) 配列アライメントが第1の遺伝子由来のエクソンの参照ゲノムとの部分的アライメントおよび第2の遺伝子由来のエクソンの参照ゲノムとの部分的アライメントをもたらすなら、次に、
(i) 配列アライメントをスプリット読み取りと判定し、
(ii) 融合接合を支持する段階(h)(I)(i)からのスプリット読み取りの数を計数/列挙し、そして
(iii) 段階(h)(I)(ii)からのスプリット読み取りの数が2つまたはそれ以上であるなら、その場合には第1の遺伝子および第2の遺伝子を融合パートナーと判定する、
(II) 配列アライメントが対照ハウスキーピング遺伝子の参照ゲノムとのアライメントをもたらすなら、次に、
(i) 配列アライメントを対照ハウスキーピング遺伝子のコンセンサス読み取りと判定し、
(ii) 段階(h)(II)(i)からの対照ハウスキーピング遺伝子のコンセンサス読み取り対を計数/列挙し、そして
(iii) 対照ハウスキーピング遺伝子の遺伝子発現のレベルを判定する、
(III) 配列アライメントがタンパク質発現に関連する標的遺伝子の参照ゲノムとのアライメントをもたらすなら、
(i) 配列アライメントをタンパク質発現に関連する標的遺伝子のコンセンサス読み取りと判定し、
(ii) 段階(h)(III)(i)からのタンパク質発現に関連する標的遺伝子のコンセンサス読み取り対を計数/列挙し、そして
(iii) タンパク質発現に関連する標的遺伝子の遺伝子発現のレベルを判定する、
段階;
(i) 段階(h)からの配列アライメントに基づいて、ゲノム変化の有無を判定する、および/または遺伝子発現の有無を判定する、および/または遺伝子発現のレベルを定量化する段階。
【0008】
別の局面において、本開示はゲノム変化の検出および/または遺伝子発現の検出および/または遺伝子発現レベルの定量化を、本明細書において開示される方法により生物学的サンプルにおいてRNAを用いて行うためのキットであって、以下:
- 本明細書において開示される方法において定義されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、
- 本明細書において開示される方法において定義される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、ならびに
- 本明細書において開示される方法において定義されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のプライマーセットを含む、キットに言及する。
【図面の簡単な説明】
【0009】
本発明は、以下の、非限定的な例および添付の図面と併せて考慮すると、詳細な説明を参照してよりよく理解されるであろう。
【0010】
【
図1】本明細書において記述される2つの遺伝子間のイントロンDNA再構成に起因する遺伝子融合事象のcfRNAに基づく検出方法の一般的な概要である。プライマー(矢印で表す)は、融合を起こすことが知られている遺伝子のエクソン接合部に隣接するようにデザインされている。プライマー(→)は、融合産物が存在する場合、得られるアンプリコンの長さが血漿サンプルで観察されるcfRNA断片サイズに適合するように、およそ100塩基対になるようにデザインされている。
【
図2A】
図2Aおよび2Bを含む
図2は、開示された方法のプライマーデザインの例示をしており、ここで
図2Aは、cfRNAにおける対照ハウスキーピング遺伝子(左パネル)および発現遺伝子(右パネル)を捕捉するためのプライマーデザインの例示をしている。プライマー対の少なくとも1つのプライマーは、cfDNAの意図しない増幅を防ぐためにエクソン-エクソン接合部にまたがっており、得られるアンプリコンの長さはおよそ100塩基対である。ハウスキーピング遺伝子のプライマー対は発現遺伝子のプライマー対とは異なり、
図2Bは、長さが5000塩基対超のイントロンが介在する、2つの異なるエクソンに結合するようにデザインされたフォワードプライマーおよびリバースプライマーの例示をしていることに留意されたい。
【
図3A】
図3Aおよび3Bを含む
図3は、がん患者および健常個体由来の血漿全核酸抽出物からのcfRNAのサイズおよび濃度分析を示しており、ここで
図3Aはがん患者(サンプルA)由来の血漿全核酸抽出物からのcfRNAのサイズおよび濃度分析を示し、
図3Bは別のがん患者(サンプルB)由来の血漿全核酸抽出物からのcfRNAのサイズおよび濃度分析を示し、
図3Cは健常個体(サンプルC)由来の血漿全核酸抽出物からのcfRNAのサイズおよび濃度分析を示し、
図3Dは別の健常個体(サンプルD)由来の血漿全核酸抽出物からのcfRNAのサイズおよび濃度分析を示す。Bioanalyzer RNA 6000 Picoキットまたは4200 TapestationのHigh Sensitivity RNA Screentapeを用いて、サンプルを定量化およびプロファイリングした。cfRNAの総濃度(存在量の代表値)は、健常個体から抽出されたものと比べて、がん患者から抽出された代表的な血漿では一般的に高い。
【
図4】がん患者および健常個体から抽出された血漿からの全核酸抽出物におけるcfDNAおよびcfRNAの収量の比較を示す。
【
図5A】
図5A、5Bおよび5Cを含む
図5は、cfRNA断片サイズを模倣するために大きなサイズのヌクレオチド(1500ヌクレオチド超)をより小さなサイズに物理的に剪断することによる、抽出されたH2228細胞株RNAの断片化の一例を示す。Bioanalyzer RNA 6000 Picoキットまたは4200 TapestationのHigh Sensitivity RNA Screentapeを用いて、サンプルを定量化およびプロファイリングしたものであり、ここで
図5Aは抽出されたH2228細胞株RNAの断片化プロファイルを示し、
図5Bは断片化H2228細胞株RNAの結果として得られた断片化プロファイルを示し、
図5Cは血漿cfRNAの断片化プロファイルを示す。H2228細胞株RNAの結果として得られた断片化プロファイルは、血漿cfRNAのそれと類似しており、119ヌクレオチドの位置に主要なRNAピークがある(矢印で表す)。
【
図6A】
図6Aおよび6Bを含む
図6は、EML4のエクソン6bおよびALKのエクソン20の融合切断点を捕捉したスプリット読み取りのアライメントを示す、1 ngの断片化H2228 RNAにおけるEML4-ALK融合の検出を例示しており、ここで
図6Aは、Integrated Genome Viewer(IGV)上でのスプリット読み取りの可視化であり、
図6Bは、エクソン融合を示す(遺伝子融合の検出のためのArribaツールからの)図表示である。
【
図7-1】
図7は、断片化RNAサンプルについての本明細書において記述される多重アンプリコン配列決定法を用いた、がん細胞株: NCI-H660細胞株(CRL-5813, ATCC)、VCaP細胞株(CRL-2876, ATCC)、MV-4-11 細胞株(CRL-9591, ATCC)およびKasumi-1細胞株(CRL-2724, ATCC)におけるさまざまなエクソン融合の検出を示すArribaツールの図表示である。
【
図8A】
図8A、8Bおよび8Cを含む
図8は、cfDNAに基づく方法と比較した、本明細書において記述されるcfRNAに基づく方法を用いた転移性前立腺患者からの核酸抽出物におけるTMPRSS2-ERG遺伝子融合の検出を示し、ここで
図8Aは、cfDNAに基づく検出方法で検出された、イントロン切断点の存在を支持していた17スプリット読み取りを示すIGVグラフ的考察であり、
図8Bは、本明細書において記述されるcfRNAに基づく方法で検出された、対応するエクソン切断点の存在を支持していた4123スプリット読み取りを示すIGVグラフレポートであり、
図8Cは、TMPRSS2-ERG遺伝子融合を示すArribaツールの図表示である。
【
図9A】
図9A、9Bおよび9Cを含む
図9は、cfDNAに基づく方法と比較した、本明細書において記述されるcfRNAに基づく方法を用いた、転移性肺がん患者からの核酸抽出物におけるCCDC6-RET遺伝子融合の検出を示し、ここで
図9Aは、cfDNAに基づく検出方法で検出された、イントロン切断点の存在を支持していた12スプリット読み取りを示すIGVグラフレポートであり、
図9Bは、本明細書において記述されるcfRNAに基づく方法で検出された、対応するエクソン切断点の存在を支持していた1474スプリット読み取りを示すIGVグラフレポートであり、
図9Cは、CCDC6-RET遺伝子融合を示すArribaツールの図表示である。
【
図10A】
図10Aおよび10Bを含む
図10は、本明細書において記述されるcfRNAに基づく方法を用いた、急性リンパ芽球性白血病臨床サンプルの末梢血細胞画分から抽出されたRNAサンプルにおけるBCR-ABL1遺伝子融合の検出を示し、ここで
図10Aは、BCR-ABL1遺伝子融合を示すIGVグラフレポートであり、
図10Bは、BCR-ABL1遺伝子融合を示すArribaツールの図表示である。
【
図11】本明細書において記述されるcfRNAに基づく方法の検出感度の限界を判定するために、H2228細胞株から得たナノグラムRNAあたりのEML4-ALK融合転写物のコピー数を定量化した結果を示す。
【
図12】本明細書において記述される方法を用いた、がんおよび健常サンプルの両方からのcfRNAにおける対照遺伝子および他の標的遺伝子の発現の検出および定量化を示す。表(上パネル)は、インプットcfRNA量が異なる2つのサンプルの繰り返しを含む、試験した各サンプルのcfRNAインプット量を記述している。発現ヒートマップ(下パネル)は、サンプルごとの、本明細書において記述される方法から導出された発現読み取り計数の分布を実証する。同じサンプルにおける融合検出は実行可能であり、
図8および
図9に描かれるように、それぞれ、CCDC6-RETおよびTMPRSS2-ERG融合が同時に陽性であったC_20-347およびC_20-146について示されている。
【
図13A】
図13A、13Bおよび13Cを含む
図13は、本明細書において記述される方法を使いcfRNAを用いた未処置肺がん症例において作用しうるドライバー融合体の同定を示し、ここで
図13AはLMNA-NTRK1融合体の検出を示し、
図13BはCD74-NRG1融合体の検出を示し、
図13Cは、それぞれ、cfDNAにおける他のドライバー遺伝子変異の存在が陰性であった、3例の肺がん症例におけるcfRNAでのETV6-NTRK3融合体の検出を示す。
【
図14】
図14Aおよび14Bを含む
図14は、本明細書において記述される方法を用いたcfDNAおよびcfRNAによる45例の肺がん症例における融合検出を示し、cfDNAと比較して、cfRNA画分を用いた場合にさらなる融合が同定されたことを示す。cfRNAおよびcfDNAを用いて同時に処理した臨床サンプルを融合検出について比較したものであり、ここで
図14Aは、cfDNAおよびcfRNAに基づく融合検出の一致を示し、cfRNAが5症例で追加の融合を同定し、cfDNAでは検出可能な融合を1つ見逃したことを示している。両方法で一致する融合が検出された症例は12例あり、
図14Bは、cfDNAとcfRNAの両方法、または2つの方法のうちの1つによって検出された融合の範囲と、cfRNAによって検出された同時に存在する複数の融合の検出を記載している。(
* = cfDNAとcfRNAの両方で検出された融合)。
【
図15】High Sensitivity DNA Screentapeで見られた配列決定用ライブラリに変換されたcfRNAサンプルの典型的なライブラリプロファイルを例示する。200塩基対を超える複数のピークは、潜在的な融合産物、対照遺伝子産物、ならびに複数のフォワードおよびリバースプライマーが含まれる他の遺伝子発現産物を包含する複数の産物に対応している。適格なライブラリは200塩基対超のサイズの顕著なピークを有するであろう。
【
図16】本明細書において記述されるcfRNAに基づく方法を用いてFFPE肺腫瘍組織から抽出されたRNAにおける18 bpの欠失の検出を示すIGVグラフレポートである。EGFR c.2240_2257del p.L747_P753delinsS変異体転写物(欠失を含む)の発現は、4266読み取りによって支持された。
【
図17】本明細書において記述されるcfRNAに基づく方法を用いて転移性肺がん患者の血漿から抽出されたcfRNAにおける単一ヌクレオチド変異の検出を示すIGVグラフレポートである。EGFR c.2573T>G p.L858R変異体転写物(単一ヌクレオチド変異を含む)の発現は、112読み取りによって支持された。
【
図18】
図18Aおよび18Bを含む
図18は、本明細書において記述されるcfRNAに基づく方法を用いた、単一ヌクレオチド変異、挿入(例えば重複)または欠失変異を含む発現転写物の検出を示し、ここで
図18Aは、FFPE腫瘍サンプルから抽出された組織RNAにおいて検出された単一ヌクレオチド変異、挿入または欠失変異を示し、
図18Bは、血漿から抽出されたcfRNAにおいて検出された単一ヌクレオチド変異を示す。
【発明を実施するための形態】
【0011】
詳細な説明
開示される方法により、非浸潤がんの検出、予後予測、および処置応答の予測を目的として、生物学的サンプルにおけるゲノム変化および遺伝子発現の検出、ならびにRNA(cfRNAなどの)の遺伝子発現レベルの定量化が可能になる。本開示は、バーコード配列を用いた個々のcfRNA分子のタグ付け、およびcfRNAの断片化された性質に適合するように最適化されたアンプリコンのデザインを伴う、高度に多重化されたアンプリコンに基づいたNGSに基づく方法について記述する。本明細書において記述される方法は、cfDNAとcfRNAの両方を含む循環核酸抽出物に適用することができ、核酸抽出物サンプルにおいて、融合RNA転写物と遺伝子発現を同時に検出および定量化することができる。本開示では、融合検出と遺伝子発現モニタリングを組み合わせた新規なアンプリコンに基づいたNGSアッセイにより、cfRNAの適用性を拡張する。ハイブリダイゼーションに基づいたライブラリ調製法では、ライブラリ構築段階中の酵素ライゲーションによる配列特異的な偏りが、特に少量のインプットRNAの分析中に、転写物の偏った再現につながる。ハイブリダイゼーション捕捉またはアンプリコン配列決定などの標的指向型NGSアッセイは、cfRNAの高感度な定量化を可能にすることができる。標的指向型NGSに基づいた方法は、全トランスクリプトーム分析と比較して高い変換効率を有するが、これには費用および労力などの欠点がある。
【0012】
第1の局面において、本開示は以下の段階を含む、生物学的サンプル中のRNAを用いてゲノム変化を検出する、および/または遺伝子発現を検出する、および/または遺伝子発現のレベルを定量化する方法に言及する:
(a) 生物学的サンプルからRNAを抽出し、RNAを相補的DNA(cDNA)に変換する段階;
(b) 変換されたcDNAに対して、複数の多重化PCR反応を、
(I) ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対であって、
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、ゲノム変化を起こしうる各標的遺伝子のエクソン接合部の約50塩基対上流に位置する配列に相補的であり、
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、ゲノム変化を起こしうる各標的遺伝子のエクソン接合部の約50塩基対下流に位置する配列に相補的であり、
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、ゲノム変化を起こしうる各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なる、
複数のフォワードおよびリバースプライマー対、ならびに/または
(II) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対であって、
(i) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対下流の配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(ii) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対下流の配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(iii) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよび各リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる連続配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なる、
複数のフォワードおよびリバースプライマー対、ならびに/または
(III) タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のプライマーセットであって、
各プライマーセットが、タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対を含み、
(i) タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対下流の配列に相補的であり、
タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なり、
(ii) タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対下流の配列に相補的であり、
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(iii) タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよび各リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる連続配列に相補的であり、
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なる、
複数のプライマーセット
を用いて実施し、それによって複数のアンプリコンを作製する段階;
(c) 段階(b)からの複数のアンプリコンを精製する段階;
(d) ユニバーサルインデックス付きアダプタープライマーを用いることにより段階(c)からの精製産物を増幅して、配列決定用ライブラリを作製する段階;
(e) 段階(d)から得られた配列決定用ライブラリを精製する段階;
(f) 段階(e)からの精製された配列決定用ライブラリを次世代配列決定用プラットフォーム上で多重配列決定に供して、複数の配列決定読み取りを得る段階;
(g) 段階(f)から得られた複数の配列決定読み取りから各配列のコンセンサス読み取りを導出する段階;
(h) 段階(g)から得られたコンセンサス読み取りと参照ゲノムとの配列アライメントを実施する段階であって、
(I) 配列アライメントが第1の遺伝子由来のエクソンの参照ゲノムとの部分的アライメントおよび第2の遺伝子由来のエクソンの参照ゲノムとの部分的アライメントをもたらすなら、次に、
(i) 配列アライメントをスプリット読み取りと判定し、
(ii) 融合接合を支持する段階(h)(I)(i)からのスプリット読み取りの数を計数/列挙し、そして
(iii) 段階(h)(I)(ii)からのスプリット読み取りの数が2つまたはそれ以上であるなら、その場合には第1の遺伝子および第2の遺伝子を融合パートナーと判定する、
(II) 配列アライメントが対照ハウスキーピング遺伝子の参照ゲノムとのアライメントをもたらすなら、次に、
(i) 配列アライメントを対照ハウスキーピング遺伝子のコンセンサス読み取りと判定し、
(ii) 段階(h)(II)(i)からの対照ハウスキーピング遺伝子のコンセンサス読み取り対を計数/列挙し、そして
(iii) 対照ハウスキーピング遺伝子の遺伝子発現のレベルを判定する、
(III) 配列アライメントがタンパク質発現に関連する標的遺伝子の参照ゲノムとのアライメントをもたらすなら、
(i) 配列アライメントをタンパク質発現に関連する標的遺伝子のコンセンサス読み取りと判定し、
(ii) 段階(h)(III)(i)からのタンパク質発現に関連する標的遺伝子のコンセンサス読み取り対を計数/列挙し、そして
(iii) タンパク質発現に関連する標的遺伝子の遺伝子発現のレベルを判定する、
段階、
(i) 段階(h)からの配列アライメントに基づいて、ゲノム変化の有無を判定する、および/または遺伝子発現の有無を判定する、および/または遺伝子発現のレベルを定量化する段階。
【0013】
1つの例において、開示される方法は、生物学的サンプル中のRNAのゲノム変化を検出するために用いられる。例えば、本方法は、既知および未知の融合を検出するために、ならびに所与のサンプル中の対照ハウスキーピング遺伝子の発現量に対しての、それらの定量化のために用いられうる。別の例において、開示される方法は、生物学的サンプル中のRNAの遺伝子発現を検出するために用いられる。さらに別の例において、開示される方法は、生物学的サンプル中のRNAの遺伝子発現レベルを定量化するために用いられる。さらなる例において、開示される方法は、生物学的サンプルにおけるRNAのゲノム変化の検出およびRNAの遺伝子発現の検出を同時に行うために用いられる。さらなる例において、開示される方法は、生物学的サンプルにおけるRNAのゲノム変化の検出およびRNAの遺伝子発現の定量化を同時に行うために用いられる。さらなる例において、開示される方法は、生物学的サンプルにおけるRNAのゲノム変化の検出、RNAの遺伝子発現の検出、およびRNAの遺伝子発現の定量化を同時に行うために用いられる。
【0014】
1つの例において、開示される方法は、生物学的サンプル中のcfRNAのゲノム変化を検出するために用いられる。例えば、本方法は、既知および未知の融合を検出するために、ならびに所与のサンプル中の対照ハウスキーピング遺伝子の発現量に対しての、それらの定量化のために用いられうる。別の例において、開示される方法は、生物学的サンプル中のcfRNAの遺伝子発現を検出するために用いられる。さらに別の例において、開示される方法は、生物学的サンプル中のcfRNAの遺伝子発現レベルを定量化するために用いられる。さらなる例において、開示される方法は、生物学的サンプルにおけるcfRNAのゲノム変化の検出およびcfRNAの遺伝子発現の検出を同時に行うために用いられる。さらなる例において、開示される方法は、生物学的サンプルにおけるcfRNAのゲノム変化の検出およびcfRNAの遺伝子発現の定量化を同時に行うために用いられる。さらなる例において、開示される方法は、生物学的サンプルにおけるcfRNAのゲノム変化の検出、cfRNAの遺伝子発現の検出、およびcfRNAの遺伝子発現の定量化を同時に行うために用いられる。
【0015】
1つの例において、融合転写物を捕捉するためのプライマーのデザインには、2つの主な特徴 - 1) 存在する場合にはRNA転写物の各コピーを個別にタグ付けするための下流(標的遺伝子(例えば融合)転写物に対して下流)プライマーにおけるランダムバーコード配列の存在、および2) 予想される全アンプリコン長が90~110塩基対に近くなるように、パネル内の各エクソン接合部からおよそ50塩基対の各プライマーの位置、がある。これは、110~120ヌクレオチドをピークに観察されたサンプルのcfRNAサイズ分布を満たすために行われた。
【0016】
1つの例において、段階(b)(I)に開示される
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対は、
図1に示されるようにデザインされる:
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードプライマーが、ゲノム変化を起こしうる各標的遺伝子のエクソン接合部の約50塩基対上流に位置する配列に相補的であり、
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、ゲノム変化を起こしうる各標的遺伝子のエクソン接合部の約50塩基対下流に位置する配列に相補的であり、
ゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、その5'末端にバーコード配列を含み、ゲノム変化を起こしうる各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なる。
1つの例において、段階(b)(II)に開示される
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対がデザインされ、
(i)
図2A(左)に示されるように、対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
フォワードプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対
下流の配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(ii) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
フォワードプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対
下流の配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(iii) 対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよび各リバースプライマーが、各対照ハウスキーピング遺伝子のエクソン-エクソン接合部にまたがる連続配列に相補的であり、
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、各対照ハウスキーピング遺伝子に対応する各リバースプライマーのバーコード配列が異なる。
1つの例において、段階(b)(III)に開示される
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のプライマーセットがデザインされ、
各プライマーセットが、タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対を含み、
(i)
図2A(右)に示されるように、タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各
フォワードプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対
下流の配列に相補的であり、
タンパク質発現に関連する各標的遺伝子に特異的な複数のフォワードおよびリバースプライマー対の各
リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なり、
(ii) タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列に相補的であり、
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各
フォワードプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる配列の約100塩基対
下流の配列に相補的であり、
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なり;
(iii) タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよび各リバースプライマーが、タンパク質発現に関連する各標的遺伝子のエクソン-エクソン接合部にまたがる連続配列に相補的であり、
タンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーが、その5'末端にバーコード配列を含み、タンパク質発現に関連する各標的遺伝子に対応する各リバースプライマーのバーコード配列が異なる。
【0017】
1つの例において、
図2Bに示されるように、段階(b)(II)に開示される
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対のフォワードプライマーは、第1のエクソン中の配列に相補的であり、段階(b)(II)に開示される
対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対のリバースプライマーは、第2のエクソン中の配列に相補的であり、ここで第1のエクソンおよび第2のエクソンには、長さが5000塩基対超のイントロンが介在し、それによって複数の多重化PCR反応中に意図的でない任意のゲノムDNAの増幅が回避される。
【0018】
1つの例において、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよびリバースプライマー対のプライマーの少なくとも1つは、エクソン-エクソン接合部にまたがる。1つの例において、段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよびリバースプライマー対のプライマーの少なくとも1つは、エクソン-エクソン接合部にまたがる。1つの例において、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよびリバースプライマー対のプライマーの少なくとも1つ、ならびに/または段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各フォワードおよびリバースプライマー対のプライマーの少なくとも1つは、エクソン-エクソン接合部にまたがる。1つの例において、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対のフォワードプライマーもしくはリバースプライマー、ならびに/または段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対のフォワードプライマーもしくはリバースプライマーは、エクソン-エクソン接合部にまたがる。別の例において、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対のフォワードプライマーおよびリバースプライマーの両方とも、ならびに/または段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対のフォワードプライマーおよびリバースプライマーの両方とも、エクソン-エクソン接合部にまたがり、ここでエクソンの長さは約100塩基対である。
【0019】
1つの例において、段階(b)(I)に開示される遺伝子変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマー、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマー、ならびに段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の各リバースプライマーは、その5'末端にバーコード配列を含み、ここで各バーコード配列は異なる。本明細書において用いられる場合、「バーコード配列」という用語は、核酸配列内に可変量の情報を含むコードされた分子またはバーコードをいう。例えば、バーコード配列は、種々の配列同定技法、例えば、核酸配列決定、プローブハイブリダイゼーションに基づいたアッセイなどのいずれかを用いて読み出すことができるタグである。いくつかの例において、バーコード配列は、バーコード配列が標的領域の変換DNA配列にタグ付けされると、標的領域の各異なる変換cDNA配列は、それに付加されている固有のバーコード配列を有するようになり、サンプルからの標的領域の変換cDNA配列を読み出すように、サンプルの標的領域の異なる変換cDNA配列をタグ付けするために本明細書において記述される方法において用いられる。
【0020】
バーコード配列は、複数の固有の標的配列のプールされた分析を可能にし、ここでプールから得られた配列情報は、後で各開始標的配列に帰属させることができる。すなわち、増幅プロセスの後に、バーコード配列を用いてアンプリコンをグループ化し、同じバーコード配列を有するアンプリコンのファミリーを形成する。いくつかの例において、バーコード配列は、標的領域内のどの配列とも相補的でない突出部である。各リバースプライマーはその5'末端に、本明細書において開示されるようにランダムに割り当てられたバーコード配列を保有するので、バーコード配列は、配列決定用ライブラリ形成の段階において個々のcDNA分子を一意にタグ付けすることを可能にする。
【0021】
1つの例において、バーコード配列は、10~16個のランダムヌクレオチド、または10~15個のランダムヌクレオチド、または10~13個のランダムヌクレオチド、または10個のランダムヌクレオチド、または11個のランダムヌクレオチド、または12個のランダムヌクレオチド、または13個のランダムヌクレオチド、または14個のランダムヌクレオチド、または15個のランダムヌクレオチド、または16個のランダムヌクレオチドを含むオリゴヌクレオチドである。1つの例において、バーコード配列は、10~16個のランダムヌクレオチドを含むオリゴヌクレオチドである。1つの例において、バーコード配列は、10個のランダムヌクレオチドを含むオリゴヌクレオチドである。1つの具体例において、バーコード配列は、NNNNNNNNNN(SEQ ID NO: 615)として表すことができる10個のランダムヌクレオチドを含むオリゴヌクレオチドである。
【0022】
1つの例において、バーコード配列および部分アダプター配列を除く、段階(b)に開示される複数のフォワードおよびリバースプライマー対の各フォワードプライマーの典型的な長さは、約20塩基対である。1つの例において、バーコード配列および部分アダプター配列を除く、段階(b)に開示される複数のフォワードおよびリバースプライマー対の各リバースプライマーの典型的な長さは、約20塩基対である。1つの例において、バーコード配列および部分アダプター配列を含む、段階(b)に開示される複数のフォワードおよびリバースプライマー対の各フォワードプライマーの典型的な長さは、約45塩基対であり、ここでバーコード配列の長さは約10塩基対であり、ここで部分アダプター配列の長さは約20塩基対である。1つの例において、バーコード配列および部分アダプター配列を含む、段階(b)に開示される複数のフォワードおよびリバースプライマー対の各リバースプライマーの典型的な長さは、約45塩基対であり、ここでバーコード配列の長さは約10塩基対であり、ここで部分アダプター配列の長さは約20塩基対である。
【0023】
1つの例において、生物学的サンプルはRNAを含む。1つの例において、RNAはcfRNAである。1つの例において、cfRNAは生物学的サンプル中に自由に存在し、開示される方法の段階(a)に開示されるように直接cDNAに変換することができる。
【0024】
1つの例において、cfRNAは開示される方法の段階(a)の前に生物学的サンプルから抽出される。さらなる例において、RNAは、細胞内にもともと封入されているものであってもよく、開示される方法の段階(a)の前に抽出される必要がある。1つの例において、細胞は体内のどのタイプの細胞であってもよい。1つの例において、細胞は骨、上皮、軟骨、脂肪組織、神経、筋肉、結合組織、食道、胃、肝臓、胆嚢、膵臓、副腎、膀胱、胆嚢、大腸、小腸、腎臓、肝臓、膵臓、結腸、胃、胸腺、脾臓、脳、脊髄、心臓、肺、眼球、角膜、皮膚、膵島組織または器官由来である。1つの例において、細胞はがん細胞、幹細胞、内皮細胞、または脂肪細胞であってもよい。1つの例において、細胞は血球である。血球は白血球、または血小板であってもよい。1つの例において、細胞は、ゲノム変化を担持することが知られているがん細胞から選択される。1つの例において、細胞は、融合遺伝子を担持することが知られているがん細胞株から選択される。1つの例において、融合遺伝子を担持するがん細胞株は、CRL-9591、H-2228、CRL-2724、VCaP、CRL-5813などを含みうるが、これらに限定されることはない。RNA抽出のためのさまざまな方法が当技術分野において公知であり、開示される方法の目的のために用いられうる。RNA抽出のためのさまざまな方法が当技術分野において公知であり、開示される方法の目的のために用いられうる。1つの例において、限定されることはないが、Zymo Quick-cfRNA Serum & Plasma Kit (Zymo Research)、NextPrep(商標) Magnazol(商標) cfRNA Isolation Kit (PerkinElmer)、Isopure Plasma cfDNA/RNA Isolation Kit (Aline Biosciences)、QIAmp Circulating Nucleic Acid Kit (Qiagen)、QIAamp ccfDNA/RNA Kit (Qiagen)、MagMAX(商標) Cell-Free Total Nucleic Acid Isolation Kit (Applied Biosystems)などのような、キットを用いて、cfRNAは段階(a)の前に生物学的サンプルから抽出される。
【0025】
1つの例において、細胞から抽出されたRNAを超音波処理に供し、それによってcfRNAのサイズにさらに近づける。別の例において、Covaris、Qsonica、Diagenode Bioruptorなどを用いて超音波処理を行う。別の例において、細胞から抽出されたRNAを熱および二価陽イオンに基づく断片化に供する。さらに別の例において、NEBNext(登録商標) Magnesium RNA Fragmentation Moduleを用いて断片化を行う。
【0026】
1つの例において、生物学的サンプルはcfRNAとcfDNAの両方を含む。本明細書において用いられる場合、cfDNAは、本明細書において開示される液体サンプル中に自由に存在し、細胞内に含まれない非カプセル化DNAをいう。再構成を受けた長いイントロンの存在により、再構成されたcfDNAが配列決定可能な産物を形成するのを妨げる。
【0027】
開示される方法では、生物学的サンプル中に自由に存在するcfRNA、または生物学的サンプルから抽出されたcfRNAは、第1の局面の方法の段階(a)に開示されるようにcDNAにまず初めに変換される。1つの例において、cfRNAは逆転写によってcDNAに変換される。本明細書において用いられる「逆転写」という用語およびその文法的変形は、RNA鋳型からのDNA分子の酵素媒介合成をいう。得られたDNAは、相補的DNA(cDNA)として知られ、PCR増幅の鋳型として用いることができる。逆転写の方法は、典型的には非標的特異的プライマー(ランダムプライマー)の使用を伴うものであり、当技術分野において周知である。1つの例において、cfRNAは、逆転写酵素および複数のランダムプライマーを含む逆転写キットを用いてcDNAに変換される。1つの例において、ランダムプライマーは6-merプライマー、7-merプライマー、8-merプライマー、9-merプライマーまたはそれらの組み合わせである。1つの例において、ランダムプライマーは6-mer(ヘキサマー/ヘキサヌクレオチド)プライマーである。1つの例において、逆転写キットは、限定されることはないが、High-Capacity cDNA Reverse Transcription Kit (Thermo Fisher Scientific)、SuperScript IV One-Step RT-PCR System (Invitrogen)などから選択される。
【0028】
1つの例において、RNAを含む生物学的サンプルは、液体サンプル、組織サンプル、または細胞サンプルである。さらに別の例において、組織サンプルは凍結組織サンプルまたは固定組織サンプルである。別の例において、固定組織サンプルはホルマリン固定パラフィン包埋(FFPE)組織サンプルである。別の例において、液体サンプルは体液である。1つの例において、体液は、血液、骨髄、脳脊髄液、腹膜液、胸水、リンパ液、腹水、漿液、喀痰、涙液、便、尿、唾液、乳管液、胃液、および膵液からなる群より選択される。1つの例において、体液は血液である。1つの例において、血液は血漿である。
【0029】
別の例において、生物学的サンプルは、疾患を有するおよび/または疾患を有すると疑われる対象から得られる。別の例において、疾患はがんである。さらに別の例において、がんは、白血病、肺がん、結腸直腸がん、乳がん、膵臓がん、前立腺がん、上咽頭がん、肝臓がん、胆管がん、食道がん、尿路上皮がん、および胃腸がんからなる群より選択される。1つの例において、がんは早期がんである。別の例において、がんは末期がんまたは転移がんである。1つの例において、がんは、転移性前立腺がん、転移性肺がん、転移性乳がん、および白血病からなる群より選択される。
【0030】
1つの例において、開示される方法を用いて検出されるゲノム変化は、構造的再構成を含む。1つの例において、「再構成」という用語は、DNAのセクションの順序の再構成をいう。1つの例において、構造的再構成は遺伝子融合などの、融合である。1つの例において、「融合」という用語は、染色体間または染色体内再構成などの、構造的再構成によって生じる構造的変化をいう。1つの例において、構造的再構成は、欠失、挿入(重複など)、逆位、塩基転換、転座、選択的スプライシングなどを含みうるが、これらに限定されることはない。1つの例において、構造的再構成は、本明細書において開示される方法を用いて検出可能であるものなどの、融合遺伝子の形成をもたらす。1つの例において、「欠失」は、少なくとも1つのヌクレオチドが除去される配列変化である。1つの例において、「欠失」は、10ヌクレオチド超が除去される配列変化である。1つの例において、「欠失」は、20ヌクレオチド超が除去される配列変化である。1つの例において、「欠失」は、30ヌクレオチド超が除去される配列変化である。1つの例において、「欠失」は、40ヌクレオチド超が除去される配列変化である。1つの例において、「欠失」は、50ヌクレオチド超が除去される配列変化である。1つの例において、「欠失」は、50ヌクレオチド未満が除去される「小さな欠失」であってもよい。1つの例において、「挿入」は、少なくとも1つのヌクレオチドが2つのヌクレオチド間に挿入される配列変化である。1つの例において、「挿入」は、10ヌクレオチド超が2つのヌクレオチド間に挿入される配列変化である。1つの例において、「挿入」は、20ヌクレオチド超が2つのヌクレオチド間に挿入される配列変化である。1つの例において、「挿入」は、30ヌクレオチド超が2つのヌクレオチド間に挿入される配列変化である。1つの例において、「挿入」は、40ヌクレオチド超が2つのヌクレオチド間に挿入される配列変化である。1つの例において、「挿入」は、50ヌクレオチド超が2つのヌクレオチド間に挿入される配列変化である。1つの例において、「挿入」は、50ヌクレオチド未満が2つのヌクレオチド間に挿入される「小さな挿入」であってもよい。1つの例において、「挿入」は「重複」である。1つの例において、「重複」は、1つまたは複数のヌクレオチドのコピーが元のコピーの3'-フランキングに直接挿入される配列変化である。1つの例において、「逆位」という用語は、元の配列に置き換わる1ヌクレオチド超が元の配列の逆相補体である配列変化をいう。1つの例において、「転座」という用語は、非相同染色体間の部分の再構成をいい、これは「融合」をもたらしうる。1つの例において、「選択的スプライシング」は、配列中の1つまたは複数のエクソンをRNAからスプライシングにより切り出し、同じ遺伝子の通常はより離れたエクソンを並置させうる、単一遺伝子転写物の異常なスプライシングをいう。スプライシングの変化は、2つの遺伝子に限定された定義である融合と比較して、同じ遺伝子が関与する。1つの例において、スプライシングの変化には、MET遺伝子のエクソン14がスプライシングにより切り出され、エクソン13およびエクソン15を近接させるMETエクソン14スキッピングが含まれ、これを、本明細書において記述される方法を用いて検出することができる(
図14)。1つの例において、開示される方法を用いて検出されるゲノム変化は、単一ヌクレオチド変異を含む。1つの例において、「一塩基変異」は、参照ゲノム中の位置を規定するヌクレオチドとは異なる、ゲノム中の特定の位置に生じる単一ヌクレオチドの変異をいう。
【0031】
1つの例において、「ハウスキーピング遺伝子」は、細胞機能の維持に必須な高度に保存された遺伝子をいう。1つの例において、対照ハウスキーピング遺伝子は、グルコース-6-リン酸イソメラーゼ(GPI)、FERMドメイン含有8(FRMD8)、小核リボ核タンパク質D3(SNRPD3)、プロテアソームサブユニット, β型, 2(PSMB2)、TATAボックス結合タンパク質(TBP)、RELがん原遺伝子、NF-kBサブユニット(REL)、シナプトソーム関連タンパク質29(SNAP29)、チューブリンガンマ複合体関連タンパク質2(TUBGCP2)、受容体アクセサリタンパク質5(REEP5)、溶質キャリアファミリー4メンバー1アダプタータンパク質(SLC4A1AP)、インテグリンサブユニットベータ7(ITGB7)、プロテイン-O-マンノースキナーゼ(POMK)、ER膜タンパク質複合体サブユニット7(EMC7)、核自己抗原性精子タンパク質(NASP)、フォークヘッドおよびリングフィンガードメインを有するチェックポイント(CHFR)、リボソームRNAプロセッシング1(RRP1)、サイトゾル鉄硫黄アセンブリ成分1(CIAO1)、プミリオRNA結合ファミリーメンバー1(PUM1)、小胞体選別受容体における保持1(Retention in endoplasmic reticulum sorting receptor 1; RER1)、セリンおよびアルギニンに富んだスプライシング因子4(Serine and arginine rich splicing factor 4; SRSF4)を含む(
図12B参照)。ハウスキーピング遺伝子の発現は、サンプル間で比較的一定であると考えられている。例えば、同じ量のRNAを含むサンプルの場合、ハウスキーピング遺伝子の数および発現は同様であろう。例えば、より少量のRNAを含むサンプルの場合、より多量のRNAを含むサンプルよりもハウスキーピング遺伝子の数および発現が少なくなり、その逆も同様である。それゆえ、概してハウスキーピング遺伝子のRNA分子の計数は、遺伝子改変標的およびタンパク質発現に関連する標的遺伝子のRNA分子の正規化のために用いることができる。
【0032】
1つの例において、本明細書において開示される方法において用いられるcfRNAの量は、少なくとも6 ngである。別の例において、本明細書において開示される方法において用いられるcfRNAの量は、約6 ng~約100 ng、または約10 ng、または約20 ng、または約30 ng、または約40 ng、または約50 ng、または約60 ng、または約70 ng、または約80 ng、または約90 ng、または約100 ngである。1つの例において、本明細書において開示される方法において用いられるcfRNAの量は、20 ng~50 ngである。
【0033】
次いで、第1の局面の段階(b)に開示されるとおり、変換されたcDNAに対して、多重化PCR反応が、(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、ならびに/または(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、ならびに/または(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対を用いて実施され、ここでゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対は、対照ハウスキーピング遺伝子の複数個のそれとは異なり、かつタンパク質発現に関連する標的遺伝子の複数個のそれとは異なる。
【0034】
1つの例において、段階(b)における変換されたcDNAに対する複数の多重化PCR反応は、段階(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、ならびに段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のプライマー対を用いて実施される。1つの例において、段階(b)における変換されたcDNAに対する複数の多重化PCR反応は、段階(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、ならびに段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対を用いて実施される。別の例において、段階(b)における変換されたcDNAに対する複数の多重化PCR反応は、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー、ならびに段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のプライマー対を用いて実施される。1つの例において、段階(b)における変換されたcDNAに対する複数の多重化PCR反応は、段階(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対、ならびに段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対を用いて実施される。
【0035】
1つの例において、多重化PCR反応は、Platinum SuperFi II DNA Polymerase (Invitrogen)、KAPA HiFi DNA Polymerase (Roche)、Platinum Taq DNA PolymeraseまたはPlatinum SuperFi DNA Polymerase (Invitrogen)およびQ5 High-Fidelity DNA Polymerase (NEB)などを用いて、変換されたcDNAに対して実施される。
【0036】
1つの例において、変換されたcDNAに対して実施される複数の多重化PCR反応は、3~15回のPCRサイクルを含む。1つの例において、PCR増幅は3回のPCRサイクルを含む。1つの例において、PCR増幅は4回のPCRサイクルを含む。1つの例において、PCR増幅は5回のPCRサイクルを含む。1つの例において、PCR増幅は6回のPCRサイクルを含む。1つの例において、PCR増幅は7回のPCRサイクルを含む。1つの例において、PCR増幅は8回のPCRサイクルを含む。1つの例において、PCR増幅は9回のPCRサイクルを含む。1つの例において、PCR増幅は10回のPCRサイクルを含む。1つの例において、PCR増幅は11回のPCRサイクルを含む。1つの例において、PCR増幅は12回のPCRサイクルを含む。1つの例において、PCR増幅は13回のPCRサイクルを含む。
【0037】
1つの例において、段階(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的なフォワードおよびリバースプライマー対の数は、少なくとも100である。別の例において、段階(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、100~2000である。1つの例において、段階(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的なフォワードおよびリバースプライマー対の数は、200~1900、または300~1800、または400~1700、または500~1600、または600~1500、または700~1400、または800~1300、または900~1200、または1000~1100である。1つの例において、段階(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、約100、約200、約300、または約400、または約500、または約600、または約700、または約800、または約900、または約1000、または約1100、または約1200、または約1300、または約1400、または約1500、または約1600、または約1700、または約1800、または約1900、または約2000である。1つの例において、段階(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数に上限はない。
【0038】
1つの例において、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、少なくとも20である。1つの例において、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、20~300である。1つの例において、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、30~290、または40~280、または50~260、または60~250、または70~240、または80~230、または90~220、または100~210、または110~200、または120~190、または130~180、または140~170である。1つの例において、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、約20、または約30、または約40、または約50、または約60、または約70、または約80、または約90、または約100、または約110、または約120、または約130、または約140、または約150、または約160、または約170、または約180、または約190、または約200、または約210、または約220、または約230、または約240、または約250、または約260、または約270、または約280、または約290、または約300である。1つの例において、段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数に上限はない。
【0039】
1つの例において、段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、少なくとも10である。1つの例において、段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、10~1700である。1つの例において、段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、10~1700、または100~1600、または200~1500、または300~1400、または400~1300、または500~1200、または600~1100、または700~1000である。1つの例において、段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数は、約10、または約100、または約200、または約300、または約400、または約500、または約600、または約700、または約800、または約900、または約1000、または約1100、または約1200、または約1300、または約1400、または約1500、または約1600、または約1700である。1つの例において、段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数に上限はない。
【0040】
別の例において、多重化PCR反応における複数のフォワードおよびリバースプライマー対の最大総数は約4000であり、ここで段階(b)(I)に開示されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数が約2000であり、ここで段階(b)(II)に開示される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数が約300であり、かつここで段階(b)(III)に開示されるタンパク質発現に関連する標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対の数が約1700である。
【0041】
1つの例において、ゲノム変化を起こしうる標的遺伝子の複数個は、融合を起こすことが知られている遺伝子のパートナー遺伝子由来のエクソンに融合された、融合を起こすことが知られている遺伝子由来のエクソンを含む。1つの例において、融合を起こすことが知られている遺伝子は、ALK受容体チロシンキナーゼ、RETがん原遺伝子、ROSがん原遺伝子1、線維芽細胞増殖因子受容体1(FGFR1)、線維芽細胞増殖因子受容体2(FGFR2)、線維芽細胞増殖因子受容体3(FGFR3)、神経栄養受容体チロシンキナーゼ1(NTRK1)、神経栄養受容体チロシンキナーゼ2(NTRK2)、神経栄養受容体チロシンキナーゼ3(NTRK3)、ニューレグリン1(NRG1)、B-Rafがん原遺伝子、セリン/スレオニンキナーゼ(BRAF)、膜貫通セリンプロテアーゼ2(TMPRSS2)、METがん原遺伝子、受容体チロシンキナーゼ(MET)、上皮増殖因子受容体(EGFR)、エストロゲン受容体1(ESR1)、血小板由来増殖因子受容体アルファ(PDGFRA)、アンドロゲン受容体(AR)、RhoGEFおよびGTPaseのBCR活性化因子(BCR)、コア結合因子サブユニットベータ(CBFB)、リジンメチルトランスフェラーゼ2A(KMT2A)、ヌクレオホスミン1(NPM1)、PML核小体スキャフォールド(PML)、ならびにRUNXファミリー転写因子1(RUNX1)からなる群より選択される。1つの例において、融合を起こすことが知られている遺伝子のパートナー遺伝子は、EMAP様4(EML4)、キネシンファミリーメンバー5B(KIF5B)、コイルドコイルドメイン含有6(CCDC6)、CD74分子(CD74)、形質転換酸性コイルドコイル含有タンパク質3(TACC3)、エズリン(EZR)、ETS転写因子ERG(ERG)、GTPaseドメインとアンキリンリピートとPHドメイン3を有するArfGAP(AGAP3)、A-キナーゼアンカリングタンパク質9(AKAP9)、KIAA1549、トロポミオシン3(TMP3)、転座プロモーター領域、核バスケットタンパク質(TPR)、ERからゴルジ調節因子への輸送(TFG)、ラミンA/C(LMNA)、BicCファミリーRNA結合タンパク質1(BICC1)、RAD51リコンビナーゼ(RAD51)、CD47分子(CD47)、Yes1関連転写調節因子(YAP1)、ETSバリアント転写因子1(ETV1)、ETSバリアント転写因子4(ETV4)、ETSバリアント転写因子5(ETV5)、ETSバリアント転写因子6(ETV6)、PAPOLAおよびCPSF1と相互作用する因子(FIP1L1)、セントリオリン(CNTRL)、ABLがん原遺伝子1、非受容体チロシンキナーゼ(ABL1)、AF4/FMR2ファミリーメンバー1(AFF1)、MDS1およびEVI1複合体遺伝子座(MECOM)、MLLT3スーパー伸長複合体サブユニット(MLLT3)、ミオシン重鎖11(MYH11)、PBXホメオボックス1(PBX1)、レチノイン酸受容体アルファ(RARA)、ならびにRUNX1パートナー転写共抑制因子1(RUNX1T1)からなる群より選択される。
【0042】
本開示の方法は、ある種のサイズを有するアンプリコンを作製するために最適化される。選択された90~110塩基対の長さは、より短いアンプリコン(80塩基対未満)の産物が、アンプリコン配列決定のための多段階ライブラリ調製法を通じてあまり効果的に保持されないため、最適であると考えられた。1つの例において、段階(b)におけるcDNA由来の複数のアンプリコンの長さは90~110塩基対である。1つの例において、段階(b)におけるcDNA由来の複数のアンプリコンの長さは約90塩基対、または約100塩基対、または約110塩基対である。
【0043】
段階(b)におけるcDNA由来の複数のアンプリコンは次に、第1の局面の段階(c)に開示されるように、精製される。
【0044】
本開示の方法は、除去したい小さなプライマー二量体人工産物および保持したい所望の産物、ならびに酵素によって(例えばエンドヌクレアーゼおよびエキソヌクレアーゼを用いて)消化したい過剰なプライマーの、サイズに基づいた(磁気ビーズに基づいた)分離を伴うようにデザインされる。1つの例において、DNAの精製は、常磁性ビーズなどの作用物質を用いて実施される。1つの例において、常磁性ビーズは、AMPure XPビーズ、SPRIビーズ、およびDynabeadsからなる群より選択される。1つの例において、常磁性ビーズはAMPure XPビーズである。
【0045】
次に、精製された複数のアンプリコンを、ユニバーサルインデックス付きアダプタープライマーを用いて増幅し、第1の局面の段階(d)に開示されるように、複数の配列決定用ライブラリを作製する。
【0046】
1つの例において、増幅は、KAPA Hifi HotStart ReadyMix、Phusion U Hot Start DNA Polymerase (Thermo Scientific)、ZymoTaq DNA Polymerase (Zymo Research)およびQ5U Hot Start High-Fidelity DNA Polymerase (NEB)などを用いることによって実施される。
【0047】
1つの例において、段階(d)に開示される各ユニバーサルインデックス付きアダプタープライマーは、アダプター配列を含む。1つの例において、「アダプター配列」という用語は、さまざまな目的のために関心対象のオリゴヌクレオチドを調製するために関心対象のオリゴヌクレオチドに付加することができる任意のヌクレオチド配列をいう。アダプター配列は、配列決定用ツールのフローセル表面に存在する複数のオリゴヌクレオチドに相補的であり、それによってDNA断片が配列決定用ツールに付着することを可能にする。いくつかの例において、アダプター配列は、関心対象のオリゴヌクレオチドの配列決定を可能にする。配列決定用プラットフォーム特異的アダプター配列は当技術分野において公知であり、例えば、Illumina P5/P7アダプター配列を含む。
【0048】
1つの例において、第1の局面の方法の段階(d)に開示されるユニバーサルインデックス付きアダプタープライマーは
の配列を含むフォワードプライマー; および
の配列を含むリバースプライマーを含み、
ここで「
*」はホスホロチオエート結合を表し、かつここで下線配列はバーコード配列である。次いで、形成された複数の配列決定用ライブラリは、第1の局面の段階(e)に開示されるように、精製される。
【0049】
1つの例において、複数の配列決定用ライブラリの精製は、常磁性ビーズなどの作用物質を用いて実施される。1つの例において、常磁性ビーズは、AMPure XPビーズ、SPRIビーズ、およびDynabeadsからなる群より選択される。1つの例において、常磁性ビーズはAMPure XPビーズである。
【0050】
次いで、精製された複数の配列決定用ライブラリを、第1の局面の段階(f)に開示されるように、次世代配列決定用プラットフォーム上で多重配列決定に供して、複数の配列決定読み取りを得る。
【0051】
1つの例において、複数の配列決定用ライブラリは、NextSeq 550、NovaSeq 6000、またはBGI MGISEQ-2000、DNBSEQ-G400、DNBSEQ-T7上で配列決定される。
【0052】
1つの例において、複数の配列決定用ライブラリは、Agilent High Sensitivity DNA Screentapeを用いて定性化され、KAPA Library Quantification Kitを用いて定量化される。1つの例において、複数の配列決定用ライブラリは、成功すれば、(例えば、
図15に示されるように) 200塩基対を超える複数の顕著なピークの典型的なサイズプロファイルを有するであろう、配列決定用ライブラリのサイズプロファイルを判定することにより定性化される。
【0053】
その後、第1の局面の段階(g)に開示されるように、段階(f)から得られた複数の配列決定読み取りの各配列から複数のコンセンサス読み取りが導出される。
【0054】
1つの例において、第1の局面の段階(g)は以下をさらに含む:
(g)(I) 各配列決定読み取りからバーコード配列の存在を検出すること、
(g)(II) 同じバーコード配列を有する複数の配列決定読み取りに対してクラスタ再割り当てを実施して、複数のバーコードクラスタを作製することであって、ここで各バーコードクラスタが、同じアンプリコンからの、同じバーコード配列を有する読み取りを含む、こと、および
(g)(III) 各バーコードクラスタに対しコンセンサス呼び出しを実施して、各配列のコンセンサス読み取りを得ること。
【0055】
導出されたコンセンサス配列は、第1の局面の段階(h)に開示されるように、参照ゲノムに対してアライメントされる。1つの例において、「参照ゲノム」という用語は、公開データベースから入手可能でありうる、当技術分野において公知のDNA配列をいう。1つの例において、「コンセンサス読み取り」という用語は、コンセンサス呼び出しから得られるヌクレオチド配列をいう。1つの例において、コンセンサス呼び出しは、サブグループ内の各配列決定結果について各位置のヌクレオチドを同定し、複数の配列決定結果にわたって各位置のヌクレオチドの同一性を比較し、各位置の大多数ヌクレオチドを決定することにより実施される。大多数ヌクレオチドの計数が、特定の位置に対しての大多数を判定するために設定された閾値を上回る場合、該位置の割り当ては大多数ヌクレオチドである。大多数ヌクレオチドの計数がこの閾値を下回る場合、該位置の割り当ては行われない。閾値は位置ごとに可変であり、特定の位置に対応する配列決定結果の総数の関数である。
【0056】
1つの例において、開示される方法の段階(h)はさらに、配列アライメントが段階(h)(I)に開示されるように、第1の遺伝子由来のエクソンの参照ゲノムに対する部分的アライメントおよび第2の遺伝子由来のエクソンの参照ゲノムに対する部分的アライメントをもたらすなら、その結果を用いて、(i) 配列アライメントをスプリット読み取りと判定すること、(ii) 融合接合を支持する段階(h)(I)(i)からのスプリット読み取りの数を計数/列挙すること、ならびに(iii) 段階(h)(I)(ii)からのスプリット読み取りの数が2つまたはそれ以上であるなら、第1の遺伝子および第2の遺伝子を融合パートナーと判定することを含む。1つの例において、開示される方法の段階(h)はさらに、配列アライメントが段階(h)(II)に開示されるように、対照ハウスキーピング遺伝子の参照ゲノムとのアライメントをもたらすなら、その結果を用いて、(i) 配列アライメントを対照ハウスキーピング遺伝子のコンセンサス読み取りと判定すること、ならびに(ii) 段階(h)(II)(i)からの対照ハウスキーピング遺伝子のコンセンサス読み取り対を計数/列挙して、対照ハウスキーピング遺伝子の遺伝子発現のレベルを判定することを含む。1つの例において、開示される方法の段階(h)はさらに、配列アライメントが段階(h)(III)に開示されるように、タンパク質発現に関連する標的遺伝子の参照ゲノムとのアライメントをもたらすなら、その結果を用いて、(i) 配列アライメントをタンパク質発現に関連する標的遺伝子のコンセンサス読み取りと判定すること、ならびに(ii) 段階(h)(III)(i)からのタンパク質発現に関連する標的遺伝子のコンセンサス読み取り対を計数/列挙して、タンパク質発現に関連する標的遺伝子の遺伝子発現のレベルを判定することを含む。
【0057】
1つの例において、「コンセンサス読み取り対」は、同じバーコード配列およびプライマー対を含む全ての配列決定読み取りを折り畳んだ(collapsing)後に呼び出されるコンセンサス配列をいう。例えば、各コンセンサス読み取り対は、cDNAに変換された元のRNA分子に属すると推定される。1つの例において、段階(h)に開示される計数/列挙は、バーコード配列に基づくコンセンサス計数に基づき達成され、ここで同じバーコード配列およびプライマー対の組み合わせを含む各RNA分子は、固有のRNA分子を表す。1つの例において、第1の局面の段階(b)に開示される複数のフォワードおよびリバースプライマー対の全てのリバースプライマーは、バーコード配列を含む。それゆえ、所与のバーコード配列およびプライマー対の組み合わせによって捕捉された全てのRNA分子を検出および計数/列挙することができる。
【0058】
1つの例において、導出された複数のコンセンサス配列の参照ゲノムとのアライメントは、配列アライメントツールを用いて実施される。1つの例において、アライメントツールは、STAR、HISAT2、bwa、CLC、RSEM、kallisto、salmonなどである。
【0059】
段階(h)からの配列アライメントの結果は、第1の局面の段階(i)に開示されるように、ゲノム変化の有無を判定するために、および/または遺伝子発現の有無を判定するために、および/または遺伝子発現のレベルを定量化するために用いられる。
【0060】
1つの例において、開示される方法は、段階(h)(I)からの配列アライメントの可視化および融合呼び出しをさらに含む。1つの例において、可視化はIntegrated Genome Viewer、またはSavant Genome Browserなどを用いて実施される。1つの例において、融合呼び出しはArribaおよびFusion Catcherなどを用いて実施される。
【0061】
1つの例において、ゲノム変化の有無を判定する、および/または遺伝子発現の有無を判定する、および/または遺伝子発現のレベルを定量化する段階は、段階(h)からの配列アライメントのバリアント呼び出しを実施することをさらに含む。1つの例において、ゲノム変化の有無を判定する、および/または遺伝子発現の有無を判定する、および/または遺伝子発現のレベルを定量化する段階は、段階(h)(II)からの配列アライメントのバリアント呼び出しを実施することをさらに含む。1つの例において、ゲノム変化の有無を判定する、および/または遺伝子発現の有無を判定する、および/または遺伝子発現のレベルを定量化する段階は、段階(h)(III)からの配列アライメントのバリアント呼び出しを実施することをさらに含む。1つの例において、バリアント呼び出しの段階は、(i) 段階(h)からの配列アライメントに基づいてコンセンサス読み取りと参照ゲノムとの間の差異を同定すること; およびii) ゲノム変化を含む配列アライメントの読み取り計数を判定することを含む。1つの例において、バリアント呼び出しを行う段階は、(i) 段階(h)(II)からの配列アライメントに基づいてコンセンサス読み取りと参照ゲノムとの間の差異を同定すること; およびii) ゲノム変化を含む配列アライメントの読み取り計数を判定することを含む。1つの例において、バリアント呼び出しを行う段階は、(i) 段階(h)(III)からの配列アライメントに基づいてコンセンサス読み取りと参照ゲノムとの間の差異を同定すること; およびii) ゲノム変化を含む配列アライメントの読み取り計数を判定することを含む。1つの例において、ゲノム変化は、挿入(例えば、重複)、欠失、および単一ヌクレオチド変異からなる群より選択される。1つの例において、バリアント呼び出しは、Mutect2およびカスタムバリアントコーラー(custom variant caller)を用いて実施される。
【0062】
1つの例において、第1の局面の開示される方法は、遺伝子発現、構造的再構成の検出および生物学的サンプルからのcfRNAにおける遺伝子発現の定量化を同時に行うために用いられ、がん細胞において過剰発現されることが知られている遺伝子の発現レベルが定量化される。1つの例において、第1の局面の開示される方法は、cfRNAにおけるゲノム変化の検出および生物学的サンプルからのcfRNAにおける遺伝子発現の定量化を同時に行うために用いられ、ゲノム変化を起こした標的遺伝子の発現レベルが定量化される。1つの例において、第1の局面の開示される方法は遺伝子発現の検出およびcfRNAの遺伝子発現の定量化を同時に行うために用いられ、タンパク質発現に関連する標的遺伝子の発現レベルが定量化される。
【0063】
1つの例において、タンパク質発現に関連する遺伝子の発現レベルを可視化するために用いられる統計モデリング技法は、ヒートマップ可視化、主成分分析、階層的クラスタリングなどである。
【0064】
第2の局面において、本開示は第1の局面の方法によって、ゲノム変化の検出および/または遺伝子発現の検出および/または遺伝子発現レベルの定量化を、生物学的サンプルにおいてRNAを用いて行うためのキットであって、以下:
(a) 第1の局面の方法の段階(b)(I)において定義されるゲノム変化を起こしうる標的遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対;
(b) 第1の局面の方法の段階(b)(II)において定義される対照ハウスキーピング遺伝子の複数個に特異的な複数のフォワードおよびリバースプライマー対; ならびに
(c) 第1の局面の方法の段階(b)(III)において定義されるタンパク質発現に関連する遺伝子の複数個に特異的な複数のプライマーセットを含む、キットに言及する。
【0065】
1つの例において、当業者は、本明細書における開示に基づいて、例えば、第1の局面の方法の段階(b)(I)、(b)(II)および(b)(III)に記述されるように、第2の局面のキットの(a)、(b)および(c)における複数のプライマー対およびプライマーセットをデザインすることができるであろう。1つの例において、本明細書において記述されるキットにおいて提供される第1の局面の方法の段階(b)(III)において定義されるタンパク質発現に関連する遺伝子の複数個に特異的な複数のプライマーセットは、ゲノム変化の有無を判定するために用いられうる。1つの例において、本明細書において記述されるキットにおいて提供される第1の局面の方法の段階(b)(III)において定義されるタンパク質発現に関連する遺伝子の複数個に特異的な複数のプライマーセットは、欠失、挿入(例えば、重複)および単一ヌクレオチド変異などのゲノム変化の有無を判定するために用いられうる。1つの例において、本明細書において記述されるキットにおいて提供される第1の局面の方法の段階(b)(III)において定義されるタンパク質発現に関連する遺伝子の複数個に特異的な複数のプライマーセットは、本明細書において記述されるバリアント呼び出しを行う段階をさらに実施することによってゲノム変化の有無を判定するために用いられうる。1つの例において、ゲノム変化は単一ヌクレオチド変異、挿入(例えば、重複)または欠失でありうる。1つの例において、第1の局面の方法によってゲノム変化の検出および/または遺伝子発現の検出および/または生物学的サンプルにおけるcfRNAの遺伝子発現レベルの定量化を行うためのキットは、複数の多重化PCR反応を実施するための緩衝液、逆転写酵素、DNAポリメラーゼ、および複数のデオキシヌクレオチド三リン酸(dNTP)をさらに含む。いくつかの例において、本明細書において記述されるキットにおいて提供される試薬は、1つまたは複数の容器に独立して分配された成分を含む別々の容器において提供されうる。本明細書において記述される方法は、配列決定(高処理配列決定などの)に関するため、配列決定プロセスにおいて必要とされるさらなる成分は、当業者によって容易に判定されうる。
【0066】
本出願において用いられる場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈上明らかにそうでないことが指示されない限り、複数の参照を含む。例えば、「プライマー(a primer)」という用語は、それらの混合物および組み合わせを含めて、複数のプライマーを含む。
【0067】
本明細書において用いられる場合、「増加」および「減少」という用語は、集団全体に存在するのと同じ形質または特徴と比較して、集団の部分集合における選択された形質または特徴の相対的変化をいう。したがって、増加は正のスケールでの変化を示し、減少は負のスケールでの変化を示す。本明細書において用いられる「変化」という用語はまた、全体としての集団における同じ形質または特徴と比較した、単離集団の部分集合の選択された形質または特徴の間の差異をいう。しかしながら、この用語は、見られる差異の評価を伴わない。
【0068】
本明細書において用いられる場合、物質の濃度、物質のサイズ、時間の長さ、または他の記載値の文脈における「約」という用語は、記載値の±5%、または記載値の±4%、または記載値の±3%、または記載値の±2%、または記載値の±1%、または記載値の±0.5%を意味する。
【0069】
本開示を通じて、ある種の態様は範囲形式で開示されうる。範囲形式での記述は、単に便宜上、簡潔にするためのものであり、開示された範囲に対する柔軟性のない限定と解釈されるべきではないことを理解されたい。したがって、範囲の記述は、その範囲内の個々の数値と同様に、全ての可能な部分範囲を具体的に開示していると見なされるべきである。例えば、1~6などの範囲の記述は、1~3、1~4、1~5、2~4、2~6、3~6などのような部分範囲、およびその範囲内の個々の数値、例えば、1、2、3、4、5、および6を具体的に開示していると見なされるべきである。これは範囲の広さに関係なく適用される。
【0070】
本明細書において例示的に記述された本開示は、本明細書において具体的に開示されていない要素、限定がない場合にも、適切に実践されうる。したがって、例えば、「含む(comprising)」、「含む(including)」、「含有する(containing)」などの用語は、広範に、限定なしに解釈されるものとする。さらに、本明細書において利用される用語および表現は、限定の用語ではなく、説明の用語として用いられており、そのような用語および表現の使用には、表示および記述された特徴またはその一部の均等物を排除する意図はなく、主張される本開示の範囲内でさまざまな修正が可能であることが認識される。このように、本開示は好ましい態様および任意の特徴により具体的に開示されているが、本明細書において具体化された本開示の修正および変形が当業者によって利用されうることや、そのような修正および変形は本開示の範囲内にあると見なされることが理解されるべきである。
【0071】
本発明を、本明細書において広範かつ一般的に記述してきた。一般的な開示に含まれるより狭い種および亜属のグループのそれぞれもまた、本開示の一部を構成する。これには、属(genus)から任意の主題を除去する但し書または否定的な限定を伴う本開示の包括的記述が含まれ、除外された材料が本明細書に具体的に記載されているかどうかには関係がない。
【0072】
他の態様は、以下の特許請求の範囲および非限定的な例の範囲内にある。
【実施例】
【0073】
方法
サンプル収集および処理
Streck Cell-free DNA BCT(登録商標)に採取された血液は、血漿分離前に常温で出荷された。簡単に説明すると、血漿は2段階の遠心分離プロセスを用いて調製された: 最初の遠心分離は4℃で10分間1500×gにて行って、血漿を分離した。血漿層を別のチューブに移し、4℃で10分間15,000×gにて遠心分離して、細胞夾雑物をさらに除去し、直ちに核酸抽出用に処理するか、または抽出に使用するまで-80℃で貯蔵した。凍結している場合、抽出前に血漿を室温で完全に解凍した。
【0074】
QIAamp Circulating Nucleic Acids kit (Qiagen)を用いて血漿無細胞全核酸を抽出した。核酸抽出液には、共溶出したcfDNAおよびcfRNA画分が含まれている。cfDNAは、Qubit Fluorometer (Thermo Fisher Scientific)を用いて定量化し、4200 TapeStation (Agilent)のGenomic DNA ScreenTapeを用いてサイズ決定した。cfRNAは、Bioanalyzer RNA 6000 Picoキットまたは4200 TapestationのHigh Sensitivity RNA Screentapeを用いて定量化およびプロファイリングした。
【0075】
配列決定用ライブラリにおける融合および発現のためのプライマーのデザイン
cfRNAサンプルにおける潜在的な融合を捕捉するために、高度に多重のアンプリコンに基づくNGSアッセイをデザインした。融合遺伝子におけるパートナーエクソンの予想される配向に依り、エクソン融合接合部の上流のプライマー(「フォワード」プライマー)または融合接合部の下流のプライマー(「リバース」プライマー)を標的遺伝子のエクソンに対してデザインした。大まかに言うと、がんにおける融合事象に関与することが知られている標的遺伝子に対して、複数のエクソン隣接プライマーをデザインした。全ての下流プライマーについて、コンセンサス呼び出しおよび固有分子の列挙のために、遺伝子特異的配列の上流にランダムな10塩基対のバーコード配列を組み入れた。300超の「フォワード」プライマーおよび300超の「リバース」プライマーのプールを調製した。遺伝子間で起こることが知られている潜在的な融合を最適に捕捉するために、多重PCRには複数の「上流」および「下流」プライマーを含めた。プライマーのデザインには、融合を起こすことが知られている、十分に特徴付けられた遺伝子のエクソンを含めており、バーコード配列のプライマーを加えることで、列挙方法にしたがってRNA転写物のコピーの正確な列挙を可能にした(
図1)。
【0076】
対照遺伝子および発現を定量化したい他の遺伝子に対応する転写物の捕捉のために、対のうちの少なくとも1つのプライマーがエクソン-エクソン接合部に着地するか、またはプライマー対は長さが5000塩基対超のイントロンによって介在された2つのエクソン内にあるように、プライマーをデザインした。これらのプライマーを最終的なプライマープールにも含めた。cfRNA増幅の特異性は、全cfRNA配列決定ワークフローを実施することによって、ただし相補的DNA調製中に逆転写酵素を除いて検証した。逆転写を実施しなかった場合、意図した領域、特に対照遺伝子および発現遺伝子の配列決定は、cfDNAを増幅するプライマーによるものとすることができた。そのようなプライマーはいずれも再デザインして、エクソン-エクソンにまたがるプライマーの3'エクソンスパンを低減することによりRNAに対する特異性を向上させた。発現に関連する標的遺伝子のプライマーのデザインは、対照遺伝子標的と同様であって、プライマー対の少なくとも1つのプライマーがエクソン-エクソン接合部にまたがっており、1つの標的遺伝子につき2つまたはそれ以上のプライマー対を、5'末端と3'末端のエクソンの両方をカバーするようにデザインして、1つまたは複数のアンプリコンが所与の標的遺伝子を表すようにさせることで、発現に向けた標的遺伝子の発現をより確実に捕捉した。高度に多重化されたプライマープールを、複数の上流および下流プライマーで利用したが、そのうちのいくつかは、発現のばらつきに応じて大部分のサンプルにおいて配列決定可能な標的を作製するものと予想され、いくつかのプライマーは、生産的に発現される融合遺伝子を作製する構造的再構成についてサンプルが陽性である場合にのみ産物を作製するものと予想される。プライマーはさらに、Illumina配列決定のための配列決定用アダプターで配列決定可能なライブラリを作製するのに必要な適切な伸長を保有していた(
図2Aおよび2B)。
【0077】
cfRNA配列決定用ライブラリの調製
ランダムプライマーを使い総量20 ulにてHigh-Capacity cDNA Reverse Transcription Kit (Thermo Fisher Scientific)を用い、20~50 ngのcfRNAを相補的DNA(cDNA)に変換した。変換されたcDNAを鋳型として、Platinum(商標) SuperFi II DNA Polymerase (Thermo Fisher Scientific)を使った標的捕捉のための高度に多重化されたPCR反応において用いた。簡単に説明すると、cDNAをプライマーおよびDNAポリメラーゼと1回の反応で組み合わせ、以下の条件での3~15サイクルのPCRに供した: 98℃, 1分; 60℃, 1分; 72℃, 1分、続いて72℃で5分間の最終伸長。増幅産物を1ラウンドの酵素消化(エキソヌクレアーゼ、ExoIおよびExoTを使用)と1.8倍量のAMPure XPビーズを使用した2ラウンドのクリーンアップに供し、緩衝液EBまたはヌクレアーゼを含まない水で溶出した。精製したPCR産物を次に、Illuminaプラットフォームでの配列決定に適合するユニバーサルインデックス付きアダプタープライマーと、KAPA HiFi HotStart ReadyMixを用いたプライマーとで増幅した。最終的な増幅ライブラリを2ラウンドの0.8倍量のAMPure XPビーズで精製して、過剰なアダプターを除去し、最終的な配列決定用ライブラリをサイズ選択した。ライブラリを、High Sensitivity DNA Screentapeを用いて定量化し、KAPA Library Quantification Kitを用いて定量化した。各ライブラリをNextseq 550にてサンプルあたり300万のペアエンドリードの深さまで配列決定した。
【0078】
データ分析
カスタムパイプラインを用いて、FASTQファイルを処理した。まず初めに、配列決定されたアンプリコンを同定し、読み取り1および対になった読み取り2の正しい方向性、上流または下流(パネルデザインに基づくプライマー配列の所定のリストから)の潜在的なプライマー配列の存在に基づいてFASTQファイルにラベル付けした。読み取り1におけるバーコード配列を、読み取り1におけるプライマー上流に同定し、cutadaptを用いてトリミングした。抽出された分子タグ配列を用いて、所定のプライマー対および固有のバーコード配列により識別可能な配列の全ての重複読み取りのコンセンサス読み取り配列を導出した。次に、コンセンサス読み取りを新しいFASTQファイルに書き込み、STARアライナーを用いてヒトゲノム参照hg19にアライメントした。ゲノムの非連続領域が読み取り内に捕捉されている融合読み取りは、スプリット読み取りとして同定され、融合パートナーは配列アライメントに基づいて同定された。さらに、2つの相互パートナー遺伝子にマッピングされたスプリット読み取り配列の存在が、同定された遺伝子に特異的なプライマーによって捕捉されたことが確認された。融合接合を支持しているスプリット読み取り(読み取り対)の数を列挙した。ArribaおよびFusionCatcherを用いて、可視化および融合呼び出しも実施した。融合およびエクソンスキッピングバリアント(転写物バリアント)を呼び出すには、少なくとも2つの支持スプリット読み取りが必要とされた。分子バーコーディングを用いると、配列決定データの品質が高くなるため、配列決定に誤りがなくなり、融合呼び出しの信頼性が高まる。
【0079】
発現レベル分析は、発現のためのプライマー対によって予め定義された所与のアンプリコンを支持するコンセンサス読み取り対を列挙することによって行った。読み取り対の数を列挙し、対照遺伝子または標的遺伝子として下流分析のために集計した。Mutect2およびカスタムバリアントコーラーを用いてコンセンサスBAMファイルに対しバリアント呼び出しを実施して、参照配列と比べて単一ヌクレオチド変異、挿入変異および欠失変異を同定した。単一ヌクレオチド変異、挿入および欠失を含む変異体転写物の発現を、特定の単一ヌクレオチド変異、挿入変異または欠失変異を含み、意図した標的領域にマッピングされた読み取りの数に基づいて定量化した。野生型転写物の発現を、参照配列に一致し、意図した標的領域にマッピングされた読み取りの数に基づいて定量化した。各変異の相対的発現も、全読み取り数に対する変異体読み取り数の割合に基づいて判定した。
【0080】
結果
本開示は高い感度、特異性、および最小限の侵襲的手順で、cfRNAを用いて臨床的に関連するゲノムおよび遺伝子発現の変化を同時に検出および定量化するための方法について記述している。
【0081】
cfRNAに基づく検出アッセイの検証: 血漿中の無細胞核酸の相対的存在量
健常個体およびがん患者の血漿からの全cfRNA濃度を、cfRNAの存在について特徴付け、Bioanalyzer RNA 6000 Picoアッセイを用いて断片サイズ分布について分析した。cfRNAは全てのがんサンプルに存在し、サイズが110~120ヌクレオチドの位置に主なピークを示し、200~300ヌクレオチドの範囲に2番目のRNA集団を示した(
図3Aおよび3B)。相対的存在量の観点から見ると、より短い断片(110~120ヌクレオチド)は、より大きなサイズのRNA断片(200~300ヌクレオチド)よりも約5~10倍豊富であった。健常個人からのcfRNAも同じサイズ分布パターンを示したが、cfRNA濃度は有意に低かった(
図3Cおよび3D)。
【0082】
健常個体およびがん個体の血漿からのcfDNAおよびcfRNAを含む全核酸抽出物を分析した。各抽出液のcfDNA濃度に比べ、cfRNA濃度は一般的に低く、cfDNA濃度が10 ng/ml血漿を超えた場合に最も大きく異なった(
図4)。
【0083】
がん細胞株から抽出されたRNAを用いたcfRNAに基づく多重アンプリコン配列決定検出の技術的検証
本明細書において記述される方法は、CRL-9591(KMT2A-AFF1)、H2228(EML4-ALK)、CRL-2724(RUNX1-RUNX1T1)、VCaP(TMPRSS2-ERG)およびCRL-5813(TMPRSS2-ERG)などの、融合遺伝子を担持することが知られている培養がん細胞株から抽出されたRNAを用いて融合を検出する能力を示した。培養細胞からのRNAは血漿cfDNAに比べて比較的無傷であるため、cfRNAのサイズにより近づけるために、細胞株RNAを超音波処理(Covarisを使用)に供した。得られた画分を用いてcfRNAを模倣し、種々の既知の融合の検出のための多重アンプリコン配列決定の性能を実証した(
図5A、5Bおよび5C)。これを用いてcfRNAを模倣するのに適切な材料を提供し、種々の既知の融合の検出のための多重アンプリコン配列決定の性能を実証した。全5種のがん細胞株においてRNAに基づく融合検出に成功した(
図7)。得られた複数の配列決定用ライブラリは、High Sensitivity DNA Screentapeで見られた配列決定用ライブラリに変換されたcfRNAサンプルの典型的なライブラリプロファイルを例示した
図15に示されるように、Agilent High Sensitivity DNA Screentapeを用いて定性化することができる。200塩基対を超える複数のピークは、潜在的な融合産物、対照遺伝子産物、ならびに複数のフォワードおよびリバースプライマーが含まれる他の遺伝子発現産物を包含する複数の産物に対応している。適格なライブラリは200塩基対超のサイズの顕著なピークを有するであろう。
【0084】
参照ゲノムに対する配列アライメントでは、標的エクソンに対する部分的アライメントと、スプリット読み取りとして知られる、パートナー遺伝子エクソンに対応するゲノム配列の別の部分に対する部分的アライメントでの配列決定読み取りの捕捉が示され、わずか1 ngの断片化RNAで、H2228細胞株におけるEML4-ALK融合転写物の検出が、スプリット構成を支持している8364読み取りで確認された(
図6Aおよび6B)。スプリット読み取りのアライメントにより、がん細胞株: NCI-H660細胞株(CRL-5813, ATCC)、VCaP細胞株(CRL-2876, ATCC)、ヒトMV-4-11細胞株(CRL-9591, ATCC)およびKasumi-1(CRL-2724, ATCC)における融合が、断片化RNAにおける多重アンプリコン配列決定法を用いたRNA配列決定データにおける融合検出用のArribaツールによって可視化される通り正確に検出されることが示された(
図7)。
【0085】
cfDNAに基づく検出アッセイとcfRNAに基づく検出アッセイとの間のデータ比較
DNAに基づく方法(Liquid Hallmark)を用い融合について陽性であることが以前に特徴付けられたがん患者2名の血漿からの核酸抽出物を試験した。転移性前立腺がんの1番目の症例においては、TMPRSS2内のイントロン位置chr21:42867069(TMPRSS2-NM_005656.4のイントロン2)およびERG内のイントロン位置chr21:39818058(ERG-NM_001291391.1のイントロン3)にマッピングされている17スプリット読み取りによって支持されたTMPRSS2-ERG融合がcfDNA(70 ngのcfDNAを使用)において検出された(
図8A)。同じ循環核酸抽出物を用いて、cfRNAにおける融合(わずか24 ngのcfRNAに相当)が、スプリット読み取りを支持している4123で検出され、TMPRSS2のエクソン2(chr21: 21:42870045)をNM_001291391.1のエクソン4(またはERG NM_182918.4のエクソン2)(chr 21:39817544)と融合していた(
図8B)。
【0086】
転移性肺がんの2番目の症例においては、cfDNA(切断点CCDC6イントロン1(chr10:61623181)およびRETイントロン11(chr10:43611035)ならびにcfRNA CCDC6エクソン1(10:61665879)およびRETエクソン12(10:43612031)を用いてCCDC6-RET融合が検出された。cfDNAは12支持読み取りで検出されたが、cfRNAにおける融合は13スプリット読み取りによって支持された(
図9Aおよび9B)。
【0087】
末梢血細胞由来のDNAにおいてBCR-ABL1再構成が確認された血液悪性腫瘍(急性リンパ芽球性白血病)からの3番目の臨床サンプルにおいては、保管されていた軟膜の別の画分からRNAを抽出し、本明細書で記述した多重アンプリコン配列決定法で試験した。BCRのエクソン14とABL1のエクソン2との間の融合はRNA画分において、159,106の豊富な支持読み取りで容易に検出可能であった。多数の支持読み取りは、試験したサンプル(軟膜RNA)において融合陽性のがん細胞の発現増加および二次濃縮による、BCR-ABL1融合のある転写物の濃縮を示している(
図10Aおよび
図10B)。
【0088】
追加の融合事象を
図13に示しており、本明細書において記述される方法を使いcfRNAを用いた未処置肺がん症例において作用しうるドライバー融合体の同定を例示している。
図13A、
図13Bおよび
図13Cは、それぞれ3例の肺がん症例でのcfRNAサンプルにおけるさまざまな遺伝子融合事象、すなわちLMNA-NTRK1融合、CD74-NRG1およびETV6-NTRK3融合の検出を示す。これらの変異はDNAに基づくアッセイを用いて検出不能であって、cfDNAにおける他のドライバー遺伝子変異の存在については陰性のように見える。さらに、記述した方法で45例の肺がん症例において融合検出のためにcfDNAおよびcfRNAを用いたところ、cfDNAと比較してcfRNA画分を用いた場合には、さらなる融合が同定された(
図14)。サンプルインプットとしてDNAおよびRNAを直交的に用いて融合の試験を実施したところ、サンプルインプットとしてcfDNAおよびcfRNAに基づき融合検出が一致した症例が12例あった。サンプルインプットとしてcfDNAの代わりにcfRNAを用いた場合、5例で追加の融合が検出され、1例で融合が見逃され検出されなかった。cfDNAとcfRNAの両方法により、または2つの方法のうちの1つにより検出された融合範囲のリストを
図14Bに示す。
【0089】
検出限界
検出限界は、融合事象が容易に検出可能でありうる最低RNA濃度として定義される。RNAに基づく融合の検出限界の最初の判定は、本明細書において記述される方法を用いてEML4-ALK融合が容易に検出可能であった1 ngのH2228細胞株RNAに存在するEML4-ALK融合転写物の数を定量化することによって行った(
図6および
図7)。EML4-ALK融合RNA転写物の数は、H2228細胞に存在するEML4-ALK転写物用に特別にデザインされたqRT-PCRアッセイを用いて、5 ngのRNAあたりおよそ13.7コピーであると判定された(
図11)。それゆえ、本明細書において記述される方法は、(H2228 RNA 1 ng中) 2.72コピーまでのEML4-ALK融合を検出できることが示され、RNAに基づく融合の非常に高感度な検出が示唆された。
【0090】
発現cfRNAに基づく融合事象の同時検出および定量化
cfRNAにおける融合の検出の他に、非侵襲的発現モニタリングを目的とした標的遺伝子の同時検出も、がんおよび健常サンプルからのcfRNAに対して行った。同じ多重反応において、22対照遺伝子に対するプライマーならびに免疫療法応答に関連する6遺伝子(CD274、PDCD1、CTLA4、LAG3、HAVCR2およびCD47)に対する13アンプリコンを含め、組み合わせた標的捕捉を実施した。意図した標的領域にマッピングされた読み取り計数に基づいて、各標的の発現レベルの判定を行った。発現レベルの範囲を発現ヒートマップにおいて可視化した(
図12)。
【0091】
通常、健常サンプルではcfRNAとcfDNAの両方の収量が非常に低かったため、予想通り、健常サンプル全体で対照遺伝子と免疫療法応答遺伝子の発現は低かった。しかしながら、がんサンプルの中では、本方法において用いられたcfRNA材料の量が同等であるにもかかわらず、一部のサンプルはほぼ全標的の限定発現を示し、ある範囲の発現パターンが観察された。本方法の検出の信頼性および定量的能力は、異なる量のcfRNAを用いて同じサンプルを繰り返し実施することにより実証され、これにより発現読み取り数の増加が示されたが、サンプル繰り返しの間でパターンの類似が示された(
図12)。繰り返しはC_20.126.1およびC_20.126.2(サンプル20.126の繰り返し)ならびにC_20.1069.1およびC_20.1069.2(サンプル20.1069の繰り返し)で表される。ヒートマップでは、2つの繰り返しが互いに最も近く、他のサンプルと比較して、同じサンプルの2つの繰り返し間の類似性が高いことを示している。
【0092】
RNAサンプルにおける欠失変異を含む発現転写物の検出
本明細書において記述される方法は、FFPE肺腫瘍組織から抽出されたRNAサンプルにおいて18ヌクレオチド欠失を検出する能力を示した。4266支持読み取りでEGFR c.2240_2257del p.L747_P753delinsS変異体転写物(欠失を含む)の発現が検出された(
図16)。
【0093】
RNAサンプルにおける単一ヌクレオチド変異を含む発現転写物の検出
本明細書において記述される方法は、転移性肺がん患者の血漿から抽出されたcfRNAサンプルにおいて単一ヌクレオチド変異を検出する能力を示した。112読み取りによりEGFR c.2573T>G p.L858R変異体転写物(単一ヌクレオチド変異を含む)の発現が支持された(
図17)。
【0094】
RNAサンプルにおける単一ヌクレオチド変異、挿入および欠失変異を含む発現転写物の検出
本明細書において記述される方法は、FFPE腫瘍サンプルから抽出された組織RNA(
図18A)および血漿から抽出されたcfRNA(
図18B)において単一ヌクレオチド変異、挿入および欠失変異を検出する能力を示した。単一ヌクレオチド変異、挿入(例えば、重複)および欠失変異を含む発現転写物の検出を目的とした標的遺伝子の同時検出を、4つのがんサンプルからの腫瘍組織RNAおよび3つのがんサンプルからの血漿cfRNAに対して実施した。同じ多重PCR反応において、所望の標的に対するプライマーを含め、組み合わせた標的捕捉を実施した。変種対立遺伝子頻度(VAF)を、本明細書において記述される方法から検出された全読み取り計数に対する変異体読み取り計数の比率に基づいて決めた。本明細書において記述されるRNAに基づく方法の有効性は、
図18Aおよび18Bに描かれたVAFの割合によって示される。
【0095】
考察
本開示では、循環無細胞RNA(cfRNA)を用いて、構造的再構成などのゲノム変化および遺伝子発現を同時に検出するための方法について記述している。そのような非侵襲的な検出および定量化は、がんの検出、予後の判定および治療応答の予測を可能にするものと想定される。本方法は、高度に多重化されたアンプリコンに基づいたNGSに基づいており、バーコード配列を用いた個々のcfRNA分子のタグ付け、およびcfRNAの断片化された性質に適合するように最適化されたアンプリコンのデザインを伴う。本発明者らは、本方法を、cfDNAとcfRNAの両方を含む循環核酸抽出物に適用することができ、そのようなサンプルにおいて融合RNA転写物と遺伝子発現を同時に検出および定量化することができることを示した。
【0096】
異なる遺伝子由来のエクソンの並置をもたらして融合転写物をもたらす遺伝子融合などの構造的再構成をcfRNA分析物から検出するために、次世代配列決定(NGS)による融合検出のための標的指向型多重アンプリコンパネルをデザインした。融合に関与するエクソン接合部に隣接する一対のプライマーにより、融合転写物を増幅するために遺伝子エクソンの並置を利用した。融合を起こすことが知られている融合遺伝子とパートナー遺伝子のエクソンに特異的なプライマーを、エクソン接合部位のすぐ隣にデザインした。異なる遺伝子由来のエクソンのそのような並置は、融合されるエクソンが(スプライシングによって)一緒になるようにプロセッシングされたmRNAが作製される場合にのみ起こりうるため、DNA中のエクソンを隔てる融合した比較的長いイントロンが介在しているせいで、同じプライマーによる生産的な増幅に同等のDNA配列が寄与する可能性は低い。
【0097】
融合転写物を捕捉するためのプライマーのデザインには、2つの主な特徴 - 1) 存在する場合にはRNA融合転写物の各コピーを個別にタグ付けするための下流(融合転写物に対して下流)プライマーにおけるランダムバーコード配列の存在、および2) 予想される全アンプリコン長が90~110塩基対に近くなるように、パネル内の各エクソン接合部からおよそ50塩基対の各プライマーの位置、があった。これは、110~120ヌクレオチドをピークに観察されたサンプルのcfRNAサイズ分布を満たすために行われた。選択された90~110塩基対の長さは、より短いアンプリコン(80塩基対未満)の産物が、除去したい小さなプライマー二量体人工産物および保持したい所望の産物の、サイズに基づいた(磁気ビーズに基づいた)分離を伴う、アンプリコン配列決定のための多段階ライブラリ調製法を通じてあまり効果的に保持されないため、最適であると考えられた。遺伝子間で起こることが知られている潜在的な融合を最適に捕捉するために、多重PCRには複数の「上流」および「下流」プライマーを含めた。プライマーのデザインには、とりわけ、ALK、RET、ROS1、FGFR2、FGFR3などの、融合を起こすことが知られている十分に特徴付けられた遺伝子のエクソン、ならびにEML4、KIF5B、CCDC6、CD74、TACC3などの、それらのパートナー遺伝子のエクソンが含まれる。上流エクソンと下流エクソンの間の潜在的な融合(デザインを意図した遺伝子対に限定されない)は、捕捉反応が同時に複数のプライマーを含む場合、サンプル中に存在すれば理論的には検出することができる。大まかに言うと、標的遺伝子およびパートナー遺伝子において融合を起こすことが知られている全てのエクソン接合部(および融合に関与することがこれまで報告されていない可能性のある介在エクソン)を捕捉するためのプライマーをデザインした。バーコード配列プライマーは、列挙の方法にしたがってRNA転写物のコピーの正確な列挙を可能にする。
【0098】
この方法に基づくcfRNA NGSライブラリの調製プロセスにおける最初の段階は、ランダムプライマーとともに逆転写酵素を用いてcfRNA(天然に断片化されている)を相補的DNA(cDNA)に変換することである。逆転写反応の結果は、サンプル中に存在するcfRNA分子の全相補体である。融合検出のためのエクソン隣接プライマーに加えて、反応に含まれるcfRNAの量の定量的測定を提供するために、多重反応にはいくつか(20種超)の対照ハウスキーピング遺伝子に対するプライマーも含めた。全てのサンプルタイプにわたって、あるベースラインで発現される遺伝子の転写物を捕捉する目的は、多重PCR反応に入る細胞物質の平均存在量を推定することであり、サンプル抽出、逆転写およびPCR段階を含めて、cfRNA配列決定ライブラリの調製プロセス全体の対照として機能することであった。対照標的遺伝子を対象としているプライマーのデザインは、対照標的遺伝子DNAの意図しない増幅を防ぐために、エクソン-エクソン接合部にまたがるように対照遺伝子プライマー対の少なくとも1つのプライマーをデザインし、得られるアンプリコンは長さがおよそ100塩基対であったという点で、融合標的のデザインとは異なっていた(
図1)。発現に関連する標的遺伝子のプライマーのデザインは、対照遺伝子標的と同様であって、プライマー対の少なくとも1つのプライマーがエクソン-エクソン接合部にまたがっており、1つの標的遺伝子につき2つまたはそれ以上のプライマー対を、5'末端と3'末端のエクソンの両方をカバーするようにデザインして、1つまたは複数のアンプリコンが所与の標的遺伝子を表すようにさせることで、発現に向けた標的遺伝子の発現をより確実に捕捉した。高度に多重化されたプライマープールを、複数の上流および下流プライマーで利用したが、そのうちのいくつかは、発現のばらつきに応じて大部分のサンプルにおいて配列決定可能な標的を作製するものと予想され、いくつかのプライマーは、生産的に発現される融合遺伝子を作製する構造的再構成についてサンプルが陽性である場合にのみ産物を作製するものと予想される。プライマーはさらに、Illumina配列決定のための配列決定用アダプターで配列決定可能なライブラリを作製するのに必要な適切な伸長を保有していた。
【0099】
本開示では、構造的再構成と遺伝子発現を同時に検出強化するためのcfRNA分析物の使用が実証された。これは、融合に関与する遺伝子のエクソンを包含する多重アンプリコンNGSアッセイのデザイン、およびバーコード配列の使用とcfRNA適用に最適なアンプリコンのサイズ選択による、標的遺伝子の発現に向けたアンプリコンのデザインによって達成された。全体的な存在量を、蓄積された読み取り数の読み取り密度によって定量化した。本開示において、コストおよび人的資源を含む全トランスクリプトーム配列決定に関連する問題は、血漿cfRNAを標的とした配列決定の適用によって部分的に克服された。
【0100】
本開示において、METがん原遺伝子、受容体チロシンキナーゼ(MET)エクソン14スキッピング、アンドロゲン受容体(AR)転写物バリアントなどの臨床的に関連する変化したスプライシング事象は、遺伝子内融合事象としてアプローチされており、存在する場合には、通常は観察されないが、がんでは起こりうる同じ遺伝子のエクソンの並置として異常スプライシングを捕捉するプライマーの組み合わせを用いて捕捉されるようにデザインされている。さまざまな処置に対する応答の予測のために、関連遺伝子の発現を非侵襲的に定量化する能力は、応答の長期的モニタリングを可能にし、臨床的決定を知らせるので、有益である。しかしながら、これは臨床診療において日常的に実施されておらず、変異およびゲノムコピー数の変化などのDNAレベルの変化の検出に主として限定されている。NGSなどの配列決定技術を用いて、配列決定読み取りを参照配列(ゲノム)と比較することにより変異が同定される。ゲノムコピー数の変化は、遺伝子に対応する読み取りの数を計数し、1遺伝子あたり2コピーのDNAを持つ細胞またはサンプルから予想される正常なコピー数からの偏差を定量化することにより定量化される。1つの例において、DNAレベルの変化は、ミスセンス変異、フレームシフト変異、挿入-欠失、スプライス部位変異につながる単一ヌクレオチド変異を含む。cfRNA分析物にアクセスすることによる発現変化の非侵襲的モニタリングでは、腫瘍特異的転写物の過剰発現を利用し、血液中の腫瘍由来RNAシグナルの増幅をもたらし、それによって検出感度を高めることができる。構造的再構成、例えば、血漿における遺伝子融合の非侵襲的な特徴付けの場合、典型的には、標的指向型のcfDNAに基づいた次世代配列決定(NGS)に基づく方法が利用される。
【0101】
安定性の問題を克服するために、本開示では、適切なRNA単離手順、DNA夾雑の除去および内因性ハウスキーピング対照遺伝子の使用が適用されている。一緒に組み合わせて、cfRNAを使用して、がんの診断、予後および治療応答の予測に関連する正確な情報を提供することができる。
【0102】
本開示の新規な特徴およびそれらが技術的に重要である理由は、以下の通りである:
1. 血漿から単離された場合に長さが通常約100ヌクレオチドであるcfRNAからの標的を増幅することができる一貫して短いアンプリコンの増幅を可能にするプライマーの特別なデザイン。
2. 融合を含むか否かにかかわらず、特異的標的の正確な列挙のためのプライマーデザインにおいてバーコード配列を含めること。
3. 融合(もしあれば)および標的遺伝子発現の同時捕捉のためのデザインの組み合わせ。
4. 多重パネルに含まれるあらゆる潜在的なプライマーの組み合わせとの新規融合を検出する能力。
5. RNAに基づく融合および発現の並行分析を可能にするデータ分析ワークフローのデザイン。
【0103】
本開示の方法は、以下の利点を有する:
1. 本開示の方法では、サンプルインプットにcfRNA(イントロンを欠く)を用い、それによって従来のDNAに基づくアッセイからは通常除外される長いイントロンを伴う遺伝子融合の同定を可能にする。
2. 本開示の方法は、完全に特徴付けられたゲノム変化標的と新規なゲノム変化標的(すなわち、これまでに特徴付けられていないゲノム変化標的)の両方の同定を可能にする。新規なゲノム変化標的は、多重化パネルに含まれる任意の潜在的なプライマーの組み合わせで検出することができる。RNAに基づく融合および発現の並行分析を可能にするデータ分析ワークフローのデザイン。
3. 本開示の方法は、cfRNAの構造的再構成の検出および発現レベルの判定を同時に可能にする。発現しているがん関連遺伝子について、ctRNAはctDNAと同じ変異情報を提供する; さらに、関心対象の標的遺伝子の発現レベルに関する定量的情報を提供することができ、腫瘍特異的転写物の過剰発現により対立遺伝子の頻度が低い変種の検出感度を潜在的に増加させることができる。これらの標的の発現を非侵襲的に定量化する能力は、処置応答のモニタリングおよび処置の決定に非常に有用でありうる。
4. 本開示の方法は、迅速かつ非侵襲的(必要な採血は1回だけ)な、血液に基づく検査(例えば、血中cfRNAにおける融合標的を検出するため)に用いられうる。さらに、本方法は単一検査での複数のがんの検出に拡張可能であり、無症候性集団におけるがんのスクリーニングに適している。
5. 本開示の方法は、従来のゲノム構造変化検出法と比較して非常に感度が高い。同等またはそれ以上の検出能力を得るために必要な出発物質(cfRNA)はもっと少ない。例えば、転移性前立腺がんサンプルにおけるTMPRSS2-ERG融合の検出には、同様の配列決定読み取りを作製するのに70 ngのcfDNAを用いるのと比較して、24 ngのcfRNAしか必要とされない。
6. 技術的意義は標的捕捉のためのプライマーの一般化可能な使用にあり、これによってさらに少ない、限られた量の核酸サンプルインプットでの作業が可能になる。さらに、標的の独自の組み合わせが、複数のがんを感度よく特異的に検出するために選択される。
7. 本開示の方法は拡張可能であり、単一アッセイにおいていくつかのがんの種類を同定するために複数のゲノム領域を捕捉することを可能にする。標的遺伝子のカバー範囲は、フォワードおよびリバースプライマー対の追加によって拡張することができる。
8. 本開示の方法は、以下の用途において用いられうる:
● 例えば、がんに関連するものなどの、臨床的に関連性のある十分に特徴付けられたゲノム変化(遺伝子融合など)の検出、同定および定量化。
● がんに特異的な新規ゲノム変化の同定。
● 健常個体および検査されたがんのリスクが高い個体におけるがんスクリーニング。
● 免疫療法などの処置に対する応答のモニタリングを含む、がん患者における疾患モニタリング。
9. より短い断片は、プライマーデザインおよび最適に捕捉できる配列情報に対する制約のため、配列決定に基づくアッセイの出発材料としてはより困難である。本開示の方法では、長さがcfDNA(約160塩基対)と比較して、長さが短い(約100ヌクレオチド) cfRNAを用いる。本明細書において記述されるプライマーは、融合および発現変化の検出感度を最大化するために、長さが約100ヌクレオチドの断片化cfRNAを捕捉するように最適にデザインされている。
10. 本開示の方法では、ゲノム変化事象の検出のためのサンプルインプットとして、DNAではなくRNAを用いる。これにより、典型的なDNAに基づく検出アッセイでは除外されたであろうゲノム変化事象の検出が可能になる。そのようなゲノム変化の例としては、以下が挙げられる:
● RNAの過剰発現につながるDNAのコピー数増加;
● 2つまたはそれ以上の遺伝子の非常に長いイントロンを伴う構造的再構成; および
● 薬物応答または耐性に対応する遺伝子発現パターンの変化。
【0104】
配列表
ゲノム変化を起こしうる遺伝子に特異的なフォワードプライマーの表
ゲノム変化を起こしうる遺伝子に特異的なリバースプライマーの表
対照ハウスキーピング遺伝子に特異的なフォワードプライマーの表
対照ハウスキーピング遺伝子に特異的なリバースプライマーの表
タンパク質発現に関連する標的遺伝子に特異的なフォワードプライマーの表
タンパク質発現に関連する標的遺伝子に特異的なリバースプライマーの表
他の配列の表
【配列表】
【国際調査報告】