(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022179442
(43)【公開日】2022-12-02
(54)【発明の名称】捕捉プローブおよびその使用
(51)【国際特許分類】
C12Q 1/6886 20180101AFI20221125BHJP
C12N 15/09 20060101ALI20221125BHJP
C12Q 1/6813 20180101ALI20221125BHJP
C12Q 1/6844 20180101ALI20221125BHJP
C12Q 1/00 20060101ALI20221125BHJP
【FI】
C12Q1/6886 Z ZNA
C12N15/09 Z
C12Q1/6813 Z
C12Q1/6844 Z
C12Q1/00
【審査請求】未請求
【請求項の数】14
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022082469
(22)【出願日】2022-05-19
(31)【優先権主張番号】21175123.5
(32)【優先日】2021-05-20
(33)【優先権主張国・地域又は機関】EP
(71)【出願人】
【識別番号】520490901
【氏名又は名称】ソフィア、ジェネティックス、ソシエテ、アノニム
【氏名又は名称原語表記】SOPHIA GENETICS SA
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100120617
【弁理士】
【氏名又は名称】浅野 真理
(74)【代理人】
【識別番号】100126099
【弁理士】
【氏名又は名称】反町 洋
(72)【発明者】
【氏名】ガブリエラ、エッコ
(72)【発明者】
【氏名】シアオピン、シン
(72)【発明者】
【氏名】アードリアン、ウィリグ
(72)【発明者】
【氏名】チェンユ、シュ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA19
4B063QQ02
4B063QQ08
4B063QQ42
4B063QQ53
4B063QR32
4B063QR36
(57)【要約】 (修正有)
【課題】既知および未知の融合遺伝子を検出するためのプローブ、それに関連する融合遺伝子を検出する方法、それに関連する使用およびキット、特に、癌を診断およびモニターする方法を提供する。
【解決手段】プローブセットは、標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分を有する少なくとも1つのプローブであって、前記プローブが、標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、第2のプローブ部分の長さが、プローブの全長の約1%~約42%に相当する少なくとも1つのプローブ、および標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1つのさらなるプローブであって、標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複しないさらなるプローブを含んでなる。
【選択図】なし
【特許請求の範囲】
【請求項1】
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を有する少なくとも1つのプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分の長さが、前記プローブの全長の約1%~約42%に相当する
前記少なくとも1つのプローブ、および
前記標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1つのさらなるプローブであって、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複しない前記さらなるプローブ
を含んでなる、プローブセット。
【請求項2】
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を有する少なくとも2つのプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分の長さが、前記プローブの全長の約1%~約42%に相当し、かつ、
前記プローブが異なる長さの第2のプローブ部分を有する
前記少なくとも2つのプローブを含んでなる、プローブセット。
【請求項3】
前記標的核酸の第1のヌクレオチド部分が、第1の融合パートナーをコードする融合遺伝子もしくは転写産物、または1つのエクソンをコードするエクソンスキッピング転写産物であり、かつ
前記標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分が、第2の融合パートナーをコードする融合遺伝子もしくは転写産物、または第2のエクソンをコードするエクソンスキッピング転写産物である、
請求項1または2に記載のプローブセット。
【請求項4】
前記第2のプローブ部分の長さが、前記プローブの全長の約1%、9%、17%、25%、33%または42%に相当する、請求項1~3のいずれか一項に記載のプローブセット。
【請求項5】
第1の融合パートナーをコードする融合遺伝子もしくは転写産物、または
1つのエクソンをコードするエクソンスキッピング転写産物
である標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
第2の融合パートナーをコードする融合遺伝子もしくは転写産物、または
第2のエクソンをコードするエクソンスキッピング転写産物
である標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を含むプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ
前記第2のプローブ部分が1~約50塩基対(bp)の長さであり、前記プローブの全長が約120bpである
前記プローブ。
【請求項6】
前記第2のプローブ部分の長さが、約10bp、約20bp、約30bp、約40bpまたは約50bpを有する、請求項5に記載のプローブ。
【請求項7】
前記標的核酸の第1のヌクレオチド部分が、キナーゼ分子である第1の融合パートナーであり、前記標的核酸の第2のヌクレオチド部分が、非キナーゼ分子である第2の融合パートナーである、請求項1~4のいずれか一項に記載のプローブセット、または請求項5もしくは6に記載のプローブ。
【請求項8】
請求項1~4のいずれか一項に記載のプローブセットまたは請求項5もしくは6に記載の少なくとも1つのプローブを含む、キット。
【請求項9】
請求項1~4のいずれか一項に記載のプローブセットまたは請求項5もしくは6に記載の少なくとも1つのプローブを含む、組成物。
【請求項10】
サンプル中の融合遺伝子および/またはエクソンスキッピングを検出するための方法であって、請求項1~4のいずれか一項に記載のプローブセットまたは請求項5もしくは6に記載の少なくとも1つのプローブと前記標的核酸の相補的な部分とをハイブリダイズさせる工程を含む、前記方法。
【請求項11】
請求項10に記載の融合遺伝子および/またはエクソンスキッピングを検出する方法であって:
a)核酸を含むサンプル材料を提供する工程;
b)核酸配列決定ライブラリを準備する工程;
c)請求項1~4のいずれか一項に記載のプローブセットまたは請求項5もしくは6に記載の少なくとも1つのプローブをハイブリダイズさせる工程;
d)核酸を増幅する工程;
e)核酸の配列を決定する工程;および
f)工程e)で得られた核酸配列を分析する工程
を含む標的捕捉を伴う標的DNA配列決定またはRNA配列決定である、前記方法。
【請求項12】
前記サンプルが、疾患、好ましくは癌である疾患に罹患している、または罹患していることが疑われる対象から得られる、請求項11または12に記載の融合遺伝子および/またはエクソンスキッピングを検出する方法。
【請求項13】
癌を診断またはモニターする方法であって、請求項1~4のいずれか一項に記載のプローブセットまたは請求項5もしくは6に記載の少なくとも1つのプローブと、サンプル中に存在する標的核酸の相補的部分とをハイブリダイズさせる工程を含み、標的融合遺伝子および/またはエクソンスキッピング等の前記標的核酸の検出が癌の存在を示す、前記方法。
【請求項14】
融合遺伝子および/またはエクソンスキッピング、好ましくは癌中に存在する融合遺伝子および/またはエクソンスキッピングを検出する方法における、請求項1~4のいずれか一項に記載のプローブセットまたは請求項5もしくは6に記載の少なくとも1つのプローブの使用。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、融合遺伝子検出、特に、遺伝子融合イベントを検出するためのプローブの分野、融合遺伝子を検出する方法、それに関連する使用およびキットに関する。特に、本発明は、癌を診断および/またはモニターする方法に関する。
【背景技術】
【0002】
融合遺伝子は、診断の指針となり、予後の情報を提供し、かつ治療の決定をサポートする重要な臨床バイオマーカーである。融合遺伝子は、転座、逆位および欠失等の染色体再編成によりもたらされ、キメラRNAやタンパク質をもたらす場合がある。融合遺伝子は、通常、例えばキナーゼ遺伝子であり得る第1の融合パートナーと、第2の融合パートナーの2つのパートナーを含む。
【0003】
融合遺伝子は、蛍光in situハイブリダイゼーション(FISH)、逆転写ポリメラーゼ連鎖反応(RT-PCR)、免疫組織化学(IHC)、次世代シーケンシング(NGS)ベースの技術等の多様な分子アッセイによって検出することができる。
【0004】
FISHは、蛍光顕微鏡による可視化を可能にする特定の核酸配列にハイブリダイズする蛍光色素分子を含む核酸プローブに依存している。RT-PCRでは、既知の融合遺伝子転写産物を標的にしてPCRによって増幅するように設計された特定のプライマーセットが用いられる。IHCでは、融合タンパク質と特異的に結合する抗体を用いて融合を検出し、顕微鏡で検出する。これらの技術は臨床において広く用いられているが、スループットが低いという特徴があり、既知のパートナー間の融合イベントの検出に限定されていた。
【0005】
対照的に、NGSベースの技術では、複数の患者における複数の遺伝子融合イベントを包括的かつ並行して検出することができる。この技術にはいくつかのバリエーションがあり、それぞれが異なるライブラリ調製方法に基づいている。マルチプレックスPCR(mPCR)は、スループットがより高いRT-PCRのバージョンであり、遺伝子特異的プライマーのプールを用いてさまざまな融合遺伝子が検出され、次いでPCR産物がNGSライブラリに変換されて配列が決定される。この技術は、比較的高速であるという利点があるが、両方の融合パートナーが既知である必要がある。mPCRと類似しているが、遺伝子特異的プライマーと一般的なプライマーとが組み合わせて用いられるアンカーマルチプレックスPCR(AMP)では、この制限が部分的に解消され、特定の既知の融合パートナーの新規融合イベントの検出が可能となる。しかしながら、AMPおよびmPCRはいずれも、標的外(off-target)のプライマー結合やプライマーの二量体化等の、PCRに固有の技術的制限の影響を受け、これはパネルサイズの増大に伴い増大する(Heyer and Blackburn, 2020 Bioessays 42(7):e2000016)。
【0006】
現在、アンプリコンまたはPCRベースの技術に代わるものは、全ゲノム配列決定(WGS)およびRNA配列決定(RNA-seq)である。これらの技術により、既知および新規の融合を含む、完全なゲノムまたはトランスクリプトーム(それぞれ)について偏りのない特性評価が可能となる。しかしながら、このタイプのゲノムワイドなアプローチはコストが大きいため、これらの技術はまだ臨床応用にはほとんど用いられていない。ハイブリダイゼーション捕捉ベースのNGS(hybridization capture-based NGS)により、配列決定の前にWGSまたはRNA-seqのライブラリが標的濃縮工程に供される、費用対効果の高い代替手段が提供される。この工程では、既知および新規の両方の融合イベントの検出が可能になる一方で、配列決定される領域が制限される(Hrdlickova et al., 2017, Wiley Interdiscip Rev RNA 2017, 8:e1364;上述したHeyer and Blackburn, 2020)。
【0007】
ハイブリダイゼーション捕捉ベースのNGSは、RNA-seqライブラリを用いた融合検出で特に興味深い。この技術では、RNA分子がcDNAに変換され、次いでシーケンシングアダプターにライゲーションされ、増幅されて全トランスクリプトームライブラリが生成される。これらのライブラリは、目的の配列を標的にして単離するように設計された生化学的部分(通常はビオチン)に結合されたプローブを用いたハイブリダイゼーション捕捉に供され、続いて増幅および配列決定される(Mercer et al., 2014, Nat Protoc. 9(5):989-1009;上述したHeyer and Blackburn, 2020)。
【0008】
したがって、ハイブリダイゼーション捕捉を成功させるための重要な工程は、プローブの設計である。プローブの設計について様々な例が知られており、EP3647420A1では、プローブが、潜在的な接合点で互いに連結されている5’側の遺伝子Aの一部と3’側の遺伝子Bの一部とを含む融合遺伝子の転写産物から調製されるcDNAの遺伝子AまたはBのいずれかに由来する領域とハイブリダイズするプローブの設計が記載されている。正確なプローブの設計により、目的の標的のみが捕捉されることが保証される。融合遺伝子の検出では、プローブの設計が融合パートナーおよび切断点に依存し、それらは常に既知であるとは限らず医学的応用ごとに大きく異なるため、これは特に困難な作業である。さらに、融合プローブの設計の重要な制限は、診断上関心がない野生型(WT)パートナー遺伝子からの過度の読み取りを捕捉することなく、新規および既知の融合を同様に検出するためにどのようにプローブを配置するかという点にある。
【0009】
遺伝子融合イベントの検出に適したプローブは、既知のパートナー(以下、第1のパートナー)と相同であるように設計することができ、これによりパートナーのその領域を含むほぼすべての融合の検出が可能になる(以下、ユニバーサルプローブ)。あるいは、プローブは、既知の融合を濃縮するために、切断点を横断して、第1および第2の融合パートナーの両方と重複して設計することもできる(以下、特異的プローブ)。ユニバーサルプローブの設計は、プローブの設計の最も一般的な形式であるが、特異性が低く、低発現の融合を検出するためにより深い配列決定が必要になる場合がある。したがって、関連する既知の融合の最適な検出を保証するために、アプローチは、特定の融合/切断点に固有のプローブも設計することである。しかしながら、このアプローチでは、配列読み取りを最適化するために、慎重な設計バランスが必要である。
【0010】
したがって、WT(野生型)の第2の融合パートナーの対応物の捕捉を制限しながら、既知および新規の融合遺伝子パートナーを同時に捕捉および検出するためのプローブおよびプローブセットを改良する必要がある。
【発明の概要】
【0011】
本発明は、プローブの設計を最適化して特定の既知の融合を検出し、WTの第2の融合パートナー対応物の捕捉を最小限に抑えることができるという知見に基づくものである。この設計により、特定の融合の第2のパートナーのWTの対応物の捕捉が低減し、融合の検出が可能になる一方で、融合の検出に関連しない配列読み取りの発生が最小限に抑制され、したがってより多くの融合を並行して検出するか、またはNGS実行ごとの患者のより高度な多重化をする余地が残される。
【0012】
本発明は、特に、ユニバーサルプローブおよび特異的プローブを含む、いわゆる低重複プローブの設計に関する。プローブは、第2のパートナーと重複する融合切断点領域の後の塩基対の数によって定義され、すべてのプローブが120bpの一定の全長(すなわち、100%プローブ長)である。ユニバーサルプローブ(または0bpプローブ)は、第2の融合パートナーと重複せず、切断点の端までの第1のパートナーのみを網羅する。特異的プローブは、第1の融合パートナーで開始し、第2の融合パートナーと重複し、融合切断点を超えて最大10bp、20bp、30bp、40bpまたは50bp(すなわち、全長プローブの9%、17%、25%、33%または42%)である(
図1B)。これらの低重複プローブは、標的の融合遺伝子に起因する第2のパートナーの読み取りを捕捉し(
図2A、3A 対
図2B~Dおよび
図3B~D)、WTの対応物に由来する読み取りの捕捉を回避する。
【0013】
特に、本発明はさらに、第2の融合パートナーに対して最大で10bp、20bp、30bpおよび40bpの重複を有するユニバーサルプローブおよび特定の低重複プローブの混合物に関する。実施例2および3に示されるように、この重複プローブの混合物は、0bpまたは50bpのプローブ単独よりも多くの融合断片を捕捉することができる。低重複プローブの混合物によってのみ、高重複プローブを用いて得られる読み取りと比較して、WTの第2のパートナーの読み取りの低減が可能となる。
【0014】
特に、本発明はさらに、ユニバーサルプローブおよび第2の融合パートナーに対して最大で10bp、20bp、30bp、40bpおよび50bpの重複を有する特定の低重複プローブの混合物、ならびにユニバーサルプローブおよび第2の融合パートナーに対して最大で50bpの重複を有する特定の低重複プローブの混合物に関する。これらの低重複プローブの混合物は、0bpプローブ単独と同じかそれ以上の数の融合フラグメントを捕捉するが、実施例4に示すように、対象となる融合に応じて多少の変動がある。しかしながら、低重複プローブの混合物によってのみ、高重複プローブを用いて得られる読み取りと比較して、WTの第2のパートナーの読み取りの低減が可能となる。
【0015】
一つの実施形態において、
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を有する少なくとも1つのプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分の長さが、前記プローブの全長の約1%~約42%に相当する
前記少なくとも1つのプローブ、および
前記標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1つのさらなるプローブであって、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複しない前記さらなるプローブ
を含んでなる、プローブセット。
【0016】
一つの実施形態において、
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を有する少なくとも2つのプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分の長さが、前記プローブの全長の約1%~約42%に相当し、かつ、
前記プローブが異なる長さの第2のプローブ部分を有する
前記少なくとも2つのプローブを含んでなるプローブセットが提供される。
【0017】
一つの実施形態において、
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分、
を含むプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分の長さが、前記プローブの全長の約1%~約42%に相当する
プローブが提供される。
【0018】
一つの実施形態において、本発明のプローブまたはプローブセットであって、第2のプローブ部分の長さが、プローブの全長の約1%、9%、17%、25%、33%または42%に相当するプローブまたはプローブセットが提供される。
【0019】
一つの実施形態において、第1のプローブ部分は、第1の融合パートナーをコードする融合遺伝子もしくは転写産物、または1つのエクソンをコードするエクソンスキッピング転写産物から選択される標的核酸の第1のヌクレオチド部分に相補的であり、かつ、第2のプローブ部分は、第2の融合パートナーをコードする融合遺伝子もしくは転写産物、または第2のエクソンをコードするエクソンスキッピング転写産物から選択される標的核酸の第2のヌクレオチド部分に相補的である。
【0020】
特定の態様によれば、標的核酸の第1のヌクレオチド部分は、キナーゼ分子である第1の融合パートナーであり、標的核酸の第2のヌクレオチド部分は、非キナーゼ分子である第2の融合パートナーである。
【0021】
特定の態様によれば、本発明のプローブは、融合遺伝子、したがってDNA分子の捕捉および検出に適している。特定の態様によれば、本発明のプローブは、融合遺伝子の転写産物および/またはエクソンスキッピング転写産物、したがってRNA分子の捕捉および検出に適している。
【0022】
特定の態様によれば、本発明のプローブは、既知または新規の融合遺伝子パートナーの捕捉および検出に適している。
【0023】
特定の態様によれば、本発明のプローブは、少なくとも1つの融合遺伝子および/またはエクソンスキッピングの捕捉および検出に適している。
【0024】
特定の態様によれば、本発明は、本発明の少なくとも1つのプローブまたはプローブセットを含むキットを提供する。
【0025】
特定の態様によれば、本発明は、本発明の少なくとも1つのプローブまたはプローブセットを含む組成物を提供する。
【0026】
特定の態様によれば、本発明は、標的濃縮DNA配列決定またはRNA配列決定で用いるための少なくとも1つのプローブまたはプローブセットを提供する。
【0027】
特定の態様によれば、本発明は、本発明の少なくとも1つのプローブまたはプローブセットと標的核酸の相補的部分とをハイブリダイズさせる工程を含む、サンプル中の遺伝子融合および/またはエクソンスキッピングの検出方法を提供する。
【0028】
特定の態様によれば、本発明は、標的捕捉による標的DNA配列決定またはRNA配列決定(すなわち、ハイブリダイゼーション捕捉ベースの標的配列決定)の方法であって:
a)核酸を含むサンプル材料を提供する工程;
b)核酸配列決定ライブラリを準備する工程;
c)本発明の少なくとも1つのプローブまたはプローブセットを標的核酸にハイブリダイズさせる工程;
d)核酸を増幅する工程;
e)核酸の配列を決定する工程;および
f)工程e)で得られた核酸配列を分析する工程
を含む方法を提供する。
【0029】
特定の態様によれば、本発明は、本発明の少なくとも1つのプローブまたは本発明のプローブセットと、サンプル中に存在する標的核酸の相補的部分とをハイブリダイズさせる工程を含む、癌を診断またはモニターする方法を提供する。
【0030】
特定の態様によれば、本発明は、癌を診断またはモニターする方法であって、発癌性融合遺伝子および/またはエクソンスキッピングの存在が患者サンプルで検出される場合、それにより癌の存在が示される方法を提供する。
【0031】
特定の態様によれば、本発明は、融合遺伝子および/またはエクソンスキッピング、好ましくは癌中に存在する融合遺伝子を検出する方法における、本発明の少なくとも1つのプローブまたはプローブセットの使用を提供する。
【図面の簡単な説明】
【0032】
【
図1】
図1は、ユニバーサルプローブ(第2の融合パートナーと重複しないプローブ;本明細書では0bpと呼ぶ)、および特異的プローブ(第2の融合パートナーと重複するプローブ)の設計例を示し、すべてのプローブは120bpの一定の全長を有する。A)は、プローブが第2の融合パートナーと最大で60bpまたは90bp重複する高重複プローブデザインを示す。パネルA)はまた、実施例2および3で用いられるような、高重複プローブ(60bpおよび90bp)と低重複プローブ(30bp)との混合を示す。B)は、プローブが第2の融合パートナーと10bp、20bp、30bp、40bpまたは50bp重複する本発明の低重複プローブの設計を示す。
【
図2】
図2は、実施例2に従って、低重複プローブ(B~D)について検出されたものと比較して、高重複プローブ(A)について検出された融合切断点(0bp位置)に対して開始するFGFR3-TACC3融合フラグメントのヒートマップを示す。B)0bpプローブ;C)50bpプローブ、およびD)0bp、10bp、20bp、30bpおよび40bpプローブの混合物。プロットB~Dの左側の数字は、融合をサポートする切断点領域を含むユニークな分子の数を表し(300万のフラグメント入力を考慮)、プロットの右側のパーセンテージは、領域内のユニークな分子の合計との比較における、融合をサポートするユニークな分子のパーセンテージを表す。
【
図3】
図3は、実施例3に従って、低重複プローブ(B~D)について検出されたものと比較して、高重複プローブ(A)について検出された融合切断点(0bp位置)に対して開始するPAX8-PPARG融合フラグメントのヒートマップを示す。B)0bpプローブ;C)50bpプローブ、およびD)0bp、10bp、20bp、30bpおよび40bpプローブの混合物。プロットB~Dの左側の数字は、融合をサポートする切断点領域を含むユニークな分子の数を表し(300万のフラグメント入力を考慮)、プロットの右側のパーセンテージは、領域内のユニークな分子の合計との比較における、融合をサポートするユニークな分子のパーセンテージを表す。
【
図4】バープロットは、臨床サンプル(S1、S2、S3)、および実施例4に記載される参照サンプル(RS:Seraseq(登録商標) FFPE Tumor Fusion RNA v2)におけるさまざまな融合について、低重複プローブ設計(0bpもしくは0+50bp、または混合(0bp+10bp+20bp+30bp+40bp+50bp))により捕捉された切断点(1000で除算)にまたがるフラグメントの数を示す。検出された融合フラグメントの数とともに、条件0bpにおける融合フラグメントの数、0bpとの比較における条件0+50bpでの融合フラグメントの倍率変化、0bpとの比較における「混合」条件での融合フラグメントの倍率変化(それぞれのバーの上に記載)。
【発明を実施するための形態】
【0033】
「核酸分子」は、RNA(リボ核酸)、DNA(デオキシリボ核酸)、LNA(ロック核酸(locked nucleic acid))、PNA(ペプチド核酸)、cDNA(相補的DNA)等の既知の核酸分子から選択される。
【0034】
「融合遺伝子」または「遺伝子融合」または「融合核酸分子」または「ハイブリッド遺伝子」または「キメラ遺伝子」または「キメラ転写産物」という用語は、元々独立していた2つ以上の遺伝子から形成される遺伝子を指し、第1の遺伝子の全体またはフラグメントと、第2の遺伝子および/または後続の遺伝子の全体またはフラグメントとを含む。通常、融合遺伝子は、(i)しばしばキナーゼ遺伝子である第1の融合パートナーまたは遺伝子、および(ii)第2の融合パートナーまたは遺伝子の2つのパートナーを含む。融合遺伝子は、転座、逆位、欠失等の染色体再編成によってもたらされ、キメラRNAおよびキメラタンパク質をもたらす場合がある。融合遺伝子は、ヒトにおけるすべての主要なタイプの腫瘍(すなわち、良性、潜在的に悪性または悪性(癌))において発見されている。融合遺伝子は、診断の指針となり、予後の情報を提供し、かつ治療の決定をサポートする重要な臨床バイオマーカーである。
【0035】
「切断点」という用語は、ゲノムの再編成またはスプライシングのいずれかの結果として、2つの遠位ゲノム領域が一つになる、染色体または転写産物におけるヌクレオチド位置を指す。さらに、「切断点」という用語は、融合遺伝子または転写産物の第1および第2の融合パートナーの間や、エクソンスキッピング転写産物の第1のエクソンおよび第2のエクソンの間等の、標的核酸の第1および第2のヌクレオチド部分の間の点を指す(エクソンジャンクションとも呼ばれる)。
【0036】
したがって、融合遺伝子または転写産物の第1および第2の融合パートナーや、エクソンスキッピング転写産物の第1のエクソンおよび第2のエクソン等の、標的核酸の第1および第2のヌクレオチド部分が、切断点によって定義および分離される。標的核酸の第2のヌクレオチド部分が切断点から始まることが理解される。多くの場合、標的核酸の第1のヌクレオチド部分は切断点の3’として定義することができ、3’パートナーと呼ばれることがある。また、多くの場合、標的核酸の第2のヌクレオチド部分は切断点の5’にあってもよく、5’パートナーと呼ばれることがある。
【0037】
「融合」または「融合分子」という用語は、遺伝子、遺伝子産物(cDNA、mRNAまたはポリペプチド)、および第1の融合遺伝子またはパートナーの全体または断片、および第2の融合遺伝子またはパートナーの全体または断片を含むそれらの変異体等の任意の融合分子を包含する。
【0038】
「既知の融合」または「既知の遺伝子融合」または「既知の融合遺伝子」という用語は、第1の遺伝子の全体または断片(第1の融合パートナー)および第2の遺伝子の全体または断片(第2の融合パートナー)が既知である融合遺伝子を指す。遺伝子融合を分類し、癌におけるそれらの役割を説明する継続的な努力がなされており、例えば、COSMIC:癌における体細胞変異のカタログ(Tate et al, 2019, COSMIC: the Catalogue Of Somatic Mutations In Cancer. Nucleic Acids Res. 47(D1):D941-D947; http://cancer.sanger.ac.uk/census)、Mitelman Database of Chromosome Aberrations and Gene Fusions in Cancer(https://mitelmandatabase.isb-cgc.org/)およびChimerDB(Jang et al., 2020, ChimerDB 4.0: an updated and expanded database of fusion genes. Nucleic Acids Res. 48(D1):D817-D824; http://www.kobic.re.kr/chimerdb/)がある。
【0039】
融合遺伝子を記述する従来の命名法が本明細書で用いられ、例えば、以下が含まれる:例えば、FGFR3-TACC3等の融合遺伝子の略語(5’-3’)であり、FGFR3は線維芽細胞増殖因子受容体3(Fibroblast Growth Factor Receptor 3)の略語であり、第1の融合遺伝子であり、TACC3はトランスフォーミング酸性コイルドコイル含有タンパク質3(Transforming acidic coiled-coil-containing protein 3)の略語であり、第2の融合遺伝子であり、あるいはPAX8-PPARGにおいて、PAX8はペアボックス遺伝子8(paired box gene 8)の略語であり、第2の融合遺伝子であり、PPARGはペルオキシソーム増殖因子活性化受容体γ(Peroxisome Proliferator Activated Receptor Gamma)の略語であり、第1の融合遺伝子であり、あるいは、例えば、関連する転写産物およびエクソンを含む融合遺伝子の略語(5’-3’)である。例えば、FGFR3:BAIAP2L1(NM_000142:e17:NM_018842:e2)融合は、エクソン2から始まる3’パートナーBAIAP2L1転写産物NM_018842と融合したエクソン17までの5’FGFR3転写産物NM_00142を含む。
【0040】
「未知の融合」または「新規の融合」または「パートナー不可知融合(partner agnostic fusion)」または「未知融合遺伝子」または「新規融合遺伝子」または「パートナー不可知遺伝子融合(partner agnostic gene fusion)」という用語は、新規融合遺伝子または第2の遺伝子パートナーまたはアイソフォームがまだ特定されていない融合遺伝子を指す。
【0041】
「キナーゼ」または「キナーゼ分子」という用語は、高エネルギーリン酸含有分子(ATP等)から基質へのリン酸基の転移を触媒する酵素群を指す。キナーゼ酵素としては、タンパク質キナーゼ(サイクリン依存性キナーゼ(CDK)、分裂促進因子活性化タンパク質キナーゼ(MAPK)等)、脂質キナーゼ(ホスファチジルイノシトールキナーゼ、スフィンゴシンキナーゼ(SK)等)、炭水化物キナーゼ(ヘキソキナーゼ、ホスホフルクトキナーゼ(PFK)等)、ヌクレオチド(DNAおよびRNA)に作用するキナーゼ、これらのキナーゼの基質である他の小分子に作用するキナーゼ(例えば、クレアチン、ホスホグリセレート、リボフラビン、ジヒドロキシアセトン、シキミ酸等)が挙げられる。「キナーゼ遺伝子」または「キナーゼ転写産物」という用語は、キナーゼ分子をコードする遺伝子または転写産物の群を指す。
【0042】
「非キナーゼ」または「非キナーゼ遺伝子」または「非キナーゼ転写産物」という用語は、キナーゼタンパク質をコードしない遺伝子または転写産物の群を指す。
【0043】
「エクソンスキッピング」という用語は、メッセンジャーRNAから1つ以上の連続するエクソンを細胞に排除させるRNAスプライシングの形態を指す。「エクソン」とは、遺伝子のヌクレオチド配列のうち、成熟転写産物のヌクレオチド配列に残る領域を指す。エクソンスキッピングは、欠失、変異によって引き起こされるか、またはスプライシング調節の結果として発生し得ると理解されている。核酸分子中に存在する、スキップされたエクソンに隣接し含まれるエクソンは、本明細書に開示されるプローブおよび原理を用いて検出することができる。
【0044】
「RNA配列決定」または「RNAseq」または「RNA-seq」または「トランスクリプトームプロファイリング」または「RNAハイスループット配列決定」または「大規模並行RNA配列決定」または「cDNAの次世代配列決定」という用語は、次世代配列決定(NGS)を用いて、細胞のトランスクリプトームを分析することにより、特定の時点における生物学的サンプル中のRNAの存在および量を明らかにする配列決定技術を指す。
【0045】
「標的RNA配列決定」または「標的RNA-seq」という用語は、例えば標的捕捉またはアンプリコンベースのアプローチ(アンプリコン配列決定)によって行うことができる、特定の標的濃縮と組み合わされたRNA配列を指す。この方法により、目的の特定の転写産物の選択および配列決定をすることができる(すなわち、目的のRNA転写産物または濃縮物を濃縮する)。同様に、「標的DNA配列決定」または「標的DNA-seq」という用語は、例えば標的捕捉またはアンプリコンベースのアプローチ(アンプリコン配列決定)によって行うことができる、特定の標的濃縮と組み合わされたDNA配列決定を指す。
【0046】
「標的捕捉による標的RNA-seq/DNA-seq」または「(RNA/DNA)CaptureSeq」または「ハイブリダイゼーション捕捉(配列決定)」または「標的捕捉方法」または「NGSのためのハイブリダイゼーション捕捉ベースの標的濃縮」という用語は、ハイブリダイゼーション捕捉の工程を含む濃縮技術を指す。この技術では、目的の配列が分離されるように特別に設計され、生化学的部分(通常はビオチン)に結合されたプローブを用いて、RNAまたはDNAの配列決定ライブラリをハイブリダイゼーション捕捉にかける。次いで、これらのターゲットが濃縮されたライブラリを増幅させ、配列を決定する。
【0047】
「プローブ」または「ベイト」または「(プローブ)核酸分子」または「捕捉プローブ」または「(DNA/RNA)オリゴヌクレオチド(捕捉)プローブ」という用語は、標的核酸分子にハイブリダイズすることができる核酸分子を指す。融合遺伝子およびエクソンスキッピングの検出の文脈において、プローブは、融合遺伝子/転写産物および/またはエクソンスキッピングから生じる転写産物の核酸分子にハイブリダイズまたはアニーリングすることができる。プローブが第1の融合遺伝子(パートナー)の核酸分子のみにハイブリダイズ/アニーリングしている場合、その遺伝子が関与する任意の融合の検出が可能になり、そのようなプローブは本明細書ではユニバーサルプローブと呼ばれる。プローブが第1の融合遺伝子(パートナー)の核酸分子にハイブリダイズ/アニーリングし、切断点を超えて第2の融合遺伝子(パートナー)に入る場合、既知の融合遺伝子の検出が可能になり、そのようなプローブは本明細書では特異的プローブと呼ばれる。
【0048】
「標的核酸」という用語は、本発明のプローブによって捕捉され得る遺伝子または転写産物内の核酸領域を指し;例えば、融合遺伝子を形成する可能性のある遺伝子や、エクソンスキッピングが発生する可能性のある転写産物である。
【0049】
プローブ
一つの実施形態において、
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を含むプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分の長さが、前記プローブの全長の約1%~約42%に相当する
プローブが提供される
【0050】
第2のプローブ部分の長さがプローブの全長の約1%~約42%に相当することは、第2のプローブ部分と標的核酸の第2の部分とが、プローブの全長のそのパーセンテージで重複することを意味すると理解される。
【0051】
プローブは、標的核酸の第1のヌクレオチド部分に相補的なプローブ部分、および標的核酸の第2のヌクレオチド部分に相補的な別のプローブ部分を含み得ることが理解される。
【0052】
標的核酸の第1および第2のヌクレオチド部分に相補的なプローブは特異的プローブであり、例えば既知の融合遺伝子またはエクソンスキッピングの検出を可能にすることが理解される。
【0053】
一つの実施形態において、標的核酸は融合遺伝子または転写産物であり、前記標的核酸の第1のヌクレオチド部分は第1の融合パートナーをコードする融合遺伝子または転写産物であり、前記標的核酸の第2のヌクレオチド部分は第2の融合パートナーをコードする融合遺伝子または転写産物である。
【0054】
一つの実施形態において、標的核酸はエクソンスキッピング転写産物であり、前記標的核酸の第1のヌクレオチド部分は、第1のエクソンをコードするエクソンスキッピング転写産物であり、前記標的核酸の第2のヌクレオチド部分は、第2のエクソンをコードするエクソンスキッピング転写産物である。
【0055】
一つの実施形態において、標的核酸は、DNA、RNAおよびcDNAから選択される。
【0056】
一つの実施形態において、
第1の融合パートナーをコードする融合遺伝子もしくは転写産物、または
1つのエクソンをコードするエクソンスキッピング転写産物
である標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
第2の融合パートナーをコードする融合遺伝子もしくは転写産物、または
第2のエクソンをコードするエクソンスキッピング転写産物
である標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を含むプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ
前記第2のプローブ部分の長さが、前記プローブの全長の約1%~約42%に相当する
プローブが提供される。
【0057】
プローブ全長のパーセンテージとして表される、標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分のヌクレオチド長は、限定されないが、例えば、1%以上、9%以上、17%以上、25%以上、33%以上、約42%以上であり、約42%以下;約1%、9%以下、17%以下、25%以下、33%以下、42%以下であり;例えば、1%~42%、1%~33%、1%~25%、1%~17%、1%~9%等である。好ましくは、プローブ全長のパーセンテージとして表される第2のプローブ部分の長さは、約1%、9%、17%、25%、33%および42%から選択される。
【0058】
一つの実施形態において、
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を含むプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分が1~約50塩基対(bp)の長さであり、前記プローブの全長が約120bpである
プローブが提供される。
【0059】
一つの実施形態において、
第1の融合パートナーをコードする融合遺伝子もしくは転写産物、または
1つのエクソンをコードするエクソンスキッピング転写産物
である標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
第2の融合パートナーをコードする融合遺伝子もしくは転写産物、または
第2のエクソンをコードするエクソンスキッピング転写産物
である標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を含むプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分が1~約50塩基対(bp)の長さであり、前記プローブの全長が約120bpである
プローブが提供される。
【0060】
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分のヌクレオチド長は、限定されないが、例えば、1以上、10以上、20以上、30以上、40以上、約50であり、約50以下;10以下、20以下、30以下、40以下、50以下であり;例えば、10~50、10~40、10~30、10~20である。好ましくは、標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分のヌクレオチド長は、約10、20、30、40および50である。
【0061】
プローブの合計のヌクレオチド長は、限定されないが、例えば、20以上、40以上、60以上、80以上、100以上、110以上、または115以上であり、220以下、200以下、180以下、160以下、140以下、130以下、または125以下であり;例えば、20~220、60~180、100~140、110~130、115~125または120である。好ましくは、プローブのヌクレオチド長は約120である。
【0062】
一つの実施形態において、標的核酸の第1のヌクレオチド部分のみと相補的なプローブであって、標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複しないプローブが提供される。この実施形態において、第2のプローブ部分は存在しない。この実施形態において、第2のプローブ部分は0bp(0bpプローブ)である。このプローブはユニバーサルプローブであり、未知の融合遺伝子の検出が可能であることが理解される。
【0063】
ユニバーサルプローブのヌクレオチド長は、限定されないが、例えば、20以上、40以上、60以上、80以上、100以上、110以上または115以上であり;220以下、200以下、180以下、160以下、140以下、130以下または125以下であり;例えば、20~220、60~180、100~140、110~130、115~125または120である。好ましくは、プローブのヌクレオチド長は120である。
【0064】
本発明によれば、標的核酸の第1のヌクレオチド部分にのみ相補的なプローブ(ユニバーサルプローブ、または0bpプローブ)、および長さ1~約50bpの第2のプローブ部分を含む本発明のプローブが本明細書における低重複プローブとして言及される。50bpを超える長さの第2のプローブ部分を含むプローブは、本明細書では高重複プローブと呼ばれる。本発明の低重複プローブの設計および高重複プローブの設計は、実施例1に記載され、
図1に示されている。
【0065】
一つの実施形態において、
第1の融合パートナーをコードする融合遺伝子または転写産物と相補的な第1のプローブ部分であって、前記第1の融合パートナーが好ましくはキナーゼ分子である第1のプローブ部分、および
第2の融合パートナーをコードする融合遺伝子または転写産物に相補的な第2のプローブ部分であって、前記第2の融合パートナーが好ましくは非キナーゼ分子である第2のプローブ部分
を含むプローブであって、
前記プローブが、本明細書に記載の発明における第1の融合パートナーと第2の融合パートナーとの間の切断点と重複する
プローブが提供される。
【0066】
一つの実施形態において、第1の融合パートナーをコードする融合遺伝子または転写産物に相補的な第1のプローブ部分を含む本発明のプローブであって、前記第1の融合パートナーがキナーゼ分子であるプローブが提供される。そのようなキナーゼ分子には、任意の既知のキナーゼが含まれることが理解される。キナーゼの例としては、限定されないが、タンパク質キナーゼ(CDK、MAPK等)、脂質キナーゼ(ホスファチジルイノシトールキナーゼ、SK等)、炭水化物キナーゼ(ヘキソキナーゼ、PFK等)、ヌクレオチド(DNAおよびRNA)に作用するキナーゼ、および他の小分子に作用するキナーゼが挙げられる。好ましくは、キナーゼはチロシンキナーゼおよびセリン/スレオニンキナーゼである。特定のキナーゼの例としては、限定されないが、ALK、RET、ROS、MET、BRAF、NTRK等が挙げられる。
【0067】
一つの実施形態において、第2の融合パートナーをコードする融合遺伝子または転写産物に相補的な第2のプローブ部分を含む本発明のプローブであって、前記第2の融合パートナーが非キナーゼ分子であるプローブが提供される。そのような非キナーゼ分子には、任意の既知の非キナーゼ分子が含まれることが理解される。非キナーゼの例としては、限定されないが、EML4、CD74、ETV6、TACC3、LMNA、SLC34A2等が挙げられる。
【0068】
表1は、本発明のプローブによって捕捉および検出することができる融合遺伝子の例を示す。
【表1】
【0069】
一つの実施形態において、本発明のプローブは、DNAまたはRNAから作製され、好ましくはDNAから作製される。
【0070】
プローブの説明において、用語「相補的」および「相同」は交換可能に用いられる。
【0071】
一つの実施形態において、以下のヌクレオチド配列のいずれかを含む本発明のプローブが提供される:(a)標的核酸の第1および/または第2のヌクレオチド部分に相補的な少なくとも20個、40個、60個、80個、100個、110個、115個または120個の連続するヌクレオチドを含むヌクレオチド配列;(b)(a)のヌクレオチド配列において、1つ以上のヌクレオチドが付加、欠失および/または置換されたヌクレオチド配列;(c)ヌクレオチド配列(a)に対して、例えば、70%以上、80%以上、90%以上、95%以上、97%以上、98%以上または99%以上の同一性を有するヌクレオチド配列;および(d)標的核酸の第1および/または第2のヌクレオチド部分とストリンジェントな条件下でハイブリダイズする少なくとも20個、40個、60個、80個、100個、110個、115個または120個の連続するヌクレオチドを有する核酸であるヌクレオチド配列。
【0072】
一つの実施形態において、本発明のプローブは、目的の遺伝子融合(DNA)または転写産物(RNA)を濃縮(すなわち捕捉)する。
【0073】
一つの実施形態において、本発明のプローブは、エクソンスキッピングおよび/または融合遺伝子の捕捉および検出に適している。
【0074】
一つの実施形態において、本発明のプローブは、2つを超えるパートナーを含む融合遺伝子の捕捉および検出に適している。
【0075】
別の実施形態において、本発明のプローブは、ビオチン、磁気ビーズ、フルオロフォア、放射性同位元素、ナノ粒子等の検出可能な標識に連結される。そのようなプローブは、標的濃縮法に用いられ得ることが理解される。
【0076】
別の実施形態において、本発明のプローブは、DNAマイクロアレイ、cDNAマイクロアレイ、SNPマイクロアレイ等のマイクロアレイと関連付けられる。そのようなプローブは、ハイブリッド捕捉反応に用いられ得ることが理解される。
【0077】
別の実施形態において、本発明のプローブは、配列番号1~75から選択される配列を有する。
【0078】
一つの実施形態において、配列番号4、配列番号13、配列番号19および配列番号20~26から選択されるユニバーサルプローブが提供される。
【0079】
一つの実施形態において、第2のプローブ部分の長さが10bpであり、プローブの全長が120bpであり、配列番号6、配列番号15および配列番号37~46から選択される本発明のプローブが提供される。
【0080】
一つの実施形態において、第2のプローブ部分の長さが20bpであり、プローブの全長が120bpであり、配列番号7、配列番号16および配列番号47~56から選択されるプローブが提供される。
【0081】
一つの実施形態において、第2のプローブ部分の長さが30bpであり、プローブの全長が120bpであり、配列番号1、配列番号8、配列番号12、配列番号17および配列番号57~66から選択される本発明のプローブが提供される。
【0082】
一つの実施形態において、第2のプローブ部分の長さが40bpであり、プローブの全長が120bpであり、配列番号9、配列番号18および配列番号67~76から選択される本発明のプローブが提供される。
【0083】
一つの実施形態において、第2のプローブ部分の長さが50bpであり、プローブの全長が120bpであり、配列番号5、配列番号14および配列番号27~36から選択される本発明のプローブが提供される。
【0084】
一つの実施形態において、本発明のプローブの調製方法が提供される。
【0085】
McBride LJ and Caruthers MH., 1983, Tetrahedron Letters 24(3):245-248に記載されているような、DNAプローブまたはRNAプローブの化学合成の標準的な方法を用いることができる。
【0086】
一つの実施形態において、約60~約120塩基または約80~約120塩基の範囲の長さを有するマイクロアレイ上のオリゴヌクレオチド合成を含む、本発明のプローブの調製方法が提供される。
【0087】
オリゴヌクレオチドプール(プローブプール)は、濃縮工程の前に、Klocker et al., 2020, Chem. Soc. Rev.49, p. 8749-8773に記載される方法等の既知のプロセスによって、ビオチン、磁気ビーズ、フルオロフォア、放射性同位元素またはナノ粒子等の検出可能な標識を含むように改変される。
【0088】
分離されたプローブは液相法に用いられ得るのに対し、マイクロアレイ上のプローブは表面相法に用いられ得ることが理解される。
【0089】
プローブのセット
別の実施形態において、本発明のプローブのセット(組み合わせまたは混合物またはプール)が提供される。
【0090】
一つの実施形態において、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、または少なくとも6個の本発明のプローブを含むプローブセットが提供される。
【0091】
一つの実施形態において、少なくとも10個、少なくとも20個、少なくとも40個、少なくとも50個、少なくとも100個、少なくとも200個、少なくとも300個、少なくとも400個または少なくとも500個の本発明のプローブを含むプローブセットが提供される。
【0092】
一つの実施形態において、本発明のプローブセットは、少なくとも1つの本発明のユニバーサルプローブおよび少なくとも1つの本発明の特異的プローブを含む。
【0093】
一つの実施形態において、
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を含む少なくとも1つのプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分の長さが、前記プローブの全長の約1%~約42%に相当する
前記少なくとも1つのプローブ、および
前記標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1つのさらなるプローブであって、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複しない前記さらなるプローブ
を含んでなるプローブセットが提供される。
【0094】
一つの実施形態において、
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を含む少なくとも1つのプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分が1~約50塩基対(bp)の長さであり、前記プローブの全長が約120bpである
前記少なくとも1つのプローブ、および
前記標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1つのさらなるプローブであって、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複しない前記さらなるプローブ
を含んでなるプローブセットが提供される。
【0095】
少なくとも1つのユニバーサルプローブおよび少なくとも1つの特異的プローブを含む本発明のプローブセットは、既知および新規の融合遺伝子パートナーの捕捉および検出に適していることが理解される。
【0096】
一つの実施形態において、本発明のプローブセットは、少なくとも2つの本発明の特異的プローブを含む。
【0097】
一つの実施形態において、
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を含む少なくとも2つのプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記第2のプローブ部分の長さが、前記プローブの全長の約1%~約42%に相当する
少なくとも2つのプローブを含んでなるプローブセットが提供される。
【0098】
一つの実施形態において、
標的核酸の第1のヌクレオチド部分に相補的な第1のプローブ部分、および
標的核酸の第2のヌクレオチド部分に相補的な第2のプローブ部分
を含む少なくとも2つのプローブであって、
前記プローブが、前記標的核酸の第1のヌクレオチド部分と第2のヌクレオチド部分との間の切断点と重複し、かつ、
前記前記第2のプローブ部分が1~約50塩基対(bp)の長さであり、前記プローブの全長が約120bpである
少なくとも2つのプローブを含んでなるプローブセットが提供される。
【0099】
少なくとも2つの本発明の特異的プローブを含むプローブセットは、既知の融合遺伝子パートナーの捕捉および検出に適していることが理解される。
【0100】
別の好ましい実施形態において、本発明のプローブセットは、第2のプローブ部分の長さが異なる少なくとも2つの本発明の特異的プローブを含む。
【0101】
一つの実施形態において、本発明のプローブセットは、異なる標的核酸にハイブリダイズするプローブを含み、複数の異なる標的核酸を1つのプローブセットで捕捉および検出することができる。
【0102】
一つの実施形態において、本発明のプローブセットは、第1の融合パートナーをコードする融合遺伝子もしくは転写産物、または1つのエクソンをコードするエクソンスキッピング転写産物等の標的核酸の同じ第1のヌクレオチド部分にハイブリダイズするプローブを含む。例示的なプローブセットは、PPARGまたはFGFR3である同じ第1の融合遺伝子にハイブリダイズする特異的プローブおよび/またはユニバーサルプローブの両方を含む。
【0103】
一つの実施形態において、本発明のプローブセットは、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも10個、少なくとも20個、少なくとも50個または少なくとも100個の、第1の融合パートナーをコードする融合遺伝子もしくは転写産物、または1つのエクソンをコードするエクソンスキッピング転写産物等の標的核酸の異なる第1のヌクレオチド部分とハイブリダイズするプローブを含む。
【0104】
一つの実施形態において、本発明のプローブセットは、標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1個のユニバーサルプローブ、および第2のプローブ部分の長さがプローブの全長の約1%~約42%、例えば、約1%、9%、17%、25%、33%および/または42%に相当する少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個または少なくとも5個のプローブ(特異的プローブ)を含む。
【0105】
一つの実施形態において、本発明のプローブセットは、標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1個のユニバーサルプローブ、および第2のプローブ部分が約1~約50bpの長さ、例えば、約10bp、20bp、30bp、40bpおよび/または50bp等の長さであり、プローブの全長が約120bpである少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個または少なくとも5個のプローブ(特異的プローブ)を含む。
【0106】
一つの実施形態において、本発明のプローブセットは、標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1個のユニバーサルプローブ、および第2のプローブ部分の長さがプローブの全長の42%に相当する少なくとも1つのプローブ(特異的プローブ)を含む。
【0107】
一つの実施形態において、本発明のプローブセットは、標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1つのユニバーサルプローブ、および第2のプローブ部分の長さが50bpであり、プローブの全長が約120bpである少なくとも1つのプローブを含む。
【0108】
一つの実施形態において、本発明のプローブセットは、標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1つのユニバーサルプローブ、および第2のプローブ部分の長さがプローブの全長の約1%、9%、17%、25%、33%および/または42%に相当する少なくとも5つのプローブ(特異的プローブ)を含む。
【0109】
一つの実施形態において、本発明のプローブセットは、標的核酸の第1のヌクレオチド部分のみと相補的な少なくとも1つのユニバーサルプローブ、および第2のプローブ部分が約10bp、20bp、30bp、40bpおよび/または50bpの長さであり、プローブの全長が約120bpである少なくとも5つのプローブ(特異的プローブ)を含む。
【0110】
一つの実施形態において、本発明のプローブセットは、第2のプローブ部分の長さがプローブの全長の約1%~約42%、例えば、約1%、9%、17%、25%、33%および/または42%に相当する少なくとも2つのプローブ(特異的プローブ)を含む。
【0111】
一つの実施形態において、本発明のプローブセットは、第2のプローブ部分の長さがプローブの全長の約1%~約42%、例えば、約1%、9%、17%、25%、33%および/または42%に相当する少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのプローブ(特異的プローブ)を含む。好ましくは、本発明のプローブセットは、第2のプローブ部分の長さがプローブの全長の約1%、9%、17%、25%、33%および/または42%に相当する少なくとも5つのプローブを含む。
【0112】
一つの実施形態において、本発明のプローブセットは、第2のプローブ部分が約1~約50bpの長さ、例えば、約10bp、20bp、30bp、40bpおよび/または50bpの長さであり、プローブの全長が約120bpである少なくとも2つのプローブ(特異的プローブ)を含む。
【0113】
一つの実施形態において、本発明のプローブセットは、第2のプローブ部分が約1~約50bpの長さ、例えば、約10bp、20bp、30bp、40bpおよび/または50bpの長さであり、プローブの全長が約120bpである少なくとも2つ、少なくとも3つ、少なくとも4つまたは少なくとも5つのプローブ(特異的プローブ)を含む。好ましくは、本発明のプローブセットは、第2のプローブ部分が約10bp、20bp、30bp、40bpおよび/または50bpの長さであり、プローブの全長が約120bpである少なくとも5つのプローブを含む。
【0114】
本発明のプローブセットは、融合核酸分子(融合遺伝子/転写産物)および/またはエクソンスキッピング核酸分子(エクソンスキッピング転写産物)等の標的核酸分子を任意にさらに含む組成物または反応混合物であり得ることが理解される。
【0115】
本発明のプローブセットは、患者サンプル由来の標的核酸分子をさらに含む混合物の反応であり得ることが理解される。
【0116】
「プローブのセット」、「プローブセット」または「プローブプール」という用語は、交換可能に用いられる。
【0117】
一つの実施形態において、当技術分野で既知の任意のプローブをさらに含む、本発明のプローブセットが提供される。
【0118】
プローブの方法と使用
本発明のプローブは、WTの第2の融合パートナー対応物の捕捉を有利に低減させるように設計されている。
【0119】
特定の態様によれば、本発明は、少なくとも1つの融合遺伝子および/またはエクソンスキッピングを検出するための少なくとも1つのプローブまたはプローブセットを提供する。
【0120】
別の特定の態様によれば、本発明は、少なくとも1つの融合遺伝子および/またはエクソンスキッピングを検出するための少なくとも1つのプローブまたはプローブセットの使用を提供する。
【0121】
特定の態様によれば、本発明は、少なくとも1つの融合遺伝子を検出するための少なくとも1つのプローブまたはプローブセットであって、前記融合遺伝子が既知または未知(すなわち、新規融合またはパートナー不可知融合)であるプローブまたはプローブセットを提供する。
【0122】
特定の態様によれば、本発明は、標的濃縮DNA配列決定またはRNA配列決定における使用のための少なくとも1つのプローブまたはプローブセットを提供する。
【0123】
別の特定の態様によれば、本発明は、標的濃縮DNAまたはRNA配列決定法における少なくとも1つのプローブまたはプローブセットの使用を提供する。
【0124】
特定の態様によれば、本発明は、次世代配列決定(NGS)ベースの標的濃縮DNAまたはRNA配列決定における使用のための少なくとも1つのプローブまたはプローブセットを提供する。
【0125】
別の特定の態様によれば、本発明は、次世代配列決定(NGS)ベースの標的濃縮DNAまたはRNA配列決定法における少なくとも1つのプローブまたはプローブセットの使用を提供する。
【0126】
特定の態様によれば、本発明は、マイクロアレイ、ブロッティング、標的DNAの精製のためのカラムまたはビーズへのプローブの固定化等の方法における使用のための少なくとも1つのプローブまたはプローブセットを提供する。
【0127】
別の特定の態様によれば、本発明は、マイクロアレイ、ブロッティング、標的DNAの精製のためのカラムまたはビーズへのプローブの固定化等の方法における少なくとも1つのプローブまたはプローブセットの使用を提供する。
【0128】
一つの実施形態によれば、本発明の少なくとも1つのプローブまたは本発明のプローブセットと標的核酸の相補的部分とをハイブリダイズさせる工程を含む、サンプル中の遺伝子融合および/またはエクソンスキッピングを検出するための方法が提供される。
【0129】
一つの実施形態によれば、標的捕捉による標的化またはRNA配列決定(すなわち、ハイブリダイゼーション捕捉配列決定)の方法であって:
a)核酸を含むサンプル材料を提供する工程、
b)核酸配列決定ライブラリを準備する工程;
c)少なくとも1つのプローブまたはプローブセットと標的核酸とをハイブリダイズさせる工程;
d)核酸を増幅する工程;
e)核酸の配列を決定する工程;および
f)工程e)で得られた核酸配列を分析する工程
を含む方法が提供される。
【0130】
一つの実施形態によれば、標的捕捉による標的化RNA配列決定の方法であって、工程a)核酸を含むサンプル材料を提供する工程が:
a.1)核酸を含むサンプル材料を提供する工程;
a.2)任意にmRNA転写産物を選択する工程:
a.3)任意にrRNA(リボソームRNA)を枯渇させる工程;
a.4)mRNA転写産物を断片化する工程
を含む方法が提供される。
【0131】
工程a)およびa.1)~a.4)は、ポリA選択(a.2およびa.3)、ハイブリダイゼーションベースのrRNA枯渇(a.3)、化学的または酵素的RNAの断片化(a.4)等の任意の公知の方法によって実施され得る。
【0132】
一つの実施形態によれば、標的捕捉による標的化RNA配列決定の方法であって、工程b)核酸配列決定ライブラリを準備する工程が:
b.1)サンプルRNAをcDNA(相補的DNA)に変換する工程;
b.2)任意に二本鎖cDNAを平滑末端DNAに変換し、続いて非テンプレート3’dAMP(dA)ヌクレオチド尾部を付加する工程;
b.3)任意にcDNAをシーケンシングアダプターにライゲーションする工程;
b.4)任意にcDNAアダプター産物を増幅して全トランスクリプトームライブラリを生成する工程
を含む方法が提供される。工程b)およびb.1)~b.4)は、逆転写、二本鎖cDNA合成(b1)、末端修復およびA-尾部化(b2)、酵素的ライゲーション(b3)、PCR(b4)等の任意の公知の方法によって実施され得る。工程b.3は、NGSのための核酸配列決定ライブラリの準備に必要である。
【0133】
一つの実施形態によれば、標的捕捉による標的化RNA配列決定の方法であって、工程c)少なくとも1つの本発明のプローブまたはプローブセットと標的核酸とをハイブリダイズさせる(すなわち、目的の配列を濃縮する)工程が:
c.1)工程b)で得られた個々のまたはプールされたcDNAライブラリを準備する工程;
c.2)少なくとも1つの本発明のプローブまたはプローブセットと標的ライブラリとをハイブリダイズさせる工程;
c.3)非標的化cDNA/ライブラリを洗浄する工程:
c.4)標的化cDNA/ライブラリを溶出する工程
を含む方法が提供される。
【0134】
工程c)およびc.1)~c.4)は、標的ハイブリダイゼーション捕捉等の任意の既知の方法によって実施され得る。
【0135】
一つの実施形態において、工程c.2)は、個々のまたはプールされたcDNAライブラリをプローブと共に、好ましくは65℃でインキュベーションすることによって実施される。
【0136】
一つの実施形態において、工程c.2)は、個々のまたはプールされたcDNAライブラリを、ビオチン等の生化学的部分に連結されたプローブと共にインキュベーションすることによって行われ、前記プローブは、ライブラリ中の目的の配列にアニーリングし、次いで、アニーリングされた生成物は、ストレプトアビジンに結合した磁気ビーズ等の使用される生化学的部分を具体的に選択する系を用いて捕捉される。
【0137】
一つの実施形態において、ビオチンに結合したプローブおよびストレプトアビジンに結合した磁気ビーズを用いて、前記プローブが捕捉される。
【0138】
工程c.3)では、ライブラリにアニーリングしたプローブを洗浄して、非特異的に結合した配列を除去し、得られた産物をPCRによって増幅し(工程d)、配列決定する(工程e)。
【0139】
工程c)において、プローブは、ハイブリダイゼーションに適した条件で標的核酸とハイブリダイズされ、互いに少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%または100%同一であるヌクレオチド配列が典型的に互いにハイブリダイズを維持する条件下で洗浄される。
【0140】
工程d)核酸を増幅する工程は、ポリメラーゼ連鎖反応(PCR)等の任意の既知の方法によって実施され得る。
【0141】
工程e)核酸の配列を決定する工程は、合成による配列決定(Illumina)、イオン半導体配列決定(Ion Torrent)、単一分子リアルタイム(SMRT)配列決定(Pacific Biosciences社)、ナノポアDNA/RNA配列決定(Oxford Nanopore Technologies)等の任意の既知の方法によって実施され得る。
【0142】
工程f)の分析は、目的の遺伝子融合イベントの存在を支持するフラグメントの数が定量化されるように、任意の既知の方法によって実施され得る。
【0143】
既知の遺伝子融合および新規遺伝子融合は、特に発癌性遺伝子融合であると理解される。
【0144】
一つの実施形態によれば、標的捕捉による標的化DNA配列決定またはRNA配列決定の方法が提供され、サンプルは、疾患に罹患している、または罹患していることが疑われる対象から得られ、好ましくは、疾患は癌である。
【0145】
一つの実施形態によれば、融合遺伝子および/またはエクソンスキッピングの存在がサンプル中で検出される場合、それが癌の存在を示す、標的捕捉による標的化DNA配列決定またはRNA配列決定の方法が提供される。
【0146】
組成物
本発明の別の態様によれば、少なくとも1つの本発明のプローブを含む組成物が提供される。
【0147】
本発明の別の態様によれば、少なくとも1つの本発明のプローブセットを含む組成物が提供される。
【0148】
特定の態様によれば、本発明の組成物は、本発明の方法、特に、標的化DNA配列決定またはRNA配列決定の方法、および癌の診断またはモニターの方法において有用である。
【0149】
特定の態様によれば、本発明の組成物は反応混合物であり、任意に標的核酸分子をさらに含む。
【0150】
キット
本発明の別の態様によれば、少なくとも1つの本発明のプローブ、および任意に使用説明書を含むキットが提供される。
【0151】
本発明の別の態様によれば、少なくとも1つの本発明のプローブセット、および任意に使用説明書を含むキットが提供される。
【0152】
特定の態様によれば、本発明のキットは、本発明の方法、特に、標的化DNA配列決定またはRNA配列決定の方法、および癌の診断またはモニターの方法において有用である。
【0153】
癌の診断およびモニターの方法
一つの実施形態において、融合遺伝子またはエクソンスキッピングの発現が患者サンプルで検出され、癌の存在が示唆される。
【0154】
特定の態様によれば、本発明は、融合遺伝子および/またはエクソンスキッピング、好ましくは癌中に存在する融合遺伝子および/またはエクソンスキッピングの検出方法における使用のための少なくとも1つのプローブまたはプローブのセットを提供する。
【0155】
別の特定の態様によれば、本発明は、融合遺伝子および/またはエクソンスキッピング、好ましくは癌中に存在する融合遺伝子および/またはエクソンスキッピングの検出方法における少なくとも1つのプローブまたはプローブセットの使用を提供する。
【0156】
一つの実施形態によれば、少なくとも1つの本発明のプローブまたは本発明のプローブセットと、癌中に存在する標的核酸の相補的部分とをハイブリダイズさせる工程を含む、サンプル中の癌を診断またはモニターする方法が提供される。
【0157】
特定の実施形態によれば、本明細書に記載の本発明の任意の方法を含む、癌を診断またはモニターする方法が提供される。
【0158】
別の特定の実施形態によれば、癌を診断またはモニターする方法であって:
a)核酸を含むサンプル材料を提供する工程;
b)核酸配列決定ライブラリを準備する工程;
c)少なくとも1つの本発明のプローブまたはプローブセットと標的核酸とをハイブリダイズさせる工程;
d)核酸を増幅する工程;
e)核酸の配列を決定する工程;および
f)工程e)で得られた核酸配列を分析する工程
を含む方法が提供される。
【0159】
一つの実施形態によれば、融合遺伝子および/またはエクソンスキッピングの存在が患者サンプルにおいて検出される場合、それが癌の存在を示す、癌の診断またはモニターの方法が提供される。
【0160】
一つの実施形態によれば、癌を診断またはモニターする方法が提供され、サンプルは、疾患、好ましくは癌である疾患に罹患している、または罹患していることが疑われる対象から得られる。
【0161】
一つの実施形態によれば、患者サンプルにおける融合遺伝子および/またはエクソンスキッピングの存在の検出が前記患者の治療を示す、癌を診断またはモニターする方法が提供される。
【0162】
一つの態様によれば、サンプルは患者サンプルであり、組織、血液、唾液、または細胞学的標本/調製物(FFPE、塗抹標本)等の形態である。
【0163】
患者
一つの実施形態において、本発明における患者は癌に罹患している。
【0164】
別の特定の実施形態において、本発明における患者は、肺癌、胆管癌、前立腺癌、膵管腺癌、甲状腺癌、結腸直腸癌、胃癌、神経膠芽腫、頭頸部癌、腎臓癌、子宮内膜癌等に罹患している。
【0165】
別の特定の実施形態において、本発明における患者は癌に罹患していることが疑われる。
【0166】
別の特定の実施形態において、本発明における患者は癌の治療を受けている。
【0167】
本明細書で引用される参考文献は、参照によりその全体が本明細書に組み込まれる。本発明は、本明細書に記載される特定の実施形態および図面によって範囲が限定されるべきではなく、これらは本発明の個々の態様の単一の例示として意図されており、機能的に同等の方法および構成要素は本発明の範囲内にある。本発明を説明する実施例は、決して本発明の範囲を限定することを意図するものではない。
【実施例0168】
実施例1:プローブの設計
融合遺伝子には、WT型(野生型)での発現レベルが比較的低い第1のパートナー(多くの場合キナーゼ酵素)、およびより高いWTレベルの発現を有する遺伝子であることが多い第2のパートナーが含まれる。これは、プローブの設計が完了したときに、プローブが第2のパートナーのWT対応物を捕捉できるように設計されている場合、融合型との比較において、WT型の遺伝子によって多くの消費される読み取りが存在することになる。
次のプローブが設計されました。
【0169】
下記のプローブが設計された:
i)ユニバーサルプローブ、これは、第2の融合パートナーと重複しないプローブであり、すなわち本明細書では0bpプローブと呼ばれ、このプローブは全長120bpの一定の長さであり得る(
図1)。このプローブによって、第1の融合パートナーの新規融合を捕捉することが可能となる。
ii)特異的プローブ、これは、第2の融合パートナーと重複するプローブであり、すなわち、第2のプローブ部分は少なくとも1bpである。高重複プローブ設計では、特異的プローブが約50bpを超えて、例えば、第2の融合パートナーと最大60bpまたは90bp重複し、すべてのプローブは全長120bpで一定である(
図1A)。低重複プローブ設計(本発明)では、特異的プローブは、第2の融合パートナーと最大10bp、20bp、30bp、40bpまたは50bp重複し、すべてのプローブは全長120bpで一定である(
図1B)。
【0170】
実施例2:FGFR3-TACC3融合の検出における高重複プローブ設計と低重複プローブ設計との性能の比較
FGFR3-TACC3融合の検出において、高重複プローブと低重複プローブとの性能を比較した。FGFR3は第1の融合遺伝子である。
【0171】
材料と方法
RNA配列決定ライブラリは、Seraseq(登録商標) FFPE Tumor Fusion RNA v2標準物質から抽出した100ngのRNAを用いて調製した。次いで、カスタムパネルを用いたxGEN Lockdown IDT(登録商標)プローブベースの捕捉技術を用いて、個別にバーコード化された全トランスクリプトームライブラリを捕捉した。プローブは、高重複プローブ混合物(60bp、90bp)と、低重複プローブ混合物(30bp)(
図2A)、または低重複プローブ:0bpプローブ(
図2B)、または低重複50bpプローブ(
図2C)、または0bp、10bp、20bp、30bpおよび40bp低重複プローブの混合物(
図2D)とを含み、かつFGFR3-TACC3融合を標的とするプローブを含むプローブの混合物を用いて、本発明に従って設計された。この融合遺伝子において、FGFR3は第1の融合遺伝子であり、TACC3は第2の融合遺伝子である。次いで、捕捉されたライブラリを、Illumina MiSeq装置を用いて配列決定した。BWA-MEMアライナーを用いて読み取りを自家製の融合合成ゲノムにマッピングすることによりデータを分析し、融合切断点に関連するフラグメント開始のヒートマップを生成した。プローブの混合物には、異なる遺伝子融合を標的とするプローブが含まれており、明確にするために、FGFR3-TACC3融合を標的とするプローブについてのみ記載し、FGFR3-TACC3融合の検出結果が報告された。
【0172】
下記のプローブが用いられた。
a)高重複プローブ(60bpおよび90bp)と低重複プローブ(30bp)との混合物(
図2A):
【表2】
【0173】
b)ユニバーサルプローブ(0bpプローブ)(
図2B):
【表3】
【0174】
c)第2の融合パートナーと50bp重複する特異的プローブ(
図2C):
【表4】
【0175】
d)ユニバーサルプローブ(0bpプローブ)と、第2の融合パートナーと10bp、20bp、30bpおよび40bp重複する特異的プローブとのプローブ混合物(
図2D):
【表5】
【0176】
高重複プローブで捕捉されたFGFR3-TACC3融合の融合切断点から始まるフラグメントのヒートマップの分析(
図2A)により、これらのプローブがWTの第2のパートナーの読み取りを極めて多く捕捉することが示された。融合周辺のフラグメントの約60%が、第2のパートナー(TACC3)の野生型転写産物に起因する可能性がある。高重複プローブの混合物に低重複プローブ(30bp)を追加しても、WTの第2のパートナーの読み取りは低減しなかった。
【0177】
低重複プローブで捕捉されたFGFR3-TACC3融合の融合切断点から始まるフラグメントのヒートマップの分析(
図2B、C、D)により、これらのプローブが標的融合に属する主に第2のパートナー読み取りを捕捉することが示された。有利なことに、プローブの混合物により、0bpおよび50bpのプローブ単独よりも多くの融合フラグメントを捕捉することができた(すなわち、プローブの混合物-2108フラグメント(
図2D);0bp-1101フラグメント(
図2B);50bp-1302フラグメント(
図2C))。低重複プローブの混合物のみ(
図2D)によって、高重複プローブ(
図2A)を用いて得られた読み取りと比較して、WTの第2のパートナーの読み取りを低減することができた。有利なことに、ユニバーサルプローブおよび特異的な低重複プローブを含むこの低重複プローブの混合物によって、既知および新規の融合遺伝子パートナーの検出が可能であった。
【0178】
これらの結果から、低重複プローブが、標的融合に属する第2のパートナーの読み取りを主に捕捉すること、有利には低重複プローブの混合物が0bpおよび50bpプローブ単独よりも多くの融合フラグメントを捕捉することが示された。低重複プローブの混合物のみによって、高重複プローブを用いて得られた読み取りと比較して、WTの第2のパートナーの読み取りを低減することができた。したがって、既知の融合/切断点を捕捉するための融合特異的プローブの設計は、WTの第2のパートナーの対応物を捕捉しないように最適化されていた。
【0179】
実施例3:PAX8-PPARG融合の検出における高重複プローブ設計と低重複プローブ設計との性能の比較
PAX8-PPARG融合の検出において、高重複プローブと低重複プローブとの性能を比較した。PPARGは第1の融合遺伝子である。
【0180】
実施例2と同様の材料および方法
プローブは、高重複プローブ混合物(60bp、90bp)と、低重複プローブ(30bp)(
図3A)、または低重複プローブ:0bpプローブ(
図3B)、または低重複50bpプローブ(
図3C)、または0bp、10bp、20bp、30bpおよび40bp低重複プローブの混合物(
図3D)とを含み、かつPAX8-PPARG融合を標的とするプローブを含むプローブの混合物を用いて、本発明に従って設計された。この融合遺伝子において、PPARGは第1の融合遺伝子であり、PAX8は第2の融合遺伝子である。プローブの混合物には、異なる遺伝子融合を標的とするプローブが含まれており、明確にするために、PAX8-PPARG融合を標的とするプローブについてのみ記載し、PAX8-PPARG融合の検出結果が報告された。
【0181】
下記のプローブが用いられた。
a)高重複プローブ(60bpおよび90bp)と低重複プローブ(30bp)の混合物(
図3A):
【表6】
【0182】
b)ユニバーサルプローブ(0bpプローブ)(
図3B):
【表7】
【0183】
c)第2の融合パートナーと50bp重複する特異的プローブ(
図3C):
【表8】
【0184】
d)ユニバーサルプローブ(0bpプローブ)と、第2の融合パートナーと10bp、20bp、30bpおよび40bp重複する特異的プローブとの混合物(
図3D):
【表9】
【0185】
高重複プローブで捕捉されたPAX8-PPARG融合の融合切断点から始まるフラグメントのヒートマップの分析(
図3A)により、これらのプローブがWTの第2のパートナーの読み取りを極めて多く捕捉することが示された。融合周辺のフラグメントの約39%が、第2のパートナー(PAX8)の野生型転写産物に起因する可能性がある。高重複プローブの混合物に低重複プローブ(30bp)を追加しても、WTの第2のパートナーの読み取りは低減しなかった。
【0186】
低重複プローブで捕捉されたPAX8-PPARG融合の融合切断点から始まるフラグメントのヒートマップの分析(
図3B、C、D)により、これらのプローブが標的融合に属する主に第2のパートナー読み取りを捕捉することが示された。有利なことに、プローブの混合物により、0bpおよび50bpのプローブ単独よりも多くの融合フラグメントを捕捉することができた(すなわち、プローブの混合物-1827フラグメント(
図3D);0bp-1032フラグメント(
図3B);50bp-1351フラグメント(
図3C))。低重複プローブの混合物のみ(
図3D)によって、高重複プローブ(
図3A)を用いて得られた読み取りと比較して、WTの第2のパートナーの読み取りを低減することができた。有利なことに、ユニバーサルプローブおよび特異的な低重複プローブを含むこの低重複プローブの混合物によって、既知および新規の融合遺伝子パートナーの検出が可能であった。
【0187】
これらの結果から、低重複プローブが、標的融合に属する第2のパートナーの読み取りを主に捕捉すること、有利には低重複プローブの混合物が0bpおよび50bpプローブ単独よりも多くの融合フラグメントを捕捉することが示された。低重複プローブの混合物のみによって、高重複プローブを用いて得られた読み取りと比較して、WTの第2のパートナーの読み取りを低減することができた。したがって、既知の融合/切断点を捕捉するための融合特異的プローブの設計は、WTの第2のパートナーの対応物を捕捉しないように最適化されていた。
【0188】
実施例4:臨床サンプルおよび参照サンプルにおける異なる融合の低重複プローブによる捕捉
臨床サンプルおよび参照サンプルの異なる融合について、低重複プローブ設計で捕捉された融合フラグメントの数を比較した。
【0189】
材料と方法
RNA配列決定ライブラリを、臨床FFPEサンプルまたは参照サンプル(Seraseq(登録商標) FFPE Tumor Fusion RNA v2参照物質)から抽出した100ngのRNAを用いて調製した。次いで、カスタムパネルを用いたxGEN Lockdown IDT(登録商標)プローブベースの捕捉技術を用いて、個別にバーコード化された全トランスクリプトームライブラリを捕捉した。プローブは、低重複プローブ0bpプローブ(0bp)、または0bp、10bp、20bp、30bp、40bpおよび50bp低重複プローブの混合物(混合物)、0bpおよび50bp低重複プローブの混合物(0+50bp)を含むプローブの混合物を用いて、本発明に従って設計された。次いで、捕捉されたライブラリを、Illumina MiSeq装置を用いて配列決定した。BWA-MEMアライナーを用いて読み取りを自家製の融合合成ゲノムにマッピングすることによりデータを分析し、融合切断点に関連するフラグメント開始のヒートマップを生成した。両方の臨床サンプルにおいて融合が検出された(固形腫瘍;サンプル1および2には確認されたCD74-ROS1融合が含まれ、サンプル3には確認されたEML4-ALK融合(それぞれS1、S2、S3)、および14個の異なる融合と2つのエクソンスキッピングイベントを含む参照物質(RS;seracare)が含まれていた。EML4-ALK、KIF5B-RET、NCOA4-RET、SLC34A2-ROS1、TPM3-NTRK1、FGFR3-BAIAP2L1、PAX8-PPARG、FGFR3-TACC3、ETV6-NTRK3、LMNA-NTRK1およびSLC45A3-BRAFを含む、さまざまな融合体を標的化した。
【0190】
検出された融合フラグメントの数とともに、条件0bpにおける融合フラグメントの数、0bpとの比較における条件0+50bpでの融合フラグメントの倍率変化、0bpとの比較における混合条件での融合フラグメントの倍率変化が報告された(
図4)。
【0191】
下記のプローブが用いられた。
a)ユニバーサルプローブ(0bpプローブ):
【表10】
【0192】
b)ユニバーサルプローブ(0bpプローブ)と、第2の融合パートナーと50bp重複する特異的プローブ(0+50bp)とのプローブ混合物:
【表11】
【0193】
c)ユニバーサルプローブ(0bpプローブ)と、第2の融合パートナーと10bp、20bp、30bp、40bpおよび50bp重複する特異的プローブとのプローブ混合物(混合物):
【表12】
【0194】
FGFR3-TACC3(0bp)およびFGFR3-BAIAP2L1(0bp)のユニバーサルプローブは、配列番号4と同じ配列を有することに留意されたい。CD74-ROS1(0bp)およびSLC34A2-ROS1(0bp)のユニバーサルプローブは配列番号19と同じ配列である。
【0195】
これらの結果から、対象となる融合に応じて、0bpプローブ、0+50bpおよびプローブの混合物が同程度またはそれ以上の数の融合フラグメントを捕捉することが示された(
図4)。
【0196】
したがって、本発明のプローブ混合物/設計は、融合分子の効果的な捕捉を提供し、標的化されていないWT形態の遺伝子と比較した場合に変異体形態に由来する読み取りを最適化しながら、所望の特異的融合を濃縮する。