(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-20
(54)【発明の名称】cfRNAおよびcfTNAの標的NGSシーケンシングのための組成物および方法
(51)【国際特許分類】
C12Q 1/6806 20180101AFI20240912BHJP
C12Q 1/6827 20180101ALI20240912BHJP
C12Q 1/6876 20180101ALI20240912BHJP
C12Q 1/6855 20180101ALI20240912BHJP
C12Q 1/6851 20180101ALI20240912BHJP
C40B 40/06 20060101ALI20240912BHJP
【FI】
C12Q1/6806 Z
C12Q1/6827 Z
C12Q1/6876 Z
C12Q1/6855 Z
C12Q1/6851 Z
C40B40/06
【審査請求】有
【予備審査請求】有
(21)【出願番号】P 2024517452
(86)(22)【出願日】2021-09-23
(85)【翻訳文提出日】2024-04-24
(86)【国際出願番号】 US2021051683
(87)【国際公開番号】W WO2023048713
(87)【国際公開日】2023-03-30
(81)【指定国・地域】
(71)【出願人】
【識別番号】524103988
【氏名又は名称】ジノミク テスティング コーポレーティブ,エルシーエー
(74)【代理人】
【識別番号】100114775
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】アルビタール,マーヘル
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA19
4B063QQ02
4B063QQ03
4B063QQ41
4B063QR55
4B063QS24
4B063QS28
4B063QS32
4B063QX02
(57)【要約】
無細胞核酸試験を、同じ試料から得られたcfTNA画分およびcfRNA画分の同時分析を使用して行う。好ましい実施形態では、cfTNA単離は、cfDNAおよびcfRNAの小さな断片さえも単離することを含み、両方の画分中のcfRNAの逆転写後、そのようにして得られたcDNAライブラリは、タイリングされた濃縮オリゴヌクレオチドを使用して標的濃縮に供される。最も注目すべきことに、両方のcDNAライブラリからのデータセットを使用する配列分析は、これまでに実現されていない感度および特異性を提供する。
【特許請求の範囲】
【請求項1】
無細胞液から核酸を操作する方法であって、
生体液から無細胞全核酸(cfTNA)を得る工程;
前記cfTNAの第1の部分をDNAse消化に供して、前記cfTNAのcfRNA画分を生成する工程;
前記cfTNAの前記cfRNA画分と前記cfTNAの第2の部分との両方を逆転写、アダプターライゲーション、および増幅に供して、それによって、第1および第2それぞれのcDNAライブラリを作製する工程;
前記第1および第2のcDNAライブラリの各々を、複数の標的cDNAを濃縮する標的濃縮に供して、それによって、第1および第2それぞれの標的濃縮cDNAライブラリを作製する工程;
を含む方法。
【請求項2】
前記cfTNAが、17~200塩基の間のサイズを有するcfRNA断片および50~300塩基の間のサイズを有するcfDNA断片を含む、請求項1に記載の方法。
【請求項3】
前記cfTNAが、30~250塩基の間のサイズを有するcfRNA断片および75~400塩基の間のサイズを有するcfDNA断片を含む、請求項1に記載の方法。
【請求項4】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも30%を一緒に構成する、請求項2または請求項3のいずれか一項に記載の方法。
【請求項5】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも40%を一緒に構成する、請求項2または請求項3のいずれか一項に記載の方法。
【請求項6】
cfTNA中の突然変異を、増強された感度で検出する方法であって、
生体液の試料からcfRNAおよびcfTNAを得る工程;
前記cfRNAおよびcfTNAから第1および第2それぞれのcDNAライブラリを作製する工程;前記第1および第2のcDNAライブラリの各々を、複数の標的cDNAを濃縮する標的濃縮に供し、それによって第1および第2それぞれの標的濃縮cDNAライブラリを作製する工程;ならびに
前記第1および第2の標的濃縮cDNAライブラリをシーケンシングし、前記第1および第2の標的濃縮cDNAライブラリからのシーケンシング結果を使用して、それによって、同じ試料からのシーケンシングcfRNAまたはcfDNA単独と比較して増強された感度で突然変異を検出する工程;
を含む方法。
【請求項7】
前記生体液から前記cfTNAを得る前記工程が、cfRNAおよびcfDNAの同時単離を含む、請求項6に記載の方法。
【請求項8】
前記cfTNAが、17~200塩基の間のサイズを有するcfRNA断片および50~300塩基の間のサイズを有するcfDNA断片を含む、請求項6に記載の方法。
【請求項9】
前記cfTNAが、30~250塩基の間のサイズを有するcfRNA断片および75~400塩基の間のサイズを有するcfDNA断片を含む、請求項6に記載の方法。
【請求項10】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも30%を一緒に構成する、請求項8または請求項9のいずれか一項に記載の方法。
【請求項11】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも40%を一緒に構成する、請求項8または請求項9のいずれか一項に記載の方法。
【請求項12】
配列分析用試薬キットであって、
生体液のcfTNAのcfDNA枯渇cfRNA画分を含む第1の試薬;および
同じ生体液のcfTNAを含む第2の試薬;
を含む試薬キット。
【請求項13】
前記生体液がヒトの血漿または血清である、請求項12に記載の試薬キット。
【請求項14】
前記第1の試薬が、主に17~200塩基の間のサイズを有するcfRNA断片および主に50~300塩基の間のサイズを有するcfDNA断片を含む、請求項12~13のいずれか一項に記載の試薬キット。
【請求項15】
前記第2の試薬が、主に17~200塩基の間のサイズを有するcfRNA断片を含む、請求項14に記載の試薬キット。
【請求項16】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも30%を一緒に構成する、請求項12~13のいずれか一項に記載の試薬キット。
【請求項17】
前記第1の試薬が、前記第2の試薬から調製される、請求項12~13のいずれか一項に記載の試薬キット。
【請求項18】
配列分析用試薬キットであって、
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリを含み;前記第1の標的濃縮cDNAライブラリが生体液のcfTNAのcfDNA画分を含まず;ならびに
前記第2の標的濃縮cDNAライブラリが同じ生体液のcfTNAのcfDNA画分を含む、
試薬キット。
【請求項19】
前記第1および第2の標的濃縮cDNAライブラリが、同じ標的cDNAを使用して標的濃縮される、請求項18に記載の試薬キット。
【請求項20】
前記標的cDNAが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする、請求項18または19に記載の試薬キット。
【請求項21】
配列分析用試薬キットであって、
50塩基以下のサイズを有するRNAの結合を可能にし、100塩基以下のサイズを有するDNAの結合を可能にする表面およびサイズを有する複数のナノ粒子;および
標的遺伝子に対する配列相補性を有する複数の標的濃縮オリゴヌクレオチドを含み、
前記標的濃縮オリゴヌクレオチドの少なくとも一部が、同じ標的遺伝子の異なる部分にハイブリダイズする、
試薬キット。
【請求項22】
前記複数のナノ粒子が、30塩基以下のサイズを有するRNAの結合を可能にし、80塩基以下のサイズを有するDNAの結合を可能にする表面およびサイズを有する、請求項21に記載の試薬キット。
【請求項23】
前記複数のナノ粒子が、20塩基以下のサイズを有するRNAの結合を可能にし、60塩基以下のサイズを有するDNAの結合を可能にする表面およびサイズを有する、請求項21に記載の試薬キット。
【請求項24】
前記複数のナノ粒子が常磁性ナノ粒子である、請求項21~23のいずれか一項に記載の試薬キット。
【請求項25】
対象の核酸データを分析する方法であって、
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし、それによって第1および第2それぞれの配列データセットを得る工程(前記第1の標的濃縮cDNAライブラリは前記対象の生体液のcfTNAから調製され、cfTNAのcfDNA画分を含まず、
前記第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAから調製され、cfTNAのcfDNA画分を含む);
前記第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異を同定する工程、ならびに少なくとも前記第1の配列データセットにおける発現を定量する工程、を含む方法。
【請求項26】
前記シーケンシングの工程がペアエンドシーケンシングであり、ならびに/または第1および第2の標的濃縮cDNAライブラリが、前記第1の標的濃縮cDNAライブラリ単独の突然変異の検出と比較して、突然変異の検出の感度が増強される、請求項25記載の方法。
【請求項27】
前記第1および第2の標的濃縮cDNAライブラリが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAが濃縮されており、任意選択的に、前記第1および第2の標的濃縮cDNAライブラリが、臨床経過、治療に対する応答または疾患の再発の診断または決定のために、特定の前記疾患に特異的な標的cDNAが濃縮されている、請求項25または請求項26に記載の方法。
【請求項28】
対象のがんを分類する方法であって、
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし、それによって第1および第2それぞれの配列データセットを得る工程(前記第1の標的濃縮cDNAライブラリは前記対象の生体液のcfTNAのcfDNA画分を含まず、
前記第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAのcfDNA画分を含む);
前記第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異を同定する工程、および各遺伝子について少なくとも前記第1の配列データセットにおける発現レベルを定量する工程;ならびに
前記同定された突然変異および定量された発現レベルをモデルに使用して、それによって前記対象の前記がんを同定する工程、
を含む方法。
【請求項29】
前記シーケンシングの工程がペアエンドシーケンシングである、請求項28に記載の方法。
【請求項30】
前記第1および第2の標的濃縮cDNAライブラリが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAについて濃縮されている、請求項28または29に記載の方法。
【請求項31】
対象を治療する方法であって、
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし、それによって第1および第2それぞれの配列データセットを得る工程(前記第1の標的濃縮cDNAライブラリは前記対象の生体液のcfTNAのcfDNA画分を含まず;
前記第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAのcfDNA画分を含む);
前記第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異を同定する工程、および各遺伝子について少なくとも前記第1の配列データセットにおける発現レベルを定量する工程;ならびに
前記同定された突然変異および定量された発現レベルに基づいて治療を投与する工程、
を含む方法。
【請求項32】
前記シーケンシングの工程がペアエンドシーケンシングである、請求項31に記載の方法。
【請求項33】
前記第1および第2の標的濃縮cDNAライブラリが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAについて濃縮されている、請求項31または32に記載の方法。
【請求項34】
生体液から得られたcDNAの配列分析用試薬キットであって、
それぞれのcDNAにハイブリダイズする40~70ヌクレオチドの間の長さを有する複数の標的濃縮プローブを含み、
前記複数の標的濃縮プローブが、ヌクレオチドあたり2~59プローブの間のタイリング密度および1~60ヌクレオチドの間のステップ長を有するタイリング様式で前記それぞれのcDNAに結合し;
前記それぞれのcDNAが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子、および/または受容体関連遺伝子をコードする、
試薬キット。
【請求項35】
前記標的濃縮プローブのそれぞれが、固相捕捉のための配列部分、固相捕捉のための化学修飾、または磁気ビーズをさらに含む、請求項34に記載のキット。
【請求項36】
前記標的cDNAが、前記生体液のcfTNAおよびcfRNAから調製される、請求項34に記載のキット。
【請求項37】
対象のための治療を予測する方法であって、
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし、それによって第1および第2それぞれの配列データセットを得る工程(前記第1の標的濃縮cDNAライブラリは前記対象の生体液のcfTNAのcfDNA画分を含まず;
前記第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAのcfDNA画分を含む);
前記第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異を同定する工程、および各遺伝子について少なくとも前記第1の配列データセットにおける発現レベルを定量する工程;ならびに
前記同定された突然変異および定量された発現レベルに基づいて前記治療を予測する工程、を含む方法。
【請求項38】
前記シーケンシングの工程がペアエンドシーケンシングである、請求項37に記載の方法。
【請求項39】
前記第1および第2の標的濃縮cDNAライブラリが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAについて濃縮されている、請求項37または38に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の分野は、様々な生体液由来の無細胞核酸の分析のための組成物および方法であり、特に血漿および血清由来の無細胞RNA(cfRNA)および無細胞DNA(cfDNA)に関する。
【背景技術】
【0002】
背景技術の説明は、本発明を理解するのに有用であり得る情報を含む。本明細書で提供される情報のいずれかが先行技術であるか、または現在特許請求されている発明に関連すること、または具体的または暗黙的に参照される任意の刊行物が先行技術であることを認めるものではない。
【0003】
本明細書におけるすべての刊行物および特許出願は、あたかも各個々の刊行物または特許出願が参照により組み込まれることが具体的かつ個別に示されているのと同程度に、参照により組み込まれる。組み込まれた参考文献における用語の定義または使用が、本明細書で提供されるその用語の定義と矛盾しているかまたは逆である場合、本明細書で提供されるその用語の定義が適用され、参考文献におけるその用語の定義は適用されない。
【0004】
無細胞核酸(cfNA)、特に血液および他の生体液中に存在する無細胞DNA(cfDNA)および無細胞RNA(cfRNA)は、がん細胞または腫瘍などの対象中の疾患細胞および組織を検出するための潜在的なマーカーとして最近提案された。その目的のために、循環核酸を生体液から単離する必要があり、そのような単離を達成するための様々なキットおよび方法が当技術分野で公知である。例えば、cfDNAおよび/またはcfRNAは、固相(典型的にはシリカ系)吸着およびその後のクリーンアップを使用して非核酸成分を除去するか(例えば、QIAamp Circulating Nucleic Acid Kit or Apostle MiniMax High Efficiency cfDNA_RNA(cfNAs)Isolation Kit)、または国際公開第2021/037075号パンフレットに記載されているような水性二相システムを使用して単離することができる。代替的には、循環するcfDNAまたはcfRNAは、マイクロ流体デバイスを使用して単離することもできる(例えば、NPJ Precision Oncology(2020)4:3を参照されたい)。またさらなる例では、米国特許出願公開第2014/0356877号明細書は、電気化学的分離を使用した血液からの核酸単離を教示し、米国特許出願公開第2015/0031035号明細書は、核酸の環状化およびその後のローリングサークル増幅を教示している。調製方法にかかわらず、そのようにして得られた核酸調製物は次いで、さらなる分析に供される。
【0005】
例えば、米国特許出願公開第2006/0228727号明細書は、健康な対照と比較して、遺伝子増幅および/または遺伝子過剰発現の全体的な反映として、がん患者の血漿/血清中の特定の遺伝子のDNAおよびRNAの量を一緒に分析することを教示している。概念的には比較的単純であるが、そのような方法は突然変異特異的情報を提供せず、細胞のDNAセグメント中の突然変異が転写されるか否かも識別しない。配列分析の別の例(例えば、米国特許出願公開第2020/0199671号明細書を参照されたい)では、cfRNAおよび細胞内RNAをシーケンシングし、細胞内RNA配列情報を使用してcfRNA配列情報をフィルタリングする。このようなアプローチは、有利には、cfRNA試料中の細胞内RNA汚染を排除することができ、分析はRNA情報のみに限定される。国際公開第2018/208892号パンフレットは、循環腫瘍RNAを使用したRNA発現プロファイリングを教示しており、もう一度RNAの分析を限定している。同様に、米国特許出願公開第2020/0232010号明細書は、試料の偏りを減少させるためのサイズ分布および断片化に基づくcfDNA分析の方法を教示している。しかしながら、そのような方法は、試料中のcfDNAのみを分析する。
【0006】
DNAとRNAの両方を分析する努力では、米国特許出願公開第2019/0390253号明細書が、同じ遺伝子をコードする異なる形態について配列情報を得ることができるように、形態特異的配列タグを使用した試料中の核酸の複数の形態(ここでは:dsDNA、ssDNA、ssRNA)および/または修飾の分析を記載している。さらに、そのような方法は、形態特異的増幅および濃縮も可能にする。そのような分析は、DNAおよびRNAの同時分析を有利に可能にするが、そのようなアッセイの感度は、特にDNAおよび/またはRNAが低いコピー数/転写産物で存在する場合、比較的低いと予想される。さらに、DNAおよび/またはRNAが血漿または血清から単離される場合、感度はさらにより問題である。少なくともいくつかの事例では、無細胞核酸からのシーケンシングライブラリは、米国特許出願公開第2018/0327831号明細書に記載されているような、小型捕捉プローブの使用によって改善することができる。しかしながら、そのようなアプローチは、典型的には、既に単離された核酸の集団に限定され、そのため、特に目的の遺伝子または転写産物が低コピー数または翻訳を受け、突然変異体遺伝子および突然変異体転写産物の場合によくあるように高い不安定性を有する場合、感度を増加させない。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】米国特許出願公開第2014/0356877号明細書
【特許文献2】米国特許出願公開第2015/0031035号明細書
【特許文献3】米国特許出願公開第2006/0228727号明細書
【特許文献4】米国特許出願公開第2020/0199671号明細書
【特許文献5】国際公開第2018/208892号パンフレット
【特許文献6】米国特許出願公開第2020/0232010号明細書
【特許文献7】米国特許出願公開第2019/0390253号明細書
【特許文献8】米国特許出願公開第2018/0327831号明細書
【非特許文献】
【0008】
【非特許文献1】NPJ Precision Oncology(2020)4:3
【発明の概要】
【発明が解決しようとする課題】
【0009】
したがって、循環核酸の単離および分析の様々なシステムおよび方法が当技術分野で公知であるにもかかわらず、それらのすべてまたはほとんどすべてがいくつかの欠点を抱えている。したがって、特に循環核酸が血液から単離され、安定性が低い場合、循環核酸の単離および分析のための組成物および方法が依然として必要とされている。
【課題を解決するための手段】
【0010】
本発明の主題は、生体液中、特に対象の血液中の循環無細胞核酸の改善された単離および分析のための様々な組成物および方法に関する。
【0011】
特に好ましい組成物および方法は、同じ試料液由来のcfTNA画分およびcfRNA画分の両方を使用し、それらの画分は、分解された核酸(例えば、100以下のヌクレオチドの断片サイズを有する)の単離を可能にする工程で得られる。さらに、両方の画分の逆転写後、好ましい方法により、そのように調製されたcDNAライブラリは、ハイブリダイゼーションプローブがタイリング様式で同じ標的cDNAに結合するように、各標的cDNAの増幅のために複数のハイブリダイゼーションプローブを使用して、標的特異的方法でさらに濃縮される。
【0012】
注目すべきことに、cfTNA画分およびcfRNA画分からこのようにして調製された標的濃縮cDNAライブラリの配列分析は、目的の複数の遺伝子に関して前例のない感度および特異性を提供した。実際、本発明者は、様々ながんの存在が血液試料において検出され得るだけでなく、そのような方法ががん分類(例えば、がんのタイプまたはステージ)も可能にすることを実証した。
【0013】
本発明の主題の一態様では、本発明者は、無細胞液から核酸を操作する方法であって、生体液から無細胞全核酸(cfTNA)を得る工程、および該cfTNAの第1の部分をDNAse消化に供して、cfTNAのcfRNA画分を生成するさらなる工程を含む方法を企図する。さらに別の工程では、cfTNAのcfRNA画分とcfTNAの第2の部分との両方を逆転写、アダプターライゲーション、および増幅に供して、それによって、それぞれ第1および第2のcDNAライブラリを作製し、次いで、第1および第2のcDNAライブラリのそれぞれを、複数の標的cDNAを濃縮する標的濃縮に供して、それによって、それぞれ第1および第2の標的濃縮cDNAライブラリを作製する。
【0014】
いくつかの実施形態では、cfTNAは、17~200塩基の間のサイズを有するcfRNA断片、および50~300塩基の間のサイズを有するcfDNA断片を含み、および/またはcfTNAは、30~250塩基の間のサイズを有するcfRNA断片、および75~400塩基の間のサイズを有するcfDNA断片を含む。さらに企図される実施形態では、cfRNA断片およびcfDNA断片は、すべてのcfTNAの少なくとも30%または少なくとも40%を一緒に構成し得る。
【0015】
本発明の主題に限定されるものではないが、生体液からcfTNAを得るステップは、cfRNAおよびcfDNAの同時単離によって実施され得る。追加的または代替的に、逆転写の工程は、第1鎖合成のためのランダムプライミングの工程、および/またはdUTPを第2鎖合成に組み込む工程を含むことが企図される。最も典型的には、必須ではないが、アダプターライゲーションは、3’-dTMPオーバーハングを有するアダプターをライゲーションする工程を含み得る。アダプターライゲーションが、p5配列部分、p7配列部分、第1インデックス配列部分、第2インデックス配列部分、第1シーケンシングプライマー結合部位配列部分および/または第2シーケンシングプライマー結合部位配列部分を含むアダプターを使用することが、(特にNGSシーケンシングが使用される場合)さらに好ましい)。最も典型的には、増幅は6~15の間の増幅サイクルにわたって行われる。
【0016】
なおさらなる実施形態では、標的濃縮は、各標的cDNAに対して、それぞれ異なる位置で標的cDNAに結合する複数のハイブリダイゼーションプローブを使用する。したがって、いくつかの態様では、複数のハイブリダイゼーションプローブは、標的cDNAにタイリング様式で(例えば、少なくとも×2のタイリング密度で)結合する。異なる観点から見ると、複数のハイブリダイゼーションプローブは、ステップ長n(nは1~10の整数である)を有するタイリング様式で標的cDNAに結合することができる。特定のタイリングにかかわらず、複数のハイブリダイゼーションプローブの各々が100~150塩基の長さを有することが一般に好ましい。容易に理解されるように、第1および第2の標的濃縮cDNAライブラリは、シーケンシング、記録保持などのためにさらに増幅され得る。
【0017】
したがって、企図される方法はまた、第1および第2の標的濃縮cDNAライブラリまたは増幅された第1および第2の標的濃縮cDNAライブラリをシーケンシングし、それによってそれぞれ第1および第2の配列データセットを生成する工程を含む。同様に容易に認識されるように、第1および第2のデータセットは、典型的には、配列情報を含み、ならびに定量的情報(例えば、TPMデータまたはコピー数データ)を提供する。
【0018】
本発明の主題の別の態様では、本発明者は、生体液の試料からcfRNAおよびcfTNAを得る工程、ならびにcfRNAおよびcfTNAから第1および第2それぞれのcDNAライブラリを作製するさらなる工程を含む、cfTNA中の突然変異を増強された感度で検出する方法を企図する。さらに別の工程では、第1および第2のcDNAライブラリの各々を、複数の標的cDNAを濃縮する標的濃縮に供し、それによって第1および第2それぞれの標的濃縮cDNAライブラリを作製し、さらに別の工程では、第1および第2の標的濃縮cDNAライブラリをシーケンシングする(例えば、NGSシーケンシングを使用する)。次いで、第1および第2の標的濃縮cDNAライブラリからのシーケンシング結果を使用して、それによって、同じ試料からのシーケンシングcfRNAまたはcfDNA単独と比較して高い感度で突然変異を検出する。
【0019】
必ずしもそうとは限らないが、最も典型的には、生体液からcfTNAを得る工程は、cfRNAとcfDNAの同時単離を使用する。そのような方法および他の方法では、cfTNAが、17塩基~200塩基の間のサイズを有するcfRNA断片、および50塩基~300塩基の間のサイズを有するcfDNA断片を含むか、またはcfTNAが、30塩基~250塩基の間のサイズを有するcfRNA断片、および75塩基~400塩基の間のサイズを有するcfDNA断片を含むことが一般に好ましい。異なる観点から見ると、cfRNA断片およびcfDNA断片は、すべてのcfTNAの少なくとも30%または少なくとも40%を一緒に構成することが企図される。
【0020】
標的濃縮は、各標的cDNAに対して、それぞれ異なる位置で標的cDNAに結合する複数のハイブリダイゼーションプローブを使用することがさらに企図される。例えば、複数のハイブリダイゼーションプローブは、標的cDNAにタイリング様式で、好ましくは少なくとも×2のタイリング密度で結合する。したがって、複数のハイブリダイゼーションプローブは、ステップ長n(nは1~10の間の整数である)のタイリング様式で標的cDNAに結合することができる。他の選択肢としては、複数のハイブリダイゼーションプローブの各々が100~150塩基の長さを有することが一般に好ましい。
【0021】
さらに、シーケンシングの工程は、ペアエンドシーケンシングを含むこと、および/またはシーケンシングが少なくとも20倍の読み取り深度まで実行されることが企図される。企図される方法において、突然変異を検出する工程は、単一ヌクレオチド変化、1つ以上のヌクレオチドの挿入、1つ以上のヌクレオチドの欠失、逆位、転座およびコピー数変異のうちの少なくとも1つを検出する。さらに、企図される方法はまた、変異対立遺伝子画分の決定を可能にする。有利には、固有の突然変異の検出および/または変異対立遺伝子断片検出の感度は、cfDNA単独と比較して増強される。
【0022】
本発明の主題のさらなる態様では、本発明者はまた、生体液のcfTNAのcfDNA枯渇cfRNA画分を含む第1の試薬および同じ生体液のcfTNAを含む第2の試薬を含み得る配列分析用試薬キットを企図する。最も典型的には、生体液はヒトの血漿または血清である。例えば、第1の試薬は、主に17塩基~200塩基の間のサイズを有するcfRNA断片および主に50塩基~300塩基の間のサイズを有するcfDNA断片を含み得、および/または第2の試薬は、主に17塩基~200塩基の間のサイズを有するcfRNA断片を含む。最も典型的には、cfRNA断片およびcfDNA断片は、すべてのcfTNAの少なくとも30%または少なくとも40%を一緒に構成する。いくつかの実施形態では、第1の試薬は第2の試薬から調製され得る。
【0023】
本発明の主題のさらに別の態様では、本発明者は、第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリを含み得る配列分析用試薬キットであって、第1の標的濃縮cDNAライブラリが生体液のcfTNAのcfDNA画分を含まず、第2の標的濃縮cDNAライブラリが同じ生体液のcfTNAのcfDNA画分を含む試薬キットを企図する。
【0024】
所望であれば、第1および第2の標的濃縮cDNAライブラリは、同じ標的cDNAを使用して標的濃縮され、および/または標的cDNAは、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子、または受容体関連遺伝子をコードする。第1および第2の標的濃縮cDNAライブラリのそれぞれのcDNAは、p5配列部分、p7配列部分、第1のインデックス配列部分、第2のインデックス配列部分、第1のシーケンシングプライマー結合部位配列部分、および第2のシーケンシングプライマー結合部位配列部分のうちの少なくとも1つを含み得ることがさらに企図される。有利には、第1および/または第2の標的濃縮cDNAライブラリのcDNAは、標的cDNAに対応する、生体液中に存在する全核酸の少なくとも90%に相当する。
【0025】
したがって、本発明の主題のさらに別の態様では、本発明者は、50塩基以下のサイズを有するRNAの結合を可能にし、100塩基以下のサイズを有するDNAの結合を可能にする表面およびサイズを有する複数のナノ粒子を含む配列分析用試薬キットを企図する。そのようなキットは、標的遺伝子に対する配列相補性を有する複数の標的濃縮オリゴヌクレオチドをさらに含み、標的濃縮オリゴヌクレオチドの少なくとも一部が、同じ標的遺伝子の異なる部分にハイブリダイズする。
【0026】
少なくともいくつかの実施形態では、複数のナノ粒子は、30塩基以下のサイズを有するRNAの結合を可能にし、80塩基以下のサイズを有するDNAの結合を可能にする表面およびサイズを有し得るか、または20塩基以下のサイズを有するRNAの結合を可能にし、60塩基以下のサイズを有するDNAの結合を可能にする表面およびサイズを有し得る。最も典型的には、必須ではないが、複数のナノ粒子は常磁性ナノ粒子である。標的濃縮オリゴヌクレオチドに関して、複数の標的濃縮オリゴヌクレオチドは、各標的cDNAに対して、それぞれ異なる位置で標的cDNAに結合する複数のハイブリダイゼーションプローブを含むことが典型的に好ましい。例えば、複数のハイブリダイゼーションプローブは、タイリング様式で標的cDNAに結合することができ、複数のハイブリダイゼーションプローブは、少なくとも×2のタイリング密度を提供する。したがって、適切なハイブリダイゼーションプローブは、ステップ長n(nは1~10の間の整数である)のタイリング様式で標的cDNAに結合することができる。さらなる例では、複数のハイブリダイゼーションプローブの各々は、100~150塩基の長さを有し得る。さらに、企図されるキットはまた、逆転写酵素、リガーゼ、およびペアエンドシーケンシングに適した複数の異なるアダプターのうちの少なくとも1つを含み得る。
【0027】
したがって、本発明者はまた、本発明の主題のさらに別の態様において、第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし、それによって第1および第2それぞれの配列データセットを得る工程を含む、対象の核酸データを分析する方法を企図する。最も典型的には、第1の標的濃縮cDNAライブラリは対象の生体液のcfTNAから調製され、cfTNAのcfDNA画分を含まず、第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAから調製され、cfTNAのcfDNA画分を含む。そのような方法のさらなる工程では、第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異が同定され、少なくとも第1の配列データセット中の少なくとも1つの遺伝子について発現レベルが決定される。いくつかの態様では、シーケンシングの工程はペアエンドシーケンシングである。
【0028】
第1および第2の標的濃縮cDNAライブラリの使用は、第1の標的濃縮cDNAライブラリ単独の突然変異の検出と比較して、突然変異の検出の感度が増強することに留意すべきである。好ましくは、必須ではないが、第1および第2の標的濃縮cDNAライブラリは、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAが濃縮されており、任意選択的に、第1および第2の標的濃縮cDNAライブラリは、臨床経過、治療に対する応答または疾患の再発の診断または決定のために、特定の疾患に特異的な標的cDNAが濃縮されている。
【0029】
さらに、そのような方法はまた、機械学習アルゴリズムにおいて第1および第2の配列データセットを使用して、疾患パラメータに関連する1つ以上の遺伝子を同定する工程を含み得ることが企図される。例えば、適切な疾患パラメータは、がんの存在、がんのタイプ、がんの再発、および/または残存がんである。追加的または代替的に、そのような方法は、機械学習アルゴリズムにおいて第1および第2の配列データセットを使用して、細胞遺伝学的パラメータ(例えば、染色体の少なくとも一部の転座および/または欠損または重複)に関連する1つ以上の遺伝子を同定する工程を含み得ることが企図される。同様に、そのような方法は、機械学習アルゴリズムにおいて第1および第2の配列データセットを使用して、免疫組織化学的パラメータ(例えば、細胞表面受容体の存在もしくは量および/または細胞表面酵素の存在もしくは量)に関連する1つ以上の遺伝子を同定する工程を含み得ること、ならびに/あるいはそのような方法は、モデルにおいて第1および第2の配列データセットを使用して、それによって、疾患パラメータ、細胞遺伝学的パラメータ、および/または免疫組織化学的パラメータを同定する工程を含み得ることが企図される。容易に理解されるように、そのような方法は、1つ以上の突然変異および/または定量された発現に基づいて治療を投与する工程をさらに含み得る。
【0030】
結果として、本発明者らはまた、第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし(ペアエンドシーケンシング配列決定を使用して)、それによって第1および第2それぞれの配列データセットを得る工程を含む、対象のがんを分類する方法を企図する。好ましくは、第1の標的濃縮cDNAライブラリは対象の生体液のcfTNAのcfDNA画分を含まず、一方第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAのcfDNA画分を含む。そのような方法のさらなる工程では、第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異が同定され、少なくとも第1の配列データセット中の1つ以上の遺伝子について発現レベルが定量される。そのようにして同定された突然変異および定量された発現レベルは、次いで、トレーニング済みモデルに使用され、それによって対象のがんを分類することができる。
【0031】
いくつかの態様では、第1および第2の標的濃縮cDNAライブラリは、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAが濃縮されている。例えば、トレーニング済みモデルは、がんが存在する、再発している、もしくは残存しているとしてがんを分類することができ、またはトレーニング済みモデルは、がんを固形がん、肉腫、またはリンパ腫として分類することができる。最も典型的には、トレーニング済みモデルは、ベイズ分類器による機械学習を使用して構築される。容易に明らかであるように、企図される方法はまた、がんの分類に基づいて治療を投与する工程を含み得る。
【0032】
したがって、異なる観点から見ると、本発明者は、第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし(ペアエンドシーケンシングを使用して)、それによって第1および第2それぞれの配列データセットを得る工程を含む、対象を治療する方法を企図する。好ましくは、第1の標的濃縮cDNAライブラリは対象の生体液のcfTNAのcfDNA画分を含まず、一方第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAのcfDNA画分を含む。そのような方法のさらなる工程は、第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異を同定する工程、および少なくとも第1の配列データセット中の各遺伝子について発現レベルを定量する工程を含む。次いで、同定された突然変異および定量された発現レベルに基づいて治療が投与される。
【0033】
前述のように、第1および第2の標的濃縮cDNAライブラリは、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAが濃縮されていることが企図される。したがって、治療は、化学療法剤、免疫刺激剤、チェックポイント阻害剤、および/またはがんワクチンを投与する工程を含み得る。治療は、好ましくは、同定された突然変異および定量された発現レベルを使用するモデル(例えば、ベイズ分類器トレーニング済みモデル)に基づくことも理解されたい。
【0034】
最後に、本発明者は、それぞれの標的cDNAにハイブリダイズする複数の標的濃縮プローブを含む、生体液から得られたcDNAの配列分析用試薬キットであって、標的cDNAががん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子および/または受容体関連遺伝子をコードする試薬キットを企図する。所望であれば、標的濃縮プローブの各々は、固相捕捉のための配列部分、固相捕捉のための化学修飾、または磁気ビーズをさらに含み得る。最も典型的には、標的cDNAは、生体液のcfTNAおよびcfRNAから調製される。いくつかの実施形態では、標的cDNAは、以下の表1の遺伝子をコードする。
【0035】
本発明の主題の様々な目的、特徴、態様および利点は、好ましい実施形態の以下の詳細な説明と併せて、同様の符号が同様の構成要素を表す添付の図面からより明らかになるであろう。
【図面の簡単な説明】
【0036】
【
図1】
図1は、本明細書に記載の標的濃縮を使用した、試料中のcfRNA、cfTNAおよびcfDNAを使用した突然変異カウントを示す例示的なグラフである。
【
図2】
図2は、本明細書に記載の標的濃縮を使用した、試料中のcfTNAおよびcfDNAを使用した変異対立遺伝子頻度(VAF)を示す例示的なグラフである。
【
図3】
図3は、本明細書に記載の標的濃縮を使用した、試料中のcfRNAおよびcfTNAを使用した変異対立遺伝子頻度を示す例示的なグラフである。
【
図4】
図4は、cfTNAと比較してcfRNAを使用する、変異対立遺伝子頻度(VAF)検出を検出する例示的なグラフである。
【
図5】
図5は、マントル細胞リンパ腫の診断ツールとしての、CD22に対するCCND1の相対的発現を示す例示的なグラフである。
【
図6】
図6は、慢性リンパ球性リンパ腫の診断ツールとしての、CD22に対するCCND1の相対的発現を示す例示的なグラフである。
【
図7】
図7は、固形がん(乳がん)の診断ツールとしてのMUC1の発現を示す例示的なグラフである。
【
図8】
図8は、固形がん(乳がん)の診断ツールとしてのHER2の発現を示す例示的なグラフである。
【
図9】
図9は、本明細書に記載の標的濃縮を使用した、一般的ながん検出(すべてのタイプ)についてのトレーニング済みモデルの例示的なグラフである。
【
図10】
図10は、本明細書に記載の標的濃縮を使用した、特定のがんサブタイプ(リンパ系新生物)検出についてのトレーニング済みモデルの例示的なグラフである。
【
図11】
図11は、本明細書に記載の標的濃縮を使用した、特定のがんサブタイプ(骨髄系新生物)検出についてのトレーニング済みモデルの例示的なグラフである。
【
図12】
図12は、本明細書に記載の標的濃縮を使用した、特定のがんサブタイプ(固形新生物)検出についてのトレーニング済みモデルの例示的なグラフである。
【
図13】
図13は、本明細書に記載の標的濃縮およびTPM/CNVデータを使用した、特定のがんサブタイプ(固形新生物)検出についてのトレーニング済みモデルの例示的なグラフである。
【
図14】
図14は、本明細書に記載の標的濃縮およびTPM/CNVデータを使用した、特定のがんサブタイプ(骨髄系新生物)検出についてのトレーニング済みモデルの例示的なグラフである。
【
図15】
図15は、本明細書に記載のcfRNAからのRNAシーケンシングを使用した、急性リンパ芽球性白血病を有する患者の染色体転座を示す例示的なグラフである。
【
図16】
図16は、本明細書に記載のcfRNAからのRNAシーケンシングを使用した、急性骨髄性白血病を有する患者の染色体転座を示す例示的なグラフである。
【
図17】
図17は、CNVkitアプローチのような標準的なアプローチを使用した、急性リンパ芽球性白血病を有する小児患者における染色体構造異常を示す例示的なグラフである。
【
図18】
図18は、CNVkitアプローチのような標準的なアプローチを使用した、急性リンパ芽球性白血病を有する小児患者における染色体構造異常を示す別の例示的なグラフである。
【
図19】
図19は、cfRNAを使用した、循環中のがん特異的突然変異(再発/微小残存疾患)の存在の予測を示す例示的なグラフである。
【
図20】
図20は、cfTNAを使用した、循環中のがん特異的突然変異(再発/微小残存疾患)の存在の予測を示す例示的なグラフである。
【発明を実施するための形態】
【0037】
本発明者は、血液などの生体液から単離された無細胞核酸の分析に関連する多くの困難が、cfTNAおよびcfRNAならびにそれらの断片を同じ試料から単離し、そのようにして得られた試料を逆転写に供してそれぞれのcDNAライブラリを作製するシステムおよび方法を使用して克服され得ることを今回発見した。分析をさらに改善するために、次いで、cDNAライブラリを、(ハイパー)タイリングハイブリダイゼーションプローブを使用する標的濃縮に供して、その後増幅、NGSシーケンシングおよびインシリコ分析する。
【0038】
特に、本明細書に提示されるシステムおよび方法は、現在知られている方法と比較して核酸の損失を回避するだけでなく、顕著な感度および特異性で突然変異の優れた検出も提供する。実際、目的の遺伝子をコードする循環核酸の圧倒的多数(実質的にすべてではないにしても)は、それらの物理的完全性、コピー数、および発現の強度にかかわらず、本明細書に提示されるシステムおよび方法を使用して調査することができることを理解されたい。その結果、本明細書に提示される方法によって得られたシーケンシングデータは、循環核酸の非常に正確で包括的な提示を提供するだけでなく、機械学習が、がん、がんのタイプ、微小残存疾患などを識別するために、高い信頼性(例えば、AUC≧0.7、より典型的にはAUC≧0.8)で使用できるトレーニング済みモデルの生成を可能にする。同様に、本明細書に提示されるシステムおよび方法はまた、高い信頼性でがんサブタイプを識別可能にする。
【0039】
例えば、1つの典型的な方法では、生体液は、EDTA含有採血管に採取された末梢血であり、血漿画分は、当技術分野で周知の遠心分離を介して血液から調製される。次いで、全核酸(cfTNA)は、少なくとも50塩基対のサイズを有するDNAおよび少なくとも17ヌクレオチドのサイズを有するRNAの回収に適したシリカ系ビーズを使用して血漿試料から抽出される。これに関連して、そのように回収された核酸は、全長遺伝子および転写産物ならびにそれらのすべての断片を、そのような断片が非常に小さい場合(例えば、<150bp/nt、または<100bp/nt、または<75塩基bp/nt、さらにより小さい)であっても含むことに留意されたい。次いで、そのように単離されたcfTNAの少なくともいくつかを2つの部分に分割し、2つの部分のうちの1つをDNAse処理に供して、対応するcfRNAを得る。有利には、この工程は、DNAに対してRNAについて試料を濃縮し、独立しているが対応する試料として機能し得る(未処理cfTNA試料中のDNA/RNA量は、典型的には80%/20%~95%/5%である)。したがって、2つの異なる試料(cfTNAおよびcfRNA)が同じ生体液から生成されることを認識すべきである。
【0040】
次いで、2つの異なる試料のそれぞれを、第1鎖合成(典型的には小さいランダムプライマーを用いる)、第2鎖合成(鎖特異性のためにdUTPを用いて実施し得る)およびAテーリングによる任意選択のrRNA枯渇後に逆転写に供する。次いで、そのようにして得られた第1および第2のcDNAライブラリを3’-dTMPアダプターにライゲーションする。この時点で、cfTNAから調製されるcDNAライブラリは、アダプターもライゲーションされたcfDNAも含むことに留意すべきである。第1および第2のcDNAライブラリの両方をPCRを用いて増幅し、各増幅反応物をさらなる処理のためにクリーンアップする。容易に理解されるように、適切なアダプターが以下でより詳細に説明するように使用された場合、多重化のために複数のサンプルを組み合わせることができる。
【0041】
次いで、そのように増幅された第1および第2のcDNAライブラリを、各標的遺伝子に対する複数のタイリングハイブリダイゼーションプローブを使用して標的遺伝子濃縮に供する。最も典型的には、標的遺伝子または転写産物全体が、ステップ長1~10の間を有するハイブリダイゼーションプローブによって標的化される(すなわち、第1および第2のハイブリダイゼーションプローブは、1~10ntの間の直線距離で標的配列に結合する)。ハイブリダイゼーションプローブが100~150ntの長さを有することがさらに好ましい。本実施例では、標的遺伝子は、1つ以上のがん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子、および/または受容体関連遺伝子をコードする遺伝子であり、1458個の標的遺伝子の例示的な集合を以下の表1に示す。ハイブリダイゼーションを液相で少なくとも8時間にわたって行い、捕捉されたcDNAを磁気ビーズを用いて取り外すことになる。
【0042】
標的核酸の単離により、第1および第2の標的濃縮cDNAライブラリが得られ、次いで、それらをさらなる増幅(典型的には6~15増幅サイクルの間)に供し、次いで、そのように増幅された標的濃縮cDNAライブラリを、NGSシーケンシング(典型的にはペアエンドシーケンシング)を使用してシーケンシングする。シーケンシングの終了時に、第1および第2の標的濃縮cDNAライブラリのデータを、逆畳み込み、突然変異体および融合呼び出し、発現レベル決定、CNV/SNP変異体の同定、ならびに対立遺伝子画分およびゲノム再編成の決定のために処理する。さらに、また、以下により詳細に示されるように、第1および/または第2の標的濃縮cDNAライブラリのデータの一部または全部を、トレーニング済みモデルの作製に使用することができ、および/またはがんの存在を同定するために、がんを分類またはさらにサブタイプに分類するために、残存疾患を検出するために、および細胞遺伝学的変化(例えば、転座、コピー数の変化など)を検出するために、1つ以上のトレーニング済みモデルで使用することができる。
【0043】
適切な生体液に関して、全血、血漿、および血清以外の多数の生体液も本明細書での使用に適切であると見なされ、適切な液は、無細胞核酸を含有することができる、または含有することが疑われるすべての液を含むことを理解されたい。また、容易に理解されるように、生体液は、任意の適切な供給源から、特にヒトまたは非ヒト哺乳動物(家畜、コンパニオンアニマルなど)から得ることができる。さらに、ヒトまたは他の哺乳動物は、健康であっても、または状態もしくは疾患を有すると診断されているか、もしくは有することが疑われていてもよく、特にそのような疾患が1つ以上の遺伝子の突然変異および/または(過剰または過小)発現パターンに関連し得るかまたはそれに起因し得ることに留意すべきである。したがって、対象は、cfRNAおよびcfTNAが対象から得られるときに、治療未経験であっても、または治療を受けていてもよい。異なる観点から見ると、cfRNAおよびcfTNAの使用は、疾患の検出、疾患の進行の監視、疾患を治療するために行われる治療の治療効果の監視、ならびに残存または再発性疾患の検出に特に有益である。
【0044】
したがって、企図される液には、唾液、尿、滑液、脳脊髄液、嚢胞液(例えば、膵臓嚢胞)および腹水が含まれる。結果として、生体液のタイプに応じて、固体担体(例えば、シリカまたはアミン修飾担体)への吸着による単離、多塩基性材料への非共有結合(特にタンパク質)、電気泳動または他の電気化学的分離、マイクロ流体分離などを含む、cfRNAおよびcfTNAの多数の公知の単離方法が企図されることに留意されたい。しかしながら、cfRNAおよびcfTNAの特に好ましい単離方法には、固相吸着を使用するものが含まれる。
【0045】
さらに、本明細書に提示される方法およびシステムのための試料は、必ずしも液に限定される必要はないが、そのようなシステムおよび方法は、核酸の含有量が低い任意の試料と組み合わせて使用することができ、そのような核酸が少なくともある程度の分解を受けている可能性があることも認識されるべきである。したがって、さらに企図される試料には、生検標本(例えば、未加工または加工されていてもよい、針芯、塗抹標本、ブラシなど)、組織スライド(FFPE固定または非固定)、微小または残存法医学組織試料、古い組織からの試料(例えば、100歳超)などが含まれる。
【0046】
単離方法にかかわらず、単離されたcfRNAおよびcfDNAは、(特定の標的遺伝子または転写産物に関して)完全長核酸を表すだけでなく、様々な程度の長さを有するその断片も表すことを理解されたい。実際、cfTNAおよびcfRNAの特定の供給源材料に起因して、単離された材料は、主に(例えば、少なくとも50%、または少なくとも60%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%の)複数の標的遺伝子およびその転写産物の断片を含むことが予想される。したがって、複数の標的遺伝子および転写産物の大部分は、1,000bp/nt未満に等しい、または900bp/nt未満に等しい、または800bp/nt未満に等しい、または700bp/nt未満に等しい、または600bp/nt未満に等しい、または500bp/nt未満に等しい、または400bp/nt未満に等しい、または300bp/nt未満に等しい、さらにはそれ未満の長さを有することが企図される。
【0047】
異なる観点から見ると、本明細書で企図される手順を使用して単離されたcfRNAの少なくとも一部は、15~50ntの間、または20~75ntの間、または17~100ntの間、または20~150ntの間、または20~200ntの間、または50~300ntの間の長さ範囲を有し得る。同様に、本明細書で企図される手順を用いて単離されたcfTNA中に存在するcfDNAの少なくとも一部は、50~100bpの間、または75~150bpの間、または75~200bpの間、または100~300bpの間、または50~350bpの間の長さ範囲を有し得る。したがって、cfRNAおよびcfTNAの全体的なサイズ分布は、100~200bp/ntの間、または150~250bp/ntの間、または200~300bp/ntの間の長さ、典型的には50~400bp/ntの間または75~500bp/ntの間の長さ分布幅(すべての単離された核酸の90%を被覆する)でピークを有し得る。
【0048】
さらに企図される態様では、cfRNA画分がcfTNA単離の親体積から調製されることが一般に好ましいが、cfRNA画分はまた、cfRNAのみを選択的に単離するように設計された方法および材料を使用して、または試料の第2の異なる体積からのいずれかで、同じ試料由来のcfTNAから別個に調製され得ることを理解されたい。代替的には、cfRNAおよびcfDNAを同じ生体液から別々に単離してもよく、様々な割合の単離されたcfRNAおよびcfDNA(例えば、約5~15%のcfRNAと85~95%のcfDNA、または約15~25%のcfRNAと75~85%のcfDNA、または約30~50%のcfRNAと50~70%のcfDNA)からcfTNA画分を再構成してもよい。
【0049】
容易に理解されるように、cfRNAおよびcfTNA試料中の単離されたcfRNA分子の逆転写は、当技術分野で公知のすべての標準的なプロトコルに従うことができる。さらに、cfRNAおよびcfTNA試料は、リボソームRNAを除去するために前処理され得ることを理解されたい。さらに、望ましい場合、cfRNAおよびcfTNA試料はまた、マグネシウムの存在下での熱処理、または剪断、および/または超音波処理を使用してサイズ断片化に供され、例えば200~400塩基対/ヌクレオチドの間の平均サイズを有する断片化分子の集団を生成し得る。最も典型的には、逆転写は、特に第1鎖合成のためにユニバーサルプライマーを利用する。第2鎖合成も確立された手順に従うことができ、オリゴTプライマー、ランダムプライマー、および/または標的化第2鎖プライマー(例えば、標的濃縮リストからの配列を使用すること)の使用を含み得る。同様に、第2鎖合成は、dUTP取り込みを使用して鎖特異的であり得ることが企図される。cDNA作製の方法にかかわらず、そのようにして作製されたcDNAライブラリは、cDNAライブラリメンバーへのアダプターライゲーションを容易にするAテーリング(単一アデノシンの付加)に供されることが好ましい(典型的には、3’-dTMPオーバーハングを有するdsDNAアダプターを使用して、Aテーリングされたライブラリメンバーへのライゲーションを可能にする)。
【0050】
同様に、アダプターの選択は、本明細書に提示された本発明の主題を限定するものではなく、アダプターの選択は、典型的には下流処理の特定の方法によって駆動されることを認識されたい。例えば、下流処理がIllumina型次世代シーケンシングを使用する場合、アダプターは、典型的には、クラスター形成を可能にするためにフローセルまたはレーン上の相補配列に特異的に結合する配列部分を含む。他のそのような配列部分の中でも、p5およびp7配列部分は、本明細書での使用に特に適していると考えられる。さらに、特に試料が多重化される場合、企図されるアダプターはまた、シーケンシング後の逆畳み込みを可能にする固有の第1および/または第2のインデックス部分を含み得る。同様に容易に認識されるように、アダプターは、通常、ペアエンドシーケンシングを可能にするための適切なシーケンシングプライマー結合部位配列部分を含む。しかし、特にシーケンシングがペアエンドシーケンシングではない場合(例えば、ナノポアシーケンシング、一分子リアルタイムシーケンシング、イオントレントシーケンシング、SOLiDシーケンシングなど)、様々な代替アダプターを使用することができ、またはさらにはアダプターを使用しなくてもよい態様がさらに企図される。次いで、そのようにして得られた第1および第2のcDNAライブラリを、所望の標的遺伝子セットについて増幅および/または濃縮することができる。この時点で、第1および第2のcDNAライブラリは同じ生体液から(最も典型的には同じcfTNA単離物から)調製されたので、これらの2つのcDNAライブラリは、同じ試料の2つの異なるが相補的な図を表す:1つは(DNAに対して)RNAが濃縮されており、もう1つは(RNAに対して)DNAが豊富である。
【0051】
標的濃縮に関して、第1および第2のcDNAライブラリを(好ましくはアダプターライゲーション後)標的濃縮に供して、目的の遺伝子を選択してライブラリを濃縮することが企図される。最も典型的には、目的の遺伝子は疾患または状態に関連するが、一般的な健康状態または年齢または他の非健康関連状態に基づいて選択することもできる。例えば、目的の疾患関連遺伝子は、典型的には、特定の疾患に関連するかまたは特定の疾患の原因となる1つ以上の遺伝子を含む。とりわけ、疾患ががんである場合、がん関連遺伝子は、がんの存在、がんのタイプ、がんの再発、および/または治療後の残存がんを示し得る。したがって、特に企図される標的遺伝子には、細胞シグナル伝達関連遺伝子(例えば、細胞表面受容体の存在または量を同定するため)、チェックポイント阻害関連遺伝子(例えば、がんの免疫状態を同定するため)、細胞表面酵素をコードする遺伝子、免疫表現型関連遺伝子(例えば、細胞表面受容体の存在もしくは量および/または細胞表面酵素の存在もしくは量を同定するため)、および/または1つ以上の細胞表面受容体をコードする遺伝子が含まれる。さらに、がん特異的遺伝子には、公知の遺伝子の特定の突然変異体型(例えば、キナーゼの融合産物、切断型の細胞表面受容体またはシグナル伝達成分)、ならびに新生物および患者に特異的な突然変異体型(すなわち、腫瘍特異的ネオ抗原および患者特異的ネオ抗原)をコードするものも含まれ得る。したがって、濃縮のために選択された遺伝子を使用して、がんの存在を同定し、特定のがんを分類し、治療に対する臨床経過もしくは応答を決定し、または疾患の再発を同定できることを理解されたい。
【0052】
さらに、本明細書に提示される方法は、がん(または他の疾患細胞)の遺伝子における突然変異を同定するのに有用であるだけでなく、突然変異した遺伝子および突然変異していない遺伝子の発現レベルを決定することができ、疾患の同定および治療に適した臨床情報のさらなる次元を追加することを理解されたい。例えば、そのような追加の情報は、変異遺伝子の単独の同定が、その変異遺伝子が弱くしか発現されないかまたは全く発現されない医薬標的として臨床的に無関係であり得る場合に特に有益である。
【0053】
さらに、本明細書に提示される企図されるシステムおよび方法は、循環核酸分解産物および比較的小さいサイズ(例えば、17~50の間のRNAヌクレオチドおよび/または50~300の間のDNA塩基対)を有する断片を利用するだけでなく、タイリングまたはさらにはハイパータイリング標的濃縮を使用してこれらの断片を特異的に濃縮し、それによって無細胞生体液中に存在するすべての変異体の捕捉を最大化することを認識されたい。例えば、いくつかの実施形態では、各標的遺伝子は、ステップ長n(nは1~5の間の整数である)(すなわち、標的遺伝子に結合し、塩基で発現された場合の第1および第2のハイブリダイゼーションプローブの3’末端の直線距離)でタイリング様式(部分的に重複)に標的cDNAに結合する複数のハイブリダイゼーションプローブによって標的化される。他の実施形態では、nは5~10の間、または10~15の間、または15~20の間、または20~30の間、または30~50の間、または50~70の間、または70~100の間である。したがって、異なる観点から見ると、複数のハイブリダイゼーションプローブは、より長いハイブリダイゼーションプローブが使用される場合、少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または10~20の間、または20~40の間、または40~60の間、およびさらにそれ以上の高いタイリング密度を提供する。結果として、本明細書での使用に適したハイブリダイゼーションプローブの線長は、20~40塩基の間、または40~70塩基の間、または70~100塩基の間、または100~150塩基の間、およびさらにそれ以上の長さであってよいことが認識されるべきである。したがって、ハイブリダイゼーションプローブは、多数の位置で各標的遺伝子の全長を被覆する。当然のことながら、ハイブリダイゼーションプローブは、典型的には、ハイブリダイゼーションプローブと結合した標的との物理的分離を可能にして標的濃縮を容易にする部分を含み、適切な部分には、磁気ビーズ、色分けされたビーズ、親和性剤(例えば、ビオチン、アビジン、hisタグ、セルロース結合タンパク質など)が含まれることに留意すべきである。
【0054】
最も好ましくは、ハイブリダイゼーションプローブは、配列特異的アニーリングを可能にするのに十分な時間、液相中でcDNAライブラリと組み合わされる。容易に理解されるように、ハイブリダイゼーションプローブが長いほど、特異的かつ完全にアニールするのにより長い時間を必要とする。その結果、ハイブリダイゼーションプローブによる標的捕捉は、2~4時間の間、または4~8時間の間、または8~12時間の間の範囲であり得、場合によってはさらに長くなり得る。捕捉されたcDNAのタイプにかかわらず、ハイブリダイゼーションプローブと捕捉されたcDNAとの間に形成されたハイブリッドは、未結合cDNAライブラリメンバーの残りから除去される。これに関連して、そのように濃縮された標的核酸は、(cfRNAの逆転写からの)cfDNA分子およびcDNA分子を含むことが認識されるべきである。さらに、そのように単離され濃縮された標的核酸は、cfTNA画分およびcfRNA画分の全長RNA分子だけでなく、生体液中に元々存在するすべての断片および分解産物も表すことを理解されたい。したがって、循環核酸の捕捉は、疾患細胞から放出される無細胞核酸の有意に改善された提示を提供する。実際、第1および/または第2の標的濃縮cDNAライブラリは、標的cDNAに対応する、生体液中に存在する全核酸の少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも92%、または少なくとも94%、または少なくとも96%、または少なくとも98%を表すことが推定される。
【0055】
シーケンシングを容易にするために、第1および第2の標的濃縮cDNAライブラリを標的特異的増幅に供する。容易に理解されるように、そのような増幅は、アダプターのアンカリング、シーケンシング、および/またはインデックス配列部分を有利に使用することができる(標的特異的配列に起因する増幅バイアスを有益に低減する)。最も典型的には、第1および第2の標的濃縮cDNAライブラリの増幅は、シーケンシング、保管および反復分析のための十分な材料を提供するために6~15増幅サイクルにわたって行われる。既に先に述べたように、特定のシーケンシング方法は本発明の主題を限定するものではないことを理解されたい。しかしながら、シーケンシングは、次世代(例えば、ペアエンド)シーケンシングまたは他のハイスループット法を用いて行われることが一般に好ましい。第1および第2の標的濃縮cDNAライブラリのシーケンシングは、好ましくは、少なくとも10倍、または少なくとも20倍、または少なくとも30倍、または少なくとも40倍、または少なくとも50倍、または少なくとも100倍、さらに必要に応じてそれ以上の深度まで行われる。
【0056】
シーケンシングの方法にかかわらず、2つのデータセットが、増幅され標的濃縮された第1および第2のcDNAライブラリから得られ、これもまた以下でより詳細に考察されるように、異なるが相補的な情報を提供することを理解されたい。有利には、本発明者は、本明細書に提示されるシステムおよび方法の使用により、遺伝子における多種多様な突然変異体、代替転写産物、および発現が不十分または非発現の突然変異の同定および定量、ならびに以下により詳細に示されるようにRNA転写産物に高い不安定性をもたらす突然変異の検出が可能になることを発見した。さらに、本明細書に提示されるシステムおよび方法はまた、cfRNA画分を使用して(突然変異した)標的遺伝子の発現レベルの定量を可能にし、これは、cfTNA画分から得られたコピー数変異情報からさらに解釈可能となる。同様に、企図されるシステムおよび方法は、cfTNA画分およびcfRNA画分の両方が分析される場合、対立遺伝子画分の改善された分析を可能にする。
【0057】
したがって、第1および第2の標的濃縮cDNAライブラリの使用は、突然変異体(例えば、SNV、インデル、転座)検出の感度を有意に増強させる。とりわけ、各細胞から生成されたcDNAに変換されたRNAは、各細胞から生成されたDNAよりも豊富である。したがって、以下により詳細に示されるように、TNAシーケンシングにおけるDNAの同時シーケンシングは、例えば突然変異によるその安定性の変化に起因して、RNAが分解される場合の突然変異の検出を補償する。実際、cfTNA画分およびcfRNA画分から得られたデータは、以下により詳細に示されるように、高い信頼性で疾患、病態および疾患状態の同定およびさらには予測を可能にする機械学習トレーニング済みモデルを介して生成するのに十分であることが認識されるべきである。さらに、cfTNA画分およびcfRNA画分に基づいてそのようにして得られた情報を使用して、免疫表現型および/または免疫組織化学的プロファイルを予測することもできる。以下でさらに詳細に考察するように、cfTNA画分およびcfRNA画分に基づいてそのようにして得られた情報もまた、仮想細胞遺伝学的分析を実施するために使用することができる。
【実施例】
【0058】
核酸抽出(一般プロトコル):特に明記しない限り、すべての核酸抽出は、EDTAバキュテーナーチューブに採取した全末梢血からのものであった。細胞成分から血漿を分離した後、1mlの血漿を使用した。
【0059】
小さな断片化RNAおよびTNAを捕捉するために、本発明者は、元々は循環中のマイクロRNAを捕捉するために設計された方法を適合させた。以下の実施例では、本発明者は市販のキット(Apostle MiniMax High Efficiency cfRNA/cfDNA 単離キット)を使用し、製造業者のプロトコルに従った。cfRNA/cfDNAの単離後、cfTNA試料の半分をDNaseで処理してcfRNA試料を得たが、他方の半分は不変に維持した。次いで、各対象のcfTNAおよびcfRNA試料を並行して処理して、各対象のそれぞれのcDNAライブラリを作製した。逆転写およびアダプターライゲーションを、市販のキット(KAPA RNA HyperPrepキット)を製造者の説明書に従って使用して行った。逆転写およびアダプターライゲーションは、以下の工程を含んでいた:ランダムヘキサマープライマーを使用した第1鎖合成、続いてKAPA RNA HyperPrep Kitプライマーを使用した第2鎖合成、およびAテーリング。A-テーリングが完了したら、インデックス配列部分を有するIllumina NGSアダプターをcfDNAおよびcDNAにライゲーションし、KAPA RNA HyperPrep Kitプライマーを用いて第1および第2のライブラリを14サイクル増幅した。これに関連して、第2鎖合成は、以下でより詳細に論じるように、下流の標的濃縮に使用されている同じオリゴヌクレオチドを好ましくは使用し、それによって感度および特異性を大幅に増強させることを理解されたい。
【0060】
次いで、増幅反応をKingFisherFlexクリーンアップシステムを用いてクリーンアップし、増幅された第1および第2のライブラリを定量した。標的特異的ハイブリダイゼーションプローブ(「標的濃縮プローブ」)とのハイブリダイゼーションのために、Janusによって対象のライブラリから8プレックスDNA試料ライブラリプールを調製した。プローブは、一晩(少なくとも8時間)のハイブリダイゼーションのために合計1458個の遺伝子(表1に列挙)をカバーするGTC設計KAPA標的濃縮プローブであった。表1の標的遺伝子の各遺伝子に対する標的濃縮プローブは、60ヌクレオチドの長さを有し(したがって、1~60の間のステップ長が提供される。特定のステップ長がプライマー設計ソフトウェアによって決定されるであろう)、2~59の間のタイリング密度をもたらした。標的ハイブリダイゼーション後、KAPAビーズを使用して多重化DNAライブラリを捕捉し、各ライブラリを増幅して第1および第2の標的濃縮cDNAライブラリを得た。次いで、第1および第2の標的濃縮cDNAライブラリをクリーンアップし、Agilent TapeStation分析装置を用いて確認した。次いで、各ライブラリを正規化し、プールし、変性させ、ペアエンド100×2サイクルを用いてシーケンシングのためにNovaseq 6000シーケンサーにロードした。
【表1】
【0061】
シーケンシング実行が終了した後、データをbcl2fastq2 Software v.2.20.0で実行してデマルチプレックス(de-multiplex)した。その後の配列分析には、融合呼び出しのためのDragen 3.8 RNA seqパイプライン、発現レベル(TPMで測定)の決定のためのSalmon v1.4.0、CNV呼び出しの決定のためのcnvkit、および突然変異呼び出しを得るためのVCF用RNA-Seq Alignment v.2.0.2-BaseSpace Sequence Hub Appが含まれた。
【0062】
患者試料:160人の個体の末梢血試料をEDTAチューブに採取した。以下の表2に示すように、これらの個体のうち、31人は健常対照であり、129人は骨髄系腫瘍(22)、リンパ系腫瘍(73)または固形腫瘍(34)の病歴を有する患者であった。これらの試料の血漿1mlから全核酸を抽出し、表1の遺伝子を使用して上記のように逆転写および標的濃縮を行った。
【表2】
【0063】
各患者の標的濃縮cDNAライブラリの配列分析(各患者のcfTNAおよびcfRNA画分に基づく)により、有意に多数の突然変異がcfRNA画分から検出され得ることが明らかになった。
図1から明らかに分かるように、同じ遺伝子濃縮パネルを使用したcfTNAと比較して、cfRNAのみを使用して有意により多くの突然変異が検出された。特に、275個の遺伝子を有する公知のDNAパネルに基づく日常的な試験で検出された突然変異の数は、同定された突然変異体が実質的に少なかった。cfRNA試験で検出された突然変異の数が、cfTNAまたはcfDNAを使用した場合よりも有意に高かったことは注目に値する。cfRNAおよびcfTNAの試験に使用される遺伝子の数もまた、DNAで使用される遺伝子(275遺伝子)よりも有意に多かった(1485遺伝子)。しかしながら、275個の遺伝子パネルは臨床的に関連する発がん性遺伝子のほとんどを含んでいたので、275個の遺伝子に含まれていなかった遺伝子におけるRNA試験では45個の突然変異しか検出されなかった。実際、これらの45個の突然変異は27個の遺伝子に集中していた。これらの知見を考慮すると、cfRNA分析はより感度が高く、有益であることが明確に分かる。しかしながら、cfRNAは、以下により詳細に示されるように、低発現または未発現の突然変異の検出、またはRNAが単離限界を超えて急速に分解される場合には不利である。
【0064】
さらなる一連の分析において、本発明者は、変異対立遺伝子頻度(VAF)/感度に対するcfRNAおよびcfTNAの影響を調査した。より具体的には、本発明者は、両方の方法で突然変異が検出された場合、cfTNAとcfDNAとの間でVAFを比較した。
図2に見られるように、VAFのレベルにおいて2つの方法の間に有意差がある(符号検定[帰無仮説検定]P=0.04)。この比較は、cfTNAが使用される場合、検出された突然変異において実質的に感度がより高いことを明らかに実証する。特定の理論または仮説に限定されるものではないが、本発明者は、そのような差がcfTNA中のcfRNA画分に起因し得ることを企図する。
【0065】
次いで、本発明者は、cfTNAおよびcfRNAの両方を使用した場合の突然変異の包括的検出の潜在的な利益を決定することに着手した。既に上で示したように、cfRNAを使用した場合、cfTNAまたはcfDNAと比較して、より多くの数の突然変異が検出された。しかしながら、本発明者は、特定の変異がcfTNAでは検出され得るが、cfRNAでは検出されないことを発見した。このような違いは、突然変異による翻訳の早期終了が突然変異体RNAの分解の増加をもたらし得るという現象に起因する可能性が最も高い。そのような観察に加えて、(不適切な)スプライシング変異はまた、RNAの早期分解をもたらし得る。全体として、
図3から分かるように、突然変異が両方の分析で検出された場合、cfRNAとcfTNAとの間でVAFに差はなかった。しかし、
図4から明らかなように、いくつかの突然変異はcfTNAと比較してより高いレベルで明確に検出され、逆もまた同様であった。以下の例は、cfDNAでは検出されたが、cfRNAでは検出されなかった多数の突然変異があることを示している。表3は、cfTNAで検出されたが、cfRNAでは検出されなかった突然変異の例を示している。終結につながる突然変異の割合が高いことに留意されたい。残りの突然変異は、高度に不安定化する可能性が高い。
【表3】
【0066】
有意に改善された突然変異体の検出およびVAF決定に加えて、本発明者はまた、本明細書に提示されるシステムおよび方法が、免疫表現型、免疫組織化学プロファイルの正確な予測、ならびにcfRNA発現の定量的分析によるバイオマーカーの診断および測定に適していることを実証した。より具体的には、本発明者は、cfRNA画分および/またはcfTNA画分からの標的化RNAシーケンシングにより、典型的には免疫表現型同定および免疫組織化学(IHC)プロファイリングに使用されるタンパク質の発現レベルを測定することが可能になり、RNAレベルは典型的にはタンパク質レベルを反映し、したがって実際のタンパク質発現の測定の代理として有用であり得るので、選択されたタンパク質の発現レベルを様々な疾患およびがんの診断、予後予測、およびモニタリングにおけるバイオマーカーとして使用可能になることを発見した。
【0067】
例えば、CCND1の(特にCD22に対する)発現レベルは、マントル細胞リンパ腫の診断マーカーとして使用することができる。試験した患者集団の試料を使用して、
図5は、発現レベル(および特に一般的なB細胞マーカーCD22に対する相対的発現レベル)が、個体#3および#6についてマントル細胞リンパ腫の存在を正確に診断できることを実証する。対照的に、
図6から容易に得ることができるように、いずれの慢性リンパ性白血病(CLL)試料も同様の高いCCND1:CD22比を示さなかった。したがって、cfRNA分析からの発現レベルデータは、異なるリンパがんタイプを正確に識別できることを理解されたい。
【0068】
固形腫瘍についても同様に、cfRNA試料中のCA15-3(MUC1)の発現レベルを使用して、
図7の患者#2および#7から分かるように、活動性乳がんを有する試料を他の状態と区別することができる。また、乳がんおよび高ERBB2(HER2)を有するこれらの患者は、
図8に明確に示すように、末梢血cfRNA中のERBB2 mRNAを評価することによって区別することができた。
【0069】
またさらなる一連の実験において、本発明者は、様々なタイプのがんの診断および早期検出のために、機械学習によるcfRNA発現プロファイリングを使用した。一例では、本発明者は、がんの有無を予測するための機械学習アルゴリズムを用いたTPM(Transcripts Per Kilobase Million)プロファイリングによって決定されるcfRNA発現レベルを使用した。このようなシステムでは、特定のがんの存在を予測するために、ならびにこの予測に必要な遺伝子を決定するために開発された機械学習システムを使用して、NGS標的遺伝子の発現レベルを分析した。がんに関連する遺伝子のサブセットを、k分割(k-fold)交差検証手順(k=10)に基づいて、分類システムのために自動的に選択した。個々の遺伝子について、k-1サブセットのトレーニングでナイーブベイズ分類器を構築し、他の試験サブセットで試験した。次いで、トレーニングおよび試験サブセットを回転させ、分類誤差の平均を使用して遺伝子の関連性を測定した。分類システムを、最も関連性の高い遺伝子の選択されたサブセットでトレーニングし、幾何平均ナイーブベイズ(GMNB)を、特定のがんを予測するための分類器として用いた。GMNBは、尤度積(likelihood product)に幾何平均を適用することによる一般化されたナイーブベイズ分類器であり、これにより、高次元性を有する標準的なナイーブベイズ分類器に一般的に関連するアンダーフロー問題が排除される。遺伝子選択およびがん分類のプロセスを反復的に適用して、最適な分類システムおよび目的の特定のがんに関連する遺伝子のサブセットを得た。
【0070】
任意のがんの存在の予測:上記の機械学習アプローチを用いて測定された発現レベルを使用して、上記の160人の患者の分析は、
図9に示すように、表1の1450個の遺伝子を使用して0.786の曲線下面積(AUC)でがんを有する患者を実際に区別できることを示した。この予測は、このシステムに突然変異プロファイリングを追加することによって改善されると予想される。
【0071】
特定のがんの存在の予測:cfRNA発現プロファイリングを開発された機械学習モデルと併せると、特定のがんを予測することができる。例えば、本発明者は、
図10に示されるように、650個の遺伝子を使用して0.848のAUCでリンパ系新生物(びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、慢性リンパ性白血病、急性リンパ芽球性白血病)を有する患者を区別した。同様に、本発明者は、
図11に示されるように、1450個の遺伝子を使用して0.812のAUCで骨髄性がん(急性骨髄性白血病、骨髄異形成症候群、骨髄増殖性新生物など)を有する患者を区別した。同様に、本発明者は、
図12に示されるよう、950個の遺伝子を使用して0.799のAUCで固形腫瘍(乳房、肺、卵巣など)を有する患者を区別した。
【0072】
容易に理解されるように、突然変異プロファイルがcfRNA発現プロファイルに追加される場合、これらの分析のすべてを改善することができる。さらに、予測はまた、特定のがんの存在の予測に使用される変数に、任意のゲノムCNV(コピー数変異)を包含するTPMによって測定されるcfTNAのレベルを加えることによって改善することができる。例えば、固形腫瘍予測AUCは、
図13から分かるように、cfTNAがアルゴリズムに追加された場合、0.799から0.874に有意に改善された。同じように、骨髄がん予測は、
図14に示されるように、改善されたAUC(0.812から0.854)から明らかなように、cfTNAデータを追加することによって有意に改善された。したがって、cfRNAおよびcfDNAの使用は臨床分析を有意に改善し、ひいては個体における治療および予防を改善することをもう一度認識すべきである。
【0073】
またさらなる例では、本発明者はまた、細胞遺伝学的変化の検出においてcfRNAおよびcfTNAを使用した。典型的には、細胞遺伝学的異常は、染色体転座または構造的な増加および/または消失である。企図されるシステムおよび方法を使用して、cfRNAおよびcfTNAの両方の分析は、完全な細胞遺伝学的分析を可能にする。
【0074】
例えば、染色体転座は、染色体転座から生じるRNA融合から検出することができ、本発明者は、RNA融合産物がこれらの染色体転座の検出において有意により信頼性が高いことを発見した。さらに、RNAシーケンシングを使用すると、パートナー遺伝子に関係なく転座を検出することができる。本発明者は、cfRNAシーケンシングによって、様々な融合mRNAを検出することができた。例えば、本発明者は、
図15に見られるように、急性リンパ芽球性白血病を有する小児患者におけるt(12;21)(p13;q22)RUNX1-ETV6を検出することができる。別の例において、
図16から得ることができるように、t(8;21)(q22;q22)RUNX1-RUNX1T1が、急性骨髄性白血病を有する患者において検出された。
【0075】
さらに、企図されるシステムおよび方法はまた、様々な染色体構造異常の検出を可能にする。例えば、cfTNAシーケンシングを使用することにより、CNVkitアプローチなどの標準的なアプローチを使用して染色体構造異常の分析が可能になる。
図17および
図18は、急性リンパ芽球性白血病を有する小児患者におけるcfTNAデータを示し、cfRNAおよびcfTNA分析により、染色体転座および/または構造的な増加もしくは消失のための完全な細胞遺伝学的分析を行うことができることが確認される。
【0076】
最後に、本発明者はまた、cfRNAおよび/またはcfTNAの発現プロファイルを使用することが、微小残存疾患の検出のために使用され得ることを発見した。より具体的には、cfRNAまたはcfTNAの発現プロファイルを機械学習アプローチと併せて使用することにより、末梢血循環において突然変異を示す活動性がんを有する患者の予測が可能になった。cfRNAを使用して、本発明者は、
図19に示されるように、循環中の突然変異の存在を0.718のAUCで予測することができ、一方cfTNAを使用して、本発明者は、
図20に示されるように、循環中の突然変異の存在を0.735のAUCで予測することができた。
【0077】
したがって、上記を考慮して、試料中のRNAおよびDNA(特にcfTNA/cfRNA)の両方を定量し、生物学的事象(診断、治療に対する応答、予後...)を予測するためのバイオマーカーを開発するために両方を使用することは、分子医学にとっても新規かつ高感度である。実際、RNAと同じ様式でDNAを定量することの1つの重要な利点は、ゲノムの増加および消失を評価することである。これをRNA情報に加えると、新しいバイオマーカーの発見が大幅に改善される。さらに、本明細書に提示されるシステムおよび方法はRNAを保持し、ハイブリッド捕捉を使用して試料中のDNAからcDNA/RNAおよびエクソンを引き出すことを理解されたい。
【0078】
いくつかの実施形態では、本発明の特定の実施形態を説明および特許請求するために使用される成分の量、濃度などの特性、反応条件などを表す数は、場合によっては「約」という用語によって修飾されると理解されるべきである。したがって、いくつかの実施形態では、明細書および添付の特許請求の範囲に記載された数値パラメータは、特定の実施形態によって得られることが求められる所望の特性に応じて変化し得る近似値である。本明細書における値の範囲の列挙は、単に、その範囲内に入る各別個の値を個別に参照する簡略方法として役立つことを意図している。本明細書に別段の指示がない限り、各個々の値は、本明細書に個別に列挙されているかのように本明細書に組み込まれる。
【0079】
本明細書で使用される場合、医薬組成物または薬物を「投与する」という用語は、医薬組成物または薬物の直接および間接投与の両方を指し、医薬組成物または薬物の直接投与は、典型的には医療専門家(例えば、医師、看護師など)によって行われ、間接投与は、直接投与(例えば、注射、注入、経口送達、局所送達などを介して)のために医薬組成物または薬物を医療専門家に提供または利用可能にする工程を含む。状態、疾患の発症についての感受性、または意図される治療に対する応答を「予後判定する」または「予測する」という用語は、対象における状態の進行速度、改善、および/または持続期間を含む、状態、感受性および/または応答を予測する行為または予測(しかし、その治療または診断ではない)を包含することを意味することにさらに留意すべきである。
【0080】
本明細書に記載のすべての方法は、本明細書に別段の指示がない限り、または文脈と明らかに矛盾しない限り、任意の適切な順序で実行することができる。本明細書の特定の実施形態に関して提供されるありとあらゆる例または例示的な言語(例えば、「など」)の使用は、単に本発明をよりよく明らかにすることを意図しており、特許請求される本発明の範囲を限定するものではない。本明細書のいかなる言語も、本発明の実施に不可欠な、特許請求されていない要素を示すと解釈されるべきではない。
【0081】
コンピュータを対象とする任意の言語は、サーバ、インターフェース、システム、データベース、エージェント、ピア、エンジン、モジュール、コントローラ、または個別にまたは集合的に動作する他の種類のコンピューティングデバイスを含むコンピューティングデバイスの任意の適切な組み合わせを含むように読まれるべきであることに留意されたい。コンピューティングデバイスは、有形の非一時的コンピュータ可読記憶媒体(例えば、ハードドライブ、ソリッドステートドライブ、RAM、フラッシュ、ROMなどである)に記憶されたソフトウェア命令を実行するように構成されたプロセッサを備えることを理解されたい。ソフトウェア命令は、好ましくは、開示された装置に関して以下に説明するような役割、責任、または他の機能を提供するようにコンピューティングデバイスを構成する。特に好ましい実施形態では、様々なサーバ、システム、データベース、またはインターフェースは、場合によりHTTP、HTTPS、AES、公開秘密鍵交換、ウェブサービスAPI、または他の電子情報交換方法に基づく標準化されたプロトコルまたはアルゴリズムを使用してデータを交換する。データ交換は、好ましくは、パケット交換ネットワーク、インターネット、LAN、WAN、VPN、または他のタイプのパケット交換ネットワークを介して行われる。
【0082】
本明細書の説明および以下の特許請求の範囲を通して使用される場合、「a」、「an」、および「the」の意味は、文脈が明らかにそうでないことを指示しない限り、複数の言及を含む。また、本明細書の説明で使用される場合、「in」の意味は、文脈が明らかにそうでないことを指示しない限り、「in」および「on」を含む。また、本明細書で使用される場合、文脈がそうでないことを指示しない限り、「~に結合される」という用語は、直接結合(互いに結合された2つの要素が互いに接触する)および間接結合(少なくとも1つの追加の要素が2つの要素の間に配置される)の両方を含むことを意図している。したがって、「~に結合される」および「~と結合される」という用語は同義的に使用される。
【0083】
既に説明されたもの以外のより多くの修正が、本明細書の本発明の概念から逸脱することなく可能であることは当業者には明らかである。したがって、本発明の主題は、添付の特許請求の範囲の範囲を除いて制限されるべきではない。さらに、明細書および特許請求の範囲の両方を解釈する際に、すべての用語は、文脈と一致する可能な限り最も広い方法で解釈されるべきである。特に、「備える(comprises)」および「備えている(comprising)」という用語は、要素、構成要素、または工程を非排他的な方法で言及するものとして解釈されるべきであり、参照される要素、構成要素、または工程が存在するか、または利用されるか、または明示的に参照されていない他の要素、構成要素、またはステップと組み合わされ得ることを示す。明細書の特許請求の範囲がA、B、C....およびNからなる群から選択されるもののうちの少なくとも1つを指す場合、テキストは、AプラスNまたはBプラスNなどではなく、群からの1つの要素のみを必要とすると解釈されるべきである。
【手続補正書】
【提出日】2024-05-14
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
無細胞液から核酸を操作する方法であって、
生体液から無細胞全核酸(cfTNA)を得る工程;
前記cfTNAの第1の部分をDNAse消化に供して、前記cfTNAのcfRNA画分を生成する工程;
前記cfTNAの前記cfRNA画分と前記cfTNAの第2の部分との両方を逆転写、アダプターライゲーション、および増幅に供して、それによって、第1および第2それぞれのcDNAライブラリを作製する工程;
前記第1および第2のcDNAライブラリの各々を、複数の標的cDNAを濃縮する標的濃縮に供して、それによって、第1および第2それぞれの標的濃縮cDNAライブラリを作製する工程;
を含む方法。
【請求項2】
前記cfTNAが、17~200塩基の間のサイズを有するcfRNA断片および50~300塩基の間のサイズを有するcfDNA断片を含む、請求項1に記載の方法。
【請求項3】
前記cfTNAが、30~250塩基の間のサイズを有するcfRNA断片および75~400塩基の間のサイズを有するcfDNA断片を含む、請求項1に記載の方法。
【請求項4】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも30%を一緒に構成する、請求項2または請求項3のいずれか一項に記載の方法。
【請求項5】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも40%を一緒に構成する、請求項2または請求項3のいずれか一項に記載の方法。
【請求項6】
cfTNA中の突然変異を、増強された感度で検出する方法であって、
生体液の試料からcfRNAおよびcfTNAを得る工程;
前記cfRNAおよびcfTNAから第1および第2それぞれのcDNAライブラリを作製する工程;前記第1および第2のcDNAライブラリの各々を、複数の標的cDNAを濃縮する標的濃縮に供し、それによって第1および第2それぞれの標的濃縮cDNAライブラリを作製する工程;ならびに
前記第1および第2の標的濃縮cDNAライブラリをシーケンシングし、前記第1および第2の標的濃縮cDNAライブラリからのシーケンシング結果を使用して、それによって、同じ試料からのシーケンシングcfRNAまたはcfDNA単独と比較して増強された感度で突然変異を検出する工程;
を含む方法。
【請求項7】
前記生体液から前記cfTNAを得る前記工程が、cfRNAおよびcfDNAの同時単離を含む、請求項6に記載の方法。
【請求項8】
前記cfTNAが、17~200塩基の間のサイズを有するcfRNA断片および50~300塩基の間のサイズを有するcfDNA断片を含む、請求項6に記載の方法。
【請求項9】
前記cfTNAが、30~250塩基の間のサイズを有するcfRNA断片および75~400塩基の間のサイズを有するcfDNA断片を含む、請求項6に記載の方法。
【請求項10】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも30%を一緒に構成する、請求項8または請求項9のいずれか一項に記載の方法。
【請求項11】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも40%を一緒に構成する、請求項8または請求項9のいずれか一項に記載の方法。
【請求項12】
配列分析用試薬キットであって、
生体液のcfTNAのcfDNA枯渇cfRNA画分を含む第1の試薬;および
同じ生体液のcfTNAを含む第2の試薬;
を含む試薬キット。
【請求項13】
前記生体液がヒトの血漿または血清である、請求項12に記載の試薬キット。
【請求項14】
前記第1の試薬が、主に17~200塩基の間のサイズを有するcfRNA断片および主に50~300塩基の間のサイズを有するcfDNA断片を含む、請求項12~13のいずれか一項に記載の試薬キット。
【請求項15】
前記第2の試薬が、主に17~200塩基の間のサイズを有するcfRNA断片を含む、請求項14に記載の試薬キット。
【請求項16】
前記cfRNA断片および前記cfDNA断片が、すべてのcfTNAの少なくとも30%を一緒に構成する、請求項12~13のいずれか一項に記載の試薬キット。
【請求項17】
前記第1の試薬が、前記第2の試薬から調製される、請求項12~13のいずれか一項に記載の試薬キット。
【請求項18】
配列分析用試薬キットであって、
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリを含み;前記第1の標的濃縮cDNAライブラリが生体液のcfTNAのcfDNA画分を含まず;ならびに
前記第2の標的濃縮cDNAライブラリが同じ生体液のcfTNAのcfDNA画分を含む、
試薬キット。
【請求項19】
前記第1および第2の標的濃縮cDNAライブラリが、同じ標的cDNAを使用して標的濃縮される、請求項18に記載の試薬キット。
【請求項20】
前記標的cDNAが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする、請求項18または19に記載の試薬キット。
【請求項21】
配列分析用試薬キットであって、
50塩基以下のサイズを有するRNAの結合を可能にし、100塩基以下のサイズを有するDNAの結合を可能にする表面およびサイズを有する複数のナノ粒子;および
標的遺伝子に対する配列相補性を有する複数の標的濃縮オリゴヌクレオチドを含み、
前記標的濃縮オリゴヌクレオチドの少なくとも一部が、同じ標的遺伝子の異なる部分にハイブリダイズする、
試薬キット。
【請求項22】
前記複数のナノ粒子が、30塩基以下のサイズを有するRNAの結合を可能にし、80塩基以下のサイズを有するDNAの結合を可能にする表面およびサイズを有する、請求項21に記載の試薬キット。
【請求項23】
前記複数のナノ粒子が、20塩基以下のサイズを有するRNAの結合を可能にし、60塩基以下のサイズを有するDNAの結合を可能にする表面およびサイズを有する、請求項21に記載の試薬キット。
【請求項24】
前記複数のナノ粒子が常磁性ナノ粒子である、請求項21~23のいずれか一項に記載の試薬キット。
【請求項25】
対象の核酸データを分析する方法であって、
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし、それによって第1および第2それぞれの配列データセットを得る工程(前記第1の標的濃縮cDNAライブラリは前記対象の生体液のcfTNAから調製され、cfTNAのcfDNA画分を含まず、
前記第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAから調製され、cfTNAのcfDNA画分を含む);
前記第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異を同定する工程、ならびに少なくとも前記第1の配列データセットにおける発現を定量する工程、を含む方法。
【請求項26】
前記シーケンシングの工程がペアエンドシーケンシングであり、ならびに/または第1および第2の標的濃縮cDNAライブラリが、前記第1の標的濃縮cDNAライブラリ単独の突然変異の検出と比較して、突然変異の検出の感度が増強される、請求項25記載の方法。
【請求項27】
前記第1および第2の標的濃縮cDNAライブラリが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAが濃縮されており、任意選択的に、前記第1および第2の標的濃縮cDNAライブラリが、臨床経過、治療に対する応答または疾患の再発の診断または決定のために、特定の前記疾患に特異的な標的cDNAが濃縮されている、請求項25または請求項26に記載の方法。
【請求項28】
対象のがんを分類する方法であって、
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし、それによって第1および第2それぞれの配列データセットを得る工程(前記第1の標的濃縮cDNAライブラリは前記対象の生体液のcfTNAのcfDNA画分を含まず、
前記第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAのcfDNA画分を含む);
前記第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異を同定する工程、および各遺伝子について少なくとも前記第1の配列データセットにおける発現レベルを定量する工程;ならびに
前記同定された突然変異および定量された発現レベルをモデルに使用して、それによって前記対象の前記がんを同定する工程、
を含む方法。
【請求項29】
前記シーケンシングの工程がペアエンドシーケンシングである、請求項28に記載の方法。
【請求項30】
前記第1および第2の標的濃縮cDNAライブラリが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAについて濃縮されている、請求項28または29に記載の方法。
【請求項31】
同定された突然変異および定量された発現レベルに基づいて治療を投与する方法において使用するための、第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリであって、
前記方法が、
前記第1の標的濃縮cDNAライブラリおよび
前記第2の標的濃縮cDNAライブラリをシーケンシングし、それによって第1および第2それぞれの配列データセットを得る工程(前記第1の標的濃縮cDNAライブラリは前記対象の生体液のcfTNAのcfDNA画分を含まず;
前記第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAのcfDNA画分を含む);
前記第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異を同定する工程、および各遺伝子について少なくとも前記第1の配列データセットにおける発現レベルを定量する工程;ならびに
前記同定された突然変異および定量された発現レベルに基づいて治療を投与する工程、
を含む
、第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリ。
【請求項32】
前記シーケンシングの工程がペアエンドシーケンシングである、請求項31に記載の
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリ。
【請求項33】
前記第1および第2の標的濃縮cDNAライブラリが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAについて濃縮されている、請求項31または32に記載の
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリ。
【請求項34】
生体液から得られたcDNAの配列分析用試薬キットであって、
それぞれのcDNAにハイブリダイズする40~70ヌクレオチドの間の長さを有する複数の標的濃縮プローブを含み、
前記複数の標的濃縮プローブが、ヌクレオチドあたり2~59プローブの間のタイリング密度および1~60ヌクレオチドの間のステップ長を有するタイリング様式で前記それぞれのcDNAに結合し;
前記それぞれのcDNAが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子、および/または受容体関連遺伝子をコードする、
試薬キット。
【請求項35】
前記標的濃縮プローブのそれぞれが、固相捕捉のための配列部分、固相捕捉のための化学修飾、または磁気ビーズをさらに含む、請求項34に記載のキット。
【請求項36】
前記標的cDNAが、前記生体液のcfTNAおよびcfRNAから調製される、請求項34に記載のキット。
【請求項37】
対象のための治療を予測する方法であって、
第1の標的濃縮cDNAライブラリおよび第2の標的濃縮cDNAライブラリをシーケンシングし、それによって第1および第2それぞれの配列データセットを得る工程(前記第1の標的濃縮cDNAライブラリは前記対象の生体液のcfTNAのcfDNA画分を含まず;
前記第2の標的濃縮cDNAライブラリは同じ生体液のcfTNAのcfDNA画分を含む);
前記第1および第2の配列データセット中の各遺伝子について1つ以上の突然変異を同定する工程、および各遺伝子について少なくとも前記第1の配列データセットにおける発現レベルを定量する工程;ならびに
前記同定された突然変異および定量された発現レベルに基づいて前記治療を予測する工程、を含む方法。
【請求項38】
前記シーケンシングの工程がペアエンドシーケンシングである、請求項37に記載の方法。
【請求項39】
前記第1および第2の標的濃縮cDNAライブラリが、がん関連遺伝子、細胞シグナル伝達関連遺伝子、免疫表現型関連遺伝子または受容体関連遺伝子をコードする標的cDNAについて濃縮されている、請求項37または38に記載の方法。
【国際調査報告】