(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024074960
(43)【公開日】2024-05-31
(54)【発明の名称】臓器健康および疾患をモニタリングするための方法およびシステム
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240524BHJP
C12Q 1/6813 20180101ALI20240524BHJP
C12Q 1/686 20180101ALI20240524BHJP
C12N 15/09 20060101ALI20240524BHJP
【FI】
C12Q1/6869 Z
C12Q1/6813 Z
C12Q1/686 Z
C12N15/09 Z
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024062693
(22)【出願日】2024-04-09
(62)【分割の表示】P 2020572967の分割
【原出願日】2020-01-22
(31)【優先権主張番号】62/796,481
(32)【優先日】2019-01-24
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(74)【代理人】
【識別番号】100107489
【弁理士】
【氏名又は名称】大塩 竹志
(72)【発明者】
【氏名】ヨン リ
(57)【要約】
【課題】組織および臓器健康をモニタリングするための方法、組成物およびシステムを提供すること。
【解決手段】本明細書に提供される方法、組成物およびシステムは、セルフリーDNA(cfDNA)試料から遺伝子座特異的コピー数シグナルを抽出して、組織特異的cfDNAコピー数プロファイルを識別し、cfDNA試料における組織画分の定量化を可能にする。本開示は、試料におけるcfDNAの組織および/または細胞特異的画分を定量するために、cfDNA遺伝子座特異的コピー数シグナルを抽出するための、試料におけるcfDNAを解析するためのシステム、方法および組成物に関する。
【選択図】なし
【特許請求の範囲】
【請求項1】
明細書に記載の発明。
【発明の詳細な説明】
【技術分野】
【0001】
分野
本明細書に提供されるシステム、方法および組成物は、健康モニタリング、診断学、または細胞プロファイリングおよび解析のために、試料から遺伝子座特異的cfDNAコピー数シグナルを抽出するための方法に関する。具体的には、本システム、方法および組成物は、試料におけるセルフリーDNA(cfDNA)を解析して、試料における総cfDNAに対する組織または細胞型の相対的寄与を決定するための方法に関する。本明細書に提供される方法は、配列特異的cfDNAカバレッジ、強度またはコピー数シグナルを利用し、cfDNAにおけるメチル化状態の直接的な決定を含まない。
【背景技術】
【0002】
背景
近年、セルフリーDNA(cfDNA)が、疾患診断学のためのバイオマーカー発見のための有望な供給源として現れた。特に、胎児cfDNAおよびインタクトな胎児細胞は、母体血液循環に進入することができる。結果的に、このような胎児の遺伝的材料の解析は、初期非侵襲的出生前検査(NIPT)を可能にすることができる。胎児cfDNAに関するNIPTの実行における重要な課題は、これが典型的には、母体cfDNAと混合されており、よって、cfDNAの解析が、母体の遺伝子型シグナルを説明する必要によって妨害されることである。さらに、cfDNAの解析は、がんの検出および診断のための診断ツールとして有用である。
【発明の概要】
【課題を解決するための手段】
【0003】
セルフリー核酸試料(例えば、血漿試料)から配列決定ライブラリーを調製するための現在のプロトコールは、典型的には、解析のための配列決定ライブラリーの調製のためのcfDNAの単離を含む。しかし、既存のcfDNA解析方法は、NIPT適用のためであれ腫瘍学適用のためであれ、cfDNA配列決定からの遺伝子変化のシグナルの抽出に頼り、したがって、NIPTおよび腫瘍学に限定される。
【0004】
要旨
本開示は、試料におけるcfDNAの組織および/または細胞特異的画分を定量するために、cfDNA遺伝子座特異的コピー数シグナルを抽出するための、試料におけるcfDNAを解析するためのシステム、方法および組成物に関する。
【0005】
本明細書に提供される一部の実施形態は、生体試料におけるセルフリーDNA(cfDNA)を解析する方法に関する。一部の実施形態では、試料は、潜在的な細胞死または組織もしくは疾患損傷を有するヒト対象に由来する。一部の実施形態では、細胞死または組織/臓器損傷は、頭部外傷等の鈍的外傷、肝臓または腎臓における薬物毒性、心筋症における心臓損傷、腎臓疾患における腎臓損傷、肝臓疾患における肝損傷または糖尿病におけるベータ細胞死等の臓器損傷が関与する疾患を含む。一部の実施形態では、細胞死または組織/臓器損傷は、過剰量の細胞死または細胞ターンオーバーが起こる、がんまたは妊娠を含む。
【0006】
一部の実施形態では、本方法は、cfDNAを含む生体試料を得るステップであって、cfDNAが、複数のcfDNA断片を含み、各断片が、1種または複数の組織または細胞型に対応する、ステップと;各cfDNA断片を定量して、ゲノムワイドのまたは標的化された(遺伝子座特異的)cfDNAプロファイルを生成するステップであって、ゲノムワイドcfDNAプロファイルが、複数のコピー数シグナルを含み、各コピー数(カバレッジまたは強度を含む)シグナルが、cfDNA断片に対応する、ステップと;ゲノムワイドcfDNAコピー数シグナルプロファイルを、参照コピー数シグナルプロファイルの収集と比較して、細胞損傷、組織損傷または臓器損傷の供給源を決定または定量するステップとを含む。一部の実施形態では、本方法は、試料からプルダウンまたはPCRによりcfDNAを濃縮して、濃縮されたcfDNAを提供するステップを必要に応じて含む。
【0007】
本明細書に提供される一部の実施形態は、対象における組織または臓器損傷の進行をモニタリングする方法に関する。一部の実施形態では、本方法は、対象から生体試料を得るステップであって、生体試料が、セルフリーDNA(cfDNA)を含む、ステップと;試料におけるcfDNAを定量して、複数のコピー数シグナルを含むゲノムワイドcfDNAコピー数シグナルプロファイルを得るステップであって、各コピー数シグナルが、特異的な細胞型または組織型のcfDNA断片に対応する、ステップと;ゲノムワイドcfDNAコピー数シグナルプロファイルを、健康な対象または純粋な組織型の既知のコピー数シグナルプロファイルの収集と比較するステップとを含む。一部の実施形態では、定量するステップは、PCRも濃縮も用いずに実行される。一部の実施形態では、既知のコピー数シグナルと比較した、試料におけるコピー数シグナルの差は、組織または臓器損傷に関係する対象における状態と相関する。
【図面の簡単な説明】
【0008】
【
図1】
図1は、標的化された染色体位置に沿ったcfDNAの腎臓組織および血液シグナルプロファイルを描写するプロットを説明する。組織/細胞型特異的シグナルは、cfDNA配列決定から得られた腎臓疾患患者の血漿cfDNAコピー数シグナルから、非負行列因子分解方法を使用して抽出される。標的領域は、cfDNA試料におけるマルチプレックスPCRによりアッセイされる。
【0009】
【
図2】
図2は、血液の血漿における腎臓cfDNAの画分の定量化に基づき、患者における腎不全を予測するための結果を示すプロットを描写する。
【0010】
【
図3】
図3Aおよび
図3Bは、腎臓移植レシピエントのセットにおける、時間の関数としての腎臓組織由来のDNAの割合の時間経過パターンのプロットを描写する。
図3Aは、ドナー腎臓cfDNAの推定される腎臓画分を示し、
図3Bは、患者自身の腎臓cfDNAの推定される腎臓画分を示す。
図3Aおよび
図3Bは両者共に、経時的な統計的に有意な変化を示し、時間的変化のパターンは、これらの患者に既知の生物医学的手順と一貫する。
【0011】
【
図4】
図4は、様々な疾患にわたる結腸cfDNAの成分(component)画分を描写し、それによると、クローン病の画分は、解析された他の疾患におけるものよりも有意に大きいことが見出された。
【0012】
【
図5】
図5は、組織cfDNA定量化のためのcfDNA試料を評価するためのプロセスを説明するブロック図を描写する。
【発明を実施するための形態】
【0013】
詳細な説明
次の詳細な説明において、本明細書の一部を形成する添付の図面の参照が為される。図面において、文脈がそれ以外のことを指示しない限り、同様の記号は典型的に、同様の成分を識別する。詳細な説明、図面および特許請求の範囲に記載されている説明目的の実施形態は、限定を意味するものではない。本明細書に提示されている主題の精神または範囲から逸脱することなく、他の実施形態を利用することができ、他の変化を為すことができる。本明細書に概して記載され図中に説明されている本開示の態様を、その全てが本明細書に明確に企図される多種多様な異なる構成で配置し、置換し、組み合わせ、分離し、設計することができることが容易に理解されるであろう。
【0014】
本明細書に提供されるシステム、方法および組成物の実施形態は、試料における核酸断片を解析して、どれほどの数の核酸断片が、対象の身体の様々な部分のゲノムの様々な部分に起源をもつか決定するステップに関する。より詳細には、本明細書に提供されるシステム、方法および組成物は、試料におけるcfDNA集団を解析して、対象の身体の様々な部分のゲノムの様々な部分由来のcfDNAの相対量を決定するステップに関する。したがって、本システム、方法および組成物は、cfDNAの組織起源定量化に関し、例えば、疾患進行をモニタリングする、臓器もしくは組織健康をモニタリングする、疾患を診断もしくは検出する、薬物有効性もしくは毒性を決定する、または新生児健康モニタリングをするための適用を含む、上昇した細胞死または上昇した遺伝的変更が関与する幅広い適用において使用することができる。
【0015】
一実施形態では、血液の血漿等のcfDNAを保有することが既知の生体試料は、特異的な型の臓器損傷または上昇した細胞ターンオーバーを有することが疑われる対象から採取される。全ゲノム配列(WGS)解析が、生体試料におけるcfDNAにおいて実行されて、典型的な対象におけるものよりも多いまたは少ないcfDNAを示し得るゲノム領域を識別する。例えば、対象が、肝損傷または腎不全を患う場合、ベースライン対照集団と比較して、肝臓または腎臓に由来するcfDNAをより多く得ると予想することができる。配列解析は、完了したら、種々の異なる機械学習、人工知能または他のプロトコールにより比較されて、ベースライン対照に対する対象由来のcfDNAの差を識別する。一実施形態では、解析の部分は、対象および正常ベースライン対照由来の異なる組織由来のcfDNAの相対的画分を定量するステップを含むことができる。一部の実施形態では、定量化は、参照組織プロファイルのセットを決定するステップ、およびゲノムワイドcfDNAカバレッジデータに基づき、cfDNA試料における組織cfDNAの画分を定量するステップのうち一方または両方を含むことができる。
【0016】
例えば、正常および/または罹患試料のセットのためのゲノムワイドのまたは標的化されたcfDNAコピー数プロファイルのため、参照cfDNAカバレッジプロファイルのセットが導かれ、その結果得られる線形組合せが、正常および/または罹患試料からcfDNAコピー数シグナルを再構築する。各参照プロファイルは、特異的な細胞または組織型に対応する。非負行列因子分解等の教師なし機械学習方法を使用して、個体由来のcfDNAシグナルを分解し、参照組織または細胞特異的プロファイルを抽出し、これにより、ベースライン参照プロファイルを生成することができる。体液の型に応じて、優占的な細胞または組織型は異なる場合がある。例えば、血漿に関して、白血球細胞シグナルプロファイルが主要な寄与体であるであろう。標的化された染色体位置に沿ったcfDNAの抽出された腎臓組織および血液シグナルプロファイルの例示的な解析は、
図1に描写されている。
【0017】
cfDNAを解析する伝統的な方法は、配列特異的検出を要求し、このことは、アッセイの感度を限定し、生体試料における総cfDNAに対する対象における各組織型の相対的寄与の正確な、信頼のおけるまたは再現性がある決定をもたらさない。例えば、伝統的なアプローチは、正常試料と比較して、試料におけるcfDNAのどれほど多くが、肺、脾臓、肝臓、腎臓等に由来するかを決定することができない。cfDNA配列決定の以前の方法は、移植組織またはがんの状態のモニタリングに関する適用のための方法であった。しかし、斯かる方法は、対立遺伝子に基づく解析を要求し、これは、ドナーと宿主または腫瘍と正常の間の一塩基多様性(single nucleotide variation)の配列決定および検出を要求した。cfDNA配列決定、アレイハイブリダイゼーションまたは同様の方法から、対象自身の臓器健康状態を定量することができる既存の方法は存在しない。
【0018】
さらに、臓器または組織健康をモニタリングするための伝統的方法は、組織生検により実行される。組織生検を使用して、特異的組織に基づき疾患の存在または程度を試験および決定することができ、これは、対象から採取された組織生検試料からの細胞または組織の抽出により実行することができる。しかし、これらの方法は、侵襲的であり、時間がかかり、高価であり、一般に、意図されない健康上の結果のリスク増加を保有する。
【0019】
対照的に、本明細書に記載されているシステム、方法および組成物は、様々な組織に起源をもつcfDNA断片の量を決定するステップに関する。さらに、本システム、方法および組成物は非侵襲的であり、細胞死または組織損傷の動力学の即時決定を提供することができる。本明細書に提供されるシステム、方法および組成物は、対象の身体の臨床症状または機能悪化が見出される前に、種々の徴候の初期検出を可能にすることができる。さらに、これらの方法は、特異的に標的化された臓器の選択を要求しないが、その代わりに、介護者が、いずれの臓器が悪化しつつあるか発見することを可能にし、これは、スクリーニング方法として組織生検を使用していては不可能である。それに関連して、本方法、システムおよび組成物は、一度に、単一の解析において、組織生検方法よりも少ないサンプリングバイアスにより、多臓器の定量化およびモニタリングを可能にすることができる。
【0020】
他に断りがなければ、本明細書に開示されている方法およびシステムの実施は、当業者の技能範囲内である、分子生物学、微生物学、タンパク質精製、タンパク質工学、タンパク質およびDNA配列決定ならびに組換えDNAの分野において一般的に使用されている従来の技法および装置が関与する。斯かる技法および装置は、当業者にとって公知であり、多数の教科書および参考文献(例えば、Sambrook et al., “Molecular Cloning: A Laboratory Manual,”ThirdEdition (Cold Spring Harbor), [2001]);およびAusubel et
al., “CurrentProtocols inMolecular Biology” [1987]を参照)に記載されている。
【0021】
数的範囲は、当該範囲を定義する数を包括する。本明細書を通じて定められたあらゆる最大数値的限界は、あたかもより低い数値的限界が本明細書に明示的に書かれているかのように、あらゆる斯かるより低い数値的限界を含むことが意図される。本明細書を通じて定められたあらゆる最小数値的限界は、あたかもより高い数値的限界が本明細書に明示的に書かれているかのように、あらゆる斯かるより高い数値的限界を含むであろう。本明細書を通じて定められたあらゆる数値的範囲は、あたかも狭い数値的範囲が全て本明細書に明示的に書かれているかのように、斯かるより幅広い数値的範囲内に収まるあらゆる斯かる狭い数値的範囲を含むであろう。
【0022】
本明細書において他に規定がなければ、本明細書に使用されているあらゆる技術および科学用語は、当業者によって一般的に理解されているものと同じ意義を有する。本明細書に含まれる用語を含む様々な科学辞書は、周知されており、当業者が利用できる。本明細書に記載されているものと同様のまたは均等ないかなる方法および材料も、本明細書に開示されている実施形態の実施または検査において用途を見出されるが、いくつかの方法および材料が記載されている。
【0023】
すぐ下に定義されている用語は、全体として本明細書を参照することにより、より十分に記載される。記載されている特定の方法論、プロトコールおよび試薬は、当業者によって使用される文脈に応じて変動し得るため、本開示がこれらに限定されないことを理解されたい。本明細書で使用される場合、文脈がそれ以外を明らかに示さない限り、単数形の用語「1つの(a)」、「1つの(an)」および「その(the)」は、複数形の参照を含む。
【0024】
他に断りがなければ、それぞれ、核酸は、左から右に5’から3’の配向性で書かれ、アミノ酸配列は、左から右にアミノからカルボキシの配向性で書かれる。
【0025】
本明細書で使用される場合、「ポリヌクレオチド」および「核酸」は、互換的に使用することができ、リボヌクレオチドまたはデオキシリボヌクレオチドのいずれかの、いずれかの長さのヌクレオチドのポリマー形態を指すことができる。よって、これらの用語は、一本鎖、二本鎖または多重鎖DNAまたはRNAを含む。ポリヌクレオチドの例として、遺伝子もしくは遺伝子断片、セルフリーDNA(cfDNA)、全ゲノムDNA、ゲノムDNA、エピゲノム、ゲノムDNA断片、エクソン、イントロン、メッセンジャーRNA(mRNA)、調節性RNA、トランスファーRNA、リボソームRNA、非コードRNA(ncRNA)、例えば、PlWI相互作用RNA(piRNA)、低分子干渉RNA(siRNA)および長鎖非コードRNA(lncRNA)、低分子ヘアピン(shRNA)、核内低分子RNA(snRNA)、マイクロRNA(miRNA)、核小体低分子RNA(snoRNA)およびウイルスRNA、リボザイム、cDNA、組換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、いずれかの配列の単離されたDNA、いずれかの配列の単離されたRNA、核酸プローブ、プライマー、または前述のいずれかの増幅されたコピーが挙げられる。ポリヌクレオチドは、非天然塩基を有するヌクレオチド、アザまたはデアザプリン等の改変天然塩基を有するヌクレオチドを含む、メチル化ヌクレオチドおよびヌクレオチドアナログ等の改変ヌクレオチドを含むことができる。ポリヌクレオチドは、4種のヌクレオチド塩基:アデニン(A);シトシン(C);グアニン(G);およびチミン(T)の特異的な配列で構成され得る。例えば、ポリヌクレオチドがRNAである場合、チミンに代えた天然の置き換えとして、ウラシル(U)が存在する場合もある。DNAにウラシルが使用される場合もある。用語「核酸配列」は、ポリヌクレオチドのアルファベット表現、または天然および非天然塩基を含むいずれかの核酸分子を指すことができる。
【0026】
ドナーDNA(dDNA)という用語は、移植のドナーの細胞に起源をもつDNA分子を指す。様々なインプリメンテーションにおいて、dDNAは、ドナーから移植組織または臓器を受けた受取者(donee)から得られる試料に見出される。
【0027】
循環セルフリーDNAまたは単純にセルフリーDNA(cfDNA)は、細胞内に限局されず、血流または他の生体液中を自由に循環しているDNA断片である。cfDNAは、一部の事例では、受取者の血液中を循環するドナー組織DNA、一部の事例では、腫瘍細胞または腫瘍罹患細胞、他の事例では、母体血液中を循環する胎児DNAに由来する、異なる起源を有することが公知である。他の非限定的な例として、例えば、腎臓、肺、脳および心臓等、同じ生物にとってネイティブである組織または臓器に起源をもつcfDNAが挙げられる。組織特異的cfDNAのレベルは、例えば、頭部外傷等の鈍的外傷、肝臓または腎臓における薬物毒性、心筋症における心臓損傷、腎臓疾患における腎臓損傷、肝臓疾患における肝損傷等の臓器損傷が関与した疾患、および糖尿病におけるベータ細胞死を含む、細胞死、組織損傷または臓器損傷が起こる場合に増加または減少し得る。例として、過剰量の細胞死または細胞ターンオーバーが起こる、がんおよび妊娠も挙げられる。
【0028】
一般に、cfDNAは、断片化され、ゲノムのごく一部を含み、これは、cfDNAが得られる個体のゲノムとは異なる場合がある。cfDNAバイオジェネシスの正確な機構は未知である。一般に、cfDNAは、アポトーシス性または壊死性の細胞死に由来すると考えられるが、生細胞からの活発なcfDNA放出を示唆する証拠もある。一般に、cfDNAは、多様な細胞型に起源をもち、細胞起源および健康状態に応じて、対象のゲノムワイドcfDNAプロファイルは変動し得る。
【0029】
非循環ゲノムDNA(gDNA)または細胞DNAという用語は、細胞に限局されるDNA分子を指すように使用され、多くの場合、完全ゲノムを含む。
【0030】
二項分布は、一連のn回の独立した実験における成功数の離散型確率分布であり、それぞれが、はい・いいえの質問を尋ね、それぞれが、それ自身のブール値の成績を有する:単一ビットの情報を含有するランダム変数:正(確率pによる)または負(確率q=1-pによる)。単一の試行、すなわち、n=1のため、二項分布はベルヌーイ分布である。二項分布は、サイズNの集団からの置き換えにより引き出されたサイズnの試料における成功数のモデル化に高頻度で使用される。ランダム変数Xが、パラメーターn∈Nおよびp∈[0,1]による二項分布に従う場合、ランダム変数Xは、X~B(n,p)と書かれる。
【0031】
当該事象が、既知の平均比率で、また、最後の事象からの時間とは独立して起こる場合、本明細書でPois()として表示されるポアソン分布は、時間および/または空間の固定された間隔で起こる事象の所与の数の確率を表す離散型確率分布である。ポアソン分布は、距離、面積または体積等、他の指定の間隔での事象数に使用することもできる。ポアソン分布に従った間隔におけるk回の事象の観察の確率は、次の方程式により得られる:
【数1】
(λは、比率パラメーターとも呼ばれる、間隔における事象の平均数または事象率であり、eは、2.71828、オイラー数、または自然対数の底であり、kは、値0、1、2、...を取り、k!は、kの階乗である)。
【0032】
ガンマ分布は、連続確率分布の2パラメーターファミリーである。一般的に使用されている3種の異なるパラメーター化(parametrization)が存在する:形状パラメーターk
およびスケールパラメーターθによる;形状パラメーターα=kおよび比率パラメーターと呼ばれる逆スケールパラメーターβ=1/θによる;または形状パラメーターkおよび平均パラメーターμ=k/βによる。これら3形態のそれぞれにおいて、両方のパラメーターが正の実数である。ガンマ分布は、ランダム変数Xの最大エントロピー確率分布であり、それに関して、E[X]=kθ=α/βが固定されゼロを超え、
【数2】
が固定されている(
【数3】
はディガンマ関数である)。
【0033】
本明細書における用語「試料」は、核酸または核酸の混合物を含む、生物体液、細胞、組織、臓器または生物に典型的に由来する試料を指し、生体試料と本明細書で称することができる。斯かる試料として、痰/口腔液、羊水、血液、血液画分または細針生検試料(例えば、外科的生検、細針生検等)、尿、腹水、胸水、およびその他が挙げられるがこれらに限定されない。試料は多くの場合、ヒト対象(例えば、患者)から採取されるが、アッセイは、イヌ、ネコ、ウマ、ヤギ、ヒツジ、ウシ、ブタ等が挙げられるがこれらに限定されない、いずれかの哺乳動物由来の試料において使用することができる。試料は、生物学的供給源から得られた際に直接的に、または試料の性状を改変するための前処理後に使用することができる。例えば、斯かる前処理は、血液からの血漿の調製、粘稠性の液体の希釈、等々を含むことができる。前処理方法は、濾過、沈殿、希釈、蒸留、混合、遠心分離、凍結、凍結乾燥、濃縮、増幅、核酸断片化、干渉成分の不活性化、試薬の添加、溶解等が関与することもできるが、これらに限定されない。斯かる前処理方法が、試料に関して用いられる場合、斯かる前処理方法は、典型的に、目的の核酸(複数可)が、時に、無処理被験試料(例えば、すなわち、いかなる斯かる前処理方法(複数可)にも付されていない試料)中の濃度に比例した濃度で、被験試料中に残るようなものである。斯かる「処理された」または「加工された」試料は依然として、本明細書に記載されている方法に関して、生物学的「被験」試料であると考慮される。
【0034】
本明細書における用語「生物体液」は、生物学的供給源から採取された液体を指し、例えば、血液、血清、血漿、痰、洗浄液、脳脊髄液、尿、精液、汗、涙、唾液、およびその他を含む。本明細書で使用される場合、用語「血液」、「血漿」および「血清」は、画分またはその加工された部分を明示的に包含する。同様に、試料が、生検、スワブ、スメア等から採取される場合、「試料」は、生検、スワブ、スメア等に由来する加工された画分または部分を明示的に包含する。
【0035】
試料は、対象から得ることができ、組織もしくは臓器健康をモニタリングすること、疾患を診断もしくは検出すること、または対象の試料を他の仕方で解析することが望ましい。本明細書で使用される場合、「対象」は、処置、観察または実験の目標である動物を指す。「動物」は、魚類、甲殻類、爬虫類および特に、哺乳動物等、冷血および温血脊椎動物および無脊椎動物を含む。「哺乳動物」は、マウス、ラット、ウサギ、モルモット、イヌ、ネコ、ヒツジ、ヤギ、ウシ、ウマ、霊長類、例えば、サル、チンパンジーおよび類人猿、ならびに特に、ヒトを限定することなく含む。対象は、がん、遺伝的障害、臓器損傷もしくは組織損傷、またはモニタリングすることができる他の疾患もしくは障害を有するまたはこれを有することが疑われる対象であることができる。一部の実施形態では、対象は、臓器移植物のレシピエントである対象等、臓器受取者である。一部の実施形態では、対象は、慢性疾病または鈍的外傷による潜在的臓器損傷を有する。
【0036】
本システム、方法および組成物の実施形態は、対象から試料を得るステップ、および対象における疾患もしくは障害をモニタリング、検出、評価、予測もしくは診断するステップ、対象における組織もしくは臓器損傷をモニタリングするステップ、または核酸組織起源を評価もしくは定量するステップに関する。疾患は、例えば、がん、遺伝的障害、臓器特異的障害、または組織起源および/または疾患型に基づく異なるゲノム領域におけるcfDNA増加によって特徴付けられる他の疾患もしくは障害を含むことができる。
【0037】
本明細書で使用される場合、参照ゲノムという用語は、対象由来の識別された配列の参照に使用することができる、いずれかの生物の、部分的であれ完全であれ、いずれか特定の既知のゲノム配列を指す。「ゲノム」は、核酸配列において発現される、生物またはウイルスの完全遺伝的情報を指す。
【0038】
本明細書に提供される方法、システムおよび組成物の一部の実施形態は、ゲノムワイドcfDNAコピー数(CN)シグナルに基づき、cfDNA試料における複数の組織または細胞型の相対的寄与を同時に定量するステップに関する。意図される適用に応じて、cfDNA試料は、生体試料、例えば、血液、血漿、尿、脳脊髄液または他のいずれかの型のヒト体液に由来することができる。ゲノムワイドcfDNAカバレッジ、コピー数または強度シグナルは、いずれかの配列決定技術またはハイブリダイゼーションに基づくDNAコピー数定量化技術による等、配列決定に基づくDNA分子計数により得ることができる。一部の実施形態では、cfDNAは、コピー数シグナル測定の前に、標的化PCRまたは濃縮アッセイまたはゲノムワイド増幅に付すことができる。実施形態のいずれかでは、例えば、ゲノム全体の非特異的増幅、例えば、全ゲノム増幅(WGA)方法、例えば、MDA、または例えば、数kbの数個のまたは単一の選択された領域の高度標的化PCR増幅を含む、様々な増幅方法を使用することができる。
【0039】
本明細書に記載されているシステムまたは方法のいずれか由来の生体試料または生体試料のセット由来のcfDNAカバレッジを考慮すると、異なる組織の相対的画分を定量することができる。一部の実施形態では、定量化は、参照組織プロファイルのセットを決定するステップ、およびゲノムワイドのまたは標的化されたcfDNAカバレッジデータに基づき、cfDNA試料における組織cfDNAの画分を定量するステップのうち一方または両方を含むことができる。
【0040】
例えば、正常試料のセットのためのゲノムワイドcfDNAコピー数プロファイルのため、その結果得られる線形組合せが、正常試料由来のcfDNAコピー数プロファイルに対応するように、参照cfDNAカバレッジプロファイルのセットが導かれる。血液cfDNAコピー数プロファイルは、複数の細胞または組織型由来のシグナルの混合物に対応する一方、参照プロファイルは、特異的な細胞または組織型に対応する。非負行列因子分解等、教師なし機械学習方法を使用して、血漿cfDNAシグナルのセットを分解し、参照プロファイルを抽出し、これにより、ベースライン参照プロファイルのセットを生成することができる。体液の型に応じて、優占的な細胞または組織型は異なる場合がある。例えば、血漿に関して、白血球細胞シグナルプロファイルが主要な寄与体であるであろう。
【0041】
同様に、既知の臓器損傷、または臓器損傷に関連する特異的疾患を有する患者試料のセットのゲノムワイドcfDNAコピー数プロファイルから、半教師つき機械学習を用いて、ベースライン参照プロファイルに加えて、組織または疾患特異的cfDNAプロファイルを抽出することができる。得られたベースライン参照プロファイルを使用して、患者試料由来のcfDNAシグナルのベースライン部分を説明することができ、次いで、追加的な組織参照プロファイルが、説明できないcfDNAカバレッジシグナルから導かれる。
【0042】
教師なしおよび半教師つきアプローチは、ディープ(deep)ニューラルネットワークに基づく教師つき機械学習方法により、関連するcfDNA試料へのアクセスが限定された組織または細胞型のための予測されるcfDNAカバレッジプロファイルにさらにカップルすることができる。例えば、DNase到達性シグナル、ヒストンマークシグナルおよびゲノムDNAメチル化シグナルを含む、入力特色としての所与の細胞型のためのエピジェネティックシグナルを考慮すると、ディープ学習方法を使用して、細胞型のためのcfDNAカバレッジプロファイルを予測することができる。
【0043】
したがって、一部の実施形態では、参照組織プロファイルのセットは、目的の試料における組織定量化に使用される。cfDNAカバレッジプロファイルのため、組織画分は、観察されるcfDNAカバレッジプロファイルを既知の参照プロファイルにおいて線形に投射することにより、定量することができる。
【0044】
本明細書に提供されるシステム、方法および組成物の実施形態は、例えば、臓器健康モニタリング、薬物毒性モニタリング、スポーツ医学、疾患診断および検出、腫瘍学、非侵襲的出生前検査(NIPT)および新生児健康モニタリング、または疾患病理学研究を含む、幅広い適用を含むことができる。
【0045】
臓器健康モニタリングの分野において、本システム、方法および組成物の実施形態は、例えば、腎臓、肺または心臓等の多臓器のモニタリング、ならびに単一の血液検査による疾患前および後のモニタリングおよび診断に使用することができる。本明細書に記載されている実施形態は、高リスク集団のモニタリング戦略のためのものを含む、重度臓器不全の初期検出および予防を可能にする、主要臓器を標的とする低コスト普遍的血液検査を含む。例えば、ループスもしくは糖尿病を有する患者の腎臓健康モニタリング;心筋症の家族歴を有する個体の心臓健康モニタリング;または敗血症を有する患者の多臓器健康モニタリング。さらに、例えば、頭部または胸部/肺領域における外傷(鈍的傷害)の重症度は、重度機能的帰結が観察されない限り、アクセスが容易ではない。本明細書に提供されるシステム、方法および組成物の実施形態は、外傷の重症度の定量的モニタリングを可能にし、初期医療介入を通知する。
【0046】
薬物毒性モニタリングの分野において、本システム、方法および組成物の実施形態は、例えば、これにより個別化医療および個々の患者の薬物療法レジメンに対するリアルタイム調整を可能にする、所与の患者における処方薬の肝臓もしくは腎毒性のモニタリング、または臨床試験における新薬の肝臓もしくは腎薬物毒性の測定に使用することができる。
【0047】
スポーツ医学の分野において、本システム、方法および組成物の実施形態は、例えば、これにより運動選手訓練スケジュールの合理的調整を可能にし、オーバートレーニング症候群を予防する、激しい訓練による身体損傷の規模のモニタリングに使用することができる。セルフリーDNAは、運動に伴い増加することが見出される。運動選手に関して、オーバートレーニング症候群(OTS)は、限界を絶え間なく強く求めるときに、高頻度で起こる状態である。OTSが起こると、回復には数日間~数週間を要することがある、または一部の事例では、運動選手は回復しないこともある。筋肉cfDNA定量化、したがって、OTSの初期検出および予防のためのアプローチは、運動選手が最適な訓練成績を達成するために高い価値があるであろう。
【0048】
疾患診断および検出の分野において、本システム、方法および組成物の実施形態は、例えば、診断が困難なまたは高頻度で誤診される疾患、例えば、過敏性腸症候群、炎症性腸疾患、セリアック病、線維筋痛症、関節リウマチ、多発性硬化症、ループス、多嚢胞性卵巣症候群、虫垂炎、クローン病、潰瘍性大腸炎または特発性ミオパチーのモニタリングまたは解析に使用することができる。これらの疾患の一部は一般に、組織生検のみにより確実に診断される。セリアック病等、多くの疾患は現在、組織生検を使用して診断される。既存の診断用マーカーがない、または優れた診断マーカーを欠く多くの疾患が存在し、例えば、慢性疲労症候群が挙げられる。本明細書に提供されるシステム、方法および組成物の実施形態は、上述および他の疾患および障害のモニタリング、検出、評価、予測または診断を可能にする。例えば、本システムおよび方法の実施形態を使用して、ある特定の疾患を識別するために、ある特定の組織成分の画分を決定することができる。
図4に示す通り、例えば、結腸cfDNAの成分画分は、様々な疾患にわたって示され、クローン病の画分は、解析された他の疾患よりも有意に大きい。
【0049】
腫瘍学の分野において、本システム、方法および組成物の実施形態は、例えば、cfDNAの組織起源定量化およびがん組織起源の決定、ならびに単一のcfDNA全ゲノム配列(WGS)アッセイからの突然変異に使用することができる。WGSは、個体の生殖系列ゲノムの配列全体(全染色体を含む)を含む。
【0050】
NIPTおよび新生児健康モニタリングの分野において、本システム、方法および組成物の実施形態は、例えば、母体健康状態の決定およびモニタリング、ならびに胎児に対する母体免疫反応の測定に使用することができる。一部の実施形態は、流産および早期分娩の予測に関する。一部の実施形態は、新生児血漿cfDNA配列決定による、臓器早発(organ prematurity)、黄疸、遺伝的欠損または他の新生児健康状態等、新生児健康状態
のモニタリング、調査、診断または予測に関する。
【0051】
疾患病理学研究の分野において、本システム、方法および組成物の実施形態は、例えば、複数のヒト臓器の間の動力学および相互作用のプロファイリングによる、縦断的研究を可能にし、研究者が多くの疾患の病理発生を理解するための、単純かつ低コストの組織起源定量化に使用することができる。
【0052】
したがって、本明細書に提供される一部の実施形態は、対象におけるcfDNAの定量化のための方法およびシステムに関する。一部の実施形態では、本方法は、特異的な型のがんを有するまたはこれを有すると疑われる対象から、血液の血漿等のcfDNAを保有することが既知の生体試料を得るステップを含む。本明細書で使用される場合、「がん」は、白血病、肉腫、癌腫および黒色腫を含む、哺乳動物、特にヒトに見出されるあらゆる型のがんまたは新生物または悪性腫瘍を指す。がんの例は、脳、乳房、子宮頸部、結腸、頭頸部、腎臓、肺、非小細胞肺、黒色腫、中皮腫、卵巣、肉腫、胃、子宮および髄芽腫のがんである。追加的ながんは、例えば、ホジキン病、非ホジキンリンパ腫、多発性骨髄腫、神経芽細胞腫、乳がん、卵巣がん、肺がん、横紋筋肉腫、原発性血小板増加症、原発性マクログロブリン血症、小細胞肺腫瘍、原発性脳腫瘍、胃がん、結腸がん、悪性膵インスリノーマ(insulanoma)、悪性カルチノイド、膀胱がん、前悪性皮膚病変、精巣がん、リンパ腫、甲状腺がん、神経芽細胞腫、食道がん、泌尿生殖器がん、悪性高カルシウム血症、子宮頸部がん、子宮内膜がん、副腎皮質がんおよび前立腺がんを含むことができる。
【0053】
一部の実施形態では、全ゲノム配列(WGS)解析が、生体試料中のcfDNAにおいて実行されて、健康な患者におけるcfDNAの量と比較して、または健康な患者の標本(cross section)にわたるcfDNAレベルと比較して、上昇または減少したcfDN
A量を示し得る領域を識別する。例えば、患者が、肝損傷または肝臓がんを患う場合、ベースライン対照集団由来の肝臓由来のcfDNAのレベルと比較して、肝臓に由来すると識別される、上昇したcfDNAレベルを得ると予想することができる。ある特定の型のcfDNAのレベルは、種々の機械学習、人工知能または他のアルゴリズムによる解析を含む、本明細書に提供される様々なアルゴリズムにより、総cfDNAレベルから決定して、ベースライン対照と比較して、対象由来の特異的cfDNAのレベルおよび差を識別する、または複数の組織型に由来する複数の型のcfDNAのレベルおよび差を識別および比較することができる。一部の実施形態では、cfDNAの解析は、対象および正常ベースライン対照由来の異なる組織由来のcfDNAの相対的画分を定量するステップを含む。一部の実施形態では、定量化は、参照組織プロファイルのセットを決定するステップ、およびゲノムワイドcfDNAカバレッジデータに基づき、cfDNA試料における組織cfDNAの画分を定量するステップのうち一方または両方を含むことができる。ベースライン対照は、適切なベースラインを確立するための、様々な地理的領域、年齢、民族性、人種または性別由来の試料を含む、試料の集団由来の健康な対照試料を含むことができる。
【0054】
本明細書に提供される一部の実施形態は、生体試料におけるセルフリーDNA(cfDNA)を解析する方法に関する。一部の実施形態では、本方法は、cfDNAを含む生体試料を得るステップと;試料からcfDNAを濃縮して、濃縮されたcfDNAを提供するステップであって、濃縮されたcfDNAが、複数のcfDNA断片を含み、各断片が、特異的な組織または細胞型に対応する、ステップと;各cfDNA断片を定量して、ゲノムワイドcfDNAプロファイルを生成するステップであって、ゲノムワイドcfDNAプロファイルが、複数のコピー数シグナルを含み、各コピー数シグナルが、cfDNA断片に対応する、ステップと;ゲノムワイドcfDNAプロファイルを、既知のcfDNAコピー数シグネチャーのプロファイルと比較して、細胞損傷、組織損傷または臓器損傷を決定するステップとを含む。
【0055】
一部の実施形態では、生体試料は、cfDNAのプロファイルを有するまたはこれを有すると疑われるいずれかの生体試料であることができる。よって、生体試料は、対象から得られる生体液等、対象に由来するまたはこれから得られるいずれかの試料であることができる。よって、例として、生体試料は、血液、血漿、血清、尿、脳脊髄液、唾液、リンパ液、房水、硝子体液、蝸牛液(cochlear fluid)、涙、乳汁、痰、腟分泌物、またはこれらのいずれかの組合せとなることができる、またはこれに由来するもしくはこれから得ることができる。
【0056】
一部の実施形態では、試料中のcfDNAの濃縮等、目的の核酸またはその断片の濃縮は、いずれか適した濃縮技法を含むことができる。一部の実施形態では、cfDNAの濃縮は、分子反転プローブ、溶液中捕捉(in solution capture)、プルダウンプローブ、
ベイトセット、標準PCR、マルチプレックスPCR、ハイブリッド捕捉、エンドヌクレアーゼ消化、DNase I高感受性および選択的環状化による濃縮を含むことができる。濃縮は、望まれない材料を排除することによる、核酸の負の選択により達成することができる。この種類の濃縮は、「フットプリンティング」技法または「サブトラクティブ」ハイブリッド捕捉を含む。前者において、標的試料は、タンパク質の保護により、または一本鎖および二本鎖配置によって、ヌクレアーゼ活性から安全である。後者において、「ベイト」プローブに結合する核酸が排除される。一部の実施形態では、濃縮は、cfDNAの増幅を含む。一部の実施形態では、増幅は、PCR増幅またはゲノムワイド増幅を含む。
【0057】
一部の実施形態では、cfDNAの定量化等、核酸の定量化は、試料における核酸または核酸断片の量の決定に適したいずれかの技法を含むことができる。よって、例えば、定量化は、配列決定に基づくDNA分子計数を使用したcfDNAの配列決定、またはハイブリダイゼーションに基づくDNA定量化の実行を含むことができる。
【0058】
一部の実施形態では、各コピー数シグナルは、特異的組織または細胞型由来のcfDNAの相対的寄与を示す。コピー数は、本明細書で使用される場合、いずれかの配列決定技術またはハイブリダイゼーションに基づくDNAコピー数定量化技術による等、DNA分子計数により得られるシグナルに基づく、試料におけるゲノムワイドcfDNAカバレッジを指す。
【0059】
一部の実施形態では、組織型は、モニタリング、解析、測定されることが望まれる、または疑われる損傷が起こるもしくは起こり得る、いずれかの組織型である。一部の実施形態では、組織型は、腎臓、筋肉、心臓、血管、肝臓、脳、眼、肺、脂肪、腺、骨、骨髄、軟骨、腸、胃、皮膚または膀胱である。一部の実施形態では、細胞型は、血球細胞、ニューロン細胞、腎臓細胞、上皮、細胞外基質細胞もしくは免疫細胞、または細胞のいずれかの組合せである。例えば、本方法は、対象における1種または複数の組織または臓器型を測定またはモニタリングするステップを含むことができる。よって、一部の実施形態では、ゲノムワイドcfDNAプロファイルは、臓器健康の査定を提供するために、多臓器由来のcfDNAの量を定量する。一部の実施形態では、各cfDNA断片は、同時に定量される。本明細書で使用される場合、同時は、同時的にまたは実質的に同時的に行われる行動を指す。よって、同時定量化は、同時的なまたは実質的に同時的な、単一のアッセイにおける複数のcfDNA断片の解析を指す。したがって、本明細書に提供される実施形態は、単一解析普遍的血液検査に関し、これによると、多臓器は、単一のアッセイにおいてモニタリングされるまたはモニタリングされ得る。例えば、組織cfDNAの定量化は、多数のまたは単一の組織において決定することができる。一例は、腎臓cfDNA画分の定量化であることができる。
図2に示す通り、腎臓画分は、腎不全患者に関してより高く、本明細書に記載されている定量化は、腎不全の予測を可能にする。
【0060】
一部の実施形態では、初期試料が第1の時点で解析され、第2の試料が第2の時点で解析されるように、試料は、対象から定期的に得られ、かつ解析されて、経時的に健康をモニタリングし、cfDNAプロファイルの差が査定されて、cfDNAプロファイルの変化の指標を提供する。斯かる解析は、経時的なある特定の組織型の改善または悪化に関する情報を提供することができる。例えば、斯かる方法を使用して、臓器移植物をモニタリングする、薬物毒性をモニタリングする、処置レジメンをモニタリングする、経時的に様々な臓器もしくは組織の健康状態をモニタリングする、妊娠の異なるステージにおける母体健康をモニタリングする、妊娠中および出生前もしくは出生後に新生児健康をモニタリングする、または他の適した査定のために行うことができる。よって、本明細書に提供される一部の実施形態は、経時的な臓器移植物のモニタリングに関する。一部の実施形態では、ゲノムワイドcfDNAプロファイルは、臓器における薬物毒性を示す。一部の実施形態では、試料は母体試料であり、ゲノムワイドcfDNAプロファイルは胎児健康を示す。ある特定の組織、臓器、細胞または状態のモニタリングに適した期間は、特異的な適用に依存することができ、数分間単位、例えば、1、2、3、4、5、6、7、8、9、10、12、15、20、25、30、35、40、45、50、55もしくは60分毎の試料のモニタリング、数時間単位、例えば、1、2、3、4、5、6、7、8、9、10、12、15、18、20もしくは24時間毎、数日間単位、例えば、1、2、3、4、5、6、7、8、9、10、15、20、25もしくは30日毎、数ヶ月単位、例えば、1、2、3、4、5、6、7、8、9、10、11もしくは12ヶ月毎、または数年間単位、例えば、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80年毎もしくはそれよりも多く、または上述の値のうちいずれか2つによって定義された範囲内の時間量であることができる。例えば、腎臓臓器移植物は、本明細書に記載されているシステムおよび方法を使用して、経時的にモニタリングすることができる。
図3A~
図3Bに示す通り、ドナー腎臓cfDNAおよび患者自身の腎臓cfDNAに関する、時間の関数としての、腎臓組織由来のDNAの割合の時間経過パターンは、経時的にモニタリングすることができる。
【0061】
一部の実施形態では、本方法は、ゲノムワイドcfDNAプロファイルからベースライン参照プロファイルを減算するステップをさらに含む。ベースラインプロファイルが被験試料において説明され得るように、ベースライン参照プロファイルは、ベースラインcfDNA試料において提示される特異的な細胞または組織型に対応し、ベースラインからの変化または変動は、診断または異常検出に使用することができる。
【0062】
本明細書に提供される一部の実施形態は、対象におけるがんの進行をモニタリングする方法に関する。一部の実施形態では、本方法は、対象から生体試料を得るステップであって、生体試料がセルフリーDNA(cfDNA)を含む、ステップと;試料におけるcfDNAを定量して、複数のコピー数シグナルを含むゲノムワイドcfDNAプロファイルを得るステップであって、各コピー数シグナルが特異的な細胞型または組織型のcfDNA断片に対応する、ステップと;複数のコピー数シグナルを、健康な対象の既知のコピー数シグナルのプロファイルと比較するステップとを含む。一部の実施形態では、既知のコピー数シグナルと比較した、試料におけるコピー数シグナルの差は、対象におけるがん性または前がん性状態と相関する。一部の実施形態では、cfDNAの定量化の前に、総cfDNAが試料から濃縮される。一部の実施形態では、本方法は、複数のコピー数シグナルをがん患者試料の既知のコピー数シグナルのプロファイルと比較するステップをさらに含む。一部の実施形態では、生体試料は、血液、血漿、血清、尿、脳脊髄液、唾液、リンパ液、房水、硝子体液、蝸牛液、涙、乳汁、痰、腟分泌物、またはこれらのいずれかの組合せを含む。一部の実施形態では、定量化は、配列決定に基づくDNA分子計数を使用した、cfDNAの配列決定を含む。一部の実施形態では、定量化は、ハイブリダイゼーションに基づくDNA定量化の実行を含む。一部の実施形態では、本方法は、cfDNAの定量化の前に、cfDNAの濃縮をさらに含む。一部の実施形態では、濃縮は、PCR増幅またはゲノムワイド増幅による、cfDNAの増幅を含む。
【実施例0063】
追加的な代替は、以下の実施例にさらに詳細に開示されているが、これは決して、特許請求の範囲の限定を意図するものではない。
一般手順および方法
抽出
【0064】
正常血液循環速度は、血液の全体積が1分間に1回循環するように、毎分約5リットルである。この速度は、cfDNA生成および分解動態よりもはるかに高く、cfDNA組成は、短い時間枠(例えば、5分間未満)内で、ある人物の血液中で均一である。これらの条件下、採血は、cfDNAのおよそポアソンサンプリングである。多項分布または多変量超幾何分布のいずれかが、DNA抽出のモデル化に使用される。
【0065】
抽出プロセスは、ポアソン分布n”l~Pois(n”・Σtβt・Atl)または統合して、多項分布(n”l)~Multi(Σtβt・At,n”)(式中、n”lは、遺伝子座lにおけるコピー数であり、n”は、cfDNA断片の総コピーであり、βtは、組織型t由来のcfDNAの画分であり、Atは、組織型tの参照コピー数プロファイルである)に従う。
PCR増幅
【0066】
PCRプロセスは、ガンマ分布n’l~ガンマ(n”l・ρ,θ)または統合して、ディリクレ分布(n’l)θ~Dir(α=(n”l・ρ))(式中、ρ=(1+r)/(1-r)/[1-(1+r)-t],θ=[(1+r)t-1]・(1-r)/(1+r)であり、rは、各サイクルにおけるPCR増幅効率であり、n’lは、PCR後の遺伝子座lにおけるDNA分子の数であり、n’は、cfDNA断片から増幅されたDNA分子の総数である)によって近似される。
配列決定
【0067】
抽出と同様に、配列決定は、ポアソン分布nl~Pois(n・n’l/n’)または統合して、多項分布(nl)~Multi(n’l/n’,n)(式中、nは、配列決定において観察された断片の数であり、nlは、所与の遺伝子座lに観察されたcfDNAコピー数である)に従う。
いくつかの数値
【0068】
ある典型的な人物におけるおよそ5,000mLの血液により、1.8~44ng/mL血漿cfDNAは、1,350,000~33,000,000コピーのヒトゲノムに対応する。1%の組織画分は、13,500~330,000コピーに対応する。例として、3ngのcfDNAが、cfDNA WGSアッセイのための入力として使用される場合、これは、総計900コピー、1%組織ゲノムの9コピー、0.1%組織ゲノムの0.9コピーに対応する。
(実施例1)
凝集されたcfDNAシグナルプロファイルのモデル化
【0069】
次の実施例は、凝集されたcfDNAシグナルプロファイルのモデル化の実施形態を実証する。
【0070】
抽出およびPCR可変性を無視すると、cfDNAシグナルのモデルSは、(nl)~Multi(Σtβt・At,n)である。およそ均等に分布した多数のビン(bin)(
または遺伝子座)を仮定すると、これは、ポアソン分布:nl~Pois(n・Σtβt・At)に近い。公知組織プロファイルAを仮定すると、組織画分B=(βt)のみが未知であり、これは、数値最適化によって解くことができる。
【0071】
cfDNAシグナルのモデルPSは、ガンマ-ポアソン(負の二項)分布nl~NB(n”l・ρ,p=n・θ/(n’+n・θ))である。n’=n”・ρ・θ,n”l=n”・Σtβt・Atlを仮定し、抽出の可変性を無視すると、nl~NB(n”・ρ・Σtβt・Atl,n/(n”・ρ+n))が得られる。n<<n”・ρの場合、これは、およそnl~Pois(n・Σtβt・Atl)であり、モデルSと同じである。
【0072】
EおよびPステップを、単一ディリクレ分布(n’l)/θ~Dir(n”・α・1/(1+1/ρ))またはn’l~ガンマ(n”・α・ρ/(1+ρ),(1+ρ)θ)へと組み合わせる。ディリクレ分布が使用されて、未知多項確率分布を推定する。より詳細には、これは、ベータ分布を多次元へと拡張し、事前分布および観察される分布の間に円滑な移行をもたらし、どの程度迅速に当該移行が起こるかについての制御を可能にする。
【0073】
抽出、PCRおよび配列決定ステップを一体に組み合わせると、cfDNAシグナルのモデルEPSは、(n
l)~DM(n”/(1+1/ρ)・α,n)または(n
l)~DM(n”・α・(1+r)/2,n)(式中、DMは、ディリクレ-多項分布である)である。およそ均等に分布した多数のビン(または遺伝子座)を仮定すると、これは、負の二項分布:n
l~NB(n”・α・ρ/(1+ρ),(1+ρ)θn/[(1+ρ)θn+n’]またはn
l~NB(n”・α
l・(1+r)/2,n/[n+n”・(1+r)/2]に近い。μ=n・α
l,δ
2=n・α
l・[n/n”・(1/ρ+1)+1]の平均および分散。n<<n”の場合、例えば、>1ng入力cfDNAによる30×WGSに関して、n
lは、ポアソン分布n
l~Pois(n・α
l)に接近する。表1は、cfDNA定量化に関与する確率モデルのリストを提示し、式中、α
l=Σ
tβ
t・A
tlおよびα=Σ
tβ
t・A
tである。
表1
【表1】
【0074】
cfDNAシグナルのモデルPSは、ガンマ-ポアソン(負の二項)分布nl~NB(n”l・ρ,p=n・θ/(n’+n・θ))である。n’=n”・ρ・θ,n”l=n”・Σtβt・Atlを仮定し、抽出の可変性を無視すると、nl~NB(n”・ρ・Σtβt・Atl,n/(n”・ρ+n))が得られる。n<<n”・ρの場合、これは、およそnl~Pois(n・Σtβt・Atl)であり、モデルSと同じである。
乗法更新
【0075】
ポアソンモデルnl~Pois(n・αl)は、費用としてのKL発散による非負行列因子分解と均等である。Lee and Seung, 2001に記載されている非負行列因子分解(NM
F)アルゴリズムに基づく乗法更新アルゴリズムβst←βst・ΣlAtl・rsl/(β・A)sl/ΣlAtlの適用は、βtのコンピュータ処理に使用される。
反復加重線形回帰
【0076】
所与の試料に関して、推定組織画分β0により、費用関数による加重線形回帰は、E(β;β0,A)=1/2・Σl[(rl-(β・A)l)2/(β0・A)l]として定義される。この加重線形回帰(regress)が解かれ(β0,A)、次いでβ←r・W-1
・AT(A・W-1・AT)-1(式中、W=diag(β0・A))、さらなる反復更新アルゴリズムを提供する。これと正則(regular)線形回帰E=1/2・Σl[(rl
-(β・A)l)2との間の差は、W=diag(α)=β・ALに基づく加重である。モデルEPSの導出
【0077】
(n’
l)/θ~Dir((n”
l・ρ))および(n”
l)~Multi(α,n”)を仮定し、全分散の法則を次の通りに示す:
【数4】
【0078】
これは、Dir(n”・α・1/(1+1/ρ))にマッチする。n”
l~Pois(n”・α
l)およびn’
l~ガンマ(n”
l・ρ,θ)を仮定し、全分散の法則を示す:
【数5】
【0079】
これは、ガンマ(n”・α・ρ/(1+ρ),(1+ρ)θ)にマッチする。
【数6】
(実施例2)
組織cfDNAプロファイルの決定
【0080】
以下の実施例は、組織cfDNA参照プロファイルを決定するための方法の実施形態を実証する。
【0081】
組織特異的または細胞型特異的cfDNAシグナルプロファイルを推定するために、2つの相補的戦略を使用することができる。第1の方法は、変動する画分において目的の組織/細胞を含有する試料のセットに基づき、教師なし機械学習を使用することである。第2の方法は、組織/細胞型のゲノムDNA(gDNA)エピジェネティックプロファイルまたは遺伝子発現プロファイルに基づき、所与の組織/細胞に起源をもつcfDNAシグナルプロファイルを予測することにより、教師つき機械学習を使用することである。
教師なし機械学習
【0082】
教師つき機械学習方法は、非負行列因子分解を適用して、cfDNA混合物シグナルを分解し、組織特異的cfDNAカバレッジプロファイルを抽出する。ポアソンモデルnl~Pois(n・αl)は、費用としてのカルバック・ライブラー(KL)発散による非負行列因子分解と均等である。KL発散は、ある確率分布が、参照確率分布とどの程度異なるかの尺度である。目的の組織型の十分なサイズおよび組織組成の所与のデータセットに関して、Lee and Seung 2001によるNMFアルゴリズムが適用されて、各試料における組織画分を推定すると共に、組織cfDNAプロファイルを確かめる。試料における組織tの組織画分は、βst←βst・ΣlAtl・rsl/(β・A)sl/ΣlAtlによって推定される一方、組織型tの遺伝子座lにおけるcfDNAシグナルは、Atl←Atl・Σsβst・rsl/(β・A)sl/Σsβstによって推定され、式中、・は、行列の乗算であり、rslは、試料sにおける遺伝子座lを被覆する読み取りデータの画分である。
教師つき機械学習
【0083】
教師なしアルゴリズムについて、2つの関係する限界が存在する。第一に、これは、特異的な生理学的または疾患条件下の個体由来の試料を要求し、例えば、腎臓cfDNAプロファイルを学習するために、腎臓損傷が上昇した患者由来の複数のcfDNA試料へのアクセスが要求される。第二に、小さい細胞集団を有する組織型または稀な細胞型に関して、斯かる細胞によって寄与される血液cfDNAシグナルの画分は、非常に小さくなり得る。よって、より多い数のcfDNA試料が、斯かる組織または細胞型のcfDNAシグナルプロファイルを効果的に学習するために要求される。これらの限界は、大きいデータセットによって克服され得る。しかし、実際に、大きいデータセットは、全組織型への広範な適用cfDNA WGSに基づく組織定量化を防止し得る。
【0084】
これらの理由から、特異的な組織細胞試料由来のエピジェネティックまたは発現データから組織特異的cfDNAコピー数プロファイルを予測する教師つき機械学習を使用することができる。教師つき機械学習は、特異的な臓器損傷を有する患者由来のcfDNA試料へのアクセスを要求しないが、その代わりに、正常または疾患試料のいずれかに由来する単離された組織細胞のみを使用する。この方法は、一次元配列決定データにおいて、ディープニューラルネットワーク、より詳細には、回帰性ニューラルネットワークまたはコンボリューショナルニューラルネットワークを適用して、cfDNAプロファイルを予測する。ニューラルネットワークへの入力特色は、所与の組織型に関する、ゲノムワイドDNase到達性、DNAメチル化、ヒストンメチル化、ヒストンアセチル化プロファイルまたは遺伝子発現プロファイルを含む。機械学習からの予測は、目的の組織に関するゲノムワイドcfDNAコピー数プロファイルである。
【0085】
組織内(within-tissue)および組織間(cross-tissue)交差検証の両方が使用されて
、機械学習モデルを訓練および評価する。より詳細には、組織特異的エピジェネティックデータが、入力特色として調製され、推定組織cfDNAカバレッジプロファイル(教師なしアルゴリズムから)が、標的として調製される。組織内交差検証のため、検証のためのゲノムにおける遺伝子座のサブセットが保持され、他の遺伝子座が訓練に使用される。組織間交差検証のため、血球細胞等、ある特定の細胞型のcfDNA参照プロファイルが、訓練のために使用され、腎臓または肺細胞等、追加的な細胞型のcfDNA参照プロファイルが、検証のために使用される。
(実施例3)
cfDNA研究
【0086】
以下の実施例は、対象由来の試料におけるcfDNAを解析するための研究の実施形態を実証する。
パイロット研究
【0087】
末期腎疾患(ESRD)を有する10名の患者および10名の年齢、性別および体重がマッチした正常対照由来の血漿DNAを得て、研究した。試料毎に、30×WGSを実行した。ESRD vs正常対照を確実に区別することができる強いcfDNAシグナルの存在を得た。クラスタリング解析および主成分解析(PCA)は、ESRDおよび正常試料が、別個の群を形成することを示す。正常対照に関して、決定された腎臓画分は<0.5%であった。
混合物研究
【0088】
3つの症例対照ペアに関して、合成cfDNA混合物は、系列希釈によりESRDを対照cfDNAと混合することにより調製した。症例対照ペア毎に、100%、50%、25%、12.5%、6.25%、3.125%、1.5625%および0.78125%ESRD cfDNAによる8種の混合物を、対照cfDNAと希釈した。このデータセットにより、組織定量化解析性能を決定した。混合物研究は、推定される腎臓画分が、真の腎臓画分に対して線形であり、腎臓画分が、0.5%もの低さに対し正確に(CV<20%)決定され得ることを実証した。
【0089】
検証のための一実施形態は、組織cfDNA定量化のためのcfDNA試料を評価するためのプロセスを説明する
図5のブロック図において描写される。
図5に示す通り、第1のコホートは、対照および罹患対象を含むことができ、これは、ライブラリー調製、30×WGSに付され、次いで解析される。WGS産物の部分は、バイオマーカー発見に付され、一方、他の部分は、シグナル立証またはWGSアルゴリズムに付される。第2のコホートは、例えば、糖尿病対象、ループス対象、高血圧対象、腎臓疾患(慢性腎臓疾患(CKD)または多嚢胞性腎臓疾患(PKD)等)由来の多数の試料、対照試料、または他の対象由来の試料を含む、合成混合物のコホートであることができる。混合物は、アンプリコンアッセイ、配列決定およびアルゴリズムに適用されて、組織を定量する(定量化限界(LOQ)または検出限界(LOD)および方法の線形性の決定を含む)または疾患を診断する(方法の感度および特異度の決定を含む)ための方法の性能を決定する。
完全研究
【0090】
混合物研究に続いて、慢性腎臓疾患(CKD)の様々なステージにおける200名前後の糖尿病患者試料が収集され、30×cfDNA WGSに付される。結果は、推定される腎臓画分が、初期ステージCKD患者対末期CKD患者を確実に区別することができ、推定される腎臓画分が、初期ステージCKD患者対CKDなしの糖尿病患者を確実に区別することができ、推定される腎臓画分が、腎臓疾患の重症度と相関することを示す。
多様な臓器研究
【0091】
心不全もしくは肺損傷(例えば、嚢胞性線維症)患者または正常対照由来の5種の血液試料が収集され、30×cfDNA WGSに付される。結果は、心不全、肺損傷または腎臓疾患患者が、互いに別個のcfDNAシグナルプロファイルを有し、これらが正常対照とは異なること、また、心臓cfDNA画分および肺cfDNA画分を定量することができることを実証する。
多様な移植研究
【0092】
肺または心臓移植患者由来の5種の血液試料が収集され、30×cfDNA WGSに付される。結果は、心臓移植または肺移植患者が、別個のパターンを有すること、また、推定肺画分または心臓画分が、遺伝的変異体に基づくドナー臓器画分と線形に相関することを実証する。
【0093】
用語「を含む(comprising)」は、本明細書で使用される場合、「を含む(including
)」、「を含有する」または「により特徴付けられる」と同義であり、包括的またはオープンエンドであり、追加的な、列挙されていない要素または方法ステップを除外しない。
【0094】
上の記載は、本発明のいくつかの方法および材料を開示する。本発明は、方法および材料における改変、ならびに製作方法および装置における変更を許容する。斯かる改変は、本開示の考慮または本明細書に開示されている発明の実施から、当業者に明らかとなるであろう。結果的に、本発明は、本明細書に開示されている特異的な実施形態に限定されることを意図しないが、本発明の真の範囲および精神の内に収まるあらゆる改変および代替を網羅することを意図する。
【0095】
公開および非公開の出願、特許および文献の参考文献が挙げられるがこれらに限定されない、本明細書に引用されているあらゆる参考文献は、それらの全体が参照により本明細書に組み込まれ、これにより、本明細書の一部分を為す。参照により本明細書に組み込まれる刊行物および特許または特許出願が、本明細書に含有される開示と矛盾する程度まで、本明細書は、いかなる斯かる矛盾した材料にも優先するおよび/またはその優位に立つことが意図される。
本発明は、例えば、以下の項目を提供する。
(項目1)
生体試料におけるセルフリーDNA(cfDNA)を解析する方法であって、
cfDNAを含む生体試料を得るステップと;
前記試料からcfDNAを抽出して、精製されたcfDNAを提供するステップであって、前記精製されたcfDNAが複数のcfDNA断片を含み、各断片が特異的な組織または細胞型に対応する、ステップと;
前記cfDNA断片を定量して、ゲノムワイドcfDNAコピー数プロファイルを生成するステップであって、前記ゲノムワイドcfDNAコピー数プロファイルが複数のコピー数シグナルを含み、各コピー数シグナルがcfDNA断片に対応する、ステップと;
前記ゲノムワイドcfDNAコピー数プロファイルを既知のcfDNAシグネチャーのセットと比較して、細胞損傷、組織損傷または臓器損傷を決定するステップと
を含む方法。
(項目2)
前記生体試料が、血液、血漿、血清、尿、脳脊髄液、唾液、リンパ液、房水、硝子体液、蝸牛液、涙、乳汁、痰、腟分泌物、またはこれらのいずれかの組合せを含む、項目1に記載の方法。
(項目3)
定量するステップが、配列決定に基づくDNA分子計数を使用して、前記cfDNAを配列決定する工程を含む、項目1に記載の方法。
(項目4)
目的のcfDNA断片を濃縮するステップをさらに含む、項目1に記載の方法。
(項目5)
定量するステップが、ハイブリダイゼーションに基づくDNA定量化を実行する工程を含む、項目1に記載の方法。
(項目6)
抽出するステップが、gDNAを除外し、かつcfDNA断片を濃縮するための、サイズに基づく濃縮を含む、項目1に記載の方法。
(項目7)
濃縮するステップが、前記cfDNAの増幅を含む、項目1に記載の方法。
(項目8)
増幅が、PCR増幅またはゲノムワイド増幅を含む、項目7に記載の方法。
(項目9)
各コピー数シグナルが、特異的な組織または細胞型由来のcfDNAの相対的寄与を示す、項目1に記載の方法。
(項目10)
前記組織型が、腎臓、筋肉、心臓、血管、肝臓、脳、眼、肺、脂肪、腺、骨、骨髄、軟骨、腸、胃、皮膚または膀胱である、項目1に記載の方法。
(項目11)
前記細胞型が、血球細胞、ニューロン細胞、腎臓細胞、上皮、細胞外基質細胞、ベータ細胞または免疫細胞である、項目1に記載の方法。
(項目12)
前記ゲノムワイドcfDNAプロファイルが、臓器または多臓器健康の査定を提供する
ために、多臓器由来のcfDNAの量を定量するために使用される、項目1に記載の方法。
(項目13)
前記試料が、対象から定期的に得られ、かつ解析されて、経時的に健康をモニタリングする、項目1に記載の方法。
(項目14)
経時的に臓器移植物をモニタリングするステップをさらに含む、項目13に記載の方法。
(項目15)
前記ゲノムワイドcfDNAプロファイルが、臓器における薬物毒性または有効性を示す、項目1に記載の方法。
(項目16)
前記試料が母体試料であり、前記ゲノムワイドcfDNAプロファイルが胎児健康を示す、項目1に記載の方法。
(項目17)
様々な組織および細胞型に対応する参照cfDNAプロファイルのセットに前記ゲノムワイドcfDNAプロファイルを投射することにより、多臓器が、同時に定量される、項目1に記載の方法。
(項目18)
前記ゲノムワイドcfDNAプロファイルからベースライン参照プロファイルを減算するステップをさらに含む、項目1に記載の方法。
(項目19)
対象における疾患進行をモニタリングする方法であって、
前記対象から生体試料を得るステップであって、前記生体試料がセルフリーDNA(cfDNA)を含む、ステップと;
前記試料における前記cfDNAを定量して、複数のコピー数シグナルを含むゲノムワイドcfDNAプロファイルを得るステップであって、各コピー数シグナルが特異的な細胞型または組織型のcfDNA断片に対応する、ステップと;
前記複数のcfDNAコピー数シグナルを健康な対象の既知のコピー数シグナルのセットと比較するステップと
を含み、前記既知のコピー数シグナルと比較した、前記試料におけるコピー数シグナルの差が、前記対象における疾患進行と相関する、方法。
(項目20)
前記cfDNAを定量するステップの前に、総cfDNAが前記試料から濃縮される、項目19に記載の方法。
(項目21)
前記複数のコピー数シグナルを、罹患患者試料の既知のコピー数シグナルのプロファイルと比較するステップをさらに含む、項目19に記載の方法。
(項目22)
前記生体試料が、血液、血漿、血清、尿、脳脊髄液、唾液、リンパ液、房水、硝子体液、蝸牛液、涙、乳汁、痰、腟分泌物、またはこれらのいずれかの組合せを含む、項目19に記載の方法。
(項目23)
定量するステップが、配列決定に基づくDNA分子計数を使用して、前記cfDNAを配列決定する工程を含む、項目19に記載の方法。
(項目24)
定量するステップが、ハイブリダイゼーションに基づくDNA定量化を実行するステップを含む、項目19に記載の方法。
(項目25)
前記疾患が、心不全、肺損傷、糖尿病、クローン病または腎臓疾患から選択される、項
目19に記載の方法。
(項目26)
濃縮するステップが、標的化された増幅またはゲノムワイド増幅により、前記cfDNAを増幅する工程を含む、項目25に記載の方法。
(項目27)
対象における組織および臓器健康をモニタリングする方法であって、
前記対象から生体試料を得るステップであって、前記生体試料がセルフリーDNA(cfDNA)を含む、ステップと;
前記試料における前記cfDNAを定量して、複数のコピー数シグナルを含むゲノムワイドcfDNAプロファイルを得るステップであって、各コピー数シグナルが特異的な細胞型または組織型のcfDNA断片に対応する、ステップと;
前記複数のcfDNAコピー数シグナルを、健康な対象の既知のコピー数シグナルのセットと比較するステップと
を含み、前記既知のコピー数シグナルと比較した、前記試料におけるコピー数シグナルの差が、前記対象における臓器健康状態の変化と相関する、方法。
(項目28)
前記cfDNAを定量するステップの前に、総cfDNAが前記試料から濃縮される、項目27に記載の方法。
(項目29)
前記複数のコピー数シグナルを、不良な組織または臓器健康を有する患者由来の試料の既知のコピー数シグナルのプロファイルと比較するステップをさらに含む、項目27に記載の方法。
(項目30)
前記生体試料が、血液、血漿、血清、尿、脳脊髄液、唾液、リンパ液、房水、硝子体液、蝸牛液、涙、乳汁、痰、腟分泌物、またはこれらのいずれかの組合せを含む、項目27に記載の方法。
(項目31)
定量するステップが、配列決定に基づくDNA分子計数を使用して、前記cfDNAを配列決定する工程を含む、項目27に記載の方法。
(項目32)
定量するステップが、ハイブリダイゼーションに基づくDNA定量化を実行する工程を含む、項目27に記載の方法。
(項目33)
濃縮するステップが、標的化された増幅またはゲノムワイド増幅により、前記cfDNAを増幅する工程を含む、項目27に記載の方法。