(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022058469
(43)【公開日】2022-04-12
(54)【発明の名称】尿および他のサンプルにおける無細胞DNAの分析
(51)【国際特許分類】
C12Q 1/68 20180101AFI20220405BHJP
G16B 40/00 20190101ALI20220405BHJP
G16H 10/40 20180101ALI20220405BHJP
G16H 50/00 20180101ALI20220405BHJP
G01N 33/48 20060101ALI20220405BHJP
G01N 33/50 20060101ALI20220405BHJP
C12Q 1/6869 20180101ALI20220405BHJP
C12N 15/09 20060101ALN20220405BHJP
【FI】
C12Q1/68
G16B40/00
G16H10/40
G16H50/00
G01N33/48 Z
G01N33/50 P
C12Q1/6869 Z
C12N15/09 Z
【審査請求】有
【請求項の数】23
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2021214585
(22)【出願日】2021-12-28
(62)【分割の表示】P 2019529243の分割
【原出願日】2017-11-30
(31)【優先権主張番号】62/427,999
(32)【優先日】2016-11-30
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
2.SWIFT
(71)【出願人】
【識別番号】512037244
【氏名又は名称】ザ チャイニーズ ユニバーシティ オブ ホンコン
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【弁理士】
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100150810
【弁理士】
【氏名又は名称】武居 良太郎
(74)【代理人】
【識別番号】100166165
【弁理士】
【氏名又は名称】津田 英直
(72)【発明者】
【氏名】ロー ユク-ミン デニス
(72)【発明者】
【氏名】チウ ロッサ ワイ クン
(72)【発明者】
【氏名】チャン クワン チー
(72)【発明者】
【氏名】チアン ペイヨン
(72)【発明者】
【氏名】チョン ホア ツェー ティモシー
(57)【要約】
【課題】無細胞DNAを分析することによって特定の臓器の疾患(例えば癌)を検出することができる。いくつかの実施形態は、例えば、尿、唾液、血液、および便サンプル中に生じ得るように、特定の臓器由来または特定の臓器を通過する臓器関連サンプルを使用することができる。いくつかの実施形態では、無細胞DNAのメチル化レベルはサンプル中で測定することができる。組織特異的メチル化パターンを使用して、異なる組織型からの寄与度を決定することができる。他の実施形態では、臓器関連の無細胞DNAのサイズを測定することができる。
【解決手段】サイズプロファイルの統計的尺度は、無細胞DNA断片が健康でない組織と比較して健康な組織を有する対象について予想より集合的に長いことを示し得る。他の実施形態では、2つの異なるサンプルを分析して、特定の臓器に癌があるかどうかを決定することができる。血液サンプルおよび臓器関連サンプルの両方の無細胞DNAを分析して、コピー数異常を示す染色体領域を同定することができる。
【選択図】なし
【特許請求の範囲】
【請求項1】
生物の生物学的サンプルを分析する方法であって、前記生物学的サンプルが第1の組織型を含む複数の組織型からの無細胞DNA分子の混合物を含み、前記方法が、
Nが10以上の整数である、N個のゲノム部位を同定することと、
M個の組織型のそれぞれについて、
前記N個のゲノム部位でN個の組織特異的メチル化レベルを得ることであって、NがM以上であり、前記組織特異的メチル化レベルがN×Mの寸法のマトリックスAを形成し、前記M個の組織型のうちの1つが第1の臓器の第1の疾患に対応する第1の罹患組織型に対応する、得ることと、
コンピュータシステムによって、前記生物学的サンプルからの複数の無細胞DNA分子を分析することであって、前記複数の無細胞DNA分子が少なくとも1,000個の無細胞DNA分子であり、前記無細胞DNA分子を分析することが、
前記生物に対応する参照ゲノム中の前記無細胞DNA分子の位置を同定することを含む、分析することと、
前記N個のゲノム部位のうちのいずれか1つにそれぞれ位置する前記複数の無細胞DNA分子のセットを同定することと、
前記複数の無細胞DNA分子の前記セットを用いて、前記N個のゲノム部位のN個の混合物メチル化レベルを測定することと、
前記M個の組織型それぞれの前記N個の混合物メチル化レベルおよび前記N個の組織特異的メチル化レベルを使用して、前記コンピュータシステムによって、前記混合物中の前記第1の罹患組織型の第1の寄与度を決定することと、
前記生物内の前記第1の臓器の前記第1の疾患のレベルを決定するために、前記第1の罹患組織型の前記第1の寄与度を使用することと、を含む、方法。
【請求項2】
前記M個の組織型のうちの第2の組織型が、第1の臓器の第2の疾患に対応する第2の罹患組織型に対応し、前記方法が、
前記M個の組織型それぞれの前記N個の混合物メチル化レベルおよび前記N個の組織特異的メチル化レベルを使用して、前記コンピュータシステムによって、前記混合物中の前記第2の罹患組織型の第2の寄与度を決定することと、
前記生物内の前記第1の臓器についての前記第2の疾患のレベルを決定するために、前記第2の罹患組織型の前記第2の寄与度を使用することと、をさらに含む、請求項1に記載の方法。
【請求項3】
前記M個の組織型のうちの第2の型が、第2の臓器の第2の疾患に対応する第2の罹患組織型に対応し、前記方法が、
前記M個の組織型それぞれの前記N個の混合物メチル化レベルおよび前記N個の組織特異的メチル化レベルを使用して、前記コンピュータシステムによって、前記混合物中の前記第2の罹患組織型の第2の寄与度を決定することと、
前記生物内の前記第2の臓器についての前記第2の疾患のレベルを決定するために、前記第2の罹患組織型の前記第2の寄与度を使用することと、をさらに含む、請求項1に記載の方法。
【請求項4】
前記M個の組織型のうちの第2の組織型が、前記第1の臓器の健康な組織に対応する、請求項1に記載の方法。
【請求項5】
前記生物学的サンプルが、第1の臓器由来である、または前記生物学的サンプルが前記生物から出るときに前記第1の臓器を通過する、請求項1に記載の方法。
【請求項6】
前記生物学的サンプルが尿であり、前記第1の臓器が膀胱である、請求項1に記載の方法。
【請求項7】
前記生物学的サンプルが尿であり、前記第1の臓器が腎臓である、請求項1に記載の方法。
【請求項8】
前記第1の疾患が、糸球体腎炎またはネフローゼ症候群である、請求項7に記載の方法。
【請求項9】
前記生物学的サンプルが唾液であり、前記第1の臓器が唾液腺である、請求項1に記載の方法。
【請求項10】
前記第1の疾患が癌である、請求項1に記載の方法。
【請求項11】
前記生物学的サンプルが尿サンプルであり、前記方法が、
エチレンジアミン四酢酸(EDTA)を添加することによって前記尿サンプルを調製すること、をさらに含む、請求項1に記載の方法。
【請求項12】
前記生物学的サンプル中の無細胞DNAおよび細胞DNAの寄与比率を決定することをさらに含む、請求項1に記載の方法。
【請求項13】
前記N個のゲノム部位が閾値量未満の個体間変動を有する部位を含む、請求項1に記載の方法。
【請求項14】
前記M個の組織型が、腎臓、尿路上皮、好中球、B細胞、およびT細胞を含む、請求項1に記載の方法。
【請求項15】
前記N個のゲノム部位が、正常尿路上皮のメチローム中の部位を含む、請求項1に記載の方法。
【請求項16】
前記N個のゲノム部位が、正常尿路上皮のメチロームおよび腫瘍メチロームに共通する部位を含む、請求項1に記載の方法。
【請求項17】
生物の尿サンプルを分析する方法であって、前記尿サンプルが正常細胞および潜在的に癌に関連する細胞に由来するDNAを含み、前記DNAの少なくとも一部が前記尿サンプル中で無細胞であり、前記方法が、
複数のサイズの各サイズについて、
前記サイズに対応する前記尿サンプルからのDNA断片の量を測定することと、
複数のサイズにおける前記DNA断片の量に基づいて、第1のパラメータの第1の値を計算することであって、前記第1のパラメータが前記尿サンプル中のDNA断片のサイズプロファイルの統計的尺度を提供し、前記DNA断片のサイズの増加と共に前記第1のパラメータが増加する、計算することと、
前記第1の値を基準値と比較することと、
前記比較することに基づいて膀胱癌のレベルの分類を決定することと、を含む、方法。
【請求項18】
前記基準値が、膀胱癌を有することおよび/または膀胱癌を有さないことがそれぞれ分かっているサンプルから決定される、請求項17に記載の方法。
【請求項19】
前記第1のパラメータが周期性指標を含み、前記周期性指標が、前記サイズプロファイルの複数のピークにおけるDNA断片の量と前記サイズプロファイルの複数のトラフにおけるDNA断片の量との差を用いて計算され、
前記複数のピークが一定のサイズ間隔で存在し、
前記複数のトラフが、前記複数のピークからオフセットされた一定のサイズ間隔で存在する、請求項17に記載の方法。
【請求項20】
膀胱癌のレベルの分類を決定することが、前記第1の値が前記基準値よりも大きい場合に、前記生物が膀胱癌を有すると決定することを含む、請求項17に記載の方法。
【請求項21】
前記膀胱癌のレベルが、膀胱癌のステージを含む、請求項17に記載の方法。
【請求項22】
前記基準値が、前記生物の膀胱から腫瘍を除去する手術前に前記生物から決定される、請求項17に記載の方法。
【請求項23】
生物の腎臓の腎盂からの尿サンプルを分析する方法であって、前記尿サンプルがDNAを含み、前記DNAの少なくとも一部が無細胞であり、前記方法が、
複数のサイズの各サイズについて、
前記サイズに対応する前記尿サンプルからのDNA断片の量を測定することと、
複数のサイズの前記DNA断片の量に基づいて第1のパラメータの第1の値を計算することであって、前記第1のパラメータが前記尿サンプル中のDNA断片のサイズプロファイルの統計的尺度を提供する、計算することと、
前記第1の値を基準値と比較することと、
前記比較に基づいて前記腎臓の炎症レベルの分類を決定することと、を含む、方法。
【請求項24】
前記DNA断片のサイズの増加と共に前記第1のパラメータが増加する、請求項23に記載の方法。
【請求項25】
前記第1の値が前記基準値よりも大きい場合に、前記腎臓が炎症していると決定すること、をさらに含む、請求項23に記載の方法。
【請求項26】
前記腎臓の前記腎盂からの前記尿サンプルを得ること、をさらに含む、請求項23に記載の方法。
【請求項27】
前記第1のパラメータが周期性指標を含み、前記第1のパラメータが周期性指標を含み、前記周期性指標が、前記サイズプロファイルの複数のピークにおけるDNA断片の量と前記サイズプロファイルの複数のトラフにおけるDNA断片の量との差を用いて計算され、
前記複数のピークが一定のサイズ間隔で存在し、
前記複数のトラフが、前記複数のピークからオフセットされた一定のサイズ間隔で存在する、請求項23に記載の方法。
【請求項28】
前記第1のパラメータが、中央値または閾値サイズを有するDNA断片の割合を含む、請求項23に記載の方法。
【請求項29】
前記生物が健康であると分かっていた場合に、前記基準値が前記生物から決定される、請求項23に記載の方法。
【請求項30】
生物の第1のサンプルおよび血液サンプルを分析することによって、前記生物の第1の臓器における癌を同定する方法であって、前記第1のサンプルおよび前記血液サンプルが、両方とも正常細胞および潜在的に癌に関連する細胞に由来するDNAを含み、前記第1のサンプルが第1の臓器由来であり、または前記第1のサンプルが前記生物から出るときに前記第1の臓器を通過し、かつ前記血液サンプルとは異なり、前記DNAの少なくとも一部が、前記第1のサンプルおよび前記血液サンプルの両方において無細胞であり、前記方法が、
前記第1のサンプルおよび前記血液サンプルからの複数のDNA分子を分析することであって、前記DNA分子を分析することが、
前記生物のゲノム中の前記DNA分子の位置を同定することと、前記DNA分子が1つ以上の部位でメチル化されているかどうかを任意選択に決定することと、を含むDNA分子を分析することと、
前記生物の複数の染色体領域の各染色体領域について、
前記染色体領域が、前記第1のサンプルおよび前記血液サンプルのそれぞれについてコピー数異常またはメチル化異常のうちの少なくとも一方の異常を示すかどうかの分類を、
前記同定された位置に基づいて各サンプルからのDNA分子の各群を前記染色体領域からのものとして同定することであって、前記各群が前記染色体領域の複数の遺伝子座のそれぞれに位置する少なくとも1つのDNA分子を含む、同定することと、
コンピュータシステムを用いてDNA分子の前記各群の各値を計算することであって、前記各値が前記各群の前記DNA分子の特性を定義し、前記特性がコピー数またはメチル化レベルのうちの少なくとも1つである、計算することと、
前記各値を基準値と比較することと、によって決定することと、
前記第1のサンプルについて異常を示すと分類された染色体領域の第1の量が第1の閾値を超えるかどうかに基づいて第1の癌のレベルを決定することと、
前記血液サンプルについて異常を示すと分類された第2の量の染色体領域が第2の閾値を超えるかどうかに基づいて第2の癌のレベルを決定することと、
前記第1の癌のレベルは前記生物が癌を有することを示し、前記第2の癌のレベルは前記生物が癌を有しないことを示す場合に、前記生物が前記第1の臓器の癌を有すると決定することと、を含む、方法。
【請求項31】
前記メチル化異常が、低メチル化または高メチル化を含む、請求項30に記載の方法。
【請求項32】
前記第1のサンプルが、尿、唾液、または便である、請求項30に記載の方法。
【請求項33】
前記複数の染色体領域が非重複である、請求項30に記載の方法。
【請求項34】
前記血液サンプルが血漿または血清である、請求項30に記載の方法。
【請求項35】
前記DNA分子を分析することが、前記DNA分子が1つ以上の部位でメチル化されているかどうかを決定することをさらに含む、請求項30に記載の方法。
【請求項36】
前記基準値が正常サンプルについて決定される、請求項30に記載の方法。
【請求項37】
各染色体領域の前記基準値が、隣接する染色体領域についての前記各値と前記基準値との比較に依存する、請求項30に記載の方法。
【請求項38】
前記DNA分子が1つ以上の部位でメチル化されているかどうかを決定することをさらに含み、
前記異常が低メチル化であり、かつ
前記特性が前記メチル化レベルである、請求項30に記載の方法。
【請求項39】
前記異常がコピー数異常であり、
前記特性が前記コピー数である、請求項30に記載の方法。
【請求項40】
前記各値が、前記コピー数および前記メチル化レベルの両方を使用して計算される、請求項30に記載の方法。
【請求項41】
生物の尿サンプルを分析する方法であって、前記尿サンプルが正常細胞および潜在的に癌に関連する細胞に由来するDNAを含み、前記DNAの少なくとも一部が前記尿サンプル中で無細胞であり、前記方法が、
前記尿サンプルから複数のDNA分子を分析することであって、DNA分子を分析することが、
前記生物のゲノム中の前記DNA分子の位置を同定することを含む、DNA分子を分析することと、
前記生物の複数の染色体領域の各染色体領域について、
前記染色体領域が、コピー数異常またはメチル化異常のうちの少なくとも一方の異常を示すかどうかの分類を、
前記同定された位置に基づいて前記染色体領域に由来するものとして前記尿サンプルからのDNA分子の群を同定することであって、前記群が前記染色体領域の複数の遺伝子座のそれぞれに位置する少なくとも1つのDNA分子を含む、同定することと、
コンピュータシステムを用いて前記DNA分子の群の値を計算することであって、前記値が前記群の前記DNA分子の特性を定義し、前記特性がコピー数またはメチル化レベルのうちの少なくとも1つである、計算することと、
前記値を基準値と比較することと、によって決定することと、
前記尿サンプルについてコピー数異常を示すと分類された染色体領域の第1の量が第1の閾値を超えるかどうかに基づいて第1の癌のレベルを決定することと、
前記尿サンプルについて前記メチル化異常を示すと分類された染色体領域の第2の量が第2の閾値を超えるかどうかに基づいて第2の癌のレベルを決定することと、
腫瘍組織の寄与度が第3の閾値を超えるかどうかに基づいて第3の癌のレベルを決定することと、
前記第1の癌のレベル、前記第2の癌のレベル、または前記第3の癌のレベルのうちの少なくとも1つが、前記生物が癌を有することを示す場合に、前記生物が癌を有することを決定することと、を含む、方法。
【請求項42】
前記メチル化異常が低メチル化または高メチル化を含む、請求項41に記載の方法。
【請求項43】
前記腫瘍組織の前記寄与度を決定することをさらに含む、請求項41に記載の方法。
【請求項44】
前記腫瘍組織の前記寄与度を決定することが、腫瘍特異的体細胞変異、腫瘍特異的メチル化シグネチャ、腫瘍特異的断片のエンドパターン、または断片のサイズ分析を使用することによるものである、請求項43に記載の方法。
【請求項45】
前記腫瘍組織の前記寄与度を決定することが、得られた組織特異的メチル化レベルおよびゲノム部位で測定されたメチル化レベルからの前記腫瘍組織の前記寄与度を推定することによるものである、請求項43に記載の方法。
【請求項46】
前記腫瘍組織の前記寄与度を決定することが、
Nが10以上の整数である、N個のゲノム部位を同定することと、
M個の組織型のそれぞれについて、
前記N個のゲノム部位でN個の組織特異的メチル化レベルを得ることであって、NがM以上であり、前記組織特異的メチル化レベルがN×Mの寸法のマトリックスAを形成し、前記M個の組織型のうちの1つが膀胱の癌に対応する腫瘍組織に対応する、N個の組織特異的メチル化レベルを得ることと、
コンピュータシステムによって前記尿サンプルからの複数の無細胞DNA分子を分析することであって、前記複数の無細胞DNA分子が少なくとも1,000個の無細胞DNA分子であり、前記無細胞DNA分子を分析することが、
前記生物に対応する参照ゲノム中の前記無細胞DNA分子の位置を同定することを含む、無細胞DNA分子を分析することと、
前記N個のゲノム部位のうちのいずれか1つにそれぞれ位置する前記複数の無細胞DNA分子のセットを同定することと、
前記複数の無細胞DNA分子の前記セットを用いてN個のゲノム部位のN個の混合物メチル化レベルを測定することと、
前記M個の組織型それぞれの前記N個の混合物メチル化レベルおよび前記N個の組織特異的メチル化レベルを使用して、前記コンピュータシステムによって、前記混合物中の前記腫瘍組織の前記寄与度を決定することと、によるものである、請求項43に記載の方法。
【請求項47】
前記第1の癌のレベル、前記第2の癌のレベル、もしくは前記第3の癌のレベルのうちの少なくとも2つが、前記生物が癌を有することを示す場合に、または前記第1の癌のレベル、前記第2の癌のレベル、もしくは前記第3の癌のレベルが、前記生物が癌を有することを示す場合に、前記生物が癌を有することを決定する、請求項41に記載の方法。
【請求項48】
生物の生物学的サンプルを分析する方法であって、前記生物学的サンプルは正常細胞および潜在的に癌に関連する細胞に由来し、前記DNAの少なくとも一部は、前記生物学的サンプル中で無細胞であり、前記方法が、
前記生物学的サンプルのDNA分子に対応する複数のシークエンスリードを受けることと、
前記シークエンスリードのゲノム位置を決定することと、
前記参照ゲノムに対して1つのミスマッチを有する前記シークエンスリードの数に基づいてパラメータを決定する、前記参照ゲノムに対して1つのミスマッチを有する前記シークエンスリードを決定するために、前記シークエンスリードと参照ゲノムとを比較することと、
前記パラメータを閾値と比較することと、
パラメータと前記閾値との前記比較を使用して癌のレベルの分類を決定することと、を含む、方法。
【請求項49】
複数のミスマッチが、体細胞変異およびシークエンシングエラーに起因する、請求項48に記載の方法。
【請求項50】
前記シークエンスリードの前記数が、正確に1つのミスマッチを有するシークエンスリードのものである、請求項48に記載の方法。
【請求項51】
癌のレベルの分類を決定することが、コピー数異常、低メチル化、高メチル化、または腫瘍寄与のうちの少なくとも1つを使用することを含む、請求項48に記載の方法。
【請求項52】
ヒトの尿サンプルを分析する方法であって、前記尿サンプルが正常細胞および潜在的に癌に関連する細胞に由来するDNAを含み、前記DNAの少なくとも一部は前記尿サンプル中で無細胞であり、前記方法が、
前記尿サンプルのDNA分子に対応する複数のシークエンスリードを得ることと、
前記複数のシークエンスリードのうちの各シークエンスリードについて、
コンピュータシステムによって、前記シークエンスリードがヒト参照ゲノムに整列する場合に、前記シークエンスリードをヒトリードとして分類すること、または
前記シークエンスリードが第1の病原体の種または属に対応する第1の病原体参照ゲノムに整列する場合に、前記シークエンスリードを第1の病原体リードとして分類することと、
第1の病原体リードの量に基づいてパラメータを決定することと、
前記パラメータとカットオフ値とを比較することであって、前記カットオフ値が、膀胱癌を有する参照サンプルの第1のセットおよび膀胱癌を有さない対照サンプルの第2のセットから決定される、比較することと、
前記比較を用いて膀胱癌のレベルの分類を決定することと、を含む、方法。
【請求項53】
前記シークエンスリードを第1の病原体リードとして分類することが、1つ以上の細菌の参照ゲノムに前記シークエンスリードを整列させることを含む、請求項52に記載の方法。
【請求項54】
前記第1の病原体が細菌である、請求項52に記載の方法。
【請求項55】
前記細菌が、Halonotius、Thermococcus、Nitrosopumilus、またはActinomycesを含む、請求項54に記載の方法。
【請求項56】
前記パラメータが第1のパラメータであり、
前記カットオフ値が第1のカットオフ値であり、
前記複数のシークエンスリードのうちの各シークエンスリードについて、
前記シークエンスリードを第2の病原体の種または属に対応する第2の病原体参照ゲノムに整列させる場合に、前記シークエンスリードを第2の病原体リードとして分類することと、
第2の病原体リードの第2の量に基づいて第2のパラメータを決定することと、
前記第2のパラメータを第2のカットオフ値と比較することと、
前記第1のパラメータと前記第1のカットオフ値との比較、および前記第2のパラメータと前記第2のカットオフ値との比較を使用して、前記膀胱癌のレベルの分類を決定することと、をさらに含む、請求項52に記載の方法。
【請求項57】
前記第1の病原体が、mycobacterium、halobacterium、actinomyces、corynebacterium、またはcandidatusを含む、請求項52に記載の方法。
【請求項58】
上記の前記方法のいずれかの動作を実行するコンピュータシステムを制御するための複数の命令を保存するコンピュータ可読媒体を含むコンピュータ製品。
【請求項59】
請求項58に記載の前記コンピュータ製品と、
前記コンピュータ可読媒体上に保存された命令を実行するための1つ以上の処理装置と、を備えたシステム。
【請求項60】
上記の前記方法のいずれかを実行するための手段を含むシステム。
【請求項61】
上記の方法のいずれかを実行するように構成されたシステム。
【請求項62】
上記の方法のいずれかのステップをそれぞれ実行するモジュールを備えるシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2016年11月30日に出願された「尿および他のサンプルにおける無細胞DNAの分析」と題する米国仮特許出願第62/427,999号からの優先権を主張し、全ての目的のために、その内容全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
ヒトの体液に見出される細胞外DNAの短い断片は、アポトーシスおよび壊死中に死細胞から放出される(1)。胎児由来の循環血漿中の無細胞(cf)DNA(2)、腫瘍細胞(3)および移植同種移植(4)の分析は、非侵襲的出生前検査(5)、腫瘍を評価するための「液体生検」(6、7)、および移植臓器の臨床状態のモニタリング(8)の開発を可能にしてきた。
【0003】
尿分析は全く非侵襲的であり、尿中cfDNAの由来を理解することは、「液体生検」の形態としてのその臨床使用を導くのに有用である。尿の無細胞上清から単離されたDNAは、腎前性、腎性、または腎後性の系から生じるものとして大別され得る。輸血(9)、妊娠(9-11)、造血幹細胞移植(12)、非泌尿器悪性腫瘍(13、14)、腎移植(15)、および膀胱癌(16、17)をモデル系として用いて、いくつかの群では尿中cfDNAの割合が全身循環、腎臓、および腎後性尿路上皮に由来していることを実証してきた。
【0004】
以前の研究では、目的の単一ソースから一度にcfDNA検出することを重視し、特定のソースに由来する尿中cfDNAの量には大きな変動がある。総尿中cfDNAに対する各組織ソースの寄与比率は不明であり、いくつかの研究では、目的のソースからのcfDNA濃度は極端に低く、または検出不能である(15、16、18)。したがって、癌または他の疾患を検出するために、尿(または血液以外の非侵襲的生検、例えば唾液もしくは便サンプル)を使用することは困難であった。
【0005】
他の技術は、以前に癌と診断された患者をモニターするための点変異を分析する。しかしながら、そのような技術は、癌を診断するための無症候性患者の広く適用可能なスクリーニング技術に容易には修正できない。癌を検出し得る前に特定の点変異は同定されなければならない。したがって、周知の点変異についてのスクリーニングのみがスクリーニングに可能であり、または患者についての特定の点変異は、以前に検出された腫瘍についての従来の侵襲性生検を通して同定されなければならない。
【発明の概要】
【0006】
実施形態は、特定の臓器での疾患の検出(例えば、癌)のために無細胞DNAを分析できる。いくつかの実施形態は、例えば、尿、唾液、血液、および便サンプル中に生じ得るように、特定の臓器由来または特定の臓器を通過する臓器関連サンプルを使用することができる。分析は様々な方法で実行することができる。
【0007】
いくつかの実施形態では、無細胞DNAのメチル化レベルをサンプル中で測定することができる。組織特異的メチル化パターンを使用して、異なる組織型からの寄与度を決定することができる。1つの組織型は、特定の臓器での特定の疾患の罹患組織型であり得る。罹患組織型の寄与度を使用して、サンプル中の特定疾患のレベル(分類)を決定することができる。一例として、メチル化パターンを使用して癌性膀胱内膜細胞の割合を決定することができ、その割合を使用して癌のレベルを決定することができる。
【0008】
他の実施形態では、臓器関連無細胞DNAのサイズを測定することができる。膀胱から排泄された尿サンプルを使用する例では、サイズプロファイルは、尿中に天然に存在する無細胞DNA断片を測定することができる。サイズプロファイルの統計的尺度は、無細胞DNA断片が健康な膀胱組織を有する対象について予想されるよりも集合的に長いことを示し得る。より長い断片の徴候を使用することで、対象における膀胱癌を同定することができる。尿サンプルを使用する別の例では、尿サンプルを腎盂から回収することができる。腎臓が炎症を起こしているかどうかについての判定は、無細胞DNA断片が、非炎症腎臓を有する対象について予想されるよりも集合的に長いことを示す統計的尺度に基づいて行うことができる。
【0009】
他の実施形態では、2つの異なるサンプルを分析して、特定の臓器が癌を有するかどうかを決定することができる。血液サンプルおよび臓器関連サンプル(例えば、尿、唾液、または便サンプル)両方の無細胞DNAを分析して、コピー数異常を示す染色体領域を同定することができる。血液サンプルが癌を示さず、臓器関連サンプルが癌を示す場合、対象はサンプルに関連した臓器に癌を有すると同定することができる。例えば、尿サンプルについては、対象は膀胱癌を有すると同定することができる。尿路の癌、尿路上皮から生じる移行上皮癌、および腎臓癌などの他の癌も検出することができる。
【0010】
他の実施形態は、本明細書に記載の方法と関係したシステムおよびコンピュータ可読媒体に関する。
【0011】
本発明の実施形態の性質および利点に関するより良好な理解は、以下の詳細な説明および添付の図面を参照して得ることができる。
【図面の簡単な説明】
【0012】
【
図1】本発明の実施形態による、腎臓、尿路上皮、B細胞、T細胞、および好中球から同定された19,418個のメチル化可変領域におけるメチル化密度を示す。各垂直線は、メチル化密度に基づいて色分けされた単一のメチル化可変領域を表す。高いメチル化密度を有するメチル化可変領域(DMR)を濃い灰色で表し、低いメチル化密度を有する遺伝子座を薄い灰色で表す。
【
図2】本発明の実施形態による、膀胱腫瘍、B細胞、尿路上皮、腎臓、好中球、およびT細胞における27,371個のメチル化可変領域(DMR)のメチル化密度を示すヒートマップである。
【
図3】本発明の実施形態による、造血幹細胞移植患者(HSCT)(三角)および腎移植患者(丸いドット)からの31の尿サンプル中の血球および腎臓に由来するcfDNAの寄与比率を示す。
【
図4A】本発明の実施形態による、正常尿路上皮細胞(
図4A)、単一の組織特異的メチル化パターンとしての尿路上皮および膀胱癌細胞(
図4B)、および別々の組織特異的メチル化パターンとしての尿路上皮および膀胱癌細胞(
図4C)を含む異なる組織特異的メチル化パターンを使用して定義された割合に対する、膀胱癌症例および無癌対照のメチル化デコンボリューションをグラフ化したものを示す。
【
図4B】本発明の実施形態による、正常尿路上皮細胞(
図4A)、単一の組織特異的メチル化パターンとしての尿路上皮および膀胱癌細胞(
図4B)、および別々の組織特異的メチル化パターンとしての尿路上皮および膀胱癌細胞(
図4C)を含む異なる組織特異的メチル化パターンを使用して定義された割合に対する、膀胱癌症例および無癌対照のメチル化デコンボリューションをグラフ化したものを示す。
【
図4C】本発明の実施形態による、正常尿路上皮細胞(
図4A)、単一の組織特異的メチル化パターンとしての尿路上皮および膀胱癌細胞(
図4B)、および別々の組織特異的メチル化パターンとしての尿路上皮および膀胱癌細胞(
図4C)を含む異なる組織特異的メチル化パターンを使用して定義された割合に対する、膀胱癌症例および無癌対照のメチル化デコンボリューションをグラフ化したものを示す。
【
図5】本発明の実施形態による、罹患組織型の組織特異的メチル化パターンを用いて、生物の生体サンプルを分析する方法500を示すフローチャートである。
【
図6A】本発明の実施形態による、6人の膀胱癌症例および6人の対照についてのミリリットル尿あたりのゲノム当量(GE)の総cfDNA濃度を示す。
【
図6B】本発明の実施形態による、6人の膀胱癌症例および6人の対照についての膀胱腫瘍GE指数値を示す。
【
図7A】本発明の実施形態による、代表的なHSCT患者(
図7A)および腎移植患者(
図7B)のレシピエントならびにドナーDNAについての尿中cfDNAのサイズプロファイルを示す。
【
図7B】本発明の実施形態による、代表的なHSCT患者(
図7A)および腎移植患者(
図7B)のレシピエントならびにドナーDNAについての尿中cfDNAのサイズプロファイルを示す。
【
図8A】本発明の実施形態による、石が原因でブロックされた右腎の腎盂、および左腎からの排泄尿のcfDNAのサイズプロファイルを示す。
【
図8B】本発明の実施形態による、石が原因でブロックされた右腎の腎盂、および左腎からの排泄尿のcfDNAのサイズプロファイルを示す。
【
図9A】本発明の実施形態による、37℃で0時間、3時間、6時間インビトロ培養した腎盂からの尿のcfDNAのサイズプロファイルである。
【
図9B】本発明の実施形態による、37℃で0時間、3時間、6時間インビトロ培養した腎盂からの尿のcfDNAのサイズプロファイルである。
【
図10A】本発明の実施形態による、(a)3時間および(b)6時間培養した腎盂尿のサイズプロファイルと比較した排泄尿のサイズプロファイルを示す。
【
図10B】本発明の実施形態による、(a)3時間および(b)6時間培養した腎盂尿のサイズプロファイルと比較した排泄尿のサイズプロファイルを示す。
【
図11A】本発明の実施形態による、31のHSCTおよび腎移植尿サンプルについてのcfDNA断片のサイズパラメータ間の関係を表示するグラフである。
【
図11B】本発明の実施形態による、31のHSCTおよび腎移植尿サンプルについてのcfDNA断片のサイズパラメータ間の関係を表示するグラフである。
【
図12A】本発明の実施形態による、腎盂からの尿(
図12A)および排泄尿(
図12B)に対する37℃インビトロ培養実験中の尿中cfDNAの濃度を示す。
【
図12B】本発明の実施形態による、腎盂からの尿(
図12A)および排泄尿(
図12B)に対する37℃インビトロ培養実験中の尿中cfDNAの濃度を示す。
【
図13A】本発明の実施形態による、37℃で0~12時間インビトロ培養した排泄尿cfDNAのサイズプロファイル。
【
図13B】本発明の実施形態による、37℃で0~12時間インビトロ培養した排泄尿cfDNAのサイズプロファイル。
【
図13C】本発明の実施形態による、37℃で0~12時間インビトロ培養した排泄尿cfDNAのサイズプロファイル。
【
図13D】本発明の実施形態による、37℃で0~12時間インビトロ培養した排泄尿cfDNAのサイズプロファイル。
【
図14】本発明の実施形態による、生物の腎臓の腎盂からの尿サンプルを分析して、臓器損傷の程度(例えば、炎症レベル)を決定する方法1400のフローチャートである。
【
図15A】本発明の実施形態による、筋肉浸潤性膀胱癌2症例の術前および術後の尿サンプルのサイズプロファイルを示す。
【
図15B】本発明の実施形態による、筋肉浸潤性膀胱癌2症例の術前および術後の尿サンプルのサイズプロファイルを示す。
【
図16A】本発明の実施形態による、膀胱癌患者からの3つの排泄尿サンプルのサイズプロファイルを示す。
【
図16B】本発明の実施形態による、膀胱癌患者からの3つの排泄尿サンプルのサイズプロファイルを示す。
【
図16C】本発明の実施形態による、膀胱癌患者からの3つの排泄尿サンプルのサイズプロファイルを示す。
【
図17A】本発明の実施形態による、TURBTを受ける非筋肉浸潤性膀胱癌を有する3患者からの3つの術前尿サンプルのサイズプロファイルを示す。
【
図17B】本発明の実施形態による、TURBTを受ける非筋肉浸潤性膀胱癌を有する3患者からの3つの術前尿サンプルのサイズプロファイルを示す。
【
図17C】本発明の実施形態による、TURBTを受ける非筋肉浸潤性膀胱癌を有する3患者からの3つの術前尿サンプルのサイズプロファイルを示す。
【
図18】本発明の実施形態による、尿中cfDNAのサイズを使用して膀胱癌を検出するために生物の尿サンプルを分析する方法1800のフローチャートを示す。
【
図19A】本発明の実施形態による、対照、Ta-T1疾患を有する膀胱癌患者、およびT2-T4疾患を有する膀胱癌患者における70bp(P>70bp)よりも長い尿中cfDNA断片の割合の箱ひげ図を示す。
【
図19B】本発明の実施形態による、対照、Ta-T1疾患を有する膀胱癌患者、およびT2-T4疾患を有する膀胱癌患者における70bp(P>70bp)よりも長い尿中cfDNA断片の割合の箱ひげ図を示す。
【
図20】本発明の実施形態による、全体的なメチル化における一致、および尿中cfDNAおよび膀胱癌組織間のコピー数異常を表示するCircosプロットを示す。
【
図21A】本発明の実施形態による、5人の膀胱癌患者(A~E)の全体的なメチル化および尿中cfDNAのコピー数異常についてのCircosプロットを示す。
【
図21B】本発明の実施形態による、5人の膀胱癌患者(A~E)の全体的なメチル化および尿中cfDNAのコピー数異常についてのCircosプロットを示す。
【
図21C】本発明の実施形態による、5人の膀胱癌患者(A~E)の全体的なメチル化および尿中cfDNAのコピー数異常についてのCircosプロットを示す。
【
図21D】本発明の実施形態による、5人の膀胱癌患者(A~E)の全体的なメチル化および尿中cfDNAのコピー数異常についてのCircosプロットを示す。
【
図21E】本発明の実施形態による、5人の膀胱癌患者(A~E)の全体的なメチル化および尿中cfDNAのコピー数異常についてのCircosプロットを示す。
【
図22A】本発明の実施形態による、T22の膀胱癌腫瘍(19A)およびcf尿(19B)についてのCircosプロットを示す。
【
図22B】本発明の実施形態による、T22の膀胱癌腫瘍(19A)およびcf尿(19B)についてのCircosプロットを示す。
【
図23A】本発明の実施形態による、膀胱癌症例および対照における全体的な高メチル化密度の箱ひげ図を示す。
【
図23B】本発明の実施形態による、癌を検出するために、高メチル化密度を使用するための受信者動作特性(ROC)曲線を示す。
【
図25A】本発明の実施形態による、2人の患者の全体的なメチル化およびCNAの術前および術後のCircosプロットを示す。
【
図25B】本発明の実施形態による、2人の患者の全体的なメチル化およびCNAの術前および術後のCircosプロットを示す。
【
図25C】本発明の実施形態による、2人の患者の全体的なメチル化およびCNAの術前および術後のCircosプロットを示す。
【
図25D】本発明の実施形態による、2人の患者の全体的なメチル化およびCNAの術前および術後のCircosプロットを示す。
【
図26】本発明の実施形態による、非侵襲的(Ta)の低悪性度乳頭状尿路上皮腫瘍(PUNLMP)を有する膀胱癌患者におけるメチル化およびコピー数異常を示すCircosプロットである。
【
図27A】本発明の実施形態による、同一排泄尿から得られた膀胱癌患者(T23)のcf尿(
図27A)および尿沈渣(
図27B)についてのCircosプロットを示す。
【
図27B】本発明の実施形態による、同一排泄尿から得られた膀胱癌患者(T23)のcf尿(
図27A)および尿沈渣(
図27B)についてのCircosプロットを示す。
【
図29A】本発明の実施形態による、T22およびT23の膀胱癌2症例のCNAまたは低メチル化の証拠を示しているゲノム全体の1MBビンの割合を示す。
【
図29B】本発明の実施形態による、T22およびT23の膀胱癌2症例のCNAまたは低メチル化の証拠を示しているゲノム全体の1MBビンの割合を示す。
【
図30】本発明の実施形態による、対象における血液サンプルおよび尿サンプルを分析することによって、対象における膀胱癌を同定する方法を示すフローチャートである。
【
図31A】本発明の実施形態による、低メチル化を有する1mbビンの割合、コピー数異常を有する1mbビンの割合、ならびに46人の膀胱癌患者および39人の対照のメチル化デコンボリューションからの膀胱腫瘍寄与についての箱ひげ図を示す。
【
図31B】本発明の実施形態による、低メチル化を有する1mbビンの割合、コピー数異常を有する1mbビンの割合、ならびに46人の膀胱癌患者および39人の対照のメチル化デコンボリューションからの膀胱腫瘍寄与についての箱ひげ図を示す。
【
図31C】本発明の実施形態による、低メチル化を有する1mbビンの割合、コピー数異常を有する1mbビンの割合、ならびに46人の膀胱癌患者および39人の対照のメチル化デコンボリューションからの膀胱腫瘍寄与についての箱ひげ図を示す。
【
図31D】本発明の実施形態による、低メチル化、CNA、および膀胱腫瘍寄与についての受信者動作特性(ROC)曲線を示す。
【
図31E】本発明の実施形態による、低メチル化、CNA、および膀胱腫瘍寄与についての受信者動作特性(ROC)曲線を示す。
【
図31F】本発明の実施形態による、低メチル化、CNA、および膀胱腫瘍寄与についての受信者動作特性(ROC)曲線を示す。
【
図32A】本発明の実施形態による、低メチル化を有する1mbビンの割合、コピー数異常を有する1mbビンの割合、ならびに非侵襲性(Ta)低悪性度疾患を有する17人の膀胱癌患者および39人の対照のメチル化デコンボリューションからの膀胱腫瘍寄与についての箱ひげ図を示す。
【
図32B】本発明の実施形態による、低メチル化を有する1mbビンの割合、コピー数異常を有する1mbビンの割合、ならびに非侵襲性(Ta)低悪性度疾患を有する17人の膀胱癌患者および39人の対照のメチル化デコンボリューションからの膀胱腫瘍寄与についての箱ひげ図を示す。
【
図32C】本発明の実施形態による、低メチル化を有する1mbビンの割合、コピー数異常を有する1mbビンの割合、ならびに非侵襲性(Ta)低悪性度疾患を有する17人の膀胱癌患者および39人の対照のメチル化デコンボリューションからの膀胱腫瘍寄与についての箱ひげ図を示す。
【
図32D】本発明の実施形態による、低メチル化、CNA、および膀胱腫瘍寄与の受信者動作特性(ROC)曲線を示す。
【
図32E】本発明の実施形態による、低メチル化、CNA、および膀胱腫瘍寄与の受信者動作特性(ROC)曲線を示す。
【
図32F】本発明の実施形態による、低メチル化、CNA、および膀胱腫瘍寄与の受信者動作特性(ROC)曲線を示す。
【
図33】本発明の実施形態による、生体の尿サンプルを分析する方法を示す。
【
図34A】本発明の実施形態による、49人の膀胱癌症例および39人の対照において1つのミスマッチを有するリード割合の箱ひげ図である。
【
図35】本発明の実施形態による、生物の生体サンプルを分析する方法を示す。
【
図36】本発明の実施形態による、3人の膀胱癌症例および5人の対照についての異なる微生物種の相対存在量を表示するヒートマップである。
【
図37】本発明の実施形態による、ヒトの尿サンプルを分析する方法を示す。
【
図38】本発明の一実施形態によるシステム3800を示す。
【
図39】本発明の実施形態による、システムおよび方法と共に使用可能な、例となるコンピュータシステムのブロック図を示す。
【0013】
用語
「生物学的サンプル」は、対象(例えば、妊婦、癌に罹患している人もしくは癌に罹患していると疑われる人、臓器移植レシピエント、または臓器(例えば、心筋梗塞における心臓、卒中における脳、または貧血における造血系など)が関与する疾患プロセスを有すると疑われる対象)から得られ、目的の1つ以上の核酸分子(複数可)を含有する任意のサンプルを指す。生物学的サンプルは、血液、血漿、血清、尿、膣液、水腫(例えば精巣の)からの液、膣洗浄流体、胸水、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、乳首からの吸引液、体の異なる部分からの吸引液などの体液であり得る。便サンプルも使用することができる。種々の実施形態では、無細胞DNAのために濃縮された生物学的サンプル(例えば、遠心分離プロトコルを介して得られた血漿サンプル)におけるDNAの大部分は無細胞であり得、例えば、50%超、60%超、70%超、80%超、90%超、95%超、または99%超のDNAは無細胞であり得る。遠心分離プロトコルは、例えば、3,000g×10分で流体部分を得ることと、残留細胞を除去するために30,000gでさらに10分間再遠心分離することを含み得る。
【0014】
本明細書で使用される場合、用語「遺伝子座(locus)」またはその複数形「遺伝子座(loci)」は、ゲノム全体において変動を有するヌクレオチド(または塩基対)の任意の長さの位置またはアドレスである。「シークエンスリード」は、核酸分子の任意の部分または全部から配列決定されたヌクレオチドの鎖を指す。例えば、シークエンスリードは、核酸断片から配列決定された短鎖ヌクレオチド(例えば、約20~150個)、核酸断片の片端もしくは両端の短鎖ヌクレオチド、または生物学的サンプルに存在する核酸断片全体の配列決定であり得る。シークエンスリードは、例えば、シークエンシング技術を用いた、またはプローブを用いた種々の方法で、例えば、ハイブリッド形成アレイもしくは捕捉プローブで、または単一プライマーもしくは等温増幅を用いた、ポリメラーゼ連鎖反応(PCR)もしくは線形増幅などの増幅技術で、得ることができる。
【0015】
用語「サイズプロファイル」は、一般に、生物学的サンプル中のDNA断片のサイズを指す。サイズプロファイルは、様々なサイズの量のDNA断片の分布を提供するヒストグラムであってもよい。様々な統計パラメータ(サイズパラメータまたは単にパラメータとも呼ばれる)を使用して、あるサイズプロファイルを別のサイズプロファイルと区別することができる。1つのパラメータは、全てのDNA断片に対する、または他のサイズもしくは範囲のDNA断片に対する、特定のサイズもしくはサイズ範囲のDNA断片の割合である。
【0016】
本明細書で使用される場合、用語「分類」は、サンプルの特定の特性と関係した任意の数(複数可)または他の特徴(複数可)を指す。例えば、「+」記号(または「陽性」という語)は、サンプルが欠失または増幅を有するものとして分類されることを意味し得る。分類は、二元性(例えば、陽性または陰性)であり得、またはより多レベルの分類(例えば、1~10または0~1の尺度)を有し得る。
【0017】
用語「カットオフ」および「閾値」は、ある操作において使用される所定の数を指す。例えば、カットオフサイズは、それを超えると断片が除外されるサイズを指すことができる。閾値は、特定の分類が当てはまるものを上回るまたは下回る値であってよい。これらの用語のいずれかは、これらの文脈のいずれかで使用することができる。
【0018】
哺乳類ゲノムにおける「DNAメチル化」は、典型的には、CpGジヌクレオチドにおけるシトシン残基の5’炭素へのメチル基の付加(すなわち、5-メチルシトシン)を指す。DNAメチル化は、他の文脈、例えばCHGおよびCHH、においてはシトシンにおいて生じ得、式中、Hはアデニン、シトシンまたはチミンである。シトシンのメチル化は、5-ヒドロキシメチルシトシンの形態でもあり得る。N6-メチルアデニンなどの非シトシンのメチル化も報告されている。
【0019】
「部位」は、単一の塩基位置または相関する塩基位置の群、例えば、CpG部位であり得る単一の部位に対応する。「遺伝子座」は、複数の部位を含む領域に対応し得る。遺伝子座は、遺伝子座をその脈絡における部位と等価にするであろうただ1つの部位を含むことができる。
【0020】
「メチローム」は、ゲノムにおける複数の部位または遺伝子座のDNAメチル化の量の尺度を提供する。メチロームは、ゲノムの全部、ゲノムの実質的な部分、またはゲノムの比較的わずかな部分(複数可)に対応し得る。「腫瘍メチローム」は、生物(例えば、ヒト)の腫瘍のメチロームに対応する。腫瘍メチロームは、母体血漿中の腫瘍組織または無細胞腫瘍DNAを用いて決定することができる。目的の組織特異的メチロームの他の例は、臓器のメチローム(例えば、脳細胞、骨、肺、心臓、筋肉、および腎臓などのメチローム)であり、それはDNAを体液(例えば、血漿、血清、汗、唾液、尿、生殖分泌物、精液、便液、下痢液、脳脊髄液、消化管分泌物、腹水、胸水、眼内液、水腫(例えば精巣の)からの液、嚢胞液、膵臓分泌物、腸分泌物、痰、涙、乳房および甲状腺からの吸引液など)に寄与することができる。臓器は移植臓器であってもよい。
【0021】
「組織」は、同じタイプの細胞の群に対応する。異なるタイプの組織は、異なるタイプの細胞(例えば、肝細胞、肺胞細胞または血球細胞)からなり得るが、異なる生物(母親対胎児)由来の組織または健常細胞対腫瘍細胞にも対応し得る。「参照組織」は、組織特異的メチル化レベルを決定するために使用される組織に対応する。異なる個体由来の同じ組織型の複数のサンプルを使用して、その組織型の組織特異的メチル化レベルを決定することができる。
【0022】
各ゲノム部位(例えば、CpG部位)についての「メチル化指数」は、部位におけるメチル化を、その部位を網羅するリード総数と比較して示す、シークエンスリードの比率を指す。ある領域の「メチル化密度」は、その領域における部位を網羅するリード総数で分割されたメチル化を示す、領域内の部位のリード数である。この部位は、特定の特徴を有し得、例えば、CpG部位であり得る。したがって、ある領域の「CpGメチル化密度」は、その領域におけるCpG部位(例えば、特定のCpG部位、CpGアイランド内のCpG部位、またはそれより大きな領域)を網羅するリード総数で分割されたCpGメチル化を示すリード数である。例えば、ヒトゲノム中の各100kbビンのメチル化密度は、100kb領域へマッピングされたシークエンスリードによって覆われたCpG部位全部の比率として、CpG部位の(メチル化されたシトシンに対応する)バイサルファイト処理後に覆われていないシトシンの総数から決定することができる。この分析は、50kbまたは1Mbなどの他のビンサイズでも実施できる。領域は、全ゲノムまたは染色体または染色体の一部(例えば、染色体腕)であり得る。CpG部位のメチル化指数は、領域がそのCpG部位のみを含む場合、その領域のメチル化密度と同じである。「メチル化シトシンの比率」は、その領域における解析されたシトシン残基の総数、すなわちCpGの脈絡外のシトシンなどについて、メチル化されている(例えば、二亜硫酸塩変換後に覆われていない)ことが示されているシトシン部位「C」の数を指す。メチル化指数、メチル化密度、およびメチル化シトシンの比率は、「メチル化レベル」の例である。
【0023】
用語「疾患のレベル」または「病態のレベル」は、疾患(例えば、癌)が存在するかどうか、疾患が癌である場合、疾患のステージ、腫瘍のサイズ、転移があるかどうか、身体の総腫瘍量、および/または疾患の重症度の他の尺度を指すことができる。疾患のレベルは、記号、アルファベット、および色などの数または他のしるしであり得る。レベルは、ゼロであり得る。癌のレベルはまた、変異または変異の数に関連付けられる前悪性または前癌性の病態(状態)を含む。疾患のレベルは、種々の方法で使用することができる。例えば、スクリーニングは、疾患を有することが今まで分かっていない人において、疾患が存在するかどうかを確認することができる。評価は、疾患と診断された人を調べて疾患の進行を経時的にモニターし、療法の有効性を研究し、または予後を判断することができる。一実施形態では、予後は、患者が疾患で死亡する可能性、または特定の持続時間または特定の時間の後に疾患が進行する可能性として表すことができる。検出は、「スクリーニング」を意味することができ、または疾患の示唆的な特徴(例えば、症状または他の陽性試験)を有する人が疾患を有するかどうかを確認することを意味することができる。
【0024】
ゲノム遺伝子座(マーカー)についての「型」は、組織型全体の遺伝子座について特定の属性に対応する。所与の型の遺伝子座は、組織型全体にわたるメチル化レベルに特定の統計的変動を有することができる。ゲノム遺伝子座(マーカー)についての「カテゴリー」は、同じ組織型についての異なる個体にわたる遺伝子座についてのメチル化レベルの特定の変動に対応する。1セットのゲノム遺伝子座(マーカー)は、様々な型および/またはカテゴリーの任意の数の遺伝子座から構成することができる。したがって、遺伝子座のセットは特定の測定のために選択された遺伝子座に対応し、そのセットにおける遺伝子座の任意の特定の特性を暗示するものではない。本明細書は主にI型遺伝子座およびII型遺伝子座に関する。ゲノム部位のセットは、特定の組織型についての特定のメチル化シグネチャを有さなくてもよく、例えば、特定の組織型において唯一または優勢にメチル化されなくてもよい。このようなセットはII型部位と呼ばれる。これらのゲノム部位は、特定の徴候を有するゲノム部位と組み合わせて使用することができ、I型部位と呼ばれる。
【0025】
「臓器関連サンプル」は、例えば、尿、唾液、胸水、血液、および便サンプル中に生じ得るような、特定の臓器によって生成され(例えば、腎臓によって生成された尿)、または特定の臓器を通過する(例えば、膀胱を通過する尿)サンプルを指すことができる。サンプルは無細胞DNAを含み、無細胞DNAと細胞DNAの混合物であり得る。
【0026】
尿路上皮(または尿上皮)は、「移行上皮」の一例である。腎盂、尿管、膀胱、尿道の一部など、尿路の大部分を覆う上皮型である。
【発明を実施するための形態】
【0027】
尿無細胞(cf)DNA、ならびに他の臓器関連サンプルは、便サンプルのように、液体生検の完全に非侵襲的な形態、または他の非侵襲的な生検として大きな可能性を持つ。原発組織によるcfDNAの組成の知見は、その臨床用途を導くのに有用である。しかしながら、そのようなサンプルの組成は非常に変わりやすく、それによって生検として使用するための広い適用性を制限する。例えば、任意の特定の臓器からの経腎臓DNAの量は、サンプルごとに大きく異なり、それによって腎臓からの無細胞DNAの割合も同様に変動させる。
【0028】
CpG部位のメチル化はエピジェネティック調節およびメチル化シグネチャの重要な形態であり、異なる組織(19、20)および細胞型(21)について同定することができる。異なる組織からの血漿cfDNAの寄与比率は、全ゲノムバイサルファイトシークエンシングおよびシークエンシングデータのデコンボリューション解析を用いて、確認できることを近年実証した(22)。
【0029】
本開示は、異なる組織からの尿中cfDNAの寄与比率を推定するために、メチル化デコンボリューションを使用することによって尿中cfDNAの組成を分析し、それは組織特異的メチル化パターン(参照パターンとも呼ばれる)を使用する。そのような分析は、罹患組織型、例えば癌性尿路上皮細胞のメチル化パターンの使用を含み得る。そのようなデコンボリューションを使用した技術は、関連する疾患のレベルを決定することができる。結果は、メチル化デコンボリューションを使用した膀胱癌患者からの尿中cfDNAの分析が、膀胱腫瘍に由来するcfDNA割合の増加を同定することを示す。
【0030】
断片サイズ、腫瘍関連コピー数、およびメチル化レベルの他の変化もまた分析される。例えば、排泄尿のサイズプロファイルを使用して、対象が膀胱癌を有するかどうかを同定する。さらに、腎盂からの尿のサイズプロファイルは、腎臓が炎症を起こしているかどうかを同定するために使用される。
【0031】
さらに、例えば、その全体が参照として組み込まれる米国特許第8,741,811号に記載されているように、コピー数異常は血液を使用して癌を検出するために使用することができる。しかしながら、血液は多くの臓器由来の組織を含み、それによって多くの臓器に関連しているので、どの臓器に腫瘍があるのかが分からない場合がある。尿、またはより少ない臓器由来の組織を通常は有する他のサンプルを分析できるが、コピー数異常を有する経腎臓DNAは依然として様々な臓器由来であり得る。したがって、腫瘍を有する特定の臓器を同定することは困難であり得る。これに対処する1つの方法は、臓器関連サンプル(例えば、唾液、胸水、尿、または便サンプル)および血液サンプルからの無細胞DNAのコピー数分析が癌のレベルの別個の判定を得る、本明細書に記載の技術と関連する。血液サンプルが癌を示さず、排尿サンプルが示すのであれば、癌は、排尿サンプルに関連する臓器に由来するもの、例えば尿に対する膀胱癌と同定することができる。
【0032】
I.病変組織参照パターンを用いたデコンボリューション
サンプル(例えば、血液および尿)は複数の組織型を含むことができ、各サンプルは無細胞DNAの異なる割合に寄与する。異なるタイプの組織のDNAは典型的には異なるメチル化パターンを有するので、特定のサンプルにおいて測定されたメチル化レベルを使用して、サンプル中の複数の組織型それぞれの寄与度を決定することができる。例えば、その全体が参照により本明細書に組み込まれる、米国特許出願公開第2016/0017419号に記載されているように、デコンボリューションのプロセスは、組織特異的メチル化パターンを使用して寄与度を決定することができる。
【0033】
寄与度の変化を使用して異常を検出することができる。しかしながら、特定のサンプルが、例えば尿中の寄与度において高い変動性を有する場合、問題が起こり得る。いくつかの実施形態は、臓器の健康な組織から決定されるメチル化パターンを使用するのとは対照的に、病変組織と特異的に対応する組織特異的メチル化パターンを使用することによってこの問題に対処することができる。最初に、サンプルとしての尿に関する問題、およびデコンボリューションに関する詳細について説明する。
【0034】
A.サンプルとしての尿
造血細胞は、一貫して、比較的安定した濃度で存在する血漿cfDNAに対する優勢な寄与体であるが(22、27)、尿中cfDNAの量と組成は非常に変動しやすい。例えば、cfDNAに対する腎臓の寄与は、臨床的に安定している腎移植患者において、4.2~94%、または104~3,970GE/ml尿の範囲で変動し得る。この組成変動の度合によって、尿中の総cfDNA濃度の変動(移植患者からの225~25,710GE/ml尿)が悪化し、単一の供給源からのcfDNAを高感度検出することのみを目的とするアッセイが、なぜ検出できないレベルのサンプルに遭遇することがあるのか、を説明し得る。これは、恒常性平衡に維持されている血漿の内容物間の違いを際立たせるが、排泄尿の内容物は、泌尿器系を一回一方向に通過した後の恒常性要件の排出性副産物である。様々な水和状態は総cfDNA濃度に影響を及ぼし得ると考えられるが、希釈効果は各組織からの寄与比率の変動を説明することができない。
【0035】
尿中cfDNAの調査は、尿中cfDNA断片の大部分が短く(<100bp)、主要な分泌性DNA加水分解酵素であるDNaseIが、腎臓および膀胱で高発現され(http://www.proteinatlas.org/)、尿中に存在し(Ito et al.1984)、高活性(Nadano et al.1993)である、という事実によってさらに複雑になる。各組織供給源からの検出可能なcfDNA量の変動は、由来組織による尿中cfDNAの組成、および尿路を下るにつれcfDNAが受け得る変化も深く理解することを必要とする。
【0036】
したがって、尿中のcfDNAの組成を決定する際の課題は、尿中cfDNAは、血漿中のそれ(尿中では約50塩基および血漿中では150塩基)よりも短いという事実にあり、それが尿路を通過するように尿DNAは絶えず分解されている。さらに、尿からの無細胞DNAの抽出は、DNaseIの存在により血漿からの抽出よりも困難である。したがって、メチル化デコンボリューションがそのようなかなり短い断片に有効であることは明らかではない。
【0037】
血球、腎臓、および尿路上皮は、尿中へのcfDNAの腎前性、腎性、および腎後性放出について、それぞれ主要原因として関与しているという仮説を立てた。血漿中cfDNAの80%前後は造血細胞(27)に由来し、相当量の血漿cfDNAを尿中に腎臓を介して濾過することができる場合、これらのDNA断片は、造血細胞の特徴を持つ可能性が高い。しかしながら、様々な組織からの経腎臓DNAの組成は尿中で変動する。
【0038】
全ゲノムバイサルファイトシークエンシングを用いて尿中cfDNA組成について全体的な調査を行った。DNA断片をワトソン鎖とクリック鎖にマッピングした。サンプルあたり1レーンを使用して、ゲノム全体のCpG部位において平均シークエンシング深度2.42で、中央値8000万の一意的にマッピング可能な非重複リードを得た。組織特異的メチル化シグネチャおよびメチル化デコンボリューションを使用して、各組織からの寄与比率を推定した。
【0039】
尿中の無細胞DNAおよび細胞DNAの寄与比率を決定することが可能であることを実証している。メチル化デコンボリューションから導き出された寄与比率は、造血幹細胞および腎移植レシピエントの尿中の同種移植片由来ドナー特異的遺伝的マーカーを用いて計算されたものと高度に相関している。異なる組織からの寄与比率に大きな変動を見出した。腎盂から得られた尿からのcfDNAは、排泄尿と比較してより高い割合の長い断片を有する。インビボ分解を模倣するための37°Cでの尿中cfDNAのインビトロ培養は、尿中cfDNAの絶対濃度が3.5~4.9時間の半減期で減少することを明らかにした。インビボ分解にもかかわらず、腎移植患者および骨髄移植患者の排泄尿を用いた検証は、メチル化デコンボリューションとドナー特異的SNPとの間の寄与比率において高い相関を示した。
【0040】
無細胞尿および尿沈渣からのDNAメチル化は、尿路を構成する組織を含む異なる正常組織および病理学的組織からの参照メチロームと比較される。膀胱癌患者からの尿中cfDNAのメチル化デコンボリューションは、癌からの寄与比率の増加を同定した。そのような尿中cfDNAはまた、サイズプロファイル、コピー数、ならびに全体的な低メチル化および/または高メチル化において異常を示した。
【0041】
尿中cfDNAのこの全体的な調査によって、組成、分解、および尿路におけるcfDNAの変動に関する理解が深まり、分子診断ツールとしての全ゲノム尿中cfDNAシークエンシングの使用のための基礎を築いた。
【0042】
B.メチル化デコンボリューション
メチル化デコンボリューションの原理は、生物からのDNA混合物の組成を決定するための単一のメチル化ゲノム部位(メチル化マーカー)を用いて説明することができる。生物は、哺乳動物またはヒトを含む動物であり得る。組織Aがゲノム部位に対して完全にメチル化されている、すなわち100%のメチル化密度(MD)であり、組織Bが完全にメチル化されていない、すなわち0%のMDであると仮定する。この例では、メチル化密度は、CpGジヌクレオチドが目的の領域でメチル化されているという状況で、シトシン残基の割合を指す。
【0043】
DNA混合物Cが組織Aおよび組織Bで構成され、DNA混合物Cの全体的なメチル化密度が60%である場合、以下の式に従ってDNA混合物Cに対する組織Aおよび組織Bの寄与比率を推定することができる。
MDC=MDA×a+MDB×b、
式中、MDA、MDB、MDCはそれぞれ組織A、組織BおよびDNA混合物CのMDを表し、aおよびbは、DNA混合物Cに対する組織AおよびBの寄与比率である。この特定の例では、組織AおよびBがDNA混合物の唯一の2つの構成要素であると仮定されている。したがって、a+b=100%である。したがって、組織Aおよび組織BはそれぞれDNA混合物に60%および40%寄与すると計算される。
【0044】
組織Aおよび組織Bにおけるメチル化の密度は、生物のサンプルから、または同一タイプ(潜在的な同一亜集団、例えば、他のヒト)の他の生物由来のサンプルから得ることができる。他の生物由来のサンプルを使用する場合、組織Aのサンプルのメチル化密度の統計分析(例えば平均、中央値、幾何平均)を使用してメチル化密度MDAを得ることができ、MDBについても同様である。
【0045】
ゲノム部位は、最小の個体間変動、例えば、変動の特定の絶対量未満を有するように、または試験したゲノム部位の最も低い部分内にあるように選択することができる。例えば、最も低い部分については、実施形態は、試験したゲノム部位群の中で最も低い10%の変動を有するゲノム部位のみを選択することができる。他の生物は、健康な人、特定の生理的状態を有する人(妊娠中の女性、年齢の違う人、特定の性別の人など)から得ることができ、現在試験中の生物を含む特定の亜集団に対応し得る。
【0046】
亜集団の他の生物はまた、他の病態(例えば、肝炎や糖尿病患者など)を有してもよい。そのような亜集団は、様々な組織について組織特異的メチル化パターンを変えた可能性がある。そのような病状下の組織のメチル化パターンは、正常組織のメチル化パターンを使用することに加えて、デコンボリューション分析に使用することができる。このデコンボリューション分析は、そのような亜集団からの生物をそれらの条件で試験する場合に、より正確であり得る。例えば、硬変性肝臓または線維性腎臓は、それぞれ正常な肝臓および正常な腎臓と比較して異なるメチル化パターンを有し得る。したがって、肝硬変の患者が他の疾患についてスクリーニングされた場合、血漿DNAにDNAを寄与する候補の1つとして、他の組織型の健康な組織と共に硬変性肝臓を含めることがより正確であり得る。
【0047】
より多くのゲノム部位(例えば、10以上)を使用して、より潜在的な候補組織がある場合に、DNA混合物の構成を決定することができる。DNA混合物の組成比率の推定の正確さは、ゲノム部位の数、特定の組織に対するゲノム部位(「部位」とも呼ばれる)の特異性、および参照組織特異的レベルを決定するために使用される、異なる候補組織にわたる部位および異なる個体にわたる部位の多様性を含む多くの要因に依存する。組織に対する部位の特異性は、特定の組織型と他の組織型との間のゲノム部位のメチル化密度の差を指す。
【0048】
それらのメチル化密度間で差が大きくなるほど、特定の組織への特定の部位はより多くなる。例えば、ある部位が肝臓内で完全にメチル化され(メチル化密度=100%)、他の全ての組織内で完全に非メチル化される(メチル化密度=0%)場合、この部位は肝臓に対して非常に特異的である。一方、異なる組織にわたる部位の変動性は、例えば、異なるタイプの組織における部位のメチル化密度の範囲または標準偏差に反映され得るが、これらに限定されるものではない。より広い範囲またはより高い標準偏差は、数学的に、DNA混合物に対する異なる臓器の相対寄与をより正確かつ精密に判定することを可能にする。DNA混合物に対する候補組織の寄与比率を推定する精度に関するこれらの要因の影響は、本出願の後節で説明される。
【0049】
ここでは、数学の方程式を使用してDNA混合物への異なる臓器の寄与比率の演繹を説明する。DNA混合物中の異なる部位のメチル化密度と、異なる組織中の対応する部位のメチル化密度との間の数学的関係を以下のように表すことができる。
【数1】
式中、
【数2】
は、DNA混合物中の部位iのメチル化密度を表し,p
kは、DNA混合物に対する組織kの寄与比率を表し、MD
ikは、組織k内の部位iのメチル化密度を表す。部位の数が臓器の数と同じかそれより多い場合、個々のp
k値を決定することができる。組織特異的メチル化密度は他の個体から得ることができ、部位は上述のように最小の個体間変動を有するように選択することができる。
【0050】
追加の基準は、精度を向上させるためのアルゴリズムに含めることができる。例えば、全ての組織の集合した寄与は100%になるように制限され得る。すなわち、
Σ
kp
k=100%
さらに、全ての臓器の寄与は非負である必要があり得る。
【数3】
【0051】
生物学的変化により、観察された全体的なメチル化パターンは、組織のメチル化から推定されるメチル化パターンと完全に同一でなくてもよい。そのような状況では、個々の組織の最も可能性の高い寄与比率を決定するために数学的分析が必要とされる。これに関して、DNAにおいて観察されたメチル化パターンと組織から推定されたメチル化パターンとの間の差は、Wで示される。
【数4】
式中、OはDNA混合物について観察されたメチル化パターンであり、M
kは個々の組織kのメチル化パターンであり、p
kはDNA混合物に対する組織kの寄与比率である。各p
kの最もありそうな値は、観察されたメチル化パターンと推定されたメチル化パターンとの間の差であるWを最小化することによって決定することができる。この方程式は、数学的アルゴリズムを用いて、例えば、二次計画法、線形/非線形回帰、期待値最大化(EM)アルゴリズム、最尤推定アルゴリズム、最大事後確率推定、および最小二乗法を用いて解くことができるが、これらに限定されるものではない。
【0052】
C.尿中cfDNA組織マッピングのためのメチル化可変領域の同定
公に利用可能なメチロームおよびに異なる組織から得られた正常サンプルおよび病理学的サンプルの全ゲノムのバイサルファイトシークエンシングに基づいて、参照メチロームを組み立てることができる。サンプル組織は、腎皮質、腎髄質、尿管、膀胱尿路上皮、膀胱筋、前立腺(内腔、中枢、および末梢)、ならびに精嚢を含むがこれらに限定されない組織に由来し得る。サンプルの組織および細胞組成は手術中に得られ、肉眼的解剖によって確認され得る。
【0053】
これらの組織を区別できるメチル化シグネチャを同定するために、血球(好中球、T細胞、およびB細胞)、腎臓、ならびに尿路上皮のメチロームを特徴付けることを目的とした。血液細胞に関する公的に入手可能な全ゲノムバイサルファイトシークエンシングデータ(Human Epigenome Atlas、www.genboree.org/epigenomeatlas/index.rhtml、(28))を利用して、腎移植または泌尿器科手術を受けた患者からの腎臓または尿路上皮組織を得て、35~40倍のカバレッジで全ゲノムバイサルファイトシークエンシングを実行した。
【0054】
多数のCpG部位にわたって類似のメチル化密度を有する組織を一緒にグループ化することができ、有益なメチル化可変領域(DMR)を同定することができる。腎臓、尿路上皮、好中球、B細胞、およびT細胞を用いて、19418個のDMRがメチル化マーカーとしての使用のために同定された。これは、1つの組織においてDMRにおけるメチル化密度が他の4つの組織と比較して有意に異なる(Zスコア>3)3549のI型マーカー、およびメチル化密度が異なる組織にわたって変動を示す15,869のII型マーカーを含む。
【0055】
図1は、好中球、B細胞、T細胞、腎臓および尿路上皮における19,418個のメチル化可変領域(DMR)でのメチル化密度を示すヒートマップである。各垂直線はDMRを表し、高メチル化密度から低メチル化密度は赤(例えば区画102)から黄色(例えば区画104)で表される。階層的クラスタリングは、血球中のこれらのDMRにおけるメチル化パターンが腎臓および尿路上皮のそれらとは大きく異なることを示す。
【0056】
前述のようにメチル化デコンボリューションアルゴリズムを使用して、尿中cfDNAをバイサルファイト処理後に配列決定し、DMRのcfDNA断片中で観察されたメチル化パターンを、5つの参照組織におけるメチル化シグネチャと比較した。(22)。次に、好中球、B細胞、T細胞、腎臓、および尿路上皮の寄与比率を推測した。
図1は、血球、腎臓、および尿路上皮が正常な尿中cfDNAの組成中にあることを示す。
【0057】
41×2ペアエンドバイサルファイトシークエンシングを使用して、一意的にマッピング可能なリード29.9Mの中央値に、合計46膀胱癌症例および39の対照を配列決定した。膀胱癌症例は、非侵襲性超低悪性度(Ta PUNLMP)からT4高悪性度の疾患まで多岐にわたった。全ての対照はuristixに血液または肉眼的血尿のいずれかを有していた。8人の対照は日常的な臨床ケアの一環として、uristixに持続する血液または肉眼的血尿に対して柔軟な膀胱鏡検査を受け、悪性腫瘍について陰性であることが確認された。15人の対照を使用して、ベースラインレベルのメチル化およびコピー数を確立した。残りの24人の対照を試験群で使用した。
【0058】
図2は、膀胱腫瘍、B細胞、尿路上皮、腎臓、好中球、およびT細胞における27,371個のメチル化可変領域(DMR)のメチル化密度を示すヒートマップである。各垂直線は、メチル化密度に基づくDMRカラーコードを表す。
図2のDMRは、
図1のDMRとはわずかに異なる。垂直線はメチル化レベルによって順序付けられている。常染色体のDMRのみが含まれる。低メチル化は赤色に着色され(例えばセクション202)、高メチル化は黄色に着色されている(例えばセクション204)。これらのDMRはメチル化デコンボリューションに使用され、各尿サンプル中の膀胱腫瘍に起因する尿中cfDNAの比率を同定する。膀胱腫瘍組織を一倍体ゲノムの8.5倍カバレッジに配列決定して、メチル化デコンボリューションのためのDMRを同定した。
図2は、膀胱腫瘍DNAが検出され得ることを示す。異常なメチロームを有する任意の組織は、他の生理学的病態または病理学的病態において検出され得る。
【0059】
手術前後の尿サンプルによって証明されるように、全ゲノムバイサルファイトシークエンシングを使用して膀胱癌患者を長期的にモニターすることができる。
【0060】
D.造血幹細胞および腎移植患者におけるメチル化デコンボリューションならびにドナー特異的遺伝子型を用いた検証
腎移植患者およびHSCT患者からのそれぞれ26および5尿サンプルについて、全ゲノムバイサルファイトシークエンシングを行った。ゲノム全体にわたる19,418個のDMRのメチル化密度により、腎臓、尿路上皮、B細胞、T細胞、および好中球に由来するDNAの割合を決定することができた。ドナー特異的SNPにより、各尿サンプル中の腎臓および血球由来のDNA断片の割合を同定することができ、メチル化デコンボリューションの精度をドナー特異的SNPにより決定されたゴールドスタンダードと比較した。メチル化デコンボリューションからの血球の寄与比率は、B細胞、T細胞、および好中球の合計であった。
【0061】
HSCTおよび腎移植患者のためのIllumina OMNI 2M SNPアレイを使用して、ドナーおよびレシピエントの生殖細胞系列遺伝子型情報を確認した。バイサルファイトシークエンシングのために31個の尿サンプルを採取した。各サンプルについて平均8000万の一意的にマッピングされたリードを得て、ドナーおよびレシピエント特異的SNPを有する断片の同定が、ドナー組織からのcfDNA断片の割合の正確な計算を可能にした。
【0062】
図3は、本発明の実施形態による、HSCT(三角)および腎移植(丸点)患者からの31個の尿サンプル中の血球および腎臓由来のcfDNAの寄与比率を示す。x軸はドナー特異的SNPから計算されたドナー臓器からの寄与度を示し、y軸はメチル化デコンボリューションによって推定されたものとしてのドナー臓器の寄与度を表示する。メチル化デコンボリューションによって決定されたドナー組織の寄与比率ならびにドナーおよびレシピエント特異的遺伝子型を使用して決定された比率は、高度に相関していた(R
2=0.97)。
【0063】
これらの結果は、メチル化デコンボリューションの能力を実証し、良好なダイナミックレンジにわたって尿中cfDNAに異なる組織の寄与比率を決定した。ドナー特異的SNPを用いて、尿中cfDNAに対するドナー造血細胞の寄与の割合は6~78%の範囲で変動し、ドナー腎臓の寄与の割合は1~94%の範囲で変動した。31個の移植尿サンプルについての全尿中cfDNAメチル化デコンボリューションの結果を表1に列挙する。
【表1】
【0064】
これらの結果は、血液細胞、腎臓、および尿路上皮の寄与が異なるサンプル間で非常に変動しやすいことを示した。いくつかのサンプルでは、異なる日に得られれた同じ個体からの尿サンプル中の特定の組織からの寄与比率に大きな変動があった(例えばT45およびT86)。これらの組織のそれぞれの寄与比率は0%程度に低くすることができ、血球、腎臓、および尿路上皮についてそれぞれ93%、100%、および64%まで上昇できる。31個の尿サンプルにわたって、血球、腎臓、および尿路上皮についてのメチル化デコンボリューションを使用して測定された寄与比率の中央値および四分位範囲は、それぞれ52%(0~84%)、32%(7~100%)、および5%(0~12%)であった。
【0065】
E.メチル化デコンボリューションを用いた癌の判定
このセクションでは、尿路上皮および膀胱腫瘍DNAのメチロームを用いて、尿中cfDNAのメチルデコンボリューションを説明する。デコンボリューションは、異なる組織からのDNAの絶対量のばらつきを説明することができる。しかし、上記のように、尿中の異なる組織の寄与には高い変動性がある。したがって、1つのソースからの寄与が低いまたは高い場合、それは必ずしも異常ではない。
【0066】
図4A~4Cは、正常尿路上皮細胞(
図4A)、単一の組織特異的メチル化パターンとしての尿路上皮細胞および膀胱癌細胞(
図4B)、および別々の組織特異的メチル化パターンとしての尿路上皮細胞および膀胱癌細胞(
図4C)を含む、異なる組織特異的メチル化パターン(参照パターンとも呼ばれる)を使用して定義された割合についての、膀胱癌症例および無癌対照に対するメチル化デコンボリューションのプロットを示す。メチル化デコンボリューションから導き出された寄与比率は、y軸上に表示される。
【0067】
1.参照としての正常尿路上皮の使用
膀胱癌の大部分は、尿路上皮細胞から生じる移行上皮癌である。しかしながら、膀胱腫瘍由来のDNAのメチル化は、正常な尿路上皮に類似しているか、または大きく異なりかつ明瞭なメチル化パターンを示し得る。膀胱腫瘍が細胞回転を増加させ、正常尿路上皮に似たcfDNA断片を放出する可能性があるという理由で、膀胱癌患者からの尿中cfDNAへの尿路上皮の寄与比率を、無癌対照と比較して調べた。
【0068】
図4Aは、組織特異的メチル化パターンが、メチル化デコンボリューションにおける腎臓、正常尿路上皮、B細胞、T細胞、および好中球を含む場合の正常尿路上皮の寄与度を示す。非癌症例および膀胱癌症例における正常尿路上皮の寄与度は変動し、大きく重複しており、2つの群間に有意差はない(マン・ホイットニーU検定p=0.15)。したがって、メチル化デコンボリューションは、膀胱癌患者と無腫瘍対照との間で尿路上皮の寄与に有意差がないことを見出した。これは、膀胱癌患者の尿中の正常尿路上皮に似たcfDNAの顕著な増加がないことを示唆している。
【0069】
2.正常と癌の間で共通のメチル化を持つ部位の使用
膀胱癌は、悪性の変化を受けた尿路上皮細胞から発生すると考えられているので、膀胱腫瘍のメチロームと正常尿路上皮との間の類似点と相違点を同定するために、膀胱腫瘍サンプルを8.5倍カバレッジに配列決定した。膀胱腫瘍と正常尿路上皮との間でメチル化密度が類似している(<10%の差)7201のDMRを同定した。その後、腎臓、B細胞、T細胞、および好中球と共に、尿路上皮に関するこの定義を用いてメチル化デコンボリューションを行った。
【0070】
図4Bは、本発明の実施形態による、組織特異的メチル化パターンが、膀胱癌において保存された、腎臓、B細胞、T細胞、好中球、および尿路上皮マーカーを含む場合の尿路上皮の寄与度を示す。正常尿路上皮および膀胱癌において保存されていたDMRによって定義される尿路上皮の寄与は、非癌(0~67%)および膀胱癌患者(13~86%)において非常に変動しやすい。正常尿路上皮および膀胱癌において保存されていたメチル化マーカーを用いて、対照と比較して膀胱癌対象からの尿路上皮の寄与が増加した(マン・ホイットニーU検定P=0.003)。対照と比較して、膀胱癌対象からの尿路上皮寄与の中央値は4.5倍増加した。対照の中央値は10.34であり、膀胱癌患者の中央値は48.9であった。
【0071】
3.別の参照としての腫瘍尿路上皮の使用
最後に、好中球、T細胞、B細胞、腎臓、および正常尿路上皮と共に、別個の参照パターンとして膀胱腫瘍メチロームを含んだ。したがって、正常および腫瘍尿路上皮は別々の組織として扱われる。腫瘍尿路上皮は生検腫瘍に基づいて決定された。腫瘍参照パターンは、1つまたは複数のそのような生検腫瘍に基づいて決定することができる。複数の生検を使用する場合、腫瘍参照パターンは、生検の全部または特定の割合(例えば、50%超)で発生するDMRに限定され得る。異なる腫瘍生検もまた、異なる参照パターンを有する別個の組織とみなすことができ、それによって腫瘍細胞の特定の群の分類が可能になる。6つの細胞/組織にわたってDMRを同定し、同定されたDMRをメチル化デコンボリューションにおいて使用した。
【0072】
図4Cは、本発明の実施形態による、組織特異的メチル化パターンが、腎臓、尿路上皮、B細胞、T細胞、好中球、および膀胱癌を含む場合の膀胱腫瘍細胞の寄与度を示す。本発明者らは、膀胱癌を有する症例では膀胱腫瘍寄与の中央値が14倍増加したが、非癌対照では膀胱腫瘍寄与が非常に低レベルであることを見出した。非癌症例は非常に低い膀胱腫瘍寄与(0~11%)を有するが、膀胱癌症例は最大84%の高い膀胱腫瘍寄与を有する。マン・ホイットニーU検定は、2つの群の間に有意差があることを示した(p=0.0002)。対照についての寄与の中央値は4.13であり、膀胱癌対象についての寄与の中央値は57.45である。
【0073】
したがって、約20のカットオフ値は、癌のレベルの正確な分類を提供する。20に近い他の値でも同様の感度と特異性が得られる。他の疾患または癌については、特定のカットオフ値は異なってもよい。
【0074】
正常な対照に対比した膀胱癌患者の尿中の膀胱腫瘍の寄与度の間の有意差は、膀胱腫瘍寄与を使用して非癌対照から膀胱癌患者を区別できることを示唆する。膀胱癌メチロームは1つの膀胱腫瘍からのDNAに基づいて決定されたので、これは異なる患者からの膀胱癌DNAにおいて共有されるメチル化パターンがあることを示唆する。
【0075】
根治的膀胱切除術を受ける筋肉侵襲性膀胱癌2症例について、小腸の一部を使用して、膀胱の代わりに導尿および貯蔵のための回腸導管または新生膀胱を形成した。小腸が尿と直接接触しているので、膀胱腫瘍寄与の減少および小腸寄与の増加を検出することができるかどうかを確かめるために、術前および術後の尿サンプルにおいて膀胱腫瘍および小腸でメチル化デコンボリューションを行った。両方の術後膀胱癌サンプルは、正常対照によって観察されたレベルに対して膀胱腫瘍寄与の著しい減少を示した(表2)。術後のサンプルでは、好中球ならびに小腸からの寄与も有意に増加した。
【表2】
【0076】
手術前後の結果を比較すると、膀胱腫瘍からの寄与が減少し、小腸および好中球からの寄与が上昇する。好中球の増加は手術直後に予想される。したがって、5人の膀胱癌患者からの術前サンプルにおいて、実施形態では、膀胱腫瘍細胞から尿中へのcfDNA寄与の有意な増加を検出するためにメチル化デコンボリューションを使用することができたが、癌症例と正常対照との間の正常尿路上皮寄与に有意差はなかった。これは、膀胱腫瘍メチロームが正常尿路上皮細胞のそれとは大きく異なること、および実施形態が単一の膀胱腫瘍参照メチロームを使用して異なる膀胱癌患者からの尿中cfDNAにおける腫瘍寄与の増大を同定できることを示唆する。今回の結果は、代表的な膀胱癌メチロームを参照として使用して、寄与の増加を検出できることを示す。
【0077】
疾患の検出およびモニタリングのための「液体生検」として使用される尿中cfDNAについて、尿中cfDNAの起源、およびそれが尿路内で受ける変化を理解することは有用である。ここでは、尿中cfDNAの全ゲノムバイサルファイトシークエンシングが、異なる組織に特徴的なメチル化シグネチャの認識を可能にし、すなわち組織型による尿中cfDNAの組成の全体的な調査を可能にすることを実証する。以前の研究は一般に単一供給源からの尿中cfDNAの同定に集中していたが、尿サンプル中のcfDNAの全体的な調査が各組織型の寄与比率を示し、異なる尿サンプル中の異なる組織寄与の同時比較を可能にする。cfDNAの由来を検出するためのメチル化シグネチャの使用は、遺伝的変異に基づく方法に関して利点を有し、それはドナー特異的対立遺伝子、または各患者に特有であり得る腫瘍特異的体細胞変異について予備知識を必要とする。
【0078】
F.病変組織を参照として用いて疾患を判定する方法
図5は、本発明の実施形態による、罹患組織型の組織特異的メチル化パターンを使用して生物の生物学的サンプルを分析する方法500を示すフローチャートである。生物学的サンプルは、第1の組織型を含む、複数の組織型由来の無細胞DNA分子の混合物を含む。方法500を使用して、特定の臓器における疾患のレベルを決定でき、例えば、その臓器の病変細胞に対応する組織特異的メチル化パターンがデコンボリューションに使用される。方法500は、コンピュータシステムを使用して実行することができる。
【0079】
ブロック510において、Nが整数である、N個のゲノム部位は分析のために同定される。N個のゲノム部位は、例えば、I型およびII型のゲノム部位を説明するセクションIIに詳細に記載されるように、種々の属性を有し得る。例として、N個のゲノム部位は、I型もしくはII型部位のみ、または両方の組み合わせを含むことができる。ゲノム部位は、1つ以上の他のサンプルの分析に基づいて、例えば、様々な個体において測定されたメチル化レベルについてのデータベースから得られたデータに基づいて、同定され得る。いくつかの実施形態では、少なくとも10個のN個のゲノム部位がII型である。N個のゲノム部位はまた、I型部位(例えば、少なくとも10個)を含み得る。
【0080】
ゲノム遺伝子座のこれらのメチル化特性は、1つのサンプルまたはサンプルのセットについて測定することができる。サンプルのセットは、試験される本生物を含む生物の亜集団、例えば本生物と共有される特定の形質を有する亜集団のためのものであり得る。これらの他のサンプルは参照組織と呼ぶことができ、異なる参照組織は異なるサンプルから使用することができる。
【0081】
ブロック520において、N個の組織特異的メチル化レベルは、M個の組織型のそれぞれに対するN個のゲノム部位で得られる。NはM以上であるので、デコンボリューションにおいて組織特異的メチル化レベルを使用して、分数百分率を決定することができる。組織特異的メチル化レベルは、N×M寸法のマトリックスAを形成することができる。マトリックスAの各列は、特定の組織型についてのメチル化パターンに対応することができ、パターンはN個のゲノム部位におけるメチル化レベルである。
【0082】
臓器の特定の疾患の検出のために、M個の組織型の1つは、第1の臓器の第1の疾患に対応する第1の罹患組織型に対応することができる。M個の組織型のうちの第2の組織型は、第1の臓器の健康な組織に対応し得る。様々な実施形態において、組織特異的メチル化パターンは、公開データベース(複数可)または以前の研究から検索することができる。これらの組織特異的メチル化パターンを使用して、デコンボリューション分析で使用されるN個のゲノム部位を同定することができる。
【0083】
ブロック530において、M個の組織型からの無細胞DNA分子の混合物を含む生物学的サンプルを受ける。生物学的サンプルは、様々な方法で患者の生物から得ることができる。そのようなサンプルを得る様式は、非侵襲的または侵襲的であり得る。非侵襲的に得られたサンプルの例は、ある種の体液(例えば、血漿または血清または尿)または便を含む。例えば、血漿および尿は、複数の臓器組織由来の無細胞DNA分子を含み、したがって1つのサンプルを介して複数の臓器を分析するのに有用である。
【0084】
いくつかの例では、生物学的サンプルは、細胞DNAを含んでもよい。例えば、尿サンプルでは、生物学的サンプルは尿沈渣由来の細胞DNAを含んでもよい。細胞DNAは一般に無細胞DNAよりも長く、超音波処理などの断片化プロセスを使用して、ショートリードシークエンシングのためのより短い断片を産生することができる。
【0085】
ブロック540において、生物学的サンプルからの無細胞DNA分子を分析して生物に対応する参照ゲノムにおけるそれらの位置を同定する。例えば、無細胞DNA分子を配列決定してシークエンスリードを得ることができ、シークエンスリードを参照ゲノムにマッピング(整列)させることができる。生物がヒトの場合、参照ゲノムは、潜在的には特定の亜集団からの参照ヒトゲノムである。別の例として、無細胞DNA分子は、(例えば、PCRまたは他の増幅後に)異なるプローブを用いて分析することができ、各プローブは異なるゲノム部位に対応する。いくつかの実施形態では、無細胞DNA分子の分析は、無細胞DNA分子に対応するシークエンスリードまたは他の実験データを受け取り、次いで実験データを分析することによって実施され得る。
【0086】
M個の組織型からの寄与度を決定するための正確なデコンボリューションを提供するように、無細胞DNA分子の統計的に有意な数を分析することができる。いくつかの実施形態において、少なくとも1,000個の無細胞DNA分子が分析される。他の実施形態では、少なくとも10,000または50,000または100,000または500,000または1,000,000または5,000,000以上の無細胞DNA分子を分析することができる。分析する分子の総数は、MおよびN、ならびに目的の精度(正確さ)に依存し得る。
【0087】
ブロック550において、N個の混合物メチル化レベルは、各参照ゲノムのN個のゲノム部位のいずれかに位置する無細胞DNA分子の第一の群(セット)を使用してN個のゲノム部位で測定される。N個の混合物メチル化レベルは、生物学的サンプルの混合物中のメチル化レベルを指す。例として、混合物からの無細胞DNA分子がN個のゲノム部位の1つに位置する場合、その部位におけるその分子のメチル化指数はその部位の全体的なメチル化密度に含まれ得る。N個の混合物メチル化レベルは、N個の長さのメチル化ベクトルbを形成することができ、bは観察された値に対応し、そこから組織型の寄与度が決定され得る。
【0088】
一実施形態では、DNA混合物中のゲノム部位についてのメチル化レベルは、全ゲノムバイサルファイトシークエンシングを用いて決定することができる。他の実施形態において、ゲノム部位のメチル化レベルは、Illumina HumanMethylation450システムなどのメチル化マイクロアレイ分析を用いて、またはメチル化免疫沈降を用いること(例えば、抗メチルシトシン抗体を用いること)もしくはメチル化結合タンパク質による処理に続いてマイクロアレイ分析もしくはDNAシークエンシングによって、またはメチル化感受性制限酵素処理に続いてマイクロアレイ分析もしくはDNAシークエンシングによって、またはメチル化認識シークエンシングを用いること、例えば、単一分子シークエンシング法を用いることによって(例えば、ナノポアシークエンシング(Schreiber et al.,Proc Natl Acad Sci2013;110:18910-18915)によって、またはPacific Biosciences単一分子リアルタイム分析(Flusberg et al.,Nat Methods2010;7:461-465)によって)、決定することができる。組織特異的メチル化レベルは、同じ方法で測定することができる。他の例として、標的化バイサルファイトシークエンシング、メチル化特異的PCR、非バイサルファイトベースのメチル化認識シークエンシング(例えば、単一分子シークエンシングプラットフォームによる(Powers et al.,Efficient and accurate whole genome assembly and methylome profiling of E.coli,BMC Genomics,2013;14:675)は、血漿DNAメチル化デコンボリューション分析のための血漿DNAのメチル化レベルの分析に使用することができる。したがって、メチル化認識シークエンシングの結果は、種々の方法で得ることができる。
【0089】
ブロック560において、混合物中の第1の罹患組織型の寄与度は、M個の組織型それぞれのN個の第1のメチル化レベルおよびN個の組織特異的メチル化レベルを使用して決定される。いくつかの実施形態では、組成ベクトルのM値を決定することができる。各M値は、DNA混合物に対するM個の組織型のうちの特定の組織型の寄与度に対応する。N×Mの組織特異的メチル化レベルを考えると、組成ベクトルのM値を解いてN個の混合物メチル化レベル(例えば、メチル化ベクトルb)を得ることができる。当業者によって理解されるように、M個の寄与度は、様々な方法(例えば、行列因数分解および/または行列反転、または最適化プロセスによる)で解くことができる、Ax=bを解くことによって決定されるベクトルxに対応し得る。NがMよりも大きいとき、解決策は、例えば最小二乗法を使用して、エラーの最小化を伴うことができる。
【0090】
組成ベクトルを使用して、混合物中のM個の組織型のそれぞれの量を決定することができる。組成ベクトルのM値は、M個の組織型の寄与度として直接とらえてもよい。いくつかの実装形態では、M値はパーセントに変換することができる。誤差項を使用して、M値をより高い値またはより低い値にシフトできる。組成ベクトルの値はそれぞれ成分とみなすことができ、特定の成分は特定の組織型に対応し得る。
【0091】
ブロック570において、第1の罹患組織型の寄与度を使用して、生物における第1の臓器についての第1の疾患のレベルを決定する。寄与度はカットオフ値(閾値)と比較することができる。例えば、
図4Cでは、カットオフ値は20であり得る。カットオフ値は、その組織型について健康である生物、およびその組織型について罹患している生物からのサンプルを用いて決定することができる。サンプルは、第1の疾患を有するか否かに加えて、様々なレベルの第1の疾患を有することができる。当業者は、既知のレベルの第1の疾患を有するサンプルから測定されたデータに基づいて所望のカットオフ値を決定する方法を理解するであろう。
【0092】
第1の臓器の例としては、腎臓(例えば、尿がサンプルである場合)、膀胱(例えば、尿がサンプルである場合)、肝臓(例えば、血漿または血清がサンプルである場合)、または唾液腺(例えば、唾液がサンプルである場合)であり得る。第1の疾患の例は、癌、第1の臓器が腎臓である場合の糸球体腎炎、または第1の臓器が腎臓である場合のネフローゼ症候群であり得る。
【0093】
いくつかの実施形態では、参照パターンは、潜在的に同じ臓器または異なる臓器から、複数の病変組織のために使用することができる。このようにして、複数の疾患タイプを同時に測定することができる。
【0094】
いくつかの実施形態では、寄与度を使用して、カットオフ値と比較することができる指数値を決定することができる。寄与度は特定の範囲に制限され、寄与の合計は100%になる。したがって、寄与が増加すると、他が犠牲になる。指標値はより広い範囲を有することができ、他の組織型の寄与に依存しない。指数値は、膀胱腫瘍GE指数と呼ばれる、尿1ミリリットル当たりの総cfDNAゲノム当量(GE)を乗じた寄与度であってもよい。
【0095】
図6Aに示すように、6人の症例および6人の対照は、GE/mlで測定した場合に尿中の全無細胞DNA濃度に統計的差異を示さなかった。
図6Bに示すように、膀胱腫瘍組織の決定寄与度に総GE/ml(膀胱腫瘍GE指数)を乗じて指数値を計算すると、指数値は対照と比較して膀胱癌症例において有意に高かった。
【0096】
いくつかの実施形態では、寄与度を使用して、新しい指数値を計算するためのCNAおよび/または尿中で同定された低メチル化の数および振幅を調整することができる。
【0097】
II.尿中CFDNAのサイズ
cfDNA断片の長さは、全ゲノム配列解析を使用して、単一塩基対の分解能に確認することができる。具体的には、尿中cfDNAの長さは、ペアエンド超並列シークエンシングを用いて一塩基対の分解能で決定し、異なる断片長での頻度のサイズプロファイルプロットで可視化することができる。尿中cfDNA断片の大部分は比較的短い。正常対照の排泄尿において、中央値のcfDNA断片長は65~80bpである。サイズプロファイル分析における異なる長さでのcfDNA断片の頻度の可視化は、<100bpのcfDNA断片において明確な10bpの周期性を明らかにし、ピークの頻度はトラフの頻度の最大3倍である。
【0098】
以下に説明するように、腎盂からの対をなすサンプルからのデータおよび排泄尿は、上部尿路において長いcfDNA断片の割合が大きいことを示す。インビトロ培養実験は、cfDNAが一次速度論の下で尿路において分解されることを示唆する。これは、長い断片の割合の減少および50~80bpの範囲における10bpの周期性の強調によってサイズプロファイルに反映されている。尿中cfDNAで観察された10bpの周期性は、血漿と比較して尿中のより大きな振幅ではあるが(36、37)、血漿中で見られるものを連想させる。この分解プロセスは全体的なメチル化密度に影響を及ぼし、メチル化デコンボリューションの結果にも変動を引き起こすが、移植患者の排泄尿中に観察される高度の相関は、メチル化デコンボリューションプロセスがインビボ分解にもかかわらずロバストであることを示唆する。
【0099】
A.HSCTおよび腎移植患者における尿中cfDNAのサイズ
以前の研究では、胎児由来の尿中cfDNA断片は、母性由来の断片(Tsui et al.PLos One2012)よりも短いことを示した。ここでは、特に同種移植片由来のcfDNAがレシピエント由来の断片と比較して異なるサイズプロファイルになる場合、移植尿中cfDNA断片のサイズを調べる。
【0100】
図7Aおよび7Bは、本発明の実施形態による、代表的なHSCT患者(
図7A)および腎移植患者(
図7B)からのレシピエントおよびドナーDNAの尿中cfDNAサイズプロファイルを示す。X軸は一塩基対の分解能でサイズを表示し、軸線は各長さでの頻度を示す。ドナーおよびレシピエントのサイズプロファイルは、それぞれ青と赤で表示される。
【0101】
31人のHSCTおよび腎移植患者からの尿サンプルは、特に50~80bpの範囲で、81bpの長さの中央値および10の倍数である長さで異なる10bpの周期で、同様のパターンを示す。HSCT患者(
図7A)および腎移植患者(
図7B)からのドナーおよびレシピエント特異的サイズプロファイルの分離後、レシピエント組織と比較してドナーの造血および腎臓組織由来の尿中cfDNAのサイズ間に観察可能な差はなかった。したがって、同種造血細胞および腎臓由来のドナー特異的cfDNAのサイズプロファイルは、レシピエント由来のcfDNAのサイズプロファイルとほぼ同一である。
【0102】
これは、造血組織および腎臓組織から放出されたcfDNAがレシピエント組織と同程度のサイズのものであり、または尿路の分解環境が一定期間後に異なる組織から放出されたcfDNAに共通のサイズプロファイルを担わせることを示す。造血系由来および胎児由来の両方のcfDNAは血漿の腎臓濾過を介して尿に寄与するが、尿路中の造血細胞はcfDNAを直接尿中に寄与することがあり、したがってそれらサイズプロファイル間の差を説明することができる。
【0103】
B.腎盂と排泄尿中の尿中cfDNAのサイズと組成
血漿cfDNAのサイズと組成は、循環中に均衡を達成するように見え、末梢血の繰り返しサンプリングとほぼ一貫したままである。これとは対照的に、尿は腎臓で産生され、尿管を通って一方向に膀胱へと下降し、そこで排尿される前に蓄えられる。
【0104】
DNaseIが腎臓および膀胱(http://www.proteinatlas.org/)で高発現して存在し、(29)尿中で高活性するため(30)、cfDNA断片が排泄尿と比較して腎盂でのサイズが異なるものか調べた。右側尿路系の完全な閉塞を引き起こし、腎盂から直接尿を排出させる経皮的腎瘻造設術(尿が形成される腎盂への管)の挿入を必要とする、2cmの尿管結石に罹患した患者から尿サンプルを得た。左側腎臓は、尿路を介して排泄された正常な尿を産生した。石は右側の完全な閉塞を引き起こした。右腎臓の腎盂と排泄尿から同時に2つの機会で尿を採取したところ、腎盂からの尿には長い断片の割合が多いことが分かった。2番目の機会は炎症が腎盂で減少した後だった。
【0105】
図8Aおよび8Bは、本発明の実施形態による、石のために遮断された右腎の腎盂からのcfDNA、および左腎からの排泄尿のサイズプロファイルを示す。尿中cfDNAのサイズプロファイルは、37日違いの2機会に腎盂および排泄尿からの対をなすサンプルからのものである。
図8Aは、経皮的腎結石摘出術(PCN)挿入の5日後に採取された腎盂尿および排泄尿を表す。
図8Bは、患者が回復した後、PCN挿入の42日後に採取された尿サンプルを表す。X軸は一塩基対の解像度でサイズを表示し、Y軸は特定の長さで一意にマッピング可能な断片の頻度を示す。線802および806は、左腎によって産生された排泄尿を表す。線804および808は、同時に採取された右腎盂からの尿を表す。
【0106】
両方の機会に、排泄尿と比べて腎盂尿中の長い尿中cfDNA断片の割合がより大きく、50~80bpの範囲で周期性の振幅の減少がある。さらに、最初のサンプル(
図8A)の尿中cfDNA断片の平均長は、後のサンプル(
図8B)の尿中cfDNA断片の平均長よりも長く、これは右腎において炎症が減少した後に生じた。
【0107】
腎盂尿および排泄尿についてのメチル化デコンボリューションの結果は、排泄尿と比較して腎盂尿中で寄与比率がより高く、4つ全ての尿サンプル中で好中球由来の有意な寄与があることを示す。好中球のメチル化シグネチャを有するcfDNA断片は、血漿由来の腎前性由来のものか、または腎盂内の白血球凝集由来のもののいずれかであり得る。排泄尿と比較して腎盂尿中のCpG部位にわたってより高い全体的なメチル化密度も存在する。
【表3】
【0108】
表3には、腎盂尿および排泄尿のcfDNAについて、CpG部位でのメチル化デコンボリューションおよび全体的なメチル化密度による各組織からの寄与比率を示す。AおよびBは、
図8Aおよび
図8Bに表示されている対をなす右腎盂尿サンプルおよび排泄尿サンプルに対応する。
【0109】
C.腎盂からの尿中cfDNAのサイズプロファイルの経時変化
尿路の異なる部分から尿をサンプリングすることによって、腎盂で長いcfDNA断片の割合が大きいことが分かった。尿が尿路を下降するにつれて、cfDNAの絶対濃度が減少し、50~80bpの間で最も顕著である特徴的な10塩基対(bp)周期性を有するより短い断片の割合が増加する。
【0110】
1.経時的に培養した腎盂尿
腎盂尿および排泄尿間で観察された差異の一部は、cfDNAのインビボ分解に起因し得る。第1の機会(
図8A)で腎盂尿および排泄尿の差を観察した後、第2の採取(
図8B)のために、より多くの量の腎盂尿を採取し、追加の尿を密封容器に入れ、37℃で培養した。腎盂尿のインビトロ培養は、尿路における尿のインビボ通過および膀胱における貯蔵を模倣する。尿を容器から取り出し、3時間、6時間、および24時間培養で処理した。
【0111】
図9Aおよび9Bは、37℃で0、3、および6時間のインビトロ培養した腎盂からの尿由来のcfDNAのサイズプロファイルである。
図9Aは、各塩基対長における周波数を表示し、
図9Bは、累積頻度を表示する。線902および908は採取時のcfDNAのサイズプロファイルを表す。線904および910は、3時間の培養後のサイズプロファイルを表す。線906および912は、6時間の培養後のサイズプロファイルを表す。これらのグラフは、10bp周期性の振幅の増加およびインビトロ培養による長いcfDNA断片の割合の減少を示す。見て分かるように、3時間および6時間の培養後、これらのサンプルのサイズプロファイルは、長い断片の割合の漸進的な減少および50~80bpの領域における10bp周期性の振幅の増加を示した。腎盂由来の尿からのcfDNAのこのインビトロ培養は、尿路との接触がない場合でさえ、37℃での培養がcfDNAの濃度の減少、短いcfDNAのより大きい割合、および10bp周期性の増加を引き起こすことを示す。腎盂尿のサイズプロファイルは、37℃で3~6時間培養した後の排泄尿のサイズプロファイルに似ている。
【0112】
図10Aおよび10Bは、(a)3時間および(b)6時間培養した腎盂尿のサイズプロファイルと比較した、排泄尿のサイズプロファイルを示す。線1002は、3時間培養した腎盂尿を表す。線1004および1008は排泄尿を表す。線1006は、6時間培養した腎盂尿を表す。見られるように、排泄尿のサイズプロファイルは、3時間および6時間培養した腎盂のサイズプロファイルと非常に類似している。これらのデータは、尿が腎盂から尿路へとインビボ通過の間に、cfDNAの濃度を減少させてcfDNA断片の長さを短くする分解プロセスがある可能性を示す。
【0113】
2.異なるサイズパラメータの相互関係
単一尿サンプル由来の尿中cfDNA断片の長さ、すなわち尿中cfDNAの分解の程度は、中央値長、70bpより長い断片の割合(P>70と標識)、および断片化(周期性)指標などのいくつかの定量的尺度を用いて、特徴付けることができる。70bpより長い断片の割合(P>70bp)は、70bpより長い断片の数を断片の総数で割ってパーセントとして表すことで決定することができる。
【0114】
10bpの周期性が最大で50~80bpとの間に顕著であり、周期性の振幅は、50、60、および70bpのピーク長と、55、65、75bpのトラフ長との間の周波数の差で表すことができる。これは周期性指数(PI)として表すことができる。周期性指数は、サイズプロファイル中の複数のトラフ長でのDNA断片の頻度からの、サイズプロファイル中の複数のピーク長でのDNA断片の頻度の差を表し得る。複数のピーク長は、一定のサイズ間隔で存在してもよい。複数のトラフ長は、複数のピーク長からオフセットされた一定のサイズ間隔で存在してもよい。例えば、一定のサイズ間隔は10bpであってもよいが、トラフ長はピーク長と5bpだけずれて(または位相のずれ)いてもよい。周期性指数の一例は、以下のように計算することができる。
PI=(F(50)+F(60)+F(70))-(F(55)+F(65)+F(75))
式中、F50、F60、F70、F55、F65、およびF75は、その特定の長さにおけるcfDNA断片の頻度を表す。高い周期性指数は、トラフと比較したピークにおけるcfDNA断片間の頻度の大きな差、つまりより大きい周期性の振幅を表す。
図10Aおよび
図10Bに示すように、10bpの周期性が50~80bpの間で最も顕著であり、周期性の振幅は、50、60、および70bpのピーク長の頻度の合計と、55、65、および75bpのトラフ長の合計との差によって表すことができる。
【0115】
図11Aおよび11Bは、31個のHSCT尿サンプルおよび腎移植尿サンプルについてのcfDNA断片のサイズパラメータ間の関係を示すグラフである。パラメータは、中央値(bp)、比率>70bp(P
>70)、および周期性指数(PI)である。
図11Aは、中央値長とP
>70との間に強い正の相関があることを示している。
図11Bは、中央値とPIとの間に、したがってP>70bpの場合にも負の(逆)相関があることを示している。この後者の観察は、cfDNA断片の長さおよび周期性が関連しており、各サンプルの分解の程度を表すという概念を補強する。
【0116】
サイズプロファイルで見られる培養した腎盂尿中に見られる変化は、中央値の減少、P>70bpの減少、およびPI(表4)の増加によって反映される。腎盂尿の中央値、P>70bpおよびPIは、3~6時間の培養後に対をなす排泄尿のそれと非常に同等になる。
【表4】
【0117】
表4は、37℃でインビトロ培養中の腎盂由来の尿中cfDNAおよび対をなす排泄尿について、塩基対(bp)の中央値、70bp超の断片割合(P>70)、および周期性指数(PI)の形態における要約サイズ統計を示す。腎盂尿、排泄尿、および37℃で3時間および6時間インビトロで培養した腎盂尿の比較は、腎盂尿が排泄尿と比較して高い中央値、P>70、および低いFIを有することを示す。腎盂尿は、より短い断片の割合が増加するように37℃に保たれ、より顕著な周期性が50~75bpのピークとトラフ間により大きな差として見られる場合に、分解される。腎盂由来の尿がインビトロ培養中に断片化されたので、中央値、P>70において漸進的な減少、およびPIの増加があった。
【0118】
インビトロ培養の結果は、一般的に、排泄尿中に観察されるサイズプロファイルを説明し、cfDNA断片の断片化が尿路で発生したという証拠を提供する。これは、尿中cfDNAのサイズおよび濃度が、i)採尿部位、およびii)尿が体内にあった期間の影響を受け得ることを知らせる。
【0119】
3.メチル化および経時的組成
興味深いことに、全体的なCpG部位のメチル化密度は排泄尿と比べて腎盂尿でより高く、腎盂は37℃で培養されるので、全体的なCpG部位のメチル化密度の漸進的な減少がある。インビトロ培養中の尿中cfDNAの絶対濃度、断片サイズ、および全体的なCpG部位メチル化密度の変化を考慮して、これらの因子がメチル化デコンボリューションに影響を与えるかどうかを評価した。腎盂における尿中cfDNAのメチル化デコンボリューションによる全体的なメチル化密度および異なる組織による寄与比率は、37℃でのインビトロ培養中に変動するが、血球、腎臓、および尿路上皮由来の寄与比率はランク付けに関して一定のままである。(表5)
【表5】
【0120】
表5は、37℃でインビトロ培養中のcfDNAについて、CpG部位でのメチル化デコンボリューションおよび全体的なメチル化密度による各組織からの寄与比率を示す。全体的なメチル化密度は、6時間で74.1%~68.9%に減少し、メチル化デコンボリューション寄与に変動があった。しかしながら、血球(好中球、T細胞、およびB細胞)、腎臓、および尿路上皮からの寄与比率は、ランク付けに関して一定のままである。
【0121】
インビトロ培養中の腎盂尿についてのメチル化デコンボリューションの結果は、血球(好中球)が、異なる組織由来の寄与度のわずかな変動を伴う、0時間、3時間、6時間時点で優勢な寄与体であることを示した。対をなす排泄尿のメチル化デコンボリューション結果はまた、腎盂尿サンプルと比較して、尿路上皮由来のわずかに高い寄与を伴う優勢な好中球寄与を示した。より高い尿路上皮の寄与は、尿が尿路のより長い範囲から尿路上皮cfDNAを獲得することを反映し得る。
【0122】
D.尿中cfDNA濃度の経時変化
腎盂内の尿中cfDNA断片のサイズプロファイルが高割合の長い断片を有していたので、37℃での腎盂尿のインビトロ培養の効果を調べた。腎盂尿を、PCNを介して採取し、qPCRによる絶対cfDNA濃度、および各時点からのサイズプロファイルを確かめるために異なる時点で一定分量を得ながら、37℃に保った。
【0123】
腎盂尿cfDNAの濃度を62bpのLEP遺伝子領域についてqPCRを用いて定量化し、定量化は時間ゼロ、およびそれぞれの培養時点で行われた。経時的に総DNA濃度の減少があり、初期期間中により大きな減少を伴う(
図12A)。指数関数的減衰曲線が当てはまる場合、尿中cfDNAは4.9時間の半減期および7.0時間の平均寿命を有すると推定される。
【0124】
次いで、37℃に維持された場合に、腎盂尿において観察された分解および断片化パターンも、対照の排泄尿中に見出すことができるかどうかを評価した。その日の2回目の排泄尿から約200mlの尿を採取し、その尿をインビトロで、37℃で12時間まで培養した。正常対照におけるcfDNAの濃度は変動しやすい。ここでは、最も高いcfDNA濃度を持つ対照の尿サンプルの尿培養の結果を示す。排泄尿中のcfDNAの濃度は腎盂尿と同様に経時的に減少し、指数関数的な減衰曲線は0.92のR
2に当てはめることができ、3.5時間の推定半減期および5.1時間の平均寿命を伴う(
図12B)。
【0125】
したがって、インビトロ培養中のcfDNA断片の短縮はまた、qPCRによって定量化した場合のcfDNA濃度の低下に経時的に反映される。(
図12A)正常な対象の排泄尿のインビトロ培養で同様の指数関数的減少のパターンが観察され(
図12B)、これはcfDNAが3.5~4.9時間の半減期で時間依存的に断片化されることを示唆する。
【0126】
図12Aおよび12Bは、腎盂からの尿(
図12A)および排泄尿(
図12B)について37℃でインビトロ培養実験中の尿中cfDNAの濃度を示す。x軸は、対数スケールで表示された尿中のcfDNAの濃度GE/mlであり、y軸は、時間での培養時間である。cfDNAは、腎盂尿および排泄尿の両方において一次反応速度下で3.5~4.9時間の半減期で分解されるようである。分解速度は個体によって異なってもよい。
【0127】
E.排泄尿中cfDNAの経時的なサイズ変化
排泄尿のサイズ変化を経時的に調べた。非バイサルファイトシークエンシングのために適切なDNAを3時間間隔で収集した。驚くべきことに、0~12時間のcfDNAの連続的なサイズプロファイルは静的なままであり、排泄尿のサイズプロファイルの典型的なものである。対照対象からの排泄cfDNAのサイズプロファイルが、37℃で最長12時間までの培養中一定のままであるという事実は、安定したサイズプロファイルが一定の時点以降維持されることを示す。この安定したサイズプロファイルは、排泄尿サンプルに最も一般的に見られるパターンである。
【0128】
図13A~13D。0~12時間、37℃でのインビトロ培養による排泄尿cfDNAのサイズプロファイル。尿を培養容器から等分し、3時間間隔で処理した。
図13A~
図13Dは、qPCRによって測定した場合のcfDNA濃度の同時低下を示す。
図13Aは、0時間および3時間でのサイズプロファイルを示す。
図13Bは、3時間および6時間でのサイズプロファイルを示す。
図13Cは、6時間および9時間でのサイズプロファイルを示す。
図13Dは、9時間および12時間でのサイズプロファイルを示す。
図12BのcfDNA濃度に見られる指数関数的減衰にもかかわらず、これらの尿サンプルのサイズプロファイルは、12時間の培養にわたって一定のままである。
【0129】
したがって、腎盂尿の培養における並列サイズプロファイルは、長い断片の割合および10bp周期の強調の減少を示す。(
図9A)しかしながら、排泄尿の培養の並列サイズプロファイルは、典型的な排泄尿サイズプロファイル(
図13A~13D)が安定した終点を表すように見えることを示す。この時点以降、異なる長さのcfDNA断片は同様の速度で分解され、総cfDNAの継続的な減少にもかかわらずサイズプロファイルは一定のままである。
【0130】
F.長い断片から炎症を決定する方法
イメージングは腎臓結石を同定できることもあるが、例えば、MRIまたはCTスキャンなどのイメージングから腎臓の炎症レベルを決定することは困難である。
【0131】
図14は、本発明の実施形態による、生物の腎臓の腎盂からの尿サンプルを分析して臓器損傷の程度(例えば炎症レベル)を決定する方法1400のフローチャートである。尿サンプル中の少なくとも一部のDNAは無細胞である。方法1400は、本明細書に記載の他の特定の方法と同様に、全体または部分的にコンピュータシステムを用いて実行することができる。
【0132】
方法1400は、サイズ分布を使用して炎症のレベル(病態のレベルの一例)を決定することができる。血漿DNAのサイズ分布は、例えば、リアルタイムPCR、電気泳動、および質量分析を使用して決定され得るが、これらに限定されない。様々な実施形態において、測定サイズは、長さ、分子量、または電気泳動図における移動度および電気泳動もしくは質量分析計において一定距離を移動するのに必要な時間などの長さもしくは質量に比例する測定パラメータである。別の例では、結合した染料の量がDNA分子の長さに比例するであろう挿入蛍光染料、例えば臭化エチジウムまたはSYBRグリーンでDNAを染色することができる。サンプルに紫外線が照射されたときに放出される蛍光の強度によって結合した染料の量を決定することができる。
【0133】
ブロック1410において、様々なサイズに対応するDNA断片の量を測定する。複数のサイズの各サイズについて、そのサイズに対応する尿サンプルから複数のDNA断片の量を測定することができる。例えば、140塩基の長さを有するDNA断片の数を測定することができる。量はヒストグラムとして保存されてもよい。一実施形態では、生物学的サンプルからの複数の核酸の各サイズが測定され、それは個々の基準で(例えば、単一分子シークエンシングまたはペアエンドシークエンシングおよび参照に対するアライメントによって)、または群ベース(例:電気泳動によって)で行われ得る。サイズは範囲に対応し得る。したがって、ある量は、特定の範囲内のサイズを有するDNA断片についてのものであり得る。
【0134】
複数のDNA断片は、ランダムに選択することができる。例えば、DNA断片はランダムに配列決定されてもよい。いくつかの実施形態では、DNA断片から生じる一対のシークエンスリードを対象に対応するゲノム(例えば、参照ヒトゲノム)に整列させて、DNA断片の長さを決定することができる。様々な実施形態において、サイズは、質量、長さ、または他の適切なサイズの尺度であり得る。本明細書に記載するように、測定は様々な方法で実施することができる。例えば、DNA断片のペアエンドシークエンシングおよびアラインメントを実施してもよく、または電気泳動を使用してもよい。統計的に有意な数のDNA断片を測定して、生物学的サンプルの正確なサイズプロファイルを得ることができる。統計的に有意な数のDNA断片の例には、10万、100万、200万、または他の適切な値を超えるものが含まれ、それは必要な精度に依存し得る。
【0135】
一実施形態では、そのようなペアエンドシークエンシングまたは電気泳動などの物理的測定から得られたデータをコンピュータで受信し分析して、DNA断片のサイズの測定を達成することができる。例えば、ペアエンドシークエンシングからのシークエンスリードを分析して(例えば、アライメントにより)サイズを決定することができる。別の例として、電気泳動から生じる電気泳動図を分析してサイズを決定することができる。一実施態様では、DNA断片の分析は、DNA断片を配列決定する、または電気泳動に供する実際のプロセスを含む一方、他の実施態様は、得られたデータの分析を単に実行することができる。
【0136】
ブロック1420において、第1のパラメータの第1の値は、複数のサイズでのDNA断片の量に基づいて計算される。一態様では、第1のパラメータは、生物学的サンプル中のDNA断片のサイズプロファイル(例えばヒストグラム)の統計的尺度を提供する。パラメータは、複数のDNA断片のサイズから決定されるので、サイズパラメータと呼ぶことができる。一実施形態では、第1のパラメータはDNA断片サイズの増加と共に増加する。
【0137】
第1のパラメータは、様々な形態のものであることができる。そのようなパラメータは、ヒストグラム(特定サイズの断片の絶対数または相対数を提供する任意のデータ構造)から得ることができる、断片の総数で割った特定サイズのDNA断片の数である。別の例として、パラメータは、特定のサイズまたは特定の範囲内の断片数を別のサイズまたは範囲の断片数で割ったものであり得る。分割は、異なるサンプルについて分析されている異なる数のDNA断片を説明するための正規化として作用することができる。正規化は、各サンプルについて同数のDNA断片を分析することによって達成することができ、それは分析された断片の総数で割ることと同じ結果を効果的に提供する。パラメータの他の例は、参照によりその全体が組み込まれる米国特許出願公開第2013/0237431号に記載されている。
【0138】
ブロック1430において、第1の値を基準値と比較する。基準値の例には、正常値、および正常値からの特定の距離であるカットオフ値(例えば、標準偏差の単位で)が含まれる。基準値は、同じ生物からの異なるサンプルから決定されてもよい(例えば、その生物が健康であると分かった場合)。したがって、生物が炎症を有していないと推定される場合に、基準値はサンプルから決定された第1のパラメータの値に対応してもよい。一実施形態では、生物学的サンプルは治療後に生物から得られ、基準値は治療前に得られたサンプルから決定された第1のパラメータの値に対応する。基準値はまた、他の健康な生物のサンプルから決定されてもよい。
【0139】
ブロック1440において、腎臓における炎症のレベルの分類は、その比較に基づいて決定される。様々な実施形態において、分類は、数値的、テキスト的、または他の任意の指標であり得る。分類は、炎症、確率、または他のスコアに関して、イエスまたはノーの二元的結果を提供することができ、それは、例えば以前に生物の過去の分類に対する絶対値または相対値であり得る。一実施態様では、分類は、腎臓に炎症がないこと、または炎症レベルが低下したことである。他の実施形態では、分類は、腎臓が炎症を起こしていること、または炎症のレベルが上がっていることである。一実施形態では、第1の値が基準値を超える場合に、第1の腎臓が炎症を起こしていると判定することができる。
【0140】
本明細書に記載されるように、炎症のレベルは炎症の存在を含むことができる。例えば、第1の値が超えているかどうか(例えば、第1のパラメータが定義される方法に応じて大きいか小さいか)、または炎症が存在するかどうか、または少なくとも尤度(例えば尤度率)を決定することができる。閾値を超える範囲は、可能性の増加をもたらし、複数の閾値の使用をもたらすことができる。さらに、上記の程度は炎症の異なるレベルに対応できる。したがって、実施形態は、腎臓における炎症のレベルの進行を診断、病期分類、予測、またはモニターすることができる。
【0141】
腎臓における炎症のレベルに基づいて、治療計画を立ててもよい。炎症は、薬物、食事療法、療法、または手術によって治療することができる。場合によっては、炎症の存在が早期に検出され得るので、本明細書に記載の方法を用いない場合よりも炎症は早く治療され得る。検出方法の結果として、死亡を含む合併症の危険性が低減され得る。
【0142】
III.尿中cfDNAサイズを用いた膀胱癌の検出
癌から放出されたcfDNAは、非癌細胞から放出されたcfDNAと比較して異なる長さであることが実証された(31、32)。下部尿路腫瘍からの大量のcfDNAの放出が、排泄尿の全体的なサイズプロファイルを乱すのに十分な異なるサイズのcfDNA断片に寄与する可能性があるという理由で、2症例の筋肉浸潤性膀胱癌を選択した。これらのサンプルのサイズおよびメチル化パターンを評価する全ゲノムのバイサルファイトシークエンシングのために根治的膀胱摘出術を受けているこれらの2人の患者についての手術前後の尿サンプルを採取した。結果は、膀胱癌症例が、長い断片のより大きい割合を有する尿中cfDNAを有することを示す。
【0143】
A.分析
図15Aおよび15Bは、2例の筋肉浸潤性膀胱癌からの術前および術後の尿サンプルのサイズプロファイルを示す。術前サンプルは線1502および1506で表される。術後サンプルは線1504および1508で表される。両方の術前サンプルは、より大きな割合の長い断片を有する異常なサイズプロファイルを示し、サイズプロファイルは術後サンプルにおいて正常である。これは、
図15Aの術前サンプル:中央値131bp、P>70 90.1%、PI0.10、
図15Bの術前サンプル:中央値143bp、P>70 96.2%、PI0.04、
図15Aの術後サンプル:中央値80bp、P>70 60.0%、PI1.6、および
図15Bの術後サンプル:中央値93bp、P>70 72.7%、PI1.61で、要約サイズ統計にも反映されている。
【0144】
P>70の他に、長いcfDNA断片>100bpまたは他の長さの割合を使用することができる。
図15Aおよび15Bは、サイズパラメータを用いて、癌を有するサンプル(術前)と癌を有さないサンプル(術後)とを識別し得ることを示す。
【0145】
術後尿中のサイズプロファイルの正規化は、術前に観察された長い断片の大部分が切除された腫瘍に由来していたことを示した。これは、手術前のサンプルで見られるより大きな断片が膀胱癌サンプルからのものであることを示唆している。メチル化デコンボリューションからさらなる示唆を得て、術前サンプル中の56.2%および78.8%のcfDNA断片が膀胱腫瘍に由来することが示す。したがって、長いDNA断片の割合を使用して、膀胱癌についてスクリーニングし、かつ再発についてモニターすることができる。術後膀胱腫瘍寄与は、
図15Aおよび15Bそれぞれについて4.9%および3.1%であり、これにより、長いDNA断片と腫瘍寄与との間の関係が確認される。
【0146】
図16A~
図16Cは、膀胱癌患者からの3つの排泄尿サンプルのサイズプロファイルを示す。3人の患者全員が筋肉浸潤性膀胱癌を患っていた。3つ全てのサンプルについて長い断片の割合が増加しており、これは、サイズ要約統計(
図16A)中央値131、P>70 90.1%、FI0.10、(
図16B)中央値143、P>70 96.2%、FI0.04、(
図16C)中央値114、P>70 83.7%、FI0.16にも反映される。膀胱癌患者の尿サイズプロファイルは、114~143bpの中央値、83~96%のF>70、および0.2未満のFIを有する。これは、膀胱癌患者からの尿で長いcfDNA断片の割合が大きく、そのサイズプロファイルが通常50~75bpの範囲で見られる周期性を欠くことを反映する。
【0147】
また、膀胱腫瘍(TURBT)の経尿道的切除術を受けた非筋肉侵襲性疾患の治療を受けた、膀胱癌さらなる3症例の術前尿を配列決定した。1つの症例はより長い断片を伴う著しく異常なサイズプロファイルを示したが、他の2つは正常なサイズプロファイルを示した。
【0148】
図17A~17Cは、TURBTを受けている非筋肉浸潤性膀胱癌を有する3人の患者からの3個の術前尿サンプルのサイズプロファイルを示す。TBR413では長い断片の割合が増加する。要約サイズ統計は、中央値114bp、P
>70 83.7%、PI0.16である。他の2つの尿サイズプロファイル(TBR406およびTBR419)は、排泄尿に典型的なサイズプロファイルを表示する。TBR413は術前には非筋肉侵襲性であると考えられていたが、TURBT後に筋肉侵襲性疾患を有することが判明し、その後根治的膀胱摘出術が必要となった。したがって、癌のタイプを識別することができ、異常なサイズプロファイル(例えば、長い断片の統計値が閾値を上回る)は、より進行した疾患を示し得る。
図17Aは、
図16Cと同じサンプルに対応する。
【0149】
異常なサイズプロファイル(TBR413)の症例は、筋肉浸潤を有する高悪性度であったサイズが14cmの広範な膀胱腫瘍を有することが見出され、その後、根治的膀胱摘出術を必要とした。他の2つの症例(TBR406および409)は、TURBT後に疾患再発を伴わずに非筋肉侵襲性疾患を有することが組織学的に確認された。これらの結果は、大きな腫瘍量を有する筋肉浸潤性膀胱癌が、異常な尿サイズプロファイルを生じさせるのに十分な腫瘍DNAを放出する可能性が高いことを示した。
【0150】
B.長い尿中cfDNAを用いた膀胱癌の検出方法
図18は、本発明の実施形態による、あるサイズの尿中cfDNAを用いて膀胱癌を検出するために生物の尿サンプルを分析する方法1800のフローチャートを示す。尿サンプルは、正常細胞および潜在的に癌に関連する細胞に由来するDNAを含む。尿サンプル中の少なくとも一部のDNAは無細胞である。
【0151】
ブロック1810において、様々なサイズに対応するDNA断片の量を測定する。複数のサイズの各サイズについて、そのサイズに対応する尿サンプルから複数のDNA断片の量を測定することができる。ブロック1810は、
図14のブロック1410と類似の様式で実施してもよい。
【0152】
ブロック1820において、第1のパラメータの第1の値は、複数のサイズでのDNA断片の量に基づいて計算される。一態様では、第1のパラメータは、生物学的サンプル中のDNA断片のサイズプロファイル(例えばヒストグラム)の統計的尺度を提供する。一実施形態では、第1のパラメータはDNA断片サイズの増加と共に増加する。サイズは、50、55、60、65、70、75、80、85、90、95、100、105、110、115、または120bpより大きい断片を含んでもよい。ブロック1820は、
図14のブロック1420と類似の様式で実施してもよい。
【0153】
ブロック1830において、第1の値を基準値と比較する。ブロック1830は、
図14のブロック1430と類似の様式で実施してもよい。
【0154】
ブロック1840において、膀胱癌のレベルの分類は、その比較に基づいて決定される。例えば、第1の値が基準値を超える場合、生物は膀胱癌を有すると判断してもよい。判定は、癌の特定のレベル、例えば癌が筋肉侵襲性であるかどうかについてのものであり得る。
【0155】
上記の結果に示されるように、尿中cfDNAのサイズプロファイル分析は、長い断片が予想外に大きな割合を占める尿サンプルを同定することができ、メチルデコンボリューションはcfDNA断片の由来を同定することができる。尿路上皮癌の場合、大きなcfDNA断片を同定することができ、メチル化デコンボリューションを使用して、尿路上皮癌のそのような症例について尿路上皮腫瘍由来の断片の増加があることを確かめた。
【0156】
癌のレベルに基づいて、治療計画を立ててもよい。癌は化学療法、薬物、食事療法、療法、および/または手術によって治療することができる。場合によっては、癌の存在は早期に検出され得るので、本明細書に記載の方法を用いない場合よりも癌は早く治療され得る。検出方法の結果として、死亡を含む合併症の危険性が低減され得る。膀胱癌は、原発腫瘍の外科的切除後に最大70%の再発率を有する。非侵襲性尿検査が定期的に行われる場合、検査はより早期に再発を検出することができ、また、膀胱鏡検査の必要性または頻度を減らし得る。
【0157】
C.進行性浸潤性腫瘍を同定するためのcfDNA断片サイズの使用
膀胱癌を検出することに加えて、cfDNA断片のサイズを分析して、腫瘍のステージを示すことができる。浸潤性高悪性度の尿路上皮癌は、長い断片の割合がより大きいことと関連している。
【0158】
図19Aは、対照、および非筋肉侵襲性Ta-T1疾患を有する膀胱癌患者、および筋肉侵襲性T2-T4疾患を有する膀胱癌患者における、70bpより長い尿中cfDNA断片の比率(P>70bp)を示す箱ひげ図である。対照およびTa-T1疾患を有する膀胱癌患者におけるP>70bpの間に有意差はなかった。T2-T4疾患を有する膀胱癌患者は、長い尿中cfDNA断片の割合がより大きいことを示した(マン・ホイットニーU検定P=0.03)。それゆえ、70bpより長い断片の割合を使用して、T2-T4疾患を有するものとその疾患を有さないものとを区別してもよい。
【0159】
図19Bは、対照、およびTa-T1疾患を有する膀胱癌患者、およびT2-T4疾患を有する膀胱癌患者における、105bpより長い尿中cfDNA断片の比率(P>105bp)を示す箱ひげ図である。対照と非筋肉侵襲性(Ta-T1)疾患を有する膀胱癌患者との間のp>105bpに有意差はなかった。筋肉浸潤性膀胱(T2-T4)疾患は、長い尿中cfDNA断片の割合がより大きいことを示した(マン・ホイットニーU検定P=0.005)。したがって、105bpより長い断片の割合を使用して、T2-T4疾患を有するものと疾患を有さないものとを区別し得る。
【0160】
IV.血漿および尿中の異常の比較
癌は、全体的な低メチル化(33)およびコピー数異常(34)によって特徴付けられてもよく、これらの変化は癌患者の血漿中で検出されてもよい(7)。全ゲノムバイサルファイトシークエンシングは、1MBビン(または所定の長さおよび/または位置を有し得る他のサイズの領域)によってゲノム全体のメチル化密度を決定し、ゲノム全体の遺伝子座にマッピングされた断片数に基づいてコピー数変化があるかどうかを決定することできる。正常対照におけるメチル化密度およびコピー数は、無癌サンプルからのcfDNAの配列決定に基づいて決定することができる。対照と比較して3を超えるZスコア差(または他の値、例えば所望の感度および特異度に基づいて選択される)がある場合、CNAおよびメチル化の変化は有意であるとみなすことができる。尿サンプルについては、他のサンプル、例えば血漿についての閾値とは異なる特定の閾値を決定することができる。
【0161】
A.尿中の異常は腫瘍のメチル化およびCNAの変化を反映する
筋肉侵襲性疾患を有する膀胱癌患者からの対をなす腫瘍組織および排泄尿を得た。全体的な低メチル化は、尿中cfDNAおよび原発性膀胱腫瘍の両方で見られた。膀胱腫瘍はまた、ゲノム全体にわたってコピー数異常を示した。尿中cfDNAにおける増減の位置は、腫瘍において見られたものを反映していた(
図20)。これらの結果は、尿中cfDNAにおいて観察可能な低メチル化およびコピー数異常が原発性膀胱癌において見られる異常の代表例であることを示した。
【0162】
図20は、本発明の実施形態による、全体的なメチル化における一致および尿中cfDNAと膀胱癌組織との間のコピー数異常を示すCircosプロットを示す。染色体位置は時計回りに昇順で表される。中心から周辺までの4つの環は、1)膀胱腫瘍メチル化(環2002)、2)尿中cfDNAメチル化(環2004)、3)膀胱腫瘍コピー数(環2006)、および4)尿中cfDNAコピー数(環2008)を表す。1Mbビンの全体的なメチル化密度は環2002および環2004に表され、有意な低メチル化および高メチル化はそれぞれ赤および緑の点で表される。高メチル化はこれらのサンプルには存在しない。コピー数変化は、2つの外側の環で表される。コピー数の減少は赤い点(例えば、点2010)で表され、環の中心に向かっている。コピー数の増加は緑色の点(例えば、点2012)で表され、環の中心から外れている。灰色の点(例えば、点2014)は、対照から有意な逸脱がないことを表す。
【0163】
図21A~21Eは、本発明の実施形態による、5人の膀胱癌患者(A~E)からの尿中cfDNAの全体的なメチル化およびコピー数異常のCircosプロットを示す。内側の環(例えば環2102)はメチル化密度を表し、外側の環(例えば環2104)はコピー数の変化を表す。低メチル化およびコピー数の減少は赤色に着色され(例えば、点2106)、環の中心に向かっているが、高メチル化およびコピー数の増加は緑色に着色され(例えば、点2108)、環の中心から離れている。灰色の点(例えば、点2110)は、対照から有意な逸脱がないことを表す。
図21Aのデータは、
図20の尿中cfDNA環のデータに対応する。
【0164】
4つのサンプル(
図21A、21B、21D、および21E)で尿中cfDNAの全体的な低メチル化、および5つの全サンプルでコピー数異常の証拠を発見した。注目すべきことに、筋肉侵襲性疾患を有することが術前に確認された2つの症例は、半分を超える染色体において大きなコピー数の変化を示した(
図21Aおよび21B)。
図21Bは、低メチル化に加えて高メチル化も示す。その後、TURBT後に広範な筋肉浸潤性疾患を有することが確認された症例(
図21D)も、染色体1q、9、および10qにおいて明らかな全体的な低メチル化および大きなコピー数の増加および喪失を示した。
図21Aは、
図15Aの術前サイズプロファイルに対応する患者T22の結果を示す。
図21Bは、
図15Bの術前のサイズプロファイルに対応する患者T23の結果を示す。
図21Cは、
図17BのTBR406を有する患者の結果を示す。
図21Dは、
図17AのTBR413を有する患者の結果を示す。
図21Eは、
図17CのTBR419を有する患者の結果を示す。非筋肉侵襲性疾患を伴う3例である
図21C、
図21D、および
図21Eは、軽度の低メチル化と、数および振幅に関してコピー数異常の比較的わずかな証拠を示した。
【0165】
全ゲノムバイサルファイトシークエンシングにより、異常なcfDNAサイズプロファイル、コピー数、および膀胱癌に関連する全体的なメチル化の変化を同時に分析できる。バイサルファイト変換中のインビボでの分解およびcfDNAの喪失にもかかわらず、尿中cfDNAにおいて検出された全体的な低メチル化およびコピー数の異常は原発腫瘍組織において見られる変化と密接に対応する。したがって、このアプローチは、膀胱腫瘍を代表するメチル化状態およびコピー数の変動を評価するための非侵襲的方法を提供する。
【0166】
コピー数異常は、一般的に膀胱癌において観察される(38)。これらの変化は、膀胱癌患者からの5つの全尿サンプルにおいて観察可能であった。コピー数異常はまた、非常に低い悪性度の疾患を検出することがある。
【0167】
さらに、筋肉侵襲性疾患と高い腫瘍量を有する症例は、サイズプロファイル、コピー数、および全体的な低メチル化の顕著な撹乱を表す可能性が高い。単一バイサルファイトシークエンシングの実施から得たこれらの分析の組み合わせの実施可能性は、膀胱癌症例の検出を容易にし、より進行した疾患を有する症例を区別し得る。膀胱腫瘍および小腸の寄与における対応する変化を検出するメチル化デコンボリューションの能力はまた、この方法を、他の泌尿器、腎臓、または全身状態の検出のために、明確なmethylomicパターンを有するcfDNAを放出する細胞由来の寄与の増加の検出に拡張することができることを示す。
【0168】
尿由来のcfDNA、および膀胱腫瘍から抽出されたDNA(グレード3尿路上皮癌、T3)を配列決定し、尿中で観察されたCNAおよび全体的な1MB低メチル化が膀胱腫瘍の変化に非常に同等であることを見出した。
【0169】
図22Aおよび22Bは、T22の膀胱癌腫瘍(
図22A)およびcf尿(
図22B)についてのCircosプロットを示す。内側の環(例えば環2202)はメチル化密度を表し、外側の環(例えば環2204)はコピー数の変化を表す。低メチル化およびコピー数の減少は赤色に着色され(例えば、点2206)、環の中心に向かっているが、高メチル化およびコピー数の増加は緑色に着色され(例えば、点2208)、環の中心から離れている。灰色の点(例えば、点2210)は、対照から有意な逸脱がないことを表す。膀胱癌腫瘍とcf尿とのcircosプロットを比較すると、両方に全体的な低メチル化がある。膀胱腫瘍および尿中にも多数のCNAが存在し、これらの異常の位置は両方においてほぼ同一である。類似性の結果として、cf尿異常を用いて膀胱腫瘍を検出することができる。
図22Bは、
図20で使用したものと同じサンプルに対応する。
【0170】
B.膀胱癌に伴って上昇した高メチル化
高メチル化についてのcfDNAを分析することによって癌を検出することは慣例的ではないが、高メチル化を使用して、癌のレベルの分類を決定できることを見出した。尿中cfDNAに寄与している正常組織(血球、腎臓、尿路上皮)において一貫してメチル化されていない1,082,774のCpG部位(例えば<2%)を同定した。非メチル化は、2%、5%、または10%未満でメチル化されている部位を指してもよい。これらの部位は、腫瘍においてより一般的にメチル化されており、したがって正常組織と比較して高メチル化されている。例として、高メチル化部位は、30%、40%、50%、60%、70%、80%、または90%を超えてメチル化され得る。膀胱癌症例および対照からの尿サンプル中のこれらのCpG部位における全体的なメチル化密度を計算した。
【0171】
図23Aは、これらの1082774個のCpG部位における、膀胱癌症例および対照における全体的な高メチル化密度の箱ひげ図を示す。膀胱癌症例は、対照と比較してより高い全体的なメチル化密度を示した。
図23Bは、癌を検出するために高メチル化密度を使用するためのROC曲線を示す。AUCは0.814であった。
【0172】
C.術前尿中のCNAおよび低メチル化は術後尿中には存在しない。
図24A~24Dは、根治的膀胱摘出術を受けている2人の膀胱癌患者の術前(
図24Aおよび24C)および術後(
図24Bおよび24D)のcf尿を示す(T22およびT23)。内側の環(例えば環2402)はメチル化密度を表し、外側の環(例えば環2404)はコピー数変化を表す。低メチル化およびコピー数の減少は赤色に着色され(例えば、点2406)、環の中心に向かっているが、高メチル化およびコピー数増加は緑色に着色され(例えば、点2408)、環の中心から離れている。灰色の点(例えば、点2410)は、対照から有意な逸脱がないことを表す。膀胱癌に関連するCNAおよび低メチル化は、術前尿中で明らかに観察可能であるが(
図24Aおよび24C)、術後サンプル中のcf尿(
図24Bおよび24D)は、無癌対照と同等のコピー数およびメチル化レベルで正規化する。
【0173】
図25A~25Dは、2人の患者についての全体的なメチル化およびCNAの術前および術後のCircosプロットを示す。
図25Aおよび
図25Bは、3cmのT1HG疾患を有する患者についての手術前後のcircosプロットである。術後のCircosプロットは、術前のサンプルに見られる全体的な低メチル化およびCNAのクリアランスを示す。病理学によって尿路上皮腫瘍の明確なマージンを確認し、患者は術後サンプルが得られた再発を発症していない。
【0174】
図25Cおよび
図25Dは、T3aHG疾患を有する患者についての手術前後のcircosプロットである。術後のcircosプロットは、全体的な低メチル化およびCNAの持続性を示す。病理学的報告により、切除マージンに腫瘍が存在する筋肉浸潤性疾患の存在および残存疾患の存在を確認した。したがって、全ゲノムバイサルファイトシークエンシングを用いて残存疾患の存在を探すことができ、膀胱癌の治療を受けている患者における腫瘍由来cfDNAの長期モニタリングに使用することができる。
【0175】
メチル化レベルおよびコピー数異常の分析は、癌治療(手術を含む)の成功を評価するのに役立ち得る。さらに、分析は癌の寛解、進行、または重症度をモニターし得る。
【0176】
D.CNAおよび低メチル化は、無細胞尿および尿沈渣で検出することができる
図26は、低悪性度(Ta)の非侵襲性乳頭状尿路上皮腫瘍(PUNLMP)を有する膀胱癌患者におけるメチル化およびコピー数異常を示すCircosプロットである。内側の環はメチル化密度を表し、外側の環はコピー数の変化を表す。低メチル化およびコピー数の減少は赤色に着色されて環の中心に向かっているが、高メチル化およびコピー数の増加は緑色に着色されて環の中心から離れている。灰色の点は対照から有意な偏差がないことを表す。図中のデータは、患者の尿の配列決定から得られた。第10染色体のコピー数増加(セクション2602)は、低悪性度の組織像を有する超低悪性度疾患の患者に見られる。それゆえ、低悪性度疾患または早期癌は、コピー数異常を用いて同定することができる。
【0177】
尿サンプルは、遠心分離により細胞および細胞を含まない部分に分離することができ、細胞を含まない部分はさらなる濾過を受ける。ほとんどの尿サンプルには小さいながらも目に見える尿沈渣があり、そこからDNAを抽出できる。尿沈渣は、3000×gでの遠心分離後のチューブの底の内容物であってもよく、細胞性物質を含んでもよい。膀胱癌の尿サンプルからDNAを抽出して、全ゲノムのバイサルファイトシークエンシングを行った。
【0178】
図27Aおよび27Bは、同じ排泄尿から得られた膀胱癌患者(T23)からのcf尿(
図27A)および尿沈渣(
図27B)についてのCircosプロットを示す。内側の環(例えば環2702)はメチル化密度を表し、外側の環(例えば環2704)はコピー数の変化を表す。低メチル化およびコピー数の増加は赤色に着色され(例えばドット2706)、環の中心に向かっているが、高メチル化およびコピー数の増加は緑色に着色され(例えばドット2708)、環の中心から離れている。灰色の点(例えば、点2710)は、対照から有意な逸脱がないことを表す。存在する場合および実質的なDNAが抽出された場合、尿沈渣は、膀胱癌を反映する全体的な低メチル化およびCNAを示すように配列決定することができる。尿沈渣中のCNAの低メチル化および位置は、cf尿中に見られる変化と同程度である。
【0179】
尿沈渣サイズは、異なるサンプル間で変化する。いくつかの尿サンプルは、遠心分離後に目に見える尿沈渣を有さない(すなわち、低い細胞含有量)。
図27Aおよび
図27Bでは、尿沈渣中のCNAの振幅および低メチル化は、無細胞DNAと比較して高く、これは、沈渣ベースのCNAが場合によっては、より高感度であり得ることを示唆する。尿沈渣が存在するとき、腫瘍細胞からの寄与比率はいくつかの例においてより高くなり得る。
【0180】
尿沈渣分析は、通常、細胞診によって分析される。実施形態では、尿沈渣は配列決定されてもよい。尿沈渣は、cfDNAと同様に配列決定されてもよい。場合によっては、尿沈渣DNAを断片化(例えば、超音波処理)して、cfDNAと同じまたは類似の技術によって配列決定するために、より小さいサイズのDNAを形成することができる。したがって、尿沈渣の分析は、cf尿と同様に疾患を検出する同一のまたは類似の様式で使用することができる。尿沈渣の分析は、cf尿の分析と組み合わせると、特異度および/または感度を高め得る。
【0181】
E.CNAおよび全体的な低メチル化は尿中に検出されるが血漿中には検出されない
明らかな転移が見られない膀胱癌を持つ2人の患者では、CNAおよび低メチル化は、尿中のcfDNAで検出されたが、血漿のcfDNAでは検出されなかった。
【0182】
図28A~28Dは、2人の膀胱癌患者(T22およびT23)からのcf尿(
図28Aおよび28C)および血漿(
図28Bおよび28D)についてのCircosプロットを示す。内側の環はメチル化密度を表し、外側の環はコピー数の変化を表す。低メチル化およびコピー数の減少は赤色に着色されて環の中心に向かっているが、高メチル化およびコピー数の増加は緑色に着色されて環の中心から離れている。灰色の点は対照から有意な偏差がないことを表す。尿および血漿サンプルを同時に得た。これらの図は、メチル化レベルおよびコピー数異常が血漿中に現れないかまたは明らかに現れないため、メチル化レベルまたはコピー数に基づく膀胱癌の検出が、血漿のcfDNAと比較して尿のcfDNAにおいて容易であることを示す。
【0183】
図29Aおよび29Bは、2つの膀胱癌症例、T22およびT23についてのCNAまたは低メチル化の証拠を示す、ゲノム全体にわたる1MBのビンの割合を示す。T23については、血漿中、例えば染色体5pにCNAの証拠がある。このコピー数の増加は尿のcfDNAでも見られるが、他のCNAおよび全体的な低メチル化は血漿と比較して尿中ではるかに明白である。T23は一連のネオアジュバント化学療法を完了したが、その後根治的膀胱摘出術の約6ヵ月後に脳転移を発症した。これらのグラフはまた、より多くのビンが血漿中よりも尿中でCNAまたは低メチル化を示すため、メチル化レベルまたはコピー数に基づく膀胱癌の検出が、血漿のcfDNAと比較して尿のcfDNAにおいてより容易であることを示している。
【0184】
F.特定の臓器の癌を同定する方法
図30は、本発明の実施形態による、対象の第1のサンプルおよび血液サンプルを分析することによって対象の第1の臓器内の癌を同定する方法を示すフローチャートである。第1のサンプルが、第1の臓器由来であり、または第1のサンプルが生物を出るのと同様に第1の臓器を通過し、かつ血液サンプルとは異なる。第1のサンプルおよび血液サンプルは両方とも、正常細胞由来の、および潜在的に癌に関連する細胞由来のDNAを含む。第1のサンプルおよび血液サンプルの両方において少なくとも一部のDNAは無細胞である。第1のサンプルの例は、尿、唾液、または便である。
【0185】
ブロック3010において、生物学的サンプルからの複数のDNA分子を分析する。DNA分子の分析は、生物のゲノム中のDNA分子の位置を同定すること、および任意に(例えば、メチル化分析が行われる場合に)DNA分子が1つ以上の部位でメチル化されているかどうかを決定することを含むことができる。メチル化状態は、特定のシトシン残基が5-メチルシトシンまたは5-ヒドロキシメチルシトシンであるかどうかを含み得る。
【0186】
分析は、メチル化認識シークエンシングからシークエンスリードを受けることによって行うことができ、すなわち以前にDNAから得られたデータにだけ分析を行うことができる。他の実施形態では、分析は、実際のシークエンシングまたはデータを得る他の能動的ステップを含み得る。シークエンスリードは、種々のシークエンシング技術、PCR技術、アレイ、および断片の配列を同定するための他の適切な技術から得ることができる。シークエンスリードの部位のメチル化状態は、本明細書に記載のとおりに得ることができる。
【0187】
メチル化認識シークエンシングの一例は、亜硫酸水素ナトリウムでDNAを処理した後、DNAシークエンシングを行うことを含む。メチル化認識シークエンシングは、重亜硫酸ナトリウムを使用せずに、DNA分子(N6-メチルアデニン、5-メチルシトシン、および5-ヒドロキシメチルシトシンを含む)のメチル化状態をバイサルファイト変換なしで直接解明することを可能にする単一分子シークエンシングプラットフォームを使用して(AB Flusberg et al.2010 Nat Methods;7:461-465;J Shim et al.2013 Sci Rep;3:1389.doi:10.1038/srep01389)、またはメチル化シトシンの免疫沈降によって(例えば、メチルシトシンに対する抗体を用いることによって、またはメチル化DNA結合タンパク質もしくはペプチド(LG Acevedo et al.2011 Epigenomics;3:93-101)とそれに続くシークエンシングを用いることによって、またはメチル化感受性制限酵素とそれに続くシークエンシングの使用によって、実施することができる。別の実施形態では、アレイ、デジタルPCR、および質量分析などの非シークエンシング技術を使用する。
【0188】
ブロック3020~3050は、対象の複数の染色体領域の各染色体領域に対して繰り返される。複数の染色体領域は重複していなくてもよい。ゲノムは、1メガベース(Mb)の長さ、または500Kbもしくは2Mbのような他のセグメント長の領域に分離することができる。領域のサイズは1Mb、またはその他の同じサイズにすることができる。その場合、全ゲノムは約3,000の領域を含むことができ、それぞれの領域は所定のサイズおよび位置のものであってもよい。また、上記のように、そのような所定の領域は、使用される特定の染色体の長さまたは特定の数の領域、および本明細書中に記載される他の任意の基準に適応するように変動し得る。領域が異なる長さを有する場合、例えば本明細書に記載されるように、そのような長さを使用して結果を正規化することができる。
【0189】
ブロック3020において、染色体領域がコピー数異常の異常を示すかどうかの分類、または低メチル化は、第1のサンプルおよび血液サンプルのそれぞれについて決定される。ブロック3020は、ブロック3030~3050を実行することによって実施することができる。コピー数の異常または低メチル化の検出に関するさらなる詳細は、米国特許第8,741,811号および同第9,121,069号、ならびにPCT公開第WO2014/043763号に見出すことができ、その全体が参照により組み込まれる。
【0190】
ブロック3030では、各サンプルからのDNA分子のそれぞれの群が、同定された位置に基づいて染色体領域からのものとして同定される。それぞれの群は、染色体領域の複数の遺伝子座のそれぞれに位置する少なくとも1つのDNA分子を含む。一実施形態では、その群は、例えば、その全体が参照により本明細書に組み入れられる、米国特許第9,121,069号に記載されているように、染色体領域の特定のハプロタイプに整列する断片であり得る。別の実施形態では、その群は、例えば米国特許第9,121,069号にも記載されているように、染色体領域に整列する任意の断片であり得る。
【0191】
ブロック3040において、コンピュータシステムは、DNA分子の各群の各値を計算する。それぞれの値は、それぞれの群のDNA分子の特性を定義する。特性は、メチル化レベル、第1の各群のDNA分子の量、または第1の各群のDNA分子のサイズプロファイルの統計値であり得る。量の一例として、各値は、正規化された値、例えば、サンプルのタグカウントの総数または参照領域のタグカウントの数で割った領域のタグカウントでもあり得る。各値は、(例えば、他のハプロタイプについての)他の値との差または比率でもあり得、それによってその領域に対する差の性質を提供する。
【0192】
ブロック3050では、各値を基準値と比較して、第1の染色体領域が、例えば、欠失もしくは増幅のコピー数異常、低メチル化もしくは高メチル化のメチル化異常、またはミスマッチなどの異常を示すかどうかの分類を決定する。この基準値は、本明細書に記載の任意の閾値または基準値であり得る。例えば、基準値は、正常サンプルについて決定された閾値であり得る。ハプロタイプ間の差が使用される場合、各値は2つのハプロタイプについてのタグカウントの差または比であり得、基準値は統計学的に有意な偏差が存在することを決定するための閾値であり得る。別の例として、基準値は別のハプロタイプまたは領域のタグカウントまたはサイズ値であり得、比較が差または比(またはそのような関数)をとること、次いで差または比が閾値より大きいかどうかを決定することを含むことができる。
【0193】
基準値は、他の領域の結果に基づいて変えることができる。例えば、隣接領域も偏差を示す場合(1つの閾値と比較して小さいが、例えば、3のzスコア)、より低い閾値を使用することができる。例えば、3つの連続した領域が全て第1の閾値を超える場合は、癌の可能性が高くなり得る。したがって、この第1の閾値は、非連続領域から癌を同定するのに必要とされる別の閾値よりも低くなってもよい。わずかな偏差でさえも3つ(または3つ超)の領域を有することは、感度および特異度が保存され得るという偶然効果の十分に低い確率を有し得る。
【0194】
ブロック3060において、第1の癌のレベルは、第1のサンプルについて異常を示すものと分類された染色体領域の第1の量が第1の閾値を超えるかどうか基づいて決定される。例として、第1の癌のレベルに対応する分類は、生物が癌を有するかどうか、癌のステージ、および癌の予後であり得る。一実施形態では、全ての異常領域がカウントされ、その領域がどこに現れるかにかかわらず単一の閾値が使用される。別の実施形態では、閾値は、カウントされる領域の位置およびサイズに基づいて変わり得る。例えば、染色体の特定の染色体またはアーム上の領域の量は、その特定の染色体(またはアーム)の閾値と比較してもよい。複数の閾値を使用してもよい。例えば、特定の染色体(またはアーム)上の異常領域の量は第1の閾値を超えなければならず、ゲノム中の異常領域の総量は第2の閾値を超えなければならない。
【0195】
ブロック3070において、第2の癌のレベルは、血液サンプルについての異常を示すものと分類された染色体領域の第2の量が第2の閾値を超えるかどうかに基づいて決定される。ブロック3070は、ブロック3060と類似の様式で実施してもよい。
【0196】
ブロック3080において、第1の癌のレベルは対象が癌を有することを示し、第2の癌のレベルは対象が癌を有していないことを示す場合に、対象は第1の臓器の癌を有すると決定される。そのようなシナリオは、
図28A~28Dに例示されている。したがって、全ゲノムバイサルファイトシークエンシングはまた、尿路上皮癌患者の無細胞尿および尿沈渣中の全体的な低メチル化およびコピー数異常(CNA)を同定することができる。これらの変化は膀胱腫瘍に見られる変化に対応しており、体循環では検出されない。
【0197】
癌の判定後、治療計画を立ててもよい。癌は化学療法、薬物、食事療法、療法、および/または手術によって治療することができる。場合によっては、癌の存在は早期に検出され得るので、本明細書に記載の方法を用いない場合よりも癌は早く治療され得る。検出方法の結果として、死亡を含む合併症の危険性が低減され得る。
【0198】
G.CNAについての癌のレベルを決定する
ブロック3060および3070内の領域の量の閾値は、カウントされた領域に対する不均衡の強さに依存し得る。例えば、癌の分類を決定するための閾値として使用される領域の量は、各領域における異常を検出するために使用される特異度および感度(異常閾値)に依存し得る。例えば、異常閾値が低い(例えば、2のzスコア)場合、量閾値は高い(例えば150)ように選択されてもよい。しかし、異常閾値が高い(例えば、3のzスコア)場合、量閾値はより低くてもよい(例えば、50)。異常を示す領域の量も重み付けされた値とすることができ、例えば、高い不均衡を示す1つの領域は、わずかな不均衡を示す領域よりも高く重み付けすることができる(すなわち、異常について正および負よりも多い分類がある)。
【0199】
したがって、有意に過剰または過小表現の正規化されたタグカウント(または群の特性についての他の各値)を示す染色体領域の量(数および/またはサイズを含んでもよい)は、病気の重症度を表すものとして使用することができる。異常な正規化されたタグカウントを有する染色体領域の量は、2つの要因、すなわち腫瘍組織における染色体異常の数(またはサイズ)および生物学的サンプル(例えば血漿)中の腫瘍由来DNAの分画濃度によって決定することができる。より進行した癌は、より多くの(そしてより大きな)染色体異常を示す傾向がある。それゆえ、より多くの癌関連染色体異常が潜在的にサンプル(例えば血漿)中で検出可能である。より進行した癌を有する患者では、高い腫瘍量が、血漿中のより高い分画濃度の腫瘍由来DNAをもたらすであろう。結果として、腫瘍関連染色体異常は血漿サンプル中でより容易に検出されるであろう。
【0200】
癌のスクリーニングまたは検出の文脈では、正規化されたタグカウント(または他の値)の過剰または過小表現を示す染色体領域の量を使用して、試験された被験体の癌を有する可能性を決定することができる。±2のカットオフ(すなわち、zスコア>2または<2)を使用すると、偶然のみに起因して約5%の試験領域が対照対象の平均から有意に逸脱したzスコアを与えると予想される。全ゲノムが1Mbのセグメントに分割されると、全ゲノムには約3000セグメントがあるだろう。したがって、約150セグメントは、>2または<2のzスコアを有すると予想される。
【0201】
したがって、癌が存在する場合、zスコア>2または<-2のセグメント数について、150のカットオフ(閾値)値を使用することができる。異常zスコアを有するセグメントの数(例えば、100、125、175、200、250、および300)についての他のカットオフ値は、診断目的に合うように選択することができる。より低いカットオフ値、例えば100は、感度の高い試験をもたらすが、より低い特異度およびより高いカットオフ値は、より特異的であるがより感度が低いであろう。偽陽性分類の数は、zスコアのカットオフ値を増やすことによって減らすことができる。例えば、カットオフ値が3に増やされた場合、セグメントのわずか0.3%が偽陽性であるだろう。この状況では、異常なzスコアを持つ3つを超えるセグメントを使用して癌の存在を示すことができる。異なる診断目的に合うように、他のカットオフ値、例えば1、2、4、5、10、20、および30を選択することもできる。しかしながら、癌関連染色体異常を検出する感度は、診断を下すのに必要とされるセグメントの異常数が増えるにつれて減少するであろう。
【0202】
特異度を犠牲にすることなく、感度を改善するために可能なアプローチの1つは、隣接する染色体セグメントの結果を考慮に入れることである。一実施形態では、zスコアのカットオフは>2および<-2のままである。しかしながら、染色体領域は、2つの連続するセグメントが同じタイプの異常を示す場合、例えば両方のセグメントが>2のzスコアを有する場合にのみ、潜在的に異常であると分類される。正規化されたタグカウントの偏差がランダムエラーの場合、2つの連続したセグメントが同じ方向に誤ってポジティブになる確率は0.125%(5%×5%/2)になる。他方、染色体異常が2つの連続するセグメントを包含する場合、より低いカットオフ値は、血漿サンプル中のセグメントの過剰または過小表現の検出をより高感度にする。対照対象の平均からの正規化されたタグカウント(または他の値)の偏差はランダムエラーによるものではないので、連続分類要件は感度に重大な悪影響を及ぼさないであろう。他の実施形態では、より高いカットオフ値を使用して隣接セグメントのzスコアを一緒に加算することができる。例えば、3つの連続するセグメントのzスコアを合計することができ、5つのカットオフ値を使用することができる。この概念は、3つを超える連続したセグメントに拡張できる。
【0203】
量と異常閾値の組み合わせはまた、分析の目的に依存し、生物の任意の事前知識(またはその欠如)に依存し得る。例えば、正常な健康集団を癌についてスクリーニングする場合、潜在的に、領域(すなわち、領域の数に対する高い閾値)、およびある領域が異常を有すると同定されたときの異常閾値の両方の量において、典型的に高い特異度を使用する。しかし、リスクがより高い患者(例えば、しこりまたは家族歴、喫煙者、HPVウイルス、肝炎ウイルス、または他のウイルスを訴える患者)では、より高い感度(偽陰性がより少ない)を得るために、閾値を低くすることができる。
【0204】
一実施形態では、染色体異常を検出するために1Mbの分解能および6.3%の腫瘍由来DNAの検出下限を使用する場合、各1Mbセグメント中の分子の数は60,000個である必要があるだろう。これは、全ゲノムについて約1億8,000万(60,000リード/Mb×3,000Mb)の整列可能リードに翻訳されるであろう。
【0205】
H.メチル化についての癌のレベルの決定
メチル化について、態様は、CNAについてと同じであり得る。一実施形態では、全領域のメチル化レベルを決定し、閾値と比較することができる。
【0206】
いくつかの実施形態では、第一のメチル化レベルは、メチル化レベルが基準値を超える領域の数に対応できる。例えば、生物のゲノムの複数の領域を同定することができる。領域は、本明細書に記載の基準、例えば特定の長さまたは特定の数の部位を用いて同定することができる。1つ以上の部位(例えば、CpG部位)が各領域内で同定され得る。領域メチル化レベルは各領域について計算することができる。第1のメチル化レベルは第1の領域についてのものである。領域メチル化レベルのそれぞれは、各領域カットオフ値と比較され、それは領域間で同一または異なってもよい。第1の領域に対する領域カットオフ値は第1のカットオフ値である。各領域のカットオフ値は、参照メチル化レベルからの特定量(例えば、0.5)であり得、それによって、参照から有意差を有する領域のみをカウントすることができ、それは非癌対象から決定され得る。
【0207】
領域が各領域のカットオフ値を超える、メチル化レベル領域の第1の数を決定し、閾値と比較して分類を決定することができる。一実施態様では、閾値はパーセントである。第1の数を閾値と比較することは、例えば正規化プロセスの一部として、閾値と比較する前に、領域の第1の数を領域の第2の数(例えば全ての領域)で除算することを含み得る。
【0208】
上述したように、生物学的サンプル中の腫瘍DNAの分画濃度を使用して、第1のカットオフ値を計算することができる。分画濃度は単純に最小値より大きいと推定することができるが、最小値より低い分画濃度を有するサンプルは、例えば分析に適さないとしてフラグを立てることができる。最小値は、参照メチル化レベルに対する腫瘍のメチル化レベルの予想される差に基づいて決定することができる。例えば、差が0.5である場合(例えば、カットオフ値として使用される場合)、特定の腫瘍濃度はこの差を見るのに十分に高いことが必要である。
【0209】
V.CNA、グローバルメチル化、および腫瘍寄与の組み合わせ
全ゲノムバイサルファイトシークエンシングにより、全体的なメチル化状態、コピー数異常(CNA)、およびメチル化デコンボリューションによる膀胱腫瘍寄与を同時に評価できる。46人の膀胱癌患者と39人の対照において膀胱癌を検出するこれらの分析方法の能力を評価した。対照の平均値に加えて、3つの標準偏差に基づいて、正常上限を設定した。これらの基準を用いて陽性と判定された対照はなく、100%の特異度を示した。
【0210】
A.パラメータの組み合わせに対する感度と特異度の結果
図31A~31Cは、46人の膀胱癌患者および39人の対照について、低メチル化を伴う1mbビンの割合、コピー数異常を伴う1mbビンの割合、およびメチル化デコンボリューションからの膀胱腫瘍寄与の箱ひげ図をそれぞれ示す。
図31D~31Fは、低メチル化についての対応するROC曲線を示す図であり、
図31Dは
図31Aに対応するROC曲線を示し、
図31Eは
図31Bに対応するROC曲線を示し、
図31Fは
図31Cに対応するROC曲線を示す。膀胱腫瘍寄与は、組織特異的メチル化シグネチャおよび異なる組織にわたって変化する非組織特異的メチル化シグネチャを使用して導き出された。
【0211】
低メチル化を伴う1mbのビンの割合(
図31A)、CNA(
図31B)、および膀胱腫瘍寄与(
図31C)は、対照と比較して膀胱癌症例において有意に高かった(マン・ホイットニーU検定P<0.001)。正常上限として対照の平均値に加えて3つの標準偏差を使用して、どの対照も陽性と判定されなかった。同じカットオフを使用して、46の膀胱癌症例のうちの43症例が、3つのパラメータのうちの少なくとも1つを用いて同定され得る。
【0212】
有意な低メチル化を有する1mbビンの割合を使用して、71.7%の感度で膀胱癌を検出することができた(ROC AUC=0.93)(
図31D)。有意なCNAを伴う1mbビンの割合を使用して、63.0%で膀胱癌を検出することができた(ROC AUC=0.90)(
図31E)。メチル化デコンボリューションからの膀胱腫瘍寄与を用いて、78.3%の感度で膀胱癌を検出することができた(ROC AUC=0.93)(
図31F)。3つのパラメータのうちのいずれか1つが癌を示す場合、検出された癌を考慮することによって3つのパラメータを組み合わせることができる。3つ全てのパラメータを組み合わせることによって、3つのパラメータのうちの少なくとも1つについて陽性と判定された膀胱癌症例の感度は93.4%に上昇した。特異度は100%であった。3つ全てのパラメータを組み合わせることで、29症例の高悪性度または浸潤性疾患(T1以上)全てを検出できた。
【0213】
パラメータは、パラメータの任意の組み合わせが癌を示す場合、検出癌を考慮して組み合わせてもよい。いくつかの実施形態では、最小数のパラメータが癌の検出に必要とされ得る。例えば、2つ、3つ、またはそれ以上のパラメータが必要とされ得る。いくつかの実施形態は、癌を検出するために、癌を示す特定のパラメータ(例えば、CNA、低メチル化、またはデコンボリューション)を必要とし得る。表6にパラメータを組み合わせた場合の検出結果を示す。
【表6】
【0214】
これらの結果は、現在の標準治療である、尿細胞診と比較することができる。46人の膀胱癌患者のうちの42人は、日常診療の一環として、泌尿器科手術前の6ヶ月以内に1~3個の尿サンプルを尿細胞診に送った。尿細胞診が陽性であったのは42人の膀胱癌患者のうちの4人(9.5%)のみだった。尿細胞診が陽性の4症例は浸潤性(T2b-4)の高悪性度疾患であった。尿細胞診は、低メチル化、CNA、および/または膀胱腫瘍寄与を使用するよりも膀胱癌の検出において正確性が低かった。
【0215】
一例として、非浸潤性低悪性度疾患(TaLG)を有する17の膀胱癌症例を配列決定した。低悪性度疾患を検出する分析方法の能力を評価した。
【0216】
図32A、32B、および32Cは、低侵襲性(Ta)低悪性度疾患の17人の膀胱癌患者および39の対照について、低メチル化を伴う1mbビンの割合、コピー数異常を伴う1mbビンの割合、およびメチル化デコンボリューションからの膀胱腫瘍寄与の箱ひげ図をそれぞれ示す。
図32Dは、
図32Aの対応するROC曲線を示す。
図32Eは、
図32Bの対応するROC曲線を示す。
図32Fは、
図32Cの対応するROC曲線を示す。3つのパラメータのうちの少なくとも1つを使用して、非侵襲性の低悪性度疾患を有する17人の患者のうちの14人を同定することができた。
【0217】
有意な低メチル化を有する1mbビンの割合を使用して、41.1%の感度で膀胱癌を検出することができた(ROC AUC=0.89)(
図32D)。有意なCNAを有する1mbビンの割合を使用して、17.6%(ROC AUC=0.78)で膀胱癌を検出することができた(
図32E)。メチル化デコンボリューションからの膀胱腫瘍寄与を使用して、47.0%の感度で膀胱癌を検出することができた(ROC AUC=0.81)(
図32F)。3つ全てのパラメータを組み合わせることにより、3つのパラメータのうち少なくとも1つについて陽性と判定された膀胱癌症例の感度は82.4%に上昇した。特異度は100%であった。
【0218】
3つを超えるパラメータを使用してもよい。表7は、低メチル化、CNA、デコンボリューション、高メチル化、異なるカットオフを使用した1ミスマッチを使用した、および組み合わせた変異負荷の最大5つのパラメータの感度および特異度を示す。実証されたカットオフ値は、対照の平均プラス3標準偏差(SD)、および対照の平均プラス2SDである。パラメータは、「OR」(少なくとも1つのパラメータで陽性の場合は陽性判定)、または「AND」(5つのパラメータ全てで陽性の場合は陽性判定)を使用して組み合わせることができる。
【表7】
【0219】
カットオフ値として対照の平均+2SDを使用し、「OR」を使用した5つのパラメータを組み合わせて、95.7%の感度および82.1%の特異度を達成することができる。あるいは、ロジスティック回帰モデルを使用して、リーブワンアウト分析に基づいて、91.3%の感度および89.7%の特異度を達成することができる。
【0220】
リーブワンアウト分析を使用してロジスティック回帰モデルの性能を試験することができる。このような分析において、1つのサンプルがテストサンプルとして使用される。他の全てのサンプルは、ロジスティック回帰モデルに適合するためのトレーニングセットとして使用され、それによってモデルのパラメータ(例えば、係数および閾値)を取得する。次に、第2のサンプルをテストサンプルとして使用し、他の全てのサンプルを、係数を決定するためにトレーニングセットとして使用する。次に、この手順を各サンプルについて順番に繰り返す。
【0221】
いくつかの実施形態では、癌を有するカットオフ値として0.5の確率に基づくロジスティック回帰を使用して、癌を有する確率=1-1/(1+exp[-(-0.4413124*低メチル化-0.68652846*CNA-0.44981374*腫瘍寄与度+1.02332221*高メチル化+0.07711755*ミスマッチローディング+1.35436873)])。
【0222】
平均+3SDにカットオフを調整することによって、95.7%の感度および100%の特異度を得ることができる。他の実施形態では、他の分類アルゴリズム、例えば、決定木、支持ベクトルマシン、単純ベイズ分類器、K最近傍法、ランダムフォレストツリー、および他の全ての機械学習アルゴリズムを使用することができるが、これらに限らない。したがって、本明細書に記載の分析方法を使用して、低悪性度疾患を検出してもよい。
【0223】
B.CNA、全体的なメチル化、および腫瘍寄与を用いて尿サンプルを分析する方法
図33は、生物の尿サンプルを分析する方法3300を示す。生物は、本明細書に記載の任意の生物であり得る。尿サンプルは、正常細胞由来のおよび潜在的に癌に関連する細胞由来のDNAを含み得る。尿サンプル中の少なくとも一部のDNAは無細胞であり得る。
【0224】
ブロック3310において、尿サンプルからの複数のDNA分子を分析する。DNA分子を分析することは、生物のゲノム中のDNA分子の位置を同定することを含み得る。位置を特定することは、コンピュータシステムによってであってもよい。
【0225】
ブロック3320において、染色体領域が、生物の複数の染色体領域の各染色体領域についてコピー数異常またはメチル化異常の少なくとも1つの異常を示すかどうかの分類を決定する。メチル化異常は、低メチル化または高メチル化であり得る。いくつかの実施形態では、異常は低メチル化または高メチル化の一方のみを含み得る。例えば、異常は、コピー数異常または低メチル化のうちの少なくとも1つであり得る。いくつかの実施形態では、染色体領域がミスマッチの異常を示すかどうかの分類が決定される。
【0226】
ブロック3330において、分類は、同定された位置に基づいて染色体領域からのものとして尿サンプルからのDNA分子の群を同定することによって決定され得る。この群は、染色体領域の複数の遺伝子座のそれぞれに位置する少なくとも1つのDNA分子を含んでもよい。
【0227】
ブロック3340において、分類はまた、コンピュータシステム、DNA分子の群の値を用いて、計算することによって決定され得る。それぞれの値は、それぞれの群のDNA分子の性質を定義し得る。特性は、コピー数またはメチル化レベルのうちの少なくとも1つであり得る。所望により、その特性は、本明細書に記載のように、ミスマッチ変異荷重であり得る。
【0228】
ブロック3350において、分類はさらに、基準値と値を比較することによって決定され得る。基準値は、異常から正常値の間のカットオフを決定し得る。基準値は、3のzスコアに基づき得る。例えば、基準値は、それを超えるとコピー数異常とみなされるコピー数の値であってもよい。いくつかの例では、基準値は、それを超えると領域が高メチル化または低メチル化とみなされるメチル化レベルの値であってもよい。
【0229】
ブロック3360において、第1の癌のレベルは、尿サンプルについてのコピー数異常を示すと分類された染色体領域の第1の量が第1の閾値を超えるかどうかに基づいて決定され得る。第1の閾値は、癌を有すると分かっている生物を、癌を有していてもいなくてもよい生物から区別することができる。他の実施形態では、第1の閾値は、癌を有していないことが分かっている生物を、癌を有するかどうか分からない生物から区別し得る。
【0230】
ブロック3370において、第2の癌のレベルは、尿サンプルについて低メチル化または高メチル化を示すと分類された染色体領域の第2の量が第2の閾値を超えるかどうかに基づいて決定され得る。第2の閾値がコピー数の代わりにメチル化レベルに適用され得ることを除いて、第2の閾値は第1の閾値と同様であり得る。
【0231】
ブロック3380において、第3の癌のレベルは、腫瘍組織の寄与度が第3の閾値を超えるかどうかに基づいて決定され得る。方法3300は、腫瘍組織の寄与度を決定することをさらに含み得る。様々な実施形態において、寄与度は、腫瘍特異的体細胞変異、腫瘍特異的メチル化シグネチャ、腫瘍特異的断片のエンドパターン、または断片のサイズ分析(例えば、腫瘍DNAは非腫瘍DNAより統計的に長い)を用いることによって決定され得る。腫瘍特異的体細胞変異を用いて寄与度を決定することに関するさらなる詳細は、米国特許公開第2014/0100121号に記載されている。腫瘍特異的メチル化シグネチャを使用することに関するさらなる詳細は、米国特許公開第2014/0080715号および同第2016/0017319号ならびにPCT特許公開第WO2014/043763号に記載されている。腫瘍特異的断片のエンドパターンを使用することに関するさらなる詳細は、米国特許公開第2017/0024513号に記載されている。断片サイズ分析の使用に関するさらなる詳細は、米国特許公開第2016/0201142号に記載されている。これら全ての特許出願の内容は、あらゆる目的のために参照により本明細書に組み込まれる。腫瘍組織の寄与度はまた、本明細書中に記載されるデコンボリューション方法によって決定され得る。第3の閾値は、コピー数またはメチル化レベルの代わりに寄与度に適用され得ることを除いて、第1の閾値または第2の閾値のいずれかと同様であり得る。
【0232】
追加の閾値は、癌の追加のレベルであってもよい。例えば、癌のレベルは、ミスマッチを示すと分類された染色体領域の量が閾値を超えるかどうかに基づいて決定され得る。
【0233】
ブロック3390において、第1の癌のレベル、第2の癌のレベル、または第3の癌のレベルのうちの少なくとも1つが、生物が癌を有することを示す場合に、生物が癌を有すると決定され得る。少なくとも2つのレベルまたは3つのレベルが、生物が癌を有することを示す場合、生物は癌を有すると決定してもよい。癌の追加のレベルが使用されてもよい。少なくとも1つのレベルが、生物が癌を有することを示す場合、生物は癌を有すると決定され得る。いくつかの実施形態では、生物が癌を有することを全てのレベルが示す場合に、生物は癌を有すると決定され得る。他の実施形態では、50%、60%、70%、80%、または90%以上のレベルによって生物が癌を有することを示す場合に、生物が癌を有すると決定され得る。
【0234】
方法3300は、本明細書に記載の任意の様式で生物を治療することを含んでもよい。
【0235】
VI.ミスマッチおよび浅いシークエンシングを使用して腫瘍量を推定すること
1つのミスマッチを有するリードの割合を使用して、浅い深度のシーケンシングを用いて腫瘍量を推定した。これを使用して、膀胱癌症例を正常な対照と区別することができる。尿路上皮癌は体細胞変異の蓄積を特徴とする。膀胱癌は、高い体細胞変異率(メガベースあたり約8変異)を有し得る(Glaser et al.,Nat.Rev.Urol.,2017)。膀胱癌患者における膀胱腫瘍に由来する尿中cfDNAは、参照ゲノムと比較してミスマッチを示す断片の割合が増加していてもよい。参照ゲノムと比較したミスマッチは、生殖細胞系列の変動、体細胞変異、またはシークエンシングエラーが原因で起こり得る。参照ゲノムと比較してミスマッチを有するリード数を評価できるが、ヒトゲノムの1倍カバレッジ未満での全ゲノムバイサルファイトシークエンシングは、体細胞変異を正確に同定するには不十分である。膀胱癌症例および対照由来の尿中cfDNAは、一般的な生殖細胞系の変動を抱えており、それは参照ゲノムに対するミスマッチとして検出することができる。これに加えて、膀胱癌症例における体細胞変異のより高い発生率は、ヒト参照ゲノムと比較して単一のミスマッチを有するより高い割合のリードに寄与し得る。
【0236】
図34Aは、49の膀胱癌症例および39の対照において1つのミスマッチを有するリードの割合についての箱ひげ図である。箱ひげ図は、膀胱癌症例が、対照と比較して1つのミスマッチを伴うより高い割合のリードを有することを示す(マン・ホイットニーU検定P<0.001)。
図34Bは、ROC曲線が0.79のAUCを有することを示す。ミスマッチを有するリードの割合は、膀胱癌を検出するために使用され得る。
【0237】
図35は、生物の生物学的サンプルを分析する方法3500を示す。生物学的サンプルは、正常細胞および潜在的に癌に関連する細胞に由来するDNAを含んでもよい。少なくとも一部のDNAは、生物学的サンプル中で無細胞であり得る。生物学的サンプルは尿サンプルであってもよい。
【0238】
ブロック3510において、生物学的サンプルのDNA分子に対応する複数のシークエンスリードを受ける。シークエンスリードは、全ゲノムバイサルファイトシークエンシングからのものであってもよい。シークエンスリードは、1倍未満、1倍~2倍、2倍~3倍、3倍~5倍、または5倍~10倍の深さ範囲であってもよい。複数のシークエンスリードは、5,000万未満の固有マッピングリード、4,000万未満の固有マッピングリード、3,000万未満の固有マッピングリード、または2,000万未満の固有マッピングリードを含む、8,000万未満の固有マッピングリードであり得る。
【0239】
ブロック3520において、シークエンスリードのゲノム位置は、例えば本明細書に記載されているように、決定される。例えば、ゲノム位置は、参照ゲノムに基づいてコンピュータを用いて決定することができる。参照ゲノムは、集団に対する参照ゲノムまたは生物(例えば、ヒト)に対応する代表例であり得る。別の実施形態では、参照ゲノムは、その生物についての生殖系列(構成的)ゲノムを含めることによって対象に特異的であり得る。
【0240】
ブロック3530において、シークエンスリードは、参照ゲノムに対して1つのミスマッチを持つシークエンスリードを決定するために参照ゲノムと比較される。例として、ミスマッチとは、体細胞変異、シークエンシングエラー、または天然のミスマッチ(例えば、対象の生殖系列ゲノムと参照ゲノムとの違いから生じる多型)の結果であり得る。シークエンスリードごとに複数のミスマッチを使用してもよいが、ミスマッチを1つだけ使用するよりもパフォーマンスが悪くなることがある。各DNA分子は一般に100bp未満であり、短いDNA範囲内で2つ以上の真の体細胞変異を観察する確率は低い。
【0241】
ブロック3540において、パラメータは、参照ゲノムに対して1つのミスマッチを有するシークエンスリードの数に基づいて決定される。いくつかの実施形態では、シークエンスリードの数は、1つ以下のミスマッチを有するシークエンスリードのものであってもよい。他の実施形態では、シークエンスリードの数は、1つ以上のミスマッチ、例えば、2つ、3つ、またはそれ以上のミスマッチを有するシークエンスリードを含んでもよい。パラメータは、1つのミスマッチを有するシークエンスリードの正規化数であり得る。例えば、パラメータは、1つのミスマッチを有するシークエンスリードの密度、濃度、または割合であってもよい。場合によっては、パラメータは、1つのミスマッチを有するシークエンスリードの数と等しくてもよい。
【0242】
ブロック3550において、パラメータを閾値と比較する。閾値は、健康な生物についてのミスマッチに関するデータおよび/または癌を有する生物についてのミスマッチに関するデータを使用して決定され得る。例えば、閾値は、健康な生物の集団についての平均パラメータを超える1、2、または3標準偏差に設定され得る。
【0243】
ブロック3560において、癌のレベルの分類は、パラメータと閾値との比較を使用して決定される。パラメータが閾値を超える場合、癌のレベルの分類は、生物が癌を有することであり得る。本明細書に記載のように、追加の分類を使用することができる。例えば、癌のレベルの他の分類は、コピー数異常、低メチル化、高メチル化、または腫瘍寄与を使用してもよく、本明細書に記載の方法に従って決定してよい。例えば、癌を検出することは、ミスマッチに基づくもの以外のパラメータを含んでもよい。
【0244】
方法3500は、ミスマッチがシークエンスエラーであるかどうか決定することを除外してもよい。ミスマッチの理由を決定しないことによって、癌のレベルの分類を決定することは、正確さを実質的に減少させることなくより効率的であり得る。
【0245】
方法3500は、本明細書に記載の任意の技術によって癌を治療することを含んでもよい。
【0246】
VII.尿中メタゲノム解析は膀胱癌症例および対照を同定することができる
尿中細菌叢の研究は、尿路中の微生物が、尿路感染症の他に、泌尿器疾患と関連していることを提示した。ヒトゲノムにマッピングされていない配列決定されたcfDNAリードのメタゲノム解析を行った。マッピングされていないリードは、病原体に存在する1Mマーカー遺伝子の参照にマッピングされた。病原体は、約13,500の細菌性および古細菌性ゲノムならびに約3,500のウイルス性ゲノムを含み得、BSMapを用いてマッピングされ得る。サンプルあたり平均25,000個のリードをマーカー遺伝子参照にマッピングすることができた。Metaphlan2を使用して、豊富な種の表の中で異なる微生物からの寄与比率を同定した。
【0247】
図36は、3つの膀胱癌症例および5つの対照についての異なる微生物種の相対存在量を表示するヒートマップを示す。相対存在量は、特定の種にマッピングされたリード/メタゲノムデータベースにマッピングされたリード数の合計を特定の微生物のサイズ×1e9(RPKM)で割ったものとして定義できる。3つの膀胱癌症例はT188、T179、およびTBR1875であった。5つの対照はTBR532、T159、T56、T59、およびT29であった。各垂直線は単一の種を表す。色は、赤(例えば、セクション3602)が高い寄与比率、青(例えば、セクション3604)が低い寄与比率を表すように、各種についての対数存在量を表す。
図36は、膀胱癌の症例と対照を分離できることを示している。対照よりも膀胱癌症例において多かった種には、Halonotius、Thermococcus、Nitrosopumilus、およびActinomycesが含まれる。膀胱癌症例よりも対照においてより豊富な種には、BrevibacteriumおよびNocardioidesがある。その結果、ヒトゲノムにマッピングされていないcfDNAリードを使用して膀胱癌を検出することができる。
【0248】
対照と比較した膀胱癌症例において差分相対存在量を示す上位微生物としては、以下の細菌:Granulicella、Actinobaculum schaalii、Mycobacterium tuberculosis/bovis/africanum/canetti、actinobacterium、Ilumatobacter coccineus、Candidatus Koribacter、Mobiluncus curtisii、Acidimicrobium ferrooxidans、Candidatus Chloracidobacterium thermophilum、Candidatus Korarchaeum cryptofilum、Methanobacterium、Salinispora pacifica、Methanocella conradii、Brevibacterium、およびMycobacteriumが挙げられる。
【0249】
上位微生物としてはさらに、Methanoculleus,Methanocaldococcus,Methanolinea tarda,Thermoplasma volcanium,Methanosphaerula palustris,Sulfolobus acidocaldarius,Methanosphaera stadtmanae,Methanoplanus petrolearius,Methanocella arvoryzae,Methanofollis liminatans,およびMethanococcus aeolicusの古細菌が挙げられる。
【0250】
図37は、ヒトの尿サンプルを分析する方法3700を示す。尿サンプルは、正常細胞由来のおよび潜在的に癌に関連する細胞由来のDNAを含み得る。尿サンプル中の少なくとも一部のDNAは無細胞であり得る。
【0251】
ブロック3710において、尿サンプルのDNA分子に対応する複数のシークエンスリードが得られる。ブロック3710は、本明細書に記載の他のサンプルの測定ステップと類似の様式で実行することができる。
【0252】
ブロック3720において、複数のシークエンスリードのうちの各シークエンスリードについて、シークエンスリードは、コンピュータシステムによりヒト参照ゲノムに整列させることができる。シークエンスリードがヒト参照ゲノムに整列すると、シークエンスリードはヒトリードとして分類される。1回のリード当たり2つ以下のミスマッチがある場合、シークエンスリードは整列しているとみなすことができる。場合によっては、より多数のミスマッチが許容されてもよい。ヒト参照ゲノムは、尿サンプルを提供したのと同じ民族または人種の集団(例えば、東アジア、ヨーロッパ)に由来し得る。参照ゲノムは公開データベース(例えば、NCBIまたはUCSC)からのものであり得る。参照ゲノムはまた、尿サンプルが得られたヒトについてのde novoアセンブリ法であってもよい。言い換えれば、ヒトが癌に罹患していないと分かっている場合に、個人的な参照ゲノムが使用され得る。
【0253】
ブロック3730において、複数のシークエンスリードのうちの各シークエンスリードについて、シークエンスリードは、第1の病原体の種または属に対応する第1の病原体の参照ゲノムに、コンピュータシステムによって、整列させることができる。シークエンスリードが第1の病原体参照ゲノムに整列すると、シークエンスリードは第1の病原体リードとして分類される。細菌、ウイルス、および古細菌の参照ゲノムを含む複数の病原体参照ゲノムを試験することができる。使用する特定の病原体参照ゲノムは、特定の種または属の有病率、および異なる種が膀胱癌の異なる分類を示すかどうかに依存し得る。例えば、その種が全て膀胱癌を示し、有病率が比較的低い場合、その属の種由来のゲノムの相同部分から属の参照を構築することができる。
【0254】
方法3700は、病原体リードの2つ以上の異なるタイプに対応するものとしてシークエンスリードを分類することを含んでもよい。例えば、シークエンスリードは、第1の細菌の参照ゲノムに整列させることができ、第2の細菌の参照ゲノムに整列させることもできる。2つ以上の病原体参照ゲノムへのそのようなアラインメントは、異なる病原体間で相同な遺伝子から生じ得る。アラインメントおよび分類は、異なるタイプの細菌、古細菌、またはウイルスの参照ゲノムに対するものであってもよい。様々な実施形態において、シークエンスリードが複数の病原体に整列する場合、最良のアラインメントを有する病原体を選択することができる。そのシークエンスリードが複数の病原体に等しく整列する場合、シークエンスリードは廃棄されるか、各病原体に割り当てられるか、または病原体を含む属に割り当てられる。
【0255】
方法3700は、複数のシークエンスリードを複数のタイプの病原体リードに分類することを含み得る。例えば、複数のシークエンスリードのうちの第1のシークエンスリードは第1の古細菌参照ゲノムと整列して、それにより第1の病原体リードとしてシークエンスリードを分類することができ、複数のシークエンスリードのうちの第2のシークエンスリードは第2の古細菌と整列して、それにより第2の病原体リードとしてシークエンスリードを分類する。病原体参照ゲノムに整列する任意のシークエンスリードは、非ヒトリードとして分類され得る。
【0256】
ブロック3740において、方法3700は、病原体リードの量に基づいてパラメータを決定することを含んでもよい。病原体リードの量は、例えば、複数の病原体参照ゲノムに整列する二重計数シークエンスリードを含まずに、病原体参照ゲノムに整列する全てのリードの合計(例えば、第1の病原体リード、第2の病原体リード)であり得る。いくつかの実施形態では、第1の病原体リードの量は、特定の病原体参照ゲノムに整列させたシークエンスリードの量であってもよい。例として、パラメータは、第1の病原体リードのローカウント、濃度、割合、または割合であり得る。
【0257】
方法3700は、異なる病原体の参照ゲノムに整列させたリードについて、第2の病原体リードの第2の量に基づいて第2のパラメータを決定することを含んでもよい。例として、第2のパラメータは、第2の病原体リードのローカウント、濃度、割合、または割合であり得る。第2のパラメータは、第1のパラメータとして対応する方法で計算されたパラメータであってもよい。病原体参照ゲノムは、Halonotius、Thermococcus、Nitrosopumilus、Actinomyces、または本明細書に記載の任意の病原体由来のゲノムを含んでもよい。さらに、病原体参照ゲノムは、本明細書に記載の任意の病原体から任意のゲノムを除外してもよい。病原体参照ゲノムは、細菌ゲノム、ウイルスゲノム、および古細菌ゲノムを含んでもよくまたは除外してもよい。
【0258】
病原体参照ゲノムは、mycobacterium、halobacterium、actinomyces、corynebacterium、またはcandidatusのうちの少なくとも1つからの参照ゲノムを含んでもよい。参照ゲノムは、mycobacterium、halobacterium、actinomyces、corynebacterium、またはcandidatusのうちのいずれか1つ、2つ、3つ、または4つを含んでもよい。
【0259】
ブロック3750において、方法3700は、カットオフ値にパラメータを比較することを含んでもよい。いくつかのタイプのパラメータが異なるタイプの病原体リードの量に基づいて決定される場合、各タイプの量は1つ以上のカットオフ値と比較してもよい。一例として、パラメータのいくつかのタイプの各パラメータは、単一のカットオフ値と比較されてもよい。他の例では、各タイプのパラメータは、そのタイプのパラメータに特有のカットオフ値と比較される。いくつかの例では、異なるタイプのパラメータによって指定される座標を有する多次元点は、線、平面、またはより高次元の平面であり得るカットオフ値と比較され得る。カットオフ値(単数または複数)は、膀胱癌を有する参照サンプルの第1のセットおよび膀胱癌を有さない対照サンプルの第2のセットから決定されてもよい。
【0260】
ブロック3760において、方法3700は、その比較を使用して、膀胱癌のレベルの分類を決定することを含んでもよい。方法3700は、第1の病原体の量がカットオフ値を超える場合に、ヒトが膀胱癌を患っていると決定することを含んでもよい。いくつかのパラメータが異なるタイプの量の病原体リードに基づいて決定される場合、ヒトが膀胱癌を有すると決定することは、複数のパラメータが1つ以上のカットオフ値を超える場合であり得る。いくつかの実施形態では、膀胱癌は、パラメータの一定の割合(例えば、50%、60%、70%、80%、90%、または100%)が1つ以上のカットオフ値を超える場合に決定され得る。癌の重症度は、カットオフ値と比較してパラメータがどれほど高いかによって決定され得る。いくつかの実施形態では、癌の重症度は、いくつのパラメータが1つ以上のカットオフ値を超えるかによって決定されてもよい。
【0261】
方法3700は、本明細書に記載の癌のための任意の治療することを含んでもよい。場合によっては、方法3700は、尿サンプルだけでなく生物学的サンプルにも適用されてもよい。場合によっては、方法3700は、膀胱癌だけでなく、癌のレベルを決定することを含んでもよい。
【0262】
VIII.材料および方法
上記に示した特定の結果を得るために、特定の技術を以下に記載する。一例に使用されたそのような技術は、他の例にも使用することができる。
【0263】
A.移植患者のためのサンプル採取と処理
移植データは、尿サンプルを11人の腎移植患者と臨床的に安定した2人の造血幹細胞移植(HSCT)患者から採取した。尿サンプルはまた、腎結石を有する患者、および5人の膀胱癌患者から採取された。可能であれば早朝の尿サンプルは避けて、朝の来診中または手術前の朝に尿サンプルを採取した。前述したように、30~50mLの尿を単純滅菌ボトルに採取し、4℃で保存し、採取から1時間以内に処理した(12、23)。尿の無細胞部分を遠心分離および上清の濾過によって単離した。
【0264】
B.ライブラリ調製、バイサルファイト変換、および超並列DNAシークエンシング
DNAライブラリは、製造業者の説明書に従ってKAPA HTPライブラリ調製キット(Kapa Biosystems)を用いて最大500ngの尿中cfDNAで調製した(7)。75bpペアエンドモードを使用したIllumina HiSeq2500シーケンサーを使用して、バイサルファイトおよび非バイサルファイトDNAシークエンシングを前述のとおり実施した(24、25)。ベースコーリングおよび品質管理の後、データは、メチル化データ解析パイプラインMethy-Pipeにより処理された(26)。
【0265】
最大500ngの尿中cfDNAをライブラリ調製のために使用した。DNAライブラリは、メーカーの説明書に従ってKAPA HTPライブラリ調製キット(Kapa Biosystems)を用いて調製した(7)。バイサルファイトおよび非バイサルファイトDNAシークエンシングを、前述のとおり実施した(24、25)。非バイサルファイトシークエンシングは、バイサルファイトシークエンシングに十分なDNAがない場合にのみ、サイズプロファイル分析に使用された。75bpペアエンドモードを使用したIllumina HiSeq2500シーケンサーを用いて、DNAライブラリを配列決定した。塩基呼び出しの後、アダプター配列および低品質塩基(すなわち品質スコア<5)は除去された。次いで、FASTQ形式のトリミングリードは、メチル化データ解析パイプラインMethy-Pipeによって処理された(26)。尿サンプルあたり1レーンの配列決定を使用して、ヒト参照ゲノムにマッピングされた8,000万の一意的な非重複リードの中央値を得た。
【0266】
C.抽出および定量化
尿中cfDNAの抽出および定量化のために、尿中cfDNAは、前述のように抽出して定量化した(11、12、23)。ほとんどのサンプルで30~50mLの尿、最大250mLがインビトロ培養実験に必要であった。手短に言えば、新鮮な尿を簡素な無菌ボトルに採取し、アリコートをSiemens Multistix10SGシステムを用いて試験し、Roche Cobas8000を用いてクレアチニン濃度についてアッセイした。残りの尿サンプルについて、pH8(Invitrogen)で0.5モル/LのEDTAを添加して10ミリモル/Lの最終EDTA濃度にし、ヌクレアーゼ活性を阻害した(9)。EDTAはエチレンジアミン四酢酸に相当する。
【0267】
次いで、尿を10分間4℃で遠心分離し、上清を0.45μmのフィルター(Milex-GV;Millipore)を通して濾過し、無細胞成分を単離した。次いで、無細胞尿を-80℃で貯蔵するか、または直ちに抽出した。処理した尿10mLごとに、6モル/Lのグアニジンチオシアネート(Sigma-Aldrich)15mLと樹脂(Wizard Plus Minipreps DNA精製システム;Promega)1mLを加え、混合物を室温で2時間培養した。次いで、製造業者の指示のとおりに、Wizard-Plus MiniprepsDNA精製システムを用いて、樹脂-DNA複合体を単離し、洗浄し、および溶出した。採取した10mLの尿ごとに、尿中cfDNAの溶出に約100μLを使用した。
【0268】
抽出されたcfDNAは、LEP遺伝子を標的とする62bpのアンプリコンを用いてリアルタイム定量PCRを用いて定量化した(11)。絶対DNA濃度は、1.25~4000GE/μLの範囲の11点のDNA標準を用いて決定され、全ての尿中cfDNA濃度は、GE/mL尿で表される。
【0269】
次のように、末梢血白血球および組織からのゲノムDNAの抽出および定量化を行うことができる。製造業者のプロトコルに従って、Quagen DNA Blood Mini Kitを使用してバフィーコートサンプルを処理し、Qiagen DNA Mini Kitを使用して組織サンプルを処理した。
【0270】
D.SNPアレイを用いたドナーおよびレシピエント特異的遺伝子型の判定
全ての腎移植およびHSCT患者のために、約250万のドナーとレシピエントのSNPを、メーカーのプロトコルに従って、Illumina Omni2.5SNPアレイを使用して検索した。ドナーおよびレシピエント生殖細胞系DNAは、バッフィーコート、口腔スワブ、または腎臓組織のいずれかから得た。これにより、移植症例ごとにドナーおよびレシピエントに固有のSNPを特定することができた。ドナーおよびレシピエント特異的対立遺伝子の知識を超並列シークエンシングの結果と組み合わせて使用して、尿中のドナーおよびレシピエント特異的cfDNA断片の割合を正確に確かめることが可能になった。
【0271】
E.尿中DNA組織マッピングのためのメチル化マーカーとしてのメチル化可変領域の同定。
異なるヒト組織由来の全ゲノムバイサルファイトシークエンシングデータを用いて、メチル化デコンボリューション用の参照メチロームを構築した。正常サンプル中の尿中cfDNAの主要原因は、血球(血漿cfDNAの主要成分であり、腎臓後系でも放出される可能性がある)、腎臓、および尿路全体を覆った尿路上皮であろうと仮定した。好中球、B細胞、およびT細胞のための全ゲノムバイサルファイトシークエンシングデータは、公的に利用可能なリソース(Human Epigenome Atlas、www.genboree.org/epigenomeatlas/index.rhtml)、(28)から入手した。この研究を始めたとき、腎臓または尿路上皮に関して利用可能な全ゲノムのメチル化データはなかった。したがって、死体の腎移植症例由来の組織ならびに腎尿管摘出術および根治的膀胱摘出術を受けている患者由来の隣接正常組織を得ることによって独自の参照メチロームを構築した。腎臓参照は、6人の患者から得られた、皮質および髄質の腎臓組織からのバイサルファイトシークエンシングデータを使用して編集され、35倍の一倍体ゲノムカバレッジに配列決定された。尿路上皮参照は、40倍の一倍体ゲノムカバレッジに配列決定された6人の患者の尿管および膀胱から得られた尿路上皮を含む。膀胱癌参照は、根治的膀胱摘出術中に得られ、8.5倍の一倍体ゲノムカバレッジに配列決定された膀胱腫瘍に基づいた。
【0272】
前述のように、メチル化マーカーを選択した(22)。常染色体のCpGアイランドとショアを重ならない500bp単位に細分し、各単位のメチル化密度を各参照組織について決定した。メチル化可変領域を使用して、I型およびII型マーカーを同定した。I型マーカーは、他の全ての参照組織の平均レベルと比較して、1つの組織において3SD高いまたは低いメチル化密度を有する任意のゲノム遺伝子座を指す。II型マーカーは、全ての組織型にわたって非常に変動しやすいメチル化密度を示したゲノム遺伝子座であった。(A)最も高メチル化された組織のメチル化密度が最も低メチル化された組織のメチル化密度よりも少なくとも20%高い場合、および(B)群の平均メチル化密度(すなわち、変動係数)で割ったときの全組織型にわたるメチル化密度のSDが少なくとも0.25であった場合に、遺伝子座は非常に変動しやすいと考えられた。
【0273】
F.尿中cfDNA中の異なる組織の寄与比率を判定するためのメチル化デコンボリューション
メチル化デコンボリューションの目的は、尿中cfDNA内の各組織の寄与比率を決定することであった。サンらにより記載されたようにメチル化デコンボリューションを行った(22)。簡潔に言うと、特定のマーカーで観察されたメチル化密度は、各組織からの寄与比率、および各組織中のそのマーカーのメチル化密度によって影響を受けた。
【0274】
二次プログラミング(39)を使用して連立方程式を解いた。I型およびII型マーカー(合計19418マーカー)の組み合わせリスト上の各メチル化マーカーについての組織パネルおよびそれらに対応するメチル化密度を含むマトリックスをまとめた。参照メチロームは腎臓、尿路上皮、好中球、およびリンパ球からなり、全ての組織からの寄与比率は100%になる。これらの組織型は、尿路上皮以外に、それぞれ腎移植またはHSCTによって検証可能であることから、選択された。膀胱癌患者の術前および術後の尿サンプルを評価する際に、膀胱癌および小腸メチローム由来のメチル化マーカーを参照セットに加えた。
【0275】
G.尿中cfDNAの低メチル化およびコピー数異常の同定
ゲノム全体のメチル化密度および1Mbビンによるコピー数は、8人の正常対照からの尿中cfDNAデータを用いて決定された。メチル化密度またはコピー数の有意な増加または減少は、正常対照の平均と比較して3を超えるzスコアとして定義された。全体的なメチル化密度およびコピー数変化は、circosプロットを使用して表した(35)。
【0276】
IX.実施例システム
図38は、本発明の一実施形態によるシステム3800を示す。示されたシステムは、サンプルホルダ3810内の無細胞DNA分子などのサンプル3805を含み、サンプル3805はアッセイ3808と接触して物理的特徴3815の信号を提供することができる。サンプルホルダの例は、アッセイのプローブおよび/もしくはプライマー、または液滴が(アッセイを含む液滴と共に)移動するチューブを含むフローセルであり得る。サンプルからの蛍光強度値などの物理的特徴3815は、検出器3820によって検出される。検出器は、データ信号を構成するデータ点を得るために、間隔(例えば、周期的な間隔)を空けて測定を行うことができる。一実施形態では、アナログデジタル変換器は、検出器からのアナログ信号をデジタル形式へと複数回変換する。データ信号3825は、検出器3820から論理システム3830へ送信される。データ信号3825は、ローカルメモリ3835、外部メモリ3840、または記憶装置3845に保存することができる。
【0277】
論理システム3830は、コンピュータシステム、ASIC、マイクロプロセッサなどであってもよいかまたは含んでもよい。それは、ディスプレイ(例えば、モニター、LEDディスプレイなど)およびユーザ入力装置(例えば、マウス、キーボード、ボタンなど)を含むこともでき、またはこれらに連結されることもできる。論理システム3830および他の構成要素は、スタンドアローンもしくはネットワーク接続されたコンピュータシステムの一部であってもよく、またはサーマルサイクラー装置に直接取り付けられてもよいか、もしくは組み込まれてもよい。論理システム3830は、処理装置3850において実行する最適化ソフトウェアを含むこともできる。
【0278】
本明細書で言及されるコンピュータシステムはいずれも、任意の適切な数のサブシステムを利用してもよい。このようなサブシステムの例は、コンピュータシステム10の
図39に示されている。いくつかの実施形態において、コンピュータシステムは単一のコンピュータ装置を含み、サブシステムはこのコンピュータ装置の構成要素であり得る。他の実施形態では、コンピュータシステムは、それぞれがサブシステムであり、内部構成要素を備えた複数のコンピュータ装置を含むことができる。コンピュータシステムは、デスクトップコンピュータおよびラップトップコンピュータ、タブレット、携帯電話、ならびに他の携帯装置を含むことができる。
【0279】
図39に示すサブシステムは、システムバス75を介して相互接続される。プリンタ74、キーボード78、記憶装置(複数可)79、ディスプレイアダプタ82へ連結されるモニター76、およびその他などの追加のサブシステムが示されている。I/Oコントローラ71へ連結する周辺機器および入出力(I/O)装置は、入出力(I/O)ポート77(例えば、USB、FireWire(登録商標))など、当該技術分野で既知の任意の数の手段によって、コンピュータシステムへ接続することができる。例えば、I/Oポート77または外部インターフェース81(例えば、Ethernet、Wi-Fiなど)を使用して、Internetなどの広域ネットワーク、マウス入力装置、またはスキャナへ、コンピュータシステム10を接続することができる。システムバス75を介した相互接続は、中央処理装置73が各サブシステムと通信し、システムメモリ72または記憶装置(複数可)79(例えば、ハードドライブまたは光ディスクなどの固定ディスク)からの複数の命令の実行、およびサブシステム間の情報交換を制御することを可能にする。システムメモリ72および/または記憶装置(複数可)79は、コンピュータ可読媒体を具現化してもよい。別のサブシステムは、カメラ、マイクロホン、および加速度計、ならびにこれらに類するものなどのデータ収集装置85である。本明細書に言及されるデータのうちのいずれも、ある構成要素から別の構成要素へ出力することができ、ユーザに対して出力することができる。
【0280】
コンピュータシステムは、内部インターフェースによって、または1つの構成要素から別の構成要素に接続して取り外し可能な記憶装置を介して、例えば外部インターフェース81によって互いに接続された、複数の同一構成要素またはサブシステムを含むことができる。いくつかの実施形態では、コンピュータシステム、サブシステム、または装置は、ネットワーク上で通信することができる。このような例において、1つのコンピュータをクライアント、別のコンピュータをサーバとみなすことができ、これらは各々、同一のコンピュータシステムの一部であり得る。クライアントおよびサーバは各々、複数のシステム、サブシステム、または構成要素を含むことができる。
【0281】
実施形態の態様は、ハードウェア(例えば、アプリケーション特異的集積回路またはフィールドプログラマブルゲートアレイ)を使用して、および/またはモジュール式もしくは統合様式で概してプログラム可能な処理装置と共にコンピュータソフトウェアを使用して、制御論理の形態で実装することができる。本明細書で使用する場合、処理装置は、シングルコア処理装置、同一の集積チップ上のマルチコア処理装置、または回路基板上もしくはネットワーク化された複数の処理ユニットを含む。本開示および本明細書に提供される教示に基づいて、当業者は、ハードウェアを用いておよびハードウェアとソフトウェアとを併用して、本発明の実施形態を実施するための他のやりかたおよび/または方法を知り、認識することになっている。
【0282】
本出願に記載されるソフトウェア構成要素または関数のうちのいずれも、例えば、Java、C、C++、C#、Objective-C、Swiftなどの何らかの適切なコンピュータ言語、または例えば、従来の技術もしくはオブジェクト指向の技術を使用するPerlもしくはPythonなどのスクリプト言語を使用する、処理装置によって実行されるソフトウェアコードとして実装されてもよい。ソフトウェアコードは、記憶および/または伝送のためのコンピュータ可読媒体上に一連の命令またはコマンドとして保存することができる。適切な非一過性コンピュータ可読媒体は、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、磁気媒体(ハードドライブもしくはフロッピーディスクなど)、または光学媒体(コンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)など)、およびフラッシュメモリなどを含むことができる。コンピュータ可読媒体は、このような記憶装置または伝送装置の任意の組み合わせであってもよい。
【0283】
このようなプログラムはまた、コードされ、インターネットを含む種々のプロトコルに従う有線ネットワーク、光ネットワーク、および/または無線ネットワークを介した伝送に適合した搬送波信号を使用して、伝送されてもよい。このようなものとして、コンピュータ可読媒体は、このようなプログラムでコードされたデータ信号を用いて生成されてもよい。プログラムコードでコードされたコンピュータ可読媒体は、互換性のある装置でパッケージ化されていても、または(例えば、インターネットダウンロードを介して)他の装置とは別個に提供されてもよい。いずれのこのようなコンピュータ可読媒体も、単一のコンピュータ製品(例えば、ハードドライブ、CD、またはコンピュータシステム全体)の上または内部に存在してもよく、システムまたはネットワーク内の異なるコンピュータ製品上またはその内部に存在してもよい。コンピュータシステムは、モニター、プリンタ、または本明細書に記載の結果のうちのいずれかをユーザへ提供するための他の適切なディスプレイを含み得る。
【0284】
本明細書記載の方法のうちのいずれも、全体的または部分的に、ステップを実行するように構成され得る1つ以上の処理装置を含むコンピュータシステムを用いて実施することができる。したがって、実施形態は、本明細書に説明される方法のうちのいずれかのステップを実行するように構成されたコンピュータシステムを対象とし得、潜在的には異なる構成要素がそれぞれのステップまたはそれぞれのステップ群を実行する。番号付けされたステップとして提示されるものの、本明細書の方法のステップは、同時にまたは異なる順序で実行することができる。加えて、これらのステップの部分が、他の方法の他のステップの部分と併用されてもよい。また、ステップの全部または部分は任意であってもよい。さらに、いずれの方法のうちのステップのいずれも、モジュール、ユニット、回路、またはこれらのステップを実施するための他の手段で実施することができる。
【0285】
特定の実施形態の具体的な詳細は、本発明の実施形態の趣旨および範囲から逸脱することなく、任意の適切な様式で組み合わせることができる。しかしながら、本発明の他の実施形態は、各個々の態様、またはこれらの個々の態様の具体的な組み合わせに関する具体的な実施形態に向けられ得る。
【0286】
本発明の例となる実施形態に関する先の説明は、図示および説明の目的で提示されている。徹底的であること、または本発明を説明された正確な形態に限定することは意図されず、多くの修正および変更が、先の教示に鑑みて可能である。
【0287】
前述の説明では、説明の目的のために、多くの詳細が、本技術の様々な実施形態の理解を提供するために記載されている。しかしながら、特定の実施形態がこれら一部の詳細なしで、または追加の詳細と共に実施され得ることは当業者には明らかであろう。
【0288】
いくつかの実施形態を説明したが、様々な修正、代替構成、および均等物は、本発明の趣旨から逸脱することなく使用されてもよいことが当業者によって認識されるであろう。さらに、本発明を不必要に曖昧にすることを避けるために、いくつかの周知のプロセスおよび要素は記載されていない。さらに、任意の特定の実施形態の詳細は、その実施形態の変形形態に必ずしも存在するとは限らず、または他の実施形態に追加されてもよい。
【0289】
値の範囲が提供される場合、各介在値はまた、下限の単位の10分の1まで、文脈上明確に指示されていない限り、その範囲の上限と下限との間で、具体的に開示されていると理解されている。記載範囲内の任意の記載値または介在値と、その記載範囲内の任意の他の記載値または介在値との間の各狭い範囲が包含される。これらのより狭い範囲の上限および下限は、独立してその範囲に含まれてもまたは除外されてもよく、より狭い範囲に、上限および下限のいずれかを含む、上限も下限も含まない、または上限および下限の両方を含む各範囲もまた本発明に包含され、記載範囲内の任意の具体的な除外される限界値に従うものとする。記載された範囲が限界の一方または両方を含む場合、それらの含まれた限界の一方またはその両方を除外した範囲も含まれる。
【0290】
「a」、「an」または「the」の記述は、それとは反対に具体的に示されない限り、「1つ以上」を意味することが意図される。「または」の使用は、それとは反対に具体的に示されない限り、「を除いてまたは」ではなく「を含んでまたは」を意味することが意図される。「第1」の構成要素への参照は、第2の構成要素が提供されることを必ずしも必要としない。そのうえ、「第1」または「第2」の構成要素への参照は、明示的に述べられていない限り、参照される構成要素を特定の場所に限定するものではない。用語「~に基づいて」は、「少なくとも一部に基づいて」を意味することを意図している。
【0291】
本明細書に言及される特許、特許出願、刊行物、および明細書は全て、それらの全体が全ての目的のために参照により組み込まれる。いかなるものも、先行技術であるとは認められていない。
X.参照
1.Stroun M,Maurice P,Vasioukhin V,Lyautey J,Lederrey C,Lefort F,et al.The origin and mechanism of circulating DNA.Ann NY Acad Sci 2000;906:161-8.
2.Lo YM,Corbetta N,Chamberlain PF,Rai V,Sargent IL,Redman CW,et al.Presence of fetal DNA in maternal plasma and serum Lancet 1997;350:485-7.
3.Chen XQ,Stroun M,Magnenat JL,Nicod LP,Kurt AM,Lyautey J,et al.Microsatellite alterations in plasma DNA of small cell lung cancer patients Nat Med 1996;2:1033-5.
4.Lo YM,Tein MS,Pang CC,Yeung CK,Tong KL,Hjelm NM Presence of donor-specific DNA in plasma of kidney and liver-transplant recipients.Lancet 1998;351:1329-30.
5.Chiu RWK,Chan KCA,Gao Y,Lau VYM,Zheng W,Leung TY,et al.Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma.Proc Natl Acad Sci USA 2008;105:20458-63.
6.Leary RJ,Sausen M,Kinde I,Papadopoulos N,Carpten JD,Craig D,et al.Detection of chromosomal alterations in the circulation of cancer patients with whole-genome sequencing.Sci Transl Med 2012;4:162ra154.
7.Chan KCA,Jiang P,Chan CWM,Sun K,Wong J,Hui EP,et al.Noninvasive detection of cancer-associated genome-wide hypomethylation and copy number aberrations by plasma DNA bisulfite sequencing.Proc Natl Acad Sci USA 2013;110:18761-8.
8.De Vlaminck I,Valantine HA,Snyder TM,Strehl C,Cohen G,Luikart H,et al.Circulating cell-free DNA enables noninvasive diagnosis of heart transplant rejection.Sci Transl Med 2014;6:241ra77.
9.Botezatu I,Serdyuk O,Potapova G,Shelepov V,Alechina R,Molyaka Y,et al.Genetic analysis of DNA excreted in urine:a new approach for detecting specific genomic DNA sequences from cells dying in an organism.Clin Chem 2000;46:1078-84.
10.Al-Yatama MK,Mustafa AS,Ali S,Abraham S,Khan Z,Khaja N.Detection of Y chromosome-specific DNA in the plasma and urine of pregnant women using nested polymerase chain reaction.Prenat Diagn 2001;21:399-402.
11.Tsui NBY,Jiang P,Chow KCK,Su X,Leung TY,Sun H,et al.High resolution size analysis of fetal DNA in the urine of pregnant women by paired-end massively parallel sequencing.PLoS One 2012;7:e48319.
12.Hung ECW,Shing TKF,Chim SSC,Yeung PC,Chan RWY,Chik KW,et al.Presence of donor-derived DNA and cells in the urine of sex-mismatched hematopoietic stem cell transplant recipients:implication for the transrenal hypothesis.Clin Chem 2009;55:715-22.
13.Su Y-H,Wang M,Brenner DE,Norton PA,Block TM.Detection of mutated K-ras DNA in urine,plasma,and serum of patients with colorectal carcinoma or adenomatous polyps.Ann N Y Acad Sci 2008;1137:197-206.
14.Chan KCA,Leung SF,Yeung SW,Chan ATC,Lo YMD.Quantitative analysis of the transrenal excretion of circulating EBV DNA in nasopharyngeal carcinoma patients.Clin Cancer Res 2008;14:4809-13.
15.Zhang J,Tong K-L,Li PKT,Chan AYW,Yeung C-K,Pang CCP,et al.Presence of Donor-and Recipient-derived DNA in Cell-free Urine Samples of Renal Transplantation Recipients:Urinary DNA Chimerism.Clin Chem 1999;45:1741-6.
16.Szarvas T,Kovalszky I,Bedi K,Szendroi A,Majoros A,Riesz P,et al.Deletion analysis of tumor and urinary DNA to detect bladder cancer:urine supernatant versus urine sediment.Oncol Rep 2007;18:405-9.
17.Birkenkamp-Demtroder K,Nordentoft I,Christensen E,Hoyer S,Reinert T,Vang S,et al.Genomic Alterations in Liquid Biopsies from Patients with Bladder Cancer.Eur Urol 2016;70:75-82.
18.Li Y,Zhong XY,Kang A,Troeger C,Holzgreve W,Hahn S.Inability to detect cell free fetal DNA in the urine of normal pregnant women nor in those affected by preeclampsia associated HELLP syndrome.J Soc Gynecol Investig.2003;10:503-8.
19.Fernandez AF,Assenov Y,Martin-Subero JI,Balint B,Siebert R,Taniguchi H,et al.A DNA methylation fingerprint of 1628 human samples.Genome Res 2012;22:407-19.
20.Consortium RE,Kundaje A,Meuleman W,Ernst J,Bilenky M,Yen A,et al.Integrative analysis of 111 reference human epigenomes.Nature 2015;518:317-30.
21.Houseman EA,Accomando WP,Koestler DC,Christensen BC,Marsit CJ,Nelson HH,et al.DNA methylation arrays as surrogate measures of cell mixture distribution.BMC Bioinformatics 2012;13:86.
22.Sun K,Jiang P,Chan KCA,Wong J,Cheng YKY,Liang RHS,et al.Plasma DNA tissue mapping by genome-wide methylation sequencing for noninvasive prenatal,cancer,and transplantation assessments.Proc Natl Acad Sci USA 2015;112:E5503-12.
23.Yu SCY,Lee SWY,Jiang P,Leung TY,Chan KCA,Chiu RWK,et al.High-resolution profiling of fetal DNA clearance from maternal plasma by massively parallel sequencing.Clin Chem 2013;59:1228-37.
24.Chan KCA,Jiang P,Zheng YWL,Liao GJW,Sun H,Wong J,et al.Cancer genome scanning in plasma:detection of tumor-associated copy number aberrations,single-nucleotide variants,and tumoral heterogeneity by massively parallel sequencing.Clin Chem 2013;59:211-24.
25.Lun FMF,Chiu RWK,Sun K,Leung TY,Jiang P,Chan KCA,et al.Noninvasive prenatal methylomic analysis by genomewide bisulfite sequencing of maternal plasma DNA.Clin Chem 2013;59:1583-94.
26.Jiang P,Sun K,Lun FMF,Guo AM,Wang H,Chan KCA,et al.Methy-Pipe:an integrated bioinformatics pipeline for whole genome bisulfite sequencing data analysis.PLoS One 2014;9:e100360.
27.Lui YYN,Chik KW,Chiu RWK,Ho CY,Lam CWK,Lo YMD.Predominant hematopoietic origin of cell-free dna in plasma and serum after sex-mismatched bone marrow transplantation.Clin Chem 2002;48:421-7.
28.Hodges E,Molaro A,Dos Santos CO,Thekkat P,Song Q,Uren PJ,et al.Directional DNA methylation changes and complex intermediate states accompany lineage specificity in the adult hematopoietic compartment.Mol Cell 2011;44:17-28.
29.Ito K,Minamiura N,Yamamoto T.Human urine DNase I:immunological identity with human pancreatic DNase I,and enzymic and proteochemical properties of the enzyme.J Biochem 1984;95:1399-406.
30.Nadano D,Yasuda T,Kishi K.Measurement of deoxyribonuclease I activity in human tissues and body fluids by a single radial enzyme-diffusion method.Clin Chem 1993;39:448-52.
31.Jiang P,Chan CWM,Chan KCA,Cheng SH,Wong J,Wong VW-S,et al.Lengthening and shortening of plasma DNA in hepatocellular carcinoma patients.Proc Natl Acad Sci USA 2015;112:E1317-25.
32.Underhill HR,Kitzman JO,Hellwig S,Welker NC,Daza R,Baker DN,et al.Fragment Length of Circulating Tumor DNA.PLoS Genet 2016;12:e1006162.
33.Feinberg AP,Vogelstein B.Hypomethylation distinguishes genes of some human cancers from their normal counterparts.Nature 1983;301:89-92.
34.Beroukhim R,Mermel CH,Porter D,Wei G,Raychaudhuri S,Donovan J,et al.The landscape of somatic copy-number alteration across human cancers.Nature 2010;463:899-905.
35.Krzywinski M,Schein J,Birol I,Connors J,Gascoyne R,Horsman D,et al.Circos:an information aesthetic for comparative genomics.Genome Res 2009;19:1639-45.
36.Lo YMD,Chan KCA,Sun H,Chen EZ,Jiang P,Lun FMF,et al.Maternal plasma DNA sequencing reveals the genome-wide genetic and mutational profile of the fetus.Sci Transl Med 2010;2:61ra91.
37.Snyder MW,Kircher M,Hill AJ,Daza RM,Shendure J.Cell-free DNA Comprises an In Vivo Nucleosome Footprint that Informs Its Tissues-Of-Origin.Cell 2016;164:57-68.
38.The Cancer Genome Atlas Research Network.Comprehensive molecular characterization of urothelial bladder carcinoma.Nature 2014;507:315-22.
39.Meersche K Van den,Soetaert K,Oevelen D Van.xsample():An R Function for Sampling Linear Inverse Problems.J Stat Softw 2009;30:1-15.
【手続補正書】
【提出日】2022-01-27
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
生物の生物学的サンプルを分析する方法であって、前記生物学的サンプルが尿サンプルであり、前記生物学的サンプルが複数の組織型からの無細胞DNA分子の混合物を含み、前記方法が、
Nが10以上の整数である、N個のゲノム部位を同定することと、
M個の組織型のそれぞれについて、
前記N個のゲノム部位でN個の組織特異的メチル化レベルを得ること、ここでNがM以上であり、前記組織特異的メチル化レベルがN×Mの寸法のマトリックスAを形成し、前記M個の組織型のうちの1つが第1の臓器の第1の疾患に対応する第1の罹患組織型に対応し、ここで前記第1の罹患組織型が、癌性の尿路上皮細胞であり、ここで前記M個の組織型の第2の組織型が通常の尿路上皮であり、そしてここで前記M個の組織型の第3の組織型が、第1の臓器の第2の疾患に対応する第2の罹患組織型であり;
コンピュータシステムによって、前記生物学的サンプルからの複数の無細胞DNA分子を分析することであって、前記複数の無細胞DNA分子が少なくとも1,000個の無細胞DNA分子であり、前記無細胞DNA分子を分析することが、以下の:
前記生物に対応する参照ゲノム中の前記無細胞DNA分子の位置を同定することを含む、分析することと、 前記N個のゲノム部位のうちのいずれか1つにそれぞれ位置する前記複数の無細胞DNA分子のセットを同定することと、
前記複数の無細胞DNA分子の前記セットを用いて、前記N個のゲノム部位のN個の混合物メチル化レベルを測定することと、
前記M個の組織型それぞれの前記N個の混合物メチル化レベルおよび前記N個の組織特異的メチル化レベルを使用して、前記コンピュータシステムによって、前記混合物中の前記第1の罹患組織型の第1の寄与度を決定することと、
前記生物内の前記第1の臓器の前記第1の疾患のレベルを決定するために、前記第1の罹患組織型の前記第1の寄与度を使用することと、を含む、方法。
【請求項2】
前記方法が、
前記M個の組織型それぞれの前記N個の混合物メチル化レベルおよび前記N個の組織特異的メチル化レベルを使用して、前記コンピュータシステムによって、前記混合物中の前記第2の罹患組織型の第2の寄与度を決定することと、
前記生物内の前記第1の臓器についての前記第2の疾患のレベルを決定するために、前記第2の罹患組織型の前記第2の寄与度を使用することと、をさらに含む、請求項1に記載の方法。
【請求項3】
前記M個の組織型のうちの第4の組織型が、第2の臓器の第3の疾患に対応する第3の罹患組織型に対応し、前記方法が、
前記M個の組織型それぞれの前記N個の混合物メチル化レベルおよび前記N個の組織特異的メチル化レベルを使用して、前記コンピュータシステムによって、前記混合物中の前記第2の罹患組織型の第2の寄与度を決定することと、
前記生物内の前記第2の臓器についての前記第3の疾患のレベルを決定するために、前記第3の罹患組織型の前記第2の寄与度を使用することと、をさらに含む、請求項1に記載の方法。
【請求項4】
前記第1の臓器が膀胱である、請求項1に記載の方法。
【請求項5】
前記第1の疾患が、膀胱癌である、請求項4に記載の方法。
【請求項6】
前記第1の疾患のレベルが、当該膀胱癌が存在することである、請求項5に記載の方法。
【請求項7】
前記第1の疾患が癌である、請求項1に記載の方法。
【請求項8】
前記第1の疾患のレベルが、当該癌が存在することである、請求項7に記載の方法。
【請求項9】
前記方法が、
エチレンジアミン四酢酸(EDTA)を添加することによって前記尿サンプルを調製すること、をさらに含む、請求項1に記載の方法。
【請求項10】
前記生物学的サンプル中の無細胞DNAおよび細胞DNAの寄与比率を決定することをさらに含む、請求項1に記載の方法。
【請求項11】
前記N個のゲノム部位が閾値量未満の個体間変動を有する部位を含む、請求項1に記載の方法。
【請求項12】
前記M個の組織型が、腎臓、好中球、B細胞、およびT細胞を含む、請求項1に記載の方法。
【請求項13】
前記M個の組織型が、小腸を含む、請求項1に記載の方法。
【請求項14】
前記N個のゲノム部位が、腫瘍尿路上皮生検の特定の割合で生じる示差的メチル化領域において生じる領域内の部位を含む、請求項1に記載の方法。
【請求項15】
生物の第1の臓器についての第1の疾患のレベルを決定するため、第1疾患組織型の第1の寄与度を使用することが、第1の寄与度をカットオフ値と比較することを含む、請求項1に記載の方法。
【請求項16】
前記M個の組織型が、第2の臓器の第1の疾患に対応する第3の罹患組織型に対応し、ここで前記第2の臓器が第1の臓器ではない、請求項1に記載の方法。
【請求項17】
前記第2の臓器が腎臓であり、そして前記第2の臓器の第1の疾患が、糸球体腎炎またはネフローゼ症候群である、請求項1に記載の方法。
【請求項18】
前記第1の疾患が、非筋肉侵襲性癌であり、そして第2疾患が筋肉侵襲性癌である、請求項1に記載の方法。
【請求項19】
請求項1~18のいずれか一項に記載の方法を実行するためのコンピュータシステムを制御するための複数の指令を格納するコンピュータ読み取り可能媒体を含むコンピュータ製品。
【請求項20】
請求項19に記載のコンピュータ製品と;
前記コンピュータ読み取り可能媒体に格納された指示を実行するための1又は複数のプロセッサを含む、システム。
【請求項21】
請求項1~18のいずれか一項に記載の方法を実行する手段を含むシステム。
【請求項22】
請求項1~18のいずれか一項に記載の方法を実行するように構成されたシステム。
【請求項23】
請求項1~18のいずれか一項に記載の方法のいずれかのステップをそれぞれ実行するモジュールを備えるシステム。
【外国語明細書】