特表2024-538724 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ファウンデーション・メディシン・インコーポレイテッドの特許一覧

特表2024-538724コピー数変化の自動呼び出しのための方法及びシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-10-23

(54)【発明の名称】コピー数変化の自動呼び出しのための方法及びシステム

(51)【国際特許分類】

C12Q 1/6809 20180101AFI20241016BHJP

C12Q 1/6874 20180101ALI20241016BHJP

C12Q 1/6883 20180101ALI20241016BHJP

C12Q 1/6886 20180101ALI20241016BHJP

【ＦＩ】

C12Q1/6809 Z

C12Q1/6874 Z

C12Q1/6883 Z

C12Q1/6886 Z

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2024521087

(86)(22)【出願日】2022-10-07

(85)【翻訳文提出日】2024-05-08

(86)【国際出願番号】 US2022077764

(87)【国際公開番号】W WO2023060236

(87)【国際公開日】2023-04-13

(31)【優先権主張番号】63/253,907

(32)【優先日】2021-10-08

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＪＡＶＡ

２．ＰＹＴＨＯＮ

(71)【出願人】

【識別番号】517192663

【氏名又は名称】ファウンデーション・メディシン・インコーポレイテッド

(74)【代理人】

【識別番号】110002077

【氏名又は名称】園田・小林弁理士法人

(72)【発明者】

【氏名】フェンドラー，バーナード

(72)【発明者】

【氏名】ヒューズ，ジェーソンディー．

【テーマコード（参考）】

4B063

【Ｆターム（参考）】

4B063QA11

4B063QA13

4B063QA17

4B063QA19

4B063QQ02

4B063QQ12

4B063QQ42

4B063QQ43

4B063QQ58

4B063QR32

4B063QR40

4B063QR80

4B063QS39

4B063QX02

(57)【要約】

コピー数変化（ＣＮＡ）の自動呼び出しのための方法及びシステムが説明される。方法及びシステムは、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、配列決定ベースのカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルデータを利用して、遺伝子座の増幅及び欠失を検出し、いくつかの閾値及びフィルタを適用して、プロセスマッチド対照及び配列決定データの手動キュレーションの必要性を排除しつつ、改善された信頼性を有するＣＮＡの自動呼び出しを提供する。
【選択図】図１

【特許請求の範囲】

【請求項1】

コピー数変化の自動呼び出しのための方法であって、
１つ以上のプロセッサで、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードに対する配列リードデータを受信することと、前記配列リードデータに基づいて、
前記１つ以上のプロセッサを使用して、前記１つ以上のサブゲノム区間内の前記１つ以上の遺伝子座に対する、前記試料の倍数性、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルを決定することと、
前記１つ以上のプロセッサを使用して、前記セグメント化データに基づいて、複数のセグメントを識別することと、
前記１つ以上のプロセッサを使用して、少なくとも前記カバレッジ比データ、前記対立遺伝子画分データ、前記セグメント化データ、及び前記コピー数モデルに基づいて、前記複数のセグメントに対するコピー数を決定することと、
前記１つ以上のプロセッサを使用して、前記複数のセグメントの対応するセグメントの前記コピー数に基づいて、前記１つ以上の遺伝子座のうちの遺伝子座に対する増幅又は欠失の存在を検出することと、
前記１つ以上のプロセッサを使用して、前記１つ以上の遺伝子座に対する前記検出された増幅及び欠失に基づいて、前記１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を含む、方法。

【請求項2】

前記１つ以上の遺伝子座のうちの遺伝子座について検出された増幅及び欠失の任意の重複を併合することを更に含む、請求項１に記載の方法。

【請求項3】

前記１つ以上の遺伝子座に対する前記呼び出されたコピー数変化を含むレポートを生成することを更に含む、請求項１に記載の方法。

【請求項4】

前記１つ以上の遺伝子座に対する前記呼び出されたコピー数変化に基づいて、前記対象に対するゲノムプロファイルを生成することを更に含む、請求項１に記載の方法。

【請求項5】

前記カバレッジ比データが、前記試料中及び前記対照試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを参照ゲノムにアラインメントすることと、前記試料中及び前記対照試料中の前記１つ以上のサブゲノム区間内の前記１つ以上の遺伝子座の各々と重複する配列リードの数を決定することと、によって決定される、請求項１に記載の方法。

【請求項6】

前記対照試料が、一対の正常試料、プロセスマッチド対照試料、又はパネルオブノーマル対照試料である、請求項５に記載の方法。

【請求項7】

前記対立遺伝子画分データが、前記試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを参照ゲノムにアラインメントすることと、前記１つ以上の遺伝子座のうちの遺伝子座に存在する対立遺伝子の数を検出することと、前記遺伝子座に存在する前記対立遺伝子のうちの少なくとも１つに対する対立遺伝子画分を決定することと、によって決定される、請求項１に記載の方法。

【請求項8】

前記セグメント化データが、
前記試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを参照ゲノムにアラインメントすることと、
枝刈り厳密線形時間（ＰＥＬＴ）法を使用して、前記アラインメントされた配列リードデータ、カバレッジ比データ、及び対立遺伝子画分データを処理して、前記アラインメントされた配列リードデータを考慮することを必要とするセグメントの数を決定することであって、各セグメントが、同じコピー数を有する、決定することと、によって生成される、請求項１に記載の方法。

【請求項9】

前記コピー数モデルが、前記カバレッジ比データ及び対立遺伝子画分データに基づいて、前記１つ以上の遺伝子座に対するコピー数を予測する、請求項１に記載の方法。

【請求項10】

前記カバレッジ比データが、前記１つ以上の遺伝子座と関連付けられた一塩基多型（ＳＮＰ）及びイントロンに対するカバレッジ比データを更に含む、請求項９に記載の方法。

【請求項11】

前記コピー数モデルがまた、前記試料に対する試料純度及び倍数性も予測する、請求項９に記載の方法。

【請求項12】

前記コピー数モデルがまた、前記セグメント化データも出力する、請求項９に記載の方法。

【請求項13】

前記試料に対する前記倍数性が、１～８の範囲の値を有する、請求項１に記載の方法。

【請求項14】

増幅は、前記対応するセグメントに対する前記コピー数が前記試料の前記倍数性以上であるときに検出される、請求項１に記載の方法。

【請求項15】

増幅は、前記対応するセグメントに対する前記コピー数が前記試料の前記倍数性＋第１の所定の値以上であるときに検出される、請求項１４に記載の方法。

【請求項16】

前記第１の所定の値が、２～５００の範囲の値である、請求項１５に記載の方法。

【請求項17】

前記第１の所定の値が、２～１０の範囲の値である、請求項１５に記載の方法。

【請求項18】

増幅は、前記対応するセグメントに対する前記コピー数が前記試料の前記倍数性＋第２の所定の値以上であり、かつ前記遺伝子座が第１の定義済み遺伝子座セットのメンバーであるときに検出される、請求項１４に記載の方法。

【請求項19】

前記第２の所定の値が、０～５００の範囲の値である、請求項１８に記載の方法。

【請求項20】

前記第２の所定の値が、２～１０の範囲の値である、請求項１８に記載の方法。

【請求項21】

前記第１の定義済み遺伝子座セットが、１つ以上の薬物投与可能遺伝子標的座、予後遺伝子座、がん遺伝子座、又はそれらの任意の組み合わせを含む、請求項１８に記載の方法。

【請求項22】

前記第１の定義済み遺伝子座セットが、ＡＲ及びＥＲＢＢ２遺伝子座を含む、請求項２１に記載の方法。

【請求項23】

欠失の前記検出が、対応するセグメント内の前記１つ以上の遺伝子座のホモ接合体欠失を識別することを含む、請求項１に記載の方法。

【請求項24】

ホモ接合体欠失が、前記遺伝子座における第１の対立遺伝子及び第２の対立遺伝子に対する前記コピー数の合計に等しい所与の遺伝子座に対する総コピー数を決定することによって検出される、請求項２３に記載の方法。

【請求項25】

前記第１の対立遺伝子が、メジャー対立遺伝子であり、前記第２の対立遺伝子が、マイナー対立遺伝子である、請求項２４に記載の方法。

【請求項26】

ホモ接合体欠失は、所与の遺伝子座に対する前記総コピー数が第３の所定の値に等しい場合に呼び出される、請求項２４に記載の方法。

【請求項27】

前記第３の所定の値が、約ゼロである、請求項２６に記載の方法。

【請求項28】

欠失の前記検出が、対応するセグメント内の前記１つ以上の遺伝子座のヘテロ接合体欠失を識別することを含む、請求項１に記載の方法。

【請求項29】

ヘテロ接合体欠失は、所与の遺伝子座における第１の対立遺伝子に対するコピー数が第４の所定の値に等しく、かつ前記所与の遺伝子座における第２の対立遺伝子に対するコピー数が前記第４の所定の値に等しくない場合、呼び出される、請求項２８に記載の方法。

【請求項30】

前記第４の所定の値が、約ゼロである、請求項２９に記載の方法。

【請求項31】

前記第１の対立遺伝子が、メジャー対立遺伝子であり、前記第２の対立遺伝子が、マイナー対立遺伝子である、請求項２９に記載の方法。

【請求項32】

欠失の前記検出が、対応するセグメント内の前記１つ以上の遺伝子座の部分欠失を識別することを含む、請求項１に記載の方法。

【請求項33】

部分欠失は、所与の遺伝子座に対して、隣接する遺伝子座、一塩基多型（ＳＮＰ）、及びイントロンに対するｌｏｇ２比（Ｌ２Ｒ）が、前記遺伝子座に対する前記ｌｏｇ２比とは有意に異なり、かつ前記所与の遺伝子座に対する前記ｌｏｇ２比が、隣接していない遺伝子座、一塩基多型（ＳＮＰ）、及びイントロンに対するＬ２Ｒの分布とは有意に異なる場合、呼び出される、請求項３２に記載の方法。

【請求項34】

前記１つ以上の遺伝子座に対する前記コピー数変化を呼び出す前に品質管理手順を実施することを更に含む、請求項１に記載の方法。

【請求項35】

前記品質管理手順が、前記配列リードデータの品質を評価するために実施される、請求項３４に記載の方法。

【請求項36】

前記品質管理手順が、コピー数モデルの成功した収束を評価するために実施される、請求項３４に記載の方法。

【請求項37】

前記品質管理手順が、前記１つ以上の遺伝子座に対するＣＮＡ呼び出しの信頼性を評価するために実施される、請求項３４に記載の方法。

【請求項38】

前記呼び出されたＣＮＡが、前記対象の疾患を診断するか、又はその診断を確認するために使用される、請求項１に記載の方法。

【請求項39】

前記疾患が、がんである、請求項３８に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０２１年１０月８日に出願された米国仮特許出願第６３／２５３，９０７号の優先権利益を主張し、その内容は参照によりその全体が本明細書に組み込まれる。

【0002】

本開示は、ゲノムプロファイリングデータを分析するための方法及びシステム、より具体的には、ゲノムプロファイリングを使用するコピー数変化の自動呼び出しのための方法及びシステムに関する。

【背景技術】

【0003】

構造的変異体（ＳＶ）は、典型的には、少なくとも５０塩基対（ｂｐ）の長さの変化を含む、大規模ゲノム変化である（Ｍａｈｍｏｕｄ，ｅｔａｌ．（２０１９），“Ｓｔｒｕｃｔｕｒａｌｖａｒｉａｎｔｃａｌｌｉｎｇ：ｔｈｅｌｏｎｇａｎｄｔｈｅｓｈｏｒｔｏｆｉｔ”，ＧｅｎｏｍｅＢｉｏｌｏｇｙ２０：２４６）。これらの大規模ゲノム変化は、欠失、重複、逆位、挿入、及び転座として分類され、ＤＮＡの獲得、喪失、再配列の異なる組み合わせを説明する。

【0004】

コピー数変化（ＣＮＡ）（コピー数変異（ＣＮＶ）とも呼ばれる）は、欠失又は重複を主に含む大きな構造的変異体のサブタイプであり、最大５０万ヌクレオチド長の変化を包含し得る。体細胞コピー数変異（ＣＮＶ）は、多くのタイプのがんの発症における重要な役割を果たし得る（Ｓａｍａｄｉａｎ，ｅｔａｌ．（２０１８），“Ｂａｍｇｉｎｅｅｒ：Ｉｎｔｒｏｄｕｃｔｉｏｎｏｆｓｉｍｕｌａｔｅｄａｌｌｅｌｅ－ｓｐｅｃｉｆｉｃｃｏｐｙｎｕｍｂｅｒｖａｒｉａｎｔｓｉｎｔｏｅｘｏｍｅａｎｄｔａｒｇｅｔｅｄｓｅｑｕｅｎｃｅｄａｔａｓｅｔｓ”，ＰＬｏＳＣｏｍｐｕｔＢｉｏｌ．１４（３）：ｅ１００６０８０）。次世代配列決定（ＮＧＳ）法の発展は、アルゴリズムの発展が、エクソーム及び標的配列データを含む、様々な配列決定データセットからＣＮＡプロファイルを計算で推論することを可能にした。

【0005】

しかしながら、配列決定データに基づいてＣＮＡを検出及び呼び出すための既存の方法は、配列決定カバレッジ正規化のための一対の正常試料又はプロセスマッチド対照を必要とし得、配列決定データの広範な手動キュレーションを必要とし得、例えば、試料汚染によって導入される誤差の影響を受け易い場合があり、並びに／又は小さい欠失及び／若しくは染色体Ｘで生じるＣＮＡ事象に対して良好にＣＮＡ検出及び呼び出しを取り扱うことができない場合がある。したがって、ＣＮＡの自動呼び出しのための改善された方法に対する必要性が残っている。

【発明の概要】

【0006】

コピー数変化のより正確な検出を提供し、かつカバレッジ正規化試料又は配列決定データの手動キュレーションを必要としない、コピー数変化（ＣＮＡ）の自動呼び出しのための方法及びシステムが本明細書に開示される。特に、説明された方法及びシステムは、（ｉ）性別を考慮する染色体Ｘ配列リードデータの適切な正規化を提供する「パネルオブノーマル」を使用するカバレッジ正規化手順、（ｉｉ）カバレッジ比データの特定の変換を使用するようにカスタマイズされ、かつ試料汚染を考慮するように拡張された枝刈り厳密線形時間（ｐｒｕｎｅｄｅｘａｃｔｌｉｎｅａｒｔｉｍｅ（ＰＥＬＴ））法に基づくセグメント化、（ｉｉｉ）異常ＳＮＰプロファイル（汚染シグナルを識別するためにベース置換ノイズモデル及びコピー数モデルプロファイルを使用して決定される）に基づく反復試料汚染検出法、（ｉｖ）全ての局所的に最適なコピー数モデル構成の決定及びモデル（例えば、配列リードデータと最も一貫し、かつ生物学的に妥当であるコピー数モデル）の優先順位付けに基づく新規コピー数モデル決定法、並びに／又は（ｖ）特定のコピー数モデル及びコピー数モデル全体に明示的に含まれない追加の変化に対するスキャンの両方に基づくＣＮＡの自動呼び出しを利用する。

【0007】

方法であって、対象からの試料から得られた複数の核酸分子を提供することと、１つ以上のアダプターを複数の核酸分子からの１つ以上の核酸分子上にライゲーションすることと、複数の核酸分子からの１つ以上のライゲーションされた核酸分子を増幅することと、増幅された核酸分子から増幅された核酸分子を捕捉することと、シーケンサーによって、捕捉された核酸分子を配列決定して、捕捉された核酸分子を表す複数の配列リードを得ることであって、複数の配列リードの１つ以上が試料中のサブゲノム区間内で変異体遺伝子座と重複する、得ることと、１つ以上のプロセッサで、複数の配列リードに対する配列リードデータを受信することと、配列リードデータに基づいて、１つ以上のプロセッサを使用して、１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、試料の倍数性、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルを決定することと、１つ以上のプロセッサを使用して、セグメント化データに基づいて、複数のセグメントを識別することと、１つ以上のプロセッサを使用して、少なくともカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルに基づいて、複数のセグメントに対するコピー数を決定することと、１つ以上のプロセッサを使用して、複数のセグメントの対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅又は欠失の存在を検出することと、１つ以上の遺伝子座に対する検出された増幅及び欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を含む、方法が、本明細書に開示される。

【0008】

いくつかの実施形態では、１つ以上の遺伝子座のうちの遺伝子座について検出された増幅及び欠失の任意の重複を併合することを更に含む。いくつかの実施形態では、コピー数モデルが、カバレッジ比データ及び対立遺伝子画分データに基づいて、１つ以上の遺伝子座に対するコピー数を予測する。いくつかの実施形態では、カバレッジ比データが、１つ以上の遺伝子座と関連付けられた一塩基多型（ＳＮＰ）及びイントロンに対するカバレッジ比データを更に含む。いくつかの実施形態では、コピー数モデルがまた、試料に対する試料純度及び倍数性も予測する。いくつかの実施形態では、コピー数モデルがまた、セグメント化データも出力する。いくつかの実施形態では、増幅は、対応するセグメントに対するコピー数が試料の倍数性以上であるときに検出される。いくつかの実施形態では、欠失の検出が、対応するセグメント内の１つ以上の遺伝子座のホモ接合体欠失を識別することを含む。いくつかの実施形態では、欠失の検出が、対応するセグメント内の１つ以上の遺伝子座のヘテロ接合体欠失を識別することを含む。いくつかの実施形態では、欠失の検出が、対応するセグメント内の１つ以上の遺伝子座の部分欠失を識別することを含む。いくつかの実施形態では、対象が、疾患を有する疑いがあるか、又はがんを有すると決定される。いくつかの実施形態では、疾患が、がんである。いくつかの実施形態では、方法が、定期検査に使用される。いくつかの実施形態では、方法が、出生前検査に使用される。いくつかの実施形態では、方法が、対象から試料を収集することを更に含む。いくつかの実施形態では、試料が、組織生検試料、液体生検試料、又は正常対照を含む。いくつかの実施形態では、試料が、組織生検試料であり、骨髄試料を含む。いくつかの実施形態では、試料が、液体生検試料であり、かつ血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含む。いくつかの実施形態では、試料が、液体生検試料であり、循環腫瘍細胞（ＣＴＣ）を含む。いくつかの実施形態では、試料が、液体生検試料であり、かつ無細胞ＤＮＡ（ｃｆＤＮＡ）、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、複数の核酸分子は、腫瘍核酸分子と非腫瘍核酸分子との混合物を含む。いくつかの実施形態では、腫瘍核酸分子は、不均質組織生検試料の腫瘍部分に由来し、かつ非腫瘍核酸分子は、不均質組織生検試料の正常部分に由来する。いくつかの実施形態では、試料は、液体生検試料を含み、腫瘍核酸分子は、液体生検試料の循環腫瘍ＤＮＡ（ｃｔＤＮＡ）画分に由来し、非腫瘍核酸分子は、液体生検試料の非腫瘍無細胞ＤＮＡ（ｃｆＤＮＡ）画分に由来する。いくつかの実施形態では、１つ以上のアダプターは、増幅プライマー、フローセルアダプター配列、基質アダプター配列、又は試料インデックス配列を含む。いくつかの実施形態では、捕捉された核酸分子は、１つ以上のベイト分子へのハイブリダイゼーションによって増幅された核酸分子から捕捉される。いくつかの実施形態では、１つ以上のベイト分子が、１つ以上の核酸分子を含み、各核酸分子が、捕捉された核酸分子の領域に相補的な領域を含む。いくつかの実施形態では、核酸分子を増幅することは、ポリメラーゼ連鎖反応（ＰＣＲ）増幅技術、非ＰＣＲ増幅技術、又は等温増幅技術を実施することを含む。いくつかの実施形態では、配列決定は、超並列配列決定（ＭＰＳ）技術、全ゲノム配列決定（ＷＧＳ）、全エクソーム配列決定、標的配列決定、直接配列決定、又はサンガー配列決定技術の使用を含む。いくつかの実施形態では、配列決定は、超並列配列決定を含み、超並列配列決定技術は、次世代シーケンシング（ＮＧＳ）を含む。いくつかの実施形態では、次世代配列決定（ＮＧＳ）が、ペアエンド配列決定を含む。いくつかの実施形態では、配列決定は、次世代シーケンサーを含む。いくつかの実施形態では、方法は、１つ以上のプロセッサによって、呼び出されたコピー数変化を示すレポートを生成することを更に含む。いくつかの実施形態では、方法は、レポートを医療提供者に送信することを更に含む。いくつかの実施形態では、レポートは、コンピュータネットワーク又はピアツーピア接続を介して送信される。

【0009】

コピー数変化の自動呼び出しのための方法であって、１つ以上のプロセッサで、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードに対する配列リードデータを受信することと、配列リードデータに基づいて、１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、試料の倍数性、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルを決定することと、１つ以上のプロセッサを使用して、セグメント化データに基づいて、複数のセグメントを識別することと、１つ以上のプロセッサを使用して、少なくともカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルに基づいて、複数のセグメントに対するコピー数を決定することと、１つ以上のプロセッサを使用して、複数のセグメントの対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅又は欠失の存在を検出することと、１つ以上の遺伝子座に対する検出された増幅及び欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を含む、方法もまた、本明細書に開示される。

【0010】

いくつかの実施形態では、１つ以上の遺伝子座のうちの遺伝子座について検出された増幅及び欠失の任意の重複を併合することを更に含む。いくつかの実施形態では、１つ以上の遺伝子座に対する呼び出されたコピー数変化を含むレポートを生成することを更に含む。いくつかの実施形態では、１つ以上の遺伝子座に対する呼び出されたコピー数変化に基づいて、対象に対するゲノムプロファイルを生成することを更に含む。

【0011】

いくつかの実施形態では、カバレッジ比データが、試料中及び対照試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを参照ゲノムにアラインメントすることと、試料中及び対照試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座の各々と重複する配列リードの数を決定することと、によって決定される。いくつかの実施形態では、対照試料が、一対の正常試料、プロセスマッチド対照試料、又はパネルオブノーマル対照試料である。

【0012】

いくつかの実施形態では、対立遺伝子画分データが、試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを参照ゲノムにアラインメントすることと、１つ以上の遺伝子座のうちの遺伝子座に存在する対立遺伝子の数を検出することと、遺伝子座に存在する対立遺伝子のうちの少なくとも１つに対する対立遺伝子画分を決定することと、によって決定される。

【0013】

いくつかの実施形態では、セグメント化データが、試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを参照ゲノムにアラインメントすることと、枝刈り厳密線形時間（ＰＥＬＴ）法を使用して、アラインメントされた配列リードデータ、カバレッジ比データ、及び対立遺伝子画分データを処理して、アラインメントされた配列リードデータを考慮することを必要とするセグメントの数を決定することであって、各セグメントが、同じコピー数を有する、決定することと、によって生成される。

【0014】

いくつかの実施形態では、コピー数モデルが、カバレッジ比データ及び対立遺伝子画分データに基づいて、１つ以上の遺伝子座に対するコピー数を予測する。いくつかの実施形態では、カバレッジ比データが、１つ以上の遺伝子座と関連付けられた一塩基多型（ＳＮＰ）及びイントロンに対するカバレッジ比データを更に含む。いくつかの実施形態では、コピー数モデルがまた、試料に対する試料純度及び倍数性も予測する。いくつかの実施形態では、コピー数モデルがまた、セグメント化データも出力する。いくつかの実施形態では、試料に対する倍数性が、１～８の範囲の値を有する。

【0015】

いくつかの実施形態では、増幅は、対応するセグメントに対するコピー数が試料の倍数性以上であるときに検出される。いくつかの実施形態では、増幅は、対応するセグメントに対するコピー数が試料の倍数性＋第１の所定の値以上であるときに検出される。いくつかの実施形態では、第１の所定の値が、２～５００の範囲の値である。いくつかの実施形態では、第１の所定の値が、２～１０の範囲の値である。

【0016】

いくつかの実施形態では、増幅は、対応するセグメントに対するコピー数が試料の倍数性＋第２の所定の値以上であり、かつ遺伝子座が第１の定義済み遺伝子座セットのメンバーであるときに検出される。いくつかの実施形態では、第２の所定の値が、０～５００の範囲の値である。いくつかの実施形態では、第２の所定の値が、２～１０の範囲の値である。いくつかの実施形態では、第１の定義済み遺伝子座セットが、１つ以上の薬物投与可能遺伝子標的座、予後遺伝子座、がん遺伝子座、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、第１の定義済み遺伝子座セットが、ＡＲ及びＥＲＢＢ２遺伝子座を含む。

【0017】

いくつかの実施形態では、欠失の検出が、対応するセグメント内の１つ以上の遺伝子座のホモ接合体欠失を識別することを含む。いくつかの実施形態では、ホモ接合体欠失が、遺伝子座における第１の対立遺伝子及び第２の対立遺伝子に対するコピー数の合計に等しい所与の遺伝子座に対する総コピー数を決定することによって検出される。いくつかの実施形態では、第１の対立遺伝子が、メジャー対立遺伝子であり、第２の対立遺伝子が、マイナー対立遺伝子である。いくつかの実施形態では、ホモ接合体欠失は、所与の遺伝子座に対する総コピー数が第３の所定の値に等しい場合に呼び出される。いくつかの実施形態では、第３の所定の値が、約ゼロである。

【0018】

いくつかの実施形態では、欠失の検出が、対応するセグメント内の１つ以上の遺伝子座のヘテロ接合体欠失を識別することを含む。いくつかの実施形態では、ヘテロ接合体欠失は、所与の遺伝子座における第１の対立遺伝子に対するコピー数が第４の所定の値に等しく、かつ所与の遺伝子座における第２の対立遺伝子に対するコピー数が第４の所定の値に等しくない場合、呼び出される。いくつかの実施形態では、第４の所定の値が、約ゼロである。いくつかの実施形態では、第１の対立遺伝子が、メジャー対立遺伝子であり、第２の対立遺伝子が、マイナー対立遺伝子である。

【0019】

いくつかの実施形態では、欠失の検出が、対応するセグメント内の１つ以上の遺伝子座の部分欠失を識別することを含む。いくつかの実施形態では、部分欠失は、所与の遺伝子座に対して、隣接する遺伝子座、一塩基多型（ＳＮＰ）、及びイントロンに対するｌｏｇ２比（Ｌ２Ｒ）が、遺伝子座に対するｌｏｇ２比とは有意に異なり、かつ所与の遺伝子座に対するｌｏｇ２比が、隣接していない遺伝子座、一塩基多型（ＳＮＰ）、及びイントロンに対するＬ２Ｒの分布とは有意に異なる場合、呼び出される。

【0020】

いくつかの実施形態では、呼び出されたＣＮＡが、対象の疾患を診断するか、又はその診断を確認するために使用される。いくつかの実施形態では、疾患が、がんである。いくつかの実施形態では、方法が、がん治療を選択して、呼び出されたＣＮＡに基づいて、対象に投与することを更に含む。いくつかの実施形態では、方法が、がん治療の有効量を決定して、呼び出されたＣＮＡに基づいて、対象に投与することを更に含む。いくつかの実施形態では、方法が、呼び出されたＣＮＡに基づいて、がん治療を対象に投与することを更に含む。いくつかの実施形態では、がん治療は、化学療法、放射線療法、免疫療法、標的療法、又は外科手術を含む。いくつかの実施形態では、がんは、Ｂ細胞がん（多発性骨髄腫）、黒色腫、乳がん、肺がん、気管支がん、結腸直腸がん、前立腺がん、膵臓がん、胃がん、卵巣がん、膀胱がん、脳がん、中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮内膜がん、口腔のがん、咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸がん、虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫、消化管間質腫瘍（ＧＩＳＴ）、結腸がん、多発性骨髄腫（ＭＭ）、骨髄異形成症候群（ＭＤＳ）、骨髄増殖性障害（ＭＰＤ）、急性リンパ性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性骨髄性白血病（ＣＭＬ）、慢性リンパ性白血病（ＣＬＬ）、赤血球増加症Ｖｅｒａ、ホジキンリンパ腫、非ホジキンリンパ腫（ＮＨＬ）、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ血管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭状がん、乳頭状腺がん、髄様がん、気管支原性がん、腎細胞がん、肝がん、胆管がん、絨毛がん、精上皮がん、胎児性がん、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体細胞腫、神経膠芽腫、聴神経芽腫、乏突起膠腫、髄膜腫、神経芽腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、無形成性骨髄化生、好酸球増加症候群、全身性肥満細胞症、家族性好酸球増加症、慢性好酸球性白血病、神経内分泌がん、又はカルチノイド腫瘍である。

【0021】

いくつかの実施形態では、１つ以上の遺伝子座は、１０～２０遺伝子座、１０～４０遺伝子座、１０～６０遺伝子座、１０～８０遺伝子座、１０～１００遺伝子座、１０～１５０遺伝子座、１０～２００遺伝子座、１０～２５０遺伝子座、１０～３００遺伝子座、１０～３５０遺伝子座、１０～４００遺伝子座、１０～４５０遺伝子座、１０～５００遺伝子座、２０～４０遺伝子座、２０～６０遺伝子座、２０～８０遺伝子座、２０～１００遺伝子座、２０～１５０遺伝子座、２０～２００遺伝子座、２０～２５０遺伝子座、２０～３００遺伝子座、２０～３５０遺伝子座、２０～４００遺伝子座、２０～５００遺伝子座、４０～６０遺伝子座、４０～８０遺伝子座、４０～１００遺伝子座、４０～１５０遺伝子座、４０～２００遺伝子座、４０～２５０遺伝子座、４０～３００遺伝子座、４０～３５０遺伝子座、４０～４００遺伝子座、４０～５００遺伝子座、６０～８０遺伝子座、６０～１００遺伝子座、６０～１５０遺伝子座、６０～２００遺伝子座、６０～２５０遺伝子座、６０～３００遺伝子座、６０～３５０遺伝子座、６０～４００遺伝子座、６０～５００遺伝子座、８０～１００遺伝子座、８０～１５０遺伝子座、８０～２００遺伝子座、８０～２５０遺伝子座、８０～３００遺伝子座、８０～３５０遺伝子座、８０～４００遺伝子座、８０～５００遺伝子座、１００～１５０遺伝子座、１００～２００遺伝子座、１００～２５０遺伝子座、１００～３００遺伝子座、１００～３５０遺伝子座、１００～４００遺伝子座、１００～５００遺伝子座、１５０～２００遺伝子座、１５０～２５０遺伝子座、１５０～３００遺伝子座、１５０～３５０遺伝子座、１５０～４００遺伝子座、１５０～５００遺伝子座、２００～２５０遺伝子座、２００～３００遺伝子座、２００～３５０遺伝子座、２００～４００遺伝子座、２００～５００遺伝子座、２５０～３００遺伝子座、２５０～３５０遺伝子座、２５０～４００遺伝子座、２５０～５００遺伝子座、３００～３５０遺伝子座、３００～４００遺伝子座、３００～５００遺伝子座、３５０～４００遺伝子座、３５０～５００遺伝子座、又は４００～５００遺伝子座を含む。

【0022】

疾患を診断するための方法であって、方法が、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）の検出に基づいて、対象が疾患を有することを診断することを含み、検出されたＣＮＡが、本明細書に開示される方法のうちのいずれかに従って決定される、方法が、本明細書に開示される。

【0023】

がん治療を選択する方法であって、方法が、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を検出することに応答して、対象に対するがん治療を選択することを含み、検出されたＣＮＡが、本明細書に開示される方法のうちのいずれかに従って決定される、方法が、本明細書に開示される。

【0024】

対象のがんを処置する方法であって、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を検出することに応答して、有効量のがん治療を対象に投与することを含み、検出されたＣＮＡが、本明細書に開示される方法のうちのいずれかに従って決定される、方法が、本明細書に開示される。

【0025】

対象における腫瘍の進行又は再発を監視するための方法であって、方法が、本明細書に開示される方法のうちのいずれかに従って、第１の時点で対象から得られた第１の試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を検出することと、第２の時点で対象から得られた第２の試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を検出することと、第１の試料中で検出されたＣＮＡを第２の試料中で検出されたＣＮＡと比較し、それによって、腫瘍の進行又は再発を監視することと、を含む、方法が、本明細書に開示される。いくつかの実施形態では、第２の試料中のＣＮＡの検出は、本明細書に開示される方法のうちのいずれかに従って決定される。いくつかの実施形態では、方法が、腫瘍の進行に応答して抗がん治療を調整することを更に含む。いくつかの実施形態では、方法は、腫瘍進行に応答して抗がん治療の投与量を調整すること、又は異なる抗がん治療を選択することを更に含む。いくつかの実施形態では、方法が、調整された抗がん治療を対象に投与することを更に含む。いくつかの実施形態では、第１の時点は、対象が抗がん治療を投与される前であり、第２の時点は、対象が抗がん治療を投与された後である。いくつかの実施形態では、対象が、がんを有するか、がんを有するリスクがあるか、がんについて日常的に検査されているか、又はがんを有する疑いがある。一部の実施形態では、がんは、固形腫瘍である。いくつかの実施形態では、がんが、血液がんである。いくつかの実施形態では、抗がん治療が、化学療法、放射線療法、免疫療法、標的療法、又は外科手術を含む。

【0026】

いくつかの実施形態では、本明細書に開示される方法のうちのいずれかは、１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する呼び出されたＣＮＡを決定することと、呼び出されたＣＮＡを試料と関連付けられた診断値として適用することと、を更に含む。いくつかの実施形態では、本明細書に開示される方法のうちのいずれかは、１つ以上の遺伝子座に対する呼び出されたＣＮＡに基づいて、対象に対するゲノムプロファイルを生成することを更に含む。いくつかの実施形態では、対象のゲノムプロファイルが、包括的ゲノムプロファイリング（ＣＧＰ）試験、遺伝子発現プロファイリング試験、がんホットスポットパネル試験、ＤＮＡメチル化試験、ＤＮＡ断片化試験、ＲＮＡ断片化試験、又はそれらの任意の組み合わせからの結果を更に含む。いくつかの実施形態では、対象のゲノムプロファイルが、核酸配列決定に基づく試験からの結果を更に含む。いくつかの実施形態では、方法は、生成されたゲノムプロファイルに基づいて、対象に対して、抗がん剤を選択すること、抗がん剤を投与すること、又は抗がん処置を適用することを更に含む。

【0027】

いくつかの実施形態では、開示される方法のうちのいずれかを使用する、試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するＣＮＡの検出は、対象に対する示唆される処置決定を行う際に使用される。いくつかの実施形態では、試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するＣＮＡの検出は、対象に処置を適用又は投与する際に使用される。

【0028】

システムであって、１つ以上のプロセッサと、１つ以上のプロセッサに通信可能に結合され、かつ命令を記憶するように構成されたメモリと、を備え、命令が、１つ以上のプロセッサによって実行されたとき、システムに、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードに対する配列リードデータを受信することと、配列リードデータに基づいて、１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、試料の倍数性、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルを決定することと、セグメント化データに基づいて、複数のセグメントを識別することと、少なくともカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルに基づいて、複数のセグメントに対するコピー数を決定することと、複数のセグメントの対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅又は欠失の存在を検出することと、１つ以上の遺伝子座に対する検出された増幅及び欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を含む、方法が、本明細書に開示される。

【0029】

１つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、１つ以上のプログラムが、命令を含み、命令が、システムの１つ以上のプロセッサによって実行されたとき、システムに、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードに対する配列リードデータを受信することと、配列リードデータに基づいて、１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、試料の倍数性、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルを決定することと、セグメント化データに基づいて、複数のセグメントを識別することと、少なくともカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルに基づいて、複数のセグメントに対するコピー数を決定することと、１つ以上のプロセッサを使用して、複数のセグメントの対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅又は欠失の存在を検出することと、１つ以上の遺伝子座に対する検出された増幅及び欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を含む、方法もまた、本明細書に開示される。

【0030】

参照による組み込み
この明細書で言及される全ての刊行物、特許及び特許出願は、あたかも各個々の刊行物、特許又は特許出願が参照によりその全体が組み込まれることが具体的かつ個別に示されているのと同程度に、その全体が参照により本明細書に組み込まれる。本明細書の用語と組み込まれた参考文献の用語との間に矛盾がある場合、本明細書の用語が支配する。

【図面の簡単な説明】

【0031】

開示される方法、デバイス、及びシステムの様々な態様は、添付の特許請求の範囲に詳細に記載されている。開示される方法、デバイス、及びシステムの特徴及び利点のより良い理解は、例示的な実施形態の以下の詳細な説明及び添付の図面を参照することによって得られるであろう。

【0032】

【図1】開示される方法の一例による、自動ＣＮＡ呼び出しのためのプロセスフローチャートの非限定的な例を提供する。

【図2】開示される方法の一例による、自動ＣＮＡ呼び出しのためのプロセスフローチャートの別の非限定的な例を提供する。

【図3】開示される方法の一例による、欠失呼び出しをスキャンするためのプロセスフローチャートの非限定的な例を提供する。

【図4】開示される方法の一例による、重複遺伝子呼び出しを併合するためのプロセスフローチャートの非限定的な例を提供する。

【図5】開示される方法の一例による、遺伝子座に対応する遺伝子オブジェクトのプロパティを設定するためのプロセスフローチャートの非限定的な例を提供する。

【図6】本明細書に説明されるシステムのいくつかの例による、例示的なコンピューティングデバイスを図示する。

【図7】本明細書に説明されるシステムのいくつかの例による、例示的なコンピュータシステム又はコンピュータネットワークを図示する。

【発明を実施するための形態】

【0033】

カバレッジ正規化試料又は配列決定データの手動キュレーションを必要としない、コピー数変化（ＣＮＡ）の自動呼び出しのための方法及びシステムが本明細書に開示される。説明される方法及びシステムは、（ｉ）性別を考慮する染色体Ｘ配列リードデータの適切な正規化を提供する「パネルオブノーマル」を使用するカバレッジ正規化手順、（ｉｉ）例えば、カバレッジ比データの特定の変換を使用するようにカスタマイズされ、かつ試料汚染を考慮するように拡張された枝刈り厳密線形時間（ＰＥＬＴ）法に基づくセグメント化、（ｉｉｉ）異常ＳＮＰプロファイル（汚染シグナルを識別するためにベース置換ノイズモデル及びコピー数モデルプロファイルを使用して決定される）に基づく反復試料汚染検出法、（ｉｖ）全ての局所的に最適なコピー数モデル構成の決定及びモデル（例えば、配列リードデータと最も一貫し、かつ生物学的に妥当であるコピー数モデル）の優先順位付けに基づく新規コピー数モデル決定法、並びに／又は（ｖ）特定のコピー数モデル及びコピー数モデル全体に明示的に含まれない追加の変化に対するスキャンの両方に基づくＣＮＡの自動呼び出しを利用する。

【0034】

いくつかの例では、例えば、コピー数変化の自動呼び出しのための方法であって、１つ以上のプロセッサで、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルデータを受信することと、セグメント化データで識別された対応するセグメントのコピー数及び試料の倍数性に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅を決定することと、１つ以上のプロセッサを使用して、セグメント化データで識別された対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座の欠失を検出することと、１つ以上のプロセッサを使用して、１つ以上の遺伝子座のうちの遺伝子座に対する増幅及び欠失呼び出しの任意の重複を併合することと、１つ以上の遺伝子座に対する決定された増幅及び検出された欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を含む、方法が、説明される。

【0035】

ＣＮＡの呼び出しのための従来のアプローチに対する開示される方法及びシステムの利点は、プロセスマッチド対照の必要性の排除、手動キュレーションの必要性の排除、従来のアプローチにおけるマッチド対照の使用と比較して、改善されたカバレッジ正規化（低減されたノイズ）、プロセスマッチド対照の品質に対する依存が除去されるという点における改善された堅牢性、低純度腫瘍試料のより精密な取り扱い（低減されたノイズレベル及び改善されたコピー数モデリングに起因する）、及びより再現性の高いＣＮＡ呼び出し（例えば、手動キュレーションから生じる変動の排除による）を含む。

【0036】

定義
他に定義されない限り、本明細書において使用される技術的用語の全ては、本開示が属する分野の当業者によって一般的に理解されるのと同じ意味を有する。

【0037】

本明細書及び添付の特許請求の範囲において使用される場合、単数形「ａ」、「ａｎ」、及び「ｔｈｅ」は、文脈上他に明確に指示されない限り、複数の言及を含む。本明細書における「又は」への任意の言及は、特に明記しない限り、「及び／又は」を包含することが意図される。

【0038】

本明細書で使用される場合、「含む（ｃｏｍｐｒｉｓｉｎｇ）」（並びに「ｃｏｍｐｒｉｓｅ」及び「ｃｏｍｐｒｉｓｅｓ」等のｃｏｍｐｒｉｓｉｎｇの任意の形態又は変形）、「有する（ｈａｖｉｎｇ）」（並びに「ｈａｖｅ」及び「ｈａｓ」等のｈａｖｉｎｇ任意の形態又は変形）、「含む（ｉｎｃｌｕｄｉｎｇ）」（並びに「ｉｎｃｌｕｄｅｓ」及び「ｉｎｃｌｕｄｅ等を含む任意の形態又は変形）、又は「含有する（ｃｏｎｔａｉｎｉｎｇ）」（及び「ｃｏｎｔａｉｎｓ」及び「ｃｏｎｔａｉｎ」等のｃｏｎｔａｉｎｉｎｇの任意の形態又は変形）という用語は、包括的又はオープンエンドであり、追加の列記されていない添加剤、構成要素、整数、要素、又は方法ステップを排除するものではない。

【0039】

本明細書で使用される場合、数又は値の「約」という用語は、その数又は値のプラス又はマイナス１０％の数又は値を指す。範囲の文脈で使用されるときの「約」という用語は、その範囲のその最低値のマイナス１０％及びその最大値のプラス１０％を指す。

【0040】

本明細書で使用される場合、「サブゲノム区間」（又は「サブゲノム配列区間」）という用語は、ゲノム配列の一部分を指す。

【0041】

本明細書で使用される場合、「対象区間」という用語は、サブゲノム区間又は発現サブゲノム区間（例えば、サブゲノム区間の転写配列）を指す。

【0042】

本明細書で使用される場合、「変異体配列」又は「変異体」という用語は、互換的に使用され、対応する「正常な」又は「野生型」配列に対して修飾された核酸配列を指す。いくつかの例では、変異体配列は、「短い変異体配列」（又は「短い変異体」）、すなわち、約５０塩基対未満の長さの変異体配列であり得る。

【0043】

「対立遺伝子頻度」及び「対立遺伝子画分」という用語は、本明細書では互換的に使用され、ゲノム遺伝子座に対する配列リードの総数に対する特定の対立遺伝子に対応する配列リードの画分を指す。

【0044】

「変異体対立遺伝子頻度」及び「変異体対立遺伝子画分」という用語は、本明細書では互換的に使用され、ゲノム遺伝子座の配列リードの総数に対する特定の変異体対立遺伝子に対応する配列リードの画分を指す。

【0045】

本明細書で使用される場合、「セグメント化」（又は「配列セグメント化」）という用語は、複数のセグメントの各セグメントが可能な限り均質であり、かつ所与のセグメントと関連付けられた全ての配列リードが同じコピー数を有するように、配列リードデータを、全ての配列リードデータ点をカバーするいくつかの非重複セグメントに分割するためのプロセスを指す。いくつかの例では、セグメント化は、当業者に既知の様々な方法（例えば、ＢｒａｕｎａｎｄＭｉｌｌｅｒ（１９９８），“ＳｔａｔｉｓｔｉｃａｌｍｅｔｈｏｄｓｆｏｒＤＮＡｓｅｑｕｅｎｃｅｓｅｇｍｅｎｔａｔｉｏｎ”，ＳｔａｔｉｓｔｉｃａｌＳｃｉｅｎｃｅ１３（２）：１４２－１６２を参照されたい）のうちのいずれかを使用して、整列された配列リードデータ（又は配列リードデータに由来する、他の配列決定関連データ、例えば、カバレッジデータ、対立遺伝子頻度データなど）を処理することによって実施され得る。セグメント化方法の例としては、限定されるものではないが、円形バイナリセグメンテーション（ＣＢＳ）法、最尤法、隠れマルコフ連鎖法、ウォーキングマルコフ法、ベイズ法、長距離相関法、変化点法、又はそれらの任意の組み合わせを含む。

【0046】

本明細書で使用される場合、「倍数性」という用語は、コピー数モデルによって決定される際の腫瘍試料中の複数の遺伝子座に対する平均コピー数を指す。いくつかの例では、腫瘍試料の「倍数性」は、腫瘍試料の不均質性（すなわち、腫瘍試料純度の変動）に起因して、細胞内の完全な染色体セットの数、したがって、常染色体遺伝子（すなわち、番号付きの非性染色体に位置する遺伝子）に対する可能な対立遺伝子の数とは異なり得る。

【0047】

本明細書で使用されるいかなる項目の見出しも、構成上の目的のみのためであり、記載される主題を限定するものと解釈されるべきではない。

【0048】

自動ＣＮＡ呼び出しのための方法
図１は、開示される方法の一例による、自動ＣＮＡ呼び出しプロセス１００のためのプロセスフローチャートの非限定的な例を提供する。説明される方法及びシステムは、（ｉ）性別を考慮する染色体Ｘ配列リードデータの適切な正規化を提供する「パネルオブノーマル」を使用するカバレッジ正規化手順、（ｉｉ）例えば、カバレッジ比データの特定の変換を使用するようにカスタマイズされ、かつ試料汚染を考慮するように拡張された枝刈り厳密線形時間（ＰＥＬＴ）法に基づくセグメント化、（ｉｉｉ）異常ＳＮＰプロファイル（汚染シグナルを識別するためにベース置換ノイズモデル及びコピー数モデルプロファイルを使用して決定される）に基づく反復試料汚染検出法、（ｉｖ）全ての局所的に最適なコピー数モデル構成の決定及びモデル（例えば、配列リードデータと最も一貫し、かつ生物学的に妥当であるコピー数モデル）の優先順位付けに基づく新規コピー数モデル決定法、並びに／又は（ｖ）特定のコピー数モデル及びコピー数モデル全体に明示的に含まれない追加の変化に対するスキャンの両方に基づくＣＮＡの自動呼び出しを利用する。

【0049】

図１に例示されるように、自動ＣＮＡ呼び出しプロセス１００は、分析される試料（例えば、患者腫瘍試料）中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードに対する配列リードデータの前処理によって導出される、配列決定カバレッジ比データ（又は「カバレッジ比データ」）、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルデータの入力によるステップ１０２で始まる。

【0050】

いくつかの例では、試料に対するカバレッジ比データ（例えば、患者腫瘍試料）は、試料中及び対照中（例えば、一対の正常対照、プロセスマッチド対照、又は「パネルオブノーマル」対照）の１つ以上のサブゲノム区間内の１つ以上の遺伝子座が重複する複数の配列リードを参照ゲノム（例えば、ＧＲＣｈ３８ヒト参照ゲノム）にアラインメントし、腫瘍試料に対するカバレッジを対照におけるカバレッジに正規化するために、試料中及び対照中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座の各々が重複する配列リードの数を決定することによって決定される。いくつかの例では、例えば、一対の正常対照試料が利用可能ではない場合、プロセスマッチド対照（例えば、複数のＨａｐＭａｐ細胞株からのＤＮＡの混合物）が、カバレッジを正規化するために、一対の正常対照の代わりに使用され得る。いくつかの例では、例えば、一対の正常対照試料が利用可能ではない場合、「パネルオブノーマル」対照が、カバレッジを正規化するために、一対の正常対照の代わりに使用され得る。

【0051】

いくつかの例では、「パネルオブノーマル」（ＰｏＮ）又は「タンジェント正規化」対照法が、配列決定カバレッジを正規化するために使用され得る（例えば、Ｔａｂａｋ，ｅｔａｌ．（２０１９）“ＴｈｅＴａｎｇｅｎｔｃｏｐｙ－ｎｕｍｂｅｒｉｎｆｅｒｅｎｃｅｐｉｐｅｌｉｎｅｆｏｒｃａｎｃｅｒｇｅｎｏｍｅａｎａｌｙｓｅｓ”，ｈｔｔｐｓ：／／ｗｗｗ．ｂｉｏｒｘｉｖ．ｏｒｇ／ｃｏｎｔｅｎｔ／１０．１１０１／５６６５０５ｖ１．ｆｕｌｌ．ｐｄｆを参照されたい）。タンジェント正規化法は、データ内のノイズに対処するために腫瘍データを正規化する方法である。具体的には、タンジェント法は、腫瘍及び／又はそれらの正常対照からの配列決定データが生成された実験条件の差から結果的に生じるシステミックノイズを低減することに対処する。タンジェント正規化法が従来の正規化法よりもノイズのより大きい低減をもたらすことが示されている。

【0052】

始めに、ｎ_Ｎを正常な非患者試料（すなわち、複数の健常な個体から得られた試料）の数とし、ｎ_Ｔを腫瘍試料の数とする。ｉを集合｛１，２，…，ｎ_Ｎ｝の要素、ｊを集合｛１，２，…，ｎ_Ｔ｝の要素とする。Ｎ_ｉをｉ番目の正常試料のゲノム順位におけるｌｏｇ２コピー比強度のベクトルと定義する。同様に、Ｔ_ｊをｊ番目の腫瘍試料のゲノム順位におけるｌｏｇ２コピー比強度のベクトルと定義する。正常試料ベクトル及び腫瘍試料ベクトルは、全ての可能なカバレッジプロファイルのＭ次元ベクトル空間の要素である。ここで、全ての可能なカバレッジプロファイルのベクトル空間の参照部分空間Ｎを、正常試料のベクトルの全ての線形結合｛Ｎ_１，Ｎ_２，…，Ｎ_ｎＮ｝を含む空間と定義する。Ｎは、「ノイズ空間」と呼ばれ、（ｎ_Ｎ－１）次元平面である。

【0053】

この設定を考慮すると、タンジェント正規化法は、次のように進む。各腫瘍試料ベクトルＴ_ｊごとに、ユークリッド計量法を使用して、ノイズ空間ＮにおけるＴ_ｊに最も近いベクトルを決定することによって始まる。このベクトルをｐ（Ｔ_ｊ）と表記し、Ｔ_ｊのＮへの投影である。ｐ（Ｔ_ｊ）は、Ｔ_ｊと同様の条件下で特徴化された正常試料のプロファイルを表す。ここで、Ｔ_ｊの正規化は、Ｔ_ｊとＴ_ｊのＮへの投影ｐ（Ｔ_ｊ）との間の差を計算することによって算出され得る：
Ｔ_ｊの正規化＝Ｔ_ｊ－ｐ（Ｔ_ｊ）
投影ｐ（Ｔ_ｊ）は、標準線形代数技術を使用して直接算出され得る。

【0054】

ＰｏＮ法は、典型的な変動を除去するために正常な試料中の観察されたシステミックノイズのパターンを使用する。染色体Ｘ（ｃｈｒＸ）は、正常な男性が１つのみのＸ染色体を有するため、男性ではｃｈｒＸ上の遺伝子座のカバレッジが半分であるという特異的なパターンを有する。したがって、ＰｏＮ法は、この変動を除去する。

【0055】

いくつかの例では、試料（例えば、患者腫瘍試料）に対する対立遺伝子画分データは、試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座が重複する複数の配列リードを参照ゲノム（例えば、ＧＲＣｈ３８ヒト参照ゲノム）にアラインメントし、試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に存在する異なる対立遺伝子の数を検出し、所与の対立遺伝子配列に対して識別された配列リードの数を、遺伝子座に対して識別された配列リードの総数で除算することによって、１つ以上の遺伝子座に存在する異なる対立遺伝子に対する対立遺伝子画分を決定することによって、決定される。

【0056】

いくつかの例では、試料（例えば、患者腫瘍試料）に対するセグメント化データは、試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座が重複する複数の配列リードを参照ゲノム（例えば、ＧＲＣｈ３８ヒト参照ゲノム）にアラインメントし、セグメント化アルゴリズム（例えば、円形バイナリセグメンテーション（ＣＢＳ）法、最尤法、隠れマルコフ連鎖法、ウォーキングマルコフ法、ベイズ法、長距離相関法、変化点法、又はそれらの任意の組み合わせ）を使用して、整列された配列リードデータ（又は配列リードデータに由来する、他の配列決定関連データ、例えば、カバレッジ比データ、対立遺伝子頻度データなど）を処理して、所与のセグメントと関連付けられた配列が同じコピー数を有するように、複数の非重複セグメントを生成することによって、生成され得る。

【0057】

いくつかの例では、セグメント化は、カバレッジ比及び対立遺伝子画分データを最良に考慮するコピー数モデルを決定するためのコピー数モデリングプロセスの一部として実施され得る。例えば、いくつかの例では、コピー数モデルは、純度推定値（例えば、腫瘍に由来した試料中の細胞の画分）、セグメント化（例えば、増幅又は喪失のいずれかを受けた成分へのゲノムの分割）、各セグメントへのコピー数の割り当て、を含み得、コピー数状態は、そのセグメントのゲノムコピーの数である。いくつかの例では、コピー数モデリングは、半数体カバレッジ比データ（例えば、Ｒ_Ａ及びＲ_Ｂ、式中、Ｒ_Ａ及びＲ_Ｂは、それぞれ、マイナー及びメジャー対立遺伝子Ａ及びＢの半数体カバレッジ比である）を、メジャー及びマイナー対立遺伝子に対する合計カバレッジ比（Ｒ_Ａ＋Ｒ_Ｂ＝（２＋（Ｃ_Ａ＋Ｃ_Ｂ）ｇ）／（１＋λ ｇ）、式中、Ｃ_Ａ及びＣ_Ｂは、それぞれ、マイナー及びメジャー対立遺伝子Ａ及びＢの対立遺伝子カウントであり、ｇ＝ρ／（１－ρ）、式中、ρは、純度であり、λ＝（Ψ／２）、式中、Ψは、倍数性である）及び差分カバレッジ比（Ｒ_Ａ－Ｒ_Ｂ＝（（Ｃ_Ａ－Ｃ_Ｂ））／（１＋λ ｇ））データに変換し、差分カバレッジ比データ対合計カバレッジ比データを、セグメントデータ及び許容されるコピー数状態を表すグリッドと重複するプロットにプロットすることによって容易にされ得る。

【0058】

いくつかの例では、セグメント化は、配列リードデータ内の試料汚染を同時に検出及び補正しながら、反復様式で実施され得る。例えば、いくつかの例では、方法は、選択されたヘテロ接合体一塩基多型（ＳＮＰ）セットに対するマイナー対立遺伝子頻度の分布に基づいて、試料に対する汚染の程度を推定することを含み得る。次いで、マイナー対立遺伝子頻度（ＭＡＦ）閾値に対する初期値として、推定された汚染の程度を使用して、配列決定データは、ＭＡＦ閾値を下回るマイナー対立遺伝子頻度を有するＳＮＰを含むセグメント化プロセスから配列決定データを同時に除外しながら反復的にセグメント化される。各反復では、残っているＳＮＰは、それらが、同じセグメント上で検出される他のＳＮＰに対するＭＡＦとは異なるマイナー対立遺伝子頻度を有する場合、異常（すなわち、汚染に起因する可能性がある）として分類され、ＭＡＦ閾値は、選択されたヘテロ接合体ＳＮＰセットに対するマイナー対立遺伝子頻度の予想される分布に対する、異常ＳＮＰマイナー対立遺伝子頻度の分布の比較に基づいて、増分調整される。セグメント化、分類、及びＭＡＦ閾値調整ステップは、ＭＡＦ閾値が増加するたびに繰り返される。ＭＡＦ閾値の更なる増加が必要とされないとき（又は異常ＳＮＰマイナー対立遺伝子頻度の更なる変化が存在しないか、又は反復の指定された最大数に達したとき）、セグメント化データ及び試料に対する推定された汚染の程度（ＭＡＦ閾値の最終値と等しい）が出力される。いくつかの例では、方法は、セグメント化データを使用して、１つ以上の遺伝子座に対するコピー数を予測するコピー数モデルを構築する。

【0059】

いくつかの例では、試料（例えば、患者腫瘍試料）に対するセグメント化データは、整列された配列リードデータ（又は配列リードデータに由来する、他の配列決定関連データ、例えば、カバレッジ比データ、対立遺伝子頻度データなど）を適切に考慮するために必要なセグメントの数を決定するために、枝刈り厳密線形時間（ＰＥＬＴ）法を使用して生成され得、各セグメント（及びセグメントと関連付けられた配列リード）が同じコピー数を有する。いくつかの例では、セグメント化データは、カバレッジ比及び対立遺伝子画分データの特定の変換（例えば、推定されたコピー数状態を同時に重ねながら同じグラフ上におけるカバレッジ比及び対立遺伝子画分データの提示を可能にする変換）を使用するようにカスタマイズされ、かつ試料汚染を考慮するために拡張された枝刈り厳密線形時間（ＰＥＬＴ）を使用して生成される。

【0060】

いくつかの例では、コピー数モデルは、１つ以上の遺伝子座（すなわち、１つ以上の遺伝子標的）に対する測定されたカバレッジ比及び対立遺伝子画分データを最良に考慮する、各遺伝子座のコピーの数、試料のセグメント化、試料純度、及び試料倍数性（すなわち、試料に対する平均コピー数）を識別（又は予測）するために使用され得る。いくつかの例では、コピー数モデルを生成するために使用される入力データはまた、一塩基多型（ＳＮＰ）及びイントロンに対するカバレッジ比及び対立遺伝子画分データを含む。カバレッジ比データは、多くの場合、ｌｏｇ２カバレッジ比データに変換される。コピー数モデリング方法の例としては、限定されるものではないが、非重複ウィンドウにおけるリードカウントを算出するためのスライディングウィンドウ法、正規化カバレッジ深度及びＢ対立遺伝子頻度（すなわち、２つの対立遺伝子についての相対シグナル強度比の正規化尺度）法、円形化バイナリセグメンテーション（ＣＢＳ）法、平均シフトアプローチに基づくマッピング密度の統計解析、隠れマルコフモデル、リード深度ベースのベイズ情報基準法、又はそれらの任意の組み合わせが挙げられる（例えば、ＬｉａｎｄＯｌｉｖｉｅｒ（２０１３），“Ｃｕｒｒｅｎｔａｎａｌｙｓｉｓｐｌａｔｆｏｒｍｓａｎｄｍｅｔｈｏｄｓｆｏｒｄｅｔｅｃｔｉｎｇｃｏｐｙｎｕｍｂｅｒｖａｒｉａｔｉｏｎ”，Ｐｈｙｓｉｏｌ．Ｇｅｎｏｍｉｃｓ４５（１）：１－１６参照）。

【0061】

いくつかの事例では、コピー数モデルを生成するために使用される入力カバレッジ比データ又はコピー数推定値は、整数値に四捨五入される。いくつかの例では、完成したコピー数モデルによって報告される出力値（例えば、セグメントの予測されたコピー数値）は、整数値である。いくつかの例では、完成したコピー数モデルによって報告される出力値（例えば、特定の遺伝子座に対して予測された試料純度、試料倍数性、及びコピー数値）は、実数（例えば、連続する）である。いくつかの例では、サブクローナル事象（例えば、サブクローナル欠失事象）は、整数コピー数値を適合させずに生じ得、したがって、非整数の予測されたコピー数値を有し得る。

【0062】

いくつかの例では、コピー数モデルは、試料純度（又は腫瘍画分）が０．０５～１．０の範囲の値を有すると決定し得る。いくつかの例では、決定される試料純度は、少なくとも０．０５、少なくとも０．１、少なくとも０．２、少なくとも０．３、少なくとも０．４、少なくとも０．５、少なくとも０．６、少なくとも０．７、少なくとも０．８、少なくとも０．９、少なくとも０．９５、少なくとも０．９８、又は少なくとも０．９９であり得る。いくつかの例では、決定される試料純度は、最大で０．９９、最大で０．９８、最大で０．９５、最大で０．９、最大で０．８、最大で０．７、最大で０．６、最大で０．５、最大で０．４、最大で０．３、最大で０．２、最大で０．１、又は最大で０．０５であり得る。この段落に説明された下限値及び上限値のいずれかは、本開示内に含まれる範囲を形成するように組み合わせられてもよく、例えば、いくつかの例では、決定される試料純度は、０．１～０．８の範囲であってもよい。当業者は、所与の例で決定される試料純度が、この範囲内の任意の値、例えば、約０．６４を有し得ることを認識するであろう。

【0063】

いくつかの例では、コピー数モデルは、試料倍数性が１．０～１０．０の範囲の値を有すると決定し得る。いくつかの例では、決定される試料倍数性は、少なくとも１．０、少なくとも２．０、少なくとも３．０、少なくとも４．０、少なくとも５．０、少なくとも６．０、少なくとも７．０、少なくとも８．０、少なくとも９．０、又は少なくとも１０．０であり得る。いくつかの例では、決定される試料倍数性は、最大で１０．０、最大で９．０、最大で８．０、最大で７．０、最大で６．０、最大で５．０、最大で４．０、最大で３．０、最大で２．０、又は最大で１．０であり得る。この段落に説明された下限値及び上限値のいずれかは、本開示内に含まれる範囲を形成するように組み合わせられてもよく、例えば、いくつかの例では、決定される試料倍数性は、１．０～８．０の範囲であってもよい。当業者は、所与の例で決定される試料倍数性が、この範囲内の任意の値、例えば、約３．４を有し得ることを認識するであろう。いくつかの例では、試料倍数性は、整数値として四捨五入及び報告され得る。

【0064】

いくつかの例では、コピー数モデルは、０～５００の範囲の所与の遺伝子座（又は関連付けられたセグメント）に対するコピー数を予測し得る。いくつかの例では、予測されるコピー数は、少なくとも０、少なくとも２、少なくとも４、少なくとも６、少なくとも８、少なくとも１０、少なくとも２０、少なくとも４０、少なくとも６０、少なくとも８０、少なくとも１００、少なくとも２００、少なくとも３００、少なくとも４００、又は少なくとも５００である。いくつかの例では、予測されるコピー数は、最大で５００、最大で４４００、最大で３００、最大で２００、最大で１００、最大で８０、最大で６０、最大で４０、最大で２０、最大で１０、最大で８、最大で６、最大で４、最大で２、又は最大で０である。この段落に説明された下限値及び上限値のいずれかは、本開示内に含まれる範囲を形成するように組み合わせられてもよく、例えば、いくつかの例では、予測されるコピー数は、１～１００の範囲であってもよい。当業者は、予測されるコピー数が、この範囲内の任意の値、例えば、７を有し得ることを認識するであろう。いくつかの例では、遺伝子座に対して予測されるコピー数は、整数ではなく実数値であり得る。

【0065】

再び図１を参照すると、ステップ１０４では、分析されている１つ以上の遺伝子座の各遺伝子座の増幅（例えば、遺伝子座のコピーの数の増加）又は欠失（完全な若しくは部分的な遺伝子座の欠失）は、セグメントベースによってセグメント上で決定される。１つ以上の遺伝子座の増幅又は欠失を検出するために使用される方法は、図２に関して以下により詳細に説明される。

【0066】

図１のステップ１０６では、重複遺伝子呼び出し、又はより正式には「遺伝子オブジェクト」に対する重複呼び出し（すなわち、所与の遺伝子座と関連付けられたプロパティセット（例えば、配列場所、標的対立遺伝子配列、カバレッジ比など）を保持するデジタルデータ構築物）が併合される。重複呼び出しは、例えば、遺伝子配列が２つの部分配列に破壊され、両方の部分配列が増幅又は欠失を含む遺伝子座として呼び出される場合に生じ得、したがって、遺伝子座に対する２つ以上の遺伝子オブジェクトを生成する。他の事例では、欠失は、コピー数モデルデータから直接得られるコピー数予測、及び部分欠失スキャン法（例えば、標的対立遺伝子配列と重複するが有意に逸脱する配列リードを探し、部分欠失呼び出しを結果的にもたらす）の両方を使用して呼び出され得、その場合、２つ以上の遺伝子オブジェクトが、遺伝子座に対して再び生成される。部分欠失を検出して呼び出すための方法は、図３に関して以下により詳細に説明される。併合時、２つ以上の遺伝子オブジェクト及びそれらの対応するプロパティ（例えば、配列場所、標的対立遺伝子配列、カバレッジ比など）は、単一の遺伝子オブジェクト及びプロパティのコンセンサスセットによって置き換えられることになる。遺伝子オブジェクト及びそれらのプロパティを併合するための方法は、図４に関して以下により詳細に説明される。

【0067】

図１のステップ１０８では、各遺伝子座（又は遺伝子オブジェクト）と関連付けられたプロパティセットが更新される。遺伝子プロパティの更新のより詳細な説明は、図５の説明の一部として以下に提供される。

【0068】

図１のステップ１１０では、ＣＮＡの結果が、例えば、配列リードデータ、試料純度（例えば、指定された試料純度閾値に対する試料純度の比較によって）、コピー数モデルの成功した収束の品質を評価するための、及び／又は個々の遺伝子座に対するＣＮＡ呼び出しの信頼性を評価するためなどの品質管理（ＱＣ）手順を実施することによって、フィルタリングされ、報告のために準備される。

【0069】

図２は、開示される方法の一例による、自動ＣＮＡ呼び出しプロセス２００のためのプロセスフローチャートのより詳細な例を提供する。プロセスは、分析される試料（例えば、患者腫瘍試料）中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードに対する配列リードデータの前処理によって導出されるカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルデータの入力によるステップ２０２で始まる。

【0070】

図２のステップ２０４では、増幅された遺伝子座が、コピー数モデルによって決定される試料の倍数性に対して、コピー数モデルによる遺伝子座（又はそれと関連付けられたセグメント）に対して予測されたコピー数を比較することによってセグメントごとに識別される。例えば、遺伝子座（又はそれと関連付けられたセグメント）のコピー数がステップ２０４の倍数性を超える場合、遺伝子座は、増幅されると決定され、ステップ２１０で呼び出された遺伝子（又は呼び出された遺伝子座）のリストに加えられる。

【0071】

いくつかの例では、遺伝子座に対する増幅の決定は、遺伝子座（又は対応するセグメント）に対するコピー数が試料の倍数性＋第１の所定の値以上であるかどうかを決定することを含む。いくつかの例では、第１の所定の値は、０～５００の範囲の値であり得る。いくつかの例では、第１の所定の値は、少なくとも０、少なくとも２、少なくとも４、少なくとも６、少なくとも８、少なくとも１０、少なくとも２０、少なくとも４０、少なくとも６０、少なくとも８０、少なくとも１００、少なくとも２００、少なくとも３００、少なくとも４００、又は少なくとも５００である。いくつかの例では、第１の所定の値は、最大で５００、最大で４４００、最大で３００、最大で２００、最大で１００、最大で８０、最大で６０、最大で４０、最大で２０、最大で１０、最大で８、最大で６、最大で４、最大で２、又は最大で０である。この段落に説明された下限値及び上限値のいずれかは、本開示内に含まれる範囲を形成するように組み合わせられてもよく、例えば、いくつかの例では、第１の所定の値は、２～１０の範囲であってもよい。当業者は、第１の所定の値が、この範囲内の任意の値、例えば、約１１を有し得ることを認識するであろう。

【0072】

図２のステップ２０４の遺伝子座に対する増幅の決定は、遺伝子座（又は対応するセグメントに対するコピー数が試料の倍数性＋第２の所定の値（すなわち、第１の所定の値とは異なる値）以上であるかどうか、及び遺伝子座が第１の定義済み遺伝子座セットのメンバーであるかどうかを決定することを含む。いくつかの例では、第２の所定の値は、０～５００の数値範囲である。いくつかの例では、第２の所定の値は、少なくとも０、少なくとも２、少なくとも４、少なくとも６、少なくとも８、少なくとも１０、少なくとも２０、少なくとも４０、少なくとも６０、少なくとも８０、少なくとも１００、少なくとも２００、少なくとも３００、少なくとも４００、又は少なくとも５００である。いくつかの例では、第２の所定の値は、最大で５００、最大で４４００、最大で３００、最大で２００、最大で１００、最大で８０、最大で６０、最大で４０、最大で２０、最大で１０、最大で８、最大で６、最大で４、最大で２、又は最大で０である。この段落に説明された下限値及び上限値のいずれかは、本開示内に含まれる範囲を形成するように組み合わせられてもよく、例えば、いくつかの例では、第２の所定の値は、４～６０の範囲であってもよい。当業者は、第２の所定の値が、この範囲内の任意の値、例えば、約７を有し得ることを認識するであろう。いくつかの例では、第１の定義済み遺伝子座セットが、１つ以上の薬物投与可能遺伝子標的座、予後遺伝子座、がん遺伝子座、又はそれらの任意の組み合わせを含む。いくつかの例では、第１の定義済み遺伝子座セットが、例えば、ＡＲ及びＥＲＢＢ２遺伝子座を含む。

【0073】

図２のステップ２０６では、遺伝子座のホモ接合体欠失が、所与の遺伝子座に対する総コピー数（総ＣＮ）を決定することと、遺伝子座の総コピー数を第３の定義済み値と比較することと、によって、セグメントごとに識別される。遺伝子座に対する総コピー数は、遺伝子座における第１の対立遺伝子及び第２の対立遺伝子（例えば、メジャー対立遺伝子及びマイナー対立遺伝子）に対するコピー数の合計と等しい。いくつかの例では、所与の遺伝子座に対する予測されるコピー数は、コピー数モデルへのカバレッジ比データ入力における統計的変動（又はノイズ）に起因して負の値を有し得る。遺伝子座（又はそれと関連付けられる対応するセグメント）に対する総コピー数が第３の定義済み値とほぼ等しい場合、ホモ接合体欠失が、遺伝子座に対して呼び出され、遺伝子座が、ステップ２１０で、呼び出された遺伝子のリストに追加される。

【0074】

図２のステップ２０８では、遺伝子座のヘテロ接合体欠失が、所与の遺伝子座の第１の対立遺伝子及び第２の対立遺伝子（例えば、メジャー対立遺伝子及びマイナー対立遺伝子）に対するコピー数を第４の定義済み値と比較することによって、セグメントごとに識別される。ヘテロ接合体欠失は、遺伝子座（又は対応するセグメント）に対する第１の対立遺伝子のコピー数が第４の所定の値とほぼ等しく、かつ遺伝子座（又は対応するセグメント）に対する第２の遺伝子座に対するコピー数が第４の所定の値と等しくない場合に、所与の遺伝子座に対して呼び出される。遺伝子座（又は対応するセグメント）に対する第１の対立遺伝子のコピー数が第４の所定の値とほぼ等しく、かつ遺伝子座（又は対応するセグメント）に対する第２の対立遺伝子に対するコピー数が第４の所定の値と等しくない場合、ヘテロ接合体欠失が、遺伝子座に対して呼び出され、遺伝子座が、ステップ２１０で、呼び出された遺伝子のリストに追加される。

【0075】

図２のステップ２１２では、遺伝子座の部分欠失は、所与の遺伝子座に対して、隣接する遺伝子座、一塩基多型（ＳＮＰ）、及び／又はイントロンに対するｌｏｇ２比カバレッジ比（「ｌｏｇ２比」又は「Ｌ２Ｒ」）が、所与の遺伝子座に対するＬ２Ｒとは有意に異なるかどうか、並びに所与の遺伝子座に対するＬ２Ｒが、隣接していない遺伝子座、一塩基多型（ＳＮＰ）、及び／又はイントロンに対するＬ２Ｒの分布とは有意に異なるかどうかを決定することによって識別され得る。Ｌ２Ｒの有意な差の決定は、図３に関して以下により詳細に説明される。所与の遺伝子座の部分欠失がステップ２１２で呼び出される場合、遺伝子座は、ステップ２１４で、呼び出された遺伝子のリストに追加される。

【0076】

図２のステップ２１６では、遺伝子座（デジタルでは「遺伝子オブジェクト」として表される）に対する重複呼び出しが併合され得る。上記のように、重複呼び出しは、例えば、遺伝子配列が２つの部分配列に破壊され、両方の部分配列が増幅又は欠失を含む遺伝子座として呼び出される場合、又は欠失が、コピー数モデルデータから直接得られるコピー数予測、及び部分欠失スキャン法の両方を使用して、遺伝子座に対して呼び出された場合に生じ得る。部分欠失を検出して呼び出すための方法は、図３に関して以下により詳細に説明される。併合時、２つ以上の遺伝子オブジェクト及びそれらの対応するプロパティ（例えば、配列場所、標的対立遺伝子配列、カバレッジ比など）は、単一の遺伝子オブジェクト及びプロパティのコンセンサスセットによって置き換えられることになる。遺伝子オブジェクト及びそれらのプロパティを併合するための方法は、図４に関して以下により詳細に説明される。

【0077】

図２のステップ２１８では、各遺伝子座（又は遺伝子オブジェクト）と関連付けられたプロパティセットが更新される。遺伝子プロパティの更新のより詳細な説明は、図５の説明の一部として以下に提供される。

【0078】

図２のステップ２２０では、ＣＮＡの結果が、例えば、配列リードデータ、試料純度（例えば、指定された試料純度閾値との試料純度の比較によって）、コピー数モデルの成功した収束の品質を評価するための、及び／又は個々の遺伝子座に対するＣＮＡ呼び出しの信頼性を評価するためなどの品質管理（ＱＣ）手順を実施することによって、フィルタリングされ、報告のために準備される。

【0079】

図３は、遺伝子座で部分欠失を呼び出すためのシステムのプロセス（又はサブルーチン）３００の非限定な例を提供する。ステップ３０２で始まり、各遺伝子重複セグメントが、部分欠失についてレビューされる。上記のように、遺伝子座の部分欠失は、ステップ３０４で、所与の遺伝子座に対して、隣接する遺伝子座（例えば、遺伝子座、一塩基多型（ＳＮＰ）、及び／又はイントロン）に対するｌｏｇ２比カバレッジ比（「ｌｏｇ２比」又は「Ｌ２Ｒ」）が、所与の遺伝子座に対するＬ２Ｒとは有意に異なる（及び非ゼロコピー数に対応する）かどうかを決定することと、ステップ３０８で、所与の遺伝子座に対するＬ２Ｒが、隣接していない遺伝子座（例えば、遺伝子座、一塩基多型（ＳＮＰ）、及び／又はイントロン）に対するＬ２Ｒの分布とは有意に異なるかどうかを決定することによって識別され得、隣接していない遺伝子座に対するＬ２Ｒは、ステップ３０６で収集される。隣接する遺伝子座に対するＬ２Ｒが、ステップ３０４で、遺伝子座に対するＬ２Ｒとは有意に異ならないと決定された場合、その所見は、ステップ３１０で、遺伝子座に対応する遺伝子オブジェクトに追加され、リターンされる（部分欠失評価プロセスは、全ての遺伝子重複セグメントがスキャンされた後に図２に例示されるプロセス２００にリターンする）。隣接する遺伝子座に対するＬ２Ｒが、ステップ３０４で、遺伝子座に対するＬ２Ｒと有意に異なると決定され、かつ所与の遺伝子座に対するＬ２Ｒが、ステップ３０８で、隣接していない遺伝子座に対するＬ２Ｒの分布と有意に異なると決定された場合、その所見は、ステップ３１０で、遺伝子座に対応する遺伝子オブジェクトに追加され、リターンされる。

【0080】

いくつかの例では、例えば試料純度が指定された純度閾値を下回る場合、隣接する遺伝子座、一塩基多型（ＳＮＰ）、及び／又はイントロン（すなわち、関心対象の２つの他の遺伝子座の間に存在するか、又は関心対象の遺伝子座に隣接する、介在する遺伝子座、ＳＮＰ、又はイントロン）に対するＬｏｇ２カバレッジ比（Ｌ２Ｒ）は、次の場合、ステップ３０４で、所与の遺伝子座に対するＬ２Ｒと有意に異なると決定され得る。（ｉ）２つの最も近い隣接遺伝子座（例えば、遺伝子座、ＳＮＰ遺伝子座、及び／又はイントロン）に対する平均コピー数は、第１の指定された閾値及びカバレッジ比（例えば、ｌｏｇ２カバレッジ比）の画分差以下である。例えば、画分差は、｜（Ｌ２Ｒ_ｉ－Ｌ２Ｒ_ｉ＋１）｜／（ｍａｘ［Ｌ２Ｒ_ｉ，Ｌ２Ｒ_ｉ＋１］）として定義され得、式中ｉは、隣接する遺伝子座のゲノムインデックスであり、２つの最も近い隣接遺伝子座について、第２の指定された閾値以下であるか、又は（ｉｉ）現在の遺伝子座（遺伝子座ｉ）の予測されるコピー数が、ゼロ以下であり（上記のように、予測されるコピー数値は、カバレッジ比（又はｌｏｇ２カバレッジ比）データの統計的変動に起因して負の場合がある）、最も近い隣接遺伝子座ｉ＋１（例えば、最も近い隣接遺伝子座、ＳＮＰ遺伝子座、及び／又はイントロン）の予測されるコピー数がゼロ以下であり、画分差（上記に定義される）が、第１の指定された閾値未満であり、（ｉｉｉ）両側ｐ値が第３の指定された閾値未満である。いくつかの例では、第１の指定された閾値、第２の指定された閾値、及び第３の指定された閾値は、各々独立して、約０．０００００１～約０．３の範囲であり得る。いくつかの例では、第１の指定された閾値、第２の指定された閾値、及び第３の指定された閾値は、各々独立して、少なくとも若しくは約０．０００００１、少なくとも若しくは約０．００００１、少なくとも若しくは約０．０００１、少なくとも若しくは約０．００１、少なくとも若しくは約０．００２、少なくとも若しくは約０．００３、少なくとも若しくは約０．００４、少なくとも若しくは約０．００５、少なくとも若しくは約０．０１、少なくとも若しくは約０．０２、少なくとも若しくは約０．０３、少なくとも若しくは約０．０４、少なくとも若しくは約０．０５、少なくとも若しくは約０．０６、少なくとも若しくは約０．０７、少なくとも若しくは約０．０８、少なくとも若しくは約０．０９、少なくとも若しくは約０．１、少なくとも若しくは約０．１２、少なくとも若しくは約０．１４、少なくとも若しくは約０．１６、少なくとも若しくは約０．１８、少なくとも若しくは約０．２０、少なくとも若しくは約０．２２、少なくとも若しくは約０．２４、少なくとも若しくは約０．２６、少なくとも若しくは約０．２８、又は少なくとも若しくは約０．３０であり得る。

【0081】

いくつかの例では、例えば、試料純度が、指定された純度閾値を上回る場合、所与の遺伝子座のｌｏｇ２カバレッジ比は、隣接していない遺伝子座、一塩基多型（ＳＮＰ）、及び／又はイントロンの分布と有意に異なると決定され得、ステップ３０４では、２つの最も近い隣接遺伝子座（例えば、遺伝子座、ＳＮＰ遺伝子座、及び／又はイントロン）に対する平均コピー数が第１の指定された閾値未満であり、ｌｏｇ２カバレッジ比の画分差（上記に定義される）が第２の指定された閾値未満であり、かつ両側ｐ値が第３の指定された閾値未満である場合。これらの例では、第１の指定された閾値、第２の指定された閾値、及び第３の指定された閾値は、各々独立して、約０．０００００１～約０．３の範囲であり得る。いくつかの例では、第１の指定された閾値、第２の指定された閾値、及び第３の指定された閾値は、各々独立して、少なくとも若しくは約０．０００００１、少なくとも若しくは約０．００００１、少なくとも若しくは約０．０００１、少なくとも若しくは約０．００１、少なくとも若しくは約０．００２、少なくとも若しくは約０．００３、少なくとも若しくは約０．００４、少なくとも若しくは約０．００５、少なくとも若しくは約０．０１、少なくとも若しくは約０．０２、少なくとも若しくは約０．０３、少なくとも若しくは約０．０４、少なくとも若しくは約０．０５、少なくとも若しくは約０．０６、少なくとも若しくは約０．０７、少なくとも若しくは約０．０８、少なくとも若しくは約０．０９、少なくとも若しくは約０．１、少なくとも若しくは約０．１２、少なくとも若しくは約０．１４、少なくとも若しくは約０．１６、少なくとも若しくは約０．１８、少なくとも若しくは約０．２０、少なくとも若しくは約０．２２、少なくとも若しくは約０．２４、少なくとも若しくは約０．２６、少なくとも若しくは約０．２８、又は少なくとも若しくは約０．３０であり得る。

【0082】

図３のステップ３０８では、所与の遺伝子座に対するＬ２Ｒは、例えば、両側ｐ値が指定された閾値未満である場合、隣接していない遺伝子座、一塩基多型（ＳＮＰ）、及び／又はイントロンに対するＬ２Ｒの分布とは有意に異なると決定され得る。

【0083】

図４は、重複遺伝子呼び出しを枝刈り及び併合するためのプロセス（又はサブルーチン）４００の非限定的な例を提供する。上記のように、重複呼び出しは、例えば、遺伝子配列が２つの部分配列に破壊され、両方の部分配列が増幅又は欠失を含む遺伝子座として呼び出される場合、又は欠失が、コピー数モデルデータから直接得られるコピー数予測、及び部分欠失スキャン法の両方を使用して、遺伝子座に対して呼び出された場合に生じ得る。プロセスは、同じ遺伝子名を有する各遺伝子オブジェクトをレビューすることによってステップ４０２で始まる。ステップ４０４では、全ての対応するゲノム区間（例えば、所与の遺伝子座にアラインメントされた配列リード）が同じ遺伝子オブジェクトに対して呼び出されたか否かの決定が行われる。呼び出された場合、遺伝子オブジェクトは、ステップ４０６でリターンされる（全ての遺伝子オブジェクトがレビューされた後、枝刈り及び併合プロセスは、図２に例示されるプロセス２００にリターンする）。呼び出されていない場合、重複呼び出しが、どの呼び出しが枝刈りされるべきであり、どの呼び出しが保存され、併合されるべきかを決定するためにレビューされる。保存された重複遺伝子オブジェクトの属性（例えば、遺伝子標的配列、Ｌ２Ｒデータ、増幅又は欠失ステータスなど）がステップ４０８で併合され、その後、ステップ４０６でメインプロセスにリターンされる。

【0084】

併合されることになる重複遺伝子呼び出しは、同一、重複、又は完全な遺伝子配列の部分配列である、遺伝子配列を含み得る。例えば、枝刈りステップは、１つの遺伝子オブジェクトが、全遺伝子配列にまたがり、同じ遺伝子に対する別の遺伝子オブジェクトが部分配列であるときに、頻繁に実施される。

【0085】

図５は、遺伝子座に対応する遺伝子オブジェクトのプロパティを選択又は更新するためのプロセス５００の非限定的な例を提供する。プロセスは、各遺伝子オブジェクトのレビューを伴うステップ５０２で始まる。ステップ５０４では、遺伝子オブジェクトに対してステータスが設定される（例えば、遺伝子のタイプ、変化の関連性、コピー数事象の所与のサイズ、増幅又は欠失呼び出しの信頼性、遺伝子が既知又は未知であるかどうかなど）。

【0086】

図５のステップ５０６では、欠失呼び出しが遺伝子に対して行われたかどうかを決定するために遺伝子オブジェクトが評価される。行われた場合、欠失呼び出しに対する信頼性評価がステップ５０８で行われる。行われていない場合、ステップ５１０で、増幅呼び出しが遺伝子に対して行われたかどうかを決定するために遺伝子オブジェクトが評価される。行われた場合、増幅呼び出しに対する信頼性評価（増幅曖昧度評価）がステップ５１２で行われる。行われていない場合、サブクローナル欠失に対する信頼性評価がステップ５１４で行われる。

【0087】

図５のステップ５０８で行われる欠失呼び出し信頼性評価は、試料のバルク純度（すなわち、試料のバルク腫瘍塊を特性評価するコピー数モデルによって決定されるパラメータ、又は言い換えると、試料中の腫瘍組織によって呈されるコピー数の範囲をカバーするコピー数値）がどうかを決定することと、第１の指定されたバルク純度閾値とのバルク純度の比較に基づいて、欠失が呼び出された各遺伝子オブジェクトに対する真又は偽の品質管理ステータスを割り当てることと、を含み得る。

【0088】

図５のステップ５１２で行われる増幅曖昧度評価は、遺伝子座がマッピングする対応するセグメントのコピー数が試料の倍数性＋第１の指定された倍数性差閾値以下である場合、増幅曖昧として１つ以上の遺伝子座のうちの所与の遺伝子座に対するステータスを設定することを含み得る。

【0089】

いくつかの例では、図５のステップ５１２で行われる増幅曖昧度評価は、遺伝子座がマッピングする対応するセグメントのコピー数が試料の倍数性＋第２の指定された倍数性差閾値以下であり、かつ遺伝子座が第２の指定されたコピー数閾値を下回るコピー数で呼び出される第３の定義済み遺伝子座セット内に含まれない場合、増幅曖昧として１つ以上の遺伝子座のうちの所与の遺伝子座に対するステータスを設定することを含み得る。

【0090】

いくつかの例では、図５のステップ５１２で行われる増幅曖昧度評価は、遺伝子座がマッピングする対応するセグメントのコピー数が試料の倍数性＋第３の指定された倍数性差閾値と等しく、かつ遺伝子座が第４の定義済み遺伝子座セット内に含まれる場合、増幅曖昧として１つ以上の遺伝子座のうちの所与の遺伝子座に対するステータスを設定することを含み得る。

【0091】

いくつかの例では、図５のステップ５１２で行われる増幅曖昧度評価は、遺伝子座がマッピングする対応するセグメントのコピー数が試料の倍数性＋第４の指定された倍数性差閾値と等しく、かつ遺伝子座が第５の定義済み遺伝子座セット内に含まれる場合、増幅曖昧として１つ以上の遺伝子座のうちの所与の遺伝子座に対するステータスを設定することを含み得る。

【0092】

いくつかの例では、第１の指定された倍数性差閾値、第２の指定された倍数性差閾値、第３の指定された倍数性差閾値、及び第４の指定された倍数性差閾値は、各々独立して、１～１２の範囲であり得る（例えば、整数又は浮動小数点数）。いくつかの例では、第１の指定された倍数性差閾値、第２の指定された倍数性差閾値、第３の指定された倍数性差閾値、及び第４の指定された倍数性差閾値は、各々独立して、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、又は少なくとも１２である。いくつかの例では、第１の指定された倍数性差閾値、第２の指定された倍数性差閾値、第３の指定された倍数性差閾値、及び第４の指定された倍数性差閾値は、各々独立して、最大で１２、最大で１１、最大で１０、最大で９、最大で８、最大で７、最大で６、最大で５、最大で４、最大で３、最大で２、又は最大で１である。この段落で説明された下限及び上限値のうちのいずれかは、本開示内に含まれる範囲を形成するために組み合わせられ得、例えば、いくつかの例では、第１の指定された倍数性差閾値、第２の指定された倍数性差閾値、第３の指定された倍数性差閾値、及び第４の指定された倍数性差閾値は、各々独立して、２～１１の範囲であり得る。

【0093】

いくつかの例では、第２の指定されたコピー数閾値は、２～１２の範囲である。いくつかの例では、第２の指定されたコピー数閾値は、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、又は少なくとも１２である。いくつかの例では、第２の指定されたコピー数閾値は、最大で１２、最大で１１、最大で１０、最大で９、最大で８、最大で７、最大で６、最大で５、最大で４、最大で３、又は最大で２であり得る。この段落に説明された下限値及び上限値のいずれかは、本開示内に含まれる範囲を形成するように組み合わせられてもよく、例えば、いくつかの例では、第２の指定されたコピー数閾値は、３～７の範囲であってもよい。

【0094】

いくつかの例では、第３の定義済み遺伝子座セット、第４の定義済み遺伝子座セット、及び第５の定義済み遺伝子座セットは、各々独立して、ＥＲＢＢ２遺伝子座、ＡＲ遺伝子座、又はそれらの任意の組み合わせを含み得る。

【0095】

図５のステップ５１８では、サブクローナル欠失呼び出しに対する信頼性評価が行われる。いくつかの例では、欠失が遺伝子座に対して呼び出された場合、コピー数モデルが成功して収束した場合、試料純度が指定された純度閾値を超える場合、第１の分離係数と分離との積がカバレッジ比の差未満である場合、及びカバレッジ比の差が第２の分離係数と分離との積未満である場合、「サブクローナル欠失曖昧」のステータスが設定される。分離は、試料純度及び倍数性に基づくコピー数モデルパラメータであり得、例えば、分離は、β_１＝ρ／（Ψρ＋２（１－ρ））であり、式中、ρは、試料純度（腫瘍画分）であり、Ψは、試料倍数性である。カバレッジ比の差は、メジャー及びマイナー対立遺伝子に対するカバレッジ比の合計（Ｒ_ａ＋Ｒ_ｂ、平均カバレッジ比の２倍に等しい）－コピー数モデルに対するゼロレベル（又は基底状態）パラメータ、β_０＝（２（１－ρ））／（Ψρ＋２（１－ρ））と等しくなり得る。

【0096】

いくつかの例では、指定された純度閾値は、０～１の範囲である。いくつかの例では、指定された純度閾値は、少なくとも０、少なくとも０．０５、少なくとも０．１、少なくとも０．２、少なくとも０．３、少なくとも０．４、少なくとも０．５、少なくとも０．６、少なくとも０．７、少なくとも０．８、少なくとも０．９、又は少なくとも０．９５である。いくつかの例では、指定された純度閾値は、最大で１、最大で０．９５、最大で０．９、最大で０．８、最大で０．７、最大で０．６、最大で０．５、最大で０．４、最大で０．３、最大で０．２、最大で０．１、最大で０．０５である。この段落に説明された下限値及び上限値のいずれかは、本開示内に含まれる範囲を形成するように組み合わせられてもよく、例えば、いくつかの例では、第２の指定された純度閾値は、０．１～０．７の範囲であってもよい。

【0097】

いくつかの例では、第１の分離係数は、０．１０～０．３０の範囲である。いくつかの例では、第１の分離係数は、少なくとも０．１、少なくとも０．１５、少なくとも０．２、少なくとも０．２５、又は少なくとも０．３である。いくつかの例では、第１の分離係数は、最大で０．３、最大で０．２５、最大で０．２、最大で０．１５、又は最大で０．１である。この段落に説明された下限値及び上限値のいずれかは、本開示内に含まれる範囲を形成するように組み合わせられてもよく、例えば、いくつかの例では、第１の分離係数は、０．１５～０．２５の範囲であってもよい。

【0098】

いくつかの例では、第２の分離係数は、０．５０～０．９０の範囲である。いくつかの例では、第２の分離係数は、少なくとも０．５、少なくとも０．６、少なくとも０．７、少なくとも０．８、又は少なくとも０．９である。いくつかの例では、第２の分離係数は、最大で０．９、最大で０．８、最大で０．７、最大で０．６、又は最大で０．５である。この段落に説明された下限値及び上限値のいずれかは、本開示内に含まれる範囲を形成するように組み合わせられてもよく、例えば、いくつかの例では、第２の分離係数は、０．６～０．８の範囲であってもよい。

【0099】

図５のステップ５１６では、増幅又は欠失呼び出しが上記に説明されるように曖昧であると決定された場合、「曖昧」の最終ステータスが遺伝子座に対して設定され得る。ステップ５１８では、特別規則セット（例えば、開示されるＣＮＡ呼び出し手順が良好に実施されないと知られている特定の遺伝子座のリスト）が参照され、それにより、リストにある遺伝子座に対する呼び出しがフィルタ除去され得る。ステップ５２０では、１つ以上の遺伝子座に対する更新ステータス設定のプロセスが完了する。

【0100】

いくつかの例では、ＣＮＡの自動呼び出しのための開示される方法は、少なくとも１０、少なくとも２０、少なくとも３０、少なくとも４０、少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０、少なくとも９０、少なくとも１００、少なくとも１２０、少なくとも１４０、少なくとも１６０、少なくとも１８０、少なくとも２００、少なくとも２２０、少なくとも２４０、少なくとも２６０、少なくとも２８０、少なくとも３００、少なくとも３２０、少なくとも３４０、少なくとも３６０、少なくとも３８０、少なくとも４００、又は４００超の遺伝子座を含む、遺伝子座のパネルをカバーする配列リードデータに適用され得る。いくつかの例では、パネルは、例えば、少なくとも１００、少なくとも２００、少なくとも３００、少なくとも４００、少なくとも５００、少なくとも６００、少なくとも７００、少なくとも８００、少なくとも９００、少なくとも１，０００、少なくとも２，０００、少なくとも３，０００、少なくとも４，０００、少なくとも５，０００、少なくとも６００、少なくとも７，０００、少なくとも８，０００、少なくとも９，０００、又は少なくとも１０，０００ＳＮＰ遺伝子座を含む、複数のゲノムワイドＳＮＰ遺伝子座を更に含み得る。いくつかの例では、パネルは、遺伝子座、ＳＮＰ遺伝子座、エクソン遺伝子座、イントロン遺伝子座、又はそれらの任意の組み合わせを含む、少なくとも１００、少なくとも２００、少なくとも３００、少なくとも４００、少なくとも５００、少なくとも６００、少なくとも７００、少なくとも８００、少なくとも９００、少なくとも１，０００、少なくとも１，５００、少なくとも２，０００、少なくとも２，５００、少なくとも３，０００、少なくとも３，５００、少なくとも４，０００、少なくとも４，５００、少なくとも５，０００、少なくとも５，５００、少なくとも６，０００、少なくとも６，５００、少なくとも７，０００、少なくとも７，５００、少なくとも８，０００、少なくとも８，５００、少なくとも９，０００、少なくとも９，５００、少なくとも１０，０００、少なくとも１１，０００、少なくとも１２，０００、少なくとも１３，０００、少なくとも１４，０００、又は少なくとも１５，０００標的遺伝子座を含み得る。

【0101】

使用方法
いくつかの例では、開示された方法は、（ｉ）対象（例えば、がんを有することが疑われるか、又はがんを有すると決定された対象）から試料を取得するステップと、（ｉｉ）試料から核酸分子（例えば、腫瘍核酸分子と非腫瘍核酸分子との混合物）を抽出するステップと、（ｉｉｉ）試料から抽出された核酸分子に１つ以上のアダプター（例えば、１つ以上の増幅プライマー、フローセルアダプター配列、基質アダプター配列、又は試料インデックス配列）をライゲーションするステップと、（ｉｖ）（例えば、ポリメラーゼ連鎖反応（ＰＣＲ）増幅技術、非ＰＣＲ増幅技術、又は等温増幅技術を使用して）核酸分子を増幅するステップと、（ｖ）（例えば、捕捉された核酸分子の領域に相補的な領域をそれぞれ含む１つ以上の核酸分子をそれぞれ含む１つ以上のベイト分子へのハイブリダイゼーションによって）増幅された核酸分子から核酸分子を捕捉するステップと、（ｖｉ）例えば、次世代（例えば、大規模並列）シーケンサーを使用して、例えば、次世代（超並列）配列決定技術、全ゲノム配列決定（ＷＧＳ）技術、全エクソーム配列決定技術、標的配列決定技術、直接配列決定技術、又はサンガー配列決定技術を使用して、試料から抽出された核酸分子（又はそれに由来するライブラリプロキシ）を配列決定するステップと、（ｖｉｉ）対象（又は患者）、介護者、ヘルスケア提供者、医師、腫瘍学者、電子カルテシステム、病院、診療所、診療所、第三者支払人、保険会社、又は官公庁にレポート（例えば、電子レポート、ウェブベースのレポート、又は紙のレポート）を生成、表示、送信、及び／又は送達するステップと、のうちの１つ以上を更に含み得る。いくつかの例では、レポートは、本明細書に記載の方法からの出力を含む。いくつかの例では、レポートの全部又は一部は、オンライン又はウェブベースのヘルスケアポータルのグラフィカルユーザインターフェースに表示されることができる。いくつかの例では、レポートは、コンピュータネットワーク又はピアツーピア接続を介して送信される。

【0102】

開示される方法は、様々な試料のうちのいずれかとともに使用され得る。例えば、いくつかの例では、試料は、組織生検試料、液体生検試料、又は正常対照を含み得る。いくつかの例では、試料は、液体生検試料であり得、血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含み得る。いくつかの例では、試料は、液体生検試料であり得、循環腫瘍細胞（ＣＴＣ）を含み得る。いくつかの例では、試料は、液体生検試料であり得、無細胞ＤＮＡ（ｃｆＤＮＡ）、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）、又はそれらの任意の組み合わせを含み得る。

【0103】

いくつかの例では、試料から抽出された核酸分子は、腫瘍核酸分子と非腫瘍核酸分子との混合物を含むことができる。いくつかの例では、腫瘍核酸分子は、異種組織生検試料の腫瘍部分に由来することができ、非腫瘍核酸分子は、異種組織生検試料の正常部分に由来することができる。いくつかの例では、試料は、液体生検試料を含むことができ、腫瘍核酸分子は、液体生検試料の循環腫瘍ＤＮＡ（ｃｔＤＮＡ）画分に由来することができ、非腫瘍核酸分子は、液体生検試料の非腫瘍無細胞ＤＮＡ（ｃｆＤＮＡ）画分に由来することができる。

【0104】

いくつかの例では、コピー数変化（ＣＮＡ）の自動検出及び呼び出しのための開示される方法は、対象（例えば、患者）における疾患若しくは他の条件（例えば、がん、遺伝性疾患（ダウン症候群及び脆弱Ｘ）、神経疾患、又はコピー数が疾患の診断、処置、又は予測に関連する任意の他の疾患タイプ）の存在を診断するために使用され得る。いくつかの例では、開示される方法は、本明細書の他の箇所で説明されるように、様々ながんのうちのいずれかの診断に適用可能であり得る。

【0105】

いくつかの例では、自動ＣＮＡ呼び出しのための開示される方法が、胎児ＤＮＡの遺伝性疾患を予測するために使用され得る。（例えば、侵襲的又は非侵襲的出生前検査のために）。例えば、侵襲的羊水穿刺、絨毛絨毛サンプリング（ｃＶＳ）、若しくは胎児臍帯サンプリング技術を使用して得られた試料、又は無細胞ＤＮＡ（ｃｆＤＮＡ）試料の非侵襲的サンプリング（母体ｃｆＤＮＡと胎児ｃｆＤＮＡとの混合物を含む）を使用して得られた試料から抽出された胎児ＤＮＡを配列決定して得られた配列リードデータが、例えば、ダウン症（トリソミー２１）、トリソミー１８、トリソミー１３、Ｘ及びＹ染色体の余分なコピー又は欠損と関連付けられたコピー数変化を識別するために、開示される方法に従って処理され得る。

【0106】

いくつかの例では、自動ＣＮＡ呼び出しのための開示される方法は、１つ以上の遺伝子座に対して決定されたＣＮＡ値に基づいて、臨床試験のための対象（例えば、患者）を選択するために使用され得る。いくつかの例では、例えば、１つ以上の遺伝子座のＣＮＡの識別に基づく、臨床試験のための患者選択は、標的療法の開発を加速させ、処置決定の医療成果を改善する。

【0107】

いくつかの例では、コピー数変化（ＣＮＡ）の自動検出及び呼び出しのための開示される方法は、対象に対する適切な治療又は処置（例えば、がん治療又はがん処置）を選択するために使用され得る。いくつかの例では、例えば、がん治療又は処置は、ポリ（ＡＤＰ－リボース）ポリメラーゼ阻害薬（ＰＡＲＰｉ）、白金化合物、化学療法、放射線療法、標的療法（例えば、免疫療法）、外科手術、又はそれらの任意の組み合わせの使用を含み得る。

【0108】

いくつかの例では、コピー数変化（ＣＮＡ）の自動検出及び呼び出しのための開示される方法は、対象における疾患（例えば、がん）を治療する際に使用され得る。例えば、本明細書に開示される方法のうちのいずれかを使用して患者試料中の１つ以上の遺伝子座でＣＮＡが生じることを決定することに応答して、有効量のがん治療又はがん処置が対象に投与され得る。

【0109】

いくつかの例では、コピー数変化（ＣＮＡ）の自動検出及び呼び出しのための開示される方法は、対象における疾患の進行又は再発（例えば、がん又は腫瘍の進行又は再発）を監視するために使用され得る。例えば、いくつかの例では、方法は、第１の時点で対象から得られた第１の試料中のＣＮＡを検出するために使用されるとともに、第２の時点で患者から得られた第２の試料中のＣＮＡを検出するために使用され得、ＣＮＡの第１の決定及びＣＮＡの第２の決定の比較は、疾患の進行又は再発を監視することを可能にする。いくつかの例では、第１の時点は、患者が治療又は処置を投与される前に選択され、第２の時点は、対象が治療又は処置を投与された後に選択される。

【0110】

いくつかの例では、開示される方法は、例えば、呼び出されたコピー数変化（ＣＮＡ）の変化に応答して、処置用量を調整し、及び／又は異なる処置を選択することによって、対象に対する治療又は処置（例えば、がん処置又はがん治療）を調整するために使用され得る。

【0111】

いくつかの例では、開示される方法を使用して決定された、呼び出されたＣＮＡは、試料と関連付けられた予後又は診断指標として使用され得る。例えば、いくつかの例では、予後又は診断指標は、試料中の疾患（例えば、がん）の存在の指標、疾患（例えば、がん）が試料中に存在する可能性の指標、試料が由来した対象が疾患（例えば、がん）を発症することになる可能性の指標（すなわち、危険因子）、又は試料が由来した対象が特定の治療又は処置に応答することになる可能性の指標を含み得る。

【0112】

いくつかの例では、コピー数変化（ＣＮＡ）の自動検出及び呼び出しのための開示される方法は、特定の疾患、例えば、がんの検出、監視、危険因子の予測、又は処置の選択の一部として、対象に由来する試料中の１つ以上の遺伝子座における変異体配列の存在の識別を含むゲノムプロファイリングプロセスの一部として実装され得る。いくつかの例では、ゲノムプロファイリングのために選択される変異体パネルは、選択された遺伝子座セットにおける変異体配列の検出を含み得る。いくつかの例では、ゲノムプロファイリングのために選択される変異体パネルは、包括的ゲノムプロファイリング（ＣＧＰ）、単一のアッセイで数百の遺伝子（関連するがんバイオマーカーを含む）を評価するために使用される次世代配列決定（ＮＧＳ）アプローチを介して、いくつかの遺伝子座での変異体配列の検出を含み得る。ゲノムプロファイリングプロセスの一部として、コピー数変化（ＣＮＡ）の自動検出及び呼び出しのための開示される方法の含有（又は対象のゲノムプロファイルの一部として呼び出されたＣＮＡに対する、開示される方法からの出力の含有）は、例えば、所与の患者試料中の１つ以上の遺伝子座におけるＣＮＡの存在を独立して確認することによって、ゲノムプロファイルに基づいて行われる、例えば、疾患検出呼び出し及び処置決定の妥当性を改善し得る。

【0113】

いくつかの例では、ゲノムプロファイルは、個人のゲノム及び／又はプロテオームにおける遺伝子（又はその変異体配列）、コピー数変異、エピジェネティック形質、タンパク質（又はその改変）、及び／又は他のバイオマーカーの存在に関する情報、並びに個人の対応する表現型形質、並びに遺伝的又はゲノム形質、表現型形質、及び環境因子の間の相互作用に関する情報を含むことができる。

【0114】

いくつかの例では、被験者のゲノムプロファイルは、包括的ゲノムプロファイリング（ＣＧＰ）試験、核酸配列決定に基づく試験、遺伝子発現プロファイリング試験、がんホットスポットパネル試験、ＤＮＡメチル化試験、ＤＮＡ断片化試験、ＲＮＡ断片化試験、又はそれらの任意の組み合わせからの結果を含むことができる。

【0115】

いくつかの例では、方法は、生成されたゲノムプロファイルに基づいて、処置又は治療（例えば、抗がん剤、抗がん処置、又は抗がん治療）を対象に投与又は適用することを更に含み得る。抗がん剤又は抗がん処置は、がん細胞の処置に有効である化合物を指し得る。抗がん剤又は抗がん治療の例は、アルキル化剤、代謝拮抗物質、天然産物、ホルモン、化学療法、放射線療法、免疫療法、外科手術、又は特定の細胞シグナル伝達経路の欠陥、例えば、ＤＮＡミスマッチ修復（ＭＭＲ）経路の欠陥を標的とするように構成された治療を含むが、これらに限定されない。

【0116】

試料
開示される方法及びシステムは、対象（例えば、患者）から収集される核酸（例えば、ＤＮＡ又はＲＮＡ）を含む様々な試料（本明細書では検体とも呼ばれる）のうちのいずれかとともに使用され得る。例としては、限定されるものではないが、腫瘍試料、組織試料、生検試料、血液試料（例えば、末梢全血試料）、血漿試料、血清試料、リンパ試料、唾液試料、痰試料、尿試料、婦人科液試料、循環腫瘍細胞（ＣＴＣ）試料、脳脊髄液（ＣＳＦ）試料、心嚢液試料、胸水試料、腹水（腹膜液）試料、糞便（又は便）試料、又は他の体液、分泌物、及び／若しくは排泄物試料（あるいはそれらに由来する細胞試料）が挙げられる。ある特定の例では、試料は、凍結試料又はホルマリン固定パラフィン包埋（ＦＦＰＥ）試料であり得る。

【0117】

いくつかの例では、試料は、組織切除（例えば、外科的切除）、針生検、骨髄生検、骨髄吸引、皮膚生検、内視鏡生検、細針吸引、口腔スワブ、鼻腔スワブ、膣スワブ、又は細胞学的スミア、擦り傷、洗浄又は洗浄液（管腔洗浄液又は気管支肺胞洗浄液など）などによって収集され得る。

【0118】

いくつかの例では、試料は、液体生検試料であり、例えば、全血、血漿、血清、尿、便、痰、唾液、又は脳脊髄液を含み得る。いくつかの例では、試料は、液体生検試料であり得、循環腫瘍細胞（ＣＴＣ）を含み得る。いくつかの例では、試料は、液体生検試料であり得、無細胞ＤＮＡ（ｃｆＤＮＡ）、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）、又はそれらの任意の組み合わせを含み得る。

【0119】

いくつかの例では、試料は、１つ以上の前悪性又は悪性細胞を含み得る。本明細書で使用される場合、前悪性腫瘍とは、まだ悪性ではないが、悪性になる準備ができている細胞又は組織を指す。ある特定の例では、試料は、固形腫瘍、軟部組織腫瘍、又は転移性病変から取得され得る。ある特定の例では、試料は、血液悪性腫瘍又は前悪性腫瘍から取得され得る。他の例では、試料は、手術マージンからの組織又は細胞を含み得る。ある特定の例では、試料は、腫瘍浸潤リンパ球を含み得る。いくつかの例では、試料は、１つ以上の非悪性細胞を含み得る。いくつかの例では、試料は、原発性腫瘍又は転移（例えば、転移生検試料）であるか、又はその一部であり得る。いくつかの事例では、試料は、隣接部位（例えば、腫瘍に隣接する部位）と比較して、腫瘍（例えば、腫瘍細胞）のパーセントが最も高い部位（例えば、腫瘍部位）から得られ得る。いくつかの事例では、試料は、隣接部位（例えば、腫瘍に隣接する部位）と比較して、最大腫瘍病巣（例えば、顕微鏡下で視覚された際の最大数の腫瘍細胞）を有する部位（例えば、腫瘍部位）から得られ得る。

【0120】

いくつかの例では、開示される方法は、一次対照（例えば、正常組織試料）を分析することを更に含み得る。いくつかの例では、開示される方法は、一次対照が利用可能であるかどうかを決定すること、及び利用可能である場合、一次対照から対照核酸（例えば、ＤＮＡ）を単離することを更に含み得る。いくつかの例では、試料は、一次対照が利用可能ではない場合、任意の正常対照（例えば、正常隣接組織（ＮＡＴ））を含み得る。いくつかの例では、試料は、組織学的に正常な組織であり得るか、又はそれを含み得る。いくつかの例では、方法は、本明細書に説明される方法を使用して、試料、例えば、組織学的に正常な試料（例えば、外科的組織マージンから）を評価することを含む。いくつかの例では、開示される方法は、例えば、一次対照を伴わない試料中のＮＡＴからの非腫瘍組織をマクロ切開することによって、非腫瘍細胞が濃縮された部分試料を取得することを更に含み得る。いくつかの例では、開示される方法は、一次対照及びＮＡＴが利用できないと決定することと、マッチド対照なしで分析のために試料をマーキングすることとを更に含み得る。

【0121】

いくつかの例では、組織学的に正常な組織（例えば、そうでなければ組織学的に正常な組織マージン）から得られた試料は、依然として、本明細書に説明される変異体配列などの遺伝子変化を含み得る。したがって、方法は、検出された遺伝子変化の存在に基づいて、試料を再分類することを更に含み得る。いくつかの例では、複数の試料（例えば、異なる対象からの）が同時に処理される。

【0122】

開示される方法及びシステムは、様々な組織試料（又はその疾患状態）、例えば、固形組織試料、軟組織試料、転移性病変、又は液体生検試料のうちのいずれかから抽出された核酸の分析に適用され得る。組織の例としては、限定されるものではないが、結合組織、筋肉組織、神経系組織、上皮組織、及び血液が挙げられる。組織試料は、動物又は人体内の器官のいずれかから収集され得る。ヒト器官の例としては、脳、心臓、肺、肝臓、腎臓、膵臓、脾臓、甲状腺、乳腺、子宮、前立腺、大腸、小腸、膀胱、骨、皮膚等が挙げられるが、これらに限定されない。

【0123】

いくつかの例では、試料から抽出された核酸は、デオキシリボ核酸（ＤＮＡ）分子を含み得る。開示される方法による分析のために好適であり得るＤＮＡの例としては、限定されるものではないが、ミトコンドリアＤＮＡ又はその断片、無細胞ＤＮＡ（ｃｆＤＮＡ）、及び循環腫瘍ＤＮＡ（ｃｔＤＮＡ）が挙げられる。無細胞ＤＮＡ（ｃｆＤＮＡ）は、アポトーシス及びネクローシス中に正常及び／又はがん細胞から放出されるＤＮＡの断片から構成され、血流中を循環し、及び／又は他の体液中に蓄積する。循環腫瘍ＤＮＡ（ｃｆＤＮＡ）は、血流中を循環し、及び／又は他の体液中に蓄積するがん細胞及び腫瘍から放出されるＤＮＡの断片から構成される。

【0124】

いくつかの例では、ＤＮＡは、試料から有核細胞から抽出される。いくつかの例では、試料は、例えば、試料が主に赤血球、過剰な細胞質を含有する病変細胞、又は線維症を有する組織で構成される場合、有核細胞性が低い。いくつかの例では、有核細胞性が低い試料は、ＤＮＡ抽出のために、より多くの、例えば、より大きな組織体積を必要とし得る。

【0125】

いくつかの例では、試料から抽出された核酸は、リボ核酸（ＲＮＡ）分子を含み得る。開示される方法による分析のために好適であり得るＲＮＡの例としては、限定されるものではないが、総細胞ＲＮＡ、特定の存在量のＲＮＡ配列の枯渇後の総細胞ＲＮＡ（例えば、リボソームＲＮＡ）、無細胞ＲＮＡ（ｃｆＲＮＡ）、メッセンジャーＲＮＡ（ｍＲＮＡ）又はその断片、総ＲＮＡのポリ（Ａ）尾部ｍＲＮＡ画分、リボソームＲＮＡ（ｒＲＮＡ）又はその断片、転移ＲＮＡ（ｔＲＮＡ）又はその断片、及びミトコンドリアＲＮＡ又はその断片が挙げられる。いくつかの例では、ＲＮＡは、試料から抽出され、例えば、逆転写反応を使用して相補的ＤＮＡに変換され得る。いくつかの例では、ｃＤＮＡは、ランダムプライムｃＤＮＡ合成法によって産生される。他の例では、ｃＤＮＡ合成は、オリゴ（ｄＴ）含有オリゴヌクレオチドによるプライミングによって成熟ｍＲＮＡのポリ（Ａ）尾部で開始される。枯渇、ポリ（Ａ）濃縮、及びｃＤＮＡ合成のための方法は、当業者に周知である。

【0126】

いくつかの例では、試料は、例えば、腫瘍細胞又は腫瘍細胞核を含む、腫瘍含有量を含み得る。いくつかの例では、試料は、少なくとも５～５０％、１０～４０％、１５～２５％、又は２０～３０％の腫瘍細胞核を有する腫瘍含有量を含み得る。いくつかの例では、試料は、少なくとも５％、少なくとも１０％、少なくとも２０％、少なくとも３０％、少なくとも４０％、又は少なくとも５０％の腫瘍細胞核の腫瘍含有量を含み得る。いくつかの例では、腫瘍核のパーセントは、試料中の腫瘍細胞の数を、核を有する試料中の全ての細胞の総数で除算することによって決定（例えば、計算）される。いくつかの例では、例えば、試料が肝細胞を含む肝臓試料であるとき、異なる腫瘍含有量計算が、２倍又は２倍超の核を有する肝細胞の存在、他のＤＮＡ含有量、例えば、非肝細胞、体細胞核の存在に起因して必要とされ得る。いくつかの例では、遺伝子変化、例えば、変異体配列の検出の感度、又は、例えば、マイクロサテライト不安定性の決定の感度は、試料の腫瘍含有量に依存し得る。例えば、より低い腫瘍含有量を有する試料は、所与のサイズの試料に対する検出のより低い感度を結果的にもたらし得る。

【0127】

いくつかの例では、上記のように、試料は、例えば、腫瘍からの、又は正常組織からの、核酸（例えば、ＤＮＡ、ＲＮＡ（又はＲＮＡに由来するｃＤＮＡ）、又は両方）を含む。ある特定の例では、試料は、例えば、腫瘍又は正常組織由来の非核酸成分、例えば、細胞、タンパク質、炭水化物、又は脂質を更に含み得る。

【0128】

対象
いくつかの例では、試料は、ある条件若しくは疾患（例えば、過剰増殖性疾患又は悲がん指標）を有するか、又はある条件若しくは疾患を有すると疑われる対象（例えば、患者）から得られる（例えば、収集される）。いくつかの例では、過剰増殖性疾患は、がんである。いくつかの例では、がんは、固形腫瘍又はその転移性形態である。いくつかの例では、がんは、血液がん、例えば、白血病又はリンパ腫である。

【0129】

いくつかの例では、対象は、がんを有するか、又はがんを有するリスクがある。例えば、いくつかの例では、対象は、がん（例えば、がんを発症するためのベースラインのリスクを増加させる遺伝子変異を有すること）に対する遺伝的素因を有する。いくつかの例では、対象は、がんを発症するリスクを増加させる環境変動（例えば、放射線又は化学物質）に曝露されている。いくつかの例では、対象は、がんの発症について監視されることを必要とする。いくつかの例では、対象は、例えば、がん治療で処置された後に、がんの進行又は退縮について監視されることを必要としている。いくつかの例では、対象は、がんの再発について監視されることを必要としている。いくつかの例では、対象は、微小残存病変（ＭＲＤ）について監視されることを必要としている。いくつかの例では、対象は、がんに対して処置されていたか、又は処置されている。いくつかの例では、対象は、がん治療（又はがん処置）で処置されていない。

【0130】

いくつかの例では、対象（例えば、患者）は、１つ以上の標的療法で処置されているか、又は以前に処置されたことがある。いくつかの例では、例えば、標的療法で以前に処置されたことがある患者について、標的療法後試料（例えば、検体）が得られる（例えば、収集される）。いくつかの例では、標的療法後試料は、標的療法の完了後に得られた試料である。

【0131】

いくつかの例では、患者は、標的療法で以前に処置されていない。いくつかの例では、例えば、以前に標的療法で処置されていない患者について、試料は、切除、例えば、元の切除、又は再発後の切除（例えば、治療後の疾患再発後）。

【0132】

がん
いくつかの例では、試料は、がんを有する対象から取得される。例示的ながんとしては、限定されるものではないが、Ｂ細胞がん（例えば、多発性骨髄腫）、黒色腫、乳がん、肺がん（非小細胞肺がん又はＮＳＣＬＣなど）、気管支がん、結腸直腸がん、前立腺がん、膵臓がんが含まれるが、これらに限定されない、胃がん、卵巣がん、膀胱がん、脳又は中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮がん又は子宮内膜がん、口腔又は咽頭がん、肝がん、腎臓がん、精巣がん、胆道がん、小腸又は付属器がん、唾液腺がん、甲状腺がん、副腎腺がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫瘍、胃腸間質腫瘍（ＧＩＳＴ）、結腸がん、多発性骨髄腫（ＭＭ）、骨髄異形成症候群（ＭＤＳ）、骨髄増殖性障害（ＭＰＤ）、急性リンパ性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性骨髄性白血病（ＣＭＬ）、慢性リンパ性白血病（ＣＬＬ）、多発性細胞血症ベラ、ホジキンリンパ腫、非ホジキンリンパ腫（ＮＨＬ）、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨形成性肉腫、脊索腫、血管肉腫、内皮肉腫滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭がん、乳頭腺がん、髄質がん、気管支原性がん、腎細胞がん、肝細胞腫、胆管がん、絨毛がん、セミノーマ、胚性がん腫、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星状細胞腫、髄芽細胞腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽細胞腫、聴神経腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、アグノーゲン性骨髄性化生、高好酸球性症候群、全身性肥満細胞症、家族性高好酸球増加症、慢性好酸球性白血病、神経内分泌がん、がん様腫瘍などが挙げられる。

【0133】

いくつかの例では、がんは、血液悪性腫瘍（又は前悪性腫瘍）である。本明細書で使用される場合、血液悪性腫瘍は、造血又はリンパ組織の腫瘍、例えば血液、骨髄、又はリンパ節に影響を及ぼす腫瘍を指す。例示的な血液悪性腫瘍には、白血病（例えば、急性リンパ芽球性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性リンパ性白血病（ＣＬＬ）、慢性骨髄性白血病（ＣＭＬ）、有毛細胞白血病、急性単球性白血病（ＡＭｏＬ）、慢性骨髄単球性白血病（ＣＭＭＬ）、若年性骨髄単球性白血病（ＪＭＭＬ）、又は大顆粒リンパ性白血病）、リンパ腫（例えば、ＡＩＤＳ関連リンパ腫、皮膚Ｔ細胞リンパ腫、ホジキンリンパ腫（例えば、古典的ホジキンリンパ腫又は結節性リンパ球優位型ホジキンリンパ腫）、菌状息肉症、非ホジキンリンパ腫（例えば、Ｂ細胞非ホジキンリンパ腫（例えば、バーキットリンパ腫、小リンパ性リンパ腫（ＣＬＬ／ＳＬＬ）、びまん性大細胞型Ｂ細胞リンパ腫、濾胞性リンパ腫、免疫芽球性大細胞リンパ腫、前駆Ｂリンパ芽球性リンパ腫、又はマントル細胞リンパ腫）又はＴ細胞非ホジキンリンパ腫（菌状息肉症、未分化大細胞リンパ腫、又は前駆Ｔリンパ芽球性リンパ腫））、原発性中枢神経系が含まれるが、これらに限定されない。

【0134】

核酸抽出及び処理
ＤＮＡ又はＲＮＡは、当業者に既知の様々な技術のうちのいずれかを使用して、組織試料、生検試料、血液試料、又は他の体液試料から抽出され得る（例えば、国際特許出願公開第２０１２／０９２４２６号の実施例１、Ｔａｎ，ｅｔａｌ．（２００９），“ＤＮＡ，ＲＮＡ，ａｎｄＰｒｏｔｅｉｎＥｘｔｒａｃｔｉｏｎ：ＴｈｅＰａｓｔａｎｄＴｈｅＰｒｅｓｅｎｔ”，Ｊ．Ｂｉｏｍｅｄ．Ｂｉｏｔｅｃｈ．２００９：５７４３９８、ｔｈｅｔｅｃｈｎｉｃａｌｌｉｔｅｒａｔｕｒｅｆｏｒｔｈｅＭａｘｗｅｌｌ（登録商標）１６ＬＥＶＢｌｏｏｄＤＮＡＫｉｔ（ＰｒｏｍｅｇａＣｏｒｐｏｒａｔｉｏｎ，Ｍａｄｉｓｏｎ，ＷＩ）、及びｔｈｅＭａｘｗｅｌｌ１６ＢｕｃｃａｌＳｗａｂＬＥＶＤＮＡＰｕｒｉｆｉｃａｔｉｏｎＫｉｔＴｅｃｈｎｉｃａｌＭａｎｕａｌ（ＰｒｏｍｅｇａＬｉｔｅｒａｔｕｒｅ＃ＴＭ３３３，Ｊａｎｕａｒｙ１，２０１１，ＰｒｏｍｅｇａＣｏｒｐｏｒａｔｉｏｎ，Ｍａｄｉｓｏｎ，ＷＩ）を参照されたい）。ＲＮＡ単離のためのプロトコルは、例えば、Ｍａｘｗｅｌｌ（登録商標）１６ＴｏｔａｌＲＮＡＰｕｒｉｆｉｃａｔｉｏｎＫｉｔＴｅｃｈｎｉｃａｌＢｕｌｌｅｔｉｎ（ＰｒｏｍｅｇａＬｉｔｅｒａｔｕｒｅ＃ＴＢ３５１、２００９年８月、ＰｒｏｍｅｇａＣｏｒｐｏｒａｔｉｏｎ、Ｍａｄｉｓｏｎ、ＷＩ）に開示されている。

【0135】

典型的なＤＮＡ抽出手順は、例えば、（ｉ）ＤＮＡが抽出されることになる流体試料、細胞試料、又は組織試料の収集と、（ｉｉ）必要な場合、ＤＮＡ及び他の細胞質成分を放出するための細胞膜の破壊（すなわち、細胞溶解）と、（ｉｉｉ）タンパク質、脂質、及びＲＮＡを沈殿させるための濃厚塩溶液による液体試料又は溶解した試料の処置、その後の、沈殿したタンパク質、脂質、及びＲＮＡを分離するための遠心分離と、（ｉｖ）細胞膜溶解ステップ中に使用された洗剤、タンパク質、塩、又は他の試薬を除去するための上清からのＤＮＡの精製と、を含む。

【0136】

細胞膜の破壊は、様々な機械的剪断（例えば、フレンチプレス又は細針）又は超音波破壊技術を使用して実施され得る。細胞溶解ステップは、多くの場合、脂質、細胞及び核膜を溶解するための洗剤及び界面活性剤の使用を含む。いくつかの例では、溶解ステップは、タンパク質を破壊するためのプロテアーゼの使用、及び／又は試料中のＲＮＡの消化のためのＲＮａｓｅの使用を更に含み得る。

【0137】

ＤＮＡ精製のための好適な技術の例としては、限定されるものではないが、（ｉ）氷冷エタノール又はイソプロパノール中の沈殿、その後の遠心分離（例えば、酢酸ナトリウムの添加による、イオン強度を増加させることによって増強され得るＤＮＡの沈殿）と、（ｉｉ）フェノール－クロロホルム抽出、その後の、核酸を含有する水相を、変性タンパク質を含有する有機相から分離するための遠心分離と、（ｉｉｉ）核酸が緩衝液のｐＨ及び塩濃度に応じて固相（例えば、シリカ又はその他）に吸着する固相クロマトグラフィーと、が挙げられる。

【0138】

いくつかの例では、ＤＮＡに結合された細胞及びヒストンタンパク質は、プロテアーゼを添加することによって、又は酢酸ナトリウム若しくは酢酸アンモニウムでタンパク質を沈殿させることによって、あるいはＤＮＡ沈殿ステップの前のフェノール－クロロホルム混合物による抽出を通じて除去され得る。

【0139】

いくつかの例では、ＤＮＡは、様々な好適な市販のＤＮＡ抽出及び精製キットのうちのいずれかを使用して抽出され得る。例としては、限定されるものではないが、Ｑｉａｇｅｎ（Ｇｅｒｍａｎｔｏｗｎ、ＭＤ）製のＱＩＡａｍｐ（ヒト試料からのゲノムＤＮＡの単離用）及びＤＮＡｅａｓｙ（動物又は植物試料からのゲノムＤＮＡの単離用）キット、又はＰｒｏｍｅｇａ（Ｍａｄｉｓｏｎ、ＷＩ）製のＭａｘｗｅｌｌ（登録商標）及びＲｅｌｉａＰｒｅｐ（商標）シリーズが挙げられる。

【0140】

上記のように、いくつかの例では、試料は、ホルマリン固定（ホルムアルデヒド固定、又はパラホルムアルデヒド固定）、パラフィン包埋（ＦＦＰＥ）組織調製を含み得る。例えば、ＦＦＰＥ試料は、基質、例えば、ＦＦＰＥブロックに包埋された組織試料であり得る。ホルムアルデヒド固定又はパラホルムアルデヒド固定、パラフィン包埋（ＦＦＰＥ）組織から核酸（例えば、ＤＮＡ）を単離するための方法が、例えば、Ｃｒｏｎｉｎ，ｅｔａｌ．，（２００４）ＡｍＪＰａｔｈｏｌ．１６４（１）：３５－４２、Ｍａｓｕｄａ，ｅｔａｌ．，（１９９９）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２７（２２）：４４３６－４４４３、Ｓｐｅｃｈｔ，ｅｔａｌ．，（２００１）ＡｍＪＰａｔｈｏｌ．１５８（２）：４１９－４２９、ＡｍｂｉｏｎＲｅｃｏｖｅｒＡｌｌ（商標）ＴｏｔａｌＮｕｃｌｅｉｃＡｃｉｄＩｓｏｌａｔｉｏｎＰｒｏｔｏｃｏｌ（Ａｍｂｉｏｎ，Ｃａｔ．Ｎｏ．ＡＭ１９７５，Ｓｅｐｔｅｍｂｅｒ２００８）、Ｍａｘｗｅｌｌ（登録商標）１６ＦＦＰＥＰｌｕｓＬＥＶＤＮＡＰｕｒｉｆｉｃａｔｉｏｎＫｉｔＴｅｃｈｎｉｃａｌＭａｎｕａｌ（ＰｒｏｍｅｇａＬｉｔｅｒａｔｕｒｅ＃ＴＭ３４９，Ｆｅｂｒｕａｒｙ２０１１）、Ｅ．Ｚ．Ｎ．Ａ．（登録商標）ＦＦＰＥＤＮＡＫｉｔＨａｎｄｂｏｏｋ（ＯＭＥＧＡｂｉｏ－ｔｅｋ，Ｎｏｒｃｒｏｓｓ，ＧＡ，ｐｒｏｄｕｃｔｎｕｍｂｅｒｓＤ３３９９－００，Ｄ３３９９－０１，ａｎｄＤ３３９９－０２，Ｊｕｎｅ２００９）、並びにＱＩＡａｍｐ（登録商標）ＤＮＡＦＦＰＥＴｉｓｓｕｅＨａｎｄｂｏｏｋ（Ｑｉａｇｅｎ，Ｃａｔ．Ｎｏ．３７６２５，Ｏｃｔｏｂｅｒ２００７）に開示されている。例えば、ＲｅｃｏｖｅｒＡｌｌ（商標）ＴｏｔａｌＮｕｃｌｅｉｃＡｃｉｄＩｓｏｌａｔｉｏｎＫｉｔは、高温でキシレンを使用してパラフィン包埋試料を可溶化し、ガラス繊維フィルタにかけて核酸を捕捉する。Ｍａｘｗｅｌｌ（登録商標）１６ＦＦＰＥＰｌｕｓＬＥＶＤＮＡＰｕｒｉｆｉｃａｔｉｏｎＫｉｔを、Ｍａｘｗｅｌｌ（登録商標）１６Ｉｎｓｔｒｕｍｅｎｔとともに、ＦＦＰＥ組織の１から１０μｍ切片のゲノムＤＮＡを精製するために使用する。シリカクラッド常磁性粒子（ＰＭＰ）を用いてＤＮＡを精製し、低溶出容量で溶出する。Ｅ．Ｚ．Ｎ．Ａ．（登録商標）ＦＦＰＥＤＮＡＫｉｔは、ゲノムＤＮＡの単離のためにスピンカラム及び緩衝系を使用する。ＱＩＡａｍｐ（登録商標）ＤＮＡＦＦＰＥＴｉｓｓｕｅＫｉｔは、ゲノム及びミトコンドリアＤＮＡの精製にＱＩＡａｍｐ（登録商標）ＤＮＡＭｉｃｒｏｔｅｃｈｎｏｌｏｇｙを使用する。

【0141】

いくつかの例では、開示される方法は、試料から抽出された核酸の収量値を決定又は取得することと、決定された値を参照値と比較することを更に含み得る。例えば、決定又は取得された値が参照値未満である場合、核酸は、ライブラリ構築を進める前に増幅され得る。いくつかの例では、開示される方法は、試料中の核酸断片のサイズ（又は平均サイズ）に対する値を決定又は取得することと、決定又は取得された値を、参照値、例えば、少なくとも１００、２００、３００、４００、５００、６００、７００、８００、９００、又は１０００塩基対（ｂｐｓ）のサイズ（又は平均サイズ）と比較することと、を更に含み得る。いくつかの例では、本明細書に説明される１つ以上のパラメータは、この決定に応答して、調整又は選択され得る。

【0142】

単離後、核酸は、典型的には、わずかにアルカリ性の緩衝液、例えば、Ｔｒｉｓ－ＥＤＴＡ（ＴＥ）緩衝液中、又は超純水中で溶解される。いくつかの例では、単離された核酸（例えば、ゲノムＤＮＡ）は、当業者に既知の様々な技術のうちのいずれかを使用することによって、断片化又は剪断され得る。例えば、ゲノムＤＮＡは、物理的剪断法、酵素的切断法、化学的切断法、及び当業者に周知の他の方法によって断片化され得る。ＤＮＡ剪断のための方法は、例えば、国際特許出願公開第２０１２／０９２４２６号の実施例４に説明されている。いくつかの例では、ＤＮＡ剪断法の代替法を使用して、ライブラリ調製中のライゲーションステップを回避することができる。

【0143】

ライブラリ調製
いくつかの例では、試料から単離された核酸は、ライブラリを構築するために使用され得る（例えば、本明細書に説明される核酸ライブラリ）。いくつかの例では、核酸は、上記に説明された方法のうちのいずれかを使用して断片化され、任意選択的に、鎖末端損傷の修復に供され、任意選択的に、アダプター、プライマー、及び／若しくはバーコード（例えば、増幅プライマー、配列アダプター、フローセルアダプター、基質アダプター、試料バーコード若しくはインデックス、及び／又は固有の分子識別子配列）を合成するためにライゲーションされ、サイズ選択され（例えば、分取ゲル電気泳動による）、並びに／又は増幅される（例えば、ＰＣＲ、非ＰＣＲ増幅技術、又は等温増幅技術を使用して）。いくつかの例では、断片化及びアダプターライゲーションされた核酸群は、標的配列のハイブリダイゼーションベースの選択の前に明示的なサイズ選択又は増幅なしに使用される。いくつかの例では、核酸は、当業者に周知の様々な特異的又は非特異的核酸増幅方法のうちのいずれかによって増幅される。いくつかの例では、核酸は、例えば、ランダムプライム鎖置換増幅などの全ゲノム増幅法によって増幅される。次世代配列決定のための核酸ライブラリ調製技術の例は、例えば、ｖａｎＤｉｊｋ，ｅｔａｌ．（２０１４），Ｅｘｐ．ＣｅｌｌＲｅｓｅａｒｃｈ３２２：１２－２０，ａｎｄＩｌｌｕｍｉｎａ’ｓｇｅｎｏｍｉｃＤＮＡｓａｍｐｌｅｐｒｅｐａｒａｔｉｏｎｋｉｔに説明されている。

【0144】

いくつかの例では、結果的に得られる核酸ライブラリは、ゲノムの複雑さの全て又は実質的に全てを含み得る。この文脈における「実質的に全て」という用語は、実際には、手順の初期工程中にゲノム複雑性のいくらかの望ましくない喪失があり得る可能性を指す。本明細書に説明される方法はまた、核酸ライブラリがゲノムの一部である場合、例えば、ゲノムの複雑性が設計によって低減される場合に有用である。いくつかの例では、ゲノムの任意の選択された部分は、本明細書に説明される方法とともに使用され得る。例えば、ある特定の実施形態では、エクソーム全体又はそのサブセットが単離される。いくつかの例では、ライブラリは、少なくとも９５％、９０％、８０％、７０％、６０％、５０％、４０％、３０％、２０％、１０％、又は５％のゲノムＤＮＡを含み得る。いくつかの例では、ライブラリは、少なくとも９５％、９０％、８０％、７０％、６０％、５０％、４０％、３０％、２０％、１０％、又は５％のゲノムＤＮＡを含むゲノムＤＮＡのｃＤＮＡコピーからなり得る。ある特定の例では、核酸ライブラリを生成するために使用される核酸の量は、５マイクログラム未満、１マイクログラム未満、５００ｎｇ未満、２００ｎｇ未満、１００ｎｇ未満、５０ｎｇ未満、１０ｎｇ未満、５ｎｇ未満、又は１ｎｇ未満であり得る。

【0145】

いくつかの例では、ライブラリ（例えば、核酸ライブラリ）は、核酸分子の集合を含む。本明細書に説明されるように、ライブラリの核酸分子は、標的核酸分子（例えば、腫瘍核酸分子、参照核酸分子及び／又は制御核酸分子、本明細書ではそれぞれ第１、第２及び／又は第３の核酸分子とも呼ばれる）を含むことができる。ライブラリの核酸分子は、単一の対象又は個体に由来し得る。いくつかの例では、ライブラリは、２以上の対象（例えば、２、３、４、５、６、７、８、９、１０、２０、３０以上の対象）に由来する核酸分子を含み得る。例えば、異なる対象由来の２つ以上のライブラリは、２以上の対象由来の核酸分子を有するライブラリを形成するために組み合わせられ得る（各対象に由来する核酸分子は、任意選択的に、特定の対象に対応する固有の試料バーコードにライゲーションされる）。いくつかの例では、対象は、がん又は腫瘍を有するか、又は有するリスクがあるヒトである。

【0146】

いくつかの例では、ライブラリ（又はその一部分）は、１つ以上のサブゲノム区間を含み得る。いくつかの例では、サブゲノム区間は、単一ヌクレオチド位置、例えば、その位置の変異体が腫瘍表現型と関連付けられている（陽性又は陰性に）ヌクレオチド位置であり得る。いくつかの例では、サブゲノム区間は、２つ以上のヌクレオチド位置を含む。そのような例は、長さが少なくとも２、５、１０、５０、１００、１５０、２５０、又は２５０超のヌクレオチド位置の配列を含む。サブゲノム区間は、例えば、１つ以上の全遺伝子（又はその一部分）、１つ以上のエクソン若しくはコーディング配列（又はその一部分）、１つ以上のイントロン（又はその一部分）、１つ以上のマイクロサテライト領域（又はその一部分）、又はそれらの任意の組み合わせを含み得る。サブゲノム区間は、天然に存在する核酸分子、例えば、ゲノムＤＮＡ分子の断片の全部又は一部を含み得る。例えば、サブゲノム区間は、配列決定反応に供されるゲノムＤＮＡの断片に対応し得る。いくつかの例では、サブゲノム区間は、ゲノム供給源からの連続配列である。いくつかの例では、サブゲノム区間は、ゲノム中で連続していない配列を含み、例えば、ｃＤＮＡ中のサブゲノム区間は、スプライシングの結果として形成されたエクソン－エクソン接合部を含み得る。いくつかの例では、サブゲノム区間は、腫瘍核酸分子を含む。いくつかの例では、サブゲノム区間は、非腫瘍核酸分子を含む。

【0147】

分析のための遺伝子座の標的化
本明細書に説明される方法は、本明細書に説明されるように、例えば、ゲノム遺伝子座セット（例えば、遺伝子座又はその断片）から、対象区間セット（例えば、標的配列）を評価するための方法と組み合わせて、又はその一部として使用され得る。

【0148】

いくつかの例では、開示される方法によって評価されるゲノム遺伝子座セットは、変異形態で、細胞分裂、増殖若しくは生存に対する効果と関連付けられるか、又はがん、例えば、本明細書に説明されるがんと関連付けられる、複数の、例えば、遺伝子を含む。

【0149】

いくつかの例では、開示される方法によって評価される遺伝子座セットは、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも２０、少なくとも３０、少なくとも４０、少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０、少なくとも９０、少なくとも１００、又は１００超の遺伝子座を含む。

【0150】

いくつかの例では、選択された遺伝子座（本明細書では標的遺伝子座又は標的配列とも呼ばれる）又はその断片は、対象ゲノムの非コーディング配列、コーディング配列、遺伝子内領域、又は遺伝子間領域を含む、対象区間を含み得る。例えば、対象区間は、非コーディング配列又はその断片（例えば、プロモーター配列、エンハンサー配列、５’非翻訳領域（５’ＵＴＲ）、３’非翻訳領域（３’ＵＴＲ）、又はそれらの断片）、その断片のコーディング配列、エクソン配列又はその断片、イントロン配列又はその断片を含み得る。

【0151】

標的捕捉試薬
本明細書に説明される方法は、分析のための複数の特定の標的配列（例えば、遺伝子配列又はその断片）を選択及び捕捉するために、核酸ライブラリを複数の標的捕捉試薬と接触させることを含み得る。いくつかの例では、標的捕捉試薬（すなわち、標的分子に結合し、それによって、標的分子の捕捉を可能にする分子）が、分析される対象区間を選択するために使用される。例えば、標的捕捉試薬は、標的分子にハイブリダイズし（すなわち、それに相補的である）、それによって、標的核酸の捕捉を可能にし得るベイト分子、例えば、核酸分子（例えば、ＤＮＡ分子又はＲＮＡ分子）であり得る。いくつかの例では、標的捕捉試薬、例えば、ベイト分子（又はベイト配列）は、捕捉オリゴヌクレオチド（又は捕捉プローブ）である。いくつかの例では、標的核酸は、ゲノムＤＮＡ分子、ＲＮＡ分子、ＲＮＡ分子由来のｃＤＮＡ分子、マイクロサテライトＤＮＡ配列などである。いくつかの例では、標的捕捉試薬は、標的に対する溶液相ハイブリダイゼーションに好適である。いくつかの例では、標的捕捉試薬は、標的に対する固相ハイブリダイゼーションに好適である。いくつかの例では、標的捕捉試薬は、標的に対する溶液相ハイブリダイゼーション及び固相ハイブリダイゼーションの両方に好適である。標的捕捉試薬の設計及び構築は、例えば、国際特許出願公開第２０２０／２３６９４１号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。

【0152】

本明細書に説明される方法は、配列決定されることになる標的核酸分子を選択するための標的捕捉試薬の適切な選択によって、１以上の対象からの試料（例えば、がん組織検体、液体生検試料など）からの多数のゲノム遺伝子座（例えば、遺伝子又は遺伝子産物（例えば、ｍＲＮＡ）、マイクロサテライト遺伝子座など）の最適化された配列決定を提供する。いくつかの例では、標的捕捉試薬は、特定の標的遺伝子座、例えば、特定の標的遺伝子座又はその断片にハイブリダイズし得る。いくつかの例では、標的捕捉試薬は、特定の標的遺伝子座群、例えば、特定の遺伝子座群又はその断片にハイブリダイズし得る。いくつかの例では、標的特異的及び／又は群特異的標的捕捉試薬の混合を含む複数の標的捕捉試薬が使用され得る。

【0153】

いくつかの例では、核酸配列決定のための複数の標的配列を捕捉するために核酸ライブラリと接触した複数の標的捕捉試薬（例えば、ベイトセット）中の標的捕捉試薬（例えば、ベイト分子）の数は、１０超、５０超、１００超、２００超、３００超、４００超、５００超、６００超、７００超、８００超、９００超、１，０００超、１，２５０超、１，５００超、１，７５０超、２，０００超、３，０００超、４，０００超、５，０００超、１０，０００超、２５，０００超、又は５０，０００超である。

【0154】

いくつかの例では、標的捕捉試薬配列の全長は、約７０ヌクレオチド～１０００ヌクレオチドであり得る。一例では、標的捕捉試薬の長さは、約１００～３００ヌクレオチド、１１０～２００ヌクレオチド、又は１２０～１７０ヌクレオチド長である。上記のものに加えて、約７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、３００、４００、５００、６００、７００、８００及び９００ヌクレオチド長の中間オリゴヌクレオチド長を本明細書に説明される方法で使用することができる。いくつかの実施形態では、約７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０又は２３０塩基のオリゴヌクレオチドを使用することができる。

【0155】

いくつかの例では、各標的捕捉試薬配列は、（ｉ）標的特異的捕捉配列（例えば、遺伝子座又はマイクロサテライト遺伝子座特異的相補配列）、（ｉｉ）アダプター、プライマー、バーコード、及び／又は固有の分子識別子配列、並びに（ｉｉｉ）一端若しくは両端のユニバーサルテールを含み得る。本明細書に使用される際、「標的捕捉試薬」という用語は、標的特異的標的捕捉配列又は標的特異的標的捕捉配列を含む標的捕捉試薬オリゴヌクレオチド全体を指し得る。

【0156】

いくつかの例では、標的捕捉試薬中の標的特異的捕捉配列は、約４０ヌクレオチド～１０００ヌクレオチド長である。いくつかの例では、標的特異的捕捉配列は、約７０ヌクレオチド～３００ヌクレオチド長である。いくつかの例では、標的特異的配列は、約１００ヌクレオチド～２００ヌクレオチド長である。更に他の例では、標的特異的配列は、約１２０ヌクレオチド～１７０ヌクレオチド長、典型的には１２０ヌクレオチド長である。上記のものに加えて、中間の長さ、例えば、約４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２１０、２２０、２３０、２４０、２５０、３００、４００、５００、６００、７００、８００及び９００ヌクレオチド長の標的特異的配列、並びに上記の長さの間の長さの標的特異的配列もまた、本明細書中に記載される方法において使用され得る。

【0157】

いくつかの例では、標的捕捉試薬は、１つ以上の再編成を含む対象区間、例えば、ゲノム再編成を含むイントロンを選択するように設計され得る。そのような例では、標的捕捉試薬は、選択効率を高めるために反復配列がマスクされるように設計される。再編成が既知の連結配列を有するこれらの例では、相補的標的捕捉試薬を連結配列に設計して選択効率を高めることができる。

【0158】

いくつかの例では、開示される方法は、２つ以上の異なる標的カテゴリを捕捉するように設計された標的捕捉試薬の使用を含み得、各カテゴリは、異なる標的捕捉試薬設計戦略を有する。いくつかの例では、本明細書に開示される、ハイブリダイゼーションベースの捕捉方法及び標的捕捉試薬組成物は、標的配列セットの捕捉及び均質なカバレッジを提供するが、一方で、標的化された配列セットの外側のゲノム配列のカバレッジを最小化する。いくつかの例では、標的配列は、ゲノムＤＮＡのエクソーム全体又はその選択されたサブセットを含み得る。別の例では、標的配列は、大きな染色体領域（例えば、染色体腕全体）を含み得る。本明細書に開示される方法及び組成物は、複合標的核酸配列セットについて異なる配列決定深度及びカバレッジのパターンを達成するための異なる標的捕捉試薬を提供する。

【0159】

典型的には、ＤＮＡ分子が標的捕捉試薬配列として使用されるが、ＲＮＡ分子も使用することができる。いくつかの例では、ＤＮＡ分子標的捕捉試薬は、一本鎖ＤＮＡ（ｓｓＤＮＡ）又は二本鎖ＤＮＡ（ｄｓＤＮＡ）であり得る。いくつかの例では、ＲＮＡ－ＤＮＡ二重鎖は、ＤＮＡ－ＤＮＡ二重鎖よりも安定であり、したがって、潜在的により良好な核酸の捕捉を提供する。

【0160】

いくつかの例では、開示される方法は、１つ以上の核酸ライブラリから捕捉された、選択された核酸分子セット（例えば、ライブラリキャッチ）を提供することを含む。例えば、方法は、１つ又は複数の核酸ライブラリを提供することであって、各々が、１以上の対象からの１つ以上の試料から抽出された複数の核酸分子（例えば、複数の標的核酸分子及び／又は参照核酸分子）を含む、提供することと、１つ又は複数のライブラリ（例えば、溶液ベースのハイブリダイゼーション反応における）を、１、２、３、４、５、５つ超の複数の標的捕捉試薬（例えば、オリゴヌクレオチド標的捕捉試薬）と接触させて、複数の標的捕捉試薬／核酸分子ハイブリッドを含むハイブリダイゼーション混合物を形成することと、例えば、ハイブリダイゼーション混合物を、ハイブリダイゼーション混合物からの複数の標的捕捉試薬／核酸分子ハイブリッドの分離を可能にする結合実体と接触させることによって、複数の標的捕捉試薬／核酸分子ハイブリッドをハイブリダイゼーション混合物から分離し、それによって、ライブラリキャッチ（例えば、１つ又は複数のライブラリからの選択又は濃縮された核酸分子の部分群）を提供することと、を含み得る。

【0161】

いくつかの例では、開示される方法は、ライブラリキャッチを増幅することを更に含み得る（例えば、ＰＣＲを実施することによって）。他の例では、ライブラリキャッチは、増幅されない。

【0162】

いくつかの例では、標的捕捉試薬は、必要に応じて説明書、標準、緩衝液若しくは酵素又は他の試薬を含み得るキットの一部であり得る。

【0163】

ハイブリダイゼーション条件
上記のように、本明細書に開示される方法は、ライブラリ（例えば、核酸ライブラリ）を、複数の標的捕捉試薬と接触させて、選択されたライブラリ標的核酸配列（すなわち、ライブラリキャッチ）と接触させるステップを含み得る。接触ステップは、例えば、溶液ベースのハイブリダイゼーションで行われ得る。いくつかの例では、方法は、１回以上の追加の溶液ベースのハイブリダイゼーションに関してハイブリダイゼーションステップを繰り返すことを含む。いくつかの例では、方法は、ライブラリキャッチを、同じか又は異なる標的捕捉試薬の集合との１回以上の追加の溶液ベースのハイブリダイゼーションに供することを更に含む。

【0164】

いくつかの例では、接触ステップは、固体支持体、例えば、アレイを使用して行われる。ハイブリダイゼーションのための好適な固体支持体は、例えば、Ａｌｂｅｒｔ，Ｔ．Ｊ．ｅｔａｌ．（２００７）Ｎａｔ．Ｍｅｔｈｏｄｓ４（１１）：９０３－５、Ｈｏｄｇｅｓ，Ｅ．ｅｔａｌ．（２００７）Ｎａｔ．Ｇｅｎｅｔ．３９（１２）：１５２２－７、及びＯｋｏｕ，Ｄ．Ｔ．ｅｔａｌ．（２００７）Ｎａｔ．Ｍｅｔｈｏｄｓ４（１１）：９０７－９に説明されており、それらの内容は、その全体が参照により本明細書に組み込まれる。

【0165】

本明細書の方法での使用に適合させることができるハイブリダイゼーション方法は、例えば、国際特許出願公開第２０１２／０９２４２６号に記載されているように、当技術分野で記載されている。複数の標的核酸に標的捕捉試薬をハイブリダイズするための方法は、例えば、国際特許出願公開第２０２０／２３６９４１号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。

【0166】

配列決定方法
本明細書に開示される方法及びシステムは、核酸を配列決定するための方法又はシステム（例えば、次世代配列決定システム）と組み合わせて、又はその一部として使用されて、試料中のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを生成し、それによって、例えば、複数の遺伝子座における遺伝子対立配列を決定し得る。本明細書で使用される「次世代配列決定」（又は「ＮＧＳ」）はまた、「超並列配列決定」とも呼ばれ得、個々の核酸分子（例えば、単一分子配列決定では）又は個々の核酸分子のクローン的に拡大されたプロキシのヌクレオチド配列をハイスループット様式（例えば、１０^３、１０^４、１０^５、又は１０^５超の分子が同時に配列決定される）で決定する任意の配列決定方法を指す。

【0167】

次世代配列決定法は、当技術分野で公知であり、例えば、参照により本明細書に組み込まれる、Ｍｅｔｚｋｅｒ、Ｍ．（２０１０）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙＲｅｖｉｅｗｓ１１：３１－４６に説明されている。本明細書に開示される方法及びシステムを実装するときに使用するために好適な配列決定方法の他の例は、例えば、国際特許出願公開第２０１２／０９２４２６号に説明されている。いくつかの例では、配列決定は、例えば、全ゲノム配列決定（ＷＧＳ）、全エクソーム配列決定、標的配列決定、又は直接配列決定を含み得る。いくつかの例では、配列決定は、例えば、サンガー配列決定を使用して実施され得る。いくつかの例では、配列決定は、断片の両端が配列決定されることを可能にし、かつ、例えば、ゲノム再編成、反復配列要素、遺伝子融合、及び新規の転写物の検出のための高品質のアラインメント可能な配列データを生成する、ペアエンド配列決定技術を含み得る。

【0168】

開示される方法及びシステムは、Ｒｏｃｈｅ４５４、ＩｌｌｕｍｉｎａＳｏｌｅｘａ、ＡＢＩ－ＳＯＬｉＤ、ＩＯＮＴｏｒｒｅｎｔ、ＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓ、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅ、Ｈｅｌｉｃｏｓ、及び／又はＰｏｌｏｎａｔｏｒプラットフォームなどの、配列決定プラットフォームを使用して実装され得る。いくつかの例では、配列決定は、ＩｌｌｕｍｉｎａＭｉＳｅｑ配列決定を含み得る。いくつかの例では、配列決定は、ＩｌｌｕｍｉｎａＨｉＳｅｑ配列決定を含み得る。いくつかの例では、配列決定は、ＩｌｌｕｍｉｎａＮｏｖａＳｅｑ配列決定を含み得る。試料から抽出された核酸中の多数の標的ゲノム遺伝子座を配列決定するための最適化された方法は、例えば、国際特許出願公開第２０２０／２３６９４１号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。

【0169】

ある特定の例では、開示される方法は、（ａ）複数の正常及び／若しくは腫瘍核酸分子を含むライブラリを試料から取得するステップ、（ｂ）標的核酸分子への標的捕捉試薬のハイブリダイゼーションを可能にする条件下でライブラリを１、２、３、４、５、又は５つ超の複数の標的捕捉試薬と同時に若しくは順次接触させ、それによって、選択された捕捉された正常及び／若しくは腫瘍核酸分子セット（すなわち、ライブラリキャッチ）を提供するステップ、（ｃ）例えば、ハイブリダイゼーション混合物を、ハイブリダイゼーション混合物からの標的捕捉試薬／核酸分子ハイブリッドの分離を可能にする結合実体と接触させることによって、核酸分子の選択されたサブセット（例えば、ライブラリキャッチ）をハイブリダイゼーション混合物から分離するステップ、（ｄ）ライブラリキャッチを配列決定して、１つ以上の対象区間（例えば、１つ以上の標的配列）と重複する複数のリード（例えば、配列リード）を、変異（又は変化）を含み得るライブラリキャッチ、例えば、体細胞変異又は生殖細胞系列変異を含む変異体配列から取得するステップ、（ｅ）本明細書の他の箇所で説明されるアラインメント方法を使用して配列リードをアラインメントするステップ、並びに／又は（ｆ）複数のうちの１つ以上の配列リードから対象区間内のヌクレオチド位置にヌクレオチド値を割り当てる（例えば、ベイズ法又は本明細書に説明される他の方法を使用して、例えば、変異を呼び出す）ステップのうちの１つ以上を含む。

【0170】

いくつかの例では、１つ以上の対象区間に対する配列リードを取得することは、少なくとも１、少なくとも５、少なくとも１０、少なくとも２０、少なくとも３０、少なくとも４０、少なくとも５０、少なくとも１００、少なくとも１５０、少なくとも２００、少なくとも２５０、少なくとも３００、少なくとも３５０、少なくとも４００、少なくとも４５０、少なくとも５００、少なくとも５５０、少なくとも６００、少なくとも６５０、少なくとも７００、少なくとも７５０、少なくとも８００、少なくとも８５０、少なくとも９００、少なくとも９５０、少なくとも１，０００、少なくとも１，２５０、少なくとも１，５００、少なくとも１，７５０、少なくとも２，０００、少なくとも２，２５０、少なくとも２，５００、少なくとも２，７５０、少なくとも３，０００、少なくとも３，５００、少なくとも４，０００、少なくとも４，５００、又は少なくとも５，０００の遺伝子座、例えば、ゲノム遺伝子座、遺伝子座、マイクロサテライト遺伝子座などを配列決定することを含み得る。いくつかの例では、１つ以上の対象区間に対する配列リードを取得することは、この段落に説明された範囲内の任意の数の遺伝子座、例えば、少なくとも２，８５０の遺伝子座に対する対象区間を配列決定することを含み得る。

【0171】

いくつかの例では、１つ以上の対象区間に対する配列リードを取得することは、少なくとも２０塩基、少なくとも３０塩基、少なくとも４０塩基、少なくとも５０塩基、少なくとも６０塩基、少なくとも７０塩基、少なくとも８０塩基、少なくとも９０塩基、少なくとも１００塩基、少なくとも１２０塩基、少なくとも１４０塩基、少なくとも１６０塩基、少なくとも１８０塩基、少なくとも２００塩基、少なくとも２２０塩基、少なくとも２４０塩基、少なくとも２６０塩基、少なくとも２８０塩基、少なくとも３００塩基、少なくとも３２０塩基、少なくとも３４０塩基、少なくとも３６０塩基、少なくとも３８０塩基、又は少なくとも４００塩基の配列リード長（又は平均配列リード長）を提供する配列決定方法を用いて対象区間を配列決定することを含む。いくつかの例では、１つ以上の対象区間に対する配列リードを取得することは、この段落に説明された範囲内の任意の数の塩基の配列リード長（又は平均配列リード長）、例えば、５６塩基の配列リード長（又は平均配列リード長）を提供する配列決定方法を用いて対象区間を配列決定することを含み得る。

【0172】

いくつかの例では、１つ以上の対象区間に対する配列リードを取得することは、平均で少なくとも１００×以上のカバレッジ（又は深度）で配列決定することを含み得る。いくつかの例では、１つ以上の対象区間に対する配列リードを取得することは、平均で少なくとも１００×、少なくとも１５０×、少なくとも２００×、少なくとも２５０×、少なくとも５００×、少なくとも７５０×、少なくとも１，０００×、少なくとも１，５００ ×、少なくとも２，０００×、少なくとも２，５００×、少なくとも３，０００×、少なくとも３，５００×、少なくとも４，０００×、少なくとも４，５００×、少なくとも５，０００×、少なくとも５，５００×、又は少なくとも６，０００×以上のカバレッジ（又は深度）で配列決定することを含み得る。いくつかの例では、１つ以上の対象区間に対する配列リードを取得することは、この段落で説明された値の範囲内の任意の値を有する平均カバレッジ（又は深度）、例えば、少なくとも１６０×で配列決定することを含み得る。

【0173】

いくつかの例では、１つ以上の対象区間に対する配列リードを取得することは、約９０％、９２％、９４％、９５％、９６％、９７％、９８％、又は９９％超の配列決定された遺伝子座に対して、少なくとも１００×～少なくとも６，０００×の範囲の任意の値を有する平均配列決定深度で配列決定することを含む。例えば、いくつかの例では、対象区間に対するリードを取得することは、少なくとも９９％の配列決定された遺伝子座に対して少なくとも１２５×の平均配列決定深度で配列決定することを含む。別の例として、いくつかの例では、対象区間に対するリードを取得することは、少なくとも９５％の配列決定された遺伝子座に対して少なくとも４，１００×の平均配列決定深度で配列決定することを含む。

【0174】

いくつかの例では、ライブラリ中の核酸種の相対存在量は、配列決定実験によって生成されたデータ中のそれらの同族配列の出現の相対数（例えば、所与の同族配列に対する配列リードの数）をカウントすることによって推定され得る。

【0175】

いくつかの例では、開示される方法及びシステムは、本明細書に説明されるように、対象区間セット（例えば、遺伝子座）に対するヌクレオチド配列を提供する。ある特定の事例では、配列は、マッチする正常対照（例えば、野生型コントロール）、及び／又はマッチする腫瘍対照（例えば、原発性対転移性）を含む方法を使用せずに提供される。

【0176】

いくつかの例では、本明細書で使用される場合、配列決定深度のレベル（例えば、配列決定深度のＸ倍レベル）は、重複リード（例えば、ＰＣＲ重複リード）の検出及び除去の後に得られるリードの数（例えば、固有リード）を指す。他の例では、例えば、コピー数変化（ＣＮＡ）の検出を支援するために、重複リードが評価される。

【0177】

アラインメント
アラインメントは、リードをある場所、例えば、ゲノム場所又は遺伝子座とマッチングさせるプロセスである。いくつかの例では、ＮＧＳリードは、既知の参照配列（例えば、野生型配列）にアラインメントされ得る。いくつかの例では、ＮＧＳリードは、デノボアセンブリされ得る。ＮＧＳリードに対する配列アラインメントの方法は、例えば、Ｔｒａｐｎｅｌｌ，Ｃ．ａｎｄＳａｌｚｂｅｒｇ，Ｓ．Ｌ．ＮａｔｕｒｅＢｉｏｔｅｃｈ．，２００９，２７：４５５－４５７に説明されている。デノボ配列アセンブリの例は、例えばＷａｒｒｅｎＲ．ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２００７，２３：５００－５０１、ＢｕｔｌｅｒＪ．ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．，２００８，１８：８１０－８２０、及びＺｅｒｂｉｎｏＤ．Ｒ．ａｎｄＢｉｒｎｅｙＥ．，ＧｅｎｏｍｅＲｅｓ．，２００８，１８：８２１－８２９に説明されている。配列アラインメントの最適化は、例えば、国際特許出願公開第２０１２／０９２４２６号に記載されているように、当技術分野で説明されている。配列アラインメント方法の追加の説明が、例えば、国際特許出願公開第２０２０／２３６９４１号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。

【0178】

ミスアラインメント（例えば、ゲノム内の不正確な場所における短いリードからの塩基対の配置）、例えば、代替対立遺伝子のリードが代替対立遺伝子リードのヒストグラムピークからシフトされ得るため、実際のがん変異の周りの配列コンテキスト（例えば、反復配列の存在）に起因するリードのミスアラインメントは、変異検出の感度の低下につながり得、変異検出の感度の低下につながり得る。ミスアラインメントを引き起こし得る配列コンテキストの他の例は、ショートタンデムリピート、散在反復配列、低複雑性領域、挿入－欠失（インデル）、及びパラログを含む。実際の変異が存在しない場合に問題のある配列状況が生じる場合、ミスアラインメントは、実際の参照ゲノム塩基配列のリードを誤った場所に配置することによって、「変異」対立遺伝子のアーチファクトのリードを導入し得る。多重遺伝子分析のための変異呼び出しアルゴリズムは、低存在量の変異に対してさえも感受性でなければならないため、配列ミスアラインメントは、偽陽性発見率を増加させ、及び／又は特異性を低下させ得る。

【0179】

いくつかの例では、本明細書に開示される方法及びシステムは、複数の個別に調整されたアラインメント方法又はアルゴリズムの使用を統合して、配列決定方法、特に、多数の多様なゲノム遺伝子座における多数の多様な遺伝的事象の超並列配列決定に依存する方法で、ベース呼び出し性能を最適化し得る。いくつかの例では、開示される方法及びシステムは、１つ以上のグローバルアラインメントアルゴリズムの使用を含み得る。いくつかの例では、開示される方法及びシステムは、１つ以上のローカルアラインメントアルゴリズムの使用を含み得る。使用され得るアラインメントアルゴリズムの例としては、限定されるものではないが、Ｂｕｒｒｏｗｓ－ＷｈｅｅｌｅｒＡｌｉｇｎｍｅｎｔ（ＢＷＡ）ソフトウェアバンドル（例えば、Ｌｉ，ｅｔａｌ．（２００９），“ＦａｓｔａｎｄＡｃｃｕｒａｔｅＳｈｏｒｔＲｅａｄＡｌｉｇｎｍｅｎｔｗｉｔｈＢｕｒｒｏｗｓ－ＷｈｅｅｌｅｒＴｒａｎｓｆｏｒｍ”，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２５：１７５４－６０、Ｌｉ，ｅｔａｌ．（２０１０），ＦａｓｔａｎｄＡｃｃｕｒａｔｅＬｏｎｇ－ＲｅａｄＡｌｉｇｎｍｅｎｔｗｉｔｈＢｕｒｒｏｗｓ－ＷｈｅｅｌｅｒＴｒａｎｓｆｏｒｍ”，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓｅｐｕｂ．ＰＭＩＤ：２００８０５０５参照）、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎアルゴリズム（例えば、Ｓｍｉｔｈ，ｅｔａｌ．（１９８１），“ＩｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＣｏｍｍｏｎＭｏｌｅｃｕｌａｒＳｕｂｓｅｑｕｅｎｃｅｓ”，Ｊ．ＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ１４７（１）：１９５－１９７参照）、ＳｔｒｉｐｅｄＳｍｉｔｈ－Ｗａｔｅｒｍａｎアルゴリズム（例えば、Ｆａｒｒａｒ（２００７），“ＳｔｒｉｐｅｄＳｍｉｔｈ－ＷａｔｅｒｍａｎＳｐｅｅｄｓＤａｔａｂａｓｅＳｅａｒｃｈｅｓＳｉｘＴｉｍｅｓＯｖｅｒＯｔｈｅｒＳＩＭＤＩｍｐｌｅｍｅｎｔａｔｉｏｎｓ”，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２３（２）：１５６－１６１参照）、Ｎｅｅｄｌｅｍａｎ－Ｗｕｎｓｃｈアルゴリズム（Ｎｅｅｄｌｅｍａｎ，ｅｔａｌ．（１９７０）“ＡＧｅｎｅｒａｌＭｅｔｈｏｄＡｐｐｌｉｃａｂｌｅｔｏｔｈｅＳｅａｒｃｈｆｏｒＳｉｍｉｌａｒｉｔｉｅｓｉｎｔｈｅＡｍｉｎｏＡｃｉｄＳｅｑｕｅｎｃｅｏｆＴｗｏＰｒｏｔｅｉｎｓ”，Ｊ．ＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ４８（３）：４４３－５３）、又はそれらの任意の組み合わせが挙げられる。

【0180】

いくつかの例では、本明細書に開示される方法及びシステムはまた、配列アセンブリアルゴリズム、例えば、Ａｒａｃｈｎｅ配列決定アセンブリアルゴリズム（例えば、Ｂａｔｚｏｇｌｏｕ，ｅｔａｌ．（２００２），“ＡＲＡＣＨＮＥ：ＡＷｈｏｌｅ－ＧｅｎｏｍｅＳｈｏｔｇｕｎＡｓｓｅｍｂｌｅｒ”，ＧｅｎｏｍｅＲｅｓ．１２：１７７－１８９参照）の使用も含み得る。

【0181】

いくつかの例では、配列リードを分析するために使用されるアラインメント方法は、異なるゲノム遺伝子座における異なる変異体（例えば、点変異、挿入、欠失など）の検出のために個別的にカスタマイズ又は調整されない。いくつかの例では、異なるゲノム遺伝子座で検出される異なる変異体の少なくともサブセットの検出のために個別的にカスタマイズ又は調整される異なるアラインメント方法がリードを分析するために使用される。いくつかの例では、異なるゲノム遺伝子座で各異なる変異体を検出するために個別的にカスタマイズ又は調整される異なるアラインメント方法がリードを分析するために使用される。いくつかの例では、調整は、（ｉ）配列決定される遺伝子座（例えば、遺伝子座、マイクロサテライト遺伝子座、又は他の対象区間）、（ｉｉ）試料と関連付けられた腫瘍タイプ、（ｉｉｉ）配列決定される変異体、又は（ｉｖ）試料若しくは対象の特徴のうちの１つ以上の関数であり得る。配列決定されるいくつかの特定の対象区間に個別に調整されるアラインメント条件の選択又は使用は、速度、感度及び特異性の最適化を可能にする。この方法は、比較的多数の多様な対象区間に対するリードのアラインメントが最適化される場合に特に有効である。いくつかの例では、方法は、再配置のために最適化されたアラインメント方法と、再配置と関連付けられていない対象区間のために最適化された他のアラインメント方法の併用を含む。

【0182】

いくつかの例では、本明細書に開示される方法は、配列リードを分析、例えば、アラインメントするためのアラインメント方法を選択又は使用することを更に含み、アラインメント方法は、（ｉ）腫瘍タイプ、例えば、試料中の腫瘍タイプ、（ｉｉ）配列決定される対象区間の場所（例えば、遺伝子座）、（ｉｉｉ）配列決定される対象区間内の変異体のタイプ（例えば、点変異、挿入、欠失、置換、コピー数変異（ＣＮＶ）、再編成、又は融合）、（ｉｖ）分析される部位（例えば、ヌクレオチド位置）、（ｖ）試料のタイプ（例えば、本明細書に説明される試料）、及び／又は（ｖｉ）評価される対象区間内若しくはその近くの隣接配列（例えば、対象区間内又はその近くの反復配列の存在に起因する対象区間のミスアラインメントに対する、その予想される傾向に従って）のうちの１つ以上の関数であるか、それらに応じて選択されるか、それらに対して最適化される。

【0183】

いくつかの例では、本明細書に開示される方法は、面倒なリード、例えば、再編成を有するリードの迅速かつ効率的なアラインメントを可能にする。したがって、対象区間に対するリードが再編成、例えば、転座を伴うヌクレオチド位置を含むいくつかの例では、方法は、適切に調整され、以下を含むアラインメント方法を使用することを含み得る。（ｉ）リードとのアラインメントのための再配列参照配列を選択することであって、当該再配列参照配列が再配列（いくつかの例では、参照配列はゲノム再編成と同一ではない）とアラインメントする、選択すること、及び（ｉｉ）リードを当該再編成参照配列と比較、例えば、アラインメントすること。

【0184】

いくつかの例では、代替的な方法が、問題のあるリードをアラインメントするために使用され得る。これらの方法は、比較的多数の多様な対象区間に対するリードのアラインメントが最適化される場合に特に有効である。例として、試料を分析する方法は、（ｉ）第１のパラメータセットを使用するリードの比較（例えば、アラインメント比較）を実施し（例えば、第１のマッピングアルゴリズムを使用するか、又は第１の参照配列との比較によって）、当該リードが第１のアラインメント基準を満たす（例えば、リードが当該第１の参照配列で、例えば、特定の数のミスマッチ未満でアラインメントされ得る）かどうかを決定することと、（ｉｉ）当該リードが第１のアラインメント基準を満たさない場合、第２のパラメータセットを使用して第２のアラインメント比較を実施する（例えば、第２のマッピングアルゴリズムを使用するか、又は第２の参照配列との比較によって）ことと、（ｉｉｉ）任意選択的に、当該リードが第２の基準を満たす（例えば、当該リードが当該第２の参照配列で、例えば、特定の数未満のミスマッチ未満でアラインメントされ得る）かどうかを決定することであって、当該第２のパラメータセットが、例えば、当該第１のパラメータセットと比較して、変異体に対するリードとのアラインメント（例えば、再編成、挿入、欠失、又は転座）を結果的にもたらす可能性が高い、当該第２の参照配列の使用を含む、決定することと、を含み得る。

【0185】

いくつかの例では、開示される方法における配列データのアラインメントは、本明細書の他の箇所に説明される変異呼び出し方法と組み合わせられ得る。本明細書で論じられるように、実際の変異を検出するための感度の低下は、分析されている遺伝子又はゲノム遺伝子座（例えば、遺伝子座）の予想される変異部位の周りのアラインメントの質を（手動で又は自動化された様式で）評価することによって対処することができる。いくつかの例では、評価されることになる部位は、ヒトゲノム（例えば、ＨＧ１９ヒト参照ゲノム）又はがん変異（例えば、ＣＯＳＭＩＣ）のデータベースから得られ得る。問題があると特定された領域は、例えば、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎアラインメントなどのより遅いがより正確なアラインメントアルゴリズムを使用するアラインメント最適化（又は再アラインメント）によって、関連する配列状況においてより良好な性能を与えるように選択されたアルゴリズムを使用して修復することができる。一般的なアラインメントアルゴリズムが問題を改善することができない場合、カスタマイズされたアラインメントアプローチが、例えば、置換を含む可能性が高い遺伝子に対する最大の異なるミスマッチペナルティパラメータの調整、特定の腫瘍タイプに共通である特定の変異タイプ（例えば、黒色腫のＣ→Ｔ）に基づいて、特定のミスマッチペナルティパラメータを調整すること、又はある特定の試料タイプに共通である特定の変異タイプ（例えば、ＦＦＰＥに共通である置換）に基づいて、特定のミスマッチペナルティパラメータを調整することによって作成され得る。

【0186】

ミスアラインメントに起因する評価された対象区間の特異性の低下（偽陽性率の増加）は、配列決定データ内の全ての変異呼び出しの手動又は自動検査によって評価され得る。ミスアラインメントに起因して偽の変異呼び出しが発生し易いことが判明した領域は、上記に論じられたアラインメント改善に供され得る。アルゴリズム的な改善策が可能でない場合、問題領域からの「変異」を標的遺伝子座のパネルから分類又はスクリーニングすることができる。

【0187】

変異呼び出し
ベース呼び出しは、配列決定デバイスの生の出力、例えば、オリゴヌクレオチド分子中のヌクレオチドの決定された配列を指す。変異呼び出しは、配列決定されている所与のヌクレオチド位置に対してヌクレオチド値、例えば、Ａ、Ｇ、Ｔ、又はＣを選択するプロセスを指す。典型的には、位置に対する配列リード（又はベース呼び出し）は、２つ以上の値を提供することになり、例えば、いくつかのリードがＴを示すことになり、いくつかがＧを示すことになる。変異呼び出しは、正しいヌクレオチド値、例えば、それらの値のうちの１つを配列に割り当てるプロセスである。「変異」呼び出しと呼ばれるが、任意のヌクレオチド位置、例えば、変異体対立遺伝子、野生型対立遺伝子、変異体若しくは野生型として特徴付けられていない対立遺伝子に対応する位置、又は可変性を特徴としない位置にヌクレオチド値を割り当てるために適用することができる。

【0188】

いくつかの例では、開示される方法は、特に、試料、例えば、がんを有する対象からの試料中の多数の多様なゲノム遺伝子座（例えば、遺伝子座、マイクロサテライト領域など）における多数の多様な遺伝子事象の超並列配列決定に依存する方法において、配列決定データに適用されるときの性能を最適化するために、カスタマイズ又は調整された変異呼び出しアルゴリズム又はパラメータの使用を含み得る。変異呼び出しの最適化は、例えば、国際特許出願公開第２０１２／０９２４２６号に記載されているように、当技術分野で説明されている。

【0189】

変異呼び出しのための方法は、以下のうちの１つ以上を含むことができる：参照配列内の各位置での情報に基づいて独立した呼び出しを行う（例えば、配列リードを調べること；ベースコール及び品質スコアを調べること；潜在的な遺伝子型が与えられたときの観察された塩基及び品質スコアの確率を計算すること；及び遺伝子型（例えば、ベイズ則を使用する）の割り当て）；偽陽性を除去すること（例えば、深度閾値を使用して、予想よりもはるかに低い又は高い読み取り深度を有するＳＮＰを拒否する；小さいインデルに起因する偽陽性を除去するための局所再調整）；連鎖不平衡（ＬＤ）／帰属に基づく分析を実行して、呼び出しを改良すること。

【0190】

特定の遺伝子型及び位置に関連する遺伝子型尤度を計算するために使用される式は、例えば、ＬｉＨ．ａｎｄＤｕｒｂｉｎＲ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２０１０；２６（５）：５８９－９５に説明されている。特定のがん型における特定の変異に対する事前の予想は、そのがん型からの試料を評価するときに使用することができる。そのような可能性は、がん変異の公開データベース、例えば、ＣａｔａｌｏｇｕｅｏｆＳｏｍａｔｉｃＭｕｔａｔｉｏｎｉｎＣａｎｃｅｒ（ＣＯＳＭＩＣ）、ＨＧＭＤ（ＨｕｍａｎＧｅｎｅＭｕｔａｔｉｏｎＤａｔａｂａｓｅ）、ＴｈｅＳＮＰＣｏｎｓｏｒｔｉｕｍ、ＢｒｅａｓｔＣａｎｃｅｒＭｕｔａｔｉｏｎＤａｔａＢａｓｅ（ＢＩＣ）及びＢｒｅａｓｔＣａｎｃｅｒＧｅｎｅＤａｔａｂａｓｅ（ＢＣＧＤ）から得ることができる。

【0191】

ＬＤ／インピュテーションベースの分析の例は、例えば、Ｂｒｏｗｎｉｎｇ，Ｂ．Ｌ．ａｎｄＹｕ，Ｚ．Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．２００９，８５（６）：８４７－６１に説明されている。低カバレッジＳＮＰ呼び出し方法の例は、例えば、Ｌｉ，Ｙ．，ｅｔａｌ．，Ａｎｎｕ．Ｒｅｖ．ＧｅｎｏｍｉｃｓＨｕｍ．Ｇｅｎｅｔ．２００９，１０：３８７－４０６に説明されている。

【0192】

アラインメント後、呼び出し方法（例えば、ベイジアン変異呼び出し方法）を使用して置換の検出が実施され得、これは、対象区間の各々の各塩基、例えば、評価される遺伝子又は他の遺伝子座のエクソンに適用され、代替対立遺伝子の存在が観察される。この方法は、変異の存在下でリードデータを観測する確率を、ベースコールエラーのみの存在下でリードデータを観測する確率と比較する。この比較が変異の存在を十分に強く支持する場合、変異を呼び出すことができる。

【0193】

ベイズ変異検出手法の利点は、変異の存在確率と塩基呼び出しエラーの確率のみとの比較を、その部位における変異の存在の事前予想によって重み付けできることである。代替対立遺伝子のいくつかのリードが所与のがん型について頻繁に変異した部位で観察される場合、変異の証拠の量が通常の閾値を満たさない場合であっても、変異の存在が確実に呼び出され得る。次いで、この柔軟性を使用して、より希少な変異／より低い純度の試料の検出感度を高めるか、又は読み取りカバレッジの減少に対して試験をより堅牢にすることができる。がんにおいてゲノム中のランダムな塩基対が変異している可能性は約１ｅ－６である。例えば、典型的な多遺伝子性がんゲノムパネルの多くの部位で生じる特異的変異の可能性は、桁違いに高くなり得る。これらの尤度は、がん変異の公開データベース（例えば、ＣＯＳＭＩＣ）に由来し得る。

【0194】

インデル呼び出しは、典型的には関連する信頼スコア又は統計的証拠指標を含む、挿入又は欠失によって参照配列とは異なる配列特定データ中の塩基を見つけるプロセスである。インデル呼び出しの方法は、候補インデルを同定する工程、局所再アラインメントによって遺伝子型尤度を計算する工程、並びにＬＤベースの遺伝子型推論及びコールを行う工程を含み得る。典型的には、ベイズ法を使用して潜在的インデル候補を取得し、次いでこれらの候補をベイズフレームワーク内の参照配列とともに試験する。

【0195】

候補インデルを生成するためのアルゴリズムは、例えば、ＭｃＫｅｎｎａ，Ａ．，ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２０１０；２０（９）：１２９７－３０３、Ｙｅ，Ｋ．，ｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２００９；２５（２１）：２８６５－７１、Ｌｕｎｔｅｒ，Ｇ．，ａｎｄＧｏｏｄｓｏｎ，Ｍ．，ＧｅｎｏｍｅＲｅｓ．２０１１；２１（６）：９３６－９、及びＬｉ，Ｈ．，ｅｔａｌ．（２００９），Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２５（１６）：２０７８－９に説明されている。

【0196】

インデル呼び出し及び個体レベルの遺伝子型尤度を生成する方法としては、例えば、Ｄｉｎｄｅｌアルゴリズム（ＡｌｂｅｒｓＣ．Ａ．ｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２０１１；２１（６）：９６１－７３）が挙げられる。例えば、ベイジアンＥＭアルゴリズムを使用して、リードを分析し、初期インデル呼び出しを行い、各候補インデルについて遺伝子型尤度を生成し、続いて、例えば、ＱＣＡＬＬ（ＬｅＳ．Ｑ．ａｎｄＤｕｒｂｉｎＲ．ＧｅｎｏｍｅＲｅｓ．２０１１；２１（６）：９５２－６０）を使用して遺伝子型を補完することができる。インデルを観察する事前の予想などのパラメータは、インデルのサイズ又は位置に基づいて調整することができる（例えば、増加又は減少）。

【0197】

がんＤＮＡの分析のための５０％又は１００％の対立遺伝子頻度からの限られた偏差に対処する方法が開発されている。（例えば、ＳＮＶＭｉｘ－Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２０１０Ｍａｒｃｈ１５；２６（６）：７３０－７３６参照。）しかしながら、本明細書に開示される方法は、１％～１００％の範囲の頻度（又は対立遺伝子画分）（すなわち、０．０１～１．０の範囲の対立遺伝子画分）、及び、特に、５０％未満のレベルの変異体対立遺伝子の存在の可能性の考慮を可能にする。このアプローチは、例えば、天然（マルチクローナル）腫瘍ＤＮＡの低純度ＦＦＰＥ試料における変異の検出に特に重要である。

【0198】

いくつかの例では、配列リードを分析するために使用される変異呼び出し方法は、異なるゲノム遺伝子座における異なる変異体の検出のために個別的にカスタマイズ又は調整されない。いくつかの例では、異なるゲノム遺伝子座で検出される異なる変異体の少なくともサブセットのために個別的にカスタマイズ又は微調整される異なる変異呼び出し方法が使用される。いくつかの例では、各異なるゲノム遺伝子座で検出される各異なる変異体のために個別的にカスタマイズ又は微調整される異なる変異呼び出し方法が使用される。カスタマイズ又は調整は、本明細書に説明される因子、例えば、試料中のがんのタイプ、配列決定される対象区間が位置する遺伝子若しくは遺伝子座、又は配列決定される変異体のうちの１つ以上に基づくことができる。配列決定される対象区間の数に対して個別的にカスタマイズ又は微調整された変異呼び出し方法のこの選択又は使用は、変異呼び出しの速度、感度、及び特異性の最適化を可能にする。

【0199】

いくつかの例では、ヌクレオチド値は、固有の変異呼び出し方法を使用してＸ個の固有の対象区間の各々のヌクレオチド位置に割り当てられ、Ｘは、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも３０、少なくとも４０、少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０、少なくとも９０、少なくとも１００、少なくとも２００、少なくとも３００、少なくとも４００、少なくとも５００、少なくとも１０００、少なくとも１５００、少なくとも２０００、少なくとも２５００、少なくとも３０００、少なくとも３５００、少なくとも４０００、少なくとも４５００、少なくとも５０００以上である。呼び出し方法は異なり、それによって、例えば、異なるベイズ事前値に依存することによって一意であり得る。

【0200】

いくつかの例では、当該ヌクレオチド値を割り当てることは、タイプの腫瘍における当該ヌクレオチド位置における変異体、例えば、変異を示すリードを観察する以前（例えば、文献）の期待値であるか又はそれを表す値の関数である。

【0201】

いくつかの例では、方法は、少なくとも１０、２０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００又は１，０００個のヌクレオチド位置についてヌクレオチド値（例えば、変異の呼び出し）を割り当てることを含み、各割り当ては、タイプの腫瘍における当該ヌクレオチド位置における変異体、例えば変異を示すリードを観察する以前（例えば、文献）の期待値であるか又はそれを表す固有の（他の割り当ての値とは対照的な）値の関数である。

【0202】

いくつかの例では、ヌクレオチド値を割り当てることは、変異体が特定の頻度（例えば、１％、５％、１０％など）で試料中に存在する場合及び／又は変異体が存在しない場合（例えば、塩基呼び出しエラーのみに起因してリードにおいて観察される）、当該ヌクレオチド位置で前記変異体を示すリードを観察する確率を表す値のセットの関数である。

【0203】

いくつかの例では、本明細書に説明される変異呼び出し方法は、（ａ）当該Ｘ個の対象区間の各々におけるヌクレオチド位置について、（ｉ）タイプＸの腫瘍の当該ヌクレオチド位置における変異体、例えば、変異を示すリードを観察する以前（例えば、文献）の期待値であるか又はそれを表す第１の値と、（ｉｉ）変異体がある頻度（例えば、１％、５％、１０％など）で試料中に存在する場合、及び／又は変異体が存在しない（例えば、ベース呼び出しエラー単独に起因して、リード内で観察される）場合、当該ヌクレオチド位置で当該変異体を示すリードを観察する可能性を表す第２の値のセットと、を取得することと、（ｂ）当該値に応答して、例えば、本明細書に説明されるベイズ法によって、第１の値を使用する第２のセット内の値の間の比較を重み付けすることによって、当該ヌクレオチド位置の各々に、当該リードからのヌクレオチド値（例えば、変異を呼び出す）を割り当て、それによって、当該試料を分析することと、を含み得る。

【0204】

変異体呼び出し方法の追加の説明が、例えば、国際特許出願公開第２０２０／２３６９４１号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。

【0205】

自動ＣＮＡ呼び出しのためのシステム
対象からの試料中の１つ以上の遺伝子座におけるＣＮＡの自動検出及び呼び出しのための開示される方法のうちのいずれかを実装するために設計されたシステムもまた、本明細書に開示される。システムは、例えば、１つ以上のプロセッサと、１つ以上のプロセッサに通信可能に結合され、かつ命令を記憶するように構成されたメモリと、を備え得、命令が、１つ以上のプロセッサによって実行されたとき、システムに、１つ以上のプロセッサで、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルデータを受信することと、セグメント化データで識別された対応するセグメントのコピー数及び試料の倍数性に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅を決定することと、１つ以上のプロセッサを使用して、セグメント化データで識別された対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座の欠失を検出することと、１つ以上のプロセッサを使用して、１つ以上の遺伝子座のうちの遺伝子座に対する増幅及び欠失呼び出しの任意の重複を併合することと、１つ以上の遺伝子座に対する決定された増幅及び検出された欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を行わせる。

【0206】

いくつかの例では、開示されるシステムは、シーケンサー、例えば、次世代シーケンサー（超並列シーケンサーとも呼ばれる）を更に含む。次世代（又は超並列）配列決定プラットフォームの例としては、限定されるものではないが、Ｒｏｃｈｅ４５４、ＩｌｌｕｍｉｎａＳｏｌｅｘａ、ＡＢＩ－ＳＯＬｉＤ、ＩＯＮＴｏｒｒｅｎｔ、又はＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅ配列決定プラットフォームが挙げられる。

【0207】

いくつかの例では、開示されるシステムは、本明細書に説明される様々な試料（例えば、対象に由来する組織試料、生検試料、血液試料、又は液体生検試料）のうちのいずれかにおけるＣＮＡの自動検出及び呼び出しに使用され得る。

【0208】

いくつかの例では、コピー数変化を決定するために配列決定データが処理される複数の遺伝子座は、少なくとも１、２、３、４、５、６、７、８、９、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、又は１０超の遺伝子座を含み得る。

【0209】

いくつかの例では、核酸配列データは、４００塩基未満、３００塩基未満、２００塩基未満、１５０塩基未満、１００塩基未満、９０塩基未満、８０塩基未満、７０塩基未満、６０塩基未満、５０塩基未満、４０塩基未満、又は３０塩基未満のリード長を有する次世代配列決定技術（超並列配列決定技術とも呼ばれる）を使用して取得される。

【0210】

いくつかの例では、１つ以上の遺伝子座におけるコピー数変化の決定は、本明細書の他の箇所で説明されるように、試料が由来した対象（例えば、患者）内のがんに対する処置を選択、開始、調整、又は終了するために使用される。

【0211】

いくつかの事例では、開示されるシステムは、試料処理及びライブラリ調製ワークステーション、マイクロプレートハンドリングロボット、流体分注システム、温度制御モジュール、環境制御チャンバ、追加のデータ記憶モジュール、データ通信モジュール（例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＷｉＦｉ、イントラネット、又はインターネット通信ハードウェア及び関連ソフトウェア）、ディスプレイモジュール、１つ以上のローカル及び／若しくはクラウドベースのソフトウェアパッケージ（例えば、機器／システム制御ソフトウェアパッケージ、配列決定データ分析ソフトウェアパッケージ）など、又はそれらの任意の組み合わせを更に含み得る。いくつかの事例では、システムは、本明細書の他の箇所に説明されるコンピュータシステム又はコンピュータネットワークを含むか、又はその一部であり得る。

【0212】

コンピュータシステム及びネットワーク
図６は、一実施形態によるコンピューティングデバイス又はシステムの例を例示する。デバイス６００は、ネットワークに接続されたホストコンピュータとすることができる。デバイス６００は、クライアントコンピュータ又はサーバとすることができる。図６に示されるように、デバイス６００は、パーソナルコンピュータ、ワークステーション、サーバ、又はハンドヘルド計算デバイス（携帯電子デバイス、例えば、電話又はタブレット）などの任意の好適なタイプのマイクロプロセッサベースのデバイスであり得る。デバイスは、例えば、１つ以上のプロセッサ６１０、入力デバイス６２０、出力デバイス６３０、メモリ又は記憶デバイス６４０、通信デバイス６６０、及び核酸シーケンサー６７０を含み得る。メモリ又は記憶デバイス６４０に常駐するソフトウェア６５０は、例えば、オペレーティングシステム、及び本明細書に説明される方法を実行するためのソフトウェアを含み得る。入力デバイス６２０及び出力デバイス６３０は、一般に、本明細書に記載のものに対応していてもよく、コンピュータと接続可能であってもよく、又はコンピュータと一体化していてもよい。

【0213】

入力デバイス６２０は、タッチスクリーン、キーボード若しくはキーパッド、マウス、又は音声認識デバイスなどの入力を提供する任意の好適なデバイスであってもよい。出力デバイス６３０は、タッチスクリーン、触覚デバイス、又はスピーカなど、出力を提供する任意の好適なデバイスであってもよい。

【0214】

ストレージ６４０は、ストレージ（例えば、ＲＡＭ（揮発性及び不揮発性）、キャッシュ、ハードドライブ、又はリムーバブルストレージディスクを含む、電気的、磁気的、又は光学的メモリ）を提供する任意の好適なデバイスであり得る。通信デバイス６６０は、ネットワークインターフェースチップ又はデバイスなどのネットワークを介してシグナルを送受信し得る任意の好適なデバイスを含み得る。コンピュータの構成要素は、例えば、有線メディア（例えば、物理システムバス６８０、イーサネット接続、若しくは任意の他の有線転送技術）を介して、又は無線（例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）、Ｗｉ－Ｆｉ（登録商標）、又は任意の他の無線技術）で、任意の好適な様式で接続することができる。

【0215】

ソフトウェアモジュール６５０は、ストレージ６４０に実行可能な命令として記憶され、プロセッサ６１０によって実行されることができ、例えば、オペレーティングシステム及び／又は本開示の方法の機能を具現化するプロセスを含むことができる（例えば、上記のデバイスに具現化される）。

【0216】

ソフトウェアモジュール６５０はまた、命令実行システム、装置、若しくはデバイス（例えば、本明細書に記載のもの）によって、又はそれらと接続して使用するための任意の非一時的コンピュータ可読記憶媒体内に記憶及び／又は転送することができ、命令実行システム、装置、若しくはデバイスからの、ソフトウェアに関連付けられた命令をフェッチし、命令を実行することができる。本開示の文脈において、コンピュータ可読記憶媒体は、ストレージ６４０などの任意の媒体であり得、命令実行システム、装置、若しくはデバイスによって、又はそれらと接続して使用するためのプロセスを含む若しくは記憶することができる。コンピュータ可読記憶媒体の例としては、単一の機能ユニットとして動作するハードドライブ、フラッシュドライブ、及び配信モジュールなどのメモリユニットを挙げることができる。また、本明細書に記載の様々なプロセスは、上記の実施形態及び技法に従って動作するように構成されたモジュールとして具現化され得る。更に、プロセスは別個に示され、かつ／又は説明され得るが、当業者は、上記のプロセスが他のプロセス内のルーチン又はモジュールであり得ることを理解するであろう。

【0217】

ソフトウェアモジュール６５０はまた、命令実行システム、装置、若しくは上述したものなどのデバイスによって、又はそれらと接続して使用するための任意の伝送媒体内に伝播され得、命令実行システム、装置、若しくはデバイスからの、ソフトウェアに関連付けられた命令をフェッチし、命令を実行し得る。本開示の文脈において、伝送媒体は、任意の媒体とし得、命令実行システム、装置、若しくはデバイスによって、又はそれらと接続して使用するための伝送プログラミングを通信、伝播、又は伝送し得る。伝送可読媒体は、電子、磁気、光学、電磁気、若しくは赤外線の有線又は無線伝播媒体を含み得るが、これらに限定されない。

【0218】

デバイス６００は、任意の好適なタイプの相互接続された通信システムであり得る、ネットワーク（例えば、図７に示され、及び／又は以下に説明される、ネットワーク７０４）に接続され得る。ネットワークは、任意の好適な通信プロトコルを実装し得、任意の好適なセキュリティプロトコルによって保護され得る。ネットワークは、無線ネットワーク接続（Ｔ１若しくはＴ３回線）、ケーブルネットワーク、ＤＳＬ、又は電話回線などの、ネットワークシグナルの送受信を実装し得る任意の好適な配置のネットワークリンクを含み得る。

【0219】

デバイス６００は、任意のオペレーティングシステム、例えば、ネットワーク上で動作するのに好適なオペレーティングシステムを使用して実装され得る。ソフトウェアモジュール６５０は、Ｃ、Ｃ＋＋、Ｊａｖａ、又はＰｙｔｈｏｎなどの任意の好適なプログラミング言語で書くことができる。様々な実施形態では、本開示の機能を具現化するアプリケーションソフトウェアは、異なる構成で（例えば、クライアント／サーバ配置で、又はウェブベースのアプリケーション若しくはウェブサービスとしてのウェブブラウザを介して）展開され得る。いくつかの実施形態では、オペレーティングシステムは、１つ以上のプロセッサ、例えば、プロセッサ６１０によって実行される。

【0220】

デバイス６００は、任意の適切な核酸配列決定機器とすることができるシーケンサー６７０を更に含むことができる。

【0221】

図７は、一実施形態によるコンピューティングシステムの例を例示する。システム７００では、デバイス６００（例えば、上記に説明され、図６に例示される）は、ネットワーク７０４に接続され、これはまた、デバイス７０６にも接続されている。いくつかの実施形態では、デバイス７０６は、シーケンサーである。例示的なシーケンサーは、限定されないが、Ｒｏｃｈｅ／４５４のＧｅｎｏｍｅＳｅｑｕｅｎｃｅｒ（ＧＳ）ＦＬＸＳｙｓｔｅｍ、Ｉｌｌｕｍｉｎａ／ＳｏｌｅｘａのＧｅｎｏｍｅＡｎａｌｙｚｅｒ（ＧＡ）、ＩｌｌｕｍｉｎａのＨｉＳｅｑ２５００、ＨｉＳｅｑ３０００、ＨｉＳｅｑ４０００、及びＮｏｖａＳｅｑ６０００配列決定システム、Ｌｉｆｅ／ＡＰＧのＳｕｐｐｏｒｔＯｌｉｇｏｎｕｃｌｅｏｔｉｄｅＬｉｇａｔｉｏｎＤｅｔｅｃｔｉｏｎ（ＳＯＬｉＤ）システム、ＰｏｌｏｎａｔｏｒのＧ．００７システム、ＨｅｌｉｃｏｓＢｉｏＳｃｉｅｎｃｅｓのＨｅｌｉＳｃｏｐｅＧｅｎｅ配列決定システム、又はＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓのＰａｃＢｉｏＲＳシステムを含む。

【0222】

デバイス６００及び７０６は、例えば、ローカルエリアネットワーク（ＬＡＮ）、仮想プライベートネットワーク（ＶＰＮ）、又はインターネットなどのネットワーク７０４を介して適切な通信インターフェースを使用して通信することができる。いくつかの実施形態では、ネットワーク７０４は、例えば、インターネット、イントラネット、仮想プライベートネットワーク、クラウドネットワーク、有線ネットワーク、又は無線ネットワークとすることができる。デバイス６００及び７０６は、イーサネット、ＩＥＥＥ８０２．１１ｂ無線などの無線又は有線通信を介して、部分的又は全体的に通信することができる。追加的に、デバイス６００及び７０６は、例えば、好適な通信インターフェースを使用して、モバイル／セルラーネットワークなどの第２のネットワークを介して通信することができる。デバイス６００と７０６との間の通信は、メールサーバ、モバイルサーバ、メディアサーバ、電話サーバなどの様々なサーバを更に含むか、それらと通信することができる。いくつかの実施形態では、デバイス６００及び７０６は、（ネットワーク７０４を介した通信の代わりに、又はそれに加えて）、例えば、イーサネット、ＩＥＥＥ８０２．１１ｂ無線などの無線又は有線通信を介して、直接通信することができる。いくつかの実施形態では、デバイス６００及び７０６は、直接接続とすることができるか、又はネットワーク（例えば、ネットワーク７０４）を介して発生することができる通信７０８を介して通信する。

【0223】

デバイス６００及び７０６のうちの一方又は全ては、一般に、本明細書に説明される様々な例に従ってネットワーク７０４を介して情報を提供及び／又は受信するために、ローカル若しくはリモートのデータベース又は他のデータ及びコンテンツのソースからアクセスされる論理（例えば、ｈｔｔｐウェブサーバロジック）を含むか、又はデータをフォーマットするようにプログラムされる。

【0224】

例示的な実施態様
本明細書に説明される方法及びシステムの例示的な実施態様は、以下を含む。
１．方法であって、
対象からの試料から取得された複数の核酸分子を提供することと、
１つ以上のアダプターを複数の核酸分子からの１つ以上の核酸分子上にライゲーションすることと、
複数の核酸分子からの１つ以上のライゲーションされた核酸分子を増幅することと、
増幅された核酸分子から増幅された核酸分子を捕捉することと、
シーケンサーによって、捕捉された核酸分子を配列決定して、捕捉された核酸分子を表す複数の配列リードを得ることであって、複数の配列リードのうちの１つ以上が、試料中の１つ以上のサブゲノム区間内で１つ以上の遺伝子座と重複する、得ることと、
１つ以上のプロセッサで、複数の配列リードに対する配列リードデータを受信することと、配列リードデータに基づいて、
１つ以上のプロセッサを使用して、１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、試料の倍数性、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルを決定することと、
１つ以上のプロセッサを使用して、セグメント化データに基づいて、複数のセグメントを識別することと、
１つ以上のプロセッサを使用して、少なくともカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルに基づいて、複数のセグメントに対するコピー数を決定することと、
１つ以上のプロセッサを使用して、複数のセグメントの対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅又は欠失の存在を検出することと、
１つ以上のプロセッサを使用して、１つ以上の遺伝子座に対する検出された増幅及び欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を含む、方法。
２．１つ以上の遺伝子座のうちの遺伝子座について検出された増幅及び欠失の任意の重複を併合することを更に含む、条項１に記載の方法。
３．コピー数モデルが、カバレッジ比データ及び対立遺伝子画分データに基づいて、１つ以上の遺伝子座に対するコピー数を予測する、条項１又は２に記載の方法。
４．カバレッジ比データが、１つ以上の遺伝子座と関連付けられた一塩基多型（ＳＮＰ）及びイントロンに対するカバレッジ比データを更に含む、条項１～３のいずれか一項に記載の方法。
５．コピー数モデルがまた、試料に対する試料純度及び倍数性も予測する、条項１～４のいずれか一項に記載の方法。
６．コピー数モデルがまた、セグメント化データも出力する、条項１～５のいずれか一項に記載の方法。
７．増幅は、対応するセグメントに対するコピー数が試料の倍数性以上であるときに検出される、条項１～６のいずれか一項に記載の方法。
８．欠失の検出が、対応するセグメント内の１つ以上の遺伝子座のホモ接合体欠失を識別することを含む、条項１～７のいずれか一項に記載の方法。
９．欠失の検出が、対応するセグメント内の１つ以上の遺伝子座のヘテロ接合体欠失を識別することを含む、条項１～８のいずれか一項に記載の方法。
１０．欠失の検出が、対応するセグメント内の１つ以上の遺伝子座の部分欠失を識別することを含む、条項１～９のいずれか一項に記載の方法。
１１．対象が、疾患を有することが疑われるか、又は疾患を有すると決定される、条項１～１０のいずれか一項に記載の方法。
１２．疾患が、がんである、条項１１に記載の方法。
１３．方法が、定期検査に使用される、条項１～１２のいずれか一項に記載の方法。
１４．方法が、出生前検査に使用される、条項１～１３のいずれか一項に記載の方法。
１５．対象から試料を収集することを更に含む、条項１～１４のいずれか一項に記載の方法。
１６．試料が、組織生検試料、液体生検試料、又は正常対照を含む、条項１～１５のいずれか一項に記載の方法。
１７．試料が、組織生検試料であり、骨髄試料を含む、条項１６に記載の方法。
１８．試料が、液体生検試料であり、かつ血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含む、条項１６に記載の方法。
１９．試料が、液体生検試料であり、かつ循環腫瘍細胞（ＣＴＣ）を含む、条項１６に記載の方法。
２０．試料が、液体生検試料であり、かつ無細胞ＤＮＡ（ｃｆＤＮＡ）、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）、又はそれらの任意の組み合わせを含む、条項１６に記載の方法。
２１．複数の核酸分子が、腫瘍核酸分子と非腫瘍核酸分子との混合物を含む、条項１～２０のいずれか一項に記載の方法。
２２．腫瘍核酸分子が、不均質組織生検試料の腫瘍部分に由来し、かつ非腫瘍核酸分子が、不均質組織生検試料の正常部分に由来する、条項２１に記載の方法。
２３．試料が、液体生検試料を含み、腫瘍核酸分子が、液体生検試料の循環腫瘍ＤＮＡ（ｃｔＤＮＡ）画分に由来し、非腫瘍核酸分子が、液体生検試料の非腫瘍無細胞ＤＮＡ（ｃｆＤＮＡ）画分に由来する、条項２１に記載の方法。
２４．１つ以上のアダプターが、増幅プライマー、フローセルアダプター配列、基質アダプター配列、又は試料インデックス配列を含む、条項１～２３のいずれか一項に記載の方法。
２５．捕捉された核酸分子が、１つ以上のベイト分子へのハイブリダイゼーションによって増幅された核酸分子から捕捉される、条項１～２４のいずれか一項に記載の方法。
２６．１つ以上のベイト分子が、１つ以上の核酸分子を含み、各核酸分子が、捕捉された核酸分子の領域に相補的な領域を含む、条項２５に記載の方法。
２７．核酸分子を増幅することが、ポリメラーゼ連鎖反応（ＰＣＲ）増幅技術、非ＰＣＲ増幅技術、又は等温増幅技術を実施することを含む、条項１～２６のいずれか一項に記載の方法。
２８．配列決定が、超並列配列決定（ＭＰＳ）技術、全ゲノム配列決定（ＷＧＳ）、全エクソーム配列決定、標的配列決定、直接配列決定、又はサンガー配列決定技術の使用を含む、条項１～２７のいずれか一項に記載の方法。
２９．配列決定が、超並列配列決定を含み、超並列配列決定技術が、次世代配列決定（ＮＧＳ）を含む、条項２８に記載の方法。
３０．次世代配列決定（ＮＧＳ）が、ペアエンド配列決定を含む、条項２９に記載の方法。
３１．シーケンサーが、次世代シーケンサーを含む、条項１～３０のいずれか一項に記載の方法。
３２．１つ以上のプロセッサによって、呼び出されたコピー数変化を示すレポートを生成することを更に含む、条項１～３１のいずれか一項に記載の方法。
３３．レポートをヘルスケア提供者に送信することを更に含む、条項３２に記載の方法。
３４．レポートが、コンピュータネットワーク又はピアツーピア接続を介して送信される、条項３３に記載の方法。
３５．コピー数変化の自動呼び出しのための方法であって、
１つ以上のプロセッサで、対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードに対する配列リードデータを受信することと、配列リードデータに基づいて、
１つ以上のプロセッサを使用して、１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、試料の倍数性、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルを決定することと、
１つ以上のプロセッサを使用して、セグメント化データに基づいて、複数のセグメントを識別することと、
１つ以上のプロセッサを使用して、少なくともカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルに基づいて、複数のセグメントに対するコピー数を決定することと、
１つ以上のプロセッサを使用して、複数のセグメントの対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅又は欠失の存在を検出することと、
１つ以上のプロセッサを使用して、１つ以上の遺伝子座に対する検出された増幅及び欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を含む、方法。
３６．１つ以上の遺伝子座のうちの遺伝子座について検出された増幅及び欠失の任意の重複を併合することを更に含む、条項３５に記載の方法。
３７．１つ以上の遺伝子座に対する呼び出されたコピー数変化を含むレポートを生成することを更に含む、条項３５又は３６に記載の方法。
３８．１つ以上の遺伝子座に対する呼び出されたコピー数変化に基づいて、対象に対するゲノムプロファイルを生成することを更に含む、条項３５～３７のいずれか一項に記載の方法。
３９．カバレッジ比データが、試料中及び対照試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを参照ゲノムにアラインメントすることと、試料中及び対照試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座の各々と重複する配列リードの数を決定することと、によって決定される、条項３５～３８のいずれか一項に記載の方法。
４０．対照試料が、一対の正常試料、プロセスマッチド対照試料、又はパネルオブノーマル対照試料である、条項３９に記載の方法。
４１．対立遺伝子画分データが、試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを参照ゲノムにアラインメントすることと、１つ以上の遺伝子座のうちの遺伝子座に存在する対立遺伝子の数を検出することと、遺伝子座に存在する対立遺伝子のうちの少なくとも１つに対する対立遺伝子画分を決定することと、によって決定される、条項３５～４０のいずれか一項に記載の方法。
４２．セグメント化データが、
試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードを参照ゲノムにアラインメントすることと、
枝刈り厳密線形時間（ＰＥＬＴ）法を使用して、アラインメントされた配列リードデータ、カバレッジ比データ、及び対立遺伝子画分データを処理して、アラインメントされた配列リードデータを考慮することを必要とするセグメントの数を決定することであって、各セグメントが、同じコピー数を有する、決定することと、によって生成される、条項３５～４１のいずれか一項に記載の方法。
４３．コピー数モデルが、カバレッジ比データ及び対立遺伝子画分データに基づいて、１つ以上の遺伝子座に対するコピー数を予測する、条項３５～４２のいずれか一項に記載の方法。
４４．カバレッジ比データが、１つ以上の遺伝子座と関連付けられた一塩基多型（ＳＮＰ）及びイントロンに対するカバレッジ比データを更に含む、４３に記載の方法。
４５．コピー数モデルがまた、試料に対する試料純度及び倍数性も予測する、項４３又は４４に記載の方法。
４６．コピー数モデルがまた、セグメント化データも出力する、条項４３～４５のいずれか一項に記載の方法。
４７．試料に対する倍数性が、１～８の範囲の値を有する、条項３５～４６のいずれか一項に記載の方法。
４８．増幅は、対応するセグメントに対するコピー数が試料の倍数性以上であるときに検出される、条項３５～４７のいずれか一項に記載の方法。
４９．増幅は、対応するセグメントに対するコピー数が試料の倍数性＋第１の所定の値以上であるときに検出される、条項４８に記載の方法。
５０．第１の所定の値が、２～５００の範囲の値である、条項４９に記載の方法。
５１．第１の所定の値が、２～１０の範囲の値である、条項４９又は５０に記載の方法。
５２．増幅は、対応するセグメントに対するコピー数が試料の倍数性＋第２の所定の値以上であり、かつ遺伝子座が第１の定義済み遺伝子座セットのメンバーであるときに検出される、条項４８に記載の方法。
５３．第２の所定の値が、０～５００の範囲の値である、条項５２に記載の方法。
５４．第２の所定の値が、２～１０の範囲の値である、条項５２又は５３に記載の方法。
５５．第１の定義済み遺伝子座セットが、１つ以上の薬物投与可能遺伝子標的座、予後遺伝子座、がん遺伝子座、又はそれらの任意の組み合わせを含む、条項５２～５４のいずれか一項に記載の方法。
５６．第１の定義済み遺伝子座セットが、ＡＲ及びＥＲＢＢ２遺伝子座を含む、条項５５に記載の方法。
５７．欠失の検出が、対応するセグメント内の１つ以上の遺伝子座のホモ接合体欠失を識別することを含む、条項３５～５６のいずれか一項に記載の方法。
５８．ホモ接合体欠失が、遺伝子座における第１の対立遺伝子及び第２の対立遺伝子に対するコピー数の合計に等しい所与の遺伝子座に対する総コピー数を決定することによって検出される、条項５７に記載の方法。
５９．第１の対立遺伝子が、メジャー対立遺伝子であり、第２の対立遺伝子が、マイナー対立遺伝子である、条項５８に記載の方法。
６０．ホモ接合体欠失は、所与の遺伝子座に対する総コピー数が第３の所定の値に等しい場合に呼び出される、条項５８又は５９に記載の方法。
６１．第３の所定の値が、約ゼロである、条項６０に記載の方法。
６２．欠失の検出が、対応するセグメント内の１つ以上の遺伝子座のヘテロ接合体欠失を識別することを含む、条項３５～６１のいずれか一項に記載の方法。
６３．ヘテロ接合体欠失は、所与の遺伝子座における第１の対立遺伝子に対するコピー数が第４の所定の値に等しく、かつ所与の遺伝子座における第２の対立遺伝子に対するコピー数が第４の所定の値に等しくない場合、呼び出される、条項６２に記載の方法。
６４．第４の所定の値が、約ゼロである、条項６３に記載の方法。
６５．第１の対立遺伝子が、メジャー対立遺伝子であり、第２の対立遺伝子が、マイナー対立遺伝子である、条項６３又は６４に記載の方法。
６６．欠失の検出が、対応するセグメント内の１つ以上の遺伝子座の部分欠失を識別することを含む、条項３５～６５のいずれか一項に記載の方法。
６７．部分欠失は、所与の遺伝子座に対して、隣接する遺伝子座、一塩基多型（ＳＮＰ）、及びイントロンに対するｌｏｇ２比（Ｌ２Ｒ）が、遺伝子座に対するｌｏｇ２比とは有意に異なり、かつ所与の遺伝子座に対するｌｏｇ２比が、隣接していない遺伝子座、一塩基多型（ＳＮＰ）、及びイントロンに対するＬ２Ｒの分布とは有意に異なる場合、呼び出される、条項６６に記載の方法。
６８．１つ以上の遺伝子座に対するコピー数変化を呼び出す前に品質管理手順を実施することを更に含む、条項３５～６７のいずれか一項に記載の方法。
６９．品質管理手順が、配列リードデータの品質を評価するために実施される、条項６８に記載の方法。
７０．品質管理手順が、コピー数モデルの成功した収束を評価するために実施される、条項６８又は６９に記載の方法。
７１．品質管理手順が、１つ以上の遺伝子座に対するＣＮＡ呼び出しの信頼性を評価するために実施される、項６８～７０のいずれか一項に記載の方法。
７２．呼び出されたＣＮＡが、対象の疾患を診断するか、又はその診断を確認するために使用される、条項３５～７１のいずれか一項に記載の方法。
７３．疾患が、がんである、条項７２に記載の方法。
７４．がん治療を選択して、呼び出されたＣＮＡに基づいて、対象に投与することを更に含む、条項７２又は７３に記載の方法。
７５．がん治療の有効量を決定して、呼び出されたＣＮＡに基づいて、対象に投与することを更に含む、条項７３又は７４に記載の方法。
７６．呼び出されたＣＮＡに基づいて、がん治療を対象に投与することを更に含む、条項７４又は７５に記載の方法。
７７．がん治療が、化学療法、放射線療法、免疫療法、標的療法、又は外科手術を含む、条項７４～７６のいずれか一項に記載の方法。
７８．がんが、Ｂ細胞がん（多発性骨髄腫）、黒色腫、乳がん、肺がん、気管支がん、結腸直腸がん、前立腺がん、膵臓がん、胃がん、卵巣がん、膀胱がん、脳がん、中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮頸部がん、子宮内膜がん、口腔のがん、咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸がん、虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫、消化管間質腫瘍（ＧＩＳＴ）、結腸がん、多発性骨髄腫（ＭＭ）、骨髄異形成症候群（ＭＤＳ）、骨髄増殖性障害（ＭＰＤ）、急性リンパ性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性骨髄性白血病（ＣＭＬ）、慢性リンパ性白血病（ＣＬＬ）、真性赤血球増加症、ホジキンリンパ腫、非ホジキンリンパ腫（ＮＨＬ）、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ血管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭状がん、乳頭腺がん、髄様がん、気管支原性がん、腎細胞がん、肝がん、胆管がん、絨毛がん、精上皮がん、胎児性がん、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体細胞腫、血管芽細胞腫、聴神経芽腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、原発性骨髄線維症、好酸球増加症候群、全身性肥満細胞症、家族性好酸球増加症、慢性好酸球性白血病、神経内分泌がん、又はカルチノイド腫瘍である、条項７４～７７のいずれか一項に記載の方法。
７９．１つ以上の遺伝子座が、１０～２０遺伝子座、１０～４０遺伝子座、１０～６０遺伝子座、１０～８０遺伝子座、１０～１００遺伝子座、１０～１５０遺伝子座、１０～２００遺伝子座、１０～２５０遺伝子座、１０～３００遺伝子座、１０～３５０遺伝子座、１０～４００遺伝子座、１０～４５０遺伝子座、１０～５００遺伝子座、２０～４０遺伝子座、２０～６０遺伝子座、２０～８０遺伝子座、２０～１００遺伝子座、２０～１５０遺伝子座、２０～２００遺伝子座、２０～２５０遺伝子座、２０～３００遺伝子座、２０～３５０遺伝子座、２０～４００遺伝子座、２０～５００遺伝子座、４０～６０遺伝子座、４０～８０遺伝子座、４０～１００遺伝子座、４０～１５０遺伝子座、４０～２００遺伝子座、４０～２５０遺伝子座、４０～３００遺伝子座、４０～３５０遺伝子座、４０～４００遺伝子座、４０～５００遺伝子座、６０～８０遺伝子座、６０～１００遺伝子座、６０～１５０遺伝子座、６０～２００遺伝子座、６０～２５０遺伝子座、６０～３００遺伝子座、６０～３５０遺伝子座、６０～４００遺伝子座、６０～５００遺伝子座、８０～１００遺伝子座、８０～１５０遺伝子座、８０～２００遺伝子座、８０～２５０遺伝子座、８０～３００遺伝子座、８０～３５０遺伝子座、８０～４００遺伝子座、８０～５００遺伝子座、１００～１５０遺伝子座、１００～２００遺伝子座、１００～２５０遺伝子座、１００～３００遺伝子座、１００～３５０遺伝子座、１００～４００遺伝子座、１００～５００遺伝子座、１５０～２００遺伝子座、１５０～２５０遺伝子座、１５０～３００遺伝子座、１５０～３５０遺伝子座、１５０～４００遺伝子座、１５０～５００遺伝子座、２００～２５０遺伝子座、２００～３００遺伝子座、２００～３５０遺伝子座、２００～４００遺伝子座、２００～５００遺伝子座、２５０～３００遺伝子座、２５０～３５０遺伝子座、２５０～４００遺伝子座、２５０～５００遺伝子座、３００～３５０遺伝子座、３００～４００遺伝子座、３００～５００遺伝子座、３５０～４００遺伝子座、３５０～５００遺伝子座、又は４００～５００遺伝子座を含む、条項３５～７８のいずれか一項に記載の方法。
８０．疾患を診断するための方法であって、方法が、
対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）の検出に基づいて、対象が疾患を有することを診断することを含み、検出されたＣＮＡが、項３５～７５のいずれか一項に記載の方法に従って決定される、方法。
８１．がん治療を選択する方法であって、方法が、
対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を検出することに応答して、対象に対するがん治療を選択することを含み、検出されたＣＮＡが、条項３５～７９のいずれか一項に記載の方法に従って決定される、方法。
８２．対象のがんを処置する方法であって、
対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を検出することに応答して、有効量のがん治療を対象に投与することを含み、検出されたＣＮＡが、条項３５～８１のいずれか一項に記載の方法に従って決定される、方法。
８３．対象における腫瘍の進行又は再発を監視するための方法であって、方法が、
条項３５～８１のいずれか一項に記載の方法に従って、第１の時点で対象から得られた第１の試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を検出することと、
第２の時点で対象から得られた第２の試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を検出することと、第１の試料中で検出されたＣＮＡを第２の試料中で検出されたＣＮＡと比較し、それによって、腫瘍の進行又は再発を監視することと、を含む、方法。
８４．第２の試料中のＣＮＡの検出が、条項３５～８１のいずれか一項に記載の方法に従って決定される、項８３に記載の方法。
８５．腫瘍の進行に応答して、抗がん治療を調整することを更に含む、条項８３又は８４に記載の方法。
８６．腫瘍進行に応答して抗がん治療の投与量を調整すること、又は異なる抗がん治療を選択することを更に含む、条項８３～８５のいずれか一項に記載の方法。
８７．調整された抗がん治療を対象に投与することを更に含む、条項８６に記載の方法。
８８．第１の時点は、対象が抗がん治療を投与される前であり、第２の時点は、対象が抗がん治療を投与された後である、条項８３～８７のいずれか一項に記載の方法。
８９．対象が、がんを有するか、がんを有するリスクがあるか、がんについて日常的に検査されているか、又はがんを有する疑いがある、条項８３～８８のいずれか一項に記載の方法。
９０．がんが、固形腫瘍である、条項８３～８９のいずれか一項に記載の方法。
９１．がんが、血液がんである、条項８３～８９のいずれか一項に記載の方法。
９２．抗がん治療が、化学療法、放射線療法、免疫療法、標的療法、又は外科手術を含む、条項８５～９１のいずれか一項に記載の方法。
９３．１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する呼び出されたＣＮＡを決定することと、呼び出されたＣＮＡを試料と関連付けられた診断値として適用することと、を更に含む、条項３５～７９のいずれか一項に記載の方法。
９４．１つ以上の遺伝子座に対する呼び出されたＣＮＡに基づいて、対象に対するゲノムプロファイルを生成することを更に含む、条項３５～７９のいずれか一項に記載の方法。
９５．対象のゲノムプロファイルが、包括的ゲノムプロファイリング（ＣＧＰ）試験、遺伝子発現プロファイリング試験、がんホットスポットパネル試験、ＤＮＡメチル化試験、ＤＮＡ断片化試験、ＲＮＡ断片化試験、又はそれらの任意の組み合わせからの結果を更に含む、条項９４に記載の方法。
９６．対象のゲノムプロファイルが、核酸配列決定に基づく試験からの結果を更に含む、条項９４又は９５に記載の方法。
９７．生成されたゲノムプロファイルに基づいて、対象に対して、抗がん剤を選択すること、抗がん剤を投与すること、又は抗がん処置を適用することを更に含む、条項９４～９６のいずれか一項に記載の方法。
９８．試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するＣＮＡの検出が、対象に対する示唆される処置決定を行う際に使用される、条項３５～７９のいずれか一項に記載の方法。
９９．試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対するＣＮＡの検出が、対象に処置を適用又は投与する際に使用される、条項３５～７９のいずれか一項に記載の方法。
１００．システムであって、
１つ以上のプロセッサと、
１つ以上のプロセッサに通信可能に結合され、かつ命令を記憶するように構成されたメモリと、を備え、命令が、１つ以上のプロセッサによって実行されたとき、システムに、
対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードに対する配列リードデータを受信することと、配列リードデータに基づいて、
１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、試料の倍数性、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルを決定することと、
セグメント化データに基づいて、複数のセグメントを識別することと、
少なくともカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルに基づいて、複数のセグメントに対するコピー数を決定することと、
複数のセグメントの対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅又は欠失の存在を検出することと、
１つ以上の遺伝子座に対する検出された増幅及び欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を行わせる、システム。
１０１．１つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、１つ以上のプログラムが、命令を含み、命令が、システムの１つ以上のプロセッサによって実行されたとき、システムに、
対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座と重複する複数の配列リードに対する配列リードデータを受信することと、配列リードデータに基づいて、
対象からの試料中の１つ以上のサブゲノム区間内の１つ以上の遺伝子座に対する、試料の倍数性、カバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルを決定することと、
セグメント化データに基づいて、複数のセグメントを識別することと、
少なくともカバレッジ比データ、対立遺伝子画分データ、セグメント化データ、及びコピー数モデルに基づいて、複数のセグメントに対するコピー数を決定することと、
複数のセグメントの対応するセグメントのコピー数に基づいて、１つ以上の遺伝子座のうちの遺伝子座に対する増幅又は欠失の存在を検出することと、
１つ以上の遺伝子座に対する検出された増幅及び欠失に基づいて、１つ以上の遺伝子座に対するコピー数変化（ＣＮＡ）を呼び出すことと、を行わせる、非一時的コンピュータ可読記憶媒体。

【0225】

以上から、開示される方法及びシステムの特定の実施態様が例示及び説明されたが、様々な修正がそれらになされ得、本明細書で企図されることが理解されるべきである。本明細書内に提供される特定の例によって本発明が限定されることも意図していない。本発明は、上述の明細書を参照して説明されたが、本明細書の好ましい実施形態の説明及び例示は、限定の意味で解釈されることを意味していない。更に、本発明の全ての態様は、様々な条件及び変数に依存する、本明細書に記載された特定の描写、構成、又は相対的割合に限定されないことを理解されたい。本発明の実施形態の形態及び詳細に置ける様々な修正が当業者にとって明らかであろう。したがって、本発明はまた、任意のそのような修正例、変形例、及び均等物も包含するものと企図される。

【図1】