【実施例】
【0441】
以下に記載の実施例は、特定の実施形態を図示し、技術を限定しない。
【0442】
実施例1:遺伝的変異に関連する状態を検出する一般的方法
本明細書に記載の方法および基本的理論を利用し、遺伝的変異に関連する種々の状態を検出し、かつ遺伝的変異の有無を決定することができる。本明細書に記載の方法を用いて検出することができる遺伝的変異の非限定的な例として、染色体異常断片(例えば、欠失、重複)、異数性、性別、サンプル同定、遺伝的変異に関連する疾患状態など、または上記の組み合わせがある。
【0443】
ビンフィルタリング
標的染色体のゲノム領域の情報量を、染色体位置の関数として、不確定要素の組み合わせにより正規化された、正倍数体とトリソミーのカウントとの間の平均分離の結果をプロットすることにより視覚化することができる。不確定要素の増加(
図1を参照のこと)または3倍体と正倍数体(例えば、3倍体の妊娠および正倍数体の妊娠)との間のギャップの減少(
図2を参照のこと)はともに、Zスコアの予測指数を低下させることもある、罹患症例におけるZ値の低下を生じる。
【0444】
図3は、第21番染色体に沿った染色体位置の関数としてプロットされた、t分布に基づく、p値プロファイルをグラフにより図示する。
図3に示されたデータの分析は、36個の無益な第21番染色体ビン(それぞれ約50キロ塩基対(kbp)長)を同定する。無益な領域を、セントロメアに近いp腕に配置する(21p11.2−21p11.1)。
図4に概略的に示すように、Zスコアの算出から全ての36個のビンを除去することにより、全てのトリソミーの例に対してZ値を顕著に増加させることができることもあるが、正倍数体のZ値に不規則な分散のみを導入し得る。
【0445】
36個の無益なビンの除去により得られた予測指数の改善は、第21番染色体におけるカウントプロファイルを検査することにより説明することができる(
図5を参照のこと)。
図5において、2つの任意に選択されたサンプルは、カウント対(vs)ビンプロファイルの一般的傾向変動が、近距離ノイズから離れて実質的に類似の傾向変動に追随することを示す。
図5に示されるプロファイルは、実質的に平行である。
図5に示されたプロファイルプロットの強調領域(例えば、楕円の領域)はまた、なお平行性を示すが、染色体の残りに対して大きな変動を示す。いくつかの実施形態において、変動するビン(例えば、36個の無益なビン)の除去により、Z統計の精度および一貫性を改善することができる。
【0446】
ビン正規化
実施例1に記載のように、無益なビンをフィルタリングすることは、Z値の予測指数に対する所望の改善を提供しないこともある。実施例1に記載のように、第18番染色体のデータをフィルタリングし、無益なビンを除去するときに、Z値は、実質的に改善しなかった(
図6を参照のこと)。実施例1に示される第21番染色体のカウントプロファイルでわかるように、第18番染色体のカウントプロファイルも、短距離ノイズに関わらず実質的に平行である。しかし、ビンワイズカウントの不確定要素を評価するために使用される2つの第18番染色体のサンプル(
図6の下部を参照のこと)は、カウントプロファイルの一般的な平行から顕著に逸脱する。2つのトレースの中央のディップは、楕円により強調されているが、大きな欠失を表す。実験過程に試験した他のサンプルは、この欠失を示さなかった。欠失は、
図7に示される楕円により図示された、第18番染色体におけるp値プロファイルのディップの位置と一致する。すなわち、第18番染色体におけるp値に観察されたディップは、第18番染色体のサンプルの欠失の存在により説明され、これは、罹患領域のカウントの分散の増加を生じる。カウントの分散は不規則ではないが、まれな事象を表し(例えば、第18番染色体の断片の欠失)、他のサンプルを含む場合、他のサンプルからの不規則な変動は、ビンフィルタリング方法の予測指数(the predictive power bin filtering procedure)を低下させる。
【0447】
この実施例から2つの疑問が生じる;(1)p値信号が意味のある、および/または有用であるとどのように決定するか、および(2)本明細書に記載のp値法を、任意のビンデータとともに使用するために一般化することができるか(例えば、任意の染色体の内から、第13番染色体、第18番染色体または第21番染色体内からのビンのみではない)。一般化した方法を使用し、全体のゲノムにおけるカウント合計の分散性を除去することができ、これは、多くの場合、Zスコアを評価するときに対して正規化因子として使用することができる。
図8に示されるデータを使用し、参照中央値カウントを各ビンに割り当てることによりデータの一般的な曲線を再構築し、試験サンプルの各ビンカウントを、割り当てられた参照中央値カウントに対して正規化することにより、上記の疑問に対する答えを探すことができる。
【0448】
中央値を、既知の正倍数体の参照のセットから抽出する。参照中央カウントを演算する前に、ゲノム全体の無益なビンをフィルタリングする。残りのビンカウントを、残りのカウント総数に対して正規化する。試験サンプルはまた、フィルタリングされていないビンにおいて観察されたカウントの和に対して正規化される。得られた試験プロファイルは、多くの場合、母体の欠失または重複の領域および胎児が3倍体である領域を除いて、1の値前後に集中する(
図9を参照のこと)。
図10に図示されたビンワイズ正規化されたプロファイルは、正規化方法の妥当性を確かにし、第18番染色体のヘテロ接合の母体欠失(例えば、プロファイルトレーシングの灰色の区分の中央のディップ)および試験サンプルの第18番染色体の染色体表現の上昇値(
図10のプロファイルトレーシングの灰色領域を参照のこと)を明らかに表す。
図10からわかるように、トレーシングの灰色の区分における中央値は、約1.1前後に集中し、トレーシングの黒色の区分における中央値は、1.0前後に集中する。
【0449】
ピーク上昇
図11は、認識可能な特徴または形質(例えば、母体の重複、母体の欠失など、またはそれらの組み合わせ)を有する患者から、ビンワイズ正規化を使用して、複数のサンプルを分析した結果をグラフにより図示する。サンプルの同定は、多くの場合、それぞれの正規化されたカウントプロファイルを比較することにより決定することができる。
図11に図示された実施例において、正規化されたプロファイルおよびその上昇ならびにその希少性におけるディップの位置は、両サンプルが同じ患者に由来することを示す。法医学的パネルデータを、多くの場合、これらの所見を立証するために使用することができる。
【0450】
図12および13は、患者の同一性またはサンプルの同一性を同定するための正規化されたビンプロファイルを使用した結果をグラフにより図示する。
図12および13において分析されたサンプルは、第4番染色体および22の、広範囲の母体異常を担持し、これは、プロファイルトレーシングの他のサンプルにおいては存在せず、上部および下部のトレースの共有の由来を確かにする。このような結果は、具体的なサンプルが特定の患者に属する決定につながることができ、また、具体的なサンプルが既に分析されているかどうかを決定するために使用することができる。
【0451】
ビンワイズ正規化は、異常の検出を容易にするが、異なるサンプルからのピークの比較は、多くの場合、ピーク上昇および位置(例えば、ピーク端)の定量的測定を分析することによりさらに容易となる。ピークの最も突出した記述子は、多くの場合、その上昇であり、次いで、その端の位置である。異なるカウントプロフィールからの特徴は、多くの場合、以下の非限定的分析を使用して比較することができる。
【0452】
(a)単一の試験サンプルにおいてピークを検出した特徴の信頼度を決定する。特徴がバックグランドノイズまたは処理人工物から区別可能である場合、特徴を、一般的集団に対してさらに分析することができる。
【0453】
(b)母集団において検出された特徴の広がりを決定する。特徴が希少である場合、それを希少な異常のためのマーカーとして使用することができる。母集団で頻繁に見つけられる特徴は、分析にあまり有用ではない。民族的な起源は、検出された特徴のピーク上昇の妥当性の決定に関与し得る。したがって、いくつかの特徴は、特定の民族的起源からのサンプルに対して有用な情報を提供する。
【0454】
(c)異なるサンプルに認められる特徴間の比較の信頼度を得る。
【0455】
図14において、正倍数体の対象から第5番染色体の正規化されたビンカウントを図示する。いくつかの実施形態において、平均上昇は、一般的に、異常の上昇を測定する参照基準である。小さくかつ/または狭い偏差は、広く、顕著な異常に比べ、あまり信頼性のない予測因子である。したがって、胎児の低い寄与および/または処理人工物からのバックグランドノイズまたは分散は、異常が大きくなく、またはバックグランドより顕著なピーク上昇がないときに考慮に入れることが重要である。この例を、
図15に示し、この場合、上部のトレースにおいて顕著であるピークは、下部のプロファイルトレースの観察されるバックグランドノイズにおいてマスクされ得る。ピーク上昇の信頼度(
図16を参照のこと)を、正倍数体分布の幅(例えば、分散(シグマ記号として示す)と平均偏差の組み合わせ)に対する参照からの平均偏差(デルタ記号として示す)により決定することができる。平均伸長上昇の誤差を、平均値の誤差において公知の式から得ることができる。1ビンより長い伸長を、染色体内の全てのビンの不規則な(非連続の)サンプルとして処理する場合、平均上昇の誤差は、異常の範囲内のビンの数の平方根とともに減少する。この根拠では、隣り合うビンの間の相関、つまり、
図17に示される相関関数により確定された仮定が無視される(例えば、G(n)の式)。非正規化されたプロファイルは、中位の範囲の強い相関(例えば、基準の波状の分散)を示すことがあるが、正規化されたプロファイルは、相関を平準化し、不規則なノイズのみを除外する。平均値の標準誤差、つまり自己相関の相関と、第5番染色体の上昇の平均値の標準偏差の実際のサンプル評価との間の緊密な一致(
図18を参照のこと)は、相関の欠如の仮定値の有効性を確かにする。次いで、Zスコア(
図19を参照のこと)および1の上昇期待値からの偏差に関連する、Zスコアから算出したp値(
図20を参照のこと)を、平均の上昇の不確定要素に対する推定値に照らして評価することができる。p値は、ピークのビン数により次数を決定するt分布に基づく。所望のレベルの信頼度に応じて、カットオフがノイズを抑制することができ、実際の信号の絶対的な検出を可能にする。
【0456】
【化18】
[この文献は図面を表示できません]
式1を使用し、2つの異なるサンプルのピーク上昇を直接比較することができ、式中、Nは染色体全体のビンの数を指し、およびnは、異常の範囲内のビンの数を指す。2つのサンプル間の類似性を測定するp値を生成するt検定の次数を、2つの逸脱した伸長の短い方のビンの数により決定する。
【0457】
ピーク端
サンプルの異常の平均の上昇の比較に加え、比較された伸長の開始および終了も、統計学的分析に有用な情報を提供することができる。ピーク端の比較における分解能の上限を、多くの場合、ビンの大きさ(例えば、本明細書に記載の実施例の50kbp)により決定する。
図21は、3つの考えられるピーク端のシナリオ;(a)1つのサンプルからのピークを、別のサンプルからの一致するピーク内に完全に含有することができ、(b)1つのサンプルからの端が別のサンプルからの端に部分的にオーバーラップすることができ、または(c)1つのサンプルからの主要な端は、別のサンプルの末端にほんのわずか接触し、またはオーバーラップすることができることを図示する。
図22は、(c)に記載のシナリオの一例(and example)を図示する(例えば、中間のトレースの末端が上部のトレースの主要な末端にほんのわずか接触する、中間
のトレースを参照のこと)。
【0458】
端に関連する片側公差を、多くの場合、使用し、実際の異常端から不規則な分散を区別することができる。端の位置および幅を、
図23に示すように、異常なカウントプロファイルの第1の導関数を数値で評価することにより定量することができる。
【0459】
異常を、2つのヘビサイド関数の合成数として表す場合、その導関数は、2つのディラックデルタ関数の和となる。開始端は、上方向の吸収形状のピークに相関するが、終了端は、下方向の180度転換した吸収ピークとなる。異常が狭い場合、2つのスパイクは互いに近づき、分散型の曲線を形成する。端の位置を、第1のスパイクの導関数の極値により概算することができる一方、端の公差は、その幅により決定される。
【0460】
異なるサンプル間の比較は、多くの場合、端の不確定要素の合成数で除算した、2つの一致する端の位置間の差を決定することに帰着することができる。しかし、
図24に図示されるように、導関数は、バックグランドノイズに消されることもある。異常自体には、そのビン全てから寄与される総合的な情報が有効であるが、第1の導関数のみが、異常の端の数点から情報を得ることができ、これは、ノイズに打ち勝つには不十分となり得る。
図24を作製するために使用された、スライディングウィンドウ平均化は、この状況に限定された値のものである。ノイズを、第1の導関数(例えば、点推定値に類似)とピーク上昇(例えば、積分推定値に相当)を組み合わせることにより、抑制することができる。いくつかの実施形態において、第1の導関数およびピーク上昇を、ともに乗算することにより合成することができ、これは、
図25に示されるように、ピーク上昇の指数の第1の導関数とすることに等しい。
図25に示された結果は、異常の外のノイズを抑制するのに成功するが、異常の範囲内のノイズは、この操作により増強する。第1のピークの導関数は、なお明らかに区別可能であり、これを正確な端の位置および片側公差の抽出に使用することが可能であり、それにより、異常をより低いプロファイルトレーシングにおいて明らかに同定することが可能である。
【0461】
染色体上昇中央値
正倍数体患者の標的染色体内の正規化された上昇中央値は、胎児画分に関わらず、1に近いままであることが期待される。しかし、
図9および10に示されるように、トリソミー患者の上昇中央値は、胎児画分とともに増加する。この増加は、一般に、傾き0.5の実質的な線形である。実験測定値により、これらの期待値を確認する。
図26は、86個の正倍数体のサンプル(
図26の
点付きの棒で示す)における上昇中央値のヒストグラムを図示する。中央値は、1前後に緊密に集められている(中央値=1.0000、中央絶対偏差(MAD)=0.0042、平均値=0.9996、標準偏差(SD)=0.0046)。
図26に示されるヒストグラムに示されるように、1.012を超える正倍数体の上昇中央値はない。対照的に、
図26に示される35個のトリソミーサンプルの中から(
斜線付きの棒)、1つを除いて全てが、正倍数体の範囲のかなり上の1.02を超える上昇中央値を有する。この例の2群の患者間のギャップは、正倍数体または異数体としての分類を可能にするのに十分大きいものである。
【0462】
分類精度における限定因子としての胎児画分
いくつかの実施形態において、胎児画分と、正倍数体(例えば、正倍数体の妊娠)における正規化されたカウントの中央値の分布の幅との間の比を使用し、正規化された上昇の中央値を使用して、分類の信頼性を決定することができる。正規化されたカウントの中央値ならびにZ値などの他の記述子は、比例定数0.5の胎児画分とともに線形に増加するため、胎児画分は、分類において95%の信頼度を得るため、正規化されたカウントの中央値の分布の4標準偏差または分類において99%の信頼度を得るため、6標準偏差を超える必要がある。特定の実施形態において、整列した配列タグの数を増加させることは、プロファイル測定値の誤差を減少させ、正規化された上昇の中央値の分布を急峻にするよう作用し得る。したがって、ますます正確な測定を行うことは、胎児画分と、正倍数体の正規化された上昇の中央値の分布の幅との間の比を改善することである。
【0463】
面積比
正規化されたカウントの分布の中央値は、一般に、点推定値であり、それ自体は、多くの場合、積分推定値に比べ、あまり信頼性のない推定値、例えば、分布下面積(例えば、曲線下面積)である。高値の胎児画分を含有するサンプルは、点推定値を使用することにより影響される程ではないが、低値の胎児画分にて、不規則誤差によるわずかに増加した中央値カウントを有する正倍数体サンプルからの実際に上昇した正規化されたプロファイルを区別することが困難になる。胎児画分が相対的に低い(例えば、F=約7%、F(7%))トリソミー例からの正規化されたカウントの分布の中央値を図示するヒストグラムを、
図27に示す。分布の中央値は、1+F/2=1.035から遠くない1.021である。しかし、分布の幅(MAD=0.054、SD=0.082)は、正倍数体値の1からの中央値の偏差をかなり超え、サンプルが異常であるという任意の主張は除外される。分布の視覚的に判断し、代替えの分析を提案する:ピークの右へのシフトは相対的に小さいが、1の正倍数体期待値から左への面積(
右肩下がりの斜線付き)と右への面積(
右肩上がりの斜線付き)との間の均衡をかなり摂動させる。したがって、2つの面積間の比は、積分推定値であり、分類が胎児画分の低値により困難である例において有利となり得る。曲線下の
右肩上がりの斜線付きおよび
右肩下がりの斜線付きの面積における積分推定値の計算を、以下にさらに詳細に説明する。
【0464】
正規化されたカウントのガウス分布を仮定する場合、この時、
【0465】
【化19】
[この文献は図面を表示できません]
正倍数体の例において、正規化されたカウントにおける期待値は1である。トリソミー患者において、期待値は、
【0466】
【化20】
[この文献は図面を表示できません]
である。
【0467】
面積比を算出するための参照点が1であるため、指数関数に対する引数はz
2であり、
【0468】
【化21】
[この文献は図面を表示できません]
である。
【0469】
参照点の左の面積は、
【0470】
【化22】
[この文献は図面を表示できません]
である。
【0471】
誤差関数erf(z)を、そのテイラー展開を使用して評価することができる:
【0472】
【化23】
[この文献は図面を表示できません]
。
【0473】
参照点から右の面積は1−Bである。それゆえ、2つの面積間の比は、
【0474】
【化24】
[この文献は図面を表示できません]
である。
【0475】
測定された胎児画分から面積比Rへの誤差伝播を、単に、式7のFを、F−ΔFおよびF+ΔFで置き換えることにより推定することができる。
図28は、480サンプルのセットの正倍数体およびトリソミーの面積比の頻度を示す。2グループ間のオーバーラップは、胎児画分の低いトリソミーサンプルを含む。
【0476】
分類基準の組み合わせ
図29は、実質的には類似の現象と説明される、上昇中央値および面積比の相互関係および相互依存の両方を図示する。類似の関係として、上昇中央値および面積比を、他の分類基準、例えば、Zスコア、フィットさせた胎児画分、種々の残差二乗和およびベイジアンp値と関連付ける(
図30を参照のこと)。個々の分類基準は、ギャップ領域の正倍数体分布とトリソミー分布との間の部分的オーバーラップから生じる曖昧さに苦しみ得るが、複数の基準の組み合わせにより、いずれかの曖昧さを減少させ、または排除することができる。いくつかの実施形態において、複数の次元に沿った信号の広がりは、オーバーラップするピークを、十分に定義された容易に同定可能なエンティティに分解する、異なるの核のNMR周波数を測定するのと同じ効果を有し得る。相互相関記述子を使用して、任意の理論的パラメータを定量的に予測する試みはなされていないため、異なる分類基準間に観察される相互相関は干渉されない。正倍数体が集合するのみの多次元空間の領域を定義することにより、その領域の特定の表面以外に配置される任意のサンプルの分類を可能にする。したがって、分類スキームを、正倍数体のコンセンサスな票に減少させる。
【0477】
分類基準法の組み合わせを利用するいくつかの実施形態において、本明細書に記載の分類基準を、当技術分野において公知の追加の分類基準と組み合わせることができる。特定の実施形態は、本明細書に挙げる分類基準のサブセットを使用することができる。特定の実施形態は、1つまたはそれより多い分類基準をその中からおよび/または胎児画分と数学的に組み合わせ(例えば、加算、減算、除算、乗算など)、新たな分類基準を得ることができる。いくつかの実施形態は、多次元分類空間の次元性を少なくする主成分分析を適応することができる。いくつかの実施形態は、1つまたはそれより多い分類を使用し、罹患と非罹患患者との間のギャップを定義し、かつ新たなデータセットを分類することができる。分類基準の任意の組み合わせを使用し、罹患と非罹患患者との間のギャップを定義し、新たなデータセットを分類することができる。他の分類基準と組み合わせて使用し、罹患と非罹患患者との間のギャップを定義し、新たなデータセットを分類することができる分類基準の非限定的な例として、以下がある:線形判別分析、二次判別分析、可変判別分析、混合判別分析、k近傍法、分類木、バギング、ブースティング、ニューラルネットワーク、サポートベクターマシン、および/またはランダムフォレスト。
【0478】
実施例2:測定された胎児画分およびビン重み付けされた残差二乗和を使用した、胎児異数性に関連する遺伝的変異の検出方法
Z値統計および他の配列リードデータの統計分析は、多くの場合、胎児異数性に対する遺伝的変異の有無を決定する成果の決定または提供に適切であるが、いくつかの例において、胎児画分の寄与および倍数性の仮定に基づく追加の分析を含むことが有用であり得る。分類スキームに胎児画分の寄与を含むときに、既知の正倍数体(正倍数体の妊娠)のセットからの参照中央カウントプロファイルを、一般に比較のために利用する。参照中央カウントプロファイルを、ゲノム全体をNビンに分割することにより作製することができ、この場合、Nはビンの数である。各ビンiは、割り当てられた2つの数字:(i)参照カウントF
iおよび(ii)ビン参照カウントの不確定要素(例えば、標準偏差、つまりσ)である。
【0479】
以下の関係を利用し、胎児画分、母体の倍数性、および参照カウントの中央値を、胎児異数体に対する遺伝的変異の有無を決定する分類スキームに組み込むことができる。
【0480】
【化25】
[この文献は図面を表示できません]
式中、Y
iは、カウントプロファイルの中央値のビンに対応する試験サンプルのビンにおいて測定されたカウントを表し、Fは胎児画分を表し、Xは胎児倍数性を表し、M
iは各ビンに割り当てられた母体倍数性を表す。式(8)のXにおいて使用される可能な値は、胎児が正倍数体である場合1であり、胎児が3倍体である場合3/2であり、双胎の胎児であり、1例が罹患し、もう1例が罹患していない場合5/4である。5/4は、1例の胎児が罹患し、もう1例が罹患していない双胎の場合に使用され、それは、式(8)の項Fが総胎児DNAを表すため、全ての胎児DNAを考慮する必要があるためである。いくつかの実施形態において、母体ゲノムの大きな欠失および/または重複を、母体倍数性M
iを、各ビンまたはゲノム片に割り当てることにより、考慮することができる。いくつかの実施形態において、母体倍数性は、多くの場合、1/2の倍数として割り当てられ、ビンワイズ正規化を使用して推定することができる。母体倍数性は、多くの場合、1/2の倍数であるため、母体倍数性を容易に考慮することができ、それゆえ、微分を簡易化するさらなる式に含まれない。
【0481】
胎児倍数性を、任意の適切な方法を使用して評価することができる。いくつかの実施形態において、胎児倍数性を、式(8)またはその微分を使用して評価することができる。特定の実施形態において、胎児倍数性を、以下の式(8)を基にした非限定的方法の1つを使用して分類することができる:
1)胎児画分Fを測定し、2つの残差二乗和を形成する値を使用する。残差二乗和を算出するために、式(8)の右側(RHS)を左側(LHS)から減算し、その差を平方し、選択されたゲノムビンに対して合計し、またはこれらの実施形態において、全てのビン、つまり全てのビンに対する和を使用する。このプロセスを、2つの残差二乗和のそれぞれを算出するために行う。残差二乗和の1つを、胎児倍数性のセットを用いて1(例えば、X=1)に評価し、もう一方の残差二乗和を、胎児倍数性のセットを用いて3/2(例えば、X=3/2)に評価する。胎児試験被験体が正倍数性である場合、2つの残差二乗和の間の差は、負になり、さもなければ、差は正になる。
【0482】
2)測定値にて胎児画分を固定し、倍数性値を最適化する。胎児倍数性は、一般に、2つの個別の値、1または3/2の1つのみとなり得るが、倍数性は、連続関数として処理され得ることもある。線形回帰を使用し、倍数性の推定値を作製することができる。線形回帰分析から得られる推定値が1に近い場合、胎児の試験サンプルを、正倍数体として分類することができる。推定値が3/2に近い場合、胎児は3倍体として分類することができる。
【0483】
3)胎児倍数性を固定し、線形回帰分析を使用して胎児画分を最適化する。胎児画分を測定し、拘束項は、測定された胎児画分の誤差推定値に相互に比例する重み付け関数を用いて、測定された胎児画分に近いフィットさせた胎児画分を維持するために含まれることができる。式(8)を2回、3/2にて正倍数性セットで1回および胎児倍数性セットを1にして1回解く。式(8)を、倍数性セットを1にして解くときに、胎児画分を当て嵌める必要はない。残差二乗和を、各結果に対して形成し、残差二乗和を減算する。その差が負である場合、胎児試験被験体は正倍数体である。その差が正である場合、胎児試験被験体は3倍体である。
【0484】
1)、2)および3)に記載の一般化された方法を、本明細書においてさらに詳細に説明する。
【0485】
倍数性の固定値、胎児画分の固定値:残差二乗和
いくつかの実施形態において、胎児異数性を、2つの変数、胎児倍数性(例えば、X)および胎児核酸画分(例えば、胎児画分;F)を分析するモデルを使用して決定することができる。特定の実施形態において、胎児倍数性を、個別の値とすることができ、いくつかの実施形態において、胎児画分は、値の連続体であってよい。胎児画分を測定することができ、測定された値を使用し、胎児倍数性として考えられる各値に対する式(8)の結果を作製する。式(8)の結果を作製するために使用され得る胎児倍数性の値は、単胎の胎児妊娠において1および3/2を含み、双胎の胎児妊娠の例において、1例の胎児が罹患し、もう1例の胎児が罹患していない場合、5/4を使用することができる。いくつかの実施形態において、各胎児倍数性値に対して得られた残差二乗和により、その方法が測定値を再生する成功率を測定する。X=1(例えば、正倍数体の仮定値)にて式(8)を評価するときに、胎児画分を取り消し、以下の式により残差二乗和を得る:
【0486】
【化26】
[この文献は図面を表示できません]
式(9)および次の計算を簡易化するために、以下の概念を利用する:
【0487】
【化27】
[この文献は図面を表示できません]
X=3/2(例えば、3倍体の仮定値)にて式(8)を評価するときに、以下の式により、残差二乗和を得る:
【0488】
【化28】
[この文献は図面を表示できません]
式(9)と(13)との差は、代替えの仮説(例えば、トリソミーシングルトン、X=3/2)に対して帰無仮説(例えば、正倍数体、X=1)を試験するために使用することができる関数結果(例えば、ファイ)を形成する。
【0489】
【化29】
[この文献は図面を表示できません]
Fに対するファイのプロファイルは、縦座標の右に定義される放物線である(Fが0以上であるため)。ファイは、モデルパラメータの実験誤差および不確定要素に関わらず、Fがゼロに近づくときに起点に収束する。
【0490】
いくつかの実施形態において、ファイ関数は、負の二階二次係数の測定された胎児画分Fに依存する(式(14)を参照のこと)。測定された胎児画分のファイ従属度は、正倍数体および3倍数体の両方の例において凸形状を暗示するようである。この分析が正しい場合、トリソミーの例は、高いF値にて形を反転させるが、式(12)はFに依存する。式(8)および(14)を組み合わせ、母体倍数性を考慮せず、X=3/2を設定し、実験誤差を無視すると、トリソミーの例における式は以下になる:
【0491】
【化30】
[この文献は図面を表示できません]
3倍体における式(11)と(12)との関係は、任意の測定誤差がないときに理想の状況下で成り立つ。式(14)と(15)を組み合わせることにより、以下の式を得、これは多くの場合、3倍体の例の凹型放物線を生成する:
【0492】
【化31】
[この文献は図面を表示できません]
正倍数体において、式(11)および(12)は、測定誤差を除き、同じ値を有するものとし、これは凸型放物線を生成することもある:
【0493】
【化32】
[この文献は図面を表示できません]
トリソミー(
破線)および正倍数体(
実線、下部)の例において、典型的なモデルパラメータ値におけるファイ関数プロファイルのシミュレート値を、
図31に示す。
図32は、実際のデータを使用する例を示す。
図31および32において、横座標の下のデータ点は、一般に、正倍数体として分類される例を表す。横座標より上のデータ点は、一般にトリソミー21(T21)の例として分類される例を表す。
図32において、第4象限(例えば、中央下部の象限)の孤立のデータ点は、1例が罹患した胎児の双胎妊娠である。
図32を作製するために利用されたデータセットは、他の罹患した双胎サンプルを同様に含み、横座標へのT21のデータ点の広がりを説明する。
【0494】
式(9)および(10)は、多くの場合、以下のように解釈され得る:3倍体において、正倍数体モデルは、ファイ
E(式(9)を参照のこと)がファイ
T(式(13)を参照のこと)より大きいことを意味する、大きな誤差を作製することもある。結果として、ファイ関数(式(7)を参照のこと)は、第1象限(例えば、上部左の象限)を占める。正倍数体において、トリソミーモデルは、大きな誤差を作製することもあり、式(2)および(6)のランクはそのままであり、関数ファイ(式(7))は、第4象限を占める。したがって、おもに、正倍数体または3倍体としてのサンプルの分類は、ファイの記号の評価に帰着することもある。
【0495】
いくつかの実施形態において、
図31および32に示されるデータ点の曲率を、ファイ関数(式(7))を、その記号を乗算するファイ関数の絶対値の平方根に置き換えることにより減少させ、または排除することができる。Fに対して作製された線形関係は、
図33に示されるように、低値の胎児画分にて、3倍体と正倍数体との分離を改善することができることもある。Fに対する関係を直線化することは、低値の胎児画分(例えば、F)にて不確定要素間隔の増加を生じ、それゆえ、このプロセスから実現される増加は、差の視覚的判断を実質的に容易にさせること、つまり灰色領域が変化しないことに関連する。双胎妊娠に分析にこのプロセスを拡大させることは、相対的に簡単である。式(9)を作製するために使用される理由は、1例の罹患した胎児および1例の正常な胎児を有する双胎妊娠において、Fに関わらず、ファイ関数が、ゼロ、プラスまたはマイナス実験誤差に帰着するものであることを意味する。双胎妊娠は、一般に、単胎妊娠より多くの胎児DNAを生成する。
【0496】
倍数性の最適値、胎児画分の固定値:線形回帰
特定の実施形態において、胎児異数性を、胎児画分をその測定値で固定し、倍数性を、残差二乗和を最適化するよう多様化させるモデルを使用して決定することができる。いくつかの実施形態において、得られたフィットさせた胎児画分を使用し、双胎の例において値が1、3/2、または5/4に近いかどうかに応じて、トリソミーまたは正倍数体として症例を分類することができる。
【0497】
式(8)から開始すると、残差二乗和を以下のように形成することができる:
【0498】
【化33】
[この文献は図面を表示できません]
Xの関数としてファイを最小にするために、Xに対するファイの第1の導関数を作製し、ゼロに等しく設定し、得られた式をXに対して解く。得られた式を、式(19)に示す。
【0499】
【化34】
[この文献は図面を表示できません]
倍数性の最適値を、以下の式により得られることもある:
【0500】
【化35】
[この文献は図面を表示できません]
先に記載したように、母体倍数性に対する項、M
iを、さらなる数学的微分から省略することができる。Xに対して得られた式は、母親に評価される染色体または各染色体の欠失または重複がないときの、相対的に簡易な、および多くの場合、頻繁に生じる特定の症例に対応する。得られた式を、
図21に示す。
【0501】
【化36】
[この文献は図面を表示できません]
Xi
ffおよびXi
fyは、それぞれ、式(11)および(12)により得られる。全ての実験誤差が無視できる実施形態において、式(21)を解くことにより、Xi
ff=Xi
fyである場合、正倍数体において1の値を得る。全ての実験誤差が無視できる特定の実施形態において、式(21)を解くことにより、3倍体に対して3/2の値を得る(Xi
ffとXi
fyとの間の3倍体の関係における式(15)を参照のこと)。
【0502】
倍数性の最適値、胎児画分の固定値:誤差伝播
倍数性の最適値は、多くの場合、種々の誤差源により不正確である。誤差源の3つの、非限定的な例として、以下がある:参照ビンカウントf
i、ビンカウントの測定値y
iおよび胎児画分F。誤差の非限定的な例の寄与を、個別に試験する。
【0503】
測定された胎児画分の誤差:フィットさせた胎児画分の質
Y染色体にマッピングされた配列タグの数(例えば、Yカウント)に基づいた胎児画分の推定値は、FQA胎児画分値に対して相対的に大きな偏差を示すこともある(
図34を参照のこと)。3倍体におけるZ値も、多くの場合、
図35に示される斜線の周りに相対的な広がりを示す。
図35の斜線は、トリソミー21の例における胎児画分の増加を伴う、第21番染色体における染色体表現の理論的増加の期待値を表す。胎児画分を、適切な方法を使用して評価することができる。胎児画分を推定するために利用することができる方法の非限定的な例は、胎児数量アッセイ(例えば、FQA)である。胎児画分を推定する他の方法は、当技術分野において公知である。胎児画分を推定するために利用される種々の方法も、
図36〜39に示されるように中央斜線の周りに実質的に同様な広がりを示すこともある。
図36において、偏差は、フィットさせた胎児画分において観察されるものと実質的に類似する(例えば、高値のF
0において負)(式(33)を参照のこと)。いくつかの実施形態において、0%〜20%の範囲の平均の染色体Y(例えば、染色体Y)の胎児画分(
図36の
中間のヒストグラムの線を参照のこと)に対する線形の近似値の傾きは、約3/4である。特定の実施形態において、標準偏差に対する線形の近似値(
図36、
上部および下部のヒストグラムの線を参照のこと)は、約2/3+F
0/6である。いくつかの実施形態において、第21番染色体(例えば、第21番染色体)に基づく胎児画分の推定値は、胎児画分を当て嵌めることにより得られたものに実質的に類似する(
図37を参照のこと)。性別に基づく胎児画分の推定値の別の定量的に類似のセットを、
図38に示す。
図39は、T21の例における正規化されたビンカウントの中央値を図示し、これは、線形の近似値が1+F
0/2に実質的に類似する傾きを有すると期待される(
図39のグラフにおける起点から上部の中間点までの灰色の線を参照のこと)。
【0504】
図36〜39は、以下の共通の特徴を共有する:
a)1に等しくない傾き(Z値を除き、方法に応じて、1より大きいまたは1未満のいずれか)
b)大きな広がりの胎児画分の推定値および、
c)広がりの範囲が胎児画分とともに増加。
【0505】
いくつかの実施形態において、これらの観察を考慮するため、測定された胎児画分の誤差を、式ΔF=2/3+F
0/6を使用して、モデル化する。
【0506】
測定された胎児画分の誤差:測定された胎児画分からフィットさせた倍数性までの誤差伝播
分析を簡略化するため、f
iおよびy
iが誤差がないと仮定する場合、胎児画分Fの測定値は、F
v(例えば、真の胎児画分)およびΔF(例えば、測定された胎児画分の誤差)からなる:
【0507】
【化37】
[この文献は図面を表示できません]
いくつかの例において、フィットさせたXの値の不確定要素は、測定された胎児画分Fの誤差から生じる。Xに最適な値を、式(21)により得るが、実際の倍数性値をX
vより得、この場合、X
v=1または3/2である。X
vは個別に変化する一方、Xは連続的に変化し、好適な条件下において(例えば、相対的に誤差が少ない)、X
vの周りに蓄積するにすぎない。
【0508】
F
iおよびY
iが誤差のないことを再び仮定すると、式(8)は以下になる:
【0509】
【化38】
[この文献は図面を表示できません]
式(21)から(23)を組み合わせることにより、実際の倍数性X
vと、誤差ΔFを含む倍数性推定値Xとの間の以下の関係が作製される。関係はまた、母体倍数性が1に等しく(例えば、正倍数体)、母体倍数性における項、M
iを1に置き換えるという仮定を含む。
【0510】
【化39】
[この文献は図面を表示できません]
いくつかの例において、項X
v−1は、正倍数体において実質的にゼロと同一であり、ΔFは、Xの誤差に寄与しない。3倍体の例において、誤差の項は、ゼロに帰着しない(例えば、実質的にゼロと同一ではない)。したがって、いくつかの実施形態において、倍数性の推定値を、誤差ΔFの関数として見なすことができる。
【0511】
【化40】
[この文献は図面を表示できません]
誤差の固定値ΔF=プラスまたはマイナス0.2%のF
0の関数として、フィットさせた3倍体Xのプロファイルのシミュレート値を、
図40に示す。実際のデータを使用して得られる結果を、
図41に示す。データ点は一般に、式(24)により予測される非対称のトランペット型曲線に一致する。
【0512】
小さい胎児画分は、多くの場合、大きな倍数性に誤差と定量的に関連する。過小評価された胎児画分は、倍数性の過大評価により相殺されることもあり、過大評価された胎児画分は、多くの場合、倍数性において過小評価につながる。効果は、多くの場合、胎児画分が過小評価されるときに大きくなる。これは、
図40および41に示されるグラフにおいて非対称に見られることに一致する(例えば、Fが低下するにつれて、上部の分岐の増加は、下部の分岐の低下より実質的に速くなる)。Fの誤差の異なるレベルのシミュレーションは、Xvからの偏差の範囲がΔFとともに増加する同じパターンを追随する。
【0513】
Xにおける確率分布を使用し、これらの観察値を定量することができる。いくつかの実施形態において、ΔFの分布を使用し、以下の式を使用してXにおける密度関数を得ることができる:
【0514】
【化41】
[この文献は図面を表示できません]
式26において、xはΔFであり、yはXであり(例えば、倍数体の推定値)、g(x)は式(24)により得られる。導関数を、以下の式に従い評価する:
【0515】
【化42】
[この文献は図面を表示できません]
いくつかの実施形態において、逆関数g
−1(y)を、式(24)から得ることができる。
【0516】
【化43】
[この文献は図面を表示できません]
Fの誤差がガウシアン分布に一致する場合、式(26)のf
x(x)を以下の式と置き換えることができる:
【0517】
【化44】
[この文献は図面を表示できません]
特定の実施形態において、式(26)から(29)を組み合わせることにより、
図42に示されるように、異なるレベルのΔFにてXに対する確率分布を生じる。
【0518】
いくつかの例において、Fの誤差が高値のときに顕著となることもある、より高い倍数性値に向かうバイアスは、多くの場合、
図42のパネルA〜Cに示されるように、密度関数の非対称形状:相対的に長く、
右側の垂直線の右にゆっくり低下する尾部、Xの線に垂直であり、X軸に沿っている形状に反映される。いくつかの実施形態において、ΔFの任意の値に対して、
右側の垂直線(X
v=3/2)の左の、確率密度関数の下の面積は、
右側の垂直線の右の面積に等しい。すなわち、全てのフィットさせた倍数性の半分が、多くの場合、過大推定値であるが、全てのフィットさせた倍数性のもう半分は、過小推定値であることもある。いくつかの例において、バイアスは、一般に、一方の、または他方の方向の広がりではなく、Xの誤差の範囲を考慮するにすぎない。いくつかの実施形態において、分布の中央値は、X
vに等しい。
図43は、実際のデータにおいて得られた正倍数体およびトリソミーの分布を図示している。測定された胎児画分における不確定要素は、3倍体についてフィットさせた倍数性の値に見られる分散の一部を説明することもあるが、正倍数体におけるXの推定値の誤差は、多くの場合、ビンカウントからの誤差伝播を試験することを必要とする。
【0519】
倍数性の固定値、胎児画分の最適値:線形回帰
多くの場合、限定された数の既知の個別の値をとることができるフィットさせた倍数性とは反対に、倍数性をその考えられる値(例えば、正倍数体では1、シングルトン3倍体では3/2、双胎3倍体では5/4)の1つに固定させて、連続して変化する胎児画分を、多くの場合、最適化することができる。測定された胎児画分(F
0)が既知である実施形態において、胎児画分の最適化を、フィットさせたFが、実験誤差(例えば、ΔF)内で、F
0に近いままであるように制限することができる。いくつかの例において、胎児画分の観察値(例えば、測定値)F
0は、式(22)〜(28)に記載の、胎児画分F
vと異なることもある。強固な誤差伝播分析は、F
0とF
vとの間で区別することを可能とするはずである。以下の微分を簡易化するために、胎児画分の観察値と真の胎児画分との間の差は、無視される。
【0520】
式(8)を、以下の、母体倍数性の項(例えば、M
i)も省略する再調整したフォーマットにおいて示す。
【0521】
【化45】
[この文献は図面を表示できません]
いくつかの実施形態において、最小化される必要のある関数項を、以下に定義する:
【0522】
【化46】
[この文献は図面を表示できません]
式(31)が正倍数体(例えば、X=1)において評価されるときに、項
【0523】
【化47】
[この文献は図面を表示できません]
は、多くの場合、Fに依存し、したがって、フィットさせたFは、多くの場合、F
0に等しい。いくつかの例において、式(24)を、正倍数体において評価するときに、式は、
【0524】
【化48】
[この文献は図面を表示できません]
に帰着することもある。
【0525】
式(24)を、シングルトンのトリソミーの例(例えば、X=3/2)において、評価するときに、Fを乗算する係数が測定された胎児画分とビンカウントの両方を含有し、それゆえ、Fにおける最適値は、多くの場合、両方のパラメータに依存する。いくつかの例において、Fに対する式(24)の第1の導関数は、ゼロに帰着する。
【0526】
【化49】
[この文献は図面を表示できません]
いくつかの実施形態において、X=3/2を置き換え、Fにおいて、式(32)を解くことにより、Fの最適値を生成する。
【0527】
【化50】
[この文献は図面を表示できません]
さらに計算および/または微分を簡易化するため、以下の補助変数を利用する:
【0528】
【化51】
[この文献は図面を表示できません]
補助変数を利用したとき、式(33)におけるX=3/2の胎児画分の最適値はこの時、以下に帰着する:
【0529】
【化52】
[この文献は図面を表示できません]
フィットさせたFは、多くの場合、測定値F
0に直線的に比例するが、必ずしも、F
0に等しいと限らないこともある。いくつかの実施形態において、測定された胎児画分の誤差と、ビンカウントの不確定要素との比により、個々のビンに対する測定値F
0に与えられた相対的重み付けを決定する。いくつかの例において、誤差ΔFが大きいほど、ビンカウントがフィットさせたFに及ぼす影響は強くなる。代替えとして、小さいΔFは、一般に、フィットさせたFが、F
0で占められることを意味する。いくつかの実施形態において、データセットが、トリソミーサンプルからのものであり、全ての誤差を無視できる場合、式(40)は、FとF
0との間の同一性に帰着する。数学的証明により、X=3/2に設定された胎児倍数性を使用し、F
0(観察値)およびF
v(実際)が同じ値と仮定すると、式(30)は、以下になる:
【0530】
【化53】
[この文献は図面を表示できません]
F
0およびF
vといった仮定値は、一般に、本明細書において示された定量的分析のための許容し得る仮定値である。式(39)および(41)を組み合わせることにより、以下を生成する
【0531】
【化54】
[この文献は図面を表示できません]
式(40)および(42)を組み合わせることにより、F
0とF
vの間の同一性を生じる:
【0532】
【化55】
[この文献は図面を表示できません]
理論的モデルをさらに図示するために、実際の倍数性が1(例えば、正倍数体)であるが、式(40)における正倍数性値の使用をX=3/2(例えば、3倍体シングルトン)に設定する場合、得られたフィットさせたFは、F
0に等しくもなく、ゼロに帰着せず、以下の式が一般に当てはまる:
【0533】
【化56】
[この文献は図面を表示できません]
したがって、特定の実施形態において、正倍数体の例を試験するときの3倍体の式の適用は、一般に、参照ビンカウントおよび関連の不確定要素(式(38)を参照)に応じて、0〜1(両端を含まない)の比例係数でF
0に比例する非ゼロフィットさせたFを生じる。類似の分析を、参照として86個の既知の正倍数体からの実際のデータを使用して、
図44に示す。
図44に示されるように、式(44)からの直線の傾きは、20度に近い。
【0534】
正倍数体とT21の例の孤立のデータ点(例えば、測定された胎児画分がおよそ40%、フィットさせた画分がおよそ20%)は、T21双胎を表す。定数ΔFを仮定するときに、
図44に示されるグラフの正倍数体の分岐は、一般に傾斜するが、ΔF=2/3+F
0/6を使用するときに、グラフの正倍数体の分岐が、多くの場合、「倍数体の固定値、胎児画分の最適値、誤差伝播:フィットさせた胎児画分」と題した節において本明細書において説明されるように、実質的に水平となる。
【0535】
倍数体の固定値、胎児画分の最適値:残差二乗和
正倍数体の例におけるいくつかの例において、式(32)のフィットさせたFがF
0に等しく、X=1であった場合、正倍数体モデルの残差二乗和は、式(31)から追随する:
【0536】
【化57】
[この文献は図面を表示できません]
これは、式(9)と実質的に同じ結果である。正倍数体の例における特定の例において、式(40)を、式(31)に組み合わせることができる。いくつかの実施例において、得られた数式は、二次的にF
0に依存する。特定の実施形態において、遺伝的変異の分類を、3倍体の残差二乗和を正倍数体の残差二乗和から減算することにより行う。3倍体の残差二乗和を正倍数体の残差二乗和から減算することにより得られる分類の結果も、多くの場合、以下のF
0に依存する:
【0537】
【化58】
[この文献は図面を表示できません]
項S
fyは、一般に、式(14)においても見られるように、胎児画分に依存する。いくつかの実施形態において、
【0538】
【化59】
[この文献は図面を表示できません]
の測定された胎児画分における従属度を、胎児画分を考慮することにより分析することができる。胎児画分は、多くの場合、測定された胎児画分F
0が真の胎児画分F
vに等しいと仮定することにより考慮することができる。いくつかの実施形態において、サンプルの核型が正倍数体である場合、S
fyおよびS
ffは、同じ値を有する(例えば、実験誤差を除く)。結果として、2つの残差二乗和間の差は、多くの場合、以下に帰着する:
【0539】
【化60】
[この文献は図面を表示できません]
特定の実施形態において、サンプルの核型が3倍体である場合、式(41)および(42)を、式(46)と組み合わせることができ、以下を生成する:
【0540】
【化61】
[この文献は図面を表示できません]
したがって、いくつかの実施形態において、
【0541】
【化62】
[この文献は図面を表示できません]
の差が、正である場合、胎児は3倍体であり、特定の実施形態において、差が負である場合、胎児は罹患していない。正または負の結果のグラフ表示は、多くの場合、放物線状、3倍体では凹型および正倍数体では凸型である。両方の分岐は、F
0が低下するにつれて、ゼロに向かう傾向があり、実験誤差はグラフの形状にほとんど影響しない。多くの例において、分岐は、実質的に線形または自由項でもないが、第2の次数係数は、サイズが異なることに加え、異なる記号を有する。ΔFがおよそ2%では、86個の正倍数体のセットから抽出された参照カウントおよび不確定要素を使用して、項S
ffの値が3.7に近づく(
図45を参照のこと)。
【0542】
図45に示される例において、2つの分岐は、多くの場合、式(47)および(48)の測定された胎児画分の平方を乗算する異なる係数により非対称である。3倍体の(例えば、正の)分岐は、相対的に急速に増加し、実質的に正倍数体の分岐より早くゼロと区別可能になる。実際のデータセットを使用して得られた
図46は、
図45に示される定量的結果を確かにする。
図46において、第4象限の孤立の濃灰色の点(例えば、下部中央の象限)は、罹患した双胎である。
図46を作製するために使用されるデータセットにおいて、グラフの正倍数体およびT21の分岐はともに、曲率を示し、それは、ともに式(31)のトリソミーのバージョンからのF
0の二次従属度を示すためである。
【0543】
いくつかの実施形態において、グラフの両方の分岐を直線化し、視覚的判断を容易にすることができる。直線化の値は、多くの場合、誤差伝播分析に馴化させる。
図45および46に示される結果は、測定された胎児画分の誤差が胎児画分の全範囲で均一であるという仮定に基づいた。しかし、仮定は、必ずしも、その例ではない。いくつかの例において、誤差ΔFと測定された胎児画分F
0(ΔF=2/3+F
0/6)との線形関係に基づき、より現実的な仮定が、
図47に示される結果を生成する。
図47において、正倍数体の分岐は、実質的に平坦、つまりほぼ定数(例えば、放物線状の特徴が実質的に存在しない)であるが、トリソミーの分岐は放物線状のままである。トリソミーの分岐の濃灰色の点で散在する薄灰色の3点は、双胎からのデータを表す。双胎のデータは、誤差モデル固定値に対して上昇することもある。
【0544】
サンプルが遺伝的変異により罹患しているかどうかの分類を、多くの場合、以下の3つプロセスの1つを使用して行う:(1)残差二乗和の放物線状の差に基づく分類(
図45および46を参照のこと)、(2)残差二乗和の直線的な差に基づく分類(
図47および48を参照のこと)、および(3)フィットさせた胎児画分に基づく分類(式(33)を参照のこと)。いくつかの実施形態において、選択された方法は、誤差伝播を考慮する。
【0545】
倍数体の固定値、胎児画分の最適値:システムエラー−参照オフセット
理想的には、ビンカウント参照値および測定値は、ゼロのシステムエラー(例えば、オフセット)を含有するものとするが、実際には、ビンカウントの参照値および測定値は、互いに対してシフトすることもある。いくつかの例において、互いに対するシフトの影響を、シフトΔが目的の染色体全体の定数であると仮定して、式(33)を使用して分析することができる。いくつかの実施形態において、正倍数体の例において、不規則誤差を無視する場合、以下の関係が成り立つ:
【0546】
【化63】
[この文献は図面を表示できません]
f
i0は、実際のビンカウント参照値iを表し、f
iは、任意のシステムエラーΔを含む、使用されたビンカウント参照値を表す。特定の実施形態において、式(49)および(50)を式(33)に置き換えることにより、フィットさせた胎児画分のグラフの正倍数体の分岐における以下の式を作製する:
【0547】
【化64】
[この文献は図面を表示できません]
いくつかの実施形態において、係数S
00、S
f0およびS
f0fを、f
iをf
i0に置き換えることにより、式(33)〜(39)から作製する。特定の実施形態において、正倍数体のフィットさせたF
Eと、測定値F
0との線形関数の関係の逆の傾きが、1+S
f0f+2S
f0+S
00Δ
2に等しく、これは、多くの場合、相対的に簡易な二次方程式を解くことによりシステムエラーΔの推定を可能にする。3倍体において、F
0がF
vと等しいと仮定すると、ビンカウントの測定値は、以下になることもある:
【0548】
【化65】
[この文献は図面を表示できません]
式(52)、(49)および(33)を組み合わせることにより、フィットさせた胎児画分のグラフの3倍体の分岐の以下の式を作製する:
【0549】
【化66】
[この文献は図面を表示できません]
いくつかの実施形態において、式(51)および(53)は、フィットさせた3倍体および正倍数体の胎児画分が、
図48に示すように挙動することを予測する。
図48において、黒色の線(例えば、3本の線の各セットの上部の線)は、負のオフセットΔに対応し、濃灰色の線(例えば、3本の線の各セットの下部の線)は、正のオフセットΔに対応し、薄灰色の線(例えば、3本の線の各セットの中央の線)は、オフセットが存在しない状態に対応する。
図49は、実際のデータに人工的に重ねたシステムエラーのシミュレート値Δの影響を図示する。
【0550】
図50は、正倍数体および3倍体のデータセットにおけるシステムエラーのオフセットにおける、フィットさせた胎児画分の従属度を図示する。正倍数体および3倍体の両方の例において、式(51)および(53)の理論的な式は、多くの場合、測定された胎児画分上の、およびシステムエラーオフセット上のフィットさせた胎児画分の定量的従属度を捉える。
図49および50のグラフに使用される係数は、任意の潜在的システムバイアスを除去することなく、未処理の参照ビンカウントから得た。
【0551】
倍数体の固定値、胎児画分の最適値、誤差伝播:フィットさせた胎児画分
フィットさせた胎児画分における誤差の寄与は、多くの場合、2種類の誤差:1)測定された胎児画分からの誤差、および2)ビンカウント測定値および参照値からの誤差の1つにある。2種類の誤差を、異なる方法を使用して、個々に分析し、後に組み合わせて最終誤差範囲を作製する。測定された胎児画分からの伝播した誤差を、式(40)のF
0をまずF
0−2ΔF(例えば、下部の誤差境界において)と、次いでF
0+2ΔF(例えば、上部の誤差境界において)と置き換えることにより評価することができる。特定の実施形態において、この相対的に簡易な方法は、95%の信頼区間にて定量的挙動を補正する。異なる所望の信頼水準において、より一般的な境界の組、F
0−nΔFおよびF
0+nΔFを利用することができる。上部および下部の誤差境界を作製するために使用される項は、ビンカウントの測定値および参照値の誤差からの寄与が、多くの場合、無視されるため、誤差全体を過小評価することもある。
【0552】
いくつかの実施形態において、フィットさせた胎児画分の誤差の、ビンカウント測定値および参照値からの寄与をさらに評価するために、式(38)〜(40)を利用することができる。特定の実施形態において、式(33)を、第1の次数、平方および平均に切り捨てられるf
iおよびy
iに対して、フィットさせた胎児画分においてテイラー級数に展開することができる。いくつかの例において、y
iの不確定要素が、多くの場合、f
iの不確定要素と同じであることを仮定することができる。分析を容易にするために、交差項および高次項を、平均化する上でゼロに帰着すると仮定する。テイラー展開係数は、多くの場合、連鎖法則を利用して得られる。次いで、フィットさせた胎児画分の二乗平均の分散を、以下に示す式(54)により得る。いくつかの実施形態において、式により表されるモデルは、ΔFの推定値からの寄与を無視する。部分的な導関数を、以下の式(54)に示される式を使用して評価することができる。
【0553】
【化67】
[この文献は図面を表示できません]
式(54)〜(59)を組み合わせることにより以下の式を作製する:
【0554】
【化68】
[この文献は図面を表示できません]
いくつかの実施形態において、式(60)を95%信頼区間にて評価するために、以下の上部および下部の境界を使用することができる:
【0555】
【化69】
[この文献は図面を表示できません]
実質的に全ての考えられる誤差源(例えば、F
0、f
i、y
i)がテイラー展開級数に含まれる実施形態において、同じ式が、多くの場合、得られる。いくつかの例において、F
0におけるFの従属度を、S
fyより考慮することができる。いくつかの実施形態において、F
0に対応する冪級数項は、多くの場合、以下となる;
【0556】
【化70】
[この文献は図面を表示できません]
は、3倍体において、1に等しい。したがって、ΔFが多くの場合、F
0とともに増加し、高値のF
0にて大きくなるけれども、相対的に簡易なΔFをF
0に減算および加算することが、正当である。いくつかの実施形態において、成果は、FおよびS
fyがともにF
0に直線的に依存することによる。試験被験体から得られたデータから得られるフィットさせた胎児画分とともに、式(61)に基づくシミュレーションを
図51に示す。
図51に示されたシミュレーションにおいて、本明細書において記載のようにΔF=2/3+F
0/6である。
【0557】
実施例3:ゲノム位置の関数としてのスライディングウィンドウ分析および累積和
正規化されたカウントプロファイルの認識可能な特徴(例えば、遺伝的変異の領域、コピー数多型の領域)の同定は、相対的に時間がかかり、かつ/または相対的に費用がかかるプロセスであることもある。認識可能な特徴を同定するプロセスは、多くの場合、ノイズデータおよび/または胎児核酸の寄与が低いことを含有するデータセットにより複雑化する。真性の遺伝的変異またはコピー数多型を表す認識可能な特徴の同定は、大きく、特徴のないゲノム領域の検索を回避するのに役に立ち得る。認識可能な特徴の同定を、検索および得られたデータセットから、残りのゲノム片から、非常に可変的なゲノム片を除去することにより、つまり所定の複数のプロファイル分散毎に、平均プロファイル上昇から逸脱するデータ点を除去することにより獲得することができる。
【0558】
いくつかの実施形態において、所定の複数のプロファイル分散毎に、プロファイル上昇の平均値から逸脱するデータ点を得ることを使用し、50,000超または100,000超のゲノム片から、実際のシグナルまたは孤立のノイズスパイクを表す約100〜約1000の候補ゲノム片(例えば、約100ゲノム片、約200ゲノム片、約300ゲノム片、約400ゲノム片、約500ゲノム片、約600ゲノム片、約700ゲノム片、約800ゲノム片、約900ゲノム片、または約1000ゲノム片)の範囲まで候補ゲノム片の数を少なくすることができる。候補ゲノム片の数を少なくすることは、相対的に急速に、容易に獲得することができ、多くの場合、2桁以上の大きさによる遺伝的異常の検索および/同定を迅速化する。遺伝的変異の候補領域の有無を検索するゲノム片の数が少ないことは、多くの場合、データセットの複雑性および/または次元性を減少させる。
【0559】
いくつかの実施形態において、所定の複数のプロファイル分散毎に、プロファイル上昇の平均値から逸脱するデータ点を含有するデータセットを少なくした後に、少なくなったデータセットをフィルタリングし、孤立のノイズスパイクを排除する。少なくなったデータセットをフィルタリングし、孤立のノイズスパイクを除去することにより、多くの場合、フィルタリングされた、少なくなったデータセットを作製する。いくつかの実施形態において、フィルタリングされた、少なくなったデータセットは、連続のデータ点のクラスターを保持し、特定の実施形態において、フィルタリングされた、少なくなったデータセットは、ギャップの所定の数および/またはサイズについての許容差を有するかなり連続するデータ点のクラスターを保持する。いくつかの実施形態において、実質的に同じ方向の平均のプロファイル上昇から逸脱するフィルタリングされた、少なくなったデータセットからのデータポイントを、合わせてグループ化する。
【0560】
バックグランドノイズが、多くの場合、核酸サンプルに存在することにより(例えば、サンプルの総核酸と比較した目的の領域の比)、バックグランドノイズから遺伝的変異または遺伝的異常の領域を区別することは、多くの場合、困難を要する。信号対ノイズ比を改善する方法は、多くの場合、真性の遺伝的変異および/または遺伝的異常の領域を表す候補領域の同定を容易にするのに有用である。ゲノムバックグランドノイズに対する真性の遺伝的変異の領域の信号対ノイズ比を改善する任意の方法を使用することができる。ゲノムバックグランドノイズに対する真性の遺伝的変異の領域の信号対ノイズ比を改善するときに使用されるのに適切な方法の非限定的な例は、疑わしい異常およびそ中間体周囲物に対する積分の使用である。いくつかの実施形態において、疑わしい異常およびその中間体周囲物に対する積分の使用は有益であり、それは、合計することにより不規則なノイズが削除されるためである。いくつかの実施形態において、ノイズを少なくし、または排除している場合、さらに相対的に少量の信号が、候補ピークおよびその周囲物の累積和を使用して、容易に検出可能となり得る。累積和は、ピークから(例えば、片側またはもう一方に)外れた任意に選択された起点に対して定義されることもある。累積和は、多くの場合、選択された遺伝片または各片に対する正規化されたカウントプロファイルの積分の推定値である。
【0561】
異常が存在しない場合、ゲノム位置の関数としての累積和は、多くの場合、単位傾き(例えば、1に等しい傾き)を有する直線として挙動する。欠失または重複が存在する場合、累積和プロファイルは、多くの場合、2本以上の線分からなる。いくつかの実施形態において、異常から外れた領域は、単位傾きを有する線分にマッピングする。特定の実施形態において、異常の範囲内の領域において、線分を、傾きが異常の範囲内のカウントプロファイル上昇または下降に等しい他の線分と結合する。
【0562】
母体異常を有するこれらのサンプルにおいて、傾き(例えば、カウントプロファイル上昇に等しい)を、相対的に容易に決定する:ホモ接合の母体欠失では0、ヘテロ接合の母体欠失では0.5、ヘテロ接合重複では1.5、ホモ接合重複では2.0。胎児異常を有するこれらのサンプルにおいて、実際の傾きは、異常の種類(例えば、ホモ接合欠失、ヘテロ接合欠失、ホモ接合重複またはヘテロ接合重複)および胎児画分の両方に依存する。いくつかの実施形態において、胎児による母体異常の受け継ぎは、遺伝的変異において胎児サンプルを評価するときに考慮される。
【0563】
いくつかの実施形態において、単位傾きを有する線分は、異常の左および右の正常なゲノム領域に対応しており、互いに対して垂直にシフトする。これらの切片間の差(例えば、減算の結果)は、異常の幅(罹患ゲノム片の数)と異常のレベル(例えば、ホモ接合の母体欠失では−1、ヘテロ接合の母体欠失では−0.5、ヘテロ接合重複では+0.5、ホモ接合重複では+1など)との積に等しい。ゲノム位置の関数として累積和を使用して処理したデータセットの例において、
図52〜61Fを参照のこと(例えば、スライディングウィンドウ分析)。
【0564】
実施例4:誤差除去のパラメータ化および不偏正規化(PERUN)
カウント測定値の分散性
理想的に、染色体上昇の測定値は、
図62において見られるように、正倍数体において1の上昇の直線の水平線である。トリソミー妊娠において、染色体上昇の測定値の所望の挙動は、
図63で15%に等しい胎児画分においてシミュレートしたように、胎児画分に比例した1からの偏差を用いた階段関数である。母体欠失/重複は除外されるが、これは1/2の倍数の大きさに基づく胎児異常から容易に認識され、区別される。
【0565】
実際に測定したものは、理想的ではなかった。
図64は、1093例の正倍数体妊娠から採取した第20番染色体、第21番染色体および第22番染色体における重ね合わせた未処理カウントを示し、
図65は、134例のトリソミー21妊娠から採取された第20番染色体、第21番染色体および第22番染色体における重ね合わせた未処理カウントを示す。2つのプロフィイルのセットの視覚的判断では、トリソミーの例の第21番染色体のトレースが上昇したことを確認できなかった。確率的ノイズおよび体系的バイアスの両方が第21番染色体の上昇の可視化を難しくさせた。さらに、第21番染色体のさらに右の線分は、トリソミープロファイルよりむしろ、正倍数体の第21番染色体のトレースが上昇したことを誤って示唆した。体系的バイアスの大部分は、具体的なゲノム領域に関連したGC含量に由来した。
【0566】
GC含量に起因する、体系的バイアスを除去する試みは、乗法LOESS GC平滑化、リピートマスキング(RM)、LOESSおよびRMの組み合わせ(GCRM)およびcQNなどの他のものを含んだ。
図66は、1093個の正倍数体のトレースに適用した場合の、GCRMの結果を示し、
図67は、134例のトリソミーの例におけるGCRMプロファイルを示す。GCRMは、正倍数体における第21番染色体のGC富化された最も右の線分の上昇値を平坦化することに成功した。しかし、この方法では、明らかに全体の確率的ノイズを増加させた。さらに、未処理測定値(第20番染色体(Chr20)の最も左の領域)から消失している新たな体系的バイアスを作製した。GCRMに起因した改善は、増加したノイズおよびバイアスにより相殺され、方法の有用性に疑問を示した。
図63に観察されるような第21番染色体からのわずかな上昇は、
図66および
図67において示されるように、大きなノイズの中に消失した。
【0567】
PERUN(誤差除去のパラメータ化および不偏正規化)を、これまでに記載されたGC正規化方法の実行可能な代替えとして開発した。
図68および
図69は、
図64〜67に示されるものに対するPERUN方法の結果を対比する。PERUNの結果は、
図64〜67において分析されたデータの同じ2つの部分集合上に得られた。体系的バイアスのほとんどが、PERUNトレースから消失し、正倍数体サンプルの1つの第20番染色体の顕著な欠失などの確率的ノイズおよび生物学的変動を残すにすぎない(
図68)。第20番染色体の欠失も、未処理カウントプロファイルにおいて観察可能であったが(
図64)、GCRMトレースにおいて完全にマスクされた。GCRMがこの大きな偏差を明らかにできないことは、極めて小さい胎児のT21の上昇を測定するには明らかに不適切となる。PERUNトレースは、未処理またはGCRMプロファイルよりも含有するビンが少ない。
図62〜63に示されるように、PERUNの結果は、少なくとも測定誤差が許容するのと同様であるようである。
【0568】
参照中央カウントプロファイルに対する正規化
従来のGC正規化方法は、最適下により行うことができる。その理由の一部は、GCバイアスが唯一の変動源ではないことがあった。多くの個々の未処理のカウントプロファイルの積み重ねられたプロットは、異なるサンプル間の平行性を表す。いくつかのゲノム領域が一貫して過剰に表されるが、他では、480v2試験のトレースにより図示されるように(
図6)、一貫して過小に表される。GCバイアスはサンプル間で異なるが、これらのプロファイルに観察される体系的、ビン特異的バイアスは、全てのサンプルにおいて同じパターンとなる。
図6のプロファイル全ては、協調するようにジグザグであった。唯一の例外は、下部の2つのサンプルの中央部分であり、これは、母体欠失に由来することがわかった。このビン特異的バイアスを補正するために、参照プロファイルの中央値を使用した。参照プロファイルの中央値は、既知の正倍数体のセット(例えば、正倍数体妊娠)またはフローセルの全てのサンプルから構築された。方法は、参照サンプルのセットにおいて、ビン当たりの中央値カウントを評価することにより参照プロファイルを作製した。ビンと関連するMADが、ビンの信頼性を測定した。かなり変動可能なビンおよび一貫して表現が消失しているビンを、さらなる分析から除去した(
図4)。次いで、試験データセットのカウント測定値を、
図8に図示したように、参照プロファイルの中央値に対して正規化した。かなり可変なビンを正規化されたプロファイルから除去し、2倍体片においておよそ1、ヘテロ接合重複の領域において1.5、ヘテロ接合欠失の領域において0.5などとなるトレースを残した(
図9)。得られた正規化されたプロファイルは、合理的に分散性を減少させ、母体欠失および重複の検出ならびにサンプル同一性のトレースを可能にした(
図12、22、13、11)。カウントプロファイルの中央値に基づいた正規化は、成果を明確にすることができるが、GCバイアスはなお、このような方法において負の効果を有する。本明細書に記載のPERUN法を使用し、GCバイアスに対処し、より感受性および特異性の高い成果を提供することができる。
【0569】
LOESS補正乗算法の有害な影響
図11は、ビンワイズカウントがGC−LOESSまたはGCRM適用前(
図64〜65)より適用後(
図66〜67)にさらに変動するかについて図示した。LOESS GC補正は、回帰直線(直線、
図70、上部パネル)で未処理カウントを除算することにより未処理カウント(
図70、上部パネル)からの傾向変動を除去した。点を中央値カウントにより定義し、ゲノムGC含量の中央値を固定した。平均の、中央値カウントより下のカウントを、小さい数で除算するが、中央値カウントを超えるカウントは、大きい数で除算した。いずれの例においても、平均のカウントを拡大し、または縮小し、1に一致させた(
図70、下部パネル)。カウントの増大に加え、小さいカウントの拡大縮小も、分散性を増大させた。GCゲノム含量の中央値から左の最終結果(
図70、下部パネル)は、対応する未処理カウント(
図70、上部パネル)よりかなりの広がりを示し、典型的な三角形の形状(
図70、下部パネル、三角)を形成した。カウントの傾向変動を除去するため、GC LOESS/GCRMは精度をあきらめ、それゆえ、補正方法は一般に乗算法であり、加算法でない。PERUNにより提供された正規化は一般に、本来は加算法であり、乗算技法に対する精度を強化する。
【0570】
GCバイアススケーリングにおけるゲノムワイド転換点の不十分
代替えの方法は、ゲノム全体に総合的なGCバイアススケーリングを行う代わりに、個々の染色体に個別にLOESS補正を適用した。個々の染色体のスケーリングは、過剰表現された染色体からの信号を削除するため、正倍数体またはトリソミーとしてサンプルを分類するためには実用的ではなかった。しかし、この試験の結論では、PERUNアルゴリズムを開発するための媒介因子として最終的に有用であった。
図71は、複数のサンプルからの同じ染色体において得られたLOESS曲線が、共通の交点(転換点)を共有することを図示する。
【0571】
図72は、転換点の周りの染色体特異的LOESS曲線を、これらのサンプルにおいて測定されたGCバイアス係数に比例する角度で傾斜させることにより、曲線全てを融合させたことを示す。染色体特異的LOESS曲線を、サンプル特異的GCバイアス係数により傾斜させることにより、
図73に示されるように、複数のサンプルにおいて得られたLOESS曲線のファミリーの広がりを顕著に減少させた(黒
塗りの円(傾斜前)および
白抜きの円(傾斜後))。黒
塗りの円および
白抜きの円が接触する点は、転換点と一致した。さらに、染色体特異的転換点のGC含量の軸上の位置は、所与の染色体のGC含量の中央値と一致したことが明らかとなった(
図74、左の垂
直線:中央値、右の垂
直線:平均値)。同様の結果を、
図75A〜
図75Fに示されるように、全ての染色体において得られた(左の垂
直線:中央値、右の垂
直線:平均値)。全ての常常染色体およびX染色体を、GC含量の中央値に従い、順序付けた。
【0572】
図76に示されるように、ゲノムワイドGC LOESSスケーリングは、ゲノム全体のGC含量の中央値の変換を旋回させた。転換点は、ゲノム全体のGC含量に類似のGC含量の中央値を有する染色体に許容可能であったが、極端なGC含量を含む染色体、例えば、第19番染色体、第20番染色体、第17番染色体、および第16番染色体(極度に高GC含量)においては最適下となった。ゲノム全体のGC含量の中央値に集中したこれらの染色体の転換点は、
図76の左の四角内に観察される広がりを維持し、
図76の右の四角により囲まれた分散性の低い領域を消失した(染色体特異的転換点)。
【0573】
しかし、染色体特異的GC含量の中央値の転換点は、分散性をかなり減少させた(
図75)。以下のように観察した:
1)GC補正は、分散性を減少させるために、ゲノム全体によりむしろ、小さいゲノム片または断片に行われるべきである。片または断片が小さいほど、GC補正にさらに焦点が当てられ、残差誤差を最小にする。
【0574】
2)この具体的な例において、これらの小さいゲノム片または断片は、染色体と同一である。おもに、概念はさらに一般的であり、片または断片が50kbpのビンを含む任意のゲノム領域であってよい。
【0575】
3)個々のゲノム領域内のGCバイアスを、ゲノム全体において評価したサンプル特異的な、ゲノムワイドGC係数を使用して、修正することができる。この概念は重要であり、ゲノム片のいくつかの記述子(例えば、転換点点の位置、GC含量分布、GC含量の中央値、LOESS曲線の形状など)は、各片に特異的であり、サンプルから独立し、つまりバイアスを修正するために使用されるGC係数値は、片全てにおいて同じであり、各サンプルにおいて異なる。
【0576】
これらの一般的な結論が、その方法の詳細な説明から明らかとなるように、PERUNの開発を導いた。
【0577】
体系的バイアス源の分離性
多くの、異なるライブラリ作製の化学物質を使用して測定された未処理カウントプロファイル、クラスター環境、シークエンシング技術およびサンプルコホートを慎重に調査し、少なくとも2つの独立した体系的分散性源の存在を一貫して確認した:
1)全てのビンに、所与のサンプル内で同じように影響を与え、各サンプル間で変化する、GC含量に基づいたサンプル特異的バイアス、および
2)全てのサンプルに共通のビン特異的減衰パターン。
【0578】
2つの分散性の供給源をデータに混合する。両方の完全な除去には解析が必要であった。PERUNより前から存在する誤差除去方法の不備は、2つの体系的なバイアスの供給源の一方に対してのみ補正し、もう一方を無視しているという事実により生じる。
【0579】
例えば、GCRM(またはGC LOESS)法は、狭いGC含量の範囲内にあるGC含量値を含むビン全てを理想的に処理した。そのサブセットに属するビンは、参照中央カウントプロファイルにより反映されるように、広範囲の異なる本来の上昇により特徴付けることができる。しかし、GCRMは、GC含量以外の本来の特性に左右されなかった。それゆえ、GCRMは、ビンサブセットにすでに存在する広がりを維持する(またはさらに拡大する)。
【0580】
一方で、ビンワイズ参照中央カウントは、GCバイアスによるビン特異的減衰パターンの調節について無視し、異なるGC含量により生じる広がりを維持した。
【0581】
対極の誤差スペクトラムを取り扱う方法を連続的に適用することにより、全体的(ゲノムワイド)に2つのバイアスを分解する試みが不成功に終わり、ビン上昇における2つのバイアスを分離する必要性が無視された。理論に限定されないが、PERUNの成功は、明らかに、ビン上昇において、2つのバイアス源を局所的に分離することによる。
【0582】
無益なビンの除去
無益なビンを除去する多くの試みにより、ビン選択に分類を改善する可能性を有することが示されている。第1のこのような方法では、全ての480v2トリソミーの例におけるビン当たりの第21番染色体、第18番染色体、および第13番染色体のカウントの平均値を評価し、全ての480v2正倍数体におけるビン当たりのカウント平均値と比較した。罹患と非罹患例との間のギャップは、両グループにおいて測定されたビンカウントから得られたビンワイズ不確定要素の合成値を用いて拡大縮小した。得られたt統計値を使用し、
図77に示されるように、ビンワイズp値プロファイルを評価した。第21番染色体の例において、方法は、36個の無益なビンを同定した(
図77の楕円形で標識された中央パネル)。Zスコアの計算からこれらのビンを除外することにより、罹患例におけるZ値が顕著に増加したが、非罹患のZスコア(
図78)を不規則に摂動させ、それにより、正倍数体とトリソミー21の例との間のギャップを増大させた。
【0583】
第18番染色体において、この方法は、2つの罹患例におけるZスコアを改善するにすぎなかった(
図79)。
【0584】
ポストホック分析は、これらの2つのサンプルのZスコアの改善が、第18番染色体(
図11)の大きな母体欠失の除去から生じ、2つのサンプルが実際に同じ患者のものであることを示した。これらの改善は、サンプル特異的であり、指数が一般化されない。第13番染色体において、この方法は、Zスコアのいかなる改善も生じかなった。
【0585】
代替えのビンフィルタリングスキームは、極度に低いまたは極度に高いGC含量を含むビンを除去する。この方法は、第9番染色体、第15番染色体、第16番染色体、第19番染色体、および第22番染色体(カットオフに応じて)において顕著に変動を減少させるが、第13番染色体および第18番染色体において不利に影響する、混合した結果を生成した。
【0586】
さらに別の簡易なビン選択スキームは、一貫して低いカウントのビンを排除する。この方法は、2つのLDTv2CE第18番染色体偽陰性(
図80)および2つの第21番染色体偽陰性(
図81)を補正した。少なくとも3つの第18番染色体偽陽性も補正したが、少なくとも1つの新たな第18番染色体偽陽性を作製した(
図80):
結論として、無益なビンをフィルタリングするために使用される異なる基準は、データ処理が、ビンが分類に寄与する有用な情報の量に基づいたビン選択によって有益となることを明らかにした。
【0587】
体系的ビンワイズバイアスからのGCバイアスの分離
カウント測定値に見つかる異なる体系的バイアスを分解し、かつ排除するために、データ処理ワークフローが、「参照中央カウントプロファイルに対する正規化」と題した前述の節から「無益なバイアスの除去」と題した節までに記載の部分的方法を最適に組み合わせるために必要であった。第1のステップは、GCバイアス係数値に従い、異なるサンプルを順序付けた後、カウント対GC含量のプロットを重ねる。結果は、
図82に概略的に示された、プロペラのようにねじれた3次元の面となる。
【0588】
こうして整列された、測定値は、サンプル特異的GCバイアス係数のセットを、個々のゲノム片または断片内の誤差を修正するために適用することができることを示唆する。
図82において、各片または断片を、GC含量により定義する。ゲノムの代替えの区分は、連続の、オーバーラッピングしないビンとなる。ビンの連続の開始位置は、均一にゲノムを包含する。このような一例の50kbp長のビンにおいて、
図83は、サンプルのセットにおいて、そのビン内で測定されたカウント値の挙動を調べている。カウントを、これらのサンプルに観察されるGCバイアス係数に対してプロットする。ビン内のカウントは、サンプル特異的GCバイアスとともに明らかに直線的に増加する。同じパターンが圧倒的に主要なビンにおいて観察される(in observed)。観察値を簡易な線形関係を使用してモデル化することができる:
【0589】
【化71】
[この文献は図面を表示できません]
式Aの種々の項は、以下の意味を有する:
M:不必要な変動により混入した主要な情報を表すカウント測定値。
【0590】
L:染色体上昇−これは、データ処理方法からの所望の出力である。Lは、正倍数性からの胎児および/または母体異常を示す。これは、確率的誤差により、および体系的バイアスの両方によりマスクされる量である。染色体上昇Lは、サンプル特異的およびビン特異的の両方である。
【0591】
G:線形モデルのLOESSまたた任意の等価の方法を使用して測定されたGCバイアス係数。Gは、Mから、およびビン特異的GC含量値のセットから抽出され、通常、参照ゲノムから得られる(が、同様に実際のGC含量の観察値から得られ得る)、二次的な情報を表す。Gはサンプル特異的であり、ゲノム位置に沿って変化しない。不必要な変動の一部を包含する。
【0592】
I:線形モデルの切片(
図83の
斜線)。このモデルパラメータを、所与の実験設定において、サンプルに独立し、ビン特異的に固定する。
【0593】
S:線形モデルの傾き(
図83の
斜線)。このモデルパラメータを、所与の実験設定において、サンプルに独立し、ビン特異的に固定する。
【0594】
量MおよびGを測定する。最初、ビン特異的な値IおよびSは未知である。未知のIおよびSを評価するために、正倍数体のサンプルの全てのビンにおいて、L=1を仮定する必要がある。仮定は、必ずしも当てはまらないが、欠失/重複を含む任意のサンプルよりも、正常な染色体上昇を含むサンプルのほうが圧倒的になるであろうことを合理的に予期することができる。正倍数体サンプルに適用された線形モデルは、選択されたビンに特異的なIおよびSパラメータ値を抽出する(L=1を仮定)。同じ方法をヒトゲノムのビン全てに適用し、各ゲノム位置における切片Iおよび傾きSのセットを生成する。交差検証は、全てのLDTv2CE正倍数体の90%を含有するワークセットを無作為に選択し、そのサブセットを使用し、モデルを訓練する。無作為の選択を100回繰り返し、各ビンにおいて、100個の傾きおよび100個の切片のセットを生成する。「PERUNパラメータの交差検証」と題した前述の節は、より詳細に交差検証の方法について説明している。
【0595】
図84〜85は、それぞれ、第2番染色体のビン番号2404において評価した、100個の切片値および100個の傾き値を示す。2つの分布は、
図83に示される1093個のLDTv2CE正倍数体の100個の異なる90%サブセットに対応する。両方の分布が、相対的に狭く、不規則な形状である。これらの広がりは、線形モデルにより報告された場合の係数の誤差に類似する。原則として、傾きは、切片よりあまり信頼性がなく、それは、少ないサンプルにGCバイアス範囲の極端な部分が集合するためである。
【0596】
PERUNパラメータIおよびSの解釈
切片Iの意味を
図86により図示する。グラフは、1つのLDTv2CEフローセルに3回の別個のシークエンシング試行を行ったときに得られる、技術的反復物のセットから抽出されたデータを含むビン切片の推定値と相関する。y軸は、これらの3つの測定値からのビンワイズカウントの中央値を含有する。これらの中央値は、概念上、参照プロファイルの中央値に関連し、これは既に「参照中央カウントプロファイルに対する正規化」と題した節に記載のようにプロファイルを正規化するために使用された。ビンワイズ切片をx軸に沿ってプロットする。2つの量間の著しい相関は、GCバイアスの非存在下において、ビン当たりのカウント期待値としての切片の本当の意味を表す。参照カウントプロファイルの中央値を含む問題は、GCバイアスを考慮しないことである(「参照中央カウントプロファイルに対する正規化」と題した節を参照のこと)。PERUNにおいて、理論に限定されないが、切片Iの課題は、ビン特異的減衰を扱うことであるが、GCバイアスは、他のモデルパラメータである傾きSの二の次となる。
【0597】
図86は、技術的反復物のセットが男性妊娠の母集団を反映しないため、相関からY染色体を除外する。
【0598】
傾きSの分布(
図87)は、そのモデルパラメータの意味を図示する。
【0599】
図87の分布と、ゲノムワイドのGC含量の分布との間の著しい類似(
図88)は、傾きSが、含有する染色体のGC含量の中央値によりシフトした、ビンのGC含量に近似することを示す。
図88の細い垂直線は、ゲノム全体のGC含量の中央値を示す。
【0600】
図89は、傾きSと、ビン当たりのGC含量との間の密接な関係を再確認させる。わずかな湾曲であるが、観察された傾向変動は、ほんの少量の顕著な外れ値のビンと極めて密接であり、かつ一致する。
【0601】
カウント測定値からの染色体上昇の抽出
モデルパラメータ値IおよびSが各ビンに利用可能であることを仮定し、新たな試験サンプルで採取された測定値Mを使用し、以下の式に従い染色体上昇を評価する:
【0602】
【化72】
[この文献は図面を表示できません]
式Aと同じく、GCバイアス係数Gを、ビンワイズ未処理カウントの測定値Mと、参照ゲノムのGC含量との間の回帰の傾きとして評価する。次いで、染色体上昇Lを、さらなる分析(Z値、母体欠失/重複、胎児の微小欠失/微小重複、胎児の性別、性別異数性など)に使用する。式Bにより包含される方法は、誤差除去のパラメータ化および不偏正規化(PERUN)と呼ばれる。
【0603】
PERUNパラメータの交差検証
「体系的ビンワイズバイアスからのGCバイアスの分離」と題した節で推論したように、IおよびSの評価に、既知の正倍数体の10%(
図83の1093個のLDTv2のセット)を無作為に選択し、交差検証用に別においておく。残りの正倍数体の90%に適用した線形モデルは、選択されたビンに特異的なIおよびSパラメータ値を抽出する(L=1と仮定)。次いで、交差検証は、所与のビンにおけるIおよびSの推定値を使用し、ワークセットおよび残りの10%正倍数体の両方におけるG測定値から測定値Mを再び作製する(繰り返すが、L=1と仮定)。交差検証のサブセットの無作為の選択を、何回か繰り返す(
図83において100回であるが、10回の繰り返しで十分である)。
図83の100個の斜線は、100個の異なる90%ワークサブセット選択における線形モデルを表す。同じ方法を、ヒトゲノムの全てのビンに適用し、各ゲノム位置において、切片Iおよび傾きSのセットを生成する。
【0604】
モデルの成功を定量化し、結果のバイアスを回避するため、以下に定義されるR因子を使用する:
【0605】
【化73】
[この文献は図面を表示できません]
式Bの分子は、実際の測定値(M)からカウント予測値(式BのP)の絶対偏差を合計したものである。分子は、単に測定値を合計したものである。R因子を、モデルの残差誤差または不測の変動として解釈することができる。R因子は、バイアスに脆弱な、結晶学的モデルの改善された方法を直接取り入れる。結晶学において、バイアスを検出し、観察値の交差検証サブセット内で評価されたR因子により測定する。同じ概念を、ゲノムワイドのカウントバイアス除去において適用する。
【0606】
図90は、R因子が、第2番染色体からのビン番号2404のワーク(訓練)セットにおいて評価されたR因子に対してプロットされた交差検証サブセット(y軸)において評価したことを示す。交差検証サブセットの無作為の選択を100回繰り返したので、100個のデータ点がある。R
workの低下を伴い、R
cv値が増加する(バイアスを測定)、典型的な線形関係が観察される。
【0607】
図90は、この具体的なビンにおけるモデルの誤差の割合(または相対的誤差)の観点から解釈され得る。R
cvは常にR
workを通常約1%超える。本明細書において、R
cvおよびR
workの両方は、6%より低いままであり、上記の方法からGCバイアス測定値係数GおよびモデルパラメータIおよびSを使用して、予測値Mにおける約6%の誤差を期待することができることを意味する。
【0608】
交差検証誤差値
図90〜91は、それぞれ、ビンchr2_2404およびchr2_2345における交差検証誤差を示す。これらの、および他の多くのビンにおいて、誤差は決して6%を超えない。chr1_31などの一部のビン(
図92)は、8%に近い交差検証誤差を有する。さらに他(
図93〜95)では、100%を超えるかなり大きな交差検証誤差を有することもある(
図93のchr1_10では40%、
図94のchr1_9では350%、および
図95のchr1_8では800%)。
【0609】
図96は、全てのビンにおける最大値(R
cv、R
work)の分布を示す。ほんのわずかなビンが5%より小さい誤差を有する。ほとんどのビンは、7%より小さい誤差(XおよびYを含む合計61927本のうち48956本の常染色体)を有する。数個のビンは、7%〜10%の誤差を有する。尾部は、10%を超える誤差を含むビンからなる。
【0610】
図97は、交差検証誤差と、技術的反復物のセットから推定されたビン当たりの相対的誤差を相関させる。
中央領域のデータ点
(すなわち、2本の垂直線の間に位置するデータ点)は、7%〜10%の交差検証誤差に対応する。
2本の垂直線の右側の領域のデータ点は、10%を超える交差検証誤差を含むビンを示す。
2本の垂直線の左側の領域のデータ点(誤差<7%)は、ビンの塊を表す。
【0611】
図91〜95において、上部右の差し込み図の上のビン名に続く括弧内の数字は、その具体的なビンにおいて見つかった切片と、ビン当たりのゲノムワイズの中央値カウントとの間の比を示す。交差検証誤差は、明らかに、その比の値の低下とともに増加する。例えば、ビン、chr1_8は、3カウント以上には決してならず、その相対的誤差は800%に近づく。所与のビンにおけるカウントの期待値が小さいほど、ビンはあまり信頼性がない。
【0612】
交差検証に基づくビン選択
「無益なビンの除去」と題した前述の節に記載の観察値に基づき(
図78および
図80〜81)、交差検証誤差を、ビンフィルタリングのための基準として使用した。選択方法として、7%を超える交差検証誤差を含む全てのビンを捨てる。フィルタリングはまた、一貫してゼロカウントを含有する全てのビンを排除する。残りのサブセットは、48956個の常染色体のビンを含有する。これらは、染色体表現を評価するため、かつ罹患または正倍数体のサンプルを分類するために使用されるビンである。7%のカットオフは、トリソミーのZスコアから正倍数体のZスコアを分離するギャップが、7%の交差検証誤差にて安定することにより正当化される(
図98)。
【0613】
図99A(全てのビン)および99B(交差検証されたビン)は、上記のビン選択がおもに、マッピング性が低いビンをほとんど除去することを例証する。
【0614】
期待されるように、ほとんどの除去されるビンは、ゲノムワイドのビンカウントの中央値よりかなり小さい切片を有する。驚くことではないが、ビン選択は、「無益なビンの除去」と題した前述の節に記載の選択とかなりオーバーラップする(
図25および27〜28)。
【0615】
モデルパラメータの誤差
図100〜101は、2つのビン(chr18_6およびchr18_8)のフィットさせた線形モデル(細い直線)の95%信頼区間(曲線)を示す。太い灰色の直線は、Sパラメータをこれらの2つのビンのGC含量と、第18番染色体のGC含量の中央値との間の差と置き換えることにより得られる。誤差範囲は、線形モデルにより報告されるように、これらの2つのビンにおけるモデルパラメータIおよびSの誤差に基づいて評価される。さらに、大きなGCバイアス係数も大きな誤差を含有する。極端に大きいGCバイアス係数に対応する大きな不確定要素は、改変されていないPERUNの適用性の範囲を適度のGCバイアス係数に限定することを示唆する。その範囲を超えて、残りのGCバイアスを除去するためにさらなる測定を行うことが必要とされる。幸いにも、ごく少量のサンプルが罹患しているにすぎない(LDTv2CE集団のおよそ10%)。
【0616】
図102〜104は、モデルパラメータIおよびSの誤差およびSの誤差と、切片の値との相関を示す。
【0617】
二次正規化
高値のGCバイアス係数は、PERUNモデルにより仮定された線形範囲を超え、PERUN正規化後のさらなるLOESS GC正規化ステップにより是正される。LOESS法の乗法の性質により、正規化されたカウントがすでにかなり1に近いため、分散性を大きく増大させない。代替えとして、LOESSを、残差を減算する追加の方法と置き換えることができる。任意選択の二次正規化は、多くの場合、少量のサンプルに対して必要とされるのみで利用される(およそ10%)。
【0618】
ホールパディング(パディング)
図68〜69は、サイズおよび位置に応じて、偽陽性または偽陰性を作製する可能性のある多数の母体欠失および重複の存在を確認する。ホールパディングと呼ばれる任意選択の方法を考案し、これらの母体異常から干渉を排除した。この方法は、単に対して正規化プロファイルをパディングし、1.3を超えて、または0.7より下で逸脱するときに、1に近いままにする。LDTv2CEにおいて、ホールパディング(すなわち、パディング)は、分類に顕著に影響しなかった。しかし、
図105は、第4番染色体の大きな欠失を含有するWIプロファイルを示す。ホールパディングは、そのプロファイルを、第13番染色体の偽陽性から第13番染色体の真性陰性に変換する。
【0619】
結果
この節では、トリソミー13、トリソミー18およびトリソミー21(それぞれ、T13、T18およびT21)、性別決定、および性別異数性におけるPERUNの結果について考察する。
【0620】
分散性の低下
図106は、PERUN正規化前後のビンワイズカウントプロファイルの標準偏差の分布を比較する。得られた正倍数体およびトリソミーの例における染色体表現の分布を、
図107に示す。
【0621】
T13、T18、およびT21の分類の改善
図108〜111は、LDTv2CEのPERUN分類結果を、GCRMカウントを使用して得られたものと比較する。2つの第18番染色体偽陽性、2つの第18番染色体偽陰性、および2つの第21番染色体偽陰性を除去するのに加え、PERUNでは、高次のn乗の上昇がサンプル当たりのカウント数を減少させたことにも関わらず、正倍数体と罹患例とのギャップがほぼ2倍になる(ELANDデータ)。同様の結果を、LDTv2CE Elandデータに訓練させたPERUNパラメータを、WI測定値に適用するときに得る。Bowtieアライメントは、一部のビンの低マッピング性を考慮して、異なるパラメータのセットおよび追加のビンフィルタリングを必要とするが、その結果は、ELANDアライメントで見られたものに近づく。
【0622】
実施例5:PERUNの追加の説明
誤差除去のパラメータ化および不偏正規化(PERUN)法の例は、実施例4に説明され、このような方法の追加の説明を実施例5に記載する。
【0623】
細胞非含有の血中DNA(例えば、母体血漿から)の超並列シークエンシングは、理想的な条件下において、一義的に参照ヒトゲノムに整列された場合に、シークエンシングされたリードをカウントすることにより染色体上昇を定量することができる。いくつかの例において、大量の反復物データを組み込むこのような方法は、異数性を意味し得る染色体上昇の測定値と期待値との統計的に有意な偏差を示す(Chiuら、Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma.Proc.Natl.Acad.Sci USA.2008;105:20458−20463;Fanら、Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood.Proc.Natl.Acad.Sci USA.2008;105:16266−16271;Ehrichら、Noninvasive detection of fetal trisomy 21 by sequencing of DNA in maternal blood:a study in a clinical setting,American Journal of Obstetrics and Gynecology−AMER J OBSTET GYNECOL,vol.204,no.3,pp.205.e1−205.e11,2011 DOI:10.1016/j.ajog.2010.12.060]。理想的に、配列されたリードの分布は、一定のレベルにてゲノムの正倍数体の片を包含するものとする(
図62および
図63)。に、多重化次世代シークエンシング(NGS)の測定が、典型的に、リード開始位置をまばらに分散させる、低いカバレージ(約0.1)を生成するため、均一性を獲得することは困難であり得る。いくつかの実施形態において、この問題を、ゲノムを、等しい長さのオーバーラップしていない片(ビン)に区分し、各ビンに、その中に配列されるリードの数を割り当てることにより部分的に克服する。いくつかの実施形態において、GCバイアスから生じる残りの不均一性[Dohm JC,Lottaz C,Borodina T,Himmelbauer H.Substantial biases in ultra−short read data sets from high−throughput DNA sequencing.Nucleic Acids Res.2008 Sep;36(16):e105.Epub 2008 Jul 26.]は、ビンワイズGC含量に対して傾向変動を除去する乗法を使用してかなり抑制される(Fan HC,Quake SR(2010)Sensitivity of Noninvasive Prenatal Detection of Fetal Aneuploidy from Maternal Plasma Using Shotgun Sequencing Is Limited Only by Counting Statistics.PLoS ONE 5(5):e10439.doi:10.1371/journal.pone.0010439)。いくつかの実施形態において、得られたカウントプロファイルの平坦化は、四重鎖バーコーディングを使用して、臨床環境における胎児トリソミーの分類の成功を可能にする[Palomakiら、DNA sequencing of maternal plasma to detect Down syndrome:an international clinical validation study.Genet Med.,2011 Nov;13(11):913−20.]。
【0624】
四重鎖(すなわち、4個同時のサンプルリード)から高次のサンプル多重鎖レベル(例えば、十二重鎖(すなわち、12個同時のサンプルリード))への移行により、試験被験体(例えば、妊娠女性)の遺伝的変異(例えば、異数体、トリソミーなど)のNGSに基づく検出の限界が強調され、サンプル当たりのリード数および遺伝的変異を分離するギャップ(例えば、トリソミーサンプルの正倍数体)の両方が減少する。多重化の増加により促進されたダウンサンプリングは、データ処理アルゴリズムにおける新たな、よりストリンジェントな必要条件を課すことができる(
図64、
図65および実施例4)。いくつかの実施形態において、リピートマスキングと結びつけた場合でも、GCの傾向変動を除去することには、いくつかの改善を必要とする(
図66、
図67および実施例4)。いくつかの実施形態において、四重鎖バーコーディング(例えば、四重鎖インデキシング)を用いて獲得した感受性を維持するために、以下および
図7、
図8および実施例4に図示および説明するように、目的の微細な信号を、かなりのバックグランドノイズから抽出することができる方法およびアルゴリズムが示される。いくつかの実施形態において、「PERUN」(誤差除去のパラメータ化および不偏正規化)と名付けた新規の方法を説明する。
【0625】
従来のGCの傾向変動を除去することは、自然数の乗法であってよく(
図17および実施例4)、
図6に図示される、追加の体系的バイアス源を対処することができない。いくつかの例において、既知の正倍数体サンプルのセットから構築された参照中央カウントプロファイルは、追加のバイアスを排除することができ、定量的改善に導くことができる。いくつかの例において、既知の正倍数体サンプルのセットから構築された参照中央カウントプロファイルは、参照サンプルからGCバイアスの残りの混合物を引き継ぐことができる。いくつかの実施形態において、正規化は、ビンを塊で取り扱うよりむしろ、ビン上昇にてバイアスを互いから分離することにより1つまたはそれより多い直交型のバイアスを除去する。いくつかの実施形態において、GCバイアスを除去し、位置依存性減衰からGCバイアスのビンワイズ分離を獲得する(
図68、
図69および実施例4)。いくつかの実施形態において、正倍数体と、トリソミーのZスコアとの実質的に増加したギャップは、四重鎖および十二重鎖GCRMの両方の結果に対して得られる。いくつかの実施形態において、母体および胎児の微小欠失および重複を検出する。いくつかの実施形態において、胎児画分を正確に測定する。いくつかの実施形態において、性別を容易に決定する。いくつかの実施形態において、性別異数性(例えば、胎児性別異数性)を同定する。
【0626】
PERUN法および定義
いくつかの実施形態において、参照ゲノム全体を順序付けられたセットBのビンJに区分する:
【0627】
【化74】
[この文献は図面を表示できません]
ビンの長さを抑制し、相対的に均一なGC含量のゲノム伸長に調整することができる。いくつかの実施形態において、隣接のビンをオーバーラップすることができる。いくつかの実施形態において、隣接のビンはオーバーラップしない。いくつかの実施形態において、ビンの両端を等距離にすることができ、または変更し、ヌクレオチド組成物または信号減衰など体系的バイアスをオフセットすることができる。いくつかの実施形態において、ビンは、一本の染色体に内のゲノム位置を含む。各ビンb
jは、参照ゲノムの対応する部分のGC含量g
j0を特徴とする。いくつかの実施形態において、ゲノム全体を参照GC含量プロファイルに割り当てる:
【0628】
【化75】
[この文献は図面を表示できません]
同じg
0プロファイルを、選択された参照ゲノムに整列させた全てのサンプルに適用することができる。
【0629】
ビンbの妥当または明白なサブセット、
【0630】
【化76】
[この文献は図面を表示できません]
を特定の基準を満たすよう選択することができ、例えば、g
j0=0のビン、極値g
j0値を含むビン、複雑性が低く、またはマッピング性が低いことを特徴とするビン(Derrien T,Estelle’J,Marco Sola S,Knowles DG,Raineri E,ら、(2012)Fast Computation and Applications of Genome Mappability.PLoS ONE 7(1):e30377,doi:10.1371/journal.pone.0030377)、高い変数またはさもなければ、無益なビン、一貫して信号が減衰する領域、母体異常の観察値あるいは、染色体全体(X、Y、3倍体染色体、および/またはGC含量の極値を含む染色体)を除外するよう選択することができる。記号
【0631】
【化77】
[この文献は図面を表示できません]
はbのサイズを示す。
【0632】
ビンb
j内に一義的に整列させたサンプルiからの全てのシークエンシングしたリードは、セットa
ijを形成し、この濃度M
ijは、そのビンに割り当てられた未処理カウントの測定値を表す。いくつかの実施形態において、サンプルiのビンカウントの測定値のベクターは、そのサンプルの未処理のカウントプロファイルを構成する。いくつかの実施形態において、これは、PERUNにおいて、おもに観察される。
【0633】
【化78】
[この文献は図面を表示できません]
異なるサンプル間の比較を可能にするため、スケーリング定数N
iは、ビンのサブセットに対する未処理ビンカウントの和として評価される:
【0634】
【化79】
[この文献は図面を表示できません]
いくつかの実施形態において、式Hのbを常染色体のビンに制限する。いくつかの実施形態において、式Hのbを、常染色体のビンに制限しない。M
iを、カウントN
iの合計で除算し、拡大縮小した未処理ビンカウントm
ijを生成する:
【0635】
【化80】
[この文献は図面を表示できません]
セットa
ijのヌクレオチド組成物は、ビンのGC含量g
ijの観察値で説明される。サンプル特異的GC含量プロファイルg
iの観察値は、個々のビン特異的GC含量をベクターに集める。
【0636】
【化81】
[この文献は図面を表示できません]
いくつかの実施形態において、g
i≠g
0およびg
i1≠g
i2≠i1。記号gは、その起源に関わらず、GC含量プロファイルを示し、すなわち、参照ゲノムから得られ、またはサンプル特異的リードアライメントから得られる。いくつかの実施形態において、各式モデルはgを使用する。いくつかの実施形態において、実際の実行は、gをg
0またはg
iのいずれかで置換することができる。
【0637】
単一のサンプルiにおいて、m
iと、gとの線形関係をG
iおよびr
iを用いて仮定し、それぞれ、回帰線のサンプル特異的な傾きおよび残りのアレイを示す:
【0638】
【化82】
[この文献は図面を表示できません]
回帰を、全体のセットB(式D)、またはその妥当なサブセットb(式F)に拡大することができる。傾きの観察値G
iは、拡大縮小されたGCバイアス係数とも呼ばれる。G
iは、サンプルiの体系的GCバイアスへの脆弱性のバルクを表す。いくつかの実施形態において、モデルパラメータの数を最小にするため、関係m
i(g)の曲率と関連し、かつ残りr
iに包含される高次項は、明示的に対応されない。いくつかの実施形態において、サンプル特異的カウントN
iの合計は、異なるサンプルで記録された観察値間の相互作用を混乱させ、M
iをgに関連づける拡大縮小していないG
iの等価物はあまり有用ではなく、考慮に入れないだろう。
【0639】
真の染色体上昇l
ijのベクターは、サンプルiのビン
【0640】
【化83】
[この文献は図面を表示できません]
に対応するが、サンプル特異的染色体上昇プロファイルを形成する:
【0641】
【化84】
[この文献は図面を表示できません]
いくつかの実施形態において、l
iの推定値を、m
iからm
iに存在する体系的バイアスを除去することにより得ることが目的である。
【0642】
各値l
ijは、ビン特異的であり、サンプル特異的でもある。これらは、母体および胎児の両方の寄与を構成し、各倍数性P
MijおよびP
Fijに比例する。
【0643】
ビン特異的およびサンプル特異的倍数性P
ijを、1/2の整数倍として、それぞれ正倍数体、ヘテロ接合欠失、ホモ接合欠失、ヘテロ接合重複、およびホモ接合重複を表す1、1/2、0、3/2、および2の値を用いて定義することができる。いくつかの例において、所与の染色体のトリソミーは、染色体全体またはその実質的な部分に沿って、3/2の倍数性値を意味する。
【0644】
母親および胎児の両方が2倍体(P
Mij=P
Fij=1)であるときに、l
ijは、一部の任意に選択された正倍数体上昇Eに等しい。いくつかの実施形態において、簡便な選択として、Eを
【0645】
【化85】
[この文献は図面を表示できません]
に設定し、したがって、確実にプロファイルl
iを正規化する。ビン選択が存在しない場合、
【0646】
【化86】
[この文献は図面を表示できません]
である。いくつかの実施形態において、Eは、視覚化のため1に設定することができる。いくつかの実施形態において、以下の関係を満たす:
【0647】
【化87】
[この文献は図面を表示できません]
記号f
iは、サンプルiの母体血漿からの細胞非含有血中DNAに存在する胎児DNAの画分を表す。胎児(P
Fij≠1)または母体(P
Mij≠1)のいずれかの正倍数性からの任意の偏差は、l
ijとf
iを推定するために利用することができるEとの差を生じ、微小欠失/微小重複またはトリソミーを検出する。
【0648】
l
iをm
iから抽出するために、線形関係が、所与のサンプルで測定された、ビン特異的に拡大縮小された未処理カウントm
ijと、サンプル特異的に拡大縮小されたGCバイアス係数との間で想定される:
【0649】
【化88】
[この文献は図面を表示できません]
対角マトリクスIおよびベクターSは、式Nに要約される線形式のセットのビン特定的な切片および傾きを集める:
【0650】
【化89】
[この文献は図面を表示できません]
IおよびSはともに、サンプル非依存性である。切片I
jは、GCバイアスが存在しない場合(すなわち、G
i=0のとき)に、拡大縮小された未処理カウントの正倍数体期待値として見なすことができる。
【0651】
これらの実際の値は、Eに採用された慣例を反映する(上記参照)。切片S
jは、差
【0652】
【化90】
[この文献は図面を表示できません]
に関連して非線形であり、式中、
【0653】
【化91】
[この文献は図面を表示できません]
は、ビンjを含有する染色体のGC含量の中央値を表す。
【0654】
パラメータIおよびSの値がわかると、実際の染色体上昇プロファイルl
jは、拡大縮小された未処理カウントプロファイルm
i、および拡大縮小されたGCバイアス係数G
iから、式Nを再配列することにより推定される:
【0655】
【化92】
[この文献は図面を表示できません]
切片マトリクスIの対角文字が、式Qのマトリクス逆関数を行う。
【0656】
パラメータの推定
モデルパラメータIおよびSを、正倍数体の妊娠として核型化されたサンプルにおいて採取されたNスケールの未処理カウントプロファイルのセットから評価する。Nは10
3桁のものである。拡大縮小されたGCバイアス係数G
iは、各サンプル(i=1、...、N)において決定される。全てのサンプルを、これらのG
i値のサイズおよび記号に従い少数のクラスに分離する。層化は、各シェル内のG
i値を表す十分な数と十分に小さい範囲を含む相反する要求のバランスをとる。4層の妥協案として、陰性、ほぼゼロ、やや陽性、および極めて陽性のGCバイアスに調整し、ほぼゼロのシェルが最も密度が集中している。各層からのサンプルの画分(典型的には10%)を、無作為に選択し、交差検証のために取っておくことができる。残りのサンプルは、モデルの訓練に使用されるワークセットを作製する。訓練および続く交差検証はともに、ゲノム全体に沿って、全てのサンプルに母体および胎児欠失または重複が含まれないことを仮定する:
【0657】
【化93】
[この文献は図面を表示できません]
大量のサンプルにより、仮定値Rからの母体偏差の偶然値が相殺される。各ビンjにおいて、l
ijを、Eに設定し、切片I
jおよび傾きS
jを、式Nに従い、訓練に適用した線形回帰の係数として評価することを可能にする。I
jおよびS
jにおける不確定要素の推定値を同様に記録する。
【0658】
該当機能および交差検証サブセットへの無作為の区分を、複数回(例えば、10
2回)繰り返し、I
jおよびS
jパラメータの値の分布を生成する。いくつかの実施形態において、無作為の区分を約10〜約10
5回繰り返す。いくつかの実施形態において、無作為の区分を、約10、約10
2、約10
3、約10
4または約10
5回繰り返す。
【0659】
交差検証
ワークセットから得られると、モデルパラメータI
jおよびS
jを使用し、拡大縮小した未処理カウントを拡大縮小したGCバイアス係数から式Nおよび仮定値Rを使用して逆算出する。記号p
ijは、サンプルiのビンb
jにおける拡大縮小した未処理カウントの予測値を示す。さらに明細書内のインデックスWおよびCVは、それぞれワークサブセットおよび交差検証サブセットを表す。逆算出を全てのサンプルに、WおよびCVの両方から適用する。結晶学的構造の改善された法から取り入れたR因子(Brunger,Free R value:a novel statistical quantity for assessing the accuracy of crystal structures,Nature355,472−475(30 January 1992);doi:10.1038/355472a0)をサンプルの2つのサブセットにおいて個別に定義する:
【0660】
【化94】
[この文献は図面を表示できません]
R因子はともにビン特異的である。結晶学と同じく、R因子16〜17を、モデルの残りの相対的誤差として解釈することができる。パラメータの推定から除外しているので、交差検証R因子R
CVjは、所与のW/CV除算における誤差の実際の測定値を提供するが、R
jCVとR
Wjとの差は、ビンjにおけるモデルバイアスを反映する。R値の個々の対を、各ビンにおいて、およびサンプルのセットをWおよびCVに無作為に区分するために評価する。全てのR
CVjおよびR
Wjの最大値は、WおよびCVへの異なる無作為の区分において得られるが、ビンjをその全体のモデル誤差ε
jに割り当てる。
【0661】
ビン選択
ゼロのGC含量g
j0の全てのビンを、大量のサンプル全体に一貫してゼロカウントとなるビンのセット
【0662】
【化95】
[この文献は図面を表示できません]
であるとしてさらなる考慮から排除する。さらに、交差検証許容誤差値εの最大値を、全てのビンに重ねることができる。いくつかの実施形態において、モデル誤差ε
jが上限εを超えるビンを拒絶する。いくつかの実施形態において、フィルタリングはビンマッピング性のスコア
【0663】
【化96】
[この文献は図面を表示できません]
を使用し、マッピング性の許容値μの最小値に重ね、μ
j<μのビンを拒絶する(Derrien T,Estelle’J,Marco Sola S,Knowles DG,Raineri E,ら、(2012)Fast Computation and Applications of Genome Mappability.PLoS ONE7(1):e30377,doi:10.1371/journal.pone.0030377)。第21番染色体、第18番染色体および第13番染色体の胎児トリソミーを決定するために、性染色体を同様に除外することができる。ビン選択の相の全てを存続させるビンのサブセットβにさらに演算を行うことができる。いくつかの実施形態において、同じサブセットβを全てのサンプルに使用する。
【0664】
正規化および標準化
いくつかの実施形態において、所与のサンプルiにおいて、ビン選択βに対応する染色体上昇l
ijを式Qに従い推定する。いくつかの実施形態において、第2の正規化を適用し、l
ij対GC含量の相関からの任意の曲率を除去する。いくつかの実施形態において、l
ijは、すでにほぼバイアスされておらず、第2の傾向変動を除去することは確実であり、誤差ブースティングに影響されない。いくつかの実施形態において、標準的なテキストブック法で十分である。
【0665】
いくつかの実施形態において、正規化の結果を各染色体内で合計する:
【0666】
【化97】
[この文献は図面を表示できません]
サンプルiの常染色体材料の合計を個々のL
in項全ての合計として評価することができる:
【0667】
【化98】
[この文献は図面を表示できません]
目的の各染色体の染色体表現を、L
inをL
iで除算することにより得ることができる:
【0668】
【化99】
[この文献は図面を表示できません]
染色体nの表現の分散性σ
nを、複数のフローセルに及ぶサンプルの選択全体のMADの無修正値χ
inとして推定することができる。いくつかの実施形態において、期待値
【0669】
【化100】
[この文献は図面を表示できません]
は、試験サンプルと同じフローセルからのサンプルの選択に対応するχ
inの中央値として評価する。サンプル選択はともに、高値の陽性対照、低値の陽性対照、高値の陰性対照、空白、QC基準を満たさないサンプル、およびSD(l
i)が予め定義されたカットオフ(典型的に0.10)を超えるサンプルを除外することができる。合わせて、σ
n値および
【0670】
【化101】
[この文献は図面を表示できません]
は、Zスコアを使用して、異なるサンプル間の染色体表現の標準化および比較のためのコンテキストを提供する:
【0671】
【化102】
[この文献は図面を表示できません]
いくつかの実施形態において、トリソミー13、18、および21などの異常を、所望の信頼水準により決定される、予め定義された値を超えるZ値により示す。
【0672】
実施例6:式の例
本明細書に記載の方法に使用することができる数学的および/または統計学的式の非限定的例を以下に記載する。
【0673】
【化103】
[この文献は図面を表示できません]
実施例7:上昇の同定および調節(パディング)
母体の欠失および重複は、多くの場合、プロファイルの第1の上昇として表されるが、T21、T18、またはT13を検出するときに分散性を減少させるためPERUNを用いて正規化されたカウントプロファイルから除去することができる。プロファイルからの欠失および重複の除去は、母体異常を由来とする染色体表現の測定値に見つかる分散性(例えば、生物学的分散性)を減少させることができる。
【0674】
1の染色体上昇期待値から顕著に逸脱する全てのビンを最初に同定する。本実施例において、いくつかの単離されたビンを選択から除去する。これは任意選択とする。本実施例において、連続のビン外れ値の十分に大きなグループのみを維持する。これも任意選択とする。ビン外れ値に割り当てられた上昇または連続のビン外れ値のグループに応じて、補正因子を上昇測定値に加算し、1の上昇期待値に近づけるよう調節する。本実施例で使用されるPAV値は+1(ホモ接合の母体欠失)、+0.5(ヘテロ接合の母体欠失)、−0.5(ヘテロ接合重複)、−1(ホモ接合重複)、またはそれ以上(大きなスパイク)である。大きなスパイクは、多くの場合、母体欠失および重複として同定されない。
【0675】
このパディング法により、大きな母体異常を含有するサンプルにおける分類(例えば、異数性、例えば、トリソミーとしての分類)を補正した。パディングにより、Chr4の大きな母体欠失を除去するため、WIサンプルを偽陽性T13から真性陰性に変換した(
図112〜115)。
【0676】
実験データの過去のシミュレーションは、染色体、胎児画分、および異常の種類(ホモ接合またはヘテロ接合、重複または欠失)に応じて、20〜40ビン長の母体異常が、分類の端(例えば、閾)全体のZ値を推し進め、偽陽性または偽陰性を生じ得ることを示している。パディング(例えば、調節)はこの危険を回避することができる。
【0677】
このパディング法により、目的でない母体異常(混乱因子)を除去し、正倍数体の分散性を減少させ、Zスコアを標準化するために使用されるシグマ値をより厳密に作製することができ、それゆえ、正倍数体とトリソミーの例とのギャップを拡大させることができる。
【0678】
実施例8:母体および/または胎児コピー数多型からの胎児画分の決定
本明細書に記載の方法の際立った特徴は、胎児(例えば、正倍数体の胎児)を妊娠している妊娠女性の例において、母体異常(例えば、母体および/または胎児コピー数多型)を、胎児画分を確認するプローブとして使用することである。母体異常の検出および定量化は、典型的に、未処理カウントの正規化の助けを借りてなされている。本実施例において、未処理カウントを、PERUNを使用して正規化する。代替えとして、参照中央カウントプロファイルに対する正規化を、同じ方法で、および同じ目的において使用することができる。
【0679】
未処理カウントのPERUN正規化により、サンプル特異的ビンワイズ染色体レベルl
ij(iはサンプルをカウントし、jはビンをカウントする)を生成する。これらが母体および胎児の両方の寄与を構成し、それぞれの倍数性P
MijとP
Fijに比例する。
【0680】
ビン特異的およびサンプル特異的倍数性P
ijを、1/2の整数倍として、それぞれ、正倍数性、ヘテロ接合欠失、ホモ接合欠失、ヘテロ接合重複、およびホモ接合重複を表す値の1、1/2、0、3/2、および2を用いて定義する。具体的に、所与の染色体のトリソミーは、染色体全体またはその実質的な部分に沿って、3/2の倍数性の値となる。
【0681】
母親および胎児の両方が2倍体(P
Mij=P
Fij=1)であるときに、l
ijは、いくつかの任意に選択された正倍数体のレベルEに等しい。簡便な選択により、Eを
【0682】
【化104】
[この文献は図面を表示できません]
に設定し、式中、bは全てのビンのセット(B)の妥当または明白なサブセットを表す。したがって、確実にプロファイルl
iを正規化する。ビン選択が存在しない場合は、
【0683】
【化105】
[この文献は図面を表示できません]
である。代替えとして、および優先的には、Eは、視覚化のため1に設定され得る。一般に、以下の関係を満たす:
【0684】
【化106】
[この文献は図面を表示できません]
記号f
iは、サンプルiの母体血漿からの細胞非含有血中DNAに存在する胎児DNAの画分を表す。胎児(P
Fij≠1)または母体(P
Mij≠1)のいずれかの正倍数性からの任意の偏差は、l
ijと、f
iを推定し、かつ微小欠失/微小重複またはトリソミーを検出するために利用することができるEとの間の差を生じる。
【0685】
異なる4種の母体異常を個別に考慮に入れる。胎児が母体異常を受け継ぐ可能性がある(またはホモ接合の場合、受け継がなければならない)場合、4種全てが、考えられる胎児遺伝子型において説明される。さらに、胎児は、同様に父親から一致する異常を受け継ぐ可能性がある。一般に、胎児画分は、P
Mij≠P
Fijのときにのみ測定され得る。
【0686】
A)ホモ接合の母体欠失(P
Mij=0)。2つの考えられる、随伴する胎児倍数性は以下を含む:
a.P
Fij=0、この場合、l
ij=0、および胎児画分は、欠失から評価することができない
b.P
Fij=1/2、この場合、l
ij=f
i/2、および胎児画分は、欠失内の平均上昇の2倍として評価される。
【0687】
B)ヘテロ接合の母体欠失(P
Mij=1/2)。3つの考えられる、随伴する胎児倍数性は以下を含む:
a.P
Fij=0、この場合、l
ij=(1−f
i)/2、および胎児画分は、1/2と、欠失内の平均上昇との差の2倍として評価される
b.P
Fij=1/2、この場合、l
ij=1/2、および胎児画分は、欠失から評価することができない
c.P
Fij=1、この場合、l
ij=(1+f
i)/2、および胎児画分は、1/2と、欠失内の平均上昇との差の2倍として評価される。
【0688】
C)ヘテロ接合の母体重複(P
Mij=3/2)、3つの考えられる、随伴する胎児倍数性は以下を含む:
a.P
Fij=1、この場合、l
ij=(3−f
i)/2、および胎児画分は、3/2と、重複内の平均上昇との差の2倍として評価される
b.P
Fij=3/2、この場合、l
ij=3/2、および胎児画分は重複から評価することができない
c.P
Fij=2、この場合、l
ij=(3+f
i)/2、および胎児画分は、3/2と、重複内の平均上昇との差の2倍として評価される。
【0689】
D)ホモ接合の母体重複(P
Mij=2)、2つの考えられる、随伴する胎児倍数性は以下を含む:
a.P
Fij=2、この場合、l
ij=2、および胎児画分は、重複から評価することができない
b.P
Fij=3/2、この場合、l
ij=2−f
i/2、および胎児画分は、2と、重複内の平均上昇との差の2倍として評価される。
【0690】
以下のLDTv2CEサンプル(
図116〜131)は、母体および/または胎児のコピー数多型から胎児画分を決定する用途について図示する。患者は、無作為に選択されておらず、FQA胎児画分値との何らかの一致は、いずれかの技法の長所の尺度として解釈されるものではない。
実施例9:実施形態の実施例
以降に、本技術の特定の実施形態の非限定的な例を挙げる。
【0691】
A0.染色体異常断片もしくは胎児異数性または両方の有無を検出する方法であって、以下を含む方法:
(a)試験被験体から、循環無細胞核酸を含むサンプルを得、
(b)サンプルから細胞非含有サンプル核酸を単離し、
(c)細胞非含有サンプル核酸から配列リードを得、
(d)ゲノム片に分割されている既知のゲノムに、(c)で得られた配列リードをマッピングし、
(e)ゲノム片内にマッピングされた配列リードをカウントし、
(f)(e)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(g)(f)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定する。
【0692】
A0.1.試験被験体が、ヒト、動物、および植物から選択される、実施形態A0の方法。
【0693】
A0.2.ヒト試験被験体が、女性、妊娠女性、男性、胎児、または新生児を含む、実施形態A0.1の方法。
【0694】
A0.3.(f)が、標準偏差の二乗の逆関数を使用して、(e)で得られたゲノム片におけるカウントを重み付けすることを含む、実施形態A0〜A0.2のいずれか1つの方法。
【0695】
A1.染色体異常断片もしくは胎児異数性または両方の有無を検出する方法であって、以下を含む方法:
(a)試験被験体から血中細胞非含有サンプル核酸の配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)で得られたゲノム片におけるカウントを正規化することにより、サンプル正規化されたカウントプロファイルを作製し、
(e)(d)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定する。
【0696】
A1.01.染色体異常断片もしくは胎児異数性または両方の有無を検出方法であって、以下を含む方法:
(a)参照ゲノムのゲノム片にマッピングされた試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ゲノム片について配列リードのカウントを正規化することにより、サンプル正規化されたカウントプロファイルを作製し、
(c)(b)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定する。
【0697】
A1.1.細胞非含有サンプル核酸が、試験被験体から得られた血液から単離される、実施形態A0〜A1.01のいずれか1つの方法。
【0698】
A1.2.細胞非含有サンプル核酸が、試験被験体から得られた血清から単離される、実施形態A0〜A1.01のいずれか1つの方法。
【0699】
A1.3.細胞非含有サンプル核酸が、試験被験体から得られた血漿から単離される、実施形態A0〜A1.01のいずれか1つの方法。
【0700】
A1.4.試験被験体が、ヒト、動物、および植物から選択される、実施形態A1またはA1.01の方法。
【0701】
A1.5.ヒト試験被験体が、女性、妊娠女性、男性、胎児、または新生児を含む、実施形態A1.4の方法。
【0702】
A1.6.(d)が、標準偏差の二乗の逆関数を使用して、(c)で得られたゲノム片におけるカウントを重み付けすることを含む、実施形態A1〜A1.5のいずれか1つの方法。
【0703】
A2.細胞非含有サンプル核酸の配列リードがポリヌクレオチドフラグメントの形態である、実施形態A1〜A1.6のいずれか1つの方法。
【0704】
A2.1.ポリヌクレオチドフラグメントが、約20〜約50ヌクレオチド長である、実施形態A2の方法。
【0705】
A2.2.ポリヌクレオチドが、約30〜約40ヌクレオチド長である、実施形態A2.1の方法。
【0706】
A3.既知のゲノムが、共通のサイズを共有するゲノム片に分割される、実施形態A1の方法。
【0707】
A4.(c)が、(b)のゲノム片にマッピングされた冗長な配列リードを除去した後に行われる、実施形態A1〜A3のいずれか1つの方法。
【0708】
A5.サンプル正規化されたカウントプロファイルが、サンプル未処理カウントプロファイルを参照中央カウントプロファイルに対して正規化することにより作製される、実施形態A1〜A4のいずれか1つの方法。
【0709】
A5.1.サンプル未処理カウントプロファイルがゲノムまたはその断片全体のカウント測定値の分布を表すサンプル測定カウントプロファイルを構築することにより作製される、実施形態A5の方法。
【0710】
A6.さらに、ゲノムまたはその断片全体に非冗長にマッピングされたカウントの合計数に対して、サンプル測定カウントプロファイルを正規化し、それによりサンプル未処理カウントプロファイルを作製することを含む、実施形態A5またはA5.1の方法。
【0711】
A7.参照中央カウントプロファイルが以下を含むプロセスにより作製される、実施形態A3の方法:
(i)複数の参照被験体からの血中細胞非含有参照サンプル核酸から、配列リードを得、
(ii)ゲノム片に分割されている既知のゲノムに(i)で得られた配列リードをマッピングし、
(iii)ゲノム片内にマッピングされた配列リードをカウントし、
(iv)(iii)のカウントから未処理カウントプロファイルを作製し、
(v)参照サンプルの中央値カウントがゼロのゲノム断片を除去し、
(vi)ゲノム断片における中央値カウントおよび不確定要素を決定し、この場合、(i)〜(vi)を行うことにより、参照中央カウントプロファイル、不確定要素プロファイルおよび/または断片識別子を作製する。
【0712】
A7.1.参照被験体が、ヒト、動物、および植物から選択される、実施形態A7の方法。
【0713】
A7.2.ヒト参照被験体が、女性、妊娠女性、男性、胎児、または新生児を含む、実施形態A7.1の方法。
【0714】
A7.3.参照被験体の妊娠女性が、染色体異常がない胎児および/または正倍数体であることが知られている胎児を妊娠している、実施形態A7.2の方法。
【0715】
A8.(iii)の後に不確定要素のカットオフを選択することを含む、実施形態A7〜A7.3のいずれか1つの方法。
【0716】
A8.1.不確定要素のカットオフが以下を含むプロセスにより得られる、実施形態A8の方法:
(iv)で作製されたプロファイルの標準偏差を算出し、
選択された信頼区間に等しい定数を、プロファイルの標準偏差に乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
【0717】
A8.2.不確定要素のカットオフが以下を含むプロセスにより得られる、実施形態A8の方法:
(iv)で作製されたプロファイルの中央絶対偏差を算出し、
選択された信頼区間に等しい定数を、プロファイルの中央絶対偏差に乗算し、
それにより不確定要素のカットオフにおける値を作製する。
【0718】
A8.3.不確定要素のカットオフを超える値を含む任意のゲノム片を除去する、実施形態A8〜A8.2のいずれか1つの方法。
【0719】
A8.4.選択された信頼区間を表す定数が、信頼区間のカットオフとして選択された標準偏差の数に等しい、実施形態A8.2またはA8.3の方法。
【0720】
A8.5.定数が2であり、この定数が2標準偏差を表す、実施形態A8.4の方法。
【0721】
A8.6.定数が3であり、この定数が3標準偏差を表す、実施形態A8.4の方法。
【0722】
A9.(vi)の後に不確定要素のカットオフを超えるカウント不確定要素を含む断片を除去することを含む、実施形態A7〜A8.6のいずれか1つの方法。
【0723】
A10.参照中央カウントプロファイルが、ゲノムまたはその断片全体の参照測定カウントの分布を表す参照測定カウントプロファイルを構築することにより作製される、実施形態A7〜A9のいずれか1つの方法。
【0724】
A11.サンプル正規化されたカウントプロファイルが、ゲノム断片を、(v)の参照サンプルカウントプロファイルから除去されたサンプル未処理カウントプロファイルから除去し、(vi)で作製された不確定要素を割り当て、参照中央カウントプロファイルに残る断片のカウントの和に対して各残りの断片におけるサンプルカウント測定値を正規化することにより各ゲノム片において作製される、実施形態A7〜A10のいずれか1つの方法。
【0725】
A12.胎児の染色体異常断片もしくは胎児異数性または両方を検出する予測値を含むサンプルプロファイルピークを、以下を含むプロセスによりゲノムの位置にて同定する、実施形態A1〜A11のいずれか1つの方法:
ピークを含む、(iv)で作製された正規化されたカウントプロファイルを評価する信頼水準を選択し、
ピークを評価するゲノム断片長の最大値を選択し、
ゲノム内の位置の種々の長さのゲノム断片において、ピーク上昇および/またはピーク幅を評価し、
それにより、胎児の染色体異常断片もしくは胎児異数性または両方を検出する予測値を含むピークが、ゲノムの位置にて信頼水準を用いて検出される。
【0726】
A12.1.選択された信頼水準が95%である、実施形態A12の方法。
【0727】
A12.2.選択された信頼水準が99%である、実施形態A12の方法。
【0728】
A12.3.信頼水準が、カウント測定値の品質に基づき選択される、実施形態A12〜A12.2のいずれか1つの方法。
【0729】
A12.4.ピークを評価するゲノム断片長の最大値が1つまたはそれより多いゲノム断片またはその部分を含む、実施形態A12の方法。
【0730】
A13.さらに、以下を含む、実施形態A12〜A12.4のいずれか1つの方法:
ゲノムの位置を選択し、
ピークを含むp値プロファイルを作製し、
選択された信頼水準以下のp値を含むゲノム断片を除去し、
異なる長さの冗長な、および/またはオーバーラップする断片を除去し、
ピーク端の位置およびそれらの関連の不確定要素を決定し、
無作為に選択されたサンプル間で共通して見つかるピークを同定し、場合により除去し、
それにより、胎児の染色体異常断片もしくは胎児異数性または両方を検出する予測値を含むピークを、ゲノムの位置内に検出する。
【0731】
A13.1.異なる長さの冗長な、および/またはオーバーラップする断片の部分を除去する、実施形態A13の方法。
【0732】
A13.2.異なる長さの冗長な、および/またはオーバーラップする断片全てを除去する。実施形態A13の方法。
【0733】
A14.p値プロファイルが、以下を含むプロセスにより作製される、実施形態A13〜A13.2のいずれか1つの方法:
評価のためにゲノムの所望の位置を選択し、
所望のゲノム断片長を選択し、
ゲノムの位置における平均プロファイル上昇およびサンプル正規化されたカウントプロファイル内の平均値の関連誤差を評価し、
p値を、選択されたゲノム断片に割り当て、
それによりp値プロファイルが作製される。
【0734】
A14.1.選択されたゲノム断片に割り当てられたp値を、式
【0735】
【化107】
[この文献は図面を表示できません]
に従い算出し、式中、x
1およびx
2は平均の値を表し、n
1およびn
2はサンプルサイズを表し、σ
1およびσ
2は標準偏差を表す、実施形態A14の方法。
【0736】
A15.p値を、選択されたゲノム断片に割り当てることは、さらに以下を含む、実施形態A14またはA14.1の方法:
(1)開始断片を選択し、
(2)ゲノムの選択された位置における平均の上昇および平均値の標準誤差を決定し、
(3)平均の断片上昇および平均値の対応する標準誤差を評価し、
(4)ゲノムの選択された位置における平均の上昇に対して、および/または所定の上昇値に対してZ値を評価し、
(5)1つまたはそれより多い開始断片および/または断片長において1〜4を繰り返し、
(6)選択された開始断片のそれぞれの断片長全体および/または各断片長に対してt検定を行い、
それにより、p値が選択されたゲノム断片に割り当てられる。
【0737】
A15.1.Z値を、式
【0738】
【化108】
[この文献は図面を表示できません]
を使用して算出し、式中、Nおよびnは染色体全体の、および異常の範囲内のビンの数を指し、σ
1およびσ
2は標準偏差を表し、Δ
1は被験体1の遺伝的変異の領域の平均の上昇と、被験体1の対応する染色体の平均の上昇との差を表し、Δ
2は被験体2の遺伝的変異の領域の平均の上昇と、被験体2の対応する染色体の平均の上昇との差を表す、実施形態A15の方法。
【0739】
A15.2.所定の値が1に等しい、実施形態A15の方法。
【0740】
A15.3.所定の値が1未満である、実施形態A15の方法。
【0741】
A15.4.所定の値が1より大きい、実施形態A15の方法。
【0742】
A16.自己相関における任意選択の補正を含む、実施形態A15〜A15.4のいずれか1つの方法。
【0743】
A17.共通に見つかるピークは、以下を含むプロセスにより同定される、実施形態A13の方法:
同じまたは同様の条件下において測定された複数のサンプルから、細胞非含有サンプル核酸リードを得、
試験サンプルのセットを選択し、
ピークを含む参照中央カウントプロファイルを作製し、
試験サンプルのセットのサンプル間に共通して見つかるピークを同定する。
【0744】
A17.1.複数のサンプルを無作為に選択する、実施形態A17の方法。
【0745】
A17.2.試験サンプル間に共通して見つかるピークを同定することは、以下を含む、実施形態A17およびA17.1の方法:
ピークを含む参照中央カウントプロファイル、ピークを含むZ値プロファイル、ピークを含むp値プロファイル、またはそれらの組み合わせを比較し、
各サンプルにおいて共通して同定されたピークを同定する。
【0746】
A18.以下を含むプロセスにより、ピーク端の位置、ピーク片側公差および関連の不確定要素を決定することを含む、実施形態A1〜A17.2のいずれか1つの方法:
ピークを含むサンプル正規化されたカウントプロファイルおよび/またはピークを含む参照中央カウントプロファイルの1つまたはそれより多い領域を選択し、
正規化プロファイルの第1の導関数および/またはその指数を決定し、
ピーク導関数を特徴付け、
それにより、プロセスは、胎児の染色体異常断片もしくは胎児の異数性または両方を検出する予測値を含む、ピーク最大値の導関数およびピーク幅の導関数を作製する。
【0747】
A19.2つのサンプルが同じドナーからのものであるかを決定する方法であって、以下を含む方法:
1つまたはそれより多いドナーのサンプルからの血中細胞非含有サンプル核酸から配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
ピークを含む正規化されたカウントプロファイルを作製し、
各サンプル内の予測値を含む正規化されたカウントプロファイルのピークを同定し、
1サンプルのピークと、別のサンプルのピークを比較し、
ピーク対の一致に基づき、結合確率を評価し、
サンプルが同じドナーからのものである確率を決定し、
それにより、サンプルが同じドナーからのものである確率に対して決定がなされる。
【0748】
A20.さらに、以下のプロセスの1つ以上を使用して、1サンプルのピークと別のサンプルのピークを比較することを含む、実施形態A19の方法:
ピーク幅の導関数を使用して、ピークの端が、片側公差内で一致するかを決定し、
ピーク最大値の導関数を使用して、ピーク上昇が、平均値の標準誤差内で一致するかを決定し、
所与のピークの集団の広がりにおいてp値を調節し、
それにより、プロセスの1つ以上を行うことにより、サンプルが同じドナーからのものであるかを決定する。
【0749】
A21.ピーク上昇が、平均値の標準誤差内で一致するかどうかを決定することが、さらにt検定を使用することを含む、実施形態A20の方法。
【0750】
A22.t検定が式
【0751】
【化109】
[この文献は図面を表示できません]
に従い算出され、式中、x
1およびx
2は平均の値を表し、n
1およびn
2はサンプルのサイズを表し、σ
1およびσ
2は標準偏差を表す、実施形態A20およびA21の方法。
【0752】
A23.中央カウントプロファイルの上昇を使用して、正倍数体または異数体としてサンプルを分類する方法であって、以下を含む方法:
循環無細胞核酸を含む試験被験体からサンプルを得、
サンプルから、細胞非含有サンプル核酸を単離し、
単離された細胞非含有サンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
カウントされ、マッピングされた配列リードから、ゲノム片上昇を選択したカウントプロファイルの中央値および関連の不確定要素を含む正規化されたカウントプロファイルを得、
評価のためのゲノムの位置を選択し、
ゲノムの位置におけるプロファイル上昇の中央値および関連の不確定要素を評価し、
上昇中央値が所定の値を顕著に超えるかどうかを決定し、
それにより、上昇中央値が所定の値を顕著に超えるかどうかを決定することにより、サンプルが正倍数体または異数体であるかを決定する。
【0753】
A23.1.所定の値が1に等しい、実施形態A23の方法。
【0754】
A23.2.所定の値が1未満である、実施形態A23の方法。
【0755】
A23.3.所定の値が1より大きい、実施形態A23の方法。
【0756】
A24.ゲノムの位置内の予測値を含む、正規化されたカウントプロファイルピークの上昇を同定し、同定された場合、ゲノムの位置におけるプロファイル上昇の中央値および関連の不確定要素を評価する前に、母体、胎児、および/または母体および胎児の欠失および/または重複において補正することを含む、実施形態A23〜A23.3のいずれか1つの方法。
【0757】
A25.以下を含む予測値を含むピークの面積比を使用して、正倍数体または異数体としてサンプルを分類する方法:
循環無細胞核酸を含む試験被験体から、サンプルを得、
サンプルから、細胞非含有サンプル核酸を単離し、
単離された細胞非含有サンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
選択されたゲノム片におけるカウントの分布を含む正規化されたカウントプロファイルを得、
評価のためのゲノムの位置を選択し、
予測値を含むピークのための選択された位置およびピークに関連の面積比を評価し、
ピークにおける面積比が所定の値に対して有意に異なるかどうかを決定し、
それにより、ピークにおける面積比が所定の値を顕著に超えるかどうかを決定することにより、サンプルが正倍数体または異数体であるかを決定する。
【0758】
A25.1.所定の値が1に等しい、実施形態A25の方法。
【0759】
A25.2.所定の値が1未満である、実施形態A25の方法。
【0760】
A25.3.所定の値が1より大きい、実施形態A25の方法。
【0761】
A26.ゲノムの位置内のピーク面積比を同定し、同定された場合、ゲノムの位置においける予測値を含むピークの面積比を評価する前に母体もしくは胎児、または母体および胎児の欠失および/または重複を補正することを含む、実施形態A25の方法。
【0762】
A27.複数の分類基準を組み合わせることにより正倍数体または異数体としてサンプルを分類する方法であって、以下を含む方法:
試験被験体および複数の既知の正倍数体参照被験体から、循環無細胞核酸を含むサンプルを得、
サンプルから、細胞非含有サンプル核酸を単離し、
単離された細胞非含有サンプル核酸から配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
試験および参照被験体におけるカウントから正規化されたカウントプロファイルを得、
評価のためのゲノムの位置を選択し、
複数の分類基準を使用して、正倍数体の参照のゲノムの選択された位置を評価し、
正倍数体が分布するのみの最小のN次元空間を決定し、
複数の分類基準を使用して試験被験体のゲノムの位置を評価し、
試験被験体のN次元点が、正倍数体が分布するのみの空間内にあるかどうかを決定し、
それにより、試験被験体のN次元点が、正倍数体が分布するのみの空間にあるかどうかを決定することにより、試験被験体が正倍数体または異数体であるかどうかを決定する。
【0763】
A28.正倍数体におけるN次元空間および試験被験体におけるN次元点を、プロファイル上昇の中央値、面積比、Z値、フィットさせた倍数性、フィットさせた胎児画分、残差二乗和、およびベイジアンp値から選択された1つまたはそれより多い分類基準を使用して評価する、実施形態A27の方法。
【0764】
A29.配列リードを得ることは、細胞非含有サンプル核酸に核酸シークエンシングプロセスを行うことを含む、A1〜A28のいずれか1つの方法。
【0765】
A30.シークエンシングプロセスが、ナノポアシークエンシング、合成によるシークエンシング、パイロシークエンシング、PCRシークエンシング、ジデオキシシークエンシング、またはそれらの組み合わせから選択される方法を含む、実施形態A29の方法。
【0766】
A31.染色体異常断片もしくは胎児異数性または両方の有無を決定することは、成果のグラフ、成果のレポート、成果を含む電子ファイル、成果の2次元表示、成果の3次元表示、またはそれらの組み合わせを医療専門家に提供することを含む、実施形態A0〜A30のいずれか1つの方法。
【0767】
A32.医療専門家が、実施形態A31で提供された成果に基づき提言を提供する、A31の実施形態。
【0768】
A33.内蔵のコンピュータ読み取り可能なプログラムコードを有するコンピュータ使用可能な媒体、配列受信モジュールを含む個別のソフトウェアモジュールを含むコンピュータ読み取り可能なプログラムコード、ロジック処理モジュールおよびデータ表示組織化モジュール含むコンピュータプログラム製品であって、コンピュータ読み取り可能なプログラムコードが染色体異常断片もしくは胎児異数性または両方の有無を同定する方法を実行するよう、実行に適合し、方法が以下を含む、コンピュータプログラム製品:
(a)配列受信モジュールにより、試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ロジック処理モジュールにより、(a)で得られた配列リードを、ゲノム片に分割されている既知のゲノムにマッピングし、
(c)ロジック処理モジュールにより、ゲノム片内にマッピングされた配列リードをカウントし、
(d)ロジック処理モジュールにより、(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)ロジック処理モジュールにより、(d)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定し、
(f)ロジック処理モジュールにより決定されたことに対してデータ表示組織化モジュールにより、染色体異常断片もしくは胎児異数性または両方の有無を示すデータ表示を組織化する。
【0769】
A34.実施形態A33のコンピュータプログラム製品を格納するメモリを含む、装置。
【0770】
A35.実施形態A33に明記されたコンピュータプログラム製品の1つまたはそれより多い機能を実行するプロセッサを含む、実施形態A34の装置。
【0771】
A36.核酸シークエンシング装置および処理装置を含むシステムであって、シークエンシング装置がサンプルから配列リードを得、処理装置がシークエンシングデバイスから配列リードを得、以下を含む方法を行うシステム:
(a)試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)(d)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定する。
【0772】
B0.遺伝的変異の有無を検出する方法であって、以下を含む方法:
(a)試験被験体から、核酸を含むサンプルを得、
(b)サンプルから、サンプル核酸を単離し、
(c)サンプル核酸から、配列リードを得、
(d)ゲノム片に分割されている既知のゲノムに、(c)で得られた配列リードをマッピングし、
(e)ゲノム片内にマッピングされた配列リードをカウントし、
(f)(e)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(g)(f)のサンプル正規化されたカウントプロファイルから、遺伝的変異の有無を決定する。
【0773】
B0.1.試験被験体が、ヒト、動物、および植物から選択される、実施形態B0の方法。
【0774】
B0.2.ヒト試験被験体が、女性、妊娠女性、男性、胎児、または新生児を含む、実施形態B0.1の方法。
【0775】
B0.3.(f)が、標準偏差の二乗の逆関数を使用して、(e)で得られたゲノム片におけるカウントを重み付けすることを含む、実施形態B0〜B0.2のいずれか1つの方法。
【0776】
B1.遺伝的変異の有無を検出する方法であって、以下を含む方法:
(a)試験被験体から、サンプル核酸の配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)(d)のサンプル正規化されたカウントプロファイルから、遺伝的変異の有無を決定する。
【0777】
B1.01.遺伝的変異の有無を検出する方法であって、以下を含む方法:
(a)参照ゲノムのゲノム片にマッピングされた試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ゲノム片について配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(c)(b)のサンプル正規化されたカウントプロファイルから、遺伝的変異の有無を決定する。
【0778】
B1.1.サンプル核酸が、試験被験体から得られた血液から単離される、実施形態B0またはB1.01.のいずれか1つの方法。
【0779】
B1.2.サンプル核酸が、試験被験体から得られた血清から単離される、実施形態B0またはB1.01のいずれか1つの方法。
【0780】
B1.3.サンプル核酸が、試験被験体から得られた血漿から単離される、実施形態B0またはB1.01のいずれか1つの方法。
【0781】
B1.4.試験被験体が、ヒト、動物、および植物から選択される、実施形態B1またはB1.01の方法。
【0782】
B1.5.ヒト試験被験体が、女性、妊娠女性、男性、胎児、または新生児を含む、実施形態B1.4の方法。
【0783】
B1.6.(d)が、標準偏差の二乗の逆関数を使用して、(c)で得られたゲノム片におけるカウントを重み付けすることを含む、実施形態B1〜B1.5のいずれか1つの方法。
【0784】
B2.サンプル核酸の配列リードが、ポリヌクレオチドフラグメントの形態である、実施形態B1〜B1.6のいずれか1つの方法。
【0785】
B2.1.ポリヌクレオチドフラグメントが、約20〜約50ヌクレオチド長である、実施形態B2の方法。
【0786】
B2.2.ポリヌクレオチドが、約30〜約40ヌクレオチド長である、実施形態B2.1の方法。
【0787】
B3.既知のゲノムが、共通のサイズを共有するゲノム片に分割される、実施形態B1の方法。
【0788】
B4.(c)が、(b)のゲノム片にマッピングされた冗長な配列リードを除去した後に行われる、実施形態B1〜B3のいずれか1つの方法。
【0789】
B5.サンプル正規化されたカウントプロファイルが、サンプル未処理カウントプロファイルを参照中央カウントプロファイルに対して正規化することにより作製される、実施形態B1〜B4のいずれか1つの方法。
【0790】
B5.1.サンプル未処理カウントプロファイルが、ゲノムまたはその断片全体のカウント測定値の分布を表すサンプル測定カウントプロファイルを構築することにより作製される、実施形態B5の方法。
【0791】
B6.さらに、ゲノムまたはその断片全体に非冗長にマッピングされたカウントの合計数に対してサンプル測定カウントプロファイルを正規化し、それによりサンプル未処理カウントプロファイルを作製することを含む、実施形態B5またはB5.1の方法。
【0792】
B7.参照中央カウントプロファイルが、以下を含むプロセスにより作製される、実施形態B3の方法:
(i)複数の参照被験体からの参照サンプル核酸から、配列リードを得、
(ii)ゲノム片に分割されている既知のゲノムに、(i)で得られた配列リードをマッピングし、
(iii)ゲノム片内にマッピングされた配列リードをカウントし、
(iv)(iii)のカウントから、未処理カウントプロファイルを作製し、
(v)参照サンプルの中央値カウントがゼロであるゲノム断片を除去し、
(vii)ゲノム断片における中央値カウントおよび不確定要素を決定し、
(i)〜(vi)を行うことにより、参照中央カウントプロファイル、不確定要素プロファイルおよび/または断片識別子を作製する。
【0793】
B7.1.参照被験体が、ヒト、動物、および植物から選択される、実施形態B7の方法。
【0794】
B7.2.ヒト参照被験体が、女性、妊娠女性、男性、胎児、または新生児を含む、実施形態B7.1の方法。
【0795】
B7.3.参照被験体が、遺伝的変異を担持しない、実施形態B7.2の方法。
【0796】
B8.(iii)の後に不確定要素のカットオフを選択することを含む、実施形態B7〜B7.3のいずれか1つの方法。
【0797】
B8.1.不確定要素のカットオフが、以下を含むプロセスにより得られる、実施形態B8の方法:
(iv)で作製されたプロファイルの標準偏差を算出し、
プロファイルの標準偏差に、選択された信頼区間に等しい定数を乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
【0798】
B8.2.不確定要素のカットオフが、以下を含むプロセスにより得られる、実施形態B8の方法:
(iv)で作製されたプロファイルの中央絶対偏差を算出し、
プロファイルの中央絶対偏差に、選択された信頼区間に等しい定数を乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
【0799】
B8.3.不確定要素のカットオフを超える値を含む任意のゲノム片が除去される、実施形態B8〜B8.2のいずれか1つの方法。
【0800】
B8.4.選択された信頼区間を表す定数が、信頼区間のカットオフとして選択された標準偏差の数に等しい、実施形態B8.2またはB8.3の方法。
【0801】
B8.5.定数が2であり、この定数が2標準偏差を表す、実施形態B8.4の方法。
【0802】
B8.6.定数が3であり、この定数が3標準偏差を表す、実施形態B8.4の方法。
【0803】
B9.(vi)の後に、不確定要素のカットオフを超えるカウントの不確定要素を含む断片を除去することを含む、実施形態B7〜B8.6のいずれか1つの方法。
【0804】
B10.参照中央カウントプロファイルが、ゲノムまたはその断片全体の参照測定カウントの分布を表す参照測定カウントプロファイルを構築することにより作製される、実施形態B7〜B9のいずれか1つの方法。
【0805】
B11.サンプル正規化されたカウントプロファイルが、(v)の参照サンプルカウントプロファイルから除去されたサンプル未処理カウントプロファイルからゲノム断片を除去し、(vi)で作製された不確定要素を割り当て、参照中央カウントプロファイルに残る断片のカウントの和に対して各残りの断片におけるサンプル測定カウントを正規化することにより各ゲノム断片において作製される、実施形態B7〜B10のいずれか1つの方法。
【0806】
B12.遺伝的変異を検出するための予測値を含むサンプルプロファイルピークを、以下を含むプロセスによりゲノムの位置にて同定する、実施形態B1〜B11のいずれか1つの方法:
(iv)で作製された、ピークを含む正規化されたカウントプロファイルを評価する信頼水準を選択し、
ピークを評価するゲノム断片長の最大値を選択し、
ゲノムの位置の種々の長さのゲノム断片におけるピーク上昇および/またはピーク幅を評価し、
それにより、遺伝的変異を検出するための予測値を含むピークがゲノムの位置にて信頼水準を用いて検出される。
【0807】
B12.1.選択された信頼水準が95%である、実施形態B12の方法。
【0808】
B12.2.選択された信頼水準が99%である、実施形態B12の方法。
【0809】
B12.3.信頼水準が、カウント測定値の品質に基づき選択される、実施形態B12〜B12.2のいずれか1つの方法。
【0810】
B12.4.ピークを評価するゲノム断片長の最大値が、1つまたはそれより多いゲノム断片またはその部分を含む、実施形態B12の方法。
【0811】
B13.さらに、以下を含む、実施形態B12〜B12.4のいずれか1つの方法:
ゲノムの位置を選択し、
ピークを含むp値プロファイルを作製し、
選択された信頼水準より下のp値を含むゲノム断片を除去し、
異なる長さの冗長な、および/またはオーバーラップする断片を除去し、
ピーク端の位置およびそれらの関連の不確定要素を決定し、
無作為に選択されたサンプルに共通して見つかるピークを同定し、かつ場合により除去し、
それにより、遺伝的変異を検出するための予測値を含むピークがゲノムの位置内に検出される。
【0812】
B13.1.異なる長さの冗長な、および/またはオーバーラップする断片の部分が除去される、実施形態B13の方法。
【0813】
B13.2.異なる長さの全ての冗長な、および/またはオーバーラップする断片が除去される、実施形態B13の方法。
【0814】
B14.p値プロファイルが、以下を含むプロセスにより作製される、B13〜B13.2のいずれか1つの方法:
評価のためのゲノムの所望の位置を選択し、
所望のゲノム断片長を選択し、
ゲノムの位置における平均のプロファイル上昇およびサンプル正規化されたカウントプロファイルにおける平均値の関連の誤差を評価し、
選択されたゲノム断片にp値を割り当て、
それによりp値プロファイルが作製される。
【0815】
B14.1.選択されたゲノム断片に割り当てられたp値が式
【0816】
【化110】
[この文献は図面を表示できません]
に従い算出され、式中、x
1およびx
2は平均の値を表し、n
1およびn
2はサンプルサイズを表し、σ
1およびσ
2は標準偏差を表す、実施形態B14の方法。
【0817】
B15.p値を選択されたゲノム断片に割り当てることは、さらに以下を含む、実施形態B14またはB14.1の方法:
(1)開始断片を選択し、
(2)ゲノムの選択された位置における平均の上昇および平均値の標準誤差を決定し、
(3)平均の断片上昇および対応する平均値の標準誤差を評価し、
(4)ゲノムの選択された位置における平均の上昇に対する、および/または所定の上昇期待値に対するZ値を評価し、
(5)1つまたはそれより多い開始断片および/または断片長において1〜4を繰り返し、
(6)選択された開始断片のそれぞれの断片長全体および/または各断片長に対してt検定を行い、
それにより、p値が1つまたはそれより多い選択されたゲノム断片に割り当てられる。
【0818】
B15.1.所定の値が1に等しい、実施形態B15の方法。
【0819】
B15.2.所定の値が1未満である、実施形態B15の方法。
【0820】
B15.3.所定の値が1より大きい、実施形態B15の方法。
【0821】
B15.4.Z値が式
【0822】
【化111】
[この文献は図面を表示できません]
を使用して算出され、式中、Nおよびnは染色体全体および異常の範囲内のビンの数を指し、σ
1およびσ
2は標準偏差を表し、Δ
1は被験体1における遺伝的変異の領域の平均の上昇と、被験体1における対応する染色体の平均の上昇との差を表し、Δ
2は被験体2における遺伝的変異の領域の平均の上昇と、被験体2における対応する染色体の平均の上昇との差を表す、実施形態B15の方法。
【0823】
B16.自己相関における任意選択の補正を含む、実施形態B15〜B15.4のいずれか1つの方法。
【0824】
B17.共通にみつかるピークが、以下を含むプロセスにより同定される、実施形態B13の方法:
同じまたは同様の条件下において測定された複数のサンプルから細胞非含有サンプル核酸リードを得、
試験サンプルのセットを選択し、
ピークを含む参照中央カウントプロファイルを作製し、
試験サンプルのセットのサンプル間に共通して見つかるピークを同定する。
【0825】
B17.1.複数のサンプルが無作為に選択される、実施形態B17の方法。
【0826】
B17.2.試験サンプル間に共通して見つかるピークを同定することが、以下を含む、実施形態B17およびB17.1の方法:
ピークを含む参照中央カウントプロファイル、ピークを含むZ値プロファイル、ピークを含むp値プロファイル、またはそれらの組み合わせを比較し、
各サンプルで共通して同定されたピークを同定する。
【0827】
B18.以下を含むプロセスによりピーク端の位置、ピーク片側公差および関連の不確定要素を決定することを含む、実施形態B1〜B17.2のいずれか1つの方法:
ピークを含むサンプル正規化されたカウントプロファイルおよび/またはピークを含む参照中央カウントプロファイルの1つまたはそれより多い領域を選択し、
正規化プロファイルの第1の導関数および/またはその指数を決定し、
ピーク導関数を特徴付け、
それにより、プロセスが、遺伝的変異を検出する予測値を含むピーク最大値の導関数およびピーク幅の導関数を作製する。
【0828】
B19.2つのサンプルが同じドナーからのものであるどうかを決定する方法であって、以下を含む方法:
1つまたはそれより多いドナーのサンプルからの血中細胞非含有サンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
ピークを含む正規化されたカウントプロファイルを作製し、
各サンプルの予測値を含む正規化されたカウントプロファイルピークを同定し、
1サンプルのピークを別のサンプルからのピークと比較し、
一致するピーク対に基づき、結合確率を決定し、
サンプルが同じドナーからのものである確率を決定し、
それにより、サンプルが同じドナーからのものである確率に対して決定がなされる。
【0829】
B20.さらに、1サンプルのピークを別のサンプルのピークと以下のプロセスの1つ以上を使用して比較することを含む、実施形態B19の方法:
ピーク幅の導関数を使用して、ピークの端が片側公差内で一致するかどうかを決定し、
ピーク最大値の導関数を使用して、ピーク上昇が標準誤差内に一致するかどうかを決定し、
所与のピークの集団の広がりにおいてp値を調節し、
それにより、プロセスの1つ以上を行うことにより、サンプルが同じドナーからのものであるかどうかを決定する。
【0830】
B21.ピーク上昇が、平均値の標準誤差内に一致するかどうかを決定することが、さらにt検定を使用することを含む、実施形態B20の方法。
【0831】
B22.t検定が式
【0832】
【化112】
[この文献は図面を表示できません]
に従い算出され、式中、x
1およびx
2は平均の値を表し、n
1およびn
2がサンプルのサイズを表し、σ
1およびσ
2は標準偏差を表す、実施形態B20およびB21の方法。
【0833】
B23.遺伝的変異を有する場合に以下を含む中央カウントプロファイルの上昇を使用して、サンプルを分類する方法:
核酸を含む試験被験体から、サンプルを得、
サンプルからサンプル核酸を単離し、
単離されたサンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
カウントされ、マッピングされた配列リードから、選択されたゲノム片上昇における中央カウントプロファイルを含む正規化されたカウントプロファイルおよび関連の不確定要素を得、
評価のためのゲノムの位置を選択し、
ゲノムの位置において中央プロファイル上昇および関連の不確定要素を評価し、
上昇中央値が顕著に、所定の値に対して有意に異なるかどうかを決定し、
それにより、上昇中央値が所定の値に対して有意に異なるかどうかを決定することにより、遺伝的変異を有する場合のサンプルかどうかを決定する。
【0834】
B23.1.所定の値が1に等しい、実施形態B23の方法。
【0835】
B23.2.所定の値が1未満である、実施形態B23の方法。
【0836】
B23.3.所定の値が1より大きい、実施形態B23の方法。
【0837】
B24.ゲノムの位置内の予測値を含む正規化されたカウントプロファイルピーク上昇を同定し、同定された場合、ゲノムの位置における中央プロファイル上昇および関連の不確定要素を評価する前に、参照サンプルに存在する欠失および/または重複において補正することを含む、実施形態B23〜B23.3のいずれか1つの方法。
【0838】
B25.遺伝的変異を有する場合のサンプルを、以下を含む予測値を含むピークの面積比を使用して分類する方法:
核酸を含む試験被験体からサンプルを得、
サンプルからサンプル核酸を単離し、
単離されたサンプル核酸から配列リードを得、
ゲノム片に分割されている既知のゲノムに配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
選択されたゲノム片におけるカウントの分布を含む正規化されたカウントプロファイルを得、
評価のためのゲノムの位置を選択し、
予測値を含むピークにおける選択された位置およびピークにおける関連の面積比を評価し、
ピークにおける面積比が所定の値に対して有意に異なるかどうかを決定し、
それにより、ピークにおける面積比が所定の値を顕著に超えるかどうかを決定することにより、サンプルが参照サンプルに対して遺伝的変異を有するかどうかを決定する。
【0839】
B25.1.所定の値が1に等しい、実施形態B25の方法。
【0840】
B25.2.処置の値が1未満である、実施形態B25の方法。
【0841】
B25.3.所定の値が1より大きい、実施形態B25の方法。
【0842】
B26.ゲノムの位置内のピーク面積比を同定し、同定された場合、ゲノムの位置において予測値を含むピークの面積比を評価する前に参照サンプルに存在する欠失および/または重複において補正することを含む、実施形態B25の方法。
【0843】
B27.複数の分類基準を組み合わせることにより遺伝的変異を分類する方法であって、以下を含む方法:
試験被験体および複数の参照被験体から、核酸を含むサンプルを得、
サンプルから、サンプル核酸を単離し、
単離されたサンプル核酸から、配列リードを得、
ゲノム片に分割されている既知のゲノムに、得られた配列リードをマッピングし、
ゲノム片内にマッピングされた配列リードをカウントし、
試験および参照被験体におけるカウントから、正規化されたカウントプロファイルを得、
評価のためにゲノムの位置を選択し、
複数の分類基準を使用して、参照サンプルのゲノムの選択された位置を評価し、
参照サンプルのみが分布する最小のN次元空間を決定し、
複数の分類基準を使用して、試験被験体のゲノムの位置を評価し、
試験被験体におけるN次元点が、参照サンプルのみが分布する空間内にあるかどうかを決定し、
それにより、試験被験体におけるN次元点が参照サンプルのみが分布する空間にあるかどうか決定することにより、試験被験体が遺伝的変異を有するか(is has)どうかを決定する。
【0844】
B27.1.参照被験体が遺伝的変異を担持しないことが知られている、実施形態B27の方法。
【0845】
B27.2.参照被験体が遺伝的変異を担持することが知られている、実施形態B27の方法。
【0846】
B28.参照被験体におけるN次元空間および試験被験体におけるN次元点がプロファイル上昇の中央値、面積比、Z値、フィットさせた倍数性、フィットさせた胎児画分、残差二乗和、およびベイジアンp値から選択される1つまたはそれより多い分類基準を使用して評価される、実施形態B27〜B27.2のいずれか1つの方法。
【0847】
B29.配列リードを得ることは、サンプル核酸に核酸シークエンシングプロセスを行うことを含む、実施形態B1〜B28のいずれか1つの方法。
【0848】
B30.シークエンシングプロセスが、ナノポアシークエンシング、合成によるシークエンシング、パイロシークエンシング、PCRシークエンシング、ジデオキシシークエンシング、またはそれらの組み合わせから選択される方法を含む、実施形態B29の方法。
【0849】
B31.染色体異常断片もしくは胎児異数性または両方の有無を決定することは、成果のグラフ、成果のレポート、成果を含む電子ファイル、成果の2次元表示、成果の3次元表示、またはそれらの組み合わせを医療専門家に提供することを含む、実施形態B0〜B30のいずれか1つの方法。
【0850】
B32.医療専門家が、実施形態B31で提供された成果に基づき提言を提供する、B31の実施形態。
【0851】
B33.サンプル核酸、参照サンプル核酸、または両方が細胞非含有核酸である、実施形態B0〜B32のいずれか1つの方法。
【0852】
B34.細胞非含有核酸が循環無細胞核酸である、実施形態B33の方法。
【0853】
B35.遺伝的変異が病状を決定する、実施形態B0〜B34のいずれか1つの方法。
【0854】
B36.内蔵のコンピュータ読み取り可能なプログラムコードを有するコンピュータ利用可能な媒体、配列受信モジュールを含む個別のソフトウェアモジュールを含むコンピュータ読み取り可能なプログラムコード、ロジック処理モジュールおよびデータ表示組織化モジュールを含むコンピュータプログラム製品であって、コンピュータ読み取り可能プログラムコードが遺伝的変異の有無を同定する方法を実行するよう、実行に適応し、方法が以下を含む、コンピュータプログラム製品:
(a)配列受信モジュールにより、試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)ロジック処理モジュールにより、ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ロジック処理モジュールにより、ゲノム片内にマッピングされた配列リードをカウントし、
(d)ロジック処理モジュールにより、(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)ロジック処理モジュールにより、(d)のサンプル正規化されたカウントプロファイルから、染色体異常断片もしくは胎児異数性または両方の有無を決定し、
(f)ロジック処理モジュールにより決定されたことに対してデータ表示組織化モジュールにより、遺伝的変異の有無を示すデータ表示を組織化する。
【0855】
B37.実施形態B36のコンピュータプログラム製品が格納されるメモリを含む、装置。
【0856】
B38.実施形態B36に明記されたコンピュータプログラム製品の1つまたはそれより多い機能を実行するプロセッサを含む、実施形態B37の装置。
【0857】
B39.核酸シークエンシング装置および処理装置を含むシステムであって、シークエンシング装置がサンプルから配列リードを得、処理装置がシークエンシングデバイスから配列リードを得、以下を含む方法を行うシステム:
(a)試験被験体から、サンプル核酸の配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)で得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)で得られたゲノム片におけるカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(e)(d)のサンプル正規化されたカウントプロファイルから遺伝的変異の有無を決定する。
【0858】
C1.胎児倍数性を決定する方法であって、以下を含む方法:
(a)試験被験体のサンプルから得られた循環無細胞核酸の配列リードに基づき、未処理のカウントプロファイルを作製し、
(b)1例以上の参照被験体のサンプルから得られた循環無細胞核酸の配列リードに基づき、参照中央カウントプロファイルを作製し、
(c)試験被験体の配列リードのカウント合計に対して、(a)から正規化されたカウントプロファイルを作製し、
(d)1例以上の参照被験体の配列リードのカウント合計に対して、(b)から正規化されたカウントプロファイルを作製し、
(e)一部、正規化されたカウントプロファイルおよび倍数性固定値または倍数性の最適値、および胎児画分の固定値または胎児画分の最適値から選択された1つまたはそれより多い仮定値に基づき、残差二乗和を算出し、
(f)(e)の残差二乗和に基づき胎児倍数性を決定する。
【0859】
C1.1.試験被験体および/または1例以上の参照被験体が、ヒト、動物、および植物から選択される、実施形態C1の方法。
【0860】
C1.2.ヒト試験被験体および/または1例以上の参照被験体が、女性、妊娠女性、男性、胎児、または新生児を含む、実施形態C1.1の方法。
【0861】
C1.3.細胞非含有サンプル核酸が、試験および/または参照被験体から得られる血液から単離される、実施形態C1〜C1.2のいずれか1つの方法。
【0862】
C1.4.細胞非含有サンプル核酸が、試験および/または参照被験体から得られた血清から単離される、実施形態C1〜C1.2のいずれか1つの方法。
【0863】
C1.5.細胞非含有サンプル核酸が、試験および/または参照被験体から得られた血漿から単離される、実施形態C1〜C1.2のいずれか1つの方法。
【0864】
C1.6.さらに、(e)の残差二乗和を、測定された胎児画分を使用して算出することを含み、倍数性の固定値が1に等しくない、実施形態C1〜C1.5のいずれか1つの方法。
【0865】
C1.7.残差二乗和の数値に基づき、胎児倍数性を決定することにより、正倍数体または3倍体として胎児を分類することが可能になる、実施形態C1〜C1.6のいずれか1つの方法。
【0866】
C1.8.胎児画分の固定値が測定された胎児画分である、実施形態C1の方法。
【0867】
C1.9.(c)、(d)、または(c)および(d)が、標準偏差の二乗の逆関数を使用して、(a)、(b)、または(a)および(b)で作製されたゲノム片におけるカウントを重み付けすることを含む、実施形態C1〜C1.8のいずれか1つの方法。
【0868】
C2.(a)が以下を含む、実施形態C1〜C1.9のいずれか1つの方法:
(i)試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(ii)ゲノム片に分割されている既知のゲノムに、(i)で得られた配列リードをマッピングし、
(iii)ゲノム片内にマッピングされた配列リードをカウントし、
(iv)ゲノムまたはその断片全体のカウント測定値の分布を表すサンプル測定カウントプロファイルを構築し、
(v)ゲノムまたはその断片全体の非冗長なマッピングされたカウントの合計数に対して、試験被験体サンプルからサンプル測定カウントプロファイルを正規化し、それによりサンプル未処理カウントプロファイルを作製する。
【0869】
C3.(iii)が(ii)のゲノム片にマッピングされた冗長な配列リードを除去した後に行われる、実施形態C2の方法。
【0870】
C4.(b)が以下を含む、実施形態C1の方法:
(1)正倍数体であることが知られている1例以上の参照被験体の血中細胞非含有参照サンプル核酸から配列リードを得、
(2)ゲノム片に分割されている既知のゲノムに、(1)で得られた配列リードをマッピングし、
(3)ゲノム片内にマッピングされた配列リードをカウントし、
(4)(2)のカウントから未処理カウントプロファイルを作製し、
(5)参照サンプルにおける中央値カウントがゼロであるゲノム断片を除去し、
(6)ゲノム片における中央値カウントおよび不確定要素を決定し、
(7)残りの片におけるカウント合計に対してカウントの中央値を正規化し、
(1)〜(7)を行うことにより、参照中央カウントプロファイル、不確定要素プロファイルおよび/または断片識別子を作製する。
【0871】
C4.1.細胞非含有核酸の配列リードが、ポリヌクレオチドフラグメントの形態である、実施形態C1〜C4のいずれか1つの方法。
【0872】
C4.2.ポリヌクレオチドフラグメントが、約20〜約50ヌクレオチド長である、実施形態C4.1の方法。
【0873】
C4.3.ポリヌクレオチドフラグメントが、約30〜約40ヌクレオチド長である、実施形態C4.2の方法。
【0874】
C4.4.既知のゲノムが共通のサイズを共有するゲノム断片に分割される、実施形態C1〜C4.3のいずれか1つの方法。
【0875】
C5.(4)の後に不確定要素のカットオフを選択することを含む、実施形態C4の方法。
【0876】
C5.1.不確定要素のカットオフが、以下を含むプロセスにより得られる、実施形態C5の方法:
(4)で作製されたプロファイルの標準偏差を算出し、
プロファイルの標準偏差に3を乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
【0877】
C5.2.不確定要素のカットオフが、以下を含むプロセスにより得られる、実施形態C5の方法:
(4)で作製されたプロファイルの中央絶対偏差を算出し、
プロファイルの中央絶対偏差に3を乗算し、
それにより、不確定要素のカットオフにおける値を作製する。
【0878】
C6.(7)の後に不確定要素のカットオフを超えるカウント不確定要素を含む断片を除去することを含む、実施形態C4またはC5.2の方法。
【0879】
C7.参照中央カウントプロファイルが、ゲノムまたはその断片全体の参照測定カウントの分布を表す参照測定カウントプロファイルを構築することにより作製される、実施形態C4〜C6のいずれか1つの方法。
【0880】
C8.正規化されたカウントプロファイルが、(5)の参照サンプルカウントプロファイルから除去されたサンプル未処理カウントプロファイルからゲノム断片を除去し、(6)で作製された不確定要素を割り当て、参照中央カウントプロファイルに残る断片のカウントの和に対して、各残りの断片のサンプル測定カウントを正規化することにより各ゲノム断片において作製される、実施形態C4〜C7のいずれか1つの方法。
【0881】
C9.血中細胞非含有サンプル核酸から配列リードを得ることは、以下を含む、実施形態C1〜C8のいずれか1つの方法:
対象から、循環無細胞核酸を含むサンプルを得、サンプルから細胞非含有サンプル核酸を単離し、
被験体から得られたサンプルが血液、血清、血漿またはそれらの組み合わせを含む。
【0882】
C10.残差二乗和を評価することは以下を含む、実施形態C1の方法:
式
【0883】
【化113】
[この文献は図面を表示できません]
の成果値を算出し、
式
【0884】
【化114】
[この文献は図面を表示できません]
の成果値を算出し、
式
【0885】
【化115】
[この文献は図面を表示できません]
を使用して、ファイにおける成果値を算出し、
【0886】
【化116】
[この文献は図面を表示できません]
からの数値を使用し、
ファイが所定の値未満またはそれより大きいかどうかを決定し、
式中、ファイはそれぞれ正倍数体またはトリソミーの成果を仮定して評価される残差二乗和間の差を表し、fは参照中央カウントプロファイルを表し、エプシロンはカウント合計に対して正規化された測定カウントプロファイルを表し、Fは胎児画分を表し、Nはゲノム片の合計数を表し、iは選択されたゲノム片を表し、シグマ(σ)は選択されたゲノム片におけるfと関連する不確定要素を表し、
正倍数体または非正倍数体の決定がファイの数値に基づく。
【0887】
C10.1.胎児画分が測定された胎児画分である、実施形態C10の方法。
【0888】
C10.2.所定の値が0に等しい、実施形態C10またはC10.1の方法。
【0889】
C10.3.所定の値が0より大きい、実施形態C10またはC10.1の方法。
【0890】
C10.4.所定の値が0未満である、実施形態C10またはC10.1の方法。
【0891】
C11.胎児倍数性の最適値が以下を含む、実施形態C1の方法:
式
【0892】
【化117】
[この文献は図面を表示できません]
の成果値を算出し、
式
【0893】
【化118】
[この文献は図面を表示できません]
の成果値を算出し、
式
【0894】
【化119】
[この文献は図面を表示できません]
を使用して、倍数性(例えば、X)における成果値を算出し、
【0895】
【化120】
[この文献は図面を表示できません]
からの数値を使用し、
Xが所定の値未満またはそれより大きいかどうかを決定し、
式中、fは参照中央カウントプロファイルを表し、yはカウント合計に対して正規化された測定カウントプロファイルを表し、Fは胎児画分を表し、Nはゲノム片の合計数を表し、iは選択されたゲノム片を表し、シグマ(σ)は選択されたゲノム片におけるfと関連する不確定要素を表し、エプシロンは正倍数体サンプルから3倍体を区別するカットオフとして使用される正の数であり、
正倍数体または非正倍数体の決定は、Xの数値に基づきなされる。
【0896】
C11.1.所定の値が(1+エプシロン)である、実施形態C11の方法。
【0897】
C11.2.Xが(1+エプシロン)より大きい、実施形態C11またはC11.1の方法。
【0898】
C11.3.Xが(1+エプシロン)未満である、実施形態C11またはC11.1の方法。
【0899】
C11.4.Xが(1+エプシロン)に等しい、実施形態C11またはC11.1の方法。
【0900】
C12.胎児画分の最適値が以下を含む、実施形態C1の方法:
式
【0901】
【化121】
[この文献は図面を表示できません]
の成果値を算出し、
式
【0902】
【化122】
[この文献は図面を表示できません]
の成果値を算出し、
倍数性(例えば、X)における成果値を、式
【0903】
【化123】
[この文献は図面を表示できません]
を使用して算出し、
【0904】
【化124】
[この文献は図面を表示できません]
からの数値を使用し、
フィットさせた胎児画分と、測定された胎児画分との差の絶対値が、測定された胎児画分における誤差における所定の値より大きいかどうかを決定し、
式中、Fは、フィットさせた胎児画分を表し、F
0は胎児画分の測定値を表し、デルタF(例えば、ΔF)は胎児画分の測定値の誤差を表し、Sは計算を簡易化するために導入された補助変数を表し、fは参照中央カウントプロファイルを表し、エプシロンはカウント合計に対して正規化された測定カウントプロファイルを表し、Nはゲノム片の合計数を表し、iは選択されたゲノム片を表し、シグマ(σ)は選択されたゲノム片においてfと関連する不確定要素を表し、
正倍数体または非正倍数体の決定は、Xの数値に基づいてなされる。
【0905】
C12.1.所定の値を、式
【0906】
【化125】
[この文献は図面を表示できません]
を使用して算出する、実施形態C11の方法。
【0907】
C12.2.Xが
【0908】
【化126】
[この文献は図面を表示できません]
より大きい、実施形態C12またはC12.1の方法。
【0909】
C12.3.Xが
【0910】
【化127】
[この文献は図面を表示できません]
未満である、実施形態C12またはC12.1の方法。
【0911】
C12.4.Xが
【0912】
【化128】
[この文献は図面を表示できません]
に等しい、実施形態C12またはC12.1の方法。
【0913】
C13.倍数性の固定値および胎児画分の最適値を仮定する残差二乗和を評価することは以下を含む、実施形態C1の方法:
胎児画分を測定し、
胎児画分の最適値を得、
式
【0914】
【化129】
[この文献は図面を表示できません]
の成果値を算出し、
実施形態C12から得られた値を使用し、
ファイが所定の値未満またはそれより大きいかどうかを決定し、
式中、ファイはそれぞれ正倍数体またはトリソミーの成果を仮定して評価される残差二乗和間の差を表し、F
0は測定された胎児画分を表し、デルタF(例えば、ΔF)は測定された胎児画分の誤差を表し、Sは計算を簡易化するために導入された補助変数を表し、fは参照中央カウントプロファイルを表し、yはカウント合計に対して正規化された測定カウントプロファイルを表し、
正倍数体または非正倍数体の決定がファイの数値に基づきなされる。
【0915】
C13.1.所定の値が0である、実施形態C13の方法。
【0916】
C13.2.ファイが所定の値に等しい、実施形態C13.1の方法。
【0917】
C13.3.ファイが所定の値未満である、実施形態C13.1の方法。
【0918】
C13.4.ファイが所定の値より大きい、実施形態C13.1の方法。
【0919】
C14.非正倍数体の決定がトリソミーの決定である、実施形態C1〜C13.4のいずれか1つの方法。
【0920】
C14.1.非正倍数体の決定が1倍体の決定である、実施形態C1〜C13のいずれか1つの方法。
【0921】
C15.染色体異常断片もしくは胎児異数性または両方の有無を決定することは、成果のグラフ、成果のレポート、成果を含む電子ファイル、成果の2次元表示、成果の3次元表示、またはそれらの組み合わせを医療専門家に提供することを含む、実施形態C1〜C14.1のいずれか1つの方法。
【0922】
C16.医療専門家が、実施形態C15で提供された成果に基づき提言を提供する、C15の実施形態。
【0923】
C17.内蔵のコンピュータ読み取り可能なプログラムコードを有するコンピュータ使用可能な媒体、配列受信モジュールを含む個別のソフトウェアモジュールを含むコンピュータ読み取り可能なプログラムコード、ロジック処理モジュールおよびデータ表示組織化モジュールを含むコンピュータプログラム製品であって、コンピュータ読み取り可能プログラムコードが胎児倍数性を決定する方法を実行するよう、実行に適応し、方法が以下を含む、コンピュータプログラム製品:
(a)ロジック処理モジュールにより、試験被験体のサンプルから配列受信モジュールにより得られた循環無細胞核酸の配列リードに基づき、未処理カウントプロファイルを作製し、
(b)ロジック処理モジュールにより、1例以上の参照被験体のサンプルから配列受信モジュールにより得られた循環無細胞核酸の配列リードに基づき、参照中央カウントプロファイルを作製し、
(c)ロジック処理モジュールにより、試験被験体の配列リードのカウント合計に対して(a)から正規化されたカウントプロファイルを作製し、
(d)ロジック処理モジュールにより、1例以上の参照被験体の配列リードのカウント合計に対して(b)から正規化されたカウントプロファイルを作製し、
(e)ロジック処理モジュールにより、一部、正規化されたカウントプロファイルおよび倍数性の固定値または倍数性の最適値および胎児画分の固定値または胎児画分の最適値から選択された1つまたはそれより多い仮定値に基づき、残差二乗和を算出し、
(f)ロジック処理モジュールにより、(e)の残差二乗和に基づき、胎児倍数性を決定し、
(g)ロジック処理モジュールにより決定されたことに対してデータ表示組織化モジュールにより、染色体異常断片もしくは胎児異数性または両方の有無を示すデータ表示を組織化する。
【0924】
C18.実施形態C17のコンピュータプログラム製品が格納されるメモリを含む、装置。
【0925】
C19.実施形態C17に明記されるコンピュータプログラム製品の1つまたはそれより多い機能を実行するプロセッサを含む、実施形態C18の装置。
【0926】
C20.核酸シークエンシング装置および処理装置を含むシステムであって、シークエンシング装置がサンプルから配列リードを得、処理装置がシークエンシングデバイスから配列リードを得、以下を含む方法を行うシステム:
(a)試験被験体のサンプルから得られた循環無細胞核酸の配列リードに基づき、未処理カウントプロファイルを作製し、
(b)1例以上の参照被験体のサンプルから得られた循環無細胞核酸の配列リードに基づき、参照中央カウントプロファイルを作製し、
(c)試験被験体の配列リードのカウント合計に対して(a)から正規化されたカウントプロファイルを作製し、
(d)1例以上の参照被験体の配列リードのカウント合計に対して(b)から正規化されたカウントプロファイルを作製し、
(e)一部、正規化されたカウントプロファイルおよび倍数性の固定値または倍数性の最適値および胎児画分の固定値または胎児画分の最適値から選択される1つまたはそれより多い仮定値に基づき、残差二乗和を算出し、
(f)(e)の残差二乗和に基づき、胎児倍数性を決定する。
【0927】
D0.染色体異常断片もしくは胎児異数性または両方の有無を同定する方法であって、以下を含む方法:
(a)試験被験体から、循環無細胞核酸を含むサンプルを得、
(b)サンプルから、細胞非含有サンプル核酸を単離し、
(c)細胞非含有サンプル核酸から、配列リードを得、
(d)ゲノム片に分割されている既知のゲノムに、(c)において得られた配列リードをマッピングし、
(e)ゲノム片内にマッピングされた配列リードをカウントし、
(f)スライディングウィンドウ正規化に基づき、(e)のカウントされ、マッピングされた配列リードを正規化し、
(g)(f)の正規化から染色体異常断片もしくは胎児異数性または両方を同定する成果を提供する。
【0928】
D0.1.(f)が以下を含む、実施形態D0の方法:
(i)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
【0929】
D0.11.遺伝的変異、染色体異常断片または胎児異数性の有無を検出する方法であって、以下を含む方法:
(a)参照ゲノムのゲノム片にマッピングされた試験被験体から、血中細胞非含有サンプル核酸の配列リードを得、
(b)スライディングウィンドウ正規化に基づき、ゲノム片について配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(c)(b)のサンプル正規化されたカウントプロファイルから、遺伝的変異、染色体異常断片または胎児異数性の有無を決定する。
【0930】
D0.12.(b)が以下を含む、実施形態D0.11の方法:
(j)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
【0931】
D0.2.(v)が予め定義されたギャップ公差を使用して行われる、実施形態D0.1またはD0.12の方法。
【0932】
D0.3.異常上昇および端を特徴付けることは、疑わしい異常およびそのすぐ周囲に対して積分を使用することを含む、実施形態D0.1、D0.12およびD0.2のいずれか1つの方法。
【0933】
D0.4.(vi)が以下を含む、実施形態D0.1〜D0.3の実施形態にいずれか1つの方法:
(1)候補異常の片側の選択されたゲノム片に線形回帰を行い、
(2)候補異常のもう一方の側の選択されたゲノム片に線形回帰を行い、
(3)候補異常の範囲内の上昇平均値および/または2本の線形回帰線をつなぐ線分の傾きを決定し、
(4)異常の範囲内の上昇平均値と組み合わせて、2本の線形回帰線の切片間の差を決定し、
(1)〜(4)を行うことにより、異常の幅を生成する。
【0934】
D1.染色体異常断片もしくは胎児異数性または両方を同定する方法であって、以下を含む方法:
(a)細胞非含有サンプル核酸から配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)において得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)スライディングウィンドウ正規化に基づき、(c)のカウントされ、マッピングされた配列リードを正規化し、
(e)(d)の正規化から染色体異常断片もしくは胎児異数性または両方を同定する成果を提供する。
【0935】
D1.1.(d)が以下を含む、実施形態D1の方法:
(i)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
【0936】
D1.2.(v)が予め定義されたギャップ公差を使用して行われる、実施形態D0.1またはD1.1の方法。
【0937】
D1.3.異常上昇および端を特徴付けることは、疑わしい異常およびそのすぐ周囲に対して積分を使用することを含む、実施形態D0〜D1.2のいずれか1つの方法。
【0938】
D1.4.(vi)が以下を含む、実施形態D1.1〜D1.3のいずれか1つの方法:
(1)候補異常の片側の選択されたゲノム片に線形回帰を行い、
(2)候補異常のもう一方の側の選択されたゲノム片に線形回帰を行い、
(3)候補異常の範囲内の上昇平均値および/または2本の線形回帰線をつなぐ線分の傾きを決定し、
(4)異常の範囲内の上昇平均値と組み合わせて、2本の線形回帰線の切片間の差を決定し、
(1)〜(4)を行うことにより、異常の幅を生成する。
【0939】
D1.5.(1)〜(4)を約1回〜約100回繰り返す、実施形態D0.4およびD1.4の方法。
【0940】
D1.6.(1)〜(4)を約1回〜約10回繰り返す、実施形態D0.4およびD1.4の方法。
【0941】
D2.細胞非含有サンプル核酸を、試験被験体から得られた血液から単離する、実施形態D0〜D1.6のいずれか1つの方法。
【0942】
D2.1.細胞非含有サンプル核酸を、被験体から得られた血清から単離する、実施形態D0〜D1.6のいずれか1つの方法。
【0943】
D2.2.細胞非含有サンプル核酸を、試験被験体から得られた血漿から単離する、実施形態D0〜D1.6のいずれか1つの方法。
【0944】
D3.試験被験体が、ヒト、動物、および植物から選択される、実施形態D0〜D2.2のいずれか1つの方法。
【0945】
D3.1.ヒト試験被験体が、女性、妊娠女性、男性、胎児、または新生児から選択される、実施形態D3の方法。
【0946】
E0.遺伝的変異を同定する方法であって、以下を含む方法:
(a)試験被験体から、循環無細胞核酸を含むサンプルを得、
(b)サンプルから細胞非含有サンプル核酸を単離し、
(c)細胞非含有サンプル核酸から配列リードを得、
(d)ゲノム片に分割されている既知のゲノムに、(c)において得られた配列リードをマッピングし、
(e)ゲノム片内にマッピングされた配列リードをカウントし、
(f)スライディングウィンドウ正規化に基づき、(e)のカウントされ、マッピングされた配列リードを正規化し、
(g)(f)の正規化から遺伝的変異を同定する成果を提供する。
【0947】
E0.1.(f)が以下を含む、実施形態E0の方法:
(i)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
【0948】
E0.2.(v)が予め定義されたギャップ公差を使用して行われる、実施形態E0.1の方法。
【0949】
E0.3.異常上昇および端を特徴付けることは、疑わしい異常およびそのすぐ周囲に対して積分を使用することを含む、実施形態E0.1またはE0.2の方法。
【0950】
E0.4.(vi)が以下を含む、実施形態E0.1〜E0.3の実施形態にいずれか1つの方法:
(1)候補異常の片側の選択されたゲノム片に線形回帰を行い、
(2)候補異常のもう一方の側の選択されたゲノム片に線形回帰を行い、
(3)候補異常の範囲内の上昇平均値および/または2本の線形回帰線をつなぐ線分の傾きを決定し、
(4)異常の範囲内の上昇平均値と組み合わせて、2本の線形回帰線の切片間の差を決定し、
(1)〜(4)を行うことにより、異常の幅を生成する。
【0951】
E1.遺伝的変異を同定する方法であって、以下を含む方法:
(a)細胞非含有サンプル核酸から配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)において得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)スライディングウィンドウ正規化に基づき、(c)のカウントされ、マッピングされた配列リードを正規化し、
(e)(d)の正規化から遺伝的変異を同定する成果を提供する。
【0952】
E1.1.(d)が以下を含む、実施形態E1の方法:
(i)サンプル正規化されたカウントプロファイルを作製し、
(ii)ノイズゲノム片を除去し、
(iii)上昇平均値から顕著に逸脱するゲノム片を同定し、
(iv)(iii)において同定された孤立のデータ点を除去し、
(v)同じ方向に逸脱する隣り合うデータ点をグループ化し、
(vi)異常上昇および端を特徴付ける。
【0953】
E1.2.(v)が予め定義されたギャップ公差を使用して行われる、実施形態E0.1またはE1.1の方法。
【0954】
E1.3.異常上昇および端を特徴付けることは、疑わしい異常およびそのすぐ周囲に対して積分を使用することを含む、実施形態E0〜E1.2のいずれか1つの方法。
【0955】
E1.4.(vi)が以下を含む、実施形態E1.1〜E1.3のいずれか1つの方法:
(1)候補異常の片側の選択されたゲノム片に線形回帰を行い、
(2)候補異常のもう一方の側の選択されたゲノム片に線形回帰を行い、
(3)候補異常の範囲内の上昇平均値および/または2本の線形回帰線をつなぐ線分の傾きを決定し、
(4)異常の範囲内の上昇平均値と組み合わせて、2本の線形回帰線の切片間の差を決定し、
(1)〜(4)を行うことにより、異常の幅を生成する。
【0956】
E1.5.(1)〜(4)を約1回〜約100回繰り返す、実施形態E0.4およびE1.4の方法。
【0957】
E1.6.(1)〜(4)を約1回〜約10回繰り返す、実施形態E0.4およびE1.4の方法。
【0958】
E2.細胞非含有サンプル核酸を、試験被験体から得られた血液から単離する、実施形態E0〜E1.6のいずれか1つの方法。
【0959】
E2.1.細胞非含有サンプル核酸を、試験被験体から得られた血清から単離する、実施形態E0〜E1.6のいずれか1つの方法。
【0960】
E2.2.細胞非含有サンプル核酸を、試験被験体から得られた血漿から単離する、実施形態E0〜E1.6のいずれか1つの方法。
【0961】
E3.試験被験体が、ヒト、動物、および植物から選択される、実施形態E0〜E2.2のいずれか1つの方法。
【0962】
E3.1.ヒト試験被験体が、女性、妊娠女性、男性、胎児、または新生児から選択される、実施形態E3の方法。
【0963】
E4.細胞非含有サンプル核酸の配列リードが、ポリヌクレオチドフラグメントの形態である、実施形態D0〜E3.1のいずれか1つの方法。
【0964】
E4.1.ポリヌクレオチドフラグメントが、約20〜約50ヌクレオチド長である、実施形態E4の方法。
【0965】
E4.2.ポリヌクレオチドが、約30〜約40ヌクレオチド長である、実施形態E4.1.の方法。
【0966】
F1.表1Bに記載の状態、症候群または異常の有無を検出し、かつ/または決定する方法であって、以下を含む方法:
(a)細胞非含有サンプル核酸から、配列リードを得、
(b)ゲノム片に分割されている既知のゲノムに、(a)において得られた配列リードをマッピングし、
(c)ゲノム片内にマッピングされた配列リードをカウントし、
(d)(c)において得られたカウントおよび/またはその処理された派生物に基づき、表1Bに挙げる状態、症候群または異常の有無を決定する。
【0967】
F1.1.表1Bに挙げる状態、症候群または異常の有無の決定は、表1Bに挙げる状態、症候群または異常の有無を検出することを含む、実施形態F1の方法。
【0968】
F2.(d)がサンプル正規化されたカウントプロファイルを提供し、プロファイルに基づき、成果を決定することを含む、実施形態F1またはF1.1の方法。
【0969】
F3.細胞非含有サンプル核酸が、試験被験体から得られた血液から単離される、実施形態F1〜F2のいずれか1つの方法。
【0970】
F3.1.細胞非含有サンプル核酸が、試験被験体から得られた血清から単離される、実施形態F1〜F3のいずれか1つの方法。
【0971】
F3.2.細胞非含有サンプル核酸が、被験体から得られた血漿から単離される、実施形態F1〜F3のいずれか1つの方法。
【0972】
F4.試験被験体が、ヒト、動物、および植物から選択される、実施形態F1〜F3.2のいずれか1つの方法。
【0973】
F4.1.ヒト試験被験体が、女性、妊娠女性、男性、胎児、または新生児から選択される、実施形態F4の方法。
【0974】
F5.細胞非含有サンプル核酸の配列リードが、ポリヌクレオチドフラグメント形態である、実施形態F1〜F4.1のいずれか1つの方法。
【0975】
F5.1.ポリヌクレオチドフラグメントが、約20〜約50ヌクレオチド長である、実施形態F5の方法。
【0976】
F5.2.ポリヌクレオチドが、約30〜約40ヌクレオチド長である、実施形態F5.1の方法。
【0977】
G1.試験サンプルにおけるバイアスゲノム片レベルの減少を用いて算出する方法であって、以下を含む方法:
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントを得、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(c)(i)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム選択レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルに減少する。
【0978】
G2.参照ゲノムの部分が染色体内にある、実施形態G1の方法。
【0979】
G3.参照ゲノムの部分が染色体の部分内にある、実施形態G1の方法。
【0980】
G4.染色体が第21番染色体である、実施形態G2またはG3の方法。
【0981】
G5.染色体が第18番染色体である、実施形態G2またはG3の方法。
【0982】
G6.染色体が第13番染色体である、実施形態G2またはG3の方法。
【0983】
G7.(b)の前に、参照ゲノムの部分の一部または全てにマッピングされた配列リードのカウントに対する誤差の測定値を算出し、誤差の測定値の閾値に従い、参照のゲノムの特定の部分について配列リードのカウントを除去するか、または重み付けすることを含む、実施形態G1〜G6のいずれか1つの方法。
【0984】
G8.閾値が、第1のゲノム片レベルと、3.5以上の第2のゲノム片レベルとの標準偏差のギャップに従い選択される、実施形態G7の方法。
【0985】
G9.誤差の測定値がR因子である、実施形態G7またはG8の方法。
【0986】
G10.約7%〜約10%のR因子を有する参照ゲノムの部分について配列リードのカウントが、(b)の前に除去される、実施形態G9の方法。
【0987】
G11.(b)のフィットさせた関係がフィットさせた線形関係である、実施形態G1〜G10のいずれか1つの方法。
【0988】
G12.関係の傾きが線形回帰により決定される、実施形態G11の方法。
【0989】
G13.各GCバイアスがGCバイアス係数であり、GCバイアス係数が、(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との線形関係の傾きである、実施形態G11またはG12の方法。
【0990】
G14.(b)のフィットさせた関係がフィットさせた非線形関係である、実施形態G1〜G10のいずれか1つの方法。
【0991】
G15.各GCバイアスがGC曲率の推定値を含む、実施形態G14の方法。
【0992】
G16.(c)のフィットさせた関係が線形である、実施形態G1〜G15のいずれか1つの方法。
【0993】
G17.関係の傾きを線形回帰により決定する、実施形態G16の方法。
【0994】
G18.(b)のフィットさせた関係が線形であり、(c)のフィットさせた関係が線形であり、ゲノム片レベルL
iが式α:
L
i=(m
i−G
iS)I
−1 式α
に従い参照ゲノムの部分のそれぞれにおいて決定され、式中、G
iはGCバイアスであり、Iは(c)のフィットさせた関係の切片であり、Sは(c)の関係の傾きであり、m
iは参照ゲノムの各部分にマッピングされたカウントの測定値であり、iはサンプルである、実施形態G1〜G17のいずれか1つの方法。
【0995】
G19.参照ゲノムの部分の数が約40,000以上の部分である、実施形態G1〜G18のいずれか1つの方法。
【0996】
G20.参照ゲノムの各部分が所定の長さのヌクレオチド配列を含む、実施形態G1〜G19のいずれか1つの方法。
【0997】
G21.所定の長さが約50キロ塩基である、実施形態G20の方法。
【0998】
H1.胎児の異数性の有無を同定する方法であって、以下を含む方法:
(a)胎児を妊娠する妊娠女性からの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントを得、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(c)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供し、
(d)95%以上の感受性および95%以上の特異性の算出されたゲノム片レベルに従い、胎児における異数性の有無を同定する。
【0999】
H2.参照ゲノムの部分が染色体内にある、実施形態H1の方法。
【1000】
H2.1.異数性が染色体異数性である、実施形態H1またはH2の方法。
【1001】
H3.参照ゲノムの部分が染色体の部分内にある、実施形態H1の方法。
【1002】
H3.1.異数性が染色体の部分の異数性である、実施形態H1またはH3の方法。
【1003】
H4.染色体が第21番染色体である、実施形態H2〜H3.1のいずれか1つの方法。
【1004】
H5.染色体が第18番染色体である、実施形態H2〜H3.1のいずれか1つの方法。
【1005】
H6.染色体が第13番染色体である、実施形態H2〜H3.1のいずれか1つの方法。
【1006】
H7.(b)の前に、参照ゲノムの部分の一部または全てにマッピングされた配列リードのカウントに対する誤差の測定値を算出し、誤差の測定値の閾値に従い、参照のゲノムの特定の部分について配列リードのカウントを除去するか、または重み付けすることを含む、実施形態H1〜H6のいずれか1つの方法。
【1007】
H8.閾値が、第1のゲノム片レベルと、3.5以上の第2のゲノム片レベルとの標準偏差のギャップに従い選択される、実施形態H7の方法。
【1008】
H9.誤差の測定値がR因子である、実施形態H7またはH8の方法。
【1009】
H10.約7%〜約10%のR因子を有する参照ゲノムの一部について配列リードのカウントが(b)の前に除去される、実施形態H9の方法。
【1010】
H11.(b)のフィットさせた関係がフィットさせた線形関係である、実施形態H1〜H10のいずれか1つの方法。
【1011】
H12.関係の傾きが線形回帰により決定される、実施形態H11の方法。
【1012】
H13.各GCバイアスがGCバイアス係数であり、GCバイアス係数が、(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との線形関係の傾きである、実施形態H11またはH12の方法。
【1013】
H14.(b)のフィットさせた関係がフィットさせた非線形関係である、実施形態H1〜H10のいずれか1つの方法。
【1014】
H15.各GCバイアスがGC曲率の推定値を含む、実施形態H14の方法。
【1015】
H16.(c)のフィットさせた関係が線形である、実施形態H1〜H15のいずれか1つの方法。
【1016】
H17.関係の傾きが線形回帰により決定される、実施形態H16の方法。
【1017】
H18.(b)のフィットさせた関係が線形であり、(c)のフィットさせた関係が線形であり、ゲノム片レベルL
iが式β:
L
i=(m
i−G
iS)I
−1 式β
に従い参照ゲノム部分のそれぞれにおいて決定され、式中、G
iはGCバイアスであり、Iは(c)のフィットさせた関係の切片であり、Sは(c)の関係の傾きであり、m
iは参照ゲノムの各部分にマッピングされたカウントの測定値であり、iはサンプルである、実施形態H1〜H17のいずれか1つの方法。
【1018】
H19.参照ゲノムの部分の数が約40,000以上の部分である、実施形態H1〜H18のいずれか1つの方法。
【1019】
H20.参照ゲノムの各部分が所定の長さのヌクレオチド配列を含む、実施形態H1〜H19のいずれか1つの方法。
【1020】
H21.所定の長さが約50キロ塩基である、実施形態H20の方法。
【1021】
I1.試験サンプルにおけるバイアスゲノムレベルの減少を用いて算出する方法であって、以下を含む方法:
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントを得、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるマッピング特徴とのフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのバイアス実験値を決定し、
(c)バイアス実験値と、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルで減少する。
【1022】
I2.参照ゲノムの部分が染色体内にある、実施形態I1の方法。
【1023】
I3.参照ゲノムの部分が染色体の部分内にある、実施形態I1の方法。
【1024】
I4.染色体が第21番染色体である、実施形態I2またはI3の方法。
【1025】
I5.染色体が第18番染色体である、実施形態I2またはI3の方法。
【1026】
I6.染色体が第13番染色体である、実施形態I2またはI3の方法。
【1027】
I7.(b)の前に、参照ゲノムの部分の一部または全てにマッピングされた配列リードのカウントに対する誤差の測定値を算出し、誤差の測定値の閾値に従い、参照のゲノムの特定の部分について配列リードのカウントを除去するか、または重み付けすることを含む、実施形態I1〜I6のいずれか1つの方法。
【1028】
I8.閾値が、第1のゲノム片レベルと、3.5以上の第2のゲノム片レベルとの標準偏差のギャップに従い選択される、実施形態I7の方法。
【1029】
I9.誤差の測定値がR因子である、実施形態I7またはI8の方法。
【1030】
I10.約7%〜約10%のR因子を有する参照ゲノムの部分について配列リードのカウントが(b)の前に除去される、実施形態I9の方法。
【1031】
I11.(b)のフィットさせた関係がフィットさせた線形関係である、実施形態I1〜I10のいずれか1つの方法。
【1032】
I12.関係の傾きが線形回帰により決定される、実施形態I11の方法。
【1033】
I13.各バイアス実験値がバイアス実験値係数であり、バイアス実験値係数が、(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるマッピング特徴との線形関係の傾きである、実施形態I11またはI12の方法。
【1034】
I14.(b)のフィットさせた関係がフィットさせた非線形関係である、実施形態I1〜I10のいずれか1つの方法。
【1035】
I15.各バイアス実験値がバイアス実験値曲率の推定値を含む、実施形態I14の方法。
【1036】
I16.(c)のフィットさせた関係が線形である、実施形態I1〜I15のいずれか1つの方法。
【1037】
I17.関係の傾きが線形回帰により決定される、実施形態I16の方法。
【1038】
I18.(b)のフィットさせた関係が線形であり、(c)のフィットさせた関係が線形であり、ゲノム片レベルL
iが式γ:
L
i=(m
i−G
iS)I
−1 式γ
に従い参照ゲノム部分のそれぞれにおいて決定され、式中、G
iはバイアス実験値であり、Iは(c)のフィットさせた関係の切片であり、Sは(c)の関係の傾きであり、m
iは参照ゲノムの各部分にマッピングされたカウント測定値であり、iはサンプルである、実施形態I1〜I17のいずれか1つの方法。
【1039】
I19.参照ゲノムの部分の数が約40,000以上の部分である、実施形態I1〜I18のいずれか1つの方法。
【1040】
I20.マッピング特徴がGC含量であり、バイアス実験値がGCバイアスである、実施形態I1〜I19のいずれか1つの方法。
【1041】
I21.マッピング特徴がマッピング性の測定値であり、バイアス実験値がマッピング性バイアスである、実施形態I1〜I19のいずれか1つの方法。
【1042】
I22.(c)の関係が非線形である、実施形態I1〜I21のいずれか1つの方法。
【1043】
I23.参照ゲノムの各部分が所定の長さのヌクレオチド配列を含む、実施形態I1〜I22のいずれか1つの方法。
【1044】
I24.所定の長さが約50キロ塩基である、実施形態I23の方法。
【1045】
J1.偽陰性の少ない、かつ偽陽性の少ない決定を含む、胎児の染色体異数性の有無を決定する方法であって、以下を含む方法:
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それによりゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第1の上昇が上昇期待範囲のうちの1つにあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節し、
(f)(e)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無を決定する成果が、核酸配列リードから作製される。
【1046】
J1.1.第1の上昇がゲノム片のためのものであり、その一部または全てが、母体もしくは胎児、または母体および胎児のコピー数多型を含む、実施形態J1の方法。
【1047】
J1.2.レベル期待範囲が、母体もしくは胎児、または母体および胎児のホモ接合のコピー数多型および母体もしくは胎児、または母体および胎児のヘテロ接合のコピー数多型に関して決定される、実施形態J1またはJ1.1の方法。
【1048】
J2.胎児の染色体異数性の有無の偽陽性または偽陰性の同定の尤度を減少させる方法であって、以下を含む方法:
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、ゲノム片において正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第1の上昇が上昇期待範囲内にあるときに所定の値により第1の上昇を調節し、それにより、第1の上昇を調節し、
(f)(e)の調節を含むゲノム片におけるゲノム片上昇に従い、胎児の染色体異数性の有無を決定し、それにより染色体異数性の有無を決定する成果が、偽陽性または偽陰性である尤度が減少した核酸配列リードから作製される。
【1049】
J2.1.第2のセットが実質的に母体および/または胎児のコピー数多型を含まない、実施形態J1またはJ2の方法。
【1050】
J3.ゲノム全体またはゲノムのセグメントにおいて配列リードのカウントを得ることを含む、実施形態J1〜J2.1のいずれか1つの方法。
【1051】
J4.性染色体を除くゲノム全体において配列リードのカウントを得ることを含む、実施形態J1〜J3のいずれか1つの方法。
【1052】
J5.カウントが、GC含量、ビンワイズ正規化、GC LOESS、PERUN、GCRM、またはそれらの組み合わせにより、(b)において正規化される、実施形態J1〜J4のいずれか1つの方法。
【1053】
J6.(b)の正規化されたカウントが、正規化モジュールにより提供される、実施形態J1〜J5のいずれか1つの方法。
【1054】
J7.第2の上昇と有意に異なる第1の上昇が、比較モジュールにより(c)において同定される、実施形態J1〜J6のいずれか1つの方法。
【1055】
J8.上昇期待範囲が、範囲設定モジュールにより(d)において決定される、実施形態J1〜J7のいずれか1つの方法。
【1056】
J9.(e)の調節が、調節モジュールにより行われる、実施形態J1〜J8のいずれか1つの方法。
【1057】
J10.(f)の成果が、成果モジュールにより決定される、実施形態J1〜J9のいずれか1つの方法。
【1058】
J11.ゲノム片のセットの上昇が、比較モジュールから正規化モジュールに転送される、実施形態J7〜J10のいずれか1つの方法。
【1059】
J12.第1の上昇が、比較モジュールから調節モジュールに転送される、実施形態J9〜J11のいずれか1つの方法。
【1060】
J13.上昇期待範囲が、範囲設定モジュールから調節モジュールに転送される、実施形態J9〜J12のいずれか1つの方法。
【1061】
J14.調節が、調節モジュールから成果モジュールに転送される、実施形態J10〜J13のいずれか1つの方法。
【1062】
J15.核酸配列リードを得ることを含む、実施形態J1〜J14のいずれか1つの方法。
【1063】
J16.核酸配列リードが、シークエンシングモジュールにより作製される、実施形態J15の方法。
【1064】
J17.核酸シークエンシングリードが、超並列シークエンシング(MPS)により作製される、実施形態J15またはJ16の方法。
【1065】
J18.核酸配列リードを参照ゲノムのゲノム片に、または参照ゲノム全体にマッピングすることを含む、実施形態J15〜J17のいずれか1つの方法。
【1066】
J19.核酸配列リードが、マッピングモジュールによりマッピングされる、実施形態J18の方法。
【1067】
J20.参照ゲノムのゲノム片にマッピングされた核酸配列リードが、カウンティングモジュールによりカウントされる、実施形態J1〜J19のいずれか1つの方法。
【1068】
J21.配列リードが、シークエンシングモジュールからマッピングモジュールに転送される、実施形態J19またはJ20の方法。
【1069】
J22.参照ゲノムのゲノム片にマッピングされた核酸配列リードが、マッピングモジュールからカウンティングモジュールに転送される、実施形態J20またはJ21の方法。
【1070】
J23.参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントが、カウンティングモジュールから正規化モジュールに転送される、実施形態J20〜J22のいずれか1つの方法。
【1071】
J24.装置が、シークエンシングモジュール、マッピングモジュール、カウンティングモジュール、正規化モジュール、比較モジュール、範囲設定モジュール、分類モジュール、調節モジュール、プロットモジュール、成果モジュール、データ表示組織化モジュールまたはロジック処理モジュールの1つ以上を含み、装置が、モジュールの1つ以上からの命令を実行することができるプロセッサを含み、または通信する、実施形態J20〜J23のいずれか1つの方法。
【1072】
J24.1.第1の装置が、正規化モジュール、比較モジュール、範囲設定モジュール、調節モジュール、および成果モジュールのうちの1つまたはそれより多くを含む、実施形態J24の方法。
【1073】
J25.第2の装置が、マッピングモジュールおよびカウンティングモジュールを含む、実施形態J20〜J24.1のいずれか1つの方法。
【1074】
J26.第3の装置がシークエンシングモジュールを含む、実施形態J16〜J25のいずれか1つの方法。
【1075】
J27.(b)の正規化されたカウントが未処理カウントである、実施形態J1〜J26のいずれか1つの方法。
【1076】
J28.(b)の正規化されたカウントがフィルタリングされる、実施形態J1〜J27のいずれか1つの方法。
【1077】
J29.(b)の正規化されたカウントがフィルタリングされない、実施形態J1〜J27のいずれか1つの方法。
【1078】
J30.プロファイルの第1の上昇および第2の上昇が上昇中央値である、実施形態J1〜J29のいずれか1つの方法。
【1079】
J31.第2の上昇が、染色体またはそのセグメントにおけるゲノム片のセットを含む、実施形態J1〜J30のいずれか1つの方法。
【1080】
J32.第1のセット、第2のセット、または第1のセットおよび第2のセットが、2つまたはそれより多いゲノム片を含む、実施形態J1〜J31のいずれか1つの方法。
【1081】
J33.各ゲノム片が連続ヌクレオチドの長さにほぼ等しいものである、実施形態J32の方法。
【1082】
J34.各ゲノム片が約50kbである、実施形態J32またはJ33の方法。
【1083】
J35.各セットが2つまたはそれより多いゲノム片を含む、実施形態J1〜J34のいずれか1つの方法。
【1084】
J36.各セットが20〜40個のゲノム片を含む、実施形態J1〜J35のいずれか1つの方法。
【1085】
J37.成果が、90%と等しいかそれより高い特異性および90%と等しいかそれより高い感度とともに提供される、実施形態J1〜J36のいずれか1つの方法。
【1086】
J38.染色体異数性が染色体の欠失または付加である、実施形態J1〜J37のいずれか1つの方法。
【1087】
J39.染色体異数性がトリソミーである、実施形態J1〜J39のいずれか1つの方法。
【1088】
J40.トリソミーがトリソミー21、トリソミー18、またはトリソミー13である、実施形態J39の方法。
【1089】
J41.不確定値が平均絶対偏差または標準偏差である、実施形態J1〜J40のいずれか1つの方法。
【1090】
J42.不確定値が第1の上昇から得られる、実施形態J1〜J41のいずれか1つの方法。
【1091】
J43.不確定値が第2の上昇から得られる、実施形態J1〜J41のいずれか1つの方法。
【1092】
J43.1.不確定値が、第1の上昇および第2の上昇から得られる、実施形態J1〜J41のいずれか1つの方法。
【1093】
J44.(d)において上昇期待範囲を決定することが、3回の不確定値による、実施形態J1〜J43のいずれか1つの方法。
【1094】
J45.ヘテロ接合のコピー数多型またはホモ接合のコピー数多型が、母体もしくは胎児、または母体および胎児の欠失あるいは母体もしくは胎児、または母体よび胎児の重複である、実施形態J1〜J44のいずれか1つの方法。
【1095】
J46.第2の上昇が参照上昇である、実施形態J1〜J45のいずれか1つの方法。
【1096】
J47.第1の上昇および第2の上昇が参照上昇に対して正規化される、実施形態J46の方法。
【1097】
J48.正規化された参照値(NRV)が、参照上昇に対して正規化される第2のレベルに従い決定される、実施形態J47の方法。
【1098】
J49.コピー数多型についての上昇期待値が、NRVおよびコピー数多型の上昇期待定数に従い決定される、実施形態J48の方法。
【1099】
J50.NRVに上昇期待値定数が乗算される、実施形態J49の方法。
【1100】
J51.ホモ接合重複における上昇期待定数が2であり、ヘテロ接合重複が1.5であり、ヘテロ接合欠失が0.5であり、ホモ接合欠失がゼロである、実施形態J49またはJ50の方法。
【1101】
J52.母体および/または胎児のコピー数多型の非存在における上昇期待定数が1である、実施形態J49〜J51のいずれか1つの方法。
【1102】
J53.上昇期待範囲が、コピー数多型および不確定値における上昇期待値に従い決定される、実施形態J49〜J52のいずれか1つの方法。
【1103】
J54.第1の上昇の調節が、所定の値を第1の上昇から減算することを含む、実施形態J1〜J53のいずれか1つの方法。
【1104】
J55.ゲノム片の第1のセットにマッピングされた1つまたはそれより多い配列リードが、母体もしくは胎児、または母体および胎児の重複を含む、実施形態J54の方法。
【1105】
J56.第1の上昇の調節が、所定の値を第1の上昇に加算することを含む、実施形態J1〜J53のいずれか1つの方法。
【1106】
J56.1.所定の値が、コピー数多型において予め決定される所定の調節値(PAV)である、実施形態J1〜J56のいずれか1つの方法。
【1107】
J56.2.コピー数多型についてのPAVが、コピー数多型についての上昇期待値およびコピー数多型についてのPAV係数に従い決定される、実施形態J56.1の方法。
【1108】
J56.3.ホモ接合重複におけるPAV係数が−1であり、ヘテロ接合重複が−0.5であり、ヘテロ接合欠失が0.5であり、ホモ接合欠失が1である、実施形態J56.2の方法。
【1109】
J56.4.PAV係数が、PAV係数を乗算したPAVの積である、実施形態J56.2またはJ56.3の方法。
【1110】
J57.ゲノム片の第1のセットにマッピングされた配列リードのうちの1つまたはそれより多くが、母体もしくは胎児、または母体および胎児の欠失を含む、J56の方法。
【1111】
J58.妊娠女性からの循環無細胞核酸の配列リードが、妊娠女性から得られたサンプルからのものである、実施形態J1〜J57のいずれか1つの方法。
【1112】
J59.サンプルが妊娠女性からの血液を含む、実施形態J58の方法。
【1113】
J60.サンプルが妊娠女性からの血漿を含む、実施形態J58の方法。
【1114】
J61.サンプルが妊娠女性からの血清を含む、実施形態J58の方法。
【1115】
J62.プロファイルが染色体またはそのセグメントのプロファイルである、実施形態J1〜J61のいずれか1つの方法。
【1116】
J63.プロファイルが複数の第1の上昇を含む、実施形態J1〜J62のいずれか1つの方法。
【1117】
J64.複数の第1の上昇において、(c)、(d)および(e)を繰り返すことを含む、実施形態J1〜J63のいずれか1つの方法。
【1118】
J65.ゲノム片の第1のセットが、ゲノム片の第2のセットと異なり、かつ/または区別される、実施形態J1〜J64のいずれか1つの方法。
【1119】
J66.ゲノム片の第2のセットがゲノム片の第1のセットを含む、実施形態J1〜J64のいずれか1つの方法。
【1120】
J67.第2の上昇が、ゲノム片の第2のセットにおける上昇の平均値、中間値または中央値である、実施形態J66の方法。
【1121】
J68.不確定値が第2の上昇の平均値、中間値または中央値から得られ、不確定値が標準偏差またはMADである、実施形態J67の方法。
【1122】
J69.第2の上昇が染色体全体を表し、第1の上昇が母体もしくは胎児、または母体および胎児のコピー数多型を表す、実施形態J1〜J68のいずれか1つの方法。
【1123】
K1.胎児を妊娠する妊娠女性のゲノム内の母体および/または胎児のコピー数多型を同定する方法であって、以下を含む方法:
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それによりゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)上昇期待範囲の1つに基づき、ゲノム片内の母体および/または胎児のコピー数多型を同定し、それにより母体および/または胎児のコピー数多型が核酸配列リードから同定される。
【1124】
K1.1.第1の上昇がゲノム片のためのものであり、その一部または全てが母体もしくは胎児、または母体および胎児のコピー数多型を含む、実施形態K1の方法。
【1125】
K1.2.レベル期待範囲が、母体もしくは胎児、または母体および胎児のホモ接合のコピー数多型および母体もしくは胎児、または母体および胎児のヘテロ接合のコピー数多型に関して決定される、実施形態K1またはK1.1の方法。
【1126】
K2.第2のセットが実質的にコピー数多型を含まない、実施形態K1〜K1.2のいずれか1つの方法。
【1127】
K3.第1の上昇が上昇期待範囲内にあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節することを含み、母体および/または胎児のコピー数多型がゲノム片の第1のセット内で同定される、実施形態K1またはK2の方法。
【1128】
K3.1.ゲノム全体またはゲノムのセグメントについて配列リードのカウントを得ることを含む、実施形態K1〜K3のいずれか1つの方法。
【1129】
K4.性染色体を除くゲノム全体について配列リードのカウントを得ることを含む、実施形態K1〜K3.1のいずれか1つの方法。
【1130】
K5.カウントが、GC含量、ビンワイズ正規化、GC LOESS、PERUN、GCRM、またはそれらの組み合わせにより(b)において正規化される、実施形態K1〜K4のいずれか1つの方法。
【1131】
K6.(b)において正規化されたカウントが、正規化モジュールにより提供される、実施形態K1〜K5のいずれか1つの方法。
【1132】
K7.第2の上昇と有意に異なる第1の上昇が、比較モジュールにより(c)において同定される、実施形態K1〜K6のいずれか1つの方法。
【1133】
K8.上昇期待範囲が、範囲設定モジュールにより(d)において決定される、実施形態K1〜K7のいずれか1つの方法。
【1134】
K9.調節が調節モジュールにより行われる、実施形態K3〜K8のいずれか1つの方法。
【1135】
K10.(e)において同定することは、分類モジュールにより決定される、実施形態K1〜A9のいずれか1つの方法。
【1136】
K11.ゲノム片のセットの上昇が、正規化モジュールから比較モジュールに転送される、実施形態K7〜K10のいずれか1つの方法。
【1137】
K12.第1の上昇が、比較モジュールから調節モジュールに転送される、実施形態K9〜K11のいずれか1つの方法。
K13.上昇期待範囲が、範囲設定モジュールから調節モジュールに転送される、実施形態K9〜K12のいずれか1つの方法。
【1138】
K14.調節が、調節モジュールから分類モジュールに転送される、実施形態K10〜K13のいずれか1つの方法。
【1139】
K15.核酸配列リードを得ることを含む、実施形態K1〜K14のいずれか1つの方法。
【1140】
K16.核酸配列リードが、シークエンシングモジュールにより作製される、実施形態K15の方法。
【1141】
K17.核酸シークエンシングリードが、超並列シークエンシング(MPS)により作製される、実施形態K15またはK16の方法。
【1142】
K18.核酸配列リードを、参照ゲノムのゲノム片に、または参照ゲノム全体にマッピングすることを含む、実施形態K15〜K17のいずれか1つの方法。
【1143】
K19.核酸配列リードがマッピングモジュールによりマッピングされる、実施形態K18の方法。
【1144】
K20.参照ゲノムのゲノム片にマッピングされた核酸配列リードが、カウンティングモジュールによりカウントされる、実施形態K1〜K19のいずれか1つの方法。
【1145】
K21.配列リードが、シークエンシングモジュールからマッピングモジュールに転送される、実施形態K19またはK20の方法。
【1146】
K22.参照ゲノムのゲノム片にマッピングされた核酸配列リードが、マッピングモジュールからカウンティングモジュールに転送される、実施形態K20またはK21の方法。
【1147】
K23.参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントが、カウンティングモジュールから正規化モジュールに転送される、実施形態K20〜K22のいずれか1つの方法。
【1148】
K24.装置が、シークエンシングモジュール、マッピングモジュール、カウンティングモジュール、正規化モジュール、比較モジュール、範囲設定モジュール、分類モジュール、調節モジュール、プロットモジュール、成果モジュール、データ表示組織化モジュールまたはロジック処理モジュールの1つ以上を含み、装置がモジュールの1つ以上からの命令を実行することができるプロセッサを含み、または通信する、実施形態K20〜K23のいずれか1つの方法。
【1149】
K24.1.第1の装置が、正規化モジュール、比較モジュール、範囲設定モジュール、調節モジュールおよび成果モジュールのうちの1つまたはそれより多くを含む、実施形態K24の方法。
【1150】
K25.第2の装置が、マッピングモジュールおよびカウンティングモジュールを含む、実施形態K20〜K24.1のいずれか1つの方法。
【1151】
K26.第3の装置がシークエンシングモジュールを含む、実施形態K16〜K25のいずれか1つの方法。
【1152】
K27.(b)において正規化されたカウントが未処理カウントである、実施形態K1〜K26のいずれか1つの方法。
【1153】
K28.(b)において正規化されたカウントがフィルタリングされる、実施形態K1〜K27のいずれか1つの方法。
【1154】
K29.(b)において正規化されたカウントがフィルタリングされない、実施形態K1〜K27のいずれか1つの方法。
【1155】
K30.プロファイルの第1の上昇および第2の上昇が、上昇中央値である、実施形態K1〜K29のいずれか1つの方法。
【1156】
K31.ゲノム片について正規化されたカウントのプロファイルが、染色体またはそのセグメントのプロファイルである、実施形態K1〜K30のいずれか1つの方法。
【1157】
K32.第1のセット、第2のセット、または第1のセットおよび第2のセットが、2つまたはそれより多いゲノム片を含む、実施形態K1〜K31のいずれか1つの方法。
【1158】
K33.各ゲノム片が連続ヌクレオチドの長さにほぼ等しいものである、実施形態K32の方法。
【1159】
K34.各ゲノム片が約50kbである、実施形態K32またはK33の方法。
【1160】
K35.各セットが2つまたはそれより多いゲノム片を含む、実施形態K1〜K34のいずれか1つの方法。
【1161】
K36.各セットが20〜40個のゲノム片を含む、実施形態K1〜K35のいずれか1つの方法。
【1162】
K37.(e)において同定されることは、90%と等しいかそれより高い特異性および90%と等しいかそれより高い感度とともに提供される、実施形態K1〜K36のいずれか1つの方法。
【1163】
K38.プロファイルが異数性を含む、実施形態K1〜K37のいずれか1つの方法。
【1164】
K39.異数性がトリソミーである、実施形態K38の方法。
【1165】
K40.トリソミーがトリソミー21、トリソミー18、またはトリソミー13である、実施形態K39の方法。
【1166】
K41.不確定値が平均絶対偏差または標準偏差である、実施形態K1〜K40のいずれか1つの方法。
【1167】
K42.不確定値が第1の上昇から得られる、実施形態K1〜K41のいずれか1つの方法。
【1168】
K43.不確定値が第2の上昇から得られる、実施形態K1〜K41のいずれか1つの方法。
【1169】
K43.1.不確定値が、第1の上昇および第2の上昇から得られる、実施形態K1〜K41のいずれか1つの方法。
【1170】
K44.(d)の上昇期待範囲を決定することは3回の不確定値による、実施形態K1〜K43のいずれか1つの方法。
【1171】
K45.ヘテロ接合のコピー数多型またはホモ接合のコピー数多型が、母体もしくは胎児、または母体および胎児の欠失あるいは母体もしくは胎児、または母体よび胎児の重複である、実施形態K1〜K44のいずれか1つの方法。
【1172】
K46.第2の上昇が参照上昇である、実施形態K1〜K45のいずれか1つの方法。
【1173】
K47.第1の上昇および第2の上昇が参照上昇に対して正規化される、実施形態K46の方法。
【1174】
K48.正規化された参照値(NRV)は、参照上昇に対して正規化される第2のレベルに従い決定される、実施形態K47の方法。
【1175】
K49.コピー数多型についての上昇期待値は、NRVおよびコピー数多型の上昇期待定数に従い決定される、実施形態K48の方法。
【1176】
K50.NRVに上昇期待定数が乗算される、実施形態K49の方法。
【1177】
K51.ホモ接合重複における上昇期待定数が2であり、ヘテロ接合重複が1.5であり、ヘテロ接合欠失が0.5であり、ホモ接合欠失がゼロである、実施形態K49またはK50の方法。
【1178】
K52.母体および/または胎児のコピー数多型の非存在における上昇期待定数が1である、実施形態K49〜K51のいずれか1つの方法。
【1179】
K53.上昇期待範囲が、コピー数多型および不確定値における上昇期待値に従い決定される、実施形態K49〜K52のいずれか1つの方法。
【1180】
K54.第1の上昇の調節が、所定の値を第1の上昇から減算することを含む、実施形態K3〜K54のいずれか1つの方法。
【1181】
K55.ゲノム片の第1のセットにマッピングされた1つまたはそれより多い配列リードが、母体もしくは胎児、または母体および胎児の重複を含む、実施形態K54の方法。
【1182】
K56.第1の上昇の調節が、所定の値を第1の上昇に加算することを含む、実施形態K3〜K53のいずれか1つの方法。
【1183】
K56.1.所定の値が、コピー数多型において予め決定される所定の調節値(PAV)である、実施形態K1〜K56のいずれか1つの方法。
【1184】
K56.2.コピー数多型についてのPAVが、コピー数多型についての上昇期待値およびコピー数多型についてのPAV係数に従い決定される、実施形態K56.1の方法。
【1185】
K56.3.ホモ接合重複におけるPAV係数が−1であり、ヘテロ接合重複が−0.5であり、ヘテロ接合欠失が0.5であり、ホモ接合欠失が1である、実施形態K56.2の方法。
【1186】
K56.4.PAV係数が、PAV係数を乗算したPAVの積である、実施形態K56.2またはK56.3の方法。
【1187】
K57.ゲノム片の第1のセットにマッピングされた配列リードのうちの1つまたはそれより多くが、母体もしくは胎児、または母体および胎児の欠失を含む、K56の方法。
【1188】
K58.妊娠女性からの循環無細胞核酸の配列リードが、妊娠女性から得られたサンプルからのものである、実施形態K1〜K57のいずれか1つの方法。
【1189】
K59.サンプルが妊娠女性からの血液を含む、実施形態K58の方法。
【1190】
K60.サンプルが妊娠女性からの血漿を含む、実施形態K58の方法。
【1191】
K61.サンプルが妊娠女性からの血清を含む、実施形態K58の方法。
【1192】
K62.プロファイルが染色体またはそのセグメントのプロファイルである、実施形態K1〜K61のいずれか1つの方法。
【1193】
K63.プロファイルが複数の第1の上昇を含む、実施形態K1〜K62のいずれか1つの方法。
【1194】
K64.複数の第1の上昇において、(c)、(d)および(e)を繰り返すことを含む、実施形態K1〜K63のいずれか1つの方法。
【1195】
K65.ゲノム片の第1のセットが、ゲノム片の第2のセットと異なり、かつ/または区別される、実施形態K1〜K64のいずれか1つの方法。
【1196】
K66.ゲノム片の第2のセットがゲノム片の第1のセットを含む、実施形態K1〜K64のいずれか1つの方法。
【1197】
K67.第2の上昇が、ゲノム片の第2のセットにおける上昇の平均値、中間値または中央値である、実施形態K66の方法。
【1198】
K68.不確定値が、第2の上昇の平均値、中間値または中央値から得られ、不確定値が標準偏差またはMADである、実施形態K67の方法。
【1199】
K69.第2の上昇が染色体全体を表し、第1の上昇が母体もしくは胎児、または母体および胎児のコピー数多型を表す、実施形態K1〜K68のいずれか1つの方法。
【1200】
L1.偽陰性が少なく、偽陽性が少ない決定を含む、胎児の染色体異数性の有無を決定する方法であって、以下を含む方法:
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それによりゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第2の上昇に従い第1の上昇を調節し、それにより第1の上昇を調節し、
(f)(e)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無を決定する成果が、核酸配列リードから作製される、。
【1201】
L2.胎児の染色体異数性の有無の偽陽性または偽陰性決定の尤度を減少させる方法であって、以下を含む方法:
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それによりゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第2の上昇に従い第1の上昇を調節し、それにより第1の上昇を調節し、
(f)(e)の調節を含むゲノム片のゲノム片上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無を決定する成果が、偽陽性または偽陰性である尤度が少ない核酸配列リードから作製される。
【1202】
L2.1.第1の上昇がゲノム片のためのものであり、その一部または全てが母体もしくは胎児、または母体および胎児のコピー数多型を含む、実施形態L1またはL2の方法。
【1203】
L2.2.レベル期待範囲が、母体もしくは胎児、または母体および胎児のホモ接合のコピー数多型および母体もしくは胎児、または母体および胎児のヘテロ接合のコピー数多型に関して決定される、実施形態L1からL2.1のいずれか1つの方法。
【1204】
L3.第2のセットが実質的に母体および/または胎児のコピー数多型を含まない、実施形態L1〜L2.2のいずれか1つの方法。
【1205】
L4.第1のレベルが第2のレベルに調節される、実施形態L1〜L3のいずれか1つの方法。
【1206】
L4.1.第1の上昇が上昇期待範囲内にあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節することを含み、母体および/または胎児のコピー数多型がゲノム片の第1のセット内で同定される、実施形態L1〜L4のいずれか1つの方法。
【1207】
L4.2.ゲノム全体またはゲノムのセグメントについて配列リードのカウントを得ることを含む、実施形態L1〜L4.1のいずれか1つの方法。
【1208】
L4.3.性染色体を除くゲノム全体について配列リードのカウントを得ることを含む、実施形態L1〜L4.2のいずれか1つの方法。
【1209】
L5.カウントが、GC含量、ビンワイズ正規化、GC LOESS、PERUN、GCRM、またはそれらの組み合わせにより、(b)において正規化される、実施形態L1〜L4.3のいずれか1つの方法。
【1210】
L6.(b)の正規化されたカウントが、正規化モジュールにより提供される、実施形態L1〜L5のいずれか1つの方法。
【1211】
L7.第2の上昇と有意に異なる第1の上昇が、比較モジュールにより(c)において同定される、実施形態L1〜L6のいずれか1つの方法。
【1212】
L8.上昇期待範囲が、範囲設定モジュールにより(d)において決定される、実施形態L1〜L7のいずれか1つの方法。
【1213】
L9.調節が調節モジュールにより行われる、実施形態L3〜L8のいずれか1つの方法。
【1214】
L10.(e)において同定することは、分類モジュールにより決定される、実施形態L1〜A9のいずれか1つの方法。
【1215】
L11.ゲノム片のセットの上昇が、正規化モジュールから比較モジュールに転送される、実施形態L7〜L10のいずれか1つの方法。
【1216】
L12.第1の上昇が、比較モジュールから調節モジュールに転送される、実施形態L9〜L11のいずれか1つの方法。
【1217】
L13.上昇期待範囲が、範囲設定モジュールから調節モジュールに転送される、実施形態L9〜L12のいずれか1つの方法。
【1218】
L14.調節が、調節モジュールから分類モジュールに転送される、実施形態L10〜L13のいずれか1つの方法。
【1219】
L15.核酸配列リードを得ることを含む、実施形態L1〜L14のいずれか1つの方法。
【1220】
L16.核酸配列リードが、シークエンシングモジュールにより作製される、実施形態L15の方法。
【1221】
L17.核酸シークエンシングリードが超並列シークエンシング(MPS)により作製される、実施形態L15またはL16の方法。
【1222】
L18.核酸配列リードを参照ゲノムのゲノム片に、または参照ゲノム全体にマッピングすることを含む、実施形態L15〜L17のいずれか1つの方法。
【1223】
L19.核酸配列リードがマッピングモジュールによりマッピングされる、実施形態L18の方法。
【1224】
L20.参照ゲノムのゲノム片にマッピングされた核酸配列リードが、カウンティングモジュールによりカウントされる、実施形態L1〜L19のいずれか1つの方法。
【1225】
L21.配列リードが、シークエンシングモジュールからマッピングモジュールに転送される、実施形態L19またはL20の方法。
【1226】
L22.参照ゲノムのゲノム片にマッピングされた核酸配列リードが、マッピングモジュールからカウンティングモジュールに転送される、実施形態L20またはL21の方法。
【1227】
L23.参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントが、カウンティングモジュールから正規化モジュールに転送される、実施形態L20〜L22のいずれか1つの方法。
【1228】
L24.装置が、シークエンシングモジュール、マッピングモジュール、カウンティングモジュール、正規化モジュール、比較モジュール、範囲設定モジュール、分類モジュール、調節モジュール、プロットモジュール、成果モジュール、データ表示組織化モジュールまたはロジック処理モジュールの1つ以上を含み、装置がモジュールの1つ以上からの命令を実行することができるプロセッサを含み、または通信する、実施形態L20〜L23のいずれか1つの方法。
【1229】
L24.1.第1の装置が、正規化モジュール、比較モジュール、範囲設定モジュール、調節モジュールおよび成果モジュールのうちの1つまたはそれより多くを含む、実施形態L24の方法。
【1230】
L25.第2の装置が、マッピングモジュールおよびカウンティングモジュールを含む、実施形態L20〜L24.1のいずれか1つの方法。
【1231】
L26.第3の装置がシークエンシングモジュールを含む、実施形態L16〜L25のいずれか1つの方法。
【1232】
L27.(b)で正規化されたカウントが未処理カウントである、実施形態L1〜L26のいずれか1つの方法。
【1233】
L28.(b)で正規化されたカウントがフィルタリングされる、実施形態L1〜L27のいずれか1つの方法。
【1234】
L29.(b)で正規化されたカウントがフィルタリングされない、実施形態L1〜L27のいずれか1つの方法。
【1235】
L30.プロファイルの第1の上昇および第2の上昇が、上昇中央値である、実施形態L1〜L29のいずれか1つの方法。
【1236】
L31.ゲノム片について正規化されたカウントのプロファイルが、染色体またはそのセグメントのプロファイルである、実施形態L1〜L30のいずれか1つの方法。
【1237】
L32.第1のセット、第2のセット、または第1のセットおよび第2のセットが、2つまたはそれより多いゲノム片を含む、実施形態L1〜L31のいずれか1つの方法。
【1238】
L33.各ゲノム片が連続ヌクレオチドの長さにほぼ等しいものである、実施形態L32の方法。
【1239】
L34.各ゲノム片が約50kbである、実施形態L32またはL33の方法。
【1240】
L35.各セットが2つまたはそれより多いゲノム片を含む、実施形態L1〜L34のいずれか1つの方法。
【1241】
L36.各セットが20〜40個のゲノム片を含む、実施形態L1〜L35のいずれか1つの方法。
【1242】
L37.(e)において同定されることが、90%と等しいかそれより高い特異性および90%と等しいかそれより高い感度とともに提供される、実施形態L1〜L36のいずれか1つの方法。
【1243】
L38.プロファイルが異数性を含む、実施形態L1〜L37のいずれか1つの方法。
【1244】
L39.異数性がトリソミーである、実施形態L38の方法。
【1245】
L40.トリソミーがトリソミー21、トリソミー18、またはトリソミー13である、実施形態L39の方法。
【1246】
L41.不確定値が平均絶対偏差または標準偏差である、実施形態L1〜L40のいずれか1つの方法。
【1247】
L42.不確定値が第1の上昇から得られる、実施形態L1〜L41のいずれか1つの方法。
【1248】
L43.不確定値が第2の上昇から得られる、実施形態L1〜L41のいずれか1つの方法。
【1249】
L43.1.不確定値が、第1の上昇および第2の上昇から得られる、実施形態L1〜L41のいずれか1つの方法。
【1250】
L44.(d)において上昇期待範囲を決定することが、3回の不確定要素による、実施形態L1〜L43のいずれか1つの方法。
【1251】
L45.ヘテロ接合のコピー数多型またはホモ接合のコピー数多型は、母体もしくは胎児、または母体および胎児の欠失あるいは母体もしくは胎児、または母体よび胎児の重複である、実施形態L1〜L44のいずれか1つの方法。
【1252】
L46.第2の上昇が参照上昇である、実施形態L1〜L45のいずれか1つの方法。
【1253】
L47.第1の上昇および第2の上昇が、参照上昇に対して正規化される、実施形態L46の方法。
【1254】
L48.正規化された参照値(NRV)は、参照上昇に対して正規化される第2のレベルに従い決定される、実施形態L47の方法。
【1255】
L49.コピー数多型についての上昇期待値は、NRVおよびコピー数多型の上昇期待定数に従い決定される、実施形態L48の方法。
【1256】
L50.NRVに上昇期待定数が乗算される、実施形態L49の方法。
【1257】
L51.ホモ接合重複における上昇期待定数が2であり、ヘテロ接合重複が1.5であり、ヘテロ接合欠失が0.5であり、ホモ接合欠失がゼロである、実施形態L49またはL50の方法。
【1258】
L52.母体および/または胎児のコピー数多型の非存在における上昇期待定数が1である、実施形態L49〜L51のいずれか1つの方法。
【1259】
L53.上昇期待範囲が、コピー数多型および不確定値における上昇期待値に従い決定される、実施形態L49〜L52のいずれか1つの方法。
【1260】
L54.第1の上昇の調節が、所定の値を第1の上昇から減算することを含む、実施形態L3〜L54のいずれか1つの方法。
【1261】
L55.ゲノム片の第1のセットにマッピングされた1つまたはそれより多い配列リードが、母体もしくは胎児、または母体および胎児の重複を含む、実施形態L54の方法。
【1262】
L56.第1の上昇の調節が、所定の値を第1の上昇に加算することを含む、実施形態L3〜L53のいずれか1つの方法。
【1263】
L56.1.所定の値が、コピー数多型において予め決定される所定の調節値(PAV)である、実施形態L1〜L56のいずれか1つの方法。
【1264】
L56.2.コピー数多型についてのPAVが、コピー数多型についての上昇期待値およびコピー数多型についてのPAV係数に従い決定される、実施形態L56.1の方法。
【1265】
L56.3.ホモ接合重複におけるPAV係数が−1であり、ヘテロ接合重複が−0.5であり、ヘテロ接合欠失が0.5であり、ホモ接合欠失が1である、実施形態L56.2の方法。
【1266】
L56.4.PAV係数が、PAV係数を乗算したPAVの積である、実施形態L56.2またはL56.3の方法。
【1267】
L57.ゲノム片の第1のセットにマッピングされた配列リードのうちの1つまたはそれより多くが、母体もしくは胎児、または母体および胎児の欠失を含む、実施形態L56の方法。
【1268】
L58.妊娠女性からの循環無細胞核酸の配列リードが、妊娠女性から得られたサンプルからのものである、実施形態L1〜L57のいずれか1つの方法。
【1269】
L59.サンプルが妊娠女性からの血液を含む、実施形態L58の方法。
【1270】
L60.サンプルが妊娠女性からの血漿を含む、実施形態L58の方法。
【1271】
L61.サンプルが妊娠女性からの血清を含む、実施形態L58の方法。
【1272】
L62.プロファイルが、染色体またはそのセグメントのプロファイルである、実施形態L1〜L61のいずれか1つの方法。
【1273】
L63.プロファイルが複数の第1の上昇を含む、実施形態L1〜L58のいずれか1つの方法。
【1274】
L64.複数の第1の上昇において、(c)、(d)および(e)を繰り返すことを含む、実施形態L1〜L59のいずれか1つの方法。
【1275】
L65.ゲノム片の第1のセットが、ゲノム片の第2のセットと異なり、かつ/または区別される、実施形態L1〜L64のいずれか1つの方法。
【1276】
L66.ゲノム片の第2のセットがゲノム片の第1のセットを含む、実施形態L1〜L64のいずれか1つの方法。
【1277】
L67.第2の上昇が、ゲノム片の第2のセットにおける上昇の平均値、中間値または中央値である、実施形態L66の方法。
【1278】
L68.不確定値が第2の上昇の平均値、中間値または中央値から得られ、不確定値が標準偏差またはMADである、実施形態L67の方法。
【1279】
L69.第2の上昇が染色体全体を表し、第1の上昇が母体もしくは胎児、または母体および胎児のコピー数多型を表す、実施形態L1〜L68のいずれか1つの方法。
【1280】
M1.1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは試験サンプルからの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)(i)GCバイアスと、(ii)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される、システム。
【1281】
M2.1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは試験サンプルからの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)(i)GCバイアスと、(ii)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される、装置。
【1282】
M3.コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントにアクセスし、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(c)(i)GCバイアスと、(ii)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される命令を含む、コンピュータプログラム製品。
【1283】
N1.1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは胎児を妊娠する妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供し、
(c)95%以上の感受性および95%以上の特異性の算出されたゲノム片レベルに従い、胎児における異数性の有無を同定するよう構成される、システム。
【1284】
N2.1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは胎児を妊娠する妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供し、
(c)95%以上の感受性および95%以上の特異性の算出されたゲノム片レベルに従い、胎児における異数性の有無を同定するよう構成される、装置。
【1285】
N3.コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)胎児を妊娠する妊娠女性からの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントにアクセスし、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(c)GCバイアスと、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供し、
(d)95%以上の感受性および95%以上の特異性の算出されたゲノム片レベルに従い、胎児における異数性の有無を同定するよう構成される命令を含む、コンピュータプログラム製品。
【1286】
O1.1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは胎児を妊娠する妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるマッピング特徴とのフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのバイアス実験値を決定し、
(b)バイアス実験値と、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される、システム。
【1287】
O2.1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムの部分にマッピングされた配列リードのカウントを含み、配列リードは胎児を妊娠する妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるマッピング特徴とのフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのバイアス実験値を決定し、
(b)バイアス実験値と、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれにおけるゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される、装置。
【1288】
O3.コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントにアクセスし、
(b)(i)参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントと、(ii)部分のそれぞれにおけるマッピング特徴とのフィットさせた関係から複数のサンプルにおける参照ゲノムの部分のそれぞれのバイアス実験値を決定し、
(c)バイアス実験値と、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントとの間のフィットさせた関係から参照ゲノムの部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供することにより、参照ゲノムの部分のそれぞれにマッピングされた配列リードのカウントにおけるバイアスが、算出されたゲノム片レベルにおいて減少するよう構成される命令を含む、コンピュータプログラム製品。
【1289】
P1.1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)第1の上昇が上昇期待範囲のうちの1つにあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節し、
(e)(d)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される、システム。
【1290】
P2.1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇は、ゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)第1の上昇が上昇期待範囲のうちの1つにあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節し、
(e)(d)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される、装置。
【1291】
P3.コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントにアクセスし、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第1の上昇が上昇期待範囲のうちの1つにあるときに、所定の値により第1の上昇を調節し、それにより第1の上昇を調節し、
(f)(e)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより、染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される命令を含む、コンピュータプログラム製品。
【1292】
Q1.1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)上昇期待範囲の1つに基づくゲノム片内の母体および/または胎児のコピー数多型を同定し、それにより母体および/または胎児のコピー数多型が、核酸配列リードから同定されるよう構成される、システム。
【1293】
Q2.1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この(第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)上昇期待範囲の1つに基づくゲノム片内の母体および/または胎児のコピー数多型を同定し、それにより母体および/または胎児のコピー数多型が、核酸配列リードから同定されるよう構成される、装置。
【1294】
Q3.コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントにアクセスし、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)上昇期待範囲の1つに基づくゲノム片内の母体および/または胎児のコピー数多型を同定し、それにより母体および/または胎児のコピー数多型が、核酸配列リードから同定されるよう構成される命令を含む、コンピュータプログラム製品。
【1295】
R1.1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)第2の上昇に従い第1の上昇を調節し、それにより、第1の上昇を調節し、
(e)(d)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される、システム。
【1296】
R2.1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、配列リードは妊娠女性からの循環無細胞核酸のリードであり、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(c)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(d)第2の上昇に従い第1の上昇を調節し、それにより、第1の上昇を調節し、
(e)(d)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される、装置。
【1297】
R3.コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントにアクセスし、
(b)参照ゲノムのゲノム片にマッピングされたカウントを正規化し、それにより、ゲノム片について正規化されたカウントのプロファイルを提供し、
(c)プロファイルの正規化されたカウントの第2の上昇と有意に異なる正規化されたカウントの第1の上昇を同定し、この第1の上昇はゲノム片の第1のセットについてのものであり、この第2の上昇はゲノム片の第2のセットについてのものであり、
(d)ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定し、
(e)第2の上昇に従い第1の上昇を調節し、それにより、第1の上昇を調節し、
(f)(e)の調節を含むゲノム片の上昇に従い、胎児の染色体異数性の有無を決定し、それにより染色体異数性の有無の決定が、核酸配列リードから作製されるよう構成される命令を含む、コンピュータプログラム製品。
【1298】
S1.1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた試験被験体からの血中細胞非含有サンプル核酸の配列リードのカウントを含み、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)ゲノム片のそれぞれについて配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(b)(a)のサンプル正規化されたカウントプロファイルから染色体異常断片もしくた胎児異数性または両方の有無を決定するよう構成される、システム。
【1299】
S2.1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
メモリは1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ参照ゲノムのゲノム片にマッピングされた試験被験体からの血中細胞非含有サンプル核酸の配列リードのカウントを含み、
1つまたはそれより多いプロセッサにより実行可能な命令は、
(a)ゲノム片のそれぞれについて配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(b)(a)のサンプル正規化されたカウントプロファイルから染色体異常断片もしくた胎児異数性または両方の有無を決定するよう構成される、装置。
【1300】
S3.コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)参照ゲノムのゲノム片にマッピングされた試験被験体からの血中細胞非含有サンプル核酸の配列リードのカウントにアクセスし、
(b)ゲノム片のそれぞれについて配列リードのカウントを正規化することによりサンプル正規化されたカウントプロファイルを作製し、
(c)(b)のサンプル正規化されたカウントプロファイルから染色体異常断片もしくは胎児の異数性または両方の有無を決定するよう構成される命令を含む、コンピュータプログラム製品。
【1301】
本明細書において参照された各特許、特許出願、公報および明細書の全体は、参照により本明細書に組み込まれる。上記の特許、特許出願、公報および明細書の引用は、上記のいずれかが関連の従来技術であるという承認ではなく、これらの公報または明細書の内容または日付に関し何らかの承認を構成することもない。
【1302】
技術の基本的な態様から逸脱することなく、上記を修正することができる。技術は、1つまたはそれより多い特定の実施形態を参照して、実質的に詳細に説明しているが、当業者であれば、本出願に特に開示される実施形態を変更することができ、さらにこれらの修正および改善が技術の範囲および趣旨内であることが理解されるだろう。
【1303】
本明細書において図により説明した技術は、本明細書に特に開示されていない任意の要素(各要素)の存在しない場合に適切に実施することができる。したがって、例えば、本明細書における各例において、用語「含む」、「本質的に〜からなる」および「〜からなる」は、他の2つの用語のいずれかと置き換えることができる。使用されている用語および表現は、説明の用語として使用され、限定されず、このような用語および表現の使用は、示され、かつ説明される特徴の任意の等価物またはその部分を除外せず、種々の修正が主張される技術の範囲内で可能である。用語、不定冠詞(「a」または「an」)は、要素の1つまたは要素の1つまたはそれより多いいずれかを説明することが文脈上、明らかでない限り、修正する要素の1つまたは複数を指すことができる(例えば、「試薬」は複数の試薬を意味することができる)。本明細書において使用される場合、用語「約」は基本となるパラメータの10%以内の値を指し(すなわち、プラスまたはマイナス10%)、一連の値の始めの用語「約」の使用は、各値を修飾する(すなわち、「約1、2および3」は、約1、約2および約3を指す)。例えば、「約100グラム」は、90グラム〜110グラムの重さを含むことができる。さらに、本明細書において、値の列挙が記載されるとき(例えば、約50%、60%、70%、80%、85%または86%)、列挙は、その全ての中間および分数の値(例えば、54%、85.4%)を含む。したがって、本技術が、当業者が利用し得る、本明細書に開示された概念の代表的な実施形態、任意選択の特徴、修正および変形により特に開示されているが、このような修正および変形は本技術の範囲であると考慮されると理解されるものとする。
【1304】
本技術の特定の実施形態を、以下に続く特許請求の範囲に記載する。
【1305】
(項目1)
試験サンプルについて、バイアスゲノム片レベルの減少を用いて算出するための方法であって、上記方法は:
(a)参照ゲノムの部分にマッピングされた配列リードのカウントを得る工程であって、上記配列リードは、試験サンプルからの循環無細胞核酸のリードである、工程;
(b)(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおけるGC含量との間の、各サンプルについてフィットさせた関係から、複数のサンプルについての上記参照ゲノムの上記部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定する工程、
(c)(i)上記GCバイアスと、(ii)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントとの間のフィットさせた関係から上記参照ゲノムの上記部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供する工程であって、ここで上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントにおけるバイアスが、上記算出されたゲノム片レベルにおいて減少する、工程
を包含する、方法。
【1306】
(項目2)
上記参照ゲノムの上記部分が染色体内にある、項目1に記載の方法。
【1307】
(項目3)
上記参照ゲノムの上記部分が染色体の一部にある、項目1に記載の方法。
【1308】
(項目4)
上記染色体が第21番染色体である、項目2または3の方法。
【1309】
(項目5)
上記染色体が第18番染色体である、項目2または3の方法。
【1310】
(項目6)
上記染色体が第13番染色体である、項目2または3の方法。
【1311】
(項目7)
(b)の前に、上記参照ゲノムの上記部分の一部または全てにマッピングされた上記配列リードのカウントにおける誤差の測定値を算出する工程、および上記誤差の測定値の閾値に従い上記参照ゲノムの特定の部分について上記配列リードのカウントを除去するか、または重み付けする工程を含む、項目1〜6のいずれか1項に記載の方法。
【1312】
(項目8)
上記閾値が、第1のゲノム片レベルと第2のゲノム片レベルとの間の、3.5またはそれより大きい標準偏差のギャップに従い選択される、項目7に記載の方法。
【1313】
(項目9)
上記誤差の測定値がR因子である、項目7または8に記載の方法。
【1314】
(項目10)
約7%〜約10%のR因子を有する上記参照ゲノムの上記部分についての上記配列リードのカウントが(b)の前に除去される、項目9に記載の方法。
【1315】
(項目11)
(b)の上記フィットさせた関係がフィットさせた線形関係である、項目1〜10のいずれか1項に記載の方法。
【1316】
(項目12)
上記関係の傾きが線形回帰により決定される、項目11に記載の方法。
【1317】
(項目13)
各GCバイアスがGCバイアス係数であり、上記GCバイアス係数は、(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおける上記GC含量との間の上記線形関係の傾きである、項目11または12に記載の方法。
【1318】
(項目14)
(b)の上記フィットさせた関係がフィットさせた非線形関係である、項目1〜10のいずれか1項に記載の方法。
【1319】
(項目15)
各GCバイアスがGC曲率の推定値を含む、項目14に記載の方法。
【1320】
(項目16)
(c)の上記フィットさせた関係が線形である、項目1〜15のいずれか1項に記載の方法。
【1321】
(項目17)
上記関係の傾きが線形回帰により決定される、項目16に記載の方法。
【1322】
(項目18)
(b)の上記フィットさせた関係が線形であり、(c)の上記フィットさせた関係が線形であり、上記ゲノム片レベルL
iが、式α:
Li=(m
i−G
iS)I
−1 式α
に従い、上記参照ゲノムの上記部分のそれぞれについて決定され、ここで式中、G
iは上記GCバイアスであり、Iは(c)の上記フィットさせた関係の切片であり、Sは(c)の上記関係の傾きであり、m
iは上記参照ゲノムの各部分にマッピングされたカウント測定値であり、iはサンプルである、項目1〜17のいずれか1項に記載の方法。
【1323】
(項目19)
上記参照ゲノムの上記部分の数が約40,000以上の部分である、項目1〜18のいずれか1項に記載の方法。
【1324】
(項目20)
上記参照ゲノムの各部分が所定の長さのヌクレオチド配列を含む、項目1〜19のいずれか1項に記載の方法。
【1325】
(項目21)
上記所定の長さが約50キロ塩基である、項目20に記載の方法。
【1326】
(項目22)
(b)の上記GCバイアスがGCバイアスモジュールにより決定される、項目1〜21のいずれか1項に記載の方法。
【1327】
(項目23)
(c)の上記ゲノム片レベルがレベルモジュールにより算出される、項目1〜22のいずれか1項に記載の方法。
【1328】
(項目24)
上記(c)のゲノム片レベルが式αに従い上記レベルモジュールにより提供される、項目23に記載の方法。
【1329】
(項目25)
上記レベルモジュールが上記GCモジュールからGCバイアスの決定を受信する、項目23または24の方法。
【1330】
(項目26)
1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
上記メモリは、上記1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ上記メモリは、参照ゲノムの部分にマッピングされた配列リードのカウントを含み、上記配列リードは、試験サンプルからの循環無細胞核酸のリードであり、
上記1つまたはそれより多いプロセッサにより実行可能な上記命令は、
(a)(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から、複数のサンプルについての上記参照ゲノムの上記部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、かつ
(b)(i)上記GCバイアスと、(ii)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントとの間のフィットさせた関係から上記参照ゲノムの上記部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供するように構成され、ここで上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントにおけるバイアスが上記算出されたゲノム片レベルにおいて減少する、
システム。
【1331】
(項目27)
1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
上記メモリは、上記1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ上記メモリは、参照ゲノムの部分にマッピングされた配列リードのカウントを含み、上記配列リードは、試験サンプルからの循環無細胞核酸のリードであり、
上記1つまたはそれより多いプロセッサにより実行可能な上記命令は、
(a)(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から、複数のサンプルについての上記参照ゲノムの上記部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、
(b)(i)上記GCバイアスと、(ii)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントとの間のフィットさせた関係から上記参照ゲノムの上記部分のそれぞれにおけるゲノム片レベルを算出し、それにより算出されたゲノム片レベルを提供するように構成され、ここで上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントにおけるバイアスが、上記算出されたゲノム片レベルにおいて減少する、
装置。
【1332】
(項目28)
コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)試験サンプルからの循環無細胞核酸のリードである、参照ゲノムの部分にマッピングされた配列リードのカウントにアクセスし、
(b)(i)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントと、(ii)上記部分のそれぞれにおけるGC含量との間の各サンプルについてフィットさせた関係から複数のサンプルについての上記参照ゲノムの上記部分のそれぞれのグアニンおよびシトシン(GC)バイアスを決定し、そして
(c)(i)上記GCバイアスと、(ii)上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントとの間のフィットさせた関係から上記参照ゲノムの上記部分のそれぞれのゲノム片レベルを算出し、それにより、算出されたゲノム片レベルを提供するよう構成される命令を含み、ここで上記参照ゲノムの上記部分のそれぞれにマッピングされた上記配列リードの上記カウントにおけるバイアスが、上記算出されたゲノム片レベルにおいて減少する、
コンピュータプログラム製品。
【1333】
(項目29)
胎児の染色体異数性の有無を決定するための方法であって、上記方法は:
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを得る工程、
(b)上記参照ゲノムの上記ゲノム片にマッピングされた上記カウントを正規化し、それにより上記ゲノム片について正規化されたカウントのプロファイルを提供する工程、
(c)上記プロファイルの上記正規化されたカウントの第2の上昇と有意に異なる上記正規化されたカウントの第1の上昇を同定する工程であって、ここで、上記第1の上昇はゲノム片の第1のセットについてのものであり、かつ上記第2の上昇はゲノム片の第2のセットについてのものである、工程、
(d)上記ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型における上昇期待範囲を決定する工程、
(e)上記第1の上昇が上記上昇期待範囲のうちの1つにあるときに上記第1の上昇を調節し、それにより上記第1の上昇の調節を提供する工程、
(f)(e)の上記調節を含む上記のゲノム片の上昇に従い、上記胎児の染色体異数性の有無を決定する工程であって、ここで上記染色体異数性の有無を決定する成果が、上記核酸配列リードから作製される、工程
を包含する、方法。
【1334】
(項目30)
上記ゲノム片の第1のセットにマッピングされた上記配列リードの上記カウントが、母体もしくは胎児、または母体および胎児の重複を含む、項目29に記載の方法。
【1335】
(項目31)
上記レベル期待範囲が、母体もしくは胎児、または母体および胎児のホモ接合のコピー数多型、ならびに母体もしくは胎児、または母体および胎児のヘテロ接合のコピー数多型に関して決定される、項目29または30に記載の方法。
【1336】
(項目32)
上記第1の上昇が、所定の値により(e)において調節される、項目29〜31のいずれか1項に記載の方法。
【1337】
(項目33)
上記第1の上昇が、上記第2の上昇に対して(e)において調節される、項目29〜31のいずれか1項の方法。
【1338】
(項目34)
上記第2のセットにマッピングされた上記リードの上記カウントが、実質的に母体および/または胎児のコピー数多型を含まない、項目29〜33のいずれか1項に記載の方法。
【1339】
(項目35)
ゲノム全体またはゲノムのセグメントについて配列リードのカウントを得る工程を含む、項目29〜34のいずれか1項に記載の方法。
【1340】
(項目36)
性染色体を除くゲノム全体について配列リードのカウントを得る工程を含む、項目29〜35のいずれか1項に記載の方法。
【1341】
(項目37)
上記カウントが、GC含量、ビンワイズ正規化、GC LOESS、PERUN、GCRM、またはそれらの組み合わせにより(b)において正規化される、項目29〜36のいずれか1項に記載の方法。
【1342】
(項目38)
(b)における上記正規化されたカウントが、正規化モジュールにより提供される、項目29〜37のいずれか1項に記載の方法。
【1343】
(項目39)
上記第2の上昇と有意に異なる上記第1の上昇が、比較モジュールにより(c)において同定される、項目29〜38のいずれか1項に記載の方法。
【1344】
(項目40)
上記上昇期待範囲が、範囲設定モジュールにより(d)において決定される、項目29〜39のいずれか1項に記載の方法。
【1345】
(項目41)
(e)の上記調節が、調節モジュールにより行われる、項目29〜40のいずれか1項に記載の方法。
【1346】
(項目42)
(f)の上記染色体異数性の有無の決定が、成果モジュールにより決定される、項目29〜41のいずれか1項に記載の方法。
【1347】
(項目43)
上記ゲノム片のセットの上昇が、上記正規化モジュールから上記比較モジュールに転送される、項目39〜42のいずれか1項に記載の方法。
【1348】
(項目44)
上記第1の上昇が、上記比較モジュールから上記調節モジュールに転送される、項目41〜43のいずれか1項に記載の方法。
【1349】
(項目45)
上記上昇期待範囲が、上記範囲設定モジュールから上記調節モジュールに転送される、項目41〜44のいずれか1項に記載の方法。
【1350】
(項目46)
上記調節が、上記調節モジュールから上記成果モジュールに転送される、項目42〜45のいずれか1項に記載の方法。
【1351】
(項目47)
核酸配列リードを得る工程を含む、項目29〜46のいずれか1項に記載の方法。
【1352】
(項目48)
上記核酸配列リードがシークエンシングモジュールにより作製される、項目47に記載の方法。
【1353】
(項目49)
上記核酸配列リードが超並列シークエンシング(MPS)により作製される、項目47または48に記載の方法。
【1354】
(項目50)
上記核酸配列リードを、上記参照ゲノムの上記ゲノム片に、または参照ゲノム全体にマッピングする工程を含む、項目47〜49のいずれか1項に記載の方法。
【1355】
(項目51)
上記核酸配列リードがマッピングモジュールによりマッピングされる、項目50に記載の方法。
【1356】
(項目52)
上記参照ゲノムの上記ゲノム片にマッピングされた上記核酸配列リードがカウンティングモジュールによりカウントされる、項目29〜51のいずれか1項に記載の方法。
【1357】
(項目53)
上記配列リードが、上記シークエンシングモジュールから上記マッピングモジュールに転送される、項目51または52に記載の方法。
【1358】
(項目54)
上記参照ゲノムの上記ゲノム片にマッピングされた上記核酸配列リードが、上記マッピングモジュールから上記カウンティングモジュールに転送される、項目52または53に記載の方法。
【1359】
(項目55)
上記参照ゲノムの上記ゲノム片にマッピングされた上記核酸配列リードの上記カウントが、上記カウンティングモジュールから上記正規化モジュールに転送される、項目52〜54のいずれか1項に記載の方法。
【1360】
(項目56)
装置は、上記シークエンシングモジュール、上記マッピングモジュール、上記カウンティングモジュール、上記正規化モジュール、上記比較モジュール、上記範囲設定モジュール、分類モジュール、上記調節モジュール、プロットモジュール、上記成果モジュール、データ表示組織化モジュールまたはロジック処理モジュールのうちの1つまたはそれより多くを含み、上記装置は、上記モジュールのうちの1つまたはそれより多くからの命令を実行することができるプロセッサを含むか、またはこれと通信する、項目53〜55のいずれか1項に記載の方法。
【1361】
(項目57)
第1の装置は、上記正規化モジュール、上記比較モジュール、上記範囲設定モジュール、上記調節モジュール、および上記成果モジュールのうちの1つまたはそれより多くを含む、項目42〜56のいずれか1項に記載の方法。
【1362】
(項目58)
第2の装置は、上記マッピングモジュールおよび上記カウンティングモジュールを含む、項目52〜57のいずれか1項に記載の方法。
【1363】
(項目59)
第3の装置は、上記シークエンシングモジュールを含む、項目53〜58のいずれか1項に記載の方法。
【1364】
(項目60)
(b)における上記正規化されたカウントが、未処理カウントである、項目29〜59のいずれか1項に記載の方法。
【1365】
(項目61)
(b)における上記正規化されたカウントが、フィルタリングされる、項目29〜60のいずれか1項に記載の方法。
【1366】
(項目62)
(b)における上記正規化されたカウントが、フィルタリングされない、項目29〜61のいずれか1項に記載の方法。
【1367】
(項目63)
上記プロファイルの上記第1の上昇および上記第2の上昇が上昇中央値である、項目29〜62のいずれか1項に記載の方法。
【1368】
(項目64)
上記第2の上昇が、染色体またはそのセグメントにおけるゲノム片のセットを含む、項目29〜63のいずれか1項に記載の方法。
【1369】
(項目65)
第1のセット、第2のセットまたは上記第1のセットおよび上記第2のセットが2つまたはそれより多いゲノム片を含む、項目29〜64のいずれか1項に記載の方法。
【1370】
(項目66)
各ゲノム片は、連続ヌクレオチドの長さがほぼ等しいものである、項目29〜65のいずれか1項に記載の方法。
【1371】
(項目67)
各ゲノム片が約50kbである、項目29〜66のいずれか1項に記載の方法。
【1372】
(項目68)
各セットが2つまたはそれより多いゲノム片を含む、項目29〜67のいずれか1項に記載の方法。
【1373】
(項目69)
各セットが20〜40個のゲノム片を含む、項目29〜68のいずれか1項に記載の方法。
【1374】
(項目70)
上記染色体異数性の有無の決定が、90%と等しいかそれより高い特異性および90%と等しいかそれより高い感度とともに提供される、項目29〜69のいずれか1項に記載の方法。
【1375】
(項目71)
上記染色体異数性が染色体の欠失または付加である、項目29〜70のいずれか1項に記載の方法。
【1376】
(項目72)
上記染色体異数性がトリソミーである、項目29〜71のいずれか1項に記載の方法。
【1377】
(項目73)
上記トリソミーがトリソミー21、トリソミー18、またはトリソミー13である、項目72に記載の方法。
【1378】
(項目74)
上記不確定値が平均絶対偏差または標準偏差である、項目29〜73のいずれか1項に記載の方法。
【1379】
(項目75)
上記不確定値が上記第1の上昇から得られる、項目29〜74のいずれか1項に記載の方法。
【1380】
(項目76)
上記不確定値が上記第2の上昇から得られる、項目29〜74のいずれか1項に記載の方法。
【1381】
(項目77)
上記不確定値が上記第1の上昇および上記第2の上昇から得られる、項目29〜74のいずれか1項に記載の方法。
【1382】
(項目78)
(d)の上記上昇期待範囲を決定する工程は、上記不確定値の3倍による、項目29〜77のいずれか1項に記載の方法。
【1383】
(項目79)
上記ヘテロ接合のコピー数多型または上記ホモ接合のコピー数多型が、母体もしくは胎児、または母体および胎児の欠失、あるいは母体もしくは胎児、または母体および胎児の重複である、項目29〜78のいずれか1項に記載の方法。
【1384】
(項目80)
上記第2の上昇が参照上昇である、項目29〜79のいずれか1項の方法。
【1385】
(項目81)
上記第1の上昇および上記第2の上昇が上記参照上昇に対して正規化される、項目80に記載の方法。
【1386】
(項目82)
正規化された参照値(NRV)が上記参照上昇に対して正規化される上記第2のレベルに従い決定される、項目81に記載の方法。
【1387】
(項目83)
上記コピー数多型についての上昇期待値が、上記NRVと、上記コピー数多型の上昇期待定数に従い決定される、項目82に記載の方法。
【1388】
(項目84)
上記NRVに上記上昇期待定数が乗算される、項目83に記載の方法。
【1389】
(項目85)
ホモ接合重複についての上記上昇期待定数が2であり、ヘテロ接合重複についての上記上昇期待定数が1.5であり、ヘテロ接合欠失についての上記上昇期待定数が0.5であり、ホモ接合欠失についての上記上昇期待定数がゼロである、項目83または84に記載の方法。
【1390】
(項目86)
母体および/または胎児のコピー数多型の非存在についての上記上昇期待定数が、1である、項目83〜85のいずれか1項に記載の方法。
【1391】
(項目87)
上昇期待範囲が、上記コピー数多型についての上記上昇期待値および不確定値に従い決定される、項目83〜86のいずれか1項に記載の方法。
【1392】
(項目88)
上記第1の上昇の上記調節が、上記第1の上昇から上記所定の値を減算することを含む、項目32〜87のいずれか1項に記載の方法。
【1393】
(項目89)
上記第1の上昇の上記調節が、上記第1の上昇に上記所定の値を加算することを含む、項目32〜87のいずれか1項に記載の方法。
【1394】
(項目90)
上記所定の値が、コピー数多型において予め決定される所定の調節値(PAV)である、項目32〜89のいずれか1項に記載の方法。
【1395】
(項目91)
コピー数多型についての上記PAVが、上記コピー数多型についての上記上昇期待値と、上記コピー数多型についてのPAV係数に従い決定される、項目90に記載の方法。
【1396】
(項目92)
ホモ接合重複についての上記PAV係数が−1であり、ヘテロ接合重複についての上記PAV係数が−0.5であり、ヘテロ接合欠失についての上記PAV係数が0.5であり、ホモ接合欠失についての上記PAV係数が1である、項目91に記載の方法。
【1397】
(項目93)
上記PAV係数が上記PAV係数を乗算した上記PAVの積である、項目91または92に記載の方法。
【1398】
(項目94)
上記ゲノム片の第1のセットにマッピングされた上記配列リードのうちの1つまたはそれより多くが、母体もしくは胎児、または母体および胎児の欠失を含む、項目29〜93のいずれか1項に記載の方法。
【1399】
(項目95)
上記妊娠女性からの循環無細胞核酸の上記配列リードが、上記妊娠女性から得たサンプルからのものである、項目29〜94のいずれか1項に記載の方法。
【1400】
(項目96)
上記サンプルが上記妊娠女性からの血液を含む、項目95に記載の方法。
【1401】
(項目97)
上記サンプルが上記妊娠女性からの血漿を含む、項目95に記載の方法。
【1402】
(項目98)
上記サンプルが上記妊娠女性からの血清を含む、項目95に記載の方法。
【1403】
(項目99)
上記プロファイルが染色体またはそのセグメントのプロファイルである、項目29〜98のいずれか1項に記載の方法。
【1404】
(項目100)
上記プロファイルが複数の第1の上昇を含む、項目29〜99のいずれか1項に記載の方法。
【1405】
(項目101)
複数の第1の上昇に対して、(c)、(d)および(e)を繰り返すことを含む、項目29〜100のいずれか1項に記載の方法。
【1406】
(項目102)
上記ゲノム片の第1のセットが、上記ゲノム片の第2のセットと異なり、かつ/または区別できる、項目29〜101のいずれか1項に記載の方法。
【1407】
(項目103)
上記ゲノム片の第2のセットが、上記ゲノム片の第1のセットを含む、項目29〜101のいずれか1項に記載の方法。
【1408】
(項目104)
上記第2の上昇が、上記ゲノム片の第2のセットについての上昇の平均値、中間値または中央値である、項目29〜103のいずれか1項に記載の方法。
【1409】
(項目105)
上記不確定値が、上記第2の上昇の平均値、中間値または中央値から得られ、上記不確定値が標準偏差またはMADである、項目104に記載の方法。
【1410】
(項目106)
上記第2の上昇が染色体全体を表し、上記第1の上昇が母体もしくは胎児、または母体および胎児のコピー数多型を表す、項目29〜105のいずれか1項に記載の方法。
【1411】
(項目107)
1つまたはそれより多いプロセッサおよびメモリを含むシステムであって、
上記メモリは、上記1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ上記メモリは、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、上記配列リードは、妊娠女性からの循環無細胞核酸のリードであり、
上記1つまたはそれより多いプロセッサにより実行可能な上記命令は、
(a)上記参照ゲノムの上記ゲノム片にマッピングされた上記カウントを正規化し、それにより上記ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)上記プロファイルの上記正規化されたカウントの第2の上昇と有意に異なる上記正規化されたカウントの第1の上昇を同定し、ここで上記第1の上昇がゲノム片の第1のセットについてのものであり、上記第2の上昇がゲノム片の第2のセットについてのものであり、
(c)上記ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型の上昇期待範囲を決定し、
(d)上記第1の上昇が上記上昇期待範囲のうちの1つにあるときに、所定の値により上記第1の上昇を調節し、それにより、上記第1の上昇の調節を提供し、そして
(e)(d)の上記調節を含む上記ゲノム片の上昇に従い、上記胎児の染色体異数性の有無を決定するよう構成され、ここで上記染色体異数性の有無の決定が、上記核酸配列リードから作製される、
システム。
【1412】
(項目108)
1つまたはそれより多いプロセッサおよびメモリを含む装置であって、
上記メモリは、上記1つまたはそれより多いプロセッサにより実行可能な命令を含み、かつ上記メモリは、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントを含み、上記配列リードは、妊娠女性からの循環無細胞核酸のリードであり、
上記1つまたはそれより多いプロセッサにより実行可能な上記命令が、
(a)上記参照ゲノムの上記ゲノム片にマッピングされた上記カウントを正規化し、それにより上記ゲノム片について正規化されたカウントのプロファイルを提供し、
(b)上記プロファイルの上記正規化されたカウントの第2の上昇と有意に異なる上記正規化されたカウントの第1の上昇を同定し、ここで上記第1の上昇がゲノム片の第1のセットについてのものであり、上記第2の上昇がゲノム片の第2のセットについてのものであり、
(c)上記ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型の上昇期待範囲を決定し、
(d)上記第1の上昇が上記上昇期待範囲のうちの1つにあるときに、所定の値により上記第1の上昇を調節し、それにより、上記第1の上昇の調節を提供し、そして
(e)(d)の上記調節を含む上記ゲノム片の上昇に従い、上記胎児の染色体異数性の有無を決定するよう構成され、ここで上記染色体異数性の有無の決定が、上記核酸配列リードから作製される、
装置。
【1413】
(項目109)
コンピュータ読み取り可能な媒体に組み込まれた有形のコンピュータプログラム製品であって、1つまたはそれより多いプロセッサにより実行されるときに、
(a)妊娠女性からの循環無細胞核酸のリードである、参照ゲノムのゲノム片にマッピングされた核酸配列リードのカウントにアクセスし、
(b)上記参照ゲノムの上記ゲノム片にマッピングされた上記カウントを正規化し、それにより上記ゲノム片について正規化されたカウントのプロファイルを提供し、
(c)上記プロファイルの上記正規化されたカウントの第2の上昇と有意に異なる上記正規化されたカウントの第1の上昇を同定し、ここで上記第1の上昇がゲノム片の第1のセットについてのものであり、上記第2の上昇がゲノム片の第2のセットについてのものであり、
(d)上記ゲノムのセグメントについての不確定値に従い、ホモ接合およびヘテロ接合のコピー数多型の上昇期待範囲を決定し、
(e)上記第1の上昇が上記上昇期待範囲のうちの1つにあるときに、所定の値により上記第1の上昇を調節し、それにより、上記第1の上昇の調節を提供し、
(f)(e)の上記調節を含む上記ゲノム片の上昇に従い、上記胎児の染色体異数性の有無を決定するよう構成される命令を含み、ここで上記染色体異数性の有無の決定が、上記核酸配列リードから作製される、
コンピュータプログラム製品。