(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-21
(54)【発明の名称】配列決定データからの病原性RFC1伸長の決定
(51)【国際特許分類】
C12Q 1/6809 20180101AFI20240614BHJP
C12Q 1/6883 20180101ALI20240614BHJP
C12Q 1/6869 20180101ALI20240614BHJP
C12Q 1/686 20180101ALI20240614BHJP
【FI】
C12Q1/6809 Z ZNA
C12Q1/6883 Z
C12Q1/6869 Z
C12Q1/686 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023576188
(86)(22)【出願日】2022-06-10
(85)【翻訳文提出日】2023-12-11
(86)【国際出願番号】 US2022033020
(87)【国際公開番号】W WO2022261445
(87)【国際公開日】2022-12-15
(32)【優先日】2021-06-11
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】サイ・チェン
(72)【発明者】
【氏名】マイケル・エー・エバレー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QA20
4B063QQ03
4B063QQ08
4B063QQ42
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS34
4B063QS39
4B063QS40
4B063QX02
(57)【要約】
本明細書に開示されるのは、目的の遺伝子(例えば、RFC1の場合、hg38の(約)chr4:39348424)の遺伝子座の反復伸長ステータス(例えば、病原性、キャリア、及び良性)を決定するためのシステム、装置、及び方法である。配列リードを配列グラフに整列させた後、所定の基準を満たす反復配列の出現数及び病原性反復配列の頻度を決定することができ、これらは反復伸長ステータスを決定するために使用される。
【特許請求の範囲】
【請求項1】
複製因子Cサブユニット1(RFC1)反復伸長ステータスを決定するための方法であって、
ハードウェアプロセッサの制御下で、
(a)対象から得られた試料から生成された複数の配列リードを受け取ることと、
(b)複数のアラインメントされた配列リードを生成するために、前記複数の配列リードを配列グラフにアラインメントすることであって、前記配列グラフが、RFC1の遺伝子座を表し、RFC1の遺伝子座の非反復配列が隣接する反復配列表現を含み、前記複数のアラインメントされた配列リードが、前記複数の配列リードと、前記配列グラフへの前記複数の配列リードのアラインメントとを含む、ことと、
(c)第1の出現閾値及び第1の品質閾値を使用して、前記複数のアラインメントされた配列リードのうちのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することと、
(d)前記複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を決定することと、
(e)前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示を使用して、前記対象のRFC1の遺伝子座における反復伸長ステータスを決定することと、
を含む、方法。
【請求項2】
RFC1の遺伝子座における前記反復伸長が、hg38の約chr4:39348424、又は別の参照ゲノム配列の対応する位置にある、請求項1に記載の方法。
【請求項3】
前記複数のアラインメントされた配列リードを使用して、前記対象が、RFC1の遺伝子座において反復伸長を有する0個、1個又は2個の対立遺伝子を有すると決定することを含む、請求項1~2のいずれか一項に記載の方法。
【請求項4】
前記対象が、RFC1の遺伝子座に反復伸長を有する2つの対立遺伝子を有する、請求項1~3のいずれか一項に記載の方法。
【請求項5】
RFC1の遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が、第1のステータス閾値よりも大きいと決定することと、
RFC1の遺伝子座における前記反復伸長ステータスを病原性ステータスとして決定することと、を含む、
請求項4に記載の方法。
【請求項6】
RFC1の遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示を、第1のステータス閾値以下であり、かつ第2のステータス閾値以上であると決定することと、
RFC1の遺伝子座における前記反復伸長ステータスをキャリアステータスとして決定することと、
を含む、請求項4に記載の方法。
【請求項7】
RFC1の遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が、第1のステータス閾値以下であり、かつ第2のステータス閾値以上であると決定することと、
前記病原性反復配列及び前記病原性反復配列と高い配列類似性を有する配列の出現数の頻度表示が第3のステータス閾値よりも大きいと決定することであって、任意選択で、前記病原性反復配列及び前記病原性反復配列に類似する配列が1塩基異なる、ことと、
前記病原性配列の出現数の前記頻度表示が第4のステータス閾値より大きいと決定することと、
RFC1の遺伝子座における前記反復伸長ステータスをキャリアステータスとして決定することと、
を含む、請求項4に記載の方法。
【請求項8】
RFC1の遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が、第2のステータス閾値未満であることを決定することと、
RFC1の遺伝子座における前記反復伸長ステータスを良性ステータスとして決定することと、
を含む、請求項4に記載の方法。
【請求項9】
前記対象が、RFC1の遺伝子座において反復伸長を有するRFC1の1つの対立遺伝子を有する、請求項1~3のいずれか一項に記載の方法。
【請求項10】
前記複数の配列リードの前記アラインメントされた配列リードにおける前記複数の反復配列の出現数を決定することが、前記複数の配列リードの前記アラインメントされた配列リードにおける、RFC1の遺伝子座において反復伸長を有する前記1つの対立遺伝子に由来する前記複数のアラインメントされた配列リードにおける前記複数の反復配列の出現数を決定することを含み、
RFC1の遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が第1のステータス閾値よりも大きいと決定することと、
RFC1の遺伝子座における前記反復伸長ステータスを病原性ステータスとして決定することと、を含む、
請求項9に記載の方法。
【請求項11】
前記複数の配列リードの前記アラインメントされた配列リードにおける前記複数の反復配列の出現数を決定することが、前記複数の配列リードの前記アラインメントされた配列リードにおける、RFC1の遺伝子座において反復伸長を有する前記1つの対立遺伝子に由来する前記複数のアラインメントされた配列リードにおける前記複数の反復配列の出現数を決定することを含み、
RFC1の遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が、第1のステータス閾値以下であることを決定することと、
RFC1の遺伝子座における前記反復伸長ステータスをキャリアステータスとして決定することと、
を含む、請求項9に記載の方法。
【請求項12】
前記アラインメントされた配列リードのアラインメントに基づいて、RFC1の遺伝子座において反復伸長を有する前記RFC1の1つの対立遺伝子に由来する前記アラインメントされた配列リードを選択することを含む、請求項10~11のいずれか一項に記載の方法。
【請求項13】
RFC1の遺伝子座における反復伸長を有する前記RFC1の1つの対立遺伝子に由来する前記アラインメントされた配列リードが、(i)イン反復リード、又は(ii)それぞれが反復伸長重複閾値より大きいRFC1の遺伝子座における反復伸長に対する重複を有する隣接リードである前記アラインメントされた配列リードを含み、任意で、前記反復伸長重複閾値が約60塩基対である、請求項10~12のいずれか一項に記載の方法。
【請求項14】
RFC1の遺伝子座において反復伸長を有する前記RFC1の1つの対立遺伝子に由来する前記アラインメントされた配列リードが、(i)イン反復リードである全ての前記アラインメントされた配列リードと、(ii)隣接リードである前記アラインメントされた配列リードの全てではない配列リードとを含む、請求項13に記載の方法。
【請求項15】
前記対象が、RFC1の遺伝子座における反復伸長を有する0対立遺伝子を有し、RFC1の遺伝子座における前記反復伸長ステータスが良性ステータスである、請求項1~3のいずれか一項に記載の方法。
【請求項16】
RFC1の遺伝子座における反復伸長が、1つ又はそれを超える反復配列の閾値総コピーを含む、請求項4~15のいずれか一項に記載の方法。
【請求項17】
一又は複数の反復配列の閾値総コピー数が一又は複数の反復配列の総コピー数20である、請求項16記載の方法。
【請求項18】
前記反復伸長が疾患に関連する又は疾患を引き起こし、任意選択で、前記疾患が小脳性運動失調、神経障害、及び前庭反射消失症候群(CANVAS)である、請求項4~17のいずれか一項に記載の方法。
【請求項19】
RFC1の遺伝子座における前記反復伸長ステータスが、病原性ステータス、キャリアステータス、又は良性ステータスである、請求項1~18のいずれか一項に記載の方法。
【請求項20】
前記複数の反復配列の各々は、前記第1の出現閾値以上の出現数を有し、各出現は、各々が前記第1の品質閾値以上の品質スコアを有する塩基の数を有する、請求項1~19のいずれか一項に記載の方法。
【請求項21】
前記第1の出現閾値が2であり、前記第1の品質閾値が約20であり、及び/又は前記第1の品質閾値より大きい品質スコアをそれぞれ有する前記反復配列の塩基の数が5である、請求項20に記載の方法。
【請求項22】
前記出現の各々は、各々が第2の品質閾値以上の品質スコアを有する基底の数を有する、請求項1~21のいずれか一項に記載の方法。
【請求項23】
前記第2の品質閾値は約20であり、及び/又は前記第2の品質閾値より大きい品質スコアを有する前記出現の各々の基底の数は3である、請求項22に記載の方法。
【請求項24】
前記反復配列表現が縮重である、請求項1~23のいずれか一項に記載の方法。
【請求項25】
前記反復配列表現がAARRGである、請求項1~24のいずれか一項に記載の方法。
【請求項26】
前記反復配列表現及び/又は前記複数の反復配列の各々が5塩基長である、請求項1~25のいずれか一項に記載の方法。
【請求項27】
前記反復配列表現及び/又は前記複数の反復配列の各々が少なくとも5塩基長であり、任意選択で、前記反復配列表現及び/又は前記複数の反復配列の各々が6塩基長である、請求項1~25のいずれか一項に記載の方法。
【請求項28】
前記病原性反復配列がAAGGG又はACAGGである、請求項1~27のいずれか一項に記載の方法。
【請求項29】
前記病原性反復配列が少なくとも60%のGC含有量を有する、請求項1~28のいずれか一項に記載の方法。
【請求項30】
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が、前記複数の反復配列の出現の総数のうちの前記病原性反復配列の出現数のパーセンテージ、又は前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の比である、請求項1~29のいずれか一項に記載の方法。
【請求項31】
前記複数の配列リードが、RFC1の遺伝子座にアラインメントされる、請求項1~30のいずれか一項に記載の方法。
【請求項32】
得られた前記試料から生成された前記複数の配列リードを受け取る工程が、
複数の配列リードを含む第2の複数の配列リードを参照ゲノム配列にアラインメントすることと、
前記第2の複数の配列リードから前記複数の配列リードを選択することであって、前記複数の配列リードがRFC1の遺伝子座にアラインメントされる、ことと、
を含む、請求項1~31のいずれか一項に記載の方法。
【請求項33】
前記複数の配列リードが、それぞれが約100塩基対~約1000塩基対の長さである配列リードを含む、請求項1~32のいずれか一項に記載の方法。
【請求項34】
前記複数の配列リードがペアエンド配列リードを含む、請求項1~33のいずれか一項に記載の方法。
【請求項35】
前記複数の配列リードが、シングルエンド配列リードを含む、請求項1~33のいずれか一項に記載の方法。
【請求項36】
前記複数の配列リードが、標的配列決定及び/又は全ゲノム配列決定(WGS)によって生成され、場合により、前記WGSが臨床用WGS(cWGS)である、請求項1~35のいずれか一項に記載の方法。
【請求項37】
前記参照ゲノム配列が参照ヒトゲノム配列を含み、前記対象がヒト対象である、請求項1~36のいずれか一項に記載の方法。
【請求項38】
前記試料が、細胞、無細胞DNA、無細胞胎児DNA、羊水、血液試料、生検試料、又はそれらの組み合わせを含む、請求項1~37のいずれか一項に記載の方法。
【請求項39】
1つ又は複数の診断方法を使用して、前記対象のRFC1の遺伝子座における前記反復伸長ステータスを確認することを含み、任意選択で、前記1つ又は複数の診断方法が、ポリメラーゼ連鎖反応(PCR)及びサンガーシーケンシング、サザンブロット、並びに連鎖解析を含む、請求項1~38のいずれか一項に記載の方法。
【請求項40】
目的の遺伝子の反復伸長ステータスを決定するためのシステムであって、
実行可能命令を記憶するように構成された非一時的メモリと
前記非一過性メモリと通信するハードウェアプロセッサであって、前記実行可能な命令によってプログラムされた前記ハードウェアプロセッサは、
(a)対象から得られた試料から生成された複数の配列リードを受け取ることと、
(b)複数のアラインメントされた配列リードを生成するために、前記複数の配列リードを配列グラフにアラインメントすることであって、前記配列グラフが、目的の遺伝子の遺伝子座を表し、前記遺伝子の遺伝子座の非反復配列が隣接する反復配列表現を含み、前記複数のアラインメントされた配列リードが、前記複数の配列リードと、前記配列グラフへの前記複数の配列リードのアラインメントとを含む、ことと、
(c)第1の出現閾値及び第1の品質閾値を使用して、複数のアラインメントされた配列リードのうちのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することと、
(d)前記複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を決定することと、(e)前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示を使用して、前記対象の前記目的の遺伝子座における前記反復伸長ステータスを決定することと、を実行する、前記非一過性メモリと通信するハードウェアプロセッサと、を含む、システム。
【請求項41】
前記目的の遺伝子が複製因子Cサブユニット1(RFC1)である、請求項40に記載のシステム。
【請求項42】
反復伸長を有する目的の遺伝子の遺伝子座が、hg38の約chr4:39348424又は別の参照ゲノム配列の対応する位置にある、請求項41記載のシステム。
【請求項43】
前記反復伸長が疾患に関連する又は疾患を引き起こし、任意選択で、前記疾患が小脳性運動失調、神経障害、及び前庭反射消失症候群(CANVAS)である、請求項41~42のいずれか一項に記載のシステム。
【請求項44】
前記反復配列表現がAARRGである、請求項41~43のいずれか一項に記載のシステム。
【請求項45】
前記病原性反復配列がAAGGG又はACAGGである、請求項41~44のいずれか一項に記載のシステム。
【請求項46】
前記ハードウェアプロセッサが、前記複数のアラインメントされた配列リードを使用して、前記対象が、前記目的の遺伝子の遺伝子座において反復伸長を有する0個、1個又は2個の対立遺伝子を有すると決定することを行うように前記実行可能命令によってプログラムされる、請求項40~45のいずれか一項に記載のシステム。
【請求項47】
前記対象が、前記目的の遺伝子の遺伝子座に反復伸長を有する2つの対立遺伝子を有する、請求項40~46のいずれか一項に記載のシステム。
【請求項48】
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が第1のステータス閾値よりも大きいと決定することと、
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスを病原性ステータスとして決定することと、
を含む、請求項47に記載のシステム。
【請求項49】
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示を決定することが、第1のステータス閾値以下であり、かつ第2のステータス閾値以上であることと、
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスをキャリアステータスとして決定することと、
を含む、請求項47に記載のシステム。
【請求項50】
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示を決定することが、第1のステータス閾値以下であり、かつ第2のステータス閾値以上であることと、
前記病原性反復配列及び前記病原性反復配列と高い配列類似性を有する配列の出現数の頻度表示を決定することが、第3のステータス閾値よりも大きく、任意選択で、前記病原性反復配列及び前記病原性反復配列に類似する配列が1塩基異なることと、
前記病原性配列の出現数の頻度表示が第4のステータス閾値より大きいと決定することと、
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスをキャリアステータスとして決定することと、
を含む、請求項47に記載のシステム。
【請求項51】
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が、第2のステータス閾値未満であることを決定することと、
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスを良性ステータスとして決定することと、
を含む、請求項47に記載のシステム。
【請求項52】
前記対象が、前記目的の遺伝子の遺伝子座に反復伸長を有する前記目的の遺伝子の1つの対立遺伝子を有する、請求項40~46のいずれか一項に記載のシステム。
【請求項53】
前記複数の配列リードの前記アラインメントされた配列リードにおける前記複数の反復配列の出現数を決定することが、前記目的の遺伝子の遺伝子座において反復伸長を有する前記目的の遺伝子の前記1つの対立遺伝子に由来する前記複数のアラインメントされた配列リードの前記アラインメントされた配列リードにおける前記複数の反復配列の出現数を決定することを含み、
前記目的の遺伝子の遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が第1のステータス閾値よりも大きいと決定することと、
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスを病原性ステータスとして決定することと、
を含む、請求項52に記載のシステム。
【請求項54】
前記複数の配列リードの前記アラインメントされた配列リードにおける前記複数の反復配列の出現数を決定することが、前記目的の遺伝子の遺伝子座において反復伸長を有する前記目的の遺伝子の前記1つの対立遺伝子に由来する前記複数のアラインメントされた配列リードの前記アラインメントされた配列リードにおける前記複数の反復配列の出現数を決定することを含み、
前記目的の遺伝子の遺伝子座における前記反復伸長ステータスを決定することが、
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が、第1のステータス閾値以下であることを決定することと、
前記目的の遺伝子の前記遺伝子座における前記反復伸長ステータスをキャリアステータスとして決定することと、
を含む、請求項52に記載のシステム。
【請求項55】
前記ハードウェアプロセッサが、前記実行可能命令によって、前記アラインメントされた配列リードのアラインメントに基づいて、前記目的の遺伝子の遺伝子座における反復伸長を有する前記目的の遺伝子の前記1つの対立遺伝子に由来する前記アラインメントされた配列リードを選択することを行うようにプログラムされる、請求項53~54のいずれか一項に記載のシステム。
【請求項56】
目的の遺伝子の遺伝子座において反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来するアラインメントされた配列リードが、(i)イン反復リード、又は(ii)それぞれが反復伸長重複閾値よりも大きい前記目的の遺伝子の遺伝子座における前記反復伸長に対する重複を有する隣接するリードであるアラインメントされた配列リードを含み、任意で、前記反復伸長重複閾値が約60塩基対である、請求項53~55のいずれか一項記載のシステム。
【請求項57】
前記目的の遺伝子の前記遺伝子座において反復伸長を有する前記目的の遺伝子の1つの対立遺伝子に由来する前記アラインメントされた配列リードが、(i)イン反復リードである全てのアラインメントされた配列リード、及び(ii)隣接リードである前記アラインメントされた配列リードの全てではない配列リードを含む、請求項56記載のシステム。
【請求項58】
前記対象が、前記目的の遺伝子の遺伝子座において反復伸長を有する0対立遺伝子を有し、前記目的の遺伝子の遺伝子座における前記反復伸長ステータスが良性ステータスである、請求項40~46のいずれか一項に記載のシステム。
【請求項59】
目的の遺伝子の遺伝子座における反復伸長が、1つ又はそれを超える反復配列の閾値総コピーを含む、請求項47~58のいずれか一項記載のシステム。
【請求項60】
一又は複数の反復配列の閾値総コピー数が一又は複数の反復配列の総コピー数20である、請求項59に記載のシステム。
【請求項61】
前記反復伸長が疾患に関連するか、又は疾患を引き起こし、任意で前記疾患が神経疾患である、請求項44~60のいずれか一項に記載のシステム。
【請求項62】
前記目的の遺伝子座における前記反復伸長ステータスが、病原性ステータス、キャリアステータス又は良性ステータスである、請求項40~61のいずれか一項に記載のシステム。
【請求項63】
前記複数の反復配列の各々は、前記第1の出現閾値以上の出現数を有し、各出現は、各々が前記第1の品質閾値以上の品質スコアを有する塩基の数を有する、請求項40~62のいずれか一項に記載のシステム。
【請求項64】
前記第1の出現閾値が2であり、前記第1の品質閾値が約20であり、及び/又は前記第1の品質閾値より大きい品質スコアをそれぞれ有する前記反復配列の塩基の数が5である、請求項63に記載のシステム。
【請求項65】
前記出現の各々は、各々が第2の品質閾値以上の品質スコアを有する基底の数を有する、請求項40~64のいずれか一項に記載のシステム。
【請求項66】
前記第2の品質閾値は約20であり、及び/又は前記第2の品質閾値より大きい品質スコアを有する前記出現の各々の基底の数は3である、請求項65に記載のシステム。
【請求項67】
前記反復配列表現が縮重である、請求項40~66のいずれか一項に記載のシステム。
【請求項68】
前記反復配列表現及び/又は前記複数の反復配列の各々が5塩基長である、請求項40~67のいずれか一項に記載のシステム。
【請求項69】
前記反復配列表現及び/又は前記複数の反復配列の各々が少なくとも5塩基長であり、任意選択で、前記反復配列表現及び/又は前記複数の反復配列の各々が6塩基長である、請求項40~68のいずれか一項に記載のシステム。
【請求項70】
前記病原性反復配列が少なくとも60%のGC含有量を有する、請求項40~69のいずれか一項に記載のシステム。
【請求項71】
前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の前記頻度表示が、前記複数の反復配列の出現の総数のうちの前記病原性反復配列の出現数のパーセンテージ、又は前記複数の反復配列の出現の総数に対する前記病原性反復配列の出現数の比である、請求項40~70のいずれか一項に記載のシステム。
【請求項72】
前記複数の配列リードが、前記目的の遺伝子の遺伝子座にアラインメントされる、請求項40~71のいずれか一項に記載のシステム。
【請求項73】
得られた前記試料から生成された前記複数の配列リードを受け取る工程が、
複数の配列リードを含む第2の複数の配列リードを参照ゲノム配列にアラインメントすることと、
前記第2の複数の配列リードから前記複数の配列リードを選択することであって、前記複数の配列リードが前記目的の遺伝子の遺伝子座にアラインメントされる、ことと、
を含む、請求項40~72のいずれか一項に記載のシステム。
【請求項74】
前記複数の配列リードが、それぞれが約100塩基対~約1000塩基対の長さである配列リードを含む、請求項40~73のいずれか一項に記載のシステム。
【請求項75】
前記複数の配列リードがペアエンド配列リードを含む、請求項40~74のいずれか一項に記載のシステム。
【請求項76】
前記複数の配列リードが単一エンド配列リードを含む、請求項40~74のいずれか一項に記載のシステム。
【請求項77】
前記複数の配列リードが、標的配列決定及び/又は全ゲノム配列決定(WGS)によって生成され、場合により、前記WGSが臨床用WGS(cWGS)である、請求項40~76のいずれか一項に記載のシステム。
【請求項78】
前記参照ゲノム配列が参照ヒトゲノム配列を含み、前記対象がヒト対象である、請求項40~77のいずれか一項に記載のシステム。
【請求項79】
前記試料が、細胞、無細胞DNA、無細胞胎児DNA、羊水、血液試料、生検試料、又はそれらの組み合わせを含む、請求項40~78のいずれか一項に記載のシステム。
【請求項80】
前記ハードウェアプロセッサが、1つ又は複数の診断システムを使用して決定された前記対象の前記目的の遺伝子の前記遺伝子座での前記反復伸長ステータスのコンフォメーションを受け取ることを実行するように前記実行可能命令によってプログラムされ、任意選択で、前記1つ又は複数の診断システムが、ポリメラーゼ連鎖反応(PCR)及びサンガー配列決定、サザンブロット、並びに連鎖解析を含む、請求項40~79のいずれか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、2021年6月11日に出願された米国仮出願第63/209,608号に対する35 U.S.C.§119(e)に基づく優先権を主張する。関連出願の内容は、その全体が参照により本明細書に組み込まれる。
【0002】
配列表の参照
本出願は、電子フォーマットでの配列表とともに出願されている。配列表は、サイズが10キロバイトである、2022年5月29日に作成されたSequence_Listing_47CX-311978-WO.txtという表題のファイルとして提供される。配列表の電子フォーマット中の情報は、参照によりその全体が本明細書に組み込まれる。
【0003】
本開示は、一般に、配列データを処理する分野に関し、より具体的には、反復を決定することに関する。
【背景技術】
【0004】
複製因子Cサブユニット(RFC1)遺伝子における二対立遺伝子イントロンAAGGG反復伸長は、家族性小脳性運動失調、ニューロパシー、及び前庭反射消失症候群(CANVAS)及び遅発性運動失調を引き起こし得る。この病原性AAGGG伸長の現在の診断方法は時間がかかり、大規模に実施することはできない。1つの方法は、アラインメントからのリードの手動検査による臨床全ゲノム配列決定(cWGS)スクリーニングである。しかし、この高GCゲノム領域では、ペアエンドリードの塩基品質が低下し、特に病原性AAGGG又は他の高GC反復パターンがある場合、手動検査がより困難になり、誤りが起こりやすくなる。cWGSデータを含む配列決定データからこの病原性伸長を同定するための自動化された正確な方法が必要とされている。
【発明の概要】
【0005】
複製因子Cサブユニット1(RFC1)反復伸長ステータスを決定するための方法が本明細書に開示される。いくつかの実施形態において、RFC1反復伸長ステータスを決定するための方法は、(ハードウェアプロセッサ又は仮想プロセッサなどの)プロセッサの制御下にあり、(a)対象から得られた試料から生成された複数の配列リードを受け取ることを含む。本方法は、(b)複数のアラインメントされた配列リードを生成するために、複数の配列リードを配列グラフにアラインメントすることを含み得る。配列グラフはRFC1の遺伝子座を表すことができる。配列グラフは、RFC1の遺伝子座の非反復配列に隣接する反復配列表現を含み得る。複数のアラインメントされた配列リードは、複数の配列リードと、配列グラフに対する複数の配列リードのアラインメントとを含み得る。本方法は、(c)第1の出現閾値及び第1の品質閾値を使用して、複数のアラインメントされた配列リードのうちのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することを含み得る。方法は、(d)複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を決定することを含み得る。方法は、(e)複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を使用して、対象のRFC1の遺伝子座における反復伸長のステータスを決定することを含み得る。
【0006】
いくつかの実施形態において、方法は、対象が、複数のアラインメントされた配列リードを使用して、RFC1の遺伝子座において反復伸長を有する0個、1個又は2個の対立遺伝子を有すると決定する工程を含む。いくつかの実施形態では、RFC1の遺伝子座における反復伸長は、hg38の約chr4:39348424、又は別の参照ゲノム配列の対応する位置にある。
【0007】
いくつかの実施形態では、RFC1の遺伝子座における反復伸長のステータスは、病原性ステータス、キャリアステータス、又は良性ステータスである。いくつかの実施形態では、反復伸長は、疾患に関連するか、又は疾患を引き起こす。この疾患は、小脳性運動失調、ニューロパシー、及び前庭動眼反射症候群(CANVAS)であり得る。いくつかの実施形態では、本方法は、1つ又は複数の診断方法を使用して、対象のRFC1の遺伝子座における反復伸長のステータスを確認することを含む。1つ又は複数の診断方法は、ポリメラーゼ連鎖反応(PCR)及びサンガー配列決定、サザンブロット、及び連鎖分析を含み得る。
【0008】
いくつかの実施形態において、対象は、RFC1の遺伝子座において反復伸長を有する2つの対立遺伝子を有する。いくつかの実施形態において、RFC1の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値よりも大きいことを決定することを含む。RFC1の遺伝子座における反復伸長のステータスを決定することは、RFC1の遺伝子座における反復伸長のステータスを病原性ステータスとして決定することを含み得る。
【0009】
いくつかの実施形態において、RFC1の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下及び第2のステータス閾値以上であることを決定することを含む。RFC1の遺伝子座における反復伸長のステータスを決定することは、RFC1の遺伝子座における反復伸長のステータスをキャリアステータスとして決定することを含み得る。
【0010】
いくつかの実施形態において、RFC1の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下及び第2のステータス閾値以上であることを決定することを含む。RFC1の遺伝子座における反復伸長のステータスを決定することは、病原性反復配列の出現数の頻度表示を決定することと、病原性反復配列と高い配列類似性を有する配列が第3のステータス閾値より大きいことを決定することと、を含み得る。例えば、病原性反復配列及び病原性反復配列に類似する配列は、1塩基異なり得る。RFC1の遺伝子座における反復伸長のステータスを決定することは、病原性配列の出現数の頻度表示が第4のステータス閾値より大きいと決定することを含み得る。RFC1の遺伝子座における反復伸長のステータスを決定することは、RFC1の遺伝子座における反復伸長のステータスをキャリアステータスとして決定することを含み得る。
【0011】
いくつかの実施形態では、RFC1の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第2のステータス閾値未満であると決定することを含む。RFC1の遺伝子座における反復伸長のステータスを決定することは、RFC1の遺伝子座における反復伸長のステータスを良性ステータスとして決定することを含み得る。
【0012】
いくつかの実施形態において、対象は、RFC1の遺伝子座において反復伸長を有するRFC1の1つの対立遺伝子を有する。いくつかの実施形態では、複数の配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することは、複数の配列リードのアラインメントされた配列リードにおける、RFC1の遺伝子座において反復伸長を有する1つの対立遺伝子に由来する複数のアラインメントされた配列リードにおける複数の反復配列の出現数を決定することを含む。RFC1の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値よりも大きいことを決定することを含み得る。RFC1の遺伝子座における反復伸長のステータスを決定することは、RFC1の遺伝子座における反復伸長のステータスを病原性ステータスとして決定することを含み得る。
【0013】
いくつかの実施形態では、複数の配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することは、複数の配列リードのアラインメントされた配列リードにおける、RFC1の遺伝子座において反復伸長を有する1つの対立遺伝子に由来する複数のアラインメントされた配列リードにおける複数の反復配列の出現数を決定することを含む。RFC1の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下であると決定することを含み得る。RFC1の遺伝子座における反復伸長のステータスを決定することは、RFC1の遺伝子座における反復伸長のステータスをキャリアステータスとして決定することを含み得る。
【0014】
いくつかの実施形態では、方法は、アラインメントされた配列リードのアラインメントに基づいて、RFC1の遺伝子座において反復伸長を有するRFC1の1つの対立遺伝子に由来するアラインメントされた配列リードを選択することを含む。いくつかの実施形態では、RFC1の遺伝子座における反復伸長を有するRFC1の1つの対立遺伝子に由来するアラインメントされた配列リードは、(i)イン反復リード、又は(ii)それぞれが反復伸長重複閾値より大きいRFC1の遺伝子座における反復伸長に対する重複を有する隣接リードであるアラインメントされた配列リードを含む。反復伸長重複閾値は、約60塩基対であり得る。RFC1の遺伝子座において反復伸長を有するRFC1の1つの対立遺伝子に由来するアラインメントされた配列リードは、(i)イン反復リードである全てのアラインメントされた配列リードと、(ii)隣接リードであるアラインメントされた配列リードの全てではない配列リードとを含み得る。
【0015】
いくつかの実施形態において、対象は、RFC1の遺伝子座において反復伸長を有する0個の対立遺伝子を有する。RFC1の遺伝子座における反復伸長のステータスは良性ステータスであり得る。
【0016】
いくつかの実施形態では、RFC1の遺伝子座における反復伸長は、1つ又はそれを超える反復配列の閾値総コピーを含む。一又は複数の反復配列の閾値総コピー数は、一又は複数の反復配列の総コピー数20であり得る。いくつかの実施形態では、複数の反復配列の各々は、第1の出現閾値以上の出現数を有し、各発生は、各々が第1の品質閾値以上の品質スコアを有する塩基の数を有する。第1の出現閾値は2であり得る。第1の品質閾値は約20であり得る。それぞれが第1の品質閾値より大きい品質スコアを有する反復配列の塩基の数は5であり得る。いくつかの実施形態では、出現の各々は、各々が第2の品質閾値以上の品質スコアを有する基底の数を有する。第2の品質閾値は約20であり得る。第2の品質閾値よりも大きい品質スコアを有する各出現の塩基の数は3であり得る。
【0017】
いくつかの実施形態において、反復配列表現は縮重である。反復配列表現はAARRGであり得る。反復配列表現は、少なくとも5塩基長であり得る。反復配列表現は、5塩基長であり得る。反復配列表現は、6塩基長であり得る。複数の反復配列のそれぞれは、少なくとも5塩基長であり得る。複数の反復配列のそれぞれは、5塩基長であり得る。複数の反復配列のそれぞれは、6塩基長であり得る。病原性反復配列は、AAGGG又はACAGGであり得る。病原性反復配列は、少なくとも60%のGC含有量を有し得る。
【0018】
いくつかの実施形態において、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示は、複数の反復配列の出現の総数からの病原性反復配列の出現数のパーセンテージである。複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示は、複数の反復配列の出現の総数に対する病原性反復配列の出現数の比であり得る。
【0019】
いくつかの実施形態において、複数の配列リードは、RFC1の遺伝子座にアラインメントされる。いくつかの実施形態において、得られた試料から生成された複数の配列リードを受け取ることは、複数の配列リードを含む第2の複数の配列リードを参照ゲノム配列にアラインメントすることを含む。得られた試料から生成された複数の配列リードを受け取ることは、第2の複数の配列リードから複数の配列リードを選択することであって、複数の配列リードがRFC1の遺伝子座にアラインメントされる、ことを含み得る。
【0020】
いくつかの実施形態では、複数の配列リードは、それぞれが約100塩基対~約1000塩基対の長さである配列リードを含む。複数の配列リードは、ペアエンド配列リードを含み得る。複数の配列リードは、シングルエンド配列リードを含み得る。複数の配列リードは、標的配列決定及び/又は全ゲノム配列決定(WGS)によって生成され得、場合により、WGSが臨床用WGS(cWGS)である。いくつかの実施形態では、試料は、細胞、無細胞DNA、無細胞胎児DNA、羊水、血液試料、生検試料、又はそれらの組み合わせを含む。いくつかの実施形態において、参照ゲノム配列は、参照ヒトゲノム配列を含む。対象はヒト対象であり得る。
【0021】
本明細書に開示されるのは、目的の遺伝子の反復伸長ステータスを決定するためのシステムを含む。いくつかの実施形態において、目的の遺伝子の反復伸長ステータスを決定するためのシステムは、実行可能命令を記憶するように構成された非一時的メモリと、非一時的メモリと通信するプロセッサ(例えば、ハードウェアプロセッサ又は仮想プロセッサ)と、を含む。プロセッサは、実行可能命令によって、(a)対象から得られた試料から生成された複数の配列リードを受け取ることを行うようにプログラムされ得る。プロセッサは、実行可能命令によって、(b)複数のアラインメントされた配列リードを生成するために配列グラフに複数の配列リードをアラインメントすることを実行するようにプログラムされ得る。配列グラフは、目的の遺伝子の遺伝子座を表すことができる。配列グラフは、遺伝子の遺伝子座の非反復配列に隣接する反復配列表現を含むことができる。複数のアラインメントされた配列リードは、複数の配列リードを含み得る。複数のアラインメントされた配列リードは、配列グラフに対する複数の配列リードのアラインメントを含み得る。プロセッサは、実行可能命令によって、(c)第1の出現閾値及び第1の品質閾値を使用して、複数のアラインメントされた配列リードのうちのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することを行うようにプログラムされ得る。プロセッサは、(d)複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を決定することを実行するように実行可能命令によってプログラムすることができる。プロセッサは、実行可能命令によって、(e)複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を使用して、対象の目的の遺伝子の遺伝子座における反復伸長のステータスを決定することを実行するようにプログラムすることができる。
【0022】
いくつかの実施形態において、目的の遺伝子は、複製因子Cサブユニット1(RFC1)である。反復伸長を有する目的の遺伝子の遺伝子座は、hg38の約chr4:39348424又は別の参照ゲノム配列の対応する位置にある。反復伸長は、疾患に関連し得るか、又は疾患を引き起こし得る。この疾患は、小脳性運動失調、ニューロパシー、及び前庭動眼反射症候群(CANVAS)であり得る。反復配列表現はAARRGであり得る。病原性反復配列は、AAGGG又はACAGGであり得る。
【0023】
いくつかの実施形態では、プロセッサは、複数のアラインメントされた配列リードを使用して、対象が、目的の遺伝子の遺伝子座において反復伸長を有する0個、1個又は2個の対立遺伝子を有すると決定することを行うように実行可能命令によってプログラムされる。いくつかの実施形態において、目的の遺伝子の遺伝子座における反復伸長のステータスは、病原性のステータス、キャリアのステータス又は良性のステータスである。反復伸長は、疾患に関連し得るか、又は疾患を引き起こし得る。疾患は神経疾患であり得る。いくつかの実施形態では、プロセッサは、実行可能命令によって、1つ又は複数の診断システムを使用して決定された対象の目的の遺伝子の遺伝子座での反復伸長のステータスの立体配座を受け取ることを実行するようにプログラムされる。1つ又は複数の診断システムは、ポリメラーゼ連鎖反応(PCR)及びサンガー配列決定、サザンブロット、及び連鎖分析を含み得る。
【0024】
いくつかの実施形態において、対象は、目的の遺伝子の遺伝子座において反復伸長を有する2つの対立遺伝子を有する。いくつかの実施形態において、目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値よりも大きいことを決定することを含む。目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、目的の遺伝子の遺伝子座における反復伸長のステータスを病原性ステータスとして決定することを含み得る。
【0025】
いくつかの実施形態において、目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下及び第2のステータス閾値以上であることを決定することを含む。目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、目的の遺伝子の遺伝子座における反復伸長のステータスをキャリアステータスとして決定することを含み得る。
【0026】
いくつかの実施形態において、目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下及び第2のステータス閾値以上であることを決定することを含む。目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、病原性反復配列の出現数の頻度表示を決定することと、病原性反復配列と高い配列類似性を有する配列が第3のステータス閾値より大きいことを決定することと、を含み得る。例えば、病原性反復配列及び病原性反復配列に類似する配列は、1塩基異なる。目的の遺伝子の遺伝子座での反復伸長のステータスを決定することは、病原性配列の出現数の頻度表示が第4のステータス閾値より大きいことを決定することを含むことができ、目的の遺伝子の遺伝子座での反復伸長のステータスを決定することは、目的の遺伝子の遺伝子座での反復伸長のステータスをキャリアステータスとして決定することを含むことができる。
【0027】
いくつかの実施形態では、目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第2のステータス閾値未満であると決定することを含む。目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、目的の遺伝子の遺伝子座における反復伸長のステータスを良性ステータスとして決定することを含み得る。
【0028】
いくつかの実施形態では、対象は、目的の遺伝子の遺伝子座に反復伸長を有する目的の遺伝子の1つの対立遺伝子を有する。いくつかの実施形態では、複数の配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することは、目的の遺伝子の遺伝子座において反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来する複数のアラインメントされた配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することを含む。目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値よりも大きいことを決定することを含み得る。目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、目的の遺伝子の遺伝子座における反復伸長のステータスを病原性ステータスとして決定することを含み得る。
【0029】
いくつかの実施形態では、複数の配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することは、目的の遺伝子の遺伝子座において反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来する複数のアラインメントされた配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することを含む。目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下であると決定することを含み得る。目的の遺伝子の遺伝子座における反復伸長のステータスを決定することは、目的の遺伝子の遺伝子座における反復伸長のステータスをキャリアステータスとして決定することを含み得る。
【0030】
いくつかの実施形態では、プロセッサは、実行可能命令によって、アラインメントされた配列リードのアラインメントに基づいて、目的の遺伝子の遺伝子座における反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来するアラインメントされた配列リードを選択することを行うようにプログラムされる。いくつかの実施形態では、目的の遺伝子の遺伝子座において反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来するアラインメントされた配列リードは、(i)イン反復リード、又は(ii)それぞれが反復伸長重複閾値よりも大きい目的の遺伝子の遺伝子座における反復伸長に対する重複を有する隣接するリードであるアラインメントされた配列リードを含み、任意で、反復伸長重複閾値は約60塩基対である。目的の遺伝子の遺伝子座において反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来するアラインメントされた配列リードは、(i)イン反復リードである全てのアラインメントされた配列リード、及び(ii)隣接リードであるアラインメントされた配列リードの全てではない配列リードを含み得る。
【0031】
いくつかの実施形態において、対象は、目的の遺伝子の遺伝子座において反復伸長を有する0個の対立遺伝子を有する。目的の遺伝子の遺伝子座における反復伸長のステータスは良性ステータスであり得る。
【0032】
いくつかの実施形態では、目的の遺伝子の遺伝子座における反復伸長は、1つ又はそれを超える反復配列の閾値総コピーを含む。一又は複数の反復配列の閾値総コピー数は、一又は複数の反復配列の総コピー数20であり得る。いくつかの実施形態では、複数の反復配列の各々は、第1の出現閾値以上の出現数を有し、各出現は、各々が第1の品質閾値以上の品質スコアを有する塩基の数を有する。第1の出現閾値は2であり得る。第1の品質閾値は約20であり得る。それぞれが第1の品質閾値より大きい品質スコアを有する反復配列の塩基の数は5であり得る。いくつかの実施形態では、出現の各々は、各々が第2の品質閾値以上の品質スコアを有する基底の数を有する。第2の品質閾値は約20であり得る。第2の品質閾値よりも大きい品質スコアを有する各出現の塩基の数は3であり得る。
【0033】
いくつかの実施形態において、反復配列表現は縮重である。反復配列表現及び/又は複数の反復配列のそれぞれは、少なくとも5塩基長であり得る。反復配列表現及び/又は複数の反復配列のそれぞれは、5塩基長であり得る。反復配列表現及び/又は複数の反復配列のそれぞれは、6塩基長であり得る。いくつかの実施形態では、病原性反復配列は、少なくとも60%のGC含有量を有する。
【0034】
いくつかの実施形態では、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示は、複数の反復配列の出現の総数のうちの病原性反復配列の出現数のパーセンテージ、又は複数の反復配列の出現の総数に対する病原性反復配列の出現数の比である。
【0035】
いくつかの実施形態において、複数の配列リードは、目的の遺伝子の遺伝子座にアラインメントされる。いくつかの実施形態において、得られた試料から生成された複数の配列リードを受け取ることは、複数の配列リードを含む第2の複数の配列リードを参照ゲノム配列にアライメントすることを含む。得られた試料から生成された複数の配列リードを受け取ることは、第2の複数の配列リードから複数の配列リードを選択することであって、複数の配列リードが目的の遺伝子の遺伝子座にアラインメントされる、ことを含み得る。
【0036】
いくつかの実施形態では、複数の配列リードは、それぞれが約100塩基対~約1000塩基対の長さである配列リードを含む。複数の配列リードは、ペアエンド配列リードを含む。複数の配列リードは、シングルエンド配列リードを含む。いくつかの実施形態では、複数の配列リードは、標的配列決定及び/又は全ゲノム配列決定(WGS)によって生成され、場合により、WGSが臨床用WGS(cWGS)である。いくつかの実施形態では、試料は、細胞、無細胞DNA、無細胞胎児DNA、羊水、血液試料、生検試料、又はそれらの組み合わせを含む。いくつかの実施形態において、参照ゲノム配列は、参照ヒトゲノム配列を含む。対象はヒト対象であり得る。
【0037】
本明細書に記載されている主題の1以上の実装形態の詳細が、添付の図面及び以下の説明に記述されている。その他の特徴、態様、及び利点は、本明細書、図面、及び特許請求の範囲から明らかになるであろう。本概要も以下の発明を実施するための形態も、本発明の主題の範囲を定義又は制限するものと言っているわけではない。
【図面の簡単な説明】
【0038】
【
図1】RFC1遺伝子座を表す配列グラフの非限定的な例示的概略図、並びに、反復と重複するリードを、スパンリード、イン反復リード及びフランキングリードとして分類することを示す図である。
【
図2】反復と重複する患者試料のリードの非限定的な例示的視覚化を示す図である。患者は、PCRによって2つの伸長AAGGGハプロタイプを有することが確認された。
【
図3】反復と重複する患者試料のリードの非限定的な例示的視覚化を示す図である。ヒト患者は推定患者であった。しかし、PCRは推定を検証しなかった。PCRは、AAGGG反復の代わりにAAGAG反復を示唆した。
【
図4A】非限定的な例示的な5merフィルタリング及びカウントの概略図である。
【
図4B】非限定的な例示的な5merフィルタリング及びカウントの概略図である。
【
図5A】キャリアが2つのハプロタイプについてより良好な分離を必要とすることを示す図である。
【
図5B】キャリアが2つのハプロタイプについてより良好な分離を必要とすることを示す図である。
【
図6A】伸長された対立遺伝子に由来する配列リードの非限定的な例示的な概略図である。
【
図6B】伸長された対立遺伝子に由来する配列リードの非限定的な例示的な概略図である。
【
図7】75人の患者のコホートにおける、一方の短い対立遺伝子及び一方の伸長対立遺伝子を有する試料についての伸長対立遺伝子における5mer反復の割合を示す図である。
【
図8】150人の血縁関係のない健康な個体のPolaris集団について、一方の短い対立遺伝子及び一方の伸長対立遺伝子を有する試料についての伸長対立遺伝子における5mer反復の割合を示す図である。
【
図9】RFC1反復伸長ステータスを決定する例示的な方法を示すフロー図である。
【
図10】目的の遺伝子(例えば、RFC1)の反復伸長ステータスを決定する例示的な方法を示すフロー図である。
【
図11】目的の遺伝子(例えば、RFC1)の反復伸長ステータスの決定を実施するように構成された例示的なコンピューティングシステムのブロック図である。
【0039】
図面全体を通して、参照番号は、参照要素間の対応を示すために再使用されてもよい。図面は、本明細書に記載される例示的実施形態を図示するために提供され、本開示の範囲を限定することを意図するものではない。
【発明を実施するための形態】
【0040】
以下の詳細な説明では、添付の図面を参照し、添付の図面は本明細書の一部をなす。図面において、同様の記号は、文脈上特に指示されない限り、典型的には同様の構成要素を特定する。詳細な説明、図面、及び特許請求の範囲に記載される例示的な実施形態は、限定することを意図するものではない。本明細書に提示される主題の趣旨又は範囲から逸脱することなく、その他の実施形態を利用することができ、その他の変更を加えることができる。本開示の態様は、本明細書に全般的に記載され、図面に例示されるように、多種多様な異なる構成で配置され、置換され、組み合わされ、分離され、及び設計され得ることが容易に理解され、それらの全てが本明細書で明示的に企図されており、本明細書の開示の一部をなす。
【0041】
本明細書で参照される全ての特許、公開された特許出願、その他の刊行物、及びGenBankからの配列、及び本明細書で参照されるその他のデータベースは、関連技術に関してそれら全体が本明細書に参照により組み込まれる。
【0042】
複製因子Cサブユニット1(RFC1)反復伸長ステータスを決定するための方法が本明細書に開示される。いくつかの実施形態において、RFC1反復伸長ステータスを決定するための方法は、(ハードウェアプロセッサ又は仮想プロセッサなどの)プロセッサの制御下にあり、(a)対象から得られた試料から生成された複数の配列リードを受け取ることを含む。本方法は、(b)複数のアラインメントされた配列リードを生成するために、複数の配列リードを配列グラフにアラインメントすることを含み得る。配列グラフはRFC1の遺伝子座を表すことができる。配列グラフは、RFC1の遺伝子座の非反復配列に隣接する反復配列表現を含み得る。複数のアラインメントされた配列リードは、複数の配列リードと、配列グラフに対する複数の配列リードのアラインメントとを含み得る。本方法は、(c)第1の出現閾値及び第1の品質閾値を使用して、複数のアラインメントされた配列リードのうちのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することを含み得る。方法は、(d)複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を決定することを含み得る。方法は、(e)複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を使用して、対象のRFC1の遺伝子座における反復伸長のステータスを決定することを含み得る。
【0043】
本明細書に開示されるのは、目的の遺伝子の反復伸長ステータスを決定するためのシステムを含む。いくつかの実施形態において、目的の遺伝子の反復伸長ステータスを決定するためのシステムは、実行可能命令を記憶するように構成された非一時的メモリと、非一時的メモリと通信するプロセッサ(例えば、ハードウェアプロセッサ又は仮想プロセッサ)と、を含む。プロセッサは、実行可能命令によって、(a)対象から得られた試料から生成された複数の配列リードを受け取ることを行うようにプログラムされ得る。プロセッサは、実行可能命令によって、(b)複数のアラインメントされた配列リードを生成するために配列グラフに複数の配列リードをアラインメントすることを実行するようにプログラムされ得る。配列グラフは、目的の遺伝子の遺伝子座を表すことができる。配列グラフは、遺伝子の遺伝子座の非反復配列に隣接する反復配列表現を含むことができる。複数のアラインメントされた配列リードは、複数の配列リードを含み得る。複数のアラインメントされた配列リードは、配列グラフに対する複数の配列リードのアラインメントを含み得る。プロセッサは、実行可能命令によって、(c)第1の出現閾値及び第1の品質閾値を使用して、複数のアラインメントされた配列リードのうちのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することを行うようにプログラムされ得る。プロセッサは、(d)複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を決定することを実行するように実行可能命令によってプログラムすることができる。プロセッサは、実行可能命令によって、(e)複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を使用して、対象の目的の遺伝子の遺伝子座における反復伸長のステータスを決定することを実行するようにプログラムすることができる。
【0044】
病原性RFC1伸長の決定
複製因子Cサブユニット(RFC1)遺伝子における二対立遺伝子イントロンAAGGG反復伸長は、近年、家族性小脳性運動失調、ニューロパシー、及び前庭反射消失症候群(CANVAS)の原因、並びに遅発性運動失調の頻繁な原因として発見されている。一般集団では、この反復伸長は非常に多様であり、多くの異なる良性反復パターンを有する。この病原性AAGGG伸長のための現在の診断方法としては、ポリメラーゼ連鎖反応(PCR)及びサンガー配列決定、サザンブロット及び連鎖分析が挙げられるが、これらの方法の全ては、時間がかかり、そして大規模に実施され得ない。これらの方法と比較して、臨床全ゲノム配列決定(cWGS)スクリーニングは、この伸長を大規模な並行方法で同定することを可能にする。しかしながら、cWGSデータからこの病原性伸長を特定するための自動化された正確な方法はない。現在、この病原性伸長は、ExpansionHunter(Dolzhenko,E.et al.ExpansionHunter Denovo:a computational method for locating known and novel repeat expansions in short-read sequencing data.Genome Biol 21,102(2020).https://doi.org/10.1186/s13059-020-02017-z、その内容は、その全体が参照により本明細書に組み込まれる)によるアライメント等、アラインメントからのリードの手動試験によって同定される。試料サイズが大きい場合、この手動スクリーニングは非常に時間がかかる。
【0045】
更に、この高GCゲノム領域では、ペアエンドリードの塩基品質が低下する。この品質低下は、繰り返しパターンが何であるかと相関する。これは、特に病原性AAGGG又は他の高GC反復パターンがある場合、手動スクリーニングを更に困難にし、間違いを起こしやすくする。そのため、この病原性反復をペアエンドcWGSデータから正確に診断することは不可能であるという意見があった。
【0046】
本明細書では、cWGSデータなどの配列決定データからこの病原性伸長を自動的かつ正確にスクリーニングする方法が開示される。この病原性反復を配列決定データからスクリーニングする他の方法はない。本方法は、本明細書に記載のロジックを実装して、この領域におけるデータ品質の低下に起因するアーチファクトを最小化する。例えば、一cWGS試料について、従来の方法では80を超える異なる反復パターンが決定され、AAGGGの割合はわずか約64%であった。比較して、同じ試料について、本開示の方法はわずかな異なる反復パターンしか決定せず、AAGGGの割合は90%を超えた。この方法は、実際の病原性反復を良性反復から分離するための規則を実施する。この方法は、大集団を迅速にスクリーニングし、二重に伸長したAAGGG反復を有する患者、一方のハプロタイプ上に伸長したAAGGG反復を有し、他方のハプロタイプ上に良性反復を有するキャリア、及びいずれかのハプロタイプ上に伸長したAAGGGを有しない正常な人々を出力することができる。1つの30×cWGS試料では、この方法はスクリーニング結果を出力するのに1秒未満かかった(ExpansionHunterが実行された後)。
【0047】
RFC1における反復伸長は、CANVASの原因として特定されている。GRCh38では、RFC1は、chr4:39348424-39348479に(AAAAG)11反復を有する。(AAAAG)exp及び場合によっては(AAAGG)expなど、他にも多くの良性の伸長パターンが存在し得る。ホモ接合性(AAGGG)exp及び(ACAGG)expは病原性であると同定されている。病原性RFC1伸長の診断方法には、PCR及びサンガーシーケンシング、サザンブロット、連鎖解析、及び臨床全ゲノム配列決定(cWGS)スクリーニングが含まれる。PCR及びサンガー配列決定は、突然変異体及び野生型のために異なるプライマーを利用する。しかしながら、長距離PCRは反復領域においてより誤りやすい。サザンブロットはPCRよりも困難である。サザンブロットは、二対立遺伝子の大きな伸長の存在を確認することができる。サザンブロットは、それらがどのような伸長であるかを示さない。連鎖解析に関して、ファミリーベースの研究では、突然変異体についていくつかの連鎖不平衡(LD)一塩基多型(SNP)が同定されている。しかしながら、いくつかの系統は、SNPが病原性反復を有するLDであることを保証しない。
【0048】
この病原性伸長は、例えばExpansionHunter(EH)アラインメントからのリードの手動検査によるcWGSスクリーニングによって同定することができる。スクリーニングは、参照AAAAG及び病原性AAGGGが同時に遺伝子型決定され得るように、(AARRG)
n(RはA又はGである)(
図1)の構築された反復グラフで、ExpansionHunterによって実施することができる。グラフアラインメントにおいて、反復と重複するリードは、
図1に示されるように、スパンディングリード、イン反復リード及びフランキングリードとして分類され得る。反復が反復の両端に反復及び隣接領域を含むように、反復がリード長よりも短い場合、スパンニング読み出しが起こり得る。反復がリード長より長い場合、イン反復リードは、全リード(シングルエンドシーケンシングリードであってもペアエンドシーケンシングリードであっても)又はペアエンドシーケンシングリードの1回のリードが反復の一部のみを含み、反復の隣接領域を含まないように起こり得る。フランキングリードは、反復の一部及び反復の一端のフランキング領域を含む。
【0049】
手動検査によるcWGSスクリーニングで病原性伸長を同定するために、反復と重複する全てのリードをEH視覚化ツールによって視覚化することができる。リードを調べて、そのリードが病原性(AAGGG)
nを含むかどうかを調べることができる。
図2は、反復と重複するヒト患者試料のリードの可視化を示す。ヒト患者FAM-092-D12は、PCRによって、2つの伸長したAAGGGハプロタイプを有することが確認された。
図2に示されるように、リードは、主にAAGGGを含有するイン反復リード及びフランキングリードのいずれかであった。反復はリード長よりも長いので、スパンニングリードは観察されなかった。しかしながら、手動検査は困難で不正確であり得る。例えば、2つの異なるハプロタイプを区別することは困難であり得る。病原性反復(例えば、AAAGG)と同様のパターンは、偽陽性コールをもたらし得る。
図3は、反復と重複する患者試料のリードの可視化を示す。ヒト患者FAM-062-F08は推定患者であった。しかし、PCRは推定を検証しなかった。
図3に示すように、これらが何の反復であるかを素目で見分けることは困難である。PCRは、AAGGG反復の代わりにAAGAG反復を示唆した。
【0050】
本明細書では、cWGSデータなどの配列決定データからこの病原性伸長を自動的かつ正確にスクリーニングする方法が開示される。グラフアラインリードでは、反復重複部分において各5量体が何回観察されたかをカウントすることができる。いくつかの実施形態では、低下したデータ品質からのノイズを最小化するために、以下の基準を使用することができる:各タイプの5量体は、5つ全ての塩基が品質閾値(例えば、20)以上の品質(Q)を有する2つの出現を有する。
図4Aを参照すると、20以上の品質を有するベースが大文字で示されている。例えば、
図4Aに示す4つのAAAAG/AAaAg/AaaaG 5量体のうち、2つは20以上の品質を有する5つ全ての塩基を有し(AAAAGとして示す5量体)、1つは20以上の品質を有する4つの塩基を有し(AAaAGとして示す5量体)、及び1つは20以上の品質を有する2つの塩基を有していた(AaaaGとして示す5量体)。4つのAAAAG/AAaAg/AaaaG 5量体はこの基準を満たし、計数される。別の例として、
図4Aに示される3つのAAGGG/AAGgG 5量体のうち、2つは20以上の品質を有する5つ全ての塩基を有し(AAGGGとして示される5量体)、1つは20以上の品質を有する4つの塩基を有した(AAGgGとして示される5量体)。3つ全てのAAGGG/AAGgG 5量体がこの基準を満たし、計数される。更なる例として、
図4Aに示される2つの残りの5量体のうちの1つは、20以上の品質を有する5つ全ての塩基を有し(AGGGGとして示される5量体)、1つは、20以上の品質を有する4つの塩基を有した(AAGaGとして示される5量体)。これらの2つの5量体は、5量体の各タイプが1つの出現を有するので、5量体の各タイプが20の品質閾値以上の品質(Q)を有する5塩基全てを有する2つの出現を有するという基準を満たさない。これら2つの5量体を濾過し、計数しない。
【0051】
いくつかの実施形態では、低下したデータ品質からのノイズを最小限に抑えるために、以下の基準を使用することができる:各タイプの5量体は、5つ全ての塩基が品質閾値(例えば、20)以上の品質(Q)を有する2つの出現を有し、カウントされた各5量体は、品質閾値(例えば、20)以上の品質を有する少なくとも3つの塩基を有する。
図4Bを参照すると、20以上の品質を有するベースが大文字で示されている。例えば、
図4Bに示す4つのAAAAG/AAaAg/AaaaG 5量体のうち、2つは20以上の品質を有する5つ全ての塩基を有し(AAAAGとして示す5量体)、1つは20以上の品質を有する4つの塩基を有し(AAaAGとして示す5量体)、及び1つは20以上の品質を有する2つの塩基を有していた(AaaaGとして示す5量体)。AAAAG/AAaAg 5量体は基準を満たし、計数される。AaaaG 5量体は基準を満たさず(この5量体は20以上の品質を有する2つの塩基のみを有するため)、フィルタリングされ、計数されない。別の例として、
図4Bに示される3つのAAGGG/AAGgG 5量体のうち、2つは20以上の品質を有する5つ全ての塩基を有し(AAGGGとして示される5量体)、1つは20以上の品質を有する4つの塩基を有した(AAGgGとして示される5量体)。3つ全てのAAGGG/AAGgG 5量体が基準を満たし、計数される。更なる例として、
図4Bに示される2つの残りの5量体のうちの1つは、20以上の品質を有する5つ全ての塩基を有し(AGGGGとして示される5量体)、1つは、20以上の品質を有する4つの塩基を有した(AAGaGとして示される5量体)。これらの2つの5量体は、5量体の各タイプが1つの出現を有するので、5量体の各タイプが20の品質閾値以上の品質(Q)を有する5塩基全てを有する2つの出現を有するという基準を満たさず、フィルタリングされ、計数されない。
【0052】
患者試料の配列リードを処理し、基準を使用して5merカウントを行った。実際の患者は、ほぼ100%のAAGGG(病原性反復)を有していた。5量体フィルタリング及び計数規則により、PCR検証患者FAM-062-F08において93%のAAGGGが観察された(
図2及び添付の説明を参照されたい)。他の5量体はAAAGG(2%)及びGGGGG(5%)であった。これらの他の5量体は、配列決定エラー/アーチファクトに起因する可能性が非常に高い。
【0053】
図5A~
図5Bに示すように、キャリアは、2つのハプロタイプについてより良好な分離を必要とする。伸長対立遺伝子からのリードでは、キャリアはほぼ100%のAAGGGを有していた。1つの伸長された対立遺伝子を有するキャリアである患者について、患者の試料の配列リードを処理し、基準を使用して5merのフィルタリング及びカウントを行った。計数基準を5量体フィルタリングすると、患者は75%AAGGGを有することが観察された(
図5A)。基準を使用して5merフィルタリングを行い、伸長対立遺伝子からのリードをカウントすることによって、患者は93%AAGGGを有することが観察された。
図6A~6Bを参照すると、スパンリードは、短い対立遺伝子に由来する。反復との重複が短い隣接するリードについては、そのリードがどの対立遺伝子に由来するかが不確実である。
図6Bに示される残りのフランキングリード及びイン反復リードは、伸長された対立遺伝子に由来する。
【0054】
予想(より早期の発症又はその後の世代におけるより重度の表現型)及び/又は神経障害症状などの反復伸長の徴候を示す77人の患者の試料をcWGSに供した。これらの患者は、いくらかの病原性RFC1反復伸長を有すると疑われた。彼らのいずれも、既知の伸長の臨床文書を有していなかった。これらの試料における反復伸長を同定できないことは、試験が不十分であるため、又は以前は未知であった病原性反復伸長と関連している可能性がある。一般的なExpensionHunterスクリーニングでは、少数の患者でRFC1が「伸長」として特定された。以前に、実際のRFC1患者は、反復に1つずつアラインメントされた配列リードを手作業で調べることによって同定された。本開示の方法は、RFC1ステータス(病原性、キャリア、又は良性及び/又は0、1、又は2などの伸長の数)の自動スクリーニングに使用することができる。77名の患者コホートにおけるRFC1伸長のパターンを調べた。RFC1において反復をスクリーニングするとき、参照対立遺伝子についてはAAAAGについて85%以上を使用し、病原性対立遺伝子についてはAAGGGについて85%以上を使用した。伸長対立遺伝子を見ることによって、反復パターンを同定した。
図7は、75人の患者コホートにおける、一方の短い対立遺伝子及び一方の伸長対立遺伝子を有する試料についての伸長対立遺伝子における5mer反復の割合を示す。表1は、以下の基準を使用した患者コホートのスクリーニング結果を示す:
2つの伸長対立遺伝子及び85%を超えるAAGGG反復の場合、病原性である。
1つの伸長対立遺伝子及び85%を超えるAAGGG反復の場合、又は2つの伸長対立遺伝子及び30%の-85%AAGGG反復の場合、キャリアである。
伸長対立遺伝子がない場合、1つの伸長対立遺伝子及び85%未満のAAGGG反復の場合、又は2つの伸長対立遺伝子及び30%未満のAAGGG反復の場合、良性である。
【0055】
【0056】
150人の血縁関係のない健康な個体のPolaris集団におけるRFC1反復のパターンを調べた。Polaris集団は、ヨーロッパ系、東アジア系、及びアフリカ人の多様な集団である。
図8は、このPolaris集団について1つの短い対立遺伝子及び1つの伸長対立遺伝子を有する試料についての伸長対立遺伝子における5mer反復の割合を示す。分析は、AAGGG及び他の多くのパターンについて高い頻度を示す。表1は、以下の基準を使用したPolaris集団に対するスクリーニング結果を示す:
2つの伸長対立遺伝子及び85%を超えるAAGGG反復の場合、病原性である。
1つの伸長対立遺伝子及び85%を超えるAAGGG反復の場合、又は2つの伸長対立遺伝子及び30%の-85%AAGGG反復の場合、キャリアである。
伸長対立遺伝子がない場合、1つの伸長対立遺伝子及び85%未満のAAGGG反復の場合、又は2つの伸長対立遺伝子及び30%未満のAAGGG反復の場合、良性である。
【0057】
【0058】
RFC1反復伸長ステータスの決定
図9は、複製因子Cサブユニット1(RFC1)反復伸長ステータスを決定する例示的な方法900を示すフロー図である。方法900は、コンピューティングシステムの1つ以上のディスクドライブなどのコンピュータ可読媒体上に記憶された実行可能プログラム命令のセット内で具現化されてもよい。例えば、
図11に示され、以下でより詳細に説明されるコンピューティングシステム1100は、方法900を実施するための実行可能プログラム命令のセットを実行することができる。方法900が開始された場合、実行可能プログラム命令は、RAMなどのメモリにロードされ、コンピューティングシステム1100の1つ以上のプロセッサによって実行することができる。方法900は、
図11に示されるコンピューティングシステム1100について説明されているが、説明は単なる例示であり、限定することを意図するものではない。いくつかの実施形態では、方法900又はその部分は、複数のコンピューティングシステムによって連続的に又は並列に実行されてもよい。
【0059】
方法900がブロック904で開始した後、方法900はブロック908に進み、コンピューティングシステム(例えば、
図11を参照して説明したコンピューティングシステム1100)が、対象から得られた試料から生成された複数の配列リードを受信する。配列リードは、例えば、それぞれ50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、300、400、500、600、700、800、900、1000、1250、1500、1750、2000又はそれ以上の塩基対(bps)の長さであり得る。例えば、配列リードは、それぞれ約100塩基対~約1000塩基対の長さである。配列リードは、ペアエンド配列リードを含み得る。配列リードは、シングルエンド配列リードを含み得る。配列リードは、標的化配列決定によって生成され得る。配列リードは、全ゲノムシーケンシング(WGS)によって生成することができる。配列リードは、全ゲノムシーケンシング(WGS)によって生成することができる。WGSは臨床用WGS(cWGS)であり得る。試料は、細胞、無細胞DNA、無細胞胎児DNA、羊水、血液試料、生検試料、又はそれらの組み合わせを含み得る。対象はヒト対象であり得る。
【0060】
受け取られる配列リードは、RFC1の遺伝子座からのリードのみを含み得る。例えば、複数の配列リードは、RFC1の遺伝子座にアラインメントされ得る。あるいは、受け取られる配列リードは、RFC1及び他の場所の遺伝子座からのリードを含み得る。コンピューティングシステムは、RFC1の遺伝子座にアラインメントされた複数の配列リードを含む第2の複数の配列リードを参照ゲノム配列にアラインメントすることができる。参照ゲノム配列は、hg19又はhg38などの参照ヒトゲノム配列を含むことができる。コンピューティングシステムは、第2の複数の配列リードから、RFC1の遺伝子座にアラインメントされた複数の配列リードを選択することができる。
【0061】
コンピューティングシステムは、配列リードをメモリに記憶することができる。コンピューティングシステムは、配列リードをメモリにロードすることができる。配列リードは、合成による配列決定、結合による配列決定、又はライゲーションによる配列決定などの技術によって生成することができる。配列リードは、Illumina,Inc.(San Diego,CA)からのMINISEQ、MISEQ、NEXTSEQ、HISEQ及びNOVASEQ配列決定機器などの機器を使用して生成することができる。
【0062】
方法900はブロック908からブロック912に進み、ここで、コンピューティングシステムは、複数のアラインメントされた配列リードを生成するために、複数の配列リードを配列グラフにアラインメントする。配列グラフはRFC1の遺伝子座を表すことができる。配列グラフは、RFC1の遺伝子座の非反復配列が隣接する反復配列表現(例えば、RがA又はGであるAARRG)を含むことができる。複数のアラインメントされた配列リードは、複数の配列リード、及び配列グラフに対する複数の配列リードのアラインメントを含み得るか、又はそれらと関連付けられ得る。
【0063】
方法900はブロック912からブロック916に進み、ここで、コンピューティングシステムは、第1の出現閾値(例えば、2)及び第1の品質閾値(例えば、20)を使用して、複数のアラインメントされた配列リードのうちのアラインメントされた配列リードにおける複数の反復配列(例えば、AAGGG、AAAAG、AAAGG、AAGAG、AACGG、及びACGGG)の出現数を決定する。第1の出現閾値及び第1の品質閾値を使用して、複数のアラインメントされた配列リードのうちのアラインメントされた配列リードにおける複数の反復配列の出現数を決定又はカウントすることは、本明細書では5merフィルタリング及びカウントと呼ばれる。5量体のフィルタリング及び計数は、両方の対立遺伝子又は伸長された対立遺伝子に対するものであり得る。
【0064】
RFC1の遺伝子座における反復伸長は、1つ又はそれを超える反復配列の閾値総コピー(例えば、合計20コピー)を含み得る。一又は複数の反復配列の閾値総コピーは、例えば、一又は複数の反復配列の15、16、17、18、19、20、30、40、50、60、70、80、90,100又はそれ以上若しくはそれ以下の総コピーであり得る。
【0065】
いくつかの実施形態において、複数の反復配列のそれぞれは、第1の出現閾値以上(又はそれ以上)の出現数を有し、各発生は、それぞれが第1の品質閾値以上の品質スコアを有する多数の塩基を有する。第1の出現閾値は、例えば、2、3、4、5、6、7、8、9、10以上とすることができる。第1の品質閾値は、例えば、約10、15、20、25、30、35、40、45、50、又はそれ以上又はそれ以下とすることができる。それぞれが第1の品質閾値より大きい(又はそれ以上の)品質スコアを有する反復配列の塩基の数は、例えば4又は5であり得る。例えば、各タイプの5量体は、20の品質閾値(例えば、第1の品質閾値)以上の品質(Q)を有する5つ全ての塩基を有する2つの出現を有する。いくつかの実施形態では、各出現は、各々が第2の品質閾値以上(又はより大きい)の品質スコアを有するいくつかの基底を有する。第2の品質閾値以上(又はそれ以上)の品質スコアをそれぞれ有する塩基の数は、例えば、2、3、4、又は5であり得る。第2の品質閾値は、例えば、約10、15、20、25、30、35、40、45、50、又はそれ以上又はそれ以下とすることができる。第2の品質閾値より大きい品質スコアを有する各出現の塩基の数は、例えば、2、3、4、又は5であり得る。例えば、カウントされた各5量体は、20の品質閾値(例えば、第2の品質閾値)以上の品質を有する少なくとも3個の塩基を有する。いくつかの実施形態では、第1の品質閾値及び第2の品質閾値は同一である。
【0066】
反復配列表現は縮重であり得る。反復配列表現は、RがA又はGであるAARRGであり得る。反復配列表現は、少なくとも5塩基長であり得る。反復配列表現は、5塩基長であり得る。反復配列表現は、6塩基長であり得る。複数の反復配列のそれぞれは、少なくとも5塩基長であり得る。複数の反復配列のそれぞれは、5塩基長であり得る。複数の反復配列のそれぞれは、6塩基長であり得る。反復配列表現及び反復配列は、同一の長さを有することができる。
【0067】
方法900はブロック916からブロック920に進み、コンピューティングシステムが、複数の反復配列の出現の総数に対する、病原性反復配列(例えば、AAGGG又はACAGG)又は1つ若しくは複数の病原性反復配列の出現数の頻度表示を決定する。病原性反復配列は、AAGGG又はACAGGであり得る。病原性反復配列は、少なくとも50%、55%、60%、65%、70%、75%、80%又はそれ以上又はそれ未満のGC含有量を有することができる。病原性反復配列は、少なくとも5塩基長であり得る。病原性反復配列は、5塩基長であり得る。病原性反復配列は、6塩基長であり得る。
【0068】
複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示は、複数の反復配列の出現の総数に対する病原性反復配列の出現数のパーセンテージであり得る。複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示は、複数の反復配列の出現の総数に対する病原性反復配列の出現数の比であり得る。
【0069】
方法900はブロック920からブロック924に進み、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を使用して、対象のRFC1の遺伝子座における反復伸長のステータス(又は反復伸長ステータス)を決定する。RFC1の遺伝子座における反復伸長ステータスは、病原性ステータス、キャリアステータス、又は良性ステータスであり得る。コンピューティングシステムは、対象が、複数のアラインメントされた配列リードを使用して、RFC1の遺伝子座において反復伸長を有する0個、1個又は2個の対立遺伝子を有すると決定し得る。RFC1の遺伝子座における反復伸長は、hg38のchr4:39348424若しくはその付近、又は別の参照ゲノム配列の対応する位置であり得る。反復伸長は、疾患に関連し得るか、又は疾患を引き起こし得る。この疾患は、小脳性運動失調、ニューロパシー、及び前庭動眼反射症候群(CANVAS)又は運動失調であり得る。
【0070】
2つの伸長対立遺伝子両方の対立遺伝子が伸長培養される場合、両方の伸長培養された対立遺伝子の5merカウントを行うことができる。いくつかの実施形態において、対象は、それぞれがRFC1の遺伝子座において反復伸長を有する2つの対立遺伝子を有し得る。
【0071】
2つの伸長対立遺伝子-病原性ステータス。RFC1の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値よりも大きい(又はそれ以上である)と決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、病原性ステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定することができる。
【0072】
2つの伸長対立遺伝子-キャリアステータス。RFC1の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下(又は未満)であり、第2のステータス閾値以上(又は超)であることを決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。第2のステータス閾値は、例えば、10%、15%、20%、25%、30%、35%、40%、45%、50%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、キャリアステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定することができる。
【0073】
2つの伸長対立遺伝子-キャリアステータス。RFC1の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下(又は未満)であり、第2のステータス閾値以上(又は以上)であることを決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。第2のステータス閾値は、例えば、10%、15%、20%、25%、30%、35%、40%、45%、50%、又はそれ以上又はそれ以下とすることができる。
【0074】
コンピューティングシステムは、(1)病原性反復配列及び(2)複数の反復配列の出現の総数に対する病原性反復配列との高い配列類似性を有する配列の出現数の頻度表示を決定することができる。病原性反復配列及び病原性反復配列に対して高い配列類似性を有する配列の配列類似性は、例えば、(約)70%、75%、80%、85%、90%、95%又はそれ以上若しくはそれ以下であり得るか、又はそれ以下であり得る。病原性反復配列及び病原性反復配列に類似する配列は、1、2、3、4、5、6、7、8、9、10又はそれ以上の塩基などの1又は複数の塩基が異なる。病原性反復配列との高い配列類似性を有する配列は、非病原性であり得、及び/又は良性の伸長に関係し得る(例えば、関連)。
【0075】
複数の反復配列の出現の総数に対する、(1)病原性反復配列及び(2)病原性反復配列との高い配列類似性を有する配列の出現数の頻度表示は、複数の反復配列の出現の総数のうちの(1)病原性反復配列及び(2)病原性反復配列との高い配列類似性を有する配列の出現数の百分率であり得る。複数の反復配列の出現の総数に対する、(1)病原性反復配列及び(2)病原性反復配列との高い配列類似性を有する配列の出現数の頻度表示は、複数の反復配列の出現の総数のうちの(1)病原性反復配列及び(2)病原性反復配列との高い配列類似性を有する配列の出現数の比であり得る。
【0076】
コンピューティングシステムは、病原性反復配列の出現数の頻度表示を決定することができ、複数の反復配列の出現の総数に対する病原性反復配列と高い配列類似性を有する配列は、第3のステータス閾値よりも大きい(又はそれ以上)。第3ステータス閾値は、例えば、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。
【0077】
コンピューティングシステムは、病原性配列の出現数の頻度表示が第4のステータス閾値よりも大きい(又はそれ以上である)と決定することができる。第4ステータス閾値は、例えば、5%、10%、15%、20%、25%、30%、又はそれ以上又はそれ以下とすることができる。代替的又は追加的に、コンピューティングシステムは、病原性配列と高い配列類似性を有する配列の出現数の頻度表示を決定することができる。複数の反復配列の出現の総数に対する、病原性反復配列に対して高い配列類似性を有する配列の出現数の頻度表示は、複数の反復配列の出現の総数のうちの病原性反復配列に対して高い配列類似性を有する配列の出現数のパーセンテージであり得る。複数の反復配列の出現の総数に対する、病原性反復配列との高い配列類似性を有する配列の頻度表示は、複数の反復配列の出現の総数に対する病原性反復配列との高い配列類似性を有する配列の出現数の比であり得る。コンピューティングシステムは、病原性配列との高い配列類似性を有する配列の出現数の頻度表示が第5のステータス閾値以下(又はそれ未満)であると決定することができる。第5ステータス閾値は、例えば、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、キャリアステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定することができる。
【0078】
いくつかの実施形態において、コンピューティングシステムは、病原性配列の出現数の頻度表示が第4のステータス閾値以下(又はそれ未満)であると決定する。代替的又は追加的に、コンピューティングシステムは、病原性配列との高い配列類似性を有する配列の出現数の頻度表示が第5のステータス閾値よりも大きい(又はそれ以上である)と決定することができる。コンピューティングシステムは、良性ステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定することができる。
【0079】
例えば、病原性反復配列はAAGGGであり、病原性反復配列と高い配列類似性を有する配列はAAAGGである。2つの配列は80%の配列同一性を有する。2つの配列は、1塩基異なる。全ての反復配列のうちのAAGGG反復配列及びAAAGG反復配列の割合は、80%より大きくてもよい。全反復配列のうちのAAGGG反復配列のパーセンテージは10%超であり得る。あるいは、又は更に、全ての反復配列のうちのAAAGG反復配列のパーセンテージは、90%以下であり得る。コンピューティングシステムは、キャリアステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定することができる。全反復配列の中のAAGGG反復配列の割合が10%以下であり、及び/又は全反復配列の中のAAAGG反復配列の割合が90%より大きい場合、コンピューティングシステムは、RFC1の遺伝子座における反復伸長ステータスを良性ステータスとして決定することができる。
【0080】
2つの伸長対立遺伝子-良性ステータス。RFC1の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第2のステータス閾値未満(又はそれ以下)であると決定することができる。第2のステータス閾値は、例えば、10%、15%、20%、25%、30%、35%、40%、45%、50%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、良性ステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定することができる。
【0081】
1つの伸長対立遺伝子1つの対立遺伝子が伸長され、1つの対立遺伝子が伸長されない場合、伸長された対立遺伝子の5merカウントを行うことができる。いくつかの実施形態において、対象は、RFC1の遺伝子座において反復伸長を有するRFC1の1つの対立遺伝子を有する。
【0082】
1つの伸長対立遺伝子-病原性ステータス。複数の配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定するために、コンピューティングシステムは、RFC1の遺伝子座において反復伸長を有するRFC1の1つの対立遺伝子に由来する複数のアラインメントされた配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することができる。RFC1の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値よりも大きい(又はそれ以上である)と決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、病原性ステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定することができる。
【0083】
1つの伸長対立遺伝子-キャリアステータス。複数の配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定するために、コンピューティングシステムは、RFC1の遺伝子座において反復伸長を有するRFC1の1つの対立遺伝子に由来する複数のアラインメントされた配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することができる。RFC1の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下(又はそれ未満)であると決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、キャリアステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定することができる。
【0084】
1つの伸長対立遺伝子が存在する場合に、病原性ステータス又はキャリアステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、アラインメントされた配列リードのアラインメントに基づいて、RFC1の遺伝子座における反復伸長を有する、RFC1の1つの対立遺伝子に由来するアラインメントされた配列リードを選択することができる。RFC1の遺伝子座における反復伸長を有するRFC1の1つの対立遺伝子に由来するアラインメントされた配列リードは、(i)イン反復リード、又は(ii)それぞれが反復伸長重複閾値より大きいRFC1の遺伝子座における反復伸長に対する重複を有する隣接リードであるアラインメントされた配列リードを含み得る。反復伸長重複閾値は、例えば、30、35、40、45、50、55、60、65、70、75、80、85、90又はそれ以上若しくはそれ以下の塩基対であり得る。RFC1の遺伝子座において反復伸長を有するRFC1の1つの対立遺伝子に由来するアラインメントされた配列リードは、(i)イン反復リードである全てのアラインメントされた配列リードと、(ii)隣接リードであるアラインメントされた配列リードの全てではない配列リードとを含み得る。反復がリード長より長い場合、イン反復リードは、全リード(シングルエンドシーケンシングリードであってもペアエンドシーケンシングリードであっても)又はペアエンドシーケンシングリードの1回のリードが反復の一部のみを含み、反復の隣接領域を含まないように起こり得る。フランキングリードは、反復の一部及び反復の一端のフランキング領域を含む。
【0085】
伸長対立遺伝子なし両方の対立遺伝子が伸長されない場合、両方の対立遺伝子の5merカウントを行うことができる。いくつかの実施形態において、対象は、RFC1の遺伝子座において反復伸長を有する0個の対立遺伝子を有する。RFC1の遺伝子座における反復伸長ステータスは、良性ステータスであり得る。
【0086】
いくつかの実施形態では、コンピューティングシステムは、方法900の任意の結果(中間結果を含む)を含むか又は表す、グラフィカルユーザインターフェースなどのユーザインターフェース(UI)を生成することができる。例えば、UIは、反復伸長ステータスを含むか、又は表すことができる。UIは、例えばダッシュボードを含むことができる。UIは、1つ以上のUI要素を含むことができる。UI要素は、反復伸長ステータスを含むか又は表すことができる。UI要素は、ウィンドウ(例えば、コンテナウィンドウ、ブラウザウィンドウ、テキスト端末、子ウィンドウ、又はメッセージウィンドウ)、メニュー(例えば、メニューバー、コンテキストメニュー、又はメニュー追加)、アイコン、又はタブとすることができる。UI要素は、入力制御(例えば、チェックボックス、ラジオボタン、ドロップダウンリスト、リストボックス、ボタン、トグル、テキストフィールド、又は日付フィールド)用とすることができる。UI要素は、ナビゲーション(例えば、ブレッドクラム、スライダ、検索フィールド、ページ分割、スライダ、タグ、アイコン)とすることができる。UI要素は、情報(例えば、ツールチップ、アイコン、プログレスバー、通知、メッセージボックス、又はモーダルウィンドウ)を提供することができる。UI要素はコンテナ(例えば、アコーディオン)とすることができる。いくつかの実施形態では、コンピューティングシステムは、反復伸長ステータスなどの方法900の任意の結果(中間結果を含む)を含む又は表すレポートを生成することができる。
【0087】
コンピューティングシステムは、1つ又は複数の診断方法を実行させて、対象のRFC1の遺伝子座における反復伸長ステータスを確認することができる。UI又はレポートは、対象のRFC1の遺伝子座での反復伸長ステータスを確認するために1つ又は複数の診断方法が実行されるべきであることを含むか又は示すことができる。コンピューティングシステムは、1つ又は複数の診断方法を使用して決定された対象のRFC1の遺伝子座での反復伸長ステータスの確認を受信することができる。1つ又は複数の診断方法は、ポリメラーゼ連鎖反応(PCR)及びサンガー配列決定、サザンブロット、及び連鎖分析を含み得る。
【0088】
いくつかの実施形態では、方法900の任意の閾値(例えば、出現閾値(例えば、第1の出現閾値)、品質閾値(例えば、第1の品質閾値、又は第2の品質閾値)、閾値総コピー、ステータス閾値(例えば、第1のステータス閾値、第2のステータス閾値、第3のステータス閾値、第4のステータス閾値、又は第5のステータス閾値)、又は反復伸長重複閾値)は、100、200、300、400、500、1000、2000、3000、4000、5000個、又はそれ以上又はそれ以下の試料などの多数の試料を使用して決定することができる。
【0089】
方法900はブロック928で終了する。
【0090】
目的の遺伝子の反復伸長ステータスの決定
図10は、目的の遺伝子の反復伸長のステータス(本明細書では反復伸長ステータスとも呼ばれる)を決定する例示的な方法1000を示すフロー図である。方法1000は、コンピューティングシステムの1つ以上のディスクドライブなどのコンピュータ可読媒体上に記憶された実行可能プログラム命令のセット内で具現化されてもよい。例えば、
図11に示され、以下でより詳細に説明されるコンピューティングシステム1100は、方法1000を実施するための実行可能プログラム命令のセットを実行することができる。方法1000が開始された場合、実行可能プログラム命令は、RAMなどのメモリにロードされ、コンピューティングシステム1100の1つ以上のプロセッサによって実行することができる。方法1000は、
図11に示されるコンピューティングシステム1100について説明されているが、説明は単なる例示であり、限定することを意図するものではない。いくつかの実施形態では、方法1000又はその部分は、複数のコンピューティングシステムによって連続的に又は並列に実行されてもよい。
【0091】
方法1000がブロック1004で開始した後、方法1000はブロック1008に進み、コンピューティングシステム(例えば、
図11を参照して説明したコンピューティングシステム1100)が、対象から得られた試料から生成された複数の配列リードを受信する。配列リードは、例えば、それぞれ50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、300、400、500、600、700、800、900、1000、1250、1500、1750、2000又はそれ以上の塩基対(bps)の長さであり得る。例えば、配列リードは、それぞれ約100塩基対~約1000塩基対の長さである。配列リードは、ペアエンド配列リードを含み得る。配列リードは、シングルエンド配列リードを含み得る。配列リードは、標的化配列決定によって生成され得る。配列リードは、全ゲノムシーケンシング(WGS)によって生成することができる。配列リードは、全ゲノムシーケンシング(WGS)によって生成することができる。WGSは臨床用WGS(cWGS)であり得る。試料は、細胞、無細胞DNA、無細胞胎児DNA、羊水、血液試料、生検試料、又はそれらの組み合わせを含み得る。対象はヒト対象であり得る。
【0092】
受け取られる配列リードは、目的の遺伝子の遺伝子座からのリードのみを含み得る。例えば、複数の配列リードは、目的の遺伝子の遺伝子座にアラインメントされ得る。あるいは、受け取られる配列リードは、目的の遺伝子の遺伝子座及び他の場所からのリードを含み得る。コンピューティングシステムは、目的の遺伝子の遺伝子座にアラインメントされた複数の配列リードを含む第2の複数の配列リードを参照ゲノム配列にアラインメントすることができる。参照ゲノム配列は、hg19又はhg38などの参照ヒトゲノム配列を含むことができる。コンピューティングシステムは、第2の複数の配列リードから目的の遺伝子の遺伝子座にアラインメントされた複数の配列リードを選択することができる。
【0093】
コンピューティングシステムは、配列リードをメモリに記憶することができる。コンピューティングシステムは、配列リードをメモリにロードすることができる。配列リードは、合成による配列決定、結合による配列決定、又はライゲーションによる配列決定などの技術によって生成することができる。配列リードは、Illumina,Inc.(San Diego,CA)からのMINSEQ、MISEQ、NEXTSEQ、HISEQ及びNOVASEQ配列決定機器などの機器を使用して生成することができる。
【0094】
方法1000はブロック1008からブロック1012に進み、ここで、コンピューティングシステムは、複数のアラインメントされた配列リードを生成するために、複数の配列リードを配列グラフにアラインメントする。配列グラフは、目的の遺伝子(例えば、RFC1)の遺伝子座を表すことができる。配列グラフは、遺伝子の遺伝子座の非反復配列が隣接する反復配列表現(例えば、AARRG(式中、RはAであり、又は目的の遺伝子がRFC1である場合はGである))を含むことができる。複数のアラインメントされた配列リードは、複数の配列リードを含み得る。複数のアラインメントされた配列リードは、配列グラフに対する複数の配列リードのアラインメントを含むか、又はそれと関連し得る。
【0095】
方法1000はブロック1012からブロック1016に進み、ここで、コンピューティングシステムは、第1の出現閾値(例えば、2)及び第1の品質閾値(例えば、20)を使用して、複数のアラインメントされた配列リードのうちのアラインメントされた配列リードにおける複数の反復配列(例えば、目的の遺伝子がRFC1である場合、AAGGG、AAAAG、AAAGG、AAGAG、AACGG及びACGGG)の出現数を決定する。第1の出現閾値及び第1の品質閾値を使用して、複数のアラインメントされた配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定又はカウントすることは、本明細書ではn-merフィルタリング及びカウントと呼ばれ、nは反復配列の長さである。n量体のフィルタリング及び計数は、両方の対立遺伝子又は伸長された対立遺伝子に対するものであり得る。
【0096】
目的の遺伝子の遺伝子座における反復伸長は、1つ又はそれを超える反復配列の閾値総コピーを含み得る。一又は複数の反復配列の閾値総コピーは、例えば、一又は複数の反復配列の15、16、17、18、19、20、30、40、50、60、70、80、90,100又はそれ以上若しくはそれ以下の総コピーであり得る。
【0097】
いくつかの実施形態において、複数の反復配列のそれぞれは、第1の出現閾値以上(又はそれを超える)の出現数を有し、各出現は、それぞれが第1の品質閾値以上(又はそれを超える)の品質スコアを有する多数の塩基を有する。第1の出現閾値は、例えば、2、3、4、5、6、7、8、9、10以上とすることができる。第1の品質閾値は、例えば、約10、15、20、25、30、35、40、45、50、又はそれ以上又はそれ以下とすることができる。それぞれが第1の品質閾値より大きい(又はそれ以上の)品質スコアを有する反復配列の塩基の数は、例えば、4、5、6、7、9、9、10又はそれ以上であり得る。例えば、各タイプの5量体は、20の品質閾値(例えば、第1の品質閾値)以上の品質(Q)を有する5つ全ての塩基を有する2つの出現を有する。いくつかの実施形態では、各出現は、各々が第2の品質閾値以上(又はより大きい)の品質スコアを有するいくつかの基底を有する。第2の品質閾値以上(又はそれ以上)の品質スコアをそれぞれ有する塩基の数は、例えば、2、3、4、5、6、7、8、9、10又はそれ以上であり得る。第2の品質閾値は、例えば、約10、15、20、25、30、35、40、45、50、又はそれ以上又はそれ以下とすることができる。第2の品質閾値より大きい品質スコアを有する各出現の塩基の数は、例えば、2、3、4、又は5であり得る。例えば、カウントされた各5量体は、20の品質閾値(例えば、第2の品質閾値)以上の品質を有する少なくとも3個の塩基を有する。いくつかの実施形態では、第1の品質閾値及び第2の品質閾値は同一である。
【0098】
反復配列表現は縮重であり得る。反復配列表現はAARRGであり得、ここで、挿入物の遺伝子がRFC1である場合、RはA又はGである。反復配列表現は、5、6、7、8、9、10又はそれを超える塩基長であり得る。複数の反復配列の各々は、5、6、7、8、9、10塩基長又はそれを超える長さであり得る。反復配列表現及び反復配列は、同一の長さを有することができる。
【0099】
方法1000はブロック1016からブロック1020に進み、コンピューティングシステムが、複数の反復配列の出現の総数に対する、病原性反復配列(例えば、目的の遺伝子がRFC1である場合、AAGGG又はACAGG)又は1つ若しくは複数の病原性反復配列の出現数の頻度表示を決定する。病原性反復配列は、少なくとも50%、55%、60%、65%、70%、75%、80%又はそれ以上又はそれ未満のGC含有量を有することができる。病原性反復配列は、5、6、7、8、9、10又はそれ以上の塩基長であり得る。
【0100】
複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示は、複数の反復配列の出現の総数に対する病原性反復配列の出現数のパーセンテージであり得る。複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示は、複数の反復配列の出現の総数に対する病原性反復配列の出現数の比であり得る。
【0101】
方法1000はブロック1020からブロック1024に進み、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示を使用して、対象の目的の遺伝子座における反復伸長ステータスを決定する。コンピューティングシステムは、対象が、複数のアラインメントされた配列リードを使用して、目的の遺伝子の遺伝子座において反復伸長を有する0個、1個又は2個の対立遺伝子を有すると決定し得る。目的の遺伝子の遺伝子座における反復伸長ステータスは、病原性ステータス、キャリアステータス又は良性ステータスである。反復伸長は、疾患に関連し得るか、又は疾患を引き起こし得る。この疾患は、例えば、遅発性運動失調、小脳性運動失調、感覚性ニューロン障害、両側性前庭障害、又は小脳性運動失調、神経障害、及び前庭反射消失症候群(CANVAS)であり得る。疾患は、癌、非癌性疾患、神経疾患、神経変性疾患、自己免疫疾患、アルツハイマー病、パーキンソン病、認知症、関節リウマチ、又は炎症であり得る。疾患は、ハンチントン病、脊髄性及び延髄性筋萎縮症、歯状核赤核淡蒼球ルイ体萎縮症脊髄小脳失調症、脆弱X、脆弱X振戦運動失調症候群、他の脆弱な部位、筋緊張性ジストロフィー1型、ハンチントン病様2、脊髄小脳失調症8型、フクス角膜ジストロフィー、フリードライヒ失調症、FRAXE精神遅滞、眼咽頭型筋ジストロフィー、筋緊張性ジストロフィー1型、脊髄小脳失調症10型、脊髄小脳失調症31型、脊髄小脳失調症36型、前頭側頭型認知症/筋萎縮性側索硬化症、又はEPM1(ミオクローヌスてんかん)であり得る。目的の遺伝子は、ハンチンチン、アンドロゲン受容体(AR)遺伝子、ATN1、ATXN1、ATXN2、ATXN3、ATXN10、CACNA1A、ATXN7、TBP遺伝子、PPP2R2B、TK2、BEAN、NOP56、JPH3、FRDA、CSTB、PABP2、TCF4、又はC9ORF72であり得る。
【0102】
いくつかの実施形態において、目的の遺伝子は、複製因子Cサブユニット1(RFC1)である。反復伸長を有する目的の遺伝子の遺伝子座は、hg38のchr4:39348424若しくはその付近、又は別の参照ゲノム配列の対応する位置であり得る。反復伸長は、疾患に関連し得るか、又は疾患を引き起こし得る。この疾患は、小脳性運動失調、ニューロパシー、及び前庭動眼反射症候群(CANVAS)又は運動失調であり得る。反復配列表現はAARRGであり得る。病原性反復配列は、AAGGG又はACAGGであり得る。
【0103】
2つの伸長対立遺伝子両方の対立遺伝子が伸長培養される場合、両方の伸長培養された対立遺伝子の5merカウントを行うことができる。いくつかの実施形態では、対象は、目的の遺伝子の遺伝子座にそれぞれ反復伸長を有する2つの対立遺伝子を有し得る。
【0104】
2つの伸長対立遺伝子-病原性ステータス。目的の遺伝子の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値よりも大きい(又はそれ以上である)と決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、病原性ステータスとして目的の遺伝子の遺伝子座における反復伸長ステータスを決定することができる。
【0105】
2つの伸長対立遺伝子-キャリアステータス。目的の遺伝子の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下(又は未満)であり、第2のステータス閾値以上(又は超)であることを決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。第2のステータス閾値は、例えば、10%、15%、20%、25%、30%、35%、40%、45%、50%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、キャリアステータスとして目的の遺伝子の遺伝子座における反復伸長ステータスを決定することができる。
【0106】
2つの伸長対立遺伝子-キャリアステータス。目的の遺伝子の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下(又は未満)であり、第2のステータス閾値以上(又は以上)であることを決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。第2のステータス閾値は、例えば、10%、15%、20%、25%、30%、35%、40%、45%、50%、又はそれ以上又はそれ以下とすることができる。
【0107】
コンピューティングシステムは、(1)病原性反復配列及び(2)複数の反復配列の出現の総数に対する病原性反復配列との高い配列類似性を有する配列の出現数の頻度表示を決定することができる。病原性反復配列及び病原性反復配列に対して高い配列類似性を有する配列の配列類似性は、例えば、(約)70%、75%、80%、85%、90%、95%又はそれ以上若しくはそれ以下であり得るか、又はそれ以下であり得る。病原性反復配列及び病原性反復配列に類似する配列は、1、2、3、4、5、6、7、8、9、10又はそれ以上の塩基などの1又は複数の塩基が異なる。病原性反復配列との高い配列類似性を有する配列は、非病原性であり得、及び/又は良性の伸長に関係し得る(例えば、関連)。
【0108】
複数の反復配列の出現の総数に対する、(1)病原性反復配列及び(2)病原性反復配列との高い配列類似性を有する配列の出現数の頻度表示は、複数の反復配列の出現の総数のうちの(1)病原性反復配列及び(2)病原性反復配列との高い配列類似性を有する配列の出現数の百分率であり得る。複数の反復配列の出現の総数に対する、(1)病原性反復配列及び(2)病原性反復配列との高い配列類似性を有する配列の出現数の頻度表示は、複数の反復配列の出現の総数のうちの(1)病原性反復配列及び(2)病原性反復配列との高い配列類似性を有する配列の出現数の比であり得る。
【0109】
コンピューティングシステムは、病原性反復配列の出現数の頻度表示を決定することができ、複数の反復配列の出現の総数に対する病原性反復配列と高い配列類似性を有する配列は、第3のステータス閾値よりも大きい(又はそれ以上)。第3のステータス閾値は、例えば、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。
【0110】
コンピューティングシステムは、病原性配列の出現数の頻度表示が第4のステータス閾値よりも大きい(又はそれ以上である)と決定することができる。第4のステータス閾値は、例えば、5%、10%、15%、20%、25%、30%、又はそれ以上又はそれ以下とすることができる。代替的又は追加的に、コンピューティングシステムは、病原性配列と高い配列類似性を有する配列の出現数の頻度表示を決定することができる。複数の反復配列の出現の総数に対する、病原性反復配列に対して高い配列類似性を有する配列の出現数の頻度表示は、複数の反復配列の出現の総数のうちの病原性反復配列に対して高い配列類似性を有する配列の出現数のパーセンテージであり得る。複数の反復配列の出現の総数に対する、病原性反復配列との高い配列類似性を有する配列の頻度表示は、複数の反復配列の出現の総数に対する病原性反復配列との高い配列類似性を有する配列の出現数の比であり得る。コンピューティングシステムは、病原性配列との高い配列類似性を有する配列の出現数の頻度表示が第5のステータス閾値以下(又はそれ未満)であると決定することができる。第5ステータス閾値は、例えば、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、キャリアステータスとして目的の遺伝子の遺伝子座における反復伸長ステータスを決定することができる。
【0111】
いくつかの実施形態において、コンピューティングシステムは、病原性配列の出現数の頻度表示が第4のステータス閾値以下(又はそれ未満)であると決定する。代替的又は追加的に、コンピューティングシステムは、病原性配列との高い配列類似性を有する配列の出現数の頻度表示が第5のステータス閾値よりも大きい(又はそれ以上である)と決定することができる。コンピューティングシステムは、良性ステータスとしてRFC1の遺伝子座における反復伸長ステータスを決定することができる。
【0112】
2つの伸長対立遺伝子-良性ステータス。目的の遺伝子の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第2のステータス閾値未満(又はそれ以下)であると決定することができる。第2のステータス閾値は、例えば、10%、15%、20%、25%、30%、35%、40%、45%、50%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、良性ステータスとして目的の遺伝子の遺伝子座における反復伸長ステータスを決定することができる。
【0113】
2.1つの伸長対立遺伝子1つの対立遺伝子が伸長され、1つの対立遺伝子が伸長されない場合、伸長された対立遺伝子の5merカウントを行うことができる。いくつかの実施形態では、対象は、目的の遺伝子の遺伝子座に反復伸長を有する目的の遺伝子の1つの対立遺伝子を有する。
【0114】
1つの伸長対立遺伝子-病原性ステータス。複数の配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定するために、コンピューティングシステムは、RFC1の遺伝子座において反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来する複数のアラインメントされた配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することができる。目的の遺伝子の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値よりも大きい(又はそれ以上である)と決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、病原性ステータスとして目的の遺伝子の遺伝子座における反復伸長ステータスを決定することができる。
【0115】
1つの伸長対立遺伝子-キャリアステータス。複数の配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定するために、コンピューティングシステムは、RFC1の遺伝子座において反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来する複数のアラインメントされた配列リードのアラインメントされた配列リードにおける複数の反復配列の出現数を決定することができる。目的の遺伝子の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、複数の反復配列の出現の総数に対する病原性反復配列の出現数の頻度表示が第1のステータス閾値以下(又はそれ未満)であると決定することができる。第1のステータス閾値は、例えば、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上又はそれ以下とすることができる。コンピューティングシステムは、キャリアステータスとして目的の遺伝子の遺伝子座における反復伸長ステータスを決定することができる。
【0116】
1つの伸長対立遺伝子が存在する場合に、病原性ステータス又はキャリアステータスとして目的の遺伝子の遺伝子座における反復伸長ステータスを決定するために、コンピューティングシステムは、アラインメントされた配列リードのアラインメントに基づいて、目的の遺伝子の遺伝子座における反復伸長を有する、目的の遺伝子の1つの対立遺伝子に由来するアラインメントされた配列リードを選択することができる。目的の遺伝子の遺伝子座における反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来するアラインメントされた配列リードは、(i)イン反復リード、又は(ii)それぞれが反復伸長重複閾値より大きい目的の遺伝子の遺伝子座における反復伸長に対する重複を有する隣接リードであるアラインメントされた配列リードを含み得る。反復伸長重複閾値は、例えば、30、35、40、45、50、55、60、65、70、75、80、85、90又はそれ以上若しくはそれ以下の塩基対であり得る。目的の遺伝子の遺伝子座において反復伸長を有する目的の遺伝子の1つの対立遺伝子に由来するアラインメントされた配列リードは、(i)イン反復リードである全てのアラインメントされた配列リード、及び(ii)隣接リードであるアラインメントされた配列リードの全てではない配列リードを含み得る。反復がリード長より長い場合、イン反復リードは、全リード(シングルエンドシーケンシングリードであってもペアエンドシーケンシングリードであっても)又はペアエンドシーケンシングリードの1回のリードが反復の一部のみを含み、反復の隣接領域を含まないように起こり得る。フランキングリードは、反復の一部及び反復の一端のフランキング領域を含む。
【0117】
伸長対立遺伝子なし両方の対立遺伝子が伸長されない場合、両方の対立遺伝子の5merカウントを行うことができる。いくつかの実施形態において、対象は、目的の遺伝子の遺伝子座において反復伸長を有する0個の対立遺伝子を有する。目的の遺伝子の遺伝子座における反復伸長ステータスは良性ステータスであり得る。
【0118】
いくつかの実施形態では、コンピューティングシステムは、方法1000の任意の結果(中間結果を含む)を含むか又は表す、グラフィカルユーザインターフェースなどのユーザインターフェース(UI)を生成することができる。例えば、UIは、反復伸長ステータスを含むか、又は表すことができる。UIは、例えばダッシュボードを含むことができる。UIは、1つ以上のUI要素を含むことができる。UI要素は、反復伸長ステータスを含むか又は表すことができる。UI要素は、ウィンドウ(例えば、コンテナウィンドウ、ブラウザウィンドウ、テキスト端末、子ウィンドウ、又はメッセージウィンドウ)、メニュー(例えば、メニューバー、コンテキストメニュー、又はメニュー追加)、アイコン、又はタブとすることができる。UI要素は、入力制御(例えば、チェックボックス、ラジオボタン、ドロップダウンリスト、リストボックス、ボタン、トグル、テキストフィールド、又は日付フィールド)用とすることができる。UI要素は、ナビゲーション(例えば、ブレッドクラム、スライダ、検索フィールド、ページ分割、スライダ、タグ、アイコン)とすることができる。UI要素は、情報(例えば、ツールチップ、アイコン、プログレスバー、通知、メッセージボックス、又はモーダルウィンドウ)を提供することができる。UI要素はコンテナ(例えば、アコーディオン)とすることができる。いくつかの実施形態では、コンピューティングシステムは、反復伸長ステータスなどの方法900の任意の結果(中間結果を含む)を含む又は表すレポートを生成することができる。
【0119】
コンピューティングシステムは、1つ又は複数の診断方法を実行させて、対象の目的の遺伝子の遺伝子座における反復伸長ステータスを確認することができる。UI又はレポートは、対象の目的の遺伝子の遺伝子座での反復伸長ステータスを確認するために1つ又は複数の診断方法が実行されるべきであることを含むか又は示すことができる。コンピューティングシステムは、1つ又は複数の診断システムを使用して決定された対象の目的の遺伝子の遺伝子座における反復伸長ステータスの立体配座を受け取ることができる。1つ又は複数の診断システムは、ポリメラーゼ連鎖反応(PCR)及びサンガー配列決定、サザンブロット、及び連鎖分析を含み得る。
【0120】
いくつかの実施形態では、方法1000の任意の閾値(例えば、出現閾値(例えば、第1の出現閾値)、品質閾値(例えば、第1の品質閾値、又は第2の品質閾値)、閾値総コピー、ステータス閾値(例えば、第1のステータス閾値、第2のステータス閾値、第3のステータス閾値、第4のステータス閾値、又は第5のステータス閾値)、又は反復伸長重複閾値)は、100、200、300、400、500、1000、2000、3000、4000、5000個、又はそれ以上又はそれ以下の試料などの多数の試料を使用して決定することができる。
【0121】
方法1000はブロック1028で終了する。
【0122】
実行環境
図11は、目的の遺伝子(例えば、RFC1)の反復伸長ステータスを決定するように構成された例示的なコンピューティングデバイス1100の一般的なアーキテクチャを示す。
図11に示されるコンピューティングデバイス1100の全般的な構築は、コンピュータハードウェア及びソフトウェア構成要素の構成を含む。コンピューティングデバイス1100は、
図11に示されるものより多くの(又はより少ない)要素を含んでもよい。しかしながら、これらの全般的な従来の要素の全てが、有効な開示を提供するために示される必要はない。図示されるように、コンピューティングデバイス1100は、処理ユニット1110、ネットワークインターフェース1120、コンピュータ可読媒体ドライブ1130、入力/出力デバイスインターフェース1140、ディスプレイ1150、及び入力デバイス1160を含み、これらの全ては、通信バスを介して互いに通信することができる。ネットワークインターフェース1120は、1つ以上のネットワーク又はコンピューティングシステムに接続性を提供してもよい。処理ユニット1110は、したがって、ネットワークを介してその他のコンピューティングシステム又はサービスから情報及び命令を受信してもよい。処理ユニット1110はまた、メモリ1170と通信し、入力/出力デバイスインターフェース1140を介して任意選択のディスプレイ1150の出力情報を更に提供してもよい。入力/出力デバイスインターフェース1140はまた、キーボード、マウス、デジタルペン、マイクロフォン、タッチスクリーン、ジェスチャ認識システム、音声認識システム、ゲームパッド、加速度計、ジャイロスコープ、又はその他の入力デバイスなどの、任意の入力デバイス1160からの入力を受け付けてもよい。
【0123】
メモリ1170は、1つ以上の実施形態を実施するために処理ユニット1110が実行するコンピュータプログラム命令(いくつかの実施形態ではモジュール又は構成要素としてグループ化される)を含んでもよい。メモリ1170は、全般的に、RAM、ROM、及び/又はその他の永続的、補助的若しくは非一過性コンピュータ可読媒体を含む。メモリ1170は、コンピューティングデバイス1100の全般的な管理及び動作において、処理ユニット1110によって使用するためのコンピュータプログラム命令を提供する動作システム1172を記憶してもよい。メモリ1170は、本開示の態様を実施するためのコンピュータプログラム命令及びその他の情報を更に含んでもよい。
【0124】
例えば、一実施形態では、メモリ1170は、
図9を参照して説明した方法900及び
図10を参照して説明した方法1000などの、反復伸長ステータス(例えば、病原性、キャリア、又は良性)を決定するための反復伸長ステータス決定モジュール1174を含む。更に、メモリ1170は、データストア1190及び/又は処理されている配列リード及び決定された伸長ステータスを反復伸長ステータス(及びその任意の中間結果)を記憶する1つ若しくは複数の他のデータストアを含むか又はそれと通信することができる。
【0125】
追加の考慮
前述の実施形態のうちの少なくともいくつかにおいて、一実施形態で使用される1以上の要素は、このような交換が技術的に実行可能でない場合を除いて、別の実施形態で互換的に使用することができる。当業者であれば、特許請求される主題の範囲から逸脱することなく、上記の方法及び構造に、種々のその他の省略、追加、及び修正がなされてもよいことを理解するであろう。このような修正及び変更は全て、添付の特許請求の範囲によって定義されるように、主題の範囲内に含まれることが意図される。
【0126】
当業者であれば、本明細書に開示される本プロセス及びその他のプロセス並びに方法について、プロセス及び方法において実行される機能が、異なる順序で実施され得ることを理解するであろう。更に、概説された工程及び動作は、例としてのみ提供され、工程及び動作の一部は任意選択であることができ、より少ない工程及び動作に組み合わされることができる、又は、開示される実施形態の本質を損なうことなく、追加の工程及び動作に拡大することができる。
【0127】
本明細書における実質的に任意の複数形及び/又は単数形の用語の使用について、当業者は、文脈及び/又は用途に適切なように、複数形から単数形に、及び/又は単数形から複数形に置き換えることができる。明確性のために、種々の単数形/複数形の順列が本明細書に明示的に記載されてもよい。本明細書及び添付の特許請求の範囲で使用される場合、単数形「a」、「an」、及び「the」は、文脈がそうでない旨を明確に指示しない限り、複数の指示対象を含む。したがって、「~するように構成されたデバイス(device configured to)」などの語句は、1つ以上の列挙されたデバイスを含むことが意図されている。このような1つ以上の列挙されたデバイスはまた、記載された詳細説明を実行するように集合的に構成され得る。例えば、「詳細説明A、B、及びCを実行するように構成されたプロセッサ」は、詳細説明Aを実行し、かつ詳細説明B及びCを実行するように構成された第2のプロセッサと関連して動作を行うように構成された、第1のプロセッサを含むことができる。本明細書における「又は」への任意の言及は、特に指示しない限り、「及び/又は」を包含することを意図する。
【0128】
全般的に、本明細書で使用される用語、特に添付の特許請求の範囲(例えば、添付の特許請求の範囲の本体)使用される用語は、全般的に「オープン」ターム(open terms)として意図される(例えば、用語「含む(including)」は「~を含むがこれらに限定されない(including but not limited to)」と解釈されるべきであり、用語「有する(having)」は「少なくとも有する(having at least)」と解釈されるべきであり、用語「含む(includes)」は「~を含むがこれらに限定するものではない(includes but is not limited to)」と解釈されるべきであるなど)。導入された請求項記載の具体的な数が意図されている場合、このような意図が請求項に明示的に列挙され、このような記載がない場合、このような意図は存在しないことも、当業者には更に理解されるであろう。例えば、理解を助けるために、以下の添付の特許請求の範囲は、請求項の記載を導入するための導入句「少なくとも1つの(at least one)」及び「1つ以上の(one or more)」の使用を含んでもよい。しかしながら、このような語句の使用は、同じ請求項が、「1以上の」又は「少なくとも1つの」、及び「a」若しくは「an」などの不定冠詞を含む(例えば、「a」及び/又は「an」が、「少なくとも1つの」又は「1以上の」の意味に解釈されるべきである)場合であっても、不定冠詞「a」又は「an」による請求項記載の導入が、このような導入された請求項記載を含む任意の特定の請求項を、このような記載のうちの1つのみを含む実施形態に限定するものと解釈すべきではなく、請求項記載を導入するために使用される不定冠詞の使用についても同じく当てはまる。更に、導入された請求項記載の具体的な数が明示的に列挙されている場合であっても、このような記載が、少なくとも列挙された数の意味(例えば、「2つの記載」の無修飾の記載は、その他の修飾がないと、少なくとも2つの記載又は2つ以上の記載を意味する)で解釈されるべきであることを、当業者は認識するであろう。更に、「A、B、及びCなどのうちの少なくとも1つ」と類似した常套句が使用される場合には、全般的に、このような構造は、当業者がこの常套句を理解するであろう意味において意図される(例えば、「A、B、及びCのうちの少なくとも1つを有するシステム」としては、Aのみ、Bのみ、Cのみ、A及びBともに、A及びCともに、B及びCともに、並びに/又はA、B、及びCともに、などを有するシステムが挙げられるが、これらに限定されない)。「A、B、又はCなどのうちの少なくとも1つ」と類似した常套句が使用される場合には、全般的に、このような構造は、当業者がこの常套句を理解するであろう意味において意図される(例えば、「A、B、又はCのうちの少なくとも1つを有するシステム」としては、Aのみ、Bのみ、Cのみ、A及びBともに、A及びCともに、B及びCともに、並びに/又はA、B、及びCともに、などを有するシステムが挙げられるが、これらに限定されない)。本明細書、特許請求の範囲、又は図面にかかわらず、2つ以上の代替用語を提示する実質上任意の離接語及び/又は語句は、用語のうちの1つ、用語のいずれか、又は両方の用語を含む可能性を企図することが理解されるべきであると、当業者には更に理解されるであろう。例えば、語句「A又はB」は、「A」又は「B」又は「A及びB」の可能性を含むと理解されるであろう。
【0129】
加えて、本開示の特徴又は態様がマーカッシュ群の観点で記載されている場合、それによって、当業者は、本開示がまた、マーカッシュ群の構成要素の任意の個々の構成要素又はサブグループの観点でも記載されていることを認識するであろう。
【0130】
当業者には理解されるように、書面による説明を提供するという観点からなどの任意の及び全ての目的において、本明細書に開示される全ての範囲はまた、任意の及び全ての可能なサブ範囲並びにそれらのサブ範囲の組み合わせも包含する。任意の列挙された範囲は、同じ範囲が、少なくとも等半分、3分の1、4分の1、5分の1、10分の1などに分解されることを十分に記載し可能にするものとして容易に認識することができる。非限定的実施例として、本明細書で説明される各範囲は、下部3分の1、中部3分の1、及び上部3分の1などに容易に分解することができる。また、当業者には理解されるように、「最大で(up to)」、「少なくとも(at least)」、「より大きい(greater than)」、「より小さい(less than)」などの全ての言語は、列挙された数を含み、続いて上述のように下位範囲に分解され得る範囲を指す。最後に、当業者には理解されるように、範囲は、各個々の構成要素を含む。したがって、例えば、1~3個の物品を有する群は、1個、2個、又は3個の物品を有する群を意味する。同様に、1~5個の物品を有する群は、1個、2個、3個、4個、又は5個の物品を有する群などを意味する。
【0131】
本開示の種々の実施形態が例示目的で本明細書に記載されており、本開示の範囲及び趣旨から逸脱することなく種々の修正がなされ得ることが理解されるであろう。したがって、本明細書に開示される種々の実施形態は、以下の特許請求の範囲によって示される真の範囲及び趣旨を限定することを意図するものではない。
【0132】
全ての目的又は利点が、本明細書に記載される任意の特定の実施形態に従って必ずしも達成され得る必要性がないことを理解されたい。したがって、例えば、当業者であれば、特定の実施形態が、本明細書で教示又は示唆され得るその他の目的若しくは利点を必ずしも達成することなく、本明細書で教示されるような利点若しくは利点の群を達成又は最適化する方法で動作するように構成され得ることを、認識するであろう。
【0133】
本明細書に記載されるプロセスの全ては、1つ以上のコンピュータ又はプロセッサを含むコンピューティングシステムによって実行されるソフトウェアコードモジュール内に具現化され得、またそれを介して完全に自動化され得る。コードモジュールは、任意の種類の非一過性コンピュータ可読媒体又はその他のコンピュータ記憶デバイスに記憶されてもよい。いくつかの又は全ての方法は、専用のコンピュータハードウェアで具現化されてもよい。
【0134】
本明細書に記載されるもの以外の多くのその他の変形形態が、本開示から明らかとなるであろう。例えば、実施形態に応じて、本明細書に記載されるアルゴリズムのうちのいずれかの特定の行為、事象、又は機能を、異なる順序で実行することができ、追加し、統合し、又は全体を省略することができる(例えば、アルゴリズムの実施には全ての記載された行為又は事象が必要ではない)。更に、特定の実施形態では、行為又は事象は、逐次的ではなく、例えば、マルチスレッド処理、割り込み処理、又は複数のプロセッサ若しくはプロセッサコアを介して、又はその他の平行体系上で、同時に実行することができる。加えて、異なるタスク又はプロセスは、互いに機能することができる異なる機械装置及び/又はコンピューティングシステムによって実行することができる。
【0135】
本明細書に開示される実施形態に関連して説明される種々の例示的な論理ブロック及びモジュールは、処理ユニット若しくはプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、又はその他のプログラム可能な論理デバイス、別個のゲート若しくはトランジスタ論理、別個のハードウェア構成要素、又は本明細書に記載される機能を実行するように設計されたそれらの任意の組み合わせなどの機械装置によって、実装又は実行され得る。プロセッサはマイクロプロセッサであってもよいが、代替的に、プロセッサは、コントローラ、マイクロコントローラ、又はステートマシン、それらの組み合わせなどであってもよい。プロセッサは、コンピュータ実行可能命令を処理するように構成された電気回路を含むことができる。別の実施形態では、プロセッサは、コンピュータ実行可能命令を処理することなく論理動作を実行する、FPGA又はその他のプログラマブルデバイスを含む。プロセッサはまた、コンピューティングデバイスの組み合わせ、例えば、DSPとマイクロプロセッサ、複数のマイクロプロセッサ、DSPコアに関連した1つ以上のマイクロプロセッサ、又は任意のその他のこのような構成の組み合わせとして実装することもできる。本明細書では主としてデジタル技術について記載されているが、プロセッサはまた、主にアナログ構成要素を含んでもよい。例えば、本明細書に記載の信号処理アルゴリズムの一部又は全ては、アナログ回路又は混合アナログ回路及びデジタル回路に実装されてもよい。コンピューティング環境は、少数例を挙げると、マイクロプロセッサ、メインフレームコンピュータ、デジタル信号プロセッサ、ポータブルコンピューティングデバイス、デバイスコントローラ、又は機器内のコンピューティングエンジンに基づくコンピュータシステムを含むが、これらに限定されない、任意の種類のコンピュータシステムを含むことができる。
【0136】
本明細書に記載され、かつ/又は添付の図面に示されるフロー図における任意のプロセス説明、要素又はブロックは、プロセスにおいて特定の論理関数又は要素を実施するための1つ以上の実行可能な命令を含むモジュール、セグメント、又はコードの部分を潜在的に表すものとして、理解されるべきである。交互実施形態は本明細書に記載される実施形態の範囲内に含まれ、当業者には理解されるように、関与する機能に応じて、要素又は機能を削除し、実質的に同時に又は逆の順序を含む図示された又は考察されたものからの順序から除外してもよい。
【0137】
上述の実施形態に多くの変形及び修正がなされてもよく、その要素は、その他の許容可能な例の中にあるものとして理解されるべきであることを強調するべきである。このような修正及び変形は全て、本明細書で本開示の範囲内に含まれ、以下の特許請求の範囲によって保護されることが意図される。
【配列表】
【国際調査報告】