(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-15
(45)【発行日】2024-01-23
(54)【発明の名称】遺伝毒性を検出し、評価するための方法および試薬
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240116BHJP
C12Q 1/02 20060101ALI20240116BHJP
G16Y 10/60 20200101ALI20240116BHJP
G16Y 20/40 20200101ALI20240116BHJP
G16Y 40/20 20200101ALI20240116BHJP
【FI】
C12Q1/6869 Z
C12Q1/02
G16Y10/60
G16Y20/40
G16Y40/20
(21)【出願番号】P 2020564824
(86)(22)【出願日】2019-02-13
(86)【国際出願番号】 US2019017908
(87)【国際公開番号】W WO2019160998
(87)【国際公開日】2019-08-22
【審査請求日】2022-02-10
(32)【優先日】2018-02-13
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2018-09-26
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】518201670
【氏名又は名称】ツインストランド・バイオサイエンシズ・インコーポレイテッド
【氏名又は名称原語表記】TWINSTRAND BIOSCIENCES, INC.
(74)【代理人】
【識別番号】110001508
【氏名又は名称】弁理士法人 津国
(72)【発明者】
【氏名】ソーク,ジェシー・ジェイ
(72)【発明者】
【氏名】バレンタイン,チャールズ・クリントン・ザ・サード
【審査官】松田 芳子
(56)【参考文献】
【文献】米国特許出願公開第2015/0275289(US,A1)
【文献】国際公開第2013/142389(WO,A1)
【文献】Proc. Natl. Acad. Sci.,2017年03月28日,vol.114,E3101-E3109
【文献】Nat. Protocol.,2014年,vol.9,p.2586-2606
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/68
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
被験体が変異原に曝露した後に前記被験体においてインビボで発生したゲノム変異を検出し、定量化するための方法であって、
前記被験体由来サンプルであって、二本鎖DNA分子を含むサンプルを提供することと、ここで、被験体は、
被験体由来二本鎖DNA分子
を含むサンプルを抽出する前の30日以内に前記変異原に曝露されている、
前記サンプル中の複数の前記二本鎖DNA分子のそれぞれについてのエラー修正済配列リードを作成することであって、
二本鎖DNA分子の元の第1の鎖のコピーのセットおよび前記
二本鎖DNA分子の元の第2の鎖のコピーのセットを作成すること、
前記元の第1の鎖および第2の鎖の前記コピーのセットを配列決定して、第1の鎖配列および第2の鎖配列を提供すること、ならびに
前記第1の鎖配列と前記第2の鎖配列とを比較して、前記第1の鎖配列と前記第2の鎖配列との間の1つ以上の対応関係を識別することを含む、エラー修正済配列リードを作成することと、
前記1つ以上の対応関係を分析して、前記サンプル中の前記二本鎖DNA分子の変異スペクトラムを決定することと、を含む、方法。
【請求項2】
配列決定された二本鎖塩基対あたりの固有の変異数を計算することによって、
サンプル中の二本鎖DNA分子の変異体頻度を計算することをさらに含む、請求項1に記載の方法。
【請求項3】
前
記二本鎖DNA分子が、前記被験体の肝臓、脾臓、血液、肺または骨髄から抽出された、請求項1に記載の方法。
【請求項4】
前記変異スペクトラムが、教師なし階層型変異スペクトラムクラスタリングによって作成される、請求項1に記載の方法。
【請求項5】
前記変異スペクトラムが、三重変異スペクトラムである、請求項1に記載の方法。
【請求項6】
複数の前記二本鎖DNA分子のそれぞれについてのエラー修正済配列リードを作成することが、1つ以上の標的ゲノム領域のエラー修正済配列リードを作成することを含む、請求項1に記載の方法。
【請求項7】
前記1つ以上の標的ゲノム領域が、前記ゲノム中の変異を起こしやすい部位である、請求項6に記載の方法。
【請求項8】
前記1つ以上の標的ゲノム領域が、既知の癌ドライバー遺伝子である、請求項6に記載の方法。
【請求項9】
前記被験体がトランスジェニック動物であり、前
記二本鎖DNA分子の少なくともいくつかが、導入遺伝子の1つ以上の部分を含む、請求項1に記載の方法。
【請求項10】
前記被験体が非トランスジェニック動物であり、前
記二本鎖DNA分子が、内因性ゲノム領域を含む、請求項1に記載の方法。
【請求項11】
前記被験体がヒトであり、前
記二本鎖DNA分子が、前記ヒトから採取された採血物から抽出されたものである、請求項1に記載の方法。
【請求項12】
1つ以上のプロセッサによって実行されるとき、被験体が少なくとも1つの遺伝毒性物質に曝露されているかどうかを決定するための、および/または少なくとも1つの遺伝毒性物質の同一性を決定するための請求項1~11のいずれか一項に記載の方法を行う命令を含む、一時的でないコンピュータ可読記憶媒体。
【請求項13】
検出された薬剤の変異スペクトラム、変異体頻度および/または三重変異スペクトラムを計算することをさらに含み、ここから前記少なくとも1つの遺伝毒性物質の前記同一性が決定される、請求項12に記載の一時的でないコンピュータ可読記憶媒体。
【請求項14】
被験体が少なくとも1つの遺伝毒性物質に曝露されているかどうか、および/または少なくとも1つの遺伝毒性物質の同一性を決定するための請求項1~11のいずれか一項に記載の方法を行うためのコンピュータシステムであって、前記システムが、プロセッサと、メモリと、データベースと、前記プロセッサのための命令を含む一時的でないコンピュータ可読記憶媒体とを備える少なくとも1つのコンピュータを含み、前記プロセッサが、請求項1~11のいずれか一項に記載の方法を含む操作を行うために前記命令を実行するように構成されている、コンピュータシステム。
【請求項15】
ネットワークコンピュータシステムをさらに含み、前記ネットワークコンピュータシステムが、
a.有線または無線のネットワークと、
b.被験体のサンプルのポリヌクレオチド配列を抽出し、増幅させ、産生するための試薬を含むキットの使用に由来するデータを受信し、ネットワークを介して前記ポリヌクレオチド配列をリモートサーバに送信することが可能な複数のユーザ電子計算デバイスと、
c.前記プロセッサと、メモリと、データベースと、前記プロセッサのための命令を含む前記一時的でないコンピュータ可読記憶媒体とを備えるリモートサーバであって、前記プロセッサが、請求項1~11のいずれか一項に記載の方法を含む操作を行うために前記命令を実行するように構成されている、リモートサーバと、を含み、
d.前記リモートサーバが、サンプルの遺伝毒性物質曝露から生じる変異誘発事象および/または核酸損傷事象を検出し、識別することが可能である、請求項14に記載のシステム。
【請求項16】
前記データベースおよび/または前記ネットワークを介してアクセス可能な第三者のデータベースは、既知の遺伝毒性物質の遺伝毒性物質プロファイル、少なくとも1つの被験体のサンプルの遺伝毒性物質プロファイルのうちの1つ以上を含む複数の記録をさらに含み、前記遺伝毒性物質プロファイルが、変異またはDNA損傷の部位を含む、請求項15に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年2月13日出願の米国仮特許出願第62/630,228号および2018年9月26日出願の米国仮特許出願第62/737,097号に対する優先権およびその利益を主張し、これらの開示は、その全体が参照により組み込まれる。
【背景技術】
【0002】
遺伝毒性とは、遺伝物質(例えば、DNA、RNA)への損傷を引き起こす薬剤またはプロセス(すなわち、遺伝毒性物質)の破壊的性質を指す。生殖細胞株において、核酸物質への損傷は、遺伝性生殖細胞系列変異を引き起こす可能性を有し、一方、体細胞における核酸物質への損傷は、体細胞変異を引き起こす可能性がある。いくつかの場合において、かかる体細胞変異は、悪性腫瘍または他の疾患を引き起こす場合がある。遺伝毒性物質曝露が、かかる核酸損傷を直接的もしくは間接的に引き起こし得るか、またはいくつかの場合において、直接的もしくは間接的に核酸損傷の引き金となる原因となり得ることが確立されている。例えば、遺伝毒性物質は、遺伝物質と直接的に相互作用し、ヌクレオチド配列自体もしくはその構造を変化させるか、または化学修飾(例えば、付加物または破壊)が生じる場合があり、細胞機構によって複製され、修復され、または他の方法で処理されようとするときに、ヌクレオチド配列に対する変化を誘発する(または誘発する確率を上げる)場合がある。遺伝毒性物質は、天然に存在する化学物質またはプロセス(例えば、石炭、ラジウムまたはUV光)、または人工的に作られる化学物質またはプロセスまたは療法(例えば、工業用ウレタン、X線機械、多くの化学療法薬、およびいくつかの形態の遺伝子療法)であってもよい。
【0003】
他の遺伝毒性物質は、DNA複製の忠実性を低下させる細胞経路を活性化することによって、間接的に核酸損傷の引き金となり得る。例えば、これは、正常なチェックポイントを迂回する細胞周期機構の直接的もしくは間接的な活性化であってもよく、または核酸の正常な修復を減らすこと(例えば、特に、ミスマッチ修復(MMR)、ヌクレオチド除去修復(NER)、塩基除去修復(BER)、二本鎖切断修復(DSBR)、転写と共役した修復(TCR)、非相同末端結合(NHEJ)を含む多くの核酸修復経路のうちいずれか1つの直接的または間接的な調節異常)によるものであってもよい。他の遺伝毒性物質は、それ自体が遺伝毒性である細胞環境を促進することによって、間接的に作用し得る。かかる環境の一例は、「酸化ストレス」であり、酸化ストレスは、生物において(例えば、免疫介在性炎症の刺激によって)、または配列の化学組成自体を変えるとによって、または核酸鎖を構造的に変えることによって遺伝物質に損傷を引き起こし得る細胞において、活性酸素種の産生が増えることによって生じる場合がある。さらに別の間接的な形態の遺伝毒性物質は、生物の免疫系の特定の態様を抑制する薬剤またはプロセスである。免疫監視機構においてこのような減少は、いくつかの機構のうちいずれか1つを介し、遺伝毒性であり得る微生物の増殖を可能にすることによって(例えば、特定の組織において炎症を引き起こすか、または細胞周期の進行を促進することによって)、生物における遺伝毒性を引き起こす場合がある。さらに、かかる薬剤またはプロセスは、別の状況ではこの機構を介して除去され、発癌性である遺伝子異常を有する細胞を除去する正常な能力の低下によって、生物の遺伝毒性による負荷の原因となり得る。多くの遺伝毒性物質の機構は、発見されないままである。
【0004】
遺伝毒性物質は、種々の内外の供給源に由来し得る。例えば、外部(すなわち外因性)の供給源は、化学物質または化学物質の混合物(例えば、医薬品、工業用/製造用副産物、化学廃棄物、化粧品、家庭用洗浄剤、可塑剤、タバコの煙、溶剤など);重金属、空気中微粒子、汚染物質、食品、放射線(例えば、光子、例えば、γ線、X線、粒子放射線、またはそれらの混合物)、自然環境またはデバイスからの物理的な力(例えば、磁場、重力場、加速力など);別の生物(例えば、ウイルス、寄生虫、細菌、原虫、真菌)、または別の天然に存在する生物(例えば、真菌、植物、動物、細菌、細菌、原虫など)によって産生されるものを含んでいてもよい。特定の作物自体(例えば、タバコ)は、その天然の形態で既知の遺伝毒性物質を含有する。主食作物は、成長中(例えば、産業廃棄物による灌漑用水の汚染)、収穫中(例えば、変異原であるアリストロキン酸を産生するaristocholiaと作物を不注意によって一緒に収穫)、貯蔵中(例えば、変異原であるアフラトキシンを産生するaspergillus種の成長を引き起こす湿った豆類および穀物のサイロ)、または調製中(例えば、多くの形態の遺伝毒性物質を生成する、肉の燻製および他の保存方法、または変異原であるアクリルアミドを産生し得るデンプンの高温調理)に遺伝毒性物質に汚染される場合がある。内部(すなわち、内因性)の供給源のいくつかの例は、生化学的プロセスまたは生化学的プロセスの結果を含んでいてもよい。例えば、化学薬剤は、その薬剤が代謝活性化から生じる変異原に対する前駆体である場合、遺伝毒性物質であると決定されてもよい。他の例としては、炎症経路の刺激因子(例えば、ストレス、自己免疫疾患)、またはアポトーシスもしくは免疫監視機構の阻害因子が挙げられるだろう。供給源にかかわらず、ある薬剤またはプロセスが潜在的に、遺伝毒性、変異誘発性または発癌性(すなわち、癌を引き起こす)であるかどうかを決定する際に、多くの因子が役割を果たす。
【0005】
特定の用途において、変異誘発プロセスを検出し、定量化する能力は、ヒトにおいて癌のリスクを評価し、発癌物質曝露の影響を予測するために重要である。同様に、化学化合物または他の薬剤が核酸変異を引き起こす可能性を評価することは、市場取引前の製品安全性試験(例えば、医薬品、化粧品、食品、製造副産物など)の不可欠な要素である。遺伝毒性物質を識別する現行法は、手間がかかり、費用が高く、時間がかかり(例えば、曝露と症状との間に数年間)、実際のヒトの体内での効果)を表すものではない場合があり(特定のモデル生物のみに対してである)、いくつかの場合において、的確な原因物質を突き止めることが困難である。例えば、時には、ある被験体の集団が病気になる発生率の増加(例えば、癌クラスター)の検出は、遺伝毒性物質の検索(例えば、医薬品および食品の安全性分析、環境汚染物質、または環境ダンピングの調査など)を開始する前に必要である。
【0006】
インビボにおける体細胞変異の従来の尺度は、細菌、細胞培養物、またはゲノム全体の効果が小さな人工レポーターから推定されるトランスジェニック動物における選択に基づくアッセイから間接的に推定される。したがって、現時点で使用されているアッセイは、ある化合物のインビボにおける真の遺伝毒性の可能性に対する不完全な代理手段であり、これらのアッセイは、労働集約的でありながら、ある化合物の変異誘発性の可能性についての情報のうち、限られた一部のみを提供する。おそらく、人工細菌系(すなわち、エームズアッセイ)において変異誘発性の可能性を示す多くの化合物は、ヒトにおける真のリスクを正確に反映しておらず、別の状況では治療に有望な化合物を開発または商業的な使用から不必要に追い出してしまうだろう。同様に、発癌性の可能性を有するいくつかの化合物は、細菌内で検出不可能な、直接的ではない変異誘発性の機構によってそのように機能する。かかる化合物は、リスクを早期に十分に認識することができないため、被験体に害を及ぼす可能性がある。
【0007】
インビボ哺乳動物レポーター系、例えば、トランスジェニックげっ歯類アッセイ(例えば、BigBlue(登録商標)マウスおよびラット、ならびにMuta(商標)Mouse)は、細菌よりも良好な近似値のヒトの薬物効果を与える。これらは、動物がヒトの完全な代表ではないという限りにおいて限定されるが、哺乳動物トランスジェニックアッセイは、初期の前臨床安全性試験にとって依然として価値が高いが、これらのアッセイは、複雑であり、まだある程度人工的である。BigBlue(登録商標)アッセイは、例えば、レポーターに基づくシステムに依存しており、それにより、マルチコピーラムダファージ導入遺伝子内で起こる変異の一部は、後に細菌にトランスフェクションされるシャトルベクターによるレポーターの回収の後、表現型によって識別することができる。294BPのレポーター遺伝子内で起こる全ての変異を、多くが表現型を付与しないため、検出することはできない。導入遺伝子自体は、高度に凝縮され、メチル化されており、広範なゲノムの非常に可変性の転写および凝縮の状態を表すものではない。変異分子がウイルスおよび細菌の機構を通過すると、人工的な変異を導入する可能性があり、それぞれの工程で起こる固有の障害は、変異の対立遺伝子フラクションが定量化できないことを意味する。さらに、試験は、種の限られた一部の特定の株の使用を必要とする。また、げっ歯類自体は、ヒトの完全な代表ではない。例えば、アフラトキシンは、ヒトにおいて非常に変異誘発性であるが、マウスにおいて、性的成熟の後に特定の代謝酵素が発現すると、その解毒が容易になり、意味のある発癌性ではない。トランスジェニックげっ歯類は、依然として、いくつかの試験状況において発癌性の代替物として使用され得る有効な遺伝毒性の測定基準として、米国食品医薬品局(FDA)および他の規制機関によって承認されている現行の代表的な基準であるが、ある化合物がヒトにおいて癌を引き起こす可能性を評価するための広く使用可能なツールとして、最適なものとはほど遠い。
【0008】
被験体が曝露され得る特定の健康リスク(すなわち、癌/悪性腫瘍/新生物、神経毒性、神経変性、不妊症、出生異常など)寄与する核酸変異および損傷を引き起こす因子/薬剤/環境の遺伝毒性の可能性の直接的な測定を可能にする、迅速で、柔軟性があり、信頼性の高い方法が必要とされている。この方法は、任意の種類の生物内の任意の組織の種類および/または細胞の種類の任意のゲノム遺伝子座において、(先行技術の代表的な基準試験で必要とされるような)クローナル選択を必要とすることなく、発癌性因子が、被験体/生物において、またはその被験体/生物によってモデル化される別の生物において、癌の発生または他の疾患または障害を生じさせる変異または他の遺伝毒性損傷をインビボでどのように引き起こすかの作用機序についての情報を提供しつつ(推定されるか、または直接的に)、使用可能であるべきである。
【0009】
これらの特徴を有する十分に正確で利便性の高いツールが利用可能であれば、例えば、前臨床および臨床での薬物安全性試験において、遺伝毒性物質に関連する疾患および障害を予防し、診断し、治療することにおいて、変異の原因物質/薬剤およびその作用機序を検出し、識別することにおいて、および他の産業全体との関わり(例えば、環境汚染試験および毒性発状の閾値レベルの決定、高スループット消費者製品の安全性試験、毒性曝露の疑いがある場合の患者の診断および治療、遺伝毒性物質の意図的な放出または意図的ではない放出の国家的なセキュリティリスク評価)など、多くの用途を有するだろう。
【発明の概要】
【0010】
本技術は、遺伝毒性を評価するための方法、システムおよび試薬のキットを対象とする。特に、本技術のいくつかの実施形態は、曝露された被験体における化合物(例えば、化学化合物)および/または環境薬剤(例えば、放射線)の遺伝毒性の可能性を評価するために二本鎖配列決定を利用することを対象とする。例えば、本技術の種々の実施形態は、任意のクローン選択を必要とすることなく、任意の生物の任意のゲノムコンテキストにおける化合物誘発性変異の直接的な測定を可能にする二本鎖配列決定方法を行うことを含む。本技術のさらなる例は、二本鎖配列決定および関連する試薬を用いてゲノムインビボ変異導入を検出し、評価するための方法を対象とする。本技術の種々の態様は、前臨床および臨床での薬物安全性試験だけではなく、他の産業全体との関わりにおいて、多くの用途を有する。
【0011】
一実施形態において、本技術は、被験体が変異原に曝露した後に被験体においてインビボで発生したゲノム変異を検出し、定量化するための方法であって、(1)変異原に曝露された被験体から抽出された1つ以上の標的二本鎖DNA分子を二本鎖配列決定することと、(2)標的二本鎖DNA分子についてのエラー修正済コンセンサス配列を作成することと、(3)標的二本鎖DNA分子の変異スペクトラムを識別することと、(4)配列決定された1つ以上の種類の二本鎖塩基対あたりの固有の変異数を計算することによって、標的二本鎖DNA分子の変異体頻度を計算することと、を含む、方法を含む。
【0012】
別の実施形態において、本技術は、試験化合物の変異誘発性シグネチャを作成するための方法であって、(1)試験化合物に曝露された生存生物(例えば、試験動物)から抽出されたDNAフラグメントを二本鎖配列決定することと、(2)試験化合物の変異誘発性シグネチャを作成することと、を含む、方法を含む。また、この方法は、配列決定された二本鎖塩基対あたりの固有の変異数を計算することによって、複数のDNAフラグメントの変異体頻度を計算することをさらに含んでいてもよい。
【0013】
別の実施形態において、本技術は、化合物の遺伝毒性の可能性を評価するための方法であって、(1)化合物に曝露された試験動物から抽出された標的DNAフラグメントを二本鎖配列決定して、標的DNAフラグメントのエラー修正済コンセンサス配列を作成することと、(2)エラー修正済コンセンサス配列から化合物の変異誘発性シグネチャを作成することと、(3)化合物への曝露によって、十分に遺伝毒性のある化合物を表す変異誘発性シグネチャが得られるかどうかを決定することと、を含む、方法を含む。
【0014】
別の実施形態において、本技術は、遺伝毒性物質を検出し、定量化するための本明細書に開示する方法を行うための説明書と共に試薬を含むキットを含む。このキットは、電子計算デバイス(例えば、ラップトップ/デスクトップコンピュータ、タブレットなど)にインストールされているか、またはネットワーク(被験体の記録および検出された遺伝毒性物質のデータベースを含むリモートサーバ)を介してアクセス可能なコンピュータプログラム製品をさらに含んでいてもよい。コンピュータプログラム製品は、コンピュータ上で実行されるとき、遺伝毒性物質を検出し、識別するための本明細書に開示するキットを用いる方法の工程を実行する、一時的でないコンピュータ可読媒体で具現化される。
【0015】
別の実施形態において、本技術は、少なくとも1つの遺伝毒性物質への被験体の曝露を識別するか、または確認するためのネットワークコンピュータシステムであって、(1)リモートサーバと、(2)被験体のサンプルを抽出し、増幅させ、配列決定するために本明細書に開示するキットを利用することが可能な複数のユーザ電子計算デバイスと、(3)既知の遺伝毒性物質プロファイルを含む第三者のデータベース(任意要素)と、(4)電子計算デバイスと、データベースと、リモートサーバとの間の電子通信を伝達するための有線または無線のネットワークと、を備える、ネットワークコンピュータシステムを含む。リモートサーバは、さらに、(a)ユーザの遺伝毒性物質の記録結果と遺伝毒性物質プロファイル(例えば、スペクトラム、頻度、作用機序など)の記録を格納するデータベースと、(b)メモリに通信可能に接続された1つ以上のプロセッサと、プロセッサのための命令を含む、1つ以上の一時的でないコンピュータ可読記録デバイスまたは媒体とを備えており、ここで、プロセッサは、二本鎖配列決定フラグメント中のエラーを修正する工程と、検出された薬剤の変異スペクトラム、変異体頻度および三重変異スペクトラムを計算する工程とを含む操作を行うための命令を実行するように構成されており、これらから少なくとも1つの遺伝毒性物質の同一性を決定することができる。
【0016】
本技術はさらに、1つ以上のプロセッサによって実行されるとき、被験体が少なくとも1つの遺伝毒性物質に曝露されたかどうかを決定するための、および/または少なくとも1つの遺伝毒性物質の同一性を決定するための方法を実行する命令を含む、一時的でないコンピュータ可読記憶媒体を含み、方法は、二本鎖配列決定フラグメント中のエラーを修正する工程と、検出された薬剤の変異スペクトラム、変異体頻度および三重スペクトラムを計算する工程とを含み、これらから少なくとも1つの遺伝毒性物質の同一性が決定される。
【0017】
本技術はさらに、被験体が少なくとも1つの遺伝毒性物質に曝露されたかどうかを決定するための、および/または少なくとも1つの遺伝毒性物質の同一性を決定するためのコンピュータを用いた方法を含み、この方法は、二本鎖配列決定フラグメント中のエラーを修正する工程と、検出された薬剤の変異スペクトラム、変異体頻度および三重スペクトラムを計算する工程とを含み、これらから少なくとも1つの遺伝毒性物質の同一性が決定される。
【0018】
別の実施形態において、本技術は、遺伝毒性物質に曝露された被験体を診断し、治療するための方法、システムおよびキットを含む。診断することは、被験体が曝露され、および/または摂取された少なくとも1つの遺伝毒性物質を検出することを含み、治療することは、遺伝毒性物質の将来の曝露および/または摂取を取り除くこと、および/または遺伝毒性物質の生物学的効果を遮断し、および/または別の状況で妨害するための治療プロトコル(例えば、医薬)を投与することを含む。
【0019】
別の実施形態において、本技術は、前臨床および臨床での薬物安全性試験のため、発癌物質およびその作用機序を検出し、識別するため、他の産業全体との関わり(例えば、毒性環境汚染物質、高スループット消費者製品および薬物安全性試験など)のための方法、コンピュータを用いたシステムおよびキットを含む。
【0020】
別の実施形態において、本技術は、エラー修正二本鎖配列決定を用いて新規遺伝毒性物質を識別し、および/または次いで、被験体が、遺伝毒性物質に関連する疾患または障害の進行するリスクが生じる前に、被験体が曝露され得る遺伝毒性物質の安全性閾値量(重量、体積、濃度など)および/または安全性閾値変異体頻度を決定する、方法、システムおよびキットを含む(例えば、環境保護庁の基準を設定する際に使用される、遺伝毒性物質に曝露された被験体を診断し、治療する際に使用される、など)。
【0021】
別の実施形態において、本技術は、被験体が、安全性閾値レベル(すなわち、遺伝毒性物質の量および/または遺伝毒性物質の変異体頻度および三重シグネチャ)を超える遺伝毒性物質に曝露されたかどうかを決定することによって、被験体が、変異に関連する疾患または障害が発生するのを防ぐための方法、システムおよびキットであって、その場合には、疾患の発症を予防し、阻害し、または抑止するための予防的処置を提供する、方法、システムおよびキットを含む。
【0022】
本技術の一態様は、遺伝毒性物質を生じる変異への曝露の後ではあるが数日間または数週間または数ヶ月または数年以内に、疾患を引き起こす変異を検出する能力を含む。通常、完全な疾患の発症は、何年も診断されない(例えば、アスベストに曝露した後に肺癌発生まで10~20年)。本明細書に開示される方法およびキットは、症状が現れるまでに何年間も待つのではなく、曝露直後に疾患発症を引き起こすゲノム変異の検出を可能にする。
【0023】
本技術の別の態様は、遺伝毒性物質への曝露の可能性があった後の最短で約2~5日以内から数年後まで、遺伝毒性物質を生じる変異に起因して、被験体が疾患または障害が発生するリスクが増加しているかどうかを予測する能力を含み、そうである場合、初期段階での疾患の発症を検出するための予防的処置および周期的なスクリーニングを提供する。
【0024】
別の態様は、複数の二本鎖の単離されたゲノムDNAフラグメントを含む、DNAライブラリおよび製造方法を含み、各フラグメントは、1つ以上の所望なアダプター分子にライゲーションされる。
【0025】
別の態様は、どの化合物が遺伝毒性であるかを識別するために複数の化合物を迅速にスクリーニングするための高スループット方法を含む。
【0026】
別の態様は、被験体が何らかの遺伝毒性物質に曝露されたかどうかを決定するために、この同じ被験体の複数の異なる組織/細胞の種類を迅速にスクリーニングするための高スループット方法を含む。
【0027】
別の態様は、何らかの遺伝毒性物質に曝露された集合体の割合を決定するために、異なる被験体に由来する複数の組織および細胞を迅速にスクリーニングするための高スループット方法を含む。
【0028】
別の態様は、特定の疾患または障害に関連する変異を生じる遺伝毒性物質の曝露を引き起こす、遺伝毒性物質の「作用機序」を直接的にまたは推論的に決定することを含む。
【0029】
本技術の他の実施形態、態様および利点は、以下の詳細な説明において、さらに説明される。
【図面の簡単な説明】
【0030】
本開示の多くの態様は、以下の図面を参照しつつ、よりよく理解することができる。図面中の構成要素は、必ずしも縮尺どおりではない。その代わりに、本開示の原理を明確に例示することを重視する。
【
図1-1】
図1Aは、本技術のいくつかの実施形態と共に使用するための核酸アダプター分子、および本技術の実施形態に従う二本鎖核酸フラグメントへのアダプター分子のライゲーションから得られる二本鎖アダプター核酸分子複合体を示す。
【
図1-2】
図1Bおよび
図1Cは、本技術の実施形態に従う種々の二本鎖配列決定方法の工程の概念図である。
【
図2A】
図2Aは、従来の長期間げっ歯類発癌性試験(左側スキーム)、生体外での選択を伴う従来のトランスジェニックげっ歯類変異誘発性試験(中央スキーム)、および本技術の態様に従う直接的なDNA配列決定スキームを介する変異導入試験(右側スキーム)を含む、試験化合物のヒトでの癌リスクを予測するためのインビボ動物試験を使用するための種々の方法スキームの概念図である。
【
図2B】
図2Bおよび
図2Cは、本技術の態様に従う、培養中に成長したヒト細胞における試験化合物のインビトロ変異導入を評価するための二本鎖配列決定を用いるための方法スキームの概念図である。
【
図3-1】
図3A~
図3Dは、本技術の一実施形態に従う、変異原処置の後の肝臓および骨髄における二本鎖配列決定について計算された変異体頻度を示す箱ひげ図のグラフである。
【
図3-3】
図3Eは、本技術の一実施形態に従う、
図3A~3Dの二本鎖配列決定アッセイに対する、BigBlue(登録商標)cIIプラークアッセイにおける相対的なcII変異体倍増率を示すプロットである。
【
図3-4】
図3Fは、本技術の一実施形態に従う、BigBlue(登録商標)マウス組織と、BigBlue(登録商標)マウス組織からのcIIのgDNAの二本鎖配列決定とから産生される個々に採取された変異体プラークについてのcII遺伝子内の単一ヌクレオチドバリアント(SNV)の割合を示す。
【
図3-5】
図3Gおよび
図3Hは、本技術の一実施形態に従う、コドン位置および機能的帰結による、全てのBigBlue(登録商標)組織の種類および処置群にわたるcIIの直接的な二本鎖配列決定によって識別される変異の分布を示す。
【
図4】本技術の一実施形態に従う、各処置群の複数のサンプルにおいて二本鎖配列決定によって測定された変異体頻度を示す棒グラフである。
【
図5A】
図5Aおよび
図5Bは、本技術の一実施形態に従って二本鎖配列決定によって決定される、肝臓の中のcII導入遺伝子と比較して、内因性遺伝子の変異体頻度を示す棒グラフである。
【
図5C】
図5Cは、示される処置カテゴリについて、本技術の一実施形態に従う、肝臓および骨髄についての遺伝子領域による二本鎖配列決定について計算されたSNV変異体頻度(MF)を示す箱ひげ図のグラフである。
【
図5D】
図5Dは、本技術の一実施形態に従う、
図5Cに示される集計データの個々の測定値を示す散布図である。
【
図6】
図6は、本技術の一実施形態に従って二本鎖配列決定によって測定される変異スペクトラムを示す棒グラフである。
【
図7-1】
図7A~7Cは、本技術の一実施形態に従う、ビヒクル対照(
図7A)、ベンゾ[a]ピレン(
図7B)、N-エチル-ニトロソウレア(
図7C)についてのトリヌクレオチド変異スペクトラムを示すグラフである。
【
図8】
図8は、本技術の一実施形態に従う、対照およびウレタンを投与された実験動物について、肺、脾臓および血液サンプルの変異体頻度を示す棒グラフである。
【
図9】
図9は、本技術の一実施形態に従う、組織サンプル群にわたる平均最小点変異体頻度を示す棒グラフである。
【
図10A】
図10Aは、示される処置カテゴリについて、本技術の一実施形態に従う、肺、脾臓および血液についての遺伝子領域による二本鎖配列決定について計算されたSNV MFを示す箱ひげ図のグラフである。
【
図11】
図11は、本技術の一実施形態に従って二本鎖配列決定によって測定された、試験された組織内のウレタンおよびビヒクル対照の変異スペクトラムを示す棒グラフである。
【
図12-1】
図12Aおよび
図12Bは、本技術の一実施形態に従う、ビヒクル対照についての隣接ヌクレオチドのコンテキストにおける変異スペクトラム(すなわち、トリヌクレオチドスペクトラム)を示すグラフである。
【
図13】
図13は、本技術の一実施形態に従う、ウレタン処置されたサンプルにおける単一ヌクレオチドバリアント(SNV)スペクトル鎖バイアスを示す。
【
図14】
図14は、本技術の一実施形態に従って二本鎖配列決定によって検出された、バリアント対立遺伝子フラクションの早期新生物性クローン選択を示すグラフである。
【
図15A】
図15Aは、本技術の一実施形態に従う、Tg-rasH2マウスモデルにおけるヒト形質導入遺伝子座を含むRas遺伝子ファミリーから捕捉されたエキソンについてのゲノム区間にわたってプロットされたSNVを示すグラフである。
【
図15B】
図15Bは、本技術の一実施形態に従う、ヒトHRAS導入遺伝子のエキソン3にアラインメントする単一ヌクレオチドバリアントを示すグラフである。
【
図16A】
図16Aは、従来のDNA配列決定を用いる、ウレタン処置後のマウス肺におけるヒトHRASの代表的な400塩基対部分からの配列決定データのグラフ表示である。
【
図16B】
図16Bは、本技術の一実施形態に従って二本鎖配列決定を用いる、ウレタン処置後のマウス肺におけるヒトHRASの代表的な400塩基対部分からの配列決定データのグラフ表示である。
【
図17-1】
図17A~
図17Cは、COSMICからのシグネチャ1についての隣接ヌクレオチドのコンテキストにおける変異スペクトラム(すなわち、トリヌクレオチドスペクトラム)を示すグラフである。
【
図18】
図18は、本技術の一実施形態に従う、公開された全30種類のCOSMICシグネチャおよび実施例1および2からの4種類のコホートスペクトラムの教師なし階層型クラスタリングを示す。
【
図19】
図19は、本技術の一実施形態に従う、遺伝毒性物質曝露から生じる変異誘発事象および/または核酸損傷事象を識別するための本明細書に開示する方法および/またはキットと共に使用するためのネットワークコンピュータシステムの概略図である。
【
図20】
図20は、本技術の一実施形態に従う、本技術の一実施形態に従う、二本鎖配列決定コンセンサス配列データを提供するためのルーチンを示すフロー図である。
【
図21】
図21は、本技術の一実施形態に従う、サンプルの遺伝毒性物質曝露から生じる変異誘発事象を検出し、識別するためのルーチンを示すフロー図である。
【
図22】
図22は、本技術の一実施形態に従う、サンプルの遺伝毒性物質曝露から生じるDNA損傷事象を検出し、識別するためのルーチンを示すフロー図である。
【
図23】
図23は、本技術の一実施形態に従う、被験体において発癌物質または発癌物質曝露を検出し、識別するためのルーチンを示すフロー図である。
【発明を実施するための形態】
【0031】
本技術のいくつかの実施形態の具体的な詳細が、
図1A~図
23を参照しつつ、以下に記載される。これらの実施形態は、例えば、遺伝毒性を評価するための方法、システム、キットなどを含んでいてもよい。本技術のいくつかの実施形態は、曝露された被験体、モデル生物またはモデル細胞培養系において、ある薬剤(例えば、化学化合物)または任意の他の種類の曝露(例えば、放射線源)の遺伝毒性の可能性を評価するために二本鎖配列決定を利用することを対象とする。本技術の他の実施形態は、遺伝毒性薬剤と関連する変異シグネチャを決定するために二本鎖配列決定を利用することを対象とする。本技術のさらなる実施形態は、被験体のDNA変異スペクトラムと既知の変異誘発性化合物の変異スペクトラムとを比較することによって、被験体が曝露された可能性がある1つ以上の遺伝毒性薬剤を識別することを対象とする。本技術のさらなる実施形態は、1つ以上の組織における1つ以上の細胞の種類からの被験体のDNA変異スペクトラムと、ある場所または環境に存在することが知られている既知の環境または化合物の変異スペクトラムとを比較することによって、被験体が曝露された可能性がある1つ以上の場所または環境を識別することを対象とする。本技術のさらなる実施形態は、1つ以上の組織における1つ以上の細胞の種類からの被験体のDNA変異スペクトラムと、既知の個体の変異スペクトラム、またはその個体が曝露されたことがわかっている既知の場所または環境の変異スペクトラム、またはこのような場所または環境に存在することが知られている化合物の変異スペクトラムとを比較することによって、被験体を識別することを対象とする。特定の実施形態において、遺伝毒性物質は、発癌性の可能性について評価されてもよい。さらなる実施形態は、癌ドライバー変異と共に出現する変異を有するクローンを識別することによって、変異誘発性または非変異誘発性の発癌物質から生じる発癌リスクを識別し、評価することを含む。さらなる実施形態は、その変異が癌ドライバーであると考えられていない変異(多くは「パッセンジャー」または「ヒッチハイカー」変異として知られる)であるが、クローンを実質的に固有に標識する変異を有するクローンの出現を識別することによって、変異誘発性または非変異誘発性の発癌物質から生じる発癌リスクを識別し、評価することを含む(SalkおよびHorwitz、Sem Cancer Bio 2010 PMID:20951806)。本技術の他の実施形態は、遺伝毒性物質曝露または他の内因性遺伝毒性プロセス(例えば、老化)から生じる核酸損傷(特に、付加物などのDNA損傷)を検出し、評価するために二本鎖配列決定を利用することを対象とする。
【0032】
実施形態の多くは、本明細書では二本鎖配列決定に関して記載されるが、本明細書に記載されるものに加え、エラー修正済配列リードを作成することが可能な他の配列決定様式は、本技術の範囲内である。これに加えて、本技術の他の実施形態は、本明細書に記載されるものとは異なる構成、構成要素または手順を有していてもよい。したがって、当業者は、本技術が、さらなる要素を有する他の実施形態を含んでいてもよく、また、
図1A~図
23を参照しつつ以下に示され、記載される特徴のいくつかを含まない他の実施形態を含んでいてもよいことを理解するだろう。
【0033】
定義
本開示がより容易に理解されるために、まず、特定の用語を以下に定義する。以下の用語および他の用語についてのさらなる定義は、本明細書全体を通して記載される。
【0034】
本出願では、文脈から別段明確でない限り、「1つの(a)」という用語は、「少なくとも1つ」を意味すると理解され得る。本出願で使用される場合、「または」という用語は、「および/または」を意味すると理解され得る。本出願では、「~を含む(comprising)」および「~を含む(including)」という用語は、それ自体によって示されるか、または1つ以上のさらなる構成要素または工程と共に示されるかにかかわらず、項目化された構成要素または工程を包含すると理解され得る。範囲が本明細書で提示される場合、その両端が含まれる。本出願で使用される場合、「~を含む(comprise)」という用語およびこの用語の変形語、例えば、「~を含む(comprising)」および「~を含む(comprises)」は、他の添加剤、構成要素、整数または工程を除外することを意図しない。
【0035】
約:「約」という用語は、ある値を参照しつつ本明細書で使用される場合、参照される値の観点で、類似する値を指す。一般に、その観点に精通している当業者は、その観点で「約」に包含される関連する程度の分散を理解するだろう。例えば、いくつかの実施形態において、「約」という用語は、参照される値の25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%以内、またはさらに小さな範囲の値を包含し得る。1桁の整数値の分散について、正方向または負方向のいずれかにおける1個の数値の工程が、その値の25%を超える場合、「約」は、正方向または負方向のいずれかにおいて少なくとも1、2、3、4または5の整数値を含むことが当業者によって一般的に受け入れられており、状況に応じて0を超えても超えなくてもよい。この非限定的な例は、当業者にとって明らかであろういくつかの状況において、3セントが約5セントとみなされ得るという仮説である。
【0036】
類似体:本明細書で使用される場合、「類似体」という用語は、1つ以上の特定の構造特徴、要素、構成要素または部分が参照物質と共通する物質を指す。典型的には、「類似体」は、参照物質と有意な構造類似性を示し、例えば、コアまたはコンセンサス構造が共通するが、特定の別個の様式では違いもある。いくつかの実施形態において、類似体は、参照物質から、例えば、参照物質の化学操作によって生成可能な物質である。いくつかの実施形態において、類似体は、参照物質を生成する合成プロセスと実質的に類似した(例えば、複数の工程が共通する)合成プロセスの性能によって生成可能な物質である。いくつかの実施形態において、類似体は、参照物質を生成するために使用されるものとは異なる合成プロセスの性能によって生成されるか、または生成可能である。
【0037】
生体サンプル:本明細書で使用される場合、「生体サンプル」または「サンプル」という用語は、典型的には、本明細書に記載されるように、目的の生体源(例えば、組織または生物または細胞培養物)から得られるか、または目的の生体源に由来するサンプルを指す。いくつかの実施形態において、目的の供給源は、動物またはヒトなどの生物を含む。他の実施形態において、目的の供給源は、細菌、ウイルス、原虫または真菌などの微生物を含む。さらなる実施形態において、目的の供給源は、合成組織、生物、細胞培養物、核酸または他の材料であってもよい。さらにさらなる実施形態において、目的の供給源は、植物系生物であってもよい。さらに別の実施形態において、サンプルは、例えば、水サンプル、土壌サンプル、考古学サンプルまたは非生物源から採取された他のサンプルなどの環境サンプルであってもよい。他の実施形態において、サンプルは、多生物サンプル(例えば、混合生物サンプル)であってもよい。いくつかの実施形態において、生体サンプルは、生体組織または生物流体であるか、生体組織または生物流体を含む。いくつかの実施形態において、生体サンプルは、骨髄、血液、血球、腹水、組織サンプル、生検サンプル、または微細針吸引サンプル、細胞を含有する体液、遊離浮遊核酸、タンパク質に結合した核酸、リボタンパク質に結合した核酸、痰、唾液、尿、脳脊髄液、腹腔液、胸水、糞便、リンパ液、婦人科系体液、皮膚スワブ、膣スワブ、パップスメア、口腔スワブ、鼻スワブ、導管洗浄または気管支肺泡洗浄などの染液または洗浄液、膣液、吸引物、擦過物、骨髄標本、組織生検標本、胎児組織または体液、外科標本、糞便、他の体液、分泌液、および/または排泄物、および/またはこれらからの細胞などであってもよく、またはこれらを含んでいてもよい。いくつかの実施形態において、生体サンプルは、個体から得られた細胞であるか、または個体から得られた細胞を含む。いくつかの実施形態において、得られる細胞は、サンプルが得られる個体由来の細胞であるか、またはサンプルが得られる個体由来の細胞を含む。いくつかの実施形態において、細胞小器官または小胞またはエクソソームなどの細胞誘導体。特定の実施形態において、生体サンプルは、被験体から得られる液体生検である。いくつかの実施形態において、サンプルは、任意の適切な手段によって目的の供給源から直接的に得られる「一次サンプル」である。例えば、いくつかの実施形態において、一次生体サンプルは、生検(例えば、微細針吸引または組織生検)、手術、体液(例えば、血液、リンパ液、糞便など)の採取などからなる群から選択される方法によって得られる。いくつかの実施形態において、文脈から明らかになるように、「サンプル」という用語は、一次サンプルを処理することによって(例えば、その1つ以上の構成要素を除去することによって、および/または1つ以上の薬剤をこれに加えることによって)得られる調製物を指す。例えば、半透過性膜を使用して濾過すること。このような「処理されたサンプル」は、例えば、サンプルから抽出されるか、または一次サンプルに対して、mRNAの増幅または逆転写、特定の構成要素の単離および/または精製などの技術を行うことによって得られる核酸またはタンパク質を含んでいてもよい。
【0038】
癌疾患:一実施形態において、遺伝毒性物質に関連する疾患または障害は、一般的に異常な細胞の調節異常による成長によって特徴付けられるような、当業者によく知られた「癌疾患」であり、転移する場合がある。本技術の1つ以上の態様を用いて検出可能な癌疾患は、非限定的な例として、特に、前立腺癌(すなわち、腺癌、小細胞)、卵巣癌(例えば、卵巣腺癌、漿液性癌または胎生期癌、卵黄腫瘍、奇形腫)、肝臓癌(例えば、HCCまたはヘパトーマ、血管肉腫)、形質細胞腫瘍(例えば、多発性骨髄腫、形質細胞白血病、形質細胞腫、アミロイドーシス、ヴァルデンストレームマクログロブリン血症)、大腸癌(例えば、結腸腺癌、結腸粘液腺癌、カルチノイド、リンパ腫および直腸腺癌、直腸扁平上皮癌)、白血病(例えば、急性骨髄性白血病、急性リンパ性白血病、慢性骨髄性白血病、慢性リンパ性白血病、急性骨髄芽球性白血病、急性前骨髄球性白血病、急性骨髄単球性白血病、急性単球性白血病、急性赤白血病および慢性白血病、T細胞白血病、セザリー症候群、全身性肥満細胞症、有毛細胞白血病、慢性骨髄性白血病の急性転化)、骨髄異形成症候群、リンパ腫(例えば、びまん性大細胞型B細胞リンパ腫、皮膚T細胞リンパ腫、末梢性T細胞リンパ腫、ホジキンリンパ腫、非ホジキンリンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、MALTリンパ腫、辺縁帯細胞リンパ腫、リヒタートランスフォーメーション、ダブルヒットリンパ腫、移植関連リンパ腫、CNSリンパ腫、節外性リンパ腫、HIV関連リンパ腫、風土病性リンパ腫、バーキットリンパ腫、移植関連リンパ増殖性新生物およびリンパ球性リンパ腫など)、子宮頸癌(扁平上皮子宮頸癌、明細胞癌、HPV関連癌腫、子宮頸部肉腫など)、食道癌(食道扁平上皮細胞癌腫、腺癌、特定のグレードのバレット食道、食道腺癌)、黒色腫(皮膚黒色腫、ブドウ膜黒色腫、四肢末端部黒色腫、メラニン欠乏性黒色腫など)、CNS腫瘍(例えば、乏突起膠腫、星細胞腫、多形性膠芽細胞腫、髄膜腫、神経鞘腫、頭蓋咽頭腫など)、膵臓癌(例えば、腺癌、腺扁平上皮癌腫、印環細胞癌腫、肝様癌腫、コロイド癌腫、島細胞癌腫、膵臓神経内分泌癌腫など)、消化管間質腫瘍、肉腫(例えば、線維肉腫、粘液肉腫、脂肪肉腫、軟骨肉腫、骨肉腫、血管肉腫、内皮腫肉腫、リンパ管肉腫、リンパ管内皮腫肉腫、平滑筋肉腫、ユーイング肉腫および横紋筋肉腫、紡錘形細胞腫瘍など)、乳癌(例えば、炎症性癌腫、肺葉癌腫、乳管癌腫など)、ER陽性癌、HER-2陽性癌、膀胱癌(膀胱扁平上皮癌、膀胱小細胞癌、尿路上皮癌など)、頭頸部癌(例えば、頭頸部の扁平上皮細胞癌腫、HPV関連扁平上皮細胞癌腫、鼻咽頭癌腫など)、肺癌(例えば、非小細胞肺癌腫、大細胞癌腫、気管支癌腫、扁平上皮細胞癌、小細胞肺癌など)、転移性癌、口腔癌、子宮癌(平滑筋肉腫、平滑筋腫など)、精巣癌(例えば、セミノーマ、非セミノーマおよび胚性癌腫、卵黄腫瘍など)、皮膚癌(例えば、扁平上皮細胞癌腫および基底細胞癌腫、メルケル細胞癌腫、黒色腫、皮膚T細胞リンパ腫など)、甲状腺癌(例えば、乳頭癌腫、髄様癌腫、未分化甲状腺癌など)、胃癌(stomach cancer)、上皮内癌、骨癌、胆道癌、眼の癌、喉頭癌、腎臓癌(例えば、腎細胞癌腫、ウイルムス腫瘍など)、胃癌(gastric cancer)、芽細胞腫(例えば、腎芽細胞腫、髄芽腫、血管芽細胞腫、神経芽細胞腫、網膜芽腫など)、骨髄増殖性新生物(真性赤血球増加症、本態性血小板血症、骨髄線維症など)、脊索腫、滑液腫瘍、中皮腫、腺癌、汗腺癌腫、皮脂腺癌腫、嚢胞腺癌、胆管癌腫、絨毛腫、上皮癌腫、上衣腫、松果体腫、聴神経腫、神経鞘腫、髄膜腫、下垂体腺腫、神経鞘腫瘍、小腸の癌、褐色細胞腫、小細胞肺癌、腹膜中皮腫、副甲状腺機能亢進症による腺腫、副腎癌、未知の原発性癌、内分泌系の癌、陰茎の癌、尿道の癌、皮膚または眼内の黒色腫、婦人科系の腫瘍、小児の固形腫瘍、または中枢神経系の新生物、原発性縦隔胚細胞腫瘍、未確定の潜在能を有するクローン造血、くすぶり型骨髄腫、意義不明の単クローン性免疫グロブリン血症、単クローン性B細胞リンパ球増加症、低グレードの癌、クローナルフィールド欠損(clonal field defects)、前癌性の新生物、尿管癌、自己免疫関連癌(すなわち、潰瘍性結腸炎、原発性硬化性胆管炎、セリアック病)、遺伝性素因と関連する癌(すなわち、BRCA1、BRCA2、TP53、PTEN、ATMなどの遺伝子欠損を有するもの)、および種々の遺伝的症候群、例えば、MEN1、MEN2トリソミー21など)、および子宮において化学物質に曝露されたときに生じるもの(すなわち、ジエチルスチルベストロール[DES]に曝露した女性の子孫のうち、女性の子孫における明細胞癌)を含む。
【0039】
癌ドライバーまたは癌ドライバー遺伝子:本明細書で使用される場合、「癌ドライバー」または「癌ドライバー遺伝子」は、適切な状況において、細胞が悪性転換を受ける可能性がある遺伝子病変を指す。このような遺伝子としては、悪性転換を正常に抑制するが、特定の様式で変異すると、もはや悪性転換を正常に抑制しない、腫瘍抑制因子(例えば、TP53、BRCA1)が挙げられる。他のドライバー遺伝子は、特定の様式で変異すると、細胞が悪性化するのを容易にする新しい性質を構成的に活性化するか、または獲得する癌遺伝子(例えば、KRAS、EGFR)であってもよい。ゲノムの非コード領域にみられる他の変異は、癌ドライバーであってもよい。例えば、テロメラーゼ遺伝子(TERT)のプロモーター領域の変異は、この遺伝子の過剰発現を引き起こし、そのため、癌ドライバーとなる場合がある。特定の転位(例えば、BCR-ABL融合)は、1つの遺伝子領域と、別の遺伝子領域とを並置し、過剰発現、抑制の消失またはキメラ融合遺伝子に関連する機構を介して腫瘍発生を促進する場合がある。広義には、他の細胞と比べて、その増殖、生存または競争上の優位性を与えるか、またはより安定的に進化する能力を付与する表現型を細胞に与える遺伝子変異(またはエピ変異)は、ドライバー変異と考えることができる。これは、これらの変異が同じ遺伝子内で起こり得る場合であっても(すなわち、同義変異)、このような特徴を欠く変異とは対照的である。このような変異が腫瘍内で識別されるとき、このような変異は、増殖に有意義に寄与することなく、クローン増殖と共に「ヒッチハイク」するため、一般的に、パッセンジャー変異と呼ばれる。当業者に認識されるように、ドライバーとパッセンジャーの区別は絶対的なものではなく、絶対的なものであると解釈されるべきではない。ある特定の状況(例えば、特定の組織)でのみ機能するドライバーもいれば、他のドライバーは、他の変異またはエピ変異または他の因子が存在しないと働かない場合もある。
【0040】
対照サンプル:本明細書で使用される場合、「対照サンプル」は、対照サンプルが、遺伝毒性の可能性について評価される薬剤、環境またはプロセスに曝露されていないことを除き、比較されるサンプルと同じ様式で単離されたサンプルを指す。
【0041】
決定:本明細書に記載の多くの方法論は、「決定する」工程を含む。当業者は、本明細書を読むと、このような「決定する」ことが、例えば本明細書に明示的に言及される特定の技術を含め、当業者が利用可能な種々の技術のいずれかの使用によって利用されるか、または達成することができることを理解するだろう。いくつかの実施形態において、決定することは、物理的なサンプルの操作を伴う。いくつかの実施形態において、決定することは、例えば、関連する分析を行うように調整されたコンピュータまたは他の処理ユニットを利用した、データまたは情報の検討および/または操作を伴う。いくつかの実施形態において、決定することは、情報源から関連情報および/または資料を受信することを伴う。いくつかの実施形態において、決定することは、サンプルまたはエンティティの1つ以上の特徴を、比較可能な参照と比較することを伴う。
【0042】
二本鎖配列決定(DS):本明細書で使用される場合、「二本鎖配列決定(DS)」は、その最も広い意味で、個々のDNA分子の両方の鎖からの配列を比較することによって卓越した精度を達成する、タグを用いるエラー修正方法を指す。
【0043】
遺伝毒性:本明細書で使用される場合、「遺伝毒性」という用語は、遺伝物質(例えば、DNA、RNA)への損傷を引き起こす薬剤またはプロセス(すなわち、遺伝毒性物質)の破壊的性質を指す。遺伝毒性物質への曝露から直接的または間接的に生じるポリヌクレオチド損傷、遺伝子変異の形成および/または正常な核酸構造の破壊は、遺伝毒性の態様である。遺伝毒性物質に曝露された被験体は、直後に、または数年後に、疾患または障害(例えば、癌)を発症する可能性がある。一実施形態において、本技術は、部分的に、その疾患もしくは障害の発症を予防するか、もしくはその発症リスクを減らし、および/またはその有害な影響に対抗するために、被験体において遺伝毒性を引き起こす寄与事象および/または因子(例えば、薬剤、プロセス)を識別することを対象とする。他の実施形態において、遺伝毒性の開始は、遺伝子ライブラリ内で多様性を作り出すためなどの設計によるものである。
【0044】
遺伝毒性物質または遺伝毒性薬剤または因子:本明細書で使用される場合、「遺伝毒性物質」または「遺伝毒性薬剤または因子」という用語は、例えば、核酸源(例えば、生体源、被験体)が曝露される任意の化学物質、および/または摂取物、環境曝露、および/またはポリヌクレオチド損傷、ゲノム変異または正常な核酸構造の破壊を引き起こす任意のトリガー事象(内因性前駆体変異)を指す。いくつかの実施形態において、遺伝毒性物質は、被験体において疾患もしくは障害の発症を直接的もしくは間接的に(例えば、変異誘発性前駆体のトリガーとなる)、またはその両方で引き起こす能力を有する。本技術によって検出することが可能な遺伝毒性因子または薬剤は、非限定的な例として、化学物質または化学物質の混合物(例えば、医薬品、工業用添加剤および廃棄副産物、石油蒸留物、重金属、化粧品、家庭用洗浄剤、空気中微粒子、食品、製造業の副産物、汚染物質、可塑剤、洗剤など)、および放射線(粒子放射線、光子、または両方)、ならびに/または天然環境によって、または人工的に(例えば、デバイスから)作られた物理的な力(例えば、磁場、重力場、加速力など)を含む。遺伝毒性物質は、さらに、液体、固体および/またはエアロゾル製剤を含んでいてもよく、その曝露は、任意の投与経路を介するものであってもよい。遺伝毒性薬剤または因子は、外因性であってもよく(例えば、曝露が生体源の外側に由来する)、または他の場合には、遺伝毒性薬剤または因子は、生体源に対して内因性であってもよく、またはこれらの組み合わせであってもよい。外部に由来する薬剤または因子は、このような曝露が内因的に処理されると、遺伝毒性になる場合がある。さらに他の例では、薬剤または因子は、1つ以上のさらなる薬剤または因子と組み合わせると遺伝毒性になる場合があり、いくつかの場合において、相乗効果を有している場合がある。遺伝毒性因子または薬剤のさらなる例としては、さらに、曝露すると(例えば、被験体の感染によって)被験体において直接的または間接的に核酸損傷を引き起こすことが可能な生物、例えば、非限定的な例として、膀胱癌に寄与する住血吸虫症、子宮頸癌または頭頸部癌に寄与するHPV、メルケル細胞癌腫に寄与するポリオーマウイルス、胃癌に寄与するヘリコバクターピロリ、扁平上皮細胞癌腫に寄与する皮膚創傷の慢性細菌感染などが挙げられるだろう。さらなる遺伝毒性薬剤または因子としては、さらに、遺伝毒性薬剤を産生する(例えば、それ自体の中で、または分泌する)ことが可能な生物、例えば、非限定的な例として、aspergillus flavus由来のアフラトキシン、または植物のaristocholiaファミリー由来のアリストロキン酸などが挙げられるだろう。本技術の種々の態様を用いて検出することが可能な遺伝毒性因子または薬剤は、さらに、内因性遺伝毒性物質を含んでいてもよく、正確に定量化または実験的に制御することができないものであってもよく、例えば、非限定的な例として、ストレス、炎症、治療処置(例えば、遺伝子療法、遺伝子編集療法、幹細胞療法、他の細胞療法、医薬品、放射線撮影など)の影響を含んでいてもよい。内因性因子はまた、被験体の曝露の一体的な影響を反映する被験体の組織における変異および他の遺伝毒性事象の総計を表す場合がある。
【0045】
遺伝毒性物質に関連する疾患または障害:本明細書で使用される場合、「遺伝毒性物質に関連する疾患または障害」という用語は、1つ以上の遺伝毒性物質への曝露によって直接的または間接的に引き起こされる、被験体におけるゲノム変異または他のポリヌクレオチド損傷または転位から生じる任意の医学的状態を指す。遺伝毒性物質に関連する疾患または障害は、癌に関連するものであってもよく、癌に関連しないものであってもよい。これに加えて、ポリヌクレオチド損傷/転移または変異は、生殖細胞内であってもよく、または体細胞内であってもよい。複数の例において、生殖細胞が影響を受ける場合、遺伝毒性物質に関連する疾患または障害は、曝露した被験体の子孫である被験体において顕在化してもよい(または別の状況で、そのリスクが与えられてもよい)と考えられる。
【0046】
十分に遺伝毒性を有する薬剤:本明細書で使用される場合、「十分に遺伝毒性を有する薬剤」という用語は、曝露された1つ以上の生物に由来し得る1つ以上の分子中の1つ以上のヌクレオチド残基に核酸損傷または変異を引き起こす可能性が約50%、約40%、約30%、約20%、約10%、約5%、約4%、約3%、約2%、約1%、約0.5%、約0.1%、約0.01%、約0.001%、約0.0001%、約0.00001%、約0.000001%などであることが本技術のシステム、方法およびキットによって識別された薬剤、因子、化合物またはプロセスを指す。いくつかの実施形態において、十分に遺伝毒性を有する薬剤は、対照バックグラウンドレベルを上回る核酸損傷または変異を引き起こす確率が約50%より高くてもよい。いくつかの実施形態において、十分に遺伝毒性を有する薬剤は、遺伝毒性物質に曝露された被験体において、ある疾患または障害を引き起こす確率が約50%、約40%、約30%、約20%、約10%、約5%、約4%、約3%、約2%、約1%、約0.5%、約0.1%、約0.01%、約0.001%、約0.0001%、約0.00001%などであることが本技術のシステム、方法およびキットによって識別された薬剤、因子、化合物またはプロセスを指す。
【0047】
成長を阻害する:本明細書で使用される場合、癌疾患における「成長を阻害する」という用語は、処置を行わない状態での細胞の増殖および/または細胞の大きさの成長と比較して、処置に曝露された細胞の増殖および/または細胞の大きさ/質量の減少によって明らかであるように、細胞の成長(例えば、腫瘍の大きさ、癌細胞の分裂速度など)をインビボまたはインビトロで、例えば、約5%、約10%、約20%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、約95%または約99%、またはもっと大きく減少させることを指す。成長阻害は、細胞においてアポトーシスを誘発し、細胞において壊死を誘発し、細胞周期の進行を遅らせ、細胞代謝を妨害し、細胞溶解を誘発し、または細胞の増殖および/または細胞の大きさの成長を減少させるいくつかの他の機構を誘発する処置の結果であってもよい。
【0048】
発現:本明細書で使用される場合、核酸配列の「発現」は、以下の事象のうちの1つ以上を指す。(1)DNA配列からのRNAテンプレートの作成(例えば、転写による)、(2)RNA転写物の処理(例えば、スプライシング、編集、5’キャップ形成および/または3’末端形成による)、(3)RNAのポリペプチドもしくはタンパク質への翻訳、および/または(4)ポリペプチドもしくはタンパク質の翻訳後修飾。
【0049】
作用機序:本明細書で使用される場合、「作用機序」という用語は、遺伝毒性物質に曝露した後に核酸に変化を引き起こす生化学的プロセスを指す。一実施形態において、「作用機序」は、疾患または障害が完全に発症するまでのゲノム変異または損傷に続く生化学経路および/または病態生理学的プロセスを指す。別の実施形態において、「作用機序」は、遺伝毒性物質曝露の後に生体源で起こり、ゲノム損傷(例えば、変異誘発前の病変)または変異を引き起こす生化学経路および/または生理学的プロセスを含む。さらに別の実施形態において、遺伝毒性薬剤またはプロセスの作用機序は、影響を受けるヌクレオチド塩基、導入されるヌクレオチド変化、導入されるDNA損傷の種類、導入される構造変化、影響を受けるヌクレオチド(1つ以上)の隣接ヌクレオチド配列コンテキスト、影響を受ける遺伝子コンテキストまたは配列(1つ以上)、転写状態または影響を受ける領域、影響を受ける領域のメチル化状態、遺伝毒性物質曝露によって影響を受ける領域のタンパク質結合状態または縮合状態または染色体位置、のうちの1つ以上から推定されてもよい。
【0050】
変異:本明細書で使用される場合、「変異」という用語は、核酸配列または構造に対する変化を指す。ポリヌクレオチド配列に対する変異は、複雑な複数ヌクレオチドの変化の中で、サンプル中の点変異(例えば、単一塩基変異)、複数ヌクレオチドの変異、ヌクレオチドの欠失、配列転位、ヌクレオチドの挿入およびDNA配列の重複を含んでいてもよい。変異は、相補的な塩基の変化(すなわち、真の変異)として、または片方の鎖上の変異があるが、他の鎖上には変異がないもの(すなわち、ヘテロ二本鎖)として、二本鎖DNA分子の両方の鎖上で起こってもよく、修復されるか、破壊されるか、または誤って修復される/真の二本鎖変異へと変換される可能性を有する。
【0051】
変異体頻度:本明細書で使用される場合、「変異体頻度」という用語は、「変異体頻度」と呼ばれることもあり、配列決定される二本鎖塩基対の合計数あたりに検出される固有の変異の数を指す。いくつかの実施形態において、変異体頻度は、特定の遺伝子のみ、または1セットの遺伝子、または1セットのゲノム標的の中の変異の頻度である。いくつかの実施形態において、変異体頻度は、特定の種類の変異のみを指していてもよい(例えば、A>T変異の頻度は、A塩基の合計数あたりのA>T変異の数として計算される)。変異が細胞または分子の集合体に導入される頻度は、特に、遺伝毒性物質によって、遺伝毒性物質への曝露の時間またはレベルの量によって、被験体の年齢によって、時間経過に伴って、組織または有機体の種類によって、ゲノムの領域によって、変異の種類によって、トリヌクレオチドコンテキストによって、遺伝性の遺伝子背景によって変化し得る。
【0052】
変異シグネチャ:本明細書で使用される場合、「変異シグネチャ」および「変異スペクトラムまたは複数のスペクトラム」という用語は、DNA複製の失敗、外因性および内因性の遺伝毒性物質曝露、欠陥のあるDNA修復経路およびDNA酵素編集などの変異導入プロセスから生じる変異の種類の特徴的な組み合わせを指す。一実施形態において、変異スペクトラムは、計算パターンマッチング(例えば、教師なし階層型変異スペクトラムクラスタリング)によって作成される。
【0053】
癌ではない疾患:別の実施形態において、遺伝毒性物質に関連する疾患または障害は、癌ではない疾患である。その代わりに、ゲノム変異または損傷によって引き起こされるか、またはこれらが原因となるさらに別の種類の疾患または障害である。非限定的な例として、本技術の1つ以上の態様を用いて検出可能であるか、または予測されるこのような癌ではない種類の疾患または障害は、糖尿病、自己免疫疾患または障害、不妊症、神経変性、早老症、心血管疾患、別の遺伝子介在性疾患の処置に関連する任意の疾患(すなわち、化学療法介在性神経症およびシスプラチンなど化学療法に関連する腎不全)、アルツハイマー/認知症、肥満、心臓疾患、高血圧、関節炎、精神疾患、他の神経障害(神経線維腫症)、および多因子性遺伝障害(例えば、環境因子がトリガとなる素因)を含む。
【0054】
核酸:本明細書で使用される場合、その最も広い意味で、オリゴヌクレオチド鎖に組み込まれているか、または組み込まれ得る任意の化合物および/または物質を指す。いくつかの実施形態において、核酸は、ホスホジエステル結合を介してオリゴヌクレオチド鎖に組み込まれているか、または組み込まれ得る化合物および/または物質である。文脈から明らかになるように、いくつかの実施形態において、「核酸」は、個々の核酸残基(例えば、ヌクレオチドおよび/またはヌクレオシド)を指し、いくつかの実施形態において、「核酸」は、個々の核酸残基を含むオリゴヌクレオチド鎖を指す。いくつかの実施形態において、「核酸」は、RNAであるか、またはRNAを含み、いくつかの実施形態において、「核酸」は、DNAであるか、またはDNAを含む。いくつかの実施形態において、核酸は、1つ以上の天然核酸残基であるか、1つ以上の天然核酸残基を含むか、または1つ以上の天然核酸残基からなる。いくつかの実施形態において、核酸は、1つ以上の核酸類似体であるか、1つ以上の核酸類似体を含むか、または1つ以上の核酸類似体からなる。いくつかの実施形態において、核酸類似体は、ホスホジエステル骨格を利用しない点において核酸と異なる。例えば、いくつかの実施形態では、核酸は、1つ以上の「ペプチド核酸」であるか、1つ以上の「ペプチド核酸」を含むか、または1つ以上の「ペプチド核酸」からなり、「ペプチド核酸」は、当該技術分野で既知であり、骨格内にホスホジエステル結合の代わりにペプチド結合を有し、本技術の範囲内であると考えられる。これに代えて、またはこれに加えて、いくつかの実施形態において、核酸は、ホスホジエステル結合ではなく、1つ以上のホスホロチオエート結合および/または5’-N-ホスホラミダイト結合を有する。いくつかの実施形態において、核酸は、1つ以上の天然ヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシンおよびデオキシシチジン)であるか、1つ以上の天然ヌクレオシドを含むか、または1つ以上の天然ヌクレオシドからなる。いくつかの実施形態において、核酸は、1つ以上のヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、C-5プロピニルシチジン、C-5プロピニルウリジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニルウリジン、C5-プロピニルシチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、0(6)-メチルグアニン、2-チオシチジン、メチル化塩基、インターカレーションされた塩基、およびこれらの組み合わせ)であるか、1つ以上のヌクレオシド類似体を含むか、または1つ以上のヌクレオシド類似体からなる。いくつかの実施形態において、核酸は、天然核酸中の糖類と比較して、1つ以上の修飾された糖類(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノースおよびヘキソース)を含む。いくつかの実施形態において、核酸は、RNAまたはタンパク質などの機能的遺伝子産物をコードするヌクレオチド配列を有する。いくつかの実施形態において、核酸は、1つ以上のイントロンを含む。いくつかの実施形態において、核酸は、天然源からの単離、相補性テンプレートに基づく重合による酵素合成(インビボまたはインビトロで)、組換え細胞または系における生殖および化学合成のうちの1つ以上によって調製される。いくつかの実施形態において、核酸は、少なくとも2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000残基長、またはもっと長い残基長である。いくつかの実施形態において、核酸は、部分的または完全に一本鎖であり、いくつかの実施形態において、核酸は、部分的または完全に二本鎖である。いくつかの実施形態において、核酸は、二次構造を有する分枝鎖であってもよい。いくつかの実施形態において、核酸は、ポリペプチドをコードするか、またはポリペプチドをコードする配列の相補体である少なくとも1つの要素を含むヌクレオチド配列を有する。いくつかの実施形態において、核酸は、酵素活性を有する。いくつかの実施形態において、核酸は、例えば、リボ核酸タンパク質複合体またはトランスファーRNAにおいて、機械的な機能を果たす。
【0055】
医薬組成物または製剤:本明細書で使用される場合、「医薬組成物」という用語は、薬理学的に有効な量の活性薬物または活性薬剤と、薬学的に許容される担体とを含む。いくつかの例では、本技術の種々の態様を使用して、医薬組成物または製剤、またはその中の活性薬物または活性薬剤の遺伝毒性を評価することができる。
【0056】
ポリヌクレオチド損傷:本明細書で使用される場合、「ポリヌクレオチド損傷」または「核酸損傷」という用語は、遺伝毒性物質によって直接的または間接的に(例えば、代謝物、または損傷を引き起こすか、または変異誘発性であるプロセスの誘発)引き起こされる、被験体のデオキシリボ核酸(DNA)配列に対する損傷(「DNA損傷」)またはリボ核酸(RNA)配列に対する損傷(「RNA損傷」)を指す。損傷した核酸は、被験体における毒性物質曝露と関連する疾患または障害の発症を引き起こす場合がある。いくつかの実施形態において、被験体における損傷した核酸の検出は、遺伝毒性物質曝露の指標となり得る。ポリヌクレオチド損傷は、細胞におけるDNAの化学的および/または物理的な修飾をさらに含んでいてもよい。いくつかの実施形態において、損傷は、非限定的な例として、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ヒドロキシル化、切断、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二本鎖切断、リン酸化、脱リン酸化、SUMO化、グリコシル化、脱グリコシル化、プトレシニル化(putrescinylation)、カルボキシル化、ハロゲン化、ホルミル化、一本鎖ギャップ、熱からの損傷、乾燥からの損傷、UV曝露からの損傷、γ放射線からの損傷、X線からの損傷、電離放射線からの損傷、非電離放射線からの損傷、重粒子放射線からの損傷、核崩壊からの損傷、β放射線からの損傷、α放射線からの損傷、中性子放射線からの損傷、陽子放射線からの損傷、宇宙放射線からの損傷、高pHからの損傷、低pHからの損傷、活性酸化種からの損傷、遊離ラジカルからの損傷、過酸化物からの損傷、次亜塩素酸塩からの損傷、ホルマリンまたはホルムアルデヒドなどの組織固定からの損傷、反応性鉄からの損傷、低イオン状態からの損傷、高イオン状態からの損傷、非緩衝状態からの損傷、ヌクレアーゼからの損傷、環境曝露からの損傷、火災からの損傷、機械的応力からの損傷、酵素分解からの損傷、微生物からの損傷、調製の機械剪断からの損傷、調製の酵素断片化からの損傷、インビボで自然発生した損傷、核酸抽出中に発生した損傷、配列決定ライブラリ調製中に発生した損傷、ポリメラーゼによって導入された損傷、核酸修復中に導入された損傷、核酸末端のテーリング中に発生した損傷、核酸ライゲーション中に発生した損傷、配列決定中に発生した損傷、DNAの機械的な取り扱いから発生した損傷、ナノポアを通過中に発生した損傷、生物における老化の一部として発生した損傷、個体の化学物質曝露の結果として発生した損傷、変異原によって生じた損傷、発癌物質によって生じた損傷、染色体異常誘発物質によって発生した損傷、酸素曝露に起因するインビボでの炎症損傷から生じた損傷、1つ以上の鎖切断に起因する損傷のうちの少なくとも1つ、およびこれらの任意の組み合わせであるか、またはこれらを含む。
【0057】
参照:本明細書で使用される場合、これに対して相対的に比較が行われる標準または対照を記載する。例えば、いくつかの実施形態において、目的の薬剤、動物、個体、集合体、サンプル、配列または値を、ある場所に存在し得るか、または電子手段を介して遠隔からアクセスし得る物理的なデータベースまたはコンピュータデータベースにおける参照または対照の薬剤、動物、個体、集合体、サンプル、配列または値、またはこれらの代表と比較する。いくつかの実施形態において、参照または対照は、目的の試験もしくは決定と実質的に同時に試験され、および/または決定される。いくつかの実施形態において、参照または対照は、任意に有形の媒体で具現化されていてもよい、歴史的な参照または対照である。典型的には、当業者に理解されるように、参照または対照は、評価されるものと同等の条件もしくは状況下で決定されるか、または特徴付けられる。当業者は、特定の可能な参照もしくは対照に対する信頼および/または比較を正当化するのに十分な類似性がいつ存在するかを理解するだろう。「参照サンプル」は、試験被験体とは異なり、比較されるサンプルと同じ様式で単離され、既知の量の同じ遺伝毒性薬剤に曝露された被験体由来のサンプルを指す。参照サンプルの被験体は、試験被験体と遺伝子的に同一であってもよく、または異なっていてもよい。これに加えて、参照サンプルは、既知の量の同じ遺伝毒性薬剤に曝露された何体かの被験体に由来していてもよい。
【0058】
安全閾値レベル:本明細書で使用される場合、「安全閾値レベル」という用語は、疾患発症を引き起こす可能性のあるゲノム変異が起こる前に被験体が曝露され得る特定の遺伝毒性物質または遺伝毒性物質の組み合わせの量(例えば、重量、体積、濃度、質量、モル量、単位*時間の積分など)を指す。例えば、安全閾値レベルは、ゼロであってもよい。他の例では、遺伝毒性物質曝露のレベルは、忍容されるレベルであってもよい。許容される曝露リスクの忍容性は、被験体、年齢、性別、組織の種類、患者の健康状態、および当業者によく知られている他のリスクベネフィット考慮事項に依存して異なる場合がある。
【0059】
安全閾値変異体頻度:本明細書で使用される場合、「安全閾値変異体頻度」という用語は、遺伝毒性薬剤またはプロセスによって引き起こされる、許容される変異率を指し、この頻度を下回ると、被験体は、遺伝毒性物質に関連する疾患または障害を生じるリスクが許容範囲であると推測する。許容される曝露リスクとその結果生じる変異率の忍容性は、被験体、年齢、性別、組織の種類、患者の健康状態などに依存して異なる場合がある。
【0060】
単一分子識別子(SMI):本明細書で使用される場合、「単一分子識別子」または「SMI」という用語(特に、「タグ」、「バーコード」、「分子バーコード」、「固有分子識別子」すなわち「UMI」と呼ばれてもよい)は、より大きな異種の分子集合体の中で個々の分子を実質的に区別することが可能な任意の物質(例えば、ヌクレオチド配列、核酸分子特徴)を指す。いくつかの実施形態において、SMIは、外部から適用されるSMIであってもよく、または外部から適用されるSMIを含んでいてもよい。いくつかの実施形態において、外部から適用されるSMIは、変性または半変性した配列であってもよく、または変性または半変性した配列を含んでいてもよい。いくつかの実施形態において、実質的に変性したSMIは、ランダム固有分子識別子(R-UMI)として知られる場合もある。いくつかの実施形態において、SMIは、既知のコードのプール内からのコード(例えば、核酸配列)を含んでいてもよい。いくつかの実施形態において、所定のSMIコードは、定義された固有分子識別子(D-UMI)として知られる。いくつかの実施形態において、SMIは、内因性SMIであってもよく、または内因性SMIを含んでいてもよい。いくつかの実施形態において、内因性SMIは、標的配列の特定の剪断点、標的配列を含む個々の分子の末端に関連する特徴、または個々の分子の一端にあるか、個々の分子の一端に隣接するか、または個々の分子の一端から既知の距離内にある特定の配列に関連する情報であってもよく、またはこれらの情報を含んでいてもよい。いくつかの実施形態において、SMIは、核酸分子に対する無作為または半無作為な損傷、化学修飾、酵素による修飾、または他の修飾によって引き起こされる、核酸分子における配列変動に関連するものであってもよい。いくつかの実施形態において、上述の修飾は、メチルシトシンの脱アミノ化であってもよい。いくつかの実施形態において、上述の修飾は、核酸ニックの部位を伴っていてもよい。いくつかの実施形態において、SMIは、外因性の要素と内因性の要素の両方を含んでいてもよい。いくつかの実施形態において、SMIは、物理的に隣接するSMI要素を含んでいてもよい。いくつかの実施形態において、複数のSMI要素は、分子内で空間的に明確に区別されてもよい。いくつかの実施形態において、SMIは、非核酸であってもよい。いくつかの実施形態において、SMIは、2つ以上の異なる種類のSMI情報を含んでいてもよい。SMIの種々の実施形態は、全体が参照により本明細書に組み込まれる国際特許公開第WO2017/100441号にさらに開示される。
【0061】
鎖定義要素(SDE):本明細書で使用される場合、「鎖定義要素」または「SDE」という用語は、二本鎖核酸物質の特定の鎖の識別を可能にし、したがって、他の/相補性の鎖からの区別を可能にする任意の材料(例えば、配列決定または他の核酸インテロゲーションの後に、標的二本鎖核酸から得られる2つの一本鎖核酸それぞれの像副産物をお互いに実質的に区別可能にする任意の材料)を指す。いくつかの実施形態において、SDEは、アダプター配列中の実質的に非相補性の配列の1つ以上のセグメントであってもよく、またはこのセグメントを含んでいてもよい。特定の実施形態において、アダプター配列中の実質的に非相補性の配列のセグメントは、Y字型または「ループ」形状を含むアダプター分子によって提供されてもよい。他の実施形態において、アダプター配列中の実質的に非相補性の配列のセグメントは、アダプター配列中の隣接する相補性配列の中央に、対になっていない「バブル」を形成してもよい。他の実施形態において、SDEは、核酸修飾を包含してもよい。いくつかの実施形態において、SDEは、対になった鎖から物理的に分離した反応コンパートメントへの物理的な分離を含んでいてもよい。いくつかの実施形態において、SDEは、化学修飾を含んでもよい。いくつかの実施形態において、SDEは、修飾された核酸であってもよい。いくつかの実施形態において、SDEは、核酸分子に対する無作為または半無作為な損傷、化学修飾、酵素による修飾、または他の修飾によって引き起こされる、核酸分子における配列変動に関連するものであってもよい。いくつかの実施形態において、上述の修飾は、メチルシトシンの脱アミノ化であってもよい。いくつかの実施形態において、上述の修飾は、核酸ニックの部位を伴っていてもよい。SDEの種々の実施形態は、全体が参照により本明細書に組み込まれる国際特許公開第WO2017/100441号にさらに開示される。
【0062】
被験体:本明細書で使用される場合、「被験体」という用語は、生物、典型的には、哺乳動物、例えば、ヒト(いくつかの実施形態において、出生前のヒト形態を含む)、非ヒト動物(例えば、哺乳動物および非哺乳動物、限定されないが、非ヒト霊長類、ウマ、ヒツジ、イヌ、ウシ、ブタ、ニワトリ、両生類、爬虫類、海洋生物(一般的にシーモンキーを除く)、他のモデル生物、例えば、虫、ハエなど)、およびトランスジェニック動物(例えば、トランスジェニックげっ歯類)などを指す。いくつかの実施形態において、被験体は、遺伝毒性物質もしくは遺伝毒性因子もしくは薬剤に曝露されており、または別の実施形態において、被験体は、潜在的な遺伝毒性物質に曝露されている。いくつかの実施形態において、被験体は、関連する疾患、障害または状態に罹患している。いくつかの実施形態において、被験体は、遺伝毒性物質に関連する疾患または障害に罹患している。いくつかの実施形態において、被験体は、ある疾患、障害または状態にかかりやすい。いくつかの実施形態において、被験体は、ある疾患、障害または状態の1つ以上の症状または特徴を示す。いくつかの実施形態において、被験体は、ある疾患、障害または状態の症状または特徴を何ら示さない。いくつかの実施形態において、被験体は、ある疾患、障害もしくは状態に対するかかりやすさ、またはある疾患、障害もしくは状態のリスクに特徴的な1つ以上の特徴を有する。いくつかの実施形態において、被験体は、ある疾患、障害または状態の症状または特徴を示しているところであり、いくつかの実施形態において、このような症状または特徴は、遺伝毒性物質に関連する疾患または障害と関連する。いくつかの実施形態において、被験体は、患者である。いくつかの実施形態において、被験体は、診断および/または治療が実施されるか、および/または実施された個体である。さらに他の実施形態において、被験体は、任意の生きている生体源または他の核酸物質を指し、遺伝毒性物質に曝露されていてもよく、例えば、生物、細胞および/または組織、例えば、インビボ試験用のもの、例えば、真菌、原生動物、細菌、古細菌、ウイルス、培養物中の単離された細胞、意図的に(例えば、幹細胞移植、臓器移植)または意図的ではない(すなわち、胎児または母体のマイクロキメリズム)細胞、または単離された核酸またはオルガネラ(すなわち、ミトコンドリア、葉緑体、遊離ウイルスゲノム、遊離プラスミド、アプタマー、リボザイム、または核酸の誘導体または前駆体(すなわち、オリゴヌクレオチド、ジヌクレオチドトリリン酸など)を含んでいてもよい。
【0063】
実質的に:本明細書で使用される場合、「実質的に」という用語は、目的の特徴または性質の全体またはほぼ全体の程度または度合いを示す定性的な状態を指す。生物学の当業者は、生物学的現象および化学的現象が、完全に終了すること、および/または完全に終了することに向けて進むこと、または絶対的な結果を達成するか、または回避することは、もしあるにしてもまれであることを理解するだろう。したがって、「実質的に」という用語は、多くの生物学的現象および化学的現象に内在する潜在的に完全に終了することはないことを捕捉するために本明細書で使用される。
【0064】
治療に有効な量:本明細書で使用される場合、「治療に有効な量」または「薬理学的に有効な量」または単に「有効な量」という用語は、意図される薬理学的結果、治療結果または予防結果をもたらす活性薬物または薬剤の量を指す。いくつかの例では、本技術の種々の態様を使用し、活性薬物または薬剤(例えば、遺伝毒性に関連する事象を意図的に誘発するために送達される活性薬物)の有効な量を評価または決定することができる。
【0065】
トリヌクレオチドまたはトリヌクレオチドコンテキスト:本明細書で使用される場合、「トリヌクレオチド」または「トリヌクレオチドコンテキスト」という用語は、配列において直前および直後にあるヌクレオチド塩基のコンテキスト内のヌクレオチド(例えば、3つのモノヌクレオチドの組み合わせ中のモノヌクレオチド)を指す。
【0066】
トリヌクレオチドスペクトラムまたはシグネチャ:本明細書では、「トリヌクレオチドシグネチャ」という用語は、「トリヌクレオチドスペクトラム」、「三重シグネチャ」および「三重スペクトラム」と相互に置き換え可能に使用され、トリヌクレオチドコンテキスト内の変異シグネチャ(例えば、遺伝毒性物質曝露と関連するもの)を指す。一実施形態において、遺伝毒性物質は、固有の、半固有の、および/または別の状況で識別可能な三重スペクトラム/シグネチャを有していてもよい。
【0067】
処置:本明細書で使用される場合、「処置」という用語は、被験体に対する治療薬剤の適用または投与、または被験体から単離された組織または細胞株に対する治療薬剤の適用または投与を指し、被験体は、障害、例えば、疾患、状態、または疾患の症状、または疾患に対する素因を有し、その目的は、その疾患、疾患の症状、または疾患に対する素因を治し、治癒させ、軽減し、緩和し、変化させ、救済し、改善し、改良し、または影響を与えることである。一例では、障害または疾患/状態は、遺伝毒性疾患または障害である。別の例では、障害または疾患/状態は、遺伝毒性疾患または障害ではない。いくつかの例では、本技術の種々の態様を使用し、処置または潜在的な処置の遺伝毒性を評価する。
【0068】
二本鎖配列決定方法および関連するアダプターおよび試薬の選択された実施形態
二本鎖配列決定は、二本鎖核酸分子からエラー修正済DNA配列を生成するための方法であり、元々、国際特許公開第WO2013/142389号および米国特許第9,752,188号および第WO 2017/100441号、Schmittら、PNAS、2012[1]、Kennedyら、PLOS Genetics、2013[2]、Kennedyら、Nature Protocols、2014[3]、およびSchmittら、Nature Methods、2015[4]に記載された。上述の特許、特許出願および刊行物はそれぞれ、それらの全体が参照により本明細書に組み込まれる。
図1A~
図1Cに示されるように、本技術の特定の態様において、二本鎖配列決定を使用して、誘導体配列リードを、大規模並列配列決定(MPS)(一般的に次世代配列決定(NGS)としても知られる)中に同じ二本鎖核酸親分子に由来するものとして認識することができるだけではなく、配列決定後に区別可能なエンティティとして互いに区別されるような様式で、個々のDNA分子の両方の鎖を独立して配列決定することができる。次いで、各鎖から得られる配列リードを、二本鎖コンセンサス配列(DCS)として知られる元の二本鎖核酸分子のエラー修正済配列を得るという目的のために比較する。二本鎖配列決定のプロセスは、元の二本鎖核酸分子の両方の鎖が、DCSを形成するために使用される作成した配列決定データ中に現れることを明示的に確認することを可能にする。
【0069】
特定の実施形態において、DSを組み込む方法は、1つ以上の配列決定アダプターを、第1の鎖標的核酸配列と第2の鎖標的核酸配列とを含む標的二本鎖核酸分子にライゲーションし、二本鎖標的核酸複合体を生成することを含んでいてもよい(例えば、
図1A)。
【0070】
種々の実施形態において、得られる標的核酸複合体は、少なくとも1つのSMI配列を含んでいてもよく、外部から適用される変性または半変性した配列(例えば、
図1Aに示されるランダム化された二本鎖タグ、
図1Aではαおよびβとして識別された配列)、標的二本鎖核酸分子の特定の剪断点に関連する内因性情報、またはこれらの組み合わせを伴っていてもよい。SMIは、標的核酸分子を、単独で、またはそれらがライゲーションされた核酸フラグメントの要素を区別することと組み合わせて配列決定される集合中の複数の他の分子から実質的に区別可能にすることができる。SMI要素の実質的に区別可能な特徴は、それぞれの鎖の誘導体増幅産物が、配列決定後に同じ元の実質的に固有の二本鎖核酸分子に由来するものであると認識することができるように、二本鎖核酸分子を形成するそれぞれの一本鎖が独立して有していてもよい。他の実施形態において、SMIは、さらなる情報を含んでいてもよく、および/または上に引用した刊行物に記載されるものなど、このような分子を区別する機能が有用である他の方法で使用されてもよい。別の実施形態において、SMI要素は、アダプターライゲーションの後に組み込まれてもよい。いくつかの実施形態において、SMIは、本質的に二本鎖である。他の実施形態において、SMIは、本質的に一本鎖である(例えば、SMIは、アダプターの一本鎖部分上にあってもよい)。他の実施形態において、SMIは、本質的に一本鎖と二本鎖の組み合わせである。
【0071】
いくつかの実施形態において、各二本鎖標的核酸配列複合体は、さらに、標的二本鎖核酸分子を形成する2つの一本鎖核酸の増幅産物を、配列決定後に互いに実質的に区別可能にする要素(例えば、SDE)を含んでいてもよい。一実施形態において、SDEは、配列決定アダプター内に含まれる非対称プライマー部位を含んでいてもよく、または他の配置において、配列非対称をプライマー配列内ではなくアダプター分子内に導入してもよく、その結果、第1の鎖標的核酸配列複合体と標的核酸配列複合体の第2の鎖のヌクレオチド配列における少なくとも一部が、増幅および配列決定の後に互いに異なっている。他の実施形態において、SMIは、カノニカルヌクレオチド配列A、T、C、GまたはUとは異なるが、2つの増幅され、配列決定された分子における少なくとも1つのカノニカルヌクレオチド配列の差に変換される、2つの鎖間の別の生化学的非対称を含んでいてもよい。さらに別の実施形態において、SDEは、増幅前に2つの鎖を物理的に分離する手段であってもよく、その結果、第1の鎖標的核酸配列および第2の鎖標的核酸配列からの誘導体増幅産物は、これら2つの配列間の区別を維持する目的のために、互いに実質的に物理的に単離された状態を維持する。上述の第1の鎖と第2の鎖とを区別することを可能にするSDE機能を提供するための他のこのような配置および方法論、例えば、上に引用した刊行物に記載されるもの、または記載した機能目的を果たす他の方法を利用してもよい。
【0072】
少なくとも1つのSMIと少なくとも1つのSDEとを含む二本鎖標的核酸複合体を作成した後、またはこれらの要素の片方または両方がその後に導入される場合に、複合体は、DNA増幅(例えばPCRを用いる)またはDNA増幅の任意の他の生化学的方法(例えば、ローリングサークル増幅、複数置換増幅、等温増幅、ブリッジ増幅または表面結合増幅)が行われてもよく、その結果、第1の鎖標的核酸配列の1つ以上のコピーおよび第2の鎖標的核酸配列の1つ以上のコピーが産生される(例えば、
図1B)。次いで、第1の鎖標的核酸分子の1つ以上の増幅コピーおよび第2の標的核酸分子の1つ以上の増幅コピーに、好ましくは、「次世代の」大規模並列DNA配列決定プラットフォームを用いて、DNA配列決定を行う(例えば、
図1B)。
【0073】
元の二本鎖標的核酸分子に由来する第1の鎖標的核酸分子および第2の鎖標的核酸分子のいずれかから作られる配列リードは、共通する関連する実質的に固有のSMIに基づいて識別され、SDEによって反対の鎖標的核酸分子から区別されてもよい。いくつかの実施形態において、SMIは、数学に基づくエラー修正コード(例えば、ハミングコード)に基づく配列であってもよく、それにより、特定の増幅エラー、配列決定エラーまたはSMI合成エラーは、元の二本鎖(例えば、二本鎖核酸分子)の相補性鎖に対してSMI配列の配列を関連付ける目的のために許容される場合がある。例えば、SMIが、カノニカルDNA塩基の完全に変性した配列の15塩基対を含む二本鎖外因性SMIを含む場合、概算で4の15乗=1,073,741,824のSMIバリアントが、完全に変性したSMIの集合に存在する。2つのSMIが、10,000個のサンプリングされたSMIの集合からのSMI配列内で1個のヌクレオチドのみが異なる配列決定データのリードから回収される場合、これが偶然に発生する確率を数学的に計算することができ、この1つの塩基対の違いが、上に記載した種類のエラーの1つを反映していることが起こりそうかどうかの決定を行い、そのSMI配列が、同じ元の二本鎖分子に由来するという事実を有することを決定することができる。SMIが少なくとも部分的に外部から適用される配列であり、その配列バリアントが互いに完全に変性したものではなく、少なくとも部分的には既知の配列である、いくつかの実施形態において、その既知の配列の同一性は、いくつかの実施形態において、上述の種類の1つ以上のエラーが、ある既知のSMI配列の同一性を別のSMI配列の同一性へと変換しないような様式で設計することができ、その結果、あるSMIが別のSMIであると誤って解釈されてしまう確率は減少する。いくつかの実施形態において、このSMI設計戦略は、ハミングコード手法またはその誘導体を含む。識別されたら、第1の鎖標的核酸分子から作られる1つ以上の配列リードを、第2の鎖標的核酸分子から作られる1つ以上の配列リードと比較して、エラー修正済標的核酸分子配列を生成する(例えば、
図1C)。例えば、第1の鎖標的核酸配列と第2の鎖標的核酸配列の両方からの塩基が一致するヌクレオチド位置は、真の配列であるとみなされ、一方、この2つの鎖間で一致しないヌクレオチド位置は、技術的なエラーの可能性がある部位と認識され、この部位は、考慮に入れられないか、除外されるか、修正されるか、または別の状況で識別されてもよい。このようにして、元の二本鎖標的核酸分子のエラー修正済配列を生成することができる(
図1Cに示される)。いくつかの実施形態において、第1の鎖標的核酸分子および第2の鎖標的核酸分子から作られるそれぞれの配列決定リードを別個にグループ化した後、この第1の鎖および第2の鎖それぞれについて一本鎖コンセンサス配列を作成してもよい。次いで、第1の鎖標的核酸分子および第2の鎖標的核酸分子に由来する一本鎖コンセンサス配列を比較して、エラー修正済標的核酸分子配列を生成することができる(例えば、
図1C)。
【0074】
これに代えて、いくつかの実施形態において、この2本の鎖間の配列が一致しない部位は、元の二本鎖標的核酸分子において、生物学的に由来するミスマッチの可能性がある部位と認識することができる。これに代えて、いくつかの実施形態において、この2本の鎖間の配列が一致しない部位は、元の二本鎖標的核酸分子において、DNA合成に由来するミスマッチの可能性がある部位と認識することができる。これに代えて、いくつかの実施形態において、この2本の鎖間の配列が一致しない部位は、損傷を受けたか、または修飾されたヌクレオチド塩基が、片方または両方の鎖に存在し、酵素プロセス(例えば、DNAポリメラーゼ、DNAグリコシラーゼまたは別の核酸修飾酵素または化学プロセス)によってミスマッチに変換された可能性がある部位と認識することができる。いくつかの実施形態において、この後者の知見を使用して、酵素プロセスまたは化学処理の前の核酸損傷またはヌクレオチド修飾の存在を推測することができる。
【0075】
いくつかの実施形態において、本技術の態様に従い、本明細書に記載する二本鎖配列決定工程から作られる配列決定リードをさらにフィルタリングして、DNA損傷分子(例えば、貯蔵、運搬中に、組織または血液の抽出中または抽出後に、ライブライリー調製中または調製後に損傷したなど)からの配列決定リードを除外することができる。例えば、DNA修復酵素、例えば、ウラシル-DNAグリコシラーゼ(UDG)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)および8-オキソグアニンDNAグリコシラーゼ(OGG1)を利用して、DNA損傷(例えば、インビトロでのDNA損傷またはインビボでの損傷)を除外するか、または修正することができる。これらのDNA修復酵素は、例えば、DNAから損傷した塩基を除去するグリコシラーゼである。例えば、UDGは、(シトシンの自発的な加水分解によって生じる)シトシン脱アミノ化から生じるウラシルを除去し、FPGは、8-オキソ-グアニン(例えば、活性酸素種から生じる共通のDNA病変)を除去する。FPGは、リアーゼ活性も有し、脱塩基部位に1塩基ギャップを生成することができる。このような脱塩基部位は、例えば、ポリメラーゼがテンプレートをコピーすることができないため、一般的に、その後にPCRによって増幅することができない。したがって、このようなDNA損傷修復/除去酵素の使用は、真の変異を有していないが、配列決定および二本鎖配列分析の後に別の状況でエラーとして検出されない可能性がある損傷DNAを効果的に除去することができる。損傷した塩基に起因するエラーは、二本鎖配列決定によって多くは修正することができるが、まれに、相補性エラーが、両方の鎖上の同じ位置に起こることが理論的にあり得るため、エラーを増やす損傷を減らすことによって、アーチファクトの確率を下げることができる。さらに、ライブラリ調製中、配列決定されるDNAの特定のフラグメントは、その供給源から、または処理工程(例えば、機械的なDNA剪断)から一本鎖であってもよい。これらの領域は、典型的には、当該技術分野で知られる「末端修復」工程中に二本鎖DNAに変換され、DNAポリメラーゼおよびヌクレオシド基質は、DNAサンプルに付加され、5’陥凹末端を延長する。コピーされるDNAの一本鎖部分におけるDNA損傷の変異誘発性部位(すなわち、DNA二本鎖の片方または両方の末端にある一本鎖5’オーバーハングまたは内部の一本鎖ニックまたはギャップ)は、末端平滑化反応中にエラーを生じる場合があり、一本鎖変異、合成エラーまたは核酸損傷部位を二本鎖形態にして、最終的な二本鎖コンセンサス配列において真の変異であると誤って解釈される場合があり、真の変異が元の二本鎖核酸分子内に実際には存在しなかった場合に、存在したと誤って解釈される場合がある。この状況は、「偽の二本鎖」と呼ばれ、このような損傷を破壊/修復する酵素の使用によって減らすことができ、または防ぐことができる。他の実施形態において、この発生は、元の二本鎖分子の一本鎖部位が生成するのを破壊するか、または防ぐための戦略の使用によって減らすことができ、または除外することができる(例えば、ニックまたはギャップが残る可能性がある機械的な剪断または特定の他の酵素ではなく、元の二本鎖核酸物質をフラグメント化するために使用される特定の酵素の使用)。他の実施形態において、元の二本鎖核酸の一本鎖部分を除外するためのプロセス(例えば、S1ヌクレアーゼまたは緑豆ヌクレアーゼなどの一本鎖に特異的なヌクレアーゼ)の使用を、同様の目的のために利用することができる。
【0076】
さらなる実施形態において、本明細書に記載する二本鎖配列決定工程から作られる配列決定リードをさらにフィルタリングして、偽の二本鎖のアーチファクトに最もなりやすいリードの末端をトリミングすることによって、偽の変異を除外することができる。例えば、DNAフラグメント化は、二本鎖分子の末端に一本鎖部分を生成することができる。これらの一本鎖部分は、末端修復中に末端平滑化されてもよい(例えば、KlenowまたはT4ポリメラーゼによって)。いくつかの場合において、ポリメラーゼは、これらの末端修復した領域においてコピーの誤りを起こし、「偽の二本鎖分子」の生成を引き起こす。ライブラリ調製のこれらのアーチファクトは、配列決定されたときに真の変異であると誤って見えてしまう場合がある。これらの末端修復機構の結果としてのエラーは、より高いリスクを有する領域で生じる可能性がある変異を除外するために配列決定リードの末端をトリミングすることによって、配列決定後の分析から除外することができるか、または減らすことができ、それにより、偽の変異の数を減らすことができる。一実施形態において、配列決定リードのこのようなトリミングは、自動的に達成することができる(例えば、通常の処理工程)。別の実施形態において、変異体頻度は、フラグメント末端領域について評価することができ、変異の閾値レベルがこのフラグメント末端領域で観察される場合、DNAフラグメントの二本鎖コンセンサス配列リードを作成する前に、配列決定リードのトリミングを行ってもよい。
【0077】
具体例として、いくつかの実施形態において、本明細書では、二本鎖標的核酸物質のエラー修正済配列リードを作成する方法が提供され、本方法は、二本鎖標的核酸物質を少なくとも1つのアダプター配列にライゲーションして、アダプター-標的核酸物質複合体を形成する工程を含み、ここで、少なくとも1つのアダプター配列は、(a)二本鎖標的核酸物質のそれぞれの分子を固有に標識する変性または半変性した単一分子識別子(SMI)配列と、(b)アダプター-標的核酸物質複合体のそれぞれの鎖が、その相補性鎖に対して別個に識別可能なヌクレオチド配列を有するように、アダプター-標的核酸物質複合体の第1の鎖をタグ化する第1のヌクレオチドアダプター配列およびアダプター-標的核酸物質複合体の第2の鎖をタグ化する第1のヌクレオチド配列と少なくとも部分的に相補性の第2のヌクレオチドアダプター配列とを含む。次に、本方法は、アダプター-標的核酸物質複合体のそれぞれの鎖を増幅させ、複数の第1の鎖アダプター-標的核酸複合体アンプリコンおよび複数の第2の鎖アダプター-標的核酸複合体アンプリコンを生成する工程を含んでいてもよい。本方法は、さらに、上述の第1の鎖および第2の鎖を両方とも増幅させ、第1の核酸産物および第2の核酸産物を提供する工程を含んでいてもよい。本方法はまた、第1の核酸産物および第2の核酸産物をそれぞれ配列決定して、複数の第1の鎖配列リードおよび複数の第2の鎖配列リードを生成する工程と、少なくとも1つの第1の鎖配列リードおよび少なくとも1つの第2の鎖配列リードの存在を確認する工程とを含んでいてもよい。本方法は、さらに、少なくとも1つの第1の鎖配列リードと少なくとも1つの第2の鎖配列リードとを比較することと、一致しないヌクレオチド位置を考慮に入れないことによって、二本鎖標的核酸物質のエラー修正済配列リードを作成すること、またはこれに代えて、比較した第1の鎖配列リードと第2の鎖配列リードが非相補性である1つ以上のヌクレオチド位置を有する、比較した第1の鎖配列リードと第2の鎖配列リードを除去することとを含んでいてもよい。
【0078】
さらなる具体例として、いくつかの実施形態において、本明細書では、サンプルからDNAバリアントを識別する方法が提供され、本方法は、核酸物質(例えば、二本鎖標的DNA分子)の両方の鎖を、少なくとも1つの非対称アダプター分子にライゲーションして、二本鎖標的DNA分子の第1の鎖(例えば、上鎖)に関連付けられた第1のヌクレオチド配列と、二本鎖標的DNA分子の第2の鎖(例えば、下鎖)と関連付けられた第1のヌクレオチドに少なくとも部分的に非相補性の第2のヌクレオチド配列とを有するアダプター-標的核酸物質複合体を形成する工程と、アダプター-標的核酸物質のそれぞれの鎖を増幅させる工程とを含み、それぞれの鎖において、増幅したアダプター-標的核酸産物の別個のまだ関連するセットを生成する。本方法は、さらに、複数の第1の鎖アダプター-標的核酸産物および複数の第2の鎖アダプター-標的核酸産物それぞれを配列決定する工程と、アダプター-標的核酸物質複合体のそれぞれの鎖から少なくとも1つの増幅した配列リードの存在を確認する工程と、第1の鎖から得られた少なくとも1つの増幅した配列リードと、第2の鎖から得られた少なくとも1つの増幅した配列リードとを比較して、核酸物質(例えば、二本鎖標的DNA分子)の両方の鎖の配列が一致しているヌクレオチド塩基のみを有する核酸物質(例えば、二本鎖標的DNA分子)のコンセンサス配列リードを形成する工程とを含んでいてもよく、その結果、コンセンサス配列リード中の特定の位置で生じるバリアント(例えば、参照配列と比較して)が、真のDNAバリアントとして識別される。
【0079】
いくつかの実施形態において、本明細書では、二本鎖核酸物質から高度に正確なコンセンサス配列を作成する方法が提供され、本方法は、個々の二本鎖DNA分子をアダプター分子でタグ化して、タグ化DNA物質を形成する工程であって、ここで、各アダプター分子は、(a)二本鎖DNA分子を固有に標識する変性または半変性した単一分子識別子(SMI)と、(b)それぞれのタグ化DNA分子について、タグ化DNA物質内のそれぞれの個々のDNA分子の元の下鎖から、元の上鎖を区別する第1および第2の非相補性ヌクレオチドアダプター配列とを含む、工程と、タグ化DNA分子の元の上鎖の重複のセットとタグ化DNA分子の元の下鎖の重複のセットとを作成し、増幅したDNA物質を形成する工程とを含む。本方法は、さらに、元の上鎖の重複からの第1の一本鎖コンセンサス配列(SSCS)および元の下鎖の重複からの第2の一本鎖コンセンサス配列(SSCS)を作成する工程と、元の上鎖の第1のSSCSと、元の下鎖の第2のSSCSとを比較する工程と、元の上鎖の第1のSSCSおよび元の下鎖の第2のSSCSの両方の配列が相補性であるヌクレオチド塩基のみを有する高度に正確なコンセンサス配列を作成する工程とを含んでいてもよい。
【0080】
さらなる実施形態において、本明細書では二本鎖標的DNA分子を含むサンプルからDNA損傷を検出および/または定量化する方法が提供され、本方法は、各二本鎖標的DNA分子の両方の鎖を少なくとも1つの非対称アダプター分子にライゲーションして、複数のアダプター-標的DNA複合体を形成する工程であって、ここで、各アダプター-標的DNA複合体は、二本鎖標的DNA分子の第1の鎖と関連付けられた第1のヌクレオチド配列と、二本鎖標的DNA分子の第2の鎖と関連付けられた第1のヌクレオチドに少なくとも部分的に非相補性の第2のヌクレオチド配列とを有する、工程と、それぞれのアダプター標的DNA複合体について、アダプター標的DNA複合体のそれぞれの鎖を増幅させる工程とを含み、それぞれの鎖において、増幅したアダプター標的DNAアンプリコンの別個のまだ関連するセットを生成する。本方法は、さらに、複数の第1の鎖アダプター-標的DNAアンプリコンおよび複数の第2の鎖アダプター-標的DNAアンプリコンをそれぞれ配列決定する工程と、アダプター-標的DNA複合体のそれぞれの鎖から少なくとも1つの配列リードの存在を確認する工程と、第1の鎖から得られた少なくとも1つの配列リードと、第2の鎖から得られた少なくとも1つの配列リードとを比較して、二本鎖DNA分子の1つの鎖の配列リードが、二本鎖DNA分子の他の鎖の配列リードと一致していない(例えば、非相補性の)ヌクレオチド塩基を検出および/または定量化する工程とを含んでいてもよく、その結果、DNA損傷の部位を検出および/または定量化することができる。いくつかの実施形態において、本方法は、さらに、第1の鎖アダプター-標的DNAアンプリンコンからの第1の一本鎖コンセンサス配列(SSCS)および第2の鎖アダプター-標的DNAアンプリンコンからの第2の一本鎖コンセンサス配列(SSCS)を作成する工程と、元の第1の鎖の第1のSSCSと、元の第2の鎖の第2のSSCSとを比較する工程と、第1のSSCSの配列と第2のSSCSの配列が非相補性であるヌクレオチド塩基を識別して、サンプル中の二本鎖標的DNA分子と関連付けられたDNA損傷を検出および/または定量化する工程とを含んでいてもよい。
【0081】
単一分子識別子配列(SMI)
種々の実施形態に従い、提供される方法および組成物は、核酸物質のそれぞれの鎖上に1つ以上のSMI配列を含む。SMIは、それぞれの鎖の誘導体増幅産物が、配列決定後に同じ元の実質的に固有の二本鎖核酸分子に由来するものであると認識することができるように、二本鎖核酸分子から得られるそれぞれの一本鎖が独立して有していてもよい。いくつかの実施形態において、SMIは、さらなる情報を含んでいてもよく、および/または当業者が認識するように、このような分子を区別する機能が有用である他の方法で使用されてもよい。いくつかの実施形態において、SMI要素は、核酸物質にアダプター配列をライゲーションする前、実質的に同時、または後に組み込まれてもよい。
【0082】
いくつかの実施形態において、SMI配列は、少なくとも1つの変性または半変性した核酸を含んでいてもよい。他の実施形態において、SMI配列は、変性していなくてもよい。いくつかの実施形態において、SMIは、核酸分子のフラグメント末端(例えば、ライゲーションされた核酸物質の無作為に、または半無作為に剪断された末端)またはフラグメント末端付近と関連付けられた配列であってもよい。いくつかの実施形態において、外因性配列は、例えば、単一のDNA分子を互いに区別することが可能なSMI配列を得るために、ライゲーションされた核酸物質(例えば、DNA)の無作為に、または半無作為に剪断された末端に対応する配列と組み合わせて考えられてもよい。いくつかの実施形態において、SMI配列は、二本鎖核酸分子にライゲーションされるアダプター配列の一部である。特定の実施形態において、SMI配列を含むアダプター配列は、二本鎖核酸分子の各鎖が、アダプター配列にライゲーションした後にSMIを含むような、二本鎖である。別の実施形態において、SMI配列は、二本鎖核酸分子にライゲーションする前または後に一本鎖であり、相補性SMI配列は、その反対の鎖をDNAポリメラーゼで延長し、相補性二本鎖SMI配列を得ることによって作成されてもよい。他の実施形態において、SMI配列は、アダプターの一本鎖部分(例えば、Y字型を有するアダプターのアーム)にある。このような実施形態において、SMIは、二本鎖核酸分子の元の鎖に由来する配列リードのファミリーのグループ化を容易にしてもよく、いくつかの場合において、二本鎖核酸分子の元の第1の鎖と第2の鎖との間の関係を付与することができる(例えば、SMIの全てまたは一部が、ルックアップテーブルによって関連付けることが可能であってもよい)。複数の実施形態において、第1の鎖および第2の鎖が異なるSMIで標識される場合、2つの元の鎖からの配列リードは、1つ以上の内因性SMI(例えば、核酸分子のフラグメント末端またはフラグメント末端付近と関連付けられる配列などのフラグメントに特有の特徴)を用いて関連付けられてもよく、またはこの2つの元の鎖によって共有されるさらなる分子タグ(例えば、アダプターの二本鎖部分中のバーコード)の使用によって関連付けられてもよく、またはこれらの組み合わせであってもよい。いくつかの実施形態において、各SMI配列は、約1~約30核酸(例えば、1、2、3、4、5、8、10、12、14、16、18、20、またはもっと多くの変性または半変性した核酸)を含んでいてもよい。
【0083】
いくつかの実施形態において、SMIは、核酸物質およびアダプター配列の片方または両方にライゲーション可能である。いくつかの実施形態において、SMIは、核酸物質のT-オーバーハング、A-オーバーハング、CG-オーバーハング、脱ヒドロキシル化塩基および平滑末端のうちの少なくとも1つにライゲーションされてもよい。
【0084】
いくつかの実施形態において、SMIの配列は、単一の核酸分子を互いに区別することが可能なSMI配列を得るために、例えば、核酸物質(例えば、ライゲーションされた核酸物質)の無作為に、または半無作為に剪断された末端に対応する配列と組み合わせて考えられ(またはこれと組み合わせて設計され)てもよい。
【0085】
いくつかの実施形態において、少なくとも1つのSMIは、例えば、剪断点自体を用いて、または剪断点に対してすぐ横に隣接した核酸物質中の所定の数のヌクレオチド[例えば、剪断点から2、3、4、5、6、7、8、9、10ヌクレオチド]を用いて、内因性SMI(例えば、剪断点(例えば、フラグメント末端)に関連するSMI)であってもよい。いくつかの実施形態において、少なくとも1つのSMIは、外因性SMI(例えば、標的核酸物質にはみられない配列を含むSMI)であってもよい。
【0086】
いくつかの実施形態において、SMIは、画像化部分(例えば、蛍光または別の状況で光学的に検出可能な部分)であってもよく、または画像化部分を含んでいてもよい。いくつかの実施形態において、このようなSMIは、増幅工程を必要とすることなく、検出および/または定量化を可能にする。
【0087】
いくつかの実施形態において、SMI要素は、アダプター-標的核酸複合体上の異なる位置に配置される2つ以上の別個のSMI要素を含んでいてもよい。
【0088】
SMIの種々の実施形態は、全体が参照により本明細書に組み込まれる国際特許公開第WO2017/100441号にさらに開示される。
【0089】
鎖定義要素(SDE)
いくつかの実施形態において、二本鎖核酸物質の各鎖は、さらに、標的二本鎖核酸物質を形成する2つの一本鎖核酸の増幅産物を、配列決定後に互いに実質的に区別可能にする要素を含んでいてもよい。いくつかの実施形態において、SDEは、配列決定アダプター内に含まれる非対称プライマー部位であってもよく、またはこの部位を含んでいてもよく、または他の配置において、配列非対称をプライマー配列内ではなくアダプター配列内に導入してもよく、その結果、第1の鎖標的核酸配列複合体と標的核酸配列複合体の第2の鎖のヌクレオチド配列における少なくとも一部が、増幅および配列決定の後に互いに異なっている。他の実施形態において、SDEは、カノニカルヌクレオチド配列A、T、C、GまたはUとは異なるが、2つの増幅され、配列決定された分子における少なくとも1つのカノニカルヌクレオチド配列の差に変換される、2つの鎖間の別の生化学的非対称を含んでいてもよい。さらに別の実施形態において、SDEは、増幅前に2つの鎖を物理的に分離する手段であってもよく、またはこの手段を含んでいてもよく、その結果、第1の鎖標的核酸配列および第2の鎖標的核酸配列からの誘導体増幅産物は、これら2つの誘導体増幅産物間の区別を維持する目的のために、互いに実質的に物理的に単離された状態を維持する。第1の鎖と第2の鎖を区別することを可能にするSDE機能を提供するための他のこのような配置または方法論が利用されてもよい。
【0090】
いくつかの実施形態において、SDEは、ループ(例えば、ヘアピンループ)を形成することが可能であってもよい。いくつかの実施形態において、ループは、少なくとも1つのエンドヌクレアーゼ認識部位を含んでいてもよい。いくつかの実施形態において、標的核酸複合体は、ループ内の切断事象を容易にするエンドヌクレアーゼ認識部位を含有していてもよい。いくつかの実施形態において、ループは、非カノニカルヌクレオチド配列を含んでいてもよい。いくつかの実施形態において、含有される非カノニカルヌクレオチド配列は、鎖開裂を容易にする1つ以上の酵素によって認識可能であってもよい。いくつかの実施形態において、含有される非カノニカルヌクレオチド配列は、ループ中の鎖開裂を容易にする1つ以上の化学プロセスによって標的とされてもよい。いくつかの実施形態において、ループは、ループ中の鎖開裂を容易にする1つ以上の酵素プロセス、化学プロセスまたは物理プロセスによって標的とされ得る、修飾された核酸リンカーを含有していてもよい。いくつかの実施形態において、この修飾されたリンカーは、光開裂可能なリンカーである。
【0091】
種々の他の分子ツールが、SMIおよびSDEとして機能し得る。剪断点およびDNAに基づくタグ以外に、対になった鎖を物理的に近接した状態に維持する単分子コンパートメント化方法、または他の非核酸タグ化方法は、鎖に関連する機能を果たし得る。同様に、アダプター鎖を物理的に分離し得る様式でのアダプター鎖の非対称化学標識は、SDEの役割を果たすことができる。近年記載された二本鎖配列決定の変形例は、重亜硫酸塩変換を使用して、シトシンメチル化の形態で天然に存在する鎖非対称を、2つの鎖を区別する配列の違いへと変換する。この実施態様は、検出され得る変異の種類に制限があるが、天然の非対称を利用するこの概念は、修飾ヌクレオチドを直接的に検出することができる配列決定技術を出現させるという観点で注目すべきものである。SDEの種々の実施形態は、全体が参照により本明細書に組み込まれる国際特許公開第WO2017/100441号にさらに開示される。
【0092】
アダプターおよびアダプター配列
種々の配置において、SMI(例えば、分子バーコード)、SDE、プライマー部位、フローセル配列および/または他の特徴を含むアダプター分子は、本明細書に開示する実施形態の多くと共に使用することが想定される。いくつかの実施形態において、提供されるアダプターは、(1)高い標的特異性、(2)多重化することが可能であること、(3)安定した最小限のバイアスを有する増幅を示すという性質のうちの少なくとも1つを有するPCRプライマー(例えば、プライマー部位)に対して相補性または少なくとも部分的に相補性の1つ以上の配列であってもよく、またはこの配列を含んでいてもよい。
【0093】
いくつかの実施形態において、アダプター分子は、「Y」字型、「U」字型、「ヘアピン」形状であってもよく、バブル(例えば、相補性ではない配列の一部)を有していてもよく、または他の特徴を有していてもよい。他の実施形態において、アダプター分子は、「Y」字型、「U」字型、「ヘアピン」形状、またはバブルを含んでいてもよい。特定のアダプターは、修飾ヌクレオチドまたは標準的ではないヌクレオチド、制限部位、またはインビトロで構造または機能を操作するための他の特徴を含んでいてもよい。アダプター分子は、末端を有する種々の核酸物質にライゲーションしてもよい。例えば、アダプター分子は、核酸物質のT-オーバーハング、A-オーバーハング、CG-オーバーハング、複数ヌクレオチドオーバーハング、脱ヒドロキシル化塩基、平滑末端にライゲーションするのに適したものであってもよく、分子の末端は、標的の5’が脱リン酸化されているか、または別の状況で従来のライゲーションから遮断されていた。他の実施形態において、アダプター分子は、ライゲーション部位の5’鎖に脱リン酸化または別のライゲーションを防ぐ修飾を含んでいてもよい。後者の2つの実施形態において、このような戦略は、ライブラリーフラグメントまたはアダプター分子の二量体化を防ぐのに有用な場合がある。
【0094】
アダプター配列は、一本鎖配列、二本鎖配列、相補性配列、非相補性配列、部分的に相補性の配列、非対称配列、プライマーに結合する配列、フローセル配列、ライゲーション配列またはアダプター分子によって提供される他の配列を意味していてもよい。特定の実施形態において、アダプター配列は、オリゴヌクレオチドに対する相補性によって増幅するために使用される配列を意味していてもよい。
【0095】
いくつかの実施形態において、提供される方法および組成物は、少なくとも1つのアダプター配列(例えば、2つのアダプター配列であり、核酸物質の5’末端および3’末端のそれぞれに1つ)を含む。いくつかの実施形態において、提供される方法および組成物は、2個以上のアダプター配列(例えば、3、4、5、6、7、8、9、10個、またはもっと多く)を含んでいてもよい。いくつかの実施形態において、アダプター配列の少なくとも2つは、互いに(例えば、配列によって)異なる。いくつかの実施形態において、各アダプター配列は、アダプター配列が互いに(例えば、配列によって)異なる。いくつかの実施形態において、少なくとも1つのアダプター配列は、少なくとも1つの他のアダプター配列の少なくとも一部に対して少なくとも部分的に相補性ではない(例えば、少なくとも1つのヌクレオチドによって相補性ではない)。
【0096】
いくつかの実施形態において、アダプター配列は、少なくとも1つの標準的ではないヌクレオチドを含む。いくつかの実施形態において、標準的ではないヌクレオチドは、脱塩基部位、ウラシル、テトラヒドロフラン、8-オキソ-7,8-ジヒドロ-2’デオキシアデノシン(8-オキソ-A)、8-オキソ-7,8-ジヒドロ-2’-デオキシグアノシン(8-オキソ-G)、デオキシイノシン、5’ニトロインドール、5-ヒドロキシメチル-2’-デオキシシチジン、イソ-シトシン、5’-メチル-イソシトシン、またはイソグアノシン、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、光開裂可能なリンカー、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチド、イソ-dC、イソdG、2’-O-メチルヌクレオチド、イノシンヌクレオチドロックド核酸、ペプチド核酸、5メチルdC、5-ブロモデオキシウリジン、2,6-ジアミノプリン、2-アミノプリンヌクレオチド、脱塩基ヌクレオチド、5-ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、I-リンカー、5’ヘキシニル修飾ヌクレオチド、5-オクタジイニルdU、光開裂可能なスペーサー、光開裂可能ではないスペーサー、クリックケミストリーに適合性の修飾ヌクレオチド、およびこれらの任意の組み合わせから選択される。
【0097】
いくつかの実施形態において、アダプター配列は、磁気特性(すなわち、磁気部分)を有する部分を含む。いくつかの実施形態において、この磁気特性は、常磁性である。アダプター配列が磁気部分を含む(例えば、磁気部分を含むアダプター配列にライゲーションする核酸物質)いくつかの実施形態において、磁場が適用される場合、磁気部分を含むアダプター配列は、磁気部分を含まないアダプター配列(例えば、磁気部分を含まないアダプター配列にライゲーションする核酸物質)から実質的に分離される。
【0098】
いくつかの実施形態において、少なくとも1つのアダプター配列は、SMIに対して5’に位置する。いくつかの実施形態において、少なくとも1つのアダプター配列は、SMIに対して3’に位置する。
【0099】
いくつかの実施形態において、アダプター配列は、1つ以上のリンカードメインを介して、SMIおよび核酸物質のうちの少なくとも1つに接続してもよい。いくつかの実施形態において、リンカードメインは、ヌクレオチドで構成されていてもよい。いくつかの実施形態において、リンカードメインは、少なくとも1つの修飾ヌクレオチドまたは非ヌクレオチド分子(例えば、本開示の他の箇所に記載されるもの)を含んでいてもよい。いくつかの実施形態において、リンカードメインは、ループであってもよく、またはループを含んでいてもよい。
【0100】
いくつかの実施形態において、二本鎖核酸物質のそれぞれの鎖の片方または両方の末端上のアダプター配列は、さらに、SDEを提供する1つ以上の要素を含んでいてもよい。いくつかの実施形態において、SDEは、アダプター配列内に含まれる非対称プライマー部位であってもよく、またはこの部位を含んでいてもよい。
【0101】
いくつかの実施形態において、アダプター配列は、少なくとも1つのSDEと少なくとも1つのライゲーションドメイン(すなわち、少なくとも1つのリガーゼの活性に修正可能なドメイン、例えば、リガーゼの活性によって核酸物質にライゲーションすることに適したドメイン)であってもよく、またはこれらを含んでいてもよい。いくつかの実施形態において、5’から3’まで、アダプター配列は、プライマー結合部位、SDEおよびライゲーションドメインであってもよく、またはこれらを含んでいてもよい。
【0102】
二本鎖配列決定アダプターを合成するための種々の方法は、例えば、米国特許第9,752,188号、国際特許公開第WO2017/100441号および国際特許出願第PCT/US18/59908号(2018年11月8日に出願された)に既に記載されており、これらは全て、それらの全体が参照により本明細書に組み込まれる。
【0103】
プライマー
いくつかの実施形態において、(1)高い標的特異性、(2)多重化可能であること、(3)安定した最小限のバイアスを有する増幅を示すという特性のうちの少なくとも1つを有する1つ以上のプライマーは、本技術の態様に従う種々の実施形態に使用することが想定されている。多くの従来の試験および商業製品は、従来のPCR-CEについての特定のこれらの基準を満たすプライマー混合物を設計している。しかし、これらのプライマー混合物は、MPSと共に使用するのに常に適しているというわけではないことを注記しておく。実際に、高度に多重化されたプライマー混合物を開発することは、挑戦的なことであり、時間がかかるプロセスである場合がある。簡便には、IlluminaおよびPromegaの両者は、種々の標準的および標準的ではないSTRおよびSNP遺伝子座の安定した効率的な増幅を示すIlluminaプラットフォームのための多重互換性プライマー混合物を近年開発した。これらのキットは、PCRを使用して、配列決定前にその標的領域を増幅するため、ペアエンド配列決定データにおける各リードの5’末端は、DNAを増幅するために使用されるPCRプライマーの5’末端に対応する。いくつかの実施形態において、提供される方法および組成物は、均一な増幅を確実にするように設計されたプライマーを含み、これは、種々の反応濃度、溶融温度、および二次構造とプライマー内/プライマー間の相互作用を最小限にすることを伴っていてもよい。多くの技術が、MPSアプリケーションのための高度に多重化されたプライマーの最適化のために記載されてきた。特に、これらの技術は、当該技術分野で十分に記載されているように、多くはampliseq方法として知られている。
【0104】
増幅
提供される方法および組成物は、種々の実施形態において、核酸物質(またはその一部、例えば、特定の標的領域または遺伝子座)を増幅し、増幅した核酸物質(例えば、アンプリコン産物のいくつかのメンバー)を形成する少なくとも1つの増幅工程を利用するか、またはその少なくとも1つの増幅工程において使用される。
【0105】
いくつかの実施形態において、核酸物質を増幅することは、SMI配列が少なくとも部分的に維持されるように、第1のアダプター配列中に存在する配列に少なくとも部分的に相補性の少なくとも1つの一本鎖オリゴヌクレオチドを用い、元の二本鎖核酸物質からの第1の核酸鎖および第2の核酸鎖のそれぞれに由来する核酸物質を増幅する工程を含む。増幅工程は、さらに、第2の一本鎖オリゴヌクレオチドを使用し、目的のそれぞれの鎖を増幅することを含み、このような第2の一本鎖オリゴヌクレオチドは、(a)目的の標的配列に少なくとも部分的に相補性であってもよく、または(b)少なくとも1つの一本鎖オリゴヌクレオチドと第2の一本鎖オリゴヌクレオチドが、核酸物質を効果的に増幅するような様式で配向するように、第2のアダプター配列中に存在する配列に少なくとも部分的に相補性であってもよい。
【0106】
いくつかの実施形態において、サンプル中の核酸物質を増幅することは、「チューブ」(例えば、PCRチューブ)内で、乳化液滴、マイクロチャンバ、および上に記載の他の例または他の既知の容器内で核酸物質を増幅することを含んでいてもよい。
【0107】
いくつかの実施形態において、少なくとも1つの増幅する工程は、少なくとも1つの標準的ではないヌクレオチドである少なくとも1つのプライマー、または少なくとも1つの標準的ではないヌクレオチドを含む少なくとも1つのプライマーを含む。いくつかの実施形態において、標準的ではないヌクレオチドは、ウラシル、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、ビオチン化ヌクレオチド、ロックド核酸、ペプチド核酸、高Tm核酸バリアント、対立遺伝子を区別する核酸バリアント、本明細書の他の箇所に記載される任意の他のヌクレオチドまたはリンカーバリアント、またはこれらの任意の組み合わせから選択される。
【0108】
任意の用途に適した増幅反応が、いくつかの実施形態に適合することが想定されるが、具体例として、いくつかの実施形態において、増幅工程は、ポリメラーゼ連鎖反応(PCR)、ローリングサークル増幅(RCA)、複数置換増幅(MDA)、等温増幅、乳化液内のポロニー増幅、表面でのブリッジ増幅、ビーズの表面もしくはヒドロゲル内の表面、およびこれらの任意の組み合わせであってもよく、またはこれらを含んでいてもよい。
【0109】
いくつかの実施形態において、核酸物質を増幅することは、核酸物質のそれぞれの鎖の5’末端および3’末端上のアダプター配列の領域に少なくとも部分的に相補性の一本鎖ヌクレオチドの使用を含む。いくつかの実施形態において、核酸物質を増幅することは、目的の標的領域または標的配列(例えば、ゲノム配列、ミトコンドリア配列、プラスミド配列、合成的に作られた標的核酸など)に少なくとも部分的に相補性の少なくとも1つの一本鎖オリゴヌクレオチドと、アダプター配列のある領域(例えば、プライマー部位)に少なくとも部分的に相補性の一本鎖オリゴヌクレオチドとの使用を含む。
【0110】
一般に、安定した増幅(例えば、PCR増幅)は、反応条件に大きく依存し得る。マルチプレックスPCRは、例えば、緩衝液の組成、一価または二価カチオンの濃度、洗剤濃度、クラウディング剤(すなわち、PEG、グリセロールなど)の濃度、プライマー濃度、プライマーTm、プライマー設計、プライマーGC含有量、プライマー修飾ヌクレオチド特性およびサイクリング条件(すなわち、温度および伸長時間、ならびに温度変化速度)に対して感受性な場合がある。緩衝液の条件の最適化は、困難かつ時間がかかるプロセスである場合がある。いくつかの実施形態において、増幅反応は、既に知られている増幅プロトコルに従って、緩衝液、プライマープール濃度およびPCR条件のうちの少なくとも1つを使用してもよい。いくつかの実施形態において、新しい増幅プロトコルが作成されてもよく、および/または増幅反応の最適化が使用されてもよい。具体例として、いくつかの実施形態において、PCR最適化キット、例えば、Promega(登録商標)からのPCR最適化キットを使用してもよく、このキットは、種々のPCR増幅(例えば、マルチプレックス、リアルタイム、GCリッチおよび阻害剤耐性増幅)に部分的に最適化される、多くのあらかじめ配合された緩衝液を含む。これらのあらかじめ配合された緩衝液は、様々なMg2+濃度およびプライマー濃度およびプライマープール比で迅速に補充することができる。これに加え、いくつかの実施形態において、種々のサイクリング条件(例えば、熱的サイクリング)が評価および/または使用されてもよい。特定の実施形態が、特定の望ましい用途に適しているかどうかを評価する際に、他の態様の中で特に、特異性、ヘテロ接合性遺伝子座に対する対立遺伝子カバレッジ比、遺伝子座間のバランスおよび深さのうちの1つ以上を評価してもよい。増幅成功の測定は、産物のDNA配列決定、ゲルまたはキャピラリー電気泳動またはHPLCまたは他のサイズ分離方法の後に行うフラグメントの視覚化による産物の評価、二本鎖核酸に結合する染料または蛍光プローブを使用する溶解曲線分析、質量分析法または当該技術分野で知られている他の方法を含んでいてもよい。
【0111】
種々の実施形態に従って、種々の因子のいずれかが、特定の増幅工程の長さ(例えば、PCR反応中のサイクル数など)に影響を与えることがある。例えば、いくつかの実施形態において、提供される核酸物質は、損なわれるか、または別の状況で最適ではないものになる場合がある(例えば、分解および/または汚染される)。このような場合、より長い増幅工程は、所望な産物が許容され得る程度に増幅されることを確実にするのに役立つ場合がある。いくつかの実施形態において、増幅工程は、それぞれの開始時のDNA分子から平均で3~10の配列決定されたPCRを提供し得るが、他の実施形態において、第1の鎖および第2の鎖それぞれについてたった1つのコピーだけが必要である。特定の理論に縛られることを望まないが、多すぎるPCRコピーまたは少なすぎるPCRコピーは、アッセイ効率を低下させ、最終的には深さが低下する可能性がある。一般に、増幅(例えば、PCR)反応に使用される核酸(例えば、DNA)フラグメントの数は、同じSMI/バーコード配列を共有するリードの数を規定することができる、最初に調節し得る変数である。
【0112】
核酸物質
種類
種々の実施形態に従い、種々の核酸物質のうちいずれかを使用してもよい。いくつかの実施形態において、核酸物質は、カノニカル糖-リン酸骨格内のポリヌクレオチドに対する少なくとも1つの修飾を含んでいてもよい。いくつかの実施形態において、核酸物質は、核酸物質内の任意の塩基中に少なくとも1つの修飾を含んでいてもよい。例えば、非限定的な例として、いくつかの実施形態において、核酸物質は、二本鎖DNA、一本鎖DNA、二本鎖RNA、一本鎖RNA、ペプチド核酸(PNA)、ロックド核酸(LNA)のうちの少なくとも1つであるか、またはこれらを含む。
【0113】
修飾
種々の実施形態に従い、核酸物質は、特定の提供される方法または組成物が使用される用途に応じて、任意の特定の工程の前、実質的に同時に、またはその後に、1つ以上の修飾を受けてもよい。
【0114】
いくつかの実施形態において、修飾は、核酸物質の少なくとも一部の修復であってもよく、または核酸物質の少なくとも一部の修復を含んでいてもよい。核酸修復の任意の用途に適した方法が、いくつかの実施形態に適合することが想定されるが、そのため、特定の例示的な方法および組成物を以下に記載し、実施例に記載する。
【0115】
非限定的な例として、いくつかの実施形態において、DNA修復酵素、例えば、ウラシル-DNAグリコシラーゼ(UDG)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)および8-オキソグアニンDNAグリコシラーゼ(OGG1)を利用して、DNA損傷(例えば、インビトロでのDNA損傷)を修正することができる。上述のように、これらのDNA修復酵素は、例えば、DNAから損傷した塩基を除去するグリコシラーゼである。例えば、UDGは、(シトシンの自発的な加水分解によって生じる)シトシン脱アミノ化から生じるウラシルを除去し、FPGは、8-オキソ-グアニン(例えば、活性酸素種から生じる共通のDNA病変)を除去する。FPGは、リアーゼ活性も有し、脱塩基部位に1塩基ギャップを生成することができる。このような脱塩基部位は、例えば、ポリメラーゼがテンプレートをコピーすることができないため、その後にPCRによって増幅することができない。したがって、このようなDNA損傷修復酵素の使用は、真の変異を有していないが、配列決定および二本鎖配列分析の後に別の状況でエラーとして検出されない可能性がある損傷DNAを効果的に除去することができる。
【0116】
上述のように、さらなる実施形態において、本明細書に記載する処理工程から作られる配列決定リードをさらにフィルタリングして、アーチファクトに最もなりやすいリードの末端をトリミングすることによって、偽の変異を除外することができる。例えば、DNAフラグメント化は、二本鎖分子の末端に一本鎖部分を生成することができる。これらの一本鎖部分は、末端修復中に末端平滑化されてもよい(例えばKlenowによって)。いくつかの場合において、ポリメラーゼは、これらの末端修復した領域においてコピーの誤りを起こし、「偽の二本鎖分子」の生成を引き起こす。これらのアーチファクトは、配列決定されたときに真の変異であると見えてしまう場合がある。これらの末端修復機構の結果としてのエラーは、生じる可能性がある変異を除外するために配列決定リードの末端をトリミングすることによって、配列決定後の分析から除外することができ、それにより、偽の変異の数を減らすことができる。いくつかの実施形態において、配列決定リードのこのようなトリミングは、自動的に達成することができる(例えば、通常の処理工程)。いくつかの実施形態において、変異体頻度は、フラグメント末端領域について評価することができ、変異の閾値レベルがこのフラグメント末端領域で観察される場合、DNAフラグメントの二本鎖コンセンサス配列リードを作成する前に、配列決定リードのトリミングを行ってもよい。
【0117】
二本鎖配列決定の鎖比較技術によって提供される高度なエラー修正は、標準的な次世代配列決定方法と比較して、二本鎖核酸分子の配列決定エラーを数桁程度減少させる。このエラーの減少は、ほぼ全ての種類の配列において、配列決定の精度を向上させるが、特にエラーが起こりやすいことが当該技術分野でよく知られている生化学的に厳しい配列にとって特に十分に適している場合がある。このような種類の配列の非限定的な一例は、ホモポリマーまたは他のマイクロサテライト/ショートタンデムリピートである。二本鎖配列決定のエラー修正から利益を得るエラーが起こりやすい配列の別の非限定的な例は、例えば、加熱、放射線、機械的応力、または1つ以上のヌクレオチドポリメラーゼによってコピーする間にエラーが起こりやすい化学付加物を生成し、また分子の末端として、またはニックおよびギャップとして一本鎖DNAを生成する種々の化学曝露によって損傷を受けた分子である。さらなる実施形態において、二本鎖配列決定は、二本鎖核酸分子の集合体の中で少数の配列バリアントの正確な検出にも使用することができる。本出願の非限定的な一例は、被験体内の癌ではない組織からの多数の変異していない分子の中で、癌に由来する少数のDNA分子の検出である。二本鎖配列決定による稀少なバリアント検出のための別の非限定的な用途は、遺伝毒性物質曝露から生じるDNA損傷の早期検出である。二本鎖配列決定のさらなる非限定的な用途は、ドライバー変異と共に出現している遺伝子クローンに注目することによって、遺伝毒性または非遺伝毒性の発癌物質から生成する変異の検出のための用途である。少数配列バリアントの正確な検出のためのなおさらなる非限定的な用途は、遺伝毒性物質と関連する変異誘発性シグネチャを作成することである。
【0118】
遺伝毒性の識別と評価
本技術は、遺伝毒性を評価するための方法、システム、キットなどを対象とする。特に、本技術のいくつかの実施形態は、ある生体源における化合物(例えば、化学化合物)または他の薬剤の遺伝毒性の可能性を評価するために二本鎖配列決定を利用することを対象とする。例えば、本技術の種々の実施形態は、クローン選択を必要とすることなく、任意の生物の任意のゲノムコンテキストにおける薬剤誘発性変異の直接的な測定を可能にする二本鎖配列決定方法を行うことを含む。本技術のさらなる例は、二本鎖配列決定を用い、インビボゲノム変異導入を検出し、評価するための方法を対象とする。本技術の種々の態様は、前臨床および臨床での薬物安全性試験だけではなく、他の産業全体との関わりにおいて、多くの用途を有する。例えば、本技術は、数年後に疾患/障害の発症を引き起こす超低頻度の変異を検出するための方法を含み、ここで、この変異は、少なくとも1つの遺伝毒性物質(例えば、放射線、発癌物質)への曝露の直接的な結果として、および/またはDNAポリメラーゼエラー、遊離ラジカルおよび脱プリン反応などの内因性源の結果として生じる。検出は、最近の遺伝毒性物質への曝露の後(例えば、曝露から数日以内)に被験体を試験し、二本鎖配列決定を用いて、超低頻度の変異を識別することによって行うことができる。特定の例では、検出された超低頻度の変異を、典型的には曝露から何年も後に顕在化する疾患/障害(例えば、アスベストへの曝露から20年後の肺癌)を含め、特定の疾患または障害を引き起こすことが知られている変異と比較してもよい。したがって、本技術は、将来の曝露を防ぐため、また、初期の医学的処置を行うために、遺伝毒性物質の存在と、遺伝毒性物質に曝露された被害者とを識別する、利便性の高い方法を提供する。本技術は、安全ではない消費者製品、医薬品および他の工業/商業/製造業の副産物を市場または環境から除去するために、遺伝毒性物質を含むこれらを識別するための種々の高スループットスクリーニング方法で使用することもできる。
【0119】
特定の実施形態において、遺伝毒性物質の影響(例えば、欠失、切断および/または転位)は、その損傷がすぐに細胞死を引き起こさない場合には、癌または他の遺伝毒性物質に関連する疾患または障害を引き起こす場合がある。例えば、核酸損傷は、被験体が、遺伝毒性物質に関連する疾患または障害を発症するのに十分なものであってもよく、および/または曝露された被験体において既に存在する別の種類の疾患または障害の活性化または進行に寄与するものであってもよい。切断が起こりやすい領域(脆弱部位と呼ばれる)は、遺伝毒性薬剤(例えば、農薬または特定の化学療法薬などの化学物質)から生じてもよい。いくつかの化学物質は、癌遺伝子が存在する染色体領域において脆弱部位を誘発する能力を有し、発癌作用をもたらす可能性がある。さらに、農薬、製造化合物または他の有害物質のいくつかの混合物への職業的な曝露は、曝露された個体における遺伝毒性損傷の増加と正の相関関係がある。例えば、ヒト曝露前の遺伝毒性の可能性の調査は、任意の潜在的な遺伝毒性物質(例えば、潜在的な薬物、化粧品、消費製品、工業/製造製品または副産物、または研究中の他の化学化合物)にとって非常に望ましい。同様に、遺伝毒性物質への曝露が疑われる実施形態において、その遺伝毒性物質が識別可能である場合、被験体は、標的化された治療的処置を受けることができ、および/または遺伝毒性物質は、被験体または他のヒトへの将来の曝露を防止するために除去されてもよい。
【0120】
潜在的な遺伝毒性薬剤または因子の遺伝毒性の影響を検出し、時間および費用の両方で効率的な様式において潜在的に得られる変異誘発プロセスを定量化する能力は、商業的にも医学的にも重要である。特定の例では、潜在的な遺伝毒性物質の変異誘発プロセスを検出し、定量化する能力は、癌リスクを評価し、発癌物質を識別し、ヒトにおける曝露の影響を予測するために重要な場合がある。しかし、現在のツールは、遅く、煩雑であり、および/または提供する情報に制限がある。上述のように、インビボ試験および哺乳動物レポーター系、例えば、BigBlue(商標登録)マウスおよびラットは、DNA損傷を引き起こす化合物の可能性を決定するための有効な遺伝毒性測定基準として、米国食品医薬品局(FDA)の規制の下で現在利用されている。
【0121】
図2Aは、潜在的な遺伝毒性物質(例えば、潜在的な変異原)のインビボ変異導入を評価するための種々の方法論を示す概念図である。
図2Aに示されるそれぞれのスキームにおいて、試験被験体(例えば、BigBlue(商標登録)マウス、マウスモデル生物、ラットモデル生物など)は、適切な投与経路を用いて、潜在的な遺伝毒性物質(例えば、調査中の化合物/薬剤/因子)に曝露される。
図2Aの最も左側に示される従来の1つのスキームにおいて、長期間のげっ歯類発癌性バイオアッセイは、種々の用量の試験物質に曝露している間または曝露後に、新生物病変の発生について、試験動物を長期間(例えば2年間)観察する。試験動物は、例えば、予想されるヒト曝露の種類に応じて、経口、真皮または吸入による曝露によって投薬されてもよい。従来のスキームにおいて、投薬は、典型的には、約2年間続く。しかし、投薬パラメータ(例えば、投薬の持続時間、投与経路、投薬レベル、または他の投薬レジメンのパラメータ)は、所望な試験プロトコルに従って設定することができる。
図2Aの左側のスキームを参照すると、特定の動物の健康特徴が、試験全体を通じてモニタリングされるが、主要な評価は、試験が終了したときの試験動物の組織および臓器の完全な病理学的分析で行われる。
【0122】
図2Aの中央のスキームに示される別のインビボアッセイは、トランスジェニックげっ歯類を利用する。適切な短期投薬レジメンの後(例えば、数日または数週間の単位で)、試験動物を安楽死させ、所望な組織を収集し、DNAを抽出する。抽出したDNAから、トランスジェニックフラグメントを単離し、得られた精製プラスミドをファージに封入し、大腸菌に感染させる。従来のトランスジェニックプラークアッセイを行い、基本的な変異体頻度を計算する。
【0123】
上述の両方のスキームは、遅く、試験される潜在的な遺伝毒性物質の遺伝毒性(例えば、変異導入)に関して非常に限定された情報を提供する。ゲノム遺伝子座、組織または生物によって制限されない様式で体細胞変異を直接的に測定する可能性は、魅力的であるが、通常の細胞の変異体頻度(約10-7~10-8)よりかなりエラー率が高い(約10-3)ため、現時点では、標準的なDNA配列決定では不可能である。
【0124】
大規模並列配列決定は、変異誘発性曝露のインビボでの影響について、任意の生物のゲノムを包括的に調べる可能性を与えるが、上に述べたように、従来の方法は、不正確すぎて、このような変異(100万分の1未満のレベルで起こり得る)を検出することができない。例えば、次世代配列決定(NGS)の約0.1%のエラー率は、稀少なバリアントおよび固有の分子プロファイルまたはシグネチャの検出を妨害するバックグラウンドノイズを生成する。NGSプラットフォームにおけるエラーのいくつかの一般的な原因としては、PCR酵素(増幅中に生じる)、シーケンサリードおよび処理中のDNA損傷(例えば、8-オキソグアニン、脱アミノ化シトシン、脱塩期部位など)が挙げられる。
【0125】
本技術の態様に従い、二本鎖配列決定方法の工程は、高度に正確なDNA配列決定リードを作成することができ、これはさらに、詳細な変異体頻度を提供する(例えば、100万分の1未満の遺伝毒性物質により誘発される変異を解像し、異なる変異誘発プロセスを客観的に特性決定するための変異スペクトラムデータを提供し、作用機序を推測する)ことができる。例えば、
図2Aに示される右側のスキームは、従来技術のスキームと同じ試験被験体において、変異体頻度、変異の種類のスペクトラムおよびゲノムコンテキストデータについての詳細な情報も提供しつつ、潜在的な遺伝毒性物質(例えば、潜在的な変異原)の遺伝毒性を迅速に検出し、評価するための方法を含む。さらに、二本鎖配列決定分析は、任意の生物からの任意の組織における任意の遺伝子座での変異導入の感度の高い検出を行うことができる。例えば、
図2Aおよび
図2Bに示されるように、二本鎖配列決定方法のスキームは、培養中に成長した細胞(例えば、ヒト細胞、げっ歯類細胞、哺乳動物細胞、非哺乳動物細胞など)における試験化合物のインビトロでの変異導入を評価するために使用することができ(
図2B)、野生型げっ歯類(例えば、マウス)における試験化合物のインビボでの変異導入を評価するために使用することができる(
図2C)。例えば、一実施形態において、本技術は、適切な投与経路(例えば、経口、皮下、局所、エアゾール、筋肉内など)によって試験化合物(例えば、潜在的な遺伝毒性物質/変異原)に試験生物(例えば、げっ歯類、培養中に成長した細胞)を曝露することを含む方法の工程を含む。一実施形態において、試験生物は、試験化合物に短時間(例えば、1回の投薬、数分間、数時間、24時間未満、数日間、2~6日間など)、または中程度の持続時間(例えば、数日間、3~12日間、約1週間、約2週間、約1ヶ月、約2ヶ月、約3~6ヶ月など)、またはいくつかの他の適切な時間、曝露されてもよい。試験生物が、動物(例えば、げっ歯類)、例えば、
図1A(右側のスキーム)および
図1Cに示されるものである場合、動物を安楽死させ、および/またはDNA抽出のために所望の組織を収集してもよい。例えば、特定の実施形態において、試験動物を安楽死させず、1つ以上の血液サンプル(例えば、試験物質の投与または曝露の後、同じ時間点または異なる時間点で)を、DNA抽出のために試験動物から集めてもよい。動物を安楽死させる実施形態において、目的の1つ以上の組織(例えば、肝臓、骨髄、肺、脾臓、血液など)をDNA抽出のために収集してもよい。試験生物が、培養中の細胞を含む場合(
図1B)、細胞の全てまたは一部が、DNA抽出のために収集されてもよい。
【0126】
集められたか、または収集された生体サンプルからのDNA抽出の後、DNAライブラリ(例えば、配列決定ライブラリ)を調製してもよい。一実施形態において、DNAライブラリ(または他の核酸配列決定ライブラリ)を調製するための手法は、上に記載したのと同様の様式で、二本鎖配列決定ライブラリ構築プロトコル(例えば、
図1Aに示されるような)に関して、フラグメント化された二本鎖核酸物質(例えば、DNAサンプル由来)を分子バーコードで標識する(例えば、タグ化する)ことから開始されてもよい。いくつかの実施形態において、二本鎖核酸物質は、フラグメント化されていてもよい(例えば、無細胞DNA、損傷DNAなど)。しかし、他の実施形態において、種々の工程は、超音波などの機械的な剪断、または他のDNA切断方法(例えば、酵素による消化、噴霧など)を用いる核酸物質のフラグメント化を含んでいてもよい。フラグメント化された二本鎖核酸物質を標識する態様は、末端修復と3’-dAテーリングを含んでいてもよく、特定の用途で必要とされる場合、その後に、二本鎖核酸フラグメントと、SMIを含有する二本鎖配列決定に適したアダプターとをライゲーションする(例えば、
図1Aに示されるような)ことを含んでいてもよい。他の実施形態において、SMIは、元の核酸分子の両方の鎖からの固有に関連する情報のために、内因性であってもよく、または外因性配列と内因性配列の組み合わせであってもよい。
【0127】
二本鎖核酸物質へのアダプター分子のライゲーションの後、本方法は、増幅(例えば、PCR増幅、ローリングサークル増幅、複数置換増幅、等温増幅、ブリッジ増幅、表面結合増幅など)に続いてもよい(
図1B)。特定の実施形態において、例えば、1つ以上のアダプター配列に特異的なプライマーを使用して、元の二本鎖核酸分子のそれぞれの鎖に由来する核酸アンプリコンの複数のコピーにおいて生じる核酸物質のそれぞれの鎖を増幅してもよく、それぞれのアンプリコンは、元に関連付けられたSMIを保持している(
図1B)。増幅と、反応副生成物を除去するための関連する工程の後、標的核酸領域(例えば、目的の領域、遺伝子座など)は、任意に、ハイブリダイゼーションに基づく捕捉を用いて濃縮されてもよく、または別の実施形態において、目的の標的核酸領域に特異的なアダプター配列およびプライマーに特異的なプライマーを用いたマルチプレックスPCRを用いて、濃縮されてもよい(図示せず)。
【0128】
DNAライブラリ調製および増幅工程の後、二本鎖アダプター-DNA複合体は、標準的な配列決定方法を用い、適切な大規模並列DNA配列決定プラットフォームを用いて配列決定されてもよい(
図1B)。第1の鎖の複数のコピーと第2の鎖の複数のコピーを配列決定した後、配列決定データを、二本鎖配列決定手法を用い、本明細書に記載するように分析してもよく、それによって、同じ外因性(例えば、アダプター配列)および/または元の二本鎖標的核酸分子の第1の鎖または第2の鎖に由来する内因性SMIを共有する配列決定リードが、別個にグループ化される。いくつかの実施形態において、第1の鎖(例えば、「上鎖」)からのグループ化された配列決定リードを使用して、第1の鎖コンセンサス配列(例えば、一本鎖コンセンサス配列(SSCS))を形成し、第2の鎖(例えば、「下鎖」)からのグループ化された配列決定リードを使用して、第2の鎖コンセンサス配列(例えば、SSCS)を形成する。
図1Cを再び参照すると、次いで、第1のSSCSと第2のSSCSとを比較し、この2つの鎖間で一致するヌクレオチドを有する二本鎖コンセンサス配列(DCS)を作成してもよい(例えば、両方の鎖に由来する配列決定リード中に現れる場合には、バリアントまたは変異は、真であるとみなされる)(例えば、
図1Cを参照)。同様に、この比較する工程において、ヌクレオチドが上述の2つの鎖間で一致しないDCSの位置を、DNA損傷の可能性がある位置(例えば、遺伝毒性物質曝露によって引き起こされる損傷)としてさらに評価してもよい。
【0129】
図2A~
図2Cを再び参照し、本技術の態様に従い、二本鎖配列決定分析をさらに使用して、ゲノム全体にわたって誘発された変異の頻度を正確に定量化することができる。例えば、本技術の態様は、例えば、変異スペクトラム、トリヌクレオチド変異シグネチャ、増殖および新生物選択に対する特定の変異の機能的帰結についての情報、既知の遺伝毒性物質に関連する経験的に導き出された遺伝毒性に関連する情報との比較(例えば、変異スペクトラム、トリヌクレオチド変異シグネチャ)などを含む、誘導体配列データにおいて捕捉された遺伝毒性に関連する情報を作成することを対象とする。
【0130】
本技術は、さらに、遺伝毒性物質への曝露の結果として、被験体における少なくとも1つのゲノム変異を検出するための方法であって、(1)遺伝毒性物質曝露後の被験体からのサンプルであって、複数の二本鎖DNA分子を含むサンプルを提供する工程と、(2)非対称アダプター分子を個々の二本鎖DNA分子にライゲーションして、複数のアダプター-DNA分子を作成する工程と、(3)それぞれのアダプター-DNA分子について、(i)アダプター-DNA分子の元の第1の鎖のコピーのセットおよびアダプター-DNA分子の元の第2の鎖のコピーのセットを作成すること、(ii)元の第1の鎖のコピーのセットおよび元の第2の鎖のコピーのセットを配列決定して、第1の鎖配列および第2の鎖配列を提供すること、および(iii)第1の鎖配列と第2の鎖配列とを比較して、第1の鎖配列と第2の鎖配列との間の1つ以上の対応関係を識別することと、(4)それぞれのアダプター-DNA分子における1つ以上の対応関係を分析して、特定の遺伝毒性物質の指標となる変異体頻度および変異スペクトラム、遺伝毒性物質の種類、および/または作用機序のうちの少なくとも1つを決定する工程とを含む、方法を含む。いくつかの実施形態において、変異スペクトラムは、三重変異スペクトラムである。他の実施形態において、それぞれのアダプター-DNA分子における1つ以上の対応関係を分析して、三重変異スペクトラムを決定することは、さらに、特定の遺伝毒性物質について三重変異シグネチャを作成することを含む。特定の実施形態において、変異体頻度を決定することは、変異される塩基の三重/トリヌクレオチドのコンテキストの頻度を決定することを含む。
【0131】
いくつかの実施形態において、三重変異シグネチャおよび/または変異スペクトラムを、経験的に導き出された遺伝毒性物質に関連する情報と比較して、被験体が曝露された遺伝毒性物質の種類(わかっていない場合)、遺伝毒性物質の作用機序、被験体が、遺伝毒性物質に関連する疾患または障害を発症する可能性、および/または他の遺伝毒性物質に関連する情報を(例えば、類似性および/または差に基づいて)決定する。例えば、被験体における既知の遺伝毒性物質または疑わしい遺伝毒性物質(例えば、試験遺伝毒性物質)曝露から得られる二本鎖配列決定トリヌクレオチドスペクトラムパターンを、他の既知の遺伝毒性物質への曝露と関連付けられた経験的に導き出されたトリヌクレオチドスペクトラムパターン(例えば、データベースに格納されたもの)と比較してもよい。特定の実施形態において、二本鎖配列決定トリヌクレオチドスペクトラムパターンは、経験的に導き出されたトリヌクレオチドスペクトラムパターンのうちの1つ以上と実質的に類似していてもよく、その結果、医師は、1つ以上の経験的に導き出されたトリヌクレオチドスペクトラムパターンに対する類似性に基づき、試験遺伝毒性物質の同一性、試験遺伝毒性物質への曝露レベル、試験遺伝毒性物質の作用機序などについて知らせてもよい。
【0132】
変異体頻度
いくつかの実施形態において、二本鎖配列決定分析工程は、種々の曝露条件下、特定の遺伝毒性物質と関連付けられた変異体頻度を識別してもよい。例えば、遺伝毒性物質への生体サンプルの曝露と関連付けられた変異体頻度は、限定されないが、他の因子の中で特に、生物/被験体、被験体の年齢、遺伝毒性物質の種類、遺伝毒性物質への曝露の時間またはレベルの量、組織の種類、処置群、ゲノム(例えば、ゲノム遺伝子座)の領域、変異の種類、置換の種類、トリヌクレオチドコンテキストを含む種々の因子に応じて変化してもよい。いくつかの例では、変異体頻度は、配列決定される二本鎖塩基対あたりに検出される固有の変異の数として測定される。他の実施形態において、変異体頻度は、時間経過に伴う、単一の遺伝子または生物における新しい変異の速度である。
【0133】
変異スペクトラム
種々の実施形態において、二本鎖配列決定を用いて作成された高度に正確な(例えば、エラー修正済)配列リードをさらに分析して、特定の遺伝毒性物質または潜在的な遺伝毒性物質についての変異スペクトラムまたはシグネチャを作成してもよい。一実施形態において、変異スペクトラムまたはシグネチャは、遺伝毒性物質への曝露から生じる変異誘発プロセスから引き起こされる変異の種類の特徴的な組み合わせを含む。このような特徴的な組み合わせは、変異の種類(例えば、核酸配列または構造に対する変化)に関連する情報を含んでいてもよい。例えば、変異スペクトラムは、サンプル中の点変異(例えば、単一塩基変異)の数、位置およびコンテキスト、ヌクレオチドの欠失、配列転位、ヌクレオチドの挿入およびDNA配列の重複に関するパターン情報を含んでいてもよい。いくつかの実施形態において、変異スペクトラムは、決定された変異パターンを生じる作用機序を決定するのに関連する情報を含んでいてもよい。例えば、変異スペクトラムは、変異誘発プロセスが、外因性または内因性の遺伝毒性物質曝露によって直接的に引き起こされたか、または特に、DNA複製の失敗、欠陥のあるDNA修復経路およびDNA酵素編集の撹乱によって、遺伝毒性物質曝露が間接的に引き金となったかを決定する能力を有していてもよい。いくつかの実施形態において、変異スペクトラムは、計算パターンマッチング(例えば、教師なし階層型変異スペクトラムクラスタリング、非負値行列因子分解など)によって作成されてもよい。
【0134】
三重変異スペクトラム/シグネチャ
一実施形態において、二本鎖配列決定を用いて作成された高度に正確な(例えば、エラー修正済)配列リードをさらに分析して、三重変異スペクトラム(本明細書では、トリヌクレオチドスペクトラムまたはシグネチャとも呼ばれる)を作成してもよい。例えば、遺伝毒性物質および/または遺伝毒性物質曝露の発生と関連付けられた変異スペクトラムをさらに分析して、トリヌクレオチドまたはトリヌクレオチドコンテキスト中の単一ヌクレオチドの変化または変異を検出してもよい。理論によって束縛されないが、遺伝毒性物質曝露または他のプロセス(例えば、老化)は、トリヌクレオチドコンテキスト(例えば、ヌクレオチド塩基およびそのすぐ周囲にある塩基)に依存して、核酸に対する可変性および/または特有の損傷を引き起こす場合があることが理解される。いくつかの実施形態において、遺伝毒性物質は、固有の、半固有の、および/または別の状況で識別可能な三重スペクトラム/シグネチャを有していてもよい。例えば、第1の遺伝毒性物質のトリヌクレオチドスペクトラムは、主にC・G→A・T変異を含んでいてもよく、さらに、CpG部位に対し、より高い親和性を有していてもよい。このようなトリヌクレオチドスペクトラムは、ベンゾ[α]ピレンおよび他の多環芳香族炭化水素が既知の変異原であるタバコへの曝露によって主に引き起こされるのと同様の提案された病因である。別の例では、ウレタンは、5’-NTG-3’トリヌクレオチドコンテキストにおいてT・A→A・Tの周期的なパターンにおいてDNA損傷を生成する遺伝毒性物質である。したがって、いくつかの実施形態において、三重変異スペクトラムを決定することは、被験体における遺伝毒性物質曝露を識別し、潜在的な遺伝毒性物質の遺伝毒性を決定し、他の利点の中から、遺伝毒性薬剤または因子の作用機序を識別するために有利であろう。
【0135】
作用機序
いくつかの実施形態において、二本鎖配列決定を用いて作成された高度に正確な(例えば、エラー修正済)配列リードを使用して、特定の遺伝毒性物質に曝露した後の核酸に対する検出された変化を生じる生化学的プロセス(1つ以上)を推測することができる。例えば、一実施形態において、二本鎖配列決定方法を用いて作成された変異体頻度および変異スペクトラム(トリヌクレオチドスペクトラムを含む)を、観察された変異の種類および遺伝毒性物質曝露によって引き起こされた遺伝子変異またはDNA損傷のゲノム位置に関連付けられたパターンおよび生化学的性質に関する、経験的に導き出されたか、または演繹的に導き出された情報と比較してもよい。検出されたゲノム前変異、変異または損傷に続く生化学経路および/または病態生理学的プロセスが確認される実施形態において、このような情報を使用して、いくつかの実施形態において、遺伝毒性物質に曝露された被験体についての処置選択肢(例えば、治療または予防)を知らせてもよく、または他の実施形態において、このような情報を使用して、商品化努力(例えば、新薬)、清掃努力(例えば、環境毒素または製造副産物の)実行可能性を知らせてもよく、またはさらなる実施形態において、このような情報を使用して、試験された化合物、薬剤または因子が、その化合物、薬剤または因子と関連付けられた遺伝毒性を除外するか、および/または低減するために変更され得るかを知らせてもよい。
【0136】
遺伝毒性を評価するための核酸物質の供給源
上に記載したように、核酸物質は、任意の種々の供給源に由来していてもよいことが想定される。例えば、いくつかの実施形態において、核酸物質は、少なくとも1つの被験体(例えば、ヒトまたは動物被験体)または他の生体源由来のサンプルから提供される。いくつかの実施形態において、核酸物質は、保存/貯蔵されたサンプルから提供される。いくつかの実施形態において、サンプルは、血液、血清、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、鼻スワブ、口腔スワブ、組織擦過物、毛髪、指紋、尿、便、硝子体液、腹腔洗浄液、痰、気管支洗浄、経口洗浄、胸腔洗浄、胃洗浄、胃液、胆汁、膵管洗浄、胆管洗浄、総胆管洗浄、胆嚢液、滑液、感染した創傷、感染していない創傷、考古学的サンプル、鑑識サンプル、水サンプル、組織サンプル、食品サンプル、バイオリアクターサンプル、植物サンプル、爪あか、精液、前立腺液、卵管洗浄、細胞を含まない核酸、細胞内の核酸、メタゲノミクスサンプル、移植された異物の洗浄、鼻洗浄、腸液、上皮のブラッシング、上皮洗浄、組織生検、検死サンプル、壊死サンプル、臓器サンプル、ヒト識別アンプル、人工的に作られた核酸サンプル、合成遺伝子サンプル、核酸データ保存サンプル、腫瘍組織のうちの少なくとも1つ、およびこれらの任意の組み合わせであるか、またはこれらを含む。他の実施形態において、サンプルは、微生物、植物系生物、または任意の集められた環境サンプル(例えば、水、土、考古学的サンプルなど)のうちの少なくとも1つであるか、またはこれらを含む。本明細書でさらに記載される特定の例では、核酸物質は、遺伝毒性物質または潜在的な遺伝毒性物質に曝露された生体源に由来していてもよい。いくつかの例では、遺伝毒性物質は、変異原および/または発癌物質である。一例では、核酸物質を分析して、核酸物質の由来となる生体源が、遺伝毒性物質に曝露されたかどうかを決定する。
【0137】
例えば、エームズ試験(例えば、細菌における変異導入の試験)、哺乳動物細胞培養におけるインビトロ試験、トランスジェニックげっ歯類アッセイ、Pig-aアッセイおよびインビボでの2年間のバイオアッセイなどの他の既知の毒性アッセイまたは従来の毒性アッセイと比較すると、二本鎖配列決定は、複数の進化を提供する。例えば、従来技術の方法の多くは、試験薬剤/因子の遺伝毒性に関連する有益な情報の代理手段としてのレポーター遺伝子のインテロゲーションに限定される(例えば、エームズ試験、インビトロ哺乳動物細胞培養、インビボトランスジェニックげっ歯類アッセイ)か、または非ヒト源における試験(例えば、エームズ試験、トランスジェニックげっ歯類アッセイ、Pig-aアッセイ、2年間のバイオアッセイ)は、提供される非常に少ない情報を完成するために長時間を必要とする場合があり(例えば、野生型げっ歯類において2年間のバイオアッセイ)、または非常に費用がかかる場合がある(例えば、トランスジェニックげっ歯類アッセイ、2年間のバイオアッセイ)。遺伝毒性について試験薬剤/因子をスクリーニングするための従来技術のアッセイおよび技術の欠点の多くとは対照的に、二本鎖配列決定アッセイは、広く展開可能であり、経済的であり、試験薬剤/因子の早期および後期のスクリーニングに適している場合があり、これを利用して、短期間で高度に正確なデータを提供することができ(例えば、2週間未満で)、これを使用して、任意の生物/生体源からのインビトロおよびインビボで試験されたサンプル(すなわち、特に、インビボヒトサンプルを含む)または任意の組織/臓器をスクリーニングすることができ、複数の遺伝子座を評価し、遺伝毒性のレポーターとして天然ゲノムを使用することができ、決定された遺伝毒性薬剤/因子の作用機序を知らせることができる。
【0138】
試薬を用いたキット
本技術の態様は、さらに、二本鎖配列決定方法の種々の態様を実施するためのキットを包含する(本明細書では「DSキット」とも呼ばれる)。いくつかの実施形態において、キットは、核酸抽出、核酸ライブラリ調製、増幅(例えば、PCRによる)およびスクリーニングについて本明細書に開示する方法または方法工程のうちの1つ以上を実施するための説明書と共に、種々の試薬を含んでいてもよい。一実施形態において、キットは、さらに、配列決定データ(例えば、生の配列決定データ、配列決定リードなど)を分析するためのコンピュータプログラム製品(例えば、コンピュータ上で実行するためのコード化されたアルゴリズム、1つ以上のアルゴリズムを実行するためのクラウドベースのサーバに対するアクセスコード)を含み、例えば、サンプルに関連して、本技術の態様に従い、変異体頻度、変異スペクトラム、三重変異スペクトラム、既知の遺伝毒性物質の変異スペクトラムに対する比較などを決定してもよい。
【0139】
いくつかの実施形態において、DSキットは、サンプル調製(例えば、DNA抽出、DNAフラグメント化)、核酸ライブラリ調製、増幅および配列決定の種々の態様を行うのに適した試薬または試薬の組み合わせを含んでいてもよい。例えば、DSキットは、任意に、1つ以上のDNA抽出試薬(例えば、緩衝液、カラムなど)および/または組織抽出試薬を含んでいてもよい。任意に、DSキットは、さらに、例えば、物理的手段(例えば、音響剪断または超音波処理を容易にするための管、ネブライザユニットなど)または酵素手段(例えば、無作為または半無作為のゲノム剪断のための酵素および適切な反応酵素)によって、二本鎖DNAをフラグメント化するための1つ以上の試薬またはツールを含んでいてもよい。例えば、キットは、標的消化のための酵素(例えば、制限エンドヌクレアーゼ、CRISPR/CasエンドヌクレアーゼおよびRNAガイド、および/または他のエンドヌクレアーゼ)、二本鎖フラグメンターゼカクテル、DNAのフラグメントを主に二本鎖にするため、および/または一本鎖DNAを破壊するための一本鎖DNase酵素(例えば、緑豆ヌクレアーゼ、S1ヌクレアーゼ)のうちの1つ以上を含む二本鎖DNAを酵素によってフラグメント化するためのDNAフラグメント化試薬と、このような酵素反応を容易にするための適切な緩衝液および溶液とを含んでいてもよい。
【0140】
一実施形態において、DSキットは、二本鎖配列決定プロセスの工程を行うのに適したサンプルから核酸配列ライブラリを調製して、サンプル中の二本鎖核酸分子のエラー修正済(例えば、高度に正確な)配列を作成するためのプライマーおよびアダプターを含む。例えば、キットは、単一分子識別子(SMI)配列を含むアダプター分子の少なくとも1つのプール、またはユーザがこれを作成するためのツール(例えば、一本鎖オリゴヌクレオチド)を含んでいてもよい。いくつかの実施形態において、アダプター分子のプールは、サンプル中の複数の核酸分子を、アダプター分子の接続の後に実質的に固有に標識することができるように、適切な数の実質的に固有のSMI配列を、単独で、またはライゲーションされるフラグメントの固有の特徴と組み合わせて、含む。分子タグ化の当業者は、「適切な」数のSMI配列を伴うものは、種々の特有の因子(例えば、インプットDNA、DNAフラグメント化の種類、フラグメントの平均大きさ、ゲノム内で配列決定される配列の複雑さと反復性など)に応じて、数桁程度変化することを理解するだろう。任意に、アダプター分子は、さらに、1つ以上のPCRプライマー結合部位、1つ以上の配列決定プライマー結合部位、または両方を含む。別の実施形態において、DSキットは、SMI配列またはバーコードを含むアダプター分子を含まないが、その代わりに、従来のアダプター分子(例えば、Y字型の配列決定アダプターなど)を含み、種々の方法工程は、分子配列リードを関連付けるために内因性SMIを利用してもよい。いくつかの実施形態において、アダプター分子は、インデックスアダプターであり、および/またはインデックス配列を含む。
【0141】
一実施形態において、DSキットは、非相補性領域および/またはいくつかの他の鎖定義要素(SDE)をそれぞれ含むアダプター分子のセット、またはユーザがこれを作成するためのツール(例えば、一本鎖オリゴヌクレオチド)を含む。別の実施形態において、キットは、アダプター分子の少なくとも1つのセットを含み、アダプター分子の少なくともサブセットが、それぞれ、少なくとも1つのSMIと少なくとも1つのSDEとを含むか、またはこれらを作成するためのツールを含む。二重配列決定プロセス工程を行うのに適したサンプルから核酸配列決定ライブラリを調製するためのプライマーおよびアダプターのさらなる特徴は、上に記載され、米国特許第9,752,188号、国際特許公開第WO2017/100441号および国際特許出願第PCT/US18/59908号(2018年11月8日出願)に開示され、これらは全て、それらの全体が参照により本明細書に組み込まれる。
【0142】
これに加えて、キットは、さらに、例えば、DNAに結合する染料、例えば、Qubit蛍光光度計(例えば、Thermo Fisher Scientific、ウォルサム、MAから入手可能)と共に使用するためのSYBR(商標)グリーンまたはSYBR(商標)ゴールド(Thermo Fisher Scientific、ウォルサム、MAから入手可能)など、または適切な蛍光分光計で使用するためのPicoGreen(商標)染料(例えば、Thermo Fisher Scientific、ウォルサム、MAから入手可能)などのDNA定量化材料を含んでいてもよい。他のプラットフォームでのDNA定量化に適した他の試薬も想定される。さらなる実施形態は、核酸サイズ選択試薬(例えば、Solid Phase Reversible Immobilization(SPRI)磁気ビーズ、ゲル、カラム)、ベイト/プレイハイブリダイゼーションを用いた標的DNA捕捉のためのカラム、qPCR試薬(例えば、コピー数決定のための)、および/またはデジタルドロップレットPCR試薬のうちの1つ以上を含むキットを含む。いくつかの実施形態において、キットは、任意に、ライブラリ調製酵素(リガーゼ、ポリメラーゼ、エンドヌクレアーゼ、例えば、RNAインテロゲーションのための逆転写酵素)、dNTP、緩衝液、捕捉試薬(例えば、ビーズ、表面、コーティングされたチューブ、カラムなど)、インデックスプライマー、増幅プライマー(PCRプライマー)および配列決定プライマーのうちの1つ以上を含んでいてもよい。いくつかの実施形態において、キットは、エラーが起こりやすいDNAポリメラーゼおよび/または高忠実性DNAポリメラーゼなどのDNA損傷の種類を評価するための試薬を含んでいてもよい。特定の条件(例えば、高GCを豊富に含むゲノム/標的)におけるPCRまたはライゲーション反応のためのさらなる添加剤および試薬が想定される。
【0143】
一実施形態において、キットは、さらに、試薬、例えば、(疾患を引き起こす変異を修復することと対比して)ポリメラーゼ連鎖反応(PCR)プロセスを妨害するDNA配列のエラーを修復するDNAエラー修正酵素を含む。非限定的な例として、酵素は、以下のうちの1つ以上を含む。ウラシル-DNAグリコシラーゼ(UDG)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)、8-オキソグアニンDNAグリコシラーゼ(OGG1)、ヒトアプリン/アピリミジンエンドヌクレアーゼ(APE1)、エンドヌクレアーゼIII(Endo III)、エンドヌクレアーゼIV(Endo IV)、エンドヌクレアーゼV(Endo V)、エンドヌクレアーゼVIII(Endo VIII)、N-グリコシラーゼ/APリアーゼNEIL1タンパク質(hNEIL1)、T7エンドヌクレアーゼI(T7 Endo I)、T4ピリミジンダイマーグリコシラーゼ(T4 PDG )、ヒト一本鎖選択的一官能性ウラシル-DNAグリコシラーゼ(hSMUG1)、ヒトアルキルアデニンDNAグリコシラーゼ(hAAG)など。これを利用して、DNA損傷(例えば、インビトロでのDNA損傷)を修正することができる。これらのDNA修復酵素のいくつかは、例えば、DNAから損傷した塩基を除去するグリコシラーゼである。例えば、UDGは、(シトシンの自発的な加水分解によって生じる)シトシン脱アミノ化から生じるウラシルを除去し、FPGは、8-オキソ-グアニン(例えば、活性酸素種から生じる共通のDNA病変)を除去する。FPGは、リアーゼ活性も有し、脱塩基部位に1塩基ギャップを生成することができる。このような脱塩基部位は、例えば、ポリメラーゼがテンプレートをコピーすることができないため、その後にPCRによって増幅することができない。したがって、このようなDNA損傷修復酵素および/またはここに列挙した、当該技術分野で知られている他のものの使用は、真の変異を有していないが、配列決定および二本鎖配列分析の後に別の状況でエラーとして検出されない可能性がある損傷DNAを効果的に除去することができる。
【0144】
キットは、さらに、適切な対照、例えば、DNA増幅対照、核酸(テンプレート)定量化対照、配列決定対照、既知の遺伝毒性物質/変異原に曝露された生体源に由来する核酸分子(例えば、遺伝毒性物質に曝露された試験動物または培養中に成長した細胞から抽出したDNA)および/または遺伝毒性物質/変異原に曝露されなかった生体源に由来する核酸分子を含んでいてもよい。別の実施形態において、対照試薬は、意図的に損傷を受けた核酸および/または任意の損傷薬剤によって損傷を受けていないか、または曝露されていない核酸を含んでいてもよい。さらなる実施形態において、キットは、制御された遺伝毒性実験において送達される1つ以上の遺伝毒性および/または非遺伝毒性薬剤(例えば、化合物)も含んでいてもよく、任意に、このような薬剤を被験体、組織、細胞などに送達するためのプロトコルを含んでいてもよい。したがって、キットは、試験物質(例えば、試験化合物、潜在的な遺伝毒性薬剤または因子など)についてのプロトコルの信憑性を決定する二本鎖配列決定結果(例えば、予想される変異スペクトラム/シグネチャ)を与える対照を提供するのに適した試薬(試験化合物、核酸、対照配列決定ライブラリなど)を含み得る。一実施形態において、キットは、被験体サンプルにおける変異を検出するための分析のための被験体サンプル(例えば、血液サンプル)を運ぶための容器を含み、したがって、変異のパターンおよび種類は、被験体がどの遺伝毒性物質に曝露されたかを示す。別の実施形態において、キットは、核酸汚染対照標準(例えば、試験生物または被験体生物とは異なる生物におけるゲノム領域に対してアフィニティを有するハイブリダイゼーション捕捉プローブ)を含んでいてもよい。
【0145】
キットは、さらに、PCRおよび配列決定緩衝液、希釈剤、被験体サンプル抽出ツール(例えば、シリンジ、スワブなど)を含む、商業的な立場およびユーザの立場から望ましい材料を含む1つ以上の他の容器と、使用のための説明書を含む添付文書とを含んでいてもよい。これに加えて、ラベルは、例えば上述のような使用のための指示と共に、容器上に提供されてもよく、および/またはこの指示および/または他の情報も、キットに含まれる添付書類に含まれていてもよく、および/またはその中に提供されるウェブサイトアドレスを介して含まれていてもよい。キットは、例えば、サンプルチューブ、プレートシーラー、マイクロ遠心分離チューブ開口器、ラベル、磁気粒子分離器、フォームインサート、アイスパック、ドライアイスパック、絶縁など、実験器具も含んでいてもよい。
【0146】
キットは、さらに、電子計算デバイス(例えば、ラップトップ/デスクトップコンピュータ、タブレットなど)にインストール可能であるか、またはネットワーク(例えば、リモートサーバ)を介してアクセス可能なコンピュータプログラム製品を含んでいてもよく、ここで、計算デバイスまたはリモートサーバは、二本鎖配列決定分析工程を含む操作を行うための命令を実行するような構成の1つ以上のプロセッサを備えている。例えば、プロセッサは、生の配列決定リードまたは未分析配列決定リードを処理して二本鎖配列決定データを作成するための命令を実行するような構成であってもよい。さらなる実施形態において、コンピュータプログラム製品は、被験体またはサンプルの記録(例えば、特定の被験体またはサンプルまたはサンプル群に関する情報と、既知の遺伝毒性物質に関する経験的に導き出された情報)を含むデータベースを備えていてもよい。コンピュータプログラム製品は、コンピュータ上で実行されるとき、本明細書に開示する方法の工程を実行する、一時的でないコンピュータ可読媒体で具現化される(例えば、
図19および
図20を参照)。
キットは、さらに、データ(例えば、配列決定データ、レポート、他のデータ)をアップロードし、ダウンロードするためのリモートサーバ(クラウドベースのサーバを含む)にアクセスするための命令および/またはアクセスコード/パスワードなど、またはローカルデバイスにインストールされるソフトウェアを含んでいてもよい。全ての計算作業は、リモートサーバで行われ、インターネット接続などを介してユーザ/キットユーザによってアクセスされてもよい。
【0147】
高スループット遺伝毒性物質スクリーニング
本技術は、さらに、疑わしい薬剤または因子(例えば、化合物、化学物質、医薬品、製造製品または副産物、食品物質、環境因子など)の遺伝毒性を評価するための高スループットスクリーニングスキームを含む。一実施形態において、未知の遺伝毒性の影響を有する薬剤/因子をスクリーニングして、その試験薬剤/因子が遺伝毒性の影響を有するかどうかを決定してもよい。いくつかの実施形態において、遺伝毒性の影響を有するか、または閾値の遺伝毒性の影響を超える薬剤/因子の使用をなくしたいと強く要望しつつ、薬剤/因子をスクリーニングしてもよい。例えば、遺伝毒性物質に関連する疾患または障害を潜在的に引き起こし得る様式で変異誘発性である薬剤/因子は、この薬剤/因子を適切に制御し、除外し、廃棄し、保存などをすることができるように識別することができる。いくつかの実施形態において、発癌性である薬剤/因子は、本明細書に記載する高スループットスクリーニングスキームを用いて識別することができる。別の実施形態において、未知の遺伝毒性の影響を有する薬剤/因子を、所望な遺伝毒性の影響、特に、標的生体源に対する所望な遺伝毒性の影響を有する薬剤/因子を発見したいという意図でスクリーニングしてもよい。例えば、ある疾患または障害(例えば、癌)を有する患者に由来する生体サンプルは、細胞(例えば、癌細胞)を摂動させ得るか、または破壊し得る所望な遺伝毒性の影響について複数の薬剤/因子を試験するための高スループットスクリーニングスキームで使用されてもよい。このようなスクリーニングは、新薬/療法の発見のために、および/または個別化医薬に使用するための標的療法のために行うことができる。
【0148】
いくつかの実施形態において、高スループットスクリーニングとは、複数のサンプルを同時におよび/または時間効率的にスクリーニングすることを指す。一例では、遺伝毒性について薬剤または因子を試験することは、被験体(例えば、生体源)を試験薬剤または因子に曝露すること(例えば、処置すること、投与すること、適用することなど)を含む。したがって、高スループットスクリーニングスキームの場合、生体源/サンプルのアレイは、同じ試験薬剤/因子を用いて同時に処置されてもよく、または他の実施形態において、複数の試験薬剤/因子を用いて処置されてもよい。特定の例では、複数の生体サンプル(例えば、培養中に成長したヒトまたは他の生物の細胞、組織サンプル、血液または他の体液サンプル、トランスジェニック動物の細胞、異種移植片で成長したヒト細胞、生きている患者のオルガノイド、フィーダー細胞など)は、試験薬剤/因子に実質的に同時に、かつ一貫した条件下で曝露されてもよい。高スループットスクリーニングはまた、生体機能チップによって、例えば、内分泌、皮膚、胃腸管、肺、脳、心臓、骨髄、肝臓、腎臓および脾臓といった臓器および組織から抽出された同じ被験体由来の血液または組織サンプルを含む10臓器チップを用い、使用されてもよい。高スループットスクリーニングのための臓器チップの使用方法は、当該技術分野でよく知られている(例えば、Chanら[5])。他の実施形態において、遺伝子組換えされた細胞株(例えば、このような細胞を、変異誘発性または遺伝毒性の損傷の影響に対してより感受性にするために欠損または欠陥のあるDNA修復経路を有する)が、高スループットスクリーニングスキームに組み込まれてもよい。
【0149】
いくつかの実施形態において、複数の生体サンプルは、同じであっても実質的に類似していてもよい(例えば、培養中に成長した同一の細胞株、同じ被験体および/または同じ組織の種類からの組織サンプルなど)。他の実施形態において、複数の生体サンプルのうちの1つ以上が、異なっていてもよい。例えば、試験薬剤/因子は、同じ生物、異なる生物、またはこれらの組み合わせからの異なる組織/細胞の種類に対する遺伝毒性の影響について試験されてもよい。特定の例では、疑わしい遺伝毒性薬剤または因子(例えば、化合物、医薬品など)を、同じ被験体の種々の臓器からの組織サンプルに対して同時に試験してもよい(例えば、10臓器チップ)。いくつかの実施形態において、高スループットスクリーニングは、複数の試験薬剤/因子を同時に試験することを包含していてもよい。したがって、それぞれの試験されたサンプルは、意図的に変化しているか、または変化していなくてもよい(例えば、細胞の種類によって、組織の種類によって、細胞または組織が抽出される被験体によって、腫によってなど)異なる性質を有していてもよく、および/または高スループットスクリーニングスキームを使用して、任意の望ましい情報を提供する様式で複数のサンプルを効率的にスクリーニングすることが可能なように、設計ごとに異なっていてもよい(例えば、試験薬剤/因子による、投薬レベルによる、曝露時間によるなど)異なる試験レジメンを受けてもよいことが想定される。
【0150】
生体サンプルが曝露され、および/または所望な曝露レジメンが終了したら、そのサンプルからの細胞/組織を収集してもよく、二本鎖配列決定を用いるという目的のためにDNAを抽出して、それぞれのサンプルに由来するDNAに対する試験薬剤/因子の遺伝毒性/変異誘発性の影響を評価してもよい。いくつかの実施形態において、細胞を含まないDNA(例えば、培地に放出されたもの)は、二本鎖配列決定分析について生体サンプルから集められてもよい。本技術によって想定されるさらなる実施形態は、DNA損傷、既知の遺伝毒性物質または疑わしい遺伝毒性物質の変異誘発性または発癌性を評価するために二本鎖配列決定データを作成するためのDNAサンプルの高スループット処理を含む。
【0151】
本明細書に記載の高スループットスクリーニングプロセスは、例えば、生体サンプルの実験的処置、DNA抽出、ライブラリ調製工程、増幅工程(例えば、PCR)および/またはDNA配列決定工程(例えば、大規模並列配列決定のための種々の技術およびデバイスを用いる)のうちの1つ以上を行うためのロボットの使用を介する、自動化を含んでいてもよい。高スループットスクリーニングを使用することにより、遺伝毒性に関連する変異および/またはDNA損傷について多数のサンプルを迅速にスクリーニングするように、複数のサンプル(すなわち、同じ被験体からの異なる細胞の種類、または異なる被験体からの同じ細胞の種類)を並行して試験することが可能になる。
【0152】
一実施形態において、それぞれがウェルのアレイからなり、それぞれのウェルが1つのサンプルを含むマイクロプレートを、ロボット搬送によってシステムを通るように移動させる。一例では、マイクロプレート内のウェルは、自動化された液体搬送システムによって満たされてもよく、センサを使用して、マイクロプレート中のサンプルを評価してもよい(例えば、多くはインキュベーション時間の後に)。ラボラトリーオートメーションソフトウェアを使用して、スクリーニングプロセスの全体または一部を制御し、それによって、このプロセス内の正確さと、プロセス間の再現性を確保することができる。
【0153】
環境/外因性遺伝毒性物質
本技術の態様は、例えば、上述のインビボまたはインビトロ二本鎖配列決定スクリーニング方法のいずれかを用いることによって、環境/外因性薬剤/因子の遺伝毒性を評価することを含む。本技術のさらなる態様は、被験体/生物が、ある環境領域内で、ある遺伝毒性物質に曝露されたかどうかを評価することを含む。例えば、生体サンプル(例えば、組織、血液)は、生きている生物から集められてもよく、または別の状況で汚染の疑わしい領域に曝露され、例えば、ある領域が汚染されているかどうかを決定してもよい。他の実施形態において、生体サンプルは、より大きな領域に存在する生物から集められ、遺伝毒性物質による汚染源の特定の地理的位置を正確に示すためのスクリーニングプロセスとして評価されてもよい(例えば、水系に漏れ/放出された工業副産物)。本明細書に記載される種々の方法を使用して、可能性のある遺伝毒性物質の存在について調査中である環境領域に曝露された生体サンプル(例えば、被験体由来)を分析してもよい。別の実施形態において、本明細書に記載される種々の方法を使用して、ある環境領域(例えば、地理的領域、居住領域、職業環境など)において既知の遺伝毒性物質に曝露された疑いがある被験体から採取した生体サンプルを分析してもよい。本技術の態様に従って、生体サンプルは、複数の生物(例えば、海生生物、哺乳動物、濾過摂食、歩哨生物など)または特定の種(例えば、ヒトサンプル)を供給源とするものであってもよい。
【0154】
検出可能な環境遺伝毒性物質は、さらに、変異誘発性薬剤、例えば、限定されないが、γ線照射、X線、UV照射、マイクロ波、電子放出、毒性ガス、毒性空気粒子(例えば、吸入アスベスト)、および化学化合物および/または病原体に汚染された湖、川、小川、地下水などのうちの1つ以上への曝露を含む。外因性遺伝毒性物質のさらなる供給源としては、例えば、食品物質、化粧品、家庭雑貨品、ヘルスケア関連製品、調理製品およびツール、および他の製造された消費財が挙げられるだろう。
【0155】
二本鎖配列決定結果は、さらに、例えば、癌クラスターの場所を最初に識別する疫学的研究など、疾患を引き起こす汚染物質の存在を識別する他の方法と組み合わせて使用されてもよい。いくつかの実施形態において、本明細書に開示する方法を利用して、クラスターのメンバーに影響を与えた特定の遺伝毒性物質を識別してもよい。このデータから、遺伝毒性物質の供給源を決定することができる。被験体の疾患または医学状態を、原因となる事象(例えば、環境または他の外因性の変異原または発癌物質への曝露)と結びつけるための従来から使用されている相関関係の情報を有する従来の調査手段とは対照的に、二本鎖配列決定は、高度に正確な、再現可能なデータ(例えば、変異スペクトラムおよび作用機序)を提供し、この結果を使用して、上述の原因となる事象(例えば、特定の変異原または発癌物質への曝露)を経験的に決定することができる。
【0156】
内因性遺伝毒性物質
本技術の態様は、例えば、上述のインビボまたはインビトロ二本鎖配列決定スクリーニング方法のいずれかを用いることによって、内因性薬剤/因子(例えば、内因性遺伝毒性物質または遺伝毒性プロセス)の遺伝毒性を評価することを含む。したがって、本技術の態様は、DNA損傷を引き起こした内因性遺伝毒性物質または遺伝毒性プロセスを被験体/生物が経験したかどうかを評価することを含む。例えば、生体サンプル(例えば、組織、血液)は、例えば、その被験体が、遺伝毒性物質に関連する疾患または障害を有しているか、またはこのような疾患または障害を発症するリスクがあるかどうかを決定するために、被験体(例えば、患者)から集められてもよい。
【0157】
内因性因子は、非限定的な例として、ヌクレオチドの誤った組み込みを引き起こす生物学的発生、例えば、DNAポリメラーゼのエラー、遊離ラジカルおよび脱プリン反応などを含んでいてもよい。内因性因子は、さらに、疾患または障害に関連するポリヌクレオチド変異に直接的に寄与する短時間または長時間の生物学的状態の発症、例えば、ストレス、炎症、内因性ウイルスの活性化、自己免疫疾患、環境曝露、食品の選択(例えば、発癌性の食品および飲料)、喫煙、天然の遺伝子構成、老化、神経変性などを含んでいてもよい。例えば、被験体が長期間、高レベルのストレスに曝露されている場合、その被験体は、ストレスに関連する癌(例えば、白血病、乳癌など)と相関関係にある任意の変異について、二本鎖配列決定によって試験されてもよい。
【0158】
内因性因子はまた、個体の曝露の一体的な影響を反映する個々のヒトの組織における変異および他の遺伝毒性事象の総計を表す場合があり、正確に定量化すること、または実験的に制御することができない可能性がある場合がある。
【0159】
安全変異体頻度レベルを決定するための方法
遺伝毒性物質への曝露から生じるDNA損傷のレベルまたは量は、被験体の種々の特徴(例えば、健康レベル、年齢、性別、遺伝子構成、以前の遺伝毒性物質曝露事象など)に加えて、例えば、(直接的または間接的に)DNA損傷を引き起こす際の遺伝毒性物質の有効性、曝露の用量または量、曝露の経路または様式(例えば、摂取、吸入、経皮吸収、静脈内など)、曝露の持続時間(例えば、時間経過に伴う)、被験体が曝露される他の薬剤または因子の相乗効果または拮抗的効果を含む種々の因子に依存して変化する場合がある。上述のように、遺伝毒性物質への曝露は、ポリ核酸損傷を引き起こす場合があり、ポリ核酸損傷は、例えば、本明細書に記載する二本鎖配列決定方法によって評価され、既知の疾患に関連する変異パターン(例えば、乳癌について明確なゲノム変異)と十分に類似した変異パターン(例えば、変異の種類、変異体頻度、トリヌクレオチドコンテキストにおける識別可能な変異)を含み得るものと関連付けられた固有の、半固有の、および/または別の状況で識別可能な変異誘発性スペクトラムまたはシグネチャを決定することができる。本技術の種々の態様は、安全であると考え得る変異体頻度レベルを検出し、および/または定量化するための方法であって、遺伝毒性物質の安全閾値変異体頻度を検出する方法をさらに含む、方法を対象とする。サンプル中の変異体頻度が安全レベルを超える場合、その被験体は、時間経過に伴って、上述の疾患を発症するリスクが著しく増加していることを示す。
【0160】
本技術は、さらに、被験体が変異原に曝露した後に被験体においてインビボで発生したゲノム変異を検出し、定量化するための方法であって、(1)変異原に曝露された被験体から抽出された1つ以上の標的二本鎖DNA分子を二本鎖配列決定することと、(2)標的二本鎖DNA分子についてのエラー修正済コンセンサス配列を作成することと、(3)標的二本鎖DNA分子の変異スペクトラムを識別することと、(4)配列決定された二本鎖塩基対あたりの固有の変異数を計算することによって、標的二本鎖DNA分子の変異体頻度を計算することと、を含む、方法を含む。工程(3)の一実施形態において、変異スペクトラムは、サンプルの固有のプロファイルであり、「トルヌクレオチドシグネチャ(trunucleotide signature)」を含む。
【0161】
一実施形態において、工程(1)および(2)は、(a)二本鎖標的核酸分子を少なくとも1つのアダプター分子にライゲーションして、アダプター-標的核酸複合体を形成することであって、少なくとも1つのアダプター分子が、i.単独で、または二本鎖標的核酸分子を固有に標識する標的核酸剪断点と組み合わせた、変性または半変性した単一分子識別子(SMI)配列と、ii.アダプター-標的核酸複合体の各鎖が、その相補性鎖に対して別個に識別可能なヌクレオチド配列を有するように、アダプター-標的核酸複合体の各鎖をタグ化するヌクレオチド配列とを含むことと、(b)アダプター-標的核酸複合体の各鎖を増幅させ、複数の第1の鎖アダプター-標的核酸複合体アンプリコンおよび複数の第2の鎖アダプター-標的核酸複合体アンプリコンを産生することと、(c)アダプター-標的核酸複合体アンプリコンを配列決定して、複数の第1の鎖配列リードおよび複数の第2の鎖配列リードを産生することと、(d)複数の第1の鎖配列リードからの少なくとも1つの配列と、複数の第2の鎖配列リードからの少なくとも1つの配列とを比較し、一致しないヌクレオチド位置を考慮に入れないことによって、二本鎖標的核酸分子のエラー修正済配列リードを作成することと、によって達成される(米国特許第9,752,188 B2号およびWO 2017/100441号を参照されたい)。
【0162】
遺伝毒性物質の量の安全閾値レベルを決定する方法
本技術は、さらに、被験体による特定の遺伝毒性物質への曝露の安全レベル(重量または体積または質量または単位*時間の積分などによる濃度量)、および/またはある化合物または他の薬剤(例えば、無線デバイスなどからの電波)が任意の曝露レベルで遺伝毒性であるか否かを決定するための実験的なインビトロまたはインビボでの方法を含む。この決定は、安全閾値変異体頻度レベルを最初に決定することに依存していてもよい。一実施形態において、対照被験体のサンプルは、遺伝毒性物質(またはその欠如)について試験され、曝露された被験体のサンプル(例えば、複数のマウス、または同じ被験体由来の複数の細胞であって、その1つのセットが対照細胞であるなど)の遺伝毒性物質プロファイルと比較される。曝露された被験体は、疾患の発症に直接的に寄与する検出された遺伝毒性物質により誘発される変異が起こる前に、安全曝露閾値レベルを決定するための指定された所定の曝露量の疑わしい遺伝毒性物質を摂取する。
【0163】
別の実施形態において、試験被験体(例えば、ラボ動物、インビトロでの細胞など)は、様々な期間にわたって、様々な用量に曝露され、その状態から、(1)どの曝露用量でポリヌクレオチド変異がみられないか、および/または(2)どの曝露用量で、ポリヌクレオチド変異が検出されるか、しかし、他の化合物のレベルを推測するために判明した変異レベルを用い、どの用量等価レベルが被験体において癌を引き起こさないか、および/または(3)遺伝毒性物質の用量応答曲線および誘発される変異の回帰分析を決定して、線形の低用量応答曲線を推測すること、および/または(4)検出された遺伝毒性物質頻度/シグネチャと関連付けられる、被験体の集団における所与の健康転帰の危険率がどのようなものであるかなど、遺伝毒性物質曝露の安全なカットアウトレベルが決定される。
【0164】
安全曝露閾値レベルは、例えば、ヒト、イヌ/ネコ、ウマなどの種ごとに、さらに決定されてもよい。安全閾値レベルは、遺伝毒性物質への曝露経路ごとに、さらに決定されてもよい。例えば、種々の量の遺伝毒性物質を使用する実験は、本明細書に開示される二本鎖配列決定方法を用いて試験され、特定の疾患の発症と関連付けられる変異および三重スペクトラムを引き起こし得る経口、局所またはエアロゾル摂取による量(重量、体積など)および/または頻度を決定することができる。
【0165】
および/または、本明細書に開示される二本鎖配列決定の実験的な方法を使用し、時間および/または温度に基づき、遺伝毒性物質曝露の閾値量を決定することができる。例えば、曝露の持続時間、水温および水中の遺伝毒性物質の濃度に基づき、遺伝毒性物質を含有する水におけるシャワーまたは風呂からの経皮吸収を使用し、経皮吸収される遺伝毒性物質の量(用量)を計算することができる。
【0166】
遺伝毒性物質の安全閾値レベルを識別する、エラー修正二本鎖配列決定の結果は、さらに、他の安全性閾値データ(例えば、既存のFDAおよびEPAのレベル、有害物質疾病登録局のレベル、米国国家毒性プログラムのガイドライン、OECDガイドライン、カナダ保健省のガイドライン、欧州機関のガイドライン、ILSI/HESIガイドラインなど)と組み合わされ、確立された基準を確認するか、または調節してもよい。
【0167】
検出および治療の方法
疾患または障害の発症は、遺伝毒性物質曝露から多くの年数(例えば、20年)が経過するまで、従来の試験および画像診断技術によって診断することができない場合があるが、本技術は、被験体を予防的に処置するために、または疾患について被験体を(より高いリスクレベルであるという理由で)能動的にスクリーニングするために、および遺伝毒性物質の存在を識別し、それを排除して将来の曝露を防ぐために、遺伝毒性物質曝露から数日以内または数週間以内または数ヶ月以内に、疾患を引き起こす変異、または疾患を引き起こす変異または変異の前駆体を生じる可能性を有する遺伝毒性プロセスの指標を検出する方法を提供する。
【0168】
被験体が、遺伝毒性物質の閾値安全レベルを超えて曝露される場合、および/または被験体が、安全ではないレベルの遺伝毒性物質に潜在的に曝露されたと決定された場合(例えば、危険な曝露レベルを識別する衛生部門)、その被験体は、遺伝毒性物質に関連する疾患または障害の発症のリスクが著しく増加している。次いで、その被験体は、その遺伝毒性物質を遮断し、および/または解毒する薬剤を用いて予防的に処置され、および/またはその遺伝毒性物質の曝露が、減らされるか、または除去される(例えば、環境からその遺伝毒性物質を除去する、または被験体を移動させる)。これに加えて、またはこれに代えて、被験体は、連続的に時間が決められた診断試験(例えば、癌検出のための血液試験)および/または画像診断(例えば、CAT、MRI、PET、超音波、血清バイオマーカー試験など)を受け、その被験体が、その疾患または障害の初期段階を発症しているかどうかを検出し、その間に、最も効果的に治療される。非限定的な例として、アフラトキシンまたはアリストロキン酸曝露の場合、被験体は、別の肝癌誘発物質である慢性C型肝炎を有する患者が肝細胞癌についてスクリーニングされる典型的なスケジュールである6ヶ月ごとに、肝臓超音波を受けるように命令される可能性が高い。当該技術分野において周知である従来の診断試験が疾患(例えば、癌)を検出した時点で、その後、治療が開始される(例えば、手術、化学療法、免疫療法など)。
【0169】
予防的処置を提供する(すなわち、発症を予防するか、または発症のリスクを下げる)方法、および/または癌の成長を阻害する方法、および/または癌を根絶する方法は、当業者に周知の治療プロトコルを含み、遺伝毒性物質の種類に合わせられるだろう。既に誘発されている変異を逆行させる治療は現時点で存在しないが、被験体が特定の残留遺伝毒性物質を排泄するのを助けるための治療方法(例えば、キレート化による特定の重金属)は、さらなる遺伝毒性を減らすだろう。
【0170】
変異原誘発性の腫瘍(例えば、喫煙者における肺癌、重度の紫外線曝露における黒色腫、タバコ使用者における口腔癌など)の場合、これらの腫瘍における変異の負荷は、高くなる傾向があり、より多くの新抗原を生じ、免疫療法に好ましく応答する傾向がかなり大きくなることの説明となると考えられる。免疫療法の予防的な実施、例えば、チェックポイント阻害剤(すなわち、ニボルマブ、ペムブロリズマブおよびアテゾリズマブなどのPD1およびPDL1阻害剤、イピリズマブなどのCTLA4阻害剤)を含む免疫療法の予防的な実施により、被験体の免疫系が初期に形成する腫瘍を根絶することができる可能性が高い。したがって、曝露シグネチャの識別の別の治療を目的とする使用は、正式な臨床試験の設定において慎重な試験が必要ではあるが、免疫療法に対する将来の腫瘍応答性の予測、予防的処置を用いる潜在的な疾患予防である。
【0171】
検出および治療の方法は、さらに、遺伝毒性物質の作用機序を直接的にまたは推論的に決定する方法を含んでいてもよく、これを、適切な治療経過を決定し、および/または薬物耐性バリアントのモニタリングに使用してもよい(Schmittら[6]を参照されたい)。
【0172】
被験体が、少なくとも1つの遺伝毒性物質に曝露されたと診断されるか、または検出されたら、被験体は、その遺伝毒性物質に関連する疾患または障害の発症を防ぎ、発症を遅らせ、その影響を減らし、および/または根絶するために、治療に有効な量の医薬組成物を投与されてもよい。医薬組成物は、遺伝毒性物質に関連する疾患または障害の阻害剤または根絶剤と、薬学的に許容される担体または塩とを含む、治療に有効な量の組成物を含む。また、治療に有効な量は、意図される薬理学的結果、治療結果または予防結果をもたらすのに有効な、遺伝毒性物質に関連する疾患または障害の阻害剤または根絶剤を含む、治療用の非毒性の用量範囲の組成物を含む。
【0173】
医薬組成物は、経口投与、静脈内投与、筋肉内投与、皮下投与、尿道内投与、直腸投与、脊髄内投与、局所投与、口腔投与または非経口投与を含む投与経路のために製剤化され、これらの投与経路によって投与される。医薬組成物は、従来の医薬担体および賦形剤と混合され、錠剤、カプセル剤、丸薬、液体、静脈内溶液、飲料および食品などの形態で使用されてもよく、重量%または体積%で約0.1%~約99.9%、または約1%~約98%、または約5%~約95%、または約10%~約80%、または約15%~約60%、または約20%~約55%の活性成分を含有する。
【0174】
経口投与の場合、錠剤、丸剤およびカプセルは、さらに、結合剤(例えば、アカシアガム、ゼラチン、ポリビニルピロリドン、ソルビトールまたはトラガカント)、充填剤(例えば、リン酸カルシウム、グリシン、ラクトース、トウモロコシデンプン、ソルビトールまたはショ糖)、滑沢剤(例えば、ステアリン酸マグネシウム、ポリエチレングリコール、シリカまたはタルク)、崩壊剤(例えば、ポテトデンプン)、香味剤もしくは着色剤、または許容される湿潤剤などの従来の担体を含んでもよい。経口液体調製物は、水溶液または油性溶液、懸濁液、乳剤、シロップまたはエリキシル剤に製剤化されてもよく、懸濁剤、乳化剤、非水性剤、保存剤、着色剤および香味剤などの従来の添加剤を含有してもよい。
【0175】
静脈内投与経路については、医薬組成物を、一般的に使用される静脈内輸液のいずれかに溶解または懸濁し、点滴によって投与することができる。静脈内輸液としては、生理食塩水またはリンガー溶液が挙げられるが、これらに限定されない。
【0176】
非経口投与のための医薬組成物は、水性または非水性の等張性滅菌注射液または懸濁液の形態であってもよい。これらの溶液または懸濁液は、経口投与のための製剤で使用するために言及される担体のうちの1つ以上を含む滅菌粉末または顆粒から調製することができる。化合物は、ポリエチレングリコール、プロピレングリコール、エタノール、トウモロコシ油、ベンジルアルコール、塩化ナトリウムおよび/または種々の緩衝液に溶解することができる。
【0177】
治療効果のある用量は、さらに、遺伝毒性物質曝露の量または持続時間、被験体の年齢、体重、性別または人種、疾患または障害の発生段階、および当業者に周知の他の方法などの種々の因子に基づいて計算されてもよい。一実施形態において、被験体は、遺伝毒性物質への潜在的な曝露または疑わしい曝露が発見されたときに、たとえその曝露が何年も前に起こったことであっても、試験される。安全閾値レベルを超えて曝露されていると診断された場合、被験体は、直ちに、または症状が出たときに、医薬化合物を投与される。全ての実施形態において、遺伝毒性物質は、可能であれば被験体の環境から除去される。
【0178】
実験例
以下の章は、二本鎖配列決定および関連する試薬を用い、ゲノムインビボ変異導入を検出し、評価するための方法の例を提供する。以下の実施例は、本技術を説明するものであり、本技術を製造し、使用する際に当業者を支援するために提示される。実施例は、別の状況で技術の範囲を限定することは決して意図されない。
【0179】
一般に、インビボ変異導入を測定するためのDSの有効性を評価するために、62個のサンプルにわたって82億個のエラー修正済塩基を作成した一連のマウス実験を行い、2種類の独立した動物株における5種類の健康な組織からの9種類の遺伝子について、3種類の変異原の効果を調べた。二本鎖配列決定は、特定の変異原、組織の種類およびゲノム遺伝子座によって変動する程度まで、処置された動物間の変異体頻度の増加を定量的に示し、代表的な基準となるトランスジェニックげっ歯類アッセイの変異体頻度の増加を密接に反映していた。種々の例では、客観的な変異パターンのみに基づき、その治療群によってサンプルを識別することが可能であった。いくつかの例では、変異原感受性は、異なる遺伝子座間で最大4倍まで変化し、理論によって束縛されないが、スペクトラムパターンは、このことが、部分的に領域的に異なるプロセスの結果であることを示唆しており、このプロセスには、転写およびメチル化も含まれ得る。種々の例では、タバコに関連する発癌物質であるベンゾ[a]ピレンで処置された動物において、非常に低い頻度でDSによって識別されたSNV間のトリヌクレオチド変異シグネチャは、公的に入手可能なデータベース中の喫煙に関連する肺癌のゲノム中のクローン性SNV間でみられるものとほぼ同一であることが示された。いくつかの例では、DSを使用して、変異原治療からわずか4週間後に、選択圧が加えられてクローン的に拡大する低頻度の発癌性ドライバー変異を識別した。したがって、また、本明細書に記載される様々な実施例で実証されるように、DSは、遺伝毒性プロセスおよびリアルタイムの新生物進化を直接的に定量化するために使用することができ、変異生物学、毒性学および癌リスク評価における多様な用途を有する。
【0180】
実施例1
BigBlue(登録商標)マウスにおけるcll導入遺伝子および内因性遺伝子の中のインビボ変異分析のための二本鎖配列決定の応用この章は、エラー修正次世代配列決定(NGS)を使用し、BigBlue(登録商標)トランスジェニックげっ歯類(TGR)変異アッセイにおいて使用されるcII導入遺伝子およびネイティブマウス遺伝子の両方において、化学的に誘発された変異を直接的に測定した例を記載する。現時点で、TGR変異アッセイは、プラーク形成を介して稀少なcII変異体を検出する。標準的なNGSは、エラー率が高い(配列決定される103塩基あたり約1のエラー)ため、低頻度の変異検出には使用することができない。エラー修正NGSまたは二本鎖配列決定は、顕著に低いエラー率を有し(約1/108塩基)、非常に稀少な変異の検出を可能にする。
【0181】
この実施例では、二本鎖配列決定の応用により、対照、N-エチル-ニトロソウレア(ENU)およびベンゾ[a]ピレン(B[a]P)曝露したBigBlue(登録商標)C57BL6雄マウスにおける変異体頻度(MF)およびスペクトラムを評価した。
【0182】
BigBlue(登録商標)トランスジェニックC57BL/6雄マウスは、1日目~28日目にビヒクル(オリーブ油)またはB[a]P(50mg/kg/日)を用いるか、または1~3日目にENU(pH6緩衝液中、40mg/kg/日)を用い、毎日強制経口投与によって処置された(n=6)。試験31日目に組織を採取し、凍結させた。変異体について、肝臓と骨髄を分析した。DNAを単離し、Agilent Technologiesによって記載されるRecoverEaseおよびTranspack法を用い、cII変異体プラークについて変異体を分析した。二本鎖配列決定を用いて、肝臓および骨髄における変異について、cIIおよび他の内因性遺伝子を配列決定した。
【0183】
評価される遺伝子と、遺伝子を選択するために使用される基準は、以下の通りである。(1)全ての組織の種類で普遍的に転写される、Polr1c(RNAポリメラーゼ)、(2)網膜以外の組織で発現されないRho(ロドプシン)、(3)肝臓内で高度に発現されるが、他の場所ではほとんど発現されない、Hp(ハプトグロビン)、(4)ヒト肝細胞癌における最も一般的な変異遺伝子であるCtnnb1(β-カテニン)、および(5)CII:BigBlue(登録商標)マウス中の約80コピーに存在する360bpトランスジェニックレポーター遺伝子。
【0184】
図3A~3Dは、上述の変異原処置の後の肝臓および骨髄における二本鎖配列決定(
図3Aおよび3B)およびBigBlue(登録商標)cIIプラークアッセイ(
図3Cおよび3D)について計算された変異体頻度を示す箱ひげ図のグラフである。二本鎖配列決定のMFは、配列決定された二本鎖塩基対あたりの合計変異体に基づいていた(n=5匹のマウス/群)。BigBlue(登録商標)のMFは、変異体プラーク形成単位の数に対する変異体プラークの数として計算された(n=6匹のマウス/群)。示される通り、二本鎖配列決定によって測定されたMFと、従来のBigBlue(登録商標)cIIプラークアッセイによって測定されたMFは、両方の変異原に対して同様の応答を得た。より迅速に分裂する細胞を含む骨髄は、両方法を用い、肝臓よりも高いMFを示した。
【0185】
図3Eは、二本鎖配列決定に対する、トランスジェニックげっ歯類アッセイにおける相対的なcII変異体倍増率を示す。上述の通り、プラークアッセイにおけるMFは、選択プレート上で観察される表現型が活性な変異体プラークの数を、許容プレート上で形成されるプラークの合計数で割り算したものとして計算される。二本鎖配列決定アッセイにおけるMFは、変異体塩基対の観察数を、297BPのcII導入遺伝子区間内で配列決定された塩基対の合計数によって割り算したものとして計算される。誘導体測定に差があるにもかかわらず、二本鎖配列決定アッセイとBigBlue(登録商標)cIIプラークアッセイとの間の相関関係は、組織および変異原の処置の枠を超えて強い。
【0186】
図3Fは、BigBlue(登録商標)マウス組織と、BigBlue(登録商標)マウス組織からのcIIのgDNAの二本鎖配列決定とから産生される個々に採取された変異体プラークについてのcII遺伝子内のSNVの割合を示す。SNVは、ピリミジンを参照として用いて指定される。二本鎖配列決定は、3510個のプラークの手動での収集によって達成されたものと同じ各処置群からの変異スペクトラムを与える(カイ二乗検定を用い、3つ全てでp値>0.999)。SNVの全観察値を、cII区間内の参照塩基の観察数によって割り算し、1に正規化することによって、割合を計算した。
【0187】
図3Gは、コドン位置および機能的帰結による、全てのBigBlue(登録商標)組織の種類および処置群にわたるcIIの直接的な二本鎖配列決定によって識別される全ての変異の分布を示す。
図3Hは、個々に収集された変異体プラーク間で識別された変異についての分布データを示す。
図3Gおよび3Hを一緒に参照すると、直接的な二本鎖配列決定(
図3G)は、全ての効果群を生じさせる全遺伝子に沿って変異を識別し、一方、採取された変異体プラークからの変異(
図3H)は、このタンパク質の重要ではないC末端およびN末端で同義バリアントおよび変異を含まない。理論によって束縛されないが、このタンパク質の重要ではないC末端およびN末端にある同義バリアントおよび変異は、プラークアッセイ中の選択的成長およびスコアリングに必要な遺伝子機能を破壊しないと考えられる。
【0188】
図4は、二本鎖配列決定によって測定されるMFが各処置群内で一致していることを示す棒グラフである。全ての遺伝子にわたって集計されたMFは、二本鎖配列決定によって、肝臓および骨髄で測定された。固有の変異体の数は、変異原に曝露したマウス(118個の変異/26億個の塩基対まで)と比較して、ビヒクル対照動物では低かった(1~13個の変異/14億個の塩基対)。ある群の中の動物間のMFは、全ての処置条件において再現可能であり、対照動物における低い変異数(1~13個)は、MFの安定した推定値を得るための深い配列決定の必要性を強調するものである。
【0189】
図5Aおよび5Bは、肝臓(
図5A)および骨髄(
図5B)の中のcII導入遺伝子と比較して、二本鎖配列決定によって測定された、内因性遺伝子のMFを示す棒グラフである。各遺伝子(約3~6kb)は、約5000倍の深さで配列決定され、cII遺伝子(約350bp×ゲノムあたり80コピー)は、約100K~300Kの深さで配列決定された。変異体頻度は、
図3A~3Dについて上に記載される通りに計算された。示される通り、内因性遺伝子は、cII導入遺伝子と同様のMFの増加を示す。二本鎖配列決定は、MFが肝臓よりも骨髄で高いことを示す。理論によって束縛されないが、骨髄の方が細胞分裂の速度が大きいことは、試験された両方の変異原について、より高いMFレベルが検出されたことの説明となるだろう。さらに、
図5Aおよび5Bに示される内因性遺伝子の応答の差は、内因性遺伝子の転写状態または染色体構造の差に関連するだろう。
【0190】
図5Cは、肝臓および骨髄についての遺伝子領域による二本鎖配列決定について計算されたSNV MFを示す箱ひげ図のグラフであり、
図5Dは、
図5Cに示される集計データの個々の測定値を示す散布図である。散布点は、個々の測定値を示し、これらの測定値に95% CIが付与されている。
図5Cの箱ひげ図は、その組織および処置カテゴリに関する全てのデータ点の4つの四分位数全てを示す。Y軸の目盛は、線形目盛であり、大きさは10
-7で示される。
図5Cを参照すると、この箱ひげ図は、
図5Dに示されるBig Blue(登録商標)マウスモデルの4種類の内因性遺伝子およびcII導入遺伝子にわたる、肝臓および骨髄組織におけるSNV変異頻度の集計をまとめたものである。変異誘発の程度は、特定の変異原、組織の種類および遺伝子座の影響を受ける。
【0191】
図6は、二本鎖配列決定によって測定される、試験組織内の各試験変異原(例えば、処置)の変異スペクトラムを示す棒グラフである。
図6を参照すると、全ての遺伝子にわたって集計され、各サンプルについて計算され、教師なし階層型クラスター分析によってグループ化された、各変異の部分は、その変異スペクトラムが各処置(例えば、試験変異原)に固有であることを示す。コード化されたデータの教師なしクラスター分析は、変異スペクトラムに基づくデータのグループ化を可能にし、ENUサンプルが、圧倒的多数のT→C、T→AおよびC→Tの変異によって、全ての組織において容易に識別されることを示す。同様に、B[a]Pサンプルは、C→AおよびG→Tの変異によって区別される。
【0192】
図7A~7Cは、ビヒクル対照(7A)、B[a]P(7B)およびENU(7C)について、隣接ヌクレオチドの観点での変異スペクトラム(すなわち、トリヌクレオチドスペクトラム)を示すグラフである。トリヌクレオチドスペクトラム形式における変異シグネチャは、変異導入の異なる機構に関する情報を提供し、および/または特定の変異原に固有の変異パターンを示す。例えば、CCGおよびCGCといったコンテキストは、他のコンテキストよりもタバコに関連する発癌物質B[a]Pに攻撃を受けやすいように思われる(
図7B)。このシグネチャパターンは、アフラトキシン曝露によって示されるシグネチャパターンと同様な場合がある(例えば、同様の変異導入機構である場合がある)。
図7Cは、アルキル化剤ENUが、IUPACコードGTS(ここで、S+[G][C])に一致する2つの攻撃を受けやすいコンテキストを有し、トランジション変異の誘発因子であることを示す。
【0193】
この実施例では、ENUおよびB[a]Pで処置された骨髄および肝臓サンプルにおける変異負荷は、対照と比較して有意に増加しており、従来のBigBlue(登録商標)cII変異体プラーク頻度(変異体頻度MF)と同等であり、組織の種類によって同様に変化したことが示されている。スペクトラムの評価は、各処置群において、インデルと単塩基置換の特徴的なパターンを明らかにした。トリヌクレオチド塩基分析は、隣接ヌクレオチドコンテキストが、変異の可能性を強く調節することを示し、最も極端なホットスポットは、B[a]PについてはCCGおよびCGCであり、ENUについてはGTGおよびGTCであった。二本鎖配列決定は、以下の4種類の内因性遺伝子に拡張された。Polr1c、ロドプシン、ハプトグロビンおよびβ-カテニン。ここでもまた、MFは、ENUおよびB[a]Pに曝露された動物で増加したが、ゲノム遺伝子座によって有意に変化しており、これは転写状態を反映している可能性が高い。この実施例では、二本鎖配列決定は、TGRアッセイにおいて許容される前臨床安全性バイオマーカーであるcII導入遺伝子における変異を検出するための成功した方法であることを示すが、さらに、この実施例は、二本鎖配列決定が、内因性癌関連遺伝子に基づくリスク評価ツールの基礎となり得ることを示す。
【0194】
実施例2
二本鎖配列決定を用いた哺乳動物ゲノムにおけるインビボでの化学変異導入の直接的な定量化この章は、二本鎖配列決定を使用して、癌ドライバー遺伝子における早期の変異が、試験変異原の腫瘍発生の可能性を反映するかどうかを決定する例を記載する。
【0195】
この実施例では、FDAに承認された癌にかかりやすいマウスモデルにおいて、異なるマウス組織の種類(肺、脾臓、血液)において、ウレタンの影響を調べる。このマウスモデルは、Tg.rasH2である(Saitohら、Oncogene 1990.PMID 2202951)。このマウスは、1つの半接合単立遺伝子上での発現を促進するために活性化エンハンサー変異を有するヒトHrasの約3個のタンデムコピーを含有する。これらのマウスは、脾臓血管肉腫および肺腺癌にかかりやすく、通常は、2年間の天然動物の試験を代替するために6ヶ月の発癌性試験に使用される。マウスにおいてみられる腫瘍は、通常、ヒトHras癌原遺伝子の1つのコピーに活性化変異を獲得している。この4種類の天然マウス遺伝子(Rho、Hp、Ctnnb1、Polr1c)に加えて、天然マウスHras導入遺伝子および天然ヒトHras導入遺伝子も、この実施例で分析される。
【0196】
この実施例では、Tg.rasH2マウス(n=5/群)に、ビヒクルまたは発癌性用量のウレタンを投与し(1日目、3日目、5日目)、標的組織(肺、脾臓)および全血における二本鎖配列決定による変異検出のために、29日目に安楽死させた。内因性遺伝子(Rho、Hp、Ctnnb1、Polr1c)および天然マウスおよびヒトのHras(トランス)遺伝子も配列決定した。
【0197】
ウレタンを投与した動物(n=5/群)から、11週目に腫瘍(脾臓血管肉腫、肺腺癌)を採取し、これらの腫瘍における特徴的な癌ドライバー変異(CDM)を識別するために、全エキソーム配列決定(WES)を行った。
【0198】
図8は、対照およびウレタンを投与された実験動物について、肺、脾臓および血液サンプルの変異体頻度(MF)を示す棒グラフである。この分析では、検出された全ての固有のバリアントを1つの変異として計測し、これをサンプルごとに合計した。これを、配列決定された二本鎖塩基の合計数によって、全捕捉領域にわたって割り算した。事象の数は、各サンプルの上に記載されている。合計で、全30個のサンプルにわたって、3,966,947,832個の二本鎖配列決定された塩基対が作成された。
図8に示す通り、変異誘発は、同じ処置群の動物間では一致しており、配列決定の深さが増すと共に信頼度が増加する。
【0199】
図9は、各組織サンプル群にわたる平均最小点変異体頻度を示す棒グラフである(エラーバーは、±1の標準偏差である)。
【表1】
【0200】
図9および表1を一緒に参照すると、ビヒクル対照(VC)と処置群との間の差は、非常に有意であった。ウェルチのt検定(不等分散の場合)を使用し、組織の対照の変異体頻度と比較して、変異原処置された組織の変異体頻度の優位性を決定した。血液を用いたときの信頼区間がわずかに広いのは、この特定の例において、血液VCサンプルにおいて配列決定の平均深さが低いことを反映している。本明細書に記載の方法を用いてこれを修正することができることが予想される。
【0201】
図10Aは、示されている処置カテゴリについて、肺、脾臓および血液についての遺伝子領域による二本鎖配列決定について計算されたSNV MFを示す箱ひげ図のグラフであり、
図10Bは、
図10Aに示される集計データの個々の測定値を示す散布図である。散布点は、個々の測定値を示し、これらの測定値に95% CIが付与されている。
図10Aの箱ひげ図は、その組織および処置カテゴリに関する全てのデータ点の4つの四分位数全てを示す。Y軸の目盛は、線形目盛であり、大きさは10
-7で示される。
図10Aを参照すると、この箱ひげ図は、
図10Bに示されるTg-rasH2マウスモデルの肺、脾臓および血液におけるSNV変異頻度の集計をまとめたものである。Tg-rasH2マウスモデルにcII導入遺伝子は存在しない。変異誘発の程度は、特定の変異原、組織の種類および遺伝子座の影響を受ける。
図11は、二本鎖配列決定によって測定される、試験組織内のウレタンおよびVCの変異スペクトラムを示す棒グラフである。
図11を参照すると、コード化されたデータの教師なしクラスター分析は、変異スペクトラムに基づくデータのグループ化を可能にした。このデータは、ヌクレオチド変異の単純なスペクトルだけで曝露を識別することが可能であることを示している。言い換えると、変異原が不明であった場合、このような変異原は、変異スペクトラムの性質による、曝露した生物のDNAの二本鎖配列決定によって、新たに識別することができる。
【0202】
図12Aおよび
図12Bは、ビヒクル対照(12A)およびウレタン(12B)について、隣接ヌクレオチドの観点での変異スペクトラム(すなわち、トリヌクレオチドスペクトラム)を示すグラフである。トリヌクレオチドスペクトラム形式における変異シグネチャは、変異導入の異なる機構に関する情報を提供し、および/または特定の変異原に固有の変異パターンを示す。したがって、そのトリヌクレオチドコンテキスト内のそれぞれの変異の種類の詳細な内訳(「三重シグネチャ」)は、各処置群について非常に固有の指紋を明らかにし、これは、このような曝露によって引き起こされる腫瘍からのクローン変異の既知のシグネチャと一致する。処置されていない動物では、それぞれグアニンの酸化およびシトシンおよび5-me-シトシンの脱アミノ化によって生じるC:G→A:TおよびC:G→G:Cの変異は、老化の既知のパターンであり、この変異が検出された。ウレタン処置の後、モチーフ「NTG」内のT:A→A:Tが、最も一般的な変異として示される。
【0203】
図13は、単一ヌクレオチドバリアント(SNV)鎖バイアスがCtnnb1およびPolr1cで観察されたが、HpおよびRhoゲノム領域では観察されなかったことを示す。SNVの表記は、転写された鎖の順方向における参照ヌクレオチドに対して正規化される。個々の重複は、点と95%信頼区間で示され、線形のセグメントを有する。全ての変異頻度は、バリアント呼び出し領域内の各参照塩基のヌクレオチド数について修正された。鎖バイアスがないことに対する帰無仮説は、相互変異について等しい頻度である。C>NおよびT>Nバリアントは均一な頻度であり、G>NおよびA>Nバリアントは頻度が上昇しているため、バイアスは、Ctnnb1およびPolr1cにおいて明らかである。HpおよびRhoと比較して、理論によって束縛されないが、この差は、転写によって結合するヌクレオチド除去修復およびこれらの遺伝子の相対的な発現レベルに起因すると考えられる。
【0204】
図14は、二本鎖配列決定によって検出される、バリアント対立遺伝子フラクションの早期新生物性クローン選択を示すグラフである。識別された変異の大部分は、単一分子で、非常に低いバリアント対立遺伝子フラクション(VAF)、例えば、1/10,000程度で起こった。いくつかのバリアントは、サンプル中の複数の分子に見出され、かなり高いVAFを有すると識別された。
【0205】
図15Aは、Tg-rasH2マウスモデルにおけるヒト形質導入遺伝子座を含むRas遺伝子ファミリーから捕捉されたエキソンについてのゲノム区間にわたってプロットされたSNVを示すグラフである。シングレットは、単一分子内に見出される変異である。マルチプレットは、同じサンプラー内の複数の分子内で識別される同一の変異であり、クローン増殖事象を表す場合がある。それぞれの点の高さは、各SNVのバリアント対立遺伝子頻度(VAF)に対応し、この点の大きさは、マルチプレットの観察のみに対応している。COSMICにおけるRasファミリーのヒト癌変異ホットスポットの位置および相対的な頻度は、それぞれの遺伝子の下に示される。
図15Bは、ヒトHRAS導入遺伝子のエキソン3にアラインメントする単一ヌクレオチドバリアント(SNV)を示すグラフである。最も一般的なHRAS癌を引き起こすホットスポットであるヒトHRASのエキソン3内のコドン番号61の中心残基は、強調表示されている。
【0206】
図15Aおよび
図15Bを一緒に参照すると、T>A塩基転換のクラスターが、ヒト癌性Hrasコドン61ホットスポットで、4/5のウレタン処置された肺サンプルと1/5のウレタン処置された脾臓サンプルで観察された。特に、5種類の処置された肺サンプルのうち4種類が、0.1%~1.8%のバリアント対立遺伝子頻度でこの変異を有していた。特に、これらのクローンは、コンテキストNTGにおいて塩基転換T>Aを有し、これはウレタン変異導入の特徴である(
図12BにおけるNTG部位の強い偏りを指す)。これに加え、2種類の処置された脾臓サンプルは、このコドンに変異を有していた。片方は、この同じ位置であり、もう一方は、隣接する塩基対にあった。4/5の処置された肺サンプルの観察により、29日目までに病原性変異がクローン的に増殖し、一方、このパネルの他の箇所では>1メンバークローンとして、または複数のサンプルにおいて繰り返しがみられた非常に少ない変異(十分に確立された癌ドライバーにおける高いVAFマルチプレットとして)は、曝露の直後の陽性選択の強い指標である。さらに、本技術の実施形態に従って、二本鎖配列決定方法は、かかる早期新生物性クローン選択を検出するのに必要な感受性を提供する。
【表2】
【0207】
表2を参照すると、変異の97.5%は、単一分子のみで識別され、1%は、2つの分子でみられ、約0.5%は、2つより多い分子でみられた。4種類の最高レベルのクローンは全て、ヒトHRASにおける再発腫瘍ホットスポットであるAA61において癌性変異を生じていた。この最高レベルのクローンも、癌ホットスポットで現れ、このことは、強い選択圧の大きさをさらに強調するものであった。
【0208】
サンプルあたり、はるかに多い量のDNAが抽出され、配列決定された二本鎖分子に変換された。組織サンプルのうち抽出された部分から、約5μgのゲノムDNAを得た。これをゲノム当量に変換し、3を掛け算し、この抽出においてtg.HRASコピーの数を得る。このうち約1/3%のみが配列決定され、そのため、検出された組織よりも約300倍多い変異体が、サンプリングされた組織の元の部分に存在していた。
【表3】
【0209】
この実施例において、選択されたクローンは、最高対立遺伝子フラクションクローンにおいて、90,000個を超える細胞を包含していた。その結果、計算によって、試験の29日以内に(例えば、変異曝露の時から)、細胞死がないと仮定すると、これらの細胞の倍増時間は、1.8日ごとであり、約2の(29/1.8)乗から約90,000であった。理論によって束縛されないが、この計算された細胞倍増速度は、これらの選択された変異を短時間(例えば、最短で2週間)で検出する可能性が高いことを示唆する。
【0210】
図16A~
図16Bは、従来のDNA配列決定(
図16A)および二本鎖配列決定(
図16B)を用いる、ウレタン処置後のマウス肺におけるヒトHRASの代表的な400塩基対部分からの配列決定データのグラフ表示である。従来のDNA配列決定は、0.1%~1%のエラー率を有し、真の低頻度の変異の存在を曖昧にする。
図16Aは、本試験における1つのサンプル(マウス肺)の1つの遺伝子(ヒトHRAS)の代表的な400BP部分からの従来の配列決定データを示す。各バーは、ヌクレオチド位置に対応する。各バーの高さは、100,000倍を超える深さに対して配列決定されるとき、その位置での非参照塩基の対立遺伝子フラクションに対応する。全ての位置は、ある程度の頻度で変異するように見え、これらはほぼ全てがエラーである。
図16Bを参照すると、二本鎖配列決定で処理される場合、1つの変異だけが真であることが明らかになる。
【0211】
この実施例の実験的な分析の結果は、二本鎖配列決定が、ウレタンによる変異の誘発を非常に安定して、厳密な複製信頼区間で定量化することを示す。さらに、変異誘発の程度は、組織特異的であり、肺は、脾臓および血液よりも変異誘発されやすい。ウレタン曝露の単純な変異スペクトラムは、綺麗であり、バイアスのないクラスタリングは、群間を区別することができる。ウレタンの三重変異スペクトラムは、「NTG」のコンテキスト内のT→AおよびT→Cの変異に対する強い傾向を示し、変異スペクトラムは、ビヒクル対照(および他の変異原、実施例1を参照)から区別可能である。
【0212】
これに加え、末梢血における変異誘発は、脾臓でみられた変異誘発と非常に似ており、末梢血の生前サンプリングが、いくつかの変異原について、検死(または生検)の代替となる可能性があることを示唆する。さらに、この実施例は、ヒトHRAS導入遺伝子における癌性変異の選択の明確な証拠が、29日目であっても二本鎖配列決定を用いて示されることを示した。このホットスポットでの変異のスペクトラムは、この既知の変異原の影響を正確に反映していた。したがって、二本鎖配列決定は、将来の癌リスクのバイオマーカーとして初期癌ドライバー変異を評価することに関して、初期の正確なデータを提供することができる。異種混入は、きわめて低いレベルを維持していたが、外来種の汚染物質の除去は、自動的に信頼性高く行われた。
【0213】
実施例3
二本鎖配列決定を用いた哺乳動物ゲノムにおける変異原シグネチャの分析。この章は、二本鎖配列決定分析によって作成されたデータを使用し、識別変異原のための変異誘発性シグネチャを作成し、比較し、および/または変異原曝露を識別することができる例を記載する。
【0214】
癌における体細胞変異のカタログ(COSMIC)データベースは、ゲノム中に存在することが見出された変異の種類の固有の組み合わせとして規定される「変異シグネチャ」に対する参照を提供する。ヒトの体内の全ての細胞に存在し、生涯にわたって発生する体細胞変異。このような体細胞変異は、例えば、DNA複製機構の固有のわずかな失敗、外因性または内因性の変異原曝露、DNAの酵素による修飾および欠陥のあるDNA修復を含め、複数の変異プロセスの結果である。
【0215】
図17A~
図17Cは、COSMICからのシグネチャ1(
図17A)、シグネチャ4(
図17B)およびシグネチャ29(
図17C)についての隣接ヌクレオチドのコンテキストにおける変異スペクトラム(すなわち、トリヌクレオチドスペクトラム)を示すグラフである。
図17Aを参照すると、シグネチャ1は、全ての癌の種類においてみられ、5-メチル-シトシンの自発的な脱アミノ化によって引き起こされ、CpG部位でC>Tトランジションを生じるという病因が提案されている。
図17B~
図17Cを参照すると、シグネチャ4および29は、喫煙と相関関係にあり、タバコにおける主要な変異原であるベンゾ[a]ピレンによって生じる。パターンは類似しているが、シグネチャ4は、喫煙者の肺癌において最も頻繁に観察され、一方、シグネチャ29は、扁平上皮食道癌において主にみられ、喫煙者と、噛みタバコの使用者で最も頻繁にみられる。
【表4】
【0216】
表4は、本明細書で考察される実施例1および2から導かれる実験パラメータとデータを提供する。
図18は、公開された全30種類のCOSMICシグネチャおよび実施例1および2からの4種類のコホートスペクトラムの教師なし階層型クラスタリングを示す。クラスタリングは、重み付け(WGMA)方法とコサイン類似度による測定基準を用いて行われた。特に、ベンゾ[a]ピレン(BaP)は、シグネチャ4および29の両方に対して非常に類似しており、タバコの摂取または吸入によるBaP曝露と相関関係にある。ビヒクル対照(VC)は、5-メチル-シトシンの自発的な脱アミノ化に関係のあるパターンであるシグネチャ1と似ており、活性酸素種と5-メチル-シトシンの自発的な脱アミノ化の両方の変異誘発性の影響の混合を表すと考えられる。
【0217】
この実施例は、二本鎖配列決定を使用し、変異スペクトラム分析を作成することができ、識別および他の分析のために、この変異スペクトラム分析を既知の変異シグネチャと比較するか、または参照することができることを示す。
【0218】
適切な計算環境
以下の考察は、本開示の態様を実施可能な適切な計算環境の一般的な説明を提供する。必要とされるわけではないが、本開示の態様および実施形態は、汎用コンピュータ(例えば、サーバまたはパーソナルコンピュータ)によって実行されるルーチンなどのコンピュータで実行可能な命令の一般的な観点で記載される。当業者であれば、本開示を、インターネット家電、携帯機器、ウェアラブルコンピュータ、セルラーホンまたは携帯電話、マルチプロセッサシステム、マルチプロセッサを使用した家電またはプログラマブル家電、セットトップボックス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータなどを含む他のコンピュータシステム構成を用いて実施することができることを理解するだろう。本開示は、以下に詳細に説明するコンピュータで1つ以上の実行可能な命令を実行するように具体的にプログラミングされ、構成されているか、または構築された特殊用途のコンピュータまたはデータプロセッサで具現化されてもよい。実際に、「コンピュータ」という用語は、本明細書で一般的に使用される場合、上述のデバイスのいずれかだけではなく、任意のデータプロセッサを指す。
【0219】
本開示は、分散型計算環境でも実施可能であり、タスクまたはモジュールは、リモート処理デバイスによって行われ、これらは、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)またはインターネットなどの通信ネットワークを介して接続している。分散計算環境において、プログラムモジュールまたはサブルーチンは、ローカルメモリ記憶デバイスおよびリモートメモリ記憶デバイスの両方に配置されてもよい。以下に記載される本開示の態様は、チップ(例えば、EEPROMチップ)中のファームウェアに格納されているか、またはインターネットまたは他のネットワーク(無線ネットワークを含む)によって電子的に分散される磁気および光学的に読み取り可能かつ除去可能なコンピュータディスクを含め、コンピュータ可読媒体に格納されるか、または分散されてもよい。当業者は、本開示の一部が、サーバコンピュータに存在していてもよく、一方、対応する部分がクライアントコンピュータに存在していてもよいことを理解するだろう。本開示の態様に特有のデータ構造およびデータの伝送も、本開示の範囲内に包含される。
【0220】
コンピュータの実施形態(例えば、パーソナルコンピュータまたはワークステーション)は、1つ以上のユーザ入力デバイスおよびデータ格納デバイスに接続した1つ以上のプロセッサを備えていてもよい。コンピュータは、少なくとも1つの出力デバイス(例えば、表示デバイス)および1つ以上の任意要素のさらなる出力デバイス(例えば、プリンタ、プロッタ、スピーカ、触覚または嗅覚による出力デバイスなど)にも接続していてもよい。コンピュータは、例えば、任意要素のネットワーク接続、無線送受信機、またはこれら両方によって、外部のコンピュータに接続していてもよい。
【0221】
種々の入力デバイスは、キーボードおよび/またはポインティングデバイス(例えば、マウス)を備えていてもよい。マイクロホン、ジョイスティック、ペン、タッチスクリーン、スキャナ、デジタルカメラ、ビデオカメラ、など、他の入力デバイスが可能である。さらなる入力デバイスは、配列決定機(例えば、大規模並列シーケンサ)、蛍光鏡および他の実験機器などを備えていてもよい。適切なデータ記憶デバイスは、コンピュータによってアクセス可能なデータを格納することが可能な任意の種類のコンピュータ可読媒体、例えば、磁気ハードおよびフロッピーディスクドライブ、光学ディスクドライブ、磁気カセット、テープドライブ、フラッシュメモリカード、デジタルビデオディスク(DVD)、ベルヌーイカートリッジ、RAM、ROM、スマートカードなどを含んでいてもよい。実際に、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)またはインターネットなどのネットワークに対する接続ポートまたはノードを含め、コンピュータ可読命令およびデータを格納または送信するための任意の媒体を使用してもよい。
【0222】
本開示の態様は、種々の他の計算環境で実践され得る。例えば、ネットワークインターフェースを備える分散計算環境は、システムに1つ以上のユーザコンピュータを使用し、使用してもよく、この1つ以上のユーザコンピュータは、インターネットのワールドワイドウェブ部分内のウェブサイトを含め、コンピュータにアクセスとインターネットとのデータ交換を可能にするブラウザプログラムモジュールを含んでいてもよい。ユーザコンピュータは、他のプログラムモジュール(例えば、オペレーティングシステム)、1つ以上のアプリケーションプログラム(例えば、ワードプロセシングまたはスプレッドシートアプリケーション)などを含んでいてもよい。コンピュータは、種々の種類のアプリケーションを実行するようにプログラミング可能な汎用デバイスであってもよく、またはコンピュータは、特定の機能または機能群に最適化されるか、または限定される専用デバイスであってもよい。より重要なことに、ネットワークブラウザで示されるが、以下に詳細に記載されるように、ユーザにグラフィカルユーザインターフェースを提供するための任意のアプリケーションプログラムを使用してもよい。ウェブブラウザおよびウェブインターフェースの使用は、本明細書でよく知られている例としてのみ使用される。
【0223】
インターネットまたはワールドワイドウェブ(「ウェブ」)に接続した少なくとも1つのサーバコンピュータは、本明細書で記載する電子メッセージ(例えば、ウェブページ、データストリーム、音声信号および電子画像)を受信し、ルーティングし、格納するための機能の多くまたは全てを実行することができる。インターネットが示されているが、イントラネットなどのプライベートネットワークが、いくつかの用途では実際に好ましい場合がある。ネットワークは、クライアントサーバアーキテクチャを有していてもよく、このとき、コンピュータは、他のクライアントコンピュータにサービスを提供するための専用コンピュータであるか、またはピアツーピアなどの他のアーキテクチャを有していてもよく、このとき、1つ以上のコンピュータは、サーバおよびクライアントとして同時に機能する。サーバコンピュータ(1つ以上)に接続するデータベースまたは複数のデータベースは、ユーザコンピュータ間で交換されるウェブページおよびコンテンツの多くを格納することができる。データベース(1つ以上)を含むサーバコンピュータ(1つ以上)は、システムに対する悪意のある攻撃を阻止し、これに格納されるメッセージおよびデータの完全性を維持するためのセキュリティ対策(例えば、ファイアウォールシステム、セキュアソケットレイヤ(SSL)、パスワード保護システム、暗号化など)を採用していてもよい。
【0224】
適切なサーバコンピュータは、特に、サーバエンジン、ウェブページ管理要素、コンテンツ管理要素およびデータベース管理要素を備えていてもよい。サーバエンジンは、基本的な処理と、オペレーションシステムレベルタスクを実行する。ウェブページ管理要素は、ウェブページの作成および表示またはルーティングを処理する。ユーザは、これに関連付けられたURLを用い、サーバコンピュータにアクセスしてもよい。コンテンツ管理要素は、本明細書に記載する実施形態の機能の大部分を処理する。データベース管理要素は、データベースに関する格納および検索タスク、データベースへのクエリ、データベースの読み込み書き出し機能、および動画、グラフィックおよび音響信号などのデータの格納を含む。
【0225】
本明細書に記載される機能ユニットの多くは、それらの実装独立性をより特定的に強調するために、モジュールと分類されている。例えば、モジュールは、様々な種類のプロセッサによる実行のためのソフトウェアで実装され得る。実行可能コードの識別されたモジュールは、例えば、コンピュータ命令の1つ以上の物理ブロックまたは論理ブロックを含み、この1つ以上の物理ブロックまたは論理ブロックは、例えば、オブジェクト、手順または機能として整理され得る。コンピュータ命令の識別されたブロックは、物理的に一緒に配置される必要はないが、異なる位置に格納される異なる命令を含んでいてもよく、論理的に一緒に結びつけられると、モジュールを含み、そのモジュールの述べられている目的を達成する。
【0226】
モジュールはまた、カスタムVLSI回路またはゲートアレイ、論理チップなどの既製品の半導体、トランジスタまたは他の別個の要素を含むハードウェア回路として実装されてもよい。モジュールはまた、フィールドプログラマブルゲートアレイ、プログラマブルアレイロジック、プログラマブルロジックデバイスなどのプログラマブルハードウェアデバイスにも実装され得る。
【0227】
実行可能コードのモジュールは、単一の命令、または多くの命令であってもよく、異なるプログラムの中で、いくつかのメモリデバイスにわたって、いくつかの異なるコードセグメントに分散されてもよい。同様に、操作データは、操作データは、本明細書ではモジュール内で識別され、示されていてもよく、任意の適切な形態で具現化され、任意の適切な種類のデータ構造に整理されていてもよい。操作データは、単一のデータセットとして集められてもよく、または異なる記憶デバイスを含む、異なる場所に分散されてもよく、システムまたはネットワークに対する単なる電子信号として少なくとも部分的に存在していてもよい。
【0228】
遺伝毒性検査のためのシステム
本発明は、さらに、被験体のサンプルを処理し、有線または無線のネットワークを介して配列決定データをリモートサーバに送信して、サンプルのエラー修正済配列リード(例えば、二本鎖配列リード、二本鎖コンセンサス配列など)、変異スペクトラム、変異体頻度、三重変異シグネチャ、サンプルデータと1つ以上の既知の遺伝毒性物質と関連付けられた対応するデータとの間に類似性が存在するかどうかを決定するシステム(例えば、ネットワーク型コンピュータシステム、高スループット自動化システムなど)を含む。
【0229】
以下にさらに詳細に説明されるように、また、
図19に示される実施形態に関して、遺伝毒性物質のコンピュータを用いたシステムは、(1)リモートサーバと、(2)配列決定データを作成および/または送信することが可能な複数のユーザ電子計算デバイスと、(3)既知の遺伝毒性物質プロファイルおよび関連する情報を含むデータベース(任意要素)と、(4)電子計算デバイスとデータベースとリモートサーバとの間の電子通信を伝送するための有線または無線のネットワークとを備える。リモートサーバは、さらに、(a)ユーザの遺伝毒性物質の記録結果と遺伝毒性物質プロファイル(例えば、スペクトラム、頻度、作用機序など)の記録を格納するデータベースと、(b)メモリに通信可能に接続された1つ以上のプロセッサと、プロセッサのための命令を含む、1つ以上の一時的でないコンピュータ可読記録デバイスまたは媒体とを備えており、ここで、プロセッサは、
図20~23に記載される1つ以上の工程を含む操作を行うための上述の命令を実行するように構成されている。
【0230】
一実施形態において、本技術は、1つ以上のプロセッサによって実行されるとき、被験体が少なくとも1つの遺伝毒性物質に曝露されるかどうか、および/または少なくとも1つの遺伝毒性物質の同一性もしくは性質/特徴を決定するための方法を実行する命令を含む一時的でないコンピュータ可読記憶媒体をさらに含む。特定の実施形態において、この方法は、
図20~23に記載の1つ以上の工程を含んでいてもよい。
【0231】
本技術のさらなる態様は、被験体が少なくとも1つの遺伝毒性物質に曝露されるかどうか、および/または少なくとも1つの遺伝毒性物質の同一性もしくは性質/特徴を決定するためのコンピュータを用いた方法を対象とする。特定の実施形態において、この方法は、
図20~23に記載の1つ以上の工程を含んでいてもよい。
【0232】
図19は、コンピュータプログラム製品1950がインストールされた、遺伝毒性物質曝露から生じる変異誘発事象および/または核酸損傷事象を識別するための本明細書に開示される方法および/またはキットと共に使用するためのコンピュータシステム1900のブロック図である。
図19は、種々の計算システムの構成要素を示しているが、当業者にとって既知の他の構成要素または異なる構成要素(例えば上述のもの)が、本開示の態様が実施され得る適切な計算環境を提供し得ることが想定される。
図20は、本技術の一実施形態に従う、二本鎖配列決定コンセンサス配列データを提供するためのルーチンを示すフロー図である。
図21~
図23は、サンプルの遺伝毒性物質曝露から生じる変異誘発事象および/または核酸損傷事象を識別するための種々のルーチンを示すフロー図である。本技術の態様に従い、
図21~
図23に関して記載される方法は、例えば、サンプルの変異スペクトラム、変異体頻度、三重変異スペクトラム、サンプルデータと既知の遺伝毒性物質のデータセットとの比較から導き出される情報を含む、サンプルデータを提供することができる。
【0233】
図19に示されるように、コンピュータシステム1900は、複数のユーザ計算デバイス1902、1904と、有線または無線のネットワーク1910と、サンプルの遺伝毒性物質曝露から生じる変異誘発事象および/または核酸損傷事象を分析するためのプロセッサを備えるリモートサーバ(「DupSeq(商標)サーバ」)1940とを備えていてもよい。複数の実施形態において、ユーザ計算デバイス1902、1904を使用し、配列決定データを作成および/または送信することができる。一実施形態において、計算デバイス1902、1904のユーザは、遺伝毒性を評価するための被験体サンプルの二本鎖配列決定方法の工程など、本技術の他の態様を行うユーザであってもよい。一例では、計算デバイス1902、1904のユーザは、本技術の一実施形態に従い、試薬および/またはアダプターを含むキット(1、2)を用いた特定の二本鎖配列決定方法の工程を行い、被験体サンプルをインテロゲーションする。
【0234】
図示されるように、各ユーザ計算デバイス1902、1904は、少なくとも1つの中央処理装置1906と、メモリ1907と、ユーザとネットワークのインターフェース1908とを備える。一実施形態において、ユーザデバイス1902、1904は、デスクトップ、ラップトップまたはタブレットコンピュータを含む。
【0235】
2つのユーザ計算デバイス1902、1904が示されているが、任意の数のユーザ計算デバイスがシステム1900の他の構成要素に含まれていてもよく、または接続されていてもよいことが想定される。これに加え、計算デバイス1902、1904はまた、サンプルを増幅させ、配列決定するためのユーザ(1)およびユーザ(2)によって使用される複数のデバイスおよびソフトウェアの代表であってもよい。例えば、計算デバイスは、配列決定機(例えば、Illumina HiSeg(商標)、Ion Torrent PGM、ABI SOLiD(商標)シーケンサ、PacBio RS、Helicos Heliscope(商標)など)、リアルタイムPCR機(例えば、ABI 7900、Fluidigm BioMark(商標)など)、マイクロアレイ機器などであってもよい。
【0236】
上述の構成要素に加え、システム1900は、さらに、遺伝毒性物質プロファイルおよび関連する情報を格納するためのデータベース1930を備えていてもよい。例えば、サーバ1940によってアクセス可能なデータベース1930は、複数の既知の遺伝毒性物質についての変異スペクトラム、三重変異スペクトラム/シグネチャ、作用機序などの記録または集合を含んでいてもよく、それぞれの格納された遺伝毒性物質の変異プロファイル/パターンに関する追加情報も含んでいてもよい。特定の例では、データベース1930は、遺伝毒性物質プロファイルを含む第三者のデータベース1932であってもよい。例えば、癌における体細胞変異のカタログ(Catalogue of Somatic Mutations in Cancer:COSMIC)のウェブサイトは、発癌物質への曝露から生じた腫瘍におけるクローン変異として見出された「変異スペクトラム」の集合を含む(例えば、喫煙者における肺癌)[8、9]。別の実施形態において、このデータベースは、サーバ1940とは別個にホスティングされたスタンドアロンデータベース1930(プライベートであるか、またはプライベートではないもの)であってもよく、またはデータベースは、サーバ1940上にホスティングされていてもよく(例えばデータベース1970)、経験的に導き出された遺伝毒性物質プロファイル1972を含む。いくつかの実施形態において、システム1900を使用して新しい試験薬剤/因子プロファイルを作成するとき、システム1900および関連する方法(例えば、本明細書に記載される方法、例えば、
図20~23に記載される方法)の使用から作成されるデータを、データベース1930および/または1970にアップロードしてもよく、そのため、さらなる遺伝毒性物質プロファイル1932、1972が、将来の比較作業のために作成されてもよい。
【0237】
サーバ1940は、ユーザ計算デバイス1902、1904からの配列決定データ(例えば、生の配列決定ファイル)および関連する情報を、ネットワーク1910を介して受信し、計算し、分析するような構成であってもよい。サンプル特有の生配列決定データは、デバイス1902、1904にインストールされているか、またはネットワーク1910を介してリモートサーバ1940からアクセス可能であるコンピュータプログラム製品/モジュール(配列モジュール1905)を用いて、または当該技術分野でよく知られている他の配列決定ソフトウェアを用いて、ローカルに計算されてもよい。次いで、生の配列データは、ネットワーク1910を介してリモートサーバ1940に送信されてもよく、ユーザ結果1974は、データベース1970に格納されてもよい。サーバ1940は、データベース1970から生の配列決定データを受信するような構成であり、また、例えば、本明細書に開示される二本鎖配列決定技術を用いてエラー修正済二本鎖配列リードを計算によって作成するような構成であるプログラム製品/モジュール「DSモジュール」1912も含む。DSモジュール1912は、サーバ1940上に示されているが、当業者は、DSモジュール1912がこれに代えてデバイス1902、1904に、または別のリモートサーバ(図示せず)上にホスティングされてもよいことを理解するだろう。
【0238】
リモートサーバ1940は、少なくとも1つの中央処理装置(CPU)1960と、ユーザとネットワークのインターフェース1962(またはサーバにインターフェース接続したサーバ専用の計算デバイス)と、データベース1970(例えば上述のもの)とを備えていてもよく、データベース1970には、既知の遺伝毒性物質および新規遺伝毒性物質の変異プロファイル1972を格納するための複数のコンピュータファイル/記録および試験されるサンプルについての結果(例えば、生の配列決定データ、二本鎖配列決定データ、遺伝毒性分析など)1974を格納するためのファイル/記録を含む。サーバ1940は、さらに、本技術の態様に従い、遺伝毒性物質コンピュータプログラム製品(遺伝毒性物質モジュール)1950を格納したコンピュータメモリ1911を備える。
【0239】
コンピュータプログラム製品/モジュール1950は、一時的でないコンピュータ可読媒体で具現化され、コンピュータ(例えば、サーバ1940)上で実行されるとき、遺伝毒性物質を検出し、識別するための本明細書に開示される方法の工程を行う。本開示の別の態様は、プロセッサに遺伝毒性分析(例えば、計算した変異体頻度、変異スペクトラム、三重変異スペクトラム、遺伝毒性物質比較レポート、閾値レベルレポートなど)を行わせることを可能にするように具現化されたコンピュータ可読プログラムコードまたは命令を有する一時的でないコンピュータ可読媒体を含むコンピュータプログラム製品/モジュール1950を備える。これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能な装置にロードされて機械を生成してもよく、その結果、コンピュータまたは他のプログラム可能な装置で実行する命令は、本明細書に記載の機能または工程を実施する手段を作成する。これらのコンピュータプログラム命令はまた、コンピュータまたは他のプログラム可能な装置に特定の様式で機能させるように命令し得るコンピュータ可読メモリまたは媒体に格納されてもよく、その結果、コンピュータ可読メモリまたは媒体に格納される命令は、分析を実施する命令手段を含む製造物品を生成する。コンピュータプログラム命令はまた、コンピュータまたは他のプログラム可能な装置にロードされ、コンピュータまたは他のプログラム可能な装置で行われる一連の操作工程により、コンピュータまたは他のプログラム可能な装置で実行する命令が上述の機能または工程を実施するための工程を提供するような、コンピュータで実施されるプロセスを生成してもよい。
【0240】
さらに、コンピュータプログラム製品/モジュール1950は、任意の適切な言語および/またはブラウザで実施されてもよい。例えば、Python、C言語で実施されてもよく、好ましくは、オブジェクト指向高レベルプログラミング言語、例えば、Visual Basic、SmallTalk、C++などを用いて実施されてもよい。アプリケーションは、Windows(商標)98、Windows(商標)2000、Windows(商標)NTなどを含むMicrosoft Windows(商標)環境などの環境に適するように書かれていてもよい。これに加え、アプリケーションは、MacIntosh(商標)、SUN(商標)、UNIXまたはLINUX環境のために書かれていてもよい。これに加え、機能工程は、ユニバーサルプログラミング言語またはプラットフォームに依存しないプログラミング言語を用いて実施されてもよい。このようなマルチプラットフォームプログラミング言語の例として、限定されないが、ハイパーテキストマークアップランゲージ(HTML)、JAVA(商標)、JavaScript(商標)、フラッシュプログラミング言語、コモンゲートウェイインターフェース/ストラクチャードクエリーランゲージ(CGI/SQL)、プラクティカルエクストラクションレポートランゲージ(PERL)、AppleScript(商標)および他のシステムスクリプト言語、プログラミングランゲージ/ストラクチャードクエリーランゲージ(PL/SQL)などが挙げられる。Java(商標)またはJavaScript(商標)に対応するブラウザ、例えば、HotJava(商標)、Microsoft(商標)Explorer(商標)またはNetscape(商標)を使用してもよい。アクティブコンテンツウェブページが使用される場合、Java(商標)アプレットまたはActive(商標)コントロールまたは他のアクティブコントロール技術を含んでいてもよい。
【0241】
システムは、多くのルーチンを呼び出す。ルーチンのいくつかが本明細書に記載されるが、当業者は、システムが実行することができる他のルーチンを識別することができる。さらに、本明細書に記載されるルーチンは、様々な様式で変更することができる。例として、例示されるロジックの順序を並べ替えてもよく、サブ工程を並列に実行してもよく、例示されるロジックを省略してもよく、他のロジックを含んでもよい、など。
【0242】
図20~
図23は、サンプルの遺伝毒性物質曝露から生じる変異誘発事象および/または核酸損傷事象を検出し、識別するためのルーチン2000、2100、2200、2300を示すフロー図である。
図20は、サンプル(例えば、遺伝毒性アッセイからのサンプル)中の二本鎖核酸分子についての二本鎖配列決定データを提供するためのルーチン2000を示すフロー図である。ルーチン2000は、計算デバイス(例えば、クライアントコンピュータまたはコンピュータネットワークに接続するサーバコンピュータ)によって呼び出されてもよい。一実施形態において、計算デバイスは、配列データ作成部および/または配列モジュールを含む。一例として、計算デバイスは、操作者が計算デバイスと通信するユーザインターフェースに接続した後、ルーチン2000を呼び出してもよい。
【0243】
ルーチン2000は、ブロック2002で開始し、配列モジュールは、ユーザ計算デバイスから生の配列データを受信し(ブロック2004)、サンプル中の複数の核酸分子に由来する複数の生の配列リードを含むサンプル特有のデータセットを作成する(ブロック2006)。いくつかの実施形態において、サーバは、後で処理するために、データベースにサンプル特有のデータセットを格納することができる。次に、DSモジュールは、サンプル特有のデータセット中の生の配列データから二本鎖コンセンサス配列決定データを作成するための要求を受信する(ブロック2008)。DSモジュールは、元の二本鎖核酸分子を表すファミリーからの配列リードを(例えばSMI配列に基づいて)グループ分けし、個々の鎖からの代表的な配列を互いに比較する(ブロック2010)。一実施形態において、代表的な配列は、それぞれの元の核酸分子からの1つまたは1つより多い配列リードであってもよい。別の実施形態において、代表的な配列は、代表的な鎖内のアラインメントおよびエラー修正から作成される一本鎖コンセンサス配列など(SSCS)であってもよい。このような実施形態において、第1の鎖からのSSCSを、第2の鎖からのSSCSと比較することができる。
【0244】
ブロック2012で、DSモジュールは、比較した代表的な鎖間で相補性を有するヌクレオチド位置を識別する。例えば、DSモジュールは、比較した(例えば、アラインメントされた)配列リードに沿って、ヌクレオチド塩基コールが一致するヌクレオチド位置を識別する。さらに、DSモジュールは、比較した代表的な鎖間で相補性を有しない位置を識別する(ブロック2014)。同様に、DSモジュールは、比較した(例えば、アラインメントされた)配列リードに沿って、ヌクレオチド塩基コールが一致しないヌクレオチド位置を識別することができる。
【0245】
次に、DSモジュールは、サンプル中の二本鎖核酸分子について二本鎖配列決定データを提供することができる(ブロック2016)。このようなデータは、処理された配列リードそれぞれについて、二本鎖コンセンサス配列の形態であってもよい。二本鎖コンセンサス配列は、一実施形態において、元の核酸分子のそれぞれの鎖からの代表的な配列が一致しているヌクレオチド位置のみを含んでいてもよい。したがって、一実施形態において、一致しない位置は、エラー修正された二本鎖コンセンサス配列が高度に正確な配列リードであるように、除外されるか、または考慮に入れられなくてもよい。別の実施形態において、二本鎖配列決定データは、一致しないヌクレオチド位置をさらに分析することができるように(例えば、DNA損傷を評価することができる場合に)、一致しないヌクレオチド位置に対するレポート情報を含んでいてもよい。ルーチン2000は、次いで、ブロック2018に続いてもよく、ブロック2018で終了する。
【0246】
図21は、サンプルの遺伝毒性物質曝露から生じる変異誘発事象を検出し、識別するためのルーチン2100を示すフロー図である。このルーチンは、図
19の計算デバイスによって呼び出すことができる。ルーチン2100は、ブロック2102で開始し、遺伝毒性物質モジュールは、
図20からの二本鎖配列決定データ(例えば、ブロック2016の後)と参照配列情報とを比較し(ブロック2104)、変異(例えば、被験体の配列が参照配列から変化している)を識別する(ブロック2106)。次に、遺伝毒性物質モジュールは、そのサンプルについて、変異体頻度を決定し(ブロック2108)、変異スペクトラムを作成する(ブロック2110)。このように、変異パターン分析は、このサンプルから分析された核酸分子における変異事象の種類、位置および頻度に関する情報と共に提供されてもよい。任意に、遺伝毒性物質モジュールは、曝露の遺伝毒性結果を分析するためのトリヌクレオチドコンテキストおよびパターン情報を提供する三重変異スペクトラムを作成してもよい(ブロック2112)。
【0247】
遺伝毒性物質モジュールはまた、任意に、変異スペクトラムおよび/または三重変異スペクトラム(決定された場合)と、複数の既知の遺伝毒性物質データセット(例えば、データベース内の遺伝毒性物質プロファイル記録に格納されているもの)とを比較し(ブロック2114)、例えば、そのサンプルが既知の遺伝毒性物質に曝露されたかどうかを決定してもよく、または別の例では、試験薬剤/因子が、既に知られている遺伝毒性物質と類似した遺伝毒性物質プロファイルを有するかどうかを決定してもよい。任意に、遺伝毒性物質モジュールは、部分的には比較情報に基づき、遺伝毒性物質の可能性のある作用機序を決定してもよい(ブロック2116)。次に、遺伝毒性物質モジュールは、データベース中のサンプル特有のデータセットに格納され得る遺伝毒性データを提供することができる(ブロック2118)。いくつかの実施形態において、図示されないが、遺伝毒性データを使用し、将来の比較作業のためにデータベースに格納される遺伝毒性物質プロファイルを作成してもよい。ルーチン2100は、次いで、ブロック2120に続いてもよく、ブロック2120で終了する。
【0248】
図22は、サンプルの遺伝毒性物質曝露から生じるDNA損傷事象を検出し、識別するためのルーチン2200を示すフロー図である。このルーチンは、図
19の計算デバイスによって呼び出すことができる。ルーチン2200は、
図20のブロック2014で開始し、決定ブロック2202で、ルーチン2200は、相補性を有しないヌクレオチド位置がプロセスエラーであるかどうかを決定する。様々な実施形態において、元のDNA分子の両方の鎖の配列リード間の一致しない位置かどうかを決定するためのパラメータは、操作者によって、DNA損傷の既知の特徴によって、プロセスエラーの既知の特徴によって、ミスマッチが表される最低限の数の配列リードなどによって特定されてもよい。
【0249】
ヌクレオチド位置がプロセスエラーであると決定された場合(DNA抽出の前のインビボDNA損傷の部位とは対照的に)、DSモジュールは、相補性を有しないこのようなヌクレオチド位置を除外してもよく、または考慮に入れなくてもよい(ブロック2204)。ルーチン2200は、
図20のブロック2016に続いてもよい。
【0250】
決定ブロック2202に戻って参照し、ヌクレオチド位置がプロセスエラーではないと決定された場合、遺伝毒性物質モジュールは、相補性を有しないこのようなヌクレオチド位置を、例えば遺伝毒性物質への曝露から生じるインビボDNA損傷の可能性がある部位であると識別してもよい(ブロック2206)。識別の後、遺伝毒性物質モジュールは、データベース中のサンプル特有のデータセットと関連付けられるDNA損傷レポートを作成してもよい(ブロック2208)。いくつかの実施形態において、DNA損傷レポーを使用し、潜在的な遺伝毒性物質(図示せず)の作用機序を推測してもよい。ルーチン2200は、
図20のブロック2016に続いてもよい。
【0251】
図23は、被験体における発癌物質または発癌物質曝露を検出し、識別するためのルーチン2300を示すフロー図である。ルーチン2300は、図
19の計算デバイスによって呼び出すことができる。ルーチン2300は、ブロック2302で開始し、遺伝毒性物質モジュールは、
図20からの二本鎖配列決定データ(例えば、ブロック2016の後)と、任意に
図21からの遺伝毒性データ(例えば、ブロック2116の後)を受信し、そのサンプルが遺伝毒性物質に曝露されたことを確認する(ブロック2304)。次に、遺伝毒性物質モジュールは、標的ゲノム領域(例えば遺伝子)の配列内のバリアントを識別する(ブロック2306)。例えば、遺伝毒性物質モジュールは、特定の遺伝子座(例えば、癌ドライバー遺伝子、癌遺伝子など)で二本鎖配列決定データおよび遺伝毒性データを分析してもよい。次いで、遺伝毒性物質モジュールは、バリアント対立遺伝子頻度(VAF)を計算する(ブロック2308)。
【0252】
決定ブロック2310で、ルーチン2300は、VAFが、対照群よりも試験群の方が高いかどうかを決定する。試験群のVAFが対照群よりも高くない場合、遺伝毒性物質モジュールは、その薬剤に、発癌物質の疑いを下げてラベリングする(ブロック2312)。ルーチン2300は、次いで、ブロック2314に続いてもよく、ブロック2314で終了する。VAFが、対照群よりも試験群の方が高い場合、ルーチン2300は、決定ブロック2316に続き、決定ブロック2316でルーチン2300は変異が非シングレットかどうかを決定する。
【0253】
変異がシングレットである場合、遺伝毒性物質モジュールは、その薬剤を、発癌物質である疑いが中レベルであると特性決定する(ブロック2318)。変異が非シングレット(すなわち、マルチプレット)であると決定される場合、このルーチンは、決定ブロック2320に続き、ルーチン2300は、バリアントが標的遺伝子で検出されるかどうか、そのバリアントがドライバー変異(例えば、癌成長/転換を起こさせることが知られている変異)と一致するかどうかを決定する。
【0254】
変異がドライバー変異ではない場合、遺伝毒性物質モジュールは、その薬剤を、発癌物質である疑いが中レベルであると特性決定する(ブロック2318)。変異体(1つ以上)が、ドライバー変異と一致する場合、遺伝毒性物質モジュールは、その薬剤を、発癌物質である疑いが高レベルであると特性決定する(ブロック2322)。
【0255】
疑いが中レベルであると特性決定された薬剤(ブロック2318で)、または疑いが高レベルであると特性決定された薬剤(ブロック2318で)、遺伝毒性物質モジュールは、発癌物質についての安全性閾値を評価し、および/または被験体において曝露後の遺伝毒性物質に関連する疾患または障害が発症することに関連するリスクを決定してもよい(ブロック2324)。ルーチン2300は、次いで、ブロック2314に続いてもよく、ブロック2314で終了する。
【0256】
他の工程およびルーチンも、本技術によって想定される。例えば、システム(例えば、遺伝毒性物質モジュールまたは他のモジュール)は、遺伝毒性物質データを分析し、被験体が遺伝毒性物質に曝露されたかどうか、試験薬剤/因子が遺伝毒性であるかどうかを決定し、どのような特徴があれば遺伝毒性物質が変異誘発性または発癌性であるかを決定するなどの構成であってもよい。他の工程は、特定の被験体の生体サンプルから導き出された遺伝毒性物質データに基づき、被験体が予防的または治療的に処置されるべきであるかどうかを決定することを含んでいてもよい。例えば、遺伝毒性物質(1つ以上)が、このシステムを用いて識別されると、サーバは、その被験体が、遺伝毒性物質の安全閾値レベルを超えて曝露されたかどうかを決定することができる。遺伝毒性物質の安全閾値レベルを超えて曝露されている場合、予防的または抑制的な疾患処置が開始されてもよい。
さらなる例
1.被験体が変異原に曝露した後に被験体においてインビボで発生したゲノム変異を検出し、定量化するための方法であって、
被験体からのサンプルであって、二本鎖DNA分子を含むサンプルを提供することと、
サンプル中の複数の二本鎖DNA分子のそれぞれについてのエラー修正済配列リードを作成することであって、
アダプター-DNA分子の元の第1の鎖のコピーのセットおよびアダプター-DNA分子の元の第2の鎖のコピーのセットを作成すること、
元の第1の鎖および第2の鎖のコピーのセットを配列決定して、第1の鎖配列および第2の鎖配列を提供すること、ならびに
第1の鎖配列と第2の鎖配列とを比較して、第1の鎖配列と第2の鎖配列との間の1つ以上の対応関係を識別することを含む、エラー修正済配列リードを作成することと、
1つ以上の対応関係を分析して、サンプル中の二本鎖DNA分子の変異スペクトラムを決定することと、を含む、方法。
2.配列決定された二本鎖塩基対あたりの固有の変異数を計算することによって、標的二本鎖DNA分子の変異体頻度を計算することをさらに含む、例1に記載の方法。
3.標的二本鎖DNA分子が、被験体の肝臓、脾臓、血液、肺または骨髄から抽出された、例1に記載の方法。
4.被験体が、標的二本鎖DNA分子が被験体から取り出される前の30日以内に変異原に曝露された、例1に記載の方法。
5.変異スペクトラムが、教師なし階層型変異スペクトラムクラスタリングによって作成される、例1に記載の方法。
6.変異スペクトラムが、三重変異スペクトラムである、例1に記載の方法。
7.複数の二本鎖DNA分子のそれぞれについてのエラー修正済配列リードを作成することが、1つ以上の標的ゲノム領域のエラー修正済配列リードを作成することを含む、例1に記載の方法。
8.1つ以上の標的ゲノム領域が、ゲノム中の変異を起こしやすい部位である、例7に記載の方法。
9.1つ以上の標的ゲノム領域が、既知の癌ドライバー遺伝子である、例7に記載の方法。
10.被験体がトランスジェニック動物であり、標的二本鎖DNA分子の少なくともいくつかが、導入遺伝子の1つ以上の部分を含む、例1に記載の方法。
11.被験体が非トランスジェニック動物であり、標的二本鎖DNA分子が、内因性ゲノム領域を含む、例1に記載の方法。
12.被験体がヒトであり、標的二本鎖DNA分子が、ヒトから採取される採血物から抽出される、例1に記載の方法。
13.試験薬剤の変異誘発性シグネチャを作成するための方法であって、
試験薬剤に曝露された試験被験体から抽出されたDNAフラグメントを二本鎖配列決定することと、
試験薬剤の変異誘発性シグネチャを作成することとを含み、作成することが、
配列決定された二本鎖塩基対あたりの固有の変異数を計算することによって、複数のDNAフラグメントの変異体頻度を計算することと、
複数のDNAフラグメントの変異パターンであって、変異の種類、変異トリヌクレオチドコンテキストおよび変異のゲノム分布を含む、変異パターンを決定することと、を含む、方法。
14.試験薬剤の変異シグネチャを、1つ以上の既知の遺伝毒性物質の変異シグネチャと比較することをさらに含む、例13に記載の方法。
15.試験薬剤の変異シグネチャが、組織の種類、試験薬剤への曝露レベル、ゲノム領域および被験体の種類のうちの1つ以上に基づいて変化する、例13に記載の方法。
16.被験体の種類が、培養中に成長したヒト細胞である、例15に記載の方法。
17.試験動物が、動物を安楽死させる前の30日以内に試験化合物に曝露された、例13に記載の方法。
18.変異誘発性シグネチャが、計算パターンマッチングによって作成される、例13に記載の方法。
19.変異シグネチャが、三重変異シグネチャである、例13に記載の方法。
20.DNAフラグメントを二本鎖配列決定することは、1つ以上の標的ゲノム領域を二本鎖配列決定することを含む、例13に記載の方法。
21.1つ以上の標的ゲノム領域が、ゲノム中の変異を起こしやすい部位である、例20に記載の方法。
22.1つ以上の標的ゲノム領域が、既知の癌ドライバー遺伝子である、例20に記載の方法。
23.試験動物がトランスジェニック動物であり、DNAフラグメントのうちの少なくともいくつかが、導入遺伝子の1つ以上の部分を含む、例13に記載の方法。
24.試験動物が非トランスジェニック動物であり、DNAフラグメントが、内因性ゲノム領域を含む、例13に記載の方法。
25.試験薬剤の遺伝毒性の可能性を評価するための方法であって、
(a)試験薬剤に曝露された生体源からの複数の二本鎖DNAフラグメントを含むサンプルから配列決定ライブラリを調製することであって、複数の二本鎖DNAフラグメントに非対称アダプター分子をライゲーションして、複数のアダプター-DNA分子を作成することを含む、配列決定ライブラリを調製することと、
(b)アダプター-DNA分子の第1の鎖および第2の鎖を配列決定して、それぞれのアダプター-DNA分子について第1の鎖配列リードおよび第2の鎖配列リードを提供することと、
(c)それぞれのアダプター-DNA分子について、第1の鎖配列リードと第2の鎖配列リードとを比較して、第1の鎖配列リードと第2の鎖配列リードとの間の1つ以上の対応関係を識別することと、
(d)それぞれのアダプター-DNA分子について第1の鎖配列リードと第2の鎖配列リードとの間の1つ以上の対応関係を分析することによって、試験薬剤の変異シグネチャを決定して、サンプル中の変異パターン、変異の種類、変異体頻度、変異の種類の分布および変異のゲノム分布のうちの少なくとも1つを決定することと、
(e)試験薬剤の変異シグネチャと、既知の遺伝毒性物質に由来する複数の変異スペクトラムとを比較して、変異シグネチャが、既知の遺伝毒性物質からの変異スペクトラムと十分に類似しているかどうかを決定すること、または
(f)変異体頻度、変異の種類、または変異の種類の分布のうちの少なくとも1つが、安全閾値レベルを超えているかどうかを評価すること、または
(g)変異体頻度が、安全閾値変異体頻度を超えるかどうかを決定することと、を含む、方法。
26.試験薬剤の変異シグネチャが、安全閾値頻度を超える変異体頻度を含む、例25に記載の方法。
27.試験薬剤の変異シグネチャが、既知の癌関連変異パターンと十分に類似する変異パターンを含む、例25に記載の方法。
28.生体源が、培養中に成長した細胞、動物、ヒト、ヒト細胞株、トランスジェニック動物、非トランスジェニック動物、ヒト組織サンプルまたはヒト血液サンプルのうちの少なくとも1つである、例25に記載の方法。
29.生体源が、複数の二本鎖DNAフラグメントを含むサンプルを抽出する前の30日以内に試験薬剤に曝露された、例25に記載の方法。
30.変異シグネチャが、三重変異シグネチャである、例25に記載の方法。
31.第1の鎖配列リードと第2の鎖配列リードとを比較する前に、方法が、アダプター配列、配列リード長さおよび元の鎖の情報のうちの1つ以上を用いて第1の鎖配列リードと第2の鎖配列リードとを関連付けることを含む、例25に記載の方法。
32.配列決定ライブラリを調製する前に、方法が、生体源を試験薬剤に曝露することをさらに含む、例25に記載の方法。
33.生体源を試験薬剤に曝露する前に、生体源が、癌組織であるか、または癌組織を含む、例32に記載の方法。
34.生体源を試験薬剤に曝露する前に、生体源が、健康な組織であるか、または健康な組織を含む、例32に記載の方法。
35.サンプルが、血液サンプルであるか、または血液サンプルを含む、例25に記載の方法。
36.サンプルが、癌細胞株であるか、または癌細胞株を含む、例25に記載の方法。
37.生体源が、癌細胞を含み、物質が、癌細胞の少なくとも一部に対する選択的遺伝毒性について試験される、例25に記載の方法。
38.物質が治療化合物である、例37に記載の方法。
39.治療化合物の選択的遺伝毒性に感受性であることが示されている癌細胞の一部について、方法が、治療化合物に曝露する前に、癌細胞の一部について変異体頻度および変異スペクトラムのうちの1つ以上を決定することをさらに含む、例38に記載の方法。
40.試験薬剤が、食品、薬物、ワクチン、化粧用物質、工業用添加剤、工業副産物、石油蒸留物、重金属、家庭用洗浄剤、空気中微粒子、製造業の副産物、汚染物質、可塑剤、洗剤、放射線発生製品、タバコ製品、化学物質または生物材料を含む、例25に記載の方法。
41.遺伝毒性薬剤への被験体の曝露を決定するための方法であって、
被験体のDNA変異スペクトラムと、既知の変異誘発性化合物の変異スペクトラムとを比較することと、
被験体のDNA変異スペクトラムに最も類似する既知の変異誘発性化合物の変異スペクトラムを識別することと、を含む、方法。
42.被験体のDNA変異スペクトラムが、二本鎖配列決定によって評価される、例41に記載の方法。
43.被験体のDNA変異スペクトラムが、患者の血液から抽出されたDNAから作成される、例41に記載の方法。
44.被験体のDNA変異スペクトラムが、三重変異スペクトラムである、例41に記載の方法。
45.被験体のDNAを配列決定して、被験体のDNA変異スペクトラムを作成することをさらに含む、例41に記載の方法。
46.被験体のDNAを配列決定することは、1つ以上の既知の癌ドライバー遺伝子を配列決定することを含む、例45に記載の方法。
47.二本鎖ポリヌクレオチドのエラー修正二本鎖配列決定をして遺伝毒性物質を識別する際に使用可能なキットであって、キットは、
エラー修正二本鎖配列決定実験において使用可能な、ポリメラーゼ連鎖反応(PCR)プライマーの少なくとも1つのセットおよびアダプター分子の少なくとも1つのセットと、
被験体のサンプルから抽出されたDNAのエラー修正二本鎖配列決定を行い、被験体が少なくとも1つの遺伝毒性物質に曝露されたかどうかを識別する際のキットの使用方法に関する説明書と、を含む、キット。
48.試薬が、DNA修復酵素を含む、例47に記載のキット。
49.アダプター分子のセット中のそれぞれのアダプター分子が、少なくとも1つの単一分子識別子(SMI)配列および少なくとも1つの鎖定義要素を含む、例47に記載のキット。
50.コンピュータ上で実行されるとき、サンプル中の1つ以上の二本鎖DNA分子について、エラー修正済二本鎖配列決定リードを決定する工程と、エラー修正済二本鎖配列決定リードを使用して、少なくとも1つの遺伝毒性物質の変異体頻度、変異スペクトラムおよび/または三重スペクトラムを決定する工程とを行う、一時的でないコンピュータ可読媒体で具現化されたコンピュータプログラム製品をさらに含む、例47に記載のキット。
51.コンピュータプログラム製品が、被験体のDNAを変異させる際の遺伝毒性物質の作用機序と、遺伝毒性物質の作用機序に基づいて被験体に投与するのに適した治療的処置または予防的処置をさらに決定する、例50に記載のキット。
52.遺伝毒性物質に曝露された被験体を診断し、治療するための方法であって、
a)被験体が遺伝毒性物質に曝露されたかどうかを、
i)被験体から生体サンプルを得ること、
ii)サンプルから抽出された複数の二本鎖DNA配列についてのエラー修正済二本鎖配列決定リードを提供すること、
iii)DNA配列の変異体頻度、変異スペクトラムおよび/または三重変異スペクトラムを決定すること、
iv)変異体頻度、変異スペクトラムおよび/または三重変異スペクトラムが、被験体が遺伝毒性物質に曝露されたことを示すかどうかを決定することによって、決定することと、
b)被験体が遺伝毒性物質に曝露された場合、遺伝毒性物質に関連する疾患または障害の発症を予防するか、または阻止するための予防的および/または治療的処置を提供することと、を含む、方法。
53.遺伝毒性物質への安全曝露の閾値レベルを識別し、治療を提供するための方法であって、
a)遺伝毒性物質の安全曝露の閾値レベルを決定することと、
b)被験体が、安全曝露の閾値レベルよりも高いレベルで遺伝毒性物質に曝露されたかどうかを、
i)被験体から生体サンプルを得ること、
ii)生体サンプルから抽出された複数の二本鎖DNA配列についてのエラー修正済二本鎖配列決定リードを提供すること、
iii)DNA配列の変異体頻度、変異スペクトラムおよび/または三重変異スペクトラムを決定すること、
iv)変異体頻度、変異スペクトラムおよび/または三重変異スペクトラムが、被験体が特定の遺伝毒性物質に曝露されたことを示すかどうかを決定すること、
v)変異体頻度、変異スペクトラムおよび/または三重変異スペクトラムに基づき、被験体の遺伝毒性物質への曝露レベルを計算することによって、決定することと、
c)被験体が遺伝毒性物質の安全曝露の閾値レベルを超えて曝露された場合、遺伝毒性物質に関連する疾患または障害の発症を予防するか、または阻止するための予防的および/または治療的処置を提供することと、を含む、方法。
54.サンプルの遺伝毒性物質曝露から生じる変異誘発事象および/または核酸損傷事象を検出し、識別するためのシステムであって、
配列決定データおよび遺伝毒性データに関連する情報を送信するためのコンピュータネットワークであって、情報が、生の配列決定データ、二本鎖配列決定データ、サンプル情報および遺伝毒性物質情報のうちの1つ以上を含む、コンピュータネットワークと、
1つ以上のユーザ計算デバイスと関連付けられ、コンピュータネットワークと通信するクライアントコンピュータと、
複数の遺伝毒性物質プロファイルとユーザ結果の記録を格納するために、コンピュータネットワークに接続するデータベースと、
コンピュータネットワークと通信し、かつ二本鎖配列決定データを作成するためのクライアントコンピュータからの生の配列決定データと要求、元の二本鎖核酸分子を表すファミリーからのグループ配列リードを受信し、個々の鎖からの代表的な配列を互いに比較して、二本鎖配列決定データを作成するように構成された、二本鎖配列決定モジュールと、
コンピュータネットワークと通信し、二本鎖配列決定データと参照配列情報とを比較し、変異を識別し、変異体頻度、変異スペクトラムおよび三重変異スペクトラムのうちの少なくとも1つを含む遺伝毒性物質データを作成するように構成された、遺伝毒性物質モジュールと、を備える、システム。
55.遺伝毒性物質プロファイルは、複数の既知の遺伝毒性物質からの遺伝毒性物質変異スペクトラムを含む、例54に記載のシステム。
56.1つ以上のプロセッサによって実行されるとき、被験体が少なくとも1つの遺伝毒性物質に曝露されるかどうかを決定するための、および/または少なくとも1つの遺伝毒性物質の同一性を決定するための例1~46および52~53のいずれか一つに記載の方法を行う命令を含む、一時的でないコンピュータ可読記憶媒体。
57.検出された薬剤の変異スペクトラム、変異体頻度および/または三重変異スペクトラムを計算することをさらに含み、ここから少なくとも1つの遺伝毒性物質の同一性が決定される、例56に記載の一時的でないコンピュータ可読記憶媒体。
58.被験体が少なくとも1つの遺伝毒性物質に曝露されているかどうか、および/または少なくとも1つの遺伝毒性物質の同一性を決定するための例1~53のいずれか一つに記載の方法を行うためのコンピュータシステムであって、システムが、プロセッサと、メモリと、データベースと、プロセッサのための命令を含む一時的でないコンピュータ可読記憶媒体とを備える少なくとも1つのコンピュータを含み、プロセッサが、例1~46および52~53のいずれか一つに記載の方法を含む操作を行うために命令を実行するように構成されている、コンピュータシステム。
59.例58に記載のシステムであって、ネットワークコンピュータシステムをさらに含み、ネットワークコンピュータシステムが、
a.有線または無線のネットワークと、
b.被験体のサンプルのポリヌクレオチド配列を抽出し、増幅させ、産生するための試薬を含むキットの使用に由来するデータを受信し、ポリヌクレオチド配列を、ネットワークを介してリモートサーバに送信することが可能な複数のユーザ電子計算デバイスと、
c.プロセッサと、メモリと、データベースと、プロセッサのための命令を含む一時的でないコンピュータ可読記憶媒体とを備え、プロセッサが、例1~46および52~53のいずれか一つに記載の方法を含む操作を行うために命令を実行するように構成されている、リモートサーバと、を含み、
d.リモートサーバが、サンプルの遺伝毒性物質曝露から生じる変異誘発事象および/または核酸損傷事象を検出し、識別することが可能な、システム。
60.データベースおよび/またはネットワークを介してアクセス可能な第三者のデータベースは、既知の遺伝毒性物質の遺伝毒性物質プロファイル、少なくとも1つの被験体のサンプルの遺伝毒性物質プロファイルのうちの1つ以上を含む複数の記録をさらに含み、遺伝毒性物質プロファイルが、変異またはDNA損傷の部位を含む、例59に記載のシステム。
61.コンテンツが、少なくとも1つのコンピュータに、遺伝毒性スクリーニングアッセイからサンプル中の二本鎖核酸分子についての二本鎖配列決定データを提供するための方法を行わせる、一時的でないコンピュータ可読媒体であって、方法が、
ユーザ計算デバイスから生の配列データを受信することと、
サンプル中の複数の核酸分子に由来する複数の生の配列リードを含むサンプル特有のデータセットを作成することと、
元の二本鎖核酸分子を表すファミリーからの配列リードをグループ化することであって、このグループ化が、共有される単一分子識別子配列に基づくことと、
元の二本鎖核酸分子からの第1の鎖配列リードと第2の鎖配列リードとを比較して、第1の鎖配列リードと第2の鎖配列リードとの間の1つ以上の対応関係を識別することと、
サンプル中の二本鎖核酸分子についての二本鎖配列決定データを提供することと、を含む、一時的でないコンピュータ可読媒体。
62.例61に記載のコンピュータ可読媒体であって、比較された第1の配列リードおよび第2の配列リードとの間の非相補性を有するヌクレオチド位置を識別することをさらに含み、方法は、さらに、
非相補性を有する位置において、プロセスエラーを識別し、排除するか、または割り引くことと、
プロセスエラーと識別されない非相補性を有する位置において、遺伝毒性物質への曝露から生じる可能性のあるインビボでのDNA損傷部位として、非相補性を有する残りの位置を識別することとを含む、コンピュータ可読媒体。
63.コンテンツが、少なくとも1つのコンピュータに、サンプルの遺伝毒性物質曝露から生じる変異誘発事象を検出し、識別するための方法を行わせる、一時的でないコンピュータ可読媒体であって、方法が、
二本鎖配列データと参照配列情報とを比較することと、
二本鎖配列データ中の変異を識別し、ここで、変異は、参照情報と一致しない領域として識別されることと、
二本鎖配列データ中の変異体頻度を決定することと、
二本鎖配列データから変異スペクトラムを作成することと、
二本鎖配列データから三重変異スペクトラムを作成することと、
変異スペクトラムおよび/または三重変異スペクトラムと複数の既知の遺伝毒性物質データセットとを比較することと、を含む、一時的でないコンピュータ可読媒体。
64.コンテンツが、少なくとも1つのコンピュータに、被験体における発癌物質または発癌物質曝露を検出し、識別するための方法を行わせる、一時的でないコンピュータ可読媒体であって、方法が、
被験体からのサンプルから作成される二本鎖配列決定データを用いて標的ゲノム領域中の配列バリアントを識別することと、
試験サンプルおよび対照サンプルのバリアント対立遺伝子頻度(VAF)を計算することと、
VAFが対照群よりも試験群において高いかどうかを決定することと、
より高いVAFを有するサンプルにおいて、配列バリアントが非シングレットであるかどうかを決定することと、
より高いVAFを有するサンプルにおいて、配列バリアントが、ドライバー変異であるかどうかを決定することと、
非シングレットおよび/またはドライバー変異を有するサンプルを、発癌物質であることが疑わしいものとして特徴付けることと、を含む、一時的でないコンピュータ可読媒体。
65.発癌物質の安全性閾値を評価すること、および/または被験体における曝露の後に遺伝毒性物質に関連する疾患または障害が発生することと関連するリスクを決定することをさらに含む、例64に記載の一時的でないコンピュータ可読媒体。
【0257】
参考文献
以下に列挙される参考文献、および上述の明細書に引用される特許および公開された特許出願は、本明細書に完全に記載されるかのように、それらの全体が参照により組み込まれる。
[1]Schmitt MW,Kennedy SR,Salk JJ,Fox EJ,Hiatt JB,and Loeb LA.Detection of ultra-rare mutations by next-generation sequencing.Proc Natl Acad Sci U S A.2012;109(36):14508-14513.
[2]Kennedy SR,Salk JJ,Schmitt MW,Loeb LA.Ultra-Sensitive Sequencing Reveals an Age-Related Increase in Somatic Mitochondrial Mutations that are inconsistent with oxidative damage.PLOS Genetics.2013;9(9):1-10.
[3]Kennedy SR,Schmitt MW,Fox EJ,Kohrn BF,Salk JJ,Ahn EH,et al.Detecting ultralow-frequency mutations by Duplex Sequencing.Nat Protoc.2014;9(11):2586-2606.
[4]Schmitt MW,Fox EJ,Prindle MJ,Reid-Bayliss KS,True LD,et al.Sequencing small genomic targets with high efficiency and extreme accuracy.Nature Methods.2015;12(5):423-5.
[5]Chan CY,Huang PH,Guo F,Ding X,Kapur V,Mai J D,et al.Accelerating drug discovery via organs-on-chips.Lab Chip.2013;12(24):4697-4710.
[6]Schmitt MW,Loeb LA,and Salk JJ.The influence of subclonal resistance mutations on targeted cancer therapy.Nat Rev Clin Oncol.2016;13(6):335-347.
[7]Salk JJ,Schmitt MW,Loeb L A. Enhancing the accuracy of next-generation sequencing for detecting rare and subclonal mutations.Nature Reviews Genetics.2018.19:269-283.
【0258】
結論
本技術の実施形態の上述の詳細な説明は、網羅的であること、または本技術を上述の正確な形態に限定することを意図するものではない。本技術の具体的な実施形態および実施例は、例示的な目的のために上に記載されているが、関連技術分野の当業者が認識するように、本技術の範囲内で様々な等価な修正が可能である。例えば、工程は所与の順序で提示されるが、代替的な実施形態は、異なる順序で工程を実行してもよい。本明細書に記載の様々な実施形態を組み合わせて、さらなる実施形態を提供することもできる。本明細書に引用される全ての参考文献は、本明細書に完全に記載されるかのように、参照により組み込まれる。
【0259】
上の記載から、本技術の特定の実施形態は、例示のために本明細書に記載されているが、本技術の実施形態の説明を不必要に曖昧にすることを回避するために周知の構造および機能は詳細には示されていないことを理解されたい。文脈が許容する場合、単数または複数の用語は、それぞれ複数または単数の用語も含み得る。
【0260】
さらに、「または」という単語が、2つ以上の項目のリストに関して他の項目から排他される単一の項目のみを意味するように明示的に限定されない限り、そのようなリストにおける「または」の使用は、(a)そのリスト内の任意の単一の項目、(b)そのリスト内の全ての項目、または(c)そのリスト内の項目の任意の組み合わせを含むと解釈される。加えて、「~を含む(comprising)」という用語は、少なくとも列挙された特徴(1つ以上)を含むことを意味するように、全体を通して使用され、同じ特徴の任意のより多い数および/または追加の種類の他の特徴が排除されない。特定の実施形態は例示のために本明細書には記載されているが、本技術から逸脱することなく種々の変更が行われ得ることも理解されたい。さらに、本技術のある特定の実施形態と関連付けられた利点は、それらの実施形態の文脈で説明されているが、他の実施形態も、そのような利点を示してもよく、全ての実施形態が必ずしも本技術の範囲内に収まるような利点を示す必要はない。したがって、本開示および関連技術は、本明細書に明示的に示されないまたは記載されない他の実施形態を包含することができる。
【0261】
本開示において使用される製品名は、識別のためにのみ使用される。全ての商標は、それぞれの所有者の所有権である。