特許第6262922号(P6262922)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 花王株式会社の特許一覧

<>
  • 特許6262922-物質の遺伝毒性の評価方法 図000009
  • 特許6262922-物質の遺伝毒性の評価方法 図000010
  • 特許6262922-物質の遺伝毒性の評価方法 図000011
  • 特許6262922-物質の遺伝毒性の評価方法 図000012
  • 特許6262922-物質の遺伝毒性の評価方法 図000013
  • 特許6262922-物質の遺伝毒性の評価方法 図000014
  • 特許6262922-物質の遺伝毒性の評価方法 図000015
  • 特許6262922-物質の遺伝毒性の評価方法 図000016
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】6262922
(24)【登録日】2017年12月22日
(45)【発行日】2018年1月17日
(54)【発明の名称】物質の遺伝毒性の評価方法
(51)【国際特許分類】
   C12N 15/09 20060101AFI20180104BHJP
   C12N 15/01 20060101ALI20180104BHJP
   C12Q 1/02 20060101ALI20180104BHJP
   C12Q 1/68 20180101ALI20180104BHJP
【FI】
   C12N15/00 AZNA
   C12N15/00 X
   C12Q1/02
   C12Q1/68 Z
【請求項の数】24
【全頁数】44
(21)【出願番号】特願2017-537347(P2017-537347)
(86)(22)【出願日】2017年2月16日
(86)【国際出願番号】JP2017005700
【審査請求日】2017年7月13日
【新規性喪失の例外の表示】特許法第30条第2項適用 (1)平成28年8月19日 「Environmental and Molecular Mutagenesis,September 2016,Volume 57,Issue Supplement sl:Environmental Mutagenesis and Genomics Society 47th Annual Meeting,Page S74」、及び平成28年9月26日 「Environmental Mutagenesis and Genomics Society,47th Annual Meeting,Crown Center,Westin Kansas City,Kansas City,Missouri」(米国)に発表
【新規性喪失の例外の表示】特許法第30条第2項適用 (2)平成28年10月31日 日本環境変異原学会 発行「日本環境変異原学会第45回大会プログラム・要旨集、第92頁」、平成28年11月17日 「日本環境変異原学会第45回大会」(つくば国際会議場、茨城県つくば市竹園2−20−3)、及び平成28年11月17−18日 「日本環境変異原学会第45回大会」(つくば国際会議場、茨城県つくば市竹園2−20−3)に発表
【早期審査対象出願】
(73)【特許権者】
【識別番号】000000918
【氏名又は名称】花王株式会社
(74)【代理人】
【識別番号】110000084
【氏名又は名称】特許業務法人アルガ特許事務所
(72)【発明者】
【氏名】松村 奨士
(72)【発明者】
【氏名】本田 大士
【審査官】 戸来 幸男
(56)【参考文献】
【文献】 国際公開第2016/149261(WO,A1)
【文献】 Genes Environ.,2015年,vol.37, no.15,pp.1-10
【文献】 Genes Environ.,2013年,vol.35, no.2,pp.53-56
【文献】 Nucleic Acids Res.,2012年,vol.40, no.5,pp.2032-2040
【文献】 Mutat. Res.,2015年,vol.776,pp.136-143
【文献】 Nature,2014年,vol.512, no.7513,pp.155-160, suppl.1-9
【文献】 Curr. Oncol.,2010年,vol.17, no.5,pp.39-42
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00−15/90
C12Q 1/02
C12Q 1/68
CAplus/MEDLINE/EMBASE/BIOSIS/
WPIDS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
PubMed
(57)【特許請求の範囲】
【請求項1】
試験物質の遺伝毒性の評価方法であって、
(1)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出したリード配列上の塩基がマッチしない部位を、該部位におけるマッチしない塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む、方法。
【請求項2】
前記(2)で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3)において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
請求項1記載の方法。
【請求項3】
前記(3)〜(5)が、
前記リード配列に含まれる塩基を下記(i)〜(iv)に分けること、
(i) 参照配列上の塩基がAである位置に存在する塩基
(ii) 参照配列上の塩基がTである位置に存在する塩基
(iii)参照配列上の塩基がGである位置に存在する塩基
(iv) 参照配列上の塩基がCである位置に存在する塩基
該リード配列に含まれる塩基の中から、参照配列と塩基がマッチしないものを検出し、当該塩基の存在する部位を、該部位における該塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること、
検出されたマッチしない塩基の各々について、該変異部位における変異前及び変異後の塩基対を取得すること、及び
該変異部位の塩基対置換型変異を、変異前の塩基対と変異後の塩基対の種類に従って、AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→ATの6つの塩基対の変異パターンに分類すること、
を含む、請求項1又は2記載の方法。
【請求項4】
試験物質の遺伝毒性の評価方法であって、
(1')試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2')該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3')該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4')該(3')で検出したリード配列上の塩基がマッチしない部位を、該部位におけるマッチしない塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること;
(5')取得した変異の各々について、該参照配列に基づいて、変異前の塩基と、該変異前の塩基の上流及び下流に隣接する塩基とを含むコンテクスト配列を決定すること;
(6')該(4')で取得した各変異を、該(5')で決定したコンテクスト配列及び変異後の塩基の種類に従ってタイプ分けすること;
(7')該(6')で得られた変異タイプの各々の変異頻度を決定すること、
を含む、方法。
【請求項5】
前記(2')で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3')において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
請求項記載の方法。
【請求項6】
前記(3')〜(6')が、
前記リード配列に含まれる塩基を下記(i)〜(iv)に分けること、
(i) 参照配列上の塩基がAである位置に存在する塩基
(ii) 参照配列上の塩基がTである位置に存在する塩基
(iii)参照配列上の塩基がGである位置に存在する塩基
(iv) 参照配列上の塩基がCである位置に存在する塩基
該リード配列に含まれる塩基の中から、参照配列と塩基がマッチしないものを検出し、当該塩基の存在する部位を、該部位における該塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること、
検出されたマッチしない塩基の各々について、該変異部位における変異前及び変異後の塩基対を取得すること、
該変異部位の塩基対置換型変異を、変異前の塩基対と変異後の塩基対の種類に従って、AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→ATの6つの塩基対の変異パターンに分類すること、
該変異部位における変異前の塩基と、該変異前の塩基の上流に隣接する1以上の塩基と、該変異前の塩基の下流に隣接する1以上の塩基とからなるコンテクスト配列を決定すること、及び
該6つの塩基対の変異パターンと該コンテクスト配列に従って、該塩基対置換型変異をタイプ分けすること、
を含む、請求項4又は5記載の方法。
【請求項7】
試験物質の遺伝毒性の評価方法であって、
(1")試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2")該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3")該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列における該参照配列に対して塩基が挿入もしくは欠失した部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4")該(3")で検出したリード配列上の塩基の挿入もしくは欠失部位を、該挿入もしくは欠失部位のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、挿入もしくは欠失変異を有する変異部位として取得すること;
(5")取得した変異の各々について、挿入もしくは欠失の塩基長、及び/又は挿入された塩基の種類を決定すること;
(6")該(5")で決定された挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること、
を含む、方法。
【請求項8】
前記(2")で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3")において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
請求項記載の方法。
【請求項9】
前記塩基対置換型変異が、1塩基対置換型変異、2塩基対置換型変異、又は3塩基対置換型変異である、請求項1〜のいずれか1項記載の方法。
【請求項10】
前記細胞集団が、サルモネラ菌細胞集団および大腸菌細胞集団からなる群より選択される少なくとも1種である、請求項1〜のいずれか1項記載の方法。
【請求項11】
前記サルモネラ菌がS.Typhimurium LT−2株、TA100株、TA98株、TA1535株、TA1538株又はTA1537株である、請求項10記載の方法。
【請求項12】
がん細胞における変異の評価方法であって、
(1)がん細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出したリード配列上の塩基がマッチしない部位を、該部位におけるマッチしない塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む、方法。
【請求項13】
培養細胞の遺伝情報の評価方法であって、
(1)培養細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出したリード配列上の塩基がマッチしない部位を、該部位におけるマッチしない塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む、方法。
【請求項14】
前記(2)で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(4)において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
請求項12又は13記載の方法。
【請求項15】
前記(3)〜(5)が、
前記リード配列に含まれる塩基を下記(i)〜(iv)に分けること、
(i) 参照配列上の塩基がAである位置に存在する塩基
(ii) 参照配列上の塩基がTである位置に存在する塩基
(iii)参照配列上の塩基がGである位置に存在する塩基
(iv) 参照配列上の塩基がCである位置に存在する塩基
該リード配列に含まれる塩基の中から、参照配列と塩基がマッチしないものを検出し、当該塩基の存在する部位を、該部位における該塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること、
検出されたマッチしない塩基の各々について、該変異部位における変異前及び変異後の塩基対を取得すること、及び
該変異部位の塩基対置換型変異を、変異前の塩基対と変異後の塩基対の種類に従って、AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→ATの6つの塩基対の変異パターンに分類すること、
を含む、請求項12〜14のいずれか1項記載の方法。
【請求項16】
がん細胞における変異の評価方法であって、
(1')がん細胞集団を試験群とし、そのDNAを取得すること;
(2')該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3')該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4')該(3')で検出したリード配列上の塩基がマッチしない部位を、該部位におけるマッチしない塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること;
(5')取得した変異の各々について、該参照配列に基づいて、変異前の塩基と、該変異前の塩基の上流及び下流に隣接する塩基とを含むコンテクスト配列を決定すること;
(6')該(4')で取得した各変異を、該(5')で決定したコンテクスト配列及び変異後の塩基の種類に従ってタイプ分けすること;
(7')該(6')で得られた変異タイプの各々の変異頻度を決定すること、
を含む、方法。
【請求項17】
培養細胞の遺伝情報の評価方法であって、
(1')培養細胞集団を試験群とし、そのDNAを取得すること;
(2')該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3')該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4')該(3')で検出したリード配列上の塩基がマッチしない部位を、該部位におけるマッチしない塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること;
(5')取得した変異の各々について、該参照配列に基づいて、変異前の塩基と、該変異前の塩基の上流及び下流に隣接する塩基とを含むコンテクスト配列を決定すること;
(6')該(4')で取得した各変異を、該(5')で決定したコンテクスト配列及び変異後の塩基の種類に従ってタイプ分けすること;
(7')該(6')で得られた変異タイプの各々の変異頻度を決定すること、
を含む、方法。
【請求項18】
前記(2')で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3')において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
請求項16又は17記載の方法。
【請求項19】
前記(3')〜(6')が、
前記リード配列に含まれる塩基を下記(i)〜(iv)に分けること、
(i) 参照配列上の塩基がAである位置に存在する塩基
(ii) 参照配列上の塩基がTである位置に存在する塩基
(iii)参照配列上の塩基がGである位置に存在する塩基
(iv) 参照配列上の塩基がCである位置に存在する塩基
該リード配列に含まれる塩基の中から、参照配列と塩基がマッチしないものを検出し、当該塩基の存在する部位を、該部位における該塩基のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、塩基対置換型変異を有する変異部位として取得すること、
検出されたマッチしない塩基の各々について、該変異部位における変異前及び変異後の塩基対を取得すること、
該変異部位の塩基対置換型変異を、変異前の塩基対と変異後の塩基対の種類に従って、AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→ATの6つの塩基対の変異パターンに分類すること、
該変異部位における変異前の塩基と、該変異前の塩基の上流に隣接する1以上の塩基と、該変異前の塩基の下流に隣接する1以上の塩基とからなるコンテクスト配列を決定すること、及び
該6つの塩基対の変異パターンと該コンテクスト配列に従って、該塩基対置換型変異をタイプ分けすること、
を含む、請求項16〜18のいずれか1項記載の方法。
【請求項20】
がん細胞における変異の評価方法であって、
(1")がん細胞集団を試験群とし、そのDNAを取得すること;
(2")該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3")該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列における該参照配列に対して塩基が挿入もしくは欠失した部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4")該(3")で検出したリード配列上の塩基の挿入もしくは欠失部位を、該挿入もしくは欠失部位のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、挿入もしくは欠失変異を有する変異部位として取得すること;
(5")取得した変異の各々について、挿入もしくは欠失の塩基長、及び/又は挿入された塩基の種類を決定すること;
(6")該(5")で決定された挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること、
を含む、方法。
【請求項21】
培養細胞の遺伝情報の評価方法であって、
(1")培養細胞集団を試験群とし、そのDNAを取得すること;
(2")該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3")該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列における該参照配列に対して塩基が挿入もしくは欠失した部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4")該(3")で検出したリード配列上の塩基の挿入もしくは欠失部位を、該挿入もしくは欠失部位のリード配列間での出現頻度に基づいて該部位を変異部位として決定する工程を行うことなく、挿入もしくは欠失変異を有する変異部位として取得すること;
(5")取得した変異の各々について、挿入もしくは欠失の塩基長、及び/又は挿入された塩基の種類を決定すること;
(6")該(5")で決定された挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること、
を含む、方法。
【請求項22】
前記(2")で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3")において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
請求項20又は21記載の方法。
【請求項23】
前記塩基対置換変異が、1塩基対置換型変異、2塩基対置換型変異、又は3塩基対置換型変異である、請求項12〜19のいずれか1項記載の方法。
【請求項24】
前記検出に用いるリード配列の総量が、1×1010bp以下である、請求項1〜23のいずれか1項記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、変異の解析、又は物質の遺伝毒性を評価する方法に関する。
【背景技術】
【0002】
遺伝毒性とは、DNAを中心とする細胞内の遺伝物質に対する毒性の総称であり、より狭義には、DNAの損傷や突然変異等を引き起こし、その遺伝情報を変化させる性質(変異原性)をいう。DNAの遺伝情報は、A(アデニン)、T(チミン)、G(グアニン)及びC(シトシン)の4種の塩基で構成された塩基配列に保持されている。遺伝毒性物質は、直接的あるいは間接的にDNAに作用し、その塩基配列に質的又は量的に変化を及ぼして、遺伝情報を変化させる。遺伝毒性物質による遺伝情報の変化は、発がんや生殖発生毒性の原因となることが知られており、医薬品、化粧料、各種化学物質等の遺伝毒性を評価することは、公衆の安全のために重要である。
【0003】
遺伝毒性のメカニズムは多様であり、大きく分けて、DNAの塩基対情報を別の塩基対に変化させる塩基対置換型変異、DNAの配列中に短い塩基配列の挿入や欠失を引き起こす短い挿入・欠失変異、及びゲノム配列全体に比較的長い塩基配列の挿入、欠失、転座、逆位などを引き起こし、ゲノム構造を変化させるゲノム構造変化が存在する。特に、短い挿入・欠失変異は、遺伝子のコードするタンパク質の読み枠を変化させる場合、フレームシフト型変異とも呼ばれる。化学物質による遺伝毒性においては、塩基対置換型変異又は短い挿入・欠失変異を引き起こすものが多いと言われる。
【0004】
これまで、物質の遺伝毒性を評価する方法として、インビトロやインビボのモデルを用いた様々な遺伝毒性試験が開発されてきた。例えば、前述の塩基対置換型変異、あるいはフレームシフト型変異を検出する試験として、Bruce N.Ames博士が開発したAmes試験がある(非特許文献1)。Ames試験では、ヒスチジン生合成遺伝子に変異があり、ヒスチジンを含まない培地では生育できないサルモネラ菌株を使用する。物質曝露によって当該遺伝子に変異が起き、ヒスチジンを合成可能になると、ヒスチジンを含まない培地上でコロニーを形成できるようになる。生じたコロニーを計数することにより、物質の変異原性を確認する。この他に、ゲノム構造変化の有無を検出する試験として、哺乳動物細胞を用いた小核試験などが用いられている(非特許文献2)。さらに、複数の遺伝毒性試験を組み合わせることで、高感度に物質の遺伝毒性の有無を確認することができる。
【0005】
しかし、前述したような従来の遺伝毒性試験では、遺伝毒性の検出は、変異の量や質を直接反映しない間接的な指標に依存している。そのため、従来の試験では、どのような変異が起きたか、それが何塩基に一つの割合で起きたか等、変異の質的及び量的な情報が詳細には得られない。また、各種試験の間に統一的な指標が存在しないため、異なる試験間の結果の比較は困難である。したがって、複数の変異原間での強度の比較や、メカニズムによる遺伝毒性の分類といった遺伝毒性の体系的理解を進める上で、従来の遺伝毒性試験は十分な情報を提供しない。
【0006】
次世代シーケンサー等を用いた高スループットシーケンシング技術の遺伝毒性評価への応用が提案されている。Maslovら(非特許文献3)は、高スループットシーケンシングの遺伝毒性評価への応用の方法論を開示している。その方法の一つとして、細胞を物質に曝露した後、単一細胞に由来するゲノム情報が均一な集団を作製し、そのゲノム情報を次世代シーケンサーで取得することで変異部位を同定するものがある。この方法論の実用例として、松田ら(非特許文献4)は、変異原に曝露したSalmonella Typhimurium由来の菌株TA100株のシングルコロニーを単離し、その全ゲノム配列を次世代シーケンサーで取得し、リファレンスとなる配列とリード配列間で配列を比較して、一定の頻度で複数のリード配列に同じ塩基の変化が生じている部位を変異部位として検出することで、個々の変異及びその位置を同定したことを報告している。さらに松田ら(非特許文献5)は、シングルコロニーを単離する代わりに希釈した菌株培養液を微量採取し、追培養したものを用いて、非特許文献4と同様の手法で変異を検出する方法を報告している。また別の方法として、次世代シーケンサーを用いて放射線等によるDNAの変異の蓄積を評価する方法が報告されている。具体的には制限酵素サイト等に特異的な配列(タグ配列)に着目し、その出現頻度に基づき、ゲノム中の変異頻度を推定する評価を行っている(特許文献1)。また、セルフリー(cf)DNAの各分子に固有のタグ配列を付加し、同一分子から得られる複数のリード配列のコンセンサス配列を得た上で、ゲノム上の同一箇所に複数のリード配列を整列させて比較する変異検出方法が開示されている(非特許文献6、7)。
【0007】
(特許文献1)国際公開公報第2014/175427号
(非特許文献1)Mortelmans et al., Mutation Research, 2000, 455:29-60
(非特許文献2)Matsushima et al., Mutagenesis, 1999, 14:569-580
(非特許文献3)Maslov et al., Mutation Research 2015, 776:136-143
(非特許文献4)Matsuda, Genes and Environment, 2013, 35:53-56
(非特許文献5)Matsuda et al., Genes and Environment, 2015、37:15-24
(非特許文献6)Nucleic Acids Research, 2016, 44(11):e105
(非特許文献7)Clinical Oncology, 2016, 28:735-738
【発明の概要】
【0008】
一実施形態において、本発明は、試験物質の遺伝毒性の評価方法であって、
(1)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む、方法を提供する。
【0009】
別の一実施形態において、本発明は、試験物質の遺伝毒性の評価方法であって、
(1’)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2’)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3’)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4’)該(3’)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5’)取得した変異の各々について、該参照配列に基づいて、変異前の塩基と、該変異前の塩基の上流及び下流に隣接する塩基とを含むコンテクスト配列を決定すること;
(6’)該(4’)で取得した各変異を、該(5’)で決定したコンテクスト配列及び変異後の塩基の種類に従ってタイプ分けすること;
(7’)該(6’)で得られた変異タイプの各々の変異頻度を決定すること、
を含む、方法を提供する。
【0010】
さらに別の一実施形態において、本発明は、試験物質の遺伝毒性の評価方法であって、
(1”)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2”)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3”)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列における該参照配列に対して塩基が挿入もしくは欠失した部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4”)該(3”)で検出した部位を、挿入もしくは欠失変異を有する変異部位として取得すること;
(5”)取得した変異の各々について、挿入もしくは欠失の塩基長、及び/又は挿入された塩基の種類を決定すること;
(6”)該(5”)で決定された挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること、
を含む、方法を提供する。
【0011】
なお別の一実施形態において、本発明は、がん細胞における変異の評価方法であって、
(1)がん細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む、方法を提供する。
【0012】
なお別の一実施形態において、本発明は、培養細胞の遺伝情報の評価方法であって、
(1)培養細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む、方法を提供する。
【図面の簡単な説明】
【0013】
図1】合成DNAサンプルにおける塩基対の変異パターンの変異コール割合。A:GC塩基対の変異パターン、B:AT塩基対の変異パターン。
図2】合成DNAサンプルにおける塩基対の変異パターンの変異頻度増加量。A:GC塩基対、B:AT塩基対。
図3】合成DNAサンプルにおける挿入変異の変異頻度増加量。A:挿入塩基数、B:挿入塩基の種類。
図4】変異原曝露サンプルにおける塩基対の変異パターンの変異頻度増加量。A:GC塩基対、B:AT塩基対。*:p<0.05、**:p<0.01、***:p<0.001(Dunnett’s test)。
図5】オリジナル塩基の種類に依存した、変異原曝露サンプルにおける塩基対の変異パターンの変異頻度増加量の違い。
図6】変異原曝露サンプルにおける塩基対変異パターンのスペクトル解析結果。
図7】変異原曝露サンプルにおける塩基対変異のシーケンスコンテクスト解析結果。Signiture 11:公知のアルキル化剤による変異シグニチャーのパターン、ENU:実施例2におけるEthylnitrosourea処理による変異パターン。
図8】変異原曝露サンプルにおける塩基対変異のシーケンスコンテクスト解析結果(図7の続き)。Signiture 11:公知のアルキル化剤による変異シグニチャーのパターン、ENU:実施例2におけるEthylnitrosourea処理による変異パターン。
【発明の詳細な説明】
【0014】
(1.定義)
本明細書において、「変異(又は突然変異)」(mutation)とは、DNAに生じる突然変異をいい、例えば、DNAにおける塩基又は配列の欠失、挿入、置換、付加、逆位、及び転座が挙げられる。本明細書における変異は、1塩基の欠失、挿入、置換、付加、ならびに2以上の塩基からなる配列の欠失、挿入、置換、付加、逆位、及び転座を包含する。また本明細書における変異には、コード領域及び非コード領域における変異が含まれ、また発現するアミノ酸の変化を伴う変異及び伴わない変異(サイレント変異)が含まれる。
【0015】
本発明において評価される物質の「遺伝毒性」とは、該物質が変異を引き起こす性質(いわゆる変異原性)をいう。
【0016】
本明細書において、「オリジナルフラグメント」とは、解析対象DNAのフラグメントであって、シーケンシング反応によって配列を読み取られる側の一本鎖DNA断片をいう。また本明細書において、変異部位の塩基に関する「オリジナル塩基」とは、それぞれ、オリジナルフラグメントの変異箇所における変異前の塩基をいう。
【0017】
本明細書中で引用された全ての特許文献、非特許文献、およびその他の刊行物は、その全体が本明細書中において参考として援用される。
【0018】
(2.細胞集団における変異の解析方法)
高スループットシーケンシングを用いた遺伝毒性評価方法により、変異原により引き起こされた変異の量や質を直接的に評価できると期待される。また、このような方法は、ゲノム配列が利用可能であれば、基本的には全ての生物種に適用可能と考えられる。一方で、非特許文献4のような従来の高スループットシーケンシングを用いた遺伝毒性評価方法では、一部位での塩基の変異の検出のために、その部位を含む多数のリード配列を全て整列させて比較するという方法をとるため、大量の配列情報が必要となり、配列情報の取得及び変異部位の検出に多大な時間、労力及びコストを要する。また、物質曝露による変異は、一般的には非常に低頻度であり集団内の個々の細胞に均等に発生するわけではないため、非特許文献4のような単一細胞の解析では、細胞集団内での変異頻度や、変異原が細胞集団に及ぼす影響を正確に評価することは難しいと考えられる。非特許文献5記載の方法でも、解析に供したサンプルの遺伝情報は依然として均質であったことから、その結果は細胞集団の情報を反映していたとは言い難い。遺伝毒性の評価では、個々の細胞に入った低頻度な変異を如何に検出するか、及びそれに基づいて、集団に対する遺伝毒性をどのように評価するかが重要なポイントである。
【0019】
非特許文献4又は5のような解析を複数の異なる単一細胞由来のサンプルに対して繰り返せば、細胞集団での事象を反映した情報を得ることができるが、そのための時間、労力やコストは膨大である。特に複数の物質について評価する場合、また用量反応関係を評価する場合においては、この方法は現実的ではない。一方、特許文献1の方法は、比較的コストの低い方法であるが、制限酵素サイト等の特定の配列を利用した変異頻度の推定にとどまっており、ゲノム全体における変異に対しての定性及び定量性が低く、正確な変異情報に基づく遺伝毒性評価を実現可能な方法ではない。
【0020】
また、従来の高スループットシーケンシングを用いた遺伝毒性評価方法は、哺乳動物細胞の単離培養における技術的ハードルや、ゲノムサイズに起因する変異解析コストの増大を考えた場合、複数の物質の評価への適用は極めて困難である。様々な変異情報を保持した細胞集団における変異原に起因する変異の量的及び質的情報を、簡便かつ低コストに検出する方法の開発が望まれている。
【0021】
本発明者は、参照配列の特定の部位を含む複数のリード配列間での比較により、特定部位における塩基配列の変化が、複数のリード配列中で一定の頻度で生じている部位を変異部位として検出する従来法の代わりに、リード配列の各々を参照配列と比較して1つ1つのリード配列から塩基の変異を検出し、その結果を解析することで、変異のパターン及びその頻度を算出する解析方法を見出した。この解析方法は、従来法よりも効率的に、多量の塩基配列情報に基づく変異検出、または高速かつ高感度な変異検出を可能にし、ひいては、細胞集団全体としての量的及び質的な変異の傾向を反映するデータをもたらすことができる。
【0022】
本発明の方法によれば、一回の解析で、細胞集団内における変異についての量的及び質的な情報を得ることができる。したがって、本発明の方法によれば、従来法と比べてはるかに簡便かつ低コストに、細胞集団レベルでの変異解析が可能になる。本発明の方法は、物質の遺伝毒性評価や癌の評価など、遺伝情報がヘテロな細胞集団における変異の傾向を把握したい場合に特に有効である。
【0023】
したがって、一実施形態において、本発明は、細胞集団における変異を解析する方法を提供する。本発明の方法の基本的な手順は、以下のとおりである:
(A)細胞集団由来のDNAを取得する;
(B)該DNAのフラグメント(すなわちオリジナルフラグメント)をシーケンシングし、各フラグメントにつき1つ以上のリード配列を得る;
(C)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出する;
(D)該1つ以上のリード配列について検出した部位を、変異部位として取得する;
(E)該変異部位における変異の情報を取得し、該情報に基づいて変異の傾向を解析する。
【0024】
本発明の方法で用いる細胞集団は、ホモ集団(例えば単一コロニー由来の細胞集団など、遺伝情報が均一なもの)であっても、ヘテロ集団(遺伝情報が不均一なもの)であっても、遺伝情報の均一性が不明な集団であってもよいが、好ましくは、ヘテロ集団又はそれと推定される細胞集団である。本発明の方法で用いる細胞集団の例としては、動物もしくは植物から採取した検体、及び動物、植物もしくは微生物由来の培養細胞の集団などが挙げられ、好ましくは、動物、植物もしくは微生物の株由来の培養細胞の集団が挙げられる。動物の例としては、好ましくはヒト等の哺乳動物や、カイコ、線虫などが挙げられ、微生物の例としては、好ましくは大腸菌、サルモネラ菌、酵母などが挙げられる。本発明の方法で用いる細胞集団の別の例としては、生体から採取した検体もしくはその培養物、変異原もしくはその候補物質に曝した培養細胞、又は薬物もしくはその候補物質を投与した培養細胞などが挙げられる。
【0025】
本発明で用いる細胞集団由来のDNAは、該細胞集団から当該分野における通常の方法を用いて抽出又は単離することによって、取得することができる。該抽出又は単離には、例えば、市販のDNA抽出キットなどを用いることができる。あるいは、抽出又は単離後保存されている該細胞集団由来のDNAを取得し、本発明の方法で使用してもよい。本発明で用いる細胞集団由来のDNAとしては、ゲノムDNA、ミトコンドリアゲノムDNA、葉緑体ゲノムDNA、プラスミドDNA、ウイルスゲノムDNAなどが挙げられる。このうち、ゲノムDNAが好ましい。
【0026】
あるいは、細胞集団中のRNAウイルスについて解析する場合は、DNAの代わりにRNAを取得および解析してもよい。細胞中のRNAは、市販のRNA抽出キットなど、当該分野における通常の方法で抽出又は単離することができる。あるいは、抽出又は単離後保存されている該細胞集団由来のRNAを取得し、本発明の方法で使用してもよい。本発明の方法においてRNAを取得および解析する場合、本明細書中における「DNA」は「RNA」と読み替えられ、また塩基Tは塩基Uと読み替えられる。
【0027】
本発明の方法で用いる参照配列とは、変異解析の対象であるDNA中に含まれる既知の配列である。ここで、既知の配列としては、公共のデータベース等に登録されている配列を使用することが好ましいが、上記本発明の方法の(C)に先立って予めシーケンサー等で配列決定した解析対象DNA中の配列であってもよい。該参照配列の領域や長さ、その数は特に限定されず、変異解析の目的に応じてDNA中から適宜選択され得る。例えば、本発明による変異解析の目的が物質の遺伝毒性評価である場合、参照配列の長さは、特に限定されないが、合計で1,000bp以上が好ましく、10,000bp以上がより好ましく、100,000bp以上がさらに好ましく、1,000,000bp以上がなお好ましい。
【0028】
DNAのフラグメント化は、超音波処理、酵素処理など、当該分野における通常の方法を用いて行うことができる。調製するフラグメントの長さは、シーケンサーが精度よく読み取れる長さに応じて適宜選択され得る。一般的には、100〜10,000bpが選択され得るが、シーケンサーが精度よく読み取れる限りは10,000bp以上の長さのフラグメントが調製されてもよく、シーケンサーの種類に依存してより適切な範囲が選択され得る。例えば、フラグメントの増幅を行うシーケンシング反応用のシーケンサーにかける場合は、フラグメントの長さは平均長100〜500bpが好ましく、平均長150〜200bpがより好ましい。また例えば、一分子リアルタイムシーケンシングを行うシーケンサーにかけるためには、フラグメントの長さは平均長150〜10,000bpが好ましく、平均長200〜1,000bpがより好ましく、平均長200〜500bpがより好ましい。
【0029】
次いで、得られたフラグメントをシーケンシングする。フラグメントのシーケンシングは、後述する参照配列との配列比較に使用すべき部分について行えば足りる。例えば、その配列の少なくとも一部、好ましくは全体が、参照配列のDNA領域に対応するフラグメントをシーケンシングすればよい。哺乳動物細胞等の場合には、エクソン領域等を選択的にシーケンシングしてもよい。領域の選択には、SureSelect(アジレント・テクノロジー社製)等のキットが上市されている。
【0030】
フラグメントの増幅を行うシーケンシング反応では、フラグメントをPCR等で増幅するとともに、増幅された各フラグメントの配列を決定する。一分子リアルタイムシーケンシング反応では、フラグメントを増幅せずにその配列を決定する。フラグメントのシーケンシングには、公知のシーケンサーを使用すればよいが、好ましくは高スループットシーケンサー(いわゆる次世代シーケンサー)が用いられる。フラグメントの増幅を行う高スループットシーケンサーとしては、HiSeq(イルミナ社製)、MiSeq(イルミナ社製)などが上市されている。また、一分子リアルタイムシーケンスを行う高スループットシーケンサーとしては、Pac Bio RSII(Pacfic Biosciences社製)、Pac Bio Sequel System(Pacific Biosciences社製)などが上市されている。
【0031】
フラグメントのシーケンシング方法の詳細な手順は特に限定されないが、より精度の高いシーケンシング方法であることが好ましい。そのような方法の一つとして、フラグメントの増幅を行うシーケンシングにおいては、後述するようにフラグメントの両側から配列を取得し、共通する部分を活用する方法が挙げられる。また、互いに相補的な2つのオリジナルフラグメントから取得した配列を相補鎖間で比較することにより、さらに比較精度を向上させることもできる。そのような技術としては、HiSeqやMiSeqのライブラリ調製時に、各フラグメント分子固有のアダプターを付加し、シーケンシング後に該アダプター配列情報をもとに相補鎖間の塩基配列を参照する方法(Proc Natl Acad Sci U S A, 2012, 109(36):14508-14513)などが挙げられる。一分子リアルタイムシーケンシングでは、2本鎖フラグメントの両末端にヘアピン配列のアダプターを付加することで一本の環状にし、該1分子の環状フラグメントを連続で数回シーケンシングし、その配列情報を統合する方法(Nucleic Acids Res, 2010, 38(15):e159)などが挙げられる。
【0032】
以上のシーケンシングの結果、上述したDNAのフラグメント化により得られたオリジナルフラグメントの各々について、読み取り結果(リード配列)が取得される。各オリジナルフラグメントについて取得するリード配列の数は1つ以上であればよいが、後述する変異傾向の解析における精度向上の観点からは、好ましくは、各フラグメントについてそれぞれ複数のリード配列が取得される。1フラグメントから取得されるリード配列の数は、好ましくは2本以上、より好ましくは10本以上である。他方、解析の効率の観点からは、リード配列の数は5本以下であることが好ましく、2本以下であることがより好ましい。
【0033】
取得した該1つ以上のリード配列は、そのまま以降の参照配列との比較に用いることができる。変異解析の精度向上の観点からは、該取得したリード配列の塩基の中から、シーケンシングによる読み取りの信頼度の高いものを抽出することが好ましい。好ましくは、同じ1つのフラグメントから得られた2つ以上のリード配列の対応する塩基の中から、信頼度の高い塩基を抽出する。抽出された信頼度の高い塩基は、本明細書において“コンセンサス塩基”と称される。“コンセンサス塩基”の抽出は、次世代シーケンサーに付属のプログラム等を用いて行うことができる。より詳細な手順としては、例えば、同じ1つのフラグメントから得られた2つのリード配列の間で、対応する位置の塩基の種類が、同じであるか、又は2つのリード配列が相補鎖の場合には相補的である塩基を“コンセンサス塩基”として抽出する方法;同じ1つのフラグメントから得られた2つ以上のリード配列間で塩基を比較し、配列上の各位置について、相補的な鎖を含む場合は相補的な塩基も含めて最大の頻度で出現する塩基を決定し、“コンセンサス塩基”として抽出する方法;リード配列間の対応する位置にある塩基の中でシーケンサーでの読み取り精度(クオリティ値)の最も高い塩基を“コンセンサス塩基”として採用する方法;クオリティ値や塩基の出現頻度等を基に、確率論的に“コンセンサス塩基”を決定する方法;同じ1つのフラグメントから得られた全てのリード配列の対応する塩基が一致した場合にその塩基を“コンセンサス塩基”とする方法;またはこれらを組み合わせた方法、などが挙げられる。本発明の方法において、該“コンセンサス塩基”の抽出は、必要に応じて、後述するリード配列の参照配列へのマッピングの前に実施してもよく、又はマッピング後に実施してもよい。
【0034】
次いで、シーケンシングにより得られた各オリジナルフラグメントについての該1つ以上のリード配列を、それぞれ参照配列に対してマッピングし、配列を比較する。比較の結果、該各リード配列と参照配列とで塩基がマッチしない部位を検出する。好ましくは、当該比較は、上述したリード配列上の“コンセンサス塩基”についてのみ行われ得る。該「マッチしない部位」のタイプとしては、例えば、参照配列に対してリード配列上の塩基の種類が異なる部位(置換部位)、参照配列に対してリード配列上の塩基が欠失している部位(欠失部位)、参照配列に対してリード配列上に塩基が挿入されている部位(挿入部位)などが挙げられる。
【0035】
検出した「マッチしない部位」は、解析対象DNAにおける変異部位として取得される。より詳細には、変異部位における変異の情報を取得する。取得される情報としては、例えば、該マッチしない部位(変異部位)のタイプ(例えば、置換部位か、欠失部位か、挿入部位か)、該部位における塩基の種類及び変異前の塩基(又は塩基対)の種類(例えば、参照配列上で該部位に対応する位置にある塩基の種類)、該部位の両隣の塩基の種類(例えば、参照配列上で該部位に対応する位置の両隣にある塩基の種類)などが挙げられるが、これらに限定されない。好ましい実施形態においては、該マッチしない部位が置換部位であれば、該部位における塩基の種類、及び変異前の塩基の種類の情報が取得され;マッチしない部位が欠失部位であれば、変異前の塩基の種類、及び該欠失部位の両隣の塩基の種類の情報が取得され;マッチしない部位が挿入部位であれば、該部位における塩基の種類、及び該挿入部位の両隣の塩基の種類の情報が取得される。
【0036】
リード配列と参照配列との比較からは、リード配列と参照配列とで塩基がマッチした部位も検出され得る。これらの「マッチした部位」は、解析対象DNAにおいて変異がない部位として取得され得る。これらの変異がない部位に関する情報を取得することができる。取得される情報としては、例えば、該部位における塩基の種類や、該部位の両隣の塩基の種類などが挙げられる。
【0037】
該1つ以上のリード配列の各々について、上述した変異部位における変異の情報、又変異がない部位に関する情報の取得を行う。取得した情報を集めて、変異解析用データベースを作成することができる。例えば、各リード配列から取得した変異部位に関する情報を全て集めたデータベースを作成してもよく;各リード配列から取得した変異情報を、変異部位のタイプごとに分類したデータベースを作成してもよく;各リード配列から取得した変異情報を、変異部位における変異前(例えば参照配列)もしくは変異後の塩基の種類ごとに分類したデータベースを作成してもよく;各リード配列から取得した変異情報を、変異部位の塩基長(例えば挿入、欠失又は置換部位の長さ)ごとに分類したデータベースを作成してもよく;さらに、これらの分類を組み合わせたデータベースを作成してもよい。あるいは、変異部位に関する情報と変異がない部位に関する情報とを統合したデータベースを作成してもよい。例えば、変異部位と変異がない部位の情報とを、変異前(例えば参照配列)の塩基の種類(A、T、G及びC)ごとにまとめたデータベースを作成してもよい。あるいは、変異部位のゲノム上での位置を特定し、遺伝子のコード領域または非コード領域に該当するか、さらに遺伝子のコード領域の場合には、イントロンかエクソンか、RNAに転写される側の鎖か、そうでないかなどの情報とともにデータベースを作成してもよい。
【0038】
上述した「マッチしない部位」の検出、ならびに変異部位又は変異がない部位に関する情報の取得は、シーケンシングで得られた全リード配列に対して行ってもよいが、一部のリード配列に対して行ってもよい。当該検出に用いるリード配列の総量(用いるリード配列の合計長)は、その後の変異の傾向の解析を可能にする量であれば特に限定されないが、変異頻度の逆数以上の塩基長であることが好ましく、変異頻度の逆数の100倍以上の塩基長であることがより好ましい。例えば、後述する実施例2における変異の頻度が約1/105bpのオーダーであることから、用いるリード配列の長さの合計は、1×105bp以上であることが好ましく、1×107bp以上あることがより好ましく、1×109bp以上であることがさらに好ましい。また、変異の頻度が1/106bpのオーダーである変異の傾向を解析するためには、検出に用いるリード配列の総量は、前記量の10倍であることが好ましく、変異の頻度が1/104bpのオーダーである変異の傾向を解析するためには、検出に用いるリード配列の総量は、前記量の1/10倍であることが好ましい。他方、解析の効率の点から、検出に用いるリード配列の総量は、変異頻度の逆数の1万倍以下の塩基長であることが好ましく、1000倍以下の塩基長であることがより好ましく、100倍以下の塩基長であることがより好ましい。例えば、検出に用いるリード配列の総量は、1×1010bp以下であることが好ましく、1×109bp以下であることがより好ましく、1×108bp以下であることがさらに好ましく、1×107bp以下であることがよりさらに好ましく、1×106bp以下であることがなお好ましい。また、該変異解析用データベースは、取得した変異部位又は変異がない部位の全てに関する情報に基づいて作成されてもよいが、その後の変異の傾向の解析を可能にする限り、一部の部位の情報のみに基づいて作成されてもよい。
【0039】
従来の方法(例えば、非特許文献4、5)では、参照配列の特定の部位に対応する複数のリード配列を取得した後、該複数のリード配列間で同じ部位に同じタイプのマッチしない塩基が一定頻度で見られたときに、当該部位を解析対象DNAにおける変異部位として決定していた。この方法では、低頻度の変異を見逃す可能性がある。またこの方法では、変異検出するDNA領域が該複数のリード配列がオーバーラップする限定された長さの領域に制限され、かつリードをオーバーラップさせるために多くのデータを必要とするため、DNAの広い領域にわたって解析し、全体での変異の傾向を把握するには膨大な時間と労力を要する。
【0040】
他方、本発明の方法では、そのようなリード配列間でのマッチしない塩基の出現頻度に基づく変異部位の決定は行われない。本発明の方法では、基本的には参照配列の特定の部位に対応する1つ以上のリード配列についてそれぞれ、参照配列との比較に基づいた変異情報を取得し、必要に応じてそれらの情報を分類して、データベースを作成する。該データベースに基づいて、解析対象DNAにおける変異の傾向を解析する。例えば、該データベースに含まれる任意の要素を標本集団とした統計解析(例えば変異頻度解析、変異のパターン解析等)を行うことができる。
【0041】
本発明の方法では、各リード配列についてそれぞれ変異情報を取得するため、低頻度の変異を見逃すことなく検出することができる。また本発明の方法では、変異検出に用いたリード配列のいずれかに対応するDNA上の広範な領域についての変異の検出と解析が可能になる。したがって、本発明の方法によれば、従来の方法よりも高速かつ高感度に変異を検出することができるので、より効率よくかつより正確な変異解析を行うことができる。
【0042】
(2−1.次世代シーケンサーを用いた各フラグメントにおける変異の検出)
本発明の方法の好ましい実施形態として、PCRを行う次世代シーケンサーを用いたDNAフラグメントのシーケンシング、及び参照配列との比較による解析対象DNAにおける変異の解析の手順を以下に詳述する。
【0043】
シーケンシングされる解析対象DNAに由来するフラグメントは、シーケンシングのためのアダプター配列を両端に付加される。アダプターの付加されたフラグメントは、次世代シーケンサーでのシーケンシングに際し、PCR法で検出可能な量まで増幅される。増幅されたフラグメントは配列を読み取られ、読み取られた配列はリード配列として出力される。本発明の好ましい実施形態においては、各増幅されたフラグメントに対して、2本のリード配列(リード1、リード2)を取得する。このとき、シーケンシングで読み取られたオリジナルフラグメントの配列側に対応するのがリード1であり、その相補鎖側に対応するのがリード2である。シーケンサーのリード長の2倍未満のサイズでフラグメントを調製した場合、各増幅されたフラグメントのリード1及びリード2は、共通領域として該フラグメントの少なくとも一部を含み、さらに、それぞれその上流領域又は下流領域を含む。読み取ったリード1とリード2を共通領域で重ね合わせることにより、各増幅されたフラグメントについて1本の合成リード配列を構築する。2本のリード配列からの合成リード配列の構築は、PEAR(Bioinformatics, 2014, 30(5):614-620)、FLASH(Bioinformatics, 2011, 27(21):2957-2963)、PANDAseq(BMC Bioinformatics, 2012, 13:31)等のソフトウェアにより実行することができる。
【0044】
次いで、各々のリード配列を参照配列上にマッピングし、比較する。好ましい実施形態においては、比較精度の向上のため、当該比較は、リード配列上の上述した“コンセンサス塩基”についてのみ行われ得る。別の好ましい実施形態においては、比較精度の向上のため、比較に供するリード配列として合成リード配列を用いる。より好ましくは、合成リード配列における参照配列と比較する領域を、リード1とリード2の重複部分に限定し、かつ比較に用いる合成リード配列上の塩基を、リード1とリード2の間で塩基の種類が相補的であるもの(すなわち“コンセンサス塩基”)に限定する。これにより、シーケンシング時のエラーが配列比較に及ぼす悪影響を低減することができる。該“コンセンサス塩基”への限定は、参照配列へのマッピングを行う前に実施してもよいが、マッピング後に実施することもできる。
【0045】
該参照配列へのマッピングと比較によって、各々のリード配列における、参照配列と塩基がマッチしない部位(変異部位)を検出することができる。さらに、該変異部位のタイプ(置換部位か、欠失部位か、挿入部位か)、該部位における塩基の種類、変異前の塩基の種類、該部位の両隣の塩基の種類、などの変異情報を取得することができる。これらの手順を、シーケンシングで得られた各オリジナルフラグメント由来のリード配列について行うことにより、変異情報を集めて、各リード配列からの変異情報のデータベースを作成することができる。上記の手順は、1つ1つのリード配列について順次行うこともできるが、複数のリード配列について並行して行ってもよい。
【0046】
上述したリード配列の参照配列へのマッピング、比較領域の絞り込み、参照配列と塩基がマッチしない部位の表示、及び該部位における変異情報の取得の手順は、例えば、マッピングはBowtie2ソフトウェア(Nature Methods, 2012, 9(4):357-359)や、BWAソフトウェア(Bioinformatics, 2009, 25(14):1754-1760)、比較領域の絞り込み、参照配列とマッチしない塩基の表示はSamtoolsソフトウェア(Bioinformatics, 2009, 25(16):2078-2079)、及び該部位における変異情報の取得はPython等のプログラミング言語を用いて作成した参照配列と異なる塩基を検出するプログラム等により実行することができる。但し、上記本発明の方法の手順を実行するためのソフトウェア又はプログラミング言語はこれらに限定されない。
【0047】
(2−2.細胞集団における変異の解析)
さらに、取得された変異情報のデータベースに基づいて、細胞集団における変異の傾向を調べることができる。好ましくは、本発明により解析される変異としては、DNAの塩基対を別の塩基対に変化させる塩基対置換型変異、及びDNAの配列中に短い塩基配列の挿入や欠失を引き起こす短い挿入・欠失変異が挙げられる。塩基対置換型変異としては、1塩基対置換型変異、及び2塩基対又は3塩基対以上が置換した多塩基対置換型変異が挙げられる。このうち本発明では、好ましくは1塩基対置換型変異が解析される。本発明により、これらの変異の変異パターン及び変異頻度を決定することができる。以下、その解析手順を詳述する。
【0048】
(2−2−1.塩基対置換型変異の解析)
一実施形態においては、1塩基対置換型変異が解析される。本実施形態においては、上述したように各オリジナルフラグメントからの1以上のリード配列をそれぞれ参照配列と比較し、各リード配列における該参照配列と塩基がマッチしない部位を検出する。これらの部位は、参照配列に対して塩基対置換型変異を有する変異部位として取得される。次いで、検出した変異部位の塩基の種類と変異前の塩基に基づいて、各変異を塩基の変異パターンに従って分類する。次いで、該塩基の変異パターンの各々について、出現頻度を決定する。これらの手順は、上述したPython等のプログラミング言語を用いて作成したプログラム等を用いて行うことができる。
【0049】
より詳細な例においては、リード配列に含まれる各塩基を下記(i)〜(iv)に分ける。
(i) 参照配列上の塩基がAである位置に存在する塩基
(ii) 参照配列上の塩基がTである位置に存在する塩基
(iii)参照配列上の塩基がGである位置に存在する塩基
(iv) 参照配列上の塩基がCである位置に存在する塩基
上記(i)及び(ii)は、参照配列の塩基対がATであった部位に存在する塩基であり、上記(iii)及び(iv)は、参照配列の塩基対がGCであった部位に存在する塩基である。これらの塩基の中から、参照配列と塩基がマッチしない(すなわち塩基対置換変異している)ものを検出する。次いで、検出された変異した塩基の各々について、上記(i)〜(iv)の分類に基づいて、参照配列の塩基情報から該変異部位に存在していた変異前の塩基対を求め、また各リード配列の塩基情報に基づいて変異後の塩基対を求める。これらのデータから、各変異を、変異前の塩基対がATであった場合について[AT→TA、AT→CG、及びAT→GC]の3パターン、変異前の塩基対がGCであった場合について[GC→TA、GC→CG、及びGC→AT]の3パターンの、全部で6つの塩基対の変異パターンに分類することができる。さらに、各変異パターンに属する変異の総数、及び解析した塩基の総数に基づいて、各変異パターンの出現頻度を決定することができる。例えば、AT、GC塩基対それぞれについての解析した塩基の総数に基づいて、各々の塩基対ごとに3種類の変異パターンの出現頻度を算出することができる。
【0050】
さらに、上記で得られた各変異の変異パターンを、オリジナル塩基に従ってさらに分類することができる。変異前の塩基対がATであった部位の変異のオリジナル塩基はA又はTであり、変異前の塩基対がGCであった部位の変異のオリジナル塩基はG又はCである。したがって、上記6つの塩基対の変異パターンのそれぞれは、オリジナル塩基に従ってさらに2つに分けることができる。このような分類は、細胞からのDNAの抽出又は単離の過程において生じた塩基の修飾によって生じたシーケンシングの読み取りエラーの除去に有用である。特に、G塩基は、DNA調製過程で酸化による化学修飾を受け、GをTとして読み間違えるエラーを起こしやすいことが知られている。通常であれば、塩基対の変異により該塩基対を構成する双方の塩基が変化するため、オリジナル塩基に従って2つに分けた塩基対の変異パターンは、同等の変異頻度を示すはずである。変異頻度がどちらかのオリジナル塩基に偏っていれば、塩基の修飾に起因するシーケンシングエラーが示唆される。
【0051】
本発明の別の一実施形態においては、多塩基対置換型変異が解析される。多塩基対置換型変異としては、例えば、2塩基対置換型変異及び3塩基対置換型変異が挙げられる。多塩基対置換型変異の解析の場合には、例えば、変異前の塩基配列に応じて変異パターンを分類し(例えば2塩基対置換型においては4×4=16通り)、次いで、各変異パターンに属する変異の総数、及び解析した変異の総数に基づいて、各変異パターンの出現頻度を決定することができる。
【0052】
(2−2−2.シーケンスコンテクスト解析)
近年、がん細胞のゲノム上に蓄積された変異情報から、変異原が引き起こした変異の要素(変異シグニチャー)を数学的手法で抽出するアプローチが提案されている。ヒトの様々ながんゲノムに蓄積された変異情報から、様々な変異シグニチャーが同定されている(Cell Rep, 2013, 3:246-259)。変異シグニチャーの理論においては、塩基対置換型変異の変異パターンを該塩基対が位置する前後のシーケンスコンテクストに基づいて分類する。シーケンスコンテクスト解析を行うことにより、塩基対置換型変異のより詳細な解析が可能になる。
【0053】
したがって、別の一実施形態として、1塩基対置換型変異のシーケンスコンテクスト解析の手順を示す。本実施形態においては、まず、上述したようにリード配列をそれぞれ参照配列と比較することによって、各リード配列における1塩基対置換型変異を検出する。次いで、検出した各変異について、該参照配列に基づいて、変異前の塩基と、該変異前の塩基の上流及び下流に隣接する塩基とを含む配列(いわゆるコンテクスト)を決定する。続いて、各変異を、塩基対の変異パターン及び該コンテクストに従ってタイプ分けする。すなわち、検出した変異を、上述した(2−2−1.)と同様の手順で、6つの塩基対の変異パターン[AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→AT]に分ける。一方で、検出した各変異を、コンテクストに従って分類する。例えば、変異部位の両隣の1塩基ずつを含めた3塩基長のコンテクストは、4×4の16群[例えば、Cからの変異の場合、ACA、ACC、ACG、ACT、CCA、CCC、CCG、CCT、GCA、GCC、GCG、GCT、TCA、TCC、TCG、及びTCT]に分類される。結果、各変異は、塩基対の変異パターンとコンテクストに従って、全部で96(4×6×4)のタイプに分類される。この解析に使用するコンテクストの配列は、変異前の塩基と、該変異前の塩基の上流に隣接する1以上の塩基と、該変異前の塩基の下流に隣接する1以上の塩基からなるものであればよい。またコンテクストの長さは、3塩基以上であればよいが、それに限定されるものではなく、必要に応じてさらに長いコンテクストを解析することも可能である。例えば、変異部位の両隣の2塩基ずつを含めた5塩基長のコンテクストに従うと、各変異は256群(4×4×4×4)に分類され、この分類と6つの塩基対パターンにより、各変異は最終的に全部で1536(4×4×6×4×4)のタイプに分類される。さらに変異部位の両隣のn塩基ずつを含めた2n+1塩基長のコンテクストに従うと、各変異は42n群に分類され、この分類と6つの塩基対パターンにより、各変異は最終的に全部で42n×6個のタイプに分類される。次いで、各変異タイプに属する変異の総数、及び解析した塩基の総数に基づいて、上記変異タイプの各々の変異頻度を決定することができる。
【0054】
(2−2−3.短い挿入・欠失変異の解析)
さらに別の一実施形態においては、短い挿入・欠失変異が解析される。本実施形態においては、上述したようにリード配列をそれぞれ参照配列と比較することによって、各リード配列における該参照配列に対して塩基が挿入又は欠失されている部位を検出する。これらの部位は、参照配列に対して挿入又は欠失変異を有する変異部位として取得される。さらに、取得された各変異について、変異のタイプ(挿入変異か又は欠失変異か)、該挿入もしくは欠失部位の塩基長、及び/又は挿入もしくは欠失した塩基の種類を決定する。本実施形態で検出される挿入もしくは欠失部位としては、好ましくは挿入もしくは欠失した塩基の長さが10bp以下、より好ましくは1〜5bpである部位がよいが、これに限定されない。特定の塩基長の挿入もしくは欠失部位を検出する手順は、上述したPython等のプログラミング言語を用いて作成したプログラムを用いて行うことができる。さらに、各リード配列と参照配列との比較によって、挿入もしくは欠失した塩基の種類を同定することができる。これらにより、各リード配列における挿入もしくは欠失部位の塩基長、及び/又は挿入もしくは欠失部位の塩基の種類を決定することができる。次いで、挿入もしくは欠失の頻度を、塩基長及び/又は塩基の種類ごとに決定する。例えば、各リード配列について取得した挿入もしくは欠失変異を塩基長ごとに分類し、それぞれの頻度を決定することができる。また例えば、挿入もしくは欠失した塩基をその種類(A、T、G、及びC)ごとに分類し、それぞれの頻度を決定することができる。さらに、該塩基長及び塩基の種類による分類を組み合わせたより細かい変異の分類を行い、それぞれの頻度を決定することができる。
【0055】
(2−3.変異頻度増加量の解析)
上述の手順に従ってリード配列と参照配列との比較により検出された変異は、シーケンシングにおける塩基読み取りエラーを含み得る。より高精度な変異解析のためには、このエラー成分を除去することが好ましい。エラー成分の除去は、解析対象の細胞集団の変異頻度から、対照の細胞集団の変異頻度を差し引くことによって行うことができる。さらに、解析対象の細胞集団が特定の条件に曝された細胞集団である場合、解析対象と対照との変異頻度の差を求めることによって、当該特定の条件が変異頻度に及ぼす影響の解析が可能になる。例えば、解析対象とする細胞集団が、特定の条件に曝された細胞集団、例えば、変異原に曝された細胞集団、薬物を投与された細胞集団などである場合、これらの条件に曝されていない同じ細胞集団を対照の細胞集団とする。この対照の細胞集団について、上記と同様の手順で塩基対置換型変異の解析、シーケンスコンテクスト解析、又は挿入・欠失変異の解析を行い、変異頻度を決定する。得られた対照の細胞集団の変異頻度を、解析対象の細胞集団の変異頻度から差し引く。これにより、解析対象の細胞集団の変異頻度からシーケンシングエラーの成分を除去するとともに、当該特定の条件による変異頻度の増加の有無、又は当該特定の条件下での対照に対する変異頻度増加量を調べることができる。さらに、変異頻度の解析を、上述したオリジナル塩基に従った分類に基づいて行うと、塩基の修飾に起因するシーケンシングエラーを検出することができるため好ましい。
【0056】
(3.応用)
上述した本発明による変異解析方法により、細胞集団に生じた変異を定量的かつ定性的に解析することができる。本発明の解析方法は、変異に関連する様々な解析又は評価に応用することができる。代表的な応用例としては、物質の遺伝毒性の評価、腫瘍発生に伴う変異の評価方法(例えば、がん細胞における変異の評価、及びcfDNAにおける変異の評価方法)、ならびに培養細胞の品質管理(例えば変異の有無又は変異タイプの評価等の遺伝情報の評価)である。
【0057】
したがって、本発明の好ましい実施形態として、試験物質の遺伝毒性の評価方法が提供される。該方法の具体的手順を以下に説明する。
【0058】
(3−1.物質の遺伝毒性の評価方法)
(3−1−1.塩基対置換型変異の解析に基づく評価)
本発明による試験物質の遺伝毒性の評価方法の一実施形態は、上述した塩基対置換型変異の解析に基づく。当該方法は、
(1)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む。
【0059】
上記工程(1)〜(6)については、上記(2.)、特に(2−2−1.)で述べたとおりである。より詳細には、1塩基対置換型変異を解析する場合、工程(5)では、各変異を、参照配列の塩基対がATである部位については[AT→TA、AT→CG、及びAT→GC]の3パターンの変異パターンに分類し、また参照配列の塩基対がGCである部位については[GC→TA、GC→CG、及びGC→AT]の3パターンに分類する。好ましくは、これらを組み合わせて全部で6つの塩基対の変異パターンに分類する。さらに、これら6つの塩基対の変異パターンを、オリジナル塩基の種類(ATであればAであるかTであるか、GCであればGであるかCであるか)に基づいて、それぞれさらに2群に分け、全部で12の変異パターンに分類してもよい。次いで工程(6)において、工程(5)で決定した変異パターンの各々について、変異頻度を決定する。これにより、各塩基対の変異パターンの変異頻度を決定することができる。
【0060】
好ましい実施形態においては、上記方法はさらに以下を包含する:
(7)該試験物質に曝露していない該細胞集団を対照群とし、該(1)〜(6)と同様の手順で、該対照群における各塩基対の変異パターンの変異頻度を決定すること;
(8)該(6)で得られた試験群における各変異パターンの変異頻度から、該(7)で得られた対照群における各変異パターンの変異頻度を引き算すること。
これにより、シーケンシングエラーの影響を除去した試験群における変異頻度増加量を求めることができる。
【0061】
(3−1−2.シーケンスコンテクスト解析に基づく評価)
本発明による試験物質の遺伝毒性の評価方法のさらなる一実施形態は、上述したシーケンスコンテクスト解析に基づく。当該方法は、
(1’)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2’)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3’)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4’)該(3’)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5’)取得した変異の各々について、該参照配列に基づいて、変異前の塩基と、該変異前の塩基の上流及び下流に隣接する塩基とを含むコンテクスト配列を決定すること;
(6’)該(4’)で取得した各変異を、該(5’)で決定したコンテクスト配列及び変異後の塩基の種類に従ってタイプ分けすること;
(7’)該(6’)で得られた変異タイプの各々の変異頻度を決定すること、
を含む。
【0062】
上記工程(1’)〜(7’)については、上記(2.)、特に(2−2−2.)で述べたとおりである。より詳細には、工程(6’)では、各変異を、上述した塩基対の6つの変異パターン[AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→AT]と、変異部位の両隣の塩基の種類に従う16群[たとえば、Cからの変異の場合、ACA、ACC、ACG、ACT、CCA、CCC、CCG、CCT、GCA、GCC、GCG、GCT、TCA、TCC、TCG、及びTCT]に基づいて、全部で96のタイプに分類する。次いで工程(7’)において、工程(6’)で決定した変異タイプの各々について、変異頻度を決定する。これにより、変異のタイプ及び変異頻度を決定することができる。
【0063】
好ましい実施形態においては、上記方法はさらに以下を包含する:
(8’)該試験物質に曝露していない該細胞集団を対照群とし、該(1’)〜(7’)と同じ手順で、対照群における各変異タイプの変異頻度を決定すること;
(9’)該(7’)で得られた試験群における各変異タイプの変異頻度から、該(8’)で得られた対照群における各変異タイプの変異頻度を引き算すること。
これにより、シーケンシングエラーの影響を除去した試験群における変異頻度増加量を求めることができる。
【0064】
(3−1−3.短い挿入もしくは欠失変異の解析に基づく評価)
本発明による試験物質の遺伝毒性の評価方法のさらなる一実施形態は、上述した短い挿入もしくは欠失変異の解析に基づく。当該方法は、
(1”)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2”)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3”)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列における該参照配列に対して塩基が挿入もしくは欠失した部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4”)該(3”)で検出した部位を、挿入もしくは欠失変異を有する変異部位として取得すること;
(5”)取得した変異の各々について、挿入もしくは欠失の塩基長、及び/又は挿入された塩基の種類を決定すること;
(6”)該(5”)で決定された挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること、
を含む。
【0065】
上記工程(1”)〜(6”)については、上記(2.)、特に(2−2−3.)で述べたとおりである。より詳細には、工程(3”)では、参照配列との比較により、各リード配列における挿入もしくは欠失部位であって、その挿入もしくは欠失した塩基の長さが好ましくは10bp以下、より好ましくは1〜5bpである部位を検出する。さらに挿入又は欠失が検出された場合、各リード配列の配列と参照配列との比較によって、挿入又は欠失した塩基の種類を同定することができる。これにより、各リード配列における挿入もしくは欠失部位の塩基長、及び/又は挿入もしくは欠失した塩基の種類を決定することができる(工程(5”))。次いで工程(6”)において、工程(5”)で決定された挿入もしくは欠失部位の塩基長、及び/又は挿入もしくは欠失した塩基の種類の各々について、変異頻度を決定する。これにより、変異パターン及び変異頻度を決定することができる。
【0066】
好ましい実施形態においては、上記方法はさらに以下を包含する:
(7”)該試験物質に曝露していない該細胞集団を対照群とし、該(1”)〜(6”)と同様の手順で、対照群における挿入もしくは欠失部位の塩基長及び/又は挿入もしくは欠失した塩基の種類ごとの変異頻度を決定すること;
(8”)前記(6”)で得られた試験群における挿入もしくは欠失部位の塩基長及び/又は挿入もしくは欠失した塩基の種類ごとの変異頻度から、該(7”)で得られた対照群における変異頻度を引き算すること。
これにより、シーケンシングエラーの影響を除去した試験群における変異頻度増加量を求めることができる。
【0067】
本発明による試験物質の遺伝毒性の評価方法によれば、試験物質への曝露によってそれぞれ異なる変異を生じている可能性のある細胞の集団について、該細胞集団レベルでの変異の傾向を解析することができる。したがって本発明によれば、従来の単一細胞ベースでの解析方法(例えば非特許文献4、5)と比べて、生体内における該試験物質による実際の影響により近い情報を得ることができる。また本発明によれば、細胞集団に対して試験物質が及ぼす影響を、DNA上の個々の塩基のレベルで定量的かつ定性的に解析することが可能であるため、試験物質の遺伝毒性に関するより詳細な情報を得ることができる。
【0068】
(3−2.腫瘍発生に伴う変異の評価方法)
(3−2−1.がん細胞における変異の評価方法)
本発明の別の好ましい実施形態として、がん細胞における変異の評価方法が提供される。該方法の具体的手順は、基本的には上述した試験物質の遺伝毒性の評価方法と同じである。ただし試験群としては、がん細胞の集団を使用する。あるいは、がん細胞集団の代わりに、がんが疑われる細胞や、がん化リスクを評価したい細胞の集団を試験群として用いてもよい。対照群としては、非がん細胞(例えば正常細胞)の集団やがん化リスクの低い細胞の集団を使用する。当該方法は、がん種に特有の変異の傾向を特定したり、がん化リスクを評価したり、がんの進行度や悪性度を確認するために有用である。がん細胞における変異の評価に関しては、(2−2−2.)に示したようなシーケンスコンテクスト解析により、より詳細な解析が可能になる。これまでにも、ヒトのがんゲノム解析において、変異を、3塩基のコンテクストに基づいて96通り(4×6×4)、あるいは5塩基のコンテクストに基づいて1536通り(4×4×6×4×4)に分類したことが報告されている(Cell Rep, 2013, 3:246-259)。
【0069】
本発明によるがん細胞における変異の評価方法によれば、従来のゲノム上の特定部位での変異の解析方法、すなわち、ゲノム上の同一箇所に対する複数のリード配列を整列させて比較する方法(例えば非特許文献4、5)のようながん組織中で選択を受けた結果としてがん組織中の細胞に一定以上の割合で存在する変異のみを抽出する方法と異なり、がん細胞集団全体に生じている当該がん種特有の変異の傾向を特定することができる。がん細胞中の変異の量や質は、がんの種類によって様々であることが報告されている(Nature, 2013, 500(7463):415-421)。本発明の方法によれば、がん細胞集団における変異の傾向を、定量的かつ定性的に解析することが可能であるため、がんの進行度や、種類の診断に有用である可能性が考えられる。
【0070】
さらに、これまでの変異シグニチャーの解析では、特定の原因によって腫瘍を誘発したと考えられる集団に対して、その集団内の各人から得られたゲノムDNAを解読し、従来法(例えば非特許文献4、5)に従ってがん組織中に一定以上の割合存在する変異を抽出した後、抽出した変異に対してシーケンスコンテクスト解析を行い、次いで各人から得られた変異情報を集計して、集団内の変異シグニチャーを同定する。しかし、個人の診断において変異シグニチャー解析を行う場合、同定される変異数が少ないため、得られたシーケンスコンテクストと既知の変異シグニチャーとの類似性の判断が難しい可能性がある。一方で、本発明によれば、図7及び8に示すように、1回の次世代シーケンシング解析によって、変異シグニチャーとの類似性を確認可能な品質のシーケンスコンテクストデータを得ることが可能である。これは、従来の方法と異なり、一定以上の割合を占めていない変異を解析対象に加えることによって、シーケンスコンテクストの解析に十分な量の変異数を確保できるためである。従って本発明は、個人の変異におけるシーケンスコンテクストのハイスループット解析に活用できると考えられる。
【0071】
(3−2−2.cfDNAにおける変異の評価方法)
本発明の別の好ましい実施形態として、血中セルフリーDNA(cfDNA)の解析が提供される。cfDNAは、ヒトの腫瘍形成の低侵襲な診断方法として着目されている。cfDNAは血漿や血清、尿などのリキッドバイオプシーから得られる。該方法のcfDNA解析への適用に関する具体的手順は、基本的には上述した試験物質の遺伝毒性の評価方法と同じである。ただし試験群のDNAとしては、がん細胞集団から取得したDNAの代わりに、がん患者のヒト等から採取したリキッドバイオプシー中のcfDNAを使用する。対照群としては、例えば健常なヒト由来のcfDNAや、予め採取しておいたがんを患う前の時点における同一のヒトのcfDNAを用いる。当該方法は、がん患者に特有のcfDNA中の変異の傾向を特定したり、がんの進行度や悪性度を確認したりするのに有用である。
【0072】
本発明によるcfDNAにおける変異の評価方法によれば、従来の解析方法、すなわち、cfDNAの各分子に固有のタグ配列を付加し、同一分子から得られる複数のリード配列のコンセンサス配列を得た上で、ゲノム上の同一箇所に複数のリード配列を整列させて比較する方法(非特許文献6、7を参照)のような、cfDNA中で一定の割合を占め、がん組織中の細胞に一定の割合で存在すると推定される変異のみを抽出する方法と異なり、がん細胞集団全体に生じている当該がん種特有の変異の傾向を特定することができる。cfDNAにおける変異の評価に関しては、(2−2−2.)に示したようなシーケンスコンテクスト解析により、より詳細な解析が可能になる。本発明の方法は、低侵襲性であり、かつがん細胞特有の変異の傾向の特定や、がんの進行度や悪性度の確認、低進行度の微小腫瘍の検出等に有用である。したがって、本発明の方法のがんの定期検診や健康診断等への適用が考えられる。
【0073】
(3−3.培養細胞の遺伝情報の評価方法)
本発明の別の好ましい実施形態として、培養細胞の遺伝情報の評価方法が提供される。該方法の具体的手順は、基本的には上述した試験物質の遺伝毒性の評価方法と同じである。ただし試験群としては、変異の有無を調べたい培養細胞の集団を使用する。例えば、試験群としては、ある一定期間継代した細胞であって、その変異の傾向を確認したいものなどが挙げられる。対照群としては、同じ種類の培養細胞であって、遺伝情報既知の(例えば変異の有無及びその変異タイプが確認されている)細胞の集団を使用する。例えば、対照群としては、継代に供する前の細胞などが挙げられる。当該方法によって、培養細胞の変異の有無又はその変異タイプを評価することができる。当該方法は、培養細胞の品質管理のために有用である。
【0074】
本発明による培養細胞の遺伝情報の評価方法によれば、個別の細胞に生じた変異ではなく、当該培養細胞集団に生じている当該培養細胞特有の変異の傾向を特定することができる。当該方法によれば、iPS細胞等の培養細胞において遺伝的な品質が保持されているか否か(変異が起こっていないか否か)を評価することができる。例えば、ヒト由来のiPS細胞を作成した場合に、その臨床適用をするにあたり遺伝的な品質管理を行うことは極めて重要である。iPS細胞のゲノムにおいては、その樹立の過程で、様々な変異を生じることが報告されている。これらは、患者への移植後に発がん等につながる可能性があり、その遺伝的な品質の管理は必須である(Nature, 2011, 471(7336):63-67)。本発明の方法を用いることによって、iPS細胞の集団において生じている変異の傾向を簡便にとらえることが可能になる。さらに本発明の方法は、PCRを用いた従来一般的なiPS細胞の品質評価方法に比べて網羅性の高い方法であり、かつ別の従来法であるSCIDマウスを用いた腫瘍形成法(PLoS One, 2012, 7(5):e37342)に比べて非常に安価であり得る。従って、本発明の方法は、iPS細胞の遺伝的な品質管理のための、簡便かつ安価なスクリーニング手法としても有用であろう。
【0075】
(3.4.各種条件)
上記実施形態のいずれにおいても、参照配列としては、試験群の細胞集団のDNA中の既知配列を使用することができる。該参照配列は、公共のデータベース等に登録されている配列を使用することが好ましいが、上記本発明の方法に先立って予めシーケンサー等で配列決定した該細胞集団のゲノムDNA中の配列であってもよい。
【0076】
本発明による試験物質の遺伝毒性の評価方法に使用される試験物質の例としては、その遺伝毒性を評価したい物質であれば特に制限されない。例えば、遺伝毒性を有すると疑われる物質、又は遺伝毒性の有無を確認したい物質、どのような変異を誘発するかを調べたい物質などが挙げられる。試験物質は、天然に存在する物質であっても、化学的もしくは生物学的方法等で人工的に合成した物質であってもよく、又は化合物であっても、組成物もしくは混合物であってもよい。あるいは、該試験物質は、紫外線や放射線などであってもよい。
【0077】
細胞集団を試験物質に曝露する手段は、試験物質の種類に応じて適宜選択すればよく、特に限定されない。例えば、細胞集団を含む培地に試験物質を添加する方法、細胞集団を試験物質の存在する雰囲気下に置く方法などが挙げられる。
【0078】
本発明の方法に使用される細胞集団の例としては、動物もしくは植物から採取した検体、及び動物、植物もしくは微生物由来の培養細胞の集団などが挙げられ、好ましくは、動物、植物もしくは微生物の株由来の培養細胞の集団が挙げられる。動物の例としては、好ましくはヒト等の哺乳動物や、カイコ、線虫などが挙げられ、微生物の例としては、好ましくは大腸菌、サルモネラ菌、酵母などが挙げられる。
【0079】
上記に列挙した細胞集団のうち、試験物質の遺伝毒性の評価方法においては、好ましくは微生物株由来の培養細胞の集団が使用され、より好ましくは大腸菌細胞の集団及びサルモネラ菌細胞の集団からなる群より選択される少なくとも1種が使用される。サルモネラ菌の好ましい例としては、S.Typhimurium LT−2株や、Ames試験に使用されるS.Typhimurium TA100株、TA98株、TA1535株、TA1538株、TA1537株等が挙げられる。大腸菌の好ましい例としては、同じくAmes試験に使用されるWP2株、WP2 uvrA株等が挙げられる。
【0080】
本発明に使用することができるがん細胞の種類は、特に限定されないが、例えば、肺がん、乳がん、前立腺がん、舌がん、喉頭もしくは咽頭がん、消化器がん(例えば食道がん、胃がん、十二指腸がん、大腸がん、結腸もしくは直腸がん等)、肝臓がん、膵臓がん、子宮頸がん、子宮体がん、腎細胞がん、腎盂がん、膀胱がん、脳腫瘍、骨腫瘍、白血病、リンパ腫、骨髄腫、皮膚がん、悪性黒色腫などが挙げられる。これらのがん細胞は、動物から採取した検体由来のものであってもよく、又は培養がん細胞株であってもよい。
【0081】
本発明の例示的実施形態として、さらに以下の物質、製造方法、用途、方法等を本明細書に開示する。ただし、本発明はこれらの実施形態に限定されない。
【0082】
〔1〕試験物質の遺伝毒性の評価方法であって、
(1)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む、方法。
【0083】
〔2〕好ましくは、前記(2)で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3)において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
〔1〕記載の方法。
【0084】
〔3〕好ましくは、前記(3)におけるリード配列と参照配列との比較により検出された部位の塩基のうち、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含む、〔1〕記載の方法。
【0085】
〔4〕好ましくは、前記(3)〜(5)が、
前記リード配列に含まれる塩基を下記(i)〜(iv)に分けること、
(i) 参照配列上の塩基がAである位置に存在する塩基
(ii) 参照配列上の塩基がTである位置に存在する塩基
(iii)参照配列上の塩基がGである位置に存在する塩基
(iv) 参照配列上の塩基がCである位置に存在する塩基
該リード配列に含まれる塩基の中から、参照配列と塩基がマッチしないものを検出し、当該塩基の存在する部位を、塩基対置換型変異を有する変異部位として取得すること、
検出されたマッチしない塩基の各々について、該変異部位における変異前及び変異後の塩基対を取得すること、及び
該変異部位の塩基対置換型変異を、変異前の塩基対と変異後の塩基対の種類に従って、AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→ATの6つの塩基対の変異パターンに分類すること、
を含む、〔1〕〜〔3〕のいずれか1項記載の方法。
【0086】
〔5〕好ましくは、前記6つの塩基対の変異パターンのそれぞれを、オリジナル塩基に従って2群に分類することをさらに含む、〔4〕記載の方法。
【0087】
〔6〕好ましくは、さらに、
(7)前記試験物質に曝露していない前記細胞集団を対照群とし、前記(1)〜(6)と同様の手順で、該対照群における各塩基対の変異パターンの変異頻度を決定すること;
(8)前記(6)で得られた試験群における各変異パターンの変異頻度から、該(7)で得られた対照群における各変異パターンの変異頻度を引き算すること、
を含む、〔1〕〜〔5〕のいずれか1項記載の方法。
【0088】
〔7〕試験物質の遺伝毒性の評価方法であって、
(1’)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2’)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3’)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4’)該(3’)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5’)取得した変異の各々について、該参照配列に基づいて、変異前の塩基と、該変異前の塩基の上流及び下流に隣接する塩基とを含むコンテクスト配列を決定すること;
(6’)該(4’)で取得した各変異を、該(5’)で決定したコンテクスト配列及び変異後の塩基の種類に従ってタイプ分けすること;
(7’)該(6’)で得られた変異タイプの各々の変異頻度を決定すること、
を含む、方法。
【0089】
〔8〕好ましくは、前記(2’)で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3’)において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
〔7〕記載の方法。
【0090】
〔9〕好ましくは、前記(3’)におけるリード配列と参照配列との比較により検出された部位の塩基のうち、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含む、〔7〕記載の方法。
【0091】
〔10〕好ましくは、前記(3’)〜(6’)が、
前記リード配列に含まれる塩基を下記(i)〜(iv)に分けること、
(i) 参照配列上の塩基がAである位置に存在する塩基
(ii) 参照配列上の塩基がTである位置に存在する塩基
(iii)参照配列上の塩基がGである位置に存在する塩基
(iv) 参照配列上の塩基がCである位置に存在する塩基
該リード配列に含まれる塩基の中から、参照配列と塩基がマッチしないものを検出し、当該塩基の存在する部位を、塩基対置換型変異を有する変異部位として取得すること、
検出されたマッチしない塩基の各々について、該変異部位における変異前及び変異後の塩基対を取得すること、
該変異部位の塩基対置換型変異を、変異前の塩基対と変異後の塩基対の種類に従って、AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→ATの6つの塩基対の変異パターンに分類すること、
該変異部位における変異前の塩基と、該変異前の塩基の上流に隣接する1以上の塩基と、該変異前の塩基の下流に隣接する1以上の塩基とからなるコンテクスト配列を決定すること、及び
該6つの塩基対の変異パターンと該コンテクスト配列に従って、該塩基対置換型変異をタイプ分けすること、
を含む、〔7〕〜〔9〕のいずれか1項記載の方法。
【0092】
〔11〕好ましくは、前記コンテクスト配列が、変異部位における変異前の塩基と、その両隣の1塩基ずつを含めた3塩基長の配列であり、かつ前記6つの塩基対の変異パターンと該3塩基長のコンテクスト配列に従って、前記塩基対置換型変異が96にタイプ分けされる、〔10〕記載の方法。
【0093】
〔12〕好ましくは、さらに、
(8’)前記試験物質に曝露していない前記細胞集団を対照群とし、前記(1’)〜(7’)と同じ手順で、対照群における各変異タイプの変異頻度を決定すること;
(9’)前記(7’)で得られた試験群における各変異タイプの変異頻度から、該(8’)で得られた対照群における各変異タイプの変異頻度を引き算すること、
を含む、〔7〕〜〔11〕のいずれか1項記載の方法。
【0094】
〔13〕試験物質の遺伝毒性の評価方法であって、
(1”)試験物質に曝露した細胞集団を試験群とし、そのDNAを取得すること;
(2”)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3”)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列における該参照配列に対して塩基が挿入もしくは欠失した部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4”)該(3”)で検出した部位を、挿入もしくは欠失変異を有する変異部位として取得すること;
(5”)取得した変異の各々について、挿入もしくは欠失の塩基長、及び/又は挿入された塩基の種類を決定すること;
(6”)該(5”)で決定された挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること、
を含む、方法。
【0095】
〔14〕好ましくは、前記(2”)で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3”)において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
〔13〕記載の方法。
【0096】
〔15〕好ましくは、前記(3”)におけるリード配列と参照配列との比較により検出された部位の塩基のうち、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含む、〔13〕記載の方法。
【0097】
〔16〕検出される挿入もしくは欠失した部位の塩基長が、好ましくは10bp以下、より好ましくは1〜5bpである、〔13〕〜〔15〕のいずれか1項記載の方法。
【0098】
〔17〕好ましくは、さらに、
(7”)前記試験物質に曝露していない前記細胞集団を対照群とし、前記(1”)〜(6”)と同様の手順で、対照群における挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること;
(8”)前記(6”)で得られた試験群における挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度から、該(7”)で得られた対照群における該変異頻度を引き算すること、
を含む、〔13〕〜〔16〕のいずれか1項記載の方法。
【0099】
〔18〕好ましくは、前記塩基対置換型変異が、1塩基対置換型変異、2塩基対置換型変異、又は3塩基対置換型変異である、〔1〕〜〔12〕のいずれか1項記載の方法。
【0100】
〔19〕好ましくは、前記細胞集団が、サルモネラ菌細胞集団および大腸菌細胞集団からなる群より選択される少なくとも1種である、〔1〕〜〔18〕のいずれか1項記載の方法。
【0101】
〔20〕好ましくは、前記サルモネラ菌がS.Typhimurium LT−2株、TA100株、TA98株、TA1535株、TA1538株又はTA1537株である、〔19〕記載の方法。
【0102】
〔21〕がん細胞における変異の評価方法であって、
(1)がん細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む、方法。
【0103】
〔22〕培養細胞の遺伝情報の評価方法であって、
(1)培養細胞集団を試験群とし、そのDNAを取得すること;
(2)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4)該(3)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5)取得した各変異を、塩基対の変異パターンに従って分類すること;
(6)該(5)で得られた変異パターンの各々の変異頻度を決定すること、
を含む、方法。
【0104】
〔23〕好ましくは、前記(2)で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(4)において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
〔21〕又は〔22〕記載の方法。
【0105】
〔24〕好ましくは、前記(3)におけるリード配列と参照配列との比較により検出された部位の塩基のうち、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含む、〔21〕又は〔22〕記載の方法。
【0106】
〔25〕好ましくは、前記(3)〜(5)が、
前記リード配列に含まれる塩基を下記(i)〜(iv)に分けること、
(i) 参照配列上の塩基がAである位置に存在する塩基
(ii) 参照配列上の塩基がTである位置に存在する塩基
(iii)参照配列上の塩基がGである位置に存在する塩基
(iv) 参照配列上の塩基がCである位置に存在する塩基
該リード配列に含まれる塩基の中から、参照配列と塩基がマッチしないものを検出し、当該塩基の存在する部位を、塩基対置換型変異を有する変異部位として取得すること、
検出されたマッチしない塩基の各々について、該変異部位における変異前及び変異後の塩基対を取得すること、及び
該変異部位の塩基対置換型変異を、変異前の塩基対と変異後の塩基対の種類に従って、AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→ATの6つの塩基対の変異パターンに分類すること、
を含む、〔21〕〜〔24〕のいずれか1項記載の方法。
【0107】
〔26〕好ましくは、前記6つの塩基対の変異パターンのそれぞれを、オリジナル塩基に従って2群に分類することをさらに含む、〔25〕記載の方法。
【0108】
〔27〕好ましくは、さらに、
(7)前記(1)〜(6)と同様の手順で、対照群における各塩基対の変異パターンの変異頻度を決定すること;
(8)前記(6)で得られた試験群における各変異パターンの変異頻度から、該(7)で得られた対照群における各変異パターンの変異頻度を引き算すること、
を含む、〔21〕〜〔26〕のいずれか1項記載の方法。
【0109】
〔28〕好ましくは、
前記方法が、がん細胞における変異の評価方法であり、前記対照群が、非がん細胞集団であるか、又は、
前記試験群が、がんが疑われる細胞又はがん化リスクを評価したい細胞の集団であり、前記対照群が、非がん細胞集団又はがん化リスクの低い細胞の集団であり、かつ前記方法によって細胞のがん化リスクが評価される、
〔27〕記載の方法。
【0110】
〔29〕好ましくは、前記方法が、培養細胞の遺伝情報の評価方法であり、前記対照群が、前記試験群と同じ種類の培養細胞であって、遺伝情報既知の細胞の集団である、〔27〕記載の方法。
【0111】
〔30〕がん細胞における変異の評価方法であって、
(1’)がん細胞集団を試験群とし、そのDNAを取得すること;
(2’)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3’)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4’)該(3’)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5’)取得した変異の各々について、該参照配列に基づいて、変異前の塩基と、該変異前の塩基の上流及び下流に隣接する塩基とを含むコンテクスト配列を決定すること;
(6’)該(4’)で取得した各変異を、該(5’)で決定したコンテクスト配列及び変異後の塩基の種類に従ってタイプ分けすること;
(7’)該(6’)で得られた変異タイプの各々の変異頻度を決定すること、
を含む、方法。
【0112】
〔31〕培養細胞の遺伝情報の評価方法であって、
(1’)培養細胞集団を試験群とし、そのDNAを取得すること;
(2’)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3’)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4’)該(3’)で検出した部位を、塩基対置換型変異を有する変異部位として取得すること;
(5’)取得した変異の各々について、該参照配列に基づいて、変異前の塩基と、該変異前の塩基の上流及び下流に隣接する塩基とを含むコンテクスト配列を決定すること;
(6’)該(4’)で取得した各変異を、該(5’)で決定したコンテクスト配列及び変異後の塩基の種類に従ってタイプ分けすること;
(7’)該(6’)で得られた変異タイプの各々の変異頻度を決定すること、
を含む、方法。
【0113】
〔32〕好ましくは、前記(2’)で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3’)において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
〔30〕又は〔31〕記載の方法。
【0114】
〔33〕好ましくは、前記(3’)におけるリード配列と参照配列との比較により検出された部位の塩基のうち、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含む、〔30〕又は〔31〕記載の方法。
【0115】
〔34〕好ましくは、前記(3’)〜(6’)が、
前記リード配列に含まれる塩基を下記(i)〜(iv)に分けること、
(i) 参照配列上の塩基がAである位置に存在する塩基
(ii) 参照配列上の塩基がTである位置に存在する塩基
(iii)参照配列上の塩基がGである位置に存在する塩基
(iv) 参照配列上の塩基がCである位置に存在する塩基
該リード配列に含まれる塩基の中から、参照配列と塩基がマッチしないものを検出し、当該塩基の存在する部位を、塩基対置換型変異を有する変異部位として取得すること、
検出されたマッチしない塩基の各々について、該変異部位における変異前及び変異後の塩基対を取得すること、
該変異部位の塩基対置換型変異を、変異前の塩基対と変異後の塩基対の種類に従って、AT→TA、AT→CG、AT→GC、GC→TA、GC→CG、及びGC→ATの6つの塩基対の変異パターンに分類すること、
該変異部位における変異前の塩基と、該変異前の塩基の上流に隣接する1以上の塩基と、該変異前の塩基の下流に隣接する1以上の塩基とからなるコンテクスト配列を決定すること、及び
該6つの塩基対の変異パターンと該コンテクスト配列に従って、該塩基対置換型変異をタイプ分けすること、
を含む、〔30〕〜〔33〕のいずれか1項記載の方法。
【0116】
〔35〕好ましくは、前記コンテクスト配列が、変異部位における変異前の塩基と、その両隣の1塩基ずつを含めた3塩基長の配列であり、かつ前記6つの塩基対の変異パターンと該3塩基長のコンテクスト配列に従って、前記塩基対置換型変異が96にタイプ分けされる、〔34〕記載の方法。
【0117】
〔36〕好ましくは、さらに、
(8’)前記(1’)〜(7’)と同じ手順で、対照群における各変異タイプの変異頻度を決定すること;
(9’)前記(7’)で得られた試験群における各変異タイプの変異頻度から、該(8’)で得られた対照群における各変異タイプの変異頻度を引き算すること、
を含む、〔30〕〜〔35〕のいずれか1項記載の方法。
【0118】
〔37〕好ましくは、
前記方法が、がん細胞における変異の評価方法であり、前記対照群が、非がん細胞集団であるか、又は、
前記試験群が、がんが疑われる細胞又はがん化リスクを評価したい細胞の集団であり、前記対照群が、非がん細胞集団又はがん化リスクの低い細胞の集団であり、かつ前記方法によって細胞のがん化リスクが評価される、
〔36〕記載の方法。
【0119】
〔38〕好ましくは、前記方法が、培養細胞の遺伝情報の評価方法であり、前記対照群が、前記試験群と同じ種類の培養細胞であって、遺伝情報既知の細胞の集団である、〔36〕記載の方法。
【0120】
〔39〕がん細胞における変異の評価方法であって、
(1”)がん細胞集団を試験群とし、そのDNAを取得すること;
(2”)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3”)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列における該参照配列に対して塩基が挿入もしくは欠失した部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4”)該(3”)で検出した部位を、挿入もしくは欠失変異を有する変異部位として取得すること;
(5”)取得した変異の各々について、挿入もしくは欠失の塩基長、及び/又は挿入された塩基の種類を決定すること;
(6”)該(5”)で決定された挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること、
を含む、方法。
【0121】
〔40〕培養細胞の遺伝情報の評価方法であって、
(1”)培養細胞集団を試験群とし、そのDNAを取得すること;
(2”)該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;
(3”)該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列における該参照配列に対して塩基が挿入もしくは欠失した部位を検出すること、ここで該参照配列は、該DNA中の既知配列である;
(4”)該(3”)で検出した部位を、挿入もしくは欠失変異を有する変異部位として取得すること;
(5”)取得した変異の各々について、挿入もしくは欠失の塩基長、及び/又は挿入された塩基の種類を決定すること;
(6”)該(5”)で決定された挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること、
を含む、方法。
【0122】
〔41〕好ましくは、前記(2”)で得られたリード配列の塩基から、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含み、かつ
前記(3”)において、該抽出されたリード配列上の塩基を参照配列の塩基と比較する、
〔39〕又は〔40〕記載の方法。
【0123】
〔42〕好ましくは、前記(3”)におけるリード配列と参照配列との比較により検出された部位の塩基のうち、シーケンシングによる読み取りの信頼度の高い塩基を抽出することをさらに含む、〔39〕又は〔40〕記載の方法。
【0124】
〔43〕検出される挿入もしくは欠失した部位の塩基長が、好ましくは10bp以下、より好ましくは1〜5bpである、〔39〕〜〔42〕のいずれか1項記載の方法。
【0125】
〔44〕好ましくは、さらに、
(7”)前記(1”)〜(6”)と同様の手順で、対照群における挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度を決定すること;
(8”)前記(6”)で得られた試験群における挿入もしくは欠失部位の塩基長及び/又は挿入された塩基の種類ごとの変異頻度から、該(7”)で得られた対照群における該変異頻度を引き算すること、
を含む、〔39〕〜〔43〕のいずれか1項記載の方法。
【0126】
〔45〕好ましくは、
前記方法が、がん細胞における変異の評価方法であり、前記対照群が、非がん細胞集団であるか、又は、
前記試験群が、がんが疑われる細胞又はがん化リスクを評価したい細胞の集団であり、前記対照群が、非がん細胞集団又はがん化リスクの低い細胞の集団であり、かつ前記方法によって細胞のがん化リスクが評価される、
〔44〕記載の方法。
【0127】
〔46〕好ましくは、前記方法が、培養細胞の遺伝情報の評価方法であり、前記対照群が、前記試験群と同じ種類の培養細胞であって、遺伝情報既知の細胞の集団である、〔44〕記載の方法。
【0128】
〔47〕好ましくは、前記塩基対置換変異が、1塩基対置換型変異、2塩基対置換型変異、又は3塩基対置換型変異である、〔21〕〜〔38〕のいずれか1項記載の方法。
【0129】
〔48〕前記検出に用いるリード配列の総量が、好ましくは1×1010bp以下、より好ましくは1×109bp以下、さらに好ましくは1×108bp以下、よりさらに好ましくは1×107bp以下、なお好ましくは1×106bp以下である、〔1〕〜〔47〕のいずれか1項記載の方法。
【実施例】
【0130】
以下、実施例を示し、本発明をより具体的に説明する。
【0131】
実施例1 解析方法のバリデーション
本実施例では、変異頻度既知の合成DNAサンプルを本発明の試験方法で解析して変異を定性及び定量評価することによって、本発明の解析方法の有効性を検証した。
【0132】
1.DNAサンプルの調製
様々な変異パターンを既知の量で含む合成DNAサンプルを調製した。模式図1に、DNAサンプル調製手順の概念図を示す。1000bpのランダムな配列を有する合成DNA配列(配列番号1;以下、ランダムDNA配列と称する)を合成した。このランダムDNA配列には、GC、AT塩基対が約50%ずつ存在した。このランダムDNA配列をベースに、変異(塩基対置換型変異又は短い挿入・欠失変異)を導入したDNA配列(以下、変異DNA配列とする)を調製した。以下に詳細を説明する。
【0133】
塩基対置換型変異を含む変異DNA配列については、ランダムDNA配列の中心に位置するGC塩基対(501番目)を他の塩基対(GC→TA、CG又はAT、表1参照)で置換した3種類の変異配列を作製し、それぞれpTAKN−2ベクターに組み込んだ。得られたベクターをTEバッファー(pH8.0、和光純薬工業社製)に溶解し、100ng/μLの濃度に調整し、各変異DNA配列を含む溶液を等量混合した。同様に、AT塩基対(502番目)を他の塩基対(AT→TA、CG又はGC、表1参照)で置換した3種類の変異配列を作製し、それぞれpTAKN−2ベクターに組み込み、ベクターのTEバッファー溶液(100ng/μL)を調製し、得られた3種類の溶液を等量混合した。各々の等量混合溶液を変異DNA溶液とした。また、該変異DNA溶液10μLを90μLのTEバッファーと混合して、10倍希釈変異DNA溶液を調製した。さらに該10倍希釈変異DNA溶液10μLを90μLのTEバッファーを混合して、100倍希釈変異DNA溶液を調製した。別途、ランダムDNA配列をpTAKN−2ベクターに組み込み、ベクターのTEバッファー溶液(100ng/μL)を調製した(ランダムDNA溶液)。ランダムDNA溶液に、変異DNA溶液、10倍希釈変異DNA溶液、又は100倍希釈変異DNA溶液を混合し、各塩基対置換が均等の頻度で認められ、かつ総変異頻度が1/103、1/104、1/105、1/106bpのDNAサンプルを調製した(表2参照)。
【0134】
短い挿入・欠失変異を含む変異DNA配列については、501番塩基対の前に一塩基(A、すなわちAT塩基対)を挿入した変異配列を作製した(表1参照)。これを上記と同様にpTAKN−2ベクターに組み込み、ベクターのTEバッファー溶液(100ng/μL)を調製して変異DNA溶液とした。また、該変異サンプル溶液の10倍及び100倍希釈変異DNA溶液を調製した。ランダムDNA溶液に、変異DNA溶液、10倍希釈変異DNA溶液、又は100倍希釈変異DNA溶液を混合し、総変異頻度が1/103、1/104、及び1/105、1/106bpのDNAサンプルを調製した(表2参照)。各変異DNA溶液を含むDNAサンプルを変異サンプル、変異DNA溶液を含まない(ランダムDNA溶液のみの)DNAサンプルを対照サンプルとして、以下のシーケンシングを行った。
【0135】
【化1】
【0136】
【表1】
【0137】
【表2】
【0138】
2.高スループットシーケンシング
1.で調製した各変異サンプル及び対照サンプルについて、次世代シーケンサーHiSeq2500(イルミナ社製、以下、HiSeqとも称する)を用いて標準プロトコールに従って、塩基配列を解読した。その際、DNAは超音波処理により平均約150bpの長さにフラグメント化し、各フラグメント両端にアダプターを付加して、2×125bpのリード長でシーケンシングした。サンプルあたり、平均で1.9Gbpの塩基配列情報を得た。
【0139】
3.リード配列の編集及び変異解析用フォーマットの作製
シーケンシングによって得られたリード配列の編集及び解析フローの概念図を模式図2に示す。まず、Cutadaptソフトウェア(Martin,2011)を用い、各リード末端のアダプター配列の除去及び、クオリティの低い塩基の除去を行った。
i)HiSeqでは、シーケンシングに供されたDNAフラグメント(オリジナルフラグメント)一つにつき、片側からリード1配列を読み取った後、反対側からそのペアとなるリード2配列を取得する。そこで、Cutadaptの選定をパスした各ペアのリード配列について、PEARソフトウェアを用い、両リードの配列が対を形成する部分を重ね合わせ、一本の合成リード(Conjugated Read)を構築した。合成リードの配列の塩基は、全てリード1にあわせた。合成リードにおける各塩基のクオリティ値は、リード1とリード2の塩基が相補的である場合には両塩基のクオリティ値の和、両リードの塩基が相補的でない場合にはクオリティ値の大きい方の値から小さい方のクオリティ値を引いた値を採用した。これにより、クオリティ値の違いにしたがって、合成リードにおける各塩基のうち、リード1と2の塩基が対形成していたものを選別することができる。
ii)作製した各オリジナルフラグメントについての合成リードを、Bowtie2ソフトウェアを用いて、参照配列(ランダムDNA配列を挿入したpTAKN−2ベクターの配列)にマッピングし、Samフォーマットのファイルを作成した。
iii)得られたSamファイルを、Samtoolsソフトウェアを用いてpileupフォーマットに変換した。この際、塩基のクオリティ値をもとに、解析対象の塩基情報を、ペアのリードの重なり領域において両リードの塩基が相補的に対形成していた範囲に限定した。
iv)得られたpileupフォーマットを、プログラミング言語Pythonを用いて作成したプログラムを用いた変異解析に供した。
【0140】
【化2】
【0141】
4.変異解析
1)塩基対置換型変異の検出
1塩基対置換型変異についての変異解析アルゴリズムの概念図を模式図3に示す。解析に供したpileupフォーマットから、プログラミング言語Pythonを用いて作成したプログラムを用いて、リード配列中の全解析対象塩基を、対応する参照配列の塩基がAである群、Tである群、Gである群、及びCである群の4群に分類した。次いで、各群に振り分けられた塩基の総数、及び変異した塩基を検出した。得られたデータから、変異前のAT塩基対106bpあたりに占めるAT塩基対の各変異パターン(AT→TA、AT→CG、AT→GC)の変異コール割合、及び変異前のGC塩基対106bpあたりに占めるGC塩基対の各変異パターン(GC→TA、GC→CG、GC→AT)の変異コール割合を算出した。
【0142】
【化3】
【0143】
塩基対置換型変異を含む変異サンプルにおける、GC及びAT塩基対それぞれの各変異パターンの変異コール割合を図1に示す。いずれの変異パターンについても、サンプル中の変異頻度に依存して変異コール割合が上昇した。対照サンプルでも変異が検出されたが、これは背景エラー(シーケンシングエラーを含むサンプル調製からシーケンシングの過程で生じたエラー)を表す。さらに、対照サンプルでも変異コール割合は変異パターンごとに異なっており、GC塩基対は、AT塩基対に比べて変異コール割合が高い傾向にあった。これは、GC塩基対がDNA抽出等のライブラリ作製過程で、酸化等の化学修飾の影響を受けやすいことが原因と考えられる。
【0144】
2)変異頻度増加量の算出
次に、変異サンプルの変異コール割合から、対照サンプルの変異コール割合を差し引くことによって、シーケンスエラーを含む背景エラーを除外し、対照サンプルに対する変異サンプルでの変異頻度の増加量(以下、変異頻度増加量という)を算出した。算出した変異頻度増加量を図2に示す。いずれの変異パターンにおいても、変異頻度増加量と、導入した変異頻度は概ね一致しており、本方法により約105bpに一つの頻度の塩基対置換型変異を検出できたことが示された。
【0145】
3)短い挿入・欠失変異の検出
短い挿入・欠失変異については、プログラミング言語Pythonを用いて作成したプログラムを用いて、ランダムDNA配列に対して10bp以下の長さで挿入又は欠失した塩基を全て検出し、その挿入又は欠失長さ(bp)、及び挿入又は欠失塩基の種類ごとに出現頻度を計数した。さらに、前述した塩基対置換型変異の解析と同様に、対照サンプルの変異頻度を差し引いて背景エラーを除外し、変異頻度増加量を算出した。挿入変異の変異頻度増加量の結果を図3に示す。図3Aは挿入された塩基の長さ(bp)、図3Bは挿入された塩基の種類について、変異頻度増加量を示している。本方法により、約105bpに一つの頻度の短い挿入変異を検出することができた。また、挿入変異と同様の方法により一塩基欠失についても検討し、約105bpに一つの頻度の短い欠失変異を検出することができた(データは示さない)。
【0146】
5.結論
本実施例では、様々な変異情報を含むDNAにおける塩基対置換型変異、及び短い挿入・欠失変異について、量(頻度)及び質(変異パターン)を含む総合的な変異情報を高感度に取得することができた。これらの結果から、本発明の解析方法によりDNA中に存在する低頻度の変異を定性的かつ定量的に解析できることが示された。
【0147】
実施例2 変異原による遺伝毒性の解析
本実施例では、本発明の解析方法による、変異原への曝露によって生物のゲノムに生じた変異パターンの定性及び定量解析により、該変異原の遺伝毒性を解析した。変異原としてEthylnitrosourea(ENU、CAS No.759−73−9)を用いた。変異原に曝露する生物として、塩基対置換型の変異を検出可能な、Ames試験に汎用されるサルモネラ菌TA100株を使用した。実験は、独立した3回の操作を行い、サンプルを調製した(n=3)。
【0148】
1.TA100株の変異原への曝露
変異原への曝露は、Ames試験のプレインキュベーション法(K. Mortelmans et al., Mutat. Res. - Fundam. Mol. Mech. Mutagen., 2000, 455, 29-60)に準拠して実施した。TA100株を2mLのニュートリエントブイヨン No.2(Oxoid社製)に植菌し、37℃、180rpmで4時間振とう培養し、O.D.660値が1.0以上の前培養液を得た。ENU(54%;シグマアルドリッチ社製)は、ジメチルスルホキシド(DMSO;和光純薬工業製)で希釈した。試験管内に、適切な濃度に希釈したENU溶液100μL、0.1Mリン酸バッファー500μL、及び前培養液100μLを添加し(ENU濃度:67.5、135、270、405、540、810、及び1080μg/tube、37℃のウォーターバス中で20分間、100rpmで振とう培養した。対照群としては、ENU溶液の代わりに溶媒(DMSO)100μLを添加した。20分間振とう培養後、培養液を含む試験管をウォーターバスから取り出し、予め分注しておいた2mLのNutrient Broth溶液に培養液50μLを添加し、37℃、180rpmで14時間追培養した後、菌懸濁液を1mL回収し、7500rpmで5分間遠心し、上清を除去し、菌体を回収した。
【0149】
また、Ames試験用に、上記と同様の条件でENUを曝露した菌懸濁液を作製し、45℃に加温した2mLのtop agar(1%NaCl、1%agar、0.05mM Histidine及び0.05mM Biotineを含む)を添加し、ボルテックスで懸濁した後、最小グルコース寒天培地(テスメディア(登録商標)AN;オリエンタル酵母工業製)上に重層した。得られたプレートを37℃で48時間培養後、観察されたコロニーを計数した。
【0150】
2.Total DNAの回収
1.で得られた菌体から、DNeasy Blood & Tissue Kit(キアゲン社製)を用い、推奨プロトコールに従って、Total DNAを回収した。
【0151】
3.高スループットシーケンス
2.で回収した対照群及びENU処理群からのTotal DNA液を用いて、次世代シーケンサーHiSeq2500(イルミナ社製)により、標準プロトコールに従って塩基配列を解読した。その際、DNAは超音波処理により平均約150bpの長さにフラグメント化し、各フラグメント両端にアダプターを付加して、2×125bpのリード長でシーケンシングした。サンプルあたり、平均で5.0Gbpの塩基配列情報を得た。
【0152】
4.リード配列の編集及び変異解析
シーケンシングによって得られたリード配列の編集及び変異解析は、実施例1と同様に、模式図2に示す解析フローの概念図に従って、Cutadaptソフトウェア、PEARソフトウェア、Bowtie2ソフトウェア、Samtoolsソフトウェア、及びプログラミング言語Pythonを用いて作成したプログラムを用いて行った。本実施例においては、Bowtie2ソフトウェアでのマッピング後、Picard tools(broadinstitute.github.io/picard/)を用いて、PCR duplicatesの除去を行った。
【0153】
Bowtie2ソフトウェアでマッピングする参照配列は、S.Typhimurium TA100株のゲノム配列をもとに構築した。まず、TA100株からDNAを抽出し、次世代シーケンサーHiSeq2500(イルミナ社製)により、標準プロトコールに従って塩基配列を解読した。その際、DNAは超音波処理により平均約300bpの長さにフラグメント化し、各フラグメント両端にアダプターを付加して、2×125bpのリード長でシーケンシングした。得られたリード配列をS.Typhimurium LT−2株のゲノム配列とpSLTプラスミド配列(GCA000006945.2)、およびR46プラスミド配列(NC_003292.1)にマッピング後、Samtoolsソフトウェアを用いて変異検出を行った。得られた変異情報を反映したTA100株のゲノム配列に基づく参照配列を作製し、変異解析に使用した。TA100株のゲノム配列を配列番号2に示す。
【0154】
5.変異頻度増加量の算出
実施例1と同様の手順で、プログラミング言語Pythonを用いたプログラムを用いて、参照配列に対してマッピングされた全リード配列中の全解析対象塩基を、対応する参照配列の塩基によって4群に振り分け、次いで各群の塩基の総数、及び参照配列に対して変異した塩基を検出した。変異した塩基を参照配列の塩基と比較することで、ENU処理群及び対照群それぞれについて、解析対象塩基中におけるAT塩基対、GC塩基対の各106bpにおける各変異パターン(AT→TA、AT→CG、AT→GC、及びGC→TA、GC→CG、GC→AT)、及び各変異パターンの変異コール割合を算出した。対照群とENU処理群間における各変異パターンの頻度についての統計学的検定は、変異パターンごとにDunnettの多重比較検定にて行った。
【0155】
次いで、実施例1の2)と同様の手順で各塩基対の変異パターンごとに、ENU処理群の変異コール割合から対照群の変異コール割合を差し引くことにより、ENU曝露による変異頻度増加量を算出した。
【0156】
6.シーケンスコンテクスト解析
本検討では、シーケンスコンテクストに基づいて変異コール割合を解析した。すなわち、5.で得られた変異コール情報及び参照配列の情報をもとに、各々の変異コール箇所の塩基対の変異タイプを検出した。さらに参照配列の情報をもとに、各変異コール箇所及びその両隣の塩基を含む3塩基の情報を収集した。各変異コール箇所の変異を、6通りの塩基対変異タイプに、その両隣の塩基情報(4×4=16通り)をかけ合わせた96通りのタイプに分類した。このシーケンスコンテクストに基づく96通りの変異タイプについて、各々の変異コール割合(/106bp)を算出した。各変異タイプについて、ENU処理群における変異コール割合から対照群の変異コール割合を差し引くことにより、ENU曝露による変異頻度増加量を算出した。
【0157】
7.結果
1)Ames試験の復帰突然変異体数
表3にENU曝露後の復帰突然変異コロニー数を示す。データは3枚のプレートの測定値の平均及び標準偏差を示す。ENU曝露により、復帰変異突然変異体数の増加が認められたことから、ENU曝露によりTA100株のゲノム中に変異が導入されたことが示された。
【0158】
【表3】
【0159】
2)ENU曝露による変異コール割合の変化の算出
ENU処理群(ENU濃度135、270、405及び540μg/tube)について、5.で算出した変異頻度増加量を図4に示す。ENU曝露によって、複数の塩基対の変異パターンの頻度に増加が認められた。GC塩基対においては、GC>AT変異の頻度の増加が認められた(図4A)。一方、AT塩基対においては、主にAT>TA、及びAT>GC変異の頻度の増加が認められた(図4B)。
【0160】
3)各変異パターンのオリジナル塩基による分類
HiSeqにおいては、リード1の配列がシーケンシング反応に供された元のDNA断片(オリジナルフラグメント)に対応している。したがって、リード1配列の塩基が参照配列のA、T、G及びCのいずれの塩基にマップされたかを調べることにより、オリジナルフラグメントの変異箇所における変異前の塩基(すなわち、オリジナル塩基)を確認できる。
背景エラー頻度はオリジナル塩基によって異なり得るため、変異パターンをオリジナル塩基に従ってさらに分類し、各分類の変異頻度増加量を求めた。すなわち、上記5.で求めた対照サンプル及び変異サンプルにおける6つの塩基対変異パターンのそれぞれを、オリジナル塩基の種類によってさらに2つずつに分類し、各分類の変異頻度を求めた。次いで、変異サンプルの変異頻度から対応する対照サンプルの変異頻度を差し引いて、変異頻度増加量を算出した。
【0161】
図5はENU暴露サンプルにおけるオリジナル塩基の種類ごとに分けた塩基対の変異パターンの変異頻度増加量を示している。通常、ENUの曝露によってゲノム中に固定された変異の場合、塩基対の双方の塩基が変化するため、塩基対を形成するどちらの塩基においても同等の頻度で変異頻度の増加が認められる。しかし、図5中のGC>TA変異においては、明らかにオリジナル塩基がGの場合にオリジナル塩基がCの場合と比べて変異頻度が高い傾向が認められた。
【0162】
上記のバイアスは、GC>TA変異の大部分が、化学修飾されたGによって引き起こされたことを強く示唆している。すなわち、本検討で認められたGC>TA変異の増加は、ゲノム内に固定された変異ではなく、シーケンシングにおける化学修飾されたG塩基の読み取りエラーを反映しているものと考えられた。G塩基は、DNAサンプルの調製過程で酸化による化学修飾を受けやすく、シーケンシングにおけるGをTとして読み間違えるエラーを起こしやすいことが知られている。したがって、本検討においていくつかのサンプルで認められたGC>TA変異頻度の増加は、DNA調製過程にGが酸化されたことにより生じた人為的影響であると考えられた。よって本解析方法により、細胞からのDNAサンプル調製過程で生じるエラーを原因としたシーケンシングエラーを取り除くことができることが示唆された。
【0163】
4)変異スペクトル解析
次に、ENU540μg/tube群で増加の認められた各変異パターンの変異頻度増加量をもとに、変異スペクトルの解析を行った。具体的には、各変異パターンの106bpにおける変異頻度増加量を合計し、各変異パターンの全体に占める割合を算出した。結果を図6及び表4に示す。最も多く頻度増加の認められた変異パターンはGC>AT変異であり、次に割合の高かった変異パターンはAT>GC変異であった。これは非特許文献5において、Ames試験菌株の一つであるYG7108株において認められたENUの変異パターンと同様の結果であったことから、本方法により、ENUによる変異パターンを正確に検出できたことが示唆された。
【0164】
【表4】
【0165】
5)シーケンスコンテクスト解析
シーケンスコンテクスト解析で算出された変異頻度増加量を図7及び8に示す。図中の変異パターンの表記は、変異した塩基対のうちのピリミジン塩基の変異パターン(C>A、C>G、C>T、T>A、T>C及びT>G)と、該ピリミジン塩基とその両隣の塩基を含む3塩基配列(例えば、C>Tにおいて該C塩基がAとTに挟まれていた場合は、ACTと表記される)で表されている。本解析において最も変異頻度増加量の大きかったC>T変異においては、Cの3’塩基側にピリミジン塩基(C又はT)の位置するコンテクストにおいて、変異頻度増加量が高くなる傾向が認められた。これは、アルキル化剤による変異シグニチャーの示したパターン(図7〜8中のSigniture 11、Nature, 2013, 500(7463):415-421参照)と類似しており、ENUがアルキル化剤であることと矛盾しない結果となった。この結果から、シーケンスコンテクスト解析は、変異原の遺伝毒性メカニズムの推定や、ヒトの発がんにおける役割を簡便に推定することができる有用な方法であると考えられた。
【要約】
細胞の変異を簡便かつ低コストに解析する方法の提供。細胞集団における変異を解析する方法であって、細胞集団由来のDNAを取得すること;該DNAのフラグメントをシーケンシングし、各フラグメントにつき1つ以上のリード配列を得ること;該1つ以上のリード配列をそれぞれ参照配列と比較して、該リード配列と該参照配列とで塩基がマッチしない部位を検出すること;該1つ以上のリード配列について検出した部位を、変異部位として取得すること;及び、該変異部位における変異の情報を取得し、該情報に基づいて変異の傾向を解析すること、を含む方法。
図1
図2
図3
図4
図5
図6
図7
図8
【配列表】
[この文献には参照ファイルがあります.J-PlatPatにて入手可能です(IP Forceでは現在のところ参照ファイルは掲載していません)]