IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人大阪大学の特許一覧 ▶ 公益財団法人 放射線影響研究所の特許一覧

特許7355325細胞系譜生成方法、プログラム、及び細胞系譜生成装置
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-25
(45)【発行日】2023-10-03
(54)【発明の名称】細胞系譜生成方法、プログラム、及び細胞系譜生成装置
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20230926BHJP
   C12M 1/34 20060101ALI20230926BHJP
   C12N 15/09 20060101ALN20230926BHJP
【FI】
C12Q1/6869 Z
C12M1/34 B
C12N15/09 Z
【請求項の数】 10
(21)【出願番号】P 2019139833
(22)【出願日】2019-07-30
(65)【公開番号】P2021019564
(43)【公開日】2021-02-18
【審査請求日】2022-05-31
(73)【特許権者】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(73)【特許権者】
【識別番号】508259216
【氏名又は名称】公益財団法人 放射線影響研究所
(74)【代理人】
【識別番号】100109210
【弁理士】
【氏名又は名称】新居 広守
(72)【発明者】
【氏名】八木 健
(72)【発明者】
【氏名】内村 有邦
(72)【発明者】
【氏名】佐藤 康成
(72)【発明者】
【氏名】松本 拡高
【審査官】藤澤 雅樹
(56)【参考文献】
【文献】特開2016-224865(JP,A)
【文献】米国特許出願公開第2009/0292482(US,A1)
【文献】国際公開第2016/181979(WO,A1)
【文献】BMC Bioinformatics,2014年,Vol.15, No.35,pp.1-16
【文献】PLoS Comput. Biol.,2014年,Vol.10, No.7, e1003703, pp.1-15
【文献】Nature Genetics,2015年,Vol.47, No.4,pp.367-372, ONLINE METHODS
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-3/00
G16B 5/00-99/00
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
分析対象とする個体の第1組織を構成する複数の細胞における、第1変異の頻度を示す第1頻度、第2変異の頻度を示す第2頻度、及び、第3変異の頻度を示す第3頻度を取得し、前記個体の第2組織を構成する複数の細胞における、前記第1変異の頻度を示す第4頻度、前記第2変異の頻度を示す第5頻度、及び、前記第3変異の頻度を示す第6頻度を取得する取得ステップと、
前記第2頻度と前記第3頻度との和が前記第1頻度に一致又はほぼ一致し、かつ、前記第5頻度と前記第6頻度との和が前記第4頻度に一致又はほぼ一致するか否かを判定する判定ステップと、
前記判定ステップにおける判定結果に基づき、前記第1変異、前記第2変異、及び前記第3変異の関係を分析して、前記個体の細胞における変異に基づく細胞系譜を生成する分析ステップと、を含み、
前記分析ステップでは、
前記第2頻度と前記第3頻度との和が前記第1頻度に一致又はほぼ一致し、かつ、前記第5頻度と前記第6頻度との和が前記第4頻度に一致又はほぼ一致すると判定された場合に、前記第1変異を有する第1細胞、前記第2変異を有する第2細胞、及び前記第3変異を有する第3細胞は、前記第1細胞から、前記第2細胞又は前記第3細胞へと分岐する第1分岐点の関係を有すると決定し、
決定した前記第1分岐点の関係に整合する前記細胞系譜を生成する
細胞系譜生成方法。
【請求項2】
前記取得ステップでは、さらに、前記第1組織を構成する複数の細胞における第4変異の頻度を示す第1未帰属頻度、及び、前記第2組織を構成する複数の細胞における前記第4変異の頻度を示す第2未帰属頻度を取得し、
前記分析ステップでは、
さらに、前記細胞系譜のうちの複数の分岐端の細胞の各々が有する複数の分岐端変異について、前記第1組織を構成する複数の細胞における頻度を示す第1末端頻度が前記第1未帰属頻度と0よりも大きい第1差分頻度との和に対応し、かつ、前記第2組織を構成する複数の細胞における頻度を示す第2末端頻度が前記第2未帰属頻度と0よりも大きい第2差分頻度との和に対応する分岐端変異が1つであるとき、前記第4変異を有する第4細胞、及び前記1つの分岐端変異を有する第5細胞は、前記第5細胞から、前記第4細胞へと分岐する第2分岐点の関係を有すると決定し、
決定した前記第2分岐点の関係にさらに整合する、前記細胞系譜を生成する
請求項に記載の細胞系譜生成方法。
【請求項3】
前記分析ステップでは、前記第4細胞、前記第5細胞、及び第6細胞は、前記第5細胞から、前記第4細胞又は前記第6細胞へと分岐する前記第2分岐点の関係を有すると決定し、
前記第6細胞は、前記第1組織を構成する複数の細胞における頻度が前記第1差分頻度であり、かつ、前記第2組織を構成する複数の細胞における頻度が前記第2差分頻度である疑似変異を有する
請求項に記載の細胞系譜生成方法。
【請求項4】
前記分析ステップでは、さらに、生成された前記細胞系譜に基づき、前記個体の第3組織を構成する複数の細胞の各々が前記細胞系譜上のいずれの細胞に対応するかを特定し、前記第3組織における前記細胞系譜上の細胞の組成比率を算出する
請求項1~3のいずれか一項に記載の細胞系譜生成方法。
【請求項5】
前記判定ステップでは、
【数1】
によって表される残差二乗和が所定の閾値以下の場合に、前記第2頻度と前記第3頻度との和が前記第1頻度に一致又はほぼ一致し、かつ、前記第5頻度と前記第6頻度との和が前記第4頻度に一致又はほぼ一致すると判定し、
Nは、前記個体の複数の組織のうち、前記第1組織及び前記第2組織を含む、前記細胞系譜生成方法に用いられた対象組織の数であり、
2,ave.は、前記対象組織を構成する複数の細胞における、前記第2変異の頻度の平均頻度であり、
3,ave.は、前記対象組織を構成する複数の細胞における、前記第3変異の頻度の平均頻度であり、
1,nは、第n(nは正の整数)組織を構成する複数の細胞における、前記第1変異の頻度を示す第(1+3(n-1))頻度であり、
2,nは、第n組織を構成する複数の細胞における、前記第2変異の頻度を示す第(2+3(n-1))頻度であり、
3,nは、第n組織を構成する複数の細胞における、前記第3変異の頻度を示す第(3+3(n-1))頻度である
請求項1~3のいずれか一項に記載の細胞系譜生成方法。
【請求項6】
前記所定の閾値は、作成される前記細胞系譜において、(i)1つの細胞から3つ以上の細胞へと分岐する分岐点の関係が存在することの矛盾、及び、(ii)2つ以上の細胞から1つの細胞へと合流する合流点の関係が存在することの矛盾が生じない値である
請求項5に記載の細胞系譜生成方法。
【請求項7】
前記細胞系譜は、前記個体の癌細胞における変異に基づいて生成される
請求項1~6のいずれか一項に記載の細胞系譜生成方法。
【請求項8】
前記第2組織は、前記第1組織とは異なる組織である
請求項1~7のいずれか一項に記載の細胞系譜生成方法。
【請求項9】
請求項1~8のいずれか一項に記載の細胞系譜生成方法をコンピュータに実行させるための
プログラム。
【請求項10】
分析対象とする個体の第1組織を構成する複数の細胞における、第1変異の頻度を示す第1頻度、第2変異の頻度を示す第2頻度、及び、第3変異の頻度を示す第3頻度を取得し、前記個体の第2組織を構成する複数の細胞における、前記第1変異の頻度を示す第4頻度、前記第2変異の頻度を示す第5頻度、及び、前記第3変異の頻度を示す第6頻度を取得する取得部と、
前記第2頻度と前記第3頻度との和が前記第1頻度に一致又はほぼ一致し、かつ、前記第5頻度と前記第6頻度との和が前記第4頻度に一致又はほぼ一致するか否かを判定する判定部と、
前記判定部の判定結果に基づき、前記第1変異、前記第2変異、及び前記第3変異の関係を分析して前記個体の細胞においてした変異に基づく細胞系譜を生成する分析部と、を備え
前記分析部は、
前記第2頻度と前記第3頻度との和が前記第1頻度に一致又はほぼ一致し、かつ、前記第5頻度と前記第6頻度との和が前記第4頻度に一致又はほぼ一致すると判定された場合に、前記第1変異を有する第1細胞、前記第2変異を有する第2細胞、及び前記第3変異を有する第3細胞は、前記第1細胞から、前記第2細胞又は前記第3細胞へと分岐する第1分岐点の関係を有すると決定し、
決定した前記第1分岐点の関係に整合する前記細胞系譜を生成する
細胞系譜生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、細胞系譜生成方法、プログラム、及び細胞系譜生成装置に関する。
【背景技術】
【0002】
近年、次世代シーケンサの技術が医療の現場に浸透しつつある。例えば、次世代シーケンサを用いて特定のタンパク質をコードする遺伝子の転写産物を定量することにより、特定のタンパク質の発現量を推定し、推定された特定のタンパク質の発現量を患者の状態の診断に用いる検査方法等が提案されている(例えば、特許文献1参照)。このような背景から、患者ごとの状態に合わせた個別化医療の実現への期待も高まっている。
【先行技術文献】
【特許文献】
【0003】
【文献】国際公開第2016/181979号
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、個別化医療を実現するためには、患者ごとの詳細な状態を示す、より詳細な情報が出力される必要がある。
【0005】
本発明は、上記に鑑みてなされ、より詳細な情報を得ることができる細胞系譜生成方法等を提供する。
【課題を解決するための手段】
【0006】
本発明の一態様に係る細胞系譜生成方法は、分析対象とする個体の第1組織を構成する複数の細胞における、第1変異の頻度を示す第1頻度、第2変異の頻度を示す第2頻度、及び、第3変異の頻度を示す第3頻度を取得し、前記個体の第2組織を構成する複数の細胞における、前記第1変異の頻度を示す第4頻度、前記第2変異の頻度を示す第5頻度、及び、前記第3変異の頻度を示す第6頻度を取得する取得ステップと、前記第2頻度と前記第3頻度との和が前記第1頻度に対応し、かつ、前記第5頻度と前記第6頻度との和が前記第4頻度に対応するか否かを判定する判定ステップと、前記判定ステップにおける判定結果に基づき、前記第1変異、前記第2変異、及び前記第3変異の関係を分析して、前記個体の細胞における変異に基づく細胞系譜を生成する分析ステップと、を含む。
【0007】
また、本発明の一態様は、上記の細胞系譜生成方法をコンピュータに実行させるためのプログラムとして実現できる。
【0008】
また、本発明の一態様に係る細胞系譜生成装置は、分析対象とする個体の第1組織を構成する複数の細胞における、第1変異の頻度を示す第1頻度、第2変異の頻度を示す第2頻度、及び、第3変異の頻度を示す第3頻度を取得し、前記個体の第2組織を構成する複数の細胞における、前記第1変異の頻度を示す第4頻度、前記第2変異の頻度を示す第5頻度、及び、前記第3変異の頻度を示す第6頻度を取得する取得部と、前記第2頻度と前記第3頻度との和が前記第1頻度に対応し、かつ、前記第5頻度と前記第6頻度との和が前記第4頻度に対応するか否かを判定する判定部と、前記判定部の判定結果に基づき、前記第1変異、前記第2変異、及び前記第3変異の関係を分析して前記個体の細胞においてした変異に基づく細胞系譜を生成する分析部と、を備える。
【発明の効果】
【0009】
本発明の一態様に係る細胞系譜生成方法は、より詳細な情報を得ることできる。
【図面の簡単な説明】
【0010】
図1A図1Aは、配偶子に突然変異が生じた場合における発生過程を示す図である。
図1B図1Bは、初期発生の過程中に突然変異が生じた場合における発生過程を示す図である。
図2図2は、細胞系譜の生成のために用いる突然変異について説明する図である。
図3図3は、アリル頻度の分布を例示する図である。
図4図4は、実施の形態に係る細胞系譜生成装置の機能構成を示すブロック図である。
図5図5は、実施の形態に係る細胞系譜生成装置の動作を示すフローチャートである。
図6図6は、実施例に係る複数の組織における突然変異のアリル頻度を示す第1の図である。
図7図7は、実施例に係る複数の組織における突然変異のアリル頻度を示す第2の図である。
図8図8は、実施例に係る複数の組織における突然変異のアリル頻度を示す第3の図である。
図9図9は、実施例に係る複数の組織における突然変異のアリル頻度を示す第4の図である。
図10図10は、実施例に係る複数の組織における突然変異のアリル頻度を示す5の図である。
図11図11は、実施例に係る細胞系譜生成の概念を示す概略図である。
図12A図12Aは、実施例に係る細胞系譜生成装置のアルゴリズムについて説明する第1図である。
図12B図12Bは、実施例に係る細胞系譜生成装置のアルゴリズムについて説明する第2図である。
図12C図12Cは、実施例に係る細胞系譜生成装置のアルゴリズムについて説明する第3図である。
図13図13は、実施例に係る細胞系譜を例示する図である。
図14図14は、各組織における細胞系譜上の細胞の組成比率を例示する図である。
図15図15は、実施の形態に係る細胞系譜生成方法の適用例を説明する図である。
【発明を実施するための形態】
【0011】
(発明に至った経緯)
生体組織中に含まれる個々の細胞について細胞系譜上の由来を明らかにすることができれば、各種の疾患の状態及び老化進行等の程度を定量的に把握することが可能になるため、このような細胞系譜を生成する方法が検討されている。これまでに、例えば、女性の場合であればX染色体の不活化(初期発生の過程でランダムに片方のX染色体が不活化されるという現象を利用したもの)に注目して、癌細胞等の由来が、細胞系譜上の単一の細胞に由来するのか、細胞系譜上の複数の細胞に由来する混合状態によって構成されているかを区別する方法が開発されている。しかしながら本方法は、女性にしか適用できず、また、生成される細胞系譜の分解能が悪い。具体的には、本方法では、父親に由来するX染色体の父親アリル、及び母親に由来するX染色体の母親アリルのうち、いずれかの不活化しか区別できない。つまり、本方法では、2種類の細胞しか区別できないため、臨床的に有意な情報が得られる場合が限られる。このような理由から、本方法は、臨床の現場などで広く利用されることはなかった。
【0012】
近年、次世代シーケンサを用いて、より詳細な細胞系譜を生成する方法が実施されているが、検体由来の細胞を単一の細胞に分離し、それぞれの細胞をシーケンシングに堪える量となるまで増殖させたうえで、シーケンシングを行うことが必要である。分析対象となる組織が、単一の細胞への分離、及び増殖の操作を行うことが困難な組織である場合、本方法は、適用が困難であり、莫大な労力、時間、費用が必要となる。このような理由から、本方法も、臨床の現場などで、広く利用されるには現実的でなかった。
【0013】
より臨床の現場に適した方法が求められる中、マウスを用いた実験において、シーケンシングにより体組織中に低頻度で存在する突然変異を効率よく検出し、同一個体内の複数の組織において、精度高く突然変異の頻度(つまり存在頻度)を用いることで高精度な細胞系譜の生成を可能にする新たな方法の開発に成功した。本方法では、数理モデルを用いた解析により、初期発生の過程で生じた突然変異を指標として、任意の組織において、高精度な細胞系譜の生成を可能にする革新的な方法である。
【0014】
本方法では、ゲノムのシーケンシングで得られる、複数の体組織中のそれぞれに低頻度で存在する突然変異に対して、突然変異の頻度を算出する。数理学的な工夫を加えた解析により、複数の組織間において得られた頻度をもとに初期発生の過程における突然変異の発生の系譜を明らかにする。これにより、本方法では、分析対象とする個体の細胞において生じた突然変異に基づく細胞系譜を生成する。即ち、本方法は、分析対象とする個体の2以上の組織それぞれの、当該組織を構成する複数の細胞における突然変異の頻度に基づいて細胞系譜を生成する方法である。
【0015】
本方法は、次世代シーケンサの技術が臨床の現場に浸透しつつある昨今において、細胞系譜に基づく観点から診断に必要な新たな指標を与えることを可能とする。
【0016】
本方法によれば、例えば、X染色体の不活化を指標とした方法等の従来までの方法における制約を劇的に改善でき、細胞系譜の状況をより詳細に明らかにすることができる。このようにして、明らかになった細胞系譜の詳細な状況は、個々の突然変異の存在する頻度として、体組織中(疾患関連の組織など)での細胞動態を明確に捉えるためのマーカーとして利用できる。例えば、抗癌剤治療において、抗癌剤が投与され、癌細胞の集団が死滅した後、細胞増殖による組織の回復過程を追跡することが可能になる。このような例では、回復の過程に異常があるか否かの判定により、治療方針の決定に対して有用な情報が提供できると考えられる。また、例えば、老化の一因と考えられる、細胞系譜上の単一の細胞の増殖を的確に捉えることも可能となる。
【0017】
以上に例示されるように、細胞系譜の状況をより詳細に明らかにすることにより、患者に適用された治療方法等によって、疾患の症状が適正に快方(健康な状態等)に向かっているか否かを判断する指標として、細胞系譜を利用することもできる。
【0018】
以下、実施の形態について、図面を参照しながら具体的に説明する。なお、以下で説明する実施の形態は、いずれも包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
【0019】
なお、各図は模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付し、重複する説明は省略又は簡略化される場合がある。
【0020】
(実施の形態)
[概要]
はじめに、本発明の概要について、図1A図3を用いて説明する。図1Aは、配偶子に突然変異が生じた場合における発生過程を示す図である。また、図1Bは、初期発生の過程中に突然変異が生じた場合における発生過程を示す図である。
【0021】
本実施の形態においては、分析対象とする個体の第1組織及び第2組織を含む2以上の組織それぞれの、当該組織を構成する複数の細胞における突然変異の頻度に基づいて細胞系譜を生成する。
【0022】
以降の説明では、第2組織が第1組織とは異なる組織であり、第1組織及び第2組織を含む2以上の組織は、それぞれ異なる組織であるとして説明するが、これに限らない。第1組織と第2組織とは、同一の組織であってもよい。例えば、同一の組織を異なる2以上の時点において採取することにより得られた第1組織及び第2組織を含む2以上の組織のそれぞれから、当該組織を構成する細胞における突然変異の頻度に基づいて細胞系譜を生成してもよい。
【0023】
また、本発明は、突然変異の頻度が高精度に算出されれば、単一の組織を構成する細胞のみからであっても細胞系譜を生成できる。したがって、第1組織と第2組織とは、同じ単一の組織であってもよい。例えば、技術の進歩又は派生する別技術により、個々の細胞の突然変異の頻度を高精度に算出可能な新たなシーケンシング又は変異頻度算出の手法が登場すれば、当然、その手法を用いて単一の組織を構成する複数の細胞から突然変異の頻度を算出し、当該頻度を用いて細胞系譜を生成してもよい。
【0024】
これによれば、第2頻度と第3頻度との和が第1頻度に対応し、かつ、第5頻度と第6頻度との和が第4頻度に対応するか否かを、第2頻度と第3頻度との和が第1頻度に対応するか否かのみで判定できる。したがって、本発明をより簡易に実現できる。また、分析対象とする個体から採取される組織の数も1つのみでよいため、本発明をより低侵襲な検査方法として臨床の現場などで利用することができる。
【0025】
図1Aに示すように、配偶子のいずれかに突然変異が生じた場合、形成される受精卵は、配偶子に生じた突然変異を有する。具体的には、2倍体生物の場合、受精卵が有する染色体には、それぞれの配偶子に由来する相同染色体どうしのペアが生物種に応じた数含まれる。これらの相同染色体のペアのうち、突然変異を有さない染色体と配偶子に由来する突然変異を有する染色体との相同染色体のペアが含まれた状態となる。図中ではこのような相同染色体のペアを示している。このような相同染色体のペアは、分裂の過程において次世代の細胞に引き継がれるため、全ての体細胞において突然変異を有さない染色体と突然変異を有する染色体との比は、常に1:1であり、突然変異の頻度が50%である。したがって、図中に示すように個体の全身の細胞において均一に、突然変異に基づく表現型が発現される。
【0026】
一方で、図1Bに示すように、受精卵を形成するまで突然変異を有しなかった細胞において、受精卵からの分裂により生じた2つの細胞のうち一方のみに突然変異が生じた場合、当該一方の細胞に突然変異を有さない染色体と突然変異を有する染色体との相同染色体のペアが含まれる。また、2つの細胞のうち他方の細胞にはいずれも突然変異を有さない相同染色体のペアが含まれる。したがって、例えば、以降の細胞周期が一様であった場合、全ての体細胞において突然変異を有さない染色体と突然変異を有する染色体との比は、常に3:1であり、突然変異の頻度は25%である。突然変異を有する染色体を含む細胞に由来して分裂した組織においては、図中に示すように個体の一部においてモザイク状に、突然変異に基づく表現型が発現される。
【0027】
本発明は、突然変異が生じたタイミングによって異なる、突然変異を有する染色体の割合である存在確率(以下、突然変異の頻度又はアリル頻度ともいう)を用いた、細胞系譜を生成する方法等を開示するものである。なお、以下では、突然変異を単に変異として説明する場合がある。
【0028】
図2は、細胞系譜の生成のために用いる突然変異について説明する図である。図2では、特定の組織から採取された当該組織を構成する複数の細胞について、ゲノムシーケンスの結果の一部を示している。図2では、参照配列と、ゲノムシーケンスの結果読み出された複数の部分配列とを、参照配列上の対応する箇所に示している。参照配列は、図中の最上段にDNA(DeoxyriboNucleic Acid)の塩基部分に基づくアデニン(A)、チミン(T)、グアニン(G)、及びシトシン(C)の4種の文字列として示されている。
【0029】
また、図中の参照配列よりも下側の左右に延びる矩形は、それぞれゲノムシーケンス結果の配列を示している。なお、読み出された配列は、文字列での表記を省略し、読み出しの可不可をのみを示している。具体的には、図中には、配列が読み出された領域であるリード領域を、ハッチングを付した矩形で示し、配列が読み出されなかった領域である非リード領域を、破線の白抜き矩形で示している。図中では、15の部分配列が読み出されており、そのうち12の部分配列については、図中の中央に矢印で示す、変異箇所の配列を含めて読み出されている。変異箇所では、参照配列においてCが示されているのに対し、読み出された部分配列のうちの一部ではTが示されている。即ち、この変異箇所においては、本来配列されていたCに突然変異が生じることによりTに変化している。
【0030】
このような突然変異における頻度は、変異箇所の配列を含めて読み出された数に対する突然変異が生じていた数である。即ち、図中の例では、100分率で示すと、7(Tの数)×100/12(Tの数+Cの数)=約58%である。本実施の形態においては、このようなDNAにおける1つのヌクレオチドの変化に基づく突然変異の頻度を用いる細胞系譜の生成について説明する。
【0031】
なお、本実施の形態において、突然変異は、上記のように1つのヌクレオチドの変化に限らず、オリゴヌクレオチド、遺伝子単位等複数のヌクレオチドの変化であってもよい。また、突然変異による変化は、上記のようにヌクレオチドの置換であってもよく、欠損又は挿入であってもよい。挿入は、例えば、ヌクレオチドのコピー数の変化として特定してもよい。したがって、突然変異の頻度は、突然変異の形態に応じて適切な数式を用いて算出されればよい。
【0032】
図3は、アリル頻度の分布を例示する図である。図3では、特定の個体について、突然変異をアリル頻度5%ごとに分類した際の、それぞれのアリル頻度における突然変異の個数を示すグラフである。図3では、横軸にアリル頻度を100分率で示し、縦軸に突然変異の個数を、最も高い値を100%とした時の相対個数として示している。
【0033】
図3に示すように、特定の個体における突然変異には、100%のアリル頻度である突然変異が最も多く含まれている。これは、受精卵を形成する配偶子のいずれにも同様の突然変異が生じていた、ホモ接合の突然変異を示している。一方で、50%のアリル頻度をピークとする二項分布に従う突然変異は、受精卵を形成する配偶子のいずれかに突然変異が生じていた、ヘテロ接合の突然変異102を示している。なお、ヘテロ接合の突然変異102には、図1Aを用いて説明した例も含まれる。また、50%よりも小さいアリル頻度の箇所に、比較的少数の突然変異が存在している。この比較的少数の突然変異は、モザイク変異101を示しており、図1Bを用いて説明した例も含まれる。
【0034】
本実施の形態においては、モザイク変異101のアリル頻度を用いて細胞系譜を生成する。なお、モザイク変異101は、50%よりも小さいアリル頻度を示すものであればよいが、図3に示すように、モザイク変異101が他の突然変異に比べ少数であるため、ヘテロ接合の突然変異102との分離能の観点から、40%よりも小さいアリル頻度を示すモザイク変異を用いることでより正確な細胞系譜を生成することができる。細胞系譜の生成に用いるモザイク変異101のアリル頻度の閾値は、シーケンサの精度、細胞の条件等に応じて適宜設定されてもよい。
【0035】
[細胞系譜生成装置の構成]
以下、図4を用いて、本実施の形態における細胞系譜生成装置の構成を説明する。図4は、実施の形態に係る細胞系譜生成装置の機能構成を示すブロック図である。図4では、細胞系譜生成装置100とともに、各種の周辺装置を併せて図示している。
【0036】
本実施の形態における細胞系譜生成装置100は、分析対象とする個体の第1組織及び第2組織を含む2以上の組織それぞれの、当該組織を構成する複数の細胞における突然変異の頻度に基づいて細胞系譜を生成する。
【0037】
細胞系譜生成装置100は、取得部11と、判定部13と、分析部15とを備える細胞系譜生成装置100は、例えば、取得部11、判定部13、及び分析部15の機能に係るプログラムが格納されたメモリと、当該プログラムを実行する回路とを備えるコンピュータとして実現されてもよい。
【0038】
取得部11は、分析対象とする個体の細胞から得られ、シーケンサ201によって読み出された、DNAの配列中に生じた突然変異の頻度を算出する変異頻度算出装置203に接続される。
【0039】
シーケンサ201は、分析対象とする個体の組織を構成する複数の細胞から抽出された核酸検体を用いて、当該細胞に含まれるDNAの配列を読み出す(シーケンシングする)装置である。シーケンサ201は、核酸検体を用いてシーケンシングが可能な構成であればよく、測定原理、装置構成等は特に限定されない。シーケンサ201は、シーケンシングの結果として読み出されたDNAの配列を変異頻度算出装置203へと送信する。
【0040】
変異頻度算出装置203は、読み出されたDNAの配列をもとに配列中に含まれる突然変異の頻度を算出する装置である。変異頻度算出装置203は、例えば、回路と、突然変異の頻度の算出に係るプログラムが格納されたメモリとを備えたコンピュータとして実現される。図2を用いて説明したように、変異頻度算出装置203は、あらかじめ取得した参照配列に対して、受信したDNAの配列が対応する箇所を検出する。変異頻度算出装置203は、さらに、受信したDNAの配列の中で、参照配列と比較して突然変異が発生した変異箇所を特定し、当該変異箇所における突然変異の頻度を算出する。
【0041】
本実施の形態では、変異頻度算出装置203は、第1組織及び第2組織の少なくとも2つの組織のそれぞれを構成する複数の細胞から抽出された核酸検体について、突然変異である、第1変異、第2変異、及び第3変異それぞれの頻度を算出する。変異頻度算出装置203によって算出された突然変異の頻度は、変異頻度算出装置203に接続された取得部11によって取得される。
【0042】
即ち、取得部11は、分析対象とする個体の第1組織を構成する複数の細胞における、第1変異の頻度を示す第1頻度、第2変異の頻度を示す第2頻度、及び、第3変異の頻度を示す第3頻度を取得する。また、取得部11は、第2組織を構成する複数の細胞における、第1変異の頻度を示す第4頻度、第2変異の頻度を示す第5頻度、及び、第3変異の頻度を示す第6頻度を取得する。取得部11は、このようにして変異頻度算出装置203において算出された突然変異の頻度を取得する処理部である。取得部11は、取得した突然変異の頻度を判定部13へと送信する。
【0043】
判定部13は、取得部11において取得された突然変異の頻度に基づき、所定の条件が満たされるか否かを判定する処理部である。具体的には、判定部13は、第2頻度と第3頻度との和が第1頻度に対応し、かつ、第5頻度と第6頻度との和が第4頻度に対応するか否かを判定する。判定部13は、第1頻度~第6頻度に基づく判定結果を分析部へと送信する。
【0044】
分析部15は、判定部13による判定結果に基づき、第1変異、第2変異、及び第3変異の関係を分析して、分析対象とする個体の細胞における突然変異に基づく細胞系譜を生成する処理部である。例えば、第2変異の頻度及び第3変異の頻度の和と第1変異の頻度とが、第1組織及び第2組織を含む複数の組織において一致する(ただし、シーケンシングの測定誤差を許容する)場合、第2変異と第3変異とは、第1変異に由来し、かつ、互いに相補的な関係であると推定できる。つまり、第1変異を有する第1細胞、第2変異を有する第2細胞、及び第3変異を有する第3細胞は、第1細胞から、第2細胞又は第3細胞へと分岐する第1分岐点の関係を有すると推定される。
【0045】
なお、第1細胞、第2細胞、及び第3細胞は、保有する突然変異の種類が異なる細胞の分類を示す概念である。つまり、本実施の形態において生成される細胞系譜は、突然変異のバリエーションが変化する変化点を分岐点として分岐分類する、突然変異の分岐分類図と読み替えることもできる。
【0046】
分析部15による分析の結果、生成された細胞系譜は、出力部205へと出力され、細胞系譜生成装置100のユーザへと提示される。
【0047】
出力部205は、例えば、ディスプレイ等の表示装置であり、分析部15において生成された細胞系譜を画像として提示することにより、ユーザに細胞系譜を視認させることができる。
【0048】
なお、取得部11、判定部13、及び分析部15は、個別に実現されてもよく、一体化されてもよい。つまり、取得部11、判定部13、及び分析部15は、例えば1つのプログラム等として、単一の構成で実現されてもよい。
【0049】
[細胞系譜生成装置の動作]
以下、細胞系譜生成装置100の動作について図5を用いて説明する。図5は、実施の形態に係る細胞系譜生成装置の動作を示すフローチャートである。
【0050】
本実施の形態における細胞系譜生成装置100の取得部11は、はじめに、第1頻度~第6頻度を含む複数の突然変異の頻度を変異頻度算出装置203から取得する(S101)。また、取得部11は、第1組織を構成する複数の細胞にける第4変異の頻度を示す第1未帰属頻度、及び、前記第2組織を構成する複数の細胞における前記第4変異の頻度を示す第2未帰属頻度を変異頻度算出装置203から取得する(S102)。
【0051】
ここで、判定部13は、取得した第2頻度と第3頻度との和が第1頻度と一致するか否かを判定する(S103)。判定部13において、第2頻度と第3頻度との和が第1頻度と一致しないと判定された場合(S103でNo)、細胞系譜生成装置100は、処理を終了する。一方で、判定部13において、第2頻度と第3頻度との和が第1頻度と一致すると判定された場合(S103でYes)、判定部13は、さらに、取得した第5頻度と第6頻度との和が第4頻度と一致するか否かを判定する(S104)。判定部13において、第5頻度と第6頻度との和が第4頻度と一致しないと判定された場合(S104でNo)、細胞系譜生成装置100は、処理を終了する。
【0052】
一方で、判定部13において、第5頻度と第6頻度との和が第4頻度と一致すると判定された場合(S104でYes)、分析部15は、第1変異を有する第1細胞から、第2変異を有する第2細胞及び第3変異を有する第3細胞へと分岐する第1分岐点の関係を決定する(S105)。言い換えると、第2頻度と第3頻度との和が第1頻度に対応し、かつ、第5頻度と第6頻度との和が第4頻度に対応すると判定された場合(S103でYesかつS104でYes)に、第1細胞、第2細胞、及び第3細胞は、第1分岐点の関係を有すると決定される。
【0053】
分析部15は、このようにして決定された第1分岐点の関係に整合するように細胞系譜を生成する(S106)。例えば、分析対象とする個体から得られた細胞に、突然変異のバリエーションが異なる細胞が3つよりも多く存在する場合、分析部15は、3つよりも多い細胞の中から、第1分岐点の関係を有する3つの細胞を特定して分岐の方向を規定することで細胞系譜を生成してもよい。また、このような第1分岐点の関係が複数特定された場合、複数の第1分岐点の関係のすべてに整合する細胞系譜を生成してもよい。即ち、第1分岐点の関係から3つよりも多い細胞の細胞系譜が生成されてもよい。
【0054】
続いて、細胞系譜生成装置100は、取得部11において取得された第1未帰属頻度及び第2未帰属頻度を用いてさらに細胞系譜を更新することでより多くの分岐情報を含む細胞系譜を生成する。ここでは、突然変異の頻度の大小関係から細胞系譜の末端における細胞から第4変異を有する細胞へと分岐する第2分岐点の関係を決定する。
【0055】
分析部15は、ステップS106において生成された細胞系譜の複数の分岐端の細胞である第5細胞における突然変異の頻度と、第4変異の頻度との大小関係の比較を行う。具体的には、分析部15は、複数の第5細胞の各々が有する分岐端変異について、第1組織を構成する複数の細胞における頻度を示す第1末端頻度と、第1未帰属頻度との差分である第1差分頻度が0よりも大きいか否かを判定する。つまり、分析部15は、第1末端頻度が第1未帰属頻度よりも大きいか否かを判定する。また、分析部15は、複数の第5細胞の各々が有する分岐端変異について、第2組織を構成する複数の細胞における頻度を示す第2末端頻度と、第2未帰属頻度との差分である第2差分頻度が0よりも大きいか否かを判定する。つまり、分析部15は、第2末端頻度が第2未帰属頻度よりも大きいか否かを判定する。
【0056】
このようにして、分析部15は、第1差分頻度が0よりも大きく、かつ、第2差分頻度が0よりも大きいと判定された分岐端変異が複数の分岐端変異のうち、ただ1つに定まるか否かを判定する(S107)。複数の分岐端変異のうち第1差分頻度が0よりも大きく、かつ、第2差分頻度が0よりも大きい分岐端変異がただ1つに定まらなかった場合(S107でNo)、細胞系譜生成装置100は処理を終了する。一方で、複数の分岐端変異のうち第1差分頻度が0よりも大きく、かつ、第2差分頻度が0よりも大きい分岐端変異がただ1つに定まった場合(S107でYes)、分析部15は、第4変異を有する第4細胞と第5細胞とは、第5細胞から第4細胞へと分岐する第2分岐点の関係を有すると決定する。このとき、上記の第2分岐点の関係では、第4細胞と対となる変異のバリエーションを有する細胞が特定されていない。細胞系譜をより多分岐、多世代にわたって生成するため、第4細胞と対となる第6細胞を仮設定してもよい。つまり、第4細胞、第5細胞、及び第6細胞は、第5細胞から、第4細胞又は第6細胞へと分岐する第2分岐点の関係を有すると決定する(S108)。なお、第6細胞は、第1組織を構成する複数の細胞における頻度が第1差分頻度であり、かつ、第2組織を構成する複数の細胞における頻度が第2差分頻度である疑似頻度を有する。
【0057】
なお、このような大小関係の比較において、シーケンシングの測定誤差を許容してもよい。つまり、数値として第1差分頻度又は第2差分頻度が0以下であっても、誤差範囲を考慮した際に、第1差分頻度又は第2差分頻度の0よりも大きい範囲が含まれる場合には上記の判定条件を満たすとしてもよい。
【0058】
分析部15は、このようにして決定された第2分岐点の関係にさらに整合するように、第1分岐点の関係に整合するように生成された細胞系譜を更新して、新たな細胞系譜を生成する(S109)。例えば、第1分岐点の関係の説明における、第1細胞、第2細胞、及び第3細胞のうち、第2細胞及び第3細胞のそれぞれが有する第2変異及び第3変異を分岐端の細胞が有する分岐端変異とみなしてステップS107以降の処理を実行する。これにより、第2変異及び第3変異のいずれかから第4細胞又は第6細胞へと分岐する第2分岐点の関係にも整合する細胞系譜を生成してもよい。これにより、2分岐3世代にわたる細胞系譜が生成されてもよい。
【0059】
[実施例]
以下、実施例を用いて、本実施の形態をさらに具体的に説明する。
【0060】
図6は、実施例に係る複数の組織における突然変異のアリル頻度を示す第1の図である。本実施例では、分析対象とする個体としてマウスを用いている。また、図6に示すように、複数の組織として、大脳、小脳、肩の皮膚、臀部の皮膚、胃、肺、肝臓、腸、膵臓、四頭筋、舌、心臓、脾臓、腎臓、分泌腺、精巣、尾の17組織を用いた。これらの複数の組織のそれぞれについて組織片を採取し、当該組織片を構成する複数の細胞を用いてシーケンシングを行った。得られたDNAの配列内において、31か所のモザイク変異101と、2か所のヘテロ接合の突然変異102とが見いだされた。図中では、各突然変異について、複数の組織それぞれにおけるアリル頻度を接続し、突然変異ごとのアリル頻度の曲線として示している。
【0061】
図6では、はじめに変異頻度算出装置203において算出された突然変異の頻度に対して、補正処理を適用する。具体的には、次式(1)により、算出された突然変異の頻度が、一様に含み得る相加誤差等の成分の減算を行うとともに、100分率を小数表現に変換する。
【0062】
【数1】
【0063】
なお、Xm,n,rawは、変異頻度算出装置203において算出される、組織nにおける変異mの頻度の生データである。当該生データは、前述したように、変異mごとの相加誤差等を含み得る100分率の数値である。したがって、上記式(1)によってコントロール郡を用いて算出される相加誤差等の成分Xm,ctrlが減算される。また、性染色体上に生じた突然変異については、相同染色体が存在しないため、もとより2倍の頻度が算出される。したがって、これらの性染色体上に生じた突然変異については、あらかじめ半分に補正された生データを算出する。
【0064】
ここで、補正済みの頻度が所定の値よりも低い場合、当該頻度を示す突然変異を以降の処理から除外する。具体的には、シーケンサ201の測定誤差等と区別できないレベルの頻度を除外するための所定の値が設定され、当該所定の値を用いて突然変異の除外を行う。したがって所定の値は、測定に用いたシーケンサ201の性能及び測定条件等に応じて適宜設定されればよい。
【0065】
また、以降のデータ処理では、便宜上、ヘテロ接合の突然変異102(つまり、全ての組織における突然変異の頻度が0.5とみなせる突然変異)が含まれる。このようなヘテロ接合の突然変異102を有する細胞は、モザイク変異101を有する細胞すべての上位に位置する、細胞系譜の「根(root)」として位置づけられる。したがって、細胞系譜を自動的に生成する際に、ヘテロ接合の突然変異102を有する細胞が含まれることで、誤差等がなければ、理論上すべてのモザイク変異101を有する細胞系譜の分岐の関係を特定し、1つの細胞系譜を生成できる。
【0066】
図6に示された複数の突然変異の中には、複数の組織のいずれにおいてもほぼ同等のアリル頻度を示す突然変異が存在している。これらの突然変異は、同一のタイミングにおいて生じた変異であることが予想される。したがって、これらの突然変異を異なる細胞上の突然変異として扱うと、1つの細胞から3つ以上の細胞へと分岐する分岐点の関係が存在すること等の細胞系譜における矛盾が生じ得る。したがって、これらの変異を一体的に取り扱うため、複数の組織のいずれにおいてもほぼ同等のアリル頻度を示す突然変異をクラスタリングする処理を行う。
【0067】
このとき、突然頻度どうしのアリル頻度の類似度を数値化するため、以下の式(2)を用いる。
【0068】
【数2】
【0069】
なお、Nは、個体の複数の組織のうち、第1組織及び第2組織を含む、細胞系譜生成方法に用いられた対象組織の数である。また、Xi,ave.は、対象組織を構成する複数の細胞における、変異iの頻度の平均値である。また、Xii,ave.は、対象組織を構成する複数の細胞における、第ii変異の頻度の平均値である。また、Xi,nは、第n(nは正の整数)組織を構成する複数の細胞における、第i変異の頻度である。また、Xii,nは、第n組織を構成する複数の細胞における、第ii変異の頻度である。
【0070】
上記式(2)において得られる値は、大きいほど対象組織での変異iと変異iiとのアリル頻度の差が小さいことを示している。したがって、閾値を用いた判定により、変異iと変異iiとを同一のクラスタに分類するか否かを決定できる。より具体的には、2つの突然変異を変異i及び変異iiとして用い、上記式(2)において得られる値が閾値以上である場合に、当該2つの突然変異を同一のクラスタに分類する。一方、2つの突然変異を変異i及び変異iiとして用い、上記式(2)において得られる値が閾値よりも小さい場合に、当該2つの突然変異を別のクラスタに分類する。このように数式を用いて総当たり的にクラスタリングを実施し、全ての突然変異を自動的にクラスタに分類できる。
【0071】
ここで用いる閾値は、大きすぎると同一のクラスタに分類されるべき突然変異が異なるクラスタに分類される。また、閾値は、小さすぎると異なるクラスタに分類されるべき突然変異が同一のクラスタに分類される。したがって、ここで用いる閾値は、適切に設定される必要がある。ただし、シーケンサ201等の性能によって適切な値は一義的に決定できない。よって、いくつかの閾値を設定して、それぞれに以降の処理を適用した後、結果から判断される適切な閾値を決定してもよい。
【0072】
なお、同一のクラスタに分類された複数の突然変異は、以降の処理において、1つの突然変異として扱う。言い換えると、突然変異は、複数の突然変異の集合であるクラスタでもよい。したがって、以降の処理において扱う突然変異の頻度は、次式(3)によって置き換えられる。
【0073】
【数3】
【0074】
なお、Mi,numは、クラスタMに分類された突然変異mの個数である。また、Xm,nは、第n組織における突然変異mのそれぞれの頻度である。つまり、第n組織において、クラスタMが示す突然変異の集合における頻度は、クラスタMに分類された突然変異mの第n組織における頻度の平均値によって表される。なお、突然変異mがクラスタを構成していない独立の突然変異である場合でも上記式(3)は成立する。よって、独立した突然変異も分類された突然変異mが1つであるクラスタMとして扱うことで、全てのクラスタに、上記式(3)を適用すればよい。また、処理速度の関係から突然変異mが2以上のクラスタMのみに、上記式(3)を適用してもよい。
【0075】
以上のように、本実施例においては、クラスタを構成する複数の突然変異が、細胞系譜上の同一のタイミングにおいて生じた突然変異であると仮定し、これらの複数の突然変異の頻度の平均値を用いる。つまり、上記の実施の形態の説明に置き換えると、第1変異、第2変異、第3変異、及び第4変異の少なくとも1つは、複数の突然変異の集合で構成されるクラスタ(変異クラスタ)であってもよい。さらに言い換えると、上記において説明した突然変異のバリエーションは、複数の突然変異の組み合わせであってもよい。この場合、変異クラスタである第1変異、第2変異、第3変異、又は第4変異の頻度は、変異クラスタを構成する集合の複数の突然変異それぞれの頻度の平均値であってもよい。
【0076】
これによれば、細胞系譜上の同一のタイミングで生じた突然変異を、一体的に取り扱った細胞系譜を生成できる。個々の突然変異を算出に用いる必要がなく、細胞系譜の生成のための処理量を削減できる。また、シーケンサ201、変異頻度算出装置203等の、突然変異の頻度算出に関わる外部環境等においてそれぞれ生じ得る誤差等を軽減でき、より精度高く細胞系譜を生成することができる。
【0077】
図7は、実施例に係る複数の組織における突然変異のアリル頻度を示す第2の図である。図7では、図6における突然変異のうち、ヘテロ接合の突然変異102の1つである変異30と、モザイク変異の2つである変異31及び変異33とを図示し、その他の突然変異については図示を省略している。また、図7には、変異31及び変異33におけるアリル頻度を加算することによって得られる仮想頻度35を太線で併せて図示している。図7に示すように、仮想頻度35は、変異30とほぼ一致している。即ち、複数の組織それぞれにおいて、変異31の頻度と変異33の頻度との和が変異30の頻度と一致していることがわかる。つまり、3つの頻度が以下式(4)に示す和の関係を有している。
【0078】
【数4】
【0079】
なお、X1,nは、第n組織を構成する複数の細胞における、第1変異の頻度を示す第(1+3(n-1))頻度である。また、X2,nは、第n組織を構成する複数の細胞における、第2変異の頻度を示す第(2+3(n-1))頻度である。また、X3,nは、第n組織を構成する複数の細胞における、第3変異の頻度を示す第(3+3(n-1))頻度である。
【0080】
これにより、変異30を有する細胞、変異31を有する細胞、及び変異33を有する細胞の関係が前述した第1分岐点の関係であると決定できる。
【0081】
図8は、実施例に係る複数の組織における突然変異のアリル頻度を示す第3の図である。図8では、図6における突然変異のうち、モザイク変異の3つである変異33、変異37、及び変異39を図示し、その他の突然変異については図示を省略している。また、図8には、変異37及び変異39におけるアリル頻度を加算することによって得られる仮想頻度41を太線で併せて図示している。図8に示すように、仮想頻度41は、変異33とほぼ一致している。即ち、複数の組織それぞれにおいて、変異37の頻度と変異39の頻度との和が変異33の頻度と一致していることがわかる。これにより、変異33を有する細胞、変異37を有する細胞、及び変異39を有する細胞の関係が前述した第1分岐点の関係であると決定できる。
【0082】
図7及び図8を用いて説明したように、変異30を有する細胞、変異31を有する細胞、変異33を有する細胞、変異37を有する細胞、及び変異39を有する細胞の関係は、2つの第1分岐点の関係に整合する細胞系譜をもって説明できる。つまり、変異30を有する細胞は、変異31及び変異33の一方を有する細胞に分岐し、変異33を有する細胞は、変異37及び変異39の一方を有する細胞に分岐する。
【0083】
以降では、上記の実施の形態において説明したように突然変異の頻度の大小関係を用いて得られる第2分岐点の関係により、さらに詳細な情報を有する細胞系譜を生成する。具体的には、一の突然変異に着目した時に、当該一の突然変異と他の突然変異との組み合わせのうち、以下式(5)の関係を有する組み合わせの他の突然変異がただ1つとなる組み合わせを特定する。
【0084】
【数5】
【0085】
なお、X4,nは、第n組織を構成する複数の細胞における、第4変異の頻度を示す第1未帰属頻度である。また、X5,nは、第n組織を構成する複数の細胞における、分岐端変異の頻度を示す第1末端頻度である。複数の組織のそれぞれについて、第4変異において上記式(5)を満たす分岐端変異がただ一つである場合に、第4変異を有する細胞と、当該分岐端変異を有する細胞とが第2分岐点の関係を有すると決定される。言い換えると、複数の組織のいずれか一つでも、下記式(6)の関係となった場合、第4変異を有する細胞と、当該分岐端変異を有する細胞とが第2分岐点の関係を有さないと決定する。
【0086】
【数6】
【0087】
以下、このような第2分岐点の関係の探索について、より詳細に説明する。
【0088】
まず、上記の第1分岐点の関係に基づいて生成された細胞系譜のうち、「根」であるヘテロ接合の突然変異102を有する細胞から分岐した複数の末端に位置する分岐端の細胞の各々が有する複数の分岐端変異を「葉(leaf)」の集合(L)とする。したがって、「葉」の集合には、分岐端の細胞の各々が有する、複数の分岐端変異(l)が含まれる。また、生成された細胞系譜の中で、「根」から分岐した系譜に含まれない突然変異であり、かつ、これより上位の細胞との分岐点の関係をもたない突然変異を「孤立(orphaned)」の集合(O)とする。したがって、「孤立」の集合には、第4変異を含む複数の突然変異(o)が含まれる。ここで、Oの中から次式(7)で得られる値が最大となるoを選択する。
【0089】
【数7】
【0090】
なお、Xo,nは、第n組織を構成する複数の細胞における、oの頻度である。ここで選択されるoは、つまり、Oの中で、細胞系譜上の最も上位に位置する細胞が有すると考えられる突然変異である。つまり、第2分岐点の関係は成り立つものの、細胞系譜上、間に別の細胞が入り得る細胞を選択しないために、上記式(7)で最大の値をとり得るoを選択している。
【0091】
ここで選択したoの頻度と、複数のlそれぞれの頻度との比較を、次式(8)を用いて実施する。
【0092】
【数8】
【0093】
なお、Xl,nは、第n組織を構成する複数の細胞における、lの頻度である。また、Xo,nは、第n組織を構成する複数の細胞における、oの頻度である。
【0094】
第n組織のすべてにおいて、上記式(8)により得られる値が、閾値を上回る場合、当該lを、選択したoの親候補の集合に追加する。具体的には、上記式(8)により得られる値は、第n組織の各々におけるlの頻度とoの頻度との差分頻度である。例えば、oが第4変異である場合には、上記式(8)により、第1組織における、第1末端頻度と第1未帰属頻度との差分頻度である第1差分頻度、及び、第2組織における、第2末端頻度と第2未帰属頻度との差分頻度である第2差分頻度、を含む、第n組織の各々における差分頻度が得られる。
【0095】
また、上記の閾値は、シーケンシング等の測定誤差を許容するための値である。したがって、このような誤差が無視できるような理想系においては、閾値として0が設定される。例えば、oが第4変異である場合には、第1差分頻度及び第2差分頻度を含む、第n組織の各々における差分頻度がいずれも0よりも大きい値となる。しかしながら、現実的には、シーケンシングの測定誤差等により、差分頻度が負の値をとる場合があるため、測定誤差分等を考慮して、負の閾値が設定される。例えば、本実施例では、閾値として-0.01を設定した。
【0096】
複数のlのすべてについて、上記式(8)を用いたlの頻度とoの頻度との比較が終了した後、親候補の集合における要素の数をカウントし、当該要素の数が1であった場合、親候補の集合に含まれたlを有する細胞と、選択したoを有する細胞とが第2分岐点の関係を有すると決定される。決定された第2分岐点の関係に整合するように、細胞系譜を更新して再作成する。なお、この際、親候補の集合に含まれたlと、選択したoとを用いて、上記式(8)を用いて算出された第n組織の各々における差分頻度を示す「疑似(pseudo)」の突然変異(p:疑似変異)を有する細胞を、oを有する細胞と、lを有する細胞との第2分岐点の関係に加える。具体的には、lを有する細胞から、oを有する細胞又はpを有する細胞へと分岐する第2分岐点の関係とする。
【0097】
その後、Oの中から選択したoを削除し、Lの中から親候補の集合に含まれたlを削除し、Lの中に新たにoとpとを加える。なお、親候補の集合における要素の数をカウントし、当該要素の数が0または2以上であった場合、Oの中から選択したoを削除する。これは、選択したoと第2分岐点の関係を有するlが特定できない場合に、細胞系譜を更新せず、かつ、次のoについての処理に移行するために実施している。以上の処理を、Oが空集合となるまで繰り返す。
【0098】
図9は、実施例に係る複数の組織における突然変異のアリル頻度を示す第4の図である。図9では、図6における突然変異のうち、モザイク変異の4つである変異31、変異37、変異39、及び変異43を図示し、その他の突然変異については図示を省略している。変異31、変異37、及び変異39は、前述したように細胞系譜における分岐端変異である。このうち、いずれの組織においても変異43のアリル頻度よりも高いアリル頻度を示す(つまり差分の頻度>0の)変異は変異31のみである。したがって、変異31を有する細胞、及び変異43を有する細胞の関係が前述した第2分岐点の関係であると決定できる。
【0099】
ここで、図10は、実施例に係る複数の組織における突然変異のアリル頻度を示す第5の図である。図10では、図6における突然変異のうち、図9に示した各変異に、変異31のアリル頻度と変異43のアリル頻度との差分である差分頻度を有する疑似変異45を太線で併せて図示している。このような差分頻度を有する変異は実験的には観測されなかったが、疑似変異を有する細胞を、第2分岐点における、変異43を有する細胞と対となる細胞として以降の分析に用いてもよい。
【0100】
図11は、図6図10を用いて説明した内容の概念を示す概略図である。図11中の円形は個々の突然変異のバリエーションを有する細胞を示し、矢印によって細胞系譜上の親子関係であることを示している。言い換えると、矢印の元側の細胞から矢印の先側の細胞へと細胞系譜上の世代が進むことを示している。なお、実施例において認められた31の突然変異には、複数の突然変異が同時に生じる(つまりいずれの組織においても同等のアリル頻度を示す)突然変異が含まれる。したがって、図11では、31の突然変異に対して、より少ない突然変異のバリエーションを有する細胞が示されている。
【0101】
図11の(a)に示すように、はじめに第1分岐点の関係に基づき5つの細胞による細胞系譜が生成される。続いて、図11の(b)に示すように、第2分岐点の関係により6つ目の細胞を含む細胞系譜が生成される。さらに、図11の(c)に示すように、第2の分岐点の関係において分岐先の細胞と対をなす細胞を生成してもよい。
【0102】
さらに、図12A図12B、及び図12Cを用いて、細胞系譜の生成をより精度よく効率的に行うためのアルゴリズムについて説明する。図12Aは、実施例に係る細胞系譜生成装置のアルゴリズムについて説明する第1図である。図12Bは、実施例に係る細胞系譜生成装置のアルゴリズムについて説明する第2図である。図12Cは、実施例に係る細胞系譜生成装置のアルゴリズムについて説明する第3図である。本実施例に例示されるように、実際の細胞系譜生成装置の使用においては、多数の突然変異のバリエーションを有する細胞の中から第1分岐点の関係を特定する必要がある。したがって、以上に説明したような3つの細胞ごとの突然変異の頻度の和を調べる手法が自動化されるとより効率的に細胞系譜を生成することができる。
【0103】
そこで、以下の式(9)を用いて第1分岐点の関係を自動的に特定し、細胞系譜を生成すればよい。
【0104】
【数9】
【0105】
なお、Nは、個体の複数の組織のうち、第1組織及び第2組織を含む、細胞系譜生成方法に用いられた対象組織の数である。また、X2,ave.は、対象組織を構成する複数の細胞における、第2変異の頻度の平均値である。また、X3,ave.は、対象組織を構成する複数の細胞における、第3変異の頻度の平均値である。また、X1,nは、第n組織を構成する複数の細胞における、第1変異の頻度を示す第(1+3(n-1))頻度である。また、X2,nは、第n組織を構成する複数の細胞における、第2変異の頻度を示す第(2+3(n-1))頻度である。また、X3,nは、第n組織を構成する複数の細胞における、第3変異の頻度を示す第(3+3(n-1))頻度である。
【0106】
上記式により、特定の3つの突然変異を有する3つの細胞について、3つのうちの2つの突然変異の頻度の和を、残り1つの突然変異の頻度から差し引いた値を、組織ごとの平均的な値としての残差二乗和で算出することができる。つまり、上記式によって得られる値が小さいほど、特定の3つの細胞が第1分岐点の関係を有すると考えられ得る。つまり、所定の閾値を設定し、上記式によって得られる値と当該所定の閾値との比較によって第1分岐点の関係が成立するとすればよい。
【0107】
ここで、図12Aでは、所定の閾値が大きすぎたために、細胞系譜における矛盾が生じた例における細胞系譜103aを示している。細胞系譜における矛盾とは、例えば、1つの細胞から3つ以上の細胞へと分岐する分岐点の関係が存在すること、又は、2つ以上の細胞から1つの細胞へと合流する合流点の関係が存在することが挙げられる。図12Aでは、このような矛盾が生じているため、所定の閾値が不適であることがわかる。一方で、図12Cでは、所定の閾値が小さすぎたために、細胞系譜が適切に生成されなかった例における細胞系譜103bを示している。所定の閾値が小さすぎた場合、例えば、シーケンシングの測定誤差までも排除してしまうために細胞間の第1分岐点の関係がごく一部しか決定できない。
【0108】
したがって、所定の閾値は、上記の矛盾が生じない最大の値であるとよい。即ち、所定の閾値を、上記式によって取り得るよりも十分に大きい値に仮設定し、徐々に所定の閾値を小さくすることにより、細胞系譜上の矛盾が消えたときの値を、当該所定の閾値として決定してもよい。
【0109】
本実施例においては、例えば、所定の閾値αを0.01で初期化し(α=0.01)、生成された細胞系譜103aにおいて、上記の矛盾の有無を判定した。その後、細胞系譜103a上に上記の矛盾があると判定された場合に、所定の閾値から0.00025を減じた値を新たに所定の閾値として設定し(α=α-0.00025)、再度、上記の矛盾の有無を判定した。細胞系譜103上に上記の矛盾がないと判定された場合に所定の閾値を確定し、処理を終了した。以上の値等は、一例であり、例えば、所定の閾値を初期化する際に、少なくとも1つの矛盾が存在するように所定の閾値を設定してもよい。また、矛盾の有無を判定した後に、当該矛盾であった箇所をカウントして、フィードバック制御により所定の閾値から減じる値を変更する等、処理を高速化するための公知の技術を組み合わせてもよい。
【0110】
以上のようにして、細胞系譜103上の矛盾をもとに所定の閾値を設定することにより、グラフィカルに適切な所定の閾値を設定できる。また、所定の閾値がシーケンシングに用いられたシーケンサ201の性能等によって左右されるため、所定の閾値に柔軟性をもたせることで、細胞系譜生成装置100が適用可能なシーケンサ201等の外部環境の選択肢を拡大することができる。
【0111】
このようにして、図12Bに示すように適切に第1分岐点の関係が決定された細胞系譜103が生成される。
【0112】
図13は、実施例に係る細胞系譜を例示する図である。図13には、実施例において説明した突然変異を、当該突然変異を有する細胞として示し、それぞれの分岐点の関係に整合して生成された細胞系譜103が示されている。図13に示すように、変異30を有する細胞30aは、変異31を有する細胞31a又は変異33を有する細胞33aへと分岐する。さらに変異33を有する細胞33aは、変異37を有する細胞37a又は変異39を有する細胞39aへと分岐する。一方、変異31を有する細胞31aは、変異43を有する細胞43a、又は観測されていない疑似変異45を有する細胞45aへと分岐する。
【0113】
それぞれの突然変異を有する細胞は、さらに、分岐点の関係により次代の細胞へと分岐している。具体的には、さらに分析を進めることにより、細胞45aが、細胞61及び細胞63へと分岐し、細胞43aが、細胞65及び細胞67へと分岐することが判明した。また、分析を進めることにより、細胞39aから分岐した一の細胞が、細胞69及び細胞71へと分岐し、細胞39から分岐した他の細胞から3度の分岐により、細胞73及び細胞75、2度の分岐により細胞77、1度の分岐により細胞79へと分岐することが判明した。このようにして、本実施例では、最大6世代、11種の分岐端へと分岐する細胞系譜103が生成された。以上に説明した、多世代にわたる細胞系譜の生成では、従来のX染色体不活化等の手法に見られる情報量の乏しさ、及び従来の次世代シーケンサを用いた手法に見られる煩雑さが劇的に改善され、より詳細な情報を簡易に提供することができる。
【0114】
なお、以上に説明した実施例については、マウスを用いた生殖交配の実験、及びマウスの単一細胞由来の核をもつ細胞を増殖させたセルラインの実験において妥当性が確認されている。具体的には、生殖交配の実験では、上記の実験に用いたマウスの第1世代子孫のそれぞれにおいて突然変異の保有状況を確認し、細胞系譜の各世代に対応する突然変異を保有する個体が存在することを確認した。また、セルラインの実験では、上記の実験に用いたマウスの体細胞の単一細胞由来の核をもつ細胞を増殖させ、細胞系譜の各世代に対応する突然変異を保有するセルラインが存在することを確認した。
【0115】
以下、本実施例において生成された細胞系譜103の応用例について説明する。
【0116】
図14は、各組織における細胞系譜上の細胞の組成比率を例示する図である。図14では、上記実施例に用いた17組織のそれぞれにおいて、突然変異ごとの頻度を用いて算出された細胞系譜上の11種(細胞61~細胞71、及び細胞37a)の細胞の組成比率を示している。
【0117】
図14に示すように、組織ごとに細胞の組成比率は大きく異なっていることがわかる。顕著な例としては、精巣において、細胞67及び細胞69が支配的となっている。一方で、分泌腺、腎臓、心臓、膵臓において、細胞67及び細胞69は、比較的に小さい比率である。このように、個体の複数の組織における突然変異の頻度から生成された細胞系譜103を用いて、当該個体の分析対象としたい組織(第3組織)を構成する複数の細胞の細胞系譜103上の細胞の組成比率として算出してもよい。
【0118】
具体的には、分析ステップにおいて、さらに、生成された細胞系譜103に基づき、分析対象としたい組織を構成する複数の細胞の各々が細胞系譜上のいずれの細胞に対応するかを特定する。その後、分析対象としたい組織における細胞系譜上の細胞の組成比率を算出してもよい。これにより、分析対象としたい組織を構成する複数の細胞の各々が、細胞系譜103をどのようにたどって形成された細胞であるかを調べることができ、さらに、このような細胞がどのような割合で組織内に含まれるかを示すことができる。
【0119】
例えば、分析対象としたい組織を、疾患に関連する組織とし、当該組織を構成する複数の細胞のうちの、組成比率上で多数の細胞及び少数の細胞、並びに、疾患の前後における増加した細胞及び減少した細胞等を数値として示す等が可能となる。よって、これまでになかった観点で疾患に関連する組織についての臨床上のより詳細な情報を得ることができる。
【0120】
なお、分析対象としたい組織は、細胞系譜103の生成に用いられた組織であってもよく、その他であってもよい。言い換えると、第3組織は、第1組織と同じであってもよく、第2組織と同じであってもよく、その他であってもよい。
【0121】
図15は、実施の形態に係る細胞系譜生成方法の適用例を説明する図である。図15では、ある人51において、細胞組成51aが経時的に変化する様子を示している。本発明により、人51のある組織において、細胞系譜のうちのどの細胞がどの程度の割合で含まれているかを示す細胞組成51aを可視化することが容易に可能となる。そこで、図15に示すように、人51の細胞組成51aを経時的に追跡することで、人51において細胞組成51aから細胞組成51bへと変化した前後において、何らかの外因性ストレスの有無を特定することが可能となる。また、図15に示すように、人51の細胞組成51aにおいて、特定の細胞が異常増殖した細胞組成51cへの変化に基づき、人51における発癌の診断を細胞組成51aの変化から早期に行うことが可能となる。
【0122】
なお、上記において、第1変異、第2変異、第3変異、及び第4変異は、特定の突然変異、又は突然変異の組み合わせであるとして説明したが、これらは、突然変異どうしの関係性を説明するための便宜的な変異である。例えば、上記実施例において生成された細胞系譜103では、細胞30aと、細胞31aと、細胞33aとは、第1分岐点の関係を有することを説明した。この場合、細胞30aが有する変異30が、第1変異であり、細胞31aが有する変異31及び細胞33aが有する変異33が、第2変異及び第3変異である。また、生成された細胞系譜103では、細胞33aと、細胞37aと、細胞39aとは、第1分岐点の関係を有することを説明した。この場合、細胞31aが有する変異31が、第1変異であり、細胞37aが有する変異37及び細胞39aが有する変異39が、第2変異及び第3変異である。
【0123】
つまり、第1変異、第2変異、第3変異、及び第4変異とは、細胞系譜103の生成のための分析の各段階において、流動的に異なる変異を示す概念である。
【0124】
[効果等]
以上説明したように、本実施の形態における細胞系譜生成方法は、分析対象とする個体の第1組織及び第2組織を含む2以上の組織それぞれの、当該組織を構成する複数の細胞における突然変異の頻度に基づいて細胞系譜103を生成する。
【0125】
これによれば、分析対象とする個体から第1組織及び第2組織を採取し、細胞の突然変異の頻度を算出するのみで、細胞系譜103を生成できる。生成された細胞系譜103から、従来に比べ、より詳細な情報を得ることができる。
【0126】
より具体的には、本実施の形態における細胞系譜生成方法は、分析対象とする個体の第1組織を構成する複数の細胞における、第1変異の頻度を示す第1頻度、第2変異の頻度を示す第2頻度、及び、第3変異の頻度を示す第3頻度を取得し、個体の第2組織を構成する複数の細胞における、第1変異の頻度を示す第4頻度、第2変異の頻度を示す第5頻度、及び、第3変異の頻度を示す第6頻度を取得する取得ステップと、第2頻度と第3頻度との和が第1頻度に対応し、かつ、第5頻度と第6頻度との和が第4頻度に対応するか否かを判定する判定ステップと判定ステップにおける判定結果に基づき、第1変異、第2変異、及び第3変異の関係を分析して、個体の細胞における変異に基づく細胞系譜103を生成する分析ステップと、を含む。
【0127】
これによれば、細胞系譜生成方法では、分析対象とする個体から複数の組織片を採取し、シーケンサ等の用いて得られたDNA配列から算出された突然変異の頻度を取得する。取得された突然変異の頻度を比較するのみで当該変異を有する細胞の細胞系譜103を生成することができる。よって容易かつ、少なくとも3つの変異の関係に基づき細胞系譜103が生成されるため、従来に比べ、より詳細な情報を得ることができる。
【0128】
また、例えば、分析ステップでは、第2頻度と第3頻度との和が第1頻度に対応し、かつ、第5頻度と第6頻度との和が第4頻度に対応すると判定された場合に、第1変異を有する第1細胞、第2変異を有する第2細胞、及び第3変異を有する第3細胞は、第1細胞から、第2細胞又は第3細胞へと分岐する第1分岐点の関係を有すると決定し、決定した第1分岐点の関係に整合する細胞系譜103を生成してもよい。
【0129】
これによれば、突然変異の頻度の関係に基づき、当該突然変異を有する細胞の系譜として細胞系譜103を生成することができる。よって、より詳細な情報を得ることができる細胞系譜103が生成される。
【0130】
また、例えば、取得ステップでは、さらに、第1組織を構成する複数の細胞における第4変異の頻度を示す第1未帰属頻度、及び、第2組織を構成する複数の細胞における第4変異の頻度を示す第2未帰属頻度を取得し、分析ステップでは、さらに、細胞系譜103のうちの複数の分岐端の細胞の各々が有する複数の分岐端変異について、第1組織を構成する複数の細胞における頻度を示す第1末端頻度が第1未帰属頻度と0よりも大きい第1差分頻度との和に対応し、かつ、第2組織を構成する複数の細胞における頻度を示す第2末端頻度が第2未帰属頻度と0よりも大きい第2差分頻度との和に対応する分岐端変異が1つであるとき、第4変異を有する第4細胞、及び1つの分岐端変異を有する第5細胞は、第5細胞から、第4細胞へと分岐する第2分岐点の関係を有すると決定し、決定した第2分岐点の関係にさらに整合する、細胞系譜103を生成してもよい。
【0131】
これによれば、さらに、細胞系譜103における次代の細胞を特定することで、少なくとも4つの変位の関係に基づき細胞系譜103が生成される。よって、従来に比べ従来に比べ、より詳細な情報を得ることができる。
【0132】
また、例えば、第1変異、第2変異、第3変異、及び第4変異の少なくとも1つは、複数の変異の集合で構成される変異クラスタであってもよい。この場合、変異クラスタである第1変異、第2変異、第3変異、又は第4変異の頻度は、変異クラスタを構成する集合の複数の変異それぞれの頻度の平均値であってもよい。
【0133】
これによれば、細胞系譜103上の同一のタイミングで生じた突然変異を、一体的に取り扱った細胞系譜103を生成できる。言い換えると、上記において説明した突然変異のバリエーションは、複数の突然変異の組み合わせであってもよい。
【0134】
また、例えば、分析ステップでは、第4細胞、第5細胞、及び第6細胞は、第5細胞から、第4細胞又は第6細胞へと分岐する第2分岐点の関係を有すると決定し、第6細胞は、第1組織を構成する複数の細胞における頻度が第1差分頻度であり、かつ、第2組織を構成する複数の細胞における頻度が第2差分頻度である疑似変異を有してもよい。
【0135】
これによれば、細胞系譜103をより次代へとつなげるために、観測されていない(未検出の)変異を有する細胞を仮設定することができる。これにより、更に多世代にわたる細胞系譜103を生成することができる。よって、より詳細な情報を得ることができる。
【0136】
また、例えば、分析ステップでは、さらに、生成された細胞系譜103に基づき、個体の第3組織を構成する複数の細胞の各々が細胞系譜103上のいずれの細胞に対応するかを特定し、第3組織における細胞系譜103上の細胞の組成比率を算出してもよい。
【0137】
これによれば、第3組織を構成する複数の細胞が細胞系譜上のどのような細胞をどのような比率で含んでいるかを、算出された組成比率として示すことができる。例えば、第3組織を構成する複数の細胞のうちの、組成比率上で多数の細胞、少数の細胞、増加した細胞、及び減少した細胞等を数値として示すなど、これまでになかった観点で第3組織に関する臨床上のより詳細な情報を得ることができる。
【0138】
また、例えば、判定ステップでは、上記数式によって表される残差二乗和が所定の閾値以下の場合に、第2頻度と第3頻度との和が第1頻度に対応し、かつ、第5頻度と第6頻度との和が第4頻度に対応すると判定してもよい。
【0139】
これによれば、数式を用いて総当たり的に突然変異の関係を決定することができる。よってより簡便に細胞系譜103を生成することができる。
【0140】
また、例えば、所定の閾値は、作成される細胞系譜103において、(i)1つの細胞から3つ以上の細胞へと分岐する分岐点の関係が存在することの矛盾、及び、(ii)2つ以上の細胞から1つの細胞へと合流する合流点の関係が存在することの矛盾が生じない値であってもよい。
【0141】
これによれば、矛盾の生じない妥当な範囲、かつ、得られる突然変異の頻度の中で最も多世代の細胞系譜103を生成することができる。よって、より詳細な情報を得ることができる。
【0142】
また、例えば、細胞系譜103は、個体の癌細胞における変異に基づいて生成されてもよい。
【0143】
これによれば、癌細胞の細胞系譜103を生成することができる。癌細胞の由来を明らかにすることができるため、有効な抗癌剤、治療法、予後等の判断のために、より詳細な情報を提供できる。
【0144】
また、例えば、第2組織は、第1組織とは異なる組織であってもよい。
【0145】
これによれば、第1組織と、第1組織とは異なる第2組織とを用いて細胞系譜103を生成できる。より様々な細胞組成の組織において細胞系譜103の生成に用いる突然変異の頻度の算出を実施できるため、組成割合の少ない細胞に起因する検出誤差の影響を低減できる。よって、より正確な細胞系譜103の生成が実施できる。
【0146】
また、本実施の形態におけるプログラムは、上記のいずれかに記載の方法をコンピュータに実行させる。
【0147】
これによれば、コンピュータを用いて、上記に記載の細胞系譜生成方法を実行することができる。
【0148】
また、本実施の形態における細胞系譜生成装置100は、分析対象とする個体の第1組織を構成する複数の細胞における、第1変異の頻度を示す第1頻度、第2変異の頻度を示す第2頻度、及び、第3変異の頻度を示す第3頻度を取得し、個体の第2組織を構成する複数の細胞における、第1変異の頻度を示す第4頻度、第2変異の頻度を示す第5頻度、及び、第3変異の頻度を示す第6頻度を取得する取得部11と、第2頻度と第3頻度との和が第1頻度に対応し、かつ、第5頻度と第6頻度との和が第4頻度に対応するか否かを判定する判定部13と、判定部の判定結果に基づき、第1変異、第2変異、及び第3変異の関係を分析して個体の細胞においてした変異に基づく細胞系譜103を生成する分析部15と、を備える。
【0149】
これによれば、細胞系譜生成装置100は、分析対象とする個体から複数の組織片を採取し、シーケンサ等の用いて得られたDNA配列から算出された突然変異の頻度を取得部11により取得する。判定部13において取得された突然変異の頻度を比較するのみで、分析部15は当該変異を有する細胞の細胞系譜103を生成することができる。よって容易かつ、少なくとも3つの変異の関係に基づき細胞系譜103が生成されるため、従来に比べ、より詳細な情報を得ることができる。
【0150】
(その他の実施の形態)
以上、実施の形態について説明したが、本発明は、上記実施の形態に限定されるものではない。
【0151】
例えば、上記実施の形態において、特定の処理部が実行する処理を別の処理部が実行してもよい。また、複数の処理の順序が変更されてもよいし、複数の処理が並行して実行されてもよい。
【0152】
また、上記実施の形態において、入出力部などの各構成要素は、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPU又はプロセッサなどのプログラム実行部が、ハードディスク又は半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
【0153】
また、入出力部などの各構成要素は、ハードウェアによって実現されてもよい。各構成要素は、回路(又は集積回路)でもよい。これらの回路は、全体として1つの回路を構成してもよいし、それぞれ別々の回路でもよい。また、これらの回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。
【0154】
また、本発明の全般的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム又はコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよい。また、システム、装置、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。
【0155】
例えば、上記以外の遺伝学的な追加実験の結果を用いて細胞系譜の補間を行う補間装置を備えていてもよい。また、このような補間のための実験の結果を入力する入力装置を備えていてもよい。
【0156】
また、例えば、上記の実施の形態における細胞系譜生成装置と、シーケンサと、変異頻度算出装置と、出力部とが一体化された細胞系譜生成システムとして実現されてもよい。
【0157】
また、本発明は、コンピュータによって行われる情報の提示方法として実現されてもよいし、情報の提示方法をコンピュータに実行させるためのプログラムとして実現されてもよい。また、本発明は、このようなプログラムが記録されたコンピュータ読み取り可能な非一時的な記録媒体として実現されてもよい。
【0158】
その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、又は、本発明の趣旨を逸脱しない範囲で各実施の形態における構成要素及び機能を任意に組み合わせることで実現される形態も本発明に含まれる。
【産業上の利用可能性】
【0159】
本発明は、癌等、疾患の診断、及び投薬等の治療のための予備検査等において有用な情報を提供するなど、臨床上のあらゆる場面において有効に用いられる。
【符号の説明】
【0160】
11 取得部
13 判定部
15 分析部
30、31、33、37、39、43 変異
30a、31a、33a、37a、39a、43a、45a、61、63、65、67、69、71、73、75、77、79 細胞
35、41 仮想頻度
45 疑似変異
51 人
51a、51b、51c 細胞組成
100 細胞系譜生成装置
101 モザイク変異
102 ヘテロ接合の突然変異
103、103a、103b 細胞系譜
201 シーケンサ
203 変異頻度算出装置
205 出力部
図1A
図1B
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12A
図12B
図12C
図13
図14
図15