IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7601204遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体
<>
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図1
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図2
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図3
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図4
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図5
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図6
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図7
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図8
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図9
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図10
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図11
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図12
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図13
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図14
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図15
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図16
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図17
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図18
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図19
  • 特許-遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体 図20
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-09
(45)【発行日】2024-12-17
(54)【発明の名称】遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体
(51)【国際特許分類】
   G16B 25/00 20190101AFI20241210BHJP
【FI】
G16B25/00
【請求項の数】 9
(21)【出願番号】P 2023506774
(86)(22)【出願日】2022-01-06
(86)【国際出願番号】 JP2022000221
(87)【国際公開番号】W WO2022196041
(87)【国際公開日】2022-09-22
【審査請求日】2023-08-15
(31)【優先権主張番号】P 2021041423
(32)【優先日】2021-03-15
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100104765
【弁理士】
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100107331
【弁理士】
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100131015
【弁理士】
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】麻生川 稔
【審査官】松田 岳士
(56)【参考文献】
【文献】特開2007-259847(JP,A)
【文献】特開2006-163720(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00-99/00
C12M 1/00- 3/10
C12Q 1/00- 3/00
(57)【特許請求の範囲】
【請求項1】
PCR後の遺伝子におけるマイクロサテライトの分布情報を取得する第1取得手段と、
前記PCRの1サイクルごとの前記マイクロサテライトの増幅率を示す第1の割合と、前記PCRの1サイクルごとに前記マイクロサテライトから発生するスタッターの割合を示す第2の割合と、前記PCRのサイクル数と、を取得する第2取得手段と、
前記PCR後の遺伝子における前記マイクロサテライトの分布情報と、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、に基づいて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出する算出手段と
を備え
前記算出手段は、前記PCRによる増幅をモデル化した行列であって、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を成分として含む増幅行列を用いて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出する
ことを特徴とする遺伝子情報処理システム。
【請求項2】
前記算出手段は、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を用いて、繰り返しユニットが1つ少ない又は多いスタッターのアンプリコン量を推定することを特徴とする請求項1に記載の遺伝子情報処理システム。
【請求項3】
前記算出手段は、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を用いて、繰り返しユニットが2つ少ない又は多いスタッターのアンプリコン量を推定することを特徴とする請求項1又は2に記載の遺伝子情報処理システム。
【請求項4】
前記算出手段は、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を用いて、前記PCRで増幅されたマイクロサテライトのアンプリコン量に対する前記スタッターのアンプリコン量の比率であるスタッター比を推定することを特徴とする請求項1から3のいずれか一項に記載の遺伝子情報処理システム。
【請求項5】
前記第2の割合は、繰り返しユニットが少ないマイナススタッターが発生する割合と、繰り返しユニットが多いプラススタッターの割合と、の両方を含むことを特徴とする請求項1から4のいずれか一項に記載の遺伝子情報処理システム。
【請求項6】
前記第2取得手段は、前記PCR後の前記遺伝子における前記マイクロサテライトの分布情報から、前記第1の割合、前記第2の割合、及び前記PCRのサイクル数の少なくとも1つを推定して取得することを特徴とする請求項1からのいずれか一項に記載の遺伝子情報処理システム。
【請求項7】
前記第2取得手段は、前記第1の割合、前記第2の割合、及び前記PCRのサイクル数の少なくとも1つを、山登り法又はデータフィッティングにより推定することを特徴とする請求項に記載の遺伝子情報処理システム。
【請求項8】
少なくとも1つのコンピュータが、
PCR後の遺伝子におけるマイクロサテライトの分布情報を取得し、
前記PCRの1サイクルごとの前記マイクロサテライトの増幅率を示す第1の割合と、前記PCRの1サイクルごとに前記マイクロサテライトから発生するスタッターの割合を示す第2の割合と、前記PCRのサイクル数と、を取得し、
前記PCR後の遺伝子における前記マイクロサテライトの分布情報と、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、に基づいて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出し、
前記マイクロサテライトの分を算出する際には、前記PCRによる増幅をモデル化した行列であって、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を成分として含む増幅行列を用いて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出する
ことを特徴とする遺伝子情報処理方法。
【請求項9】
PCR後の遺伝子におけるマイクロサテライトの分布情報を取得し、
前記PCRの1サイクルごとの前記マイクロサテライトの増幅率を示す第1の割合と、前記PCRの1サイクルごとに前記マイクロサテライトから発生するスタッターの割合を示す第2の割合と、前記PCRのサイクル数と、を取得し、
前記PCR後の遺伝子における前記マイクロサテライトの分布情報と、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、に基づいて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出し、
前記マイクロサテライトの分を算出する際には、前記PCRによる増幅をモデル化した行列であって、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を成分として含む増幅行列を用いて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出する
ようにコンピュータを動作させることを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、遺伝子情報に関する処理を実行する遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体の技術分野に関する。
【背景技術】
【0002】
この種のシステムとして、PCR(Polymerase Chain Reaction)において発生するスタッターに関する情報を扱うものが知られている。例えば特許文献1では、PCRの増幅後に現れるスタッターの相対的な高さを見積もることが記載されている。特許文献2では、PCRによって得られるピークが真のピークであるかノイズピークであるかを問わずに、ピーク判定を行う技術が開示されている。特許文献3では、パーセントスタッターを算出し、任意のサンプルの値をまとめた平均パーセントスタッターを算出することが開示されている。特許文献4では、ピーク位置、ピーク高、スタッター率を含むモデルパラメータを最適化することが開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2006-163720号公報
【文献】特開2006-079334号公報
【文献】特表2004-533241号公報
【文献】特表2004-516455号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
この開示は、例えば上記各引用文献に鑑みてなされたものであり、遺伝子に関する処理を適切に実行することが可能な遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0005】
この開示の遺伝子情報処理システムの一の態様は、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得する第1取得手段と、前記PCRの1サイクルごとの前記マイクロサテライトの増幅率を示す第1の割合と、前記PCRの1サイクルごとに前記マイクロサテライトから発生するスタッターの割合を示す第2の割合と、前記PCRのサイクル数と、を取得する第2取得手段と、前記PCR後の遺伝子における前記マイクロサテライトの分布情報と、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、に基づいて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出する算出手段とを備える。
【0006】
この開示の遺伝子情報処理方法の一の態様は、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得し、前記PCRの1サイクルごとの前記マイクロサテライトの増幅率を示す第1の割合と、前記PCRの1サイクルごとに前記マイクロサテライトから発生するスタッターの割合を示す第2の割合と、前記PCRのサイクル数と、を取得し、前記PCR後の遺伝子における前記マイクロサテライトの分布情報と、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、に基づいて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出する。
【0007】
この開示の記録媒体の一の態様は、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得し、前記PCRの1サイクルごとの前記マイクロサテライトの増幅率を示す第1の割合と、前記PCRの1サイクルごとに前記マイクロサテライトから発生するスタッターの割合を示す第2の割合と、前記PCRのサイクル数と、を取得し、前記PCR後の遺伝子における前記マイクロサテライトの分布情報と、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、に基づいて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出するようにコンピュータを動作させるコンピュータプログラムが記録されている。
【図面の簡単な説明】
【0008】
図1】第1実施形態に係る遺伝子情報処理システムのハードウェア構成を示すブロック図である。
図2】第1実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。
図3】PCRにおいて発生するスタッターの一例を示すグラフである。
図4】第1実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。
図5】第2実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。
図6】-1スタッターの一例を示すグラフである。
図7】スタッターのアンプリコン量を推定する方法を示す概念図である。
図8】第2実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。
図9】-2スタッター及び+2スタッターの一例を示すグラフである。
図10】第4実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。
図11】第4実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。
図12】マイナススタッターが発生する割合及びプラススタッターが発生する割合の両方を考慮する例を示す概念図である。
図13】第6実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。
図14】PCRによる増幅をモデル化した増幅行列の一例を示す行列式である。
図15】第6実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。
図16】第7実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。
図17】第7実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。
図18】第8実施形態に係る遺伝子情報処理システムにおいて算出される遺伝子情報の推算量と実際量とを示すグラフである。
図19】繰り返し回数と-1スタッター比との関係を示すグラフである。
図20】データフィッティングによりスタッターが発生する割合を推定する方法を示すグラフである。
【発明を実施するための形態】
【0009】
以下、図面を参照しながら、遺伝子情報処理システム、遺伝子情報処理方法、コンピュータプログラム、及び記録媒体の実施形態について説明する。
【0010】
<第1実施形態>
第1実施形態に係る遺伝子情報処理システムについて、図1から図4を参照して説明する。
【0011】
(ハードウェア構成)
まず、図1を参照しながら、第1実施形態に係る遺伝子情報処理システム10のハードウェア構成について説明する。図1は、第1実施形態に係る遺伝子情報処理システムのハードウェア構成を示すブロック図である。
【0012】
図1に示すように、第1実施形態に係る遺伝子情報処理システム10は、プロセッサ11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、記憶装置14とを備えている。遺伝子情報処理システム10は更に、入力装置15と、出力装置16とを備えていてもよい。プロセッサ11と、RAM12と、ROM13と、記憶装置14と、入力装置15と、出力装置16と、カメラ20とは、データバス17を介して接続されている。
【0013】
プロセッサ11は、コンピュータプログラムを読み込む。例えば、プロセッサ11は、RAM12、ROM13及び記憶装置14のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込むように構成されている。或いは、プロセッサ11は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。プロセッサ11は、ネットワークインタフェースを介して、遺伝子情報処理システム10の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、読み込んでもよい)。プロセッサ11は、読み込んだコンピュータプログラムを実行することで、RAM12、記憶装置14、入力装置15及び出力装置16を制御する。本実施形態では特に、プロセッサ11が読み込んだコンピュータプログラムを実行すると、プロセッサ11内には、遺伝子情報に関する処理を実行するための機能ブロックが実現される。また、プロセッサ11として、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)のうち一つを用いてもよいし、複数を並列で用いてもよい。
【0014】
RAM12は、プロセッサ11が実行するコンピュータプログラムを一時的に記憶する。RAM12は、プロセッサ11がコンピュータプログラムを実行している際にプロセッサ11が一時的に使用するデータを一時的に記憶する。RAM12は、例えば、D-RAM(Dynamic RAM)であってもよい。
【0015】
ROM13は、プロセッサ11が実行するコンピュータプログラムを記憶する。ROM13は、その他に固定的なデータを記憶していてもよい。ROM13は、例えば、P-ROM(Programmable ROM)であってもよい。
【0016】
記憶装置14は、遺伝子情報処理システム10が長期的に保存するデータを記憶する。記憶装置14は、プロセッサ11の一時記憶装置として動作してもよい。記憶装置14は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。
【0017】
入力装置15は、遺伝子情報処理システム10のユーザからの入力指示を受け取る装置である。入力装置15は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。
【0018】
出力装置16は、遺伝子情報処理システム10に関する情報を外部に対して出力する装置である。例えば、出力装置16は、遺伝子情報処理システム10に関する情報を表示可能な表示装置(例えば、ディスプレイ)であってもよい。
【0019】
(機能的構成)
次に、図2を参照しながら、第1実施形態に係る遺伝子情報処理システム10の機能的構成について説明する。図2は、第1実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。
【0020】
図2に示すように、第1実施形態に係る遺伝子情報処理システム10は、その機能を実現するための処理ブロックとして、第1取得部110と、第2取得部120と、算出部130とを備えて構成されている。第1取得部110、第2取得部120、及び算出部130の各々は、例えば上述したプロセッサ11(図1参照)において実現されればよい。
【0021】
第1取得部110は、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得可能に構成されている。第1取得部110は、例えば事前に行われた実験(即ち、PCRを用いた増幅処理)の結果として、マイクロサテライトの分布情報を取得すればよい。マイクロサテライトの分布情報は、一の生体(即ち、単数の生体)のマイクロサテライトの分布情報であってもよいし、複数の生体のマイクロサテライトの分布情報(例えば、混合サンプルから得られた分布情報)であってもよい。なお、単数の生体由来でも、1つの遺伝子座のマイクロサテライトは2種であることがある(正確には、1種又は2種である)。マイクロサテライトの分布情報は、このような単数の生体由来の2種のマイクロサテライトの分布情報であってもよい。
【0022】
第2取得部120は、PCRの1サイクルごとのマイクロサテライトの増幅率を示す第1の割合と、PCRの1サイクルごとにマイクロサテライトから発生するスタッターの割合を示す第2の割合と、PCRのサイクル数と、を取得可能に構成されている。第2取得部120は、第1の割合、第2の割合、及びPCRのサイクル数の少なくとも1つを、例えばユーザ等が入力する既知の値として取得してもよい。或いは、第2取得部120は、第2取得部120は、第1の割合、第2の割合、及びPCRのサイクル数の少なくとも1つを、他のパラメータから推定して取得してもよい。なお、各パラメータを推定する方法については、後述する他の実施形態で詳しく説明する。
【0023】
算出部130は、第1取得部110で取得されたPCR後の遺伝子におけるマイクロサテライトの分布情報と、第2取得部120で取得された第1の割合、第2の割合、及びPCRのサイクル数とに基づいて、PCR前の遺伝子におけるマイクロサテライトの分布を算出可能に構成されている。即ち、算出部130は、PCRの対象となった遺伝子の元々の(即ち、増幅前の)マイクロサテライトの分布を算出可能に構成さている。算出部130による具体的な算出の方法については、後述する他の実施形態で詳しく説明する。
【0024】
(スタッター)
次に、図3を参照しながら、PCRにおいて発生するスタッターについて具体的に説明する。図3は、PCRにおいて発生するスタッターの一例を示すグラフである。
【0025】
図3に示すように、遺伝子情報をPCRによって増幅すると、本物の遺伝子情報(以下、適宜「真のアリル」と称する)に加えて、スタッターと呼ばれるノイズが検出される。スタッターのピークは、真のアリルのピーク位置に対して、繰り返しユニット数が少ない又は多い位置で検出される。本実施形態に係る遺伝子情報処理システム10は、このスタッターが発生する割合を第2の割合として取得することで、PCR前の遺伝子におけるマイクロサテライトの分布を算出する。言い換えれば、PCRによる増幅でスタッターが生じている場合でも、真のアリルに対応する増幅前の分布情報を得ることができる。
【0026】
(動作の流れ)
次に、図4を参照しながら、第1実施形態に係る遺伝子情報処理システム10の動作の流れについて説明する。図4は、第1実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。
【0027】
図4に示すように、第1実施形態に係る遺伝子情報処理システム10が動作する際には、まず第1取得部110が、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得する(ステップS101)。
【0028】
続いて、第2取得部120が、第1の割合を取得し(ステップS102)、第2の割合を取得し(ステップS103)、PCRのサイクル数を取得する(ステップS104)。なお、第1の割合、第2の割合、PCRのサイクル数を取得する順序は、上記の順に限定されるものではなく、互いに前後して取得されてもよいし、同時に取得されてもよい。
【0029】
続いて、算出部130が、第1取得部110で取得されたPCR後の遺伝子におけるマイクロサテライトの分布情報と、第2取得部120で取得された第1の割合、第2の割合、及びPCRのサイクル数とに基づいて、PCR前の遺伝子におけるマイクロサテライトの分布を算出する(ステップS105)。算出部130は、算出したPCR前の遺伝子におけるマイクロサテライトの分布を出力する機能を有していてもよい。算出部130は、例えばディスプレイ等に算出したマイクロサテライトの分布を表示するようにしてもよい。
【0030】
(技術的効果)
次に、第1実施形態に係る遺伝子情報処理システム10によって得られる技術的効果について説明する。
【0031】
図1から図4で説明したように、第1実施形態に係る遺伝子情報処理システム10では、PCR後の遺伝子におけるマイクロサテライトの分布情報と、第1の割合と、第2の割合と、PCRのサイクル数とに基づいて、PCR前の遺伝子におけるマイクロサテライトの分布が算出される。このようにすれば、PCRにおいて発生するスタッターの存在を考慮して、PCR前の遺伝子におけるマイクロサテライトの分布を適切に算出することが可能である。
【0032】
<第2実施形態>
第2実施形態に係る遺伝子情報処理システム10について、図5から図8を参照して説明する。なお、第2実施形態は、上述した第1実施形態と一部の動作が異なるのみであり、例えばハードウェア構成等については、第1実施形態(図1参照)と同一であってよい。このため、以下では、第1実施形態と重複する部分については適宜説明を省略するものとする。
【0033】
(機能的構成)
まず、図5を参照しながら、第2実施形態に係る遺伝子情報処理システム10の機能的構成について説明する。図5は、第2実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。なお、図5では、図2で示した構成要素と同様の要素に同一の符号を付している。
【0034】
図5に示すように、第2実施形態に係る遺伝子情報処理システム10は、その機能を実現するための処理ブロックとして、第1取得部110と、第2取得部120と、算出部130とを備えて構成されている。そして特に、第2実施形態に係る算出部130は、アンプリコン量推定部131を備えている。
【0035】
アンプリコン量推定部131は、第1の割合と、第2の割合と、PCR法のサイクル数と、を用いて、繰り返しユニットが1つ少ないスタッター(以下、適宜「-1スタッター」と称する)、又は繰り返しユニットが1つ多いスタッター(以下、適宜「+1スタッター」と称する)のアンプリコン量を推定可能に構成されている。そして、第2実施形態に係る算出部130は、アンプリコン量推定部131で推定された-1スタッター又は+1スタッターのアンプリコン量を用いて、PCR前の遺伝子におけるマイクロサテライトの分布を算出可能に構成されている。
【0036】
(-1スタッター)
次に、図6を参照しながら、上述したアンプリコン量推定部131がアンプリコン量を推定する-1スタッターについて具体的に説明する。図6は、-1スタッターの一例を示すグラフである。
【0037】
図6に示すように、-1スタッターのピークは、真のアリルのピークの位置に対して、繰り返しユニット数が1個分少ない位置で検出される。-1スタッターのピークは、その他のスタッターと比較して発生割合が大きく、ピークの大きさも比較的大きなものとなる。よって、-1スタッターのアンプリコン量を推定することができれば、真のアリルのマイクロサテライトの分布を精度よく算出できるようになる。なお、-1スタッターのアンプリコン量を推定するための具体的な手法については、以下で詳しく説明する。
【0038】
(アンプリコン量の推定方法)
次に、図7を参照しながら、スタッターのアンプリコン量を推定する方法について具体的に説明する。図7は、スタッターのアンプリコン量を推定する方法を示す概念図である。
【0039】
図7に示すように、遺伝子情報のうち「5回繰り返し」のものをPCRで増幅する場合を考える。なお、ここでは説明の便宜上、-1スタッターのみが発生する場合を考えるものとする。また、PCRの1サイクルごとのマイクロサテライトの増幅率(即ち、第1の割合)は“a”、PCRの1サイクルごとにマイクロサテライトから発生するスタッターの割合(即ち、第2の割合)は“b”、PCRのサイクル数は“n”とする。
【0040】
図7を見ると分かるように、PCRを3サイクルした場合、「5回繰り返し」のアンプリコン量は、aとなる。また、-1スタッター(即ち、「4回繰り返し」)のアンプリコン量は、3×a×bとなる。そして、PCRをnサイクルした場合、「5回繰り返し」のアンプリコン量は、aとなる。また、-1スタッター(即ち、「4回繰り返し」)のアンプリコン量は、nC1×an-1×bとなる(Cはコンビネーション)。
【0041】
以上のように、第1の割合a、第2の割合b、PCRのサイクル数nを用いれば、-1スタッターのアンプリコン量を推定することが可能である。なお、ここでの説明は省略したが、+1スタッター(即ち、真のアリルのピークの位置に対して、繰り返しユニット数が1個分多い位置で検出されるスタッター)のアンプリコン量を推定してもよい。+1スタッターのアンプリコン量を推定する場合には、上記の第1の割合a、第2の割合bに加えて、プラススタッターが発生する第3の割合cを考慮すればよい。第3の割合cを用いる構成については、後述する他の実施形態(第5実施形態)で詳しく説明する。
【0042】
(動作の流れ)
次に、図8を参照しながら、第2実施形態に係る遺伝子情報処理システム10の動作の流れについて説明する。図8は、第2実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。なお、図8では、図4で示した処理と同様の処理に同一の符号を付している。
【0043】
図8に示すように、第2実施形態に係る遺伝子情報処理システム10が動作する際には、まず第1取得部110が、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得する(ステップS101)。
【0044】
続いて、第2取得部120が、第1の割合を取得し(ステップS102)、第2の割合を取得し(ステップS103)、PCRのサイクル数を取得する(ステップS104)。
【0045】
続いて、アンプリコン量推定部131が、第1の割合、第2の割合、及びPCRのサイクル数を用いて、-1スタッターのアンプリコン量又は+1スタッターのアンプリコン量を推定する(ステップS201)。そして、算出部130は、アンプリコン量推定部131が推定したアンプリコン量を用いて、PCR前の遺伝子におけるマイクロサテライトの分布を算出する(ステップS202)。
【0046】
(技術的効果)
次に、第2実施形態に係る遺伝子情報処理システム10によって得られる技術的効果について説明する。
【0047】
図5から図8で説明したように、第2実施形態に係る遺伝子情報処理システム10では、-1スタッター又は+1スタッターのアンプリコン量を推定し、推定したアンプリコン量を用いて、PCR前の遺伝子におけるマイクロサテライトの分布が算出される。このようにすれば、PCRにおいて発生する-1スタッター又は+1スタッターの存在を考慮して、PCR前の遺伝子におけるマイクロサテライトの分布を適切に算出することが可能である。
【0048】
<第3実施形態>
第3実施形態に係る遺伝子情報処理システム10について、図9を参照して説明する。なお、第3実施形態は、上述した第2実施形態と比べて、扱うスタッターの種類が異なるのみであり、システムの構成や全体的な動作の流れ等については、第2実施形態と同一であってよい。このため、以下では、すでに説明した部分と重複する部分については適宜説明を省略するものとする。
【0049】
(アンプリコン量推定部の構成)
第3実施形態に係る遺伝子情報処理システム10では、アンプリコン量推定部131が、繰り返しユニットが2個少ないスタッター(以下、適宜「-2スタッター」と称する)、又は繰り返しユニットが2個少ないスタッター(以下、適宜「+2スタッター」と称する)のアンプリコン量を推定する。アンプリコン量推定部131は、典型的には、すでに第2実施形態で説明した-1スタッター又は+1スタッターのアンプリコン量と共に、-2スタッター又は+2スタッターのアンプリコン量を推定する。ただし、アンプリコン量推定部131は、-1スタッター又は+1スタッターのアンプリコン量を推定せずに、-2スタッター又は+2スタッターのアンプリコン量のみを推定してもよい。
【0050】
(-2スタッター及び+2スタッター)
次に、図9を参照しながら、第3実施形態に係るアンプリコン量推定部131がアンプリコン量を推定する-2スタッター及び+2スタッターについて具体的に説明する。図9は、-2スタッター及び+2スタッターの一例を示すグラフである。
【0051】
図9に示すように、-2スタッターのピークは、真のアリルのピークの位置に対して、繰り返しユニット数が2個分少ない位置で検出される。一方、+2スタッターのピークは、真のアリルのピークの位置に対して、繰り返しユニット数が2個分多い位置で検出される。-2スタッターは、-1スタッターが発生する現象が2回発生することで生ずる。同様に、+2スタッターは、+1スタッターが発生する現象が2回発生することで生ずる。このため-2スタッター及び+2スタッターは、-1スタッター及び+1スタッターと比べて、その発生割合が小さく、ピークの大きさも比較的小さなものとなる。ただし、-2スタッター及び+2スタッターのアンプリコン量を推定することができれば、真のアリルのマイクロサテライトの分布を更に精度よく算出できるようになる。なお、-2スタッター及び+2スタッターのアンプリコン量を推定するための具体的な手法については、以下で詳しく説明する。
【0052】
(アンプリコン量の推定方法)
次に、既出の図7を参照しながら、スタッターのアンプリコン量を推定する方法について具体的に説明する。なお、各種条件は、第2実施形態で説明したものと同様であるものとする。
【0053】
図7において、すでに説明したように、PCRを3サイクルした場合、「5回繰り返し」のアンプリコン量は、aとなり、-1スタッター(即ち、「4回繰り返し」)のアンプリコン量は、3×a×bとなる。この場合、-2スタッター(即ち、「3回繰り返し」)のアンプリコン量は、3×a×bとなる。
【0054】
そして、PCRをnサイクルした場合、「5回繰り返し」のアンプリコン量は、aとなり、-1スタッター(即ち、「4回繰り返し」)のアンプリコン量は、nC1×an-1×bとなる。この場合、-2スタッター(即ち、「3回繰り返し」)のアンプリコン量は、nC2×an-2×bとなる。-1スタッター比SR-1は、(「4回繰り返し」のアンプリコン量)/(「5回繰り返し」のアンプリコン量)と表現できるため、前述の値を用いると、SR-1=(nC1×an-1×b)/(a)=nC1×b/a=n×b/aと表すことができる。同様に、-2スタッター比SR-2は、(「3回繰り返し」のアンプリコン量)/(「5回繰り返し」のアンプリコン量)と表現できるため、前述の値を用いると、SR-2=(nC2×an-2×b)/(a)=nC2×b/a=1/2×n×(n-1)×b/a≒1/2×(n×b/a)=1/2×(SR-1と表すことができる。
【0055】
以上のように、第1の割合a、第2の割合b、PCRのサイクル数nを用いれば、-2スタッターのアンプリコン量を推定することが可能である。なお、ここでの説明は省略したが、+2スタッターのアンプリコン量についても、同様の手法で推定することが可能である。上述した例では、-2スタッターが、「-1スタッターが発生する現象が2回発生することで生ずる」ことを前提として説明したが、1回のPCR過程で-2スタッターが生ずる可能性を考慮してもよい。この場合、上記第1の割合a、第2の割合bに加えて、-2スタッターが発生する割合を用いればよい。この値は、例えば「x回繰り返し」の2次式で近似すればよい。同様に、1回のPCR過程で-3スタッターが生ずる可能性を考慮してもよい。この場合、-3スタッターが発生する割合を用いればよい。この値は、例えば「x回繰り返し」の3次式(或いは、3次以上の式)で近似すればよい。
【0056】
(技術的効果)
次に、第3実施形態に係る遺伝子情報処理システム10によって得られる技術的効果について説明する。
【0057】
図9で説明したように、第3実施形態に係る遺伝子情報処理システム10では、-2スタッター又は+2スタッターのアンプリコン量を推定し、推定したアンプリコン量を用いて、PCR前の遺伝子におけるマイクロサテライトの分布が算出される。このようにすれば、PCRにおいて発生する-2スタッター又は+2スタッターの存在を考慮して、PCR前の遺伝子におけるマイクロサテライトの分布を適切に算出することが可能である。
【0058】
なお、ここまでの実施形態では、-1スタッター、+1スタッター、-2スタッター、及び+2スタッターのアンプリコン量を推定する例を挙げたが、繰り返しユニット数が3つ以上少ない又は多いスタッター(例えば、-3スタッターや+3スタッター等)のアンプリコン量を推定して、PCR前の遺伝子におけるマイクロサテライトの分布を算出するようにしてもよい。
【0059】
<第4実施形態>
第4実施形態に係る遺伝子情報処理システム10について、図10及び図11を参照して説明する。なお、第4実施形態は、上述した第1から第3実施形態と比べて、一部の構成及び動作が異なるのみであり、その他の部分は第1から第3実施形態と同一であってよい。このため、以下では、すでに説明した部分と重複する部分については適宜説明を省略するものとする。
【0060】
(機能的構成)
まず、図10を参照しながら、第4実施形態に係る遺伝子情報処理システム10の機能的構成について説明する。図10は、第4実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。なお、図10では、図2で示した構成要素と同様の要素に同一の符号を付している。
【0061】
図10に示すように、第4実施形態に係る遺伝子情報処理システム10は、その機能を実現するための処理ブロックとして、第1取得部110と、第2取得部120と、算出部130とを備えて構成されている。そして特に、第4実施形態に係る算出部130は、スタッター比推定部132を備えている。
【0062】
スタッター比推定部132は、第1の割合と、第2の割合と、PCR法のサイクル数と、を用いて、PCRで増幅されたマイクロサテライトのアンプリコン量に対するスタッターのアンプリコン量の比率であるスタッター比を推定可能に構成されている。なお、スタッター比の対象となるスタッターは、繰り返しユニット数が少ないマイナススタッター(例えば、-1スタッターや-2スタッター)であってもよいし、繰り返しユニット数が多いプラススタッター(例えば、+1スタッターや+2スタッター)であってもよい。そして、第4実施形態に係る算出部130は、スタッター比推定部132で推定されたスタッター比を用いて、PCR前の遺伝子におけるマイクロサテライトの分布を算出可能に構成されている。
【0063】
(スタッター比の算出方法)
スタッター比は、すでに説明した各スタッターのアンプリコン量を用いて算出することができる。例えば、図7に示す例における-1スタッターのスタッター比r1は、「4回繰り返し(即ち、-1スタッター)のアンプリコン量」÷「5回繰り返しのアンプリコン量」として算出できる。具体的には、-1スタッターのスタッター比r1は、(nC1×an-1×b)÷a=nC1×(b/a)となる。同様に、-2スタッターのスタッター比r2は、「3回繰り返し(即ち、-2スタッター)のアンプリコン量」÷「5回繰り返しのアンプリコン量」として算出できる。具体的には、-2スタッターのスタッター比r2は、(nC2×an-2×b)÷a=nC2×(b/a)となる。
【0064】
なお、ここでは-1スタッターのスタッター比r1、及び-2スタッターのスタッター比r2についてのみ説明したが、その他のスタッター比についても、同様の手法で算出することが可能である。
【0065】
(動作の流れ)
次に、図11を参照しながら、第4実施形態に係る遺伝子情報処理システム10の動作の流れについて説明する。図11は、第4実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。なお、図11では、図4に示した処理と同様の処理に同一の符号を付している。
【0066】
図11に示すように、第4実施形態に係る遺伝子情報処理システム10が動作する際には、まず第1取得部110が、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得する(ステップS101)。
【0067】
続いて、第2取得部120が、第1の割合を取得し(ステップS102)、第2の割合を取得し(ステップS103)、PCRのサイクル数を取得する(ステップS104)。
【0068】
続いて、スタッター比推定部132が、第1の割合、第2の割合、及びPCRのサイクル数を用いて、スタッター比を推定する(ステップS401)。そして、算出部130は、スタッター比推定部132が推定したスタッター比を用いて、PCR前の遺伝子におけるマイクロサテライトの分布を算出する(ステップS402)。
【0069】
(技術的効果)
次に、第4実施形態に係る遺伝子情報処理システム10によって得られる技術的効果について説明する。
【0070】
図10及び図11で説明したように、第4実施形態に係る遺伝子情報処理システム10では、スタッターのアンプリコン量の比率であるスタッター比を推定し、推定したスタッター比を用いて、PCR前の遺伝子におけるマイクロサテライトの分布が算出される。このようにすれば、PCRにおいて発生するスタッターの存在を考慮して、PCR前の遺伝子におけるマイクロサテライトの分布を適切に算出することが可能である。
【0071】
<第5実施形態>
第5実施形態に係る遺伝子情報処理システム10について、図12を参照して説明する。なお、第5実施形態は、上述した第1から第4実施形態と比べて、第2の割合に含まれる一部のパラメータが異なるのみであり、その他の部分は第1から第4実施形態と同一であってよい。このため、以下では、すでに説明した部分と重複する部分については適宜説明を省略するものとする。
【0072】
(複数種類のスタッターの発生割合)
まず、図12を参照しながら、第5実施形態に係る遺伝子情報処理システム10で扱われる第2の割合について説明する。図12は、マイナススタッターが発生する割合及びプラススタッターが発生する割合の両方を考慮する例を示す概念図である。
【0073】
図12に示すように、第5実施形態に係る遺伝子情報処理システム10では、繰り返しユニット数が少ないマイナススタッターが発生する割合bと、繰り返しユニット数が多いプラススタッターが発生する割合cとの両方を考慮する。
【0074】
図12の例において、PCRを10サイクルしたとすると、「5回繰り返し」のアンプリコン量は、a10+abc+1260a+4200a+3150a+252bとなる。また、「4回繰り返し(即ち、-1スタッター)」のアンプリコン量は、10ab+360ac+2520a+4200a+1260abとなる。「3回繰り返し(即ち、-2スタッター)」のアンプリコン量は、45a+840ac+3150a+2520a+210bとなる。
【0075】
なお、ここでは-1スタッター及び-2スタッターの例を挙げたが、その他のスタッター比についても、同様の手法で算出することが可能である。
【0076】
(技術的効果)
次に、第5実施形態に係る遺伝子情報処理システム10によって得られる技術的効果について説明する。
【0077】
図12で説明したように、第5実施形態に係る遺伝子情報処理システム10では、マイナススタッターが発生する割合と、繰り返しユニットが多いプラススタッターが発生する割合との両方が用いられる。このようにすれば、PCRにおいて発生するマイナススタッター及びプラススタッターの両方の存在を考慮して、PCR前の遺伝子におけるマイクロサテライトの分布を適切に算出することが可能である。
【0078】
<第6実施形態>
第6実施形態に係る遺伝子情報処理システム10について、図13から図16を参照して説明する。なお、第6実施形態は、上述した第1から第5実施形態と比べて、一部の構成及び動作が異なるのみであり、その他の部分は第1から第5実施形態と同一であってよい。このため、以下では、すでに説明した部分と重複する部分については適宜説明を省略するものとする。
【0079】
(機能的構成)
まず、図13を参照しながら、第6実施形態に係る遺伝子情報処理システム10の機能的構成について説明する。図13は、第6実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。なお、図13では、図2で示した構成要素と同様の要素に同一の符号を付している。
【0080】
図13に示すように、第6実施形態に係る遺伝子情報処理システム10は、その機能を実現するための処理ブロックとして、第1取得部110と、第2取得部120と、算出部130とを備えて構成されている。そして特に、第6実施形態に係る算出部130は、増幅行列算出部133を備えている。
【0081】
増幅行列算出部133は、PCRによる増幅をモデル化した行列である増幅行列を算出可能に構成されている。増幅行列算出部133は、第1の割合と、第2の割合と、PCRのサイクル数と、を成分として含む増幅行列を算出する。そして、第6実施形態に係る算出部130は、増幅行列算出部133で推定された増幅行列を用いて、PCR前の遺伝子におけるマイクロサテライトの分布を算出可能に構成されている。
【0082】
(増幅行列)
次に、図14を参照しながら、上述した増幅行列算出部133が算出する増幅行列について具体的に説明する。図14は、PCRによる増幅をモデル化した増幅行列の一例を示す行列式である。
【0083】
図14に示すように、増幅行列は、図7及び図12において説明したPCRの増幅率a(即ち、第1の割合)と、マイナススタッターの発生割合b及びプラススタッターの発生割合c(即ち、第2の割合)と、PCRのサイクル数nと、を成分として含む行列である。このような増幅行列を用いれば、PCRをnサイクルした後のマイクロサテライトの分布情報を、PCR前のマイクロサテライトの分布情報に増幅行列を掛けたものとして表すことができる。よって、増幅行列を用いれば、PCR後のマイクロサテライトの分布情報から、PCR前のマイクロサテライトの分布を容易に算出できる。なお、-2スタッターが1回のPCR過程で発生する割合を考慮する場合、その値は、bの右隣の列に入る。同様に、+2スタッターが1回のPCR過程で発生する割合を考慮する場合、その値は、cの左隣の列に入る。
【0084】
(動作の流れ)
次に、図15を参照しながら、第6実施形態に係る遺伝子情報処理システム10の動作の流れについて説明する。図15は、第6実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。なお、図15では、図4に示した処理と同様の処理に同一の符号を付している。
【0085】
図15に示すように、第6実施形態に係る遺伝子情報処理システム10が動作する際には、まず第1取得部110が、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得する(ステップS101)。
【0086】
続いて、第2取得部120が、第1の割合を取得し(ステップS102)、第2の割合を取得し(ステップS103)、PCRのサイクル数を取得する(ステップS104)。
【0087】
続いて、増幅行列算出部133が、第1の割合、第2の割合、及びPCRのサイクル数を用いて、増幅行列を算出する(ステップS601)。そして、算出部130は、増幅行列算出部133が算出した増幅行列を用いて、PCR前の遺伝子におけるマイクロサテライトの分布を算出する(ステップS602)。
【0088】
(技術的効果)
次に、第6実施形態に係る遺伝子情報処理システム10によって得られる技術的効果について説明する。
【0089】
図11で説明したように、第6実施形態に係る遺伝子情報処理システム10では、PCRによる増幅をモデル化した増幅行列が算出され、算出した増幅行列を用いて、PCR前の遺伝子におけるマイクロサテライトの分布が算出される。このように、第1の割合、第2の割合、及びPCRのサイクル数を成分とする増幅行列を用いれば、PCR前の遺伝子におけるマイクロサテライトの分布を適切に算出することが可能である。
【0090】
<第7実施形態>
第7実施形態に係る遺伝子情報処理システム10について、図16及び図17を参照して説明する。なお、第7実施形態は、上述した第1から第6実施形態と比べて一部の構成及び動作が異なるのみで、その他の部分については第1から第6実施形態と同一であってよい。このため、以下では、すでに説明した部分と重複する部分については適宜説明を省略するものとする。
【0091】
(機能的構成)
まず、図16を参照しながら、第7実施形態に係る遺伝子情報処理システム10の機能的構成について説明する。図16は、第7実施形態に係る遺伝子情報処理システムの機能的構成を示すブロック図である。なお、図16では、図2で示した構成要素と同様の要素に同一の符号を付している。
【0092】
図16に示すように、第7実施形態に係る遺伝子情報処理システム10は、その機能を実現するための処理ブロックとして、第1取得部110と、第2取得部120と、算出部130とを備えて構成されている。そして特に、第7実施形態に係る第2取得部120は、パラメータ推定部121を備えている。
【0093】
パラメータ推定部121は、PCR後の遺伝子におけるマイクロサテライトの分布情報から、第1の割合、第2の割合、及びPCRのサイクル数の少なくとも1つを推定可能に構成されている。即ち、第7実施形態に係る第2取得部120は、第1の割合、第2の割合、及びPCRのサイクル数の少なくとも1つを、パラメータ推定部121で推定して取得する。なお、第1の割合、第2の割合、及びPCRのサイクル数のうち、パラメータ推定部121で推定されたもの以外は、推定以外の方法(例えば、ユーザからの入力等)で取得すればよい。
【0094】
(動作の流れ)
次に、図17を参照しながら、第7実施形態に係る遺伝子情報処理システム10の動作の流れについて説明する。図17は、第7実施形態に係る遺伝子情報処理システムの動作の流れを示すフローチャートである。なお、図17では、図4に示した処理と同様の処理に同一の符号を付している。
【0095】
図17に示すように、第7実施形態に係る遺伝子情報処理システム10が動作する際には、まず第1取得部110が、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得する(ステップS101)。
【0096】
続いて、パラメータ推定部121が、CR後の遺伝子におけるマイクロサテライトの分布情報から、第1の割合、第2の割合、及びPCRのサイクル数の少なくとも1つを推定する(ステップS701)。そして、第2取得部120が、第1の割合を取得し(ステップS102)、第2の割合を取得し(ステップS103)、PCRのサイクル数を取得する(ステップS104)。第2取得部120は、パラメータ推定部121が推定したパラメータについては、推定した値を取得する。
【0097】
続いて、算出部130が、第1取得部110で取得されたPCR後の遺伝子におけるマイクロサテライトの分布情報と、第2取得部120で取得された第1の割合、第2の割合、及びPCRのサイクル数とに基づいて、PCR前の遺伝子におけるマイクロサテライトの分布を算出する(ステップS105)。
【0098】
(技術的効果)
次に、第7実施形態に係る遺伝子情報処理システム10によって得られる技術的効果について説明する。
【0099】
図16及び図17で説明したように、第7実施形態に係る遺伝子情報処理システム10では、PCR後の遺伝子におけるマイクロサテライトの分布情報から、第1の割合、第2の割合、及びPCRのサイクル数の少なくとも1つが推定される。このようにすれば、第1の割合、第2の割合、及びPCRのサイクル数を直接取得することなく、推定したパラメータを用いて、PCR前の遺伝子におけるマイクロサテライトの分布を適切に算出することが可能である。
【0100】
<第8実施形態>
第8実施形態に係る遺伝子情報処理システム10について、図18から図20を参照して説明する。なお、第8実施形態は、上述した第7実施形態におけるパラメータの具体的な推定方法を説明するものであり、システム構成や全体的な動作の流れ等については第7実施形態と同一であってよい。このため、以下では、すでに説明した部分と重複する部分については適宜説明を省略するものとする。
【0101】
(山登り法による推定)
まず、図18を参照しながら、山登り法を用いたパラメータの推定方法について具体的に説明する。図18は、第8実施形態に係る遺伝子情報処理システムにおいて算出される遺伝子情報の推算量と実際量とを示すグラフである。
【0102】
第8実施形態に係る遺伝子情報処理システム10におけるパラメータ推定部121は、山登り法を用いて、第1の割合、第2の割合、及びPCRのサイクル数の少なくとも1つを推定可能に構成されている。
【0103】
ここで、「5回繰り返し」をPCRで増幅した実験結果が得られているとする。この場合、図14で示した行列式の右辺では、PCR前の「5回繰り返し」の部分が何らかの値を持ち(例えば、20)、それ以外はゼロとなる。
【0104】
次に、PCRの増幅率a(即ち、第1の割合)と、マイナススタッターの発生割合b及びプラススタッターの発生割合c(即ち、第2の割合)と、PCRのサイクル数nを適当に決めると、増幅行列の各成分の値も決まる。そして、この増幅行列と、上述したPCR前の値とを用いえれば、PCR後の値(アンプリコン量)が推算できる。
【0105】
図18に示す図では、上述したように推算した推算量が実線で示されており、実際量が破線で示されている。なお、図18では、推算量及び実際量の両者を1.0になるように規格化している。このため、PCR前の「5回繰り返し」の部分の値が何であるかは問題とならない。
【0106】
ここで特に、図18における推算量(実線)と、実際量(破線)との間に誤差が生じているのは、適当に決めたPCRの増幅率a、スタッターの発生割合b及びc、PCRのサイクル数nが実際の値からずれているからである。よって、この誤差が小さくなるように、適当に決めたa、b、c、nの値を変更することで、真のa、b、c、nの値を推定できる。
【0107】
例えば、a=1.800の場合、0.001増やして、a=1.801とする。そして、変更後のaを用いて同様に推算し、誤差が小さくなっていれば、変更後の値(即ち、a=1.801)を採用し、誤差が大きくなっていれば、変更前の値(即ち、a=1.800)のままにする。その後は、再びa、b、c、nの値のいずれか1つを変更して、同様の演算を行う。このような処理を繰り返すことによって、真のa、b、c、nの値を推定することが可能である。なお、ここではa、b、c、nの値を1つずつ変更する例を挙げたが、a、b、c、nの値をすべて変更しながら同様の処理を繰り返すようにしてもよい。
【0108】
また、a、b、c、nの初期値はランダムに決めてもよいが、所定の範囲(例えば、現実的に想定される値)から数値を選択するようにしてもよい。例えば、PCRの増幅率であるaは、1.0~2.0の範囲から選択するようにしてもよい。PCRサイクル数nは、1から30までの値として選択してもよい。なお、PCRサイクル数nは、実際は整数であるが、有効なPCRの回数を示す値であるため、整数ではない実数としてもよい。
【0109】
(データフィッティングによる推定)
次に、図19及び図20を参照しながら、データフィッティングを用いたパラメータの推定方法について具体的に説明する。図19は、繰り返し回数と-1スタッター比との関係を示すグラフである。図20は、データフィッティングによりスタッターが発生する割合を推定する方法を示すグラフである。
【0110】
第8実施形態に係る遺伝子情報処理システム10におけるパラメータ推定部121は、上述した山登り法に加えて又は代えて、データフィッティングによりスタッターの発生する割合を推定可能に構成されていてもよい。以下では、-1スタッター比からマイナススタッターが発生する割合bを算出する例を説明する。
【0111】
図19に示すように、-1スタッター比は、繰り返し回数が比較的少ない場合はほとんど増えず、繰り返し回数が比較的多い場合に大きくなることが判っている。このような関係を、定数b0及び繰り返し回数xを用いてエクセル関数で表すと、例えば((x-3)>0?(b0*(x-3)):0)となる。この場合、繰り返し回数が3回以下であれば、b=0(即ち、-1スタッター比は増えない)となり、繰り返し回数が大きくなると、bも大きくなる(例えば、「10回繰り返し」であれば、b0*7となる)。
【0112】
上記の結果、-1スタッター比をエクセル関数で表すと、{nC1*((x-3)>0?(b0*(x-3)):0)}/{a}となる。この関係をグラフにあてはめると、図20のような直線となる。この場合、“3”が-1スタッターを発生させる最小の数となる。この最小の数をbnとすると、b0*((x-bn)>0?(b0*(x-bn)):0)}という関係式が得られる。その結果、マイナススタッターが発生する割合bは、b0及びbnの2つのパラメータで表すことが可能である。なお、b0及びbnの値は、図19及び図20で示したような実験結果から簡単に求めることができる。つまり、マイナススタッターが発生する割合bを実験結果から容易に推定することができる。
【0113】
上記の例ではマイナススタッターが発生する割合bを推定する例を挙げたが、プラススタッターが発生する割合cについても、同様の手法で推定することができる。cの関係式は、定数c0及び最小数cnを用いて表すと、例えばc0*((x-cn)>0?(c0*(x-cn)):0)}となる。
【0114】
(技術的効果)
次に、第8実施形態に係る遺伝子情報処理システム10によって得られる技術的効果について説明する。
【0115】
図18から図20で説明したように、第8実施形態に係る遺伝子情報処理システム10では、山登り法又はデータフィッティングを用いて、第1の割合、第2の割合、及びPCRのサイクル数の少なくとも1つが推定される。このようにすれば、第1の割合、第2の割合、及びPCRのサイクル数を高精度で推定し、PCR前の遺伝子におけるマイクロサテライトの分布を適切に算出することが可能である。
【0116】
<付記>
以上説明した実施形態に関して、更に以下の付記のようにも記載されうるが、以下には限られない。
【0117】
(付記1)
付記1に記載の遺伝子情報処理システムは、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得する第1取得手段と、前記PCRの1サイクルごとの前記マイクロサテライトの増幅率を示す第1の割合と、前記PCRの1サイクルごとに前記マイクロサテライトから発生するスタッターの割合を示す第2の割合と、前記PCRのサイクル数と、を取得する第2取得手段と、前記PCR後の遺伝子における前記マイクロサテライトの分布情報と、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、に基づいて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出する算出手段とを備えることを特徴とする遺伝子情報処理システムである。
【0118】
(付記2)
付記2に記載の遺伝子情報処理システムは、前記算出手段は、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を用いて、繰り返しユニットが1つ少ない又は多いスタッターのアンプリコン量を推定することを特徴とする付記1に記載の遺伝子情報処理システムである。
【0119】
(付記3)
付記3に記載の遺伝子情報処理システムは、前記算出手段は、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を用いて、繰り返しユニットが2つ少ない又は多いスタッターのアンプリコン量を推定することを特徴とする付記1又は2に記載の遺伝子情報処理システムである。
【0120】
(付記4)
付記4に記載の遺伝子情報処理システムは、前記算出手段は、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を用いて、前記PCRで増幅されたマイクロサテライトのアンプリコン量に対する前記スタッターのアンプリコン量の比率であるスタッター比を推定することを特徴とする付記1から3のいずれか一項に記載の遺伝子情報処理システムである。
【0121】
(付記5)
付記5に記載の遺伝子情報処理システムは、前記第2の割合は、繰り返しユニットが少ないマイナススタッターが発生する割合と、繰り返しユニットが多いプラススタッターの割合と、の両方を含むことを特徴とする付記1から4のいずれか一項に記載の遺伝子情報処理システムである。
【0122】
(付記6)
付記6に記載の遺伝子情報処理システムは、前記算出手段は、前記PCRによる増幅をモデル化した行列であって、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、を成分として含む増幅行列を用いて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出することを特徴とする付記1から5のいずれか一項に記載の遺伝子情報処理システムである。
【0123】
(付記7)
付記7に記載の遺伝子情報処理システムは、前記第2取得手段は、前記PCR後の前記遺伝子における前記マイクロサテライトの分布情報から、前記第1の割合、前記第2の割合、及び前記PCRのサイクル数の少なくとも1つを推定して取得することを特徴とする付記1から6のいずれか一項に記載の遺伝子情報処理システムである。
【0124】
(付記8)
付記8に記載の遺伝子情報処理システムは、前記第2取得手段は、前記第1の割合、前記第2の割合、及び前記PCRのサイクル数の少なくとも1つを、山登り法又はデータフィッティングにより推定することを特徴とする付記7に記載の遺伝子情報処理システムである。
【0125】
(付記9)
付記9に記載の遺伝子情報処理方法は、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得し、前記PCRの1サイクルごとの前記マイクロサテライトの増幅率を示す第1の割合と、前記PCRの1サイクルごとに前記マイクロサテライトから発生するスタッターの割合を示す第2の割合と、前記PCRのサイクル数と、を取得し、前記PCR後の遺伝子における前記マイクロサテライトの分布情報と、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、に基づいて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出することを特徴とする遺伝子情報処理方法である。
【0126】
(付記10)
付記10に記載のコンピュータプログラムは、PCR後の遺伝子におけるマイクロサテライトの分布情報を取得し、前記PCRの1サイクルごとの前記マイクロサテライトの増幅率を示す第1の割合と、前記PCRの1サイクルごとに前記マイクロサテライトから発生するスタッターの割合を示す第2の割合と、前記PCRのサイクル数と、を取得し、前記PCR後の遺伝子における前記マイクロサテライトの分布情報と、前記第1の割合と、前記第2の割合と、前記PCRのサイクル数と、に基づいて、前記PCR前の前記遺伝子における前記マイクロサテライトの分布を算出するようにコンピュータを動作させることを特徴とするコンピュータプログラムである。
【0127】
(付記11)
付記11に記載の記録媒体は、付記10に記載のコンピュータプログラムを記録していることを特徴とする記録媒体である。
【0128】
この開示は上記実施形態に限定されるものではない。この開示は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴う遺伝子情報処理システム、遺伝子情報処理方法、コンピュータプログラム、及び記録媒体もまたこの開示の技術思想に含まれる。
【0129】
法令で許容される限りにおいて、この出願は、2021年3月15日に出願された日本出願特願2021-041423を基礎とする優先権を主張し、その開示の全てをここに取り込む。また、法令で許容される限りにおいて、本願明細書に記載された全ての公開公報及び論文をここに取り込む。
【符号の説明】
【0130】
10 遺伝子情報処理システム
110 第1取得部
120 第2取得部
121 パラメータ推定部
130 算出部
131 アンプリコン量推定部
132 スタッター比推定部
133 増幅行列算出部
a PCRの増幅率
b マイナススタッターの発生割合
c プラススタッターの発生割合
n PCRのサイクル数
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20