(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-20
(45)【発行日】2023-12-28
(54)【発明の名称】マイクロサテライト不安定性測定
(51)【国際特許分類】
G16B 40/10 20190101AFI20231221BHJP
G16B 20/20 20190101ALI20231221BHJP
【FI】
G16B40/10
G16B20/20
(21)【出願番号】P 2022526400
(86)(22)【出願日】2020-11-07
(86)【国際出願番号】 US2020059581
(87)【国際公開番号】W WO2021092523
(87)【国際公開日】2021-05-14
【審査請求日】2022-05-09
(32)【優先日】2019-11-08
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-11-08
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-11-08
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502221282
【氏名又は名称】ライフ テクノロジーズ コーポレーション
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100098475
【氏名又は名称】倉澤 伊知郎
(74)【代理人】
【識別番号】100130937
【氏名又は名称】山本 泰史
(74)【代理人】
【識別番号】100144451
【氏名又は名称】鈴木 博子
(74)【代理人】
【識別番号】100162824
【氏名又は名称】石崎 亮
(72)【発明者】
【氏名】レオン ハリソン
(72)【発明者】
【氏名】バウド チャールズ
(72)【発明者】
【氏名】ヒグドン チャールズ ウェンデル
【審査官】塩田 徳彦
(56)【参考文献】
【文献】国際公開第2019/079624(WO,A2)
【文献】国際公開第2019/083594(WO,A9)
【文献】国際公開第2019/099529(WO,A1)
【文献】国際公開第2017/099893(WO,A1)
【文献】国際公開第2017/112738(WO,A1)
【文献】欧州特許出願公開第01128311(EP,A2)
【文献】欧州特許出願公開第02218794(EP,A1)
【文献】欧州特許出願公開第03739064(EP,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00-99/00
(57)【特許請求の範囲】
【請求項1】
生物学的サンプル中のマイクロサテライト不安定性を同定する方法であって、
キャピラリ電気泳動遺伝子分析装置から複数の信号を得ることであって、
前記信号が、ポリメラーゼ連鎖反応を介して前記生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光から検出され、前記核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が
前記複数の異なるマイクロサテライト遺伝子座の1つに対応していることと、
前記複数のマイクロサテライト遺伝子座
のそれぞれ個々のマイクロサテライト遺伝子座について組み合わされた信号に、1つ又は複数の分類子を適用して、前記生物学的サンプルが、マイクロサテライト不安定性高、マイクロサテライト不安定性低、又はマイクロサテライト安定性であるかを同定することと、を含む方法。
【請求項2】
前記1つ又は複数の分類子を適用することが、
前記複数の異なるマイクロサテライト遺伝子座のそれぞれ個々のマイクロサテライト遺伝子座について前記信号における1つ又は複数の信号特徴を決定することと、
それぞれ個々のマイクロサテライト遺伝子座について決定された前記1つ又は複数の信号特徴を組み合わせることと、
組み合わされた前記信号特徴に前記1つ又は複数の分類子を適用して、前記生物学的サンプルが、マイクロサテライト不安定性高、マイクロサテライト不安定性低、又はマイクロサテライト安定性であるかを同定することと、
を含む、請求項1に記載の方法。
【請求項3】
前記1つ又は複数の分類子を適用することが、前記生物学的サンプルに由来する信号特徴と、非癌性組織の1つ又は複数のサンプルに由来する信号特徴と、を比較することを含む、請求項1又は請求項2に記載の方法。
【請求項4】
少なくとも1つの分類子がフラグメントサイズ閾値を含む、請求項1又は請求項2に記載の方法。
【請求項5】
少なくとも1つの分類子がフラグメントサイズ間隔を含む、請求項1又は請求項2に記載の方法。
【請求項6】
前記1つ又は複数の分類子を適用することが、指定されたサイズ間隔内のピークカウントを評価することを含む、請求項1又は請求項2に記載の方法。
【請求項7】
前記1つ又は複数の分類子を適用することが、指定されたサイズ間隔内の腫瘍組織と正常組織との間の相対的なピークカウントを評価することを含む、請求項1又は請求項2に記載の方法。
【請求項8】
前記1つ又は複数の分類子を適用することが、指定されたサイズ間隔内のピークエンベロープカウントを評価することを含む、請求項1又は請求項2に記載の方法。
【請求項9】
前記1つ又は複数の分類子を適用することが、指定されたサイズ間隔内のピークエンベロープ分離を評価することを含む、請求項1又は請求項2に記載の方法。
【請求項10】
前記1つ又は複数の分類子を適用することが、指定されたサイズ間隔内のピークエンベロープ分離を評価することを含む、請求項1又は請求項2に記載の方法。
【請求項11】
前記1つ又は複数の分類子を適用することが、指定されたサイズ間隔内の1つ又は複数のピーク位置におけるシフトを評価することを含む、請求項1又は2に記載の方法。
【請求項12】
前記1つ又は複数の分類子を適用することが、ピークパターン入力を分析することを含む、請求項1又は2に記載の方法。
【請求項13】
前記ピークパターン入力が、フラグメントサイズ軸に沿ったピーク振幅、フラグメントサイズ軸に沿ったピーク位置、最大ピークに対するピーク振幅、最大ピークに対するピーク位置、ピークエンベロープピーク振幅、ピークエンベロープピーク位置、ピークエンベロープピーク幅、又はピークエンベロープメトリックに対するピークメトリックのうちの2つ以上の値を含む、請求項12に記載の方法。
【請求項14】
前記生物学的サンプルに対して、マイクロサテライト不安定性であると決定された前記マイクロサテライト遺伝子座の百分率が、第1の所定の閾値を超える場合に、高いマイクロサテライト不安定性ステータスを割り当てるか、マイクロサテライト不安定性であると決定されたマイクロサテライト遺伝子座の百分率が、第2の所定の閾値を超えるが、前記第1の所定の閾値よりも低い場合に、低いマイクロサテライト不安定性ステータスを割り当てるか、又はマイクロサテライト不安定性であると決定されたマイクロサテライト遺伝子座の百分率が、前記第2の所定の閾値より低い場合に、マイクロサテライト安定性ステータスを割り当てることを更に含む、請求項2に記載の方法。
【請求項15】
前記信号特徴を分析して、安定値又は不安定値のいずれかを、前記マイクロサテライト遺伝子座のそれぞれに割り当てることと、
前記マイクロサテライト遺伝子座の前記割り当てられた安定値及び不安定値全体の加重合計を計算することと、
前記マイクロサテライト遺伝子座全体の前記加重合計が、第1の所定の閾値を超える場合に、前記生物学的サンプルに高いマイクロサテライト不安定性ステータスを割り当てるか、前記マイクロサテライト遺伝子座全体の前記加重合計が、第2の所定の閾値を超えるが、前記第1の所定の閾値を超えない場合に、前記生物学的サンプルに低いマイクロサテライト不安定性ステータスを割り当てるか、又は前記マイクロサテライト遺伝子座全体の前記加重合計が前記第2の所定の閾値より低い場合に、マイクロサテライト安定性ステータスを割り当てることと、を更に含む、請求項2に記載の方法。
【請求項16】
前記加重合計が、前記複数の信号特徴を3つの別個の出力値にマッピングする1つ又は複数の分類関数を使用して計算される、請求項15に記載の方法。
【請求項17】
生物学的サンプル中のマイクロサテライト不安定性を同定するための方法であって、
キャピラリ電気泳動遺伝子分析装置から複数の信号を取得することであって、
前記信号が、ポリメラーゼ連鎖反応を介して前記生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光から検出され、前記核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が、
前記複数の異なるマイクロサテライト遺伝子座の1つに対応することと、
前記複数のマイクロサテライト遺伝子座のそれぞれ個々のマイクロサテライト遺伝子座について組み合わされた信号に、1つ又は複数の分類子を適用して、前記生物学的サンプルが、高いマイクロサテライト不安定性、低いマイクロサテライト不安定性、又はマイクロサテライト安定性を有するかどうかを同定することと、を含む方法。
【請求項18】
前記分類子が非線形分類関数を含む、請求項17に記載の方法。
【請求項19】
前記非線形分類関数が多層人工ニューラルネットワークを含む、請求項18に記載の方法。
【請求項20】
前記分類子がディープ・ラーニング・ニューラル・ネットワークを含む、請求項17に記載の方法。
【請求項21】
生物学的サンプル中のマイクロサテライト不安定性を同定するための、1つ又は複数のコンピュータプロセッサ上で実行可能な非一時的なコンピュータ可読媒体に格納された、実行可能コードを含むコンピュータプログラム製品であって、前記実行可能コードが、
キャピラリ電気泳動遺伝子分析装置から複数の信号を取得することであって、前記信号が、ポリメラーゼ連鎖反応を介して前記生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光から検出され、前記核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が、
前記複数の異なるマイクロサテライト遺伝子座のうちの1つに対応することと、
前記複数のマイクロサテライト遺伝子座のそれぞれ個々のマイクロサテライト遺伝子座について組み合わされた信号に、1つ又は複数の分類子を適用して、前記生物学的サンプルが、マイクロサテライト不安定性高、マイクロサテライト不安定性低、又はマイクロサテライト安定性ステータスを有するかを同定することと、に対する1つ又は複数のコンピュータ可読命令を含む、コンピュータプログラム製品。
【請求項22】
少なくとも1つの分類子が、人工知能によって作製された分類子を含む、請求項21に記載のコンピュータプログラム製品。
【請求項23】
キャピラリ電気泳動遺伝子分析装置を使用して、生物学的サンプル中のマイクロサテライト不安定性を同定するためのシステムであって、
1つ又は複数のコンピュータプロセッサによって実行される場合、1つ又は複数のコンピュータ可読命令を格納する非一時的なコンピュータ可読媒体に接続された前記1つ又は複数のコンピュータプロセッサと、
キャピラリ電気泳動遺伝子分析装置から複数の信号を取得することであって、前記信号が、ポリメラーゼ連鎖反応を介して前記生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光から検出され、前記核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が、
前記複数の異なるマイクロサテライト遺伝子座のうちの1つに対応することと、
前記複数のマイクロサテライト遺伝子座のそれぞれ個々のマイクロサテライト遺伝子座について組み合わされた信号に、1つ又は複数の分類子を適用して、前記生物学的サンプルが、マイクロサテライト不安定性高、マイクロサテライト不安定性低、又はマイクロサテライト安定性ステータスを有するかを同定することと、
前記1つ又は複数のプロセッサのうちの少なくとも1つに接続されたメモリと、
前記メモリに接続され
たユーザ・デバイス・ディスプレイと、を含むシステム。
【請求項24】
少なくとも1つの分類子が、人工知能によって作製された分類子を含む、請求項23に記載のシステム。
【請求項25】
生物学的サンプル中のマイクロサテライト不安定性を同定するためのキットであって、
、生物学的サンプルの複数のマイクロサテライト遺伝子座に隣接するように構成されて、PCRプライマー及び前記生物学的サンプルが組み合わされ、増幅プロセスにかけられる場合、蛍光標識されたDNAフラグメントが生成され、前記複数のマイクロサテライト遺伝子座を含み、ここで、前記複数のマイクロサテライト遺伝子座の少なくともいくつかは、前記複数のマイクロサテライト遺伝子座の他のものとは異なる、複数のポリメラーゼ連鎖反応(PCR)プライマーと、
1つ又は複数のプロセッサによって実行される場合、前記1つ又は複数のプロセッサに、前記複数の蛍光標識されたマイクロサテライト遺伝子座から得られた蛍光データを使用して、
請求項1~20のいずれか一項に記載の方法に従って、前記生物学的サンプルのマイクロサテライト不安定性を分類することを含む処理を実行させる、実行可能命令コードを含む、非一時的なコンピュータ可読媒体に埋め込まれたコンピュータプログラム製品と、
を含む、キット。
【請求項26】
前記実行可能命令コードの実行により、前記1つ又は複数のプロセッサに、
1つ又は複数の遺伝子座特異的アルゴリズムを前記蛍光データに適用して、前記複数のマイクロサテライト遺伝子座の対応する特定の遺伝子座のマイクロサテライト不安定性を分類する遺伝子座特異的結果を生成することと、
前記遺伝子座特異的結果を使用して、前記生物学的サンプルの前記マイクロサテライト不安定性を分類することと、を含む処理を実行させる、請求項25に記載のキット。
【請求項27】
前記1つ又は複数の分類子を適用することが、フラグメントサイズ軸に沿ったピーク振幅、フラグメントサイズ軸に沿ったピーク位置、最大ピークに対するピーク振幅、最大ピークに対するピーク位置、ピークエンベロープピーク振幅、ピークエンベロープピーク位置、ピークエンベロープピーク幅、又はピークエンベロープメトリックに対するピークメトリックのうちの2つ以上の値を含むピークパターン入力を分析することを含む、請求項1に記載の方法。
【請求項28】
正常組織サンプルからのピークパターン入力に対する、前記生物学的サンプルのピークパターン入力の偏差を測定することを更に含む、請求項
27に記載の方法。
【請求項29】
癌を有さない個体の集団全体で計算された名目上のピークパターン値に対する、前記生物学的サンプルのピークパターン入力の偏差を測定することを更に含む、請求項
27に記載の方法。
【請求項30】
癌を有さない個体の集団全体で計算された名目上のピークパターン値と比較して、正常組織サンプルからのピークパターン入力に対する、前記生物学的サンプルのピークパターン入力の偏差を測定することを更に含む、請求項
27に記載の方法。
【請求項31】
前記生物学的サンプルの腫瘍細胞の正規化されたデータと前記生物学的サンプルの正常な非腫瘍細胞の正規化されたデータとの間の差信号を計算することと、これらの差信号に基づいてピークパターンを導出することと、を更に含む、請求項
27に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2019年11月8日に出願された米国仮出願第62/932,987号、同様に2019年11月8日に出願された米国仮出願第62/932,910号、及び2019年11月8日に出願された米国仮出願第62/932,752号に対する優先権の利益を主張している。本明細書で論じられるこれら及び他のすべての外部の資料は、参照によりその全体が組み込まれる。
【0002】
本開示は、一般に、DNAフラグメント分析に関する。
【背景技術】
【0003】
癌の原因要素は、DNAを修復するための生体分子機構の破壊であると考えられている。細胞複製中、DNA修復メカニズムは複製細胞の完全性にとって重要である。これらのメカニズムが崩壊すると、結果として生じる細胞によって運ばれるDNAに間違いが蓄積する可能性がある。この崩壊を利用して腫瘍を同定し、破壊する抗癌剤が存在する。この薬物は、腫瘍が高い変異率を示し、それがDNA修復生体分子機構の高程度の機能不全に関連している場合に最も効果的である。薬物が最も効果的であろう状況を検出する1つの方法は、DNAが多くの繰り返される部分列で構成されている遺伝子座において、DNAが正常から逸脱する程度を調べることである。これらの部分列は、マイクロサテライトと呼ばれる。
【0004】
ショートタンデムリピート(Short Tandem Repeat:STR)としても知られるマイクロサテライトマーカ(遺伝子座)は、繰り返されるヌクレオチド配列からなる多形性DNA遺伝子座である。典型的なマイクロサテライト分析では、マイクロサテライト遺伝子座は、蛍光標識されたフォワードプライマー及び非標識のリバースプライマーを使用して、ポリメラーゼ連鎖反応(Polymerase Chain Reaction:PCR)によって増幅される。PCRアンプリコンは電気泳動を使用してサイズにより分離される。用途には、リンケージマッピング、動物繁殖、ヒト、動物、植物の分類、病原体のサブタイプ分類、遺伝的多様性、マイクロサテライト不安定性、ヘテロ接合性消失(Loss Of Heterozygosity:LOH)、インターシンプルシーケンスリピート(Inter-Simple Sequence Repeat:ISSR)、マルチローカスバリアント分析(Multilocus Variant Analysis:MLVA)、及び癌治療のためのコンパニオン診断が含まれる。
【0005】
所与のDNA遺伝子座のマイクロサテライトの数が通常と大幅に異なる場合、そのマイクロサテライト遺伝子座はマイクロサテライト不安定性(Microsatellite Unstable:MSU)であると見なされる。多数のマイクロサテライト遺伝子座が不安定性を示す場合、DNAサンプルはマイクロサテライト不安定性が高く、MSI-高(-high)と見なされる。不安定性を示すものがわずかしかない場合、DNAサンプルはMSI-低(MSI-low)と見なされる。不安定性を示すものがない場合、DNAサンプルはマイクロサテライト安定性(MSI stable)(MSS)であると見なされる。
【0006】
所与のマイクロサテライト遺伝子座で、キャピラリ電気泳動(Capillary Electrophoresis:CE)を使用して、フラグメント分析を使用することによって、マイクロサテライトの数を測定できる。自動CEは蛍光色素を使用し、アガロース又はポリアクリルアミドゲル電気泳動等の他の方法よりも高い分解能及び高い精度で分離する。
【0007】
CEシステムでフラグメント分析を実行するために、プローブ及びプライマーを設計して、目的の領域に隣接させることができる。これは、ポリメラーゼ連鎖反応(PCR)で使用されるプライマー又はプローブに蛍光色素を付着させて、電気泳動の前に目的のDNA遺伝子座を増幅し、アンプリコンをCEにかけることによって行うことができる。サイズ標準、試験フラグメントの色とは異なる色で標識された既知のサイズの一連のフラグメントも存在する。次いで、標識されたPCR産物及びサイズ標準が、動電学的にキャピラリに注入される。電気泳動中、電極間に高電圧が印加されると、負に帯電したDNAフラグメントは、カソードからポリマーで満たされたキャピラリを通って正に帯電したアノードに向かって移動する。
【0008】
CEを使用したDNAフラグメント分析は多重化でき、同じキャピラリを通過する反応ウェルにおける複数のフラグメントが存在することを意味する。通常、フラグメントが小さいほど、より速く実行され、フラグメントが大きいほど遅く実行される。正極に到達する少し前に、サイズによって分離された蛍光標識DNAフラグメントは、レーザビームの経路を通って移動する。レーザビームにより、フラグメント上の色素が様々な発光波長で蛍光を発する。CCDカメラが蛍光を検出し、蛍光強度がデジタル化され、色分けされ、エレクトロフェログラムのピークとして表示される。より長いフラグメントは、より短いフラグメントに比べて、データにおいてより遅く発生する。
【発明の概要】
【0009】
正常な分子とは異なるマイクロサテライトを有するDNAの割合が低い場合、異常なDNA分子が存在することを検出するのは非常に困難であり得る。CEデータを分析して、所与のDNA遺伝子座においてMSI-高とMSI-安定性とを確実に区別し、全体的な遺伝的プロファイルをMSI-高又はMSI-低と見なすことができるかどうかを決定するために、十分に不確実性を解決するには、より正確な方法が必要である。
【0010】
CEフラグメント分析を使用する代わりに可能な方法がある。簡単な例では、シークエンシング技術を使用して、目的のDNA遺伝子座をシークエンシングし、シークエンシング分析(例えば、シークエンシング内のマイクロサテライトの数をカウントする)を通じて、MSIステータスを割り当てることができる。しかし、CEフラグメント分析以外のシークエンシングテクノロジー又は同様の手法を使用すると、不利になる場合がある。例えば、DNA配列分析では、データを多重化する能力が制限されている。更に、DNA配列分析のプロセスには時間がかかり、分析はエラーがより発生しやすくなる可能性がある。
【0011】
MSIステータスコールを行うためのCEフラグメント分析データの手動レビューを含む従来技術の解決策は、かなり時間がかかり、限られた手動レビュー時間を非効率的に使用する傾向がある。本明細書で論じられる本発明の実施形態は、多くの場合、MSIステータスコールを自動的に行うための、非常に広い範囲の合理的な方法を提供する。また、説明した方法を使用して、例えば、計算結果の決定閾値への近似性を報告することにより、コールに信頼性メトリックを割り当てることができ、続いて、これを使用して、自動化されたMSI評価の信頼性が低い場合に人によるレビュー作業に集中させることができる。
【0012】
生物学的サンプル中のマイクロサテライト不安定性を検出するために使用される本発明の実施形態が開示される。信号データは、キャピラリ電気泳動遺伝子分析装置から受信され、信号データは、ポリメラーゼ連鎖反応を介して生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光から測定される。核酸配列は、複数の異なるマイクロサテライト遺伝子座に対応する。遺伝子座が異なれば、異なる信号特徴を示す。特定の遺伝子座では、その遺伝子座における信号データの特徴にも特有の分析方法の階層を適用できる。例えば、3レベルの階層は次のように説明できる。複数の異なるマイクロサテライト遺伝子座の1つ又は複数の第1のマイクロサテライト遺伝子座の不安定性に関して、信号データに基づいて第1の決定を取得するために、第1の処理アルゴリズムが実装される。複数の異なるマイクロサテライト遺伝子座の1つ又は複数の第2のマイクロサテライト遺伝子座の不安定性に関して、信号データに基づいて第2の決定を取得するために、第2の処理アルゴリズムが実装される。次に、少なくとも第1の決定及び第2の決定に基づいて、生物学的サンプルのマイクロサテライト不安定性を測定するために、第3の処理アルゴリズムが実装される。
【0013】
本発明の実施形態は、CEデータを分析して、所与のDNA遺伝子座が異常であるかどうかを決定し、すべての遺伝子座からの結果を組み合わせた全体的な遺伝子プロファイルがMSI-高、MSI-低、又はMSSと見なすことができるかどうかを決定する方法の集合体を説明する。ここで説明する方法は、自動的にコールを行う手段を提供する。また、説明した方法を使用して、例えば、計算結果の決定閾値への近似性を報告することにより、コールに信頼性メトリックを割り当てることができ、続いて、これを使用して、自動化されたMSI評価の信頼性が低い場合に人によるレビュー作業に集中させることができる。
【0014】
本明細書に開示される本発明の実施形態は、単純な閾値からディープラーニング技術を利用することまでの範囲の分析への多様な要素からなる手法を説明する。この理由は、全体的な遺伝的プロファイルをMSI-高、MSI-低、又はMSI-安定性に割り当てると、DNA内のマイクロサテライトの1つの遺伝子座から、DNA内のマイクロサテライトの多くの遺伝子座までが関与する可能性があるためである。分析アルゴリズムの複雑さは、選択した遺伝子座におけるDNA複製パターンの性質によって異なる。一部の遺伝子座は、所与の癌に対して他の種類の癌と比較してより敏感である可能性があり、並びに/あるいは他の遺伝子座と組み合わせて、MSIステータスについてより感度の高い及び/又は具体的な試験をもたらす可能性があり、並びに/あるいはDNAがより確実に増幅される可能性があるため、異なる遺伝子座は、異なる癌に対して選択される。
【図面の簡単な説明】
【0015】
【
図1】
図1は、本発明の一実施形態によるシステムを示す。
【
図2】
図2は、本発明のいくつかの実施形態で使用される例示的なキャピラリ電気泳動プロセスを示す。
【
図3】
図3は、本発明のいくつかの実施形態で使用される例示的な遺伝子分析装置を示す。
【
図4】
図4は、
図3の例示的な遺伝子分析装置で使用される例示的なオールインワンカートリッジを示す。
【
図5】
図5は、本発明のいくつかの実施形態で使用されるユーザ・インターフェース・ディスプレイの4つの例示的なスクリーンショットを示す。
【
図6】
図6は、
図3の例示的な遺伝子分析装置のクラウド統合プロセスを表すフロー図を示す。
【
図7】
図7は、本発明のいくつかの実施形態による方法のフロー図を示す。
【
図8】
図8は、本発明のいくつかの実施形態による代替方法のフロー図を示す。
【
図9】
図9は、本発明の一実施形態の1つ又は複数の態様を実施することができる分散型コンピュータシステムのブロック図を示す。
【
図10】
図10は、本発明の一実施形態の1つ又は複数の態様を実施することができる電子デバイスのブロック図を示す。
【発明を実施するための形態】
【0016】
本発明を上記の図面を参照して説明したが、図面は例示であることを意図したものであり、他の実施形態は本発明の趣旨と一致し、本発明の範囲内にある。
【0017】
ここで、本明細書の一部を形成し、実施形態を実施する特定の例を例示する目的で示す添付の図面を参照して、様々な実施形態が、以下により詳細に説明される。しかし、本明細書は、多くの異なる形態で具体化されてもよく、本明細書に示された実施形態に限定されると解釈されるべきではなく、むしろ、これらの実施形態は、本明細書が徹底的かつ完全であり、本発明の範囲を当業者に完全に伝えるように提供されている。とりわけ、本明細書は、方法又はデバイスとして具体化できる。したがって、本明細書の様々な実施形態のいずれも、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、又はソフトウェア及びハードウェアの態様を組み合わせた実施形態の形態をとることができる。したがって、以下の明細書は、限定的な意味で解釈されるべきではない。
【0018】
図1は、本発明の例示的な実施形態によるシステム1000を示している。本発明の実施形態に示されるDNAフラグメント分析プロセスは、組織サンプルからDNAを抽出することから始まる。調査中の1つ又は複数の核酸サンプル111における目的の複数のマイクロサテライトDNA遺伝子座は、サーマルサイクラー等の増幅装置112で実行されるPCR反応で増幅することができる。本発明のいくつかの実施形態で使用される例示的なサーマルサイクル装置には、Applied Biosystems ProFlex PCR System、SimpliAmp Thermal Cycler、及びThermo Fisher Scientificによって製造された他のサーマルサイクラーシステムが含まれる。PCR反応は、目的のマイクロサテライト遺伝子座に隣接するように特別に設計された蛍光標識プライマーを含む湿式化学キット110を使用して実行される。他の特許出願は、増幅装置112で実行されるPCR反応で使用するための特別に設計されたプライマー及び試薬を含む湿式化学キット110の例示的な実施形態を詳細に説明し、これには、限定されないが、同時係属中の米国特許出願第62/932,752(代理人/TFS整理番号LT01509PRO)及び第62/932,910号(代理人/TFS整理番号LT01514PRO)(両方とも2019年11月8日に出願)、及び米国非仮特許出願XX/XXXXXXX(代理人/TFS整理番号LT01514)が含まれ、これは、2019年11月8日に出願された米国仮特許出願第62/932,910号の優先権を主張する。上記のこれらの特許出願のそれぞれは、参照によりその全体が本明細書に組み込まれる。システム1000は、キャピラリ電気泳動に基づく遺伝子分析装置(例えば、シークエンシング装置)101、1つ又は複数のコンピュータ103、及びユーザデバイス108を含む。本発明のいくつかの実施形態で使用される例示的な遺伝子分析装置には、Thermo Fisher ScientificによるApplied Biosystems SeqStudio Genetic Analyzer、モデル3500、3720、及び3130、並びにThermo Fisher Scientific等によって製造された同様のキャピラリ電気泳動に基づく遺伝子分析装置が含まれる。
【0019】
図2に記載の例示的なプロセスに示されるように、キャピラリ電気泳動(CE)は、イオン性フラグメントをサイズによって分離するために使用されるプロセス200である。本発明のいくつかの実施形態で使用されるThermo Fisher ScientificのCE装置では、電気運動注入を使用して、溶液から1つ又は複数のキャピラリを含むキャピラリアレイ201の各キャピラリにDNAフラグメントを注入する。キャピラリ電気泳動中、PCR反応の伸長産物(及び塩又は組み込まれていないプライマー及びヌクレオチド等の他の負に帯電した分子)は、電気運動注入の結果としてキャピラリに入る。サンプルに高電圧充電を印加すると、負に帯電したフラグメントがキャピラリに押し込まれる。伸長産物は、それらの全電荷に基づいてサイズで分離される。サンプルの電気泳動移動度は、実行条件(バッファーの種類、濃度、及びpH;実行温度;印加された電圧の量;及び使用されるポリマーの種類)によって影響を受ける可能性がある。
【0020】
正極に到達する少し前に、サイズによって分離された蛍光標識されたDNAフラグメントは、レーザビーム202の経路を横切って移動する。レーザビームにより、フラグメントに付着した色素が蛍光を発する。色素信号は回折システム203によって分離され、CCDカメラは204に示されるように蛍光を検出する。各色素は、レーザによって励起された時に異なる波長で発光するため、すべての色、したがって遺伝子座を1回のキャピラリ注入で検出及び区別することができる。蛍光信号はデジタルデータに変換され、次いで、分析ソフトウェアアプリケーションと互換性のあるファイル形式でデータが保存される。
【0021】
一般に、CE装置から得られるデータは、所与の数のマイクロサテライトに期待されるアンプリコンの正確なサイズの単一のピークではなく、一連の蛍光ピークである。これは、目的のDNAの増幅のニュアンスによって引き起こされ、関与する生体分子機構の「スタッター」は、マイクロサテライトの実際の数よりもいくらか多いか、又はいくらか少ないマイクロサテライトを含むアンプリコンを生成する結果となる可能性がある。この「スタッター」の結果として、マイクロサテライトの数を決定すること、及び/又はマイクロサテライトの数が正常な非癌性組織で予想される数と異なるかどうかを決定することにおいて、いくらかの不確実性があり得る。
【0022】
CE装置から受信した信号の複雑さに加えて、単一の色素を、異なるDNA遺伝子座を標的とするいくつかの異なるPCRプライマーと共に使用することができる。これは、使用できる異なる色素の数に装置が制限を課し、目的のDNA遺伝子座の数が使用できる色素の最大数を超える可能性があるためである。アンプリコンのサイズが、それぞれのPCRプライマーで同じ色素が使用されている遺伝子座のグループ間で十分に異なる場合、各遺伝子座に関連する蛍光ピークは、CE装置によって作成されたデータで十分に分離されるであろう。上記のように、本発明の実施形態では、蛍光を検出するCCDカメラが使用され、蛍光強度は、デジタル化され、色分けされ、電気泳動図においてピークとして表示される。より長いフラグメントは、より短いフラグメントに比べてデータにおいて遅く発生する。白黒の図には示されていないが、CCDカメラによって検出された蛍光の複数の色及び電気泳動図の色分けが、当業者に知られているように、本発明の実施形態で利用される。ここで
図1~10を説明する。
【0023】
図1に示されるCEデータ分析アルゴリズム102を実施するための命令は、ストレージ105に格納されているコンピュータプログラム製品104に属し、それらの命令は、プロセッサ106によって実行可能である。1つ又は複数の特許出願は、CEデータ分析アルゴリズム102の例示的な実施形態を詳細に説明し、限定されないが、この特許出願、及び同時係属中の2019年11月8日に出願された米国仮特許出願第62/932,910号(代理人/TFS整理番号LT01514PRO)、米国の非仮特許出願第XX/XXXXXXX号(代理人/TFS整理番号LT01514)(2019年11月8日に出願された米国仮特許出願第62/932,910号の優先権を主張する)を含み、上記のそれぞれは、参照によりその全体が本明細書に組み込まれる。プロセッサ106がコンピュータプログラム製品104の命令を実行している時、命令又はその一部は、通常、ワーキングメモリ109にロードされ、そこからプロセッサ106によって命令に容易にアクセスされる。図示の実施形態では、コンピュータプログラム製品104は、ストレージ105又は他の非一時的なコンピュータ可読媒体に格納される(異なるデバイス及び異なる場所の媒体に分散されることを含み得る)。代替の実施形態では、ストレージ媒体は一時的なものである。
【0024】
一実施形態では、プロセッサ106は、実際には、大規模な並列計算をサポートする少なくとも数千の算術論理演算装置を含むグラフィックスプロセッシングユニット(Graphics Processing Unit:GPU)を含む追加のワーキングメモリ(追加のプロセッサ及び個別に図示されていないメモリ)を含み得る複数のプロセッサを含む。GPUは、一般的な汎用プロセッサ(CPU)よりも効率的に関連する処理タスクを実行できるため、ディープ・ラーニング・アプリケーションでよく利用される。他の実施形態は、効率的な並列処理をサポートするシストリックアレイ及び/又は他のハードウェア構成を含む1つ又は複数の特殊な処理ユニットを含む。いくつかの実施形態では、そのような特殊なハードウェアは、CPU及び/又はGPUと連動して動作して、本明細書で説明される様々な処理を実行する。いくつかの実施形態では、そのような特殊なハードウェアは、特定用途向け集積回路等(特定用途向け集積回路の一部を指す場合がある)、フィールドプログラマブルゲートアレイ等、及びそれらの組合わせを含む。しかし、いくつかの実施形態では、プロセッサ106等のプロセッサは、必ずしも本発明の趣旨及び範囲から逸脱することなく、1つ又は複数の汎用プロセッサ(好ましくは複数のコアを有する)として実装され得る。
【0025】
図3は、
図1のシステムで使用され得る例示的な遺伝子分析装置システム300を示している。本発明のいくつかの実施形態では、例示的な遺伝子分析装置システム300は、ThermoFisher Scientific Inc.によって製造されたApplied Biosystems(商標)SeqStudio(商標)Genetic Analyzer装置システムを含むが、同様にキャピラリ電気泳動を行うことができる他の遺伝子分析装置システムが使用され得る。
【0026】
システム300は、遺伝子分析装置310、オールインワンカートリッジ320、及びカソードバッファー330を含む。遺伝子分析装置310に組み込まれているのは、タッチスクリーンディスプレイ340及びUSBポート350である。本発明のいくつかの実施形態で使用される遺伝子分析装置システム300は、同じプレート上で複数のフラグメント分析及び/又はシークエンシングの実行を可能にする。遺伝子分析装置システム300は、統合されたカートリッジベースのシステム320で使いやすく、研究者が実験的な実行にアクセスし、それをモニタリングし、また統合されたタッチスクリーンディスプレイ340上で、又はリモートでデータを閲覧することを可能にする。完全に接続された遺伝子分析装置は、シンプルなカートリッジ設計と共に、研究室又は施設の複数の研究者によって簡単に共有され得る。
【0027】
本発明のいくつかの実施形態では、装置の使いやすい機能的コアは、効率及び利便性を最大化するのに役立つカートリッジ設計を含む。例えば、上記のSeqStudio Genetic Analyzerは、
図4に更に詳細に示されるオールインワンカートリッジ320を利用し、オールインワンカートリッジ320は、キャピラリアレイ440、ポリマーリザーバ410、ポリマー送達システム420、及びアノードバッファー430を含有する。カートリッジ320のいくつかの実施形態では、レーザ検出ウインドウも提供され得る。カートリッジ320は取り外し可能であり、本発明の一実施形態では、最大4ヶ月間装置に保管することができる。本発明のいくつかの実施形態では、各カートリッジは、サンガーシークエンシング及びフラグメント分析を再構成なしで実行することを可能にする、SeqStudioシステムに固有の新しいポリマーを含む。本発明の一実施形態では、カートリッジは4つのキャピラリを有し、標準的な96ウェルプレート又は8ウェルストリップチューブのいずれかからのサンプルを処理することができる。本発明のいくつかの実施形態では、カートリッジ及びカソードバッファー容器は、器具(カソードバッファー容器)への注入の回数(カートリッジ)及び時間の長さを追跡するラジオ・フリークエンシー・アイディンティフィケーション(RFID)タグを含む。これにより、科学者は同じ装置を使用して、自分のカートリッジの保管を維持できる。
【0028】
遺伝子分析装置システム300は、SeqStudio Genetic Analyzerにおける実行をリアルタイムでモニタリングすることを可能にする。
図5に示されるように、装置300は、各キャピラリの結果510をリアルタイムで表示する。注入が終了すると、いくつかの品質チェックが計算され、例示的なスクリーンディスプレイ520に表示される。注入によるトレース又はQC値が不十分な場合は、所望により注入パラメータを変更して、これらのサンプルを再注入できる。オフサイトのコンピュータモニタリングからの例示的なスクリーンショット530は、実行の進行を示している。本発明のいくつかの実施形態で使用される例示的なスクリーンショット540では、PlateManagerユーザインターフェースで設定された実行は、装置に直接アップロードすることができる。PlateManagerを使用すると、研究者が同じプレート上で複数のシークエンシング及びフラグメント分析の実行を割り当てることができ、カートリッジ内のユニバーサルポリマーを利用し、必要な場合にのみそれらを使用し、別のレベルの柔軟性を提供する。
図5のユーザインターフェースのスクリーンショット510~540に示されるように、本発明のいくつかの実施形態で使用されるSeqStudio Genetic Analyzerのメンテナンスは、ユーザにとって単純かつ簡単であることが意図され、本明細書で説明される本発明の例示的な実施形態で使用される遺伝子分析装置で使用される装置較正は、自動的に処理され得る。
【0029】
図6に示されるように、無線接続性を、
図3に示される例示的な遺伝子分析装置に統合することによって、別のレベルの利便性を追加することができる。
図6は、オンボードインターフェース、リモートコンピュータ、又はモバイルデバイスアプリを介して、いくつかの異なる方法で、どのようにユーザによってSeqStudio遺伝子分析装置にアクセスされるかを示している。本発明のいくつかの実施形態では、アッセイ又は実験的実行は、610に示すように、オンボードコンピュータを使用するか、又はThermo Fisher Connect内又は別のコンピュータ上で動作するスタンドアロンソフトウェアであるPlateManagerを使用することによるかのいずれかによってセットアップすることができる。Webブラウザベースのソフトウェアを使用することにより、インターネット接続を介して、実行セットアップ、プレートマップ、実行条件、及び分析設定にすぐにアクセスできる。注入条件、再注入、及び注入の並べ替えは、620に示すように、実行中にモニタリング及び変更でき、各プレートから品質データを回収する能力を最大化する。データ回収後、マイクロサテライト不安定性を測定するためのアプリケーションを含む、ウェブブラウザベースのアプリケーションスイートは、本発明のいくつかの実施形態においてアクセス可能な分析を可能にする。DNA配列バリアント、アラインメント、及びフラグメント分析はすべて、分析工程630において、実行の完了直後に利用可能である。最後に、クラウド接続650は、異なる場所にいる共同作業者が、データ情報をモニタリングし、アクセスし、共有し、共有及び共同作業工程640で実行後いつでも同じデータセットを迅速に分析することを可能にする。
【0030】
SeqStudio Genetic Analyzerは、装置自体、又はスマートフォン、タブレット、若しくは他のユーザデバイスを介してタッチスクリーンの使いやすさを提供し、研究者がリモート及びオンサイトでデータを共同で分析できるようにする。本発明のいくつかの実施形態で使用される本明細書で論じられる例示的な遺伝子分析装置システムは、性能又は品質を損なうことなく、単純で手頃なサンガーシークエンシング及びフラグメント分析を必要とする、新規及び経験豊富なユーザの両方のために設計される。
【0031】
図7は、生物学的サンプルのMSIステータスを決定するために本発明のいくつかの実施形態で使用される方法700のフロー図を示す。工程710において、生物学的サンプルの1つ又は複数のDNA遺伝子座が、選択されて、高い変異率、したがって高いマイクロサテライト不安定性を示す腫瘍を調査する。
【0032】
マイクロサテライト不安定性(MSI)は、DNAの複製中の忠実度の低下によるゲノム不安定性の一形態であり、これは、DNA修復メカニズムの欠陥が原因であると考えられている。この生体分子機構の欠陥は、DNA内で1つのヌクレオチド(4つの可能なヌクレオチドの1つ)が何度も繰り返される場所(ホモポリマー)を調べることで最も簡単に観察でき、例えば、GGGGGGGGGGGはグアニンの11塩基の繰返しである。この例を伸長すると、腫瘍細胞にしばしば現れる損傷したDNA修復メカニズムにより、グアニンの11塩基の繰返しを有するDNAのセクションは、例えば、通常の11塩基ではなく、10塩基又は5塩基又は13塩基として複製される場合がある。マイクロサテライト不安定性分析には、ホモポリマーが存在するDNAのいくつかの異なる領域を調べるために設計された化学物質が関与する。これらの化学物質は、目的のホモポリマーのそれぞれを含むDNAのセクション(特定のDNA遺伝子座におけるDNAの増幅されたフラグメント)を選択し、増幅する。したがって、再び11塩基のグアニンの例に基づいて構築すると、通常、この遺伝子座で増幅されたDNAは、例えば20塩基のフラグメントサイズになる(化学によって選択された11より大きいいずれかの数)。しかし、DNA複製修復メカニズムが損傷している場合、複製されたDNAは通常の11グアニンではなく、10しか持たない可能性があるため、増幅されたフラグメントのサイズは20ではなく19となるであろう。本開示の主題である技術を使用してこの状況を検出する2つの方法が存在する。1)同じ人の腫瘍組織及び正常組織からのDNAを分析し、2つを比較するか、又は2)腫瘍組織からのDNAを分析し、DNA修復メカニズムに損傷がない場合に、通常、目的の各DNA遺伝子座で予想されるものと比較する。これらの概念及び本開示に記載される発明は、ヌクレオチドの単純な反復配列、例えば、ACACACAC又はTATGTATGTATGTAGT等からなるDNAの非ホモポリマーセクションにも適用されることに留意されたい。
【0033】
したがって、工程710において、特定のDNA遺伝子座が、他の癌タイプと比較して、調査中の癌タイプに対する遺伝子座の感受性のために選択され得る。特定のDNA遺伝子座(マーカとも呼ばれる)は、その特定の遺伝子座におけるDNA増幅の信頼性のために選択することもできる。
【0034】
工程720において、各DNA遺伝子座が検査され、その所与の遺伝子座がマイクロサテライト不安定性(MSU)であるか、又はマイクロサテライト安定性(MSS)であるかを決定するために、各遺伝子座に対して1つ又は複数のアルゴリズムが選択され得る。本発明の実施形態は、所与のDNA遺伝子座がMSU又はMSSであるかどうかを決定するための多数のアルゴリズムを利用し、これには、以下のアルゴリズム1~11を含む。工程730において、選択されたアルゴリズム(複数可)は、選択されたDNA遺伝子座ごとに実行される。工程740において、全体的なMSIステータスは、選択された各DNA遺伝子座についてのMSI結果を組み合わせることによって、生物学的サンプルについて決定される。
【0035】
図8は、生物学的サンプルのマイクロサテライト不安定性を評価するための方法の別の実施形態を示しており、これは、最初に上記及び
図7に記載されている。
図8に示される実施形態は、
図7に示されるマイクロサテライト不安定性評価方法の実施形態を詳細に説明する追加の詳細及び代替データ分析経路を提供する。
図8の工程810から開始し、生物学的サンプルのすべてのDNA遺伝子座にわたるCEフラグメント分析データが得られる。工程805に示すように、各DNA遺伝子座又はマーカは個別に分析され得る。あるいは、マーカは、
図8の工程815に示されるように一緒に分析され得る。工程805のようにマーカを別々に分析する場合、工程820でマーカごとに1つ又は複数の信号特徴を抽出することができ、以下に説明する例示的な分類関数等の1つ又は複数の分類関数を、抽出した信号特徴に適用して、工程830で各マーカのMSIステータスを決定することができる。
【0036】
1.単純なサイズの閾値:フラグメントサイズ閾値より下(又はMSS状況の場所によっては上)に現れるいずれの蛍光ピークも、MSUと見なされる。これは、所与の色素でカバーされるDNA遺伝子座が1つだけで、ヌクレオチド数がMSU及びMSSのDNA分子の状況間で大幅に異なる場合に適している。
【0037】
2.フラグメントサイズ間隔:所与のフラグメントサイズ間隔(データのDNAフラグメントサイズ軸上の間隔)内に蛍光ピークが現れる場合、DNA遺伝子座はMSUと見なされる。これは、同じ色素を使用するすべてのDNA遺伝子座をカバーするサイズ間隔の間に重複がなく、MSU及びMSSの状況に関連する蛍光ピークも十分に分離されていることを前提としている。
【0038】
3.所定のサイズ間隔内のピークカウント:有意な蛍光ピークの数(ピークサイズによって決定される有意性)が閾値を超えている場合、その遺伝子座はMSUと見なされる。これは、同じ色素を使用するすべてのDNA遺伝子座をカバーするサイズ間隔の間に重複がないことを前提としている。
【0039】
4.所与のサイズ間隔内の相対ピークカウント:有意な蛍光ピークの数(ピークサイズによって決定される有意性)がMSSで予想される数から大幅に逸脱している場合、その遺伝子座はMSUと見なされる。これは、同じ色素を使用するすべてのDNA遺伝子座をカバーするサイズ間隔の間に重複がないことを前提としている。
【0040】
5.所与のサイズ間隔内のピークエンベロープピーク:エンベロープピークの数が2つ以上の場合、遺伝子座はMSI-高と見なされる。これは、同じ色素を使用するすべてのDNA遺伝子座をカバーするサイズ間隔の間に重複がないことを前提としている。
【0041】
6.所定のサイズ間隔内のピークエンベロープ分離:2つの最大エンベロープピーク間の分離がMSI-安定性サンプルの分離から大幅に偏向している場合、遺伝子座はMSI-高と見なされる。これは、同じ色素を使用するすべてのDNA遺伝子座をカバーするサイズ間隔の間に重複がないことを前提としている。
【0042】
7.ピークパターン:ピークパターンは、次の2つ以上の値で構成できる。ピーク振幅及び/又はフラグメントサイズ軸に沿った位置、最大ピークに対するピーク振幅及び/又は位置、ピークエンベロープピーク振幅、位置、及び/又は幅、ピークエンベロープメトリックと比較したピークメトリック。
【0043】
8.正常からのピークパターン偏差:正常組織サンプルからのピークパターンと比較した上記(7)のピークパターン。
【0044】
9.正常な(非癌)集団のピークパターンからのピークパターンの偏差:癌を有さない人の集団にわたるピークパターンの公称値(平均、中央値、zスコア等)からのピークパターンに対する上記(7)のピークパターン。
【0045】
10.集団の偏差に対する正常からのピークパターンの偏差:上記の(8)及び(9)の組合わせであり、ここで、(8)のメトリックは、癌を有さない人の集団全体でこれらのパターンの公称値と比較される。
【0046】
11.差信号パターン:所与の人からのデータが正常組織及び腫瘍組織の両方から利用できる場合、上記の信号パターンは、腫瘍組織及び正常組織からの正規化されたデータの違いに基づいて計算できる。更に、差信号から導出された他のメトリックを使用して、各遺伝子座における差信号を特性決定することができる。例えば、差信号の非対称性は、負のピークと比較した差信号の正のピークの重心間の差によって特性決定することができる。他の例は、差信号の最大値及び最小値の相対位置、負のピークと比較した正の二乗平均平方根(Root-Mean-Square:RMS)値、差信号の全体的なRMS値等を含む。
【0047】
項目(7)~(11)の場合、DNA遺伝子座がMSSであるか、又はMSUであるかを決定するためのアルゴリズムは、多次元ベクターを処理できる適切な分類関数で構成されるであろう。例えば、判別関数、多層人工ニューラルネットワーク、ベクターマシン等は、適用できる典型的な機械学習方法の例である。あるいは、項目(7)~(10)で概説した信号特徴を事前に指定する代わりに、ディープラーニング法を適用して、目的のフラグメントサイズ間隔にローカライズされたCEフラグメント分析データの多数のサンプルを使用することにより、MSUとMSSとを区別するための最良の信号特徴を自動的に学習できる。
【0048】
MSIステータスの全体的な評価を行うために、
図7の工程740又は
図8の工程810から開始して、各DNA遺伝子座のMSI結果は、調査中の核酸サンプル中のすべてのマーカにわたって組み合わされて、工程840及び880で全体的なMSIステータスコールを割り当てることができる。以下は、2つ以上のDNA遺伝子座が使用される場合にこれを行うための例示的な方法である。
【0049】
12.固定百分率レベル:MSUであるDNA遺伝子座の百分率が選択された閾値を超えている場合、全体的な割当てはMSI-高(又は、MSUであるDNA遺伝子座の百分率が第1に選択された閾値を下回っているが第2の所定の閾値を超えている場合はMSI-低)であり、MSUであるDNA遺伝子座の百分率がこれらの閾値の両方を下回っている場合はMSSである。
【0050】
13.加重合計:本発明の一実施形態では、MSU遺伝子座に例示的な値1を割り当て、MSS遺伝子座に例示的な値0を割り当てた後、DNA遺伝子座全体の加重合計を計算することができ、遺伝子座全体の加重合計が閾値を超えた場合、全体的な評価にMSI-高を割り当てることができる。線形判別関数は、重み付けを決定するための例示的な方法である。
【0051】
14.非線形分類:
図8に示すように、工程820及び830で、DNA遺伝子座全体のMSI結果を、代替的に非線形の方法で組み合わせて、工程840及び880のMSIステータスの全体的な評価を決定することができる。非線形分類関数を決定するための例示的な方法は、割当てを行うために多層人工ニューラルネットワークを訓練することである。
交差エントロピーを最小化するために当技術分野で知られている慣習的なバックプロパゲーション技術で訓練された標準的な3層人工ニューラルネットワークは、MSUをMSSの場合と区別するのに十分な精度を提供することが見出された。
【0052】
15.全体的な評価に対する指示:工程805のように各DNA遺伝子座のMSIステータスを事前に評価する代わりに、マーカは、工程815で一緒に分析され、工程860に示されるように、項目(7)~(11)で表される信号特徴をDNA遺伝子座全体で組み合わせることができ、
図8の工程870に示されるように全体的なMSIステータスを直接割り当てる1つ又は複数の分類関数を生成するために使用される。例えば、マーカAがMSUであるか又はMSSであるかを決定するために3つの信号特徴を使用し、マーカBにはこれに4つの特徴を使用した。本発明の一実施形態では、両方のマーカからの特徴を7次元特徴ベクターに組み合わせて、このベクターを全体的なMSIステータスコールにマッピングするように訓練された人工ニューラルネットワーク等の人工知能生成分類子に供給することができる。マーカ間で情報を組み合わせる明示的なアルゴリズムの代わりに、この情報の組合わせは、この人工ニューラルネットワーク分類子の訓練に固有のものになる。あるいは、人工知能生成分類子は、ディープラーニング法を介して実装することができ、これは、工程805でマーカを個別に分析した後、又は工程815で示すように、マーカを一緒に分析した後のいずれかで、DNA遺伝子座全体のデータを分析において組み合わせることを除いて、上記のように使用できる。
図8の工程850に示されるように、信号特徴は、MSIステータスコールに直接マッピングするためにディープ・ラーニング・ニューラル・ネットワークに直接供給される。例えば、各遺伝子座からの信号は、1つの大きな信号ベクターに連結され、ディープラーニングネットワークに供給されて、工程880でそれらを全体的なMSIステータスコールにマッピングすることができる。
【0053】
本発明のいくつかの実施形態は、腫瘍患者を治療するために1つ又は複数の抗腫瘍薬を使用するための方法を含む。特定の実施形態では、本明細書に開示される、方法、コンピュータプログラム製品、システム、又はキットの1つ又は複数を使用して、患者から得られた生物学的サンプル中の腫瘍細胞のマイクロサテライト不安定性を決定する。次いで、マイクロサテライト不安定性が高いと決定された場合、腫瘍を治療するために1つ又は複数の抗腫瘍薬が患者に投与される。
【0054】
本明細書で説明されるシステム、装置、及び方法は、プログラム可能なプロセッサによる実行のために、情報担体、例えば、非一時的な機械可読ストレージデバイスで有形に具現化されるコンピュータプログラム製品、並びに
図6、
図7、及び
図8の方法の工程のうちの1つ又は複数を含む、本明細書に記載の方法工程を使用して、実装され得、代替的な実施形態は、上記プロセッサによって実行可能な1つ又は複数のコンピュータプログラムを使用して実装され得る。コンピュータプログラムは、特定の活動を実施するか、又は特定の結果をもたらすために、コンピュータにおいて直接又は間接的に使用できるコンピュータプログラム命令のセットである。コンピュータプログラムは、コンパイルされ又は解釈された言語を含む、あらゆる形式のプログラミング言語で記述でき、スタンドアロンプログラムとして、又はコンピューティング環境における使用のために適したモジュール、コンポーネント、サブルーチン、又はその他のユニットとして、あらゆる形式で展開できる。
【0055】
図9は、本発明を実施することができる環境900の一実施形態の構成要素を示している。本発明を実施するためにすべての構成要素が必要とされるわけではなく、構成要素の配置及び種類の変更は、本発明の趣旨又は範囲から逸脱することなく行うことができる。示されるように、システム900は、1つ又は複数のローカルエリアネットワーク(Local Area Network)(「LAN」)/ワイドエリアネットワーク(Wide Area Network)(「WAN」)912、1つ又は複数の無線ネットワーク910、1つ又は複数の有線又は無線クライアントデバイス906、モバイル又は他の無線クライアントデバイス902~906、サーバ907~909を含み、1つ又は複数のデータストア又はデータベースを含むか、あるいはそれらと通信することができる。様々なクライアントデバイス902~906は、例えば、デスクトップコンピュータ、ラップトップコンピュータ、セットトップボックス、タブレット、モニタ、携帯電話、スマートフォン、遺伝子分析関連システム若しくはエンティティ等に関連するダッシュボード若しくは分析とインターフェースするか、又はそれらを閲覧するためのデバイスを含み得る。サーバ907~909は、例えば、1つ又は複数のアプリケーションサーバ、コンテンツサーバ、検索サーバ、データベースサーバ、データベース管理又はSQLサーバ、遺伝子分析関連システムに関連する他のサーバ等を含むことができる。
【0056】
図10は、本発明の実施形態による遺伝子分析関連システム及び方法の1つ又は複数の態様を実施することができる電子デバイス1100のブロック図を示している。電子デバイス1100のインスタンスは、サーバ、例えば、サーバ907~909、及びクライアントデバイス、例えば、クライアントデバイス902~906を含み得る。
【0057】
図11は、コンピュータシステム1100の一例を示しており、その1つ又は複数は、
図1のコンピュータ103の構成要素又は代替物の1つ又は複数を提供し得る。コンピュータシステム1100は、遺伝子分析装置プログラム1123(例えば、これは、
図1の実施形態のコンピュータプログラム製品102のCEデータ分析プログラム104を含み得る)を含む、コンピュータプログラム製品1122に含まれる命令コードを実行する。コンピュータプログラム製品1122は、コンピュータシステム1100等の1つ又は複数のコンピュータに命令して、本明細書で参照される実施形態によって実行される例示的な方法工程を達成する処理を実行することができる、電子的可読媒体において実行可能コードを含む。電子的可読媒体は、情報を電子的に保存する任意の非一時的な媒体であってもよく、例えば、ネットワーク接続を介して、ローカル又はリモートでアクセスされてもよい。代替実施形態では、媒体は一時的であってもよい。媒体は、実行可能コードの異なる部分を、異なる位置及び/又は異なる時間で記憶するように各々構成されている、複数の地理的に分散した媒体を含んでもよい。電子的可読媒体中の実行可能命令コードは、例示されたコンピュータシステム1100に、本明細書で説明された様々な例示的なタスクを実行するように指示する。本明細書で説明するタスクを実行することを指示するための実行可能コードは、典型的には、ソフトウェアで実現される。しかし、コンピュータ又は他の電子デバイスは、本発明から逸脱することなく、特定されたタスクの多く又はすべてを実施するためにハードウェアで実現されるコードを利用できることを当業者は理解する。当業者は、本発明の趣旨及び範囲内で例示的な方法を実施する実行可能コードに関する多くの変形形態が見出され得ることを理解するであろう。
【0058】
コンピュータプログラム製品1100に含まれるコード又はコードのコピーは、永続性ストレージデバイスのローディング及び保存のために、システム1100に通信可能に結合された1つ又は複数のストレージ永続性媒体(個別に図示せず)に常駐することができる。一般に、電子デバイス1100は、プロセッサ/CPU1102、メモリ1130、電源1106、及び入力/出力(I/O)コンポーネント/デバイス1140、例えば、マイク、スピーカ、ディスプレイ、タッチスクリーン、キーボード、マウス、キーパッド、顕微鏡、GPSコンポーネント等を含むことができ、これらは、例えば、グラフィカル・ユーザ・インターフェース、ダッシュボード等を提供するために操作可能であり得る。
【0059】
ユーザは、電子デバイス1100のタッチスクリーンを介して入力を提供することができる。タッチスクリーンは、例えば、ユーザが、彼又は彼女の指等のユーザの体の一部でタッチスクリーンに触れているかどうかを決定することによって、ユーザが入力を提供しているかどうかを決定することができる。電子デバイス1100はまた、電子デバイス1100の前述の要素を接続する通信バス1104を含むことができる。ネットワークインターフェース1114は、受信機及び送信機(又はトランシーバ)、並びに無線通信用の1つ又は複数のアンテナを含むことができる。
【0060】
プロセッサ1102は、任意の種類の処理デバイス、例えば、中央処理装置(CPU)、及びグラフィックスプロセッサ(GPU)のうちの1つ又は複数を含むことができる。また、例えば、プロセッサは、中央処理ロジック、又は他のロジックであり得、ハードウェア、ファームウェア、ソフトウェア、又はそれらの組合わせを含んで、1つ又は複数の機能又は動作を実行するか、あるいは1つ又は複数の他のコンポーネントからの1つ又は複数の機能又は動作を引き起こすことができる。また、所望のアプリケーション又はニーズに基づいて、中央処理ロジック、又は他のロジックは、例えば、ソフトウェア制御マイクロプロセッサ、ディスクリートロジック、例えば、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラム可能/プログラムされたロジックデバイス、命令等を含むメモリデバイス、又はハードウェアで具体化された組合わせロジックを含み得る。更に、ロジックはソフトウェアとして完全に具現化することもできる。
【0061】
ランダムアクセスメモリ(Random Access Memory:RAM)1112及び読取り専用メモリ(Read Only Memory:ROM)1132を含むことができるメモリ1130は、メモリデバイス、例えば一次(CPUによって直接アクセス可能)又は二次(CPUにより間接的にアクセス可能)ストレージデバイス(例えば、フラッシュメモリ、磁気ディスク、光ディスク等)の任意の種類のうちの1つ又は複数によって有効にすることができる。ROM1132はまた、電子デバイスのベーシックインプット/アウトプットシステム(Basic Input/Output System:BIOS)1120を含むことができる。
【0062】
RAMは、オペレーティングシステム1121、データストレージ1124を含むことができ、1つ又は複数のデータベース、並びにプログラム及び/又はアプリケーション1122、並びに遺伝子分析装置プログラム1123を含むことができる。遺伝子分析装置プログラム1123は、本発明の実施形態による方法及びシステムを実施又は促進するために必要なすべてのプログラミング、アプリケーション、アルゴリズム、ソフトウェア及び他のツールを広く含むことを意図している。遺伝子分析装置プログラム1123プログラムの要素は、単一のサーバコンピュータ上に存在するか、又は複数のコンピュータ、サーバ、デバイス、エンティティ、若しくは部位に分散され得る。更に、本明細書で説明する処理を実行するためのコンピュータプログラム製品1122を保存することに加えて、メモリ1130は、本明細書で参照及び例示される様々なデータ要素を保存するように構成され得ることを当業者は理解するであろう。
【0063】
電源1106は、1つ又は複数の電力構成要素を含み、電子デバイス1100への電力の供給及び管理を容易にする。
【0064】
入力/出力(I/O)インターフェース1140を含む入力/出力構成要素は、例えば、電子デバイス1100の任意の構成要素、外部デバイスの構成要素(例えば、ネットワーク又はシステム1100の他のデバイスの構成要素)とエンドユーザとの間の通信を容易にするための任意のインターフェースを含むことができる。例えば、そのような構成要素は、受信機、送信機、トランシーバ、及び1つ又は複数の入力/出力インターフェースの統合であり得るネットワークカードを含むことができる。例えば、ネットワークカードは、ネットワークの他のデバイスとの有線又は無線通信を容易にすることができる。無線通信の場合、アンテナはそのような通信を容易にすることができる。また、入力/出力インターフェース1140及びバス1104の一部は、電子デバイス1100の構成要素間の通信を容易にすることができ、一例では、プロセッサ1102によって実行される処理を容易にすることができる。
【0065】
電子デバイス1100がサーバである場合、それは、例えば、有線又は無線ネットワークを介して信号を送信又は受信することができるか、あるいは信号を、例えば、物理的にメモリステータスとしてメモリに処理又は保存することができる、コンピューティングデバイスを含むことができる。サーバは、1つ又は複数のアプリケーションを提供するための構成を含むアプリケーションサーバであり得る。
【0066】
有線及び/又は無線ネットワークを介してデータを送信、受信、及び処理することができる任意のコンピューティングデバイスは、本発明の実施形態による遺伝子分析装置関連システム及び方法の実装の態様を容易にすること等において、サーバとして機能し得る。サーバとして機能するデバイスは、専用のラックマウントサーバ、デスクトップコンピュータ、ラップトップコンピュータ、セットトップボックス、前述のデバイスの1つ又は複数を組み合わせた統合デバイス等のデバイスを含み得る。
【0067】
サーバは構成及び機能が大きく異なる場合があるが、通常、1つ又は複数の中央処理装置、メモリ、大量データストレージ、電源、有線又は無線ネットワークインターフェース、入力/出力インターフェース、及びWindows Server、Mac OS X、Unix、Linux(登録商標)、FreeBSD等のオペレーティングシステムが含まれる。
【0068】
サーバは、例えば、本発明の実施形態によるシステム及び方法の態様を容易にすること等において、1つ又は複数のネットワークを介して別のデバイスにデータ又はコンテンツを提供するように構成されるか、あるいはそのような構成を含むデバイスを含み得る。1つ又は複数のサーバは、例えば、本発明の実施形態で利用されるウェブサイトをホストする際に使用され得る。1つ又は複数のサーバは、例えば、ビジネスサイト、情報サイト、ソーシャルネットワーキングサイト、教育サイト、ウィキ、金融サイト、政府サイト、個人サイト等の様々なサイトをホストすることができる。
【0069】
サーバはまた、例えば、Webサービス、サードパーティサービス、オーディオサービス、ビデオサービス、電子メールサービス、HTTP又はHTTPSサービス、インスタントメッセージング(Instant Messaging:IM)サービス、ショートメッセージサービス(Short Message Service:SMS)のサービス、マルチメディアメッセージングサービス(Multimedia Messaging Service:MMS)のサービス、ファイル転送プロトコル(File Transfer Protocol:FTP)サービス、Voice Over IP(VOIP)サービス、カレンダーサービス、電話サービス等の様々なサービスを提供することができ、これらはすべて、本発明の実施形態によるシステム及び方法の例の態様と連携して機能する可能性がある。コンテンツは、例えば、テキスト、画像、オーディオ、ビデオ等を含み得る。
【0070】
本発明の実施形態による遺伝子分析装置システム及び方法の例示的な態様では、クライアントデバイスは、例えば、有線及び/又は無線ネットワークを介してデータを送受信することができる任意のコンピューティングデバイスを含み得る。このようなクライアントデバイスには、デスクトップコンピュータのほか、携帯電話、スマートフォン、ディスプレイポケットベル、無線周波数(Radio Frequency:RF)デバイス、赤外線(Infrared:IR)デバイス、パーソナルデジタルアシスタント(Personal Digital Assistant:PDA)、ハンドヘルドコンピュータ、GPS対応デバイスタブレットコンピュータ、モニタ、センサー搭載デバイス、ラップトップコンピュータ、セットトップボックス、ウェアラブルコンピュータ、前述のデバイスの1つ又は複数を組み合わせた統合デバイス等のポータブルデバイスが含まれ得る。
【0071】
クライアントデバイスは、機能及び特徴の点で広範囲に及ぶ可能性がある。例えば、携帯電話、スマートフォン、又はタブレットは、数字キーパッド及びテキストのみを表示できる数行のモノクロ液晶ディスプレイ(Liquid-Crystal Display:LCD)のディスプレイを有し得る。別の例では、Web対応のクライアントデバイスは、物理的又は仮想キーボード、データストレージ(フラッシュメモリ又はSDカード等)、加速度計、ジャイロスコープ、GPS又は他の位置認識機能、並びにテキスト及びグラフィックスの両方を表示できる2D又は3Dタッチセンシティブカラー画面を有し得る。
【0072】
例えば、本発明の実施形態による例示的なシステム及び方法で使用され得るクライアントデバイス1002~1006等のクライアントデバイスは、Windows、iOS又はLinux(登録商標)等のパーソナルコンピュータオペレーティングシステム、及びiOS、Android、Windows Mobile等のモバイルオペレーティングシステム含む、様々なオペレーティングシステムを実行し得る。クライアントデバイスは、別のコンピューティングデバイスとの間でデータを送信又は受信するように構成された1つ又は複数のアプリケーションを実行するために使用できる。クライアントアプリケーションは、テキストコンテンツ、マルチメディア情報等を提供及び受信することができる。クライアントアプリケーションは、分析又はダッシュボードの表示又は相互作用、本発明の実施形態で使用される遺伝子分析装置、方法又はシステムとの相互作用、ウェブページの閲覧、ウェブ検索エンジンの使用、スマートフォンに保存された様々なアプリとの相互作用、電子メール、SMS、又はMMSを介したメッセージの送受信、ゲームのプレイ、広告の受信、ローカルに保存又はストリーミングされたビデオの視聴、又はソーシャルネットワークへの参加等の動作を実施し得る。本発明の実施形態による遺伝子分析装置システム及び方法の例示的な態様では、例えば、ネットワーク1010又は1012等の1つ又は複数のネットワークは、クライアントデバイスへの無線ネットワークを介する等、サーバ及びクライアントデバイスを他のコンピューティングデバイスと結合させることができる。ネットワークは、ある電子デバイスから別の電子デバイスに情報を通信するために、任意の形態のコンピュータ可読媒体を使用することを可能にし得る。ネットワークには、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、ユニバーサルシリアルバス(Universal Serial Bus:USB)ポート等の直接接続、他の形態のコンピュータ可読媒体、又はそれらの任意の組合わせに加えて、インターネットが含まれ得る。異なるアーキテクチャ及びプロトコルに基づくものを含む、相互接続されたLANのセットでは、ルータはLAN間のリンクとして機能し、データを相互に送信できるようにする。
【0073】
LAN内の通信リンクは、ツイストワイヤペア又は同軸ケーブルを含み得るが、ネットワーク間の通信リンクは、アナログ電話回線、ケーブル回線、光回線、T1、T2、T3、及びT4を含む完全若しくは部分的な専用デジタル回線、サービス総合デジタル網(Integrated Services Digital Network:ISDN)、デジタル加入者線(Digital Subscriber Line:DSL)、衛星リンクを含む無線リンク、光ファイバーリンク、又は当業者に知られている他の通信リンクを含むことができる。更に、リモートコンピュータ及び他の関連する電子デバイスは、モデム及び電話リンクを介してLAN又はWANのいずれかにリモート接続できる。
【0074】
本発明の実施形態による例示的な遺伝子分析関連システム及び方法のような無線ネットワーク1010等の無線ネットワークは、デバイスをネットワークと結合させることができる。無線ネットワークは、スタンドアロンのアドホックネットワーク、メッシュネットワーク、無線LAN(WLAN)ネットワーク、セルラーネットワーク等を採用することができる。
【0075】
無線ネットワークは、無線ラジオリンク等によって接続された端末、ゲートウェイ、ルータ等の自律型システムを更に含み得る。これらのコネクタは、無線ネットワークのトポロジが急速に変化するように、自由かつランダムに移動し、それ自身を任意に編成するように構成され得る。無線ネットワークは更に、第2(2G)、第3(3G)、第4(4G)世代、セルラーシステム用のロング・ターム・エボリューション(LTE)無線通信アクセス、WLAN、無線ルータ(WR)メッシュ等を含む複数のアクセステクノロジーを採用することができる。2G、2.5G、3G、4G、5G等のアクセステクノロジー及び将来のアクセスネットワークにより、様々なモビリティレベルのクライアントデバイス等のクライアントデバイスを広範囲の領域カバーできるようになる可能性がある。例えば、無線ネットワークは、グローバル・システム・フォー・モバイル・コミュニケーション(Global System for Mobile communication:GSM)、ユニバーサル・モバイル・テレコミュニケーション・システム(Universal Mobile Telecommunications System:UMTS)、ジェネラル・パケット・ラジオ・サービス(General Packet Radio Service:GPRS)、拡張データGSM環境(Enhanced Data GSM Environment:EDGE)、3GPP(登録商標)ロング・ターム・エボリューション(Long Term Evolution:LTE)、LTEアドバンスト、広帯域符号分割多重接続(Wideband Code Division Multiple Access:WCDMA(登録商標))、Bluetooth、802.11b/g/n等のラジオ・ネットワーク・アクセス・テクノロジーを介した無線通信接続を可能にし得る。無線ネットワークは、情報がクライアントデバイスと別のコンピューティングデバイス、ネットワーク等との間を移動することができる事実上すべての無線通信メカニズムを含み得る。
【0076】
インターネットプロトコル(Internet Protocol:IP)は、参加するデジタル通信ネットワークのネットワークを介してデータ通信パケットを送信するために使用され得、TCP/IP、UDP、DECnet、NetBEUI、IPX、アップルトーク等のプロトコルを含み得る。インターネットプロトコルのバージョンには、IPv4及びIPv6が含まれる。インターネットには、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、無線ネットワーク、及びローカルエリアネットワーク間でパケットを通信できる長距離パブリックネットワークが含まれる。パケットは、ネットワーク内のノード間で、それぞれが特有のローカルネットワークアドレスを有するサイトに送信され得る。データ通信パケットは、インターネットに接続されたアクセスノードを介して、ユーザサイトからインターネットを通して送信され得る。標的サイトのサイトアドレスがパケットのヘッダーに含まれている場合、パケットはネットワークノードを介してネットワークに接続されている任意の標的サイトに転送され得る。インターネットを介して通信される各パケットは、標的アドレス及び標的サイトに接続するためのネットワークパスの可用性に従ってパケットを切り替える、ゲートウェイ及びサーバによって決定されるパスを介して送信され得る。
【0077】
パケットのヘッダーには、例えば、送信元ポート(16ビット)、宛先ポート(16ビット)、シーケンス番号(32ビット)、確認応答番号(32ビット)、データオフセット(4ビット)、予約済み(6ビット)、チェックサム(16ビット)、緊急ポインタ(16ビット)、オプション(サイズが8ビットの倍数の可変ビット数)、パディング(すべてゼロで構成され、ヘッダーが32ビット境界上で終了するようなビット数を含み得る)。上記のそれぞれのビット数も、より多い場合とより少ない場合がある。
【0078】
本発明の実施形態による例示的なシステム及び方法で使用され得る「コンテンツデリバリーネットワーク」又は「コンテンツディストリビューションネットワーク」(CDN)は、一般に、コンテンツプロバイダに代わってコンテンツ、ストリーミング媒体、及びアプリケーションのストレージ、キャッシュ、又は送信等の様々なサービスを促進するように設計された、ソフトウェア、システム、プロトコル、及び技術と共に、ネットワーク(複数可)によってリンクされた自律型コンピュータの集合を含む、分散型コンピュータシステムを指す。このようなサービスは、「クラウドコンピューティング」、分散ストレージ、DNS要求処理、プロビジョニング、データモニタリング及びレポート、コンテンツターゲティング、パーソナライズ、並びにビジネスインテリジェンス等を含むがこれらに限定されない補助テクノロジーを利用できる。CDNは、エンティティがサードパーティのウェブサイトインフラストラクチャの全体又は一部をサードパーティに代わって運用及び/又は管理できるようにする場合もある。
【0079】
ピアツーピア(Peer-to-Peer)(又はP2P)コンピュータネットワークは、専用サーバの所与のセットに集中するのではなく、主にネットワークの参加者のコンピューティングパワー及び帯域幅に依存する。P2Pネットワークは通常、主にアドホック接続を介してノードを接続するために使用される。純粋なピアツーピアネットワークは、クライアント又はサーバの概念はないが、ネットワーク上の他のノードに対して「クライアント」及び「サーバ」の両方として同時に機能する同等のピアノードのみを有する。
【0080】
本発明の一実施形態は、システム、方法、及びコンピュータプロセッサによって実行することができるコンピュータプログラムロジックを具体的に保存する非一時的なコンピュータ可読ストレージ媒体(複数可)を含む。
【0081】
当業者は、コンピュータシステム1100が、本発明の実施形態によるコンピュータプログラム製品を実施することができるシステムのほんの一例を示していることを理解するであろう。代替実施形態の一例を挙げると、本発明の一実施形態によるコンピュータプログラム製品に含まれる命令の実行は、例えば、分散型コンピューティングネットワークのコンピュータ等の複数のコンピュータにわたって分散されてもよい。
【0082】
本発明の実施形態には、以下を含む。
実施形態1.生物学的サンプル中のマイクロサテライト不安定性を同定する方法であって、
生物学的サンプルを使用して得られた核酸配列を含むフラグメントの蛍光を検出することによって、複数の信号を得ることであって、各信号が複数の異なるマイクロサテライト遺伝子座の1つに対応していることと、
複数の信号のそれぞれについて1つ又は複数の信号特徴を決定することと、
複数のマイクロサテライト遺伝子座の信号特徴の1つ又は複数に1つ又は複数の分類子を適用して、生物学的サンプルが、マイクロサテライト不安定性高、マイクロサテライト不安定性低、又はマイクロサテライト安定性であるかを同定することと、とを含む方法。
【0083】
実施形態2.複数の異なるマイクロサテライト遺伝子座のそれぞれ個々のマイクロサテライト遺伝子座の信号に対応する1つ又は複数の信号特徴に、1つ又は複数の分類子を適用して、それぞれ個々のマイクロサテライト遺伝子座がマイクロサテライト不安定性であるか、又はマイクロサテライト安定性であるかを同定することと、遺伝子座全体のこれらの決定を組み合わせて、生物学的サンプルのマイクロサテライトステータスを決定することと、とを更に含む、実施形態1に記載の方法。
【0084】
実施形態3.1つ又は複数の分類子を適用することが、生物学的サンプルに由来する信号特徴と、非癌性組織の1つ又は複数のサンプルに由来する信号特徴と、とを比較することを含む、実施形態1又は実施形態2に記載の方法。
【0085】
実施形態4.少なくとも1つの分類子がフラグメントサイズ閾値を含む、実施形態1又は実施形態2に記載の方法。
【0086】
実施形態5.少なくとも1つの分類子がフラグメントサイズ間隔を含む、実施形態1又は実施形態2に記載の方法。
【0087】
実施形態6.1つ又は複数の分類子を適用することが、指定されたサイズ間隔内のピークカウントを評価することを含む、実施形態1又は実施形態2に記載の方法。
【0088】
実施形態7.1つ又は複数の分類子を適用することが、指定されたサイズ間隔内の腫瘍組織と正常組織との間の相対的なピークカウントを評価することを含む、実施形態1又は実施形態2に記載の方法。
【0089】
実施形態8.1つ又は複数の分類子を適用することが、指定されたサイズ間隔内のピークエンベロープカウントを評価することを含む、実施形態1又は実施形態2に記載の方法。
【0090】
実施形態9.1つ又は複数の分類子を適用することが、指定されたサイズ間隔内のピークエンベロープ分離を評価することを含む、実施形態1又は実施形態2に記載の方法。
【0091】
実施形態10.1つ又は複数の分類子を適用することが、指定されたサイズ間隔内のピークエンベロープ分離を評価することを含む、実施形態1又は実施形態2に記載の方法。
【0092】
実施形態11.1つ又は複数の分類子を適用することが、指定されたサイズ間隔内の1つ又は複数のピーク位置におけるシフトを評価することを含む、実施形態1又は実施形態2に記載の方法。
【0093】
実施形態12.1つ又は複数の分類子を適用することが、ピークパターン入力を分析することを含む、実施形態1又は実施形態2に記載の方法。
【0094】
実施形態13.ピークパターン入力が、フラグメントサイズ軸に沿ったピーク振幅、フラグメントサイズ軸に沿ったピーク位置、最大ピークに対するピーク振幅、最大ピークに対するピーク位置、ピークエンベロープピーク振幅、ピークエンベロープピーク位置、ピークエンベロープピーク幅、又はピークエンベロープメトリックに対するピークメトリックのうちの2つ以上の値を含む、実施形態12に記載の方法。
【0095】
実施形態14.生物学的サンプルに対して、マイクロサテライト不安定性であると決定されたマイクロサテライト遺伝子座の百分率が、第1の所定の閾値を超える場合に、高いマイクロサテライト不安定性ステータスを割り当てるか、マイクロサテライト不安定性であると決定されたマイクロサテライト遺伝子座の百分率が、第2の所定の閾値よりも高いが、第1の所定の閾値よりも低い場合に、低いマイクロサテライト不安定性ステータスを割り当てるか、又はマイクロサテライト不安定性であると決定されたマイクロサテライト遺伝子座の百分率が、第2の所定の閾値より低い場合に、マイクロサテライト安定性ステータスを割り当てることを更に含む、実施形態2に記載の方法。
【0096】
実施形態15.信号特徴を分析して、安定値又は不安定値のいずれかを、マイクロサテライト遺伝子座のそれぞれに割り当てることと、
マイクロサテライト遺伝子座の割り当てられた安定値及び不安定値全体の加重合計を計算することと、
マイクロサテライト遺伝子座全体の加重合計が、第1の所定の閾値を超える場合に、生物学的サンプルに高いマイクロサテライト不安定性ステータスを割り当てるか、マイクロサテライト遺伝子座全体の加重合計が、第2の所定の閾値を超えるが、第1の所定の閾値を超えない場合に、生物学的サンプルに低いマイクロサテライト不安定性ステータスを割り当てるか、又はマイクロサテライト遺伝子座全体の加重合計が第2の所定の閾値より低い場合に、マイクロサテライト安定性ステータスを割り当てることと、とを更に含む、実施形態2に記載の方法。
【0097】
実施形態16.加重合計が、複数の信号特徴を3つの別個の出力値にマッピングする1つ又は複数の分類関数を使用して計算される、実施形態15に記載の方法。
【0098】
実施形態17.生物学的サンプル中のマイクロサテライト不安定性を同定するための方法であって、
生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光を検出することによって複数の信号を取得することであって、核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が、複数の異なるマイクロサテライト遺伝子座の1つに対応することと、
1つ又は複数の分類子を使用して複数の信号を分析して、生物学的サンプルが、高いマイクロサテライト不安定性、低いマイクロサテライト不安定性、又はマイクロサテライト安定性を有するかどうかを同定することと、とを含む方法。
【0099】
実施形態18.分類子が非線形分類関数を含む、実施形態17に記載の方法。
【0100】
実施形態19.非線形分類関数が多層人工ニューラルネットワークを含む、実施形態18に記載の方法。
【0101】
実施形態20.分類子がディープ・ラーニング・ニューラル・ネットワークを含む、実施形態17に記載の方法。
【0102】
実施形態21.生物学的サンプル中のマイクロサテライト不安定性を同定するための、1つ又は複数のコンピュータプロセッサ上で実行可能な非一時的なコンピュータ可読媒体に格納された実行可能コードを含むコンピュータプログラム製品であって、実行可能コードが、
キャピラリ電気泳動遺伝子分析装置から複数の信号を取得することであって、信号が、ポリメラーゼ連鎖反応を介して生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光から検出され、核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が、複数の異なるマイクロサテライト遺伝子座のうちの1つに対応することと、
1つ又は複数の分類子を使用して複数の信号のそれぞれを分析して、生物学的サンプルが、マイクロサテライト不安定性高、マイクロサテライト不安定性低、又はマイクロサテライト安定性ステータスを有するかどうかを同定することと、とに対する1つ又は複数のコンピュータ可読命令を含む、コンピュータプログラム製品。
【0103】
実施形態22.少なくとも1つの分類子が、人工知能によって作製された分類子を含む、実施形態21に記載のコンピュータプログラム製品。
【0104】
実施形態23.キャピラリ電気泳動遺伝子分析装置を使用して、生物学的サンプル中のマイクロサテライト不安定性を同定するためのシステムであって、
1つ又は複数のコンピュータプロセッサによって実行される場合に、1つ又は複数のコンピュータ可読命令を格納する非一時的なコンピュータ可読媒体に接続された1つ又は複数のコンピュータプロセッサと、
a.キャピラリ電気泳動遺伝子分析装置から複数の信号を取得することであって、信号が、ポリメラーゼ連鎖反応を介して生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光から検出され、核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が、複数の異なるマイクロサテライト遺伝子座のうちの1つに対応することと、
b.1つ又は複数の分類子を使用して複数の信号のそれぞれを分析して、生物学的サンプルが、マイクロサテライト不安定性高、マイクロサテライト不安定性低、又はマイクロサテライト安定性ステータスを有するかどうかを同定することと、
1つ又は複数の信号特徴を記憶するために、1つ又は複数のプロセッサのうちの少なくとも1つに接続されたメモリと、
メモリに接続され、信号特徴の1つ又は複数を表示するように構成されるユーザ・デバイス・ディスプレイと、とを含むシステム。
【0105】
実施形態24.少なくとも1つの分類子が、人工知能によって作製された分類子を含む、実施形態23に記載のシステム。
【0106】
実施形態25.生物学的サンプル中のマイクロサテライト不安定性を同定するためのキットであって、
生物学的サンプルの複数のマイクロサテライト遺伝子座に隣接するように構成されて、PCRプライマー及び生物学的サンプルが組み合わされ、増幅プロセスにかけられる場合、蛍光標識されたDNAフラグメントが生成され、複数のマイクロサテライト遺伝子座を含み、ここで、複数のマイクロサテライト遺伝子座の少なくともいくつかは、複数のマイクロサテライト遺伝子座の他のものとは異なる、複数のポリメラーゼ連鎖反応(PCR)プライマーと、
1つ又は複数のプロセッサによって実行される場合、1つ又は複数のプロセッサに、複数の蛍光標識されたマイクロサテライト遺伝子座から得られた蛍光データを使用して、生物学的サンプルのマイクロサテライト不安定性を分類することを含む処理を実行させる、実行可能命令コードを含む、非一時的なコンピュータ可読媒体に埋め込まれたコンピュータプログラム製品と、
とを含む、キット。
【0107】
実施形態26.実行可能命令コードの実行により、1つ又は複数のプロセッサに、
1つ又は複数の遺伝子座特異的アルゴリズムを蛍光データに適用して、複数のマイクロサテライト遺伝子座の対応する特定の遺伝子座のマイクロサテライト不安定性を分類する遺伝子座特異的結果を生成することと、
遺伝子座特異的結果を使用して、生物学的サンプルのマイクロサテライト不安定性を分類することと、とを含む処理を実行させる、実施形態25に記載のキット。
【0108】
実施形態27.腫瘍を有する患者を抗腫瘍薬で治療する方法であって、腫瘍の細胞が高いマイクロサテライト不安定性を示す場合、抗腫瘍薬はより効果的である可能性が高く、方法が、
患者から、腫瘍の細胞を含む生物学的サンプルを取得することと、
実施形態1~20のいずれか1つの方法を使用して、腫瘍の細胞が、正常細胞と比較して、高いマイクロサテライト不安定性を示すかどうかを決定することと、腫瘍の細胞のマイクロサテライト不安定性が高いと決定された場合は、腫瘍を治療するために抗腫瘍薬を患者に投与することと、とを含む方法。
【0109】
実施形態28.腫瘍を有する患者を抗腫瘍薬で治療する方法であって、腫瘍の細胞が高いマイクロサテライト不安定性を示す場合、抗腫瘍薬はより効果的である可能性が高く、方法が、
患者から、腫瘍の細胞を含む生物学的サンプルを取得することと、
実施形態21及び22のいずれか1つに記載のコンピュータプログラム製品を使用して、腫瘍の細胞が高いマイクロサテライト不安定性を示すかどうかを決定することと、
腫瘍の細胞のマイクロサテライト不安定性が高いと決定された場合に、腫瘍を治療するために抗腫瘍薬を患者に投与することと、とを含む方法。
【0110】
実施形態29.腫瘍を有する患者を抗腫瘍薬で治療する方法であって、腫瘍の細胞が高いマイクロサテライト不安定性を示す場合、抗腫瘍薬はより効果的である可能性が高く、方法が、
患者から、腫瘍の細胞を含む生物学的サンプルを取得することと、
実施形態23及び24のいずれか1つに記載のシステムを使用して、腫瘍の細胞が高いマイクロサテライト不安定性を示すかどうかを決定することと、
腫瘍の細胞のマイクロサテライト不安定性が高いと決定された場合に、腫瘍を治療するために抗腫瘍薬を患者に投与することと、とを含む方法。
【0111】
実施形態30.腫瘍を有する患者を抗腫瘍薬で治療する方法であって、腫瘍の細胞が高いマイクロサテライト不安定性を示す場合、抗腫瘍薬はより効果的である可能性が高く、方法が、
患者から、腫瘍の細胞を含む生物学的サンプルを取得することと、
実施形態25及び26のいずれか1つに記載のキットを使用して、腫瘍の細胞が高いマイクロサテライト不安定性を示すかどうかを決定することと、
腫瘍の細胞のマイクロサテライト不安定性が高いと決定された場合に、腫瘍を治療するために抗腫瘍薬を患者に投与することと、とを含む方法。
【0112】
実施形態31.腫瘍を有する患者を抗腫瘍薬で治療する方法であって、腫瘍の細胞が高いマイクロサテライト不安定性を示す場合、抗腫瘍薬はより効果的である可能性が高く、方法が、
患者から複数の生物学的サンプルを取得することであって、少なくとも1つの生物学的サンプルが、腫瘍の細胞を含み、少なくとも1つの生物学的サンプルが正常細胞を含むことと、
実施形態1~20のいずれか1つの方法を使用して、腫瘍の細胞が、高いマイクロサテライト不安定性を示すかどうかを決定することと、腫瘍の細胞のマイクロサテライト不安定性が高いと決定された場合に、腫瘍を治療するために抗腫瘍薬を患者に投与することと、とを含む方法。
【0113】
本発明の追加の関連する実施形態は、以下を含む。
【0114】
実施形態1A.生物学的サンプル中のマイクロサテライト不安定性を同定する方法であって、
生物学的サンプルを使用して得られた核酸配列を含むフラグメントの蛍光を検出することによって、複数の信号を得ることであって、各信号が複数の異なるマイクロサテライト遺伝子座の1つに対応していることと、
複数の信号のそれぞれについて1つ又は複数の信号特徴を決定することと、
複数のマイクロサテライト遺伝子座の信号特徴の1つ又は複数に1つ又は複数の分類子を適用して、生物学的サンプルが、マイクロサテライト不安定性高であるか、マイクロサテライト不安定性低であるか、又はマイクロサテライト安定性であるかを同定することと、とを含む方法。
【0115】
実施形態2A.複数の異なるマイクロサテライト遺伝子座のそれぞれ個々のマイクロサテライト遺伝子座の信号に対応する1つ又は複数の信号特徴に、1つ又は複数の分類子を適用して、それぞれ個々のマイクロサテライト遺伝子座がマイクロサテライト不安定性であるか、又はマイクロサテライト安定性であるかを同定することと、遺伝子座全体のこれらの決定を組み合わせて、生物学的サンプルのマイクロサテライトステータスを決定することと、とを更に含む、実施形態1Aに記載の方法。
【0116】
実施形態3A.1つ又は複数の分類子を適用することが、生物学的サンプルに由来する信号特徴と、非癌性組織の1つ又は複数のサンプルに由来する信号特徴と、とを比較することを含む、実施形態1Aに記載の方法。
【0117】
実施形態4A.少なくとも1つの分類子が、フラグメントサイズ閾値又はフラグメントサイズ間隔を含む、実施形態1Aに記載の方法。
【0118】
実施形態5A.1つ又は複数の分類子を適用することが、ピークカウント、又は指定されたサイズ間隔内の腫瘍組織と正常組織との間の相対ピークカウントを評価することを含む、実施形態1Aの方法。
【0119】
実施形態6A.1つ又は複数の分類子を適用することが、指定されたサイズ間隔内のピークエンベロープカウント又はピークエンベロープ分離を評価することを含む、実施形態1Aの方法。
【0120】
実施形態7A.1つ又は複数の分類子を適用することが、指定されたサイズ間隔内の1つ又は複数のピーク位置におけるシフトを評価することを含む、実施形態1Aに記載の方法。
【0121】
実施形態8A.1つ又は複数の分類子を適用することが、フラグメントサイズ軸に沿ったピーク振幅、フラグメントサイズ軸に沿ったピーク位置、最大ピークに対するピーク振幅、最大ピークに対するピーク位置、ピークエンベロープピーク振幅、ピークエンベロープピーク位置、ピークエンベロープピーク幅、又はピークエンベロープメトリックに対するピークメトリックのうちの2つ以上の値を含むピークパターン入力を分析することを含む、実施形態1Aに記載の方法。
【0122】
実施形態9A.正常組織サンプルからのピークパターン入力に対する生物学的サンプルのピークパターン入力の偏差を測定することを更に含む、実施形態8Aに記載の方法。
【0123】
実施形態10A.癌を有さない個体の集団全体で計算された名目上のピークパターン値に対する生物学的サンプルのピークパターン入力の偏差を測定することを更に含む、実施形態8Aに記載の方法。
【0124】
実施形態11A.癌を有さない個体の集団全体で計算された名目上のピークパターン値と比較して、正常組織サンプルからのピークパターン入力に対する生物学的サンプルのピークパターン入力の偏差を測定することを更に含む、実施形態8Aに記載の方法。
【0125】
実施形態12.生物学的サンプルの腫瘍細胞の正規化されたデータからのピークパターン入力と、生物学的サンプルの正常な非腫瘍細胞からの正規化されたデータとの間の差信号パターンを計算することを更に含む、実施形態8Aに記載の方法。
【0126】
実施形態13A.生物学的サンプルに対して、マイクロサテライト不安定性であると決定されたマイクロサテライト遺伝子座の百分率が、第1の所定の閾値を超える場合に、高いマイクロサテライト不安定性ステータスを割り当てるか、マイクロサテライト不安定性であると決定されたマイクロサテライト遺伝子座の百分率が、第2の所定の閾値を超えるが、第1の所定の閾値よりも低い場合に、低いマイクロサテライト不安定性ステータスを割り当てるか、又はマイクロサテライト不安定性であると決定されたマイクロサテライト遺伝子座の百分率が、第2の所定の閾値より低い場合に、マイクロサテライト安定性ステータスを割り当てることを更に含む、実施形態2Aに記載の方法。
【0127】
実施形態14A.信号特徴を分析して、安定値又は不安定値のいずれかを、マイクロサテライト遺伝子座のそれぞれに割り当てることと、
マイクロサテライト遺伝子座の割り当てられた安定値及び不安定値全体の加重合計を計算することと、
マイクロサテライト遺伝子座全体の加重合計が、第1の所定の閾値を超える場合に、生物学的サンプルに高いマイクロサテライト不安定性ステータスを割り当てるか、マイクロサテライト遺伝子座全体の加重合計が、第2の所定の閾値を超えるが、第1の所定の閾値を超えない場合に、生物学的サンプルに低いマイクロサテライト不安定性ステータスを割り当てるか、又はマイクロサテライト遺伝子座全体の加重合計が第2の所定の閾値より低い場合に、マイクロサテライト安定性ステータスを割り当てることと、とを更に含む、実施形態2Aに記載の方法。
【0128】
実施形態15A.加重合計が、複数の信号特徴を3つの別個の出力値にマッピングする1つ又は複数の分類関数を使用して計算される、実施形態14Aに記載の方法。
【0129】
実施形態16A.生物学的サンプル中のマイクロサテライト不安定性を同定するための方法であって、
生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光を検出することによって複数の信号を取得することであって、核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が、複数の異なるマイクロサテライト遺伝子座の1つに対応することと、
1つ又は複数の分類子を使用して複数の信号を分析して、生物学的サンプルが、高いマイクロサテライト不安定性、低いマイクロサテライト不安定性、又はマイクロサテライト安定性を有するかどうかを同定することと、とを含む方法。
【0130】
実施形態17A.分類子が非線形分類関数を含む、実施形態16Aに記載の方法。
【0131】
実施形態18A.非線形分類関数が多層人工ニューラルネットワークを含む、実施形態17Aに記載の方法。
【0132】
実施形態19A.分類子がディープ・ラーニング・ニューラル・ネットワークを含む、実施形態16Aに記載の方法。
【0133】
実施形態20A.生物学的サンプル中のマイクロサテライト不安定性を同定するための、1つ又は複数のコンピュータプロセッサ上で実行可能な非一時的なコンピュータ可読媒体に格納された実行可能コードを含むコンピュータプログラム製品であって、実行可能コードが、
キャピラリ電気泳動遺伝子分析装置から複数の信号を取得することであって、信号が、ポリメラーゼ連鎖反応を介して生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光から検出され、核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が、複数の異なるマイクロサテライト遺伝子座のうちの1つに対応することと、
1つ又は複数の分類子を使用して複数の信号のそれぞれを分析して、生物学的サンプルが、マイクロサテライト不安定性高、マイクロサテライト不安定性低、又はマイクロサテライト安定性ステータスを有するかどうかを同定することと、とに対する1つ又は複数のコンピュータ可読命令を含む、コンピュータプログラム製品。
【0134】
実施形態21A.少なくとも1つの分類子が、人工知能によって作製された分類子を含む、実施形態20Aに記載のコンピュータプログラム製品。
【0135】
実施形態22A.キャピラリ電気泳動遺伝子分析装置を使用して、生物学的サンプル中のマイクロサテライト不安定性を同定するためのシステムであって、
1つ又は複数のコンピュータプロセッサによって実行される場合、1つ又は複数のコンピュータ可読命令を格納する、非一時的なコンピュータ可読媒体に接続された1つ又は複数のコンピュータプロセッサと、
キャピラリ電気泳動遺伝子分析装置から複数の信号を取得することであって、信号が、ポリメラーゼ連鎖反応を介して生物学的サンプルから増幅された核酸配列を含むフラグメントの蛍光から検出され、核酸配列が、複数の異なるマイクロサテライト遺伝子座に対応し、各信号が、複数の異なるマイクロサテライト遺伝子座のうちの1つに対応することと、
1つ又は複数の分類子を使用して複数の各信号を分析して、生物学的サンプルが、マイクロサテライト不安定性高、マイクロサテライト不安定性低、又はマイクロサテライト安定性ステータスであるかを同定することと、
1つ又は複数の信号特徴を記憶するために、1つ又は複数のプロセッサのうちの少なくとも1つに接続されたメモリと、
メモリに接続され、信号特徴の1つ又は複数を表示するように構成されるユーザ・デバイス・ディスプレイと、とを含むシステム。
【0136】
実施形態23A.生物学的サンプル中のマイクロサテライト不安定性を同定するためのキットであって、
生物学的サンプルの複数のマイクロサテライト遺伝子座に隣接するように構成されて、PCRプライマー及び生物学的サンプルが組み合わされ、増幅プロセスにかけられる場合、蛍光標識されたDNAフラグメントが生成され、複数のマイクロサテライト遺伝子座を含み、ここで、複数のマイクロサテライト遺伝子座の少なくともいくつかは、複数のマイクロサテライト遺伝子座の他のものとは異なる、複数のポリメラーゼ連鎖反応(PCR)プライマーと、
1つ又は複数のプロセッサによって実行される場合、1つ又は複数のプロセッサに、複数の蛍光標識されたマイクロサテライト遺伝子座から得られた蛍光データを使用して、生物学的サンプルのマイクロサテライト不安定性を分類することを含む処理を実行させる、実行可能命令コードを含む、非一時的なコンピュータ可読媒体に埋め込まれたコンピュータプログラム製品と、とを含むキット。
【0137】
実施形態24A.実行可能命令コードの実行により、1つ又は複数のプロセッサに、
1つ又は複数の遺伝子座特異的アルゴリズムを蛍光データに適用して、複数のマイクロサテライト遺伝子座の対応する特定の遺伝子座のマイクロサテライト不安定性を分類する遺伝子座特異的結果を生成することと、
遺伝子座特異的結果を使用して、生物学的サンプルのマイクロサテライト不安定性を分類することと、とを含む処理を実行させる、請求項23Aに記載のキット。
【0138】
例示された実施形態に関して本発明を具体的に説明したが、本開示に基づいて様々な変更、修正、及び適合を行うことができ、本発明の範囲内にあることが意図される。現在最も実用的かつ好ましい実施形態であると考えられるものに関連して本発明を説明したが、本発明は開示された実施形態に限定されず、反対に、上記及び下記に参照される様々な実施形態によって、記載されているような本発明の根底にある基本原理の範囲内に含まれる、様々な修正及び同等の構成を網羅することを意図していることが理解される。