(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024075641
(43)【公開日】2024-06-04
(54)【発明の名称】次世代シーケンシングサンプルにおける汚染検出のためのシステムおよび方法
(51)【国際特許分類】
G16B 30/00 20190101AFI20240528BHJP
【FI】
G16B30/00
【審査請求】有
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2024039966
(22)【出願日】2024-03-14
(62)【分割の表示】P 2022529498の分割
【原出願日】2020-11-20
(31)【優先権主張番号】62/938,807
(32)【優先日】2019-11-21
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】591003013
【氏名又は名称】エフ. ホフマン-ラ ロシュ アーゲー
【氏名又は名称原語表記】F. HOFFMANN-LA ROCHE AKTIENGESELLSCHAFT
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【弁理士】
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100138759
【弁理士】
【氏名又は名称】大房 直樹
(72)【発明者】
【氏名】カムネワ,オルガ・コンスタンチノフナ
(72)【発明者】
【氏名】ワーン,シュオ
(57)【要約】 (修正有)
【課題】汚染を検出し、液体生検サンプルの点推定値および信頼区間の双方として汚染レベルを報告するためのベータ混合モデリングに基づく統計的方法及びシステムを提供する。
【解決手段】方法は、被験者由来のシーケンシングされたサンプルからのバリアントのリストを含む電子ファイルを受信することと、頻度範囲内のバリアントのセットに対する代替対立遺伝子頻度のセットを計算することと、前記代替対立遺伝子頻度のセットの分析に基づいて前記サンプルが汚染されているかどうかを判定することと、前記サンプルが汚染されていない場合、前記バリアントのリストに少なくとも部分的に基づいて薬物を投与することと、前記サンプルが汚染されている場合、バリアントの第2のリストを含む汚染されていないシーケンシングされたサンプルを取得し、前記バリアントの第2のリストに少なくとも部分的に基づいて薬物を投与することと、を含む。
【選択図】なし
【特許請求の範囲】
【請求項1】
汚染を検出する方法であって、
被験者由来のシーケンシングされたサンプルからのバリアントのリストを含む電子ファイルを受信することと、
頻度範囲内のバリアントのセットに対する代替対立遺伝子頻度のセットを計算することと、
前記代替対立遺伝子頻度のセットの分析に基づいて前記サンプルが汚染されているかどうかを判定することと、
前記サンプルが汚染されていない場合、前記バリアントのリストに少なくとも部分的に基づいて薬物を投与することと、
前記サンプルが汚染されている場合、バリアントの第2のリストを含む汚染されていないシーケンシングされたサンプルを取得し、前記バリアントの第2のリストに少なくとも部分的に基づいて薬物を投与することと
を含む、方法。
【請求項2】
前記頻度範囲が0から0.25の間である、請求項1に記載の方法。
【請求項3】
前記頻度範囲が0から0.1の間である、請求項1に記載の方法。
【請求項4】
前記代替対立遺伝子頻度のセットの前記分析が、前記代替対立遺伝子頻度をクラスタリングモデルに当てはめることを含む、請求項1に記載の方法。
【請求項5】
前記クラスタリングモデルが混合モデルである、請求項4に記載の方法。
【請求項6】
前記代替対立遺伝子頻度のいずれかが外れ値であるかどうかを判定することと、前記代替対立遺伝子頻度の前記分析の前に、前記代替対立遺伝子頻度のセットから任意の外れ値を除去することと、をさらに含む、請求項1に記載の方法。
【請求項7】
前記代替対立遺伝子頻度のいずれかが外れ値であるかどうかを判定するステップが、局所外れ値因子計算を含む、請求項6に記載の方法。
【請求項8】
前記代替対立遺伝子頻度の前記分析から汚染レベルを判定することをさらに含む、請求項1に記載の方法。
【請求項9】
前記汚染レベルを判定するステップが、前記代替対立遺伝子頻度を混合モデルに当てはめることを含む、請求項8に記載の方法。
【請求項10】
前記汚染レベル付近の信頼性レベルを判定するステップをさらに含む、請求項9に記載の方法。
【請求項11】
信頼性レベルを判定することが、前記バリアントおよび対応する前記代替対立遺伝子頻度をブートストラップすることを含む、請求項10に記載の方法。
【請求項12】
前記薬物ががん薬物である、請求項1に記載の方法。
【請求項13】
前記がん薬物が、特定のバリアントを有しない患者よりも、前記特定のバリアントを有する患者に対して良好に機能する、請求項10に記載の方法。
【請求項14】
前記サンプルが、少なくとも1000xの平均シーケンシング深度にシーケンシングさ
れる、請求項1に記載の方法。
【請求項15】
前記サンプルが、少なくとも2000xの平均シーケンシング深度にシーケンシングされる、請求項1に記載の方法。
【請求項16】
汚染を検出する方法であって、
被験者由来のシーケンシングされたサンプルからのバリアントのリストを含む電子ファイルを受信することと、
頻度範囲内のバリアントのセットに対する代替対立遺伝子頻度のセットを計算することと、
前記代替対立遺伝子頻度のセットの分析に基づいて前記サンプルが汚染されているかどうかを判定することと
を含む、方法。
【請求項17】
上記の方法のいずれかの動作を実行するようにコンピュータシステムを制御するための複数の命令を記憶するコンピュータ可読媒体を含む、コンピュータ製品。
【請求項18】
システムであって、
請求項17に記載のコンピュータ製品と、
前記コンピュータ可読媒体に記憶された命令を実行するための1つ以上のプロセッサとを備える、システム。
【発明の詳細な説明】
【関連出願の相互参照】
【0001】
なし
【0002】
参照による組み込み
本明細書で述べられる全ての刊行物および特許出願は、それぞれの個々の刊行物または特許出願が参照によって組み込まれることが具体的且つ個別に示されるかのように同程度に参照によって本明細書に組み込まれる。
【技術分野】
【0003】
本発明の実施形態は、一般に、次世代シーケンシングのためのシステムおよび方法に関し、より詳細には、次世代シーケンシングサンプルにおける汚染検出のためのシステムおよび方法に関する。
【背景技術】
【0004】
次世代シーケンシング(NGS)は、キャリアスクリーニング、感染症、ならびにがんの検出および/または分析などの様々な用途における診断アッセイに使用されることができる点まで進歩している。特定の用途では、例えばがんにおける突然変異(すなわち、バリアント)であり得るシーケンシング標的は、サンプル中に非常に少量存在することができる。サンプル中にこのような少量の標的が存在すると、偽陽性と判定されるリスクが高くなる。
【0005】
偽陽性の1つの潜在的な原因は、シーケンシングエラーによるものである。例えば、90%の生の読み取り精度を有するシーケンサーは、1回のパスで決定された配列に対して多くのエラーを生成することが予想され、エラーを実際の突然変異と区別することを困難にする。このシーケンシングエラーを低減する1つの方法は、標的を何度もシーケンシングすることによってコンセンサス配列を決定し、それによって所望のコンセンサス配列精度(すなわち、例えば、99%、99.9%、または99.99%)を達成することである。
【0006】
偽陽性の別の原因は、サンプル汚染(すなわち、サンプルの交差汚染)に由来することができる。しかしながら、サンプル間汚染を検出するための従来技術に記載されている方法は非常に少ない。したがって、偽陽性のリスクを低減するために、システムおよび方法がNGSサンプルの汚染を検出することができることが望ましいであろう。
【発明の概要】
【0007】
本発明は、一般に、次世代シーケンシングのためのシステムおよび方法に関し、より詳細には、次世代シーケンシングサンプルにおける汚染検出のためのシステムおよび方法に関する。
【0008】
いくつかの実施形態では、汚染を検出する方法が提供される。本方法は、被験者由来のシーケンシングされたサンプルからのバリアントのリストを含む電子ファイルを受信することと、頻度範囲内のバリアントのセットに対する代替対立遺伝子頻度のセットを計算することと、代替対立遺伝子頻度のセットの分析に基づいてサンプルが汚染されているかどうかを判定することと、サンプルが汚染されていない場合、バリアントのリストに少なくとも部分的に基づいて薬物を投与することと、サンプルが汚染されている場合、バリアントの第2のリストを含む汚染されていないシーケンシングされたサンプルを取得し、バリ
アントの第2のリストに少なくとも部分的に基づいて薬物を投与することと、を含むことができる。
【0009】
いくつかの実施形態では、頻度範囲は、0から0.25の間である。いくつかの実施形態では、頻度範囲は、0から0.1の間である。
【0010】
いくつかの実施形態では、代替対立遺伝子頻度のセットの分析は、代替対立遺伝子頻度をクラスタリングモデルに当てはめることを含む。いくつかの実施形態では、クラスタリングモデルは、混合モデルである。いくつかの実施形態では、混合モデルは、ベータ混合モデルである。
【0011】
いくつかの実施形態では、本方法は、代替対立遺伝子頻度のいずれかが外れ値であるかどうかを判定することと、代替対立遺伝子頻度の分析の前に、代替対立遺伝子頻度のセットから任意の外れ値を除去することと、をさらに含む。
【0012】
いくつかの実施形態では、代替対立遺伝子頻度のいずれかが外れ値であるかどうかを判定するステップは、局所外れ値因子計算を含む。
【0013】
いくつかの実施形態では、本方法は、代替対立遺伝子頻度の分析から汚染レベルを判定することをさらに含む。
【0014】
いくつかの実施形態では、汚染レベルを判定するステップは、代替対立遺伝子頻度を混合モデルに当てはめることを含む。
【0015】
いくつかの実施形態では、本方法は、汚染レベル付近の信頼性レベルを判定することをさらに含む。
【0016】
いくつかの実施形態では、信頼性レベルを判定することは、バリアントおよび対応する代替対立遺伝子頻度をブートストラップすることを含む。
【0017】
いくつかの実施形態では、薬物は、がん薬物である。
【0018】
いくつかの実施形態では、がん薬物は、特定のバリアントを有しない患者よりも、特定のバリアントを有する患者に対して良好に機能する。
【0019】
いくつかの実施形態では、サンプルは、少なくとも1000xの平均シーケンシング深度にシーケンシングされる。いくつかの実施形態では、サンプルは、少なくとも2000xの平均シーケンシング深度にシーケンシングされる。
【0020】
いくつかの実施形態では、汚染を検出するシステムが提供される。システムは、本明細書に記載の方法のいずれかに記載のステップを実行するようにプログラムされたプロセッサを含む。
【0021】
いくつかの実施形態では、汚染を検出する方法が提供される。本方法は、被験者由来のシーケンシングされたサンプルからのバリアントのリストを含む電子ファイルを受信することと、頻度範囲内のバリアントのセットに対する代替対立遺伝子頻度のセットを計算することと、代替対立遺伝子頻度のセットの分析に基づいて、サンプルが汚染されているかどうかを判定することと、を含むことができる。
【0022】
いくつかの実施形態では、コンピュータ製品が提供される。コンピュータ製品は、上述
した方法のいずれかの動作を実行するようにコンピュータシステムを制御するための複数の命令を記憶するコンピュータ可読媒体を含む。
【0023】
いくつかの実施形態では、上述したコンピュータ製品と、コンピュータ可読媒体に記憶された命令を実行するための1つ以上のプロセッサとを含むシステムが提供される。
【図面の簡単な説明】
【0024】
本発明の新規の特徴は、以下の特許請求の範囲に具体的に記載されている。本発明の特徴および利点のより良い理解は、本発明の原理が利用される例示的な実施形態を説明する以下の詳細な説明、およびその添付の図面を参照することによって得られるであろう:
【0025】
【
図1】本発明の1つ以上の態様を実施するように構成されたコンピュータシステムの一実施形態を示すブロック図である。
【
図2A】純粋な汚染されていないサンプルにおける代替対立遺伝子頻度が以下の3つのレベル付近に集中する傾向があることを示している:0.0(AA)、0.5(Aa)、1.0(aa)。
【
図2B】純粋な汚染されていないサンプルにおける代替対立遺伝子頻度が以下の3つのレベル付近に集中する傾向があることを示している:0.0(AA)、0.5(Aa)、1.0(aa)。
【
図3A】純粋なサンプルに対する低範囲の代替対立遺伝子頻度における頻度分布を示している。
【
図3B】純粋なサンプルに対する低範囲の代替対立遺伝子頻度における頻度分布を示している。
【
図3C】純粋なサンプルに対する低範囲の代替対立遺伝子頻度における頻度分布を示している。
【
図4A】汚染されたサンプルに対する低範囲の代替対立遺伝子頻度における頻度分布を示している。
【
図4B】汚染されたサンプルに対する低範囲の代替対立遺伝子頻度における頻度分布を示している。
【
図4C】汚染されたサンプルに対する低範囲の代替対立遺伝子頻度における頻度分布を示している。
【
図4D】汚染されたサンプルに対する低範囲の代替対立遺伝子頻度における頻度分布を示している。
【
図5A】標的キットパネルのシミュレーションの結果を示している。
【
図5B】標的キットパネルのシミュレーションの結果を示している。
【
図5C】標的キットパネルのシミュレーションの結果を示している。
【
図5D】拡張キットパネルのシミュレーションの結果を示している。
【
図5E】拡張キットパネルのシミュレーションの結果を示している。
【
図5F】拡張キットパネルのシミュレーションの結果を示している。
【
図5G】監視キットパネルのシミュレーションの結果を示している。
【
図5H】監視キットパネルのシミュレーションの結果を示している。
【
図5I】監視キットパネルのシミュレーションの結果を示している。
【
図6】汚染されたサンプルに対する低範囲の代替対立遺伝子頻度の分布を示すヒストグラムを示している。
【
図7A】予測された汚染レベルの平均を示している。
【
図7B】1000個のブートストラップを使用した信頼性レベルを示している。
【
図8A】典型的なカバレッジ深度にシーケンシングされた単一の汚染源を有する1000個の合成サンプルからの性能を示している。
【
図8B】低い汚染レベル(1%未満の汚染)における10,000個のサンプルのシーケンシングカバレッジを増加させる効果を示している。
【
図8C】低い汚染レベル(1%未満の汚染)における10,000個のサンプルのシーケンシングカバレッジを増加させる効果を示している。
【
図8D】低い汚染レベル(1%未満の汚染)における10,000個のサンプルのシーケンシングカバレッジを増加させる効果を示している。
【
図8E】低い汚染レベル(1%未満の汚染)における10,000個のサンプルのシーケンシングカバレッジを増加させる効果を示している。
【
図8F】低い汚染レベル(1%未満の汚染)における10,000個のサンプルのシーケンシングカバレッジを増加させる効果を示している。
【
図9A】典型的なカバレッジ深度にシーケンシングされた5つの汚染源を有する方法の性能を示している。
【
図9B】5つの汚染源の汚染の合計が1%未満である10000個の合成サンプルに対するシーケンシング深度の変化の効果を示している。
【
図9C】5つの汚染源の汚染の合計が1%未満である10000個の合成サンプルに対するシーケンシング深度の変化の効果を示している。
【
図9D】5つの汚染源の汚染の合計が1%未満である10000個の合成サンプルに対するシーケンシング深度の変化の効果を示している。
【
図9E】5つの汚染源の汚染の合計が1%未満である10000個の合成サンプルに対するシーケンシング深度の変化の効果を示している。
【
図9F】5つの汚染源の汚染の合計が1%未満である10000個の合成サンプルに対するシーケンシング深度の変化の効果を示している。
【
図10】予測された汚染レベルが指定された汚染レベルに十分に対応し、0.94のピアソン相関係数を有することを示している。
【発明を実施するための形態】
【0026】
サンプルの交差汚染の特定は、全ての次世代シーケンシング(NGS)用途、特に、がん検出および/または分析などの様々な用途のための液体生検のように、低頻度でサンプル中に存在する体細胞変異または任意の他のバリアントの検出を目的とするものにおいて重要である。そのような用途では、汚染は、例えば、患者が不必要な処置を受けたり、非有効性もしくは準最適な薬物を処方されたりすることをもたらすことにより、重要な突然変異の偽陽性結果をもたらし、患者に害をもたらす可能性がある。しかしながら、サンプル間汚染を検出する方法は、パブリックドメインではほとんど利用できない。ここでは、本発明者らは、汚染を検出し、液体生検サンプルの点推定値および信頼区間の双方として汚染レベルを報告するためのベータ混合モデリングに基づく統計的手法を説明する。本発明者らは、インシリコシミュレーションおよびインビトロ汚染スパイクサンプルの双方によって本発明者らの方法を検証する。本発明者らは、液体生検サンプルに焦点を当てているが、任意の一般的なNGS用途に対して僅かな変更を除けば同じ戦略が適用可能である。例えば、生検からの組織サンプルは、本明細書に記載のシステムおよび方法にしたがって使用されることができる。
【0027】
I.次世代シーケンシング技術
上に示したように、調製された目的の核酸分子(例えば、シーケンシングライブラリ)は、複数のマイクロサテライト遺伝子座のシーケンシングリードを決定するための手順の一部として、シーケンシングアッセイを使用してシーケンシングされる。多くのシーケンシング技術またはシーケンシングアッセイのいずれかが利用されることができる。本明細書で使用される「次世代シーケンシング(NGS)」という用語は、クローンで増幅された分子および単一の核酸分子の超並列シーケンシングを可能にするシーケンシング方法を指す。
【0028】
本明細書に開示される方法での使用に適した配列アッセイの非限定的な例は、ナノポアシーケンシング(米国特許出願公開第2013/0244340号明細書、第2013/
0264207号明細書、第2014/0134616号明細書、第2015/0119259号明細書および第2015/0337366号明細書)、サンガーシーケンシング、キャピラリーアレイシーケンシング、熱サイクルシーケンシング(Searsら、Biotechniques,13:626-633(1992))、固相シーケンシング(Zimmermanら、Methods Mol.Cell Biol.,3:39-42(1992))、マトリックス支援レーザー脱離/イオン化飛行時間型質量分析(MALDI-TOF/MS;Fuら、Nature Biotech.,16:381-384(1998))などの質量分析によるシーケンシング、ハイブリダイゼーションによるシーケンシング(Drmanacら、Nature Biotech.,16:54-58(1998)、限定されないが、合成によるシーケンシング(例えば、HiSeq(商標)、MiSeq(商標)、またはGenome Analyzer、それぞれIlluminaより入手可能)を含むNGS法、ライゲーションによるシーケンシング(例えば、SOLiD(商標)、Life Technologies)、イオン半導体シーケンシング(例えば、Ion Torrent(商標)、Life Technologies)、およびSMRT(登録商標)シーケンシング(例えば、Pacific Biosciences)を含む。
【0029】
市販のシーケンシング技術は、Affymetrix Inc.(カリフォルニア州サニーベール)のハイブリダイゼーションによるシーケンシングプラットフォーム、Illumina/Solexa(カリフォルニア州サンディエゴ)およびHelicos Biosciences(マサチューセッツ州ケンブリッジ)の合成によるシーケンシングプラットフォーム、Applied Biosystems(カリフォルニア州フォスターシティ)のライゲーションによるシーケンシングプラットフォームを含む。他のシーケンシング技術は、限定されないが、Ion Torrent技術(ThermoFisher Scientific)、およびナノポアシーケンシング(カリフォルニア州サンタクララのRoche Sequencing SolutionsのGenia Technology)およびOxford Nanopore Technologies(英国オックスフォード)を含む。
【0030】
II.アルゴリズムを実装するための例示的なコンピュータシステム
本明細書に記載のアルゴリズムは、コンピュータシステム上に実装されることができる。例えば、
図1は、本発明の1つ以上の態様を実装するように構成されたコンピュータシステム100の一実施形態を示すブロック図である。図示のように、コンピュータシステム100は、限定されないが、メモリブリッジ105および通信経路113を介して並列処理サブシステム112に結合された中央処理装置(CPU)102およびシステムメモリ104を含む。メモリブリッジ105は、通信経路106を介してI/O(入力/出力)ブリッジ107にさらに結合され、I/Oブリッジ107は、スイッチ116に結合される。
【0031】
動作中、I/Oブリッジ107は、入力装置108(例えば、キーボード、マウス、ビデオ/画像キャプチャ装置など)からユーザ入力情報を受信し、通信経路106およびメモリブリッジ105を介して処理するために入力情報をCPU102に転送するように構成される。いくつかの実施形態では、入力情報は、物体検出動作が実行されるデジタル記憶媒体に記憶されたカメラ/画像キャプチャ装置からのライブフィードまたはビデオデータである。スイッチ116は、I/Oブリッジ107と、ネットワークアダプタ118ならびに様々なアドインカード120および121などのコンピュータシステム100の他の構成要素との間の接続を提供するように構成される。
【0032】
同様に示されるように、I/Oブリッジ107は、CPU102および並列処理サブシステム112によって使用されるコンテンツおよびアプリケーションおよびデータを記憶
するように構成され得るシステムディスク114に結合される。一般的な問題として、システムディスク114は、アプリケーションおよびデータのための不揮発性記憶装置を提供し、固定または取り外し可能なハードディスクドライブ、フラッシュメモリ装置、およびCD-ROM(コンパクトディスク読み出し専用メモリ)、DVD-ROM(デジタル多用途ディスク-ROM)、ブルーレイ、HD-DVD(高精細DVD)、または他の磁気、光学、もしくは固体記憶装置を含むことができる。最後に、明示的に示されていないが、ユニバーサルシリアルバスまたは他のポート接続、コンパクトディスクドライブ、デジタル多用途ディスクドライブ、フィルム記録装置などの他の構成要素もI/Oブリッジ107に接続され得る。
【0033】
様々な実施形態では、メモリブリッジ105は、ノースブリッジチップであってもよく、I/Oブリッジ107は、サウスブリッジチップであってもよい。さらに、通信経路106および113、ならびにコンピュータシステム100内の他の通信経路は、限定されないが、AGP(Accelerated Graphics Port)、HyperTransport、または当該技術分野で知られている任意の他のバスもしくはポイントツーポイント通信プロトコルを含む、任意の技術的に適切なプロトコルを使用して実装されてもよい。
【0034】
いくつかの実施形態では、並列処理サブシステム112は、任意の従来の陰極線管、液晶ディスプレイ、発光ダイオードディスプレイなどとすることができる表示装置110に画素を供給するグラフィックスサブシステムを含む。そのような実施形態では、並列処理サブシステム112は、例えばビデオ出力回路を含む、グラフィックおよびビデオ処理に最適化された回路を組み込む。そのような回路は、並列処理サブシステム112内に含まれる1つ以上の並列処理ユニット(PPU)にわたって組み込まれてもよい。他の実施形態では、並列処理サブシステム112は、汎用および/または計算処理に最適化された回路を組み込む。同様に、そのような回路は、そのような汎用および/または計算動作を実行するように構成された並列処理サブシステム112内に含まれる1つ以上のPPUにわたって組み込まれてもよい。さらに他の実施形態では、並列処理サブシステム112内に含まれる1つ以上のPPUは、グラフィックス処理、汎用処理、および計算処理動作を実行するように構成されてもよい。システムメモリ104は、並列処理サブシステム112内の1つ以上のPPUの処理動作を管理するように構成された少なくとも1つのデバイスドライバ103を含む。システムメモリ104はまた、CPU102上で実行され、PPUの動作を制御するコマンドを発行することができるソフトウェアアプリケーション125を含む。
【0035】
様々な実施形態では、並列処理サブシステム112は、
図1の1つ以上の他の要素と統合されて単一のシステムを形成してもよい。例えば、並列処理サブシステム112は、単一チップ上のCPU102および他の接続回路と統合されて、システムオンチップ(SoC)を形成することができる。
【0036】
本明細書に示されるシステムは例示的なものであり、変形および変更が可能であることが理解されよう。ブリッジの数および配置、CPU102の数、および並列処理サブシステム112の数を含む接続トポロジは、必要に応じて変更されてもよい。例えば、いくつかの実施形態では、システムメモリ104は、メモリブリッジ105を介さずに直接CPU102に接続することができ、他の装置は、メモリブリッジ105およびCPU102を介してシステムメモリ104と通信する。他の代替的なトポロジでは、並列処理サブシステム112は、I/Oブリッジ107に、またはメモリブリッジ105ではなくCPU102に直接接続されてもよい。さらに他の実施形態では、I/Oブリッジ107およびメモリブリッジ105は、1つ以上の個別の装置として存在する代わりに、単一チップに統合されてもよい。最後に、特定の実施形態では、
図1に示す1つ以上の構成要素は存在
しなくてもよい。例えば、スイッチ116は排除することができ、ネットワークアダプタ118およびアドインカード120、121は、I/Oブリッジ107に直接接続する。
【0037】
III.汚染検出
いくつかの実施形態では、サンプル汚染は、以下によって検出されることができる:(1)特定のバリアントベースのアッセイのための共通の一塩基バリアント(SNV)のセットを識別すること、(2)識別された共通のSNVのセットに対する代替対立遺伝子頻度を計算すること、(3)局所外れ値因子(LOF)を有する外れ値部位(例えば、シーケンシングエラーおよび体細胞変異)を除去すること、(4)代替対立遺伝子頻度にクラスタリングモデル(すなわち、ベータ混合モデル)を当てはめて、背景サンプルおよび前景汚染をモデル化すること、および(5)当てはめられたクラスタリングモデルから汚染レベルの点推定値を推論し、非パラメトリックブートストラップから信頼区間を取得すること。
【0038】
本明細書に記載の結果は、ベータ混合モデルを使用しているが、他のクラスタリングモデルも同様に使用されることができる。例えば、接続性モデル、セントロイドモデル、分布モデル(すなわち、混合モデル)、部分空間モデル、群モデル、グラフベースモデル、署名グラフモデル、およびニューラルモデルもまた使用されることができる。
【0039】
ヒトは二倍体であることから、純粋な汚染されていないサンプルにおける代替対立遺伝子頻度は、以下の3つのレベル付近に集中する傾向がある:
図2Aおよび
図2Bに示すように、0.0(AA)、0.5(Aa)、1.0(aa)。標的被験者からのサンプルが非標的被験者からのサンプルによって汚染されている場合(すなわち、汚染物質被験者)、汚染被験者からのAaおよびaa SNVは、0.0の予想レベルを有するAA遺伝子座について標的被験者の代替対立遺伝子頻度を0よりも上にシフトさせる。要するに、0からのこれらの偏差は、汚染を検出することを可能にする。
【0040】
いくつかの実施形態では、
図3A~
図3Cおよび
図4A~
図4Dに示すように、汚染されたサンプルから純粋な汚染されていないサンプルを識別するために、低範囲の代替対立遺伝子頻度(すなわち、約25、20、15、10、または5%未満)が分析されることができる。
図3A~
図3Cは、純粋なサンプルに対する低範囲の代替対立遺伝子頻度における頻度分布を示している。
図3A~
図3Cに見られるように、低頻度範囲のごく僅かなSNVしか純粋なサンプルの予想される0.0値から逸脱していない。対照的に、汚染されたサンプルについて
図4A~
図4Dに示すように、低頻度範囲のSNVは、予想される0.0値から著しく多く逸脱している。
【0041】
他の実施形態では、高範囲の代替対立遺伝子頻度(すなわち、約75%、80%、85%、90%、または95%よりも大きい)が分析されることができる。他の実施形態では、中間範囲の代替対立遺伝子頻度(すなわち、約25%から75%、30%から70%、35%から65%、40%から60%、または45%から55%)が分析されることができる。他の実施形態では、汚染されたサンプルから純粋な汚染されていないサンプルを識別するために、低範囲、中間範囲、および高範囲の代替対立遺伝子頻度の任意の組み合わせが分析されることができる。換言すれば、いくつかの実施形態では、0から100%の全頻度範囲、または全頻度範囲の任意の部分または部分の組み合わせが使用されることができる。
【0042】
モデルを構築するために、本発明者らは、1000個のゲノムプロジェクト(TGP)データを使用して、0.5%を超えるが99.5%未満の集団代替対立遺伝子頻度を有する共通のSNVを識別および選択した。その結果、本発明者らは、Targeted,Expanded and Surveillance Avenio(登録商標) ct
DNA分析キット液体生検パネル内の285、868、および707個の共通のSNVを選択した。625人の関連する被験者がモデルのTGPから選択され、その選択は、以下の米国人口を反映するように行われた:白人(68.2%)、ヒスパニックまたはラテン系人(15.4%)、黒人(11.9%)、およびアジア人(4.5%)。他の実施形態では、モデルのために選択された人口は、国、州、郡、省、地域、大陸などの人口を表すことができる。選択のために考慮される要因は、例えば、人種、民族、性別、年齢、および/または場所を含むことができる。いくつかの実施形態では、モデルに対して少なくとも100、200、300、400、500、600、700、800、900、または1000個のSNVが選択される。いくつかの実施形態では、モデルに対して最大100、200、300、400、500、600、700、800、900、または1000個のSNVが選択される。いくつかの実施形態では、より多くの遺伝子をカバーするより多くのシーケンシングデータを提供するより大きなパネルは、モデルに対して選択されることができるより多くのSNVをもたらす。いくつかの実施形態では、パネルは、少なくとも5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、または1000個の遺伝子をカバーする。いくつかの実施形態では、パネルは、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、または1000個までの遺伝子をカバーする。いくつかの実施形態では、より大きなパネルは、SNVの選択基準を厳しくすることを可能にする。例えば、5から95%、10から90%、15から85%、20から80%、25から75%、30から70%、35から65%、40から60%、または45から55%の集団代替対立遺伝子頻度を有する共通のSNVがモデルのために選択され、十分な数のSNVをもたらすことができる。いくつかの実施形態では、集団代替頻度範囲は、パネルのサイズに基づいて決定されることができる。
【0043】
いくつかの実施形態では、本方法は、有益な遺伝子座をモデル化するために、液体生検サンプルにおいて検出されたより低範囲の代替対立遺伝子頻度(≦25%)を使用する。ランダムな標的被験者およびランダムな汚染被験者が選択された各パネルの10,000のシミュレーションに基づいて、本発明者らは、平均して、3つのパネルのそれぞれを使用して処理された単一の汚染源を有するサンプルにおいて21個(標的キット)、70個(拡張キット)、および54個(監視キット)の有益なSNVを予想することを示している。5A~
図5Cは、標的キットパネルのシミュレーションの結果を示している。
図5D~
図5Fは、拡張キットパネルのシミュレーションの結果を示している。
図5G~
図5Iは、監視キットパネルのシミュレーションの結果を示している。いくつかの実施形態では、単一の汚染源を有するサンプルにおける分析のために選択されたSNVの総数のうち、少なくとも5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、または100個の有益なSNVが存在する。
【0044】
次いで、本発明者らは、有益なSNVの代替対立遺伝子頻度を判定し、汚染検出のために3成分ベータ混合モデルを使用してそれらをモデル化する。一般的なベータ混合モデル確率密度関数は、以下の形式を有する:
【0045】
f(x|π1,π2,α0,β0,α1,β1,α2,β2)=(1-π1-π2)Beta(x|α0,β0)+π1Beta(x|α1,β1)+π2Beta(x|α2,β2)
【0046】
低代替対立遺伝子頻度範囲のヒストグラムプロットは、純粋なサンプルについては0.0(図示せず)に単一のピークのみを有するが、汚染されたサンプルは、単一の汚染源を
仮定すると、
図6に示すように、0.0(AA)のピークを含む2から3つのピークを有することになる。SNVが独立しており、ただ1つの汚染源であると仮定すると、モデルは、合計で以下の3つのベータ成分を有することになる:(1)背景AA+汚染(AA)、(2)背景AA+汚染Aa、および(3)背景AA+汚染aa。
【0047】
各SNVは独立しており、各SNVは同じ深度(N、選択された部位にわたる平均シーケンシング深度として計算される)でシーケンシングされ、1つの汚染源しか存在しないと仮定する。したがって、以下の簡略化が使用されて、モデル内のパラメータの数を減らすことができる:(1)
図6に0.0の代替対立遺伝子頻度(すなわち、汚染AAを伴う背景AA)において示される第1のベータ成分は、α
0=1、β
0=10
4によって直接パラメータ化される。本発明者らは、ディラックデルタ分布の代理として、鋭いスパイク(β
0=10
4)を有する厳密に減少する分布(α
0=1)を予想するが、シーケンシング誤差も可能にする。(2)第2のベータ成分は、背景AAおよび汚染Aaに対応する。この成分に属する各SNVについて予想される代替対立遺伝子の数は、α
1としてパラメータ化され、部位あたりの対立遺伝子の総数は、選択された全てのSNPの平均カバレッジ深度Nに設定される。各SNVは、同じ深度でシーケンシングされる。同様に、α
1+β
1=α
2+β
2=Nであり、Nは、サンプルごとに選択された全てのSNVにわたる平均カバレッジ深度として計算される。(3)第3のベータ成分は、背景AAおよび汚染aaに対応する。aaは、2つの代替対立遺伝子を有するため、この成分に属する各SNPについて予想される代替対立遺伝子の数は2α
1であり、部位あたりの対立遺伝子の総数は、Nのままである。最尤推定が使用されて、ベータ混合モデルを代替対立遺伝子頻度に当てはめる。換言すれば、ホモ接合汚染分布(aa)の中心は、ヘテロ接合汚染分布(Aa)の中心の2倍であり、または2つの代替対立遺伝子のためにα
2=2
1である。
【0048】
上記の簡略化により、自由パラメータの数は、8から3に減少し、一般的なベータ混合モデルは、以下の式に簡略化される:
【0049】
f(x|π1,π2,α1)=(1-π1-π2)Beta(x|1,104)+π1Beta(x|α1,N-α1)+π2Beta(x|2α1,N-2α1)f(x|π1,π2,α1)=(1-π1-π2)Beta(x|1,104)+π1Beta(x|α1,N-α1)+π2Beta(x|2α1,N-2α1)
【0050】
尤度関数
【数1】
が使用されて、準ニュートン法(すなわち、束縛制約を有する限られたメモリのブロイデン・フレッチャー・ゴールドファーブ・シャンノアルゴリズム)を使用して、最大尤度を有するベータ混合モデルのパラメータπ
1、π
2、α
1を推定または決定することができる。複数の初期化が使用されて、極大値を回避することができる。
【0051】
最尤推定方法は、外れ値(例えば、シーケンシングエラーおよび体細胞変異)に敏感であるため、本発明者らは、モデル当てはめの前に局所外れ値因子(LOF)を使用して外れ値を除去し、汚染レベルのより堅牢な推定をもたらす。LOFは、そのk個の最近傍と比較した点の局所密度(lrd)を測定する。
【0052】
【0053】
LOF>1は、点Aの局所密度がその近傍の平均局所密度よりも小さく、Aが潜在的に外れ値であることを示すことを意味する。本発明者らは、k=5およびLOFのカットオフ=3を使用する。
【0054】
いくつかの実施形態では、外れ値検出の他の方法が可能である。例えば、いくつかの実施形態では、外れ値検出方法は、単変量または多変量とすることができる。いくつかの実施形態では、外れ値検出方法は、パラメトリックまたは非パラメトリックとすることができる。いくつかの実施形態では、外れ値検出方法は、zスコアまたは極値解析(パラメトリック)、確率的および統計的モデリング(パラメトリック)、線形回帰モデル、近接ベースモデル、情報理論モデル、高次元外れ値検出方法、ニューラルネットワーク、ベイジアンネットワーク、隠れマルコフモデル、ファジー論理ベース方法、および/またはアンサンブル技術とすることができる。
【0055】
次いで、汚染レベルの点推定値は、2α
1/N(すなわち、第3のベータ成分の平均、ホモ接合汚染分布aa)と推定される。
図7Aは、この例では、指定された汚染レベル(0.5%)が予測された汚染レベル(0.54%)と一致することを示している。汚染レベルの信頼区間は、SNV部位(すなわち、非パラメトリックブートストラップ)およびそれらの対応する代替対立遺伝子頻度をブートストラップすることによって構築される。
図7Bは、1000個のブートストラップによって、この例の汚染レベルの90%信頼区間が(0.49%,0.63%)であることを示している。シーケンシングエラーが存在する場合、本発明者らの方法の検出の理論的限界は、少なくとも2/N(または部位あたり最大1つのシーケンシングエラーの場合、α
1=1)である。この限界は、部位あたりのシーケンシングエラーの数が大きくなると大きくなる(すなわち、シーケンシング誤り率がより大きくなる)。より保守的で偽陽性の結果を少なくするために、本発明者らは、4/Nよりも大きい予測汚染レベルのみを報告する。いくつかの実施形態では、少なくとも100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、または10000個のブートストラップが信頼区間を生成するために使用される。
【0056】
TGPからの30,000個のインシリコ合成サンプルの包括的シミュレーション研究は、シーケンシング深度が増加するにつれて方法の性能が増加し、拡張Avenioキットからの深くシーケンシングされたサンプルについて、それぞれ0.02%および0.09%という低い偽陽性率および検出限界を達成することを実証している(表1)。標的個体および汚染個体(1つの汚染源)は、ここでも1000個のゲノムプロジェクトからの選択された集団からのサンプルである。本発明者らは、二項分布を有する各SNVの代替対立遺伝子の数(n)を合成する。
【0057】
【0058】
ここで、Nは、全ての部位の平均シーケンシング深度であり、pは、汚染レベルおよび
特定の部位に基づく理論的な代替対立遺伝子頻度である。p=0または1について、本発明者らは、シーケンシングエラーを説明するために、p=2×10-5または1-2×10-5に調整する。次いで、各部位の代替対立遺伝子頻度が計算される。より一般的には、シーケンシングエラーを説明するために、pは、システムの予想されるシーケンシングエラーの大きさに対応する量だけ調整されることができる。いくつかの実施形態では、これは、コンセンサスシーケンシングエラーとすることができる。
【0059】
いくつかの実施形態では、シーケンシング深度カバレッジは、25x未満、50x未満、75x未満、100x未満、200x未満、300x未満、400x未満、500x未満、600x未満、700x未満、800x未満、900x未満、1000x未満、2000x未満、3000x未満、4000x未満、5000x未満、6000x未満、7000x未満、8000x未満、9000x未満、または10000x未満である。いくつかの実施形態では、カバレッジは、少なくとも25x、50x、75x、100x、200x、300x、400x、500x、600x、700x、800x、900x、1000x、2000x、3000x、4000x、5000x、6000x、7000x、8000x、9000x、または10000xである。
【0060】
いくつかの実施形態では、合成データは、0から50%の汚染の間の様々な汚染レベルのサンプルを含む。50%を超える汚染では、背景汚染が前景になるため、50%を超える汚染レベルをシミュレートする必要はない。いくつかの実施形態では、シミュレートされた汚染レベルは、50%、40%、30%、20%、10%、5%、4%、3%、2%、または1%未満である。
図8Aは、典型的なカバレッジ深度にシーケンシングされた単一の汚染源を有する1000個の合成サンプルからの性能を示している。
【0061】
汚染レベルが低い場合(すなわち、1%未満)、
図8B~
図8Fに示すように、シーケンシングカバレッジが約2000x未満になると性能が低下し始める。
図8B~
図8Fは、低い汚染レベル(1%未満の汚染)における10,000個のサンプルのシーケンシングカバレッジを増加させる効果を示している。
【0062】
複数の汚染源の場合、モデルの1つの仮定(すなわち、1つの汚染源)に違反しているが、本方法は、予測される汚染レベルよりも低い汚染サンプルにさらにフラグを立てることができる。複数の汚染源に対する本方法の性能を評価するために、5つの汚染源を有する1000個の合成サンプルデータが生成され、各汚染源からの汚染レベルがランダム化され、5つの汚染源からの総汚染レベルを合計0から50%とした。
図9Aは、典型的なカバレッジ深度にシーケンシングされた5つの汚染源を有する方法の性能を示している。
図9B~
図9Fは、5つの汚染源の汚染の合計が1%未満である10000個の合成サンプルに対するシーケンシング深度の変化の効果を示している。ここでも、シーケンシングカバレッジが2000x未満になると、性能が低下し始める。
【0063】
本発明者らの提案する方法は、サンノゼのCLIA labの拡張Avenioキットを使用して処理した103個のインビトロスパイク血漿サンプル(1つの汚染源、0~8%の汚染レベル)によってさらに評価される。予測された汚染レベルは、
図10に示すように、0.94のピアソン相関係数を有する指定された汚染レベルによく対応する。
【0064】
【表1】
拡張Avenioキットのための30,000個のインシリコ合成データに対するサンプル汚染のための提案された方法の性能。FPR-偽陽性率、LOD-検出限界、CI-クロッパー・ピアソンの正確な信頼区間。LODは、99.9%の検出率でプロビット回帰を用いて判定された。
【0065】
本明細書に記載の統計的方法は、シーケンシングパネル内の多数の部位について代替対立遺伝子頻度を生成する任意のパイプライン内に統合されることができる。これは、汚染されたサンプルの適切な取り扱いを特定して可能にするのに役立ち、分析結果の信頼性を大幅に高める。
【0066】
IV.処置方法
いくつかの実施形態では、本明細書に記載のシステムおよび方法が使用されて、サンプル汚染からのバリアントに基づくのではなく、バリアントの正確な識別に基づいて患者の処置を導くことができる。例えば、がん薬物の投与などのがん治療は、識別されたバリアントに基づいて選択されることができる。いくつかの実施形態では、バリアントがサンプル汚染に由来するかまたは潜在的に由来すると識別されているため、特定の処置が除外されることができる。いくつかの実施形態では、サンプル汚染が検出されたときに患者が再検査され(すなわち、サンプルが再シーケンシングされる)、サンプルが汚染されていないことを再検査および/または確認した後にのみ適切な治療が選択されて与えられる。
【0067】
特徴または要素が本明細書で別の特徴または要素「上」にあると言及される場合、それは、他の特徴または要素上に直接存在することができ、または介在する特徴および/または要素も存在してもよい。対照的に、特徴または要素が別の特徴または要素に「直接」あると言及される場合、介在する特徴または要素は存在しない。特徴または要素が別の特徴または要素に「接続され」、「取り付けられ」または「結合され」と言及される場合、それは他の特徴または要素に直接接続され、取り付けられ、または結合されることも可能であり、または介在する特徴または要素が存在し得ることも理解されよう。対照的に、特徴または要素が別の特徴または要素に「直接接続されている」、「直接接続されている」、または「直接結合されている」と言及される場合、介在する特徴または要素は存在しない。一実施形態に関して説明または示されているが、そのように説明または示されている特徴および要素は、他の実施形態に適用することができる。別の特徴に「隣接して」配置された構造または特徴への言及は、隣接する特徴と重複するか、またはその下にある部分を有することができることも当業者には理解されるであろう。
【0068】
本明細書に使用される用語は、特定の実施形態を説明することのみを目的としており、本発明を限定することは意図されていない。例えば、本明細書で使用される場合、単数形「a」、「an」および「the」は、文脈が明らかに他のことを示さない限り、複数形も含むことを意図している。本明細書で使用される場合、「備える(comprises)」および/または「備える(comprising)」という用語は、記載された特徴、ステップ、動作、要素、および/またはコンポーネントの存在を指定するが、1つ以上
の他の特徴、ステップ、動作、要素、構成要素、および/またはそれらのグループの存在または追加を排除するものではないことがさらに理解される。本明細書で使用される場合、「および/または」という用語は、関連するリストされた項目の1つ以上のありとあらゆる組み合わせを含み、「/」と省略されることができる。
【0069】
「下(under)」、「下(below)」、「下(lower)」、「上(over)」、「上(upper)」などのような空間的に相対的な用語は、説明を容易にするために、ある要素または特徴と別の要素または図に示されている特徴との関係を説明するために本明細書において使用されることができる。空間的に相対的な用語は、図に示されている方向に加えて、使用中または動作中の装置の異なる方向を包含することを意図していることが理解されよう。例えば、図の装置が裏返されている場合、他の要素または特徴の「下」または「下方」として記述されている要素は、他の要素または特徴の「上」になる。したがって、「下」という例示的な用語は、上と下の双方の方向を包含することができる。装置は、他の方法で方向付けられてもよく(例えば、90度回転または他の方向に)、本明細書で使用される空間的に相対的な記述子がそれに応じて解釈されてもよい。同様に、「上向き」、「下向き」、「垂直」、「水平」などの用語は、特に明記しない限り、説明の目的でのみ本明細書で使用される。
【0070】
「第1」および「第2」という用語は、本明細書では様々な特徴/要素(ステップを含む)を説明するために使用されることができるが、文脈が別段の指示をしない限り、これらの特徴/要素はこれらの用語によって制限されるべきではない。これらの用語は、ある特徴/要素を別の特徴/要素から区別するために使用される場合がある。したがって、以下に記載される第1の特徴/要素は、第2の特徴/要素と呼ぶことができ、同様に、以下に記載される第2の特徴/要素は、本発明の教示から逸脱することなく、第1の特徴/要素と呼ぶことができる。
【0071】
本明細書および以下の特許請求の範囲を通じて、文脈上別段の定めがない限り、「備える(comprise)」という単語、および「備える(comprises)」および「備える(comprising)」などの変異は、方法および物品(例えば、組成物ならびに装置および方法を含む装置)において共同で使用されることができることを意味する。例えば、用語「備える(comprising)」は、ここに記されるいずれの要素またはステップを含むことを暗示するが、いずれの他の要素またはステップを除外することを含まない、と理解される。
【0072】
実施例で使用されるものを含め、本明細書で本明細書および特許請求の範囲で使用される場合、特に明示的に指定されない限り、全ての数は、その用語が明示的に表示されない場合でも、「約」または「およそ」という単語で始まるかのように読むことができる。「約」または「およそ」という句は、大きさおよび/または位置を説明するときに使用されて、説明される値および/または位置が値および/または位置の合理的な予想範囲内にあることを示すことができる。例えば、数値は、記載された値(または値の範囲)の+/-0.1%、記載された値(または値の範囲)の+/-1%、記載された値(または値の範囲)の+/-2%、記載された値(または値の範囲)の+/-5%、記載された値(または値の範囲)の+/-10%などの値を有することができる。本明細書に示された任意の数値はまた、文脈上別段の指示がない限り、その値をほぼ含むと理解されるべきである。例えば、値「10」が開示されている場合、「約10」も開示されている。本明細書に記載されている任意の数値範囲は、そこに含まれる全てのサブ範囲を含むことを意図している。また、当業者が適切に理解するように、値が「以下」であると開示される場合、「値以上」および値間の可能な範囲も開示されることも理解される。例えば、値「X」が開示される場合、「X以下」ならびに「X以上」(例えば、Xは数値である)も開示される。また、本特許出願全体で、データは多くの様々な形式で提供され、このデータは、終了点
と開始点、およびデータポイントの任意の組み合わせの範囲を表すことも理解される。例えば、特定のデータポイント「10」および特定のデータポイント「15」が開示される場合、10および15よりも大きい、それ以上、それよりも小さい、それ以下、およびそれに等しいことが、10から15の間とともに開示されていると見なされることが理解される。2つの特定のユニット間の各ユニットもまた開示されていることも理解される。例えば、10と15が開示されている場合、11、12、13、および14も開示される。
【0073】
様々な例示的な実施形態が上に記載されているが、特許請求の範囲に記載されているように、本発明の範囲から逸脱することなく、様々な実施形態にいくつかの変更を加えることができる。例えば、記載された様々な方法ステップが実行される順序は、代替の実施形態ではしばしば変更されることがあり、他の代替の実施形態では、1つ以上の方法ステップが完全にスキップされることがある。様々な装置およびシステムの実施形態の任意の特徴は、いくつかの実施形態には含めてもよく、他の実施形態には含めなくてもよい。したがって、前述の説明は、主に例示的な目的で提供されており、特許請求の範囲に記載されているように、本発明の範囲を限定するものと解釈されるべきではない。
【0074】
本明細書に含まれる例および図は、限定ではなく例示として、主題が実施され得る特定の実施形態を示している。前述のように、他の実施形態を利用してそこから導き出すことができ、その結果、本開示の範囲から逸脱することなく、構造的および論理的な置換および変更を行うことができる。本発明の主題のそのような実施形態は、複数のものが実際に開示されている場合、単に便宜のために、そして本特許出願の範囲を任意の単一の発明または発明の概念に自発的に限定することを意図することなく、本明細書において個別にまたは集合的に「発明」という用語によって言及されることができる。したがって、特定の実施形態が本明細書で例示および説明されてきたが、同じ目的を達成するために計算された任意の構成を、示された特定の実施形態の代わりに使用することができる。本開示は、様々な実施形態のありとあらゆる適応または変形をカバーすることを意図している。上記の実施形態、および本明細書に具体的に記載されていない他の実施形態の組み合わせは、上記の説明を検討すると、当業者にとって明らかであろう。