(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-20
(54)【発明の名称】乳癌の包括的多遺伝子性リスク評価
(51)【国際特許分類】
G16H 50/30 20180101AFI20240213BHJP
【FI】
G16H50/30
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023550609
(86)(22)【出願日】2022-02-24
(85)【翻訳文提出日】2023-10-12
(86)【国際出願番号】 US2022017697
(87)【国際公開番号】W WO2022182870
(87)【国際公開日】2022-09-01
(32)【優先日】2021-02-24
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522411223
【氏名又は名称】ミリアド ジェネティクス,インコーポレーテッド
(74)【代理人】
【識別番号】110002572
【氏名又は名称】弁理士法人平木国際特許事務所
(72)【発明者】
【氏名】ヒューズ,エリシャ
(72)【発明者】
【氏名】グチン,アレクサンダー
(72)【発明者】
【氏名】ランチベリー,ジェリー
(72)【発明者】
【氏名】ワグナー,スザンヌ
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA04
(57)【要約】
本明細書において提供されるのは、目的の設計基準に基づいて複数の祖先情報SNPマーカーを選択すること、対象の遺伝子型を測定すること、形質関連SNPマーカーを得ること、ならびに複数の祖先情報SNPマーカーおよび形質関連SNPマーカーに基づいて対象の形質のリスクについての包括的多遺伝子性リスクスコアを計算することによって、対象の形質のリスクを評価する方法である。形質は癌のリスクであり得る。また、対象の祖先を評価する方法も提供される。
【選択図】
図4
【特許請求の範囲】
【請求項1】
対象の祖先を評価する方法であって、前記方法が、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、ならびに
複数の祖先情報SNPマーカーに基づいて、それぞれの異なる人種集団についての対象の遺伝子型の人種比率を計算するステップ
を含む方法。
【請求項2】
祖先情報SNPマーカーが、3つ以上の異なる人種集団で異なる頻度を有する、請求項1に記載の方法。
【請求項3】
祖先情報SNPマーカーが、アフリカ人、ヨーロッパ人、および東アジア人の人種集団で異なる頻度を有する、請求項1に記載の方法。
【請求項4】
複数の祖先情報SNPマーカーが10~50,000個のSNPマーカーである、請求項1に記載の方法。
【請求項5】
複数の祖先情報SNPマーカーが10~56個のSNPマーカーである、請求項1に記載の方法。
【請求項6】
対象において形質のリスクを評価する方法であって、前記方法が、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、
形質関連SNPマーカーを得るステップ、ならびに
複数の祖先情報SNPマーカーおよび形質関連SNPマーカーに基づいて、対象における前記形質のリスクについての包括的多遺伝子性リスクスコアを計算するステップ
を含む方法。
【請求項7】
対象の追加の臨床的変数とともに、対象における前記形質のリスクについての包括的多遺伝子性リスクスコアを計算するステップを更に含む、請求項6に記載の方法。
【請求項8】
追加の臨床的変数が、対象の年齢、個人既往歴、および家族既往歴である、請求項7に記載の方法。
【請求項9】
形質が対象の疾患のリスクである、請求項6に記載の方法。
【請求項10】
疾患が癌である、請求項9に記載の方法。
【請求項11】
複数の祖先情報SNPマーカーが10~50,000個のSNPマーカーである、請求項6に記載の方法。
【請求項12】
複数の祖先情報SNPマーカーが10~56個のSNPマーカーである、請求項6に記載の方法。
【請求項13】
形質関連SNPマーカーが、複数の癌関連SNPマーカーである、請求項6に記載の方法。
【請求項14】
形質関連SNPマーカーが、複数の10~50,000個の乳癌関連SNPマーカーである、請求項6に記載の方法。
【請求項15】
形質関連SNPマーカーが、複数の10~93個の乳癌関連SNPマーカーである、請求項6に記載の方法。
【請求項16】
対象における前記形質のリスクについての包括的多遺伝子性リスクスコアを計算するステップが、参照群の臨床データの訓練(training)とともに行われる、請求項6に記載の方法。
【請求項17】
対象における前記形質のリスクについての包括的多遺伝子性リスクスコアを計算するステップが、参照群の臨床データの検証とともに行われる、請求項6に記載の方法。
【請求項18】
対象の遺伝子型がNGSによって測定される、請求項6に記載の方法。
【請求項19】
対象の遺伝子型が配列決定チップを用いて決定される、請求項6に記載の方法。
【請求項20】
複数の祖先情報SNPマーカーが、3つ以上の異なる人種集団のそれぞれについての対象の遺伝子型の人種比率を決定する、請求項6に記載の方法。
【請求項21】
複数の祖先情報SNPマーカーが、アフリカ人、ヨーロッパ人、および東アジア人の人種集団のそれぞれについての対象の遺伝子型の人種比率を決定する、請求項6に記載の方法。
【請求項22】
対象の形質のリスクについての包括的多遺伝子性リスクスコアが、人種集団が自己申告された場合であっても、3つ以上の異なる人種集団の対象について正確である、請求項6に記載の方法。
【請求項23】
対象の形質のリスクについての包括的多遺伝子性リスクスコアが、人種集団が自己申告された場合であっても、アフリカ人、ヨーロッパ人、および東アジア人の人種集団の対象について正確である、請求項6に記載の方法。
【請求項24】
対象の形質のリスクについての包括的多遺伝子性リスクスコアが、いずれの人種集団においても形質のリスクが過大評価されないように、3つ以上の異なる人種集団の対象について較正される、請求項6に記載の方法。
【請求項25】
対象の形質のリスクについての包括的多遺伝子性リスクスコアが、いずれの人種集団においても形質のリスクが過大評価されないように、アフリカ人、ヨーロッパ人、および東アジア人の人種集団の対象について較正される、請求項6に記載の方法。
【請求項26】
対象の形質のリスクについての包括的多遺伝子性リスクスコアが、3つ以上の異なる人種集団の対象について低リスクと高リスクを判別する、請求項6に記載の方法。
【請求項27】
対象の形質のリスクについての包括的多遺伝子性リスクスコアが、アフリカ人、ヨーロッパ人、および東アジア人の人種集団の対象について低リスクと高リスクを判別する、請求項6に記載の方法。
【請求項28】
形質が対象の疾患のリスクである、請求項22~27のいずれか1項に記載の方法。
【請求項29】
疾患が癌である、請求項28に記載の方法。
【請求項30】
包括的多遺伝子性リスクスコアを計算するステップが、自己申告のアフリカ人祖先、自己申告の東アジア人祖先、および自己申告のヨーロッパ人祖先の女性の臨床コホートを用いることを含む、請求項6に記載の方法。
【請求項31】
包括的多遺伝子性リスクスコアを計算するステップが、祖先構成の比率に従って重み付けされた祖先特異的多遺伝子性リスクスコアの総和を用いることを含む、請求項6に記載の方法。
【請求項32】
包括的多遺伝子性リスクスコアが、参照コホートおよび自己申告された祖先によって定義されたサブコホートにおいて乳癌と強く関連している、請求項6に記載の方法。
【請求項33】
包括的多遺伝子性リスクスコアが、すべての祖先のすべての女性についての正確なリスク層別化のために臨床および/または生物学的リスク因子と組み合わされる、請求項6に記載の方法。
【請求項34】
包括的多遺伝子性リスクスコアを計算するステップが、式IIIに従ったリスク対立遺伝子の線形結合を含み、
【数1】
式中、Nは選択されたSNPの総数であり;
係数b
kは、発症コホートから推定されるk番目のSNPの形質関連についての対立遺伝子ごとのlog ORであり;
x
kは、0、1または2である個々の患者が保有するk番目のSNPの対立遺伝子の数であり;
u
kは、大規模な一般集団研究に含まれる個人について報告されたk番目のSNPの平均対立遺伝子の数である、請求項6に記載の方法。
【請求項35】
処置を必要とする対象において疾患を処置する方法であって、その方法が、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、
疾患関連SNPマーカーを得るステップ、ならびに
複数の祖先情報SNPマーカーおよび疾患関連SNPマーカーに基づいて、対象の疾患のリスクについての包括的多遺伝子性リスクスコアを計算し、そこでスコアが対象を処置する必要性を示すステップ、ならびに
対象に疾患の治療を施すステップ
を含む方法。
【請求項36】
年齢、個人既往歴、および家族既往歴に関する追加の変数とともに包括的多遺伝子性リスクスコアを計算するステップを更に含む、請求項35に記載の方法。
【請求項37】
疾患が癌である、請求項35に記載の方法。
【請求項38】
治療が、外科手術、冷凍アブレーション、放射線療法、骨髄移植、化学療法、免疫療法、ホルモン療法、幹細胞療法、薬物療法、生物学的治療、および医薬、予防的または治療的化合物の投与のうちの1つ以上から選択される癌治療である、請求項37に記載の方法。
【請求項39】
疾患が乳癌である、請求項37に記載の方法。
【請求項40】
治療が乳癌治療である、請求項39に記載の方法。
【請求項41】
疾患を有する対象を診断または予後診断する方法であって、その方法が、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、
疾患関連SNPマーカーを得るステップ、ならびに
複数の祖先情報SNPマーカーおよび疾患関連SNPマーカーに基づいて、対象のその疾患のリスクについての包括的多遺伝子性リスクスコアを計算し、そこでスコアが対象の診断または予後を示すステップ
を含む方法。
【請求項42】
疾患が癌である、請求項41に記載の方法。
【請求項43】
対象の形質を評価するためのデータを生成する方法であって、その方法が、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、
対象の遺伝子型での形質関連SNPマーカーを測定するステップ
を含む方法。
【請求項44】
対象の追加の臨床的変数の決定を更に含む、請求項43に記載の方法。
【請求項45】
追加の臨床的変数が、対象の年齢、個人既往歴、家族既往歴である、請求項44に記載の方法。
【請求項46】
形質が対象の疾患のリスクである、請求項43に記載の方法。
【請求項47】
疾患が癌である、請求項46に記載の方法。
【請求項48】
複数の祖先情報SNPマーカーが10~50,000個のSNPマーカーである、請求項43に記載の方法。
【請求項49】
複数の祖先情報SNPマーカーが10~56個のSNPマーカーである、請求項43に記載の方法。
【請求項50】
形質関連SNPマーカーが、複数の癌関連SNPマーカーである、請求項43に記載の方法。
【請求項51】
形質関連SNPマーカーが、複数の10~50,000個の乳癌関連SNPマーカーである、請求項43に記載の方法。
【請求項52】
形質関連SNPマーカーが、複数の10~93個の乳癌関連SNPマーカーである、請求項43に記載の方法。
【請求項53】
対象の疾患のリスクを評価するシステムであって、そのシステムが、
対象の遺伝子型を受信するためのプロセッサ;
複数の祖先情報SNPマーカー、その遺伝子型の複数の疾患関連SNPマーカー、ならびに年齢、個人既往歴、および家族既往歴についての追加の変数に基づいて、対象の疾患のリスクについての包括的多遺伝子性リスクスコアを計算するステップを実行するための1つ以上のプロセッサ;ならびに
リスクスコアを表示および/または報告するためのディスプレイ
を含むシステム。
【請求項54】
疾患が癌である、請求項53に記載のシステム。
【請求項55】
プロセッサに対象の疾患のリスクを評価する方法のステップを実行させる、プロセッサによる実行のための命令をその中に記録している非一時的な機械可読記録媒体であって、その方法が、
対象の遺伝子型を受信するステップ;
複数の祖先情報SNPマーカー、その遺伝子型の複数の疾患関連SNPマーカー、ならびに年齢、個人既往歴、および家族既往歴についての追加の変数に基づいて、対象の疾患のリスクについての包括的多遺伝子性リスクスコアを計算するステップ;ならびに
リスクスコアを表示および/または報告するためのプロセッサ出力に送信するステップ
を含む非一時的な機械可読記憶媒体。
【請求項56】
疾患が癌である、請求項55に記載の媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年2月24日に出願された米国仮特許出願第63/153,231号に対する優先権の利益を主張するものであり、その内容全体は、参照により本明細書に組み入れられる。
【0002】
技術分野
本発明は、遺伝学および医学の分野に関する。より詳細には、本発明は、多遺伝子性形質および医薬用途で乳癌リスクを評価および予測する方法、ならびに乳癌を処置する方法に関する。
【背景技術】
【0003】
ポリゲノミック(polygenomic)リスクスコアを使用して、特定の疾患のリスクのような対象の臨床形質または症状の見込みを評価することが所望される。ゲノムデータ由来のリスクスコアは、用いられるべき多型遺伝子座の同定に依存している。
【0004】
例えば乳癌リスクについての形質予想のための従来の方法は、様々な乳癌関連遺伝子を同定してきた。しかし、乳癌関連遺伝子の生殖細胞系列病的バリアントは、従来の方法の正確性および予測力を低下させる複雑さをもたらす。また、従来の方法は、単一人種由来のゲノムデータに頼っている可能性がある。
【0005】
ゲノムデータから形質のリスクを特徴付ける従来の方法の重大な欠点は、1つの特定の集団での形質の基準データが、異なる人種の異なる集団での同一の形質を正確に予測しない可能性があることである。1つの人種から選ばれた集団に由来するゲノムデータを用いた従来の方法は、異なる集団での特定の形質のリスクを過大評価し得る。リスクの過大評価は、特に疾患形質では重大な欠点である。
【0006】
癌のリスクなどの形質を決定するための従来の方法の別の欠点は、ゲノムデータを用いた計算がしばしば自己申告の人種情報に依存しているという問題を含む。ゲノムデータ中の自己申告の人種情報の誤りは、包括的な集団の癌リスクの適切な決定を妨げ得る。
【0007】
形質のリスクを決定するための従来の方法の重大な欠点は、異なる集団での形質の低リスクと高リスクの判別の欠如である。例えば、1つの人種由来のゲノムデータに基づく乳癌リスクに対する従来の方法は、異なる人種の集団での低リスクと高リスクを判別することができないかもしれない。この従来の方法の欠点は、疾患形質の予防および処置戦略を混乱させ、患者の転帰(outcome)を脅かし得る。
【0008】
ポリゲノミックリスクスコアの従来の方法は、ゲノムワイド関連解析(GWAS)を通して発見されたSNPに依存しうる。しかし、このようなSNPは通常原因ではなく、原因となるバリアントとの連鎖不平衡(LD)でありうる。必要なのは、すべての人種グループおよび集団についてリスクを判別するポリゲノミックリスク推定のための一組のSNPである。集団によって計算を偏らせず、すべての人種グループおよび集団について正確な結果を提供するポリゲノミックリスク推定のための一組のSNPマーカーを得ることもまた、所望される。
【0009】
必要とされるのは、例えば乳癌リスクなどの形質のための多遺伝子性リスクスコアを決定し、過大評価を防ぐための高度に較正された正確な方法である。すべての人種集団に有用であり、自己申告の患者データに関わらない、このような方法の必要性がある。有益な臨床リスクアルゴリズムは、医療および患者の処置を改善し得る。
【0010】
人種に関わらずすべての集団でリスクレベルの良好な判別を有する、乳癌リスクなどの形質を評価する方法の差し迫った必要性がある。医療現場に効率的に提供され得る方法の必要性がある。
【発明の概要】
【0011】
本発明は、例えば乳癌のリスクのような、多遺伝子性形質を決定する方法を提供する。本発明の方法は、医学、ならびにリスクが同定および/または評価される疾患の処置に使用され得る。
【0012】
いくつかの態様では、本発明の方法は、乳癌患者において臨床リスクの優れた予測を提供しうる。本発明の方法は、すべての人種グループのすべての患者に包括的に適用可能な乳癌の多遺伝子性リスク予測を提供し得る。
【0013】
本発明の包括的ポリゲノミックリスクスコアは、癌などの臨床形質または症状の見込みを評価するために使用され得る。
【0014】
本発明の態様は、1つの特定の人種または集団における形質について得られたゲノムデータから、個人の形質のリスクを特徴付けることができ、そこでは個人は異なる人種または集団であってもよい。本発明の実施形態は、その個人とは異なる人種から選出された集団由来のゲノムデータを用いて、その個人の形質のリスクを過大評価することなく、ある個人の形質についての包括的ポリゲノミックリスクスコアを提供し得る。
【0015】
更なる態様では、本発明は、人種情報を自己申告する個人のゲノムデータを用いて癌リスクなどの形質を正確に決定することを企図する。本発明の包括的多遺伝子性リスクスコアは、自己申告された人種情報のあらゆる誤りに関わらず、全世界の集団について癌リスクを正確に決定するために使用され得る。
【0016】
追加の態様では、本発明は、異なる集団において形質の低リスクと高リスクの十分な判別を伴って、形質のリスクを決定する方法を提供する。
【0017】
いくつかの実施形態では、本発明は、任意の人種の集団または個人について低リスクと高リスクを判別することができる包括的多遺伝子性リスクスコアに基づく、乳癌リスクのための方法を含む。本開示の方法は、疾患形質の予防および処置戦略を提供し、患者の転帰を改善することができる。
【0018】
更なる実施形態では、本発明は、過大評価を防ぐ乳癌リスクなどの形質のための包括的多遺伝子性リスクスコアを決定する、高度に較正された正確な方法を提供する。本開示の方法は、自己申告された患者データに関わらずすべての人種集団に有用であり得、医療および患者の処置を改善し得る。
【0019】
追加の実施形態では、本発明は、人種に関わらずすべての集団についてリスクレベルの判別の改善を伴う、乳癌リスクなどの形質を評価する方法を提供する。本開示の方法は、医療現場に効率的に提供され得る。
【0020】
本開示の方法は、様々な形質リスクマーカーの使用を更に企図し、そのマーカーは一塩基多型(SNP)でありうる。本開示のSNPは、1つ以上の異なる人種グループにおいて乳癌リスクと関連しうる。SNPの組合せは、包括的多遺伝子性リスクスコア(gPRS)を提供するために使用でき、それは、疾患の家族歴の有無に関わらず、病気を持たない患者を乳癌リスクについて層別化することができる。
【0021】
本発明の態様は、指定された基準を通して発見された特有の一組のSNPに依存するポリゲノミックリスクスコアリングの方法を提供する。ポリゲノミックリスク推定のためのこの特有の一組のSNPは、すべての人種グループおよび集団についてリスクを判別し得る。本明細書において開示されるポリゲノミックリスク推定のための一組のSNPマーカーは、実質的にあらゆる集団または人種グループについて偏りなく、すべての人種グループおよび集団に正確な結果を提供する。
【0022】
追加のマーカーまたは要素の種類には、年齢、家族歴、乳房密度、およびホルモン曝露が含まれ得る。
【0023】
特定の態様では、本発明の臨床的有用性は、すべての祖先の乳癌患者についての臨床リスクの優れた予測を含みうる。
【0024】
本発明の方法によって得られる包括的多遺伝子性スコアは、乳癌リスクの決定において驚くべき正確性の向上を提供し得る。
【0025】
本発明の方法は、異なる祖先についての幅広いマーカーの含み、それを評価することによって、驚くほど正確な多遺伝子性形質およびリスクの決定を提供し得る。
【0026】
本発明の実施形態は、様々なゲノムリスク遺伝子座に基づくスコアの形式で多遺伝子性形質およびリスクのレベルの決定を企図する。ゲノムリスク遺伝子座は個別に同定され定義されることができ、その結果、対象の遺伝子型決定によって正確な決定が行われ得る。
【0027】
特定の態様では、ゲノムリスク遺伝子座は乳癌のゲノムリスクマーカーを含むことができ、それは特異的に乳癌情報(breast cancer-informative)を提供し得る追加のリスクマーカーと組み合わされる。
【0028】
本発明の実施形態は、対象の祖先を評価する方法を含み、その方法は、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報(ancestry-informative)SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、ならびに
複数の祖先情報SNPマーカーに基づいて、それぞれの異なる人種集団についての対象の遺伝子型の人種比率を計算するステップを含む。祖先情報SNPマーカーは、3つ以上の異なる人種集団、例えば、アフリカ人、ヨーロッパ人、および東アジア人の人種集団などで異なる頻度を有しうる。
【0029】
複数の祖先情報SNPマーカーは、10~50,000個のSNPマーカー、または10~56個のSNPマーカーであり得る。
【0030】
対象において形質のリスクを評価する方法であって、その方法は、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、
形質関連SNPマーカーを得るステップ、ならびに
複数の祖先情報SNPマーカーおよび形質関連SNPマーカーに基づいて、対象におけるその形質のリスクについての包括的多遺伝子性リスクスコアを計算するステップを含む。対象におけるその形質のリスクについての包括的多遺伝子性リスクスコアを計算するステップは、対象の追加の臨床的変数、例えば、対象の年齢、個人既往歴、家族既往歴などとともに行われ(is done with)得る。形質は、例えば癌などの、対象の疾患のリスクであり得る。
【0031】
複数の祖先情報SNPマーカーは、10~50,000個のSNPマーカー、または10~56個のSNPマーカーであり得る。形質関連SNPマーカーは、複数の癌関連SNPマーカーであり得る。形質関連SNPマーカーは、複数の10~50,000個の乳癌関連SNPマーカー、または10~93個の乳癌関連SNPマーカーでありうる。
【0032】
上記の方法では、対象における形質のリスクについての包括的多遺伝子性リスクスコアを計算するステップは、参照群の臨床データの訓練(training)とともに、または参照群の臨床データの検証とともに行われ得る。対象の遺伝子型は、NGSによって、または配列決定チップを用いて測定され得る。
【0033】
上記の方法では、複数の祖先情報SNPマーカーは、3つ以上の異なる人種集団、例えば、アフリカ人、ヨーロッパ人、および東アジア人の人種集団などのそれぞれについての対象の遺伝子型の人種比率を決定し得る。
【0034】
上記の方法では、対象におけるその形質のリスクについての包括的多遺伝子性リスクスコアは、人種集団が自己申告された場合であっても、3つ以上の異なる人種集団、例えば、アフリカ人、ヨーロッパ人、および東アジア人の人種集団などの対象について正確でありうる。
【0035】
上記の方法では、対象におけるその形質のリスクについての包括的多遺伝子性リスクスコアは、例えば、アフリカ人、ヨーロッパ人、および東アジア人の人種集団などのいずれの人種集団においてもその形質のリスクが過大評価されないように、3つ以上の異なる人種集団の対象について較正され得る。
【0036】
上記の方法では、対象におけるその形質のリスクについての包括的多遺伝子性リスクスコアは、3つ以上の異なる人種集団、例えば、アフリカ人、ヨーロッパ人、および東アジア人の人種集団の対象について低リスクと高リスクを判別し得る。
【0037】
上記の方法では、形質は、対象における例えば癌などの疾患のリスクである。
【0038】
上記の方法では、包括的多遺伝子性リスクスコアの計算は、自己申告のアフリカ人祖先、自己申告の東アジア人祖先、および自己申告のヨーロッパ人祖先の女性の臨床コホートを用いることを含み得る。
【0039】
上記の方法では、包括的多遺伝子性リスクスコアの計算は、祖先構成の比率に従って重み付けされた祖先特異的多遺伝子性リスクスコアの総和を用いることを含み得る。
【0040】
上記の方法では、包括的多遺伝子性リスクスコアは、参照コホートおよび自己申告された祖先によって定義されたサブコホートにおいて、乳癌と強く関連しうる。
【0041】
上記の方法では、包括的多遺伝子性リスクスコアは、すべての祖先のすべての女性についての正確なリスク層別化のために臨床および/または生物学的リスク因子と組み合わされ得る。
【0042】
上記の方法では、包括的多遺伝子性リスクスコアの計算は、式IIIに従ったリスク対立遺伝子の線形結合を含み得る。
【0043】
【数1】
式中、Nは選択されたSNPの総数であり;
係数b
kは、発症コホート(development cohort)から推定されるk番目のSNPの形質関連についての対立遺伝子ごとのlog ORであり;
x
kは、0、1または2である個々の患者が保有するk番目のSNPの対立遺伝子の数であり;
u
kは、大規模な一般集団研究に含まれる個人について報告されたk番目のSNPの平均対立遺伝子の数である。
【0044】
本発明の実施形態は、処置を必要とする対象において疾患を処置する方法を更に企図し、その方法は、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、
疾患関連SNPマーカーを得るステップ、ならびに
複数の祖先情報SNPマーカーおよび疾患関連SNPマーカーに基づいて、対象の疾患のリスクについての包括的多遺伝子性リスクスコアを計算し、そこでスコアが対象を処置する必要性を示すステップ、ならびに
対象に疾患の治療を施すステップを含む。包括的多遺伝子性リスクスコアの計算は、年齢、個人既往歴、および家族既往歴に関する追加の変数とともに行われ得る。疾患は癌でありうる。治療は、外科手術、冷凍アブレーション、放射線療法、骨髄移植、化学療法、免疫療法、ホルモン療法、幹細胞療法、薬物療法、生物学的治療、および医薬、予防的または治療的化合物の投与のうちの1つ以上から選択される癌治療であり得る。疾患は乳癌でありうる。治療は乳癌治療であり得る。
【0045】
本発明は、疾患を有する対象を診断または予後診断する方法を含み、その方法は、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、
疾患関連SNPマーカーを得るステップ、ならびに
複数の祖先情報SNPマーカーおよび疾患関連SNPマーカーに基づいて、対象のその疾患のリスクについての包括的多遺伝子性リスクスコアを計算し、そこでスコアが対象の診断または予後を示すステップを含む。疾患は癌でありうる。
【0046】
本発明は、対象の形質を評価するためのデータを生成する方法を含み、その方法は、
下記の基準、すなわち
SNPマーカーが実質的にヒトゲノムの全体に及ぶ;
SNPマーカーがそれぞれ少なくとも1%のゲノム頻度を有する;および
SNPマーカーが異なる人種集団において異なる頻度を有する;
という基準に基づいて、複数の祖先情報SNPマーカーを選択するステップ、
対象の遺伝子型を測定するステップ、
対象の遺伝子型での形質関連SNPマーカーを測定するステップを含む。方法は、対象の追加の臨床的変数、例えば、対象の年齢、個人既往歴、家族既往歴などの決定を更に含みうる。形質は、例えば癌などの、対象の疾患のリスクであり得る。複数の祖先情報SNPマーカーは、10~50,000個のSNPマーカー、または10~56個のSNPマーカーである。形質関連SNPマーカーは、複数の癌関連SNPマーカーであり得る。形質関連SNPマーカーは、複数の10~50,000個の乳癌関連SNPマーカー、または10~93個の乳癌関連SNPマーカーでありうる。
【0047】
本発明は、対象の疾患のリスクを評価するシステムを更に含み、そのシステムは、
対象の遺伝子型を受信するためのプロセッサ;
複数の祖先情報SNPマーカー、その遺伝子型の複数の疾患関連SNPマーカー、ならびに年齢、個人既往歴、および家族既往歴についての追加の変数に基づいて、対象の疾患のリスクについての包括的多遺伝子性リスクスコアを計算するステップを実行するための1つ以上のプロセッサ;ならびに
リスクスコアを表示および/または報告するためのディスプレイを含む。疾患は癌でありうる。
【0048】
追加の実施形態は、プロセッサに対象の疾患のリスクを評価する方法のステップを実行させる、プロセッサによる実行のための命令をその中に記録している非一時的な機械可読記録媒体を含み、その方法は、
対象の遺伝子型を受信するステップ;
複数の祖先情報SNPマーカー、その遺伝子型の複数の疾患関連SNPマーカー、ならびに年齢、個人既往歴、および家族既往歴についての追加の変数に基づいて、対象の疾患のリスクについての包括的多遺伝子性リスクスコアを計算するステップ;ならびに
リスクスコアを表示および/または報告するためのプロセッサ出力に送信するステップを含む。疾患は癌でありうる。
【図面の簡単な説明】
【0049】
【
図1】
図1は、異なる大陸由来の寄与から見た祖先の図を示す。
【
図2】
図2は、ヒスパニック系、白人/非ヒスパニック系、黒人/アフリカ人、およびアジア人の遺伝子型についての祖先に基づく遺伝子型の分布の図を示す。
【
図3】
図3は、乳癌リスクについての包括的多遺伝子性リスクスコアの分布が、すべての祖先遺伝子型の患者について約0を中心としており、リスク推定から祖先由来の偏りが除去されていることを示している本発明の実施形態の図を示す。
【
図4】
図4は、乳癌リスクについての包括的多遺伝子性リスクスコアの分布が、6q25 SNP (rs140068132)を保有していないヒスパニック系の患者について約0を中心としている本発明の実施形態の図を示す。
【
図5】
図5は、異なる乳癌対立遺伝子頻度に基づいた、多遺伝子性リスクスコアの分布における祖先特異的な差異の比較を示す。
【
図6】
図6は、祖先による歴史的な乳癌罹患率の図を示す。
【発明を実施するための形態】
【0050】
発明の詳細な説明
本発明は、対象の形質を予測できる包括的多遺伝子性リスクスコアを決定する方法を含む。
【0051】
包括的多遺伝子性リスクスコアは、乳癌のリスク評価を予測し得る。
【0052】
いくつかの態様では、本発明は、対象の形質についてのリスク評価の驚くべき正確性の向上を伴う包括的多遺伝子性リスク予測の方法を提供する。
【0053】
本発明の実施形態は、すべての祖先のすべての集団に適用可能な信頼性のある乳癌リスク関連性を更に提供する。
【0054】
本開示は、臨床リスク管理、リスクの大きさの評価、および包括的多遺伝子性リスクスコア、ならびに非臨床形質予測の様々な方法を提供する。本発明の方法は、すべての祖先の集団について驚くほど正確な予測能力を提供し得る。
【0055】
本開示の態様は、疾患と関連している様々なマーカーを用いて対象の遺伝子型を決定すること、および包括的多遺伝子性リスクスコアの形で遺伝子型を組み合わせることによって、臨床症状または生物学的形質の発現の程度などの形質のリスクを予測することを含む。
【0056】
更なる実施形態では、形質についての包括的多遺伝子性リスク予測を提供するために、複数の形質リスクマーカーが使用され得る。
【0057】
複数の形質リスクマーカーは、様々な疾患関連遺伝子マーカーを含みうる。
【0058】
いくつかの実施形態では、複数の形質リスクマーカーは、1~1,000,000個のSNPマーカーを含みうる。
【0059】
特定の実施形態では、複数の形質リスクマーカーは、1~10,000個のSNPマーカー、または1~1000個のSNPマーカー、または1~100個のSNPマーカーを含みうる。複数の形質リスクマーカーは、1~1000個の乳癌SNPマーカー、またはcancer 1~500個の乳癌SNPマーカー、または1~100個の乳癌SNPマーカーでありうる。
【0060】
特定の実施形態では、複数の形質リスクマーカーは、56個のSNPマーカーから149個のSNPマーカーを含みうる。
【0061】
本発明は、例えば乳癌を含む疾患のリスクなどの、多遺伝子性形質を決定する方法を提供する。本発明の方法は、リスクがポリゲノミックスコアリングによって決定される疾患を処置するために使用され得る。
【0062】
いくつかの態様では、本発明の方法は、乳癌患者において臨床リスクの優れた予測を提供しうる。本発明の方法は、すべての人種グループのすべての患者に包括的に適用可能な、乳癌などの疾患の包括的多遺伝子性リスク予測を提供し得る。
【0063】
本発明の包括的ポリゲノミックリスクスコアは、対象において癌などの臨床形質または症状の見込みを評価するために使用され得る。
【0064】
特定の実施形態では、本発明は、1つの特定の人種グループまたは集団における形質について得られたゲノムデータから、個人の形質のリスクを計算することができ、そこでその個人は異なる人種グループまたは集団であってもよい。本発明の実施形態は、従って、その個人が属する、または自己認識している人種とは異なる人種から選出された集団由来のゲノムデータを用いて、その個人の形質のリスクを過大評価することなく、ある個人の形質についての包括的ポリゲノミックリスクスコアを提供し得る。
【0065】
更なる実施形態では、本発明は、人種情報を自己申告する個人のゲノムデータを用いて癌リスクなどの形質を正確に決定することを企図する。本発明の包括的多遺伝子性リスクスコアは、自己申告された人種情報における任意の誤りにも関わらず、任意の人種の対象について癌リスクを正確に決定するために使用され得る。
【0066】
追加の実施形態では、本発明は、対象が属する、または自己認識している人種グループまたは集団に関わらず、形質の低リスクと高リスクの十分な判別を伴って、個人の形質のリスクを決定する方法を提供する。
【0067】
いくつかの実施形態では、本発明は、驚くべきことに、任意の人種の個人について低リスクと高リスクを区別することができる、包括的多遺伝子性リスクスコアに基づく乳癌リスクのための方法を含む。
【0068】
本開示の方法は、疾患形質の予防および処置戦略を提供し、患者の転帰を改善することができる。
【0069】
更なる実施形態では、本発明は、高度に較正された正確な包括的多遺伝子性リスクスコアを提供し得る。包括的多遺伝子性リスクスコアは、過大評価を防ぐ、対象の乳癌リスクなどの形質を決定する方法において使用され得る。本開示の方法は、自己申告された患者データの使用に関わらずすべての人種グループおよび/または集団に有用であり得、医療および患者の処置を改善し得る。
【0070】
追加の実施形態では、本発明は、人種に関わらずすべての集団についてリスクレベルの判別の向上を伴う、乳癌リスクなどの形質を評価する方法を提供する。本開示の方法は、医療現場に効率的に提供され得る。
【0071】
本開示の方法は、様々な形質リスクマーカーの使用を更に企図し、そのマーカーは一塩基多型(SNP)でありうる。本開示のSNPは、1つ以上の異なる人種グループにおいて乳癌リスクと関連しうる。SNPの組合せは、包括的多遺伝子性リスクスコア(gPRS)を提供するために使用でき、それは、疾患の家族歴の有無に関わらず、病気を持たない患者を乳癌リスクについて層別化することができる。
【0072】
追加のマーカーまたは要素の種類には、年齢、家族歴、乳房密度、およびホルモン曝露が含まれ得る。
【0073】
特定の態様では、本発明の臨床的有用性は、すべての祖先の乳癌患者についての臨床リスクの優れた予測を含みうる。
【0074】
本発明の方法によって得られる包括的多遺伝子性スコアは、乳癌リスクの決定において驚くべき正確性の向上を提供し得る。
【0075】
本発明の方法は、異なる祖先についての幅広いマーカーの寄与をふくみ、それを評価することによって、驚くほど正確な多遺伝子性形質およびリスクの決定を提供し得る。
【0076】
本発明の実施形態は、様々なゲノム上のリスク遺伝子座に基づくスコアの形式で多遺伝子性形質およびリスクのレベルの決定を企図する。ゲノム上のリスク遺伝子座は個別に同定され定義されることができ、その結果、対象の遺伝子型決定によって正確な決定が行われ得る。
【0077】
特定の態様では、ゲノム上のリスク遺伝子座は乳癌のゲノムリスクマーカーを含むことができ、それは特異的に乳癌情報を提供することができる追加のリスクマーカーと組み合わされる。
【0078】
追加の実施形態では、複数の形質リスクマーカーは、1~100個の家族歴要素、または1~20個の家族歴要素、または1~10個の家族歴要素を含みうる。
【0079】
本発明の実施形態は、例えば1~100個の臨床要素、または1~20個の臨床要素、または1~10個の臨床要素のような複数の形質リスクマーカーを含みうる。
【0080】
本明細書の実施形態は、乳癌についての改善された包括的多遺伝子性リスク予測を提供し得る。
【0081】
他のリスク因子および要素と多遺伝子性SNPスコアリング法を組み合わせた総合的なリスク評価は、リスク推定の正確性を改善することができ、中程度の浸透度の遺伝子に病的バリアントを有する女性の意思決定を容易にし得る。
【0082】
更なる態様では、本発明の多遺伝子性リスクスコアは、従来の方法を用いるより、乳癌について驚くほどより正確でありうる。
【0083】
特定の態様では、包括的多遺伝子性リスクスコアと乳癌との関連性は、固定的層別化(fixed stratification)方法によって評価されうる。固定的層別化(fixed stratification)は、他の変数および要素の間で、年齢および家族歴について調整されうる。
【0084】
本発明の実施形態は、女性に正確性の向上した乳癌の推定生涯リスクを提供し得る。このようなリスク推定は、乳房の磁気共鳴画像法(MRI)の検討などの、より積極的なスクリーニングの閾値に基づく決定に情報を提供するために有用である。
【0085】
いくつかの態様では、本明細書において開示されるのは、乳癌SNPマーカーを利用して乳癌の包括的多遺伝子性リスクスコアを提供することができる方法である。
【0086】
乳癌リスクマーカーのいくつかの例は、Prediction of breast cancer risk based on profiling with common genetic variants, Mavaddatら、J Natl Cancer Inst., 2015, April 8, Vol. 107(5), djv03に示される。
【0087】
乳癌リスクマーカーのいくつかの例は、Michailidouら、Genome-wide association analysis of more than 120,000 individuals identifies 15 new susceptibility loci for breast cancer, Nat Genet., 2015, Vol. 47, pp. 373に示される。
【0088】
乳癌リスクマーカーのいくつかの例は、Characterizing Genetic Susceptibility to Breast Cancer in Women of African Ancestry, Fengら、Cancer Epidemiol Biomarkers Prev., 2017, July, Vol. 26(7), pp. 1016-1026に示される。
【0089】
乳癌リスクマーカーのいくつかの例は、Rainville, I.ら、Breast Cancer Research and Treatment, 2020, Vol. 180, pp. 503-509に示される。
【0090】
乳癌リスクマーカーのいくつかの例は、Early Diagnosis of Breast Cancer, Wangら、Sensors (Basel), 2017, July, Vol. 17(7), p. 1572に示される。
【0091】
乳癌リスクの遺伝的修飾因子のいくつかの例は、Muranen TA,ら、Genetics in Medicine, 2017, Vol. 19(5), pp. 599-603に示される。
【0092】
乳癌のリスクスコアのいくつかの例は、Kuchenbaecker K,ら、J Natl Cancer Inst., 2017, Vol. 109(7), djw302に示される。
【0093】
癌のリスクのいくつかの例は、Perencevich M,ら、Gastroenterology & Hepatology, 2011, Vol. 7(6), pp. 420-423に示される。
【0094】
遺伝子解析のいくつかの例は、Lekら、Nature, 2016, Vol. 536.7616, pp. 285に示される。
【0095】
祖先情報SNP
一般的に、対象における形質の多遺伝子による決定は、一組の多遺伝子性SNPマーカーを用いて行われ得る。いくつかの実施形態では、形質は祖先であり得る。
【0096】
本発明の態様は、対象の遺伝子型の祖先による特徴付けに利点を提供する。
【0097】
特定の態様では、本開示の方法は、1つ以上の異なる人種グループと関連したSNPを使用し得る。SNPの組合せは、対象の祖先を評価するために使用され得る。対象の遺伝子型は、1つ以上の異なる人種グループの祖先比率に基づいて決定され得る。
【0098】
本発明の実施形態は、複数の祖先情報SNPマーカーを選択することによって対象の祖先を評価する方法を提供する。祖先情報SNPマーカーは、例えば、実質的にヒトゲノムの全体に及ぶ能力、少なくとも1%のゲノム頻度を有すること、および異なる人種集団において異なる頻度を有することなどの1つ以上の基準を基にし得る。対象の遺伝子型を得ることによって、対象の遺伝子型における人種比率は、複数の祖先情報SNPマーカーに基づいてそれぞれの異なる人種集団について計算され得る。
【0099】
いくつかの実施形態では、祖先情報SNPマーカーは、3つ以上の異なる人種集団、例えば、アフリカ人、ヨーロッパ人、および東アジア人の人種集団などで異なる頻度を有し得る。複数の10~50,000個の祖先情報SNPマーカーが使用され得る。
【0100】
いくつかの実施形態では、複数の祖先情報SNPマーカーは、1~1,000,000個のSNPマーカーを含みうる。
【0101】
本発明の特定の実施形態では、複数の10~56個の祖先情報SNPマーカーが使用され得る。
【0102】
本開示の方法は、祖先情報SNPマーカーの使用を、生物学的形質と関連しうる追加のSNPマーカーと組み合わせることができる。SNPの組合せは、包括的多遺伝子性リスクスコア(gPRS)を提供するために使用され得、それは人種に関わらずその形質のリスクについて対象を層別化し得る。包括的多遺伝子性リスクスコアは、本質的に祖先比率に基づくゲノム情報を取り入れることができる。
【0103】
本発明の態様は、設計基準を通して発見された特有の一組のSNPに依存する包括的ポリゲノミックリスクスコアリングの方法を提供する。包括的ポリゲノミックリスク推定のためのこの特有の一組のSNPは、すべての人種グループおよび集団についてリスクを判別し得る。本明細書において開示されるポリゲノミックリスク推定のための特有の一組のSNPマーカーは、実質的にあらゆる集団または人種グループについて偏りなく、すべての人種グループおよび集団に正確な結果を提供する。
【0104】
特定の態様では、特有の一組の祖先情報SNPマーカーは、異なる祖先グループの個々のSNPリスクベータ(risk beta)の推定値を用いて発見された。いくつかの実施形態では、それぞれの祖先について、個々のSNPリスクベータは、既知の値から、myRisk患者において得られたデータから、および先行の統合データ(combined data)のメタ分析を通して決定された。異なる祖先グループにおける個々のSNPリスクベータの推定値は、癌リスクなどの形質のリスクについての包括的多遺伝子性リスクスコアを提供し得る特有の一組のSNPマーカーを決定するために使用され得、それは祖先に関わらずリスクについて病気を持たない患者を層別化し得る。
【0105】
例えば、いくつかの実施形態では、アフリカ人のSNPリスクベータは、1,000以上、または5,000以上、または10,000以上の、自己申告のアフリカ人祖先の患者のmyRisk測定結果から決定され得る。約70のアジア人SNPリスクベータは、Shuら、Nat Commun., 2020, Vol. 11, pp. 1217-1226から決定され得る。ヒスパニック系のSNPリスクベータは、1,000以上、または5,000以上、または10,000以上の、自己申告のヒスパニック系祖先の患者のヒスパニック系myRisk測定結果から決定され得る。
【0106】
本発明の実施形態は、すべての人種グループおよび集団のすべての女性について臨床的に有効であり得る、形質についての包括的多遺伝子性リスクスコアを提供し得る。
【0107】
本開示の包括的多遺伝子性リスクスコアは、すべての人種グループおよび集団のすべての女性について、形質の意味のあるリスク判別を提供し得る。
【0108】
本開示の包括的多遺伝子性リスクスコアは、ある集団の形質についてのスコアの統計的分布を提供し得るが、そこでは、スコアはあらゆる祖先特異的亜集団について偏りなく、0を中心とし得る。
【0109】
図1は、異なる大陸由来の寄与から見た祖先の図を示す。
【0110】
図2は、ヒスパニック系、白人/非ヒスパニック系、黒人/アフリカ人、およびアジア人の遺伝子型についての祖先に基づく遺伝子型の分布の図を示す。
【0111】
包括的ポリゲノミックリスク推定のための特有の一組の祖先情報SNPは、異なる大陸由来の寄与から見た対象の祖先の特徴付けによって入手され得る。
【0112】
更なる実施形態では、3つの大陸の祖先:すなわち、アフリカ人、東アジア人およびヨーロッパ人の間で区別するための設計基準によって、特有の一組の祖先情報SNPマーカーが入手され得る。
【0113】
更なる実施形態では、3つ以上の大陸の祖先の間で区別するための設計基準によって、特有の一組の56個の祖先情報SNPマーカーが入手され得る。
【0114】
本開示の祖先情報SNPには、表1のものが含まれる。
【0115】
【0116】
癌の包括的ポリゲノミックリスク推定
本発明の実施形態は、特有の一組の祖先情報SNPマーカーを、癌のリスクなどの形質と関連した追加のSNPマーカーと組み合わせることを更に企図する。
【0117】
いくつかの実施形態では、本発明の方法は、祖先情報SNPマーカーの使用を、1つ以上の異なる人種グループにおいて癌リスクと関連しうる追加のSNPマーカーと組み合わせることができる。このようなSNPの組合せは、癌リスクについての包括的多遺伝子性リスクスコア(gPRS)を提供するために使用でき、それは、祖先および疾患の家族歴の有無に関わらず、病気を持たない患者を癌リスクについて層別化することができる。
【0118】
更なる態様では、本発明の方法は、祖先情報SNPマーカーの使用を、1つ以上の異なる人種グループの女性において乳癌リスクと関連しうる追加のSNPマーカーと組み合わせることができる。このようなSNPの組合せは、乳癌リスクについての包括的多遺伝子性リスクスコア(gPRS)を提供するために使用でき、それは、祖先および疾患の家族歴の有無に関わらず、病気を持たない女性を乳癌リスクについて層別化することができる。
【0119】
いくつかの態様では、包括的ポリゲノミックリスク推定は、祖先情報SNPマーカーと癌関連SNPとの組合せを用いることによって、対象の遺伝的祖先に関わらず対象の癌のリスクを特徴付けしうる。癌関連SNPは、1つ以上の異なる人種グループまたは集団に由来しうる。
【0120】
いくつかの態様では、包括的ポリゲノミックリスク推定は、祖先情報SNPマーカーと乳癌関連SNPとの組合せを用いることによって、遺伝的祖先に関わらず女性の乳癌のリスクを特徴付けしうる。乳癌関連SNPは、1つ以上の異なる人種グループまたは集団に由来しうる。
【0121】
いくつかの実施形態では、包括的ポリゲノミックリスクスコアは、10~56個の祖先情報SNPマーカーと10~93個の乳癌関連SNPとの組合せを用いることによって、遺伝的祖先に関わらず女性の乳癌のリスクを特徴付けしうる。乳癌関連SNPは、最大92個までのヨーロッパ人乳癌関連SNPおよび1つのヒスパニック系乳癌SNP 6q25(rs140068132)を含み得る。
【0122】
特定の実施形態では、包括的ポリゲノミックリスクスコアは、56個の祖先情報SNPマーカーと、92個のヨーロッパ人乳癌関連SNPおよび1つのヒスパニック系乳癌SNP 6q25(rs140068132)で構成される93個の乳癌関連SNPとの組合せを用いることによって、遺伝的祖先に関わらず女性の乳癌のリスクを特徴付けしうる。
【0123】
本発明の包括的ポリゲノミックリスクスコアは、すべての人種グループおよび集団のすべての女性に対し、驚くほど高いリスク判別および較正の優れた正確性に関して、高水準の正確性を実現し得る。
【0124】
本開示の乳癌関連SNPには、表2のものが含まれる。
【0125】
【0126】
多遺伝子性リスクスコア
別の実施例では、乳癌リスクの多遺伝子性推定は、86-SNP多遺伝子性リスクスコアを用いて行われ得る。86-SNP多遺伝子性リスクスコアは、低~中程度の浸透度(penetrant)の遺伝子、例えばATM、CHEK2、およびPALB2などに病的バリアントを有する女性における乳癌発症のリスクとの関連を提供し得る。80歳までの乳癌の絶対リスクを計算することができ、BRCA1/2、ATM、CHEK2、およびPALB2に病的バリアントを有する女性における多遺伝子性層別化の潜在的な臨床的有用性を説明する。
【0127】
多遺伝子性リスクスコアは、式IIIに従った中心化された(centered)リスク対立遺伝子の線形結合として定義され得る。
【0128】
【数2】
式中、Nは選択されたSNPの総数であり、係数b
kは、文献のメタ分析および発症コホートから推定されるk番目のSNPの乳癌関連についての対立遺伝子ごとのlog ORであり;x
kは、個々の患者が保有するk番目のSNPの対立遺伝子の数であり(x
k=0、1または2);u
kは、大規模な一般集団研究に含まれる個人について報告されたk番目のSNPの平均対立遺伝子の数である。合格基準は、高リスクまたは低リスクの対立遺伝子による欠測コール(missing calls)の補完が10%より大きく相対リスクを変化させないように、欠測SNPコール(missing SNP calls)の数を制限しうる。
【0129】
いくつかの態様では、SNP係数は、多遺伝子性リスクスコアのために推定され得る。
【0130】
いくつかの実施形態では、SNP係数は推定され得、複数の該当するSNPについての標準誤差は発症コホートに基づいて得ることができる。これらの係数は{b_devk | k=1, 2,…, NSNP}で、標準誤差は{σ_ devk | k=1, 2,…, NSNP}によって表され、ここで、NSNPは使用されるSNPの数である。これらの値は、従属変数として乳癌状態による単一の多変量ロジスティック回帰モデル、ならびに以下の独立変数から推定され得る:それぞれのNSNP SNPについての対立遺伝子の数を表すNSNP数値変数{xk | k=1, 2,…, NSNP}、年齢、祖先、癌の個人歴および家族歴。年齢、祖先、癌の個人歴および家族歴の変数は、上述のようにコード化されうる。SNP係数は、文献に基づく係数{b_litk | k=1, 2,…, NSNP}、および標準誤差{σ_litk | k=1, 2,…, NSNP}を選択することによってさらに推定され得る。SNP間の連鎖不平衡は、各遺伝子について1つのモデルを用いて、多変量回帰モデルにおける効果を共推定することによって説明され得る。
【0131】
最後に、多遺伝子性リスクスコア係数は、発症コホートおよび文献に基づく係数のメタ分析からの{bk | k=1, 2,…, NSNP}に従って計算され得る。多遺伝子性リスクスコア係数は、二乗標準誤差に反比例する重み付けを用いた発症コホートおよび文献の係数の加重平均として計算されてもよい。二乗標準誤差の比率は、中央値に置き換えることができる。
【0132】
より詳細には、複数のSNPについて、および欠測のないσ_litk値を用いて、比率の中央値(median ratio)は、式IVに従って計算され得る。
【0133】
【数3】
式中、1からN
SNPまでのそれぞれのkについて、b
kは式Vに従って定義された。
【0134】
【0135】
更なる態様では、各SNPの情報性(informativeness)が計算され得る。
【0136】
SNPの情報性は、その効果量およびその一般集団対立遺伝子頻度の関数でありうる。1からNSNPまでのそれぞれのkについて、k番目のSNPの情報性は、式VIに従って計算され得る。
【0137】
【0138】
追加の態様では、SNPは情報性によって順序付けられてもよい。指定により、b1は最も情報性の高いSNP、b2は2番目に情報性の高いSNPなどのように示されてもよい。
【0139】
カイ二乗尤度比検定(LRT)統計値は、多遺伝子性リスクスコア(PRS)への各SNPの寄与を評価するために計算され得る。連鎖した一組に由来するSNPについては、各遺伝子に由来する単一の最も情報性の高い代表的なSNPのみが含まれてもよく、評価のための1つを差し引いたNSNPを省いてもよい。1からNSNPまでのそれぞれのkについて、以下のステップに従って、発症コホートで解析が行われ得る。第一に、式VIIに従って、すべての患者についてのk-SNP PRSを計算する。
【0140】
【0141】
第二に、従属変数として乳癌状態を用い、PRSkについての独立変数、年齢、祖先、癌の個人歴および家族歴を用いて、多変量ロジスティック回帰モデルを構築する。第三に、LRT統計値を記録して、完全モデル(full model)と除外されたPRSkを有するネストモデル(nested model)とを比較する。
【0142】
更なる態様では、PRSのためのSNPは、最も高い尤度比検定(LRT)値に従って選択されうる。代表的なSNPが包括のために選択された場合、ある遺伝子由来のすべての連鎖したSNPが包含されてもよい。
【0143】
86-SNPスコアの実施形態に組み込まれた複数のSNPのアイデンティティは、表3に示される。染色体上の位置は、hg19に従って示される。
【0144】
【0145】
癌の方法および処置
癌治療としては、外科手術、冷凍アブレーション、放射線療法、骨髄移植、化学療法、免疫療法、ホルモン療法、幹細胞療法、薬物療法、生物学的治療、および医薬、予防的または治療的化合物、例えば、生物学的または外因性活性剤の投与が挙げられ得る。
【0146】
処置の例としては、肥満体の外科的干渉、理学療法、食事、および食事補充が挙げられる。
【0147】
癌生物学的治療の例としては、養子細胞移入、血管形成阻害剤、カルメット-ゲラン桿菌療法、生物化学療法、癌ワクチン、キメラ抗原受容体(CAR)T細胞療法、サイトカイン療法、遺伝子治療、免疫チェックポイント調節因子、免疫複合体、モノクローナル抗体、腫瘍溶解性ウイルス療法、および標的薬物療法が挙げられる。
【0148】
癌外科手術の例としては、乳腺腫瘤摘出、部分乳房切除、全乳房切除、単純乳房切除、改変根治的乳房切除、根治的乳房切除、およびホールステッド根治的乳房切除が挙げられる。
【0149】
癌薬の例としては、乳癌を予防するのに承認されている薬物が挙げられ、Evista(塩酸ラロキシフェン)、塩酸ラロキシフェン、およびクエン酸タモキシフェンが挙げられる。
【0150】
癌薬物の例としては、乳癌を処置するのに承認されている薬物が挙げられ、アベマシクリブ、アブラキサン(パクリタキセルアルブミン安定化ナノ粒子製剤)、Ado-トラスツズマブエムタンシン、アフィニトール(Afinitor)(エベロリムス)、Afinitor Disperz(エベロリムス)、アルペリシブ、アナストロゾール、Aredia(パミドロン酸二ナトリウム)、アリミデックス(アナストロゾール)、アロマシン(エクセメスタン)、アテゾリズマブ、カペシタビン、シクロホスファミド、ドセタキセル、塩酸ドキソルビシン、Ellence(塩酸エピルビシン)、Enhertu(Fam-Trastuzumab Deruxtecan-nxki)、塩酸エピルビシン、メシル酸エリブリン、エベロリムス、エクセメスタン、5-FU(フルオロウラシル注射)、Fam-Trastuzumab Deruxtecan-nxki、Fareston(トレミフェン)、Faslodex(フルベストラント)、Femara(レトロゾール)、フルオロウラシル注射、フルベストラント、塩酸ゲムシタビン、Gemzar(塩酸ゲムシタビン)、酢酸ゴセレリン、Halaven(メシル酸エリブリン)、Herceptin Hylecta(トラスツズマブおよびヒアルロニダーゼ-oysk)、ハーセプチン(トラスツズマブ)、イブランス(パルボシクリブ)、イクサベピロン、イグゼンプラ(イクサベピロン)、カドサイラ(Ado-トラスツズマブエムタンシン)、Kisqali(リボシクリブ)、二トシル酸ラパチニブ、レトロゾール、Lynparza(オラパリブ)、酢酸メゲストロール、メトトレキサート、マレイン酸ネラチニブ、Nerlynx(マレイン酸ネラチニブ)、オラパリブ、パクリタキセル、パクリタキセル-アルブミン安定化ナノ粒子製剤、パルボシクリブ、パミドロン酸二ナトリウム、パージェタ(ペルツズマブ)、ペルツズマブ、Piqray(アルペリシブ)、リボシクリブ、トシル酸タラゾパリブ、Talzenna(トシル酸タラゾパリブ)、クエン酸タモキシフェン、タキソテール(ドセタキセル)、テセントリク(アテゾリズマブ)、チオテパ、トレミフェン、トラスツズマブ、トラスツズマブおよびヒアルロニダーゼ-oysk、Trexall(メトトレキサート)、Tykerb(二トシル酸ラパチニブ)、ベージニオ(アベマシクリブ)、硫酸ビンブラスチン、ゼローダ(カペシタビン)、並びにゾラデックス(酢酸ゴセレリン)が挙げられる。
【0151】
本明細書中で用いられる用語「疾患」は、あらゆる障害、状態、疾病、例えば、秩序がないか(disordered)、または不正確に(incorrectly)機能している身体の臓器、部分、構造、または系に現れる慢性病を含む。
【0152】
本明細書中で用いられる用語「試料」は、対象から単離されるあらゆる生体試料を含む。試料としては、限定するものではないが、単細胞または多発性細胞、細胞のフラグメント、体液のアリコート、全血、血小板、血清、血漿、赤血球、白血球(white blood cellsまたはleucocytes)、内皮細胞、組織生検、滑膜液、リンパ液、腹水、および間質液または細胞外液が挙げられ得る。また、用語「試料」は、細胞間の空間内の液体(fluid)を包含し、滑液、歯肉溝滲出液、骨髄、脳脊髄液(CSF)、唾液、粘液、痰、精液、汗、尿、または他のあらゆる体液が挙げられる。血液試料としては、全血またはそのあらゆる画分が挙げられ得、血球、赤血球、白血球(white blood cellsまたはleucocytes)、血小板、血清、および血漿が挙げられる。
【0153】
本明細書中で用いられる用語「対象」は、ヒトを含む。ヒトは一般に女性および男性、およびその他ノンバイナリー等を含む。
【0154】
一部の実施形態において、本発明は、治療レジメンからの撤退を含む、治療レジメンを推奨する方法を提供することができる。
【0155】
更なる実施形態において、オッズ比は、臨床医に、対象の生物学的状態の予後予測の心象(picture)を提供することができる。そのような実施形態は、治療決定に情報を与え得、治療応答の監視も促進し得る、対象特異的な予後予測情報を提供し得る。そのような実施形態は、驚くべきことに、処置の向上、例えば疾患のより良好な管理、または症状の寛解を達成する対象の割合の増大をもたらし得る。
【0156】
本明細書中で用いられる用語「生物学的」、「生物療法」、および/または「バイオ医薬品」は、生物学的物質から製造されるか、または抽出される医薬療法生成物を含み得る。生物学的は、ワクチン、血液または血液成分、アラージェニック、体細胞、遺伝子療法、組織、組換えタンパク質、および生細胞を含み得;糖、タンパク質、核酸、生細胞若しくは生組織、またはそれらの組合せで構成され得る。
【0157】
本明細書中で用いられる用語「治療レジメン」、「治療」、および/または「処置」は、生物学的、化学的、物理的、またはそれらの組合せに拘わらず、対象の状態を持続させるか、寛解させるか、向上させるか、さもなければ改変することが意図される、対象のあらゆる臨床管理および干渉を含み得る。
【0158】
本明細書中で用いられる用語「投与する」は、所望の効果がもたらされるように、所望の部位での組成物の少なくとも部分的な局在化をもたらす方法または経路による、対象中への組成物の配置を含み得る。投与経路は、局所投与および全身投与の双方を含む。通常、局所投与は、対象の全身と比較してより多くの組成物が特定の位置に送達されるが、全身投与は、対象の本質的に全身に送達される。また、「投与する」は、対象の身体に及ぼす物理的作用を実行することを含み、理学療法、並びにカイロプラクティック管理(chiropractic care)、マッサージ、および鍼が挙げられる。
【0159】
装置およびシステム
本明細書中で用いられる用語、機械可読記憶媒体は、例えば、機械可読データまたはデータアレイによりコードされるデータ記憶材料を含むことができる。データおよび機械可読記憶媒体は、前記データを用いるための命令によりプログラムされた機械を用いた場合に、種々の目的で用いることができる。そのような目的は、経時的な対象もしくは集団のリスク、または処置に対する反応のリスクに関する、あるいは炎症性疾患の創薬の情報を記憶し、これにアクセスし、およびこれを操作することを含む。ゲノム測定値を含むデータは、プロセッサ、データ記憶システム、1つ以上のインプット装置、1つ以上のアウトプット装置を含み得るプログラマブルコンピュータにより実行されているコンピュータプログラムにより実行され得る。プログラムコードを、インプットデータに入力して、本明細書中に記載される機能を実行し、およびアウトプット情報を生じさせることができる。アウトプット情報は、続いて、1つ以上のアウトプット装置に入力することができる。コンピュータは、例えば、パーソナルコンピュータ、マイクロコンピュータ、またはワークステーションであり得る。
【0160】
本明細書中で用いられる用語、コンピュータプログラムは、コンピュータシステムとコミュニケートするように、高レベル手続き型言語またはオブジェクト指向プログラミング言語で実行される命令コードであり得る。プログラムは、マシン言語またはアセンブリ言語で実行されてもよい。また、プログラミング言語は、コンパイル型言語であってもインタープリタ型言語であってもよい。各コンピュータプログラムは、記憶媒体または記憶装置が、記載の手順を実行するためにコンピュータによって読まれる場合、コンピュータを構成して作動させるために、記憶媒体または装置、例えばROMまたは磁気ディスケットに記憶することができ、およびプログラマブルコンピュータによって可読であり得る。健康関連またはゲノムデータ管理システムは、コンピュータプログラムで構成されたコンピュータ可読記憶媒体として実行されると考えることができ、ここで、記憶媒体は、コンピュータを、種々の機能を実行するような特定の様式で作動させる。
【0161】
結論
本明細書中で具体的に記載されるすべての出版物、特許、および文献は、それらの全体がすべての目的のために参照によって本明細書に組み入れられる。
【0162】
参照SNP ID番号、または「rs」IDは、同一の場所に位置するSNPのグループまたはクラスターにNCBIによって割り当てられた識別タグである。rs ID番号またはrsタグは提出後に割り当てられる。提出されたSNPは、それが以前に提出されたSNPと同一の場所に位置するかどうか確かめるために検証され、もしそうであれば、提出されたSNPは、既存の参照SNP記録の参照セットに関連付けられる。これらのSNP rs IDは、NCBIデータベースを含む外部資源またはデータベースに位置付けられる。SNP rs ID番号は、使用者が最初のdbSNP記録に戻るように指し示すために、これらの外部資源およびデータベースの記録に注記される。参照SNP記録は、NCBI| rs<NCBI SNP ID>の形式を有する。
【0163】
本明細書中で具体的に定義される文言は、本開示の文脈において全体として提供されており、当業者によって典型的に理解される意味を有する。本明細書中で用いられる場合、単数形「a(1つの)」、「an(1つの)」、および「the(その)」は、複数形を含む。
【0164】
本開示は、様々な実施形態と併せて記載されるが、本開示は、そのような実施形態に限定されることを意図していない。逆に、本開示は、当業者によって認識される、様々な代替物、改変物、および均等物を包含する。
【0165】
定義されない限り、本明細書中で用いられるすべての技術用語および科学用語は、本発明が係わる技術の当業者によって一般的に理解されるものと同じ意味を有する。本明細書中に記載されるものと類似のまたは同等の方法および材料は、本発明の実施または試験に使用され得るが、適切な方法および材料は以下に記載される。加えて、本明細書中の材料、方法、および例は、一例にすぎず、限定することを意図しない。
【0166】
前述の開示は、理解を明確にするための説明および例によって一部詳細に記載されているが、様々な変更および改変が、本発明の範囲および添付の特許請求の範囲内で行われてもよいことは、当業者によって理解されるであろう。
【実施例】
【0167】
[実施例1]
包括的多遺伝子性乳癌リスク評価
乳癌リスク評価は、包括的多遺伝子性リスクスコア(gPRS)に統合された小さい影響を有する一塩基多型(SNP)の使用によって決定され、主としてヨーロッパ系の集団について開発および検証された。gPRSをすべての人種グループおよび集団のすべての女性について意味のあるものにするため、個々の祖先の遺伝子構成を利用する新規の包括的PRS(gPRS)が決定され、検証された。
【0168】
93個の乳癌関連SNPおよび56個の祖先情報SNPで構成される149個のSNPを用いて、3つの大陸の祖先に対応する祖先特異的な包括的多遺伝子性リスクスコアが決定され、検証された。アフリカ人の多遺伝子性リスクスコアは、遺伝性癌検査を勧められた31,126人の自己申告のアフリカ系アメリカ人患者のコホートを用いて決定された。東アジア人の多遺伝子性リスクスコアは、アジア乳癌連合(Asia Breast Cancer Consortium)からの公開データに基づいて開発された。ヨーロッパ人の多遺伝子性リスクスコアは、乳癌協会コンソーシアム(Breast Cancer Association Consortium)からのデータおよび24,259人のヨーロッパ人遺伝性癌検査患者を用いて決定された。それぞれの患者について、祖先情報SNPは、3つの大陸のそれぞれに起因する祖先比率を計算するために使用された。gPRSは、遺伝的祖先構成に従って重み付けされた祖先特異的多遺伝子性リスクスコアの合計であった。独立の検証コホート(N=62,707)において、gPRSの判別および較正が評価され、前述のヨーロッパ系の女性のための86-SNP PRSについての性能と比較された。SNPおよび多遺伝子性リスクスコアと乳癌との関連は、癌の個人歴、癌の家族歴、年齢、および祖先で調整されたロジスティック回帰を用いて解析された。オッズ比(OR)は、対応する患者集団内での標準偏差当たりで記録された。P値は両側として記録された。
【0169】
図3は、乳癌リスクについての包括的多遺伝子性リスクスコアの分布が、すべての祖先遺伝子型の患者について約0を中心としており、リスク推定から祖先由来の偏りが除去されていることを示している本発明の実施形態の図を示す。
【0170】
表4に示されるように、gPRSは、完全な検証コホートおよび自己申告の祖先によって定義されたサブコホートにおいて、乳癌と強く関連していた。
【0171】
【0172】
表4に関して、乳癌SNPの95%(88/93)は、自己申告された集団のそれぞれの中で≧1%のリスク対立遺伝子頻度を持っていた。前述の86-SNP PRSと比較して、本発明のgPRSは、サンプルサイズが小さ過ぎてどちらかのスコアの優位性を示すことができなかったアジア人集団を除いて、全体として、および各サブコホート内で改善された判別を示した。gPRSはすべての女性について適切に較正された。
【0173】
結論として、149-SNP gPRSはすべての祖先の女性について検証され、較正された。臨床的および生物学的リスク因子と組み合わせて、149-SNP gPRSは、祖先、集団または人種に関わらず、すべての女性について驚くほど改善されたリスク層別化を提供し得る。
【0174】
[実施例2]
包括的多遺伝子性乳癌リスク決定
すべての遺伝的祖先での乳癌についての包括的ポリゲノミックリスク推定は、92個のヨーロッパ人乳癌関連SNPおよび1つのヒスパニック系乳癌関連SNP 6q25(rs140068132)で構成される93個の乳癌関連SNPの組合せを用いて定義された。
【0175】
ヨーロッパ人SNP乳癌リスクベータは、既知のSNP特性およびmyRisk患者データに由来するSNP特性のメタ分析を基にした。アフリカ人SNP乳癌リスクベータは、自己申告されたアフリカ人祖先の31,126人のmyRisk患者由来のデータを基にした。約70個のSNPについてのアジア人SNP乳癌リスクベータは、Shuら、Nat Commun., 2020, Vol. 11, pp. 1217-1226を基にした。ヨーロッパ人SNP乳癌リスクベータは、直接決定された。ヒスパニック系SNP乳癌リスクベータは、約9,000人のヒスパニック系myRisk患者のデータから決定された。
【0176】
乳癌についての包括的ポリゲノミックリスク推定は、すべての祖先のmyRisk患者の大規模コホートにおける包括的多遺伝子性リスクスコアの判別の評価を含む一次解析によって決定された。
【0177】
乳癌についての包括的ポリゲノミックリスク推定は、完全コホートにおける86-SNP PRSの使用と比較して、93個の乳癌関連SNPを用いてすべての集団についての乳癌リスク判別の改善を計算することを含む二次解析によって更に決定された。二次解析は自己申告された祖先によって定義されたサブコホートにおいて繰り返された。
【0178】
乳癌についての包括的ポリゲノミックリスク推定は、追加解析によって更に決定され、包括的ポリゲノミックリスクスコアが、病気を持たない患者全体、およびヒスパニック系の6q25 SNP(rs140068132)保有者を除くそれぞれの亜集団において0を中心とすることを確認している。0を中心とすることは、包括的ポリゲノミックリスクスコアが、いかなる特定の人種グループまたは集団にも偏っていないことを示した。0を中心とすることは、包括的ポリゲノミックリスクスコアが、意外にもすべての人種グループおよび集団について同一のリスク推定を提供することを示した。
【0179】
表5に示されるように、乳癌についての包括的ポリゲノミックリスク推定は、従って、すべての患者についての乳癌リスク判別、および自己申告された祖先によって定義されたすべてのサブコホートについての乳癌リスク判別を提供することが実証された。
【0180】
【0181】
図4は、乳癌リスクについての包括的多遺伝子性リスクスコアの分布が、6q25 SNP (rs140068132)を保有していないヒスパニック系の患者について約0を中心としている本発明の実施形態の図を示す。
【0182】
図4に示されるように、乳癌についての包括的多遺伝子性リスク推定は、ヒスパニック系の6q25 SNP(rs140068132)の保有者を除いて、すべての祖先の病気を持たない患者について約0を中心としていた。ヒスパニック系の6q25 SNP(rs140068132)の保有者は、保護効果を保つため独立に扱われた。
図4中の乳癌についての平均包括的多遺伝子性リスク推定は表6に示される。
【0183】
【0184】
図5は、異なる乳癌対立遺伝子頻度に基づく多遺伝子性リスクスコアの分布における祖先特異的な差異の比較を示す。
【0185】
図5に示されるように、ヒスパニック系の人々について、乳癌についての包括的多遺伝子性リスク推定は、ヒスパニック系の6q25 SNP(rs140068132)を保有していない患者では約0を中心とし、6q25(rs140068132)保有者ではより低リスク側に移行していた。
【0186】
【0187】
[実施例3]
比較上の86-SNPポリゲノミックリスク推定の使用
BRCA1、BRCA2、CHEK2、ATM、PALB2における病的バリアントの保有者、および非保有者について別々に、86-SNP多遺伝子性リスクスコアが評価された。他のマーカーおよび要素を含まない86-SNPポリゲノミックリスク推定の使用は、比較上の方法であった。
【0188】
IRBに承認された研究には、多遺伝子パネルを用いて遺伝的癌リスクについて臨床的に検査されたヨーロッパ人祖先の152,012人の女性が含まれた。86-SNP多遺伝子性リスクスコアは、BRCA1(N=2,249)、BRCA2(N=2,638)、CHEK2(N=2,564)、ATM(N=1,445)およびPALB2(N=906)における病的バリアントの保有者、ならびに非保有者(N=141,160)について、別々に評価された。多変量ロジスティック回帰は、年齢および癌の家族歴を考慮した後、86-SNPスコアと浸潤性乳癌との関連を調べるために使用された。95%信頼区間(CI)を伴う標準化されたオッズ比(OR)として表される効果量は、各遺伝子の保有者および非保有者について評価された。86-SNPスコアは、BRCA1、BRCA2、CHEK2、ATMおよびPALB2保有者集団における乳癌リスクと強い相関があった(p=10-4)。しかし、異なる遺伝子についての異なる効果量は、更なる解釈を困難にさせた。
【0189】
多遺伝子性リスクスコアは、中心化されたリスク対立遺伝子の線形結合として定義され:
【0190】
【数7】
式中、Nは選択されたSNPの総数であり、係数b
kは、文献のメタ分析および発症コホートから推定されるk番目のSNPの乳癌関連についての対立遺伝子ごとのlog ORであり;x
kは、個々の患者が保有するk番目のSNPの対立遺伝子の数であり(x
k=0、1または2);u
kは、大規模な一般集団研究に含まれる個人について報告されたk番目のSNPの平均対立遺伝子の数である。合格基準は、高リスクまたは低リスクの対立遺伝子による欠測コール(missing call)の補完が10%より大きく相対リスクを変化させないように、欠測SNPコール(missing SNP call)の数を制限した。
【0191】
浸潤性乳癌との関連性は、Rバージョン3.4.4以上(R Foundation for Statistical Computing, Vienna, Austria)を用いて構築された多変量ロジスティック回帰モデルからのp値および95%信頼区間(CI)を伴うORで評価された。ORは、病気を持たない対照における多遺伝子性リスクスコア(PRS)の単位標準偏差当たりで記録された。p値は尤度比カイ二乗検定統計値から計算され、両側として記録された。多変量ロジスティック回帰の使用は、そこでの患者が適格要因、BC診断または家族歴のために選ばれた遺伝子検査コホートにおける潜在的な偏りに対処する。臨床検査集団における確認に関連した要因の調整は、偏りのないリスク推定の導出を可能にしうる。
【0192】
すべてのモデルには、最初の浸潤性乳癌(BC)診断の年齢もしくは病気を持たない場合遺伝子検査時の年齢、非BCの個人歴、あらゆる癌の家族歴ならびに祖先、ヨーロッパ人および/またはアシュケナージ系ユダヤ人についての独立変数が含まれた。症例は、非浸潤性乳管癌(DCIS)の有無に関わらず浸潤性乳癌と診断された女性であった。対照は、検査時にBC癌に罹患していなかった。DCISと診断された女性は対照から除外された。PRSと年齢との関係の試験では、多変量モデルにはPRSおよび年齢に関する相互作用項が含まれた。相互作用試験はPRSおよび保有状態についてもまた実施され、遺伝子によるPRS成績の差について試験している。このモデルでは、カテゴリー変数は、保有状態、非保有者、BRCA1病的バリアント、BRCA2病的バリアントなどを表し、PRSは各保有者群内で標準化され、PRSおよび保有状態に関する相互作用項が含まれた。
【0193】
モデルには、年齢、癌の個人歴、癌の家族歴、および祖先についての臨床変数が含まれた。データは、遺伝性の遺伝子検査のために提出された検査申請書から得られた。臨床変数はまた、調査コホートの適格性を定義するためにも使用されるため、完全な臨床データを有する女性のみが調査に含まれた。
【0194】
年齢は、連続変数として年数でコード化された。病気を持つ患者については、浸潤性乳癌の最初の診断の年齢が用いられ、病気を持たない患者については、遺伝子検査時の年齢が用いられた。癌の個人歴変数は、今までに罹患したことがあるかないかの二値でコード化された。単離変数(separate variable)は、子宮癌/子宮内膜癌、卵巣癌、膵臓癌、胃癌、非ポリポーシス大腸癌、および20個以上のポリープを有する腺腫性ポリポーシス患者についてコード化された。
【0195】
すべての患者は、以下の遺伝子:APC、ATM、BARD1、BMPR1A、BRCA1、BRCA2、BRIP1、CDH1、CDK4、CDKN2A(p14ARF、p16)、CHEK2、EPCAM、MLH1、MSH2、MSH6、MYH、NBN、PALB2、PMS2、PTEN、RAD51C、RAD51D、SMAD4、STK11、およびTP53についての生殖細胞変異について検査された。ライブラリー調製品は、乳癌(BC)情報一塩基多型(SNP)を有するエクソン断片と付加的DNA断片との両方についての、特注設計の標的化された次世代シーケンシング(NGS)試薬を包含した。ロングレンジPCRおよびネスティッドPCRをCHEK2遺伝子の部分に適用することにより、偽遺伝子配列を排除した。HiSeq2500またはMiSeq機器(Illumina Inc., San Diego, CA)でのシーケンシングは、配列バリアントと大規模な再構成(欠失および重複)との両方を同定した。
【0196】
一次解析は、各遺伝子保有者群における86-SNPスコアと浸潤性BCとの関連性を調べた。予備解析では、CHEK2 1100delCまたは他のCHEK2 PVの保有者における86-SNPスコアの成績が比較された。家族歴との相互作用を検査するため、二値変数(病気を持つ第一度近親者の有無)または重み付けされた近親者数での浸潤性BCに罹患している近親者の総和のいずれかが用いられた。遺伝子保有状態との相互作用を検査するため、非保有者または遺伝子特異的保有状態についてのカテゴリー変数が作られた。
【0197】
家族性癌は、診断回数としてコード化され、血縁の程度に従って重み付けされた。第一度近親者それぞれについて0.5の重み付けが用いられ、第二度近親者それぞれについて0.25の重み付けが用いられた。変数には、浸潤性乳管癌、小葉浸潤性乳癌(lobular invasive breast cancer:LCIS)、DCIS、男性乳癌、前立腺癌、および上記に掲載されたそれぞれの個人の癌の種類が含まれた。祖先は、報告された祖先の比率を表す定量的変数としてコード化された。例えば、アシュケナージ祖先のみを挙げた患者は1.0のアシュケナージの値によってコード化され、ヨーロッパ人祖先についでは0でコード化された。ヨーロッパ人およびアシュケナージ祖先を報告した患者は、0.5のヨーロッパ人およびアシュケナージの値によってコード化された。
【0198】
86-SNPスコアのパーセンタイルによって相対リスクを調べるため、非保有者ならびにBRCA1、BRCA2、CHEK2、およびATM PV-陽性コホートは、それぞれ86-SNPスコアに基づいて五分位数にビン分割された。PALB2コホートは、より小さいサンプルサイズから成るため、三分位数にビン分割された。中央パーセンタイルビン(PALB2については33から66番目のパーセンタイル三分位数、他のすべてについては40から60番目のパーセンタイル五分位数)は、上述の共変量をも含むモデル中の参照群として設定された。
【0199】
BCを発症する絶対生涯リスクは、86-SNPスコアに基づくリスクを以前に発表された遺伝子特異的リスク推定(PV保有者について)またはSurveillance, Epidemiology, and End Results(SEER)の2009~2014のデータからの生涯BCリスク推定(非保有者について)と組み合わせることによって、病気を持たない調査参加者について計算された。
【0200】
乳癌関連遺伝子中の病的バリアント(PV)の保有者についての80歳までの絶対リスク推定を背景にした確率密度関数としての生涯乳癌リスクは、86-SNPスコア法によって修正されたように決定され得る。中等度リスクの乳癌遺伝子CHEK2、ATM、およびPALB2に病的バリアント(PV)を有する女性では、点推定値はBRCA1/2保有者より高かった。86-SNPスコアと遺伝子保有者の種類との相互作用は有意であった。最も顕著なリスク判別は、CHEK2保有者について観察され、効果量は、非保有者においておよび一般集団について観察されたオッズ比と同等であった。
【0201】
調査コホートの臨床的特徴および人口統計データの要約は、表7に示される。
【0202】
【0203】
CHEK2 1100delCおよび他のCHEK2 PVの保有者における連続86-SNPスコアでの乳癌の発症についてのORは、表8に示される。
【0204】
【0205】
年齢ビンおよびBC関連遺伝子中のPVの保有状態による連続86-SNPスコアでの乳癌の発症についてのORは、表9に示される。
【0206】
【0207】
第一度近親者のBC罹患状態、およびBC関連遺伝子中のPVの保有状態による、乳癌の発症についてのORは、表10に示される。
【0208】
【0209】
調査コホートの臨床的特徴および人口統計データの要約は、表11に示される。
【0210】
【0211】
5つのBC関連遺伝子中の病的バリアントの保有者における86-SNP多遺伝子性リスクスコアによる乳癌の発症リスクの修正は、表12に示される。
【0212】
【0213】
86-SNP PRSのパーセンタイル、およびBC関連遺伝子中の病的バリアントの保有状態による乳癌の発症についてのオッズ比は、表13および表14に示される。
【0214】
【0215】
【0216】
80歳までの推定生涯乳癌リスクおよび86-SNP PRSによる修正は、表15に示される。
【0217】
【国際調査報告】