IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 学校法人順天堂の特許一覧 ▶ ジェネシスヘルスケア株式会社の特許一覧

<>
  • 特開-前立腺癌の罹患リスクを評価する方法 図1
  • 特開-前立腺癌の罹患リスクを評価する方法 図2
  • 特開-前立腺癌の罹患リスクを評価する方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023030740
(43)【公開日】2023-03-08
(54)【発明の名称】前立腺癌の罹患リスクを評価する方法
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20230301BHJP
   C12Q 1/6827 20180101ALI20230301BHJP
   G16H 20/00 20180101ALI20230301BHJP
   C12N 15/09 20060101ALN20230301BHJP
【FI】
C12Q1/6869 Z
C12Q1/6827 Z
G16H20/00
C12N15/09 Z
【審査請求】有
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2021136035
(22)【出願日】2021-08-24
【新規性喪失の例外の表示】新規性喪失の例外適用申請有り
(71)【出願人】
【識別番号】502285457
【氏名又は名称】学校法人順天堂
(71)【出願人】
【識別番号】504217812
【氏名又は名称】ジェネシスヘルスケア株式会社
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】八谷 剛史
(72)【発明者】
【氏名】堀江 重郎
(72)【発明者】
【氏名】佐藤 バラン 伊里
(72)【発明者】
【氏名】寺島 正美
【テーマコード(参考)】
4B063
5L099
【Fターム(参考)】
4B063QA13
4B063QQ42
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS34
4B063QX02
5L099AA04
(57)【要約】
【課題】多遺伝子リスクスコアと連鎖不平衡を用いた前立腺癌の罹患リスクの評価方法を提供すること。
【解決手段】対象者の遺伝子型に関する情報と多遺伝子リスクスコアモデルを用いて、前記対象者の前立腺癌の罹患リスクを評価する方法であって、前記多遺伝子リスクスコアモデルが、前立腺癌に罹患したヒトの遺伝子型データと、前立腺癌に罹患していないヒトの遺伝子型データと、を含むデータを用いてゲノムワイド関連解析により得られた、東アジアのヒトの前立腺がんの評価に関する多遺伝子リスクスコアモデルである、方法。
【選択図】図1
【特許請求の範囲】
【請求項1】
対象者の遺伝子型に関する情報と多遺伝子リスクスコアモデルを用いて、前記対象者の前立腺癌の罹患リスクを評価する方法であって、
前記多遺伝子リスクスコアモデルが、前立腺癌に罹患したヒトの遺伝子型データと、前立腺癌に罹患していないヒトの遺伝子型データと、を含むデータを用いてゲノムワイド関連解析により得られた、東アジアのヒトの前立腺がんの評価に関する多遺伝子リスクスコアモデルである、
方法。
【請求項2】
前記前立腺癌の罹患リスクに関する情報が、前記対象者が前記前立腺癌に罹患していることを確認するための生検を行うべきか否かに関する情報を含む、
請求項1に記載の方法。
【請求項3】
前記生検を行うべきか否かに関する情報が、前記対象者が罹患した前記前立腺癌の悪性度及び/又は病期分類に関する情報を含む、
請求項2に記載の方法。
【請求項4】
対象者の遺伝子型に関する情報は、前記対象者の唾液サンプルより得られるものである、
請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記前立腺癌の罹患リスクに関する情報と、前立腺特異抗原の血中濃度に関する情報と、をスクリーニングモデルに入力し、該スクリーニングモデルによって、前立腺癌の罹患に関する情報を出力する、
請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記前立腺癌の罹患に関する情報が、前記対象者が罹患した前記前立腺癌の進行に関する情報を含む、
請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記対象者の年齢に関する情報を、前記スクリーニングモデルにさらに入力する、
請求項1~6のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は前立腺癌の罹患リスクを評価する方法に関する。
【背景技術】
【0002】
日本においても前立腺癌の患者数は近年増加傾向にあり、前立腺癌の早期発見と治療が望まれる。一般的な前立腺がんの診断は、PSA検査などのスクリーニング検査により、前立腺がんの可能性がある人をスクリーニングし、スクリーニング検査によって減率先願の疑いがある場合には、生検などの確定診断が行われる。
【0003】
ところで、従来からゲノムワイド関連解析(以下、「GWAS」ともいう。)により多数の疾患と一塩基多型(以下、「SNP」ともいう。)との関連性の特定が進められており、前立腺癌についても特定のSNPとの関係性が特定されつつある。そして、このように特定された複数のSNPを用いて多遺伝子リスクスコア(PRS)により各種疾患の罹患リスクの評価が行われている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
一方で、前立腺癌の罹患リスクは人種による違いが大きい。例えば、欧米人を中心とした研究において前立腺癌の罹患リスクとの関係が知られているSNPであっても、必ずしも東アジア、特には日本人においては前立腺癌の罹患リスクが証明されていないSNPもあり、多遺伝子リスクスコアにおいてこのような人種の相違を考慮することで、前立腺癌の罹患リスクをより適切に評価できるようにすることが考えられる。
【0005】
本発明は、上記点に鑑みてなされたものであり、多遺伝子リスクスコアと連鎖不平衡を用いた前立腺癌の罹患リスクの評価方法を提供することを課題とする。
【課題を解決するための手段】
【0006】
すなわち、本発明は以下のとおりである。
〔1〕
対象者の遺伝子型に関する情報と多遺伝子リスクスコアモデルを用いて、前記対象者の前立腺癌の罹患リスクを評価する方法であって、
前記多遺伝子リスクスコアモデルが、前立腺癌に罹患したヒトの遺伝子型データと、前立腺癌に罹患していないヒトの遺伝子型データと、を含むデータを用いてゲノムワイド関連解析により得られた、東アジアのヒトの前立腺がんの評価に関する多遺伝子リスクスコアモデルである、
方法。
〔2〕
前記前立腺癌の罹患リスクに関する情報が、前記対象者が前記前立腺癌に罹患していることを確認するための生検を行うべきか否かに関する情報を含む、
〔1〕に記載の方法。
〔3〕
前記生検を行うべきか否かに関する情報が、前記対象者が罹患した前記前立腺癌の悪性度及び/又は病期分類に関する情報を含む、
〔2〕に記載の方法。
〔4〕
対象者の遺伝子型に関する情報は、前記対象者の唾液サンプルより得られるものである、
〔1〕~〔3〕のいずれか一項に記載の方法。
〔5〕
前記前立腺癌の罹患リスクに関する情報と、前立腺特異抗原の血中濃度に関する情報と、をスクリーニングモデルに入力し、該スクリーニングモデルによって、前立腺癌の罹患に関する情報を出力する、
〔1〕~〔4〕のいずれか一項に記載の方法。
〔6〕
前記前立腺癌の罹患に関する情報が、前記対象者が罹患した前記前立腺癌の進行に関する情報を含む、
〔1〕~〔5〕のいずれか一項に記載の方法。
〔7〕
前記対象者の年齢に関する情報を、前記スクリーニングモデルにさらに入力する、
〔1〕~〔6〕のいずれか一項に記載の方法。
【発明の効果】
【0007】
本発明によれば、多遺伝子リスクスコアと連鎖不平衡を用いた前立腺癌の罹患リスクを評価することができる。
【図面の簡単な説明】
【0008】
図1】プルーニングと閾値法(pruning and thresholding method)により作成した多遺伝子リスクスコアモデルに用いるバリアント数を示す表。
図2】24個の多遺伝子リスクスコアモデルのAUCの値を示すグラフ。
図3】多遺伝子リスクスコアモデルの評価結果。
【発明を実施するための形態】
【0009】
本発明の実施の形態について説明する。以下の実施形態は、本発明を説明するための例示であり、本発明をこの実施形態にのみ限定する趣旨ではない。本発明は、その要旨を逸脱しない限り、様々な形態で実施することができる。
【0010】
本実施形態の評価方法は、対象者の遺伝子型に関する情報と多遺伝子リスクスコアモデルを用いて、東アジアのヒト(対象者)の前立腺癌の罹患リスクを評価する方法である。
【0011】
本実施形態において、「前立腺癌」は、前立腺の細胞が正常な細胞増殖機能を失い、無秩序に自己増殖することにより発生する疾患であり、前立腺のおもに外腺の上皮細胞ががん化し発症するものが含まれる。以下、前立腺癌を「本疾患」ともいう。
【0012】
また、本実施形態において、本疾患は、一般には、本疾患に関するする医学会の公表するガイドラインに沿って診断される疾患、医療用医薬品の添付文書において、効能・効果の欄に記載される疾患、あるいは、医薬・医療業界において汎用される用語として理解される疾患の少なくともいずれかを意味するものと解することができる。
【0013】
本疾患の罹患リスクとは、本疾患の罹りやすさや罹りにくさなどの本疾患に罹る可能性をいう。「罹患リスクを評価する」とは、例えば、現在または将来において本疾患に罹る可能性をいくつかのレベルに分けて出力することや、数値により出力することを含む。本疾患のリスクの評価には、疾患に罹りやすい傾向にあるのか、罹りにくい傾向にあるのかといった、疾患に対する遺伝的要因あるいは遺伝的感受性についての評価が含まれる。
これにより、前立腺癌の罹患リスクに関する情報を得ることができる。
【0014】
さらに、前立腺癌の罹患リスクに関する情報は、対象者が前立腺癌に罹患していることを確認するための生検を行うべきか否かに関する情報を含んでいてもよい。この生検を行うべきか否かに関する情報は、対象者が罹患した前立腺癌の悪性度及び/又は病期分類に関する情報を含むこともできる。これにより、本実施形態の方法は、PSA検査に代えて又は加えて、生検前のスクリーニング検査の一つとして利用することもできる。
【0015】
なお、本疾患のリスクを評価するにあたっては、本疾患のリスクの評価を受ける対象者が、本疾患のリスクの評価時において、実際に本疾患に罹患しているか(発症しているか)否かは問わない。
【0016】
本実施形態の方法は、東アジア人に好適に用いることができる。東アジア人の中でも日本人等の被検者により好適に用いることができる。また、本実施形態の方法は、いずれの男性の被検者に対して用いる。
【0017】
本実施形態において用いる多遺伝子リスクスコアモデルは、前立腺癌に罹患したヒトの遺伝子型データと、前立腺癌に罹患していないヒトの遺伝子型データと、を含むデータを用いてゲノムワイド関連解析により得られた、東アジアのヒトの前立腺がんの評価に関する多遺伝子リスクスコアモデルである。
【0018】
前立腺癌に関係する要因として200近くのバリアントが知られており、それぞれのSNPは疾患リスクにはわずかな影響しか与えないがそのようなSNPが重畳することにより、疾患リスクに対して有意な影響として現れる。本実施形態においてはそれらバリアントを用いた多遺伝子リスクスコアモデルを東アジアのヒト集団に最適化したものであり、本実施形態において用いる多遺伝子リスクスコアモデルにおいて評価するSNPは、GWASにより特定された前立腺癌の罹患リスクに関するSNPであって、東アジアのヒト集団において連鎖不平衡にあるSNPである。
【0019】
より具体的には、ゲノムワイド関連解析のデータ(Ishigaki K et al., bioRxiv (2019))と、東アジアのヒトの集団において連作不平衡のデータ(1000 Genomes Project Consortium. Nature (2015))から、プルーニングと閾値法(pruning and thresholding method)により、24個の多遺伝子リスクスコアモデルを作成した(図1)。
【0020】
次いで、24個の多遺伝子リスクスコアモデルのなかから最も高いAUCを与える多遺伝子リスクスコアモデルを特定した。その結果、東アジア人前立腺癌の罹患リスクに関係するSNP61個を用いる多遺伝子リスクスコアモデルが最も高いAUCを示すことが分かった(図2)。
【0021】
具体的には、本疾患に罹患している日本人男性の被検者313名と、罹患していない日本人男性のコントロール5546名のデータをテストデータとして用いた。各人のデータを多遺伝子リスクスコアモデルに入力し、本疾患に罹患しているか否かを予測し、その偽陽性率と真陽性率を算出し、AUC(Area Under the Curve)を求めた。SNP61個を用いる多遺伝子リスクスコアの値に従って研究対象者を5分位に分類し、5群と前立腺癌リスクの関連解析結果を図3に示す。
【0022】
特に本実施形態においては、GWAS有意水準を満たさないバリアントも含めて多遺伝子リスクスコアモデルを24個作成し、東アジア人前立腺癌の罹患リスクに関係するSNP61個を用いる多遺伝子リスクスコアモデルを選定した。この点において、本実施形態の多遺伝子リスクスコアモデルと、GWAS有意水準を満たすバリアントのみを対象に作成された多遺伝子リスクスコアモデルとは、モデル作成のアプローチが根本的に異なる。
【0023】
多遺伝子リスクスコアモデルの一例としては、特に制限されないが、例えば、対象者の特定のSNPに関する遺伝子型情報を入力とし、本疾患の罹患リスクを出力とするロジスティック回帰モデルを用いることができる。当該ロジスティック回帰モデルは、予め、本疾患に罹患したヒトの遺伝子型データと、本疾患に罹患していないヒトの遺伝子型データと、を学習データとして用いてパラメータを機械学習している。
【0024】
また、多遺伝子リスクスコアモデルとしては、ロジスティック回帰モデルに代えて、プルーニングと閾値法(pruning and thresholding method)、多層パーセプトロン、CNN(Convolutional Neural Network)及びRNN(Recurrent Neural Network)などのニューラルネットワーク、ガウシアンカーネル等の任意のカーネル関数を用いるサポートベクターマシーン、回帰木としてモデル化したランダムフォレスト、重回帰分析、隠れマルコフモデルなどを利用したモデル、統計モデルや確率モデルなど種々の他のモデルを採用することもできる。また、種々のモデルを組み合わせて総合的な評価を行うモデルを採用することもできる。
【0025】
以下、本実施形態の多遺伝子リスクスコアモデルに含まれるSNPのバリアントの情報(GRCh37での染色体番号(chr_name)、塩基ポジション(chr_position)、reference allele、effect allele、effect weight)を列記する。
【0026】
【表1】
【0027】
なお、本明細書において記載するrs番号が他のrs番号と併合され、新たなrs番号が付与された場合には、本明細書において該当するrs番号は、併合後のrs番号及び併合される他のrs番号をも意味する。また、本明細書において記載するrs番号が複数のrs番号の併合により付与された番号である場合には、本明細書において該当するrs番号は、その他の元となるrs番号をも意味する。
【0028】
以下、本実施形態の評価方法の一態様について説明する。但し、評価方法は、以下に限定されない。
【0029】
はじめに、対象者の試料を用いて、試料中の対象者の遺伝子型に関する情報を特定する。対象者の遺伝子型に関する情報とは、一塩基多型における2つのホモ接合型(AA,BB)と、ヘテロ接合型(AB)に分類して示される、一塩基多型の遺伝子型(Genotype)の情報を意味する。
【0030】
このようなSNPの検出に用いる試料としては、染色体DNAを含む試料であれば特に制限されない。試料としては、例えば、唾液、血液、尿等の体液サンプル;口腔粘膜などの細胞サンプル;毛髪等の体毛などが挙げられる。SNPの検出には、これらの試料から常法により単離した染色体DNAを直接使用してもよいし、単離した染色体DNAを増幅して、増幅後の染色体DNAを使用してもよい。このなかでも、より簡便に評価を行う観点から、対象者の唾液サンプルより対象者の遺伝子型に関する情報を得ることが好ましい。
【0031】
SNPの検出は、通常の遺伝子多型解析方法によって行うことができる。例えば、DNAチップ法(DNAマイクロアレイ)、サンガー法を用いた従来型のシーケンサーや次世代シーケンサー(NGS;Next Generation Sequencer)などを用いたシーケンス解析、PCR(Polymerase Chain Reaction)、ハイブリダイゼーション、インベーダー法などが挙げられるが、これらに限定されない。
【0032】
次いで、対象者の遺伝子型に関する情報に基づいて、多遺伝子リスクスコアモデルにより本疾患の罹患リスクを評価する。以下に、多遺伝子リスクスコアモデルを用いた本疾患のリスク評価の一例について説明する。
【0033】
例えば、多遺伝子リスクスコアモデルへの情報の入力の際には、対象者の遺伝子型データを、多遺伝子リスクスコアモデルに入力可能な特徴量に変換するようにしてもよい。特徴量としては、例えば、各SNPについて、対象者の遺伝子型データがホモ接合型(AA)、ホモ接合型(BB)、又はヘテロ接合型(AB)のいずれであるかを示すパラメータが挙げられる。しかし、モデルが、このようなパラメータへの変換の必要がないものである場合には、上記変換は必要とされない。
【0034】
対象者の遺伝子型データの特徴量への変換は、例えば、SNP1つ1つに関して、対象者の遺伝子型データに値を付すことにより行うことができる。例えば、各SNPについて、対象者の遺伝子型データがホモ接合型(AA)、ホモ接合型(BB)、又はヘテロ接合型(AB)のいずれに該当するのかに応じて、そのSNPに値(例えば、0又は1)を対応づける。これにより、対象者の遺伝子型データを特徴量に変換することができる。なお、以下では、各SNPに対応させる値を0又は1とした場合を例に説明するが、SNPに対応させる値は0又は1の2つの値に限られるものではない。
【0035】
接合型に対応づける値はSNPごとに決めることができる。例えば、あるSNPは、対象者の遺伝子型データがホモ接合型(AA)である場合に値1を対応付け、ホモ接合型(BB)及びヘテロ接合型(AB)である場合に値0を対応付けるようにし、他のSNPは、対象者の遺伝子型データがヘテロ接合型(AB)である場合に値1を対応付け、ホモ接合型(AA)及びホモ接合型(BB)である場合に値0を対応付けるようにしてもよい。そのほか、対象者の遺伝子型データがヘテロ接合型(AB)及びホモ接合型(BB)である場合に値1を対応付け、ホモ接合型(AA)である場合に値0を対応付けるようにしてもよい。
【0036】
さらに、本実施形態の評価方法は、PSA検査と複合して用いてもよい。以下、PSA検査と複合して用いる場合(以下、「複合法」ともいう。)の一例について記載する。
【0037】
複合法では、2つのパターンが考えられる。一つは、多遺伝子リスクスコアモデルに上記SNPを特徴量として入力可能な点は変更せずに、さらに、PSA検査により得られた前立腺特異抗原の血中濃度に関する情報を特徴量として入力できるようなモデルへ変更し、SNPに関する情報と前立腺特異抗原の血中濃度に関する情報を、多遺伝子リスクスコアモデルに入力して、前立腺癌の罹患に関する情報を出力するパターンである。この一つ目のパターンで用いるモデルを、前立腺特異抗原の血中濃度に関する情報を考慮しない上述の多遺伝子リスクスコアモデルと区別するために第1スクリーニングモデルと呼称する。
【0038】
また、二つ目は、多遺伝子リスクスコアモデルから罹患リスクを出力し、その出力結果とPSA検査により得られた前立腺特異抗原の血中濃度に関する情報とを、別のモデル(以下、「第2スクリーニングモデル」ともいう。)へ入力し、前立腺癌の罹患に関する情報を出力するパターンである。
【0039】
第1スクリーニングモデルと第2スクリーニングモデルの違いは、第1スクリーニングモデルが一つのモデルで対象者の遺伝子型に関する情報とPSA検査に基づいて前立腺癌の罹患に関する情報を出力するのに対して、第2スクリーニングモデルは上述した多遺伝子リスクスコアモデルで遺伝的要因からの罹患リスクを出力してから、その結果とPSA検査をさらに別のモデルに入力して、前立腺癌の罹患に関する情報を出力するという点にある。
【0040】
しかしながら、その目的とするところは同一であり、この第1スクリーニングモデル及び第2スクリーニングモデルによれば、対象者の遺伝子型に関する情報に基づいて遺伝的要因から罹患リスクを評価することに加え、対象者のPSA検査の結果に基づいて現状から罹患リスクを評価することができる。
【0041】
第1スクリーニングモデルと第2スクリーニングモデルの出力する前立腺癌の罹患に関する情報は、対象者が罹患した前立腺癌の進行に関する情報を含んでいてもよい。これにより、出力される情報に基づいて、対象者の遺伝的要因及び現況に基づいて、生検の実施の有無を判断することができる。
【0042】
また、第1スクリーニングモデルと第2スクリーニングモデルには、対象者の年齢に関する情報をさらに入力するようにしてもよい。これにより、出力される前立腺癌の進行に関する情報の精度をより向上することができる。
【産業上の利用可能性】
【0043】
本発明の方法は、医療やヘルスケアに関連する分野において、本疾患のリスクを評価し、その予防および/または治療に貢献するものである。
図1
図2
図3