IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ スリービリエンの特許一覧

特表2022-518660新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム及び方法
<>
  • 特表-新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム及び方法 図1
  • 特表-新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム及び方法 図2
  • 特表-新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム及び方法 図3
  • 特表-新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム及び方法 図4
  • 特表-新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム及び方法 図5
  • 特表-新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム及び方法 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-03-16
(54)【発明の名称】新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム及び方法
(51)【国際特許分類】
   G16B 25/00 20190101AFI20220309BHJP
【FI】
G16B25/00
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021530300
(86)(22)【出願日】2019-08-20
(85)【翻訳文提出日】2021-05-26
(86)【国際出願番号】 KR2019010563
(87)【国際公開番号】W WO2020111451
(87)【国際公開日】2020-06-04
(31)【優先権主張番号】10-2018-0151779
(32)【優先日】2018-11-30
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】521229072
【氏名又は名称】スリービリエン
【氏名又は名称原語表記】3BILLION
【住所又は居所原語表記】14th floor, yeonbong building, 416, Teheran-ro, Gangnam-gu Seoul 06193, Republic of Korea
(74)【代理人】
【識別番号】110002262
【氏名又は名称】TRY国際特許業務法人
(72)【発明者】
【氏名】イ ジョンソル
(57)【要約】
本発明は、単一遺伝子を特定し、前記単一遺伝子の発現量に応じて、高発現患者群と低発現患者群とを振り分ける患者群分類部と、前記高発現患者群と前記低発現患者群とから全ての遺伝子の予後連関性値を計算する予後連関性算出部と、全ての遺伝子に対して、前記高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値と、を比較する予後連関性比較部と、前記比較値から患者群を振り分けるバイオマーカーを選定するバイオマーカー選定部と、を含む、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システムを提供する。
【特許請求の範囲】
【請求項1】
単一遺伝子を特定し、前記単一遺伝子の発現量に応じて、高発現患者群と低発現患者群とを振り分ける患者群分類部と、
前記高発現患者群と前記低発現患者群とから全ての遺伝子の予後連関性値を計算する予後連関性算出部と、
全ての遺伝子に対して、前記高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値と、を比較する予後連関性比較部と、
前記比較値から患者群を振り分けるバイオマーカーを選定するバイオマーカー選定部と、
を含む、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム。
【請求項2】
前記バイオマーカーを基準にして、高発現患者群または低発現患者群から、前記予後連関性値で新規の標的タンパク質を選定する新規の標的タンパク質選定部を更に含む、請求項1に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム。
【請求項3】
前記予後連関性値は、患者の予後データである遺伝子発現量、疾病が再発する期間、疾病が再発するか否か、に応じて計算されることを特徴とする、請求項1に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム。
【請求項4】
前記高発現患者群と前記低発現患者群とを振り分ける基準発現値は、患者群の平均値またはステップマイナーアルゴリズムによって行われることを特徴とする、請求項1に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム。
【請求項5】
前記予後連関性値は、ログランク検定法(log‐rank test)、コックスハザード比(Cox hazard ratio)、または患者羅列法によるログランク検定法のうち、何れか一つによって生成されることを特徴とする、請求項1に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム。
【請求項6】
前記高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値との比較は、ピアソンの相関係数(Pearson’s correlation coefficient)、ユークリッド距離(Eucledian distance)、マハラノビス距離(Mahalanobis distance)、タニモト係数(Tanimoto coefficient)のうち、何れか一つによって行われることを特徴とする、請求項1に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム。
【請求項7】
患者群分類部において単一遺伝子を特定し、前記単一遺伝子の発現量に応じて、高発現患者群と低発現患者群とを振り分ける第1のステップと、
予後連関性算出部において、前記高発現患者群と前記低発現患者群とから全ての遺伝子の予後連関性値を計算する第2のステップと、
予後連関性比較部において、全ての遺伝子に対して、前記高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値と、を比較する第3のステップと、
バイオマーカー選定部において、前記予後連関性値の比較から患者群を振り分けるバイオマーカーを選定する第4のステップと、
を含む、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法。
【請求項8】
新規の標的タンパク質選定部において、前記バイオマーカーを基準にして、高発現患者群または低発現患者群から、前記予後連関性値で新規の標的タンパク質を選定する第5のステップを更に含む、請求項7に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法。
【請求項9】
前記予後連関性値は、患者の予後データである遺伝子発現量、疾病が再発する期間、疾病が再発するか否か、に応じて計算されることを特徴とする、請求項7に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法。
【請求項10】
前記高発現患者群と前記低発現患者群とを振り分ける基準発現値は、患者群の平均値またはステップマイナーアルゴリズムによって行われることを特徴とする、請求項7に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法。
【請求項11】
前記予後連関性値は、ログランク検定法(log‐rank test)、Cox hazard ratio、または患者羅列法によるログランク検定法のうち、何れか一つによって生成されることを特徴とする、請求項7に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法。
【請求項12】
前記高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値との比較は、ピアソンの相関係数(Pearson’s correlation coefficient)、ユークリッド距離(Eucledian distance)、マハラノビス距離(Mahalanobis distance)、タニモト係数(Tanimoto coefficient)のうち、何れか一つによって行われることを特徴とする、請求項7に記載の、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予後データを用いて、新規の標的タンパク質と、それに関する同伴診断バイオマーカーを発掘するシステム及び方法に関する。
【背景技術】
【0002】
精密診断医学は、患者の特性に応じて患者に対する治療法を精密に提示する概念である。
【0003】
古典的には、性別、年齢帯などのように、患者群を少数の下位群に振り分けて、治療に対する効果の差異を探索し、若しこのような特性に応じて治療の効果が相違する場合、患者をそのような特性に応じて下位群集化した上、それに適した治療法を提示してきた。しかし、個人の遺伝情報を大量に獲得するのが技術的に可能になることによって、同一あるいは類似した遺伝的な特徴を共有する少数の患者群から最大の治療の効果が期待できる治療法を提示しようとする努力が進行しつつある。よって、最大の治療の効果が期待できる患者群を選別するための遺伝的な特徴を探索及び発掘することは重要な問題である。
【0004】
近来、癌細胞の遺伝的な特徴を大量に測定できる技術が開発されたことに従い、1)遺伝子の発現量、2)遺伝子のプロモーターメチレーションの程度、3)遺伝子のコピー数変異などの特性値を、数万個の遺伝子に対して同時に測定し、このような大量の特性を用いて患者群を下位群集化しようとする試みが進行しつつある。
【0005】
しかし、従来の群集化作業は、様々なクラスタリング技法を用いて行われ、多少機械的に群集化が行われるため、このように探索された下位群集が共有している生物学的な特徴を再び探索しなければならない問題があり、あまりにも大容量の特性値で患者群を下位群集化しようとすると、どちらの特性値が、患者群の下位群集化において重要なのかが不明になる問題がある。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明が達成しようとする技術的課題は、治療反応性が類似していると期待される患者群とを振り分けるためのバイオマーカーと、その患者群の治療において効果的な新規の標的タンパク質を探索するためのシステム及び方法を提供することである。
【課題を解決するための手段】
【0007】
このような課題を解決するために、本発明の実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システムは、単一遺伝子を特定し、前記単一遺伝子の発現量に応じて、高発現患者群と低発現患者群とを振り分ける患者群分類部と、前記高発現患者群と前記低発現患者群とから全ての遺伝子の予後連関性値を計算する予後連関性算出部と、全ての遺伝子に対して、前記高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値と、を比較する予後連関性比較部と、前記比較値から最初に患者群を振り分けた前記単一遺伝子を、患者群を振り分けるバイオマーカーで選定するバイオマーカー選定部と、を含む。
【0008】
前記バイオマーカーを基準にして、高発現患者群または低発現患者群から、前記予後連関性値で新規の標的タンパク質を選定する新規の標的タンパク質選定部を更に含むことができる。
【0009】
前記予後連関性値は、患者の予後データである遺伝子発現量、疾病が再発する期間、疾病が再発するか否か、に応じて計算され得る。
【0010】
前記高発現患者群と前記低発現患者群とを振り分ける基準発現値は、患者群の平均値またはステップマイナーアルゴリズムによって行われ得る。
【0011】
前記予後連関性値は、ログランク検定法(log‐rank test)、コックスハザード比(Cox hazard ratio)、または患者羅列法によるログランク検定法のうち、何れか一つによって生成され得る。
【0012】
前記高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値との比較は、ピアソンの相関係数(Pearson’s correlation coefficient)、ユークリッド距離(Eucledian distance)、マハラノビス距離(Mahalanobis distance)、タニモト係数(Tanimoto coefficient)のうち、何れか一つによって行われ得る。
【0013】
上述した本発明の技術的課題の以外にも、本発明の他の特徴及び利点を以下で記述するか、そのような記述及び説明から、本発明が属する技術分野における通常の知識を有する者であれば明確に理解できるだろう。
【発明の効果】
【0014】
以上のような本発明によると、次のような効果がある。
【0015】
本発明は、治療に対する反応性を予測するためのバイオマーカーと類似した遺伝的な特徴を共有する患者群において、効果的な標的タンパク質を同時に発掘することができる。
【0016】
本発明は、新規の標的であると予想されるタンパク質を抑制する薬物の処方を受けたデータがなくても、新規の標的タンパク質と、それに関する同伴診断バイオマーカーを発掘することができる。
【0017】
その他にも、本発明の実施例を通じて、本発明の更なる他の特徴及び利点が新しく把握できるだろう。
【図面の簡単な説明】
【0018】
図1】本発明の一実施例に係る、新規の標的タンパク質と、それに関するバイオマーカーの発掘システムの構成図である。
図2】本発明の実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システムを用いて計算した実際の結果の一部を示す図である。
図3】NFKBIE低発現群におけるPAK1の予後連関性値を示す実験図である。
図4】NFKBIE高発現群におけるPAK1の予後連関性値を示す実験図である。
図5】全ての患者のPAK1の予後連関性値を示す実験図である。
図6】本発明の一実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法のフロー図である。
【発明を実施するための形態】
【0019】
本明細書において、各図面の構成要素に参照番号を付加するに際し、同じ構成要素に限っては、たとえ他の図面上に表示されるとしても、なるべく同じ番号を持たせていることに留意して欲しい。
【0020】
なお、本明細書において記述されている用語の意味は、次のように理解して欲しい。
【0021】
「含む」または「有する」などの用語は、一つまたはそれ以上の他の特徴や数字、段階、動作、構成要素、部分品、またはこれらを組み合わせたものの存在または付加の可能性を予め排除しないことと理解すべきである。
【0022】
以下、添付の図面を参考しながら、上記の問題点を解決するために考案された本発明の望ましい実施例について詳しく説明する。
【0023】
図1は、本発明の一実施例に係る、新規の標的タンパク質と、それに関するバイオマーカーの発掘システムの構成図である。
【0024】
図1に示すように、本発明の一実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム1000は、患者群分類部100、予後連関性算出部200、予後連関性比較部300、バイオマーカー選定部400、新規の標的タンパク質選定部500、及びデータベース600を含む。
【0025】
データベース600は、患者の予後データを格納することができる。ここで、予後データは、患者に対して全2万余個の遺伝子に対する遺伝子発現量、患者の死亡の有無(または再発の有無)、及び患者が死亡するまでの期間(または再発の期間)に関する情報である。
【0026】
患者群分類部100は、前記予後データを用いて任意の単一遺伝子を特定した上、前記単一遺伝子の特定発現量に応じて、高発現患者群と低発現患者群とを振り分けることができる。
【0027】
この際、高発現患者群と低発現患者群とを振り分ける基準発現値は、一般的に広く利用されている方法である患者群の平均値、あるいは両患者群の発現値が発現量を基準にして昇順に整列する場合、単一計算関数(step function)のような形態である場合、どの部分から値の変化が著しく現われるのかを統計的に探索可能であるステップマイナーアルゴリズム(step miner algorithm)を用いて探索することができる(stepminer文献:Extracting binary signals from microarray time‐course data)。本発明の実施例では、高発現患者群と低発現患者群とを振り分ける基準発現値を、患者群の平均値またはstepminerアルゴリズムを利用することに限定して説明するが、該業界において基準発現値を探索するために使われる通常のものであれば何れも使用可能である。
【0028】
予後連関性算出部200は、高発現患者群と低発現患者群とのそれぞれから全ての遺伝子に対する予後連関性値を計算することができる。
【0029】
予後連関性値は、患者の予後データである遺伝子発現量、疾病が再発する期間、疾病が再発するか否か、に応じて計算され得る。
【0030】
この際、予後連関性値は、一般的に多く使われているログランク検定法(log‐rank test)、コックスハザード比(Cox hazard ratio)、または患者羅列法によるログランク検定法のうち、何れか一つによって生成され得る。
【0031】
ログランク検定法(log‐rank test)またはコックスハザード比(Cox hazard ratio)は、当業者にとって公知の技術なので、詳細な説明は省略する。
【0032】
患者羅列法によるログランク検定法に関する内容は、Robust method for identification of prognostic gene signatures from gene expression profiles、Woogwang Sim、Jungsul Lee & Chulhee Choi、Scientific Reports、volume 7、Article number:16926(2017)を参照できる。
【0033】
予後連関性比較部300は、全ての遺伝子に対して、高発現患者群における予後連関性値と、低発現患者群における予後連関性値と、を比較することができる。
【0034】
例えば、全ての遺伝子の1番目からN番目までに対して、患者群分類部100は、遺伝子mを特定し、遺伝子mの発現量に応じて、高発現患者群mHと低発現患者群mLとに振り分ける。
【0035】
なお、予後連関性算出部200は、遺伝子の1番目からN番目までの全ての遺伝子の予後連関性を計算する。
【0036】
さらに、予後連関性比較部300は、全ての遺伝子のi(1番目ないしN番目)に対して、mLiとmHiの値を比較する。mL1は、遺伝子mが低発現患者群mLにおける遺伝子の1番目の予後連関性値である。
【0037】
つまり、予後連関性比較部300は、mLiとmHiの値の比較は互いに充分に異なっているかを確認するところ、mLiとmHiの値の類似性の程度は、ピアソンの相関係数(Pearson’s correlation coefficient)、ユークリッド距離(Eucledian distance)、マハラノビス距離(Mahalanobis distance)、タニモト係数(Tanimoto coefficient)のうち、何れか一つによって行われ得る。
【0038】
ピアソンの相関係数(Pearson’s correlation coefficient)は、対応標本が類似した線形変換を通じて変化されたのであるか否かを確認することができる。ユークリッド距離(Eucledian distance)は、平面上の両点の距離を計算する方式を多次元の空間へ拡張させて距離を測る方式であり、マハラノビス距離(Mahalanobis distance)は、空間上の座標軸が、同じ密度ではなく、何れかの一軸が激しく圧縮または膨脹されたことを考慮して距離を測る方式である。タニモト係数(Tanimoto coefficient)は、両集合がどのくらい類似しているかを確認するために、両集合の合集合の大きさで交集合の大きさを除した値である。タニモト係数を用いて、両患者群における遺伝子の予後連関性の程度を比べる際には、mHiあるいはmLiの値のうち、統計的に優位な値を有する遺伝子集合に対して計算する。例えば、mL患者群において、ログランク検定法を用いて各遺伝子の予後連関性を計算した場合、統計的に有意であると言える1.64以上のchi‐square値を有する遺伝子からなる集合Aを求める。同じ方法で、mH患者群から遺伝子集合Bを求める。この両集合に対して、AとBとの交集合の元素数を、AとBとの合集合の元素数で除した値を、両集合の類似性を示す値として使うことができる。
【0039】
バイオマーカー選定部400は、高発現患者群の予後連関性値mHiと、低発現患者群の予後連関性値mLiとの比較値から患者群を振り分けるバイオマーカーを選定することができる。
【0040】
バイオマーカー選定部400は、バイオマーカーを選定するために、両患者のグループ間の遺伝子の予後連関性類似度の値を既に設定された値と比較する。
【0041】
例えば、バイオマーカー選定部400は、(mL1とmH1)、(mL2とmH2)、…、(mLNとmHN)の全ての遺伝子の比較を通じて計算した類似度の値が、既に設定された値以上であるか否かに応じて、特定遺伝子mをバイオマーカーで選定するか否かを決定することができる。
【0042】
この際、バイオマーカー選定部400は、特定遺伝子mをバイオマーカーで選定しないと、再び患者群分類部100へ次の単一遺伝子に対して作業を進行するように指示することができる。
【0043】
本発明の他の実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム1000は、新規の標的タンパク質選定部500を更に含むことができる。
【0044】
新規の標的タンパク質選定部500は、バイオマーカーを基準にして、高発現患者群または低発現患者群において、前記予後連関性値で新規の標的タンパク質を選定することができる。
【0045】
その一例として、予後連関性値が大きいほど、患者の予後に悪く影響を与えるということを意味することができる。
【0046】
例えば、単一遺伝子mの発現量に応じた低発現患者群では、遺伝子の2番目の発現が高いほど、死亡や転移の時間が短くて、予後に悪く影響を与える予後連関性値が最も大きかったのであり、単一遺伝子mの発現量に応じた高発現患者群では、遺伝子の34番目の発現が高いほど、死亡や転移の時間が短くて、予後に悪く影響を与える予後連関性値が最も大きかったのであり、一方、遺伝子の2番目は、単一遺伝子mの発現の低い低発現患者群に対する新規の標的タンパク質となり、遺伝子の34番目は、単一遺伝子mの発現の高い高発現患者群に対する新規の標的タンパク質となる。
【0047】
この際、このように探索された新規の標的タンパク質を抑制する薬物の効果を極大化するために、患者を選別するためのバイオマーカーは単一遺伝子mになる。
【0048】
以上のように、本発明の実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム1000は、治療に対する反応性を予測するためのバイオマーカーと類似した遺伝的な特徴を共有する患者群において、効果的な標的タンパク質を同時に発掘可能である。
【0049】
新薬開発会社の場合、自社の薬物の効果を極大化することができる患者群を選別するバイオマーカーの発掘に大きな関心を有している。
【0050】
新薬の場合、同伴診断バイオマーカーの有無に応じて、開発の期間及び開発の費用を節減することができる。
【0051】
従来は、既に標的を認知している治療剤の処方を受けた患者群を、特定のタンパク質の突然変異の有無に応じて患者群を振り分けた上、治療剤に対する反応性を確認していたため、新しい標的タンパク質を発掘することが出来ず、単にそのような特定の突然変異が治療に対する同伴診断バイオマーカーになるか否かを確認可能であるだけである。
【0052】
ところが、本発明の実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム1000は、新規の標的であると予想されるタンパク質を抑制する薬物の処方を受けたデータがなくても、新規の標的タンパク質と、それに関する同伴診断バイオマーカーを発掘可能である。
【0053】
図2は、本発明の実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システムを用いて計算した実際の結果のうち、一部を示す図である。
【0054】
図2に示すように、予後連関性値は、患者羅列法によるログランク検定法で計算したものであって、負数の場合、遺伝子の発現量が高くて、患者の死亡や転移が速く発生して予後が悪いことを意味する。
【0055】
計8個のデータセットが利用可能であったのであり、全651人の患者データが使われた。
【0056】
以下は、上の計算で使われたデータセットのそれぞれに関する簡略な説明である。
【0057】
GSE17891:2011年4月に公開された英国データであって、27人の患者の試料を含む。参考文献:Collisson EA、Sadanandam A、Olson P、Gibb WJ et al.Subtypes of pancreatic ductal adenocarcinoma and their differing responses to therapy.Nat Med 2011 Apr;17(4):500‐3
【0058】
GSE21501:2010年7月に公開された米国データであって、130人の患者の試料を含む。参考文献:Stratford JK、Bentrem DJ、Anderson JM、Fan C et al.A six‐gene signature predicts survival of patients with localized pancreatic ductal adenocarcinoma.PLoS Med 2010 Jul 13;7(7):e1000307
【0059】
GSE57495:2015年8月に公開された米国データであって、63人の患者の試料を含む。参考文献:Chen DT、Davis‐Yadley AH、Huang PY、Husain K et al.Prognostic Fifteen‐Gene Signature for Early Stage Pancreatic Ductal Adenocarcinoma.PLoS One 2015;10(8):e0133562.
【0060】
GSE62452:2016年7月に公開された米国データであって、130人の患者の試料を含む。参考文献:YangS、HeP、WangJ、Schetter A et al.A Novel MIF Signaling Pathway Drives the Malignant Character of Pancreatic Cancer by Targeting NR3C2.Cancer Res 2016 Jul 1;76(13):3838‐50.
【0061】
GSE71729:2015年9月に公開された米国データであって、145人の患者の試料を含む。参考文献:Moffitt RA、Marayati R、Flate EL、Volmar KE et al.Virtual microdissection identifies distinct tumor‐ and stroma‐specific subtypes of pancreatic ductal adenocarcinoma.Nat Genet 2015 Oct;47(10):1168‐78
【0062】
GSE79668:2016年6月に公開された米国データであって、51人の患者の試料を含む。参考文献:Kirby MK、Ramaker RC、Gertz J、Davis NS et al.RNA sequencing of pancreatic adenocarcinoma tumors yields novel expression patterns associated with long‐term survival and reveals a role for ANGPTL4.Mol Oncol 2016 Oct;10(8):1169‐82
【0063】
PAAD‐US:国際癌研究コンソーシアムICGCに公開された米国データ、計185人の患者のデータを含む。データアドレス:https://dcc.icgc.org/releases/release_27/Projects/PAAD‐US
【0064】
PACA‐AU:国際癌研究コンソーシアムICGCに公開されたオーストラリアデータ、計461人の患者のデータを含む。データアドレス:https://dcc.icgc.org/releases/release_27/Projects/PACA‐AU
【0065】
NFKBIE未発現群とNFKBIE発現群とのそれぞれから、PAK1の予後連関性値をそれぞれのデータセットで患者羅列法によるログランク検定法によって計算した。
【0066】
その具体的な計算法は、データセットGSE62452に対して、各患者が死亡するまでの期間(日数)、死亡の発生有無、NFKBIEの発現有無、PAK1の発現量に対する情報が与えられた場合、NFKBIE未発現群におけるPAK1の予後連関性点数を患者羅列法によって計算し、その計算法は次のようである。
【0067】
GSE62452には、下の表1のように、計130個の試料が存在し、このうち、癌組織は66個である。66個の癌組織におけるNFKBIEの平均発現量は0.13574であるため、NFKBIEの発現量が0.13574未満の患者のみを選別する。
【0068】
【表1】
選別されたNFKBIE低発現群の患者に対して、PAK1の発現量に応じて、患者を表2のように整列する。
【0069】
【表2】
【0070】
その後、PAK1の発現が最も低い患者(GSM1527227)をlow PAK1 groupとし、残りの患者をhigh PAK1 groupとしてログ検定分析をすると、chi‐square値が2.106となる。
【0071】
次に、PAK1の発現順位が2番目である患者を除き、3番目の順位の患者から残りの全ての患者のみをhigh PAK1 groupとしてログ検定分析をし、chi‐square値として2.186を記録する。
【0072】
このように、PAK1の発現順に整列されている患者群P(1)、…、P(n)に対して、i<jを満たす全てのi<j対に対して、{P(1)、…、P(i)}はPAK1低発現患者群とし、{P(j)、…、P(n)}はPAK1高発現患者群として、各場合に対するログ検定値を求めたことによるn*(n‐1)/2個のchi‐square値の平均値が、患者羅列法によるログランク検定法によって求めたPAK1の予後連関性の点数である(参照:Robust method for identification of prognostic gene signatures from gene expression profiles、Scientific Reportsvolume 7、Article number:16926(2017))。
【0073】
その後、NFKBIE高発現群(0.13574以上発現された患者群)に対して、同じ作業をして、NFKBIE高発現群におけるPAK1の予後連関性の点数を計算する。このような作業を使用可能な全てのデータセットに対して行う。
【0074】
その後、各データセットから求められた統計的な有意度が分かるz‐値を取り合わせて、単一数値である最終の予後点数を計算した。この際、取り合わせには統計数値(z‐値あるいはp‐値)と、それに使われた患者数とを何れも考慮して取り合わせるLiptak’s z‐value計算法(J Evol Biol.2011 Aug;24(8):1836‐41.doi:10.1111/j.1420‐9101.2011.02297.x.Epub 2011 May 23.Optimally weighted Z‐test is a powerful method for combining probabilities in meta‐analysis.Zaykin)を用いた。Liptak’s z‐valueは、標準規定分布に従うものとして知られており、それによって、有意水準0.05で優位なz‐値の絶対値は略1.64であり、これ以上のz‐値を有する遺伝子を優位なものとして見做すことができる。
【0075】
NFKBIE未発現群では、多数のデータセットでPAK1が予後に悪いということが確認できる(<‐1.64)。この際、z値が負数であることは、遺伝子の発現が高いほど、患者の予後が悪いということを意味し、z値が陽数であることは、遺伝子の発現が高いほど、患者の予後が良いということを意味する。
【0076】
よって、PAK1は、膵膓癌において新規の標的タンパク質になることができ、この際、NFKBIEはPAK1抑制剤の効果を期待することができる患者を選別するための同伴診断バイオマーカーである。
【0077】
若し、患者をNFKBIEの発現に振り分けずに、全ての患者を対象にしてPAK1の予後連関性の点数を計算すると、統計的に有意ではない値(‐1.1280)であって、即ち、NFKBIEの発現量を基準にして患者を群集化すればこそ、PAK1を標的タンパク質として探索できるということを傍証する。
【0078】
図3は、NFKBIE低発現群におけるPAK1の予後連関性値を示す実験図であり、図4は、NFKBIE高発現群におけるPAK1の予後連関性値を示す実験図であり、図5は、全ての患者のPAK1の予後連関性値を示す実験図である。
【0079】
図3に示すように、NFKBIE低発現群内では、PAK1の発現の高い患者群の死亡率が、PAK1の発現の低い患者群の死亡率よりも高いことが分かる。
【0080】
図4に示すように、NFKBIE高発現群内では、PAK1の発現の高い患者群の死亡率と、PAK1の発現の低い患者群の死亡率との差異が大きくないことが分かる。
【0081】
図5に示すように、NFKBIEの発現量で患者群を振り分けずに、全ての患者を対象にする場合、PAK1の発現による死亡率において差異がないことが分かる。
【0082】
このように、PAK1は、新規の標的タンパク質になることができ、この際、NFKBIEは、PAK1抑制剤の効果の期待ができる患者を選別するための同伴診断バイオマーカーになり得る。
【0083】
以下では、本発明の一実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法を説明する。以下では、説明の便宜のため、前述した図1において言及した参照番号を言及しながら説明し、以上で説明した内容と重複している内容は省略する。
【0084】
図6は、本発明の一実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法のフロー図である。
【0085】
図6に示すように、一実施例に係る、新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘方法は、患者群を分類する第1のステップS100と、予後連関性値を計算する第2のステップS200と、各患者群の予後連関性値を比較する第3のステップS300と、バイオマーカーを選定する第4のステップS400と、新規の標的タンパク質を選定する第5のステップS500と、を含む。
【0086】
第1のステップS100は、患者群分類部100において単一遺伝子を特定し、前記単一遺伝子の発現量に応じて、高発現患者群と低発現患者群とを振り分けることができる。
【0087】
第2のステップS200は、予後連関性算出部200において、前記高発現患者群と前記低発現患者群とから全ての遺伝子の予後連関性値を計算することができる。
【0088】
第3のステップS300は、予後連関性比較部300において、全ての遺伝子に対して、前記高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値と、を比較することができる。
【0089】
この際、高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値と、を比較し、特定の単一遺伝子をバイオマーカーで選定しないと、再び患者群分類部100に次の単一遺伝子に対して作業を進行するようになる。
【0090】
第4のステップS400は、バイオマーカー選定部400において、高発現患者群の予後連関性値と、前記低発現患者群の予後連関性値と、の比較から患者群を振り分けるバイオマーカーを選定することができる。
【0091】
第5のステップS500は、新規の標的タンパク質選定部において、前記バイオマーカーを基準にして、高発現患者群または低発現患者群において、前記予後連関性値で新規の標的タンパク質を選定することができる。
【0092】
以上で説明した本発明は、前述した実施例及び添付の図面に限定されず、本発明の技術的思想を脱しない範囲内で、様々な置き換え、変形、及び変更が可能であるということは、本発明が属する技術分野において、通常の知識を持った者にとって自明であるだろう。
図1
図2
図3
図4
図5
図6
【国際調査報告】