IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ ユニバーシティ オブ ノース カロライナ アット チャペル ヒルの特許一覧

特表2022-551921癌表現型を決定する為のDNAコピー数異常(CNA)
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-14
(54)【発明の名称】癌表現型を決定する為のDNAコピー数異常(CNA)
(51)【国際特許分類】
   C12Q 1/68 20180101AFI20221207BHJP
   C12Q 1/02 20060101ALI20221207BHJP
   C12Q 1/6827 20180101ALI20221207BHJP
   C12Q 1/6869 20180101ALI20221207BHJP
   C12N 15/11 20060101ALI20221207BHJP
   G01N 33/50 20060101ALI20221207BHJP
【FI】
C12Q1/68
C12Q1/02
C12Q1/6827 Z
C12Q1/6869 Z
C12N15/11 Z
G01N33/50 P
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022521656
(86)(22)【出願日】2020-10-09
(85)【翻訳文提出日】2022-06-08
(86)【国際出願番号】 US2020055093
(87)【国際公開番号】W WO2021072280
(87)【国際公開日】2021-04-15
(31)【優先権主張番号】62/912,727
(32)【優先日】2019-10-09
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
2.ANDROID
3.JAVA
4.JAVASCRIPT
5.SMALLTALK
6.WINDOWS
7.PYTHON
8.RUBY
(71)【出願人】
【識別番号】501345323
【氏名又は名称】ザ ユニバーシティ オブ ノース カロライナ アット チャペル ヒル
【氏名又は名称原語表記】THE UNIVERSITY OF NORTH CAROLINA AT CHAPEL HILL
(74)【代理人】
【識別番号】100107364
【弁理士】
【氏名又は名称】斉藤 達也
(72)【発明者】
【氏名】ペルー,チャールズ,エム.
(72)【発明者】
【氏名】パーカー,ジョエル,エス.
(72)【発明者】
【氏名】シャ,ユーリ
(72)【発明者】
【氏名】ファン,チェン
【テーマコード(参考)】
2G045
4B063
【Fターム(参考)】
2G045AA26
2G045DA13
2G045DA14
4B063QA08
4B063QA12
4B063QA13
4B063QA17
4B063QA19
4B063QQ02
4B063QQ28
4B063QQ42
4B063QQ62
4B063QR08
4B063QR32
4B063QR42
4B063QR56
4B063QR62
4B063QR66
4B063QR72
4B063QS03
4B063QS34
4B063QS36
4B063QX02
(57)【要約】
本開示は、患者サンプルのコピー数異常(CNA)に基づいて、癌に関係する表現型の計算された癌シグネチャーを生成する為の方法を提供する。計算された癌シグネチャーは、体細胞変異、mRNA発現シグネチャー、又は蛋白質発現シグネチャーに対応し得る。本開示は、計算された癌表現型を用いて患者を処置する方法をもまた提供する。加えて、本開示は、癌表現型を再現する為に、CNAに基づいて、計算されたシグネチャーを生成する為の方法を提供する。
【特許請求の範囲】
【請求項1】
(a)患者からのサンプルを得る事又は得た事と;
(b)複数の染色体上の複数の位置に於いて複数のコピー数異常(CNA)を測定する事又は測定した事と;
(c)mRNA発現データ及び分子サブタイプに基づく数理モデルを用いて、測定されたCNAを分析する事と、
を含み、
数理モデルが、サンプルの計算された癌シグネチャーを生成する様にして少なくとも2つの異なる統計方法に依ってバリデーションされている、
患者からのサンプルの計算された癌シグネチャーを生成する方法。
【請求項2】
50超のCNAが測定される、請求項1に記載の方法。
【請求項3】
100超のCNAが測定される、請求項1に記載の方法。
【請求項4】
約250及び約400の間のCNAが測定される、請求項1に記載の方法。
【請求項5】
計算された癌シグネチャーが体細胞変異シグネチャーに対応する、請求項1に記載の方法。
【請求項6】
体細胞変異シグネチャーを調える為の数理モデルが補足表6の10以上のベータ係数値に基づく、請求項5に記載の方法。
【請求項7】
計算された癌シグネチャーがmRNA発現シグネチャーに対応する、請求項1に記載の方法。
【請求項8】
計算された癌シグネチャーが乳癌サブタイプのシグネチャーである、請求項1に記載の方法。
【請求項9】
乳癌サブタイプシグネチャーを調える為の数理モデルが補足表4の10以上のベータ係数値に基づく、請求項7に記載の方法。
【請求項10】
計算された癌シグネチャーが蛋白質発現シグネチャーに対応する、請求項1に記載の方法。
【請求項11】
蛋白質発現シグネチャーを調える為の数理モデルが補足表5の10以上のベータ係数値に基づく、請求項10に記載の方法。
【請求項12】
蛋白質発現シグネチャーが免疫組織化学(IHC)シグネチャーである、請求項10に記載の方法。
【請求項13】
IHCシグネチャーがエストロゲン受容体(ER)、上皮成長因子受容体(EGFR)、ヒト上皮成長因子受容体2(HER2)、プロゲステロン受容体(PR)、又は網膜芽細胞腫(RB)シグネチャーである、請求項12に記載の方法。
【請求項14】
計算された癌シグネチャーがFoundationOne(登録商標)CDX結果、MAMMAPRINT(登録商標)70遺伝子再発スコア、OncotypeDX(商標)再発スコア、又はProsigna(登録商標)再発リスクスコアに対応する、請求項1に記載の方法。
【請求項15】
計算された癌シグネチャーがFoundationOne(登録商標)結果であり、FoundationOne(登録商標)結果を調える為の数理モデルが補足表9の10以上のベータ係数値に基づく、請求項14に記載の方法。
【請求項16】
計算された癌シグネチャーが、膀胱尿路上皮癌(BLCA)、子宮頸部扁平上皮細胞癌及び内頸部腺癌(CESC)、結腸腺癌(COAD)、食道癌(ESCA)、多形性膠芽腫(GBM)、頭頸部扁平上皮細胞癌(HNSC)、淡明腎細胞腎臓癌(KIRC)、乳頭状腎細胞腎臓癌(KIRP)、急性骨髄性白血病(LAML)、脳低悪性度グリオーマ(LGG)、肝細胞肝臓癌(LIHC)、肺腺癌(LUAD)、肺扁平上皮細胞癌(LUSC)、膵臓腺癌(PAAD)、褐色細胞腫及びパラガングリオーマ(PCPG)、前立腺腺癌(PRAD)、直腸腺癌(READ)、肉腫(SARC)、肌の皮膚メラノーマ(SKCM)、胃腺癌(STAD)、精巣胚細胞腫瘍(TGCT)、甲状腺癌(THCA)、胸腺腫(THYM)、又は子宮体部内膜癌(UCEC)シグネチャーである、請求項1に記載の方法。
【請求項17】
計算されたシグネチャーを調える為の数理モデルが補足表14の10以上のベータ係数値に基づく、請求項16に記載の方法。
【請求項18】
複数のコピー数異常(CNA)が全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる、請求項1に記載の方法。
【請求項19】
(a)患者からの生体サンプルを得る事又は得た事と;(b)コピー数が複数の染色体上の複数の位置に於いて測定される生体サンプルの遺伝子レベルコピー数異常(CNA)アッセイを行なう事又は行なった事と;(c)CNAアッセイの結果(to results)を標準のセットと比較して、患者が特定の癌サブタイプを有するかどうかを決定する事と;(d)患者が特定の癌サブタイプを有する場合には、決定された癌サブタイプに基づいて、好適な化学療法レジメンを癌患者に投与する事とに依る、
患者が特定の癌サブタイプを有するかどうかを決定するステップを含む、癌患者を化学療法に依って処置する為の方法。
【請求項20】
化学療法レジメンが継続中の治療介入である、請求項19に記載の方法。
【請求項21】
継続中の治療介入が特定の処置を中止する事を含む、請求項20に記載の方法。
【請求項22】
複数のコピー数異常(CNA)が全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる、請求項19に記載の方法。
【請求項23】
方法が:
(a)癌表現型の複数の遺伝子発現シグネチャー及びサブタイプ情報を受け取る事と;
(b)癌表現型の複数のコピー数異常(CNA)データセットを受け取る事と;
(c)複数のCNAデータセットを人工知能アルゴリズムに依って分析して、癌表現型のCNAセグメントレベルシグネチャーの予備的なセットを得る事と;
(d)遺伝子発現トレーニングセットを用いて予備的なセットのCNAセグメントレベルシグネチャーを修正し、最終セットCNAセグメントレベルシグネチャーを得る事と;
(e)最終セットCNAセグメントレベルシグネチャーを用いて、癌表現型の計算された癌シグネチャーを調える事と、
を含む、
癌表現型の計算された癌シグネチャーを生成する為の方法。
【請求項24】
癌表現型が体細胞変異に関連する、請求項23に記載の方法。
【請求項25】
癌表現型がmRNA発現のレベルに対応する、請求項23に記載の方法。
【請求項26】
癌表現型が蛋白質発現のレベルに対応する、請求項23に記載の方法。
【請求項27】
蛋白質発現のレベルが免疫組織化学(IHC)シグネチャーに対応する、請求項26に記載の方法。
【請求項28】
複数のコピー数異常(CNA)データセットが全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる、請求項23に記載の方法。
【請求項29】
方法が:
(a)患者のコピー数異常(CNA)データを受け取る事と;
(b)癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を受け取り、CNAシグネチャーが癌発現分析、癌サブタイプ情報、及びCNAゲイン/ロス情報に基づく事と;
(c)1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)に対して相対的に患者特性のCNAデータの特性をキャラクタリゼーションする様にして、癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を利用するアルゴリズムに依って、患者のCNAデータを処理する事と;
(d)患者の計算された癌シグネチャーを調える事と、
を含む、
患者の計算された癌シグネチャーを生成する為の方法。
【請求項30】
癌表現型が体細胞変異に関連する、請求項29に記載の方法。
【請求項31】
癌表現型がmRNA発現のレベルに対応する、請求項29に記載の方法。
【請求項32】
癌表現型が蛋白質発現のレベルに対応する、請求項29に記載の方法。
【請求項33】
蛋白質発現のレベルが免疫組織化学(IHC)シグネチャーに対応する、請求項29に記載の方法。
【請求項34】
癌表現型が、副腎、膀胱、骨、乳部、子宮頸部、結腸、肝臓、肺、リンパ、卵巣、膵臓、陰茎、前立腺、直腸、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、気管、又は子宮癌に関連する、請求項29に記載の方法。
【請求項35】
癌表現型が乳癌に関連する、請求項34に記載の方法。
【請求項36】
コピー数異常(CNA)データが全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる、請求項29に記載の方法。
【請求項37】
(a)患者の計算された癌シグネチャーを生成する事と;
(b)患者のコピー数異常(CNA)データを受け取る事と;
(c)癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を受け取り、CNAシグネチャーが癌発現分析、癌サブタイプ情報、及びCNAゲイン/ロス情報に基づく事と;
(d)1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)に対して相対的に患者特性のCNAデータの特性をキャラクタリゼーションする様にして、癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を利用するアルゴリズムに依って患者のCNAデータを処理する事と;
(e)キャラクタリゼーションされた特性に基づいて、患者の計算された癌シグネチャーを調える事と;
(f)計算された癌シグネチャーに基づく処置プランに基づいて患者を処置する事と、
を含む、癌を有する対象を処置する為の方法。
【請求項38】
処置が継続中の治療介入である、請求項37に記載の方法。
【請求項39】
継続中の治療介入が特定の処置を中止する事を含む、請求項38に記載の方法。
【請求項40】
コピー数異常(CNA)データが全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる、請求項37に記載の方法。
【請求項41】
請求項29に記載の患者の計算された癌シグネチャーを生成する為のアルゴリズムに依って、患者CNAデータと癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)とを処理する様に構成されたプロセッサーを含むデバイス。
【請求項42】
請求項41に記載のデバイスを含むシステム。
【請求項43】
癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)と患者CNAデータを比較する為のアルゴリズムを含むソフトウェアを含む、請求項41に記載のデバイス。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は2019年10月9日出願の米国出願第62/912,727号、ペロー等(Perou et al.)、代理人整理番号150-32-PROVの利益を主張する。此れは其の全体が参照に依って此処に組み込まれる。
【0002】
連邦出資の研究又は開発についての申し立て
本発明は国立衛生研究所に依って授与された助成金番号CA58223、CA148761、及びCA195740に依る政府のサポートに依って成された。政府は本発明に或る種の権利を有する。
【0003】
ASCIIテキストファイルとして提出される「配列リスト」、表、又はコンピュータプログラムリスト付属書類の参照
本願は十五の(15)表及び一つの(1)コンピュータプログラムリストを付属書類として含有する。其れ等はASCIIテキストファイルとしてEFSウェブから電子提出された。其れ等は次のファイル属性を有する:(1)補足表1.Supp_Table1.txtと題する遺伝子発現シグネチャーのアノテーションであって、其れは2,042,486バイトのサイズを有し、2019年3月4日に作成された;(2)補足表2.Supp_Table2.txtと題するコピー数セグメントのアノテーションであって、其れは728,822バイトのサイズを有し、2019年10月9日に作成された;(3)補足表3.Supp_Table3.txtと題する遺伝子のエラスティックネットモデルの概要であって、其れは1,236,182バイトのサイズを有し、2019年10月9日に作成された;(4)補足表4.Supp_Table4.txtと題する乳癌の分子サブタイプ及び組織学のエラスティックネットモデルの概要であって、其れは37,355バイトのサイズを有し、2019年10月9日に作成された;(5)補足表5.Supp_Table5.txtと題する乳癌の蛋白質発現及び臨床的な受容体ステータスのエラスティックネットモデルの概要であって、其れは405,443バイトのサイズを有し、2019年10月9日に作成された;(6)補足表6.Supp_Table6.txtと題する乳癌の体細胞変異のエラスティックネットモデルの概要であって、其れは120,280バイトのサイズを有し、2019年10月9日に作成された;(7)補足表7.Supp_Table7.txtと題する乳癌のサブタイプ特異的なシグネチャー予測の概要であって、其れは1,001,837バイトのサイズを有し、2019年10月9日に作成された;(8)補足表8.Supp_Table8.txtと題する肺癌の遺伝子発現シグネチャーのエラスティックネットモデルの概要であって、其れは1,199,707バイトのサイズを有し、2019年10月9日に作成された;(9)補足表9.Supp_Table9.txtと題するFOUNDATIONONE(登録商標)ゲノム検査遺伝子を用いる遺伝子発現シグネチャーのエラスティックネットモデルの概要であって、其れは56,199バイトのサイズを有し、2019年10月9日に作成された;(10)補足表10.Supp_Table10.txtと題する1038のTCGA乳部腫瘍の遺伝子発現シグネチャースコアであって、其れは6,875,948バイトのサイズを有し、2019年10月9日に作成された;(11)補足表11.Supp_Table11.txtと題する512のTCGA LUAD腫瘍及び498のTCGA LUSC腫瘍の遺伝子発現シグネチャースコアであって、其れは6,627,663バイトのサイズを有し、2019年10月9日に作成された;(12)補足表12.Supp_Table12.txtと題する1689のMETABRIC乳部腫瘍の遺伝子発現シグネチャースコアであって、其れは6,235,101バイトのサイズを有し、2019年10月9日に作成された;(13)補足表13.Supp_Table13.txtと題する972の乳部腫瘍のバイナリ変異マトリクスであって、其れは162,934バイトのサイズを有し、2019年10月9日に作成された;(14)補足表14.Supp_Table14.txtと題する汎癌シグネチャー予測の概要であって、其れは577,688バイトのサイズを有し、2019年10月9日に作成された;(15)補足表15.Supp_Table15.txtと題するアンプリコンシグネチャーのリストであって、其れは2,739バイトのサイズを有し、2019年10月9日に作成された。(16)helper.Rと題するコンピュータプログラムリストであって、其れは15,697バイトのサイズを有し、2019年9月25日に作成された。全ての十六の(16)ファイルは其れ等の全体が参照に依って此処に組み込まれる。
【0004】
1.分野
本開示は、患者サンプルのコピー数異常(CNA)に基づいて、癌に関係する表現型の計算された癌シグネチャーを生成する為の方法を提供する。計算された癌シグネチャーは体細胞変異、mRNA発現シグネチャー、又は蛋白質発現シグネチャーに対応し得る。本開示は、計算された癌表現型を用いて患者を処置する為の方法(a for method)をもまた提供する。加えて、本開示は、癌表現型を再現する為に、CNAに基づいて、計算されたシグネチャーを生成する為の方法を提供する。
【背景技術】
【0005】
2.背景
2.1.序
本明細書に於いて提供される「背景」の記載は、本開示の文脈を一般的に提示する目的である。其れが此の背景セクションに記載される限りの名指しされている本発明者の成果と、別様には出願時の先行技術の資格を持ち得ない本明細書の態様とは、本開示に対する先行技術としては明示的にも暗黙的にも認められない。
腫瘍形成は多くの場合には複数のタイプのDNAの異状に依って駆動され、甚だしい複雑性及び不均質性の疾患に至る。此の不均質性を解析する能力は、癌のメカニズムを理解する事に、及び個別化処置の為に患者サブグループを同定する事にとって重大である。此の不均質性を捕捉する為の1つの限定は、疾患表現型のキャラクタリゼーションに在る。癌ゲノムアトラス(TCGA)を包含する多くのコンソーシアムの努力に依って、大規模マルチプラットフォームゲノムデータが今は利用可能であり、分子レベルで且つ複数のテクノロジータイプを用いる事に依って癌表現型を研究する機会を提供する(非特許文献1~4)1-4。特に、増殖速度から腫瘍微小環境の特徴迄、様々である特定の癌表現型を定義する為の多くの遺伝子発現シグネチャーが開発された(非特許文献5~7)5-7。此れ等のmRNA発現特徴は、蛋白質発現、体細胞変異、及び臨床的な特徴と併せて、腫瘍の総合的な分子ポートレートを提供する。マルチプラットフォームゲノムデータを一緒に統合して遺伝子型及び表現型の間の関係性を解き明かす事は、腫瘍挙動の裏にある遺伝学的原因を理解する事にとって決定的である(非特許文献8)。鍵の腫瘍駆動表現型の予測モデルを構築する事は、個別化処置の為に患者を層化する為に有益であろう。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】ペローC.M.等(Perou, C. M. et al.)著「ヒト乳部腫瘍の分子ポートレート(Molecular portraits of human breast tumours)」ネイチャー(Nature)第406巻, p.747-752, doi:10.1038/35021093(2000年)
【非特許文献2】「ヒト乳部腫瘍の総合的分子ポートレート(Comprehensive molecular portraits of human breast tumours)」ネイチャー(Nature)第490巻, p.61-70, doi:10.1038/nature11412(2012年)
【非特許文献3】カーティスC.等(Curtis, C. et al.)著「2,000の乳部腫瘍のゲノム及びトランスクリプトームアーキテクチャは新規サブグループを明らかにする(The genomic and transcriptomic architecture of 2,000 breast tumours reveals novel subgroups)」ネイチャー(Nature)第486巻, p.346-352, doi:10.1038/nature10983(2012年)
【非特許文献4】ホードリーK.A.等(Hoadley, K. A. et al.)著「起源細胞パターンは33のタイプの癌からの10,000の腫瘍の分子分類に於いて優勢である(Cell-of-Origin Patterns Dominate the Molecular Classification of 10,000 Tumors from 33 Types of Cancer)」セル(Cell)第173巻, p.291-304 e296, doi:10.1016/j.cell.2018.03.022(2018年)
【非特許文献5】ネヴィンスJ.R.(Nevins, J. R.)&ポッティA.(Potti, A.)著「遺伝子発現プロファイルをマイニングする:癌表現型としての発現シグネチャー(Mining gene expression profiles: expression signatures as cancer phenotypes)」ネイチャー・レビューズ・ジェネティクス(Nature Reviews Genetics)第8巻, p.601-609, doi:10.1038/nrg2137(2007年)
【非特許文献6】ビルトA.H.等(Bild, A. H. et al.)著「標的化治療のガイドとしてのヒトの癌の発癌経路シグネチャー(Oncogenic pathway signatures in human cancers as a guide to targeted therapies)」ネイチャー(Nature)第439巻, p.353-357, doi:10.1038/nature04296(2006年)
【非特許文献7】クワM.(Kwa, M.), マクリスA.(Makris, A.)&エステバF.J.(Esteva, F. J.)著「早期ステージ乳癌の遺伝子発現シグネチャーの臨床的有用性(Clinical utility of gene-expression signatures in early stage breast cancer)」ネイチャー・レビューズ・クリニカル・オンコロジー(Nature Reviews Clinical Oncology)第14巻, p.595-610, doi:10.1038/nrclinonc.2017.74(2017年)
【非特許文献8】ガッツァM.L.(Gatza, M. L.), シルバG.O.(Silva, G. O.), パーカーJ.S.(Parker, J. S.), ファンC.(Fan, C.)& ペローC.M.(Perou, C. M.)著「統合的ゲノミクスアプローチはルミナルサブタイプヒト乳癌の増殖の駆動因子を同定する(An integrated genomics approach identifies drivers of proliferation in luminal-subtype human breast cancer)」ネイチャー・ジェネティクス(Nature genetics)第46巻, p.1051-1059, doi:10.1038/ng.3073(2014年)
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、上記従来技術における課題を解決するためになされたものである。
【課題を解決するための手段】
【0008】
3.開示の概要
本開示は、患者のサンプルの計算された癌シグネチャーを生成する方法を提供し、此れは:(a)患者からのサンプルを得る事又は得た事と;(b)複数の染色体上の複数の位置に於いて複数のコピー数異常(CNA)を測定する事又は測定した事と;(c)mRNA発現データ及び分子サブタイプに基づく数理モデルを用いて、測定されたCNAを分析する事とを含み、数理モデルは、サンプルの計算された癌シグネチャーを生成する様にして少なくとも2つの異なる統計方法に依ってバリデーションされている。1つの実施形態では、50超のCNAが測定され、代替的には100超のCNAが測定され、代替的には約250及び約400の間のCNAが測定される。別の実施形態では、400超のCNAが測定される。複数のコピー数異常(CNA)は全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる。
【0009】
本明細書に於いて開示される方法では、計算された癌シグネチャーは体細胞変異シグネチャーに対応し得る。体細胞変異シグネチャーを調える為の数理モデルは補足表6の10以上のベータ係数値に基づき得る。代替的には、数理モデルは20以上のベータ係数値、40以上のベータ係数値、60以上のベータ係数値、又は100以上のベータ係数値に基づき得る。別の実施形態では、数理モデルはベータ係数値の上位5%、上位10%、上位25%、又は上位50%に基づき得る。
【0010】
本明細書に於いて開示される方法の別の実施形態では、計算された癌シグネチャーはmRNA発現シグネチャーに対応し得、此れは乳癌サブタイプのシグネチャーであり得る。乳癌サブタイプシグネチャーを調える為の数理モデルは補足表4の10以上のベータ係数値に基づき得る。代替的には、数理モデルは20以上のベータ係数値、40以上のベータ係数値、60以上のベータ係数値、又は100以上のベータ係数値に基づき得る。別の実施形態では、数理モデルはベータ係数値の上位5%、上位10%、上位25%、又は上位50%に基づき得る。
【0011】
本明細書に於いて開示される方法の尚別の実施形態では、計算された癌シグネチャーは蛋白質発現シグネチャーに対応し得る。蛋白質発現シグネチャーを調える為の数理モデルは補足表5の10以上のベータ係数値に基づき得る。代替的には、数理モデルは20以上のベータ係数値、40以上のベータ係数値、60以上のベータ係数値、又は100以上のベータ係数値に基づき得る。別の実施形態では、数理モデルはベータ係数値の上位5%、上位10%、上位25%、又は上位50%に基づき得る。
【0012】
本明細書に於いて開示される方法では、蛋白質発現シグネチャーは免疫組織化学(IHC)シグネチャーであり得る。IHCシグネチャーはエストロゲン受容体(ER)、上皮成長因子受容体(EGFR)、ヒト上皮成長因子受容体2(HER2)、プロゲステロン受容体(PR)、又は網膜芽細胞腫(RB)シグネチャーであり得る。
【0013】
計算された癌シグネチャーは、癌診断法の商業的なベンダーからの結果に対応し得る。例えば、計算された癌シグネチャーは、FoundationOne(登録商標)CDX結果、MAMMAPRINT(登録商標)70遺伝子再発スコア、OncotypeDX(商標)再発スコア、又はProsigna(登録商標)再発リスクスコアに対応し得る。計算された癌シグネチャーはFoundationOne(登録商標)結果であり得、FoundationOne(登録商標)結果を調える為の数理モデルは補足表9の10以上のベータ係数値に基づき得る。代替的には、数理モデルは20以上のベータ係数値、40以上のベータ係数値、60以上のベータ係数値、又は100以上のベータ係数値に基づき得る。別の実施形態では、数理モデルはベータ係数値の上位5%、上位10%、上位25%、又は上位50%に基づき得る。
【0014】
計算された癌シグネチャーは次の遺伝子のいずれかの変異、置換、又は挿入若しくは欠失(indel)に関連し得る:(C17orf39)、(MLL)、(MLL2)、ABL1、ACVR1B、AKT1、AKT2、AKT3、ALK、ALOX12B、AMER1、APC、AR、ARAF、ARFRP1、ARID1A、ASXL1、ATM、ATR、ATRX、AURKA、AURKB、AXIN1、AXL、BAP1、BARD1、BCL2、BCL2L1、BCL2L2、BCL6、BCOR、BCORL1、BRAF、BRCA1、BRCA2、BRD4、BRIP1、BTG1、BTG2、BTK、C11orf30、CALR、CARD11、CASP8、CBFB、CBL、CCND1、CCND2、CCND3、CCNE1、CD22、CD274、CD70、CD79A、CD79B、CDC73、CDH1、CDK12、CDK4、CDK6、CDK8、CDKN1A、CDKN1B、CDKN2A、CDKN2B、CDKN2C、CEBPA、CHEK1、CHEK2、CIC、CREBBP、CRKL、CSF1R、CSF3R、CTCF、CTNNA1、CTNNB1、CUL3、CUL4A、CXCR4、CYP17A1、DAXX、DDR1、DDR2、DIS3、DNMT3A、DOT1L、EED、EGFR、EP300、EPHA3、EPHB1、EPHB4、ERBB2、ERBB3、ERBB4、ERCC4、ERG、ERRFI1、ESR1、EZH2、FAM46C、FANCA、FANCC、FANCG、FANCL、FAS、FBXW7、FGF10、FGF12、FGF14、FGF19、FGF23、FGF3、FGF4、FGF6、FGFR1、FGFR2、FGFR3、FGFR4、FH、FLCN、FLT1、FLT3、FOXL2、FUBP1、GABRA6、GATA3、GATA4、GATA6、GID4、GNA11、GNA13、GNAQ、GNAS、GRM3、GSK3B、H3F3A、HDAC1、HGF、HNF1A、HRAS、HSD3B1、ID3、IDH1、IDH2、IGF1R、IKBKE、IKZF1、INPP4B、IRF2、IRF4、IRS2、JAK1、JAK2、JAK3、JUN、KDM5A、KDM5C、KDM6A、KDR、KEAP1、KEL、KIT、KLHL6、KMT2A、KMT2D、KRAS、LTK、LYN、MAF、MAP2K1、MAP2K2、MAP2K4、MAP3K1、MAP3K13、MAPK1、MCL1、MDM2、MDM4、MED12、MEF2B、MEN1、MERTK、MET、MITF、MKNK1、MLH1、MPL、MRE11A、MSH2、MSH3、MSH6、MST1R、MTAP、MTOR、MUTYH、MYC、MYCL、MYCN、MYD88、NBN、NF1、NF2、NFE2L2、NFKBIA、NKX2-1、NOTCH1、NOTCH2、NOTCH3、NPM1、NRAS、NT5C2、NTRK1、NTRK2、NTRK3、P2RY8、Page 4 of 36 RAL-0003-01、PALB2、PARK2、PARP1、PARP2、PARP3、PAX5、PBRM1、PDCD1、PDCD1LG2、PDGFRA、PDGFRB、PDK1、PIK3C2B、PIK3C2G、PIK3CA、PIK3CB、PIK3R1、PIM1、PMS2、POLD1、POLE、PPARG、PPP2R1A、PPP2R2A、PRDM1、PRKAR1A、PRKCI、PTCH1、PTEN、PTPN11、PTPRO、QKI、RAC1、RAD21、RAD51、RAD51B、RAD51C、RAD51D、RAD52、RAD54L、RAF1、RARA、RB1、RBM10、REL、RET、RICTOR、RNF43、ROS1、RPTOR、SDHA、SDHB、SDHC、SDHD、SETD2、SF3B1、SGK1、SMAD2、SMAD4、SMARCA4、SMARCB1、SMO、SNCAIP、SOCS1、SOX2、SOX9、SPEN、SPOP、SRC、STAG2、STAT3、STK11、SUFU、SYK、TBX3、TEK、TET2、TGFBR2、TIPARP、TNFAIP3、TNFRSF14、TP53、TSC1、TSC2、TYRO3、U2AF1、VEGFA、VHL、WHSC1、WHSC1L1、WT1、XPO1、XRCC2、ZNF217、又はZNF703。
【0015】
計算された癌シグネチャーは、ALKイントロン18、19;BCL2 3’UTR;BCRイントロン8、13、14;BRAFイントロン7-10;BRCA1イントロン2、7、8、12、16、19、20;BRCA2イントロン2;CD74イントロン6-8;EGFRイントロン7、15、24-27;ETV4イントロン5、6;ETV5イントロン6、7;ETV6イントロン5、6;EWSR1イントロン7-13;EZRイントロン9-11;FGFR1イントロン1、5、17;FGFR2イントロン1、17;FGFR3イントロン17;KITイントロン16;KMT2A(MLL)イントロン6-11;MSH2イントロン5;MYBイントロン14;MYCイントロン1;NOTCH2イントロン26;NTRK1イントロン8-10;NTRK2イントロン12;NUTM1イントロン1;PDGFRAイントロン7、9、11;RAF1イントロン4-8;RARAイントロン2;RETイントロン7-11;ROS1イントロン31-35;RSPO2イントロン1;SDC4イントロン2;SLC34A2イントロン4;TERC ncRNA;TERTプロモーター;又はTMPRSS2イントロン1-3の再構成に関連し得る。
【0016】
計算された癌シグネチャーは、膀胱尿路上皮癌(BLCA)、子宮頸部扁平上皮細胞癌及び内頸部腺癌(CESC)、結腸腺癌(COAD)、食道癌(ESCA)、多形性膠芽腫(GBM)、頭頸部扁平上皮細胞癌(HNSC)、淡明腎細胞腎臓癌(KIRC)、乳頭状腎細胞腎臓癌(KIRP)、急性骨髄性白血病(LAML)、脳低悪性度グリオーマ(LGG)、肝細胞肝臓癌(LIHC)、肺腺癌(LUAD)、肺扁平上皮細胞癌(LUSC)、膵臓腺癌(PAAD)、褐色細胞腫及びパラガングリオーマ(PCPG)、前立腺腺癌(PRAD)、直腸腺癌(READ)、肉腫(SARC)、肌の皮膚メラノーマ(SKCM)、胃腺癌(STAD)、精巣胚細胞腫瘍(TGCT)、甲状腺癌(THCA)、胸腺腫(THYM)、又は子宮体部内膜癌(UCEC)シグネチャーであり得る。計算されたシグネチャーを調える為の数理モデルは補足表14の10以上のベータ係数値に基づく。代替的には、数理モデルは、20以上のベータ係数値、40以上のベータ係数値、60以上のベータ係数値、又は100以上のベータ係数値に基づき得る。別の実施形態では、数理モデルはベータ係数値の上位5%、上位10%、上位25%、又は上位50%に基づき得る。
【0017】
本開示は、患者が特定の癌サブタイプを有するかどうかを決定するステップを含む、癌患者を化学療法に依って処置する為の方法をもまた提供し:(a)患者からの生体サンプルを得る事又は得た事と;(b)コピー数が複数の染色体上の複数の位置に於いて測定される生体サンプルの遺伝子レベルコピー数異常(CNA)アッセイを行なう事又は行なった事と;(c)CNAアッセイの結果(to results)を標準のセットと比較して、患者が特定の癌サブタイプを有するかどうかを決定する事と;(d)患者が特定の癌サブタイプを有する場合には、決定された癌サブタイプに基づいて、好適な化学療法レジメンを癌患者に投与する事とに依る。化学療法レジメンは継続中の治療介入であり得る。継続中の治療介入は、特定の処置を中止する事を含む。
【0018】
別の実施形態では、本開示は、癌表現型の計算された癌シグネチャーを生成する為の方法を提供し、方法は:(a)癌表現型の複数の遺伝子発現シグネチャー及びサブタイプ情報を受け取る事と;(b)癌表現型の複数のコピー数異常(CNA)データセットを受け取る事と;(c)複数のCNAデータセットを人工知能アルゴリズムに依って分析して、癌表現型のCNAセグメントレベルシグネチャーの予備的なセットを得る事と;(d)遺伝子発現トレーニングセットを用いて予備的なセットのCNAセグメントレベルシグネチャーを修正し、最終セットCNAセグメントレベルシグネチャーを得る事と;(e)最終セットCNAセグメントレベルシグネチャーを用いて、癌表現型の計算された癌シグネチャーを調える事とを含む。癌表現型は体細胞変異、mRNA発現のレベル、蛋白質発現のレベル、又は免疫組織化学(IHC)シグネチャーに関連し得る。
【0019】
加えて、本開示は、患者の計算された癌シグネチャーを生成する為の方法を提供し、方法は:(a)患者のコピー数異常(CNA)データを受け取る事と;(b)癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を受け取り、CNAシグネチャーは癌発現分析、癌サブタイプ情報、及びCNAゲイン/ロス情報に基づく事と;(c)1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)に対して相対的に患者特性のCNAデータの特性をキャラクタリゼーションする様にして、癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を利用するアルゴリズムに依って患者のCNAデータを処理する事と;(d)患者の計算された癌シグネチャーを調える事とを含む。癌表現型は体細胞変異、mRNA発現のレベル、蛋白質発現のレベル、又は免疫組織化学(IHC)シグネチャーに関連し得る。
【0020】
本明細書に於いて開示される方法では、癌表現型は副腎、膀胱、骨、乳部、子宮頸部、結腸、肝臓、リンパ、卵巣、膵臓、陰茎、前立腺、直腸、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、気管、又は子宮癌に関連し得る。好ましい実施形態では、癌表現型は乳癌に関連する。
【0021】
別の実施形態では、開示は、癌を有する対象を処置する為の方法を提供し:(i)患者のコピー数異常(CNA)データを受け取る事と、(ii)癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を受け取り、CNAシグネチャーが癌発現分析、癌サブタイプ情報、及びCNAゲイン/ロス情報に基づく事と;(iii)1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)に対して相対的に患者特性のCNAデータの特性をキャラクタリゼーションする様にして、癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を利用するアルゴリズムに依って患者のCNAデータを処理する事と;(iv)キャラクタリゼーションされた特性に基づいて、患者の計算された癌シグネチャーを調える事と;(b)計算された癌シグネチャーに基づく処置プランに基づいて患者を処置する事とを含む。処置は継続中の治療介入であり得る。継続中の治療介入は特定の処置を中止する事を含み得る。
【0022】
本開示は、デバイスをもまた提供し、患者CNAデータ及び癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)をアルゴリズムに依って処理して、上に記載されている計算された癌シグネチャーを生成する様に構成されたプロセッサーを含む。請求項36のデバイスを含むシステムもまた提供される。加えて、本開示は請求項36のデバイスを提供し、癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)と患者CNAデータを比較する為のアルゴリズムを含むソフトウェアを含む。
【図面の簡単な説明】
【0023】
4.図面の簡単な説明
図1】乳癌の遺伝子発現シグネチャー特異的なCNA関連性の同定。図1A.遺伝子シグネチャーに関連するCNAを同定する為に用いられる戦略の模式的な概観。ゲイン/ロスはDNAコピー数ゲイン又はロスを指示する;Pos/Negは正の又は負の関連性を指示する。図1A-1D.分子サブタイプを考慮する線形回帰分析ランドスケープが、正に(軸よりも上の暗灰色)又は負に(軸よりも下の暗灰色)遺伝子シグネチャーに関連する遺伝子を同定する為に用いられ、フィッシャーの正確検定が、コピー数ゲイン(軸よりも上の明灰色)又はロス(軸よりも下の明灰色)の度数を網膜芽細胞腫遺伝子ヘテロ接合性の喪失(RB-LOH)((図1B)、基底シグナル伝達(図1C)、及びエストロゲンシグナル伝達(図1D)遺伝子プログラムシグネチャーについて比較する為に用いられた。点線は有意閾値を指示する(q=0.01)。両方の分析で有意な遺伝子のq値のみがプロットされた。黒い矢頭は公知経路駆動因子を指示する。各図では、染色体境界が黒い縦線に依って指示されている。
図2】乳癌のDNA CNA及び遺伝子発現シグネチャーのパターン。図2A.ゲイン及びロスを指示するDNA CNAを示すヒートマップ。サンプルは分子サブタイプに従ってX軸上に共通に並べられている。遺伝子は染色体位置に従ってY軸上に並べられている。図2B.遺伝子発現シグネチャーを示すヒートマップ。サンプルは分子サブタイプに従ってX軸上に共通に並べられている。遺伝子シグネチャースコアはメディアンにセンタリングされ、ピアソン相関に基づいてセントロイドリンケージ階層的クラスタリングに依ってクラスタリングされている。
図3】DNA CNA及びアンプリコンシグネチャーの間の関連性のパターン。高いシグネチャースコア(上位四分位)を有するサンプル中に於いて、正の相関及びコピー数ゲインの増大した度数を有した遺伝子(q<0.01)が明灰色で示され、負の相関及びコピー数ロスの増大した度数を有した物(q<0.01)が暗灰色で示されている。各アンプリコンシグネチャーは其の対応するアンプリコンと正の関連性を有する。
図4】乳癌の遺伝子シグネチャーのDNA CNAに基づくエラスティックネット予測モデル。図4A.遺伝子発現シグネチャーレベルを予測する為のエラスティックネットモデルを構築する為に用いられる戦略の模式的な概観。図4B.メディアンスコア(横線)、四分位範囲(IQR、箱の境界)、及びIQRの1.5倍(ひげ)を指示する箱ひげ図を用いて表示されている543のシグネチャーの曲線下面積(AUC)値;横線はAUC=0.75を指示し、此れは「高度に予測可能」であると見做される。3つのシグネチャーが強調され、其れ等の特徴ランドスケープもまた図4F図4Hに示されている。図4C図4E.RB-LOH(図4C)、基底シグナル伝達(図4D)、及びエストロゲンシグナル伝達(図4E)を予測する為のTCGAテストセット及び乳癌国際コンソーシアムの分子タキソノミー(METABRIC)バリデーションセットの受信者動作特性(ROC)曲線及び対応するAUC値。図4F図4H.RB-LOH(図4F)、基底シグナル伝達(図4G)、及びエストロゲンシグナル伝達(図4H)の予測モデルの、エラスティックネットの選択されたCNAセグメント及び/又は染色体全腕、並びに其れ等の係数。
図5】乳癌のサブタイプ調整された遺伝子シグネチャー特異的なCNAの同定。図5A.分子サブタイプを考慮する遺伝子シグネチャーに関連するCNAを同定する為に用いられる戦略の模式的な概観。ゲイン/ロスはDNAコピー数ゲイン又はロスを指示する;Pos/Negは正の又は負の関連性を指示する。図5B図5D.分子サブタイプを考慮する線形回帰が、正に(軸よりも上)又は負に(軸よりも下)遺伝子シグネチャーに関連する遺伝子を同定する為に用いられ、フィッシャーの正確検定が、コピー数ゲイン(軸よりも上)又はロス(軸よりも下)の度数をRB-LOH(図5B)、基底シグナル伝達(図5C)、及びエストロゲンシグナル伝達(図5D)遺伝子プログラムシグネチャーについて比較する為に用いられた。点線は有意閾値を指示する(q=0.01)。両方の分析で有意な遺伝子のq値のみがプロットされた。
図6】入れ替えテストセットAUC値のヒストグラム。各表現型当たり100の入れ替えからのテストセットAUC値が、各高度に予測可能な遺伝子発現シグネチャー、臨床的な受容体ステータス、体細胞変異、及び固有の分子サブタイプについてプロットされた。縦線はAUC=0.75を指示し、此れは「高度に予測可能」を定義する為の閾値として用いられる。
図7】複数の鍵の発現シグネチャー及び予後のCNAに基づくエラスティックネット予測モデル。図7A.HER1-C2シグネチャーのTCGAテストセット及びMETABRICバリデーションセットのROC曲線及び対応するAUC値。図7B.HER1-C2シグネチャーの予測モデルの選択されたCNAセグメント及び/又は染色体全腕、並びに其れ等の係数。EGFR経路の公知の駆動因子が黒い矢印に依って強調されている。図7C図7F.RB-LOH(図7C)、基底シグナル伝達(図7D)、エストロゲンシグナル伝達(図7F)、及びHER1-C2(図7F)シグネチャーの、遺伝子シグネチャースコア(遺伝子発現)及び対応するエラスティックネット予測モデル(DNA CNA)に依って層化された10年の乳癌特異的な生存のカプラン・マイヤー曲線。事象の統計は高及び低の両群に於いて事象数/トータルの患者として指示された。
図8】3つの臨床的に用いられる乳癌アッセイのCNAに基づくエラスティックネット予測モデル。図8A図8I.Oncotype DX(登録商標)再発スコア(図8A図8C)、Prosigna再発リスクスコア(図8D図8F)、及びMAMMAPRINT(登録商標)70遺伝子再発スコア(図8G図8I)の10年の乳癌特異的な生存のROC曲線及びカプラン・マイヤー曲線。カプラン・マイヤー曲線は遺伝子シグネチャースコア(遺伝子発現)及び対応するエラスティックネットコピー数予測モデル(DNA CNA)に依って層化された。事象の統計は高及び低群両方に於いて事象数/トータルの患者として指示された。図8J図8L.Oncotype DX(登録商標)再発スコア(図8J)、Prosigna(登録商標)再発リスクスコア(k)、及びMAMMAPRINT(登録商標)70遺伝子再発スコア(図8L)の予測モデルの、エラスティックネットの選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数。
図9】乳癌の個々の蛋白質発現及び変異ステータスを予測するエラスティックネットモデル。図9A.TCGA RPPAアレイからの216の蛋白質及びリン蛋白質の蛋白質発現を予測する為のAUC値のメディアンスコア(横線)、四分位範囲(IQR、箱の境界)、及びIQRの1.5倍(ひげ)を指示する箱ひげ図。目当ての5つの蛋白質がドットに依って強調されている。横線はAUC=0.75を指示する。図9B図9D.臨床的なERステータス(図9B)、臨床的なPRステータス(図9C)、及び臨床的なHER2ステータス(図9D)を予測する為の、TCGAテストセット及びMETABRICバリデーションセットのROC曲線及び対応するAUC値。図9E.臨床的なERステータスの予測モデルの、選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数。図9F.ドットプロットは個々の体細胞変異を予測する為のAUC値を指示する。横線はAUC=0.75を指示する。図9G図9H.TP53の変異(図9G)及び変異量(図9H)を予測する為の、TCGAトレーニングセット及びTCGAテストセットのROC曲線及び対応するAUC値。図9I.変異量の予測モデルの選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数。
図10】遺伝子シグネチャーの、乳癌サブタイプ特異的なCNAに基づくエラスティックネット予測モデル。図10A.箱ひげ図は、基底細胞様(n=185)、ルミナル(n=853)、及びルミナルA(n=556)サンプル内の遺伝子シグネチャーを予測する為のAUC値を指示する;プロットは免疫シグネチャー(n=78)及び他のシグネチャー(n=465)へと層化されるという事に注意。横線はAUC=0.75を指示する。図10B.基底細胞様サンプル内のCD8 T細胞発現シグネチャーを予測する為のTCGAテストセット及びMETABRICバリデーションセットのROC曲線及び対応するAUC値。図10C.基底細胞様サンプル内のCD8 T細胞発現シグネチャーの予測モデルの、選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数。
図11】乳癌の固有の及び組織学的サブタイプのCNAに基づくエラスティックネット予測モデル。図11A図11E.基底細胞様(図11A)、HER2高発現(図11B)、ルミナルA(図11C)、及びルミナルB(図11D)サブタイプ、並びに乳癌組織学IDC対ILC(図11E)を予測する為の、ROC曲線並びに対応するAUC値。図11F図11J.基底細胞様(図11F)、HER2高発現(図11G)、ルミナルA(11H)、及びルミナルB(図11I)サブタイプ、並びに組織学(図11J)の予測モデルの、選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数。正のウェイトはILC分類を支持する。
図12】臨床的な受容体ステータス及びRPPAに依って測定される対応する蛋白質発現のDNAに基づくエラスティックネット予測モデルの選択されたCNAランドスケープ。ER IHCステータス(図12A)、ER RPPA発現(図12B)、PR IHCステータス(図12C)、PR RPPA発現(図12D)、HER2 IHCステータス(図12E)、及びHER2 RPPA発現(図12F)の予測モデルの、選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数。同じ蛋白質のRPPA発現及びIHCステータスを予測するモデルは類似のランドスケープを有する。
図13】全ての遺伝子及びFoundation One(登録商標)313遺伝子セットの予測因子を用いるエラスティックネットモデル性能の比較。乳癌の全ての遺伝子(各カラムの左のデータ点)及びFoundation One(登録商標)テスト313遺伝子(各カラムの右のデータ点)を用いて遺伝子シグネチャー及び個々の蛋白質発現を予測する為の、AUC値のメディアンスコア(横線)、四分位範囲(IQR、箱の境界)、及びIQRの1.5倍(ひげ)を指示する箱ひげ図。AUC値は2つのカテゴリー間で高度に相関する。
図14】遺伝子シグネチャーの汎癌DNA CNAに基づくエラスティックネット予測モデル。図14A.線プロットは、各腫瘍タイプの高度に予測可能なシグネチャーの数(即ちAUC>0.75)(上側の線)及び高度に予測可能な非アンプリコンシグネチャー(下側の線)を指示する。図14B.箱ひげ図は各腫瘍タイプのコピー数異常遺伝子のパーセンテージを指示する。図14C.ヒートマップは各腫瘍タイプの各遺伝子シグネチャーの予測可能性を示す。灰色は予測可能を指示し、黒は予測可能ではないを指示する。腫瘍及び遺伝子シグネチャーが、ユークリッド距離及び完全なリンケージを用いて階層的クラスタリングに依ってクラスタリングされる。図14D及び図14E.クローディン低シグネチャー並びに免疫シグネチャーのマルチ腫瘍予測モデルの選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数。
図15】肺癌の遺伝子シグネチャーのDNA CNAに基づくエラスティックネット予測モデル。図15A.箱ひげ図は、肺癌データで構築されたモデル(X軸のTCGAトレーニング及びTCGAテスト)及び乳癌データで構築された物(X軸の乳癌モデル予測)を用いて肺癌の遺伝子シグネチャーを予測する為のAUC値を指示する。横線はAUC=0.75を指示する。図15B.肺癌データ及び乳癌で構築された両方のモデルが首尾良い(AUC>0.75)という事を示す、TP53ステータスシグネチャーを予測する為のROC曲線及び対応するAUC値。図15C.肺組織学、肺腺癌(LUAD)対肺扁平上皮細胞癌(LUSC)を予測する為のROC曲線及び対応するAUC値。図15D~15E.TP53ステータスシグネチャーの肺癌(図15D)並びに乳癌(図15E)で構築された予測モデルの選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数は、類似の特徴ランドスケープを示す。図15F.肺組織学LUAD対LUSCを分類する為の予測モデルの、選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数。正のウェイトはLUSC分類を支持する。
図16】乳癌の連続的なRB-LOHシグネチャースコアのDNA CNAに基づくエラスティックネット予測。図16A.TCGAトレーニングセット、TCGAテストセット、及びMETABRICバリデーションセットの観察されたシグネチャースコアに対する予測されたRB-LOHシグネチャースコアの散布図。灰色の線はフィットした回帰線である。ピアソン相関が指示されている。図16B.予測モデルの選択されたCNAセグメント及び/又は染色体全腕並びに其れ等の係数。
図17】乳癌のDNAシーケンシングに依って決定されたコピー数値に依って鍵の癌表現型を予測する、DNA CNAに基づくエラスティックネットモデル。エクソームシーケンシングからのDNAシーケンシングデータが分析された。鍵の遺伝子発現シグネチャー(図17A)、臨床アッセイ(図17B)、臨床的な受容体ステータス(図17C)、及び分子サブタイプ(図17D)を予測する為の、受信者動作曲線(ROC)及びROC下面積(AUC)値。
【発明を実施するための形態】
【0024】
5.本開示の詳細な記載
当業者は、本明細書に記載される方法への使用の為のコピー数異常(CNA)データを得る為の幾つもの方法があるという事を認識するであろう。CNAデータのソースは従来の方法であり得、蛍光インサイチュハイブリダイゼーション(FISH)、比較ゲノムハイブリダイゼーション(CGH)、アレイ比較ゲノムハイブリダイゼーション(aCGH)、又は一塩基多型(SNP)アレイを包含するが、此れ等に限定されない。より最近には、全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又はWGS及びWESの組み合わせを用いてサンプルのCNAデータを得る為の方法が記載されている。総説はヘハー・クワ等(Hehir-Kwa, et al.)著(2018年)「次世代シーケンシングの時代のコピー数検出の臨床実装(The clinical implementation of copy number detection in the age of next-generation sequencing)」エキスパート・レビュー・オブ・モレキュラー・ダイアグノスティックス(Expert Review of Molecular Diagnostics)第18巻:10, 907-915を見よ。WGS又はWESからCNAデータを得る為の幾つものツールが利用可能である。例はADTEx、ControlFREEC、VarScan2、及びSynthExを包含する。例えば、シルバ等(Silva et al.)著(2017年)「SynthEx:コピー数異常検出及び腫瘍不均質性プロファイリングの為の合成的な正常に基づくDNAシーケンシングツール(SynthEx: a synthetic-normal-based DNA sequencing tool for copy number alteration detection and tumor heterogeneity profiling)」ゲノム・バイオロジー(Genome Biology)第18巻:66;又はセア等(Zare et al.)著(2017年)「全エクソームシーケンシングデータを用いる癌のコピー数バリエーション検出ツールの評価(An evaluation of copy number variation detection tools for cancer using whole exome sequencing data)」BMCバイオインフォマティクス(BMC Bioinformatics)(2017年)第18巻:286を見よ。CNAデータを次世代シーケンサーから得る為のソフトウェアプログラム(コピー数バリアント(CNV)コーラー)及び其れ等のリリース年は、ADTex(2014年)、BIC-seq(2011年)、BreakDancer(2009年)、CANOES(2014年)、Canvas(2011年)、CLAMMS(2015年)、cn.MOPS(2012年)、CNVem(2013年)、CNVer(2010年)、CnvHiTSeq(2012年)、CNVkit(2016年)、CNVnator(2011年)、CNVrd2(2014年)、CNV-seq(2009年)、CODEX(2015年)、CONIFER(2012年)、CONTRA(2012年)、Control-FREEC(2011年)、CoNVaDING(2015年)、Copy-Seq(2010年)、Cortex(2012年)、DECoN(2016年)、Delly(2012年)、Excavator(2013年)、ExomeCNV(2011年)、ExomeCopy(2011年)、ExomeDepth(2012年)、FermiKit(2015年)、GASV(2009年)、GATK(2010年)、GenomeSTRiPv2(2015年)、GROM-RD(2015年)、iCopyDAV(2018年)、JointSLM(2011年)、LUMPY(2014年)、Magnolya(2009年)、m-HMM(2013年)、mrCaNaVAR(2009年)、PEMer(2009年)、Pindel(2009年)、RDXplorer(2009年)、ReadDepth(2011年)、RSICNV(2017年)、Samblaster(2013年)、SegSeq(2009年)、SeqCNV(2017年)、SOAPsv(2011年)、Ulysses(2015年)、VariationHunter(2009年)、VarScan(2012年)、及びXHMM(2012年)を包含する。マコーミック(McCormick)著(2019年8月8日)「CNV分析は焦点をNGS配列にシフトする(CNV Analysis Shifts Focus to NGS Sequences)」https://www.biocompare.com/Editorial-Articles/363086-CNV-Analysis-Shifts-Focus-to-NGS-Sequences/を見よ。
【0025】
本明細書に記載される方法から益するであろう承認された薬物の多くの例がある。薬物は、低分子キナーゼ阻害剤、例えば、慢性骨髄性白血病(CML)に当初承認されたブレークポイントクラスター領域-アベルソン(BCR-ABL)の阻害剤イマチニブ(グリベック(Gleevac)(登録商標))を包含する。モノクローナル抗体キナーゼ阻害剤の例は、乳癌に承認されたERB-B2の阻害剤トラスツズマブ(ハーセプチン(登録商標))、又は大腸癌に承認された血管内皮成長因子(VEGF)の阻害剤ベバシズマブ(アバスチン(登録商標))である。コンパニオン診断法に承認された薬物の他の例は、BRCA1/2変異、KRAS変異、cKIT発現に承認された薬物を包含する。表1は、幾つものキナーゼ阻害剤を包含する幾つもの承認された薬物を列記する。ジャン等(Janne et al.)著, 2009年, ネイチャー・レビューズ・ドラッグ・ディスカバリー(Nature Reviews Drug Discovery)第8巻 p.709-723;レヴィツキ(Levitzki)及びクライン(Klein)著, 2010年, モレキュラー・アスペクツ・オブ・メディシン(Molecular Aspects of Medicine)第31巻, p.287-329;並びにメラー等(Mellor et al.)著, 2011年, トキシコロジカル・サイエンシズ(Toxicological Sciences)第120巻(1) p.14-32;並びに特定の薬物の添付文書を見よ。
【0026】
【表1-1】
【表1-2】
【表1-3】
【0027】
略語:遺伝子標的についてはGene Cards(http://www.genecards.org/)を見よ。適応症:ALL、急性リンパ芽球性白血病;AML、急性骨髄性白血病;BrCA、乳癌;CML、慢性骨髄性白血病;CMML、慢性骨髄単球性白血病;CRC、大腸癌;GIST、消化管間質腫瘍;HCC、肝細胞癌;HNSCC、頭頸部扁平上皮細胞癌;MDS/MPD、骨髄異形成症候群/骨髄増殖性疾患;NSCLC、非小細胞肺癌;OvCA、卵巣癌;RCC、腎細胞癌;STS、軟部肉腫;及びTNBC、トリプルネガティブ乳癌。
【0028】
此れ等の薬物の多くはコンパニオン診断法への使用を承認されている。例えば、トラスツズマブ(ハーセプチン(登録商標))はERB-B2を過剰発現する乳癌について、セツキシマブ(アービタックス(登録商標))は野生型KRASを有する患者について承認されている。アマド等(Amado et al.), 2008年, ジャーナル・オブ・クリニカル・オンコロジー(Journal of Clinical Oncology)第26巻(10): p.1626-1634;アレグラ等(Allegra et al.), 2009年, ジャーナル・オブ・クリニカル・オンコロジー(Journal of Clinical Oncology)第27巻 p.2091-2096。診断法への使用を承認された別のキナーゼ阻害剤はクリゾチニブ(ザーコリ(登録商標))であり、ALK再構成の蛍光インサイチュハイブリダイゼーション(FISH)検査について承認されている(Vysis LSI ALKデュアルカラー、ブレークアパート再構成プローブ;アボット・モレキュラー、アボットパーク、IL)。シャー等(Shah et al.)著, 2011年, ランセット・オンコロジー(The Lancet Oncology)第12巻 p.1004-1012;ショー等(Shaw et al.)著, 2009年, ジャーナル・オブ・クリニカル・オンコロジー(Journal of Clinical Oncology)第27巻 p.4247-4253。ベムラフェニブ(ゼルボラフ(登録商標))はBRAF V600E変異を有する患者への使用を承認されている(Cobas 4800 BRAF V600変異検査、ロシュ・モレキュラー・ダイアグノスティックス、プレザントン、CA)。チャップマン等(Chapman et al.), 2011年, ニューイングランド・ジャーナル・オブ・メディシン(The New England Journal of Medicine)第364巻 p.2507-2516。追加の詳細はコンパニオン診断法のUS FDAウェブサイトに見出され得る(https://www.fda.gov/MedicalDevices/ProductsandMedicalProcedures/InVitroDiagnostics/ucm301431.htm)。追加のコンパニオン診断法については表1のバイオマーカーカラムを見よ。
【0029】
本明細書に於いて開示される方法は幾つもの癌の診断法及び処置の支援として用いられ得る。一度特定の癌が診断されると、臨床医が患者を処置する為に用い得る種々の標的化治療がある。膀胱癌の限定しない例は、表1のエルダフィチニブ(バルバーサ(商標))又はペムブロリズマブ(キイトルーダ(登録商標))を包含する。追加の治療はアベルマブ(バベンチオ(登録商標))、デュルバルマブ(イミフィンジ(商標))、又はニボルマブ(オプジーボ(登録商標))を包含する。BrCAの限定しない例は、表1のアベマシクリブ(ベージニオ(登録商標))、アドトラスツズマブエムタンシン(カドサイラ(登録商標))、アルペリシブ(ピクレイ(登録商標))、アテゾリズマブ(テセントリク(登録商標))、エベロリムス(アフィニトール(登録商標))、ラパチニブ(タイケルブ(登録商標))、オラパリブ(リムパーザ(LYNPARZA)(登録商標))、パルボシクリブ(イブランス(登録商標))、ペルツズマブ(パージェタ(登録商標))、リボシクリブ(キスカリ(登録商標))又はトラスツズマブ(ハーセプチン(登録商標))、又はトラスツズマブ(ハーセプチンハイレクタ(商標))を包含する。追加の治療はアナストロゾール(アリミデックス(登録商標))、エキセメスタン(アロマシン(登録商標))、フルベストラント(フェソロデックス(登録商標))、レトロゾール(フェマーラ(登録商標))、ネラチニブ(ネルリンクス(商標))、タモキシフェン(ソルタモックス(登録商標))、又はトレミフェン(フェアストン(登録商標))を包含する。CRCの限定しない例は、表1のベバシズマブ(アバスチン(登録商標))、セツキシマブ(アービタックス(登録商標))、パニツムマブ(ベクティビックス(登録商標))、ラムシルマブ(サイラムザ(登録商標))、又はレゴラフェニブ(スチバーガ(登録商標))を包含する。追加の治療はイピリムマブ(ヤーボイ(登録商標))、ニボルマブ(オプジーボ(登録商標))、又はジブアフリベルセプト(ザルトラップ(登録商標))を包含する。HCCの限定しない例は、表1のペムブロリズマブ(キイトルーダ(登録商標))、ラムシルマブ(サイラムザ(登録商標))、レゴラフェニブ(スチバーガ(登録商標))、又はソラフェニブ(ネクサバール(登録商標))を包含する。追加の治療はカボザンチニブ(カボメティクス(商標))、レンバチニブ(レンビマ(登録商標))、又はニボルマブ(オプジーボ(登録商標))を包含する。腎臓癌の限定しない例は、表1のアキシチニブ(インライタ(登録商標))、ベバシズマブ(アバスチン(登録商標))、カボザンチニブ(カボメティクス(登録商標))、エベロリムス(アフィニトール(登録商標))、パゾパニブ(ヴォトリエント(登録商標))、ペムブロリズマブ(キイトルーダ(登録商標))、ソラフェニブ(ネクサバール(登録商標))、スニチニブ(スーテント(登録商標))、テムシロリムス(トーリセル(登録商標))を包含する。追加の治療はアベルマブ(バベンチオ(登録商標))、イピリムマブ(ヤーボイ(登録商標))、レンバチニブメシル酸塩(レンビマ(登録商標))、又はニボルマブ(オプジーボ(登録商標))を包含する。白血病の限定しない例は表1のダサチニブ(スプリセル(登録商標))、エナシデニブ(アイディハイファ(登録商標))、ギルテリチニブ(ゾスパタ(登録商標))、イマチニブ(グリベック(登録商標))、イボシデニブ(ティブソボ(登録商標))、ミドスタウリン(ライダプト(登録商標))、ニロチニブ(タシグナ(登録商標))、又はベネトクラクス(ベネクレクスタ(登録商標))を包含する。追加の治療はアレムツズマブ(キャンパス(登録商標))、ブリナツモマブ(ビーリンサイト(登録商標))、ボスチニブ(ボスリフ(登録商標))、デュベリシブ(コピクトラ(商標))、ゲムツズマブオゾガマイシン(マイロターグ(商標))、グラスデギブ(ダウリスモ(商標))、イブルチニブ(イムブルビカ(登録商標))、イデラリシブ(ザイデリグ(登録商標))、イノツズマブオゾガマイシン(ベスポンサ(登録商標))、モキセツモマブパスドトックス-tdfk(ルモキシティ(商標))、オビヌツズマブ(ガザイバ(登録商標))、オファツムマブ(アーゼラ(登録商標))、ポナチニブ(アイクルシグ(登録商標))、リツキシマブ(リツキサン(登録商標))、リツキシマブ及びヒトヒアルロニダーゼ(リツキサンハイセラ(商標))、タグラクソフスプエルゾス(エルゾンリス(商標))、チサゲンレクロイセル(キムリア(登録商標))、又はトレチノイン(ベサノイド(登録商標))を包含する。肺癌、例えばNSCLCの限定しない例は、表1のアファチニブ(ジオトリフ(GILORAF)(登録商標))、アレクチニブ(アレセンサ(登録商標))、アテゾリズマブ(テセントリク(登録商標))、ベバシズマブ(アバスチン(登録商標))、セリチニブ(LDK378/ジカディア(登録商標))、クリゾチニブ(ザーコリ(登録商標))、ダブラフェニブ(タフィンラー(TAFINAR)(登録商標))、ダコミチニブ(ビジンプロ(登録商標))、エルロチニブ(タルセバ(登録商標))、ゲフィチニブ(イレッサ(登録商標))、オシメルチニブ(タグリッソ(登録商標))、ペムブロリズマブ(キイトルーダ(登録商標))、ペメトレキセド(アリムタ(登録商標))、ラムシルマブ(サイラムザ(登録商標))、トラメチニブ(メカニスト(登録商標))を包含する。追加の治療はブリガチニブ(アルンブリグ(商標))、デュルバルマブ(イミフィンジ(商標))、ロルラチニブ(ローブレナ(登録商標))、ネシツムマブ(ポートラーザ(商標))、ニボルマブ(オプジーボ(登録商標))を包含する。リンパ腫の限定しない例は、表1のアカラブルチニブ(カルケンス(登録商標))、ペムブロリズマブ(キイトルーダ(登録商標))、ベネトクラクス(ベネクレクスタ(登録商標))を包含する。追加の治療は、アキシカブタゲンシロルユーセル(イエスカルタ(商標))、ベリノスタット(ベレオダク(登録商標))、ベキサロテン(タルグレチン(登録商標))、ボルテゾミブ(ベルケイド(登録商標))、ブレンツキシマブベドチン(アドセトリス(登録商標))、コパンリシブ(アリコパ(商標))、デニロイキンジフチトクス(オンタック(登録商標))、デュベリシブ(コピクトラ(商標))、イブリツモマブチウキセタン(ゼヴァリン(登録商標))、イブルチニブ(イムブルビカ(登録商標))、イデラリシブ(ザイデリグ(登録商標))、モガムリズマブ-kpkc(ポテリジオ(登録商標))、ニボルマブ(オプジーボ(登録商標))、オビヌツズマブ(ガザイバ(登録商標))、ポラツズマブベドチン-piiq(ポライビー(商標))、プララトレキサート(フォロチン(登録商標))、リツキシマブ(リツキサン(登録商標))、リツキシマブ及びヒトヒアルロニダーゼ(リツキサンハイセラ(商標))、ロミデプシン(イストダックス(登録商標))、シルツキシマブ(シルバント(登録商標))、チサゲンレクロイセル(キムリア(登録商標))、ボリノスタット(ゾリンザ(登録商標))を包含する。メラノーマの限定しない例は、表1のアリトレチノイン(パンレチン(登録商標))、ビニメチニブ(メクトビ(登録商標))、コビメチニブ(コテリック(登録商標))、ダブラフェニブ(タフィンラー(TAFINAR)(登録商標))、エンコラフェニブ(ビラフトビ(商標))、ペムブロリズマブ(キイトルーダ(登録商標))、トラメチニブ(メカニスト(登録商標))、又はベムラフェニブ(ゼルボラフ(登録商標))を包含する。追加の治療は、アベルマブ(バベンチオ(登録商標))、セミプリマブ-rwlc(リブタヨ(登録商標))、イピリムマブ(ヤーボイ(登録商標))、ニボルマブ(オプジーボ(登録商標))、ソニデジブ(オドムゾ(登録商標))、又はビスモデギブ(エリベッジ(登録商標))を包含する。多発性骨髄腫(MM)の限定しない例は、ボルテゾミブ(ベルケイド(登録商標))、カルフィルゾミブ(カイプロリス(登録商標))、ダラツムマブ(ダラザレックス(商標))、エロツズマブ(エムプリシティ(商標))、イキサゾミブ(ニンラーロ(登録商標))、パノビノスタット(ファリーダック(登録商標))、セリネクソール(エクスポビオ(商標))を包含する。前立腺癌の限定しない例は表1の酢酸アビラテロン(ザイティガ(登録商標))を包含する。追加の治療はアパルタミド(アーリーダ(商標))、カバジタキセル(ジェブタナ(登録商標))、ダロルタミド(ニュベクオ(登録商標))、エンザルタミド(イクスタンジ(登録商標))、ラジウム223二塩化物(ゾーフィゴ(登録商標))を包含する。癌処置に用いられ得る追加の薬物は、デノスマブ(ザイゲバ(登録商標))、ジヌツキシマブ(ユニツキシン(商標))、ヨーベングアンI131(アゼドラ(登録商標))、ランレオチド酢酸塩(ソマチュリン(登録商標)デポ)、ルテチウムLu177-ドータテート(ルタテラ(登録商標))、ニラパリブ(ゼジューラ(商標))、ルカパリブカンシル酸塩(ルブラカ(商標))、ルキソリチニブリン酸塩(ジャカフィ(登録商標))、シロリムス(ラパミューン(登録商標))、又はタラゾパリブ(タルゼナ(登録商標))を包含する。
【0030】
5.1.定義
次の用語は当業者に依って良く理解されると思われるが、次の定義は本開示の主題の説明を助ける為に提出される。
【0031】
本明細書に於いて用いられる計算されたシグネチャーの「曲線下面積」又は「AUC」は、AUCが0.60又は0.65超である場合には予測可能である。計算されたシグネチャーのAUCは、其れが0.75又はより多大である場合には「高度に予測可能」である。計算されたシグネチャーのAUCは0.80、0.85、0.90、0.95、0.97、又はより多大であり得る。
【0032】
本明細書に於いて用いられる「癌の臨床的徴候」は対象に於ける癌の存在の何れかの徴候又は指標を意味及び包含し、此の徴候又は指標は当業者(例えば、腫瘍医、診療看護師)には周知であろう。癌の臨床的徴候は、癌に関連する事が公知の何れかの症状であり得る。幾つかの癌の臨床的徴候は、例えば、慢性疼痛、吐き気、嘔吐、異状な味覚、便秘、尿路症状(例えば、膀胱痙攣)、呼吸器症状、皮膚の問題(例えば、痒み、脱毛)、又は高熱を取り分け包含する。
【0033】
寛解が腫瘍学分野に於いて平常で定義される通り、本明細書に於いて用いられる「寛解」は、癌の症状が縮減又は消失した期間を意味及び包含する。
【0034】
本明細書に於いて用いられるサンプル中のバイオマーカーのレベルを「続けて測定する」は、サンプル中のバイオマーカーのレベルを1回よりも多く、例えば四半期毎、隔月で、毎月、隔週で、毎週、3日毎、毎日、又は毎日数回測定する事を言う。レベルの続けてのモニタリングは、当業者に依って必要と見做される通り、バイオマーカーのレベルを定期的なインターバルで周期的に測定する事を包含する。
【0035】
本明細書に於いて用いられる用語「標準レベル」は、1つ以上の正常な対象に於いて決定されるバイオマーカーのベースラインレベルを言う。例えば、ベースラインは少なくとも1つの対象から得られ得、好ましくは対象(例えば、n=2から100以上)の平均から得られ、対象(単数又は複数)は癌の先立つ既往を有さない。本発明では、バイオマーカーレベルの測定は、記載される通り多重のコピー数を用いて実施され得る。
【0036】
本明細書に於いて用いられるように、標準レベルに対して相対的なバイオマーカーの測定レベルの「上昇」は、サンプル中のバイオマーカーの量又は濃度が、標準に対して相対的に、本明細書に記載される方法に依って検出される為に対象に於いて十分に多大であるという事を意味する。例えば、標準レベルに対して相対的な測定レベルの上昇は、検出可能である何れかの統計的に有意な上昇であり得る。斯かる上昇は、標準に対して相対的に約1%、約10%、約20%、約40%、約80%、約2倍、約4倍、約8倍、約20倍、又は約100倍の上昇、又はより多くを包含し得るが、此れ等に限定されない。本明細書に於いて用いられる用語「約」は、或る数値プラス又はマイナス数値の10%を言う。
【0037】
当分野に於いて公知のシグナル伝達経路調節薬又は化学療法薬剤の限定しない例は、5-フルオロウラシル;アスパラギナーゼ;ベバシズマブ(アバスチン(登録商標));ブレオマイシン;カンパテシン;セツキシマブ(アービタックス(登録商標));クリゾチニブ(ザーコリ(登録商標));シクロホスファミド;シタラビン;ダカルバジン;ダクチノマイシン;ダサチニブ(スプリセル(登録商標));ダウノルビシン;DNAメチルトランスフェラーゼ阻害剤(DNMT)、例えばアザシチジン(ビダーザ(登録商標))及びデシタビン;ドキソルビシン;ドキソルビシン;エピルビシン;エルブスタチン;エルロチニブ(タルセバ(登録商標));エストラムスチン;エトポシド;エトポシド;ゲフィチニブ(イレッサ(登録商標))、ゲムシタビン、ゲニステイン、ヒストンアセチルトランスフェラーゼ阻害剤(HAT);ヒストンデアセチルトランスフェラーゼ阻害剤(HDAC)、例えばベリノスタット、エンチノスタット(MS-275)、パノビノスタット、PCI-24781、ロミデプシン(デプシペプチド、FK-228)、バルプロ酸、ボリノスタット(ゾリンザ(登録商標)、SAHA)、又はHSP90阻害剤を包含する熱ショック蛋白質阻害剤、例えばアルベスピマイシン(IPI-493)、AT13387、AUY922(レゾルシノールイソオキサゾールアミド)、CNF2024(BIIB021)、HSP990、MPC-3100、レタスピマイシン(IPI-504)、SNX-2112、SNX-5422、STA-9090、タネスピマイシン(17-AAG;KOS-953)、又はXL888;ハービマイシンA;ヘキサメチルメラミン;ヘッジホッグ経路阻害剤、例えばサリデジブ(IPL-926)、ビスモデギブ(エリベッジ(商標));ヒドロキシ尿素、イダルビシン、イホスファミド、イマチニブ(グリベック(登録商標))、イリノテカン、ラパチニブ(タイケルブ(登録商標))、ラベンダスチンA、ロイコボリン、レバミゾール、メルカプトプリン、メトトレキサート、マイトマイシン、ミトキサントロン、mTOR阻害剤、例えばエベロリムス(アフィニトール(登録商標))、シロリムス(ラパミューン(登録商標))、テムシロリムス(トーリセル(登録商標));ニロチニブ(タシグナ(登録商標));ニトロソ尿素、例えばカルムスチン及びロムスチン;パクリタキセル;パニツムマブ(ベクティビックス(登録商標));パゾパニブ(ヴォトリエント(登録商標));ペガプタニブ(マクジェン(登録商標));白金化合物、例えばカルボプラチン、シスプラチン、オキサプラチン;プリカマイシン、プロカルバジン(procarbizine);プロテアソーム阻害剤、例えばボルテゾミブ(ベルケイド(登録商標));ラニビズマブ(ルセンティス(登録商標));ソラフェニブ(ネクサバール(登録商標));スニチニブ(スーテント(登録商標));タキサン、例えばドセタキセル、パクリタキセル、タキソール;チオグアニン;トポテカン;トラスツズマブ(ハーセプチン(登録商標));チロシンキナーゼ阻害剤;チルホスチン;バンデタニブ(カプレルサ(登録商標));ベムラフェニブ(ゼルボラフ(登録商標));ビンブラスチン;ビンカアルカロイド;ビンクリスチン;又はビノレルビンである。好ましい実施形態では、化学療法薬剤はベバシズマブ(アバスチン(登録商標))、セツキシマブ(アービタックス(登録商標))、クリゾチニブ(ザーコリ(登録商標))、ダサチニブ(スプリセル(登録商標))、エルロチニブ(タルセバ(登録商標))、エベロリムス(アフィニトール(登録商標))、ゲフィチニブ(イレッサ(登録商標))、イマチニブ(グリベック(登録商標))、ラパチニブ(タイケルブ(登録商標))、ニロチニブ(タシグナ(登録商標))、パニツムマブ(ベクティビックス(登録商標))、パゾパニブ(ヴォトリエント(登録商標))、シロリムス(ラパミューン(登録商標))、ソラフェニブ(ネクサバール(登録商標))、スニチニブ(スーテント(登録商標))、テムシロリムス(トーリセル(登録商標))、トラスツズマブ(ハーセプチン(登録商標))、バンデタニブ(カプレルサ(登録商標))、又はベムラフェニブ(ゼルボラフ(登録商標))である。化学療法薬剤の更なる例は、上の表1、標準的な刊行物及びテキストに見出され得る。例えば、全米総合癌ネットワーク(NCCNガイドライン(商標))又は「臨床腫瘍学マニュアル(Manual of Clinical Oncology)」デニスA.カシアート(Dennis A. Casciato)及びバリーB.ローウィッツ(Barry B. Lowitz)編, 第4版, 2000年7月15日, リトル・ブラウン・アンド・カンパニー, 米国を見よ。
【0038】
其れ等の発現シグネチャーが本明細書に於いて開示される方法を用いて計算され得る蛋白質の限定しない例は:14-3-3_ゼータ、4E-BP1、4E-BP1_pS65、4E-BP1_pT37_T46、4E-BP1_pT70、53BP1、ACC_pS79、ACC1、ADAR1、Akt_pS473、Akt_pT308、AMPK_アルファ、アネキシン_VII、AR、A-Raf_pS299、ASNS、Bap1-c-4、Bcl-2、Bim、B-Raf、B-Raf_pS445、BRD4、カスパーゼ-8、CDK1_pY15、Chk2、Chk2_pT68、cIAP、COG3、サイクリン_B1、サイクリン_E1、DJ-1、DUSP4、Dvl3、eEF2K、EGFR、eIF4E、eIF4G、ER、ER-アルファ、ER-アルファ_pS118、ERK2、FASN、FoxM1、GAPDH、GATA3、HER2、HER2_pY1248、INPP4B、IRS1、JNK2、MSH2、MSH6、NF2、p16_INK4a、p53、p62-LCKリガンド、p70S6K、p90RSK、P-カドヘリン、PCNA、PDK1、PDK1_pS241、PI3K-p110-アルファ、PI3K-p85、PR、PREX1、Rab25、Rad50、Raptor、S6、Smac、Smad1、Src、VEGFR2、XRCC1、又はYAP_pS127である。追加の詳細及び蛋白質は図9A~9E及び補足表5を見よ。
【0039】
本明細書に於いて、用語「約」及び/又は「大凡」は数的な値及び/又は範囲に用いられ得る。用語「約」は、記載されている値に近い値を意味すると理解される。例えば、「約40[単位]」は、40の±25%以内(例えば30から50)、±20%、±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%、±1%、±1%未満、又は其の中の若しくは其の下の何れかの他の値若しくは値の範囲以内を意味し得る。代替的には、文脈に依存して、用語「約」は±標準偏差の半分、±1標準偏差、又は±2標準偏差を意味し得る。更に其の上、言い回し「約[或る値]未満」又は「約[或る値]超」は、本明細書に於いて提供される用語「約」の定義から判断して理解されるべきである。用語「約」及び「大凡」は交換可能に用いられ得る。
【0040】
本明細書に於いて、或る種の数量については、数的範囲が提供される。此れ等の範囲は其の中の全ての部分範囲を含むという事は理解されるべきである。其れ故に、範囲「50から80」は其の中の全ての可能な範囲を包含する(例えば、51~79、52~78、53~77、54~76、55~75、60~70等)。更に其の上、所与の範囲内の全ての値は、それに依って包含される範囲のエンドポイントであり得る(例えば、範囲50~80は、例えば55~80、50~75等のエンドポイントを有する範囲を包含する)。
【0041】
本明細書及び請求項に於いて用いられる動詞「含む」並びに其の活用は、其の限定しない意味で用いられて、単語に後続する項目が包含されるが、具体的に言及されてはいない項目が除外されないという事を意味する。
【0042】
本明細書に於いて、単語「含む(comprising)」又は変形、例えば「含む(comprises)」若しくは「含む(comprising)」は、何れかの他の要素、完全体、若しくはステップ、又は要素、完全体、若しくはステップの群の除外ではなく、申し立てられる要素、完全体、若しくはステップ、又は要素、完全体、若しくはステップの群の包含を含意すると理解されるであろう。本開示は、好適には、請求項に記載されるステップ、要素、及び/又は試薬「を含み」得るか、「から成り」得るか、又は「から本質的に成り」得る。
【0043】
5.2.コンピューティングデバイス
コンピューティングデバイスは、プログラマブルハードウェアデバイス、例えばプロセッサー、デジタルシグナルプロセッサー、中央処理装置、フィールドプログラマブルゲートアレイ、プログラマブルロジックアレイ、プログラマブルロジックデバイス、クラウド処理システム、又は同類に実装され得る。コンピューティングデバイスは、種々のタイプのプロセッサーに依る実行の為のソフトウェアにもまた実装され得る。同定されるデバイスは実行可能コードを包含し得、例えば、コンピュータ命令の1つ以上の物理又は論理ブロックを含み得る。此れ等は例えばオブジェクト、手続き、ファンクション、又は他の構文として構成され得る。其れでも、同定されるデバイスの実行可能ファイルは物理的に一緒に位置する必要はなく、異なる位置に記憶された相違する命令を含み得る。此れ等が、一緒に論理的に連結される時にコンピューティングデバイスを構成し、コンピューティングデバイスの申し立てられる目的を達成する。別の例では、コンピューティングデバイスは、病院又は外来患者環境に位置した、且つ病院又は外来患者環境に於いて会計、購入処理、及び他のプロセスを管理する為の他のコンピューティングデバイス(例えば、POS機器又はコンピュータ)に通信接続されたサーバー又は他のコンピュータであり得る。別の例では、コンピューティングデバイスはモバイルコンピューティングデバイスであり得る。例えば、スマートフォン、携帯電話、ページャー、パーソナルデジタルアシスタント(PDA)、スマートフォンクライアントを有するモバイルコンピュータ、又は同類等だが此れ等に限定されない。別の例では、コンピューティングデバイスは、何れかのタイプのウェアラブルコンピュータ、例えばヘッドマウントディスプレイ(HMD)を有するコンピュータ、又はスマートウォッチ若しくは幾つかの他のウェアラブルスマートデバイスであり得る。コンピュータセンシングの幾らかは、ユーザーが着用している衣服の生地の一部であり得る。コンピューティングデバイスは、何れかのタイプの従来のコンピュータ、例えばラップトップコンピュータ又はタブレットコンピュータをもまた包含し得る。典型的なモバイルコンピューティングデバイスはワイヤレスデータアクセス対応デバイス(例えば、iPHONE(登録商標)スマートフォン、BLACKBERRY(登録商標)スマートフォン、NEXUS ONE(商標)スマートフォン、iPAD(登録商標)デバイス、スマートウォッチ、又は同類)であり、此れはインターネットプロトコル又はIP及びワイヤレスアプリケーションプロトコル又はWAPの様なプロトコルを用いてワイヤレスな様式でデータを送る事及び受け取る事ができる。此れは、ユーザーがワイヤレスデバイス、例えばスマートウォッチ、スマートフォン、携帯電話、ページャー、双方向ラジオ、通信機、及び同類を介して情報にアクセスする事を許す。ワイヤレスデータアクセスは、Bluetooth、近距離無線通信、CDPD、CDMA、GSM、PDC、PHS、TDMA、FLEX、ReFLEX、iDEN、TETRA、DECT、DataTAC、Mobitex、EDGE、並びに他の2G、3G、4G、5G、及びLTEテクノロジーを包含するが此れ等に限定されない多くのワイヤレスネットワークに依ってサポートされ、其れは多くのハンドヘルドデバイスオペレーティングシステム、例えばPalmOS、EPOC、Windows CE、FLEXOS、OS/9、JavaOS、iOS、及びAndroidで作動する。典型的には、此れ等のデバイスはグラフィカルディスプレイを用い、ワイヤレスネットワークの縮減されたメモリ制約を備え得る小さいファイルサイズを有するウェブブラウザである、所謂ミニ又はマイクロブラウザに依ってインターネット(又は他の通信ネットワーク)にアクセスし得る。代表的な実施形態では、モバイルデバイスは携帯電話又はスマートフォン又はスマートウォッチであり、此れが、GSMネットワークのデータテクノロジーであるGPRS(汎用パケット無線サービス)に依って作動するか、又は近距離無線通信、例えばBluetoothに依って作動する。従来の音声通信に加えて、所与のモバイルデバイスは、別の斯かるデバイスとBluetooth、近距離無線通信、SMS(ショートメッセージサービス)、拡張SMS(EMS)、マルチメディアメッセージ(MMS)、eメールWAP、ページング、又は他の公知の若しくは後で開発されるワイヤレスデータフォーマットを包含する多くの異なるタイプのメッセージ転送技術に依って通信し得る。本明細書に於いて提供される例の多くはスマートフォンに実装されるが、例は、類似に、何れかの好適なコンピューティングデバイス、例えばコンピュータに実装され得る。
【0044】
コンピューティングデバイスの実行可能コードは単一の命令又は多くの命令であり得、更には、異なるアプリケーション間で及び幾つかのメモリデバイス間で幾つかの異なるコードセグメントに分散され得る。類似に、オペレーションデータは、本明細書に於いてはコンピューティングデバイス内で同定及び例解され得、何れかの好適な形態で具現化され及び何れかの好適なタイプのデータ構造内で構成され得る。オペレーションデータは単一のデータセットとして収集され得るか、又は異なるストレージデバイスを包含する異なる位置に分散され得、少なくとも部分的には電子信号としてシステム又はネットワーク上に存在し得る。
【0045】
記載されている特徴、構造、又は特質は1つ以上の実施形態に於いて何れかの好適な様式で組み合わせられ得る。次の記載に於いては、本開示の主題の実施形態の綿密な理解を提供する為に、数々の具体的な詳細が提供される。然し乍ら、当業者は、本開示の主題が、特定の詳細の1つ以上なしに、又は他の方法、コンポーネント、材料等に依って実施され得るという事を認識するであろう。他の場合には、本開示の主題の態様を曖昧化する事を避けるために、周知の構造、材料、又はオペレーションは詳細には示されないか又は記載されない。
【0046】
本明細書に於いて用いられる用語「メモリ」は一般的にはコンピューティングデバイスのストレージデバイスである。例は、リードオンリーメモリ(ROM)及びランダムアクセスメモリ(RAM)を包含するが、此れ等に限定されない。
【0047】
コンピューティングデバイスのメモリ上で1つ以上のオペレーションを行なう為のデバイス又はシステムは、ソフトウェア、ハードウェア、ファームウェア、又は此れ等の組み合わせであり得る。デバイス又はシステムは、更に、種々の此れ迄に開示された決定、計算、又は同類を本開示の目的の為に行なうことができる全てのソフトウェア又はコンピュータプログラムを包含又は別様にカバーする事が意図される。例えば、例示的な実施形態は、プロセッサーが本開示のプロセスを実装する事を可能化できる全てのソフトウェア又はコンピュータプログラムをカバーする事が意図される。例示的な実施形態は、斯かるソフトウェア又はコンピュータプログラムを記録又は記憶する何れかの及び全ての現行で公知の関係する技術又は後で開発される非一時的な記録若しくは記憶媒体(例えばCD-ROM、DVD-ROM、ハードドライブ、RAM、ROM、フロッピーディスク、磁気テープカセット等)をカバーする事をもまた意図される。例示的な実施形態は、更に、下で開示される例示的なオペレーションを実装する事に使用可能な何れかの他の現行で公知の関係する技術又は後で開発される媒体(例えば一時的な媒体、搬送波等)に依って提供される斯かるソフトウェア、コンピュータプログラム、システム、及び/又はプロセスをカバーする事が意図される。
【0048】
例示的な実施形態に従うと、本開示のコンピュータプログラムは多くの例示的なやり方で実行され得る。例えば、デバイスのメモリに常駐するか、又はサーバー上で実行され、幾つもの標準プロトコル、例えばTCP/IP、HTTP、XML、SOAP、REST、JSON、及び他の十分なプロトコルに依ってデバイスアプリケーション若しくはブラウザと通信するホストアプリケーションとしての、アプリケーションである。本開示のコンピュータプログラムは、デバイス上のメモリから又はホストサーバーから実行する例示的なプログラミング言語、例えばBASIC、COBOL、C、C++、Java、Pascal、又はスクリプト言語、例えばJavaScript、Python、Ruby、PHP、Perl、又は他の好適なプログラミング言語で書かれ得る。
【0049】
本明細書に於いて言われる用語「コンピューティングデバイス」及び「実態」は幅広く解釈されるべきであり、交換可能であると理解されるべきである。其れ等は、何れかのタイプのコンピューティングデバイス、例えばサーバー、デスクトップコンピュータ、ラップトップコンピュータ、スマートフォン、携帯電話、ページャー、パーソナルデジタルアシスタント(例えばGPRS NICに依るPDA)、スマートフォンクライアントを有するモバイルコンピュータ、又は同類を包含し得る。
【0050】
本明細書に於いて言われるユーザーインターフェースは、一般的には、ユーザーがコンピューティングデバイスとインタラクションするシステムである。ユーザーインターフェースは、ユーザーがコンピューティングデバイスを操作する事を許す入力を包含し得、システムが情報及び/又はデータを提示する事、ユーザーの操作の効果を指示する事等を許す出力を包含し得る。コンピューティングデバイス(例えばモバイルデバイス)のユーザーインターフェースの例は、ユーザーがタイピングよりも多くのやり方でプログラムとインタラクションする事を許すグラフィカルユーザーインターフェース(GUI)を包含する。GUIは、典型的には、ユーザーに利用可能な情報及びアクションを表す為に、テキストに基づくインターフェース、タイピングされるコマンドラベル、又はテキストナビゲーションではなくて表示オブジェクト及びビジュアルインジケータをオファーし得る。例えば、インターフェースはディスプレイウィンドウ又は表示オブジェクトであり得、此れがインタラクションの為にモバイルデバイスのユーザーに依って選択可能である。ユーザーインターフェースは、ユーザーがコンピューティングデバイスを操作する事を許す為の入力を包含し得、コンピューティングデバイスが情報及び/又はデータを提示する事、ユーザーの操作の効果を指示する事等を許す為の出力を包含し得る。コンピューティングデバイスのユーザーインターフェースの例は、ユーザーがタイピングよりも多くのやり方でプログラム又はアプリケーションとインタラクションする事を許すグラフィカルユーザーインターフェース(GUI)を包含する。GUIは、典型的には、ユーザーに利用可能な情報及びアクションを表す為に、テキストに基づくインターフェース、タイピングされたコマンドラベル、又はテキストナビゲーションではなくて表示オブジェクト及びビジュアルインジケータをオファーし得る。例えば、ユーザーインターフェースはディスプレイウィンドウ又は表示オブジェクトであり得、此れがインタラクションの為にコンピューティングデバイスのユーザーに依って選択可能である。表示オブジェクトはコンピューティングデバイスのディスプレイスクリーン上に表示され得、ユーザーインターフェースを用いるユーザーに依って選択及びインタラクションされ得る。或る例では、コンピューティングデバイスのディスプレイは、ディスプレイアイコンを表示し得るタッチスクリーンであり得る。ディスプレイアイコンを選択する為に、ユーザーはディスプレイアイコンが表示されるディスプレイスクリーンのエリアを押し下げ得る。別の例では、ユーザーはコンピューティングデバイスの何れかの他の好適なユーザーインターフェース、例えばキーパッドを用いて、ディスプレイアイコン又は表示オブジェクトを選択し得る。例えば、ユーザーは、カーサーを移動して表示オブジェクトを強調及び選択する為にトラックボール又は矢印キーを用い得る。
【0051】
表示オブジェクトは、モバイルデバイスのディスプレイスクリーン上に表示され得、インターフェースを用いるユーザーに依って選択及びインタラクションされ得る。或る例では、モバイルデバイスのディスプレイはタッチスクリーンであり得、此れがディスプレイアイコンを表示し得る。ディスプレイアイコンを選択する為に、ユーザーはディスプレイアイコンが表示されるディスプレイスクリーンのエリアを押し下げ得る。別の例では、ユーザーはモバイルデバイスの何れかの他の好適なインターフェース、例えばキーパッドを用いて、ディスプレイアイコン又は表示オブジェクトを選択し得る。例えば、プロセッサーが本開示の態様を実施する事を引き起こす為に、ユーザーはトラックボール又はタイムズ(times)プログラム命令を其れに用い得る。
【0052】
本明細書に於いて言われるコンピュータネットワークは、一緒にリンクされているコンピューティングシステム、デバイス、又は機器の何れかの群であり得る。例は、ローカルエリアネットワーク(LAN)及びワイドエリアネットワーク(WAN)を包含するが、此れ等に限定されない。ネットワークは其の設計モデル、トポロジー、又はアーキテクチャに基づいてカテゴリー化され得る。或る例では、ネットワークは階層的インターネットワーキングモデルを有するとしてキャラクタリゼーションされ得、此れがネットワークを3つの層:アクセス層、ディストリビューション層、及びコア層に分ける。アクセス層は、クライアントノード、例えばワークステーションをネットワークに接続する事に焦点を合わせる。ディストリビューション層はルーティング、フィルタリング、及びサーバー品質(QoS)ポリシーを管理する。コア層は、ネットワークの異なる領域のディストリビューション層デバイス間でパケットを移動する為の高速の高冗長性のフォワーディングサービスを提供し得る。コア層は典型的には複数のルーター及びスイッチを包含する。
【0053】
本主題は、システム、方法、及び/又はコンピュータプログラム製品であり得る。コンピュータプログラム製品は、プロセッサーが本主題の態様を実施する事を引き起こす為のコンピュータ読み取り可能なプログラム命令を其の上に有するコンピュータ読み取り可能な記憶媒体(単数又は複数)を包含し得る。
【0054】
コンピュータ読み取り可能な記憶媒体は、命令実行デバイスに依る使用の為の命令を保持及び記憶し得るタンジブルデバイスであり得る。コンピュータ読み取り可能な記憶媒体は、例えば、電子ストレージデバイス、磁気式ストレージデバイス、光学式ストレージデバイス、電磁式ストレージデバイス、半導体ストレージデバイス、又は前述の何れかの好適な組み合わせであり得るが、此れ等に限定されない。コンピュータ読み取り可能な記憶媒体のより具体的な例の非網羅的なリストは次を包含する:ポータブルコンピュータディスケット、ハードディスク、RAM、ROM、消去可能プログラマブル読み取り専用メモリ(EPROM又はフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスクリードオンリーメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリースティック、フロッピーディスク、機械的にコード化されたデバイス、例えば命令が其の上に記録されたパンチカード又は溝中の隆起構造、及び前述の何れかの好適な組み合わせ。本明細書に於いて用いられるコンピュータ読み取り可能な記憶媒体は、一時的なシグナル其の物、例えばラジオ波又は他の自由伝搬電磁波、ウェーブガイド若しくは他の伝送媒体に依って伝搬する電磁波(例えば、光ファイバーケーブルを通る光パルス)、又は配線に依って伝送される電気信号であると解釈されるべきではない。
【0055】
本明細書に記載されるコンピュータ読み取り可能なプログラム命令は、コンピュータ読み取り可能な記憶媒体から其々のコンピューティング/処理デバイスに、或いはネットワーク、例えばインターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、及び/又はワイヤレスネットワーク若しくは近距離無線通信を介して外部コンピュータ若しくは外部ストレージデバイスにダウンロードされ得る。ネットワークは、銅伝送ケーブル、光伝送ファイバー、ワイヤレス伝送、ルーター、ファイヤーウォール、スイッチ、ゲートウェイコンピュータ、及び/又はエッジサーバーを含み得る。各コンピューティング/処理デバイスのネットワークアダプターカード又はネットワークインターフェースは、コンピュータ読み取り可能なプログラム命令をネットワークから受け取り、其々のコンピューティング/処理デバイス内のコンピュータ読み取り可能な記憶媒体に於ける記憶の為に、コンピュータ読み取り可能なプログラム命令をフォワーディングする。
【0056】
本主題のオペレーションを実施する為のコンピュータ読み取り可能なプログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、ステート設定データ、又はソースコード若しくはオブジェクトコード何方かであり得、オブジェクト指向プログラミング言語、例えばJava、Smalltalk、C++、Javascript、又は同類、及び従来の手続き型プログラミング言語、例えば「C」プログラミング言語又は類似のプログラミング言語を包含する1つ以上のプログラミング言語の何れかの組み合わせで書かれ得る。コンピュータ読み取り可能なプログラム命令は、全体がユーザーのコンピュータ上で、一部がユーザーのコンピュータ上で、スタンドアローンソフトウェアパッケージとして、一部がユーザーのコンピュータ上で且つ一部がリモートコンピュータ上で、又は全体がリモートコンピュータ若しくはサーバー上で実行され得る。後者のシナリオでは、リモートコンピュータは、ローカルエリアネットワーク(LAN)若しくはワイドエリアネットワーク(WAN)を包含する何れかのタイプのネットワークに依ってユーザーのコンピュータに接続され得るか、又は接続は外部コンピュータに対して(例えば、インターネットサービスプロバイダーを用いるインターネットに依って)為され得る。幾つかの実施形態では、本主題の態様を行なう為に、例えばプログラマブルロジック回路、フィールドプログラマブルゲートアレイ(FPGA)、又はプログラマブルロジックアレイ(PLA)を包含する電子回路が、電子回路を個別化する為にコンピュータ読み取り可能なプログラム命令のステート情報を利用する事に依って、コンピュータ読み取り可能なプログラム命令を実行し得る。
【0057】
本主題の態様が、主題の実施形態に従う方法、装置(システム)、及びコンピュータプログラム製品のフローチャート図解及び/又はブロック図を参照して本明細書に記載される。フローチャート図解及び/又はブロック図の各ブロック並びにフローチャート図解及び/又はブロック図のブロックの組み合わせは、コンピュータ読み取り可能なプログラム命令に依って実装され得るという事は理解されるであろう。
【0058】
此れ等のコンピュータ読み取り可能なプログラム命令は、コンピュータ、専用のコンピュータ、又は他のプログラマブルデータ処理装置のプロセッサーに提供されて、機械を生じ得る。其の結果、コンピュータ又は他のプログラマブルデータ処理装置のプロセッサーに依って実行される命令は、フローチャート及び/又はブロック図のブロック(単数又は複数)に指定された機能/役割を実装する為の手段を作り出す。また、此れ等のコンピュータ読み取り可能なプログラム命令はコンピュータ読み取り可能な記憶媒体上に記憶され得、此れがコンピュータ、プログラマブルデータ処理装置、及び/又は他のデバイスが特定の様式で機能する様に指図し得る。其の結果、其の中に命令が記憶されたコンピュータ読み取り可能な記憶媒体が、フローチャート及び/又はブロック図のブロック(単数又は複数)に指定された機能/役割の態様を実装する命令を包含する製造品を構成する。
【0059】
また、コンピュータ読み取り可能なプログラム命令はコンピュータ、他のプログラマブルデータ処理装置、又は他のデバイスにロードされて、一連のオペレーションステップがコンピュータ、他のプログラマブル装置、又は他のデバイス上で行われる事を引き起こして、コンピュータに実装されたプロセスを生じ得る。其の結果、コンピュータ、他のプログラマブル装置、又は他のデバイス上で実行される命令が、フローチャート及び/又はブロック図のブロック(単数又は複数)に指定された機能/役割を実装する。
【0060】
図中のフローチャート及びブロック図は、本主題の種々の実施形態に従うシステム、方法、及びコンピュータプログラム製品の可能な実装のアーキテクチャ、機能性、及びオペレーションを例解する。此の点で、フローチャート又はブロック図の各ブロックは、命令のモジュール、セグメント、又は部分を表し得、此れは指定された論理機能(単数又は複数)を実装する為の1つ以上の実行可能な命令を含む。幾つかの代替的な実装では、ブロックに注記されている機能は、図に注記されている順序から外れて起こり得る。例えば、関わる機能性に依存して、連続して示されている2つのブロックは事実実質的に同時的に実行され得るか、又はブロックは場合に依っては逆の順序で実行され得る。ブロック図及び/又はフローチャート図解の各ブロック並びにブロック図及び/又はフローチャート図解のブロックの組み合わせが、専用のハードウェアに基づくシステムに依って実装され得、此れ等が、指定された機能若しくは役割を行なうか又は専用のハードウェア及びコンピュータ命令の組み合わせを実施するという事もまた注記される。
【0061】
請求項は何れかの任意の要素を除外する様にドラフトされ得るという事が更に注記される。其の為、此の申し立ては、請求項の要素についての「専ら」、「のみ」、及び同類等の排他的な術語の記載の使用又は「否定的」限定の使用の先行する根拠として働く事が意図される。
【0062】
別様に定義されない限り、本明細書に於いて用いられる全ての技術的及び科学的用語は、本開示が属する分野の業者に依って普通に理解される同じ意味を有する。好ましい方法、デバイス、及び材料が記載されるが、本明細書に記載される物と類似の又は同等の何れかの方法及び材料は本開示の実施又はテストに用いられ得る。本明細書に於いて引用される全ての参照は、其れ等の全体が参照に依って組み込まれる。
【0063】
次の例は本開示を更に例解し、範囲を限定する事は意図されない。特に、本開示は記載される特定の実施形態には限定されないという事は理解されるべきである。何故なら、其れ等は当然の事乍ら変形し得るからである。本開示の範囲は添付の請求項に依ってのみ限定されるであろうから、本明細書に於いて用いられる術語は特定の実施形態を記載する目的の為のみであり、限定する事は意図されないという事もまた理解されるべきである。
【実施例
【0064】
6.例
6.1.概要
腫瘍表現型を正確にキャラクタリゼーション及び予測する能力は、患者の予後を予測する為に重大である。加えて、シグナル伝達経路の活性の様な鍵の表現型の予測モデルを構築する事は、処置選択をガイドする為に有益であろう。此の研究では、腫瘍DNA情報と遺伝子発現シグネチャーの総合的アーカイブとが、腫瘍生物学の複数の態様を詳しくキャラクタリゼーションする為のフレームワークとして利用された。ゲノムワイドな関連性分析及びエラスティックネット予測方法を用いる統合的な計算論的アプローチが、DNAコピー数異常及び遺伝子発現シグネチャーの間の関係性を分析する為に提示される。アプローチは、増殖ステータス及びEGFR経路活性を包含するDNAコピー数特徴単独に基づいて、高い正確度で、乳癌の個々の腫瘍内の多くの発現シグネチャーレベルを定量的に予測する事ができた。また、エラスティックネットモデルは、固有の分子サブタイプを包含する多くの他の鍵の表現型、エストロゲン受容体ステータスを包含する幾つかの蛋白質発現特徴、並びに(and for)TP53及びCDH1を包含する体細胞変異ステータスを予測することができた。此のアプローチは複数の他の腫瘍タイプに首尾良く適用され(汎癌)、此れは扁平上皮/基底細胞様癌の免疫細胞特徴を包含する幾つもの繰り返し予測可能なシグネチャーを同定した。また、此れ等のエラスティックネットDNA予測因子は、普通に用いられるDNAに基づく遺伝子パネルから、其れ故に、多くの場合に治療の方針決定をガイドする非遺伝学的腫瘍特徴について情報提供する為にもまた、コールされ得た。シャ等(Xia et al.)(2019年12月11日公開)「上皮癌の分子ポートレートの遺伝学的決定因子(Genetic Determinants of the Molecular Portraits of Epithelial Cancers)」ネイチャーコミュニケーションズ(Nature Communications)第10巻: p.5666を見よ。此れの内容は其の全体が組み込まれる。
【0065】
複数の遺伝子シグネチャー特異的なDNAコピー数異常のキャラクタリゼーション
DNAコピー数異常(CNA)及び複数の遺伝子発現シグネチャーの間の可能な関連性が第1に検討された。当初の焦点は、複数の遺伝子発現シグネチャーが既に普通に臨床使用中である乳部腫瘍である10-12。複数のシグナル伝達経路、公知の予後/予測モデル、腫瘍微小環境特徴、並びにDNAアンプリコン及び欠失の特徴を包含する多様な表現型を測定する543の公開された遺伝子発現シグネチャーのパネル13が、TCGA乳癌プロジェクトから来るRNA-seqデータを用いる1038の乳癌に適用された(補足表1)。各シグネチャーに基づく表現型にDNA CNAをリンクする可能な関連性を同定する為に、DNAコピー数データが用いられた。先に、ガッツァ等(Gatza et al.)は、CNA及び52遺伝子シグネチャーの限定されたパネルの間の可能な関連性を調べる為に、患者のかなり小さいコホートの関連性分析方法を開発した。此の関連性分析は、別の491シグネチャーを包含し、固有の分子サブタイプ情報を考慮する様に改変された(図1A)。何故なら、幾つかの遺伝子シグネチャーはサブタイプ特異的な関連性を示したからである(図2A図2B)。各シグネチャーでは、2つの独立の統計方法が関連性について検定する為に用いられた。発現シグネチャースコア及び遺伝子レベルDNAセグメント値の間の正の又は負の相関を同定する為に、サブタイプを共変量とする線形回帰が用いられた。ガッツァ等(Gatza et al.)の成果を踏襲して、高いシグネチャースコアを有するサンプル(上位四分位)及び低いシグネチャースコアを有する物(他の全て)に於けるCNAゲイン又はロスの度数を比較する為に、フィッシャーの正確検定が用いられた。両方の検査は偽発見率をコントロールする為にベンジャミーニ-ホッホベルク補正された14。あり得る偽陽性結果を更に縮減する為に、発現シグネチャーに関連するDNA CNA特徴は、値が両方の分析に於いて統計的に有意である場合にのみコールされた(q<0.01)。高いシグネチャースコアを有するサンプルに於いては、シグネチャーのあり得るDNA CNA駆動因子は正の相関と増大したコピー数ゲインとを有するはずであり、あり得る抑圧因子は負の相関とコピー数ロスの増大した度数とを有するであろう。此のアプローチに依って、関連性ランドスケープが各シグネチャーについて分析され、多くの発現シグネチャーは斯かる関連性を有さないという事を指摘した。
【0066】
此れ等の結果を同じシグネチャーについてのガッツァ等(Gatza et al.)からの物と比較する事に依って、関連性ランドスケープの再現性が分析された。此処では、ガッツァ等(Gatza et al.)の全ての52のシグネチャーが包含された。特に、RB-LOHシグネチャー15が焦点であり、現行の分析がTCGA乳部腫瘍のかなり大きいコホートのデータを用いたという事を指摘する(n=1038対n=476);加えて、2つの研究の間の別の体系的な違いは、ガッツァ等(Gatza et al.)は遺伝子発現マイクロアレイを用いたが、mRNA-seqが用いられたという事である。より重要な事には、サブタイプに拘らず普遍的関連性を同定する為に、分子サブタイプが考慮された。此れ等の方法論的違いにも拘らず、RB-LOHシグネチャーの関連性ランドスケープとガッツァ等(Gatza et al.)に依って公開された物との間には高い一致があった(図1B);両方のランドスケープは公知のRB-E2Fコンポーネントの同定を強調し、RB1のDNAロス並びにE2F1及びE2F3のゲインと、MYC及びCCND2を包含する複数の細胞周期駆動因子の増幅とを包含した16。SOS1等の先の結果に存在するが此の分析では不在の関連性もまたあった;此れは固有のサブタイプの補正を原因とした。何故なら、SOS1及びRB-LOHシグネチャーの間の相関は基底細胞様腫瘍にのみ存在したからである。
【0067】
新たな及び古い可能な関連性が、全ての543の遺伝子シグネチャーを用いて調べられた。先に決定されたDNAアンプリコン遺伝子発現シグネチャーに対する関連性が見出され、全ては対応するアンプリコンの領域を包含し(図3)、関連性分析が、発現シグネチャーの公知のDNAに基づく駆動因子を同定する事ができるという事を示した。ホードリー等(Hoadley et al.)2014年17の12腫瘍タイプのPanCan(n=3500)腫瘍分析から定義される2つの重要な「遺伝子プログラム」の普遍的発現シグネチャー、詰まり「基底シグナル伝達」シグネチャー及び「エストロゲンシグナル伝達」シグネチャーは、両方とも多くの情報に富む関連性を示した。基底シグナル伝達シグネチャーでは、RAD17、RAD50、PALB2、及びBRCA1等のDNA修復に関わる遺伝子のロス/欠失を包含する先に公知の関連性が同定された(図1C)。エストロゲンシグナル伝達シグネチャーでは、多くの独特なルミナル腫瘍DNAコピー数変化が同定され、16pゲイン及び16qロスを包含した図1D)。総括すると、此れ等の結果は、本明細書に於いて開示される戦略が、其れ等の多くが先に公知であった特定の遺伝子シグネチャーにCNAをリンクする関連性を客観的に見出す事ができるという事を実証している。
【0068】
エラスティックネットモデルに依るCNAに基づく遺伝子シグネチャー予測
此れ等の関連性の強さから、DNA CNA特徴のみに基づく遺伝子発現シグネチャーレベルの計算論的予測因子を構築する事の実現可能性が評価された。CNA及び遺伝子シグネチャーの間の関連性が見出され得たという事実に基づくと、発現シグネチャーの少なくとも幾つかはDNA情報単独を用いて予測可能であろうという事が可能であった。予測モデルを首尾良く構築する為に、エラスティックネットと呼ばれる統計モデリングアプローチが用いられた。此れは正則化回帰モデルであり、此れは多数のあり得るコリニア変数を扱う事ができ、其れから、最終モデルを構築する為の最も妥当な特徴を選択する事ができる。遺伝子レベルCNAスコアを予測因子として用いる代わりに、536のセグメントレベルCNAスコアが、癌に重要である事が示されている所定の染色体領域を用いて計算された18-22(補足表2)。此れ等のDNAセグメントは、有意な汎癌体細胞CNA及び乳癌サブタイプ特異的なCNA領域を包含した。1038サンプルTCGA乳癌データセットがトレーニングセット(70%)及びテストセット(30%)に分割された。モデルが専らTCGAトレーニングセットから構築され、TCGAテストセット及び大きい独立の乳部腫瘍データセット(乳癌国際コンソーシアムの分子タキソノミー(METABRIC)、n=1,689)両方に依ってバリデーションされた。サンプルを高いシグネチャースコア(上位3分の1)対低いシグネチャースコア(下位3分の2)を有する物に分類する様に、モデルがトレーニングされた。ROC曲線下面積(AUC)値がモデル性能を評価する為に用いられた(図4A)。
【0069】
全ての遺伝子シグネチャーのAUC分布はシグネチャーの全てではないが幾つかについて高い予測可能性を実証した(図4B)。当然の事乍ら、AUC値はTCGAトレーニングセットで最も高かった。然し乍ら、AUC値は多くのシグネチャーについてTCGAテストセット及びMETABRICバリデーションセットの間で高く且つ非常に類似であり、首尾良いモデルが複数の発現特徴について開発されるという事を示した。注目すべき事に、543のシグネチャーの中で142は両方のバリデーションセットに於いて0.75よりも上のAUC値を有し、「高度に予測可能」である事が決定された。此れ等の142シグネチャーの中で、33のみが、本質的に特異的なCNA事象を測定するDNAに基づくアンプリコンシグネチャーであり、因って、高いAUC値を生ずる事が予想された。例えば、シグネチャー16q23アンプリコン23はMETABRICバリデーションセットに於いて最も高いAUC値を有した(AUC=0.96)。注目すべき事に、関連性ランドスケープで強調された3つのシグネチャー、詰まりRB-LOHシグネチャー、基底シグナル伝達シグネチャー、及びエストロゲンシグナル伝達シグネチャーは、対応する受信者動作特性(ROC)曲線に依って示される通り、全て高度に予測可能であった(AUC>0.85)(図4C図4E)。最も予測可能なシグネチャーは、複数の増殖シグネチャー及び少数の発癌経路を包含し、最も予測可能でないシグネチャーは、殆ど、腫瘍微小環境の免疫浸潤物及び他の特徴を表す物であった。特に、EGFR経路活性を指示するホードリー等(Hoadley et al.)2007年に依って先に開発されたHER1-C2シグネチャー24は両方のバリデーションセットに於いて~0.90のAUC値を有した(図5A)。更に其の上、乳癌クリニックで普通に用いられる市販のシグネチャーの3つの研究に基づく実装、詰まりOncotypeDX(登録商標)再発スコア25、MAMMAPRINT(登録商標)70遺伝子再発スコア26、及びProsigna(登録商標)再発リスクスコア11は、高度に予測可能なシグネチャーの内であり、0.89、0.88、及び0.91という対応するTCGAテストセットAUC値を有した(図5B図5D)。入れ替えテストは、0.75のテストセットAUCが有意な予測力を指示するという事を示し(図6)、予想され得る通り、入れ替えデータでは、達成された最も高いAUCは0.63であるという事と、大多数が0.5に近いという事とを指摘した。此れ等の142のシグネチャーの中で、33のみが本質的に特異的なCNA事象を測定するDNAに基づくアンプリコンシグネチャーであり、因って、高いAUC値を生ずる事が予想された。例えば、シグネチャー16q23アンプリコン23はMETABRICバリデーションセットに於いて最も高いAUC値を有した(AUC=0.96)。
【0070】
此れ等の予測モデルをより良く理解する為に、エラスティックネットモデルに依って選択されたCNA領域(補足表3)が検討された。関連性ランドスケープに対して直接的に比較する為に、3つのシグネチャーのモデル特徴ランドスケープが示されている。顕著には、CNAとの多くの関連性を有したRB-LOHシグネチャー及び基底シグナル伝達シグネチャーでは、関連性ランドスケープ及びエラスティックネットモデル特徴ランドスケープの間に有意な量のオーバーラップがあった(図4F図4G)。例えば、RB-E2Fコンポーネント及び細胞周期コンポーネントはRB-LOHシグネチャーと有意に関連し、エラスティックネットに依ってRB-LOHシグネチャースコアの予測の為に選択された。反対に、エストロゲンシグナル伝達シグネチャーは単純な関連性ランドスケープを有したが、エラスティックネットモデルは、関連性分析に基づく領域の物以外の多くの更なる特徴を選択した(図4H)。此れは、遺伝子を1つずつ評価する関連性分析よりも寧ろ、全ゲノムのデータを一緒にする事に依って、エラスティックネットがCNA及び遺伝子シグネチャーの間の関係性についての追加の情報を提供するという事を示唆する。加えて、高度に予測可能なHER1-C2シグネチャーでは、多くのEGFR経路関連遺伝子が其のエラスティックネットモデルに依って選択され、EGFR其れ自体、KRAS、SOS1、及びNRASを包含した(図7B)。一緒にすると、此れ等の結果は、高い正確度と生物学的に見込みある且つ情報に富む特徴セットとを有するDNA CNAのみを用いて、多くの遺伝子発現シグネチャーを予測する能力を示している。
【0071】
固有の分子サブタイプのCNAに基づく予測
次に、エラスティックネットDNA特徴モデリング戦略は、乳癌の個々のサンプル分子サブタイプの予測を包含する他の複雑な腫瘍表現型の予測に適用された11。全ての固有のサブタイプの予測モデルは高いAUC値を実証し(即ち>0.75)、此れ等のRNAに基づく表現型がDNAに基づく情報に依って良く説明され得るという事を指示した(図11A図11D、補足表4)。基底細胞様乳癌がユニークな疾患実体に相当するという先の知見と整合して、基底細胞様サブタイプは最も高いテストセットAUC値を有した(>0.9)17。1pゲイン及び5qロス等の基底細胞様サンプルに於いて高頻度で異常である領域は、予測エラスティックネットモデルに依って選択された20,21図11F)。HER2高発現サブタイプもまた高いAUC値を有し(>0.82)、意外ではないが、其のモデルに依って選択された領域はERBB2領域を包含した。此れは此のサブタイプの有力な駆動因子である(図11G)。ルミナルA及びルミナルBサブタイプは予測する事がより難しかったが、依然として高度に予測可能であった(METABRICバリデーションセットのルミナルAのAUC=0.82及びルミナルBのAUC=0.76)。此れ等の2つのサブタイプ間の独特な違いは増殖速度であり、此処で、ルミナルB腫瘍は一般的にルミナルA腫瘍よりも高い増殖速度を有する;予想され得る通り、8q(MYC)増幅及びRB1欠失を包含する増殖に関係する領域はルミナルB予測モデルのみに存在した(図11H図11I)。組織学的サブタイプもまた臨床処置の方針決定を左右するので、DNA CNAに基づくエラスティックネットモデルが、2つの主要な乳癌組織学、詰まり浸潤性乳管癌(IDC)及び浸潤性小葉癌(ILC)を如何に予測するかが評価された。ROC曲線は高いAUC値をTCGAトレーニングセット(0.87)及びテストセット(0.8)両方(図11E)に於いて示した。ILCのホールマークの染色体16q22.1に位置するCDH1のロスは、モデルの特徴ランドスケープに反映された(図11J)。
【0072】
個々の蛋白質発現のCNAに基づく予測
加えて、エラスティックネットのDNAに基づくモデリング戦略は、個々の蛋白質の予測モデルを構築する為に適用された。TCGA乳癌サンプルから来る216の蛋白質及びリン蛋白質を測定する逆相蛋白質アレイ(RPPA)データが利用された。多くの研究が蛋白質レベル及びmRNA存在量の間の関係性に取り組み、mRNA転写物レベルが蛋白質レベルを約50%の確率で予測するという事を結論付けた27。少数の研究は、蛋白質発現に対するDNAコピー数の影響をもまた検討しており、有意な相関を有する幾つかの蛋白質、典型的には増幅又は欠失の標的である物を見出している28,29。然し乍ら、此れ等の研究は相関を個々の遺伝子について評価している。此処では、蛋白質発現を予測する為に全ゲノムを考慮に入れる為のエラスティックネットモデルが構築される。0.75に等しいか又はより多大な「高精度」AUCの前述の定義を用いて、モデルは、RPPAアレイに存在する216の蛋白質発現レベルの内、16を正確に予測する事ができた(テストセットAUC>0.75)(図12A図12F、補足表5)。臨床的には、乳癌に於いて、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、及びヒト上皮成長因子受容体(HER2)の蛋白質発現は乳癌処置を指図し、免疫組織化学(IHC)染色に依ってルーチン的に評価される。RPPAに依って評価された此れ等の3つの蛋白質の発現は、本明細書に於いて開示されるモデルに依って全て高度に予測可能であった(AUC>0.75)(図9A図9D、補足表5)。他の13の高度に予測可能な蛋白質の中で、其れ等の多くは細胞周期に関係し、CCNB1、CCNE1、及びFOXM1を包含した。別の興味深い予測可能な蛋白質はASNSであった(テストセットAUC=0.82);最近、ASNSは乳癌転移に重要な役割を演ずる事が示されている。此処では、其の高い発現が、肺転移の増大した転移ポテンシャルにリンクされた。此れは可能な治療標的を表す30,31
【0073】
乳癌では、最も決定的な治療バイオマーカーはER、PR、及びHER2であり、免疫組織化学に依ってスコア付けされる。HER2予測では、HER2及び17qが、最も大きい係数で、HER2 RPPA蛋白質発現のモデル及びHER2臨床IHCステータスに依ってガイドされるモデル両方に依って選択された(図12E図12F)。対照的に、ESR1コピー数ゲイン/ロスは稀であるので、ERの蛋白質発現はESR1コピー数変化に依って説明され得ない32。尚も、エラスティックネットモデルは、DNAコピー数情報のみを利用する時に、ER RPPA蛋白質発現(AUC 0.82)及びER臨床IHCステータス(METABRICバリデーションセットでAUC 0.89)を正確に予測する事ができた。此れ等の2つのモデルの特徴のランドスケープは複雑であり、多くの正の及び負の予測因子を有した。注目すべき事に、ルミナル特徴の16pゲイン及び16qロスがモデルに包含され、ERの正値がルミナル腫瘍に於いて広まっているという事実と整合した(図9E)。PRの正値はERの正値と高度に一致し、ER発現を予測する多くの領域がPR発現をもまた予測したという事と整合する(図12A図12D)。
【0074】
最後に、癌患者の為の今日のますます普通の臨床アッセイは遺伝子パネルアッセイである。此処では、典型的には数百の遺伝子が超並列シーケンシングを用いてDNAシーケンシングされ、其れ故に体細胞変異ステータス及びDNAコピー数値を各遺伝子について与える33。最も広く利用される遺伝子パネルの1つはFoundationOne(登録商標)であり、此れは此の草稿の執筆の時点で313遺伝子を含有した。此れ等の313遺伝子のDNAコピー数情報のみを用いて、全ての遺伝子シグネチャー及び蛋白質発現のエラスティックネット予測モデルは本質的に同一の結果及びAUC値を達成した(図13);其れ故に、此れ等の複雑な発現及び蛋白質表現型は、ヒトゲノムの小さいサブセットのみを用いる時に正確に予測され得る。
【0075】
体細胞変異のCNAに基づく予測
次に、個々の体細胞変異を予測する能力が調べられた。高度に信頼できる変異コールを有するTCGA乳部腫瘍からの変異データ34が利用され、分析は先の成果に依って同定された有意に変異した遺伝子リストと高頻度変異遺伝子(度数>5%)とに限定され、HLA及びIGH遺伝子は除外した。少数の変異のみ、詰まりTP53、CDH1、MAP3K1が、0.75のテストセットAUC閾値をパスした(図9F図9F);また、GATA3及びPIK3CAは0.75よりも僅かに下だが比較的高いAUC値を有した。其れ等の公知の腫瘍抑制表現型と整合して、TP53及びCDH1モデル両方は、此れ等の2つの遺伝子を包含するCNAセグメントを負の予測因子として選択した。ルミナルサブタイプ特異的な変異モデル、詰まりGATA3及びMAP3K1は、16pゲインを包含するルミナルコピー数変化を選択した。興味深い事に、免疫治療応答に関係する事が示されているサンプル当たりのトータルの変異数として此処では定義される腫瘍変異負荷35,36は、DNA CNAから高度に予測可能であった(図9F)。
【0076】
遺伝子シグネチャーのサブタイプ特異的な予測
分子サブタイプが遺伝子シグネチャーの予測可能性に影響するかどうかを検討する為に、上で記載されている同一のエラスティックネット分析が行なわれたが、基底細胞様サブタイプ腫瘍、ルミナルAサブタイプ腫瘍、又はルミナル腫瘍(HER2高発現、ルミナルA及びルミナルBが組み合わせられる)のみに適用された。結果は、予測正確度が異なるサブタイプに於いて異なるという事を示し(補足表7)、幾つかのケースでは、どのシグネチャーが予測可能であるかもまた様々であった。1つの際立った現象は、全ての乳癌サンプルを用いて構築されたモデルを用いると低いAUC値を有する幾つかの免疫シグネチャーが、基底細胞様腫瘍のみを用いる時にはより高いAUC値を有するという事であった(図10A)。例えば、全てのサンプル対基底細胞様サンプルを用いる時に、CD8 T細胞シグネチャー37は0.71及び0.84のAUC値を有した(図10B)。此のシグネチャーを予測する為に選択されたセグメントは、CD8 T細胞ケモカインCXCL9、CXCL10、CXCL11、及びケモカイン分泌に関係する遺伝子SEC31Aをコードする遺伝子を包含した。此れ等の両方はT細胞トラフィッキングに影響する38。興味深い事に、EGFRは負の予測因子として選択され、腫瘍の固有のメカニズムが腫瘍免疫微小環境を形作るという証拠を提供した39図10C)。此の知見は、異なるサブタイプの裏にある不均質性を実証し、免疫療法について基底細胞様腫瘍を優先する事についての洞察を提供する。
【0077】
肺癌の遺伝子シグネチャーの予測
エラスティックネットモデリング戦略の一般化可能性を評価する為に、肺腺癌(LUAD)及び肺扁平上皮細胞癌(LUSC)両方を包含するTCGA肺癌データを用いる予測モデルが評価された40,41。再び、遺伝子発現シグネチャーを用いた。第1に、乳癌に由来するDNAに基づく予測モデルが肺癌に適用された。結果は、肺トレーニングセット、肺テストセット、及び乳癌テストセットに於いて0.75のAUC閾値をパスした37のシグネチャーを同定した(図15A、補足表8)。意外ではないが、此れ等のシグネチャーの殆どはアンプリコンシグネチャーであった。然し乍ら、2つはそうではなく、TP53変異ステータス及びPTEN/PI3K経路活性に関係した。乳癌又は肺癌で構築されたモデルに依って選択されたCNAセグメント及び/又は染色体全腕は、TP53ステータスシグネチャーについては類似であり(図15D図15E)、エラスティックネットアプローチが最も妥当な特徴を一貫して選択する事ができるという事を指示した。最後に、肺癌データでトレーニングされた場合には、より多数のシグネチャーが予測可能である事が見出され、幾つかのモデルは腫瘍タイプ依存的であり得、他は腫瘍タイプ非依存的であり得る(即ちTP53)という事を示唆した。DNA CNAに基づくエラスティックネットモデルが2つの肺癌組織学を首尾良く分類し得るかどうかという問いが評価された(evalutated)。結果は、LUAD対LUSCを非常に高い正確度で分類する事が可能であるという事を示し(トレーニング及びテストセットではAUC=0.98及び0.97)、LUAD及びLUSCが独特な体細胞駆動因子を有するという先の知見と整合した42図15C図15F)。
【0078】
遺伝子シグネチャーの汎癌予測
最後に、エラスティックネットモデリングアプローチはTCGAからの23の他の腫瘍タイプに適用された。此れ等はマルチプラットフォームデータと少なくとも100サンプルとを有する。各腫瘍タイプに対する504のメディアン発現に基づく遺伝子シグネチャーが、各腫瘍タイプの各シグネチャーの予測可能性を調べた(were examined)。結果は、高い正確度(AUC>0.75)を有する首尾良いモデルが乳癌及び肺癌以外の複数の腫瘍タイプについて構築されたという事を示した。意外ではないが、より多くのCNA事象を有する腫瘍タイプに於いては、高度に予測可能であるより多くの遺伝子シグネチャーがあった(図14A図14B)。遺伝子シグネチャーの予測可能性に基づく腫瘍タイプの階層的クラスタリングは、汎扁平上皮群を包含する腫瘍タイプ間の類似性についての先の知見と整合する情報に富む腫瘍サブグループ分けを明らかにした(図14C。基底細胞様乳癌は、LUSC及び頭頸部扁平上皮細胞癌(HNSC)を包含する扁平上皮癌とクラスタリングした。多くの免疫に関係するシグネチャーが此れ等の腫瘍タイプに於いて特有に予測可能であり、前述のCD8 T細胞シグネチャー並びにPD1及びCTLA4シグナル伝達経路を包含した。他方で、ルミナル乳癌はLUAD及び膀胱尿路上皮癌(BLCA)とクラスタリングし、此処では、RB-LOHシグネチャーを包含する増殖速度を測定する複数のシグネチャーが高度に予測可能であった。最後に、アンプリコンシグネチャーは、コピー数異常遺伝子の高いパーセンテージを有する腫瘍タイプに於いて普遍的に予測可能であった。
【0079】
クローディン低サブタイプ及び上皮間葉転換(EMT)様状態を表すクローディン低シグネチャーが43、11の腫瘍タイプに於いて高度に予測可能であったという事に注意して、此のシグネチャーを予測する上で普遍的に重要であるCNA領域が、此れ等の腫瘍タイプからの組み合わせられたデータからのモデルとして構築された。齎されたモデルは0.8のトレーニングセットAUC及び0.74のテストセットAUCを有し、マルチ腫瘍モデルが11の腫瘍タイプに於いてシグネチャーを予測する事ができるという事を指示した。加えて、此のモデルに依って選択されたCNA領域は、より公知でない遺伝子ERASを包含する多くのRAS/MAPK経路コンポーネントを強調し(図14D)、其の強制発現がヒト乳腺細胞のEMTを誘導したという知見と整合した44。総括すると、此れ等の結果は、エラスティックネットアプローチが、多くの腫瘍型に於ける鍵の遺伝子シグネチャーの予測モデルを堅牢に構築する事ができるという事を実証した。
【0080】
6.2.考察
変異ステータス若しくはバイオマーカーレベルの様な鍵の腫瘍表現型又は複雑な発現表現型を予測する能力は、固形上皮癌の生物学的複雑性を理解する上で決定的である。近年、乳癌では、ER、PR、及びHER2の蛋白質発現分析が要求され、遺伝子発現検査は普通である。肺癌では、遺伝子パネル検査が標準治療に包含され、主として免疫療法を原因として、発現分析(mRNA及び蛋白質両方)は注目が増している。多くの固形上皮癌、特に乳部及び肺は、少なくとも部分的にはDNAコピー数に依って駆動されると考えられる。何故なら、多数のコピー数事象が起こり、多くは公知の遺伝的駆動因子であるからである45,46。提案されるコピー数に依って駆動される腫瘍タイプを調べる時に、DNAコピー数変化の多様性を用いる時には、多くの鍵の腫瘍表現型は予測可能であり得るという事が推論された。此の仮説に取り組む為に、複数の刊行物から取られたマニュアルキュレーションされた遺伝子発現シグネチャーの大規模なアーカイブが、腫瘍表現型を研究し及び其れ等の予測可能性を推定する為に用いられた。DNAコピー数異常及び各遺伝子発現シグネチャーの間の関係性が2つの手段に依って分析された;第1はゲノムワイド関連性方法であり、第2はエラスティックネット予測モデルを構築して其れ等の正確度を評価する事であった。関連性研究は、遺伝子を1つずつ評価する事に依って、我々が発現シグネチャーに対する遺伝子の正又は負に相関したDNA特徴を見出す事を許した。此れ等の2つの方法は、協同的に、CNA及び遺伝子シグネチャーの間のリンクの大きな全体像を生じた。CNA及び遺伝子シグネチャーの間の公知の関連性が一貫して見出され、DNA増幅及びロスの遺伝子シグネチャー、並びに(and for)シグナル伝達経路活性(即ちTP53及びEGFR)を包含するより複雑な表現型の遺伝子シグネチャー、並びに細胞増殖ステータスの遺伝子シグネチャーを包含した;事実、方法は、此れ等のシグネチャーの多くを非常に高い正確度(AUC>0.9)で、異なる遺伝子発現及びDNAコピー数テクノロジー(即ちMETABRIC)さえ用いた真のテストセットについて予測する事ができた。一緒にすると、各遺伝子シグネチャーの関連性ランドスケープ及びエラスティックネットの特徴ランドスケープは、あり得る遺伝的駆動因子の更なる検討の為のCNA領域を提供する。加えて、固有の分子サブタイプ、蛋白質発現レベル、及び体細胞変異ステータス(腫瘍変異負荷を包含する)を包含する種々の他の分子表現型へのエラスティックネットモデリング戦略の更なる適用は、乳癌の多くの鍵の表現型を正確に予測する能力を明らかにした。癌クリニックに於けるDNAエクソーム及び遺伝子パネルの増して行く使用から、此れ等のモデルは臨床的に有用であり得、少なくとも、乳癌のER、PR、及びHER2ステータスの様な鍵の特徴をコールする為の直交的なアプローチを提供し得て、恐らくは、其れ自体で、結果的には鍵の表現型をコールする為にさえも用いられ得る。
【0081】
此処で提示される分析では、発現シグネチャーは最も高い三分位対2つの下位三分位に分けられた;然し乍ら、発現シグネチャーが連続変数として処置されるエラスティックネットモデルもまた分析され、此れ等もまた、依然として許容されるがより低い正確度ではあるが、二値変数としてテストされた時に高いAUCを示すモデルについて首尾良かった(図12A図12F)。其れ故に、予測因子の多数についてされた様な単純な高対低に加えて、定量的な形質を予測する事さえも実現可能であり得る。
【0082】
プレシジョンメディシンを改善するゴールの為に、多くの商業的な遺伝子パネル検査が開発されている。FoundationOne(登録商標)ゲノム検査に依って導出され得る313遺伝子のみのDNA CNA情報を用いると、CNA値の全エクソームを用いる物と比較された時に、遺伝子発現シグネチャー予測及び蛋白質発現予測正確度は同じ儘であった。313遺伝子は高度に癌に妥当するとして選択され、腫瘍形成に重要である事が報告されている。此の結果は、ゲノムの小さい一部が、幾つかの固形上皮癌タイプで見られる癌表現型の予測力の大きい一部を占めるという事を示唆する。また、此れはクリニックに於けるエラスティックネットモデルの適用に光を当てる。例えば、此処で評価されたRB-LOHシグネチャーを包含する種々の増殖シグネチャーは、RB/E2F経路を標的化するCDK4/6阻害剤について、あり得るバイオマーカーとして働き得る47。RB-LOHシグネチャーのエラスティックネットモデルは、患者を高い増殖速度を有する者へと層化する為に用いられ得る。此れは典型的にはRBロスを有する者を同定し、此れ等にはCDK4/6阻害剤は推奨されないであろう。此の特定の仮定上の適用を確認する為には、更なるバリデーションが必要とされる。然し乍ら、バリデーションされた場合には、予後及び予測バイオマーカーの全く新たなセットが既存のDNAに基づく遺伝子パネルから読み出され、其れ故に、プレシジョンメディシンの為のより多くの手引きを追加のコストなしに提供し得る。
【0083】
最後に、此のアプローチの一般化可能性が23の異なる腫瘍タイプの汎癌分析に依って示された。作業仮説と整合して、アンプリコンシグネチャー以外の種々の遺伝子シグネチャーが、多くのコピー数変化を有する腫瘍タイプに於いて予測可能であった。類似の特徴を共有する事が示された腫瘍タイプは、シグネチャー予測可能性の類似のパターンを有した。より重要な事には、扁平上皮腫瘍の免疫特徴及び腺癌の増殖速度等の其れ等の共有された鍵の特徴は、多くの場合には高度に予測可能であった。
【0084】
総括すると、此れ等の結果は、乳及び非小細胞肺癌患者について複数の鍵の癌表現型のCNAに基づく予測因子を構築する能力を実証している。殆どの研究は腫瘍形成の遺伝的駆動因子を見出す事に焦点を合わせているが、成果は、決定的な複雑な腫瘍表現型がDNA情報を用いて予測され得るという重要な含意を保有している。此れは可能性としてクリニックに於いて用いられ得る。
【0085】
6.3.方法
遺伝子発現データ.ヒト乳癌及び肺癌(肺腺癌及び肺扁平上皮細胞癌両方)のイルミナHiSeq 2000 RNAシーケンシングデータはブロード研究所TCGA GDACファイアホースから取得された。METABRICプロジェクト(n=1,992サンプル)のイルミナHT-29 v3発現データは欧州バイオインフォマティクス研究所の欧州ゲノム-フェノームアーカイブから取得された。TCGA乳癌及び肺癌遺伝子発現データでは、遺伝子レベルRNA-Seqリードが上四分位正規化及びlog2変換され、サンプルの70%超で発現される遺伝子へとフィルタリングされ、メディアンにセンタリングされ、各データセット内でサンプル毎に標準化された。METABRICマイクロアレイ遺伝子発現データでは、取得されたデータはサンプルの70%超で発現される遺伝子へとフィルタリングされ、各遺伝子についてメディアンにセンタリングされ、各サンプルについて標準化された。TCGA及びMETABRIC乳癌データ両方では、PAM50サブタイピングが先に記載されている通り適用された2,3,11。全ての他の腫瘍タイプの遺伝子発現データはGDC PanCanAtlas公開サイトからダウンロードされた。各腫瘍タイプについて、遺伝子発現データは、サンプルの70%超で発現される遺伝子にフィルタリングされ、メディアンにセンタリングされ、各腫瘍タイプ内でサンプル毎に標準化された。
【0086】
DNAコピー数データ.ヒト乳癌及び肺癌のGISTIC2遺伝子レベルコピー数データは、更なる処理なしにブロード研究所TCGA GDACファイアホースから取得された。METABRICプロジェクトでは、サーキュラーバイナリセグメンテーション(CBS)アルゴリズムを用いるコピー数セグメンテーションデータが欧州ゲノム-フェノームアーカイブから取得された。Ensembl 54(hg18)ゲノムビルドを用いて、遺伝子レベルコピー数スコアが、GISTIC248に用いられた極値法に依って導出された:CBSに依って同定されたコピー数セグメント内に完全に収まった遺伝子は、対応するセグメント値を割り当てられた。複数のセグメントとオーバーラップした遺伝子は、オーバーラップしたセグメントの中で最も多大な増幅又は最も小さい欠失値を割り当てられた。オーバーラップセグメントを有さない遺伝子は更なる分析から除外された。全ての他の腫瘍タイプのGISTIC2遺伝子レベルコピー数データは、更なる処理なしにGDC PanCanAtlas公開サイトからダウンロードされた。
【0087】
蛋白質発現データ.ヒト乳癌の正規化された蛋白質発現データは、更なる処理なしにブロード研究所TCGA GDACファイアホースから取得された。
【0088】
変異データ.2015 TCGA小葉乳癌データセットからの変異アノテーションフォーマット(MAF)データが用いられた34。MAFファイルは、第1に、次のバリアント分類のみを包含する様にフィルタリングされた:Frame_Shift_Del、Frame_Shift_Ins、In_Frame_Del、In_Frame_Ins、Missense_Mutation、Nonsense_Mutation、Nonstop_Mutation、RNA,Splice_Site、Translation_Start_Site。其れから、いずれかの変異を指示する1及び変異なしを指示する0のサンプルマトリクスに依るバイナリ遺伝子が、フィルタリングされたMAFに基づいて構築された(補足表15)。其れから、各サンプルの変異量が其のサンプル中の変異遺伝子のトータル数に依って決定された。
【0089】
遺伝子発現シグネチャー.543の先に公開された遺伝子発現シグネチャーのパネルが、癌表現型を詳しくキャラクタリゼーションする為に用いられた。此れ等の543のシグネチャーは複数の刊行物又はGSEAから得られ49、部分的に谷岡等(Tanioka et al)に依って要約されている13。各シグネチャーの遺伝子及び其れ等の参照の完全なリストは補足表1に示されている。シグネチャースコアは其れ等の由来と整合した様式で計算された。遺伝子間の均質な発現を有する504のシグネチャーでは、メディアン発現値がシグネチャースコアとして用いられた。シグネチャーの残りは所定の遺伝子セントロイドに対する相関に基づくか又は公開されたアルゴリズムに基づいた。相関に基づくシグネチャーでは、全ての所定のトレーニングセットはGitHubレポジトリからダウンロードする様に利用可能である(https://github.com/xyouli/DNA-based-predictors-of-non-genetic-cancer-phenotypes)。斯かる各シグネチャーでは、DWD53が第1に遺伝子発現マトリクスを対応するトレーニングセットとマージする為に用いられ、其れから、ピアソン/スピアマン相関/ユークリッド距離がマージデータの各サンプルについて演算された。幾つかのアルゴリズムに基づくシグネチャーでは、各シグネチャーを計算する為に、対応するRコードが提供された。コンピュータプログラムリスト付属書類を見よ。全ての(See All)543のシグネチャーがTCGA乳癌及び肺癌データ並びにMETABRICデータに適用された(補足表12~14を見よ)。504のメディアン発現に基づくシグネチャーが汎癌データに適用された。
【0090】
遺伝子シグネチャー特異的なCNAの同定.CNA及び遺伝子発現シグネチャーの間の関連性を同定する為に、2つの独立の統計検定が、マッチした遺伝子発現及びコピー数データを有するTCGA乳癌コホートに用いられ、全ての正常様サンプルを除外した(n=1038)。各シグネチャーについて、各遺伝子は、交絡変数として考慮に入れられた分子サブタイプとの有意な関連性について検定された:シグネチャー~CNA+(1|基底)+(1|HER2)+(1|LumA)+(1|LumB)。正の/負の相関はモデルのCNAの係数及びp値に依って決定された。高いシグネチャースコアを有するサンプル(上位四分位)及び低いシグネチャースコアを有する物(下位の3つの四分位)のCNAゲイン又はロスの度数何方かを比較する為に、フィッシャーの正確検定が用いられた。各分析では、全ての遺伝子について各シグネチャーのp値を調整する為に、ベンジャミーニ-ホッホベルク多重検定補正が用いられた。両方の分析に於いて有意である遺伝子を同定する為に、有意閾値は0.01に設定された。
【0091】
エラスティックネット予測モデルを構築する.リッジ回帰のL1及びL2ペナルティ並びに最小絶対縮小及び選択オペレータ(ラッソ)を線形的に組み合わせる正則化回帰方法であるエラスティックネットモデリングアプローチが、癌表現型のDNA CNAに基づく予測因子を構築する為に用いられた。代替的には、機械学習の他の方法がモデルを構築する為に用いられ得る。斯かる他の方法の例は、ラッソ:ロバート・ティブシラニ(Tibshirani, Robert)著, 1996年「ラッソに依る回帰縮小及び選択(Regression shrinkage and selection via the lasso)」ジャーナル・オブ・ザ・ロイヤル・スタティスティカル・ソサイエティー(Journal of the Royal Statistical Society):シリーズB(方法論)第58.1巻: p.267-288;リッジ:アーサーE.ホール(Hoerl, Arthur E.)及びロバートW.ケナード(Robert W. Kennard)著, 1970年「リッジ回帰:非直交問題のバイアス推定(Ridge regression: Biased estimation for nonorthogonal problems)」テクノメトリクス(Technometrics)第12.1巻: p.55-67;サポートベクターマシン:コルテス(Cortes), コリーナ(Corinna), 及びウラジミール・バプニック(Vladimir Vapnik), 1995年「サポートベクターネットワーク(Support-vector networks)」マシンラーニング(Machine learning)第20.3巻: p.273-297;又はディープラーニング:ルカン(LeCun), ヤン(Yann), ヨシュア・ベンジオ(Yoshua Bengio), 及びジェフリー・ヒントン(Geoffrey Hinton)著, 2015年「ディープラーニング(Deep learning)」ネイチャー(nature)第521.7553巻: p.436を包含するが、此れ等に限定されない。一般的に、遺伝子レベルCNAスコアは第1にセグメントレベルCNAスコアにコラプスされた。各セグメントの遺伝子の完全なリストは補足表2に示されている18-22。各セグメントスコアはセグメント内の遺伝子の平均CNAスコアとして計算された。各癌表現型では、トータルのサンプルが70%トレーニングセット及び30%テストセットに分割され(Rパッケージサンプリング)、臨床的な変数:利用可能な時には総体的な生存、性別、人種、ERステータス、PRステータス、及びHER2ステータス、組織学的サブタイプ、病理学的ステージ、並びに分子サブタイプに依って層化された。モデルがトレーニングセットのみから構築された;200ラウンドのモンテカルロクロスバリデーション(Rパッケージcaret)がチューニングパラメータを選択する為に用いられた。ラムダ値は0.1から1迄のアルファの範囲から0.1ずつ選択された。最適なパラメータ組み合わせは、最も良好な分類正確度を有する様に決定された。其れから、利用可能な場合には、最適なパラメータを有するモデルがテストセット及び他のバリデーションセットに適用された。受信者動作特性(ROC)曲線が構築され、ROC曲線下面積(AUC)値がモデル性能を評価する為に用いられた。0.75よりも上のAUC値を有する表現型は高度に予測可能と見做される。
【0092】
連続的なスコアを有する遺伝子発現シグネチャー、蛋白質発現、及び変異量を予測する為に、高いスコア(上位3分の1)対低いスコア(下位3分の2)でサンプルを分類する為のモデルが構築された。分子サブタイプ、臨床的な受容体ステータス、癌組織学、及びバイナリアウトカムを有した変異について、各アウトカムを分類する為のモデルが構築された。上に記載されている関連性検定の通り、乳癌遺伝子発現シグネチャーでは、正常様のサンプルは除外された(n=1038)。体細胞変異については、全てのIGH及びHLA遺伝子が除去され、2015 TCGA小葉乳癌分析34に於いて同定された5%超の変異度数を有する遺伝子及び/又は有意に変異した遺伝子のみが包含された(補足表15)。
【0093】
サブタイプ特異的な遺伝子シグネチャー予測では、同じエラスティックネットモデルアプローチが、70%トレーニング及び30%テストに分割された特定のサブタイプのサンプル内で繰り返され、モデルが、同じサブタイプを有するMETABRICサンプルに適用された。
【0094】
非小細胞肺癌データを用いる遺伝子シグネチャー及び組織学予測では、LUAD(n=498)及びLUSC(n=512)両方を組み合わせた全TCGA肺データセットが用いられた。此れ等はトレーニング及びテストセットに分割され、臨床的な変数:総体的な生存、性別、病理学的ステージ、及び組織学(LUAD又はLUSC)について均一化された。モデルがトレーニングセットから構築され、テストセットに適用された。また、TCGA乳癌トレーニングセットから構築されたモデルが全肺データセットに適用された。また、モデルは別々にLUAD及びLUSC内で構築された。
【0095】
汎癌遺伝子発現シグネチャー予測では、分析は、RNA、DNA、及び臨床データを有する少なくとも100サンプルを有する腫瘍タイプに限定された。504のメディアン発現に基づく遺伝子シグネチャーが各腫瘍タイプに適用された。各腫瘍タイプの各シグネチャー予測では、トータルのサンプルは70%トレーニングセット及び30%テストセットに分割され、性別、人種、及び総体的な生存について均一化された。其れから、モデルがトレーニングセットから構築され、テストセットに適用されて、トレーニング及びテストAUC値を得た。
【0096】
各予測モデルに依って選択される特徴を眺める為に、CNAセグメントの係数が各セグメント内の遺伝子に対して再マッピングされ、プロットされた。CNAセグメントの係数及びAUC値を包含する全てのエラスティックネットモデルの概要は補足表に報告されている。
【0097】
データの利用可能性.現行の研究の間に生成及び/又は分析されたデータセットは、本開示及び其の補足情報表から利用可能である。全ての生の及び一次データはTCGA及びMETABRICパブリックデータレポジトリから来る。
【0098】
異なるコピー数異常(CNA)データソースへの適用.
方法
DNAエクソームシーケンシングに依って決定されたコピー数異常(alternation)プロファイルが、TCGA乳癌プロジェクトからの1067の乳癌サンプルについてCNVkitに依ってコールされた50。536のセグメント値が上で記載されている通り計算された。鍵の遺伝子発現シグネチャー、臨床アッセイ、臨床的な受容体ステータス、及び分子サブタイプのエラスティックネット予測が、本明細書に記載される通り、SNPアレイコピー数データから構築された既存のモデルにエクソームシーケンシングからのセグメント値を適用する事に依って為された。受信者動作曲線下面積(AUC)値が計算されて、モデル性能を反映した。
【0099】
結果
エラスティックネットモデルがDNAエクソームシーケンシングデータからコールされ得るかどうかを検討する為に、DNAエクソームシーケンシングに依って決定されたコピー数データが、代表的な高度に予測可能な表現型について、DNA SNPアレイデータから構築されたモデルに適用された。図17A~17Dに示されている結果は、4つの鍵の遺伝子発現シグネチャー、3つの臨床アッセイ、3つの受容体ステータス、及び4つの分子サブタイプを包含する全ての14の表現型が、高いAUC値を有するという事を実証し(>=0.88)、異なるプラットフォームに由来するDNAコピー数データへの本明細書に於いて開示されるモデル及び方法の適用可能性を実証している。
【0100】
7.参照
1 ペローC.M.等(Perou, C. M. et al.)著「ヒト乳部腫瘍の分子ポートレート(Molecular portraits of human breast tumours)」ネイチャー(Nature)第406巻, p.747-752, doi:10.1038/35021093(2000年).
2 「ヒト乳部腫瘍の総合的分子ポートレート(Comprehensive molecular portraits of human breast tumours)」ネイチャー(Nature)第490巻, p.61-70, doi:10.1038/nature11412(2012年).
3 カーティスC.等(Curtis, C. et al.)著「2,000の乳部腫瘍のゲノム及びトランスクリプトームアーキテクチャは新規サブグループを明らかにする(The genomic and transcriptomic architecture of 2,000 breast tumours reveals novel subgroups)」ネイチャー(Nature)第486巻, p.346-352, doi:10.1038/nature10983(2012年).
4 ホードリーK.A.等(Hoadley, K. A. et al.)著「起源細胞パターンは33のタイプの癌からの10,000の腫瘍の分子分類に於いて優勢である(Cell-of-Origin Patterns Dominate the Molecular Classification of 10,000 Tumors from 33 Types of Cancer)」セル(Cell)第173巻, p.291-304 e296, doi:10.1016/j.cell.2018.03.022(2018年).
5 ネヴィンスJ.R.(Nevins, J. R.)&ポッティA.(Potti, A.)著「遺伝子発現プロファイルをマイニングする:癌表現型としての発現シグネチャー(Mining gene expression profiles: expression signatures as cancer phenotypes)」ネイチャー・レビューズ・ジェネティクス(Nature Reviews Genetics)第8巻, p.601-609, doi:10.1038/nrg2137(2007年).
6 ビルトA.H.等(Bild, A. H. et al.)著「標的化治療のガイドとしてのヒトの癌の発癌経路シグネチャー(Oncogenic pathway signatures in human cancers as a guide to targeted therapies)」ネイチャー(Nature)第439巻, p.353-357, doi:10.1038/nature04296(2006年).
7 クワM.(Kwa, M.), マクリスA.(Makris, A.)&エステバF.J.(Esteva, F. J.)著「早期ステージ乳癌の遺伝子発現シグネチャーの臨床的有用性(Clinical utility of gene-expression signatures in early stage breast cancer)」ネイチャー・レビューズ・クリニカル・オンコロジー(Nature Reviews Clinical Oncology)第14巻, p.595-610, doi:10.1038/nrclinonc.2017.74(2017年).
8 ガッツァM.L.(Gatza, M. L.), シルバG.O.(Silva, G. O.), パーカーJ.S.(Parker, J. S.), ファンC.(Fan, C.)& ペローC.M.(Perou, C. M.)著「統合的ゲノミクスアプローチはルミナルサブタイプヒト乳癌の増殖の駆動因子を同定する(An integrated genomics approach identifies drivers of proliferation in luminal-subtype human breast cancer)」ネイチャー・ジェネティクス(Nature genetics)第46巻, p.1051-1059, doi:10.1038/ng.3073(2014年).
9 ゾウH.(Zou, H.)&ヘイスティT.(Hastie, T.)著「エラスティックネットに依る正則化及び変数選択(Regularization and variable selection via the elastic net)」(第B67巻, p.301, 2005年)ジャーナル・オブ・ザ・ロイヤル・スタティスティカル・ソサイエティー(Journal of the Royal Statistical Society)B 第67巻, p.768-768, doi:DOI 10.1111/j.1467-9868.2005.00527.x(2005年).
10 パイクS.等(Paik, S. et al.)著「リンパ節転移陰性のエストロゲン受容体陽性乳癌を有する女性に於ける遺伝子発現及び化学療法のベネフィット(Gene expression and benefit of chemotherapy in women with node-negative, estrogen receptor-positive breast cancer)」ジャーナル・オブ・クリニカル・オンコロジー:米国臨床腫瘍学会公式雑誌(Journal of clinical oncology : official journal of the American Society of Clinical Oncology)第24巻, p.3726-3734, doi:10.1200/JCO.2005.04.7985(2006年).
11 パーカー, J. S.等(Parker, J. S. et al.)著「固有のサブタイプに基づく乳癌の教師ありリスク予測因子(Supervised risk predictor of breast cancer based on intrinsic subtypes)」ジャーナル・オブ・クリニカル・オンコロジー:米国臨床腫瘍学会公式雑誌(Journal of clinical oncology : official journal of the American Society of Clinical Oncology)第27巻, p.1160-1167, doi:10.1200/JCO.2008.18.1370(2009年).
12 ファンデフェイヴァM.J.等(van de Vijver, M. J. et al.)著「乳癌の生存の予測因子としての遺伝子発現シグネチャー(A gene-expression signature as a predictor of survival in breast cancer)」ニューイングランド・ジャーナル・オブ・メディシン(The New England Journal of Medicine)第347巻, p.1999-2009, doi:10.1056/NEJMoa021967(2002年).
13 谷岡M.等(Tanioka, M. et al.)著「第III相治験CALGB 40601からのRNA及びDNAの統合的分析は、HER2陽性乳癌に於けるトラスツズマブに基づくネオアジュバント化学療法への応答の予測因子を同定する(Integrated Analysis of RNA and DNA from the Phase III Trial CALGB 40601 Identifies Predictors of Response to Trastuzumab-Based Neoadjuvant Chemotherapy in HER2-Positive Breast Cancer)」クリニカル・キャンサー・リサーチ:米国癌学会公式雑誌(Clinical Cancer Research: an official journal of the American Association for Cancer Research), doi:10.1158/1078-0432.CCR-17-3431(2018年).
14 ベンジャミーニY.(Benjamini, Y.)&ホッホベルクY.(Hochberg, Y.)著「偽発見率をコントロールする-多重検定の実際的且つ強力なアプローチ(Controlling the False Discovery Rate - a Practical and Powerful Approach to Multiple Testing)」ジャーナル・オブ・ザ・ロイヤル・スタティスティカル・ソサイエティー(Journal of the Royal Statistical Society)B Met 第57巻, p.289-300(1995年).
15 ヘルシュコヴィッツJ.I.(Herschkowitz, J. I.), ヒーX.(He, X.), ファンC.(Fan, C.)&ペローC.M.(Perou, C. M)著「網膜芽細胞腫腫瘍抑制因子の機能喪失は基底細胞様及びルミナルB乳癌に於ける普通の事象である(The functional loss of the retinoblastoma tumour suppressor is a common event in basal-like and luminal B breast carcinomas)」ブレスト・キャンサー・リサーチ(Breast Cancer Research): BCR 第10巻, R75, doi:10.1186/bcr2142(2008年).
16 クヌーセンE.S.(Knudsen, E. S.)&ワンJ.Y.(Wang, J. Y.)著「癌治療に於いてRB経路を標的化する(Targeting the RB-pathway in cancer therapy)」クリニカル・キャンサー・リサーチ:米国癌学会公式雑誌(Clinical Cancer Research: an official journal of the American Association for Cancer Research)第16巻, p.1094-1099, doi:10.1158/1078-0432.ccr-09-0787(2010年).
17 ホードリーK.A.等(Hoadley, K. A. et al.)著「12の癌タイプのマルチプラットフォーム分析は起源組織内及び間に於ける分子分類を明らかにする(Multiplatform analysis of 12 cancer types reveals molecular classification within and across tissues of origin)」セル(Cell)第158巻, p.929-944, doi:10.1016/j.cell.2014.06.049(2014年).
18 ベルキムR.等(Beroukhim, R. et al.)著「ヒトの癌の体細胞コピー数異常のランドスケープ(The landscape of somatic copy-number alteration across human cancers)」ネイチャー(Nature)第463巻, p.899-905, doi:10.1038/nature08822(2010年).
19 ザックT.I.等(Zack, T. I. et al.)著「体細胞コピー数異常の汎癌パターン(Pan-cancer patterns of somatic copy number alteration)」ネイチャー・ジェネティクス(Nature genetics)第45巻, p.1134-1140, doi:10.1038/ng.2760(2013年).
20 シルバG.O.等(Silva, G. O. et al.)著「種間DNAコピー数分析が乳癌の複数の1q21-q23サブタイプ特異的な駆動遺伝子を同定する(Cross-species DNA copy number analyses identifies multiple 1q21-q23 subtype-specific driver genes for breast cancer)」ブレスト・キャンサー・リサーチ・アンド・トリートメント(Breast Cancer Research and Treatment)第152巻, p.347-356, doi:10.1007/s10549-015-3476-2(2015年).
21 ヴァイクマンV.J.等(Weigman, V. J. et al.)著「基底細胞様乳癌DNAコピー数ロスは、ゲノム不安定性、治療応答、及び患者生存に関わる遺伝子を同定する(Basal-like Breast cancer DNA copy number losses identify genes involved in genomic instability, response to therapy, and patient survival)」ブレスト・キャンサー・リサーチ・アンド・トリートメント(Breast Cancer Research and Treatment)第133巻, p.865-880, doi:10.1007/s10549-011-1846-y(2012年).
22 チャオH.H.(Chao, H. H.), ヒーX.(He, X.), パーカーJ.S.(Parker, J. S.), ジャオW.(Zhao, W.)&ペローC.M.(Perou, C. M.)著「乳癌の突然変異の別の手段としてのマイクロスケールゲノムDNAコピー数異状(Micro-scale genomic DNA copy number aberrations as another means of mutagenesis in breast cancer)」PLoSワン(PLoS One)第7巻, e51719, doi:10.1371/journal.pone.0051719(2012年).
23 ファンC.等(Fan, C. et al.)著「臨床的な変数及び数百の遺伝子発現シグネチャーを用いて乳癌患者の予後モデルを構築する(Building prognostic models for breast cancer patients using clinical variables and hundreds of gene expression signatures)」BMCメディカルゲノミクス(BMC Medical Genomics)第4巻, p.3, doi:1755-8794-4-310.1186/1755-8794-4-3(2011年).
24 ホードリーK.A.等(Hoadley, K. A. et al.)著「EGFR関連発現プロファイルは乳部腫瘍サブタイプに依って様々である(EGFR associated expression profiles vary with breast tumor subtype)」BMCゲノミクス(BMC Genomics)第8巻, p.258, doi:10.1186/1471-2164-8-258(2007年).
25 パイクS.等(Paik, S. et al.)著「タモキシフェン処置されたリンパ節転移陰性乳癌の再発を予測する為のマルチ遺伝子アッセイ(A multigene assay to predict recurrence of tamoxifen-treated, node-negative breast cancer)」ニューイングランド・ジャーナル・オブ・メディシン(The New England Journal of Medicine)第351巻, p.2817-2826, doi:10.1056/NEJMoa041588(2004年).
26 ファントフィールL.J.等(van’t Veer, L. J. et al.)著「遺伝子発現プロファイリングは乳癌の臨床アウトカムを予測する(Gene expression profiling predicts clinical outcome of breast cancer)」ネイチャー(Nature)第415巻, p.530-536, doi:10.1038/415530a(2002年).
27 リウY.(Liu, Y.), バイヤーA.(Beyer, A.)&エバーソルドR.(Aebersold, R.)著「mRNA存在量に対する細胞蛋白質レベルの依存性について(On the Dependency of Cellular Protein Levels on mRNA Abundance)」セル(Cell)第165巻, p.535-550, doi:10.1016/j.cell.2016.03.014(2016年).
28 マイヤーS.等(Myhre, S. et al.)著「乳癌関係蛋白質の発現に対するDNAコピー数及びmRNAレベルの影響(Influence of DNA copy number and mRNA levels on the expression of breast cancer related proteins)」モレキュラー・オンコロジー(Molecular Oncology)第7巻, p.704-718, doi:10.1016/j.molonc.2013.02.018(2013年).
29 ガイガーT.(Geiger, T.), コックスJ.(Cox, J.)&マンM.(Mann, M.)著「癌細胞の遺伝子コピー数バリエーションから齎されるプロテオーム変化(Proteomic changes resulting from gene copy number variations in cancer cells)」PLoSジェネティクス(PLoS genetics)第6巻, e1001090, doi:10.1371/journal.pgen.1001090(2010年).
30 ノットS.R.V.等(Knott, S. R. V. et al.)著「アスパラギンバイオアベイラビリティは乳癌のモデルに於ける転移を支配する(Asparagine bioavailability governs metastasis in a model of breast cancer)」ネイチャー(Nature)第554巻, p.378-381, doi:10.1038/nature25465(2018年).
31 バラスブラマニアンM.N.(Balasubramanian, M. N.), バターワースE.A.(Butterworth, E. A.)&キルバーグM. S.(Kilberg, M. S.)著「アスパラギンシンセターゼ:細胞ストレスに依る制御及び腫瘍生物学への関わり(Asparagine synthetase: regulation by cell stress and involvement in tumor biology)」アメリカン・ジャーナル・オブ・フィジロジー・エンドクリノロジー・アンド・メタボリズム(American journal of physiology Endocrinology and metabolism)第304巻, E789-799, doi:10.1152/ajpendo.00015.2013(2013年).
32 ホーリングスH.M.等(Horlings, H. M. et al.)著「乳癌に於けるESR1遺伝子増幅:普通の現象?(ESR1 gene amplification in breast cancer: a common phenomenon?)」ネイチャー・ジェネティクス(Nature genetics)第40巻, p.807-808; 著者返信p.810-802, doi:10.1038/ng0708-807(2008年).
33 フランプトンG.M.等(Frampton, G. M. et al.)著「超並列DNAシーケンシングに基づく臨床的な癌ゲノムプロファイリング検査の開発及びバリデーション(Development and validation of a clinical cancer genomic profiling test based on massively parallel DNA sequencing)」ネイチャー・バイオテクノロジー(Nature Biotechnology)第31巻, p.1023-1031, doi:10.1038/nbt.2696(2013年).
34 チリエッロG.等(Ciriello, G. et al.)著「浸潤性小葉乳癌の総合的分子ポートレート(Comprehensive Molecular Portraits of Invasive Lobular Breast Cancer)」セル(Cell)第163巻, p.506-519, doi:10.1016/j.cell.2015.09.033(2015年).
35 リオントスM.(Liontos, M.), アナスタシウI.(Anastasiou, I.), バミアスA.(Bamias, A.)&ディモプーロスM.A.(Dimopoulos, M. A.)著「DNAダメージ、腫瘍変異量、及び癌に対する免疫応答に対する其れ等のインパクト(DNA damage, tumor mutational load and their impact on immune responses against cancer)」アナルズ・オブ・トランスレーショナル・メディシン(Annals of Translational Medicine)第4巻, p.264, doi:10.21037/atm.2016.07.11(2016年).
36 ヴァン・アレンE.M.等(Van Allen, E. M. et al.)著「転移性メラノーマに於けるCTLA-4遮断に対する応答のゲノム相関(Genomic correlates of response to CTLA-4 blockade in metastatic melanoma)」サイエンス(Science)第350巻, p.207-211, doi:10.1126/science.aad0095(2015年).
37 イグレシアM.D.等(Iglesia, M. D. et al.)著「11の腫瘍タイプの免疫細胞浸潤物のゲノム分析(Genomic Analysis of Immune Cell Infiltrates Across 11 Tumor Types)」国立癌研究所雑誌(Journal of the National Cancer Institute)第108巻, doi:10.1093/jnci/djw144(2016年).
38 ソコルC.L.(Sokol, C. L.)&ラスターA.D.(Luster, A. D.)著「自然免疫に於けるケモカインシステム(The chemokine system in innate immunity)」コールドスプリングハーバー・パースペクティブス・イン・バイオロジー(Cold Spring Harbor Perspectives in Biology)第7巻, doi:10.1101/cshperspect.a016303(2015年).
39 ヴェレンシュタインM.D.(Wellenstein, M. D.)&デ・フィッセルK.E.(de Visser, K. E.)著「腫瘍免疫ランドスケープを形作る癌細胞に固有のメカニズム(Cancer-Cell-Intrinsic Mechanisms Shaping the Tumor Immune Landscape)」イミュニティ(Immunity)第48巻, p.399-416, doi:10.1016/j.immuni.2018.03.004(2018年).
40 癌ゲノムアトラス研究N.(Cancer Genome Atlas Research, N.)著「扁平上皮細胞肺癌の総合的ゲノムキャラクタリゼーション(Comprehensive genomic characterization of squamous cell lung cancers)」ネイチャー(Nature)第489巻, p.519-525, doi:10.1038/nature11404(2012年).
41 癌ゲノムアトラス研究N. (Cancer Genome Atlas Research, N.)著「肺腺癌の総合的分子プロファイリング(Comprehensive molecular profiling of lung adenocarcinoma)」ネイチャー(Nature)第511巻, p.543-550, doi:10.1038/nature13385(2014年).
42 キャンベルJ.D.等(Campbell, J. D. et al.)著「肺腺癌及び扁平上皮細胞癌の体細胞ゲノム異常の独特なパターン(Distinct patterns of somatic genome alterations in lung adenocarcinomas and squamous cell carcinomas)」ネイチャー・ジェネティクス(Nature genetics)第48巻, p.607-616, doi:10.1038/ng.3564(2016年).
43 ヘルシュコヴィッツJ.I.等(Herschkowitz, J. I. et al.)著「ネズミ乳腺癌モデル及びヒト乳部腫瘍の間の保存された遺伝子発現特徴の同定(Identification of conserved gene expression features between murine mammary carcinoma models and human breast tumors)」ゲノム・バイオロジー(Genome Biology)第8巻, R76, doi:10.1186/gb-2007-8-5-r76(2007年).
44 スアレス-カブレラC.等(Suarez-Cabrera, C. et al.)著「Ras近縁遺伝子ERASはヒト及びネズミ乳癌に関わる(The Ras-related gene ERAS is involved in human and murine breast cancer)」サイエンティフィック・リポーツ(Scientific Reports)第8巻, p.13038, doi:10.1038/s41598-018-31326-4(2018年).
45 ベイリーM.H.等(Bailey, M. H. et al.)著「癌駆動遺伝子及び変異の総合的キャラクタリゼーション(Comprehensive Characterization of Cancer Driver Genes and Mutations)」セル(Cell)第173巻, p.371-385 e318, doi:10.1016/j.cell.2018.02.060(2018年).
46 ディンL.等(Ding, L. et al.)著「癌ゲノミクスの始まりの終わりに於ける発癌プロセスの展望(Perspective on Oncogenic Processes at the End of the Beginning of Cancer Genomics)」セル(Cell)第173巻, p.305-320 e310, doi:10.1016/j.cell.2018.03.033(2018年).
47 アスガーU.(Asghar, U.), ヴィトキェーヴィチA.K.(Witkiewicz, A. K.), ターナーN.C.(Turner, N. C.)& クヌーセンE.S.(Knudsen, E. S.)著「癌治療に於いてサイクリン依存性キナーゼを標的化する事の歴史及び将来(The history and future of targeting cyclin-dependent kinases in cancer therapy)」ネイチャー・レビューズ・ドラッグ・ディスカバリー(Nature Reviews Drug Discovery)第14巻, p.130-146, doi:10.1038/nrd4504(2015年).
48 マーメルC.H.(Mermel, C. H. et al.)著「GISTIC2.0は、ヒト癌の病巣体細胞コピー数異常の標的の高感度な且つ信頼できる所在確認を助ける(GISTIC2.0 facilitates sensitive and confident localization of the targets of focal somatic copy-number alteration in human cancers)」ゲノム・バイオロジー(Genome Biology)第12巻, R41, doi:10.1186/gb-2011-12-4-r41(2011年).
49 スブラマニアンA.等(Subramanian, A. et al.)著「遺伝子セット濃縮分析:ゲノムワイド発現プロファイルを解釈する為のナレッジベースアプローチ(Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles)」米国科学アカデミー紀要(Proceedings of the National Academy of Sciences of the United States of America)第102巻, p.15545-15550, doi:10.1073/pnas.0506580102(2005年).
50 タレヴィッチE(Talevich E), シェーンAH(Shain AH), ボトンT(Botton T), バスティアンBC(Bastian BC)著(2016年)「CNVkit:標的化DNAシーケンシングからのゲノムワイドコピー数検出及び可視化(CNVkit: Genome-Wide Copy Number Detection and Visualization from Targeted DNA Sequencing)」PLoSコンピュテーショナル・バイオロジー(PLoS Computational Biology)第12巻(4): e1004873.
【0101】
8.本開示の一般化された申し立て
次の付番された申し立ては本開示の一般的な記載を提供するが、添付の請求項を限定する事は意図されない。
【0102】
申し立て1:患者のサンプルの計算された癌シグネチャーを生成する方法であって、此れが:(a)患者からのサンプルを得る事又は得た事と;(b)複数の染色体上の複数の位置に於いて複数のコピー数異常(CNA)を測定する事又は測定した事と;(c)mRNA発現データ及び分子サブタイプに基づく数理モデルを用いて、測定されたCNAを分析する事とを含み、数理モデルは、サンプルの計算された癌シグネチャーを生成する様にして少なくとも2つの異なる統計方法に依ってバリデーションされている。
【0103】
申し立て2:申し立て1の方法であって、50超のCNAが測定される。
【0104】
申し立て3:申し立て1の方法であって、100超のCNAが測定される。
【0105】
申し立て4:申し立て1の方法であって、約250及び約400の間のCNAが測定される。
【0106】
申し立て5:申し立て1~4の何れかの方法であって、計算された癌シグネチャーが体細胞変異シグネチャーに対応する。
【0107】
申し立て6:申し立て5の方法であって、体細胞変異シグネチャーを調える為の数理モデルが補足表6の10以上のベータ係数値に基づく。
【0108】
申し立て7:申し立て1~4の何れかの方法であって、計算された癌シグネチャーがmRNA発現シグネチャーに対応する。
【0109】
申し立て8:申し立て7の方法であって、計算された癌シグネチャーが乳癌サブタイプのシグネチャーである。
【0110】
申し立て9:申し立て7の方法であって、乳癌サブタイプシグネチャーを調える為の数理モデルが補足表4の10以上のベータ係数値に基づく。
【0111】
申し立て10:申し立て1~4の何れかの方法であって、計算された癌シグネチャーが蛋白質発現シグネチャーに対応する。
【0112】
申し立て11:申し立て10の方法であって、蛋白質発現シグネチャーを調える為の数理モデルが補足表5の10以上のベータ係数値に基づく。
【0113】
申し立て12:申し立て10の方法であって、蛋白質発現シグネチャーが免疫組織化学(IHC)シグネチャーである。
【0114】
申し立て13:申し立て12の方法であって、IHCシグネチャーがエストロゲン受容体(ER)、上皮成長因子受容体(EGFR)、ヒト上皮成長因子受容体2(HER2)、プロゲステロン受容体(PR)、又は網膜芽細胞腫(RB)シグネチャーである。
【0115】
申し立て14:申し立て1~4の何れかの方法であって、計算された癌シグネチャーがFoundationOne(登録商標)CDX結果、MAMMAPRINT(登録商標)70遺伝子再発スコア、OncotypeDX(商標)再発スコア、又はProsigna(登録商標)再発リスクスコアに対応する。
【0116】
申し立て15:申し立て14の方法であって、計算された癌シグネチャーがFoundationOne(登録商標)結果であり、FoundationOne(登録商標)結果を調える為の数理モデルが補足表9の10以上のベータ係数値に基づく。
【0117】
申し立て16:申し立て1~4の何れかの方法であって、計算された癌シグネチャーが、膀胱尿路上皮癌(BLCA)、子宮頸部扁平上皮細胞癌及び内頸部腺癌(CESC)、結腸腺癌(COAD)、食道癌(ESCA)、多形性膠芽腫(GBM)、頭頸部扁平上皮細胞癌(HNSC)、淡明腎細胞腎臓癌(KIRC)、乳頭状腎細胞腎臓癌(KIRP)、急性骨髄性白血病(LAML)、脳低悪性度グリオーマ(LGG)、肝細胞肝臓癌(LIHC)、肺腺癌(LUAD)、肺扁平上皮細胞癌(LUSC)、膵臓腺癌(PAAD)、褐色細胞腫及びパラガングリオーマ(PCPG)、前立腺腺癌(PRAD)、直腸腺癌(READ)、肉腫(SARC)、肌の皮膚メラノーマ(SKCM)、胃腺癌(STAD)、精巣胚細胞腫瘍(TGCT)、甲状腺癌(THCA)、胸腺腫(THYM)、又は子宮体部内膜癌(UCEC)シグネチャーである。
【0118】
申し立て17:申し立て16の方法であって、計算されたシグネチャーを調える為の数理モデルが補足表14のベータ係数値に基づく。
【0119】
申し立て18:申し立て1~17の何れかの方法であって、複数のコピー数異常(CNA)は全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる。
【0120】
申し立て19:患者が特定の癌サブタイプを有するかどうかを決定するステップを含む、癌患者を化学療法に依って処置する為の方法であって:(a)患者からの生体サンプルを得る事又は得た事と;(b)コピー数が複数の染色体上の複数の位置に於いて測定される生体サンプルの遺伝子レベルコピー数異常(CNA)アッセイを行なう事又は行なった事と;(c)CNAアッセイの結果(to results)を標準のセットと比較して、患者が特定の癌サブタイプを有するかどうかを決定する事と;(d)患者が特定の癌サブタイプを有する場合には、決定された癌サブタイプに基づいて、好適な化学療法レジメンを癌患者に投与する事とに依る。
【0121】
申し立て20:申し立て19の方法であって、化学療法レジメンが継続中の治療介入である。
【0122】
申し立て21:申し立て20の方法であって、継続中の治療介入が特定の処置を中止する事を含む。
【0123】
申し立て22:申し立て19~21の何れかの方法であって、コピー数異常(CNA)アッセイが全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる。
【0124】
申し立て23:癌表現型の計算された癌シグネチャーを生成する為の方法であって、方法が:(a)癌表現型の複数の遺伝子発現シグネチャー及びサブタイプ情報を受け取る事と;(b)癌表現型の複数のコピー数異常(CNA)データセットを受け取る事と;(c)複数のCNAデータセットを人工知能アルゴリズムに依って分析して、癌表現型のCNAセグメントレベルシグネチャーの予備的なセットを得る事と;(d)遺伝子発現トレーニングセットを用いて予備的なセットのCNAセグメントレベルシグネチャーを修正し、最終セットCNAセグメントレベルシグネチャーを得る事と;(e)最終セットCNAセグメントレベルシグネチャーを用いて、癌表現型の計算された癌シグネチャーを調える事とを含む。
【0125】
申し立て24:申し立て23の方法であって、癌表現型が体細胞変異に関連する。
【0126】
申し立て25:申し立て23の方法であって、癌表現型がmRNA発現のレベルに対応する。
【0127】
申し立て26:申し立て23の方法であって、癌表現型が蛋白質発現のレベルに対応する。
【0128】
申し立て27:申し立て26の方法であって、蛋白質発現のレベルが免疫組織化学(IHC)シグネチャーに対応する。
【0129】
申し立て28:申し立て23~26の何れかの方法であって、複数のコピー数異常(CNA)データセットが全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる。
【0130】
申し立て29:患者の計算された癌シグネチャーを生成する為の方法であって、方法が:(a)患者のコピー数異常(CNA)データを受け取る事と;(b)癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を受け取り、CNAシグネチャーが癌発現分析、癌サブタイプ情報、及びCNAゲイン/ロス情報に基づく事と;(c)1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)に対して相対的に患者特性のCNAデータの特性をキャラクタリゼーションする様にして、癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を利用するアルゴリズムに依って患者のCNAデータを処理する事と;(d)患者の計算された癌シグネチャーを調える事とを含む。
【0131】
申し立て30:申し立て29の方法であって、癌表現型が体細胞変異に関連する。
【0132】
申し立て31:申し立て29の方法であって、癌表現型がmRNA発現のレベルに対応する。
【0133】
申し立て32:申し立て29の方法であって、癌表現型が蛋白質発現のレベルに対応する。
【0134】
申し立て33:申し立て29の方法であって、蛋白質発現のレベルが免疫組織化学(IHC)シグネチャーに対応する。
【0135】
申し立て34:申し立て29の方法であって、癌表現型が副腎、膀胱、骨、乳部、子宮頸部、結腸、肝臓、肺、リンパ、卵巣、膵臓、陰茎、前立腺、直腸、唾液腺、皮膚、脾臓、精巣、胸腺、甲状腺、気管、又は子宮癌に関連する。
【0136】
申し立て35:申し立て41の方法であって、癌表現型が乳癌に関連する。
【0137】
申し立て36:申し立て29~35の何れかの方法であって、コピー数異常(CNA)データが全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる。
【0138】
申し立て37:癌を有する対象を処置する為の方法であって:(a)患者の計算された癌シグネチャーを生成する事を含み:(i)患者のコピー数異常(CNA)データを受け取る事と;(ii)癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を受け取り、CNAシグネチャーが癌発現分析、癌サブタイプ情報、及びCNAゲイン/ロス情報に基づく事と;(iii)1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)に対して相対的に患者特性のCNAデータの特性をキャラクタリゼーションする様にして、癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)を利用するアルゴリズムに依って患者のCNAデータを処理する事と;(iv)キャラクタリゼーションされた特性に基づいて、患者の計算された癌シグネチャーを調える事と;(b)計算された癌シグネチャーに基づく処置プランに基づいて患者を処置する事とを含む。
【0139】
申し立て38:申し立て37の方法であって、処置が継続中の治療介入である。
【0140】
申し立て39:申し立て37の方法であって、継続中の治療介入が特定の処置を中止する事を含む。
【0141】
申し立て40:申し立て37~39の何れかの方法であって、コピー数異常(CNA)データが全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる。
【0142】
申し立て41:デバイスであって、申し立て29の患者の計算された癌シグネチャーを生成する為のアルゴリズムに依って、患者CNAデータと癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)とを処理する様に構成されたプロセッサーを含む。
【0143】
申し立て42:申し立て41のデバイスを含むシステム。
【0144】
申し立て43:申し立て41のデバイスであって、癌表現型に関連する1つ以上のCNA(単数又は複数)シグネチャー(単数又は複数)と患者CNAデータを比較する為のアルゴリズムを含むソフトウェアを含む。
【0145】
申し立て36:申し立て41~43の何れかのデバイスであって、コピー数異常(CNA)データが全ゲノムシーケンシング(WGS)、全エクソームシーケンシング(WES)、又は其れ等の組み合わせから得られる。
【0146】
上の記載は例解的な実施形態及び例を代表するのみであるという事は理解されるべきである。読者の便宜の為に、上の記載は、全ての可能な実施形態の限定された数の代表的な例、本開示の原理を教示する例に焦点を合わせた。記載は、全ての可能な変形、又は更には記載されている変形の組み合わせを網羅的に列挙する事を試みてはいない。代わりの実施形態が本開示の特定の部分で提示されずにあり得るという事、又は記載されていない更なる代わりの実施形態が或る部分では利用可能であり得るという事は、其れ等の代わりの実施形態の権利放棄と見做されるべきではない。其れ等の記載されていない実施形態の多くには、本開示の原理の適用の違いよりも寧ろテクノロジー及び材料の違いが関わるという事を、当業者は了解するであろう。従って、本開示は、次の請求項に於いて提出される範囲及び同等物未満に限定される事は意図されない。
【0147】
参照に依る組み込み
本明細書に於いて引用される全ての参照、記事、刊行物、特許、特許公開、及び特許出願は、全ての目的について其れ等の全体が参照に依って組み込まれる。然し乍ら、本明細書に於いて引用される何れかの参照、記事、刊行物、特許、特許公開、及び特許出願の言及は、其れ等が正式な先行技術に当たるか又は世界の何れかの国に於ける共通一般知識の一部を形成するという認知又は何れかの形態の示唆ではなく、そう取られるべきではない。本開示は其の詳細な記載に於いて記載されたが、上述の記載は、範囲を例解するが限定しない事が意図されるという事は理解されるべきである。他の態様、利点、及び改変は、下で提出される請求項の範囲内である。本明細書に於いて引用される全ての刊行物、特許、及び特許出願は、各個々の刊行物又は特許出願が参照に依って組み込まれる事を具体的に且つ個々に指示される場合の様に、参照に依って本明細書に組み込まれる。
【0148】
9.コンピュータプログラム
DNA-based-predictors-of-non-genetic-cancer-phenotypes
シャ等(Xia et al.)に依る論文「上皮癌の分子ポートレートの遺伝学的決定因子(Genetic determinants of the molecular portraits of epithelial cancers)」で用いられた分析スクリプト及び関係する(relative)データ。
データは、分析に即使用可能な多くの.rdaファイルを含有する。https://github.com/xyouli/DNA-based-predictors-of-non-genetic-cancer-phenotypesに於いて見出され得る。
【0149】
Rスクリプト
helper.R:此のスクリプトは分析に用いられる多くのR関数を有する。
signature_score _and_segment_score_calculation.R:此のスクリプトは、RNA発現データからのシグネチャースコア及び遺伝子レベルコピー数データからのセグメントスコアを計算する為に用いられる。
association_test.R:此のスクリプトは、遺伝子シグネチャー及びDNAコピー数異常の間のゲノムワイド関連性検定を行なう為に用いられる。
Elastic_Net_modeling.R:此のスクリプトはエラスティックネットモデリング分析を行なう為に用いられる。エラスティックネットモデルを構築する為に用いられる全てのデータはデータフォルダに包含されている。

Rscript/Elastic_Net_modeling.R
57 lines (43 sloc) 1.81
library(caret)
library(glmnet)
library(ROCR)
library(doMC)
registerDoMC(cores = 8)
set.seed(1992)
source("~/script/helper.R")

# load data, BRCA_signatue for example
# predictor: CN_score
# response: signature_score/rppa/mutation/clinical variables
# for balanced stratification: balancing_variables
load('~/data/BRCA_signature_elastic_net_data.rda')

# choose a phenotype to model
# for example, RB-LOH signature
pheno <- "UNC_RB_LOH_Median_Breast.Cancer.Res.2008_PMID.18782450"
score <- unlist(signature_score[pheno,])
score_bi <- ifelse(score >= quantile(score,0.67),1,0)

# split sample into 70% training set and 30% test set
strata <- score_bi
pik <- rep(7/10,times=length(strata))
balanced_split <- balancedstratification(balancing_variables,strata,pik,comment = F)
train <- which(balanced_split==1)
test <- which(balanced_split==0)
trainX <- CN_score[train,]
testX <- CN_score[test,]
trainY <- score_bi[train]
testY <- score_bi[test]

glmnet_obj <- caret_wrap(trainX,trainY,testX,testY,bi = T)

# look at model performance: receiving operating curve and precision recall curve
pred_train <- predict(glmnet_obj,newdata = trainX,type = 'prob')
pred_test <- predict(glmnet_obj,newdata = testX,type = 'prob')
pred_train <- prediction(pred_train$pos,labels = trainY)
pred_test <- prediction(pred_test$pos,labels = testY)
perf_train <- performance(pred_train,measure = 'tpr',x.measure = 'fpr')
perf_test <- performance(pred_test,measure = 'tpr',x.measure = 'fpr')
auc_train <- signif(performance(pred_train,measure = 'auc')@y.values[[1]][1],2)
auc_test <- signif(performance(pred_test,measure = 'auc')@y.values[[1]][1],2)

plot_ROC(perf_train,perf_test,auc_train,auc_test,pheno)

# look at feature landscape
beta <- as.matrix(coef(glmnet_obj$finalModel,glmnet_obj$bestTune$lambda))
beta <- beta[-1,1]
plot_seg_ss(beta,pheno)

--------------------------------------------------------------------------------

DNA-based-predictors-of-non-genetic-cancer-phenotypes/Rscript/association_test.R
27 lines (22 sloc) 1.14 KB
# Test for associations between gene signatures and DNA CNA
# Given a signature_score matrix and
# gene-level CNA matrix CN_score: continuous CNA score for each gene,
# CN_gain: binary matrix where 1 is copy number gain for a gene and 0 is no gain
# CN_loss: binary matrix where 1 is copy number loss for a gene and 0 is no loss
# Fisher's exact test and spearman correlation test/linear model control for subtypes
# choose a gene signature to test, for example RB-LOH signature

load('BRCA_association_test_data.rda')
pheno <- "UNC_RB_LOH_Median_Breast.Cancer.Res.2008_PMID.18782450"
score <- unlist(signature_score[pheno,])
p_value <- sigCNTest(score, CN_score, CN_gain, CN_loss)

# Benjamini-Hochberg correct p values
p_value_adj <- apply(p_value,2,function(x){return(p.adjust(x,method = "BH"))})
# log10 transform adjusted p values
log_p <- -log(p_value_adj,10)

# plot association landscape
v <- vertical_lines
# for unadjusted associations
p <- log_p[,1:4]
# for subtype-adjusted associations
p <- log_p[,c(5:6,3:4)]

P_Plot(p,main = 'UNC_RB_LOH_Median_Breast.Cancer.Res.2008_PMID.18782450',y1 = 35,y2=50,label_up = seq(0,35,by=10),label_down = seq(10,50,by=10))

--------------------------------------------------------------------------------

DNA-based-predictors-of-non-genetic-cancer-phenotypes/Rscript/signature_score_and_segment_score_calculation.R
48 lines (34 sloc) 2.2 KB
# This script is for calculating gene signature scores based on RNA and segment scores based on gene-level DNA CNA

# Given a gene expression data matrix (gene X sample): edata
# rows are genes in Entrez ID and columns are samples
# run calc_signatures
signature_score <- calc_signatures(edata,"~/data/gene_signatures_20170111.gmt",method = "median")

# find NA signatures
NAsig <- rownames(signature_score[is.na(signature_score[,1]),])
# remove NA signatures
i <- match(NAsig,rownames(signature_score))
signature_score <- signature_score[-i,]

# CD103_Ratio
CD103_pos <- signature_score[rownames(signature_score)=="CD103_Positive_Median_Cancer.Cell.2014_PMID.25446897"]
CD103_neg <- signature_score[rownames(signature_score)=="CD103_Negative_Median_Cancer.Cell.2014_PMID.25446897"]
CD103_ratio <- CD103_pos - CD103_neg # log2 scale division
signature_score <- rbind(signature_score,CD103_ratio)
rownames(signature_score)[nrow(signature_score)] <- "CD103_Ratio_Cancer.Cell.2014_PMID.25446897"

# differentiation score
diff_centroid <- read.table("~/data/special_gene_signature_training_sets/UNC_Differentiation.Score_Model_BCR.2010_PMID.20813035",sep = '\t',header = T,row.names = 1,check.names = F)
diff_score <- assignDiffScore.dwd(diff_centroid,edata)
signature_score <- rbind(signature_score,diff_score)
rownames(signature_score)[nrow(signature_score)] <- "UNC_Differentiation.Score_Model_BCR.2010_PMID.20813035"

# oncotype DX score
oncotype <- GHI_RS(edata)
signature_score <- rbind(signature_score,diff_score)
rownames(signature_score)[nrow(signature_score)] <- "GHI_RS_Model_NJEM.2004_PMID.15591335"

save(signature_score,file = 'signature_score.rda')

# For special signatures calculated as correlation to predetermined gene centroids
# All traing sets files are included in the ~/data/special_gene_signature_training_sets folder
# For calculation of such special signature, DWD was used to merge current edata with
# training set, then DWD prediction tool was used to compute pearson/spearman correlation/euclidean distance
# for each sample

# Given a gene-level CNA score matrix (gene X sample): CNdata
# rows are genes in Entrez ID and columns are samples
segment_score <- calc_segments(CNdata,'CNA_segments.gmt',method = 'mean')
図1
図2
図3
図4-1】
図4-2】
図5
図6
図7-1】
図7-2】
図8-1】
図8-2】
図9-1】
図9-2】
図10
図11-1】
図11-2】
図11-3】
図12-1】
図12-2】
図13
図14-1】
図14-2】
図14-3】
図15-1】
図15-2】
図16
図17
【国際調査報告】