(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-27
(54)【発明の名称】高侵襲性肺腺癌のための予後診断方法
(51)【国際特許分類】
C12Q 1/68 20180101AFI20231220BHJP
C12N 15/113 20100101ALN20231220BHJP
C12Q 1/686 20180101ALN20231220BHJP
C12Q 1/6837 20180101ALN20231220BHJP
【FI】
C12Q1/68 ZNA
C12N15/113 Z
C12Q1/686 Z
C12Q1/6837 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023559151
(86)(22)【出願日】2021-12-10
(85)【翻訳文提出日】2023-08-07
(86)【国際出願番号】 EP2021085141
(87)【国際公開番号】W WO2022122994
(87)【国際公開日】2022-06-16
(32)【優先日】2020-12-11
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】523222172
【氏名又は名称】フォンダツィオーネ ディ レリジオーネ エ ディ クルト “カサ ソッリエーヴォ デラ ソッフェレンツァ” - オペラ ディ サン ピオ ダ ピエトレルチーナ
(74)【代理人】
【識別番号】100114775
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】ビアンキ,ファブリツィオ
(72)【発明者】
【氏名】ダマ,エリサ
(72)【発明者】
【氏名】メロッキ,バレンティナ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA19
4B063QQ02
4B063QQ52
4B063QR08
4B063QR62
4B063QS25
(57)【要約】
本発明は、好ましくは新鮮凍結、ホルマリン固定またはパラフィン包埋(FFPE)された標本における、初期(ステージI)疾患を含む高侵襲性肺腺癌(ADC)の予後診断のためのmiRNAバイオマーカーに基づく方法に関する。より詳細には本発明はADCの予後リスク層別化のための、好ましくは高侵襲性初期肺腺癌(すなわちC1-ADC)を有する患者を同定するための方法における、7-miRNA、14-miRNAまたは19-miRNA予後シグネチャーの使用に言及する。
【選択図】
図3aおよび
図3b
【特許請求の範囲】
【請求項1】
a)対象からの生体試料において、配列hsa-miR-193b-5p(配列番号3)、hsa-miR-31-3p(配列番号11)、hsa-miR-31-5p(配列番号12)、hsa-miR-550a-5p(配列番号15)、hsa-miR-196b-5p(配列番号5)、hsa-miR-584-5p(配列番号17)、hsa-miR-30d-5p(配列番号10)、hsa-miR-582-3p(配列番号16)、hsa-miR-9-5p(配列番号19)、hsa-let-7c-3p(配列番号1)、hsa-miR-138-5p(配列番号2)、hsa-miR-196a-5p(配列番号4)、hsa-miR-203a-3p(配列番号6)、hsa-miR-215-5p(配列番号7)、hsa-miR-2355-3p(配列番号3);hsa-miR-30d-3p(配列番号9)、hsa-miR-4709-3p(配列番号13)、hsa-miR-548b-3p(配列番号14)およびhsa-miR-675-3p(配列番号18)を含む19種類のmiRNAのそれぞれ、または配列hsa-miR-196b-5p(配列番号5)、hsa-miR-584-5p(配列番号17)、hsa-miR-30d-5p(配列番号10)、hsa-miR-582-3p(配列番号16)、hsa-miR-9-5p(配列番号19)、hsa-miR-193b-3p(配列番号23)、hsa-miR-135b-5p(配列番号20)、hsa-miR-187-3p(配列番号21)、hsa-miR-192-5p(配列番号22)、hsa-miR-210-3p(配列番号24)、hsa-miR-29b-2-5p(配列番号25)、hsa-miR-3065-3p(配列番号26)、hsa-miR-375-3p(配列番号27)およびhsa-miR-708-5p(配列番号28)を含む14種類のmiRNAのそれぞれ、または配列hsa-miR-31-5p(配列番号12)、hsa-miR-31-3p(配列番号11)、hsa-miR-193b-3p(配列番号23)、hsa-miR-193b-5p(配列番号3)、hsa-miR-196b-5p(配列番号5)、hsa-miR-550a-5p(配列番号15)およびhsa-miR-584-5p(配列番号17)を含む7種類のmiRNAのそれぞれの量を検出する工程を含む、
高侵襲性肺腺癌(C1-ADC)に罹患している患者を同定するためのインビトロまたはエクスビボ方法。
【請求項2】
工程a)で得られたデータを正規化する工程b)をさらに含む、請求項1に記載の方法。
【請求項3】
前記患者を高侵襲性肺腺癌に罹患している対象の予測されるクラスまたは非高侵襲性肺腺癌(非C1-ADC)に罹患している対象のクラスのいずれかに分類する工程c)をさらに含む、請求項2に記載の方法。
【請求項4】
前記高侵襲性肺腺癌に罹患している患者は前記疾患の初期(ステージI)である患者を含む、請求項3に記載の方法。
【請求項5】
前記生体試料は組織試料または体液であり、好ましくは前記組織試料は新鮮な組織試料、凍結させた組織試料またはFFPE組織試料であり、かつ前記体液は血清または血漿である、前記請求項のいずれかに記載の方法。
【請求項6】
前記肺腺癌は非小細胞肺癌(NSCLC)である、前記請求項のいずれかに記載の方法。
【請求項7】
工程a)における前記miRNAは、定量的RT-PCR(qRT-PCR)、デジタルPCR、RNAシークエンシング、Affymetrixマイクロアレイ、カスタムマイクロアレイ、またはNanostring技術から選択される分子バーコード付加によるデジタル検波によって検出する、請求項1に記載の方法。
【請求項8】
工程b)において報告される前記データの前記正規化は、前記miRNAをRNAシークエンシングによって検出する場合には以下に報告されているスキームに従って行う、請求項1に記載の方法。
【表1】
(ここでは、
・各試料(j)の各miRNA(i)の正規化カウント
ijは前記生カウント
ijと各試料
jに特有のサイズ係数
jとの比として計算し、各試料に特有のサイズ係数
jはその試料の全ての比係数
ijの中央値として計算し、比係数
ijは生カウント
ijと特定のmiRNA
iに対する全ての生カウント
ijの幾何平均
jとの比を表す)
【請求項9】
工程b)において報告される前記データの前記正規化は、前記miRNAをqRT-PCRによって検出する場合には以下に報告されているスキームに従って行う、請求項1に記載の方法。
【表2】
(ここでは、
・各試料(j)の各miRNA(i)の前記正規化Ct
ij(サイクル閾値)は前記生Ct
ijと各試料
jに特有のスケーリング係数
j(SF)との差として計算し、前記スケーリング係数は前記試料において参照として使用されるmiRNA「hsa-miR-16-5p」の生Ctと21.87に等しい定数との差を表す)
【請求項10】
工程c)の高侵襲性肺腺癌に罹患している対象または非高侵襲性肺腺癌に罹患している対象の前記クラスの前記分類は、以下の式:
【数1】
によって計算し、
ここでは、
・RNAシークエンシングによって分析される19-miRNAのモデルでは、
z=-8.2029+(-0.2651*hsa-let-7c-3p)+(0.1709*hsa-miR-138-5p)+(0.1443*hsa-miR-193b-5p)+(0.0200*hsa-miR-196a-5p)+(0.0464*hsa-miR-196b-5p)+(0.2297*hsa-miR-203a-3p)+(0.1285*hsa-miR-215-5p)+(0.3933*hsa-miR-2355-3p)+(-0.2220*hsa-miR-30d-3p)+(-0.1874*hsa-miR-30d-5p)+(0.1535*hsa-miR-31-3p)+(0.0326*hsa-miR-31-5p)+(-0.3032*hsa-miR-4709-3p)+(-0.1672*hsa-miR-548b-3p)+(0.1529*hsa-miR-550a-5p)+(0.1132*hsa-miR-582-3p)+(0.5229*hsa-miR-584-5p)+(0.1314*hsa-miR-675-3p)+(0.0497*hsa-miR-9-5p)であり、
・RNAシークエンシングによって分析される14-miRNAのモデルでは、
z=-5.4414+(-0.1028*hsa-miR-135b-5p)+(-0.0486*hsa-miR-187-3p)+(0.2828*hsa-miR-192-5p)+(0.1977*hsa-miR-193b-3p)+(0.0201*hsa-miR-196b-5p)+(0.1908*hsa-miR-210-3p)+(-0.5074*hsa-miR-29b-2-5p)+(0.0384*hsa-miR-3065-3p)+(-0.3312*hsa-miR-30d-5p)+(-0.0475*hsa-miR-375-3p)+(0.1895*hsa-miR-582-3p)+(0.5606*hsa-miR-584-5p)+(0.2663*hsa-miR-708-5p)+(0.0435*hsa-miR-9-5p)であり、かつ
・RNAシークエンシングによって分析されるモデル7-miRNAでは、
z=-8.5210+(0.1171*hsa-miR-193b-3p)+(0.2233*hsa-miR-193b-5p)+(0.1341*hsa-miR-196b-5p)+(0.1554*hsa-miR-31-3p)+(0.0584*hsa-miR-31-5p)+(0.3622*hsa-miR-550a-5p)+(0.4683*hsa-miR-584-5p)であるか、
あるいは代わりとして
・qRT-PCRによって分析される7-miRNAのモデルでは、
z=2.2920+(hsa-miR-193b-3p*0.1295)+(hsa-miR-193b-5p*0.0920)+(hsa-miR-196b-5p*-0.1310)+(hsa-miR-31-3p*-0.2116)+(hsa-miR-31-5p*-0.2724)+(hsa-miR-550a-5p*0.2717)+(hsa-miR-584-5p*0.0413)である、
前記請求項のいずれかに記載の方法。
【請求項11】
より短い全生存期間を有する患者および/またはより短い無病生存期間を有する患者および/または治療に応答する患者および/または限定されるものではないが初期疾患(ステージI)を有する患者を含むことができる転移性疾患を有する患者から選択される、予後不良の高侵襲性肺腺癌の群に含まれる患者の同定のための前記請求項のいずれかに記載の方法。
【請求項12】
より長い全生存期間を有する患者および/またはより長い無病生存期間を有する患者および/または治療に応答する患者および/または限定されるものではないが初期疾患(ステージI)を有する患者を含むことができる転移性疾患を有しない患者から選択される、予後良好の非高侵襲性肺腺癌の群に含まれる患者の同定のための前記請求項のいずれかに記載の方法。
【請求項13】
白金製剤による組み合わせ、好ましくはシスプラチン、カルボプラチン+ゲムシタビン、ビノレルビン、タキサンまたはカンプトテシンなどの第3世代の薬剤、分子標的薬、免疫療法、放射線療法またはそれらの組み合わせから選択される全身性術後補助化学療法から選択される、肺腺癌(C1-ADC)の予後リスク層別化および/または外科手術後の他の治療選択肢の特定のための前記請求項のいずれかに記載の方法。
【請求項14】
シークエンシングのためのマルチウェルプレート、マイクロアレイまたはライブラリーと、請求項1に記載の19種類のmiRNAのそれぞれ、14種類のmiRNAのそれぞれまたは7種類のmiRNAのそれぞれの量を検出するのに適したプライマーおよび/またはプローブとを含む、高侵襲性肺腺癌に罹患している患者を同定するのに使用するためのキット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、好ましくは新鮮凍結、ホルマリン固定またはパラフィン包埋(FFPE)された標本における初期(ステージI)疾患を含む高侵襲性肺腺癌(ADC)の予後診断のためのmiRNAバイオマーカーに基づく方法に関する。より詳細には本発明は、ADCの予後リスク層別化のための、好ましくは高侵襲性初期肺腺癌(すなわちC1-ADC)を有する患者を同定するための方法における7-miRNA、14-miRNAまたは19-miRNA予後シグネチャーの使用に言及する。
【背景技術】
【0002】
最近の世界的な肺癌データは、2018年に209万の新しい症例および176万人の死亡の疾病負荷を示している[1]。肺癌の主な種類はいくつかの異質の腫瘍サブタイプを含む非小細胞肺癌(NSCLC)(80~85%)によって代表され、そのうち肺腺癌(ADC)は全ての肺癌症例の約40%を占めている。禁煙キャンペーンおよび大規模CTスクリーニングプログラムの実施などの一次および二次予防戦略により、約20%の肺癌死亡率の低下(NELSONおよびNLST試験で観察)および進行性肺癌のステージシフトが生じた[2,3]。しかし肺癌の高レベルの分子不均一性により、大部分の高侵襲性初期腫瘍の転移性播種が増加する(約30~50%)[4]。
【0003】
ADCの徹底的な分子および機能特性評価は、特異的分子のサブタイプにおける腫瘍不均一性の情況を説明するのに役立つことができ、これは他の治療選択肢を提案することができる。本発明者らは最近になって、より進行性の癌に似ている独特の遺伝子/タンパク質発現および遺伝子変化を伴う腫瘍すなわちC1-ADCのサブセットを同定する、ステージIのADCのための10-遺伝子予後シグネチャーについて記載した[5,6]。この予後遺伝子シグネチャーは、新鮮凍結、ホルマリン固定またはパラフィン包埋(FFPE)された標本における定量的リアルタイムPCR(qRT-PCR)またはデジタルPCR(dPCR)、AffymetrixまたはRNAシークエンシング、あるいは直接デジタル検波(例えばNanostring技術)によって測定することができる[6]。
【0004】
この10-遺伝子シグネチャーの臨床的解釈を助けるために、ここでは本発明者らは、特に高侵襲性初期肺腺癌を有する患者を同定するためのADCの予後リスク層別化のために、この10種類の遺伝子の代用物としてmiRNAシグネチャーを提供する。miRNAベースの予後シグネチャーは、診断目的のために日常的に使用されるFFPE試料から抽出した場合に低品質のmRNAを使用することに関する問題を克服するであろう。実際に、miRNAなどのより短い非翻訳RNA分子は厳しい条件に対してより抵抗性があり[7,8]、かつqRT-PCRを含む発現プロファイリング方法の大部分と適合可能である。
【0005】
いくつかの先行技術は、肺癌などの癌を診断するためにmiRNAの検出の使用を開示している。しかし、高侵襲性ADCサブタイプすなわちC1-ADCを有する患者を検出するために有効に機能し、かつ新鮮凍結、ホルマリン固定またはパラフィン包埋(FFPE)された標本を使用する場合にも適用することができる特異的miRNAシグネチャーに基づく予後診断方法を開示している先行技術文献は存在しない。
【0006】
例えば国際公開第2012/089630A1号は、34種類のmiRNAのリスト内の少なくとも5種類のmiRNAを検出することにより、生物学的流体において初期肺癌を有する症状が現れていない高リスクの個体を同定するための方法を開示している。
【0007】
国際公開第2016/038119号およびBianchi Fら[14]は、その患者から得られた血液試料において異なるmiRNAの存在量の減少および増加を検出することにより対象において肺癌を診断するための方法を開示しており、その存在は、限定されるものではないが低線量コンピュータ断層撮影(LDCT)などの他の当該技術分野において承認されている方法よりも癌の早期検出を提供する。
【0008】
従って、予後バイオマーカーならびに分子標的/免疫療法ではなく全身性術後補助化学療法(すなわち白金製剤による)から最終的に恩恵を受けることができる初期高侵襲性肺癌を有する患者を同定するための方法であって、異なる種類の体液またはFFPE標本などの組織試料に適用することもできる方法の必要性に迫られている。
【図面の簡単な説明】
【0009】
【
図1】データセットおよび分析を用いた研究設計のフローチャート。
【
図2】TCGA-LUADコホートのmRNAおよびmiRNA発現プロファイル分析。(a)10-遺伝子発現シグネチャーの階層的クラスタリング分析。C1~C4クラスターがレジェンドに従って色づけられている。年齢、性別、喫煙状況およびステージがレジェンドに従って色づけられている。(b)C1~C4クラスターによって層別化された3年間の全生存期間についてのカプラン・マイヤー曲線。C1対非C1患者(C2~C4)の比較のためにログランクp値が示されている。(c)19-miRNA(実線)および14-miRNA(破線)モデルの偽陽性率および真陽性率を示す受信者動作特性(ROC)曲線。その曲線下面積(AUC)が報告されている。(d)19-、14-および7-miRNAモデルおよび対応する標的遺伝子から得られたmiRNAのネットワーク。長方形は遺伝子(mRNA)を表し、楕円形は19-miRNAモデルからのmiRNAを表し、円は14-miRNAモデルからのmiRNAを表し、六角形は14-および19-miRNAモデルの両方からのmiRNAを表す。(e)TCGA-LUADコホートにおける7-miRNAの階層的クラスタリング。C1および非C1腫瘍(10-遺伝子シグネチャーに従って定められる)がレジェンドに従って色づけられている。予測されるC1および非C1腫瘍がレジェンドに従って色づけられている(7-miRNAロジスティックモデルに従って定められる)。
【
図3】7-miRNAモデルの検証。(a)7-miRNAモデルの偽陽性率および真陽性率を示すROC曲線。そのAUCが報告されている。(b)C1(薄灰色のドット)および非C1(黒色のドット)患者におけるC1予測確率に関する箱ひげ図。予測確率は19-、14-および7-miRNAモデルによって計算されている。ウィルコクソン・マンホイットニー検定のp値が報告されている。(c)7-miRNAシグネチャーによって標的化される遺伝子ネットワークと有意に重複していることが分かった上位10個の遺伝子セットのバブルプロット。バブルサイズは統計的有意性(FDR q値の-Log)に比例しており、カラーコードは重複していることが分かった遺伝子の数を指す。X軸に、遺伝子のクエリセット(k)と重複している遺伝子セットサイズ(K)との重複比(k/K)。(d)CSSコホートの10-遺伝子発現のヒートマップ。C1および非C1腫瘍がレジェンドに従って色づけられている。リスクスコアは10-遺伝子リスクモデルに基づいて計算されている。(e)全ステージ(実線の黒色の線)またはステージI腫瘍のみ(破線の薄灰色の線)に関するCSSコホートにおける7-miRNAモデルの偽陽性率および真陽性率を示すROC曲線。そのAUCが報告されている。(f)全ステージの腫瘍およびステージIの腫瘍に関するCSSコホートにおけるC1(薄灰色のドット)および非C1(黒色のドット)腫瘍におけるC1予測確率に関する箱ひげ図。予測確率は7-miRNAモデルによって計算されている。ウィルコクソン・マンホイットニー検定のp値が報告されている。
【
図4】14および19種類のmiRNAのシグネチャーから得られたAUC。14-および19-miRNAモデルのAUCを等しい長さのランダムシグネチャーと比較するために適用される設計のフローチャート。14および19種類のmiRNAのランダムリストについての中央値、第1の四分位数(Q1)、第3の四分位数(Q3)、最小(min)および最大(max)AUCが報告されている。100種類のランダムシグネチャーについてのAUCの正規分布;AUC=0.5における破線の垂直線;14-および19-miRNAモデルのAUCにおける実線の垂直線;塗り潰されている黒色の領域は100種類のランダムシグネチャーについてのmin-max AUC範囲に対応している。DEは差次的発現の略である。
【
図5】表S1A。TCGA-LUADコホート。C1対非C1患者の比較においてDESeq2による有意に調節された200種類のmiRNA。
【
図6】表S1B。TCGA-LUADコホート。C1対非C1患者の比較においてBRB-ArrayToolsによる有意に調節された90種類のmiRNA。
【発明を実施するための形態】
【0010】
定義
別途定義されていない限り、本明細書で使用される全ての専門用語、記号および他の科学用語は、本開示が属する当業者によって一般に理解される意味を有することを意図している。場合によっては、一般に理解される意味を有する用語は明確性のため、および/またはすぐに参照できるように本明細書において定められており、従って本明細書にそのような定義を含めることは、当該技術分野において一般に理解される定義に関してかなりの違いを表すものと解釈されるべきではない。
【0011】
本明細書で使用される「マイクロRNA」または「miRNA」という用語は、RNAサイレンシングおよび遺伝子発現の転写後調節において役割を有する、植物、動物およびいくつかのウイルスに見られる約22ヌクレオチドの小さい非翻訳RNA分子を指す。miRNAは、mRNA分子内に相補配列を有する塩基対を介してその機能を与える。
【0012】
本明細書における「シグネチャー」という用語は、バイオマーカーとして使用されるいくつかのmiRNA(すなわち転写物)の組み合わせから得られる発現パターンを指す。
【0013】
本明細書における「FFPE標本」という用語は、ホルマリンに固定され、かつパラフィン包埋された組織試料を指す。
【0014】
本明細書における「AUC」という用語は、様々な分類閾値における二項分類モデルの性能を示すグラフであるROC曲線下面積(受信者動作特性曲線)を指す。
【0015】
本明細書で使用される群「C1」または「C1-ADC」における患者という用語は、予後不良を経験している患者(すなわち、より短い全生存期間を有し、かつ/またはより短い無病生存期間を有し、かつ/または治療に応答し、かつ/または転移性疾患を有する)を含む高侵襲性肺腺癌に罹患している患者を含み、限定されるものではないが初期疾患(すなわちステージI)を有する患者を含むことができ、群「非C1」または「非C1-ADC」に含まれる患者は、非高侵襲性肺腺癌に罹患しているか予後良好の患者であり(すなわち、より長い全生存期間を有し、かつ/またはより長い無病生存期間を有し、かつ/または治療に応答し、かつ/または転移性疾患を有しない)、これは限定されるものではないが初期疾患(すなわちステージI)を有する患者を含むことができる。
【0016】
本明細書における「高侵襲性」という用語は、予後不良の(すなわち、より短い全生存期間を有し、かつ/またはより短い無病生存期間を有し、かつ/または治療に応答し、かつ/または転移性疾患を有する)患者において診断される癌を指す。
【0017】
本明細書における「予後診断」という用語は、予後良好/予後不良の患者を区別するための能力を指す。
【0018】
本明細書における「バイオマーカー」という用語(生物学的マーカーの省略形)は、生物学的指標(例えば転写物、すなわちmiRNA)および/またはいくつかの生物学的状態または条件の指標を指す。
【0019】
「~を含む(comprising)」、「~を有する(having)」、「~を含む(including)」および「~を含有する(containing)」という用語は、「オープン」用語(すなわち、「限定されるものではないが、~を含む」を意味する)として理解されるべきであり、「本質的に~からなる(consist essentially of)」、「本質的に~からなる(consisting essentially of)」、「~からなる(consist of)」または「~からなる(consisting of」)などの用語のサポートとしてもみなされるべきである。
【0020】
本明細書における「TCGA」という用語は、癌ゲノムアトラス(Cancer Genome Atlas)データベースを指し、ここでは全部で33の異なる種類の腫瘍に関する分子データ(例えば、遺伝子およびタンパク質発現、遺伝子突然変異、メチル化プロファイル、コピー数多型)が公衆に入手可能にされた(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)。
【0021】
本明細書における「TCGA-LUAD」という用語は、そのデータが癌ゲノムアトラスデータベースにおいて入手可能である肺腺癌(LUAD)患者の特定のコホートを指す。
【0022】
本明細書における「CSS」という用語は、IRCSS Casa Sollievo della Sofferenza病院に登録されている肺腺癌患者のコホートを指す。
【0023】
驚くべきことに、19-miRNAまたは14-miRNAシグネチャー、あるいは好ましくは7-miRNAシグネチャーにより、別名「C1-ADC」または「C1」という初期疾患を含む高侵襲性肺腺癌に罹患している患者を同定することができることを見出した。発現プロファイルおよびひいてはそのようなmiRNAの量は、RNAシークエンシング(RNA-seq)、定量的リアルタイムPCR(qRT-PCR)またはデジタルPCR(dPCR)、あるいはAffymetrixまたは直接デジタル検波(例えばNanostring技術)によって測定することができ、異なる体液または組織試料に適用することができ、FFPE試料にも適用することができ、主にFFPE試料におけるmRNAの不安定性/分解に関する欠点を克服する。
【0024】
ここでは本発明者らは、肺癌患者の大きいコホート(TCGA-LUAD;N=510)のRNA-seq(mRNAおよびmiRNAプロファイル)データ分析に依存する多層手法を適用し、これにより本発明者らは肺腺癌患者において予後診断用miRNAシグネチャーを同定することが可能になった。そのようなシグネチャーは高侵襲性疾患をスコア化する際に高い正解率(0.79~0.85の範囲のAUC)を示し、分子マルチバイオマーカー分類法において使用することができる。重要なことに、ネットワークベースの手法を用いて本発明者らはmiRNA-mRNA調節ネットワークを再構築し、かつ癌関連経路と重複している様々な遺伝子を制御する、FFPE試料においても機能する7種類のmiRNAの最小シグネチャーを同定した。
【0025】
得られた結果は、肺癌の予後診断のためのmiRNAベースのバイオマーカーの信頼性および臨床ルーチンにおけるmiRNAバイオマーカーの適用に基づく分類法におけるそれらの使用についてさらに実証している。
【0026】
より詳細には、本発明者らは、ステージI疾患を含むADCにおいて先に記載されている10-遺伝子予後シグネチャーを再現する7-、14-および19-miRNAの代用miRNAシグネチャーを得た[6]。7-、14-および19-miRNAシグネチャーは全て高侵襲性「C1-ADC」疾患を同定するために有効であった(AUC=0.79~0.85)。注目すべきことに、7-miRNAシグネチャーにおける全てのmiRNAはFFPE試料の大部分において検出され(Ct<40;表S2)、これにより低品質のmRNAに使用した場合に証明されるより高い安定性が確認された[9]。
【0027】
重要なことに、それらの手法において本発明者らは、高侵襲性ステージI腫瘍(「C1」)を特徴とする特に精選されたmiRNA-mRNA対によるネットワーク再構築戦略を採用した。そのような手法により、14-および19-miRNAモデル(
図2cおよび
図3a)に匹敵する正解率でC1を非C1腫瘍から層別化することができ、かつ重要なことに「C1」トランスクリプトームと相互作用する7種類のmiRNAのコアを選択することが可能になった。これは肺癌の進行に関連づけられているmiRNAによって制御される分子機構を捉えるのに適切である。
【0028】
実際に本発明者らは、「7-miRNAネットワーク」と癌関連経路を表すいくつかの遺伝子セットとの間に大きい重複を観察した(
図3c)。
【0029】
究明された新しい方法の利点は、初期疾患を含む高侵襲性肺腺癌のスクリーニングのための信頼できる予後診断方法である点にある。特に前記方法は日常的な臨床設定において、
・診断目的のために日常的に使用される例えばFFPE試料から抽出した場合に低品質のmRNAを使用することに関する問題を克服することができ、
・その後の死亡率の低下と共に、再発および予後不良を経験し得る治療(すなわち外科手術、外科手術+術後補助化学療法、外科手術+放射線療法あるいはそれらの組み合わせ)後にADCを有する患者の割合を区別することができ、
・複数の遺伝子発現プロファイリングプラットフォーム(すなわちRNAseq、定量的リアルタイムPCR、デジタルPCR、Affymetrix、分子バーコード付加によるデジタル検波)と共に使用することができ、
・前記方法の特異性を増大させる特異的転写物配列を分析し、
・miRNAベースの診断のために臨床現場即時検査(POCT)において実施することができ、
・少量の生物学的物質(最大1~10ナノグラムの精製された核酸)を用いて転写物の量を測定することができる
という望ましいいくつかの特性を示す。
【0030】
従って本発明の一実施形態では、高侵襲性肺腺癌(C1-ADC)に罹患している患者を同定するためのインビトロまたはエクスビボ方法であって、
a.対象からの生体試料において、配列hsa-miR-193b-5p(配列番号3)、hsa-miR-31-3p(配列番号11)、hsa-miR-31-5p(配列番号12)、hsa-miR-550a-5p(配列番号15)、hsa-miR-196b-5p(配列番号5)、hsa-miR-584-5p(配列番号17)、hsa-miR-30d-5p(配列番号10)、hsa-miR-582-3p(配列番号16)、hsa-miR-9-5p(配列番号19)、hsa-let-7c-3p(配列番号1)、hsa-miR-138-5p(配列番号2)、hsa-miR-196a-5p(配列番号4)、hsa-miR-203a-3p(配列番号6)、hsa-miR-215-5p(配列番号7)、hsa-miR-2355-3p(配列番号3)、hsa-miR-30d-3p(配列番号9)、hsa-miR-4709-3p(配列番号13)、hsa-miR-548b-3p(配列番号14)およびhsa-miR-675-3p(配列番号18)を含む19種類のmiRNAのそれぞれ、または配列hsa-miR-196b-5p(配列番号5)、hsa-miR-584-5p(配列番号17)、hsa-miR-30d-5p(配列番号10)、hsa-miR-582-3p(配列番号16)、hsa-miR-9-5p(配列番号19)、hsa-miR-193b-3p(配列番号23)、hsa-miR-135b-5p(配列番号20)、hsa-miR-187-3p(配列番号21)、hsa-miR-192-5p(配列番号22)、hsa-miR-210-3p(配列番号24)、hsa-miR-29b-2-5p(配列番号25)、hsa-miR-3065-3p(配列番号26)、hsa-miR-375-3p(配列番号27)およびhsa-miR-708-5p(配列番号28)を含む14種類のmiRNAのそれぞれ、または配列hsa-miR-31-5p(配列番号12)、hsa-miR-31-3p(配列番号11)、hsa-miR-193b-3p(配列番号23)、hsa-miR-193b-5p(配列番号3)、hsa-miR-196b-5p(配列番号5)、hsa-miR-550a-5p(配列番号15)およびhsa-miR-584-5p(配列番号17)を含む7種類のmiRNAのそれぞれの量を検出する工程を含む方法が提供される。
【0031】
さらなる好ましい実施形態によれば、本発明の方法は、工程a)で得られたデータを正規化する工程b)をさらに含む。
【0032】
さらなる好ましい実施形態によれば、本発明の方法は、患者を高侵襲性肺腺癌に罹患している対象のクラスまたは非高侵襲性肺腺癌(非C1-ADC)に罹患している対象のクラスのいずれかに分類する工程c)をさらに含む。
【0033】
好ましくは、高侵襲性肺腺癌に罹患している対象のクラスは初期疾患(ステージI)にある患者を含む。
【0034】
より好ましくは、肺腺癌は非小細胞肺腺癌(NSCLC)である。
【0035】
本発明によれば、前記miRNAの検出は、それぞれ1つが1種類のmiRNAの配列に選択的なプライマーおよび/またはプローブを用いるハイブリダイゼーションによって行う。
【0036】
本発明の好ましい実施形態によれば、工程a)における前記miRNAの量は、定量的RT-PCR(qRT-PCR)、デジタルPCR、RNAシークエンシング、Affymetrixマイクロアレイ、カスタムマイクロアレイ、またはNanostring技術から選択される分子バーコード付加によるデジタル検波によって計算する。
【0037】
好ましくは、工程a)の定量的RT-PCR(qRT-PCR)は、検出されるmiRNAのそれぞれに特異的プライマーおよび/またはプローブを用いて行う。
【0038】
好ましくは、19-miRNA、14-miRNAまたは7-miRNAシグネチャー中に存在する各miRNAを逆転写し(すなわちRT反応)、次いで増幅させる(すなわちqPCR)ために、前記特異的プライマーおよびプローブを設計する。RT反応は当該試料中に存在する成熟miRNAを伸長させるためにアダプター配列の3’ポリAテーリングおよび5’ライゲーションに基づいているか[16]、あるいはmiRNA特異的ステムループプライマーを用いるものであってもよい[17]。
【0039】
好ましくは、miRNA量は、FFPEブロックからのAllPrep DNA/RNA FFPEキット(QIAGEN社)または他のRNA抽出方法および他の体液試料または組織試料からのRNA抽出方法から選択される従来のRNA抽出方法を用いて抽出されたmRNAおよびmiRNAを含むトータルRNAとして測定する。
【0040】
好ましくは、RNAシークエンシングはそこからのmiRNAがサイズに従って選択される10ngのトータルRNAを用いて行う。miRNAシークエンシングライブラリーは、miRNAを特異的なシークエンシングアダプターとライゲーションし、かつそれらをcDNAに変換することにより構築する。次いで、好ましくはIlluminaシークエンシングプラットフォームを用いる合成によるシークエンシングをmiRNAライブラリー調製に適用する。
【0041】
好ましくは、10ngのトータルRNAを用いてqRT-PCR分析を行い、これは、アダプター配列の3’ポリAテーリングおよび5’ライゲーションを用いて、あるいは特異的ステムループプライマーを用いて逆転写し、その後に本発明に従って分析される任意のmiRNAシグネチャーのために選択されたmiRNA特異的プライマーおよびプローブを用いてqRT-PCR分析する。
【0042】
より好ましくは、qRT-PCR分析はTaqMan Advanced miRNA cDNA合成キット(ThermoFisher社)およびTaqMan Advanced miRNAアッセイを用いて行うか、あるいは本発明に従って分析される任意のmiRNAシグネチャーのために選択された特異的プライマーおよびプローブを用いる定量的RT-PCR類似方法により行う。
【0043】
好ましくは、Poly(A)テーリング、アダプターライゲーション、RT反応およびmiR-Ampは、TaqMan Advanced miRNAアッセイ(ThermoFisher社)または類似方法の説明書に従って行う。
【0044】
好ましくは、hsa-miR16-5p(MIMAT0000069;配列番号29:UAGCAGCACGUAAAUAUUGGCG)をqRT-PCR反応における標準参照として使用する。
【0045】
本発明によれば、工程b)において報告されるデータの正規化は、miRNAをRNAシークエンシングによって定量化する場合には以下に報告されているスキームに従って行う。
【表1】
ここでは
・各試料(j)の各miRNA(i)の正規化カウント
ijは各試料
jに特有の生カウント
ijおよびサイズ係数
jの比として計算する;各試料に特有のサイズ係数
jはその試料の全ての比係数
ijの中央値として計算する;比係数
ijは、生カウント
ijと特定のmiRNA
Iに対する全ての生カウント
ijの幾何平均
jとの比を表す
【0046】
本発明によれば、工程b)に報告されているデータの正規化は、miRNAをRT-PCRによって定量化する場合には以下に報告されているスキームに従って行う。
【表2】
ここでは、
・各試料(j)の各miRNA(i)の正規化Ct
ij(サイクル閾値)は生Ct
ijと各試料
jに特有のスケーリング係数
j(SF)との差として計算する;このスケーリング係数は、当該試料において参照として使用されるmiRNA「hsa-miR-16-5p」の生Ctと21.87に等しい定数との差を表す。
【0047】
本発明によれば、miRNAをAffymetrixマイクロアレイによって定量化する場合には、工程b)で報告される生データの正規化はGene Chip miRNA Arrayに従って行い、ここではAffymetrixオリゴヌクレオチドマイクロアレイを使用して、最後のmiRBaseリリースにおいて全ての成熟miRNA配列の発現を調べる。
【0048】
本発明によれば、miRNAを直接デジタル定量化(例えばNanostring社、nCounter分析)によって定量化する場合には、工程b)で報告される生データの正規化はmiRNA発現の直接マルチプレックス測定に基づくデジタル色分けバーコード技術に従って行う。
【0049】
本発明の方法によれば、工程c)の高侵襲性肺腺癌に罹患している対象または非高侵襲性肺腺癌に罹患している対象の予測されるクラスの分類は、以下の式:
【数1】
によって計算し、
式中、
・RNAシークエンシングによって分析される19-miRNAのモデルでは、
z=-8.2029+(-0.2651*hsa-let-7c-3p)+(0.1709*hsa-miR-138-5p)+(0.1443*hsa-miR-193b-5p)+(0.0200*hsa-miR-196a-5p)+(0.0464*hsa-miR-196b-5p)+(0.2297*hsa-miR-203a-3p)+(0.1285*hsa-miR-215-5p)+(0.3933*hsa-miR-2355-3p)+(-0.2220*hsa-miR-30d-3p)+(-0.1874*hsa-miR-30d-5p)+(0.1535*hsa-miR-31-3p)+(0.0326*hsa-miR-31-5p)+(-0.3032*hsa-miR-4709-3p)+(-0.1672*hsa-miR-548b-3p)+(0.1529*hsa-miR-550a-5p)+(0.1132*hsa-miR-582-3p)+(0.5229*hsa-miR-584-5p)+(0.1314*hsa-miR-675-3p)+(0.0497*hsa-miR-9-5p)であり、
・RNAシークエンシングによって分析される14-miRNAのモデルでは、
z=-5.4414+(-0.1028*hsa-miR-135b-5p)+(-0.0486*hsa-miR-187-3p)+(0.2828*hsa-miR-192-5p)+(0.1977*hsa-miR-193b-3p)+(0.0201*hsa-miR-196b-5p)+(0.1908*hsa-miR-210-3p)+(-0.5074*hsa-miR-29b-2-5p)+(0.0384*hsa-miR-3065-3p)+(-0.3312*hsa-miR-30d-5p)+(-0.0475*hsa-miR-375-3p)+(0.1895*hsa-miR-582-3p)+(0.5606*hsa-miR-584-5p)+(0.2663*hsa-miR-708-5p)+(0.0435*hsa-miR-9-5p)であり、かつ
・RNAシークエンシングによって分析されるモデル7-miRNAでは、
z=-8.5210+(0.1171*hsa-miR-193b-3p)+(0.2233*hsa-miR-193b-5p)+(0.1341*hsa-miR-196b-5p)+(0.1554*hsa-miR-31-3p)+(0.0584*hsa-miR-31-5p)+(0.3622*hsa-miR-550a-5p)+(0.4683*hsa-miR-584-5p)であるか、
あるいは代わりとして
・qRT-PCRによって分析される7-miRNAのモデルでは、
z=2.2920+(hsa-miR-193b-3p*0.1295)+(hsa-miR-193b-5p*0.0920)+(hsa-miR-196b-5p*-0.1310)+(hsa-miR-31-3p*-0.2116)+(hsa-miR-31-5p*-0.2724)+(hsa-miR-550a-5p*0.2717)+(hsa-miR-584-5p*0.0413)である。
【0050】
好ましい実施形態によれば、工程c)は、限定されるものではないが初期疾患(ステージI)を含むことができる高侵襲性肺腺癌に罹患している対象の予測されるクラスに患者を分類する。
【0051】
好ましい実施形態によれば、本発明の方法は、より短い全生存期間を有する患者および/またはより短い無病生存期間を有する患者、および/または治療に応答する患者、および/または限定されるものではないが初期疾患(ステージI)を有する患者を含むことができる転移性疾患を有する患者から選択される、予後不良の高侵襲性肺腺癌の群に含まれる患者を同定する。
【0052】
さらなる好ましい実施形態によれば、本発明の方法は、より長い全生存期間を有する患者、および/またはより長い無病生存期間を有する患者、および/または治療に応答する患者、および/または限定されるものではないが初期疾患(ステージI)を有する患者を含むことができる転移性疾患を有しない患者から選択される、予後良好の非高侵襲性肺腺癌の群に含まれる患者を同定する。
【0053】
さらなる好ましい実施形態によれば、本発明の方法は肺腺癌を有する患者の予後リスク層別化のため、および/または白金製剤による組み合わせ、好ましくはシスプラチン、カルボプラチン+ゲムシタビン、ビノレルビン、タキサンまたはカンプトテシンなどの第3世代の薬剤、分子標的薬、免疫療法、放射線療法またはそれらの組み合わせから選択される全身性術後補助化学療法から選択される外科手術後の他の治療選択肢を特定するために使用する。
【0054】
好ましくは、本発明の方法では生体試料は組織試料または体液である。
【0055】
より好ましくは、前記組織試料は新鮮な組織試料、凍結させた組織試料またはFFPE組織試料である。
【0056】
より好ましくは、前記体液は血清または血漿である。
【0057】
さらなる実施形態は、本発明に係る方法を行うためのマイクロアレイ、定量的ポリメラーゼ連鎖反応、シークエンシングベースの技術またはデジタル分子バーコード付加ベースの技術である。
【0058】
さらなる実施形態は、マルチウェルプレートと、検出されるmiRNAのそれぞれのための特異的プライマーおよび/またはプローブとを含む本発明に係る方法を行うためのキットである。
【0059】
好ましくは、検出されるmiRNAのそれぞれを増幅するための本発明の方法において使用されるプライマーおよびプローブは、表12に列挙されているアッセイで使用されるプライマーおよびプローブに対応する。
【0060】
さらなる好ましい実施形態は、マルチウェルプレート、マイクロアレイまたはシークエンシングのためのライブラリーと、請求項1に記載の19種類のmiRNAのそれぞれ、14種類のmiRNAのそれぞれまたは7種類のmiRNAのそれぞれの量を検出するのに適したプライマーおよび/またはプローブとを含む、高侵襲性肺腺癌に罹患している患者を同定するのに使用するためのキットである。
【0061】
結果
1.miRNAシグネチャーの同定
本発明者らは、
図1に要約されている多層手法を開発し、これにより本発明者らはADC患者の予後診断のための代用miRNAベースシグネチャーを同定することが可能になった。
【表3】
割合は四捨五入により合計100にすることできなかった;
1年齢に関する情報が不明の19人の患者;
2上皮内腺癌を有する1人の患者;
3TCGA-LUADコホート中の経過観察が不明の9人の患者;
43人の死亡を除外した:1人の死亡日は不明であり、2人は外科手術から30日以内に死亡した。
【0062】
TCGA-LUADコホート(N=515)患者の10-遺伝子シグネチャーを用いた階層的クラスタリング分析により、以前の発見と一貫する4つの主流派、すなわちC1(N=201)、C2(N=98)、C3(N=39)およびC4(N=177)クラスター(
図2a)が明らかになった[6]。3年間の全生存期間の分析により、C2、C3およびC4クラスター間で有意差がないことが分かり(ステージIおよび進行したステージにおけるログランク試験p値はそれぞれp=0.90およびp=0.48であった)、従ってそれらを非C1クラスターにまとめた。C1患者は、ステージI(p値=0.0010)およびより進行したステージ(p=0.0061)の両方においてより悪い予後を示した(
図2b)。
【0063】
次いで本発明者らは、入手可能なmiRNA発現データを用いて、TCGA-LUADコホートの515人のADCのうち510人のmiRNA発現プロファイルを行った。本発明者らは、C1および非C1患者において差次的に発現されるmiRNAを同定するために他の統計学的手法としてDESeq2RパッケージおよびBRB-ArrayTools(方法の箇所を参照)の両方を使用した。本発明者らは全部で382種類のmiRNAを分析し、そのうち200種はDESeq2によって、90種はBRB-ArrayToolsによって差次的に発現されることが分かった(それぞれ表S1Aおよび表S1B、
図5および
図6を参照)。
【0064】
2つのセットにおいて全部で87種類のmiRNAが重複していた。次いでLasso正則化を適用してC1を非C1腫瘍から層別化することができる最適化されたmiRNAベースシグネチャーを同定した。14-miRNA(90種類のmiRNAセットから)および19-miRNA(200種類のmiRNAセットから)の2種類のシグネチャーが得られ(重複している5種類のmiRNA;表2)、これはC1/非C1癌患者層別化において高い正解率を示した(それぞれの交差検証AUC=0.81およびAUC=0.85;
図2c)。
【0065】
これらのmiRNAベースのバイオマーカーの複雑性をさらに減らすために、本発明者らは、C1高侵襲性疾患を同定するために14-および19-miRNAシグネチャーの同じ正解率を可能にする最小セットのmiRNAを探した。
【0066】
i)miRNAの分子機能は、この場合はC1/非C1腫瘍において差次的に発現されるものである標的化mRNAのネットワークに依存しており、ii)予後バイオマーカーは腫瘍進行に関与している機構に機能的に関連づけるべきであるという仮定を行った。従って本発明者らは、DESeq2(方法の箇所を参照)によってC1-ADCにおいて有意に(p<0.05)調節されることが分かった200種類のmiRNAのセットおよび2900種類のmRNA遺伝子のセットを用いて、ARACNe(正確な細胞ネットワークの再構築のためのアルゴリズム)(方法の箇所を参照)を行うことにより、C1腫瘍を特徴づけるmiRNA-mRNAインタラクトームを探求した。本発明者らの分析は、技術的ばらつきを減らすためにDESeq2によって同定された遺伝子に限定した。
【0067】
以下の規則を適用してC1 miRNA-mRNAインタラクトームを再構築した。すなわち、1)本発明者らは、ステージIのためにC1腫瘍のみで産生され、かつ特異的であるが排他的ではないmiRNA-mRNA対(N=2858)を選択し、2)本発明者らはC1遺伝子を標的化することが予測されるmiRNA(N=1787)を選択し、3)C1遺伝子とは逆の発現傾向を有し(N=598)、4)本発明者らは少なくとも3種類のC1遺伝子と相互作用するmiRNA(N=528)を選択した。
【0068】
同定したmiRNA-mRNAネットワークのうち、本発明者らは、19-miRNAおよび14-miRNAシグネチャーの両方から得られた「ハブ」としての7種類のmiRNAと相互作用するネットワークのセットを発見した(表2および
図2d)。この7-miRNAシグネチャー(表S2)の階層的クラスタリング分析は、より高侵襲性のC1腫瘍における全体的に増加した発現を示した(
図2e)。重要なことに、7-miRNAシグネチャーは、他の2種類のシグネチャーに匹敵し(
図3a)、かつ本発明者らがC1予測確率における差を考慮した場合(
図3b)、C1/非C1患者層別化において0.79の交差検証AUCを有していた。全ての3種類のシグネチャー(7-、14-および19-miRNA)から予測されるC1クラスは、10-遺伝子によって同定されたC1患者に匹敵するリスクの増加と共に、全ステージの患者において死亡の危険の3年の有意な増加を示した(表3)。しかし本発明者らがステージIのADC患者への分析に焦点を当てた場合、本発明者らは、C1患者について死亡リスクの約2倍の増加と共に、7-miRNAシグネチャーによって最良のリスク層別化が保持されることを示すスコアを得た(HR=2.11;95%信頼区間:1.11~4.00;p=0.0223)(表3)。極めて興味深いことに、癌進行に関連する分子機構を表す遺伝子セットに多く含まれているこれらの7種類のmiRNAによって標的化される遺伝子のネットワークが有意であることが分かり(FDR q値<0.0001)、これにより本発明者らの初期の仮説が実証された(
図3c)。
【0069】
BRBから得られたモデルの14種類のmiRNAのうちの12種を含むBRB-ArrayToolsによって同定された90種類のmiRNAの大部分(87/90、97%)がDESeq2によって発見された200-miRNAセットに含まれているにも関わらず、本発明者らはこの90-miRNAセットを用いてARACNeも行った。重複していない3種類のmiRNAのうちhsa-miR-210-3pのみが、本発明者らが先に記載した全ての選択フィルタを通過した。しかし本発明者らはこのさらなるmiRNAを7-miRNAシグネチャーに追加し、かつC1/非C1患者層別化において交差検証を行った場合、予測性能は同じままであった(すなわち、AUC=0.79)。
【表4】
【表5】
【表6】
【0070】
2.7-miRNAシグネチャーの検証
最後に本発明者らは、IRCCS Casa Sollievo della Sofferenza病院(CSS)で集めた44人の肺腺癌患者の外部コホートに対して7種類のmiRNAシグネチャーの検証を行った。表1は、TCGA-LUADコホート(54%)に対して、CSSにおいてステージIの腫瘍の過剰提示(70%)を強調するCSSコホートの患者および腫瘍特性を示す。本発明者らは10-遺伝子シグネチャーを用いてFFPE試料のqRT-PCR分析を行い、相対的リスクスコアを計算してコホートをC1(N=16)および非C1(N=28)群(
図3d)に層別化した(方法の箇所を参照)。次に本発明者らは、TaqMan Advanced miRNAアッセイを用いてqRT-PCR分析を行って、44人のADCの同じコホートにおいて7-miRNAシグネチャーもプロファイルし、ロジスティック回帰を用いて本発明者らは、7-miRNAシグネチャーの発現プロファイルに基づいてモデルを再導出した(表S2)。7-miRNAモデルは、0.76のAUC(
図3e)およびC1予測確率における有意差(p=0.0028)(
図3f)でC1を非C1腫瘍から層別化した。注目すべきことに、本発明者らが分析をステージI腫瘍に限定した場合、本発明者らは0.81のAUC(
図3e)およびC1予測確率における有意差(p=0.0108)(
図3f)を示すスコアを得た。以下に報告されている表4~表7は、同定されたmiRNAシグネチャーの詳細、それらの受入番号(mirbase.org)、それらの配列、調節傾向(C1対非C1)および使用したモデルの重みを提供している。
【表7】
アッセイは、TCGA-LUAD RNAシークエンシング実験において各miRNAを同定するために使用されるコードを指し、Acc.成熟miRNAは、成熟miRNAのmiRBase受入番号を指し、配列は成熟miRNAのヌクレオチド配列を指し、miRbase IDは、miRbaseデータベースにおける成熟miRNAの名称を指し、比は、C1-ADC試料における各miRNAの発現中央値を非C1-ADC試料における発現中央値で割ることにより計算した倍数変化を指し、p値は、C1-ADC試料と非C1-ADC試料とを比較するDESeq2のWald検定から計算した。全てのmiRNAはBenjamini-Hochberg調整に基づくq値<0.05を有し、モデルの重みは予測されるクラスを計算するために使用される方程式における係数を指す。
【表8】
アッセイは、TCGA-LUAD RNAシークエンシング実験において各miRNAを同定するために使用されるコードを指し、Acc.成熟miRNAは成熟miRNAのmiRBase受入番号を指し、配列は成熟miRNAのヌクレオチド配列を指し、miRbase IDはmiRbaseデータベースにおける成熟miRNAの名称を指し、比はC1-ADC試料における各miRNAの発現中央値を非C1-ADC試料における発現中央値で割ることにより計算した倍数変化を指し、p値はC1-ADC試料と非C1-ADC試料とを比較するBRB-ArrayToolsのパラメトリック試験から計算する。全てのmiRNAは100回の並べ替えに基づくq値<0.05を有し、モデルの重みは予測されるクラスを計算するために使用される方程式における係数を指す。
【表9】
アッセイはCSS qRT-PCRシークエンシング実験において各miRNAを同定するために使用されるコードを指し、Acc.成熟miRNAは成熟miRNAのmiRBase受入番号を指し、配列は成熟miRNAのヌクレオチド配列を指し、miRbase IDはmiRbaseデータベースにおける成熟miRNAの名称を指し、比はC1-ADC試料における各miRNAの発現中央値を非C1-ADC試料における発現中央値で割ることにより計算した倍数変化を指し、p値はC1-ADC試料と非C1-ADC試料とを比較するウィルコクソン検定から計算し、モデルの重みは予測されるクラスを計算するために使用される方程式における係数を指す。
【表10】
アッセイはTCGA-LUAD RNAシークエンシング実験において各miRNAを同定するために使用されるコードを指し、Acc.成熟miRNAは成熟miRNAのmiRBase受入番号を指し、配列は成熟miRNAのヌクレオチド配列を指し、miRbase IDはmiRbaseデータベースにおける成熟miRNAの名称を指し、比はC1-ADC試料における各miRNAの発現中央値を非C1-ADC試料における発現中央値で割ることにより計算した倍数変化を指し、p値は、C1-ADC試料と非C1-ADC試料とを比較するDESeq2のWald検定から計算した。全てのmiRNAはBenjamini-Hochberg調整に基づくq値<0.05を有し、モデルの重みは予測されるクラスを計算するために使用される方程式における係数を指す。
【0071】
3種類のシグネチャーのロジスティック回帰のパラメータおよびC1もしくは非C1群中の患者の群を含めるために使用される式が以下に表されている。
【0072】
モデル19-miRNA(RNAシークエンシング):
z=-8.2029+(-0.2651*hsa-let-7c-3p)+(0.1709*hsa-miR-138-5p)+(0.1443*hsa-miR-193b-5p)+(0.0200*hsa-miR-196a-5p)+(0.0464*hsa-miR-196b-5p)+(0.2297*hsa-miR-203a-3p)+(0.1285*hsa-miR-215-5p)+(0.3933*hsa-miR-2355-3p)+(-0.2220*hsa-miR-30d-3p)+(-0.1874*hsa-miR-30d-5p)+(0.1535*hsa-miR-31-3p)+(0.0326*hsa-miR-31-5p)+(-0.3032*hsa-miR-4709-3p)+(-0.1672*hsa-miR-548b-3p)+(0.1529*hsa-miR-550a-5p)+(0.1132*hsa-miR-582-3p)+(0.5229*hsa-miR-584-5p)+(0.1314*hsa-miR-675-3p)+(0.0497*hsa-miR-9-5p)
【0073】
モデル14-miRNA(RNAシークエンシング):
z=-5.4414+(-0.1028*hsa-miR-135b-5p)+(-0.0486*hsa-miR-187-3p)+(0.2828*hsa-miR-192-5p)+(0.1977*hsa-miR-193b-3p)+(0.0201*hsa-miR-196b-5p)+(0.1908*hsa-miR-210-3p)+(-0.5074*hsa-miR-29b-2-5p)+(0.0384*hsa-miR-3065-3p)+(-0.3312*hsa-miR-30d-5p)+(-0.0475*hsa-miR-375-3p)+(0.1895*hsa-miR-582-3p)+(0.5606*hsa-miR-584-5p)+(0.2663*hsa-miR-708-5p)+(0.0435*hsa-miR-9-5p)
【0074】
モデル7-miRNA(RNAシークエンシング):
z=-8.5210+(0.1171*hsa-miR-193b-3p)+(0.2233*hsa-miR-193b-5p)+(0.1341*hsa-miR-196b-5p)+(0.1554*hsa-miR-31-3p)+(0.0584*hsa-miR-31-5p)+(0.3622*hsa-miR-550a-5p)+(0.4683*hsa-miR-584-5p)
【0075】
モデル7-miRNA(qRT-PCR):
z=2.2920+(hsa-miR-193b-3p*0.1295)+(hsa-miR-193b-5p*0.0920)+(hsa-miR-196b-5p*-0.1310)+(hsa-miR-31-3p*-0.2116)+(hsa-miR-31-5p*-0.2724)+(hsa-miR-550a-5p*0.2717)+(hsa-miR-584-5p*0.0413)
【0076】
本明細書に示されている式を使用して、上に報告されているモデルを用いて選択された患者の予測されるクラスを同定する。
【数2】
【0077】
4.他の14-および19-miRNAシグネチャーから得られたAUCの評価
そこから7種類のmiRNAシグネチャーが得られた14-および19-miRNAシグネチャーが肺癌のより高侵襲性のサブタイプ(C1)を同定するために最も有効であることを実証するために、本発明者らは等しい長さ(14および19のmiRNA長さ)のランダムシグネチャーから得られた期待されるAUC分布に対して14-および19-miRNAモデルのAUCを比較した(
図4)。特に本発明者らは、
・BRB-Array Toolsに従って差次的に発現されない292種類のmiRNA(表8)からの14種類のmiRNAの100ランダムリスト、
・当該モデルの14種類のmiRNAを除外するBRB-Array Toolsに従って差次的に発現される76種類のmiRNA(表9)からの14種類のmiRNAの100ランダムリスト、
・DESeq2 toolに従って差次的に発現されない182種類のmiRNA(表10)からの19種類のmiRNAの100ランダムリスト、
・当該モデルの19種類のmiRNAを除外するDESeq2 toolに従って差次的に発現される181種類のmiRNA(表11)からの19種類のmiRNAの100ランダムリスト
を生成した。
【表11】
【表12】
【表13】
【表14】
【0078】
選択されたシグネチャーのために使用される同じロジスティック回帰を各ランダムリストに適用し、対応するモデル性能をAUCにより評価した。
【0079】
図4に示すように、これらのランダムシグネチャーを用いて得られたAUCはどれも14-および19-miRNAモデルを用いて得られたAUCほど高くはなく、これは、モデル選択のために適用される方法が肺癌のC1サブタイプの診断用の最良のセットのmiRNAを同定するために最も有効であることを実証している(
図4)。
【0080】
材料および方法
本発明者らは、2018年時点のTCGAデータポータル(https://portal.gdc.cancer.gov/)から515人の肺腺癌を有する患者のコホートを選択した。遺伝子およびmiRNA発現の両方のために全部で510の腫瘍をプロファイルした。発現分析のためにLog2リードカウントを使用した。生存分析のために患者の経過観察情報を使用した。全生存期間は腫瘍再選択日からあらゆる原因での死亡までの時間として定めた。経過観察を3年で打ち切って、肺癌特有の死亡率に関する全死亡率の潜在的な過大評価を低下させた。
【0081】
510人の患者のコホート全体について、10-遺伝子シグネチャーに基づく階層的クラスタリング分析を行った。クラスタリングは、非中心相関(uncentered correlation)および重心連結(centroid linkage)ならびにJava TreeViewソフトウェア環境(バージョン1.1.6r4;http://jtreeview.sourceforge.net)と共にMac OS XのためのCluster 3.0(C CLUSTERING LIBRARY 1.56)を用いて行った。4つの主流派を選択してクラスターを構築した。カプラン・マイヤー生存曲線をクラスターにより層別化し、ログランク試験p値を計算した。C1クラスターをより悪い予後に関連づけ、全ての他のクラスターを1つにまとめた(非C1クラスター)。
【0082】
TCGA-LUADデータセット(2237種類のmiRNA)の複雑性を減らし、かつ最も有益なデータを抽出して使用し、本発明者らは最も転写調節されたmiRNAを選択した。本発明者らは、C1もしくは非C1のいずれかの少なくとも50%の患者において生カウント>0であるmiRNAを選択し、全部で382種類のmiRNAを同定した。本発明者らは複雑性低減を遺伝子にも適用し、本発明者らは全ての試料の中で最も変化しているもの(上位25%の標準偏差)を選択し、全部で4899種類の遺伝子を同定した。DESeq2 Rパッケージを用いて本発明者らは、全部で2900のC1腫瘍と非C1腫瘍との間で差次的に発現される遺伝子を同定した。
【0083】
miRNA発現によるクラス予測(C1クラスター対非C1クラスター)のために、BRB-ArrayTools[10]およびDESeq2(Rパッケージ)[11]ツールを使用した。BRB-ArrayToolsは、多変量並べ替え検定(1000回のランダム並べ替え)、偽発見率評価の80%の信頼レベル、偽陽性遺伝子の0.05の最大許容割合と共に2サンプルt検定に基づく統計を使用する。DESeq2は、差次的に発現される転写物を同定するためにWald検定統計に基づいている。その後にBRB-ArrayToolsおよびDESeq2ツールから得られた差次的に発現されるmiRNAのリストをLasso正則化により減らした。詳細には、離散結果としてのクラスター(C1クラスター対非C1クラスター)および説明変数としてのmiRNA発現を考慮して、ペナルティ付き無条件ロジスティック回帰を適用した。チューニングペナルティパラメータの最適化(50回のシミュレーション)と共に交差検証した(10倍の)対数尤度を使用して潜在的な過剰適合を制御した。
【0084】
差次的に発現される遺伝子(DESeq2で同定)およびmiRNA(DESeq2およびBRB-ArrayToolsの両方で同定)から開始して、本発明者らは1000回のブートストラップと共にARACNe[12]を使用して、転写調節因子(すなわちmiRNA)と標的遺伝子との直接的な調節関係を推測した。ARACNeは全ての患者、すなわちステージIの患者およびステージII~IVの患者を用いて行った。miRNA標的遺伝子はmiRWalk3.0[13]を用いて検索した。
【0085】
19、14および7種類のmiRNAの3種類のシグネチャーについて、無条件ロジスティック回帰を用いてC1クラスターに含まれる確率を推測した。交差検証した受信者動作特性下面積を使用し、かつC1患者と非C1患者とのC1予測確率における差を評価することによりモデル性能を評価した(ウィルコクソン・マンホイットニー検定)。Cox回帰モデルを使用して、これらのmiRNAシグネチャーの予後規則および元の10-遺伝子シグネチャーのリスク層別化を再現するそれらの能力を評価した。
【0086】
7-miRNAモデルの生物学における洞察を得るために、本発明者らはそれらの標的遺伝子に関連づけられた癌関連経路のエンリッチメントを確認する。本発明者らはCGP(化学的および遺伝的摂動、3358個の遺伝子セット)を調査することにより、87種類の標的化遺伝子のリストを用いてMolecular Signature Database(MSigDB;v7.2)(https://www.gsea-msigdb.org/gsea/msigdb/annotate.jsp)を調べた。JMP15.2.1(SAS)ソフトウェアを用いてバブルプロット分析を行った。
【0087】
510人の患者、すなわち入手可能なmiRNA発現データを有するものについて、7-miRNAシグネチャーの階層的クラスタリング分析を行った。非中心相関および重心連結、およびJava TreeViewソフトウェア環境(バージョン1.1.6r4;http://jtreeview.sourceforge.net)と共に、Mac OS XのためのCluster 3.0(C Clustering Library 1.56)を用いてクラスタリングを行った。
【0088】
7種類のmiRNAシグネチャーをリスク層別化のために最良のものとして同定し、従ってIRCCS Casa Sollievo della Sofferenza病院(CSS、サン・ジョヴァンニ・ロトンド、イタリア)からの患者の外部コホートにおいて検証した。2017年2月から2020年2月までに、44人の肺腺癌を有する患者がCSSで外科手術を受けた。書面のインフォームドコンセントを全ての研究患者から得た。これらの患者の中に術前化学療法を受けたものはいなかった。医療記録の見直しにより臨床的情報を得た。患者の居住地のVital Records Officesを通して、あるいは患者または彼らの家族に直接連絡をとることにより生命状態を評価した。
【0089】
病理学者によって選択された適切な腫瘍細胞性(>60%)を有する代表的な腫瘍領域におけるFFPEブロックからの1つの組織コア(直径が1.5mm)をトータルRNA抽出のために処理した。トータルRNA抽出のためにAllPrep DNA/RNA FFPEキット(QIAGEN)を使用した。定量的リアルタイムPCR(qRT-PCR)を行って、10-遺伝子シグネチャーをDamaら[6]に記載されているように分析した。簡単に言うと、Nanodrop ND-10000分光光度計を用いてRNAを定量化し、SuperScript VILO cDNA合成キット(Thermo Fisher Scientific社)を用いて全部で200ngを逆転写し、製造業者の説明書に従ってPreAmp Master Mixキット(ThermoFisher Scientific社)を用いて10回のサイクルのために予め増幅した。QuantStudio 12k Flex(ThermoFisher Scientific社)において、TaqMan Fast Advance Master Mixおよび加水分解プローブ(ThermoFisher Scientific社;プライマーについてはDamaら[6]を参照)を用いて、1:10で希釈した予め増幅したcDNAから開始してqRT-PCR分析を行った。95℃で30秒間の最初のインキュベーション、その後に95℃で5秒間および60℃で30秒間の45サイクルでサーマルサイクリングによる増幅を行った。miRNA発現分析のために、TaqMan Advanced miRNA cDNA合成キット(ThermoFisher Scientific社)を用いて全部で10ngのRNAを逆転写した。製造業者の説明書[15](すなわち:95℃で30秒間、95℃で5秒間および60℃で30秒間の45サイクル)に従い、QuantStudio 12k Flex(ThermoFisher Scientific社)中のCard Custom Advance(ThermoFisher Scientific社)を用いて、Poly(A)テーリング、アダプターライゲーション、RT反応およびmiR-Amp(TaqMan Advanced miRNA Assayを用いる)を行った。
【0090】
先に記載されている方法[6]を用いてCT正規化のために、hsa-miR-16-5pを標準参照として使用した。簡単に言うと、各試料(j)の各miRNA(i)の正規化CTを生Ctijと各試料(j)に特有のスケーリング係数(SF)との差として計算し、SFjは試料(j)において参照として使用されるmiRNA「hsa-miR-16-5p」の生Ctと21.87に等しい定数との差を表した。
【0091】
Damaら[6]に記載されている10-遺伝子リスクモデルに基づいてリスクスコアを各患者に割り当てた。リスクモデルを適用する前に、データを再スケーリングした(q1-q3の正規化)。66パーセンタイル(6)よりも高いリスクスコアを有する患者をC1腫瘍として分類した。次に説明変数として7種類のmiRNAを用いる無条件ロジスティック回帰(C1対非C1腫瘍)を適用し、受信者動作特性下面積を計算した。ウィルコクソン・マンホイットニー検定によりC1患者と非C1患者とのC1予測確率における差を評価した。
【0092】
全ての統計分析は、SASソフトウェアのバージョン9.4(SAS Institute社、ノースカロライナ州ケーリー)ならびにR3.3.1(R Core Team、2016)およびJMP15(SAS)を用いて行った。0.05未満のp値は統計的に有意であるとみなした。
【表15】
アッセイはqRT-PCR実験において各miRNAを同定するために使用されるコードを指し、「Acc.成熟miRNA」は成熟miRNAのmiRBase受入番号を指し、「miRbase ID」はmiRbaseデータベースにおける成熟miRNAの名称を指し、「シグネチャー」は各miRNAが属する特異的なシグネチャーを指し、「ハウスキーピングmiRNA」はqRT-PCR実験を正規化するために使用されるmiRNAであり、「スパイクイン」miRNAはqRT-PCR実験の性能を制御するために使用されるmiRNAである。
【0093】
参考文献
1. Bray, F.; Ferlay, J.; Soerjomataram, I.; Siegel, R.L.; Torre, L.A.; Jemal, A. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA: A Cancer Journal for Clinicians 2018, 68, 394-424, doi:10.3322/caac.21492.
2. The National Lung Screening Trial Research Team Reduced Lung-CancerMortality with Low-Dose Computed Tomographic Screening. N Engl J Med 2011, 365, 395-409, doi:10.1056/NEJMoa1102873.
3. de Koning, H.J.; van der Aalst, C.M.; de Jong, P.A.; Scholten, E.T.; Nackaerts, K.; Heuvelmans, M.A.; Lammers, J.-W.J.; Weenink, C.; Yousaf-Khan, U.; Horeweg, N.; et al. Reduced Lung-Cancer Mortality with Volume CT Screening in a Randomized Trial. New England Journal of Medicine 2020, 382, 503-513, doi:10.1056/NEJMoa1911793.
4. Siegel, R.L.; Miller, K.D.; Jemal, A. Cancer statistics, 2020. CA: A Cancer Journal for Clinicians 2020, 70, 7-30, doi:10.3322/caac.21590.
5. Bianchi, F.; Nuciforo, P.; Vecchi, M.; Bernard, L.; Tizzoni, L.; Marchetti, A.; Buttitta, F.; Felicioni, L.; Nicassio, F.; Fiore, P.P.D. Survival prediction of stage I lung adenocarcinomas by expression of 10 genes. J Clin Invest 2007, 117, 3436-3444, doi:10.1172/JCI32007.
6. Dama, E.; Melocchi, V.; Dezi, F.; Pirroni, S.; Carletti, R.M.; Brambilla, D.; Bertalot, G.; Casiraghi, M.; Maisonneuve, P.; Barberis, M.; et al. An Aggressive Subtype of Stage I Lung Adenocarcinoma with Molecular and Prognostic Characteristics Typical of Advanced Lung Cancers. Clin Cancer Res 2017, 23, 62-72, doi:10.1158/1078-0432.CCR-15-3005.
7. Li, J.; Smyth, P.; Flavin, R.; Cahill, S.; Denning, K.; Aherne, S.; Guenther, S.M.; O’Leary, J.J.; Sheils, O. Comparison of miRNA expression patterns using total RNA extracted from matched samples of formalin-fixed paraffin-embedded (FFPE) cells and snap frozen cells. BMC Biotechnology 2007, 7, 36, doi:10.1186/1472-6750-7-36.
8. Hall, J.S.; Taylor, J.; Valentine, H.R.; Irlam, J.J.; Eustace, A.; Hoskin, P.J.; Miller, C.J.; West, C.M.L. Enhanced stability of microRNA expression facilitates classification of FFPE tumour samples exhibiting near total mRNA degradation. British Journal of Cancer 2012, 107, 684-694, doi:10.1038/bjc.2012.294.
9. Jung, M.; Schaefer, A.; Steiner, I.; Kempkensteffen, C.; Stephan, C.; Erbersdobler, A.; Jung, K. Robust MicroRNA Stability in Degraded RNA Preparations from Human Tissue and Cell Samples. Clin Chem 2010, 56, 998-1006, doi:10.1373/clinchem.2009.141580.
10. Simon, R.; Lam, A.; Li, M.-C.; Ngan, M.; Menenzes, S.; Zhao, Y. Analysis of Gene Expression Data Using BRB-Array Tools. Cancer Inform 2007, 3, 11-17.
11. Love, M.I.; Huber, W.; Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology 2014, 15, 550, doi:10.1186/s13059-014-0550-8.
12. Lachmann, A.; Giorgi, F.M.; Lopez, G.; Califano, A. ARACNe-AP: gene network reverse engineering through adaptive partitioning inference of mutual information. Bioinformatics 2016, 32, 2233-2235, doi:10.1093/bioinformatics/btw216.
13. Sticht, C.; Torre, C.D.L.; Parveen, A.; Gretz, N. miRWalk: An online resource for prediction of microRNA binding sites. PLOS ONE 2018, 13, e0206239, doi:10.1371/journal.pone.0206239.
14. Bianchi et al. A serum circulating miRNA diagnostic test to identify asymptomatic high-risk individuals with early stage lung cancer. Embo Mol. Med. 3 (2011), 495-503.
15. https://www.thermofisher.com/order/catalog/product/A25576
16. Vautrot V, Behm-Ansmant I. Enhanced Probe-Based RT-qPCR Quantification of MicroRNAs Using Poly(A) Tailing and 5' Adaptor Ligation. Methods Mol Biol. 2020;2065:39-54. doi: 10.1007/978-1-4939-9833-3_4. PMID: 31578686.
17. Schmittgen TD, Lee EJ, Jiang J, Sarkar A, Yang L, Elton TS, Chen C. Real-time PCR quantification of precursor and mature microRNA. Methods. 2008 Jan;44(1):31-8. doi: 10.1016/j.ymeth.2007.09.006. PMID: 18158130; PMCID: PMC2663046.
【手続補正書】
【提出日】2023-08-14
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】配列表
【補正方法】追加
【補正の内容】
【配列表】
【国際調査報告】