(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-02-21
(45)【発行日】2022-03-02
(54)【発明の名称】標的遺伝子発現の数学的モデリングを使用するNFkB細胞シグナリング経路活性の評価
(51)【国際特許分類】
C12Q 1/686 20180101AFI20220222BHJP
C12Q 1/6813 20180101ALI20220222BHJP
C12Q 1/6876 20180101ALI20220222BHJP
C12N 15/12 20060101ALI20220222BHJP
G01N 33/50 20060101ALI20220222BHJP
G01N 33/15 20060101ALI20220222BHJP
G06F 17/00 20190101ALI20220222BHJP
【FI】
C12Q1/686 Z
C12Q1/6813 Z ZNA
C12Q1/6876 Z
C12N15/12
G01N33/50 P
G01N33/15 Z
G06F17/00
(21)【出願番号】P 2018507571
(86)(22)【出願日】2016-08-12
(86)【国際出願番号】 EP2016069237
(87)【国際公開番号】W WO2017029215
(87)【国際公開日】2017-02-23
【審査請求日】2019-08-08
(32)【優先日】2015-08-14
(33)【優先権主張国・地域又は機関】EP
【前置審査】
(73)【特許権者】
【識別番号】590000248
【氏名又は名称】コーニンクレッカ フィリップス エヌ ヴェ
【氏名又は名称原語表記】KONINKLIJKE PHILIPS N.V.
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】ファン オーイェン,ヘンドリク ヤン
【審査官】白井 美香保
(56)【参考文献】
【文献】特表2014-520566(JP,A)
【文献】国際公開第2014/102668(WO,A2)
【文献】米国特許出願公開第2004/0180341(US,A1)
【文献】Funct Integr Genomics.,2013年,Vol.13,pp.143-154
【文献】BLOOD,2005年,Vol.106, No.4,pp.1392-1399
【文献】NFκB activity, function, and target-gene signatures in primary mediastinal large B-cell lymphoma and diffuse large B-cell lymphoma subtypes, Supplementary Information,Blood,2005年,Vol.106, No.4,pp.1-13
【文献】GeneChip Human Genome Arrays, The most comprehensive coverage of all well-substantiated genes in the human genome,AFFYMETRIX Data Sheet [online],2004年,https://www.affymetrix.com/support/technical/datasheets/human_datasheet.pdf,[令和2年6月17日検索]
(58)【調査した分野】(Int.Cl.,DB名)
C12Q1/00-3/00
Pubmed
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAPLUS/BIOSIS/MEDLINE/WPIDS/EMBASE(STN)
(57)【特許請求の範囲】
【請求項1】
結腸サンプル中で測定されたNFkB細胞シグナリング経路の7個の標的遺伝子の発現レベルに少なくとも基づいて、前記NFkB細胞シグナリング経路の活性を推測するステップを含む方法であって、前記推測するステップは、
前記サンプル中のNFkB転写因子(TF)要素のレベルを決定するステップであって、前記NFkB TF要素は、前記NFkB細胞シグナリング経路の7個の標的遺伝子の転写を制御し、当該決定するステップは、前記NFkB細胞シグナリング経路の7個の標的遺伝子の発現レベルを前記NFkB TF要素のレベルに関連付ける数学的モデルを評価することに少なくとも部分的に基づき、前記7個の標的遺伝子は、CCL5、CXCL2、ICAM1、IL6、IL8、NFKBIA、及びTNFAIP2である、ステップと
前記サンプル中のNFkB TF要素の決定されたレベルに基づいて、前記NFkB細胞シグナリング経路の活性を推測するステップと
を含み、
前記推測するステップは、前記数学的モデルを使用して
デジタルプロセッサによって実施される、方法。
【請求項2】
前記NFkB細胞シグナリング経路の推測された活性に基づいて、前記NFkB細胞シグナリング経路が異常に作動しているかどうかを決定するステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記NFkB細胞シグナリング経路の異常な作動を補正する薬物の処方を推奨するステップをさらに含み、
前記推奨するステップが、前記NFkB細胞シグナリング経路の推測された活性に基づいて、前記NFkB細胞シグナリング経路が異常に作動していると決定される場合にのみ実施される、請求項2に記載の方法。
【請求項4】
以下の活動
:
前記NFkB細胞シグナリング経路の推測された活性に基づく薬効の予測、
前記NFkB細胞シグナリング経路の推測された活性に基づく有害作用の予測
、
薬剤開発、
アッセイ開発、
経路研究
、
前記NFkB細胞シグナリング経路の推測された活性に基づく臨床試験への登録、
実施されるべき後続試験の選択、及び
コンパニオン診断試験の選択、
のうちの少なくとも1つにおいて使用される、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記数学的モデルが、前記NFkB TF要素と、前記サンプル中で測定されたNFkB細胞シグナリング経路の7個の標的遺伝子の発現レベルとを関連付ける条件付確率に少なくとも部分的に基づく確率モデルであるか、又は、前記数学的モデルが、前記サンプル中で測定されたNFkB細胞シグナリング経路の7個の標的遺伝子の発現レベルの1つ又は複数の線形結合に少なくとも部分的に基づく、請求項1から4のいずれか一項に記載の方法。
【請求項6】
デジタルプロセッサと、
前記デジタルプロセッサによって実行されるときに前記デジタルプロセッサに請求項1から5のいずれか一項に記載の方法を実施させるためのプログラムコード手段を含むコンピュータプログラムを格納した非一時的記憶媒体と、
を含む装置。
【請求項7】
デジタルプロセッサによって実行されるときに前記デジタルプロセッサに請求項1から5のいずれか一項に記載の方法を実施させるためのプログラムコード手段を含む、コンピュータプログラム。
【請求項8】
結腸サンプル中のNFkB細胞シグナリング経路の7個の標的遺伝子の発現レベルを測定するためのキットであって、
前記7個のNFkB標的遺伝子に対するポリメラーゼ連鎖反応プライマー、
前記7個のNFkB標的遺伝子に対するプローブ、及び
任意選択で、請求項6に記載の装
置又は請求項
7に記載のコンピュータプログラム
を含み、
前記7個のNFkB標的遺伝子が、CCL5、CXCL2、ICAM1、IL6、IL8、NFKBIA、及びTNFAIP2である、キット。
【請求項9】
前記プローブが配列番号46、49、52、55及び58の少なくとも1つを含み、且つ/又は前記プライマーが、配列番号44及び45、47及び48、50及び51、53及び54、並びに56及び57の少なくとも1つを含む、請求項
8に記載のキット。
【請求項10】
結腸サンプル中のNFkB細胞シグナリング経路の7個の標的遺伝子の発現レベルを測定するためのキットであって、
前記NFkB細胞シグナリング経路の7個の標的遺伝子の発現レベルを決定するための1つ又は複数の構成要素、及び、
請求項6に記載の装
置又は請求項
7に記載のコンピュータプログラム
を含み、
前記1つ又は複数の構成要素が、マイクロアレイチップ、抗体、複数のプローブ、RNAシークエンシング及びプライマーセットを含む群から選択され、
前記NFkB細胞シグナリング経路の7個の標的遺伝子が、CCL5、CXCL2、ICAM1、IL6、IL8、NFKBIA、及びTNFAIP2であり、
前記複数のプローブは、前記7個の標的遺伝子に対するプローブである、キット。
【請求項11】
請求項1から5のいずれか一項に記載の方法の実施における、請求項
8から
10のいずれか一項に記載のキットの使用。
【請求項12】
前記確率モデルは、ベイジアンネットワークモデルである、請求項5に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に、バイオインフォマティクス、ゲノミックプロセシング、プロテオミックプロセシング及び関連技術の分野に関する。より詳細には、本発明は、サンプル中で測定されたNFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルに少なくとも基づいて、NFkB細胞シグナリング経路の活性を推測することを含む方法に関する。本発明はさらに、そのような方法を実施するように構成されたデジタルプロセッサを含む装置、そのような方法を実施するために、デジタルプロセシングデバイスによって実行可能な命令を格納する非一時的記憶媒体、及びデジタルプロセシングデバイスにそのような方法を実施させるためのプログラムコード手段を含むコンピュータプログラムに関する。本発明はさらに、発現レベルを測定するためのキットに関する。
【背景技術】
【0002】
ゲノミック及びプロテオミック解析は、様々な癌が、癌の成長及び進化、例えば、細胞増殖及び転移において役割を果たす特定の遺伝子に関するゲノム突然変異/変異及び/又は高若しくは低発現レベルの特定の組み合わせと関連することが知られている、腫瘍学などの医療分野における臨床応用に関して、かなりの実現された潜在的な将来性を持つ。
【0003】
核内因子カッパB(NFkB又はNFκB)は、免疫応答に関与する多くの遺伝子の発現を調節する誘導性転写因子である。NFkB細胞シグナリング経路は、免疫応答、炎症応答及び急性相応答に関与する重要な細胞シグナリング経路であるが、細胞の生存、増殖及びアポトーシスの制御にも関与する。健常な非活性化細胞では、5遺伝子(NFKB1又はp50/p105、NFKB2又はp52/p100、RELA又はp65、REL及びRELB)に由来する二量体を含むNFkB細胞シグナリング経路関連転写因子は、NFkBのインヒビター(IkB)との相互作用により主に細胞質内にあるので、転写的に不活性なままであり、したがって、NFkB細胞シグナリング経路を不活性に保つ。上流シグナリングカスケードの活性化の際に、IkBはリン酸化され、プロテアソームによってユビキチン依存的分解を受け、NFkB二量体は核に移行し、ここで転写因子として働く。この標準的なNFkB細胞シグナリング経路に加えて、NFkB調節性転写を開始することができる別経路も存在する(
図1参照;C=標準経路;AP=別経路;PS=プロテアソーム;NC=核)。本明細書では、用語「NFkB細胞シグナリング経路」は、好ましくは、上述のNFkB転写因子の転写活性につながる任意のシグナリングプロセスを指す。
【0004】
NFkB細胞シグナリング経路の活性は、異なる種類の癌に関係すること、及び癌細胞の生存促進性(pro-survival)表現型を支持することが知られているが、NFkB細胞シグナリング経路の活性を評価するのに利用可能な臨床的アッセイはない。したがって、無秩序なNFkB細胞シグナリング経路によって少なくとも部分的に引き起こされ、したがって、NFkB細胞シグナリング経路の阻害剤に応答する可能性がある癌、例えば、びまん性大細胞B細胞リンパ腫(DLBCL)、多発性骨髄腫、別の血液起源又は固形の腫瘍、例えば、乳房腫瘍、黒色腫又は前立腺腫瘍を有する患者を特徴づけすることの可能性を高めることができることが望ましい。
【0005】
Y.Xing,F.Zhou及びJ.Wang、「Subset of genes targeted by transcription factor NF-κB in TNF-stimulated human HeLa cells」、Functional and Integrative Genomics、13巻、1号、143~154頁(2013)は、TNFα刺激HeLa細胞におけるNF-κBの直接標的遺伝子(DTG)が、ChIP-Seq、RNAi及び遺伝子発現プロファイリング技法を使用して同定されたことを主張する研究を開示している。
【0006】
F.Feuerhakeら、「NFκB activity,function、and target-gene signatures in primary mediastinal large B-cell lymphoma and diffuse large B-cell lymphoma subtypes」、Blood、106巻、4号、1392~1399頁(2005)は、縦隔原発B細胞性大細胞型リンパ腫(MLBCL)は、パイロットシリーズでの核内因子κB(NFκB)のサブユニットc-REL(細網内皮症ウイルスオンコジーンホモログ)の核局在性を含めた臨床的及び分子的特色を古典的ホジキンリンパ腫と共有することを開示している。本発明者らは、さらなる原発性MLBCLにおいてc-RELの細胞内局在を解析し、MLBCL細胞系におけるNFκBの活性及び機能を特徴づけした。
【0007】
US2004/0180341A1は、RKIPモチーフの存在によって定義されるタンパク質ファミリーの転写調節に関する。RKIPモチーフを含むタンパク質は、シグナル伝達経路に含まれるキナーゼをモジュレートする。RKIPモチーフを含むタンパク質の転写調節は、RKIPファミリー媒介性調節を受けるシグナル伝達経路をモジュレートするのに有用な薬剤を同定するためのスクリーニングアッセイの、並びにRKIPファミリー媒介性調節を受ける経路の不適切な活性を伴う障害の診断及び治療の基礎となる。
【発明の概要】
【0008】
本発明は、本明細書で開示される新規且つ改善された方法及び装置を提供する。
【0009】
本発明の主な態様によれば、上記の問題は、標的遺伝子発現の数学的モデリングを使用してNFkB細胞シグナリング経路の活性を推測する方法によって解決され、すなわち、
サンプル中で測定されたNFkB細胞シグナリング経路の6個以上、例えば、7個、8個、9個、10個、11個又は12個以上の標的遺伝子の発現レベルに少なくとも基づいて、NFkB細胞シグナリング経路の活性を推測するステップを含む方法であって、推測するステップは、
サンプル中のNFkB転写因子(TF)要素のレベルを決定するステップであって、NFkB TF要素は、NFkB細胞シグナリング経路の6個以上の標的遺伝子の転写を制御し、決定するステップは、NFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルをNFkB TF要素のレベルに関連付ける数学的モデルを評価することに少なくとも部分的に基づき、6個以上の標的遺伝子は、BCL2L1、BIRC3、CCL2、CCL3、CCL4、CCL5、CCL20、CCL22、CX3CL1、CXCL1、CXCL2、CXCL3、ICAM1、IL1B、IL6、IL8、IRF1、MMP9、NFKB2、NFKBIA、NFKBIE、PTGS2、SELE、STAT5A、TNF、TNFAIP2、TNIP1、TRAF1及びVCAM1を含む群から選択される、ステップと
サンプル中のNFkB TF要素の決定されたレベルに基づいて、NFkB細胞シグナリング経路の活性を推測するステップと
を含み、
推測するステップは、数学的モデルを使用してデジタルプロセシングデバイスによって実施される、方法によって解決される。
【0010】
本明細書では、TF要素の「レベル」は、その標的遺伝子の転写に関するTF要素の活性のレベルを示す。
【0011】
本発明は、NFkB細胞シグナリング経路において生じる作用を特定する適切な方法が、NFkB細胞シグナリング経路のシグナリング出力(なかでもNFkB細胞シグナリング経路によって制御されるNFkB転写因子(TF)要素による標的遺伝子の転写)の測定に基づき得るという本発明者らの認識に基づく。本発明者らによる認識は、TFレベルが、サンプルにおいて準定常状態(これは、なかでも標的遺伝子の発現値によって検出することができる)であると仮定する。本明細書で標的にされるNFkB細胞シグナリング経路は、異なる種類の癌と関連すること、及びNFkB細胞シグナリング経路が細胞増殖及び細胞生存のプロセスを制御する遺伝子を調節することが知られているように、癌細胞の生存促進性表現型を支持することが知られている。多くの異なる種類のヒト腫瘍は、NFkB細胞シグナリング経路の無秩序な活性を有することが見出されている。さらに、研究によって、構成的NFkB細胞シグナリング経路活性の阻害が癌性細胞の発癌能を阻止することが示された。
【0012】
本発明は、(i)サンプル中のNFkB TF要素のレベルを決定するステップであって、決定は、その転写がNFkB TF要素によって制御されている、NFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルをNFkB TF要素のレベルと関連付ける数学的モデルを評価することに少なくとも部分的に基づく、ステップ、及び(ii)サンプル中のNFkB TF要素の決定されたレベルに基づいて、NFkB細胞シグナリング経路の活性を推測するステップによって、NFkB細胞シグナリング経路の活性を決定することを可能にする。これは、好ましくは、無秩序なNFkB細胞シグナリング経路によって少なくとも部分的に引き起こされ、したがって、NFkB細胞シグナリング経路の阻害剤に応答する可能性がある癌、例えば、びまん性大細胞B細胞リンパ腫(DLBCL)、多発性骨髄腫、別の血液起源又は固形の腫瘍、例えば、乳房腫瘍、黒色腫又は前立腺腫瘍を有する患者を特徴づけすることの可能性を高めることを可能にする。本発明の重要な利点は、異なる時点で抽出した複数のサンプルを必要とするのではなく、単一サンプルを使用して、NFkB細胞シグナリング経路の活性を決定することを可能にすることである。
【0013】
本明細書では、NFkB転写因子(TF)要素は、特定のDNA配列に結合することができ、それによって標的遺伝子の転写を制御する、NFkBメンバー(NFKB1又はp50/p105、NFKB2又はp52/p100、RELA又はp65、REL及びRELB)の少なくとも1つ又は好ましくは二量体を含むタンパク質複合体であると定義される。
【0014】
数学的モデルは、NFkB TF要素と、サンプル中で測定されたNFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルとを関連付ける条件付確率に少なくとも部分的に基づく確率モデル、好ましくはベイジアンネットワークモデルでもよく、又は数学的モデルは、サンプル中で測定されたNFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルの1つ又は複数の線形結合に少なくとも部分的に基づいてもよい。特に、NFkB細胞シグナリング経路の活性の推測は、国際特許出願公開WO2013/011479A2(「Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression」)に開示されるように、又は国際特許出願公開WO2014/102668A2(「Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions」)に開示されるように実施してもよく、これらの内容はその全体が本明細書に組み込まれる。標的遺伝子発現の数学的モデリングを使用する細胞シグナリング経路活性の推測に関するさらなる詳細は、Verhaegh W.ら、「Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways」、Cancer Research、74巻、11号、2014、2936~2945頁に見出すことができる。
【0015】
ベイジアンネットワークモデルなどの確率モデルを使用することによって、条件付確率関係を使用してNFkB細胞シグナリング経路に関する既存情報を組み込むことが可能になる。これは、NFkB細胞シグナリング経路の(包括的よりもむしろ)部分的な知識及び一般的にはある種の不確実性を有して測定される生物学的測定に基づく情報の組み込みも含む。これに対して、発現レベルの1つ又は複数の線形結合に少なくとも部分的に基づく数学的モデルの使用は、NFkB細胞シグナリング経路の活性を推測するための、非常に簡単でコンピュータ計算が容易な方法を提供することができる。
【0016】
NFkB細胞シグナリング経路の推測された活性は、対象、特に、対象の組織及び/又は細胞及び/又は体液に関連する可能性があり、本明細書で使用する場合、用語「対象」は、サンプルが対象のサンプルである場合、任意の生物を指す。いくつかの実施形態では、対象は動物、好ましくは哺乳動物である。ある種の実施形態では、対象はヒト、好ましくは医学的対象である。一方で、細胞系、初代細胞培養又はオルガノイド培養からサンプルが得られる場合は、推測された活性は、細胞系、初代細胞培養又はオルガノイド培養が薬物、化学物質又は物理的処理による1つ又は複数の処理にかけられた場合に可能性がある処理効果とともに、細胞系、初代細胞培養又はオルガノイド培養が由来する最初のサンプルが対象から抽出された時点の対象の代表に過ぎない可能性がある。さらに、「標的遺伝子」は、「直接標的遺伝子」及び/又は「間接標的遺伝子」でもよい(本明細書に記載する通り)。
【0017】
特に適切な標的遺伝子は、本明細書中の以下の一節及び以下の実施例に記載される(例えば表1を参照されたい)。
【0018】
したがって、好ましい実施形態によれば、標的遺伝子は、表1に列挙される標的遺伝子を含む群から選択される。
【0019】
6個以上の標的遺伝子が、CXCL2、ICAM1、IL6、CCL5、NFKBIA、IL8、TNFAIP2、CXCL3、MMP9、NFKB2、CCL20、CCL2、CXCL1、TNF、IRF1、TRAF1、NFKBIE、VCAM1及びBIRC3を含む群から選択される方法が特に好ましく、好ましくは、6個以上の標的遺伝子は、CXCL2、ICAM1、IL6、CCL5、NFKBIA、IL8、TNFAIP2、CXCL3、MMP9、NFKB2、CCL20、CCL2及びCXCL1を含む群から選択される、3個以上、例えば、4個、5個、6個、7個、8個又は9個以上の標的遺伝子を含み、より好ましくは、3個以上の標的遺伝子は、CXCL2、ICAM1、IL6、CCL5、NFKBIA、IL8及びTNFAIP2を含む群から選択される。
【0020】
これらの標的遺伝子は、本発明者らによって行われた広範な文献調査に基づく新規な方法論を使用して選択され、実施例2でより詳細に記載されるように、これは、選択された標的遺伝子がNFkB細胞シグナリング経路の活性の推測に関して優れた根拠を提供することを示した。好都合なことに、NFkB細胞シグナリング経路の活性を推測するために複数の標的遺伝子が使用されるので、NFkB細胞シグナリング経路の活性のより確固たる推測を達成することができる。
【0021】
本発明の別の態様は、NFkB細胞シグナリング経路の推測された活性に基づいて、NFkB細胞シグナリング経路が異常に作動しているかどうかを決定することをさらに含む、(本明細書に記載される)方法に関する。
【0022】
例えば、無秩序なNFkB細胞シグナリング経路によって少なくとも部分的に引き起こされる癌を有する患者において、NFkB細胞シグナリング経路が異常に作動しているかを決定することによって、そのような患者を効率的且つ信頼できる方法によって特徴づけすることができる。別の変形形態では、(本明細書に記載される)方法を使用して、TNFα又はLPSのような特定の刺激剤を用いて又は用いずに、例えば癌患者のサンプルに由来する細胞系を特徴づけすることができる。
【0023】
本発明は、NFkB細胞シグナリング経路の異常な作動を補正する薬物の処方を推奨することをさらに含み、
NFkB細胞シグナリング経路の推測された活性に基づいて、NFkB細胞シグナリング経路が異常に作動していると決定される場合のみ推奨が実施される、(本明細書に記載される)方法にも関する。
【0024】
そうすることによって、例えば、NFkB細胞シグナリング経路の阻害剤に依拠する薬物のみが、そのような阻害剤に応答する可能性がある癌を有する患者に推奨されることが、より良く保証される。その点で、そこから利益を得られない可能性がある患者がそのような薬物を不必要に摂取することを避けることができ、その一方で、療法応答の機会が最適化される。
【0025】
本発明は、推測することが、サンプル中で測定された、NFkB細胞シグナリング経路の一連の標的遺伝子の6個以上の標的遺伝子の発現レベルに少なくとも基づいて、NFkB細胞シグナリング経路の活性を推測すること以下を含む、(本明細書に記載される)方法にも関する。
【0026】
好都合なことに、NFkB細胞シグナリング経路の活性を推測するために複数の標的遺伝子が使用されるので、NFkB細胞シグナリング経路の活性のより確固たる推測を達成することができる。
【0027】
本発明に従って使用されるサンプル(複数可)は、抽出されたサンプル、すなわち、対象から抽出されたサンプルでもよい。サンプルの例としては、限定されないが、対象の組織、生検材料、細胞、血液及び/又は体液が挙げられる。サンプルは、例えば、癌病変部から、又は癌が疑われる病変部から、又は転移性腫瘍から、又は癌細胞が混入している流体が存在する体腔(例えば、胸腹腔若しくは腹腔若しくは膀胱腔)から、又は癌細胞を含む他の体液などから、好ましくは生検法又は他のサンプル抽出法によって、得られるサンプルでもよい。サンプルが抽出される細胞はまた、血液悪性腫瘍(例えば、白血病又はリンパ腫)からの腫瘍細胞でもよい。ある場合には、細胞サンプルはまた、循環性腫瘍細胞、すなわち、血流に入っており、適切な分離技法、例えばアフェレーシス又は従来の静脈採血を使用して抽出することができる腫瘍細胞でもよい。血液は別にして、サンプルが抽出される体液は、尿、胃腸内容物又は血管外遊出物でもよい。本明細書で使用する場合、用語「サンプル」は、例えば、対象の組織及び/又は細胞及び/又は体液が対象から採取され、例えば顕微鏡スライド上に置かれている場合、並びに特許請求される方法を実施するために、このサンプルの一部が、例えば、レーザーキャプチャーマイクロダイセクション(LCM)によって、又は目的の細胞をスライドから削り取ることによって、又は蛍光活性化セルソーティング技法によって抽出される場合も包含する。さらに、本明細書で使用する場合、用語「サンプル」は、例えば、対象の組織及び/又は細胞及び/又は体液が対象から採取され、顕微鏡スライド上に置かれ、請求される方法がスライド上で実施される場合も包含する。
【0028】
別の開示される態様によれば、装置は、本明細書に記載の本発明による方法を実施するように構成されるデジタルプロセッサを含む。
【0029】
別の開示される態様によれば、非一時的記憶媒体は、本明細書に記載の本発明による方法を実施するために、デジタルプロセシングデバイスによって実行可能な命令を格納する。非一時的記憶媒体は、コンピュータ可読記憶媒体、例えば、ハードドライブ若しくは他の磁気記憶媒体、光学ディスク若しくは他の光学記憶媒体、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、フラッシュメモリ、又は他の電子記憶媒体、ネットワークサーバなどでもよい。デジタルプロセシングデバイスは、ハンドヘルドデバイス(例えば、パーソナルデータアシスタント又はスマートフォン)、ノートブックコンピュータ、デスクトップコンピュータ、タブレットコンピュータ又はデバイス、リモートネットワークサーバなどでもよい。
【0030】
別の開示される態様によれば、コンピュータプログラムがデジタルプロセシングデバイスにおいて実行される場合、コンピュータプログラムは、デジタルプロセシングデバイスに本明細書に記載の本発明による方法を実施させるためのプログラムコード手段を含む。デジタルプロセシングデバイスは、ハンドヘルドデバイス(例えば、パーソナルデータアシスタント又はスマートフォン)、ノートブックコンピュータ、デスクトップコンピュータ、タブレットコンピュータ又はデバイス、リモートネットワークサーバなどでもよい。
【0031】
別の開示される態様によれば、シグナルは、NFkB細胞シグナリング経路の推測された活性を示し、推測された活性は、本明細書に記載の本発明による方法を実施することから生じる。このシグナルは、デジタルシグナルでもよく、又はアナログシグナルでもよい。
【0032】
別の開示される態様によれば、サンプル中のNFkB細胞シグナリング経路の6個以上、例えば、7個、8個、9個、10個、11個又は12個以上の標的遺伝子の発現レベルを測定するためのキットは、
6個以上のNFkB標的遺伝子に対するポリメラーゼ連鎖反応プライマー、
6個以上のNFkB標的遺伝子に対するプローブ、及び、
任意選択で、本明細書に記載の本発明による方法を実施するように構成されるデジタルプロセッサを含む装置、本明細書に記載の本発明による方法を実施するために、デジタルプロセシングデバイスによって実行可能な命令を格納する非一時的記憶媒体、又は、デジタルプロセシングデバイスにおいて実行される場合、デジタルプロセシングデバイスに、本明細書に記載の本発明による方法を実施させるためのプログラムコード手段を含むコンピュータプログラム、
を含み、
6個以上のNFkB標的遺伝子は、BCL2L1、BIRC3、CCL2、CCL3、CCL4、CCL5、CCL20、CCL22、CX3CL1、CXCL1、CXCL2、CXCL3、ICAM1、IL1B、IL6、IL8、IRF1、MMP9、NFKB2、NFKBIA、NFKBIE、PTGS2、SELE、STAT5A、TNF、TNFAIP2、TNIP1、TRAF1及びVCAM1を含む群から選択される。
【0033】
好ましくは、
6個以上の標的遺伝子は、CXCL2、ICAM1、IL6、CCL5、NFKBIA、IL8、TNFAIP2、CXCL3、MMP9、NFKB2、CCL20、CCL2、CXCL1、TNF、IRF1、TRAF1、NFKBIE、VCAM1及びBIRC3を含む群から選択され、より好ましくは、6個以上の標的遺伝子は、CXCL2、ICAM1、IL6、CCL5、NFKBIA、IL8、TNFAIP2、CXCL3、MMP9、NFKB2、CCL20、CCL2及びCXCL1を含む群から選択される、3個以上、例えば、4個、5個、6個、7個、8個又は9個以上の標的遺伝子を含み、より好ましくは、3個以上の標的遺伝子は、CXCL2、ICAM1、IL6、CCL5、NFKBIA、IL8及びTNFAIP2を含む群から選択される。
【0034】
好ましくは、
プローブは、配列番号46、49、52、55及び58の少なくとも1つを含み、且つ/又はプライマーは、配列番号44及び45、47及び48、50及び51、53及び54、並びに56及び57の少なくとも1つを含む。
別の開示される態様によれば、サンプル中のNFkB細胞シグナリング経路の6個以上、例えば、7個、8個、9個、10個、11個又は12個以上の標的遺伝子の発現レベルを測定するためのキットは、
NFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルを決定するための1つ又は複数の構成要素、及び、
本明細書に記載の本発明による方法を実施するように構成されるデジタルプロセッサを含む装置、本明細書に記載の本発明による方法を実施するために、デジタルプロセシングデバイスによって実行可能な命令を格納する非一時的記憶媒体、又は、デジタルプロセシングデバイスにおいて実行される場合、デジタルプロセシングデバイスに、本明細書に記載の本発明による方法を実施させるためのプログラムコード手段を含むコンピュータプログラム、
を含み、
1つ又は複数の構成要素は、好ましくは、マイクロアレイチップ(例えば、DNAアレイチップ、オリゴヌクレオチドアレイチップ、タンパク質アレイチップ)、抗体、複数のプローブ、RNAシークエンシング及びプライマーセットを含む群から選択され、
NFkB細胞シグナリング経路の6個以上の標的遺伝子は、BCL2L1、BIRC3、CCL2、CCL3、CCL4、CCL5、CCL20、CCL22、CX3CL1、CXCL1、CXCL2、CXCL3、ICAM1、IL1B、IL6、IL8、IRF1、MMP9、NFKB2、NFKBIA、NFKBIE、PTGS2、SELE、STAT5A、TNF、TNFAIP2、TNIP1、TRAF1及びVCAM1を含む群から選択される。
【0035】
好ましくは、
6個以上の標的遺伝子は、CXCL2、ICAM1、IL6、CCL5、NFKBIA、IL8、TNFAIP2、CXCL3、MMP9、NFKB2、CCL20、CCL2、CXCL1、TNF、IRF1、TRAF1、NFKBIE、VCAM1及びBIRC3を含む群から選択され、より好ましくは、6個以上の標的遺伝子は、CXCL2、ICAM1、IL6、CCL5、NFKBIA、IL8、TNFAIP2、CXCL3、MMP9、NFKB2、CCL20、CCL2及びCXCL1を含む群から選択される、3個以上、例えば、3個以上、例えば、4個、5個、6個、7個、8個又は9個以上の標的遺伝子を含み、最も好ましくは、3個以上の標的遺伝子は、CXCL2、ICAM1、IL6、CCL5、NFKBIA、IL8及びTNFAIP2を含む群から選択される。
【0036】
そのようなキットを用いて、NFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルを単純で快適な方法で決定することができる。好都合なことに、NFkB細胞シグナリング経路の活性を推測するために複数の標的遺伝子が使用されるので、NFkB細胞シグナリング経路の活性のより確固たる推測を達成することができる。
【0038】
別の開示される態様によれば、本明細書に記載の本発明のキットは、本明細書に記載の本発明の方法の実施において使用される。
【0039】
本明細書に記載の本発明は、例えば、好都合なことに、
NFkB細胞シグナリング経路の推測された活性に基づく診断、
NFkB細胞シグナリング経路の推測された活性に基づく予後診断、
NFkB細胞シグナリング経路の推測された活性に基づく薬物処方、
NFkB細胞シグナリング経路の推測された活性に基づく薬効の予測、
NFkB細胞シグナリング経路の推測された活性に基づく有害作用の予測、
薬効のモニタリング、
薬剤開発、
アッセイ開発、
経路研究、
癌進行度分類、
NFkB細胞シグナリング経路の推測された活性に基づく臨床試験への登録、
実施されるべき後続試験の選択、及び
コンパニオン診断試験の選択
に関して使用することもできる。
【0040】
さらなる利点は、添付の図面、以下の記載を読み理解すれば、特に下記に提供する詳細な実施例を読めば、当業者に明らかとなるであろう。
【0041】
請求項1に記載の方法、請求項7に記載の装置、請求項8に記載の非一時的記憶媒体、請求項9に記載のコンピュータプログラム、請求項10から14に記載のキット及び請求項15に記載のキットの使用は、特に従属請求項に記載されるように、同様及び/又は同一の好適な実施形態を有することを理解されたい。
【0042】
本発明の好ましい実施形態は、従属請求項又は上記実施形態と各独立請求項との任意の組み合わせでもよいことを理解されたい。
【0043】
本発明のこれら及び他の態様は、以下に記載の実施形態を参照して説明され、明らかになろう。
【図面の簡単な説明】
【0044】
【
図1】NFkB活性化の概略的且つ例示的な標準経路及び別経路を示す図である(Dolcet X.ら、「NFkB in development and progression of human cancer」、Virchows Archives、446巻、第5号、2005、475~482頁を参照されたい)。
【
図2】NFkB細胞シグナリング経路の転写プログラムをモデル化するのに使用される、概略的且つ例示的な数学的モデル(本明細書ではベイジアンネットワークモデル)を示す図である。
【
図3】NFkB細胞シグナリング経路の標的遺伝子の証拠精選リスト(evidence curated list)(表1を参照)に基づく、例示的ベイジアンネットワークモデルの訓練結果を示す図である。
【
図4】NFkB細胞シグナリング経路の19個の標的遺伝子のショートリスト(表2を参照)に基づく、例示的ベイジアンネットワークモデルの訓練結果を示す図である。
【
図5】NFkB細胞シグナリング経路の13個の標的遺伝子のショートリスト(表3を参照)に基づく、例示的ベイジアンネットワークモデルの訓練結果を示す図である。
【
図6】NFkB細胞シグナリング経路の7個の標的遺伝子ショートリスト(表4を参照)に基づく、例示的ベイジアンネットワークモデルの訓練結果を示す図である。
【
図7】GSE34171からのびまん性大細胞B細胞リンパ腫(DLBCL)サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図8】様々な刺激時間にわたって様々なTNFα濃度で刺激した、E-MTAB-1312からの正常ヒト気管支上皮(NHBE)細胞系サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図9】様々な刺激時間にわたって様々なTNFα濃度で刺激した、E-MTAB-1312からの正常ヒト気管支上皮(NHBE)細胞系サンプルに対する、19個の標的遺伝子のショートリスト(表2参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図10】様々な刺激時間にわたって様々なTNFα濃度で刺激した、E-MTAB-1312からの正常ヒト気管支上皮(NHBE)細胞系サンプルに対する、13個の標的遺伝子のショートリスト(表3参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図11】様々な刺激時間にわたって様々なTNFα濃度で刺激した、E-MTAB-1312からの正常ヒト気管支上皮(NHBE)細胞系サンプルに対する、7個の標的遺伝子のショートリスト(表4参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図12】THP-1単核球細胞に対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図13】GSE4183からの結腸サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図14】GSE4183からの結腸サンプルに対する、19個の標的遺伝子のショートリスト(表2参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図15】GSE4183からの結腸サンプルに対する、13個の標的遺伝子のショートリスト(表3参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図16】GSE4183からの結腸サンプルに対する、7個の標的遺伝子のショートリスト(表4参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図17】GSE10890からの乳癌細胞系に対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図18】GSE20565からの卵巣サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図19】E-MTAB-1006からの乳癌サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図20】カプランマイヤープロットで示された、神経膠腫患者(GSE16011)の予後を示す図である。標的遺伝子の証拠精選リスト(表1参照)を使用する訓練した例示的ベイジアンネットワークモデルを用いる。
【
図21】標的遺伝子の証拠精選リスト(表1参照)に基づく、例示的線形モデルの訓練結果を示す図である。
【
図22】様々な刺激時間にわたって様々なTNFα濃度で刺激した、E-MTAB-1312からの正常ヒト気管支上皮(NHBE)細胞系サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的線形モデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図23】GSE4183からの結腸サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的線形モデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図24】NFkB細胞シグナリング経路の推定上の標的遺伝子の(表6参照)広範な文献リストに基づく、例示的ベイジアンネットワークモデルの訓練結果を示す図である。
【
図25】様々な刺激時間にわたって様々なTNFα濃度で刺激した、E-MTAB-1312からの正常ヒト気管支上皮(NHBE)細胞系サンプルに対する、NFkB細胞シグナリング経路の推定上の標的遺伝子の広範な文献リスト(表6参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【
図26】GSE4183からの結腸サンプルに対する、NFkB細胞シグナリング経路の推定上の標的遺伝子の広範な文献リスト(表6参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す図である。
【発明を実施するための形態】
【0045】
以下の実施例は、特に好ましい方法及びそれに関連する選択された態様を例示するに過ぎない。そこに提供される教示は、例えば、1つ又は複数の細胞シグナリング経路の異常な活性を検出する、予測する及び/又は診断するために、いくつかの試験及び/又はキットを構築するのに使用することができる。さらに、本明細書に記載の方法を使用すると、例えば、(コンパニオン診断試験のような)実施されるべき後続試験(複数可)を選択するために、薬物処方を有利に導くことができ、薬物応答予測並びに薬効(及び/又は有害作用)のモニタリングを行うことができ、薬剤耐性を予測及びモニタリングすることができる。以下の実施例は、本発明の範囲を限定するものと解釈されるべきでない。
【実施例1】
【0046】
数学的モデルの構築
国際特許出願公開WO2013/011479A2(「Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression」)に詳述されるように、確率モデル、例えば、ベイジアンネットワークモデルを構築すること、及び細胞シグナリング経路(本明細書では、NFkB細胞シグナリング経路)の6個以上の標的遺伝子の発現レベルと転写因子(TF)要素(本明細書では、NFkB TF要素)(TF要素は細胞シグナリング経路の6個以上の標的遺伝子の転写を制御する)のレベルとの間の条件付確率関係を組み込むことによって、そのようなモデルを使用して、高い正確性で細胞シグナリング経路の活性を決定することができる。さらに、条件付確率を調整すること及び/又はさらなる情報源を示すために新たなノードをモデルに追加することによって、確率モデルを、後の臨床研究によって得られるさらなる知識を組み込むように容易に更新することができる。このようにして、最新の医学知識を統合するために、必要に応じて確率モデルを更新することができる。
【0047】
国際特許出願公開WO2013/011479A2(「Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions」)に詳述されている、理解及び解釈するのが容易な別のアプローチでは、細胞シグナリング経路(本明細書では、NFkB細胞シグナリング経路)の活性は、細胞シグナリング経路の6個以上の標的遺伝子の発現レベルと転写因子(TF)要素(本明細書ではNFkB TF要素)(TF要素は、細胞シグナリング経路の6個以上の標的遺伝子の転写を制御する)のレベルの間の関係を組み込む線形又は(擬似)線形モデルを構築及び評価することによって決定することができ、モデルは、6個以上の標的遺伝子の発現レベルの1つ又は複数の線形結合に少なくとも部分的に基づく。
【0048】
両アプローチにおいて、6個以上の標的遺伝子の発現レベルは、好ましくは、mRNAレベルの測定値でもよく、これは、例えば、(RT)PCR及び標的遺伝子のmRNA配列に関連するプローブを使用するマイクロアレイ技法の結果、並びにRNAシークエンシングの結果でもよい。別の実施形態では、6個以上の標的遺伝子の発現レベルは、タンパク質レベル、例えば、標的遺伝子がコードするタンパク質(複数可)の濃度及び/又は活性によって測定することができる。
【0049】
前述の発現レベルは、場合により、アプリケーションにより適する場合もあるし適さない場合もある多くの方法で変換することができる。例えば、マイクロアレイベースのmRNAレベルなどの発現レベルの4つの異なる変換は以下のものでもよい:
- 「連続データ」、すなわち、MAS5.0及びfRMAなどの周知のアルゴリズムを使用してマイクロアレイを前処理した後に得られるような発現レベル、
- 「z-スコア」、すなわち、全サンプルの平均が0であり、標準偏差が1であるようにスケーリングされる連続発現レベル、
- 「離散」、すなわち、ある閾値を超える全発現が1に設定され、それを下回る全発現が0に設定される(例えば、プローブセットに対する閾値を、ある数の正の臨床サンプルと同数の負の臨床サンプルのセットにおけるその値の中央値として選ぶことができる)、
- 「ファジー」、すなわち、連続発現レベルが、次のフォーマットのシグモイド関数を使用して0と1の間の値に変換される:1/(1+exp((thr-expr)/se))(exprは連続発現レベルであり、thrは前述の閾値であり、seは、0と1の間の差に影響する軟化パラメータである)。
【0050】
構築され得る最も単純な線形モデルの1つは、転写因子(TF)要素(本明細書ではNFkB TF要素)を示すノードを第1層に、及び例えばマイクロアレイ又は(q)PCR実験において特定の標的遺伝子と特に高く相関する1つのプローブセットによる標的遺伝子の発現レベルの直接測定結果を示す重み付きノードを第2層に有するモデルである。重みは、訓練データセットからの計算に基づいてもよいし、又は専門的知識に基づいてもよい。標的遺伝子あたり複数の発現レベルが測定されるかもしれない場合(例えば、1つの標的遺伝子が複数のプローブセットで測定され得るマイクロアレイ実験の場合)、標的遺伝子あたり1つの発現レベルのみを使用するこのアプローチは、特に単純である。特定の標的遺伝子に対して使用される1つの発現レベルを選択する特定の方法は、訓練データセットの活性サンプルと不活性サンプルを最もよく分離することができるプローブセットからの発現レベルを使用することである。このプローブセットを決定する1つの方法は、統計的検定、例えばt検定を実施し、最も低いp値を有するプローブセットを選択することである。最も低いp値を有するプローブセットの訓練データセットの発現レベルは、定義により、(既知の)活性及び不活性サンプルの発現レベルが重なる確率が最も低いプローブセットである。別の選択法はオッズ比に基づく。そのようなモデルでは、6個以上の標的遺伝子のそれぞれについて1つ又は複数の発現レベルが与えられ、1つ又は複数の線形結合は、6個以上の標的遺伝子のそれぞれについて重み付き項を含む線形結合を含み、各重み付き項は、各標的遺伝子に対して与えられる1つ又は複数の発現レベルの1つの発現レベルのみに基づく。上記のように標的遺伝子あたり1つの発現レベルのみが選ばれる場合、モデルは、「最判別プローブセット(most discriminant probesets)」モデルと呼ぶことができる。
【0051】
「最判別プローブセット」モデルの代替として、標的遺伝子あたり複数の発現レベルが測定される可能性がある場合、標的遺伝子あたり与えられるすべての発現レベルを使用することが可能である。そのようなモデルでは、6個以上の標的遺伝子のそれぞれについて1つ又は複数の発現レベルが与えられ、1つ又は複数の線形結合は、6個以上の標的遺伝子について与えられる1つ又は複数の発現レベルのすべての発現レベルの線形結合を含む。言い換えれば、6個以上の標的遺伝子のそれぞれについて、各標的遺伝子に与えられる1つ又は複数の発現レベルのそれぞれを、それ自体の(個々の)重みによって、線形結合において重み付けすることができる。この変形形態は、「全プローブセット」モデルと呼ぶことができる。これは、すべての与えられる発現レベルを使用するが比較的単純であるという利点を持つ。
【0052】
上記の両モデルは、これらが、6個以上の標的遺伝子の1つ又は複数のプローブセットの発現レベルの線形結合に基づいてTF要素のレベルが計算される「単層」モデルとみなされ得るものであるという共通点がある。
【0053】
各モデルを評価することによって、TF要素(本明細書ではNFkB TF要素)のレベルが決定された後、細胞シグナリング経路(本明細書では、NFkB細胞シグナリング経路)の活性を推測するために、決定されたTF要素レベルを閾値処理することができる。そのような適切な閾値を計算するための好ましい方法は、不活性細胞シグナリング経路を有することが知られている訓練サンプルと活性細胞シグナリング経路を有する訓練サンプルの決定されたTF要素レベルwlcを比較することによる。そのようにし、これらの群における分散も考慮する方法は、閾値を用いることによって与えられる。
【0054】
【数1】
式中、σ及びμは、訓練サンプルに対する、決定されたTF要素レベルwlcの標準偏差及び平均である。活性及び/又は不活性訓練サンプルにおいて少数のサンプルのみが利用可能である場合は、2群の分散の平均に基づいて計算された分散に擬似カウントを加えることができる:
【0055】
【数2】
式中、vは群の決定されたTF要素レベルwlcの分散であり、xは正の擬似カウント、例えば1又は10であり、n
act及びn
pasは、それぞれ、活性及び不活性サンプルの数である。分散vの平方根をとることによって標準偏差σが次に得られる。
【0056】
解釈を容易にするために、閾値を決定されたTF要素レベルwlcから減算することができ、この結果、負の値が不活性細胞シグナリング経路に対応し、正の値が活性細胞シグナリング経路に対応する、細胞シグナリング経路の活性スコアが得られる。
【0057】
上記「単層」モデルの代替として、「2層」も一実施例において使用され得る。そのようなモデルでは、その関連プローブセットの測定強度に基づく線形結合を使用して、各標的遺伝子についてサマリー値が計算される(「第1(下)層」)。計算されたサマリー値は、続いて、さらなる線形結合を使用して、細胞シグナリング経路の他の標的遺伝子のサマリー値と結合される(「第2(上)層」)。再度、重みは訓練データセットから学習してもよいし、専門的知識に基づいてもよいし、又はこれらの組み合わせでもよい。言い換えれば、「2層」モデルでは、6個以上の標的遺伝子のそれぞれについて1つ又は複数の発現レベルが与えられ、1つ又は複数の線形結合は、6個以上の標的遺伝子のそれぞれについて、各標的遺伝子について与えられる1つ又は複数の発現レベルのすべての発現レベルの第1の線形結合を含む(「第1(下)層」)。モデルは、さらに、6個以上の標的遺伝子のそれぞれについて重み付き項を含むさらなる線形結合に少なくとも部分的に基づき、各重み付き項は、各標的遺伝子に対する第1の線形結合に基づく(「第2(上)層」)。
【0058】
サマリー値の計算は、「2層」モデルの好ましいバージョンにおいて、訓練データを使用して各標的遺伝子に対して閾値を定義すること、及び計算された線形結合から閾値を減算し、標的遺伝子サマリーを得ることを含むことができる。ここで閾値は、負の標的遺伝子サマリー値がダウンレギュレーションされた標的遺伝子に対応し、正の標的遺伝子サマリー値がアップレギュレーションされた標的遺伝子に対応するように選ぶことができる。また、標的遺伝子サマリー値を、これが「第2(上)層」に結合される前に、例えば上記の変換(ファジー、離散など)のうちの1つを使用して、変換することが可能である。
【0059】
「2層」モデルを評価することによってTF要素のレベルが決定された後、上記のように、細胞シグナリング経路の活性を推測するために、決定されたTF要素レベルを閾値処理することができる。
【0060】
以下では、上記のモデルは、まとめて「(擬似)線形」モデルと示される。確率モデル、例えば、ベイジアンネットワークモデルの訓練及び使用のより詳細な説明は、以下の実施例3にて提供する。
【実施例2】
【0061】
標的遺伝子の選択
転写因子(TF)は、特異的なDNA配列に結合し、それにより、DNAからmRNAへの遺伝情報の転写を制御することによって標的遺伝子からの転写を調節することができる、タンパク質複合体(すなわち、特定の構造体において一緒に結合したタンパク質の組み合わせ)又はタンパク質である。TF複合体のこの作用によって直接生成されるmRNAは、本明細書では、(転写因子の)「直接標的遺伝子」と称される。細胞シグナリング経路の活性化は、「間接標的遺伝子」と称されるさらに多くの二次的遺伝子の転写をもたらすこともできる。以下では、(例示的な数学的モデルとして)細胞シグナリング経路活性とmRNAレベルの間の直接的関連としての直接標的遺伝子を含む又はそれを含む(擬似)線形モデル又はベイジアンネットワークモデルが適切であるが、直接標的遺伝子と間接標的遺伝子の間の区別は必ずしも明らかであるとは限らない。本明細書では、利用可能な科学文献データに基づくスコアリング関数を使用して直接標的遺伝子を選択する方法が提示される。それにもかかわらず、限られた情報並びに生物学的バリエーション及び不確定要素が原因で、間接的標的遺伝子の偶発的選択を除外することができない。標的遺伝子を選択するために、「www.ncbi.nlm.nih.gov/pubmed」でアクセス可能で、本明細書でさらに「Pubmed」と称される、米国国立衛生研究所のMEDLINEデータベースを用いて、標的遺伝子の2つのリストを作成した。
【0062】
2013年の第2四半期及び第3四半期の期間に、(NFkB及び「標的遺伝子」)などのクエリーを使用して推定上のNFkB標的遺伝子を含む刊行物を検索した。より詳細に以下に記載される方法論に従って、得られた刊行物をさらに手作業で解析した。
【0063】
証拠が蓄積された科学実験のタイプに依存して、特定の標的遺伝子に対する科学的証拠に格付けを与えるランキングシステムを使用して、特定の細胞シグナリング経路mRNA標的遺伝子を科学文献から選択した。例えば、NFkB細胞シグナリング経路が活性であることが知られている細胞系のマイクロアレイにおけるプローブセット強度の増大によって検出されるようなmRNAの増大のように、ある実験証拠は遺伝子が直接標的遺伝子であることを単に示唆するに過ぎないが、他の証拠は、同定されたNFkB細胞シグナリング経路TF結合部位と細胞内の特定の細胞シグナリング経路の刺激後のクロマチン免疫沈降(ChIP)アッセイにおけるこの部位の検索と細胞系における細胞シグナリング経路の特異的刺激後のmRNAの増大との組み合わせのように、非常に強力であり得る。
【0064】
特定の細胞シグナリング経路標的遺伝子を見つけるためのいくつかのタイプの実験を科学文献中で特定することができる:
1.目的の細胞シグナリング経路のTFの、ゲノム上のその結合部位への直接結合が示される、ChIP実験。実施例:クロマチン免疫沈降(ChIP)技術を使用することによって、その後、例えば腫瘍壊死因子α(TNFα)又はリポ多糖(LPS)での刺激によるNFkB細胞シグナリング経路の活性誘導を伴う又は伴わない細胞系のDNAにおける推定上の機能的NFkB TF結合部位が、純粋にヌクレオチド配列に基づいて認識される結合部位のサブセットとして同定された。推定上の機能性を、TFがDNA結合部位に結合することが分かったというチップ由来の証拠として特定した。
2.結合配列を含むDNA断片へのTFのインビトロ結合を示す、電気泳動移動度シフト(EMSA)アッセイ。チップベースの証拠と比較して、EMSAベースの証拠は、インビボの状態に変換することができないので、あまり強力ではない。
3.細胞シグナリング経路の刺激及びマイクロアレイ、RNAシークエンシング、定量的PCR又は他の技法を使用するmRNA発現の測定。これらは、NFkB細胞シグナリング経路誘導性細胞系及びタンパク質への翻訳を阻害する(したがって、誘導されたmRNAは直接標的遺伝子であると仮定される)シクロヘキシミドの存在下で誘導後の少なくとも1点、好ましくはいくつかの時点で測定されるmRNAプロファイルの測定を使用する。
4.3と同様であるが、代替として、ウェスタンブロット法などのタンパク質存在量測定法で、さらに下流のmRNA発現を測定する。
5.バイオインフォマティクスアプローチを使用する、ゲノム中のTF結合部位の同定。NFkB TF要素の実施例:NFkB結合モチーフ5’-GGGRNWYYCC-3’(R:A又はG、N:任意のヌクレオチド、W:A又はT、Y:C又はT)を使用して、ヒトゲノム配列に対してソフトウェアプログラムを実行させ、遺伝子のプロモーター領域と他のゲノム領域の両方で潜在的結合部位を同定した。
6.3と同様。ただし、シクロヘキシミドなし。
7.4と同様。ただし、シクロヘキシミドなし。
【0065】
最も単純な形式では、転写因子のNFkBファミリーの標的遺伝子として遺伝子が同定されたこれらの実験的アプローチのそれぞれについて、すべての潜在的遺伝子に1ポイントを与えることができる。この相対的ランキングストラテジーを使用して、最も信頼できる標的遺伝子のリストを作成することができる。
【0066】
或いは、別の方法でのランキングを使用して、インビボでの直接標的遺伝子について最も多くの証拠を提供する技術に多数のポイントを与えることによって、直接標的遺伝子である可能性が最も高い標的遺伝子を同定することができる。上記のリストでは、これは、実験的アプローチ1)に対して8ポイントを、2)に対して7ポイントを、そして実験的アプローチ8)に対して1ポイントの低下を意味すると思われる。そのようなリストは、「標的遺伝子の一般的リスト」と呼ぶことができる。
【0067】
生物学的バリエーション及び不確定要素にもかかわらず、本発明者らは、直接標的遺伝が組織非依存的様式で誘導される可能性が最も高いと仮定した。これらの標的遺伝子のリストは、「標的遺伝子の証拠精選リスト」と呼ぶことができる。そのような標的遺伝子の証拠精選リストを使用して、異なる組織源に由来するサンプルに適用することができる、NFkB細胞シグナリング経路の計算モデルを構築した。
【0068】
以下は、証拠精選標的遺伝子リストの選択が、NFkB細胞シグナリング経路について、具体的にどのように構築されたかを例示的に説明する。
【0069】
刊行物に報告された、ChIP、EMSA、差次的発現、ノックダウン/アウト、ルシフェラーゼ遺伝子レポータアッセイ、配列解析などの実験的証拠の各タイプについてポイントを与えるスコアリング関数を導入した。同じ実験的証拠が複数の刊行物において言及されることがあり、これには、対応する数のポイントをもたらし、例えば、チップの知見に言及する2つの刊行物は、単一のチップ知見に与えられるスコアの2倍をもたらす。さらなる解析を実施して、1つのタイプの実験的証拠、例えば差次的発現のみを有するのではなく、多様なタイプの実験的証拠を有する遺伝子のみを許可した。最後に、すべての推定上のNFkB標的遺伝子について証拠スコアを計算し、5以上の証拠スコアを有するすべての推定上のNFkB標的遺伝子を選択した(表1に示す)。強力で十分な証拠を提供するので、5というカットオフレベルをヒューリスティックに選んだ。
【0070】
本発明者らは、標的遺伝子の証拠精選リスト(表1に列挙)のさらなる選択を行った。訓練サンプルからのNFkB細胞シグナリング経路の活性の決定においてより証拠となることが証明された、証拠精選リストの標的遺伝子を選択した。この選択は、文献証拠スコアと2つの異なるデータセットを使用する訓練結果の組み合わせを使用して実施した。証拠スコアに基づいて3つのランキングを行い、最も高いスコアを第1位にランク付けし、より小さいすべてのポイントをより低いランクにし、すべての含まれるプローブセット(表1参照)の「軟」オッズ比を、GSE12195及びE-MTAB-1312データセットを使用して、本明細書に記載されるように計算した。log2変換した「軟」オッズ比の絶対値を使用して、プローブセットをランク付けし、最も高いオッズ比を第1位にランク付けなどを行った。本明細書に記載のように、GSE12195由来のABC DLBCLサンプルからのサンプルを活性NFkB訓練サンプルとして選び、一方で、このデータセットからの正常サンプルを不活性NFkB訓練サンプルとして選んだ。さらに、別のNFkB訓練データセットであるE-MTAB-1312からのサンプルを使用して、「軟」オッズ比の第2のセットを計算し、対照サンプルを不活性NFkBサンプルとして使用し、様々な濃度のTNFαで2時間刺激したサンプルを活性NFkB訓練サンプルとして選択した。平均ランクに基づいて、平均ランキングが20以下の、少なくとも1つの関連プローブセットを有する標的遺伝子の好ましいセットを、「19個の標的遺伝子ショートリスト」に選択した。平均ランキングが15以下の標的遺伝子のより好ましいセットを「13個の標的遺伝子ショートリスト」に選択した。平均ランキングが12以下の標的遺伝子の最も好ましいセットを、「7個の標的遺伝子ショートリスト」に選択した。19個の標的遺伝子ショートリスト、13個の標的遺伝子ショートリスト及び7個の標的遺伝子ショートリストをそれぞれ表2~4に示す。
表1:NFkB細胞シグナリング経路モデルで使用されるNFkB細胞シグナリング経路の「標的遺伝子の証拠精選リスト」及び標的遺伝子のmRNA発現レベルを測定するために使用される関連プローブセット。
【0071】
【表1】
表2:文献証拠スコア並びにGSE12195及びE-MTAB-1312に対する「軟」オッズ比に基づく、NFkB細胞シグナリング経路の標的遺伝子の「19個の標的遺伝子ショートリスト」。
【0072】
【表2】
表3:文献証拠スコア並びにGSE12195及びE-MTAB-1312に対する「軟」オッズ比に基づく、NFkB細胞シグナリング経路の標的遺伝子の「13個の標的遺伝子ショートリスト」
【0073】
【表3】
表4:文献証拠スコア並びにGSE12195及びE-MTAB-1312に対する「軟」オッズ比に基づく、NFkB細胞シグナリング経路の標的遺伝子の「7個の標的遺伝子ショートリスト」
【0074】
【実施例3】
【0075】
数学的モデルの訓練及び使用
数学的モデルを使用して細胞シグナリング経路(本明細書では、NFkB細胞シグナリング経路)の活性を推測することができるようになる前に、このモデルを適切に訓練しなければならない。
【0076】
数学的モデルが、NFkB TF要素と、サンプル中で測定されたNFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルとを関連付ける条件付確率に少なくとも部分的に基づく確率モデル、例えば、ベイジアンネットワークモデルである場合、訓練は、好ましくは、国際特許出願公開WO2013/011479A2(「Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression」)に詳細に記載されるように実施することができる。
【0077】
数学的モデルが、サンプル中で測定されたNFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルの1つ又は複数の線形結合に少なくとも部分的に基づく場合は、訓練は、好ましくは、国際特許出願公開WO2014/102668A2(「Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions」)に詳細に記載されるように実施することができる。
【0078】
本明細書では、単純な方法でNFkB細胞シグナリング経路の転写プログラムをモデル化するために、
図2に示す例示的ベイジアンネットワークモデルを最初に使用した。このモデルは、以下の3タイプのノードを含み:(a)第1層1における転写因子(TF)要素(「不在」及び「存在」の状態)、(b)第2層2における標的遺伝子TG
1、TG
2、TG
n(「ダウン」及び「アップ」の状態)、並びに(c)標的遺伝子の発現レベルと関連する第3層3における測定ノード。これらは、本明細書で好適に使用されるような、マイクロアレイプローブセットPS
1,1、PS
1,2、PS
1,3、PS
2,1、PS
n,1、PS
n,m(「低」及び「高」の状態)でもよいが、RNAseq又はRT-qPCRのような他の遺伝子発現測定でもよい。
【0079】
本明細書では例示的ベイジアンネットワークモデルである数学的モデルの適切な実装は、マイクロアレイデータに基づく。モデルは、(i)標的遺伝子の発現レベルが、TF要素の活性化にどのように依存するか、及び(ii)次に、プローブセット強度が、各標的遺伝子の発現レベルにどのように依存するかを説明する。後者については、プローブセット強度は、fRMAで前処理したAffymetrix HG-U133Plus2.0マイクロアレイから得ることができ、これは、Gene Expression Omnibus(GEO、www.ncbi.nlm.nih.gov/geo)及びArrayExpress(www.ebi.ac.uk/arrayexpress)から広く利用可能である。
【0080】
例示的ベイジアンネットワークモデルは細胞シグナリング経路(本明細書では、NFkB細胞シグナリング経路)の生物学の単純化であるので、及び生物学的測定値は一般的にはノイズが多いので、確率的アプローチが選択され、すなわち、(i)TF要素と標的遺伝子の間の関係、及び(ii)標的遺伝子とそれらの各プローブセットの間の関係が確率項で説明される。さらに、腫瘍の成長を駆り立てる発癌性細胞シグナリング経路の活性は一過的に及び動的に変化するのでなく、長期に、又は不可逆的にさえ変化することが仮定された。したがって、例示的ベイジアンネットワークモデルは、静的な細胞状態を解釈するために開発された。この理由で、複雑な動的細胞シグナリング経路の特色は、このモデルに組み込まれなかった。
【0081】
いったん例示的ベイジアンネットワークモデルが構築され、較正されると(下記参照)、第3層3における観測としてプローブセット測定値を入力し、TF要素が「存在」である確率がどれほどになるはずであったかをモデルにおいて後向きに推測することによって、このモデルを新規サンプルのマイクロアレイデータに対して使用することができる。ここで、「存在」は、TF要素がDNAに結合しており、細胞シグナリング経路の標的遺伝子の転写を制御している現象であるとみなされ、「不在」は、TF要素が転写を制御していない場合である。したがって、この確率は、細胞シグナリング経路(本明細書では、NFkB細胞シグナリング経路)の活性を示すのに使用することができる一次読出しであり、これは、次に、細胞シグナリング経路が活性であること対細胞シグナリング経路が不活性であることの確率の比をとることによって、細胞シグナリング経路が活性であることのオッズに変換することができる(すなわち、オッズはp/(1-p)で与えられ、この場合、pは細胞シグナリング経路が活性であることの予測確率である)。
【0082】
例示的ベイジアンネットワークモデルでは、確率的関係は、定量的な確率的推論を可能にするために、定量的に作成されている。組織型にわたる汎化作用(generalization behavior)を向上させるために、(i)TF要素と標的遺伝子の間の確率的関係を説明するパラメータを注意深く厳選した。TF要素が「不在」である場合、標的遺伝子が「ダウン」の可能性が最も高く、したがって、これについて0.95という確率が選ばれ、「アップ」である標的遺伝子については0.05という確率が選ばれる。後者(非ゼロ)の確率は、標的遺伝子が他の因子によって調節される、又は標的遺伝子が、(例えば、測定ノイズが原因で)「アップ」であると偶然に観測される、(まれな)可能性を説明するためである。TF要素が「存在」である場合は、0.70という確率を伴って、標的遺伝子は「アップ」とみなされ、0.30という確率を伴って、標的遺伝子は「ダウン」とみなされる。後者の値はこのように選ばれ、これは、例えば、遺伝子のプロモーター領域がメチル化されていることが理由で、TF要素が存在である場合でさえも標的遺伝子が高発現していない、いくつかの原因があり得るからである。標的遺伝子がTF要素によってアップレギュレーションされていないが、ダウンレギュレーションされている場合は、確率は同様の方法で選ばれるが、TF要素の存在にダウンレギュレーションを反映する。(ii)標的遺伝子とそれらの各プローブセットの間の関係を説明するパラメータは、実験的データに基づいて較正した。後者については、本実施例では、活性なNFkB細胞シグナリング経路を有することが知られている患者サンプルからのマイクロアレイデータを使用し、一方で、不活性なNFkB細胞シグナリング経路のサンプルとして、同じデータセットからの正常な健常サンプルを使用したが、これは、細胞シグナリング経路活性の状態が知られている細胞系実験又は他の患者サンプルを使用して実施することもできる。得られた条件付確率表を以下に示す:
【0083】
【0084】
これらの表では、変数ALi,j、AHi,j、PLi,j及びPHi,jは、それぞれ「低」(L)又は「高」(H)プローブセット強度を伴う「不在」(A)又は「存在」(P)の転写複合体を有する較正サンプルの数を示す。0及び1の極端な確率を避けるために、ダミーカウントを加えた。
【0085】
各プローブセットPSi,jについて観測されたプローブセット強度を離散化するために、閾値ti,jを使用し、それ以下ではその観測は「低」と呼ばれ、それ以上では「高」と呼ばれる。この閾値は、使用される較正データセットにおけるプローブセットの(重み付き)中央強度となるように選択された。マイクロアレイデータのノイズ性のために、報告された強度の周囲に(log2スケールで)0.25の標準偏差を有する正規分布を仮定し、閾値の上及び下の確率質量を決定することによって、観測されたプローブセット強度をその閾値と比較する場合にファジー方法を使用した。本明細書では、擬似カウントと組み合わせ、且つ決定論的測定値の代わりに確率質量を使用して計算されるオッズ比を「軟」オッズ比と呼ぶ。
【0086】
標的遺伝子発現の数学的モデリングを使用する細胞シグナリング経路活性の推測に関するさらなる詳細は、Verhaegh W.ら、「Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways」、Cancer Research、74巻、11号、2014、2936~2945頁に見出すことができる。
【0087】
上記の例示的ベイジアンネットワークの代わりに、上記の実施例1に記載される(擬似)線形モデルを用いる場合、試験サンプル中の細胞シグナリング経路活性を推測するためにモデルが使用され得る前に、ノードが「不在」又は「存在」のいずれかであるかをコールするための、ノードと閾値の間の相関の符号及び大きさを示す重みを決定する必要があるであろう。重み及び閾値を先験的に満たすために専門的知識を使用できるが、一般的には、好ましくはグラウンドトゥルースが既知である訓練サンプルの代表セット、例えば、既知の「存在」転写因子複合体(=活性細胞シグナリング経路)又は「不在」転写因子複合体(=不活性細胞シグナリング経路)を有するサンプルにおけるプローブセットの発現データを使用して、モデルは訓練されるであろう。
【0088】
モデル出力(ここでは重み付き線形スコア)が最適化されるように、モデルトポロジーを考慮し、モデルパラメータ(ここでは、重み及び閾値)を変更する多数の訓練アルゴリズム(例えば回帰)が当分野で知られている。或いは、最適化アルゴリズムの必要なく発現観測レベルから直接的に重みを計算することも可能である。
【0089】
本明細書で「白黒」法と名付けた第1の方法は、各重みがセット{-1,0,1}の要素である3進法に帰着する。これを生物学的文脈に置く場合、-1及び1は、それぞれ、細胞シグナリング経路活性の場合、ダウンレギュレーション及びアップレギュレーションされる標的遺伝子又はプローブセットに対応する。プローブセット又は標的遺伝子がアップレギュレーション又はダウンレギュレーションされていることを統計的に証明することができない場合、これは、0の重みを受ける。一例を挙げれば、使用される訓練データを前提として、プローブ又は遺伝子がアップレギュレーション又はダウンレギュレーションされているかどうかを決定するために、活性細胞シグナリング経路サンプルの発現レベル対不活性細胞シグナリング経路を有するサンプルの発現レベルの左側及び右側2標本t検定を使用することができる。活性サンプルの平均が不活性サンプルよりも統計的に大きい、すなわち、p値がある閾値、例えば0.3よりも小さい場合、標的遺伝子又はプローブセットは、アップレギュレーションされると決定される。逆に、活性サンプルの平均が不活性サンプルよりも統計的低い場合は、標的遺伝子又はプローブセットは、細胞シグナリング経路の活性化の際にダウンレギュレーションされると決定される。最も低いp値(左側若しくは右側)が前述の閾値を超える場合は、標的遺伝子又はプローブセットの重みを0であると定義することができる。
【0090】
本明細書で「logオッズ」重みと名付けた第2の方法は、オッズ比の対数(例えば、底e)に基づく。各標的遺伝子又はプローブセットに対するオッズ比は、プローブセット/標的遺伝子レベルが対応する閾値、例えば訓練サンプルの(重み付き)中央値より上及び下である正及び負の訓練サンプルの数に基づいて計算される。ゼロ除算を避けるために、擬似カウントを加えることができる。さらなる精緻化は、プローブセット/標的遺伝子レベルが、例えば、ある特定の標準偏差(例えば、2-logスケールで0.25)を有するその観測値の周囲に正規分布していると仮定し、閾値より上及び下の確率質量をカウントすることによって、いくらかより確率的な方法で閾値より上/下のサンプルをカウントすることである。
【0091】
本明細書では、活性化B細胞様(ABC)、びまん性大細胞B細胞リンパ腫(DLBCL)(活性なNFkB細胞シグナリング経路を有することが知られている)及び不活性なNFkB細胞シグナリング経路を有することが知られている正常細胞(GSE12195、Gene Expression Omnibus(GEO、www.ncbi.nlm.nih.gov/geo、最終アクセス2013年10月9日)から入手可能)からの患者サンプルの発現に対する公的に利用可能なデータを例として使用した。或いは、TNFα及びLPSなどのNFkB活性化剤で刺激された患者サンプル若しくは細胞系及びこれらのNFkB活性化剤が除かれた患者サンプル若しくは細胞系又は他の炎症組織対正常組織、例えばE-MTAB-1312若しくはGSE16650を使用することもできる。
【0092】
図3~6は、それぞれ、NFkB細胞シグナリング経路の、標的遺伝子の証拠精選リスト、19個の標的遺伝子のショートリスト、13個の標的遺伝子のショートリスト及び7個の標的遺伝子ショートリスト(表1~4を参照)に基づく、例示的ベイジアンネットワークモデルの訓練結果を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。活性なNFkB細胞シグナリング経路を有することが知られている活性化B細胞(ABC)群(群1)は活性NFkBラベルが割り当てられ、一方、不活性なNFkB細胞シグナリング経路を有することが知られている正常サンプルを含む群(群7)はNFkB不活性がラベル付けされた。訓練サンプルに対する満点は、すべてのABCが活性である4つすべてのモデル及び不活性なNFkB細胞シグナリング経路を有するすべての正常サンプルについて達成された。当然、モデルに含まれる標的遺伝子が少なくなるにしたがって、訓練サンプルの確率は極端でなくなる。同じデータセット内で、健常な非刺激メモリーB細胞及びナイーブB細胞(それぞれ、群5及び6)が、19個及び7個の標的遺伝子モデルにおいて若干の例外はあるものの、不活性なNFkB細胞シグナリング経路を有すると正確に予想された。胚中心B細胞(GCB)(群4)、濾胞性リンパ腫(群3)、リンパ芽球細胞系(群2)の他のリンパ腫サンプルの大多数及び未知のサブタイプを有するさらなるびまん性大細胞B細胞リンパ腫(DLBCL)サンプル(群8)の1つを除くすべてが、4つすべてのモデルで、活性なNFkB細胞シグナリング経路を有すると予測された。GCBについては、高い割合の腫瘍(>50%)が少なくとも1つのNFkB調節遺伝子に突然変異を有することが知られており、これは、異常なNFkB活性と相関する可能性がある(例えば、Campagno M.ら、「Mutations of multiple genes cause deregulation of NF-kappaB in diffuse large B-cell lymphoma」、Nature、459巻、7247号、2009、717~721頁を参照されたい)。他の研究も、NFkBの構成的活性化はたいていの血液悪性腫瘍の共通の特色であることを指摘し(例えば、Keutgens A.ら、「Deregulated NF-kB activity in haematological malignacies」、Biochemical Pharmacology、72巻、9号、2006、1069~1080頁を参照されたい)、これは、様々な血液悪性腫瘍を含むこれらの群における高い割合のNFkB活性を部分的に説明し得る。(凡例:1-ABC DLBCL;2-リンパ芽球細胞系;3-濾胞性リンパ腫;4-GCB DLBCL;5-メモリーB細胞;6-ナイーブB細胞;7-正常;8-DLBCL未知サブタイプ)
【0093】
以下では、標的遺伝子の証拠精選リスト、19個の標的遺伝子ショートリスト、13個の標的遺伝子ショートリスト及び7個の標的遺伝子ショートリストをそれぞれ使用する、訓練した例示的ベイジアンネットワークモデルの検証結果を
図7~19に示す。
【0094】
図7は、GSE34171からのびまん性大細胞B細胞リンパ腫(DLBCL)サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。すべてのサンプルは、活性なNFkB細胞シグナリング経路を有すると予測された。DLBCLリンパ腫は、異常なNFkB活性を有することが知られている(例えば、Keutgens A.ら、「Deregulated NF-kB activity in haematological malignancies」、Biochemical Pharmacology、72巻、9号、2006、1069~1080頁を参照されたい)。
【0095】
図8~11は、様々な刺激時間にわたって様々なTNFα濃度で刺激した、E-MTAB-1312からの正常ヒト気管支上皮(NHBE)細胞系サンプルに対する、それぞれ、標的遺伝子の証拠精選リスト、19個の標的遺伝子のショートリスト、13個の標的遺伝子のショートリスト及び7個の標的遺伝子のショートリスト(表1~4参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。わずか0.5時間の刺激は、NFkB細胞シグナリング経路が活性になるには明らかに短すぎるが(群5、9及び13)、一方で、4時間より長い刺激(ここでは24時間)(群8、12及び16)は、NFkB細胞シグナリング経路活性を低下させるように思われ、これは、より長い刺激時間が正味のNFkB細胞シグナリング経路活性を弱める非同時的NFkBオシレーションが原因であると予測される(例えば、D.E.Nelsonら、「Oscillations in NF-κB Signaling Control the Dynamics of Gene Expression」、Science、306巻、5696号、2004、704~708頁を参照されたい)。標的遺伝子の証拠精選リストを使用するモデルは、24時間サンプルにおいて、ほとんど完全に弱められたNFkB細胞シグナリング経路活性を示すが、19個の標的遺伝子ショートリスト、13個の標的遺伝子ショートリスト及び7個の標的遺伝子ショートリストを使用するモデルは、24時間サンプルにおいて、NFkB細胞シグナリング経路活性のあまり強くない低下を示す。TNFα刺激がないすべての対照サンプル(群1~4)は、4つすべてのモデルにおいて、不活性なNFkB細胞シグナリング経路を有すると正確に予想された。2及び4時間の刺激で明らかであるように、TNFα濃度の増大の結果として、細胞シグナリング経路活性にそれほど大きな違いはないと思われ、明らかに、本実験で試験したすべての濃度は、最も低い濃度でさえも、本格的なNFkB細胞シグナリング経路活性を有するのに十分であった。(凡例:1-TNFαなし(0.5時間);2-TNFαなし(2時間);3-TNFαなし(4時間);4-TNFαなし(24時間);5-低TNFα(0.5時間);6-低TNFα(2時間);7-低TNFα(4時間);8-低TNFα(24時間);9-中TNFα(0.5時間);10-中TNFα(2時間);11-中TNFα(4時間);12-中TNFα(24時間);13-高TNFα(0.5時間);14-高TNFα(2時間);15-高TNFα(4時間);16-高TNFα(24時間))。
【0096】
図12は、THP-1単核球細胞に対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。THP-1細胞系は、リポ多糖(LPS)などの薬剤を含めた免疫応答による刺激の際に、NFkB細胞シグナリング経路活性を発現することが知られている。これらの単核球細胞におけるNFkB細胞シグナリング経路活性は、LPS刺激なしでは低いと予測される(群1)。これらの細胞をLPSで刺激すると、NFkB細胞シグナリング経路活性は増幅される(群2)。補酵素Q10(CoQ10)は抗炎症性効果を有することが報告されているが、NFkB細胞シグナリング経路活性への効果は限られていると報告された(例えば、C.Schmelzer及びF.Doring、「Identification of LPS-inducible genes downregulated by ubiquinone in human THP-1 monocytes」、Biofactors、36巻、3号、2010、222~228頁を参照されたい)。これはまた、CoQ10で処理し且つLPSで刺激したTHP-1細胞における高い予測NFkB細胞シグナリング経路活性に反映される(群3)。(凡例:1-LPSなし;2-LPS刺激;3-LPS刺激+補酵素Q10)。
【0097】
図13~16は、GSE4183からの結腸サンプルに対する、それぞれ、標的遺伝子の証拠精選リスト、19個の標的遺伝子のショートリスト、13個の標的遺伝子のショートリスト及び7個の標的遺伝子のショートリスト(表1~4参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。たいていの正常サンプル(群1)は、標的遺伝子の証拠精選リストを使用するモデルを使用することによって、NFkB細胞シグナリング経路活性の低い確率を伴って正しく予測されたが、正常サンプルに対する細胞シグナリング経路活性は、19個の標的遺伝子ショートリスト、13個の標的遺伝子ショートリスト及び7個の標的遺伝子ショートリストにおいて他のデータセットから予測されるものよりも高いように思われる。これに対して、すべての炎症性腸疾患(IBD)(群2)サンプルは、4つすべてのモデルによって、正常サンプルよりも有意に高い活性なNFkB細胞シグナリング経路を有すると予測され、これは、これらの患者の結腸の炎症状態及び炎症の結果としてNFkB細胞シグナリング経路が活性化されたことにより予測された通りである。さらに、NFkB細胞シグナリング経路は、良性アデノーマ(群2)と比較して、より進行した結腸直腸癌腫(CRC)(群4)においてより活性であることが4つすべてのモデルから明らかであり、これは、より多くの突然変異、進行した腫瘍の結果としての炎症、又は後期の癌に対する免疫応答の結果としての白血球の浸潤をもたらすより悪性の腫瘍へ腫瘍が進行した結果である可能性がある。潜在的に、NFkB細胞シグナリング経路活性スコアを使用して、アデノーマが進行して悪性になる尤度を予測することができる。(凡例:1-正常な結腸;2-IBD;3-アデノーマ;4-CRC)。
【0098】
図17は、GSE10890からの乳癌細胞系に対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。まだ知られていない経路が細胞の生存及び増殖を駆動する乳癌細胞系のいくつか(群1及び2)は、異常に活性なNFkB細胞シグナリング経路を有するとして特定され、これは、細胞の生存及び増殖の原因となり得る。活性なWnt細胞シグナリング経路を有するとして以前に特定された(国際特許出願公開WO2013/011479A2「Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression」を参照されたい)第3群では、NFkB細胞シグナリング経路が活性のサンプルは見つからなかった。(凡例:1及び2-未知の細胞シグナリング経路駆動性細胞系;3:Wnt細胞シグナリング経路駆動性細胞系)。
【0099】
図18は、GSE20565からの卵巣サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。予想されたNFkB細胞シグナリング経路が活性のサンプルの割合は、卵巣における乳房転移(群3及び4)と比較して原発癌(群1及び2)で有意に高い(p=6.0e-5(フィッシャーの正確確率検定))。慢性炎症は、腫瘍の開始及び進行に関係があった。排卵による卵巣での炎症プロセスの再発、子宮内膜症及び骨盤内感染症は、NFkB細胞シグナリング経路が活性の腫瘍と相関性があることが示されている(例えば、Alvero A.B.、「Recent insights into the role of NF-kappaB in ovarian carcinogenesis」、Genome Medicine、2巻、8号、2010、56頁、及びGuo R.X.ら、「Increased staining for phosphorylated AKT and nuclear factor-kappaB p65 and their relationship with prognosis in epithelial ovarian cancer」、Pathology International、58巻、12号、2008、746~756頁を参照されたい)。卵巣では、発癌は、炎症プロセス、例えば繰り返される排卵、子宮内膜症及び骨盤内感染症と関連付けられており、これらは、おそらく、乳房と比較して高い割合の、卵巣で生じるNFkB細胞シグナリング経路が活性の腫瘍をもたらす。(凡例:1-原発性卵巣癌腫;2-もっともらしい原発性卵巣癌腫;3-卵巣における乳房転移;4-もっともらしい卵巣における乳房転移)。
【0100】
図19は、E-MTAB-1006からの乳癌サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。ロジットNFkBオッズ比の平均は、非炎症性乳癌(nIBC)(群2)と比較して、炎症性乳癌サンプル(IBC)(群1)で有意に高い(p<0.01(2標本t検定))。これは、おそらく、nIBCと比較して、IBCにおける高い炎症状態の反映である。しかし、両群で予想されたNFkB細胞シグナリング経路活性は大きく重複しており、これは、モデルの厄介な現状において、NFkB細胞シグナリング経路活性に基づいて、IBCとnIBCをはっきりと分類する。(凡例:1-炎症性乳癌;2-非炎症性乳癌)。
【0101】
図20は、カプランマイヤープロットで示された、272人の神経膠腫患者(GSE16011)の全生存を示し、ここでは、標的遺伝子の証拠精選リスト(表1参照)を使用する訓練した例示的ベイジアンネットワークモデルを用いる。図中、垂直軸は全生存を患者グループの割合として示し、水平軸は時間を年で示す。プロットは、活性NFkB TF要素(曲線の急な傾きによって示される)が不良な全生存に対する予後マーカーであることを示す。(予測された活性NFkB TF要素を有する患者群は113人の患者からなっており(実線)、一方、予測された不活性NFkB TF要素を有する患者群は159人の患者からなっていた(点線))。NFkB TF要素の活性レベルの予後値も、NFkB活性の予測された確率のハザード比:1.83(95%CI:1.34-2.49、p=7.2e-5)で示される。
【0102】
上記の例示的ベイジアンネットワークモデルに付け加えて、単純な方法でNFkB細胞シグナリング経路の転写プログラムをモデル化するために、例示的線形モデルを使用した。モデルの構造は、国際特許出願公開WO2014/102668A2(「Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions」)の
図3に示されるものと対応していた。より具体的には、例示的線形モデルは、TFノード、標的遺伝子発現の層及びmRNA発現レベルの層からなっており、連続発現データ、標的遺伝子の証拠精選リスト(表1参照)からのすべての標的遺伝子を使用し、すべてのプローブセットが含まれ、擬似カウントは使用しなかった。モデルの訓練は、GSE12195からの同じ活性及び不活性訓練サンプルを用いて実施し、本明細書で記載される「軟logオッズ」方法を用いて、標的遺伝子の発現レベル(ここでは、プローブセット強度を用いて表される)と標的遺伝子ノードの間の関連性の重みを計算することを含んでおり、その後、転写因子複合体の活性スコアを、それぞれアップレギュレーション又はダウンレギュレーションされた標的遺伝子に対して1又は-1を乗じた計算された標的遺伝子の発現スコアの合計によって計算した。
【0103】
図21は、標的遺伝子の証拠精選リスト(表1参照)に基づく、例示的線形モデルの訓練結果を示す。図中、縦軸は活性スコアを示し、正の値は活性なNFkB細胞シグナリング経路に対応し、負の値は不活性なNFkB細胞シグナリング経路に対応する。活性化B細胞(ABC)DLBCL(群1)及び正常(群7)を、それぞれ活性及び不活性訓練サンプルとして使用した。すべての訓練サンプルは正確に分類され、すべてのABCサンプルは活性なNFkB細胞シグナリング経路を有すると予測され、一方で、正常サンプルは不活性なNFkB細胞シグナリング経路を有すると予測された。同じデータセット内で、1つを除いて、すべての他のリンパ腫サンプル及び細胞系並びにDLBCL(群2~4、8)は、NFkB活性的と予測され、これは、標的遺伝子の証拠精選リストを使用するベイジアンネットワークモデル(
図3)と同様であり、本明細書に論じる文献証拠を考慮すると、これはもっともらしい。健常な非刺激メモリーB細胞及びナイーブB細胞(群5及び6)は、NFkB活性を欠くと正確に予測される。(凡例:1-ABC DLBCL;2-リンパ芽球細胞系;3-濾胞性リンパ腫;4-GCB DLBCL;5-メモリーB細胞;6-ナイーブB細胞;7-正常;8-DLBCL未知サブタイプ)。
【0104】
図22は、様々な刺激時間にわたって様々なTNFα濃度で刺激した、E-MTAB-1312からの正常ヒト気管支上皮(NHBE)細胞系サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的線形モデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は活性スコアを示し、正の値は活性なNFkB細胞シグナリング経路に対応し、負の値は不活性なNFkB細胞シグナリング経路に対応する。NHBE細胞系は、非刺激か、様々な時間にわたって様々なTNFα濃度で刺激した。すべての非刺激の健常細胞(群1~4)は、不活性なNFkB細胞シグナリング経路を有すると正確に予測された。すべてのTNFα濃度によるわずか0.5時間の刺激は、NFkB細胞シグナリング経路が活性になるには短すぎると予測され(群5、9及び13)、これは、標的遺伝子の証拠精選リストを使用するベイジアンネットワークモデル(
図8)と同様であるが、2~24時間の刺激時間は、活性なNFkB細胞シグナリング経路をもたらした。特に標的遺伝子の証拠精選リストを使用するベイジアンネットワークモデルを用いて観測された、4時間後のNFkB細胞シグナリング経路活性の低下(
図8参照)は、訓練した例示的線形モデルを用いて再現することができなかった。(凡例:1-TNFαなし(0.5時間);2-TNFαなし(2時間);3-TNFαなし(4時間);4-TNFαなし(24時間);5-低TNFα(0.5時間);6-低TNFα(2時間);7-低TNFα(4時間);8-低TNFα(24時間);9-中TNFα(0.5時間);10-中TNFα(2時間);11-中TNFα(4時間);12-中TNFα(24時間);13-高TNFα(0.5時間);14-高TNFα(2時間);15-高TNFα(4時間);16-高TNFα(24時間))。
【0105】
図23は、GSE4183からの結腸サンプルに対する、標的遺伝子の証拠精選リスト(表1参照)を使用する、訓練した例示的線形モデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は活性スコアを示し、正の値は活性なNFkB細胞シグナリング経路に対応し、負の値は不活性なNFkB細胞シグナリング経路に対応する。たいていの正常サンプル(群1)は、他のデータセットから予想されるよりも高い活性スコアにおいてではあるが、低NFkB細胞シグナリング経路活性を有すると予測された。正常サンプルと比較して、すべての炎症性腸疾患サンプル(群2)は、正常サンプルと比較して、より高いNFkB活性スコアを有すると予測され、これは、炎症反応の1つとしてNFkB細胞シグナリング経路を活性化するこれらの患者の結腸の炎症状態を考慮すれば、非常に合理的である。さらに、アデノーマサンプル中のサンプル(群3)は、平均して、より進行した結腸直腸癌腫(CRC、群4)より低いことが明らかであり、これは、より多くの突然変異、進行した腫瘍の結果としての炎症、又は後期の癌に対する免疫応答の結果としての白血球の炎症をもたらす、より悪性の腫瘍への腫瘍の進行によって部分的に説明することができる。(凡例:1-正常な結腸;2-IBD;3-アデノーマ;4-CRC)。
【0106】
数学的モデル、例えば例示的ベイジアンネットワークモデルをマイクロアレイ又はRNAシークエンシング由来のmRNA入力データに適用する代わりに、例えば、標的遺伝子のmRNAレベルを決定するためにqPCRを使用する統合プラットフォーム上でサンプル測定を実施するための専用のアッセイを開発することが、臨床応用において有利であり得る。次いで、開示される標的遺伝子のRNA/DNA配列を使用して、そのようなプラットフォーム上でどのプライマー及びプローブを選択するかを決定することができる。
【0107】
そのような専用のアッセイの検証は、参照モデルとしてマイクロアレイベースの数学的モデルを使用し、開発したアッセイが、一連の検証サンプルに対して同様の結果を与えるかどうかを検証することによって行うことができる。専用のアッセイに次いで、これを行って、入力測定値としてmRNAシークエンシングデータを使用する同様の数学的モデルを構築し較正することもできる。
【0108】
数学的モデル、例えば例示的ベイジアンネットワークモデルを使用するマイクロアレイ/RNAシークエンシングベースの研究に基づいて、特定の細胞シグナリング経路活性を最もよく示すことが見出されている一連の標的遺伝子は、発現測定を解釈するために及び/又はNFkB細胞シグナリング経路の活性を推測するためにサンプル及び/又はコンピュータで実施されるべき多重定量PCRアッセイに変換することができる。細胞シグナリング経路活性に対してそのような試験(例えば、中央サービスラボにおけるFDA認可試験又はCLIA免除試験(CLIA waived test))を開発するために、標準化された試験キットの開発が必要であり、これは、規制当局の承認を得るために臨床試験において臨床的に検証される必要がある。
【0109】
本発明は、サンプル中で測定されたNFkB細胞シグナリング経路の6個以上の標的遺伝子の発現レベルに少なくとも基づいて、NFkB細胞シグナリング経路の活性を推測することを含む方法に関する。本発明はさらに、そのような方法を実施するように構成されるデジタルプロセッサを含む装置、そのような方法を実施するために、デジタルプロセシングデバイスによって実行可能な命令を格納する非一時的記憶媒体、及びデジタルプロセシングデバイスにそのような方法を実施させるためのプログラムコード手段を含むコンピュータプログラムに関する。
【0110】
方法は、例えば、NFkB細胞シグナリング経路の(異常な)活性の診断、NFkB細胞シグナリング経路の推測された活性に基づく予後診断、NFkB細胞シグナリング経路の推測された活性に基づく、臨床試験への登録、実施されるべきその後の試験(複数可)の選択、コンパニオン診断試験の選択、臨床判断支援システムなどにおいて、使用することができる。この関連で、これらの用途をより詳細に記述する、国際特許出願公開WO2013/011479A2(「Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression」)、国際特許出願公開WO2014/102668A2(「Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions」)及びVerhaegh W.ら、「Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways」、Cancer Research、74巻、11号、2014、2936~2945頁を参照する。
【実施例4】
【0111】
証拠精選リストと広範な文献リストとの比較
本明細書に記載の手順に従って文献証拠に基づいて構築されたNFkB細胞シグナリング経路の標的遺伝子のリスト(「標的遺伝子の証拠精選リスト」、表1参照)を、上述の手順に従わずに構築された、NFkB細胞シグナリング経路の推定上の標的遺伝子の「広範な文献リスト」とここで比較した。代替のリストは、Thomson-ReutersのMetacore(最終アクセス:2013年9月6日)内で提供されるNFkB細胞シグナリング経路の活性への応答に起因する遺伝子の編集物である。NFkBタンパク質のファミリー、すなわち、NFKB1又はp50/p105、NFKB2又はp52/p100、RELA又はp65、REL及びRELBの下流で直接転写調節される遺伝子について、このデータベースを検索した。この検索により、343個のユニークな遺伝子が得られた。NFkBSMADファミリーによる各遺伝子の帰属された転写調節を支持する刊行参考文献の数に基づいて、さらなる選択を行った。10以上の参考文献を有する遺伝子を広範な文献リスト用に選択した。言い換えれば、参考文献のマニュアルキュレーション及び実験的証拠に基づく証拠スコアの計算は実施しなかった。この手順によって32個の遺伝子が得られた(表6参照)。遺伝子の発現を、Affymetrix HG-U133Plus2.0マイクロアレイプラットフォームで、56プローブセットを測定し、このプローブセットは、RのBioconductorのプラグインを使用して選択され、1つはDEFB4Aに対する手動で加えたプローブセットであった(表6参照)。
表6:NFkB細胞シグナリング経路モデルで使用されるNFkB細胞シグナリング経路の推定上の標的遺伝子の「広範な文献リスト」及び遺伝子のmRNA発現レベルを測定するのに使用される関連プローブセット。
【0112】
【0113】
続いて、本明細書で説明する手順を使用して例示的ベイジアンネットワークモデルを構築した。証拠精選リストに基づくNFkB細胞シグナリング経路モデルの説明と同様に、広範な文献リストを含むこのモデルのプローブセットとそれらの各推定標的遺伝子の間のエッジの条件付確率表を、GSE12195からのfRMA処理データを使用して訓練した。訓練結果を
図24に示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。活性化B細胞(ABC)DLBCL(群1)を活性訓練サンプルとして使用し、正常サンプル(群7)を不活性訓練サンプルとして使用した。
図24に示す訓練結果は、不活性(群7)訓練サンプルと活性(群1)訓練サンプルの間の明らかな分離を示す。同じデータセット内で、すべての他のリンパ腫サンプル及び細胞系並びにDLBCL(群2~4、8)はNFkB活性的と予測され、本明細書に論じる文献証拠を考慮すると、これはもっともらしい。健常な非刺激メモリーB細胞及びナイーブB細胞(群5及び6)は、NFkB細胞シグナリング経路活性の欠如が正確に予測される。(凡例:1-ABC DLBCL;2-リンパ芽球細胞系;3-濾胞性リンパ腫;4-GCB DLBCL;5-メモリーB細胞;6-ナイーブB細胞;7-正常;8-DLBCL未知サブタイプ)。
【0114】
次に、いくつかのデータセットに対して、広範な文献リストに基づく訓練した例示的ネットワークベイジアンモデルを試験した。
【0115】
図25は、様々な刺激時間にわたって様々なTNFα濃度で刺激した、E-MTAB-1312からの正常ヒト気管支上皮(NHBE)細胞系サンプルに対する、NFkB細胞シグナリング経路の推定上の標的遺伝子の広範な文献リスト(表6参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。24時間までのすべての非刺激健常細胞(群1~3)は、不活性なNFkB細胞シグナリング経路を有すると正確に予想される。24時間にわたる刺激の欠如は、NFkB細胞シグナリング経路予測の予期しない活性化をもたらした。すべてのTNFα濃度によるわずか0.5時間の刺激は、広範な文献ベイジアンモデルによって、NFkB細胞シグナリング経路が活性になるには短すぎることも予測された(群5、9及び13)が、2~24時間の刺激時間は、活性なNFkB細胞シグナリング経路をもたらした(群5~8、9~12及び13~15)。標的遺伝子の証拠精選リストを使用するベイジアンネットワークモデルを用いて観測された、4時間後のNFkB細胞シグナリング経路活性の低下(
図8参照)は、訓練した広範な文献ベイジアンネットワークモデルを用いて再現されなかった。(凡例:1-TNFαなし(0.5時間);2-TNFαなし(2時間);3-TNFαなし(4時間);4-TNFαなし(24時間);5-低TNFα(0.5時間);6-低TNFα(2時間);7-低TNFα(4時間);8-低TNFα(24時間);9-中TNFα(0.5時間);10-中TNFα(2時間);11-中TNFα(4時間);12-中TNFα(24時間);13-高TNFα(0.5時間);14-高TNFα(2時間);15-高TNFα(4時間);16-高TNFα(24時間))。
【0116】
図26は、GSE4183からの結腸サンプルに対する、NFkB細胞シグナリング経路の推定上の標的遺伝子の広範な文献リスト(表6参照)を使用する、訓練した例示的ベイジアンネットワークモデルのNFkB細胞シグナリング経路活性の予測を示す。図中、縦軸は、TF要素が、NFkB細胞シグナリング経路が活性であることに対応する「存在」であり、NFkB細胞シグナリング経路が不活性であることに対応する「不在」であるオッズを示し、横軸より上の値は、TF要素が「存在」/活性である可能性がより高いことに対応し、横軸より下の値は、TF要素が「不在」/不活性であるオッズが、TF要素が「存在」/活性であるオッズよりも大きいことを示す。1つを除くアデノーマサンプルは、広範な文献ベイジアンネットワークモデルによって、活性なNFkB細胞シグナリング経路を有すると予測され、これは、特に、正常な健常結腸サンプルの場合に予測されない(群1)。(凡例:1-正常な結腸;2-IBD;3-アデノーマ;4-CRC)。
【実施例5】
【0117】
キットで使用するためのプライマー及びプローブ
キットで使用するための好ましいPCRプライマー及びプローブを以下の表7に列挙する。各遺伝子に対するPCRプライマーは、指定されたフォワード(For)及びリバース(Rev)であり、各遺伝子に対するPCR産物の検出用プローブは標識プローブである。非限定的な一実施形態では、表7に列挙されるプローブは、内部ZENクエンチャーを有する5’FAM色素及び3’Iowa Black蛍光クエンチャー(IBFQ)で標識されている。
表7:NFkB標的遺伝子の遺伝子発現を測定するためのキット用のプライマー及びプローブの非限定例
【0118】
【0119】
好ましくは、
キットは、対照遺伝子の発現レベルを測定するための1つ又は複数の構成要素を含み、1つ又は複数の構成要素は、表8に列挙される対照遺伝子の少なくとも1つに対するPCRプライマー及びプローブを含む。各遺伝子に対するPCRプライマーは指定されたフォワード(F)及びリバース(R)であり、各遺伝子に対するPCR産物の検出用プローブは標識プローブ(P又はFAM)である。非限定的な一実施形態では、表8に列挙されるプローブは、内部ZENクエンチャーを有する5’FAM色素及び3’Iowa Black蛍光クエンチャー(IBFQ)で標識されている。
表8:対照に対するオリゴ配列
【0120】
【0121】
【配列表】