(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022126644
(43)【公開日】2022-08-30
(54)【発明の名称】通常型間質性肺炎を検出するための方法及びシステム
(51)【国際特許分類】
C12Q 1/6876 20180101AFI20220823BHJP
G01N 33/50 20060101ALI20220823BHJP
G01N 33/53 20060101ALI20220823BHJP
G16B 40/20 20190101ALI20220823BHJP
C12N 15/11 20060101ALN20220823BHJP
C12Q 1/6874 20180101ALN20220823BHJP
C12Q 1/6869 20180101ALN20220823BHJP
C12Q 1/6844 20180101ALN20220823BHJP
【FI】
C12Q1/6876 Z
G01N33/50 P
G01N33/53 M
G16B40/20
C12N15/11 Z
C12Q1/6874 Z
C12Q1/6869 Z
C12Q1/6844 Z
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022082508
(22)【出願日】2022-05-19
(62)【分割の表示】P 2019511497の分割
【原出願日】2017-09-06
(31)【優先権主張番号】62/384,609
(32)【優先日】2016-09-07
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/528,899
(32)【優先日】2017-07-05
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】511118469
【氏名又は名称】ベラサイト インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】ケネディ,ジュリア,シー.
(72)【発明者】
【氏名】ファン,ジン
(72)【発明者】
【氏名】チョイ,ユンナ
(72)【発明者】
【氏名】パンクラッツ,ダニエル
(72)【発明者】
【氏名】ウォルシュ,パトリック,ショーン
(57)【要約】
【課題】 本開示は、サンプル間を通常型間質性肺炎(UIP)又は非UIPとして鑑別するためのシステム、方法、及び分類器を提供する。
【解決手段】 組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法は、(a)対象の検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをアッセイすることと、(b)前記第1の転写物群及び前記第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することにより、前記肺組織を通常型間質性肺炎(UIP)又は非通常型間質性肺炎(非UIP)に分類することを含む。
【選択図】
図7C
【特許請求の範囲】
【請求項1】
肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法であって、
(a)対象の検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをアッセイすることであって、前記第1の転写物群が、UIPで過剰発現する且つ表1及び/又は表15に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含み、前記第2の転写物群が、UIPで過小発現する且つ表1及び/又は表15に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含むこと;及び
(b)前記第1の転写物群及び前記第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することにより、(1)前記参照発現レベルと比較したとき(i)前記第1の群に対応する発現レベルの増加及び/又は(ii)前記第2の群に対応する発現レベルの低下がある場合に前記肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)前記参照発現レベルと比較したとき(i)前記第2の群に対応する発現レベルの増加及び/又は(ii)前記第1の群に対応する発現レベルの低下がある場合に前記肺組織を非通常型間質性肺炎(非UIP)に分類すること
を含む方法。
【請求項2】
肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法であって、
(a)対象の肺組織からの検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをシーケンシング、アレイハイブリダイゼーション、又は核酸増幅によってアッセイすることであって、前記第1の転写物群が、UIPで過剰発現する且つ表1及び/又は表15に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含み、前記第2の転写物群が、UIPで過小発現する且つ表1及び/又は表15のいずれかに挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含むこと;及び
(b)前記第1の転写物群及び前記第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することにより、(1)前記参照発現レベルと比較したとき(i)前記第1の群に対応する発現レベルの増加及び/又は(ii)前記第2の群に対応する発現レベルの低下がある場合に前記肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)前記参照発現レベルと比較したとき(i)前記第2の群に対応する発現レベルの増加及び/又は(ii)前記第1の群に対応する発現レベルの低下がある場合に前記肺組織を非通常型間質性肺炎(非UIP)に分類すること
を含む方法。
【請求項3】
肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出する方法であって、
(a)検査サンプルに発現する2つ以上の転写物の発現レベルをアッセイすること;及び
(b)コンピュータ生成分類器を使用して前記サンプルをUIP又は非UIPに分類すること
を含み;
前記分類器が、HP、NSIP、サルコイドーシス、RB、細気管支炎、及び器質化肺炎(OP)を含む不均一な一連の非UIP病理亜型を使用して訓練されたものであり;及び
前記検査サンプルに発現する前記2つ以上の転写物が、表1及び/又は表15に挙げられる2つ以上の遺伝子の転写物、又は配列番号1~320のいずれか2つ以上から選択される、方法。
【請求項4】
前記検査サンプルが、前記対象から入手された複数のサンプルのプールである、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記対象から入手された複数の個別サンプルからの発現レベルデータをプールすることを含む、請求項1~3のいずれか一項に記載の方法。
【請求項6】
前記発現レベルをアッセイする前にcDNAから二本鎖cDNAを合成することを含む、請求項1~3のいずれか一項に記載の方法。
【請求項7】
前記発現レベルをアッセイする前に前記二本鎖cDNAから非天然RNAを合成することを含む、請求項1~3のいずれか一項に記載の方法。
【請求項8】
前記(1)又は(2)の分類ステップに対して喫煙状態を共変量として使用することを更に含む、請求項1又は2に記載の方法。
【請求項9】
喫煙状態が、前記対象の喫煙者状態の指標となる発現プロファイルを検出することにより決定される、請求項8に記載の方法。
【請求項10】
前記サンプルの分類が、喫煙者状態バイアスの影響を受けやすい1つ以上の転写物の発現レベルの検出を含み、前記喫煙者状態バイアスの影響を受けやすい転写物には、喫煙者バイアスの影響を受けにくい転写物と異なる重みが付けられる、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記サンプルの分類が、喫煙者状態バイアスの影響を受けやすい1つ以上の転写物の発現レベルの検出を含み、前記喫煙者状態バイアスの影響を受けやすい転写物は前記分類ステップから除外される、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記分類ステップが、前記検査サンプル中の配列変異体を検出すること、及び前記配列変異体を参照サンプル中のそれぞれの配列と比較して前記サンプルをUIP又は非UIPに分類することを更に含む、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記サンプルをUIP又は非UIPに分類するため使用される発現データが、配列番号1~320から選択される遺伝子の少なくとも2つの転写物に関する発現データを含む、請求項1~12のいずれか一項に記載の方法。
【請求項14】
(i)前記対象からサンプルを入手すること、(ii)前記サンプルの第1の一部分を、前記サンプルの前記第1の一部分が不明瞭又は不確定であることを示す細胞学的分析に供すること、及び(iii)前記サンプルの第2の一部分を前記検査サンプルとしてアッセイすることを更に含む、請求項1~3のいずれか一項に記載の方法。
【請求項15】
前記第1の一部分と前記第2の一部分とが異なる一部分である、請求項14に記載の方法。
【請求項16】
前記第1の一部分と前記第2の一部分とが同じ一部分である、請求項14に記載の方法。
【請求項17】
(b)が複数のサンプルで訓練される訓練済みアルゴリズムを用いて行われ、前記検査サンプルが前記複数のサンプルと独立している、請求項1又は2に記載の方法。
【請求項18】
診断未確定の特発性肺線維症(IPF)を有する対象を治療する方法であって、
(a)対象の気道から入手された1つ以上のサンプルにおける少なくとも2つの遺伝子の発現レベルをアレイ、シーケンシング、又はqRT-PCRによって測定することであって、前記遺伝子が表1及び/又は表15に挙げられるものから選択され、及び前記方法が、
(i)前記測定するステップの前に少なくとも2つのサンプルをプールすること;
(ii)2つの別個のサンプルから独立に測定した少なくとも2セットの発現データをプールすること;又は
(iii)(i)及び(ii)の組み合わせ
を含むこと;
(b)IPFの治療に有効な化合物を、
(i)前記少なくとも2つの遺伝子の各々の発現レベルが対応する転写物の参照発現レベルと比較したとき増加している場合;及び/又は
(ii)前記少なくとも2つの遺伝子の各々の発現レベルが対応する転写物の参照発現レベルと比較したとき低下している場合;及び/又は
(iii)前記少なくとも2つの遺伝子のうちの少なくとも1つの発現レベルが対応する転写物の参照発現レベルと比較したとき増加しており、且つ前記少なくとも2つの遺伝子のうちの少なくとも1つが対応する転写物の参照発現レベルと比較したとき低下している場合
に投与すること、を含む方法。
【請求項19】
プール肺組織検査サンプルがUIP陽性か、それとも非UIP陽性かを検出する方法であって、
(a)検査サンプルに発現する1つ以上の転写物の発現レベルをアッセイすること;及び
(b)コンピュータ生成訓練済み分類器を使用して前記検査サンプルをUIP又は非UIPに分類すること
を含み;
前記コンピュータ生成訓練済み分類器が、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練され、各訓練サンプルはUIP又は非UIPの確認された診断を有し、前記訓練サンプルのうちの少なくとも2つが単一の対象から入手されたものであり;及び前記検査サンプルが前記分類前にプールされる、方法。
【請求項20】
前記分類器訓練が、表1及び/又は表15に挙げられる1つ以上の転写物の発現レベルを使用する、請求項19に記載の方法。
【請求項21】
前記分類器訓練が、表1及び/又は表15に挙げられる全ての遺伝子の転写物の発現レベルを使用する、請求項19に記載の方法。
【請求項22】
前記コンピュータ生成訓練済み分類器が、表1及び/又は表15に挙げられる遺伝子の1つ以上の転写物の発現レベルに基づき前記検査サンプルをUIP又は非UIPに分類する、請求項19~21のいずれか一項に記載の方法。
【請求項23】
プール肺組織検査サンプルが疾患又は病態に関して陽性であるかどうかを検出する方法であって、
(a)検査サンプルに発現する1つ以上の転写物の発現レベルをアッセイすること;及び
(b)コンピュータ生成訓練済み分類器を使用して前記検査サンプルを前記疾患又は病態に関して陽性、又は陰性のいずれかに分類すること
を含み;
前記コンピュータ生成訓練済み分類器が、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練され、各訓練サンプルは前記疾患又は病態に関して陽性又は陰性の確認された診断を有し、前記訓練サンプルのうちの少なくとも2つが単一の対象から入手されたものであり;及び前記検査サンプルが前記分類前にプールされる、方法。
【請求項24】
前記疾患又は病態が、肺障害、肺癌、間質性肺疾患(ILD)、特発性肺線維症(IPF)、非特異性間質性肺炎(NSIP)、Favor NSIP、通常型間質性肺炎(UIP)又は非通常型間質性肺炎(非UIP)、急性肺傷害、細気管支炎、剥離性間質性肺炎、びまん性肺胞障害、肺気腫、好酸球性肺炎、非特異性間質性肺炎(細胞性、混合型、又はFavorの亜型を含む)、肉芽腫性疾患、過敏性肺炎(HP)、Favor亜型過敏性肺炎(Favor HP)、器質化肺炎、ニューモシスチス肺炎、肺高血圧症、呼吸細気管支炎、肺サルコイドーシス、喫煙関連間質性線維症、慢性閉塞性肺疾患(COPD)、煙への曝露歴、煙への長期曝露、煙への短期曝露、及び慢性間質性線維症から選択される、請求項23に記載の方法。
【請求項25】
治療を、それを必要としている対象に特発性肺線維症(IPF)の治療に有効な療法薬で行う方法であって、
前記それを必要としている対象にIPFの治療に有効な化合物の有効用量を投与すること
を含み;前記それを必要としている対象が、コンピュータ生成訓練済み分類器によって決定したとき前記対象にIPFの治療が必要であることを示す発現レベルの表1及び/又は表15にある1つ以上の遺伝子を有する、方法。
【請求項26】
前記コンピュータ生成訓練済み分類器が、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練されたものであり、各訓練サンプルはUIP又は非UIPの確認された診断を有し、前記訓練サンプルのうちの少なくとも2つは単一の対象から入手されたものであり;及び前記検査サンプルが前記分類前にプールされる、請求項25に記載の方法。
【請求項27】
前記コンピュータ生成訓練済み分類器が、前記対象から入手されたサンプルをUIPと同定する、請求項25に記載の方法。
【請求項28】
前記コンピュータ生成訓練済み分類器が、前記対象から入手されたサンプルをIPFと同定する、請求項25に記載の方法。
【請求項29】
肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法であって、
(a)対象の検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをアッセイすることであって、前記第1の転写物群が、UIPで過剰発現する且つ表5に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含み、前記第2の転写物群が、UIPで過小発現する且つ表5に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含むこと;及び
(b)前記第1の転写物群及び前記第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することにより、(1)前記参照発現レベルと比較したとき(i)前記第1の群に対応する発現レベルの増加及び/又は(ii)前記第2の群に対応する発現レベルの低下がある場合に前記肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)前記参照発現レベルと比較したとき(i)前記第2の群に対応する発現レベルの増加及び/又は(ii)前記第1の群に対応する発現レベルの低下がある場合に前記肺組織を非通常型間質性肺炎(非UIP)に分類すること
を含む方法。
【請求項30】
肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法であって、
(a)対象の肺組織からの検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをシーケンシング、アレイハイブリダイゼーション、又は核酸増幅によってアッセイすることであって、前記第1の転写物群が、UIPで過剰発現する且つ表5に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含み、前記第2の転写物群が、UIPで過小発現する且つ表5に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含むこと;及び
(b)前記第1の転写物群及び前記第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することにより、(1)前記参照発現レベルと比較したとき(i)前記第1の群に対応する発現レベルの増加及び/又は(ii)前記第2の群に対応する発現レベルの低下がある場合に前記肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)前記参照発現レベルと比較したとき(i)前記第2の群に対応する発現レベルの増加及び/又は(ii)前記第1の群に対応する発現レベルの低下がある場合に前記肺組織を非通常型間質性肺炎(非UIP)に分類すること
を含む方法。
【請求項31】
肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出する方法であって、
(a)検査サンプルに発現する2つ以上の遺伝子の発現レベルをアッセイすること;及び
(b)コンピュータ生成分類器を使用して前記サンプルをUIP又は非UIPに分類すること
を含み;
前記分類器が、HP、NSIP、サルコイドーシス、RB、細気管支炎、及び器質化肺炎(OP)を含む不均一な一連の非UIP病理亜型を使用して訓練されたものであり;及び
前記検査サンプルに発現する前記2つ以上の遺伝子が、表5に挙げられるいずれか2つ以上の遺伝子から選択される、方法。
【請求項32】
前記検査サンプルが、前記対象から入手された複数のサンプルのプールである、請求項29~31のいずれか一項に記載の方法。
【請求項33】
前記対象から入手された複数の個別サンプルからの発現レベルデータをプールすることを含む、請求項29~31のいずれか一項に記載の方法。
【請求項34】
前記検査サンプルが生検サンプル又は気管支肺胞洗浄サンプルである、請求項29~33のいずれか一項に記載の方法。
【請求項35】
前記生検サンプルが経気管支生検サンプルである、請求項29~34のいずれか一項に記載の方法。
【請求項36】
前記発現レベルのアッセイが、qRT-PCR、DNAマイクロアレイハイブリダイゼーション、RNAseq、又はこれらの組み合わせを用いて達成される、請求項1~35のいずれか一項に記載の方法。
【請求項37】
前記発現レベルをアッセイする前に前記検査サンプルに発現するRNAからcDNAを合成することを含む、請求項29~36のいずれか一項に記載の方法。
【請求項38】
前記発現レベルをアッセイする前に前記cDNAから二本鎖cDNAを合成することを含む、請求項37に記載の方法。
【請求項39】
前記発現レベルをアッセイする前に前記二本鎖cDNAから非天然RNAを合成することを含む、請求項38に記載の方法。
【請求項40】
前記発現レベルをアッセイする前に前記ヌクレオチドの増幅を含む、請求項29~36のいずれか一項に記載の方法。
【請求項41】
前記転写物のうちの1つ以上が標識される、請求項29~36のいずれか一項に記載の方法。
【請求項42】
前記検査サンプルにおける少なくとも1つの対照核酸の発現レベルを測定することを更に含む、請求項29~32のいずれか一項に記載の方法。
【請求項43】
前記肺組織が、間質性肺疾患(ILD)、特殊型ILD、非ILD、又は診断不十分のいずれか1つに分類される、請求項29~32のいずれか一項に記載の方法。
【請求項44】
喫煙状態を前記(1)又は(2)の分類ステップへの共変量として使用することを更に含む、請求項29~30のいずれか一項に記載の方法。
【請求項45】
喫煙状態が、前記対象の喫煙者状態の指標となる発現プロファイルを検出することにより決定される、請求項44に記載の方法。
【請求項46】
喫煙状態を前記分類ステップへの共変量として使用することを更に含む、請求項3又は31に記載の方法。
【請求項47】
前記分類ステップの前に喫煙状態を共変量として使用する、請求項9、44、又は46のいずれか一項に記載の方法。
【請求項48】
遺伝子発現、変異体、突然変異、融合、ヘテロ接合性の消失(LOH)、及び生物学的パスウェイ効果から選択される1つ以上の特徴を使用して訓練された分類器を実行することを含む、請求項1~47のいずれか一項に記載の方法。
【請求項49】
前記分類が少なくとも約90%の特異度及び少なくとも約70%の感度をもたらす、請求項1~48のいずれか一項に記載の方法。
【請求項50】
前記サンプルをUIP又は非UIPに分類するために使用される前記発現データが、表5に挙げられる遺伝子から選択される遺伝子に対応する少なくとも2つの転写物に関する発現データを含む、請求項1~49のいずれか一項に記載の方法。
【請求項51】
使用される前記発現データが、表5に挙げられる遺伝子の各々を含む、請求項50に記載の方法。
【請求項52】
診断未確定の特発性肺線維症(IPF)を有する対象を治療する方法であって、
(a)対象の気道から入手された1つ以上のサンプルにおける少なくとも2つの遺伝子の発現レベルをアレイ、シーケンシング、又はqRT-PCRによって測定することであって、前記遺伝子が表5に挙げられるものから選択され、及び前記方法が、
(i)前記測定するステップの前に少なくとも2つのサンプルを物理的にプールすること;
(ii)2つの別個のサンプルから独立に測定した少なくとも2セットの発現データをプールすること;又は
(iii)(i)及び(ii)の組み合わせ
を含むこと;
(b)IPFの治療に有効な化合物を、
(i)前記少なくとも2つの遺伝子の各々の発現レベルが対応する転写物の参照発現レベルと比較したとき増加している場合;及び/又は
(ii)前記少なくとも2つの遺伝子の各々の発現レベルが対応する転写物の参照発現レベルと比較したとき低下している場合;及び/又は
(iii)前記少なくとも2つの遺伝子のうちの少なくとも1つの発現レベルが対応する転写物の参照発現レベルと比較したとき増加しており、且つ前記少なくとも2つの遺伝子のうちの少なくとも1つが対応する転写物の参照発現レベルと比較したとき低下している場合
に投与すること、を含む方法。
【請求項53】
前記投与するステップが、前記(i)の増加及び/又は前記(ii)の低下が有意な場合に限り行われる、請求項52に記載の方法。
【請求項54】
プール肺組織検査サンプルがUIP陽性か、それとも非UIP陽性かを検出する方法であって、
(a)検査サンプルに発現する1つ以上の転写物の発現レベルをアッセイすること;及び
(b)コンピュータ生成訓練済み分類器を使用して前記検査サンプルをUIP又は非UIPに分類すること
を含み;
前記コンピュータ生成訓練済み分類器が、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練され、各訓練サンプルはUIP又は非UIPの確認された診断を有し、前記訓練サンプルのうちの少なくとも2つが単一の対象から入手されたものであり;及び前記検査サンプルが前記分類前にプールされる、方法。
【請求項55】
前記分類器訓練が、表5に挙げられる1つ以上の遺伝子の発現レベルを使用する、請求項54に記載の方法。
【請求項56】
前記分類器訓練が、表5に挙げられる全ての遺伝子の発現レベルを使用する、請求項54又は55に記載の方法。
【請求項57】
前記コンピュータ生成訓練済み分類器が、表5に挙げられる1つ以上の遺伝子の発現レベルに基づき前記検査サンプルをUIP又は非UIPに分類する、請求項54~56のいずれか一項に記載の方法。
【請求項58】
前記分類器が、表5に挙げられる全ての遺伝子の転写物の発現レベルに基づき前記検査サンプルをUIP又は非UIPに分類する、請求項57に記載の方法。
【請求項59】
プール肺組織検査サンプルが疾患又は病態に関して陽性であるかどうかを検出する方法であって、
(a)検査サンプルに発現する1つ以上の転写物の発現レベルをアッセイすること;及び
(b)コンピュータ生成訓練済み分類器を使用して前記検査サンプルを前記疾患又は病態に関して陽性、又は陰性のいずれかに分類すること
を含み;
前記コンピュータ生成訓練済み分類器が、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練され、各訓練サンプルが前記疾患又は病態に関して陽性又は陰性の確認された診断を有し、前記訓練サンプルのうちの少なくとも2つが単一の対象から入手されたものであり;及び前記検査サンプルが前記分類前にプールされる、方法。
【請求項60】
治療を、それを必要としている対象に特発性肺線維症(IPF)の治療に有効な療法薬で行う方法であって、
前記それを必要としている対象にIPFの治療に有効な化合物の有効用量を投与することを含み;前記それを必要としている対象が、コンピュータ生成訓練済み分類器によって決定したとき前記対象にIPFの治療が必要であることを示す発現レベルの表5にある1つ以上の遺伝子を有する、方法。
【請求項61】
前記コンピュータ生成訓練済み分類器が、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練されたものであり、各訓練サンプルがUIP又は非UIPの確認された診断を有し、前記訓練サンプルのうちの少なくとも2つが単一の対象から入手されたものであり;及び前記検査サンプルが前記分類前にプールされる、請求項60に記載の方法。
【請求項62】
前記コンピュータ生成訓練済み分類器が、前記対象から入手されたサンプルをUIPと同定した、請求項61に記載の方法。
【請求項63】
前記コンピュータ生成訓練済み分類器が、前記対象から入手されたサンプルをIPFと同定した、請求項61に記載の方法。
【請求項64】
対象が肺障害に関して陽性かどうかを同定する方法であって、
(a)前記対象の組織サンプルを入手すること;
(b)前記組織サンプルの第1の一部分を、前記第1の一部分が不明瞭である又は疑わしいことを示す細胞学的検査に供すること;
(c)前記第1の一部分が不明瞭である又は疑わしいとの同定を受けて、前記組織サンプルの第2の一部分を前記肺障害に関連する1つ以上のマーカーの発現レベルに関してアッセイすること;
(d)前記発現レベルを訓練済みアルゴリズムで処理して、前記肺障害に関して陽性であるとの前記組織サンプルの分類を少なくとも約90%の精度で生成することであって、前記訓練済みアルゴリズムが複数の訓練サンプルを含む訓練セットで訓練され、及び前記組織サンプルが前記複数の訓練サンプルと独立していること;及び
(e)前記分類を電子的に出力すること
を含み、それにより前記対象が前記肺障害に関して陽性であるかどうかを同定する、方法。
【請求項65】
前記組織サンプルが肺組織サンプルである、請求項64に記載の方法。
【請求項66】
前記組織サンプルが非肺組織サンプルである、請求項64に記載の方法。
【請求項67】
前記非肺組織サンプルが呼吸上皮サンプルである、請求項66に記載の方法。
【請求項68】
前記呼吸上皮サンプルが前記対象の鼻又は口からのものである、請求項67に記載の方法。
【請求項69】
前記発現レベルがUIPに関連する複数のマーカーのものである、請求項64に記載の方法。
【請求項70】
前記精度が少なくとも約95%である、請求項64に記載の方法。
【請求項71】
前記分類が少なくとも約90%の特異度で生成される、請求項64に記載の方法。
【請求項72】
前記分類が少なくとも約70%の感度で生成される、請求項64に記載の方法。
【請求項73】
前記訓練済みアルゴリズムが、組織サンプルを少なくとも100の独立した検査サンプルにわたって少なくとも約90%の精度で分類するように構成される、請求項64に記載の方法。
【請求項74】
前記分類が使用者の電子ディスプレイのグラフィカルユーザインタフェース上に電子的に出力される、請求項64に記載の方法。
【請求項75】
前記肺障害が通常型間質性肺炎(UIP)又は非通常型間質性肺炎(非UIP)である、請求項64に記載の方法。
【請求項76】
前記第1の一部分が前記第2の一部分と異なる、請求項64に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
[0001] 本願は、2016年9月7日に出願された米国仮特許出願第62/384,609号、及び2017年7月5日に出願された米国仮特許出願第62/528,899号に対する優先権を主張し、これらの各々は全体として参照により本明細書に援用される。
【背景技術】
【0002】
背景
[0002] 間質性肺疾患(ILD)は、臨床症状は同様だが、様々な疾患進行、治療応答、及び生存を含め、重症度及び転帰が広範囲にわたる混成的な一群の急性及び慢性両側性実質性肺障害である1。なかでも特発性肺線維症(IPF)は、進行性の線維化、肺機能の悪化及び死亡によって特徴付けられる最も一般的な(北米で100,000人に14~60人の年間発生率)且つ重症のILDの一つである3~6。適切な臨床状況では、IPFはHRCT及び/又はSLBにおける通常型間質性肺炎(UIP)パターンの存在によって定義される8。診断までに長い時間がかかることから、疾患の経過の速さとも相まって、不確かな診断プロセスの間に受ける患者の苦痛を最小限に抑える新規ツールの必要に迫られている。IPFと診断される多くの患者は、その初期診断から5年以内に死亡する7,8。しかしながら、最近になって利用可能になった、IPF疾患進行の安定化に有望視されている2つの新規抗線維化薬ピルフェニドン及びニンテダニブ、及び他の開発中の療法薬がこの構図を変える可能性があり9~11、適切な治療介入には正確な診断が決定的に重要である5,12。
【0003】
[0003] 肺移植及び/又は抗線維性経口化合物によるこれらの新しい治療可能性を考えると2、IPFの診断を他の線維性IIPと区別することには重要な意義がある。加えて、IPFと混同されることの多い幾つもの障害が、免疫抑制剤で治療される。複合免疫抑制によるIPFの治療は有害であることが示されており、正しい治療を選択することが決定的に重要である2,33。
【0004】
[0004] IPFの診断は難題といえる。国際的に認知されているガイドラインによれば、ILDの診断及び管理においては臨床的、放射線学的、及び病理学的疾患特徴の集学的評価が推奨されている。IPF診断手法では、他の間質性肺炎、並びに結合組織病及び環境曝露及び職業性曝露の除外が必要となる3~6。IPFを有する疑いがある患者は通常、胸部の高分解能コンピュータ断層撮影(HRCT)を受けるが、HRCTは、通常型間質性肺炎(UIP)のパターンがはっきりと現れている場合に限り、高い特異度で疾患を確認する5,13。従って、ILD患者の約3分の1については、SLBなしにIPFの確信的診断が実現可能である34~36。HRCTで確信的UIPパターン診断が得られない者においては(例えばPossible UIP、及びProbable UIPのワーキングカテゴリ)、組織学的UIPの存在に関する陽性的中率(PPV)は約60%と推定されており35,36、これはSLBによる確認なしで済ませるには不十分と見なされるレベルである8。従って、HRCT結果からは結論に達しないことが頻繁にあるため、多くの患者は、間質性肺炎の病理組織学的特徴及び/又はUIPパターンを明らかにするため侵襲性の診断的外科的肺生検(SLB)が必要となり5,14、症状が発生してからIPFの診断までにかかる典型的な時間の長さは1~2年であり得る15。クライオ生検について報告されている手技的合併症発生率は高く37、SLBに伴う院内及び90日死亡率はそれぞれ1.7%及び3.9%に達していることから38、当該技術分野では低侵襲性のIPF診断方法が強く必要とされている。
【0005】
[0005] 経気管支生検(TBB)でUIP病理を高い信頼性をもって同定するのは、肺胞を有する肺実質の十分なサンプリングが困難で、且つ疾患分布が不均一であるため難題である。病理医間で不一致が生じ、正しい診断は各自の経験に依存し得る16。病理組織学的評価にも関わらず、確定診断は依然として得られないことになり得る。TBBサンプリングが適切である比率が高い後ろ向き研究では、臨床的特徴及びX線像特徴がUIPに一致する患者のうちUIPが確認されたのは30~43%であり11,12、第3の研究は確認された比率を<10%と報告した13。これにより多くが、より多量の肺胞サンプリングを提供し得る別の気管支鏡検査試験を評価することにつながった14,15。これらは現在、利用可能性及び大規模多施設試験の不足によって制限されている16。呼吸器科医、放射線科医、及び病理医の集学的チーム(MDT)が協議すると、診断精度が上がることが示されている17;残念ながら、全ての患者及びその医師が経験豊かなMDTによるこのレベルの専門家レビューを利用できるとは限らない。かかるレビューは時間がかかり、認められた専門知識のある地域施設で患者を診る必要がある。
【発明の概要】
【発明が解決しようとする課題】
【0006】
[0006] 従って、より効果的なIPF診断方法、例えば、肺胞のサンプリングが十分かどうかに頼らない気管支鏡サンプリングにおけるよりロバストなUIP検出方法が必要とされている。加えて、UIPを非UIPと鑑別する方法が必要とされている。
【0007】
[0007] 科学文献中の遺伝子発現プロファイリング研究は、IPFと他のILD亜型との間に発現差異があることを報告しているが18,19、本発明者らの先行出願PCT/US2015/059309号(全体として参照により本明細書に援用される)を除いては、臨床医の鑑別診断の一部として高頻度で存在する他の亜型を含むデータセットにおいてUIPを分類しようと試みたものはない。更に、実際の又はインシリコでのサンプルプールを利用してより高い感度及び/又は特異度の鑑別診断を実現したものはない。加えて、細胞の不均一性に非依存的な分類器を報告したものはない。
【課題を解決するための手段】
【0008】
[0008] 本明細書に記載される方法は、意外にも、患者サンプルの物理的又はインシリコプールを利用することにより、更に高い感度及び/又は鑑別診断向けの感度を達成することが可能である。更に、細胞の均一性が要求されたという先行の指摘にも関わらず、本明細書に記載される方法は、意外にも、細胞の不均一性に非依存的である。従って、本開示は、遺伝子発現差異を用いたIPFと他のILD亜型との間の区別に、先行技術に優る大幅な改良をもたらす。
【0009】
概要
[0009] 本開示は、分類器を使用してサンプル間を通常型間質性肺炎(UIP)又は非UIPに鑑別する方法及びそのために使用されるシステムを提供する。本明細書に記載される方法の精度は、専門家の病理診断を用いて真のラベルと確認されている。従って、本明細書に記載される方法は、サンプル、例えば経気管支生検(TBB)などのUIPパターンを非UIPパターンと正確に区別する病理診代用検査を提供する。
【0010】
[0010] 一部の実施形態において、本開示は、肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出するための方法及び/又はシステムを提供する。一部の実施形態において、生体サンプル中における表1、表5、表15に挙げられる1つ以上の遺伝子、又はこれらの組み合わせのmRNA発現レベルを検出することを含む、肺組織サンプルが通常型間質性肺炎(UIP)陽性かどうかを決定するための方法が提供される。詳細な実施形態において、本開示は、生体サンプル中における表5に挙げられる1つ以上の遺伝子のmRNA発現レベルを検出することを含む、肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出するための方法及び/又はシステムを提供する。一部の実施形態において、本方法は、表5に挙げられる遺伝子の全てを検出することを含む。一部の実施形態において、本方法は、上記で決定された発現レベル(例えば、表5に挙げられる1つ以上の遺伝子の発現レベル)を、対象がIPFを(例えば、別のILDとは対照的に)有する可能性の指標となるUIPスコアに変換することを更に含む。一部の実施形態において、UIPをルールアウトするため70%より高い陰性的中率(NPV)を有するモデルに従いリスクスコアが決定される。一部の実施形態において、UIPを診断するため80%より高い陽性的中率(PPV)を有するモデルに従いリスクスコアが決定される。一部の実施形態において、対象の検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをアッセイするための方法が提供され、ここで第1の転写物群は、UIPで過剰発現する且つ表1及び/又は表15のいずれかに挙げられる遺伝子のいずれか1つ以上を含み、第2の転写物群は、UIPで過小発現する且つ表1及び/又は表15のいずれかに挙げられる遺伝子のいずれか1つ以上を含む。一部の実施形態において、対象の検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをアッセイする方法が提供され、ここで第1の転写物群は、UIPで過剰発現する且つ表5に挙げられる遺伝子のいずれか1つ以上を含み、第2の転写物群は、UIPで過小発現する且つ表5に挙げられる遺伝子のいずれか1つ以上を含む。一部の実施形態において、本方法は、第1の転写物群及び第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することにより、(1)参照発現レベルと比較したとき(a)第1の群に対応する発現レベルの増加又は(b)第2の群に対応する発現レベルの低下がある場合に肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)参照発現レベルと比較したとき(c)第2の群に対応する発現レベルの増加又は(d)第1の群に対応する発現レベルの低下がある場合に肺組織を非通常型間質性肺炎(非UIP)に分類することを更に提供する。一部の実施形態において、本方法は、表1及び/又は表15に挙げられる1つ以上の遺伝子のいずれかの配列変異体を決定及び/又は比較することを更に提供する。一部の実施形態において、本方法は、表5に挙げられる1つ以上の遺伝子のいずれかの配列変異体を決定及び/又は比較することを提供する。
【0011】
[0011] 一部の実施形態において、本開示は、肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法を提供し、この方法は、対象の検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをアッセイすることであって、第1の転写物群が、UIPで過剰発現する且つ表1及び/又は表15に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含み、第2の転写物群が、UIPで過小発現する且つ表1及び/又は表15に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含むこと;及び第1の転写物群及び第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することであって、それにより(1)参照発現レベルと比較したとき(a)第1の群に対応する発現レベルの増加及び/又は(b)第2の群に対応する発現レベルの低下がある場合に肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)参照発現レベルと比較したとき(c)第2の群に対応する発現レベルの増加及び/又は(d)第1の群に対応する発現レベルの低下がある場合に肺組織を非通常型間質性肺炎(非UIP)に分類することを含む。
【0012】
[0012] 一部の実施形態において、本開示は、肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法を提供し、この方法は、対象の検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをアッセイすることであって、第1の転写物群が、UIPで過剰発現する且つ表5にある遺伝子のいずれか1つに対応する1つ以上の配列を含み、第2の転写物群が、UIPで過小発現する且つ表5に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含むこと;及び第1の転写物群及び第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することであって、それにより(1)参照発現レベルと比較したとき(a)第1の群に対応する発現レベルの増加及び/又は(b)第2の群に対応する発現レベルの低下がある場合に肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)参照発現レベルと比較したとき(c)第2の群に対応する発現レベルの増加及び/又は(d)第1の群に対応する発現レベルの低下がある場合に肺組織を非通常型間質性肺炎(非UIP)に分類することを含む。一部の実施形態において、本開示は、肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法を提供し、この方法は、対象の検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをアッセイすることであって、第1の転写物群が、UIPで過剰発現する且つ表1、表5、及び/又は表15に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含み、第2の転写物群が、UIPで過小発現する且つ表1、表5、及び/又は表15に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含むこと;及び第1の転写物群及び第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することであって、それにより(1)参照発現レベルと比較したとき(a)第1の群に対応する発現レベルの増加及び/又は(b)第2の群に対応する発現レベルの低下がある場合に肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)参照発現レベルと比較したとき(c)第2の群に対応する発現レベルの変化がないか、又はその増加があるかのいずれかである場合及び/又は(d)第1の群に対応する発現レベルの変化がないか、又はその低下がある場合に肺組織を非通常型間質性肺炎(非UIP)に分類することを含む。
【0013】
[0013] 一部の実施形態において、本開示は、肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法を提供し、この方法は、対象の肺組織からの検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをシーケンシング、アレイハイブリダイゼーション、又は核酸増幅によってアッセイすることであって、第1の転写物群が、UIPで過剰発現する且つ表1及び/又は表15に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含み、第2の転写物群が、UIPで過小発現する且つ表1及び/又は表15のいずれかに挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含むこと;及び第1の転写物群及び第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することであって、それにより(1)参照発現レベルと比較したとき(a)第1の群に対応する発現レベルの増加及び/又は(b)第2の群に対応する発現レベルの低下がある場合に肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)参照発現レベルと比較したとき(c)第2の群に対応する発現レベルの増加及び/又は(d)第1の群に対応する発現レベルの低下がある場合に肺組織を非通常型間質性肺炎(非UIP)に分類することを含む。
【0014】
[0014] 一部の実施形態において、本開示は、肺組織サンプルが通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを検出する方法を提供し、この方法は、対象の肺組織からの検査サンプル中における第1の転写物群及び第2の転写物群の各々の発現レベルをシーケンシング、アレイハイブリダイゼーション、又は核酸増幅によってアッセイすることであって、第1の転写物群が、UIPで過剰発現する且つ表5に挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含み、第2の転写物群が、UIPで過小発現する且つ表5のいずれかに挙げられる遺伝子のいずれか1つに対応する1つ以上の配列を含むこと;及び第1の転写物群及び第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することであって、それにより(1)参照発現レベルと比較したとき(a)第1の群に対応する発現レベルの増加及び/又は(b)第2の群に対応する発現レベルの低下がある場合に肺組織を通常型間質性肺炎(UIP)に分類すること、又は(2)参照発現レベルと比較したとき(c)第2の群に対応する発現レベルの増加及び/又は(d)第1の群に対応する発現レベルの低下がある場合に肺組織を非通常型間質性肺炎(非UIP)に分類することを含む。
【0015】
[0015] 一部の実施形態において、第1の群は、2以上の異なる転写物、又は3以上、4以上、5以上、10以上、15以上、20以上、又は20より多い異なる転写物を含む。
【0016】
[0016] 一部の実施形態において、第2の群は、2以上の異なる転写物、又は3以上、4以上、5以上、10以上、15以上、20以上、又は20より多い異なる転写物を含む。
【0017】
[0017] 一部の実施形態において、本開示は、肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出する方法を提供し、この方法は、検査サンプルに発現する2つ以上の転写物の発現レベルをアッセイすること;及びコンピュータ生成分類器を使用してサンプルをUIP及び非UIPに分類することを含み;ここで分類器は、HP、NSIP、サルコイドーシス、RB、細気管支炎、及び器質化肺炎(OP)を含む不均一な一連の非UIP病理亜型を使用して訓練されたものであり;及び検査サンプルに発現する2つ以上の転写物は、表1及び/又は表15に挙げられるいずれか2つ以上の配列、又は配列番号1~151のいずれか2つ以上から選択される。
【0018】
[0018] 一部の実施形態において、本開示は、肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出する方法を提供し、この方法は、検査サンプルに発現する2つ以上の転写物の発現レベルをアッセイすること;及びコンピュータ生成分類器を使用してサンプルをUIP及び非UIPに分類することを含み;ここで分類器は、HP、NSIP、サルコイドーシス、RB、細気管支炎、及び器質化肺炎(OP)を含む不均一な一連の非UIP病理亜型を使用して訓練されたものであり;及び検査サンプルに発現する2つ以上の転写物は、表5に挙げられるいずれか2つ以上の配列から選択される。
【0019】
[0019] 一部の実施形態において、検査サンプルは、対象から入手された複数のサンプルのプールである。一部の実施形態において、プールは、対象から入手された2、3、4、又は5つのサンプルを含む。
【0020】
[0020] 一部の実施形態において、本方法は、対象から入手された複数の個別サンプルからの発現レベルデータをプールすることを含む。一部の実施形態において、対象から入手された2、3、4、又は5つのサンプルからの発現レベルデータがプールされる。
【0021】
[0021] 一部の実施形態において、検査サンプルは生検サンプル又は気管支肺胞洗浄サンプルである。一部の実施形態において、生検サンプルは経気管支生検サンプルである。一部の実施形態において、検査サンプルは新鮮凍結されるか又は固定される。
【0022】
[0022] 一部の実施形態において、発現レベルのアッセイは、RT-PCR、DNAマイクロアレイハイブリダイゼーション、RNASeq、又はこれらの組み合わせを用いて達成される。一部の実施形態において、発現レベルは、検査サンプルに発現するヌクレオチド、又は検査サンプルに発現するヌクレオチドから合成されるヌクレオチドを検出することによりアッセイされる。一部の実施形態において、本方法は、発現レベルをアッセイする前に検査サンプルに発現するRNAからcDNAを合成することを含む。一部の実施形態において、本方法は、発現レベルをアッセイする前にcDNAから二本鎖cDNAを合成することを含む。一部の実施形態において、本方法は、発現レベルをアッセイする前に二本鎖cDNAから非天然RNAを合成することを含む。一部の実施形態において、非天然RNAはcRNAである。一部の実施形態において、非天然RNAは標識される。一部の実施形態において、標識はシーケンシングアダプター又はビオチン分子を含む。一部の実施形態において、本方法は、発現レベルをアッセイする前のヌクレオチドの増幅を含む。
【0023】
[0023] 一部の実施形態において、本方法は、転写物のうちの1つ以上を標識することを含む。一部の実施形態において、本方法は、検査サンプルにおける少なくとも1つの対照核酸の発現レベルを測定することを更に含む。
【0024】
[0024] 一部の実施形態において、本方法は、肺組織を間質性肺疾患(ILD)、特殊型ILD、非ILD、又は診断不十分のいずれか1つに分類することを含む。一部の実施形態において、肺組織は特発性肺線維症(IPF)又は非特異性間質性肺炎(NSIP)のいずれかに分類される。一部の実施形態において、本方法は、1つ又は複数の分類ステップに対する共変量として喫煙状態を使用することを含む。一部の実施形態において、喫煙状態は、対象の喫煙者状態の指標となる発現プロファイルを検出することにより決定される。
【0025】
[0025] 一部の実施形態において、サンプルの分類は、喫煙者状態バイアスの影響を受けやすい1つ以上の転写物の発現レベルの検出を含み、ここで喫煙者状態バイアスの影響を受けやすい転写物には、喫煙者バイアスの影響を受けにくい転写物と異なる重みが付けられる。
【0026】
[0026] 一部の実施形態において、サンプルの分類は、喫煙者状態バイアスの影響を受けやすい1つ以上の転写物の発現レベルの検出を含み、及び喫煙者状態バイアスの影響を受けやすい転写物は分類ステップから除外される。
【0027】
[0027] 一部の実施形態において、本方法は、遺伝子発現、変異体、突然変異、融合、ヘテロ接合性の消失(loss of heterozygosity)(LOH)、及び生物学的パスウェイ効果から選択される1つ以上の特徴を使用して訓練された分類器を実行することを含む。一部の実施形態において、分類器は、遺伝子発現、配列変異体、突然変異、融合、ヘテロ接合性の消失(loss of heterozygosity)(LOH)、及び生物学的パスウェイ効果を含む特徴を使用して訓練される。
【0028】
[0028] 一部の実施形態において、分類ステップは、検査サンプル中の配列変異体を検出すること、及び配列変異体を参照サンプル中のそれぞれの配列と比較してサンプルをUIP又は非UIPに分類することを更に含む。
【0029】
[0029] 一部の実施形態において、肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出するための本明細書に開示される方法は、サンプルがUIPに分類される場合にIPFの治療能力を有する化合物で対象を治療することを更に含む。一部の実施形態において、化合物は抗線維薬である。一部の実施形態において、化合物は、ピルフェニドン、ニンテダニブ、その薬学的に許容可能な塩、及びこれらの組み合わせから選択される。
【0030】
[0030] 一部の実施形態において、肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出するための本明細書に開示される方法で実施される分類は、少なくとも約90%の特異度及び少なくとも約70%の感度をもたらす。
【0031】
[0031] 一部の実施形態において、肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出するための本明細書に開示される方法は、配列番号1~320から選択される少なくとも2つの転写物について発現データをアッセイすることを含む。一部の実施形態において、肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出するための本明細書に開示される方法は、配列番号1~320の各々について発現データをアッセイすることを含む。
【0032】
[0032] 一部の実施形態において、肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出するための本明細書に開示される方法は、表5に挙げられる遺伝子から選択される少なくとも2つの遺伝子について発現データをアッセイすることを含む。一部の実施形態において、肺組織サンプルがUIP陽性か、それとも非UIP陽性かを検出するための本明細書に開示される方法は、表5に挙げられる遺伝子の各々について発現データをアッセイすることを含む。
【0033】
[0033] 一部の実施形態において、本明細書に開示される方法は、(i)対象からサンプルを入手すること、(ii)サンプルの第1の一部分を、そのサンプルの第1の一部分が不明瞭又は不確定であることを示す細胞学的分析に供すること、及び(iii)サンプルの第2の一部分を検査サンプルとしてアッセイすることを更に含む。一部の実施形態において、第1の一部分と第2の一部分とは異なる一部分である。
【0034】
[0034] 一部の実施形態において、第1の転写物群及び第2の転写物群の各々の発現レベルを対応する転写物の参照発現レベルと比較することは、複数のサンプルで訓練された訓練済みアルゴリズムを用いて行われ、ここで検査サンプルはこの複数のサンプルと独立している。
【0035】
[0035] 一部の実施形態において、本開示は、診断未確定の特発性肺線維症(IPF)を有する患者を治療する方法を提供し、この方法は、(A)対象の気道から入手された1つ以上のサンプルにおける少なくとも2つの遺伝子の発現レベルをアレイ、シーケンシング、又はqRT-PCRによって測定することであって、遺伝子が表1及び/又は表15に挙げられるものから選択され、及びこの方法が、(i)測定するステップの前に少なくとも2つのサンプルをプールすること;(ii)2つの別個のサンプルから独立に測定した少なくとも2セットの発現データをプールすること;又は(i)及び(ii)の組み合わせを含むこと;並びに(B)IPFの治療に有効な化合物を、(i)少なくとも2つの遺伝子の各々の発現レベルが対応する転写物の参照発現レベルと比較したとき増加している場合;及び/又は(ii)少なくとも2つの遺伝子の各々の発現レベルが対応する転写物の参照発現レベルと比較したとき低下している場合;及び/又は(iii)少なくとも2つの遺伝子のうちの少なくとも1つの発現レベルが対応する転写物の参照発現レベルと比較したとき増加しており、且つ少なくとも2つの遺伝子のうちの少なくとも1つが対応する転写物の参照発現レベルと比較したとき低下している場合に投与することを含む。
【0036】
[0036] 一部の実施形態において、投与するステップは、(i)の増加及び/又は(ii)の低下が有意な場合に限り行われる。
【0037】
[0037] 一部の実施形態において、本開示は、診断未確定の特発性肺線維症(IPF)を有する患者を治療する方法を提供し、この方法は、(A)対象の気道から入手された1つ以上のサンプルにおける少なくとも2つの遺伝子の発現レベルをアレイ、シーケンシング、又はqRT-PCRによって測定することであって、遺伝子が表5に挙げられるものから選択され、及びこの方法が、(i)測定するステップの前に少なくとも2つのサンプルをプールすること;(ii)2つの別個のサンプルから独立に測定した少なくとも2セットの発現データをプールすること;又は(i)及び(ii)の組み合わせを含むこと;及び(B)IPFの治療に有効な化合物を、(i)少なくとも2つの遺伝子の各々の発現レベルが対応する転写物の参照発現レベルと比較したとき増加している場合;及び/又は(ii)少なくとも2つの遺伝子の各々の発現レベルが対応する転写物の参照発現レベルと比較したとき低下している場合;及び/又は(iii)少なくとも2つの遺伝子のうちの少なくとも1つの発現レベルが対応する転写物の参照発現レベルと比較したとき増加しており、且つ少なくとも2つの遺伝子のうちの少なくとも1つが対応する転写物の参照発現レベルと比較したとき低下している場合に投与することを含む。
【0038】
[0038] 一部の実施形態において、投与するステップは、(i)の増加及び/又は(ii)の低下が有意な場合に限り行われる。
【0039】
[0039] 一部の実施形態において、本開示は、プール肺組織検査サンプルがUIP陽性か、それとも非UIP陽性かを検出する方法を提供し、この方法は、(A)検査サンプルに発現する1つ以上の転写物の発現レベルをアッセイすること;及び(B)コンピュータ生成訓練済み分類器を使用して検査サンプルをUIP又は非UIPに分類することを含み;ここでコンピュータ生成訓練済み分類器は、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練され、各訓練サンプルはUIP又は非UIPの確認された診断を有し、ここで訓練サンプルのうちの少なくとも2つは単一の対象から入手されたものであり;及び検査サンプルは分類前にプールされる。
【0040】
[0040] 一部の実施形態において、プールは物理的プールを含む。一部の実施形態において、プールはインシリコプールを含む。
【0041】
[0041] 一部の実施形態において、分類器訓練は、表1及び/又は表15に挙げられる1つ以上の転写物の発現レベルを使用する。一部の実施形態において、分類器訓練は、表5に挙げられる1つ以上の遺伝子の発現レベルを使用する。一部の実施形態において、分類器訓練は、表1に挙げられる全ての転写物の発現レベルを使用する。一部の実施形態において、分類器訓練は、表15に挙げられる全ての転写物の発現レベルを使用する。一部の実施形態において、分類器訓練は、表5に挙げられる全ての転写物の発現レベルを使用する。一部の実施形態において、分類器訓練は、表5に挙げられる全ての転写物及び表1又は表15に挙げられる1つ以上の追加の遺伝子の発現レベルを使用する。一部の実施形態において、分類器訓練は、表1及び表15に挙げられる全ての転写物の発現レベルを使用する。一部の実施形態において、コンピュータ生成訓練済み分類器は、表1及び/又は表15に挙げられる1つ以上の転写物の発現レベルに基づき検査サンプルをUIP又は非UIPに分類する。一部の実施形態において、分類器は、表1に挙げられる全ての転写物の発現レベルに基づき検査サンプルをUIP又は非UIPに分類する。一部の実施形態において、分類器は、表15に挙げられる全ての転写物の発現レベルに基づき検査サンプルをUIP又は非UIPに分類する。一部の実施形態において、分類器は、表1及び表15に挙げられる全ての転写物の発現レベルに基づき検査サンプルをUIP又は非UIPに分類する。一部の実施形態において、分類器訓練は、表5に挙げられる全ての遺伝子の発現レベルを使用する。一部の実施形態において、コンピュータ生成訓練済み分類器は、表5に挙げられる1つ以上の転写物の発現レベルに基づき検査サンプルをUIP又は非UIPに分類する。一部の実施形態において、分類器は、表5に挙げられる全ての転写物の発現レベルに基づき検査サンプルをUIP又は非UIPに分類する。
【0042】
[0042] 一部の実施形態において、本開示は、プール肺組織検査サンプルが疾患又は病態に関して陽性であるかどうかを検出する方法を提供し、この方法は、(A)検査サンプルに発現する1つ以上の転写物の発現レベルをアッセイすること;及び(B)コンピュータ生成訓練済み分類器を使用して検査サンプルを疾患又は病態に関して陽性、又は陰性のいずれかに分類することを含み;ここでコンピュータ生成訓練済み分類器は、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練され、各訓練サンプルは疾患又は病態に関して陽性又は陰性の確認された診断を有し、ここで訓練サンプルのうちの少なくとも2つは単一の対象から入手されたものであり;及び検査サンプルは分類前にプールされる。
【0043】
[0043] 一部の実施形態において、プールは物理的プールを含む。一部の実施形態において、プールはインシリコプールを含む。一部の実施形態において、分類器は、表5に挙げられる1つ以上の遺伝子の発現レベルに基づきサンプルを分類する。詳細な実施形態において、分類器は、表5に挙げられる全ての遺伝子の発現レベルに基づきサンプルを分類する。
【0044】
[0044] 一部の実施形態において、疾患又は病態は、肺障害、肺癌、間質性肺疾患(ILD)、特発性肺線維症(IPF)、通常型間質性肺炎(UIP)又は非通常型間質性肺炎(非UIP)、急性肺傷害、細気管支炎、剥離性間質性肺炎、びまん性肺胞障害、肺気腫、好酸球性肺炎、非特異性間質性肺炎(NSIP)(細胞性、混合型、又はFavorの亜型を含む)、肉芽腫性疾患、過敏性肺炎(HP)、Favor亜型過敏性肺炎(Favor HP)、器質化肺炎、ニューモシスチス肺炎、肺高血圧症、呼吸細気管支炎、肺サルコイドーシス、喫煙関連間質性線維症、慢性閉塞性肺疾患(COPD)、煙への曝露歴、煙への長期曝露、煙への短期曝露、及び慢性間質性線維症から選択される。
【0045】
[0045] 一部の実施形態において、本開示は、治療を、それを必要としている対象に特発性肺線維症(IPF)の治療に有効な療法薬で行う方法を提供し、この方法は、それを必要としている対象にIPFの治療に有効な化合物の有効用量を投与することを含み、ここでそれを必要としている対象は、コンピュータ生成訓練済み分類器によって決定したとき対象にIPFの治療が必要であることを示す発現レベルの表5にある1つ以上の遺伝子を有する。
【0046】
[0046] 一部の実施形態において、コンピュータ生成訓練済み分類器は、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練され、各訓練サンプルはUIP又は非UIPの確認された診断を有し、ここで訓練サンプルのうちの少なくとも2つは単一の対象から入手されたものであり;及び検査サンプルは分類前にプールされる。詳細な実施形態において、コンピュータ生成訓練済み分類器は、対象から入手されたサンプルをUIPと同定する。詳細な実施形態において、コンピュータ生成訓練済み分類器は、対象から入手されたサンプルをIPFと同定する。
【0047】
[0047] 一部の実施形態において、本開示は、対象が肺障害に関して陽性かどうかを同定する方法を提供し、この方法は、(a)対象の組織サンプルを入手すること;(b)組織サンプルの第1の一部分を、その第1の一部分が不明瞭である又は疑わしいことを示す細胞学的検査に供すること;(c)第1の一部分が不明瞭である又は疑わしいとの同定を受けて、組織サンプルの第2の一部分を肺障害に関連する1つ以上のマーカーの発現レベルに関してアッセイすること;(d)発現レベルを訓練済みアルゴリズムで処理して、肺障害陽性とする組織サンプルの分類を少なくとも約90%の精度で生成することであって、訓練済みアルゴリズムが、複数の訓練サンプルを含む訓練セットで訓練され、及び組織サンプルがこの複数のサンプルと独立していること;及び(e)分類を電子的に出力することを含み、それにより対象が肺障害に関して陽性かどうかを同定する。
【0048】
[0048] 一部の実施形態において、組織サンプルは肺組織サンプルである。一部の実施形態において、組織サンプルは非肺組織サンプルである。一部の実施形態において、非肺組織サンプルは呼吸上皮サンプルである。一部の実施形態において、呼吸上皮サンプルは対象の鼻又は口からのものである。
【0049】
[0049] 一部の実施形態において、発現レベルは、UIPに関連する複数のマーカーのものである。
【0050】
[0050] 一部の実施形態において、精度は少なくとも約95%である。
【0051】
[0051] 一部の実施形態において、分類は少なくとも約90%の特異度で生成される。一部の実施形態において、分類は少なくとも約70%の感度で生成される。
【0052】
[0052] 一部の実施形態において、訓練済みアルゴリズムは、肺組織サンプルを少なくとも100の独立した検査サンプルにわたって少なくとも約90%の精度で分類するように構成される。
【0053】
[0053] 一部の実施形態において、分類は使用者の電子ディスプレイのグラフィカルユーザインタフェース上に電子的に出力される。
【0054】
[0054] 一部の実施形態において、肺障害は通常型間質性肺炎(UIP)又は非通常型間質性肺炎(非UIP)である。
【0055】
[0055] 一部の実施形態において、第1の一部分は第2の一部分と異なる。
【0056】
[0056] 一部の実施形態において、本開示は、対象が通常型間質性肺炎(UIP)陽性か、それとも非通常型間質性肺炎(非UIP)陽性かを同定する方法を提供し、この方法は、(a)対象の組織サンプルを入手すること;(b)組織サンプルの第1の一部分を、その第1の一部分が不明瞭である又は疑わしいことを示す細胞学的検査に供すること;(c)第1の一部分が不明瞭である又は疑わしいとの同定を受けて、組織サンプルの第2の一部分をUIPに関連する1つ以上のマーカーの発現レベルに関してアッセイすること;(d)発現レベルを訓練済みアルゴリズムで処理して、UIP陽性又は非UIP陽性とする組織サンプルの分類を少なくとも約90%の精度で生成することであって、訓練済みアルゴリズムが、複数の訓練サンプルを含む訓練セットで訓練され、及び組織サンプルがこの複数のサンプルと独立していること;及び(e)分類を電子的に出力することを含み、それにより対象がUIP陽性か、それとも非UIP陽性かを同定する。
【0057】
[0057] 本開示の別の態様は、1つ以上のコンピュータプロセッサによる実行時に上記又は本明細書の他の部分にある方法のいずれかを実行する機械実行可能コードを含む非一時的コンピュータ可読媒体を提供する。
【0058】
[0058] 本開示の別の態様は、1つ以上のコンピュータプロセッサ及びそれと結合された非一時的コンピュータ可読媒体を含むコンピュータシステムを提供する。非一時的コンピュータ可読媒体は、1つ以上のコンピュータプロセッサによる実行時に上記又は本明細書の他の部分にある方法のいずれかを実行する機械実行可能コードを含む。
【0059】
[0059] 本開示の更なる態様及び利点は、本開示の例示に過ぎない実施形態が図示及び説明される以下の詳細な説明から当業者に容易に明らかになるであろう。理解されるであろうとおり、本開示は、他の異なる実施形態が可能であり、その幾つかの詳細は、様々な自明の点で、全て本開示から逸脱することなく改良が可能である。従って、図面及び説明は本質的に例示的なものと見なされなければならず、限定的なものと見なされてはならない。
【0060】
参照による援用
[0060] 本明細書で言及される全ての刊行物、特許、及び特許出願は、各個別の刊行物、特許、又は特許出願が参照によって援用されることを具体的且つ個別に示されたものとして本明細書において参照により援用される。参照によって援用される刊行物及び特許又は特許出願が、本明細書に含まれる開示と矛盾する限りにおいて、本明細書がいかなるかかる矛盾する資料にも取って代わり及び/又は優先することが意図される。
【0061】
図面の簡単な説明
[0061] 本開示の新規特徴は、添付の特許請求の範囲に詳細に示される。本開示の原理が利用される例示的な実施形態を示す以下の詳細な説明、及び添付の図面(本明細書ではまた「図(Figure)」及び「図(FIG.)」)を参照することにより、本開示の特徴及び利点の更なる理解が得られるであろう。
【図面の簡単な説明】
【0062】
【
図1】[0062]2つのサンプル(サンプルA及びサンプルB)を有する仮想患者の中央病理診断プロセス。レビュープロセスには3人の専門病理医が参加する。サンプルレベルの診断については、各サンプルのスライドグラスが各病理医(病理医はPath.と略される)によってレビューされる。患者レベルの診断については、全てのサンプル(この演習では2つ)からのスライドグラスが集められ、各病理医によってまとめてレビューされる。サンプルレベル及び患者レベルのいずれの診断も、同じレビュープロセスを経る。最終診断としては多数決が用いられ、但し、専門病理医が協議後にも意見不一致であればこの限りでなく、その場合、そのサンプルは診断上の信頼性が不足しているため省かれる。全てのバンク保存組織の中でかかるケースが観察されたのは僅か1例であった(n=128)。
【
図2】[0063]サンプル除外/組入れ手順。
図2は、本試験で使用するためスクリーニングした113人の患者及び関連するTBBサンプルのフロー図を示す。この図は、順次行われる各処理ステップにおける患者及びサンプルのコホート(中央の四角)、処理ステップ(台形)、及び除外(側方の四角)を示す。
【
図3】[0064]分類器性能。
図3A~
図3Dは単一サンプル分類性能を示す。53人の患者で訓練した分類器を使用することにより、訓練に使用した個別のTBBサンプルを交差検証によってスコア化し(
図3A、
図3B)、31人の患者の独立したテストコホートからのTBBサンプルを前向きにスコア化した(
図3C、
図3D)。訓練セット(
図3A)及び検証セット(
図3C)の各TBBサンプルについて、患者別に縦に整理した分類スコア(y軸)をプロットする。個々のサンプルには肺葉レベル病理診断別に色を付け、記号は元の肺葉を表す(凡例)。患者レベル病理診断は各プロットの下のx軸上に提供され、放射線診断は上のx軸上に提供される。訓練セットに関する交差検証で決定され、且つテストセットに前向きに適用された決定境界を破線の横線として示す。全てのサンプルをスコア化したときの全体的な性能の要約は、訓練セットに関して交差検証で(
図3B)、及び検証セットに関して前向きに(
図3D)提供される。各コホートにおける真陽性、真陰性、偽陽性及び偽陰性サンプルの総数を2×2表に要約する。受信者動作特性曲線下面積(ROC-AUC)、感度及び特異度、加えて関連する90%信頼区間を掲載する。
図3で用いられている病理診及び放射線画像診に関する頭字語:ACL、急性肺傷害;BR、細気管支炎;CIF,NOC、他に分類されない慢性間質性線維症;DIP、剥離性間質性肺炎;DAD、びまん性肺胞障害;EMP、肺気腫;EO-PN、好酸球性肺炎;NA、非該当/欠測;ND、診断不十分;NSIP、非特異性間質性肺炎;NSIP-C、細胞性NSIP;NSIP-F、Favor NSIP;GR、肉芽腫性疾患;HP、過敏性肺炎;HP-F、Favor HP;OP、器質化肺炎;OTHR、その他;PN-PN、ニューモシスチス肺炎;PL-HY、肺高血圧症;RB、呼吸細気管支炎;SRC、サルコイドーシス;SRIF、喫煙関連間質性線維症;UIP、通常型間質性肺炎;UIP-C、Classic UIP;UIP-D、difficult UIP;UIP-F、Favor UIP;UIP-DE、definite UIP;UIP-P、probable UIP。
【
図4】[0065]同じ患者からのTBB混合物におけるUIPの分類。
図4Aは、8人の患者からのTBBサンプルを示し(x軸)、これらのサンプルは個別サンプルとしてインビトロで処理し、84患者分類器によってスコア化(y軸)したものである(青色の四角)。比較のため、各患者からの個別TBBサンプルの平均スコアを示す(濃青色の三角)。
図4Bは、単一サンプルTBBデータのランダムサンプリングによる84患者コホート全体に関する複数(患者当たり2~5例)のTBBサンプル混合物のインシリコシミュレーションを示す。混合物は84患者UIP分類器によってスコア化し、コホート全体にわたる分類性能のROC-AUC点推定値を100重生成し、各混合条件についてプロットした。箱ひげ図は各サンプリング条件におけるROC-AUC中央値を表す。
図4Cは、90%の目標特異度における混合物の検査感度として表した、
図4Bに示される性能を示す。検査感度は約72%に改善し、ばらつきが減少する。赤色の破線の横線は、参照点としての単一サンプル分類器のROC-AUCを示す。
図4Dは、全対象について2つの上葉TBB及び3つの下葉TBBが利用可能な33人の対象のセットにおける混合物シミュレーションを示す。サンプリングを上葉又は下葉に限定したとき、性能の向上はない。
【
図5】[0066]
図5Aは、24個のマーカー(44個のうちのサブセット)を用いた主成分による教師なしクラスタリングを示す;TBBサンプルは青色、SLBサンプルはオレンジ色。
図5Bは、9遺伝子:SFTPB、SFTPC、SFTPD、ABCA3、CEBPA、AGER、GPRC5A、HOPX、及びSFTPA1に関するTBB集団内における二峰性の発現を示す;TBB発現カウントは青色、SLB発現カウントはオレンジ色)。
図5Cは、SFTPA1、SFTPB、SFTPC、及びSFTPDの間における、PDPN及びAQP5の間、又はこれらの2群のメンバー間にはない、相関性のある方向的に一貫した発現を示す;TBB発現カウントは青色、SLB発現カウントはオレンジ色)。
【
図6】[0067]経気管支生検における肺胞遺伝子発現の分布。
図6Aは、複数の組織、細胞株及び腫瘍型(x軸)に関するI型肺胞細胞の2つのマーカーの発現合計(I型肺胞統計量)(y軸)を示す。比較のため、本試験の正常肺組織、肺腫瘍、外科的肺生検(SLB、n=22)及び経気管支生検における発現もまた示す(n=283)。
図6Bは、真の病理ラベルと比べた分類の正しさ(例えば、真陰性、偽陰性、真陽性、及び偽陽性)の関数としてまとめた、各TBBサンプルについてプロットしたI型肺胞統計量を示す。
図6Cは、複数の組織、細胞株及び腫瘍型(x軸)に関する肺胞細胞の4つのマーカーの発現合計(II型肺胞統計量)(y軸)を示す。比較のため、本試験の正常肺組織、肺腫瘍、外科的肺生検(SLB、n=22)及び経気管支生検における発現もまた示す(n=283)。
図6Dは、真の病理ラベルと比べた分類の正しさ(例えば、真陰性、偽陰性、真陽性、及び偽陽性)の関数としてまとめた、各TBBサンプルについてプロットしたII型肺胞統計量を示す。IPFと診断された3人の患者(患者P1、P2、及びP3)から入手した外植片サンプルに関するペアワイズ相関。各サンプルについて部位(上又は下、中心又は末梢)が示される。IPFサンプルを正常肺サンプルと分ける上位200の発現差異がある遺伝子を使用してペアワイズピアソン相関係数を計算し、高い相関をマゼンタ色で表し、低い相関を緑色で表すヒートマップとしてプロットした。正常肺サンプル間の及びそれとの相関は0.7の範囲である(図示せず)。
【
図7】[0068]本明細書に開示される分類器を訓練及び利用するためのコンピュータシステム;プロセッサ;及びコンピュータ実行可能プロセス。
図7Aは、本明細書に開示される態様の実行に使用可能なコンピュータシステムの図解を示す。
図7Bは、
図7Aのコンピュータシステムのプロセッサの詳細な図解を示す。
図7Cは、本開示の一つの非限定的な方法の詳細な図解を示し、ここでは既知のUIP及び非UIPサンプルの遺伝子産物発現データを使用してUIPと非UIPの鑑別のための分類器が(例えば、分類器訓練モジュールを使用して)訓練され、分類器は場合によっては喫煙者状態を共変量と見なし、及び未知のサンプルからの遺伝子産物発現データを訓練済み分類器に入力することにより、その未知のサンプルがUIP又は非UIPのいずれかと同定され、及び分類器による分類の結果はレポートによって定義及び出力される。
【
図8】[0069]88人のBRAVE試験対象からのEnvisia最終検証群及び二次分析群の導出を図解するフロー図(実施例10)。
【
図9】[0070]実施例10の試験で試験対象の参照ラベルの決定に用いた中央病理レビュープロセスの図。
【
図10】[0071]Envisiaゲノム分類器の検証性能。
図10Aは、49対象最終検証群に関するEnvisiaのROC-AUC曲線を示し、予め指定した決定境界をROC曲線上にアスタリスクで示す。
図10Bは、最終検証群に関するEnvisia分類結果の2×2表を示す。
【
図11】[0072]Envisia検証群の49人の対象の分類スコア。対象は左から右に分類スコア(y軸)の昇順にソートし、下のx軸上に中央病理診断及び上のx軸上に中央放射線診断(利用可能な場合)をとった。塗り潰した丸はUIP参照ラベルの対象を表し、白抜きの丸は非UIP参照ラベルの対象を表す。検査決定境界を破線で示す。
【
図12】[0073]放射線画像診によって確定した対象サブ群におけるEnvisia性能。放射線画像診が利用可能な最終検証対象のうちの46人に関する、参照標準としての病理診に対する中央及び各施設放射線診断の2×2表を示す。放射線画像診がUIP(Definite、Probable、及びPossible UIP)に合致する対象及びUIPに合致しない対象のサブセットについて、病理診に対するEnvisia検査性能を示す。Envisia検査結果は中央及び各施設放射線診断に対して別々に評価する。
【
図13】[0074]対象の臨床学的要因に対するEnvisia検査性能のサブ群分析。UIP対象を塗り潰した赤色の丸で示し、非UIP対象を白抜き又は青色の丸で示す。
図13A:検証コホート対象年齢の関数としてのEnvisia分類スコア。
図13B:対象年齢と分類スコアとの間に有意な相関はない。
図13C:対象の性別の関数としてのEnvisiaスコア。UIPの男性患者はEnvisia検査によって見逃される傾向が高くなる(病理診UIPを有する男性17人中10人がEnvisiaによってUIPがコールされた;41%感度、これに対してUIP女性は7人中6人)。
図13D:対象の喫煙歴の関数としてのEnvisiaスコア。喫煙歴のある男性UIP患者は非喫煙者と比べて高率でEnvisiaによって誤分類される。
【
図14】[0075]サンプルの技術的要因に対するEnvisia検査性能のサブ群分析。UIP対象を塗り潰した赤色の丸で示し、非UIP対象を白抜き又は青色の丸で示す。
図14A及び
図14B:肺胞含有量を推定するための遺伝子発現要約統計量。
図14Aは肺胞I型細胞含有量(x軸)を示し、
図14Bは肺胞II型含有量(x軸)を示し
E10、各々、Envisiaスコア(y軸)に対してプロットされる。
図14C:肺胞II型含有量別にEnvisia検査真陽性(TP)、偽陰性(FN)、真陰性(TN)、及び偽陽性(FP)をプロットする。Envisia検査によって誤ってコールされた対象の中では、肺胞II型低含有量のエンリッチメントはない。
図14D:UIP参照ラベル別に分けた、Envisia分類スコアとサンプルクオリティ(RIN又はDV200)との相関。非UIPサンプル中では、UIPサンプルでは明らかでないより強い(より陰性が多い)分類スコアとより高いサンプルクオリティとの間の相関がある。
【発明を実施するための形態】
【0063】
詳細な説明
[0076] 本明細書には本開示の様々な実施形態が図示及び説明されているが、当業者には、かかる実施形態が単に例として提供されるに過ぎないことは明らかであろう。当業者には、本開示から逸脱することなく多数の変形、変更、及び代替が想起され得る。本明細書に記載される本開示の実施形態の様々な変形例を利用し得ることが理解されなければならない。
【0064】
[0077] 「間質性肺疾患」又は「ILD」(びまん性実質性肺疾患(DPLD)としても知られる)は、本明細書で使用されるとき、間質(肺の空気嚢の周囲にある組織及び空間)に発症する一群の肺疾患を指す。ILDは、疑わしい又は判明している原因によって分類されることもあり、又は特発性であることもある。例えば、ILDは、吸入物質(無機又は有機)が原因である、薬物誘発性である(例えば、抗生物質、化学療法薬、抗不整脈剤、スタチン系薬剤)、結合組織病(例えば、全身性硬化症、多発筋炎、皮膚筋炎、全身性エリテマトーデス(systemic lupus erythematosus)、関節リウマチ)に関連する、肺感染症(例えば、非定型肺炎、ニューモシスチス肺炎(PCP)、結核、トラコーマクラミジア(Chlamydia trachomatis)、呼吸器合胞体ウイルス)に関連する、悪性腫瘍(例えば、癌性リンパ管症)に関連すると分類されることもあり、又は特発性(例えば、サルコイドーシス、特発性肺線維症、ハンマン・リッチ症候群、抗合成酵素症候群)であることもある。
【0065】
[0078] 「ILD炎症」は、本明細書で使用されるとき、基礎的炎症によって特徴付けられる分析上の一群の炎症性ILD亜型を指す。これらの亜型は、まとめて、IPF及び/又は任意の他の非炎症性肺疾患亜型との比較として用いられ得る。「ILD炎症」には、HP、NSIP、サルコイドーシス、及び/又は器質化肺炎が含まれ得る。
【0066】
[0079] 「特発性間質性肺炎」又は「IIP」(「非感染性肺炎」とも称される)は、例えば、剥離性間質性肺炎、非特異性間質性肺炎、リンパ球様間質性肺炎、原因不明の器質化肺炎、及び特発性肺線維症が含まれるILDのクラスを指す。
【0067】
[0080] 「特発性肺線維症」又は「IPF」は、本明細書で使用されるとき、肺の支持構成組織(間質)の線維化によって特徴付けられる慢性の進行型肺疾患を指す。定義上、この用語は、肺線維症の原因が不明(「特発性」)の場合に使用される。顕微鏡的には、IPFを有する患者の肺組織は、通常型間質性肺炎(UIP)として知られる特有の一組の組織学的/病理学的特徴を示し、UIPは病理学的にIPFに対応するものである。
【0068】
[0081] 「非特異性間質性肺炎」又は「NSIP」は、一様な又は斑状のコラーゲン沈着を伴う慢性炎症細胞により定義される細胞パターン及びびまん性斑状線維症により定義される線維化パターンによって概して特徴付けられる特発性間質性肺炎の一形態である。UIPと対照的に、通常型間質性肺炎を特徴付ける蜂巣状の外観も線維芽細胞病巣もない。
【0069】
[0082] 「過敏性肺炎」又は「HP」は、外因性アレルギー性肺胞炎(EAA)とも称され、吸入抗原(例えば有機塵)の結果としての、それに対する過剰免疫応答及び過敏性によって引き起こされる肺内の肺胞の炎症を指す。
【0070】
[0083] 「肺サルコイドーシス」又は「PS」は、小結節として形成し得る慢性炎症細胞の異常な集積(肉芽腫)を伴う症候群を指す。HPの炎症過程には、概して、肺胞、小気管支、及び微小血管が関わる。急性及び亜急性のHP症例では、通常、身体的診察によって乾性ラ音が明らかとなる。
【0071】
[0084] 用語「マイクロアレイ」は、ハイブリダイズ可能なアレイ要素、好ましくはポリヌクレオチドプローブが基板上に規則正しく並べられたものを指す。
【0072】
[0085] 用語「ポリヌクレオチド」は、単数形又は複数形で使用されるとき、概して任意のポリリボヌクレオチド又はポリデオキシリボヌクレオチド(polydeoxyribonucleotide)を指し、これは非修飾RNA若しくはDNA又は修飾RNA若しくはDNAであってもよい。従って、例えば、本明細書に定義するとおりのポリヌクレオチドには、限定なしに、一本鎖及び二本鎖DNA、一本鎖及び二本鎖領域を含むDNA、一本鎖及び二本鎖RNA、並びに一本鎖及び二本鎖領域を含むRNA、一本鎖の、若しくはより典型的には二本鎖であってもよい、又は一本鎖及び二本鎖領域を含み得るDNA及びRNAを含むハイブリッド分子が含まれる。加えて、用語「ポリヌクレオチド」は、本明細書で使用されるとき、RNA又はDNA又はRNAとDNAとの両方を含む三重鎖領域を指す。かかる領域の鎖は同じ分子からのものであっても、又は異なる分子からのものであってもよい。この領域は、これらの分子のうちの1つ以上の全てを含み得るが、より典型的には分子の一部の領域のみが関わり得る。三重らせん領域の分子のうちの1つは、多くの場合にオリゴヌクレオチドである。用語「ポリヌクレオチド」にはまた、1つ以上の修飾塩基を含む(例えばそれにより、フルオロフォアなど、検出可能シグナルを提供する)DNA(例えばcDNA)及びRNAも含まれ得る。従って、安定性のため又はその他の理由で修飾された骨格を有するDNA又はRNAは、この用語が本明細書で意図されるとおりの「ポリヌクレオチド」である。更に、イノシンなどの普通でない塩基、又はトリチウム化塩基などの修飾塩基を含むDNA又はRNAが、本明細書に定義するとおりの用語「ポリヌクレオチド」の範囲内に含まれる。一般に、用語「ポリヌクレオチド」は、非修飾ポリヌクレオチドが化学的、酵素的及び/又は代謝的に修飾されたあらゆる形態、並びにウイルス及び単純型及び複雑型細胞を含めた細胞に特徴的なDNA及びRNAの化学的形態を包含する。
【0073】
[0086] 用語「オリゴヌクレオチド」は、限定なしに、一本鎖デオキシリボヌクレオチド、一本鎖又は二本鎖リボヌクレオチド、RNA:DNAハイブリッド及び二本鎖DNAを含めた比較的短いポリヌクレオチド(例えば、100、50、20ヌクレオチド以下)を指す。一本鎖DNAプローブオリゴヌクレオチドなどのオリゴヌクレオチドは、多くの場合に、例えば市販の自動オリゴヌクレオチド合成機を使用して化学的方法により合成される。しかしながら、オリゴヌクレオチドは、インビトロ組換えDNA媒介技法並びに細胞及び生物におけるDNAの発現によることを含め、他の種々の方法によって作られてもよい。
【0074】
[0087] 用語「遺伝子産物」又は「発現産物」は、本明細書では、mRNAを含めた遺伝子のRNA転写産物(RNA転写物)、及びRNA転写物のポリペプチド翻訳産物を指して同義的に使用される。遺伝子産物は、例えば、ポリヌクレオチド遺伝子発現産物(例えば、スプライシングされていないRNA、mRNA、スプライス変異体mRNA、マイクロRNA、断片化RNAなど)又はタンパク質発現産物(例えば、成熟ポリペプチド、翻訳後修飾ポリペプチド、スプライス変異体ポリペプチドなど)であってもよい。一部の実施形態において、遺伝子発現産物は、突然変異、融合、ヘテロ接合性の消失(loss of heterozygoxity)(LOH)、及び/又は生物学的パスウェイ効果を含む配列変異体であってもよい。
【0075】
[0088] 用語「正規化発現レベル」は、遺伝子発現産物に適用されるとき、1つ以上の参照(又は対照)遺伝子発現産物に対して正規化された遺伝子産物のレベルを指す。
【0076】
[0089] 「参照発現レベル」は、遺伝子発現産物に適用されるとき、1つ以上の参照(又は「対照」)遺伝子発現産物の発現レベルを指す。「参照正規化発現レベル」は、遺伝子発現産物に適用されるとき、1つ以上の参照(又は対照)遺伝子発現産物の正規化発現レベル値(即ち、正規化参照発現レベル)を指す。一部の実施形態において、参照発現レベルは、本明細書に記載されるとおりの、正常サンプルにおける1つ以上の遺伝子産物の発現レベルである。一部の実施形態において、参照発現レベルは実験的に決定される。一部の実施形態において、参照発現レベルは、履歴的発現レベル、例えば正常サンプルにおける参照発現レベルのデータベース値であり、このサンプルは、単一の参照発現レベル、又は複数の参照発現レベルの要約(例えば、(i)単一のサンプルからの参照発現レベルの反復分析からの2つ以上、好ましくは3つ以上の参照発現レベルの平均値;(ii)複数の異なるサンプル(例えば、正常サンプル)からの参照発現レベルの分析からの2つ以上、好ましくは3つ以上の参照発現レベルの平均値;(iii)及び上述のステップ(i)及び(ii)の組み合わせ(即ち、複数のサンプルから分析された参照発現レベルの平均値、ここで参照発現レベルのうちの少なくとも1つはレプリケートで分析される)など)を示す。一部の実施形態において、「参照発現レベル」は、例えば他の手法によってUIP又は非UIPであると確定的に判定された(即ち、確認された病理診断)サンプルにおける、配列変異体の発現レベルである。
【0077】
[0090] 「参照発現レベル値」は、遺伝子発現産物に適用されるとき、1つ以上の参照(又は対照)遺伝子発現産物の発現レベル値を指す。「参照正規化発現レベル値」は、遺伝子発現産物に適用されるとき、1つ以上の参照(又は対照)遺伝子発現産物の正規化発現レベル値を指す。
【0078】
[0091] ハイブリダイゼーション反応の「ストリンジェンシー」は当業者により容易に決定され、概して、プローブ長、洗浄温度、及び塩濃度に依存する経験的計算である。一般に、長いプローブほど、適切なアニーリングに高い温度が要求される一方、短いプローブほど必要な温度が低い。ハイブリダイゼーションは、概して、相補鎖がその融解温度を下回る環境に存在する場合に変性DNAがリアニーリングする能力に依存する。プローブとハイブリダイズ可能配列との間の所望の相同性の程度が高いほど、用いられ得る相対温度が高くなる。結果として、相対温度が高いほどストリンジェンシーがより高い、一方で温度が低いほどより低い反応条件になる傾向があり得ることになる。ハイブリダイゼーション反応のストリンジェンシーに関する更なる詳細及び説明については、Ausubel et al., Current Protocols in Molecular Biology, (Wiley Interscience, 1995)を参照のこと。
【0079】
[0092] 本明細書に定義するとおりの「ストリンジェントな条件」又は「高いストリンジェンシー条件」は、典型的には:(1)洗浄に低イオン強度溶液及び高温、例えば、0.015M塩化ナトリウム/0.0015Mクエン酸ナトリウム/0.1%ドデシル硫酸ナトリウム、50℃を用いる;(2)ハイブリダイゼーションの間にホルムアミドなどの変性剤、例えば50%(v/v)ホルムアミド、加えて0.1%ウシ血清アルブミン/0.1%Ficoll/0.1%ポリビニルピロリドン/50mMリン酸ナトリウム緩衝液、pH6.5、750mM塩化ナトリウム、75mMクエン酸ナトリウム含有、42℃を用いる;又は(3)50%ホルムアミド、5×SSC(0.75M NaCl、0.075Mクエン酸ナトリウム)、50mMリン酸ナトリウム(pH6.8)、0.1%ピロリン酸ナトリウム、5×デンハルト溶液、超音波処理サケ精子DNA(50μg/ml)、0.1%SDS、及び10%硫酸デキストラン、42℃と、42℃で0.2×SSC(塩化ナトリウム/クエン酸ナトリウム)及び50%ホルムアミド中、55℃での洗浄、続いて0.1×SSC、EDTA含有、55℃からなる高ストリンジェンシー洗浄を用いる。
【0080】
[0093] 「中程度のストリンジェンシー条件」は、Sambrook et al., Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Press, 1989)によって記載されるとおり特定されてもよく、上記に記載されるものよりもストリンジェンシーが低い洗浄溶液及びハイブリダイゼーション条件(例えば、温度、イオン強度及び%SDS)の使用を含む。中程度のストリンジェンシー条件の例は、20%ホルムアミド、5×SSC(150mM NaCl、15mMクエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハルト溶液、10%硫酸デキストラン、及び20mg/ml変性剪断サケ精子DNAを含む溶液中における37℃で一晩のインキュベーションと、続く1×SSC中約37~50℃でのフィルタの洗浄である。当業者は、プローブ長などの要因に合わせる必要に応じて温度、イオン強度等をどのように調整すればよいか認識しているであろう。
【0081】
[0094] 「感度」は、本明細書で使用されるとき、検査した総数のうち実際に標的障害を有する真陽性の割合(即ち、標的障害のある患者で陽性検査結果を有する者の割合)を指す。「特異度」は、本明細書で使用されるとき、検査した全ての患者のうち実際に標的障害を有しない真陰性の割合(即ち、標的障害のない患者で陰性検査結果を有する者の割合)を指す。
【0082】
[0095] 本開示の文脈では、任意の特定の遺伝子セット中に挙げられる遺伝子の「少なくとも1つ」、「少なくとも2つ」、「少なくとも5つ」等の表現は、挙げられる遺伝子のいずれか1つ又はあらゆる組み合わせを意味する。
【0083】
[0096] 用語「スプライシング」及び「RNAスプライシング」は同義的に使用され、イントロンを取り除いてエクソンをつなぎ合わせることにより、真核細胞の細胞質に入り込む連続コード配列を含む成熟mRNAを産生するRNAプロセシングを指す。
【0084】
[0097] 「治療有効量」又は「治療有効用量」は、対象(例えば、好ましくは哺乳類、より好ましくはヒト)への投与時に、その動物において疾患又は病態の治療(以下に定義するとおり)を生じさせるのに十分な本開示の化合物の量を指す。「治療有効量」を成す本開示の化合物の量は、化合物、病態及びその重症度、投与方法、及び治療する対象の年齢に依存することになるが、当業者は自身の知識及び本開示を考慮した上で常法どおり決定することができる。従って化合物が「有効用量」で投与されるとき、それは、その化合物がかかる用量で対象において疾患又は病態(例えばIPF)の治療(以下に定義するとおり)を生じさせる能力を有することを意味するように意図される。
【0085】
[0098] 「治療すること」又は「治療」は、本明細書で使用されるとき、目的の疾患又は病態を有する対象、好ましくはヒトにおける目的の疾患又は病態(例えばIPF)の治療を包含し、及び(i)対象における疾患又は病態の発生を、特に、かかる対象がその病態に罹り易いが、それを有するとの診断はまだ受けていない場合に防止又は阻害すること;(ii)疾患又は病態を阻害すること、即ちその発症を止めること;(iii)疾患又は病態を軽減すること、即ち、疾患又は病態の退縮を生じさせること;又は(iv)疾患又は病態に起因する症状を軽減することを含む。本明細書で使用されるとき、用語「疾患」、「障害」、及び「病態」は同義的に使用されてもよく、又は特定の病気、傷害又は病態が既知の原因物質を有しない(従って病因がいまだ解明されていない)こともあり、従っていまだ傷害又は疾患としては認識されておらず、単に望ましくない病態又は症候群とのみ認識されている(ここでは程度の差はあるが具体的な一組の症状が臨床医によって同定されている)点で異なってもよい。
【0086】
[0099] 用語「エクソン」は、成熟RNA産物に出現する分断遺伝子の任意のセグメントを指す(B. Lewin, Genes 7V (Cell Press, 1990))。理論上、用語「イントロン」は、転写されるが、転写物内からその両側のエクソンを共にスプライシングすることによって取り除かれるDNAの任意のセグメントを指す。操作上、エクソン配列は、Ref. SEQ ID番号によって定義されるとおりの遺伝子のmRNA配列に存在する。操作上、イントロン配列は、エクソン配列に囲まれた、通常はその5’及び3’境界にGT及びAGスプライスコンセンサス配列を有する、遺伝子のゲノムDNA内の介在配列である。
【0087】
[0100] 「コンピュータベースシステム」は、情報の分析に使用されるハードウェア、ソフトウェア、及びデータ記憶媒体のシステムを指す。患者コンピュータベースシステムのハードウェアには、中央演算処理装置(CPU)、並びにデータ入力用、データ出力用(例えばディスプレイ)、及びデータ記憶用ハードウェアが含まれ得る。データ記憶媒体には、上記に記載したとおりの本情報の記録を含む任意の製品、又はかかる製品にアクセスすることのできるメモリアクセス装置が含まれ得る。
【0088】
[0101] 本明細書で使用されるとき、用語「モジュール」は、例えば、メモリ、プロセッサ、電気的トレース、光コネクタ、ソフトウェア(ハードウェアにおいて実行される)などを含み得る作動可能に結合された電気的構成要素の任意のアセンブリ及び/又はセットを指す。例えば、プロセッサにおいて実行されるモジュールは、当該のモジュールに関連する1つ以上の具体的な機能を遂行する能力を有するハードウェアベースのモジュール(例えば、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、デジタルシグナルプロセッサ(DSP))及び/又はソフトウェアベースのモジュール(例えば、メモリに記憶される及び/又はプロセッサで実行されるコンピュータコードのモジュール)の任意の組み合わせであってもよい。
【0089】
[0102] コンピュータ可読媒体上にデータ、プログラミング又は他の情報を「記録する」とは、様々な方法を用いて情報を記憶するプロセスを指す。記憶された情報にアクセスするために用いられる手法に基づき、任意の好都合なデータ記憶構造が選択されてもよい。記憶には、種々のデータプロセッサプログラム及びフォーマット、例えば文書処理テキストファイル、データベースフォーマット等が用いられ得る。
【0090】
[0103] 「プロセッサ」(又は「コンピュータプロセッサ」)は、それに必要な機能を遂行し得る任意のハードウェア及び/又はソフトウェアの組み合わせを指す。例えば、好適なプロセッサは、電子制御器、メインフレーム、サーバ又はパーソナルコンピュータ(デスクトップ型又は携帯型)の形態で利用可能なものなど、プログラム可能デジタルマイクロプロセッサであってもよい。プロセッサがプログラム可能な場合、好適なプログラミングはリモート位置からプロセッサに伝達されてもよく、又はコンピュータプログラム製品(磁気装置、光学装置又は固体装置のいずれがベースかに関わらず、携帯型又は固定式コンピュータ可読記憶媒体など)に予め保存されていてもよい。例えば、磁気媒体又は光ディスクがプログラミングを担持してもよく、その対応するステーションで各プロセッサと交信する好適なリーダによって読み出されてもよい。
【0091】
[0104] 「検査サンプル」は、対象から入手された1つ以上の細胞のサンプル、好ましくは組織サンプル(例えば、経気管支生検(TBB)サンプルなどの肺組織サンプル)である。一部の実施形態において、検査サンプルは、様々な手法(例えば外科手術)によって入手することのできる生検サンプルである。詳細な実施形態において、検査サンプルは、ビデオ補助下胸腔鏡手術(VATS);気管支肺胞洗浄(BAL);経気管支生検(TBB);又はクライオ経気管支生検によって入手されたサンプルである。検査サンプルは、ブラッシング(サイトブラシ、ヒストブラシによるなど);気管支生検;気管支洗浄;又は針穿刺吸引など、補助的気管支鏡手技によって入手されてもよい。サンプルは、口腔内洗浄、タッチプレップ、又は痰採取によって入手されてもよい。検査サンプルは、患者が呈する臨床徴候及び症状(例えば、息切れ(一般に労作によって悪化する)、乾性咳嗽)、及び、場合によっては画像検査(例えば、胸部X線、コンピュータ断層撮影(CT))、肺機能検査(例えば、スパイロメトリー、オキシメトリー、運動負荷検査)、肺組織分析(例えば、気管支鏡検査、気管支肺胞洗浄、外科生検によって入手されたサンプルの組織学的及び/又は細胞学的分析)のうちの1つ以上の結果に基づき肺疾患、例えばILDを有すると疑われる患者から入手されてもよい。一部の実施形態において、検査サンプルは対象の呼吸上皮から入手される。呼吸上皮は、口、鼻、咽頭、気管、気管支、細気管支、又は肺胞からのものであってもよい。しかしながら、他の呼吸上皮源もまた使用することができる。一部の実施形態において、検査サンプルはプールサンプルである。
【0092】
[0105] 用語「プール」は、本明細書では、(i)「物理的プール」、即ち、実際にサンプルを共に混合すること、又は(ii)「インシリコプール」、即ち、サンプルで検出される1つ以上の遺伝子の発現値をプールする方法のいずれかを記載するために使用される。かかるインシリコプールをどのように実施し得るかについての非限定的な例は、実施例6に概説する。用語「インシリコ混合」及び「インシリコプール」は、本明細書では同義的に使用される。物理的プールを受けた複数のサンプルを含むサンプル(例えば検査サンプル)は、本明細書では「プールサンプル」と称され得る。
【0093】
[0106] 用語「対象」は、本明細書で使用されるとき、概して哺乳類を指す。典型的には、対象はヒトである。しかしながら、この用語は、他の種、例えば、ブタ、マウス、ラット、イヌ、ネコ、又は他の霊長類を包含する。特定の実施形態において、対象はマウス又はラットなどの実験対象である。対象は雄又は雌であってもよい。対象は、乳児、歩き始めの子ども、小児、若年成人、成人又は老人であってもよい。対象は、喫煙者、喫煙経験者又は非喫煙者であってもよい。対象はILDの個人歴又は家族歴を有してもよい。対象はILDのない個人歴又は家族歴を有してもよい。対象はILD又は別の肺障害(例えば、癌、肺気腫、COPD)の1つ以上の症状を呈してもよい。例えば、対象は息切れ(一般に労作によって悪化する)及び/又は乾性咳嗽)を呈してもよく、及び、場合によっては、ILD又は別の肺障害が存在する可能性を示す画像検査(例えば、胸部X線、コンピュータ断層撮影(CT))、肺機能検査(例えば、スパイロメトリー、オキシメトリー、運動負荷検査)、肺組織分析(例えば、気管支鏡検査、気管支肺胞洗浄、外科生検によって入手されたサンプルの組織学的及び/又は細胞学的分析)のうちの1つ以上の結果を入手していてもよい。一部の実施形態において、対象は慢性閉塞性肺疾患(COPD)を有するか、又はそれと診断されている。一部の実施形態において、対象はCOPDを有しないか、又はそれと診断されていない。医師又は他の医療提供者のケア下にある対象は、「患者」と称され得る。
【0094】
[0107] 「遺伝子シグネチャ」は、何らかの特徴又は表現型の指標となる遺伝子発現パターン(即ち、1つ以上の遺伝子、又はその断片の発現レベル)である。一部の実施形態において、遺伝子シグネチャとは、その発現及び/又は発現の欠如がUIP、非UIP、喫煙者状態、又は非喫煙者状態の指標となる遺伝子、複数の遺伝子、遺伝子の断片又は1つ以上の遺伝子の複数の断片の発現(及び/又は発現の欠如)を指す。
【0095】
[0108] 本明細書で使用されるとき、「~は喫煙者である」とは、現在紙巻きタバコを喫煙している対象、又は過去に紙巻きタバコを喫煙していたことがある人、又は現在紙巻きタバコを喫煙している若しくは過去に紙巻きタバコを喫煙していたことがある人の遺伝子シグネチャを有する人を指すことが意図される。
【0096】
[0109] 本明細書で使用されるとき、本開示の分類器の訓練時に使用される特徴を記載するために使用される場合の「変異体」は、選択的スプライス変異体を指す。
【0097】
[0110] 本明細書で使用されるとき、本開示の分類器の訓練時に使用される特徴を記載するために使用される場合の「突然変異」は、既知の正常参照配列からの配列の逸脱を指す。一部の実施形態において、逸脱は、UniGeneデータベース(Pontius JU, Wagner L, Schuler GD. UniGene: a unified view of the transcriptome. In: The NCBI Handbook. Bethesda (MD): National Center for Biotechnology Information; 2003、本明細書に援用される)、RefSeq(The NCBI handbook [Internet]. Bethesda (MD): National Library of Medicine (US), National Center for Biotechnology Information; 2002 Oct. Chapter 18, The Reference Sequence (RefSeq) Project、ワールドワイドウェブアドレス:ncbi.nlm.nih.gov/refseq/)で利用可能、Ensembl(EMBL、ワールドワイドウェブアドレス:ensembl.org/index.htmlで利用可能)など、公的にアクセス可能なデータベースに係る認められた天然遺伝子配列からの逸脱である。一部の実施形態において、突然変異には、参照配列に存在する配列残基の付加、欠失、又は置換が含まれる。
【0098】
[0111] 略称には、以下が含まれる:HRCT、高分解能コンピュータ断層撮影;VATS、ビデオ補助下胸腔鏡手術(thorascopic surgery);SLB、外科的肺生検;TBB、経気管支生検;RB、呼吸細気管支炎;OP、器質化肺炎、DAD、びまん性肺胞障害、CIF/NOC、他に分類されない慢性間質性線維症;MDT、集学的チーム;CV、交差検証;LOPO、患者一人抜き;ROC、受信者動作特性;AUC、曲線下面積;RNASeq、次世代シーケンシング技術によるRNAシーケンシング;NGS、次世代シーケンシング技術;H&E、ヘマトキシリン・エオシン;FDR、偽発見率;IRB、施設内審査委員会;ATS、米国胸部学会(American Thoracic Society);COPD、慢性閉塞性肺疾患;KEGG、京都遺伝子ゲノム百科事典(Kyoto Encyclopedia of Genes and Genomes);CI、信頼区間。
【0099】
[0112] 値の範囲が提供される場合、文脈上特に明確に指示されない限り下限の単位の10分の1に至るまでの、当該の範囲の上限と下限との間にある各中間値及び当該の記載される範囲にある任意の他の記載される値又は中間値が本開示の範囲内に包含されることが理解される。これらのより小さい範囲の上限及び下限は、独立に、記載される範囲における任意の具体的に除外される限界値を条件としてそのより小さい範囲に含まれることができ、また本開示の範囲内に包含される。記載される範囲が限界値の一方又は両方を含む場合、それらの含まれる限界値の一方又は両方を除外する範囲もまた本開示に含まれる。本明細書で使用されるとき、「約」は、指示される値の±10%を意味する。
【0100】
通常型間質性肺炎(UIP)の検出方法
[0113] 本明細書には、分子シグネチャを使用してUIPを非UIPと鑑別する方法及び/又はそのためのシステムが開示される。専門家の病理診を利用できない場合にサンプル(例えば、患者から入手されたサンプル)からのUIPの正確な診断は、診断を加速させ、ひいては治療決定が促進されるとともに、患者にとっては手術リスクが低下し、且つ医療制度にとっては費用の削減となることにより、ILD患者を利することになる。
【0101】
[0114] また、本明細書には、対象の喫煙者又は非喫煙者状態を用いて分子シグネチャを使用したUIPと他のILD亜型との鑑別を向上させる方法及び/又はそのためのシステムも開示される。
【0102】
[0115] 従って、本明細書に開示される方法及び/又はシステムは、事前に臨床情報又は人口統計学的情報がなくても転写データ(例えば高次元転写データ)に基づきUIPを非UIPパターンと鑑別することのできる分類器を提供する。
【0103】
[0116] 一部の実施形態において、本開示は、表1及び/又は表15に提示される1つ以上の配列若しくはその断片又は表1及び/又は表15からの少なくとも1つの配列若しくはその断片を含む又はそれからなる分類器を使用してUIPを非UIPと鑑別する方法を提供する。一部の実施形態において、本開示は、表5に示される1つ以上の遺伝子又は表5からの少なくとも1つの配列若しくはその断片を含む又はそれからなる分類器を使用してUIPを非UIPと鑑別する方法を提供する。一部の実施形態において、本開示は、表1及び/又は表15に提示される1つ以上の配列又は表1及び/又は表15からの少なくとも1つの配列を含む又はそれからなる分類器を使用してUIPを非UIPと鑑別する方法を提供する。一部の実施形態において、本開示は、表1及び/又は表15に提供される配列のうちの少なくとも1、2、3、4、5、6、7、8、9、10又はそれ以上を含む又はそれからなる分類器を使用するという方法を提供する。一部の実施形態において、本開示は、表5に提供される配列のうちの少なくとも1、2、3、4、5、6、7、8、9、10又はそれ以上を含む又はそれからなる分類器を使用するという方法を提供する。例えば、一部の実施形態において、本開示は、間にある全ての整数(例えば、16、17、18、19、21、22、23、24、25配列等)及び範囲(例えば、表1からの約1~10配列、約10~15配列、10~20配列、5~30配列、5~50配列、10~100配列、50~151配列等)を含め、表1に提供される少なくとも11、12、13、14、15、20、30、50、100、125、150、又は151配列を含む又はそれからなる分類器を使用するという方法を提供する。一部の実施形態において、本開示は、間にある全ての整数(例えば、表15からの16、17、18、19、21、22、23、24、25配列等)及び範囲(例えば、表15からの約1~10配列、表15からの約10~15配列、10~20配列、5~30配列、5~50配列、10~100配列、50~169配列等)を含め、表15に提供される少なくとも11、12、13、14、15、20、30、50、100、125、150、又は169配列を含む又はそれからなる分類器を使用するという方法を提供する。一部の実施形態において、本開示は、間にある全ての整数(例えば、表5からの16、17、18、19、21、22、23、24、25配列等)及び範囲(例えば、表1からの約1~10配列、表5からの約10~15配列、10~20配列、5~30配列、5~50配列、10~100配列、50~169配列、60~190配列等)を含め、表5に提供される少なくとも11、12、13、14、15、20、30、50、100、125、150、160、170、180、181、182、183、184、185、186、187、188、189、又は190遺伝子を含む又はそれからなる分類器を使用するという方法を提供する。一部の実施形態において、本開示は、間にある全ての整数(例えば、表1及び/又は表15からの16、17、18、19、21、22、23、24、25配列等)及び範囲(例えば、表1及び/又は表15からの約1~10配列、表1及び/又は表15からの約10~15配列、10~20配列、5~30配列、5~50配列、10~100配列、50~200、75~250、100~300配列等)を含め、表1及び表15の一方又は両方に提供される少なくとも11、12、13、14、15、20、30、50、100、125、150、200、250、300、又は320配列を含む又はそれからなる分類器を使用するという方法を提供する。一部の実施形態において、本開示は、間にある全ての整数(例えば、表1、表5及び/又は表15からの16、17、18、19、21、22、23、24、25配列等)及び範囲(例えば、表1、表5、及び/又は表15からの約1~10配列、表1、表5、及び/又は表15からの約10~15配列、10~20配列、5~30配列、5~50配列、10~100配列、50~200、75~250、100~300配列等)を含め、表1、表5、及び表15のうちの1、2、又は全てに提供される少なくとも11、12、13、14、15、20、30、50、100、125、150、200、250、300、320、350遺伝子、又はそれ以上を含む又はそれからなる分類器を使用するという方法を提供する。
【0104】
【0105】
【0106】
【0107】
【0108】
[0117] 本明細書に挙げられるENSG識別名(即ち、遺伝子_id)は、ワールドワイドウェブアドレス:ensembl.org(この内容は全体として参照により本明細書に援用される)で利用可能なEnsemblデータベースの遺伝子識別名を指す。
【0109】
[0118] 一部の詳細な実施形態において、本開示は、表1及び/又は表15に挙げられる配列のうちの1つ以上又はその断片を含む又はそれからなる分類器を使用してUIPを非UIPと鑑別するための方法及び/又はシステムを提供する。詳細な態様では、分類器は、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含み得る。他の態様において、分類器はこれらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。
【0110】
[0119] 一部の詳細な実施形態において、本開示は、表5に挙げられる配列のうちの1つ以上又はその断片を含む又はそれからなる分類器を使用してUIPを非UIPと鑑別するための方法及び/又はシステムを提供する。詳細な態様では、分類器は、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含み得る。他の態様において、分類器はこれらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。特定の実施形態において、本開示は、Envisia分類器を使用してUIPを非UIPと鑑別するための方法及び/又はシステムを提供し、この分類器は、表5に挙げられる遺伝子を全て含み得る。
【0111】
[0120] 一部の実施形態において、本開示は、以下の配列:ENSG00000162408;ENSG00000116285;ENSG00000219481;ENSG00000204219;ENSG00000117751;ENSG00000159023;ENSG00000116761;ENSG00000117226;ENSG00000163386;ENSG00000186141;ENSG00000122497;ENSG00000203832;ENSG00000143379;ENSG00000143367;ENSG00000163220;ENSG00000007933;ENSG00000143322;ENSG00000174307;ENSG00000143466;ENSG00000135766;ENSG00000163029;ENSG00000115828;ENSG00000135625;ENSG00000115317;ENSG00000228325;ENSG00000074582;ENSG00000123983;ENSG00000144712;ENSG00000168036;ENSG00000187094;ENSG00000179152;ENSG00000173402;ENSG00000163412;ENSG00000227124;ENSG00000184500;ENSG00000181458;ENSG00000034533;ENSG00000198585;ENSG00000172667;ENSG00000078070;ENSG00000033050;ENSG00000105983;ENSG00000164821;ENSG00000012232;ENSG00000130958;ENSG00000041982;ENSG00000136861;ENSG00000136933;ENSG00000160447;ENSG00000148357;ENSG00000170835;ENSG00000130653;ENSG00000165997;ENSG00000120539;ENSG00000156113;ENSG00000138166;ENSG00000148925;ENSG00000171714;ENSG00000149090;ENSG00000254761;ENSG00000137474;ENSG00000149289;ENSG00000120647;ENSG00000111679;ENSG00000139197;ENSG00000110900;ENSG00000123358;ENSG00000172789;ENSG00000073910;ENSG00000083544;ENSG00000187630;ENSG00000157379;ENSG00000100557;ENSG00000100592;ENSG00000100650;ENSG00000119711;ENSG00000128891;ENSG00000140718;ENSG00000182810;ENSG00000103044;ENSG00000163872;ENSG00000197701;ENSG00000168826;ENSG00000178988;ENSG00000178177;ENSG00000109618;ENSG00000250317;ENSG00000081041;ENSG00000145284;ENSG00000163644;ENSG00000163110;ENSG00000138795;ENSG00000205403;ENSG00000153404;ENSG00000206077;ENSG00000145736;ENSG00000145730;ENSG00000168938;ENSG00000113621;ENSG00000120738;ENSG00000253953;ENSG00000261934;ENSG00000155846;ENSG00000186470;ENSG00000026950;ENSG00000137331;ENSG00000244731;ENSG00000240065;ENSG00000204252;ENSG00000137309;ENSG00000137166;ENSG00000124702;ENSG00000112299;ENSG00000111962;ENSG00000112110;ENSG00000048052;ENSG00000006625;ENSG00000075303;ENSG00000158457;ENSG00000050327;ENSG00000072310;ENSG00000108448;ENSG00000141068;ENSG00000196712;ENSG00000242384;ENSG00000073605;ENSG00000167941;ENSG00000154263;ENSG00000161533;ENSG00000181045;ENSG00000211563;ENSG00000132199;ENSG00000154655;ENSG00000075643;ENSG00000101000;ENSG00000130005;ENSG00000130513;ENSG00000213965;ENSG00000006659;ENSG00000086544;ENSG00000104812;ENSG00000167757;ENSG00000198464;ENSG00000022556;ENSG00000083814;ENSG00000093072;ENSG00000185133;ENSG00000198792;ENSG00000189306;ENSG00000100376;ENSG00000154642のうちの2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;又は151を単独又は任意の組み合わせで含む又はそれからなる分類器を使用してUIPを非UIPと鑑別するための方法及び/又はシステムを提供する。詳細な態様では、かかる分類器は、追加の遺伝子、例えば、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含む。他の態様では、分類器は、上述の遺伝子のうちの幾つか、例えば、これらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。
【0112】
[0121] 一部の実施形態において、本開示は、以下の配列:ENSG00000162408;ENSG00000116285;ENSG00000219481;ENSG00000204219;ENSG00000117751;ENSG00000159023;ENSG00000116761;ENSG00000117226;ENSG00000163386;ENSG00000186141;ENSG00000122497;ENSG00000203832;ENSG00000143379;ENSG00000143367;ENSG00000163220;ENSG00000007933;ENSG00000143322;ENSG00000174307;ENSG00000143466;ENSG00000135766;ENSG00000163029;ENSG00000115828;ENSG00000135625;ENSG00000115317;ENSG00000228325;ENSG00000074582;ENSG00000123983;ENSG00000144712;ENSG00000168036;ENSG00000187094;ENSG00000179152;ENSG00000173402;ENSG00000163412;ENSG00000227124;ENSG00000184500;ENSG00000181458;ENSG00000034533;ENSG00000198585;ENSG00000172667;ENSG00000078070;ENSG00000033050;ENSG00000105983;ENSG00000164821;ENSG00000012232;ENSG00000130958;ENSG00000041982;ENSG00000136861;ENSG00000136933;ENSG00000160447;ENSG00000148357;ENSG00000170835;ENSG00000130653;ENSG00000165997;ENSG00000120539;ENSG00000156113;ENSG00000138166;ENSG00000148925;ENSG00000171714;ENSG00000149090;ENSG00000254761;ENSG00000137474;ENSG00000149289;ENSG00000120647;ENSG00000111679;ENSG00000139197;ENSG00000110900;ENSG00000123358;ENSG00000172789;ENSG00000073910;ENSG00000083544;ENSG00000187630;ENSG00000157379;ENSG00000100557;ENSG00000100592;ENSG00000100650;ENSG00000119711;ENSG00000128891;ENSG00000140718;ENSG00000182810;ENSG00000103044;ENSG00000163872;ENSG00000197701;ENSG00000168826;ENSG00000178988;ENSG00000178177;ENSG00000109618;ENSG00000250317;ENSG00000081041;ENSG00000145284;ENSG00000163644;ENSG00000163110;ENSG00000138795;ENSG00000205403;ENSG00000153404;ENSG00000206077;ENSG00000145736;ENSG00000145730;ENSG00000168938;ENSG00000113621;ENSG00000120738;ENSG00000253953;ENSG00000261934;ENSG00000155846;ENSG00000186470;ENSG00000026950;ENSG00000137331;ENSG00000244731;ENSG00000240065;ENSG00000204252;ENSG00000137309;ENSG00000137166;ENSG00000124702;ENSG00000112299;ENSG00000111962;ENSG00000112110;ENSG00000048052;ENSG00000006625;ENSG00000075303;ENSG00000158457;ENSG00000050327;ENSG00000072310;ENSG00000108448;ENSG00000141068;ENSG00000196712;ENSG00000242384;ENSG00000073605;ENSG00000167941;ENSG00000154263;ENSG00000161533;ENSG00000181045;ENSG00000211563;ENSG00000132199;ENSG00000154655;ENSG00000075643;ENSG00000101000;ENSG00000130005;ENSG00000130513;ENSG00000213965;ENSG00000006659;ENSG00000086544;ENSG00000104812;ENSG00000167757;ENSG00000198464;ENSG00000022556;ENSG00000083814;ENSG00000093072;ENSG00000185133;ENSG00000198792;ENSG00000189306;ENSG00000100376;ENSG00000154642の全てを含む又はそれからなる分類器を使用してUIPを非UIPと鑑別するための方法及び/又はシステムを提供する。詳細な態様では、分類器は、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含む。
【0113】
[0122] 一部の実施形態において、本開示は、以下の遺伝子;単独又は組み合わせで:ENSG00000005381;ENSG00000005955;ENSG00000007908;ENSG00000007933;ENSG00000010379;ENSG00000012232;ENSG00000022556;ENSG00000026950;ENSG00000033050;ENSG00000038295;ENSG00000048052;ENSG00000054803;ENSG00000054938;ENSG00000060688;ENSG00000071909;ENSG00000072310;ENSG00000073605;ENSG00000078070;ENSG00000079385;ENSG00000081041;ENSG00000081985;ENSG00000082781;ENSG00000083814;ENSG00000086544;ENSG00000089902;ENSG00000092295;ENSG00000099251;ENSG00000099974;ENSG00000100376;ENSG00000100557;ENSG00000101544;ENSG00000102837;ENSG00000103044;ENSG00000103257;ENSG00000104812;ENSG00000105255;ENSG00000105559;ENSG00000105696;ENSG00000105784;ENSG00000105983;ENSG00000106018;ENSG00000106178;ENSG00000107929;ENSG00000108312;ENSG00000108551;ENSG00000109205;ENSG00000110092;ENSG00000110900;ENSG00000110975;ENSG00000111218;ENSG00000111321;ENSG00000111328;ENSG00000112164;ENSG00000112299;ENSG00000112852;ENSG00000114248;ENSG00000114923;ENSG00000115415;ENSG00000115607;ENSG00000116285;ENSG00000116761;ENSG00000119711;ENSG00000119725;ENSG00000120217;ENSG00000120738;ENSG00000120903;ENSG00000121380;ENSG00000121417;ENSG00000122497;ENSG00000124205;ENSG00000124702;ENSG00000124935;ENSG00000125255;ENSG00000128016;ENSG00000128266;ENSG00000128791;ENSG00000128891;ENSG00000130164;ENSG00000130487;ENSG00000130598;ENSG00000131095;ENSG00000131142;ENSG00000132199;ENSG00000132204;ENSG00000132915;ENSG00000132938;ENSG00000133636;ENSG00000133794;ENSG00000134028;ENSG00000134245;ENSG00000135148;ENSG00000135447;ENSG00000135625;ENSG00000136881;ENSG00000136883;ENSG00000136928;ENSG00000136933;ENSG00000137285;ENSG00000137463;ENSG00000137573;ENSG00000137709;ENSG00000137968;ENSG00000138166;ENSG00000138308;ENSG00000140274;ENSG00000140279;ENSG00000140323;ENSG00000140450;ENSG00000140465;ENSG00000140505;ENSG00000140718;ENSG00000141279;ENSG00000142178;ENSG00000142661;ENSG00000143185;ENSG00000143195;ENSG00000143320;ENSG00000143322;ENSG00000143367;ENSG00000143379;ENSG00000143603;ENSG00000144655;ENSG00000145248;ENSG00000145284;ENSG00000145358;ENSG00000145736;ENSG00000148541;ENSG00000148700;ENSG00000148702;ENSG00000149043;ENSG00000149289;ENSG00000151012;ENSG00000151572;ENSG00000152672;ENSG00000153404;ENSG00000154227;ENSG00000154451;ENSG00000156414;ENSG00000157103;ENSG00000157680;ENSG00000158457;ENSG00000159231;ENSG00000159674;ENSG00000161609;ENSG00000162594;ENSG00000163029;ENSG00000163110;ENSG00000163285;ENSG00000163412;ENSG00000163635;ENSG00000163644;ENSG00000163735;ENSG00000163817;ENSG00000163884;ENSG00000164604;ENSG00000164821;ENSG00000165948;ENSG00000165973;ENSG00000165983;ENSG00000166923;ENSG00000167748;ENSG00000168004;ENSG00000168036;ENSG00000168062;ENSG00000168394;ENSG00000168661;ENSG00000168938;ENSG00000169248;ENSG00000170113;ENSG00000170442;ENSG00000170509;ENSG00000170837;ENSG00000171016;ENSG00000171408;ENSG00000171649;ENSG00000171714;ENSG00000172137;ENSG00000172183;ENSG00000172215;ENSG00000172667;ENSG00000173809;ENSG00000173812;ENSG00000173926;ENSG00000175764;ENSG00000175806;ENSG00000176046;ENSG00000177182;ENSG00000177294;ENSG00000178187;及びENSG00000178229のうちの2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;151;152;153;154;155;156;157;158;159;160;161;162;163;164;165;166;167;168;169;170;171;172;173;174;175;176;177;178;179;180;181;182;183;184;185;186;187;188;189;又は190を含む又はそれからなる分類器を使用してUIPを非UIPと鑑別するための方法及び/又はシステムを提供する。詳細な態様では、かかる分類器は、追加の遺伝子、例えば、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含む。他の態様では、分類器は上述の遺伝子のうちの幾つか、例えば、これらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。
【0114】
[0123] 一部の実施形態において、本開示は、以下の遺伝子;単独又は組み合わせで:MPO;GGNBP2;SELE;FMO3;SLC6A13;EXTL3;NLRP2;BTN3A1;ABCF2;TLL1;HDAC9;CBLN4;CHRDL2;SNRNP40;MYO3B;SREBF1;GSDMB;MCCC1;CEACAM1;CXCL2;IL12RB2;ITGB5;ZNF671;ITPKC;RCOR1;TGM1;HSD17B7P2;DDTL;FAM118A;C14orf105;ADNP2;OLFM4;HAS3;SLC7A5;GYS1;FSD1;PLEKHA4;TMEM59L;RUNDC3B;LMBR1;VIPR2;CCL24;LARP4B;UBTF;RASD1;ODAM;CCND1;TSPAN11;SYT10;PRMT8;LTBR;CDK2AP1;GLP1R;VNN1;PCDHB2;LRRC31;SLC4A3;STAT1;IL18RAP;ERRFI1;CTH;ALDH6A1;ZNF410;CD274;EGR1;CHRNA2;BCL2L14;ZNF211;NBPF14;EDN3;KLHDC3;SCGB1D2;SLC10A2;ZFP36;GNAZ;TWSG1;C15orf57;LDLR;KLHDC7B;TNNI2;GFAP;CCL25;ENOSF1;LINC00470;PDE6A;MTUS2;NTS;ARNTL;ADAMDEC1;WNT2B;TRAFD1;PPP1R1A;EGR4;BAAT;KIF12;GABBR2;RABEPK;TUBB2B;MGARP;SULF1;POU2F3;SLC44A5;DUSP5;PLA2G12B;DUOXA2;DUOX2;DISP2;ARRDC4;CYP1A1;CYP1A2;FTO;NPEPPS;SIK1;MYOM3;XCL2;ILDR2;CRABP2;ABL2;TUFT1;SETDB1;KCNN3;CSRNP1;SLC10A4;SCD5;DDIT4L;GTF2H2;FAM13C;ADD3;HABP2;SYT8;ZC3H12C;SLC7A11;ANO4;CLEC4F;PLEKHG4B;CERS3;GBP5;TDRD9;SLC6A1;DGKI;TSPAN33;CBR3;SPON2;CCDC155;IL23R;SMC6;PDLIM5;GABRG1;EIF4E3;ATXN7;PPM1K;CXCL5;SLC6A20;KLF15;GPR85;DEFA4;IFI27L1;NELL1;PTER;GREM1;KLK1;HRASLS5;CTNNB1;BATF2;TAP1;ZNF30;PPIC;CXCL11;NIPA1;KRT86;HSD17B13;GPR27;PYGO1;PDE7B;ZIK1;ANO5;CALB2;ISG20;CXCR6;ZMAT3;TDRD12;EIF1;MARCH3;TTLL11;MSRA;NUPR1;CLVS1;FBXO39;ZNF454;及びZNF543のうちの2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;151;152;153;154;155;156;157;158;159;160;161;162;163;164;165;166;167;168;169;170;171;172;173;174;175;176;177;178;179;180;181;182;183;184;185;186;187;188;189;又は190を含む又はそれからなる分類器を使用してUIPを非UIPと鑑別するための方法及び/又はシステムを提供する。詳細な態様では、かかる分類器は、追加の遺伝子、例えば、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含む。他の態様では、分類器は上述の遺伝子のうちの幾つか、例えば、これらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。
【0115】
[0124] 一部の実施形態において、本開示は、本明細書に記載される分類器を使用してUIPを非UIPと鑑別するための方法及び/又はシステムを提供し、ここで方法は、対象を喫煙者又は非喫煙者に分類する分類器を実行することを更に含む。かかる喫煙者状態分類は、場合によってはUIP対非UIP分類器の実行前に実行することができ、又は喫煙者状態分類ステップは、本開示のUIP対非UIP分類器の訓練時(例えば、分類器訓練モジュールを使用する)に使用される共変量として組み込まれてもよい。
【0116】
[0125] 詳細な実施形態において、本開示は、Envisia分類器を使用してUIPを非UIPと鑑別するための方法及び/又はシステムを提供し、ここでこの方法は、対象を喫煙者又は非喫煙者に分類する分類器を実行することを更に含む。かかる喫煙者状態分類は、場合によってはEnvisia分類器の実行前に実行することができ、又は喫煙者状態分類ステップは、本開示に係る表5に挙げられる遺伝子を含むUIP対非UIP分類器の訓練時(例えば、分類器訓練モジュールを使用する)に使用される共変量としてEnvisia分類器に組み込まれてもよい。
【0117】
[0126] 一部の実施形態では、それに代えて又は加えて、本明細書に記載される分類器(例えば、Envisia分類器)を使用してUIPを非UIPと鑑別する方法及び/又はそのためのシステムは、UIP対非UIP分類器の訓練時(例えば、分類器訓練モジュールを使用する)又は実行時に喫煙者状態バイアスの影響を受けやすい特定の遺伝子又はその変異体を除外する又はそれに差を付けた重みを割り当てるステップを更に含む。本明細書で使用されるとき、「喫煙者状態バイアス」とは、非喫煙者患者ではUIP患者と非UIP患者とで発現差異があるが、喫煙者である(又は喫煙であった)UIP患者と非UIP患者とでは検出可能なほどの発現差異はない遺伝子又はその変異体を指す。
【0118】
[0127] 一部の実施形態において、本開示の方法及び/又はそのためのシステムは、少なくとも第1及び第2の分類器を含む階層化された分類器を含み、ここで第1の分類器は、喫煙者を非喫煙者と区別する遺伝子シグネチャを認識するように(例えば、分類器訓練モジュールを使用して)訓練され、第2の分類器は、それぞれ喫煙者又は非喫煙者におけるUIP対非UIPを区別するように(例えば、分類器訓練モジュールを使用して)訓練される。一部のかかる実施形態において、第2の分類器はEnvisia分類器である。
【0119】
[0128] 一部の実施形態では、それに代えて又は加えて、本明細書に記載される分類器を使用してUIPを非UIPと鑑別する方法及び/又はそのためのシステムは、対象から入手した複数のサンプルをプールするステップ、及び次にプールサンプルに存在する転写物群の発現レベルをアッセイすることを含む。一部の実施形態において、複数のサンプルは2、3、4、又は5つのサンプルに等しい。一部の実施形態において、複数のサンプルは5つより多いサンプルに等しい。一部の実施形態において、分類器は、配列番号1~151のうちの1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;又は151、又はこれらの任意の組み合わせを含む又はそれからなる。詳細な態様では、かかる分類器は、追加の遺伝子、例えば、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含む。他の態様において、分類器は上述の遺伝子のうちの幾つか、例えば、これらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。一部の実施形態において、分類器は、表5に挙げられる遺伝子のうちの2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;151;152;153;154;155;156;157;158;159;160;161;162;163;164;165;166;167;168;169;170;171;172;173;174;175;176;177;178;179;180;181;182;183;184;185;186;187;188;189;又は190を含む又はそれからなる。詳細な態様では、かかる分類器は、追加の遺伝子、例えば、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含む。他の態様において、分類器は上述の遺伝子のうちの幾つか、例えば、これらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。
【0120】
[0129] 一部の実施形態では、それに代えて又は加えて、本明細書に記載される分類器を使用してUIPを非UIPと鑑別する方法及び/又はそのためのシステムは、複数のサンプルの各々に存在する転写物群の発現レベルをアッセイした後に対象から入手した複数のサンプルをインシリコでプールするステップを含む。かかるインシリコプールの一例を実施例6に記載する。一部の実施形態において、インシリコプールの非限定的な例は、(i)個別対象から入手した複数のサンプルのうちの第1のサンプルに存在する転写物群の発現レベルをアッセイするステップ;(ii)個別対象から入手した複数のサンプルのうちの第2のサンプルに存在する同じ又は重複する転写物群の発現レベルをアッセイするステップ;(iii)場合によっては、個別対象から入手した複数のサンプル中の1つ以上の追加のサンプルにおける(第1及び第2のサンプルと比較したとき)同じ又は重複する転写物群の発現レベルをアッセイするステップ;(iv)発現レベルをスケーリングするステップ;(v)スケーリングした発現レベルを平均して「インシリコプールした」発現レベルを求めるステップ;(vi)平均したスケーリング後の発現レベルの分散安定化変換(VST)を行うステップ、(vii)インシリコプールした発現のVSTを使用してスコア化するステップ;及び(viii)スコアを決定境界と比較してUIP/非UIP予測ラベルを割り当てるステップを含む。
【0121】
[0130] 一部の実施形態において、インシリコプールによってプールされる複数のサンプル中に含まれる対象からのサンプルの数は、2、3、4、又は5つのサンプルに等しい。一部の実施形態において、複数のサンプル中のサンプルの数は5つより多いサンプルに等しい。一部の実施形態において、分類器は、配列番号1~151のうちの2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;又は151、又はこれらの任意の組み合わせを含む又はそれからなる。詳細な態様では、かかる分類器は、追加の遺伝子、例えば、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含む。他の態様において、分類器は上述の遺伝子のうちの幾つか、例えば、これらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。
【0122】
[0131] 一部の実施形態において、インシリコプールによってプールされる複数のサンプル中に含まれる対象からのサンプルの数は、2、3、4、又は5つのサンプルに等しい。一部の実施形態において、複数のサンプル中のサンプルの数は5つより多いサンプルに等しい。一部の実施形態において、分類器は、表5に挙げられる遺伝子のうちの2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;151;152;153;154;155;156;157;158;159;160;161;162;163;164;165;166;167;168;169;170;171;172;173;174;175;176;177;178;179;180;181;182;183;184;185;186;187;188;189;又は190を含む又はそれからなる。詳細な態様では、かかる分類器は、追加の遺伝子、例えば、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を含む。他の態様において、分類器は上述の遺伝子のうちの幾つか、例えば、これらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。
【0123】
[0132] 一部の詳細な実施形態において、UIPを非UIPと鑑別するためのコンピュータ生成分類器が、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練され、各訓練サンプルはUIP又は非UIPの確認された診断(即ち、本明細書に開示されるとおりの「分類ラベル」又は「真のラベル」(例えば、
図1を参照のこと))を有し、ここで訓練サンプルのうちの少なくとも2つは単一の対象から入手されたものである。一部の実施形態において、本開示は、かかる分類器(例えば、Envisia分類器)を使用してプール肺組織検査サンプルがUIP陽性か、それとも非UIP陽性かを検出する方法を提供し、この方法は、(A)検査サンプルに発現する1つ以上の転写物の発現レベルをアッセイすること;及び(B)コンピュータ生成の訓練済み分類器を使用して検査サンプルをUIP又は非UIPに分類することを含み、ここで検査サンプルは、物理的プールによるか、又はインシリコプールによってプールされる。
【0124】
[0133] 一部の実施形態において、全てのサンプルで別個に訓練することにより、最大限の代表性及びサンプリングの多様性が実現し、利用可能なサンプルの先験的サブサンプリングバイアスが軽減される。更に、一部の実施形態において、分類ステップにプールサンプルを使用することにより、サンプリング効果が緩和される。従って、一部の実施形態において、プールされた検査サンプル(物理的なもの又はインシリコプールによるもののいずれでも)と共に個別の(プールされていない)サンプルで訓練した分類器を使用すると、UIPを非UIPと鑑別する際の精度の向上がもたらされる。
【0125】
[0134] 従って、一実施形態において、本開示は、Envisia分類器を使用して対象からのプール肺組織検査サンプルがUIP陽性か、それとも非UIP陽性かを検出する方法を提供し、この方法は、(A)対象からの検査サンプルに発現する1つ以上の転写物の発現レベルをアッセイすること;及び(B)コンピュータ生成Envisia分類器を使用して検査サンプルをUIP又は非UIPに分類することを含み、ここで検査サンプルは、物理的プールによるか、又はインシリコプールによってプールされた対象からの複数のサンプルを含む。一部の実施形態において、複数のサンプルは2、3、4、又は5つのサンプルを含む。一部の実施形態において、複数のサンプルは5つより多いサンプルを含む。
【0126】
[0135] 一部の実施形態において、本明細書に記載される分類器(例えば、Envisia分類器)を使用してUIPを非UIPと鑑別する方法及び/又はそのためのシステムは、ばらつきのある細胞組成を有するサンプル(例えば、単一のサンプル又はサンプルのプール)においてUIPを非UIPと鑑別することを含む。一部の実施形態において、ばらつきのある細胞組成を有するサンプル(例えば、単一のサンプル又はサンプルのプール)は、1型肺胞細胞;2型肺胞細胞、細気管支細胞、肺前駆細胞、又はこれらの組み合わせを含む。一部の実施形態において、UIPを非UIPと鑑別する分類器の精度は、分類されるサンプル又はプールサンプルの肺胞含有量に依らない。本明細書で使用されるとき、用語「細胞組成に非依存的」は、UIPを非UIPと鑑別する分類器の精度が、分類にかけられるサンプル(例えば、単一のサンプル又はサンプルのプール)の肺胞含有量に依らないような分類器に関連して使用される。
【0127】
[0136] 一部の実施形態において、本開示は、細胞組成に非依存的な分類器を提供し、この分類器は、分類器精度とサンプル又はプールサンプルの肺胞含有量との間に約0.1;0.09;0.08;0.07;0.06;0.05;0.04;0.03;0.02未満;又は約0.01未満のピアソン相関を呈する。一部の実施形態において、本開示は、細胞組成に非依存的な分類器を提供し、この分類器は、分類器精度とサンプル又はプールサンプルの肺胞含有量との間に約-0.1;-0.09;-0.08;-0.07;-0.06;-0.05;-0.04;-0.03;-0.02より大きい;又は約-0.01より大きいピアソン相関を呈する。一部の実施形態において、細胞組成に非依存的な分類器はEnvisia分類器である。
【0128】
[0137] サンプルのばらつきのある細胞組成は、任意の好適な方法によって検出されてもよい。一部の実施形態において、ばらつきのある細胞組成は、細胞含有量の半定量的ゲノム尺度を用いて決定される。一部の実施形態において、細胞含有量の半定量的ゲノム尺度はサンプル中の肺胞細胞の相対存在量を決定する。
【0129】
[0138] 一部の実施形態において、肺胞含有量のかかる半定量的ゲノム尺度は、サンプル中の肺胞1型細胞の相対存在量を決定可能なメトリクス(「肺胞1型細胞メトリクス」)を含む。一部の実施形態において、肺胞1型細胞メトリクスは1つ以上の肺胞特異的遺伝子を含む。一部の実施形態において、1つ以上の肺胞特異的遺伝子は、主に肺胞1型細胞に発現する遺伝子である。特定の実施形態において、主に肺胞1型細胞に発現する1つ以上の肺胞特異的遺伝子は、AQP5、PDPN、又はこれらの組み合わせから選択される。詳細な実施形態において、AQP5、PDPN、又はこれらの組み合わせの発現は、サンプル中の肺胞1型細胞の存在量と相関する。詳細な実施形態において、本方法は、AQP5及びPDPNの発現レベルを検出すること、場合によってはその発現レベルを正規化すること、及びこれらの遺伝子の発現レベルを加算することを含み、ここで高い発現レベルはサンプル中の肺胞1型細胞含有量が高いことを示し;低い発現レベルはサンプル中の肺胞1型細胞含有量が低いことを示し;及び中程度の発現レベルはサンプル中の肺胞1型細胞含有量が中程度であることを示す。
【0130】
[0139] 詳細な実施形態において、本開示は、2つ以上のサンプルに存在する1型肺胞細胞の相対存在量を決定する方法を提供し、この方法は、(i)個別対象から入手した第1のサンプルにおける主に肺胞1型細胞に発現する肺胞特異的遺伝子の1つ以上の転写物の発現レベルをアッセイすること;(ii)個別対象から入手した第2のサンプルにおける主に肺胞1型細胞に発現する肺胞特異的遺伝子の同じ1つ以上の転写物の発現レベルをアッセイすること;(iii)及び2つのサンプル間で1つ以上の転写物の発現レベルを比較することにより、サンプルに存在する1型肺胞細胞の相対存在量を決定することを含む。一部の実施形態において、主に肺胞1型細胞に発現する1つ以上の肺胞特異的遺伝子は、AQP5、PDPN、又はこれらの組み合わせから選択される。一部の実施形態において、主に肺胞1型細胞に発現する1つ以上の肺胞特異的遺伝子は、AQP5、PDPN、又はこれらの組み合わせを含む。一部の実施形態において、主に肺胞1型細胞に発現する1つ以上の肺胞特異的遺伝子はAQP5及びPDPNの両方を含む。一部の実施形態において、第1のサンプルと第2のサンプルとは異なる対象から入手される。一部の実施形態において、第1のサンプルと第2のサンプルとは同じ対象から入手される。一部の実施形態において、本方法は、個別対象から入手した少なくとも1つの追加のサンプルにおける主に肺胞1型細胞に発現する肺胞特異的遺伝子の同じ1つ以上の転写物の発現レベルをアッセイすること、及び次に少なくとも1つの追加のサンプルにおける発現レベルを第1及び/又は第2のサンプルにおける発現レベルと比較することにより、サンプルに存在する1型肺胞細胞の相対存在量を決定することを更に含む。一部の実施形態において、サンプルのうちの少なくとも2つは同じ対象から入手される。一部の実施形態において、サンプルのうちの少なくとも3、4、5つ、又はそれ以上は同じ対象から入手される。一部の実施形態において、サンプルの全てが異なる対象から入手される。
【0131】
[0140] 一部の実施形態において、本開示は、サンプル中の肺胞2型細胞の相対存在量を決定可能なメトリクス(「肺胞2型細胞メトリクス」)を含む肺胞含有量の半定量的ゲノム尺度を提供する。一部の実施形態において、メトリクスは1つ以上の肺胞特異的遺伝子を含む。一部の実施形態において、1つ以上の肺胞特異的遺伝子は、主に肺胞2型細胞に発現する遺伝子である。特定の実施形態において、主に肺胞2型細胞に発現する1つ以上の肺胞特異的遺伝子は、SFTPB、SFTPC、SFTPD、又はこれらの組み合わせから選択される。特定の実施形態において、主に肺胞2型細胞に発現する1つ以上の肺胞特異的遺伝子は、SFTPB、SFTPC、SFTPD、又はこれらの組み合わせを含む。特定の実施形態において、主に肺胞2型細胞に発現する1つ以上の肺胞特異的遺伝子は、SFTPB、SFTPC、及びSFTPDを含む。一部の実施形態において、肺胞2型細胞メトリクスは、肺胞1型細胞及び肺胞2型細胞の両方に発現する1つ以上の肺胞特異的遺伝子を更に含む。特定の実施形態において、肺胞1型細胞及び肺胞2型細胞の両方に発現する遺伝子はSFTPA1である。詳細な実施形態において、メトリクスは、主に肺胞2型細胞に発現する1つ以上の肺胞特異的遺伝子と、肺胞1型細胞及び肺胞2型細胞の両方に発現する1つ以上の遺伝子とを含む。詳細な実施形態において、このメトリクスは、SFTPB、SFTPC、SFTPD、SFTPA1、又はこれらの組み合わせを含む。
【0132】
[0141] 詳細な実施形態において、本開示は、サンプル中の肺胞2型細胞の相対存在量を決定する方法を提供し、この方法は、FTPB、SFTPC、SFTPD、SFTPA1、又はこれらの組み合わせの発現レベルを検出すること、場合によってはその発現レベルを正規化すること、及びこれらの遺伝子の発現レベルを加算することを含み、ここで高い発現レベルはサンプル中の肺胞2型細胞含有量が高いことを示し;低い発現レベルはサンプル中の肺胞2型細胞含有量が低いことを示し;及び中程度の発現レベルはサンプル中の肺胞2型細胞含有量が中程度であることを示す。
【0133】
[0142] 詳細な実施形態において、本開示は、2つ以上のサンプルに存在する2型肺胞細胞の相対存在量を決定する方法を提供し;この方法は、(i)個別対象から入手した第1のサンプルにおける主に肺胞2型細胞に発現する肺胞特異的遺伝子の1つ以上の転写物の発現レベルをアッセイすること;(ii)個別対象から入手した第2のサンプルにおける主に肺胞2型細胞に発現する肺胞特異的遺伝子の同じ1つ以上の転写物の発現レベルをアッセイすること;(iii)及び2つのサンプル間で1つ以上の転写物の発現レベルを比較することにより、サンプルに存在する2型肺胞細胞の相対存在量を決定することを含む。一部のかかる実施形態において、1つ以上の肺胞特異的遺伝子は主に肺胞2型細胞に発現し、SFTPB、SFTPC、及びSFTPD、及びこれらの組み合わせから選択される。詳細な実施形態において、本方法は、第1及び第2のサンプルにおけるSFTPB、SFTPC、及びSFTPDの各々の発現をアッセイすることを含む。それに代えて、又は加えて、様々な実施形態において、本方法は、第1のサンプル及び第2のサンプルにおける1つ以上の追加の遺伝子の発現レベルをアッセイすることを更に含む。一部のかかる実施形態において、1つ以上の追加の遺伝子は、主に肺胞細胞に発現する遺伝子を含む。一部の実施形態において、追加の遺伝子は肺胞1型細胞及び肺胞2型細胞の両方に発現する。詳細な実施形態において、追加の遺伝子はSFTPA1である。一部の実施形態において、第1のサンプルと第2のサンプルとは異なる対象から入手される。一部の実施形態において、第1のサンプルと第2のサンプルとは同じ対象から入手される。一部の実施形態において、本方法は、個別対象から入手した少なくとも1つの追加のサンプルにおける主に肺胞1型細胞に及び/又は肺胞1型細胞及び肺胞2型細胞の両方に発現する肺胞特異的遺伝子の同じ1つ以上の転写物の発現レベルをアッセイすること、及び次に少なくとも1つの追加のサンプルにおける発現レベルを第1及び/又は第2のサンプルにおける発現レベルと比較することにより、サンプルに存在する2型肺胞細胞の相対存在量を決定することを更に含む。一部の実施形態において、サンプルのうちの少なくとも2つは同じ対象から入手される。一部の実施形態において、サンプルのうちの少なくとも3、4、5つ、又はそれ以上は同じ対象から入手される。一部の実施形態において、サンプルの全てが異なる対象から入手される。
【0134】
[0143] 本明細書に開示される方法は、情報提供遺伝子の発現レベルを1つ以上の適切な参照と比較することを含み得る。「適切な参照」とは、既知の肺ILD状態(即ち、UIP対非UIP;IPF対非IPF)の指標となる特定の情報提供遺伝子の発現レベル(又は発現レベルの範囲)である。適切な参照は、本方法の実施者が実験的に決定してもよく、又は既存の値若しくは値の範囲であってもよい。適切な参照は、UIP/非UIP状態の指標となる発現レベル(又は発現レベルの範囲)を代表する。例えば、適切な参照は、UIPを発現することが公知の参照(対照)生体サンプルにおける情報提供遺伝子の発現レベルを代表するものであってもよい。適切な参照がUIPの指標である場合、UIPの特徴付け又は診断を必要としている対象から決定された発現レベルと適切な参照との間に検出可能な差がない(例えば、統計的に有意な差がない)ことが、対象におけるUIPの指標となり得る。適切な参照がUIPの指標である場合、UIPの特徴付け又は診断を必要としている対象から決定された発現レベルと適切な参照との間に差があることが、UIPに罹っていない(即ち、非UIPの)対象の指標となり得る。
【0135】
[0144] 或いは、適切な参照は、UIPに罹っていない(即ち、非UIPの)対象の指標となる遺伝子の発現レベル(又は発現レベルの範囲)であってもよい。例えば、適切な参照は、UIPに罹っていないことが分かっている対象から入手された参照(対照)生体サンプルにおける特定の情報提供遺伝子の発現レベルを代表するものであってもよい。適切な参照が、UIPに罹っていない対象の指標である場合、UIPの診断を必要としている対象から決定された発現レベルと適切な参照との間に差があることが、対象におけるUIPの指標となり得る。或いは、適切な参照が、UIPに罹っていない対象の指標である場合、UIPの診断を必要としている対象から決定された発現レベルと適切な参照レベルとの間に検出可能がない(例えば、統計的に有意な差がない)ことが、UIPに罹っていない対象の指標となり得る。
【0136】
[0145] 一部の実施形態において、参照標準は閾値変化レベルを提供し、従ってサンプルにおける遺伝子の発現レベルが閾値変化(詳細なマーカーに応じて増加又は低下)レベル内にある場合、その対象はUIPに罹っていないと同定されるが、レベルが閾値を上回る場合、その対象はUIPを有するリスクがあると同定される。
【0137】
[0146] 一部の実施形態において、本方法は、情報提供遺伝子の発現レベルと、UIPを有しないと同定される対照対象におけるその情報提供遺伝子の発現レベルを代表する参照標準とを比較することを含む。この参照標準は、例えば、UIPを有しないと同定される対照対象集団における情報提供遺伝子の平均発現レベルであってもよい。
【0138】
[0147] 発現レベルと適切な参照との間の統計的に有意な差の大きさは様々であり得る。例えば、UIPを示す有意差は、生体サンプルにおける情報提供遺伝子の発現レベルが当該遺伝子の適切な参照よりも少なくとも1%、少なくとも5%、少なくとも10%、少なくとも25%、少なくとも50%、少なくとも100%、少なくとも250%、少なくとも500%、又は少なくとも1000%高い、又は低いときに検出され得る。同様に、有意差は、生体サンプルにおける情報提供遺伝子の発現レベルが、当該遺伝子の適切な参照よりも少なくとも1.1倍、1.2倍,1.5倍、2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも6倍、少なくとも7倍、少なくとも8倍、少なくとも9倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも100倍、又はそれ以上高い、又は低いときに検出され得る。一部の実施形態において、情報提供遺伝子と適切な参照との間の発現の少なくとも20%~50%の差が有意である。有意差は適切な統計的検定を用いることにより同定され得る。統計的有意性の検定の例は、Applied Statistics for Engineers and Scientists by Petruccelli, Chen and Nandram 1999 Reprint Ed(全体として参照により本明細書に援用される)に提供される。
【0139】
[0148] 対象のUIP状態を評価するため、複数の発現レベルを複数の適切な参照レベルと例えば遺伝子毎に比較し得ることが理解されるべきである。比較はベクトル差として行われてもよい。そのような場合、多変量検定、例えばホテリングのT2検定を用いて観察された差の有意性を判定してもよい。かかる多変量検定の例は、Applied Multivariate Statistical Analysis by Richard Arnold Johnson and Dean W. Wichern Prentice Hall; 6th edition (April 2, 2007)(全体として参照により本明細書に援用される)に提供される。
【0140】
分類方法
[0149] 本方法はまた、対象から入手された生体サンプルにおける情報提供遺伝子の一組の発現レベル(発現パターン又はプロファイルと称される)と、複数の一組の参照レベル(参照パターンと称される)であって、各々が既知のUIP状態と関連付けられる参照パターンとを比較すること、発現パターンと最も良く似ている参照パターンを同定すること、及び参照パターンの既知のUIP状態を発現パターンと関連付けることであって、それにより対象のUIP状態を分類する(特徴付ける)ことを含んでもよい。
【0141】
[0150] 本方法はまた、予測モデルを構築又は作成することを含んでもよく、予測モデルはまた、対象の疾患状態の分類に使用することのできる分類器又は予測器とも称され得る。本明細書で使用されるとき、「UIP分類器」は、対象から入手された生体サンプルにおいて決定される発現レベルに基づき対象のUIP状態を特徴付ける予測モデルである。典型的には、モデルは、分類(UIP状態)が既に確認されているサンプルを使用して構築される。モデル(分類器)が構築されると、次にこれが、UIP状態が未知の対象の生体サンプルから得られる発現レベルに適用されてもよく、それにより対象のUIP状態が予測される。詳細な実施形態において、UIP分類器はEnvisia分類器である。従って、本方法は、UIP分類器(例えば、Envisia分類器)を発現レベルに適用することを含んでもよく、従ってUIP分類器は発現レベルに基づき対象のUIP状態を特徴付けることになる。対象は、予測されたUIP状態に基づき、例えば医療提供者によって更に治療又は評価されてもよい。一部の実施形態において、対象は、予測されたUIP状態に基づき(例えば、対象から入手された検査サンプルからの遺伝子発現データに分類器を適用することにより決定されるUIPの分類に基づき、ピルフェニドン、ニンテダニブ、又はその薬学的に許容可能な塩から選択される化合物で治療されてもよい。検査サンプルは、対象からの複数(少なくとも1、2、3、4、5つ、又はそれ以上のサンプルなど)の物理的又はインシリコプールサンプルを含み得る。
【0142】
[0151] 分類方法は、対象がUIPを有する可能性の指標となるUIPリスクスコアへと発現レベルを変換することを含み得る。一部の実施形態において、例えば、GLMNETなどのエラスティックネット回帰モデルを使用する場合など、UIPリスクスコアは、重み付き発現レベルの組み合わせ(例えば、和、積、又は他の組み合わせ)として求められてもよく、ここで発現レベルは、UIPを有する可能性の増加の予測に対するその相対的寄与によって重みが付けられる。
【0143】
[0152] 種々の予測モデルをUIP分類器として使用し得る。例えば、UIP分類器は、ロジスティック回帰、部分最小二乗法、線形判別分析、二次判別分析、ニューラルネットワーク、単純ベイズ、C4.5決定木、k最近傍法、ランダムフォレスト、サポートベクターマシン、又は他の適切な方法から選択されるアルゴリズムを含み得る。
【0144】
[0153] UIP分類器は、UIPを有すると同定された複数の対象から入手された生体サンプルにおける複数の情報提供遺伝子の発現レベルを含むデータセットで訓練され得る。例えば、UIP分類器は、組織学的所見に基づきUIPを有すると同定された複数の対象から入手された生体サンプルにおける複数の情報提供遺伝子の発現レベルを含むデータセットで訓練され得る。訓練セットは、典型的には、UIPを有しないと同定された対照対象もまた含むことになる。当業者は理解するであろうとおり、訓練データセットの対象集団は意図的に種々の特性を有してもよく、例えば、集団の特性は、分類器を使用する診断方法が有用となり得る対象の特性に依存し得る。例えば集団は、全て男性、全て女性からなってもよく、又は男性及び女性の両方からなってもよい。集団は、癌の病歴を有する対象、癌の病歴を有しない対象、又は両方のカテゴリからの対象からなってもよい。集団は、喫煙者、喫煙経験者、及び/又は非喫煙者である対象を含んでもよい。
【0145】
[0154] モデルが生体サンプルを分類する際の信頼度を決定するため、クラス予測強度もまた測定することができる。この信頼度は、対象がモデルによって予測される特定のクラスである可能性の推定値として働き得る。
【0146】
[0155] 従って、予測強度は、サンプルの分類の信頼度を伝えるものであり、いつサンプルを分類することができないかを評価する。サンプルをテストしても、サンプルが特定のクラスに属しない、又は確実に割り当てることができない場合があり得る。これは、例えば、閾値、又は範囲を利用することにより達成されてもよく、ここで所定の閾値を上回る又は下回る、又は特定の範囲内にあるスコアを付けるサンプルは、分類することのできるサンプルではない(例えば「ノーコール」)。
【0147】
[0156] モデルが構築されると、様々な方法を用いてモデルの妥当性をテストすることができる。モデルの妥当性をテストする一つの方法は、データセットの交差検証によるものである。交差検証を行うには、サンプルのうちの1つ、又はサブセットを除き、その除いたサンプルなしに上記に記載したとおりモデルを構築して「交差検証モデル」を形成する。次に除いたサンプルを、本明細書に記載されるとおり、モデルによって分類する。このプロセスを初期データセットの全てのサンプル、又はサブセットについて行い、誤り率を決定する。次にモデルの精度を判定する。このモデルは、既知のクラス、又はクラスが予め確認されているクラスに関してテスト下のサンプルを高い精度で分類する。モデルを検証する別の方法は、UIP状態が未知の新規生体サンプルなど、独立したデータセットにモデルを適用することである。
【0148】
[0157] 当業者は理解するであろうとおり、モデルの強度は、限定はされないが、精度、感度及び特異度を含めた種々のパラメータによって判定し得る。精度、感度及び特異度の様々な計算方法が本明細書に記載される(例えば実施例を参照のこと)。UIP分類器は、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、又はそれ以上の精度を有し得る。UIP分類器は、約60%~70%、70%~80%、80%~90%、又は90%~100%の範囲の精度を有し得る。UIP分類器は、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、又はそれ以上の感度を有し得る。UIP分類器は、約60%~70%、70%~80%、80%~90%、又は90%~100%の範囲の感度を有し得る。UIP分類器は、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、又はそれ以上の特異度を有し得る。UIP分類器は、約60%~70%、70%~80%、80%~90%、又は90%~100%の範囲の特異度を有し得る。
【0149】
[0158] 使用目的集団(例えば、患者などの対象)におけるUIPのルールアウトに関して陰性的中率(NPV)は40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%以上であり得る。UIPがルールアウトされると、非UIPがルールインされ得る。
【0150】
[0159] UIP分類器は、UIPのルールインに関して40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%以上の陽性的中率(PPV)を有し得る。UIPがルールインされると、非UIPがルールアウトされ得る。
【0151】
[0160] 使用目的集団は、ちょうど又は約40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%の癌の有病率を有し得る。
【0152】
[0161] 一部の実施形態において、本開示の方法及び/又はシステムは、検査サンプル(例えば肺組織)から核酸(例えば、RNA、例えば全RNAなど)を抽出すること;核酸を(例えば、cDNA(場合によっては標識されたcDNA)(このcDNAは1つ以上のRNAサンプルから逆転写(RT-PCR)によって産生されてもよい)のポリメラーゼ連鎖反応媒介性増幅によって)増幅して発現核酸ライブラリを作製すること;アレイ(例えばマイクロアレイ)によるか、又はダイレクトシーケンシング(例えばRNAseq)によって、核酸ライブラリに存在する1つ以上の核酸の発現を検出すること(例えば、RT-PCRによって産生されるcDNA種を測定することによりRNA発現プロファイルを検出すること);及び本明細書に記載される訓練済み分類器(例えばEnvisia分類器)を使用して検査サンプルがUIPか、それとも非UIPかを決定することを含む。
【0153】
[0162] 一部の実施形態において、本開示の方法及び/又はシステムは、訓練演習に喫煙者状態を取り入れることを更に含む。特定の実施形態において、喫煙者状態は、場合によっては以下の方法のうちの1つで取り入れられる:
(i)訓練時(例えば、分類器訓練モジュールを使用する)にUIP又は非UIP分類器の共変量として喫煙状態を使用することによる。
(ii)UIP又は非UIP分類器訓練時(例えば、分類器訓練モジュールを使用する)に、喫煙者状態バイアスの影響を受けやすい複数の遺伝子を同定し、かかる遺伝子を除外するか、又は場合によっては、かかるバイアスの影響を受けにくい遺伝子と異なる重みを付けることによる。
(iii)喫煙者を非喫煙者と区別する遺伝子シグネチャを認識するように(例えば、分類器訓練モジュールを使用して)訓練される初期分類器を使用して、検査サンプルの遺伝子シグネチャに基づき検査サンプルを「喫煙者」又は「非喫煙者」に予備的に分類し;及び次に、予備分類後、喫煙者又は非喫煙者のいずれかにおけるUIPと非UIPとを区別するように(例えば、分類器訓練モジュールを使用して)訓練された異なる分類器を実行する階層化された分類を作成することによる。例えば、予備分類器によって検査サンプルが喫煙者からのものであると決定された場合、喫煙者からのUIP及び非UIPサンプルで(例えば、分類器訓練モジュールを使用して)訓練された分類器を使用してUIP対非UIP分類が行われる。逆に、予備分類器によって検査サンプルが非喫煙者からのものであると決定された場合、非喫煙者からのUIP及び非UIPサンプルで(例えば、分類器訓練モジュールを使用して)訓練された分類器を使用してUIP対非UIP分類が行われる。一部の実施形態において、かかる喫煙者又は非喫煙者特異的分類器は、少なくとも一部には、喫煙者状態バイアスの影響を受けやすい遺伝子が分類器訓練に含まれることによって引き起こされるバックグラウンドノイズの減少に起因して、診断性能の向上をもたらす。
【0154】
[0163] 従って、本開示はまた、本明細書に開示されるとおりの、UIPを非UIPと鑑別する方法における使用に好適な分類器(例えばEnvisia分類器)も提供する。様々な実施形態において、本開示は、UIPを非UIPと鑑別するのに好適な分類器を提供し、この分類器は、専門病理医によって決定された1つ以上の組織病理ラベルに対応するサンプル(例えば、個別サンプル又はプールサンプル)からマイクロアレイ、qRT-PCR、又はシーケンシングデータを使用して(例えば、分類器訓練モジュール、例えばEnvisia分類器(classifier)などを使用して)訓練される。一部の実施形態において、サンプルにはUIP又は非UIPのラベルが付される。
【0155】
[0164] 一部の実施形態において、本開示は、表1及び/又は表15に提示される1つ以上の配列又はその断片、又は表1及び/又は表15からの少なくとも1つの配列又はその断片を含む又はそれからなる分類器を提供する。一部の実施形態において、本開示は、表1及び/又は表15の任意の1つ以上又は全てに提供される配列のうちの少なくとも1、2、3、4、5、6、7、8、9、10又はそれ以上を含む又はそれからなる分類器を提供する。例えば、一部の実施形態において、本開示は、間にある全ての整数(例えば、16、17、18、19、21、22、23、24、25配列等)及び範囲(例えば、表5、表7、表8、表9、表10、表11、又は表12の任意の1つ以上又は全てからの約1~10配列、表1及び/又は表15の任意の1つ以上又は全てからの約10~15配列、10~20配列、5~30配列、5~50配列、10~100配列、50~151配列)を含め、表1に提供される少なくとも11、12、13、14、15、20、30、50、100、150、151配列を含む又はそれからなる分類器を提供する。一実施形態において、本開示は、表1及び/又は表15に提供される全ての配列を含む又はそれからなる分類器を提供する。
【0156】
[0165] 一部の実施形態において、本開示は、表5に示される1つ以上の配列又はその断片、又は表5からの少なくとも1つの配列又はその断片を含む又はそれからなる分類器を提供する。一部の実施形態において、本開示は、表5に提供される配列のうちの少なくとも1、2、3、4、5、6、7、8、9、10又はそれ以上を含む又はそれからなる分類器を提供する。例えば、一部の実施形態において、本開示は、間にある全ての整数(例えば、16、17、18、19、21、22、23、24、25配列等)及び範囲(例えば、表5、表7、表8、表9、表10、表11、又は表12の任意の1つ以上又は全てからの約1~10配列、表5からの約10~15配列、10~20配列、5~30配列、5~50配列、10~100配列、50~150配列、60~190配列)を含め、表5に提供される少なくとも11、12、13、14、15、20、30、50、100、150、160、170、180、又は190配列を含む又はそれからなる分類器を提供する。一実施形態において、本開示は、表5に提供される全ての配列を含む又はそれからなる分類器を提供する。
【0157】
[0166] 一部の詳細な実施形態において、本開示は、UIPを非UIPと鑑別するための分類器を提供し、この分類器は、配列番号1~151のうちの1つ以上、又はその断片、又はこれらの任意の組み合わせを含む又はそれからなる。一実施形態において、分類器は、上述の151配列全てを含む又はそれからなる。一部の実施形態において、本開示は、UIPを非UIPと鑑別するための分類器を提供し、この分類器は、上述の151配列のうちの2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;又は151を含む又はそれからなる。詳細な態様では、分類器は、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子又はその断片を含む。他の態様では、分類器は上述の151配列のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。他の態様では、151遺伝子の各々が他の遺伝子の任意の1つ以上、又は最大20の更なる遺伝子との組み合わせで使用されてもよい。
【0158】
[0167] 一部の詳細な実施形態において、本開示は、UIPを非UIPと鑑別するための分類器を提供し、この分類器は、表5に挙げられる遺伝子のうちの1つ以上、又はその断片、又はこれらの任意の組み合わせを含む又はそれからなる。一実施形態において、分類器は、表5に挙げられる190遺伝子全てを含む又はそれからなる。一部の実施形態において、本開示は、UIPを非UIPと鑑別するための分類器を提供し、この分類器は、表5に挙げられる上述の190遺伝子のうちの2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;151;152;153;154;155;156;157;158;159;160;161;162;163;164;165;166;167;168;169;170;171;172;173;174;175;176;177;178;179;180;181;182;183;184;185;186;187;188;189;又は190を含む又はそれからなる。詳細な態様では、分類器は、表5に挙げられる190遺伝子と、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子又はその断片とを含む。他の態様では、分類器は表5に挙げられる上述の190遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。他の態様では、190遺伝子の各々が他の遺伝子の任意の1つ以上、又は最大20の更なる遺伝子との組み合わせで使用されることにより、本明細書に開示される方法に従いサンプルがUIP又は非UIPに分類されてもよい。
【0159】
[0168] 特定の実施形態において、本開示は、肺組織サンプルにおける疾患又は病態の検出を向上させる方法を提供し、この方法は、(A)検査サンプルに発現する1つ以上の転写物の発現レベルをアッセイすること;及び(B)コンピュータ生成訓練済み分類器(例えばEnvisia分類器)を使用して検査サンプルを疾患又は病態に関して陽性、又は陰性のいずれかに分類することを含み;ここでコンピュータ生成訓練済み分類器は、複数の対象から入手された複数の個別訓練サンプルに発現する1つ以上の転写物の発現レベルを使用して訓練され、各訓練サンプルは疾患又は病態に関して陽性又は陰性の確認された診断を有し、ここで訓練サンプルのうちの少なくとも2つは単一の対象から入手されたものであり;及び検査サンプルは分類前にプールされる。
【0160】
組織サンプル
[0169] 対象の分析又は診断方法に使用される肺組織サンプルは、生検サンプル(例えば、ビデオ補助下胸腔鏡手術;VATSによって得られた生検サンプル);気管支肺胞洗浄(BAL)サンプル;経気管支生検;クライオ経気管支生検などであってもよい。分析用の肺組織サンプルは、好適な保存溶液中に提供されてもよい。一部の実施形態において、組織サンプルは、ブラッシング(サイトブラシ、ヒストブラシによるなど);気管支生検;気管支洗浄;又は針穿刺吸引など、補助的気管支鏡手技によって入手される。一部の実施形態において、組織サンプルは、口腔内洗浄、タッチプレップ、又は痰採取によって入手されてもよい。一部の実施形態において、組織サンプルは対象の呼吸上皮から入手される。呼吸上皮は、口、鼻、咽頭、気管、気管支、細気管支、又は肺胞からのものであってもよい。しかしながら、他の呼吸上皮源もまた使用することができる。
【0161】
[0170] 組織サンプルは、患者が呈する臨床徴候及び症状(例えば、息切れ(一般に労作によって悪化する)、乾性咳嗽)、及び場合によっては1つ以上の画像検査(例えば、胸部X線、コンピュータ断層撮影(CT))、肺機能検査(例えば、スパイロメトリー、オキシメトリー、運動負荷検査)、及び/又は肺組織分析(例えば、気管支鏡検査、気管支肺胞洗浄、外科生検によって入手されたサンプルの組織学的及び/又は細胞学的分析)の結果に基づき肺疾患、例えばILDを有すると疑われる患者から入手されてもよい。場合によっては組織サンプルの細胞学的又は組織学的分析は、肺疾患の存在又は非存在に関して不明瞭である又は疑わしい(又は不確定である)こともある。
【0162】
[0171] 肺組織サンプルは、種々の方法のいずれで処理されてもよい。例えば、肺組織サンプルは細胞溶解に供されてもよい。肺組織サンプルはRNA保護溶液(RNA分解を阻害する、例えばRNAのヌクレアーゼ消化を阻害する溶液)に保存され、続いて細胞溶解に供されてもよい。肺組織サンプルから核酸及び/又はタンパク質などの成分が濃縮又は単離されてもよく、この濃縮又は単離された成分が主題の方法で使用されてもよい。核酸などの成分を濃縮及び単離する様々な方法を用いることができる。発現解析用にRNAを単離する様々な方法を用いることができる。
【0163】
発現産物レベルを決定するインビトロ方法
[0172] 遺伝子発現産物レベルの決定方法には、限定はされないが、以下:追加の細胞学的アッセイ、特異的タンパク質又は酵素活性に関するアッセイ、タンパク質若しくはRNAを含めた特異的発現産物又は特異的RNAスプライス変異体に関するアッセイ、インサイチュハイブリダイゼーション、全ゲノム又は部分的ゲノム発現解析、マイクロアレイハイブリダイゼーションアッセイ、遺伝子発現連鎖解析(SAGE)、酵素結合免疫吸着(enzyme linked immunoabsorbance)アッセイ、質量分析、免疫組織化学、ブロッティング、シーケンシング、RNAシーケンシング(例えば、エクソームエンリッチメントRNAシーケンシング)、DNAシーケンシング(例えば、RNAから得られたcDNAのシーケンシング);次世代シーケンシング、ナノポアシーケンシング、パイロシーケンシング、又はNanostringシーケンシングのうちの1つ以上が含まれ得る。例えば、遺伝子発現産物レベルは、Kim, et.al.(Lancet Respir Med. 2015 Jun;3(6):473-82、全ての補遺を含め、全体として本明細書に援用される)に記載される方法により決定されてもよい。本明細書で使用されるとき、用語「アッセイする」又は「検出する」又は「決定する」は、遺伝子発現産物レベルを決定することを指して同義的に使用される。実施形態において、上述の遺伝子発現産物レベルの決定方法は遺伝子発現産物レベルの検出又はアッセイに好適である。遺伝子発現産物レベルは、全mRNA又は限定はされないがグリセルアルデヒド-3-リン酸デヒドロゲナーゼ若しくはチューブリンを含めた特定の遺伝子の発現レベルなど、内部標準に対して正規化されてもよい。
【0164】
[0173] 様々な実施形態において、サンプルは、組織サンプル(例えば、TBBサンプルなどの肺組織サンプル)から回収された細胞を含む。細胞は、様々な技法を用いてサンプルから回収することができる。例えば、細胞は、細胞サンプルを遠心し、且つペレット化した細胞を再懸濁することにより回収されてもよい。細胞は、リン酸緩衝生理食塩水(PBS)などの緩衝溶液中に再懸濁されてもよい。この細胞懸濁液を遠心して細胞ペレットを得た後、細胞を溶解して、核酸、例えばメッセンジャーRNA(mRNA)が抽出されてもよい。対象から入手されたサンプルは全て、何らかの種類の更なる処理に供されるものを含め、対象から入手されたと見なされる。
【0165】
[0174] サンプルは、一実施形態において、本明細書に記載されるとおり遺伝子発現産物の検出が行われる前に更に処理される。例えば、細胞又は組織サンプル中のmRNAがサンプルの他の成分から分離されてもよい。サンプルを高濃度化及び/又は精製して、mRNAがその天然の環境にないことに伴いその非自然状態であるmRNAが単離されてもよい。例えば、研究によれば、インビボでのmRNAの高次構造は同じ配列のインビトロ構造と異なることが示されている(例えば、Rouskin et al. (2014). Nature 505, pp. 701-705(あらゆる目的から全体として本明細書に援用される)を参照のこと)。
【0166】
[0175] 一実施形態におけるサンプルからのmRNAは、合成DNAプローブ(一部の実施形態では、これには検出部分(例えば、検出可能標識、キャプチャー配列、バーコードレポート配列)が含まれる)にハイブリダイズされる。従って、これらの実施形態では、最終的には非天然mRNA-cDNA複合体が作られ、遺伝子発現産物の検出に用いられる。別の実施形態では、サンプルからのmRNAは検出可能標識、例えばフルオロフォアで直接標識される。更なる実施形態では、非天然標識mRNA分子がcDNAプローブにハイブリダイズされ、複合体が検出される。
【0167】
[0176] 一実施形態において、サンプルからmRNAが入手されると、それがハイブリダイゼーション反応で相補DNA(cDNA)に変換され、又はハイブリダイゼーション反応において1つ以上のcDNAプローブと共に使用される。cDNAはインビボでは存在せず、従って非天然分子である。更に、cDNA-mRNAハイブリッドは合成であり、インビボでは存在しない。cDNAがインビボで存在しないことに加えて、cDNAはリボ核酸でなくデオキシリボ核酸を含むとおり、必然的にmRNAと異なる。次にcDNAは、例えばポリメラーゼ連鎖反応(PCR)又は他の増幅によって増幅される。例えば、利用し得る他の増幅方法としては、リガーゼ連鎖反応(LCR)(Wu and Wallace, Genomics, 4:560 (1989)、Landegren et al., Science, 241:1077 (1988)、あらゆる目的から全体として参照により援用される、転写増幅(Kwoh et al., Proc. Natl. Acad. Sci. USA, 86:1173 (1989)、あらゆる目的から全体として参照により援用される)、自家持続配列複製法(Guatelli et al., Proc. Nat. Acad. Sci. USA, 87:1874 (1990)、あらゆる目的から全体として参照により援用される)、あらゆる目的から全体として参照により援用される、及び核酸配列ベース増幅(nucleic acid based sequence amplification)(NASBA)が挙げられる。PCR増幅用のプライマーの選択に関する指針の例は、McPherson et al., PCR Basics: From Background to Bench, Springer-Verlag, 2000(あらゆる目的から全体として参照により援用される)に提供される。この増幅反応の産物、即ち増幅されたcDNAもまた、必然的に非天然産物である。第一に、上述のとおり、cDNAは非天然分子である。第二に、PCRの場合、増幅プロセスは、出発物質のあらゆる個別のcDNA分子のcDNAコピーを何億個も作り出す働きをする。生じるコピー数は、インビボに存在するmRNAのコピー数と懸け離れている。
【0168】
[0177] 一実施形態において、cDNAは、追加のDNA配列(例えば、アダプター、レポーター、キャプチャー配列又は部分、バーコード)を断片に導入するプライマーで(例えば、アダプター特異的プライマーを使用して)増幅され、又はmRNA若しくはcDNA遺伝子発現産物配列が、追加の配列(例えば、アダプター、レポーター、キャプチャー配列又は部分的、バーコード)を含むcDNAプローブに直接ハイブリダイズされる。従ってmRNAの増幅及び/又はcDNAプローブへのハイブリダイゼーションは、追加の配列を導入して非天然ハイブリッドを形成することにより、非天然一本鎖cDNAから、又はmRNAから非天然二本鎖分子を作り出す働きをする。更に、増幅手順は、それに関連する誤り率を有する。従って、増幅はcDNA分子に更なる修飾を導入する。一実施形態では、アダプター特異的プライマーによる増幅中、一本鎖cDNA分子に検出可能標識、例えばフルオロフォアが付加される。従って増幅はまた、少なくとも、(i)cDNAはインビボでは存在しない、(i)cDNA分子の末端にアダプター配列が付加されて、インビボでは存在しないDNA配列を作る、(ii)増幅に関連する誤り率が、インビボでは存在しないDNA配列を更に作り出す、(iii)天然に存在するものと比較したとき全く異なる構造のcDNA分子、及び(iv)cDNA分子への検出可能標識の化学的付加が理由で、天然には存在しないDNA複合体を作り出す働きもする。
【0169】
[0178] 一部の実施形態において、目的の遺伝子発現産物の発現は、非天然cDNA分子の検出によって核酸レベルで検出される。
【0170】
[0179] 本明細書に記載される遺伝子発現産物には、目的の核酸配列のいずれかの配列全体又は部分的配列を含むRNA、又はインビトロで逆転写反応において合成的に入手されたその非天然cDNA産物が含まれる。用語「断片」は、概して少なくとも10、15、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、1,000、1,200、又は1,500連続ヌクレオチド、又は最大で本明細書に開示される完全長遺伝子発現産物ポリヌクレオチドに存在する数のヌクレオチドを含むポリヌクレオチドの一部分を指すことが意図される。遺伝子発現産物ポリヌクレオチドの断片は、概して少なくとも15、25、30、50、100、150、200、又は250連続アミノ酸、又は最大で本開示の完全長遺伝子発現産物タンパク質に存在するアミノ酸の総数をコードすることになる。
【0171】
[0180] 特定の実施形態において、遺伝子発現プロファイルは、全トランスクリプトームショットガンシーケンシング(「WTSS」又は「RNAseq」;例えば、Ryan et al BioTechniques 45: 81- 94を参照のこと)によって入手されてもよく、これは、サンプルのRNA内容に関する情報に関するため、ハイスループットシーケンシング技術を利用してcDNAをシーケンシングするものである。概して言えば、RNAからcDNAが作られ、cDNAが増幅され、及び増幅産物がシーケンシングされる。
【0172】
[0181] 増幅後、cDNA又はその誘導体は、任意の好都合な方法を用いてシーケンシングすることができる。例えば、断片が、Illuminaの可逆的ターミネーター方法、Rocheのパイロシーケンシング方法(454)、Life Technologiesのライゲーションによるシーケンシング(SOLiDプラットフォーム)又はLife TechnologiesのIon Torrentプラットフォームを使用してシーケンシングされてもよい。かかる方法の例は、以下の文献に記載されている:Margulies et al (Nature 2005 437: 376-80);Ronaghi et al (Analytical Biochemistry 1996 242: 84-9);Shendure (Science 2005 309: 1728);Imelfort et al (Brief Bioinform. 2009 10:609-18);Fox et al (Methods Mol Biol. 2009;553:79-108);Appleby et al (Methods Mol Biol. 2009;513: 19-39)及びMorozova (Genomics. 2008 92:255-64)(これらは、方法の概要及び方法の特定のステップに関して、ステップの各々についての全ての出発製品、試薬、及び最終産物を含め、参照によって援用される)。明らかであり得るとおり、増幅ステップの間に断片の末端に、選択の次世代シーケンシングプラットフォームと適合性のあるフォワード及びリバースシーケンシングプライマー部位が付加されてもよい。
【0173】
[0182] 他の実施形態において、産物はナノポアシーケンシングを用いて(例えば、Soni et al Clin Chem 53: 1996-2001 2007に記載されるとおり、又はOxford Nanopore Technologiesにより記載されるとおり)シーケンシングされてもよい。ナノポアシーケンシングは、単一のDNA分子がナノポアを通過するに従いそれを直接シーケンシングする単一分子シーケンシング技術である。ナノポアは、直径1ナノメートルのオーダーの小さい孔である。ナノポアを導電性流体に浸漬し、それにわたって電位(電圧)を印加すると、ナノポアを通じたイオン伝導によって僅かな電流が生じる。流れる電流の大きさは、ナノポアのサイズ及び形状に感受性がある。DNA分子がナノポアを通過するとき、DNA分子上の各ヌクレオチドがナノポアを塞ぐが、その程度は異なるため、ナノポアを流れる電流の大きさが様々な度合いに変化する。従って、DNA分子がナノポアを通過するときのこの電流の変化が、DNA配列の読み取り値に相当する。米国特許第5,795,782号、同第6,015,714号、同第6,627,067号、同第7,238,485号及び同第7,258,838号並びに米国特許出願公開第2006003171号及び同第20090029477号に開示されるとおりのナノポアシーケンシング技術。
【0174】
[0183] 一部の実施形態において、主題の方法の遺伝子発現産物はタンパク質であり、サンプルのコホートから得られたタンパク質データから誘導された分類器を使用して特定の生体サンプル中のタンパク質の量が分析される。タンパク質の量は、以下:酵素結合免疫吸着アッセイ(ELISA)、質量分析法、ブロッティング、又は免疫組織化学のうちの1つ以上によって決定されてもよい。
【0175】
[0184] 一部の実施形態において、遺伝子発現産物マーカー及び選択的スプライシングマーカーが、例えば、Affymetrixアレイ、cDNAマイクロアレイ、オリゴヌクレオチドマイクロアレイ、スポッティングマイクロアレイ、又はBiorad、Agilent、若しくはEppendorfからの他のマイクロアレイ製品を使用したマイクロアレイ解析によって決定されてもよい。マイクロアレイは、多数の遺伝子又は選択的スプライス変異体を含んで、それらを単一の実験でアッセイし得るため、特別な利点を持つ。場合によっては、マイクロアレイ装置は、ヒトゲノム若しくはトランスクリプトーム全体又はその実質的な一部を含んでもよく、遺伝子発現パターン、ゲノム配列、又は選択的スプライシングの総合的な評価が可能となる。マーカーは、Sambrook Molecular Cloning a Laboratory Manual 2001及びBaldi, P., and Hatfield, W. G., DNA Microarrays and Gene Expression 2002に記載されるとおりの標準的な分子生物学及びマイクロアレイ解析技法を用いて見付け出されてもよい。
【0176】
[0185] マイクロアレイ解析は、概して、様々な手法を用いて生体サンプル(例えば生検又は細針吸引液)から核酸を抽出及び精製することから始まる。発現及び選択的スプライシング解析には、DNAからRNAを抽出及び/又は精製することが有利であり得る。更に、tRNA及びrRNAなど、他の形態のRNAからniRNAを抽出及び/又は精製することが有益であり得る。
【0177】
[0186] 精製された核酸は更に、例えば、逆転写、ポリメラーゼ連鎖反応(PCR)、ライゲーション、化学反応又は他の技法により、蛍光標識、放射性核種、又は化学標識、例えば、ビオチン、ジゴキシゲニン、又はジゴキシンで標識されてもよい。標識は直接であってもよく、又はカップリング段階が更に必要となり得るが、間接的であってもよい。カップリング段階はハイブリダイゼーション前に、例えばアミノアリル-UTP及びNHSアミノ反応性色素(シアニン色素など)を使用して行うこともでき、又は後に、例えばビオチン及び標識ストレプトアビジンを使用して行うこともできる。一例では、修飾ヌクレオチド(例えば、1aaUTP:4TTP比)を通常のヌクレオチドと比較して低率で酵素的に付加すると、典型的には(分光光度計で測定して)60塩基毎に1つとなる。次にaaDNAが、例えばカラム又はダイアフィルトレーション装置で精製されてもよい。アミノアリル基は、核酸塩基に結合した長いリンカー上のアミン基であり、これは反応性標識(例えば蛍光色素)と反応する。
【0178】
[0187] 次に標識サンプルが、ドデシル硫酸ナトリウム(SDS)、SSC、硫酸デキストラン、ブロッキング剤(COT1 DNA、サケ精子DNA、仔ウシ胸腺DNA、ポリA又はポリTなど)、デンハルト溶液、ホルムアミン(formamine)、又はこれらの組み合わせを含有し得るハイブリダイゼーション溶液と混合されてもよい。
【0179】
[0188] ハイブリダイゼーションプローブは、DNA又はRNAサンプルにおけるプローブの配列と相補的なヌクレオチド配列(DNA標的)の存在の検出に使用される様々な長さのDNA又はRNA断片である。従ってプローブは、プローブと標的との間の相補性によるプローブ-標的塩基対合を実現する塩基配列を有する一本鎖核酸(DNA又はRNA)にハイブリダイズする。標識プローブは初めに(熱によるか、又はアルカリ性条件下で)一本鎖DNAに変性され、次に標的DNAにハイブリダイズされる。
【0180】
[0189] プローブのその標的配列とのハイブリダイゼーションを検出するため、プローブは分子マーカーでタグが付加される(又は標識される);一般的に使用されるマーカーは32P又はジゴキシゲニンであり、これは非放射性の抗体ベースのマーカーである。次に、ハイブリダイズしたプローブをオートラジオグラフィー又は他のイメージング技法によって可視化することにより、プローブに対して中程度~高度の配列相補性(例えば少なくとも70%、80%、90%、95%、96%、97%、98%、99%、又はそれ以上の相補性)を有するDNA配列又はRNA転写物が検出される。中程度又は高度の相補性を有する配列の検出は、どの程度ストリンジェントなハイブリダイゼーション条件が適用されたかに依存する;高いハイブリダイゼーション温度及びハイブリダイゼーション緩衝液中の低い塩など、高いストリンジェンシーは、高度に類似した核酸配列間のハイブリダイゼーションのみを許容し、一方、低い温度及び高い塩など、低いストリンジェンシーは、配列がそれほど類似していないときでもハイブリダイゼーションを可能にする。DNAマイクロアレイにおいて使用されるハイブリダイゼーションプローブとは、コーティングされたスライドグラス又は遺伝子チップなど、不活性表面に共有結合的に結合した、移動性のcDNA標的がハイブリダイズするDNAを指す。
【0181】
[0190] アレイ上のプローブにハイブリダイズさせようとする標的核酸を含む混合物は、熱又は化学的手法によって変性させて、マイクロアレイのポートに加えられてもよい。次に孔が密閉され、マイクロアレイが例えばハイブリダイゼーションオーブンでハイブリダイズされてもよく、ここでマイクロアレイは回転によるか、又はミキサーで混合される。一晩のハイブリダイゼーション後、非特異的結合が(例えばSDS及びSSCで)洗い流されてもよい。次にマイクロアレイは乾燥させて、色素を励起するレーザーと、色素による発光を測定する検出器とを含む機械で走査されてもよい。画像はテンプレートグリッドと重ね合わされてもよく、及び特徴(例えば、数画素を含む特徴)の強度が定量化されてもよい。
【0182】
[0191] 主題の方法の核酸の増幅及びプローブの作成には、様々なキットを使用し得る。本開示において使用し得るキットの例としては、限定はされないが、Nugen WT-Ovation(商標)FFPEキット、Nugen Exonモジュール及びFrag/Labelモジュールを備えるcDNA増幅キットが挙げられる。NuGEN WT-Ovation(商標)FFPE System V2は、FFPEサンプルに由来する小型の分解されたRNAの膨大なアーカイブに対する大域的遺伝子発現解析の実行を可能にする全トランスクリプトーム増幅システムである。このシステムは、50ngほどの少量の全FFPE RNAの増幅に必要な試薬及びプロトコルを含む。このプロトコルは、qPCR、サンプルアーカイビング、断片化、及び標識に用いられ得る。増幅されたcDNAは、NuGENのFL-Ovation(商標)cDNA Biotin Module V2を使用してGeneChip(商標)3’発現アレイ解析用に2時間未満で断片化及び標識されてもよい。Affymetrix GeneChip(商標)Exon及びGene STアレイを使用した解析用には、増幅されたcDNAをWT-Ovation(商標)Exon Moduleで使用して、次にFL-Ovation(商標)cDNA Biotin Module V2を使用して断片化及び標識してもよい。Agilentアレイでの解析用には、増幅されたcDNAをNuGENのFL-Ovation(商標)cDNA Fluorescent Moduleを使用して断片化及び標識してもよい。
【0183】
[0192] 一部の実施形態において、Ambion(商標)WT-発現キットが使用されてもよい。Ambion WT-発現キットは、別途リボソームRNA(rRNA)枯渇ステップを行うことなく全RNAを直接増幅することが可能である。Ambion(商標)WT発現キットでは、Affymetrix(商標)GeneChip(商標)Human、Mouse、及びRat Exon及びGene 1.0 STアレイ上で50ngほどの少量の全RNAのサンプルが分析され得る。入力する必要のあるRNAが少なくて済み、且つAffymetrix(商標)方法とTaqMan(商標)リアルタイムPCRデータとの間の一致点が多いことに加えて、Ambion(商標)WT-発現キットは大幅な感度増加を提供する。例えば、信号対雑音比が増加する結果として、Ambion(商標)WT-発現キットによってエクソンレベルで得られ得るバックグラウンドを上回って検出されるプローブセットの数が多くなり得る。Ambion(商標)-発現キットは更なるAffymetrix(商標)標識キットと組み合わせて使用されてもよい。一部の実施形態では、主題の方法においてAmpTec(商標)Trinucleotide Nano mRNA増幅キット(6299-A15)が使用されてもよい。ExpressArt(商標)TRinucleotide(商標)mRNA増幅Nanoキットは、幅広い、1ng~700ngの入力全RNAに好適である。入力全RNAの量及び要求されるaRNA収量に従い、これは、aRNA収量が>10μgの範囲で、1ラウンド(入力>300ngの全RNA)又は2ラウンド(最小入力量1ngの全RNA)にわたって用いられ得る。AmpTecの専売のTRinucleotide(商標)プライミング技術は、rRNAに対する選択と組み合わせた、mRNAの優先的な(普遍的な真核生物3’-ポリ(A)-配列と独立した)増幅をもたらす。このキットは、cDNA変換キット及びAffymetrix(商標)標識キットと組み合わせて使用されてもよい。
【0184】
[0193] 次に生データが、例えば、バックグラウンド強度を差し引いた後、その強度を除して各チャンネル上の特徴の総強度又は参照遺伝子の強度のいずれかを等しくすることにより正規化されてもよく、次に全ての強度のt値が計算されてもよい。より精緻な方法には、z比、loess及びlowess回帰並びにAffymetrixチップ用などのRMA(ロバストなマルチチップ解析)が含まれる。
【0185】
[0194] 一部の実施形態において、上述の方法は、対象がUIPを有するか、それとも非UIPを有するかを鑑別する分類器の(例えば、分類器訓練モジュールを使用した)訓練用の転写物発現レベルの決定に用いられ得る。一部の実施形態において、上述の方法は、サンプルがUIPか、それとも非UIPかを鑑別することが可能な分類器モジュールに入力するための転写物発現レベルの決定に用いられ得る。
【0186】
データ解析
(i)サンプルと正常の比較
[0195] 一部の実施形態において、対象からのサンプル(「検査サンプル」)で行われた分子プロファイリングの結果が、正常であることが分かっている又は疑われる生体サンプル(「正常サンプル」)と比較されてもよい。一部の実施形態において、正常サンプルは、ILD又は評価中の病態を含まない、又は含まないと予想されるサンプル、又は分子プロファイリングアッセイにおいて評価中の1つ以上のILDの検査で陰性となり得るサンプルである。一部の実施形態において、正常サンプルは、いかなるILDもない、又はないと予想されるもの、又は分子プロファイリングアッセイにおいていかなるILDの検査も陰性となり得るサンプルである。正常サンプルは、検査する対象と異なる対象からのものであってもよく、又は同じ対象からのものであってもよい。場合によっては、正常サンプルは、例えば検査下の対象など、対象から入手された肺組織サンプルである。正常サンプルは検査サンプルと同じ時点で、又は異なる時点でアッセイされてもよい。一部の実施形態において、正常サンプルは、非喫煙者からのものであることが分かっている又は疑われるサンプルである。詳細な実施形態において、正常サンプルは、少なくとも2人の専門病理医によって非UIPサンプルであることが確認されたサンプルである。詳細な実施形態において、正常サンプルは、少なくとも2人の専門病理医によって非IPFサンプルであることが確認されたサンプルである。
【0187】
[0196] 検査サンプルでのアッセイの結果は、既知の疾患状態(例えば、正常、選択のILD(例えば、IPF、NSIP等)に罹患している、喫煙者、非喫煙者、非UIP、UIP)を有するサンプルでの同じアッセイの結果と比較されてもよい。場合によっては、正常サンプルでのアッセイの結果は、データベース、又は参照からのものである。場合によっては、正常サンプルでのアッセイの結果は、当業者によって一般に受け入れられている値又は値の範囲である。場合によっては比較は定性的である。他の場合には、比較は定量的である。場合によっては、定性的又は定量的比較は、限定はされないが、以下:蛍光値、スポット強度、吸光度値、化学発光シグナル、ヒストグラム、臨界閾値、統計的有意値、遺伝子産物発現レベル、遺伝子産物発現レベル変化、選択的エクソン使用、選択的エクソン使用の変化、タンパク質レベル、DNA多型、コピー数変異、1つ以上のDNAマーカー又は領域の存在又は非存在の指標、又は核酸配列のうちの1つ以上を含み得る。
【0188】
(ii)結果の評価
[0197] 一部の実施形態において、分子プロファイリング結果は、遺伝子産物発現レベル又は選択的エクソン使用を特定のILD又は正常であること(例えば無疾患又は無病態)などの特異的表現型と相関付ける様々な手法を用いて評価される。場合によっては、診断信頼水準を提供するため、指定された統計的信頼水準が決定されてもよい。例えば、90%より高い信頼水準がILDの存在又は喫煙者若しくは非喫煙者状態の有用な予測因子であり得ると決定されてもよい。他の実施形態において、より高い又はより低いストリンジェンシーの信頼水準が選択されてもよい。例えば、約又は少なくとも約50%、60%、70%、75%、80%、85%、90%、95%、97.5%、99%、99.5%、又は99.9%の信頼水準が、有用な表現型予測因子として選択されてもよい。提供される信頼水準は、場合によっては、サンプルのクオリティ、データのクオリティ、分析のクオリティ、用いられる具体的な方法、及び/又は分析される遺伝子発現産物の数と関係し得る。診断を提供するための指定の信頼水準は、予想偽陽性数若しくは偽陰性数及び/又は費用に基づき選択されてもよい。指定の信頼水準を実現するための、又は診断力のあるマーカーを同定するためのパラメータの選択方法としては、限定はされないが、受診者動作特性(ROC)曲線分析、二項ROC、主成分分析、部分最小二乗分析、特異値分解、最小絶対収縮及び選択操作者分析、最小角度回帰、及び閾値勾配依存的正則化法(threshold gradient directed regularization)が挙げられる。
【0189】
(iii)データ解析
[0198] 遺伝子発現レベル及び選択的スプライシング生データは、場合によっては、データを正規化し及び/又はその信頼性を向上させるように設計された方法及び/又はプロセスを適用することにより改良されてもよい。本開示の一部の実施形態において、データ解析には、処理される個別データ点の数が多いため、本明細書に記載される様々な方法及び/又はプロセスを適用するためのコンピュータ又は他の装置、機械又は機器が必要である。「機械学習分類器」は、遺伝子発現プロファイルの特徴付けに利用されるコンピュータベースの予測データ構造又は方法を指す。ある種の発現レベルに対応するシグナル(例えば、エクソームエンリッチメントRNAシーケンシング又はマイクロアレイベースのハイブリダイゼーションアッセイによって得られる)が典型的には分類器に供され、発現プロファイルが分類される。教師付き学習は、概して、クラス間の差異を認識するように分類器を「訓練」すること、及び次に、独立したテストセットに関して分類器の精度を「テスト」することを含む。未知の新規サンプルについては、分類器を使用して、サンプルが属するクラスを予測することもできる。様々な実施形態において、かかる訓練は、例えば分類器訓練モジュールを使用して実現される。
【0190】
[0199] 場合によっては、ロバストマルチアレイ平均(RMA)法を使用して生データが正規化されてもよい。RMA法は、幾つものマイクロアレイ上の各対応する細胞についてのバックグラウンド補正された強度を計算することから始まる。バックグラウンド補正値は、Irizarry et al. Biostatistics 2003 April 4 (2): 249-64により記載されるとおり正の値に限られる。バックグラウンド補正後、次に各バックグラウンド補正された対応する細胞強度の底2の対数が求められる。次に、各入力アレイ及び各プローブ発現値について、アレイパーセンタイルプローブ値が全てのアレイのパーセンタイル点の平均に置き換えられる分位点正規化法(この方法については、Bolstad et al. Bioinformatics 2003によって更に十分に記載されている)を用いて各マイクロアレイに関するバックグラウンド補正された対数変換後の対応する強度が正規化される。分位点正規化後、次に正規化データが線形モデルにフィットされ、各マイクロアレイ上の各プローブの発現尺度が求められてもよい。次にチューキーのメディアンポリッシュアルゴリズム(Tukey, J. W., Exploratory Data Analysis. 1977)を使用して、正規化プローブセットデータの対数スケールの発現レベルが決定されてもよい。
【0191】
[0200] 様々な他のソフトウェア及び/又はハードウェアモジュール又はプロセスが実行されてもよい。特定の方法では、glmnetを使用したlassoペナルティを伴うロジスティック回帰によって特徴選択及びモデル推定が行われてもよい(Friedman J, Hastie T, Tibshirani R. Regularization Paths for Generalized Linear Models via Coordinate Descent. Journal of statistical software 2010; 33(1): 1-22)。生の読み取り値がTopHatを用いてアラインメントされてもよい(Trapnell C, Pachter L, Salzberg SL. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics 2009; 25(9): 1105-11)。遺伝子カウントがHTSeq(Anders S, Pyl PT, Huber W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics 2014)を使用して得られ、DESeq(Love MI, Huber W, Anders S. Moderated estimation of fold change and dispersion for RNA-Seq data with DESeq2; 2014)を用いて正規化されてもよい。方法では、上位の特徴(10~200の範囲のN)を用いることにより、e1071ライブラリ(Meyer D. Support vector machines: the interface to libsvm in package e1071. 2014)を使用して線形サポートベクターマシン(SVM)(Suykens JAK, Vandewalle J. Least Squares Support Vector Machine Classifiers. Neural Processing Letters 1999; 9(3): 293-300)が訓練された。信頼区間はpROCパッケージを使用して計算されてもよい(Robin X, Turck N, Hainard A, et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. BMC bioinformatics 2011; 12: 77)。
【0192】
[0201] 加えて、データはフィルタリングされて、疑わしいと見なされ得るデータが除かれてもよい。一部の実施形態において、約4、5、6、7又は8個より少ないグアノシン及びシトシンヌクレオチドを有するマイクロアレイプローブに由来するデータは、その異常なハイブリダイゼーション傾向又は二次構造問題に起因して信頼できないと見なされ得る。同様に、約12、13、14、15、16、17、18、19、20、21、又は22個より多いグアノシン及びシトシンヌクレオチドを有するマイクロアレイプローブに由来するデータは、その異常なハイブリダイゼーション傾向又は二次構造問題に起因して信頼できないと見なされ得る。
【0193】
[0202] 場合によっては、プローブセット信頼性を一連の参照データセットに対して順位付けすることにより、信頼できないプローブセットがデータ解析からの除外に選択されてもよい。例えば、RefSeq又はEnsembl(EMBL)は、極めて高いクオリティの参照データセットと考えられる。RefSeq又はEnsembl配列にマッチするプローブセットからのデータが、場合によってはその予想される高い信頼性に起因してマイクロアレイ解析実験に特別に組み入れられてもよい。同様に、信頼性の低い参照データセットにマッチするプローブセットからのデータが以降の分析から除外されてもよく、又はケースバイケースで組み入れるかどうかが考慮されてもよい。場合によっては、EnsemblハイスループットcDNA(HTC)及び/又はmRNA参照データセットを使用してプローブセット信頼性が個別に又は共に決定されてもよい。他の場合には、プローブセット信頼性が順位付けされてもよい。例えば、例えばRefSeq、HTC、HTSeq、及びmRNAなどの参照データセットの全てに完全にマッチするプローブ及び/又はプローブセットが、最も信頼性が高いものとして順位付けされてもよい(1)。更に、3つの参照データセットのうちの2つにマッチするプローブ及び/又はプローブセットが、次に信頼性が高いものとして順位付けされてもよく(2)、3つの参照データセットのうちの1つにマッチするプローブ及び/又はプローブセットが次に順位付けされてもよく(3)及び参照データセットにマッチしないプローブ及び/又はプローブセットが最後に順位付けされてもよい(4)。次にプローブ及び/又はプローブセットはその順位付けに基づき分析に組み入れられ、又は除外されてもよい。例えば、以降の分析にカテゴリ1、2、3、及び4のプローブセット;カテゴリ1、2、及び3のプローブセット;カテゴリ1及び2のプローブセット;又はカテゴリ1のプローブセットからのデータを組み入れることを選択してもよい。別の例において、プローブセットは、参照データセットエントリに対する塩基対ミスマッチ数によって順位付けされてもよい。分子プロファイリングのための所与のプローブ及び/又はプローブセットの信頼性の評価に関して当該技術分野で理解されている方法は多数あり、本開示の方法はそうした方法の任意のもの及びそれらの組み合わせを包含することが理解される。
【0194】
[0203] 本開示の一部の実施形態において、プローブセットからのデータは、発現しないか、又は検出不能なレベルで発現する(バックグラウンドを上回らない)場合に分析から除外されてもよい。プローブセットは、任意の群について:
標準正規分布のT0から無限大までの積分値<有意性(0.01)
[式中:T0=Sqr(GroupSize) (T-P)/Sqr(Pvar);GroupSize=群内のCELファイルの数、T=プローブセットにおけるプローブスコアの平均値、P=GC含量のバックグラウンドプローブ平均値の平均値、及びPvar=バックグラウンドプローブ分散の和/(プローブセット中のプローブ数)2]
の場合にバックグラウンドを上回って発現すると判断される。
【0195】
[0204] これにより、プローブセットの群内平均値が、プローブセットのバックグラウンドの中心としてのプローブセットプローブと同様のGC含量のバックグラウンドプローブの発現平均値より高いプローブセットが実現し、バックグラウンドプローブセット分散からプローブセットのばらつきを求めることが可能になる。
【0196】
[0205] 本開示の一部の実施形態において、分散を呈しない、又は小さい分散を呈するプローブセットは以降の分析から除外されてもよい。分散が小さいプローブセットはカイ二乗検定によって分析から除外される。プローブセットは、その変換後の分散が(N-l)自由度でのカイ二乗分布の99パーセント信頼区間の左側にある場合に分散が小さいと見なされる。Chi-Sq(N-l)に関する(N-l)*プローブセット分散/(遺伝子プローブセット分散)[式中、Nは入力CELファイル数であり、(N-l)はカイ二乗分布の自由度であり、及び「遺伝子プローブセット分散」は遺伝子にわたるプローブセット分散の平均値である]。本開示の一部の実施形態において、所与の遺伝子又は転写物クラスターのプローブセットは、GC含量、信頼性、分散などに関する前述のフィルタリングステップを通過するプローブが最小数未満しか含まれない場合、以降の分析から除外されてもよい。例えば、一部の実施形態において、所与の遺伝子又は転写物クラスターのプローブセットは、含まれるプローブが約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15未満、又は約20未満である場合、以降の分析から除外されてもよい。
【0197】
[0206] 遺伝子発現レベル又は選択的スプライシングのデータ解析方法は、本明細書に提供されるとおりの特徴選択方法及び/又はプロセスの使用を更に含み得る。本開示の一部の実施形態において、特徴選択はLIMMAソフトウェアパッケージを用いて提供される(Smyth, G. K. (2005). Limma: linear models for microarray data. In: Bioinformatics and Computational Biology Solutions using R and Bioconductor, R. Gentleman, V. Carey, S. Dudoit, R. Irizarry, W. Huber (eds.), Springer, New York, pages 397-420)。
【0198】
[0207] 遺伝子発現レベル及び/又は選択的スプライシングのデータ解析方法は、予備分類器方法及び/又はプロセス(例えば、予備分類器分析モジュールによって実行される)の使用を更に含み得る。例えば、方法及び/又はプロセスは、細胞特異的分子フィンガープリントを使用してサンプルをその組成に従い予備的に分類し、次に補正/正規化係数を適用し得る。次にこのデータ/情報が最終的な分類方法及び/又はプロセスに送り込まれてもよく、そこで当該情報が取り込まれて最終診断を助け得る。
【0199】
[0208] 特定の実施形態において、本開示の方法は、本開示のUIP/非UIP分類器の適用前に分子フィンガープリントを使用してサンプルを喫煙者又は非喫煙者に予備的に分類する予備分類器方法及び/又はプロセス(例えば、予備分類器分析モジュールによって実行される)の使用を含む。
【0200】
[0209] 遺伝子発現レベル及び/又は選択的スプライシングのデータ解析方法は、本明細書に提供されるとおりの分類器方法及び/又はプロセス(例えば、分類器分析モジュールによって実行される)の使用を更に含み得る。本開示の一部の実施形態では、対角線形判別分析、k最近傍分類器、サポートベクターマシン(SVM)分類器、線形サポートベクターマシン、ランダムフォレスト分類器、又は確率モデルベースの方法又はこれらの組み合わせがマイクロアレイデータの分類に提供される。一部の実施形態において、サンプルを(例えばUIPを非UIPと、第1のILDを第2のILDと、正常対ILDを)区別する、又は亜型を(例えばIPF対NSIPを)区別する同定マーカーは、目的のクラス間の発現レベルの差の統計的有意性に基づき選択される。場合によっては、統計的有意性は、ベンジャミニ・ホフバーグ(Benjamini Hochberg)の手順又は偽発見率(FDR)に関する別の補正を適用することにより調整される。
【0201】
[0210] 場合によっては、分類器は、Fishel and Kaufman et al. 2007 Bioinformatics 23(13): 1599-606によって記載されるものなどのメタ分析手法で補足されてもよい。場合によっては、分類器は、再現性分析などのメタ分析手法で補足されてもよい。場合によっては、再現性分析が、少なくとも1つの予測的発現産物マーカーセットに出現するマーカーを選択する。
【0202】
[0211] 事後確率を導出し、マイクロアレイデータの分析に適用する方法の例が、Smyth, G. K. 2004 Stat. Appi. Genet. Mol. Biol. 3: Article 3(全体として参照により本明細書に援用される)に提供される。場合によっては、事後確率を使用して、分類器により提供されるマーカーを順位付けしてもよい。場合によっては、マーカーはその事後確率に従い順位付けされてもよく、選択の閾値に適合するものが、例えばUIP又は非UIPであるサンプルの指標又は診断となる発現差異を有するマーカーとして選択されてもよい。例示的な閾値には、0.7、0.75、0.8、0.85、0.9、0.925、0.95、0.975、0.98、0.985、0.99、0.995又はそれより高い事前確率が含まれる。
【0203】
[0212] 分子プロファイリングの結果の統計的評価は、限定はされないが、以下:診断が正確である可能性;サンプルがUIPである可能性;サンプルが非UIPである可能性;ILDの可能性;特定のILDの可能性;特定の治療介入が成功する可能性、対象が喫煙者である可能性、及び対象が非喫煙者である可能性のうちの1つ以上の指標となる1つ又は複数の定量的値を提供することを提供し得る。従って、遺伝学又は分子生物学の訓練を受けていない可能性が高い医師が生データを理解する必要はない。むしろ、データは、患者ケアの手引きとなるのにその最も有用な形態で医師に直接提示される。分子プロファイリングの結果は、限定はされないが:スチューデントt検定、両側t検定、ピアソンの順位和分析、隠れマルコフモデル分析、q-qプロット分析、主成分分析、一元配置ANOVA、二元配置ANOVA、LIMMAなどを含め、幾つもの方法を用いて統計的に評価されてもよい。
【0204】
[0213] 本開示の一部の実施形態において、分子プロファイリングを単独で、又は細胞学的分析と組み合わせて使用することにより、約85%精度~約99%又は約100%精度の分類、同定、又は診断が提供され得る。場合によっては、分子プロファイリングプロセス及び/又は細胞診は、約、又は少なくとも約85%、86%、87%、88%、90%、91%、92%、93%、94%、95%、96%、97%、97.5%、98%、98.5%、99%、99.5%、99.75%、99.8%、99.85%、又は99.9%精度のILDの分類、同定、診断を提供する。一部の実施形態において、分子プロファイリングプロセス及び/又は細胞診は、約、又は少なくとも約85%、86%、87%、88%、90%、91%、92%、93%、94%、95%、96%、97%、97.5%、98%、98.5%、99%、99.5%、99.75%、99.8%、99.85%、又は99.9%精度の特定のILD型(例えばIPF;NSIP;HP)の存在の分類、同定、又は診断を提供する。
【0205】
[0214] 場合によっては、精度は、対象を経時的に追跡して初期診断の精度を決定することにより決定されてもよい。他の場合には、精度は、決定論的方式で、又は統計的方法を用いて確立されてもよい。例えば、受信者動作特性(ROC)分析を使用して、特定のレベルの精度、特異度、陽性的中率、陰性的中率、及び/又は偽発見率を実現するのに最適なアッセイパラメータを決定してもよい。
【0206】
[0215] 本開示の一部の実施形態において、UIPと非UIPとの間、UIPと正常との間、及び/又は喫煙者と非喫煙者との間で最も大きい発現レベルの差又は最も大きい選択的スプライシングの差を呈することが決定される遺伝子発現産物及びかかる産物をコードするヌクレオチドの組成物が、本開示の分子プロファイリング試薬としての使用に選択されてもよい。かかる遺伝子発現産物は、他の方法と比べてより広いダイナミックレンジ、より高い信号対雑音、診断力の向上、偽陽性又は偽陰性の可能性の低下、又はより高い統計的信頼水準をもたらすことにより特に有用であり得る。
【0207】
[0216] 本開示の他の実施形態において、分子プロファイリングを単独で、又は細胞学的分析と組み合わせて使用することにより、当該技術分野において用いられる標準的な細胞学的技法の使用と比較したとき、診断不十分とスコア化されるサンプル数が、約、又は少なくとも約100%、99%、95%、90%、80%、75%、70%、65%、又は約60%減少し得る。場合によっては、本開示の方法では、当該技術分野において用いられる標準的な細胞学的方法と比較したとき、不確定又は疑わしいとスコア化されるサンプル数が、約、又は少なくとも約100%、99%、98%、97%、95%、90%、85%、80%、75%、70%、65%、又は約60%減少し得る。
【0208】
[0217] 場合によっては、分子プロファイリングアッセイの結果は、分子プロファイリング事業者の代表又はエージェント、個人、医療提供者、又は保険提供者がアクセスできるようにデータベースに入力される。場合によってはアッセイ結果は、医療専門家など、事業者の代表、エージェント又はコンサルタントによるサンプル分類、同定、又は診断を含む。他の場合には、データのコンピュータ解析が自動で提供される。場合によっては分子プロファイリング事業者は、以下:行われる分子プロファイリングアッセイ、コンサルティングサービス、データ解析、結果の報告、又はデータベースアクセスのうちの1つ以上に関する請求書を個人、保険提供者、医療提供者、研究者、又は政府機関に送り得る。
【0209】
[0218] 本開示の一部の実施形態において、分子プロファイリングの結果は、コンピュータ画面上のレポートとして、又は紙の記録として提示される。場合によっては、レポートは、限定はされないが、以下:発現差異がある遺伝子の数、元のサンプルの適合性、差異のある選択的スプライシングを示す遺伝子の数、診断、診断の統計的信頼度、対象が喫煙者である可能性、ILDの可能性、及び適応となる治療のうちの1つ以上のような情報を含み得る。
【0210】
(iv)分子プロファイリング結果に基づくサンプルのカテゴリ化
[0219] 分子プロファイリングの結果は、例えば、以下:喫煙者、非喫煙者、ILD、特殊型ILD、非ILD、又は診断不十分(ILDの存在又は非存在に関して提供される情報が不十分)のうちの1つに分類されてもよい。場合によっては、分子プロファイリングの結果はIPF対NSIPのカテゴリに分類されてもよい。特定の場合には、結果はUIP又は非UIPに分類される。
【0211】
[0220] 本開示の一部の実施形態において、結果は訓練済み分類器を使用して分類される。訓練済み分類器は、訓練済みアルゴリズムであり得る。本開示の訓練済み分類器は、既知のUIP及び非UIPサンプルの参照セットを使用して開発された方法及び/又はプロセスを実行する。一部の実施形態において、訓練(例えば、分類器訓練モジュールを使用する)は、UIPサンプルからの第1のバイオマーカーセットにおける遺伝子発現産物レベルと、非UIPサンプルからの第2のバイオマーカーセットにおける遺伝子発現産物レベルとの比較を含み、ここで第1のバイオマーカーセットは、第2のセットにないバイオマーカーを少なくとも1つ含む。一部の実施形態において、訓練(例えば、分類器訓練モジュールを使用する)は、非UIPである第1のILDからの第1のバイオマーカーセットにおける遺伝子発現産物レベルと、UIPである第2のILDからの第2のバイオマーカーセットにおける遺伝子発現産物レベルとの比較を含み、ここで第1のバイオマーカーセットは、第2のセットにないバイオマーカーを少なくとも1つ含む。一部の実施形態において、訓練(例えば、分類器訓練モジュールを使用する)は、喫煙者である第1の対象からの第1のバイオマーカーセットにおける遺伝子発現産物レベルと、非喫煙者である第2の対象からの第2のバイオマーカーセットにおける遺伝子発現産物レベルとの比較を更に含み、ここで第1のバイオマーカーセットは、第2のセットにないバイオマーカーを少なくとも1つ含む。一部の実施形態において、分類器全体又は分類器の一部分のいずれかが、分類パネル内にあるバイオマーカーパネルの発現レベルと分類器に使用される他の全てのバイオマーカーパネル(又は他の全てのバイオマーカーシグネチャ)との比較を用いて訓練(例えば、分類器訓練モジュールを使用する)されてもよい。一部の実施形態において、分類器全体又は分類器の一部分のいずれも、単一の対象から入手された少なくとも2、3、4、5、又はそれ以上の個別サンプルを含むプールサンプルで測定された発現レベルの比較を用いて訓練(例えば、分類器訓練モジュールを使用する)されてもよい。一部の実施形態において、分類器全体又は分類器の一部分のいずれかも、本明細書に記載されるとおりのインシリコプール発現レベルの比較を用いて訓練(例えば、分類器訓練モジュールを使用する)されてもよく、ここでインシリコプール発現レベルは、単一の対象から入手された少なくとも2、3、4、5、又はそれ以上の個別サンプルからのプールされた発現レベルを含む。一部の実施形態において、この段落に記載されるとおり訓練される分類器は、検査サンプルがUIPか、それとも非UIPかを決定するため、配列番号1~151のうちの1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;又は151、又はこれらの任意の組み合わせを検査サンプルと参照サンプル又は参照サンプル群との間で比較する。詳細な態様では、かかる分類器は、追加の遺伝子、例えば、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を比較する。他の態様では、分類器は上述の遺伝子のうちの幾つか、例えば、これらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。
【0212】
[0221] 一部の実施形態において、本明細書に記載されるとおり訓練される分類器は、検査サンプルがUIPか、それとも非UIPかを決定するため、表5に挙げられる遺伝子のうちの1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29;30;31;32;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54;55;56;57;58;59;60;61;62;63;64;65;66;67;68;69;70;71;72;73;74;75;76;77;78;79;80;81;82;83;84;85;86;87;88;89;90;91;92;93;94;95;96;97;98;99;100;101;102;103;104;105;106;107;108;109;110;111;112;113;114;115;116;117;118;119;120;121;122;123;124;125;126;127;128;129;130;131;132;133;134;135;136;137;138;139;140;141;142;143;144;145;146;147;148;149;150;151;152;153;154;155;156;157;158;159;160;161;162;163;164;165;166;167;168;169;170;171;172;173;174;175;176;177;178;179;180;181;182;183;184;185;186;187;188;189;又は190の遺伝子発現レベルを検査サンプルと参照サンプル又は参照サンプル群との間で比較する。詳細な態様では、かかる分類器は、追加の遺伝子、例えば、1、2、3、4、5、6、7、8、又はそれ以上の追加の遺伝子を比較する。他の態様では、分類器は上述の遺伝子のうちの幾つか、例えば、これらの遺伝子のうちの1、2、3、4、5、6、7、8、又はそれ以上を省き、一方で場合によっては他の遺伝子を含む。
【0213】
[0222] サンプルのカテゴリ化に好適な分類器としては、限定はされないが、k最近傍分類器、サポートベクターマシン、線形判別分析、対角線形判別分析、アップダウン、単純ベイズ分類器、ニューラルネットワーク分類器、隠れマルコフモデル分類器、遺伝的分類器、又はこれらの任意の組み合わせが挙げられる。
【0214】
[0223] 場合によっては、本開示の訓練済み分類器は、限定はされないが、DNA多型データ、シーケンシングデータ、本開示の細胞診医又は病理医によるスコア化又は診断、本開示の予備分類器方法及び/又はプロセスによって提供される情報、又は本開示の対象の病歴に関する情報など、遺伝子発現又は選択的スプライシングデータ以外のデータを取り入れてもよい。
【0215】
[0224] ILDの(例えばUIPとの)診断に関して生体サンプルを分類するとき、典型的にはバイナリ分類器からの可能性のある結果は2つある。同様に、喫煙者の診断に関して生体サンプルを分類するとき、典型的にはバイナリ分類器からの可能性のある結果は2つある。バイナリ分類器を実際の真値(例えば、生体サンプルからの値)と比較するとき、典型的には可能性のある結果は4つある。予測からの結果がpであり(ここで「p」は、特定のILDなど、陽性の分類器結果である)、且つ実際の値もまたpである場合、それは真陽性(TP)と呼ばれる;しかしながら実際の値がnである場合、それは偽陽性(FP)と言われる。逆に、予測結果及び実際の値の両方がnであるとき(ここで「n」は、非ILD、又は本明細書に記載されるとおりの特定の疾患組織の欠如など、陰性の分類器結果である)真陰性(TN)が起こっており、及び偽陰性(FN)は、予測結果がnである一方で実際の値がpである場合である。一実施形態において、ある人が特定の疾患を有するかどうかを決定しようとする診断検査を考える。この場合、その人が検査で陽性となり、しかし実際には疾患を有しないとき偽陽性(FP)が起こる。他方で、その人が実際に疾患を有する場合に検査で陰性となり、健康であることが示唆されると、FNが起こる。一部の実施形態において、現実世界での亜型の有病率を仮定する受信者動作特性(ROC)曲線は、関連性のある集団において利用可能なサンプルで実現する誤りを再サンプリングすることによって作成されてもよい。
【0216】
[0225] 疾患の陽性的中率(PPV)、又は正確率、又は検査後確率は、陽性検査結果を有する患者のうち正しく診断される割合である。これは、陽性検査が検査下の基礎病態を反映する確率を反映するため、診断方法の最も重要な尺度である。しかしながら、その値は疾患の有病率に依存し、有病率にはばらつきがあり得る。偽陽性率(α)=FP/(FP+TN)-特異度;偽陰性率(β)=FN/(TP+FN)-感度;検出力=感度=1-β;陽性尤度比=感度/(l-特異度);陰性尤度比=(1-感度)/特異度。
【0217】
[0226] 陰性的中率は、陰性検査結果を有する患者のうち正しく診断される割合である。PPV及びNPV測定値は、適切な疾患亜型有病率推定値を用いて導出されてもよい。プール疾患有病率の推定値は、外科手術によりB対Mにおおまかに分類する不確定のプールから計算されてもよい。亜型特異的推定値については、一部の実施形態において、疾患有病率は時に、いかなるサンプルも利用できないため計算不能であることもある。このような場合、亜型疾患有病率の代わりにプール疾患有病率推定値が用いられてもよい。
【0218】
[0227] 一部の実施形態では、発現産物のレベル又は選択的エクソン使用が、以下:IPF、NSIP、HP、UIP、非UIPのうちの1つの指標となる。
【0219】
[0228] 一部の実施形態では、発現産物のレベル又は選択的エクソン使用が、対象が喫煙者又は非喫煙者であることの指標となる。
【0220】
[0229] 一部の実施形態において、主題の方法の発現解析結果は、所与の診断が正しいことの統計的信頼水準を提供する。一部の実施形態において、かかる統計的信頼水準は、少なくとも約、又は約85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%超であるか、又はそれより高い。
【0221】
レポート
[0230] 主題の方法及び/又はシステムは、サンプル(肺組織サンプル)がUIPサンプルであるという指示を提供するレポートを(例えば、レポートモジュールを使用して)生成することを含んでもよい。主題の方法及び/又はシステムは、サンプル(肺組織サンプル)が非UIPサンプルであるという指示を提供するレポートを(例えば、レポートモジュールを使用して)生成することを含んでもよい。主題の方法及び/又はシステムは、サンプル(肺組織サンプル)がILDサンプルであるという指示を提供するレポートを(例えば、レポートモジュールを使用して)生成することを含んでもよい。主題の診断方法は、検査下の個体がILDを有するかどうかに関する指示を提供するレポートを生成することを含み得る。主題の診断方法は、検査下の個体が喫煙者であるか、それとも喫煙者でないかに関する指示を提供するレポートを生成することを含み得る。主題の方法(又はレポートモジュール)は、検査下の個体がIPFを(及び例えばIPF以外のILDではなく;例えば、レポートは、その個体がNSIPではなくIPFを有することを指示し得る)有するかどうかに関する指示を提供するレポートを生成することを含み得る。
【0222】
[0231] 一部の実施形態において、UIP対非UIPを診断する主題の方法は、レポートを(例えば、レポートモジュールを使用して)生成することを含む。かかるレポートは、患者がUIPを有する可能性;患者が非UIPを有する可能性;患者がIPFを有する可能性;患者が喫煙者である可能性;更なる評価に関する推奨;治療薬及び/又は装置介入に関する推奨などの情報を含み得る。
【0223】
[0232] 例えば、本明細書に開示される方法は、主題の診断方法の結果を提供するレポートを生成又は出力するステップを更に含むことができ、レポートは電子媒体の形態で(例えば、コンピュータモニタ上の電子表示)、又は有形的表現媒体の形態で(例えば、紙又は他の有形的表現媒体に印刷されたレポート)提供されてもよい。主題の診断方法の結果(例えば、患者がUIPを有する可能性;患者が非UIPを有する可能性;患者がIPFを有する可能性;個体がILDを有する可能性;個体がIPFを有する可能性;個体が喫煙者である可能性)に関する判定は、「レポート」、又は単に「スコア」と称され得る。レポートを作成する人又は実体(「レポート生成者」)はまた、サンプル収集、サンプル処理などのステップも行い得る。或いは、レポート生成者以外の実体がサンプル収集、サンプル処理などのステップを行うこともできる。診断判定レポートは使用者に提供されてもよい。「使用者」は、医療専門家(例えば、臨床医、検査技師、医師(例えば、心臓病専門医)等)であってもよい。
【0224】
[0233] 主題のレポートは、1)サービス提供者情報;2)患者データ;3)所与の遺伝子産物又は遺伝子産物セットの発現レベルに関するデータ、スコア又は分類器判定;4)フォローアップ評価推奨;5)治療介入又は推奨;及び6)他の特徴のうちの1つ以上を更に含み得る。
【0225】
更なる評価
[0234] 所与の遺伝子産物又は遺伝子産物セットの発現レベルに基づき、及び/又はレポート(上記に記載したとおり)に基づき、医師又は他の有資格医療従事者は、検査対象(患者)の更なる評価が必要かどうかを判断することができる。更なる評価には、例えばスパイロメトリーが含まれ得る。
【0226】
治療介入
[0235] 所与の遺伝子産物又は遺伝子産物セットの発現レベルに基づき、及び/又はレポート(上記に記載したとおり)に基づき、医師又は他の有資格医療従事者は、適切な治療介入が勧められるかどうかを判断することができる。治療介入には、薬物ベースの治療介入、装置ベースの治療介入、及び外科的介入が含まれる。レポートに個体がUIP及び/又はIPFを有する可能性が指示される場合、薬物ベースの治療介入には、例えば、その個体に有効量のピルフェニドン、プレドニゾン、アザチオプリン、及び/又はN-アセチルシステインを投与することが含まれる。外科的介入には、例えば動脈バイパス術が含まれる。
【0227】
コンピュータ実行方法、システム及び装置
[0236] 本開示の方法はコンピュータ実行されることにより、方法ステップ(例えば、アッセイ、比較、計算など)が全て又は部分的に自動化されてもよい。
【0228】
[0237] 従って、本開示は、鑑別診断を含め、間質性肺疾患の診断(例えば、UIP、非UIP、IPF、NSIP、HP等の診断)を促進するコンピュータ実行方法に関連した方法、コンピュータシステム、装置などを提供する。
【0229】
[0238] 本開示は、喫煙者状態(例えば、喫煙者対非喫煙者)の決定を促進するコンピュータ実行方法に関連した方法、コンピュータシステム、装置などを更に提供する。
【0230】
[0239] 本開示は、鑑別診断を含め、間質性肺疾患の診断(例えば、UIP、非UIP、IPF、NSIP、HP等の診断)を促進するコンピュータ実行方法に関連した方法、コンピュータシステム、装置などを更に提供し、この方法は、対象の喫煙者状態(喫煙者対非喫煙者)を決定すること、及び対象の間質性肺疾患診断の決定に喫煙者状態を取り入れることを更に含む。一部の実施形態において、(i)喫煙者状態は、訓練(例えば、分類器訓練モジュールを使用する)の中で使用されるモデルの共変量として間質性肺疾患診断に取り入れられる。この手法により、特に喫煙者に由来するデータ(雑音の方が高い)において信号対雑音比が押し上げられ、喫煙者及び非喫煙者に由来するデータを組み合わせて同時に使用することが可能になる。一部の実施形態において、(ii)喫煙者状態は、間質性肺疾患診断分類器訓練の間に、喫煙者状態バイアスの影響を受けやすい1つ以上の遺伝子を同定し、かかる遺伝子を除外するか、又はかかる遺伝子に、喫煙者状態の影響を受けにくい他の遺伝子と異なる重みを付けることにより間質性肺疾患診断に取り入れられる。一部の実施形態において、(iii)喫煙者状態は、初期分類器が喫煙者を非喫煙者と区別する遺伝子シグネチャを認識するように(例えば、分類器訓練モジュールを使用して)訓練される階層化分類を構築することにより間質性肺疾患診断に取り入れられる。患者サンプルが「喫煙者」又は「非喫煙者」に(例えば、予備分類器分析モジュールを使用して)予備的に分類されると、それぞれ喫煙者又は非喫煙者におけるUIPと非UIPを区別するように各々訓練された個別の分類器が実行されて、間質性肺疾患が診断され得る。更に別の実施形態において、対象の間質性肺疾患診断の決定に喫煙者状態を取り入れるステップを含むかかる方法は、上述のこのような取り入れる方法のうちの1つ以上の組み合わせ(即ち、本段落の実施形態(i)~(iii)のうちの2つ以上の組み合わせを含む。
【0231】
[0240] 例えば、方法ステップは、バイオマーカーレベルの値を入手すること、正規化バイオマーカー(遺伝子)発現レベルを対照レベルと比較すること、UIP又は非UIPの可能性(及び場合によっては対象が喫煙者である可能性)を計算すること、レポートを生成することなどを含め、完全に又は部分的にコンピュータプログラム製品によって実施されてもよい。入手された値は、例えばデータベースに電子的に記憶されてもよく、プログラム化されたコンピュータによって(例えば、分類器分析モジュールを使用して)実行される分類器に供されてもよい。
【0232】
[0241] 例えば、本開示の方法及び/又はシステムは、バイオマーカーレベル(例えば、遺伝子産物の正規化発現レベル)を分類器分析モジュールに入力して方法及び/又はプロセスを実行することにより、本明細書に記載される比較及び計算ステップを実施し、及び例えば、コンピュータにとってローカル又はリモートの位置にある出力装置にレポートを表示又は印刷することにより、本明細書に記載されるとおりのレポートを(例えば、レポートモジュールを使用して)生成することを含み得る。レポートへの出力は、スコア(例えば、数値スコア(数値を表すもの)又は非数値スコア(例えば、数値又は数値範囲を表す非数値出力(例えば、「IPF」、「IPFのエビデンスなし」)であってもよい。他の態様において、出力は「UIP」対「非UIP」を指示し得る。他の態様において、出力は「喫煙者」対「非喫煙者」を指示し得る。
【0233】
[0242] 従って本開示は、ソフトウェア及び/又はハードウェアモジュールが記憶されているコンピュータ可読記憶媒体を含むコンピュータプログラム製品を提供する。ソフトウェア及び/又はハードウェアモジュールは、プロセッサによる実行時、個体からの1つ以上の生体サンプル(例えば肺組織サンプル)の分析によって得られた値に基づき関連する計算を実行することができる。コンピュータプログラム製品は、そこに計算を行うためのコンピュータプログラムを記憶している。
【0234】
[0243] 本開示は、上記に記載されるプログラムを実行するためのシステムを提供し、このシステムは、概して、a)ソフトウェア及び/又はハードウェアモジュールを実行する中央コンピューティング環境又はプロセッサ;b)コンピューティング環境に作動可能に接続された、患者データ(患者データには、例えば、上記に記載したとおり、患者からの生体サンプルを使用したアッセイから得られたバイオマーカーレベル又は他の値が含まれる)を受け取るための入力装置;c)コンピューティング環境に接続された、使用者(例えば医療従事者)に情報を提供するための出力装置;及びd)中央コンピューティング環境(例えばプロセッサ)によって実行される方法及び/又はプロセスであって、方法及び/又はプロセスは入力装置が受け取るデータに基づき実行され、及び方法及び/又はプロセスは値を計算し、ここで値は、本明細書に記載されるとおり、対象がUIP、非UIP、ILD、又はIPFを有する可能性の指標である、方法及び/又はプロセスを含む。
【0235】
[0244] 本開示はまた、上記に記載されるプログラムを実行するためのシステムも提供し、このシステムは、概して、a)ソフトウェア及び/又はハードウェアモジュールを実行する中央コンピューティング環境又はプロセッサ;b)コンピューティング環境に作動可能に接続された、患者データ(患者データには、例えば、上記に記載したとおり、患者からの生体サンプルを使用したアッセイから得られたバイオマーカーレベル又は他の値が含まれる)を受け取るための入力装置;c)コンピューティング環境に接続された、使用者(例えば医療従事者)に情報を提供するための出力装置;及びd)中央コンピューティング環境(例えばプロセッサ)によって実行される方法及び/又はプロセスであって、方法及び/又はプロセスは入力装置が受け取るデータに基づき実行され、方法及び/又はプロセスは値を計算し、この値は、本明細書に記載されるとおり、対象がUIP、非UIP、ILD、又はIPFを有する可能性の指標であり、及び方法及び/又はプロセスは訓練中に使用されるモデルの共変量として喫煙状態(喫煙者対非喫煙者)を使用する、方法及び/又はプロセスを含む。一部の実施形態において、方法及び/又はプロセスは、分類器訓練時に喫煙者状態バイアスの影響を受けやすい1つ以上の遺伝子を除外し、又はそれに異なる重みを付けて、喫煙状態によって交絡されない又はその影響を受けない遺伝子で訓練に使用される特徴空間をエンリッチする。
【0236】
[0245] 更に別の実施形態において、本開示は、上記に記載されるプログラムを実行するためのシステムを提供し、このシステムは、概して、a)ソフトウェア及び/又はハードウェアモジュールを実行する中央コンピューティング環境又はプロセッサ;b)コンピューティング環境に作動可能に接続された、患者データ(患者データには、例えば、上記に記載したとおり、患者からの生体サンプルを使用したアッセイから得られたバイオマーカーレベル又は他の値が含まれる)を受け取るための入力装置;c)コンピューティング環境に接続された、使用者(例えば医療従事者)に情報を提供するための出力装置;及びd)中央コンピューティング環境(例えばプロセッサ)によって実行される第1の方法及び/又はプロセスであって、第1の方法及び/又はプロセスは入力装置が受け取るデータに基づき実行され、第1の方法及び/又はプロセスは値を計算し、この値は、本明細書に記載されるとおり、対象が喫煙者又は非喫煙者である可能性の指標であり、喫煙者又は非喫煙者としての対象の状態により、それぞれ喫煙者又は非喫煙者におけるUIPと非UIPを区別するように(例えば、分類器訓練モジュールを使用して)特異的に訓練された第2の方法及び/又はプロセスが第1の方法及び/又はプロセスによって適用されることになる、第1の方法及び/又はプロセス、及びe)ここで第2の方法及び/又はプロセスは中央コンピューティング環境(例えばプロセッサ)によって実行されることであって、第2の方法及び/又はプロセスは入力装置が受け取るデータに基づき実行され、ここで第2の方法及び/又はプロセスは値を計算し、この値は本明細書に記載されるとおりの対象がILDを有する可能性の指標であること、を含む。
【0237】
コンピュータシステム
[0246]
図7Aは、バス又は一群のバス110によって一体に結合された、少なくとも1つのプロセッサ102、又は処理ユニット又は複数のプロセッサ、メモリ104、少なくとも1つの入力装置106及び少なくとも1つの出力装置108を含む処理システム100を示す。処理システムは、任意の好適な装置、例えば、ホスト装置、パーソナルコンピュータ、ハンドヘルド又はラップトップ装置、携帯情報端末、マルチプロセッサシステム、マイクロプロセッサベースのシステム、プログラム可能消費者向けエレクトロニクス装置、ミニコンピュータ、サーバコンピュータ、ウェブサーバコンピュータ、メインフレームコンピュータ、及び/又は上記のシステム又は装置のいずれかを含む分散コンピューティング環境などに実装されてもよい。
【0238】
[0247] 特定の実施形態において、入力装置106と出力装置108とは同じ装置であってもよい。処理システム100を1つ以上の周辺装置に結合するためのインタフェース112もまた提供されることがあり、例えばインタフェース112はPCIカード又はPCカードであってもよい。少なくとも1つのデータベース116を格納する少なくとも1つの記憶装置114もまた提供されることがある。
【0239】
[0248] メモリ104は、任意の形態のメモリ装置、例えば、揮発性又は不揮発性メモリ、固体記憶装置、磁気装置等であってもよい。例えば、一部の実施形態において、メモリ104は、ランダムアクセスメモリ(RAM)、メモリバッファ、ハードドライブ、読出し専用メモリ(ROM)、消去可能プログラマブル読出し専用メモリ(EPROM)、データベースなどであってもよい。
【0240】
[0249] プロセッサ102は、2つ以上の個別の処理装置を含んで、例えば処理システム100内の異なる機能を取り扱うことができる。プロセッサ100は、汎用プロセッサ(GPP)、中央演算処理装置(CPU)、加速処理ユニット(APU)、グラフィックプロセッサユニット(GPU)、特定用途向け集積回路(ASIC)など、一組の命令又はコード(例えば、メモリに記憶される)をラン又は実行するように構成された任意の好適な処理装置であってもよい。かかるプロセッサ100は、パーソナルコンピュータアプリケーション、モバイルアプリケーション、インターネットウェブブラウザ、移動体通信及び/又は無線通信(例えば、ネットワーク経由)などの使用に関連するメモリに記憶された一組の命令又はコードをラン又は実行することができる。より具体的には、プロセッサは、本明細書に記載されるとおりのデータの分析及び分類に関連するメモリ104に記憶された一組の命令又はコードを実行することができる。
【0241】
[0250] 入力装置106は入力データ118を受け取るもので、例えば、キーボード、ペン型装置又はマウスなどのポインタ装置、マイクロホンなどの音声制御起動用の音声受信装置、モデム又は無線データアダプタなどのデータ受信機又はアンテナ、データ収集カード等を含むことができる。入力データ118は、ネットワーク経由で受け取ったデータと併せて異なるソース、例えばキーボード命令に由来することができる。
【0242】
[0251] 出力装置108は出力データ120を作製又は生成し、例えば、この場合には出力データ120を可視化する表示装置又はモニタ、この場合には出力データ120が印刷されるプリンタ、ポート、例えばUSBポート、周辺構成要素アダプタ、モデム又は無線ネットワークアダプタなどのデータ伝送装置又はアンテナ等を含むことができる。出力データ120は個別的で、ネットワークに送信されるデータと併せて異なる出力装置、例えばモニタ上の画像表示に由来してもよい。使用者は、例えばモニタ上で、又はプリンタを使用して、データ出力、又はデータ出力の解釈を閲覧することができる。
【0243】
[0252] 一部の実施形態において、入力装置106及び/又は出力装置108は、ネットワーク経由でデータを送信及び/又は受信するように構成された通信インタフェースであってもよい。より具体的には、かかる実施形態において、処理システム100は、1つ以上のクライアント装置(
図7Aには図示せず)に対するホスト装置として働くことができる。そのため、処理システム100は、クライアント装置からデータ(例えば出力データ120)を送信し、及びデータ(例えば入力データ118)を受信することができる。かかる通信インタフェースは、1つ以上のネットワークインタフェースカードなど、処理システム100をクライアント装置と通信した状態にすることのできる任意の好適なモジュール及び/又は装置であってもよい。かかるネットワークインタフェースカードには、例えば、クライアント装置150をネットワーク経由でホスト装置110と通信した状態にすることのできるイーサネットポート、WiFi(登録商標)無線、Bluetooth(登録商標)無線、近距離通信(NFC)無線、及び/又はセルラー無線などが含まれ得る。
【0244】
[0253] 記憶装置114は、任意の形態のデータ又は情報記憶システム又は方法、例えば、揮発性又は不揮発性メモリ、固体記憶装置、磁気装置等であってもよい。例えば、一部の実施形態において、記憶装置114は、ランダムアクセスメモリ(RAM)、メモリバッファ、ハードドライブ、読出し専用メモリ(ROM)、消去可能プログラマブル読出し専用メモリ(EPROM)、データベースなどであってもよい。
【0245】
[0254] 使用時、処理システム100は、有線又は無線通信システム又は方法を介してデータ又は情報を少なくとも1つのデータベース116に記憶し、及び/又はそこから読み出すことが可能であるように構成される。インタフェース112は、処理ユニット102と特殊化した目的を果たし得る周辺構成要素との間の有線及び/又は無線通信を可能にし得る。一般に、プロセッサ102は、命令を入力装置106から入力データ118として受け取ることができ、出力装置108を利用することにより処理結果又は他の出力を使用者に向けて表示することができる。2つ以上の入力装置106及び/又は出力装置108が提供されてもよい。処理システム100は、任意の好適な形態の端末、サーバ、専門ハードウェアなどであってもよい。処理システム100はネットワーク通信システムの一部であってもよい。
【0246】
[0255] 処理システム100は、ネットワーク、例えば、ローカルエリアネットワーク(LAN)、仮想ローカルエリアネットワーク(VLAN)などの仮想ネットワーク、広域ネットワーク(WAN)、メトロポリタンエリアネットワーク(MAN)、ワールドワイド・インターオペラビリティ・フォー・マイクロウェーブ・アクセス(WiMAX)、セルラーネットワーク、インターネット、及び/又は有線及び/又は無線ネットワークとして実装される任意の他の好適なネットワークに接続することができる。例えば、LANネットワーク環境で使用されるとき、コンピューティングシステム環境100はネットワークインタフェース又はアダプタを介してLANに接続される。WANネットワーク環境で使用されるとき、コンピューティングシステム環境は、典型的にはモデム又はその他の、インターネットなど、WANで通信を確立するためのシステム若しくは方法を含む。モデムは、内蔵であっても又は外部であってもよく、ユーザ入力インタフェースを介するか、又は別の適切な機構を介してシステムバスに接続されてもよい。ネットワーク化された環境では、コンピューティングシステム環境100に関連して描かれるプログラムモジュール、又はその一部分は、リモートメモリ記憶装置に記憶されてもよい。
図7の図解されるネットワーク接続は例であり、複数のコンピュータ間に通信リンクを確立する他のシステム及び方法が用いられてもよいことは理解されるべきである。
【0247】
[0256] 入力データ118及び出力データ120はネットワークを介して他の装置に通信されてもよい。ネットワークを介した情報及び/又はデータの転送は、有線又は無線の通信システム及び方法を用いて実現されてもよい。サーバはネットワークと1つ以上のデータベースとの間でのデータの転送を促進することができる。サーバ及び1つ以上のデータベースは、情報ソースの例を提供する。
【0248】
[0257] 従って、
図7Aに示される処理コンピューティングシステム環境100は、1つ以上のリモートコンピュータとの論理結合を用いてネットワーク化環境で動作し得る。リモートコンピュータは、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピア装置、又は他の共通ネットワークノードであってもよく、典型的には上記に記載される要素の多く又は全てを含む。
【0249】
[0258]
図7Bは、
図7Aのプロセッサ102を更に詳細に示す。プロセッサ102は、特定のモジュールを実行するように構成され得る。モジュールは、例えば、ハードウェアモジュール、メモリ104に記憶され及び/又はプロセッサ102で実行されるソフトウェアモジュール、及び/又はこれらの任意の組み合わせであってもよい。例えば、
図7Bに示されるとおり、プロセッサ102は、予備分類器分析モジュール130、分類器訓練モジュール132、分類器分析モジュール134及びレポートモジュール136を含み、及び/又は実行する。
図7Bに示されるとおり、予備分類器分析モジュール130、分類器訓練モジュール132、分類器分析モジュール134及びレポートモジュール136は接続され、及び/又は電気的に結合されてもよい。従って、予備分類器分析モジュール130、分類器訓練モジュール132、分類器分析モジュール134及びレポートモジュール136の間で信号が送られ得る。
【0250】
[0259] 分類器訓練モジュール132は、データ(例えば遺伝子発現データ、シーケンシングデータ)のコーパスを受け取って分類器を訓練するように構成されてもよい。例えば、以前(例えば専門家によって)UIP及び非UIPと同定されたサンプルからの臨床アノテーションデータが入力装置106によって受け取られ、分類器訓練モジュール132によって使用されることにより、以前UIP及び非UIPと同定されたサンプル間の相関が同定されてもよい。例えば、専門家TBB組織病理ラベル(即ち、UIP又は非UIP)、専門家HRCTラベル、及び/又は専門家患者レベル臨床転帰ラベルが入手され、単独又は組み合わせで使用されることにより、分類器がマイクロアレイ及び/又はシーケンシングデータを用いて訓練されてもよい。使用される特徴空間は、遺伝子発現、変異体、突然変異、融合、ヘテロ接合性の消失(loss of heterozygoxity)(LOH)、生物学的パスウェイ効果及び/又は機械学習アルゴリズムを訓練するための特徴として抽出され得る任意の他の次元のデータを含むことができる。一部の実施形態において、UIP対非UIP分類器、喫煙者対非喫煙者分類器、又はUIP対非UIP及び喫煙者対非喫煙者分類器の訓練に使用される特徴空間は、遺伝子発現、変異体、突然変異、融合、ヘテロ接合性の消失(loss of heterozygosity)(LOH)、及び生物学的パスウェイ効果を含む。一部の実施形態において、UIP対非UIP分類器、喫煙者対非喫煙者分類器、又はUIP対非UIP及び喫煙者対非喫煙者分類器の訓練に使用される特徴空間は、遺伝子発現及び変異体次元を含む。
【0251】
[0260] 一部の実施形態において、分類器訓練モジュール132は、受け取られたサンプルが喫煙者に関連するか、それとも非喫煙者に関連するかに関連する指示に基づき喫煙者分類器及び非喫煙者分類器を訓練することができる。他の実施形態において、喫煙者/非喫煙者を属性(モデル共変量)として使用して単一の分類器を訓練してもよい。分類器の訓練後、それを使用して、本明細書に記載されるとおりの新規に受け取られた未知のサンプルを同定及び/又は分類してもよい。
【0252】
[0261] 予備分類器分析モジュール130は、サンプルが喫煙者に関連するか、それとも非喫煙者に関連するかを同定することができる。具体的には、予備分類器分析モジュール130は、任意の好適な方法を用いてサンプルを、喫煙する(又は過去の多量喫煙歴を有する)個体に由来するものと、それに対して喫煙しない(又は喫煙歴がない)個体に由来するものとに同定及び/又は分類することができる。分類は、使用者から指示を受け取ること、喫煙者状態バイアスの影響を受けやすい遺伝子を同定すること、機械学習分類器を使用すること、及び/又は本明細書に記載される任意の他の好適な方法など、任意の好適な方法で行われてもよい。
【0253】
[0262] 分類器分析モジュール134は、サンプルを分類器に入力して、受け取ったサンプルをUIP及び非UIPに結び付けられると同定及び/又は分類することができる。具体的には、分類器分析モジュール134は訓練済み分類器を使用して、サンプルがUIPを指示するか、それとも非UIPを指示するかを同定することができる。一部の実施形態において、分類器分析モジュール134は、UIP又は非UIPに結び付けられるサンプルのパーセンテージ又は信頼スコアを指示することができる。一部の実施形態では、分類器分析モジュール134は、一方が喫煙者サンプル用及び他方が非喫煙者サンプル用(予備分類器分析モジュール130によって決定されるとおり)の2つの別個の分類器を実行することができる。他の実施形態では、喫煙者状態の入力を有する喫煙者サンプル及び非喫煙者サンプルの両方について単一の分類器が実行される。
【0254】
[0263] レポートモジュール136は、本明細書に更に詳細に記載されるとおりの分類器分析モジュール134の結果に基づき任意の好適なレポートを生成するように構成されてもよい。場合によっては、レポートは、限定はされないが、以下:発現差異がある遺伝子の数、元のサンプルの適合性、差異のある選択的スプライシングを示す遺伝子の数、診断、診断の統計的信頼度、対象が喫煙者である可能性、ILDの可能性、及び適応される治療法のうちの1つ以上のような情報を含み得る。
【0255】
[0264]
図7Cは、本開示の非限定的な一実施形態のフローチャートを示し、ここでは既知のUIP及び非UIPサンプルの遺伝子産物発現データを使用して、UIPと非UIPとの鑑別のための分類器が(例えば、分類器訓練モジュールを使用して)訓練され、分類器は場合によっては喫煙者状態を共変量と見なし、及び未知のサンプルからの遺伝子産物発現データを訓練済み分類器に入力することにより、その未知のサンプルがUIP又は非UIPのいずれかと同定され、及び分類器による分類の結果はレポートによって定義及び出力される。
【0256】
[0265] 特定の実施形態は、
図7Aのコンピューティングシステム環境100など、1つ以上のコンピューティング装置によって行われる行為及び動作の象徴的表現に関連して記述され得る。従って、時にコンピュータ実行されると称されるかかる行為及び動作が、コンピュータのプロセッサによる、構造化された形態のデータを表す電気信号の操作を含むことは理解されるであろう。この操作によってデータは変換されるか、又はコンピュータのメモリシステム内の位置に維持され、メモリシステムはコンピュータの動作を当業者が理解する方法で再構成し、又は他の方法で改変する。データを維持するデータ構造は、データの形式により定義される特定の特性を有するメモリの物理的な位置である。しかしながら、実施形態が前述の文脈で記載されるものではあるが、以下に記載される行為及び動作がまたハードウェアに実装されてもよいことは当業者が理解するであろうとおり、それは限定を意図したものではない。
【0257】
[0266] 実施形態は、数多くの他の汎用又は専用コンピューティング装置及びコンピューティングシステム環境又は構成で実行されてもよい。実施形態での使用に好適であり得る他のコンピューティングシステム、環境、及び構成の例としては、限定はされないが、パーソナルコンピュータ、携帯用又はラップトップ型装置、携帯情報端末、マルチプロセッサシステム、マイクロプロセッサベースのシステム、プログラム可能消費者向けエレクトロニクス、ネットワーク、ミニコンピュータ、サーバコンピュータ、ウェブサーバコンピュータ、メインフレームコンピュータ、及び上記のシステム又は装置のいずれかを含む分散コンピューティング環境が挙げられる。
【0258】
[0267] 実施形態は、ハードウェア及び/又はソフトウェアモジュールなど、コンピュータ実行可能命令の一般的な文脈で記載されてもよい。実施形態はまた、通信ネットワークを介してリンクしたリモート処理装置によってタスクが遂行される分散コンピューティング環境で実践されてもよい。分散コンピューティング環境では、プログラムモジュールは、メモリ記憶装置を含むローカル及びリモートの両方のコンピュータ記憶媒体に位置してもよい。
【0259】
コンピュータプログラム製品
[0268] 本開示は、上記で
図7に関連して記載されるものなどのプログラム可能なコンピュータ上で実行されると、本開示の方法を実行することのできる
コンピュータプログラム製品を提供する。上記で考察したとおり、本明細書に記載される主題は、所望の構成に依存するシステム、機器、方法、及び/又は物品に具体化され得る。これらの様々な実装には、記憶システム、少なくとも1つの入力装置(例えば、ビデオカメラ、マイクロホン、ジョイスティック、キーボード、及び/又はマウス)、及び少なくとも1つの出力装置(例えば、表示モニタ、プリンタ等)からデータ及び命令を受け取ること、及びそれにデータ及び命令を送ることと併せて、専用又は汎用であってもよい、少なくとも1つのプログラム可能なプロセッサを含むプログラム可能なシステム上の実行可能及び/又は解釈可能な1つ以上のコンピュータプログラムにおける実装が含まれ得る。
【0260】
[0269] コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、アプリケーション、コンポーネント、又はコードとしても知られる)はプログラム可能なプロセッサの命令を含み、高レベル手続き型及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ/機械言語に実装されてもよい。本明細書で使用されるとき、用語「機械可読媒体」は、機械命令を機械可読信号として受け取る機械可読媒体を含め、プログラム可能なプロセッサに機械命令及び/又はデータを提供するために使用される任意のコンピュータプログラム製品、機器及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ等)を指す。
【0261】
[0270] この説明から、本開示の態様が、少なくとも一部には、ソフトウェア、ハードウェア、ファームウェア、又はこれらの任意の組み合わせに具体化されてもよいことは明らかであろう。従って、本明細書に記載される技法は、ハードウェア回路及び/又はソフトウェアのいかなる具体的な組み合わせにも、又はコンピュータ若しくは他のデータ処理システムによって実行される命令のいかなる詳細なソースにも限定されない。むしろ、これらの技法は、任意の種類のROM、RAM、キャッシュメモリ、ネットワークメモリ、フロッピーディスク、ハードドライブディスク(HDD)、固体素子(SSD)、光ディスク、CD-ROM、及び光磁気ディスク、EPROM、EEPROM、フラッシュメモリ、又は電子的フォーマットで命令を記憶するのに好適な任意の他のタイプの媒体を含め、メモリ又は他のコンピュータ可読媒体に記憶された命令のシーケンスを実行するマイクロプロセッサなどの1つ以上のプロセッサに応答してコンピュータシステム又は他のデータ処理システムで行われてもよい。
【0262】
[0271] 加えて、1つ又は複数のプロセッサは、1つ以上のプログラム可能な汎用又は専用マイクロプロセッサ、デジタルシグナルプロセッサ(DSP)、プログラマブルコントローラ、特定用途向け集積回路(ASIC)、プログラム可能論理デバイス(PLD)、トラステッドプラットフォームモジュール(TPM)など、又はかかる素子の組み合わせであってもよく、又はそれを含んでもよい。代替的実施形態において、論理回路又は他のハードワイヤード回路などの専用ハードウェアをソフトウェア命令との組み合わせで使用して本明細書に記載される技法を実装してもよい。
【0263】
アレイ及びキット
[0272] 本開示は、主題の評価方法又は主題の診断方法の実施に使用されるアレイ及びキットを提供する。
【0264】
アレイ
[0273] 主題のアレイは複数の核酸を含むことができ、その各々が、UIP、非UIP、IPF、又はILDに関して検査下にある個体から得られた組織サンプル中に存在する細胞において発現差異がある遺伝子にハイブリダイズする。
【0265】
[0274] 主題のアレイは複数の核酸を含むことができ、その各々が、喫煙者状態に関して検査下にある個体から得られた組織サンプル中に存在する細胞において発現差異がある遺伝子にハイブリダイズする。
【0266】
[0275] 主題のアレイは複数の核酸を含むことができ、その各々が、喫煙者状態とUIP、非UIP、IPF、又はILDとの両方に関して検査下にある個体から得られた組織サンプル中に存在する細胞において発現差異がある遺伝子にハイブリダイズする。
【0267】
[0276] 主題のアレイは複数のメンバー核酸を含むことができ、そのメンバー核酸の各々が異なる遺伝子産物にハイブリダイズする。場合によっては、2つ以上のメンバー核酸が同じ遺伝子産物にハイブリダイズする;例えば、場合によっては2、3、4、5、6、7、8、9、10、又はそれ以上のメンバー核酸が同じ遺伝子産物にハイブリダイズする。メンバー核酸は、約5ヌクレオチド(nt)~約100nt、例えば、5、6、7、8、9、10、11、12、13、14、15、16、17 18、19、20、20~25、25~30、30~40、40~50、50~60、60~70、70~80、80~90、又は90~100ntの長さを有し得る。核酸は1つ以上のリン酸骨格修飾を有し得る。
【0268】
[0277] 主題のアレイは、約10~約105個のユニークなメンバー核酸、又は105個より多いユニークなメンバー核酸を含み得る。例えば、主題のアレイは、約10~約102、約102~約103、約103~約104、約104~約105、又は105より多いユニークなメンバー核酸を含み得る。
【0269】
キット
[0278] 本開示のキットは、上記に記載したとおりのアレイと;遺伝子産物の発現レベルの解析用試薬とを含み得る。
【0270】
[0279] 核酸遺伝子産物の発現レベルの解析用試薬には、例えば、核酸のシーケンシングに好適な試薬;核酸の増幅に好適な試薬;及び核酸ハイブリダイゼーションに好適な試薬が含まれる。
【0271】
[0280] キットは、緩衝液;検出可能標識;検出可能標識を発色させる成分(例えば、核酸プローブが検出可能標識を含む場合)などを含み得る。キットの様々な成分が別個の容器に存在してもよく、又は特定の適合性のある成分が必要に応じて単一の容器内に予め組み合わされてもよい。
【0272】
[0281] 上述の成分に加えて、主題のキットは、キットの成分を使用した主題の方法の実施に関する説明書を含み得る。主題の方法の実施に関する説明書は、概して好適な記録媒体に記録される。例えば、説明書は紙又はプラスチックなどの基材に印刷されてもよい。このように、説明書はキットにおいて添付文書等として、キット又はその成分の容器のラベル表示に(即ち、パッケージング又はサブパッケージングと結び付けられている)存在するなどしてもよい。他の実施形態において、説明書は、好適なコンピュータ可読記憶媒体、例えばコンパクトディスク読出し専用メモリ(CD-ROM)、デジタルバーサタイルディスク(DVD)、ディスケット等に存在する電子記憶データファイルとして存在する。更に他の実施形態において、実際の説明書はキットに存在するのでなく、遠隔ソースから例えばインターネットを介して説明書を入手する方法が提供される。この実施形態の例は、説明書を閲覧することのできる、及び/又はそこから説明書をダウンロードすることのできるウェブアドレスを含むキットである。説明書と同様に、この説明書の入手方法は好適な基材に記録される。
【0273】
【0274】
【0275】
【0276】
[0282] 「ENSEMBL ID」は、Ensemblゲノムブラウザデータベース(ワールドワイドウェブアドレス:ensembl.org/index.html(全体として参照により本明細書に援用される)を参照のこと)からの遺伝子識別番号を指す。各識別名は、「Ensembl遺伝子」を表す文字ENSGで始まる。各ENSEMBL ID番号(即ち、Ensemblデータベース中の各「遺伝子」)は、特定のヒト染色体上の特定の開始及び停止位置によって定義される遺伝子を指し、従ってヒトゲノムの特定の遺伝子座を定義する。当業者は十分に理解し得るとおり、本明細書に開示される全ての遺伝子記号が遺伝子配列を参照し、これらの遺伝子配列は、公的に利用可能なデータベース、例えば、UniGeneデータベース(Pontius JU, Wagner L, Schuler GD. UniGene: a unified view of the transcriptome. In: The NCBI Handbook. Bethesda (MD): National Center for Biotechnology Information; 2003、ワールドワイドウェブアドレスncbi.nlm.nih.gov/unigene(本明細書に援用される)で利用可能)、RefSeq(The NCBI handbook [Internet]. Bethesda (MD): National Library of Medicine (US), National Center for Biotechnology Information; 2002 Oct. Chapter 18, The Reference Sequence (RefSeq) Project、ワールドワイドウェブアドレス:ncbi.nlm.nih.gov/refseq/(本明細書に援用される)で利用可能)、Ensembl(EMBL、ワールドワイドウェブアドレス:ensembl.org/index.html(本明細書に援用される)で利用可能)などで容易に利用可能である。その遺伝子記号、Ensembl ID、及びEntrez IDによって本明細書に開示される遺伝子の配列は、全体として本明細書に援用される。
【0277】
[0283] 本明細書に引用される全ての参考文献、特許、及び特許出願は、あらゆる目的から全体として援用される。
【実施例0278】
実施例
[0284] びまん性実質性障害の複雑さを考えると、ILDの診断手法は依然として極めて難題である。診断手法では、臨床的、放射線学的、及び病理学的データの集学的評価が重要視されてきた。後者では、従来、肺組織のサンプリングにおける収率を最大化するためSLBが重要視されている。診断上の代用として働き得る分子マーカーの発達は興味深い。ILDの診断において臨床的に有用であるためには、病理診の代用検査は、類似しているが病理学的には別個の疾患過程の中からUIPを区別する必要がある。
【0279】
[0285] 本発明者らは、ゲノム分類器が多様な患者集団において高精度でTBBのUIP遺伝子発現シグネチャを検出することができるという仮説を立てた。以下の例では、本発明者らはエクソームエンリッチメント転写データに対して機械学習を用いることにより、実際の臨床で遭遇する幅広い種類のILDの中からUIPを鑑別するように分類器を訓練した。次に本発明者らは、この分類器が独立した多施設検証コホートにおいてUIPの存在を正確に予測することを実証した。更に、本発明者らは、意外にも、サンプルをプールすることにより診断の感度及び特異度の向上が実現し、分類器性能が細胞の不均一性に非依存的であることを実証する。先行研究はIPFにおける目的の細胞が肺胞細胞であり;従ってあらゆる生物学が肺胞細胞内に含まれると予想し得ることを指摘しているため、これは意外であった。しかしながら、本発明者らの結果は、肺胞細胞外のシグナルがIPF分類を知らせるのに十分であることを実証し、これはこれまで記載されたことがない。
【0280】
[0286] 従って、本明細書に開示されるゲノム分類器は、ILDの診断における外科的肺生検の必要性を低減し得るとともに、最終的にはIPF患者の診断及び治療を知らせるために用いられ得る。
【0281】
実施例1
サンプル収集、病理診断、及びラベル付け
[0287] 施設内審査委員会(IRB)の承認を受けた、Veracyte, Inc.(South San Francisco, CA)が後援する進行中の多施設臨床プロトコル、新規ゲノム検査のための気管支サンプル収集(BRonchial sAmple collection for a noVel gEnomic test:BRAVE)の一部として、ビデオ補助下胸腔鏡手術(VATS)標本を前向きに収集した。追加のVATS及び外科的肺生検標本をバンク保存の供給源から入手した。利用可能な場合には、通常の臨床ケアの間に収集された高分解能コンピュータ断層撮影(HRCT)スキャンを専門放射線科医がレビューした。放射線診断はATSガイドライン(Raghu G, et al., Am J Respir Crit Care Med 2011,183:788-824、全体として参照により本明細書に援用される)に従いまとめた。病理学的診断は専門病理医(A-LK、TC、JM、及びSG)が中央レビュープロセスに従い決定した。
【0282】
[0288] 外科手術後、試験施設が外科的肺生検(SLB)、気管支鏡肺クライオ生検(BLC)又は経気管支生検(TBB)から組織スライドを調製し、匿名化し、2人の病理医による盲検の独立した専門家病理学レビューに供した。選択のスライドをスキャンして顕微鏡画像のパーマネントデジタルファイルを作成した(Aperio, Vista, CA)。Kim SY, et al., The Lancet Respiratory Medicine 2015;3:473-482(全体として参照により本明細書に援用される)に記載される中央レビュープロセスに従いスライドを評価した。
【0283】
[0289] 各病理医が患者に関して全体として(患者レベル)、及び病理診のためサンプリングされた特定の肺葉に関して(サンプル又は肺葉レベル)診断を決定した。診断は、亜型一致として定義される意見一致をもって評価した。意見一致の場合、カテゴリ上のUIP又は非UIPの「真の」ラベルを定義し、他の場合には第3の病理医による盲検レビューを用いて3分の2の(「タイブレーカー」)コンセンサスを実現した。意見一致がない場合、非盲検協議プロセスを用いた。このプロセスはまた
図1にも説明され、結果としてサンプルレベル及び患者レベルの両方の病理診断が得られる。
【0284】
[0290] 同じ肺葉からの外科的肺生検(SLB)で行われた病理診断を用いてアルゴリズム訓練及び開発用の真のラベルをTBBに割り当てた。Kim SY et al.,前掲に記載されるとおり、病理亜型をアルゴリズム訓練及び検証で用いるためのUIP又は非UIPのサンプル及び患者ラベルに翻訳し、但し例外として、下葉ではUIPパターンが検出されたが上葉では非UIP又は診断不十分ラベルが割り当てられた3人の患者については、患者レベルでUIPラベルを割り当てた(表14)。
【0285】
[0291] 各患者から分子検査用に最大5つのTBBサンプル(上葉2つ、下葉3つ)を収集した。サンプリングは、病理サンプリングに隣接する範囲から目に見える組織を入手するという指針に基づいて、治療を行う医師の裁量で行われた。アルゴリズム訓練及びサンプルスコア化用に肺葉レベルの分解能でTBBサンプルにUIP又は非UIPのラベルを割り当てた。患者は2つ以上のサンプルレベル診断を有し得るが(即ち、患者1人当たり各VATSサンプルに1つ、ほとんどの場合に右肺の下葉及び上葉の各々から1つ)、患者レベル診断は1つのみ有し得る。混合物については(実施例6を参照)、訓練における全ての患者をスコア化できるようにサンプルラベルから真のラベルを推測した。
【0286】
[0292] 合計で、17の臨床施設において84人の患者から283例のTBBサンプルが収集され、これを本明細書に報告する試験に利用した。以下の病理診断は、アルゴリズム訓練及びスコア化の目的上、非UIPと定義した:急性肺傷害、細気管支炎、剥離性間質性肺炎、びまん性肺胞障害、肺気腫、好酸球性肺炎、非特異性間質性肺炎(NSIP)(細胞性、混合型、又はFavorの亜型を含む)、肉芽腫性疾患、過敏性肺炎(Favor亜型を含む)、器質化肺炎、ニューモシスチス肺炎、肺高血圧症、呼吸細気管支炎、サルコイドーシス、及び喫煙関連間質性線維症。
【0287】
[0293] UIPは、アルゴリズム訓練及びスコア化の目的上、任意のUIP亜型(Classic UIP、difficult UIP、Favor UIP、又はUIP)と定義した。
【0288】
[0294] 診断上の一致は、非UIP病理診については亜型意見一致又はUIPについては任意のUIP亜型と定義した。亜型意見不一致(例えばFavor HPとHP、Favor NSIPとNSIP)の場合、相談後にコンセンサス診断(例えば、それぞれHP及びNSIP)を受け入れた。他に分類されない慢性間質性線維症、診断不十分、又は「その他」の診断は訓練ラベルを割り当てず、訓練から除外した。
【0289】
[0295] 上述のとおり、肺葉にわたって一致したUIP又は非UIP診断を有する患者からの混合は、混合スコア化についてUIP又は非UIPラベルを割り当てた。下葉UIPパターンを有するが、その上葉では非UIP又は診断不十分のラベルを有する3人の患者は、混合物スコア化の目的上、UIPラベルを割り当てた。
【0290】
[0296] 多くの診断用語は米国胸部学会(American Thoracic Society)(ATS)2011年又は2013年ガイドライン5,6に従うが、肺葉レベルで特徴をより良く特徴付けるため、専門病理医パネルによって幾つかの変更が加えられた。詳細には、ATS 2011年ガイドラインに記載されるとおりの「Definite UIP」及び「Probable UIP」の代わりに「Classic UIP」及び「Difficult UIP」を含めた。他に分類されない慢性間質性線維症(CIF/NOC)は分類不能の線維性ILDに対応する。分類不能の線維症(専門家病理診パネルの判断で、UIP、非特異性間質性肺炎(NSIP)、又は過敏性肺炎(HP)が示唆される特徴を呈する)のケースを特定するため、CIF/NOCの3つのサブカテゴリ、「Favor UIP」、「Favor NSIP」、及び「Favor HP」を定義した。喫煙関連間質性線維症(SRIF)の診断もまた含める20。
【0291】
[0297] 分類のため、サンプルレベル病理診断を2値クラスラベル(UIP及び非UIP)に変換した。病理診断カテゴリの中で、「UIP」クラスには、(1)UIP、(2)Classic UIP、(3)Difficult UIP、及び(4)Favor UIPが含まれる。診断不十分(ND)を除く他の全ての病理診断は「非UIP」クラスに割り当てた。
【0292】
実施例2
サンプル処理
[0298] 患者から分子試験用に術前又は術中経気管支生検標本を収集し、包装して核酸保存剤中4℃で輸送し、処理時までVeracyteの施設において-80℃で長期保存した。簡潔に言えば、切片化のためTissue-Tek O.C.T.媒体(Sakura Finetek U.S.A.)を使用して凍結組織サンプルをマウントし、CM1800クライオスタット(Leica Biosystems、Buffalo Grove, Illinois)を使用して2×20μm切片を作成した。直ちにカール状組織片をRNAprotect(QIAGEN、Valencia, California)に浸漬し、4℃で一晩インキュベートし、抽出時まで-80℃で保存した。可能な場合は常に、隣接する5μmカール状組織片をスライドグラスにマウントし、標準的手順に従いヘマトキシリン・エオシン(H&E)染色用に処理した。
【0293】
[0299] 修正を加えたAllPrep(商標)Micro Kit(QIAGEN、Valencia, CA)手順を用いて保存TBBサンプルから核酸を抽出した。簡潔に言えば、TissueLyzer(商標)及びQIAshredder(商標)を使用してTBB組織を徹底的に破壊してホモジナイズした後、製造者(QIAGEN)の指示に従いDNA及びRNA画分をカラムで分離した。全RNAサンプルの量及びクオリティを、それぞれQuantiFluor(商標)RNA System(Promega、Madison, WI)及びAgilent RNA 6000 Picoアッセイ(Agilent Technologies、Santa Clara, CA)を使用して決定した。本発明者らはまた、ヒト脳、心臓、肺、胎盤、及び精巣(Life Technologies、Carlsbad, CA)、甲状腺及び肺腫瘍(Takara Bio USA、Mountain View, CA)(Asterand USA;協同ヒト組織ネットワーク(Cooperative Human Tissue Network))、及び肺上皮細胞株(HBEC、NL-20、Beas2b;Avrum Spira博士より供与いただいた)に由来する全RNAも入手した。加えて、22人のBRAVE I患者の外科的肺生検から抽出した全RNAもまた使用した(Kim SY et al.、前掲)。
【0294】
[0300] TruSeq(商標)RNA Access Library Prep Kit(Illumina、San Diego, CA)を製造者の指示に従い使用して、エクソン配列がエンリッチされたRNAライブラリを調製した。簡潔に言えば、高温下で二価カチオンを使用してRNAサンプルを小片に断片化し、断片化されたRNAをランダムヘキサマープライマーを使用することにより逆転写酵素でcDNAに変換した。続いてcDNAライブラリを鋳型として使用して第2鎖を合成した;従って、二本鎖cDNAのライブラリが作製され、これを製造者のプロトコルに従いシーケンシングアダプターにライゲートした。最後に、製造者のプロトコルに従い、2ラウンドのPCR増幅、バリデーション、及びキャプチャープローブハイブリダイゼーションにより、アダプターがライゲートされた高特異性のcDNAのエンリッチライブラリを作製した。
【0295】
実施例3
次世代RNAシーケンシング
[0301] この例では、NextSeq(商標)500インスツルメント(Illumina)を製造者の指示に従い使用して、サンプル当たり最大2500万ペアエンドリードの目標リード深度で、インプロセスPCR収率基準を満たす選択のサンプルに対してエクソームエンリッチメント次世代RNAシーケンシングを実施し、及び、データクオリティのフィルタリング後、17,601個のEnsembl遺伝子の発現カウントを正規化し、機械学習アルゴリズムに入力した。機械学習を用いてエラスティックネットロジスティック回帰モデルを訓練した。交差検証により、及び31人の患者の独立セットに関して、性能を評価した。シーケンシング及びアルゴリズム開発は以下のとおり実施した。
【0296】
[0302] 簡潔に言えば、Ovation(商標)RNASeq System v2(NuGEN、San Carlos, California)及びTruSeq(商標)(Illumina、San Diego, California)を使用して10ngの全RNAを増幅し、シーケンシングライブラリを調製し、Illumina HiSeqで製造者の指示に従いシーケンシングした(実施例2に記載されるとおり)。STAR RNAseqアライナーソフトウェアを使用して生シーケンシング(FASTQ)ファイルをヒト参照アセンブリ37(Genome Reference Consortium)とアラインメントした(Dobin A, et al., Bioinformatics 2013 Jan 1;29(1):15-21、全体として参照により本明細書に援用される)。HTSeqを使用して最大26,268個のEnsemblアノテート付き遺伝子レベル特徴のリードカウントを決定した(Anders S, et al., Bioinformatics 2015; 31:166-169、全体として参照により本明細書に援用される)。
【0297】
[0303] RNA-SeQCを使用してシーケンシングデータクオリティメトリクスを生成した(DeLuca DS, et al., Bioinformatics 2012;28:1530-153222、全体として参照により本明細書に援用される)。リード総数、マッピングされたユニークなリード数、各塩基のカバレッジ平均(mean per-base coverage)、塩基重複率、コード領域とアラインメントされた塩基の割合、塩基ミスマッチ率、及び遺伝子内でのカバレッジの均一性について、各レプリケートにおけるクオリティメトリクスを許容メトリクスに対して評価した。シーケンシングデータをフィルタリングすることにより、ライブラリアッセイによるエンリッチメントの標的とならない特徴、及びEnsemblで偽遺伝子とアノテートされている遺伝子、T細胞受容体又は免疫グロブリン遺伝子における非発現エクソン、又はrRNAを除外すると、特異的エンリッチメントの信頼度が高い17,601個のEnsembl遺伝子となった。
【0298】
[0304] 84患者分類器について(
図2を参照のこと)、複数のアッセイ間で発現が変動する遺伝子(全アッセイ間SD>0.3)もまた除外すると、ラン間で発現に再現性のある遺伝子は14,811個になった。発現カウントデータを遺伝子分散関数(gene dispersion function)によってスケーリングし、VST変換した後、下流解析を行った。Rで「princomp」関数(https://www.r-project.org)を使用して主成分分析を行った。Friedman J, et al., Journal of statistical software 2010;33:1-22(全体として参照により本明細書に援用される)に記載されるとおり、エラスティックネットペナルティ付きロジスティック回帰によりモデル特徴選択及びパラメータ推定を実施した。患者一人抜き交差検証(LOPO CV)によりパラメータ調整及び性能評価を決定した。
【0299】
実施例4
患者コホート特性
[0305] ILDの分子検査の開発に用いるため、BRAVE試験(実施例9を参照)の一部としての18の臨床施設に登録された113人のILD患者からのサンプルをスクリーニングした。
図2は、本試験に用いるためスクリーニングした113人の患者及び関連するTBBサンプルのフロー図を示し、これは、逐次的な各処理ステップにおける患者及びサンプルのコホート(中央の四角)、処理ステップ(台形)、及び除外(側方の四角)を示す。病理診断が利用可能かどうかの前に、患者を訓練及びテストセットに前向きに割り当てた。検査室及び解析担当者はアルゴリズムロック及びスコア化が終わるまでテストセットの病理診断及びラベルに関して盲検のままであった。
【0300】
[0306] 本発明者らは、実施例1に記載される中央病理レビュープロセスを用いてこれらの患者のうち95人に関する肺の個別の肺葉に特異的な病理診断を得た。
【0301】
[0307] 本発明者らは、非盲検レビュー(即ち協議)が必要であった診断及び肺癌と診断された1人の患者を除外し、少なくとも1つの肺葉におけるILD病理診の信頼度が高い患者は89人となった。
【0302】
[0308] 本発明者らは、113人の患者から収集した496例のTBBサンプルから全RNAを抽出し、最終的には108人の患者に由来する407サンプルに関して高クオリティRNAseqデータを生成した。
【0303】
[0309] 診断が付いた患者及び高クオリティサンプルデータの和集合は、84人の患者からの283サンプルに相当する(52UIP及び32非UIP)(
図2、表2)。
【0304】
[0310] 本発明者らは、訓練コホートとテストコホートとの間でUIP有病率を同等にすることを目標として、53人の患者をアルゴリズム訓練に、及び31人の患者を検証コホートに前向きに割り当てた(表2)。
【0305】
【0306】
[0311] 本発明者らの前向き収集における幾つかのまれな非UIP ILDに起因して、一部の亜型は患者コホートにおける単一症例によって代表される(表14、
図3)。細胞性NSIP、Favor HP、肺気腫及びニューモシスチス肺炎の単一症例は訓練コホートに割り当て、一方、びまん性肺胞障害、肺高血圧症及び好酸球性肺炎の単一症例はテストセットに割り当てた。これらの患者におけるILD亜型の多様性及び有病率の低さは、実際の臨床で遭遇するとおりの均衡のとれた一連のILDでゲノム分類器を訓練することの課題を示す。
【0307】
[0312] ルーチンの臨床ケアの一部として本発明者らの患者コホートに対して行われた放射線画像診は、UIP有病率の独立した推定を提供する。本発明者らは利用可能なHRCTスキャンの専門家レビューを実施し、UIPパターンのATS基準(Raghu G., 2011、前掲)に従い放射線学的所見をまとめた。全ての病理生検タイプによる62%と比較して、本発明者らのコホートにおけるHRCT UIPパターンの有病率は16%であった(表2)。UIPの有病率はSLBにおいて気管支鏡生検よりも高く(72%対47%[クライオ生検]対14%[経気管支生検])、SLBでは典型的には確定的UIPが同定された(表2)。
【0308】
実施例5
個別TBBサンプルを使用した分類器開発及び性能
[0313] 本発明者らは、種々のゲノム特徴及び臨床的特徴を使用して、53人の患者からの170 TBBサンプルの本発明者らの訓練セットに対して複数の正規化スキーム、特徴選択及び機械学習アルゴリズムを評価した。本発明者らは、交差検証において、発現カウントデータで訓練したエラスティックネットペナルティ付きロジスティック回帰モデル(特徴として169遺伝子(表15)を使用する)から、最も高く、最も安定した分類性能を観察した。このモデルは、サンプルレベルデータに基づき、訓練セットに関する交差検証で0.85の受信者動作特性曲線下面積(ROC-AUC)を実現する(
図3A、
図3B)。
【0309】
[0314] 本発明者らは、高い(92%)特異度を目標とする決定境界を定義し、65%の対応する感度を観察した(
図3A、
図3B)。
【0310】
[0315] この分類器を使用して、31人の患者からの113サンプルの独立したテストセットからのTBBサンプルを前向きにスコア化すると、分類器は、サンプルレベルデータに基づき0.86のROC-AUCを示し、63%の感度[95%CI:43~87]及び86%の特異度[95%CI:73~97]であった(
図3C、
図3D)。検証コホートに一般化される交差検証性能は、比較的小さいコホートサイズであるにも関わらずロバストな訓練が実現したことを示唆している。
【0311】
[0316] 84人の患者からの283 TBBサンプルの結合コホートでアルゴリズムを再訓練すると、各患者からの全てのTBBサンプルを別々にスコア化したとき、交差検証後のROC-AUCは0.87[CI:0.82~0.91](63%の感度[CI:54~72]、91%の特異度[CI:80~98])になった。より大きいサンプルセットでも同様の交差検証結果(この場合に観察されるとおり)が見込まれ、現在計画されて、BRAVE試験において有望な患者が集められているとおり、更なる独立したテストセットでの評価が必要になるであろう。
【0312】
[0317] 従って、本発明者らは、遺伝子発現シグネチャを使用したUIPゲノム分類器が、UIPに特徴的な空間的及び時間的に不均一な線維性疾患パターンを、免疫応答(RB-ILD/DIP、好酸球性肺炎、肉芽腫性疾患)、炎症(NSIP、HP)に関連する、又は傷害に対する急性期反応としての、一様な、及び典型的には活性の線維症と有効に区別できることを実証した10。
【0313】
[0318] 全ての統計的分析は、Rバージョン3.0.1を使用して行った21。マイクロアレイ分類器については、UIPクラスと非UIPクラスとの間で発現差異がある遺伝子をlimmaによって順位付けし26、次に最も低い偽発見率(FDR)(<0.0003)の上位200遺伝子をモデル構築の候補遺伝子として引き続き使用した。種々の方法を用いて幾つかのモデルを構築し、誤りが最も少ないものを選択した。glmnet27を使用したlassoペナルティ付きロジスティック回帰により特徴選択及びモデル推定を実施した。RNAseq分類器については、生カウントデータに対してDESeq222パッケージに実装されるワルド式検定から得られるFDRによって遺伝子を順位付けした。上位の特徴(10~200の範囲のN)を使用することにより、正規化発現データでe1071ライブラリ24を使用して線形サポートベクターマシン(SVM)23を訓練した。
【0314】
[0319] CVによって、及び利用可能な場合には、独立したテストセットによって分類器性能を評価した。過学習を最小限に抑えるため、訓練/テストセットの定義時及びCV分配時に最小単位として単一の患者を維持した;即ち訓練/テストセット又はCV分配においては同じ患者に属する全てのサンプルがグループとして一体に保持された。使用したCV方法には、患者一人抜き(LOPO)及び10分割患者レベルCVが含まれる。
【0315】
[0320]
図3は、単一サンプル分類性能の結果を示す。
【0316】
[0321] 性能は、所与のスコア閾値における曲線下面積(AUC)、並びに特異度(1.0-偽陽性率)及び感度(1.0-偽陰性率)として報告した。本発明者らは、少なくとも>90%特異度が要求されるようにスコア閾値を設定した。各性能測定について、2000の階層化ブートストラップレプリケート及びpROCパッケージ22を使用して95%信頼区間を計算し、[CI上限-下限]として報告した。
【0317】
実施例6
プールサンプルを使用した分類器開発及び性能
[0322] 実施例5で実現した単一サンプル性能は全体的に優れていたが、この分類器は一部のUIP患者からの一部のサンプルでUIPを検出しなかった(FN)。同じ患者からの他のサンプルではUIPが高頻度で検出されたことに伴い、サンプリング効果、不十分な組織サンプリングか又は疾患不均一性かのいずれかが、FNの原因として疑われた。
【0318】
[0323] 本発明者らによれば、偽陰性サンプルに肺胞含有量の系統的な減少は認められず、原因として肺胞組織の不適切なサンプリングは取り除かれた(実施例7を参照)。従って、疾患不均一性又は技術的サンプルクオリティ効果が、偽陰性に関する可能性のある説明として残る。重要なことに、本発明者らは、UIPの存在に関する参照標準として専門家病理レビューを選択した。操作者間の意見不一致という既知の問題にも関わらず4,29,30、本発明者らはその患者の83%について亜型レベルで2人の専門病理医間における盲検での意見一致を実現した。
【0319】
[0324] 設計上、本発明者らの臨床試験は患者1人につき複数のTBBサンプル、典型的には肺葉当たり2~3つを収集して、訓練エラー又は偽検査コールにつながり得る可能性のある疾患及びサンプリング不均一性効果を軽減する。多くの患者について、本発明者らのサンプルレベル分類器は患者1人につき利用可能なTBBのうち2つ以上のサンプルにおいて疾患を正しく検出し、全体的に高いサンプルレベル検査精度と整合する(
図3)。これにより、複数のTBBサンプルの混合物に基づくUIPの患者レベルレポーティングが、患者毎に複数のサンプルをプールすることによって実現可能である可能性が高まり、本発明者らは、かかる混合物が患者レベルで全体的に検出精度を向上させ得ると仮定した。従って本発明者らは、複数のTBBサンプルの組み合わせが関わる検査設計を評価した。
【0320】
[0325] 本発明者らは、初めにインシリコ手法を用いて、同じ患者からの複数のTBBサンプルの混合をシミュレートして単一の検査結果をもたらすモデルを導出した。本明細書では、この手法は「インシリコ混合」、又は同義的に「インシリコプール」と称される。スケーリングした遺伝子カウントデータを平均した後に分散安定化変換(VST)することにより、複数のサンプルからのインシリコ患者内混合物をモデル化した。シミュレーションは、VSTレベルで遺伝子レベルの技術的変動性が加わる各条件において100回実施した。
【0321】
[0326] 次に、インシリコでシミュレートした混合物からのスコアを、8人の患者についてのインビトロで生成した実際の混合物、並びに対応する個別の(例えば混合されていない)TBBサンプルスコアと比較した(
図4A)。結果は、本発明者らのインシリコモデリングが実際の混合物及び個別TBBサンプルから観察されたスコアを合理的に近似することを示している。
【0322】
[0327] 次に本発明者らは、この分析的方法を用いて、各患者内で無作為に選択した、患者1人当たり2~5つのTBBの混合物をシミュレートした(
図4B)。シミュレーションによれば、患者1人当たり2又は3つのサンプルの混合物が、無作為に選択した患者1人当たり単一のサンプルと比べて分類精度の増加を示す(
図4B)。更に、4又は5つのTBBの混合物は、性能推定において同程度の最大精度で変動性の低下(即ち、より高い信頼度)を示す(
図4B)。約90%の目標特異度で、混合物における検査感度は約72%に向上し、変動性が低下する(AUC=0.90[CI0.88~0.93]、90%特異度における感度=72%[CI60~81])(
図4C)。全ての対象について2つの上葉及び3つの下葉TBBが利用可能な33人の対象のセットでは、サンプリングを上葉又は下葉に限定すると、混合シミュレーションは性能の向上を示さない(
図4D)。この分析は、単一の分子検査を用いて、患者1人当たり最大5つのTBBサンプリングの混合がUIPパターンの正確な検出を最大化し得ることを示唆している。プールすると、細胞の不均一性に起因してより高い変動性が持ち込まれると予想されるため、かかる結果は意外といえる。
【0323】
[0328] 従って、物理的又はインシリコ混合試験は、患者1人につき複数のサンプリングを組み合わせると精度が増加することを示唆している。
【0324】
[0329] 全てのサンプルで別々に訓練することにより(即ち、実施例5に記載されるとおり)、本発明者らは、代表性及びサンプリング多様性を最大化し、利用可能なサンプルの先験的なサブサンプリングバイアスを軽減した。本発明者らは、サンプル混合物で検査することにより、検査精度の向上によって実証されるとおり、サンプリング効果が軽減されるものと見る。
【0325】
実施例7
サンプリング不均一性及び性能
[0330] ILD患者の肺に実証された疾患不均一性があることを所与として4、21~23、肺のばらつきのあるサンプリングで強力な分類器性能を達成し得るという知見から、TBB手技において十分な肺胞サンプリングが必要かどうかという疑問が生じた。本発明者らは、UIP対非UIPの正確な分類に肺胞細胞からの遺伝子シグナルが必要であったならば、肺胞細胞が不足しているサンプルは肺胞含有量が高いサンプルと比べてより多くの分類器誤り(特にFN)を生じるはずであるという仮説を立てた。分類器精度が十分な肺胞サンプリングに依存するかどうかについて取り組むため、本発明者らは、分類器精度と肺胞特異的遺伝子との間の相関を検定した。
【0326】
[0331] 具体的には、本発明者らは初めにTBBにおける肺胞含有量の半定量的ゲノム尺度を開発し、次にこのメトリクスを使用して、それが分類器精度と相関するかどうかを決定した。TBBサンプルは、文献に細気管支、肺胞、及び肺前駆細胞のマーカーであると報告される
E5~E944の肺特異的遺伝子の発現について評価した(表16)。この44マーカーを使用した主成分による教師なしクラスタリングから、このTBBコホートが連続する一連のサンプリングされた肺組織に相当し、そのサブセットは外科的肺生検と重複することが示唆される(
図5A;TBBサンプルは青色、SLBサンプルはオレンジ色)。
【0327】
[0332] 本発明者らは、1つはI型及び1つはII型肺胞細胞の、2つの肺胞メトリクスを開発した。
【0328】
[0333] I型肺胞統計量については、本発明者らは2つの遺伝子PDPN及びAQP5の発現を合計した。これらの遺伝子は、サンプルセットの中で連続的な遺伝子発現パターンを示す。
【0329】
[0334] II型肺胞メトリクスに用いられる本発明者らの第2の手法は、TBB集団内で二峰性発現のエビデンスを示したマーカーを調べることであった。このパターンは9つの遺伝子に見られ、そのうち5つ(SFTPB、SFTPC、SFTPD、ABCA3、CEBPA)は肺胞II型(ATII)特異的であり、3つ(AGER、GPRC5A、HOPX)は肺胞I型(ATI)特異的であり、及び1つ(SFTPA1)はI型細胞及びII型細胞の両方に見られる(
図5B;TBB発現カウントは青色、SLB発現カウントはオレンジ色)。SFTPA1、SFTPB、SFTPC、及びSFTPDの間には、相関性のある、方向的に一貫した発現が見られるが、PDPNとAQP5との間、又はこれら2群のメンバー間には見られない(
図5C;TBB発現カウントは青色、SLB発現カウントはオレンジ色)。従って本発明者らは4つのサーファクタントタンパク質SFTPA1、SFTPB、SFTPC及びSFTPDをII型肺胞含有量のマーカーとして選択し、サンプル内のそれらの発現を各サンプル内の肺胞含有量の代理尺度として合計した。
【0330】
[0335] これらのメトリクスは様々なサンプルタイプで幅広いI型及びII型肺胞特異的遺伝子発現を示し、SLB及び多くのTBBにおいて発現が高く、及び種々の非肺組織型及び3つの気管支上皮細胞株(Beas2b、HBEC、及びNL-20)において発現が低いが(
図6A)、これらの転写物の発現は分類器精度と相関しなかった(ピアソン相関、0.03、p値=0.61)。従って、これらの結果は、偽陰性の誤りも偽陽性の誤りも、低いI型又はII型肺胞I含有量と関連しないことを示しており、細胞組成にばらつきがあるTBBサンプルにおいて正確な分類結果を実現し得ることが示唆される(
図6B)。
【0331】
[0336] 本発明者らはまた、分類器精度と個別サンプルでのTBB肺胞遺伝子発現、RNAクオリティ、又はRNA収量との間に有意な相関がないことも見出した(表3)。
【0332】
【0333】
[0337] これらの結果は、肺胞含有量にばらつきのあるTBBサンプルにおいて正確な分類結果を実現できることを示唆している。
【0334】
実施例8
分類器によって使用される遺伝子に関連する生物学的パスウェイ
PANTHER(商標)パスウェイ解析
[0338] 本発明者らは、DESeq219を使用して、病理診で真の84人の患者に由来するUIP TBBと非UIP TBBとの間の発現差異を同定した。UIP(n=926)及び非UIP(n=1330)において偽発見率(FDR)調整p値≦0.05で有意に上方制御されたEnsembl遺伝子をパスウェイ過剰出現解析用のPANTHER(商標)分類システム(ウェブバージョン11.0、2016年7月15日リリース)への入力として使用した(Mi H, Lazareva-Ulitsky B. et al., Nucleic Acids Res 2005;33:D284-D288、全体として参照により本明細書に援用される)。PANTHER(商標)パスウェイをキュレートして一般的な又は重複性のパスウェイ分類を除去し、有意性順に並べた(表4)。本発明者らは、UIPのTBBが、細胞代謝、接着及び発生過程のマーカーの発現に関して有意にエンリッチされる一方、非UIP TBBは、免疫活性化、脂質代謝、ストレス応答及び細胞死のエビデンスを示すことを見出した(表4)。発生経路及び細胞増殖の異常な再活性化は、IPFの顕著な特徴である24~27。
【0335】
【0336】
実施例9
BRAVE試験設計
[0339] BRAVE(BRonchial sAmple collection for a noVel gEnomic test(新規ゲノム検査のための気管支サンプル収集))試験の目的は、間質性肺疾患(ILD)に関する様々な診断及び予後情報を提供するであろう分子プロファイリング検査を最適化するため、外部レビューのための気管支鏡標本、臨床データ、及び関連する病理スライドを収集することである。
【0337】
[0340] BRAVEは3つのアームに分かれる:BRAVE-1は、その通常のケア臨床診断の一部として診断的外科的肺生検(SLB)が予定されている患者を登録することが意図される。BRAVE-2は、診断的気管支鏡検査のみが予定されている患者が意図される。BRAVE-3は、診断的クライオ生検が予定されている患者が意図される。
【0338】
[0341] 気管支肺胞洗浄、血液、血清及び口腔スワブもまた収集される。対象は、ILD分子検査の開発及び前向き検証のための検出力及びサンプルサイズの要件を満たすのに十分な数のサンプルが集まるまで登録されることになる。
【0339】
[0342] 対象は、疾患の進行を判定するため、サンプル収集後最長1年間追跡される。年齢が18歳未満の患者、又はSLBが医学的に適応でない患者、又は非ILDの医学的状態のためにSLBを受けている最中の患者は、試験登録に適格でない。気管支鏡生検の実施が禁忌となる医学的状態を有する患者、又は気管支鏡サンプリングが推奨されない又は困難である患者もまた、BRAVE試験から除外される。
【0340】
実施例10
Envisia分類器の生成
[0343] SLB及びTBBによって入手された肺組織において機械学習がUIP病理組織学的パターンを検出することができると実証されたため(実施例1~9を参照)、本発明者らは、分類器訓練をより大きい及びより多様な患者群に拡張し、独立した前向き収集された対象セットでロックアルゴリズムを検証しようとした。
【0341】
方法
[0344] 合計201人の対象が18の米国及びヨーロッパの施設における前向き多施設試験に登録した。本発明者らは、対象1人につき最大5つのTBBを収集し、肺葉レベルで標準治療肺組織生検サンプルとペアにした。139人の対象に関して、3人の専門病理医のパネルを用いて行う組織学的パターン診断が得られた。プールTBBに関してエクソームエンリッチメントRNAシーケンシングを実施し、得られた配列をアラインメントしてxyx遺伝子の転写物カウントを抽出した。本発明者らは約90人の患者を用いて機械学習アルゴリズム、Envisiaゲノム分類器を訓練し、ロックして、次に組織学参照ラベルを有する49人の対象の独立したセットでこの検査を検証した。偽陽性はUIPパターンをオーバーコールすることにより害を生じ、IPF療法の無用のリスク及びコストにつながる可能性があるため、本発明者らは検査決定境界を最適化して高い特異度を与え、即ち偽陽性を減少させた。本発明者らは全ての分類器パラメータをロックし、検査の適応の範囲内にある患者及びサンプル特性を定義した。本発明者らはここに、49人の対象の独立コホートからのTBBにおけるEnvisiaゲノム分類器の前向き臨床検証を報告し、その分類性能をHRCTと比較する。
【0342】
試験設計及び管理
[0345] この独立した検証試験については、合計88人の対象が3つの別個のBRAVE試験に登録した(
図1)。BRAVE-1では、対象は臨床適応のSLBを受けた(n=43);BRAVE-2対象は臨床適応のTBBを受けた(n=9);及びBRAVE-3対象は臨床適応のクライオ生検を受けた(n=36)。BRAVE-2対象は組織病理評価にTBBのみを有し、BRAVE-1及び3対象は、それぞれSLB又はクライオ生検によって診断された。
【0343】
[0346] 参加医師が病理組織学的診断のための臨床適応の生検に同定した同じ肺葉から、分子検査用に最大5つの専用の経気管支生検(TBB)(典型的には、2つの上葉及び3つの下葉)を収集した。試験適応となるTBB標本;試験施設が調製した組織病理スライド及び匿名化された患者臨床データ;胸部のHRCT;各施設の臨床診断;及び1年及び2年フォローアップが、利用可能な場合には、Veracyteに提供された。分子検査結果は参加医師に提供されず、また患者診断又は治療に情報を与えるために使用されることもなかった。
【0344】
[0347] 胸部放射線科専門医(D. Lynch)によりHRCTスキャンがレビューされ、Definite UIP、Probable UIP、又はPossible UIP9、剥離性間質性肺炎(DIP)、過敏性肺炎(HP)、ランゲルハンス細胞組織球症(LCH)、非特異性間質性肺炎(NSIP)、器質化肺炎(OP)、呼吸細気管支炎(RB)、サルコイドーシス又は「その他」(分類不能)に分類された。Veracyte臨床担当者が、同じ基準だが、特定の非UIP診断の代わりに「Inconsistent with UIP」を用いて試験施設の放射線学的記載をレビューし、解釈した35。
【0345】
[0348] 臨床適応のSLB、クライオ生検、又はTBBからの組織病理スライドが、先述のとおりE1,E10、患者臨床情報に関して盲検で2又は3人の専門肺病理医によって独立してレビューされた。各病理医が、サンプリングされた各肺葉の病理組織学的パターン診断を独立に決定した。本発明者らは、コンセンサスを、2分の2又は3分の2のレビュー病理医間での組織学的パターンレベルにおける盲検による意見一致として、又は盲検による意見一致に達しなかった場合、3人の病理医間での非盲検による合議後の意見一致(協議)によって定義した。
【0346】
[0349] Veracyte担当者が、以下のカテゴリに従い、肺葉レベル診断のコンセンサスに基づき各試験対象にUIP又は非UIPの参照ラベルを割り当てた(
図9)。病理診によっていずれかの肺葉にUIPの診断が付いた場合、その対象にはUIPラベルを割り当てた
4。いずれかの肺葉における非UIP病理診について診断が付いた対象には、他の肺葉もまた全て非UIP又は診断不十分である場合に、非UIP参照ラベルを割り当てた(
図9)。全てのVeracyte実験室及び分析担当者は、検査及びアルゴリズム開発の間、参照ラベルに関して盲検であった。
【0347】
実験室検査手順
[0350] 88人のBRAVE患者からの試験適応TBBを専用の核酸保存剤(RNAprotect、QIAGEN、Valencia, CA)に収集し、現地で最長14日間低温保存し、処理のためVeracyteに発送した。本発明者らは修正AllPrep Micro手順(QIAGEN)を用いて全RNAを抽出し、続いてRNA結合蛍光色素(QuantiFluor、Promega、Madison, WI)を使用して定量化した。本発明者らは、試験への組入れには対象1人につき最低でも3つ及び最高で5つのTBBで、各々が少なくとも31ngの全RNA収量が要求されると予め指定した。サンプル数又はRNA収量が不十分であったため、9人の対象が除外された(
図8)。加えて、異物(つまようじ、1人の対象)が含まれた標本、保存剤を欠いたままVeracyteに送られた標本(1人の対象)、及び48時間の発送容器冷却期限を超えた発送となった標本(5人の対象)もまた、前向きに除外された(
図8)。従って72人の対象の個別のTBBが、本発明者らが予め指定した試験組入れ基準を満たした。
【0348】
[0351] 各対象のプールRNAを部分的に自動化されたTruSeq RNA Access Library Prep手順(Illumina、San Diego, CA)に入力して発現エクソン配列をエンリッチし、NextSeq 500インスツルメント(Illumina)で≧25Mペアエンドリードの目標深度までシーケンシングした。カウントデータは、シーケンシングされ且つユニークにマッピングされたリードの総数、マッピングされたリード及びエクソンリードの全体的な割合、各塩基のカバレッジ平均、塩基カバレッジの一様性、並びに塩基重複率及びミスマッチ率に関して基準に対して評価した。1人の対象からのデータはこれらの基準を満たさず、除外したため、71人の対象が残った(
図8)。発現カウントデータはシーケンシング深度(スケール係数)に対して正規化し、DESeq216を使用して分散安定化変換によって変換した後、分類した。
【0349】
アルゴリズム開発
[0352] 以前2012年12月~2015年7月にBRAVE試験E10に登録した90人の対象からの354の個別TBBサンプルのみを使用して機械学習アルゴリズム(分類モデル)を訓練した。このアルゴリズムによりエラスティックネットロジスティック回帰を用いて特徴選択及びハイパーパラメータ最適化を実施した。患者一人抜き交差検証(CV)によって決定される受信者動作特性曲線下面積(ROC-AUC)を使用して、訓練セットでモデルの性能を評価した。訓練セットにおいて特異度を最適化した(UIP偽陽性コールが最小限となる)検査決定境界を選択した。このように、決定境界がロックされた、190遺伝子を特徴として使用するペナルティ付きロジスティック分類器(Envisiaゲノム分類器)が定義された(表5)。Envisiaは、各TBBプールについてUIP又は非UIPの分子診断を報告する。決定境界を上回る分類スコアを有する対象は、EnvisiaによってUIPがコールされ、一方、決定境界以下のスコアを有する対象は非UIPがコールされる。検証は、この検査の開発に関わりのない第三者によって内部的にも独立にもスコア化された後、参照ラベルが明らかにされた。
【0350】
【0351】
【0352】
【0353】
【0354】
【0355】
統計的分析
[0353] 統計的分析は、Rソフトウェア、バージョン3.2.3(https://www.r-project.org)を使用して行った。連続変数はスチューデントt検定によって比較し、カテゴリ変数はカイ二乗検定によって比較した。信頼区間[CI]は全て、特に注記されない限り両側95%である。本発明者らは、予測精度の標準的な尺度を用いてテスト性能を判定した。本発明者らは、以前開発された14肺胞I型及びII型遺伝子発現スコアを使用して、検査精度が肺胞細胞遺伝子発現と相関するかどうかを判定した。本発明者らは、http://genetrail.bioinf.uni-sb.de/で利用可能なGeneTrailソフトウェアを使用して、訓練コホートTBBで発現差異がある(UIP対非UIP)上位1000遺伝子と190分類器遺伝子とを組み合わせたセットで生物学的パスウェイ解析を実施した。
【0356】
結果
試験対象の人口統計学的及び病理学的特性
[0354] 2014年8月~2016年5月に合計88人の対象が18の米国及びヨーロッパの臨床施設における3つのBRAVE試験のうちの1つに登録した(
図8)。本発明者らは、解析試験前に、標本の取り扱いに誤りがあったか又は材料が不十分であったため16人の対象を除外し、及び試験中に解析QCに不合格であった1人の対象を除外した。合計71人の対象が試験組入れ基準を満たした。そのうち、欠測組織病理スライドを有した2人の対象及び肺腺癌を有した1人の対象が続いて除外され、合計68人の対象が病理レビューに残った。本発明者らは、病理診が診断不十分な12人の対象及び分類不能の線維症を有する7人の対象にUIP/非UIP病理診参照ラベルを割り当てることができなかったため、これらの対象は最終検証に含めることができなかった(
図8)。最終的な病理組織学的パターン診断を決定し、残り49人の対象にUIP/非UIP参照ラベルを付与した。これらの49人の対象が最終検証群となった(
図8)。
【0357】
[0355] 最終検証群の49人の対象は、88人の登録対象及び39人の除外対象と比較したとき、対象年齢、性別、又は喫煙状態の有意差を示さなかった(表6)。最終検証セットは、実際の臨床で遭遇し得る多様なUIP亜型並びに非UIP ILDを含む(表7)。
【0358】
【0359】
【0360】
Envisiaゲノム分類器性能
[0356] UIPの分子診断用のEnvisiaゲノム分類器は、検証群で88%の高い特異度[CI:68%~97%]及び67%の中程度の感度[CI:45%~84%]を実現した。ROC-AUCは0.85であった(
図10)。検査性能は、外科的肺生検のみから導出された病理診を有する26人の対象又はクライオ生検からの病理診を有する21人の対象に分析を限定したとき信頼区間内に留まる(データは示さず)。21人のクライオ生検対象のうち、5人は単一のヨーロッパの試験施設からのものであり、及び1人、7人、及び8人の対象は、それぞれ3つの米国の試験施設からのものであった。
【0361】
[0357] 分類器によってなされた誤りを調べると、非UIP病理診を有する25人の対象のうち3人が分子的UIPに分類された(FP)(
図11)。1例のFPは、濾胞性細気管支炎を伴う進行性末梢気道疾患の病理学的パターン診断を有したが、試験施設によって導出されたprobable IPFの臨床診断を有した。第2のFPは、初めは中央放射線画像診によってHP及び中央病理診によって細胞性NSIPと診断されたが、長期フォローアップでHRCTにより緻密線維化が明らかになった。放射線画像診によって重症肺気腫を伴うNSIP症例であって、組織病理診でアミロイド又は軽鎖沈着症を呈することが認められるものは、分子的UIPとも称される(表8)。
【0362】
【0363】
[0358] 病理学的UIPを有する8人の対象が、Envisia検査によって分子的非UIPに分類された(FN)(
図11)。これらの対象の最終的な参照ラベルはUIPであったが、これらの症例の半分は、試験施設病理診、放射線画像診又は臨床診断のいずれかによって非UIP診断を有した。試験施設診断には、HP、RB、NSIP/DIP(後にSRIFに更新された)、及び分類不能のILDが含まれた(表9)。残り4症例はIPFの試験施設診断を有し、そのうち2例はUIPのHRCTパターン診断を有し、1例はNSIPを有し、及び1例は基礎自己免疫疾患の可能性に関連するHPを有した(表9)。
【0364】
【0365】
[0359] UIPパターンの存在又は非存在を判定することを目的に、ガイドラインに沿ってHRCTを用いて疑わしいILD患者を評価する(例えば「HRCT-UIP」)。HRCTによる確定UIP診断がない場合、UIP又は非UIPの病理組織学的パターン診断を入手するため患者はSLBが考慮されなければならない
5。Envisia分子的UIPコールの性能ベースラインを確立するため、本発明者らは、病理組織学的UIPを参照標準として使用して、HRCT-UIPの予測値を評価した。本発明者らは、専門家レビュー(D. Lynch)からのHRCTパターン診断並びに試験施設パターン診断を調べた。最終検証セットでは、中央放射線画像診は完全な特異度及び陽性的中率(PPV)を示し、感度は僅かである(
図12)。これは、専門家HRCT-UIPの高い特異度だが低い感度という先行の報告
17と一致する。この患者群における各施設の放射線画像診の特異度及びPPVは、それぞれ70%及び67%と、専門家中央レビューよりも実質的に低い(
図12)。
【0366】
[0360] 中央HRCT-UIPを有する対象間では分子的UIPのPPVは100%であり、専門家放射線画像診の(病理診と比べた)全体的なPPVと同様であるが、試験施設HRCT-UIPの全体的なPPVよりはるかに優れている(
図12)。分子的UIPのPPVは、試験施設HRCT-UIPを有する対象間では73%に低下するが、中央HRCT-UIP症例間では100%に留まる(
図12)。興味深いことに、分子的UIPコールは、Inconsistent with UIPの試験施設放射線診断を有する対象間では極めて正確であり、100%のPPV及び89%のNPVを示し、中央放射線画像診によって観察される100%PPVと同様である(
図12)。更に、分子的UIPは専門家放射線画像診と比べて、67%対41%と、向上した感度を示す。HPの特定の中央放射線診断を有する15人の対象のうち、9人はUIP病理組織学的パターンを有した(表10)。分子的UIPは、UIP病理組織学的パターンを有する9人のHP患者のうち6人において病理組織学的UIPを正しく同定したことから(表10)、Envisia検査による分子診断がHP患者における病理組織学的UIPの存在を同定する助けとなり得ることが示唆される。
【0367】
【0368】
[0361] 診断的病理診を実現することについての認識された課題は、19人の対象についてUIP又は非UIPのラベルが決まらない可能性があることを意味する(表11)。これらと同様の患者に臨床で遭遇し、ひいてはそれらの患者がEnvisiaによって検査される可能性があり得る。従って、本発明者らは、Envisia検査結果を、これらの対象に関連する利用可能な臨床情報と比較した。Envisiaによる分子的UIPを有する6人の対象の中で、2人がHRCT-UIPパターンを有し、2人がIPFの臨床診断を有する(表11)。Envisiaによる分子的非UIPを有する13人の対象の中で、7人がHRCT非UIPパターンを有し;そのうち3人が非UIP病態の臨床診断を有する(表11)。
【0369】
【0370】
[0362] Envisiaゲノム分類器が使用した190遺伝子のうち124遺伝子が、UIP及び非UIP TBB間で発現が異なる上位1000遺伝子の中にある。4つの生物学的パスウェイのメンバーについては、UIPで上方制御される分類器特徴及び遺伝子がエンリッチされ、それらのパスウェイのうち3つは、以前マイクロアレイ遺伝子発現プラットフォームを使用してSLBで同定されたものである13(表12)。
【0371】
【0372】
[0363] KEGG拡張型及び肥大型心筋症ネットワークは、全てIPFで上方制御されることが報告された、細胞外マトリックス相互作用、成長因子応答、及び細胞骨格リモデリングに関わる遺伝子を含む18,19。
【0373】
[0364] 同様に、非UIP TBBで上方制御される特徴及び遺伝子が、免疫応答、細胞間シグナル伝達及び発生経路を含め、非UIP SLBでもまた上方制御される複数のパスウェイについてエンリッチされる(表13)。IPFと比較してHPについて、細胞増殖、免疫応答遺伝子の差異のある上方制御が示されているが20、一部の遺伝子はこれらの疾患において同時制御される21。
【0374】
【0375】
考察
[0365] 臨床的コンテクストと胸部のHRCTスキャンで見られる放射線画像診パターンとの組み合わせが、ILDの評価を受けている患者において確信的診断を提供できないことはよく起こる。SLBからの病理組織学的パターン診断はこれらの患者において確定診断を提供し得るが、多くの患者は外科的診断手技を受けることを嫌がるか、又はそれを受けるには病気が重過ぎる。それを受ける患者であっても、生検所見の病理学的解釈に付随する難題により、大きい臨床的不確実性が残り得る。組織学的UIPの存在を確認するため、伴うリスクが最小限の、且つ熟達した肺病理医の視覚的及び主観的技能に依存しない、正確で利用可能な検査は極めて有用であり得る。
【0376】
[0366] Envisiaの開発に必要な機械学習の労力を支えるのに有意味な数の患者及びサンプルを集める中での重要な課題は、臨床医が新たに診断されたILD患者を調査するときに直面する課題を映し出している。本発明者らのBRAVEサンプル収集試験を通じて集められた201人の対象のうち、専門肺病理医のパネルを用いたにも関わらず、本発明者らは診断的組織病理結果を有する対象を僅か140人同定したのみであった。この低い収率は、診断的病理診を実現する上で地域社会の臨床医が対峙する課題を浮き彫りにする。本発明者らはEnvisiaゲノム分類器を当初の90人の対象を使用して訓練し、ロックし、続いて集めた対象を使用して検査を検証した。従来のTBBにおけるUIPに関して、このゲノム分類器は両方のコホートで高い性能を示した。
【0377】
[0367] 試験施設の放射線科医によっては予測されなかった組織学的UIPパターンを有する25人の対象の中での分子的UIPコールの精度は高く、UIP病理組織学的パターンを有する対象の78%の同定に成功し、偽陽性はなかった。この対象群では、Envisiaは、HRCTによっては同定できなかったUIP病理組織学的パターン症例のほぼ5分の4を復活させる真のルールイン検査として機能する。更に、このサブ群ではHPの患者がエンリッチされ、本試験におけるその60%(15分の9)が、進行性線維性疾患のエビデンスを有した。EnvisiaはHP患者におけるUIPを、49対象検証コホートで全体的にUIPが検出されたのと同じ67%感度で検出した。inconsistent with UIP放射線画像診パターン診断を有する対象におけるEnvisia分子的UIPコールのNPVは>80%であり、陽性及び陰性の両方のEnvisia検査結果に対する実質的な有用性が示唆される。
【0378】
実施例11
サンプルの臨床的及び技術的要因並びにEnvisia性能
[0368] Envisia検査性能は、対象の臨床的要因及びサンプルの技術的要因と幾らかの相関を示す。UIP疾患は男性対象及び喫煙歴のある対象においてより高率で見逃される(
図13)。肺胞II型細胞と一致する遺伝子発現には、Envisia検査精度との強い相関はなく(
図14)、検査性能に肺胞サンプリングが重要でないことが示唆され、これは90人のILD対象コホートにおける前出の観察と一致する
E10。非UIPサンプルの間では、より強力な(より多くの陰性)分類スコアと、サンプルサイズ及びRNAクオリティによって定義されるより高いサンプルクオリティとの間に、UIPサンプルでは明らかでない僅かな相関がある(
図14)。
【0379】
[0369] 上記に記載される様々な実施形態を組み合わせて、更なる実施形態を提供してもよい。本明細書で言及され、及び/又は出願データシートに挙げられる米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願及び非特許刊行物は全て、全体として参照により本明細書に援用される。実施形態の態様は、様々な特許、出願及び公報の概念を利用してなおも別の実施形態を提供するため必要に応じて修正されてもよい。
【0380】
[0370] 上記に詳述した説明を踏まえて、実施形態に対してこれら及び他の変更がなされてもよい。一般に、以下の特許請求の範囲では、用いられる用語は、本明細書及び特許請求の範囲に開示される具体的な実施形態に特許請求の範囲を限定するものと解釈されてはならず、かかる特許請求の範囲が権利を有する全範囲の均等物と共に、あらゆる可能な実施形態を包含するものと解釈されなければならない。従って、特許請求の範囲が本開示によって限定されることはない。
【0381】
[0371] 本明細書に記載される一部の実施形態は、様々なコンピュータ実行オペレーションを行うための命令又はコンピュータコードを有する非一時的コンピュータ可読媒体(非一時的プロセッサ可読媒体とも称され得る)を含むコンピュータ記憶製品に関する。コンピュータ可読媒体(又はプロセッサ可読媒体)は、それが一時的伝搬信号それ自体(例えば、空間又はケーブルなどの伝送媒体で情報を搬送する伝搬電磁波)を含まないという意味で非一時的である。媒体及びコンピュータコード(コードとも称され得る)は、1つ又は複数の特定の目的のために設計及び構築されたものであってもよい。非一時的コンピュータ可読媒体の例としては、限定はされないが、ハードディスク、フロッピーディスク、及び磁気テープなどの磁気記憶媒体;コンパクトディスク/デジタルビデオディスク(CD/DVD)、コンパクトディスク読出し専用メモリ(CD-ROM)、及びホログラフィック装置などの光記憶媒体;光ディスクなどの光磁気記憶媒体;搬送波信号処理モジュール;及び特定用途向け集積回路(ASIC)、プログラム可能論理デバイス(PLD)、読出し専用メモリ(ROM)及びランダムアクセスメモリ(RAM)装置など、プログラムコードを記憶し実行するように特別に構成されたハードウェア装置が挙げられる。本明細書に記載される他の実施形態は、例えば、本明細書で考察される命令及び/又はコンピュータコードを含み得るコンピュータプログラム製品に関する。
【0382】
[0372] 本明細書に記載される一部の実施形態及び/又は方法は、ソフトウェア(ハードウェア上で実行される)、ハードウェア、又はこれらの組み合わせによって実施されてもよい。ハードウェアモジュールには、例えば、汎用プロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、及び/又は特定用途向け集積回路(ASIC)が含まれ得る。ソフトウェアモジュール(ハードウェア上で実行される)は、C、C++、Java(商標)、Ruby、Visual Basic(商標)、R、及び/又は他のオブジェクト指向、手続き型、統計、又は他のプログラミング言語及び開発ツールを含め、種々のソフトウェア言語(例えば、コンピュータコード)で表され得る。コンピュータコードの例としては、限定はされないが、マイクロコード又はマイクロ命令、機械命令、例えば、コンパイラによって生成されるものなど、ウェブサービスの作成に使用されるコード、及びコンピュータがインタプリタを使用して実行する高水準命令を含むファイルが挙げられる。例えば、実施形態は、命令型プログラミング言語(例えば、C、FORTRAN等)、関数型プログラミング言語(例えば、Haskell、Erlang等)、論理型プログラミング言語(例えば、Prolog)、オブジェクト指向型プログラミング言語(例えば、Java、C++等)、統計プログラミング言語及び/又は環境(例えば、R等)又は他の好適なプログラミング言語及び/又は開発ツールを使用して実装されてもよい。コンピュータコードの更なる例としては、限定はされないが、制御信号、暗号化コード、及び圧縮コードが挙げられる。
【0383】
参考文献
以下の参考文献の全て及び本明細書に引用する全ての参考文献は、全体として本明細書に援用される。
1. Travis WD, Costabel U, Hansell DM, King TE, Lynch DA, Nicholson AG, Ryerson CJ, Ryu JH, Selman M, Wells AU, Behr J, Bouros D, Brown KK, Colby TV, Collard HR, Cordeiro CR, Cottin V, Crestani B, Drent M, Dudden RF, Egan J, Flaherty K, Hogaboam C, Inoue Y, Johkoh T, Kim DS, Kitaichi M, Loyd J, Martinez FJ, Myers J, Protzko S, Raghu G, Richeldi L, Sverzellati N, Swigris J, Valeyre D. An Official American Thoracic Society/European Respiratory Society Statement: Update of the international multidisciplinary classification of the idiopathic interstitial pneumonias. Am J Respir Crit Care Med 2013;188:733-748.
2. Raghu G, Rochwerg B, Zhang Y, Garcia CAC, Azuma A, Behr J, Brozek JL, Collard HR, Cunningham W, Homma S, Johkoh T, Martinez FJ, Myers J, Protzko SL, Richeldi L, Rind D, Selman M, Theodore A, Wells AU, Hoogsteden H, Schuenemann HJ. An Official ATS/ERS/JRS/ALAT Clinical Practice Guideline: Treatment of idiopathic pulmonary fibrosis. An update of the 2011 clinical practice guideline. Am J Respir Crit Care Med 2015;192:e3-e19.
3. Bjoraker JA, Ryu JH, Edwin MK, Myers JL, Tazelaar HD, Schroeder DR, Offord KP. Prognostic significance of histopathologic subsets in idiopathic pulmonary fibrosis. Am J Respir Crit Care Med 1998;157:199-203.
4. Flaherty KR, Travis WD, Colby TV, Toews GB, Kazerooni EA, Gross BH, Jain A, Strawderman RL, Flint A, Lynch JP, Martinez FJ. Histopathologic variability in usual and nonspecific interstitial pneumonias. Am J Respir Crit Care Med 2001;164:1722-1727.
5. Flaherty KR, Toews GB, Travis WD, Colby TV, Kazerooni EA, Gross BH, Jain A, Strawderman RL, Paine R, Flint A, Lynch JP, Martinez FJ. Clinical significance of histological classification of idiopathic interstitial pneumonia. Eur Respir J 2002;19:275-283.
6. Flaherty K, Thwaite E, Kazerooni E, Gross B, Toews G, Colby T, Travis W, Mumford J, Murray S, Flint A, Lynch J, Martinez F. Radiological versus histological diagnosis in UIP and NSIP: Survival implications. Thorax 2003;58:143-148.
7. Katzenstein A-LA, Mukhopadhyay S, Myers JL. Diagnosis of usual interstitial pneumonia and distinction from other fibrosing interstitial lung diseases. Hum Pathol 2008;39:1275-1294.
8. Raghu G, Collard HR, Egan JJ, Martinez FJ, Behr J, Brown KK, Colby TV, Cordier J-F, Flaherty KR, Lasky JA, Lynch DA, Ryu JH, Swigris JJ, Wells AU, Ancochea J, Bouros D, Carvalho C, Costabel U, Ebina M, Hansell DM, Johkoh T, Kim DS, King TE, Kondoh Y, Myers J, Mueller NL, Nicholson AG, Richeldi L, Selman M, Dudden RF, Griss BS, Protzko SL, Schuenemann HJ. An Official ATS/ERS/JRS/ALAT Statement: Idiopathic Pulmonary Fibrosis: Evidence-based guidelines for diagnosis and management. Am J Respir Crit Care Med 2011;183:788-824.
9. American Thoracic S, European Respiratory S. American Thoracic Society/European Respiratory Society International Multidisciplinary Consensus Classification of the Idiopathic Interstitial Pneumonias. This joint statement of the American Thoracic Society (ATS) and the European Respiratory Society (ERS) was adopted by the ATS board of directors, June 2001 and by the ERS Executive Committee, June 2001. Am J Respir Crit Care Med 2002;165:277-304.
10. Katzenstein A-LA, Myers JL. Idiopathic Pulmonary Fibrosis. Am J Respir Crit Care Med 1998;157:1301-1315.
11. Berbescu EA, Katzenstein A-LA, Snow JL, Zisman DA. Transbronchial biopsy in usual interstitial pneumonia. Chest 2006;129:1126-1131.
12. Tomassetti S, Cavazza A, Colby TV, Ryu JH, Nanni O, Scarpi E, Tantalocco P, Buccioli M, Dubini A, Piciucchi S, Ravaglia C, Gurioli C, Casoni GL, Gurioli C, Romagnoli M, Poletti V. Transbronchial biopsy is useful in predicting UIP pattern. Respir Res 2012;13:96-96.
13. Shim HS, Park MS, Park IK. Histopathologic findings of transbronchial biopsy in usual interstitial pneumonia. Pathol Int 2010;60:373-377.
14. Tomassetti S, Wells AU, Costabel U, Cavazza A, Colby TV, Rossi G, Sverzellati N, Carloni A, Carretta E, Buccioli M, Tantalocco P, Ravaglia C, Gurioli C, Dubini A, Piciucchi S, Ryu JH, Poletti V. Bronchoscopic lung cryobiopsy increases diagnostic confidence in the multidisciplinary diagnosis of idiopathic pulmonary fibrosis. Am J Respir Crit Care Med 2016;193:745-752.
15. Dhooria S, Sehgal IS, Aggarwal AN, Behera D, Agarwal R. Diagnostic yield and safety of cryoprobe transbronchial lung biopsy in diffuse parenchymal lung diseases: Systematic review and meta-analysis. Respir Care 2016;61:700-712.
16. Poletti V, Ravaglia C, Gurioli C, Piciucchi S, Dubini A, Cavazza A, Chilosi M, Rossi A, Tomassetti S. Invasive diagnostic techniques in idiopathic interstitial pneumonias. Respirology 2016;21:44-50.
17. Kim SY, Diggans J, Pankratz D, Huang J, Pagan M, Sindy N, Tom E, Anderson J, Choi Y, Lynch DA, Steele MP, Flaherty KR, Brown KK, Farah H, Bukstein MJ, Pardo A, Selman M, Wolters PJ, Nathan SD, Colby TV, Myers JL, Katzenstein A-LA, Raghu G, Kennedy GC. Classification of usual interstitial pneumonia in patients with interstitial lung disease: Assessment of a machine learning approach using high-dimensional transcriptional data. Lancet Respir Med 2015;3:473-482.
18. Friedman J, Hastie T, Tibshirani R. Regularization paths for generalized linear models via coordinate descent. J Stat Softw 2010;33:1-22.
19. Love MI, Huber W, Anders S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol 2014;15:550.
20. Mi H, Lazareva-Ulitsky B, Loo R, Kejariwal A, Vandergriff J, Rabkin S, Guo N, Muruganujan A, Doremieux O, Campbell MJ, Kitano H, Thomas PD. The PANTHER database of protein families, subfamilies, functions and pathways. Nucleic Acids Res 2005;33:D284-D288.
21. Katzenstein A-LA, Zisman DA, Litzky LA, Nguyen BT, Kotloff RM. Usual interstitial pneumonia: Histologic study of biopsy and explant specimens. Am J Surg Pathol 2002;26:1567-1577.
22. Trahan S, Hanak V, Ryu JH, Myers JL. Role of surgical lung biopsy in separating chronic hypersensitivity pneumonia from usual interstitial pneumonia/idiopathic pulmonary fibrosis: Analysis of 31 biopsies from 15 patients. Chest 2008;134:126-132.
23. Akashi T, Takemura T, Ando N, Eishi Y, Kitagawa M, Takizawa T, Koike M, Ohtani Y, Miyazaki Y, Inase N, Yoshizawa Y. Histopathologic analysis of sixteen autopsy cases of chronic hypersensitivity pneumonitis and comparison with idiopathic pulmonary fibrosis/usual interstitial pneumonia. Am J Clin Pathol 2009;131:405-415.
24. Selman M, Pardo A, Barrera L, Estrada A, Watson SR, Wilson K, Aziz N, Kaminski N, Zlotnik A. Gene expression profiles distinguish idiopathic pulmonary fibrosis from hypersensitivity pneumonitis. Am J Respir Crit Care Med 2006;173:188-198.
25. Lockstone HE, Sanderson S, Kulakova N, Baban D, Leonard A, Kok WL, McGowan S, McMichael AJ, Ho LP. Gene set analysis of lung samples provides insight into pathogenesis of progressive, fibrotic pulmonary sarcoidosis. Am J Respir Crit Care Med 2010;181:1367-1375.
26. Selman M, Pardo A. Revealing the pathogenic and aging-related mechanisms of the enigmatic idiopathic pulmonary fibrosis. An integral model. Am J Respir Crit Care Med 2014;189:1161-1172.
27. Bauer Y, Tedrow J, de Bernard S, Birker-Robaczewska M, Gibson KF, Guardela BJ, Hess P, Klenk A, Lindell KO, Poirey S, Renault B, Rey M, Weber E, Nayler O, Kaminski N. A novel genomic signature with translational significance for human idiopathic pulmonary fibrosis. Am J Respir Cell Mol Biol 2015;52:217-231.
28. Jonigk D, Izykowski N, Rische J, Braubach P, Kuhnel M, Warnecke G, Lippmann T, Kreipe H, Haverich A, Welte T, Gottlieb J, Laenger F. Molecular profiling in lung biopsies of human pulmonary allografts to predict chronic lung allograft dysfunction. Am J Pathol 2015;185:3178-3188.
29. Nicholson AG, Fulford LG, Colby TV, du Bois RM, Hansell DM, Wells AU. The relationship between individual histologic features and disease progression in idiopathic pulmonary fibrosis. Am J Respir Crit Care Med 2002;166:173-177.
30. Walsh SL, Wells AU, Desai SR, Poletti V, Piciucchi S, Dubini A, Nunes H, Valeyre D, Brillet PY, Kambouchner M, Morais A, Pereira JM, Moura CS, Grutters JC, van den Heuvel DA, van Es HW, van Oosterhout MF, Seldenrijk CA, Bendstrup E, Rasmussen F, Madsen LB, Gooptu B, Pomplun S, Taniguchi H, Fukuoka J, Johkoh T, Nicholson AG, Sayer C, Edmunds L, Jacob J, Kokosi MA, Myers JL, Flaherty KR, Hansell DM. Multicentre evaluation of multidisciplinary team meeting agreement on diagnosis in diffuse parenchymal lung disease: A case-cohort study. Lancet Respir Med 2016;4:557-565.
31. Flaherty KR, King TE, Raghu G, Lynch JP, Colby TV, Travis WD, Gross BH, Kazerooni EA, Toews GB, Long Q, Murray S, Lama VN, Gay SE, Martinez FJ. Idiopathic Interstitial Pneumonia. Am J Respir Crit Care Med 2004;170:904-910.
32. Tominaga J, Sakai F, Johkoh T, Noma S, Akira M, Fujimoto K, Colby TV, Ogura T, Inoue Y, Taniguchi H, Homma S, Taguchi Y, Sugiyama Y. Diagnostic certainty of idiopathic pulmonary fibrosis/usual interstitial pneumonia: The effect of the integrated clinico-radiological assessment. Eur J Radiol 2015;84:2640-2645.
33. The Idiopathic Pulmonary Fibrosis Clinical Research Network. Prednisone, azathioprine, and n-acetylcysteine for pulmonary fibrosis. N Engl J Med 2012;366:1968-77.
34. Sumikawa H, Johkoh T, Colby TV, Ichikado K, Suga M, Taniguchi H, Kondoh Y, Ogura T, Arakawa H, Fujimoto K, Inoue A, Mihara N, Honda O, Tomiyama N, Nakamura H, Muller NL. Computed tomography findings in pathological usual interstitial pneumonia. Am J Respir Crit Care Med 2008;177:433-439.
35. Chung JH, Chawla A, Peljto AL, Cool CD, Groshong SD, Talbert JL, McKean DF, Brown KK, Fingerlin TE, Schwarz MI, Schwarz DA, Lynch DA. CT scan findings of probable usual interstitial pneumonitis have a high predictive value for histologic usual interstitial pneumonitis. Chest 2015;147:450-459.
36. Brownell R, Moua T, Henry TS, Elicker BM, White D, Vittinghoff E, Jones KD, Urisman A, Aravena C, Johannson KA, Golden JA, King TE Jr, Wolters PJ. Collard HR, Ley B. The use of pretest probability increases the value of high-resolution CT in diagnosing usual interstitial pneumonia. Thorax 2017;72(5):424-429.
37. DiBardino DM, Haas AR, Lanfranco AR, Litzky LA, Sterman D, Bessich JL. High complication rate after introduction of transbronchial cryobiopsy into clinical practice at an academic medical center. Annals Am Thorac Soc 2017;14(6):851-857.
38. Hutchinson JP, McKeever TM, Fogarty AW, Navaratnam V, Hubbard RB. Surgical lung biopsy for the diagnosis of interstitial lung disease in England: 1997-2008. Eur Respir J 2016;48:1453-61.
E1. Kim SY, Diggans J, Pankratz D, Huang J, Pagan M, Sindy N, Tom E, Anderson J, Choi Y, Lynch DA, Steele MP, Flaherty KR, Brown KK, Farah H, Bukstein MJ, Pardo A, Selman M, Wolters PJ, Nathan SD, Colby TV, Myers JL, Katzenstein A-LA, Raghu G, Kennedy GC. Classification of usual interstitial pneumonia in patients with interstitial lung disease: assessment of a machine learning approach using high-dimensional transcriptional data. Lancet Respir Med 2015;3:473-482.
E2. Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, Batut P, Chaisson M, Gingeras TR. STAR: ultrafast universal RNA-seq aligner. Bioinformatics 2012.
E3. Anders S, Pyl PT, Huber W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics 2015;31:166-169.
E4. DeLuca DS, Levin JZ, Sivachenko A, Fennell T, Nazaire M-D, Williams C, Reich M, Winckler W, Getz G. RNA-SeQC: RNA-seq metrics for quality control and process optimization. Bioinformatics 2012;28:1530-1532.
E5. Wuenschell CW, Sunday ME, Singh G, Minoo P, Slavkin HC, Warburton D. Embryonic mouse lung epithelial progenitor cells co-express immunohistochemical markers of diverse mature cell lineages. J Histochem Cytochem 1996;44:113-123.
E6. Nielsen S, King LS, Christensen BM, Agre P. Aquaporins in complex tissues. II. Subcellular distribution in respiratory and glandular tissues of rat. Am J Physiol 1997;273:C1549-1561.
E7. Kim CF, Jackson EL, Woolfenden AE, Lawrence S, Babar I, Vogel S, Crowley D, Bronson RT, Jacks T. Identification of bronchioalveolar stem cells in normal lung and lung cancer. Cell 2005;121:823-835.
E8. Zemke AC, Snyder JC, Brockway BL, Drake JA, Reynolds SD, Kaminski N, Stripp BR. Molecular staging of epithelial maturation using secretory cell-specific genes as markers. Am J Respir Cell Mol Biol 2009;40:340-348.
E9. Treutlein B, Brownfield DG, Wu AR, Neff NF, Mantalas GL, Espinoza FH, Desai TJ, Krasnow MA, Quake SR. Reconstructing lineage hierarchies of the distal lung epithelium using single-cell RNA-seq. Nature 2014;509:371-375.
E10. Pankratz DG, Choi Y, Imtiaz U, Fedorowicz GM, Anderson JD, Colby TV, Myers JL, Lynch DA, Brown KK, Flaherty KR, Steele MP, Groshong SD, Raghu G, Barth NM, Walsh PS, Huang J, Kennedy GC, Martinez FJ. Usual interstital pneumonia can be detected in transbronchial biopsies using machine learning. Annals Am Thorac Soc 2017.
【0384】
[0373] 本明細書で言及され、及び/又は出願データシート若しくは上記の参考文献リストに挙げられる上記の米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願及び非特許刊行物は全て、全体として、参照により本明細書に援用される。
【0385】
【0386】
【0387】
【0388】
【0389】
【0390】
【0391】
【0392】
【0393】
【0394】
【0395】
【0396】
【0397】
【0398】