(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-02
(54)【発明の名称】癌検出方法、キットおよびシステム
(51)【国際特許分類】
C12Q 1/6851 20180101AFI20240625BHJP
C12Q 1/6869 20180101ALI20240625BHJP
C12Q 1/6837 20180101ALI20240625BHJP
C12Q 1/6883 20180101ALI20240625BHJP
C12M 1/34 20060101ALI20240625BHJP
【FI】
C12Q1/6851 Z ZNA
C12Q1/6869 Z
C12Q1/6837 Z
C12Q1/6883 Z
C12M1/34 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023576034
(86)(22)【出願日】2022-06-07
(85)【翻訳文提出日】2024-01-29
(86)【国際出願番号】 US2022032423
(87)【国際公開番号】W WO2022261039
(87)【国際公開日】2022-12-15
(32)【優先日】2021-06-09
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】523461999
【氏名又は名称】ミロンコル ダイアグノスティックス、インク.
(74)【代理人】
【識別番号】100104411
【氏名又は名称】矢口 太郎
(72)【発明者】
【氏名】チャン、アンドリュー
(72)【発明者】
【氏名】フー、ハイ
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA07
4B029FA15
4B063QA19
4B063QQ03
4B063QQ52
4B063QR08
4B063QR32
4B063QR62
4B063QS25
4B063QS34
4B063QX02
(57)【要約】
【要約】
【解決手段】 本明細書に提供されるのは、1つまたは複数のヒト癌を高精度で検出することができる方法、キットおよびシステムである。被験体からの液体生検試料に基づいて、1つまたはそれ以上のmiRNAからなるmiRNAバイオマーカーセットの発現プロファイルが決定された後、診断指標が算出され、それに基づいて被験体が癌であるか否かが分類される。4-miRNAバイオマーカーモデルは、99.3%の特異度を維持しながら、肺癌および胃癌では99.0~100%、胆道癌、膀胱癌、大腸癌、食道癌、神経膠腫、肝臓癌、膵臓癌、前立腺癌では83.0~99.0%、卵巣癌および肉腫では68.2~72.0%という極めて高い感度を示す。
【選択図】 なし
【特許請求の範囲】
【請求項1】
被験者から得られた生物学的試料から癌を検出する方法であって、
前記生物学的試料から少なくとも1つのmiRNAからなるmiRNAバイオマーカーセットの発現プロファイルを決定する工程であって、前記miRNAバイオマーカーセットはhsa-miR-5100を含む、前記決定する工程と、
前記miRNAバイオマーカーセットの前記発現プロファイルに基づいて、前記生物学的試料の診断指標を算出する工程であって、前記診断指標は、数式
【数1】
に基づいて算出され、
ここで、nは、前記miRNAバイオマーカーセット中の前記少なくとも1つのmiRNAの総数であり、前記miRNA
iは、前記miRNAバイオマーカーセット中のi
thmiRNAの発現レベルであり、iは0より大きく、nより小さいかそれと同等の整数であり、t
iは、i
thmiRNAの重みである、前記算出する工程と、および
前記算出された診断指数に基づいて、前記被験者が癌を有するか否かに分類する工程であって、前記算出された診断指数が予め決められた閾値以上である場合に、前記被験者が癌を有すると分類し、そうでない場合には前記被験者が癌を有さないと分類する、前記分類する工程と、を含み、
前記方法は、約0.780を超えるAUC値を持つ診断精度を達成することができる、方法。
【請求項2】
請求項1に記載の方法において、前記miRNAバイオマーカーセットは、さらに、hsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、hsa-miR-6789-5p、hsa-miR-4513、hsa-miR-3192-5p、hsa-miR-8060、hsa-miR-668-5p、hsa-miR-1268a、hsa-miR-1273g-3p、hsa-miR-4706、hsa-miR-124-3p、hsa-miR-1260b、hsa-miR-4740-5p、hsa-miR-320b、hsa-miR-7977、hsa-miR-29b-3p、hsa-miR-4708-3p、hsa-miR-4525、hsa-miR-92b-3p、hsa-miR-4257、hsa-miR-4727-3p、hsa-miR-92a-3p、hsa-miR-663a、hsa-miR-6787-5p、hsa-miR-3131、hsa-miR-6802-5p、hsa-miR-654-5p、hsa-miR-6511b-5p、hsa-miR-29b-1-5p、hsa-miR-4417、hsa-miR-4736、hsa-miR-6840-3p、hsa-miR-4710、hsa-miR-4635、hsa-miR-296-3p、hsa-miR-1199-5p、hsa-miR-7975、hsa-miR-4480、hsa-miR-3648、hsa-miR-371a-5p、hsa-miR-4771、hsa-miR-6717-5p、hsa-miR-1254、hsa-miR-1246、hsa-miR-23b-3p、hsa-miR-320a、hsa-miR-4687-5p、hsa-miR-191-5p、hsa-miR-320c、hsa-miR-6131、hsa-miR-4515、hsa-miR-342-5p、hsa-miR-4718、hsa-miR-23a-3p、hsa-miR-4455、hsa-miR-211-3p、hsa-miR-3122、hsa-miR-103a-3p、hsa-miR-4429、hsa-miR-920、hsa-miR-3194-3p、hsa-miR-4754、hsa-miR-1238-5p、hsa-miR-3191-3p、hsa-miR-4755-3p、hsa-miR-3688-5p、hsa-miR-4529-5p、hsa-miR-6861-5p、hsa-miR-1469、hsa-miR-619-5p、hsa-miR-4448、hsa-miR-4658、hsa-miR-22-3p、hsa-miR-4776-5p、hsa-miR-320e、hsa-miR-1225-3p、hsa-miR-6875-5p、hsa-miR-4534、hsa-miR-4652-5p、hsa-miR-648、hsa-miR-4259、hsa-miR-107、およびhsa-miR-650の1つまたはそれ以上を含む、方法。
【請求項3】
請求項1に記載の方法において、前記miRNAバイオマーカーセットが、さらに、hsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、hsa-miR-6789-5p、hsa-miR-4513、hsa-miR-3192-5p、hsa-miR-8060、hsa-miR-668-5p、hsa-miR-1268a、hsa-miR-1273g-3p、hsa-miR-4706、hsa-miR-124-3p、hsa-miR-1260b、hsa-miR-4740-5p、hsa-miR-320b、hsa-miR-7977、hsa-miR-29b-3p、hsa-miR-4708-3p、hsa-miR-4525、hsa-miR-92b-3p、hsa-miR-4257、hsa-miR-4727-3p、hsa-miR-92a-3p、hsa-miR-663a、hsa-miR-6787-5p、hsa-miR-3131、hsa-miR-6802-5p、hsa-miR-654-5p、hsa-miR-6511b-5p、hsa-miR-29b-1-5p、hsa-miR-4417、hsa-miR-4736、hsa-miR-6840-3p、およびhsa-miR-4710の1つまたはそれ以上を含む、方法。
【請求項4】
請求項1に記載の方法において、前記miRNAバイオマーカーセットが、さらに、hsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、およびhsa-miR-6789-5pの1つまたはそれ以上を含む、方法。
【請求項5】
請求項1に記載の方法において、前記miRNAバイオマーカーセットが、hsa-miR-5100、hsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、およびhsa-miR-6789-5pからなる、方法。
【請求項6】
請求項1に記載の方法において、前記miRNAバイオマーカーセットが、さらに、hsa-miR-1343-3p、hsa-miR-1290、およびhsa-miR-4787-3pの1つまたはそれ以上を含む、方法。
【請求項7】
請求項6に記載の方法において、前記miRNAバイオマーカーセットが、hsa-miR-5100、hsa-miR-1343-3p、hsa-miR-1290、およびhsa-miR-4787-3pからなる、方法。
【請求項8】
請求項7に記載の方法において、前記方法が、約0.850より大きいAUC値を有する診断精度を達成することができる、方法。
【請求項9】
請求項8に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌および肉腫からなる群から選択される、方法。
【請求項10】
請求項8に記載の方法において、前記方法が、約0.950より大きいAUC値を有する診断精度を達成することができる、方法。
【請求項11】
請求項10に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、卵巣癌、膵臓癌、および前立腺癌からなる群から選択される、方法。
【請求項12】
請求項10に記載の方法において、前記方法が、約0.990より大きいAUC値を有する診断精度を達成することができる、方法。
【請求項13】
請求項12に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、食道癌、胃癌、神経膠腫癌、および前立腺癌からなる群から選択される、方法。
【請求項14】
請求項12に記載の方法において、前記方法が、約0.999より大きいAUC値を有する診断精度を達成することができる、方法。
【請求項15】
請求項14に記載の方法において、前記癌が、肺癌および胃癌からなる群から選択される、方法。
【請求項16】
請求項7に記載の方法において、前記方法が、約99.0%より大きい特異度を有しながら、約68.0%より大きい感度を有する診断精度を達成することができる、方法。
【請求項17】
請求項16に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌、および肉腫からなる群から選択される、方法。
【請求項18】
請求項16に記載の方法において、前記方法が、約99.0%より大きい特異度を有しながら、約83.0%より大きい感度を有する診断精度を達成することができる、方法。
【請求項19】
請求項18に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌および前立腺癌からなる群から選択される、方法。
【請求項20】
請求項18に記載の方法において、前記方法が、約99.0%より大きい感度を有しながら、約99.0%より大きい特異度を有する診断精度を達成することができる、方法。
【請求項21】
請求項20に記載の方法において、前記癌が、肺癌および胃癌からなる群から選択される、方法。
【請求項22】
請求項1~21のいずれかに記載の方法において、前記miRNAバイオマーカーセットの発現プロファイルに基づいて、前記生物学的試料の前記診断指標を算出する際に、前記診断指標は非加重モデルを介して算出される、方法。
【請求項23】
請求項1~21のいずれかに記載の方法で、前記miRNAバイオマーカーセットの前記発現プロファイルに基づいて前記生物学的試料の前記診断指標を算出する際に、前記診断指標を、Linear Models for Microarray Data(limma)モデル、ロジスティック回帰モデル、線形判別分析(LDA)モデル、条件付きロジスティック回帰モデル、ラッソ回帰モデル、リッジ回帰モデル、ランダムフォレスト、サポートベクターマシン、およびプロビット回帰モデルからなる群から選択される1つからの重みを使用する加重モデルを介して算出する、方法。
【請求項24】
請求項23に記載の方法で、前記診断指数が、リンマモデルからの重みを使用する加重モデルを介して算出される、方法。
【請求項25】
請求項1~24のいずれか1項に記載の方法において、前記予め決定された閾値が、1110であり、前記方法は、約0.95より大きい特異度値を有する診断精度を達成することができる、方法。
【請求項26】
請求項1~24のいずれか1項に記載の方法において、前記予め決定された閾値が、1200であり、前記方法は、約0.99より大きい特異度値を有する診断精度を達成することができる、方法。
【請求項27】
請求項1~26のいずれかに記載の方法であって、
前記生物学的試料の診断指標を算出した後であって、前記被験者を前記癌に罹患しているか否かを前記分類する工程の前に、
前記算出された診断指標に基づいて正規化された診断指標を取得する工程であって、
前記算出された診断指標に基づいて、前記被験者を前記癌に罹患しているか否かに分類する工程が、
前記正規化された診断指標が予め設定されたカットポイント同等またはより大きい場合、前記被験者を前記癌に罹患していると分類する工程か、または
もしそうでなければ、前記被験者を前記癌ではないと分類する工程か、を含む、前記取得する工程をさらに含む、方法。
【請求項28】
請求項27に記載の方法において、前記算出された診断指数に基づいて前記正規化された診断指数を取得する際に、前記正規化された診断指数が数式:
【数2】
に基づいて算出され、
ここで、前記param
locationおよびparam
scaleはそれぞれ、前記正規化された診断指数が第1のプリセット値以下、第2のプリセット値以下の範囲内に収まるように構成されたロケーションパラメータとスケールパラメータである、方法。
【請求項29】
請求項28記載の方法において、前記診断指数は、前記リンマモデルからの重みを使用する加重モデルを介して算出され、第1のプリセット値は0であり、第2のプリセット値は10である、方法。
【請求項30】
請求項29に記載の方法において、前記予め設定されたカットポイントが、5.1であり、前記方法は、約0.95より大きい特異度値を有する診断精度を達成することができる方法。
【請求項31】
請求項29に記載の方法において、前記予め設定されたカットポイントが、6.0であり、前記方法は、約0.99より大きい特異度値を有する診断精度を達成することができる、方法。
【請求項32】
請求項1~31のいずれかに記載の方法において、前記生物学的試料が、血液試料、血清試料、血漿試料、尿試料、唾液試料および唾液試料からなる群から選択される液体生検試料である、方法。
【請求項33】
請求項1~32のいずれかに記載の方法において、前記生物学的試料から前記少なくとも1つのmiRNAからなるmiRNAバイオマーカーセットの発現プロファイルを決定する際に、前記miRNAバイオマーカーセットの前記発現プロファイルを、ノーザンブロット法、マイクロアレイ分析法、RNAシークエンシング法、またはRNAインサイチュハイブリダイゼーション法の少なくとも1つからなる方法によって取得される、方法。
【請求項34】
請求項1~32のいずれかに記載の方法において、前記生物学的試料から前記少なくとも1つのmiRNAからなるmiRNAバイオマーカーセットの発現プロファイルを決定する際に、前記miRNAバイオマーカーセットの前記発現プロファイルを、逆転写PCR(RT-PCR)、定量的RT-PCR(qRT-PCR)、またはデジタルRT-PCRの少なくとも1つからなる核酸増幅手順によって取得される、方法。
【請求項35】
請求項1~34のいずれか1項に記載の方法であって、さらに、前記被験体の評価を行う工程を含み、前記評価が前記癌の診断または前記癌の再発の検出を含む、方法。
【請求項36】
請求項1~35のいずれか1項に記載の方法であって、さらに、前記被験体が前記癌に罹患していると分類された場合に、前記被験体に治療レジメンを投与する工程を含む、方法。
【請求項37】
被験体から取得された生物学的試料から癌を検出するためのキットであって、少なくとも1つの核酸と少なくとも1つの指示を含み、
前記少なくとも1つの核酸の各々は、miRNAバイオマーカーセット中の各miRNAを特異的に認識することができ、それにより前記miRNAバイオマーカーセットの発現プロファイルを前記生物学的試料から取得することができ、前記miRNAバイオマーカーセットはhsa-miR-5100を含み、
前記少なくとも1つの指示は、
前記miRNAバイオマーカーセットの前記発現プロファイルに基づいて、前記生物学的試料の診断指標を算出するための第1のサブ指示を含む第1の指示であって、前記診断指標は、数式:
【数3】
に基づいて算出され、
ここで、nは、前記miRNAバイオマーカーセット中の前記少なくとも1つのmiRNAの総数であり、miRNA
iは、前記miRNAバイオマーカーセット中のi
thmiRNAの発現レベルであり、iは0より大きく、nより小さいかそれと同等の整数であり、t
iは、i
thmiRNAの重みである、第1の指示と、および
前記被験者を前記癌に罹患しているか否かに分類するための第2の指示であって、前記算出された診断指数が予め決定された閾値以上である場合には、前記被験者を前記癌に罹患していると分類し、そうでない場合には前記被験者を前記癌に罹患していないと分類する、第2の指示と、
を含む、キット。
【請求項38】
請求項37に記載のキットであって:
前記少なくとも1つの核酸が、厳しい条件下で、
(a)配列ID番号:1のヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続したヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
(b)配列ID番号:1のヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
と特異的にハイブリダイズすることができるポリヌクレオチドを含む、キット。
【請求項39】
請求項37または請求項38に記載のキットにおいて、さらに、前記miRNAバイオマーカーセットが、hsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、hsa-miR-6789-5p、hsa-miR-4513、hsa-miR-3192-5p、hsa-miR-8060、hsa-miR-668-5p、hsa-miR-1268a、hsa-miR-1273g-3p、hsa-miR-4706、hsa-miR-124-3p、hsa-miR-1260b、hsa-miR-4740-5p、hsa-miR-320b、hsa-miR-7977、hsa-miR-29b-3p、hsa-miR-4708-3p、hsa-miR-4525、hsa-miR-92b-3p、hsa-miR-4257、hsa-miR-4727-3p、hsa-miR-92a-3p、hsa-miR-663a、hsa-miR-6787-5p、hsa-miR-3131、hsa-miR-6802-5p、hsa-miR-654-5p、hsa-miR-6511b-5p、hsa-miR-29b-1-5p、hsa-miR-4417、hsa-miR-4736、hsa-miR-6840-3p、hsa-miR-4710、hsa-miR-4635、hsa-miR-296-3p、hsa-miR-1199-5p、hsa-miR-7975、hsa-miR-4480、hsa-miR-3648、hsa-miR-371a-5p、hsa-miR-4771、hsa-miR-6717-5p、hsa-miR-1254、hsa-miR-1246、hsa-miR-23b-3p、hsa-miR-320a、hsa-miR-4687-5p、hsa-miR-191-5p、hsa-miR-320c、hsa-miR-6131、hsa-miR-4515、hsa-miR-342-5p、hsa-miR-4718、hsa-miR-23a-3p、hsa-miR-4455、hsa-miR-211-3p、hsa-miR-3122、hsa-miR-103a-3p、hsa-miR-4429、hsa-miR-920、hsa-miR-3194-3p、hsa-miR-4754、hsa-miR-1238-5p、hsa-miR-3191-3p、hsa-miR-4755-3p、hsa-miR-3688-5p、hsa-miR-4529-5p、hsa-miR-6861-5p、hsa-miR-1469、hsa-miR-619-5p、hsa-miR-4448、hsa-miR-4658、hsa-miR-22-3p、hsa-miR-4776-5p、hsa-miR-320e、hsa-miR-1225-3p、hsa-miR-6875-5p、hsa-miR-4534、hsa-miR-4652-5p、hsa-miR-648、hsa-miR-4259、hsa-miR-107、およびhsa-miR-650の1つまたはそれ以上を含む、キット。
【請求項40】
請求項39に記載のキットにおいて、前記少なくとも1つの核酸が、厳しい条件下で、
(a)配列ID番号S:2~100のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続したヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
(b)配列ID番号S:2~100のいずれか1つのヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる少なくとも1つのポリヌクレオチドをさらに含む、キット。
【請求項41】
請求項73または請求項38に記載のキットにおいて、さらに、前記miRNAバイオマーカーセットが、hsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、hsa-miR-6789-5p、hsa-miR-4513、hsa-miR-3192-5p、hsa-miR-8060、hsa-miR-668-5p、hsa-miR-1268a、hsa-miR-1273g-3p、hsa-miR-4706、hsa-miR-124-3p、hsa-miR-1260b、hsa-miR-4740-5p、hsa-miR-320b、hsa-miR-7977、hsa-miR-29b-3p、hsa-miR-4708-3p、hsa-miR-4525、hsa-miR-92b-3p、hsa-miR-4257、hsa-miR-4727-3p、hsa-miR-92a-3p、hsa-miR-663a、hsa-miR-6787-5p、hsa-miR-3131、hsa-miR-6802-5p、hsa-miR-654-5p、hsa-miR-6511b-5p、hsa-miR-29b-1-5p、hsa-miR-4417、hsa-miR-4736、hsa-miR-6840-3p、およびhsa-miR-4710の1つまたはそれ以上を含む、キット。
【請求項42】
請求項41に記載のキットにおいて、前記少なくとも1つの核酸が、厳しい条件下で、
(a)配列ID番号S:2~50のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
(b)配列ID番号S:2~50のいずれか1つのヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる少なくとも1つのポリヌクレオチドをさらに含む、キット。
【請求項43】
請求項37または請求項38に記載のキットにおいて、さらに、前記miRNAバイオマーカーセットが、hsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、およびhsa-miR-6789-5pの1つまたはそれ以上を含む、キット。
【請求項44】
請求項43に記載のキットにおいて、前記少なくとも1つの核酸が、厳しい条件下で、
(a)配列ID番号S:2~20のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
(b)配列ID番号S:2~20のいずれか1つのヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる少なくとも1つのポリヌクレオチドをさらに含む、キット。
【請求項45】
請求項43に記載のキットにおいて、前記miRNAバイオマーカーセットが、hsa-miR-5100、hsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、およびhsa-miR-6789-5pからなる、キット。
【請求項46】
請求項45に記載のキットにおいて、前記少なくとも1つの核酸が、厳しい条件下で、
(a)それぞれ配列ID番号S:1~20のヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するそれらの変異体、またはそれぞれ15個以上の連続するヌクレオチドを含むそれらのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
(b)それぞれ配列ID番号S:1~20のヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、またはそれぞれ15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる合計20のポリヌクレオチドからなる、キット。
【請求項47】
請求項37または請求項38に記載のキットにおいて、さらに、前記miRNAバイオマーカーセットが、hsa-miR-1343-3p、hsa-miR-1290、およびhsa-miR-4787-3pの1つまたはそれ以上を含む、キット。
【請求項48】
請求項47記載のキットにおいて、前記少なくとも1つの核酸が、厳しい条件下で、
(a)配列ID番号S:2~4のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
(b)配列ID番号S:2~4のいずれか1つのヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる少なくとも1つのポリヌクレオチドをさらに含む、キット。
【請求項49】
請求項47に記載のキットにおいて、前記miRNAバイオマーカーセットが、hsa-miR-5100、hsa-miR-1343-3p、hsa-miR-1290、およびhsa-miR-4787-3pからなる、キット。
【請求項50】
請求項49に記載のキットにおいて、前記少なくとも1つの核酸が、厳しい条件下で、
(a)それぞれ配列ID番号S:1~4のヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するそれらの変異体、またはそれぞれ15個以上の連続するヌクレオチドを含むそれらのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
(b)配列ID番号S:1~4のヌクレオチド配列にそれぞれ相補的なヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドをそれぞれ含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる合計4つのポリヌクレオチドからなる、キット。
【請求項51】
請求項37~50のいずれか1項に記載のキットにおいて、第1の指示の第1のサブ指示において、前記診断指数が重み付けされていないモデルを介して算出される、キット。
【請求項52】
請求項37~50のいずれか1項に記載のキットにおいて、第1の指示の第1のサブ指示において、前記診断指標が、Linear Models for Microarray Data(limma)モデル、ロジスティック回帰モデル、線形判別分析(LDA)モデル、条件付きロジスティック回帰モデル、ラッソ回帰モデル、リッジ回帰モデル、ランダムフォレスト、サポートベクターマシン、およびプロビット回帰モデルからなる群から選択される1つからの重みを使用する加重モデルを介して算出される、キット。
【請求項53】
請求項52に記載のキットにおいて、前記診断指標が、前記リンマモデルからの重みを使用する加重モデルを介して算出される、キット。
【請求項54】
請求項37~53のいずれか1項に記載のキットにおいて、前記予め決定された閾値が1110であり、第2の指示が、前記分類が約0.95より大きい特異性値を有する表示をさらに含む、キット。
【請求項55】
請求項37~53のいずれか1項に記載のキットにおいて、前記予め決定された閾値が1200であり、第2の指示が、前記分類が約0.99より大きい特異性値を有する表示をさらに含む、キット。
【請求項56】
請求項37~55のいずれかに記載のキットにおいて、第1の指示は、第1の指示に従って算出された診断指数に基づいて正規化診断指数を取得するための第2の指示をさらに含み、第2の指示において、前記被験者は、前記正規化された診断指数が予め設定されたカットポイント以上であれば前記癌を有すると分類され、そうでなければ前記癌を有さないと分類される、キット。
【請求項57】
請求項56に記載のキットにおいて、第2のサブ指示において、前記正規化された診断指数が式:
【数4】
に基づいて算出され、
前記param
locationとparam
scaleが、それぞれ、前記正規化された診断指数が第1のプリセット値以下、第2のプリセット値以下の範囲内に収まるように構成されたロケーションパラメータとスケールパラメータである、キット。
【請求項58】
請求項57に記載のキットにおいて、第1の指示において、前記診断指数は、前記リンマモデルからの重みを使用する加重モデルを介して算出され、第1のプリセット値は0であり、第2のプリセット値は10である、キット。
【請求項59】
請求項58に記載のキットにおいて、前記予め設定されたカットポイントが5.1であり、第2の指示が、前記分類が約0.95より大きい特異性値を有する表示をさらに含む、キット。
【請求項60】
請求項58に記載のキットにおいて、前記予め設定されたカットポイントは6.0であり、第2の指示は、前記分類が約0.95より大きい特異性値を有する指示をさらに含む、キット。
【請求項61】
請求項37~60のいずれか1項に記載のキットにおいて、前記少なくとも1つの指示が、前記被験者の評価を実行するための第3の指示をさらに含み、前記評価が、前記癌の診断または前記癌の再発の検出を含む、キット。
【請求項62】
請求項37~61のいずれか1項に記載のキットにおいて、前記少なくとも1つの指示が、前記被験者が前記癌を有すると分類された場合に、前記被験者に治療レジメンを投与するための第4の指示をさらに含む、キット。
【請求項63】
請求項37~62のいずれかに記載のキットにおいて、前記少なくとも1つのインストラクションが、miRNAバイオマーカーセットの発現プロファイルを得るための第1の追加インストラクションをさらに含み、少なくとも1つの核酸を用いてノーザンブロッティング、マイクロアレイ解析、RNA配列決定、またはRNAインサイチュハイブリダイゼーションを実施する手順を含む、キット。
【請求項64】
請求項63に記載のキットにおいて、前記少なくとも1つの核酸が分子アレイ上に配置される、キット。
【請求項65】
請求項37~62のいずれか1項に記載のキットにおいて、前記少なくとも1セットの増幅用プライマーをさらに含み、各セットが前記生物学的試料からmiRNAバイオマーカーセット中の前記少なくとも1つのmiRNAの各々を特異的に増幅することができる、キット。
【請求項66】
請求項65に記載のキットにおいて、前記少なくとも1つの指示が、前記miRNAバイオマーカーセットの前記発現プロファイルを得るための第2の追加指示をさらに含み、前記少なくとも1つの核酸および前記少なくとも1つの増幅プライマーセットにより逆転写PCR(RT-PCR)、定量的RT-PCR(qRT-PCR)、またはデジタルRT-PCRを実施する手順を含む、キット。
【請求項67】
請求項37~66のいずれかに記載のキットにおいて、前記生物学的試料が、血液試料、血清試料、血漿試料、尿試料、唾液試料、および唾液試料からなる群から選択される液体生検試料である、キット。
【請求項68】
被験者の癌を検出するためのシステムであって、
プロセッサと、および
前記プロセッサによる実行のためのプログラム指示を含む非一過性記憶媒体であって、前記プログラム指示は、請求項1~36のいずれか1項に記載の方法における工程を前記プロセッサに実行させる、前記非一過性記憶媒体と、
を含む、システム。
【請求項69】
プロセッサによって実行されると、請求項1~36のいずれか1項に記載の方法を前記プロセッサに実行させる、コンピュータ実行可能なプログラム指示を記憶する、非一過性記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2021年6月9日に出願された米国仮出願第63/208,506号の利益を主張するものであり、その開示は参照によりその全体が本明細書に組み込まれる。
【0002】
電子的に提出された配列リスト(ファイル名Top_miRNA_Seq.txt、サイズ15,063バイト、作成日2022年5月31日)の内容は、本明細書中に参考として援用される。
【0003】
本発明は、一般に、疾患のスクリーニング、検出および診断の技術分野に関するものであり、より具体的には、1つまたは複数のヒトにおける癌を検出するための方法、キット、システム、および非一過性記憶媒体に関するものである。
【背景技術】
【0004】
近年の診断・治療技術の急速な発展にもかかわらず、癌は人間にとって困難で致命的な疾患であることに変わりはない。早期であれば治療が成功する可能性が高いため、癌関連死亡率を減少させるためには、癌を早期に発見することが重要であることはよく知られている。理想的には非侵襲的で、いわゆるマルチ癌早期発見(MCED)パラダイムの基礎となっている血液検査のような、複数の癌種を早期かつ同時に検出できる検査を開発することが、満たされていない緊急のニーズとなっている。このようなMCED検査では、多くの場合、リスクのある一般集団をスクリーニングできるようにするため、偽陽性を最小限に抑える非常に高い特異性、できれば99%以上が必要とされる。
【0005】
miRNAは、ヒトゲノムの対応する遺伝子にコードされている平均22ヌクレオチド長の小さな一本鎖の非コードRNA分子である。miRNAは、主にmRNA分子の3'非翻訳領域(3'UTR)中の相補的配列と結合することにより、遺伝子発現の負の転写後調節において機能する。miRNAはヒト遺伝子の50%以上を調節しているようであり、miRNAの異常発現は多くのヒト癌に関与している。血液中やその他の体液中における安定性が顕著であることと相まって、循環細胞外miRNAは、癌のスクリーニングや診断のための非侵襲的バイオマーカーとしての役割を果たす可能性を秘めている。
【発明の概要】
【課題を解決するための手段】
【0006】
本開示は、少なくとも1つのmiRNAバイオマーカーからなるmiRNAバイオマーカーセットによる多癌検出アプローチ(すなわち、方法、キット、およびシステム)を提供する。このアプローチは、ヒト被験者から得られた生物学的試料から決定され得るmiRNAバイオマーカーセットの発現プロファイルに実質的に基づく。このような生物学的試料は、特に、血液試料、血清試料、血漿試料、尿試料、唾液試料、または喀痰試料を含む液体生検試料とすることができ、これにより、癌の非侵襲的または最小侵襲的検出を可能にする。このアプローチは、ヒト被験者が肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌、肉腫を含む癌のいずれかに罹患しているかどうかを正確かつ確実に検出するために採用することができる。
【0007】
一の態様において、被験者から得られた生体試料から癌を検出する方法が提供される。
本方法は、実質的に以下の3つの工程(1)~(3)を含む:
【0008】
工程(1):生体試料から少なくとも1つのmiRNAからなるmiRNAバイオマーカーセットの発現プロファイルを決定する。ここで、miRNAバイオマーカーセットは、hsa-miR-5100からなる。
【0009】
工程(2):miRNAバイオマーカーセットの発現プロファイルに基づいて、生物学的試料の診断指標を算出する。診断指標は以下:
【数1】
に基づいて算出され、
ここで、nはmiRNAバイオマーカーセット中のmiRNAの総数であり、miRNAiはmiRNAバイオマーカーセット中のi
thmiRNAの発現レベルであり、iは0より大きく、nより小さいかそれと同等の整数であり、t
iはi
thmiRNAの重みである。
【0010】
工程(3):算出された診断指標の値に基づいて、被験者を癌に罹患しているか否かに分類する。算出された診断指標が予め決められた閾値以上である場合、対象者は癌に罹患していると分類され、そうでない場合、対象者は癌に罹患していないと分類される。
【0011】
さらにこの方法は、約0.780を超えるAUC値を持つ診断精度を達成できるように構成される。
【0012】
本明細書で使用する場合、miRNAバイオマーカーセットの発現プロファイルは、実質的に、miRNAバイオマーカーセットに含まれる各miRNAメンバーについて決定された発現レベルデータを含むデータセットである。
【0013】
「事前に決定された閾値」という用語は、被験者が癌種に罹患しているか否かを所定の特異度/感度で判定するために使用できる診断指標のカットポイント値として参照される。これは、典型的には、疾患を有することが知られている、及び/又は疾患を有しないことが知られている被験者の既存の集団について取得され算出された診断指標値の範囲からなる既存のデータセットに基づいて予め決定される。例えば、以下に提供される実施例1において、miRNAバイオマーカーセットが上位100のmiRNA(配列ID番号S:1-100に対応する)のいずれか1つからなる場合、AUCは0.780(すなわち、hsa-miR-1238-5pの場合)より大きいレベルに達することができる、さらには約0.999(すなわち、hsa-miR-5100、hsa-miR-1343-3p、hsa-miR-1290およびhsa-miR-4787-3pの上位4つのmiRNAの場合)に達することもある(表1参照)。
【0014】
本方法のいくつかの実施形態によれば、miRNAバイオマーカーセットは、hsa-miR-5100(配列ID番号:1に対応する)に加えて、表1に列挙された他の99個のmiRNAの1つ以上、すなわちhsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、hsa-miR-6789-5p、hsa-miR-4513、hsa-miR-3192-5p、hsa-miR-8060、hsa-miR-668-5p、hsa-miR-1268a、hsa-miR-1273g-3p、hsa-miR-4706、hsa-miR-124-3p、hsa-miR-1260b、hsa-miR-4740-5p、hsa-miR-320b、hsa-miR-7977、hsa-miR-29b-3p、hsa-miR-4708-3p、hsa-miR-4525、hsa-miR-92b-3p、hsa-miR-4257、hsa-miR-4727-3p、hsa-miR-92a-3p、hsa-miR-663a、hsa-miR-6787-5p、hsa-miR-3131、hsa-miR-6802-5p、hsa-miR-654-5p、hsa-miR-6511b-5p、hsa-miR-29b-1-5p、hsa-miR-4417、hsa-miR-4736、hsa-miR-6840-3p、hsa-miR-4710、hsa-miR-4635、hsa-miR-296-3p、hsa-miR-1199-5p、hsa-miR-7975、hsa-miR-4480、hsa-miR-3648、hsa-miR-371a-5p、hsa-miR-4771、hsa-miR-6717-5p、hsa-miR-1254、hsa-miR-1246、hsa-miR-23b-3p、hsa-miR-320a、hsa-miR-4687-5p、hsa-miR-191-5p、hsa-miR-320c、hsa-miR-6131、hsa-miR-4515、hsa-miR-342-5p、hsa-miR-4718、hsa-miR-23a-3p、hsa-miR-4455、hsa-miR-211-3p、hsa-miR-3122、hsa-miR-103a-3p、hsa-miR-4429、hsa-miR-920、hsa-miR-3194-3p、hsa-miR-4754、hsa-miR-1238-5p、hsa-miR-3191-3p、hsa-miR-4755-3p、hsa-miR-3688-5p、hsa-miR-4529-5p、hsa-miR-6861-5p、hsa-miR-1469、hsa-miR-619-5p、hsa-miR-4448、hsa-miR-4658、hsa-miR-22-3p、hsa-miR-4776-5p、hsa-miR-320e、hsa-miR-1225-3p、hsa-miR-6875-5p、hsa-miR-4534、hsa-miR-4652-5p、hsa-miR-648、hsa-miR-4259、hsa-miR-107、およびhsa-miR-650は、調整P値に基づいてランク付けされ、配列ID番号S:それぞれ2-100に対応する。
【0015】
本方法の他のいくつかの実施形態によれば、miRNAバイオマーカーセットは、hsa-miR-5100に加えて、表1に記載された他のトップ50のmiRNAの1つ以上、すなわちhsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、hsa-miR-6789-5p、hsa-miR-4513、hsa-miR-3192-5p、hsa-miR-8060、hsa-miR-668-5p、hsa-miR-1268a、hsa-miR-1273g-3p、hsa-miR-4706、hsa-miR-124-3p、hsa-miR-1260b、hsa-miR-4740-5p、hsa-miR-320b、hsa-miR-7977、hsa-miR-29b-3p、hsa-miR-4708-3p、hsa-miR-4525、hsa-miR-92b-3p、hsa-miR-4257、hsa-miR-4727-3p、hsa-miR-92a-3p、hsa-miR-663a、hsa-miR-6787-5p、hsa-miR-3131、hsa-miR-6802-5p、hsa-miR-654-5p、hsa-miR-6511b-5p、hsa-miR-29b-1-5p、hsa-miR-4417、hsa-miR-4736、hsa-miR-6840-3p、およびhsa-miR-4710は、調整P値に基づいてランク付けされ、配列ID番号S:それぞれ2-50に対応する。
【0016】
方法のいくつかの他の実施形態によれば、miRNAバイオマーカーセットは、hsa-miR-5100に加えて、表1に列挙された他の上位20のmiRNAの1つ以上、すなわちhsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p、hsa-miR-6877-5p、hsa-miR-17-3p、hsa-miR-6765-5p、hsa-miR-1268b、hsa-miR-4258、hsa-miR-451a、hsa-miR-1228-5p、hsa-miR-8073、hsa-miR-4454、hsa-miR-187-5p、hsa-miR-4286、hsa-miR-6746-5p、hsa-miR-663b、hsa-miR-6075、hsa-miR-5001-5p、およびhsa-miR-6789-5pを含み、調整P値に基づいてランク付けされ、配列ID番号S:2-20にそれぞれ対応する。ここで,さらに任意に、miRNAバイオマーカーセットは、表1に記載された上位20のmiRNAからなる(それぞれ配列ID番号S:1-20に対応する)。
【0017】
本方法のいくつかの他の実施形態によれば、miRNAバイオマーカーセットは、hsa-miR-5100に加えて、表1に列挙された他の上位4つのmiRNA、すなわち、hsa-miR-1343-3p、hsa-miR-1290、およびhsa-miR-4787-3pのうちの1つ以上をさらに含み、これらは、調整P値に基づいてランク付けされ、配列ID番号S:2~4にそれぞれ対応する。ここでさらに任意に、miRNAバイオマーカーセットは、表1に記載された上位4つのmiRNA、すなわちhsa-miR-5100、hsa-miR-1343-3p、hsa-miR-1290、およびhsa-miR-4787-3pからなり、これらはそれぞれ配列ID番号S:1-4に対応する。
【0018】
本方法は任意に、より高いAUC値を有する診断精度を達成できるようにさらに構成することができる。
【0019】
いくつかの実施形態によれば、本方法は、約0.850より大きいAUC値を有する診断精度を達成できるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌、および肉腫からなる群から選択され得る。
【0020】
いくつかの実施形態によれば、本方法は、約0.950より大きいAUC値を有する診断精度を達成できるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、卵巣癌、膵臓癌、および前立腺癌からなる群からなる。
【0021】
いくつかの実施形態によれば、本方法は、約0.990より大きいAUC値を有する診断精度を達成できるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、食道癌、胃癌、神経膠腫癌、および前立腺癌からなる群から選択され得る。
【0022】
いくつかの実施形態によれば、本方法は、約0.999より大きいAUC値を有する診断精度を達成できるように構成される。ここで任意に、検出され得る癌は、肺癌または胃癌であり得る。
【0023】
さまざまな実際的ニーズに応じて、本方法は任意に、異なる感度および特異度レベルを有する診断精度を達成できるように構成することができる。
【0024】
いくつかの実施形態によれば、本方法は、約99.0%を超える特異度を有しながら、約68.0%を超える感度を有する診断精度を達成することができるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌、および肉腫からなる群からなる。
【0025】
いくつかの実施形態によれば、本方法は、約99.0%より高い特異性を有しながら、約83.0%より高い感度を有する診断精度を達成することができるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、および前立腺癌からなる群からなる。
【0026】
いくつかの実施形態によれば、本方法は、約99.0%より大きい感度を有し、約99.0%より大きい特異度を有する診断精度を達成することができるように構成される。ここで任意に、検出され得る癌は、肺癌または胃癌であり得る。
【0027】
本方法のいくつかの実施形態によれば、miRNAバイオマーカーセットの発現プロファイルに基づいて生物学的試料の診断指標を算出する工程(2)において、診断指標は、重み付けされていないモデルを介して算出される。
【0028】
本方法の他のいくつかの実施形態によれば、miRNAバイオマーカーセットの発現プロファイルに基づいて生物学的試料の診断指標を算出する工程(2)において、診断指標は、Linear Models for Microarray Data(limma)モデルからなる群からなる1つからの重みを使用する重み付けモデルを介して算出される、ロジスティック回帰モデル、線形判別分析(LDA)モデル、条件付きロジスティック回帰モデル、ラッソ回帰モデル、リッジ回帰モデル、ランダムフォレスト、サポートベクターマシン、およびプロビット回帰モデルからなる群から選択される1つから重みを用いて重み付けモデルにより算出される。さらに任意で、診断指標は、リンマモデルからの重みを使用した重み付けモデルによって算出される。
【0029】
本明細書で使用する場合、「非重み付けモデル」および「重み付けモデル」という用語は、当業者によく理解される一般的な定義の範囲内で理解されるものとする。非重み付けモデル」という用語については、診断指標を算出する際に、miRNAバイオマーカーセット内の各miRNAに重みが適用されない状況を指す。本開示の範囲内で、式(I)を参照すると、「診断指数は重み付けされていないモデルを介して算出される」という語句は、miRNAバイオマーカーセット内の任意のmiRNAについて等しいti(例えば、ti=1)を有すると理解することができる。「重み付けモデル」という用語については、診断指標を算出する際に、miRNAバイオマーカーセット内の各miRNAに対応する重みが適用される状況を指す。本開示の範囲内において、式(I)を参照すると、「診断指標は加重モデルを介して算出される」という語句は、miRNAバイオマーカーセット内の任意のmiRNAiについて、すべてのtiが等しいわけではない(すなわち、異なる重みを有する少なくとも2つのmiRNAが存在する)と理解することができる。
【0030】
それぞれの用語は、「Linear Models for Microarray Data(limma)モデル」(Ritchie et al.2015)、「ロジスティック回帰モデル」(Venable and Ripley 2002)、「線形判別分析(LDA)モデル」(Venable and Ripley 2002)、「条件付きロジスティック回帰モデル」(Venable and Ripley 2002)、「ラッソ回帰モデル」(Tibshirani 1996)、「リッジ回帰モデル」(Hoerl and Kennard 1970)、「ランダムフォレスト」(Ripley 1996)、「support vector machine」(Ripley 1996)、「probit regression model」(Venable and Ripley 2002)は、実質的に、当業者によって一般的に評価される定義に従う確率モデル統計モデルであり、その詳細は、すぐ後ろに含まれる参考文献によって参照できる。
【0031】
利便性を提供するために、いくつかの実施形態によれば、工程(2)の後および工程(3)の前に、本方法は、算出された診断指数に基づいて正規化診断指標を得る:という正規化工程をさらに含むことができる。これに対応して、工程(3)は:正規化診断指数が予め設定されたカットポイント以上である場合、被験者を癌に罹患していると分類する;または、そうでない場合、被験者を癌に罹患していないと分類する。
【0032】
ここで、正規化工程には異なる方法があり得る。いくつかの実施形態によれば、正規化診断指数は式(II):
【数2】
に基づいて算出され、
ここで、param
locationとparam
scaleはそれぞれ、正規化された診断指数が第1のプリセット値以下、第2のプリセット値以下の範囲に収まるように構成されたロケーションパラメータとスケールパラメータである。
【0033】
より具体的には、paramlocationは実質的に、正規化診断指標の最小値を第一のプリセット値にシフトするように構成された位置パラメータであり、paramscaleは実質的に、正規化診断指標の最大値を第二の値にスケールするように構成されたスケールパラメータである。このように、第一のプリセット値および第二のプリセット値は、それぞれ、癌を有することが知られている被験者および癌を有しないことが知られている被験者の既存の集団から得られ算出された正規化診断指標値の範囲における最小値および最大値であり、異常値は除外される。
【0034】
オプションとして、複数の設定を適用することもできる。例えば、診断指標値が外れ値(参照)を除いて600から1600の範囲を持つように決定された以下のEXAMPLE 1の既存のデータセットにおいて、範囲を0(すなわち第一のプリセット値)と10(すなわち第二の現在値)の間にシフトさせるために、最終的に正規化された診断指標が0より小さくなく10より大きくならないように、paramlocationとparamscale をそれぞれ600と100に設定することができる。この正規化スキームは以下の実施例1でも採用されている。
【0035】
あるいは、paramlocationとparamscaleをそれぞれ600と1000に設定し、最終的な正規化診断指標を0以上1以下とすることもできる。さらに別の方法として、paramlocationとparamscaleをそれぞれ600と10に設定し、最終的な正規化診断指標を0以上100以下とすることもできる。さらに別の方法として、paramlocationとparamscaleをそれぞれ350と250に設定し、最終的な正規化診断指標を1以上5以下に設定することもできる。
【0036】
正規化診断指数が0と10の間になるように正規化される実施形態では、任意で事前設定カットポイントを5.1として設定し、それによって本方法が約0.95を超える特異性を有するようにするか、または任意で6.0として設定し、それによって本方法が約0.99を超える特異性を有するようにすることができる。
【0037】
上述の方法の任意の実施形態において、生物学的試料は、血液試料、血清試料、血漿試料、尿試料(Yunら、2012年)、唾液試料(Park et al.、2009)、および喀痰試料からなる群からなる液体生検試料である。
【0038】
上記のような方法の任意の実施形態において、生物学的試料から少なくとも1つのmiRNAからなるmiRNAバイオマーカーセットの発現プロファイルを決定する工程(1)において、miRNAバイオマーカーセットの発現プロファイルは、任意選択で、ノーザンブロッティングによって得ることができる、マイクロアレイ分析、RNA配列決定、またはRNAインサイチュハイブリダイゼーションによって、あるいは任意選択で、逆転写PCR(RT-PCR)、定量的RT-PCR(qRT-PCR)、またはデジタルRT-PCRからなる核酸増幅手順によって得ることができる。
【0039】
本明細書で使用される場合、上記のmiRNA検出アプローチのそれぞれは、当業者によって十分に理解される一般的な定義内で理解されるものとする。miRNAバイオマーカーセットの発現プロファイルを決定するためにこれらのアプローチを実施するための詳細を以下に提供する。
【0040】
上記のような方法の任意の実施形態において、本方法は、任意選択で、被験体の評価を実施する工程をさらに含み、前記評価は、癌の診断または癌の再発の検出を含む。
【0041】
ここで、「癌の診断」とは、以前は癌でないとわかっていた対象者に癌が発見されることをいい、「癌の再発」とは、以前に癌を取り除く治療を受けて癌でなくなった対象者に再び癌が発見されることをいう。
【0042】
上記のような方法の任意の実施形態において、本方法は、被験体が癌を有すると分類された場合に、被験体に治療レジメンを投与する工程を任意にさらに含む。ここで、本方法では、手術、放射線療法、化学療法、ホルモン療法、標的療法、免疫療法、またはそれらの組み合わせを含む、様々な既知の治療レジメンを投与することができる。これらの治療レジメンは、上記の各異なる癌に対して十分に確立されている。
【0043】
上記のような方法の任意の実施形態において、本方法は、被験体が癌を有すると分類された場合に、被験体に対して診断手順を実施する工程を任意選択的にさらに含む。ここで、診断手順は、任意選択で、身体検査、対象からの生検の病理学的検査、免疫組織化学検査、またはX線、コンピュータ断層撮影(CT)、超音波検査、および/もしくは磁気共鳴画像診断などの画像検査を含み得る。
【0044】
第2の態様において、本開示はさらに、対象から得られた生物学的試料から癌を検出するためのキットを提供し、このキットは、第1の態様に記載の方法を実施するために実質的に採用される。
【0045】
本明細書及び本開示の他の箇所で使用されるように、用語「キット」は、物品及び/又は指示書の集合体として言及される。キットに含まれる物品は、物理的実体またはその成分であり得る。本明細書に開示されるようなキットに含まれ得る物品の例としては、1つ以上の核酸(例えば、ポリヌクレオチド)、または1つ以上のデバイス、装置もしくは機器(例えば、1つ以上の核酸を含む分子アレイまたはマイクロアレイ)が挙げられ得る。キットに含まれるインストラクションは、実行すべき特定の工程の説明(例えば、マニュアル)であり得、物理的媒体(例えば、紙、カードなど)、コンピュータ読み取り可能な記憶媒体(例えば、ハードディスク、コンパクトディスクまたはCD、フラッシュドライブなど)上に印刷され得、あるいはインターネット(例えば、アクセス可能なクラウド空間)などに保存され得る。
【0046】
キットは、少なくとも以下の構成要素(1)及び(2)(すなわち、物品及び/又は説明書)を含む:
【0047】
成分(1):少なくとも1つの核酸であって、miRNAバイオマーカーセット中の各miRNAを特異的に認識することができ、それにより生物学的試料からmiRNAバイオマーカーセットの発現プロファイルを得ることができる核酸。ここで、miRNAバイオマーカーセットは、hsa-miR-5100(配列ID番号:1)を含む。
【0048】
構成要素(2):第1の指示および第2の指示を含む少なくとも1つの指示である。前記第1の指示は、前記miRNAバイオマーカーセットの発現プロファイルに基づいて前記生物学的試料の診断指標を算出するための第1のサブ指示を含み、前記診断指標は式:
【数3】
に基づいて算出され、
ここで、nは、miRNAバイオマーカーセット中の少なくとも1つのmiRNAの総数であり、miRNA
iは、miRNAバイオマーカーセット中のi
thmiRNAの発現レベルであり、iは、0より大きくn以下の整数であり、t
iは、i
thmiRNAの重みである。第二の指示は、対象が癌を有するか否かに分類するように構成され、対象は、算出された診断指数が予め決定された閾値以上であれば癌を有すると分類され、そうでなければ癌を有さないと分類される。
【0049】
ここで、キットの成分(1)において、少なくとも1つの核酸は、任意選択で、厳しい条件下で、以下:(a)配列ID番号.1、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続したヌクレオチドを含むそのフラグメントか、または(b)配列ID番号:1のヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続したヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドのいずれかに特異的にハイブリダイズすることができるポリヌクレオチドを含み得る。
【0050】
キットのいくつかの実施形態によれば、miRNAバイオマーカーセットは、hsa-miR-5100に加えて、表1に列挙された他の99のmiRNAのうちの1つ以上をさらに含む。これに対応して、キットの構成要素(1)において、少なくとも1つの核酸は、任意選択で、厳しい条件下で、(a)配列ID番号S.2~100のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または(b)配列ID番号S:2~100のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる少なくとも1つのポリヌクレオチドをさらに含み得る。
【0051】
キットのいくつかの実施形態によれば、miRNAバイオマーカーセットは、hsa-miR-5100に加えて、表1に列挙された他のトップ50miRNAの1つ以上をさらに含む。これに対応して、キットの構成要素(1)において、少なくとも1つの核酸は、任意選択で、厳しい条件下で、(a)配列ID番号S:2~50のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または(b)配列ID番号S:2~50のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる少なくとも1つのポリヌクレオチドをさらに含むことができる。
【0052】
キットのいくつかの実施形態によれば、miRNAバイオマーカーセットは、hsa-miR-5100に加えて、表1に列挙された他のトップ20のmiRNAの1つ以上をさらに含む。これに対応して、キットの構成要素(1)において、少なくとも1つの核酸は、任意選択で、厳しい条件下で、(a)配列ID番号S:2~20のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または(b)配列ID番号S:2~20のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる少なくとも1つのポリヌクレオチドをさらに含むことができる。
【0053】
ここでさらに任意に、miRNAバイオマーカーセットは、表1の上位20のmiRNAからなり、これに対応して、キットの成分(1)において、少なくとも1つの核酸は、厳しい条件下で、a)配列ID番号S:1~20のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または(b)配列ID番号S:1~20のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる合計20のポリヌクレオチドをさらに含むことができる。
【0054】
キットのいくつかの実施形態によれば、miRNAバイオマーカーセットは、hsa-miR-5100に加えて、表1に列挙された他の上位4のmiRNAの1つ以上をさらに含む。これに対応して、キットの構成要素(1)において、少なくとも1つの核酸は、任意選択で、厳しい条件下で、(a)配列ID番号S:2~4のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続したヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または(b)配列ID番号S:2~4のいずれか1つのヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続したヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかに特異的にハイブリダイズすることができる少なくとも1つのポリヌクレオチドをさらに含むことができる。
【0055】
ここでさらに任意に、miRNAバイオマーカーセットは、表1の上位4つのmiRNA、すなわちhsa-miR-5100、hsa-miR-1343-3p、hsa-miR-1290、およびhsa-miR-4787-3pからなり、これに対応して、キットの成分(1)において、少なくとも1つの核酸は、厳しい条件下で、(a)配列ID番号S:1~4のヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するそれらの変異体、または各々15個以上の連続したヌクレオチドを含むそれらのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または(b)配列ID番号S:1~4のヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するそれらの変異体、または各々15個以上の連続したヌクレオチドを含むそれらのフラグメントに各々相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる合計4つのポリヌクレオチドをさらに含むことができる。
【0056】
キットにおいて、構成要素(2)の第1の指示の第1のサブ指示において、診断指数は、重み付けされていないモデルを介して、または代替的に、第1の側面において上記で提供された確率モデリング統計モデルの1つからの重みを使用する重み付けされたモデルを介して算出することができる。ここで、キットのいくつかの実施形態によれば、診断指数は、リンマモデルからの重みを使用する加重モデルを介して算出される。
【0057】
キットのいくつかの実施形態によれば、事前決定閾値は1110として設定することができ、第2の指示はさらに、事前決定閾値として1110を使用する分類が0.95を超える特異度を有することを示す。キットの他のいくつかの実施形態によれば、事前決定閾値は1200として設定することができ、第2の指示はさらに、事前決定閾値として1200を使用するそのような分類が0.99を超える特異度を有することを示す。
【0058】
キットのいくつかの実施形態によれば、第1の指示は、第1のサブ指示に従って算出された診断指数に基づいて正規化診断指数を取得するための第2のサブ指示をさらに含み、第2の指示において、被験者は、正規化診断指数が予め設定されたカットポイント以上であれば癌を有するものとして分類され、そうでなければ癌を有さないものとして分類される。この正規化処理は、上記第1の方法の態様で述べた正規化処理と実質的に同一であるが、ここではその説明を省略する。
【0059】
オプションとして、正規化診断指数は、リンマモデルからの重みを使用する重み付きモデルを介して算出され、第1のプリセット値は0であり、第2のプリセット値は10である。さらに、プリセットカットポイントは5.1または6.0として任意に設定することができ、これによりプリセットカットポイントを用いた分類がそれぞれ0.95または0.99を超える特異度を有することができる。
【0060】
異なる実施形態によれば、キットの構成要素(2)の少なくとも1つの指示は、被験体の評価を実施するための第3の指示をさらに含むことができ、前記評価は、癌の診断または癌の再発の検出を含む;あるいは、被験体が癌を有すると分類された場合に、被験体に治療レジメンを投与するための第4の指示をさらに含むことができる。
【0061】
いくつかの実施形態によれば、キットにおける構成要素(2)の少なくとも1つの指示は、miRNAバイオマーカーセットの発現プロファイルを得るための第1の追加の指示をさらに含み得、これは、少なくとも1つの核酸によってノーザンブロッティング、マイクロアレイ解析、RNA配列決定、またはRNAインサイチュハイブリダイゼーションを実施するための手順を含む。ここで、少なくとも1つの核酸は、任意選択で分子アレイ上に配置することができる。
【0062】
いくつかの実施形態によれば、キットは、増幅プライマーの少なくとも1つのセットをさらに含んでもよく、各セットは、生物学的試料からmiRNAバイオマーカーセット中の少なくとも1つのmiRNAのそれぞれを特異的に増幅することができる。このように、キットにおける構成要素(2)の少なくとも1つの指示は、miRNAバイオマーカーセットの発現プロファイルを得るための第2の追加の指示をさらに含んでもよく、これは、少なくとも1つの核酸および少なくとも1セットの増幅プライマーによって逆転写PCR(RT-PCR)、定量的RT-PCR(qRT-PCR)、またはデジタルRT-PCRを実施する手順を含む。
【0063】
上記のようなキットの任意の実施形態において、生物学的試料は、血液試料、血清試料、血漿試料、尿試料、唾液試料、および喀痰試料からなる群から選択される液体生検試料であり得る。
【0064】
第3の態様において、本開示はさらに、対象における癌を検出するためのシステムを提供する。ここで、本システムは、実質的に、ハードウェア(例えば、プロセッサ、メモリ、I/Oインターフェース、記憶媒体など)およびソフトウェア(すなわち、オペレーションシステムソフトウェア、および特定のプログラムソフトウェアなどを含むコンピュータプログラム)の集合体からなるコンピュータ化システムであり、これらは、第1の側面において上述したような方法の全部または一部の工程を集合的に実施するように協働するように構成される。いくつかの実施形態によれば、システムは、プロセッサと、非一過性記憶媒体とを含む。非一過性記憶媒体は、プロセッサによる実行のためのソフトウェア(すなわち、プログラム・インストラクション)を含むように構成され、プログラム・インストラクションは、第1の側面で上述した方法の様々な異なる実施形態に従って、プロセッサに方法の様々な工程を実行させるように構成される。
【0065】
第4の態様において、本開示は、プロセッサによって実行されるとき、プロセッサに、第1の態様において上述された方法の様々な異なる実施形態に従った方法を実行させる、コンピュータ実行可能なプログラム指示を記憶するように構成された、非一過性記憶媒体をさらに提供する。
【0066】
miRNAバイオマーカーセットにどのようなmiRNA成分が含まれるか、診断指標に対して正規化が行われるかどうか、どのように行われるか、被験者が癌を有するか否かについてどのように分類されるか、生物学的試料にどのような試料を使用できるか、どのような検出精度レベルを達成するか、等を含む、以下の要素/特徴に関する、上述のシステム及び非一過性記憶媒体に関する様々な異なる実施形態が存在し得る。これらの異なる実施形態についての具体的な詳細は、第1の態様で説明したような方法の様々な実施形態を参照することができ、本明細書では簡潔にするために省略する。
【0067】
別段の定義がない限り、本開示全体を通じて使用される用語の定義は以下の通りである。
【0068】
一般的には、ヒト、チンパンジーなどの霊長類、イヌ、ネコなどの愛玩動物、ウシ、ウマ、ヒツジ、ヤギなどの畜産動物、マウス、ラットなどのげっ歯類などの哺乳動物をいう。また、「健常者」とは、検出すべき癌のない哺乳動物を意味する。本開示全体は、より具体的にはヒト被験体に関するものであるが、任意に他の非ヒト哺乳動物にも適用できることに留意されたい。
【0069】
「核酸」、「ヌクレオチド」、「ポリヌクレオチド」、「DNA」、「RNA」および「miRNA」などの用語または略語は、特に指示または定義がない限り、当技術分野における一般的な用法に従う。
【0070】
本明細書では、「ポリヌクレオチド」という用語は「核酸」と互換性があり、RNA、DNA、およびRNA/DNA(キメラ)のすべてを含む核酸を指す。DNAは、cDNA、ゲノムDNA、合成DNAのすべてを含む。RNAは、total RNA、mRNA、rRNA、miRNA、siRNA、snoRNA、snRNA、non-coding RNA、合成RNAの全てを含む。
【0071】
本明細書で使用される場合、用語「フラグメント」は、ポリヌクレオチドの連続部分を有するヌクレオチド配列を有するポリヌクレオチドであり、望ましくは15以上のヌクレオチド、例えば15、16、17、18、19などのヌクレオチドの長さを有する。
【0072】
本明細書において、「遺伝子」という用語は、RNAおよび二本鎖DNAのみならず、二本鎖を構成するプラス鎖(またはセンス鎖)または相補鎖(またはアンチセンス鎖)などの各一本鎖DNAも含むことが意図される。遺伝子の長さは特に限定されない。本明細書において、「遺伝子」には、特に指定のない限り、ヒトゲノムDNAを含む二本鎖DNA、cDNAを含む一本鎖DNA(プラス鎖)、プラス鎖と相補的な塩基配列を有する一本鎖DNA(相補鎖)、miRNA(マイクロRNA)及びそれらのフラグメント、並びにそれらの転写産物の全てが含まれる。「遺伝子」には、特定の塩基配列(または配列ID番号)で表される「遺伝子」だけでなく、その遺伝子によってコードされるRNAと同等の生物学的機能を有するRNAをコードする「核酸」、例えば、コングナー(すなわち、ホモログまたはオルソログ)、バリアント(例えば、遺伝子多型)、および誘導体も含まれる。このようなコンジェナー、バリアント、または誘導体をコードする「核酸」の具体例としては、配列ID番号:1~100のいずれかで表されるヌクレオチド配列の相補配列、または該ヌクレオチド配列からヌクレオチド「U」(または「u」)をヌクレオチド「T」(または「t」)に置換することにより誘導されるヌクレオチド配列と、後述する厳しい条件下でハイブリダイズするヌクレオチド配列を有する「核酸」を挙げることができる。「遺伝子」は、その機能領域によって特に限定されず、例えば、発現制御領域、コード領域、エクソン、またはイントロンを含むことができる。「遺伝子」は、細胞内に含まれていてもよいし、細胞外に放出されて単独で存在していてもよい。あるいは、「遺伝子」はエクソソームと呼ばれる小胞に封入された状態であってもよい。
【0073】
本開示全体の範囲内において、「マイクロRNA(miRNA)」という用語は、ヘアピン様構造を有するRNA前駆体として転写され、RNアーゼIII切断活性を有するdsRNA切断酵素によって切断され、RISCと呼ばれるタンパク質複合体に組み込まれ、mRNAの翻訳の抑制に関与する、15~25ヌクレオチドの非コードRNAを意味することが意図されるが、特に明記しない。本明細書で使用する「miRNA」という用語は、特定のヌクレオチド配列(または配列ID番号)で表される「miRNA」だけでなく、「miRNA」の前駆体(pre-miRNAまたはpri-miRNA)、およびそれと同等の生物学的機能を有するmiRNA、例えば、コングナー(すなわち、ホモログまたはオルソログ)、バリアント(例えば、遺伝子多型)、および誘導体を含む。このような前駆体、共役体、変異体、または誘導体は、miRBase Release 20(Kozomara and Griffiths-Jones,2010)を用いて特異的に同定することができ、その例としては、配列ID番号S:1~100のいずれかで表される任意の特定のヌクレオチド配列の相補配列と後述する厳しい条件下でハイブリダイズするヌクレオチド配列を有する「miRNA」を挙げることができる。本明細書で使用する用語「miRNA」は、miRNA遺伝子の遺伝子産物であってもよい。このような遺伝子産物には、成熟miRNA(例えば、上記のようなmRNAの翻訳抑制に関与する15~25ヌクレオチドまたは19~25ヌクレオチドの非コードRNA)またはmiRNA前駆体(例えば、pre-miRNAまたはpri-miRNA)が含まれる。
【0074】
本明細書で使用される場合、「プローブ」という用語には、遺伝子の発現に起因するRNA、またはRNAに由来するポリヌクレオチド、および/またはそれに相補的なポリヌクレオチドを特異的に検出するために使用されるポリヌクレオチドが含まれる。
【0075】
本明細書で使用される場合、用語「プライマー」または「増幅プライマー」は、遺伝子またはRNA由来のポリヌクレオチドの発現から生じるRNA、および/またはそれに相補的なポリヌクレオチドを特異的に認識して増幅するポリヌクレオチドを含む。
【0076】
この文脈において、相補的ポリヌクレオチド(相補鎖または逆鎖)とは、配列ID番号.1~100のいずれかで定義されるヌクレオチド配列、またはヌクレオチド「U」(もしくは「u」)をヌクレオチド「T」(もしくは「t」)に置換することによってこのヌクレオチド配列から誘導されるヌクレオチド配列、またはその部分配列(ここでは、この全長配列または部分配列を便宜上プラス鎖と称する)からなる。ただし、このような相補鎖は、標的プラス鎖のヌクレオチド配列と完全に相補的な配列に限定されるものではなく、標的プラス鎖に対して厳しい条件下でハイブリダイゼーションが可能な程度の相補関係を有するものであればよい。
【0077】
本明細書において、「厳しい条件」とは、核酸プローブが標的配列に対して、他の配列よりも大きな範囲(例えば、バックグラウンド測定値の平均値+バックグラウンド測定値の標準偏差×2以上の測定値)でハイブリダイズする条件をいう。厳しい条件は配列によって異なり、ハイブリダイゼーションを行う環境によっても異なる。核酸プローブに100%相補的な標的配列は、ハイブリダイゼーションの厳しい条件や洗浄条件を制御することにより同定することができる。「厳しい条件」の具体例については後述する。
【0078】
本明細書で使用される場合、用語「変異体」とは、核酸の場合、多型、突然変異などに起因する天然の変異体;
配列ID番号.1~100のいずれかで表されるヌクレオチド配列、またはヌクレオチド「U」(もしくは「u」)をヌクレオチド「T」(もしくは「t」)で置換することにより該ヌクレオチド配列から誘導されるヌクレオチド配列、またはその部分配列;配列ID番号.のいずれかで表される配列の時期尚早のmiRNAのヌクレオチド配列において、1または2もしくはそれ以上のヌクレオチドの欠失、置換、付加または挿入を含む変異体;配列ID番号.のいずれかで表される配列の時期尚早のmiRNAのヌクレオチド配列において、1または2もしくはそれ以上のヌクレオチドの欠失、置換、付加または挿入を含む変異体:1~100で表される配列の早発型miRNAのヌクレオチド配列、または該ヌクレオチド配列からヌクレオチド「U」(または「u」)をヌクレオチド「T」(または「t」)に置換することにより誘導されるヌクレオチド配列、またはその部分配列;これらのヌクレオチド配列またはその部分配列のそれぞれに対して約90%以上、約95%以上、約97%以上、約98%以上、約99%以上の同一性を示す変異体;または、これらのヌクレオチド配列またはその部分配列の各々からなるポリヌクレオチドまたはオリゴヌクレオチドに、上記で定義した厳しい条件下でハイブリダイズする核酸。変異体は、部位特異的突然変異誘発またはPCRベースの突然変異誘発のような周知の技術を用いて調製することができる。
【0079】
パーセント(%)同一性」という用語は、上述のBLASTまたはFASTAに基づくタンパク質または遺伝子検索システムを用いて、導入されたギャップの有無にかかわらず決定することができる(Zhangら、2000;Altschulら、1990;Pearsonら、1988)。
【0080】
「誘導体」という用語は、修飾された核酸、例えば、フルオロフォアなどで標識された誘導体、修飾されたヌクレオチドを含む誘導体(例えば、例えば、ハロゲン、メチルなどのアルキル、メトキシ、チオ、カルボキシメチルなどのアルコキシ、塩基転位、二重結合飽和、脱アミノ化、酸素分子の硫黄原子への置換などを受けたヌクレオチド)、PNA(ペプチド核酸;Nielsenら、1991)、LNA(ロックド核酸;Obikaら、1998)などを含むヌクレオチドが挙げられる。
【0081】
上記のmiRNAから選択されるポリヌクレオチドと特異的に結合可能な「核酸」は、合成または調製された核酸であり、具体的には「核酸プローブ」または「プライマー」が挙げられる。「核酸」は、被験体における癌の有無の検出、癌の重症度、改善度、治療感受性の診断、癌の予防、改善、治療に有用な候補物質のスクリーニングなどに直接的または間接的に利用される。「核酸」には、配列ID番号:1~100のいずれかで表される転写産物またはその合成cDNA核酸を、生体内、特に体液(例えば、血液または尿)などの試料中で、癌の発生に関連して特異的に認識し、結合することができるヌクレオチド、オリゴヌクレオチドおよびポリヌクレオチドが含まれる。本発明のヌクレオチド、オリゴヌクレオチドおよびポリヌクレオチドは、上記のような性質に基づいて、生体内、組織内、細胞内などで発現する前記遺伝子を検出するためのプローブとして、または生体内で発現する前記遺伝子を増幅するためのプライマーとして、有効に利用することができる。
【0082】
本明細書で使用される用語「検出」は、用語「検査」、「測定」、または「検出または決定支援」と交換可能である。本明細書において、「評価」という用語は、検査結果または測定結果に基づく診断または評価支援を含むことを意味する。
【0083】
本開示の範囲内で使用される場合、「P値」、「正確度」、「AUC」、「感度」、および「特異度」の各用語は、一般に、当業者によく理解される共通の定義を有すると理解され、具体的には以下のように定義される:
【0084】
「P値」または「P」という用語は、「p値」または「p」と交換可能であると考えられ、統計的検定において、帰無仮説の下でデータから実際に算出された統計量よりも極端な統計量が観察される確率を指す。したがって、「P」または「P値」が小さければ小さいほど、比較対象者間の有意差が大きいことを意味する。
【0085】
「AUC」とは、Receiver Operating Characteristic曲線の曲線下面積を意味する。「精度」とは、(真陽性数+真陰性数)/(総症例数)の値を意味する。精度は、全検体に対する正しく同定された検体の割合を示し、検出性能を評価する主要な指標となる。
【0086】
本明細書において、「感度」という用語は、(真陽性数)/(真陽性数+偽陰性数)の値を意味する。感度が高ければ、癌を検出することができ、臨床的な治療介入につながる。
【0087】
本明細書において、「特異度」という用語は、(真陰性の数)/(真陰性の数+偽陽性の数)の値を意味する。特異度が高いことで、癌患者であると誤判定された健常者の余計な検査を防ぐことができ、患者の負担軽減や医療費削減につながる。
【0088】
別段の定めがない限り、miRNAバイオマーカーセットの発現プロファイルの決定に使用できる利用可能な技術を以下に要約する。
【0089】
miRNAバイオマーカーセットの発現プロファイルの決定には、miRNAバイオマーカーセットに含まれる一つ一つのmiRNAの発現レベルの決定が実質的に含まれることに留意されたい。好ましくは、miRNAバイオマーカーセットに含まれる全てのmiRNAの発現レベルは、十分に制御された1回の実験で同時に決定することができる。しかし、任意で、これらのmiRNAの発現レベルは、複数の実験で、異なる実験手順によって決定されることが可能である。
【0090】
本明細書において、miRNAバイオマーカーセットに含まれるmiRNAの発現を測定または検出することは、miRNAに対応する核酸転写物を測定または検出することを含む。
【0091】
典型的には、発現はmiRNAまたは対応する逆転写cDNAレベルに基づいて検出または測定することができる。RNAレベルまたはcDNAレベルを測定するための定量的または定性的な方法はいずれも使用できる。miRNAまたはcDNAレベルを検出または測定する適切な方法としては、例えば、ノーザンブロッティング、マイクロアレイ解析、RNA配列決定、RNAインサイチュハイブリダイゼーション、または逆転写PCR(RT-PCR)もしくはリアルタイムRT-PCR(定量的RT-PCR(qRT-PCR)としても知られる)、またはデジタルRT-PCRなどの核酸増幅手順が挙げられる。このような方法は当技術分野でよく知られている(例えば、Green and Sambrook et al.)その他の技術としては、nCounter(登録商標)(NanoString Technologies,Seattle, WA)遺伝子発現アッセイなどの遺伝子発現のデジタル多重解析があり、US20100112710およびUS20100047924にさらに記載されている。
【0092】
目的の核酸を検出するには、一般に標的(例えばmiRNAやcDNA)とプローブとのハイブリダイゼーションが必要である。様々な癌遺伝子の発現プロファイルに用いられているmiRNAの配列は既知である。したがって、当業者であれば、それらのmiRNAを検出するためのハイブリダイゼーションプローブを容易に設計することができる(例えば、Green and Sambrook et al.)例えば、本明細書に記載のmiRNA転写物(またはそれから合成されたcDNA)に特異的に結合するポリヌクレオチドプローブは、miRNAまたはcDNAターゲットの核酸配列そのものを用いて、ルーティンな技術(例えば、PCRまたは合成)によって作成することができる。本明細書で使用する場合、「プローブ」という用語は、約10個以上の連続したヌクレオチド、約15個以上の連続したヌクレオチド、約20個以上の連続したヌクレオチドからなるポリヌクレオチド配列の一部または部分を意味する。特定の実施形態では、ポリヌクレオチドプローブは、10個以上の核酸、15個以上の核酸、または20個以上の核酸を含む。十分な特異性を付与するために、プローブは、例えば、周知のBasic Local Alignment Search Tool(BLAST)アルゴリズム(National Center for Biotechnology Information(NCBI)、Bethesda、Md.を通じて入手可能)を使用して決定されるように、約95%以上(例えば、約98%以上または約99%以上)などの約90%以上の標的配列の相補体に対する配列同一性を有し得る。
【0093】
各プローブは、クロスハイブリダイゼーションや偽陽性を避けるために、その標的に対して実質的に特異的であってもよい。特異的なプローブを使う代わりに、転写産物から材料を得る際に特異的な試薬を使う方法もある(例えば、cDNA生産時、または増幅時に標的特異的プライマーを使う)。どちらの場合も、分析対象のmiRNAのグループ内で実質的にユニークな部分へのハイブリダイゼーションによって特異性を得ることができる。ターゲットに複数のスプライスバリアントがある場合、それぞれのバリアントに共通する領域を認識するハイブリダイゼーション試薬をデザインすること、および/または、それぞれが1つ以上のバリアントを認識する複数の試薬を使用することが可能である。
【0094】
ハイブリダイゼーション反応の厳しい条件は当業者であれば容易に決定でき、一般的にはプローブの長さ、洗浄温度、塩濃度に依存する経験的な算出である。一般に、長いプローブは適切なアニーリングのために高い温度を必要とし、短いプローブは低い温度を必要とする。ハイブリダイゼーションは一般に、相補鎖が融解温度以下の環境に存在するとき、変性した核酸配列が再アニーリングする能力に依存する。プローブとハイブリダイズ可能な配列間の相同性が高ければ高いほど、使用できる相対温度は高くなる。その結果、相対温度が高いほど反応条件は厳しくなり、低いほど反応条件は緩やかになる。
【0095】
本明細書で定義される「厳しい条件」または「さらに厳しい条件」は、以下のものによって特定されるが、これらに限定されるものではない:(1)洗浄に低イオン強度と高温を使用する、例えば50℃で0.015M塩化ナトリウム/0.0015Mクエン酸ナトリウム/0.1%ドデシル硫酸ナトリウム;(2)ハイブリダイゼーション中に変性剤、例えばホルムアミドを使用する、例えば50%(v/v)ホルムアミドに0.1%ウシ血清アルブミン/0.1%フィコール/0.1%ポリビニルピロリドン/50mMリン酸ナトリウム緩衝液、pH6.5、750mM塩化ナトリウム、75mMクエン酸ナトリウム、42℃;または(3)50%ホルムアミド、5×SSC(0.75MのNaCl、0.075Mのクエン酸ナトリウム)、50mMのリン酸ナトリウム(pH6.8)、0.1%のピロリン酸ナトリウム、5×デンハルト溶液、超音波処理したサケ精子DNA(50μg/ml)、0.1%SDS、および10%デキストラン硫酸で42℃、0.2×SSC(塩化ナトリウム/クエン酸ナトリウム)および50%ホルムアミドで42℃、55℃で洗浄し、その後EDTAを含む0.1×SSCで55℃、さらに厳しい条件で洗浄する。「中程度に厳しい条件」は、Sambrookら、1989に記載されているが、これに限定されるものではなく、上記の条件よりも厳しい条件でない洗浄液およびハイブリダイゼーション条件(例えば、温度、イオン強度および%SDS)の使用を含む。中程度に厳しい条件の例は、以下からなる溶液中で、37℃で一晩インキュベートすることである:20%ホルムアミド、5×SSC(150mM NaCl、15mMクエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハルト溶液、10%デキストラン硫酸、および20mg/mLの変性剪断サケ精子DNAからなる溶液中で37℃で一晩インキュベートした後、約37~50℃で1×SSC中でフィルターを洗浄する。当業者であれば、プローブの長さなどの因子に対応するために、必要に応じて温度やイオン強度などを調整する方法を認識するであろう。
【0096】
特定の実施形態では、マイクロアレイ分析、ノーザンブロット、RNAインサイチュハイブリダイゼーション、またはPCRベースの方法が使用される。この点に関して、生物学的試料における前述のmiRNAの発現を測定することは、例えば、癌細胞を含むかまたは含む疑いのある試料を、目的のmiRNAに特異的なポリヌクレオチドプローブ、または目的のmiRNAの一部を増幅するように設計されたプライマーと接触させ、核酸標的へのプローブの結合または核酸の増幅をそれぞれ検出することからなり得る。PCRプライマーを設計するための詳細なプロトコールは当技術分野で知られている(例えば、Green and Sambrook et al.)特定の実施形態において、試料から得られたmiRNAはqRT-PCRに供され得る。逆転写は、Omniscript RT Kit(Qiagen)の使用など、当技術分野で公知の任意の方法によって行うことができる。得られたcDNAは、当技術分野で公知の任意の増幅技術によって増幅される。miRNA発現は、次に、例えば、以下に記載するような対照試料を使用して分析される。本明細書に記載されるように、コントロールに対するmiRNAの過剰発現または過小発現を測定して、個々の生物学的試料のmiRNA発現プロファイルを決定することができる。同様に、miRNA発現を分析するためにマイクロアレイを調製し使用するための詳細なプロトコールは当技術分野で知られており、本明細書に記載されている。
【0097】
本明細書で使用するRNA-sequencing(RNA-seq)は、Whole Transcriptome Shotgun Sequencingとも呼ばれ、RNA転写産物の存在および量をリアルタイムで検出するために使用される様々な高スループット配列決定技術のいずれかを指す。Wang,Z.,M.Gerstein,and M.Snyder,RNA-Seq:a revolutionary tool for transcriptomics,NAT REV GENET,2009を参照。10(1):p.57-63.RNA-seqは、ある瞬間のゲノムから試料のmiRNAのスナップショットを明らかにするために用いることができる。特定の実施形態では、miRNAは、配列決定の前に逆転写を介してcDNAフラグメントに変換され、特定の実施形態では、miRNAは、cDNAに変換することなく直接配列決定することができる。アダプターをmiRNAの5'末端および/または3'末端に結合させ、miRNAまたはcDNAを任意に、例えばPCRによって増幅することができる。フラグメントは次に、例えばRoche社(例えば454プラットフォーム)、Illumina社、Applied Biosystem社(例えばSOLiDシステム)から入手可能なような高スループットシーケンス技術を用いて配列決定される。
【図面の簡単な説明】
【0098】
【
図1】
図1A~1Cは、肺癌データセット(
図1A、発見セットと検証セットに分割)、および卵巣癌、肝臓癌、膀胱癌データセット(
図1B、冗長試料を除去した後、単一の検証データセットに統合)の症例フロー図を示し、肺癌、膀胱癌、卵巣癌、肝臓癌患者の患者と腫瘍の特性、および対応する対照の人口統計学的情報を要約している(
図1C);
【
図2】
図2A~2Gは、肺癌データセットにおける4-miRNA診断モデルの開発と検証を示す図であり、
図2Aは、発見セットにおける10重クロスバリデーションによる診断モデルのためのmiRNAの最適数(点線)の決定を示し、
図2Bは、発見セットにおけるROC分析を示し、
図2Cは、発見セットにおける正規化診断指数の分布を示し、
図2Dは、検証セットにおけるROC分析を示し、
図2Eは、検証セットにおける正規化診断指数の分布を示し、
図2Fは、対になった血清試料(前と後)の正規化診断指数の比較を示す。検証セットにおけるROC分析を示す
図2D、検証セットにおける正規化診断指標の分布を示す
図2E、180人の肺癌患者の対血清試料(手術前と手術後)の正規化診断指標の比較を示す
図2F、検証セットの臨床サブセットにおける正規化診断指標の分布を示す
図2G。点線の水平線は、我々のモデルの正規化診断指数のカットポイントを示す。グラフに示されたパーセンテージは、各癌サブグループにおける感度である。
【
図3】
図3Aおよび
図3Bは、追加癌のデータセットにおける4-miRNA診断モデルの性能を示し、
図3AはROC解析を、
図3Bは4-miRNAモデルの正規化診断指標の分布を示す。グラフに示されたパーセンテージは、各癌種の感度と非癌対照の特異度である;
【
図4】
図4Aおよび4Bは、肺癌データセットにおけるROC解析と、年齢および性別グループ間の正規化診断指数の分布を示す。
【発明を実施するための形態】
【0099】
本開示は、方法、キットおよびコンピュータ化システムを含むアプローチであって、対象から得られた生物学的試料から決定される、少なくとも1つのmiRNAからなるmiRNAバイオマーカーセットの発現プロファイルに基づいて、対象の1つまたは複数のヒト癌を正確かつ確実に検出することができるアプローチを提供する。
【0100】
本項の第一の側面では、約0.780以上のAUC値を有する診断精度を達成することができる検出方法が提供され、この方法は実質的に以下の3つの工程を含む:
【0101】
工程(1):miRNAバイオマーカーセットの発現プロファイルを決定する;
【0102】
工程(2):miRNAバイオマーカーセットの発現プロファイルに基づいて、生物学的試料の診断指標を算出する。診断指標は以下に基づいて算出される:
【数4】
ここで、nは、miRNAバイオマーカーセット中のmiRNAの総数であり、miRNA
iは、miRNAバイオマーカーセット中のi
thmiRNAの発現レベルであり、iは、0より大きくn以下の整数であり、t
iは、i
thmiRNAの重みである;および
【0103】
工程(3):算出された診断指標の値に基づいて、被験者を癌に罹患しているか否かに分類する。算出された診断指標が予め決められた閾値以上である場合、対象者は癌に罹患していると分類され、そうでない場合、対象者は癌に罹患していないと分類される。
【0104】
ここで、miRNAバイオマーカーセットは、hsa-miR-5100を含み、任意選択で、表1(実施例1参照)に列挙されたmiRNAのいずれか1つまたは組み合わせをさらに含み得る。異なる実施形態によれば、hsa-miR-5100に加えて、miRNAバイオマーカーセットは、表1の上位2~100のmiRNAからのmiRNA(複数可)をさらに含み得るか、またはその代わりに、上位2~50のmiRNAからのmiRNA(複数可)をさらに含み得るか、またはその代わりに、上位2~20のmiRNAからのmiRNA(複数可)をさらに含み得るか、またはその代わりに、上位2~4のmiRNAからのmiRNA(複数可)をさらに含み得る。
【0105】
好ましくは、miRNAバイオマーカーセットは、上位4つのmiRNA(すなわち、hsa-miR-5100、hsa-miR-1343-3p、hsa-miR-1290、及びhsa-miR-4787-3p)からなる。ここで、異なる実施形態に応じて、少なくとも本方法が特定の癌種を正確に検出できる異なるAUCカットオフレベル(例えば、0.780、0.850、0.950、0.990、および0.999)、または異なる感度特異性レベル(例えば、68%-99%、68%-99%、83%-99%、および99%-99%)が存在し得る。例えば、この方法は、AUC>0.999、および/または感度>99.0%、特異度>99.0%で肺癌および胃癌を正確に検出することができる。
【0106】
式(I)に基づく診断指数の算出方法は様々である。任意選択で、算出を非加重モデルまたは加重モデルに基づくことができる。後者の状況では、miRNAバイオマーカーセット内のmiRNAの重みを取得するために、任意で異なるモデル(例えば、リンマモデル、ロジスティック回帰モデルなど)を適用することができる。
【0107】
好ましくは、診断指標は、リンマモデルからの重みを使用する加重モデルを介して算出される。ここで、本方法の工程(3)において、予め決定された閾値を1110として設定することにより、本方法が0.95を超える特異度を有するようにすることができる;または任意に、予め決定された閾値を1200として設定することにより、本方法が0.99を超える特異度を有するようにすることができる。
【0108】
任意で、工程(2)で算出された診断指数はさらに正規化処理を受けることができ、工程(3)は、正規化された診断指数が予め設定されたカットポイントを下回らないか上回るかに基づいて癌分類を決定することができる。
【0109】
正規化処理の選択は任意であることに留意されたい。いくつかの実施形態によれば、正規化処理は数式に基づくことができる:
【数5】
ここで、param
locationとparam
scaleはそれぞれ、正規化された診断指数が第1のプリセット値以下、第2のプリセット値以下の範囲内に収まるように構成されたロケーションパラメータとスケールパラメータである。
【0110】
ここで、任意に、paramlocationおよびparamscaleをそれぞれ600および1000として選択することにより、正規化された診断指数を0から10の間にすることができる。このような正規化の下では、プリセットカットポイントを5.1として設定することにより、特異度>0.95を与えるか、または6.0として設定することにより、特異度>0.99を与えることができる。
【0111】
本方法において、生物学的試料は、有利には、血液試料、血清試料、血漿試料、尿試料、唾液試料、または喀痰試料などの液体生検試料であり得る。miRNAバイオマーカーセットの発現プロファイルの決定は、ノーザンブロッティング、マイクロアレイ分析、RNAシークエンシング、またはRNAインサイチュハイブリダイゼーションを含む様々なプローブベースのアプローチ、または逆転写PCR(RT-PCR)、定量的RT-PCR(qRT-PCR)、またはデジタルRT-PCRを含む様々な増幅依存性アプローチによって実現することができる。
【0112】
任意選択で、本方法は、被験体が癌に罹患していると診断されるか(被験体が以前癌に罹患していなかった場合)、または被験体が癌の再発に罹患しているか(被験体が以前癌を除去する治療を受けたか、または癌に罹患していなかった場合)を判定するように、被験体の評価を実施する工程をさらに含むことができる。このような目的のために、評価はさらに、身体検査、対象からの生検の病理学的検査、免疫組織化学検査、またはX線、コンピュータ断層撮影(CT)、超音波検査、磁気共鳴画像などを含む画像検査を含むことができる。
【0113】
さらに任意に、本方法は、対象が癌を有すると分類された場合に、手術、放射線療法、化学療法、ホルモン療法、標的療法、免疫療法またはそれらの組み合わせなどの治療レジメンを対象に投与する工程をさらに含むことができる。
【0114】
第2の態様では、本項の第1の態様で上述したような異なる実施形態による方法の様々な工程を具体的に実施するために採用できるキットがさらに提供される。
【0115】
キットは、miRNAバイオマーカーセットの発現プロファイルを決定するために使用することができる特定の物品(すなわち、miRNAバイオマーカーセット中の各miRNAを特異的に認識することができる1つ以上の核酸、および任意で1つ以上の増幅プライマーを含む構成要素(1))、および診断指標を算出するため、および癌分類のための特定の指示(すなわち、構成要素(2))を実質的に含む。
【0116】
miRNAバイオマーカーセットに含まれるmiRNAに応じて、成分(1)の核酸の各々は、(a)配列ID番号S:1-100、1-50、1-20もしくは1-4に記載のヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドを含むそのフラグメント;または(b)配列ID番号S:1-100、1-50、1-20もしくは1-4に記載のヌクレオチド配列、その誘導体、少なくとも80%の配列同一性を有するその変異体、または15個以上の連続するヌクレオチドからなるそのフラグメントに相補的なヌクレオチド配列からなるか、またはそれらからなるポリヌクレオチド。
【0117】
どのようなmiRNA成分がmiRNAバイオマーカーセットに含まれるか、診断指標に対して正規化を行うかどうか、どのように正規化を行うか、被験者が癌を有するか否かをどのように分類するか、生物学的試料にどのような試料を使用できるか、どのような検出精度レベルを達成するか、等を含む、以下の要素/特徴に関するキットの様々な異なる実施形態が存在し得る。これらの異なる実施形態についての具体的な詳細は、上述したような方法の様々な実施形態を参照することができ、本明細書では簡潔にするために省略する。
【0118】
このセクションの第3の側面では、コンピュータ化された解決策がさらに提供され、この解決策は、コンピュータ化された自動的な方法で、このセクションの第1の側面で上述したような方法の様々な工程を実施するために実質的に役立つ。
【0119】
このようなコンピュータによる解決策は、上述の方法の様々な工程(1)~(3)の実施が、プログラム指示からなるソフトウェアプログラムをコンピュータで実行することによって自動化されるような状況において適用することができ、高い効率性と大きな利便性といった利点をもたらす。
【0120】
具体的には、このようなコンピュータ化された解決策は、コンピュータ化されたシステムまたはコンピュータシステムを含むことができ、このシステムは、プロセッサ(すなわち、コントローラ)と、プロセッサに通信可能に結合されるコンピュータ読み取り可能な非一過性記憶媒体とを備える。コンピュータ読み取り可能な非一過性記憶媒体は、プロセッサによって実行可能なプログラム指示を記憶するように構成され、それによって、プロセッサに、上述したような方法における以下のような様々な異なる工程を実行させる:
【0121】
工程(1):miRNAバイオマーカーセットの発現プロファイルを決定する;
【0122】
工程(2):miRNAバイオマーカーセットの発現プロファイルに基づいて、式(I)に従って、生物学的試料の診断指標を算出する工程;および
【0123】
工程(3):算出された診断指標の値に基づいて、被験者を癌に罹患しているか否かを分類する。
【0124】
本明細書で使用される場合、「プロセッサ」は、「中央制御装置」または「中央演算装置(CPU)」と交換可能であると解釈され、シングルコアまたはマルチコアプロセッサ、または並列処理のための複数のプロセッサとみなすことができる。本明細書で使用する「非一過性」という用語は、電磁信号を伝搬しない有形のコンピュータ読み取り可能な記憶媒体を説明することを意図しているが、この語句によって包含される物理的なコンピュータ読み取り可能な記憶装置のタイプを他の方法で限定することを意図していない。例としては、電子、磁気、または光媒体(例えば、ディスクまたはCD/DVD-ROM)、または不揮発性メモリストレージ(例えば、「フラッシュ」メモリ)などの任意の有形または非一過性記憶媒体またはメモリ媒体を挙げることができる。
【0125】
図5に示されるように、システム100は、プロセッサ10およびコンピュータ読み取り可能な非一過性記憶媒体20に加えて、バス30、メモリ40、I/Oインターフェース50、および通信インターフェース60をさらに含むことができる。プロセッサ10、記憶媒体20、メモリ40、I/Oインターフェース50、および通信インターフェース60はすべて、バス30を介して互いに通信可能に結合される。
【0126】
記憶媒体20は、プロセッサ10によって実行されると、プロセッサ10に上述の方法の工程(1)~(3)を実行させるコンピュータ実行可能なプログラム指示を記憶する。メモリ40は、記憶媒体20から取得されたプログラム指示を一時的に記憶するように構成され、プロセッサ10は、メモリ40に一時的に記憶されたプログラム指示を実行するように構成される。入出力インターフェース50は、システム100とユーザとの間の入出力を可能にし、システム100の制御を実現する。通信インターフェース60は、システム100を他のコンピューティングデバイスと通信可能に接続し、データを交換することを可能にする。これらのコンピュータハードウェア構成要素は、ローカルに配置することも、イントラネット、インターネット、クラウドなどのネットワークを介して遠隔配置することもできることに留意されたい。
【0127】
以下では、本開示の様々な側面において上述したような発明を説明するために、1つの実施例を提供する。
【実施例1】
【0128】
実施例1
この例では、標準化されたマイクロアレイプラットフォームに基づく4つの大規模なmiRNAマイクロアレイデータセットを利用することで、MCEDに対する循環細胞フリーmiRNAに基づく診断シグネチャーの開発と検証を行っている。
【0129】
2.材料と方法
2.1.研究デザイン
3604人の癌患者と3932人の非癌対照者を含む、合計7536人のユニークな参加者を含む4つのマイクロアレイデータセットが今回の解析に含まれ、これらはすべて、標準化されたマイクロアレイプラットフォームを使用して、13の癌種にわたる5万人以上の参加者の血清miRNAの特徴を明らかにするために設計された、日本の全国研究プロジェクト「体液中miRNA検出のための開発および診断技術」に由来する研究から得られた(Asakura et al.2020、Yokoi et al.2018、Usuba et al.2019、Yamamoto et al.2020)。この4つのデータセットはもともと、それぞれ肺癌(GSE137140)、卵巣癌(GSE106817)、肝臓癌(GSE113740)、膀胱癌(GSE113486)の診断シグネチャーを開発するために集められた。
【0130】
肺癌データセットは、単一の癌種(n=1566)および非癌対照(n=2178)において最大の試料サイズを有する。オリジナルの肺癌研究では、肺癌の検出に対して高い感度と特異性を持つ2-miRNA診断モデル(本研究では「オリジナルの2-miRNAモデル」と呼ぶ)が確立された(Asakura et al.)本研究の目的は、当初、このデータセットを用いて、肺癌検出においてオリジナルの2-miRNAモデルを上回る可能性のある新しい診断モデルを開発し、検証することに設定された。他の癌種のデータセットが同定されたので、新しいモデルは他の癌を検出する性能について評価された。
【0131】
2.2.参加者と血清試料
血清試料の採取については、原著論文に既述されている(朝倉ら、2020;横井ら、2018;薄葉ら、2019、山本ら、2020)。簡単に説明すると、2008年から2016年の間に国立癌研究センター中央病院(NCCH)に紹介または入院した癌患者から、外科手術前に血清試料を採取し、4℃で1週間保存した後、さらに使用するまで-20℃で保存した。血清採取前に術前化学療法および放射線療法を受けた癌患者は除外した。癌既往歴がなく、過去3ヵ月間に入院歴のない非癌対照の血清検体は、3つの医療機関の外来で定期的な血液検査とともに採取された:NCCH、国立長寿医療研究センター(NCGG)バイオバンク、横浜みのるクリニック(YMC)。NCCHから採取した血清は癌患者と同様に保存し、NCGGとYMCから採取した血清は使用まで-80℃で保存した。本研究は、NCCHの施設審査委員会、NCGGの倫理・利益相反委員会、および医療法人新東会YMCの研究倫理委員会の承認を得た。各参加者から書面によるインフォームド・コンセントを得た。
【0132】
2.3.miRNAマイクロアレイ発現解析
マイクロアレイ解析の詳細は、原著論文(Asakura et al.)簡単に説明すると、300μLの血清から全RNAを抽出し、3DGene(登録商標)miRNA Labeling kitで標識し、miRBaseリリース21に登録されている2588のmiRNA配列を調査するように設計された3D-Gene(登録商標)Human miRNA Oligo Chip(東レ、神奈川、日本)にハイブリダイズした。以下の低品質試料は除外した:ネガティブコントロールプローブの変動係数>0.15;および3D-Gene(登録商標)Scannerで「不均一なスポットイメージ」として識別されたフラグ付きプローブの数>10。miRNAの存在は、シグナル強度がネガティブコントロールシグナルの平均値+標準偏差の2倍よりも大きい場合に決定され、ネガティブコントロールシグナルを使用する際には、ランク付けされたシグナル強度の上位5%と下位5%が除去された。バックグラウンドサブトラクションは、miRNAシグナルからネガティブコントロールシグナルの平均シグナル(シグナル強度でランク付けされた上位5%と下位5%を除去した後)を差し引くことで行った。マイクロアレイ間の正規化は、事前に選択した3つの内部コントロールmiRNA(miR-149-3p、miR-2861、miR-4463)に従ってキャリブレーションすることで達成した。
【0133】
2.4.診断モデルの開発
肺癌データセットの患者は、原著(
図1A)と同じ発見セットと検証セットに分けられた(Asakura et al.2020)。その理由は、(1)発見セットは、年齢、性別、喫煙歴に関して、癌と非癌の間でバランスが取れるように原著者によって選択された;(2)発見セットの非癌患者の50%は、癌患者と同じ血清保存条件を持つNCCHの患者であり、miRNA候補の選択における潜在的なバイアスを最小限に抑えた;(3)同じ発見セットと検証セットを用いることで、新しい診断モデルとオリジナルの2-miRNAモデルの直接的な性能比較が可能になるからである。診断モデルは肺癌発見セットから開発されたため、肺癌検証セットで検証した後、モデル開発には使用されなかった他の癌種を組み合わせたデータセットで、多癌診断モデルとしての能力をさらに検証した。
【0134】
発見セットにおいてLinear Model for Microarray Data (limma) (Ritchie et al. 2015)を実施し、肺癌対非癌間のmiRNA発現差の統計的有意性を評価した。Receiver's Operating Characteristics(ROC)曲線解析の曲線下面積(AUC)に基づき、最適な診断モデルのための最適なmiRNAの数を決定するために、発見セットにおいて10倍のクロスバリデーションを行った。診断指標は、miRNA発現量の線形和をlimma統計で重み付けしたものとして算出した。診断指標のカットポイントは、診断モデルがリスクのある一般人のスクリーニング検査として使用される可能性があるため、偽陽性を最小化するために、発見セットの非癌対照の誤分類がないように選択した。
【0135】
2.5.統計分析
癌と非癌を識別する診断能は、ROC曲線解析のAUC、感度、特異度によって決定した。2つのROC曲線のAUCの比較は、pROCパッケージのブートストラップ法を用いたroc.test関数で行った。肺癌臨床サブセットの対になった手術前と手術後の検体の感度の比較は、McNemar検定で行った。limma解析は、Bioconductorパッケージのlimma(The Bioconductor Open Source Software For Bioinformatics(2020年8月27日アクセス))を用いて行った。すべての統計解析は、Rバージョン4.0.5(The R Project for Statistical Computing(2020年7月15日アクセス))を用いて行った。
【0136】
3.結果
3.1.参加者とデータセット
肺癌データセットには、1566人の肺癌患者と2178人の非癌対照者が含まれていた(
図1A)(Asakura et al.)卵巣癌データセットには、卵巣癌患者333人と非癌対照者2759人のほか、乳癌、大腸癌、食道癌、胃癌、肝癌、肺癌、膵癌、肉腫の患者からなる(
図1B)(Yokoi et al.2018)。肝臓癌と膀胱癌のデータセットには、胆道癌、乳癌、大腸癌、食道癌、胃癌、神経膠腫、肺癌、卵巣癌、膵臓癌、前立腺癌、肉腫の患者に加えて、それぞれ肝臓癌345人/非癌1033人、膀胱癌392人/非癌100人が含まれていた(
図1B)(Usuba et al.2019、Yamamoto et al.2020)。肺癌データセットはそのままにして、他の3つのデータセット内の冗長な試料のうち、データセット間または肺癌データセット内の試料との相関が0.99より大きいものを削除した。次に、卵巣癌、肝臓癌、膀胱癌のデータセットから得られた固有の試料を、12種類の癌種にわたる2038人の癌患者と1754人の非癌対照者を含む、合計3792試料を含む単一の非肺癌データセットに統合した(
図1B)。
【0137】
肺癌データセットは、元の研究と同じ発見セット(n=416)と検証セット(n=3328)に分けられた(
図1A)。発見セットには、年齢、性別、喫煙の有無でマッチさせた208人の肺癌患者と208人の非癌対照が含まれた(Asakura et al.2020)。検証セットには、1358人の肺癌患者と1970人の非癌対照者が含まれた。肺癌患者の内訳は、男性57%、元または現在喫煙者62%、腺癌78%、扁平上皮癌14%、病期I 72%、病期II 15%、病期III 13%であった(
図1C)。
【0138】
392人の膀胱癌患者は平均年齢68歳、72%が男性、5%が転移、12%がリンパ節転移陽性、77%がT2以下、80%が高悪性度であった(
図1C)。卵巣癌患者333人は平均年齢57歳、I期25%、II期10%、組織型は漿液性55%、明細胞19%、子宮内膜症13%であった(
図1C)。肝臓癌患者348人は平均年齢68歳、78%が男性、37%がI期、33%がII期であった(
図1C)。その他の癌に関する詳細な人口統計学的情報および腫瘍の特徴は、元の研究からは提供されていない。
【表1】
【0139】
3.2.診断モデルの開発
診断モデルの開発は、208人の肺癌患者と208人の非癌対照者を含む肺癌データセットのディスカバリーセットで行われた(
図1A)。肺癌患者と非癌対照者間のmiRNA発現差の統計的有意性を評価するためにlimma解析が用いられた。上位100の発現差のあるmiRNAを表1に示した。10重クロスバリデーションにより、調整p値でランク付けされた上位4つのmiRNA(hsa-miR-5100、hsa-miR-1343-3p、hsa-miR-1290、hsa-miR-4787-3p)を用いた診断モデルが、ROC曲線解析において最良のAUCをもたらすことが示された(
図2A)。4つのmiRNA発現レベルの加重和で算出され、0から10の範囲で正規化された診断指標は、ほぼ完璧なAUC値0.999(
図2B)を示し、元の論文(Asakura et al.2020)の2-miRNAモデルのAUC値0.993(p=0.16)よりも数値的に優れていた。6というカットポイントは、偽陽性を最小化するために、発見セット中の非癌対照の誤分類がないように選択され、その結果、感度98%、特異度100%(
図2C)となり、オリジナルの2-miRNAモデル(Asakura et al.2020)では感度、特異度ともに99%であった。
【0140】
3.3.肺癌検証セットにおける診断モデルの検証
4-miRNAモデルの性能は、1358人の肺癌患者と1970人の非癌対照を含む肺癌検証セット(n=3328)で評価された。4-miRNAモデルは0.999のAUCを達成し(
図2D)、オリジナルの2-miRNAモデル(Asakura et al.2020)のAUC0.996より有意に良好であった(P=0.01)。オリジナルの2-miRNAモデル(Asakura et al.また、オリジナルの2-miRNAモデルが感度95%、特異度99%であったのに対し(Asakura et al.2020)、新しいモデルは感度、特異度ともに99%であった(
図2E)。
【0141】
さらに、4-miRNAモデルの性能は、臨床病期、T期、N期、M期、組織学によって定義された検証セットの臨床サブセットで評価された。すべての臨床サブセットにおいて、4-miRNAモデルは約99%以上の感度を示し(
図2G、表2)、これはオリジナルの2-miRNAモデルの感度よりも優れていた(表2)。特に早期の肺癌、例えばステージIの肺癌患者とT1の腫瘍患者の両方に対して、4-miRNAモデルは99%以上の感度を示し(
図2G、表2)、2-miRNAモデルの感度はそれぞれ95.4%と95.9%であった(表2)。一般的な組織型である腺癌と扁平上皮癌においても、4-miRNAモデルは、オリジナルの2-miRNAモデルと比較して、優れた性能を示した(
図2G、表2)(表2)。
【表2】
【0142】
対になった血清試料(手術前と手術後)のデータも180人の患者について入手可能であった。術後血清試料に対する4-miRNAモデルの診断指標は、診断指標カットポイント以下の正常レベルまで低下した(
図2F)。
【0143】
3.4.追加癌種における診断モデルの適用
4-miRNAモデルの性能は、12種類の癌患者2038人と非癌対照者1754人を含む、3792人の患者の複合データセットでさらに評価された。膀胱癌、肝臓癌、卵巣癌の試料サイズが最も大きく、それぞれ300人以上の患者がいた。4-miRNAモデルが機能しなかった乳癌を除き、4-miRNAモデルは、胆道癌、膀胱癌、大腸癌、食道癌、胃癌、神経膠腫、肝臓癌、卵巣癌、膵臓癌、前立腺癌でAUC>0.95、肉腫でAUC0.876と、非常に強力なパフォーマンスを示した(
図3A)。したがって、4-miRNAモデルは、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫、肝臓癌、膵臓癌、前立腺癌で83.2~100%の高い感度を示し、卵巣癌と肉腫ではそれぞれ68.2%と72.0%の妥当な感度を示した(
図3B)。さらに、肺癌データセットに含まれるものとは独立した1754の非癌対照に対して、4-miRNAモデルは99.3%の高い特異性を維持した。
【0144】
特異度を95%に下げる別の診断指標カットポイントを5.1としてさらに感度分析を行った結果、11の癌種すべてで感度が上昇し、肉腫の感度76.5%を除く11癌種で90%以上の感度を示した(表3)。
【0145】
【0146】
4.議論
この例では、複数の癌を早期発見するための4-miRNA診断モデルの開発と性能評価について報告する。3396人の癌患者と3724人の非癌患者を含む7120人の大規模な独立した検証セットにおいて、4-miRNAモデルは12種類の癌(胆道、膀胱、結腸直腸、食道、胃、神経膠腫、ライブ、肺、卵巣、膵臓癌、前立腺癌、肉腫)の12種類の癌を同時に高い感度(10種類の癌では80~100%、2種類の癌では~70%)で検出することができ、その一方で、リスクのある一般集団においてスクリーニング検査が有用であるために通常必要とされる99%という非常に高い特異性を維持することができる。我々の知る限り、これは循環遊離miRNAに基づく最初のMCED診断モデルである。興味深いことに、肺癌患者の診断指数は、腫瘍切除後、非癌コントロールのレベルまで低下した。
【0147】
循環核酸および/またはタンパク質を分析する非侵襲的スクリーニング検査は、MCEDキャンペーンの原動力となっており、最近大きな進展が見られている。MCEDのために開発されている検査のほぼ全ては、循環腫瘍DNAの評価に基づくものであり、そのほとんどが次世代バイサルファイトシーケンス技術を利用して、これらの腫瘍DNAのメチル化パターンを評価している(Klein et al.2021;Cohen et al.2018;Chen et al.2020;Cristiano et al.2019)。このような2つの検査、GalleriとPanSeerは、メチル化に基づくエピジェネティックシグネチャーとして開発されている(Klein et al.2021;Chen2020)。循環無細胞ゲノムアトラス(CCGA)の症例対照研究の解析において、Galleriは10万を超えるメチル化領域を調査し、事前に特定した12の癌(肛門、膀胱、結腸/直腸、食道、頭頸部、肝臓/胆管、肺、リンパ腫、卵巣、膵臓、形質細胞新生物、胃)に対する感度はステージI-IIIの患者(n=874)では67.6%で、ステージIVの癌を含めると76.3%(n=1346)に増加し、一方1254人の非癌対照に基づく特異度は99.3%に達した(Klein et al.2021)。一方、477のメチル化ゲノム領域のみを対象としたPanSeerアッセイは、縦断的癌モニタリング研究に登録された無症候性個人グループの血漿試料をレトロスペクティブに解析し、採血から4年以内に5つの癌(胃癌、食道癌、大腸癌、肺癌、肝臓癌)のいずれかと後に診断された98人(診断前試料)において95%という高い感度を示したが、207人の健常対照者では96%と特異度は低かった(Chen et al.2020)。しかし、PanSeerで不可解だったのは、診断後の血漿113検体で評価したところ、この検査は88%という低い感度しか示さなかったことである(Chen et al.2020)。次世代シーケンサーによる無細胞DNAフラグメント化パターンのゲノムワイド解析に基づくDELFIと呼ばれる別の検査では、7つの癌(n=208、乳癌、胆管癌、大腸癌、胃癌、肺癌、卵巣癌、膵臓癌)で感度73%、特異度98%(n=215)を達成した(Cristiano et al.2019)。最後に、9つのタンパク質バイオマーカーの測定と循環無細胞DNA中の16遺伝子の変異検出を組み合わせた検査であるCancerSEEKは、8つの癌(n=1005、卵巣、肝臓、胃、膵臓、食道、大腸、肺、乳房)において、10倍のクロスバリデーションと中央値70%の感度(n=1005)、99%の特異度(n=812)を示した(Cohen et al.2018)。まとめると、現在開発中のMCED検査は、99%という高い特異性が義務付けられた場合、一般的に60~70%の範囲の感度を示した。これらの検査と比較すると、我々の診断モデルは4つのmiRNAのみと非常にシンプルでありながら、7000人以上の大規模コホートで研究された12種類の癌のうち10種類について、80~100%の範囲で実質的に高い感度を示した。シンプルな診断モデルは、コストが大幅に低いだけでなく、RT-PCRのような分散型検査が可能な従来の技術プラットフォームを使って体外診断(IVD)検査に発展させることが可能であり、これは通常ラボラトリー開発検査(LDT)として実施されるNGSベースの検査よりも有利であることは注目に値する。これらの特性は、MCED検査が高リスクまたはリスクのある一般大衆を対象とすることを意図しているため、MCED検査の幅広い採用とコンプライアンスを推進する上で重要である。
【0148】
本研究で検討された13種類の癌の中で、乳癌だけが4-miRNA診断モデルでうまく検出されなかった。この不調の理由は明らかではないが、乳癌ではmiRNAの発現プロファイルが異なること、あるいはmiRNAの血中への流出パターンが異なることを示しているのかもしれない。興味深いことに、GalleriとCancerSEEKも、乳癌ではそれぞれ30.5%と33%という低い感度を示した(Klein et al.2021;Cohen et al.2018)とはいえ、マンモグラフィ検診は早期乳癌の発見と乳癌死亡率の減少に非常に有効であるため(Nelson et al.2016)、乳癌における性能の低さは臨床的に重要ではないかもしれない。
【0149】
これらのMCED検査の最終的な診断性能と臨床的価値は、無症状の人を対象とした大規模な前向きスクリーニング試験で確立されなければならない。10,000人以上の無症候性女性を登録したDETECT-A試験では、10種類の癌から96の癌が同定され、CancerSEEKの感度は27%で、標準的なスクリーニング検査で検出された癌を加えると52%に上昇した(Lennon et al.)。さらに、CancerSEEKをPET-CTスキャンと組み合わせると、特異度は99.6%、陽性適中率(PPV)は40.6%となった。一方、Galleri検査の前向き研究PATHFINDERの4033人の中間解析では、40人が陽性で、そのうち18人が癌と確定され、PPVは45%であった(Beerら、2021年)。我々の4-miRNA診断モデルでは、癌罹患率1%、保守的な平均感度85、特異度99.3%と仮定すると、無症状の人をスクリーニングする場合、PPVは55%となる。これは、USPSTFが推奨する4つの単一癌スクリーニングのPPV(3.7~4.4%)よりも有意に高い(Lehman et al.2017;U.S.Food and Drug Administration Cologuard Summary of Safety and Effectiveness Data、2014;およびNational Lung Screening Trial Research Team、2013)。
【0150】
5.結論
要約すると、我々の研究は、複数の癌を検出するシンプルで手頃な価格の血液ベースの診断検査の概念実証データを提供した。本研究で検出された12種類の癌は、2021年の米国における推定癌死亡者数の約38万人(~62%)を占める。
【0151】
上記で提供された実施例およびデータは、miRNAバイオマーカーセット、特に4-miRNAバイオマーカーセットが非常に高い精度で癌の検出において優れた力を示した12種類の癌のみを対象としているが、miRNAバイオマーカーセットを適用できる癌の種類は限定されないことに留意されたい。従って、本開示の範囲は、他の癌種もカバーするものと解釈される。本開示で提供されるモデルが、研究された13の癌種のうち12の癌種で機能するという事実は、本方法が、すべてではないにしても、ほとんどの癌種に適用可能であることを強く示唆している。
【0152】
参考文献
Ritchie, ME;et al.(2015).limma powers differential expression analyses for RNA-sequencing and microarray studies.Nucleic Acids Research 43(7),e47.
Venables,WN and Ripley, BD(2002)Modern Applied Statistics with S.Fourth edition.Springer.
Tibshirani, R(1996)."Regression Shrinkage and Selection via the lasso".Journal of the Royal Statistical Society.Series B (methodological).Wiley.58(1):267-88.
Hoerl,AE and Kennard,RW(1970)."Ridge Regression: Biased Estimation for Nonorthogonal problems".Technometrics.12(1):55-67.
Ripley,BD(1996)Pattern Recognition and Neural Networks.Cambridge University Press.
Kozomara,A and Griffiths-Jones,S(2010)."MiRBase:integrating microRNA annotation and deep-sequencing data".Nucleic Acids Research.39(Database issue):D152-7.
miRBase:the microRNA database:http://www.mirbase.org/
The Bioconductor Open Source Software For Bioinformatics:http://www.bioconductor.org
The R Project for Statistical Computing:https://www.r-project.org/
Asakura,K;et al.(2020).A MiRNA-Based Diagnostic Model Predicts Resectable Lung Cancer in Humans with High Accuracy.Commun.Biol.3,134.
Yokoi, A; et al.(2018).Integrated Extracellular MicroRNA Profiling for Ovarian Cancer Screening.Nat.Commun.9,4319.
Usuba,W;et al.(2019).Circulating MiRNA Panels for Specific and Early Detection in Bladder Cancer.Cancer Sci.110,408-419.
Yamamoto,Y;et al.(2020). Highly Sensitive Circulating MicroRNA Panel for Accurate Detection of Hepatocellular Carcinoma in Patients With Liver Disease.Hepatol.Commun.4,284-297.
Klein,EA;et al.(2021).Clinical Validation of a Targeted Methylation-Based Multi-Cancer Early Detection Test Using an Independent Validation Set.Ann.Oncol.:Off.J.Eur.Soc.Med.Oncol.32,1167-1177.
Cohen,JD;et al.(2018).Detection and Localization of Surgically Resectable Cancers with a Multi-Analyte Blood Test.Science.359,926-930.
Chen,X;et al.(2020).Non-Invasive Early Detection of Cancer Four Years before Conventional Diagnosis Using a Blood Test.Nat.Commun.11,3475.
Cristiano,S;et al.(2019).Genome-Wide Cell-Free DNA Fragmentation in Patients with Cancer.Nature.570,385-389.
Nelson,HD;et al.(2016).Effectiveness of Breast Cancer Screening:Systematic Review and Meta-Analysis to Update the 2009 U.S.Preventive Services Task Force Recommendation.Ann.Intern.Med.164,244-255.
Lennon,AM;et al.(2020).Feasibility of Blood Testing Combined with PET-CT to Screen for Cancer and Guide Intervention.Science.369,eabb9601.
Beer,T;et al.(2021).Interim Results of PATHFINDER,a Clinical Use Study Using a Methylation-Based Multi-Cancer Early Detection Test.J.Clin.Oncol.39,3010.
Lehman,CD;et al.(2017).National Performance Benchmarks for Modern Screening Digital Mammography:Update from the Breast Cancer Surveillance Consortium. Radiology.283,49-58.
U.S.Food and Drug Administration Cologuard Summary of Safety and Effectiveness Data(Premarket Approval Application P130017);2014.
National Lung Screening Trial Research Team;Church,TR;et al.(2013).Results of Initial Low-Dose Computed Tomographic Screening for Lung Cancer.New Engl.J.Med.2013,368,1980-1991.
Nielsen,PE;et al.(1991).Sequence-selective recognition of DNA by strand displacement with a thymine-substituted polyamide.Science.254,p.1497-500.
Obika,S;et al.(1998).Stability and structural features of the duplexes containing nucleoside analogues with a fixed N-type conformation,2'-O,4'-C-methyleneribonucleosides.Tetrahedron Lett..39,p.5401-5404.
Green,MR and Sambrook,J.(2012).Molecular Cloning:A Laboratory Manual,4th Ed.,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.
Sambrook,J;et al.(1989).Molecular Cloning:A Laboratory Manual,New York:Cold Spring Harbor Press.
Zhang,Z;et al.(2000).A greedy algorithm for aligning DNA sequences.J.Comput.Biol.7,p.203-214.
Altschul,SF;et al.(1990).Basic local alignment search tool.Journal of Molecular Biology, Vol.215,p.403-410.
Pearson, WR et al.(1988).Improved tools for biological sequence comparison.Proc.Natl.Acad.Sci.U.S.A.,Vol.85,p.2444-2448.
Yun,SJ;et al.(2012).Cell-free microRNAs in urine as diagnostic and prognostic biomarkers of bladder cancer.Int J Oncol.2012 Nov;41(5):1871-8.
Park,NJ;et al.(2009).Salivary microRNA: discovery,characterization,and clinical utility for oral cancer detection.Clin Cancer Res.2009 Sep 1;15(17):5473-7.
【配列表】
【国際調査報告】