特表2024-523848 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ミロンコルダイアグノスティックス、インク．の特許一覧

特表2024-523848癌検出方法、キットおよびシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
1C
2A-2F
2G
3A
3B
4A
4B
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-07-02

(54)【発明の名称】癌検出方法、キットおよびシステム

(51)【国際特許分類】

C12Q 1/6851 20180101AFI20240625BHJP

C12Q 1/6869 20180101ALI20240625BHJP

C12Q 1/6837 20180101ALI20240625BHJP

C12Q 1/6883 20180101ALI20240625BHJP

C12M 1/34 20060101ALI20240625BHJP

【ＦＩ】

C12Q1/6851 Z ZNA

C12Q1/6869 Z

C12Q1/6837 Z

C12Q1/6883 Z

C12M1/34 Z

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2023576034

(86)(22)【出願日】2022-06-07

(85)【翻訳文提出日】2024-01-29

(86)【国際出願番号】 US2022032423

(87)【国際公開番号】W WO2022261039

(87)【国際公開日】2022-12-15

(31)【優先権主張番号】63/208,506

(32)【優先日】2021-06-09

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】523461999

【氏名又は名称】ミロンコルダイアグノスティックス、インク．

(74)【代理人】

【識別番号】100104411

【弁理士】

【氏名又は名称】矢口太郎

(72)【発明者】

【氏名】チャン、アンドリュー

(72)【発明者】

【氏名】フー、ハイ

【テーマコード（参考）】

4B029

4B063

【Ｆターム（参考）】

4B029AA07

4B029FA15

4B063QA19

4B063QQ03

4B063QQ52

4B063QR08

4B063QR32

4B063QR62

4B063QS25

4B063QS34

4B063QX02

(57)【要約】

【要約】
【解決手段】本明細書に提供されるのは、１つまたは複数のヒト癌を高精度で検出することができる方法、キットおよびシステムである。被験体からの液体生検試料に基づいて、１つまたはそれ以上のｍｉＲＮＡからなるｍｉＲＮＡバイオマーカーセットの発現プロファイルが決定された後、診断指標が算出され、それに基づいて被験体が癌であるか否かが分類される。４－ｍｉＲＮＡバイオマーカーモデルは、９９．３％の特異度を維持しながら、肺癌および胃癌では９９．０～１００％、胆道癌、膀胱癌、大腸癌、食道癌、神経膠腫、肝臓癌、膵臓癌、前立腺癌では８３．０～９９．０％、卵巣癌および肉腫では６８．２～７２．０％という極めて高い感度を示す。
【選択図】なし

【特許請求の範囲】

【請求項1】

被験者から得られた生物学的試料から癌を検出する方法であって、
前記生物学的試料から少なくとも１つのｍｉＲＮＡからなるｍｉＲＮＡバイオマーカーセットの発現プロファイルを決定する工程であって、前記ｍｉＲＮＡバイオマーカーセットはｈｓａ－ｍｉＲ－５１００を含む、前記決定する工程と、
前記ｍｉＲＮＡバイオマーカーセットの前記発現プロファイルに基づいて、前記生物学的試料の診断指標を算出する工程であって、前記診断指標は、数式

【数1】

に基づいて算出され、
ここで、ｎは、前記ｍｉＲＮＡバイオマーカーセット中の前記少なくとも１つのｍｉＲＮＡの総数であり、前記ｍｉＲＮＡ_ｉは、前記ｍｉＲＮＡバイオマーカーセット中のｉ^ｔｈｍｉＲＮＡの発現レベルであり、ｉは０より大きく、ｎより小さいかそれと同等の整数であり、ｔ_ｉは、ｉ^ｔｈｍｉＲＮＡの重みである、前記算出する工程と、および
前記算出された診断指数に基づいて、前記被験者が癌を有するか否かに分類する工程であって、前記算出された診断指数が予め決められた閾値以上である場合に、前記被験者が癌を有すると分類し、そうでない場合には前記被験者が癌を有さないと分類する、前記分類する工程と、を含み、
前記方法は、約０．７８０を超えるＡＵＣ値を持つ診断精度を達成することができる、方法。

【請求項2】

請求項１に記載の方法において、前記ｍｉＲＮＡバイオマーカーセットは、さらに、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ、ｈｓａ－ｍｉＲ－６８７７－５ｐ、ｈｓａ－ｍｉＲ－１７－３ｐ、ｈｓａ－ｍｉＲ－６７６５－５ｐ、ｈｓａ－ｍｉＲ－１２６８ｂ、ｈｓａ－ｍｉＲ－４２５８、ｈｓａ－ｍｉＲ－４５１ａ、ｈｓａ－ｍｉＲ－１２２８－５ｐ、ｈｓａ－ｍｉＲ－８０７３、ｈｓａ－ｍｉＲ－４４５４、ｈｓａ－ｍｉＲ－１８７－５ｐ、ｈｓａ－ｍｉＲ－４２８６、ｈｓａ－ｍｉＲ－６７４６－５ｐ、ｈｓａ－ｍｉＲ－６６３ｂ、ｈｓａ－ｍｉＲ－６０７５、ｈｓａ－ｍｉＲ－５００１－５ｐ、ｈｓａ－ｍｉＲ－６７８９－５ｐ、ｈｓａ－ｍｉＲ－４５１３、ｈｓａ－ｍｉＲ－３１９２－５ｐ、ｈｓａ－ｍｉＲ－８０６０、ｈｓａ－ｍｉＲ－６６８－５ｐ、ｈｓａ－ｍｉＲ－１２６８ａ、ｈｓａ－ｍｉＲ－１２７３ｇ－３ｐ、ｈｓａ－ｍｉＲ－４７０６、ｈｓａ－ｍｉＲ－１２４－３ｐ、ｈｓａ－ｍｉＲ－１２６０ｂ、ｈｓａ－ｍｉＲ－４７４０－５ｐ、ｈｓａ－ｍｉＲ－３２０ｂ、ｈｓａ－ｍｉＲ－７９７７、ｈｓａ－ｍｉＲ－２９ｂ－３ｐ、ｈｓａ－ｍｉＲ－４７０８－３ｐ、ｈｓａ－ｍｉＲ－４５２５、ｈｓａ－ｍｉＲ－９２ｂ－３ｐ、ｈｓａ－ｍｉＲ－４２５７、ｈｓａ－ｍｉＲ－４７２７－３ｐ、ｈｓａ－ｍｉＲ－９２ａ－３ｐ、ｈｓａ－ｍｉＲ－６６３ａ、ｈｓａ－ｍｉＲ－６７８７－５ｐ、ｈｓａ－ｍｉＲ－３１３１、ｈｓａ－ｍｉＲ－６８０２－５ｐ、ｈｓａ－ｍｉＲ－６５４－５ｐ、ｈｓａ－ｍｉＲ－６５１１ｂ－５ｐ、ｈｓａ－ｍｉＲ－２９ｂ－１－５ｐ、ｈｓａ－ｍｉＲ－４４１７、ｈｓａ－ｍｉＲ－４７３６、ｈｓａ－ｍｉＲ－６８４０－３ｐ、ｈｓａ－ｍｉＲ－４７１０、ｈｓａ－ｍｉＲ－４６３５、ｈｓａ－ｍｉＲ－２９６－３ｐ、ｈｓａ－ｍｉＲ－１１９９－５ｐ、ｈｓａ－ｍｉＲ－７９７５、ｈｓａ－ｍｉＲ－４４８０、ｈｓａ－ｍｉＲ－３６４８、ｈｓａ－ｍｉＲ－３７１ａ－５ｐ、ｈｓａ－ｍｉＲ－４７７１、ｈｓａ－ｍｉＲ－６７１７－５ｐ、ｈｓａ－ｍｉＲ－１２５４、ｈｓａ－ｍｉＲ－１２４６、ｈｓａ－ｍｉＲ－２３ｂ－３ｐ、ｈｓａ－ｍｉＲ－３２０ａ、ｈｓａ－ｍｉＲ－４６８７－５ｐ、ｈｓａ－ｍｉＲ－１９１－５ｐ、ｈｓａ－ｍｉＲ－３２０ｃ、ｈｓａ－ｍｉＲ－６１３１、ｈｓａ－ｍｉＲ－４５１５、ｈｓａ－ｍｉＲ－３４２－５ｐ、ｈｓａ－ｍｉＲ－４７１８、ｈｓａ－ｍｉＲ－２３ａ－３ｐ、ｈｓａ－ｍｉＲ－４４５５、ｈｓａ－ｍｉＲ－２１１－３ｐ、ｈｓａ－ｍｉＲ－３１２２、ｈｓａ－ｍｉＲ－１０３ａ－３ｐ、ｈｓａ－ｍｉＲ－４４２９、ｈｓａ－ｍｉＲ－９２０、ｈｓａ－ｍｉＲ－３１９４－３ｐ、ｈｓａ－ｍｉＲ－４７５４、ｈｓａ－ｍｉＲ－１２３８－５ｐ、ｈｓａ－ｍｉＲ－３１９１－３ｐ、ｈｓａ－ｍｉＲ－４７５５－３ｐ、ｈｓａ－ｍｉＲ－３６８８－５ｐ、ｈｓａ－ｍｉＲ－４５２９－５ｐ、ｈｓａ－ｍｉＲ－６８６１－５ｐ、ｈｓａ－ｍｉＲ－１４６９、ｈｓａ－ｍｉＲ－６１９－５ｐ、ｈｓａ－ｍｉＲ－４４４８、ｈｓａ－ｍｉＲ－４６５８、ｈｓａ－ｍｉＲ－２２－３ｐ、ｈｓａ－ｍｉＲ－４７７６－５ｐ、ｈｓａ－ｍｉＲ－３２０ｅ、ｈｓａ－ｍｉＲ－１２２５－３ｐ、ｈｓａ－ｍｉＲ－６８７５－５ｐ、ｈｓａ－ｍｉＲ－４５３４、ｈｓａ－ｍｉＲ－４６５２－５ｐ、ｈｓａ－ｍｉＲ－６４８、ｈｓａ－ｍｉＲ－４２５９、ｈｓａ－ｍｉＲ－１０７、およびｈｓａ－ｍｉＲ－６５０の１つまたはそれ以上を含む、方法。

【請求項3】

請求項１に記載の方法において、前記ｍｉＲＮＡバイオマーカーセットが、さらに、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ、ｈｓａ－ｍｉＲ－６８７７－５ｐ、ｈｓａ－ｍｉＲ－１７－３ｐ、ｈｓａ－ｍｉＲ－６７６５－５ｐ、ｈｓａ－ｍｉＲ－１２６８ｂ、ｈｓａ－ｍｉＲ－４２５８、ｈｓａ－ｍｉＲ－４５１ａ、ｈｓａ－ｍｉＲ－１２２８－５ｐ、ｈｓａ－ｍｉＲ－８０７３、ｈｓａ－ｍｉＲ－４４５４、ｈｓａ－ｍｉＲ－１８７－５ｐ、ｈｓａ－ｍｉＲ－４２８６、ｈｓａ－ｍｉＲ－６７４６－５ｐ、ｈｓａ－ｍｉＲ－６６３ｂ、ｈｓａ－ｍｉＲ－６０７５、ｈｓａ－ｍｉＲ－５００１－５ｐ、ｈｓａ－ｍｉＲ－６７８９－５ｐ、ｈｓａ－ｍｉＲ－４５１３、ｈｓａ－ｍｉＲ－３１９２－５ｐ、ｈｓａ－ｍｉＲ－８０６０、ｈｓａ－ｍｉＲ－６６８－５ｐ、ｈｓａ－ｍｉＲ－１２６８ａ、ｈｓａ－ｍｉＲ－１２７３ｇ－３ｐ、ｈｓａ－ｍｉＲ－４７０６、ｈｓａ－ｍｉＲ－１２４－３ｐ、ｈｓａ－ｍｉＲ－１２６０ｂ、ｈｓａ－ｍｉＲ－４７４０－５ｐ、ｈｓａ－ｍｉＲ－３２０ｂ、ｈｓａ－ｍｉＲ－７９７７、ｈｓａ－ｍｉＲ－２９ｂ－３ｐ、ｈｓａ－ｍｉＲ－４７０８－３ｐ、ｈｓａ－ｍｉＲ－４５２５、ｈｓａ－ｍｉＲ－９２ｂ－３ｐ、ｈｓａ－ｍｉＲ－４２５７、ｈｓａ－ｍｉＲ－４７２７－３ｐ、ｈｓａ－ｍｉＲ－９２ａ－３ｐ、ｈｓａ－ｍｉＲ－６６３ａ、ｈｓａ－ｍｉＲ－６７８７－５ｐ、ｈｓａ－ｍｉＲ－３１３１、ｈｓａ－ｍｉＲ－６８０２－５ｐ、ｈｓａ－ｍｉＲ－６５４－５ｐ、ｈｓａ－ｍｉＲ－６５１１ｂ－５ｐ、ｈｓａ－ｍｉＲ－２９ｂ－１－５ｐ、ｈｓａ－ｍｉＲ－４４１７、ｈｓａ－ｍｉＲ－４７３６、ｈｓａ－ｍｉＲ－６８４０－３ｐ、およびｈｓａ－ｍｉＲ－４７１０の１つまたはそれ以上を含む、方法。

【請求項4】

【請求項5】

請求項１に記載の方法において、前記ｍｉＲＮＡバイオマーカーセットが、ｈｓａ－ｍｉＲ－５１００、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ、ｈｓａ－ｍｉＲ－６８７７－５ｐ、ｈｓａ－ｍｉＲ－１７－３ｐ、ｈｓａ－ｍｉＲ－６７６５－５ｐ、ｈｓａ－ｍｉＲ－１２６８ｂ、ｈｓａ－ｍｉＲ－４２５８、ｈｓａ－ｍｉＲ－４５１ａ、ｈｓａ－ｍｉＲ－１２２８－５ｐ、ｈｓａ－ｍｉＲ－８０７３、ｈｓａ－ｍｉＲ－４４５４、ｈｓａ－ｍｉＲ－１８７－５ｐ、ｈｓａ－ｍｉＲ－４２８６、ｈｓａ－ｍｉＲ－６７４６－５ｐ、ｈｓａ－ｍｉＲ－６６３ｂ、ｈｓａ－ｍｉＲ－６０７５、ｈｓａ－ｍｉＲ－５００１－５ｐ、およびｈｓａ－ｍｉＲ－６７８９－５ｐからなる、方法。

【請求項6】

請求項１に記載の方法において、前記ｍｉＲＮＡバイオマーカーセットが、さらに、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、およびｈｓａ－ｍｉＲ－４７８７－３ｐの１つまたはそれ以上を含む、方法。

【請求項7】

請求項６に記載の方法において、前記ｍｉＲＮＡバイオマーカーセットが、ｈｓａ－ｍｉＲ－５１００、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、およびｈｓａ－ｍｉＲ－４７８７－３ｐからなる、方法。

【請求項8】

請求項７に記載の方法において、前記方法が、約０．８５０より大きいＡＵＣ値を有する診断精度を達成することができる、方法。

【請求項9】

請求項８に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌および肉腫からなる群から選択される、方法。

【請求項10】

請求項８に記載の方法において、前記方法が、約０．９５０より大きいＡＵＣ値を有する診断精度を達成することができる、方法。

【請求項11】

請求項１０に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、卵巣癌、膵臓癌、および前立腺癌からなる群から選択される、方法。

【請求項12】

請求項１０に記載の方法において、前記方法が、約０．９９０より大きいＡＵＣ値を有する診断精度を達成することができる、方法。

【請求項13】

請求項１２に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、食道癌、胃癌、神経膠腫癌、および前立腺癌からなる群から選択される、方法。

【請求項14】

請求項１２に記載の方法において、前記方法が、約０．９９９より大きいＡＵＣ値を有する診断精度を達成することができる、方法。

【請求項15】

請求項１４に記載の方法において、前記癌が、肺癌および胃癌からなる群から選択される、方法。

【請求項16】

請求項７に記載の方法において、前記方法が、約９９．０％より大きい特異度を有しながら、約６８．０％より大きい感度を有する診断精度を達成することができる、方法。

【請求項17】

請求項１６に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌、および肉腫からなる群から選択される、方法。

【請求項18】

請求項１６に記載の方法において、前記方法が、約９９．０％より大きい特異度を有しながら、約８３．０％より大きい感度を有する診断精度を達成することができる、方法。

【請求項19】

請求項１８に記載の方法において、前記癌が、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌および前立腺癌からなる群から選択される、方法。

【請求項20】

請求項１８に記載の方法において、前記方法が、約９９．０％より大きい感度を有しながら、約９９．０％より大きい特異度を有する診断精度を達成することができる、方法。

【請求項21】

請求項２０に記載の方法において、前記癌が、肺癌および胃癌からなる群から選択される、方法。

【請求項22】

請求項１～２１のいずれかに記載の方法において、前記ｍｉＲＮＡバイオマーカーセットの発現プロファイルに基づいて、前記生物学的試料の前記診断指標を算出する際に、前記診断指標は非加重モデルを介して算出される、方法。

【請求項23】

請求項１～２１のいずれかに記載の方法で、前記ｍｉＲＮＡバイオマーカーセットの前記発現プロファイルに基づいて前記生物学的試料の前記診断指標を算出する際に、前記診断指標を、ＬｉｎｅａｒＭｏｄｅｌｓｆｏｒＭｉｃｒｏａｒｒａｙＤａｔａ（ｌｉｍｍａ）モデル、ロジスティック回帰モデル、線形判別分析（ＬＤＡ）モデル、条件付きロジスティック回帰モデル、ラッソ回帰モデル、リッジ回帰モデル、ランダムフォレスト、サポートベクターマシン、およびプロビット回帰モデルからなる群から選択される１つからの重みを使用する加重モデルを介して算出する、方法。

【請求項24】

請求項２３に記載の方法で、前記診断指数が、リンマモデルからの重みを使用する加重モデルを介して算出される、方法。

【請求項25】

請求項１～２４のいずれか１項に記載の方法において、前記予め決定された閾値が、１１１０であり、前記方法は、約０．９５より大きい特異度値を有する診断精度を達成することができる、方法。

【請求項26】

請求項１～２４のいずれか１項に記載の方法において、前記予め決定された閾値が、１２００であり、前記方法は、約０．９９より大きい特異度値を有する診断精度を達成することができる、方法。

【請求項27】

請求項１～２６のいずれかに記載の方法であって、
前記生物学的試料の診断指標を算出した後であって、前記被験者を前記癌に罹患しているか否かを前記分類する工程の前に、
前記算出された診断指標に基づいて正規化された診断指標を取得する工程であって、
前記算出された診断指標に基づいて、前記被験者を前記癌に罹患しているか否かに分類する工程が、
前記正規化された診断指標が予め設定されたカットポイント同等またはより大きい場合、前記被験者を前記癌に罹患していると分類する工程か、または
もしそうでなければ、前記被験者を前記癌ではないと分類する工程か、を含む、前記取得する工程をさらに含む、方法。

【請求項28】

請求項２７に記載の方法において、前記算出された診断指数に基づいて前記正規化された診断指数を取得する際に、前記正規化された診断指数が数式：

【数2】

に基づいて算出され、
ここで、前記ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}およびｐａｒａｍ_{ｓｃａｌｅ}はそれぞれ、前記正規化された診断指数が第１のプリセット値以下、第２のプリセット値以下の範囲内に収まるように構成されたロケーションパラメータとスケールパラメータである、方法。

【請求項29】

請求項２８記載の方法において、前記診断指数は、前記リンマモデルからの重みを使用する加重モデルを介して算出され、第１のプリセット値は０であり、第２のプリセット値は１０である、方法。

【請求項30】

請求項２９に記載の方法において、前記予め設定されたカットポイントが、５．１であり、前記方法は、約０．９５より大きい特異度値を有する診断精度を達成することができる方法。

【請求項31】

請求項２９に記載の方法において、前記予め設定されたカットポイントが、６．０であり、前記方法は、約０．９９より大きい特異度値を有する診断精度を達成することができる、方法。

【請求項32】

請求項１～３１のいずれかに記載の方法において、前記生物学的試料が、血液試料、血清試料、血漿試料、尿試料、唾液試料および唾液試料からなる群から選択される液体生検試料である、方法。

【請求項33】

請求項１～３２のいずれかに記載の方法において、前記生物学的試料から前記少なくとも１つのｍｉＲＮＡからなるｍｉＲＮＡバイオマーカーセットの発現プロファイルを決定する際に、前記ｍｉＲＮＡバイオマーカーセットの前記発現プロファイルを、ノーザンブロット法、マイクロアレイ分析法、ＲＮＡシークエンシング法、またはＲＮＡインサイチュハイブリダイゼーション法の少なくとも１つからなる方法によって取得される、方法。

【請求項34】

請求項１～３２のいずれかに記載の方法において、前記生物学的試料から前記少なくとも１つのｍｉＲＮＡからなるｍｉＲＮＡバイオマーカーセットの発現プロファイルを決定する際に、前記ｍｉＲＮＡバイオマーカーセットの前記発現プロファイルを、逆転写ＰＣＲ（ＲＴ－ＰＣＲ）、定量的ＲＴ－ＰＣＲ（ｑＲＴ－ＰＣＲ）、またはデジタルＲＴ－ＰＣＲの少なくとも１つからなる核酸増幅手順によって取得される、方法。

【請求項35】

請求項１～３４のいずれか１項に記載の方法であって、さらに、前記被験体の評価を行う工程を含み、前記評価が前記癌の診断または前記癌の再発の検出を含む、方法。

【請求項36】

請求項１～３５のいずれか１項に記載の方法であって、さらに、前記被験体が前記癌に罹患していると分類された場合に、前記被験体に治療レジメンを投与する工程を含む、方法。

【請求項37】

被験体から取得された生物学的試料から癌を検出するためのキットであって、少なくとも１つの核酸と少なくとも１つの指示を含み、
前記少なくとも１つの核酸の各々は、ｍｉＲＮＡバイオマーカーセット中の各ｍｉＲＮＡを特異的に認識することができ、それにより前記ｍｉＲＮＡバイオマーカーセットの発現プロファイルを前記生物学的試料から取得することができ、前記ｍｉＲＮＡバイオマーカーセットはｈｓａ－ｍｉＲ－５１００を含み、
前記少なくとも１つの指示は、
前記ｍｉＲＮＡバイオマーカーセットの前記発現プロファイルに基づいて、前記生物学的試料の診断指標を算出するための第１のサブ指示を含む第１の指示であって、前記診断指標は、数式：

【数3】

に基づいて算出され、
ここで、ｎは、前記ｍｉＲＮＡバイオマーカーセット中の前記少なくとも１つのｍｉＲＮＡの総数であり、ｍｉＲＮＡ_ｉは、前記ｍｉＲＮＡバイオマーカーセット中のｉ^ｔｈｍｉＲＮＡの発現レベルであり、ｉは０より大きく、ｎより小さいかそれと同等の整数であり、ｔ_ｉは、ｉ^ｔｈｍｉＲＮＡの重みである、第１の指示と、および
前記被験者を前記癌に罹患しているか否かに分類するための第２の指示であって、前記算出された診断指数が予め決定された閾値以上である場合には、前記被験者を前記癌に罹患していると分類し、そうでない場合には前記被験者を前記癌に罹患していないと分類する、第２の指示と、
を含む、キット。

【請求項38】

請求項３７に記載のキットであって：
前記少なくとも１つの核酸が、厳しい条件下で、
（ａ）配列ＩＤ番号：１のヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続したヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
（ｂ）配列ＩＤ番号：１のヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
と特異的にハイブリダイズすることができるポリヌクレオチドを含む、キット。

【請求項39】

請求項３７または請求項３８に記載のキットにおいて、さらに、前記ｍｉＲＮＡバイオマーカーセットが、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ、ｈｓａ－ｍｉＲ－６８７７－５ｐ、ｈｓａ－ｍｉＲ－１７－３ｐ、ｈｓａ－ｍｉＲ－６７６５－５ｐ、ｈｓａ－ｍｉＲ－１２６８ｂ、ｈｓａ－ｍｉＲ－４２５８、ｈｓａ－ｍｉＲ－４５１ａ、ｈｓａ－ｍｉＲ－１２２８－５ｐ、ｈｓａ－ｍｉＲ－８０７３、ｈｓａ－ｍｉＲ－４４５４、ｈｓａ－ｍｉＲ－１８７－５ｐ、ｈｓａ－ｍｉＲ－４２８６、ｈｓａ－ｍｉＲ－６７４６－５ｐ、ｈｓａ－ｍｉＲ－６６３ｂ、ｈｓａ－ｍｉＲ－６０７５、ｈｓａ－ｍｉＲ－５００１－５ｐ、ｈｓａ－ｍｉＲ－６７８９－５ｐ、ｈｓａ－ｍｉＲ－４５１３、ｈｓａ－ｍｉＲ－３１９２－５ｐ、ｈｓａ－ｍｉＲ－８０６０、ｈｓａ－ｍｉＲ－６６８－５ｐ、ｈｓａ－ｍｉＲ－１２６８ａ、ｈｓａ－ｍｉＲ－１２７３ｇ－３ｐ、ｈｓａ－ｍｉＲ－４７０６、ｈｓａ－ｍｉＲ－１２４－３ｐ、ｈｓａ－ｍｉＲ－１２６０ｂ、ｈｓａ－ｍｉＲ－４７４０－５ｐ、ｈｓａ－ｍｉＲ－３２０ｂ、ｈｓａ－ｍｉＲ－７９７７、ｈｓａ－ｍｉＲ－２９ｂ－３ｐ、ｈｓａ－ｍｉＲ－４７０８－３ｐ、ｈｓａ－ｍｉＲ－４５２５、ｈｓａ－ｍｉＲ－９２ｂ－３ｐ、ｈｓａ－ｍｉＲ－４２５７、ｈｓａ－ｍｉＲ－４７２７－３ｐ、ｈｓａ－ｍｉＲ－９２ａ－３ｐ、ｈｓａ－ｍｉＲ－６６３ａ、ｈｓａ－ｍｉＲ－６７８７－５ｐ、ｈｓａ－ｍｉＲ－３１３１、ｈｓａ－ｍｉＲ－６８０２－５ｐ、ｈｓａ－ｍｉＲ－６５４－５ｐ、ｈｓａ－ｍｉＲ－６５１１ｂ－５ｐ、ｈｓａ－ｍｉＲ－２９ｂ－１－５ｐ、ｈｓａ－ｍｉＲ－４４１７、ｈｓａ－ｍｉＲ－４７３６、ｈｓａ－ｍｉＲ－６８４０－３ｐ、ｈｓａ－ｍｉＲ－４７１０、ｈｓａ－ｍｉＲ－４６３５、ｈｓａ－ｍｉＲ－２９６－３ｐ、ｈｓａ－ｍｉＲ－１１９９－５ｐ、ｈｓａ－ｍｉＲ－７９７５、ｈｓａ－ｍｉＲ－４４８０、ｈｓａ－ｍｉＲ－３６４８、ｈｓａ－ｍｉＲ－３７１ａ－５ｐ、ｈｓａ－ｍｉＲ－４７７１、ｈｓａ－ｍｉＲ－６７１７－５ｐ、ｈｓａ－ｍｉＲ－１２５４、ｈｓａ－ｍｉＲ－１２４６、ｈｓａ－ｍｉＲ－２３ｂ－３ｐ、ｈｓａ－ｍｉＲ－３２０ａ、ｈｓａ－ｍｉＲ－４６８７－５ｐ、ｈｓａ－ｍｉＲ－１９１－５ｐ、ｈｓａ－ｍｉＲ－３２０ｃ、ｈｓａ－ｍｉＲ－６１３１、ｈｓａ－ｍｉＲ－４５１５、ｈｓａ－ｍｉＲ－３４２－５ｐ、ｈｓａ－ｍｉＲ－４７１８、ｈｓａ－ｍｉＲ－２３ａ－３ｐ、ｈｓａ－ｍｉＲ－４４５５、ｈｓａ－ｍｉＲ－２１１－３ｐ、ｈｓａ－ｍｉＲ－３１２２、ｈｓａ－ｍｉＲ－１０３ａ－３ｐ、ｈｓａ－ｍｉＲ－４４２９、ｈｓａ－ｍｉＲ－９２０、ｈｓａ－ｍｉＲ－３１９４－３ｐ、ｈｓａ－ｍｉＲ－４７５４、ｈｓａ－ｍｉＲ－１２３８－５ｐ、ｈｓａ－ｍｉＲ－３１９１－３ｐ、ｈｓａ－ｍｉＲ－４７５５－３ｐ、ｈｓａ－ｍｉＲ－３６８８－５ｐ、ｈｓａ－ｍｉＲ－４５２９－５ｐ、ｈｓａ－ｍｉＲ－６８６１－５ｐ、ｈｓａ－ｍｉＲ－１４６９、ｈｓａ－ｍｉＲ－６１９－５ｐ、ｈｓａ－ｍｉＲ－４４４８、ｈｓａ－ｍｉＲ－４６５８、ｈｓａ－ｍｉＲ－２２－３ｐ、ｈｓａ－ｍｉＲ－４７７６－５ｐ、ｈｓａ－ｍｉＲ－３２０ｅ、ｈｓａ－ｍｉＲ－１２２５－３ｐ、ｈｓａ－ｍｉＲ－６８７５－５ｐ、ｈｓａ－ｍｉＲ－４５３４、ｈｓａ－ｍｉＲ－４６５２－５ｐ、ｈｓａ－ｍｉＲ－６４８、ｈｓａ－ｍｉＲ－４２５９、ｈｓａ－ｍｉＲ－１０７、およびｈｓａ－ｍｉＲ－６５０の１つまたはそれ以上を含む、キット。

【請求項40】

請求項３９に記載のキットにおいて、前記少なくとも１つの核酸が、厳しい条件下で、
（ａ）配列ＩＤ番号Ｓ：２～１００のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続したヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
（ｂ）配列ＩＤ番号Ｓ：２～１００のいずれか１つのヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる少なくとも１つのポリヌクレオチドをさらに含む、キット。

【請求項41】

請求項７３または請求項３８に記載のキットにおいて、さらに、前記ｍｉＲＮＡバイオマーカーセットが、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ、ｈｓａ－ｍｉＲ－６８７７－５ｐ、ｈｓａ－ｍｉＲ－１７－３ｐ、ｈｓａ－ｍｉＲ－６７６５－５ｐ、ｈｓａ－ｍｉＲ－１２６８ｂ、ｈｓａ－ｍｉＲ－４２５８、ｈｓａ－ｍｉＲ－４５１ａ、ｈｓａ－ｍｉＲ－１２２８－５ｐ、ｈｓａ－ｍｉＲ－８０７３、ｈｓａ－ｍｉＲ－４４５４、ｈｓａ－ｍｉＲ－１８７－５ｐ、ｈｓａ－ｍｉＲ－４２８６、ｈｓａ－ｍｉＲ－６７４６－５ｐ、ｈｓａ－ｍｉＲ－６６３ｂ、ｈｓａ－ｍｉＲ－６０７５、ｈｓａ－ｍｉＲ－５００１－５ｐ、ｈｓａ－ｍｉＲ－６７８９－５ｐ、ｈｓａ－ｍｉＲ－４５１３、ｈｓａ－ｍｉＲ－３１９２－５ｐ、ｈｓａ－ｍｉＲ－８０６０、ｈｓａ－ｍｉＲ－６６８－５ｐ、ｈｓａ－ｍｉＲ－１２６８ａ、ｈｓａ－ｍｉＲ－１２７３ｇ－３ｐ、ｈｓａ－ｍｉＲ－４７０６、ｈｓａ－ｍｉＲ－１２４－３ｐ、ｈｓａ－ｍｉＲ－１２６０ｂ、ｈｓａ－ｍｉＲ－４７４０－５ｐ、ｈｓａ－ｍｉＲ－３２０ｂ、ｈｓａ－ｍｉＲ－７９７７、ｈｓａ－ｍｉＲ－２９ｂ－３ｐ、ｈｓａ－ｍｉＲ－４７０８－３ｐ、ｈｓａ－ｍｉＲ－４５２５、ｈｓａ－ｍｉＲ－９２ｂ－３ｐ、ｈｓａ－ｍｉＲ－４２５７、ｈｓａ－ｍｉＲ－４７２７－３ｐ、ｈｓａ－ｍｉＲ－９２ａ－３ｐ、ｈｓａ－ｍｉＲ－６６３ａ、ｈｓａ－ｍｉＲ－６７８７－５ｐ、ｈｓａ－ｍｉＲ－３１３１、ｈｓａ－ｍｉＲ－６８０２－５ｐ、ｈｓａ－ｍｉＲ－６５４－５ｐ、ｈｓａ－ｍｉＲ－６５１１ｂ－５ｐ、ｈｓａ－ｍｉＲ－２９ｂ－１－５ｐ、ｈｓａ－ｍｉＲ－４４１７、ｈｓａ－ｍｉＲ－４７３６、ｈｓａ－ｍｉＲ－６８４０－３ｐ、およびｈｓａ－ｍｉＲ－４７１０の１つまたはそれ以上を含む、キット。

【請求項42】

請求項４１に記載のキットにおいて、前記少なくとも１つの核酸が、厳しい条件下で、
（ａ）配列ＩＤ番号Ｓ：２～５０のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
（ｂ）配列ＩＤ番号Ｓ：２～５０のいずれか１つのヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる少なくとも１つのポリヌクレオチドをさらに含む、キット。

【請求項43】

【請求項44】

請求項４３に記載のキットにおいて、前記少なくとも１つの核酸が、厳しい条件下で、
（ａ）配列ＩＤ番号Ｓ：２～２０のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
（ｂ）配列ＩＤ番号Ｓ：２～２０のいずれか１つのヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる少なくとも１つのポリヌクレオチドをさらに含む、キット。

【請求項45】

請求項４３に記載のキットにおいて、前記ｍｉＲＮＡバイオマーカーセットが、ｈｓａ－ｍｉＲ－５１００、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ、ｈｓａ－ｍｉＲ－６８７７－５ｐ、ｈｓａ－ｍｉＲ－１７－３ｐ、ｈｓａ－ｍｉＲ－６７６５－５ｐ、ｈｓａ－ｍｉＲ－１２６８ｂ、ｈｓａ－ｍｉＲ－４２５８、ｈｓａ－ｍｉＲ－４５１ａ、ｈｓａ－ｍｉＲ－１２２８－５ｐ、ｈｓａ－ｍｉＲ－８０７３、ｈｓａ－ｍｉＲ－４４５４、ｈｓａ－ｍｉＲ－１８７－５ｐ、ｈｓａ－ｍｉＲ－４２８６、ｈｓａ－ｍｉＲ－６７４６－５ｐ、ｈｓａ－ｍｉＲ－６６３ｂ、ｈｓａ－ｍｉＲ－６０７５、ｈｓａ－ｍｉＲ－５００１－５ｐ、およびｈｓａ－ｍｉＲ－６７８９－５ｐからなる、キット。

【請求項46】

請求項４５に記載のキットにおいて、前記少なくとも１つの核酸が、厳しい条件下で、
（ａ）それぞれ配列ＩＤ番号Ｓ：１～２０のヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するそれらの変異体、またはそれぞれ１５個以上の連続するヌクレオチドを含むそれらのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
（ｂ）それぞれ配列ＩＤ番号Ｓ：１～２０のヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、またはそれぞれ１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる合計２０のポリヌクレオチドからなる、キット。

【請求項47】

請求項３７または請求項３８に記載のキットにおいて、さらに、前記ｍｉＲＮＡバイオマーカーセットが、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、およびｈｓａ－ｍｉＲ－４７８７－３ｐの１つまたはそれ以上を含む、キット。

【請求項48】

請求項４７記載のキットにおいて、前記少なくとも１つの核酸が、厳しい条件下で、
（ａ）配列ＩＤ番号Ｓ：２～４のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
（ｂ）配列ＩＤ番号Ｓ：２～４のいずれか１つのヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる少なくとも１つのポリヌクレオチドをさらに含む、キット。

【請求項49】

請求項４７に記載のキットにおいて、前記ｍｉＲＮＡバイオマーカーセットが、ｈｓａ－ｍｉＲ－５１００、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、およびｈｓａ－ｍｉＲ－４７８７－３ｐからなる、キット。

【請求項50】

請求項４９に記載のキットにおいて、前記少なくとも１つの核酸が、厳しい条件下で、
（ａ）それぞれ配列ＩＤ番号Ｓ：１～４のヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するそれらの変異体、またはそれぞれ１５個以上の連続するヌクレオチドを含むそれらのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または
（ｂ）配列ＩＤ番号Ｓ：１～４のヌクレオチド配列にそれぞれ相補的なヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドをそれぞれ含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、
とそれぞれ特異的にハイブリダイズすることができる合計４つのポリヌクレオチドからなる、キット。

【請求項51】

請求項３７～５０のいずれか１項に記載のキットにおいて、第１の指示の第１のサブ指示において、前記診断指数が重み付けされていないモデルを介して算出される、キット。

【請求項52】

請求項３７～５０のいずれか１項に記載のキットにおいて、第１の指示の第１のサブ指示において、前記診断指標が、ＬｉｎｅａｒＭｏｄｅｌｓｆｏｒＭｉｃｒｏａｒｒａｙＤａｔａ（ｌｉｍｍａ）モデル、ロジスティック回帰モデル、線形判別分析（ＬＤＡ）モデル、条件付きロジスティック回帰モデル、ラッソ回帰モデル、リッジ回帰モデル、ランダムフォレスト、サポートベクターマシン、およびプロビット回帰モデルからなる群から選択される１つからの重みを使用する加重モデルを介して算出される、キット。

【請求項53】

請求項５２に記載のキットにおいて、前記診断指標が、前記リンマモデルからの重みを使用する加重モデルを介して算出される、キット。

【請求項54】

請求項３７～５３のいずれか１項に記載のキットにおいて、前記予め決定された閾値が１１１０であり、第２の指示が、前記分類が約０．９５より大きい特異性値を有する表示をさらに含む、キット。

【請求項55】

請求項３７～５３のいずれか１項に記載のキットにおいて、前記予め決定された閾値が１２００であり、第２の指示が、前記分類が約０．９９より大きい特異性値を有する表示をさらに含む、キット。

【請求項56】

請求項３７～５５のいずれかに記載のキットにおいて、第１の指示は、第１の指示に従って算出された診断指数に基づいて正規化診断指数を取得するための第２の指示をさらに含み、第２の指示において、前記被験者は、前記正規化された診断指数が予め設定されたカットポイント以上であれば前記癌を有すると分類され、そうでなければ前記癌を有さないと分類される、キット。

【請求項57】

請求項５６に記載のキットにおいて、第２のサブ指示において、前記正規化された診断指数が式：

【数4】

に基づいて算出され、
前記ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}とｐａｒａｍ_{ｓｃａｌｅ}が、それぞれ、前記正規化された診断指数が第１のプリセット値以下、第２のプリセット値以下の範囲内に収まるように構成されたロケーションパラメータとスケールパラメータである、キット。

【請求項58】

請求項５７に記載のキットにおいて、第１の指示において、前記診断指数は、前記リンマモデルからの重みを使用する加重モデルを介して算出され、第１のプリセット値は０であり、第２のプリセット値は１０である、キット。

【請求項59】

請求項５８に記載のキットにおいて、前記予め設定されたカットポイントが５．１であり、第２の指示が、前記分類が約０．９５より大きい特異性値を有する表示をさらに含む、キット。

【請求項60】

請求項５８に記載のキットにおいて、前記予め設定されたカットポイントは６．０であり、第２の指示は、前記分類が約０．９５より大きい特異性値を有する指示をさらに含む、キット。

【請求項61】

請求項３７～６０のいずれか１項に記載のキットにおいて、前記少なくとも１つの指示が、前記被験者の評価を実行するための第３の指示をさらに含み、前記評価が、前記癌の診断または前記癌の再発の検出を含む、キット。

【請求項62】

請求項３７～６１のいずれか１項に記載のキットにおいて、前記少なくとも１つの指示が、前記被験者が前記癌を有すると分類された場合に、前記被験者に治療レジメンを投与するための第４の指示をさらに含む、キット。

【請求項63】

請求項３７～６２のいずれかに記載のキットにおいて、前記少なくとも１つのインストラクションが、ｍｉＲＮＡバイオマーカーセットの発現プロファイルを得るための第１の追加インストラクションをさらに含み、少なくとも１つの核酸を用いてノーザンブロッティング、マイクロアレイ解析、ＲＮＡ配列決定、またはＲＮＡインサイチュハイブリダイゼーションを実施する手順を含む、キット。

【請求項64】

請求項６３に記載のキットにおいて、前記少なくとも１つの核酸が分子アレイ上に配置される、キット。

【請求項65】

請求項３７～６２のいずれか１項に記載のキットにおいて、前記少なくとも１セットの増幅用プライマーをさらに含み、各セットが前記生物学的試料からｍｉＲＮＡバイオマーカーセット中の前記少なくとも１つのｍｉＲＮＡの各々を特異的に増幅することができる、キット。

【請求項66】

請求項６５に記載のキットにおいて、前記少なくとも１つの指示が、前記ｍｉＲＮＡバイオマーカーセットの前記発現プロファイルを得るための第２の追加指示をさらに含み、前記少なくとも１つの核酸および前記少なくとも１つの増幅プライマーセットにより逆転写ＰＣＲ（ＲＴ－ＰＣＲ）、定量的ＲＴ－ＰＣＲ（ｑＲＴ－ＰＣＲ）、またはデジタルＲＴ－ＰＣＲを実施する手順を含む、キット。

【請求項67】

請求項３７～６６のいずれかに記載のキットにおいて、前記生物学的試料が、血液試料、血清試料、血漿試料、尿試料、唾液試料、および唾液試料からなる群から選択される液体生検試料である、キット。

【請求項68】

被験者の癌を検出するためのシステムであって、
プロセッサと、および
前記プロセッサによる実行のためのプログラム指示を含む非一過性記憶媒体であって、前記プログラム指示は、請求項１～３６のいずれか１項に記載の方法における工程を前記プロセッサに実行させる、前記非一過性記憶媒体と、
を含む、システム。

【請求項69】

プロセッサによって実行されると、請求項１～３６のいずれか１項に記載の方法を前記プロセッサに実行させる、コンピュータ実行可能なプログラム指示を記憶する、非一過性記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本出願は、２０２１年６月９日に出願された米国仮出願第６３／２０８，５０６号の利益を主張するものであり、その開示は参照によりその全体が本明細書に組み込まれる。

【0002】

電子的に提出された配列リスト（ファイル名Ｔｏｐ＿ｍｉＲＮＡ＿Ｓｅｑ．ｔｘｔ、サイズ１５，０６３バイト、作成日２０２２年５月３１日）の内容は、本明細書中に参考として援用される。

【0003】

本発明は、一般に、疾患のスクリーニング、検出および診断の技術分野に関するものであり、より具体的には、１つまたは複数のヒトにおける癌を検出するための方法、キット、システム、および非一過性記憶媒体に関するものである。

【背景技術】

【0004】

近年の診断・治療技術の急速な発展にもかかわらず、癌は人間にとって困難で致命的な疾患であることに変わりはない。早期であれば治療が成功する可能性が高いため、癌関連死亡率を減少させるためには、癌を早期に発見することが重要であることはよく知られている。理想的には非侵襲的で、いわゆるマルチ癌早期発見（ＭＣＥＤ）パラダイムの基礎となっている血液検査のような、複数の癌種を早期かつ同時に検出できる検査を開発することが、満たされていない緊急のニーズとなっている。このようなＭＣＥＤ検査では、多くの場合、リスクのある一般集団をスクリーニングできるようにするため、偽陽性を最小限に抑える非常に高い特異性、できれば９９％以上が必要とされる。

【0005】

ｍｉＲＮＡは、ヒトゲノムの対応する遺伝子にコードされている平均２２ヌクレオチド長の小さな一本鎖の非コードＲＮＡ分子である。ｍｉＲＮＡは、主にｍＲＮＡ分子の３'非翻訳領域（３'ＵＴＲ）中の相補的配列と結合することにより、遺伝子発現の負の転写後調節において機能する。ｍｉＲＮＡはヒト遺伝子の５０％以上を調節しているようであり、ｍｉＲＮＡの異常発現は多くのヒト癌に関与している。血液中やその他の体液中における安定性が顕著であることと相まって、循環細胞外ｍｉＲＮＡは、癌のスクリーニングや診断のための非侵襲的バイオマーカーとしての役割を果たす可能性を秘めている。

【発明の概要】

【課題を解決するための手段】

【0006】

本開示は、少なくとも１つのｍｉＲＮＡバイオマーカーからなるｍｉＲＮＡバイオマーカーセットによる多癌検出アプローチ（すなわち、方法、キット、およびシステム）を提供する。このアプローチは、ヒト被験者から得られた生物学的試料から決定され得るｍｉＲＮＡバイオマーカーセットの発現プロファイルに実質的に基づく。このような生物学的試料は、特に、血液試料、血清試料、血漿試料、尿試料、唾液試料、または喀痰試料を含む液体生検試料とすることができ、これにより、癌の非侵襲的または最小侵襲的検出を可能にする。このアプローチは、ヒト被験者が肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌、肉腫を含む癌のいずれかに罹患しているかどうかを正確かつ確実に検出するために採用することができる。

【0007】

一の態様において、被験者から得られた生体試料から癌を検出する方法が提供される。
本方法は、実質的に以下の３つの工程（１）～（３）を含む：

【0008】

工程（１）：生体試料から少なくとも１つのｍｉＲＮＡからなるｍｉＲＮＡバイオマーカーセットの発現プロファイルを決定する。ここで、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００からなる。

【0009】

工程（２）：ｍｉＲＮＡバイオマーカーセットの発現プロファイルに基づいて、生物学的試料の診断指標を算出する。診断指標は以下：

【数1】

に基づいて算出され、
ここで、ｎはｍｉＲＮＡバイオマーカーセット中のｍｉＲＮＡの総数であり、ｍｉＲＮＡｉはｍｉＲＮＡバイオマーカーセット中のｉ^ｔｈｍｉＲＮＡの発現レベルであり、ｉは０より大きく、ｎより小さいかそれと同等の整数であり、ｔ_ｉはｉ^ｔｈｍｉＲＮＡの重みである。

【0010】

工程（３）：算出された診断指標の値に基づいて、被験者を癌に罹患しているか否かに分類する。算出された診断指標が予め決められた閾値以上である場合、対象者は癌に罹患していると分類され、そうでない場合、対象者は癌に罹患していないと分類される。

【0011】

さらにこの方法は、約０．７８０を超えるＡＵＣ値を持つ診断精度を達成できるように構成される。

【0012】

本明細書で使用する場合、ｍｉＲＮＡバイオマーカーセットの発現プロファイルは、実質的に、ｍｉＲＮＡバイオマーカーセットに含まれる各ｍｉＲＮＡメンバーについて決定された発現レベルデータを含むデータセットである。

【0013】

「事前に決定された閾値」という用語は、被験者が癌種に罹患しているか否かを所定の特異度／感度で判定するために使用できる診断指標のカットポイント値として参照される。これは、典型的には、疾患を有することが知られている、及び／又は疾患を有しないことが知られている被験者の既存の集団について取得され算出された診断指標値の範囲からなる既存のデータセットに基づいて予め決定される。例えば、以下に提供される実施例１において、ｍｉＲＮＡバイオマーカーセットが上位１００のｍｉＲＮＡ（配列ＩＤ番号Ｓ：１－１００に対応する）のいずれか１つからなる場合、ＡＵＣは０．７８０（すなわち、ｈｓａ－ｍｉＲ－１２３８－５ｐの場合）より大きいレベルに達することができる、さらには約０．９９９（すなわち、ｈｓａ－ｍｉＲ－５１００、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０およびｈｓａ－ｍｉＲ－４７８７－３ｐの上位４つのｍｉＲＮＡの場合）に達することもある（表１参照）。

【0014】

本方法のいくつかの実施形態によれば、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００（配列ＩＤ番号：１に対応する）に加えて、表１に列挙された他の９９個のｍｉＲＮＡの１つ以上、すなわちｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ、ｈｓａ－ｍｉＲ－６８７７－５ｐ、ｈｓａ－ｍｉＲ－１７－３ｐ、ｈｓａ－ｍｉＲ－６７６５－５ｐ、ｈｓａ－ｍｉＲ－１２６８ｂ、ｈｓａ－ｍｉＲ－４２５８、ｈｓａ－ｍｉＲ－４５１ａ、ｈｓａ－ｍｉＲ－１２２８－５ｐ、ｈｓａ－ｍｉＲ－８０７３、ｈｓａ－ｍｉＲ－４４５４、ｈｓａ－ｍｉＲ－１８７－５ｐ、ｈｓａ－ｍｉＲ－４２８６、ｈｓａ－ｍｉＲ－６７４６－５ｐ、ｈｓａ－ｍｉＲ－６６３ｂ、ｈｓａ－ｍｉＲ－６０７５、ｈｓａ－ｍｉＲ－５００１－５ｐ、ｈｓａ－ｍｉＲ－６７８９－５ｐ、ｈｓａ－ｍｉＲ－４５１３、ｈｓａ－ｍｉＲ－３１９２－５ｐ、ｈｓａ－ｍｉＲ－８０６０、ｈｓａ－ｍｉＲ－６６８－５ｐ、ｈｓａ－ｍｉＲ－１２６８ａ、ｈｓａ－ｍｉＲ－１２７３ｇ－３ｐ、ｈｓａ－ｍｉＲ－４７０６、ｈｓａ－ｍｉＲ－１２４－３ｐ、ｈｓａ－ｍｉＲ－１２６０ｂ、ｈｓａ－ｍｉＲ－４７４０－５ｐ、ｈｓａ－ｍｉＲ－３２０ｂ、ｈｓａ－ｍｉＲ－７９７７、ｈｓａ－ｍｉＲ－２９ｂ－３ｐ、ｈｓａ－ｍｉＲ－４７０８－３ｐ、ｈｓａ－ｍｉＲ－４５２５、ｈｓａ－ｍｉＲ－９２ｂ－３ｐ、ｈｓａ－ｍｉＲ－４２５７、ｈｓａ－ｍｉＲ－４７２７－３ｐ、ｈｓａ－ｍｉＲ－９２ａ－３ｐ、ｈｓａ－ｍｉＲ－６６３ａ、ｈｓａ－ｍｉＲ－６７８７－５ｐ、ｈｓａ－ｍｉＲ－３１３１、ｈｓａ－ｍｉＲ－６８０２－５ｐ、ｈｓａ－ｍｉＲ－６５４－５ｐ、ｈｓａ－ｍｉＲ－６５１１ｂ－５ｐ、ｈｓａ－ｍｉＲ－２９ｂ－１－５ｐ、ｈｓａ－ｍｉＲ－４４１７、ｈｓａ－ｍｉＲ－４７３６、ｈｓａ－ｍｉＲ－６８４０－３ｐ、ｈｓａ－ｍｉＲ－４７１０、ｈｓａ－ｍｉＲ－４６３５、ｈｓａ－ｍｉＲ－２９６－３ｐ、ｈｓａ－ｍｉＲ－１１９９－５ｐ、ｈｓａ－ｍｉＲ－７９７５、ｈｓａ－ｍｉＲ－４４８０、ｈｓａ－ｍｉＲ－３６４８、ｈｓａ－ｍｉＲ－３７１ａ－５ｐ、ｈｓａ－ｍｉＲ－４７７１、ｈｓａ－ｍｉＲ－６７１７－５ｐ、ｈｓａ－ｍｉＲ－１２５４、ｈｓａ－ｍｉＲ－１２４６、ｈｓａ－ｍｉＲ－２３ｂ－３ｐ、ｈｓａ－ｍｉＲ－３２０ａ、ｈｓａ－ｍｉＲ－４６８７－５ｐ、ｈｓａ－ｍｉＲ－１９１－５ｐ、ｈｓａ－ｍｉＲ－３２０ｃ、ｈｓａ－ｍｉＲ－６１３１、ｈｓａ－ｍｉＲ－４５１５、ｈｓａ－ｍｉＲ－３４２－５ｐ、ｈｓａ－ｍｉＲ－４７１８、ｈｓａ－ｍｉＲ－２３ａ－３ｐ、ｈｓａ－ｍｉＲ－４４５５、ｈｓａ－ｍｉＲ－２１１－３ｐ、ｈｓａ－ｍｉＲ－３１２２、ｈｓａ－ｍｉＲ－１０３ａ－３ｐ、ｈｓａ－ｍｉＲ－４４２９、ｈｓａ－ｍｉＲ－９２０、ｈｓａ－ｍｉＲ－３１９４－３ｐ、ｈｓａ－ｍｉＲ－４７５４、ｈｓａ－ｍｉＲ－１２３８－５ｐ、ｈｓａ－ｍｉＲ－３１９１－３ｐ、ｈｓａ－ｍｉＲ－４７５５－３ｐ、ｈｓａ－ｍｉＲ－３６８８－５ｐ、ｈｓａ－ｍｉＲ－４５２９－５ｐ、ｈｓａ－ｍｉＲ－６８６１－５ｐ、ｈｓａ－ｍｉＲ－１４６９、ｈｓａ－ｍｉＲ－６１９－５ｐ、ｈｓａ－ｍｉＲ－４４４８、ｈｓａ－ｍｉＲ－４６５８、ｈｓａ－ｍｉＲ－２２－３ｐ、ｈｓａ－ｍｉＲ－４７７６－５ｐ、ｈｓａ－ｍｉＲ－３２０ｅ、ｈｓａ－ｍｉＲ－１２２５－３ｐ、ｈｓａ－ｍｉＲ－６８７５－５ｐ、ｈｓａ－ｍｉＲ－４５３４、ｈｓａ－ｍｉＲ－４６５２－５ｐ、ｈｓａ－ｍｉＲ－６４８、ｈｓａ－ｍｉＲ－４２５９、ｈｓａ－ｍｉＲ－１０７、およびｈｓａ－ｍｉＲ－６５０は、調整Ｐ値に基づいてランク付けされ、配列ＩＤ番号Ｓ：それぞれ２－１００に対応する。

【0015】

本方法の他のいくつかの実施形態によれば、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００に加えて、表１に記載された他のトップ５０のｍｉＲＮＡの１つ以上、すなわちｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ、ｈｓａ－ｍｉＲ－６８７７－５ｐ、ｈｓａ－ｍｉＲ－１７－３ｐ、ｈｓａ－ｍｉＲ－６７６５－５ｐ、ｈｓａ－ｍｉＲ－１２６８ｂ、ｈｓａ－ｍｉＲ－４２５８、ｈｓａ－ｍｉＲ－４５１ａ、ｈｓａ－ｍｉＲ－１２２８－５ｐ、ｈｓａ－ｍｉＲ－８０７３、ｈｓａ－ｍｉＲ－４４５４、ｈｓａ－ｍｉＲ－１８７－５ｐ、ｈｓａ－ｍｉＲ－４２８６、ｈｓａ－ｍｉＲ－６７４６－５ｐ、ｈｓａ－ｍｉＲ－６６３ｂ、ｈｓａ－ｍｉＲ－６０７５、ｈｓａ－ｍｉＲ－５００１－５ｐ、ｈｓａ－ｍｉＲ－６７８９－５ｐ、ｈｓａ－ｍｉＲ－４５１３、ｈｓａ－ｍｉＲ－３１９２－５ｐ、ｈｓａ－ｍｉＲ－８０６０、ｈｓａ－ｍｉＲ－６６８－５ｐ、ｈｓａ－ｍｉＲ－１２６８ａ、ｈｓａ－ｍｉＲ－１２７３ｇ－３ｐ、ｈｓａ－ｍｉＲ－４７０６、ｈｓａ－ｍｉＲ－１２４－３ｐ、ｈｓａ－ｍｉＲ－１２６０ｂ、ｈｓａ－ｍｉＲ－４７４０－５ｐ、ｈｓａ－ｍｉＲ－３２０ｂ、ｈｓａ－ｍｉＲ－７９７７、ｈｓａ－ｍｉＲ－２９ｂ－３ｐ、ｈｓａ－ｍｉＲ－４７０８－３ｐ、ｈｓａ－ｍｉＲ－４５２５、ｈｓａ－ｍｉＲ－９２ｂ－３ｐ、ｈｓａ－ｍｉＲ－４２５７、ｈｓａ－ｍｉＲ－４７２７－３ｐ、ｈｓａ－ｍｉＲ－９２ａ－３ｐ、ｈｓａ－ｍｉＲ－６６３ａ、ｈｓａ－ｍｉＲ－６７８７－５ｐ、ｈｓａ－ｍｉＲ－３１３１、ｈｓａ－ｍｉＲ－６８０２－５ｐ、ｈｓａ－ｍｉＲ－６５４－５ｐ、ｈｓａ－ｍｉＲ－６５１１ｂ－５ｐ、ｈｓａ－ｍｉＲ－２９ｂ－１－５ｐ、ｈｓａ－ｍｉＲ－４４１７、ｈｓａ－ｍｉＲ－４７３６、ｈｓａ－ｍｉＲ－６８４０－３ｐ、およびｈｓａ－ｍｉＲ－４７１０は、調整Ｐ値に基づいてランク付けされ、配列ＩＤ番号Ｓ：それぞれ２－５０に対応する。

【0016】

方法のいくつかの他の実施形態によれば、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００に加えて、表１に列挙された他の上位２０のｍｉＲＮＡの１つ以上、すなわちｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ、ｈｓａ－ｍｉＲ－６８７７－５ｐ、ｈｓａ－ｍｉＲ－１７－３ｐ、ｈｓａ－ｍｉＲ－６７６５－５ｐ、ｈｓａ－ｍｉＲ－１２６８ｂ、ｈｓａ－ｍｉＲ－４２５８、ｈｓａ－ｍｉＲ－４５１ａ、ｈｓａ－ｍｉＲ－１２２８－５ｐ、ｈｓａ－ｍｉＲ－８０７３、ｈｓａ－ｍｉＲ－４４５４、ｈｓａ－ｍｉＲ－１８７－５ｐ、ｈｓａ－ｍｉＲ－４２８６、ｈｓａ－ｍｉＲ－６７４６－５ｐ、ｈｓａ－ｍｉＲ－６６３ｂ、ｈｓａ－ｍｉＲ－６０７５、ｈｓａ－ｍｉＲ－５００１－５ｐ、およびｈｓａ－ｍｉＲ－６７８９－５ｐを含み、調整Ｐ値に基づいてランク付けされ、配列ＩＤ番号Ｓ：２－２０にそれぞれ対応する。ここで,さらに任意に、ｍｉＲＮＡバイオマーカーセットは、表１に記載された上位２０のｍｉＲＮＡからなる（それぞれ配列ＩＤ番号Ｓ：１－２０に対応する）。

【0017】

本方法のいくつかの他の実施形態によれば、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００に加えて、表１に列挙された他の上位４つのｍｉＲＮＡ、すなわち、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、およびｈｓａ－ｍｉＲ－４７８７－３ｐのうちの１つ以上をさらに含み、これらは、調整Ｐ値に基づいてランク付けされ、配列ＩＤ番号Ｓ：２～４にそれぞれ対応する。ここでさらに任意に、ｍｉＲＮＡバイオマーカーセットは、表１に記載された上位４つのｍｉＲＮＡ、すなわちｈｓａ－ｍｉＲ－５１００、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、およびｈｓａ－ｍｉＲ－４７８７－３ｐからなり、これらはそれぞれ配列ＩＤ番号Ｓ：１－４に対応する。

【0018】

本方法は任意に、より高いＡＵＣ値を有する診断精度を達成できるようにさらに構成することができる。

【0019】

いくつかの実施形態によれば、本方法は、約０．８５０より大きいＡＵＣ値を有する診断精度を達成できるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌、および肉腫からなる群から選択され得る。

【0020】

いくつかの実施形態によれば、本方法は、約０．９５０より大きいＡＵＣ値を有する診断精度を達成できるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、卵巣癌、膵臓癌、および前立腺癌からなる群からなる。

【0021】

いくつかの実施形態によれば、本方法は、約０．９９０より大きいＡＵＣ値を有する診断精度を達成できるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、食道癌、胃癌、神経膠腫癌、および前立腺癌からなる群から選択され得る。

【0022】

いくつかの実施形態によれば、本方法は、約０．９９９より大きいＡＵＣ値を有する診断精度を達成できるように構成される。ここで任意に、検出され得る癌は、肺癌または胃癌であり得る。

【0023】

さまざまな実際的ニーズに応じて、本方法は任意に、異なる感度および特異度レベルを有する診断精度を達成できるように構成することができる。

【0024】

いくつかの実施形態によれば、本方法は、約９９．０％を超える特異度を有しながら、約６８．０％を超える感度を有する診断精度を達成することができるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、前立腺癌、卵巣癌、および肉腫からなる群からなる。

【0025】

いくつかの実施形態によれば、本方法は、約９９．０％より高い特異性を有しながら、約８３．０％より高い感度を有する診断精度を達成することができるように構成される。ここで任意に、検出され得る癌は、肺癌、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫癌、肝臓癌、膵臓癌、および前立腺癌からなる群からなる。

【0026】

いくつかの実施形態によれば、本方法は、約９９．０％より大きい感度を有し、約９９．０％より大きい特異度を有する診断精度を達成することができるように構成される。ここで任意に、検出され得る癌は、肺癌または胃癌であり得る。

【0027】

本方法のいくつかの実施形態によれば、ｍｉＲＮＡバイオマーカーセットの発現プロファイルに基づいて生物学的試料の診断指標を算出する工程（２）において、診断指標は、重み付けされていないモデルを介して算出される。

【0028】

本方法の他のいくつかの実施形態によれば、ｍｉＲＮＡバイオマーカーセットの発現プロファイルに基づいて生物学的試料の診断指標を算出する工程（２）において、診断指標は、ＬｉｎｅａｒＭｏｄｅｌｓｆｏｒＭｉｃｒｏａｒｒａｙＤａｔａ（ｌｉｍｍａ）モデルからなる群からなる１つからの重みを使用する重み付けモデルを介して算出される、ロジスティック回帰モデル、線形判別分析（ＬＤＡ）モデル、条件付きロジスティック回帰モデル、ラッソ回帰モデル、リッジ回帰モデル、ランダムフォレスト、サポートベクターマシン、およびプロビット回帰モデルからなる群から選択される１つから重みを用いて重み付けモデルにより算出される。さらに任意で、診断指標は、リンマモデルからの重みを使用した重み付けモデルによって算出される。

【0029】

本明細書で使用する場合、「非重み付けモデル」および「重み付けモデル」という用語は、当業者によく理解される一般的な定義の範囲内で理解されるものとする。非重み付けモデル」という用語については、診断指標を算出する際に、ｍｉＲＮＡバイオマーカーセット内の各ｍｉＲＮＡに重みが適用されない状況を指す。本開示の範囲内で、式（Ｉ）を参照すると、「診断指数は重み付けされていないモデルを介して算出される」という語句は、ｍｉＲＮＡバイオマーカーセット内の任意のｍｉＲＮＡについて等しいｔ_ｉ（例えば、ｔ_ｉ＝１）を有すると理解することができる。「重み付けモデル」という用語については、診断指標を算出する際に、ｍｉＲＮＡバイオマーカーセット内の各ｍｉＲＮＡに対応する重みが適用される状況を指す。本開示の範囲内において、式（Ｉ）を参照すると、「診断指標は加重モデルを介して算出される」という語句は、ｍｉＲＮＡバイオマーカーセット内の任意のｍｉＲＮＡｉについて、すべてのｔ_ｉが等しいわけではない（すなわち、異なる重みを有する少なくとも２つのｍｉＲＮＡが存在する）と理解することができる。

【0030】

それぞれの用語は、「ＬｉｎｅａｒＭｏｄｅｌｓｆｏｒＭｉｃｒｏａｒｒａｙＤａｔａ（ｌｉｍｍａ）モデル」（Ｒｉｔｃｈｉｅｅｔａｌ．２０１５）、「ロジスティック回帰モデル」（ＶｅｎａｂｌｅａｎｄＲｉｐｌｅｙ２００２）、「線形判別分析（ＬＤＡ）モデル」（ＶｅｎａｂｌｅａｎｄＲｉｐｌｅｙ２００２）、「条件付きロジスティック回帰モデル」（ＶｅｎａｂｌｅａｎｄＲｉｐｌｅｙ２００２）、「ラッソ回帰モデル」（Ｔｉｂｓｈｉｒａｎｉ１９９６）、「リッジ回帰モデル」（ＨｏｅｒｌａｎｄＫｅｎｎａｒｄ１９７０）、「ランダムフォレスト」（Ｒｉｐｌｅｙ１９９６）、「ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅ」（Ｒｉｐｌｅｙ１９９６）、「ｐｒｏｂｉｔｒｅｇｒｅｓｓｉｏｎｍｏｄｅｌ」（ＶｅｎａｂｌｅａｎｄＲｉｐｌｅｙ２００２）は、実質的に、当業者によって一般的に評価される定義に従う確率モデル統計モデルであり、その詳細は、すぐ後ろに含まれる参考文献によって参照できる。

【0031】

利便性を提供するために、いくつかの実施形態によれば、工程（２）の後および工程（３）の前に、本方法は、算出された診断指数に基づいて正規化診断指標を得る：という正規化工程をさらに含むことができる。これに対応して、工程（３）は：正規化診断指数が予め設定されたカットポイント以上である場合、被験者を癌に罹患していると分類する；または、そうでない場合、被験者を癌に罹患していないと分類する。

【0032】

ここで、正規化工程には異なる方法があり得る。いくつかの実施形態によれば、正規化診断指数は式（ＩＩ）：

【数2】

に基づいて算出され、
ここで、ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}とｐａｒａｍ_{ｓｃａｌｅ}はそれぞれ、正規化された診断指数が第１のプリセット値以下、第２のプリセット値以下の範囲に収まるように構成されたロケーションパラメータとスケールパラメータである。

【0033】

より具体的には、ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}は実質的に、正規化診断指標の最小値を第一のプリセット値にシフトするように構成された位置パラメータであり、ｐａｒａｍ_{ｓｃａｌｅ}は実質的に、正規化診断指標の最大値を第二の値にスケールするように構成されたスケールパラメータである。このように、第一のプリセット値および第二のプリセット値は、それぞれ、癌を有することが知られている被験者および癌を有しないことが知られている被験者の既存の集団から得られ算出された正規化診断指標値の範囲における最小値および最大値であり、異常値は除外される。

【0034】

オプションとして、複数の設定を適用することもできる。例えば、診断指標値が外れ値（参照）を除いて６００から１６００の範囲を持つように決定された以下のＥＸＡＭＰＬＥ１の既存のデータセットにおいて、範囲を０（すなわち第一のプリセット値）と１０（すなわち第二の現在値）の間にシフトさせるために、最終的に正規化された診断指標が０より小さくなく１０より大きくならないように、ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}とｐａｒａｍ_{ｓｃａｌｅ} をそれぞれ６００と１００に設定することができる。この正規化スキームは以下の実施例１でも採用されている。

【0035】

あるいは、ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}とｐａｒａｍ_{ｓｃａｌｅ}をそれぞれ６００と１０００に設定し、最終的な正規化診断指標を０以上１以下とすることもできる。さらに別の方法として、ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}とｐａｒａｍ_{ｓｃａｌｅ}をそれぞれ６００と１０に設定し、最終的な正規化診断指標を０以上１００以下とすることもできる。さらに別の方法として、ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}とｐａｒａｍ_{ｓｃａｌｅ}をそれぞれ３５０と２５０に設定し、最終的な正規化診断指標を１以上５以下に設定することもできる。

【0036】

正規化診断指数が０と１０の間になるように正規化される実施形態では、任意で事前設定カットポイントを５．１として設定し、それによって本方法が約０．９５を超える特異性を有するようにするか、または任意で６．０として設定し、それによって本方法が約０．９９を超える特異性を有するようにすることができる。

【0037】

上述の方法の任意の実施形態において、生物学的試料は、血液試料、血清試料、血漿試料、尿試料（Ｙｕｎら、２０１２年）、唾液試料（Ｐａｒｋｅｔａｌ．、２００９）、および喀痰試料からなる群からなる液体生検試料である。

【0038】

上記のような方法の任意の実施形態において、生物学的試料から少なくとも１つのｍｉＲＮＡからなるｍｉＲＮＡバイオマーカーセットの発現プロファイルを決定する工程（１）において、ｍｉＲＮＡバイオマーカーセットの発現プロファイルは、任意選択で、ノーザンブロッティングによって得ることができる、マイクロアレイ分析、ＲＮＡ配列決定、またはＲＮＡインサイチュハイブリダイゼーションによって、あるいは任意選択で、逆転写ＰＣＲ（ＲＴ－ＰＣＲ）、定量的ＲＴ－ＰＣＲ（ｑＲＴ－ＰＣＲ）、またはデジタルＲＴ－ＰＣＲからなる核酸増幅手順によって得ることができる。

【0039】

本明細書で使用される場合、上記のｍｉＲＮＡ検出アプローチのそれぞれは、当業者によって十分に理解される一般的な定義内で理解されるものとする。ｍｉＲＮＡバイオマーカーセットの発現プロファイルを決定するためにこれらのアプローチを実施するための詳細を以下に提供する。

【0040】

上記のような方法の任意の実施形態において、本方法は、任意選択で、被験体の評価を実施する工程をさらに含み、前記評価は、癌の診断または癌の再発の検出を含む。

【0041】

ここで、「癌の診断」とは、以前は癌でないとわかっていた対象者に癌が発見されることをいい、「癌の再発」とは、以前に癌を取り除く治療を受けて癌でなくなった対象者に再び癌が発見されることをいう。

【0042】

上記のような方法の任意の実施形態において、本方法は、被験体が癌を有すると分類された場合に、被験体に治療レジメンを投与する工程を任意にさらに含む。ここで、本方法では、手術、放射線療法、化学療法、ホルモン療法、標的療法、免疫療法、またはそれらの組み合わせを含む、様々な既知の治療レジメンを投与することができる。これらの治療レジメンは、上記の各異なる癌に対して十分に確立されている。

【0043】

上記のような方法の任意の実施形態において、本方法は、被験体が癌を有すると分類された場合に、被験体に対して診断手順を実施する工程を任意選択的にさらに含む。ここで、診断手順は、任意選択で、身体検査、対象からの生検の病理学的検査、免疫組織化学検査、またはＸ線、コンピュータ断層撮影（ＣＴ）、超音波検査、および／もしくは磁気共鳴画像診断などの画像検査を含み得る。

【0044】

第２の態様において、本開示はさらに、対象から得られた生物学的試料から癌を検出するためのキットを提供し、このキットは、第１の態様に記載の方法を実施するために実質的に採用される。

【0045】

本明細書及び本開示の他の箇所で使用されるように、用語「キット」は、物品及び／又は指示書の集合体として言及される。キットに含まれる物品は、物理的実体またはその成分であり得る。本明細書に開示されるようなキットに含まれ得る物品の例としては、１つ以上の核酸（例えば、ポリヌクレオチド）、または１つ以上のデバイス、装置もしくは機器（例えば、１つ以上の核酸を含む分子アレイまたはマイクロアレイ）が挙げられ得る。キットに含まれるインストラクションは、実行すべき特定の工程の説明（例えば、マニュアル）であり得、物理的媒体（例えば、紙、カードなど）、コンピュータ読み取り可能な記憶媒体（例えば、ハードディスク、コンパクトディスクまたはＣＤ、フラッシュドライブなど）上に印刷され得、あるいはインターネット（例えば、アクセス可能なクラウド空間）などに保存され得る。

【0046】

キットは、少なくとも以下の構成要素（１）及び（２）（すなわち、物品及び／又は説明書）を含む：

【0047】

成分（１）：少なくとも１つの核酸であって、ｍｉＲＮＡバイオマーカーセット中の各ｍｉＲＮＡを特異的に認識することができ、それにより生物学的試料からｍｉＲＮＡバイオマーカーセットの発現プロファイルを得ることができる核酸。ここで、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００（配列ＩＤ番号：１）を含む。

【0048】

構成要素（２）：第１の指示および第２の指示を含む少なくとも１つの指示である。前記第１の指示は、前記ｍｉＲＮＡバイオマーカーセットの発現プロファイルに基づいて前記生物学的試料の診断指標を算出するための第１のサブ指示を含み、前記診断指標は式：

【数3】

に基づいて算出され、
ここで、ｎは、ｍｉＲＮＡバイオマーカーセット中の少なくとも１つのｍｉＲＮＡの総数であり、ｍｉＲＮＡ_ｉは、ｍｉＲＮＡバイオマーカーセット中のｉ^ｔｈｍｉＲＮＡの発現レベルであり、ｉは、０より大きくｎ以下の整数であり、ｔ_ｉは、ｉ^ｔｈｍｉＲＮＡの重みである。第二の指示は、対象が癌を有するか否かに分類するように構成され、対象は、算出された診断指数が予め決定された閾値以上であれば癌を有すると分類され、そうでなければ癌を有さないと分類される。

【0049】

ここで、キットの成分（１）において、少なくとも１つの核酸は、任意選択で、厳しい条件下で、以下：（ａ）配列ＩＤ番号．１、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続したヌクレオチドを含むそのフラグメントか、または（ｂ）配列ＩＤ番号：１のヌクレオチド配列に相補的なヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続したヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドのいずれかに特異的にハイブリダイズすることができるポリヌクレオチドを含み得る。

【0050】

キットのいくつかの実施形態によれば、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００に加えて、表１に列挙された他の９９のｍｉＲＮＡのうちの１つ以上をさらに含む。これに対応して、キットの構成要素（１）において、少なくとも１つの核酸は、任意選択で、厳しい条件下で、（ａ）配列ＩＤ番号Ｓ．２～１００のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または（ｂ）配列ＩＤ番号Ｓ：２～１００のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる少なくとも１つのポリヌクレオチドをさらに含み得る。

【0051】

キットのいくつかの実施形態によれば、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００に加えて、表１に列挙された他のトップ５０ｍｉＲＮＡの１つ以上をさらに含む。これに対応して、キットの構成要素（１）において、少なくとも１つの核酸は、任意選択で、厳しい条件下で、（ａ）配列ＩＤ番号Ｓ：２～５０のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または（ｂ）配列ＩＤ番号Ｓ：２～５０のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる少なくとも１つのポリヌクレオチドをさらに含むことができる。

【0052】

キットのいくつかの実施形態によれば、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００に加えて、表１に列挙された他のトップ２０のｍｉＲＮＡの１つ以上をさらに含む。これに対応して、キットの構成要素（１）において、少なくとも１つの核酸は、任意選択で、厳しい条件下で、（ａ）配列ＩＤ番号Ｓ：２～２０のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または（ｂ）配列ＩＤ番号Ｓ：２～２０のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる少なくとも１つのポリヌクレオチドをさらに含むことができる。

【0053】

ここでさらに任意に、ｍｉＲＮＡバイオマーカーセットは、表１の上位２０のｍｉＲＮＡからなり、これに対応して、キットの成分（１）において、少なくとも１つの核酸は、厳しい条件下で、ａ）配列ＩＤ番号Ｓ：１～２０のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または（ｂ）配列ＩＤ番号Ｓ：１～２０のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる合計２０のポリヌクレオチドをさらに含むことができる。

【0054】

キットのいくつかの実施形態によれば、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００に加えて、表１に列挙された他の上位４のｍｉＲＮＡの１つ以上をさらに含む。これに対応して、キットの構成要素（１）において、少なくとも１つの核酸は、任意選択で、厳しい条件下で、（ａ）配列ＩＤ番号Ｓ：２～４のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続したヌクレオチドを含むそのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または（ｂ）配列ＩＤ番号Ｓ：２～４のいずれか１つのヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続したヌクレオチドを含むそのフラグメントに相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかに特異的にハイブリダイズすることができる少なくとも１つのポリヌクレオチドをさらに含むことができる。

【0055】

ここでさらに任意に、ｍｉＲＮＡバイオマーカーセットは、表１の上位４つのｍｉＲＮＡ、すなわちｈｓａ－ｍｉＲ－５１００、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、およびｈｓａ－ｍｉＲ－４７８７－３ｐからなり、これに対応して、キットの成分（１）において、少なくとも１つの核酸は、厳しい条件下で、（ａ）配列ＩＤ番号Ｓ：１～４のヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するそれらの変異体、または各々１５個以上の連続したヌクレオチドを含むそれらのフラグメントを含むか、またはそれらからなるポリヌクレオチドか、または（ｂ）配列ＩＤ番号Ｓ：１～４のヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するそれらの変異体、または各々１５個以上の連続したヌクレオチドを含むそれらのフラグメントに各々相補的なヌクレオチド配列を含むか、またはそれらからなるポリヌクレオチドか、のいずれかと特異的にハイブリダイズすることができる合計４つのポリヌクレオチドをさらに含むことができる。

【0056】

キットにおいて、構成要素（２）の第１の指示の第１のサブ指示において、診断指数は、重み付けされていないモデルを介して、または代替的に、第１の側面において上記で提供された確率モデリング統計モデルの１つからの重みを使用する重み付けされたモデルを介して算出することができる。ここで、キットのいくつかの実施形態によれば、診断指数は、リンマモデルからの重みを使用する加重モデルを介して算出される。

【0057】

キットのいくつかの実施形態によれば、事前決定閾値は１１１０として設定することができ、第２の指示はさらに、事前決定閾値として１１１０を使用する分類が０．９５を超える特異度を有することを示す。キットの他のいくつかの実施形態によれば、事前決定閾値は１２００として設定することができ、第２の指示はさらに、事前決定閾値として１２００を使用するそのような分類が０．９９を超える特異度を有することを示す。

【0058】

キットのいくつかの実施形態によれば、第１の指示は、第１のサブ指示に従って算出された診断指数に基づいて正規化診断指数を取得するための第２のサブ指示をさらに含み、第２の指示において、被験者は、正規化診断指数が予め設定されたカットポイント以上であれば癌を有するものとして分類され、そうでなければ癌を有さないものとして分類される。この正規化処理は、上記第１の方法の態様で述べた正規化処理と実質的に同一であるが、ここではその説明を省略する。

【0059】

オプションとして、正規化診断指数は、リンマモデルからの重みを使用する重み付きモデルを介して算出され、第１のプリセット値は０であり、第２のプリセット値は１０である。さらに、プリセットカットポイントは５．１または６．０として任意に設定することができ、これによりプリセットカットポイントを用いた分類がそれぞれ０．９５または０．９９を超える特異度を有することができる。

【0060】

異なる実施形態によれば、キットの構成要素（２）の少なくとも１つの指示は、被験体の評価を実施するための第３の指示をさらに含むことができ、前記評価は、癌の診断または癌の再発の検出を含む；あるいは、被験体が癌を有すると分類された場合に、被験体に治療レジメンを投与するための第４の指示をさらに含むことができる。

【0061】

いくつかの実施形態によれば、キットにおける構成要素（２）の少なくとも１つの指示は、ｍｉＲＮＡバイオマーカーセットの発現プロファイルを得るための第１の追加の指示をさらに含み得、これは、少なくとも１つの核酸によってノーザンブロッティング、マイクロアレイ解析、ＲＮＡ配列決定、またはＲＮＡインサイチュハイブリダイゼーションを実施するための手順を含む。ここで、少なくとも１つの核酸は、任意選択で分子アレイ上に配置することができる。

【0062】

いくつかの実施形態によれば、キットは、増幅プライマーの少なくとも１つのセットをさらに含んでもよく、各セットは、生物学的試料からｍｉＲＮＡバイオマーカーセット中の少なくとも１つのｍｉＲＮＡのそれぞれを特異的に増幅することができる。このように、キットにおける構成要素（２）の少なくとも１つの指示は、ｍｉＲＮＡバイオマーカーセットの発現プロファイルを得るための第２の追加の指示をさらに含んでもよく、これは、少なくとも１つの核酸および少なくとも１セットの増幅プライマーによって逆転写ＰＣＲ（ＲＴ－ＰＣＲ）、定量的ＲＴ－ＰＣＲ（ｑＲＴ－ＰＣＲ）、またはデジタルＲＴ－ＰＣＲを実施する手順を含む。

【0063】

上記のようなキットの任意の実施形態において、生物学的試料は、血液試料、血清試料、血漿試料、尿試料、唾液試料、および喀痰試料からなる群から選択される液体生検試料であり得る。

【0064】

第３の態様において、本開示はさらに、対象における癌を検出するためのシステムを提供する。ここで、本システムは、実質的に、ハードウェア（例えば、プロセッサ、メモリ、Ｉ／Ｏインターフェース、記憶媒体など）およびソフトウェア（すなわち、オペレーションシステムソフトウェア、および特定のプログラムソフトウェアなどを含むコンピュータプログラム）の集合体からなるコンピュータ化システムであり、これらは、第１の側面において上述したような方法の全部または一部の工程を集合的に実施するように協働するように構成される。いくつかの実施形態によれば、システムは、プロセッサと、非一過性記憶媒体とを含む。非一過性記憶媒体は、プロセッサによる実行のためのソフトウェア（すなわち、プログラム・インストラクション）を含むように構成され、プログラム・インストラクションは、第１の側面で上述した方法の様々な異なる実施形態に従って、プロセッサに方法の様々な工程を実行させるように構成される。

【0065】

第４の態様において、本開示は、プロセッサによって実行されるとき、プロセッサに、第１の態様において上述された方法の様々な異なる実施形態に従った方法を実行させる、コンピュータ実行可能なプログラム指示を記憶するように構成された、非一過性記憶媒体をさらに提供する。

【0066】

ｍｉＲＮＡバイオマーカーセットにどのようなｍｉＲＮＡ成分が含まれるか、診断指標に対して正規化が行われるかどうか、どのように行われるか、被験者が癌を有するか否かについてどのように分類されるか、生物学的試料にどのような試料を使用できるか、どのような検出精度レベルを達成するか、等を含む、以下の要素／特徴に関する、上述のシステム及び非一過性記憶媒体に関する様々な異なる実施形態が存在し得る。これらの異なる実施形態についての具体的な詳細は、第１の態様で説明したような方法の様々な実施形態を参照することができ、本明細書では簡潔にするために省略する。

【0067】

別段の定義がない限り、本開示全体を通じて使用される用語の定義は以下の通りである。

【0068】

一般的には、ヒト、チンパンジーなどの霊長類、イヌ、ネコなどの愛玩動物、ウシ、ウマ、ヒツジ、ヤギなどの畜産動物、マウス、ラットなどのげっ歯類などの哺乳動物をいう。また、「健常者」とは、検出すべき癌のない哺乳動物を意味する。本開示全体は、より具体的にはヒト被験体に関するものであるが、任意に他の非ヒト哺乳動物にも適用できることに留意されたい。

【0069】

「核酸」、「ヌクレオチド」、「ポリヌクレオチド」、「ＤＮＡ」、「ＲＮＡ」および「ｍｉＲＮＡ」などの用語または略語は、特に指示または定義がない限り、当技術分野における一般的な用法に従う。

【0070】

本明細書では、「ポリヌクレオチド」という用語は「核酸」と互換性があり、ＲＮＡ、ＤＮＡ、およびＲＮＡ／ＤＮＡ（キメラ）のすべてを含む核酸を指す。ＤＮＡは、ｃＤＮＡ、ゲノムＤＮＡ、合成ＤＮＡのすべてを含む。ＲＮＡは、ｔｏｔａｌＲＮＡ、ｍＲＮＡ、ｒＲＮＡ、ｍｉＲＮＡ、ｓｉＲＮＡ、ｓｎｏＲＮＡ、ｓｎＲＮＡ、ｎｏｎ－ｃｏｄｉｎｇＲＮＡ、合成ＲＮＡの全てを含む。

【0071】

本明細書で使用される場合、用語「フラグメント」は、ポリヌクレオチドの連続部分を有するヌクレオチド配列を有するポリヌクレオチドであり、望ましくは１５以上のヌクレオチド、例えば１５、１６、１７、１８、１９などのヌクレオチドの長さを有する。

【0072】

本明細書において、「遺伝子」という用語は、ＲＮＡおよび二本鎖ＤＮＡのみならず、二本鎖を構成するプラス鎖（またはセンス鎖）または相補鎖（またはアンチセンス鎖）などの各一本鎖ＤＮＡも含むことが意図される。遺伝子の長さは特に限定されない。本明細書において、「遺伝子」には、特に指定のない限り、ヒトゲノムＤＮＡを含む二本鎖ＤＮＡ、ｃＤＮＡを含む一本鎖ＤＮＡ（プラス鎖）、プラス鎖と相補的な塩基配列を有する一本鎖ＤＮＡ（相補鎖）、ｍｉＲＮＡ（マイクロＲＮＡ）及びそれらのフラグメント、並びにそれらの転写産物の全てが含まれる。「遺伝子」には、特定の塩基配列（または配列ＩＤ番号）で表される「遺伝子」だけでなく、その遺伝子によってコードされるＲＮＡと同等の生物学的機能を有するＲＮＡをコードする「核酸」、例えば、コングナー（すなわち、ホモログまたはオルソログ）、バリアント（例えば、遺伝子多型）、および誘導体も含まれる。このようなコンジェナー、バリアント、または誘導体をコードする「核酸」の具体例としては、配列ＩＤ番号：１～１００のいずれかで表されるヌクレオチド配列の相補配列、または該ヌクレオチド配列からヌクレオチド「Ｕ」（または「ｕ」）をヌクレオチド「Ｔ」（または「ｔ」）に置換することにより誘導されるヌクレオチド配列と、後述する厳しい条件下でハイブリダイズするヌクレオチド配列を有する「核酸」を挙げることができる。「遺伝子」は、その機能領域によって特に限定されず、例えば、発現制御領域、コード領域、エクソン、またはイントロンを含むことができる。「遺伝子」は、細胞内に含まれていてもよいし、細胞外に放出されて単独で存在していてもよい。あるいは、「遺伝子」はエクソソームと呼ばれる小胞に封入された状態であってもよい。

【0073】

本開示全体の範囲内において、「マイクロＲＮＡ（ｍｉＲＮＡ）」という用語は、ヘアピン様構造を有するＲＮＡ前駆体として転写され、ＲＮアーゼＩＩＩ切断活性を有するｄｓＲＮＡ切断酵素によって切断され、ＲＩＳＣと呼ばれるタンパク質複合体に組み込まれ、ｍＲＮＡの翻訳の抑制に関与する、１５～２５ヌクレオチドの非コードＲＮＡを意味することが意図されるが、特に明記しない。本明細書で使用する「ｍｉＲＮＡ」という用語は、特定のヌクレオチド配列（または配列ＩＤ番号）で表される「ｍｉＲＮＡ」だけでなく、「ｍｉＲＮＡ」の前駆体（ｐｒｅ－ｍｉＲＮＡまたはｐｒｉ－ｍｉＲＮＡ）、およびそれと同等の生物学的機能を有するｍｉＲＮＡ、例えば、コングナー（すなわち、ホモログまたはオルソログ）、バリアント（例えば、遺伝子多型）、および誘導体を含む。このような前駆体、共役体、変異体、または誘導体は、ｍｉＲＢａｓｅＲｅｌｅａｓｅ２０（ＫｏｚｏｍａｒａａｎｄＧｒｉｆｆｉｔｈｓ－Ｊｏｎｅｓ，２０１０）を用いて特異的に同定することができ、その例としては、配列ＩＤ番号Ｓ：１～１００のいずれかで表される任意の特定のヌクレオチド配列の相補配列と後述する厳しい条件下でハイブリダイズするヌクレオチド配列を有する「ｍｉＲＮＡ」を挙げることができる。本明細書で使用する用語「ｍｉＲＮＡ」は、ｍｉＲＮＡ遺伝子の遺伝子産物であってもよい。このような遺伝子産物には、成熟ｍｉＲＮＡ（例えば、上記のようなｍＲＮＡの翻訳抑制に関与する１５～２５ヌクレオチドまたは１９～２５ヌクレオチドの非コードＲＮＡ）またはｍｉＲＮＡ前駆体（例えば、ｐｒｅ－ｍｉＲＮＡまたはｐｒｉ－ｍｉＲＮＡ）が含まれる。

【0074】

本明細書で使用される場合、「プローブ」という用語には、遺伝子の発現に起因するＲＮＡ、またはＲＮＡに由来するポリヌクレオチド、および／またはそれに相補的なポリヌクレオチドを特異的に検出するために使用されるポリヌクレオチドが含まれる。

【0075】

本明細書で使用される場合、用語「プライマー」または「増幅プライマー」は、遺伝子またはＲＮＡ由来のポリヌクレオチドの発現から生じるＲＮＡ、および／またはそれに相補的なポリヌクレオチドを特異的に認識して増幅するポリヌクレオチドを含む。

【0076】

この文脈において、相補的ポリヌクレオチド（相補鎖または逆鎖）とは、配列ＩＤ番号．１～１００のいずれかで定義されるヌクレオチド配列、またはヌクレオチド「Ｕ」（もしくは「ｕ」）をヌクレオチド「Ｔ」（もしくは「ｔ」）に置換することによってこのヌクレオチド配列から誘導されるヌクレオチド配列、またはその部分配列（ここでは、この全長配列または部分配列を便宜上プラス鎖と称する）からなる。ただし、このような相補鎖は、標的プラス鎖のヌクレオチド配列と完全に相補的な配列に限定されるものではなく、標的プラス鎖に対して厳しい条件下でハイブリダイゼーションが可能な程度の相補関係を有するものであればよい。

【0077】

本明細書において、「厳しい条件」とは、核酸プローブが標的配列に対して、他の配列よりも大きな範囲（例えば、バックグラウンド測定値の平均値＋バックグラウンド測定値の標準偏差×２以上の測定値）でハイブリダイズする条件をいう。厳しい条件は配列によって異なり、ハイブリダイゼーションを行う環境によっても異なる。核酸プローブに１００％相補的な標的配列は、ハイブリダイゼーションの厳しい条件や洗浄条件を制御することにより同定することができる。「厳しい条件」の具体例については後述する。

【0078】

本明細書で使用される場合、用語「変異体」とは、核酸の場合、多型、突然変異などに起因する天然の変異体；
配列ＩＤ番号．１～１００のいずれかで表されるヌクレオチド配列、またはヌクレオチド「Ｕ」（もしくは「ｕ」）をヌクレオチド「Ｔ」（もしくは「ｔ」）で置換することにより該ヌクレオチド配列から誘導されるヌクレオチド配列、またはその部分配列；配列ＩＤ番号．のいずれかで表される配列の時期尚早のｍｉＲＮＡのヌクレオチド配列において、１または２もしくはそれ以上のヌクレオチドの欠失、置換、付加または挿入を含む変異体；配列ＩＤ番号．のいずれかで表される配列の時期尚早のｍｉＲＮＡのヌクレオチド配列において、１または２もしくはそれ以上のヌクレオチドの欠失、置換、付加または挿入を含む変異体：１～１００で表される配列の早発型ｍｉＲＮＡのヌクレオチド配列、または該ヌクレオチド配列からヌクレオチド「Ｕ」（または「ｕ」）をヌクレオチド「Ｔ」（または「ｔ」）に置換することにより誘導されるヌクレオチド配列、またはその部分配列；これらのヌクレオチド配列またはその部分配列のそれぞれに対して約９０％以上、約９５％以上、約９７％以上、約９８％以上、約９９％以上の同一性を示す変異体；または、これらのヌクレオチド配列またはその部分配列の各々からなるポリヌクレオチドまたはオリゴヌクレオチドに、上記で定義した厳しい条件下でハイブリダイズする核酸。変異体は、部位特異的突然変異誘発またはＰＣＲベースの突然変異誘発のような周知の技術を用いて調製することができる。

【0079】

パーセント（％）同一性」という用語は、上述のＢＬＡＳＴまたはＦＡＳＴＡに基づくタンパク質または遺伝子検索システムを用いて、導入されたギャップの有無にかかわらず決定することができる（Ｚｈａｎｇら、２０００；Ａｌｔｓｃｈｕｌら、１９９０；Ｐｅａｒｓｏｎら、１９８８）。

【0080】

「誘導体」という用語は、修飾された核酸、例えば、フルオロフォアなどで標識された誘導体、修飾されたヌクレオチドを含む誘導体（例えば、例えば、ハロゲン、メチルなどのアルキル、メトキシ、チオ、カルボキシメチルなどのアルコキシ、塩基転位、二重結合飽和、脱アミノ化、酸素分子の硫黄原子への置換などを受けたヌクレオチド）、ＰＮＡ（ペプチド核酸；Ｎｉｅｌｓｅｎら、１９９１）、ＬＮＡ（ロックド核酸；Ｏｂｉｋａら、１９９８）などを含むヌクレオチドが挙げられる。

【0081】

上記のｍｉＲＮＡから選択されるポリヌクレオチドと特異的に結合可能な「核酸」は、合成または調製された核酸であり、具体的には「核酸プローブ」または「プライマー」が挙げられる。「核酸」は、被験体における癌の有無の検出、癌の重症度、改善度、治療感受性の診断、癌の予防、改善、治療に有用な候補物質のスクリーニングなどに直接的または間接的に利用される。「核酸」には、配列ＩＤ番号：１～１００のいずれかで表される転写産物またはその合成ｃＤＮＡ核酸を、生体内、特に体液（例えば、血液または尿）などの試料中で、癌の発生に関連して特異的に認識し、結合することができるヌクレオチド、オリゴヌクレオチドおよびポリヌクレオチドが含まれる。本発明のヌクレオチド、オリゴヌクレオチドおよびポリヌクレオチドは、上記のような性質に基づいて、生体内、組織内、細胞内などで発現する前記遺伝子を検出するためのプローブとして、または生体内で発現する前記遺伝子を増幅するためのプライマーとして、有効に利用することができる。

【0082】

本明細書で使用される用語「検出」は、用語「検査」、「測定」、または「検出または決定支援」と交換可能である。本明細書において、「評価」という用語は、検査結果または測定結果に基づく診断または評価支援を含むことを意味する。

【0083】

本開示の範囲内で使用される場合、「Ｐ値」、「正確度」、「ＡＵＣ」、「感度」、および「特異度」の各用語は、一般に、当業者によく理解される共通の定義を有すると理解され、具体的には以下のように定義される：

【0084】

「Ｐ値」または「Ｐ」という用語は、「ｐ値」または「ｐ」と交換可能であると考えられ、統計的検定において、帰無仮説の下でデータから実際に算出された統計量よりも極端な統計量が観察される確率を指す。したがって、「Ｐ」または「Ｐ値」が小さければ小さいほど、比較対象者間の有意差が大きいことを意味する。

【0085】

「ＡＵＣ」とは、ＲｅｃｅｉｖｅｒＯｐｅｒａｔｉｎｇＣｈａｒａｃｔｅｒｉｓｔｉｃ曲線の曲線下面積を意味する。「精度」とは、（真陽性数＋真陰性数）／（総症例数）の値を意味する。精度は、全検体に対する正しく同定された検体の割合を示し、検出性能を評価する主要な指標となる。

【0086】

本明細書において、「感度」という用語は、（真陽性数）／（真陽性数＋偽陰性数）の値を意味する。感度が高ければ、癌を検出することができ、臨床的な治療介入につながる。

【0087】

本明細書において、「特異度」という用語は、（真陰性の数）／（真陰性の数＋偽陽性の数）の値を意味する。特異度が高いことで、癌患者であると誤判定された健常者の余計な検査を防ぐことができ、患者の負担軽減や医療費削減につながる。

【0088】

別段の定めがない限り、ｍｉＲＮＡバイオマーカーセットの発現プロファイルの決定に使用できる利用可能な技術を以下に要約する。

【0089】

ｍｉＲＮＡバイオマーカーセットの発現プロファイルの決定には、ｍｉＲＮＡバイオマーカーセットに含まれる一つ一つのｍｉＲＮＡの発現レベルの決定が実質的に含まれることに留意されたい。好ましくは、ｍｉＲＮＡバイオマーカーセットに含まれる全てのｍｉＲＮＡの発現レベルは、十分に制御された１回の実験で同時に決定することができる。しかし、任意で、これらのｍｉＲＮＡの発現レベルは、複数の実験で、異なる実験手順によって決定されることが可能である。

【0090】

本明細書において、ｍｉＲＮＡバイオマーカーセットに含まれるｍｉＲＮＡの発現を測定または検出することは、ｍｉＲＮＡに対応する核酸転写物を測定または検出することを含む。

【0091】

典型的には、発現はｍｉＲＮＡまたは対応する逆転写ｃＤＮＡレベルに基づいて検出または測定することができる。ＲＮＡレベルまたはｃＤＮＡレベルを測定するための定量的または定性的な方法はいずれも使用できる。ｍｉＲＮＡまたはｃＤＮＡレベルを検出または測定する適切な方法としては、例えば、ノーザンブロッティング、マイクロアレイ解析、ＲＮＡ配列決定、ＲＮＡインサイチュハイブリダイゼーション、または逆転写ＰＣＲ（ＲＴ－ＰＣＲ）もしくはリアルタイムＲＴ－ＰＣＲ（定量的ＲＴ－ＰＣＲ（ｑＲＴ－ＰＣＲ）としても知られる）、またはデジタルＲＴ－ＰＣＲなどの核酸増幅手順が挙げられる。このような方法は当技術分野でよく知られている（例えば、ＧｒｅｅｎａｎｄＳａｍｂｒｏｏｋｅｔａｌ．）その他の技術としては、ｎＣｏｕｎｔｅｒ（登録商標）（ＮａｎｏＳｔｒｉｎｇＴｅｃｈｎｏｌｏｇｉｅｓ，Ｓｅａｔｔｌｅ，ＷＡ）遺伝子発現アッセイなどの遺伝子発現のデジタル多重解析があり、ＵＳ２０１００１１２７１０およびＵＳ２０１０００４７９２４にさらに記載されている。

【0092】

目的の核酸を検出するには、一般に標的（例えばｍｉＲＮＡやｃＤＮＡ）とプローブとのハイブリダイゼーションが必要である。様々な癌遺伝子の発現プロファイルに用いられているｍｉＲＮＡの配列は既知である。したがって、当業者であれば、それらのｍｉＲＮＡを検出するためのハイブリダイゼーションプローブを容易に設計することができる（例えば、ＧｒｅｅｎａｎｄＳａｍｂｒｏｏｋｅｔａｌ．）例えば、本明細書に記載のｍｉＲＮＡ転写物（またはそれから合成されたｃＤＮＡ）に特異的に結合するポリヌクレオチドプローブは、ｍｉＲＮＡまたはｃＤＮＡターゲットの核酸配列そのものを用いて、ルーティンな技術（例えば、ＰＣＲまたは合成）によって作成することができる。本明細書で使用する場合、「プローブ」という用語は、約１０個以上の連続したヌクレオチド、約１５個以上の連続したヌクレオチド、約２０個以上の連続したヌクレオチドからなるポリヌクレオチド配列の一部または部分を意味する。特定の実施形態では、ポリヌクレオチドプローブは、１０個以上の核酸、１５個以上の核酸、または２０個以上の核酸を含む。十分な特異性を付与するために、プローブは、例えば、周知のＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌ（ＢＬＡＳＴ）アルゴリズム（ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（ＮＣＢＩ）、Ｂｅｔｈｅｓｄａ、Ｍｄ．を通じて入手可能）を使用して決定されるように、約９５％以上（例えば、約９８％以上または約９９％以上）などの約９０％以上の標的配列の相補体に対する配列同一性を有し得る。

【0093】

各プローブは、クロスハイブリダイゼーションや偽陽性を避けるために、その標的に対して実質的に特異的であってもよい。特異的なプローブを使う代わりに、転写産物から材料を得る際に特異的な試薬を使う方法もある（例えば、ｃＤＮＡ生産時、または増幅時に標的特異的プライマーを使う）。どちらの場合も、分析対象のｍｉＲＮＡのグループ内で実質的にユニークな部分へのハイブリダイゼーションによって特異性を得ることができる。ターゲットに複数のスプライスバリアントがある場合、それぞれのバリアントに共通する領域を認識するハイブリダイゼーション試薬をデザインすること、および／または、それぞれが１つ以上のバリアントを認識する複数の試薬を使用することが可能である。

【0094】

ハイブリダイゼーション反応の厳しい条件は当業者であれば容易に決定でき、一般的にはプローブの長さ、洗浄温度、塩濃度に依存する経験的な算出である。一般に、長いプローブは適切なアニーリングのために高い温度を必要とし、短いプローブは低い温度を必要とする。ハイブリダイゼーションは一般に、相補鎖が融解温度以下の環境に存在するとき、変性した核酸配列が再アニーリングする能力に依存する。プローブとハイブリダイズ可能な配列間の相同性が高ければ高いほど、使用できる相対温度は高くなる。その結果、相対温度が高いほど反応条件は厳しくなり、低いほど反応条件は緩やかになる。

【0095】

本明細書で定義される「厳しい条件」または「さらに厳しい条件」は、以下のものによって特定されるが、これらに限定されるものではない：（１）洗浄に低イオン強度と高温を使用する、例えば５０℃で０．０１５Ｍ塩化ナトリウム／０．００１５Ｍクエン酸ナトリウム／０．１％ドデシル硫酸ナトリウム；（２）ハイブリダイゼーション中に変性剤、例えばホルムアミドを使用する、例えば５０％（ｖ／ｖ）ホルムアミドに０．１％ウシ血清アルブミン／０．１％フィコール／０．１％ポリビニルピロリドン／５０ｍＭリン酸ナトリウム緩衝液、ｐＨ６．５、７５０ｍＭ塩化ナトリウム、７５ｍＭクエン酸ナトリウム、４２℃；または（３）５０％ホルムアミド、５×ＳＳＣ（０．７５ＭのＮａＣｌ、０．０７５Ｍのクエン酸ナトリウム）、５０ｍＭのリン酸ナトリウム（ｐＨ６．８）、０．１％のピロリン酸ナトリウム、５×デンハルト溶液、超音波処理したサケ精子ＤＮＡ（５０μｇ／ｍｌ）、０．１％ＳＤＳ、および１０％デキストラン硫酸で４２℃、０．２×ＳＳＣ（塩化ナトリウム／クエン酸ナトリウム）および５０％ホルムアミドで４２℃、５５℃で洗浄し、その後ＥＤＴＡを含む０．１×ＳＳＣで５５℃、さらに厳しい条件で洗浄する。「中程度に厳しい条件」は、Ｓａｍｂｒｏｏｋら、１９８９に記載されているが、これに限定されるものではなく、上記の条件よりも厳しい条件でない洗浄液およびハイブリダイゼーション条件（例えば、温度、イオン強度および％ＳＤＳ）の使用を含む。中程度に厳しい条件の例は、以下からなる溶液中で、３７℃で一晩インキュベートすることである：２０％ホルムアミド、５×ＳＳＣ（１５０ｍＭＮａＣｌ、１５ｍＭクエン酸三ナトリウム）、５０ｍＭリン酸ナトリウム（ｐＨ７．６）、５×デンハルト溶液、１０％デキストラン硫酸、および２０ｍｇ／ｍＬの変性剪断サケ精子ＤＮＡからなる溶液中で３７℃で一晩インキュベートした後、約３７～５０℃で１×ＳＳＣ中でフィルターを洗浄する。当業者であれば、プローブの長さなどの因子に対応するために、必要に応じて温度やイオン強度などを調整する方法を認識するであろう。

【0096】

特定の実施形態では、マイクロアレイ分析、ノーザンブロット、ＲＮＡインサイチュハイブリダイゼーション、またはＰＣＲベースの方法が使用される。この点に関して、生物学的試料における前述のｍｉＲＮＡの発現を測定することは、例えば、癌細胞を含むかまたは含む疑いのある試料を、目的のｍｉＲＮＡに特異的なポリヌクレオチドプローブ、または目的のｍｉＲＮＡの一部を増幅するように設計されたプライマーと接触させ、核酸標的へのプローブの結合または核酸の増幅をそれぞれ検出することからなり得る。ＰＣＲプライマーを設計するための詳細なプロトコールは当技術分野で知られている（例えば、ＧｒｅｅｎａｎｄＳａｍｂｒｏｏｋｅｔａｌ．）特定の実施形態において、試料から得られたｍｉＲＮＡはｑＲＴ－ＰＣＲに供され得る。逆転写は、ＯｍｎｉｓｃｒｉｐｔＲＴＫｉｔ（Ｑｉａｇｅｎ）の使用など、当技術分野で公知の任意の方法によって行うことができる。得られたｃＤＮＡは、当技術分野で公知の任意の増幅技術によって増幅される。ｍｉＲＮＡ発現は、次に、例えば、以下に記載するような対照試料を使用して分析される。本明細書に記載されるように、コントロールに対するｍｉＲＮＡの過剰発現または過小発現を測定して、個々の生物学的試料のｍｉＲＮＡ発現プロファイルを決定することができる。同様に、ｍｉＲＮＡ発現を分析するためにマイクロアレイを調製し使用するための詳細なプロトコールは当技術分野で知られており、本明細書に記載されている。

【0097】

本明細書で使用するＲＮＡ－ｓｅｑｕｅｎｃｉｎｇ（ＲＮＡ－ｓｅｑ）は、ＷｈｏｌｅＴｒａｎｓｃｒｉｐｔｏｍｅＳｈｏｔｇｕｎＳｅｑｕｅｎｃｉｎｇとも呼ばれ、ＲＮＡ転写産物の存在および量をリアルタイムで検出するために使用される様々な高スループット配列決定技術のいずれかを指す。Ｗａｎｇ，Ｚ．，Ｍ．Ｇｅｒｓｔｅｉｎ，ａｎｄＭ．Ｓｎｙｄｅｒ，ＲＮＡ－Ｓｅｑ：ａｒｅｖｏｌｕｔｉｏｎａｒｙｔｏｏｌｆｏｒｔｒａｎｓｃｒｉｐｔｏｍｉｃｓ，ＮＡＴＲＥＶＧＥＮＥＴ，２００９を参照。１０（１）：ｐ．５７－６３．ＲＮＡ－ｓｅｑは、ある瞬間のゲノムから試料のｍｉＲＮＡのスナップショットを明らかにするために用いることができる。特定の実施形態では、ｍｉＲＮＡは、配列決定の前に逆転写を介してｃＤＮＡフラグメントに変換され、特定の実施形態では、ｍｉＲＮＡは、ｃＤＮＡに変換することなく直接配列決定することができる。アダプターをｍｉＲＮＡの５'末端および／または３'末端に結合させ、ｍｉＲＮＡまたはｃＤＮＡを任意に、例えばＰＣＲによって増幅することができる。フラグメントは次に、例えばＲｏｃｈｅ社（例えば４５４プラットフォーム）、Ｉｌｌｕｍｉｎａ社、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍ社（例えばＳＯＬｉＤシステム）から入手可能なような高スループットシーケンス技術を用いて配列決定される。

【図面の簡単な説明】

【0098】

【図1】図１Ａ～１Ｃは、肺癌データセット（図１Ａ、発見セットと検証セットに分割）、および卵巣癌、肝臓癌、膀胱癌データセット（図１Ｂ、冗長試料を除去した後、単一の検証データセットに統合）の症例フロー図を示し、肺癌、膀胱癌、卵巣癌、肝臓癌患者の患者と腫瘍の特性、および対応する対照の人口統計学的情報を要約している（図１Ｃ）；

【図2】図２Ａ～２Ｇは、肺癌データセットにおける４－ｍｉＲＮＡ診断モデルの開発と検証を示す図であり、図２Ａは、発見セットにおける１０重クロスバリデーションによる診断モデルのためのｍｉＲＮＡの最適数（点線）の決定を示し、図２Ｂは、発見セットにおけるＲＯＣ分析を示し、図２Ｃは、発見セットにおける正規化診断指数の分布を示し、図２Ｄは、検証セットにおけるＲＯＣ分析を示し、図２Ｅは、検証セットにおける正規化診断指数の分布を示し、図２Ｆは、対になった血清試料（前と後）の正規化診断指数の比較を示す。検証セットにおけるＲＯＣ分析を示す図２Ｄ、検証セットにおける正規化診断指標の分布を示す図２Ｅ、１８０人の肺癌患者の対血清試料（手術前と手術後）の正規化診断指標の比較を示す図２Ｆ、検証セットの臨床サブセットにおける正規化診断指標の分布を示す図２Ｇ。点線の水平線は、我々のモデルの正規化診断指数のカットポイントを示す。グラフに示されたパーセンテージは、各癌サブグループにおける感度である。

【図3】図３Ａおよび図３Ｂは、追加癌のデータセットにおける４－ｍｉＲＮＡ診断モデルの性能を示し、図３ＡはＲＯＣ解析を、図３Ｂは４－ｍｉＲＮＡモデルの正規化診断指標の分布を示す。グラフに示されたパーセンテージは、各癌種の感度と非癌対照の特異度である；

【図4】図４Ａおよび４Ｂは、肺癌データセットにおけるＲＯＣ解析と、年齢および性別グループ間の正規化診断指数の分布を示す。

【発明を実施するための形態】

【0099】

本開示は、方法、キットおよびコンピュータ化システムを含むアプローチであって、対象から得られた生物学的試料から決定される、少なくとも１つのｍｉＲＮＡからなるｍｉＲＮＡバイオマーカーセットの発現プロファイルに基づいて、対象の１つまたは複数のヒト癌を正確かつ確実に検出することができるアプローチを提供する。

【0100】

本項の第一の側面では、約０．７８０以上のＡＵＣ値を有する診断精度を達成することができる検出方法が提供され、この方法は実質的に以下の３つの工程を含む：

【0101】

工程（１）：ｍｉＲＮＡバイオマーカーセットの発現プロファイルを決定する；

【0102】

工程（２）：ｍｉＲＮＡバイオマーカーセットの発現プロファイルに基づいて、生物学的試料の診断指標を算出する。診断指標は以下に基づいて算出される：

【数4】

ここで、ｎは、ｍｉＲＮＡバイオマーカーセット中のｍｉＲＮＡの総数であり、ｍｉＲＮＡ_ｉは、ｍｉＲＮＡバイオマーカーセット中のｉ^ｔｈｍｉＲＮＡの発現レベルであり、ｉは、０より大きくｎ以下の整数であり、ｔ_ｉは、ｉ^ｔｈｍｉＲＮＡの重みである；および

【0103】

【0104】

ここで、ｍｉＲＮＡバイオマーカーセットは、ｈｓａ－ｍｉＲ－５１００を含み、任意選択で、表１（実施例１参照）に列挙されたｍｉＲＮＡのいずれか１つまたは組み合わせをさらに含み得る。異なる実施形態によれば、ｈｓａ－ｍｉＲ－５１００に加えて、ｍｉＲＮＡバイオマーカーセットは、表１の上位２～１００のｍｉＲＮＡからのｍｉＲＮＡ（複数可）をさらに含み得るか、またはその代わりに、上位２～５０のｍｉＲＮＡからのｍｉＲＮＡ（複数可）をさらに含み得るか、またはその代わりに、上位２～２０のｍｉＲＮＡからのｍｉＲＮＡ（複数可）をさらに含み得るか、またはその代わりに、上位２～４のｍｉＲＮＡからのｍｉＲＮＡ（複数可）をさらに含み得る。

【0105】

好ましくは、ｍｉＲＮＡバイオマーカーセットは、上位４つのｍｉＲＮＡ（すなわち、ｈｓａ－ｍｉＲ－５１００、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、及びｈｓａ－ｍｉＲ－４７８７－３ｐ）からなる。ここで、異なる実施形態に応じて、少なくとも本方法が特定の癌種を正確に検出できる異なるＡＵＣカットオフレベル（例えば、０．７８０、０．８５０、０．９５０、０．９９０、および０．９９９）、または異なる感度特異性レベル（例えば、６８％－９９％、６８％－９９％、８３％－９９％、および９９％－９９％）が存在し得る。例えば、この方法は、ＡＵＣ>０．９９９、および／または感度>９９．０％、特異度>９９．０％で肺癌および胃癌を正確に検出することができる。

【0106】

式（Ｉ）に基づく診断指数の算出方法は様々である。任意選択で、算出を非加重モデルまたは加重モデルに基づくことができる。後者の状況では、ｍｉＲＮＡバイオマーカーセット内のｍｉＲＮＡの重みを取得するために、任意で異なるモデル（例えば、リンマモデル、ロジスティック回帰モデルなど）を適用することができる。

【0107】

好ましくは、診断指標は、リンマモデルからの重みを使用する加重モデルを介して算出される。ここで、本方法の工程（３）において、予め決定された閾値を１１１０として設定することにより、本方法が０．９５を超える特異度を有するようにすることができる；または任意に、予め決定された閾値を１２００として設定することにより、本方法が０．９９を超える特異度を有するようにすることができる。

【0108】

任意で、工程（２）で算出された診断指数はさらに正規化処理を受けることができ、工程（３）は、正規化された診断指数が予め設定されたカットポイントを下回らないか上回るかに基づいて癌分類を決定することができる。

【0109】

正規化処理の選択は任意であることに留意されたい。いくつかの実施形態によれば、正規化処理は数式に基づくことができる：

【数5】

ここで、ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}とｐａｒａｍ_{ｓｃａｌｅ}はそれぞれ、正規化された診断指数が第１のプリセット値以下、第２のプリセット値以下の範囲内に収まるように構成されたロケーションパラメータとスケールパラメータである。

【0110】

ここで、任意に、ｐａｒａｍ_{ｌｏｃａｔｉｏｎ}およびｐａｒａｍ_{ｓｃａｌｅ}をそれぞれ６００および１０００として選択することにより、正規化された診断指数を０から１０の間にすることができる。このような正規化の下では、プリセットカットポイントを５．１として設定することにより、特異度>０．９５を与えるか、または６．０として設定することにより、特異度>０．９９を与えることができる。

【0111】

本方法において、生物学的試料は、有利には、血液試料、血清試料、血漿試料、尿試料、唾液試料、または喀痰試料などの液体生検試料であり得る。ｍｉＲＮＡバイオマーカーセットの発現プロファイルの決定は、ノーザンブロッティング、マイクロアレイ分析、ＲＮＡシークエンシング、またはＲＮＡインサイチュハイブリダイゼーションを含む様々なプローブベースのアプローチ、または逆転写ＰＣＲ（ＲＴ－ＰＣＲ）、定量的ＲＴ－ＰＣＲ（ｑＲＴ－ＰＣＲ）、またはデジタルＲＴ－ＰＣＲを含む様々な増幅依存性アプローチによって実現することができる。

【0112】

任意選択で、本方法は、被験体が癌に罹患していると診断されるか（被験体が以前癌に罹患していなかった場合）、または被験体が癌の再発に罹患しているか（被験体が以前癌を除去する治療を受けたか、または癌に罹患していなかった場合）を判定するように、被験体の評価を実施する工程をさらに含むことができる。このような目的のために、評価はさらに、身体検査、対象からの生検の病理学的検査、免疫組織化学検査、またはＸ線、コンピュータ断層撮影（ＣＴ）、超音波検査、磁気共鳴画像などを含む画像検査を含むことができる。

【0113】

さらに任意に、本方法は、対象が癌を有すると分類された場合に、手術、放射線療法、化学療法、ホルモン療法、標的療法、免疫療法またはそれらの組み合わせなどの治療レジメンを対象に投与する工程をさらに含むことができる。

【0114】

第２の態様では、本項の第１の態様で上述したような異なる実施形態による方法の様々な工程を具体的に実施するために採用できるキットがさらに提供される。

【0115】

キットは、ｍｉＲＮＡバイオマーカーセットの発現プロファイルを決定するために使用することができる特定の物品（すなわち、ｍｉＲＮＡバイオマーカーセット中の各ｍｉＲＮＡを特異的に認識することができる１つ以上の核酸、および任意で１つ以上の増幅プライマーを含む構成要素（１））、および診断指標を算出するため、および癌分類のための特定の指示（すなわち、構成要素（２））を実質的に含む。

【0116】

ｍｉＲＮＡバイオマーカーセットに含まれるｍｉＲＮＡに応じて、成分（１）の核酸の各々は、（ａ）配列ＩＤ番号Ｓ：１－１００、１－５０、１－２０もしくは１－４に記載のヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドを含むそのフラグメント；または（ｂ）配列ＩＤ番号Ｓ：１－１００、１－５０、１－２０もしくは１－４に記載のヌクレオチド配列、その誘導体、少なくとも８０％の配列同一性を有するその変異体、または１５個以上の連続するヌクレオチドからなるそのフラグメントに相補的なヌクレオチド配列からなるか、またはそれらからなるポリヌクレオチド。

【0117】

どのようなｍｉＲＮＡ成分がｍｉＲＮＡバイオマーカーセットに含まれるか、診断指標に対して正規化を行うかどうか、どのように正規化を行うか、被験者が癌を有するか否かをどのように分類するか、生物学的試料にどのような試料を使用できるか、どのような検出精度レベルを達成するか、等を含む、以下の要素／特徴に関するキットの様々な異なる実施形態が存在し得る。これらの異なる実施形態についての具体的な詳細は、上述したような方法の様々な実施形態を参照することができ、本明細書では簡潔にするために省略する。

【0118】

このセクションの第３の側面では、コンピュータ化された解決策がさらに提供され、この解決策は、コンピュータ化された自動的な方法で、このセクションの第１の側面で上述したような方法の様々な工程を実施するために実質的に役立つ。

【0119】

このようなコンピュータによる解決策は、上述の方法の様々な工程（１）～（３）の実施が、プログラム指示からなるソフトウェアプログラムをコンピュータで実行することによって自動化されるような状況において適用することができ、高い効率性と大きな利便性といった利点をもたらす。

【0120】

具体的には、このようなコンピュータ化された解決策は、コンピュータ化されたシステムまたはコンピュータシステムを含むことができ、このシステムは、プロセッサ（すなわち、コントローラ）と、プロセッサに通信可能に結合されるコンピュータ読み取り可能な非一過性記憶媒体とを備える。コンピュータ読み取り可能な非一過性記憶媒体は、プロセッサによって実行可能なプログラム指示を記憶するように構成され、それによって、プロセッサに、上述したような方法における以下のような様々な異なる工程を実行させる：

【0121】

工程（１）：ｍｉＲＮＡバイオマーカーセットの発現プロファイルを決定する；

【0122】

工程（２）：ｍｉＲＮＡバイオマーカーセットの発現プロファイルに基づいて、式（Ｉ）に従って、生物学的試料の診断指標を算出する工程；および

【0123】

工程（３）：算出された診断指標の値に基づいて、被験者を癌に罹患しているか否かを分類する。

【0124】

本明細書で使用される場合、「プロセッサ」は、「中央制御装置」または「中央演算装置（ＣＰＵ）」と交換可能であると解釈され、シングルコアまたはマルチコアプロセッサ、または並列処理のための複数のプロセッサとみなすことができる。本明細書で使用する「非一過性」という用語は、電磁信号を伝搬しない有形のコンピュータ読み取り可能な記憶媒体を説明することを意図しているが、この語句によって包含される物理的なコンピュータ読み取り可能な記憶装置のタイプを他の方法で限定することを意図していない。例としては、電子、磁気、または光媒体（例えば、ディスクまたはＣＤ／ＤＶＤ－ＲＯＭ）、または不揮発性メモリストレージ（例えば、「フラッシュ」メモリ）などの任意の有形または非一過性記憶媒体またはメモリ媒体を挙げることができる。

【0125】

図５に示されるように、システム１００は、プロセッサ１０およびコンピュータ読み取り可能な非一過性記憶媒体２０に加えて、バス３０、メモリ４０、Ｉ／Ｏインターフェース５０、および通信インターフェース６０をさらに含むことができる。プロセッサ１０、記憶媒体２０、メモリ４０、Ｉ／Ｏインターフェース５０、および通信インターフェース６０はすべて、バス３０を介して互いに通信可能に結合される。

【0126】

記憶媒体２０は、プロセッサ１０によって実行されると、プロセッサ１０に上述の方法の工程（１）～（３）を実行させるコンピュータ実行可能なプログラム指示を記憶する。メモリ４０は、記憶媒体２０から取得されたプログラム指示を一時的に記憶するように構成され、プロセッサ１０は、メモリ４０に一時的に記憶されたプログラム指示を実行するように構成される。入出力インターフェース５０は、システム１００とユーザとの間の入出力を可能にし、システム１００の制御を実現する。通信インターフェース６０は、システム１００を他のコンピューティングデバイスと通信可能に接続し、データを交換することを可能にする。これらのコンピュータハードウェア構成要素は、ローカルに配置することも、イントラネット、インターネット、クラウドなどのネットワークを介して遠隔配置することもできることに留意されたい。

【0127】

以下では、本開示の様々な側面において上述したような発明を説明するために、１つの実施例を提供する。

【実施例1】

【0128】

実施例１
この例では、標準化されたマイクロアレイプラットフォームに基づく４つの大規模なｍｉＲＮＡマイクロアレイデータセットを利用することで、ＭＣＥＤに対する循環細胞フリーｍｉＲＮＡに基づく診断シグネチャーの開発と検証を行っている。

【0129】

２．材料と方法
２．１．研究デザイン
３６０４人の癌患者と３９３２人の非癌対照者を含む、合計７５３６人のユニークな参加者を含む４つのマイクロアレイデータセットが今回の解析に含まれ、これらはすべて、標準化されたマイクロアレイプラットフォームを使用して、１３の癌種にわたる５万人以上の参加者の血清ｍｉＲＮＡの特徴を明らかにするために設計された、日本の全国研究プロジェクト「体液中ｍｉＲＮＡ検出のための開発および診断技術」に由来する研究から得られた（Ａｓａｋｕｒａｅｔａｌ．２０２０、Ｙｏｋｏｉｅｔａｌ．２０１８、Ｕｓｕｂａｅｔａｌ．２０１９、Ｙａｍａｍｏｔｏｅｔａｌ．２０２０）。この４つのデータセットはもともと、それぞれ肺癌（ＧＳＥ１３７１４０）、卵巣癌（ＧＳＥ１０６８１７）、肝臓癌（ＧＳＥ１１３７４０）、膀胱癌（ＧＳＥ１１３４８６）の診断シグネチャーを開発するために集められた。

【0130】

肺癌データセットは、単一の癌種（ｎ＝１５６６）および非癌対照（ｎ＝２１７８）において最大の試料サイズを有する。オリジナルの肺癌研究では、肺癌の検出に対して高い感度と特異性を持つ２－ｍｉＲＮＡ診断モデル（本研究では「オリジナルの２－ｍｉＲＮＡモデル」と呼ぶ）が確立された（Ａｓａｋｕｒａｅｔａｌ．）本研究の目的は、当初、このデータセットを用いて、肺癌検出においてオリジナルの２－ｍｉＲＮＡモデルを上回る可能性のある新しい診断モデルを開発し、検証することに設定された。他の癌種のデータセットが同定されたので、新しいモデルは他の癌を検出する性能について評価された。

【0131】

２．２．参加者と血清試料
血清試料の採取については、原著論文に既述されている（朝倉ら、２０２０；横井ら、２０１８；薄葉ら、２０１９、山本ら、２０２０）。簡単に説明すると、２００８年から２０１６年の間に国立癌研究センター中央病院（ＮＣＣＨ）に紹介または入院した癌患者から、外科手術前に血清試料を採取し、４℃で１週間保存した後、さらに使用するまで－２０℃で保存した。血清採取前に術前化学療法および放射線療法を受けた癌患者は除外した。癌既往歴がなく、過去３ヵ月間に入院歴のない非癌対照の血清検体は、３つの医療機関の外来で定期的な血液検査とともに採取された：ＮＣＣＨ、国立長寿医療研究センター（ＮＣＧＧ）バイオバンク、横浜みのるクリニック（ＹＭＣ）。ＮＣＣＨから採取した血清は癌患者と同様に保存し、ＮＣＧＧとＹＭＣから採取した血清は使用まで－８０℃で保存した。本研究は、ＮＣＣＨの施設審査委員会、ＮＣＧＧの倫理・利益相反委員会、および医療法人新東会ＹＭＣの研究倫理委員会の承認を得た。各参加者から書面によるインフォームド・コンセントを得た。

【0132】

２．３．ｍｉＲＮＡマイクロアレイ発現解析
マイクロアレイ解析の詳細は、原著論文（Ａｓａｋｕｒａｅｔａｌ．）簡単に説明すると、３００μＬの血清から全ＲＮＡを抽出し、３ＤＧｅｎｅ^{（登録商標）}ｍｉＲＮＡＬａｂｅｌｉｎｇｋｉｔで標識し、ｍｉＲＢａｓｅリリース２１に登録されている２５８８のｍｉＲＮＡ配列を調査するように設計された３Ｄ－Ｇｅｎｅ^{（登録商標）}ＨｕｍａｎｍｉＲＮＡＯｌｉｇｏＣｈｉｐ（東レ、神奈川、日本）にハイブリダイズした。以下の低品質試料は除外した：ネガティブコントロールプローブの変動係数>０．１５；および３Ｄ－Ｇｅｎｅ^{（登録商標）}Ｓｃａｎｎｅｒで「不均一なスポットイメージ」として識別されたフラグ付きプローブの数>１０。ｍｉＲＮＡの存在は、シグナル強度がネガティブコントロールシグナルの平均値＋標準偏差の２倍よりも大きい場合に決定され、ネガティブコントロールシグナルを使用する際には、ランク付けされたシグナル強度の上位５％と下位５％が除去された。バックグラウンドサブトラクションは、ｍｉＲＮＡシグナルからネガティブコントロールシグナルの平均シグナル（シグナル強度でランク付けされた上位５％と下位５％を除去した後）を差し引くことで行った。マイクロアレイ間の正規化は、事前に選択した３つの内部コントロールｍｉＲＮＡ（ｍｉＲ－１４９－３ｐ、ｍｉＲ－２８６１、ｍｉＲ－４４６３）に従ってキャリブレーションすることで達成した。

【0133】

２．４．診断モデルの開発
肺癌データセットの患者は、原著（図１Ａ）と同じ発見セットと検証セットに分けられた（Ａｓａｋｕｒａｅｔａｌ．２０２０）。その理由は、（１）発見セットは、年齢、性別、喫煙歴に関して、癌と非癌の間でバランスが取れるように原著者によって選択された；（２）発見セットの非癌患者の５０％は、癌患者と同じ血清保存条件を持つＮＣＣＨの患者であり、ｍｉＲＮＡ候補の選択における潜在的なバイアスを最小限に抑えた；（３）同じ発見セットと検証セットを用いることで、新しい診断モデルとオリジナルの２－ｍｉＲＮＡモデルの直接的な性能比較が可能になるからである。診断モデルは肺癌発見セットから開発されたため、肺癌検証セットで検証した後、モデル開発には使用されなかった他の癌種を組み合わせたデータセットで、多癌診断モデルとしての能力をさらに検証した。

【0134】

発見セットにおいてＬｉｎｅａｒＭｏｄｅｌｆｏｒＭｉｃｒｏａｒｒａｙＤａｔａ（ｌｉｍｍａ）（Ｒｉｔｃｈｉｅｅｔａｌ．２０１５）を実施し、肺癌対非癌間のｍｉＲＮＡ発現差の統計的有意性を評価した。Ｒｅｃｅｉｖｅｒ'ｓＯｐｅｒａｔｉｎｇＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（ＲＯＣ）曲線解析の曲線下面積（ＡＵＣ）に基づき、最適な診断モデルのための最適なｍｉＲＮＡの数を決定するために、発見セットにおいて１０倍のクロスバリデーションを行った。診断指標は、ｍｉＲＮＡ発現量の線形和をｌｉｍｍａ統計で重み付けしたものとして算出した。診断指標のカットポイントは、診断モデルがリスクのある一般人のスクリーニング検査として使用される可能性があるため、偽陽性を最小化するために、発見セットの非癌対照の誤分類がないように選択した。

【0135】

２．５．統計分析
癌と非癌を識別する診断能は、ＲＯＣ曲線解析のＡＵＣ、感度、特異度によって決定した。２つのＲＯＣ曲線のＡＵＣの比較は、ｐＲＯＣパッケージのブートストラップ法を用いたｒｏｃ．ｔｅｓｔ関数で行った。肺癌臨床サブセットの対になった手術前と手術後の検体の感度の比較は、ＭｃＮｅｍａｒ検定で行った。ｌｉｍｍａ解析は、Ｂｉｏｃｏｎｄｕｃｔｏｒパッケージのｌｉｍｍａ（ＴｈｅＢｉｏｃｏｎｄｕｃｔｏｒＯｐｅｎＳｏｕｒｃｅＳｏｆｔｗａｒｅＦｏｒＢｉｏｉｎｆｏｒｍａｔｉｃｓ（２０２０年８月２７日アクセス））を用いて行った。すべての統計解析は、Ｒバージョン４．０．５（ＴｈｅＲＰｒｏｊｅｃｔｆｏｒＳｔａｔｉｓｔｉｃａｌＣｏｍｐｕｔｉｎｇ（２０２０年７月１５日アクセス））を用いて行った。

【0136】

３．結果
３．１．参加者とデータセット
肺癌データセットには、１５６６人の肺癌患者と２１７８人の非癌対照者が含まれていた（図１Ａ）（Ａｓａｋｕｒａｅｔａｌ．）卵巣癌データセットには、卵巣癌患者３３３人と非癌対照者２７５９人のほか、乳癌、大腸癌、食道癌、胃癌、肝癌、肺癌、膵癌、肉腫の患者からなる（図１Ｂ）（Ｙｏｋｏｉｅｔａｌ．２０１８）。肝臓癌と膀胱癌のデータセットには、胆道癌、乳癌、大腸癌、食道癌、胃癌、神経膠腫、肺癌、卵巣癌、膵臓癌、前立腺癌、肉腫の患者に加えて、それぞれ肝臓癌３４５人／非癌１０３３人、膀胱癌３９２人／非癌１００人が含まれていた（図１Ｂ）（Ｕｓｕｂａｅｔａｌ．２０１９、Ｙａｍａｍｏｔｏｅｔａｌ．２０２０）。肺癌データセットはそのままにして、他の３つのデータセット内の冗長な試料のうち、データセット間または肺癌データセット内の試料との相関が０．９９より大きいものを削除した。次に、卵巣癌、肝臓癌、膀胱癌のデータセットから得られた固有の試料を、１２種類の癌種にわたる２０３８人の癌患者と１７５４人の非癌対照者を含む、合計３７９２試料を含む単一の非肺癌データセットに統合した（図１Ｂ）。

【0137】

肺癌データセットは、元の研究と同じ発見セット（ｎ＝４１６）と検証セット（ｎ＝３３２８）に分けられた（図１Ａ）。発見セットには、年齢、性別、喫煙の有無でマッチさせた２０８人の肺癌患者と２０８人の非癌対照が含まれた（Ａｓａｋｕｒａｅｔａｌ．２０２０）。検証セットには、１３５８人の肺癌患者と１９７０人の非癌対照者が含まれた。肺癌患者の内訳は、男性５７％、元または現在喫煙者６２％、腺癌７８％、扁平上皮癌１４％、病期Ｉ７２％、病期ＩＩ１５％、病期ＩＩＩ１３％であった（図１Ｃ）。

【0138】

３９２人の膀胱癌患者は平均年齢６８歳、７２％が男性、５％が転移、１２％がリンパ節転移陽性、７７％がＴ２以下、８０％が高悪性度であった（図１Ｃ）。卵巣癌患者３３３人は平均年齢５７歳、Ｉ期２５％、ＩＩ期１０％、組織型は漿液性５５％、明細胞１９％、子宮内膜症１３％であった（図１Ｃ）。肝臓癌患者３４８人は平均年齢６８歳、７８％が男性、３７％がＩ期、３３％がＩＩ期であった（図１Ｃ）。その他の癌に関する詳細な人口統計学的情報および腫瘍の特徴は、元の研究からは提供されていない。

【表1】

【0139】

３．２．診断モデルの開発
診断モデルの開発は、２０８人の肺癌患者と２０８人の非癌対照者を含む肺癌データセットのディスカバリーセットで行われた（図１Ａ）。肺癌患者と非癌対照者間のｍｉＲＮＡ発現差の統計的有意性を評価するためにｌｉｍｍａ解析が用いられた。上位１００の発現差のあるｍｉＲＮＡを表１に示した。１０重クロスバリデーションにより、調整ｐ値でランク付けされた上位４つのｍｉＲＮＡ（ｈｓａ－ｍｉＲ－５１００、ｈｓａ－ｍｉＲ－１３４３－３ｐ、ｈｓａ－ｍｉＲ－１２９０、ｈｓａ－ｍｉＲ－４７８７－３ｐ）を用いた診断モデルが、ＲＯＣ曲線解析において最良のＡＵＣをもたらすことが示された（図２Ａ）。４つのｍｉＲＮＡ発現レベルの加重和で算出され、０から１０の範囲で正規化された診断指標は、ほぼ完璧なＡＵＣ値０．９９９（図２Ｂ）を示し、元の論文（Ａｓａｋｕｒａｅｔａｌ．２０２０）の２－ｍｉＲＮＡモデルのＡＵＣ値０．９９３（ｐ＝０．１６）よりも数値的に優れていた。６というカットポイントは、偽陽性を最小化するために、発見セット中の非癌対照の誤分類がないように選択され、その結果、感度９８％、特異度１００％（図２Ｃ）となり、オリジナルの２－ｍｉＲＮＡモデル（Ａｓａｋｕｒａｅｔａｌ．２０２０）では感度、特異度ともに99％であった。

【0140】

３．３．肺癌検証セットにおける診断モデルの検証
４－ｍｉＲＮＡモデルの性能は、１３５８人の肺癌患者と１９７０人の非癌対照を含む肺癌検証セット（ｎ＝３３２８）で評価された。４－ｍｉＲＮＡモデルは０．９９９のＡＵＣを達成し（図２Ｄ）、オリジナルの２－ｍｉＲＮＡモデル（Ａｓａｋｕｒａｅｔａｌ．２０２０）のＡＵＣ０.９９６より有意に良好であった（P＝０.０１）。オリジナルの２－ｍｉＲＮＡモデル（Ａｓａｋｕｒａｅｔａｌ．また、オリジナルの２－ｍｉＲＮＡモデルが感度９５％、特異度９９％であったのに対し（Ａｓａｋｕｒａｅｔａｌ．２０２０）、新しいモデルは感度、特異度ともに９９％であった（図２Ｅ）。

【0141】

さらに、４－ｍｉＲＮＡモデルの性能は、臨床病期、Ｔ期、Ｎ期、Ｍ期、組織学によって定義された検証セットの臨床サブセットで評価された。すべての臨床サブセットにおいて、４－ｍｉＲＮＡモデルは約９９％以上の感度を示し（図２Ｇ、表２）、これはオリジナルの２－ｍｉＲＮＡモデルの感度よりも優れていた（表２）。特に早期の肺癌、例えばステージＩの肺癌患者とＴ１の腫瘍患者の両方に対して、４－ｍｉＲＮＡモデルは９９％以上の感度を示し（図２Ｇ、表２）、２－ｍｉＲＮＡモデルの感度はそれぞれ９５．４％と９５．９％であった（表２）。一般的な組織型である腺癌と扁平上皮癌においても、４－ｍｉＲＮＡモデルは、オリジナルの２－ｍｉＲＮＡモデルと比較して、優れた性能を示した（図２Ｇ、表２）（表２）。

【表2】

【0142】

対になった血清試料（手術前と手術後）のデータも１８０人の患者について入手可能であった。術後血清試料に対する４－ｍｉＲＮＡモデルの診断指標は、診断指標カットポイント以下の正常レベルまで低下した（図２Ｆ）。

【0143】

３．４．追加癌種における診断モデルの適用
４－ｍｉＲＮＡモデルの性能は、１２種類の癌患者２０３８人と非癌対照者１７５４人を含む、３７９２人の患者の複合データセットでさらに評価された。膀胱癌、肝臓癌、卵巣癌の試料サイズが最も大きく、それぞれ３００人以上の患者がいた。４－ｍｉＲＮＡモデルが機能しなかった乳癌を除き、４－ｍｉＲＮＡモデルは、胆道癌、膀胱癌、大腸癌、食道癌、胃癌、神経膠腫、肝臓癌、卵巣癌、膵臓癌、前立腺癌でＡＵＣ>０．９５、肉腫でＡＵＣ０．８７６と、非常に強力なパフォーマンスを示した（図３Ａ）。したがって、４－ｍｉＲＮＡモデルは、胆道癌、膀胱癌、結腸直腸癌、食道癌、胃癌、神経膠腫、肝臓癌、膵臓癌、前立腺癌で８３．２～１００％の高い感度を示し、卵巣癌と肉腫ではそれぞれ６８．２％と７２．０％の妥当な感度を示した（図３Ｂ）。さらに、肺癌データセットに含まれるものとは独立した１７５４の非癌対照に対して、４－ｍｉＲＮＡモデルは９９．３％の高い特異性を維持した。

【0144】

特異度を９５％に下げる別の診断指標カットポイントを５．１としてさらに感度分析を行った結果、１１の癌種すべてで感度が上昇し、肉腫の感度７６．５％を除く１１癌種で９０％以上の感度を示した（表３）。

【0145】

【表3】

【0146】

４．議論
この例では、複数の癌を早期発見するための４－ｍｉＲＮＡ診断モデルの開発と性能評価について報告する。３３９６人の癌患者と３７２４人の非癌患者を含む７１２０人の大規模な独立した検証セットにおいて、４－ｍｉＲＮＡモデルは１２種類の癌（胆道、膀胱、結腸直腸、食道、胃、神経膠腫、ライブ、肺、卵巣、膵臓癌、前立腺癌、肉腫）の１２種類の癌を同時に高い感度（１０種類の癌では８０～１００％、２種類の癌では～７０％）で検出することができ、その一方で、リスクのある一般集団においてスクリーニング検査が有用であるために通常必要とされる９９％という非常に高い特異性を維持することができる。我々の知る限り、これは循環遊離ｍｉＲＮＡに基づく最初のＭＣＥＤ診断モデルである。興味深いことに、肺癌患者の診断指数は、腫瘍切除後、非癌コントロールのレベルまで低下した。

【0147】

循環核酸および／またはタンパク質を分析する非侵襲的スクリーニング検査は、ＭＣＥＤキャンペーンの原動力となっており、最近大きな進展が見られている。ＭＣＥＤのために開発されている検査のほぼ全ては、循環腫瘍ＤＮＡの評価に基づくものであり、そのほとんどが次世代バイサルファイトシーケンス技術を利用して、これらの腫瘍ＤＮＡのメチル化パターンを評価している（Ｋｌｅｉｎｅｔａｌ．２０２１；Ｃｏｈｅｎｅｔａｌ．２０１８；Ｃｈｅｎｅｔａｌ．２０２０；Ｃｒｉｓｔｉａｎｏｅｔａｌ．２０１９）。このような２つの検査、ＧａｌｌｅｒｉとＰａｎＳｅｅｒは、メチル化に基づくエピジェネティックシグネチャーとして開発されている（Ｋｌｅｉｎｅｔａｌ．２０２１；Ｃｈｅｎ２０２０）。循環無細胞ゲノムアトラス（ＣＣＧＡ）の症例対照研究の解析において、Ｇａｌｌｅｒｉは１０万を超えるメチル化領域を調査し、事前に特定した１２の癌（肛門、膀胱、結腸／直腸、食道、頭頸部、肝臓／胆管、肺、リンパ腫、卵巣、膵臓、形質細胞新生物、胃）に対する感度はステージＩ－ＩＩＩの患者（ｎ＝８７４）では６７．６％で、ステージＩＶの癌を含めると７６．３％（ｎ＝１３４６）に増加し、一方１２５４人の非癌対照に基づく特異度は９９．３％に達した（Ｋｌｅｉｎｅｔａｌ．２０２１）。一方、４７７のメチル化ゲノム領域のみを対象としたＰａｎＳｅｅｒアッセイは、縦断的癌モニタリング研究に登録された無症候性個人グループの血漿試料をレトロスペクティブに解析し、採血から４年以内に５つの癌（胃癌、食道癌、大腸癌、肺癌、肝臓癌）のいずれかと後に診断された９８人（診断前試料）において９５％という高い感度を示したが、２０７人の健常対照者では９６％と特異度は低かった（Ｃｈｅｎｅｔａｌ．２０２０）。しかし、ＰａｎＳｅｅｒで不可解だったのは、診断後の血漿１１３検体で評価したところ、この検査は８８％という低い感度しか示さなかったことである（Ｃｈｅｎｅｔａｌ．２０２０）。次世代シーケンサーによる無細胞ＤＮＡフラグメント化パターンのゲノムワイド解析に基づくＤＥＬＦＩと呼ばれる別の検査では、７つの癌（ｎ＝２０８、乳癌、胆管癌、大腸癌、胃癌、肺癌、卵巣癌、膵臓癌）で感度７３％、特異度９８％（ｎ＝２１５）を達成した（Ｃｒｉｓｔｉａｎｏｅｔａｌ．２０１９）。最後に、９つのタンパク質バイオマーカーの測定と循環無細胞ＤＮＡ中の１６遺伝子の変異検出を組み合わせた検査であるＣａｎｃｅｒＳＥＥＫは、８つの癌（ｎ＝１００５、卵巣、肝臓、胃、膵臓、食道、大腸、肺、乳房）において、１０倍のクロスバリデーションと中央値７０％の感度（ｎ＝１００５）、９９％の特異度（ｎ＝８１２）を示した（Ｃｏｈｅｎｅｔａｌ．２０１８）。まとめると、現在開発中のＭＣＥＤ検査は、９９％という高い特異性が義務付けられた場合、一般的に６０～７０％の範囲の感度を示した。これらの検査と比較すると、我々の診断モデルは４つのｍｉＲＮＡのみと非常にシンプルでありながら、７０００人以上の大規模コホートで研究された１２種類の癌のうち１０種類について、８０～１００％の範囲で実質的に高い感度を示した。シンプルな診断モデルは、コストが大幅に低いだけでなく、ＲＴ－ＰＣＲのような分散型検査が可能な従来の技術プラットフォームを使って体外診断（ＩＶＤ）検査に発展させることが可能であり、これは通常ラボラトリー開発検査（ＬＤＴ）として実施されるＮＧＳベースの検査よりも有利であることは注目に値する。これらの特性は、ＭＣＥＤ検査が高リスクまたはリスクのある一般大衆を対象とすることを意図しているため、ＭＣＥＤ検査の幅広い採用とコンプライアンスを推進する上で重要である。

【0148】

本研究で検討された１３種類の癌の中で、乳癌だけが４－ｍｉＲＮＡ診断モデルでうまく検出されなかった。この不調の理由は明らかではないが、乳癌ではｍｉＲＮＡの発現プロファイルが異なること、あるいはｍｉＲＮＡの血中への流出パターンが異なることを示しているのかもしれない。興味深いことに、ＧａｌｌｅｒｉとＣａｎｃｅｒＳＥＥＫも、乳癌ではそれぞれ３０．５％と３３％という低い感度を示した（Ｋｌｅｉｎｅｔａｌ．２０２１；Ｃｏｈｅｎｅｔａｌ．２０１８）とはいえ、マンモグラフィ検診は早期乳癌の発見と乳癌死亡率の減少に非常に有効であるため（Ｎｅｌｓｏｎｅｔａｌ．２０１６）、乳癌における性能の低さは臨床的に重要ではないかもしれない。

【0149】

これらのＭＣＥＤ検査の最終的な診断性能と臨床的価値は、無症状の人を対象とした大規模な前向きスクリーニング試験で確立されなければならない。１０，０００人以上の無症候性女性を登録したＤＥＴＥＣＴ－Ａ試験では、１０種類の癌から９６の癌が同定され、ＣａｎｃｅｒＳＥＥＫの感度は２７％で、標準的なスクリーニング検査で検出された癌を加えると５２％に上昇した（Ｌｅｎｎｏｎｅｔａｌ．）。さらに、ＣａｎｃｅｒＳＥＥＫをＰＥＴ－ＣＴスキャンと組み合わせると、特異度は９９．６％、陽性適中率（ＰＰＶ）は４０．６％となった。一方、Ｇａｌｌｅｒｉ検査の前向き研究ＰＡＴＨＦＩＮＤＥＲの４０３３人の中間解析では、４０人が陽性で、そのうち１８人が癌と確定され、ＰＰＶは４５％であった（Ｂｅｅｒら、２０２１年）。我々の４－ｍｉＲＮＡ診断モデルでは、癌罹患率１％、保守的な平均感度８５、特異度９９．３％と仮定すると、無症状の人をスクリーニングする場合、ＰＰＶは５５％となる。これは、ＵＳＰＳＴＦが推奨する４つの単一癌スクリーニングのＰＰＶ（３．７～４．４％）よりも有意に高い（Ｌｅｈｍａｎｅｔａｌ．２０１７；Ｕ．Ｓ．ＦｏｏｄａｎｄＤｒｕｇＡｄｍｉｎｉｓｔｒａｔｉｏｎＣｏｌｏｇｕａｒｄＳｕｍｍａｒｙｏｆＳａｆｅｔｙａｎｄＥｆｆｅｃｔｉｖｅｎｅｓｓＤａｔａ、２０１４；およびＮａｔｉｏｎａｌＬｕｎｇＳｃｒｅｅｎｉｎｇＴｒｉａｌＲｅｓｅａｒｃｈＴｅａｍ、２０１３）。

【0150】

５．結論
要約すると、我々の研究は、複数の癌を検出するシンプルで手頃な価格の血液ベースの診断検査の概念実証データを提供した。本研究で検出された１２種類の癌は、２０２１年の米国における推定癌死亡者数の約３８万人（～６２％）を占める。

【0151】

上記で提供された実施例およびデータは、ｍｉＲＮＡバイオマーカーセット、特に４－ｍｉＲＮＡバイオマーカーセットが非常に高い精度で癌の検出において優れた力を示した１２種類の癌のみを対象としているが、ｍｉＲＮＡバイオマーカーセットを適用できる癌の種類は限定されないことに留意されたい。従って、本開示の範囲は、他の癌種もカバーするものと解釈される。本開示で提供されるモデルが、研究された１３の癌種のうち１２の癌種で機能するという事実は、本方法が、すべてではないにしても、ほとんどの癌種に適用可能であることを強く示唆している。

【0152】

参考文献
Ｒｉｔｃｈｉｅ，ＭＥ；ｅｔａｌ．（２０１５）．ｌｉｍｍａｐｏｗｅｒｓｄｉｆｆｅｒｅｎｔｉａｌｅｘｐｒｅｓｓｉｏｎａｎａｌｙｓｅｓｆｏｒＲＮＡ－ｓｅｑｕｅｎｃｉｎｇａｎｄｍｉｃｒｏａｒｒａｙｓｔｕｄｉｅｓ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ４３（７），ｅ４７．

Ｖｅｎａｂｌｅｓ，ＷＮａｎｄＲｉｐｌｅｙ，ＢＤ（２００２）ＭｏｄｅｒｎＡｐｐｌｉｅｄＳｔａｔｉｓｔｉｃｓｗｉｔｈＳ．Ｆｏｕｒｔｈｅｄｉｔｉｏｎ．Ｓｐｒｉｎｇｅｒ．

Ｔｉｂｓｈｉｒａｎｉ，Ｒ（１９９６）．"ＲｅｇｒｅｓｓｉｏｎＳｈｒｉｎｋａｇｅａｎｄＳｅｌｅｃｔｉｏｎｖｉａｔｈｅｌａｓｓｏ"．ＪｏｕｒｎａｌｏｆｔｈｅＲｏｙａｌＳｔａｔｉｓｔｉｃａｌＳｏｃｉｅｔｙ．ＳｅｒｉｅｓＢ（ｍｅｔｈｏｄｏｌｏｇｉｃａｌ）．Ｗｉｌｅｙ．５８（１）：２６７-８８．

Ｈｏｅｒｌ，ＡＥａｎｄＫｅｎｎａｒｄ，ＲＷ（１９７０）．"ＲｉｄｇｅＲｅｇｒｅｓｓｉｏｎ：ＢｉａｓｅｄＥｓｔｉｍａｔｉｏｎｆｏｒＮｏｎｏｒｔｈｏｇｏｎａｌｐｒｏｂｌｅｍｓ"．Ｔｅｃｈｎｏｍｅｔｒｉｃｓ．１２（１）：５５-６７．

Ｒｉｐｌｅｙ，ＢＤ（１９９６）ＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎａｎｄＮｅｕｒａｌＮｅｔｗｏｒｋｓ．ＣａｍｂｒｉｄｇｅＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ．

Ｋｏｚｏｍａｒａ，ＡａｎｄＧｒｉｆｆｉｔｈｓ－Ｊｏｎｅｓ，Ｓ（２０１０）．"ＭｉＲＢａｓｅ：ｉｎｔｅｇｒａｔｉｎｇｍｉｃｒｏＲＮＡａｎｎｏｔａｔｉｏｎａｎｄｄｅｅｐ－ｓｅｑｕｅｎｃｉｎｇｄａｔａ"．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ．３９（Ｄａｔａｂａｓｅｉｓｓｕｅ）：Ｄ１５２-７．

ｍｉＲＢａｓｅ：ｔｈｅｍｉｃｒｏＲＮＡｄａｔａｂａｓｅ：ｈｔｔｐ：／／ｗｗｗ．ｍｉｒｂａｓｅ．ｏｒｇ／

ＴｈｅＢｉｏｃｏｎｄｕｃｔｏｒＯｐｅｎＳｏｕｒｃｅＳｏｆｔｗａｒｅＦｏｒＢｉｏｉｎｆｏｒｍａｔｉｃｓ：ｈｔｔｐ：／／ｗｗｗ．ｂｉｏｃｏｎｄｕｃｔｏｒ．ｏｒｇ

ＴｈｅＲＰｒｏｊｅｃｔｆｏｒＳｔａｔｉｓｔｉｃａｌＣｏｍｐｕｔｉｎｇ：ｈｔｔｐｓ：／／ｗｗｗ．ｒ－ｐｒｏｊｅｃｔ．ｏｒｇ／

Ａｓａｋｕｒａ，Ｋ；ｅｔａｌ．（２０２０）．ＡＭｉＲＮＡ－ＢａｓｅｄＤｉａｇｎｏｓｔｉｃＭｏｄｅｌＰｒｅｄｉｃｔｓＲｅｓｅｃｔａｂｌｅＬｕｎｇＣａｎｃｅｒｉｎＨｕｍａｎｓｗｉｔｈＨｉｇｈＡｃｃｕｒａｃｙ．Ｃｏｍｍｕｎ．Ｂｉｏｌ．３，１３４．

Ｙｏｋｏｉ，Ａ；ｅｔａｌ．（２０１８）．ＩｎｔｅｇｒａｔｅｄＥｘｔｒａｃｅｌｌｕｌａｒＭｉｃｒｏＲＮＡＰｒｏｆｉｌｉｎｇｆｏｒＯｖａｒｉａｎＣａｎｃｅｒＳｃｒｅｅｎｉｎｇ．Ｎａｔ．Ｃｏｍｍｕｎ．９，４３１９．

Ｕｓｕｂａ，Ｗ；ｅｔａｌ．（２０１９）．ＣｉｒｃｕｌａｔｉｎｇＭｉＲＮＡＰａｎｅｌｓｆｏｒＳｐｅｃｉｆｉｃａｎｄＥａｒｌｙＤｅｔｅｃｔｉｏｎｉｎＢｌａｄｄｅｒＣａｎｃｅｒ．ＣａｎｃｅｒＳｃｉ．１１０，４０８-４１９．

Ｙａｍａｍｏｔｏ，Ｙ；ｅｔａｌ．（２０２０）．ＨｉｇｈｌｙＳｅｎｓｉｔｉｖｅＣｉｒｃｕｌａｔｉｎｇＭｉｃｒｏＲＮＡＰａｎｅｌｆｏｒＡｃｃｕｒａｔｅＤｅｔｅｃｔｉｏｎｏｆＨｅｐａｔｏｃｅｌｌｕｌａｒＣａｒｃｉｎｏｍａｉｎＰａｔｉｅｎｔｓＷｉｔｈＬｉｖｅｒＤｉｓｅａｓｅ．Ｈｅｐａｔｏｌ．Ｃｏｍｍｕｎ．４，２８４-２９７．

Ｋｌｅｉｎ，ＥＡ；ｅｔａｌ．（２０２１）．ＣｌｉｎｉｃａｌＶａｌｉｄａｔｉｏｎｏｆａＴａｒｇｅｔｅｄＭｅｔｈｙｌａｔｉｏｎ－ＢａｓｅｄＭｕｌｔｉ－ＣａｎｃｅｒＥａｒｌｙＤｅｔｅｃｔｉｏｎＴｅｓｔＵｓｉｎｇａｎＩｎｄｅｐｅｎｄｅｎｔＶａｌｉｄａｔｉｏｎＳｅｔ．Ａｎｎ．Ｏｎｃｏｌ．：Ｏｆｆ．Ｊ．Ｅｕｒ．Ｓｏｃ．Ｍｅｄ．Ｏｎｃｏｌ．３２，１１６７-１１７７．

Ｃｏｈｅｎ，ＪＤ；ｅｔａｌ．（２０１８）．ＤｅｔｅｃｔｉｏｎａｎｄＬｏｃａｌｉｚａｔｉｏｎｏｆＳｕｒｇｉｃａｌｌｙＲｅｓｅｃｔａｂｌｅＣａｎｃｅｒｓｗｉｔｈａＭｕｌｔｉ－ＡｎａｌｙｔｅＢｌｏｏｄＴｅｓｔ．Ｓｃｉｅｎｃｅ．３５９，９２６-９３０．

Ｃｈｅｎ，Ｘ；ｅｔａｌ．（２０２０）．Ｎｏｎ－ＩｎｖａｓｉｖｅＥａｒｌｙＤｅｔｅｃｔｉｏｎｏｆＣａｎｃｅｒＦｏｕｒＹｅａｒｓｂｅｆｏｒｅＣｏｎｖｅｎｔｉｏｎａｌＤｉａｇｎｏｓｉｓＵｓｉｎｇａＢｌｏｏｄＴｅｓｔ．Ｎａｔ．Ｃｏｍｍｕｎ．１１，３４７５．

Ｃｒｉｓｔｉａｎｏ，Ｓ；ｅｔａｌ．（２０１９）．Ｇｅｎｏｍｅ－ＷｉｄｅＣｅｌｌ－ＦｒｅｅＤＮＡＦｒａｇｍｅｎｔａｔｉｏｎｉｎＰａｔｉｅｎｔｓｗｉｔｈＣａｎｃｅｒ．Ｎａｔｕｒｅ．５７０，３８５-３８９．

Ｎｅｌｓｏｎ，ＨＤ；ｅｔａｌ．（２０１６）．ＥｆｆｅｃｔｉｖｅｎｅｓｓｏｆＢｒｅａｓｔＣａｎｃｅｒＳｃｒｅｅｎｉｎｇ：ＳｙｓｔｅｍａｔｉｃＲｅｖｉｅｗａｎｄＭｅｔａ－ＡｎａｌｙｓｉｓｔｏＵｐｄａｔｅｔｈｅ２００９Ｕ．Ｓ．ＰｒｅｖｅｎｔｉｖｅＳｅｒｖｉｃｅｓＴａｓｋＦｏｒｃｅＲｅｃｏｍｍｅｎｄａｔｉｏｎ．Ａｎｎ．Ｉｎｔｅｒｎ．Ｍｅｄ．１６４，２４４-２５５．

Ｌｅｎｎｏｎ，ＡＭ；ｅｔａｌ．（２０２０）．ＦｅａｓｉｂｉｌｉｔｙｏｆＢｌｏｏｄＴｅｓｔｉｎｇＣｏｍｂｉｎｅｄｗｉｔｈＰＥＴ－ＣＴｔｏＳｃｒｅｅｎｆｏｒＣａｎｃｅｒａｎｄＧｕｉｄｅＩｎｔｅｒｖｅｎｔｉｏｎ．Ｓｃｉｅｎｃｅ．３６９，ｅａｂｂ９６０１．

Ｂｅｅｒ，Ｔ；ｅｔａｌ．（２０２１）．ＩｎｔｅｒｉｍＲｅｓｕｌｔｓｏｆＰＡＴＨＦＩＮＤＥＲ，ａＣｌｉｎｉｃａｌＵｓｅＳｔｕｄｙＵｓｉｎｇａＭｅｔｈｙｌａｔｉｏｎ－ＢａｓｅｄＭｕｌｔｉ－ＣａｎｃｅｒＥａｒｌｙＤｅｔｅｃｔｉｏｎＴｅｓｔ．Ｊ．Ｃｌｉｎ．Ｏｎｃｏｌ．３９，３０１０．

Ｌｅｈｍａｎ，ＣＤ；ｅｔａｌ．（２０１７）．ＮａｔｉｏｎａｌＰｅｒｆｏｒｍａｎｃｅＢｅｎｃｈｍａｒｋｓｆｏｒＭｏｄｅｒｎＳｃｒｅｅｎｉｎｇＤｉｇｉｔａｌＭａｍｍｏｇｒａｐｈｙ：ＵｐｄａｔｅｆｒｏｍｔｈｅＢｒｅａｓｔＣａｎｃｅｒＳｕｒｖｅｉｌｌａｎｃｅＣｏｎｓｏｒｔｉｕｍ．Ｒａｄｉｏｌｏｇｙ．２８３，４９-５８．

Ｕ．Ｓ．ＦｏｏｄａｎｄＤｒｕｇＡｄｍｉｎｉｓｔｒａｔｉｏｎＣｏｌｏｇｕａｒｄＳｕｍｍａｒｙｏｆＳａｆｅｔｙａｎｄＥｆｆｅｃｔｉｖｅｎｅｓｓＤａｔａ（ＰｒｅｍａｒｋｅｔＡｐｐｒｏｖａｌＡｐｐｌｉｃａｔｉｏｎＰ１３００１７）；２０１４．

ＮａｔｉｏｎａｌＬｕｎｇＳｃｒｅｅｎｉｎｇＴｒｉａｌＲｅｓｅａｒｃｈＴｅａｍ；Ｃｈｕｒｃｈ，ＴＲ；ｅｔａｌ．（２０１３）．ＲｅｓｕｌｔｓｏｆＩｎｉｔｉａｌＬｏｗ－ＤｏｓｅＣｏｍｐｕｔｅｄＴｏｍｏｇｒａｐｈｉｃＳｃｒｅｅｎｉｎｇｆｏｒＬｕｎｇＣａｎｃｅｒ．ＮｅｗＥｎｇｌ．Ｊ．Ｍｅｄ．２０１３，３６８，１９８０-１９９１．

Ｎｉｅｌｓｅｎ，ＰＥ；ｅｔａｌ．（１９９１）．Ｓｅｑｕｅｎｃｅ－ｓｅｌｅｃｔｉｖｅｒｅｃｏｇｎｉｔｉｏｎｏｆＤＮＡｂｙｓｔｒａｎｄｄｉｓｐｌａｃｅｍｅｎｔｗｉｔｈａｔｈｙｍｉｎｅ－ｓｕｂｓｔｉｔｕｔｅｄｐｏｌｙａｍｉｄｅ．Ｓｃｉｅｎｃｅ．２５４，ｐ．１４９７－５００．

Ｏｂｉｋａ，Ｓ；ｅｔａｌ．（１９９８）．ＳｔａｂｉｌｉｔｙａｎｄｓｔｒｕｃｔｕｒａｌｆｅａｔｕｒｅｓｏｆｔｈｅｄｕｐｌｅｘｅｓｃｏｎｔａｉｎｉｎｇｎｕｃｌｅｏｓｉｄｅａｎａｌｏｇｕｅｓｗｉｔｈａｆｉｘｅｄＮ－ｔｙｐｅｃｏｎｆｏｒｍａｔｉｏｎ，２'－Ｏ，４'－Ｃ－ｍｅｔｈｙｌｅｎｅｒｉｂｏｎｕｃｌｅｏｓｉｄｅｓ．ＴｅｔｒａｈｅｄｒｏｎＬｅｔｔ．．３９，ｐ．５４０１－５４０４．

Ｇｒｅｅｎ，ＭＲａｎｄＳａｍｂｒｏｏｋ，Ｊ．（２０１２）．ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，４ｔｈＥｄ．，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＰｒｅｓｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，Ｎ．Ｙ．

Ｓａｍｂｒｏｏｋ，Ｊ；ｅｔａｌ．（１９８９）．ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ＮｅｗＹｏｒｋ：ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＰｒｅｓｓ．

Ｚｈａｎｇ，Ｚ；ｅｔａｌ．（２０００）．ＡｇｒｅｅｄｙａｌｇｏｒｉｔｈｍｆｏｒａｌｉｇｎｉｎｇＤＮＡｓｅｑｕｅｎｃｅｓ．Ｊ．Ｃｏｍｐｕｔ．Ｂｉｏｌ．７，ｐ．２０３－２１４．

Ａｌｔｓｃｈｕｌ，ＳＦ；ｅｔａｌ．（１９９０）．Ｂａｓｉｃｌｏｃａｌａｌｉｇｎｍｅｎｔｓｅａｒｃｈｔｏｏｌ．ＪｏｕｒｎａｌｏｆＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，Ｖｏｌ．２１５，ｐ．４０３－４１０．

Ｐｅａｒｓｏｎ，ＷＲｅｔａｌ．（１９８８）．Ｉｍｐｒｏｖｅｄｔｏｏｌｓｆｏｒｂｉｏｌｏｇｉｃａｌｓｅｑｕｅｎｃｅｃｏｍｐａｒｉｓｏｎ．Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．，Ｖｏｌ．８５，ｐ．２４４４－２４４８．

Ｙｕｎ，ＳＪ；ｅｔａｌ．（２０１２）．Ｃｅｌｌ－ｆｒｅｅｍｉｃｒｏＲＮＡｓｉｎｕｒｉｎｅａｓｄｉａｇｎｏｓｔｉｃａｎｄｐｒｏｇｎｏｓｔｉｃｂｉｏｍａｒｋｅｒｓｏｆｂｌａｄｄｅｒｃａｎｃｅｒ．ＩｎｔＪＯｎｃｏｌ．２０１２Ｎｏｖ；４１（５）：１８７１－８．

Ｐａｒｋ，ＮＪ；ｅｔａｌ．（２００９）．ＳａｌｉｖａｒｙｍｉｃｒｏＲＮＡ：ｄｉｓｃｏｖｅｒｙ，ｃｈａｒａｃｔｅｒｉｚａｔｉｏｎ，ａｎｄｃｌｉｎｉｃａｌｕｔｉｌｉｔｙｆｏｒｏｒａｌｃａｎｃｅｒｄｅｔｅｃｔｉｏｎ．ＣｌｉｎＣａｎｃｅｒＲｅｓ．２００９Ｓｅｐ１；１５（１７）：５４７３－７．

【図1A】