(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022149754
(43)【公開日】2022-10-07
(54)【発明の名称】がんの同時検出方法
(51)【国際特許分類】
C12Q 1/6886 20180101AFI20220929BHJP
G01N 33/53 20060101ALI20220929BHJP
G01N 33/574 20060101ALI20220929BHJP
C12Q 1/6851 20180101ALI20220929BHJP
C12Q 1/6874 20180101ALI20220929BHJP
C12N 15/11 20060101ALN20220929BHJP
C12N 15/113 20100101ALN20220929BHJP
【FI】
C12Q1/6886 Z ZNA
G01N33/53 M
G01N33/574 Z
C12Q1/6851 Z
C12Q1/6874 Z
C12N15/11 Z
C12N15/113 Z
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2021052041
(22)【出願日】2021-03-25
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人日本医療研究開発機構、「次世代治療・診断実現のための創薬基盤技術開発事業」「体液中マイクロRNA診断技術基盤開発」委託研究開発、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】515130201
【氏名又は名称】株式会社Preferred Networks
(71)【出願人】
【識別番号】000003159
【氏名又は名称】東レ株式会社
(74)【代理人】
【識別番号】100145403
【弁理士】
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100131808
【弁理士】
【氏名又は名称】柳橋 泰雄
(74)【代理人】
【識別番号】100145104
【弁理士】
【氏名又は名称】膝舘 祥治
(72)【発明者】
【氏名】大野 健太
(72)【発明者】
【氏名】大田 信行
(72)【発明者】
【氏名】小園 聡子
(72)【発明者】
【氏名】吉本 真紀子
(72)【発明者】
【氏名】松崎 潤太郎
(72)【発明者】
【氏名】加藤 健
(72)【発明者】
【氏名】落谷 孝広
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QQ03
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS34
4B063QX02
(57)【要約】
【課題】対象における特定のがん種の罹患を同時に検出することが可能ながんの同時検出方法を提供する。
【解決手段】検出対象に由来する試料に含まれる、miR-1343-3pの発現量と、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p及びmiR-6836-3pを含むマイクロRNA群に含まれるそれぞれのマイクロRNAの発現量とを測定することを含む、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出方法である。
【選択図】
図12
【特許請求の範囲】
【請求項1】
検出対象に由来する試料に含まれる、miR-1343-3pの発現量と、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p、miR-4472、miR-3619-3p、miR-422a、miR-6746-5p、miR-5698、miR-4708-3p、miR-4727-3p、miR-516a-5p、miR-6087、miR-483-5p、miR-4728-5p、miR-6877-5p、miR-6831-5p、miR-8073、miR-6131、miR-6760-5p、miR-197-5p、miR-4697-5p、miR-4646-5p、miR-29b-3p、miR-320a、miR-3184-5p、miR-342-5p、miR-4750-3p、miR-296-3p、miR-6839-5p、miR-1203、miR-3679-5p、miR-16-5p、miR-4789-5p、miR-941、miR-625-3p、miR-320b、miR-6785-5p、miR-4658、miR-1914-5p、miR-4443、miR-4734、miR-4732-5p、miR-4532、miR-885-3p、miR-1224-5p、miR-4515、miR-1470、miR-7641、miR-6777-5p、miR-920、miR-646、miR-4483、miR-124-3p、miR-642b-3p、miR-4771、miR-3194-3p、miR-1254、miR-6088、miR-6812-5p、miR-6769a-5p、miR-4257、miR-4783-5p、miR-4447、miR-6763-5p、miR-6787-5p、miR-3917、miR-6794-5p、miR-4455、miR-551b-5p、miR-6887-5p、miR-629-5p、miR-663a、miR-1225-3p及びmiR-187-5pからなるマイクロRNA群に含まれるそれぞれのマイクロRNAの発現量と、を測定することを含む、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出方法。
【請求項2】
検出対象に由来する試料に含まれる、miR-1343-3pの発現量と、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p及びmiR-4472からなるマイクロRNA群に含まれるそれぞれのマイクロRNAの発現量と、を測定することを含む、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出方法。
【請求項3】
検出対象に由来する試料に含まれる、miR-1343-3pの発現量と、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p及びmiR-6836-3pからなるマイクロRNA群に含まれるそれぞれのマイクロRNAの発現量と、を測定することを含む、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出方法。
【請求項4】
前記マイクロRNAの発現量と、検出対象における乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群から選択されるがんの存在とを関連付けることを含む請求項1から3のいずれか1項に記載の同時検出方法。
【請求項5】
前記試料は、検出対象の血液、尿、脳脊髄液、リンパ液、涙液及び腹水からなる群から選択される少なくとも1種に由来する請求項1から4のいずれか1項に記載の同時検出方法。
【請求項6】
前記マイクロRNAの発現量は、DNAマイクロアレイ、RNAマイクロアレイ、定量PCR及び次世代シーケンサーからなる群から選択される少なくとも1種で測定される請求項1から5のいずれか1項に記載の同時検出方法。
【請求項7】
前記マイクロRNAは、ヒトに由来する塩基配列を有する請求項1から6のいずれかに記載の同時検出方法。
【請求項8】
miR-1343-3p、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p、miR-4472、miR-3619-3p、miR-422a、miR-6746-5p、miR-5698、miR-4708-3p、miR-4727-3p、miR-516a-5p、miR-6087、miR-483-5p、miR-4728-5p、miR-6877-5p、miR-6831-5p、miR-8073、miR-6131、miR-6760-5p、miR-197-5p、miR-4697-5p、miR-4646-5p、miR-29b-3p、miR-320a、miR-3184-5p、miR-342-5p、miR-4750-3p、miR-296-3p、miR-6839-5p、miR-1203、miR-3679-5p、miR-16-5p、miR-4789-5p、miR-941、miR-625-3p、miR-320b、miR-6785-5p、miR-4658、miR-1914-5p、miR-4443、miR-4734、miR-4732-5p、miR-4532、miR-885-3p、miR-1224-5p、miR-4515、miR-1470、miR-7641、miR-6777-5p、miR-920、miR-646、miR-4483、miR-124-3p、miR-642b-3p、miR-4771、miR-3194-3p、miR-1254、miR-6088、miR-6812-5p、miR-6769a-5p、miR-4257、miR-4783-5p、miR-4447、miR-6763-5p、miR-6787-5p、miR-3917、miR-6794-5p、miR-4455、miR-551b-5p、miR-6887-5p、miR-629-5p、miR-663a、miR-1225-3p及びmiR-187-5pからなるマイクロRNA群であって、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出方法に用いられる検出マーカー。
【請求項9】
前記マイクロRNA群は、miR-1343-3p、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p及びmiR-4472からなる請求項8に記載の検出マーカー。
【請求項10】
前記マイクロRNA群は、miR-1343-3p、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p及びmiR-6836-3pからなる請求項8に記載の検出マーカー。
【請求項11】
前記同時検出方法は、請求項1から7のいずれか1項に記載の同時検出方法で実施される請求項8から10のいずれか1項に記載の検出マーカー。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、がんの同時検出方法に関する。
【背景技術】
【0002】
血液を試料として用いるがん検診の最終的な目標は、がんの場所を予測することである。しかしながら、例えば、がん胎児性抗原(CEA)、糖鎖抗原(CA19-9)等のような従来の腫瘍マーカーを用いたがんの場所の特定方法では充分な感度が得られない場合があった。このため、腫瘍マーカーの陽性血清レベルを使用した全身検査がしばしば必要とされている。ところで、変異株由来の循環腫瘍DNA(ctDNA)を検出する方法は、初期のがんの検診に期待される方法の1つである。しかしながら、ドライバー遺伝子の領域は、がん種によって様々に変異するのが通常であるため、ctDNA変異試験では、がんの場所を特定することは困難である。一方、組織RNAの発現プロファイルは、がんの場所毎に明確であるため、循環マイクロRNA(miRNA)の発現プロファイルは、正確にがんの場所を予測する検診手段として期待されうる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本開示は、対象における特定のがん種の存在を同時に検出することが可能ながんの同時検出方法を提供することを目的とする。
【課題を解決するための手段】
【0004】
本開示の第1態様は、検出対象に由来する試料に含まれる、miR-1343-3pの発現量と、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p、miR-4472、miR-3619-3p、miR-422a、miR-6746-5p、miR-5698、miR-4708-3p、miR-4727-3p、miR-516a-5p、miR-6087、miR-483-5p、miR-4728-5p、miR-6877-5p、miR-6831-5p、miR-8073、miR-6131、miR-6760-5p、miR-197-5p、miR-4697-5p、miR-4646-5p、miR-29b-3p、miR-320a、miR-3184-5p、miR-342-5p、miR-4750-3p、miR-296-3p、miR-6839-5p、miR-1203、miR-3679-5p、miR-16-5p、miR-4789-5p、miR-941、miR-625-3p、miR-320b、miR-6785-5p、miR-4658、miR-1914-5p、miR-4443、miR-4734、miR-4732-5p、miR-4532、miR-885-3p、miR-1224-5p、miR-4515、miR-1470、miR-7641、miR-6777-5p、miR-920、miR-646、miR-4483、miR-124-3p、miR-642b-3p、miR-4771、miR-3194-3p、miR-1254、miR-6088、miR-6812-5p、miR-6769a-5p、miR-4257、miR-4783-5p、miR-4447、miR-6763-5p、miR-6787-5p、miR-3917、miR-6794-5p、miR-4455、miR-551b-5p、miR-6887-5p、miR-629-5p、miR-663a、miR-1225-3p及びmiR-187-5pからなるマイクロRNA群に含まれるそれぞれのマイクロRNAの発現量と、を測定する工程を含む、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出方法である。
【0005】
第2態様は、検出対象に由来する試料に含まれる、miR-1343-3pの発現量と、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p及びmiR-4472からなるマイクロRNA群に含まれるそれぞれのマイクロRNAの発現量と、を測定する工程を含む、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出方法である。
【0006】
第3態様は、検出対象に由来する試料に含まれる、miR-1343-3pの発現量と、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p及びmiR-6836-3pからなるマイクロRNA群に含まれるそれぞれのマイクロRNAの発現量と、を測定する工程を含む、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出方法である。
【0007】
同時検出方法は、マイクロRNAの発現量と、検出対象における乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん又は悪性骨軟部腫瘍の存在とを関連付ける工程を含んでいてよい。同時検出方法に用いられる試料は、検出対象の血液、尿、脳脊髄液、リンパ液、涙液及び腹水からなる群から選択される少なくとも1種に由来する試料であってよい。マイクロRNAの発現量は、DNAマイクロアレイ、RNAマイクロアレイ、定量PCR及び次世代シーケンサーからなる群から選択される少なくとも1種で測定されてもよく、マイクロRNAは、ヒトに由来する塩基配列を有していてもよい。
【0008】
第4態様は、miR-1343-3p、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p、miR-4472、miR-3619-3p、miR-422a、miR-6746-5p、miR-5698、miR-4708-3p、miR-4727-3p、miR-516a-5p、miR-6087、miR-483-5p、miR-4728-5p、miR-6877-5p、miR-6831-5p、miR-8073、miR-6131、miR-6760-5p、miR-197-5p、miR-4697-5p、miR-4646-5p、miR-29b-3p、miR-320a、miR-3184-5p、miR-342-5p、miR-4750-3p、miR-296-3p、miR-6839-5p、miR-1203、miR-3679-5p、miR-16-5p、miR-4789-5p、miR-941、miR-625-3p、miR-320b、miR-6785-5p、miR-4658、miR-1914-5p、miR-4443、miR-4734、miR-4732-5p、miR-4532、miR-885-3p、miR-1224-5p、miR-4515、miR-1470、miR-7641、miR-6777-5p、miR-920、miR-646、miR-4483、miR-124-3p、miR-642b-3p、miR-4771、miR-3194-3p、miR-1254、miR-6088、miR-6812-5p、miR-6769a-5p、miR-4257、miR-4783-5p、miR-4447、miR-6763-5p、miR-6787-5p、miR-3917、miR-6794-5p、miR-4455、miR-551b-5p、miR-6887-5p、miR-629-5p、miR-663a、miR-1225-3p及びmiR-187-5pからなるマイクロRNA群であって、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出方法に用いられる検出マーカーである。
【0009】
マイクロRNA群は、miR-1343-3p、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p及びmiR-4472からなっていてよく、miR-1343-3p、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p及びmiR-6836-3pからなっていてもよい。検出マーカーを用いる同時検出方法は、第1態様、第2態様又は第3態様のがんの同時検出方法であってよい。
【図面の簡単な説明】
【0010】
【
図1】本実施形態に係る機械学習システムの概要を示す模式図である。
【
図3】機械学習システムの識別精度の頑強さを示す図である。
【
図4】検出対象の性別と診断成績の関係を示す図である。
【
図5】検出対象の年齢と診断成績の関係を示す図である。
【
図6】胆道がんサンプルについての機械学習システムの予測結果を示す図である。
【
図7】肝がんサンプルについての機械学習システムの予測結果を示す図である。
【
図8】悪性骨軟部腫瘍サンプルについての機械学習システムの予測結果を示す図である。
【
図9】種々のがんサンプルについての機械学習システムの予測結果を示す図である。
【
図10】性別、年齢及び疾患ステージと診断成績の関係を示す図である。
【
図11】機械学習システムにおける各miRNAの貢献スコアの分布を示す図である。
【
図12】貢献スコアの高いmiRNAを用いた同時検出結果を示す図である。
【発明を実施するための形態】
【0011】
本明細書において「工程」との語は、独立した工程だけではなく、他の工程と明確に区別できない場合であってもその工程の所期の目的が達成されれば、本用語に含まれる。また、マイクロRNAをmiRNAと略記することがある。以下、本発明の実施形態を図面に基づいて説明する。ただし、以下に示す実施形態は、本発明の技術思想を具体化するための、がんの同時検出方法を例示するものであって、本発明は、以下に示す、がんの同時検出方法に限定されない。
【0012】
がんの同時検出方法
がんの同時検出方法は、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれる特定のがんを同時に検出する方法であって、検出対象に由来する試料に含まれる、miR-1343-3pの発現量と、特定のマイクロRNA群に含まれるそれぞれのマイクロRNAの発現量とを測定する第1工程を含んでもよい。miR-1343-3pの発現量と、特定のマイクロRNA群に含まれるマイクロRNAのそれぞれの発現量とを測定することで、検出対象におけるがん罹患の有無と、罹患しているがん種を特定して検出することができる。すなわち、がんの同時検出方法は、試料の由来となる対象が、特定のがんに罹患しているか否かを診断する方法であってもよく、診断を補助する方法であってもよい。一態様において、がんの同時検出方法は、検出対象に由来する試料に含まれる、miR-1343-3pの発現量と、特定のマイクロRNA群から選択される少なくとも1種のマイクロRNAの発現量を測定することを含んでいてもよい。また、特定のマイクロRNA群から選択されるマイクロRNAは、少なくとも2種、5種、9種、19種又は29種であってもよい。
【0013】
がんの同時検出方法に用いられる特定のマイクロRNA群は、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p、miR-4472、miR-3619-3p、miR-422a、miR-6746-5p、miR-5698、miR-4708-3p、miR-4727-3p、miR-516a-5p、miR-6087、miR-483-5p、miR-4728-5p、miR-6877-5p、miR-6831-5p、miR-8073、miR-6131、miR-6760-5p、miR-197-5p、miR-4697-5p、miR-4646-5p、miR-29b-3p、miR-320a、miR-3184-5p、miR-342-5p、miR-4750-3p、miR-296-3p、miR-6839-5p、miR-1203、miR-3679-5p、miR-16-5p、miR-4789-5p、miR-941、miR-625-3p、miR-320b、miR-6785-5p、miR-4658、miR-1914-5p、miR-4443、miR-4734、miR-4732-5p、miR-4532、miR-885-3p、miR-1224-5p、miR-4515、miR-1470、miR-7641、miR-6777-5p、miR-920、miR-646、miR-4483、miR-124-3p、miR-642b-3p、miR-4771、miR-3194-3p、miR-1254、miR-6088、miR-6812-5p、miR-6769a-5p、miR-4257、miR-4783-5p、miR-4447、miR-6763-5p、miR-6787-5p、miR-3917、miR-6794-5p、miR-4455、miR-551b-5p、miR-6887-5p、miR-629-5p、miR-663a、miR-1225-3p及びmiR-187-5pからなる第1のマイクロRNA群であってよい。
【0014】
特定のマイクロRNA群は、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p及びmiR-4472からなる第2のマイクロRNA群であってよい。
【0015】
特定のマイクロRNA群は、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p及びmiR-6836-3pからなる第3のマイクロRNA群であってよい。
【0016】
検出対象は、ヒト、チンパンジー等を含む霊長類、イヌ、ネコ等のペット動物、ウシ、ウマ、ヒツジ、ヤギ等を含む家畜動物、マウス、ラット等を含む齧歯類を含む哺乳動物であってよい。検出対象はヒトであってもよく、非ヒト哺乳動物であってもよい。
【0017】
試料の由来は、例えば、検出対象の血液、脳脊髄液、リンパ液、腹水、組織液等の体液;尿、唾液、涙液、汗等の分泌物であってよい。試料の由来として好ましくは血液、尿、脳脊髄液、リンパ液、涙液及び腹水からなる群から選択される少なくとも1種であり、より好ましくは血液であり、血液から調製される血清又は血漿であってもよい。
【0018】
発現量の測定対象となるマイクロRNAは、ヒトに由来する成熟マイクロRNAであってよく、下表に示す塩基配列を有していてもよい。
【0019】
【0020】
【0021】
【0022】
【0023】
試料に含まれるマイクロRNAの発現量は、例えば、試料からRNAを抽出し、抽出されるRNAに含まれるマイクロRNAの発現量を定量、又は半定量することで測定される。試料からのRNAの抽出には、市販のRNA抽出キットを用いることができる。RNA抽出キットとしては、例えば、3D-Gene(登録商標)RNA extraction reagent from liquid sample kit(東レ株式会社製)、miRNAeasy Serum/Plasma Kit(Qiagen社製)、miRCURYTM RNA Isolation Kit(EXIQON社製)等の市販のRNA抽出キットを用いて、付属の取り扱い説明書の手順に準じて行うことができる。
【0024】
マイクロRNAの発現量は、例えば、DNAマイクロアレイ、RNAマイクロアレイ、定量PCR、次世代シーケンサー等の通常用いられる方法によって測定することができる。測定されるマイクロRNAの発現量は、絶対発現量であってもよく、相対発現量であってもよい。
【0025】
DNAマイクロアレイは、測定対象となるマイクロRNAの少なくとも一部と相補的な塩基配列を有するDNAプローブを基材上に固定化したものである。DNAマイクロアレイを用いて特定マイクロRNAの発現量を測定する場合、例えば、抽出されたRNAを、市販のキットを用いて蛍光標識し、DNAマイクロアレイ上に配置されたマイクロRNAと相補的な配列を有するDNAプローブとハイブリダイズさせた後、蛍光強度を測定することで、マイクロRNAの発現量を測定することができる。
【0026】
RNAマイクロアレイは、測定対象となるマイクロRNAの少なくとも一部と相補的な塩基配列を有するRNAプローブを基材上に固定化したものである。RNAマイクロアレイを用いて特定マイクロRNAの発現量を測定する場合、例えば、抽出されたRNAを、市販のキットを用いて蛍光標識し、RNAマイクロアレイ上に配置されたマイクロRNAと相補的な配列を有するRNAプローブとハイブリダイズさせた後、蛍光強度を測定することで、マイクロRNAの発現量を測定することができる。
【0027】
定量PCRには、リアルタイムPCR(RT-PCR)、デジタルPCR等の公知の手法を適用することができる。定量PCRでマイクロRNAの発現量を測定する場合、例えば、抽出されたRNAからcDNAを調製し、cDNAを測定対象となるマイクロRNAに特異的なプライマーセットを用いて定量PCRにより増幅することで、マイクロRNAの発現量を測定することができる。定量PCRで測定されるマイクロRNAの発現量は、例えば、コピー数のような絶対発現量であってよく、コピー数を規格化した相対発現量であってもよい。
【0028】
次世代シーケンサーを用いてマイクロRNAの発現量を測定する場合、例えば、抽出されたRNAからcDNAを調製し、PCRによってアンプリコンを得て、次世代シーケンサーを用いてアンプリコンシーケンシングを実施する。得られたシーケンシングデータから、クオリティコントロールにより、低クオリティリードなどを削除した上で、所望の塩基配列を有するリード数によって発現量が測定される。ここで次世代シーケンサーとは、サンガー法を用いるキャピラリーシーケンサーと対比される用語である。次世代シーケンサーでは、合成シーケンシング法、パイロシーケンシング法、リガーゼ反応シーケンシング法等のシーケンシング原理が用いられる。次世代シーケンサーとして具体的には、MiSeq(登録商標)システム(illmina社)、HiSeq(登録商標)システム(illmina社)、IonPGM(登録商標)システム(Life Technology社)等が挙げられる。次世代シーケンサーによるアンプリコンシーケンシングは、メーカー推奨プロトコールに従って実施することができる。
【0029】
マイクロRNAの発現量の測定には、成熟マイクロRNAの発現量を測定することのみならず、測定対象のマイクロRNAをコードする遺伝子の転写産物又はそのプロセシング産物の発現量を測定することが含まれてもよい。一般にマイクロRNAをコードする遺伝子の一次転写産物は初期転写産物(pri-miRNA)と呼ばれ、ステムループのヘアピン構造を有する。pri-miRNAはRNaseIII様のDroshaと呼ばれる酵素によってステムループ構造をもつ成熟miRNAの前駆体(pre-miRNA)に変換される。pre-miRNAは細胞核の外に輸送され、Dicerと呼ばれる酵素のスプライシングによって、20から25塩基長の2本鎖の成熟miRNAとなる。したがって、マイクロRNAをコードする遺伝子の転写産物又はそのプロセッシング産物は、pri-miRNA、pre-miRNA及び成熟miRNAを包含する。なお、2本鎖の成熟miRNAの発現量の測定には、1本鎖の成熟miRNAの発現量を測定することのみならず、それと相補対を形成する1本鎖RNAの発現量を測定することが含まれてよい。また、測定対象となるマイクロRNAの発現量の測定には、当該マイクロRNAと生物学的な機能が同等であるマイクロRNA、例えばホモログ、オルソログ等の同族体、遺伝子多型などの変異体、又はこれらの誘導体の発現量を測定することが含まれてもよい。測定対象のマイクロRNAをコードする遺伝子の転写産物の塩基配列、マイクロRNAの同族体、変異体又は誘導体は、例えば、miRBase(http://www.mirbase.org/)を参照して同定することができる。
【0030】
がんの同時検出方法は、検出対象に由来する試料における、miR-1343-3pを含む特定のマイクロRNAの発現量と、検出対象における乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群から選択される特定のがんの存在とを関連付ける第2工程をさらに含んでいてもよい。第2工程においては、対象に由来する試料と、特定のがんの存在とを関連付けてよい。
【0031】
第2工程では、訓練データを用いて機械学習を行って予め得られる、がんの同時検出が可能な学習済みモデルを用いて、検出対象に由来する試料に含まれる特定のマイクロRNAの発現量を含むデータについて、特定のマイクロRNAの発現量と特定のがんの存在とを関連付けてよい。すなわち、がんの同時検出方法は、がんの同時検出が可能な学習済みモデルを準備することをさらに含んでいてもよい。
【0032】
機械学習に用いる訓練データは、いずれのがんに罹患しているか否かのラベル情報が付されたマイクロRNAの発現量を含むデータセットであってよい。また、訓練データにはがんに罹患していない対象に由来するデータが含まれていてもよいし、特定のがんに罹患していない対象に由来するデータが含まれていてもよい。
【0033】
機械学習システムとしては、例えば、Random Forest、Logistic Regression、Extra Tree Classifier、Support Vector Classifier、k-NN(Nearest Neighbor)Classifier、Gradient Boosting Decision Tree(GBDT)、Multi-Layer Perceptron(MLP)等の機械学習モデルを挙げることができ、これらを適宜組み合わせてもよい。
【0034】
また、第2工程は、検出対象に由来する試料における特定のマイクロRNAの発現量と、対照(例えば、健常者)に由来する試料における特定のマイクロRNAの発現量とを比較して、検出対象に由来する試料における特定のマイクロRNAの発現量が、対照に由来する試料における特定マイクロRNAの発現量よりも多い場合と、特定のがんの存在とを関連付けてもよい。ここで、発現量が多い場合とは、対照(例えば、健常者)と特定のがんに罹患している対象とを区別するために設定された正常検出量(カットオフ値)よりも、対象に由来する試料における特定のマイクロRNAの発現量のほうが多いことを意味してもよい。
【0035】
がんの同時検出方法において、がんが検出された対象には、その進行状況等に応じて経過観察、治療介入等の処置を実施してもよい。ここで、がんの処置は、がんについて施される何らかの処置であればよく、例えば、がんの治療、改善、進行の抑制(悪化の防止)、予防、がんに起因する症状の緩和等が挙げられる。処置として具体的には、例えば、抗がん剤の投与、外科的手術などが挙げられる。
【0036】
検出マーカー
検出マーカーは、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍からなる群に含まれるがんの同時検出に用いられる。検出マーカーは、miR-1343-3p、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p、miR-4472、miR-3619-3p、miR-422a、miR-6746-5p、miR-5698、miR-4708-3p、miR-4727-3p、miR-516a-5p、miR-6087、miR-483-5p、miR-4728-5p、miR-6877-5p、miR-6831-5p、miR-8073、miR-6131、miR-6760-5p、miR-197-5p、miR-4697-5p、miR-4646-5p、miR-29b-3p、miR-320a、miR-3184-5p、miR-342-5p、miR-4750-3p、miR-296-3p、miR-6839-5p、miR-1203、miR-3679-5p、miR-16-5p、miR-4789-5p、miR-941、miR-625-3p、miR-320b、miR-6785-5p、miR-4658、miR-1914-5p、miR-4443、miR-4734、miR-4732-5p、miR-4532、miR-885-3p、miR-1224-5p、miR-4515、miR-1470、miR-7641、miR-6777-5p、miR-920、miR-646、miR-4483、miR-124-3p、miR-642b-3p、miR-4771、miR-3194-3p、miR-1254、miR-6088、miR-6812-5p、miR-6769a-5p、miR-4257、miR-4783-5p、miR-4447、miR-6763-5p、miR-6787-5p、miR-3917、miR-6794-5p、miR-4455、miR-551b-5p、miR-6887-5p、miR-629-5p、miR-663a、miR-1225-3p及びmiR-187-5pからなる第4のマイクロRNA群であってよい。
【0037】
また、検出マーカーは、miR-1343-3p、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p、miR-6836-3p、miR-4730、miR-4456、miR-125a-3p、miR-4652-5p、miR-629-3p、miR-1307-3p、miR-3131、miR-4534、miR-195-5p、miR-1185-2-3p、miR-4258、miR-6515-5p、miR-1246、miR-6076、miR-1233-5p、miR-373-5p、miR-6741-5p、miR-122-5p、miR-4745-5p及びmiR-4472からなる第5のマイクロRNA群であってよい。
【0038】
さらに、検出マーカーは、miR-1343-3p、miR-221-3p、miR-4787-3p、miR-6717-5p、miR-4783-3p、miR-3160-5p、miR-6736-5p、miR-17-3p、miR-1185-1-3p及びmiR-6836-3pからなる第6のマイクロRNA群であってよい。
【実施例0039】
以下、本発明を実施例により具体的に説明するが、本発明はこれらの実施例に限定されるものではない。
【0040】
サンプルの入手
合計1496個の血清サンプルを、乳がん(BR)、膀胱がん(BL)、胆道がん(BT)、大腸がん(CR)、食道がん(ES)、胃がん(GA)、神経膠腫(GL)、肝がん(HC)、肺がん(LK)、卵巣がん(OV)、膵がん(PA)、前立腺がん(PR)及び悪性骨軟部腫瘍(SA)からなる悪性腫瘍、並びに良性腫瘍(非がん群A)の患者から入手した。これらのサンプルは、2008年から2016年迄の間に国立がん研究センターの中央病院において診断されたものであり、国立がん研究センターのバイオバンクに登録されている。血清サンプルは4℃で1週間保存された後に、-20℃で保存されたものである。がん患者由来のサンプルの内、血清採取前に外科手術、化学療法、若しくは放射線療法を受けている場合、又は後述するmiRNAマイクロアレイのデータの質が良くない場合のデータについては機械学習の分析対象から除外した。
【0041】
非がん群サンプルは、横浜みのるクリニックと国立長寿医療研究センターからも入手した。1番目のグループとなる非がん群Bは、1972人のボランティアのものであり、2015年に集められたものであった。非がん群Bの収集基準は、がんの罹患歴がないことと、過去3か月以内に入院歴がないこととし、集められた血清は-80℃で保存した。
2番目のグループとなる非がん群Cは、1581人の血清のサンプルであり、2010年から2012年迄の間に集められ、国立長寿医療研究センターにおいて-80℃で保存されたものである。それぞれのサンプルの臨床情報については、それぞれの機関における登録情報を参照して手に入れた。婦人科医学に関する情報、例えば妊娠歴や閉経年齢については、ほとんどのサンプルにおいて手に入っていなかった。
【0042】
本発明を成した研究の計画は独立行政法人国立がん研究センター研究倫理審査委員会国立研究開発法人国立長寿医療研究センター倫理・利益相反委員会によって承認された。国立がん研究センターおよび国立長寿医療研究センターから提供された検体および登録情報は、それぞれの機関のバイオバンクに由来する。また横浜みのるクリニックから提供された健康人の情報は、医療法人社団新東会横浜みのるクリニック倫理審査委員会で承認された研究から得られた。すべての被験者から書面によるインフォームドコンセントを得た。
【0043】
miRNAマイクロアレイ分析
トータルRNAを、300μLの血清から、3D-Gene(登録商標)RNA extraction reagent from liquid sample kit(東レ株式会社製)を用いて抽出した。miRNA発現量の分析は、miRBase(http://www.mirbase.org/)に登録された2588種のmiRNAの発現量を測定できる3D-Gene(登録商標)miRNA Labeling kitと3D-Gene(登録商標) Human miRNA Oligo Chip(いずれも東レ株式会社製)を用い、標準プロトコールにしたがって行った。マイクロアレイからの蛍光強度は3D-Gene(登録商標)Scannerを用いて数値化してマイクロアレイシグナルとした。
【0044】
マイクロアレイのデータのクオリティをコントロールするため、ネガティブコントロールプローブおよびブランクからのシグナルの変動係数が0.15を超えたサンプル、及び3D-Gene(登録商標) Scanner付属の画像解析ソフトで特定されるフラグプローブの数が10個を超えた質の低いサンプルについてはさらなる分析から除外した。
【0045】
miRNAの存在は、ネガティブコントロールのマイクロアレイシグナルの平均値にその標準偏差の2倍を加えた数値以上のマイクロアレイシグナルが得られたことを基準にして決定した。この際、最大と最小の強度シグナルは除外した。存在が確認されたmiRNAについては、そのマイクロアレイシグナルから、ネガティブコントロールの平均強度(シグナル強度で示されるトップとボトムの5%はそれぞれ除いた。)を差し引いてから2を底とする対数スケールに変換した。また、差し引いた後にシグナルの値が負になった場合、若しくはシグナルが計測されなかった場合には、その値は2を底とする対数スケールで0.1に変換した。
【0046】
それぞれのmiRNAシグナルの値は、3つの内部対照miRNAのシグナルの値の平均値と既定値の比を用いて規格化した。すべてのマイクロアレイのデータは、Information About a Microarray Experimentガイドラインに沿って得た。具体的には、TaqManTM Advanced miRNA Assays(Thermo Fisher Scientific社製)を用い、qRT-PCRのバリデーションを行った。miRNAの定量データは、対応するmiR-1493-3p、miR-2861、及びmiR-4463により規格化した。ここで、人間の血清(LONZA、14-490E)から抽出したRNAの連続希釈法を性能分析の定量評価に使用した。
【0047】
(機械学習による分析)
上記で得られたmiRNAデータを、学習用データセットとテスト用データセットとして4:1にランダムに分けた。これは階層分割であり、ラベルディストリビューションが学習用とテスト用のデータセットにおいて、ほぼ同じであることを意味する。それぞれのサンプルに由来する学習用データは、不適格なmiRNAデータを除いた2561次元の特徴ベクトルと、非がんを含むがん種を表す1から14の整数とのペアで表現される。対象となるがん種は、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん及び悪性骨軟部腫瘍である。以下のようにして、学習用データセットを用いて学習モデルを学習させ、その性能をテスト用データセットで評価した。
【0048】
図1は、機械学習のシステムの概要を表している。Feature Extractorは入力の特徴ベクトル(すなわち約2500種類のmiRNAの発現量を表したベクトル)に対して教師なし(すなわち、予測対象であるのがん種の情報を使わない)で変換を行なっている。具体的には、特徴ベクトル群に対してt-SNEを適用している。なお、この出力は後段の学習器の入力として用いられている。機械学習システムは、5つの予測器(破線で囲んだ部分)を持ち、それぞれが予測結果を出力する。Votingはそれらの結果を集約し、機械学習システム全体の予測結果を出力する。具体的には各サンプル、各がん種に対して、予測器が出力するスコアの幾何平均を計算している。上記の「miRNAマイクロアレイ分析」に記載の方法を、前処理として特徴ベクトルに適用した。さらに、t-SNWを教師なし特徴抽出器として、前処理した特徴ベクトルに適用し、特徴ベクトルをその出力として増強した。
【0049】
各予測器にはそれぞれ5台の分類器(Classifier)を構築した。これらは異なる乱数シードを持つ同一のアーキテクチャーとなる。それぞれのサンプルにおける分類器の出力は、がん種ごとの確率分布を表すベクトルとなる。つまり、i番目の要素は、サンプル中でIDがiとラベルされたがん(若しくは非がん)の確率を表している。5個の分類器の出力を統合するため、これらの幾何平均を取り、がん種による値を最大化する最終的な予測結果を定義した。
【0050】
分類器の構築には、2段階層技術を適用した。最初のステージは、並列に配置された学習器から成っている。前処理したデータセットの組と、学習器に対する教師なし特徴抽出器の出力とを与え、これらの予測結果を得た。それぞれの学習器を学習させるため、学習用データセットをほぼ同じ数になるように5分割し、その内の3分割分を内部学習用データセットとし、残りの2分割分を内部バリデーション用データセットとした。内部学習用データセットで学習器を学習させ、内部バリデーション用のデータセットのための予測結果を得た。モデルの学習は、内部学習用と内部バリデーション用について、考えうるすべての分割区分で行った。
【0051】
このようにして、それぞれのサンプルに対して4つの予測結果を得た。この予測結果について算術平均を行い、学習器の予測結果を得た。最初の第一ステージの弱い学習器として、Random Forest、Logistic Regression、Extra Tree Classifier、Support Vector Classifier、k-NN(Nearest Neighbor) Classifier、Gradient Boosting Decision Tree(GBDT)、及びMulti-Layer Perceptron(MLP)を使用した。学習器に加え、k-NNを第一ステージの教師なし特徴抽出器として使用した。第一ステージの学習器の出力は、次の第二ステージの学習器に与えられ、そこでは分類器としてGBDTを使用した。機械学習システムではパイソンを使用した。学習器の実装には,GBDTの実装にXGBoost、MLPの実装にChainer、それ以外の学習器の実装には、Scikit-learnを用いた.
【0052】
学習用データセットを用いて機械学習を行って得られた学習済みモデルに対して、テスト用データセットを入力して、がんの同時検出方法を評価した。結果を
図2に示す。
図2は、テスト用データセットについての機械学習システムの予測結果と実際の腫瘍部位を比較した表(confusion matrix;混同行列)である。数値は腫瘍部位ごとの予測サンプル数の割合を表す。例えば、左端列の上から4行目の0.03は、テスト用データセット中の乳がん(BR)の全サンプルのうち、3%を機械学習システムは誤って大腸がん(CR)と予測したことを意味する。対角線上の数値は正しく部位予測ができた割合を表す。なお、列ごとの数値の合計は1となる。
図2中、BRは乳がん、BLは膀胱がん、BTは胆道がん、CRは大腸がん、ESは食道がん、GAは胃がん、GLは神経膠腫、HCは肝がん、LUは肺がん、OVは卵巣がん、PAは膵がん、PRは前立腺がん、SAは悪性骨軟部腫瘍、NCは非がんを意味する。また、BR_Bは乳がんの良性疾患、GL_Bは神経膠腫の良性疾患、OV_Bは卵巣がんの良性疾患、PR_Bは前立腺がんの良性疾患、SA_Bは骨軟部腫瘍の良性疾患を示す。
【0053】
図2から、乳がん、膀胱がん、胆道がん、大腸がん、食道がん、胃がん、神経膠腫、肝がん、肺がん、卵巣がん、膵がん、前立腺がん、悪性骨軟部腫瘍、及び非がんを良好な感度で識別できたことが分かる。また、前立腺の良性腫瘍(BL_B)、良性の骨部及び軟部組織の疾患(SA_B)もまた正確に区別できた。一方で、非悪性の乳腺(BR_B)、脳(GL_B)及び卵巣(OV_B)の疾患サンプルについては、サンプルサイズが小さいことから、対応する臓器の悪性腫瘍と予測された。
【0054】
機械学習システムの識別精度の頑強さを、5分割交差検証で確認した。結果を
図3に示す。高い識別精度は病気のステージに関わらず得られていることから、循環miRNAによる診断は、初期のがんのステージにおいても有用であることが示された。特に、胆管がんと膵がんについては、進行性ステージのサンプルにおいてより正確に診断できた。一方で、大腸がん、食道がん、及び前立腺がんについては、初期のステージのサンプルにおいてより正確に診断できる傾向となった。他のがん種については、疾患のステージと診断の正確性との間に関連性は見られなかった。また、
図4及び
図5に示すように、全体として、患者の性別と年齢は診断成績に影響を与えなかった。
【0055】
上述した機械学習システムは、高い識別精度にも関わらず、いくつかのサンプルでは他のがんと誤診断をした。この誤診断を明確にするため、それぞれのサンプルの確率スコアを分析した。
図6から
図8はテスト用データセット中の胆道がん(BT)、肝がん(HC)及び悪性骨軟部腫瘍(SA)のサンプルについて、機械学習結果の予測結果を可視化したものである。機械学習システムは各サンプルに対して19次元のベクトルを出力する。各要素は非負の値で数値が大きいほど対応するがん(もしくは、非がん)である可能性が高いことを表す。2次元の表の1列が1サンプルを表し、マスの色の濃さがスコアの大小を表す。2次元の表の上にある箱は予測結果の正解・不正解を示す。なお、スコアが最も高いがん種を機械学習システムの予測としている。
【0056】
それぞれのサンプルにおいて、機械学習システムの出力はベクトルである。それぞれのベクトルの成分は、それぞれのがんのスコアを表している。最大のスコアを獲得したがん種が、機械学習システムの最終的な出力として扱われる。
図2に示されるように、悪性サンプルの中では、胆道がん(BT)、肝がん(HC)及び悪性骨軟部腫瘍(SA)が、それぞれ0.59、0.74及び0.78と最も悪い感度を示した。胆道がん(BT)のうち21%は胃がん(GA)と、9%は膵がん(PA)と誤診断された。肝がん(HC)は、胃がん(GA)又は膵がん(PA)に誤診断される傾向があった。加えて、胃がん(GA)と肺がん(LU)とは、確率は5%以下と低いが、それぞれについて誤診断される傾向があった。
【0057】
組織miRNAは、出自によって同様の特徴を共有するため、循環miRNAプロファイルの同様な変化が、前腸由来組織、例えば胃、肝臓、膵臓、胆管及び肺におけるがんの存在で誘発されると考えられる。骨腫瘍と軟部組織腫瘍については、悪性と良性サンプルのそれぞれの誤診断がこれらの感度を減少させた。
図9に示されるように、膀胱がん(BL)と前立腺がん(PR)もまた、それぞれの間で誤診断する傾向があった。また、
図10に示されるように、例えば、性別、年齢及び疾患のステージのような臨床所見を比べても、正確に診断したサンプルと誤診したサンプルに大きな違いは見られなかった。
【0058】
Probability scoreの算出
上記で説明した機械学習システムで使用したのと同様の学習用データセットを用いて、GDBTを学習させた。次いで、決定木の貢献スコアのノードを分割して得られた情報獲得をベースにしたそれぞれのmiRNAの貢献スコアを計算した。結果を
図11に示す。
図11の縦軸は貢献スコアであり、横軸はランクである。また、貢献スコアの上位200のmiRAN種と貢献スコアを表5に示す。
【0059】
【0060】
表3及び
図11に示すようにhsa-miR-1343-3pの貢献スコアが突出しており、hsa-miR-1343-3pの発現量が、がんの識別に大きく貢献していることが示唆された。
【0061】
貢献スコアが高い上位10種、30種、100種及び1000種のmiRNAの発現量を用いて、上記と同様にして学習済みモデルを得て、テスト用データセットについてがんを検出した。結果を
図12に示す。
図12に示されるように100種のmiRNAを用いた場合に理想的な診断成績に達した。本開示によれば、対象における特定のがん種の罹患を同時に検出することが可能ながんの同時検出方法を提供することができる。