(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-07
(45)【発行日】2025-04-15
(54)【発明の名称】検査方法、検査装置、学習方法、学習装置、検査プログラムおよび学習プログラム
(51)【国際特許分類】
C12Q 1/68 20180101AFI20250408BHJP
C12Q 1/686 20180101ALI20250408BHJP
C12Q 1/6869 20180101ALI20250408BHJP
C12M 1/00 20060101ALI20250408BHJP
C12M 1/34 20060101ALI20250408BHJP
C12Q 1/6813 20180101ALI20250408BHJP
【FI】
C12Q1/68
C12Q1/686 Z
C12Q1/6869 Z
C12M1/00 A
C12M1/34 Z
C12Q1/6813 Z
(21)【出願番号】P 2021500980
(86)(22)【出願日】2020-12-25
(86)【国際出願番号】 JP2020048653
(87)【国際公開番号】W WO2021132547
(87)【国際公開日】2021-07-01
【審査請求日】2023-10-03
(31)【優先権主張番号】P 2019234815
(32)【優先日】2019-12-25
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000003159
【氏名又は名称】東レ株式会社
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】渥美 淳
(72)【発明者】
【氏名】吉本 真紀子
(72)【発明者】
【氏名】宮野 敦子
【審査官】上村 直子
(56)【参考文献】
【文献】特開2019-105451(JP,A)
【文献】国際公開第2019/004436(WO,A1)
【文献】国際公開第2018/199275(WO,A1)
【文献】国際公開第2018/124293(WO,A1)
【文献】特開2019-020838(JP,A)
【文献】国際公開第2017/146033(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/68-1/70
C12M 1/00
C12M 1/34
C12N 15/00-15/90
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
miRNAを含む疾患マーカーを用いて
膵臓癌および胆道癌を含む疾患の検査を行う検査方法であって、
被検体から採取した
血液、血清または血漿を含む体液検体中の
上記疾患マーカーを測定した結果を示すマーカーデータ、および該体液検体の調製条件を示す調製データを取得する検体データ取得工程と、
体液検体中の疾患マーカーを測定した結果を示すマーカーデータおよび該体液検体の調製条件を示す調製データの組と、該体液検体が採取された被検体における疾患の罹患の有無との相関関係を機械学習させた学習済モデルに、上記検体データ取得工程で取得した上記マーカーデータおよび上記調製データを入力することによって、上記被検体における疾患の罹患の有無を判別する判別工程とを含
み、
上記調製データが、上記疾患マーカーの測定前に上記体液検体に施された処理の条件情報を含み、
上記体液検体に施された処理の条件が、上記体液検体を凍結保存するまでの時間、凍結保存時の温度、凍結保存している時間、および上記体液検体を遠心分離するまでの時間から選択される少なくとも1つの条件である、検査方法。
【請求項2】
上記調製データが、上記被検体の情報、
および上記体液検体の採取条件を示す情
報から選択される少なくとも1つの情報を
さらに含む、請求項1に記載の検査方法。
【請求項3】
上記体液検体の採取条件を示す上記情報が、上記体液検体の採取に用いられた針の太さ、上記体液検体の採取に用いられた採血管の種類、および上記被検体における最終飲食から上記体液検体を採取するまでの時間から選択される少なくとも1つの情報である、請求項
2に記載の検査方法。
【請求項4】
上記被検体の上記情報が、上記被検体の人種に関する情報である、請求項
2に記載の検査方法。
【請求項5】
上記マーカーデータが、マイクロアレイ、PCRまたはシーケンシングから得られたデータである、請求項
1に記載の検査方法。
【請求項6】
体液検体中の疾患マーカーを測定した結果を示すマーカーデータ、該体液検体の調製条件を示す調製データ、および該体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する学習用データ取得工程と、
上記学習用データ取得工程で取得した上記マーカーデータおよび上記調製データの組と、上記臨床データとの相関関係を機械学習させることにより、上記学習済モデルを生成するモデル生成工程とをさらに含む、請求項1~
5の何れか1項に記載の検査方法。
【請求項7】
miRNAを含む疾患マーカーを用いた
膵臓癌および胆道癌を含む疾患の検査に用いられる学習済モデルを生成する学習方法であって、
血液、血清または血漿を含む体液検体中の
上記疾患マーカーを測定した結果を示すマーカーデータ、
該体液検体の調製条件を示す調製データ、および該体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する学習用データ取得工程と、
取得した上記マーカーデータおよび上記調製データの組と、上記臨床データとの相関関係を機械学習させることにより、上記マーカーデータおよび上記調製データから上記疾患の罹患を判別可能な学習済モデルを生成するモデル生成工程とを含
み、
上記調製データが、上記疾患マーカーの測定前に上記体液検体に施された処理の条件情報を含み、
上記体液検体に施された処理の条件が、上記体液検体を凍結保存するまでの時間、凍結保存時の温度、凍結保存している時間、および上記体液検体を遠心分離するまでの時間から選択される少なくとも1つの条件である、学習方法。
【請求項8】
miRNAを含む疾患マーカーを用いた
膵臓癌および胆道癌を含む疾患の検査に用いられる学習済モデルを生成する学習装置であって、
血液、血清または血漿を含む体液検体中の
上記疾患マーカーを測定した結果を示すマーカーデータ、該体液検体の調製条件を示す調製データ、および該体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する学習用データ取得部と、
取得した上記マーカーデータおよび上記調製データの組と、上記臨床データとの相関関係を機械学習させることにより、上記マーカーデータおよび上記調製データから上記疾患の罹患を判別可能な学習済モデルを生成するモデル生成部と、を備
え、
上記調製データが、上記疾患マーカーの測定前に上記体液検体に施された処理の条件情報を含み、
上記体液検体に施された処理の条件が、上記体液検体を凍結保存するまでの時間、凍結保存時の温度、凍結保存している時間、および上記体液検体を遠心分離するまでの時間から選択される少なくとも1つの条件である、学習装置。
【請求項9】
miRNAを含む疾患マーカーを用いて
膵臓癌および胆道癌を含む疾患の検査を行う検査装置であって、
被検体由来の
血液、血清または血漿を含む体液検体における上記マーカーデータおよび上記調製データを取得する検体データ取得部と、
請求項
8に記載の学習装置により生成された上記学習済モデルを用いて、上記検体データ取得部が取得した上記マーカーデータおよび上記調製データから、上記疾患の罹患を判別する判別部と、を備え
、
上記調製データが、上記疾患マーカーの測定前に上記体液検体に施された処理の条件情報を含み、
上記体液検体に施された処理の条件が、上記体液検体を凍結保存するまでの時間、凍結保存時の温度、凍結保存している時間、および上記体液検体を遠心分離するまでの時間から選択される少なくとも1つの条件である、検査装置。
【請求項10】
請求項
8に記載の学習装置としてコンピュータを機能させるための学習プログラムであって、上記学習用データ取得部、および上記モデル生成部としてコンピュータを機能させるための学習プログラム。
【請求項11】
請求項
9に記載の検査装置としてコンピュータを機能させるための検査プログラムであって、上記検体データ取得部、および上記判別部としてコンピュータを機能させるための検査プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、疾患マーカーを用いて疾患の検査を行う検査方法および検査装置、当該検査に用いられる学習済モデルを生成する学習方法および学習装置、ならびに検査プログラムおよび学習プログラムに関する。
【背景技術】
【0002】
疾患等の検査を目的とした、血液中に含まれるタンパク質、DNAおよびRNAの解析が、1960年代から行われている。特に2007年頃からは、miRNAを対象とした解析も盛んに行われるようになっている。近年、血清中miRNAの発現プロファイルからがん等の罹患有無を判定する取り組みが、世界中で実施されている。
【0003】
疾患の罹患に関係する、疾患の罹患の指標となるこれらの生体分子(疾患マーカー)を用いた検査では、検体の採取に伴う疾患マーカーの存在量の変動を抑える必要がある。例えば、特許文献1には、血清状態の検体を4℃で72時間または168時間保存した後、検体中の一部のmiRNAの存在量が大きく変動することが開示されている。そのため、検体の採取も含めた検査条件を揃えて実施する等、プロトコールを統一するといった工夫が一般的になされている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
被検者検体のサンプリングは各医療機関で実施されるため、その条件は各機関により異なり得る。そのため、疾患マーカーの変動をもたらさないように、医療機関に対して条件統一の協力を仰ぐなどの対応を余儀なくされている。
【0006】
さらに、本発明者らが検討を進めていく中で、特許文献1に示された比較的長い時間の保存(72時間または168時間)を行った場合のみならず、血清を調整するまでの短い時間(例えば6時間以内)でも、miRNAの発現プロファイルに思いがけず大きな変動が存在し得ることが判明した。そのため、精度高く検査を行うには、変動しやすいmiRNAを解析対象から除外するか、または、変動を少しでも抑えるために、医療機関に対し、統一プロトコールの順守、またはより細かな条件でのサンプリングを依頼する必要性が生じている。しかしながら、一部のmiRNAを解析対象から除外することによるデータの破棄は、精度の高い検査を行ううえで大きな損失である。また厳格なプロトコールの順守、およびより細かな条件でのサンプリングは、医療現場へさらなる負担を強いることになり、検査の実施または普及の妨げとなりかねない。
【0007】
そこで、本発明は上記の問題点に鑑みてなされたものであり、その目的は、医療現場に過度の負担をかけることなく、実施可能な検体採取条件の幅を許容したうえで、精度の高い疾患の検査方法を提供することにある。
【課題を解決するための手段】
【0008】
本発明に係る検査方法は、上記課題を解決するために、疾患マーカーを用いて疾患の検査を行う検査方法であって、被検体から採取した体液検体中の疾患マーカーを測定した結果を示すマーカーデータ、および該体液検体の調製条件を示す調製データを取得する検体データ取得工程と、体液検体中の疾患マーカーを測定した結果を示すマーカーデータおよび該体液検体の調製データの組と、該体液検体が採取された被検体における疾患の罹患の有無との相関関係を機械学習させた学習済モデルに、上記検体データ取得工程で取得した上記マーカーデータおよび上記調製データを入力することによって、上記被検体における疾患の罹患の有無を判別する工程とを含む、構成である。
【0009】
また、本発明に係る検査方法の一態様は、体液検体中の疾患マーカーを測定した結果を示すマーカーデータ、該体液検体の調製条件を示す調製データ、および該体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する学習用データ取得工程と、上記学習用データ取得工程で取得した上記マーカーデータおよび上記調製データの組と、上記臨床データとの相関関係を機械学習させることにより、上記学習済モデルを生成するモデル生成工程とをさらに含む構成である。
【0010】
本発明に係る学習方法は、上記課題を解決するために、疾患マーカーを用いた疾患の検査に用いられる学習済モデルを生成する学習方法であって、体液検体中の疾患マーカーを測定した結果を示すマーカーデータ、該体液検体の調製条件を示す調製データ、および該体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する学習用データ取得工程と、取得した上記マーカーデータおよび上記調製データの組と、上記臨床データとの相関関係を機械学習させることにより、上記マーカーデータおよび上記調製データから上記疾患の罹患を判別可能な学習済モデルを生成するモデル生成工程とを含む、構成である。
【0011】
本発明に係る学習装置は、上記課題を解決するために、疾患マーカーを用いた疾患の検査に用いられる学習済モデルを生成する学習装置であって、体液検体中の疾患マーカーを測定した結果を示すマーカーデータ、該体液検体の調製条件を示す調製データ、および該体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する学習用データ取得部と、取得した上記マーカーデータおよび上記調製データの組と、上記臨床データとの相関関係を機械学習させることにより、上記マーカーデータおよび上記調製データから上記疾患の罹患を判別可能な学習済モデルを生成するモデル生成部と、を備えている構成である。
【0012】
本発明に係る検査装置は、上記課題を解決するために、疾患マーカーを用いて疾患の検査を行う検査装置であって、被検体由来の体液検体における上記マーカーデータおよび上記調製データを取得する検体データ取得部と、上述の学習装置により生成された上記学習済モデルを用いて、上記検体データ取得部が取得した上記マーカーデータおよび上記調製データから、上記疾患の罹患を判別する判別部と、を備えている構成である。
【発明の効果】
【0013】
本発明の一態様によれば、検体中の疾患マーカーを測定した結果を示すマーカーデータに加えて、検体の調製条件を示す調製データも用いることで、医療現場に過度の負担をかけることなく、精度の高い疾患の検査を行うことができる。
【図面の簡単な説明】
【0014】
【
図1】本発明の一実施形態に係る検査装置および端末装置の概略構成を示す機能ブロック図である。
【
図2】本発明の一実施形態に係る検査装置の制御部の学習フェーズにおける処理の流れを示すフローチャートである。
【
図3】本発明の一実施形態に係る検査装置の制御部の検査フェーズにおける処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0015】
本発明の一実施形態について説明する。本実施形態における検査装置は、疾患マーカーを用いた疾患の検査を行う装置であって、体液検体中の疾患マーカーを測定した結果を示すマーカーデータおよび該体液検体の調製データを入力、かつ疾患の罹患の有無を出力として機械学習させた学習済モデルを用いて、疾患の罹患の有無を判別する検査装置である。
【0016】
〔用語〕
まず、用語について説明する。本明細書において、「体液検体」とは、検査に用いられる、被検体から採取された体液のことをいう。体液としては、疾患マーカーの測定を目的とした検査に使用可能であれば特に制限はないが、一例として、血液、血清、血漿、髄液、尿、唾液、涙、組織液またはリンパ液が挙げられる。これらの中でも、血液、血清および血漿が好適に用いられる。
【0017】
本明細書において、「疾患マーカー」とは、その存在または存在量が特定の疾患との間で関係性のある生体分子のことをいう。疾患マーカーとしては、例えば、DNA、RNAおよびタンパク質等が挙げられる。これらの中でもRNAが好適に用いられ、ノンコーディングRNA(ncRNA)がより好適に用いられる。ncRNAは、20塩基長から200塩基長程度の小分子ncRNAと全長が数百塩基長から数十万塩基長の長鎖ncRNAとに大別される。ncRNAとしては、転移RNA、リボソームRNA、核内低分子RNA、核小体低分子RNA、シグナル認識複合体RNA、miRNA、piRNA、長鎖ノンコーディングRNA、環状RNA、およびmRNAの非翻訳領域等が挙げられ、miRNAが特に好適に用いられる。また、疾患は、疾患マーカーの存在が知られている疾患であれば特に制限されず、癌、認知症、高血圧、心臓疾患、脳疾患、肝炎、感染症、およびアレルギー等が挙げられる。癌としては、膵臓癌、胆道癌、乳癌、肺癌、大腸癌、食道癌、胃癌、肝臓癌、前立腺癌、膀胱癌、脳腫瘍、血液癌、卵巣癌、および子宮癌等が挙げられ、一例として、膵臓癌および胆道癌であり得る。
【0018】
本明細書において、「マーカーデータ」とは、体液検体中の疾患マーカーを測定することにより得られた、1以上の疾患マーカーの存否または存在量をそれぞれ示すデータである。なお、実際の検出対象がDNA、RNAまたはタンパク質である場合には、「存在量」は、「発現量」と言い換えることができる。また、疾患マーカーについて用いられる場合、「測定する」は、「検出する」と言い換えることができる。本実施形態におけるマーカーデータは、特定の一つの疾患マーカーを測定して得られた結果に限らず、複数の疾患マーカーを測定して得られた、各疾患マーカーに対応した複数の測定結果または数値データを含むものでもよい。複数の疾患マーカーの測定結果は、各疾患マーカーを同時に測定した結果であってもよいし、独立に測定を行った結果であってもよい。複数の疾患マーカーを用いる場合、その数は限定されず、例えば、2以上、3以上、4以上、5以上、10以上、15以上、20以上、30以上または40以上であり得る。マーカーデータを得るための測定手段としては、測定の対象となる生体分子および必要なデータに応じて適宜選択することができる。測定手段の一例としては、マイクロアレイ、qRT-PCRを含む各種PCR、次世代シーケンシングを含む各種シーケンシング、およびELISA等が挙げられる。なかでも、複数の疾患マーカーを同時に測定でき、複数の疾患マーカーを用いることで精度の高い検査を行える観点から、マイクロアレイを用いることが好ましい。測定結果を数値データへ変換する場合、変換方法は、測定結果と数値データとの間に相関関係がみられるものであれば、特に制限されない。
【0019】
本明細書において、「被検体」は、ヒトおよびチンパンジーを含む霊長類、イヌおよびネコ等の愛玩動物、ウシ、ウマ、ヒツジおよびヤギ等の家畜動物、マウスおよびラット等の齧歯類、ならびに動物園で飼育される動物等の哺乳動物を意味する。好ましい被検体は、ヒトである。また、「健常者」は、対象としている被検体と同一種の個体であって、対象としている疾患に罹患していない個体である。
【0020】
「調製データ」とは、体液検体の調製条件を示すデータであり、測定により得られる疾患マーカーの測定結果以外の、体液検体に関する1以上の情報を含む。詳細には、調製データに含まれる情報の一例としては、体液検体が採取された被検体における情報、体液検体の採取条件を示す情報、および体液検体における疾患マーカーの測定前に体液検体に施された処理の条件の情報が挙げられる。被検体または被検体の状態が相違したり、体液検体の採取条件または処理条件が相違すると、体液検体中の疾患マーカーのプロファイルは少なからず変動し得る。
【0021】
「被検体における情報」とは、体液検体および体液検体の採取とは直接関係のない、被検体自身についての情報、または体液検体採取時の被検体の身体の状態に関する情報である。このような情報としては、例えば、被検体の人種、検体採取の当日もしくは前日の食餌内容および摂食時間、被検体における最終飲食から体液を採取するまでの時間、ならびに被検体が薬物を服用していた場合の、服用薬物種または薬物を服用してから採取までの時間等の身体または身体の状態に関する情報が挙げられる。
【0022】
「体液検体の採取条件を示す情報」とは、体液採取時の条件および使用器具に関する情報である。このような情報としては、体液の採取に針を用いた場合の、用いられた採血針の種類、体液が血液または血液由来の成分であった場合の、血液の採取に用いられた採血管の種類、採血管に添加されている凝固促進剤または凝固抑制剤の種類、および採血時の血管の種類(毛細管血か静脈血か)等が挙げられる。
【0023】
「体液検体に施された処理の条件」は、疾患マーカーの測定前に、体液検体に施された各種処理および操作における条件であり、体液検体の保存に関する条件も含むものである。保存に関する条件とは、例えば、体液を採取した後、疾患マーカーの解析をすぐに行わずに凍結保存しておく場合に、凍結させるまでもしくはフリーザーに移すまでの時間および温度、凍結保存時の温度、凍結保存している時間、RNase、DNaseまたはProteaseに代表される、体液検体中の分解酵素を不活化処理するまでの時間、凍結保存中の検体保存容器の材質、および凍結保存の開始時に温度変化の衝撃を和らげるための梱包材の使用有無等が挙げられる。また、体液検体に施され得る各種処理および操作における条件とは、体液に遠心分離操作を施す場合、または採取した血液に遠心分離操作を施し、実際の体液検体となる血清を得る場合等における、被検体から体液を採取してから遠心分離操作を施すまでの時間、および遠心加速度等が挙げられる。なお、採取した体液に遠心分離操作を施すことで実際の体液検体が得られる場合、遠心分離操作後に、体液検体を凍結させるまでもしくはフリーザーに移すまでの時間も、体液検体に施された処理の条件の一例として挙げられる。さらに、保存された体液検体から疾患マーカーを測定するために、体液検体を凍結状態から溶解するまでの時間および溶解させるための温度等が挙げられる。
【0024】
調製データは、上述の情報のうちの少なくとも1つが含まれていればよく、2以上、3以上または4以上が含まれていてもよい。
【0025】
「臨床データ」とは、体液検体が採取された被検体における疾患の罹患の有無を示すデータである。後述する学習用データにおいては、疾患の罹患の有無は、組織病理検査により診断されたものであり得る。
【0026】
〔検査装置の構成〕
次に、
図1~
図3に基づいて、本実施形態に係る検査装置について説明する。
図1は、本実施形態に係る検査装置および端末装置の概略構成を示す機能ブロック図である。
図1に示されるように、検査装置100は、表示部および入力デバイス等を備えた端末装置200と通信する構成である。ただし、検査装置100は本実施形態の構成に限定されず、例えば、検査装置100は、端末装置200と通信せずに、自ら表示部および入力デバイス等を備えていてもよい。
【0027】
検査装置100は、制御部110、記憶部120および通信部130を備えている。制御部110は、取得部(学習用データ取得部、検体データ取得部)140、モデル生成部150および判別部160を備えている。また、取得部140は、マーカーデータ取得部141、調製データ取得部142および臨床データ取得部143を備えている。
【0028】
制御部110は、検査装置100を統括的に制御するものである。
【0029】
記憶部120は、検査装置100の処理に必要なデータを記憶する記憶装置である。また、記憶部120は、学習済モデル121を記憶する。なお、記憶部120は、検査装置100の外部装置であってもよい。例えば、記憶部120は、検査装置100と通信可能に接続されたサーバ等の記憶装置であってもよい。
【0030】
マーカーデータ取得部141は、体液検体中の疾患マーカーを測定した結果を示すマーカーデータを取得する。調製データ取得部142は、体液検体の調製条件を示す調製データを取得する。そして、臨床データ取得部143は、体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する。取得部140は、同一の体液検体についてのマーカーデータ、調製データおよび臨床データを互いに対応づけて記憶部120に記憶させる。
【0031】
モデル生成部150は、マーカーデータと、該マーカーデータに対応する調製データと、該マーカーデータに対応する臨床データとを用いて機械学習を行い、マーカーデータおよび該マーカーデータに対応する調製データの組と、臨床データとの相関関係を学習させた学習済モデル121を生成する。学習済モデル121を規定する各種のパラメーターは記憶部120に記憶される。学習済モデル121を生成するための具体的アルゴリズムは特に限定されず、ニューラルネットワーク、決定木、ランダムフォレスト、勾配ブースティング、バギング、サポートベクターマシン(SVM)、マッピング、クラスタリング、自己組織化マップ(SOM)、局所探索法、期待値最大化法、多変量適応型回帰スプライン法、ベイジアン・ネットワーク、カーネル密度推定、主成分分析、ガウス混合モデル、逐次的カバーリングルールの構築、勾配ブースティング決定木、および畳み込みニューラルネットワークを含むディープラーニング(深層学習)等を用いることができる。
【0032】
判別部160は、記憶部120に記憶された学習済モデル121を用いて、入力されるマーカーデータおよびそれに対応する調製データの基となる被検体が、対象とする疾患に罹患しているか否かを判別する。具体的には、判別部160は、マーカーデータおよびそれに対応する調製データを、記憶部120に記憶された学習済モデル121に入力し、学習済モデル121から出力される判別結果を取得する。取得した判別結果は、通信部130を介して端末装置200に送信される。なお、学習済モデル121から出力される判別結果が、ある数値範囲内の数値として出力されるものであってもよい。この場合、判別結果としての数値が、予め指定された閾値を超えていれば、判別部160は検査対象となった検体が陽性である(罹患している)と判別する。一方、閾値以下であれば当該検体は陰性である(罹患していない)と判別する。そして、判別部160はその結果を端末装置200に送信してもよい。あるいは、学習済モデル121から出力された数値をそのまま端末装置200に送信し、ユーザが、所定の基準に基づき検体の陽性/陰性を判別するものであってもよい。また、予め指定された閾値は段階的に複数設けられてもよい。この場合、判別部160は、例えば、判別結果としての数値が当該複数の閾値のうちのどの閾値を超えているかにより、検査対象となった検体の罹患リスクの度合いを複数段階で判別する。例えば、閾値として第1の閾値および第1の閾値よりも低い第2の閾値を設定し、第1の閾値を超えている場合に判別部160はリスク高と判別し、第1の閾値以下であり、かつ第2の閾値を超えている場合に判別部160はリスク中と判別し、第2の閾値以下の場合に判別部160はリスク低と判別するものであってもよい。
【0033】
なお、本実施形態では、制御部110にモデル生成部150を備え、取得部140に臨床データ取得部143を備えている検査装置100について説明している。しかしながら、検査装置100にモデル生成部150および臨床データ取得部143を設ける構成でなくてもよい。すなわち、検査装置100とは独立に存在する、マーカーデータ取得部141、調製データ取得部142および臨床データ取得部143を備えた取得部140と、モデル生成部150とを少なくとも含む学習装置により、上述の学習済モデル121を構築するものであってもよい。学習装置が検査装置100とは独立に存在する場合には、検査装置100は、記憶媒体に記憶された学習済モデル121を読み込むことで、学習済モデル121が利用可能となる。または、検査装置100は、有線または無線のネットワークを介して他の装置から学習済モデル121を受信することで、検査装置100において学習済モデル121が利用可能となる。
【0034】
端末装置200は、通信部210、制御部220、入力デバイス230および表示部240を備えている。通信部210は、検査装置100との間で、有線または無線でデータの送受信を行う通信インターフェースである。制御部220は、端末装置200を統括的に制御する。表示部240は、画像、文字等を表示可能なディスプレイである。入力デバイス230は、ユーザの入力を受け付けるものであり、例えばタッチパネル、マウスおよびキーボード等によって実現される。入力デバイス230がタッチパネルの場合、表示部240に当該タッチパネルが設けられる。ユーザは、端末装置200を介して、検査装置100の機能を利用することがでる。
【0035】
〔検査装置の動作〕
検査装置100は、学習済モデルを生成する学習フェーズ(学習方法に対応)と、学習フェーズにおいて生成した学習済モデルを用いて検査を行う検査フェーズ(検査方法に対応)とを実行する。
【0036】
図2は、学習フェーズにおける制御部110の処理の流れを示すフローチャートである。なお、一部のステップは並行して、または順序を替えて実行されてもよい。制御部110は、学習用データとして用いられる、体液検体中の疾患マーカーを測定することにより得られたマーカーデータを取得する(S10;学習用データ取得工程)。また、制御部110は、学習用データとして用いられる、体液検体の調製に関する情報である調製データを取得する(S11;学習用データ取得工程)。また、制御部110は、学習用データとして用いられる、体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する(S12;学習用データ取得工程)。これらの学習用のデータは、例えば、ユーザが記憶部120に予め記憶させておいたものであってもよいし、ユーザが端末装置200を操作して、検査装置100にアップロードしたものであってもよい。制御部110は、学習用データが記憶部120に記憶されていない場合は、取得部140が取得した各データを記憶部120に記憶させる。モデル生成部150は、マーカーデータおよび該マーカーデータに対応する調製データと、該マーカーデータに対応する臨床データとを用いて、マーカーデータおよび調製データの組と臨床データとの相関関係を機械学習させた学習済モデル121を生成し、記憶部120に記憶させる(S13;モデル生成工程)。以上により、学習フェーズを完了する。
【0037】
図3は、検査フェーズにおける制御部110の処理の流れを示すフローチャートである。なお、一部のステップは並行して、または順序を替えて実行されてもよい。
図3に示される処理は例えば、検査処理の実行を指示する操作がユーザにより行われることをトリガとして開始される。制御部110は、検査用データとして、マーカーデータを取得する(S20;検体データ取得工程)。また、制御部110は、検査用データとして、取得したマーカーデータに対応する調製データを取得する(S21;検体データ取得工程)。検査用データは、例えば、ユーザが記憶部120に予め記憶させておいたものであってもよいし、ユーザが端末装置200を操作して、検査装置100にアップロードしたものであってもよい。制御部110は、検査用データが記憶部120に記憶されていない場合は、取得部140が取得した各データを記憶部120に記憶させる。判別部160は、取得したマーカーデータおよび調製データを学習済モデル121に入力し(S22;判別工程)、学習済モデル121から出力される判別結果を取得する(S23;判別工程)。判別部160は、取得した判別結果を示す出力データを、通信部130を介して端末装置200に送信する(S24)。以上により、検査フェーズを完了する。端末装置200では、通信部210を介して受信した出力データを、表示部240に表示させる。
【0038】
なお、上述の処理を実行する前に、ユーザは、「マーカーデータ」、「調製データ」および「臨床データ」を取得しておく必要がある。「調製データ」および「臨床データ」は、通常、検体採取を行った医療機関で得られるデータである。一方、「マーカーデータ」は、通常、検体採取を行った医療機関または当該医療機関とは異なる検査機関で取得される。よって、ユーザが検査機関に属する場合には、ユーザは、予め医療機関から「調製データ」および「臨床データ」の提供を受けておく。
【0039】
検査装置100における学習フェーズの処理と、検査フェーズの処理とは、必ずしも連続的に行われる必要はない。すなわち、予め学習フェーズの処理のみを実行しておき、検査フェーズの処理が必要となるまで、待機していてもよい。また、学習フェーズの処理を上述の学習装置において実行し、検査装置100は検査フェーズの処理のみを実行するものであってもよい。この場合、検査装置100は、当該学習装置において生成された学習済モデルを当該学習装置から予め取得しておけばよい。
【0040】
上述の通り、本実施形態における検査装置100は、マーカーデータおよび調製データを用いて疾患の罹患の有無を判別するものであるが、追加的にさらに別のデータ(以下、追加データ)を用いることも可能である。例えば、検査対象の疾患とは異なる疾患であって、検査対象の疾患とは直接関係のない疾患の罹患の指標として従来用いられている疾患マーカーまたは検査値を、上述の調製データと組合せて用いてもよい。より詳細な例としては、膵臓癌または胆道癌の罹患の有無を判別するために検査装置100を用いる場合において、被検体の血液中に含まれる血球量(赤血球量、白血球量または血小板量)、PSAおよびCYFRA等のタンパク疾患マーカー量、ならびにHDLコレステロール量およびLDLコレステロール量等の検査値を、追加データとして、調製データと組合せて用いてもよい。このような追加データを用いる場合、調製データと同様にして、制御部110が追加データを取得する。そして、モデル生成部150は、マーカーデータおよび該マーカーデータに対応する調製データの組に追加データも加えたうえで、臨床データとの相関関係を機械学習させた学習済モデルを生成すればよい。検査フェーズにおいても、制御部110が検査用データとして追加データを取得する。そして、判別部160は、追加データも学習済モデルへの入力に用い、判別結果を取得すればよい。
【0041】
〔本実施形態の効果〕
以上のように、本実施形態では、マーカーデータを入力とし、疾患の罹患の有無を出力とする学習済モデルを用いた疾患の検査方法において、疾患の罹患の有無とは関係のない指標(調製データ)も入力の一情報として用いて学習済モデルを作成している。そして、驚くべきことに、疾患の罹患の有無とは関係のない指標を用いることで、疾患の罹患の有無を示す判別結果の精度を向上させることができる。
【0042】
調製データの取得は、細かなプロトコールの厳守等のさらなる負担を、実際に検体のサンプリングを行う医療現場に強いるものではない。すなわち、実施可能な検体採取条件の幅を許容したうえで、単に、どのようなプロトコールまたは条件でサンプリングを行っていたかを記録し、その情報を実際に検査を行うユーザに提供するだけでよい。また、これらの情報は、マーカーデータを取得し終わった後であっても、容易に取得または確認できるものである。よって、本実施形態に係る検査方法の実施においては、医療現場における負担が極めて小さい。また、比較的短い作業時間の間に変動し得る疾患マーカーが解析対象に含まれる場合であっても、それらを除外することなく精度の高い判別結果を得ることができる。
【0043】
とりわけ、複数の疾患マーカーを用いて検査を行う場合、調製データに対応するパラメーターの相違により起こり得る疾患マーカーの変動の様子は、疾患マーカー毎に異なり得る。よって、複数の疾患マーカーを用いて検査精度を高める場合、疾患マーカーの変動をより小さくする必要があり、プロトコールのより厳格な遵守が求められる。しかしながら本実施形態によれば、情報を記録しておくだけでよいので、複数の疾患マーカーを用いての検査により好適に適用できる。
【0044】
〔ソフトウェアによる実現例〕
検査装置100の制御ブロック(制御部110、特に取得部140、モデル生成部150および判別部160)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
【0045】
後者の場合、検査装置100は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも1つのプロセッサ(制御装置)を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも1つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)またはGPU(Graphics Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
【0046】
〔まとめ〕
本発明に係る検査方法は、疾患マーカーを用いて疾患の検査を行う検査方法であって、被検体から採取した体液検体中の疾患マーカーを測定した結果を示すマーカーデータ、および該体液検体の調製条件を示す調製データを取得する検体データ取得工程と、体液検体中の疾患マーカーを測定した結果を示すマーカーデータおよび該体液検体の調製データの組と、該体液検体が採取された被検体における疾患の罹患の有無との相関関係を機械学習させた学習済モデルに、上記検体データ取得工程で取得した上記マーカーデータおよび上記調製データを入力することによって、上記被検体における疾患の罹患の有無を判別する工程とを含む、構成である。
【0047】
また、本発明に係る検査方法の一態様では、上記調製データが、上記被検体の情報、上記体液検体の採取条件を示す情報、および上記疾患マーカーの測定前に上記体液検体に施された処理の条件情報から選択される少なくとも1つの情報を含む。
【0048】
また、本発明に係る検査方法の一態様では、上記体液検体に施された処理の条件が、上記体液検体を凍結保存するまでの時間、凍結保存時の温度、凍結保存している時間、および上記体液検体を遠心分離するまでの時間から選択される少なくとも1つの条件である。
【0049】
また、本発明に係る検査方法の一態様では、上記体液検体の採取条件を示す上記情報が、上記体液検体の採取に用いられた針の太さ、上記体液検体の採取に用いられた採血管の種類、および上記被検体における最終飲食から上記体液検体を採取するまでの時間から選択される少なくとも1つの情報である。
【0050】
また、本発明に係る検査方法の一態様では、上記被検体の上記情報が、上記被検体の人種に関する情報である。
【0051】
また、本発明に係る検査方法の一態様では、上記体液検体が、血液、血清、血漿、髄液、尿、唾液、涙、組織液またはリンパ液である。
【0052】
また、本発明に係る検査方法のさらなる態様では、上記体液検体が、血液、血清または血漿である。
【0053】
また、本発明に係る検査方法の一態様では、上記疾患マーカーが、miRNAである。
【0054】
また、本発明に係る検査方法の一態様では、上記マーカーデータが、マイクロアレイ、PCRまたはシーケンシングから得られたデータである。
【0055】
また、本発明に係る検査方法の一態様は、体液検体中の疾患マーカーを測定した結果を示すマーカーデータ、該体液検体の調製条件を示す調製データ、および該体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する学習用データ取得工程と、上記学習用データ取得工程で取得した上記マーカーデータおよび上記調製データの組と、上記臨床データとの相関関係を機械学習させることにより、上記学習済モデルを生成するモデル生成工程とをさらに含む構成である。
【0056】
本発明に係る学習方法は、疾患マーカーを用いた疾患の検査に用いられる学習済モデルを生成する学習方法であって、体液検体中の疾患マーカーを測定した結果を示すマーカーデータ、該体液検体の調製条件を示す調製データ、および該体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する学習用データ取得工程と、取得した上記マーカーデータおよび上記調製データの組と、上記臨床データとの相関関係を機械学習させることにより、上記マーカーデータおよび上記調製データから上記疾患の罹患を判別可能な学習済モデルを生成するモデル生成工程とを含む、構成である。
【0057】
本発明に係る学習装置は、疾患マーカーを用いた疾患の検査に用いられる学習済モデルを生成する学習装置であって、体液検体中の疾患マーカーを測定した結果を示すマーカーデータ、該体液検体の調製条件を示す調製データ、および該体液検体が採取された被検体における疾患の罹患の有無を示す臨床データを取得する学習用データ取得部と、取得した上記マーカーデータおよび上記調製データの組と、上記臨床データとの相関関係を機械学習させることにより、上記マーカーデータおよび上記調製データから上記疾患の罹患を判別可能な学習済モデルを生成するモデル生成部と、を備えている構成である。
【0058】
本発明に係る検査装置は、疾患マーカーを用いて疾患の検査を行う検査装置であって、被検体由来の体液検体における上記マーカーデータおよび上記調製データを取得する検体データ取得部と、上述の学習装置により生成された上記学習済モデルを用いて、上記検体データ取得部が取得した上記マーカーデータおよび上記調製データから、上記疾患の罹患を判別する判別部と、を備えている構成である。
【0059】
本発明の各態様に係る検査装置および学習装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記検査装置または上記学習装置が備える各部(ソフトウェア要素)として動作させることにより上記検査装置または上記学習装置をコンピュータにて実現させる検査プログラムまたは学習プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
【0060】
以下に実施例を示し、本発明の実施の形態についてさらに詳しく説明する。もちろん、本発明は以下の実施例に限定されるものではなく、細部については様々な態様が可能であることはいうまでもない。さらに、本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、それぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【実施例】
【0061】
[参考例1]
<検体の採取>
組織病理検査により診断された膵臓癌または胆道癌患者48人、および健常者48人からインフォームドコンセントを得て、それぞれの血液を採取し、遠心分離により血清を取得した。取得した血清は、採血から2時間以内に-80℃のフリーザーに移し、使用するまで-80℃で保存した。なお、採血から遠心分離までに要した時間、および遠心分離から-80℃での保存までに要した時間には、検体間で一定のばらつきがあった。
【0062】
<total RNAの抽出>
検体として、上記の96人それぞれから得られた各血清300μLを用いた。3D-Gene(登録商標)RNA extraction reagent from liquid sample kit(東レ株式会社(日本))中のRNA抽出用試薬を用いて、同社の定めるプロトコールに従って、各血清からtotal RNAを得た。以下、参考例1における検体群を検体群1という。
【0063】
<遺伝子発現量の測定>
上記の96人の各血清から得たtotal RNAに対して3D-Gene(登録商標)miRNA Labeling kit(東レ株式会社)を用いて、同社が定めるプロトコールに基づいてtotal RNA中のmiRNAを蛍光標識した。オリゴDNAチップとして、miRBase release 21に登録されているmiRNAと相補的な配列を有するプローブを搭載した3D-Gene(登録商標)Human miRNA Oligo chip(東レ株式会社)を用い、同社が定めるプロトコールに基づいてストリンジェントな条件でハイブリダイゼーションおよびハイブリダイゼーション後の洗浄を行った。DNAチップを3D-Gene(登録商標)スキャナー(東レ株式会社)を用いてスキャンし、画像を取得して3D-Gene(登録商標)Extraction(東レ株式会社)にて蛍光強度を数値化した。
【0064】
数値化された蛍光強度を用いて以下のように検出された遺伝子の発現量を計算した。まず、複数あるネガティブコントロールスポットのシグナル強度の最大順位および最小順位各々5%を除き、その[平均値+2×標準偏差]を計算し、この値より大きいシグナル強度を示した遺伝子は検出されたとみなした。また、検出された遺伝子のシグナル強度から、最大順位および最小順位各々5%を除いたネガティブコントロールスポットのシグナル強度の平均値を減算し、減算後の値を底が2の対数値に変換して遺伝子発現量とした。データの正規化は、内因性コントロールとして報告がある3種類のmiRNA:miR-149-3p、miR-2861、miR-4463(非特許文献:下村ら、Cancer Science、2016年、第107巻、ページ326-34)の平均値を用いて異なる検体のデータを正規化した。上記において検出されなかった遺伝子については、底が2の対数値0.1に置換した。このようにして、上記の96人の血清に対する、miRNAの遺伝子発現量のシグナル値を得た。
【0065】
数値化されたmiRNAの遺伝子発現量を用いた計算および統計解析は、R言語3.5.3(R Foundation for Statistical Computing、https://www.R-project.org)、caretパッケージ6.0-84、およびxgboostパッケージ0.82.1を用いて実施した。
【0066】
[参考例2]
<検体の採取>
健常者24人からインフォームドコンセントを得て、それぞれの血液を採取し、遠心分離により血清を取得した。取得した血清は、採血から6時間以内に-80℃のフリーザーに移し、使用するまで-80℃で保存した。なお、採血から遠心分離までに要した時間、および遠心分離から-80℃での保存までに要した時間には、検体間で一定のばらつきがあった。
【0067】
<total RNAの抽出>
検体として、上記の24人それぞれから得られた各血清300μLを用い、参考例1と同様にしてtotal RNAを得た。以下、参考例2における検体群を検体群2という。
【0068】
<遺伝子発現量の測定>
上記の24人の各血清から得たtotal RNAを用いて、参考例1と同様にしてmiRNAの遺伝子発現量のシグナル値を得た。
【0069】
[実施例1]
<機械学習による膵臓癌および胆道癌判別性能の検証1:45種のmiRNAを使用>
本実施例では、機械学習の一例として勾配ブースティング決定木を用いた。癌に罹患しているか健常であるかを示す臨床データ、各miRNAの遺伝子発現量のシグナル値、採血から遠心分離までに要した時間、および遠心分離から-80℃での保存までに要した時間を用いて機械学習を行い、癌に罹患しているか健常であるかに分類する判別モデル(学習済モデル)を作成し、検証を行った。本実施例では、使用するmiRNAとして、事前の検討で膵臓癌または胆道癌との関連が示されたmiRNAを任意に45種類選んだ。
【0070】
膵臓癌および胆道癌を判別するために以下のような段階的手順を踏んだ。すなわち、検体群1のデータを6:4に分けて、学習検体群および検証検体群を作成した。学習検体群で勾配ブースティング決定木により判別モデルを取得し、検証検体群でこれを検証した。検証の結果、膵臓癌および胆道癌を陽性と判定する感度は94.4%、健常者を陰性とする特異度は95.2%、精度は94.9%であった。ここで「感度」とは、陽性を正しく陽性と分類した割合である。感度が高ければ、疾患の早期発見が可能になる。また、「特異度」とは、陰性を正しく陰性と分類した割合である。特異度が高ければ、健常者に対して疾患に罹患していると誤判別することによる無駄な追加検査、患者移送、および治療の実施を防ぎ、患者の負担の軽減および医療費の削減等につながる。精度は全検体に対しての判別結果が正しかった割合を示しており、検査性能を評価する第一の指標となる。
【0071】
[実施例2]
<機械学習による膵臓癌および胆道癌判別性能の検証2:78種のmiRNAを使用>
使用するmiRNAとして、事前の検討で膵臓癌または胆道癌との関連が示されたmiRNAを任意に78種類選んだ点を除いて、実施例1と同様にして判別モデルを作成し、検証を行った。検証の結果、膵臓癌および胆道癌を陽性と判定する感度は88.9%、健常者を陰性とする特異度は95.2%、精度は92.3%であった。
【0072】
[実施例3]
<機械学習による膵臓癌および胆道癌判別性能の検証3:45種のmiRNAを使用>
本実施例では、実施例1で作成した判別モデルに対し、検体群1のデータの代わりに検体群2のデータを用いて検証を行った。検証の結果、健常者を陰性とする特異度は87.5%であった。
【0073】
[実施例4]
<機械学習による膵臓癌および胆道癌判別性能の検証4:78種のmiRNAを使用>
本実施例では、実施例2で作成した判別モデルに対し、検体群1のデータの代わりに検体群2のデータを用いて検証を行った。検証の結果、健常者を陰性とする特異度は100.0%であった。
【0074】
[比較例1]
<機械学習による膵臓癌および胆道癌判別性能の検証5:45種のmiRNAを使用>
本比較例では、機械学習の一例として勾配ブースティング決定木を用いた。癌に罹患しているか健常であるかを示す臨床データ、および各miRNAの遺伝子発現量のシグナル値を用いて機械学習を行い、癌に罹患しているか健常であるかに分類する判別モデルを作成し、検証を行った。使用するmiRNAは、実施例1と同じ45種類とした。
【0075】
膵臓癌および胆道癌を判別するために以下のような段階的手順を踏んだ。すなわち、検体群1のデータを6:4に分けて、学習検体群および検証検体群を作成した。学習検体群で勾配ブースティング決定木により判別モデルを取得し、検証検体群でこれを検証した。検証の結果、膵臓癌および胆道癌を陽性と判定する感度は88.9%、健常者を陰性とする特異度は95.2%、精度は92.3%であった。すなわち、実施例1より感度および精度が劣っていることが示された。
【0076】
[比較例2]
<機械学習による膵臓癌および胆道癌判別性能の検証6:78種のmiRNAを使用>
使用するmiRNAを実施例2と同じ78種類に変更した点を除いて、比較例1と同様にして判別モデルを作成し、検証を行った。検証の結果、膵臓癌および胆道癌を陽性と判定する感度は77.8%、健常者を陰性とする特異度は90.5%、精度は86.4%であった。すなわち、実施例2より感度、特異度および精度いずれもが劣っていることが示された。
【0077】
[比較例3]
<機械学習による膵臓癌および胆道癌判別性能の検証7:45種のmiRNAを使用>
本比較例では、比較例1で作成した判別モデルに対し、検体群1のデータの代わりに検体群2のデータを用いて検証を行った。検証の結果、健常者を陰性とする特異度は33.3%であった。すなわち、実施例3より特異度が劣っていることが示された。
【0078】
[比較例4]
<機械学習による膵臓癌および胆道癌判別性能の検証8:78種のmiRNAを使用>
本比較例では、比較例2で作成した判別モデルに対し、検体群1のデータの代わりに検体群2のデータを用いて検証を行った。検証の結果、健常者を陰性とする特異度は79.2%であった。すなわち、実施例3より特異度が劣っていることが示された。
【0079】
以上の結果を、表1および表2に示す。
【0080】
【0081】
【産業上の利用可能性】
【0082】
本発明は、疾患マーカーを利用した疾患の検査に利用することができる。
【符号の説明】
【0083】
100 検査装置
110 制御部
120 記憶部
121 学習済モデル
130 通信部
140 取得部
141 マーカーデータ取得部
142 調製データ取得部
143 臨床データ取得部
150 モデル生成部
160 判別部