(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-05
(45)【発行日】2024-08-14
(54)【発明の名称】代謝物パネルによるがん検査法
(51)【国際特許分類】
G01N 33/68 20060101AFI20240806BHJP
G01N 33/50 20060101ALI20240806BHJP
G01N 27/62 20210101ALI20240806BHJP
【FI】
G01N33/68
G01N33/50 R
G01N27/62 X
(21)【出願番号】P 2022548304
(86)(22)【出願日】2020-09-09
(86)【国際出願番号】 JP2020034198
(87)【国際公開番号】W WO2022054183
(87)【国際公開日】2022-03-17
【審査請求日】2023-02-16
(73)【特許権者】
【識別番号】501387839
【氏名又は名称】株式会社日立ハイテク
(74)【代理人】
【識別番号】110002572
【氏名又は名称】弁理士法人平木国際特許事務所
(72)【発明者】
【氏名】坂入 実
(72)【発明者】
【氏名】阿部 眞由美
(72)【発明者】
【氏名】石垣 隆士
【審査官】草川 貴史
(56)【参考文献】
【文献】特開2019-168319(JP,A)
【文献】特表2011-527414(JP,A)
【文献】国際公開第2017/165956(WO,A1)
【文献】国際公開第2017/213246(WO,A1)
【文献】特表2010-532480(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 33/48-33/98
G16H 50/20
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
複数の健常者及びがん患者について複数のがんマーカーの情報を登録したマーカーパネルを格納したデータベースであって、各がんマーカーの測定値において、健常者の平均値±X×標準偏差[式中、Xは任意の数値である。]、及び/又は健常者の平均値±標準偏差を基準範囲として、基準範囲内、基準範囲より高い又は基準範囲より低いの3つに区別された識別情報を有する前記データベースを準備し、
被験者の1以上のがんマーカーの測定値について、前記データベース中の前記識別情報との相関を解析すること、
を含む、被験者におけるがん検査を補助する方法であって、前記解析の結果から被験者におけるがんを評価するための情報が得られ、前記がんの評価が、被験者におけるがんの判定、被験者におけるがんのリスクの予測、被験者におけるがんのステージ若しくは重症度の判定、被験者におけるがんの予後判定、被験者におけるがんのモニタリング、被験者に存在するがんに対する治療の効果のモニタリング、又はがんの診断の補助を含
み、前記がんマーカーが尿中代謝物である、方法。
【請求項2】
前記被験者のがんマーカーの測定値に基づいて被験者のマーカーパネルが作成される、請求項1に記載の方法。
【請求項3】
前記マーカーパネルにおいて、前記がんマーカーのカラムが、前記3つの識別情報に応じて視覚的に区別可能に表示される、請求項1に記載の方法。
【請求項4】
前記マーカーパネルにおいて、前記がんマーカーが、機械学習により計算された
がんマーカーとしての重要度
が高い順番に示される、請求項1に記載の方法。
【請求項5】
前記データベースにおいて、前記基準範囲が、健常者の平均値±X×標準偏差[式中、Xは2である。]の基準範囲及び健常者の平均値±標準偏差の基準範囲であり、各がんマーカーの測定値が、2つの基準範囲のそれぞれについて異なる識別情報を有する、請求項1に記載の方法。
【請求項6】
前記がんマーカーの測定値に対して、前記3つの識別情報に応じて、基準範囲内はカラム値0、基準範囲より高い場合はカラム値+1、及び基準範囲より低い場合はカラム値-1が割り当てられる、請求項1に記載の方法。
【請求項7】
前記識別情報との相関の解析が、式I:
【数1】
〔式中、
g
nは、機械学習で計算された
がんマーカーとしての重要度の相対値であり、g
nの符号は、被験者のがんマーカーの測定値ががん患者と同じカラム値である場合には+、異なるカラム値である場合には-であり、
D
nは、カラム値+1、0又は-1である。〕
で示される評価関数の値に基づいて行われる、請求項6に記載の方法。
【請求項8】
前記識別情報との相関の解析が、健常者の平均値±X×標準偏差[式中、Xは2である。]を基準範囲とした識別情報に基づいて評価関数を求めた後、健常者の平均値±標準偏差を基準範囲とした識別情報に基づいて評価関数を求めて行われる、請求項7に記載の方法。
【請求項9】
前記被験者の1以上のがんマーカーの測定値について、前記データベース中のがん患者の識別情報のパターン及び健常者の識別情報のパターンとの差を計算し、前記被験者ががん患者又は健常者のパターンのいずれに近いかを解析することをさらに含む、請求項1又は7に記載の方法。
【請求項10】
前記パターンとの差の計算が、式II:
【数2】
〔式中、
g
nは、機械学習で計算された
がんマーカーとしての重要度の相対値であり、
D
nは、データベースにおけるがん患者又は健常者の、各がんマーカーについてのカラム値+1、0又は-1で表される行ベクトルであり、
T
nは、被験者における各がんマーカーについてのカラム値+1、0又は-1で表される行ベクトルである。〕
で示される距離関数により行われる、請求項9に記載の方法。
【請求項11】
前記データベースが、特定のステージ又は重症度のがん患者について複数のがんマーカーの情報を登録したマーカーパネルを有する、請求項1に記載の方法。
【請求項12】
前記がんマーカーが、3以上のがんマーカーを含む、請求項1に記載の方法。
【請求項13】
前記がんマーカーの情報を登録したマーカーパネルが、液体クロマトグラフィ質量分析(LC/MS)により得られた代謝物のイオン強度の情報を登録した代謝物パネルである、請求項1に記載の方法。
【請求項14】
前記データベースががんの種類ごとに異なるものである、請求項1に記載の方法。
【請求項15】
複数の健常者及びがん患者について複数のがんマーカーの情報を登録したマーカーパネルを格納したデータベースであって、各がんマーカーの測定値において、健常者の平均値±X×標準偏差[式中、Xは任意の数値である。]、及び/又は健常者の平均値±標準偏差を基準範囲として、基準範囲内、基準範囲より高い又は基準範囲より低いの3つに区別された識別情報を有する前記データベースを有する記憶部と、
被験者の1以上のがんマーカーの測定値の入力を受ける入力部と、
前記入力部からの被験者の1以上のがんマーカーの測定値について、前記データベース中の前記識別情報との相関を解析する解析部と、
前記解析部で得られた解析の結果から被験者におけるがんを評価する評価部
とを備え
、前記がんマーカーが尿中代謝物である、がん検査システム。
【請求項16】
請求項1に記載の方法を実施するための、請求項15に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、被験者におけるがんを評価するためのがん検査方法及びがん検査システムに関する。
【背景技術】
【0002】
従来のがんマーカーを使用したがん検査法では、まず、マーカー候補を網羅的に解析し、検出したマーカー候補の中から、統計解析、機械学習により、有望なマーカー候補を抽出し、多変量解析により、健常者とがん患者を識別するための予測式を作成する。続いて、被験者におけるマーカーの測定値を予測式に当てはめて、得られた予測値からがんのリスクを判定する、というプロセスにより検査を行っていた。
【0003】
本発明者も、液体クロマトグラフ質量分析計(LC/MS: Liquid Chromatograph/Mass Spectrometer)を利用してがんマーカーとして尿中代謝物を網羅的に解析して、複数の尿中腫瘍マーカー強度にある係数をかけて、予測式:予測値=Σ(αn×In)+β[αn:係数、β:定数、In:尿中腫瘍マーカー強度]により予測値が0以上の場合はがんのリスクが高く、予測値が0より小さければリスクが低いと判定していた(例えば、特許文献1及び2)。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2019-105456号公報
【文献】特開2020-079729号公報
【文献】国際公開WO2007/076439号
【文献】国際公開WO2011/119772号
【文献】米国特許出願公開US2009/0004687A1
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、このような予測式を使用した場合、係数とがんマーカー強度の組み合わせによっては、予測値が0に近い場合があり、判定が困難になる場合があった。このような予測式による判別の具体例を
図1に示す。
図1は、大腸がんのケース(大腸がん患者30例、健常者30例)で、15種類の尿中腫瘍マーカーを用いて、がんのリスク判定を行った結果である。がん患者の領域では、4例ほどが予測値が0に近い数値になっており、健常者の領域でも1例が0に近い値となっている。この予測値法ではこれ以上検討を行えないので、予測値だけではがんのリスクを精緻に判定することが困難な場合があることがわかる。
【0006】
一方、マーカーセットとしての代謝物パネルという考え方は既に存在する。例えば、特許文献3~5では、マーカーとしての代謝物を利用したがん検査において、複数の代謝物より構成される代謝物パネルを作成することが行われている。しかしながら、従来技術において、がんリスクの評価に際し、個別の代謝物マーカーに対して、トレーニングデータの健常者の基準範囲を設定して3つの群に分けること、テストデータにおいても同じ複数の代謝物について同様の計算を行うこと、又はテストデータの代謝物パターンがトレーニングデータにより作成された代謝物パネルのどのパターンに属するかを解析することについては報告も示唆もなかった。
【0007】
そこで本発明は、より高精度かつ精緻にがんを評価するためのがん検査方法及びシステムを提供することを目的とする。
【発明を解決するための手段】
【0008】
本発明者は、がんマーカーを使用したがん検査方法において、がんマーカーの測定値を健常者の基準範囲内、基準範囲より高い及び基準範囲より低いの3つの群に分けて解析することにより、がんの評価をより精緻に行うことができることを見出した。また本発明者は、がんマーカーを上記3つの群を視覚的に区別可能に表示する、並びに/あるいは上記3つの群にカラム値を割り当ててそのカラム値を、マーカー変動量の概算値を表す評価関数及び/又はマーカーパターンの類似度を表す距離関数に当てはめる、ことによって、がんの評価を簡便かつ精緻に行うことができることを見出した。
【0009】
本発明は、例えば以下を包含する:
[1]複数の健常者及びがん患者について複数のがんマーカーの情報を登録したマーカーパネルを格納したデータベースであって、各がんマーカーの測定値において、健常者の平均値±X×標準偏差[式中、Xは任意の数値である。]、及び/又は健常者の平均値±標準偏差を基準範囲として、基準範囲内、基準範囲より高い又は基準範囲より低いの3つに区別された識別情報を有する前記データベースを準備し、
被験者の1以上のがんマーカーの測定値について、前記データベース中の前記識別情報との相関を解析し、
前記解析の結果から被験者におけるがんを評価すること
を含む、被験者におけるがん検査方法。
[2]前記被験者のがんマーカーの測定値に基づいて被験者のマーカーパネルが作成される、[1]に記載の方法。
[3]前記マーカーパネルにおいて、前記がんマーカーのカラムが、前記3つの識別情報に応じて視覚的に区別可能に表示される、[1]又は[2]に記載の方法。
[4]前記マーカーパネルにおいて、前記がんマーカーが、機械学習により計算された重要度の順番に示される、[1]~[3]のいずれかに記載の方法。
[5]前記データベースにおいて、前記基準範囲が、健常者の平均値±X×標準偏差[式中、Xは2である。]の基準範囲及び健常者の平均値±標準偏差の基準範囲であり、各がんマーカーの測定値が、2つの基準範囲のそれぞれについて異なる識別情報を有する、[1]~[4]のいずれかに記載の方法。
[6]前記がんマーカーの測定値に対して、前記3つの識別情報に応じて、基準範囲内はカラム値0、基準範囲より高い場合はカラム値+1、及び基準範囲より低い場合はカラム値-1が割り当てられる、[1]~[5]のいずれかに記載の方法。
[7]前記識別情報との相関の解析が、式I:
【数1】
〔式中、
g
nは、機械学習で計算された重要度の相対値であり、g
nの符号は、被験者のがんマーカーの測定値ががん患者と同じカラム値である場合には+、異なるカラム値である場合には-であり、
D
nは、カラム値+1、0又は-1である。〕
で示される評価関数の値に基づいて行われる、[6]に記載の方法。
[8]前記識別情報との相関の解析が、健常者の平均値±X×標準偏差[式中、Xは2である。]を基準範囲とした識別情報に基づいて評価関数を求めた後、健常者の平均値±標準偏差を基準範囲とした識別情報に基づいて評価関数を求めて行われる、[7]に記載の方法。
[9]前記被験者の1以上のがんマーカーの測定値について、前記データベース中のがん患者の識別情報のパターン及び健常者の識別情報のパターンとの差を計算し、前記被験者ががん患者又は健常者のパターンのいずれに近いかを解析することをさらに含む、[1]~[8]のいずれかに記載の方法。
[10]前記パターンとの差の計算が、式II:
【数2】
〔式中、
g
nは、機械学習で計算された重要度の相対値であり、
D
nは、データベースにおけるがん患者又は健常者の、各がんマーカーについてのカラム値+1、0又は-1で表される行ベクトルであり、
T
nは、被験者における各がんマーカーについてのカラム値+1、0又は-1で表される行ベクトルである。〕
で示される距離関数により行われる、[9]に記載の方法。
[11]前記データベースが、特定のステージ又は重症度のがん患者について複数のがんマーカーの情報を登録したマーカーパネルを有する、[1]~[10]のいずれかに記載の方法。
[12]前記がんマーカーが、3以上又は5以上又は10以上又は20以上のがんマーカーを含む、[1]~[11]のいずれかに記載の方法。
[13]前記がんマーカーが尿中代謝物であり、前記がんマーカーの情報を登録したマーカーパネルが、液体クロマトグラフィ質量分析(LC/MS)により得られた代謝物のイオン強度の情報を登録した代謝物パネルである、[1]~[12]のいずれかに記載の方法。
[14]前記データベースががんの種類ごとに異なるものである、[1]~[13]のいずれかに記載の方法。
[15]前記がんの評価が、被験者におけるがんの判定、被験者におけるがんのリスクの予測、被験者におけるがんのステージ若しくは重症度の判定、被験者におけるがんの予後判定、被験者におけるがんのモニタリング、被験者に存在するがんに対する治療の効果のモニタリング、又はがんの診断の補助を含む、[1]~[14]のいずれかに記載の方法。
【0010】
[16]複数の健常者及びがん患者について複数のがんマーカーの情報を登録したマーカーパネルを格納したデータベースであって、各がんマーカーの測定値において、健常者の平均値±X×標準偏差[式中、Xは任意の数値である。]、及び/又は健常者の平均値±標準偏差を基準範囲として、基準範囲内、基準範囲より高い又は基準範囲より低いの3つに区別された識別情報を有する前記データベースを有する記憶部と、
被験者の1以上のがんマーカーの測定値の入力を受ける入力部と、
前記入力部からの被験者の1以上のがんマーカーの測定値について、前記データベース中の前記識別情報との相関を解析する解析部と、
前記解析部で得られた解析の結果から被験者におけるがんを評価する評価部
とを備えたがん検査システム。
[17][1]に記載の方法を実施するための、[16]に記載のシステム。
【発明の効果】
【0011】
本発明により、高精度かつ精緻にがんを評価するためのがん検査方法及びシステムが提供される。本発明の方法及びシステムは、感度及び特異度に優れているため、偽陽性及び偽陰性を減らし、正確な診断の補助に役立つ。したがって、本発明は、がんの診断、検査、治療評価などの分野に有用である。
【図面の簡単な説明】
【0012】
【
図1】15個のがんマーカーを使用して、従来の予測式による大腸がん患者と健常者の判別を行った結果のグラフを示す。
【
図2】マーカーパネルを用いて、がんマーカーのデータを3群に分割して解析する方法の概念図を示す。
【
図3】マーカー(代謝物)の重要度を解析するためのプロセスのフローを示す。
【
図4】機械学習の1種であるランダムフォレスト(RF)法により得られた重要度を指標にマーカー(代謝物)を並べる例を示すグラフである。
【
図5】本発明に係るがん検査方法の評価関数を説明する概略図である。
【
図6】本発明に係るがん検査方法の距離関数を説明する概略図である。
【
図7】本発明に係るがん検査方法の一実施形態である判定アルゴリズム1のフローを示す。
【
図8】本発明に係るがん検査方法の別の実施形態である判定アルゴリズム2のフローを示す。
【
図9】実施例1の大腸がんの評価に使用した17種類の尿中腫瘍マーカー(代謝物)の種類を示す。
【
図10】実施例1の大腸がんの評価において作成した代謝物パネルの一例(2σモードでの評価関数による評価)を示す。
【
図11】実施例1の大腸がんの評価において作成した2σモードでの評価関数プロットを示す。
【
図12】実施例1の大腸がんの評価における、2σモード及び1σモードの結果に基づいた判定アルゴリズム1による解析フローを示す。
【
図13】実施例1の大腸がんの評価において作成した2σモードでの評価関数プロット(左)、及び1σモードでの評価関数プロット(右)を示す。
【
図14】実施例1の大腸がんの評価における判定アルゴリズム1による判定結果をまとめた表である。
【
図15】実施例2の大腸がんの評価における、評価関数及び距離関数に基づいた判定アルゴリズム2による解析フローを示す。
【
図16】実施例2の大腸がんの評価における、評価関数及び距離関数に基づいた判定アルゴリズム2による解析フローを示す。
【
図17】実施例2の大腸がんの評価における判定アルゴリズム2による判定結果をまとめた表である。
【
図18】実施例3の大腸がんの評価において作成した特定の深達度(T)のがん患者の代謝物パネルの一例を示す。
【
図19】実施例3の大腸がんの評価における、深達度(T)に対する評価関数のプロットを示す。
【
図20】実施例4の乳がんの評価に使用した15種類の尿中腫瘍マーカー(代謝物)の種類を示す。
【
図21】実施例4の乳がんの評価において作成した代謝物パネルの一例(2σモードでの評価関数による評価)を示す。
【
図22】実施例4の乳がんの評価において作成した2σモードでの評価関数プロットを示す。
【
図23】実施例4の乳がんの評価における、2σモード及び1σモードの結果に基づいた判定アルゴリズム1による解析フローを示す。
【
図24】実施例4の乳がんの評価において作成した2σモードでの評価関数プロット(左)、及び1σモードでの評価関数プロット(右)を示す。「がん」はがん患者の番号を、「けん」は健常者の番号を表す。
【
図25】実施例4の乳がんの評価における判定アルゴリズム1による判定結果をまとめた表である。「がん」はがん患者の番号を、「けん」は健常者の番号を表す。
【
図26】実施例4の乳がんの評価における、評価関数及び距離関数に基づいた判定アルゴリズム2による解析フローを示す。
【
図27】実施例4の乳がんの評価における判定アルゴリズム2による判定結果(がん患者)をまとめた表である。
【
図28】実施例4の乳がんの評価における判定アルゴリズム2による判定結果(健常者)をまとめた表である。
【発明を実施するための形態】
【0013】
本明細書中、標準偏差について記載する記号「σ」はすべて、シグマハット(母集団の推定値)
【数3】
を表す。
【0014】
本発明は、被験者におけるがんを評価するためのがん検査方法及びがん検査システムを提供する。本発明において、がんの評価は、被験者におけるがんの判定、被験者におけるがんのリスクの予測、被験者におけるがんのステージ若しくは重症度の判定、被験者におけるがんの予後判定、被験者におけるがんのモニタリング、被験者に存在するがんに対する治療の効果のモニタリング、又はがんの診断の補助を含む。
【0015】
本発明は、一態様において、被験者におけるがん検査方法であって、
複数の健常者及びがん患者について複数のがんマーカーの情報を登録したマーカーパネルを格納したデータベースであって、各がんマーカーの測定値において、健常者の平均値±X×標準偏差[式中、Xは任意の数値である。]、及び/又は健常者の平均値±標準偏差を基準範囲として、基準範囲内、基準範囲より高い又は基準範囲より低いの3つに区別された識別情報を有する前記データベースを準備し、
被験者の1以上のがんマーカーの測定値について、前記データベース中の前記識別情報との相関を解析し、
前記解析の結果から被験者におけるがんを評価すること
を含む方法を提供する。
【0016】
本発明に係るがん検査方法では、複数のがんマーカーの各がんマーカーの測定値において、特定の基準範囲内、基準範囲より高い及び基準範囲より低いの3つ群に分ける。
【0017】
がんマーカーは、がんとの関連性が示されているマーカーであれば、特に限定されるものではない。例えば、がんマーカーとして、特定のタンパク質、miRNA、代謝物が知られており、血液又は尿中のいずれのマーカーであってもよい。がんマーカーは、複数であることが好ましく、例えば2以上、3以上、4以上、5以上、10以上、15以上、20以上、25以上、30以上、40以上、50以上又はそれ以上のがんマーカーを含む。がんマーカーの数に特に上限はないが、例えば500個まで、400個まで又は300個までであり得る。がんマーカーは、同時に測定することができる複数のマーカーであることが好ましい。好ましい実施形態において、がんマーカーは尿中代謝物である。がんマーカーの「測定値」は、使用するマーカーの種類に応じて異なり、当業者であれば理解することができる。
【0018】
まず、複数の健常者のがんマーカーの測定値データから、健常者の平均値±X×標準偏差[式中、Xは任意の数値である。]、及び/又は健常者の平均値±標準偏差を基準範囲として設定する。一実施形態では、Xが2である場合、すなわち2σモードである95%基準範囲((平均値-2×標準偏差)と(平均値+2×標準偏差)とで挟まれる範囲)、及び/又は1σモードである68%基準範囲((平均値-標準偏差)と(平均値+標準偏差)とで挟まれる範囲)を設定する。
【0019】
基準範囲をもとに、複数のがん患者及び複数の健常者のがんマーカーの測定値について、基準範囲内、基準範囲より高い、又は基準範囲より低い、の3つの区別された識別情報を求める。好ましい実施形態では、各がんマーカーの測定値は、健常者の平均値±X×標準偏差[式中、Xは2である。]の基準範囲と、健常者の平均値±標準偏差の基準範囲の2つの基準範囲のそれぞれについて異なる識別情報を有する。データベースには、がんマーカーの測定値が識別情報と共に格納される。したがって、データベースには、がんマーカーの情報として、がんマーカーの種類、がんマーカーの測定値、及び識別情報が少なくとも含まれる。
【0020】
データベースは、特定のステージ又は重症度のがん患者(例えば、特定の深達度T、特定のグレード、転移若しくは再発の有無など)、あるいは治療前又は治療後のがん患者について、複数のがんマーカーの情報を登録したマーカーパネルを有するものであってもよい。またデータベースは、がんの種類ごとに異なるものである。がんの種類は特に限定されるものではなく、例えば大腸がん、乳がん、小児がんなどが挙げられる。
【0021】
がんマーカーの情報は、マーカーパネルとしてデータベースに格納される。「代謝物パネル」とは、がん患者及び健常者における各がんの複数マーカーのセットのことをいい、測定値及び/又は識別情報が配置された表はマーカーパネルと呼ぶことにする。例えば、
図2に示されるような表形式のマーカーパネルがある。好ましい実施形態では、がんマーカーの情報を登録したマーカーパネルは、液体クロマトグラフィ質量分析(LC/MS)により得られた代謝物のイオン強度の情報を登録した代謝物パネルである。
【0022】
マーカーパネルにおいて、がんマーカーのカラムは、3つの識別情報に応じて視覚的に区別可能に表示されることが好ましい。例えば、色の濃淡により、異なる色により又は点灯により区別可能にカラムを表示することができる。例えば、
図2の右下に示されるように、色の濃淡(黒、白及び灰)により3つの識別情報を区別して表示することができる。
【0023】
マーカーパネルを作成する際、がんマーカーは、機械学習により計算された重要度の順番に示されることが好ましい。例えば、
図2では、マーカーを機械学習の1種であるランダムフォレスト(RF)法により求めた重要度の順番に並べて表示している。この機械学習(例えばRF法)に至るまでの解析プロセスは、マーカーとして代謝物を用いた予測値法の場合と同じである。参考のために、従来の予測値法の解析プロセスを
図3に示した。基本的に、網羅的解析で抽出した約2000種類の重要度の高い代謝物を、データ前処理、統計解析などを通して段階的に抽出して、ランダムフォレスト(RF)法により重要度の指標を得るというものである。ランダムフォレスト(RF)法により得られる重要度の指標(Mean Decrease Accuracy:MDA)の解析結果の例を
図4に示した。
【0024】
被験者の1以上のがんマーカーの測定値についても、基準範囲内、基準範囲より高い、又は基準範囲より低い、の3つ群に分ける。好ましい実施形態において、被験者のがんマーカーの測定値に基づいて被験者のマーカーパネルが作成される。
【0025】
このようにして得られた、データベースにおける識別情報を有するマーカーパネルと、被験者のがんマーカーのマーカーパネルとを比較して、被験者のがんマーカーの測定値についてデータベース中の識別情報との相関を解析する。この解析は、当技術分野で公知の方法により行うことができる。一実施形態では、3つの識別情報に数値を割り当て、機械学習により計算された重要度を加味して、関数により相関を解析することができる。その具体例を以下で説明する。
【0026】
識別情報との相関の解析のため、がんマーカーの測定値に対して、上述した3つの識別情報に応じて、基準範囲内はカラム値0、基準範囲より高い場合はカラム値+1、基準範囲より低い場合はカラム値-1を割り当てることが好ましい。例えば、
図5の下のパネルでは、基準範囲を「白」、基準範囲より高い値を「黒」、基準範囲より低い値を「灰」で示し、それぞれのカラムに、カラム値0、+1又は-1を割り当てている。
【0027】
本発明のがん検査方法では、データベースにおける識別情報を有するマーカーパネルと、被験者のがんマーカーのマーカーパネルとを比較して、がん患者又は健常者の識別情報との相同又は相違に基づいてがんを評価することができる。この方法によって、がん患者又は健常者と判別できない被験者の場合には、さらに以下のような解析を行うことが好ましい。
【0028】
一実施形態では、識別情報の相関を、
図5及び下記式Iで示される評価関数の値に基づいて行うことができる:
【数4】
〔式中、
g
nは、機械学習で計算された重要度の相対値であり、g
nの符号は、被験者のがんマーカーの測定値ががん患者と同じカラム値である場合には+、異なるカラム値である場合には-であり、
D
nは、カラム値+1、0又は-1である〕。
【0029】
評価関数によって得られる値は、がんマーカーの変動量の概算値である。データベースにおけるがん患者及び健常者の評価関数の値に基づいて、がんリスクがあると評価し得る評価関数の値と、健常であると評価し得る評価関数の値を求めることができる。例えば、がんリスクがあると評価し得る評価関数の値をαとし、健常であると評価し得る評価関数の値をβとして、被験者の評価関数の値がαを超える場合には、被験者を「がん」リスクがあると評価し、βより小さい場合には、「健常」であると評価する。
【0030】
評価関数に基づいてがんの評価を行う場合の具体的なフローの一例を
図7に示す。
図7は、判定アルゴリズム1であり、識別情報との相関の解析を、健常者の平均値±X×標準偏差[式中、Xは2である。]を基準範囲とした識別情報に基づいて評価関数を求めた後、健常者の平均値±標準偏差を基準範囲とした識別情報に基づいて評価関数を求めて行う。具体的には、最初に2σモードで評価関数を求める。上述したように、例えば、がんリスクがあると評価し得る評価関数の値をαとし、健常であると評価し得る評価関数の値をβとして、被験者の評価関数の値がαを超える場合には、被験者を「がん」リスクがあると評価し、βより小さい場合には、「健常」であると評価する。ここで、評価関数の値がβ以上α以下となる場合には、さらに1σモードで評価関数を求める。評価関数プロットを作成して、がん患者と健常者を識別する判定ラインを用いて、それぞれの被験者の再評価を行う(例えば、
図13に示すように判定ラインを引くことができる)。この判定ラインの値γ以上の場合には、被験者を「がんに近い」と評価し、γより小さい場合には「健常に近い」と評価する。このアルゴリズムにより、「がん」、「健常」、「がんに近い」、「健常に近い」という4つの評価結果が得られる。
【0031】
また別の具体的なフローの一例を
図8に示す。
図8は、判定アルゴリズム2であり、被験者の1以上のがんマーカーの測定値について、データベース中のがん患者の識別情報のパターン及び健常者の識別情報のパターンとの差を計算し、被験者ががん患者又は健常者のパターンのいずれに近いかを解析することをさらに含むものである。つまり、がん患者のマーカーパターンと健常者のマーカーパターンとの類似度を解析する。ここで、パターンとは、複数のがんマーカーの識別情報のセットを意味する。好ましくは、上述のように評価関数を求めた後、被験者についてがん患者又は健常者と判別できない場合に、さらにパターンについての解析を行う。
【0032】
一実施形態では、パターンとの差を、
図6及び下記式IIで示される距離関数の値に基づいて行うことができる:
【数5】
〔式中、
g
nは、機械学習で計算された重要度の相対値であり、
D
nは、データベースにおけるがん患者又は健常者の、各がんマーカーについてのカラム値+1、0又は-1で表される行ベクトルであり、
T
nは、被験者における各がんマーカーについてのカラム値+1、0又は-1で表される行ベクトルである〕。
【0033】
距離関数によって得られる値は、がんマーカーのパターンとの類似度である。判定アルゴリズム1と同様に、健常者の平均値±X×標準偏差[式中、Xは2である。]を基準範囲とした識別情報に基づいて評価関数を求める。具体的には、最初に2σモードで評価関数を求める。上述したように、例えば、がんリスクがあると評価し得る評価関数の値をαとし、健常であると評価し得る評価関数の値をβとして、被験者の評価関数の値がαを超える場合には、被験者を「がん」リスクがあると評価し、βより小さい場合には、「健常」であると評価する。ここで、評価関数の値がβ以上α以下となる場合には、さらに距離関数を求める。つまり、被験者のパターンを、典型的ながん患者(例えば、重症度の高いがん患者)のパターン及び健常者(例えば、すべてのがんマーカーが基準範囲にある健常者など)のパターンと比較して、ずれ(差)があるかどうかを計算する。このずれ(差)が小さい方が評価結果となる。つまり、被験者のパターンががん患者のパターンに近い場合には、被験者を「がんに近い」と評価し、がん患者のパターンに近くない場合には「健常に近い」と評価する(
図8の右側)。このアルゴリズムにより、「がん」、「健常」、「がんに近い」、「健常に近い」という4つの評価結果が得られる。
【0034】
本発明に係る代謝物パネルを用いたがん検査方法では、「がん」、「健常」、「がんに近い」及び「健常に近い」という4種類の評価を行うことができ、がん検査はより精緻になり、以前は偽陽性又は偽陰性として判定されていた被験者をより正確に高精度に評価することが可能となる。
【0035】
なお、本発明に係るがん検査方法又はがん検査システムによる「評価」は、統計学的に有意な割合の被験者を評価できることを意図している。よって本発明に係る方法及びシステムによる「評価」には、被験者の全て(すなわち100%)について必ず正しい結果が得られない場合も含まれる。統計的に有意な割合は、様々な周知の統計評価ツール、例えば信頼区間の決定、p値の決定、スチューデントのt検定、マン・ホイットニー検定等を用いて決定することができる。好ましい信頼区間は、少なくとも90%である。p値は、好ましくは、0.1、0.01、0.05、0.005又は0.0001である。より好ましくは、被験者の少なくとも60%、少なくとも80%又は少なくとも90%を、本発明に係る方法又はシステムによって適切に評価することができる。
【0036】
以下、がんマーカーとして尿中代謝物を使用し、代謝物パネルに基づいてがん検査を行う実施形態について説明する。
【0037】
まず、被験者の尿サンプルにおいて尿中代謝物を測定する。測定する尿中代謝物は、がんマーカーとして使用可能なものであれば特に限定されるものではない。例えば、実施例で例示した尿中代謝物、並びに国際公開WO2017/213246号(大腸がん及び乳がん)、特開2019-168319号公報及び特許文献2(小児がん)などに報告されている尿中代謝物を使用することができる。尿中代謝物は、複数を組み合わせて使用し、好ましくは3以上又は5以上又は10以上又は20以上を組み合わせて使用することにより、より正確かつ高精度な評価や、治療の効果のモニタリングが可能となる。尿中代謝物の組み合わせは特に限定されるものではなく、がんの種類、被験者の性別、年齢や、がん若しくはがんリスクの判定、経過観察(がんのモニタリング)、又は治療のモニタリングを含む目的などに応じて、適宜選択することができる。
【0038】
尿サンプルとは、被験者から採取した尿、及び当該尿を処理して得られるサンプル(例えば、トルエン、キシレン、塩酸などの保存料を添加した尿)を意味する。
【0039】
また被験者は、ヒト、及びその他の哺乳動物、例えば霊長類、家畜動物、ペット用動物、実験動物であり、さらには爬虫類及び鳥類などであってもよい。特に、ヒトを被験者とすることが好ましい。例えば、健康診断やがん検査によるマススクリーニングであってもよいし、そのようなマススクリーニング後の追加検査時であってもよい。
【0040】
尿中代謝物の測定は、尿サンプル中のその量又は濃度を、好ましくは半定量的又は定量的に測定することを意味し、その量は、絶対量であってもよいし又は相対量であってもよい。測定は、直接的又は間接的に行うことができる。直接的な測定は、サンプル中に存在する尿中代謝物の分子数と直接相関するシグナルに基づいて、その量又は濃度を測定することを含む。そのようなシグナルは、例えば尿中代謝物の特定の物理的又は化学的な特性に基づいている。間接的な測定は、二次成分(すなわち尿中代謝物以外の成分)、例えばリガンド、標識又は酵素反応生成物から得られるシグナルの測定である。
【0041】
尿中代謝物の測定方法は、当技術分野で公知の方法又は手段を用いることができ、特に限定されるものではない。例えば、尿中代謝物の測定は、尿中代謝物に特有の物理的又は化学的特性を測定するための手段、例えば正確な分子量又はNMRスペクトル等を測定するための手段によって行うことができる。尿中代謝物を測定するための手段としては、質量分析計、NMR分析計、二次元電気泳動装置、クロマトグラフ、液体クロマトグラフィ質量分析装置(LC/MS)等の分析装置が挙げられる。これら分析装置を単独で使用して尿中腫瘍マーカーを測定してもよいが、複数の分析装置により尿中腫瘍マーカーを測定してもよい。
【0042】
あるいは、測定対象の代謝物を検出するための試薬、例えば免疫反応試薬、酵素反応試薬などが利用できる場合には、そのような試薬を利用して尿中の代謝物を測定することができる。
【0043】
以上のようにして、被験者から採取した尿サンプルに含まれる尿中代謝物を測定し、その測定値を、上述した本発明のがん検査方法を利用することにより、被験者においてがんを評価することが可能である。さらに、被験者から複数の時点に採取した尿サンプルにおいて尿中代謝物を測定してもよい。
【0044】
続いて、上述の被験者の尿中代謝物の測定値について、データベース中の識別情報との相関を解析する。ここで、データベースには、複数の健常者及びがん患者について複数の尿中代謝物の情報を登録した代謝物パネルが格納されている。データベースは、各尿中代謝物の測定値において、
健常者の平均値±X×標準偏差[式中、Xは任意の数値である。]、及び/又は
健常者の平均値±標準偏差
を基準範囲として、基準範囲内、基準範囲より高い及び基準範囲より低いの3つに区別された識別情報を有する。
【0045】
一実施形態では、被験者の尿中代謝物の測定値について、3つの識別情報との相関を解析する。識別情報との相関の解析は、上述したように、例えば代謝物パネルの比較により、判定アルゴリズム1により、又は判定アルゴリズム2により行うことができる。この解析の結果から被験者におけるがんを評価する。
【0046】
本発明のがん検査方法によって、がんの存在や進行を早期に高精度で判定することができ、またがん若しくはがんに近い、健常若しくは健常に近いなどと細分して精緻にがんを評価することができる。例えば、がんのステージや重症度も評価できるため、詳細な検査や治療方針の決定に役立つ。簡便な検査でがんか否か又はがんリスクがあるかの診断が可能となれば、治療はもちろん検査による侵襲リスクを防ぐことが期待できる。被験者は、がんの治療を早期に受けたり、処置後は経過観察することが可能となる。また、がんの治療の効果についてモニターすることができ、治療の効果に応じて治療の停止、継続又は変更を検討することが可能となる。さらに、尿サンプルを利用することから低侵襲性であり、簡便かつ低コストにがんを評価できる。
【0047】
別の実施形態では、被験者から複数の時点で尿サンプルを採取し、それぞれの測定時点における尿サンプルに含まれる尿中代謝物を測定し、それぞれの測定時点の尿中代謝物の測定値について、データベース中の識別情報との相関を解析する。測定は、経時的に少なくとも2回、3回、4回、5回、10回、15回、20回、30回、又はそれ以上の回で、例えば1日、2日、5日、1週間、2週間、3週間、1ヶ月、2ヶ月、3ヶ月、半年、1年、2年、3年、5年、又はそれ以上の期間を空けて、行うことができる。この解析によって、経時的なモニタリングを行うことができ、がんの進行、がんの転移若しくは再発、異常なしからのがんの発症などを評価することができる。
【0048】
また別の実施形態では、がんを有する被験者におけるがんに対する治療(治療薬又は治療法)の効果をモニタリングすることができる。具体的には、
(a)治療薬又は治療法による処置を受ける前に、がんを有する被験者からの尿サンプルにおいて尿中代謝物を測定するステップ、
(b)治療薬又は治療法による処置を受けた後に、がんを有する被験者からの尿サンプルにおいて尿中代謝物を測定するステップ、
(c)必要に応じて、ステップ(b)を繰り返すステップ、
(d)(a)~(c)の測定値の解析に基づいてがんに対する治療薬又は治療法の効果をモニタリングするステップ
を含む。
【0049】
上記方法では、治療薬又は治療法による処置を受ける前に、がんを有する被験者から尿サンプルを採取し、尿サンプル中の尿中代謝物を測定する。がんを有する被験者に治療薬又は治療法による処置が行われた後、適当な時期に尿サンプルを採取して、尿サンプル中の尿中代謝物を測定する。例えば、処置の直後、30分後、1時間後、3時間後、5時間後、10時間後、15時間後、20時間後、24時間(1日)後、2~10日後、10~20日後、20~30日後、1ヶ月~6ヵ月後に尿サンプルを採取する。尿サンプル中の尿中代謝物の測定については前記と同様に行うことができる。治療前後に尿中代謝物を測定することによって、その治療薬又は治療法による処置の効果をモニタリングすることが可能となる。モニタリングの結果に基づいて、治療の停止、継続又は変更を検討する一助となる。
【0050】
さらにがん検査方法は、他の従来公知のがんの診断方法と組み合わせて行ってもよい。そのような公知のがんの診断方法としては、画像検査(例えば超音波検査、コンピュータ断層撮影(CT)、X線検査、ポジトロンCT(PET)等)、内視鏡検査、生検による病理検査、血中がんマーカーの測定などが挙げられる。
【0051】
上述の評価結果に基づいて、医師は、被験者のがんについて診断を行い、適切な処置を行うことができる。すなわち本発明は、被験者においてがんを検査し、治療する方法にも関する。例えば、本発明に係る方法に従って被験者におけるがんを判定し、被験者ががんを有している可能性が高いと評価された場合、被験者においてがんを治療する又はがんの進行を予防する処置を行う。また、被験者におけるがんのステージが進行している又はがんの予後が悪い可能性が高いと評価された場合には、治療を継続したり、必要であれば治療法の変更を検討する。また、被験者においてがんが存在する可能性が高いと評価された場合には、上述したような他のがんの診断方法を行って、がんの存在を確定する。さらに、治療前後での評価結果に基づいて、治療の効果をモニタリングし、治療の停止、継続又は変更を決定する。また、異常なしと判定された場合には、尿中代謝物の測定を経時的に行って、経過観察することができる。
【0052】
がんは、外科手術、放射線療法、化学療法、免疫療法、陽子線治療、重粒子線治療などを、単独で又は適宜組み合わせて行うことができる。がんの治療は、がんの種類、ステージ、重症度、悪性度、性別、年齢及び状態、治療に対する応答性、保有する遺伝子多型(SNP)などを考慮して、当業者であれば適宜選択することができる。
【0053】
本発明のがん検査方法は、システムを用いることによって、容易かつ簡便に行うことができる。本発明に係るがん検査システムは、以下の手段を備える:
複数の健常者及びがん患者について複数のがんマーカーの情報を登録したマーカーパネルを格納したデータベースであって、各がんマーカーの測定値において、健常者の平均値±X×標準偏差[式中、Xは任意の数値である。]、及び/又は健常者の平均値±標準偏差を基準範囲として、基準範囲内、基準範囲より高い又は基準範囲より低いの3つに区別された識別情報を有する前記データベースを有する記憶部と、
被験者の1以上のがんマーカーの測定値の入力を受ける入力部と、
前記入力部からの被験者の1以上のがんマーカーの測定値について、前記データベース中の前記識別情報との相関を解析する解析部と、
前記解析部で得られた解析の結果から被験者におけるがんを評価する評価部。
【0054】
本発明のシステムは、好ましくは、本発明のがん検査方法を実施することができるように、上記の記憶部、入力部、解析部及び評価部が互いに動作可能なように連結されたシステムである。本発明のシステムの一実施形態を
図29に示す。
【0055】
ここで、入力部は、がんマーカーの測定値の入力を受けるものであり、ユーザが任意の入力装置により測定値を入力してもよいし、他の装置(例えば、がんマーカーの測定装置、例として質量分析計、NMR分析計、液体クロマトグラフィ質量分析(LC/MS)装置等)で得られた測定値をインポートしてもよいし、あるいは他のシステムに入力された測定値を取り出し(retrieve)てもよい。入力部は、入力を受けたがんマーカーの測定値を解析するデータ解析部を備えてもよい。例えば、がんマーカーの種類、測定値、被験者情報などのデータがその後行う解析に適しているか解析したり、データの前処理を行う。
【0056】
記憶部のデータベースは、複数の健常者及びがん患者について複数のがんマーカーの情報を登録したマーカーパネルを格納している。データベースには、がんマーカーの情報として、がん患者及び健常者それぞれについて、がんマーカーの種類、がんマーカーの測定値、及び識別情報が少なくとも含まれる。好ましくは、データベースには、がん患者及び健常者のがんマーカーパネルが格納される。またデータベースには、特定のステージ又は重症度のがん患者について複数のがんマーカーのデータが格納されていてもよく、前回測定値のデータや治療前後のがん患者のデータが格納されていてもよい。データベースは、がんの種類ごとに異なるものである。
【0057】
解析部は、入力部から得られた測定値を処理するソフトウエアと計算機よりなるデータ解析部を備えている。データ解析部は、入力部から得られた測定値に基づいて被験者のマーカーパネルを作成する。データ解析部は、例えば、シグナル表示部分、測定値を解析するユニット、コンピュータユニット等を含むことができる。
【0058】
また、解析部は、がん患者及び健常者のがんマーカーの情報(例えば、識別情報)を記憶装置(データベース)等から読み出し、上記入力部で入力を受けた被験者のがんマーカーの測定値との相関を解析する。このとき、解析部は、がんマーカーの種類に応じて適切なデータベースを選択して読み出す。あるいは、同一被験者における経時的モニタリングの場合には、解析部は、前回の測定値を記憶装置(データベース)等から読み出し、入力部で入力を受けたがんマーカーの測定値と比較する。
【0059】
さらに、評価部は、解析部において相関を解析した結果に基づいて、被験者におけるがんを評価する。ここで、評価部は、被験者におけるがんの有無やがんのステージ、異常なし等を示す情報を取得する。例えば、被験者が「がんである」、「健常である」、「がんに近い」又は「健常に近い」の情報を取得する。好ましいシステムは、専門の臨床医の知識がなくても使用することができるものであり、例えば、入力部において測定値データが入力されると自動的に解析されて、被験者におけるがんの評価結果が表示されるシステムである。その際、がんの評価結果と共に、解析したがんマーカーのマーカーパネル(代謝物パネル)が一緒に表示されてもよい。
【0060】
本発明のがん検査システムは、データ保存部、データ出力・表示部などをさらに備えるものであってもよい。
【0061】
本発明を適用した例として、検査センタにおけるがん検査について説明する。検査センタでは、被検査者からの請求等に応じてがん検査の案内を行う。被検査者は一次検査の申し込みに際し、検査のマーカー数の選択を行ってもよい。これは、他のマーカーと組み合わせて、全がん検査(いろいろながんを一度に解析する)として利用することもできる。
【0062】
続いて、検査センタは尿採取に必要な検査キットを被検査者に渡す。必要に応じて郵送などにより送付する。被検査者は検査キットを受け取った後、検査センタに検体を渡す、又は送付等行う。検査センタでは、検体を続く検査のため必要に応じて、約-80℃に冷凍保存しておく。検査センタでは、上述したがん検査方法に従って一次検査を行い、検査結果を被検査者に送る。
【0063】
被検査者は、一次検査の結果を受け取り、内容に応じて二次検査の申し込みを行ってもよいし、より詳細な診断を受けてもよい。これにより、一次検査でのがんの疑いを確証したり、さらにはがんのステージを特定することが可能となる。
【0064】
以下に実施例を例示し、本発明を具体的に説明するが、この実施例は単に本発明の説明のために提供するものであり、本出願において開示する発明の範囲を限定又は制限するものではない。
【実施例】
【0065】
[実施例1]大腸がんの評価例(判定アルゴリズム1)
本手法の有効性を示す例として、モンゴロイド系被験者について、大腸がん(大腸がん患者30名、健常者30名)の評価を行った。被験者より尿サンプルを採取して、液体クロマトグラフィ質量分析(LC/MS)により尿中代謝物を検出した。
【0066】
(1)代謝物パネルの作成
縦軸に、60名の被験者(大腸がん患者30名、健常者30名)、横軸に17種類の尿中腫瘍マーカー(代謝物)を用いて、代謝物パネルを作成した。このとき用いた17種類の尿中腫瘍マーカー(代謝物)の種類を
図9に示す。なお、化合物名の項目におけるXは構造解析中の化合物である。
図9において、スーパーパスウェイは、同系列の代謝物全体の生物学的経路のことをいい、サブパスウェイはその個々の生物学的経路のことをいう。例えば、チロシン系代謝はチロシンを中心とした代謝経路でサブパスウェイであるが、アミノ酸関係の複数の代謝経路は総称してアミノ酸代謝経路といい、これはスーパーパスウェイである。得られた代謝物パネルの一例として、一部(2σモードでの評価関数による評価)を
図10に示す。具体的には、健常者の平均値±2×標準偏差を基準範囲として、代謝物の測定値がそれより上のマーカーのカラムを黒で表示し、基準範囲内のマーカーのカラムを白で表示し、それより下のマーカーのカラムを灰で表示した。
【0067】
(2)評価関数プロットの作成
図11に示すように、評価関数の値によって大腸がん患者と健常者とを識別する目的で、2σモードで評価関数プロットを作成した。評価関数は、代謝物の測定値が基準範囲より上のマーカーのカラム(黒)にカラム値+1を割り当て、基準範囲内のマーカーのカラム(白)に0を割り当て、それより下のマーカーのカラム(灰)に-1を割り当てて計算した。点線の枠で示したように、評価関数値が20から10の範囲で、がん患者と健常者の評価関数の値がオーバーラップしている領域があることがわかる。
【0068】
(3)判定アルゴリズム1による解析
2σモードでのプロットを踏まえ、1σモードでの評価関数プロットを作成した(
図13の右側)。すなわち、健常者の平均値±標準偏差を基準範囲として、各マーカーの測定値を3つの識別情報で分け、カラム値を割り当てて、評価関数を計算した。2σモード及び1σモードの結果に基づいた判定アルゴリズム1による解析フローを
図12に示す。なお、2σモード及び1σモードにおける評価関数プロットを
図13に示す。
【0069】
2σモードにおいて、評価関数が22より大きい領域を「がん」と判定し、10より小さい領域を「健常」と判定すると、評価関数が22と10の間にある被験者11、17、18、26、27、36、51及び60をどう判定するかがポイントとなる(
図13の左側)。そこで、1σモードでの評価関数プロットをみてみると、各被験者の代謝物の変化がより強調されて、被験者11、17、18、26、27、36、51及び60がより大きく分散されていることがわかる(
図13の右側)。そこで、判定ラインを評価関数値50に設定すると、被験者11、17、18、26を「がんに近い」、被験者36、51、60を「健常に近い」と判定することができた。
【0070】
以上の判定結果を
図14にまとめた。
図14に示された結果は、
感度=(30/30)×100=100%
特異度=(30/30)×100=100%
となる。よって、本方法により、感度及び特異度ともに高精度にがんを評価することができた。
【0071】
[実施例2]大腸がんの評価例(判定アルゴリズム2)
評価関数に加えて距離関数を利用して大腸がんを評価する例について説明する。判定アルゴリズム2における距離関数によって、がん患者か健常者かを判定する場合には、
図15及び
図16に示すようなフローを用いることができる。
【0072】
まず、判定アルゴリズム1と同様に、2σで計算した評価関数プロットについて、がん患者と考えられる高い値を示す領域(評価関数値が22より大きい領域)については「がん」、健常者と考えられる低い値を示す領域(評価関数値が10より小さい領域)については「健常」と判定する。
【0073】
次に、がん患者と健常者が混在すると考えられる領域(22≧評価関数値≧10)については、
図6に示すような距離関数を計算する(
図15の点線枠内及び
図16)。これは、データベースにある典型的ながん患者(例えば、重症度の高いがん患者)と健常者(例えば、すべての代謝物が基準範囲にある健常者など)の代謝物パネルパターンとのずれの大きさ(距離)を、各被験者で計算することを意味する。その値ががん患者又は健常者のパターンのいずれに近いのかを判定する。距離関数を計算する際、2σモードでの距離関数を求めてもよいし、さらに1σモードでの距離関数を求めてもよい。
図16において、「距離関数値の比」は、典型的ながん患者との距離と典型的な健常者との距離のうち、大きな値を小さな値で割ったときの値を指し、「典型的ながん患者パターン」は、ステージの高いがん患者を、「典型的な健常者パターン」は、すべての尿中腫瘍マーカー(代謝物)が基準範囲にある健常者を指す。
【0074】
判定アルゴリズム2に従った実際の解析結果を
図17に示す。
図17は、重症度の高い典型的な大腸がん患者(尿中腫瘍マーカーのほぼすべての代謝物が基準範囲外にあるケース)と典型的な健常者(尿中腫瘍マーカーのすべての代謝物が基準範囲に入っているケース)との距離関数(この場合には、ずれの大きさを示す)を計算した結果である。がん患者と健常者が混在すると考えられる領域(22≧評価関数値≧10)には、被験者18、28、51、50が存在する。距離関数の結果から、被験者18、28は「がんに近い」という判定である一方、被験者51、50は「健常に近い」という判定となった。
【0075】
このアルゴリズムでも、
感度=(30/30)×100=100%
特異度=(30/30)×100=100%
となる。よって、本方法により、感度及び特異度ともに高精度にがんを評価することができた。
【0076】
[実施例3]大腸がんの評価例(代謝物パネルによるがん重症度の評価)
代謝物パネルをみることで、がんの重症度に関する情報も得られる場合がある。
図18は、実施例1と同様に大腸がんの尿中腫瘍マーカー(代謝物)について、1σモードでの、がんのTNM分類における特定の深達度(T)のがん患者の代謝物パネルのパターン変化を示したものである。重症度(深達度)によって、がんのパターンに変化があることがわかる。例えば、代謝物9及び10を観察すると、健常者では当然のことながら、すべての代謝物パネルが「白」であるが、T
1(がんのTNM分類における深達度が粘膜又は粘膜下層でとどまっている場合)では「黒」になっており、T
2(深達度が固有筋層内)、T
3(深達度が固有筋層外)、T
4(深達度が漿膜又は漿膜外)では「灰」になっている。そのため、代謝物パネルのパターンによって、がんの重症度、すなわちTNM分類の深達度をある程度把握できることがわかる。
【0077】
[実施例4]大腸がんの評価例(評価関数によるがん重症度の評価)
評価関数によるがん検査において特徴的なのは、TNM分類における深達度を示すT
1、T
2、T
3、T
4に関わらず、検出できることである。
図19に、1σモードにおける評価関数の値とTNM分類のT
1~T
4との関係を示した。重症度が高くなるにつれて、評価関数の値が大きくなる傾向がみられ、評価関数により重症度の情報が得られることがわかった。
【0078】
[実施例5]乳がんの評価例(判定アルゴリズム1及び2)
本手法の有効性を示す例として、乳がん(乳がん患者30名(治療前25名及び治療後5名)、健常者210名)の評価を行った。被験者より尿サンプルを採取して、液体クロマトグラフィ質量分析(LC/MS)により尿中代謝物を検出した。判定アルゴリズム1及び判定アルゴリズム2において、大腸がんのケースと同様な効果が得られた。
【0079】
使用した15種類の尿中腫瘍マーカー(代謝物)の種類を
図20に示す。なお、化合物名の項目におけるXは構造解析中の化合物である。スーパーパスウェイ及びサブパスウェイは、実施例1と同様である。作成した代謝物パネルの一例として、一部(2σモードでの評価関数による評価)を
図21に示す。具体的には、健常者の平均値±2×標準偏差を基準範囲として、代謝物の測定値がそれより上のマーカーのカラムを黒で表示し、基準範囲内のマーカーのカラムを白で表示し、それより下のマーカーのカラムを灰で表示した。
【0080】
評価関数の値によって乳がん患者と健常者とを識別する目的で、2σモードで作成した評価関数プロットを
図22に示す。点線の枠で示したように、評価関数値が40から20の範囲で、がん患者と健常者の評価関数の値がオーバーラップしている領域があることがわかる。2σモードでのプロットを踏まえ、1σモードでの評価関数プロットを作成した(
図24の右側)。2σモード及び1σモードの結果に基づいた判定アルゴリズム1による解析フローを
図23に示す。なお、2σモード及び1σモードにおける評価関数プロットを
図24に示す。
図24及び25において、「がん」はがん患者の番号を、「けん」は健常者の番号を表す。
【0081】
判定アルゴリズム1による判定結果を
図25にまとめた。
図25に示された結果は、
感度=(28/30)×100=93.3%
特異度=(208/210)×100=99.0%
である。ただし、感度で、健常に近いと判断されたがん患者である被験者18、25について、被験者18は欠損データがあり再測定が必要であり、被験者25は術後化学療法中のため今後の評価が必要と判断した。よって、本方法により、感度及び特異度ともに高精度にがんを評価できた。
【0082】
評価関数に加えて距離関数を利用して乳がんを評価する例について、判定アルゴリズム2として
図26に示すようなフローを用いることができる。
【0083】
まず、判定アルゴリズム1と同様に、2σで計算した評価関数プロットについて、がん患者と考えられる高い値を示す領域(評価関数値が40より大きい領域)については「がん」、健常者と考えられる低い値を示す領域(評価関数値が20より小さい領域)については「健常」と判定する。次に、がん患者と健常者が混在すると考えられる領域(40≧評価関数値≧20)については、
図6に示すような距離関数を計算する。
図26において、「距離関数値の比」は、典型的ながん患者との距離と典型的な健常者との距離のうち、大きな値を小さな値で割ったときの値を指す。
【0084】
判定アルゴリズム2に従った実際の解析結果を
図27(がん患者)及び
図28(健常者)に示す。なお、
図27の表において、被験者2、10、17、25、30は治療後の患者である。がん患者と健常者が混在すると考えられる領域(40≧評価関数値≧20)には、がん患者10、7、23、19、21、12、24、17、16、14、13、30、18、25、健常者104、121、24、188、23が存在する。
図27及び28は、重症度の高い典型的な乳がん患者パターンと典型的な健常者パターンとの距離関数(この場合には、ずれの大きさを示す)を計算した結果である。この結果から、がん患者のうち、被験者10、7、23、19、21、12、24、17、16、14、13、30は「がんに近い」という判定である一方、被験者18、25は「健常に近い」という判定となった(
図27)。また、健常者のうち、被験者121、24、188、23、141は「がんに近い」と判定し、被験者111、28、131は「健常に近い」と判定し、被験者104は区別できなかった(
図28)。
【0085】
判定アルゴリズム2による判定結果(
図27及び28)は、
感度=(28/30)×100=93.3%
特異度=(204/210)×100=97.1%
である。ただし、感度で、健常に近いと判断されたがん患者である被験者18、25について、被験者18は欠損データがあり再測定が必要であり、被験者25は術後化学療法中のため今後の評価が必要と判断した。よって、本方法により、感度及び特異度ともに高精度にがんを評価できた。
【0086】
本明細書で引用した全ての刊行物、特許及び特許出願をそのまま参考として本明細書にとり入れるものとする。