【文献】
DEMPO K ET AL.,Demonstration of gamma-glitamyl transferase, alkaline phosphatase, CEA and HCG in human lung cancer,ONCODEV BIOL MED.,1981年,Vol. 2, No. 1-2,pages 21 - 37
【文献】
EHRMEYER, SL et al.,A cancer-associated, fast, homoarginine-sensitive electrophoretic form of serum alkaline phosphatase,CANCER RESERACH,1978年 3月,38,599-601
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0029】
以下に、本発明にかかる評価方法の実施形態(第1実施形態)、及び、本発明にかかる評価装置、評価方法、評価プログラム、記録媒体、評価システム及び端末装置の実施形態(第2実施形態)を、図面に基づいて詳細に説明する。なお、本発明はこれらの実施形態により限定されるものではない。
【0030】
[第1実施形態]
[1−1.第1実施形態の概要]
ここでは、第1実施形態の概要について
図1を参照して説明する。
図1は第1実施形態の基本原理を示す原理構成図である。
【0031】
まず、評価対象(例えば動物やヒトなどの個体)から採取した血液(例えば血漿、血清などを含む)中の物質(「上記15種類の代謝物および上記19種類のアミノ酸」のうちの少なくとも1つを含む血中物質)の濃度値に関する濃度データを取得する(ステップS11)。
【0032】
なお、ステップS11では、例えば、濃度値測定を行う企業等が測定した上記血中物質に関する濃度データを取得してもよい。また、評価対象から採取した血液から、例えば以下の(A)、(B)、または(C)などの測定方法により上記血中物質の濃度値を測定することで上記血中物質の濃度値に関する濃度データを取得してもよい。ここで、上記血中物質の濃度値の単位は、例えばモル濃度、重量濃度又は酵素活性であってもよく、これらの濃度に任意の定数を加減乗除することで得られるものでもよい。
(A)採取した血液サンプルを遠心することにより血液から血漿を分離する。全ての血漿サンプルは、濃度値の測定時まで−80℃で凍結保存する。濃度値測定時には、アセトニトリルを添加し除蛋白処理を行った後、標識試薬(3−アミノピリジル−N−ヒドロキシスクシンイミジルカルバメート)を用いてプレカラム誘導体化を行い、そして、液体クロマトグラフ質量分析計(LC/MS)により濃度値を分析する(国際公開第2003/069328号、国際公開第2005/116629号を参照)。
(B)採取した血液サンプルを遠心することにより血液から血漿を分離する。全ての血漿サンプルは、濃度値の測定時まで−80℃で凍結保存する。濃度値測定時には、スルホサリチル酸を添加し除蛋白処理を行った後、ニンヒドリン試薬を用いたポストカラム誘導体化法を原理としたアミノ酸分析計により濃度値を分析する。
(C)採取した血液サンプルを、膜やMEMS技術または遠心分離の原理を用いて血球分離を行い、血液から血漿または血清を分離する。血漿または血清取得後すぐに濃度値の測定を行わない血漿または血清サンプルは、濃度値の測定時まで−80℃で凍結保存する。濃度値測定時には、酵素やアプタマーなど、標的とする血中物質と反応または結合する分子等を用い、基質認識によって増減する物質や分光学的値を定量等することにより濃度値を分析する。
【0033】
つぎに、ステップS11で取得した濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値を、肺癌の状態を評価するための評価値として用いて、評価対象について肺癌の状態を評価する(ステップS12)。なお、ステップS12を実行する前に、ステップS11で取得した濃度データから欠損値や外れ値などのデータを除去してもよい。
【0034】
以上、第1実施形態によれば、ステップS11では評価対象の濃度データを取得し、ステップS12では、ステップS11で取得した評価対象の濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値を評価値として用いて、評価対象について肺癌の状態を評価する。これにより、肺癌の状態を知る上で参考となり得る信頼性の高い情報を提供することができる。
【0035】
また、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が評価対象についての肺癌の状態を反映したものであると決定してもよく、さらに、濃度値を例えば以下に挙げた手法などで変換し、変換後の値が評価対象についての肺癌の状態を反映したものであると決定してもよい。換言すると、濃度値又は変換後の値そのものを、評価対象についての肺癌の状態に関する評価結果として扱ってもよい。
濃度値の取り得る範囲が所定範囲(例えば0.0から1.0までの範囲、0.0から10.0までの範囲、0.0から100.0までの範囲、又は−10.0から10.0までの範囲、など)に収まるようにするためなどに、例えば、濃度値に対して任意の値を加減乗除したり、濃度値を所定の変換手法(例えば、指数変換、対数変換、角変換、平方根変換、プロビット変換、逆数変換、Box−Cox変換、又はべき乗変換など)で変換したり、また、濃度値に対してこれらの計算を組み合わせて行ったりすることで、濃度値を変換してもよい。例えば、濃度値を指数としネイピア数を底とする指数関数の値(具体的には、肺癌の状態が所定の状態(例えば、基準値を超えた状態、など)である確率pを定義したときの自然対数ln(p/(1−p))が濃度値と等しいとした場合におけるp/(1−p)の値)をさらに算出してもよく、また、算出した指数関数の値を1と当該値との和で割った値(具体的には、確率pの値)をさらに算出してもよい。
また、特定の条件のときの変換後の値が特定の値となるように、濃度値を変換してもよい。例えば、特異度が80%のときの変換後の値が5.0となり且つ特異度が95%のときの変換後の値が8.0となるように濃度値を変換してもよい。
また、各代謝物および各アミノ酸ごとに、濃度分布を正規分布化した後、平均50、標準偏差10となるように偏差値化してもよい。
なお、これらの変換は、男女別や年齢別に行ってもよい。
【0036】
また、モニタ等の表示装置又は紙等の物理媒体に視認可能に示される所定の物差し上における所定の目印の位置に関する位置情報を、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値又は当該濃度値を変換した場合にはその変換後の値を用いて生成し、生成した位置情報が評価対象についての肺癌の状態を反映したものであると決定してもよい。なお、所定の物差しとは、肺癌の状態を評価するためのものであり、例えば、目盛りが示された物差しであって、「濃度値又は変換後の値の取り得る範囲、又は、当該範囲の一部分」における上限値と下限値に対応する目盛りが少なくとも示されたもの、などである。また、所定の目印とは、濃度値又は変換後の値に対応するものであり、例えば、丸印又は星印などである。
【0037】
また、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が、所定値(平均値±1SD、2SD、3SD、N分位点、Nパーセンタイル又は臨床的意義の認められたカットオフ値など)より低い若しくは所定値以下の場合又は所定値以上若しくは所定値より高い場合に、評価対象について、肺癌の状態を評価してもよい。その際、濃度値そのものではなく、濃度偏差値(各代謝物および各アミノ酸ごとに、男女別に濃度分布を正規分布化した後、平均50、標準偏差10となるように偏差値化した値)を用いてもよい。例えば、濃度偏差値が平均値−2SD未満の場合(濃度偏差値<30の場合)又は濃度偏差値が平均値+2SDより高い場合(濃度偏差値>70の場合)に、評価対象について、肺癌の状態を評価してもよい。
【0038】
また、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、および、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を含む式を用いて、式の値を算出することで、評価対象について肺癌の状態を評価してもよい。
【0039】
また、算出した式の値が評価対象についての肺癌の状態を反映したものであると決定してもよく、さらに、式の値を例えば以下に挙げた手法などで変換し、変換後の値が評価対象についての肺癌の状態を反映したものであると決定してもよい。換言すると、式の値又は変換後の値そのものを、評価対象についての肺癌の状態に関する評価結果として扱ってもよい。
評価式の値の取り得る範囲が所定範囲(例えば0.0から1.0までの範囲、0.0から10.0までの範囲、0.0から100.0までの範囲、又は−10.0から10.0までの範囲、など)に収まるようにするためなどに、例えば、評価式の値に対して任意の値を加減乗除したり、評価式の値を所定の変換手法(例えば、指数変換、対数変換、角変換、平方根変換、プロビット変換、逆数変換、Box−Cox変換、又はべき乗変換など)で変換したり、また、評価式の値に対してこれらの計算を組み合わせて行ったりすることで、評価式の値を変換してもよい。例えば、評価式の値を指数としネイピア数を底とする指数関数の値(具体的には、肺癌の状態が所定の状態(例えば、基準値を超えた状態、など)である確率pを定義したときの自然対数ln(p/(1−p))が評価式の値と等しいとした場合におけるp/(1−p)の値)をさらに算出してもよく、また、算出した指数関数の値を1と当該値との和で割った値(具体的には、確率pの値)をさらに算出してもよい。
また、特定の条件のときの変換後の値が特定の値となるように、評価式の値を変換してもよい。例えば、特異度が80%のときの変換後の値が5.0となり且つ特異度が95%のときの変換後の値が8.0となるように評価式の値を変換してもよい。
また、平均50、標準偏差10となるように偏差値化してもよい。
なお、これらの変換は、男女別や年齢別に行ってもよい。
なお、本明細書における評価値は、評価式の値そのものであってもよく、評価式の値を変換した後の値であってもよい。
【0040】
また、モニタ等の表示装置又は紙等の物理媒体に視認可能に示される所定の物差し上における所定の目印の位置に関する位置情報を、式の値又は当該式の値を変換した場合にはその変換後の値を用いて生成し、生成した位置情報が評価対象についての肺癌の状態を反映したものであると決定してもよい。なお、所定の物差しとは、肺癌の状態を評価するためのものであり、例えば、目盛りが示された物差しであって、「式の値又は変換後の値の取り得る範囲、又は、当該範囲の一部分」における上限値と下限値に対応する目盛りが少なくとも示されたもの、などである。また、所定の目印とは、式の値又は変換後の値に対応するものであり、例えば、丸印又は星印などである。
【0041】
また、評価対象が肺癌に罹患している可能性の程度を定性的に評価してもよい。具体的には、「上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値および予め設定された1つまたは複数の閾値」または「上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を含む評価式、および予め設定された1つまたは複数の閾値」を用いて、評価対象を、肺癌に罹患している可能性の程度を少なくとも考慮して定義された複数の区分のうちのどれか1つに分類してもよい。なお、複数の区分には、肺癌に罹患している可能性の程度が高い対象(例えば、肺癌に罹患していると見做す対象)を属させるための区分(例えば、実施例に記載したランクCなど)、肺癌に罹患している可能性の程度が低い対象(例えば、肺癌に罹患していないと見做す対象)を属させるための区分(例えば、実施例に記載したランクAなど)、および肺癌に罹患している可能性の程度が中程度である対象を属させるための区分(例えば、実施例に記載したランクBなど)が含まれていてもよい。また、複数の区分には、肺癌に罹患している可能性の程度が高い対象を属させるための区分(例えば、実施例に記載した肺癌区分など)、および、肺癌に罹患している可能性の程度が低い対象を属させるための区分(例えば、実施例に記載した、健常である可能性が高い対象(例えば健常であると見做す対象)を属させるための健常区分など)が含まれていてもよい。また、濃度値又は式の値を所定の手法で変換し、変換後の値を用いて評価対象を複数の区分のうちのどれか1つに分類してもよい。
【0042】
また、式の形式は特に問わないが、例えば、最小二乗法に基づく重回帰式、線形判別式、主成分分析、正準判別分析などの線形モデル、最尤法に基づくロジスティック回帰、Cox回帰などの一般化線形モデル、一般化線形モデルに加えて個体間差、施設間差などの変量効果を考慮した一般化線形混合モデル、K−means法、階層的クラスタ解析などクラスタ解析で作成された式、MCMC(マルコフ連鎖モンテカルロ法)、ベイジアンネットワーク、階層ベイズ法などベイズ統計に基づき作成された式、サポートベクターマシンや決定木などクラス分類により作成された式、分数式など上記のカテゴリに属さない手法により作成された式、および異なる形式の式の和で示されるような式のうちのいずれか1つでもよい。
【0043】
ここで、評価式として採用する式を、例えば、本出願人による国際出願である国際公開第2004/052191号に記載の方法又は本出願人による国際出願である国際公開第2006/098192号に記載の方法で作成してもよい。なお、これらの方法で得られた式であれば、入力データとしての濃度データにおける代謝物および/またはアミノ酸の濃度値の単位に因らず、当該式を肺癌の状態を評価するのに好適に用いることができる。
【0044】
ここで、重回帰式、多重ロジスティック回帰式、正準判別関数などにおいては各変数に係数及び定数項が付加されるが、この係数及び定数項は、好ましくは実数であれば構わず、より好ましくは、データから前記の各種分類を行うために得られた係数及び定数項の99%信頼区間の範囲に属する値であれば構わず、さらに好ましくは、データから前記の各種分類を行うために得られた係数及び定数項の95%信頼区間の範囲に属する値であれば構わない。また、各係数の値、及びその信頼区間は、それを実数倍したものでもよく、定数項の値、及びその信頼区間は、それに任意の実定数を加減乗除したものでもよい。ロジスティック回帰式、線形判別式、重回帰式などを評価式として用いる場合、線形変換(定数の加算、定数倍)及び単調増加(減少)の変換(例えばlogit変換など)は評価性能を変えるものではなく変換前と同等であるので、これらの変換が行われた後のものを用いてもよい。
【0045】
なお、分数式とは、当該分数式の分子が変数A,B,C,・・・の和で表わされ及び/又は当該分数式の分母が変数a,b,c,・・・の和で表わされるものである。また、分数式には、このような構成の分数式α,β,γ,・・・の和(例えばα+βのようなもの)も含まれる。また、分数式には、分割された分数式も含まれる。なお、分子や分母に用いられる変数にはそれぞれ適当な係数がついても構わない。また、分子や分母に用いられる変数は重複しても構わない。また、各分数式に適当な係数がついても構わない。また、各変数の係数の値や定数項の値は、実数であれば構わない。ある分数式と、当該分数式において分子の変数と分母の変数が入れ替えられたものとでは、目的変数との相関の正負の符号が概して逆転するものの、それらの相関性は保たれるが故に、評価性能も同等と見做せるので、分数式には、分子の変数と分母の変数が入れ替えられたものも含まれる。
【0046】
そして、肺癌の状態を評価する際、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値以外に、他の生体情報に関する値(例えば、以下に挙げた値など)をさらに用いても構わない。また、評価式として採用する式には、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数以外に、他の生体情報に関する値(例えば、以下に挙げた値など)が代入される1つ又は複数の変数がさらに含まれていてもよい。
1.アミノ酸以外の他の血中の代謝物(アミノ酸代謝物・糖類・脂質等)、タンパク質、ペプチド、ミネラル、ホルモン等の濃度値
2.アルブミン、総蛋白、トリグリセリド(中性脂肪)、HbA1c、糖化アルブミン、インスリン抵抗性指数、総コレステロール、LDLコレステロール、HDLコレステロール、アミラーゼ、総ビリルビン、クレアチニン、推算糸球体濾過量(eGFR)、尿酸、GOT(AST)、GPT(ALT),GGTP(γ−GTP)、グルコース(血糖値)、CRP(C反応性蛋白)、赤血球、ヘモグロビン、ヘマトクリット、MCV、MCH,MCHC、白血球、血小板数等の血液検査値
3.超音波エコー、X線、CT、MRI、内視鏡像等の画像情報から得られる値
4.年齢、身長、体重、BMI、腹囲、収縮期血圧、拡張期血圧、性別、喫煙情報、食事情報、飲酒情報、運動情報、ストレス情報、睡眠情報、家族の既往歴情報、疾患歴情報(糖尿病等)等の生体指標に関する値
【0047】
[第2実施形態]
[2−1.第2実施形態の概要]
ここでは、第2実施形態の概要について
図2を参照して説明する。
図2は第2実施形態の基本原理を示す原理構成図である。なお、本第2実施形態の説明では、上述した第1実施形態と重複する説明を省略する場合がある。特に、ここでは、肺癌の状態を評価する際に、評価式の値又はその変換後の値を用いるケースを一例として記載しているが、例えば、「上記15種類の代謝物および上記19種類のアミノ酸」のうちの少なくとも1つの濃度値又はその変換後の値(例えば濃度偏差値など)を用いてもよい。
【0048】
制御部は、血液中の上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値に関する予め取得した評価対象(例えば動物やヒトなどの個体)の濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、および、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を含む予め記憶部に記憶された式を用いて、式の値を算出することで、評価対象について肺癌の状態を評価する(ステップS21)。
【0049】
以上、第2実施形態によれば、ステップS21では、評価対象の濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、および、評価式として記憶部に記憶された、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を含む式を用いて、評価式の値を算出することで、評価対象について肺癌の状態を評価する。これにより、肺癌の状態を知る上で参考となり得る信頼性の高い情報を提供することができる。
【0050】
ここで、評価式作成処理(工程1〜工程4)の概要について詳細に説明する。なお、ここで説明する処理はあくまでも一例であり、評価式の作成方法はこれに限定されない。
【0051】
まず、制御部は、濃度データと肺癌の状態を表す指標に関する指標データとを含む予め記憶部に記憶された指標状態情報から所定の式作成手法に基づいて、評価式の候補である候補式(例えば、y=a1x1+a2x2+・・・+anxn、y:指標データ、xi:濃度データ、ai:定数、i=1,2,・・・,n)を作成する(工程1)。なお、事前に、指標状態情報から欠損値や外れ値などを持つデータを除去してもよい。
【0052】
なお、工程1において、指標状態情報から、複数の異なる式作成手法(主成分分析や判別分析、サポートベクターマシン、重回帰分析、Cox回帰分析、ロジスティック回帰分析、k−means法、クラスター解析、決定木などの多変量解析に関するものを含む。)を併用して複数の候補式を作成してもよい。具体的には、多数の健常群および肺癌群から得た血液を分析して得た濃度データおよび指標データから構成される多変量データである指標状態情報に対して、複数の異なるアルゴリズムを利用して複数群の候補式を同時並行的に作成してもよい。例えば、異なるアルゴリズムを利用して判別分析およびロジスティック回帰分析を同時に行い、2つの異なる候補式を作成してもよい。また、主成分分析を行って作成した候補式を利用して指標状態情報を変換し、変換した指標状態情報に対して判別分析を行うことで候補式を作成してもよい。これにより、最終的に、最適な評価式を作成することができる。
【0053】
ここで、主成分分析を用いて作成した候補式は、全ての濃度データの分散を最大にするような各変数を含む一次式である。また、判別分析を用いて作成した候補式は、各群内の分散の和の全ての濃度データの分散に対する比を最小にするような各変数を含む高次式(指数や対数を含む)である。また、サポートベクターマシンを用いて作成した候補式は、群間の境界を最大にするような各変数を含む高次式(カーネル関数を含む)である。また、重回帰分析を用いて作成した候補式は、全ての濃度データからの距離の和を最小にするような各変数を含む高次式である。また、Cox回帰分析を用いて作成した候補式は、対数ハザード比を含む線形モデルで、そのモデルの尤度を最大とするような各変数とその係数を含む1次式であるである。また、ロジスティック回帰分析を用いて作成した候補式は、確率の対数オッズを表す線形モデルであり、その確率の尤度を最大にするような各変数を含む一次式である。また、k−means法とは、各濃度データのk個近傍を探索し、近傍点の属する群の中で一番多いものをそのデータの所属群と定義し、入力された濃度データの属する群と定義された群とが最も合致するような変数を選択する手法である。また、クラスター解析とは、全ての濃度データの中で最も近い距離にある点同士をクラスタリング(群化)する手法である。また、決定木とは、変数に序列をつけて、序列が上位である変数の取りうるパターンから濃度データの群を予測する手法である。
【0054】
評価式作成処理の説明に戻り、制御部は、工程1で作成した候補式を、所定の検証手法に基づいて検証(相互検証)する(工程2)。候補式の検証は、工程1で作成した各候補式に対して行う。
【0055】
なお、工程2において、ブートストラップ法やホールドアウト法、N−フォールド法、リーブワンアウト法などのうち少なくとも1つに基づいて候補式の判別率や感度、特異度、情報量基準、ROC_AUC(受信者特性曲線の曲線下面積)などのうち少なくとも1つに関して検証してもよい。これにより、指標状態情報や評価条件を考慮した予測性または頑健性の高い候補式を作成することができる。
【0056】
ここで、判別率とは、本実施形態にかかる肺癌評価手法で、真の状態が陰性である評価対象(例えば、肺癌に罹患していない評価対象など)を正しく陰性と評価し、真の状態が陽性である評価対象(例えば、肺癌に罹患している評価対象など)を正しく陽性と評価している割合である。また、感度とは、本実施形態にかかる肺癌評価手法で、真の状態が陽性である評価対象を正しく陽性と評価している割合である。また、特異度とは、本実施形態にかかる肺癌評価手法で、真の状態が陰性である評価対象を正しく陰性と評価している割合である。また、赤池情報量規準とは、回帰分析などの場合に,観測データが統計モデルにどの程度一致するかを表す基準であり、「−2×(統計モデルの最大対数尤度)+2×(統計モデルの自由パラメータ数)」で定義される値が最小となるモデルを最もよいと判断する。また、ROC_AUC(受信者特性曲線の曲線下面積)は、2次元座標上に(x,y)=(1−特異度,感度)をプロットして作成される曲線である受信者特性曲線(ROC)の曲線下面積として定義され、ROC_AUCの値は完全な判別では1となり、この値が1に近いほど判別性が高いことを示す。また、予測性とは、候補式の検証を繰り返すことで得られた判別率や感度、特異性を平均したものである。また、頑健性とは、候補式の検証を繰り返すことで得られた判別率や感度、特異性の分散である。
【0057】
評価式作成処理の説明に戻り、制御部は、所定の変数選択手法に基づいて候補式の変数を選択することで、候補式を作成する際に用いる指標状態情報に含まれる濃度データの組み合わせを選択する(工程3)。変数の選択は、工程1で作成した各候補式に対して行ってもよい。これにより、候補式の変数を適切に選択することができる。そして、工程3で選択した濃度データを含む指標状態情報を用いて再び工程1を実行する。
【0058】
なお、工程3において、工程2での検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補式の変数を選択してもよい。
【0059】
ここで、ベストパス法とは、候補式に含まれる変数を1つずつ順次減らしていき、候補式が与える評価指標を最適化することで変数を選択する方法である。
【0060】
評価式作成処理の説明に戻り、制御部は、上述した工程1、工程2および工程3を繰り返し実行し、これにより蓄積した検証結果に基づいて、複数の候補式の中から評価式として採用する候補式を選出することで、評価式を作成する(工程4)。なお、候補式の選出には、例えば、同じ式作成手法で作成した候補式の中から最適なものを選出する場合と、すべての候補式の中から最適なものを選出する場合とがある。
【0061】
以上、説明したように、評価式作成処理では、指標状態情報に基づいて、候補式の作成、候補式の検証および候補式の変数の選択に関する処理を一連の流れで体系化(システム化)して実行することにより、肺癌の評価に最適な評価式を作成することができる。換言すると、評価式作成処理では、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つを含む血中物質の濃度を多変量の統計解析に用い、最適でロバストな変数の組を選択するために変数選択法とクロスバリデーションとを組み合わせて、評価性能の高い評価式を抽出する。
【0062】
[2−2.第2実施形態の構成]
ここでは、第2実施形態にかかる評価システム(以下では本システムと記す場合がある。)の構成について、
図3から
図14を参照して説明する。なお、本システムはあくまでも一例であり、本発明はこれに限定されない。特に、ここでは、肺癌の状態を評価する際に、評価式の値又はその変換後の値を用いるケースを一例として記載しているが、例えば、「上記15種類の代謝物および上記19種類のアミノ酸」のうちの少なくとも1つの濃度値又はその変換後の値(例えば濃度偏差値など)を用いてもよい。
【0063】
まず、本システムの全体構成について
図3および
図4を参照して説明する。
図3は本システムの全体構成の一例を示す図である。また、
図4は本システムの全体構成の他の一例を示す図である。本システムは、
図3に示すように、評価対象である個体について肺癌の状態を評価する評価装置100と、血液中の上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つを含む血中物質の濃度値に関する個体の濃度データを提供するクライアント装置200(本発明の端末装置に相当)とを、ネットワーク300を介して通信可能に接続して構成されている。
【0064】
なお、本システムは、
図4に示すように、評価装置100やクライアント装置200の他に、評価装置100で評価式を作成する際に用いる指標状態情報や、肺癌の状態を評価する際に用いる評価式などを格納したデータベース装置400を、ネットワーク300を介して通信可能に接続して構成されてもよい。これにより、ネットワーク300を介して、評価装置100からクライアント装置200やデータベース装置400へ、あるいはクライアント装置200やデータベース装置400から評価装置100へ、肺癌の状態を知る上で参考となる情報などが提供される。ここで、肺癌の状態を知る上で参考となる情報とは、例えば、ヒトを含む生物の肺癌の状態に関する特定の項目について測定した値に関する情報などである。また、肺癌の状態を知る上で参考となる情報は、評価装置100やクライアント装置200や他の装置(例えば各種の計測装置等)で生成され、主にデータベース装置400に蓄積される。
【0065】
つぎに、本システムの評価装置100の構成について
図5から
図12を参照して説明する。
図5は、本システムの評価装置100の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
【0066】
評価装置100は、当該評価装置を統括的に制御するCPU等の制御部102と、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して当該評価装置をネットワーク300に通信可能に接続する通信インターフェース部104と、各種のデータベースやテーブルやファイルなどを格納する記憶部106と、入力装置112や出力装置114に接続する入出力インターフェース部108と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。ここで、評価装置100は、各種の分析装置(例えばアミノ酸分析装置等)と同一筐体で構成されてもよい。例えば、血液中の上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つを含む所定の血中物質の濃度値を算出(測定)・出力(印刷やモニタ表示など)する構成(ハードウェアおよびソフトウェア)を備えた小型分析装置において、後述する評価部102iをさらに備え、当該評価部102iで得られた結果を前記構成を用いて出力すること、を特徴とするものでもよい。
【0067】
記憶部106は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置、フレキシブルディスク、光ディスク等を用いることができる。記憶部106には、OS(Operating System)と協働してCPUに命令を与え各種処理を行うためのコンピュータプログラムが記録されている。記憶部106は、図示の如く、利用者情報ファイル106aと、濃度データファイル106bと、指標状態情報ファイル106cと、指定指標状態情報ファイル106dと、評価式関連情報データベース106eと、評価結果ファイル106fと、を格納する。
【0068】
利用者情報ファイル106aは、利用者に関する利用者情報を格納する。
図6は、利用者情報ファイル106aに格納される情報の一例を示す図である。利用者情報ファイル106aに格納される情報は、
図6に示すように、利用者を一意に識別するための利用者IDと、利用者が正当な者であるか否かの認証を行うための利用者パスワードと、利用者の氏名と、利用者の所属する所属先を一意に識別するための所属先IDと、利用者の所属する所属先の部門を一意に識別するための部門IDと、部門名と、利用者の電子メールアドレスと、を相互に関連付けて構成されている。
【0069】
図5に戻り、濃度データファイル106bは、血液中の上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つを含む血中物質の濃度値に関する濃度データを格納する。
図7は、濃度データファイル106bに格納される情報の一例を示す図である。濃度データファイル106bに格納される情報は、
図7に示すように、評価対象である個体(サンプル)を一意に識別するための個体番号と、濃度データとを相互に関連付けて構成されている。ここで、
図7では、濃度データを数値、すなわち連続尺度として扱っているが、濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、濃度データに、他の生体情報に関する値(上記参照)を組み合わせてもよい。
【0070】
図5に戻り、指標状態情報ファイル106cは、評価式を作成する際に用いる指標状態情報を格納する。
図8は、指標状態情報ファイル106cに格納される情報の一例を示す図である。指標状態情報ファイル106cに格納される情報は、
図8に示すように、個体番号と、肺癌の状態を表す指標(指標T1、指標T2、指標T3・・・)に関する指標データ(T)と、濃度データと、を相互に関連付けて構成されている。ここで、
図8では、指標データおよび濃度データを数値(すなわち連続尺度)として扱っているが、指標データおよび濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、指標データは、肺癌の状態のマーカーとなる既知の指標などであり、数値データを用いてもよい。
【0071】
図5に戻り、指定指標状態情報ファイル106dは、後述する指標状態情報指定部102gで指定した指標状態情報を格納する。
図9は、指定指標状態情報ファイル106dに格納される情報の一例を示す図である。指定指標状態情報ファイル106dに格納される情報は、
図9に示すように、個体番号と、指定した指標データと、指定した濃度データと、を相互に関連付けて構成されている。
【0072】
図5に戻り、評価式関連情報データベース106eは、後述する評価式作成部102hで作成した評価式を格納する評価式ファイル106e1、で構成される。
【0073】
評価式ファイル106e1は、評価式を格納する。
図10は、評価式ファイル106e1に格納される情報の一例を示す図である。評価式ファイル106e1に格納される情報は、
図10に示すように、ランクと、評価式(
図10では、Fp(Homo,・・・)やFp(Homo,GABA,Asn)、Fk(Homo,GABA,Asn,・・・)など)と、各式作成手法に対応する閾値と、各評価式の検証結果(例えば各評価式の評価値)と、を相互に関連付けて構成されている。なお、“Homo”という文字は、Homoarginineを意味するものである。
【0074】
図5に戻り、評価結果ファイル106fは、後述する評価部102iで得られた評価結果を格納する。
図11は、評価結果ファイル106fに格納される情報の一例を示す図である。評価結果ファイル106fに格納される情報は、評価対象である個体(サンプル)を一意に識別するための個体番号と、予め取得した個体の濃度データと、肺癌の状態に関する評価結果(例えば、後述する算出部102i1で算出した評価式の値、後述する変換部102i2で評価式の値を変換した後の値、後述する生成部102i3で生成した位置情報、又は、後述する分類部102i4で得られた分類結果、など)と、を相互に関連付けて構成されている。
【0075】
図5に戻り、記憶部106には、上述した情報以外にその他情報として、Webサイトをクライアント装置200に提供するための各種のWebデータや、CGIプログラム等が記録されている。Webデータとしては後述する各種のWebページを表示するためのデータ等があり、これらデータは例えばHTMLやXMLで記述されたテキストファイルとして形成されている。また、Webデータを作成するための部品用のファイルや作業用のファイルやその他一時的なファイル等も記憶部106に記憶される。記憶部106には、必要に応じて、クライアント装置200に送信するための音声をWAVE形式やAIFF形式の如き音声ファイルで格納したり、静止画や動画をJPEG形式やMPEG2形式の如き画像ファイルで格納したりすることができる。
【0076】
通信インターフェース部104は、評価装置100とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
【0077】
入出力インターフェース部108は、入力装置112や出力装置114に接続する。ここで、出力装置114には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下では、出力装置114をモニタ114として記載する場合がある。)。入力装置112には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
【0078】
制御部102は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部102は、図示の如く、大別して、要求解釈部102aと閲覧処理部102bと認証処理部102cと電子メール生成部102dとWebページ生成部102eと受信部102fと指標状態情報指定部102gと評価式作成部102hと評価部102iと結果出力部102jと送信部102kとを備えている。制御部102は、データベース装置400から送信された指標状態情報やクライアント装置200から送信された濃度データに対して、欠損値のあるデータの除去・外れ値の多いデータの除去・欠損値のあるデータの多い変数の除去などのデータ処理も行う。
【0079】
要求解釈部102aは、クライアント装置200やデータベース装置400からの要求内容を解釈し、その解釈結果に応じて制御部102の各部に処理を受け渡す。閲覧処理部102bは、クライアント装置200からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行なう。認証処理部102cは、クライアント装置200やデータベース装置400からの認証要求を受けて、認証判断を行う。電子メール生成部102dは、各種の情報を含んだ電子メールを生成する。Webページ生成部102eは、利用者がクライアント装置200で閲覧するWebページを生成する。
【0080】
受信部102fは、クライアント装置200やデータベース装置400から送信された情報(具体的には、濃度データや指標状態情報、評価式など)を、ネットワーク300を介して受信する。指標状態情報指定部102gは、評価式を作成するにあたり、対象とする指標データおよび濃度データを指定する。
【0081】
評価式作成部102hは、受信部102fで受信した指標状態情報や指標状態情報指定部102gで指定した指標状態情報に基づいて評価式を作成する。なお、評価式が予め記憶部106の所定の記憶領域に格納されている場合には、評価式作成部102hは、記憶部106から所望の評価式を選択することで、評価式を作成してもよい。また、評価式作成部102hは、評価式を予め格納した他のコンピュータ装置(例えばデータベース装置400)から所望の評価式を選択しダウンロードすることで、評価式を作成してもよい。
【0082】
評価部102iは、事前に得られた式(例えば、評価式作成部102hで作成した評価式、又は、受信部102fで受信した評価式など)、及び、受信部102fで受信した個体の濃度データに含まれる、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値を用いて、評価式の値を算出することで、個体について肺癌の状態を評価する。なお、評価部102iは、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値又は当該濃度値の変換後の値(例えば濃度偏差値)を用いて、個体について肺癌の状態を評価してもよい。
【0083】
ここで、評価部102iの構成について
図12を参照して説明する。
図12は、評価部102iの構成を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。評価部102iは、算出部102i1と、変換部102i2と、生成部102i3と、分類部102i4と、をさらに備えている。
【0084】
算出部102i1は、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、および、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を少なくとも含む評価式を用いて、評価式の値を算出する。なお、評価部102iは、算出部102i1で算出した評価式の値を評価結果として評価結果ファイル106fの所定の記憶領域に格納してもよい。
【0085】
変換部102i2は、算出部102i1で算出した評価式の値を例えば上述した変換手法などで変換する。なお、評価部102iは、変換部102i2で変換した後の値を評価結果として評価結果ファイル106fの所定の記憶領域に格納してもよい。また、変換部102i2は、濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値を、例えば上述した変換手法などで変換してもよい。
【0086】
生成部102i3は、モニタ等の表示装置又は紙等の物理媒体に視認可能に示される所定の物差し上における所定の目印の位置に関する位置情報を、算出部102i1で算出した式の値又は変換部102i2で変換した後の値(濃度値又は当該濃度値の変換後の値でもよい)を用いて生成する。なお、評価部102iは、生成部102i3で生成した位置情報を評価結果として評価結果ファイル106fの所定の記憶領域に格納してもよい。
【0087】
分類部102i4は、算出部102i1で算出した評価式の値又は変換部102i2で変換した後の値(濃度値又は当該濃度値の変換後の値でもよい)を用いて、個体を、肺癌に罹患している可能性の程度を少なくとも考慮して定義された複数の区分のうちのどれか1つに分類する。
【0088】
結果出力部102jは、制御部102の各処理部での処理結果(評価部102iで得られた評価結果を含む)等を出力装置114に出力する。
【0089】
送信部102kは、個体の濃度データの送信元のクライアント装置200に対して評価結果を送信したり、データベース装置400に対して、評価装置100で作成した評価式や評価結果を送信したりする。
【0090】
つぎに、本システムのクライアント装置200の構成について
図13を参照して説明する。
図13は、本システムのクライアント装置200の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
【0091】
クライアント装置200は、制御部210とROM220とHD230とRAM240と入力装置250と出力装置260と入出力IF270と通信IF280とで構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
【0092】
制御部210は、Webブラウザ211、電子メーラ212、受信部213、送信部214を備えている。Webブラウザ211は、Webデータを解釈し、解釈したWebデータを後述するモニタ261に表示するブラウズ処理を行う。なお、Webブラウザ211には、ストリーム映像の受信・表示・フィードバック等を行う機能を備えたストリームプレイヤ等の各種のソフトウェアをプラグインしてもよい。電子メーラ212は、所定の通信規約(例えば、SMTP(Simple Mail Transfer Protocol)やPOP3(Post Office Protocol version 3)等)に従って電子メールの送受信を行う。受信部213は、通信IF280を介して、評価装置100から送信された評価結果などの各種情報を受信する。送信部214は、通信IF280を介して、個体の濃度データなどの各種情報を評価装置100へ送信する。
【0093】
入力装置250はキーボードやマウスやマイク等である。なお、後述するモニタ261もマウスと協働してポインティングデバイス機能を実現する。出力装置260は、通信IF280を介して受信した情報を出力する出力手段であり、モニタ(家庭用テレビを含む)261およびプリンタ262を含む。この他、出力装置260にスピーカ等を設けてもよい。入出力IF270は入力装置250や出力装置260に接続する。
【0094】
通信IF280は、クライアント装置200とネットワーク300(またはルータ等の通信装置)とを通信可能に接続する。換言すると、クライアント装置200は、モデムやTAやルータなどの通信装置および電話回線を介して、または専用線を介してネットワーク300に接続される。これにより、クライアント装置200は、所定の通信規約に従って評価装置100にアクセスすることができる。
【0095】
ここで、プリンタ・モニタ・イメージスキャナ等の周辺装置を必要に応じて接続した情報処理装置(例えば、既知のパーソナルコンピュータ・ワークステーション・家庭用ゲーム装置・インターネットTV・PHS端末・携帯端末・移動体通信端末・PDA等の情報処理端末など)に、Webデータのブラウジング機能や電子メール機能を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより、クライアント装置200を実現してもよい。
【0096】
また、クライアント装置200の制御部210は、制御部210で行う処理の全部または任意の一部を、CPUおよび当該CPUにて解釈して実行するプログラムで実現してもよい。ROM220またはHD230には、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。当該コンピュータプログラムは、RAM240にロードされることで実行され、CPUと協働して制御部210を構成する。また、当該コンピュータプログラムは、クライアント装置200と任意のネットワークを介して接続されるアプリケーションプログラムサーバに記録されてもよく、クライアント装置200は、必要に応じてその全部または一部をダウンロードしてもよい。また、制御部210で行う処理の全部または任意の一部を、ワイヤードロジック等によるハードウェアで実現してもよい。
【0097】
ここで、制御部210は、評価装置100の制御部102に備えられている評価部102iが有する機能と同様の機能を有する評価部210a(算出部210a1、変換部210a2、生成部210a3、及び分類部210a4を含む)を備えていてもよい。そして、制御部210に評価部210aが備えられている場合には、評価部210aは、評価装置100から送信された評価結果に含まれている情報に応じて、変換部210a2で式の値を変換したり、生成部210a3で式の値又は変換後の値(濃度値又は当該濃度値の変換後の値でもよい)に対応する位置情報を生成したり、分類部210a4で式の値又は変換後の値(濃度値又は当該濃度値の変換後の値でもよい)を用いて個体を複数の区分のうちのどれか1つに分類したりしてもよい。
【0098】
つぎに、本システムのネットワーク300について
図3、
図4を参照して説明する。ネットワーク300は、評価装置100とクライアント装置200とデータベース装置400とを相互に通信可能に接続する機能を有し、例えばインターネットやイントラネットやLAN(有線/無線の双方を含む)等である。なお、ネットワーク300は、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、携帯回線交換網または携帯パケット交換網(IMT2000方式、GSM(登録商標)方式またはPDC/PDC−P方式等を含む)や、無線呼出網や、Bluetooth(登録商標)等の局所無線網や、PHS網や、衛星通信網(CS、BSまたはISDB等を含む)等でもよい。
【0099】
つぎに、本システムのデータベース装置400の構成について
図14を参照して説明する。
図14は、本システムのデータベース装置400の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
【0100】
データベース装置400は、評価装置100または当該データベース装置で評価式を作成する際に用いる指標状態情報や、評価装置100で作成した評価式、評価装置100での評価結果などを格納する機能を有する。
図14に示すように、データベース装置400は、当該データベース装置を統括的に制御するCPU等の制御部402と、ルータ等の通信装置および専用線等の有線または無線の通信回路を介して当該データベース装置をネットワーク300に通信可能に接続する通信インターフェース部404と、各種のデータベースやテーブルやファイル(例えばWebページ用ファイル)などを格納する記憶部406と、入力装置412や出力装置414に接続する入出力インターフェース部408と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
【0101】
記憶部406は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置や、フレキシブルディスクや、光ディスク等を用いることができる。記憶部406には、各種処理に用いる各種プログラム等を格納する。通信インターフェース部404は、データベース装置400とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部404は、他の端末と通信回線を介してデータを通信する機能を有する。入出力インターフェース部408は、入力装置412や出力装置414に接続する。ここで、出力装置414には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下で、出力装置414をモニタ414として記載する場合がある。)。また、入力装置412には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
【0102】
制御部402は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部402は、図示の如く、大別して、要求解釈部402aと閲覧処理部402bと認証処理部402cと電子メール生成部402dとWebページ生成部402eと送信部402fとを備えている。
【0103】
要求解釈部402aは、評価装置100からの要求内容を解釈し、その解釈結果に応じて制御部402の各部に処理を受け渡す。閲覧処理部402bは、評価装置100からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行う。認証処理部402cは、評価装置100からの認証要求を受けて、認証判断を行う。電子メール生成部402dは、各種の情報を含んだ電子メールを生成する。Webページ生成部402eは、利用者がクライアント装置200で閲覧するWebページを生成する。送信部402fは、指標状態情報や評価式などの各種情報を、評価装置100へ送信する。
【0104】
なお、本説明では、評価装置100が、濃度データの受信から、評価式の値の算出、個体の区分への分類、そして評価結果の送信までを実行し、クライアント装置200が評価結果の受信を実行するケースを例として挙げたが、クライアント装置200に評価部210aが備えられている場合は、評価装置100は評価式の値の算出を実行すれば十分であり、例えば評価式の値の変換、位置情報の生成、及び、個体の区分への分類などは、評価装置100とクライアント装置200とで適宜分担して実行してもよい。
例えば、クライアント装置200は、評価装置100から評価式の値を受信した場合には、評価部210aは、変換部210a2で評価式の値を変換したり、生成部210a3で評価式の値又は変換後の値に対応する位置情報を生成したり、分類部210a4で式の値又は変換後の値を用いて個体を複数の区分のうちのどれか1つに分類したりしてもよい。
また、クライアント装置200は、評価装置100から変換後の値を受信した場合には、評価部210aは、生成部210a3で変換後の値に対応する位置情報を生成したり、分類部210a4で変換後の値を用いて個体を複数の区分のうちのどれか1つに分類したりしてもよい。
また、クライアント装置200は、評価装置100から評価式の値又は変換後の値と位置情報とを受信した場合には、評価部210aは、分類部210a4で評価式の値又は変換後の値を用いて個体を複数の区分のうちのどれか1つに分類してもよい。
【0105】
[2−3.他の実施形態]
本発明にかかる評価装置、評価方法、評価プログラム、評価システム、および情報通信端末装置は、上述した第2実施形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。
【0106】
また、第2実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
【0107】
このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
【0108】
また、評価装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
【0109】
例えば、評価装置100が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、情報処理装置に本発明にかかる評価方法を実行させるためのプログラム化された命令を含む一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて評価装置100に機械的に読み取られる。すなわち、ROMまたはHDDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
【0110】
また、このコンピュータプログラムは評価装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
【0111】
また、本発明にかかる評価プログラムを、一時的でないコンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM(登録商標)、CD−ROM、MO、DVD、および、Blu−ray(登録商標) Disc等の任意の「可搬用の物理媒体」を含むものとする。
【0112】
また、「プログラム」とは、任意の言語または記述方法にて記述されたデータ処理方法であり、ソースコードまたはバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成および読み取り手順ならびに読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
【0113】
記憶部106に格納される各種のデータベース等は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。
【0114】
また、評価装置100は、既知のパーソナルコンピュータまたはワークステーション等の情報処理装置として構成してもよく、また、任意の周辺装置が接続された当該情報処理装置として構成してもよい。また、評価装置100は、当該情報処理装置に本発明の評価方法を実現させるソフトウェア(プログラムまたはデータ等を含む)を実装することにより実現してもよい。
【0115】
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じてまたは機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。
【実施例1】
【0116】
肺癌の確定診断が行われた肺癌患者(肺癌群:72名)、及び、癌の既往歴、罹患歴がない健常者(健常群:69名)の血漿サンプルから、前述の代謝物分析法(A)により血中代謝物濃度を測定した。
【0117】
14種類の代謝物(Homoarginine,GABA,3−Me−His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N−Acetyl−L−lys,Hypotaurine,bABA)の血漿中濃度値(nmol/ml)のデータを用いて、各代謝物について肺癌群と健常群の判別能をROC_AUC(受信者特性曲線の曲線下面積)で評価した。表1に各代謝物の判別能を評価する際の指標となるROC_AUCを示す。
【0118】
【表1】
【0119】
ノンパラメトリックの仮定のもとで帰無仮説を「ROC_AUC=0.5」とした場合の検定でROC_AUCが有意(p<0.05)であった代謝物は、Homoarginine,GABA,3−Me−His,ADMA,Spermine,Cystathionineであった。Homoarginine,GABA,3−Me−Hisは肺癌群で有意に減少し、ADMA,Spermine,Cystathionineは肺癌群で有意に増加した。これらの代謝物の濃度値は、ROC_AUCが有意であることから、健常の状態を考慮した、肺癌の状態の評価において有用なものであると考えられる。
【実施例2】
【0120】
実施例1で得られたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
【0121】
多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める2個の変数の組み合わせを、上記14種類の代謝物のうち少なくとも1つを必須としたうえで、19種類のアミノ酸(Asn,His,Thr,Ala,Cit,Arg,Tyr,Val,Met,Lys,Trp,Gly,Pro,Orn,Ile,Leu,Phe,Ser,Gln)および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
【0122】
肺癌群と健常群のROC_AUC値が0.597(単独の代謝物で有意なROC_AUCの最小値)以上で、変数の個数が2個のロジスティック回帰式の一覧を、
図15から
図20に示した。これらのロジスティック回帰式は、ROC_AUC値が高いことから、前記の評価において有用なものであると考えられる。
【実施例3】
【0123】
実施例1で用いたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
【0124】
多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める3個の変数の組み合わせを、実施例2と同様に、上記14種類の代謝物のうち少なくとも1つを必須としたうえで、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
【0125】
肺癌群と健常群のROC_AUC値が0.771(単独の代謝物で有意なROC_AUCの最大値)以上で、変数の個数が3個のロジスティック回帰式の一覧を、
図21から
図48に示した。これらのロジスティック回帰式は、ROC_AUC値が高いことから、前記の評価において有用なものであると考えられる。
【実施例4】
【0126】
実施例1で用いたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
【0127】
多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める6個の変数の組み合わせを、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
【0128】
上記で得られたロジスティック回帰式のうち、ROC_AUCが0.95以上の383式に含まれるアミノ酸変数の出現頻度を求めた。ロジスティック回帰式の一覧を
図49から
図64に、出現頻度を表2に示した。これより、Pro,Cit,Phe,His,Trp,ADMA,Cystathionineの出現頻度は50以上と高いことが示された。特に、Pro,Cit,Phe,His,Trp,ADMAの出現頻度は100以上と高いことが示された。更に、Pro,Cit,His,ADMAの出現頻度は300以上と高いことが示された。
【0129】
【表2】
【0130】
上記で得られたロジスティック回帰式のうち、例えば、変数の組「Pro,Cit,His,GABA,ADMA,Homoarginine」を持つ指標式1「6.0201+0.029344*Pro−0.17847*Cit−0.17485*His−22.9141*GABA+23.6129*ADMA−0.57734*homoarginine(Pro,Cit,His,GABA,ADMA,Homoarginineを変数として含む多変量判別式)の判別能は、ROC_AUC=0.9601,感度=0.903,特異度=0.899と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。
【0131】
ここで、指標式1、並びに、肺癌群のアミノ酸及び代謝物濃度値(μmol/L)を用いて、式の値を算出し、そして、算出した式の値及び予め設定したカットオフ値を用いて、肺癌群の各症例を、以下に示す通り設定した複数の区分のうちのどれか1つに分類した。ここで、カットオフ値の候補として、特異度80%のときの式の値と特異度95%のときの式の値を求めたところ、それぞれ−1.016と0.816であった。なお、これらをカットオフ値とした場合の感度はそれぞれ93%、79%である。
【0132】
式の値が最も高かった1症例のアミノ酸濃度値はそれぞれ、Pro:209.6、Cit:24.5、His:35.1、GABA:0.100、ADMA:0.629、Homoarginine:0.812であり、この症例の式の値は13.7であった。ここで、「対数オッズln(p/(1−p))=式の値」という関係式(pは癌である確率)を定義して、この式の値13.7からオッズp/(1−p)を計算したところ、918043.4であった。さらに、このオッズから確率pを計算したところ、1.0であった。
【0133】
そして、カットオフ値として特異度95%のときの式の値0.816を設定し、そして、式の値がカットオフ値より高い場合は陽性(肺癌区分に相当)でカットオフ値より低い場合は陰性(健常区分に相当)と定義して、式の値が13.7であった前記症例を陽性及び陰性のどちらかに分類したところ、この式の値はカットオフ値より高いため、この症例は陽性に分類された。
【0134】
また、第一のカットオフ値として特異度80%のときの式の値−1.016を設定し、第二のカットオフ値として特異度95%のときの式の値0.816を設定し、そして、式の値が第一のカットオフ値より低い場合はランクA(肺癌である可能性(確率、リスク)が低いことを意味する区分)で、第一のカットオフ値より高く第二のカットオフ値より低い場合はランクB(肺癌である可能性が中程度であることを意味する区分)で、第二のカットオフ値より高い場合はランクC(肺癌である可能性が高いことを意味する区分)と定義して、式の値が13.7であった前記症例を3つのランクのうちのどれか1つに分類したところ、この式の値は第二のカットオフ値より高いため、この症例はランクCに分類された。
【実施例5】
【0135】
本実施例5においては、実施例1で用いた血液サンプルの中から健常者19名分の血漿、肺癌患者20名分の血漿をそれぞれまとめたプール血漿を用い、前述の代謝物分析法(A)を用いて定性分析を行った。
【0136】
実施例1で測定した14種類の代謝物以外に、「ACQUITYTM UPLC」(ウォーターズ社)を用い(分析カラム:「Inertcil ODS−3(粒子径:2.0μm、内径:2.1mm、長さ:100mm)」(ジーエルサイエンス社)、ガードカラム:「Cartridge Guard Column E Inertsil ODS−3(粒子径:3.0μm、内径:1.5mm、長さ:10mm)」(ジーエルサイエンス社))、カラム温度を50℃とし、溶離液AにAPDSアミノタグワコー用溶離液(和光純薬工業)を用い、溶離液Bとしてアセトニトリル/水(60:40、v/v)を用いて、0.5mL/minの流量で分析を実施し、そして、この実施において、溶離液Bを、下記の通り、時間経過に合わせて段階的に変化させたところ、3.3分付近のβ−アミノイソ酪酸の直後に溶出する保持時間3.5分付近にピーク(m/z 224)が出現した。そして、このピークの面積値は、健常者の血漿プールで202,000、肺癌患者のプール血漿で2,790,000であった。つまり、肺癌患者のプール血漿で約13.8倍の面積値の上昇が認められた。そのときのクロマトグラムを
図65に示した。
0.00分〜 0.01分:5%〜6%
0.01分〜 3.50分:6%
3.50分〜 5.00分:6%〜8%
5.00分〜 6.00分:8%〜20%
6.00分〜 8.50分:20%
8.50分〜 9.50分:20%〜24%
9.50分〜12.00分:24%
12.00分〜12.01分:24%〜35%
12.01分〜15.00分:35%〜80%
15.00分〜15.10分:80%〜95%
15.10分〜17.00分:95%
17.01分〜19.00分:5%
【0137】
上記のピークはその質量数および液体クロマトグラフィの保持時間からEthylglycineであることが示された。これより、Ethylglycineが、肺癌の状態を評価するのに有用であることが示された。
【実施例6】
【0138】
実施例1のサンプルを用いて、前述の代謝物分析法(A)により実施例1の血中代謝物濃度に加え、血中のEthylglycine濃度を測定した。
【0139】
Ethylglycineの血漿中濃度値(nmol/ml)のデータを用いて、肺癌群と健常群の判別能をROC_AUCで評価した。表3にEthylglycineの判別能を評価する際の指標となるROC_AUCを示す。
【0140】
【表3】
【0141】
Ethylglycineは、ノンパラメトリックの仮定のもとで帰無仮説を「ROC_AUC=0.5」とした場合の検定でROC_AUCが有意(p<0.05)であり、肺癌群で有意に増加した。Ethylglycineの濃度値は、ROC_AUCが有意であることから、健常の状態を考慮した、肺癌の状態の評価において有用なものであると考えられる。
【実施例7】
【0142】
実施例6で得られたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
【0143】
多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める2個の変数の組み合わせを、Ethylglycineを必須としたうえで、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
【0144】
肺癌群と健常群のROC_AUC値が0.779(Ethylglycine単独のROC_AUC値)以上で、変数の個数が2個のロジスティック回帰式(変数の組み合わせ)の一覧を
図66に示した。なお、
図66に示す各式について、各変数の係数の数値はゼロを除く任意の数値であればよく、また、定数の数値は任意の数値であればよい。これらのロジスティック回帰式は、ROC_AUC値が高いことから、前記の評価において有用なものであると考えられる。
【実施例8】
【0145】
実施例6で用いたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
【0146】
多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める3個の変数の組み合わせを、実施例7と同様に、Ethylglycineを必須としたうえで、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
【0147】
肺癌群と健常群のROC_AUC値が0.779(Ethylglycine単独のROC_AUC値)以上で、変数の個数が3個のロジスティック回帰式(変数の組み合わせ)の一覧を
図67から
図69に示した。なお、
図67から
図69に示す各式について、各変数の係数の数値はゼロを除く任意の数値であればよく、また、定数の数値は任意の数値であればよい。これらのロジスティック回帰式は、ROC_AUC値が高いことから、前記の評価において有用なものであると考えられる。
【実施例9】
【0148】
実施例6で用いたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
【0149】
多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める6個の変数の組み合わせを、実施例7と同様に、Ethylglycineを必須としたうえで、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
【0150】
上記で得られたロジスティック回帰式のうち、肺癌群と健常群のROC_AUC値が0.95以上の122式に含まれるアミノ酸変数の出現頻度を求めた。ロジスティック回帰式の一覧を
図70から
図72に、出現頻度を表4に示した。なお、
図70から
図72に示す各式について、各変数の係数の数値はゼロを除く任意の数値であればよく、また、定数の数値は任意の数値であればよい。これより、Pro,Cit,Phe,His,GABA,ADMA,Cystathionine,Ethylglycineの出現頻度は20以上と高いことが示された。特に、Cit,His,ADMA,Ethylglycineの出現頻度は100以上と高いことが示された。
【0151】
【表4】
【0152】
上記で得られたロジスティック回帰式のうち、例えば、変数の組「Pro,Cit,His,ADMA,Homoarginine,Ethylglycine」を持つ指標式2「2.8645+0.024531*Pro−0.20356*Cit−0.15864*His+24.334*ADMA−0.74621*Homoarginine+3.7291*Ethylglycine(Pro,Cit,His,ADMA,Homoarginine,Ethylglycineを変数として含む多変量判別式)の判別能は、ROC_AUC=0.9599,感度=0.889,特異度=0.899と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。
【0153】
ここで、指標式2、並びに、肺癌群のアミノ酸及び代謝物濃度値(μmol/L)を用いて、式の値を算出し、そして、算出した式の値及び予め設定したカットオフ値を用いて、肺癌群の各症例を、以下に示す通り設定した複数の区分のうちのどれか1つに分類した。ここで、カットオフ値の候補として、特異度80%のときの式の値と特異度95%のときの式の値を求めたところ、それぞれ−0.7765と0.5558であった。なお、これらをカットオフ値とした場合の感度はそれぞれ93%、79%である。
【0154】
式の値が最も高かった1症例のアミノ酸濃度値はそれぞれ、Pro:279.7、Cit:26.8、His:72.4、ADMA:0.572、Homoarginine:0.833、Ethylglycine:4.20であり、この症例の式の値は21.7であった。ここで、「対数オッズln(p/(1−p))=式の値」という関係式(pは癌である確率)を定義して、この式の値21.7からオッズp/(1−p)を計算したところ、2,655,768,756であった。さらに、このオッズから確率pを計算したところ、1.0であった。
【0155】
そして、カットオフ値として特異度95%のときの式の値0.5558を設定し、そして、式の値がカットオフ値より高い場合は陽性(肺癌区分に相当)でカットオフ値より低い場合は陰性(健常区分に相当)と定義して、式の値が21.7であった前記症例を陽性及び陰性のどちらかに分類したところ、この式の値はカットオフ値より高いため、この症例は陽性に分類された。
【0156】
また、第一のカットオフ値として特異度80%のときの式の値−0.7765を設定し、第二のカットオフ値として特異度95%のときの式の値0.5558を設定し、そして、式の値が第一のカットオフ値より低い場合はランクA(肺癌である可能性(確率、リスク)が低いことを意味する区分)で、第一のカットオフ値より高く第二のカットオフ値より低い場合はランクB(肺癌である可能性が中程度であることを意味する区分)で、第二のカットオフ値より高い場合はランクC(肺癌である可能性が高いことを意味する区分)と定義して、式の値が21.7であった前記症例を3つのランクのうちのどれか1つに分類したところ、この式の値は第二のカットオフ値より高いため、この症例はランクCに分類された。