(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-09
(45)【発行日】2023-03-17
(54)【発明の名称】分光分析方法
(51)【国際特許分類】
G01N 21/35 20140101AFI20230310BHJP
A61B 5/00 20060101ALI20230310BHJP
【FI】
G01N21/35
A61B5/00 Q
(21)【出願番号】P 2020555114
(86)(22)【出願日】2019-04-05
(86)【国際出願番号】 GB2019050998
(87)【国際公開番号】W WO2019197806
(87)【国際公開日】2019-10-17
【審査請求日】2020-12-02
(32)【優先日】2018-04-11
(33)【優先権主張国・地域又は機関】GB
(73)【特許権者】
【識別番号】508346000
【氏名又は名称】ザ ユニバーシティ オブ リバプール
【氏名又は名称原語表記】THE UNIVERSITY OF LIVERPOOL
(74)【代理人】
【識別番号】100120891
【氏名又は名称】林 一好
(74)【代理人】
【識別番号】100165157
【氏名又は名称】芝 哲央
(74)【代理人】
【識別番号】100205659
【氏名又は名称】齋藤 拓也
(74)【代理人】
【識別番号】100126000
【氏名又は名称】岩池 満
(74)【代理人】
【識別番号】100185269
【氏名又は名称】小菅 一弘
(72)【発明者】
【氏名】インガム ジェームズ ジョセフ
(72)【発明者】
【氏名】バーレット ステファン デイヴィッド
(72)【発明者】
【氏名】ウェイトマン ピーター
【審査官】越柴 洋哉
(56)【参考文献】
【文献】特開2015-102542(JP,A)
【文献】国際公開第2017/161097(WO,A1)
【文献】特表2011-522260(JP,A)
【文献】特開2017-015724(JP,A)
【文献】特開2016-028229(JP,A)
【文献】特表2013-533960(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 21/17 - G01N 21/61
A61B 5/00
(57)【特許請求の範囲】
【請求項1】
赤外線吸収分光法において使用するための、異なる細胞型又は組織型から第1の細胞型又は組織型を判別することができる赤外線の波長を選択する方法であって、
前記第1の細胞型又は組織型の複数の異なる空間領域の各空間領域で得られる吸収スペクトルを含む吸収スペクトルの第1組を得て、前記異なる細胞型又は組織型の複数の異なる空間領域の各空間領域で得られる吸収スペクトルを含む吸収スペクトルの第2組を得る工程であって、各空間領域は、第1の細胞型若しくは組織型又は異なる細胞型若しくは組織型の画像の画素である、工程と、
吸収スペクトルの前記第1組に属する各空間領域についての計量値の組を定義し、吸収スペクトルの前記第2組に属する各空間領域についての計量値の対応する組を定義する工程であって、各計量値は、前記与えられた空間領域についての少なくとも2つの異なる波長について吸収された赤外線の量に対応する情報を含み、組の中の前記計量値は、波長の異なる組み合わせを含む、工程と、
各計量値についての特性値を生成するために、各計量値に対して第1数学関数を実行する工程であって、前記特性値は、前記計量値に属する前記少なくとも2つの異なる波長の各々において吸収された赤外線の量に依存している、工程と、
前記計量値の各々について、前記第1の細胞型又は組織型に属する前記複数の空間領域にわたる、与えられた計量値の前記特性値を含む分布を生成し、前記異なる細胞型又は組織型に属する前記複数の空間領域にわたる、同じ前記与えられた計量値の前記特性値を含む対応する分布を生成する、工程と、
前記分布が確率分布関数として扱われ、前記計量値が、前記確率分布関数間の
類似性の程度を数量化することにより順位付けされ、
前記計量値の各々について、与えられた計量値についての、前記第1の細胞型又は組織型について生成された前記分布及び前記異なる細胞型又は組織型について生成された前記分布を比較し、前記分布間の類似性の
前記程度を決定する、工程と、
前記計量値に属する前記分布間の類似性の
前記程度に基づいて前記計量値を順位付けする工程であって、より小さい類似性を有する分布に関連する計量値が、より大きい類似性を有する分布と関連する計量値よりも高く順位付けされる工程と、
より小さい類似性を有する分布に関連する前記計量値と関連する前記赤外線の波長を選択する工程と、
を備える方法。
【請求項2】
前記第1の細胞型又は組織型が既知であり、空間領域の第1部分が前記分布を生成するためには使用されず、前記方法が、より高く順位付けされた各計量値についての成功率を定義する工程をさらに備え、前記成功率が、
前記より高く順位付けされた計量値を使用して、前記空間領域の第1部分の中の各空間領域を前記第1の細胞型若しくは組織型又は前記異なる細胞型若しくは組織型のいずれか割り当てる工程と、
前記より高く順位付けされた計量値を使用して正しく割り当てられた、前記空間領域の第1部分の空間領域の数を決定する工程と、
前記より高く順位付けされた計量値が、前記空間領域の第1部分の空間領域を、前記第1の細胞型若しくは組織型又は前記異なる細胞型若しくは組織型のいずれかに正しく帰属させる場合の頻度であるとして、より高く順位付けされた計量値の前記成功率を算出する工程と、
によって決定される請求項1に記載の方法。
【請求項3】
前記方法が、より高く順位付けされた各計量値について誤標識率を定義する工程であって、前記誤標識率は、前記より高く順位付けされた計量値が前記異なる細胞型又は組織型を前記第1の細胞型又は組織型であると特定した確率である工程をさらに備える請求項2に記載の方法。
【請求項4】
前記算出された成功率及び誤標識率に対して第2数学関数を実行し、前記第2数学関数の結果を比較することにより、前記より高く順位付けされた計量値をスコア付けする工程をさらに備え、前記第2数学関数が
スコア=成功率×(1-誤標識率)
2
である請求項2から請求項3のいずれか1項に記載の方法。
【請求項5】
前記より高く順位付けされた計量値の複数の組み合わせについて通算成功率を決定する工程をさらに備え、前記通算成功率が、
増加する数の前記より高く順位付けされた計量値を使用すること、前記空間領域の第1部分の平均割り当てを決定するために、最高位に順位付けされた計量値のうちの2つと関連する前記空間領域の第1部分の割り当てを使用すること、そして、前記平均割り当てが正しい場合の頻度を決定すること、を繰り返すこと、
によって算出される請求項4に記載の方法。
【請求項6】
前記第1数学関数が、計量値の赤外線の前記少なくとも2つの異なる波長において吸収された赤外線の量の比を決定する請求項1から請求項5のいずれか1項に記載の方法。
【請求項7】
前記波長が最高の順位付けの計量値のうちの約500個から選択される請求項1から請求項6のいずれか1項に記載の方法。
【請求項8】
吸収スペクトルの前記第1及び第2の組が、約900cm
-1~約4000cm
-1の波長において得られたデータを含む請求項7に記載の方法。
【請求項9】
前記第1の細胞型若しくは組織型及び/又は前記異なる細胞型若しくは組織型のうちの少なくとも1つが癌性である請求項1から請求項8のいずれか1項に記載の方法。
【請求項10】
吸収スペクトルの前記第1及び第2の組がフーリエ変換赤外分光法を使用して得られ、かつ/又は吸収スペクトルの前記第1及び第2の組がMie散乱効果について補正される請求項1から請求項9のいずれか1項に記載の方法。
【請求項11】
複数の異なる細胞型又は組織型を判別する方法であって、
請求項1から請求項10のいずれか1項に記載の方法に従って選択される赤外線の波長を使用して、前記複数の異なる細胞型又は組織型に対して吸収分光法を実行する工程と、
請求項1に記載された工程に従って前記複数の細胞型又は組織型についてのそれぞれの特性値を決定する工程と、
前記吸収分光法により得られる前記特性値を、請求項1から請求項10のいずれか1項に記載の方法によって得られる既知の細胞型又は組織型に対応する分布と比較する工程と、
前記複数の異なる細胞型又は組織型に対して実行された前記吸収分光法により得られる前記特性値が前記既知の細胞型又は組織型についての前記既知の分布に対応するか否かを判定する工程と
を備える方法。
【請求項12】
複数の異なる細胞型又は組織型を判別する方法であって、
前記複数の異なる細胞型又は組織型について、請求項1から請求項10のいずれか1項に記載の方法に従って選択される複数の赤外線の波長の各々において吸収される赤外線の量に対応する情報を得る工程と、
請求項1に記載された工程に従って前記複数の細胞型又は組織型についてのそれぞれの特性値を決定する工程と、
前記複数の細胞型又は組織型について前記複数の波長の各々において得られる前記特性値を、請求項1から請求項10のいずれか1項に記載の方法によって得られる前記選択された波長と関連する既知の細胞型又は組織型に対応する分布と比較する工程と、
各それぞれの細胞型又は組織型についての前記特性値が、前記既知の細胞型又は組織型についての前記既知の分布に対応するか否かを判定する工程と、
を備える方法。
【請求項13】
複数の異なる細胞型又は組織型を含む患者から得られた細胞又は組織試料における第1の細胞型又は組織型の存在又は不存在を特定する方法であって、
請求項1に記載の方法に従って選択される複数の赤外線の波長の各々において吸収される赤外線の量に対応する情報を得て、請求項1に記載された工程に従って患者から得られた前記細胞又は組織試料における前記細胞型又は組織型のうちの1以上についてのそれぞれの特性値を決定する工程と、
患者から得られた前記細胞又は組織試料におけるそれぞれの細胞型又は組織型についての前記複数の波長の各々において得られる前記特性値を、前記選択された波長と関連する前記第1の細胞型又は組織型についての対応する既知の分布と比較する工程と、
患者から得られた前記細胞又は組織試料における前記細胞型又は組織型についての前記特性値が、前記第1の細胞型又は組織型についての前記既知の分布に対応するか否かを判定する工程と、
患者から得られた前記細胞又は組織試料における前記細胞型又は組織型についての前記特性値が、前記第1の細胞型又は組織型についての前記既知の分布に対応すると判定された場合に、前記第1の細胞型又は組織型の存在を特定し、又は前記組織試料の中の前記細胞型又は組織型についての前記特性値が、前記第1の細胞型又は組織型についての前記既知の分布に対応しない場合に、前記第1の細胞型又は組織型の不存在があると判定する工程と、
を備える方法。
【請求項14】
前記第1の細胞型が食道癌細胞株OE19であり、前記患者から得られる前記組織試料が、食道癌細胞株OE21、癌関連筋線維芽細胞及び隣接組織筋線維芽細胞のうちの1以上を含み、前記選択される複数の赤外線の波長が、以下の波数(cm
-1):1375、1381、1400、1406、1418、1692、1697の赤外線のうちの少なくとも2つに対応する請求項13に記載の方法。
【請求項15】
前記第1の細胞型が食道癌細胞株OE21であり、前記患者から得られる前記組織試料が、食道癌細胞株OE19、癌関連筋線維芽細胞及び隣接組織筋線維芽細胞のうちの1以上を含み、前記選択される複数の赤外線の波長が、以下の波数(cm
-1)の赤外線:1443、1449、1466、1472、1539、1545、1551のうちの少なくとも2つに対応する請求項13に記載の方法。
【請求項16】
前記第1の細胞型が癌関連筋線維芽細胞であり、前記患者から得られる前記組織試料が、食道癌細胞株OE19、食道癌細胞株OE21、及び隣接組織筋線維芽細胞のうちの1以上を含み、前記選択される複数の赤外線の波長が、以下の波数(cm
-1):1443、1508、1522、1678、1684、1692の赤外線のうちの少なくとも2つに対応する請求項13に記載の方法。
【請求項17】
前記第1の細胞型が隣接組織筋線維芽細胞であり、前記患者から得られる前記組織試料が、食道癌細胞株OE19、食道癌細胞株OE21、及び癌関連筋線維芽細胞のうちの1以上を含み、前記選択される複数の赤外線の波長が、以下の波数(cm
-1):1049、1103、1146、1200、1206、1400、1424、1466、1472の赤外線のうちの少なくとも2つに対応する請求項13に記載の方法。
【請求項18】
前記第1の組織型が食道癌性組織であり、前記患者から得られる前記組織試料が、癌関連間質、バレット組織及びバレット関連間質のうちの1以上を含み、前記選択される複数の赤外線の波長が、以下の波数(cm
-1):1460、1466、1472、1480、1485の赤外線のうちの少なくとも2つに対応する請求項13に記載の方法。
【請求項19】
前記第1の組織型が癌関連間質であり、前記患者から得られる前記組織試料が、食道癌性組織、バレット組織及びバレット関連間質のうちの1以上を含み、前記選択される複数の赤外線の波長が、以下の波数(cm
-1):999、1007、1018、1061、1067、1073の赤外線のうちの少なくとも2つに対応する請求項13に記載の方法。
【請求項20】
前記第1の組織型がバレット組織であり、前記患者から得られる前記組織試料が、食道癌性組織、癌関連間質及びバレット関連間質のうちの1以上を含み、前記選択される複数の赤外線の波長が、以下の波数(cm
-1):1375、1406、1412、1418、1443、1449、1466の赤外線のうちの少なくとも2つに対応する請求項13に記載の方法。
【請求項21】
前記第1の組織型がバレット関連間質であり、前記患者から得られる前記組織試料が、食道癌性組織、癌関連間質、及びバレット組織のうちの1以上を含み、前記選択される複数の赤外線の波長が、以下の波数(cm
-1):1375、1406、1412、1418、1443、1449、1466の赤外線のうちの少なくとも2つに対応する請求項13に記載の方法。
【請求項22】
前記第1の細胞型又は組織型及び前記異なる細胞型又は組織型のうちの少なくとも1つが疾患状態にある細胞型又は組織型であると特定された場合、疾患状態の前記細胞型又は組織型を、前記疾患状態を処置することにおいて有効性を有すると知られている活性薬剤、又は前記疾患状態を処置するための治療用候補であると判定されている薬剤と、インビトロで接触させる工程をさらに備える請求項13から請求項21のいずれか1項に記載の方法。
【請求項23】
コンピュータに請求項1から請求項22のいずれか1項に記載の方法を実行させるように構成されているコンピュータ可読命令を含むコンピュータプログラム。
【請求項24】
請求項23に記載のコンピュータプログラムを格納するコンピュータ可読媒体。
【請求項25】
異なる細胞型又は組織型を判別する赤外線吸収分光法において使用するための、赤外線の波長を選択するためのコンピュータ装置であって、前記コンピュータ装置は、
プロセッサ可読命令を保存するメモリと、
前記メモリに保存された命令を読み取って実行するように構成されているプロセッサと
を含み、
前記プロセッサ可読命令は、前記コンピュータ装置を、請求項1から請求項22のいずれか1項に記載の方法を実行するように制御するように構成されている命令を含むコンピュータ装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、放射線吸収データの分析に、特に異なる細胞型又は組織型から1つの細胞型又は組織型を識別することができる波長を選択する方法に関する。
【背景技術】
【0002】
吸収分光法は、疾患の診断における重要なツールである。例えば、フーリエ変換赤外(FTIR)分光法は、癌の研究に応用される最も成功を収めた赤外イメージング技術のうちの1つである。FTIRから出力された大量のデータセットを分析する公知の方法は、主成分分析及びランダムフォレスト分析等の技術を使用する。これらの技術は、異なる試料を特徴づけるための放射吸収「指紋」の特定を伴う。患者から採取した試料の中の与えられた細胞型又は組織型(例えば癌性の細胞型又は組織型)の存在又は不存在を特定するために使用される場合、これらの技術は、偽陽性を生じ、かつ/又はその細胞型又は組織型の存在を特定し損なうことが知られている。このような不具合は、患者に非常に大きい損害を与える可能性があり、不必要で潜在的に有害な治療が実施され、かつ/又は治療が必要な時に治療が為されなかったりすることを生じる可能性もある。診断の精度を高め、かつ/又は偽陽性の頻度を低下させることが望ましい。先行技術の方法と比べてさほど集約的ではないデータ処理によって高い程度の精度をもたらす吸収スペクトルデータの分析方法を提供することも望ましい。
【0003】
本明細書中で特定されるものであっても別のところで特定されるものであっても先行技術の1以上の課題を取り除くか又は緩和する、吸収分光法において使用するための判別波長を選択する方法を提供することが望ましい。
【発明の概要】
【課題を解決するための手段】
【0004】
本発明は、異なる細胞型又は組織型に対して実施された放射線吸収分光法から得られたデータを分析する。本発明は、異なる細胞型又は組織型に対して識別する放射線吸収指紋が見出される放射線の波長を選択することができる。従って、選択された波長は、別の細胞型又は組織型から1つの細胞型又は組織型を高い程度の精度で判別することができる。本方法の有用性を例証するために、本発明は、さほど集約的ではないデータ処理を使用して、公知の方法よりも高い精度で、4種の異なる細胞型及び4種の異なる組織型を判別することが示された。本発明は、疾患の診断の精度を高めるために使用されてもよい。
【0005】
第1の態様によれば、放射線吸収分光法において使用するための、異なる細胞型又は組織型から第1の細胞型又は組織型を判別することができる放射線の波長を選択する方法であって、上記第1の細胞型又は組織型の複数の異なる空間領域の各空間領域で得られる吸収スペクトルを含む吸収スペクトルの第1組を得て、上記異なる細胞型又は組織型の複数の異なる空間領域の各空間領域で得られる吸収スペクトルを含む吸収スペクトルの第2組を得る工程と、吸収スペクトルの上記第1組に属する各空間領域についての計量値の組を定義し、吸収スペクトルの上記第2組に属する各空間領域についての計量値の対応する組を定義する工程であって、各計量値は、上記与えられた空間領域についての少なくとも2つの異なる波長について吸収された放射線の量に対応する情報を含み、組の中の上記計量値は、波長の異なる組み合わせを含む工程と、各計量値に対して第1数学関数を実施して、各計量値についての特性値を生成する工程であって、上記特性値は、上記計量値に属する上記少なくとも2つの異なる波長の各々において吸収された放射線の量に依存する工程と、上記第1の細胞型又は組織型に属する上記複数の空間領域にわたる、与えられた計量値の上記特性値を含む分布を生成し、上記異なる細胞型又は組織型に属する上記複数の空間領域にわたる、上記同じ与えられた計量値の上記特性値を含む対応する分布を生成し、上記計量値の各々について繰り返す工程と、与えられた計量値についての、上記第1の細胞型又は組織型について生成された上記分布及び上記異なる細胞型又は組織型について生成された上記分布を比較し、上記分布間の類似性の程度を決定し、上記他の計量値の各々についてこの工程を繰り返す工程と、上記計量値に属する上記分布間の類似性の程度に基づいて上記計量値を順位付けする工程であって、より小さい類似性を有する分布に関連する計量値が、より大きい類似性を有する分布と関連する計量値よりも高く順位付けされる工程と、上記より高く順位付けされた計量値と関連する上記放射線の波長を選択する工程を備える方法が提供される。それぞれの吸収スペクトル(すなわち、上記第1の細胞型又は組織型の複数の異なる空間領域の各空間領域で得られる吸収スペクトルを含む吸収スペクトルの第1組、及び上記異なる細胞型又は組織型の複数の異なる空間領域の各空間領域で得られる吸収スペクトルを含む吸収の上記第2組)を得るために使用される細胞又は組織は、通常、患者から得られた試料として提供される。それぞれの第1の組織型及び異なる細胞型又は組織型は、別個に患者から得られたものでもよいし、又はそれらは、患者から得られた単一の細胞又は組織の試料に由来してもよい(例えば、両方の細胞型又は組織型が同じ生検に存在してもよい)。
【0006】
つまり、第1の態様に係る方法は、細胞型若しくは組織型の事前の生物的及び/若しくは化学的な知識を必要とすることなくかつ/又は先入観なしに、上記第1の細胞型又は組織型と上記異なる細胞型又は組織型とを判別する(すなわち識別する)、より高く順位付けされた計量値と関連する放射線の波長を効率よく特定する(すなわち選択する)ための機械学習アプローチを規定する。特に、この機械学習アプローチは、細胞型又は組織型の複数の異なる空間領域から得られる吸収スペクトルについての上記計量値の特性値についての分布を生成して比較し、これにより約1011データポイントを考慮する。対照的に、従来の方法は、せいぜい104~105データポイントを考慮する。このようにして、例えば、このように特定された波長を使用することにより、癌関連線維芽細胞(CAM)は、癌に隣接した正常組織(ATM)からより有効に識別される可能性があり、より早期の診断及び患者の転帰の向上が可能になる可能性がある。
【0007】
第1の態様に係る方法は、有利なことに、1以上の他の細胞型又は組織型から1つの細胞型又は組織型を高い程度の精度で識別するために使用することができる判別波長を提供することが見出されている。ある場合には、当該方法は、公知の技法を使用して見出されなかった診断波長を発見した。当該方法は、食道癌OE19、OE21、癌関連線維芽細胞(CAM)株及び隣接組織線維芽細胞(ATM)株のFTIR画像を約81%~約97%の範囲の精度で判別することが示された。後者の細胞は、形態学的に識別不可能であるが、癌細胞の成長を刺激するその能力において機能的に重要な差異を有することが公知である。第1の態様に係る方法は、同じ患者から採取したCAM細胞及びATM細胞の初めての正確なスペクトル的判別を提供する。当該方法は、癌性組織、癌関連間質(CAS)、バレット(Barrett)組織及びバレット関連間質(BAS)食道癌組織試料のFTIR画像を約69%~約93%の範囲の精度で判別することができる。当該方法は、高い程度の精度及び速度で異なる細胞型及び組織型を判別し、例えばランダムフォレスト法等の公知の方法に対して顕著な利点を有する。特に、細胞型間の迅速で正確な判別が成し遂げられる可能性があり、異なる細胞型を独特に判別する鍵となる波数が特定される可能性がある。第1の態様に係るこの計量値ベースの分析(MA)法は、同じ患者由来の癌間質細胞を識別することについて独特であることが示されている。鍵となる波数は、種々の食道の細胞型及び組織型を判別すると通常判明している波数とは大きく異なる。さらに、第1の態様に係る方法は、腫瘍形成のための微小環境を提供する間質細胞型の判別に基づいて癌の病期決定を可能にする。当該方法は、生物試料で見出される非常に多様な化学結合に起因して、他の細胞型及び組織へと幅広く応用可能であると予想される。
【0008】
上記より高く順位付けされた計量値は、任意の所望の割合の上記順位付けされた計量値を含んでもよい。例えば、より高く順位付けされた計量値は、すべての計量値の上位50%の中に順位付けされた計量値を含んでもよい。実施形態では、より高く順位付けされた計量値は、すべての計量値の上位50%から外れて順位付けされた計量値を何も含まなくてもよい。別の例として、より高く順位付けされた計量値は、すべての計量値の上位30%の中に順位付けされた計量値を含んでもよい。実施形態では、より高く順位付けされた計量値は、すべての計量値の上位30%から外れて順位付けされた計量値を何も含まなくてもよい。さらなる例として、より高く順位付けされた計量値は、すべての計量値の上位10%の中に順位付けされた計量値を含んでもよい。実施形態では、より高く順位付けされた計量値は、すべての計量値の上位10%から外れて順位付けされた計量値を何も含まなくてもよい。より高く順位付けされた計量値は、例えば、すべての計量値の上位5%の中に順位付けされた計量値を含んでもよい。実施形態では、より高く順位付けされた計量値は、すべての計量値の上位5%から外れて順位付けされた計量値を何も含まなくてもよい。
【0009】
計量値は、上記分布間の重なりの面積に従って順位付けされてもよい。計量値は、以下の等式の結果に応じて順位付けされてもよい:
【数1】
【0010】
分布は、確率分布関数として扱われてもよい。計量値は、確率分布関数間の類似性の程度を数量化することにより順位付けされてもよい。1つの好ましい実施形態では、上記確率分布関数間の上記類似性の程度は、上記確率分布関数のパラメータを使用することにより数量化される。
【0011】
一実施形態では、第1の細胞型又は組織型は既知であってもよく、空間領域の第1部分は、分布を生成するために使用されなくてもよい。このような実施形態では、当該方法は、より高く順位付けされた各計量値についての成功率を定義する工程であって、この成功率は、より高く順位付けされた計量値を使用して、上記空間領域の第1部分の中の各空間領域を上記第1の細胞型若しくは組織型又は上記異なる細胞型若しくは組織型のいずれかに割り当てることにより決定される工程と、より高く順位付けされた計量値を使用して正しく割り当てられた、上記空間領域の第1部分の空間領域の数を決定する工程と、上記より高く順位付けされた計量値が、上記空間領域の第1部分の空間領域を、上記第1の細胞型若しくは組織型又は上記異なる細胞型若しくは組織型のいずれかに正しく帰属させる場合の頻度であるとして、より高く順位付けされた計量値の上記成功率を算出する工程とをさらに含んでもよい。成功率は、いずれの計量値について算出されてもよい。成功率は、各計量値について算出されてもよい。波長は、他の計量値よりも高い成功率を有する計量値から選択されてもよい。1つの好ましい実施形態では、波長は、最高の成功率を有する500個の計量値から選択される。実施形態では、波長は、最高の成功率を有する500個の計量値と関連する波長からのみ選択される。実施形態では、最高の成功率を有する500個の計量値と関連する波長のすべてが選択される。波長は、例えば、最高の成功率を有する300個以下の計量値から選択されてもよい。実施形態では、波長は、最高の成功率を有する300個の計量値と関連する波長からのみ選択される。最高の成功率を有する300個の計量値と関連する波長のすべてが選択されてもよい。波長は、例えば、最高の成功率を有する100個以下の計量値から選択されてもよい。実施形態では、波長は、最高の成功率を有する100個の計量値と関連する波長からのみ選択される。最高の成功率を有する100個の計量値と関連する波長のすべてが選択されてもよい。波長は、例えば、最高の成功率を有する50個以下の計量値、40個以下の計量値、30個以下の計量値、20個以下の計量値又は10個以下の計量値から選択されてもよい。実施形態では、最高の成功率を有する50個の計量値と関連する波長のみが選択される。最高の成功率を有する50個の計量値と関連する波長のすべてが選択されてもよい。波長は、最高の成功率を有する5個以下の計量値から選択されてもよい。実施形態では、波長は、最高の成功率を有する5個の計量値と関連する波長からのみ選択される。最高の成功率を有する5個の計量値と関連する波長のすべてが選択されてもよい。
【0012】
選択された波長の判別精度を試験するために上記データのいくつかを残すことは、有利なことに、上記計量値が異なる細胞型又は組織型をどの程度よく判別することができるかの評価を可能にし、従って判別波長を選択するためのより多くの情報を提供する。
【0013】
第1部分の空間領域の各々を、第1の細胞型若しくは組織型又は異なる細胞型若しくは組織型のいずれかに割り当てるために、空間領域の第1部分についての特性値が確率密度関数と比較されてもよい。
【0014】
当該方法は、より高く順位付けされた各計量値について誤標識率を定義する工程であって、この誤標識率は、より高く順位付けされた計量値が上記異なる細胞型又は組織型を第1の細胞型又は組織型であると特定した確率である工程をさらに備えてもよい。この誤標識率は、任意の計量値又は計量値の群について算出されてもよい。誤標識率は、各計量値について算出されてもよい。波長は、他の計量値よりも低い誤標識率を有する計量値から選択されてもよい。波長は、最低の誤標識率を有する500個以下の計量値から選択されてもよい。実施形態では、最低の誤標識率を有する500個の計量値と関連する波長のみが選択される。最低の誤標識率を有する500個の計量値と関連する波長のすべてが選択されてもよい。波長は、最低の誤標識率を有する300個以下の計量値から選択されてもよい。実施形態では、最低の誤標識率を有する300個の計量値と関連する波長のみが選択されてもよい。最低の誤標識率を有する300個の計量値と関連する波長のすべてが選択されてもよい。波長は、最低の誤標識率を有する100個以下の計量値から選択されてもよい。実施形態では、最低の誤標識率を有する100個の計量値と関連する波長のみが選択される。最低の誤標識率を有する100個の計量値と関連する波長のすべてが選択されてもよい。波長は、最低の誤標識率を有す50個以下の計量値、40個以下の計量値、30個以下の計量値、20個以下の計量値又は10個以下の計量値から選択されてもよい。実施形態では、最低の誤標識率を有する50個の計量値と関連する波長のみが選択される。最低の誤標識率を有する50個の計量値と関連する波長のすべてが選択されてもよい。波長は、最低の誤標識率を有する5個以下の計量値から選択されてもよい。実施形態では、最低の誤標識率を有する5個の計量値と関連する波長のみが選択される。最低の誤標識率を有する5個の計量値と関連する波長のすべてが選択されてもよい。
【0015】
誤標識率を定義することは、有利なことに、選択された波長のうちのどれが異なる細胞型又は組織型の判別のためにより正確であるかについてのさらなる情報を提供する。
【0016】
当該方法は、上記算出された成功率及び誤標識率に対して第2数学関数を実施して上記第2数学関数の結果を比較することにより、上記より高く順位付けされた計量値をスコア付けする工程をさらに備えてもよい。任意の計量値又は計量値の群がスコア付けされてもよい。各計量値がスコア付けされてもよい。波長は、他の計量値よりも高いスコアを有する計量値から選択されてもよい。波長は、上位500個にスコア付けされた計量値から選択されてもよい。実施形態では、上位500個にスコア付けされた計量値と関連する波長のみが選択される。波長は、上位300個にスコア付けされた計量値から選択されてもよい。実施形態では、上位300個にスコア付けされた計量値と関連する波長のみが選択される。波長は、上位100個にスコア付けされた計量値から選択されてもよい。実施形態では、上位100個にスコア付けされた計量値と関連する波長のみが選択される。波長は、上位50個にスコア付けされた計量値から選択されてもよい。実施形態では、上位50個にスコア付けされた計量値と関連する波長のみが選択される。波長は、上位5個にスコア付けされた計量値から選択されてもよい。実施形態では、上位5個にスコア付けされた計量値と関連する波長のみが選択される。
【0017】
上記計量値をスコア付けする工程は、有利なことに、選択された波長のうちのどれが異なる細胞型又は組織型の判別のためにより正確であるかに対するさらなる知見を提供する。
【0018】
上記第2数学関数は、下記式であってもよい。
スコア=成功率×(1-誤標識率)
【0019】
この等式は、上記計量値を正確にスコア付けするための第2数学関数として非常に有用であることが見出された。
【0020】
当該方法は、上記より高く順位付けされた計量値の複数の組み合わせについて通算成功率(集計成功率)を決定する工程であって、この通算成功率は、最高位に順位付けされた計量値のうちの2つと関連する上記空間領域の第1部分の割り当てを使用して上記空間領域の第1部分の平均割り当てを決定し、上記平均割り当てが正しい場合の頻度を決定することにより、上記平均割り当てと関連する通算成功率を決定することと、増加する数の上記より高く順位付けされた計量値を使用してこの工程を繰り返すこととによって算出される工程をさらに備えてもよい。通算成功率は、上記計量値の任意のものの複数の組み合わせについて決定されてもよい。通算成功率は、上記計量値のすべての組み合わせについて決定されてもよい。
【0021】
増加する数の計量値について通算成功率を決定することは、有利なことに、異なる細胞型又は組織型の間の判別の精度をさらに向上させるために利用されるべき計量値の総数の概観を提供する。
【0022】
当該方法は、各通算成功率を上記通算成功率を得るために使用された計量値の数と比較する工程、及び上記通算成功率が所望の通算成功率よりも大きい上記計量値と関連する波長のサブグループを選択する工程をさらに備えてもよい。例示的な所望の通算成功率は、例えば70%であってもよい。例示的な所望の通算成功率は、例えば90%であってもよい。
【0023】
上記通算成功率の比較に基づいて波長のサブグループを選択することは、有利なことに、細胞型の最も正確な判別のための好ましい計量値数(使用者によって定義されるとおり)を提供する。使用者は、例えば、上記方法を使用して等しくなるか又は超えるべき所望の通算成功率を選択することにより、計算時間及び判別精度のバランスを選んでもよい。1つの好ましい実施形態では、最高の成功率をもたらすより高く順位付けされた計量値の数が、より大きい判別精度を成し遂げるために使用するための上記好ましい数の計量値と考えられて、上記好ましい数の計量値と関連する波長が選択される。
【0024】
上記第1数学関数は、計量値の放射線の上記少なくとも2つの異なる波長において吸収された放射線の量の比を決定してもよい。
【0025】
計量値の放射線の上記少なくとも2つの異なる波長において吸収された放射線の量の比を決定することは、有利なことに、例えば、上記第1及び第2の吸収スペクトルが得られた対象である上記第1の細胞型又は組織型及び上記異なる細胞型又は組織型の上記試料の厚さ等の測定変数を無用にする。これは、ひいては、判別波長の選択の信頼性を高める。というのも、上記選択に影響を及ぼす望まれない変数がより少なくなるからである。
【0026】
上記分布は、確率分布関数として扱われてもよい。計量値は、確率分布関数間の類似性の程度を数量化することにより順位付けされてもよい。
【0027】
1つの好ましい実施形態では、波長は、最高の順位付けの計量値のうちの約500個以下から選択される。波長は、最高の順位付けの計量値のうちの約300個以下から選択されてもよい。波長は、最高の順位付けの計量値のうちの約100個以下から選択されてもよい。波長は、最高の順位付けの計量値のうちの約50個以下、40個以下、30個以下、20個以下又は10個以下から選択されてもよい。波長は、最高の順位付けの計量値のうちの約5個以下から選択されてもよい。
【0028】
上記第1及び第2の分布を生成するために使用される空間領域の部分は、上記成功率を算出するために使用される上記空間領域の部分よりも大きくてもよい。1つの好ましい実施形態では、上記第1の細胞型又は組織型の画像からの上記空間領域の約75%が上記第1及び第2の分布を生成するために使用され、上記第1の細胞型又は組織型の上記画像からの残りの空間領域が上記成功率を決定するために使用される。これは、当該方法の結果の信頼性を向上させる好ましい「機械学習」アプローチを構成する。
【0029】
吸収スペクトルの上記第1及び第2の組を生成するために使用される放射線の波長は、上記第1の細胞型又は組織型の放射線吸収挙動の既存の知識を使用して選ばれてもよい。これにより、有利なことに、細胞型又は組織型を判別するための有用な情報を何ら提供しないことが知られている吸収スペクトルの領域で時間を消費することが回避される。
【0030】
吸収スペクトルの上記第1及び第2の組は、約900cm-1~約4000cm-1の範囲内から選択される波長を含んでもよい。吸収スペクトルの上記第1及び第2の組は、約1000cm-1~約3000cm-1の範囲内から選択される波長を含んでもよい。1つの好ましい実施形態では、吸収スペクトルの上記第1及び第2の組は、約1000cm-1~約1800cm-1の範囲内から選択される波長を含む。例えば、吸収スペクトルの上記第1及び第2の組は、約1000cm-1~約1800cm-1の範囲で例えば6cm-1間隔で得られたデータを含んでもよい。
【0031】
上記分布はヒストグラムであってもよい。このヒストグラムは、ガウス分布にフィッティングされ(すなわち近似され)てもよい。
【0032】
フィッティングされたガウス分布は確率密度関数として扱われてもよく、上記第1部分の上記空間領域の各々を上記第1の細胞型若しくは組織型又は上記異なる細胞型若しくは組織型のいずれかに帰属させるために、上記空間領域の第1部分についての上記特性値が上記確率密度関数と比較されてもよい。
【0033】
上記第1の細胞型若しくは組織型及び/又は上記異なる細胞型若しくは組織型のうちの少なくとも1つは疾患に罹患した組織であってもよい。この疾患は癌であってもよく、すなわち疾患に罹患した組織は癌性であってもよい。このような実施形態では、他のそれぞれの第1の細胞型若しくは組織型及び/又は異なる細胞型若しくは組織型のうちの少なくとも1つは疾患に罹患した組織であってもよく、例えば当該方法は、患者試料の中の異なるタイプの疾患に罹患した組織を判別することができる。他のそれぞれの第1の細胞型若しくは組織型及び/又は異なる細胞型若しくは組織型のうちの少なくとも1つは健康な組織であってもよく、例えば当該方法は、患者試料の中の疾患に罹患した組織と健康な組織とを判別することができる。
【0034】
上記第1の細胞型又は組織型及びそれぞれの異なる細胞型又は組織型(1種又は複数種)は、疾患に罹患した組織であってよい。この第1の細胞型又は組織型及び異なる細胞型又は組織型は、異なる疾患、又は同じ疾患の異なる病期(ステージ)と関連する組織であってもよい。上記第1の細胞型又は組織型及び異なる細胞型又は組織型のうちの少なくとも1つは、病気に罹患する前の状態、又は疾患状態へと発達するリスク又は疾患を引き起こす(例えば、前癌状態にある細胞型又は組織型)リスクにあると知られている状態にあってもよい。
【0035】
癌
食道癌は、6番目に多い癌死亡率の原因であり、西欧諸国において発生率が最も早く上昇している癌である。食道癌には2つの主要な形態が存在する。1つは扁平上皮癌であり、これは、アジアで最も一般的であり、喫煙及び質の悪い食生活と関連する。他方は腺癌であり、これは、西洋でより一般的であり、酸及び胆汁酸塩の胃食道逆流並びに食道のバレット異形成の前腫瘍状態と関連する。両方の癌は悪性の上皮細胞及び間質からなり、悪性の間質は、癌進行を容易にするために重要である。間質における最も重要な細胞型のうちの1つは、癌成長及び転移を促進する成長因子及びサイトカインを産生する筋線維芽細胞と呼ばれる特殊な線維芽細胞である。食道癌の診断は、ヘマトキシリン及びエオシン(H&E)を用いた染色のあとに、内視鏡検査により得られた切り取られた組織の画像を調べるという標準的なアプローチに従う。これは、検体の核酸及びタンパク質の含有量をそれぞれ青色及び赤色の可視波長でハイライトする。通常、低悪性度の異形成の診断についての観察者間の不一致は、疾患の最も早期の前腫瘍段階の特徴であるが、この不一致は50%超である。この不一致は高悪性度の異形成のより重篤な状態の診断については約15%に低下するが、診断の精度を向上させる必要がある。というのも、偽陽性は、不必要な手技を生じさせる可能性があり、偽陰性は致命的になる可能性があるからである。すべての癌に関して、早期の検出は最良の患者転帰にとって非常に重要であり、癌診断のためのより安価な、より正確で理想的に自動化された方法の必要、並びに異形成及び癌への進行のリスクが最も高いバレット食道を抱える患者の特定の必要がある。
【0036】
組織の画像の波長範囲を広げることはより多くの情報を伝えることになると長い間認識されてきており、特定の赤外(IR)波長と特定の化学部分との関連を活用するために、IR技術を組織の検査に応用することにおいてかなりの進歩がなされてきている。フーリエ変換IR(FTIR)分光法は、癌の研究に応用される最も成功したIRイメージング技術のうちの1つであり、診断ツールへの開発についてかなりの有望性を示している。イメージングFTIRは、通常、約1000個の波長の2次元画像における各画素において情報を与え、各スペクトルが、上記検体に含まれる多数の異なる分子種の多くの励起モードに関する情報を含有する。ほとんどの報告された研究は、これらの大きいデータセットを、より単純な分子システムを用いて可能である個々の振動モードの詳細な帰属のレベルよりはむしろ、主成分分析及び検体を特徴づける「指紋」の特定等の技術を使用して分析してきた。
【0037】
今では、腫瘍形成は、癌細胞によるDNA変異の獲得だけではなく腫瘍の成長及び転移を容易にする適切な細胞微小環境(癌細胞微小環境)も必要とすることは十分に認識されている。炎症細胞及び免疫細胞、微小血管細胞及び線維芽細胞系統の細胞を含めた異なる間質細胞型が、微小環境形成に関与している。筋線維芽細胞は、線維芽細胞の重要なサブセットであり、癌関連線維芽細胞(CAM)は、癌に隣接する巨視的には正常な組織(ATM)から得られる筋線維芽細胞に形態学的には類似しているが、CAMは、そのバイオロジーにおいては著しく異なり、特に癌細胞による攻撃行動の強力な刺激因子である。トランスクリプトーム、プロテオミクス及びmiRNAのプロファイリング研究はすべて、CAMとATMとの間の機能的差異を理解するための基礎を提供してきた。しかしながら、これらの細胞型の迅速かつ正確な特定を可能にする方法について差し迫ったニーズが残っている。というのも、とりわけ、これは、腫瘍形成が起こる細胞微小環境の特定を容易にすると思われるからである。
【0038】
IR技術を食道癌の研究に応用することに関する以前の研究があとで論じられる。この論文では、新規な多変量解析法をFTIRスペクトルに応用することの結果が、2種の食道癌細胞株、OE19及びOE21、並びに食道腺癌患者の間質に由来する2種の食道性筋線維芽細胞株について記載されている。OE19は食道胃接合部からの腺癌に由来し、OE21は食道扁平細胞癌に由来していた。両方ともHPA Culture Collectionsから購入され、これまでに記載されたとおりに維持された。これら2つの筋線維芽細胞株は、同じ患者から入手され以前に特性解析されたCAM及びATMであった。
【0039】
本明細書に記載されるように、第1の態様に係る方法は、すべての4つの細胞型を高精度及び高速度で判別することができる。これは、癌細胞の成長及び浸潤を刺激することにおけるCAM細胞のはるかにより強い能力を考慮すると、CAM細胞及びATM細胞にとって特に重要である。それゆえ、そのデータは、癌細胞の成長を容易にする可能性が最も高い筋線維芽細胞(CAM)の存在を特定することに基づく早期の腫瘍形成についての新しい病期決定方法の実行可能性を支える。早期診断は患者の転帰を向上させるので、このアプローチは明らかな恩恵をもたらすはずである。
【0040】
上記疾患は癌であってもよく、すなわち疾患に罹患した組織は癌性であってもよいし、又は疾患に罹患する前の組織は、癌性になるリスクにあるものであってもよい。上記第1の細胞型又は組織型及び上記異なる細胞型又は組織型のうちの少なくとも1つは癌性であってもよく、例えば第1の細胞型又は組織型及びそれぞれの異なる細胞型又は組織型は癌性であり、例えば癌関連の筋線維芽細胞である。この癌は、食道癌細胞株OE19及び/又はOE21と関連する癌等の食道癌であってもよい。
【0041】
上記疾患は、胃食道逆流症、例えばバレット食道であってもよい。疾患に罹患した組織は、例えばバレット組織又はバレット間質であってもよい。
【0042】
1つの好ましい実施形態では、上記吸収スペクトルの第1及び第2の組は、フーリエ変換赤外分光法を使用して得られる。
【0043】
上記吸収スペクトルの第1及び第2の組は、Mie散乱効果について補正されてもよい。
【0044】
第2の態様によれば、複数の異なる細胞型又は組織型を判別する方法であって、第1の態様又はその関連する選択肢のうちのいずれかに係る方法に従って選択される放射線の波長を使用して、上記複数の異なる細胞型又は組織型に対して吸収分光法を実施する工程と、第1の態様(又はそのいずれかの実施形態)に記載された工程に従って上記複数の細胞型又は組織型についてのそれぞれの特性値を決定する工程と、上記吸収分光法により得られる特性値を、第1の態様又はその関連する選択肢のうちのいずれかに係る方法によって得られる既知の細胞型又は組織型に対応する分布と比較する工程と、上記複数の異なる細胞型又は組織型に対して実施された上記吸収分光法により得られる特性値が上記既知の細胞型又は組織型についての既知の分布に対応するか否かを判定する工程とを備える方法が提供される。それぞれの吸収スペクトルを得るために使用される上記細胞又は組織は、通常、患者から得られた試料として提供される。上記それぞれの第1の組織型及び異なる細胞型又は組織型は、別個に患者から得られたものであってもよいし、又はそれらは患者から得られた単一の細胞又は組織の試料に由来してもよい(例えば、両方の細胞型又は組織型が同じ生検に存在してもよい)。
【0045】
第3の態様によれば、複数の異なる細胞型又は組織型を判別する方法であって、上記複数の異なる細胞型又は組織型について、第1の態様又はその関連する選択肢/実施形態のうちのいずれかに係る方法に従って選択される複数の放射線の波長の各々において吸収される放射線の量に対応する情報を得る工程と、本発明の第1の態様に記載された工程に従って上記複数の細胞型又は組織型のそれぞれの特性値を決定する工程と、上記複数の細胞型又は組織型について上記複数の波長の各々において得られる特性値を、第1の態様又はその関連する選択肢のうちのいずれかに係る方法によって得られる上記選択された波長と関連する既知の細胞型又は組織型に対応する分布と比較する工程と、各それぞれの細胞型又は組織型についての特性値が、既知の細胞型又は組織型についての既知の分布に対応するか否かを判定する工程とを備える方法が提供される。上記それぞれの吸収スペクトルを得るために使用される細胞又は組織は、通常、患者から得られた試料として提供される。上記それぞれの第1の組織型及び異なる細胞型又は組織型は、別個に患者から得られたものであってもよいし、又はそれらは患者から得られた単一の細胞又は組織の試料に由来してもよい(例えば、両方の細胞型又は組織型が同じ生検に存在してもよい)。
【0046】
複数の放射線の波長の各々において吸収される放射線の量に対応する情報を得る工程は、上記複数の異なる細胞型又は組織型に対して放射線分光法を実施する工程を備えてもよい。
【0047】
第4の態様によれば、複数の異なる細胞型又は組織型を含む患者から得られた細胞又は組織の試料における第1の細胞型又は組織型の存在又は不存在を特定する方法であって、第1の態様に係る方法に従って選択される複数の放射線の波長の各々において吸収された放射線の量に対応する情報を得て、本発明の第1の態様に記載された工程に従って上記組織試料の中の上記細胞型又は組織型のうちの1以上についてのそれぞれの特性値を決定する工程と、上記組織試料の中のそれぞれの細胞型又は組織型(すなわちそれぞれの特性値がすでに決定されている細胞型又は組織型)についての上記複数の波長の各々において得られる上記特性値を、上記選択された波長と関連する上記第1の細胞型又は組織型についての対応する既知の分布と比較する工程と、上記組織試料の中の上記細胞型又は組織型についての特性値が、上記第1の細胞型又は組織型についての既知の分布に対応するか否かを判定する工程と、上記組織試料の中の上記細胞型又は組織型についての特性値が、上記第1の細胞型又は組織型についての既知の分布に対応すると判定された場合に、上記第1の細胞型又は組織型の存在を特定し、又は上記組織試料の中の上記細胞型又は組織型についての特性値が、上記第1の細胞型又は組織型についての既知の分布に対応しない場合に、上記第1の細胞型又は組織型の不存在があると判定する工程とを備える方法が提供される。上記それぞれの第1の組織型及び1以上の異なる細胞型又は組織型は、別個に患者から得られたものであってもよいし、又はそれらは患者から得られた単一の細胞又は組織の試料に由来してもよい(例えば両方の細胞型又は組織型が同じ生検に存在してもよい)。
【0048】
上記第1の細胞型又は組織型及び上記異なる細胞型又は組織型のうちの少なくとも1つが疾患に罹患した組織であると特定される場合、当該方法(例えば本発明の第4の態様に記載される方法)は、上記患者において上記特定された疾患を、例えば療法又は外科手術により、例えばその疾患を処置することにおいて有効性を有する1以上の治療薬を患者に投与することにより、すなわち1以上の治療薬が治療上有効量で投与されることにより、処置する工程をさらに含んでもよい。換言すれば、本開示は、患者において疾患を処置する方法であって、第4の態様(又はそのいずれかの実施形態)に係る、複数の異なる細胞型又は組織型を含む患者から得られた細胞又は組織の試料における第1の細胞型又は組織型の存在又は不存在を特定する方法を実施する工程と、上記第1の細胞型又は組織型及び上記異なる細胞型又は組織型のうちの少なくとも1つが疾患状態又は病気に罹患する前の状態にあると特定される場合、上記患者においてそれぞれの疾患を(例えば療法又は外科手術により、例えばその疾患を処置することにおいて有効性を有する1以上の治療薬を患者に、すなわち治療量で投与することにより)処置する工程とを備える方法も提供する。特定された細胞型又は組織型が、病気に罹患する前の状態、又は疾患状態へと発達するリスク又は疾患を引き起こすリスクにあると知られている状態にある細胞型又は組織型(例えば、前癌状態にある細胞型又は組織型)に帰属される場合、当該方法は、上記患者を予防的に処置する(すなわち、その疾患の発症又はさらなる進行を防止しようとして)工程を備えてもよい。いくつかの実施形態では、当該方法は、患者において上記特定された疾患を、例えば外科手術又は療法により処置する工程をさらには含まない。実施形態では、上記第1の細胞型又は組織型及び上記異なる細胞型又は組織型のうちの少なくとも1つが疾患に罹患した組織である場合、当該方法は、病的な細胞型又は組織型を、活性薬剤(例えば治療薬)、例えば上記疾患を処置することにおいて有効性を有すると知られている治療薬、又は上記疾患を処置するための治療用候補であると判定されている薬剤とインビトロで接触させる工程をさらに備えてもよい。
【0049】
一実施形態に従って選択される放射線の波長は、単一の細胞型又は組織型のみを含有する試料における所定の細胞型又は組織型の存在又は不存在を特定するために使用されてもよい。これは、例えば、その組織試料の中のその所定の細胞型又は組織型について上記長の各々において得られる特性値を、選択された波長と関連する上記所定の細胞型又は組織型についての対応する既知の分布と比較することと、その組織試料の中のその所定の細胞型又は組織型についての特性値がその既知の分布に対応するか否かを判定することとによって成し遂げられてもよい。
【0050】
上記の態様及び実施形態では、第1の細胞型又は組織型は食道癌細胞株OE19であってもよい。第1の細胞型又は組織型は食道癌細胞株OE21であってもよい。第1の細胞型又は組織型は癌関連筋線維芽細胞であってもよい。第1の細胞型又は組織型は隣接組織筋線維芽細胞であってもよい。第1の細胞型又は組織型は癌性組織であってもよい。第1の細胞型又は組織型は癌関連間質であってもよい。第1の細胞型又は組織型はバレット組織であってもよい。第1の細胞型又は組織型はバレット関連間質であってもよい。
【0051】
一実施形態では、第1の細胞型は食道癌細胞株OE19であり、患者から得られる組織試料は、食道癌細胞株OE21、癌関連筋線維芽細胞及び隣接組織筋線維芽細胞のうちの1以上を含み(任意に、上記試料はこれらのすべてを含み)、上記選択される複数の放射線の波長は、以下の波数(cm-1)の放射線のうちの少なくとも2つに対応する:1375、1381、1400、1406、1418、1692、1697。
【0052】
あるいは、第1の細胞型は食道癌細胞株OE21であってもよく、上記患者から得られる上記組織試料は、食道癌細胞株OE19、癌関連筋線維芽細胞及び隣接組織筋線維芽細胞のうちの1以上を含み(任意に、上記試料はこれらのすべてを含み)、上記選択される複数の放射線の波長は、以下の波数(cm-1)の放射線のうちの少なくとも2つに対応する:1443、1449、1466、1472、1539、1545、1551。
【0053】
一実施形態では、第1の細胞型は癌関連筋線維芽細胞であり、上記患者から得られる上記組織試料は、食道癌細胞株OE19、食道癌細胞株OE21、及び隣接組織筋線維芽細胞のうちの1以上を含み(任意に、上記試料はこれらのすべてを含み)、上記選択される複数の放射線の波長は、以下の波数(cm-1)の放射線のうちの少なくとも2つに対応する:1443、1508、1522、1678、1684、1692。
【0054】
一実施形態では、第1の細胞型は隣接組織筋線維芽細胞であり、上記患者から得られる上記組織試料は、食道癌細胞株OE19、食道癌細胞株OE21、及び癌関連筋線維芽細胞のうちの1以上を含み(任意に、上記試料はこれらのすべてを含み)、上記選択される複数の放射線の波長は、以下の波数(cm-1)の放射線のうちの少なくとも2つに対応する:1049、1103、1146、1200、1206、1400、1424、1466、1472。
【0055】
一実施形態では、第1の組織型は食道癌性組織であり、上記患者から得られる上記組織試料は、癌関連間質、バレット組織及びバレット関連間質のうちの1以上を含み(任意に、上記試料はこれらのすべてを含み)、上記選択される複数の放射線の波長は、以下の波数(cm-1)の放射線のうちの少なくとも2つに対応する:1460、1466、1472、1480、1485。
【0056】
一実施形態では、第1の組織型は癌関連間質であり、上記患者から得られる上記組織試料は、食道癌性組織、バレット組織及びバレット関連間質のうちの1以上を含み(任意に、上記試料はこれらのすべてを含み)、上記選択される複数の放射線の波長は、以下の波数(cm-1)の放射線のうちの少なくとも2つに対応する:999、1007、1018、1061、1067、1073。
【0057】
一実施形態では、第1の組織型はバレット組織であり、上記患者から得られる上記組織試料は、食道癌性組織、癌関連間質及びバレット関連間質のうちの1以上を含み(任意に、上記試料はこれらのすべてを含み)、上記選択される複数の放射線の波長は、以下の波数(cm-1)の放射線のうちの少なくとも2つに対応する:1375、1406、1412、1418、1443、1449、1466。
【0058】
上記第1の組織型はバレット関連間質であってもよく、上記患者から得られる上記組織試料は、食道癌性組織、癌関連間質、及びバレット組織のうちの1以上を含み(任意に、上記試料はこれらのすべてを含み)、上記選択される複数の放射線の波長は、以下の波数(cm-1)の放射線のうちの少なくとも2つに対応する:1375、1406、1412、1418、1443、1449、1466。
【0059】
第5の態様によれば、コンピュータに第1の態様又はその関連する選択肢のうちのいずれかに係る方法を実行させるように構成されているコンピュータ可読命令を含むコンピュータプログラムが提供される。
【0060】
第6の態様によれば、本発明の第5の態様に係るコンピュータプログラムを格納するコンピュータ可読媒体が提供される。
【0061】
第7の態様によれば、異なる細胞型又は組織型を判別する放射線吸収分光法において使用するための、放射線の波長を選択するためのコンピュータ装置であって、このコンピュータ装置は、プロセッサ可読命令を保存するメモリと、このメモリに保存された命令を読み取って実行するように構成されているプロセッサとを含み、上記プロセッサ可読命令は、上記コンピュータを、第1の態様又はその関連する選択肢のうちのいずれかに係る方法を実行するように制御するように構成されている命令を含むコンピュータ装置が提供される。
【0062】
上記第1の細胞型及び第2の細胞型は、以下の細胞株のうちのいずれか2つから選択されてもよい:食道癌OE19、OE21、癌関連線維芽細胞(CAM)及び隣接組織線維芽細胞(ATM)。
【0063】
上記第1の組織型及び第2の組織型は、以下のうちのいずれか2つから選択されてもよい:癌性組織、癌関連間質(CAS)、バレット組織及びバレット関連間質(BAS)食道癌組織。
【0064】
本明細書に記載されるように、上記患者はいずれの好適な患者であってもよいが、典型的には哺乳動物、好ましくはヒトである。上記患者は、所定の状態(例えば、上記特定された疾患)とすでに診断されていてもよいし、又は判定されるべきそれぞれの状態とは診断されていなくてもよい。
【0065】
実施形態は、これより、添付の図面を参照して例としてのみ説明される。
【図面の簡単な説明】
【0066】
【
図1A】
図1Aは、本発明の一実施形態に係る、放射線吸収分光法において使用するための、異なる細胞型又は組織型から第1の細胞型又は組織型を判別することができる放射線の波長を選択する方法のフローチャートを示す。
【
図1B】
図1Bは、本発明の一実施形態に係る、分布間の類似性の程度を判定する代替の方法のフローチャートを示す。
【
図1C】
図1Cは、本発明の一実施形態に係る、より大きい通算成功率と関連する波長を選択する方法のフローチャートを示す。
【
図2A】
図2A~
図2Dからなる
図2は、本発明の一実施形態に係る方法によりスコア付けされた場合の、各計量値を構成する波数に対してプロットされた各計量値についての相対スコアのグラフを示す。
【
図2B】
図2A~
図2Dからなる
図2は、本発明の一実施形態に係る方法によりスコア付けされた場合の、各計量値を構成する波数に対してプロットされた各計量値についての相対スコアのグラフを示す。
【
図2C】
図2A~
図2Dからなる
図2は、本発明の一実施形態に係る方法によりスコア付けされた場合の、各計量値を構成する波数に対してプロットされた各計量値についての相対スコアのグラフを示す。
【
図2D】
図2A~
図2Dからなる
図2は、本発明の一実施形態に係る方法によりスコア付けされた場合の、各計量値を構成する波数に対してプロットされた各計量値についての相対スコアのグラフを示す。
【
図3A】
図3A~
図3Dからなる
図3は、本発明の一実施形態に係る方法によりスコア付けされた場合の、4つの異なる細胞型についての100個の最良スコアの計量値のグラフを示す。
【
図3B】
図3A~
図3Dからなる
図3は、本発明の一実施形態に係る方法によりスコア付けされた場合の、4つの異なる細胞型についての100個の最良スコアの計量値のグラフを示す。
【
図3C】
図3A~
図3Dからなる
図3は、本発明の一実施形態に係る方法によりスコア付けされた場合の、4つの異なる細胞型についての100個の最良スコアの計量値のグラフを示す。
【
図3D】
図3A~
図3Dからなる
図3は、本発明の一実施形態に係る方法によりスコア付けされた場合の、4つの異なる細胞型についての100個の最良スコアの計量値のグラフを示す。
【
図4】
図4は、本発明の一実施形態に係る方法を介して算出された場合の、
図2及び
図3に関して論じられた4つの細胞型についての通算成功率のグラフを示す。
【
図5】
図5は、
図2~
図4の4つの細胞についての、5つの上位スコアの計量値に属する波長の相対重要性の4つのグラフを示す。
【
図6】
図6は、本発明の一実施形態に係る方法を介して算出された場合の、4つの異なる組織型についての通算成功率のグラフを示す。
【
図7】
図7は、本発明の一実施形態に係る方法によりスコア付けされた場合の、
図6の4種の細胞についての、5つの上位スコアの計量値に属する波長の相対重要性の4つのグラフを示す。
【
図8A】
図8Aは、すべての波長にわたって積算されたOE19細胞(約5000)のFTIR画像を示す。
【
図8B】
図8Bは、OE19(緑色の線)、OE21(赤色の線)、CAM(紫色の線)及びATM(青色の線)についての全画素にわたる平均FTIRスペクトルを示す。
【
図9】
図9は、スペクトルプロファイルの比較を示す。領域1000~1200cm
-1における(a)OE19(緑色の線)、(b)OE21(赤色の線)CAM(紫色の線)及び(d)ATM(青色の線)についての平均スペクトル。ヒストグラムは、最適の計量値数について、CAM細胞(紫色)とATM細胞(青色)とを判別する上で重要であると分かっている波数を示す。
【
図10A】
図10Aは、OE19についての標準偏差を伴う平均スペクトルについてのスペクトル標準偏差を示す。
【
図10B】
図10Bは、OE21についての標準偏差を伴う平均スペクトルについてのスペクトル標準偏差を示す。
【
図10C】
図10Cは、CAMについての標準偏差を伴う平均スペクトルについてのスペクトル標準偏差を示す。
【
図10D】
図10Dは、ATMについての標準偏差を伴う平均スペクトルについてのスペクトル標準偏差を示す。
【発明を実施するための形態】
【0067】
フーリエ変換赤外分光法(FTIR)は、試料をある範囲の放射線の波長で照射し、その試料が各放射線の波長をどのように十分吸収するかを測定することを伴う。試料の中の異なる化学結合は、異なる放射線の波長を異なる量だけ吸収する。生物試料は、通常、実に様々な異なる化学結合を含有する。本発明は、異なる細胞型又は組織型が異なる波長において放射線を吸収する様子の差異を分析することにより、異なる生物学上の細胞型又は組織型の判別を可能にする。FTIRは、通常、数1000波長にわたる試料の放射線吸収挙動に関する情報をもたらす。生物試料のFTIR測定は、例えば、その試料の2次元画像であって、その画像の各画素が、生物試料に含有される多数の異なる化学結合の多くの励起モードに関する情報を含む吸収スペクトルを含む2次元画像を出力してもよい。
【0068】
図1Aは、本発明の一実施形態に係る、放射線吸収分光法において使用するための、異なる細胞型又は組織型から第1の細胞型又は組織型を判別することができる放射線の波長を選択する方法のフローチャートを示す。手短に言えば、当該方法は、S1において、吸収スペクトルを得る工程;S2において、一組の計量値を定義する工程;S3において、上記計量値に対して数学関数を実行する工程;S4において、上記計量値の分布を生成する工程;S5において、上記分布間の類似性の程度を決定する工程;S6において、上記分布間の類似性の程度に基づいて、上記計量値を順位付けする工程;及びS7において、より高く順位付けされた計量値と関連する波長を選択する工程を備える。
【0069】
図1Aの方法における第1工程S1は、吸収スペクトルを得る工程を備える。第1組の吸収スペクトルが第1の細胞型又は組織型について得られ、第2組の吸収スペクトルが異なる細胞型又は組織型について得られる。第1組の吸収スペクトルは、第1の細胞型又は組織型の複数の異なる空間領域の各空間領域で得られる吸収スペクトルを含む。第2組の吸収スペクトルは、異なる細胞型又は組織型の複数の異なる空間領域の各空間領域で得られる吸収スペクトルを含む。
【0070】
空間領域は、例えば、第1の細胞型若しくは組織型又は異なる細胞型若しくは組織型の画像の画素であってもよい。例えば、第1工程S1は、第1の細胞型又は組織型及び異なる細胞型又は組織型の各々についてのFTIRデータキューブと呼ばれてもよいものを取得することを含んでもよい。FTIRデータキューブは、上記細胞型又は組織型のうちの1つの画像を含んでもよい。この画像は、データキューブの第1次元に沿った第1の数(i)の画素及びデータキューブの第2次元に沿った第2の数(j)の画素を含んでもよく、この第1次元は第2次元と直交している。例えば、画像の全体サイズ(i×j)は、約5000画素以下、例えば約5000画素を含んでもよい。データキューブの第3次元は、第1次元及び第2次元の両方と直交している。この第3次元は、上記画像の各画素におけるFTIRスペクトルを含み、このFTIRスペクトルはkデータポイントを有する。例えば、第3次元は、約900cm-1~約4000cm-1の波長範囲にわたる吸収スペクトルを含んでもよい。吸収スペクトルのデータポイントkは、波長範囲にわたって区間幅、例えば約2cm-1の幅において存在してもよい。各吸収スペクトルは、Mie散乱効果について補正されてもよい。このFTIRデータキューブは、各画素が細胞型又は組織型の吸収スペクトルであってこの吸収スペクトルがkデータポイントを有するi×j画素を含む細胞型又は組織型の画像であると理解されてもよい。
【0071】
図1Aに示される方法における第2工程S2は、一組の計量値を定義する工程を備える。一組の計量値は、吸収スペクトルの第1組に属する第1の細胞型又は組織型の各空間領域について定義される。計量値の対応する組は、吸収スペクトルの第2組に属する異なる細胞型又は組織型の各空間領域について定義される。各計量値は、与えられた空間領域についての少なくとも2つの異なる波長について吸収された放射線の量に対応する情報を提供する少なくとも2つの数値入力を含む。つまり、各細胞型又は組織型は、異なる放射線の波長において細胞型又は組織型によって吸収された放射線の量と関連する計量値の算出を介して、吸収スペクトルにわたってパラメータ化される。与えられた組の中の計量値は、放射線の波長の異なる組み合わせを含む。つまり、2つの数値入力からなる計量値について、第1数値入力は第1波長において吸収された放射線の量(Aλ
1)であってもよく、第2数値入力は異なる波長において吸収された放射線の量(Aλ
2)であってもよい。この計量値は、より大きい数の数値入力、例えば3つの数値入力を含んでもよい。計量値は、スペクトル範囲内の波長対のすべての可能な組み合わせが与えられた計量値の組の内に含まれるように、定義されてもよい。例えば、計量値は、約1000cm
-1~約1800cm
-1の範囲内の6cm
-1の区間幅で生じるすべての可能な波長対が含まれるように、定義されてもよい。他のスペクトル範囲及び/又は他の区間幅が使用されてもよい。第1の細胞型又は組織型が既知である場合、使用されるスペクトル範囲は、第1の細胞型又は組織型の放射線吸収挙動の既存の知識を使用して選択されてもよい。つまり、スペクトル範囲は、使用される波長の少なくともいくつかが第1の細胞型又は組織型と特定可能な態様で相互作用すると既知であるように、選択されてもよい。
【0072】
図1Aに示される方法における第3工程S3は、各計量値に対して数学関数を実行する工程を備える。第1数学関数は、各計量値についての特性値を生成するように、各計量値の少なくとも2つの入力に対して作用する。つまり、第1数学関数の結果は、その特定の計量値と関連することができる特性値である。第1数学関数の結果(すなわち、特性値)は、計量値に属する少なくとも2つの異なる波長の各々において吸収された放射線の量に依存する。例えば、第1の細胞型又は組織型の与えられた空間領域についての与えられた計量値は、1750cm
-1の波長において吸収された放射線の量(例えばX)及び1100cm
-1の波長において吸収された放射線の量(例えばY)を含んでもよい。第1数学関数はX及びYに作用して、X及びYの両方に依存する結果を生成する。この結果は、その計量値の特性値としてその計量値に帰属される。
【0073】
第1数学関数は、例えば、計量値の少なくとも2つの異なる波長において吸収された放射線の量の比を決定してもよい。計量値の少なくとも2つの異なる波長において吸収された放射線の量の比を決定することは、有利なことに、吸収スペクトル測定変数、例えば上記第1及び第2の吸収スペクトルが得られた対象である第1の細胞型又は組織型及び異なる細胞型又は組織型の試料の厚さ等を無用にする。第1数学関数は、比以外の何かを決定してもよい。例えば、第1数学関数は、与えられた計量値の少なくとも2つの異なる波長において吸収された放射線の量の差を決定してもよい。
【0074】
可能な波長の対の多く又はすべてが考慮されるように計量値を定義することは、
図1Aの方法がすべての吸収スペクトルデータを平等に扱うということを意味する。つまり、いずれの特定の放射線の波長においても生物学的意義は与えられない。仮定した重要性を置かないというこのスタートから、当該方法は、公知の方法を使用しては特定されていない放射線の波長を使用して、第1の細胞型又は組織型と異なる細胞型又は組織型とを判別するために使用することができるバイオマーカー(すなわち明確に異なる指紋)の存在を明らかにすることができる。
【0075】
図1Aの方法における第4工程S4は、上記計量値についての分布を生成する工程を備える。与えられた細胞型又は組織型のあらゆる空間領域についての第1数学関数の結果を含む分布が各計量値について生成される。つまり、与えられた計量値(すなわち異なる放射線の波長における吸収情報の与えられた組み合わせ)が、与えられた細胞型又は組織型の複数の異なる空間領域の各々について存在する。与えられた計量値についての特性値は、与えられた細胞型又は組織型の異なる空間領域の間で変わってもよい。従って、各計量値は、それ自身の、第1数学関数の結果の分布を有してもよい。上記特性値は、例えば、その細胞型又は組織型の異なる領域にわたる細胞型又は組織型の構造差及び/又は分子組成の差に起因して、与えられた細胞型又は組織型の異なる空間領域の間で変わってもよい。各分布は、与えられた計量値についての与えられた細胞型又は組織型に属する複数の異なる空間領域にわたる第1数学関数の結果を含む。この分布は、例えばヒストグラムであってもよい。各ヒストグラムは、それらをガウス分布として扱うことにより正確に記述され分析されてもよい。
【0076】
図1Aの方法における第5工程S5は、分布間の類似性の程度を決定する工程を備える。第1の細胞型又は組織型に属する与えられた計量値についての分布は、異なる細胞型又は組織型に属する対応する計量値の分布と比較される。分布間の類似性の程度が決定される。
【0077】
分布間の類似性の程度を決定することは、複数の異なる方法で成し遂げられてもよい。
図1Bは、本発明の一実施形態に係る、分布間の類似性の程度を決定する工程の代替の方法のフローチャートを示す。
図1Bからわかるように、
図1Aの方法の第5工程S5は、複数の異なる方法で実施されてもよい。例えば、第1の方法は、分布間の重なりの面積を決定する第1下位工程S5Aを備える。分布の全体面積が、分布間の重なりの面積と比較されてもよい。より大きい重なりの面積を有する分布が、より小さい重なりの面積を有する分布よりもより類似していると考えられてもよい。
【0078】
あるいは、第2の方法は、上記分布を確率分布関数として扱う第1下位工程S5Bを備える。つまり、分布は、確率分布関数であるとして数学的に扱われてもよく、その確率分布関数間の類似性の程度は、確率分布関数のパラメータを比較することにより決定されてもよい。確率分布関数のパラメータは、例えば、その確率分布関数の平均値及び/又は標準偏差を含んでもよい。特徴的なパラメータを有する確率分布は、似たパラメータを有する確率分布関数よりも類似性が低いと考えられてもよい。
【0079】
別の選択肢として、分布はガウス分布であるとして近似されてもよく、そのガウス分布のパラメータは、互いに比較されて、分布間の類似性の程度が決定されてもよい。第5工程S5は、第1の細胞型又は組織型と上記異なる細胞型又は組織型との間の類似性の程度があらゆる計量値について既知であるように、上記計量値の各々について繰り返される。次いで、計量値は、確率分布関数間の類似性の程度を数量化することにより順位付けされてもよい。
【0080】
図1Aを再度参照して、当該方法における第6工程S6は、上記計量値に属する分布間の類似性の程度に基づいて上記計量値を順位付けする工程を備える。上記計量値は、より少ない類似性の程度を有する分布と関連する計量値がより大きい類似性の程度を有する分布よりも高く順位付けされるように、順位付けされる。つまり、特徴的な分布を生成する計量値は、似た分布を生成する計量値よりも高く順位付けされる。上記計量値を順位付けする工程は、いくつかの方法で成し遂げられてもよい。例えば、(
図1Bに示される第1下位工程S5Aにおけるように)分布の全体面積を分布間の重なりの面積と比較するとき、計量値を順位付けするために以下の等式が使用されてもよい。
【数2】
【0081】
図1Bを参照して、
図1Bに示される第1の方法の第2下位工程S6Aは、分布間の重なりの面積に従って上記計量値を順位付けする工程を備える。2つの与えられた分布の間の重なりの面積が大きいほど、それらの分布はより類似している。従って、それら2つの分布と関連する上記計量値については、順位付けが低くなる。他方、2つの与えられた分布の間の重なりの面積が小さいほど、それらの分布の類似性はより少なくなる。従って、それら2つの分布と関連する上記計量値については、順位付けが高くなる。
【0082】
上で論じたように、上記計量値を順位付けする工程の代替の方法は、分布を確率分布関数として数学的に扱うこと、及びその確率分布関数の特徴的なパラメータを有する確率分布関数を順位付けすることを含む。
図1Bに示される第2の方法の第2下位工程S6Bは、確率分布関数のパラメータを使用して上記計量値を順位付けする工程を備える。確率分布関数のパラメータは、例えば、確率分布関数の平均値及び/又は標準偏差を含んでもよい。上記パラメータは、確率分布関数の間の類似性の程度を決定するために使用されてもよい。上記パラメータは、与えられた結果が別の確率分布関数ではなくある1つの確率分布関数に属する確率を決定するために使用されてもよい。これは、
図1Cを参照して以降でより詳細に論じられる。
【0083】
上記分布はガウス分布であるとして近似されてもよく、特徴的なパラメータを有するガウス分布と関連する計量値は、類似のパラメータを有するガウス分布と関連する計量値よりも高く順位付けされてもよい。それらのガウス分布のパラメータは、例えば、ガウス分布の平均値及び/又は標準偏差を含んでもよい。上記パラメータは、近似されたガウス分布間の類似性の程度を決定するために使用されてもよい。例えば、上記パラメータは、ガウス分布間の重なりの面積を決定するために使用されてもよい。あるいは、上記ガウス分布は、確率分布関数として扱われてもよく、上記確率分布関数のパラメータは、確率分布関数の間の類似性の程度を決定するために使用されてもよい。
【0084】
図1Aを再度参照して、当該方法における第7工程S7は、より高く順位付けされた計量値と関連する放射線の波長を選択する工程を備える。上で論じたように、上記計量値は、それらに関連する分布がどれほど明確に異なるかに応じて順位付けされ、最高位に順位付けされた計量値は、最も明確に異なる分布を生成する。2つの分布がより明確に異なるほど、それらの分布を生成した計量値と関連する放射線の波長において、第1の細胞型又は組織型と異なる細胞型又は組織型との間により大きい吸収挙動の差が存在する。従って、より高く順位付けされた計量値は、細胞型又は組織型を照射するために使用されるとき細胞型又は組織型の吸収挙動においてより大きい差を生じる放射線の波長を含む。つまり、最高位に順位付けされた計量値と関連する放射線の波長における第1の細胞型又は組織型の吸収挙動は、任意の他の計量値と関連する放射線の波長における吸収挙動と比べるとき、それらの放射線の波長における上記異なる細胞型又は組織型の吸収挙動に対し最大の差を有する。第1の細胞型又は組織型と異なる細胞型又は組織型との間の吸収挙動の差が、第1の細胞型又は組織型と異なる細胞型又は組織型とを判別するために使用される。より高く順位付けされた計量値は、第1の細胞型又は組織型を異なる細胞型又は組織型から判別することができる、放射線吸収分光法において使用するための放射線の波長を含む。
【0085】
図1Cは、一実施形態に係る、より大きい通算成功率と関連する波長を選択する方法のフローチャートを示す。第7工程S7は、1以上の下位工程S7A~S7E、例えばこれらの追加の工程のすべてを含んでもよい。下位工程S7A~S7Eは、第1の細胞型又は組織型の実体(素性)が既知である場合に実施されてもよい。
【0086】
手短に言えば、第7工程S7は、S7Aにおいて、上記計量値について成功率を定義する工程、S7Bにおいて、上記計量値について誤標識率を定義する工程、S7Cにおいて、上記計量値をスコア付けする工程、S7Dにおいて、上記計量値の組み合わせについて通算成功率を決定する工程、及び/又はS7Eにおいて、より大きい通算成功率と関連する波長を選択する工程という1以上の下位工程を含んでもよい。
【0087】
図1Cの方法の第1下位工程S7Aは、より高く順位付けされた各計量値についての成功率を定義する工程を備える。この成功率は、あらゆる計量値について定義されてもよい。成功率は、与えられた吸収スペクトルが第1の細胞型又は組織型及び異なる細胞型又は組織型に属するかを与えられた計量値が正しく特定する場合の頻度を評価するように構成されている。成功率を定義するために、第1の細胞型又は組織型に属する空間領域の第1部分は、各計量値についての分布を生成するためには使用されない。代わりに、その空間領域の第1部分は、各計量値が第1の細胞型又は組織型と異なる細胞型又は組織型とをどのくらい正確に判別することができるかを試験するために使用される。空間領域の第1部分は、空間領域の残りの部分よりも小さくてもよい。例えば、上記空間領域の第1部分は、空間領域の総数の約25%を占めてもよく、他方で空間領域の残りの部分は、空間領域の総数の約75%を占めてもよい。しかしながら、他の比率が想定される。より高く順位付けされた計量値は、空間領域の第1部分に属する各空間領域を第1の細胞型若しくは組織型又は異なる細胞型若しくは組織型のいずれかに割り当てるために使用される。つまり、より高く順位付けされた計量値は、空間領域の第1部分の各空間領域が第1の細胞型若しくは組織型又は異なる細胞型若しくは組織型に属するか否かを予測するために使用される。各計量値は、空間領域の第1部分の各空間領域が第1の細胞型若しくは組織型又は異なる細胞型若しくは組織型に属するか否かを予測するために使用されてもよい。
【0088】
試験結果を生成するために、成功率は、第1の細胞型又は組織型の空間領域の第1部分に属する空間領域の各々について、与えられた計量値に対して上記第1数学関数を実行することにより定義されてもよい。試験結果は、第1の細胞型又は組織型及び異なる細胞型又は組織型に属する対応する分布(すなわち、与えられた計量値と関連する分布)と比較される。この比較は、試験結果が第1の細胞型若しくは組織型又は異なる細胞型若しくは組織型のいずれに属するかを予測するために使用される。第1の細胞型又は組織型の実体は既知であるので、その試験結果によってなされる予測は検証されてもよく、与えられた計量値についての成功率は、予測が正しい場合の頻度として定義されてもよい。一般に、成功率を定義することは、より高い順位付けの計量値を使用して正しく割り当てられた第1部分の空間領域の数を決定することを含む。成功率は、任意の計量値について算出されてもよい。例えば、成功率は、各計量値について算出されてもよい。成功率は、少なくとも、より高く順位付けされた計量値について算出されてもよい。上記計量値について成功率を定義することは、有利なことに、計量値が細胞型又は組織型をどれほど良好に判別することができるかを評価する。成功率は、選択された放射線の波長が細胞型又は組織型を判別する上でどれほど正確であるかを明らかにする。
【0089】
分布が確率密度関数として数学的に扱われる場合、第1の細胞型又は組織型の空間領域の第1部分に属する複数の空間領域についての試験結果は、確率密度関数から、上記第1の細胞型又は組織型に属する空間領域の第1部分の各々の確率を抽出するために使用されてもよい。次いで、この空間領域は、最高の関連する確率を有する細胞型又は組織型のいずれに属するか予測される。第1の細胞型又は組織型の実体は既知であるので、次いで、この予測は検証されてもよく、与えられた計量値についての成功率は、与えられた計量値が空間領域の第1部分の実体を正しく予測した頻度として算出されてもよい。細胞型又は組織型のうちの1つに属する空間領域の抽出された確率は、その細胞型又は組織型についての信頼値と呼ばれることがある。
【0090】
図1Cの方法の第2下位工程S7Bは、上記計量値について誤標識率を定義する工程を備える。誤標識率は、あらゆる計量値について決定されてもよい。誤標識率は、少なくとも、より高い順位付けの計量値について決定されてもよい。誤標識率は、上記計量値が異なる細胞型又は組織型を第1の細胞型又は組織型であると間違って特定した確率を表す。この計量値は、第1の細胞型又は組織型に属する空間領域がどの細胞型又は組織型に属するかを予測するために使用される。その計量値と関連する確率密度関数から抽出された、その計量値が第1の細胞型又は組織型(すなわち正しい細胞型又は組織型)に属する確率は、その計量値についての成功率に相当する。その計量値は、次いで、異なる細胞型又は組織型に属する空間領域がどの細胞型又は組織型に属するかを予測するために使用される。その計量値と関連する確率密度関数から抽出された、その計量値が第1の細胞型又は組織型(すなわち正しくない細胞型又は組織型)に属する確率は、その計量値についての誤標識率に相当する。計量値について誤標識率を定義することは、有利なことには、関連する波長のうちのどれが第1の細胞型又は組織型と異なる細胞型又は組織型とを判別するために最も正確であるかについてのさらなる情報を提供する。
【0091】
図1Cの方法における第3下位工程S7Cは、上記計量値をスコア付けする工程を備える。各計量値がスコア付けされてもよい。少なくとも、より高い順位付けの計量値がスコア付けされてもよい。計量値は、算出された成功率及び誤標識率に対して第2数学関数を実施することによりスコア付けされてもよい。次いで、計量値は、第2数学関数の結果に従ってスコア付けされてもよい。計量値が受け取るスコアは、その計量値が細胞型を正確に判別する能力に相当する。上記第2数学関数は、例えば、以下の等式であってもよい。
スコア=成功率×(1-誤標識率)
【0092】
すでに論じたように、成功率は、与えられた細胞型が正しく標識される割合であり、誤標識率は、他の細胞型(1又は複数)が与えられた細胞型として間違って標識される割合である。
【0093】
本発明の有効性を例示するために、上記第2数学関数が4つのFTIRデータキューブに対して実行された。第1FTIRデータキューブは食道癌関連線維芽細胞(CAM)細胞株から得られた。第2FTIRデータキューブは隣接組織線維芽細胞(ATM)細胞株から得られた。第3FTIRデータキューブは食道癌OE19細胞株から得られた。第4FTIRデータキューブは食道癌OE21細胞株から得られた。
図2A~
図2Dからなる
図2は、各計量値を構成する波数に対してプロットされた各計量値についての相対スコアのグラフを示す。
図2Aは、OE19細胞株についての上記計量値の相対スコアを示す。
図2Bは、OE21細胞株についての上記計量値の相対スコアを示す。
図2Cは、CAM細胞株についての上記計量値の相対スコアを示す。
図2Dは、ATM細胞株についての上記計量値の相対スコアを示す。
図2の例では、赤色はより高いスコアを示し、他方、青色はより低いスコアを示す。
図2からわかるように、各細胞型が独特の挙動(すなわち低い類似性の程度)を呈するスペクトルの領域は様々である。CAM及びATM細胞株については、それぞれ
図2C及び
図2Dのグラフにおいて非常に異なる挙動が見られる。これは、これらの2つの細胞型の間で成し遂げられる明確な判別を際立たせる。これは意義深い結果である。というのも、組織病理学者は、H&E染色された試料に対して光学顕微鏡法という現在の標準的な方法を使用してこれらの細胞型を識別することは困難であるとわかっているからである。例えば、CAM細胞株(
図2C)に関しては、高くスコア付けされた計量値は、約1750cm
-1の少なくとも1つの高波数を含む計量値である。ATM(
図2D)については反対の状況が認められ、高くスコア付けされた計量値は、約1150cm
-1の少なくとも1つの低波数と関連することが多い。
【0094】
図3A~
図3Dからなる
図3は、CAM、ATM、OE19及びOE21の細胞株について、第2数学関数の結果に従って100個の最良スコアの計量値のグラフを示す。
図3Aは、OE19細胞株についての100個の最良スコアの計量値を示す。
図3Bは、OE21細胞株についての100個の最良スコアの計量値を示す。
図3Cは、CAM細胞株についての100個の最良スコアの計量値を示す。
図3Dは、ATM細胞株についての100個の最良スコアの計量値を示す。
図3の例では、各計量値は、2つの異なる放射線の波長からなっていた。それゆえ、各計量値は、
図3のグラフ上で2種類の丸(特に、それぞれ白丸及び対応する黒丸)として表され、各丸が上記計量値の波数(すなわち波長の逆数)のうちの1つに対応する。
図3は、使用される放射線の波数の組み合わせを、増加する計量値番号1~100の関数として図示する。
図3Aは、その計量値の拡大された領域を示し、明確さのために白丸及び対応する黒丸を示す。
図3のマンハッタンプロット(Manhattan plot)は、各々、最良の100個の計量値を示す。このプロットは、計量値番号Nによって標識された横の列に示される丸(すなわち白丸及び対応する黒丸)は最良のN個の計量値についての丸であるという点で、累積的である。例えば、最良の計量値(すなわちトップの計量値、計量値番号N=1)については、従って、このプロットのまさにトップに、この最良の計量値についての各波数について1つ、すなわち2種類の丸がある。次の下の列の計量値番号N=2については、このプロットは累積的であるので、最良の2つの計量値(すなわち上位2つの計量値)について各計量値について2つ、すなわち4つの丸がある。3列目には、最良の2つの計量値(すなわち上位3つの計量値)について各計量値について2つ、すなわち6つの丸がある、などである。従って、計量値番号Nについて示される波数は、計量値番号N+1についても示される必要があるが、計量値番号N+1について、計量値番号Nと比べて多くとも2つの追加の波数が示されてもよい。なお、いくつかの波数は1つの計量値番号から次の計量値番号へ同じであってもよく、そのため、いくつかの丸は重なっている。つまり、上位100個の計量値の中で、例えば、その計量値についてのすべての波数が独特(ユニーク)であるとは限らない。むしろ、いくつかの波数は2以上の計量値の間で共通である。例えば、
図3Aから、計量値番号1について、2つの独特の波数について2つの丸が示されており、他方で、計量値番号N=100については、(100個の最良の計量値についてすべての波数が独特であるならば200個の丸であるが、そうではなくて)56個の独特な波数について約56個の丸が示されている。
【0095】
図3のグラフの明確に異なる形態から、これらの4つの細胞型の判別のために選択される波長に有意差があるということは明らかである。例えば、それぞれCAM細胞及びATM細胞についての
図3C及び
図3Dのグラフにおいて非常に異なる挙動が見られる。これらの差は、これらの2つの細胞型の間で
図1Aの方法により成し遂げられる明確な判別を際立たせる。例えば、
図3Cは、CAMをATM、OE19及びOE21から判別するためのより高くスコア付けされた計量値は、約1750cm
-1に少なくとも1つの波数を含む計量値であることを示す。対照的に、
図3Dは、ATM細胞株については異なる状況が見出され、より高くスコア付けされた計量値は約1150cm
-1の少なくとも1つの比較的低波数と関連することが多いことを示す。これは、意義深い結果である。というのも、組織病理学者は、ヘマトキシリン及びエオシンで染色された試料に対して光学顕微鏡法を実施するという公知の方法を使用してこれらの細胞型を識別することは困難であるとわかっているからである。
【0096】
第2数学関数は、上で論じたもの以外の形態をとってもよい。さらなる例として、第2数学関数は、以下の等式のいずれであってもよい。
スコア=成功率×信頼値
スコア=(成功率)2×信頼値
スコア=成功率×(信頼値)2
スコア=(成功率)2×(信頼値)2
スコア=成功率×(1-誤標識率)2
【0097】
1つの好ましい実施形態では、第2数学関数は以下の等式である。
スコア=成功率×(1-誤標識率)2
【0098】
図1Cの方法における第4下位工程S7Dは、上記計量値の組み合わせについて通算成功率を決定する工程を備える。通算成功率は、上記計量値のあらゆる組み合わせについて算出されてもよい。通算成功率は、少なくとも、より高い順位付けの計量値、例えば上位500まで、上位400まで、上位300まで、上位200まで、上位100まで、又は上位50まで、上位40まで、上位30まで、上位20まで、上位10まで、又は上位5までに順位付けされた計量値の組み合わせについて算出されてもよい。通算成功率は、最高位に順位付けされた計量値のうちの2つと関連する空間領域の第1部分の割り当てを使用してその空間領域の第1部分の平均割り当てを決定することにより、算出されてもよい。次いで、平均割り当てと関連する通算成功率が、上記平均割り当てが正しい場合の頻度を決定することにより決定されてもよい。この工程は、増加する数の上記より高く順位付けされた計量値を使用して繰り返されてもよい。複数のより高く順位付けされた計量値を使用した細胞型又は組織型の間の判別は、有利なことに、与えられた細胞型又は組織型内のランダムノイズ及び吸収スペクトルの小さなばらつきに対する当該方法の感度を低下させる。通算成功率を決定することは、有利なことに、細胞型又は組織型の判別についての最良の全体的な成功率を与えるために使用されるべき計量値の好ましい数の概観を与える。
【0099】
通算成功率は、通算成功率を生成するために使用される計量値の数の関数としてプロットされてもよく、この通算成功率は、第1の細胞型又は組織型と異なる細胞型又は組織型との判別の向上を成し遂げるために必要とされる好ましい計量値数を示す。最高の成功率をもたらすより高く順位付けされた計量値の数は、最大の判別精度を成し遂げるために使用するべき計量値の好ましい数であると考えられてもよい。しかしながら、実用目的からは、最高の成功率を与えるために必要とされる数未満のいくつかのより高い順位付けの計量値を使用することが望ましい場合がある。これは、例えば、より少ない計量値数でありながらも与えられた目的のためには十分高い判別精度の程度を提供する場合である可能性がある。これは、好適な程度の精度をより短時間で及び/又はより少ない計算労力で提供するという利点を有することになる。
【0100】
図4は、
図2及び
図3に関して論じられた4つの細胞型についての通算成功率のグラフを示す。このグラフは、各細胞型について、
図1Cの方法の第4下位工程S7Dにおいて使用されるより高く順位付けされた計量値の数の増加とともに通算成功率がどのように変わるかを示す。異なる細胞型について異なる変化が明らかにされている。例えば、ATM細胞株についての通算成功率は、24個の計量値までは使用される計量値の数とともに上昇し、その後低下する。対照的に、OE19についての通算成功率は、少ない計量値数については高く、そしてより多くの計量値が含まれるにつれて低下する。各細胞型について、判別のために使用されるべき好ましい数のより高く順位付けされた計量値は、最大通算成功率の位置によって決定されてもよい。
【0101】
図1Cの方法における第5下位工程S7Eは、より大きい通算成功率と関連する波長を選択する工程を備える。少なくとも最大通算成功率と関連する波長が選択されてもよい。より大きい通算成功率と関連する波長を選択することは、各通算成功率を、その通算成功率を得るために使用された計量値の数と比較することを伴ってもよい。通算成功率が所望の通算成功率よりも大きい計量値と関連する波長が、波長のサブグループとして選択されてもよい。対応する通算成功率がその最高レベルにある計量値の数は最適の計量値数と呼ばれてもよい。というのも、その計量値数は、細胞型又は組織型の最も正確な判別を提供するからである。
【0102】
通算成功率は、異なる細胞型又は組織型については異なるように変わってもよい。
図4を再度参照すると、ATMについての通算成功率は、24個の計量値が使用されるまでは各計量値が増えるにつれて上昇し、その後、通算成功率は低下することがわかる。対照的に、OE19についての通算成功率は、比較的低い計量値数に対して比較的高く、そしてより多くの計量値が使用されるにつれて減少する。
【実施例】
【0103】
実験方法
以下は、
図2~
図7及び表1~表4に示すデータを生成するために使用した実験設定の論述である。
【0104】
2種の食道癌細胞株(OE19及びOE21)並びにCAM(癌関連)及びATM(隣接組織関連)と表される2種の食道性筋線維芽細胞株に対して実験を行った。CAM及びATMは、同じ患者から外科手術の際に得た食道腺癌及び巨視的に隣接する正常組織に由来していた。これら2種の組織試料のうち、それぞれ一方は癌性であり、他方はバレットであった。このOE19及びOE21のヒトのコーカサス人種食道細胞は、HPA Culture Collections(Sigma(シグマ)、ドーセット(Dorset)、英国)から得た。細胞は、70~80%コンフルエンスに達するまで、2mM グルタミン(Sigma)、10%v/v ウシ胎仔血清(FBS)(Invitrogen(インビトロジェン)、Paisley(ペイズリー)、英国)及び1%v/v ペニシリン/ストレプトマイシン(Sigma)を添加したロズウェルパーク記念研究所(Roswell Park Memorial Institute)(RPMI1640)増殖培地(Sigma)の中で、5%CO2雰囲気の中で、37℃で培養した。培養培地は2日の間隔で補充した。筋線維芽細胞は、10%v/v FBS、1%v/v 変法イーグル培地非必須アミノ酸溶液、1%v/v ペニシリン/ストレプトマイシン、及び2%抗生物質-抗真菌薬を含有するL-グルタミンを加えたダルベッコ変法イーグル培地の中で、5%CO2雰囲気の中で、37℃で培養した。培地は48~60時間ごとに常法により交換し、細胞は、12回までコンフルエンスで継代した。CaF2ディスク(直径20mm×厚さ2mm、Crystran Ltd(クリストラン)、プール(Poole)、英国)をエタノールを使用して滅菌し、超純水でリンスし、一晩風乾した。このディスクにUVを30分間照射して無菌性を確実にした。次いでこの無菌のディスクを、組織培養12穴プレート(Corning(コーニング)、ニューヨーク、米国)の各ウェルに置いた。細胞(2×104mL-1)を各ディスクに播種し、5%CO2培養器の中で、37℃で2日間インキュベーションした。2日後、培地を取り除き、細胞を4%v/vパラホルムアルデヒド(PFA)(Sigma)溶液で固定し、必要な時まで1×リン酸緩衝生理食塩水(PBS)溶液中、4℃で保存した。イメージングに先立ち、固定した細胞を含有するCaF2スライドをMillipore超純水(18MΩcm)で少なくとも3回リンスした。リンスしたスライドを、次いでウェルプレートから取り出し、背面を超純水で拭いてすべてのリン酸残渣の完全な除去を確実にし、次いでスライドホルダーの中で最低でも90分間乾燥させた。
【0105】
適切な倫理委員会の承認及び患者へのインフォームドコンセントの後、食道生検試料を、Royal Liverpool and Broadgreen University Hospitals NHS Trust(ロイヤルリバプールアンドブロードグリーン大学病院NHSトラスト)での診断のための食道胃十二指腸内視鏡検査に参加した患者から標準的な生検鉗子を使用して得た。生検を、(異形成の組織学的なエビデンスがない)バレット食道を有する患者、及びバレット関連食道腺癌を有する患者から得た。これらは、10%ホルマリン中で固定し、パラフィンワックスの中に包埋した。組織学的診断は、日常的な患者ケアの一部としての顧問胃腸組織病理学者によりH&E染色に従って確認された。その後、各パラフィンブロックからのひとつながりの5μm切片を、ミクロトームを使用して切断し、フッ化カルシウムディスク上に載置し、キシレンを使用して脱脂した。
【0106】
細胞株及び組織切片のFTIR研究を、Varian(現在はAgilent Technologies(アジレント・テクノロジーズ)、サンタクララ(Santa Clara)、カリフォルニア州、米国)製の128×128ピクセルのテルル化カドミウム水銀(MCT)焦点面アレイを備えるVarian Cary 620-FTIRイメージング顕微鏡と併用してVarian Cary 670-FTIR分光計を用いて透過モードで実施した。FTIR画像を990cm-1~3800cm-1のスペクトル範囲で2cm-1の分解能で取得し、256スキャンを合わせた。赤外スペクトルは、最初に、主成分分析に基づくノイズリダクションアルゴリズムを使用して前処理した。信号対ノイズの実質的な向上は、10個の主な成分を生物学的に重要な情報を失うことなく保持することにより認められた。次いで、スペクトルを品質検査し、細胞に帰属できないもの(試料のブランク領域を含む)、又は高度の散乱に帰属できないものを除いた。この品質検査は、アミドIバンドの高さに基づく閾値を利用し、0.03~1.00の吸光度を有するスペクトルを保持した。最後に、赤外スペクトルを、80回の反復及びマトリゲル参照スペクトルを使用するRMieS-ESMCアルゴリズムを用いて共鳴Mie散乱について補正した。
【0107】
実験データ及び考察
FTIRデータキューブを各細胞型について取得し、Mie散乱効果について補正した。各FTIRデータキューブはi×j画素(典型的にはi×j=5000)の画像からなり、第3次元は、2cm
-1幅で波数ν=990cm
-1~3800cm
-1の範囲をカバーする1406データポイントのFTIRスペクトルである。OE19試料から得たFTIR画像を
図8Aに示す。1000cm
-1~1800cm
-1の「指紋領域」にわたって各細胞型を特徴づけるFTIRスペクトル(
図8B)を、その細胞型の対応するFTIR画像における各画素から得たスペクトルを平均することにより生成した。この平均は、画像のブランク領域からの画素を含まない。これらの平均プロファイルの直接比較から情報を推測することには問題がある。まず、各検体から得られるスペクトルの全強度のばらつきに起因して、各プロファイルを同じ曲線下面積に規格化することが必要である。空間プロファイルに対する規格化の効果は使用する波長範囲に依存するので、これは、異なる検体のプロファイルの間の差を隠すか又は大きくする可能性がある。最後に、与えられた波数におけるすべての画素の吸光度の標準偏差が大きく、細胞型の間の顕著な重なりを示す(
図10)。その結果として、異なる細胞株のスペクトルプロファイルの間の差を明らかにするためには、より精密な分析が必要である。これは、本明細書中、以降で計量値分析(Metrics Analysis、MA)と呼ぶ多変量解析法を使用して得られる。計量値は、与えられた波数の対についての吸光度の比であるように選んだ。重要なことに、このMA法はすべてのデータを平等に扱い、どの特定の波数にも何らの生物学的意義を与えない。これは、組織生化学に関連する意義を有するように定義される計量値が組織の判別に使用される従来のアプローチとは対照的である。1000cm
-1~1800cm
-1の全範囲にわたる波数において比を調べることにより、MAは、他の分析技術を使用する以前の研究では特定されなかった波数においてバイオマーカーの存在を明らかにした。
【0108】
MA法は、3つの主なパートに分割することができる:段階1:訓練、段階2:試験、及び段階3:分析。本明細書中で報告する結果については、訓練は、無作為に選んだ、データセットの中のスペクトルの数の75%を使用して完了し、試験は、残りの25%に対して行った。段階1は、2つの波数における吸光度比、上記計量値、の算出により各細胞型をパラメータ化する。これは、すべての波数組み合わせについて、1000cm-1~1800cm-1の範囲にわたって選んだ幅サイズで行った。幅サイズは、6cm-1よりも小さいサイズは何ら必要ではないと示されたため、6cm-1であった。結果として、全体で約18000個の計量値が存在する。次いで段階2では、各計量値が細胞型をどの程度良好に判別することができるかを数量化するために、スコアを各計量値と関連づけた。各細胞型について、上記計量値についての分布ヒストグラム(1つは細胞型について、1つはこの分析における他の細胞型の各々について)を作製することにより、スコアを算出した。高スコアは、明確に異なり従って比較的低い重なりを有する分布について得られる。スコアは、下式によって定義する。
スコア=成功率×(1-誤標識率)2
上記式中、成功率(感度と呼ばれることが多い)は、細胞型が正しく標識される割合であり、誤標識率(偽陽性率と呼ばれることが多い)は、他の細胞型が間違ってこの細胞型と標識される割合である。この試験フェーズで使用するスペクトルの25%について、細胞型が既知であれば、成功率を算出することができ、他の細胞型を特定する確率を使用して誤標識率を決定する。各計量値についてのスコアを使用して、その計量値が与えられた細胞型を識別する能力を順位付けする。段階3は、細胞型判別についての最良の全体的な成功率を与えるための投票システムが必要とする計量値の数を決定する。全体的な成功率は、使用する計量値の数の関数としてプロットされ、これは最良の判別を成し遂げるために必要な計量値の最適数を示す。
【0109】
MA法が判別のために最も重要であると見い出す波数は、以降バタフライプロット(Butterfly Plot)と呼ぶ、ν
1及びν
2に対する計量値スコアのプロットにおいて視覚化することができる。CAM及びATMについての4つのそのようなプロットが、これまで詳述したように、
図2に示されている。一般に、バタフライプロットは、赤色が比較的高い計量値スコアに対応し、青色が比較的低い計量値スコアに対応するように熱(ヒート)が計量値スコアによって表されるヒートマップとして考えられてもよい。バタフライプロットは、直線ν
1=ν
2に対して対称的である。すべての可能な計量値がこれらのプロットに示されている。カラーバーのスケールは、判別のために最も重要性が低い計量値(青色)から最も重要である(赤色の)計量値までの範囲にわたる。CAM及びATMの試料について、バタフライプロットにおいて非常に異なる挙動が見られ、この挙動は、これらの2種の細胞型の間で成し遂げられる明確な判別を際立たせる。これは意義深い結果である。というのも、組織病理学者は、H&E染色された試料に対して光学顕微鏡法という現在の240の標準的な方法を使用してこれらの細胞型を識別することは困難であるとわかっているからである。CAMについては、高くスコア付けされた計量値は、約1750cm
-1に少なくとも1つの高波数を含む計量値である(
図2Cの中の赤色領域)。ATMについては反対の状況が認められ、高くスコア付けされた計量値は、約1150cm
-1の少なくとも1つの低波数と関連することが多い(
図2Dの中の赤色領域)。
【0110】
(選んだ幅サイズにおける)すべての可能な計量値についてのスコアが
図2において評価され示されているが、結果を以降マンハッタンプロット(Manhattan Plot)と呼ぶ最良の(最高スコアの)100個の計量値の可視化に限定することにより、さらなる知見を得ることができる。CAM及びATMについてのプロットを
図3に示すが、
図3には、各細胞型についての最高順位の計量値を、ν
1(赤色)及びν
2(青色)に対してプロットして示す。これらのプロットは、使用する波数の組み合わせを1から100まで増加する数の計量値の関数として図示する。これらの2つの細胞型の判別のために使用する波数において有意差があることは明らかである。
【0111】
バタフライプロット及びマンハッタンプロットによって計量値スコアを視覚化することに加えて、成功率を、各細胞型について分析で使用する計量値の数の増加とともに成功率がどう変化するかを示すプロット(
図4)に提示することができる。一般に、成功率は、成功率を損なう低質の計量値が加わることに起因して、最終的には低下する。異なる変化が異なる細胞型に対して見られる。例えば、ATMについての成功率は、24個の計量値までは使用される計量値の数とともに増加し、その後減少する。対照的に、OE19についての成功率は、少ない計量値数については高く、そしてより多くの計量値が使用されるにつれて減少する。各細胞型について、判別に必要とされる最適の計量値数は、最大成功率の位置によって与えられる。上記データは各細胞株について単一の画像からサンプリングしているので、イメージングシステムの有限の空間分解能に起因して相関する可能性がある隣接する画素からのスペクトルが、その分析に潜在的にバイアスをかける可能性があり、従って非現実的に高いスコアを生じうるという懸念があった。これを確認するために、空間的に順序付けられたスペクトルを、訓練用スペクトルの非常に大多数が試験用スペクトルに隣接しないように、訓練用セット及び試験用セットに分割した。この分析は、もとのセットからは識別不可能である結果を返し、そのような画素の相関は、何ら重要なバイアスを結果に与えていないということを実証した。
【0112】
下記表1は、
図2、
図3及び
図4に関して論じた4つの細胞型の各々についての上位5個の計量値からの波数を示す。
【0113】
【0114】
最適の計量値数は、各細胞型の間で変わる。同じ波数が、与えられた細胞型についての複数の上位5個にスコア付けされた計量値に現れてもよく、従って、上位5個にスコア付けされた計量値についての波数の数は、異なる細胞型の間で変わってもよい。上記の細胞型を判別するために使用するとき、第1の態様に係る方法は、81%~97%の精度を成し遂げることができる。異なる細胞型を判別すると判明している波数は、食道の組織型を特徴づけるためにこれまで使用されてきた波数とは大きく異なる。2以上の細胞型に共通である波数は、その波数が、それらの細胞型と他のすべてとを判別するということを意味する。これは、その波数(又は波長)が、すべての他の細胞型におけるその濃度とは有意に異なる濃度でそれらの細胞型に存在するか又は存在しないかのいずれかの化学的部分の特徴である可能性が高いことを意味すると理解される。
【0115】
この分析において重要であると判明している波数の解釈を助けるために、上位5個の計量値における波数を各細胞型について調べる。異なる細胞型についての値の間の意味のある比較を可能にするための極めて適切な数の波数を与えるように5個の計量値を選んだ。これらの波数を
図5に示し、表1にまとめており、これらを考察の節でさらに論じることにする。
【0116】
図5は、OE19、OE21、CAM及びATMの細胞株についての5つの最高にスコア付けされた計量値と関連する波数の重要性の4つのグラフを示す。
図5のグラフからわかるように、各細胞型は、重要な波長の明確に異なる組を有し、その組の各々は、
図1Aの方法によって見出される。波数の重要性は、その波数が判別プロセスにおいて有用であると判明している頻度に相当してもよい。つまり、波数の重要性は、より高くスコア付けされた計量値においてその波数が現れる回数に相当してもよい。
【0117】
以下は、
図1Aの方法を4つの異なる組織試料に応用することの論述である。内視鏡下生検を、(異形成の組織学的なエビデンスがない)バレット食道を有する患者、及びバレット関連食道腺癌を有する患者から得た。これらの試料から、4つの異なる組織型を、顧問胃腸織病理学者による組織学的診断によって特定した:癌性組織、癌関連間質、バレット組織及びバレット関連間質。
図1Aの方法は、85%の平均成功率でこれらの組織型の判別を成し遂げた。組織型についての結果を
図6及び
図7に示す。
【0118】
図6は、4つの異なる組織型、癌性組織、癌関連間質(CAS)、バレット組織及びバレット関連間質(BAS)についての通算成功率のグラフを示す。
図4に示した細胞型の場合と同様に、これらの組織型についての通算成功率は、
図1Cの方法の第4下位工程S7Dで使用したより高く順位付けされた計量値の数の増加とともに変化した。異なる組織型について異なる変化が明らかにされる。
図4の細胞型の場合と同様に、
図6の各組織型について、判別のために使用されるべきより高く順位付けされた計量値の好ましい数は、最大通算成功率の位置によって決定されてもよい。
【0119】
図7は、
図6の癌性組織、CAS、バレット組織及びBASの試料についての5つの最高にスコア付けされた計量値と関連する波数の重要性の4つのグラフを示す。これらのグラフは、上位5個の計量値について、この4種の組織型を判別する波数を示す。
図7のグラフからわかるように、各組織型は、重要な波長の明確に異なる組を有し、これらの各々は、
図1Aの方法によって見出される。
【0120】
下記表2は、
図6及び
図7に関して論じた4種の組織型の各々についての上位5個の計量値からの波数を示す。
【0121】
【0122】
表1に示す細胞型の場合と同様に、最適の計量値数は、表2中の各組織型の間で変わる。
図1Aの方法は、上記4つの異なる組織型について71%~93%の精度を成し遂げる。異なる組織型を判別すると判明している波数は、食道の組織型を特徴づけるためにこれまで使用されてきた波数とは大きく異なる。表1の場合と同様に、表2について、2以上の組織型に共通である与えられた波数は、その波数が、それらの組織型と他のすべてとを判別するということを意味する。これは、その与えられた波数(又は波長)が、すべての他の組織型におけるその濃度とは有意に異なる濃度でそれらの組織型に存在するか又は存在しないかのいずれかの化学的部分の特徴であることを意味する。表1と表2とを比較すると、一般に、組織試料は、細胞株試料よりも、より正確な判別のために一般により多くの計量値が分析において使用されることを必要とするということがわかる。これは、細胞試料と比べて組織試料を考えるときの、存在する化学部分のより不均一な性質をふまえると予想される。
【0123】
以下は、判別波長を選択する公知の「ランダムフォレスト」法と比べた
図1Aの方法の論述である。
図1Aの方法を、FTIRデータ解析のためにこれまで使用されている公知のランダムフォレスト法と比較するために、(i)
図2~
図5に関して上で論じた4種の細胞株、及び(ii)
図6及び
図7に関して上で論じた4種の食道の組織型について、両方の技術を使用して同じデータセットを分析した。使用したランダムフォレスト法は、異なる試料間を判別するための分類子を構築するために使用した。下記表3は、4つの異なる細胞株OE19、OE21、CAM及びATMについて、ランダムフォレスト法の結果を、この一実施形態に係る方法の結果と比較する。
【0124】
MA法を既存の分類方法と比較するために、本発明者らは、十分に確立されたランダムフォレスト(RF)法を用いた定量比較を選んだ。これは最も適切な比較である。というのも、RFは特徴量抽出及び分類の両方をカプセル化し、生物医学分野においてFTIRデータ解析のために一般に使用されるからである。上記4種の細胞株について両方の技術を使用して同じデータセットを分析した。使用したRF法は、異なる試料の間を判別するための分類子を構築するために使用した、https://github.com/tingliu/randomforest-matlabから入手できる標準的なRF分類アルゴリズムであった。表3は、上記細胞株についてMA及びRF分析の結果を比較する。両方の技術における判別のために必要であると判明した鍵となる波数は、いくらかの類似性を示した。約30秒を超えてRF分析を実行するとき、又はツリーの数を10から500に増やすことにより、精度の向上はほとんど見られなかった。一般にMA法は、RFよりも判別(特にATMについて)においてより高い精度をより短時間で成し遂げる(表3)。例えば、OE21のMAは、1分以内に79%の成功率を成し遂げるのに対し、RFは18~約50%に限定されている。RFはATMを識別できないようであり、成功率は、4つの可能な細胞型から1つの細胞型を選ぶときの偶然から予想される成功率(25%)以下であった。RF法についてのこれらの低い成功率は、細胞株の各々と関連するデータセットのサイズ(スペクトルの数)の結果である。MA法は、データセットが偏りなくかつ同等のサイズであるかに依らずに、高い成功率を与えるのに対し、RF法は、このバランスに敏感であり、データセットが配分調整されるか又は入力データが重み付けし直されない限りは低調な成功率を与える。
【0125】
【0126】
両方技術において判別のために必要であると判明した鍵となる波数は、いくらかの類似性を示した。約30秒を超えてランダムフォレスト分析を実行するとき、又はツリーの数を10から500に増やすことにより、精度の向上はほとんど見られなかった。一般に、この一実施形態に係る方法は、(ランダムフォレスト法と比べて)判別(特にATMについて)においてより高い精度をより短時間で成し遂げる。例えば、OE21についてのこの一実施形態に係る方法は、1分以内に79%の成功率を成し遂げるのに対し、ランダムフォレスト法は約50%の成功率に限定されている。ランダムフォレスト法はATMを識別できないようであり、成功率は、4つの可能な細胞型から1つの細胞型を選ぶときの偶然から予想される成功率(25%)以下であった。
【0127】
下記表4は、4つの異なる組織型、癌性組織、癌関連間質(CAS)、バレット組織及びバレット関連間質(BAS)について、ランダムフォレスト法の結果を、この一実施形態に係る方法の結果と比較する。
【0128】
【0129】
分析した4種の組織型について、この一実施形態に係る方法の結果と公知のランダムフォレスト法の結果を比較することにより、細胞株についての一致と比べてより近い一致が明らかとなる。表4によってわかるように、上記2つの方法が癌性組織を判別する能力は同等である。この一実施形態に係る方法は、バレット組織の特定については約10%高い成功率を成し遂げる。この一実施形態に係る方法は、癌関連間質組織の特定については約20%高い成功率を成し遂げる。全体として、この一実施形態に係る方法については、公知のランダムフォレスト法と比べて、より高い平均成功率が、組織判別について、有意に短時間で得られた。
【0130】
表1及び表2に関して論じた異なる細胞型及び組織型を
図1Aの方法により判別すると判明している放射線の波長は、食道の組織型を特徴づけるためにこれまで使用されてきた波長とは大きく異なる。
図1Aの方法において細胞型及び組織型を判別すると判明している波長の意味はとらえにくい。というのも、その波長は、すべての細胞型及び別途すべての組織型のFTIRスペクトルにおけるすべての波長の盲検的なペアワイズ比較から導かれているからである。結果として、判別波長は、慎重に解釈する必要がある。他の計量値と組み合わせて使用されるとき、選択された波長は、すべての細胞型及び組織型の優れた判別を提供する。
【0131】
考察
FTIRを正常食道組織及び癌性食道組織の研究に応用することにおける顕著な進展があった。例えば、正常組織及び癌性組織のFTIRプロファイルが比較され、特定の波数において目立った吸収変化を明らかにした。例えば、964cm-1及び1237cm-1の変化は、悪性組織における核酸含有量の増加に起因するとされ、これは、グリコーゲンが健康な組織には明らかに存在するが癌性組織ではほぼ完全に失われているということを示す。例えば、部分的最小二乗法フィッティング手順を使用すると、950cm-1~1800cm-1の範囲の扁平組織、バレット非異形成組織、バレット異形成組織及び胃組織のFTIRスペクトルの主成分は、DNA、タンパク質、グリコーゲン及び糖タンパク質の濃度のばらつきから生じている可能性がある。異形成は、糖タンパク質及びDNAの増加によって特徴づけられてもよい。例えば、共焦点FTIR顕微鏡法と二次導関数FTIRスペクトルの階層的クラスター分析との組み合わせを使用するイメージング研究は、正常な道組織及びバレット食道組織を腺癌から識別し、糖タンパク質バンドとバレットとの関連を確認し、これらを陰窩の縁に位置付けた。例えば、高速IRマッピング自動化分析技術は、バレット異形成又は腺癌を95.6%感度及び86.4%特異性で特定する。二次導関数FTIRスペクトルのこのような分析は、正常な扁平組織が高グリコーゲン含有量を有し、バレット組織が高糖タンパク質含有量を有し、バレット異形成及び腺癌が高DNA含有量を有することを確認した。
【0132】
しかしながら、本明細書に記載される第1の態様に係るMAの結果から最初に留意するべきことは、異なる細胞型を判別すると判明している波数(表1)が、食道の組織型を特徴づけるためにこれまで使用されてきた波数とは大きく異なることである。例えば、従来の方法を使用して特定されるグリコーゲン、糖タンパク質又はDNAの波数は1つも表1に現れていない。また、別の従来の方法によって正常な組織を腺癌から識別すると特定された20個の特徴的な波数のうちわずか4だけしか表1に現れていない。これは、従来の方法を使用して特定された波数が妥当な判別子ではないということを意味するわけではない(実際、それらは、より多くの計量値が含まれる場合にMAによって見出されている)が、しかし、それらは、上位5個の計量値から見出される波数ほどには重要ではないということを意味する。
【0133】
この研究と別の従来の方法とに共通の4つの波数は、すべての他の細胞からの以下の細胞の、±1cm
-1の精度の、判別子を提供する;ATM(1049cm
-1)、OE19及びATM(1399cm
-1)、OE19及びATM(1465cm
-1)及びOE21(1545cm
-1)。これらの波数は、グリコーゲン、脂質、脂質及びタンパク質に帰属されてもよい。MAにおいて細胞型を判別すると判明している波数の意味はとらえにくい。というのも、その波長は、すべての細胞型のFTIRスペクトルにおけるすべての波長の盲検的なペアワイズ比較から導かれているからである。結果として、判別波数は、慎重に解釈する必要がある。明らかなことは、他の計量値と組み合わせて使用されるとき、それらの波長は、すべての細胞型の優れた判別を提供するということである(
図5)。5個の計量値のレベルの分析は、24個の判別波数を明らかにし、そして詳細に上述したように、これらの波数のうちのわずか4個しか食道の組織型の間の差を特徴づけるためにこれまでの研究で使用されてきていない。表1のこれらの判別波数のうちの5つは複数の細胞型に共通である。2つの細胞型に共通である波数は、それが、それらの細胞と他のすべてとを判別するということを意味する。これは、その波数が、すべての他の細胞におけるその濃度とは有意に異なる濃度でそれらの細胞型に存在するか又は存在しない化学的部分の特徴であるということを意味する。悪性腫瘍はDNAの増加及びグリコーゲンの大きな減少を特徴とするというこれまでの研究からの知見は、これらの分子の濃度の変化が、健康な組織の代表であると解釈することができるATM細胞とCAM細胞及び2種の悪性細胞株との間の重要な判別子を提供するはずであるということを示唆する。これは、両方の分子からの強い寄与との間の顕著な重なりがある1000cm
-1~1200cm
-1の領域に注意を向け、表1及び
図5は、このスペクトル領域における判別波数の強い濃度を示す。
図9は、このスペクトル領域における各細胞型についての
図8Aの規格化されたスペクトルプロファイルの重なりを示す。これまでに説明したように、スペクトルのそのような比較は、規格化が実施される波長範囲へのそのプロファイルの依存性に起因して、誤解を与える可能性がある。しかしながら、正常組織及び悪性組織から得られたスペクトルの三次導関数を採用することにより、この領域において従来の方法を使用して4個の鍵となる波数が以前に特定された:1024cm
-1、1049cm
-1、1080cm
-1及び1155cm
-1であり、それぞれグリコーゲン、グリコーゲン、核酸及びタンパク質に帰属されてもよい。これらの波数のうちのただ1つ、1049cm
-1、が表1及び
図5の判別波数のリストに現れる。最適の計量値数、24、におけるデータのより深い分析は、
図9に示すように、この範囲における判別波数の数の大きな増加を明らかにする。これらの追加の波数のいずれも、従来の方法を使用してこれまでに特定された波数には対応しない。
図9に示す判別波数のうちのいくつかが、特定の化学部分に由来すると知られている波数の表から特定され得なかった、OE19、OE21及びCAM細胞株のDNAにおける特定の化学的効果又は構造的406効果に由来することが可能である。
【0134】
異なる細胞型を判別する他の波数と公知の化学部分の識別特性との比較は、その細胞及び組織の化学構造の差について他の知見を提供する。例えば、ともに腺癌に由来するOE19細胞及びCAM細胞は、核酸と関連する1692cm-1の判別子を共有するが、この波数は、扁平上皮癌に由来するOE21細胞には存在しない。この波数は、腺癌に特異的な部分である可能性がある。OE21細胞及びATM細胞は、脂質の特徴として特定された1466cm-1及び1472cm-1の判別波数を共有する。この計量値アプローチは腺癌(OE19)及び扁平上皮癌(OE21)に由来する細胞の優れた判別を提供すること、並びにATM細胞及びCAM細胞は、それらの細胞と他の細胞型とを判別する15個の波数のうちのただ1つを共有しないことは、特に注目するべきである。明らかに、種々の細胞型の間の判別波数の特定は、さらなる研究の価値がある豊富な情報を含み、食道癌及び他の癌の化学構造についての重要な新しい知見をもたらす可能性がある。
【0135】
まとめ
異なる細胞型又は組織型から第1の細胞型又は組織型を判別するための放射線の波長を選択する方法が記載されている。吸収スペクトルの第1及び第2の組が得られ、各組は、それぞれ、第1の細胞型又は組織型及び異なる細胞型又は組織型の複数の異なる空間領域で得られたスペクトルを含む。対応する計量値の組が、各空間領域についての吸収スペクトルの第1及び第2の組に対して定義される。各計量値は、少なくとも2つの異なる波長についての吸収に対応する情報を含む。各組の中の計量値は、波長の異なる組み合わせを含む。特性値が各計量値について生成される。分布が、第1の細胞型又は組織型及び異なる細胞型又は組織型についての対応する特性値を使用して各計量値について生成され、比較されて、類似性の程度が決定される。計量値は、類似性の程度に基づいて順位付けされ、より高い類似性を有するより高く順位付けされた計量値と関連する波長が選択される。
【0136】
手短に言えば、この一実施形態に係る方法は、食道癌OE19、OE21、CAM及びATMの細胞株のFTIR画像を81%~97%の範囲の精度で判別することができる。これは、同じ患者由来の組織の3cm以内で採取されたCAMとATMとの筋線維芽細胞の最初の正確な判別を提供する。これは意義深い結果である。というのも、組織病理学者は、H&E染色された試料に対して光学顕微鏡法という現在の標準的な方法を使用してこれらの細胞型を識別することは困難であるとわかっているからである。この一実施形態に係る方法は、FTIRデータを解釈する新しいやり方をもたらす。当該方法は、すべての4種の異なる細胞型及び組織型を独特に判別する放射線の波長を明らかにし、それらの波長の多くは、健康な組織で見出される化学部分を用いてこれまで特定されていなかったものである。この一実施形態に係る方法は、異なる細胞型及び組織型を高精度及び高速度で判別し、公知のランダムフォレスト法に対して顕著な利点を有する。この一実施形態に係る方法は、生物試料で見出される非常に多様な化学結合に起因して、他の細胞型及び組織へと幅広く応用可能であると予想される。
【0137】
より詳細には、本発明者らは、新規な多変量統計解析技術がOE19、OE21、CAM及びATMの細胞株のFTIR画像を81%~97%の範囲の精度で判別することができるということを明らかにした。これは、同じ患者由来の組織の3cm以内で採取されたCAMとATMとの筋線維芽細胞の最初の正確なスペクトル的判別を提供する。これらの細胞型は癌細胞挙動の刺激に関連する重要な生化学的な差異を有するということが確立されてはいるが、これらの細胞型は日常的な形態学的なアプローチによっては容易に識別されないということは強調されるべきである。この知見は、推定上の癌細胞微小環境の特定により、及びバイオマーカーの分析又は大掛かりな組織処理に頼ることなく腫瘍と隣接組織間質との境界確定を可能にすることにより、早期診断において有望な臨床応用を有する。これは意義深い結果である。というのも、組織病理学者は、H&E染色された試料に対して光学顕微鏡法という現在の標準的な方法を使用してこれらの細胞型を識別することは困難であるとわかっているからである。さらに、上記データは、最も進行のリスクにあるバレット患者に限らず形成異常の病変を有する患者を含めた、重要な臨床群のスペクトル的判別に向けられた、はるかに大きい、適切に推進される、臨床試験を行うことがここで正当化されるということを示す。当該MA法は、FTIRデータを解釈する新しいやり方をもたらす。当該方法は、すべての4種の細胞型を独特に判別する波数を明らかにし、それらの波長の多くは、健康な組織で見出される化学部分を用いてこれまで特定されていなかったものである。当該方法は、細胞型を高精度及び高速度で判別し、RFアプローチに対して顕著な利点を有する。当該方法は、他の細胞型及び組織へと幅広く応用可能であると予想される。
【0138】
文脈と矛盾しないかぎり、実施形態は、ハードウェア、ファームウェア、ソフトウェア、又はこれらのいずれかの組み合わせにおいて実施されてもよい。実施形態は、機械可読媒体に保存された命令として実施されてもよく、この命令は、1以上のプロセッサによって読み取られて実行されてもよい。機械可読媒体は、情報を機械(例えば、計算装置)によって読み取り可能な形態で保存又は伝達するための任意の機構を備えてもよい。例えば、機械可読媒体としては、読み出し専用メモリ(ROM);ランダムアクセスメモリ(RAM);磁気記憶媒体;光学記憶媒体;フラッシュメモリ素子;電気的、光学的、音響的又は他の形態の伝搬信号(例えば、搬送波、赤外信号、デジタル信号等)、などが挙げられてよい。さらに、ファームウェア、ソフトウェア、ルーチン、命令が、特定のアクションを実施するとして本明細書に記載されてもよい。しかしながら、そのような記載は単に便宜のためだけのものであり、そのようなアクションは、実際にはそのファームウェア、ソフトウェア、ルーチン、命令等を実行し、そしてそうする際にアクチュエータ又は他の装置に物質界と相互作用させてもよい計算装置、プロセッサ、制御装置、又は他の装置から生じるということは理解されるはずである。
【0139】
特定の実施形態がこれまで記載されてきたが、本発明は、記載されたものとは別の態様で実施されてもよいということは分かるであろう。上記の記載は説明を意図したものであって、限定を意図したものではない。従って、添付の特許請求の範囲から逸脱しない範囲で、記載された発明に変更が加えられてもよいということは当業者には明らかであろう。