(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-05-28
(54)【発明の名称】アシルカルニチン代謝体を含む口腔癌診断用のバイオマーカー組成物
(51)【国際特許分類】
G01N 33/68 20060101AFI20240521BHJP
G01N 33/50 20060101ALI20240521BHJP
【FI】
G01N33/68
G01N33/50 D
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023574490
(86)(22)【出願日】2022-05-31
(85)【翻訳文提出日】2023-12-28
(86)【国際出願番号】 KR2022007731
(87)【国際公開番号】W WO2022255774
(87)【国際公開日】2022-12-08
(31)【優先権主張番号】10-2021-0070830
(32)【優先日】2021-06-01
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】514039912
【氏名又は名称】ナショナル キャンサー センター
(74)【代理人】
【識別番号】100121382
【氏名又は名称】山下 託嗣
(72)【発明者】
【氏名】キム,ミ キョン
(72)【発明者】
【氏名】チェ,ソン ウォン
(72)【発明者】
【氏名】ファン,グム スク
(72)【発明者】
【氏名】ジョン,ヨン エ
【テーマコード(参考)】
2G045
【Fターム(参考)】
2G045AA26
2G045CA25
2G045CA26
2G045CB07
2G045FA33
2G045FB02
2G045FB06
(57)【要約】
本開示は、代謝体プロファイリングを用いた口腔癌診断用バイオマーカーに関し、より具体的には、口腔癌発生時にその量が変化するアシルカルニチン代謝体を含むバイオマーカー組成物、および、それを用いた口腔癌診断方法に関する。本開示は、既存の組織生検が不可能であって、診断が容易でなかった口腔癌の早期診断を可能にし、血液の採取および分析を伴う液体生検法を用いることで、患者の苦痛とリスク負担を軽減させることができる。
【特許請求の範囲】
【請求項1】
アシルカルニチン(acyl carnitine)を有効成分として含む口腔癌診断用のバイオマーカー組成物。
【請求項2】
前記アシルカルニチン(acyl carnitine)代謝体は、デカノイルカルニチン(decanoyl carnitine)、オクタノイルカルニチン(octanoyl carnitine)、およびヘキサノイルカルニチン(hexanoyl carnitine)からなる群から選択される一種以上である、請求項1に記載のバイオマーカー組成物。
【請求項3】
グリセロホスホリルコリン(glycerophosphoryl choline)、アラキドン酸(arachidonic acid)、エイコサペンタエン酸(eicosapentaenoic acid)、およびトリグリセライド(triglyceride)からなる群から選択される一種以上の代謝体をさらに含む、請求項1に記載のバイオマーカー組成物。
【請求項4】
アシルカルニチン(acyl carnitine)代謝体のレベルを測定することができる製剤を有効成分として含む口腔癌診断用の組成物。
【請求項5】
請求項4の組成物を含む口腔癌診断用のキット。
【請求項6】
(a)口腔癌患者から分離されたサンプルからアシルカルニチン(acyl carnitine)代謝体のレベルを測定する段階;
(b)アシルカルニチン(acyl carnitine)代謝体のレベルを対照群サンプルのレベルと比較する段階;および
(c)口腔癌患者から分離されたサンプルからのアシルカルニチン(acyl carnitine)代謝体のレベルが対照群サンプルのレベルよりも低い場合に口腔癌と判断する段階を含む口腔癌診断のための情報提供方法。
【請求項7】
前記段階(a)は、グリセロホスホリルコリン(glycerophosphoryl choline)、アラキドン酸(arachidonic acid)、エイコサペンタエン酸(eicosapentaenoic acid)、およびトリグリセリド(triglyceride)からなる群から選択される一種以上の代謝体のレベルをさらに測定する、請求項6に記載の情報提供方法。
【請求項8】
前記分離されたサンプルは、唾液、全血、血清、およびプラズマからなる液体生検群から選択される一種以上である、請求項6に記載の情報提供方法。
【発明の詳細な説明】
【技術分野】
【0001】
<関連出願についての相互参照>
本出願は、2021年6月1日に出願された韓国特許出願第2021-0070830号に対する優先権の利益を主張し、前記特許出願の内容は本明細書に参照として統合される。
【0002】
本開示は、代謝体プロファイリングを用いた口腔癌診断用バイオマーカーに関し、より具体的には、口腔癌発生時にその量が変化するアシルカルニチン代謝体を含むバイオマーカー組成物およびそれを用いた口腔癌診断方法に関する。
【背景技術】
【0003】
口腔癌は、世界で最も一般的な悪性腫瘍の一つである。世界保健機関(GLOBOCAN)のデータによれば、2020年には世界中で37.8万人の口腔癌患者が発生し、2040年には55.3万人に増加すると予測される。口腔癌による死亡者数は2020年に17.8万人であり、2040年には26.3万人に増加すると予測される。最も一般的な口腔癌のタイプは、口腔扁平上皮癌(OSCC)で、90%以上を占める。口腔癌の5年生存率は約56%で、低い生存率の癌として分類される。治療および再建(reconstruction)の方法について、研究者ごとに様々な結果が発表されており、診断と治療の方法が大きく進歩したにもかかわらず、口腔および口咽頭癌の生存率は、依然として著しく改善されていない。
【0004】
口腔癌の初期段階では症状がほとんどなく、特異的な診断法がほとんどないため、初期に口腔癌を発見することは非常に難しい。口腔癌のほとんどのケースが、進行した段階で診断されるため、生存率が低下し、予後が悪くなる。したがって、口腔癌の早期段階での診断に利用できる非侵襲的で高感度なバイオマーカーを見つけることが非常に重要である。
【0005】
最近、ジェノミクス、トランスクリプトミクス、プロテオミクスに次ぐものとして、最先端の技術領域であるメタボロミクスは生体内の代謝物質と代謝経路を総体的に分析研究する生物学の分野の一つとして、生体内の代謝プロセスを研究し、代謝的特徴に関連する重要なバイオマーカーを同定し、代謝メカニズムを理解する重要な研究分野である。メタボロミクスは、遺伝子型と表現型を結びつける生物学的プロセスの最終産物である代謝産物の同定、プロファイリング、および定量化を含む。特に癌研究の分野では、癌発生過程での癌代謝体の変化を検出し、これらの変化が特定の遺伝子やメカニズムにどのように寄与するかを明らかにし、さらには代謝抗癌剤を用いた癌治療の戦略に重要な役割を果たす可能性がある。
【0006】
生物学的システムで代謝産物を包括的に分析し、定量化するために最も一般的に使用されるメタボロミクス解析プラットフォームは、クロマトグラフィーと結合された核磁気共鳴(NMR)分光法または質量分析法(MS)である。これらのプラットフォームに基づくメタボロミクス解析技術は、乳癌、結腸直腸癌、肺癌、前立腺癌、肝細胞癌など、さまざまな癌の診断および病因調査のためのバイオマーカーの同定に効果的かつ広範に活用されている。
【0007】
口腔癌に関連する研究報告はいくつかあるが、信頼性が高く臨床的に検証された研究は、まれである。そのため、まだメタボライトは、口腔癌のスクリーニングや検出のための臨床的なマーカーとして広く使用されていない。さらに、実際の臨床と検査に適用できる非侵襲的または液体生検を用いたバイオマーカーを見つけるための研究が必要である。
【0008】
発明者たちは、口腔癌患者グループと対照群からのUHPLC-ESI-Q-TOF-MS/MSベースのターゲットおよびノンターゲットの代謝プロファイリングを行い、アシルカルニチン(acyl carnitine)代謝体が、口腔癌を同定するための代謝シグナルとして有用であることを確認した。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】韓国登録特許第10-2091483号公報
【非特許文献】
【0010】
【非特許文献1】Martin-Blαzquez A, et al. Untargeted LC-HRMS-based metabolomics to identify novel biomarkers of metastatic colorectal cancer. Scientific reports 9, 20198 (2019).
【非特許文献2】Xie GX, et al. Urine metabolite profiling offers potential early diagnosis of oral cancer. Metabolomics 8, 220-231 (2012).
【非特許文献3】Chen X, Yu D. Metabolomics study of oral cancers. Metabolomics 15, 22 (2019).
【発明の概要】
【発明が解決しようとする課題】
【0011】
本開示の目的は、アシルカルニチン(acyl carnitine)代謝体を有効成分として含む口腔癌診断用のバイオマーカー組成物、アシルカルニチン(acyl carnitine)代謝体のレベルを測定できる製剤を有効成分として含む口腔癌診断用の組成物、これを含む口腔癌診断用のキット、および口腔癌診断のための情報提供方法を提供することである。
【課題を解決するための手段】
【0012】
本開示はアシルカルニチン(acyl carnitine)を有効成分として含む口腔癌診断用のバイオマーカー組成物を提供する。
【0013】
前記アシルカルニチン(acyl carnitine)代謝体は、デカノイルカルニチン(decanoyl carnitine)、オクタノイルカルニチン(octanoyl carnitine)、およびヘキサノイルカルニチン(hexanoyic arnitine)からなる群から選択される一種以上でありうる。
【0014】
口腔癌診断用のバイオマーカー組成物は、グリセロホスホリルコリン(glycerophosphoryl choline)、アラキドン酸(arachidonic acid)、エイコサペンタエン酸(eicosapentaenoic acid)、およびトリグリセライド(triglyceride)からなる群から選択される一種以上の代謝体をさらに含みうる。
【0015】
また、本開示は、アシルカルニチン(acyl carnitine)代謝体のレベルを測定することができる製剤を有効成分として含む口腔癌診断用の組成物を提供する。
【0016】
また、本開示は、口腔癌診断用の組成物を含む口腔癌診断用のキットを提供する。
【0017】
また、本開示は、(a)口腔癌患者から分離されたサンプルからアシルカルニチン(acyl carnitine)代謝体のレベルを測定する段階;(b)アシルカルニチン(acyl carnitine)代謝体のレベルを対照群サンプルのレベルと比較する段階;および、(c)口腔癌患者から分離されたサンプルからのアシルカルニチン(acyl carnitine)代謝体のレベルが対照群サンプルのレベルよりも低い場合に、口腔癌と判断する段階、を含む口腔癌診断のための情報提供方法を提供する。
【0018】
前記段階(a)は、グリセロホスホリルコリン(glycerophosphoryl choline)、アラキドン酸(arachidonic acid)、エイコサペンタエン酸(eicosapentaenoic acid)、およびトリグリセリド(triglyceride)からなる群から選択される一種以上の代謝体のレベルをさらに測定することができる。
【0019】
前記分離されたサンプルは、唾液、全血、血清、およびプラズマからなる液体生検群から選択される一種以上でありうる。
【0020】
また、本開示は、口腔癌の検出及び/または診断用の(マーカー)組成物およびその製造方法;口腔癌の検出及び/または診断用のキットおよびその製造方法;口腔癌の検出及び/または診断用の装置およびその製造方法;及び、口腔癌の検出及び/または診断のための情報提供方法において、アシルカルニチン代謝体の用途を提供する。
【発明の効果】
【0021】
本開示は、既存の組織生検が困難であり、診断が容易でなかった口腔癌の早期診断を可能にし、血液の採取および分析を伴う液体生検法を用いることで患者の苦痛とリスク負担を軽減させることができる。
【図面の簡単な説明】
【0022】
【
図1a】口腔癌患者群と対照群に対するRNAseqデータを用いてTCGA(The Cancer Genome Atlas)におけるパスウェイ分析の結果を示したものである(1)。
【
図1b】口腔癌患者群と対照群に対するRNAseqデータを用いてTCGA(The Cancer Genome Atlas)におけるパスウェイ分析の結果を示したものである(2)。
【
図1c】口腔癌患者群と対照群に対するRNAseqデータを用いてTCGA(The Cancer Genome Atlas)におけるパスウェイ分析の結果を示したものである(3)。
【
図2】ターゲット代謝体プロファイリングアプローチのための10個の代謝体のWald距離分析を含むヒートマップおよび階層クラスタを示したものである。
【
図3a】
図3a~
図3dは、ターゲット代謝体プロファイリングにおいて5-fold交差検証を使用したランダムフォレストの結果を示したものである。
図3aは、トレーニングセットに対するランダムフォレストの混同行列を示したものである。
【
図3b】最適なパラメータを見つけるためのグリッド(grid)サーチの結果を示したものである。精度が最も高い点は、各ツリーノード(mtry)で分割可能な変数の数が4個、成長するツリーの数(ntree)が360個の場合である。
【
図3c】テストセットに対するランダムフォレストの混同行列を示したものである。
【
図3d】テストセットにおいてランダムフォレストを使用する上位4個の代謝体を示したものである。
【
図4a】
図4aから4oは、検証データセットで特定された各代謝体パネルに関する感度、特異度、およびAUC値を示したものである。
図4aは、4個の代謝体(
図4a-
図4d)の代謝体パネルに関するものである(1)。
【
図4b】4個の代謝体(
図4a-
図4d)の代謝体パネルに関するものである(2)。
【
図4c】4個の代謝体(
図4a-
図4d)の代謝体パネルに関するものである(3)。
【
図4d】4個の代謝体(
図4a-
図4d)の代謝体パネルに関するものである(4)。
【
図4e】2個の代謝体(
図4e-
図4j)の代謝体パネルに関するものである(1)。
【
図4f】2個の代謝体(
図4e-
図4j)の代謝体パネルに関するものである(2)。
【
図4g】2個の代謝体(
図4e-
図4j)の代謝体パネルに関するものである(3)。
【
図4h】2個の代謝体(
図4e-
図4j)の代謝体パネルに関するものである(4)。
【
図4i】2個の代謝体(
図4e-
図4j)の代謝体パネルに関するものである(5)。
【
図4j】2個の代謝体(
図4e-
図4j)の代謝体パネルに関するものである(6)。
【
図4k】3個の代謝体(
図4k-
図4n)の代謝体パネルに関するものである(1)。
【
図4l】3個の代謝体(
図4k-
図4n)の代謝体パネルに関するものである(2)。
【
図4m】3個の代謝体(
図4k-
図4n)の代謝体パネルに関するものである(3)。
【
図4n】3個の代謝体(
図4k-
図4n)の代謝体パネルに関するものである(4)。
【
図4o】4個の代謝体(
図4o)の代謝体パネルに関するものである。
【
図5a】血漿脂質のUHPLC ESI Q TOF MS/MSスペクトルから得られたPCAスコア プロットをポジティブ モードで示したものである。
【
図5b】上記PCAスコア プロットをネガティブモードで示したものである。
【
図6a】
図6a~
図6dは、脂質代謝体プロファイリングにおいて5-fold交差検証を使用したランダムフォレストの結果を示したものである。
図6aは、トレーニングセットに対するランダムフォレストの混同行列を示したものである。
【
図6b】最適なパラメータを見つけるためのグリッドサーチの結果を示したものである。精度が最も高い点は、各ツリーノード(mtry)で分割可能な変数の数が4個、成長するツリーの数(ntree)が240個の場合である。
【
図6c】テストセットに対するランダムフォレストの混同行列を示したものである。
図6dは、テストセットにおいてランダムフォレストを使用する上位3個の代謝体を示したものである。
【発明を実施するための最良の形態】
【0023】
本開示は、口腔癌患者群と対照群からのサンプルに対してUHPLC-ESI-Q-TOF-MS/MSに基づくターゲットおよび非ターゲットメタボライトプロファイリングを行い、アシルカルニチン(acyl carnitine)代謝体が口腔癌を識別する代謝シグナルと見なすことができることを確認した。
【0024】
本発明では、「代謝体」という用語は、生物学的サンプルから得られる代謝物質を指すのであり、代謝体を得ることができ生物学的サンプルは、唾液、全血、血漿、血清、または血小板であり得るのであって、好ましくは、血漿であり得る。また、代謝体は、代謝および代謝過程によって生成される物質、または生物学的酵素および分子による化学的代謝作用によって生成される物質などを含むことができる。
【0025】
本発明における「診断」という用語には、特定の病気や疾患に対する個体の感受性(susceptibility)を判断すること、ある個体が特定の病気や疾患を現在持っているかどうかを判断すること、特定の病気や疾患にかかった個体の予後(prognosis)を判断すること、または治療効果に関する情報を提供するために個体の疾患を監視すること(例えばテラメトリックス(therametrics))を含む。
【0026】
本開示は、一つの観点において、アシルカルニチン(acyl carnitine)代謝体を有効成分として含む口腔癌診断用のバイオマーカー組成物を提供する。
【0027】
本開示は、一実施形態において、(a)口腔癌患者群のサンプルと対照群のサンプルとをUHPLC-ESI-Q-TOF-MS/MSベースのデータ抽出段階;(b)UHPLC-ESI-Q-TOF-MS/MS分析結果を統計処理可能な数値に変換する段階;および、(c)変換された数値を使用して統計的に前記二つのサンプルの差別性を検証する段階、を通じて、口腔癌を診断した。
【0028】
前記段階(b)では、全体の分析時間を単位時間間隔に分け、単位時間ごとに現れたクロマトグラムのピークの面積または高さの中で、最も大きな値を代表値として決定し、前記(c)の段階では、機械学習(machine learning)解析を行い、5-fold交差検証を通じて、両サンプル間の有意な差異を示す代謝体をバイオマーカーとして選定し、これを分析・検証した。
【0029】
本明細書で使用された「交差検証」の用語は、統計学でモデルを評価するための一つの方法であり、全体のデータが最低1回はテストセットとして使用されるようにデータを分割し、各パラメータに対して最適なパラメータを見つけて精度と信頼性を向上させる性能値を見つける。
【0030】
本開示における性能値はAUC(Area Under the Curve)であり、高いAUC値は、口腔癌の陽性および陰性を区別する能力が高いことを意味する。
【0031】
前記5-fold交差検証を通じて、AUC値が0.8以上の代謝体が、口腔癌の診断のためのバイオマーカーとして分類された。具体的には、これは、アシルカルニチン(acyl carnitine)代謝体を含み、好ましくは、デカノイルカルニチン(decanoyl carnitine)、オクタノイルカルニチン(octanoyl carnitine)、およびヘキサノイルカルニチン(hexanoyl carnitine)からなる群から選択される少なくとも一種の代謝体を含む。
【0032】
前記アシルカルニチン(acyl carnitine)は、脂肪酸ベータ酸化過程で、脂肪酸をミトコンドリア内に輸送する役割をして、脂質代謝プロファイリングで分析された2個の脂肪酸、すなわち、ポリ不飽和脂肪酸(PUFA)であるアラキドン酸(arachidonic acid)およびエイコサペンタエン酸(eicosapentaenoic acid)が、口腔癌患者群で減少した量を示す結果としての、信頼性のあるバイオマーカーとして検証された。これは、Mika、A.らの大腸がん患者群の血清でのPUFAレベルが健康な対照群と比較して低いことが示された研究結果と一致しており、また、
図1に示されているように、ゲノムプロジェクトであるTCGA(The Cancer Genome Atlas)から得られた、口腔がん患者群と対照群に関するRNAseqデータを使用して行われたパスウェイ分析が、本開示の研究結果と一致していることを確認した。
【0033】
また、前記バイオマーカー組成物は、グリセロホスホリルコリン(glycerophosphoryl choiine)、アラキドン酸(arachidonic acid)、エイコサペンタエン酸(eicosapentaenoic acid)、およびトリグリセリド(triglyceride)からなる群から選択される少なくとも一種の代謝体をさらに含むことができる。
【0034】
本開示は別の観点から、アシルカルニチン(acyl carnitine)代謝体のレベルを測定することができる製剤を有効成分として含む口腔癌診断用の組成物を提供する。
【0035】
本明細書で使用された「レベル」の用語は、生物学的サンプル内のバイオマーカーを検出するための、任意の分析方法を使用して作成された測定値を指すために互換的に使用されるのであり、生物学的サンプル中のバイオマーカーに対応するものに対する、存在・不存在、絶対的な量または濃度、相対的な量または濃度、滴定度、数値、発現値、測定値の比率などを示す。「レベル」の正確な特性は、バイオマーカーを検出するために使用される、特定の分析方法の特定の設計および成分に依存する。
【0036】
本明細書で使用された「製剤」(agent)の用語は、生物学的サンプルから代謝体を定量的に検出するための製剤を意味するのであり、前記製剤は特に制限されるのでない。前記製剤は、代謝体と相互作用して信号を生成する相補的な結合が可能なプライマー、プローブ、アプタマー、小分子化合物、タンパク質、リガンド、または抗体であり得る。
【0037】
本開示は別の視点から、前記口腔癌診断用の組成物を含む口腔癌診断用のキットを提供する。
【0038】
本開示において、前記キットは、アシルカルニチン(acyl carnitine)代謝体のレベルを測定できる製剤を有効成分として含む口腔癌診断用の組成物を必須的に含み、前記製剤を定量できる構成要素または定量装置をさらに含むことができる。
【0039】
本開示によるキットは、簡易診断用またはPCRベースの診断用キットであり得る。
【0040】
各用途に適したキットを設計し、構成要素に適切な修正または変更を施すことは、通常の技術者にとって明白であろう。
【0041】
前記製剤を定量することができる構成要素は、これに限定されるものではないが、診断キット関連分野で一般的に使用されるプローブ、蛍光団、発色団、放射性核種などを含むことができる。
【0042】
前記定量装置は、各代謝体のレベルを測定するためのものであり、核磁気共鳴分光計(NMR)、クロマトグラフィー、および質量分析器(mass spectrometry)からなる群から選択されるいずれか1つ以上であり得る。
【0043】
本開示は別の視点から、(a)口腔癌患者から分離されたサンプルからアシルカルニチン(acyl carnitine)代謝体のレベルを測定する段階;(b)アシルカルニチン(acyl carnitine)代謝体のレベルを対照群サンプルのレベルと比較する段階;および、(c)口腔癌患者から分離されたサンプルからのアシルカルニチン(acyl carnitine)代謝体のレベルが、対照群サンプルのレベルよりも低い場合に、口腔癌と判断する段階を含む、口腔癌診断のための情報提供方法を提供する。
【0044】
前記分離されたサンプルは、唾液、全血、血清、および血漿などの液体生検の群グループから選択でき、前記段階(a)は、グリセロホスホリルコリン(glycerophosphoryl choline)、アラキドン酸(arachidonic acid)、エイコサペンタエン酸(eicosapentaenoic acid)、およびトリグリセリド(trigiyceride)からなる群から選択される、少なくとも1種の代謝体のレベルをさらに測定することを特徴とすることができる。
【発明を実施するための形態】
【0045】
以下は、理解を助けるために本出願における好ましい実施例を提示する。ただし、以下の実施例は、本発明をより理解するために提供されたものであり、これによって本出願の内容が制限されるものではない。
【0046】
<実験材料および方法>
1.サンプル収集
本開示の研究は、国立癌センター倫理委員会(IRB No. NCC2016-0147)の承認を受け、すべての参加者から書面による同意を得て実施された。
【0047】
本開示は、ディスカバリーデータセット(Discovery Data Set)および検証データセット(Validation Data Set)で構成される。ディスカバリーデータセットは、182人の口腔癌患者と、口腔癌患者と性別-年齢がマッチングされる健康な182人との合計364人に対するデータを含む。182人の口腔癌患者は、2018年以来、国立癌センターの検診センターおよび外来診療所を訪れている。健康な182人は、登録時に癌がないと診断される。口腔癌患者群は、舌、下顎腺、上顎歯肉、下顎歯肉、上顎洞、頬粘膜、後歯茎三角筋、口蓋、舌、口底、下唇のいずれかにて組織学的に口腔癌を診断された人で構成され、健康な対照群では19歳未満は除外される。検証データセットは、ソウル大学病院を訪れた経験のある口腔癌患者52人、および同期間の国立癌センターの健康な52人に対するデータを含む。検証データセットには、ソウル大学病院を訪れた口腔癌患者52人と、口腔癌患者52名に性別がマッチングされる健康な52人とで構成される。健康な52人は、同じ期間の国立癌センターに対するディスカバリーデータセットを構成する健康な対照群から選択される。
【0048】
血液サンプルは、採取直後に冷凍保存され、血漿は4℃で3000rpmの遠心分離を使用して20分間分離され、追加の分析のために-80℃で保存した。
【0049】
本開示と関連する研究に参加した、被験者の一般的な特性は、表1に提示される。
【0050】
【0051】
ディスカバリーデータセットでは、364人の対照群が、182人の癌患者と年齢、性別ごとに一致したため、これらの変数間でグループ間には差がなかった。結果は、中央値(25%、75%)および数字(%)で示され、p値は連続変数のKruskal-Wallis検定、およびカテゴリカルデータのχ二乗検定を使用して計算された。患者群と対照群の間にはアルコール摂取状態で有意な差があった(P = 0.03)、しかし喫煙状態では有意差が見られなかった(P = 0.09)。検証データセットでは、年齢と喫煙状態に有意な差が見られたが、性別とアルコール摂取状態には差がなかった。
【0052】
ディスカバリーデータセットおよび検証データセットの代謝体を分離するためには、Agilent 1290 Infinity LCおよび6490 Triple Fourthpole MSシステムを使用したUHPLC-ESI-Q-TOF-MS/MS(Agilent Technologies; Palto, CA, USA)が採用された。代謝体の分析には、MassHunter Workstationソフトウェア(Ver B.06.00、Agilent Technologies)が使用された。
【0053】
2.LC-MS分析法
2-1.サンプルの準備
(1)セミターゲットプロファイリングに使用する血漿サンプル(50μL)は、500 μLのクロロホルム:メタノール(2:1、v/v)溶液と100 μLの水で抽出され、真空状態で乾燥させた後、3000 rpmで20分間遠心分離し、1 μLずつ注入して使用された。
【0054】
(2)ターゲットプロファイリングに使用する血漿サンプル(20μL)は、30μLの水と150μLのアセトニトリル(ACN)で抽出された。1時間かけてタンパク質を沈殿させた後、4℃、4500gで10分間遠心分離した。水溶性の上澄み液を新しい1.5mLのチューブに移し、希釈係数75%のACNで希釈し、各代謝体の内部標準を追加した。
【0055】
(3)脂質プロファイリングに使用する血漿サンプル(20μL)は、30μLの水と250μLのAVANTIS LIPIDOMIXおよびイソプロパノール(1:49、v/v)溶液を使用して抽出された。1時間かけてタンパク質を沈殿させた後、4℃、4500gで10分間遠心分離した。これを10分間混合し、2時間かけてタンパク質を完全に沈殿させた後、4℃、4500gで10分間遠心分離した。
【0056】
2-2. UPLC-ESI-Q-TOF-MS/MS分析
(1)セミターゲテッドおよびターゲッドプロファイリング:電気噴霧(ESI)を備えたXevo TQ XSシステムが組み合わされたACQUITY UPLC(Waters, Milford, MA, USA)を使用して実施された。Scherzo SM-C18カラム(2mm x 100mm、3μm; Imtakt, Kyoto, Japan)を使用して0.2mL/minで20分間極性の代謝体を分離した。移動相Aは水中の0.1%ギ酸(formic acid)で、移動相Bはメタノール中の0.1%ギ酸(formic acid)で構成された。
【0057】
(2)脂質プロファイリング:クロマトグラフィー分離は、ACQUITY UPLC CSH C18 (2.1 mm x 100 mm、1.7μm、Waters)で、カラム温度と流速を55℃、0.4 mL/minに維持しながら20分間実行した。Q-TOF Microマスディテクター(Waters, Milford, MA, USA)を使用し、陽性モードの移動相Aは水:アセトニトリル(40:60 v/v)中の0.1%ギ酸で、移動相Bはイソプロパノール:アセトニトリル(90:10 v/v)中の0.1%ギ酸で構成され、陰性モードの移動相Aは水:アセトニトリル(60:40 v/v)中の0.1%ギ酸で、移動相Bはイソプロパノール:アセトニトリル(90:10 v/v)中の0.1%ギ酸で構成された。正確な質量取得のために、5μL/minのロックスプレー(lock-spray)条件で、Lucine-enkphalin ([M + H]+: m/z 556.2771および[M-H]-: m/z 554.2615)を使用した。
【0058】
2-3.複数成分同時分析モニタリング(dMRM)
高品質のデータを得るために、化合物の滞留時間、内部標準の濃度などが、複数成分同時分析モニタリング(dMRM)によって定量化された。QCサンプルは、サンプル取得前に5個ごとに分析され、分析システムの安定性と再現性をモニタリングした。
【0059】
表2は、選択された代謝体の滞留時間と多重反応モニタリングの遷移を示した。イオン遷移の値と滞留時間の再現性を考慮すると、デカノイルカルニチン、ヘキサノイルカルニチン、およびオクタノイルカルニチンの選択された反応が確認できる。
【0060】
【0061】
3. 統計分析
多変量統計分析は、SIMCA-P+バージョン12.0(Umetrics、Ume、スウェーデン)を使用して行われた。リピッドプロファイリングではPCAが適用され、UHPLC-ESI-Q-TOF-MS/MSデータセットはPCA実行前に単位分散に拡張した。
【0062】
モデルの有効性は、解釈性と予測性に関する情報を提供するモデルパラメータで評価された。群間の差異は、連続変数に対するKruskal-Wallis検定と、カテゴリカル変数に対するχ2検定を使用して比較された。
【0063】
グローバルプロファイリングで得られた代謝体(代謝産物)は、最小絶対収縮および選択演算子(LASSO)およびランダムフォレスト(RF)メソッドを含む機械学習分析で導き出された。LASSOとRFの過剰適合バイアスを避けるために、ディスカバリーデータセットを、トレーニングセット(口腔癌146例および対照群292例)と、テストセット(口腔癌36例および対照群72例)とに分割した。トレーニングセットは、代謝体の選択に対する楽観的モデルを構築するために使用され、モデルの検証にはテストセットが使用された。2個のアルゴリズムで生成された結果を組み合わせ、追加の分析のために代謝体を選択した。
【0064】
その後、追加の代謝体は、fold変動および多変量調整条件付きロジスティック回帰分析およびAUC値に基づいて選択された。Bonferroni法を使用した事後多重比較は、代謝体のグループ間の有意な差異を識別するために適用された。
【0065】
ディスカバリーデータセットにおける飲酒および喫煙の状態に関して、OR(odds ratio)および対応するCI(95%信頼区間)を推定するために、調整された条件付きロジスティック回帰分析が実施された。
【0066】
受信機動作特性(Receiver Operating Characteristic, ROC)曲線における曲線の下の領域(Area Under the Curve, AUC)は、選択された代謝体の予測能力を試験するために計算された。すべての統計検定は両側検定で、有意水準はp > 0.05と設定された。他のすべての統計分析および可視化は、Rプラットフォームのggplot2パッケージを使用して実施された。
【0067】
<実験結果>
<実施例1:極性代謝体プロファイリング分析結果>
UHPLC-ESI-Q-TOF-MS/MSを使用した血漿サンプルから、合計82の代謝体が検出されたのであり、各代謝体は、識別のために電子の正確な質量値、断片イオン、および保存時間の側面で、オンラインデータベースの実際の標準リファレンスと比較した。その結果、追加の選別プロセスのために48個の代謝体が選択され、口腔癌患者群と対照群を区別するための最適な変数選択のためにトレーニングセットとテストセットを構成し、5-fold交差検証でLASSOを使用したロジスティック回帰の結果から16個の代謝体、およびランダムフォレスト(RF)の結果から5個の代謝体が導き出された。これらの結果に対するトレーニングセットとテストセットの精度は、それぞれ98.81%と94.30%、および94.44%と93.52%であった。
【0068】
口腔癌患者群で、上記のLASSOとRFの結果を組み合わせた18個の代謝体のうち、6個の代謝体(プロリン、タウリン、ピリドキサミン、プロカルニチン、シトルリン、ハイポクサンチン)が増加し、12個の代謝体(アセチルコリン、クレアチニン、トリプトファン、アスパルテート、オクタノイルカルニチン、アセチルカルニチン、イソカルニチン、グリセロールホスホコリン、フェニルアラニン、グルタメート、デカノイルカルニチン、ヘキサノイルカルニチン)が減少したことが示された。
【0069】
【0070】
18個の代謝体について、レシーバ動作特性(ROC)曲線の下の面積(AUC)を計算し、口腔癌に対する予測性能をテストした結果を示したのであり、これによりAUC値が0.7以上である10個の代謝体が選定された(表3)。
【0071】
また、
図2を参照すると、Wald距離解析が含まれるヒートマップおよび階層的クラスタリングにおいて、口腔癌におけるオクタノイルカルニチン、デカノイルカルニチン、ヘキサノイルカルニチン、グリセロールホスホコリン、ヒポキサンチン、およびイソ-カルニチンの有意な変化を確認できる。
【0072】
上記の10個の代謝体についてバイオマーカーの値を確認するために、ターゲットプロファイリングを実行した結果、LASSOロジスティック回帰結果からの6個の代謝体、およびランダムフォレスト結果からの上位4個の代謝体が導き出された。これらの結果に対するトレーニングセットおよびテストセットの精度は、それぞれ93.25%と93.64%、および93.14%と89.81%であった。
【0073】
【0074】
LASSOとRFの結果を組み合わせた8個の代謝体について、レシーバ動作特性(ROC)曲線の下の面積(AUC)を計算し、口腔癌の予測性能をテストした結果、AUC値が0.8以上の4個の代謝体、つまりデカノイルカルニチン、オクタノイルカルニチン、グリセロールホスホコリン、およびヘキサノイルカルニチンが選定された。特にオクタノイルカルニチンとデカノイルカルニチンのAUC値は0.9以上を示した(表4)。
【0075】
図3を参照すると、5-fold交差検証を使用したランダムフォレストの結果である。
図3aはトレーニングセットに対するランダムフォレストの混同行列であり、
図3bは、ランダムフォレストで最適なパラメータを見つけるためのグリッドサーチの結果である。最も高い精度のポイントは、各ツリーノード(mtry)で使用できる変数の数が4個、成長するツリー数(ntree)が360個である。
図3cは、テストセットに対するランダムフォレストの混同行列であり、
図3dにて、テストセットでランダムフォレストを使用した上位4個の代謝体を確認できる。
【0076】
さらに、
図4aから4dに示されるように、検証データセットでの上位4個の代謝体のAUC値は0.8よりも大きいことが確認できる。
図4oに示されるように、4個の代謝体パネルは、感度0.9744、特異性0.8478、およびAUC 0.9666と、高い口腔癌の識別指数を示す。
【0077】
<実施例2:脂質代謝体プロファイリング分析の結果>
UHPLC-ESIQ-TOF-MS/MSを使用して検出された135個の脂質代謝体のうち、口腔癌患者群と対照群との間で有意な差を示した86個の脂質代謝体を分類し、機械学習を用いて最適な変数値が導き出された。
【0078】
図5では、口腔癌患者群と対照群との間ではっきりと区別される主成分分析(Principal Component Analysis, PCA)プロットが確認できる。
【0079】
LASSOロジスティック回帰を使用して26個の代謝体、およびランダムフォレストの結果からトップ3個の代謝体が選択された。これらの結果に対するトレーニングセットおよびテストセットの精度は、それぞれ87.33%と79.86%、および,
93.49%と88.19%と示された。
【0080】
【0081】
図6は、5-fold交差検証を使用したランダムフォレストの結果を示したものである。
図6aはトレーニングセットに対するランダムフォレストの混同行列であり、
図6bはランダムフォレスト内の最適パラメータを見つけるためのグリッド検索結果である。最も高い精度のポイントは、各ツリーノード(mtry)で使用できる変数の数が14個、成長するツリーの数(ntree)が240個である。
図6cは、試験セットに対するランダムフォレストの混同行列を示し、
図6dでは、テストセットにおいて、ランダムフォレストを使用する上位3個の脂質代謝産物を同定することができる。
【0082】
その結果、口腔癌患者における選択された26種類の脂質の変化を対照群と比較した場合、回帰、倍数の変化で17個の脂質が口腔癌に有意差があり、表5に示すように、グループ(P値<0.05)の17種類の脂質のfold変化と、条件付きロジスティック回帰モデル解析におけるAUC値が0.7以上である3個の脂質(FFA 20:4、FFA 20:5、TG 60:13)が、口腔癌の診断のための有意な指標に選ばれた。選択された3個の脂質は、アラキドン酸(arachidonic acid)、エイコサペンタエン酸(eicosapentaenoic acid)、およびトリグリセリド(triglyceride)である。
【産業上の利用可能性】
【0083】
本開示によるアシルカルニチン代謝体は、口腔癌患者を区別する能力に優れた癌診断マーカーとして有用性を有し、また口腔癌における代謝シグナルとみなすことができることを客観的に証明した。さらに、口腔癌における非侵襲的サンプルを用いた早期診断マーカーとして潜在力を立証したため、口腔癌診断用組成物、診断キット、口腔癌関連検出/診断情報提供方法として、有用な価値がある。
【国際調査報告】