(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-07
(54)【発明の名称】リンパ節のがん侵襲を予測するための機械学習
(51)【国際特許分類】
A61B 6/03 20060101AFI20231130BHJP
G01T 1/161 20060101ALI20231130BHJP
A61B 5/055 20060101ALI20231130BHJP
A61B 8/00 20060101ALN20231130BHJP
【FI】
A61B6/03 360D
G01T1/161 D
A61B6/03 360T
A61B6/03 360J
A61B5/055 380
A61B8/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023533338
(86)(22)【出願日】2021-11-30
(85)【翻訳文提出日】2023-07-18
(86)【国際出願番号】 IB2021061125
(87)【国際公開番号】W WO2022118190
(87)【国際公開日】2022-06-09
(32)【優先日】2020-12-01
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522285451
【氏名又は名称】ジョンソン・アンド・ジョンソン・エンタープライズ・イノベーション・インコーポレイテッド
(74)【代理人】
【識別番号】100088605
【氏名又は名称】加藤 公延
(74)【代理人】
【識別番号】100130384
【氏名又は名称】大島 孝文
(72)【発明者】
【氏名】ワシュコ・ジュニア・ジョージ
(72)【発明者】
【氏名】エステパル・ラウル・サン・ホセ
(72)【発明者】
【氏名】キンゼイ・チャールズ・マシュー
(72)【発明者】
【氏名】スティーブンソン・クリストファー・スコット
【テーマコード(参考)】
4C093
4C096
4C188
4C601
【Fターム(参考)】
4C093FD03
4C093FF17
4C093FF19
4C093FF20
4C093FF28
4C093FG18
4C096AD14
4C096DC18
4C096DC28
4C096DC40
4C188EE02
4C188FF07
4C188KK24
4C601EE11
4C601EE20
4C601JC05
4C601JC06
(57)【要約】
本明細書では、モデルを訓練及び/又はデプロイして、1)個々のリンパ節侵襲のリンパ節レベルのリスク及び/又は2)リンパ節侵襲の対象レベルのリスクを決定することを含む、転移性がんの対象レベルのリスクを決定するための方法が開示される。したがって、本方法は、結節性疾患を有するリスクが高い又は低い患者を識別することができ、任意選択的に、例えば治療を介した、がん患者の誘導下介入を可能にする。
【特許請求の範囲】
【請求項1】
対象の転移性がんの対象レベルのリスクを決定するためのシステムであって、前記システムが、
前記対象の1つ又は2つ以上の画像を捕捉するように構成された撮像デバイスと、
コンピューティングデバイスと、を備え、前記コンピューティングデバイスが、
前記対象の複数のリンパ節を含む、前記対象から捕捉された1つ又は2つ以上の画像を取得するステップと、
前記取得された1つ又は2つ以上の画像の抽出された特徴にリスクモデルを適用することによって、前記転移性がんの対象レベルのリスクを予測するステップと、を行うように構成されており、前記リスクモデルが、画像内のリンパ節について、転移性がんのリンパ節(LN)レベルのリスクを予測するように訓練され、
前記リスクモデルが、少なくとも、基準個体の一組のリンパ節について、転移性がんの補完されたLNレベルのリスクから導出された標識を使用して訓練され、前記一組のリンパ節の前記補完されたLNレベルのリスクが、少なくとも、訓練画像のがん性リンパ節と非がん性リンパ節とを区別する補完モデルを使用して決定されている、システム。
【請求項2】
前記転移性がんの対象レベルのリスクを予測することが、
前記リスクモデルによって予測された転移性がんのLNレベルのリスクに基づいて、前記複数のリンパ節のうちの1つ又は2つ以上選択することと、
前記1つ又は2つ以上のリンパ節について予測された前記転移性がんのLNレベルのリスクを使用して、前記転移性がんの対象レベルのリスクを決定することと、を更に含む、請求項1に記載のシステム。
【請求項3】
前記複数のリンパ節のうちの1つ又は2つ以上を選択することが、最も高い確率のLNレベルのリスクを有する前記リンパ節を識別することを含み、前記転移性がんの対象レベルのリスクを決定することが、前記最も高い確率のLNレベルのリスクを前記転移性がんの対象レベルのリスクとして割り当てることを含む、請求項2に記載のシステム。
【請求項4】
前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有する転移性がんのLNレベルのリスクを予測する、請求項1~3のいずれか一項に記載のシステム。
【請求項5】
基準個体の前記一組のリンパ節が、
中央リスク値を決定することと、
前記基準個体の前記リンパ節の補完されたLNレベルのリスクを前記中央リスク値と比較することと、によって選択されている、請求項1~4のいずれか一項に記載のシステム。
【請求項6】
基準個体の前記一組のリンパ節が、
前記一組のリンパ節の前記中央リスク値よりも高いLNレベルのリスクを有する1つ又は2つ以上のリンパ節を含むことによって更に選択されている、請求項5に記載のシステム。
【請求項7】
前記一組のリンパ節の前記中央リスク値よりも低いLNレベルのリスクを有する1つ又は2つ以上のリンパ節が、前記一組のリンパ節から除外されている、請求項5又は6に記載のシステム。
【請求項8】
前記中央リスク値が、前記基準個体の対象内のLNレベルのリスクの中央値である、請求項5~7のいずれか一項に記載のシステム。
【請求項9】
前記撮像デバイスが、コンピュータ断層撮影(CT)スキャナ、磁気共鳴撮像(MRI)スキャナ、陽電子放出断層撮影(PET)スキャナ、X線スキャナ、又は超音波撮像装置、のうちの1つである、請求項1~8のいずれか一項に記載のシステム。
【請求項10】
前記撮像デバイスが、CTスキャナであり、前記1つ又は2つ以上の画像が、コンピュータ断層撮影(CT)画像を含む、請求項1~9のいずれか一項に記載のシステム。
【請求項11】
前記1つ又は2つ以上の画像が、胸部CT画像を含む、請求項1~10のいずれか一項に記載のシステム。
【請求項12】
前記コンピューティングデバイスが、前記予測された転移性がんの対象レベルのリスクに従って、前記がんのステージを決定するステップを実行するように更に構成されている、請求項1~11のいずれか一項に記載のシステム。
【請求項13】
前記コンピューティングデバイスが、前記予測された転移性がんの対象レベルのリスクに従って、前記対象に対する診断又は治療を選択するステップを実行するように更に構成されている、請求項1~12のいずれか一項に記載のシステム。
【請求項14】
前記対象に対する診断又は治療を選択することは、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、外科的な腫瘍切除、又は気管支鏡若しくは内視鏡による診断及び治療の組み合わせのいずれかを選択することを含む、請求項13に記載のシステム。
【請求項15】
前記対象に対する診断又は治療を選択することは、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも高いときに、PET若しくはPET-CTスキャンを行うこと、又はリンパ節生検を行うこと、のうちの一方又は両方の追加的な診断試験を選択することを含む、請求項14に記載のシステム。
【請求項16】
前記対象に対する診断又は治療を選択することは、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、PET又はPET-CTスキャンの追加的な診断試験を選択することを含む、請求項14に記載のシステム。
【請求項17】
前記補完モデルが、胸部CTスキャンから取得された訓練画像を使用して訓練されている、請求項1~15のいずれか一項に記載のシステム。
【請求項18】
胸部CTスキャンから取得された前記訓練画像が、1つ又は2つ以上のリンパ節を含む、請求項17に記載のシステム。
【請求項19】
前記補完モデルが、National Lung Screening Trial(NLST)の訓練画像を使用して訓練されている、請求項1~18のいずれか一項に記載のシステム。
【請求項20】
前記補完モデルが、カスタムデータセットの訓練画像を使用して訓練されている、請求項1~18のいずれか一項に記載のシステム。
【請求項21】
前記補完モデルが、前記訓練画像の少なくとも1つから2つ又は3つ以上のラジオミクスパネルを生成することによって訓練されている、請求項17~20のいずれか一項に記載のシステム。
【請求項22】
前記2つ又は3つ以上のラジオミクスパネルが、前記訓練画像のガウス変換のラプラシアンと、前記訓練画像のウェーブレット変換と、を含む、請求項21に記載のシステム。
【請求項23】
前記補完モデルが、前記2つ又は3つ以上のラジオミクスパネルの各々から特徴を抽出することと、少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練されている、請求項21又は22に記載のシステム。
【請求項24】
前記補完モデルが、
前記ラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記ラジオミクスパネル内の前記ROIから特徴を抽出することと、
少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練されている、請求項21又は22に記載のシステム。
【請求項25】
前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、請求項23又は24に記載のシステム。
【請求項26】
前記補完モデルが、訓練画像における転移の有無を示す基準グラウンドトゥルース値を使用して更に訓練されている、請求項17~25のいずれか一項に記載のシステム。
【請求項27】
前記基準グラウンドトゥルース値が、がんのステージを示すNステージ共変数値から導出され、「0」又は「1」のがんステージが、転移のないことを示し、「2」又は「3」のがんステージが、転移のあることを示す、請求項26に記載のシステム。
【請求項28】
前記基準グラウンドトゥルース値は、個々のリンパ節ががん性であるか非がん性であるかを示す、請求項27に記載のシステム。
【請求項29】
個々のリンパ節ががん性であるか非がん性であるかを示す前記基準グラウンドトゥルース値が、腫瘍又はリンパ節の特性に基づいて、前記Nステージ共変数値から逆算されたものである、請求項28に記載のシステム。
【請求項30】
前記補完モデルが、ランダムフォレスト分類子又はLASSO分類子である、請求項1~29のいずれか一項に記載のシステム。
【請求項31】
前記リスクモデルが、ランダムフォレスト分類子又はLASSO分類子である、請求項1~30のいずれか一項に記載のシステム。
【請求項32】
前記リスクモデルが、教師あり学習技術を使用して訓練されている、請求項31に記載のシステム。
【請求項33】
前記複数のリンパ節が、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、又は21個のリンパ節を含む、請求項1~32のいずれか一項に記載のシステム。
【請求項34】
前記複数のリンパ節が、8~20個のリンパ節、10~19個のリンパ節、12~18個のリンパ節、又は14~16個のリンパ節を含む、請求項1~33のいずれか一項に記載のシステム。
【請求項35】
前記転移性がんが、転移性肺がんである、請求項1~34のいずれか一項に記載のシステム。
【請求項36】
前記リスクモデルが、少なくともAUC=78%、感度=82%、又は特異度=60%の性能を呈する、請求項1~35のいずれか一項に記載のシステム。
【請求項37】
前記リスクモデルが、
補完モデルを適用して、訓練画像における複数のリンパ節について補完されたLNレベルのリスクを生成することと、
一組のリンパ節を選択することであって、前記一組内の前記リンパ節が、中央リスク値よりも高いLNレベルのリスクを有する、選択することと、
前記リスクモデルを訓練するための基準グラウンドトゥルースとして、前記一組のリンパ節における前記リンパ節の前記LNレベルのリスクを使用することであって、前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有するLNレベルのリスクを予測することができる、使用することと、によって訓練されている、請求項1~36のいずれか一項に記載のシステム。
【請求項38】
前記リスクモデルが、1つ又は2つ以上のラジオミクスパネルから特徴を抽出することと、少なくとも前記抽出された特徴を使用して前記リスクモデルを訓練することと、によって更に訓練されている、請求項37に記載のシステム。
【請求項39】
2つ又は3つ以上のラジオミクスパネルから特徴を抽出することが、
前記1つ又は2つ以上のラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記1つ又は2つ以上のラジオミクスパネル内の前記ROIから特徴を抽出することと、を含む、請求項38に記載のシステム。
【請求項40】
前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、請求項38又は39に記載のシステム。
【請求項41】
命令を含む非一時的なコンピュータ可読媒体であって、前記命令がプロセッサによって実行されたとき、前記プロセッサに、
前記対象の複数のリンパ節を含む、前記対象から捕捉された1つ又は2つ以上の画像を取得することと、
前記取得された1つ又は2つ以上の画像の抽出された特徴にリスクモデルを適用することによって、前記転移性がんの対象レベルのリスクを予測することであって、前記リスクモデルが、画像内のリンパ節について転移性がんのリンパ節(LN)レベルのリスクを予測するように訓練された、予測することと、を行わせ、
前記リスクモデルが、少なくとも、基準個体の一組のリンパ節について、転移性がんの補完されたLNレベルのリスクから導出された標識を使用して訓練され、前記一組のリンパ節の前記補完されたLNレベルのリスクが、少なくとも、訓練画像のがん性リンパ節と非がん性リンパ節とを区別する補完モデルを使用して決定されている、非一時的なコンピュータ可読媒体。
【請求項42】
前記プロセッサに前記転移性がんの対象レベルのリスクを予測させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、
前記リスクモデルによって予測された転移性がんのLNレベルのリスクに基づいて、前記複数のリンパ節のうちの1つ又は2つ以上を選択することと、
前記1つ又は2つ以上のリンパ節について予測された前記転移性がんのLNレベルのリスクを使用して、前記転移性がんの対象レベルのリスクを決定することと、を行わせる命令を更に含む、請求項41に記載の非一時的なコンピュータ可読媒体。
【請求項43】
前記プロセッサに前記複数のリンパ節のうちの1つ又は2つ以上を選択させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、最も高い確率のLNレベルのリスクを有するリンパ節を識別させる命令を更に含み、前記プロセッサに前記転移性がんの対象レベルのリスクを決定させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、前記最も高い確率のLNレベルのリスクを前記転移性がんの対象レベルのリスクとして割り当てさせる命令を含む、請求項42に記載の非一時的なコンピュータ可読媒体。
【請求項44】
前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有する転移性がんのLNレベルのリスクを予測する、請求項41~43のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項45】
基準個体の前記一組のリンパ節が、
中央リスク値を決定することと、
前記基準個体の前記リンパ節の補完されたLNレベルのリスクを前記中央リスク値と比較することと、によって選択されている、請求項41~44のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項46】
基準個体の前記一組のリンパ節が、前記一組のリンパ節の前記中央リスク値よりも高いLNレベルのリスクを有する1つ又は2つ以上のリンパ節を含むことによって更に選択されている、請求項45に記載の非一時的なコンピュータ可読媒体。
【請求項47】
前記一組のリンパ節の前記中央リスク値よりも低いLNレベルのリスクを有する1つ又は2つ以上のリンパ節が、前記一組のリンパ節から除外されている、請求項45又は46に記載の非一時的なコンピュータ可読媒体。
【請求項48】
前記中央リスク値が、前記基準個体の対象内のLNレベルのリスクの中央値である、請求項45~47のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項49】
前記1つ又は2つ以上の画像が、コンピュータ断層撮影(CT)画像を含む、請求項41~48のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項50】
前記1つ又は2つ以上の画像が、胸部CTスキャンから取得される、請求項41~49のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項51】
前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクに従って、前記がんのステージを決定させる命令を更に含む、請求項41~50のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項52】
前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクに従って、前記対象に対する診断又は治療を選択させる命令を更に含む、請求項41~51のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項53】
前記プロセッサに前記対象に対する診断又は治療を選択させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、外科的な腫瘍切除、又は気管支鏡若しくは内視鏡による診断及び治療の組み合わせのいずれかを選択させる命令を更に含む、請求項52に記載の非一時的なコンピュータ可読媒体。
【請求項54】
前記プロセッサに前記対象に対する診断又は治療を選択させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも高いときに、PET若しくはPET-CTスキャンを行うこと、又はリンパ節生検を行うこと、のうちの一方又は両方の追加的な診断試験を選択させる命令を更に含む、請求項52に記載の非一時的なコンピュータ可読媒体。
【請求項55】
前記プロセッサに前記対象に対する診断又は治療を選択させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、PET又はPET-CTスキャンの追加的な診断試験を選択させる命令を更に含む、請求項52に記載の非一時的なコンピュータ可読媒体。
【請求項56】
前記補完モデルが、胸部CTスキャンから取得された訓練画像を使用して訓練されている、請求項41~55のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項57】
胸部CTスキャンから取得された前記訓練画像が、1つ又は2つ以上のリンパ節を含む、請求項56に記載の非一時的なコンピュータ可読媒体。
【請求項58】
前記補完モデルが、National Lung Screening Trial(NLST)の訓練画像を使用して訓練されている、請求項41~57のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項59】
前記補完モデルが、カスタムデータセットの訓練画像を使用して訓練されている、請求項41~57のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項60】
前記補完モデルが、前記訓練画像の少なくとも1つから2つ又は3つ以上のラジオミクスパネルを生成することによって訓練されている、請求項56~59のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項61】
前記2つ又は3つ以上のラジオミクスパネルが、前記訓練画像のガウス変換のラプラシアンと、前記訓練画像のウェーブレット変換と、を含む、請求項60に記載の非一時的なコンピュータ可読媒体。
【請求項62】
前記補完モデルが、前記2つ又は3つ以上のラジオミクスパネルの各々から特徴を抽出することと、少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練されている、請求項60又は61に記載の非一時的なコンピュータ可読媒体。
【請求項63】
前記補完モデルが、
前記ラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記ラジオミクスパネル内の前記ROIから特徴を抽出することと、
少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練されている、請求項60又は61に記載の非一時的なコンピュータ可読媒体。
【請求項64】
前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、請求項62又は63に記載の非一時的なコンピュータ可読媒体。
【請求項65】
前記補完モデルが、訓練画像における転移の有無を示す基準グラウンドトゥルース値を使用して更に訓練されている、請求項56~64のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項66】
前記基準グラウンドトゥルース値が、がんのステージを示すNステージ共変数値から導出され、「0」又は「1」のがんステージが、転移のないことを示し、「2」又は「3」のがんステージが、転移のあることを示す、請求項65に記載の非一時的なコンピュータ可読媒体。
【請求項67】
前記基準グラウンドトゥルース値は、個々のリンパ節ががん性であるか非がん性であるかを示す、請求項66に記載の非一時的なコンピュータ可読媒体。
【請求項68】
個々のリンパ節ががん性であるか非がん性であるかを示す前記基準グラウンドトゥルース値が、腫瘍又はリンパ節の特性に基づいて、前記Nステージ共変数値から逆算されたものである、請求項67に記載の非一時的なコンピュータ可読媒体。
【請求項69】
前記補完モデルが、ランダムフォレスト分類子又はLASSO分類子である、請求項41~68のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項70】
前記リスクモデルが、ランダムフォレスト分類子又はLASSO分類子である、請求項41~69のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項71】
前記リスクモデルが、教師あり学習技術を使用して訓練されている、請求項70に記載の非一時的なコンピュータ可読媒体。
【請求項72】
前記複数のリンパ節が、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、又は21個のリンパ節を含む、請求項41~71のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項73】
前記複数のリンパ節が、8~20個のリンパ節、10~19個のリンパ節、12~18個のリンパ節、又は14~16個のリンパ節を含む、請求項41~72のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項74】
前記転移性がんが、転移性肺がんである、請求項41~73のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項75】
前記リスクモデルが、少なくともAUC=78%、感度=82%、又は特異度=60%の性能を呈する、請求項41~74のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項76】
前記リスクモデルが、
補完モデルを適用して、訓練画像における複数のリンパ節について補完されたLNレベルのリスクを生成することと、
一組のリンパ節を選択することであって、前記一組内の前記リンパ節が、中央リスク値よりも高いLNレベルのリスクを有する、選択することと、
前記リスクモデルを訓練するための基準グラウンドトゥルースとして、前記一組のリンパ節における前記リンパ節の前記LNレベルのリスクを使用することであって、前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有するLNレベルのリスクを予測することができる、使用することと、によって訓練されている、請求項41~75のいずれか一項に記載の非一時的なコンピュータ可読媒体。
【請求項77】
前記リスクモデルが、1つ又は2つ以上のラジオミクスパネルから特徴を抽出することと、少なくとも前記抽出された特徴を使用して前記リスクモデルを訓練することと、によって更に訓練されている、請求項76に記載の非一時的なコンピュータ可読媒体。
【請求項78】
2つ又は3つ以上のラジオミクスパネルから特徴を抽出することが、
前記1つ又は2つ以上のラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記1つ又は2つ以上のラジオミクスパネル内の前記ROIから特徴を抽出することと、を含む、請求項77に記載の非一時的なコンピュータ可読媒体。
【請求項79】
前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、請求項76又は77に記載の非一時的なコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2020年12月1日に出願された米国特許仮出願第63/120,102号の利益及び優先権を主張するものであり、その開示全体は、全ての目的のために参照によりその全体が組み込まれる。
【背景技術】
【0002】
胸部のコンピュータ断層撮影(computed tomographic、CT)撮像は、肺がんのリスクがある人々を評価するための臨床標準になっている。こうした取り組みは、最も初期の最も根治可能なステージにある疾患を表し得る肺結節の検出に重点を置いている。そのような肺結節の検出は、それががん性のものであるかどうか、がん性のものである場合には、それが胸部内の他の構造に、更には体の遠隔領域に広がっているかどうか決定するためのより広範な臨床評価のきっかけとなる。これは、肺がんのステージを決定するために行われ、それによって、治療介入の計画が決定される。
【0003】
肺がんステージングの一態様は、胸部リンパ節(結節状態)における肺がんの有無の決定である。現在の治療標準は、最初に、結節が良性であるか悪性であるかを決定し、次いで、リンパ節の陽電子放出断層撮影(positron emission tomography、PET)スキャン及び外科的、内視鏡的、又は気管支鏡ベースのサンプリングなどの追加的な試験を完了する、段階的アプローチを含む。組織サンプリング処置により、精密検査のリスク、出費、及び時間が増加する。こうしたリスクを軽減し、かつ診断と治療との間の時間を短縮するための、新しい非観血的な方法が必要である。本明細書で更に詳細に説明するように、肺がんスクリーニングに使用される初期胸部CTスキャンに適用される機械学習及び深層学習ベースの技術は、こうした必要性に対処することができる。
【0004】
肺がんの検出、ステージング、及び治療計画は、数週間又は数ヶ月かかり得る多段階のプロセスである。そのような臨床精密検査のリスク及び出費に加えて、このプロセスに必要とされる追加の時間は、患者に相当な不安をもたらし、間隔転移の可能性を高める。実際、診断から治療までの時間がより長いことは、全生存の悪化と関連付けられている。こうした懸念を軽減するための例示的なアプローチは、がんのほぼ同時の診断/ステージング、療法への気管支鏡アプローチの場合は、ほぼ同時の診断/治療を可能にするものである。
【発明の概要】
【課題を解決するための手段】
【0005】
本明細書に開示される本発明の実施形態は、高リスク集団において肺がんをスクリーニングするために使用される胸部CTスキャンの分析に基づくものである。いくつかの態様では、胸部の少なくとも1つのリンパ節(lymph node、LN)に転移しており、したがって、PETスキャン及びリンパ節生検などの追加的な試験を必要とするがんのリスクが高い患者を識別する。これは、臨床提供者(臨床提供者)が、試験を最も必要とする患者に試験を優先することを可能にする。その逆に、リンパ節転移を有するリスクが低い、肺がんが疑われる患者は、外科的切除又は気管支鏡による診断及び治療の組み合わせなどの、即時の治療に直接進むことができる。これにより、疾患の診断と治療との間の時間が排除される。具体的には、本明細書に開示される本発明の実施形態は、結節性疾患のリスクが高い又は低い患者の識別を可能にし、したがって、臨床医が、高リスクの個体には追加的な試験を優先すること、又は転移リスクの低い肺がん患者は気管支鏡による確認的な生検にすぐに進ませ、その直後に気管支鏡的に治療を行うこと、のいずれかを行うことを可能にする。
【0006】
本明細書では、対象の転移性がんの対象レベルのリスクを決定する方法が開示され、本方法は、対象の複数のリンパ節を含む、対象から捕捉された1つ又は2つ以上の画像を取得することと、取得された1つ又は2つ以上の画像の抽出された特徴にリスクモデルを適用することによって、転移性がんの対象レベルのリスクを予測することと、を含み、リスクモデルは、画像内のリンパ節について転移性がんのリンパ節(LN)レベルのリスクを予測するように訓練され、リスクモデルは、少なくとも、基準個体の一組のリンパ節について、転移性がんの補完されたLNレベルのリスクから導出された標識を使用して訓練され、一組のリンパ節の補完されたLNレベルのリスクは、少なくとも、訓練画像のがん性リンパ節と非がん性リンパ節とを区別する補完モデルを使用して決定される。様々な実施形態では、転移性がんの対象レベルのリスクを予測することは、リスクモデルによって予測された転移性がんのLNレベルのリスクに基づいて、複数のリンパ節のうちの1つ又は2つ以上選択することと、1つ又は2つ以上のリンパ節について予測された転移性がんのLNレベルのリスクを使用して、転移性がんの対象レベルのリスクを決定することと、を更に含む。
【0007】
様々な実施形態では、複数のリンパ節のうちの1つ又は2つ以上選択することは、最も高い確率のLNレベルのリスクを有するリンパ節を識別することを含み、転移性がんの対象レベルのリスクを決定することは、最も高い確率のLNレベルのリスクを転移性がんの対象レベルのリスクとして割り当てることを含む。様々な実施形態では、リスクモデルは、補完モデルによって予測された補完されたLNレベルのリスクよりも広い確率の範囲を有する転移性がんのLNレベルのリスクを予測する。様々な実施形態では、基準個体の一組のリンパ節は、中央リスク値を決定することと、基準個体のリンパ節の補完されたLNレベルのリスクを中央リスク値と比較することと、によって選択される。様々な実施形態では、基準個体の一組のリンパ節は、一組のリンパ節の中央リスク値よりも高いLNレベルのリスクを有する1つ又は2つ以上のリンパ節を含むことによって更に選択される。様々な実施形態では、一組のリンパ節の中央リスク値よりも低いLNレベルのリスクを有する1つ又は2つ以上のリンパ節が、一組のリンパ節から除外される。
【0008】
様々な実施形態では、中央リスク値は、基準個体の対象内のLNレベルのリスクの中央値である。様々な実施形態では、1つ又は2つ以上の画像は、コンピュータ断層撮影(computed tomography、CT)画像を含む。様々な実施形態では、1つ又は2つ以上の画像は、胸部CTスキャンから取得される。様々な実施形態では、本明細書に開示される方法は、予測された転移性がんの対象レベルのリスクに従って、がんのステージを決定することを更に含む。様々な実施形態では、本明細書に開示される方法は、予測された転移性がんの対象レベルのリスクに従って、対象に対する診断又は治療を選択することを更に含む。様々な実施形態では、対象に対する診断又は治療を選択することは、予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、外科的な腫瘍切除、又は気管支鏡若しくは内視鏡による診断及び治療の組み合わせのいずれかを選択することを含む。様々な実施形態では、対象に対する診断又は治療を選択することは、予測された転移性がんの対象レベルのリスクが閾値リスク値よりも高いときに、PET若しくはPET-CTスキャンを行うこと、又はリンパ節生検を行うこと、のうちの一方又は両方から追加的な診断試験を選択することを含む。
【0009】
様々な実施形態では、補完モデルは、胸部CTスキャンから取得された訓練画像を使用して訓練される。様々な実施形態では、胸部CTスキャンから取得された訓練画像は、1つ又は2つ以上のリンパ節を含む。様々な実施形態では、補完モデルは、National Lung Screening Trial(NLST)の訓練画像を使用して訓練される。様々な実施形態では、補完モデルは、カスタムデータセットの訓練画像を使用して訓練される。
【0010】
様々な実施形態では、補完モデルは、訓練画像の少なくとも1つから2つ又は3つ以上のラジオミクスパネルを生成することによって訓練される。様々な実施形態では、2つ又は3つ以上のラジオミクスパネルは、訓練画像のガウス変換のラプラシアンと、訓練画像のウェーブレット変換と、を含む。様々な実施形態では、補完モデルは、2つ又は3つ以上のラジオミクスパネルの各々から特徴を抽出することと、少なくとも抽出された特徴を使用して、補完モデルを訓練することと、によって更に訓練される。様々な実施形態では、補完モデルは、ラジオミクスパネル内の関心領域(region of interest、ROI)を画定することであって、画定された関心領域が、リンパ節を含む、画定することと、ラジオミクスパネル内のROIから特徴を抽出することと、少なくとも抽出された特徴を使用して、補完モデルを訓練することと、によって更に訓練される。様々な実施形態では、抽出された特徴は、一次特徴、形状特徴、グレーレベル共起行列1(gray level co-occurrence matrix、GLCM)特徴、グレーレベルランレングス行列(gray level run length matrix、GLRLM)特徴、グレーレベルサイズゾーン行列(gray level size zone matrix、GLSZM)特徴、及び近傍グレートーン差分行列(neighborhood gray tone difference matrix、NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む。
【0011】
様々な実施形態では、補完モデルは、訓練画像における転移の有無を示す基準グラウンドトゥルース値を使用して更に訓練される。様々な実施形態では、基準グラウンドトゥルース値は、がんのステージを示すNステージ共変数値から導出され、「0」又は「1」のがんステージは、転移のないことを示し、「2」又は「3」のがんステージは、転移のあることを示す。様々な実施形態では、基準グラウンドトゥルース値は、個々のリンパ節ががん性であるか非がん性であるかを示す。様々な実施形態では、個々のリンパ節ががん性であるか非がん性であるかを示す基準グラウンドトゥルース値は、腫瘍又はリンパ節の特性に基づいて、Nステージ共変数値から逆算される。
【0012】
様々な実施形態では、補完モデルは、ランダムフォレスト分類子又はLASSO分類子である。様々な実施形態では、リスクモデルは、ランダムフォレスト分類子又はLASSO分類子である。様々な実施形態では、リスクモデルは、教師あり学習技術を使用して訓練される。様々な実施形態では、複数のリンパ節は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、又は21個のリンパ節を含む。様々な実施形態では、複数のリンパ節は、8~20個のリンパ節、10~19個のリンパ節、12~18個のリンパ節、又は14~16個のリンパ節を含む。様々な実施形態では、転移性がんは、転移性肺がんである。様々な実施形態では、リスクモデルは、少なくともAUC=78%、感度=82%、又は特異度=60%の性能を呈する。
【0013】
追加的に、本明細書では、請求項1~35のいずれか一項に記載のリスクモデルを訓練する方法が開示され、本方法は、補完モデルを適用して、訓練画像における複数のリンパ節について補完されたLNレベルのリスクを生成することと、一組のリンパ節を選択することであって、一組内のリンパ節が、中央リスク値よりも高いLNレベルのリスクを有する、選択することと、リスクモデルを訓練するための基準グラウンドトゥルースとして、一組のリンパ節におけるリンパ節のLNレベルのリスクを使用することであって、リスクモデルが、補完モデルによって予測された補完されたLNレベルのリスクよりも広い確率の範囲を有するLNレベルのリスクを予測することができる、使用することと、を含む。様々な実施形態では、リスクモデルは、1つ又は2つ以上のラジオミクスパネルから特徴を抽出することと、少なくとも抽出された特徴を使用してリスクモデルを訓練することと、によって更に訓練されている。様々な実施形態では、2つ又は3つ以上のラジオミクスパネルから特徴を抽出することは、1つ又は2つ以上のラジオミクスパネル内の関心領域(ROI)を画定することであって、画定された関心領域が、リンパ節を含む、画定することと、1つ又は2つ以上のラジオミクスパネル内のROIから特徴を抽出することと、を含む。様々な実施形態では、抽出された特徴は、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む。
【0014】
追加的に、本明細書では、上で説明した方法を行うためのシステムが開示される。様々な実施形態では、対象の転移性がんの対象レベルのリスクを決定するためのシステムは、対象の1つ又は2つ以上の画像を捕捉するように構成された撮像デバイスと、コンピューティングデバイスと、を備え、コンピューティングデバイスが、対象の複数のリンパ節を含む、対象から捕捉された1つ又は2つ以上の画像を取得するステップと、取得された1つ又は2つ以上の画像の抽出された特徴にリスクモデルを適用することによって、転移性がんの対象レベルのリスクを予測するステップと、を行うように構成されており、リスクモデルが、画像内のリンパ節について、転移性がんのリンパ節(LN)レベルのリスクを予測するように訓練され、リスクモデルは、少なくとも、基準個体の一組のリンパ節について、転移性がんの補完されたLNレベルのリスクから導出された標識を使用して訓練され、一組のリンパ節の補完されたLNレベルのリスクは、少なくとも、訓練画像のがん性リンパ節と非がん性リンパ節とを区別する補完モデルを使用して決定されている。
【0015】
追加的に、本明細書では、上で説明した方法を行うための非一時的なコンピュータ可読媒体が開示される。様々な実施形態では、命令を含む非一時的なコンピュータ可読媒体は、当該命令がプロセッサによって実行されたとき、プロセッサに、対象の複数のリンパ節を含む、対象から捕捉された1つ又は2つ以上の画像を取得することと、取得された1つ又は2つ以上の画像の抽出された特徴にリスクモデルを適用することによって、転移性がんの対象レベルのリスクを予測することであって、リスクモデルが、画像内のリンパ節について転移性がんのリンパ節(LN)レベルのリスクを予測するように訓練された、予測することと、を行わせ、リスクモデルは、少なくとも、基準個体の一組のリンパ節について、転移性がんの補完されたLNレベルのリスクから導出された標識を使用して訓練され、一組のリンパ節の補完されたLNレベルのリスクは、少なくとも、訓練画像のがん性リンパ節と非がん性リンパ節とを区別する補完モデルを使用して決定される。
【図面の簡単な説明】
【0016】
本発明のこれら及び他の特徴、態様及び利点は、以下の説明及び添付の図面に関してより良く理解されるであろう。
【
図1A】一実施形態による、対象の転移性がんの対象レベルのリスクを決定することによるがんステージングのためのシステム環境の概要を表す。
【
図1B】一実施形態による、がんステージングシステムのブロック図を表す。
【
図2A】一実施形態による、リンパ節ステーションを識別する例示的なリンパ節マップを表す。
【
図2B】一実施形態による、例示的なリンパ節のアノテーションである。
【
図3A】一実施形態による、補完モデル及びリスクモデルの例示的な実装を表す。
【
図3B】一実施形態による、リスクモデルの実装を更に詳細に表す。
【
図5A】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5B】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5C】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5D】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5E】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5F】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5G】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5H】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5I】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5J】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5K】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5L】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5M】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5N】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5O】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5P】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5Q】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図5R】異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。
【
図7A】LNレベル分類子によって予測された最も高い確率スコアを使用した対象レベル性能を表す。
【
図7B】LNレベル分類子によって予測された最も高い確率スコアを使用した対象レベル性能を表す。
【
図8】2つのステップブートストラップアプローチにおける補完モデルのリンパ節レベル性能を表す。
【
図9A】ブートストラップアプローチを使用した対象レベル性能を表す。
【
図9B】ブートストラップアプローチを使用した対象レベル性能を表す。
【0017】
可能である場合は、類似又は同様の参照番号が図において使用され得、これらの参照番号は、類似又は同様の機能性を示し得ることに留意されたい。例えば、「個体315A」などの参照番号の後の文字は、その文がその特定の参照番号を有する要素を具体的に指すことを示す。「個体315」などの後続の文字を伴わない文中の参照番号は、その参照番号が付された図面内の要素のいずれか又は全てを指す(例えば、文中の「個体315」は、図面中の参照番号「個体315A」、「個体315B」、「個体315C」、及び「個体315D」を指す)。
【発明を実施するための形態】
【0018】
I.定義
特許請求の範囲及び明細書で使用される用語は、特に明記しない限り、以下に記載されるように定義される。
【0019】
「対象」という用語は、インビボ、エクスビボ、又はインビトロ、男性又は女性にかかわらず、細胞、組織、又は生物、ヒト又は非ヒトを包含する。
【0020】
「哺乳動物」という用語は、ヒト及び非ヒトの両方を包含し、ヒト、非ヒト霊長類、イヌ、ネコ、マウス、ウシ、ウマ、及びブタを含むが、これらに限定されない。
【0021】
「試験試料」の「試料」という用語は、静脈穿刺、排泄、射精、マッサージ、生検、針吸引剤、洗浄試料、掻き取り、外科的切開、若しくは介入、又は当該技術分野で既知の他の手段を含む手段によって、対象から採取された、単一の細胞若しくは複数の細胞、又は細胞の断片、又は血液試料など体液のアリコートを含むことができる。身体流体のアリコートの例としては、羊水、房水、胆汁、リンパ、母乳、間質液、血液、血漿、耳垢(イヤワックス)、カウパ腺液(尿道球腺液)、乳糜、糜粥、スキーン腺液(female ejaculate)、経血、粘液、唾液、尿、嘔吐物、涙、膣液、汗、血清、精液、皮脂、膿、胸水、脳脊髄液、滑液、細胞内流体、及び硝子体液が挙げられる。
【0022】
「基準個体」という用語は、既知のがんステージングを有する個体を指す。例えば、基準個体は、健康な個体(例えば、対照個体)を含むことができる。別の例として、基準個体は、がんがあると以前に診断及びステージングされた個体を含むことができる。別の例として、基準個体は、リンパ節に転移したがん、例えばステージIVのがんがあると以前に診断された個体を含む。
【0023】
「1つ又は2つ以上の画像を取得する」という用語は、対象から捕捉された1つ又は2つ以上の画像を取得するか、又は対象から得られた試料から捕捉された1つ又は2つ以上の画像を取得することを包含する。1つ又は2つ以上の画像を取得することは、対象から又は対象から得た試料から1つ又は2つ以上の画像を捕捉するステップを行うことを包含することができる。このフレーズはまた、例えば、対象から1つ又は2つ以上の画像を捕捉するステップを実行した第三者から、又は対象から得た試料から、1つ又は2つ以上の画像を受信することを包含することができる。1つ又は2つ以上の画像は、記憶装置に記憶されることを含む様々な既知の方式を介して、当業者によって取得され得る。
【0024】
「リンパ節侵襲」、「リンパ節転移」、又は「リンパ節がん」という用語は、対象の1つ又は2つ以上のリンパ節における転移性がんの有無を指す。
【0025】
「リンパ節転移のリスク」、「リンパ節レベルのリスク」、及び「LNレベルのリスク」という用語は、互換的に使用され、一般に、特定のリンパ節における転移性がんのリスクを指す。
【0026】
「転移性がんの対象レベルのリスク」又は「転移性がんの患者レベルのリスク」というフレーズは、互換的に使用され、対象のがんが転移した可能性を指す。様々な実施形態では、対象のがんは、対象の1つ又は2つ以上のリンパ節に転移した肺がんである。
【0027】
「がんステージ」又は「がんのステージ」という用語は、対象のがんのステージを指す。がんステージは、ステージ0~4を含む、TNMステージングシステムを指すことができる。追加的に、がんステージは、結節性がんステージ0~3を指すことができる。結節性がんステージ0は、結節性侵襲を示さず、結節性がんステージ1は、肺門結節性侵襲を示し、結節性ステージ2又は3は、縦隔侵襲を示す。
【0028】
本明細書で使用する場合、単数形「a」、「an」、及び、「the」は、文脈が明らかにそうでないことを指示していない限り、複数の引用物を含むことに留意しなければならない。
【0029】
II.システム環境の概要
図1Aは、一実施形態による、対象の転移性がんの対象レベルのリスクを決定することによるがんステージングのためのシステム環境の概要100を表す。システム環境100は、対象110、撮像デバイス120、及びがん予測140を決定するためのがんステージングシステム130を導入するためにコンテキストを提供する。様々な実施形態では、がんステージングシステム130によって決定されたがん予測140は、対象110のがんステージングとしての役割を果たす。様々な実施形態では、がんステージングシステム130によって決定されたがん予測140は、対象110の予測されたリスクレベルであり、対象110のがんステージングを決定するための基礎としての役割を果たす。
【0030】
様々な実施形態では、対象は、健康である。したがって、本明細書に記載のがんステージングのための方法は、健康な対象のがんの早期発見に有益であり得る。様々な実施形態では、対象は、がんと以前に診断された。様々な実施形態では、対象は、健康であるが、ある形態のがんが疑われる(例えば、がんと関連付けられた症状を呈している対象)。特定の実施形態では、対象におけるがんの種類は、肺がんである。したがって、本明細書に記載のがんステージングのための方法は、リンパ節侵襲を含む転移性がんのリスクが高い対象、及びリンパ節転移を有するリスクが低い、肺がんが疑われる対象を識別及び区別するのに有益であり得る。転移性がんのリスクが高い対象は、PETスキャン及びリンパ節生検などの追加的な試験を受けることができ、一方で、リンパ節転移を有するリスクが低い対象は、肺がんの外科的切除又は気管支鏡による診断及び治療の組み合わせなどの即時の治療を受けることができる。
【0031】
様々な実施形態では、撮像デバイス120は、更なる分析のために、対象110から画像を捕捉する。様々な実施形態では、撮像デバイス120は、対象110から取得した試験試料から画像を捕捉する。画像及び/又は試料は、個体によって、又はサードパーティ、例えば医療提供者又は医療専門家によって取得することができる。医療専門家の例としては、医師、緊急医療技術者、看護師、第一対応者、心理学者、フレボトミスト、理学療法要員、ナースプラクティショナ、外科医、歯科医、及び当業者に知られているような任意の他の明らかな医療専門家が含まれる。
【0032】
いくつかの実施形態では、撮像デバイス120は、対象110の解剖学的位置の画像を捕捉する。対象の例示的な解剖学的位置は、肺、胸腔、腎臓、肝臓、膵臓、脳、胃、腸、股関節、膝、脚、腕、及び顔を含むことができる。様々な実施形態では、撮像デバイス120は、対象110の胸腔の画像を捕捉する。様々な実施形態では、撮像デバイス120は、対象110の1つ又は2つ以上のリンパ節の画像を捕捉する。様々な実施形態では、撮像デバイス120は、対象110の1つ又は2つ以上のリンパ節を含む胸腔の画像を捕捉する。
【0033】
様々な実施形態では、撮像デバイス120は、コンピュータ断層撮影(CT)スキャナ、磁気共鳴撮像(magnetic resonance imaging、MRI)スキャナ、陽電子放出断層撮影(positron emission tomography、PET)スキャナ、X線スキャナ、又は超音波撮像デバイスのうちの1つである。特定の実施形態では、撮像デバイス120は、対象110の1つ又は2つ以上の画像を捕捉するCTスキャナである。特定の実施形態では、撮像デバイス120は、対象110の1つ又は2つ以上のリンパ節を含む胸腔の1つ又は2つ以上のCT画像を捕捉するCTスキャナである。
【0034】
一般に、がんステージングシステム130は、1つ又は2つ以上の画像(例えば、撮像デバイス120によって捕捉される画像)を分析して、がん予測140を生成する。様々な実施形態では、がん予測140は、対象110のがんの予測ステージであり得る。様々な実施形態では、がん予測140は、対象110のがんリンパ節侵襲の予測された可能性であり得る。様々な実施形態では、がん予測140は、推奨される臨床アプローチ(例えば、PETスキャン及びリンパ節生検などの追加的な試験)又は治療(例えば、外科的切除及び/若しくは薬物治療)を含むことができる。がんステージングシステム130は、
図4に関して下で考察されるように、コンピュータシステム400として具現化された1つ又は2つ以上のコンピュータを含むことができる。したがって、様々な実施形態では、がんステージングシステム130を参照して説明するステップは、インシリコで行われる。
【0035】
様々な実施形態では、撮像デバイス120及びがんステージングシステム130は、異なるパーティによって用いられる。例えば、第1のパーティは、撮像デバイス120 120を操作して、対象110から1つ又は2つ以上の画像を捕捉し、次いで、捕捉された1つ又は2つ以上の画像を、がん予測140を決定するためにがんステージングシステム130を実装する第2のパーティに提供する。
【0036】
ここで、一実施形態による、がんステージングシステム130のコンピュータ論理構成要素を例示するブロック図を表す、
図1Bを参照する。具体的には、がんステージングシステム130は、リンパ節特徴モジュール145と、補完モジュール150と、リスク訓練モジュール155と、リスクデプロイモジュール160と、がん予測モジュール165と、訓練データストア170と、を含み得る。
【0037】
一般に、リンパ節特徴モジュール145は、対象又は訓練対象から導出された画像から特徴を抽出する。補完モジュール150は、補完モデルを訓練及びデプロイする。補完モデルは、抽出された特徴を分析して、画像内の各リンパ節についてがんのリンパ節レベルのリスクを決定する。リスク訓練モジュール155は、補完モデルによって決定された少なくともがんのリンパ節レベルのリスクを含む訓練データを使用して、リスクモデルを訓練する。リスクデプロイモジュール160は、対象(例えば、
図1Aの対象110)から取得された画像から抽出された特徴を分析して、対象110の患者レベルの転移リスク又はがんステージの予測などのがん予測を決定するために、リスクモデルを実装する。換言すれば、がんステージングシステム130は、少なくとも2つのモデル(例えば、補完モデル及びリスクモデル)を訓練及び実装する。したがって、少なくとも2つのモデルを含むこのマルチステップ実装を通して、がんステージングシステム130は、対象の対象レベル転移リスク又はがんステージの予測などのがん予測を生成する。
【0038】
補完モデル及びリスクモデルの両方の実装は、向上したがん予測をもたらす。具体的には、補完モデルは、対象レベルのNステージの訓練データから学習し、リンパ節の抽出された特徴に適用されて、どのリンパ節が陽Nステージに関与する可能性が高いかを定義する。次いで、リスクモデルは、補完されたデータから、より精緻化されたリンパ節転移リスク確率を学習する。ここで、リスクモデルは、補完モデルによって予測された補完されたLNレベルのリスクよりも広い確率の範囲を有する転移性がんのLNレベルのリスクを予測する。これは、転移性がんの対象レベルのリスクのより正確な決定を可能にする。
【0039】
がんステージングシステム130の構成要素は、以下、2つの段階、すなわち、1)訓練段階、及び2)デプロイ段階、を参照して説明する。より具体的には、訓練段階は、基準個体(例えば、既知のがんステージングを有する個体)から捕捉された訓練画像などの訓練データに基づく、1つ又は2つ以上のモデルの構築及び訓練を指す。したがって、モデルは、デプロイ段階中に、モデルの実装が対象(例えば、
図1Aの対象110)のがんステージングの予測を可能にするように、訓練データを使用して訓練されている。様々な実施形態では、補完モジュール150はまた、モデルを訓練及びデプロイするために実装することができ、以下、補完モデルと称する。したがって、補完モジュール150は、訓練段階中に補完モデルを訓練し、デプロイ段階中に補完モデルをデプロイする。
【0040】
いくつかの実施形態では、がんステージングシステム130の構成要素は、訓練段階及びデプロイ段階のうちの1つの間に適用される。例えば、リスク訓練モジュール155及び訓練データストア170は、訓練段階中にリスクモデルを訓練するために適用される。追加的に、リスクデプロイモジュール160は、デプロイ段階中に適用される。様々な実施形態では、がんステージングシステム130の構成要素は、構成要素が訓練段階中に適用されたか、デプロイ段階中に適用されたかに依存して、異なるパーティによって実行することができる。そのようなシナリオでは、予測モデルの訓練及びデプロイは、異なるパーティによって実行される。例えば、訓練段階中に適用されるリスク訓練モジュール155及び訓練データストア170は、(例えば、リスクモデルを訓練する)第1のパーティによって用いられ、デプロイ段階中に使用されるリスクデプロイモジュール160は、(例えば、リスクモデルをデプロイする)第2のパーティによって実行され得る。同様に、補完モジュール150は、第1のパーティによって補完モデルを訓練するために使用することができ、補完モジュール150は、第2のパーティによって補完モデルをデプロイするために使用することができる。
【0041】
III.がんステージングのための方法
本明細書に記載の実施形態は、対象から捕捉された1つ又は2つ以上の画像を分析し、1つ又は2つ以上のモデルを適用して、リンパ節を含む転移性がんリスクの対象レベルを決定することによるがんステージングのための方法を含む。そのような方法は、
図1Bに記載のがんステージングシステム130によって実行することができる。
【0042】
図1Bのがんステージングシステム130のモジュールを参照すると、リンパ節特徴モジュール145は、1つ又は2つ以上の画像を分析して、1つ又は2つ以上の画像から特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、基準個体から取得された訓練画像から特徴を抽出する。下で更に詳細に説明するように、訓練画像から抽出されたこれらの特徴を使用して、補完モデルなどの1つ又は2つ以上のモデルを訓練することができる。様々な実施形態では、リンパ節特徴モジュール145は、対象(例えば、
図1Aの対象110)から取得された特徴画像を抽出する。下で更に詳細に説明するように、対象から取得された画像から抽出されたこれらの特徴は、リスクモデルなどのモデルをデプロイすることによって分析することができる。
【0043】
様々な実施形態では、1つ又は2つ以上の画像又は訓練画像は、画像内に1つ又は2つ以上のリンパ節を含む。例えば、画像又は訓練画像は、1つ又は2つ以上のリンパ節を含む胸腔の画像であり得る。様々な実施形態では、画像は、少なくとも2つのリンパ節を含む。様々な実施形態では、画像は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、又は21個のリンパ節を含む。様々な実施形態では、画像は、1~10個のリンパ節、1~15個のリンパ節、2~10個のリンパ節、2~15個のリンパ節、2~20個のリンパ節、4~10個のリンパ節、4~15個のリンパ節、4~20個のリンパ節、5~10個のリンパ節、5~15個のリンパ節、5~20個のリンパ節、8~15個のリンパ節、8~20個のリンパ節、10~15個のリンパ節、10~20個のリンパ節、12~15個のリンパ節、12~20個のリンパ節、又は15~20個のリンパ節を含む。様々な実施形態では、単一の対象又は基準個体から複数の画像が捕捉される。複数の画像は、対象又は基準個体の異なるリンパ節を捕捉することができる。様々な実施形態では、複数の画像は、少なくとも2つのリンパ節を含む。様々な実施形態では、複数の画像は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、又は21個のリンパ節を含む。様々な実施形態では、複数の画像は、8~20個のリンパ節を含む。様々な実施形態では、複数の画像は、10~19個のリンパ節、12~18個のリンパ節、又は14~16個のリンパ節を含む。
【0044】
図2Aは、一実施形態による、リンパ節ステーションを識別する例示的なリンパ節マップを表す。より具体的には、
図2Aは、米国胸部学会(American Thoracic Society)マッピングスキームから抜粋した所属リンパ節分類の描写である。ここで、リンパ節ステーションには、各リンパ節の位置及び分類を表すためにアノテーションされる。具体的には、アノテーションは、以下の通りである。(1)鎖骨上リンパ節、(2R/2L)上傍気管リンパ節、(3A)血管前リンパ節、(3P)椎骨前リンパ節、(4R/4L)傍気管リンパ節、(5)大動脈下リンパ節、(6)傍大動脈リンパ節、(7)気管支分岐部下リンパ節、(8)傍食道リンパ節、(9)肺間膜リンパ節、(10)肺門リンパ節、(11)葉間リンパ節、(12)肺葉リンパ節、(13)分節リンパ節、及び(14)副分節リンパ節。
【0045】
リンパ節特徴モジュール145は、画像内の1つ又は2つ以上のリンパ節にアノテーションする。様々な実施形態では、リンパ節特徴モジュール145は、リンパ節の周りに領域を画定することによって、1つ又は2つ以上のリンパ節にアノテーションする。様々な実施形態では、画定されたリンパ節の周りの領域は、球状領域である。様々な実施形態では、球状領域は、Xmmの半径を有する。様々な実施形態では、Xは、5mmである。様々な実施形態では、Xは、7.5mmである。いくつかの実施形態では、Xは、0.5mm、1mm、1.5mm、2mm、2.5mm、3mm、3.5mm、4mm、4.5mm、5.5mm、6mm、6.5mm、7mm、8mm、8.5mm、9mm、9.5mm、10mm、10.5mm、11mm、11.5mm、12mm、12.5mm、13mm、13.5mm、14mm、14.5mm、又は15mmである。様々な実施形態では、Xは、1~15mmである。様々な実施形態では、Xは、2~12mmである。様々な実施形態では、Xは、3~10mmである。様々な実施形態では、Xは、4~8mmである。様々な実施形態では、Xは、5~7.5mmである。様々な実施形態では、Xは、4~6mmである。様々な実施形態では、Xは、6~8mmである。様々な実施形態では、Xは、7~8mmである。様々な実施形態では、Xは、10~15mmである。
【0046】
様々な実施形態では、リンパ節特徴モジュール145は、リンパ節の周りに2つ以上の球状領域を画定することによって、1つ又は2つ以上のリンパ節にアノテーションする。例えば、リンパ節特徴モジュール145は、リンパ節の周りの5mmの第1の球状範囲、及びリンパ節の周りの7.5mmの第2の球状範囲を画定することによって、1つ又は2つ以上のリンパ節にアノテーションする。
図2Bは、一実施形態による、例示的なリンパ節のアノテーションである。具体的には、
図2Bは、2つの2R上傍気管リンパ節の周りに画定された2つの球状領域を表す。
【0047】
様々な実施形態では、リンパ節特徴モジュール145は、リンパ節の周りに各々画定された領域から特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、元の入力の変換を行って変換された画像を生成し、次いで、その画像から追加的な特徴を抽出する。一実施形態では、リンパ節特徴モジュール145は、元の画像のウェーブレット変換を行う。一実施形態では、リンパ節特徴モジュール145は、元の画像のガウシアンのラプラシアン(Laplacian of Gaussian、LoG)を実行する。したがって、リンパ節特徴モジュール145は、変換された画像の内のリンパ節の周りに画定された領域から特徴を抽出することができる。様々な実施形態では、リンパ節特徴モジュール145は、元の画像及び変換された画像の内のリンパ節の周りに画定された領域から特徴を抽出する。
【0048】
特定の実施形態では、リンパ節特徴モジュール145は、元の画像の2つの変換(例えば、元の画像のウェーブレット変換、元の画像のガウシアンのラプラシアン(LoG)の両方)を実行する。したがって、リンパ節特徴モジュール145は、第1の変換された画像及び第2の変換された画像のリンパ節の周りに画定された領域から特徴を抽出することができる。様々な実施形態では、リンパ節特徴モジュール145は、元の画像、第1の変換された画像、及び第2の変換された画像のリンパ節の周りに画定された領域から特徴を抽出する。
【0049】
元の画像、第1の変換された画像、及び/又は第2の変換された画像からの特徴の例示的なカテゴリとしては、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴を挙げることができる。一次特徴は、強度値の一次統計の特徴を指す。GLCM特徴は、画像上の所与のオフセットにおける共起グレースケール値の棒グラフに由来する。GLRLM特徴は、グレーレベルランレングス行列の統計を含む。GLSZM特徴は、グレーレベルサイズゾーン行列の統計を含む。NGTDM特徴は、近傍のグレートーン差分行列の統計を含む。異なる特徴カテゴリにおける特徴の例としては、相関特徴、LMC2、MCC、差分エントロピ、結合エントロピ、総エントロピ、クラスタプロミネンス、差分平均、結合平均、総平均、自己相関、差分分散、コントラスト、クラスタ傾向、総平方、LDMN、LDN、クラスタシェード、LMC1、逆分散、LD、LDM、結合エネルギー、及び最高確率が挙げられる。
【0050】
様々な実施形態では、リンパ節特徴モジュール145は、画像から少なくとも50個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、画像から、少なくとも100個の特徴、少なくとも150個の特徴、少なくとも200個の特徴、少なくとも250個の特徴、少なくとも300個の特徴、少なくとも350個の特徴、少なくとも400個の特徴、少なくとも450個の特徴、少なくとも500個の特徴、少なくとも550個の特徴、少なくとも600個の特徴、少なくとも650個の特徴、少なくとも700個の特徴、少なくとも750個の特徴、少なくとも800個の特徴、少なくとも850個の特徴、少なくとも900個の特徴、少なくとも950個の特徴、少なくとも1000個の特徴、少なくとも1100個の特徴、少なくとも1200個の特徴、少なくとも1300個の特徴、少なくとも1400個の特徴、少なくとも1500個の特徴、少なくとも1600個の特徴、少なくとも1700個の特徴、少なくとも1800個の特徴、少なくとも1900個の特徴、少なくとも2000個の特徴、少なくとも3000個の特徴、少なくとも4000個の特徴、少なくとも5000個の特徴、少なくとも6000個の特徴、少なくとも7000個の特徴、少なくとも8000個の特徴、少なくとも9000個の特徴、又は少なくとも10,000個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、10個の特徴~100,000個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、100個の特徴~1000個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、300個の特徴~900個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、500個の特徴~1000個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、500個の特徴~900個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、700個の特徴~1000個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、700個の特徴~900個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、800個の特徴~1000個の特徴を抽出する。様々な実施形態では、リンパ節特徴モジュール145は、800個の特徴~900個の特徴を抽出する。
【0051】
様々な実施形態では、リンパ節特徴モジュール145は、補完モデルを訓練又はデプロイするために、抽出された特徴を補完モジュール150に提供する。例えば、抽出された特徴が基準個体から捕捉された訓練画像から導出される場合、リンパ節特徴モジュール145は、抽出された特徴を補完モジュール150に提供する。様々な実施形態では、リンパ節特徴モジュール145は、リスクモデルを訓練するために、抽出された特徴をリスク訓練モジュール155に提供する。例えば、抽出された特徴が基準個体から捕捉された訓練画像から導出される場合、リンパ節特徴モジュール145は、リスクモデルを訓練するために、抽出された特徴をリスク訓練モジュール155に提供する。様々な実施形態では、リンパ節特徴モジュール145は、リスクモデルをデプロイするために、抽出された特徴をリスクデプロイモジュール160に提供する。例えば、抽出された特徴が対象(例えば、
図1Aの対象110)から捕捉された画像から導出される場合、リンパ節特徴モジュール145は、抽出された特徴をリスクデプロイモジュール160に提供する。
【0052】
III.A.補完モデルの訓練
補完モジュール150は、補完モデルを訓練及びデプロイする。一般に、補完モデルは、1つ又は2つ以上のリンパ節を含む画像から抽出された特徴を分析して、1つ又は2つ以上のリンパ節について、リンパ節ががん性である確率を予測するように構成されている。したがって、1つ又は2つ以上のリンパ節を含む画像から抽出された特徴に基づいて、補完モデルは、リンパ節の各々について確率を補完し、補完された確率は、リンパ節ががん性(例えば、転移性がん)である可能性を示す。換言すれば、補完モデルは、リンパ節レベルで転移性がんのリスクを決定することによって、がん性のリンパ節と非がん性のリンパ節とを区別する。
【0053】
様々な実施形態では、補完モデルは、回帰モデル(例えば、線形回帰、ロジスティック回帰、又は多項式回帰)、決定木、ランダムフォレスト、サポートベクター機械、ナイーブベイズモデル、k-meansクラスタ、又はニューラルネットワーク(例えば、フィードフォワードネットワーク、畳み込みニューラルネットワーク(convolutional neural network、CNN)、ディープニューラルネットワーク(deep neural network、DNN)、オートエンコーダニューラルネットワーク、敵対的生成ネットワーク、又は回帰型ネットワーク(例えば、長・短期記憶ネットワーク(long short-term memory network、LSTM)、双方向回帰型ネットワーク、ディープ双方向回帰型ネットワーク)、又はこれらの任意の組み合わせ、のうちのいずれか1つである。特定の実施形態では、補完モデルは、ランダムフォレスト分類子、又は最小絶対収縮及び選択演算(least absolute shrinkage and selection operator、LASSO)分類子である。様々な実施形態では、補完モデルは、機械学習モデルである。様々な実施形態では、補完モデルは、ブースト勾配機械学習モデル(例えば、xgboost)である。
【0054】
補完モデルは、線形回帰アルゴリズム、ロジスティック回帰アルゴリズム、決定木アルゴリズム、サポートベクター機械分類、ナイーブベイズ分類、K最近傍分類、ランダムフォレストアルゴリズム、深層学習アルゴリズム、勾配ブースティングアルゴリズム、並びにマニホールド学習、主成分分析、因子分析、オートエンコーダ正規化、及び独立成分分析などの次元削減分析、のうちのいずれか1つ、又はそれらの組み合わせなどの、機械学習実装法を使用して訓練することができる。様々な実施形態では、補完モデルは、教師あり学習アルゴリズム、教師なし学習アルゴリズム、半教師あり学習アルゴリズム(例えば、部分的な教師あり)、弱教師あり学習、転移学習、マルチタスク学習、又はそれらの任意の組み合わせを使用して訓練されている。
【0055】
様々な実施形態では、補完モデルは、ハイパーパラメータ又はモデルパラメータなどの1つ又は2つ以上のパラメータを有する。ハイパーパラメータは、一般に、訓練の前に確立される。ハイパーパラメータの例は、決定木の学習率、深度、又は葉、ディープニューラルネットワークにおける隠れ層の数、k-meansクラスタにおけるクラスタの数、回帰モデルにおけるペナルティ、及びコスト関数と関連付けられた正則化パラメータを含む。モデルパラメータは、一般に、訓練中に調整される。モデルのパラメータの例としては、ニューラルネットワークの層におけるノード、サポートベクター機械におけるサポートベクター、及び回帰モデルにおける係数と関連付けられた重みが挙げられる。補完モデルのモデルパラメータは、補完モデルの予測能力を高めるために、訓練データを使用して訓練(例えば、調整)される。
【0056】
補完モジュール150は、訓練データを使用して補完モデルを訓練する。訓練データは、訓練データストア170に記憶させる及び/又はそこから取り出すことができる。様々な実施形態では、訓練データは、基準個体から取得された1つ又は2つ以上のリンパ節を含む、訓練画像から抽出された特徴を含む。様々な実施形態では、基準個体は、健康な個体(例えば、対照個体)を含む。様々な実施形態では、基準個体は、がんがあると以前に診断された個体を含む。様々な実施形態では、基準個体は、リンパ節に転移したがんがあると以前に診断された個体を含む。したがって、そのような個体から捕捉された画像は、1つ又は2つ以上のがん性リンパ節を含む。
【0057】
様々な実施形態では、補完モデルを訓練するために使用される訓練データは、リンパ節ががん性であるか(以下、とも称される「陽性」又は「+」とも称される)、リンパ節が非がん性であるか(以下、「陰性」又は「-」とも称される)を示す、基準グラウンドトゥルースを含む。様々な実施形態では、訓練データにおける参照グランドトゥルースは、「1」又は「0」などのバイナリ値である。例えば、がん性である陽性リンパ節は、「1」の値を有する訓練データで識別することができ、一方で、非がん性である陰性リンパ節は、「0」の値を有する訓練データで識別することができる。要するに、補完モジュール150は、補完モデルが入力(例えば、リンパ節の抽出された特徴)に基づいて結果(例えば、リンパ節のリンパ節転移性がんの確率)をより良好に予測することができるように、訓練データを使用して損失関数を最小にするように補完モデルを訓練する。様々な実施形態では、損失関数は、ラッソ(least absolute shrinkage and selection operator、LASSO)回帰、リッジ回帰、又はElasticNet回帰のいずれかに対して構築される。
【0058】
様々な実施形態では、訓練データは、公的に入手可能なデータベースから取得及び/又は導出することができる。例えば、訓練データは、National Lung Screening Trial(NLST)から取得及び/又は導出することができ、基準個体の結節性ステージ(Nステージ)がん情報を含む。いくつかの実施形態では、訓練データは、例えば複数の基準個体から1つ又は2つ以上のリンパ節の画像を捕捉することによって、公的に入手可能なデータベースから独立して取得及び収集することができる。例えば、そのような訓練データは、カスタムデータセットであり得る。カスタムデータセットの訓練データは、患者ケア中に取得することができ、したがって、リンパ節の対応する外科用サンプリング情報を有することができる。訓練データは、基準個体のNステージがん情報、例えば、基準個体の撮像及び/又は生検結果に基づいて臨床医によって以前に診断されたNステージ情報を含むことができる。
【0059】
様々な実施形態では、リンパ節ががん性かどうかを示す基準グラウンドトゥルースは、臨床ステージデータから導出される結節ステージ(Nステージ)情報である。例えば、公的に入手可能なNLSTデータセットは、基準個体の臨床ステージ情報(例えば、ステージ1a、1b、2a、2b、3a、など)は含むが、リンパ節に固有の情報は含まない。換言すれば、NLSTデータセットは、個々のリンパ節ががん性であるか、非がん性であるかを区別しない。そのような実施形態では、リンパ節ががん性であるかどうかを示す基準グラウンドトゥルースは、基準個体のがんのNステージ情報及び他の特性(例えば、腫瘍サイズ、腫瘍位置、腫瘍形状、及び/又は腫瘍密度)及び/又はリンパ節のNステージ情報及び他の特性(例えば、リンパ節サイズ、リンパ節密度、及び/又はリンパ節形状)に基づいて逆算することができる。第1の例として、0又は1のNステージを有する基準個体は、がんの転移にまだ遭遇しておらず、したがって、この基準個体のリンパ節には「陰性」又は非がん性の基準グラウンドトゥルースが割り当てられる。別の例として、2又は3のNステージを有する基準個体は、がんの転移に遭遇している。したがって、腫瘍及び/又はリンパ節の特性に基づいて、リンパ節には「陽性」又は「陰性」の基準グラウンドトゥルースが割り当てられる。
【0060】
III.B.補完モデルのデプロイ
補完モジュール150は、訓練された補完モデルをデプロイして、1つ又は2つ以上のリンパ節を含む画像から抽出された特徴を分析し、1つ又は2つ以上のリンパ節についてリンパ節ががん性である確率を予測する。様々な実施形態では、訓練された補完モデルは、試験データセットに対してデプロイされる。様々な実施形態では、補完モデルを訓練するために使用される試験データセット及び訓練データセットは、共通データセットから導出され得る。例えば、共通データセットは、補完モデルを訓練及び試験するための2つのサブセットに分割され得る。いくつかの実施形態では、共通データセットは、50:50の訓練:試験データセット分割を受ける。いくつかの実施形態では、共通データセットは、60:40の訓練:試験データセット分割を受ける。いくつかの実施形態では、共通データセットは、80:20の訓練:試験データセット分割を受ける。
【0061】
訓練された補完モデルのデプロイにより、リンパ節の確率(例えば、0~1の連続した確率)が得られ、各確率は、対応するリンパ節ががん性である可能性があるかどうかを示す。様々な実施形態では、補完モジュール150は、リスクモデルを訓練するために使用される補完モデルによって予測されたリンパ節のリンパ節転移リスクのうちの1つ又は2つ以上を提供する。様々な実施形態では、補完モジュール150は、リスクモデルを訓練するために使用される補完モデルによって予測されたリンパ節のリンパ節転移リスクの全てを提供する。様々な実施形態では、補完モジュール150は、選択プロセスを実行して、補完モデルによって予測されたリンパ節のリンパ節転移リスクのサブセットを識別する。したがって、その後にリンパ節転移リスクのサブセットを使用してリスクモデルを訓練する。
【0062】
いくつかの実施形態では、補完モジュール150は、リンパ節転移リスクを閾値と比較することによって、リンパ節転移リスクのサブセットを選択する。リンパ節のリンパ節転移リスクが閾値を超えた場合、リンパ節のリンパ節転移リスクは、リスクモデルを訓練するためにサブセットに含めるように選択される。リンパ節のリンパ節転移リスクが閾値よりも低い場合、リンパ節のリンパ節転移リスクは、サブセットから除外され、したがって、リスクモデルを訓練するために使用されない。
【0063】
様々な実施形態では、閾値は、一定の値である。様々な実施形態では、閾値は、50%の転移性がんのリスクである。様々な実施形態では、閾値は、30%、35%、40%、45%、55%、60%、65%、70%、75%、80%、85%、90%、95%、又は99%の転移性がんのリスクである。いくつかの実施形態では、閾値は、30~70%である。いくつかの実施形態では、閾値は、40~60%である。いくつかの実施形態では、閾値は、45~55%である。いくつかの実施形態では、閾値は、48~52%である。いくつかの実施形態では、閾値は、49~51%である。様々な実施形態では、閾値は、可変である。様々な実施形態では、閾値は、がんを有する対象内の確率の中央値である。
【0064】
補完モジュール150は、リスクモデルを訓練するために、リンパ節転移リスクのサブセットをリスク訓練モジュール155に提供する。
【0065】
III.C.リスクモデルの訓練
リスク訓練モジュール155は、補完モデルによって予測されたリンパ節のリンパ節転移リスクのうちの少なくとも1つ又は2つ以上を含む訓練データを使用して、リスクモデルを訓練する。ここで、1つ又は2つ以上のリンパ節転移リスクは、上で説明したように、補完モジュール150によって選択されたリンパ節転移リスクのサブセットであり得る。リスクモデルを訓練するためのリンパ節転移リスクのサブセットは、補完モデルを訓練するために使用された訓練データセットと比較して精緻化された訓練データセットを表す。具体的には、精緻化された訓練データセットは、がん性である可能性がより高いリンパ節のサブセットを含み、一方で、がん性である可能性が低い(しかし、別様には、リスクモデルを訓練するために、偽陽性を表し得るか、又は混同され得る)リンパ節は、精緻化された訓練データセットから除去される。したがって、この精緻化された訓練データセットでリスクモデルを訓練することによって、リスクモデルは、転移性疾患を有する対象のリンパ節の全てについてより広い確率の範囲を予測する。より具体的には、リスクモデルは、より高いリンパ節転移リスクを伴うがんを有する可能性があるリンパ節、及びより低いリンパ節転移リスクを伴うがんを有する可能性が低いリンパ節を割り当てる可能性がより高い。
【0066】
様々な実施形態では、リスクモデルは、1つ又は2つ以上のリンパ節を含む画像から抽出された特徴を分析して、1つ又は2つ以上のリンパ節の各々について、リンパ節ががん性である連続した確率を予測する。したがって、1つ又は2つ以上のリンパ節を含む画像から抽出された特徴に基づいて、リスクモデルは、リンパ節の各々について確率を決定し、決定された確率は、リンパががん性(例えば、転移性がん)である可能性を示す。ここで、リスクモデルは、リンパ節レベルで転移性がんのリスクを決定する。様々な実施形態では、リスクモデルは、どちらのモデルも画像から抽出された特徴を分析してリンパ節レベルで転移性がんのリスクを予測するという点で、補完モデルと同様である。しかしながら、リスクモデルは、補完モデルの予測、例えば、補完モデルによって予測される1つ又は2つ以上のリンパ節レベルのリスクを使用して訓練されている。要するに、これは、リスクモデルが、補完モデルによって予測された補完されたLNレベルのリスクよりも広い確率の範囲を有する転移性がんのLNレベルのリスクを予測することを可能にする。
【0067】
リスクモデルは、補完モデルによって予測された少なくとも1つ又は2つ以上のリンパ節転移リスクを含む訓練データを使用して訓練されている。ここで、1つ又は2つ以上のリンパ節転移リスクは、リスクモデルを訓練するための基準グラウンドトゥルースとしての役割を果たすことができる。様々な実施形態では、訓練データは、基準個体から取得された1つ又は2つ以上のリンパ節を含む訓練画像から抽出された特徴を更に含むことができる。いくつかの実施形態では、リスクモデルを訓練するために使用される訓練画像は、補完モデルを訓練するために以前に使用されたものと同じ訓練画像であり得る。いくつかの実施形態では、リスクモデルを訓練するために使用される訓練画像は、補完モデルを訓練するために以前に使用された訓練画像と異なる。
【0068】
様々な実施形態では、訓練データは、リスクモデルが各訓練例を使用して訓練されるように、個々の訓練例を含む。例えば、各訓練例は、特定の訓練画像並びに基準グラウンドトゥルースの1つ又は2つ以上のリンパ節の抽出された特徴(例えば、特定の訓練画像の同じ1つ又は2つ以上のリンパ節のリンパ節転移リスク)を含むことができる。したがって、各訓練例について、リスクモデルは、損失関数(例えば、最小絶対収縮及び選択演算(LASSO)回帰、リッジ回帰、又はElasticNet回帰のいずれかの損失関数)を最小にするように訓練されている。
【0069】
様々な実施形態では、リスクモデルは、回帰モデル(例えば、線形回帰、ロジスティック回帰、又は多項式回帰)、決定木、ランダムフォレスト、サポートベクター機械、ナイーブベイズモデル、k-meansクラスタ、又はニューラルネットワーク(例えば、フィードフォワードネットワーク、畳み込みニューラルネットワーク(CNN)、ディープニューラルネットワーク(DNN)、オートエンコーダニューラルネットワーク、敵対的生成ネットワーク、又は回帰型ネットワーク(例えば、長・短期記憶ネットワーク(LSTM)、双方向回帰型ネットワーク、ディープ双方向回帰型ネットワーク)、又はこれらの任意の組み合わせ、のうちのいずれか1つである。特定の実施形態では、リスクモデルは、ランダムフォレスト分類子、又は最小絶対収縮及び選択演算(LASSO)分類子である。様々な実施形態では、リスクモデルは、機械学習モデルである。
【0070】
リスクモデルは、線形回帰アルゴリズム、ロジスティック回帰アルゴリズム、決定木アルゴリズム、サポートベクター機械分類、ナイーブベイズ分類、K最近傍分類、ランダムフォレストアルゴリズム、深層学習アルゴリズム、勾配ブースティングアルゴリズム、並びにマニホールド学習、主成分分析、因子分析、オートエンコーダ正規化、及び独立成分分析などの次元削減分析、のうちのいずれか1つ、又はそれらの組み合わせなどの、機械学習実装法を使用して訓練されることができる。様々な実施形態では、リスクモデルは、教師あり学習アルゴリズム、教師なし学習アルゴリズム、半教師あり学習アルゴリズム(例えば、部分的な教師あり)、弱教師あり学習、転移学習、マルチタスク学習、又はそれらの任意の組み合わせを使用して訓練されている。
【0071】
様々な実施形態では、リスクモデルは、ハイパーパラメータ又はモデルパラメータなどの1つ又は2つ以上のパラメータを有する。ハイパーパラメータは、一般に、訓練の前に確立される。ハイパーパラメータの例は、決定木の学習率、深度、又は葉、ディープニューラルネットワークにおける隠れ層の数、k-meansクラスタにおけるクラスタの数、回帰モデルにおけるペナルティ、及びコスト関数と関連付けられた正則化パラメータを含む。モデルパラメータは、一般に、訓練中に調整される。モデルのパラメータの例としては、ニューラルネットワークの層におけるノード、サポートベクター機械におけるサポートベクター、及び回帰モデルにおける係数と関連付けられた重みが挙げられる。リスクモデルのモデルパラメータは、リスクモデルの予測能力を高めるために、訓練データを使用して訓練(例えば、調整)される。
【0072】
III.C.リスクモデルのデプロイ
リスクデプロイモジュール160は、リスクモデルをデプロイして、対象(例えば、
図1Aにおいて上で説明した対象110)の転移性がんの対象レベルのリスクを決定する。ここで、リスクデプロイモジュール160は、訓練されたリスクモデルへの入力として対象から捕捉された1つ又は2つ以上のリンパ節を含む画像の抽出された特徴を提供する。訓練されたリスクモデルは、抽出された特徴を分析して、個々のリンパ節ががん性である可能性があるかどうかを示すリンパ節の確率を出力する。
【0073】
様々な実施形態では、リスクモデルのデプロイに続いて、リスクデプロイモジュール160は、リスクモデルによって予測された個々のリンパ節レベルの転移性がんのリスクから、対象の転移性がんの対象レベルのリスクに移行する。様々な実施形態では、リスクデプロイモジュール160は、個々のリンパ節レベルの転移性がんのリスクを組み合わせて、転移性がんの対象レベルのリスクを決定する。様々な実施形態では、リスクデプロイモジュール160は、リンパ節レベルの転移性がんのリスク全体にわたって統計演算を実行する。統計演算は、個々のリンパ節レベルの転移性がんのリスク全体にわたる最大値、最小値、平均値、中央値、又はモード値を識別することができる。特定の実施形態では、統計演算は、個々のリンパ節レベルの転移性がんのリスク全体にわたって最大値である。したがって、最も高いリンパ節レベルの転移性疾患のリスクを有するリンパ節が、対象の転移性疾患の対象レベルのリスクとして割り当てられる。
【0074】
がんステージングモジュール165は、対象の転移性疾患の対象レベルのリスクに基づいて、対象のがんステージを決定する。様々な実施形態では、がんステージングモジュール165は、対象の転移性疾患の対象レベルのリスクを1つ又は2つ以上の閾値リスク値と比較することによって、対象のがんステージを決定する。これらの閾値リスク値は、対象のがんがステージ0、ステージ1、ステージ2、又はステージ3のうちのいずれにある可能性が高いかを決定するためのカットオフとしての役割を果たすことができる。
【0075】
いくつかの実施形態では、対象レベルのリスクが30%を超える場合、対象は、少なくともステージ3のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが40%超、50%超、60%超、70%超、80%超、又は90%超のリスクである場合、対象は、少なくともステージ3のがんがあるものとしてカテゴリ化される。
【0076】
様々な実施形態では、閾値リスク値は、1つ又は2つ以上のがんステージに対応するリスク範囲を画定する。したがって、閾値リスク値は、リスク範囲の上限及び下限を設定する。いくつかの実施形態では、対象レベルのリスクが30%~100%である場合、対象は、結節ステージ3のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが40%~100%である場合、対象は、結節ステージ3のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが50%~100%である場合、対象は、結節ステージ3のがんがあるものとしてカテゴリ化される。
【0077】
いくつかの実施形態では、対象レベルのリスクが10%~40%である場合、対象は、結節ステージ2のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが15%~40%である場合、対象は、結節ステージ2のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが20%~40%である場合、対象は、結節ステージ2のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが30%~40%である場合、対象は、結節ステージ2のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが15%~30%である場合、対象は、結節ステージ2のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが20%~30%である場合、対象は、結節ステージ2のがんがあるものとしてカテゴリ化される。
【0078】
いくつかの実施形態では、対象レベルのリスクが5%~20%である場合、対象は、結節ステージ0又は結節ステージ1のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが10%~20%である場合、対象は、結節ステージ0又は結節ステージ1のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが5%~15%である場合、対象は、結節ステージ0又は結節ステージ1のがんがあるものとしてカテゴリ化される。いくつかの実施形態では、対象レベルのリスクが8%~12%である場合、対象は、結節ステージ0又は結節ステージ1のがんがあるものとしてカテゴリ化される。
【0079】
IV.がんステージングの例示的な方法
図3Aは、一実施形態による、補完モデル及びリスクモデルの例示的な実装を表す。ここで、基準個体305A及び305Bは、特定のNステージによって識別され得る。例えば、基準個体305Aは、Nステージ陰性として識別され、基準個体305Aがリンパ節がん転移を呈しないことを示す。基準個体305Bは、Nステージ陽性として識別され、基準個体305Bがリンパ節がん転移を呈することを示す。しかしながら、対象レベルNステージは、特定のリンパ節を、及び個々のリンパ節ががん性であるか、非がん性であるかを区別しない。
【0080】
補完モデル310は、各リンパ節の転移リスク(例えば、リンパ節転移リスク)を補完し、それによって、転移性がんを有するリンパ節と非がん性であるリンパ節との区別を可能にする。様々な実施形態では、補完モデル310は、リンパ節ががん性である可能性を表す、各リンパ節の確率を予測する。
【0081】
図3Aに示されるように、補完モデル310の出力は、個体305C(基準個体305Aに対応する)がリンパ節侵襲を呈しないことを識別することができる。換言すれば、個体305Cのリンパ節のいずれも、がん性である可能性はない。これは、Nステージ陰性の識別を確認する。追加的に、補完モデル310の出力は、(基準個体305Bに対応する)個体305Dが1つ又は2つ以上のリンパ節についてリンパ節侵襲を呈することを識別することができる。例えば、補完モデル310は、個体305Dの厳密に1つのリンパ節ががん性であり、一方で、個体305Dの他のリンパ節が非がん性であるように確率を補完することができる。
【0082】
様々な実施形態では、補完モデル310によって予測されたリンパ節のリンパ節転移リスクのうちの1つ又は2つ以上を使用して、リスクモデル320を訓練する。様々な実施形態では、補完モデル310によって予測されたリンパ節のリンパ節転移リスクの全てを使用して、リスクモデル320を訓練する。様々な実施形態では、リンパ節のサブセットに対応するリンパ節転移リスクのサブセットを使用して、リスクモデル320を訓練し、それによって、リスクモデルが、転移性疾患を有する対象のリンパ節の全てについてより広い確率の範囲を予測することを可能にする。
【0083】
訓練された時点で、リスクモデル320をデプロイして、1つ又は2つ以上の対象315の転移性がんの対象レベルのリスクを予測する。したがって、リスクモデル320をデプロイして、転移性疾患のリンパ節レベルのリスクから転移性疾患の対象レベルのリスクに移行する。
図3Aに示されるように、リスクモデル320をデプロイして、個体315から捕捉された画像から抽出された特徴を分析する。リスクモデル320は、個体315の領域の転移性がんの対象レベルのリスクを予測する。例えば、リスクモデル320は、個体315Aについて20%の転移性がんのリスク、個体315Bについて30%の転移性がんのリスク、個体315Cについて50%の転移性がんのリスク、及び個体315Dについて60%の転移性がんのリスクを予測する。したがって、個体315A及び315Bは、初期のステージがん(例えば、ステージ0又は1)にカテゴリ化することができ、一方で、個体315C及び315Dは、後期ステージのがん(例えば、ステージ2、3、又は4)にカテゴリ化することができる。
【0084】
個体315は、転移性疾患の対象レベルのリスクに従って、異なる治療を受けることができる。例えば、リンパ節転移を有するリスクが低い個体315A及び315Bは、外科的切除又は気管支鏡による診断及び治療の組み合わせなどの、即時の治療に直接進むことができる。別の例として、リンパ節転移を有するリスクがより高い個体315C及び315Dは、PETスキャン及びリンパ節生検などの追加的な試験を受けることができる。
【0085】
図3Bは、一実施形態による、リスクモデル320の実装を更に詳細に表す。ここで、リスクモデル320は、対象350から捕捉された画像から抽出された特徴を分析して、対象の1つ又は2つ以上のリンパ節の各々の確率を出力する。
図3Bに示されるように、リスクモデル320は、3つのリンパ節の確率を出力する。他の実施形態では、リスクモデル320は、対象350の追加的な又はより少ないリンパ節の確率を出力することができる。
【0086】
図3Bに示されるように、リスクモデル320は、第1のリンパ節には20%の確率のがん性、逆に、80%の非がん性の確率があると予測する。追加的に、リスクモデル320は、第2のリンパ節には30%の確率のがん性、逆に、70%の非がん性の確率があると予測する。追加的に、リスクモデル320は、第3のリンパ節には60%の確率のがん性、逆に、40%の非がん性の確率があると予測する。個々のリンパ節の確率を分析して、転移性がんの対象レベルのリスクを識別する。この例では、転移性がんの対象レベルの確率として、転移性がんのリンパ節の最高確率が用いられる。60%の確率のがん性を有する第3のリンパ節は、リンパ節の間で最高の確率である。したがって、対象350の転移性がんの対象レベルの確率は、60%である。
【0087】
V.がん
本明細書に記載の方法は、対象のがんの対象レベルのリスクを決定することによるがんステージングを含む。様々な実施形態では、対象のがんとしては、リンパ腫、B細胞リンパ腫、T細胞リンパ腫、菌状息肉症、ホジキン病、骨髄性白血病、膀胱がん、脳腫瘍、神経系がん、頭頸部がん、頭頸部扁平上皮がん、腎臓がん、肺がん、神経芽腫/神経膠芽腫、卵巣がん、膵臓がん、前立腺がん、皮膚がん、肝がん、黒色腫、口腔、咽喉、喉頭、及び肺の扁平上皮がん、結腸がん、子宮頸がん、子宮頸がん、乳がん、上皮がん、消化器がん、腎臓がん、泌尿生殖器がん、肺がん、食道がん、胃がん、甲状腺がん、頭頸部がん、大腸がん、造血がん、精巣がん、結腸がん及び/若しくは直腸がん、子宮がん、又は前立腺がん、のうちの1つ又は2つ以上を挙げることができる。肺細気管支肺胞がん(lung bronchioloalveolar carcinoma、BAC)、膀胱がん、女性生殖管悪性腫瘍(例えば、子宮漿液性がん、子宮内膜がん、外陰扁平上皮がん、及び子宮肉腫)、卵巣表面上皮がん(例えば、卵巣の明細胞がん、上皮性卵巣がん、卵管がん、原発性腹膜がん)、乳がん、非小細胞肺がん(non-small cell lung cancer、NSCLC)、男性生殖管悪性腫瘍(例えば、精巣がん)、後腹膜がん又は腹膜がん、胃食道腺がん、食道胃接合部がん、肝臓肝細胞がん、食道及び食道胃接合部がん、子宮頸がん、胆管がん、膵臓腺がん、肝外胆管腺がん、小腸悪性腫瘍、胃腺がん、原発不明がん(cancer of unknown primary、CUP)、結腸直腸腺がん、食道がん、前立腺腺がん、腎臓がん、頭頸部扁平上皮がん、胸腺がん、非黒色腫皮膚がん、甲状腺がん(例えば、乳頭がん)、頭頸部がん、肛門がん、非上皮性卵巣がん(non-epithelial ovarian cancer、非EOC)、ブドウ膜黒色腫、悪性胸膜中皮腫、小細胞肺がん(small cell lung cancer、SCLC)、中枢神経系がん、神経内分泌腫瘍、並びに軟部組織腫瘍、のうちのいずれか1つであり得る。ある特定の実施形態では、がんは、乳がん、非小細胞肺がん、膀胱がん、腎臓がん、大腸がん、及び黒色腫である。いくつかの実施形態では、対象におけるがんは、膀胱がん、乳がん、結腸がん、腎臓がん、肺がん、メラノーマ、卵巣がん、膵臓がん、前立腺がん、直腸がん、胃がん、甲状腺がん、又は子宮がんのうちのいずれか1つを含む、転移性がんであり得る。特定の実施形態では、がんは肺がんである。特定の実施形態では、がんは、小細胞肺がん、非小細胞肺がん、腺がん、扁平上皮がん、大細胞がん、小細胞がん、複合型小細胞がん、肺肉腫、肺リンパ腫、気管支カルチノイド、のうちのいずれか1つを含む、あるタイプの肺がんである。
【0088】
VI.誘導下介入
本明細書に記載の実施形態は、対象の転移性がんの対象レベルのリスクを決定することによるがんステージングの決定を含む。様々な実施形態では、介入は、対象について予測されたがんステージング及び/又は転移性がんの対象レベルのリスクに基づいて、対象に提供される。そのような介入は、以下誘導下介入と称され、診断の適用、治療薬の適用、対象の後続の試験、後続の生検(例えば、がん生検又はリンパ節生検、リンパ節の気管支鏡によるサンプリング)、後続の画像スキャン(例えば、PETスキャン、MRIスキャン、超音波撮像、又はX線像撮像)、腫瘍切除、気管支鏡による診断、治療物質の選択及び/又は投与、医薬組成物の選択/投与、臨床試験の登録、臨床試験の非登録、のうちのいずれか1つ、又はこれらの任意の組み合わせであり得る。
【0089】
様々な実施形態では、対象について予測された転移性がんの対象レベルのリスク、又は予測されたがんステージは、対象は転移性がんのリスクが高いことを示す。様々な実施形態では、転移性がんのリスクが高い対象は、閾値スコアを超える予測された転移性がんの対象レベルのリスクを有する。様々な実施形態では、閾値スコアは、20%超の転移性がんのリスクである。様々な実施形態では、閾値スコアは、25%超の転移性がんのリスクである。様々な実施形態では、閾値スコアは、30%超、35%超、40%超、45%超、50%超、55%超、60%超、65%超、70%超、75%超、80%超、85%超、9%超、95%超、又は99%超の転移性がんのリスクである。様々な実施形態では、閾値スコアは、20%~80%である。いくつかの実施形態では、閾値は、30~70%である。いくつかの実施形態では、閾値は、40~60%である。いくつかの実施形態では、閾値は、45~55%である。いくつかの実施形態では、閾値は、20~60%である。いくつかの実施形態では、閾値は、30~55%である。いくつかの実施形態では、閾値は、35~50%である。いくつかの実施形態では、閾値は、40~45%である。
【0090】
様々な実施形態では、対象は、対象の予測されたがんステージが少なくともステージ2(例えば、ステージ2又はステージ3)である場合、転移性がんのリスクが高い。そのような実施形態では、誘導下介入は、対象の後続の試験、対象の後続の生検、又は対象の後続の画像スキャンのうちの1つを含む。これは、臨床提供者が、最も高いリスクである対象の後続の試験、生検、又は画像スキャンを優先することを可能にする。
【0091】
様々な実施形態では、対象が転移性がんのリスクが高いと予測された場合、後期ステージの転移性がんに対して不適当である処置をその対象から除外することができる。除外されるそのような処置の例としては、腫瘍切除、肺切除、放射線(例えば、体外照射)、化学療法(例えば、局所又は全身化学療法)、免疫調節療法、更には全身麻酔が挙げられる。
【0092】
特定の実施形態では、対象が転移性がんのリスクが高いと予測された場合、対象は、後続の画像スキャンを受けて予測を確認する。例えば、対象が転移性がんのリスクが高いと予測された場合、対象は、更にPETスキャンを受ける。そのような実施形態では、PETスキャンが陰性の結果(例えば、リンパ節侵襲がない)を返した場合、対象は、更なる試験を受けることができる。例えば、対象は、後続の生検を更に受けて、リンパ節を確定的にサンプリングすることができる。いくつかの実施形態では、後続の生検は、リンパ節の気管支鏡によるサンプリングである。
【0093】
特定の実施形態では、対象が転移性がんのリスクが高いと予測された場合、対象は、後続の生検を直接受けて予測を確認する。例えば、対象は、後続の画像スキャンを受けて予測を確認する必要はなく、代わりに、後続の生検を直接受ける。例えば、対象が転移性がんのリスクが高いと予測された場合、対象は、リンパ節の気管支鏡によるサンプリングを更に受ける。
【0094】
本明細書で説明するように、転移性がんの対象レベルのリスクは、リンパ節全体にわたって個々のリンパ節レベルのリスクから決定することができる。したがって、リスクの対象レベルに基づいて転移性がんのリスクが高いと予測された対象の場合、リスクの高い対象レベルにつながった特定のリンパ節を識別することができる。したがって、特定のリンパ節は、後続の試験又は治療を標的にすることができる。特定の実施形態では、特定のリンパ節は、後続の画像スキャン(例えば、PETスキャン)を受けて、予測を確認することができる。特定の実施形態では、特定のリンパ節は、後続の生検を受けて、特定のリンパ節を確定的にサンプリングすることができる。したがって、後続の生検は、特定のリンパ節の転移性がんの有無を確認することができる。
【0095】
様々な実施形態では、対象は転移性がんのリスクが高いと予測された場合、対象は、臨床試験に登録することができる。例えば、そのような臨床試験は、転移性がんに対する治療の治療効果を試験し得、したがって、その適格基準において、登録者が転移性がんを呈していることを特定し得る。様々な実施形態では、対象は転移性がんのリスクが高いと予測された場合、対象は、臨床試験の登録が保留される。例えば、そのような臨床試験は、がんの非転移性形態に対する治療の治療効果を試験することができる。
【0096】
様々な実施形態では、対象について予測された転移性がんの対象レベルのリスクは、対象は転移性がんのリスクが低いことを示す。様々な実施形態では、転移性がんのリスクが低い対象は、閾値スコアよりも低い、予測された対象レベルのリスクを有する。様々な実施形態では、閾値スコアは、20%よりも低い転移性がんのリスクである。様々な実施形態では、閾値スコアは、25%よりも低い転移性がんのリスクである。様々な実施形態では、閾値スコアは、30%よりも低い、35%よりも低い、40%よりも低い、45%よりも低い、50%よりも低い、55%よりも低い、60%よりも低い、65%よりも低い、70%よりも低い、75%よりも低い、80%よりも低い、85%よりも低い、90%よりも低い、95%よりも低い、又は99%よりも低い転移性がんのリスクである。いくつかの実施形態では、閾値は、5%~40%である。いくつかの実施形態では、閾値は、10~30%である。いくつかの実施形態では、閾値は、15~25%である。いくつかの実施形態では、閾値は、18~22%である。様々な実施形態では、対象は、対象の予測されたがんステージがステージ2よりも低い(例えば、ステージ0又はステージ1である)場合、転移性がんのリスクが低い。そのような実施形態では、誘導下介入は、腫瘍切除、気管支鏡による診断、治療物質の選択及び/若しくは投与、並びに/又は医薬組成物の選択/投与、のうちの1つを含む。これは、転移がまだ生じていない対象の急速な識別及び治療を可能にする。
【0097】
様々な実施形態では、治療薬は、転移性がんの対象レベルのリスクに基づいて選択及び/又は対象に投与することができ、選択された治療薬は、がんに対する有効性を呈する可能性が高い。例示的な治療薬としては、化学療法、放射線、抗原特異性モノクローナル抗体、又は免疫療法が挙げられる。様々な実施形態では、高い転移性がんのリスクの対象には、治療薬が提供される。様々な実施形態では、転移性がんのリスクが高い対象は、閾値スコアを超える予測された転移性がんの対象レベルのリスクを有する。様々な実施形態では、閾値スコアは、20%超の転移性がんのリスクである。様々な実施形態では、閾値スコアは、25%超の転移性がんのリスクである。様々な実施形態では、閾値スコアは、30%超の、35%超の、40%超の、45%超の、50%超の、55%超の、60%超の、65%超の、70%超の、75%超の、80%超の、85%超の、90%超の、95%超の、又は99%超の転移性がんのリスクである。様々な実施形態では、対象は、対象の予測されたがんステージが少なくともステージ2(例えば、ステージ2、ステージ3、又はステージ4)である場合、転移性がんのリスクが高い。
【0098】
様々な実施形態では、転移性がんのリスクが低い対象には、治療薬が提供される。様々な実施形態では、転移性がんのリスクが低い対象は、閾値スコアよりも低い、予測された対象レベルのリスクを有する。様々な実施形態では、閾値スコアは、20%よりも低い転移性がんのリスクである。様々な実施形態では、閾値スコアは、25%よりも低い転移性がんのリスクである。様々な実施形態では、閾値スコアは、30%よりも低い、35%よりも低い、40%よりも低い、45%よりも低い、50%よりも低い、55%よりも低い、60%よりも低い、65%よりも低い、70%よりも低い、75%よりも低い、80%よりも低い、85%よりも低い、90%よりも低い、95%よりも低い、又は99%よりも低い転移性がんのリスクである。様々な実施形態では、対象は、対象の予測されたがんステージがステージ2よりも低い(例えば、ステージ0又はステージ1である)場合、転移性がんのリスクが低い。
【0099】
様々な実施形態では、対象は転移性がんのリスクが低いと予測された場合、対象は、早期ステージのがん治療を受け得る。早期のがん治療の例としては、腫瘍切除、肺切除、化学療法(例えば、局所又は全身化学療法)、局所的に送達される治療(例えば、経気管支針滴注、又はカテーテルベースのアブレーション)、又は放射線が挙げられる。
【0100】
特定の実施形態では、対象は転移性がんのリスクが低いと予測された場合、対象は、後続の画像スキャンを受けて予測を確認する。例えば、対象は転移性がんのリスクが低いと予測された場合、対象は、更にPETスキャンを受ける。そのような実施形態では、PETスキャンが陰性の結果(例えば、リンパ節侵襲がない)を返した場合、PETスキャンの結果は、予測と一致する。しかしながら、PETスキャンが陽性の結果(例えば、リンパ節侵襲)を返した場合、対象は、更なる試験を受けることができる。例えば、対象は、後続の生検を更に受けて、リンパ節を確定的にサンプリングすることができる。いくつかの実施形態では、後続の生検は、リンパ節の気管支鏡によるサンプリングである。
【0101】
様々な実施形態では、治療薬は、生物学的なもの、例えば、サイトカイン、抗体、可溶サイトカイン受容体、アンチセンスオリゴヌクレオチド、siRNA、などである。そのような生物学的薬剤は、生物学的薬剤の突然変異タンパク質及び誘導体を包含し、誘導体としては、例えば、当該技術分野で知られている融合タンパク質、PEG化誘導体、コレステロール共役誘導体、などを挙げることができる。サイトカイン及びサイトカイン受容体のアンタゴニスト、例えば、トラップ及びモノクローナル拮抗薬も含まれる。本明細書に記載の活性剤のバイオシミラー医薬品又は活性剤と生物学的に同等な薬物も含まれる。
【0102】
肺がんの治療薬は、ドセタキセル、シスプラチン、カルボプラチン、ゲムシタビン、ナブパクリタキセル、パクリタキセル、ペメトレキセド、ゲフィチニブ、エルロチニブ、ブリチニブ(Alunbrig(登録商標))、カプマチニブ(Tabrecta(登録商標))、セルパカチニブ(Retevmo(登録商標))、エヌトレクチニブ(Rozlytrek(登録商標))、ロルラチニブ(Lorbrena(登録商標))、ラロトレクチニブ(Vitrakvi(登録商標))、ダコミチニブ(Vizimpro(登録商標))、及びビノレルビンなどの化学療法薬を含むことができる。肺がんの治療薬としては、デュルバルマブ(Imfinzi(登録商標))、ニボルマブ(Opdivo(登録商標))、ペンブロリズマブ(Keytruda(登録商標))、アテゾリズマブ(Tecentriq(登録商標))、及びラムシルマブ、などの抗体療法剤を含むことができる。
【0103】
様々な実施形態では、医薬組成物は、転移性がんの対象のリスクレベルに基づいて選択及び/又は対象に投与することができ、選択された治療薬は、がんに対する有効性を示す可能性が高い。個体に投与される医薬組成物は、上記の治療薬などの活性剤を含む。有効成分は、治療有効量、すなわち、それによって媒介される疾患又は医学的状態を治療するために投与されるときに十分な量で存在する。組成物はまた、有効成分の送達及び安定性を高めるために、送達及び有効性を高めるための様々な他の薬剤を含むことができる。したがって、例えば、組成物はまた、所望の製剤に応じて、薬学的に許容される非毒性担体又は希釈剤を含み得、これは、動物又はヒト投与のための医薬組成物を製剤化するために一般的に使用されるビヒクルとして定義される。希釈剤は、組み合わせの生物学的活性に影響を与えないように選択される。そのような希釈剤の例は、蒸留水、緩衝水、生理食塩水、PBS、リンゲル液、デキストロース溶液、及びハンクス溶液である。加えて、医薬組成物又は製剤は、他の担体、アジュバント、又は非毒性の非治療的、非免疫原性安定剤、賦形剤などを含むことができる。組成物はまた、pH調整剤及び緩衝剤、毒性調整剤、湿潤剤、及び洗剤などの生理学的条件を近似するための追加の物質を含むことができる。組成物はまた、酸化防止剤などの様々な安定化剤のいずれかを含むことができる。
【0104】
本明細書に記載の医薬組成物は、様々な異なる方式で投与することができる。例としては、経口、鼻腔内、直腸、局所、腹腔内、静脈内、筋肉内、皮下(subcutaneous)、皮下(subdermal)、経皮、髄腔内、又は頭蓋内法を介して、薬学的に許容される担体を含有する組成物を投与することが挙げられる。様々な実施形態では、医薬組成物は、カテーテルベースのデプロイを介して(例えば、可撓性又は剛性ロボットベースの気管支鏡を使用して)投与することができる。
【0105】
そのような医薬組成物は、(例えば、肺がんを伴う患者の診断後に)治療の目的で投与することができる。本発明の文脈で使用される疾患又は障害の阻止、予防、又は防止は、肺がんの、肺がんの症状のいくつか又は全ての発生、進行、又は再発を阻止するための、又は肺がんが発生する可能性を低くするための組成物の投与を指す。肺がんの治療(treating)、治療(treatment)、又は療法とは、本発明による治療の投与によってがんの進行を遅らせる、停止させる、又は逆転させることを意味する。好ましい実施形態では、肺がんを治療することは、理想的にはがんそのものを排除するところまで、がんの進行を逆転させることを意味する。
【0106】
VII.コンピュータ実装
対象の転移性がんの対象レベルのリスクを決定することによるがんステージングのための方法を含む、本発明の方法は、いくつかの実施形態では、1つ又は2つ以上のコンピュータで実行される。
【0107】
例えば、補完モデル及び/又はリスクモデル並びにデータベース記憶装置の構築及びデプロイは、ハードウェア若しくはソフトウェア、又はこれらの組み合わせに実装することができる。本発明の一実施形態では、機械読可読記憶媒体が提供され、この媒体は、機械可読データによって符号化されたデータ記憶装置材料を含み、当該データを使用するための命令とともにプログラムされた機械を使用したとき、本明細書に記載されるモデルのデータセット、実行、及び結果のいずれかを表示することができる。本発明は、プロセッサ、データ記憶システム(揮発性及び不揮発性メモリ及び/又は記憶要素を含む)、グラフィックスアダプタ、ポインティングデバイス、ネットワークアダプタ、少なくとも1つの入力デバイス、及び少なくとも1つの出力デバイスを含む、プログラム可能なコンピュータ上で実行されるコンピュータプログラムで実施することができる。ディスプレイは、グラフィックスアダプタに結合される。プログラムコードを入力データに適用して、上記の機能を実行し、出力情報を生成する。出力情報は、既知の方法で、1つ又は2つ以上の出力デバイスに適用される。コンピュータは、例えば、従来の設計のパーソナルコンピュータ、マイクロコンピュータ、又はワークステーションであることができる。
【0108】
各プログラムは、コンピュータシステムと通信するために、高レベル手続き又はオブジェクト指向プログラミング言語で実行することができる。しかしながら、必要に応じて、プログラムはアセンブリ言語又は機械言語で実行することができる。いずれの場合も、言語は、コンパイルされた言語又は解釈された言語であることができる。そのような各コンピュータプログラムは、記憶媒体又はデバイスがコンピュータによって読み取られて本明細書に記載の手順を実行するときにコンピュータを構成及び動作させるために、汎用又は専用のプログラム可能コンピュータによって読み取り可能な記憶媒体又はデバイス(例えば、ROM又は磁気ディスケット)に記憶されることが好ましい。システムはまた、コンピュータプログラムで構成されたコンピュータ可読記憶媒体として実装されると考えられ得、そのように構成された記憶媒体は、コンピュータが、本明細書に記載の機能を実行するために特定の事前定義された様式で動作するようにする。
【0109】
シグネチャパターン及びそのデータベースは、それらの使用を容易にするために、様々な媒体に提供することができる。「媒体」とは、本発明のシグネチャパターン情報を含む製品を指す。本発明のデータベースは、コンピュータ可読媒体、例えば、コンピュータが読み取る及び直接アクセスすることができる任意の媒体に記録することができる。そのような媒体には、フロッピーディスク、ハードディスク記憶媒体、及び磁気テープなどの磁気貯蔵媒体、CD-ROMなどの光学媒体、RAM及びROMなどの電気記憶媒体、並びに磁気/光学記憶媒体などのこれらのカテゴリのハイブリッドが含まれるが、これらに限定されない。当業者は、現在知られているコンピュータ可読媒体のいずれかを使用して、本データベース情報の記録を含む製品を作製することができる方法を容易に認識することができる。「記録された」は、当該技術分野で知られているような任意のそのような方法を使用して、コンピュータ可読媒体に情報を記憶するためのプロセスを指す。記憶された情報にアクセスするために使用される手段に基づいて、任意の便利なデータ記憶構造を選択することができる。様々なデータプロセッサプログラム及びフォーマットを、記憶、例えば、例えば、ワードプロセシングテキストファイル、データベース形式、などのために使用することができる。
【0110】
いくつかの実施形態では、対象の転移性がんの対象レベルのリスクを決定することによるがんステージングのための方法を含む、本発明の方法は、分散コンピューティングシステム環境(例えば、クラウドコンピューティング環境内の)の1つ又は2つ以上のコンピュータ上で実行される。本明細書では、「クラウドコンピューティング」は、構成可能なコンピューティングリソースの共有セットへのオンデマンドネットワークアクセスを可能にするためのモデルとして定義される。クラウドコンピューティングを用いて、構成可能なコンピューティングリソースの共有セットへのオンデマンドアクセスを提供することができる。構成可能なコンピューティングリソースの共有セットは、仮想化を介して迅速にプロビジョニングされ、低管理努力又はサービスプロバイダ相互作用でリリースされ、それに応じてスケーリングすることができる。クラウドコンピューティングモデルは、例えば、オンデマンドセルフサービス、ブロードネットワークアクセス、リソースプール、速やかな拡張性、測定サービスなどの様々な特性で構成することができる。クラウドコンピューティングモデルはまた、例えば、サービスとしてソフトウェア(「Software as a Service、SaaS」)、サービスとしてプラットフォーム(「Platform as a Service、PaaS」)、及びサービスとしてのインフラストラクチャ(「Infrastructure as a Service、IaaS」)などの様々なサービスモデルを露出させることができる。クラウドコンピューティングモデルは、プライベートクラウド、コミュニティクラウド、パブリッククラウド、ハイブリッドクラウドなどの異なるデプロイモデルを使用してデプロイすることもできる。本明細書及び特許請求の範囲では、「クラウドコンピューティング環境」は、クラウドコンピューティングが用いられる環境である。
【0111】
図4は、
図1A、
図1B、
図2A、
図2B、
図3A、及び
図3Bに示されるエンティティを実装するための例示的なコンピュータを示す。コンピュータ400は、チップセット404に結合された少なくとも1つのプロセッサ402を含む。チップセット404は、メモリコントローラハブ420及び入力/出力(input/output、I/O)コントローラハブ422を含む。メモリ406及びグラフィックスアダプタ412は、メモリコントローラハブ420に結合され、ディスプレイ418は、グラフィックスアダプタ412に結合される。記憶デバイス408、入力デバイス414、及びネットワークアダプタ416は、I/Oコントローラハブ422に結合される。コンピュータ400の他の実施形態は、異なるアーキテクチャを有する。
【0112】
記憶デバイス408は、ハードドライブ、コンパクトディスク読み取り専用メモリ(compact disk read-only memory、CD-ROM)、DVD、又はソリッドステートメモリデバイスなどの非一時的なコンピュータ可読記憶媒体である。メモリ406は、プロセッサ402によって使用される命令及びデータを保持する。入力インターフェース414は、タッチスクリーンインターフェース、マウス、トラックボール、若しくは他のタイプのポインティングデバイス、キーボード、又はそれらのいくつかの組み合わせであり、データをコンピュータ400に入力するために使用される。いくつかの実施形態では、コンピュータ400は、ユーザからのジェスチャを介して入力インターフェース414から入力(例えば、コマンド)を受信するように構成され得る。グラフィックスアダプタ412は、ディスプレイ418に画像及び他の情報を表示する。ネットワークアダプタ416は、コンピュータ400を1つ又は2つ以上のコンピュータネットワークに結合する。
【0113】
コンピュータ400は、本明細書に記載の機能性を提供するためのコンピュータプログラムモジュールを実行するように適合されている。本明細書で使用される場合、「モジュール」という用語は、指定された機能を提供するために使用されるコンピュータプログラムロジックを指す。したがって、モジュールは、ハードウェア、ファームウェア、及び/又はソフトウェアに実装することができる。一実施形態では、プログラムモジュールは、記憶デバイス408に記憶され、メモリ406にロードされ、プロセッサ402によって実行される。
【0114】
図1A又は
図1Bのエンティティによって使用されるコンピュータ400のタイプは、実施形態及びエンティティによって必要とされる処理電力に応じて異なることができる。例えば、がんステージングシステム130は、単一のコンピュータ400、又はサーバファームなどのネットワークを介して互いに通信する複数のコンピュータ400で動作することができる。コンピュータ400は、グラフィックスアダプタ412及びディスプレイ418などの上記の構成要素のいくつかを欠くことができる。
【0115】
VIII.システム
本明細書には、対象の転移性がんの対象レベルのリスクを決定することによるがんステージングのためのシステムが更に開示される。様々な実施形態では、そのようなシステムは、少なくとも、
図1Aにおいて上述したがんステージングシステム130を含むことができる。様々な実施形態では、がんステージングシステム130は、
図4に記載される例示的なコンピュータ400を有するコンピュータシステムなどのコンピュータシステムとして具体化される。
【0116】
様々な実施形態では、システムは、
図1Aにおいて上述した撮像デバイス120などの撮像デバイスを含む。様々な実施形態では、システムは、がんステージングシステム130(例えば、コンピュータシステム)及び撮像デバイスの両方を含む。そのような実施形態では、がんステージングシステム130は、対象から捕捉された画像(例えば、CTスキャン)を受信するために、撮像デバイス120と通信可能に結合されることができる。コンピュータシステムは、コンピュータ内で、補完モデル及びリスクモデルの一方又は両方を実施して、画像を分析し、対象の対象レベルの結節性疾患のリスクを決定する。
【実施例】
【0117】
以下は、本発明を実施するための特定の実施形態の実施例である。実施例は、例示目的だけのために提供されており、いかなる方式によっても本発明の範囲を限定することは意図されていない。使用される数値(例えば、量、温度など)に関する精度を確実にするための努力がなされているが、ある程度の実験誤差及び偏差は許容されるべきである。
【0118】
実施例1:研究集団及び特徴抽出
この研究は、National Lung Screening Trial(NLST)のCTアームからのデータを使用して行った。NLSTのこのサブコホートは、301人が良好な結節を有し、357人が肺がんを有する、658人の研究参加者からのデータを含んでいた。658人の研究参加者の各CTスキャンを検査し、最高21個のリンパ節ステーション(1人当たり16±6)にアノテーションした(9969個のLNにアノテーションし、対照のLNが4631個で、肺がんを有する研究参加者のLNが5318個であった)。この初期試料から、肺がんのある288人は、分析に利用可能なステージングデータを有していた。バランスのよい初期コホートを作成するために、287個の対照対象を識別した。リンパ節ステーションは、
図2Aに表され、表1において詳述されている。
【0119】
【0120】
LNステーションごとに、5mm及び7.5mmの半径を有する球状領域を画定した。球体中心は、アノテーション標識によって画定した。2つのLNアノテーションの実施例は、
図2Bに示されている。
【0121】
これらのより小さい(5mm)、より大きい(7.5mm)球状ROI(関心領域)を使用して、モデルを構築するために使用される画像の範囲を調査した。これらの球状ROIから、3つの別個のラジオミクスパネルを、各6つの特徴カテゴリとともに抽出した。各パネルは、利用したメトリックの数が異なり、CTの異なる変換に基づいた。パネル1は、元の画像を特徴抽出のための入力として使用した。パネル2及び3は、それぞれ、入力画像のウェーブレット変換、及びガウスのラプラシアン(LoG)変換を用いた。特徴カテゴリには、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴を含んだ。特徴の分解は、表3に示されている。
【0122】
【表2】
*形状は、各ステーションを一定の球状領域で分析したときにLN分析に含まれない場所を特徴付ける
【0123】
図5A~
図5Rは、GLCM特徴カテゴリの異なるパネル全体にわたる異なるリンパ節ラジオミクス特徴の例示的な相関ヒートマップを表す。追加的に、
図5A~
図5Rは、各々、特定の特徴を示す。
図5A~
図5Rに示されるそのような特徴の例としては、相関特徴、LMC2、MCC、差分エントロピ、結合エントロピ、総エントロピ、クラスタプロミネンス、差分平均、結合平均、総平均、自己相関、差分分散、コントラスト、クラスタ傾向、総平方、LDMN、LDN、クラスタシェード、LMC1、逆分散、LD、LDM、結合エネルギー、及び最高確率が挙げられる。
図5C~
図5Rは、異なるフィルタに関する特徴を示す。具体的には、
図5C~
図5Rは、「XYZ」の表記を提供し、「X」、「Y」、及び「Z」は、各々、画像のX、Y、又はZ方向に適用されるフィルタを指す。「H」は、高域通過フィルタを指し、一方で、「L」は、低域通過フィルタを指す。したがって、「HHH」という表記は、X、Y、及びZ方向の各々において高域通過フィルタリングを受けた3D画像から導出された特徴を指す。「HHL」という表記は、X及びY方向において高域通過を受け、かつZ方向において低域通過フィルタリング受けた3D画像から導出された特徴を指す。
【0124】
実施例2:がんステージングのための補完モデル
モデリングは、各リンパ節のがん転移の予測から開始した。これを行うために、がんステージ(NLSTで報告される)を、各アノテーションされたLNステーションに補完した(個体LNデータは、NLSTで報告されなかったので、LN侵襲をがんステージから「バックアウト」した)。次いで、データを訓練:試験のために50:50に分割し、データの分布を表2に提供した。
【0125】
【0126】
モデルの結果は、バイナリとした(NLSTデータセットにおいてNステージ共変数を使用して結節転移のはい/いいえ。「いいえ」は、N=0又はN=1とし、「はい」は、N=2又はN=3とした)。メトリックは、正規化して(zスコア)、ランダムフォレスト及びLASSO分類子を訓練及び試験した。LNごとに、がん性であるという連続した確率を生成した。例えば、がん性である確率が20%であるLNが存在し得る(減算手段によって、がん性でないという80%の確率を割り当てた)。研究参加者内の、及びその全体にわたる全てのLNは、独立データであるとみなした。
図6には、初期モデルの性能が示されている。具体的には、モデルは、曲線下面積(Area under the Curve、AUC)=65.3%、精度(Accuracy、ACC)=96.6%、感度=61.2%、及び特異度=60.8%を達成した。
【0127】
NLSTデータへの制限は、LNに固有の情報が利用できず、平均で16個のLNがアノテーションされて、各人においてラジオミクスベースの評価を受けた。したがって、このモデルは、転移性がんの患者内の全てのLNが「+」であると仮定したが、臨床医学の場合、典型的には、がん性細胞を有するLNは1つだけである(がんは、全てのLNに同時に広がるのではなく、一般に1つ又は2つのLNにだけ広がる)。したがって、対象レベルのがんステージから個体LNへの侵襲を補完することは、(ここでも、その人のCTスキャンの範囲内の全てのLNが「+」であるとみなされるので)LNレベルにおいてモデル性能を混乱させる偽陽性をもたらす。
【0128】
次いで、所与の対象の全てのLNステーションについてLNレベル分類子によって予測される最も高い確率スコアを使用して、Nステージの可能性を決定した。
図7A~
図7Bは、Nステージの可能性に基づく対象レベル性能(AUC=69.1%、感度=72.7%、及び特異度=61.6%)を表す。また、
図7Bに示されるように、Nステージ全体にわたるスコア(例えば、最高確率)の分布をプロットした。ここで、ステージ3のがんについて、より高い最高確率が観察された(左側パネル)。
【0129】
実施例3:ステップアップリンパ節分類アプローチ:患者間LNのブートストラッピング
2ステップブートストラップアプローチを実行して、転移性疾患のLNレベルのリスクから、転移性疾患の対象レベルのリスクに移行した。具体的には、
図3Aを参照して上で説明したように、2ステップブートストラップアプローチは、補完モデル及びリスクモデルの実装を含んでいた。ここでの課題は、分類子を訓練するために、対象のNステージを全てのLNステーションに補完することであった。大部分のLNががんを含まないことを考慮すると、この補完は、LNステーションにおいて誤差をもたらす。
【0130】
2つのステップは、以下の通りであった。
1.補完:既知の転移性疾患を有する各対象について、がんが関与している可能性が最も高いリンパ節を識別した。これは、対象内の中央値を超える、(最後のモデルから出力された)がん性である確率を有するLNを選択すること(
図3Aに示される補完モデルを含む補完プロセス)によって、各対象について行った。がんを有する対象内の確率の中央値よりも低いLNは、陰性として分類した。
2.分類:コホートは、50:50の訓練:試験で分割した。次いで、LNの結果の補完プールを使用して第2の分類子(例えば、
図3Aのリスクモデル320)を訓練して、各対象について結節性疾患の存在を予測した。
【0131】
このモデルの出力は、実施例2において上で説明したモデルの出力と同様に、各LNががん性である連続した確率であった。しかしながら、追加的な補完及び分類ステップによる利益は、転移性疾患がある対象のリンパ節の全てについて割り当てられた、より広い確率の範囲が存在したことであった。より具体的には、がんを有する可能性が高いLNは、「+」となる確率が高く、一方で、がんを有する可能性が低いLNは、「+」となる確率が低かった。予測ステップのために、最も高い確率を有するLNに基づいて、LN侵襲の対象レベルのスコアを主成した(
図3B)。具体的には、これは、LNが固有の確率を取ること、及び肺がんのLN侵襲を有する対象に固有の確率を提供することを含んでいた。
図3Bに示される試験対象では、一番下のLNは、がんを保有する60%の確率が割り当てられた(例えば、確率(+)=0.6)。これは、3つのLNの中で最も高い「+」の確率を有するLNであった。したがって、対象レベルの確率には、0.6の値が割り当てられた。
【0132】
図9Aに例示されるように、ランダムフォレスト分類子を使用してステップアップアプローチを訓練した後、ブートストラップモデルの対象レベルの性能は、AUC=77.7%、感度=81.8%、及び特異度=59.9%を達成した。したがって、2ステップブートストラップモデルの性能は、実施例2に記載のアプローチと比較して向上した。同様の性能は、LASSO分類子を使用して達成された。最後に、このモデルを使用して、Nステージ全体にわたってスコア(又は、最高確率)の分布をプロットすることができる(
図9B)。興味深いことに、このモデルは、より高いNステージを有する場合に、より高い最高確率を得る。この確率スコアは、異なる臨床状況で使用して、異なる患者のトリアージ決定ツールを可能にすることができる。訓練及び試験のための追加のデータは、Nをバイナリ共変数ではなくカテゴリ共変数として予測するモデルを提供することができる。
【0133】
本出願で引用された全ての刊行物、特許、特許出願、及び他の文書は、各個別の刊行物、特許、特許出願、及び他の文書が、全ての目的のために参照により組み込まれることが個々に示されているかのようにある程度まで全ての目的のために、それらの全体が参照により本明細書に組み込まれる。
【0134】
様々な特定の実施形態が例示及び説明されてきたが、上記の明細書は限定的ではない。本開示の趣旨及び範囲から逸脱することなく様々な変更をなすことができることが認識されるであろう。本明細書を検討すると、当業者には多くの変形が明らかになるであろう。
【0135】
実施例4:CT画像ベースの予測デバイスを使用した例示的な誘導下介入
本明細書に記載の(例えば、リンパ節の転移性がんのリンパ節(LN)レベルのリスクを予測するためのリスクモデルをデプロイする)方法を実装する画像ベースのデバイスは、PETスキャンを含む従来の方法の不十分な性能のため、臨床ケアに影響を及ぼすことになる。系統的なリンパ節の切開/サンプリングを行った219人のNSCLC患者の最近の検査では、手術前のPETステージングの性能を検査した(例えば、Li他の、Implications of False Negative and False Positive Diagnosis in Lymph Node Staging of NSCLC by Means of 18F-FDG PET/CT.PLoS ONE 8(10):e78552を参照されたく、その全体は、参照によりその全体が組み込まれる)。肺門及び縦隔リンパ節転移を検出するためのPETの感度、特異度、PPV、及びNPVは、74.2%、54.4%、86.8%及び73.5%であり、13.2%の偽陰性率及び45.5%の偽陽性率であった。したがって、本明細書に記載の方法は、リンパ節侵襲をもたらした転移性疾患を検出するための非観血的な技術を表し、意思決定及び臨床ケアを改善することになる。このデバイスが意思決定及び臨床ケアに及ぼす影響の例としては、以下が挙げられる。
【0136】
そのサイズが転移に対するリスクが低い腫瘍を有する対象における追加的な試験を促す。小さな肺腫瘍のある対象における手術前のPETスキャン又はリンパ節生検の使用に対する標準的なケアが存在しないので、CTデバイスによって捕捉されたCT画像に基づくリンパ節侵襲の予測は、対象のリンパ節のPETスキャン又は気管支鏡によるサンプリングを介した後続の試験を促す。これに比べて、従来の方法は、対象に手術を受けさせ、より進行した疾患ステージは、手術中にしか認識されない。
【0137】
PETの結果が陰性であった場合は、組織ベースのリンパ節のサンプリングを促す。PETには偽陽性及び偽陰性の失敗率が存在するという一般的な認識があるが、診断試験は、PETスキャンの結果によって大きく影響される。腫瘍サイズがより小さく、陰性のPET患者は、しばしば、追加的なLNサンプリングを伴わずに手術受ける。患者のこのサブセットは、手術前の追加的なLNサンプリングから利益を得ることになる。
【0138】
偽陽性のPETスキャンで患者をステージングし、外科的介入のための適格性を実証する。現在、PETスキャンに基づいて進行ステージの疾患が強く疑われる患者は、追加的な確認的LNサンプリングを伴わずに、非治癒的全身治療/非外科的治療を受ける。リンパ節への侵襲(例えば、リンパ節のCT画像に基づく)の予測を受けた患者及びPETの結果が陰性であった患者は、代わりに、手術に関する決定を行う前に、より限定的なリンパ節サンプリングを受ける。したがって、これらの患者は、外科的切除の候補になり得、治癒の可能性が高くなる。
【0139】
どのLNに転移性疾患の可能性が最も高いかを知らせる。転移性疾患のリスクが高い患者は、リンパ節の気管支鏡によるサンプリング又は外科的サンプリングを受ける。典型的には、この戦略は、腫瘍の近位に最も重点を置いて、より離れたLNは、サンプリングを行わないか、又はより少なくサンプリングを行う。ここで、本明細書に記載の方法は、リンパ節侵襲の予測、更には関与するリンパ節の識別を可能にする。これは、臨床チームが、サンプリング戦略を、組織を取得し、収量を最大にし、かつ診断を見落とすリスクを最小にすることに適切に重点を置くように導く。
【0140】
LN転移のない患者に重点を置いた臨床試験の登録を精緻化する。局所的疾患を有する患者は、しばしば、局所的送達(化学療法又はアブレーションの経気管支針滴注)に重点を置いた臨床試験が求められる。残念なことに、そのような患者は、しばしば、リンパ節サンプリングを受けるときに、その処置中に、より進行したステージのがんが発見される。これは、適切なケアを遅らせる。したがって、本明細書に記載の(例えば、リンパ節の転移性がんのリンパ節(LN)レベルのリスクを予測するためのリスクモデルをデプロイする)方法を実装することは、リンパへの侵襲を呈する患者の識別を可能にし、したがって、そうした患者を、転移のない患者に重点を置いた臨床試験に登録する必要がなくなる。
【0141】
〔実施の態様〕
(1) 対象の転移性がんの対象レベルのリスクを決定する方法であって、前記方法が、
前記対象の複数のリンパ節を含む、前記対象から捕捉された1つ又は2つ以上の画像を取得することと、
取得された前記1つ又は2つ以上の画像の抽出された特徴にリスクモデルを適用することによって、前記転移性がんの対象レベルのリスクを予測することと、を含み、前記リスクモデルが、画像内のリンパ節について転移性がんのリンパ節(LN)レベルのリスクを予測するように訓練され、
前記リスクモデルが、少なくとも、基準個体の一組のリンパ節について、転移性がんの補完されたLNレベルのリスクから導出された標識を使用して訓練され、前記一組のリンパ節の前記補完されたLNレベルのリスクが、少なくとも、訓練画像のがん性リンパ節と非がん性リンパ節とを区別する補完モデルを使用して決定される、方法。
(2) 前記転移性がんの対象レベルのリスクを予測することが、
前記リスクモデルによって予測された転移性がんのLNレベルのリスクに基づいて、前記複数のリンパ節のうちの1つ又は2つ以上を選択することと、
前記1つ又は2つ以上のリンパ節について予測された前記転移性がんのLNレベルのリスクを使用して、前記転移性がんの対象レベルのリスクを決定することと、を更に含む、実施態様1に記載の方法。
(3) 前記複数のリンパ節のうちの1つ又は2つ以上を選択することが、最も高い確率のLNレベルのリスクを有する前記リンパ節を識別することを含み、前記転移性がんの対象レベルのリスクを決定することが、前記最も高い確率のLNレベルのリスクを前記転移性がんの対象レベルのリスクとして割り当てることを含む、実施態様2に記載の方法。
(4) 前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有する、転移性がんのLNレベルのリスクを予測する、実施態様1~3のいずれかに記載の方法。
(5) 基準個体の前記一組のリンパ節が、
中央リスク値を決定することと、
前記基準個体の前記リンパ節の補完されたLNレベルのリスクを前記中央リスク値と比較することと、によって選択される、実施態様1~4のいずれかに記載の方法。
【0142】
(6) 基準個体の前記一組のリンパ節が、
前記一組のリンパ節の前記中央リスク値よりも高いLNレベルのリスクを有する1つ又は2つ以上のリンパ節を含むことによって更に選択される、実施態様5に記載の方法。
(7) 前記一組のリンパ節の前記中央リスク値よりも低いLNレベルのリスクを有する1つ又は2つ以上のリンパ節が、前記一組のリンパ節から除外される、実施態様5又は6に記載の方法。
(8) 前記中央リスク値が、前記基準個体の対象内のLNレベルのリスクの中央値である、実施態様5~7のいずれかに記載の方法。
(9) 前記1つ又は2つ以上の画像が、コンピュータ断層撮影(CT)画像を含む、実施態様1~8のいずれかに記載の方法。
(10) 前記1つ又は2つ以上の画像が、胸部CTスキャンから取得される、実施態様1~9のいずれかに記載の方法。
【0143】
(11) 予測された転移性がんの対象レベルのリスクに従って、前記がんのステージを決定することを更に含む、実施態様1~10のいずれかに記載の方法。
(12) 前記予測された転移性がんの対象レベルのリスクに従って、前記対象に対する診断又は治療を選択することを更に含む、実施態様1~11のいずれかに記載の方法。
(13) 前記対象に対する診断又は治療を選択することは、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、外科的な腫瘍切除、又は気管支鏡若しくは内視鏡による診断及び治療の組み合わせのいずれかを選択することを含む、実施態様12に記載の方法。
(14) 前記対象に対する診断又は治療を選択することは、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも高いときに、PET若しくはPET-CTスキャンを行うこと、又はリンパ節生検を行うこと、のうちの一方又は両方から追加的な診断試験を選択することを含む、実施態様12に記載の方法。
(15) 前記対象に対する診断又は治療を選択することは、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、PET又はPET-CTスキャンの追加的な診断試験を選択することを含む、実施態様12に記載の方法。
【0144】
(16) 前記補完モデルが、胸部CTスキャンから取得された訓練画像を使用して訓練される、実施態様1~15のいずれかに記載の方法。
(17) 胸部CTスキャンから取得された前記訓練画像が、1つ又は2つ以上のリンパ節を含む、実施態様16に記載の方法。
(18) 前記補完モデルが、National Lung Screening Trial(NLST)の訓練画像を使用して訓練される、実施態様1~17のいずれかに記載の方法。
(19) 前記補完モデルが、カスタムデータセットの訓練画像を使用して訓練される、実施態様1~17のいずれかに記載の方法。
(20) 前記補完モデルが、前記訓練画像のうちの少なくとも1つから2つ又は3つ以上のラジオミクスパネル(radiomic panels)を生成することによって訓練される、実施態様16~19のいずれかに記載の方法。
【0145】
(21) 前記2つ又は3つ以上のラジオミクスパネルが、前記訓練画像のガウス変換のラプラシアンと、前記訓練画像のウェーブレット変換と、を含む、実施態様20に記載の方法。
(22) 前記補完モデルが、前記2つ又は3つ以上のラジオミクスパネルの各々から特徴を抽出することと、少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練される、実施態様20又は21に記載の方法。
(23) 前記補完モデルが、
前記ラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記ラジオミクスパネル内の前記ROIから特徴を抽出することと、
少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練される、実施態様20又は21に記載の方法。
(24) 前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、実施態様22又は23に記載の方法。
(25) 前記補完モデルが、訓練画像における転移の有無を示す基準グラウンドトゥルース値を使用して更に訓練される、実施態様16~24のいずれかに記載の方法。
【0146】
(26) 前記基準グラウンドトゥルース値が、がんのステージを示すNステージ共変数値から導出され、「0」又は「1」のがんステージが、転移のないことを示し、「2」又は「3」のがんステージが、転移のあることを示す、実施態様25に記載の方法。
(27) 前記基準グラウンドトゥルース値は、個々のリンパ節ががん性であるか非がん性であるかを示す、実施態様26に記載の方法。
(28) 個々のリンパ節ががん性であるか非がん性であるかを示す前記基準グラウンドトゥルース値が、腫瘍又はリンパ節の特性に基づいて、前記Nステージ共変数値から逆算される、実施態様27に記載の方法。
(29) 前記補完モデルが、ランダムフォレスト分類子又はLASSO分類子である、実施態様1~28のいずれかに記載の方法。
(30) 前記リスクモデルが、ランダムフォレスト分類子又はLASSO分類子である、実施態様1~29のいずれかに記載の方法。
【0147】
(31) 前記リスクモデルが、教師あり学習技術を使用して訓練される、実施態様30に記載の方法。
(32) 前記複数のリンパ節が、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、又は21個のリンパ節を含む、実施態様1~31のいずれかに記載の方法。
(33) 前記複数のリンパ節が、8~20個のリンパ節、10~19個のリンパ節、12~18個のリンパ節、又は14~16個のリンパ節を含む、実施態様1~31のいずれかに記載の方法。
(34) 前記転移性がんが、転移性肺がんである、実施態様1~33のいずれかに記載の方法。
(35) 前記リスクモデルが、少なくともAUC=78%、感度=82%、又は特異度=60%の性能を呈する、実施態様1~34のいずれかに記載の方法。
【0148】
(36) 実施態様1~35のいずれかに記載のリスクモデルを訓練する方法であって、前記方法が、
補完モデルを適用して、訓練画像における複数のリンパ節について補完されたLNレベルのリスクを生成することと、
一組のリンパ節を選択することであって、前記一組内の前記リンパ節が、中央リスク値よりも高いLNレベルのリスクを有する、選択することと、
前記リスクモデルを訓練するための基準グラウンドトゥルースとして、前記一組のリンパ節における前記リンパ節の前記LNレベルのリスクを使用することであって、前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有するLNレベルのリスクを予測することができる、使用することと、を含む、方法。
(37) 前記リスクモデルが、1つ又は2つ以上のラジオミクスパネルから特徴を抽出することと、少なくとも前記抽出された特徴を使用して前記リスクモデルを訓練することと、によって更に訓練される、実施態様36に記載の方法。
(38) 2つ又は3つ以上のラジオミクスパネルから特徴を抽出することが、
前記1つ又は2つ以上のラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記1つ又は2つ以上のラジオミクスパネル内の前記ROIから特徴を抽出することと、を含む、実施態様37に記載の方法。
(39) 前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、実施態様37又は38に記載の方法。
(40) 対象の転移性がんの対象レベルのリスクを決定するためのシステムであって、前記システムが、
前記対象の1つ又は2つ以上の画像を捕捉するように構成された撮像デバイスと、
コンピューティングデバイスと、を備え、前記コンピューティングデバイスが、
前記対象の複数のリンパ節を含む、前記対象から捕捉された1つ又は2つ以上の画像を取得するステップと、
前記取得された1つ又は2つ以上の画像の抽出された特徴にリスクモデルを適用することによって、前記転移性がんの対象レベルのリスクを予測するステップと、を行うように構成されており、前記リスクモデルが、画像内のリンパ節について、転移性がんのリンパ節(LN)レベルのリスクを予測するように訓練され、
前記リスクモデルが、少なくとも、基準個体の一組のリンパ節について、転移性がんの補完されたLNレベルのリスクから導出された標識を使用して訓練され、前記一組のリンパ節の前記補完されたLNレベルのリスクが、少なくとも、訓練画像のがん性リンパ節と非がん性リンパ節とを区別する補完モデルを使用して決定されている、システム。
【0149】
(41) 前記転移性がんの対象レベルのリスクを予測することが、
前記リスクモデルによって予測された転移性がんのLNレベルのリスクに基づいて、前記複数のリンパ節のうちの1つ又は2つ以上選択することと、
前記1つ又は2つ以上のリンパ節について予測された前記転移性がんのLNレベルのリスクを使用して、前記転移性がんの対象レベルのリスクを決定することと、を更に含む、実施態様40に記載のシステム。
(42) 前記複数のリンパ節のうちの1つ又は2つ以上を選択することが、最も高い確率のLNレベルのリスクを有する前記リンパ節を識別することを含み、前記転移性がんの対象レベルのリスクを決定することが、前記最も高い確率のLNレベルのリスクを前記転移性がんの対象レベルのリスクとして割り当てることを含む、実施態様41に記載のシステム。
(43) 前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有する転移性がんのLNレベルのリスクを予測する、実施態様40~42のいずれかに記載のシステム。
(44) 基準個体の前記一組のリンパ節が、
中央リスク値を決定することと、
前記基準個体の前記リンパ節の補完されたLNレベルのリスクを前記中央リスク値と比較することと、によって選択されている、実施態様40~43のいずれかに記載のシステム。
(45) 基準個体の前記一組のリンパ節が、
前記一組のリンパ節の前記中央リスク値よりも高いLNレベルのリスクを有する1つ又は2つ以上のリンパ節を含むことによって更に選択されている、実施態様44に記載のシステム。
【0150】
(46) 前記一組のリンパ節の前記中央リスク値よりも低いLNレベルのリスクを有する1つ又は2つ以上のリンパ節が、前記一組のリンパ節から除外されている、実施態様44又は45に記載のシステム。
(47) 前記中央リスク値が、前記基準個体の対象内のLNレベルのリスクの中央値である、実施態様44~46のいずれかに記載のシステム。
(48) 前記撮像デバイスが、コンピュータ断層撮影(CT)スキャナ、磁気共鳴撮像(MRI)スキャナ、陽電子放出断層撮影(PET)スキャナ、X線スキャナ、又は超音波撮像装置、のうちの1つである、実施態様40~47のいずれかに記載のシステム。
(49) 前記撮像デバイスが、CTスキャナであり、前記1つ又は2つ以上の画像が、コンピュータ断層撮影(CT)画像を含む、実施態様40~48のいずれかに記載のシステム。
(50) 前記1つ又は2つ以上の画像が、胸部CT画像を含む、実施態様40~49のいずれかに記載のシステム。
【0151】
(51) 前記コンピューティングデバイスが、前記予測された転移性がんの対象レベルのリスクに従って、前記がんのステージを決定するステップを実行するように更に構成されている、実施態様40~50のいずれかに記載のシステム。
(52) 前記コンピューティングデバイスが、前記予測された転移性がんの対象レベルのリスクに従って、前記対象に対する診断又は治療を選択するステップを実行するように更に構成されている、実施態様40~51のいずれかに記載のシステム。
(53) 前記対象に対する診断又は治療を選択することは、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、外科的な腫瘍切除、又は気管支鏡若しくは内視鏡による診断及び治療の組み合わせのいずれかを選択することを含む、実施態様52に記載のシステム。
(54) 前記対象に対する診断又は治療を選択することは、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも高いときに、PET若しくはPET-CTスキャンを行うこと、又はリンパ節生検を行うこと、のうちの一方又は両方の追加的な診断試験を選択することを含む、実施態様53に記載のシステム。
(55) 前記対象に対する診断又は治療を選択することは、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、PET又はPET-CTスキャンの追加的な診断試験を選択することを含む、実施態様53に記載のシステム。
【0152】
(56) 前記補完モデルが、胸部CTスキャンから取得された訓練画像を使用して訓練されている、実施態様40~54のいずれかに記載のシステム。
(57) 胸部CTスキャンから取得された前記訓練画像が、1つ又は2つ以上のリンパ節を含む、実施態様56に記載のシステム。
(58) 前記補完モデルが、National Lung Screening Trial(NLST)の訓練画像を使用して訓練されている、実施態様40~57のいずれかに記載のシステム。
(59) 前記補完モデルが、カスタムデータセットの訓練画像を使用して訓練されている、実施態様40~57のいずれかに記載のシステム。
(60) 前記補完モデルが、前記訓練画像の少なくとも1つから2つ又は3つ以上のラジオミクスパネルを生成することによって訓練されている、実施態様56~59のいずれかに記載のシステム。
【0153】
(61) 前記2つ又は3つ以上のラジオミクスパネルが、前記訓練画像のガウス変換のラプラシアンと、前記訓練画像のウェーブレット変換と、を含む、実施態様60に記載のシステム。
(62) 前記補完モデルが、前記2つ又は3つ以上のラジオミクスパネルの各々から特徴を抽出することと、少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練されている、実施態様60又は61に記載のシステム。
(63) 前記補完モデルが、
前記ラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記ラジオミクスパネル内の前記ROIから特徴を抽出することと、
少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練されている、実施態様60又は61に記載のシステム。
(64) 前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、実施態様62又は63に記載のシステム。
(65) 前記補完モデルが、訓練画像における転移の有無を示す基準グラウンドトゥルース値を使用して更に訓練されている、実施態様56~64のいずれかに記載のシステム。
【0154】
(66) 前記基準グラウンドトゥルース値が、がんのステージを示すNステージ共変数値から導出され、「0」又は「1」のがんステージが、転移のないことを示し、「2」又は「3」のがんステージが、転移のあることを示す、実施態様65に記載のシステム。
(67) 前記基準グラウンドトゥルース値は、個々のリンパ節ががん性であるか非がん性であるかを示す、実施態様66に記載のシステム。
(68) 個々のリンパ節ががん性であるか非がん性であるかを示す前記基準グラウンドトゥルース値が、腫瘍又はリンパ節の特性に基づいて、前記Nステージ共変数値から逆算されたものである、実施態様67に記載のシステム。
(69) 前記補完モデルが、ランダムフォレスト分類子又はLASSO分類子である、実施態様40~68のいずれかに記載のシステム。
(70) 前記リスクモデルが、ランダムフォレスト分類子又はLASSO分類子である、実施態様40~69のいずれかに記載のシステム。
【0155】
(71) 前記リスクモデルが、教師あり学習技術を使用して訓練されている、実施態様70に記載のシステム。
(72) 前記複数のリンパ節が、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、又は21個のリンパ節を含む、実施態様40~71のいずれかに記載のシステム。
(73) 前記複数のリンパ節が、8~20個のリンパ節、10~19個のリンパ節、12~18個のリンパ節、又は14~16個のリンパ節を含む、実施態様40~72のいずれかに記載のシステム。
(74) 前記転移性がんが、転移性肺がんである、実施態様40~73のいずれかに記載のシステム。
(75) 前記リスクモデルが、少なくともAUC=78%、感度=82%、又は特異度=60%の性能を呈する、実施態様40~74のいずれかに記載のシステム。
【0156】
(76) 前記リスクモデルが、
補完モデルを適用して、訓練画像における複数のリンパ節について補完されたLNレベルのリスクを生成することと、
一組のリンパ節を選択することであって、前記一組内の前記リンパ節が、中央リスク値よりも高いLNレベルのリスクを有する、選択することと、
前記リスクモデルを訓練するための基準グラウンドトゥルースとして、前記一組のリンパ節における前記リンパ節の前記LNレベルのリスクを使用することであって、前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有するLNレベルのリスクを予測することができる、使用することと、によって訓練されている、実施態様40~75のいずれかに記載のシステム。
(77) 前記リスクモデルが、1つ又は2つ以上のラジオミクスパネルから特徴を抽出することと、少なくとも前記抽出された特徴を使用して前記リスクモデルを訓練することと、によって更に訓練されている、実施態様76に記載のシステム。
(78) 2つ又は3つ以上のラジオミクスパネルから特徴を抽出することが、
前記1つ又は2つ以上のラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記1つ又は2つ以上のラジオミクスパネル内の前記ROIから特徴を抽出することと、を含む、実施態様77に記載のシステム。
(79) 前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、実施態様77又は78に記載のシステム。
(80) 命令を含む非一時的なコンピュータ可読媒体であって、前記命令がプロセッサによって実行されたとき、前記プロセッサに、
前記対象の複数のリンパ節を含む、前記対象から捕捉された1つ又は2つ以上の画像を取得することと、
前記取得された1つ又は2つ以上の画像の抽出された特徴にリスクモデルを適用することによって、前記転移性がんの対象レベルのリスクを予測することであって、前記リスクモデルが、画像内のリンパ節について転移性がんのリンパ節(LN)レベルのリスクを予測するように訓練された、予測することと、を行わせ、
前記リスクモデルが、少なくとも、基準個体の一組のリンパ節について、転移性がんの補完されたLNレベルのリスクから導出された標識を使用して訓練され、前記一組のリンパ節の前記補完されたLNレベルのリスクが、少なくとも、訓練画像のがん性リンパ節と非がん性リンパ節とを区別する補完モデルを使用して決定されている、非一時的なコンピュータ可読媒体。
【0157】
(81) 前記プロセッサに前記転移性がんの対象レベルのリスクを予測させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、
前記リスクモデルによって予測された転移性がんのLNレベルのリスクに基づいて、前記複数のリンパ節のうちの1つ又は2つ以上を選択することと、
前記1つ又は2つ以上のリンパ節について予測された前記転移性がんのLNレベルのリスクを使用して、前記転移性がんの対象レベルのリスクを決定することと、を行わせる命令を更に含む、実施態様80に記載の非一時的なコンピュータ可読媒体。
(82) 前記プロセッサに前記複数のリンパ節のうちの1つ又は2つ以上を選択させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、最も高い確率のLNレベルのリスクを有するリンパ節を識別させる命令を更に含み、前記プロセッサに前記転移性がんの対象レベルのリスクを決定させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、前記最も高い確率のLNレベルのリスクを前記転移性がんの対象レベルのリスクとして割り当てさせる命令を含む、実施態様81に記載の非一時的なコンピュータ可読媒体。
(83) 前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有する転移性がんのLNレベルのリスクを予測する、実施態様80~82のいずれかに記載の非一時的なコンピュータ可読媒体。
(84) 基準個体の前記一組のリンパ節が、
中央リスク値を決定することと、
前記基準個体の前記リンパ節の補完されたLNレベルのリスクを前記中央リスク値と比較することと、によって選択されている、実施態様80~83のいずれかに記載の非一時的なコンピュータ可読媒体。
(85) 基準個体の前記一組のリンパ節が、前記一組のリンパ節の前記中央リスク値よりも高いLNレベルのリスクを有する1つ又は2つ以上のリンパ節を含むことによって更に選択されている、実施態様84に記載の非一時的なコンピュータ可読媒体。
【0158】
(86) 前記一組のリンパ節の前記中央リスク値よりも低いLNレベルのリスクを有する1つ又は2つ以上のリンパ節が、前記一組のリンパ節から除外されている、実施態様84又は85に記載の非一時的なコンピュータ可読媒体。
(87) 前記中央リスク値が、前記基準個体の対象内のLNレベルのリスクの中央値である、実施態様84~86のいずれかに記載の非一時的なコンピュータ可読媒体。
(88) 前記1つ又は2つ以上の画像が、コンピュータ断層撮影(CT)画像を含む、実施態様80~87のいずれかに記載の非一時的なコンピュータ可読媒体。
(89) 前記1つ又は2つ以上の画像が、胸部CTスキャンから取得される、実施態様80~88のいずれかに記載の非一時的なコンピュータ可読媒体。
(90) 前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクに従って、前記がんのステージを決定させる命令を更に含む、実施態様80~89のいずれかに記載の非一時的なコンピュータ可読媒体。
【0159】
(91) 前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクに従って、前記対象に対する診断又は治療を選択させる命令を更に含む、実施態様80~90のいずれかに記載の非一時的なコンピュータ可読媒体。
(92) 前記プロセッサに前記対象に対する診断又は治療を選択させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、外科的な腫瘍切除、又は気管支鏡若しくは内視鏡による診断及び治療の組み合わせのいずれかを選択させる命令を更に含む、実施態様91に記載の非一時的なコンピュータ可読媒体。
(93) 前記プロセッサに前記対象に対する診断又は治療を選択させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも高いときに、PET若しくはPET-CTスキャンを行うこと、又はリンパ節生検を行うこと、のうちの一方又は両方の追加的な診断試験を選択させる命令を更に含む、実施態様91に記載の非一時的なコンピュータ可読媒体。
(94) 前記プロセッサに前記対象に対する診断又は治療を選択させる前記命令が、前記プロセッサによって実行されたときに、前記プロセッサに、前記予測された転移性がんの対象レベルのリスクが閾値リスク値よりも低いときに、PET又はPET-CTスキャンの追加的な診断試験を選択させる命令を更に含む、実施態様91に記載の非一時的なコンピュータ可読媒体。
(95) 前記補完モデルが、胸部CTスキャンから取得された訓練画像を使用して訓練されている、実施態様80~94のいずれかに記載の非一時的なコンピュータ可読媒体。
【0160】
(96) 胸部CTスキャンから取得された前記訓練画像が、1つ又は2つ以上のリンパ節を含む、実施態様95に記載の非一時的なコンピュータ可読媒体。
(97) 前記補完モデルが、National Lung Screening Trial(NLST)の訓練画像を使用して訓練されている、実施態様80~96のいずれかに記載の非一時的なコンピュータ可読媒体。
(98) 前記補完モデルが、カスタムデータセットの訓練画像を使用して訓練されている、実施態様80~96のいずれかに記載の非一時的なコンピュータ可読媒体。
(99) 前記補完モデルが、前記訓練画像の少なくとも1つから2つ又は3つ以上のラジオミクスパネルを生成することによって訓練されている、実施態様95~98のいずれかに記載の非一時的なコンピュータ可読媒体。
(100) 前記2つ又は3つ以上のラジオミクスパネルが、前記訓練画像のガウス変換のラプラシアンと、前記訓練画像のウェーブレット変換と、を含む、実施態様99に記載の非一時的なコンピュータ可読媒体。
【0161】
(101) 前記補完モデルが、前記2つ又は3つ以上のラジオミクスパネルの各々から特徴を抽出することと、少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練されている、実施態様99又は100に記載の非一時的なコンピュータ可読媒体。
(102) 前記補完モデルが、
前記ラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記ラジオミクスパネル内の前記ROIから特徴を抽出することと、
少なくとも前記抽出された特徴を使用して、前記補完モデルを訓練することと、によって更に訓練されている、実施態様99又は100に記載の非一時的なコンピュータ可読媒体。
(103) 前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、実施態様101又は102に記載の非一時的なコンピュータ可読媒体。
(104) 前記補完モデルが、訓練画像における転移の有無を示す基準グラウンドトゥルース値を使用して更に訓練されている、実施態様95~103のいずれかに記載の非一時的なコンピュータ可読媒体。
(105) 前記基準グラウンドトゥルース値が、がんのステージを示すNステージ共変数値から導出され、「0」又は「1」のがんステージが、転移のないことを示し、「2」又は「3」のがんステージが、転移のあることを示す、実施態様104に記載の非一時的なコンピュータ可読媒体。
【0162】
(106) 前記基準グラウンドトゥルース値は、個々のリンパ節ががん性であるか非がん性であるかを示す、実施態様105に記載の非一時的なコンピュータ可読媒体。
(107) 個々のリンパ節ががん性であるか非がん性であるかを示す前記基準グラウンドトゥルース値が、腫瘍又はリンパ節の特性に基づいて、前記Nステージ共変数値から逆算されたものである、実施態様106に記載の非一時的なコンピュータ可読媒体。
(108) 前記補完モデルが、ランダムフォレスト分類子又はLASSO分類子である、実施態様80~107のいずれかに記載の非一時的なコンピュータ可読媒体。
(109) 前記リスクモデルが、ランダムフォレスト分類子又はLASSO分類子である、実施態様80~108のいずれかに記載の非一時的なコンピュータ可読媒体。
(110) 前記リスクモデルが、教師あり学習技術を使用して訓練されている、実施態様109に記載の非一時的なコンピュータ可読媒体。
【0163】
(111) 前記複数のリンパ節が、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、又は21個のリンパ節を含む、実施態様80~110のいずれかに記載の非一時的なコンピュータ可読媒体。
(112) 前記複数のリンパ節が、8~20個のリンパ節、10~19個のリンパ節、12~18個のリンパ節、又は14~16個のリンパ節を含む、実施態様80~111のいずれかに記載の非一時的なコンピュータ可読媒体。
(113) 前記転移性がんが、転移性肺がんである、実施態様80~112のいずれかに記載の非一時的なコンピュータ可読媒体。
(114) 前記リスクモデルが、少なくともAUC=78%、感度=82%、又は特異度=60%の性能を呈する、実施態様80~113のいずれかに記載の非一時的なコンピュータ可読媒体。
(115) 前記リスクモデルが、
補完モデルを適用して、訓練画像における複数のリンパ節について補完されたLNレベルのリスクを生成することと、
一組のリンパ節を選択することであって、前記一組内の前記リンパ節が、中央リスク値よりも高いLNレベルのリスクを有する、選択することと、
前記リスクモデルを訓練するための基準グラウンドトゥルースとして、前記一組のリンパ節における前記リンパ節の前記LNレベルのリスクを使用することであって、前記リスクモデルが、前記補完モデルによって予測された前記補完されたLNレベルのリスクよりも広い確率の範囲を有するLNレベルのリスクを予測することができる、使用することと、によって訓練されている、実施態様80~114のいずれかに記載の非一時的なコンピュータ可読媒体。
【0164】
(116) 前記リスクモデルが、1つ又は2つ以上のラジオミクスパネルから特徴を抽出することと、少なくとも前記抽出された特徴を使用して前記リスクモデルを訓練することと、によって更に訓練されている、実施態様115に記載の非一時的なコンピュータ可読媒体。
(117) 2つ又は3つ以上のラジオミクスパネルから特徴を抽出することが、
前記1つ又は2つ以上のラジオミクスパネル内の関心領域(ROI)を画定することであって、前記画定された関心領域が、リンパ節を含む、画定することと、
前記1つ又は2つ以上のラジオミクスパネル内の前記ROIから特徴を抽出することと、を含む、実施態様116に記載の非一時的なコンピュータ可読媒体。
(118) 前記抽出された特徴が、一次特徴、形状特徴、グレーレベル共起行列1(GLCM)特徴、グレーレベルランレングス行列(GLRLM)特徴、グレーレベルサイズゾーン行列(GLSZM)特徴、及び近傍グレートーン差分行列(NGTDM)特徴、のうちの1つ又は2つ以上の特徴カテゴリを含む、実施態様115又は116に記載の非一時的なコンピュータ可読媒体。
【国際調査報告】