(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-12
(54)【発明の名称】将来の肺がんのリスクを予測するためのシステム及び方法
(51)【国際特許分類】
G16H 50/30 20180101AFI20240705BHJP
【FI】
G16H50/30
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024502086
(86)(22)【出願日】2022-07-13
(85)【翻訳文提出日】2024-03-11
(86)【国際出願番号】 IB2022056474
(87)【国際公開番号】W WO2023285993
(87)【国際公開日】2023-01-19
(32)【優先日】2021-07-16
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2022-04-07
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522285451
【氏名又は名称】ジョンソン・アンド・ジョンソン・エンタープライズ・イノベーション・インコーポレイテッド
(74)【代理人】
【識別番号】100088605
【氏名又は名称】加藤 公延
(74)【代理人】
【識別番号】100130384
【氏名又は名称】大島 孝文
(72)【発明者】
【氏名】ワシュコ・ジュニア・ジョージ・アール
(72)【発明者】
【氏名】スティーブンソン・クリストファー・スコット
(72)【発明者】
【氏名】アッシュ・サミュエル・ヨッフェ
(72)【発明者】
【氏名】サン・ホセ・エステパル・ラウル
(72)【発明者】
【氏名】メールマン・マシュー・デビッド
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA15
(57)【要約】
リスク予測モデルは、1人又は2人以上の対象の肺がんのリスク(例えば、肺がんの現在のリスク又は将来のリスク)を予測するために、コンピュータ断層撮影スキャンなどの画像を分析するために訓練及びデプロイされる。個々のリスク予測モデルは、各リスク予測モデルが異なる時間範囲にわたる肺がんのリスクを予測することができるように、縦方向結節特異的特徴及び縦方向非結節特異的特徴を含む結節特異的特徴及び非結節特異的特徴に関して訓練される。そのようなリスク予測モデルは、臨床試験のエンリッチメントを可能にすることによって、肺がんの予防療法を開発するのに有用である。
【特許請求の範囲】
【請求項1】
対象の肺がんの1つ又は2つ以上のリスクを予測するための方法であって、
前記対象から捕捉された1つ又は2つ以上の画像を取得することと、
取得された前記1つ又は2つ以上の画像から特徴を抽出することであって、抽出された前記特徴が、少なくとも非結節特異的特徴を含み、前記非結節特異的特徴が、肺実質特徴、体組成特徴、縦方向肺実質特徴、又は縦方向体組成特徴のうちの1つ又は2つ以上を含む、抽出することと、
1つ又は2つ以上の訓練されたリスク予測モデルを適用して、取得された前記1つ又は2つ以上の画像から抽出された前記特徴を分析することによって、前記対象の肺がんの1つ又は2つ以上のリスクを予測することと、を含む、方法。
【請求項2】
前記非結節特徴が、前記縦方向肺実質特徴及び前記縦方向体組成特徴を含む、請求項1に記載の方法。
【請求項3】
前記非結節特徴が、前記肺実質特徴、前記体組成特徴、前記縦方向肺実質特徴、及び前記縦方向体組成特徴の各々を含む、請求項1に記載の方法。
【請求項4】
前記縦方向肺実質特徴が、前記肺実質のデンシトメトリー測定値の変化又は前記肺実質の局所ヒストグラム測定値の変化のうちの1つ又は2つ以上を含む、請求項1に記載の方法。
【請求項5】
前記肺実質の前記デンシトメトリー測定値が、肺の低減衰領域の割合、肺の高減衰領域の割合、及び下部肺ゾーンと比較した上部肺ゾーンにおける低減衰領域又は高減衰領域の比のうちの1つ又は2つ以上を含む、請求項4に記載の方法。
【請求項6】
前記肺実質の前記局所ヒストグラム測定値が、正常組織、小葉中心性肺気腫、小葉中心性結節、すりガラス、蜂巣肺、線状痕、結節性、網状、胸膜下ライン、他の肺気腫、又は嚢胞のいずれかによって占有される肺の1つ又は2つ以上の割合を含む、請求項4に記載の方法。
【請求項7】
前記縦方向体組成特徴が、胸筋断面積の変化、胸筋除脂肪断面積の変化、又は皮下脂肪断面積の変化のうちの1つ又は2つ以上を含む、請求項1に記載の方法。
【請求項8】
肺がんの前記1つ又は2つ以上のリスクが、既存の又は高頻度に見られるがんのリスクを含む、請求項1に記載の方法。
【請求項9】
肺がんの前記1つ又は2つ以上のリスクが、がんが発生する将来のリスクを含む、請求項1に記載の方法。
【請求項10】
抽出された前記特徴が、結節特異的特徴を更に含む、請求項1に記載の方法。
【請求項11】
前記結節特異的特徴が、縦方向結節特異的特徴を含む、請求項10に記載の方法。
【請求項12】
前記縦方向結節特異的特徴が、結節特異的減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化、結節直径の変化、Lung-RADSスコアの変化、又はラジオミクス特徴の変化のうちの1つ又は2つ以上を含む、請求項11に記載の方法。
【請求項13】
ラジオミクス特徴が、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存性行列のうちの1つ又は2つ以上を含む、請求項12に記載の方法。
【請求項14】
前記対象の肺がんの前記1つ又は2つ以上のリスクを予測することが、
前記非結節特異的特徴を分析するように構成された第1のサブモデルと、
前記結節特異的特徴を分析するように構成された第2のサブモデルと、を含むリスク予測モデルを適用することを含む、請求項10に記載の方法。
【請求項15】
前記リスク予測モデルが、前記第1のサブモデル及び前記第2のサブモデルの予測された出力を分析して、前記対象の肺がんのリスクを予測するように構成された第3のサブモデルを更に含む、請求項14に記載の方法。
【請求項16】
前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの2つ又は3つ以上、3つ又は4つ以上、或いは4つ又は5つ以上が、縦方向肺実質特徴又は縦方向体組成特徴である、請求項14に記載の方法。
【請求項17】
前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの2つ又は3つ以上、3つ又は4つ以上、或いは4つ又は5つ以上が、肺実質特徴又は体組成特徴である、請求項14に記載の方法。
【請求項18】
前記1つ又は2つ以上のリスク予測モデルのうちの1つが、Lung-RADS 1、Lung-RADS 1~2、Lung-RADS 1~3、Lung-RADS 1~4A、又はLung-RADS 1~4Bのうちのいずれかに分類された訓練個体の訓練コホートから捕捉された訓練画像を使用して肺がんの前記リスクを予測するように訓練されたものである、請求項1に記載の方法。
【請求項19】
前記1つ又は2つ以上の画像が、コンピュータ断層撮影(CT)画像又はX線画像である、請求項1に記載の方法。
【請求項20】
前記1つ又は2つ以上の画像が、第1の時点で前記対象から捕捉された少なくとも第1の画像と、第2の時点で前記対象から捕捉された少なくとも第2の画像と、を含む、請求項1に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2021年7月16日に出願された米国特許仮出願第63/222,712号及び2022年4月7日に出願された米国特許仮出願第63/328,590号の利益及び優先権を主張するものであり、これらの米国特許仮出願の各々の開示全体は、その全体があらゆる目的のために参照により本明細書に組み込まれる。
【背景技術】
【0002】
肺がんは、最も一般的には肺結節の発生から始まる。結節はがん性であり得るか、又はその後悪性形質転換を起こす組織の良性過剰成長であり得る。過去10年にわたって、医学界による広範な研究は、特定の患者集団において、胸のコンピュータ断層撮影(胸のCT)を使用する年間肺がんスクリーニングが、肺結節のより早期の識別をもたらし、肺がんに関連する死亡率を減少させることを示している。放射線医学界は、高リスク肺結節を識別する臨床スコアリングシステムの作成において大きな進歩を遂げたが、肺がんの真の予防は、この疾患のリスクが最も高い患者を識別できないことによって制限されてきた。
【0003】
例えば、放射線科医によって現在利用されている肺CTスクリーニング、報告データシステム(Reporting and Data System、Lung-RADS)スコアリングシステムは、結節のサイズ、結節の成長率、及び結節の外観に基づく。一般に、結節が大きいほど、結節の成長がより急速である、又はその外観がより不規則であるほど、結節ががんになる可能性が高くなる。このシステムは、肺生検又は手術などの即時介入の恩恵を受け得る患者を識別するのに非常に適している。しかしながら、それは将来の悪性腫瘍の長期リスクを判定しない。
【発明の概要】
【発明が解決しようとする課題】
【0004】
したがって、将来肺がんが発生するリスクが最も高い患者を識別するための追加のツールが必要である。
【課題を解決するための手段】
【0005】
本明細書に開示される実施形態は、肺がんのリスク(例えば、がんの既存の若しくは高頻度に見られるリスク又はがんが発生する将来のリスク)を予測するために画像(例えば、CTスキャン)を分析するためのリスク予測モデルを実装することを含む。リスク予測モデルは、結節特異的特徴及び非結節特異的特徴などの、画像から抽出された特徴を分析する。様々な実施形態では、リスク予測モデルに非結節特異的特徴を含むことは、リスク予測モデルが、肺結節をまだ有していない対象についてのがん予測の将来のリスクを生成することを可能にする利点を有する。一例として、例が肺実質特徴及び/又は体組成特徴を含む結節特異的特徴及び/又は非結節特異的特徴を分析することによって、リスク予測モデルは、肺結節の発生前の肺がんの早期検出のために実装することができる。別の例として、例が肺実質特徴及び/又は体組成特徴を含む結節特異的特徴及び/又は非結節特異的特徴を分析することによって、リスク予測モデルは、結節を区別する(例えば、良性結節対悪性結節又は健康な結節対がん性結節)ために実装することができる。様々な実施形態において、リスク予測モデルは、縦方向結節特異的特徴及び縦方向非結節特異的特徴などの、画像から抽出された縦方向特徴を分析する。縦方向特徴は、異なる時点から捕捉された2つ又は3つ以上の画像から導出され、したがって、異なる時点にわたる特徴の変化を指す。したがって、リスク予測モデルは、がんの発生の早期検出のために、ある期間にわたって患者を監視するために実装され得る。
【0006】
本明細書に開示されるのは、対象の肺がんの1つ又は2つ以上のリスクを予測するための方法であって、対象から捕捉された1つ又は2つ以上の画像を取得することと、取得された1つ又は2つ以上の画像から特徴を抽出することであって、抽出された特徴が、少なくとも非結節特異的特徴を含み、非結節特異的特徴が、肺実質特徴、体組成特徴、縦方向肺実質特徴、又は縦方向体組成特徴のうちの1つ又は2つ以上を含む、抽出することと、1つ又は2つ以上の訓練されたリスク予測モデルを適用して、取得された1つ又は2つ以上の画像から抽出された特徴を分析することによって、対象の肺がんの1つ又は2つ以上のリスクを予測することと、を含む、方法である。様々な実施形態では、非結節特徴は、縦方向肺実質特徴と、縦方向体組成特徴と、を含む。
【0007】
様々な実施形態では、非結節特徴は、肺実質特徴、体組成特徴、縦方向肺実質特徴、及び縦方向体組成特徴の各々を含む。様々な実施形態では、肺実質特徴は、肺実質のデンシトメトリー測定値又は肺実質の局所ヒストグラム測定値のうちの1つ又は2つ以上を含む。様々な実施形態では、縦方向肺実質特徴は、肺実質のデンシトメトリー測定値の変化又は肺実質の局所ヒストグラム測定値の変化のうちの1つ又は2つ以上を含む。様々な実施形態では、肺実質のデンシトメトリー測定値は、肺の低減衰領域の割合、肺の高減衰領域の割合、及び下部肺ゾーンと比較した上部肺ゾーンにおける低減衰領域又は高減衰領域の比のうちの1つ又は2つ以上を含む。様々な実施形態において、肺実質の局所ヒストグラム測定値は、正常組織、小葉中心性肺気腫、小葉中心性結節、地上ガラス、蜂巣肺、線状痕、結節性、網状、胸膜下ライン、他の肺気腫、又は嚢胞のいずれかによって占有される肺の1つ又は2つ以上の割合を含む。様々な実施形態では、体組成特徴は、胸筋断面積、胸筋除脂肪断面積、又は皮下脂肪断面積のうちの1つ又は2つ以上を含む。
【0008】
様々な実施形態では、縦方向体組成特徴は、胸筋断面積の変化、胸筋除脂肪断面の変化積、又は皮下脂肪断面積の変化のうちの1つ又は2つ以上を含む。様々な実施形態では、肺がんの1つ又は2つ以上のリスクは、既存又は高頻度に見られるがんのリスクを含む。様々な実施形態では、肺がんの1つ又は2つ以上のリスクは、がんが発生する将来のリスクを含む。様々な実施形態では、抽出された特徴は、結節特異的特徴を更に含む。様々な実施形態では、結節特異的特徴は、縦方向結節特異的特徴を含む。様々な実施形態では、結節特異的特徴は、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ、結節直径、Lung-RADSスコア、又はラジオミクス特徴のうちの1つ又は2つ以上を含む。様々な実施形態では、縦方向結節特異的特徴は、結節特異的減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化、結節直径の変化、Lung-RADSスコアの変化、又はラジオミクス特徴の変化のうちの1つ又は2つ以上を含む。様々な実施形態では、ラジオミクス特徴は、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存性行列のうちの1つ又は2つ以上を含む。
【0009】
様々な実施形態では、結節特異的特徴は、放射線技師レポートから抽出される。様々な実施形態では、結節特異的特徴は、画像分析アルゴリズムを実装することによって計算的に抽出される。様々な実施形態では、対象の肺がんの1つ又は2つ以上のリスクを予測することは、非結節特異的特徴を分析するように構成された第1のサブモデルと、結節特異的特徴を分析するように構成された第2のサブモデルと、を含むリスク予測モデルを適用することを含む。
【0010】
様々な実施形態では、リスク予測モデルは、第1のサブモデル及び第2のサブモデルの予測された出力を分析して、対象の肺がんのリスクを予測するように構成された第3のサブモデルを更に含む。様々な実施形態において、対象の肺がんの1つ又は2つ以上のリスクを予測することは、5年リスク予測モデルを適用して、対象に5年以内に肺がんが発生する可能性が高いかどうかを予測することを含む。様々な実施形態において、対象の肺がんの1つ又は2つ以上のリスクを予測することは、3年リスク予測モデルを適用して、対象に3年以内に肺がんが発生する可能性が高いかどうかを予測することを含む。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの2つ又は3つ以上は、縦方向肺実質特徴又は縦方向体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの3つ又は4つ以上は、縦方向肺実質特徴又は縦方向体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの4つ又は5つ以上は、縦方向肺実質特徴又は縦方向体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの2つ又は3つ以上は、肺実質特徴又は体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの3つ又は4つ以上は、肺実質特徴又は体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの4つ又は5つ以上は、肺実質特徴又は体組成特徴である。
【0011】
様々な実施形態では、3年リスク予測モデルは、少なくとも0.70の曲線下面積(area under the curve、AUC)値を示す。様々な実施形態では、3年リスク予測モデルは、少なくとも5.0のオッズ比を示す。様々な実施形態において、対象の肺がんの1つ又は2つ以上のリスクを予測することは、1年リスク予測モデルを適用して、対象に1年以内に肺がんが発生する可能性が高いかどうかを予測することを含む。様々な実施形態では、対象が候補であると判定することは、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、又はLung-RADS 4Bのうちの1つにおいて対象の分類を取得することを含む。
【0012】
様々な実施形態では、対象の肺がんの1つ又は2つ以上のリスクを予測することは、結節特異的特徴及び非結節特異的特徴を一緒に分析するように構成されているリスク予測モデルを適用することを含む。様々な実施形態において、対象の肺がんの1つ又は2つ以上のリスクを予測することは、複数のリスク予測モデルを適用して、対象にN個の異なる期間内に肺がんが発生する可能性が高いかどうかを予測することを含む。様々な実施形態では、N個の異なる期間のうちの少なくとも1個は、0ヶ月、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、1年、1.5年、2年、2.5年、3年、3.5年、4年、4.5年、5年、5.5年、6年、6.5年、7年、7.5年、8年、8.5年、9年、9.5年、10年、10.5年、11年、11.5年、12年、12.5年、13年、13.5年、14年、14.5年、15年、15.5年、16年、16.5年、17年、17.5年、18年、18.5年、19年、19.5年、又は20年のうちのいずれか1つである。様々な実施形態では、Nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20の異なる期間である。様々な実施形態では、1つ又は2つ以上のリスク予測モデルのうちの1つは、Lung-RADS 1、Lung-RADS 1~2、Lung-RADS 1~3、Lung-RADS 1~4A、又はLung-RADS 1~4Bモデルのうちのいずれかに分類された訓練個体の訓練コホートから捕捉された訓練画像を使用して肺がんのリスクを予測するように訓練されている。様々な実施形態では、1つ又は2つ以上のリスク予測モデルのうちの1つは、Lung-RADS 1~3に分類された訓練個体の訓練コホートから捕捉された訓練画像を使用して肺がんのリスクを予測するように訓練されている。様々な実施形態では、訓練コホート内の訓練個体の大部分は、以前にLung-RADS 1に分類されている。
【0013】
様々な実施形態では、1つ又は2つ以上の画像は、コンピュータ断層撮影(computed tomography、CT)画像又はX線画像である。様々な実施形態では、1つ又は2つ以上の画像は、胸部CT画像又は胸のX線画像である。様々な実施形態では、1つ又は2つ以上の画像は、少なくとも第1の時点において対象から捕捉された第1の画像と、少なくとも第2の時点において対象から捕捉された第2の画像と、を含む。様々な実施形態では、リスク予測モデルは、国立肺スクリーニング試験(National Lung Screening Trial、NLST)の訓練画像を使用して訓練される。
【0014】
様々な実施形態では、本明細書に開示される方法は、対象について肺がんの1つ又は2つ以上のリスクを予測する前に、対象に対応する結節特異的特徴を取得することと、結節特異的特徴に基づいて、対象がリスク予測のための候補であると判定することと、を更に含む。様々な実施形態では、対象が候補であると判定することは、対象が肺がんを有しないか、又は対象に肺がんが発生するリスクが低いと判定することを含む。様々な実施形態では、対象に肺がんが発生するリスクが低いと判定することは、結節特異的特徴に基づいて対象が結節を有しないと判定することを含む。様々な実施形態では、肺がんは、非小細胞肺がん又は小細胞肺がんのいずれかである。様々な実施形態において、肺がんは腺がん又は扁平上皮がんのいずれかである。
【0015】
様々な実施形態では、本明細書に開示される方法は、肺がんの予測されたリスクに基づいて、対象に対する臨床的対応を選択することを更に含む。様々な実施形態では、対象に対する臨床的対応を選択することは、対象を治療するための介入を選択することを含む。様々な実施形態では、介入を選択することは、対象への投与のための治療薬を選択することを含む。様々な実施形態では、選択された治療薬は、肺がんの発生を遅延させるか又は予防するために対象に予防的に投与される。様々な実施形態では、臨床的対応は、対象の行動を修正するために対象に助言を提供することを含む。様々な実施形態では、臨床的対応は、対象のフォローアップの頻度を増加させることを含む。様々な実施形態では、臨床的対応は、肺がんの予測されたリスクを確認するために追加のリスク予測試験を実行するか又は実行するようにスケジューリングすることを含む。様々な実施形態では、訓練されたリスク予測モデルのうちの1つ又は2つ以上は、ランダムフォレストモデル又は勾配ブーストモデルのうちの1つである。
【0016】
追加的に本明細書に開示されるのは、対象の肺がんの1つ又は2つ以上のリスクを予測するための非一時的なコンピュータ可読媒体であって、非一時的なコンピュータ可読媒体は、命令を含み、当該命令は、プロセッサによって実行されると、プロセッサに、対象から捕捉された1つ又は2つ以上の画像を取得させることと、取得された1つ又は2つ以上の画像から特徴を抽出することであって、抽出された特徴が、少なくとも非結節特異的特徴を含み、非結節特異的特徴が、肺実質特徴、体組成特徴、縦方向肺実質特徴、又は縦方向体組成特徴のうちの1つ又は2つ以上を含む、抽出することと、1つ又は2つ以上の訓練されたリスク予測モデルを適用して、取得された1つ又は2つ以上の画像から抽出された特徴を分析することによって、対象の肺がんの1つ又は2つ以上のリスクを予測することと、を行わせる、非一時的なコンピュータ可読媒体である。
【0017】
様々な実施形態では、非結節特徴は、縦方向肺実質特徴と、縦方向体組成特徴と、を含む。様々な実施形態では、非結節特徴は、肺実質特徴、体組成特徴、縦方向肺実質特徴、及び縦方向体組成特徴の各々を含む。様々な実施形態では、肺実質特徴は、肺実質のデンシトメトリー測定値又は肺実質の局所ヒストグラム測定値のうちの1つ又は2つ以上を含む。様々な実施形態では、縦方向肺実質特徴は、肺実質のデンシトメトリー測定値の変化又は肺実質の局所ヒストグラム測定値の変化のうちの1つ又は2つ以上を含む。様々な実施形態では、肺実質のデンシトメトリー測定値は、肺の低減衰領域の割合、肺の高減衰領域の割合、及び下部肺ゾーンと比較した上部肺ゾーンにおける低減衰領域又は高減衰領域の比のうちの1つ又は2つ以上を含む。様々な実施形態において、肺実質の局所ヒストグラム測定値は、正常組織、小葉中心性肺気腫、小葉中心性結節、地上ガラス、蜂巣肺、線状痕、結節性、網状、胸膜下ライン、他の肺気腫、又は嚢胞のいずれかによって占有される肺の1つ又は2つ以上の割合を含む。様々な実施形態では、体組成特徴は、胸筋断面積、胸筋除脂肪断面積、又は皮下脂肪断面積のうちの1つ又は2つ以上を含む。様々な実施形態では、縦方向体組成特徴は、胸筋断面積の変化、胸筋除脂肪断面の変化積、又は皮下脂肪断面積の変化のうちの1つ又は2つ以上を含む。
【0018】
様々な実施形態では、肺がんの1つ又は2つ以上のリスクは、既存又は高頻度に見られるがんのリスクを含む。様々な実施形態では、肺がんの1つ又は2つ以上のリスクは、がんが発生する将来のリスクを含む。様々な実施形態では、抽出された特徴は、結節特異的特徴を更に含む。様々な実施形態では、結節特異的特徴は、縦方向結節特異的特徴を含む。様々な実施形態では、結節特異的特徴は、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ、結節直径、Lung-RADSスコア、又はラジオミクス特徴のうちの1つ又は2つ以上を含む。様々な実施形態では、縦方向結節特異的特徴は、結節特異的減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化、結節直径の変化、Lung-RADSスコアの変化、又はラジオミクス特徴の変化のうちの1つ又は2つ以上を含む。様々な実施形態では、ラジオミクス特徴は、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存性行列のうちの1つ又は2つ以上を含む。様々な実施形態では、結節特異的特徴は、放射線技師レポートから抽出される。様々な実施形態では、結節特異的特徴は、画像分析アルゴリズムを実装することによって計算的に抽出される。
【0019】
様々な実施形態では、プロセッサに、対象の肺がんの1つ又は2つ以上のリスクを予測させる命令は、プロセッサによって実行されると、プロセッサに、非結節特異的特徴を分析するように構成された第1のサブモデルと、結節特異的特徴を分析するように構成された第2のサブモデルと、を含むリスク予測モデルを適用させる命令を更に含む。様々な実施形態では、リスク予測モデルは、第1のサブモデル及び第2のサブモデルの予測された出力を分析して、対象の肺がんのリスクを予測するように構成された第3のサブモデルを更に含む。様々な実施形態では、プロセッサに、対象の肺がんの1つ又は2つ以上のリスクを予測させる命令は、プロセッサによって実行されると、プロセッサに5年リスク予測モデルを適用させて、対象に5年以内に肺がんが発生する可能性が高いかどうかを予測させる命令を含む。様々な実施形態では、プロセッサに、対象の肺がんの1つ又は2つ以上のリスクを予測させる命令は、プロセッサによって実行されると、プロセッサに3年リスク予測モデルを適用させて、対象に3年以内に肺がんが発生する可能性が高いかどうかを予測させる命令を含む。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの2つ又は3つ以上は、縦方向肺実質特徴又は縦方向体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの3つ又は4つ以上は、縦方向肺実質特徴又は縦方向体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの4つ又は5つ以上は、縦方向肺実質特徴又は縦方向体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの2つ又は3つ以上は、肺実質特徴又は体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの3つ又は4つ以上は、肺実質特徴又は体組成特徴である。様々な実施形態では、リスク予測モデルの第1のサブモデルの上位10の重要な特徴のうちの4つ又は5つ以上は、肺実質特徴又は体組成特徴である。
【0020】
様々な実施形態では、3年リスク予測モデルは、少なくとも0.70の曲線下面積(AUC)値を示す。様々な実施形態では、3年リスク予測モデルは、少なくとも5.0のオッズ比を示す。様々な実施形態では、プロセッサに、対象の肺がんの1つ又は2つ以上のリスクを予測させる命令は、プロセッサによって実行されると、プロセッサに1年リスク予測モデルを適用させて、対象に1年以内に肺がんが発生する可能性が高いかどうかを予測させる命令を含む。様々な実施形態では、プロセッサに、対象、Lung-RADS 1、Lung-RADS 1~2、Lung-RADS 1~3、Lung-RADS 1~4A、又はLung-RADS 1~4Bのうちの1つにおいて対象の分類を取得させる命令を更に含む。様々な実施形態では、プロセッサに、対象の肺がんの1つ又は2つ以上のリスクを予測させる命令は、プロセッサによって実行されると、プロセッサに、結節特異的特徴及び非結節特異的特徴を一緒に分析するように構成されているリスク予測モデルを適用させる命令を更に含む。
【0021】
様々な実施形態において、対象の肺がんの1つ又は2つ以上のリスクを予測することは、複数のリスク予測モデルを適用して、対象にN個の異なる期間内に肺がんが発生する可能性が高いかどうかを予測することを含む。様々な実施形態では、N個の異なる期間のうちの少なくとも1個は、0ヶ月、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、1年、1.5年、2年、2.5年、3年、3.5年、4年、4.5年、5年、5.5年、6年、6.5年、7年、7.5年、8年、8.5年、9年、9.5年、10年、10.5年、11年、11.5年、12年、12.5年、13年、13.5年、14年、14.5年、15年、15.5年、16年、16.5年、17年、17.5年、18年、18.5年、19年、19.5年、又は20年のうちのいずれか1つである。様々な実施形態では、Nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20の異なる期間である。様々な実施形態では、1つ又は2つ以上のリスク予測モデルのうちの1つは、Lung-RADS 1、Lung-RADS 1~2、Lung-RADS 1~3、Lung-RADS 1~4A、又はLung-RADS 1~4Bモデルのうちのいずれかに分類された訓練個体の訓練コホートから捕捉された訓練画像を使用して肺がんのリスクを予測するように訓練されている。様々な実施形態では、1つ又は2つ以上のリスク予測モデルのうちの1つは、Lung-RADS 1~3に分類された訓練個体の訓練コホートから捕捉された訓練画像を使用して肺がんのリスクを予測するように訓練されている。様々な実施形態では、訓練コホート内の訓練個体の大部分は、以前にLung-RADS 1に分類されている。
【0022】
様々な実施形態では、1つ又は2つ以上の画像は、コンピュータ断層撮影(CT)画像又はX線画像である。様々な実施形態では、1つ又は2つ以上の画像は、胸部CT画像又は胸のX線画像である。様々な実施形態では、1つ又は2つ以上の画像は、少なくとも第1の時点において対象から捕捉された第1の画像と、少なくとも第2の時点において対象から捕捉された第2の画像と、を含む。様々な実施形態では、リスク予測モデルは、国立肺スクリーニング試験(NLST)の訓練画像を使用して訓練される。様々な実施形態では、非一時的なコンピュータ可読媒体は、命令を更に含み、当該命令は、プロセッサによって実行されると、プロセッサに、対象の肺がんの1つ又は2つ以上のリスクを予測する前に、対象に対応する結節特異的特徴を取得することと、結節特異的特徴に基づいて、対象がリスク予測のための候補であると判定することと、を行わせる。様々な実施形態では、プロセッサに、対象が候補であると判定させる命令が、プロセッサによって実行されると、プロセッサに、対象が肺がんを有しないか、又は対象に肺がんが発生するリスクが低いとプロセッサに判定させる命令を更に含む。様々な実施形態では、プロセッサに、対象に肺がんが発生するリスクが低いと判定させる命令が、プロセッサによって実行されると、プロセッサに、結節特異的特徴に基づいて対象が結節を有しないと判定させる命令を更に含む。
【0023】
様々な実施形態では、肺がんは、非小細胞肺がん又は小細胞肺がんのいずれかである。様々な実施形態において、肺がんは腺がん又は扁平上皮がんのいずれかである。様々な実施形態では、非一時的なコンピュータ可読媒体は、プロセッサによって実行されると、プロセッサに、肺がんの予測されたリスクに基づいて対象の臨床的対応を選択させる命令を更に含む。様々な実施形態では、プロセッサに、対象の臨床的対応を選択させる命令は、プロセッサによって実行されると、プロセッサに、対象を治療するための介入を選択させる命令を更に含む。様々な実施形態では、プロセッサに介入を選択させる命令は、プロセッサによって実行されると、プロセッサに、対象への投与のための治療薬を選択させる命令を更に含む。様々な実施形態では、選択された治療薬は、肺がんの発生を遅延させるか又は予防するために対象に予防的に投与される。
【0024】
様々な実施形態では、臨床的対応は、対象の行動を修正するために対象に助言を提供することを含む。様々な実施形態では、臨床的対応は、対象のフォローアップの頻度を増加させることを含む。様々な実施形態では、臨床的対応は、肺がんの予測されたリスクを確認するために追加のリスク予測試験を実行するか又は実行するようにスケジューリングすることを含む。様々な実施形態では、訓練されたリスク予測モデルのうちの1つ又は2つ以上は、ランダムフォレストモデル又は勾配ブーストモデルのうちの1つである。
【0025】
追加的に本明細書に開示されるのは、対象の肺がんの1つ又は2つ以上の将来のリスクを予測するための方法であって、単一の時点で対象から捕捉された1つ又は2つ以上の画像を取得することと、取得された1つ又は2つ以上の画像から特徴を抽出することであって、抽出された特徴が、少なくとも結節特異的特徴を含む、抽出することと、1つ又は2つ以上の訓練されたリスク予測モデルを適用して、取得された1つ又は2つ以上の画像から抽出された特徴を分析することによって、対象の肺がんの1つ又は2つ以上のリスクを予測することと、を含む。様々な実施形態では、結節特異的特徴は、縦方向結節特異的特徴を含む。様々な実施形態では、結節特異的特徴は、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ、結節直径、Lung-RADSスコア、又はラジオミクス特徴のうちの1つ又は2つ以上を含む。様々な実施形態では、縦方向結節特異的特徴は、結節特異的減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化、結節直径の変化、Lung-RADSスコアの変化、又はラジオミクス特徴の変化のうちの1つ又は2つ以上を含む。様々な実施形態では、ラジオミクス特徴は、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存性行列のうちの1つ又は2つ以上を含む。様々な実施形態では、結節特異的特徴は、放射線技師レポートから抽出される。様々な実施形態では、結節特異的特徴は、画像分析アルゴリズムを実装することによって計算的に抽出される。様々な実施形態では、対象から捕捉された1つ又は2つ以上の画像は、がん性であると疑われる1つ又は2つ以上の結節を含む。様々な実施形態では、対象の肺がんの1つ又は2つ以上のリスクを予測することは、1つ又は2つ以上の結節の各々について、1つ又は2つ以上の訓練されたリスク予測モデルを適用して、結節から抽出された特徴を分析することによって、結節をがん性又は非がん性として分類することと、がん性又は非がん性として分類された1つ又は2つ以上の結節に基づいて、対象における既存のがんの存在又は不在を判定することと、を含む。様々な実施形態では、がん性又は非がん性として分類された1つ又は2つ以上の結節に基づいて、対象における既存のがんの存在又は不在を判定することは、少なくとも1つの結節ががん性として分類されたことに応答して、対象が既存のがんの存在を有すると判定することを含む。様々な実施形態では、がん性又は非がん性として分類された1つ又は2つ以上の結節に基づいて、対象における既存のがんの存在又は不在を判定することは、少なくとも2つ、少なくとも3つ、少なくとも4つ、又は少なくとも5つの結節ががん性として分類されたことに応答して、対象が既存のがんの存在を有すると判定することを含む。様々な実施形態では、がん性又は非がん性として分類された1つ又は2つ以上の結節に基づいて、対象における既存のがんの存在又は不在を判定することは、0の結節ががん性として分類されたことに応答して、対象が既存のがんの不在を有すると判定することを含む。
【0026】
追加的に本明細書に開示されるのは、対象の肺がんの1つ又は2つ以上のリスクを予測するための非一時的なコンピュータ可読媒体であって、非一時的なコンピュータ可読媒体は、命令を含み、当該命令は、プロセッサによって実行されると、プロセッサに、対象から捕捉された1つ又は2つ以上の画像を取得させることと、取得された1つ又は2つ以上の画像から特徴を抽出することであって、抽出された特徴は、少なくとも結節特異的特徴を含む、抽出することと、1つ又は2つ以上の訓練されたリスク予測モデルを適用して、取得された1つ又は2つ以上の画像から抽出された特徴を分析することによって、対象の肺がんの1つ又は2つ以上のリスクを予測することと、を行わせる、非一時的なコンピュータ可読媒体である。様々な実施形態では、結節特異的特徴は、縦方向結節特異的特徴を含む。様々な実施形態では、結節特異的特徴は、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ、結節直径、Lung-RADSスコア、又はラジオミクス特徴のうちの1つ又は2つ以上を含む。様々な実施形態では、縦方向結節特異的特徴は、結節特異的減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化、結節直径の変化、Lung-RADSスコアの変化、又はラジオミクス特徴の変化のうちの1つ又は2つ以上を含む。様々な実施形態では、ラジオミクス特徴は、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存性行列のうちの1つ又は2つ以上を含む。様々な実施形態では、結節特異的特徴は、放射線技師レポートから抽出される。様々な実施形態では、結節特異的特徴は、画像分析アルゴリズムを実装することによって計算的に抽出される。様々な実施形態では、対象から捕捉された1つ又は2つ以上の画像は、がん性であると疑われる1つ又は2つ以上の結節を含む。様々な実施形態では、プロセッサに、対象の肺がんの1つ又は2つ以上のリスクを予測させる命令は、プロセッサによって実行されると、プロセッサに、1つ又は2つ以上の結節の各々について、1つ又は2つ以上の訓練されたリスク予測モデルを適用して、結節から抽出された特徴を分析することによって、結節をがん性又は非がん性として分類することと、がん性又は非がん性として分類された1つ又は2つ以上の結節に基づいて、対象における既存のがんの存在又は不在を判定することと、を行わせる命令を更に含む。様々な実施形態では、プロセッサに、がん性又は非がん性として分類された1つ又は2つ以上の結節に基づいて、対象における既存のがんの存在又は不在を判定させる命令は、プロセッサによって実行されると、プロセッサに、少なくとも1つの結節ががん性として分類されたことに応答して、対象が既存のがんの存在を有すると判定させる命令を更に含む。様々な実施形態では、プロセッサに、がん性又は非がん性として分類された1つ又は2つ以上の結節に基づいて、対象における既存のがんの存在又は不在を判定させる命令は、プロセッサによって実行されると、プロセッサに、少なくとも2つ、少なくとも3つ、少なくとも4つ、又は少なくとも5つの結節ががん性として分類されたことに応答して、対象が既存のがんの存在を有すると判定させる命令を更に含む。様々な実施形態では、プロセッサに、がん性又は非がん性として分類された1つ又は2つ以上の結節に基づいて、対象における既存のがんの存在又は不在を判定させる命令は、プロセッサによって実行されると、プロセッサに、0の結節ががん性として分類されたことに応答して、対象が既存のがんの不在を有すると判定させる命令を更に含む。
【図面の簡単な説明】
【0027】
本発明のこれら及び他の特徴、態様及び利点は、以下の説明及び添付の図面に関してより良く理解されるであろう。可能である場合は、類似又は同様の参照番号が図において使用され得、これらの参照番号は、類似又は同様の機能性を示し得ることに留意されたい。例えば、「特徴215A」などの参照番号の後の文字は、その文がその特定の参照番号を有する要素を具体的に指すことを示す。「特徴215」などの後続の文字を伴わない文中の参照番号は、その参照番号が付された図面内の要素のいずれか又は全てを指す(例えば、文中の「特徴215」は、図面中の参照番号「特徴215A」及び/又は「特徴215B」を指す)。
【
図1A】一実施形態による、対象のがん予測を判定するためのシステム環境の概要を示す。
【
図1B】一実施形態による、がん予測システムのブロック図を示す。
【
図2A】第1の実施形態による、患者のエンリッチメントなどの用途のための対象のがんのリスクを判定するための例示的なフロー図を示す。
【
図2B】第2の実施形態による、患者のエンリッチメントなどの用途のための対象のがんのリスクを判定するための例示的なフロー図を示す。
【
図3A】第1の実施形態による、リスク予測モデルの実装形態の例示的なフロー図である。
【
図3B】第2の実施形態による、リスク予測モデルの実装形態の例示的なフロー図である。
【
図4A】一実施形態による、患者のエンリッチメントなどの用途のための対象のがんのリスク(例えば、がんの将来のリスク)を判定するための例示的なフロープロセスである。
【
図4B】第2の実施形態による、対象のがんのリスク(例えば、既存の又は高頻度に見られるがんのリスク)を判定するための例示的なフロープロセスである。
【
図6B】
図3Aに示される実施形態による、リスク予測モデルの実装形態の例示的な概要を示す。
【
図7A】
図3Aに示される実施形態による、様々な異なる時点(例えば、t0、t1、t2、又はそれらの組み合わせ)の患者コホートにわたるリスク予測モデルの特性を示す。
【
図7B】
図3Aに示される実施形態による、リスク予測モデルを訓練及び試験するために使用される患者人口統計を示す。
【
図7C】
図3Aに示される実施形態による、リスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。
【
図7D】
図3Aに示される実施形態による、リスク予測モデルによって予測される3年累積発生率関数を示す。
【
図7E】
図3Aに示される実施形態による、リスク予測モデルの結節モデル構成要素の上位10の結節特徴を示す。
【
図7F】
図3Aに示される実施形態による、リスク予測モデルの非結節モデル構成要素の上位10の非結節特徴を示す。
【
図8】
図3Bに示される実施形態による、リスク予測モデルの実装形態の例示的な概要を示す。
【
図9A】
図3Bに示される実施形態による、様々な異なる時点(例えば、t0、t1、t2、又はそれらの組み合わせ)の患者コホートにわたるリスク予測モデルの特性を示す。
【
図9B】
図3Bに示される実施形態による、リスク予測モデルを訓練及び試験するために使用される患者人口統計を示す。
【
図9C】
図3Bに示される実施形態による、リスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。
【
図9D】
図3Bに示される実施形態による、リスク予測モデルによって予測される3年累積発生率関数を示す。
【
図9E】
図3Bに示される実施形態による、リスク予測モデルの上位10の特徴(例えば、結節及び非結節特徴)を示す。
【
図10A】
図3Aに示される実施形態による、t1時点でのLung-RADS 1~3患者を使用してリスク予測モデルを訓練及び試験するために使用される患者人口統計を示す。
【
図10B】t1時点でLung-RADS 1~3患者を使用して訓練及び試験されたリスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。
【
図10C】t1時点でLung-RADS 1~3患者を使用してリスク予測モデルによって予測される3年累積発生率関数を示す。
【
図10D】t1時点におけるLung-RADS 1~3患者を使用して訓練されたリスク予測モデルの結節モデル構成要素の上位10の結節特徴を示す。
【
図10E】t1時点におけるLung-RADS 1~3患者を使用して訓練されたリスク予測モデルの非結節モデル構成要素の上位10の非結節特徴を示す。
【
図11A】
図3Aに示される実施形態による、t2時点でのLung-RADS 1~3患者を使用してリスク予測モデルを訓練及び試験するために使用される患者人口統計を示す。
【
図11B】t2時点でLung-RADS 1~3患者を使用して訓練及び試験されたリスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。
【
図11C】t2時点でLung-RADS 1~3患者を使用してリスク予測モデルによって予測される3年累積発生率関数を示す。
【
図11D】t2時点におけるLung-RADS 1~3患者を使用して訓練されたリスク予測モデルの結節モデル構成要素の上位10の結節特徴を示す。
【
図11E】t2時点におけるLung-RADS 1~3患者を使用して訓練されたリスク予測モデルの非結節モデル構成要素の上位10の非結節特徴を示す。
【
図12A】
図3Aに示される実施形態による、t0時点でのLung-RADS 1~3患者を使用して単一の時点のリスク予測モデルを訓練及び試験するために使用される患者人口統計を示す。
【
図12B】t0時点でLung-RADS 1~3患者を使用して訓練及び試験された単一の時点のリスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。
【
図12C】t0時点でLung-RADS 1~3患者を使用して単一の時点のリスク予測モデルによって予測される3年累積発生率関数を示す。
【
図12D】t0時点におけるLung-RADS 1~3患者を使用して訓練された単一の時点のリスク予測モデルの結節モデル構成要素の上位10の結節特徴を示す。
【
図12E】t0時点におけるLung-RADS 1~3患者を使用して訓練された単一の時点のリスク予測モデルの非結節モデル構成要素の上位10の非結節特徴を示す。
【
図13A】高頻度に見られる又は既存のがんを予測するためにLung-RADS 2~4B患者を使用して訓練及び試験されたリスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。
【
図13B】高頻度に見られるがん又は既存のがんを予測するためにLung-RADS 2~4B患者を使用してリスク予測モデルを訓練及び試験するために使用される患者人口統計を示す。
【
図13C】高頻度に見られるがん又は既存のがんを予測するためにLung-RADS 2~4B患者を使用するリスク予測モデルの得られた予測を示す。
【発明を実施するための形態】
【0028】
I.定義
特許請求の範囲及び明細書で使用される用語は、特に明記しない限り、以下に記載されるように定義される。
【0029】
「対象」又は「患者」という用語は、互換的に使用され、インビボ、エクスビボ、又はインビトロ、男性又は女性にかかわらず、細胞、組織、又は生物、ヒト、又は非ヒトを包含する。
【0030】
「哺乳動物」という用語は、ヒト及び非ヒトの両方を包含し、ヒト、非ヒト霊長類、イヌ、ネコ、マウス、ウシ、ウマ、及びブタを含むが、これらに限定されない。
【0031】
「試料」又は「試験試料」という用語は、静脈穿刺、排泄、射精、マッサージ、生検、針吸引剤、洗浄試料、掻き取り、外科的切開、又はその他の手段、あるいは当該技術分野で既知の他の手段を含む手段によって、対象から採取された、血液試料などの細胞又は体液のアリコートの単一の細胞又は複数の細胞又は断片を含むことができる。身体流体のアリコートの例としては、羊水、房水、胆汁、リンパ、母乳、間質液、血液、血漿、耳垢(イヤワックス)、カウパ腺液(尿道球腺液)、乳糜、糜粥、スキーン腺液(female ejaculate)、経血、粘液、唾液、尿、嘔吐物、涙、膣液、汗、血清、精液、皮脂、膿、胸水、脳脊髄液、滑液、細胞内流体、及び硝子体液が挙げられる。様々な実施形態では、試料は、肺腫瘍又は肺結節などの組織の生検であることができる。
【0032】
「1つ又は2つ以上の画像を取得する」という用語は、対象から捕捉された1つ又は2つ以上の画像を取得するか、又は対象から得られた試料から捕捉された1つ又は2つ以上の画像を取得することを包含する。1つ又は2つ以上の画像を取得することは、対象から又は対象から得た試料から1つ又は2つ以上の画像を捕捉するステップを行うことを包含することができる。このフレーズはまた、例えば、対象から1つ又は2つ以上の画像を捕捉するステップを実行した第三者から、又は対象から得た試料から、1つ又は2つ以上の画像を受信することを包含することができる。1つ又は2つ以上の画像は、記憶装置に記憶されることを含む様々な既知の方式を介して、当業者によって取得され得る。様々な実施形態では、「1つ又は2つ以上の画像を取得すること」は、単一の時点(例えば、単一の患者訪問)で対象から各々捕捉される1つ又は2つ以上の画像を取得することを指す。様々な実施形態では、「1つ又は2つ以上の画像を取得すること」は、異なる時点(例えば、異なる患者訪問にわたる)で対象から捕捉される1つ又は2つ以上の画像を取得することを指す。
【0033】
「訓練画像」という用語は、リスク予測モデル、例えば、本明細書に記載のモデルなどの肺がんリスク予測モデルを訓練するために使用される個体から捕捉された画像(例えば、CT画像又はX線画像)を指す。様々な実施形態では、訓練画像は、患者の日常的な臨床ケアから(例えば、日常的にスクリーニングされた患者から)構築されたコホートからのコンピュータ断層撮影(CT)画像である。様々な実施形態では、訓練画像は、研究調査(例えば、連邦政府/業界スポンサー研究調査)から構築されたコホートからのコンピュータ断層撮影(CT)画像である。様々な実施形態では、訓練画像は、国立肺がんスクリーニング試験(NLST)コホートからのコンピュータ断層撮影(CT)画像である。様々な実施形態では、訓練画像は、カスタムデータセットに含まれるコンピュータ断層撮影(CT)画像である。例えば、訓練画像は、訓練個体から捕捉することができる。「訓練個体」という用語は、リスク予測モデルを訓練する際に使用するために訓練画像が捕捉又は別様に取得される個体を指す。
【0034】
「結節特異的特徴」又は「結節特異的特徴」という用語は、肺結節、肺結節のエッジ、及び境界/結節周辺領域の特徴を指し、その例には、結節特異的減衰、結節マージン記述(例えば、肺結節を取り囲む組織実質内の最大5mm、最大10mm、最大15mm、又は最大20mm)、結節サイズ、結節形状、結節テクスチャ(例えば、平滑、棘状など)、結節直径、及びLung-RADSスコアが含まれる。様々な実施形態では、結節特異的特徴は、画像から計算的に抽出される(例えば、画像分析アルゴリズムを実装することによって)。例えば、結節特異的特徴は、PyRadiomicsなどの画像処理アルゴリズムを使用して抽出されるレディオミクス特徴量であることができる。例示的なレディオミクス特徴量は、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存行列を含むことができる。様々な実施形態では、ラジオミクス特徴は、ウェーブレットフィルタ又はガウスフィルタなどのフィルタを適用することによって変換された画像から抽出される。したがって、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存行列のいずれかを、ウェーブレット変換画像又はガウス変換画像から抽出することができる。「結節特異的特徴」という用語は更に、肺結節の前述の特徴のうちのいずれかの縦方向特徴を指す。例えば、肺結節の縦方向特徴は、2つ又は3つ以上の時点の間の肺結節の特徴の変化であり得る。例えば、第1の時点t0及び第2の時点t1が与えられると、肺結節の縦方向特徴は、時点t0と時点t1との間の肺結節の特徴の変化であり得る。特定の実施形態では、肺結節の縦方向特徴は、結節固有減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化(例えば、平滑、棘状など)、結節直径の変化、Lung-RADSスコアの変化、及びラジオミクス特徴の変化を含む。そのような縦方向結節特異的特徴は、経時的な結節の変化(例えば、非線形変化)に関する洞察を提供することができる。様々な実施形態において、第1の時点(例えば、t0)と第2の時点(例えば、t1)との間の時間は、少なくとも1ヶ月、少なくとも2ヶ月、少なくとも3ヶ月、少なくとも4ヶ月、少なくとも5ヶ月、少なくとも6ヶ月、少なくとも7ヶ月、少なくとも8ヶ月、少なくとも9ヶ月、少なくとも10ヶ月、少なくとも11ヶ月、少なくとも12ヶ月、少なくとも13ヶ月、少なくとも14ヶ月、少なくとも15ヶ月、少なくとも16ヶ月、少なくとも17ヶ月、少なくとも18ヶ月、少なくとも24ヶ月、少なくとも30ヶ月、少なくとも36ヶ月、少なくとも42ヶ月、少なくとも48ヶ月、少なくとも54ヶ月、少なくとも60ヶ月、少なくとも66ヶ月、少なくとも72ヶ月、少なくとも78ヶ月、少なくとも84ヶ月、少なくとも90ヶ月、少なくとも96ヶ月、少なくとも102ヶ月、少なくとも108ヶ月、少なくとも114ヶ月、又は少なくとも120ヶ月であり得る。様々な実施形態において、第1の時点(例えば、t0)と第2の時点(例えば、t1)との間の時間は、1ヶ月~12ヶ月、2ヶ月~10ヶ月、3ヶ月~8ヶ月、又は4ヶ月~6ヶ月であり得る。様々な実施形態において、第1の時点(例えば、t0)と第2の時点(例えば、t1)との間の時間は、12ヶ月~120ヶ月、20ヶ月~100ヶ月、30ヶ月~80ヶ月、又は40ヶ月~60ヶ月であり得る。
【0035】
様々な実施形態では、第1の時点及び第2の時点を超えて追加の時点(例えば、t3、t4など)が存在してもよく、その間に、結節特異的特徴が対象から判定される。したがって、肺結節の縦方向特徴は、任意の2つの時点(例えば、第1の時点及び第3の時点、第2の時点及び第3の時点など)から判定することができる。様々な実施形態において、任意の2つの時点の間の時間は異なる。例えば、第1の時点と第2の時点との間の時間は、第2の時点と追加の時点との間の時間とは異なり得る。そのようなシナリオは、例えば、対象が、がんの撮像、監視、及び/若しくは検出のために不規則に現れる場合(例えば、第1の期間に対して毎月、続いて第2の期間に対して毎年)、かつ/又は結節特異的特徴が、利用可能な時点のセット内の時点の不規則に間隔を空けたサブセットにおいて判定される場合に起こり得る。様々な実施形態において、任意の2つの時点の間の時間は同じであってもよい。例えば、第1の時点と第2の時点との間の時間は、第2の時点と追加の時点との間の時間と同じであってもよい。様々な実施形態では、任意の2つの時点の間の時間は、1週間、2週間、3週間、4週間、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、12ヶ月、1年、2年、3年、4年、5年、6年、7年、8年、9年、又は10年であり得る。そのようなシナリオは、例えば、対象が一貫して若しくは定期的に(例えば、がんの撮像、監視、及び/又は検出のために、毎週、毎月、毎年など)現れる場合、かつ/又は結節特異的特徴が、利用可能な時点のセット内の定期的に間隔を空けた時点のサブセットにおいて判定される場合に起こり得る。
【0036】
様々な実施形態では、結節特異的特徴は、対象のCTスキャンなどの対象の画像を分析する訓練された専門家(例えば、放射線学者)が作成したレポートから抽出される。このような結節特異的特徴は、「主観的結節特異的特徴」と呼ばれる。
【0037】
「非結節特異的特徴」という用語は、肺実質特徴又は体組成特徴のいずれかを指す。非結節特異的特徴は、結節ではない対象からの特徴を含むことができる。非結節特異的特徴は、結節に関連していない対象からの特徴を含むことができる。肺実質機構は、例えば、(i)-950ハウンスフィールド単位(Hounsfield Unit、HU)よりも低い減衰を有する面積/体積として定義される低減衰領域(low attenuation area、LAA)、及び(ii)-600HUと-250HUとの間の減衰を有する肺の面積/体積として定義される高減衰領域(high attenuation area、HAA)、によって占有される肺の割合、及び上部肺ゾーンにおけるLAAと下部肺ゾーンにおけるLAAとの比(比LAA)を含み得る肺実質のデンシトメトリー測定値を含むことができる。肺実質特徴は、肺実質の局所ヒストグラム測定値などの肺実質の間質性変化の測定値、例えば、正常組織、小葉中心性肺気腫、小葉中心性結節、すりガラス、蜂巣肺、線状痕、結節性、網状、胸膜下ライン、他の肺気腫、及び/又は嚢胞によって占有される肺の割合を更に含むことができる。体組成特徴は、例えば、大胸筋断面積、小胸筋断面積、大胸筋除脂肪断面積、小胸筋除脂肪断面積、左又は右の大胸筋又は小胸筋の集合断面積、並びに皮下脂肪断面積を含み得る。
【0038】
「非結節特異的特徴」という用語は、上述の肺実質特徴又は上述の体組成特徴のいずれかの縦方向特徴を更に指す。例えば、肺実質の縦方向特徴は、2つ又は3つ以上の時点間の肺実質の特徴の変化であり得る。追加的に、体組成の縦方向特徴は、2つ又は3つ以上の時点間の体組成の特徴の変化であり得る。例えば、第1の時点t0及び第2の時点t1が与えられると、肺実質又は体組成の縦方向特徴は、時点t0と時点t1との間の肺実質又は体組成の特徴の変化であり得る。特定の実施形態では肺実質の縦方向特徴は、例えば、(i)-950ハウンスフィールド単位(HU)よりも低い減衰を有する面積/体積として定義される低減衰領域(LAA)、及び(ii)-600HU~-250HUの減衰を有する肺の面積/体積として定義される高減衰領域(HAA)によって占有される肺の割合の変化、又は上部肺ゾーンにおけるLAAと下部肺ゾーンにおけるLAAとの比(比LAA)の変化を含む。肺実質の縦方向特徴は、肺実質の局所ヒストグラム測定値の変化などの肺実質の間質性変化の測定値の変化、又は例えば、正常組織、小葉中心性肺気腫、小葉中心性結節、すりガラス、蜂巣肺、線状痕、結節性、網状、胸膜下ライン、他の肺気腫、及び/若しくは嚢胞によって占有される肺の割合の変化を更に含むことができる。特定の実施形態では、体組成の縦方向特徴は、大胸筋断面積の変化、小胸筋断面積の変化、大胸筋除脂肪断面積の変化、小胸筋除脂肪断面積の変化、左又は右の大胸筋又は小胸筋の集合断面積の変化、並びに皮下脂肪断面積の変化を含む。そのような縦方向非結節特異的特徴は、経時的な肺実質及び/又は体組成の変化(例えば、非線形変化)に関する洞察を提供することができ、これは、がん疾患活動性を予測するのに有益であり得る。様々な実施形態において、第1の時点(例えば、t0)と第2の時点(例えば、t1)との間の時間は、少なくとも1ヶ月、少なくとも2ヶ月、少なくとも3ヶ月、少なくとも4ヶ月、少なくとも5ヶ月、少なくとも6ヶ月、少なくとも7ヶ月、少なくとも8ヶ月、少なくとも9ヶ月、少なくとも10ヶ月、少なくとも11ヶ月、少なくとも12ヶ月、少なくとも13ヶ月、少なくとも14ヶ月、少なくとも15ヶ月、少なくとも16ヶ月、少なくとも17ヶ月、少なくとも18ヶ月、少なくとも24ヶ月、少なくとも30ヶ月、少なくとも36ヶ月、少なくとも42ヶ月、少なくとも48ヶ月、少なくとも54ヶ月、少なくとも60ヶ月、少なくとも66ヶ月、少なくとも72ヶ月、少なくとも78ヶ月、少なくとも84ヶ月、少なくとも90ヶ月、少なくとも96ヶ月、少なくとも102ヶ月、少なくとも108ヶ月、少なくとも114ヶ月、又は少なくとも120ヶ月であり得る。様々な実施形態において、第1の時点(例えば、t0)と第2の時点(例えば、t1)との間の時間は、1ヶ月~12ヶ月、2ヶ月~10ヶ月、3ヶ月~8ヶ月、又は4ヶ月~6ヶ月であり得る。様々な実施形態において、第1の時点(例えば、t0)と第2の時点(例えば、t1)との間の時間は、12ヶ月~120ヶ月、20ヶ月~100ヶ月、30ヶ月~80ヶ月、又は40ヶ月~60ヶ月であり得る。
【0039】
様々な実施形態では、第1の時点及び第2の時点を超えて追加の時点(例えば、t3、t4など)が存在してもよく、その間に、非結節特異的特徴が対象から判定される。したがって、肺実質及び/又は体組成の縦方向特徴は、任意の2つの時点(例えば、第1の時点及び第3の時点、第2の時点及び第3の時点など)から判定することができる。様々な実施形態において、任意の2つの時点の間の時間は異なる。例えば、第1の時点と第2の時点との間の時間は、第2の時点と追加の時点との間の時間とは異なり得る。そのようなシナリオは、例えば、対象が、がんの撮像、監視、及び/若しくは検出のために不規則に現れる場合(例えば、第1の期間に対して毎月、続いて第2の期間に対して毎年)、かつ/又は非結節特異的特徴が、利用可能な時点のセット内の時点の不規則に間隔を空けたサブセットにおいて判定される場合に起こり得る。様々な実施形態において、任意の2つの時点の間の時間は同じであってもよい。例えば、第1の時点と第2の時点との間の時間は、第2の時点と追加の時点との間の時間と同じであってもよい。様々な実施形態では、任意の2つの時点の間の時間は、1週間、2週間、3週間、4週間、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、12ヶ月、1年、2年、3年、4年、5年、6年、7年、8年、9年、又は10年であり得る。そのようなシナリオは、例えば、対象が一貫して若しくは定期的に(例えば、がんの撮像、監視、及び/又は検出のために、毎週、毎月、毎年など)現れる場合、かつ/又は非結節特異的特徴が、利用可能な時点のセット内の定期的に間隔を空けた時点のサブセットにおいて判定される場合に起こり得る。
【0040】
様々な実施形態では、「非結節特異的特徴」は、対象から捕捉された画像などの画像から計算的に抽出される。様々な実施形態では、特徴から計算的に抽出される非結節特徴を使用して、非結節特徴を含む放射線技師レポートなどのレポートを構築することができる。様々な実施形態では、「非結節特異的特徴」は、肺気腫の持続時間又は心血管疾患の持続時間を含まない。
【0041】
「Lung-RADS X~Y」という語句は、Lung-RADS X、Lung-RADS Y、及び数値変数「X」及び「Y」の間の任意の値に分類された個体を含むことを意味する。例えば、Lung-RADS 1~3は、Lung-RADS 1、Lung-RADS 2、及びLung-RADS 3として分類される個体を示す。
【0042】
「Lung-RADS X~Y予測モデル」という語句は、Lung-RADS X~Yのいずれか1つに分類される訓練個体から捕捉された訓練画像を使用して訓練されるリスク予測モデルを指す。
【0043】
「M年予測モデル」という語句は、「M」期間内のがんのリスクを予測するように訓練されたリスク予測モデルを指す。様々な実施形態では、「M」は、0ヶ月、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、1年、1.5年、2年、2.5年、3年、3.5年、4年、4.5年、5年、5.5年、6年、6.5年、7年、7.5年、8年、8.5年、9年、9.5年、10年、10.5年、11年、11.5年、12年、12.5年、13年、13.5年、14年、14.5年、15年、15.5年、16年、16.5年、17年、17.5年、18年、18.5年、19年、19.5年、又は20年のうちのいずれかである。様々な実施形態では、M年予測モデルは、既存の又は高頻度に見られるがんのリスクを予測するように訓練される(例えば、Mは、0ヶ月、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、又は6ヶ月のいずれかである)。様々な実施形態では、M年予測モデルは、がんが発生する将来のリスクを予測するように訓練される(例えば、Mは6ヶ月超である)。様々な実施形態では、「M」は、対象からの1つ又は2つ以上の画像の取得時間から測定される。したがって、1年予測モデルは、対象からの1つ又は2つ以上の画像の取得時間から1年以内のがんの将来のリスクを予測するように訓練されたリスク予測モデルを指す。
【0044】
「既存のがん」及び「高頻度に見られるがん」という語句は、互換的に使用され、一般に、対象におけるがんの存在又は不在の検出を指す。様々な実施形態では、「既存のがん」及び「高頻度に見られるがん」という語句は、対象からの1つ又は2つ以上の画像の取得時から6ヶ月未満(例えば、6ヶ月、5ヶ月、4ヶ月、3ヶ月、2ヶ月、1ヶ月又は0ヶ月)以内に対象ががんの存在を有するという判定を指す。様々な実施形態において、「既存のがん」及び「高頻度に見られるがん」という語句は、対象が、がん性結節の検出から6ヶ月未満(例えば、6ヶ月、5ヶ月、4ヶ月、3ヶ月、2ヶ月、1ヶ月又は0ヶ月)以内にがんの存在を有するという判定を指す。本明細書に開示されるように、リスク予測モデルは、がん性結節と非がん性結節とを区別するために有益である結節特異的ラジオミクス特徴などのラジオミクス特徴に基づいて、対象が既存の又は高頻度に見られるがんを有する可能性が高いか否かを予測するために実装されることができる。
【0045】
「M年、Lung-RADS X~Y予測モデル」という語句は、1)Lung-RADS X~Yのいずれか1つに分類された訓練個体から捕捉された訓練画像を使用して訓練され、2)「M」年以内のがんの将来のリスクを予測するように訓練された、リスク予測モデルを指す。
【0046】
「がんの将来のリスク」という語句は、対象に所与の期間、例えば、ベースライン時点から1年又は3年以内にがんが発生するリスクを指す。様々な実施形態において、がんの将来のリスクは、対象に、ベースライン時点から所与の期間内にがんが発生する可能性を指す。様々な実施形態において、がんの将来のリスクは、対象に1年以内にがんが発生する可能性を指す。様々な実施形態において、がんの将来のリスクは、対象に3年以内にがんが発生する可能性を指す。様々な実施形態において、がんの将来のリスクは、対象に5年以内にがんが発生する可能性を指す。様々な実施形態において、がんの将来のリスクは、対象に、少なくとも6ヶ月、少なくとも1年、少なくとも2年、少なくとも3年、少なくとも4年、少なくとも5年、少なくとも6年、少なくとも7年、少なくとも8年、少なくとも9年、少なくとも10年、少なくとも11年、少なくとも12年、少なくとも13年、少なくとも14年、少なくとも15年、少なくとも16年、少なくとも17年、少なくとも18年、少なくとも19年、又は少なくとも20年以内にがんが発生するか、又はがんと診断される可能性を指す。様々な実施形態では、「がんの将来のリスク」は、バイナリ値である(例えば、0又は1であり、ここで、0は、期間中にがんが発生する可能性が低く、1は、期間中にがんが発生する可能性が高いことを示す)。様々な実施形態において、「がんの将来のリスク」は、連続値である(例えば、0~1の間であり、1により近い値は、期間中にがんが発生する可能性が高いことを示す)。
【0047】
肺がんの「治療する」、「治療」、又は「セラピー」という用語は、治療の投与によりがんの進行を遅延させるか、停止させるか、又は逆転させることを意味するものとする。いくつかの実施形態では、肺がんを治療することは、理想的にはがん自体を排除する点まで、がんの進行を逆転させることを意味する。様々な実施形態において、肺がんの「治療する」、「治療」、又は「セラピー」は、治療薬又は医薬組成物を対象に投与することを含む。追加的に、本明細書で使用される場合、肺がんの「治療する」、「治療」、又は「セラピー」は、予防目的のために治療薬又は医薬組成物を投与することを更に含む。がんの予防は、がんの発生、発達、発現、進行、又は再発、又は肺がんの症状のいくつか又は全てを予防するか、あるいは肺がんの発生の可能性を低減するための組成物又は治療薬の投与を指す。
【0048】
本明細書で使用する場合、単数形「a」、「an」、及び、「the」は、文脈が明らかにそうでないことを指示していない限り、複数の引用物を含むことに留意しなければならない。
【0049】
II.システム環境の概要
図1Aは、一実施形態による、対象のがん予測を判定するためのシステム環境の概要を示す。システム環境100は、対象110、撮像デバイス120、及び対象110のがん予測140を判定するためのがん予測システム130を導入するためにコンテキストを提供する。
図1Aは、がん予測140が生成される1人の対象110を示しているが、様々な実施形態において、システム環境100は、がん予測システム130が2人又は3人以上の対象のためのがん予測140(例えば、各対象についてのがん予測)を生成するように2人又は3人以上の対象を含む。
【0050】
様々な実施形態では、対象110は健康である。例えば、対象は、がんと以前に診断されていないか、又はがんを有する疑いがない。したがって、本明細書に記載のがんのリスク予測のための方法は、健康な対象におけるがんの早期検出に有益であることができる。特定の実施形態では、対象におけるがんの種類は、肺がんである。したがって、本明細書に記載の方法は、肺がんの早期検出に有益であることができる。様々な実施形態では、対象は、がんと以前に診断された。そのような実施形態では、対象は寛解していることができ、したがって、がんのリスク予測のための方法は、対象が期間内のがんの再発を経験する可能性があるかどうかを判定するのに有益であることができる。
【0051】
様々な実施形態では、期間内にがんが発生するか又はがん再発を経験すると予測される対象には、がんの発生又は再発を遅らせるか又は予防する予防的治療などの治療を行うことができる。様々な実施形態では、期間内にがんが発生するか又はがん再発を経験すると予測される対象が、臨床試験に登録されるように選択される。
【0052】
図1Aを参照すると、撮像デバイス120は、対象110から画像を捕捉する。様々な実施形態では、撮像デバイス120は、対象110から取得した試験試料から画像を捕捉する。様々な実施形態では、画像及び/又は試料は、第三者、例えば、医療専門家によって取得することができる。医療専門家の例としては、医師、緊急医療技術者、看護師、第一対応者、心理学者、フレボトミスト、理学療法要員、ナースプラクティショナ、外科医、歯科医、及び当業者に知られているような任意の他の明らかな医療専門家が含まれる。様々な実施形態では、画像及び/又は試料は、病院又は医療診療所で取得することができる。様々な実施形態では、画像及び/又は試料は、モバイル撮像デバイスなどの撮像デバイスを使用して捕捉することができる。
【0053】
いくつかの実施形態では、撮像デバイス120は、対象110の解剖学的位置の画像を捕捉する。対象の例示的な解剖学的位置は、肺、胸腔、腎臓、肝臓、膵臓、脳、胃、腸、股関節、膝、脚、腕、及び顔を含むことができる。様々な実施形態では、撮像デバイス120は、対象110の胸腔の画像を捕捉する。様々な実施形態では、撮像デバイス120は、対象の肺の画像を捕捉する。様々な実施形態では、撮像デバイス120は、対象の胸(例えば、胸筋を含む胸壁)の画像を捕捉する。様々な実施形態では、撮像デバイス120は、対象の肺を含む胸腔の画像を捕捉する。様々な実施形態では、撮像デバイス120は、対象の胸(例えば、胸筋を含む胸壁)を含む胸腔の画像を捕捉する。様々な実施形態では、撮像デバイス120は、対象の肺及び対象の胸(例えば、胸筋を含む胸壁)の両方を含む胸腔の画像を捕捉する。
【0054】
様々な実施形態では、撮像デバイス120は、コンピュータ断層撮影(CT)スキャナ、磁気共鳴撮像(magnetic resonance imaging、MRI)スキャナ、陽電子放出断層撮影(positron emission tomography、PET)スキャナ、X線スキャナ、又は超音波撮像デバイスのうちの1つである。特定の実施形態では、撮像デバイス120は、対象110の1つ又は2つ以上の画像を捕捉するCTスキャナである。様々な実施形態では、撮像デバイス120は、対象の少なくとも肺の1つ又は2つ以上のCT画像を捕捉するCTスキャナである。様々な実施形態では、撮像デバイス120は、対象の少なくとも胸の1つ又は2つ以上のCT画像を捕捉するCTスキャナである。特定の実施形態では、撮像デバイス120は、対象の肺及び対象の胸の両方を含む胸腔(例えば、胸筋を含む胸壁)の1つ又は2つ以上のCT画像を捕捉するCTスキャナである。様々な実施形態では、撮像デバイス120は、対象の1つ又は2つ以上の全身CT画像を捕捉するCTスキャナである。特定の実施形態では、撮像デバイス120は、対象の肺及び対象の胸(例えば、胸筋を含む胸壁)の両方を含む胸の1つ又は2つ以上のX線画像を捕捉するX線スキャナである。
【0055】
様々な実施形態では、撮像デバイス120は、2つ又は3つ以上の時点で対象から画像を捕捉するために採用される。特定の実施形態では、撮像デバイス120は、2つの時点で対象から画像を捕捉するために採用される。様々な実施形態では、撮像デバイス120は、3つ又は4つ以上、4つ又は5つ以上、5つ又は6つ以上、6つ又は7つ以上、7つ又は8つ以上、8つ又は9つ以上、9つ又は10以上、又は10又は11以上の時点で、対象から画像を捕捉するために採用される。例えば、撮像デバイス120は、対象から時間=t0における第1の画像を捕捉するために採用されてもよい。後続の時間=t1において、撮像デバイス120は、同じ対象から第2の画像を捕捉するために再び採用され得る。したがって、2つの異なる時点で捕捉された第1の画像及び第2の画像を分析して、縦方向特徴を生成することができる。縦方向特徴は、本明細書に更に詳細に記載されている。
【0056】
一般に、がん予測システム130は、対象110から捕捉された1つ又は2つ以上の画像(例えば、撮像デバイス120によって撮影された画像)を分析し、対象110のがん予測140を生成する。様々な実施形態では、がん予測システム130によって判定されたがん予測140は、対象110についてのがんの予測されたリスクである。例えば、がん予測140は、対象110に、画像が対象110から捕捉された日付からある期間(例えば、1年以内、3年以内、又は5年以内を含むが、それに限定されない)内にがんが発生すると予測されるかどうかを示す値である。
【0057】
様々な実施形態では、がん予測140を生成するために、がん予測システム130は、1つ又は2つ以上の画像から特徴を抽出し、1つ又は2つ以上の訓練されたリスク予測モデルを適用して、1つ又は2つ以上の画像の特徴を分析する。訓練されたリスク予測モデルは、ある期間内の対象110に対するがんのリスクを予測する。例えば、がん予測システム130は、3年以内のがんの将来のリスクを予測するように訓練されたリスク予測モデルを適用することができる。様々な実施形態では、がん予測システム130は、複数の訓練されたリスク予測モデルを適用することによって、対象110の異なる期間にわたるがんの複数のリスクを判定する。例えば、3年以内のがんの将来のリスクを予測するように訓練されたリスク予測モデルを適用することに加えて、がん予測システム130は、5年以内のがんの将来のリスクを予測するように訓練された第2のリスク予測モデルを更に適用する。がん予測システム130は、追加の期間(例えば、1年、10年、15年、20年など)について訓練された、より多くの訓練されたリスク予測モデルを適用することができる。一概して、リスク予測モデルは独立して訓練され、追加的ではない(例えば、1年であるが3年未満に発生すると予測されるがんを取得するために、3年で予測されたがんから、1年で予測されたがんを差し引くことはできない)。
【0058】
様々な実施形態では、がん予測140は、対象のがんの予測されたリスクから導出された指標であり、対象110が臨床試験に登録するために患者コホートに含まれるか又は除外されるかを識別する指標である。この指標は、臨床試験のエンリッチメンの目的で有用である。例えば、対象110にある期間内(例えば、1年以内、2年以内、3年以内、4年以内、5年以内、6年以内、7年以内、8年以内、9年以内、10年以内、11年以内、12年以内、13年以内、14年以内、15年以内、16年以内、17年以内、18年以内、19年以内、及び/又は20年以内)にがんが発生すると予測される場合、指標は、対象110が臨床試験への登録のために患者コホートに含まれるべきであることを識別する。別の例として、対象110にある期間内にがんが発生すると予測されない場合、指標は、対象110が臨床試験に登録するための患者コホートから除外されることを識別する。
【0059】
様々な実施形態では、がん予測140は、がんの予測されるリスクに基づく、対象110の推奨介入を含むことができる。例えば、がん予測システム130が、対象110に1年以内にがんが発生する可能性が高いと判定した場合、がん予測140は、次の年にわたるがんの急速な発病を遅延させるか又は予防するための推奨介入を含み得る。
【0060】
がん予測システム130は、
図5に関して以下で論じられるように、コンピュータシステム500として具体化された1つ又は2つ以上のコンピュータを含むことができる。したがって、様々な実施形態では、がん予測システム130を参照して説明されるステップは、インシリコで実行される。
【0061】
様々な実施形態では、撮像デバイス120及びがん予測システム130は、異なる関係者によって用いられる。例えば、第1の関係者は、撮像デバイス120を操作して、対象110から1つ又は2つ以上の画像を捕捉し、次いで、捕捉された1つ又は2つ以上の画像を、がん予測システム130を実装してがん予測140を判定する第2の関係者に提供する。いくつかの実施形態では、撮像デバイス120及びがん予測システム130は、同じ関係者によって使用される。
【0062】
ここで、一実施形態による、がん予測システム130のコンピュータ論理構成要素を示すブロック図を示す
図1Bを参照する。ここで、がん予測システム130は、特徴抽出モジュール145、候補対象モジュール150、リスク訓練モジュール155、リスクデプロイモジュール160、エンリッチメントモジュール165、及び訓練データストア170を含む。様々な実施形態では、がん予測システム130は、追加の又はより少ないモジュールとともに異なって構成することができる。例えば、がん予測システム130は、候補対象モジュール150を含む必要はない。別の例として、がん予測システム130は、リスク訓練モジュール155又は訓練データストア170を含む必要はなく(
図1Bの点線で示されるように)、代わりに、リスク訓練モジュール155及び訓練データストア170は、異なるシステム及び/又は関係者によって用いられる。
【0063】
概して、特徴抽出モジュール145は、対象から捕捉された画像又は訓練個体から捕捉された訓練画像から特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、画像又は訓練画像から非結節特異的特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、画像又は訓練画像から縦方向非結節特異的特徴及び/又は縦方向結節特異的特徴を抽出する。ここで、特徴抽出モジュール145は、異なる時点で対象から取得された2つ又は3つ以上の画像から特徴を抽出し、2つ又は3つ以上の画像から抽出された特徴から縦方向非結節特異的特徴及び/又は縦方向結節特異的特徴を判定する。一例として、縦方向結節特異的特徴を生成するために、特徴抽出モジュール145は、第1の時点で取得された第1の画像から結節特異的特徴を抽出し、更に、第2の時点で取得された第2の画像から結節特異的特徴を抽出する。特徴抽出モジュール145は、第1の画像から抽出された結節特異的特徴を、第2の画像から抽出された結節特異的特徴と組み合わせる。様々な実施形態において、特徴抽出モジュール145は、第1の画像から抽出された結節特異的特徴と、第2の画像から抽出された結節特異的特徴との差を判定する。したがって、縦方向結節特異的特徴は、第1の時点と第2の時点との間の結節特異的特徴の変化を表す。別の例として、縦方向結節特異的特徴を生成するために、特徴抽出モジュール145は、第1の時点で取得された第1の画像から非結節特異的特徴を抽出し、更に、第2の時点で取得された第2の画像から非結節特異的特徴を抽出する。特徴抽出モジュール145は、第1の画像から抽出された非結節特異的特徴を、第2の画像から抽出された非結節特異的特徴と組み合わせる。様々な実施形態において、特徴抽出モジュール145は、第1の画像から抽出された非結節特異的特徴と、第2の画像から抽出された非結節特異的特徴との差を判定する。したがって、縦方向非結節特異的特徴は、第1の時点と第2の時点との間の非結節特異的特徴の変化を表す。
【0064】
様々な実施形態では、第1の画像から抽出された特徴を第2の画像から抽出された特徴と組み合わせるために、特徴抽出モジュール145は、画像認識を実行して、第1の画像及び第2の画像の特性を識別する。例えば、特徴抽出モジュール145は、第1の画像に対して画像認識を実行して、第1の画像内に存在する結節を識別することができ、更に、第2の画像に対して画像認識を実行して、第2の画像内の同じ結節を識別することができる。したがって、特徴抽出モジュール145は、第1の画像内の結節から抽出された結節特異的特徴を、第2の画像内の結節から抽出された結節特異的特徴と組み合わせることができる。
【0065】
様々な実施形態では、特徴抽出モジュール145は、画像又は訓練画像から結節特異的特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、画像又は訓練画像から結節特異的特徴及び非結節特異的特徴を抽出する。特徴抽出モジュール145は、訓練画像から抽出された特徴を、リスク予測モデルを訓練するためのリスク訓練モジュール155に提供する。様々な実施形態では、特徴抽出モジュール145は、対象から捕捉された画像から抽出された特徴を、リスクへ、候補対象を識別するための候補対象モジュール150へ提供する。様々な実施形態では、特徴抽出モジュール145は、対象から捕捉された画像から抽出された特徴を、1つ又は2つ以上の訓練されたリスク予測モデルをデプロイするためのリスクデプロイモジュール160に提供する。
【0066】
候補対象モジュール150は、対象から捕捉された1つ又は2つ以上の画像から抽出された特徴を分析し、対象が、リスク予測を受けるための候補対象であるかどうかを判定する。これは、リスク予測を受ける患者のサブセットを識別するのに有用である。例えば、低リスクがん患者(例えば、現在がんを有していない患者、及び/又はがんを示す肺結節を現在有していない患者)のためのがんのリスクを予測することが好ましい場合がある。したがって、候補対象モジュール150は、その後のリスク予測のために低リスクがん患者のサブセットを識別することができる。様々な実施形態では、候補対象モジュール150は、結節特異的特徴及び非結節特異的特徴の両方を分析して、対象が候補対象であるかどうかを判定する。様々な実施形態では、候補対象モジュール150は、対象が候補対象であるかどうかを判定するために、結節特異的特徴のみを分析する。様々な実施形態では、候補対象モジュール150は、がん病期分類システム140によって実装される必要はない。例えば、全ての対象ががんのリスクについて分析されるシナリオでは、全ての対象はリスク予測を受ける候補対象である。
【0067】
リスク訓練モジュール155は、訓練個体から導出された訓練データを使用してリスク予測モデルを訓練する。例えば、訓練データは、訓練個体から捕捉された1つ又は2つ以上の訓練画像から抽出された特徴を含む。様々な実施形態では、リスク訓練モジュール155は、結節特異的特徴及び非結節特異的特徴の両方を含むリスク予測モデルを訓練する。そのような実施形態では、リスクデプロイモジュール160は、対象(例えば、
図1Aの対象110)から取得された画像から抽出された結節特異的特徴及び非結節特異的特徴の両方を分析して、がんのリスクを判定するリスク予測モデルを実装する。様々な実施形態では、リスク訓練モジュール155は、非結節特異的特徴のみを含むリスク予測モデルを訓練する。そのような実施形態では、リスクデプロイモジュール160は、対象(例えば、
図1Aの対象110)から取得された画像から抽出された非結節特異的特徴のみを分析して、がんのリスクを判定するためにリスク予測モデルを実装する。
【0068】
リスクデプロイモジュール160は、対象110のがんのリスクの予測などのがん予測を判定するために、対象(例えば、
図1Aの対象110)から取得された画像から抽出された特徴を分析するためにリスク予測モデルを実装する。訓練リスク予測モデル及びデプロイリスク予測モデルは、以下で更に詳細に説明される。
【0069】
エンリッチメントモジュール165は、患者コホートに含めるための対象を選択する。様々な実施形態では、患者コホートは、臨床試験における登録のために生成される。例えば、エンリッチメントモジュール165は、一定期間内にがんが発生する患者のより高い割合を含む患者コホート(例えば、エンリッチメント患者コホート)を生成する。このエンリッチメント患者コホートは、臨床試験におけるより少ない患者の登録を可能にし、並びに/又は肺がんを阻止及び予防する治療法の恩恵を得ることができる人々を識別する。
【0070】
がん予測システム130の構成要素は、2つの段階、すなわち、1)訓練段階及び2)デプロイ段階、を参照して以下で説明される。より具体的には、訓練段階は、訓練個体(例えば、ある期間内にがんが発生するか、又は発生しないことが知られている個体)から捕捉された訓練画像などの訓練データに基づく、リスク訓練モジュール155による1つ又は2つ以上のリスク予測モデルの構築及び訓練を指す。したがって、モデルは、デプロイ段階中に、リスクデプロイモジュール160によるモデルの実装が、対象(例えば、
図1Aの対象110)のがんのリスクの予測を可能にするように、訓練データを使用して訓練される。
【0071】
いくつかの実施形態では、がん予測システム130の構成要素は、訓練段階及びデプロイ段階のうちの1つの間に適用される。例えば、リスク訓練モジュール155及び訓練データストア170は、訓練段階中にリスクモデルを訓練するために適用される。追加的に、リスクデプロイモジュール160は、デプロイ段階中に適用される。様々な実施形態では、がん予測システム130の構成要素は、構成要素が訓練段階中又はデプロイ段階中に適用されるかどうかに応じて、異なる関係者によって実行することができる。そのようなシナリオでは、予測モデルの訓練及びデプロイは、異なる関係者によって実行される。例えば、訓練段階中に適用されるリスク訓練モジュール155及び訓練データストア170は、第1の関係者によって(例えば、リスク予測モデルを訓練するために)使用されることができ、デプロイ段階中に適用されるリスクデプロイモジュール160は、(例えば、リスク予測モデルをデプロイするために)第2の関係者によって実行されることができる。
【0072】
III.がんのリスクを予測するための方法
本明細書に記載の実施形態は、1つ又は2つ以上の訓練されたリスク予測モデルを適用することによって、対象のがんのリスクを判定するための方法を含む。そのような方法は、
図1Bに記載のがん予測システム130によって実行することができる。一実施形態による、患者のエンリッチメントなどの用途のために対象のがんのリスクを判定するための例示的なフロー
図200を示す
図2Aを更に参照する。
【0073】
図2Aに示すように、対象(例えば、
図1Aの対象110)から捕捉された対象画像210が取得される。様々な実施形態では、対象画像210は、対象のCTスキャンを実行することによって捕捉されたCT画像である。様々な実施形態では、対象画像210は、対象のX線走査を実行することによって捕捉されたX線画像である。様々な実施形態では、2つ以上の対象画像210が対象から捕捉される。
【0074】
様々な実施形態では、特徴抽出モジュール145は、対象の特徴215Aを抽出する。様々な実施形態では、対象の特徴215Aは、年齢、性別、民族性、喫煙歴、地理的位置、汚染曝露、及び/又は肺がんの家族歴などの、対象に対応する臨床データを含む。様々な実施形態では、特徴抽出モジュール145(
図1B)は、対象画像210から特徴215Aを抽出する。様々な実施形態では、特徴抽出モジュール145は、画像分析アルゴリズムを実装して、特徴215Aを対象画像210から抽出する。様々な実施形態では、特徴抽出モジュール145は、画像から特徴を分析及び抽出するように訓練された機械学習モデルを含む画像分析アルゴリズムを実装する。ラジオミクス特徴を抽出するための方法は、Radiomics of Lung Nodules:A multi-institutional study of robustness and agreement of quantitative imaging features.Tomography.2016;2(4):430-437、及びRadiomics:extracting more information from medical images using advanced feature analysis.Eur J Cancer 2012;48(4):441-446に更に記載され、これらの各々は全体が参照により本明細書に組み込まれる。
【0075】
様々な実施形態では、特徴抽出モジュール145は、対象画像210から少なくとも2つの特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、対象画像210から少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、対象画像210から少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、又は少なくとも45の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、対象画像210から少なくとも50の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、対象画像210から少なくとも100の特徴、少なくとも150の特徴、少なくとも200の特徴、少なくとも250の特徴、少なくとも300の特徴、少なくとも350の特徴、少なくとも400の特徴、少なくとも450の特徴、少なくとも500の特徴、少なくとも550の特徴、少なくとも600の特徴、少なくとも650の特徴、少なくとも700の特徴、少なくとも750の特徴、少なくとも800の特徴、少なくとも850の特徴、少なくとも900の特徴、少なくとも950の特徴、又は少なくとも1000の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、100の特徴~1000の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、300の特徴~900の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、500の特徴~1000の特徴を抽出する。
【0076】
様々な実施形態では、特徴抽出モジュール145は、結節特異的特徴を含む特徴215Aを抽出する。結節特異的特徴は、肺結節(例えば、対象画像210内に存在する又は存在しない肺結節)、肺結節のエッジ、及び/又は境界/結節周辺領域の特徴を指す。例示的な結節特異的特徴は、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ(例えば、滑らか、針骨状など)、結節直径、及びLung-RADSスコアを含む。様々な実施形態では、結節特異的特徴は、PyRadiomicsなどの画像処理アルゴリズムを使用して抽出されるラジオミクス特徴であることができる。例示的なラジオミクス特徴は、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存行列を含むことができる。様々な実施形態では、ラジオミクス特徴は、ウェーブレットフィルタ又はガウスフィルタなどのフィルタを適用することによって変換された画像から抽出される。したがって、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存行列のいずれかを、ウェーブレット変換画像又はガウス変換画像から抽出することができる。様々な実施形態において、特徴抽出モジュール145は、2つ又は3つ以上の時点の間の結節特異的特徴の変化のいずれかを含む縦方向特徴を抽出する。例えば、第1の時点t0及び第2の時点t1が与えられると、肺結節の縦方向特徴は、時点t0と時点t1との間の肺結節の特徴の変化であり得る。特定の実施形態では、肺結節の縦方向特徴は、結節固有減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化(例えば、平滑、棘状など)、結節直径の変化、Lung-RADSスコアの変化、及びラジオミクス特徴の変化を含む。
【0077】
特定の実施形態では、特徴抽出モジュール145は、対象画像210を分析し、抽出された結節特異的特徴のうちの1つ又は2つ以上に基づいて、Lung-RADSスコアを対象画像210に割り当てる。例えば、1つ又は2つ以上の抽出された結節特異的特徴(例えば、ラジオミクス特徴など)に基づいて、特徴抽出モジュール145は、対象画像210が肺結節を含まないと判定する。そのようなシナリオでは、特徴抽出モジュール145は、対象画像210に、1のLung-RADSスコアを割り当てることができる。別の例として、特徴抽出モジュール145は、対象画像210を分析し、抽出された結節特異的特徴のうちの1つ又は2つ以上に基づいて、対象画像210が結節を含むと判定する。次いで、結節特異的特徴に基づいて、特徴抽出モジュール145は、表1に示される現在のLung-RADS基準又は将来のLung-RADS基準などの、Lung-RADS基準に従って、対応するLung-RADSスコア(例えば、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、Lung-RADS 4B、又はLung-RADS 4X)を割り当てることができる。
【0078】
様々な実施形態では、特徴抽出モジュール145は、非結節特異的特徴を含む特徴215Aを抽出する。非結節特異的特徴は、肺実質特徴のいずれか(例えば、肺実質のデンシトメトリー測定値及び肺実質の間質性変化の測定値)及び筋肉/胸壁の体組成測定値を指す。肺実質のデンシトメトリー測定値は、例えば、(i)-950ハウンスフィールド単位(HU)よりも低い減衰を有する面積/体積として定義される低減衰領域(LAA)及び(ii)-600HUと-250HUとの間の減衰を有する肺の面積/体積として定義される高減衰領域(HAA)、によって占有される肺の割合、及び上部肺ゾーンにおけるLAAと下部肺ゾーンにおけるLAAとの比、を含み得る。肺実質の間質性変化の測定値は、肺実質の局所ヒストグラム測定値、例えば、正常組織、小葉中心性肺気腫、小葉中心性結節、すりガラス、蜂巣肺、線状痕、結節性、網状、胸膜下ライン、他の肺気腫、及び/又は嚢胞によって占有される肺の割合を含むことができる。筋肉構造/胸壁の体組成測定値は、例えば、大胸筋断面積、小胸筋断面積、大胸筋除脂肪断面積、小胸筋除脂肪断面積、左又は右の大胸筋又は小胸筋の集合断面積、並びに皮下脂肪断面積を含み得る。
【0079】
様々な実施形態では、特徴抽出モジュール145は、前述の肺実質特徴又は前述の体組成特徴のうちのいずれかの縦方向特徴を指す、縦方向非結節特異的特徴を抽出する。例えば、肺実質の縦方向特徴は、2つ又は3つ以上の時点間の肺実質の特徴の変化であり得る。追加的に、体組成の縦方向特徴は、2つ又は3つ以上の時点間の体組成の特徴の変化であり得る。例えば、第1の時点t0及び第2の時点t1が与えられると、肺実質又は体組成の縦方向特徴は、時点t0と時点t1との間の肺実質又は体組成の特徴の変化であり得る。特定の実施形態では肺実質の縦方向特徴は、例えば、(i)-950ハウンスフィールド単位(HU)よりも低い減衰を有する面積/体積として定義される低減衰領域(LAA)、及び(ii)-600HU~-250HUの減衰を有する肺の面積/体積として定義される高減衰領域(HAA)によって占有される肺の割合の変化、又は上部肺ゾーンにおけるLAAと下部肺ゾーンにおけるLAAとの比(比LAA)の変化を含む。肺実質の縦方向特徴は、肺実質の局所ヒストグラム測定値の変化などの肺実質の間質性変化の測定値の変化、又は例えば、正常組織、小葉中心性肺気腫、小葉中心性結節、すりガラス、蜂巣肺、線状痕、結節性、網状、胸膜下ライン、他の肺気腫、及び/若しくは嚢胞によって占有される肺の割合の変化を更に含むことができる。特定の実施形態では、体組成の縦方向特徴は、大胸筋断面積の変化、小胸筋断面積の変化、大胸筋除脂肪断面積の変化、小胸筋除脂肪断面積の変化、左又は右の大胸筋又は小胸筋の集合断面積の変化、並びに皮下脂肪断面積の変化を含む。
【0080】
様々な実施形態では、特徴抽出モジュール145は、結節特異的特徴及び非結節特異的特徴を含む特徴215Aを抽出する。様々な実施形態では、特徴抽出モジュール145は、非結節特異的特徴のみを含む特徴215Aを抽出する。特定の実施形態では、特徴抽出モジュール145は、結節特異的特徴のみを含む特徴215Aを抽出する。様々な実施形態では、特徴抽出モジュール145は、第三者によって判定される結節特異的特徴を取得する。例えば、結節特異的特徴は、対象画像210を分析する訓練された専門家(例えば、放射線学者)によって判定され得る。様々な実施形態では、特徴抽出モジュール145は、第三者によって生成されたレポートから結節特異的特徴を抽出する。例えば、特徴抽出モジュール145は、対象画像210を分析する訓練された専門家(例えば、放射線科医)によって生成されたレポートから結節特異的特徴を抽出する。
【0081】
候補対象モジュール150(
図1B)は、対象画像210の特徴215Aを分析することによって、対象分析220(
図2Aに示す)を実行する。分析に基づいて、候補対象モジュール150は、対象がリスク予測を受けるべき候補対象であるかどうかを判定する。言い換えれば、対象分析220は、がん予測のリスクに適格である候補対象を識別するためのスクリーニングプロセスである。例えば、一般的な肺がんを有しないと判定された肺がんスクリーニングを受けている対象は、その後、将来の偶発生肺がんが発生するリスクについて評価される。様々な実施形態において、スクリーニングプロセスは実行されず、対象分析220は省略される。したがって、全ての対象が、後続のリスク予測を受ける候補対象とされる。
【0082】
一例として、候補対象モジュール150は、対象の臨床データなどの対象の特徴215Aが1つ又は2つ以上の基準を満たす場合、対象がリスク予測を受けるための候補対象であると判定する。例えば、対象の特徴215Aが、対象が閾値量を超えて喫煙することを示す場合、対象は、リスク予測を受けるための候補対象とみなされる。別の例として、候補対象モジュール150は、対象が低リスクがん患者(例えば、肺がんを現在有していない患者、現在がんを示す肺結節を有していない患者、又は現在がんを有している15%未満の可能性(若しくは予測値の目標に応じて他の閾値)を有する患者)である場合、対象がリスク予測を受ける候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が高リスクがん患者(例えば、現在肺がんを有する患者、肺がんの発生の高リスクを示す肺結節を有する患者、又は現在がんを有している15%超の可能性(若しくは予測値の目標に応じて他の閾値)を有する患者))である場合に、リスク予測を受ける非候補対象であると判定する。
図2Aに示すように、対象分析220が、対象が候補対象であると判定した場合、その後のリスク予測分析のために、対象画像210が候補対象画像225(点線で示される)として取られる。代替的には、対象分析220が、対象が非候補対象であると判定した場合、患者は、リスク予測分析を更に受けないか、又は現在の標準治療(例えば、がん検診のための年間CTスキャン)に戻ってもよい。一例として、非候補対象218のための介入を対象に提供することができる。例えば、非候補対象は、既に肺がんを有する又は対象が進行性肺がんを有することを示す肺結節を有する対象であり得る。したがって、非候補対象は、がん予測のリスクを受ける必要はなく、代わりに、非候補対象218の介入を提供することができ、非候補対象の肺がんを治療するためにがん生検及び/又は治療薬(例えば、化学療法、放射線)の投与を含むことができる。別の例として、非候補対象は、特定のリスク基準の外にあり(例えば、対象が年齢及び/又は喫煙基準を満たさない)、したがって、がんが発生するリスクが低い対象であり得る。したがって、非候補対象は、がん予測のリスクを受ける必要がなく、ガイダンス(例えば、健康なライフスタイルの継続又はライフスタイルの変更の推奨)を提供され得る。
【0083】
様々な実施形態では、候補対象モジュール150は、対象が、結節特異的特徴を含む特徴215Aに基づいて候補対象であると判定する。一例として、結節特異的特徴は、Lung-RADS 0、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、Lung-RADS 4B、又はLung-RADS 4XなどのLung-RADSスコアを含むことができる。Lung-RADSスコア分類の要約及び肺結節の対応する特徴を表1に記載する。様々な実施形態では、候補対象モジュール150は、結節特異的特徴などの特徴215Aに基づいて、対象についてのLung-RADSスコアを判定する。例えば、結節特異的特徴は、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ(例えば、滑らか、針骨状など)、結節直径、Lung-RADSスコア、及び/又は一次統計、3D形状ベース特徴、2D形状ベース特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差分行列、及びグレーレベル依存行列などのラジオミクス特徴のうちの1つ又は2つ以上を含むことができる。したがって、結節減衰特徴が、肺結節が固体結節であり、結節マージン及び/又は結節直径特徴が、肺結節が5mmであることを示す場合、候補対象モジュール150は、表1に指定された基準に基づいて、2のLung-RADSスコアを割り当てることができる。
【0084】
様々な実施形態では、候補対象モジュール150は、対象が0のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が1のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が2のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が3のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4AのLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が0のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が1のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が2のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が3のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4AのLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4BのLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4XのLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が0又は1のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が0、1又は2のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が0、1、2、又は3のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が1、2又は3のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4A~4XのLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4A~4BのLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が3~4AのLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が2~4AのLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が2~3のLung-RADSスコアを割り当てられている場合、対象が候補対象であると判定する。
【0085】
様々な実施形態では、候補対象モジュール150は、対象が3のLung-RADSスコアを割り当てられている場合、対象が非候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4AのLung-RADSスコアを割り当てられている場合、対象が非候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4BのLung-RADSスコアを割り当てられている場合、対象が非候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4A又は4BのLung-RADSスコアを割り当てられている場合、対象が非候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が4A、4B又は4XのLung-RADSスコアを割り当てられている場合、対象が非候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が3、4A、又は4BのLung-RADSスコアを割り当てられている場合、対象が非候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が3、4A、4B、又は4XのLung-RADSスコアを割り当てられている場合、対象が非候補対象であると判定する。様々な実施形態では、候補対象モジュール150は、対象が0のLung-RADSスコアを割り当てられている場合、対象が非候補対象であると判定する。
【0086】
様々な実施形態では、候補対象モジュール150は、結節特異的特徴が、対象が肺結節を有しないことを示す場合、対象が候補対象であると判定する。例えば、結節特異的特徴は、結節減衰、結節マージン記述、又は結節直径のうちの1つ又は2つ以上を含むことができる。したがって、結節特異的特徴が、対象画像210が結節を含まない(例えば、減衰の欠如、マージンの欠如、又はほぼ0又は0の直径)ことを示す場合、候補対象モジュール150は、対象が候補対象であると判定する。その後、候補対象について予測を生成することができる(例えば、候補対象の少なくとも非結節特徴に基づいて生成された予測)。
【0087】
様々な実施形態では、候補対象モジュール150は、対象が肺結節を有する場合であっても、対象が候補対象であると判定する。例えば、結節特異的特徴が、対象が肺結節を有することを示す場合、候補対象モジュール150は、結節特異的特徴を更に分析して、結節をより高いリスク結節又はより低いリスク結節として分類することができる。様々な実施形態では、候補対象モジュール150は、結節が固体結節、半固体結節、又は非固体結節であるかに基づいて結節を分類することができる。例えば、候補対象モジュール150は、固体結節又は半固体結節である場合、結節をより高リスクの結節として分類し、非固体結節である場合、結節をより低リスクの結節として分類することができる。様々な実施形態では、候補対象モジュール150は、対象がより低リスクの結節を有する場合、対象が候補対象であると判定する。候補対象モジュール150は、対象がより高リスクの結節を有する場合、対象が非候補対象であると判定することができる。
【0088】
図2Aに戻ると、対象分析220の後、候補対象からの対象画像210は、今度は候補対象画像225とみなされる。特徴抽出モジュール145は、候補対象画像225から特徴215Bを抽出する。様々な実施形態では、特徴抽出モジュール145は、候補対象画像225から結節特異的特徴及び非結節特異的特徴のうちの一方又は両方を含む特徴215Bを抽出する。様々な実施形態では、特徴抽出モジュール145は、非結節特異的特徴のみを含む特徴215Aを抽出する。様々な実施形態では、特徴抽出モジュール145は、結節特異的特徴のみを含む特徴215Aを抽出する。様々な実施形態では、特徴抽出モジュール145は、第三者によって判定される候補対象画像225の結節特異的特徴を取得する。例えば、結節特異的特徴は、候補対象画像225を分析する訓練された専門家(例えば、放射線学者)によって判定され得る。様々な実施形態では、特徴抽出モジュール145は、第三者によって生成されたレポートから結節特異的特徴を抽出する。例えば、特徴抽出モジュール145は、対象画像225を分析する訓練された専門家(例えば、放射線学者)によって生成されたレポートから結節特異的特徴を抽出する。
【0089】
様々な実施形態では、特徴215Bのうちの1つ又は2つ以上は、特徴215Aのうちの1つ又は2つ以上と同じである。したがって、同じ特徴を再度抽出する必要はなく、再利用することができる。例えば、特徴215Aとして対象画像210から以前に抽出された結節特異的特徴は、特徴215Bに含まれる同じ結節特異的特徴であることができる。様々な実施形態では、特徴215Bの全ては、対象画像210から以前に抽出されたため、以前に抽出された特徴は、ここでは特徴215Bとして再利用することができる。例えば、特徴抽出モジュール145は、対象分析220の前に特徴215A及び特徴215Bを抽出し得る。したがって、特徴215Bは、候補対象画像225から更に抽出される必要はなく、ここで再利用することができる。
【0090】
様々な実施形態では、特徴215Bは、特徴215Aに含まれなかった追加の特徴を含む。例えば、特徴215Bは、特徴215Aに以前に含まれていなかった非結節特異的特徴を含む。したがって、特徴抽出モジュール145は、特徴215Aに以前に含まれていなかったこれらの追加の特徴を抽出する。
【0091】
様々な実施形態では、特徴抽出モジュール145は、候補対象画像225から少なくとも2つの特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、候補対象画像225から少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、又は少なくとも10の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、候補対象画像225から少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、又は少なくとも45の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、候補対象画像225から少なくとも50の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、候補対象画像225から少なくとも100の特徴、少なくとも150の特徴、少なくとも200の特徴、少なくとも250の特徴、少なくとも300の特徴、少なくとも350の特徴、少なくとも400の特徴、少なくとも450の特徴、少なくとも500の特徴、少なくとも550の特徴、少なくとも600の特徴、少なくとも650の特徴、少なくとも700の特徴、少なくとも750の特徴、少なくとも800の特徴、少なくとも850の特徴、少なくとも900の特徴、少なくとも950の特徴、又は少なくとも1000の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、候補対象画像225から100の特徴~1000の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、候補対象画像225から300の特徴~900の特徴を抽出する。様々な実施形態では、特徴抽出モジュール145は、候補対象画像225から500の特徴~1000の特徴を抽出する。
【0092】
リスクデプロイモジュール160(
図1B)は、抽出された特徴215Bを、訓練されたリスク予測モデル230(
図2Aに示す)に提供して、リスク予測240を生成する。様々な実施形態では、
図2Aに示されるように、リスクデプロイモジュール160は、抽出された特徴215を複数の訓練されたリスク予測モデル230に提供して、複数のリスク予測240を生成する。様々な実施形態では、リスク予測モデルは、期間内のがん予測のリスク(例えば、1年以内、3年以内、又は5年以内のがんの将来のリスク)を生成するように訓練される。様々な実施形態では、リスク予測モデルは、現在の既存の又は高頻度に見られるがんに対するリスクを生成するように訓練される。したがって、複数の期間についての予測を生成するために、リスクデプロイモジュール160は、異なるリスク予測モデルを選択しかつデプロイして、抽出された特徴215Bを分析する。例えば、リスクデプロイモジュール160は、第1の期間内のがんのリスクを予測するように訓練された第1のリスク予測モデルをデプロイすることができ、第2の期間内のがんのリスクを予測するように訓練された第2のリスク予測モデルを更にデプロイすることができる。
【0093】
様々な実施形態では、リスクデプロイモジュール160は、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、又は20の異なるリスク予測モデルをデプロイして、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20の異なる期間にわたってそれぞれ、がんのリスクを生成する。様々な実施形態では、リスクデプロイモジュール160は、5つの異なるリスク予測モデルをデプロイして、5つの異なる期間にわたるがんのリスクを生成する。様々な実施形態では、リスクデプロイモジュール160は、3つの異なるリスク予測モデルをデプロイして、3つの異なる期間にわたるがんのリスクを生成する。例えば、リスクデプロイモジュール160は、1年リスク予測モデル、3年リスク予測モデル、及び5年リスク予測モデルをデプロイして、それぞれ1年、3年、及び5年以内のがんのリスクの予測を生成する。
【0094】
様々な実施形態では、特徴215Bを分析するためにデプロイされる1つ又は2つ以上のリスク予測モデル230の各々は、異なる領域(例えば、異なる肺領域)に分けられた訓練画像で以前に訓練された。例えば、第1のリスク予測モデル230は、肺の第1の領域内のがんの存在を予測するように訓練され得、第2のリスク予測モデル230は、肺の第2の領域内のがんの存在を予測するように訓練され得、第3のリスク予測モデル230は、肺の第3の領域内のがんの存在を予測するように訓練され得る。例として、異なる肺領域は、体積で肺の上部3分の1、中央3分の1、及び下部3分の1、又は肺の別個の葉を含むことができる。したがって、対象について生成されたリスク予測240は、特定の領域(例えば、肺領域)内のがんのリスクであり得る。
【0095】
様々な実施形態では、特徴215Bを分析するためにデプロイされる1つ又は2つ以上のリスク予測モデル230の各々は、対象分析220の結果として判定された候補対象のコホートと一致する訓練個体のコホートを使用して以前に訓練された。言い換えれば、リスク予測モデル230は、それらが対象分析220を受けることになった場合、候補対象として認定される訓練個体を使用して以前に訓練された。
【0096】
様々な実施形態では、リスク予測モデル230を訓練するために使用される訓練個体のうちの1人又は2人以上は、候補対象と少なくとも1つの特徴を共有する。一例として、候補対象がLung-RADS 1として分類される場合、リスク予測モデル230を訓練するために使用される訓練個体のうちの1人又は2人以上も、Lung-RADS 1として分類された。様々な実施形態では、リスク予測モデル230は、Lung-RADS 1として分類された訓練個体から捕捉された訓練画像を使用して訓練され得る(Lung-RADS 1リスク予測モデルと呼ばれる)。様々な実施形態では、リスク予測モデル230は、Lung-RADS 1又はLung-RADS 2として分類された訓練個体から捕捉された訓練画像を使用して訓練され得る(Lung-RADS 1~2リスク予測モデルと呼ばれる)。様々な実施形態では、リスク予測モデル230は、Lung-RADS 1、Lung-RADS 2、又はLung-RADS 3として分類された訓練個体から捕捉された訓練画像を使用して訓練され得る(Lung-RADS 1~3リスク予測モデルと呼ばれる)。様々な実施形態では、リスク予測モデル230は、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、又はLung-RADS 4Aとして分類された訓練個体から捕捉された訓練画像を使用して訓練され得る(Lung-RADS 1~4Aリスク予測モデルと呼ばれる)。様々な実施形態では、リスク予測モデル230は、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、又はLung-RADS 4Bとして分類された訓練個体から捕捉された訓練画像を使用して訓練され得る(Lung-RADS 1~4Bリスク予測モデルと呼ばれる)。様々な実施形態では、リスク予測モデル230は、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、Lung-RADS 4B、又はLung-RADS 4Xとして分類された訓練個体から捕捉された訓練画像を使用して訓練され得る(Lung-RADS 1~4Xリスク予測モデルと呼ばれる)。様々な実施形態では、リスク予測モデル230は、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、及びLung-RADS 4Bとして分類された訓練個体から捕捉された訓練画像を使用して訓練され得る(Lung-RADS 2~4Bリスク予測モデルと呼ばれる)。
【0097】
候補対象がLung-RADS 1として分類されるシナリオでは(例えば、対象分析220を介して分類された、又は以前に第三者によって分類された)、リスクデプロイモジュール160は、Lung-RADS 1として以前にも分類された少なくとも1人の訓練個体から捕捉された訓練画像を使用して訓練された1つ又は2つ以上のリスク予測モデル230をデプロイする。したがって、リスクデプロイモジュール160は、それぞれがLung-RADS 1予測モデル、Lung-RADS 1~2予測モデル、Lung-RADS 1~3予測モデル、Lung-RADS 1~4A予測モデル、Lung-RADS 1~4B予測モデル、又はLung-RADS 1~4Xモデルのいずれかである1つ又は2つ以上のリスク予測モデル230をデプロイすることができる。特定の実施形態では、リスクデプロイモジュール160は、Lung-RADS 1候補対象のLung-RADS 1予測モデルをデプロイする。特定の実施形態では、リスクデプロイモジュール160は、Lung-RADS 1候補対象のLung-RADS 1~2予測モデルをデプロイする。特定の実施形態では、リスクデプロイモジュール160は、Lung-RADS 1候補対象のLung-RADS 1~3予測モデルをデプロイする。
【0098】
候補対象がLung-RADS 2として分類されるシナリオでは(例えば、対象分析220を介して分類された、又は以前に第三者によって分類された)、リスクデプロイモジュール160は、Lung-RADS 2として以前にも分類された少なくとも1人の訓練個体から捕捉された訓練画像を使用して訓練された1つ又は2つ以上のリスク予測モデル230をデプロイする。したがって、リスクデプロイモジュール160は、それぞれがLung-RADS 1~2予測モデル、Lung-RADS 1~3予測モデル、Lung-RADS 1~4A予測モデル、Lung-RADS 1~4B予測モデル、又はLung-RADS 1~4Xモデルのいずれかである1つ又は2つ以上のリスク予測モデル230をデプロイすることができる。特定の実施形態では、リスクデプロイモジュール160は、Lung-RADS 2候補対象のLung-RADS 1~2予測モデルをデプロイする。特定の実施形態では、リスクデプロイモジュール160は、Lung-RADS 2候補対象のLung-RADS 1~3予測モデルをデプロイする。
【0099】
候補対象がLung-RADS 3として分類されるシナリオでは(例えば、対象分析220を介して分類された、又は以前に第三者によって分類された)、リスクデプロイモジュール160は、Lung-RADS 3として以前にも分類された少なくとも1人の訓練個体から捕捉された訓練画像を使用して訓練された1つ又は2つ以上のリスク予測モデル230をデプロイする。したがって、リスクデプロイモジュール160は、それぞれがLung-RADS 1~3予測モデル、Lung-RADS 1~4A予測モデル、Lung-RADS 1~4B予測モデル、又はLung-RADS 1~4Xモデルのいずれかである1つ又は2つ以上のリスク予測モデル230をデプロイすることができる。
【0100】
候補対象がLung-RADS 4Aとして分類されるシナリオでは(例えば、対象分析220を介して分類された、又は以前に第三者によって分類された)、リスクデプロイモジュール160は、Lung-RADS 4Aとして以前にも分類された少なくとも1つの訓練個体から捕捉された訓練画像を使用して訓練された1つ又は2つ以上のリスク予測モデル230をデプロイする。したがって、リスクデプロイモジュール160は、それぞれがLung-RADS 1~4A予測モデル、Lung-RADS 1~4B予測モデル、又はLung-RADS 1~4Xモデルのいずれかである1つ又は2つ以上のリスク予測モデル230をデプロイすることができる。
【0101】
候補対象がLung-RADS 4Bとして分類されるシナリオでは(例えば、対象分析220を介して分類された、又は以前に第三者によって分類された)、リスクデプロイモジュール160は、Lung-RADS 4Bとして以前にも分類された少なくとも1人の訓練個体から捕捉された訓練画像を使用して訓練された1つ又は2つ以上のリスク予測モデル230をデプロイする。したがって、リスクデプロイモジュール160は、それぞれがLung-RADS 1~4B予測モデル、又はLung-RADS 1~4Xモデルのいずれかである1つ又は2つ以上のリスク予測モデル230をデプロイすることができる。
【0102】
候補対象がLung-RADS 4Xとして分類されるシナリオでは(例えば、対象分析220を介して分類された、又は以前に第三者によって分類された)、リスクデプロイモジュール160は、Lung-RADS 4Xとして以前にも分類された少なくとも1人の訓練個体から捕捉された訓練画像を使用して訓練された1つ又は2つ以上のリスク予測モデル230をデプロイする。したがって、リスクデプロイモジュール160は、それぞれがLung-RADS 1~4X予測モデルである1つ又は2つ以上のリスク予測モデル230をデプロイすることができる。
【0103】
様々な実施形態では、リスク予測モデルは、1)対象分析220の結果として判定された候補対象のコホートと一致する訓練個体のコホートを使用して訓練され、かつ2)ある期間内のがん予測のリスク(例えば、既存の若しくは高頻度に見られるがん、又は1年、3年、若しくは5年以内のがんの将来のリスク)を生成するように訓練される。例えば、候補対象についてリスク予測240を生成するために、リスクデプロイモジュール160は、1)候補対象と少なくとも1つの特徴を共有する1人又は2人以上の訓練個体を使用して訓練され、2)異なる期間内のがんのリスクを予測するように訓練される、1つ又は2つ以上のリスク予測モデル230を適用する。
【0104】
候補対象がLung-RADS「Z」として分類されるシナリオでは(例えば、対象分析220を介して分類された、又は以前に第三者によって分類された)、リスクデプロイモジュール160は、1)Lung-RADS「Z」として以前にも分類された少なくとも1人の訓練個体から捕捉された訓練画像を使用して訓練され、かつ2)異なる期間内のがんのリスクを予測する、1つ又は2つ以上のリスク予測モデル230をデプロイする。本明細書で使用される場合、これらのリスク予測モデルは、「M年、Lung-RADS X~Y予測モデル」と呼ばれ、ここで、「M」は、期間を指し、「X~Y」は、訓練個体のLung-RADSスコアの範囲を指す。例えば、1年、Lung-RADS 1~3予測モデルは、Lung-RADS 1~3に以前に分類された訓練個体を使用して訓練され、かつ1年以内のがんのリスクを予測するように訓練されたリスク予測モデルを指す。
【0105】
様々な実施形態では、Lung-RADS 1として分類される候補対象について、リスクデプロイモジュール160は、1つ又は2つ以上のM年、Lung-RADS X~Y予測モデルをデプロイし、ここで、「M」は変数であるが、「X」及び「Y」は固定である。例えば、Lung-RADS 1として分類される候補対象について、「M」は1~5年の範囲であることができ、X=1かつY=1~4Bの任意の値である。一例として、Y=3であるならば、リスクデプロイモジュール160は、1年、Lung-RADS 1~3予測モデル、2年、Lung-RADS 1~3予測モデル、3年、Lung-RADS 1~3予測モデル、4年、Lung-RADS 1~3予測モデル、及び5年、Lung-RADS 1~3予測モデルをデプロイすることができる。他の実施形態では、リスクデプロイモジュール160は、本明細書に記載される以上の追加のリスク予測モデルをデプロイすることができる(例えば、Mの範囲は1~10、1~15、又は1~20年、例えば、X及びYは、異なる範囲のLung-RADSスコアを提供するように異なるように選択される)。
【0106】
候補対象がLung-RADS 1として分類される特定の実施形態では、リスクデプロイモジュール160は、1)1年以内のがんの将来のリスクを予測する第1のリスク予測モデル230(例えば、1年、Lung-RADS 1~3予測モデル)、2)3年以内のがんの将来を予測する第2のリスク予測モデル230(例えば、3年、Lung-RADS 1~3予測モデル)、及び3)5年以内のがんの将来を予測する第3のリスク予測モデル230(例えば、5年、Lung-RADS 1~3予測モデル)をデプロイする。
【0107】
候補対象がLung-RADS 2として分類される特定の実施形態では、リスクデプロイモジュール160は、1)1年以内のがんの将来のリスクを予測する第1のリスク予測モデル230(例えば、1年、Lung-RADS 1~3予測モデル)、2)3年以内のがんの将来を予測する第2のリスク予測モデル230(例えば、3年、Lung-RADS 1~3予測モデル)、及び3)5年以内のがんの将来を予測する第3のリスク予測モデル230(例えば、5年、Lung-RADS 1~3予測モデル)をデプロイする。
【0108】
候補対象がLung-RADS 3として分類される特定の実施形態では、リスクデプロイモジュール160は、1)1年以内のがんの将来のリスクを予測する第1のリスク予測モデル230(例えば、1年、Lung-RADS 1~3予測モデル)、2)3年以内のがんの将来を予測する第2のリスク予測モデル230(例えば、3年、Lung-RADS 1~3予測モデル)、及び3)5年以内のがんの将来を予測する第3のリスク予測モデル230(例えば、5年、Lung-RADS 1~3予測モデル)をデプロイする。
【0109】
候補対象がLung-RADS 4Aとして分類される特定の実施形態では、リスクデプロイモジュール160は、1)1年以内のがんの将来のリスクを予測する第1のリスク予測モデル230(例えば、1年、Lung-RADS 1~4A予測モデル)、2)3年以内のがんの将来を予測する第2のリスク予測モデル230(例えば、3年、Lung-RADS 1~4A予測モデル)、及び3)5年以内のがんの将来を予測する第3のリスク予測モデル230(例えば、5年、Lung-RADS 1~4A予測モデル)をデプロイする。
【0110】
候補対象がLung-RADS 4Bとして分類される特定の実施形態では、リスクデプロイモジュール160は、1)1年以内のがんの将来のリスクを予測する第1のリスク予測モデル230(例えば、1年、Lung-RADS 1~4B予測モデル)、2)3年以内のがんの将来を予測する第2のリスク予測モデル230(例えば、3年、Lung-RADS 1~4B予測モデル)、及び3)5年以内のがんの将来を予測する第3のリスク予測モデル230(例えば、5年、Lung-RADS 1~4B予測モデル)をデプロイする。
【0111】
候補対象がLung-RADS 4Xとして分類される特定の実施形態では、リスクデプロイモジュール160は、1)1年以内のがんの将来のリスクを予測する第1のリスク予測モデル230(例えば、1年、Lung-RADS 1~4X予測モデル)、2)3年以内のがんの将来を予測する第2のリスク予測モデル230(例えば、3年、Lung-RADS 1~4X予測モデル)、及び3)5年以内のがんの将来を予測する第3のリスク予測モデル230(例えば、5年、Lung-RADS 1~4X予測モデル)をデプロイする。
【0112】
図2Aに示すように、リスク予測240は、患者エンリッチメント250に使用することができる。例えば、対象は、臨床研究に登録される1つ又は2つ以上の患者コホートに含まれることができる。患者エンリッチメントのための方法は、以下で更に詳細に説明される。
【0113】
ここで、第2の実施形態による、患者のエンリッチメントなどの用途のために対象のがんのリスクを判定するための例示的なフロー図を示す
図2Bが参照される。ここで、
図2Bは、
図2Bが対象分析ステップ(例えば、
図2Aに示されるステップ220)を含まないという点で
図2Aとは異なる。したがって、
図2Bは、対象がスクリーニングを受けない実施形態を示す。代わりに、全ての対象は、続いてリスク予測を受ける候補対象である。様々な実施形態では、対象は、肺結節を有するか、又は有しないかのいずれかである。様々な実施形態では、対象は、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、Lung-RADS 4B、又はLung-RADS 4Xのいずれか1つに以前に分類されることができる。したがって、そのような実施形態では、全ての対象は、肺結節病期分類及び/又はLung-RADSスコアに関係なく、リスク予測を受ける。
【0114】
図2Bに示すように、候補対象画像255は、特徴260を取得するために特徴抽出を受ける。様々な実施形態では、特徴260は、候補対象画像225の結節特異的特徴及び非結節特異的特徴のうちの一方又は両方を含む。様々な実施形態では、特徴260は、非結節特異的特徴のみを含む。様々な実施形態では、特徴260は、結節特異的特徴のみを含む。様々な実施形態では、特徴抽出モジュール140は、訓練された機械学習モデルを実装することを含む画像分析アルゴリズムなどの画像分析アルゴリズムを実装することによって、結節特異的特徴を抽出する。様々な実施形態では、特徴抽出モジュール140は、PyRadiomicsを実装することによって、結節特異的特徴を抽出する。PyRadiomicsは、「Computational radiomics system to decode the radiographic phenotype.」Cancer Research;77(21):e104~e107において更に詳細に説明されており、その全内容は参照により本明細書に組み込まれている。
【0115】
様々な実施形態では、候補対象画像255の結節特異的特徴は、第三者によって判定される。例えば、結節特異的特徴は、候補対象画像255を分析する訓練された専門家(例えば、放射線科医)によって判定され得る。様々な実施形態では、特徴抽出モジュール145は、第三者によって生成されたレポートから結節特異的特徴を抽出する。例えば、特徴抽出モジュール145は、対象画像225を分析する訓練された専門家(例えば、放射線学者)によって生成されたレポートから結節特異的特徴を抽出する。
【0116】
リスクデプロイモジュール260は、1つ又は2つ以上のリスク予測モデル265を適用して、特徴260を分析し、リスク予測270を生成する。したがって、リスク予測270は、患者エンリッチメント275に使用することができる。様々な実施形態では、
図2Bに示されるようにリスク予測270を生成するためのリスク予測モデル265のデプロイは、
図2Aに示されるようにリスク予測240を生成するためにリスク予測モデル230をデプロイするのと同じプロセスである。
【0117】
ここで、1つ又は2つ以上のリスク予測モデル265は、可能な対象の部分的範囲又は全範囲にわたる訓練個体から取得された訓練画像で訓練される。例えば、リスク予測モデル265は、肺結節を有する又は肺結節を有しないのいずれかの訓練個体から捕捉された訓練画像を使用して訓練される。別の例として、リスク予測モデル265は、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、Lung-RADS 4B、又はLung-RADS 4Xのいずれかの訓練個体から捕捉された訓練画像を使用して訓練される(例えば、Lung-RADS 1~4Xリスク予測モデル)。
【0118】
様々な実施形態では、リスクデプロイモジュール260は、複数のリスクモデル265をデプロイして、複数のリスク予測270を予測する。例えば、リスクデプロイモジュール260は、複数のM年、Lung-RADS 1~4Xリスク予測モデルをデプロイし、ここで、「M」は、がんリスクが評価されている期間を指す。様々な実施形態では、「M」は、少なくとも1年、少なくとも2年、少なくとも3年、少なくとも4年、少なくとも5年、少なくとも6年、少なくとも7年、少なくとも8年、少なくとも9年、少なくとも10年、少なくとも11年、少なくとも12年、少なくとも13年、少なくとも14年、少なくとも15年、少なくとも16年、少なくとも17年、少なくとも18年、少なくとも19年、及び/又は少なくとも20年である。特定の実施形態では、リスクデプロイモジュール260は、1)1年、Lung-RADS 1~4Xリスク予測モデル、2)3年、Lung-RADS 1~4Xリスク予測モデル、及び3)5年、Lung-RADS 1~4Xリスク予測モデルをデプロイし、それによって、1年、3年、及び5年の期間についてのがん予測のリスクを生成する。
【0119】
様々な実施形態では、デプロイされると、リスク予測モデルは、抽出された画像特徴を分析し、対象にある期間内にがんが発生する可能性が高いかどうかを示すことができる予測スコアを生成する。例えば、リスク予測モデルは、訓練されたパラメータのセットを抽出された画像特徴の値と組み合わせることによって予測スコアを計算する回帰モデル(例えば、ロジスティック回帰又は線形回帰モデル)であることができる。別の例として、リスク予測モデルは、ニューラルネットワークのノード及びレイヤに関連付けられた訓練されたパラメータのセットを抽出された画像特徴の値と組み合わせることによって予測スコアを計算するニューラルネットワークモデルであることができる。別の例として、リスク予測モデルは、決定木ノードと関連付けられた訓練されたパラメータのセットを抽出された画像特徴の値と組み合わせることによって予測スコアを計算するランダムフォレストモデルであることができる。別の例として、リスク予測モデルは、決定木ノードと関連付けられた訓練されたパラメータのセットを抽出された画像特徴の値と組み合わせることによって予測スコアを計算する勾配ブースト機械モデルであることができる。別の例として、リスク予測モデルは、訓練されたパラメータのセットを抽出された画像特徴の値と組み合わせることによって予測スコアを計算するサポートベクターマシンであることができる。
【0120】
様々な実施形態では、リスク予測モデルは、予測スコアを1つ又は2つ以上の参照スコアと比較する。様々な実施形態では、1つ又は2つ以上の参照スコアは、閾値カットオフ値である。例えば、閾値カットオフ値は、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、又は0.9などの0~1であることができる。特定の実施形態では、閾値は0.1である。特定の実施形態では、閾値は0.3である。したがって、予測スコアが閾値参照スコアを超える場合、対象は、1つのカテゴリ(例えば、がんが発生する可能性が高い)に分類される。予測スコアが閾値参照スコアを下回る場合、対象は、異なるカテゴリ(例えば、がんが発生する可能性が低い)に分類される。
【0121】
様々な実施形態では、複数の参照閾値スコアを実装して、複数の分類グループを作成することができる。例えば、第1の閾値は0.1であり、第2の閾値は0.3である。したがって、予測スコアが第1の閾値未満である場合、対象は、第1のカテゴリ(例えば、がんが発生する可能性が低い)に分類される。予測スコアが第1の閾値と第2の閾値との間にある場合、対象は、第2のカテゴリ(例えば、がんが発生するリスクが低い)に分類される。予測スコアが第2の閾値よりも大きい場合、対象は、第3のカテゴリ(例えば、がんが発生するリスクが高い)に分類される。
【0122】
一例として、参照スコアは、1人又は2人以上の訓練個体に対応する。例えば、参照スコアは、期間内にがんが発生することが知られていた訓練個体に対応することができる。別の例として、参照スコアは、期間内にがんが発生しないことが知られていた訓練個体に対応することができる。したがって、対象についての予測スコアが、期間内にがんが発生することが知られていた訓練個体に対応する参照スコアと比較して著しく異ならない(例えば、p値>0.05)場合、リスク予測モデルは、対象を、期間内にがんが発生する可能性が高いとして分類することができる。対象についての予測スコアが、期間内にがんが発生することが知られていた訓練個体に対応する参照スコアと比較して著しく異なる(例えば、p値<0.05)場合、リスク予測モデルは、対象を、期間内にがんが発生する可能性が高くないとして分類することができる。対象についての予測スコアが、期間内にがんが発生しないことが知られていた訓練個体に対応する参照スコアと比較して著しく異ならない(例えば、p値>0.05)場合、リスク予測モデルは、対象を、期間内にがんが発生する可能性が高くないとして分類することができる。対象についての予測スコアが、期間内にがんが発生しないことが知られていた訓練個体に対応する参照スコアと比較して著しく異なる(例えば、p値<0.05)場合、リスク予測モデルは、対象を、期間内にがんが発生する可能性が高いとして分類することができる。
【0123】
様々な実施形態において、訓練中に、低リスク対象から高リスク対象を区別するがん閾値のリスクが定義される。次いで、高リスク対象のみが、任意の所与のモデルに含まれる。様々な実施形態では、各リスク予測モデルは、対象を高リスク又は低リスクに区別するために使用される固有のがん閾値を有する。それらの閾値が各リスク予測モデルに対して定義されると、リスク予測モデルは、対象のためにデプロイされて、がんのリスクを予測する。そのリスクが訓練において定義された閾値を超える場合、対象を、がんのリスクが高いとして分類することができる。
【0124】
図2Bに示すように、リスク予測270は、患者エンリッチメント275のために使用することができる。例えば、対象は、臨床に登録される1つ又は2つ以上の患者コホートに含まれることができる。患者エンリッチメントのための方法は、以下で更に詳細に説明される。
【0125】
様々な実施形態では、対象のリスク予測270は、ユーザ、例えば、臨床医ユーザに表示することができる。したがって、臨床医ユーザは、対象について予測されるがんのリスクを対象に通知することができる。様々な実施形態では、追加の/他の情報をユーザ、例えば、臨床医ユーザに表示することができる。例えば、対象についてのがん予測のリスクが、対象に期間内にがんが発生する可能性が高いことを示す場合、がん予測のリスクに最も大きく寄与した特徴などの情報をユーザ、例えば、臨床医ユーザに表示することができる。例えば、がんのリスクを有すると予測される対象は、小葉中心性肺気腫によって占有される対象の肺の割合に大きく起因する可能性がある。したがって、特徴の識別及び/又は特徴の値(例えば、小葉中心性肺気腫によって占有される対象の肺の割合)を、ユーザ、例えば、臨床医ユーザに表示することができる。様々な実施形態では、対象のがんリスク予測に最も大きく寄与した上位1つ、上位2つ、上位3つ、上位4つ、上位5つ、上位6つ、上位7つ、上位8つ、上位9つ、上位10、上位11、上位12、上位13、上位14、上位15、上位16、上位17、上位18、上位19、上位20、上位21、上位22、上位23、上位24、上位25、上位30、上位35、上位40、上位45、上位50、上位55、上位60、上位65、上位70、上位75、上位80、上位85、上位90、上位95、又は上位100の特徴を、ユーザ、例えば臨床医ユーザに表示することができる。大きく寄与する特徴の表示は、がん予測のリスクをもたらした特徴を理解する際に臨床医ユーザにコンテキストを提供することができる。
【0126】
IV.患者エンリッチメント方法
一般に、リスク予測モデルからのがん予測のリスクは、患者のエンリッチメントに使用される。例えば、がん予測のリスクは、対象に期間内(例えば、1年以内、3年以内、又は5年以内)にがんが発生する可能性が高いかどうかに関する洞察を提供する。したがって、特定の期間内にがんが発生すると予測される対象について、対象は、臨床試験に登録されるべき患者コホートに含めるために選択されることができる。がん予測のリスクによって提供される洞察を考慮すると、これは、臨床試験の患者コホートへのより少ない対象の登録を可能にする。したがって、臨床試験を実施し、患者コホートにおける対象を追跡することが必要なリソースが少ない。追加的に、患者コホートに含まれていない対象(例えば、期間内にがんが発生しないと予測される対象)は、他の目的(例えば、他の臨床試験に登録される)に使用することができる。
【0127】
様々な実施形態では、対象は、患者に対して生成された複数のリスク予測のうちの1つ又は2つ以上に基づいて、患者コホートに含めるために選択される。例えば、対象は、対象に1年以内にがんが発生せず、3年以内にがんが発生しないが、5年以内にがんが発生する可能性が高いことを示す第1のリスク予測を有し得る。したがって、対象は、予防的治療薬の投与を伴うがん臨床試験に登録するための患者コホートに含めるために選択される。
【0128】
別の例として、対象は、対象に1年以内にがんが発生する可能性が高く、したがって、3年及び5年以内にがんが発生する可能性も高いことを示す第1のリスク予測を有し得る。したがって、対象は、攻撃的ながん治療(例えば、腫瘍切除及び/又は治療薬の投与)を含むがん臨床試験に登録するための患者コホートに含めるために選択される。
【0129】
様々な実施形態では、複数の対象についてのリスク予測を使用する患者エンリッチメントプロセスは、ランダムに生成された患者コホートと比較してがんが発生する可能性がより高い患者のエンリッチメントコホートを生成する。様々な実施形態では、患者エンリッチメントプロセスは、ランダムに生成された患者コホートと比較して、累積がん発生率の少なくとも1.5倍の増加を経験する患者のエンリッチメントコホートを生成する。様々な実施形態では、患者エンリッチメントプロセスは、ランダムに生成された患者コホートと比較して、累積がん発生率の少なくとも1.6倍の増加、少なくとも1.7倍の増加、少なくとも1.8倍の増加、少なくとも1.9倍の増加、少なくとも2倍の増加、少なくとも3倍の増加、少なくとも4倍の増加、少なくとも5倍の増加、少なくとも6倍の増加、少なくとも7倍の増加、少なくとも8倍の増加、少なくとも9倍の増加、少なくとも10倍の増加、少なくとも11倍の増加、少なくとも12倍の増加、少なくとも13倍の増加、少なくとも14倍の増加、少なくとも15倍の増加、少なくとも16倍の増加、少なくとも17倍の増加、少なくとも18倍の増加、少なくとも19倍の増加、少なくとも20倍の増加、少なくとも21倍の増加、少なくとも22倍の増加、少なくとも23倍の増加、少なくとも24倍の増加、少なくとも25倍の増加、少なくとも26倍の増加、少なくとも27倍の増加、少なくとも28倍の増加、少なくとも29倍の増加、又は少なくとも30倍の増加を経験する患者のエンリッチされたコホートを生成する。
【0130】
V.リスク予測モデルの訓練
本明細書に開示される実施形態は、対象のがんの可能性を予測するためのリスク予測モデルを訓練及びデプロイすることを含む。上述したように、リスク予測モデルは、結節特徴又は非結節特徴などの特徴を分析して、対象についてのがんの予測される可能性を生成するように構成される。様々な実施形態において、結節特徴及び/又は非結節特徴は、単一の時点の画像(例えば、t0画像、t1画像、又はt2画像)から抽出される。様々な実施形態では、結節特徴及び/又は非結節特徴は、2つ又は3つ以上の時点からの画像から抽出され、したがって、2つ又は3つ以上の時点にわたる特徴の変化を実証する縦方向特徴を含む。様々な実施形態では、結節特徴及び/又は非結節特徴は、単一の時点の画像から抽出された特徴と、2つ又は3つ以上の時点からの画像から抽出された縦方向特徴との両方を含む。
【0131】
様々な実施形態において、リスク予測モデルは、少なくとも5つの特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも10の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも15の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも20の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも25の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも30の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも35の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも40の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも45の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも50の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも60の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも70の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも80の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも90の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。様々な実施形態において、リスク予測モデルは、少なくとも100の特徴(例えば、結節特徴及び/又は非結節特徴)を含む。
【0132】
様々な実施形態において、リスク予測モデルは、結節特徴及び非結節特徴が別個に分析されて別個の予測を生成するように構築される。次いで、リスク予測モデルは、少なくとも別個の予測を集約して、対象のがんの予測される可能性を生成する。例えば、リスク予測モデルは、結節特徴を分析する結節モデルを含むように構築することができ、非結節特徴を分析する非結節モデルを更に含むことができる。ここで、非結節モデル及び結節モデルは、リスク予測モデルの第1及び第2のサブモデルを表す。
【0133】
一般に、結節モデルは、対象から導出された結節特徴(例えば、肺結節の特徴、肺結節のエッジ、及び境界/結節周辺領域)に基づいてがんの可能性を示す予測を出力する。非結節モデルは、対象から導出された非結節特徴のみに基づいてがんの可能性を示す予測を出力する。様々な実施形態では、結節モデル及び非結節モデルの各々の予測された出力を使用して、対象のがんの予測される可能性を生成することができる。例えば、結節モデル及び非結節モデルの各々は、スコアを出力することができる。したがって、2つのスコアを組み合わせて、対象のがんの予測される可能性を生成することができる。
【0134】
様々な実施形態では、結節特徴の分析の前に、結節モデルは、結節特徴をフィルタリングして、結節特徴の縮小セットにする分析を実行することができる。例えば、対象のCT画像が2つ以上の結節を含む場合、結節モデルは、がんの高リスクに関連付けられる結節とがんの低リスクに関連付けられる結節とを区別する分析を実行することができる。様々な実施形態において、結節モデルは、結節特徴の低減されたセットが単一の結節に対応する特徴を含むように、結節特徴をフィルタリングする。例えば、単一の結節は、がんの最も高いリスクに関連付けられた結節であり得る。様々な実施形態において、結節モデルは、結節特徴の最終セットが、がんの最も高いリスクに関連する上位Xの結節に対応する特徴を含むように、結節特徴をフィルタリングする。特定の実施形態では、Xは、1つの結節である。様々な実施形態では、Xは、2つの結節である。様々な実施形態において、Xは、3つの結節、4つの結節、5つの結節、6つの結節、7つの結節、8つの結節、9つの結節、10の結節、11の結節、12の結節、13の結節、14の結節、15の結節、16の結節、17の結節、18の結節、19の結節、又は20の結節である。したがって、結節モデルは、上位Xの結節に対応する結節特徴の低減されたセットを分析することができ、結節特徴の低減されたセットに基づいて、対象のがんの可能性を示す予測された出力を判定する。
【0135】
様々な実施形態において、結節モデル及び非結節モデルの各々の出力は、第3のサブモデルへの入力(その後、集約モデルとへの入力と称される)として提供される。したがって、集約モデルは、少なくとも結節モデル及び非結節モデルからの出力に基づいて、がんの可能性を予測することができる。様々な実施形態では、集約モデルは、入力として、対象に関する追加の情報を更に受信して、対象のがんの可能性を予測することができる。この追加の情報は、対象に時間範囲内にがんが発生する可能性が高いかどうかを判定するために更に有益であり得る。対象に関する追加情報の例には、対象に由来するプロテオミクスデータ、対象が曝露された可能性がある環境因子、対象の遺伝学、及び/又は対象の臨床情報(例えば、年齢、性別、体重、以前の病歴など)が含まれる。
【0136】
様々な実施形態において、リスク予測モデルは、結節特徴と非結節特徴との両方を一緒に分析し、がんの予測される可能性を生成するように構築される。したがって、そのような実施形態では、結節特徴及び非結節特徴は別個に分析されない。したがって、リスク予測モデルによって分析されるとき、結節特徴及び非結節特徴は、互いに分離される必要がない。
【0137】
図3Aは、第1の実施形態による、リスク予測モデルの実装形態の例示的なフロー図である。
図3Aに示すように、特徴305は、結節特徴310A及び非結節特徴310Bを含む。様々な実施形態において、結節特徴310Aは、リスク予測モデル320への入力の前に、非結節特徴310Bから選択的に分割される。リスク予測モデル320は、結節モデル325A及び非結節モデル325Bを含む。ここで、結節モデル325Aは、結節特徴310Aを入力として受信する。非結節モデル325Bは、非結節特徴310Bを入力として受信する。結節モデル325A及び非結節モデル325Bの各々の出力は、集約モデル330への入力として提供される。集約モデル330は、対象の時間範囲内のがんの可能性などのリスク予測340を生成する。
【0138】
図3Bは、第2の実施形態による、リスク予測モデルの実装形態の例示的なフロー図である。特徴305は、結節特徴310A及び非結節特徴310Bを含む。ここで、
図3Bは結節特徴310Aと非結節特徴310Bとを別個に示しているが、様々な実施形態では、特徴305自体がリスク予測モデル320への入力として提供される。リスク予測モデル320は、結節特徴310A及び非結節特徴310Bを一緒に分析して、リスク予測340を生成する。
【0139】
VI.リスク予測モデルの訓練
概して、リスク予測モデルは、非結節特異的特徴及び/又は結節特異的特徴などの画像から抽出された特徴を分析し、抽出された特徴に基づいて対象のがんリスクを予測するように構築される。様々な実施形態において、リスク予測モデルは、回帰モデル(例えば、線形回帰、ロジスティック回帰、又は多項式回帰)、決定木、ランダムフォレスト、勾配ブースト機械学習モデル、分類ブースト機械学習モデル、サポートベクターマシン、ナイーブベイズモデル、k-meansクラスタ、又はニューラルネットワーク(例えば、フィードフォワードネットワーク、畳み込みニューラルネットワーク(convolutional neural network、CNN)、ディープニューラルネットワーク(deep neural network、DNN)、オートエンコーダニューラルネットワーク、敵対的生成ネットワーク、又は回帰型ネットワーク(例えば、長・短期記憶ネットワーク(long short-term memory network、LSTM)、双方向回帰型ネットワーク、ディープ双方向回帰型ネットワーク)、又はそれらの任意の組み合わせのうちのいずれか1つである。特定の実施形態では、リスク予測モデルは、ロジスティック回帰モデルである。特定の実施形態では、リスク予測モデルは、ランダムフォレスト分類器である。特定の実施形態では、リスク予測モデルは、勾配ブースティングモデルである。様々な実施形態において、リスク予測モデルは、2つ又は3つ以上のサブモデルを含む。例えば、リスク予測モデルは、3つのサブモデル、すなわち、非結節特異的特徴を分析する第1のサブモデル、結節特異的特徴を分析する第2のサブモデル、並びに第1のサブモデル及び第2のサブモデルによって出力された予測を分析することによって、がんのリスクを予測する第3のサブモデルを含むことができる。様々な実施形態において、第1のサブモデル、第2のサブモデル、及び第3のサブモデルは、互いに独立して、回帰モデル(例えば、線形回帰、ロジスティック回帰、若しくは多項式回帰)、決定木、ランダムフォレスト、勾配ブースト機械学習モデル、分類ブースト機械学習モデル、サポートベクターマシン、ナイーブベイズモデル、k-meansクラスタ、若しくはニューラルネットワーク(例えば、フィードフォワードネットワーク、畳み込みニューラルネットワーク(CNN)、ディープニューラルネットワーク(deep neural network、DNN)、オートエンコーダニューラルネットワーク、敵対的生成ネットワーク、若しくは回帰型ネットワーク(例えば、長・短期記憶ネットワーク(LSTM)、双方向回帰型ネットワーク、ディープ双方向回帰型ネットワーク)、又はそれらの任意の組み合わせのうちのいずれか1つであり得る。
【0140】
リスク予測モデルは、線形回帰アルゴリズム、ロジスティック回帰アルゴリズム、決定木アルゴリズム、サポートベクターマシン分類、ナイーブベイズ分類、K最近傍分類、ランダムフォレストアルゴリズム、ディープラーニングアルゴリズム、勾配ブースティングアルゴリズム、及びマニホールド学習、主成分分析、因子分析、オートエンコーダ正則化、及び独立成分分析などの次元削減技術、又はそれらの組み合わせのうちのいずれか1つなどの、機械学習実装方法を使用して訓練することができる。特定の実施形態では、機械学習実装方法は、ロジスティック回帰アルゴリズムである。特定の実施形態では、機械学習実装方法は、ランダムフォレストアルゴリズムである。特定の実施形態では、機械学習実装方法は、XGboostなどの勾配ブースティングアルゴリズムである。様々な実施形態において、リスク予測モデルは、教師あり学習アルゴリズム、教師なし学習アルゴリズム、半教師あり学習アルゴリズム(例えば、部分的な教師あり)、弱教師あり、転移学習、マルチタスク学習、又はそれらの任意の組み合わせを使用して訓練される。
【0141】
様々な実施形態では、リスク予測モデルは、ハイパーパラメータ又はモデルパラメータなどの1つ又は2つ以上のパラメータを有する。ハイパーパラメータは、一般に、訓練の前に確立される。ハイパーパラメータの例は、決定木の学習率、深度、又は葉、ディープニューラルネットワークにおける隠れ層の数、k-meansクラスタにおけるクラスタの数、回帰モデルにおけるペナルティ、及びコスト関数と関連付けられた正則化パラメータを含む。モデルパラメータは、一般に、訓練中に調整される。モデルパラメータの例には、ニューラルネットワークの層におけるノード、サポートベクターマシンにおけるサポートベクター、決定木におけるノード値、及び回帰モデルにおける係数と関連付けられた重みが含まれる。リスク予測モデルのモデルパラメータは、リスク予測モデルの予測能力を改善するために訓練データを使用して訓練(例えば、調整)される。
【0142】
リスク訓練モジュール155は、訓練データを使用してリスク予測モデルを訓練する。訓練データは、訓練データストア170に記憶させる及び/又はそこから取り出すことができる。様々な実施形態では、訓練データは、訓練個体(例えば、ある期間内にがんが発生するか、又は発生しないことが知られている個体)から取得された訓練画像から抽出された特徴を含む。様々な実施形態では、訓練データは、データセットのスプリットから取得することができる。例えば、データセットは、50:50訓練:試験データセット分割を受けることができる。いくつかの実施形態では、データセットは、60:40訓練:試験データセット分割を受けることができる。いくつかの実施形態では、データセットは、80:20訓練:試験データセット分割を受けることができる。
【0143】
様々な実施形態では、インピュテーションモデルを訓練するために使用される訓練データは、訓練個体に期間内にがんが発生したこと(以下、「陽性」若しくは「+」とも呼ばれる)、又は訓練個体に期間内にがんが発生しなかったかどうか(以下、「陰性」若しくは「-」とも呼ばれる)を示す参照グランドトゥルースを含む。様々な実施形態では、訓練データにおける参照グランドトゥルースは、「1」又は「0」などのバイナリ値である。例えば、期間内にがんが発生した訓練個体は、訓練データにおいて「1」の値で識別することができるが、期間内にがんが発生しなかった訓練個体は、訓練データにおいて「0」の値で識別することができる。様々な実施形態では、リスク訓練モジュール155は、リスク予測モデルが入力(例えば、訓練画像の抽出された特徴)に基づいて、結果(例えば、期間内のがんの存在又は不存在)をよりよく予測することができるように、損失関数を最小限にするために訓練データを使用してリスク予測モデルを訓練する。様々な実施形態では、損失関数は、最小絶対収縮及び選択演算子(least absolute shrinkage and selection operator、LASSO)回帰、リッジ回帰、又はElasticNet回帰のいずれかについて構築される。様々な実施形態では、リスク予測モデルは、ランダムフォレストモデルであり、特徴分割のためのジニ不純度又はエントロピーメトリックのうちの1つを最小限に抑えるように訓練され、それによって、リスク予測モデルががんリスクをより正確に予測することを可能にする。
【0144】
様々な実施形態では、訓練データは、公的に入手可能なデータベースから取得及び/又は導出することができる。例えば、訓練データは、国立肺スクリーニング試験(NLST)から取得及び/又は導出することができる。いくつかの実施形態では、訓練データは、例えば、複数の訓練個体から画像をキャプチャすることによって、公的に利用可能なデータベースとは独立して取得及び収集することができる。そのような訓練データは、カスタムデータセットであることができる。
【0145】
様々な実施形態では、リスク予測モデルは、訓練個体の特定のコホートを使用して訓練される。様々な実施形態では、リスク予測モデルは、肺結節を有しない訓練個体のコホートを使用して訓練される。様々な実施形態では、リスク予測モデルは、肺結節を有する訓練個体のコホートを使用して訓練される。様々な実施形態では、リスク予測モデルは、Lung-RADS 1に以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 1予測モデルである。様々な実施形態では、リスク予測モデルは、Lung-RADS 1~2のうちのいずれか1つに以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 2予測モデルである。様々な実施形態では、リスク予測モデルは、Lung-RADS 1~3のうちのいずれか1つに以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 1~3予測モデルである。様々な実施形態では、リスク予測モデルは、Lung-RADS 1~4Aのうちのいずれか1つに以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 1~4A予測モデルである。様々な実施形態では、リスク予測モデルは、Lung-RADS 1~4Bのうちのいずれか1つに以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 1~4B予測モデルである。様々な実施形態では、リスク予測モデルは、Lung-RADS 1~4Xのいずれか1つに以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 1~4X予測モデルである。様々な実施形態では、リスク予測モデルは、Lung-RADS 2~4Xのいずれか1つに以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 2~4X予測モデルである。様々な実施形態では、リスク予測モデルは、Lung-RADS 2~4Xのいずれか1つに以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 2~4X予測モデルである。様々な実施形態では、リスク予測モデルは、Lung-RADS 3~4Xのいずれか1つに以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 3~4X予測モデルである。様々な実施形態では、リスク予測モデルは、Lung-RADS 3~4Xのいずれか1つに以前に分類された訓練個体のコホートを使用して訓練されるLung-RADS 3~4X予測モデルである。
【0146】
様々な実施形態において、Lung-RADS 1予測モデル、Lung-RADS 1~2予測モデル、Lung-RADS 1~3予測モデル、Lung-RADS 1~4A予測モデル、Lung-RADS 1~4B予測モデル、又はLung-RADS 1~4X予測モデルのうちのいずれかの各々について、リスク予測モデルは、訓練個体の訓練コホートを使用して訓練され、訓練コホートにおける訓練個体の大部分(例えば、50%超)はLung-RADS 1として以前に分類されていた。様々な実施形態において、Lung-RADS 1予測モデル、Lung-RADS 1~2予測モデル、Lung-RADS 1~3予測モデル、Lung-RADS 1~4A予測モデル、Lung-RADS 1~4B予測モデル、又はLung-RADS 1~4X予測モデルのうちのいずれかの各々について、リスク予測モデルは、訓練個体の訓練コホートを使用して訓練され、訓練コホートにおける訓練個体の大部分(例えば、50%超)はLung-RADS 2として以前に分類されていた。様々な実施形態において、Lung-RADS 1予測モデル、Lung-RADS 1~2予測モデル、Lung-RADS 1~3予測モデル、Lung-RADS 1~4A予測モデル、Lung-RADS 1~4B予測モデル、又はLung-RADS 1~4X予測モデルのうちのいずれかの各々について、リスク予測モデルは、訓練個体の訓練コホートを使用して訓練され、訓練コホートにおける訓練個体の大部分(例えば、50%超)はLung-RADS 1又はLung-RADS 2として以前に分類されていた。表1に示すように、個体の約90%は、Lung-RADS 1又はLung-RADS 2に入る可能性が高い。したがって、そのような個体を使用して、リスク予測モデルのいずれかを訓練することができる。
【0147】
様々な実施形態では、リスク予測モデルは、少なくとも0ヶ月、少なくとも1ヶ月、少なくとも2ヶ月、少なくとも3ヶ月、少なくとも4ヶ月、少なくとも5ヶ月、少なくとも6ヶ月、少なくとも7ヶ月、少なくとも8ヶ月、少なくとも9ヶ月、少なくとも10ヶ月、少なくとも11ヶ月、1年、少なくとも2年、少なくとも3年、少なくとも4年、少なくとも5年、少なくとも6年、少なくとも7年、少なくとも8年、少なくとも9年、少なくとも10年、少なくとも11年、少なくとも12年、少なくとも13年、少なくとも14年、少なくとも15年、少なくとも16年、少なくとも17年、少なくとも18年、少なくとも19年、又は少なくとも20年以内などの所定の時間「M」以内のがんのリスクを予測するように訓練された「M」年予測モデルである。したがって、インピュテーションモデルを訓練するために使用される訓練データは、訓練個体に「M」年以内にがんが発生したことを示す参照グランドトゥルースを含む。
【0148】
様々な実施形態では、リスク予測モデルは、1)訓練個体の特定のコホートを使用して訓練され、2)所定の時間「M」以内のがんのリスクを予測するように訓練される。上記のように、訓練個体のコホートは、Lung-RADSスコアの範囲(例えば、Lung-RADS X~Y)内に前もって分類され得る。したがって、リスク予測モデルは、1)Lung-RADS X~Yに分類された訓練個体のコホートを使用して訓練され、2)「M」年でがんのリスクを予測するように訓練された、M年、Lung-RADS X~Y予測モデルであり得る。
【0149】
様々な実施形態では、リスク予測モデルは、非結節特異的特徴及び結節特異的特徴の両方を含む。したがって、リスク予測モデルを訓練する際に、リスク予測モデルは、訓練画像から抽出された非結節特異的特徴及び結節特異的特徴の両方を分析し、損失関数を最小限に抑える予測を生成しようと試みる。一般に、リスク予測モデルの特徴は、各特徴が、リスク予測モデルによって生成された予測にどの程度影響を与えるかを反映する重要度値を有する。例えば、特徴のより高い重要度値は、特徴が、より低い重要度値を有する異なる特徴と比較して、リスク予測モデルによって生成される予測により大きく影響を与えることを示す。
【0150】
様々な実施形態では、リスク予測モデルの結節特異的特徴は、非結節特異的特徴と比較して、がんのリスクの予測により大きく影響を及ぼす。例えば、リスク予測モデルの結節特異的特徴は、リスク予測モデルの非結節特異的特徴よりも高い特徴重要度値を有する。概して、結節特異的特徴は、より短い期間(例えば、3年又は5年とは対照的に1年)以内のがんのリスクを予測するように訓練されたリスク予測モデルのためのより高い重要度値を有する。追加的に、結節特異的特徴は、より高いリスクの肺がん患者(例えば、Lung-RADS 4A又はLung-RADS 4Bに分類される患者)を使用して訓練されるリスク予測モデルのためのより高い重要度値を有する。
【0151】
様々な実施形態では、リスク予測モデルの最も高い重要度値を有する特徴は、結節特異的特徴である。様々な実施形態では、リスク予測モデルの最も高い重要度値を有する上位2つの特徴は、結節特異的特徴である。様々な実施形態では、リスク予測モデルの最も高い重要度値を有する上位3つの特徴は、結節特異的特徴である。様々な実施形態では、リスク予測モデルの最も高い重要度値を有する上位4つの特徴は、結節特異的特徴である。様々な実施形態では、リスク予測モデルの最も高い重要度値を有する上位5つ、6つ、7つ、8つ、9つ、又は10の特徴は、結節特異的特徴である。
【0152】
様々な実施形態では、リスク予測モデルの非結節特異的特徴は、結節特異的特徴と比較して、がんのリスクの予測により大きく影響を及ぼす。例えば、リスク予測モデルの非結節特異的特徴は、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有する。概して、非結節特異的特徴は、より長い期間(例えば、1年とは対照的に3年又は5年)以内のがんのリスクを予測するように訓練されたリスク予測モデルのためのより高い重要性値を有する。追加的に、非結節特異的特徴は、肺がんのリスクが低い患者(例えば、Lung-RADS 2若しくは3として分類される患者)又はまだ結節を有しない患者(例えば、Lung-RADS 1)を使用して訓練されるリスク予測モデルのためのより高い重要性値を有する。
【0153】
様々な実施形態では、リスク予測モデルの最も高い重要度値を有する特徴は、非結節特異的特徴である。様々な実施形態では、リスク予測モデルの最も高い重要度値を有する上位2つの特徴は、非結節特異的特徴である。様々な実施形態では、リスク予測モデルの最も高い重要度値を有する上位3つの特徴は、非結節特異的特徴である。様々な実施形態では、リスク予測モデルの最も高い重要度値を有する上位4つの特徴は、非結節特異的特徴である。様々な実施形態では、リスク予測モデルの最も高い重要度値を有する上位5つ、6つ、7つ、8つ、9つ、又は10の特徴は、非結節特異的特徴である。
【0154】
様々な実施形態において、リスク予測モデルは、異なる特徴を別個に分析する異なるサブモデルを含む。例えば、
図3Aを参照して上述したように、リスク予測モデルは、非結節特異的特徴及び/又は縦方向非結節特異的特徴を分析する第1のサブモデル(例えば、非結節モデル)を含むことができる。リスク予測モデルは、結節特異的特徴及び/又は縦方向結節特異的特徴を分析する第2のサブモデル(例えば、結節モデル)を含むことができる。最初に第1のサブモデル(例えば、非結節モデル)を参照すると、様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの1つ又は2つ以上は、縦方向非結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの2つ又は3つ以上は、縦方向非結節特異的特徴である。様々な実施形態において、最も高い特徴重要度値を有する上位10の特徴のうちの3つ又は4つ以上、4つ又は5つ以上、5つ又は6つ以上、6つ又は7つ以上、7つ又は8つ以上、8つ又は9つ以上、9つ又は10以上の特徴は、縦方向非結節特異的特徴である。特定の実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの4つは、縦方向非結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの5つは、縦方向非結節特異的特徴である。
【0155】
様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの1つ又は2つ以上は、非結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴の2つ又は3つ以上は、非結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの3つ又は4つ以上、4つ又は5つ以上、5つ又は6つ以上、6つ又は7つ以上、7つ又は8つ以上、8つ又は9つ以上、9つ又は10以上の特徴は、非結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの4つは、非結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの5つは、非結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの6つは、非結節特異的特徴である。
【0156】
次に、第2のサブモデル(例えば、結節モデル)を参照すると、様々な実施形態では、最も高い特徴重要度値を伴う上位10の特徴のうちの1つ又は2つ以上は、縦方向結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴の2つ又は3つ以上は、縦方向結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの3つ又は4つ以上、4つ又は5つ以上、5つ又は6つ以上、6つ又は7つ以上、7つ又は8つ以上、8つ又は9つ以上、9つ又は10以上の特徴は、縦方向結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの4つは、縦方向結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの5つは、縦方向結節特異的特徴である。
【0157】
様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの1つ又は2つ以上は、結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの2つ又は3つ以上は、結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの3つ又は4つ以上、4つ又は5つ以上、5つ又は6つ以上、6つ又は7つ以上、7つ又は8つ以上、8つ又は9つ以上、9つ又は10以上の特徴は、結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの4つは、結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの5つは、結節特異的特徴である。様々な実施形態では、最も高い特徴重要度値を有する上位10の特徴のうちの6つは、結節特異的特徴である。
【0158】
様々な実施形態では、結節特異的特徴と比較して、がんの将来のリスクの予測により大きく影響を及ぼす非結節特異的特徴を含むリスク予測モデルは、M年リスク予測モデルであり(例えば、M年以内にがんが発生するリスクを予測する)、Mは1年に等しくない。様々な実施形態では、Mは2年以上である。例えば、Mは、1.5年、2年、2.5年、3年、3.5年、4年、4.5年、5年、5.5年、6年、6.5年、7年、7.5年、8年、8.5年、9年、9.5年、10年、10.5年、11年、11.5年、12年、12.5年、13年、13.5年、14年、14.5年、15年、15.5年、16年、16.5年、17年、17.5年、18年、18.5年、19年、19.5年、又は20年であることができる。特定の例として、リスク予測モデルは、3年以内にがんが発生するリスクを予測する3年リスク予測モデルである。別の特定の例として、リスク予測モデルは、5年以内にがんが発生するリスクを予測する5年リスク予測モデルである。
【0159】
様々な実施形態では、結節特異的特徴と比較して、がんのリスクの予測により大きく影響を及ぼす非結節特異的特徴を含むリスク予測モデルは、肺結節を含まない訓練画像で訓練されたリスク予測モデルである。様々な実施形態では、そのようなリスク予測モデルは、Lung-RADS 1に分類された個体から導出された訓練画像で訓練することができる。様々な実施形態では、そのようなリスク予測モデルは、Lung-RADS 2に分類された個体から導出された訓練画像で訓練することができる。様々な実施形態では、そのようなリスク予測モデルは、Lung-RADS 3に分類された個体から導出された訓練画像で訓練することができる。様々な実施形態では、そのようなリスク予測モデルは、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、又はそれらのいずれかの組み合わせに分類された個体から導出された訓練画像で訓練することができる。様々な実施形態では、そのようなリスク予測モデルは、Lung-RADS 1予測モデル、Lung-RADS 1~2予測モデル、又はLung-RADS 1~3予測モデルである。
【0160】
特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、1年、Lung-RADS 1~4B予測モデルである。特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、3年、Lung-RADS 1~4B予測モデルである。特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、5年、Lung-RADS 1~4B予測モデルである。
【0161】
特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、5年、Lung-RADS 1~4A予測モデルである。特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、1年、Lung-RADS 1~3予測モデルである。特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、3年、Lung-RADS 1~3予測モデルである。特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、5年、Lung-RADS 1~3予測モデルである。
【0162】
特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、1年、Lung-RADS 1~2予測モデルである。特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、3年、Lung-RADS 1~2予測モデルである。特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、5年、Lung-RADS 1~2予測モデルである。
【0163】
特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、1年、Lung-RADS 1予測モデルである。特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、3年、Lung-RADS 1予測モデルである。特定の実施形態では、そのようなリスク予測モデル(例えば、リスク予測モデルの非結節特異的特徴が、リスク予測モデルの結節特異的特徴よりも高い特徴重要度値を有するリスク予測モデル)は、5年、Lung-RADS 1予測モデルである。
【0164】
様々な実施形態では、訓練されたリスク予測モデルは、訓練されたパラメータのセットを含み、リスク予測モデルがデプロイされるときに、この訓練されたパラメータのセットが使用され、画像の非結節特異的特徴及び結節特異的特徴の値を修正して、対象のがんのリスクの予測を生成するようになっている。したがって、訓練されたリスク予測モデルの訓練されたパラメータのセットは、訓練段階中に設定される。例えば、訓練されたパラメータのセットは、非結節特異的特徴が、結節特異的特徴よりもリスク予測に大きく影響を与えるように設定される。別の例として、訓練されたパラメータのセットは、結節特異的特徴が非結節特異的特徴よりもリスク予測に大きく影響を与えるように設定される。
【0165】
例えば、リスク予測モデルがニューラルネットワークである場合、非結節特異的特徴に対応するニューラルネットワークの1つ又は2つ以上のノードは、結節特異的特徴に対応するニューラルネットワークの1つ又は2つ以上のノードよりも大きな重み(例えば、パラメータ)を割り当てられる。別の例として、リスク予測モデルが、結節特異的特徴よりも大きく非結節特異的特徴に重み付けするランダムフォレストモデルである場合。
【0166】
様々な実施形態では、リスク予測モデルはまた、そのがんの場所を予測するように訓練され得る。様々な実施形態では、訓練画像は、異なる領域に分割され、したがって、リスク予測モデルの訓練は、異なる領域に従って実行される。例示的な異なる領域は、体積で肺の上部3分の1、中央3分の1、及び下部3分の1、又は肺の別個の葉を含むことができる。肺は、任意の数の構成を有する任意の数の領域に分割され得ることが当業者には理解されるであろう。リスク予測モデルががんの場所を予測することを可能にすることは、吸入及び気管支鏡投与された薬物及びデバイスを使用する、領域診断評価及び治療的介入などの介入の選択を誘導することができる。
【0167】
様々な実施形態では、本明細書に開示されるリスク予測モデルは、性能メトリックを達成する。例示的な性能メトリックは、受信機動作曲線の曲線下面積(AUC)、正の予測値、及び/又は負の予測値を含む。様々な実施形態では、本明細書に開示されるリスク予測モデルは、少なくとも0.5のAUC値を示す。様々な実施形態では、本明細書に開示されるリスク予測モデルは、少なくとも0.6のAUC値を示す。様々な実施形態では、本明細書に開示されるリスク予測モデルは、少なくとも0.7のAUC値を示す。様々な実施形態では、本明細書に開示されるリスク予測モデルは、少なくとも0.8のAUC値を示す。様々な実施形態では、本明細書に開示されるリスク予測モデルは、少なくとも0.9のAUC値を示す。様々な実施形態では、本明細書に開示されるリスク予測モデルは、少なくとも0.95のAUC値を示す。様々な実施形態では、本明細書に開示されるリスク予測モデルは、少なくとも0.99のAUC値を示す。様々な実施形態では、本明細書に開示されるリスク予測モデルは、少なくとも0.51、少なくとも0.52、少なくとも0.53、少なくとも0.54、少なくとも0.55、少なくとも0.56、少なくとも0.57、少なくとも0.58、少なくとも0.59、少なくとも0.60、少なくとも0.61、少なくとも0.62、少なくとも0.63、少なくとも0.64、少なくとも0.65、少なくとも0.66、少なくとも0.67、少なくとも0.68、少なくとも0.69、少なくとも0.70、少なくとも0.71、少なくとも0.72、少なくとも0.73、少なくとも0.74、少なくとも0.75、少なくとも0.76、少なくとも0.77、少なくとも0.78、少なくとも0.79、少なくとも0.80、少なくとも0.81、少なくとも0.82、少なくとも0.83、少なくとも0.84、少なくとも0.85、少なくとも0.86、少なくとも0.87、少なくとも0.88、少なくとも0.89、少なくとも0.90、少なくとも0.91、少なくとも0.92、少なくとも0.93、少なくとも0.94、少なくとも0.95、少なくとも0.96、少なくとも0.97、少なくとも0.98、少なくとも0.99のAUC値を示す。
【0168】
VII.がんのリスクを予測するための例示的な方法
図4Aは、一実施形態による、患者のエンリッチメントなどの用途のために対象のがんのリスクを判定するための例示的なフロープロセスである。ステップ405は、複数の対象の肺がんリスクを予測することを含む。ステップ405は、複数の対象において異なる対象に対して繰り返し実行することができるステップ410、420、430、及び440を含む。
【0169】
ステップ410で、画像が対象から捕捉される。様々な実施形態では、画像は、対象から捕捉されたCTスキャン(例えば、全身CTスキャン、肺を含むCTスキャン、胸のCTスキャン、又は肺CTスキャン)である。
【0170】
ステップ420で、特徴が画像から抽出される。様々な実施形態では、特徴は、非結節特異的特徴及び結節特異的特徴のうちの一方又は両方を含む。
【0171】
ステップ430は、抽出された特徴のうちの1つ又は2つ以上に基づいて、対象がリスク予測のための候補対象であるかどうかを判定することを含む任意のステップである。様々な実施形態では、ステップ430は、対象が候補対象であると判定するために、結節特異的特徴を分析することを含む。例えば、ステップ430は、対象が肺結節を有していないか、又は肺がんを有しておらず、したがって、がん分析のリスクを受けるのに適格であると判定するために、結節特異的特徴を分析することを含むことができる。
【0172】
ステップ440は、リスク予測モデルを適用して、得られた画像の抽出された特徴を分析してがんリスクを予測することを含む。様々な実施形態では、リスク予測モデルは、非結節特異的特徴及び結節特異的特徴の両方を分析する。
図4Aに示すように、リスク予測モデルは、2つの方法のうちの1つで結節特徴及び非結節特徴を分析することができる。最初に、ステップ444に示すように、リスク予測モデルは、結節特徴及び非結節特徴を別個に分析することができる(例えば、
図3Aを参照して上述したように)。第二に、ステップ448に示すように、リスク予測モデルは、結節特徴及び非結節特徴を一緒に分析することができる(例えば、
図3Bを参照して上述したように)。
【0173】
ステップ450は、予測されたがんリスクを使用して、複数の対象にわたってエンリッチすることを含む。ここで、ある期間内にがんが発生すると予測される対象は、これら対象の予測されるがんリスクによって示されるように、臨床試験に登録するための1つ又は2つ以上の患者コホートに含まれることができる。まとめると、これにより、臨床試験登録する個体の数の削減が可能になる。
【0174】
ここで、第2の実施形態による、対象のがんのリスク(例えば、既存の又は高頻度に見られるがんのリスク)を判定するための例示的なフロープロセスである
図4Bが参照される。ステップ460は、複数の対象のがんリスクを予測することを含む。ステップ460は、複数の対象において異なる対象に対して繰り返し実行することができるステップ465、470、475、及び480を含む。
【0175】
ステップ465は、対象から捕捉された画像を取得することを含む。様々な実施形態では、画像は、対象から捕捉されたCTスキャン(例えば、全身CTスキャン、肺を含むCTスキャン、胸のCTスキャン、又は肺CTスキャン)である。画像は、対象内に存在する1つ又は2つ以上の結節を含むことができる。ここで、1つ又は2つ以上の結節は、がん(例えば、肺がん)を示すがん性結節であることが疑われ得る。
【0176】
ステップ470は、1つ又は2つ以上の結節から特徴を抽出することを含む。本明細書で説明するように、抽出された特徴は、結節特異的特徴を含むことができる。ここで、特徴の個々のセットは、各個々の結節について抽出され得る。
【0177】
ステップ475は、1つ又は2つ以上のリスク予測モデルを適用して、抽出された特徴を分析することを含む。1つ又は2つ以上のリスク予測モデルは、1つ又は2つ以上の結節をがん性又は非がん性として分類するために有益な予測を生成する。
【0178】
ステップ480は、1つ又は2つ以上の結節の分類に基づいて、対象における既存のがんの存在又は不在を判定することを含む。例えば、少なくとも結節ががん性として分類される場合、ステップ480は、対象が既存のがんの存在を有すると判定することを含む。様々な実施形態では、ステップ480は、少なくとも2つの結節ががん性として分類される場合、対象が既存のがんの存在を有すると判定することを含む。様々な実施形態では、ステップ480は、少なくとも3つ、少なくとも4つ、又は少なくとも5つの結節ががん性として分類される場合、対象が既存のがんの存在を有すると判定することを含む。
【0179】
様々な実施形態では、ステップ480は、1つ未満の結節ががん性として分類される場合、対象が既存のがんの不在を有すると判定することを含む。様々な実施形態では、ステップ480は、0の結節ががん性として分類される場合、対象が既存のがんの不在を有すると判定することを含む。
【0180】
ステップ490は、予測されたがんリスクを使用して、複数の対象にわたってエンリッチすることを含む。例えば、既存のがんの存在を有すると予測される対象は、臨床試験に登録するために1つ又は2つ以上の患者コホートに含まれることができる。まとめると、これにより、臨床試験登録する個体の数の削減が可能になる。
【0181】
VIII.がん
本明細書に記載の方法は、がんのリスクを予測するためのリスク予測モデルを実装することを含む。様々な実施形態において、対象におけるがんは、リンパ腫、B細胞リンパ腫、T細胞リンパ腫、真菌性真菌症、ホジキン病、骨髄性白血病、膀胱がん、脳腫瘍、神経系のがん、頭頸部がん、頭頸部扁平上皮がん、腎臓がん、肺がん、神経芽細胞腫/神経膠芽細胞腫、卵巣がん、膵臓がん、前立腺がん、皮膚がん、肝がん、メラノーマ、口、喉、喉頭、肺の扁平上皮がん、結腸がん、子宮頸がん(cervical cancer)、子宮頸がん(cervical carcinoma)、乳がん、及び上皮がん、腎がん、泌尿生殖器がん、肺がん、食道がん、胃がん、甲状腺がん、頭頸部がん、大腸がん、造血がん、精巣がん、結腸及び/又は直腸がん、子宮がん、又は前立腺がんのうちの1つ又は2つ以上を含むことができる。いくつかの実施形態では、対象におけるがんは、膀胱がん、乳がん、結腸がん、腎臓がん、肺がん、メラノーマ、卵巣がん、膵臓がん、前立腺がん、直腸がん、胃がん、甲状腺がん、又は子宮がんのうちのいずれか1つを含む、転移性がんであり得る。特定の実施形態では、がんは肺がんである。特定の実施形態では、がんは、小細胞肺がん、非小細胞肺がん、非小細胞がん、腺がん、扁平上皮がん、大細胞がん、小細胞がん、複合小細胞がん、神経内分泌腫瘍、肺肉腫、肺リンパ腫、気管支がんのうちのいずれか1つを含む、肺がんのタイプである。
【0182】
様々な実施形態では、本明細書に記載のリスク予測モデルは、肺がんなどのがんの存在のリスクを予測する。言い換えれば、リスク予測モデルは、肺がんなどのがんの存在又は不存在のリスクを予測する。様々な実施形態では、本明細書に記載のリスク予測モデルは、小細胞肺がん、非小細胞肺がん、非小細胞がん、腺がん、扁平上皮がん、大細胞がん、小細胞がん、複合小細胞がん、神経内分泌腫瘍、肺肉腫、肺リンパ腫、気管支がんのいずれか1つを含む、肺がんの亜型のリスクを予測する。言い換えれば、リスク予測モデルは、期間(例えば、1、3、又は5年)内に肺がんの特定の亜型を発生する可能性が高いとして対象を分類する。特定の実施形態では、リスク予測モデルは、非小細胞肺がん又は小細胞肺がんのリスクを予測する。
【0183】
IX.介入
本明細書に記載の実施形態は、がんのリスクを予測するためのリスク予測モデルを実装することを含む。様々な実施形態では、介入は、がん予測のリスクに基づいて対象に提供される。様々な実施形態では、介入は、診断の適用、予防治療剤の適用、又は後続の行動のうちのいずれか1つであることができる。例示的な後続の行動は、対象にがんが発生するかどうかを確認するための対象の後続の試験を含むことができる。後続の試験は、後続の生検(例えば、がん生検又はリンパ節生検)又は後続の画像スキャン(例えば、CTスキャン、PETスキャン、MRIスキャン、超音波撮像、又はX線撮像)のいずれかを含むことができる。様々な実施形態において、対象の後続の試験は、がんのリスクを予測した後、次のスケジュールされた訪問、又は所定の時間(例えば、0ヶ月、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、12ヶ月、18ヶ月、又は24ヶ月)の間であることができる。様々な実施形態では、追加の後続の行動は、腫瘍切除、気管支鏡診断、治療薬の選択及び/若しくは投与、医薬組成物の選択/投与、又はそれらの任意の組み合わせなどの、対象に発生したがんを治療するための後続の行動を含むことができる。
【0184】
様々な実施形態では、治療薬は、がんの予測されたリスクに基づいて選択及び/又は対象に投与することができる。選択された治療薬は、肺がんなどのがんの発生を遅延させるか又は予防する可能性が高い。例示的な治療薬は、化学療法、エネルギー療法(例えば、外部ビーム、マイクロ波、高周波アブレーション、近接照射療法、エレクトロポレーション、クライオアブレーション、光熱アブレーション、レーザー療法、光動的療法、電気焼灼、化学実施形態、高強度集束超音波、低強度集束超音波)、抗原特異的モノクローナル抗体、抗炎症薬、腫瘍溶解性ウイルス療法、又は免疫療法を含む。様々な実施形態では、選択された治療薬はエネルギー療法であり、適用されるエネルギーの量(例えば、用量及び持続時間)は、所望の治療効果を達成するように調整することができる。様々な実施形態において、治療薬は、小分子又は生物学的製剤、例えば、サイトカイン、抗体、可溶性サイトカイン受容体、抗センスオリゴヌクレオチド、siRNAなどを含む。そのような生物学的薬剤は、例えば、当該技術分野で既知の融合タンパク質、PEG化誘導体、コレステロール共役誘導体などを含むことができる、生物学的薬剤のムチン及び誘導体を包含する。サイトカイン及びサイトカイン受容体のアンタゴニスト、例えば、トラップ及びモノクローナル拮抗薬も含まれる。本明細書に記載の活性剤のバイオシミラー医薬品又は活性剤と生物学的に同等な薬物も含まれる。
【0185】
肺がんの治療薬は、ドセタキセル、シスプラチン、カルボプラチン、ゲムシタビン、ナブパクリタキセル、パクリタキセル、ペメトレキセド、ゲフィチニブ、エルロチニブ、ブリチニブ(Alunbrig(登録商標))、カプマチニブ(Tabrecta(登録商標))、セルパカチニブ(Retevmo(登録商標))、エヌトレクチニブ(Rozlytrek(登録商標))、ロルラチニブ(Lorbrena(登録商標))、ラロトレクチニブ(Vitrakvi(登録商標))、ダコミチニブ(Vizimpro(登録商標))、及びビノレルビンなどの化学療法薬を含むことができる。肺がんの治療薬は、デュルバルマブ(Imfinzi(登録商標))、ニボルマブ(Opdivo(登録商標))、ペンブロリズマブ(Keytruda(登録商標))、アテゾリズマブ(Tecentriq(登録商標))、カナキヌマブ、及びラムシルマブなどの抗体療法を含むことができる。
【0186】
様々な実施形態では、記載される治療薬のうちの1つ又は2つ以上は、対象を治療するための併用療法として組み合わせることができる。
【0187】
様々な実施形態では、医薬組成物は、転移性がんの対象のリスクレベルに基づいて選択及び/又は投与することができ、選択された治療薬は、がんに対する有効性を示す可能性が高い。個体に投与される医薬組成物は、上記の治療薬などの活性剤を含む。有効成分は、治療有効量、すなわち、それによって媒介される疾患又は医学的状態を治療するために投与されるときに十分な量で存在する。組成物はまた、有効成分の送達及び安定性を高めるために、送達及び有効性を高めるための様々な他の薬剤を含むことができる。したがって、例えば、組成物はまた、所望の製剤に応じて、薬学的に許容される非毒性担体又は希釈剤を含み得、これは、動物又はヒト投与のための医薬組成物を製剤化するために一般的に使用されるビヒクルとして定義される。希釈剤は、組み合わせの生物学的活性に影響を与えないように選択される。そのような希釈剤の例は、蒸留水、緩衝水、生理食塩水、PBS、リンゲル液、デキストロース溶液、及びハンクス溶液である。加えて、医薬組成物又は製剤は、他の担体、アジュバント、又は非毒性の非治療的、非免疫原性安定剤、賦形剤などを含むことができる。組成物はまた、pH調整剤及び緩衝剤、毒性調整剤、湿潤剤、及び洗剤などの生理学的条件を近似するための追加の物質を含むことができる。組成物はまた、酸化防止剤などの様々な安定化剤のいずれかを含むことができる。
【0188】
本明細書に記載の薬学的組成物又は治療薬は、様々な異なる方法で投与することができる。例は、経口、鼻腔内、モジュラ内、病変内、直腸、局所、腹腔内、静脈内、筋肉内、皮下、皮下、経皮、髄腔内、気管支内、経胸腔、又は頭蓋内方法を介して薬学的に許容される担体を含有する組成物を投与することを含む。
【0189】
様々な実施形態では、臨床的対応は、リスク予測モデルを実装することによって、対象について生成されたがんの予測されたリスクに基づいて対象に提供することができる。様々な実施形態では、臨床的対応は、対象の行動を修正するためのカウンセリングを提供する(例えば、リスクを減らすために禁煙について患者にカウンセリングする)、悪性形質転換を遅延させる/予防するか、腫瘍の成長を遅らせるか、若しくは更には病気の広がり(転移)を防ぎ得る吸入/局所、静脈内若しくは経腸(経口)治療薬の開始、ポリープの結腸内視鏡検査で行われるのと同様のリスクの適応スクリーニングスケジュールを確立する(例えば、肺がんのリスクが高いと予測される個体は、より頻繁なフォローアップと画像診断を受ける必要がある)、又は肺がんの予測されるリスクを確認するために追加のリスク予測試験を実行するか若しくは実行するようにスケジューリングする(例えば、肺がんのリスクが高いと思われるヒトは、リスクを確認するか、若しくはそのヒトに発生するリスクが最も高いがんの種類を絞り込むために、追加の試験を受けることもあることを含むことができる。様々な実施形態では、追加のリスク予測試験は、血液ベースのバイオマーカー(肺がんの既知のリスクである非特異的炎症を探すため)、代謝性/プロテオミクス/遺伝子発現/遺伝子配列判定を含むことができる。このヒトはまた、気道における遺伝子発現の変化を見るために、組織(経鼻上皮、気管支上皮など)の追加のサンプリングを有することができる。
【0190】
X.コンピュータ実装
がんのリスクを予測するためのリスク予測モデルを実装する方法を含む方法は、いくつかの実施形態では、1つ又は2つ以上のコンピュータで実行される。
【0191】
例えば、リスク予測モデルの構築及びデプロイは、ハードウェア若しくはソフトウェア、又は両方の組み合わせで実装することができる。一実施形態では、機械可読記憶媒体が提供され、媒体は、データを使用するための命令でプログラムされた機械を使用するときに、リスク予測モデルの訓練又はデプロイを実行することができ、かつ/又はデータセット若しくは結果のいずれか(例えば、対象についてのがん予測のリスク)を表示することができる、機械可読データで符号化されたデータ記憶材料を含む。本発明は、プロセッサ、データ記憶システム(揮発性及び不揮発性メモリ及び/又は記憶要素を含む)、グラフィックスアダプタ、ポインティングデバイス、ネットワークアダプタ、少なくとも1つの入力デバイス、及び少なくとも1つの出力デバイスを含む、プログラム可能なコンピュータ上で実行されるコンピュータプログラムで実施することができる。ディスプレイは、グラフィックスアダプタに結合される。プログラムコードを入力データに適用して、上記の機能を実行し、出力情報を生成する。出力情報は、既知の方法で、1つ又は2つ以上の出力デバイスに適用される。コンピュータは、例えば、従来の設計のパーソナルコンピュータ、マイクロコンピュータ、又はワークステーションであることができる。
【0192】
各プログラムは、コンピュータシステムと通信するために、高レベル手続き又はオブジェクト指向プログラミング言語で実行することができる。しかしながら、必要に応じて、プログラムはアセンブリ言語又は機械言語で実行することができる。いずれの場合も、言語は、コンパイルされた言語又は解釈された言語であることができる。そのような各コンピュータプログラムは、記憶媒体又はデバイスがコンピュータによって読み取られて本明細書に記載の手順を実行するときにコンピュータを構成及び動作させるために、汎用又は専用のプログラム可能コンピュータによって読み取り可能な記憶媒体又はデバイス(例えば、ROM又は磁気ディスケット)に記憶されることが好ましい。システムはまた、コンピュータプログラムで構成されたコンピュータ可読記憶媒体として実装されると考えられ得、そのように構成された記憶媒体は、コンピュータが、本明細書に記載の機能を実行するために特定の事前定義された様式で動作するようにする。
【0193】
シグネチャパターン及びそのデータベースは、それらの使用を容易にするために、様々な媒体に提供することができる。「媒体」とは、シグネチャパターン情報を含む製品を指す。データベースは、コンピュータ可読媒体、例えば、コンピュータが読み取る及び直接アクセスすることができる任意の媒体に記録することができる。そのような媒体には、フロッピーディスク、ハードディスク記憶媒体、及び磁気テープなどの磁気貯蔵媒体、CD-ROMなどの光学媒体、RAM及びROMなどの電気記憶媒体、並びに磁気/光学記憶媒体などのこれらのカテゴリのハイブリッドが含まれるが、これらに限定されない。当業者は、現在知られているコンピュータ可読媒体のいずれかを使用して、本データベース情報の記録を含む製品を作製することができる方法を容易に認識することができる。「記録された」は、当該技術分野で知られているような任意のそのような方法を使用して、コンピュータ可読媒体に情報を記憶するためのプロセスを指す。記憶された情報にアクセスするために使用される手段に基づいて、任意の便利なデータ記憶構造を選択することができる。様々なデータプロセッサプログラム及びフォーマットを、記憶、例えば、例えば、ワードプロセシングテキストファイル、データベース形式、などのために使用することができる。
【0194】
いくつかの実施形態では、リスク予測モデルを実装することによって、がんのリスクを予測するための方法を含む方法は、分散コンピューティングシステム環境内(例えば、クラウドコンピューティング環境内)の1つ又は2つ以上のコンピュータ上で実行される。本明細書では、「クラウドコンピューティング」は、構成可能なコンピューティングリソースの共有セットへのオンデマンドネットワークアクセスを可能にするためのモデルとして定義される。クラウドコンピューティングを用いて、構成可能なコンピューティングリソースの共有セットへのオンデマンドアクセスを提供することができる。構成可能なコンピューティングリソースの共有セットは、仮想化を介して迅速にプロビジョニングされ、低管理努力又はサービスプロバイダ相互作用でリリースされ、それに応じてスケーリングすることができる。クラウドコンピューティングモデルは、例えば、オンデマンドセルフサービス、ブロードネットワークアクセス、リソースプール、速やかな拡張性、測定サービスなどの様々な特性で構成することができる。クラウドコンピューティングモデルはまた、例えば、サービスとしてソフトウェア(「Software as a Service、SaaS」)、サービスとしてプラットフォーム(「Platform as a Service、PaaS」)、及びサービスとしてのインフラストラクチャ(「Infrastructure as a Service、IaaS」)などの様々なサービスモデルを露出させることができる。クラウドコンピューティングモデルは、プライベートクラウド、コミュニティクラウド、パブリッククラウド、ハイブリッドクラウドなどの異なるデプロイモデルを使用してデプロイすることもできる。本明細書及び特許請求の範囲では、「クラウドコンピューティング環境」は、クラウドコンピューティングが用いられる環境である。
【0195】
図5は、
図1A、
図1B、
図2A、
図2B、
図3A、
図3B、
図4A、及び
図4Bに示されるエンティティを実装するための例示的なコンピュータを示す。コンピュータ500は、チップセット504に結合された少なくとも1つのプロセッサ502を含む。チップセット504は、メモリコントローラハブ520及び入力/出力(input/output、I/O)コントローラハブ522を含む。メモリ506及びグラフィックスアダプタ512は、メモリコントローラハブ520に結合され、ディスプレイ518は、グラフィックスアダプタ512に結合される。記憶デバイス508、入力デバイス514、及びネットワークアダプタ516は、I/Oコントローラハブ522に結合される。コンピュータ500の他の実施形態は、異なるアーキテクチャを有する。
【0196】
記憶デバイス508は、ハードドライブ、コンパクトディスク読み取り専用メモリ(compact disk read-only memory、CD-ROM)、DVD、又はソリッドステートメモリデバイスなどの非一時的なコンピュータ可読記憶媒体である。メモリ506は、プロセッサ502によって使用される命令及びデータを保持する。入力インターフェース514は、タッチスクリーンインターフェース、マウス、トラックボール、若しくは他のタイプのポインティングデバイス、キーボード、又はそれらのいくつかの組み合わせであり、データをコンピュータ500に入力するために使用される。いくつかの実施形態では、コンピュータ500は、ユーザからのジェスチャを介して入力インターフェース514から入力(例えば、コマンド)を受信するように構成され得る。ネットワークアダプタ516は、コンピュータ500を1つ又は2つ以上のコンピュータネットワークに結合する。
【0197】
グラフィックスアダプタ512は、ディスプレイ518に画像及び他の情報を表示する。様々な実施形態では、ディスプレイ518は、ユーザ(例えば、放射線科医、オンコロジスト、呼吸器科医)が、例えば、患者のリスク予測を開始し、任意の追加の検査又は手順を注文し、及び/又はリスク予測モデルのパラメータを設定するために、ディスプレイ518にユーザ選択を入力することができるように構成されている。一実施形態では、ディスプレイ518は、タッチスクリーンを含み得る。様々な実施形態では、ディスプレイ518は、対象のがん予測の1つ又は2つ以上のリスクを示すことができる。したがって、ディスプレイ518にアクセスするユーザは、対象について予測されるがんのリスクを対象に通知することができる。様々な実施形態では、ディスプレイ518は、対象についてのがん予測のリスクに最も大きく寄与した特徴などの情報を示すことができる。例えば、がんのリスクを有すると予測される対象は、小葉中心性肺気腫によって占有される対象の肺の割合に大きく起因する可能性がある。したがって、特徴の識別及び/又は特徴の値(例えば、小葉中心性肺気腫によって占有される対象の肺の割合)は、ディスプレイ518上でユーザ、例えば、臨床医ユーザに示されることができる。様々な実施形態では、対象についてのがん予測のリスクに最も大きく寄与した上位1、上位2、上位3、上位4、上位5、上位6、上位7、上位8、上位9、又は上位10の特徴を、ディスプレイ518上に示すことができる。上位の寄与する特徴の表示は、がん予測のリスクをもたらした特徴をユーザ、例えば、臨床医ユーザが理解するために、当該ユーザにコンテキストを提供することができる。患者の情報/結果が任意の所与の時間にアクセス可能になるように、患者プロファイル、CT画像、生成されたリスク評価、及び任意の他の関連情報がメモリに記憶され得る。
【0198】
コンピュータ500は、本明細書に記載の機能性を提供するためのコンピュータプログラムモジュールを実行するように適合されている。本明細書で使用される場合、「モジュール」という用語は、指定された機能を提供するために使用されるコンピュータプログラムロジックを指す。したがって、モジュールは、ハードウェア、ファームウェア、及び/又はソフトウェアに実装することができる。一実施形態では、プログラムモジュールは、記憶デバイス508に記憶され、メモリ506にロードされ、プロセッサ502によって実行される。
【0199】
図1A又は
図1Bのエンティティによって使用されるコンピュータ500のタイプは、実施形態及びエンティティによって必要とされる処理電力に応じて異なることができる。例えば、がん予測システム130は、単一のコンピュータ500、又はサーバファームなどのネットワークを介して互いに通信する複数のコンピュータ500で動作することができる。コンピュータ500は、グラフィックスアダプタ512及びディスプレイ518などの上記の構成要素のいくつかを欠くことができる。
【0200】
XI.システム
本明細書に更に開示されるのは、がんのリスクを予測するためのリスク予測モデルを実装するためのシステムである。様々な実施形態では、そのようなシステムは、少なくとも、
図1Aにおいて上述したがん予測システム130を含むことができる。様々な実施形態では、がん予測システム130は、
図5に記載の例示的なコンピュータ500を有するコンピュータシステムなどのコンピュータシステムとして具体化される。
【0201】
様々な実施形態では、システムは、
図1Aにおいて上述した撮像デバイス120などの撮像デバイスを含む。様々な実施形態では、システムは、がん予測システム130(例えば、コンピュータシステム)及び撮像デバイスの両方を含む。そのような実施形態では、がん予測システム130は、対象から捕捉された画像(例えば、CTスキャン)を受信するために、撮像デバイス120と通信可能に結合されることができる。コンピュータシステムは、画像を分析し、対象についての肺がんのリスクを判定するために、リスク予測モデルをインシリコで実施する。
【実施例】
【0202】
以下は、本発明を実施するための特定の実施形態の実施例である。実施例は、例示目的だけのために提供されており、いかなる方式によっても本発明の範囲を限定することは意図されていない。使用される数値(例えば、量、温度など)に関する精度を確実にするための努力がなされているが、ある程度の実験誤差及び偏差は許容されるべきである。
【0203】
実施例1:リスク予測モデルの構築及び分析の要約
国立肺スクリーニング試験(NLST)コホートからのコンピュータ断層撮影(CT)画像を分析して、3年の将来の範囲時点にわたる患者におけるがんの可能性を予測した。がんの予測された将来のリスクを使用して、肺がんの発生のためにエンリッチメントされた患者の集団を識別した。
【0204】
国立肺スクリーニング試験(NLST)は、年間CTスキャンが年間胸のX線の代わりに肺がんによる死亡を低減できるかどうかを判定するためのランダム化制御試験であった。この調査の動因となった一次仮説は、CT撮像が、治療及び治癒により適したより早期の段階におけるがん(又はより小さいサイズ結節)を検出するより高い分解能のインビボデータを提供することであった。
【0205】
NLST CT画像及び臨床データは、現在、生物医学的コミュニティが自由に利用可能であり、CTスキャンが取得された。NLST研究患者は、各々が1年離れた3つの時点で見られた。これらの時点は、t0(ベースライン)、t1(1年フォローアップ)及びt2(2年フォローアップ)として示される。更に、t3、t4及びt5として示される「合成」時点を更に作成した。これらは、データセットが一部の患者についての患者ベースラインデータ(t0)、一部の患者の1年フォローアップ(t1)データ、及び一部の患者の2年フォローアップ(t2)データを含むように、参加者をランダムにサンプリングすることによって作成された時点である。例えば、合成時点t3は、患者の1/3が以前の撮像を有さず、したがってt0においてサンプリングされ、1/3が1年の以前の撮像を有し、したがってt1においてサンプリングされ、1/3が複数(この場合2)年の以前の撮像を有し、したがってt2においてサンプリングされると仮定する。t4については、サンプリングは2:1:1(t0:t1:t2)であり、t5については、サンプリングは1:1:2(t0:t1:t2)である。これは、胸部のCTスキャンを受けたことがないヒト、以前に胸のCTスキャンを受けたを受けたことがあるヒトもいれば、胸の2回以上の以前のCTスキャンを受けたことがあるヒトもいる臨床データを模倣するために行われた。
【0206】
画像分析アルゴリズムをCT画像に適用して、肺気腫、間質性変化、保存肺組織、及び胸筋サイズ(面積)などの特徴を抽出し、後者の筋肉測定値は、体組成又は脂肪を含まない質量の代用として使用される。異なる時点で捕捉されたCTスキャンを半分に分割して、データの専用の訓練セット及びデータの試験セットを構築した。CT画像から抽出された結節及び非結節特異的特徴並びに縦方向特徴(例えば、縦方向非結節特異的特徴及び縦方向結節特異的特徴)を使用して、将来の肺がんを予測するためのロバストなリスク予測モデルが作成された。
【0207】
特徴(例えば、変数)をCT画像から抽出した。含まれる特徴は、以前の経験に基づいて、及び可能性の高い生物学的関連性に基づいて選択された。
【0208】
以下の実施例に記載されるリスク予測モデルについて、例示的な非結節特異的特徴を以下に列挙する。非結節特異的特徴のより包括的なリストを表2に示す。
1)肺実質のデンシトメトリー測定値
a.以下によって占有される肺の割合:
i.-950ハウンスフィールド単位(HU)未満の減衰を有する面積/体積として定義された、低減衰領域(LAA)
ii.-600HUと-250HUとの間の減衰を有する肺の面積/体積として定義された高減衰領域(HAA)。
b.上部肺ゾーンにおけるLAAと下部肺ゾーンにおけるLAAとの比(比LAA)
2)筋肉組織/胸壁の体組成測定値
a.大胸筋断面積
b.小胸筋断面積
c.大胸筋除脂肪断面積
d.小胸筋除脂肪断面積
e.皮下脂肪断面積(軸方向)
3)肺実質の局所ヒストグラム測定値
a.以下によって占有される肺の割合:
i.正常組織
ii.小葉中心性肺気腫
iii.小葉中心性結節
iv.すりガラス
v.蜂巣肺
vi.線状痕
vii.結節
viii.網状
ix.胸膜下ライン
x.他の気腫
xi.嚢胞
4)縦方向非結節特異的特徴(例えば、肺実質のデンシトメトリー測定値の変化、体組成測定値の変化、及び/又は肺実質の局所ヒストグラム測定値の変化)(単一の時点のリスク予測モデルに含まれない)。
【0209】
以下の実施例に記載されるリスク予測モデルについて、結節特異的特徴(例えば、肺結節の特徴、肺結節のエッジ、及び境界/結節周辺領域)を分析した。結節特異的特徴を、組織の3つのシェル:結節の内部、結節の縁、及び境界領域/結節周辺領域から抽出した。追加的に、ラジオミクスシェルは、
図6Aに示されるように、3つの異なる画像(例えば、元のCT画像、ウェーブレット変換CT画像、及びガウス変換CT画像)内の個々の結節に対して生成された。
【0210】
例示的な結節特異的特徴を以下に列挙する。
1)減衰
2)マージン記述
3)直径
4)肺CTスクリーニング、報告データシステム(Lung-RADS)スコア
5)縦方向結節特異的特徴(例えば、減衰の変化、マージン記述の変化、直径の変化、及び/又はLung-RADSスコアの変化)(単一の時点のリスク予測モデルには含まれない)。
【0211】
以下の実施例に記載のリスク予測モデルの場合、以下のラジオミクス特徴(例えば、結節特異的特徴)を、元のCT画像、ウェーブレット変換CT画像、及びガウス変換CT画像から抽出した。
1)一次統計
2)3D形状ベースの特徴
3)2D形状ベースの特徴
4)グレーレベル同時生起行列
5)グレーレベルランレングス行列
6)グレーレベルサイズゾーン行列
7)隣接グレートーン差分行列
8)グレーレベル依存性行列。
【0212】
結節特異的特徴のより包括的なリストを表3に示す。
【0213】
縦方向ラジオミクス特徴は、2つ又は3つ以上の異なる時点から捕捉されたCT画像間の上記のラジオミクス特徴のいずれかの変化として更に計算された。縦方向ラジオミクス特徴は、単一の時点のリスク予測モデルに含まれなかったことに留意されたい。
【0214】
具体的に使用される特徴は、臨床特性を含まず、これは、全体的なコホートの臨床的特徴がNLST特性であったことを意味する。肺がん予測カテゴリによる臨床的特徴を以下に示す。
【0215】
図6B及び
図8は、リスク予測モデルを実装するための2つの概要フロー図を示す。具体的には、
図6Bは、
図3Aに示される実施形態によるリスク予測モデルの実装形態の例示的な概要を示す。ここで、結節及び直近の周囲の特徴は、リスク予測モデルの2つの別個のサブモデルによって、非結節特異的特徴とは別個に分析された。2つのサブモデルからの分析の出力は、がんが発生する可能性を予測するための第3のサブモデル(例えば、「メタモデルを訓練及び交差検証する」として識別される)への入力として提供された。
図6Bに示されるように、この第3のサブモデルは、入力として、患者から判定されたプロテオミクス、患者によって経験された環境条件、患者の遺伝学、及び/又は患者の臨床特性などの他の特徴から導出された他の値を更に受信した。
図8は、
図3Bに示される実施形態による、リスク予測モデルの実装形態の例示的な概要を示す。ここでは、結節特異的特徴及び非結節特異的特徴をマージし、リスク予測モデルによって一緒に分析した。したがって、リスク予測モデルは、がんが発生する可能性を予測する可能性を予測する。
【0216】
リスク予測モデルは、CT画像から抽出された非結節特異的及び結節特異的特徴の混合について予測された。CTに関する特徴は、CTスキャナのブランド、生成及び画像再構成ソフトウェアによって変化し得る。対象間の疾病の負担における追加の地理的変動は、有害な曝露に対する実際の差をと反映し得る(すなわち、一部の人々は、程度の差はあるが曝露による損傷の影響を受けやすく、肺気腫又は肺組織の間質性変化が発生する可能性が事実上高い場合がある)。これらの理由から、この例では、疾患のCTメトリクスの存在及び重症度を判定するための絶対閾値は使用されなかった。代わりに、試験サブコホートのデータはそれぞれ、平均を差し引き、各共変数の標準偏差で割ることによって正規化された。追加のコホートがモデル精密化のために集約されるため、データ正規化は、全ての既存のデータ(クロスコホート)を使用して実行されるか、又は患者固有の生物学、曝露履歴、民族性、又は処理される医療画像のタイプを最もよく反映すると考えられるものを含むがこれらに限定されないデータのサブセットを選択する。正規化されると、データは、モデリングに対するXGBoostベースのアプローチで使用された。
【0217】
データの前処理を最初に行った。これには、連続特徴の値を正規化することを含んでいた(例えば、センタリング(平均の減算)及びスケーリング(標準偏差による分割)によって)。試験セットの正規化は、訓練セットのみからの情報を使用して実行された。すなわち、訓練セットの平均及び標準偏差を使用して、訓練セット及び試験セットの両方を正規化した。追加的に、不均衡データを説明するために、すなわちがん診断が比較的稀であるという事実を説明するために、過半クラス(がんなし)のダウンサンプリングを含む前処理が行われた。SMOTE及びROSEなどの代替的なアプローチは考慮されたが、より高い計算要件を有するダウンサンプリングと同様の性能を有していた。
【0218】
リスク予測モデルを構築するために、XGBoostを主に使用した。勾配ブーストモデルは、NLSTに登録された喫煙者における将来の肺がんの3年のリスクを予測するように独立して訓練された。モデル戦略は、訓練データにおいて決定木を開発及び最適化して、所望の結果を予測した。肺がんのリスクの高まりを特定する肺気腫、間質性変化、及びサルコペニアの潜在的にいくつかの組み合わせがあるため、ある特定の負荷の疾患(すなわち、>10%の肺気腫又は>10%の間質性変化)のための固定閾値を選択するのではなく、このアプローチが使用された。例えば、肺の25%が肺気腫である肺を有する喫煙者は、2%肺気腫、12%間質性変化、及び減少した胸筋面積を有する喫煙者と同じ将来の肺がんのリスクを有し得る。次いで、これらのモデルを修正して、CTスキャンに関して一般的な高頻度に見られる(例えば、既に存在する)がんを有するものを識別するだけではなく、偶発(例えば、新たな)がんの予測を可能にした。この最終ステップは、CT画像における任意の肺結節の特徴を説明する視覚的データを利用する。例示的な実施形態は、勾配ブーストモデルを示し、説明するが、例えば、ロジスティック回帰などの他のモデリングアプローチも利用され得ることを当業者は理解するであろう。また、リスク予測モデルは、3年リスク予測を提供するものとして具体的に示され説明されるが、予測用語は、必要に応じて変化し得ることも理解されるであろう。
【0219】
リスク予測モデルを構築するために、コホートを訓練及び試験グループに50/50に分割した。モデルは、10倍のクロス検証を使用して調整を3回繰り返し行った試験群で訓練された。予測確率の二分法は、訓練群のみからの情報を使用することによって実施した。この実施例では、これは、所与のスクリーニング対登録比についての感度を最大化する確率閾値を選択することによって実施されたが、所与の陽性予測値標的についての特異性を最大化するなどの他のアプローチも使用できることを理解されたい。予測確率閾値の安定性は、1000回反復のブートストラップサンプル法を用いて得られた。結果は、3年範囲でのがんの診断を含んでいた。性能測定及び視覚化には、(以下の実施例に記載されるように)全ての時点に対するROC曲線及びエンリッチメントの提示が含まれる。3年がん予測に基づく累積発生率関数もまた、以下の実施例において予測され/示された。
【0220】
患者のコホート全体又は患者のサブグループのいずれかについて、がんの将来のリスクを予測するためにモデルを構築した。患者のサブグループは、Lung-RADS<4B、<4A、<3及び<2としてベースライン格付け/カテゴライズされた結節に基づいてカテゴライズされた。Lung-RADS<4Bは、Lung-RADS 1-4Aとしてカテゴライズされた患者を含む。Lung-RADS<4Aは、Lung_RADS 1~3としてカテゴライズされた患者を含む。Lung-RADS<3は、Lung_RADS 1~2としてカテゴライズされた患者を含む。Lung-RADS<2は、Lung_RADS 1としてカテゴライズされた患者を含む。表1は、異なるLung-RADS分類についての特徴を要約する。
図6B及び
図8に示されるリスク予測モデルを構築するために使用される患者コホートの人口統計情報及び患者特性は、それぞれ
図7A及び
図9Aに示される。
【0221】
以下の実施例に示されるように、全ての結果は、訓練コホートで開発/訓練され、次いで試験コホートに適用されたモデルに基づく性能/所見を表す。
【0222】
累積発生率関数プロットを解釈するとき、y軸上の生確率は、打ち切り及び死亡によるリスク設定の変化によって有意に影響を受け得る。これらのプロットは、主にサブグループによるそれらの形状の変化を実証するために含まれた。
【0223】
受信機動作特性(receiver operating characteristic、ROC)曲線及び曲線下面積(AUC)値をレビューする場合、これらは主に、それらの慣例的であり、文献で使用される参照について主に含まれることに留意されたい。登録の潜在的な適格性を考慮すると、Lung-RADS基準に基づいて、4A及び4B結節を有する個体が早期評価を必要とし得ることに留意されたい。しかしながら、両方の有意な割合、例えば、4Aは、必ずしも高頻度に見られるがんではなく、したがって将来の偶発がんの潜在的な研究に登録することが可能であり得る。
【0224】
実施例2:結節及び非結節特徴の別個の分析を通したがんの将来のリスクの予測
結節特徴を分析するための結節モデル及び非結節特徴を分析するための非結節モデルを含むリスク予測モデルが、
図6Bに示される概要に従って構築された。各リスク予測モデルについて、結節モデル及び非結節モデルの出力は、患者に3年の時間範囲内に肺がんが発生する可能性が高いかどうかを示す確率を生成する第3のモデル(例えば、
図3Aに示す集約モデル)への入力として機能した。訓練セット(例えば、コホートの50%)を使用して、リスク予測モデルを訓練し、試験セット(例えば、コホートの他の50%)を使用して、リスク予測モデルを試験した。
【0225】
単一の時点のリスク予測モデル(例えば、単一の時点の画像から導出された特徴を分析するリスク予測モデル)と、縦方向リスク予測モデル(例えば、単一の時点の画像から導出された特徴及び2つ又は3つ以上の時点の画像にわたる縦方向特徴を分析するリスク予測モデル)との両方が構築された。
図7Aは、
図3Aに示される実施形態による、様々な異なる時点(例えば、t0、t1、t2、t3、t4、又はt5)の患者コホートにわたる異なるリスク予測モデルの特性を示す。
【0226】
「t0、t1、t2からの1:1:1ランダムサンプル(t3とラベル付けされる)」として示されるリスク予測モデルは、t0、t1、及びt2時点の各々での参加者のランダムな重複しない選択に関して訓練された。すなわち、このリスク予測モデルでは、患者の3分の1が患者のt0データを使用して分析され、3分の1が患者のt1データを使用して分析され、3分の1が患者のt2データを使用して分析された。「t0、t1、t2からの2:1:1ランダムサンプル(t4とラベル付けされる)」として示されるリスク予測モデルは、t0、t1、及びt2時点のそれぞれにおける参加者のランダムな重複しない選択に関して訓練された。すなわち、このリスク予測モデルでは、患者の50%が患者のt0データを使用して分析され、25%が患者のt1データを使用して分析され、25%が患者のt2データを使用して分析された。「t0、t1、t2からの1:1:2ランダムサンプル(t5とラベル付けされる)」として示されるリスク予測モデルは、t0、t1、及びt2時点のそれぞれにおける参加者のランダムな重複しない選択に関して訓練された。すなわち、このリスク予測モデルでは、患者の25%が患者のt0データを使用して分析され、25%が患者のt1データを使用して分析され、50%が患者のt2データを使用して分析された。
【0227】
注目すべきことに、
図7Aに示されるリスク予測モデルは、5~8のオッズ比及び8%を超える陽性予測値を達成し、スクリーニング対登録比は11対1未満である。これは、3年の時間範囲内にがんが発生する可能性が低い患者をスクリーニングするためのリスク予測モデルの有用性を示している。要するに、
図7Aに示される結果は、断面及び/又は縦方向特徴を使用して訓練された様々な将来のリスク予測モデルが、患者をエンリッチするために実装されることができ、それによって、登録される必要がある、又は臨床試験における登録のために考慮され得る患者の数を低減させることを示す。
【0228】
後続の結果は、「t0、t1、t2からの1:1:1ランダムサンプル(t3とラベル付けされる)」として示されるリスク予測モデルを参照しており、これは、t0、t1、及びt2時点の各々での参加者のランダムな重複しない選択に関して訓練されたものである。リスク予測モデルを評価するために使用される患者の人口統計を
図7Bに示す。ここでは、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、及びLung-RADS 4Bの各々からの患者が含まれ、将来のがんは、各患者について予測されるか、又は予測されなかった。肺がんが発生するリスクが高いと識別された患者の60%超が、標準的なLung-RADSスコアリングを使用して、肺がんが発生するリスクが低い(Lung-RADS 1又は2)とみなされたことに留意されたい。
【0229】
図7Cは、リスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。ここで、リスク予測モデルは、0.70のAUC値を示した。
図7Dは、リスク予測モデルによって予測される3年累積発生率関数を示す。ここで、3年で、リスク予測モデルは、712人の患者についてがんを予測し、他の6192人の患者についてがんなしを予測した。
【0230】
図7Eは、リスク予測モデルの結節モデル構成要素の上位10の結節特徴を示す。注目すべきことに、上位10の特徴は、縦方向結節特徴(例えば、2つ又は3つ以上の時点にわたる結節特徴の変化)とは対照的に、単一の時点の結節特徴(例えば、単一の時点で取得された画像から抽出された結節特徴)であった。これは、利用可能な以前の撮像データの存在及び量に応じて変化し得る。
図7Fは、リスク予測モデルの非結節モデル構成要素の上位10の非結節特徴を示す。特に、上位10の非結節特徴の一部分は、縦方向非結節特徴(例えば、「大胸筋除脂肪ハウンスフィールド単位モード変化」、「大胸筋除脂肪ハウンスフィールド単位標準偏差変化」、「正常実質低減衰領域変化」、及び「大胸筋ハウンスフィールド単位モード変化」)であった。したがって、これは、対象の非結節ベースの特性の変化(例えば、肺実質及び/又は体組成の変化)を捕捉する縦方向非結節特徴が、将来のがんの可能性を予測するのに有益であったことを示す。
【0231】
実施例3:結節特徴及び非結節特徴のマージされた分析によるがんの将来のリスクの予測
結節特徴及び非結節特徴を別個に分析しなかったリスク予測モデルを、
図8に示す概要に従って構築した。各リスク予測モデルは、入力として、結節特徴と、非結節特徴との両方を受信し、患者に3年の時間範囲内に肺がんが発生する可能性があるかどうかを示す確率を生成する。訓練セット(例えば、コホートの50%)を使用して、リスク予測モデルを訓練し、試験セット(例えば、コホートの他の50%)を使用して、リスク予測モデルを試験した。
【0232】
単一の時点のリスク予測モデル(例えば、単一の時点の画像から導出された特徴を分析するリスク予測モデル)と、縦方向リスク予測モデル(例えば、単一の時点の画像から導出された特徴及び2つ又は3つ以上の時点の画像にわたる縦方向特徴を分析するリスク予測モデル)との両方が構築された。
図9Aは、
図3Bに示される実施形態による、様々な異なる時点(例えば、t0、t1、t2、t3、t4、又はt5)の患者コホートにわたる異なるリスク予測モデルの特性を示す。
【0233】
「t0、t1、t2からの1:1:1ランダムサンプル(t3とラベル付けされる)」として示されるリスク予測モデルは、t0、t1、及びt2時点のそれぞれにおける参加者のランダムな重複しない選択に関して訓練された。すなわち、このリスク予測モデルでは、患者の3分の1が患者のt0データを使用して分析され、3分の1が患者のt1データを使用して分析され、3分の1が患者のt2データを使用して分析された。「t0、t1、t2からの2:1:1ランダムサンプル(t4とラベル付けされる)」として示されるリスク予測モデルは、t0、t1、及びt2時点のそれぞれにおける参加者のランダムな重複しない選択に関して訓練された。すなわち、このリスク予測モデルでは、患者の50%が患者のt0データを使用して分析され、25%が患者のt1データを使用して分析され、25%が患者のt2データを使用して分析された。「t0、t1、t2からの1:1:2ランダムサンプル(t5とラベル付けされる)」として示されるリスク予測モデルは、t0、t1、及びt2時点のそれぞれにおける参加者のランダムな重複しない選択に関して訓練された。すなわち、このリスク予測モデルでは、患者の25%が患者のt0データを使用して分析され、25%が患者のt1データを使用して分析され、50%が患者のt2データを使用して分析された。
【0234】
注目すべきことに、
図9Aに示される全てのモデルの特徴は、8%を超える陽性予測値を有する5~8のオッズ比を含む。これは、3年の時間範囲内にがんが発生する可能性が低い患者をスクリーニングするためのリスク予測モデルの有用性を示している。まとめると、
図9Aに示される結果は、断面及び/又は縦方向特徴を使用して訓練された様々な将来のリスク予測モデルが、患者をエンリッチするために実装され得、それによって、臨床試験に登録される患者の数を低減させるか、又は肺がんが発生するリスクを低減させる治療戦略(例えば、1つ又は2つ以上の臨床試験において)の恩恵を最も受け得る患者を識別することを示す。
【0235】
後続の結果は、「t0、t1、t2からの1:1:1ランダムサンプル(t3とラベル付けされる)」として示されるリスク予測モデルを参照しており、これは、t0、t1、及びt2時点の各々での参加者のランダムな重複しない選択に関して訓練されたものである。リスク予測モデルを評価するために使用される患者の人口統計を
図9Bに示す。ここでは、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、及びLung-RADS 4Bの各々からの患者が含まれ、将来のがんは、各患者について予測されるか、又は予測されなかった。
【0236】
図9Cは、リスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。ここで、リスク予測モデルは、0.69のAUC値を示した。
図9Dは、リスク予測モデルによって予測される3年累積発生率関数を示す。ここで、リスク予測モデルは、758人の患者についてがんを予測し、他の6329人の患者についてがんなしを予測した。
図9Eは、
図3Bに示される実施形態による、リスク予測モデルの上位10の特徴(例えば、結節及び非結節特徴)を示す。
【0237】
実施例4:縦方向結節特徴が有益であるLung-Rads 1~3患者における結節及び非結節特徴の別個の分析を通したがんの将来のリスクの予測
結節特徴を分析するための結節モデル及び非結節特徴を分析するための非結節モデルを含むリスク予測モデルが、
図6Bに示される概要に従って構築された。各リスク予測モデルについて、結節モデル及び非結節モデルの出力は、患者に3年の時間範囲内に肺がんが発生する可能性が高いかどうかを示す確率を生成する第3のモデル(例えば、
図3Aに示す集約モデル)への入力として機能した。訓練セット(例えば、コホートの50%)を使用して、リスク予測モデルを訓練し、試験セット(例えば、コホートの他の50%)を使用して、リスク予測モデルを試験した。
【0238】
後続の結果は、t1時点での参加者のランダムな重複しない選択に関して訓練されたリスク予測モデルを参照している。リスク予測モデルを評価するために使用される患者の人口統計を
図10Aに示す。ここで、Lung-RADS 1、Lung-RADS 2、及びLung-RADS 3の各々からの患者が含まれ、将来のがんは、各患者について予測されるか、又は予測されなかった。注目すべきことに、Lung-RADS 4A及びLung-RADS 4B患者は除外された。したがって、このモデルは、典型的には結節の欠如又は結節の小さいサイズのためにより低いリスクとみなされ得る患者におけるがんの将来のリスクを予測するように訓練される。
【0239】
図10Bは、リスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。ここで、リスク予測モデルは、0.71のAUC値を示した。
図10Cは、リスク予測モデルによって予測される3年累積発生率関数を示す。ここで、リスク予測モデルは、736人の患者についてがんを予測し、他の6235人の患者についてがんなしを予測した。
【0240】
図10Dは、リスク予測モデルの結節モデル構成要素の上位10の結節特徴を示す。特に、上位10の特徴は、単一の時点の結節特徴(例えば、単一の時点の結節特徴)とは対照的に、縦方向結節特徴(例えば、2つの時点にわたる差を表す縦方向結節特徴)であった。
図10Eは、リスク予測モデルの非結節モデル構成要素の上位10の非結節特徴を示す。要するに、本実施例で説明される結果は、少なくとも1つ又は2つ以上の縦方向特徴(例えば、対象の結節に基づく特性における変化を捕捉する縦方向結節特徴)を組み込む縦方向リスクモデルが、将来のがんの可能性を予測するために有益であることを示す。
【0241】
実施例5:縦方向非結節特徴が有益であるLung-Rads 1~3患者における結節及び非結節特徴の別個の分析によるがんの将来のリスクの予測
結節特徴を分析するための結節モデル及び非結節特徴を分析するための非結節モデルを含むリスク予測モデルが、
図6Bに示される概要に従って構築された。各リスク予測モデルについて、結節モデル及び非結節モデルの出力は、患者に3年の時間範囲内に肺がんが発生する可能性が高いかどうかを示す確率を生成する第3のモデル(例えば、
図3Aに示す集約モデル)への入力として機能した。訓練セット(例えば、コホートの50%)を使用して、リスク予測モデルを訓練し、試験セット(例えば、コホートの他の50%)を使用して、リスク予測モデルを試験した。
【0242】
後続の結果は、t2時点での参加者のランダムな重複しない選択に関して訓練されたリスク予測モデルを参照している。リスク予測モデルを評価するために使用される患者の人口統計を
図11Aに示す。ここで、Lung-RADS 1、Lung-RADS 2、及びLung-RADS 3の各々からの患者が含まれ、将来のがんは、各患者について予測されるか、又は予測されなかった。注目すべきことに、Lung-RADS 4A及びLung-RADS 4B患者は除外された。したがって、このモデルは、典型的には結節の欠如又は結節の小さいサイズのためにより低いリスクとみなされ得る患者におけるがんの将来のリスクを予測するように訓練される。
【0243】
図11Bは、リスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。ここで、リスク予測モデルは、0.70のAUC値を示した。
図11Cは、リスク予測モデルによって予測される3年累積発生率関数を示す。ここで、リスク予測モデルは、621人の患者についてがんを予測し、他の6264人の患者についてがんなしを予測した。
【0244】
図11Dは、リスク予測モデルの結節モデル構成要素の上位10の結節特徴を示す。
図11Eは、リスク予測モデルの非結節モデル構成要素の上位10の非結節特徴を示す。注目すべきことに、上位10の非結節特徴の一部分は、縦方向非結節特徴であった。例えば、上位10の非結節のうちの4つは、縦方向非結節特徴であった(例えば、「ワイルドカード高減衰領域250変化」、「全肺高減衰領域250変化」、「皮下脂肪ハウンスフィールド単位歪度変化」、及び「皮下脂肪除脂肪ハウンスフィールド単位平均変化」)。したがって、これは、対象の非結節ベースの特性の変化(例えば、肺実質及び/又は体組成の変化)を捕捉する縦方向非結節特徴が、将来のがんの可能性を予測するのに有益であったことを示す。
【0245】
実施例6:単一の時点のリスク予測モデルを使用するLung-Rads 1~3患者における結節及び非結節特徴の別個の分析によるがんの将来のリスクの予測
結節特徴を分析するための結節モデル及び非結節特徴を分析するための非結節モデルを含むリスク予測モデルが、
図6Bに示される概要に従って構築された。各リスク予測モデルについて、結節モデル及び非結節モデルの出力は、患者に3年の時間範囲内に肺がんが発生する可能性が高いかどうかを示す確率を生成する第3のモデル(例えば、
図3Aに示す集約モデル)への入力として機能した。訓練セット(例えば、コホートの50%)を使用して、リスク予測モデルを訓練し、試験セット(例えば、コホートの他の50%)を使用して、リスク予測モデルを試験した。
【0246】
後続の結果は、t0時点での参加者のランダムな重複しない選択に関して訓練された単一の時点のリスク予測モデルを参照している。リスク予測モデルを評価するために使用される患者の人口統計を
図12Aに示す。ここで、Lung-RADS 1、Lung-RADS 2、及びLung-RADS 3の各々からの患者が含まれ、将来のがんは、各患者について予測されるか、又は予測されなかった。注目すべきことに、Lung-RADS 4A及びLung-RADS 4B患者は除外された。したがって、このモデルは、典型的には結節の欠如又は結節の小さいサイズのためにより低いリスクとみなされ得る患者におけるがんの将来のリスクを予測するように訓練される。
【0247】
図12Bは、リスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。ここで、リスク予測モデルは、0.73のAUC値を示した。
図12Cは、リスク予測モデルによって予測される3年累積発生率関数を示す。ここで、リスク予測モデルは、670人の患者についてがんを予測し、他の5897人の患者についてがんなしを予測した。
【0248】
図12Dは、リスク予測モデルの結節モデル構成要素の上位10の結節特徴を示す。
図12Eは、リスク予測モデルの非結節モデル構成要素の上位10の非結節特徴を示す。まとめると、これらの結果は、単一の時点のから導出された結節特徴及び非結節特徴を含む単一の時点のリスク予測モデルが、将来のがんの可能性を予測するために有益であったことを示す。
【0249】
実施例7:Lung-RADS 2~4B患者のためのリスク予測モデルを使用する既存のがん又は高頻度に見られるがんの予測
結節特異的特徴に基づいて結節を区別するためのリスク予測モデルを構築した。ここで、リスク予測モデルは、対象における既存の又は高頻度に見られるがんの有無を予測するために構築された。この例において、高頻度に見られるがんは、6ヶ月以内に診断されたがんを指す。Lung-RADS 2~4B対象は、これらが1つ又は2つ以上の結節の存在を有する対象を表すので、この分析のために特に選択された。
【0250】
図13Aは、高頻度に見られる又は既存のがんを予測するためにLung-RADS 2~4B患者を使用して訓練及び試験されたリスク予測モデルの性能(曲線下面積(AUC)によって測定される)を示す。
図13Bは、高頻度に見られるがん又は既存のがんを予測するためにLung-RADS 2~4B患者を使用してリスク予測モデルを訓練及び試験するために使用される患者人口統計を示す。13Cは、高頻度に見られる又は既存のがんを予測するためにLung-RADS 2~4B患者を使用するリスク予測モデルの得られた予測を更に示す。
【0251】
図13Aに示されるように、リスク予測モデルは、対象に存在する1つ又は2つ以上の結節に基づいて、Lung-RADS 2~4B対象における既存の又は高頻度に見られるがんの存在又は不在を予測することについて、AUC=0.8を達成した。
図13Bにおいて、注目すべき結果は、リスク予測モデルが、13人の1A期対象及び4人の1B期対象についてがんの存在を正確に予測したことであった。これは、リスク予測モデルががんの初期段階を有する対象を識別することができる可能性があることを示唆する。
【0252】
図13Cにおいて、注目すべき結果には、診断オッズ比、スクリーニングに必要な数、及び陰性予測値が含まれる。具体的には、8.93の診断オッズ比は、肺がんを有すると予測されるこの群の誰かが、肺がんを有すると予測されない誰かよりも現在肺がんを有する8.9倍高いオッズを有することを反映する。この例における4.495の値をスクリーニングするために必要とされる数は、肺がんの1症例を識別するために約4.5人の個体のみが分析される必要があったことを示唆する。最後に、この例における98.2の陰性予測値は、対象が肺がんを有しないと予測される場合、対象は、肺がんを有しないことを98.2%確信し得ることを示す。
【0253】
本出願で引用された全ての刊行物、特許、特許出願、及び他の文書は、各個別の刊行物、特許、特許出願、及び他の文書が、全ての目的のために参照により組み込まれることが個々に示されているかのようにある程度まで全ての目的のために、それらの全体が参照により本明細書に組み込まれる。
【0254】
様々な特定の実施形態が例示及び説明されてきたが、上記の明細書は限定的ではない。本開示の趣旨及び範囲から逸脱することなく様々な変更をなすことができることが認識されるであろう。本明細書を検討すると、当業者には多くの変形が明らかになるであろう。
【0255】
表
【0256】
【0257】
【0258】
【0259】
【0260】
【0261】
【0262】
【0263】
【0264】
【0265】
〔実施の態様〕
(1) 対象の肺がんの1つ又は2つ以上のリスクを予測するための方法であって、
前記対象から捕捉された1つ又は2つ以上の画像を取得することと、
取得された前記1つ又は2つ以上の画像から特徴を抽出することであって、抽出された前記特徴が、少なくとも非結節特異的特徴を含み、前記非結節特異的特徴が、肺実質特徴、体組成特徴、縦方向肺実質特徴、又は縦方向体組成特徴のうちの1つ又は2つ以上を含む、抽出することと、
1つ又は2つ以上の訓練されたリスク予測モデルを適用して、取得された前記1つ又は2つ以上の画像から抽出された前記特徴を分析することによって、前記対象の肺がんの1つ又は2つ以上のリスクを予測することと、を含む、方法。
(2) 前記対象の肺がんの前記1つ又は2つ以上のリスクを予測することが、M年リスク予測モデルを適用して、前記対象にM年以内に肺がんが発生する可能性が高いかどうかを予測することを含み、前記M年リスク予測モデルが、結節特異的特徴及び前記非結節特異的特徴を含み、
前記非結節特徴が、前記縦方向肺実質特徴及び前記縦方向体組成特徴を含み、
前記縦方向肺実質特徴が、前記肺実質のデンシトメトリー測定値の変化又は前記肺実質の局所ヒストグラム測定値の変化のうちの1つ又は2つ以上を含み、
前記縦方向体組成特徴が、胸筋断面積の変化、胸筋除脂肪断面積の変化、又は皮下脂肪断面積の変化のうちの1つ又は2つ以上を含む、実施態様1に記載の方法。
(3) 前記非結節特徴が、前記縦方向肺実質特徴及び前記縦方向体組成特徴を含む、実施態様1に記載の方法。
(4) 前記非結節特徴が、前記肺実質特徴、前記体組成特徴、前記縦方向肺実質特徴、及び前記縦方向体組成特徴の各々を含む、実施態様1に記載の方法。
(5) 前記肺実質特徴が、前記肺実質のデンシトメトリー測定値又は前記肺実質の局所ヒストグラム測定値のうちの1つ又は2つ以上を含む、実施態様1及び3~4のいずれかに記載の方法。
【0266】
(6) 前記縦方向肺実質特徴が、前記肺実質のデンシトメトリー測定値の変化又は前記肺実質の局所ヒストグラム測定値の変化のうちの1つ又は2つ以上を含む、実施態様1及び3~4のいずれかに記載の方法。
(7) 前記肺実質の前記デンシトメトリー測定値が、肺の低減衰領域の割合、肺の高減衰領域の割合、及び下部肺ゾーンと比較した上部肺ゾーンにおける低減衰領域又は高減衰領域の比のうちの1つ又は2つ以上を含む、実施態様5又は6に記載の方法。
(8) 前記肺実質の前記局所ヒストグラム測定値が、正常組織、小葉中心性肺気腫、小葉中心性結節、すりガラス、蜂巣肺、線状痕、結節性、網状、胸膜下ライン、他の肺気腫、又は嚢胞のいずれかによって占有される肺の1つ又は2つ以上の割合を含む、実施態様5又は6に記載の方法。
(9) 前記体組成特徴が、胸筋断面積、胸筋除脂肪断面積、又は皮下脂肪断面積のうちの1つ又は2つ以上を含む、実施態様1に記載の方法。
(10) 前記縦方向体組成特徴が、胸筋断面積の変化、胸筋除脂肪断面積の変化、又は皮下脂肪断面積の変化のうちの1つ又は2つ以上を含む、実施態様1に記載の方法。
【0267】
(11) 肺がんの前記1つ又は2つ以上のリスクが、既存の又は高頻度に見られるがんのリスクを含む、実施態様1~10のいずれかに記載の方法。
(12) 肺がんの前記1つ又は2つ以上のリスクが、がんが発生する将来のリスクを含む、実施態様1~10のいずれかに記載の方法。
(13) 抽出された前記特徴が、結節特異的特徴を更に含む、実施態様1及び3~12のいずれかに記載の方法。
(14) 前記結節特異的特徴が、縦方向結節特異的特徴を含む、実施態様13に記載の方法。
(15) 前記結節特異的特徴が、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ、結節直径、Lung-RADSスコア、又はラジオミクス特徴のうちの1つ又は2つ以上を含む、実施態様13に記載の方法。
【0268】
(16) 前記縦方向結節特異的特徴が、結節特異的減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化、結節直径の変化、Lung-RADSスコアの変化、又はラジオミクス特徴の変化のうちの1つ又は2つ以上を含む、実施態様14又は15に記載の方法。
(17) ラジオミクス特徴が、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存性行列のうちの1つ又は2つ以上を含む、実施態様15又は16に記載の方法。
(18) 前記結節特異的特徴が、放射線技師レポートから抽出される、実施態様13~17のいずれかに記載の方法。
(19) 前記結節特異的特徴が、画像分析アルゴリズムを実装することによって計算的に抽出される、実施態様13~17のいずれかに記載の方法。
(20) 前記対象の肺がんの前記1つ又は2つ以上のリスクを予測することが、
前記非結節特異的特徴を分析するように構成された第1のサブモデルと、
前記結節特異的特徴を分析するように構成された第2のサブモデルと、を含むリスク予測モデルを適用することを含む、実施態様13~19のいずれかに記載の方法。
【0269】
(21) 前記リスク予測モデルが、前記第1のサブモデル及び前記第2のサブモデルの予測された出力を分析して、前記対象の肺がんのリスクを予測するように構成された第3のサブモデルを更に含む、実施態様20に記載の方法。
(22) 前記対象の肺がんの前記1つ又は2つ以上のリスクを予測することが、5年リスク予測モデルを適用して、前記対象に5年以内に肺がんが発生する可能性が高いかどうかを予測することを含む、実施態様20又は21に記載の方法。
(23) 前記対象の肺がんの前記1つ又は2つ以上のリスクを予測することが、3年リスク予測モデルを適用して、前記対象に3年以内に肺がんが発生する可能性が高いかどうかを予測することを含む、実施態様20又は21に記載の方法。
(24) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの2つ又は3つ以上が、縦方向肺実質特徴又は縦方向体組成特徴である、実施態様23に記載の方法。
(25) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの3つ又は4つ以上が、縦方向肺実質特徴又は縦方向体組成特徴である、実施態様23に記載の方法。
【0270】
(26) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの4つ又は5つ以上が、縦方向肺実質特徴又は縦方向体組成特徴である、実施態様23に記載の方法。
(27) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの2つ又は3つ以上が、肺実質特徴又は体組成特徴である、実施態様23に記載の方法。
(28) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうち3つ又は4つ以上が、肺実質特徴又は体組成特徴である、実施態様23に記載の方法。
(29) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの4つ又は5つ以上が、肺実質特徴又は体組成特徴である、実施態様23に記載の方法。
(30) 前記3年リスク予測モデルが、少なくとも0.70の曲線下面積(AUC)値を示す、実施態様23~29のいずれかに記載の方法。
【0271】
(31) 前記3年リスク予測モデルが、少なくとも5.0のオッズ比を示す、実施態様23~29のいずれかに記載の方法。
(32) 前記対象の肺がんの前記1つ又は2つ以上のリスクを予測することが、1年リスク予測モデルを適用して、前記対象に1年以内に肺がんが発生する可能性が高いかどうかを予測することを含む、実施態様20又は21に記載の方法。
(33) 前記対象が候補であると判定することが、Lung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、又はLung-RADS 4Bのうちの1つにおける前記対象の分類を取得することを含む、実施態様22~32のいずれかに記載の方法。
(34) 前記対象の肺がんの前記1つ又は2つ以上のリスクを予測することが、前記結節特異的特徴及び非結節特異的特徴を一緒に分析するように構成されているリスク予測モデルを適用することを含む、実施態様13~19のいずれかに記載の方法。
(35) 前記対象の肺がんの前記1つ又は2つ以上のリスクを予測することが、複数のリスク予測モデルを適用して、前記対象にN個の異なる期間内に肺がんが発生する可能性が高いかどうかを予測することを含む、実施態様1及び3~34のいずれかに記載の方法。
【0272】
(36) 前記N個の異なる期間のうちの少なくとも1つが、0ヶ月、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、1年、1.5年、2年、2.5年、3年、3.5年、4年、4.5年、5年、5.5年、6年、6.5年、7年、7.5年、8年、8.5年、9年、9.5年、10年、10.5年、11年、11.5年、12年、12.5年、13年、13.5年、14年、14.5年、15年、15.5年、16年、16.5年、17年、17.5年、18年、18.5年、19年、19.5年、又は20年のうちのいずれか1つである、実施態様35に記載の方法。
(37) Nが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20個の異なる期間である、実施態様35に記載の方法。
(38) 前記1つ又は2つ以上のリスク予測モデルのうちの1つが、Lung-RADS 1、Lung-RADS 1~2、Lung-RADS 1~3、Lung-RADS 1~4A、又はLung-RADS 1~4Bのうちのいずれかに分類された訓練個体の訓練コホートから捕捉された訓練画像を使用して肺がんの前記リスクを予測するように訓練されたものである、実施態様1~37のいずれかに記載の方法。
(39) 前記1つ又は2つ以上のリスク予測モデルのうちの1つが、Lung-RADS 1~3に分類された訓練個体の訓練コホートから捕捉された訓練画像を使用して肺がんの前記リスクを予測するように訓練されたものである、実施態様38に記載の方法。
(40) 前記訓練コホート内の訓練個体の大部分が、以前にLung-RADS 1に分類されたものである、実施態様38に記載の方法。
【0273】
(41) 前記1つ又は2つ以上の画像が、コンピュータ断層撮影(CT)画像又はX線画像である、実施態様1~40のいずれかに記載の方法。
(42) 前記1つ又は2つ以上の画像が、胸部CT画像又は胸のX線画像である、実施態様1~41のいずれかに記載の方法。
(43) 前記1つ又は2つ以上の画像が、第1の時点で前記対象から捕捉された少なくとも第1の画像と、第2の時点で前記対象から捕捉された少なくとも第2の画像と、を含む、実施態様1~42のいずれかに記載の方法。
(44) 前記リスク予測モデルが、国立肺スクリーニング試験(NLST)の訓練画像を使用して訓練されたものである、実施態様1~43のいずれかに記載の方法。
(45) 前記対象の肺がんの1つ又は2つ以上のリスクを予測する前に、
前記対象に対応する結節特異的特徴を取得すること、
前記結節特異的特徴に基づいて、前記対象がリスク予測のための候補であると判定すること、を更に含む、実施態様1~44のいずれかに記載の方法。
【0274】
(46) 前記対象が候補であると判定することは、前記対象が肺がんを有しないか、又は前記対象に肺がんが発生するリスクが低いと判定することを含む、実施態様45に記載の方法。
(47) 前記対象に肺がんが発生するリスクが低いと判定することが、前記結節特異的特徴に基づいて前記対象が結節を有しないと判定することを含む、実施態様46に記載の方法。
(48) 前記肺がんが、非小細胞肺がん又は小細胞肺がんのいずれかである、実施態様1~47のいずれかに記載の方法。
(49) 前記肺がんが、腺がん又は扁平上皮がんのいずれかである、実施態様1~47のいずれかに記載の方法。
(50) 肺がんの予測された前記リスクに基づいて、前記対象に対する臨床的対応を選択することを更に含む、実施態様1~49のいずれかに記載の方法。
【0275】
(51) 前記対象に対する臨床的対応を選択することが、前記対象を治療するための介入を選択することを含む、実施態様50に記載の方法。
(52) 介入を選択することが、前記対象への投与のための治療薬を選択することを含む、実施態様51に記載の方法。
(53) 選択された前記治療薬が、前記肺がんの前記発生を遅延させるか又は予防するために前記対象に予防的に投与される、実施態様52に記載の方法。
(54) 前記臨床的対応が、前記対象の行動を修正するために前記対象に助言を提供することを含む、実施態様50に記載の方法。
(55) 前記臨床的対応が、前記対象のフォローアップの頻度を増加させることを含む、実施態様50に記載の方法。
【0276】
(56) 前記臨床的対応が、肺がんの予測された前記リスクを確認するために追加のリスク予測試験を実行するか又は実行するようにスケジューリングすることを含む、実施態様50に記載の方法。
(57) 前記訓練されたリスク予測モデルのうちの1つ又は2つ以上が、ランダムフォレストモデル又は勾配ブーストモデルのうちの1つである、実施態様1~56のいずれかに記載の方法。
(58) 対象の肺がんの1つ又は2つ以上のリスクを予測するための非一時的なコンピュータ可読媒体であって、前記非一時的なコンピュータ可読媒体は、命令を含み、前記命令は、プロセッサによって実行されると、前記プロセッサに、
前記対象から捕捉された1つ又は2つ以上の画像を取得することと、
取得された前記1つ又は2つ以上の画像から特徴を抽出することであって、抽出された前記特徴が、少なくとも非結節特異的特徴を含み、前記非結節特異的特徴が、肺実質特徴、体組成特徴、縦方向肺実質特徴、又は縦方向体組成特徴のうちの1つ又は2つ以上を含む、抽出することと、
1つ又は2つ以上の訓練されたリスク予測モデルを適用して、取得された前記1つ又は2つ以上の画像から抽出された前記特徴を分析することによって、前記対象の肺がんの1つ又は2つ以上のリスクを予測することと、を行わせる、非一時的なコンピュータ可読媒体。
(59) 前記プロセッサに前記対象の肺がんの前記1つ又は2つ以上のリスクを予測させる前記命令が、前記プロセッサによって実行されると、前記プロセッサにM年リスク予測モデルを適用させて、前記対象にM年以内に肺がんが発生する可能性が高いかどうかを予測させる命令を更に含み、前記M年リスク予測モデルが、結節特異的特徴及び前記非結節特異的特徴を含み、
前記非結節特徴が、前記縦方向肺実質特徴及び前記縦方向体組成特徴を含み、
前記縦方向肺実質特徴が、前記肺実質のデンシトメトリー測定値の変化又は前記肺実質の局所ヒストグラム測定値の変化のうちの1つ又は2つ以上を含み、
前記縦方向体組成特徴が、胸筋断面積の変化、胸筋除脂肪断面積の変化、又は皮下脂肪断面積の変化のうちの1つ又は2つ以上を含む、実施態様58に記載の非一時的なコンピュータ可読媒体。
(60) 前記非結節特徴が、前記縦方向肺実質特徴及び前記縦方向体組成特徴を含む、実施態様58に記載の非一時的なコンピュータ可読媒体。
【0277】
(61) 前記非結節特徴が、前記肺実質特徴、前記体組成特徴、前記縦方向肺実質特徴、及び前記縦方向体組成特徴の各々を含む、実施態様58に記載の非一時的なコンピュータ可読媒体。
(62) 前記肺実質特徴が、前記肺実質のデンシトメトリー測定値又は前記肺実質の局所ヒストグラム測定値のうちの1つ又は2つ以上を含む、実施態様58及び60~61のいずれかに記載の非一時的なコンピュータ可読媒体。
(63) 前記縦方向肺実質特徴が、前記肺実質のデンシトメトリー測定値の変化又は前記肺実質の局所ヒストグラム測定値の変化のうちの1つ又は2つ以上を含む、実施態様58及び60~61のいずれかに記載の非一時的なコンピュータ可読媒体。
(64) 前記肺実質の前記デンシトメトリー測定値が、肺の低減衰領域の割合、肺の高減衰領域の割合、及び下部肺ゾーンと比較した上部肺ゾーンにおける低減衰領域又は高減衰領域の比のうちの1つ又は2つ以上を含む、実施態様62又は63に記載の非一時的なコンピュータ可読媒体。
(65) 前記肺実質の前記局所ヒストグラム測定値が、正常組織、小葉中心性肺気腫、小葉中心性結節、すりガラス、蜂巣肺、線状痕、結節性、網状、胸膜下ライン、他の肺気腫、又は嚢胞のいずれかによって占有される肺の1つ又は2つ以上の割合を含む、実施態様62又は63に記載の非一時的なコンピュータ可読媒体。
【0278】
(66) 前記体組成特徴が、胸筋断面積、胸筋除脂肪断面積、又は皮下脂肪断面積のうちの1つ又は2つ以上を含む、実施態様58に記載の非一時的なコンピュータ可読媒体。
(67) 前記縦方向体組成特徴が、胸筋断面積の変化、胸筋除脂肪断面積の変化、又は皮下脂肪断面積の変化のうちの1つ又は2つ以上を含む、実施態様58に記載の非一時的なコンピュータ可読媒体。
(68) 肺がんの前記1つ又は2つ以上のリスクが、既存の又は高頻度に見られるがんのリスクを含む、実施態様58~67のいずれかに記載の非一時的なコンピュータ可読媒体。
(69) 肺がんの前記1つ又は2つ以上のリスクが、がんが発生する将来のリスクを含む、実施態様58~67のいずれかに記載の非一時的なコンピュータ可読媒体。
(70) 抽出された前記特徴が、結節特異的特徴を更に含む、実施態様58及び60~69のいずれかに記載の非一時的なコンピュータ可読媒体。
【0279】
(71) 前記結節特異的特徴が、縦方向結節特異的特徴を含む、実施態様70に記載の非一時的なコンピュータ可読媒体。
(72) 前記結節特異的特徴が、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ、結節直径、Lung-RADSスコア、又はラジオミクス特徴のうちの1つ又は2つ以上を含む、実施態様70に記載の非一時的なコンピュータ可読媒体。
(73) 前記縦方向結節特異的特徴が、結節特異的減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化、結節直径の変化、Lung-RADSスコアの変化、又はラジオミクス特徴の変化のうちの1つ又は2つ以上を含む、実施態様71又は72に記載の非一時的なコンピュータ可読媒体。
(74) ラジオミクス特徴が、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存性行列のうちの1つ又は2つ以上を含む、実施態様72又は73に記載の非一時的なコンピュータ可読媒体。
(75) 前記結節特異的特徴が、放射線技師レポートから抽出される、実施態様70~74のいずれかに記載の非一時的なコンピュータ可読媒体。
【0280】
(76) 前記結節特異的特徴が、画像分析アルゴリズムを実装することによって計算的に抽出される、実施態様70~74のいずれかに記載の非一時的なコンピュータ可読媒体。
(77) 前記プロセッサに、前記対象の肺がんの前記1つ又は2つ以上のリスクを予測させる前記命令は、前記プロセッサによって実行されると、前記プロセッサにリスク予測モデルを適用させる命令を更に含み、前記リスク予測モデルが、
前記非結節特異的特徴を分析するように構成された第1のサブモデルと、
前記結節特異的特徴を分析するように構成された第2のサブモデルと、を含む、実施態様70~76のいずれかに記載の非一時的なコンピュータ可読媒体。
(78) 前記リスク予測モデルが、前記第1のサブモデル及び前記第2のサブモデルの予測された出力を分析して、前記対象の肺がんのリスクを予測するように構成された第3のサブモデルを更に含む、実施態様77に記載の非一時的なコンピュータ可読媒体。
(79) 前記プロセッサに、前記対象の肺がんの前記1つ又は2つ以上のリスクを予測させる前記命令は、前記プロセッサによって実行されると、前記プロセッサに5年リスク予測モデルを適用させて、前記対象に5年以内に肺がんが発生する可能性が高いかどうかを予測させる命令を含む、実施態様77又は78に記載の非一時的なコンピュータ可読媒体。
(80) 前記プロセッサに、前記対象の肺がんの前記1つ又は2つ以上のリスクを予測させる前記命令は、前記プロセッサによって実行されると、前記プロセッサに3年リスク予測モデルを適用させて、前記対象に3年以内に肺がんが発生する可能性が高いかどうかを予測させる命令を含む、実施態様77又は78に記載の非一時的なコンピュータ可読媒体。
【0281】
(81) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの2つ又は3つ以上が、縦方向肺実質特徴又は縦方向体組成特徴である、実施態様80に記載の非一時的なコンピュータ可読媒体。
(82) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの3つ又は4つ以上が、縦方向肺実質特徴又は縦方向体組成特徴である、実施態様80に記載の非一時的なコンピュータ可読媒体。
(83) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの4つ又は5つ以上が、縦方向肺実質特徴又は縦方向体組成特徴である、実施態様80に記載の非一時的なコンピュータ可読媒体。
(84) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの2つ又は3つ以上が、肺実質特徴又は体組成特徴である、実施態様80に記載の非一時的なコンピュータ可読媒体。
(85) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの3つ又は4つ以上が、肺実質特徴又は体組成特徴である、実施態様80に記載の非一時的なコンピュータ可読媒体。
【0282】
(86) 前記リスク予測モデルの前記第1のサブモデルの上位10個の重要な特徴のうちの4つ又は5つ以上が、肺実質特徴又は体組成特徴である、実施態様80に記載の非一時的なコンピュータ可読媒体。
(87) 前記3年リスク予測モデルが、少なくとも0.70の曲線下面積(AUC)値を示す、実施態様80~86のいずれかに記載の非一時的なコンピュータ可読媒体。
(88) 前記3年リスク予測モデルが、少なくとも5.0のオッズ比を示す、実施態様80~86のいずれかに記載の非一時的なコンピュータ可読媒体。
(89) 前記プロセッサに、前記対象の肺がんの前記1つ又は2つ以上のリスクを予測させる前記命令は、前記プロセッサによって実行されると、前記プロセッサに1年リスク予測モデルを適用させて、前記対象に1年以内に肺がんが発生する可能性が高いかどうかを予測させる命令を含む、実施態様77又は78に記載の非一時的なコンピュータ可読媒体。
(90) 前記プロセッサに、前記対象が候補であると判定させる前記命令は、前記プロセッサによって実行されると、前記プロセッサにLung-RADS 1、Lung-RADS 2、Lung-RADS 3、Lung-RADS 4A、又はLung-RADS 4Bのうちの1つにおける前記対象の分類を取得させる命令を更に含む、実施態様79~89のいずれかに記載の非一時的なコンピュータ可読媒体。
【0283】
(91) 前記プロセッサに、前記対象の肺がんの前記1つ又は2つ以上のリスクを予測させる前記命令は、前記プロセッサによって実行されると、前記プロセッサに、前記結節特異的特徴及び非結節特異的特徴を一緒に分析するように構成されているリスク予測モデルを適用させる命令を更に含む、実施態様70~76のいずれかに記載の非一時的なコンピュータ可読媒体。
(92) 前記対象の肺がんの前記1つ又は2つ以上のリスクを予測することが、複数のリスク予測モデルを適用して、前記対象にN個の異なる期間内に肺がんが発生する可能性が高いかどうかを予測することを含む、実施態様58~91のいずれかに記載の非一時的なコンピュータ可読媒体。
(93) 前記N個の異なる期間のうちの少なくとも1つが、0ヶ月、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、7ヶ月、8ヶ月、9ヶ月、10ヶ月、11ヶ月、1年、1.5年、2年、2.5年、3年、3.5年、4年、4.5年、5年、5.5年、6年、6.5年、7年、7.5年、8年、8.5年、9年、9.5年、10年、10.5年、11年、11.5年、12年、12.5年、13年、13.5年、14年、14.5年、15年、15.5年、16年、16.5年、17年、17.5年、18年、18.5年、19年、19.5年、又は20年のうちのいずれか1つである、実施態様92に記載の非一時的なコンピュータ可読媒体。
(94) Nが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20個の異なる期間である、実施態様92に記載の非一時的なコンピュータ可読媒体。
(95) 前記1つ又は2つ以上のリスク予測モデルのうちの1つが、Lung-RADS 1、Lung-RADS 1~2、Lung-RADS 1~3、Lung-RADS 1~4A、又はLung-RADS 1~4Bのうちのいずれかに分類された訓練個体の訓練コホートから捕捉された訓練画像を使用して肺がんの前記リスクを予測するように訓練されたものである、実施態様58~94のいずれかに記載の非一時的なコンピュータ可読媒体。
【0284】
(96) 前記1つ又は2つ以上のリスク予測モデルのうちの1つが、Lung-RADS 1~3に分類された訓練個体の訓練コホートから捕捉された訓練画像を使用して肺がんの前記リスクを予測するように訓練されたものである、実施態様95に記載の非一時的なコンピュータ可読媒体。
(97) 前記訓練コホート内の訓練個体の大部分が、以前にLung-RADS 1に分類されたものである、実施態様96に記載の非一時的なコンピュータ可読媒体。
(98) 前記1つ又は2つ以上の画像が、コンピュータ断層撮影(CT)画像又はX線画像である、実施態様58~97のいずれかに記載の非一時的なコンピュータ可読媒体。
(99) 前記1つ又は2つ以上の画像が、胸部CT画像又は胸のX線画像である、実施態様58~98のいずれかに記載の非一時的なコンピュータ可読媒体。
(100) 前記1つ又は2つ以上の画像が、第1の時点で前記対象から捕捉された少なくとも第1の画像と、第2の時点で前記対象から捕捉された少なくとも第2の画像と、を含む、実施態様58~99のいずれかに記載の非一時的なコンピュータ可読媒体。
【0285】
(101) 前記リスク予測モデルが、国立肺スクリーニング試験(NLST)の訓練画像を使用して訓練されたものである、実施態様58~100のいずれかに記載の非一時的なコンピュータ可読媒体。
(102) プロセッサによって実行されると、前記プロセッサに、
前記対象の肺がんの1つ又は2つ以上のリスクを予測する前に、
前記対象に対応する結節特異的特徴を取得すること、
前記結節特異的特徴に基づいて、前記対象がリスク予測のための候補であると判定すること、を行わせる命令を更に含む、実施態様58~101のいずれかに記載の非一時的なコンピュータ可読媒体。
(103) 前記プロセッサに、前記対象が候補であると判定させる前記命令が、前記プロセッサによって実行されると、前記プロセッサに、前記対象が肺がんを有しないか、又は前記対象に肺がんが発生するリスクが低いと判定させる命令を更に含む、実施態様102に記載の非一時的なコンピュータ可読媒体。
(104) 前記プロセッサに、前記対象に肺がんが発生するリスクが低いと判定させる前記命令が、前記プロセッサによって実行されると、前記プロセッサに、前記結節特異的特徴に基づいて前記対象が結節を有しないと判定させる命令を更に含む、実施態様103に記載の非一時的なコンピュータ可読媒体。
(105) 前記肺がんが、非小細胞肺がん又は小細胞肺がんのいずれかである、実施態様58~104のいずれかに記載の非一時的なコンピュータ可読媒体。
【0286】
(106) 前記肺がんが、腺がん又は扁平上皮がんのいずれかである、実施態様58~104のいずれかに記載の非一時的なコンピュータ可読媒体。
(107) プロセッサによって実行されると、前記プロセッサに、肺がんの予測された前記リスクに基づいて前記対象に対する臨床的対応を選択させる命令を更に含む、実施態様58~106のいずれかに記載の非一時的なコンピュータ可読媒体。
(108) 前記プロセッサに前記対象に対する臨床的対応を選択させる前記命令が、前記プロセッサによって実行されると、前記プロセッサに前記対象を治療するための介入を選択させる命令を更に含む、実施態様107に記載の非一時的なコンピュータ可読媒体。
(109) 前記プロセッサに介入を選択させる前記命令が、前記プロセッサによって実行されると、前記プロセッサに前記対象への投与のための治療薬を選択させる命令を更に含む、実施態様108に記載の非一時的なコンピュータ可読媒体。
(110) 選択された前記治療薬が、前記肺がんの前記発生を遅延させるか又は予防するために前記対象に予防的に投与される、実施態様109に記載の非一時的なコンピュータ可読媒体。
【0287】
(111) 前記臨床的対応が、前記対象の行動を修正するために前記対象に助言を提供することを含む、実施態様107に記載の非一時的なコンピュータ可読媒体。
(112) 前記臨床的対応が、前記対象のフォローアップの頻度を増加させることを含む、実施態様107に記載の非一時的なコンピュータ可読媒体。
(113) 前記臨床的対応が、肺がんの予測された前記リスクを確認するために追加のリスク予測試験を実行するか又は実行するようにスケジューリングすることを含む、実施態様107に記載の非一時的なコンピュータ可読媒体。
(114) 前記訓練されたリスク予測モデルのうちの1つ又は2つ以上が、ランダムフォレストモデル又は勾配ブーストモデルのうちの1つである、実施態様58~113のいずれかに記載の非一時的なコンピュータ可読媒体。
(115) 対象の肺がんの1つ又は2つ以上のリスクを予測するための方法であって、
前記対象から捕捉された1つ又は2つ以上の画像を取得することと、
取得された前記1つ又は2つ以上の画像から特徴を抽出することであって、抽出された前記特徴が、少なくとも結節特異的特徴を含む、抽出することと、
1つ又は2つ以上の訓練されたリスク予測モデルを適用して、取得された前記1つ又は2つ以上の画像から抽出された前記特徴を分析することによって、前記対象の肺がんの1つ又は2つ以上のリスクを予測することと、を含む、方法。
【0288】
(116) 前記結節特異的特徴が、縦方向結節特異的特徴を含む、実施態様115に記載の方法。
(117) 前記結節特異的特徴が、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ、結節直径、Lung-RADSスコア、又はラジオミクス特徴のうちの1つ又は2つ以上を含む、実施態様115又は116に記載の方法。
(118) 前記縦方向結節特異的特徴が、結節特異的減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化、結節直径の変化、Lung-RADSスコアの変化、又はラジオミクス特徴の変化のうちの1つ又は2つ以上を含む、実施態様116又は117に記載の方法。
(119) ラジオミクス特徴が、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存性行列のうちの1つ又は2つ以上を含む、実施態様117又は118に記載の方法。
(120) 前記結節特異的特徴が、放射線技師レポートから抽出される、実施態様115~119のいずれかに記載の方法。
【0289】
(121) 前記結節特異的特徴が、画像分析アルゴリズムを実装することによって計算的に抽出される、実施態様115~119のいずれかに記載の方法。
(122) 前記対象から捕捉された前記1つ又は2つ以上の画像が、がん性であると疑われる1つ又は2つ以上の結節を含む、実施態様115~120のいずれかに記載の方法。
(123) 前記対象の肺がんの1つ又は2つ以上のリスクを予測することが、
前記1つ又は2つ以上の結節の各々について、前記1つ又は2つ以上の訓練されたリスク予測モデルを適用して、前記結節から抽出された特徴を分析することによって、前記結節をがん性又は非がん性として分類することと、
がん性又は非がん性として分類された前記1つ又は2つ以上の結節に基づいて、前記対象における既存のがんの存在又は不在を判定することと、を含む、実施態様122に記載の方法。
(124) がん性又は非がん性として分類された前記1つ又は2つ以上の結節に基づいて、前記対象における既存のがんの存在又は不在を判定することが、
少なくとも1つの結節ががん性として分類されたことに応答して、前記対象が既存のがんの存在を有すると判定することを含む、実施態様123に記載の方法。
(125) がん性又は非がん性として分類された前記1つ又は2つ以上の結節に基づいて、前記対象における既存のがんの存在又は不在を判定することが、
少なくとも2つ、少なくとも3つ、少なくとも4つ、又は少なくとも5つの結節ががん性として分類されたことに応答して、前記対象が既存のがんの存在を有すると判定することを含む、実施態様123に記載の方法。
【0290】
(126) がん性又は非がん性として分類された前記1つ又は2つ以上の結節に基づいて、前記対象における既存のがんの存在又は不在を判定することが、
0個の結節ががん性として分類されたことに応答して、前記対象が既存のがんの不在を有すると判定することを含む、実施態様123に記載の方法。
(127) 対象の肺がんの1つ又は2つ以上のリスクを予測するための非一時的なコンピュータ可読媒体であって、前記非一時的なコンピュータ可読媒体は、命令を含み、前記命令は、プロセッサによって実行されると、前記プロセッサに、
前記対象から捕捉された1つ又は2つ以上の画像を取得することと、
取得された前記1つ又は2つ以上の画像から特徴を抽出することであって、抽出された前記特徴が、少なくとも結節特異的特徴を含む、抽出することと、
1つ又は2つ以上の訓練されたリスク予測モデルを適用して、取得された前記1つ又は2つ以上の画像から抽出された前記特徴を分析することによって、前記対象の肺がんの1つ又は2つ以上のリスクを予測することと、を行わせる、非一時的なコンピュータ可読媒体。
(128) 前記結節特異的特徴が、縦方向結節特異的特徴を含む、実施態様127に記載の非一時的なコンピュータ可読媒体。
(129) 前記結節特異的特徴が、結節特異的減衰、結節マージン記述、結節サイズ、結節形状、結節テクスチャ、結節直径、Lung-RADSスコア、又はラジオミクス特徴のうちの1つ又は2つ以上を含む、実施態様127又は128に記載の非一時的なコンピュータ可読媒体。
(130) 前記縦方向結節特異的特徴が、結節特異的減衰の変化、結節マージン記述の変化、結節サイズの変化、結節形状の変化、結節テクスチャの変化、結節直径の変化、Lung-RADSスコアの変化、又はラジオミクス特徴の変化のうちの1つ又は2つ以上を含む、実施態様128又は129に記載の非一時的なコンピュータ可読媒体。
【0291】
(131) ラジオミクス特徴が、一次統計、3D形状ベースの特徴、2D形状ベースの特徴、グレーレベル同時生起行列、グレーレベルランレングス行列、グレーレベルサイズゾーン行列、隣接グレートーン差行列、及びグレーレベル依存性行列のうちの1つ又は2つ以上を含む、実施態様129又は130に記載の非一時的なコンピュータ可読媒体。
(132) 前記結節特異的特徴が、放射線技師レポートから抽出される、実施態様127~131のいずれかに記載の非一時的なコンピュータ可読媒体。
(133) 前記結節特異的特徴が、画像分析アルゴリズムを実装することによって計算的に抽出される、実施態様127~131のいずれかに記載の非一時的なコンピュータ可読媒体。
(134) 前記対象から捕捉された前記1つ又は2つ以上の画像が、がん性であると疑われる1つ又は2つ以上の結節を含む、実施態様127~133のいずれかに記載の非一時的なコンピュータ可読媒体。
(135) 前記プロセッサに前記対象の肺がんの前記1つ又は2つ以上のリスクを予測させる前記命令が、前記プロセッサによって実行されると、前記プロセッサに、
前記1つ又は2つ以上の結節の各々について、前記1つ又は2つ以上の訓練されたリスク予測モデルを適用して、前記結節から抽出された特徴を分析することによって、前記結節をがん性又は非がん性として分類することと、
がん性又は非がん性として分類された前記1つ又は2つ以上の結節に基づいて、前記対象における既存のがんの存在又は不在を判定することと、を行わせる命令を更に含む、実施態様134に記載の非一時的なコンピュータ可読媒体。
【0292】
(136) 前記プロセッサに、がん性又は非がん性として分類された前記1つ又は2つ以上の結節に基づいて、前記対象における既存のがんの存在又は不在を判定させる前記命令が、前記プロセッサによって実行されると、前記プロセッサに、
少なくとも1つの結節ががん性として分類されたことに応答して、前記対象が既存のがんの存在を有すると判定させる命令を更に含む、実施態様135に記載の非一時的なコンピュータ可読媒体。
(137) 前記プロセッサに、がん性又は非がん性として分類された前記1つ又は2つ以上の結節に基づいて、前記対象における既存のがんの存在又は不在を判定させる前記命令が、前記プロセッサによって実行されると、前記プロセッサに、
少なくとも2つ、少なくとも3つ、少なくとも4つ、又は少なくとも5つの結節ががん性として分類されたことに応答して、前記対象が既存のがんの存在を有すると判定させる命令を更に含む、実施態様135に記載の非一時的なコンピュータ可読媒体。
(138) 前記プロセッサに、がん性又は非がん性として分類された前記1つ又は2つ以上の結節に基づいて、前記対象における既存のがんの存在又は不在を判定させる前記命令が、前記プロセッサによって実行されると、前記プロセッサに、
0個の結節ががん性として分類されたことに応答して、前記対象が既存のがんの不在を有すると判定させる命令を更に含む、実施態様135に記載の非一時的なコンピュータ可読媒体。
【国際調査報告】