特表2024-529749 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ クリンリスク，インコーポレイテッドの特許一覧

特表2024-529749腎機能低下を予測するシステムおよび方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3A
3B
3C
3D
4
5
6A
6B
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26A
26B
27A
27B
27C
27D
28
29
30
31
32
33
34
35A
35B
36
37A
37B
38
39

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-08-08

(54)【発明の名称】腎機能低下を予測するシステムおよび方法

(51)【国際特許分類】

G16H 10/40 20180101AFI20240801BHJP

【ＦＩ】

G16H10/40

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2024510262

(86)(22)【出願日】2022-08-17

(85)【翻訳文提出日】2024-04-15

(86)【国際出願番号】 US2022040605

(87)【国際公開番号】W WO2023023159

(87)【国際公開日】2023-02-23

(31)【優先権主張番号】63/234,535

(32)【優先日】2021-08-18

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】524062098

【氏名又は名称】クリンリスク，インコーポレイテッド

(74)【代理人】

【識別番号】100118902

【弁理士】

【氏名又は名称】山本修

(74)【代理人】

【識別番号】100106208

【弁理士】

【氏名又は名称】宮前徹

(74)【代理人】

【識別番号】100196508

【弁理士】

【氏名又は名称】松尾淳一

(74)【代理人】

【識別番号】100138759

【弁理士】

【氏名又は名称】大房直樹

(72)【発明者】

【氏名】タングリ，ナブディープ

【テーマコード（参考）】

5L099

【Ｆターム（参考）】

5L099AA03

5L099AA04

(57)【要約】

慢性腎疾患（ＣＫＤ）進行予測を生成する方法は、訓練データ集合に対して訓練される機械学習モデルにアクセスするステップを含み、訓練データ集合が、（ｉ）複数の患者に関連する医療研究室データの第１集合と、（ｉｉ）複数の患者に含まれる各患者の年齢と、（ｉｉｉ）複数の患者に含まれる各患者の性別とを含む。医療研究室データの第１集合は、複数の患者に含まれる患者の少なくとも１つの組み合わせについて、２０通りの医療測定値を示す。この方法は、更に、新たな患者に関連する入力データ集合を機械学習モデルに投入することによって、新たな患者についてＣＫＤ進行予測を生成するステップも含む。入力データ集合は、新たな患者の年齢および性別、ならびに医療研究室データの第２集合を含む。医療研究室データの第２集合は、新たな患者について少なくとも２０通りの医療測定値を示す。
【選択図】図２

【特許請求の範囲】

【請求項1】

方法であって、
慢性腎疾患（ＣＫＤ）進行予測を生成するように構成された機械学習モデルにアクセスするステップであって、
前記機械学習モデルが、（ｉ）複数の患者に関連する医療研究室データの第１集合と、（ｉｉ）前記複数の患者に含まれる各患者の年齢と、（ｉｉｉ）前記複数の患者に含まれる各患者の性別とを含む訓練データ集合に対して訓練され、
前記医療研究室データの第１集合が、前記複数の患者に含まれる患者の少なくとも１つの組み合わせについて、推算糸球体濾過量（ｅＧＦＲ）、尿アルブミン／クレアチニン比（ＡＣＲ）、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、アルカリホスファターゼ、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、アスパラギン酸アミノトランスフェラーゼ（ＡＳＴ）、アラニン・アミノトランスアミナーゼ（ＡＬＴ）、ビリルビン、ガンマ－グルタミル・トランスフェラーゼ（ＧＧＴ）、ヘマトクリット、および血小板数を示す、ステップと、
新たな患者に関連する入力データ集合を前記機械学習モデルに投入することによって、前記新たな患者についてＣＫＤ進行予測を生成するステップであって、
前記新たな患者についての前記ＣＫＤ進行予測が、前記新たな患者に関連する前記入力データ集合を前記機械学習モデルに投入したことによって得られる前記機械学習モデルの出力に基づき、
前記入力データ集合が、前記新たな患者の年齢と、前記新たな患者の性別と、医療研究室データの第２集合とを含み、
前記第２集合が、前記新たな患者について、ｅＧＦＲ、尿ＡＣＲ、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、アルカリホスファターゼ（ＡＬＫＰ）、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、ＡＳＴ、ＡＬＴ、ビリルビン、ＧＧＴ、ヘマトクリット、および血小板数の内１つ以上を示す、ステップと、
を含む、方法。

【請求項2】

請求項１記載の方法において、前記新たな患者が、Ｇ３以降のＣＫＤ病期とは関連付けられない、方法。

【請求項3】

請求項１記載の方法において、前記機械学習モデルが、ランダム・サバイバル・フォレスト・モデルを含む、方法。

【請求項4】

請求項１記載の方法において、前記ＣＫＤ進行予測が、前記新たな患者についての入力データ集合に関連する時間期間から特定の時間量以内においてＣＫＤ進行を生ずるリスクを示す、方法。

【請求項5】

請求項４記載の方法において、前記特定の時間量が、前記ＣＤＫ進行予測を生成する前記機械学習モデルに入力として供給される、方法。

【請求項6】

請求項４記載の方法において、前記特定の時間量が、２年または５年を含む、方法。

【請求項7】

請求項１記載の方法において、前記複数の患者の内１人以上または前記新たな患者についての前記尿ＡＣＲが、尿タンパク／クレアチニン検査または尿中一般物質定性半定量検査から変換される、方法。

【請求項8】

請求項１記載の方法において、前記ＣＫＤ進行予測が、前記新たな患者が腎不全を発症するリスク、または前記新たな患者にｅＧＦＲの４０％以上の低下が発生するリスクの予測を含む、方法。

【請求項9】

請求項８記載の方法において、前記腎不全のリスクが、前記新たな患者には、（ｉ）長期透析を必要とするリスク、（ｉｉ）腎臓移植を必要とするリスク、または（ｉｉｉ）１０ｍｌ／分／１．７３ｍ^２未満の糸球体濾過量が発生するリスクがあることの指示を含む、方法。

【請求項10】

請求項１記載の方法であって、更に、
前記ＣＫＤ進行予測が、１つ以上の予測リスク閾値を満たす特定の時間期間内に、前記新たな患者がＣＫＤを発症するリスクの予測を示すと判定するステップと、
（ｉ）前記新たな患者が腎臓介入治療を必要とする可能性があるという通知を生成するステップ、
（ｉｉ）前記ＣＫＤ進行予測に基づいて、前記新たな患者に腎臓介入治療の推奨を生成するステップ、
（ｉｉｉ）前記ＣＫＤ進行予測に基づいて、前記新たな患者にＣＫＤ進行の監視頻度の推奨を生成するステップ、または
（ｉｖ）前記新たな患者に腎臓介入治療を施術するステップ、
を含む、方法。

【請求項11】

請求項１０記載の方法において、前記１つ以上の予測リスク閾値が、前記ＣＫＤ進行予測に関連する前記特定の時間期間に基づく、方法。

【請求項12】

請求項１０記載の方法において、前記腎臓介入治療の推奨、または前記ＣＫＤ進行の監視頻度の推奨が、更に、前記新たな患者に関連する前記医療研究室データの第２集合の内少なくとも一部にも基づく、方法。

【請求項13】

請求項１０記載の方法において、前記腎臓介入治療が、レニン-アンジオテンシン-アルドステロン系（ＲＡＡＳ）阻害、血圧管理、ナトリウム・グルコース共役輸送体－２（ＳＧＬＴ２）阻害薬、ミネラルコルチコイド受容体拮抗薬（ＭＲＡ）治療、あるいは腎臓内科の診察、家庭透析、透析アクセス、または腎移植のための準備の内１つ以上を含む、方法。

【請求項14】

請求項１記載の方法において、前記医療研究室データの第１集合が、欠損値の代わりに、１つ以上の代入値を含む、方法。

【請求項15】

請求項１４記載の方法において、前記医療研究室データの第１集合が、３０％以下の値代入度で、ｅＧＦＲ、尿ＡＣＲ、尿素、カリウム、ヘモグロビン、血小板数、アルブミン、カルシウム、グルコース、ビリルビン、ナトリウム、重炭酸塩、およびＧＧＴを示す、方法。

【請求項16】

システムであって、
１つ以上のプロセッサと、
前記１つ以上のプロセッサによって実行可能である命令を格納する１つ以上のハードウェア記憶デバイスと、
を備え、
前記命令が、前記システムを、
訓練データ集合にアクセスするように構成し、
前記訓練データ集合が、（ｉ）複数の患者に関連する医療研究室データの第１集合と、（ｉｉ）前記複数の患者に含まれる各患者の年齢と、（ｉｉｉ）前記複数の患者に含まれる各患者の性別とを含み、
前記医療研究室データの第１集合が、前記複数の患者に含まれる患者の少なくとも１つの組み合わせについて、推算糸球体濾過量（ｅＧＦＲ）、尿アルブミン／クレアチニン比（ＡＣＲ）、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、アルカリホスファターゼ、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、アスパラギン酸アミノトランスフェラーゼ（ＡＳＴ）、アラニン・アミノトランスアミナーゼ（ＡＬＴ）、ビリルビン、ガンマ－グルタミル・トランスフェラーゼ（ＧＧＴ）、ヘマトクリット、および血小板数を示し、
前記命令が、更に、前記システムを、
前記訓練データ集合を、訓練されていないモデルに適用することによって、機械学習モデルを生成するように構成し、
前記機械学習モデルが、新たな患者に関連する入力データ集合を前記機械学習モデルに投入することによって、前記新たな患者について慢性腎疾患（ＣＫＤ）進行予測を生成するように構成され、
前記入力データ集合が、前記新たな患者の年齢と、前記新たな患者の性別と、医療研究室データの第２集合とを含み、前記第２集合が、前記新たな患者について、ｅＧＦＲ、尿ＡＣＲ、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、アルカリホスファターゼ（ＡＬＫＰ）、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、ＡＳＴ、ＡＬＴ、ビリルビン、ＧＧＴ、ヘマトクリット、および血小板数の内１つ以上を示す、システム。

【請求項17】

請求項１６記載のシステムにおいて、前記機械学習モデルが、ランダム・サバイバル・フォレスト・モデルを含む、システム。

【請求項18】

システムの１つ以上のプロセッサによって実行可能である命令を格納する１つ以上のハードウェア記憶デバイスであって、前記命令が、前記システムを、
慢性腎疾患（ＣＫＤ）進行予測を生成するように構成された機械学習モデルにアクセスするように構成し、前記機械学習モデルが、（ｉ）複数の患者に関連する医療研究室データの第１集合と、（ｉｉ）前記複数の患者に含まれる各患者の年齢と、（ｉｉｉ）前記複数の患者に含まれる各患者の性別とを含む訓練データ集合に対して訓練され、前記医療研究室データの第１集合が、前記複数の患者に含まれる患者の少なくとも１つの組み合わせについて、尿アルブミン／クレアチニン比（ＡＣＲ）、推算糸球体濾過量（ｅＧＦＲ）、尿素、ヘモグロビンを示し、
新たな患者に関連する入力データ集合を前記機械学習モデルに投入することによって、前記新たな患者についてＣＫＤ進行予測を生成するように構成し、前記新たな患者についての前記ＣＫＤ進行予測が、前記新たな患者に関連する前記入力データ集合を前記機械学習モデルに投入したことによって得られる前記機械学習モデルの出力に基づき、前記入力データ集合が、前記新たな患者の年齢と、前記新たな患者の性別と、医療研究室データの第２集合とを含み、前記第２集合が、前記新たな患者について、尿化学検査、包括的代謝パネル、全血球計算、肝臓パネル、または尿酸検査の内１つ以上の項目を含む、１つ以上のハードウェア記憶デバイス。

【請求項19】

請求項１８記載の１つ以上のハードウェア記憶デバイスにおいて、前記医療研究室データの第２集合が、前記新たな患者についての前記尿化学検査の１つ以上の項目を含む、１つ以上のハードウェア記憶デバイス。

【請求項20】

請求項１９記載の１つ以上のハードウェア記憶デバイスにおいて、前記医療研究室データの第２集合が、前記新たな患者についての前記尿化学検査および包括的代謝パネルの内１つ以上の項目を含む、１つ以上のハードウェア記憶デバイス。

【発明の詳細な説明】

【背景技術】

【0001】

関連出願に対する相互引用
[0001] 本願は、“SYSTEMS AND METHODS FOR PREDICTING KIDNEY FUNCTION DECLINE”（腎機能低下を予測するシステムおよび方法）と題し、２０２１年８月１８日に出願された米国仮特許出願第６３／２３４，５３５号の優先権を主張する。この特許出願をここで引用したことにより、その内容全体が本願にも含まれるものとする。

【0002】

[0002] 慢性腎疾患（ＣＫＤ：chronic kidney disease）は、現在世界中で８億５千万人を超える成人が罹患しており、高い罹患率および死亡率、ならびに高い医療費が伴う。実例をあげると、２００９年では、ＣＫＤ、例えば、腎不全の末期または末期腎臓病（ＥＳＲＤ：end-stage renal disease）の治療には、米国だけでも４００億ドルの費用が必要であった。ＣＫＤ患者の内、腎不全に至るのはほんの少数であるが、透析を必要とする臓器不全に至る前において、ＣＫＤの進行期(more advanced stages)に進む個人によって、ＣＫＤに伴う過大な罹患率および費用の多くが引き上げられている(driven)。

【0003】

[0003] リソース効率的で適切な治療をＣＫＤ患者に行うことは、この病気に苦しむ人々には恩恵があり、増々負担が増えつつある健康管理システムにおけるリソース割り当ての改善に供する。個人毎にＣＫＤ進行のリスクを精度高く予測できれば、患者と知識を共有し、更に意志決定を共有することによって、患者の体験および転帰を改善することが可能になり、治療のリスクおよび危害の病気進行リスクに対する適合性を高めることによって、医療看護を向上させること(enhance care)が可能になり、および／またはリソース割り当てと個々人のリスクとの間における整合性向上を推し進めることによって、医療制度(health system)の効率を高めることが可能になる。

【発明の概要】

【0004】

[0004] したがって、個人に合わせてＣＫＤ進行のリスクを予測する技法を改良することが求められている。

【図面の簡単な説明】

【0005】

[0005] 以上で引用した利点および特徴ならびに他の利点および特徴を得ることができる態様を説明するために、以上で端的に説明した主題について、添付図面に図示する特定的な実施形態を参照しながら、更に特定して説明する。これらの図面は典型的な実施形態を図示するに過ぎず、したがってその範囲を限定するように見なしてはならないことを理解の上で、添付図面の使用を通じて、更に具体的にそして詳細に、実施形態について説明する(described and explained)。

【図1】[0006] 開示する実施形態を組み込み、および／またはこれらの実施形態を実現するために利用されるコンピューティング・システム例を含む、コンピューティング環境例を示す。

【図2】[0007] 医療研究室データを含む訓練データ集合に対して訓練され、慢性腎疾患の進行予測を生成するように構成された機械学習モデルの一例の概念表現を示す。

【図3A】[0008] 慢性腎疾患の進行予測を生成することに関連するアクトを表す流れ図例を示す。

【図3B】慢性腎疾患の進行予測を生成することに関連するアクトを表す流れ図例を示す。

【図3C】慢性腎疾患の進行予測を生成することに関連するアクトを表す流れ図例を示す。

【図3D】慢性腎疾患の進行予測を生成することに関連するアクトを表す流れ図例を示す。

【図4】[0009] 慢性腎疾患の進行予測に関連する報告例を示す。

【図5】[0010] データ集合を訓練する機械学習モデルを生成する元となる、患者のコホート例を模式的に示す。

【図6A】[0011] 患者毎の医療研究室データに含ませる種々の検査結果を含む、ベースライン・コホート(baseline cohort)例の記述を含む表を示す。

【図6B】[0012] 図６Ａにおいて記述したような、ベースライン・コホートにおける変数欠損度(missingness)の概要を含む表を示す。

【図7】[0013] 透析および腎移植を定めるために使用されるタリフ・コード(tariff codes)の別表である。

【図8】[0014] データ集合を訓練する機械学習モデルに含まれる変数毎の変数重要度(variable importance)の概要を示す表である。

【図9】[0015] １０変数医療研究室データ集合を含む訓練データ集合の一例の概念的表現を示す。

【図10】[0016] ランダム・フォレスト・モデルとして構成された機械学習モデルに対する較正プロット例を示すグラフである（例えば、２年の時間期間に対して、図９に示すような訓練データ集合を使用する）。

【図11】[0017] ランダム・フォレスト・モデルとして構成された機械学習モデルに対する較正プロット例を示すグラフである（例えば、５年の時間期間に対して、図９に示すような訓練データ集合を使用する）。

【図12】[0018] コックス・モデルとして構成された機械学習モデルに対する較正プロット例を示すグラフである（例えば、２年の時間期間に対して、図９に示すような訓練データ集合を使用する）。

【図13】[0019] コックス・モデルとして構成された機械学習モデルに対する較正プロット例を示すグラフである（例えば、５年の時間期間に対して、図９に示すような訓練データ集合を使用する）。

【図14】[0020] ９変数医療研究室データを含み、慢性腎疾患の進行予測を生成するように構成された訓練データ集合に対して訓練された機械学習の一例を示す。

【図15】[0021] 例えば、２年の時間期間に対して、図１４に示すような訓練データ集合を使用して、コックス・モデルとして構成された機械学習モデルに対する較正プロット例を示すグラフである。

【図16】[0022] 例えば、５年の時間期間に対して、図１４に示すような訓練データ集合を使用して、コックス・モデルとして構成された機械学習モデルに対する較正プロット例を示すグラフである。

【図17】[0023] １６～２２変数医療研究室データ集合を含む訓練データ集合の一例を示す。

【図18】[0024] 例えば、２年の時間期間に対して、図１７に示すような訓練データ集合を使用する機械学習モデルに対する較正プロット例を示すグラフを示す。

【図19】例えば、２年の時間期間に対して、図１７に示すような訓練データ集合を使用する機械学習モデルに対する較正プロット例を示すグラフを示す。

【図20】例えば、２年の時間期間に対して、図１７に示すような訓練データ集合を使用する機械学習モデルに対する較正プロット例を示すグラフを示す。

【図21】[0025] 少なくとも１５変数医療研究室データ集合を含む訓練データ集合の一例を示す。

【図22】[0026] 例えば、２年の時間期間に対して、図２１に示すような訓練データ集合を使用する機械学習モデルに対する較正プロット例を示すグラフである。

【図23】[0027] 例えば、５年の時間期間に対して、図２３に示すような訓練データ集合を使用する機械学習モデルに対する較正プロット例を示すグラフである。

【図24】[0028] 本明細書において開示され、コックス・モデルとして構成された機械学習モデルの種々の例について、性能評価統計の一概要例を示す表を示す。

【図25】[0029] 本明細書において開示され、コックス・モデルとして構成された機械学習モデルの種々の例に対する較正プロットを示す。

【図26A】[0030] ランダム・フォレスト・モデルとして構成された機械学習モデルの種々の例について、性能評価統計の種々の概要例を表す表を示す。

【図26B】図２６Ｂは、ランダム・フォレスト・モデルとして構成された機械学習モデルの種々の例について、性能評価統計の種々の概要例を表す表を示す。

【図27A】[0031] 糖尿病患者に対するサブグループ分析におけるランダム・フォレスト・モデルに対する較正プロット例を示すグラフである。

【図27B】[0032] 糖尿病ではない患者に対するサブグループ分析におけるランダム・フォレスト・モデルに対する較正プロット例を示すグラフである。

【図27C】[0033] 種々の病期にあるＣＫＤ患者に対するサブグループ分析におけるランダム・フォレスト・モデルに対する較正プロット例を示すグラフである。

【図27D】図２７Ｄは、種々の病期にあるＣＫＤ患者に対するサブグループ分析におけるランダム・フォレスト・モデルに対する較正プロット例を示すグラフである。

【図28】[0034] ＣＫＤ進行予測を生成するランダム・サバイバル・フォレスト・モデルの一例を外部から検証するために使用される検証コホートの態様を示す。

【図29】[0035] ＣＫＤ進行予測を生成するランダム・サバイバル・フォレスト・モデルの一例を構築する(develop)ために使用される研究室パネルに対する欠損度(degree of missingness)の概要を示す。

【図30】[0036] ＣＫＤ進行予測を生成するランダム・サバイバル・フォレスト・モデルの一例を構築するための訓練データ集合を生成するために、透析および移植を識別するタリフ・コードの概要を示す。

【図31】[0037] ＣＫＤ進行予測を生成する２２変数サバイバル・フォレストの一例について、変数重要度(variable importance)を示す。

【図32】[0038] ＣＫＤ進行予測を生成するランダム・サバイバル・フォレスト・モデルの一例を構築するための訓練コホート、内部検査コホート、および外部検証コホートに対するベースライン記述統計(baseline descriptive statistics)の概要を示す。

【図33】[0039] ＣＫＤ進行予測を生成するための、２２個の変数を有するランダム・サバイバル・フォレスト・モデルの一例について、１～５年におけるＡＵＣおよびブライア(Brier)スコアを示す。

【図34】[0040] ＣＫＤ進行予測を生成するための、２２個の変数を有するランダム・サバイバル・フォレスト・モデルの一例について、内部検査および外部検証コホートに対するＡＵＣおよびブライア・スコアを示す。

【図35A】[0041] ２年目におけるＣＫＤ進行予測を生成するための、２２個の変数を有するランダム・サバイバル・フォレスト・モデルの一例に対する種々の較正チャートを示す。

【図35B】図３５Ｂは、２年目におけるＣＫＤ進行予測を生成するための、２２個の変数を有するランダム・サバイバル・フォレスト・モデルの一例に対する種々の較正チャートを示す。

【図36】[0042] ＣＫＤ進行予測を生成するための、２２個の変数を有するランダム・サバイバル・フォレスト・モデルの一例の性能概要を示す。

【図37A】[0043] ５年目におけるＣＫＤ進行予測を生成するための、２２個の変数を有するランダム・サバイバル・フォレスト・モデルの一例に対する種々の較正チャートを示す。

【図37B】５年目におけるＣＫＤ進行予測を生成するための、２２個の変数を有するランダム・サバイバル・フォレスト・モデルの一例に対する種々の較正チャートを示す。

【図38】[0044] ＣＫＤ進行予測を生成するヒープマップ・モデル(heapmap model)の結果を示す。

【図39】[0045] ＣＫＤ進行予測を生成する医療モデルの結果を示す。

【発明を実施するための形態】

【0006】

[0046] 開示する実施形態は、ＣＫＤ進行の危険に晒された患者に対する医療判断において、ＣＫＤ進行を予測するため、および／または医師(practitioner)を導くために、機械学習モデルを訓練および／または利用するシステム、方法、および／またはフレームワークの改良を対象とする。

【0007】

[0047] 腎不全リスク予想式（ＫＦＲＥ：Kidney Failure Risk Equation）は、個々のＣＫＤ患者について腎不全進行の危険度を予測する、国際的に認められている(validate)リスク予測手法(risk prediction)である。しかしながら、ＫＦＲＥはＣＫＤの後期（Ｇ３～Ｇ５）にしか適用できず、透析を必要とする腎不全という臨床的転帰しか考慮しないという重大な欠点(limitations)がある。ＣＫＤの早期では、更に進んだ段階への進行は希ではないにしても、腎不全は希な事象である。これら早期では、ＧＦＲの４０％の低下(decline)は、患者および医者(physician)双方にとって医療的に意味があり、スポンサーがＣＫＤの全段階において実現可能な(feasible)ランダム化比較試験を設計することを可能にする。

【0008】

[0048] 加えて、進行を遅らせる新たなＣＫＤ用疾患修飾治療が利用可能であるが、これらは、主に、腎機能が保存されている患者の研究を行ってきた。これらの治療の使用は、特に、リスクが高い早期のＣＫＤを患う個人に有効である(beneficial)として差し支えなく、透析予防の効果(benefit)は大きく、価格効率性を得ることができる。ＣＫＤのための疾患修飾療法をリスクの高い(high-risk)早期のＣＫＤを患う個人に適用するために、ｅＧＦＲの４０％の低下、あるいは腎不全またはｅＧＦＲの４０％低下の複合的転帰(composite outcome)を予測し、ＣＫＤの全ての段階（Ｇ１～Ｇ５）にある患者に適用することができるモデルを実装することができる。このようなモデルが研究室データに基づくとき、電子健康記録または研究室情報システムを通じて、これらのモデルを使用することができ、ＣＫＤでは見られることが多い符合化の変動性およびその複雑さには無縁である(not subject to)。開示する実施形態の少なくとも一部は、患者のｅＧＦＲ４０％低下または腎不全（例えば、ＣＫＤＧ１～Ｇ５の患者）を精度高く予測する、新たな研究室ベースの機械学習予測モデルの解析(derivation)および外部検証を伴う。
技術的利点
[0049] 開示する実施形態は、ＣＫＤ進行予測に関連する既存のシステムおよび方法を凌ぐ種々の技術的利点、特に、いずれの慢性腎疾患（ＣＫＤ）の段階を辿る患者についても（またはＣＤＫでない患者、またはＣＫＤステータスがわからない患者）、慢性腎疾患の進行を予測できることにおいて、技術的利点を容易に得る(facilitate)ことができる。更に、本開示によって生成された予測は、ｅＧＦＲの４０％の低下および／または腎不全のいずれかの複合的な転帰（例えば、単なる腎不全だけでなく）に基づくこともできる。本開示の少なくとも一部の実施形態にしたがって生成された予測は、いずれの転帰を経験する患者についても、リスク・スコアを提供することができる。

【0009】

[0050] ＣＫＤの患者において、開示する方法は、非限定的な例として、腎臓系照会重要度判定検査(referral triage)について伝える、更に集中的な臨床管理(clinic care)の必要性を評価する、モダリティ教育、透析アクセス・プランニング(dialysis access planning)、および／またはその他の時機を決定する、というような、様々な重要な医療判断について伝えるために使用することができる。開示する実施形態は、ＣＫＤ進行予測を生成するものであり、個々の患者についてＣＫＤ進行予測を生成するため（例えば、電子健康記録またはリンクされたソフトウェア・ソリューションにおいて実装されるとき、および／または個々の医者の要求に応答して）、および／または患者データベースにおける患者のバッチ処理をし易くするため（例えば、病院または診療所のデータベース）等に、種々の方法で実装することができる。

【0010】

[0051] 開示する実施形態の少なくとも一部は、個々の転帰（ｅＧＦＲの４０％の低下のリスクまたは腎不全のリスク）、または複合的な転帰（腎不全またはｅＧＦＲの４０％低下が発生するリスク）を予測するモデルを含み、これらのモデルは、ＣＫＤの全ての段階（Ｇ１～Ｇ５）について審査された患者、または全ての段階にある患者に適用することができる。このような特徴を提供するシステムおよび／または方法は、至急必要とされている。本開示の少なくとも一部のモデルは、ＣＫＤ進行のリスクが高い、早期疾病（Ｇ１～Ｇ３）の患者のリスクを階層化するため、臨床試験における患者（任意のＣＫＤ段階）の登録を伝えるため、および／またはナトリウム・グルコース共役輸送体－２（ＳＧＬＴ２：sodium-glucose cotransporter-2）抑制剤、またはミネラルコルチコイド受容体拮抗薬（ＭＲＡ：mineralocorticoid receptor antagonists）のような、疾患進行を修正することができる治療の実施を指導するために利用することができる。
ＣＫＤ進行を予測するシステムおよび技法
[0052] これより図１に注意を向けると、図１は、開示する発明の態様を含む、および／または開示する発明の態様を実装するために使用することができるコンピューティング・システム１１０のコンポーネント例を示す。図１は、機械学習モデルの入力および出力に関連する種々の機械学習（ＭＬ：machine learning）モジュールおよびデータ型を示す。

【0011】

[0053] 本明細書において使用する場合、機械学習モデルまたはモジュールとは、機械学習モデルまたは他の人工インテリジェンス－ベース構造／アーキテクチャを使用する処理を容易にするために動作可能な、ソフトウェアおよび／またはハードウェア・コンポーネントの任意の組み合わせを指す。例えば、１つ以上のプロセッサは、非限定的な例として、ランダム・フォレスト・モデル、ランダム・サバイバル・フォレスト・モデル、コックス比例ハザード・モデル、単一レイヤ・ニューラル・ネットワーク、フィード・フォワード・ニューラル・ネットワーク、ラジアル・ベーシス関数ネットワーク、ディープ・フィード－フォワード・ネットワーク、リカレント・ニューラル・ネットワーク、長／短期記憶（ＬＳＴＭ：long-short term memory）ネットワーク、ゲート付き回帰型ユニット、オートエンコーダ・ニューラル・ネットワーク、変分オートエンコーダ、ディノイジング・オートエンコーダ、スパース・オートエンコーダ、マルコフ・チェーン、ホップフィールド・ニューラル・ネットワーク、ボルツマン・マシン・ネットワーク、制約付きボルツマン・マシン・ネットワーク、深層信念ネットワーク、深層畳み込みネットワーク（または畳み込みニューラル・ネットワーク）、逆畳み込みニューラル・ネットワーク、ディープ畳み込み逆グラフィックス・ネットワーク、敵対的生成ネットワーク、液体状態機械、エクストリーム・ラーニング・マシン、エコー状態ネットワーク、深層残差ネットワーク、コホーネン・ネットワーク、サポート・ベクター・マシン、ニューラル・チューリング・マシン、および／またはその他という形態に構成された機能ブロックおよび／または処理レイヤを実行するように動作可能なハードウェア・コンポーネントおよび／またはコンピュータ実行可能命令を含むおよび／または利用することができる。

【0012】

[0054] 図１に示す例は、コンピューティング環境１００の一部として、コンピューティング・システム１１０を示し、このコンピューティング・システム１１０と通信する（ネットワーク１３０を通じて）サード・パーティ・システム（１つまたは複数）１２０を含むことができる。ある実施態様では、コンピューティング・システム１１０は、１人以上の患者に対してＣＫＤ進行予測を生成するように、機械学習モデル（例えば、ＣＤＫ予測モデル）を訓練するおよび／または構成するように構成される。機械学習モデルは、加えてまたは代わりに、１人以上の患者に対する治療、監視、またはこれら以外の看護(caring)の推奨を生成するように訓練／構成することもできる。図１のコンピューティング・システム１１０は、加えてまたは代わりに、本明細書において説明するように訓練／構成されるＣＫＤ予測モデルのような、機械学習モデルを動作させるように構成することもできる。

【0013】

[0055] 図１のコンピューティング・システム１１０は、１つ以上のプロセッサ（１つまたは複数）（１つ以上のハードウェア・プロセッサ（１つまたは複数）のような）１１２と、コンピュータ読み取り可能命令１１８を格納するストレージ（即ち、ハードウェア記憶デバイス（１つまたは複数）１４０）とを含む。ハードウェア記憶デバイス（１つまたは複数）１４０は、任意の数のデータ型および任意の数のコンピュータ読み取り可能命令１１８を収容することができ、これらによって、コンピューティング・システム１１０は、コンピュータ読み取り可能命令１１８が１つ以上のプロセッサ（１つまたは複数）１１２によって実行されるとき、開示する実施形態の１つ以上を実装するように構成される。ハードウェア記憶デバイス（１つまたは複数）１４０は、物理的有形記憶手段を含むこともできる。また、コンピューティング・システム１１０は、ユーザ・インターフェース（１つまたは複数）１１４と入力／出力（Ｉ／Ｏ）デバイス（１つまたは複数）１１６も含むことが示されている。

【0014】

[0056] 図１に示すように、ハードウェア記憶デバイス（１つまたは複数）１４０は、１つの記憶ユニットとして示されている。しかしながら、ハードウェア記憶デバイス（１つまたは複数）１４０は、分散型ストレージとして実装することもでき、様々な別個の、そしてときには離れたシステムおよび／またはサード・パーティ・システム（１つまたは複数）１２０に分散されることは認められよう。また、コンピューティング・システム１１０は、分散型システムを構成することもでき、コンピューティング・システム１１０のコンポーネントの１つ以上が互いに離れていてもよく、各々が異なるタスクを実行する異なるディスクリート・システムによって維持／管理(run)される。ある実例では、複数の分散型システムが、分散型クラウド環境におけるように、開示する機能を実装するために、同様のタスクおよび／または分担する(shared)タスクを実行する。

【0015】

[0057] 図１の例では、ハードウェア記憶デバイス（１つまたは複数）１４０は、訓練データ集合１４１、医療研究室データ１４２、患者情報１４３、およびＣＫＤ進行予測データ１４４を含む、異なるデータ型を格納することができる。図１に示すように、ストレージ（例えば、ハードウェア記憶デバイス（１つまたは複数）１４０）は、コンピュータ読み取り可能命令１１８を含むことができる。コンピュータ読み取り可能命令１１８は、図１に示すモデルおよび／またはモジュールの内１つ以上（例えば、機械学習モデル１４５）の訓練／構成および／または実行（例えば、ＣＤＫ進行予測生成のために）を容易にするために使用可能であってもよい。

【0016】

[0058] 機械学習モデル１４５は、訓練データ集合１４１を使用して、訓練することができる。訓練データ集合１４１は、患者のコホートについての医療研究室データ（例えば、医療研究室データ１４２に含まれる）、および／または他の患者情報（例えば、患者情報１４３に含まれる）を含むことができる。ＣＫＤ進行予測を生成するように機械学習を訓練するために、訓練データ集合１４１を機械学習モデル（例えば、機械学習モデル１４５）に適用することができる。ある実施形態では、訓練データ集合１４１は、（ｉ）複数の患者に関連する医療研究室データの第１集合と、（ｉｉ）複数の患者の中に含まれる各患者の年齢と、（ｉｉｉ）複数の患者の中に含まれる各患者の性別とを含む。医療実験室データの第１集合は、特定の患者に関連する種々の研究室データ／測定値(labs/measurements)を含むことができ、非限定的な例として、推算糸球体濾過量（ｅＧＦＲ）、尿アルブミン／クレアチニン比（ＡＣＲ）、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、アルカリホスファターゼ、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、アスパラギン酸アミノトランスフェラーゼ（ＡＳＴ）、アラニン・アミノトランスアミナーゼ（ＡＬＴ）、ビリルビン、ガンマ－グルタミル・トランスフェラーゼ（ＧＧＴ）、ヘマトクリット、血小板数、および／またはその他があげられる。

【0017】

[0059] 訓練コホートに含まれる種々の患者に関連する種々の研究室データ／測定値は、１つ以上の時点において、または１つ以上の時間期間にわたって収集することができる（または既に収集されていてもよい）（ある時間期間（例えば、１週間、１月等）にわたって一連のサンプルまたは測定値を得るための複数回の連続する診療予約にわたってというように、例えば、経時的に１回以上の患者と医師との交流の間に、個々の患者各々から得られたサンプルまたは測定値から得られる）。例えば、様々な臨床検査は、医師による診察(visit with)の初日に、患者に指示される(order)。他の例として、患者が最初の日に１つ以上の血液検査結果を提供し、次いで別の日に尿サンプルを検査のために提出するのでもよい。あるいは、特定の検査では、１週間または１か月、あるいは１年もの時間期間にわたる複数の日からのサンプルを必要とする場合もある。

【0018】

[0060] ある実施形態では、訓練および／または検査データに含まれる研究室値の集合毎に、１つの時点(time point)が使用される。例えば、ある実例では、時点がｅＧＦＲ研究室測定によって定められ、全ての他の研究室値は、３６５日のｅＧＦＲ研究室測定の中で、研究室データ(labs)から選択される。

【0019】

[0061] 医療研究室データ１４２は、１回以上の個々の(single)時間期間において患者から得られた１つ以上のサンプルに基づいて、患者から収集することができる（１回の診療予約の間に１つのサンプルまたは測定値（例えば、血液または尿サンプル）を得るというように、例えば、患者と医師の交流の間に１回毎に特定の患者各々から得られたサンプルまたは測定値から求められる）。１つ以上のサンプルは、異なる血液、尿、およびその他の研究室検査からの種々の結果を含んでもよい。

【0020】

[0062] ある実施態様では、訓練データ集合１４１において表される測定値を得るために利用される研究室検査は、患者が通例定期的な外来診療の間に行っている、日常的な研究室検査である。例えば、訓練データ集合１４１において表される測定値の少なくとも一部は、尿化学検査（例えば、尿クレアチニン、尿アルブミン、尿ＡＣＲ）、包括的代謝パネル（例えば、ｅＧＦＲ、グルコース、カルシウム、ナトリウム、アルブミン、カリウム、重炭酸塩、塩化物、尿素、リン酸塩／リン、マグネシウム、肝臓酵素）、全血球計算（例えば、ヘモグロビン、ヘマトクリット、血小板数）、肝臓パネル（例えば、ＡＬＴ、ＡＳＴ、ＡＬＫＰ、ＧＧＴ、ビリルビン）、および／または尿酸検査と関連して得られた１つ以上の測定値を含むことができる。

【0021】

[0063] ある実例では、訓練データ集合１４１において表される測定値の内１つ以上は、直接測定されるのではなく、他の測定値から解析(derive)または推論される。実例をあげると、特定の患者についての尿ＡＣＲ測定値は、尿タンパク－クレアチニン検査または尿中一般物質定性半定量検査(urine dipstick test)から変換することもできる。

【0022】

[0064] 尚、本開示に関して、訓練データ集合１４１において表される１人以上の患者についての１つ以上の測定値が、訓練データ集合１４１から欠損する、または削除される場合もあることは認められよう。非限定的な例として、訓練データ集合１４１が、患者Ａおよび患者Ｂについての医療研究室データ１４２を含む場合、尿化学検査および全血球計算は患者Ａおよび患者Ｂ双方について行われたが、肝臓パネルは患者Ａについてのみ行われた場合というように、患者Ａは、患者Ｂには入手できない研究室データ／測定値を有する場合もある。にもかかわらず、肝臓パネルが患者Ｂについて得られなかった場合であっても、訓練データ集合１４１において表される医療研究室データ１４２は、尿化学検査、全血球計算、および肝臓パネルに関連する１つ以上の測定値を含むものとして、見なされてよい。これに関して、研究室データ／測定値の集合における１つ以上の研究室データ／測定値が、１つの患者の組み合わせの中にいる１人以上の患者について欠損しても、そして研究室データ／測定値の集合の全ての研究室データ／測定値が存在する訓練コホートにおいて、いずれか１人(no single)の患者が存在しなくても（研究室データ／測定値の集合における研究室データ／測定値の各々が、訓練コホートに含まれる少なくとも１人の患者について含まれる限り）、訓練データ集合１４１において、訓練コホートにおける１つの患者の組み合わせ（例えば、患者Ａおよび患者Ｂ）によって、研究室データ／測定値の集合を表すことができる。

【0023】

[0065] ある実施態様では、訓練データ集合１４１についての医療研究室データ１４２が、医療研究室データ１４２内に表された少なくとも一部の患者について欠損値を有する。ある実例では、訓練データ集合１４１は、代入データを利用することによって、欠損値／測定値を補足する。代入データは、任意の適した技法（例えば、適応ツリー代入(adaptive tree imputation)、近接技法、回帰代入、平均代用(mean substitution)、および／またはその他）を利用して、代入することができる。例えば、訓練データ集合１４１は、その関連する患者のコホートについて、ｅＧＦＲ、尿ＡＣＲ、尿素、カリウム、ヘモグロビン、血小板数、アルブミン、カルシウム、グルコース、ビリルビン、ナトリウム、重炭酸塩、および／またはＧＧＴを含み、値代入度が３０％以下であればよい（例えば、以上の測定値はいずれも、コホートに入っている患者の内３０％以下について、代入値を含んでもよい）。

【0024】

[0066] 訓練データ集合１４１は、患者転帰情報（例えば、患者情報１４３に含まれる）のような、複数の患者（即ち、患者のコホート）に関連する追加の情報を含むこともできる。このような患者転帰情報は、患者がｅＧＦＲの低下（例えば、４０％または他の低下）、腎不全（例えば、透析または腎移植を必要とする）、および／またはＣＫＤに関連するその他の医療転帰を経験したか否か、および／またはいつ経験したかについての情報を含むこともできる。患者情報１４３は、加えてまたは代わりに、１人以上の患者のＣＫＤ病期を含むこともできる。ＣＫＤ病期は、病期Ｇ１、病期Ｇ２、病期Ｇ３、病期Ｇ４、または病期Ｇ５を含むことができる。病期は、ある実例では、前述の各病期に対応する複数の副病期(sub-stage)から選択することもできる（例えば、病期Ｇ１の副病期等）。また、患者情報１４３は、患者の生物的性別(sex)および／または社会的性別(gender)、患者の各々から各サンプルを収集した時点における患者の年齢、他の疾病／病状の履歴、病状の家族歴、これまでの治療／外科手術、および／または血圧、体温、酸素濃度(oxygen level)、反射試験、および／またはその他のバイタル(vitals)というような他の関連情報も含むことができる。このような変数は、しかしながら、特定の実施形態では必要ではなく、削除してもよい。

【0025】

[0067] 訓練データ集合１４１は、種々の方法で（例えば、教師あり学習技法、教師なし学習技法、これらの組み合わせ、および／またはその他を利用する）、機械学習モデル１４５を訓練するために利用することができる。実例をあげると、ランダム・フォレスト・モデルを構築するには、システムは、元の訓練データ集合（例えば、訓練データ集合１４１）をランダムにサンプリングし（例えば、ブートストラップ・サンプリング）、ランダムにサンプリングした（例えば、もっと小さな）データ集合にモデルを当てはめ、予測を集約することによって、非相関ツリーを構築することができる。他の例として、ランダム・サバイバル・フォレスト・モデルを構築するには、システムは、各ノードにおける特徴および／または評価のための閾値の部分集合を、集約のために、ランダムに選択することができる。

【0026】

[0068] 機械学習モデル１４５を訓練した後、特定の患者に対して（例えば、新たな患者に対して）ＣＫＤ進行予測（例えば、ＣＤＫ進行予測データ１４４）を生成するために、機械学習モデル１４５を利用する（実行する(run or execute)）ことができる。例えば、新たな患者についての医療研究室データ１４２に加えて、新たな患者についての患者情報（例えば、年齢および性別）を得ることもできる。新たな患者についての医療研究室データは、訓練データ集合１４１についての医療研究室データ１４２と関連付けて先に論じた１つ以上の研究室データ／測定値を含んでもよい。実例をあげると、新たな患者についての医療研究室データは、推算糸球体濾過量（ｅＧＦＲ）、尿アルブミン／クレアチニン比（ＡＣＲ）、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、アルカリホスファターゼ、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、アスパラギン酸アミノトランスフェラーゼ（ＡＳＴ）、アラニン・アミノトランスアミナーゼ（ＡＬＴ）、ビリルビン、ガンマ－グルタミル・トランスフェラーゼ（ＧＧＴ）、ヘマトクリット、血小板数、および／またはその他の内１つ以上を含むことができる。新たな患者についての研究室データ／測定値は、尿化学検査（例えば、尿クレアチニン、尿アルブミン、尿ＡＣＲ）、包括的代謝パネル（例えば、ｅＧＦＲ、グルコース、カルシウム、ナトリウム、アルブミン、カリウム、重炭酸塩、塩化物、尿素、リン酸塩／リン、マグネシウム、肝臓酵素）、全血球計算（例えば、ヘモグロビン、ヘマトクリット、血小板数）、肝臓パネル（例えば、ＡＬＴ、ＡＳＴ、ＡＬＫＰ、ＧＧＴ、ビリルビン）、および／または尿酸検査の内１つ以上の項目(components)を含むことができる。

【0027】

[0069] 新たな患者についての年齢、性別、および医療研究室データは、新たな患者についてＣＫＤ進行予測データ１４４を生成するために、（訓練された）機械学習モデル１４５への入力として利用することができる。ＣＫＤ進行予測データ１４４は、新たな患者にＣＫＤ進行が生ずるリスクを、ｅＧＦＲの少なくとも４０％の低下という形態で、というようにして示すことができる。ある実施形態では、ＣＫＤ進行予測は、加えてまたは代わりに、腎不全の形態で、ＣＫＤ進行のリスクを示す。実例をあげると、ＣＫＤ進行予測データ１４４は、複合ＣＫＤ進行転帰が発生する(occur)リスクを示すことができ、複合転帰は、ｅＧＦＲの４０％低下または腎不全を含む（例えば、患者に１０ｍｌ／分／１．７３ｍ^２未満のｅＧＦＲが発生し、長期透析が必要となり、または腎移植が必要となる）。先に注記したように、機械学習モデル１４５は、このようなＣＫＤ進行予測データ１４４を、病期Ｇ１または病期Ｇ２、もしくはその副病期（例えば、Ｇ３よりも末期のＣＫＤ病期にはない患者について）というような、ＣＤＫの早期にある患者についてであっても、生成するために利用することができる。

【0028】

[0070] ＣＫＤ進行予測（例えば、ＣＫＤ進行予測データ１４４）は、特定の時間量以内（例えば、新たな患者についてのｅＧＦＲ測定に関連する時点というような、新たな患者についての入力データ集合に関連する時点から）にＣＫＤ進行が生ずるリスクを示すことができる。非限定的な例として、ＣＫＤ進行予測に関連する時間量は、２年、５年、または他の時間量（例えば、６か月、１年、１８か月、３年、４年等）であってもよい。

【0029】

[0071] ある実施態様では、異なる時間軸（例えば、２年ＣＫＤ進行予測のために１つのモデル、５年ＣＫＤ進行予測のために別個のモデル等）と関連付けたＣＤＫ進行予測を生成するために、別個の機械学習モデル１４５（例えば、別個のランダム・フォレスト・モデル）を訓練する。ある実施態様では、異なる時間軸と関連付けたＣＫＤ進行予測を生成するために、１つの機械学習モデル１４５（例えば、１つのランダム・サバイバル・フォレスト・モデル）を訓練する。実例をあげると、時間軸または特定の時間量（例えば、２年、５年、または任意の時間量、もしくは日数）を、新たな患者についての性別、年齢、および医療研究室データと組み合わせて、機械学習モデル１４５への入力として供給し、機械学習モデル１４５に、入力された時間軸または特定の時間量に対して、ＣＫＤ進行予測を生成させることができる。

【0030】

[0072] 図１は、更に、追加のモジュール例も示す。これらは、ハードウェア記憶デバイス（１つまたは複数）１４０に格納する、および／または他の方法でコンピューティング・システム１１０と関連付けることができる。追加のモジュールは、データ検索モジュール１５１、データ変換モジュール１５２、訓練モジュール１５３、検証モジュール１５５、および／または実装モジュール１５６の内１つ以上を含むことができる。

【0031】

[0073] 本明細書において使用する場合、「モジュール」(module)という用語は、特定のアクトを実行するようにコンピューティング・システム１１０を構成することができる、ハードウェア・コンポーネントまたはソフトウェア・オブジェクト、ルーチン、もしくはメソッドの任意の組み合わせを指すことができる。実例をあげると、本明細書において説明する異なるコンポーネント、モジュール、エンジン、デバイス、および／またはサービスは、コンピューティング・システム１１０上で（例えば、別個のスレッドとして）実行する１つ以上のオブジェクトまたはプロセッサを利用して実装することができる。図１は、様々な独立したモジュールを図示するが、モジュールの特徴描写(characterization)は、少なくともいくらかは任意であることは理解されよう。少なくとも１つの実施態様では、明示的に説明または図示する構成以外のものにおいては、本明細書において説明する種々のモジュールを組み合わせる、分割する、または除外することもできる。例えば、いずれかの特定のモジュールを参照しながら本明細書において説明する機能はいずれも、処理ユニット、ソフトウェア・オブジェクト、モジュール、命令、コンピューティング・センタ（例えば、コンピューティング・システム１１０から離れたコンピューティング・センタ）等を、任意の数および／または組み合わせで利用して、実行することができる。本明細書では、明確さおよび説明のために、個々のモジュールを示す(provide)が、限定を意図するのではない。

【0032】

[0074] データ検索モジュール１５１は、１つ以上のデータ型を含むデータ源、データベース、および／または記憶デバイスを突き止めて、アクセスするように構成することができ、そこから、データ検索モジュール１５１は、訓練データとして使用するデータの集合または部分集合を抽出することができる。データ検索モジュール１５１は、データベースおよび／またはハードウェア記憶デバイスからデータを受け取ることができ、データ検索モジュール１５１は、受け取ったデータを訓練データとして使用するために、フォーマットし直す、またそうでなければ修正するように構成される。加えて、または代わりに、データ検索モジュール１５１は、サード・パーティ・データ集合および／またはデータ源を含む１つ以上のリモート・システム（例えば、サード・パーティ・システム（１つまたは複数）１２０）と通信することもできる。ある実例では、これらのデータ源は、患者研究室検査結果およびその他の患者情報ポータルを含む。

【0033】

[0075] データ検索モジュール１５１は、医療研究室データ１４２、患者情報１４３、および／またはＣＫＤ進行予測データ１４４を含む、電子的に格納された情報にアクセスすることができる。データ検索モジュール１５１は、スマート・モジュールとして構成することができ、適時に十分な量のデータが得られるように、そして機械学習モデル／モジュールを訓練する対象となる、所望の用途に最も該当するデータを検索するように、最適なデータ集合抽出プロセスを学習することができる。例えば、データ検索モジュール１５１は、所望の慢性腎疾患予測技法において、モデル（例えば、特定のクエリまたは特定のタスクのための）を訓練し、このモデルの精度、効率、および／または有効性を高める訓練データを生成するデータベースおよび／またはデータ集合はどれか、学習することができる。

【0034】

[0076] データ検索モジュール１５１は、コンピューティング・システム１１０に含まれる１つ以上のＭＬモジュール（１つまたは複数）および／またはモデルと通信するとき、生の記録されたソース・データを突き止め、選択し、および／または格納することができる。このような実例では、データ検索モジュール１５１と通信する他のモジュールは、受け取ったデータを更に拡張し、および／または下流のプロセスに適用するように、１つ以上のデータ源から検索された（即ち、抽出された、引き出された等）データを受け取ることができる。例えば、データ検索モジュール１５１は、訓練モジュール１５３および／または実装モジュール１５６と通信することができる。データ検索モジュール１５１は、医療研究室データ１４２および患者情報１４３を含む訓練データ集合（例えば、訓練データ集合１４１）を検索するように構成することもできる。

【0035】

[0077] ある実例では、データ変換モジュール１５２は、データ検索モジュール１５１によって検索された任意の生データを、訓練データ集合１４１に含まれるようにするために、作業可能なデータに変換するように構成される。

【0036】

[0078] ある実例では、訓練モジュール１５３は、データ検索モジュール１５１、データ変換モジュール１５２、検証モジュール１５４、および／または実装モジュール１５６の内１つ以上と通信する。このような実施形態では、訓練モジュール１５３は、データ検索モジュール１５１を介して、１つ以上の訓練データ集合（例えば、訓練データ集合１４１）を受け取るように構成される。特定のアプリケーションまたはタスクに関連する訓練データを受け取った後、訓練モジュール１５３は、１つ以上のモデルを訓練データに対して訓練することができる。訓練モジュール１５３は、教師無し訓練および／または教師付訓練によってモデルを訓練するように構成することができる。訓練モジュール１５３は、ＣＫＤ進行予測データ１４４を出力として生成するために、医療研究室データ１４２および患者情報１４３を含む訓練データ集合１４１を適用することによって、慢性腎疾患進行予測を生成するように、機械学習モデル１４５を訓練するように構成される。

【0037】

[0079] ある実施形態では、訓練データ集合１４１を、訓練データ集合と検証データ集合とに分割する。検証モジュール１５５は、検証データ集合を利用して、機械学習モデル１４５を、ＣＫＤ進行予測の精度および正確さについて検査するように構成される。例えば、任意の所望の人口統計および研究室変数を使用し、Ｒにおいて、サバイバル、回帰、および分類（ＲＦ－ＳＲＣ）パッケージ用のランダム・フォレストを使用して、ランダム・フォレスト・モデルを当てはめることができる。実例をあげると、利用可能なデータを訓練（例えば、７０％）データ集合と、検査／検証（例えば、３０％）データ集合に分割することができる。パラメータは、１５のノード・サイズ（または他のサイズ）と、６０に等しいツリー数（または他のツリー数）とを含むことができる。本開示の範囲内で、追加のまたは代わりのランダム・フォレストもしくはランダム・サバイバル・フォレスト（または他の）モデルを使用することもできる。

【0038】

[0080] コンピューティング・システム１１０は、コンピューティング・システム１１０に含まれるモジュールおよび／またはＭＬモデル１４５（または全てのモデル／モジュール）の内任意の１つと通信する実装モジュール１５６を含み、こうすることによって、実装モジュール１５６は、これらのモジュールの１つ以上の機能を実装する、初期化する(initiate)、または実行するように構成される。一例では、実装モジュール１５６は、データ検索モジュール１５１が、しかるべき時点においてデータを検索し、訓練モジュール１５３に対して訓練データを生成することができるように、データ検索モジュール１５１を動作させるように構成される。実装モジュール１５６は、プロセス伝達を容易にし、モジュールの１つ以上の間における通信のタイミングを取りやすくすることができ、ＣＫＤ進行予測モデルとして構成される機械学習モデル１４５を実装するおよび／または動作させるように構成することができる。

【0039】

[0081] コンピューティング・システムは、サード・パーティ・システム（１つまたは複数）１２０と通信することができる。サード・パーティ・システム１２０は、１つ以上のプロセッサ（１つまたは複数）１２２と、コンピュータ読み取り可能命令１１８の内１つ以上と、１つ以上のハードウェア記憶デバイス（１つまたは複数）１２４とを備える。サード・パーティ・システム（１つまたは複数）１２０は、更に、訓練データとして使用することができるデータ、例えば、ローカル・ストレージには含まれない医療研究室データを収容するデータベースを備えることもできる。加えて、または代わりに、サード・パーティ・システム（１つまたは複数）１２０は、コンピューティング・システム１１０の外部にある機械学習システムも含む。

【0040】

[0082] 図２は、訓練データ集合２１０（例えば、訓練データ集合１４１）に対して訓練される機械学習モデル２３０の一例（例えば、図１の機械学習モデル１４５）を示す。訓練データ集合２１０は、医療研究室データ２２０Ａ／２２０Ｂ（例えば、医療研究室データ１４２）と、患者情報（例えば、患者情報１４３）とを含み、患者情報は、ＣＫＤ病期２１４Ａ／２１４Ｂ、性別２１６Ａ／２１６Ｂ、および年齢２１８Ａ／２１８Ｂを、複数の患者（例えば、患者Ａ２１２Ａおよび患者Ｂ２１２Ｂ）について含む。機械学習モデル２３０は、新たな患者２４２について、慢性腎疾患進行予測２８０（例えば、ＣＫＤ進行予測データ１４４）を生成するように構成される。医療研究室データ２２０Ａは、少なくとも、患者ＡについてのｅＧＦＲ２２２Ａを含み、更に患者Ａについての追加の研究室データ／測定値も含むことができる（楕円２２４Ａで示す通り）。同様に、医療研究室データ２２０Ｂは、少なくとも、患者ＢについてのｅＧＦＲ２２２Ｂを含み、更に患者Ｂについての追加の研究室データ／測定値も含むことができる（楕円２２４Ｂで示す通り）。訓練データ集合２１０は、任意の数の患者についてのデータを含む（訓練データ集合２１０と関連付けられた楕円によって図２に示す通り）。

【0041】

[0083] 次いで、ＣＫＤ進行予測を生成し、これによってＣＫＤ進行予測モデル２７０が得られるように機械学習モデル２３０を訓練するために、訓練データ集合２１０を機械学習モデル２３０に投入する。新たな患者２４２に関連する新たな入力データ集合２４０（例えば、訓練データ集合２１０に含まれていない患者、またはＣＫＤ進行予測が望ましい患者）を、入力として、ＣＫＤ進行予測モジュール２７０に投入し、新たな患者２４２についてＣＫＤ進行予測２８０を生成する。入力データ集合２４２は、新たな患者についてのＣＫＤ病期２４４、性別２４６、年齢２４８、および医療研究室データ２５０を含む。医療研究室データ２５０（新たな患者２４２についての）は、新たな患者から得られた１つ以上のサンプルに基づく少なくとも１つのｅＧＦＲ２６２（例えば、１回の患者と医師との予約の間、１日の間、１時間内における等の新たな患者から／について得られたサンプルおよび／または情報から得られる１つの時点または１つの時間期間におけるｅＧＦＲ２６２）を含む。加えて、新たな患者２４２についての医療研究室データ２５０は、１つ以上の他の研究室データ／測定値も含むことができる（楕円２６４によって示す通り）。ＣＫＤ進行予測２８０は、指定された時間枠内において（例えば、２年以内または５年以内において）、新たな患者がｅＧＦＲの４０％低下２８２および／または腎不全２８４を発症するリスク・スコアを含む。

【0042】

[0084] 先に注記したように、ＣＫＤ進行予測２８０と関連付けられた時間枠または特定の時間量２９０は、ＣＫＤ進行予測モデル２７０がランダム・サバイバル・フォレスト・モデルとして実装される場合のように、ＣＫＤ進行予測モデル２７０への入力として供給することができる。ある実例では、入力時間枠または特定の時間量２９０は、入力として供給されず、代わりに、複数のＣＫＤ進行予測モデルからＣＫＤ進行予測モデル２７０が選択される。各ＣＫＤ進行予測モデルは、異なる時間枠または特定の時間量と関連付けられる。

【0043】

[0085] これより、以下の論述では、本開示にしたがって実行することができる複数の方法（例えば、コンピュータ実装可能またはシステム実装可能方法）および／または方法アクトについて言及する。方法アクトは、特定の順序で論じられ、特定の順序で発生するものとしてフロー・チャートにおいて示されるが、具体的に述べられない限りまたは要求されない限り、特定の順序付けは必要ない。何故なら、１つのアクトは、そのアクトが実行される前に完了する他のアクトに依存するからである。尚、本開示の特定の実施形態では、本明細書において説明するアクトの内１つ以上を省略する場合もあることは認められよう。本明細書において説明する種々のアクトは、先に説明した１つ以上のコンピューティング・システム・コンポーネント（例えば、ハードウェア・プロセッサ（１つまたは複数）１１２、ハードウェア記憶デバイス（１つまたは複数）１４０、命令、および／またはモジュール等）を利用して、実行することができる。

【0044】

[0086] 図３Ａは、ＣＫＤ進行を予測する機械学習モデルの生成に関連するアクトを示す流れ図３００の一例を示す。

【0045】

[0087] 流れ図３００のアクト３０２は、訓練データ集合にアクセスするステップを含む。この訓練データ集合は、（ｉ）複数の患者に関連する医療研究室データの第１集合と、（ｉｉ）複数の患者に含まれる各患者の年齢と、（ｉｉｉ）複数の患者に含まれる各患者の性別とを含む。医療研究室データの第１集合は、少なくとも、複数の患者に含まれる患者の組み合わせについて、推算糸球体濾過量（ｅＧＦＲ）、尿アルブミン／クレアチニン比（ＡＣＲ）、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、アルカリホスファターゼ（ＡＬＫＰ）、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、アスパラギン酸アミノトランスフェラーゼ（ＡＳＴ）、アラニン・アミノトランスアミナーゼ（ＡＬＴ）、ビリルビン、ガンマ－グルタミル・トランスフェラーゼ（ＧＧＴ）、ヘマトクリット、および血小板数を示す。

【0046】

[0088] 流れ図３００のアクト３０４は、訓練データ集合を未訓練モデルに適用することによって、機械学習モデルを生成するステップを含む。機械学習モデルは、新たな患者に関連する入力データ集合を機械学習モデルに適用することによって、新たな患者について、慢性腎疾患（ＣＫＤ）進行予測を生成するように構成される。入力データ集合は、新たな患者の年齢と、新たな患者の性別と、医療研究室データの第２集合とを含み、第２集合は、新たな患者について、ｅＧＦＲ、尿ＡＣＲ、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、ＡＬＫＰ、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、ＡＳＴ、ＡＬＴ、ビリルビン、ＧＧＴ、ヘマトクリット、および血小板数の内１つ以上を示す。

【0047】

[0089] 尚、本開示を考慮すると、機械学習モデルへの入力として利用される医療研究室データは、種々の形態を成すことができ、機械学習モデルは入力データを種々の方法で扱えることは認められよう。実例をあげると、測定値のいずれもが、連続測定値、分類(categorical)測定値、変換／修正測定値（例えば、対数変換測定値）、数学的に修正した測定値（例えば、二乗、三乗等）等を含むことができる。

【0048】

[0090] ある実例では、機械学習モデルは、入力された時間期間に対するＣＫＤ進行予測（例えば、入力時間期間内におけるｅＧＦＲの４０％低下および／または腎不全のような、ＣＫＤ進行が生ずる尤度）を生成するための入力データ集合に加えて、時間期間入力（例えば、日数、月数、年数等）を受け取るように構成されたランダム・サバイバル・フォレスト・モデルを含む。ある実例では、機械学習モデルは、特定の時間期間に対してＣＫＤ進行予測を生成するように構成されたランダム・フォレスト・モデルを含む。異なる時間軸毎にＣＫＤ進行予測を生成するために、複数のモデルを生成することもできる。

【0049】

[0091] 図３Ｂから図３Ｄは、それぞれ、新たな患者についてＣＫＤ進行予測を生成することに関連するアクトを図示する流れ図３１０、３２０、および３３０の例を示す。

【0050】

[0092] 図３Ｂの流れ図３１０のアクト３１２は、慢性腎疾患（ＣＫＤ）進行予測を生成するように構成された機械学習モデルにアクセスするステップを含む。機械学習モデルは、訓練データ集合に対して訓練され、訓練データ集合は、（ｉ）複数の患者に関連する医療研究室データの第１集合と、（ｉｉ）複数の患者に含まれる各患者の年齢と、（ｉｉｉ）複数の患者に含まれる各患者の性別とを含む。医療研究室データの第１集合は、少なくとも、複数の患者に含まれる患者の組み合わせについて、推算糸球体濾過量（ｅＧＦＲ）、尿アルブミン／クレアチニン比（ＡＣＲ）、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、アルカリホスファターゼ（ＡＬＫＰ）、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、アスパラギン酸アミノトランスフェラーゼ（ＡＳＴ）、アラニン・アミノトランスアミナーゼ（ＡＬＴ）、ビリルビン、ガンマ－グルタミル・トランスフェラーゼ（ＧＧＴ）、ヘマトクリット、および血小板数を示す。

【0051】

[0093] ある実施態様では、機械学習モデルは、ランダム・サバイバル・フォレスト・モデルを含む。医療研究室データの第１集合は、欠損したデータ値の代わりに、１つ以上の代入値を含んでもよい。ある実例では、医療研究室データの第１集合は、３０％以下の値代入度で、ｅＧＦＲ、尿ＡＣＲ、尿素、カリウム、ヘモグロビン、血小板数、アルブミン、カルシウム、グルコース、ビリルビン、ナトリウム、重炭酸塩、およびＧＧＴを示す。

【0052】

[0094] 流れ図３１０のアクト３１４は、新たな患者に関連する入力データ集合を機械学習モデルに投入することによって、新たな患者についてＣＫＤ進行予測を生成するステップを含む。新たな患者についてのＣＫＤ進行予測は、新たな患者に関連する入力データ集合を機械学習モデルに投入した結果得られる機械学習モデルの出力に基づく。入力データ集合は、新たな患者の年齢と、新たな患者の性別と、医療研究室データの第２集合とを含み、第２集合は、新たな患者について、ｅＧＦＲ、尿ＡＣＲ、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、ＡＬＫＰ、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、ＡＳＴ、ＡＬＴ、ビリルビン、ＧＧＴ、ヘマトクリット、および血小板数の内１つ以上を示す。本明細書において使用する場合、「尿ＡＣＲ」(urine ACR)とは、直接尿ＡＣＲ測定値、解析または推定尿ＡＣＲ、および／または尿アルブミン、尿クレアチニン、尿タンパク、および／または定性的尿アルブミン（例えば、ディップスティックから）のような、尿ＡＣＲの項目を含むことができる。

【0053】

[0095] ある実例では、新たな患者にはＧ３以降のＣＫＤ病期が関連付けられない。ある実施態様では、ＣＫＤ進行予測は、新たな患者が腎不全を発症するリスク、または新たな患者についてｅＧＦＲの約４０％以上の低下が発生するリスクの予測を含む。ある実例では、腎不全のリスクは、新たな患者には、（ｉ）長期透析を必要とする、（ｉｉ）腎移植を必要とする、または（ｉｉｉ）１０ｍｌ／分／１．７３ｍ^２よりも低い糸球体濾過量が発生するリスクがあるという指示を含む。

【0054】

[0096] ＣＫＤ進行予測は、新たな患者について入力された出たデータ集合に関連する時間期間から特定の時間量（例えば、新たな患者に関連するｅＦＧＲ測定からの時間量）以内においてＣＫＤ進行が生ずるリスクを示すこともできる。ある実施態様では、機械学習モデルをランダム・サバイバル・フォレスト・モデルとして実装する場合のように、ＣＫＤ進行予測を生成するために、機械学習モデルへの入力として、特定の時間量を供給する。この特定の時間量は、２年、５年、または任意の時間量を含んでもよい。

【0055】

[0097] 複数の患者の内１人以上または新たな患者についての尿ＡＣＲは、尿タンパク－クレアチニン検査または尿中一般物質定性半定量検査から変換することもできる。

【0056】

[0098] 流れ図３１０のアクト３１６は、ＣＫＤ進行予測が、１つ以上の予測リスク閾値を満たす特定の時間期間内において、新たな患者がＣＫＤを発症するリスクの予測を示すと判定するステップを含む。１つ以上の予測リスク閾値は、ＣＫＤ進行予測に関連する特定の時間期間（例えば、異なる時間軸が、異なる閾値の集合を有してもよい）に基づくこともできる。一例では、２年の時間期間において、２％以上のＣＤＫ進行予測（例えば、ｅＧＦＲの４０％低下または腎不全という形態で、新たな患者にＣＫＤ進行が生ずる尤度が２％であることを示す）を、新たな患者についての「中程度の」リスク分類と関連付けることもでき、１０％以上のＣＫＤ進行予測を、新たな患者についての「高い」リスク分類と関連付けることもできる。他の例として、５年の時間期間において、５％以上のＣＫＤ進行予測を、新たな患者についての「中程度の」リスク分類と関連付けることもでき、２５％以上のＣＫＤ進行予測を、新たな患者についての「高い」リスク分類と関連付けることもできる。同じまたは異なる時間軸に対する追加のまたは代わりの閾値構造も、本開示の範囲内に該当する。

【0057】

[0099] アクト３１８Ａ～３１８Ｄの内１つ以上は、アクト３１６の実行に基づいて実行されてよい。アクト３１８Ａは、新たな患者が腎臓介入治療を必要とする可能性があるという通知を生成するステップを含む。アクト３１８Ｂは、ＣＫＤ進行予測に基づいて、新たな患者に対する腎臓介入治療の推奨を生成するステップを含む。アクト３１８Ｃは、ＣＫＤ進行予測に基づいて、新たな患者に対するＣＫＤ進行の監視頻度の推奨を生成するステップを含む。アクト３１８Ｄは、新たな患者に腎臓介入治療を施術するステップを含む。アクト３１６にしたがって、１つ以上の閾値を満たすＣＫＤ進行予測に応答して実行されるアクト３１８Ａ、３１８Ｂ、３１８Ｃ、および／または３１８Ｄの選択は、ＣＫＤ進行予測に関連する特定の時間期間（例えば、２年または５年）、満たされた特定の閾値（１つまたは複数）（例えば、患者が「中程度の」または「高い」リスクのどちらに分類されるか）、および／または新たな患者についての実験室の集合(the set of laboratory)の少なくとも一部というような、１つ以上の他の因子(factor)（例えば、新たな患者についてＣＫＤ進行予測を生成するために入力データ集合の一部として使用される）に基づいて行うこともできる。

【0058】

[0100] これより、アクト３１８Ａから３１８Ｄに関連する種々の説明に役立つ例について論ずる。ある実例では、アクト３１８Ａの実行は、ＣＫＤに伴って発症するおそれがある合併症の通知を、新たな患者に生成するステップを含むこともできる。これは、新たな患者についての個別化した患者研究室データ／測定値および／または他の患者データに基づくことができる。

【0059】

[0101] 例えば、新たな患者が男性でヘモグロビンが約１３０ｇ／Ｌ未満であること、または女性でヘモグロビンが約１２０ｇ／Ｌ未満であると判定したことに応答して、アクト３１８Ａは、新たな患者について、貧血が潜在的な合併症であることを示す通知を生成するステップを伴うこともできる。

【0060】

[0102] 他の例として、新たな患者が約５ｍＥｑ／Ｌよりも多いカリウムを有すると判定したことに応答して、アクト３１８Ａは、新たな患者について、高カリウム血症が潜在的な合併症であることを示す通知を生成するステップを伴うこともできる。

【0061】

[0103] 他の例として、新たな患者が約２２ｍＥｑ／Ｌ未満の血清重炭酸塩を有すると判定したことに応答して、アクト３１８Ａは、新たな患者について、代謝性アシドーシスが潜在的な合併症であることを示す通知を生成するステップを伴うこともできる。

【0062】

[0104] 他の例として、新たな患者が約１．６ｍｇ／ｄＬよりも多いリン、および／または約２．１ミリモル／Ｌ未満または約２．７ミリモル／Ｌより多いカルシウムを有すると判定したことに応答して、アクト３１８Ａは、新たな患者について、ＣＫＤに伴って起こる骨ミネラル代謝異常（ＣＫＤ－ＭＢＤ：CKD mineral bone disease）が潜在的な合併症であることを示す通知を生成するステップを伴うこともできる。

【0063】

[0105] ある実例では、アクト３１８Ｂにしたがって生成される推奨は、新たな患者についての個別化された患者研究室データ／測定値、および／または他の患者データに基づくこともでき、および／またはアクト３１８Ａに関して先に注記した合併症に基づくこともできる。

【0064】

[0106] 例えば、新たな患者が約５０歳よりも高い年齢を有し、約６０ｍＬ／分／１．７３ｍ^２よりも低いｅＧＦＲを有し、または約３ｍｇ／ｍｍｏｌよりも多い尿ＡＣＲを有すると判定したことに応答して、アクト３１８Ｂは、新たな患者にスタチン（および／またはその他のコレステロール治療）を処方する提案を生成するステップを伴うこともできる。

【0065】

[0107] 他の例として、新たな患者が約３０ｍＬ／分／１．７３ｍ^２未満のｅＧＦＲを有し、アクト３１６にしたがって、ＣＫＤ進行の「高い」リスクにあると分類されたと判定したことに応答して、アクト３１８Ｂは、新たな患者を腎臓病(nephrology)と呼ぶ(refer to)という推奨を生成するステップを伴うこともできる。

【0066】

[0108] 他の例として、新たな患者が、アクト３１６にしたがって、ＣＫＤ進行の「中程度の」または「高い」リスクにあると分類されたと判定されたことに応答して、アクト３１８Ｂは、新たな患者がレニン-アンジオテンシン-アルドステロン系（ＲＡＡＳ）阻害（例えば、新たな患者が約５ｍＥｑ／Ｌよりも多いカリウム、または約１５ｍＬ／分／１．７３ｍ^２未満のｅＧＦＲを有する場合を除いて、新たな患者が約１５ｍＬ／分／１．７３ｍ^２よりも大きいｅＧＦＲおよび約３ｍｇ／ｍｍｏｌよりも多い尿ＡＣＲを有する場合、ＲＡＡＳ阻害を強く推奨することができる）、非ステロイド系ミネラルコルチコイド受容体拮抗薬（ＭＲＡ）治療（例えば、新たな患者が約５ｍＥｑ／Ｌよりも多いカリウムまたは約２５ｍＬ／分／１．７３ｍ^２よりも低いｅＧＦＲを有する場合を除いて、新たな患者が約２５ｍＬ／分／１．７３ｍ^２から約６０ｍＬ／分／１．７３ｍ^２までの範囲内のｅＧＦＲを有する場合、毎日１０ｍｇを推奨することができる。新たな患者が、約６０ｍＬ／分／１．７３ｍ２よりも高いｅＧＦＲを有する場合、毎日２０ｍｇを推奨することができる）、および／またはナトリウム・グルコース共役輸送体－２（ＳＧＬＴ２）阻害薬（例えば、新たな患者が、約２０ｍＬ／分／１．７３ｍ^２よりも低いｅＧＦＲを有する場合を除く）を受けるという推奨を生成するステップを伴うこともできる。

【0067】

[0109] 他の例では、新たな患者について、貧血が潜在的な合併症であると判定したことに応答して（アクト３１８Ａを参照して先に論じたように）、アクト３１８Ｂは、フェレイチン、血清鉄、および／または総鉄結合能（ＴＩＢＣ：total iron binding capacity）というような鉄研究(iron studies)を新たな患者に得るという推奨を生成するステップを伴うこともできる（例えば、アクト３１８Ｃを参照して以下で論ずるように、定期的な監視間隔で）。

【0068】

[0110] 他の例として、新たな患者について、高カリウム血症が潜在的な合併症であると判定したことに応答して（アクト３１８Ａを参照して先に論じたように）、アクト３１８Ｂは、患者が低カリウム食（low potassium diet）を受けること（新たな患者が、約５ｍＥｑ／Ｌから５．５ｍＥｑ／Ｌまでの範囲内のカリウムを有する場合）、および／または臨床診察指針にしたがって、高カリウム血症監視および／または治療を受ける(receive)（例えば、新たな患者が約５．５ｍＥｑ／Ｌよりも多いカリウムを有する場合）という推奨を生成するステップを伴うこともできる。

【0069】

[0111] 他の例として、新たな患者について、代謝性アシドーシスが潜在的な合併症であると判定したことに応答して（アクト３１８Ａを参照して先に論じたように）、アクト３１８Ｂは、患者が、臨床診察指針にしたがって、代謝性アシドーシス監視および／または治療を受けるという推奨を生成するステップを伴うこともできる。

【0070】

[0112] 他の例として、新たな患者について、ＣＫＤ－ＭＢＤが潜在的な合併症であると判定したことに応答して（アクト３１８Ａを参照して先に論じたように）、アクト３１８Ｂは、患者が低リン食を受けるという推奨を生成するステップを伴うこともできる。

【0071】

[0113] ある実例では、アクト３１８Ｂは、約１３０／８０ｍｍＨｇの目標血圧（または、新たな患者が約６０ｍＬ／分／１．７３ｍ^２よりも低いｅＧＦＲまたは約３ｍｇ／ｍｍｏｌよりも多い尿ＡＣＲを有する場合、約１２０ｍｍＨｇの目標収縮期血圧）というように、新たな患者に１つ以上の血圧目標を推奨するステップを含むこともできる。

【0072】

[0114] ある実例では、アクト３１８Ｃにしたがって生成される推奨は、新たな患者についての個別化された患者研究室データ／測定値および／または他の患者データに基づくこと、および／またはアクト３１８Ａを参照して先に注記した合併症に基づくこともできる。

【0073】

[0115] 例えば、アクト３１６にしたがって、新たな患者にはＣＫＤ進行の「高い」リスクがあると分類され、約６０ｍＬ／分／１．７３ｍ^２よりも低いｅＧＦＲを有すると判定したことに応答して、アクト３１８Ｃは、新たな患者が少なくとも毎年４回（以上）ＣＫＤ監視を受けるという推奨を生成するステップを伴うこともできる。

【0074】

[0116] 他の例として、アクト３１６にしたがって、新たな患者にはＣＫＤ進行の「高い」リスクがあると分類され、約６０ｍＬ／分／１．７３ｍ^２よりも高いｅＧＦＲを有すると判定したことに応答して、アクト３１８Ｃは、新たな患者が毎年３回（以上）ＣＫＤ監視を受けるという推奨を生成するステップを伴うこともできる。

【0075】

[0117] 他の例として、アクト３１６にしたがって、新たな患者にはＣＫＤ進行の「中程度」リスクがあると分類され、約４５ｍＬ／分／１．７３ｍ^２よりも低いｅＧＦＲを有すると判定したことに応答して、アクト３１８Ｃは、新たな患者が毎年３回（以上）ＣＫＤ監視を受けるという推奨を生成するステップを伴うこともできる。

【0076】

[0118] 他の例として、アクト３１６にしたがって、新たな患者にはＣＫＤ進行の「中程度」リスクがあると分類され、約４５ｍＬ／分／１．７３ｍ^２よりも高いｅＧＦＲを有すると判定したことに応答して、アクト３１８Ｃは、新たな患者が毎年２回（以上）ＣＫＤ監視を受けるという推奨を生成するステップを伴うこともできる。

【0077】

[0119] 他の例として、アクト３１６にしたがって、新たな患者にはＣＫＤ進行の「低い」リスクがあると分類された（例えば、新たな患者は「中程度の」リスクとも「高い」リスクとも分類されなかった）と判定したことに応答して、アクト３１８Ｃは、新たな患者が毎年１回（以上）ＣＫＤ監視を受けるという推奨を生成するステップを伴うこともできる。

【0078】

[0120] アクト３１８Ｄは、アクト３１８Ｂおよび／または３１８Ｃを参照して先に論じた推奨（例えば、ＲＡＡＳ阻害、血圧管理、ＳＧＬＴ２阻害薬、ＭＲＡ治療）、および／またはその他（例えば、腎臓内科の診察、家庭透析、および／または腎移植）の内１つ以上を実行するステップを含むことができる。

【0079】

[0121] 図４は、アクト３１４、３１６、３１８Ａ、３１８Ｂ、および／または３１８Ｃを参照して先に論じた種々のコンポーネントを含む報告例を示し、この報告例には、ＣＫＤ進行予測４０２（５年の時間軸に対して２２％のＣＫＤ進行リスクを示し、これは５％超過および２５％未満の閾値を満たすことに基づいて、「中程度の」と特徴付けられる）、ＣＫＤの潜在的な合併症４０４、推奨される治療４０６および追加の推奨４０８、腎臓内科への紹介(referral)の推奨４１０、血圧目標推奨４１２、および監視頻度推奨４１４等がある。

【0080】

[0122] 図４に示す報告と同様の（少なくともいくつかの観点において）報告も、医師によって行われる要求に応答して、または実施された初期診療にしたがって（例えば、特定の判断基準を満たす患者に対する日常的な処置として）、生成することもできる。尚、本開示を考慮すれば、本開示による報告が、追加のまたは代わりのコンポーネントを含んでもよく、種々の形態／フォーマットを採用できる(take on)ことは認められよう。

【0081】

[0123] 図３Ｃに注意を向けると、図３Ｃは、流れ図３２０のアクト３２２が、慢性腎疾患（ＣＫＤ）進行予測を生成するように構成された機械学習モデルにアクセスするステップを含むことを示す。この機械学習モデルは、訓練データ集合に対して訓練され、訓練データ集合は、（ｉ）複数の患者に関連する医療研究室データの第１集合と、（ｉｉ）複数の患者の中に含まれる各患者の年齢と、（ｉｉｉ）複数の患者の中に含まれる各患者の性別とを含む。医療実験室データの第１集合は、複数の患者に含まれる患者の少なくとも１つの組み合わせについて、尿アルブミン／クレアチニン比（ＡＣＲ）、推算糸球体濾過量（ｅＧＦＲ）、尿素、ヘモグロビン、アルブミン、ヘマトクリット、グルコース、リン酸塩、重炭酸塩、ガンマ－グルタミル・トランスフェラーゼ（ＧＧＴ）、血小板数、マグネシウム、および塩化物を示す。

【0082】

[0124] 流れ図３２０のアクト３２４は、新たな患者に関連する入力データ集合を機械学習モデルに投入することによって、新たな患者についてＣＫＤ進行予測を生成するステップを含む。新たな患者についてのＣＫＤ進行予測は、新たな患者に関連する入力データ集合を機械学習モデルに投入した結果得られる機械学習モデルの出力に基づく。入力データ集合は、新たな患者の年齢と、新たな患者の性別と、医療研究室データの第２集合とを含み、第２集合は、新たな患者について、尿化学検査、包括的代謝パネル、全血球計算、肝臓パネル、または尿酸検査の内１つ以上の項目を含む。

【0083】

[0125] ある実施態様では、医療研究室データの第２集合は、新たな患者について、尿化学検査、包括的代謝パネル、全血球計算の内１つ以上の項目を含む。図３Ｃには示されていないが、流れ図３２０は、更に、アクト３２４にしたがって生成されるＣＫＤ進行予測に基づく実行のために、アクト３１６、３１８Ａ、３１８Ｂ、３１８Ｃ、および／または３１８Ｄと同様のアクトを含むこともできる。

【0084】

[0126] 図３Ｄの流れ図３３０のアクト３３２は、慢性腎疾患（ＣＫＤ）進行予測を生成するように構成された機械学習モデルにアクセスするステップを含む。機械学習モデルは、訓練データ集合に対して訓練され、訓練データ集合は、（ｉ）複数の患者に関連する医療研究室データの第１集合と、（ｉｉ）複数の患者に含まれる各患者の年齢と、（ｉｉｉ）複数の患者に含まれる各患者の性別とを含む。医療研究室データの第１集合は、少なくとも、複数の患者に含まれる患者の組み合わせについて、尿アルブミン／クレアチニン比（ＡＣＲ）、推算糸球体濾過量（ｅＧＦＲ）、尿素、ヘモグロビンを示す。

【0085】

[0127] 流れ図３３０のアクト３３４は、新たな患者に関連する入力データ集合を機械学習モデルに投入することによって、新たな患者についてＣＫＤ進行予測を生成するステップを含む。新たな患者についてのＣＫＤ進行予測は、新たな患者に関連する入力データ集合を機械学習モデルに投入した結果得られる機械学習モデルの出力に基づく。入力データ集合は、新たな患者の年齢と、新たな患者の性別と、医療研究室データの第２集合とを含み、第２集合は、新たな患者について、尿化学検査、包括的代謝パネル、全血球計算、肝臓パネル、または尿酸検査の内１つ以上の項目を含む。

【0086】

[0128] ある実施態様では、医療研究室データの第２集合は、新たな患者についての尿化学検査の１つ以上の項目を含む。ある実例では、医療研究室データの第２集合は、新たな患者についての尿化学検査および包括的代謝パネルの内１つ以上の項目を含む。図３Ｄには示されていないが、流れ図３３０は、更に、アクト３３４にしたがって生成されるＣＫＤ進行予測に基づく実行のために、アクト３１６、３１８Ａ、３１８Ｂ、３１８Ｃ、および／または３１８Ｄと同様のアクトを含むこともできる。

【0087】

[0129] 先に注記したように、本開示にしたがって患者についてＣＫＤ進行予測の生成を容易にするために、種々の型式の機械学習モデルを実装することができる。以下の論述は、ＣＫＤ進行予測を生成するための種々のランダム・フォレスト・モデルおよびランダム・サバイバル・フォレスト・モデルの実装例に言及する。
ランダム・フォレスト・モデルの例（１つまたは複数）
[0130] 図５は、機械学習モデルの訓練データ集合を生成する元となった、患者のコホートの選択例を模式的に示す。マニトバ健康政策センタ（ＭＣＨＰ：Manitoba Centre for Health Policy）からのデータを使用して、カナダのマニトバ（当時の人口は１４０万人）における管理データから研究構築コホート(study development cohort)を導き出した。ＭＣＨＰは、マニトバ大学における地域保健学学科(Department of Community Health Sciences)内にある研究ユニットであり、この県における全ての個人に及ぶ保健活動およびその他の社会的健康決定要因についてのデータの人口に基づくレポジトリを維持する。訓練データ集合は、２００６年４月１日と２０１６年１２月３１日との間において入手可能な外来患者ｅＧＦＲ検査、および少なくとも１年のプレインデックスのために有効なマニトバ健康登録によって、当該県にいる全ての成人した（１８歳以上）個人を含んだ。例えば、ＣＫＤ－ＥＰＩ式を使用して、入手可能な血清クレアチニン検査からｅＧＦＲを計算した。更に、患者には、年齢および性別に関する人口統計情報を含めるように要求し、更に尿アルブミン／クレアチニン比（ＡＣＲ）またはタンパク／クレアチニン比（ＰＣＲ）検査の結果を要求した。腎不全の履歴がある患者（透析または移植）を除外した。個人健康情報番号をスクランブリングして使用し、データを特定できないようにした(de-identified)。

【0088】

[0131] この研究例では、本システムは、２００６年４月１日と２０１６年１２月３１日との間において、６，７１７，５２２回の血清クレアチニン検査を特定し、その内３，５７４，６２８回を外来診療の場で行った。これから、本システムは少なくとも１つの計算可能なｅＧＦＲ測定値および有効な健康登録を有する、６３４，１３３人の一意の個人を特定することができた。尿ＡＣＲ検査（または変換ＰＣＲ検査）が有効であるという要件に絞った後、本システムは、訓練および検査データ集合双方に対して（図５）７７，１９６人の総コホート・サイズに到達した。２年目における転帰を評価するために、訓練データ集合は、６１，３５３人の個人（訓練に４２，９４７人、そして検査に１８，４０６人）における完全な追跡(follow up)を含み、更に５年目における転帰を評価するために、３５，７３６人の個人（訓練に５４，０３７人、そして検査に２３，１５９人）を含んだ。

【0089】

[0132] 一実施形態例では、ベースライン・コホートの平均年齢は５９．３歳（±１７．０）であり、患者は、８２．２（±２７．２）ｍｌ／分／１．７３ｍ^２の平均ｅＧＦＲを有した。変換ＰＣＲを含めた後のＡＣＲ中央値は、１．１ｍｇ／ｍｍｏｌであった（四分位範囲０．５から４．７ｍｇ／ｍｍｏｌ）。患者の４７．７％は男性であり、４５．２％は糖尿病を患い、６９．９％は高血圧を患っていた。５．２％、３．６％、および２．６％は、それぞれ、鬱血性心不全、脳卒中、または心筋梗塞の病歴を有した。訓練および検査グループに分割したとき、特性は同様であった。

【0090】

[0133] 図６Ａは、図５を参照して先に論じたコホートの記述を含む表を示し、各患者についての医療研究室データに含まれる種々の検査結果を含む。種々の検査結果は、訓練データ集合（例えば、訓練データ集合１４１）に含まれる独立および従属変数として分類された。

【0091】

[0134] 訓練データ集合は、先に説明したように、年齢、性別、ｅＧＦＲ、および尿ＡＣＲを含んだ。研究期間中に最初に記録されたｅＧＦＲから開始し、６か月の枠において最後に入手可能な検査に移動し、この期間中における検査の平均を計算して、ベースラインｅＧＦＲを、全ての入手可能なｅＧＦＲ結果の平均として、計算した。患者の指標日(index date)を、この６か月期間における最後のｅＧＦＲの日付けと見なした。年齢を指標ｅＧＦＲの日付けにおいて決定し、誕生日およびその他の人口統計データを記録する(contain)マニトバ健康保険登録簿への連携を使用して、性別を判定した。尿ＡＣＲ検査が利用できなかった場合、公開および検証された公式を使用して、利用可能な尿タンパク／クレアチニン（ＰＣＲ）検査を、対応する尿ＡＣＲに変換した。指標日から１年以内で最も近い結果を選択した（前または後）。変数歪み分布(variables skewed distribution)のために、尿ＡＣＲを対数変換した。

【0092】

[0135] 既に説明した変数に加えて、モデル作成において低い欠損度（＜１５％または＜３０％）を有する他の関連研究室変数(relevant laboratory variable)を含ませた。これらには、血清ナトリウム、血清塩化物、血清ヘモグロビン、尿素、血清カリウム、グルコース、ＡＳＴ、ＡＬＴ、ビリルビン、ＧＧＴ、ヘマトクリット、および／または血小板数が含まれた。指標日から１年以内において最も近い値を選択する（前または後）。これらの変数を用いて構築したモデルを「１０変数モデル」（年齢、性別、および前述の研究室データ(labs)）と呼ぶ。

【0093】

[0136] コックス比例ハザード・モデルにおいて適用するとき、ＳＡＰＲＯＣＭＩを使用する複数の代入（ｎ＝５）を適用した。ＳＡＳＰＲＯＣＨＰＦＯＲＥＳＴを使用して枝分かれを判断するときに、「欠損値」(missing value)を有することが、変数の分割値として扱われるという所見により、ランダム・フォレスト・モデルは、変数が欠損することを許容する。いかなる欠損度でも許容する６つの追加の変数、即ち、血清アルブミン、アルカリフォスターゼ、血清リン酸塩、血清重炭酸塩、血清マグネシウム、および血清カルシウムを含む、追加のランダム・フォレスト・モデルを評価する。このモデルを１６変数モデルと呼ぶ。訓練データ集合に含まれる研究室データは、マニトバ（ＤＳＭ）研究室情報システムの共有健康診断サービス(Shared Health Diagnostic Services)から抽出可能である。

【0094】

[0137] 開示する実施形態の少なくとも一部に対する成果は、患者についてのｅＧＦＲの４０％低下または腎不全に対する予測および／またはリスク・スコアである。訓練データ集合内部において、ｅＧＦＲの４０％低下を、ベースラインｅＧＦＲからの４０％以上の低下であった最初のｅＧＦＲ検査として判定し、１か月の期間において患者が死亡しなければ、または腎不全を発症しなければ、少なくともこの１か月後に、２回目の確認検査を行った。４０％低下が発生した日付けを、これらの認定試験の内最初のものと見なす。腎不全は、３つの条件、長期透析の開始、移植の受け入れ、またはｅＧＦＲ＜１０ｍｌ／分／１．７３ｍ^２に基づいて判定した。透析は、長期透析についてのマニトバ医療サービス・データベースにおける任意の２表示(claim)として定められ、移植は、移植用マニトバ医療サービス・データベースにおける任意の１表示として定められ、また退院情報データベース（ＤＡＤ：Discharge Abstract Database）における入院は、腎移植に対応する手順コードによって定められた（カナダ健康介入分類（ＣＣＩ：Canadian Classification of Health Interventions）コードを使用すると、１ＰＣ８５または１ＯＫ８５）。透析および移植を識別するタリフ・コード(tariff code)の概要を図７に示す。

【0095】

[0138] 図６Ｂは、ベースライン・コホートにおける異なる変数の欠損度の概要を示す表である。コックス比例ハザード・モデルにおいて適用したとき、本システムは、ＳＡＳＰＲＯＣＭＩを使用して、欠損度が３０％未満の変数に対して複数の代入(imputation)を適用した。ランダム・フォレスト・モデルにおいて適用したとき、本システムは、欠損データ・アルゴリズムを使用して、欠損データに対して代入を適用した。研究室データに含まれた全ては、マニトバ共有健康診断サービス（ＤＳＭ：Shared Health Diagnostic Services of Manitoba）の研究室情報システムから抽出され、退院情報データベース（ＤＡＤ）への連携によって判定された入院事象中に記録された値はいずれも含まれなかった。

【0096】

[0139] ｅＧＦＲの４０％低下または腎不全に対する転帰日(outcome date)は、これらの発症(event)の内最初のものに基づいて決定した。図８は、機械学習モデルの訓練データ集合に含まれる各変数に対する変数重要度の概要を示す表である。具体的には、この表は、ランダム・フォレスト・モデルの一例については、精度高いＣＫＤ進行予測を生成するときに最も高い影響(impact)を及ぼした変数には、尿ＡＣＲ、ｅＧＦＲ、尿素、およびヘモグロビンが含まれることを示す。年齢および性別も有意な変数である。

【0097】

[0140] 図９は、訓練データ集合９１０に含まれる各患者についての患者情報（例えば、性別９１６Ａ、９１６Ｂ、年齢９１８Ａ、９１８Ｂ）と、医療研究室データとを含む訓練データ集合９１０の一例を概念的に示す。図示のように、患者Ａ９１２Ａに関連する医療研究室データ９２０Ａは、ｅＧＦＲ９２２Ａ、尿ＡＣＲ９２４Ａ、血清ナトリウム９２６Ａ、血清塩化物９２８Ａ、血清ヘモグロビン９３２Ａ、尿素９３４Ａ、血清カリウム９３６Ａ、およびグルコース９３８Ａの測定値を含む。同様に、図示のように、患者Ｂ９１２Ｂに関連する医療研究室データ９２０Ｂは、ｅＧＦＲ９２２Ｂ、尿ＡＣＲ９２４Ｂ、血清ナトリウム９２６Ｂ、血清塩化物９２８Ｂ、血清ヘモグロビン９３２Ｂ、尿素９３４Ｂ、血清カリウム９３６Ｂ、およびグルコース９３８Ｂの測定値を含む。楕円は、任意の数の患者を訓練データ集合９１０に含んでもよいことを示す。先に注記したように、訓練データ集合９１０において表される１人以上の患者について、何らかの測定値が欠損しているおそれがある。

【0098】

[0141] サバイバル・フォレストを右打ち切り生存と共に使用する、生存、回帰、および分類用のＲパッケージ高速統一ランダム・フォレスト(R package Fast Unified Random Forest)（ＲＦ－ＳＲＣ）を使用して、ランダム・フォレスト・モデルを当てはめることができる。これを遂行するために、データを訓練（７０％）および検査（３０％）データ集合に分割する。受信者動作特性（ＲＯＣ：receiver operating characteristic）曲線の下にある時間依存エリア、ブライア・スコア、および観測対予測リスクの較正プロットを使用して、モデルを精度について評価した。加えて、この特定例では、本システムは、推定されたリスクによって（高いリスク）、および推定されたリスクの内低い方の５０％、４５％、および30％（低いリスク）において、患者の上位１０％、１５％、および２０％について、感度、特異性、負予測値（ＮＰＣ：negative predictive value）、および正予測値（ＰＰＶ）を評価した。

【0099】

[0142] 一般化可能性を評価するために、本システムは、検査コホートの部分母集団においてこのモデルを評価した。この部分母集団は、（１）糖尿病の患者、（２）糖尿病でない患者、（３）ｅＧＦＲ＜６０ｍｌ／分／１．７３ｍ^２または尿ＡＣＲ＞３ｍｇ／ｍｍｏｌ（変換尿ＰＣＲ検査を含む）によって定められたＣＫＤの患者、および（４）ｅＧＦＲが３０～６０ｍｌ／分／１．７３ｍ^２またはｅＧＦＲ＞６０ｍｌ／分／１．７３ｍ^２および尿ＡＣＲ＞３ｍｇ／ｍｍｏｌ（変換尿ＰＣＲ検査を含む）の患者によって定められる、ＣＫＤ病期Ｇ１～Ｇ３の患者を含む。図２７Ａ～図２７Ｂを参照のこと。最終的に成長した２２変数フォレストを使用して、含まれるパラメータの変数重要度を評価した。

【0100】

[0143] また、訓練データ集合において、コックス比例ハザード・モデルを展開した(develop)。（１）多くても３０％の欠損しか有さない変数を含むモデル（１１変数モデル）、および（２）腎不全リスク予想式（ＫＦＲＥ）と比較するための、年齢、性別、ｅＧＦＲ、および尿ＡＣＲという変数を含むモデル。ハレルのＣ統計量を使用してモデル判別を評価し、ブライア・スコアを使用して精度を評価し、検査データ集合における観測対予測リスク確率のプロットを使用して較正を評価した。ＳＡＳバージョン９．３（Ｃａｒｙ，ＮＣ）およびＲバージョン４．１．０を使用して、分析を行った。アルファ＝０．０５を使用して、統計的有意性を先験的に識別した。

【0101】

[0144] また、ＳＡＳＰＲＯＣＨＰＦＯＲＥＳＴを使用して、ランダム・フォレスト・モデルを当てはめ、種々の人口統計および研究室変数を使用するＳＡＳＰＲＯＣＨＰ４ＳＣＯＲＥを使用して、内部的に検証した。ある統計分析結果では、アウトオブバッグ（ＯＯＢ：out of bag）誤分類率を、モデルにおいて選択されたリーブ数と突き合わせて調査した。２年目および５年目における転帰の予測に対する精度の尺度を、ランダム・フォレスト・モデルに対して評価した。尺度には、受信者動作特性（ＲＯＣ）曲線の下のエリア、ブライア・スコア、および予測された確率のリスク十分位(risk decile)による観測および予測リスクの較正プロットが含まれる。

【0102】

[0145] 加えて、感度、特異性、負予測値（ＮＰＶ）、および正予測値（ＰＰＶ）を含む他のパラメータを、２年モデルにおける１％および１０％のカットオフならびに５年モデルにおける５％および２５％のカットオフにおいて評価した。これらのカットオフが選択されたのは、これらが臨床的に有意であり、予測されたリスク・スコアによって分類された、個人の下位６０％および上位１０％にほぼ対応するからである。二乗誤差損失を評価するために、ＳＡＳＰＲＯＣＨＰ４ＳＣＯＲＥにおいてランダム分岐割り当て（ＲＢＡ：random branch assignments）方法を使用して、変数重要度の測定値を計算した。

【0103】

[0146] 例えば、図１０は、２年の時間期間内における低下を予測するために、例えば、図９に示す訓練データ集合を使用して、ランダム・フォレスト・モデルとして構成された機械学習モデルに対する較正プロット例を示すグラフである。図１１は、例えば、５年の時間期間に対して、図９に示すような訓練データ集合を使用して、ランダム・フォレスト・モデルとして構成された機械学習モデルに対する較正プロット例を示すグラフである。実装した例について、図１０～図１１に示すグラフから明白なように、５年予測（図１１）は、２年予測（図１０）よりも、観測された転帰と密接に相関したが、双方の予測モデルは、患者管理(care)および／または治療／予防判断を導くことができる有用な予測メトリックスを提供した。

【0104】

[0147] また、この研究は、４０％低下または腎不全の転帰を発現する(develop)リスクを予測するために、前述の変数を有する訓練データ集合において、種々の展開されたコックス比例ハザード・モデルを分析し、更に検査集合において、続いてこれらを内部的に検証した。２年目および５年目において、ハレルのＣ統計量を使用して、モデル判別を評価し、ブライア・スコアを使用して精度を評価し、観測対予測リスク確率のプロットを使用して、予測されたリスクの十分位によって、較正を評価した。ＳＡＳバージョン９．４（Ｃａｒｙ，ＮＣ）を使用して、全ての分析を行った。アルファ＝０．０５を使用して、統計的有意性を先験的に識別した。

【0105】

[0148] 例えば、図１２は、２年の時間期間に対して、例えば、図９に示すような訓練データ集合を使用して、コックス・モデルとして構成された機械学習モデルに対する較正プロットの一例を示すグラフである。図１３は、５年の時間期間に対して、例えば、図９に示す訓練データ集合を使用して、コックス・モデルとして構成された機械学習モデルに対する較正プロットの一例を示すグラフである。実装した例について、図１２～図１３に示すグラフから明白なように、２年予測（図１２）は、５年予測（図１３）よりも、観測された転帰と密接に相関したが、双方の予測モデルは、患者管理(care)および／または治療／予防判断を導くことができる有用な予測メトリックスを提供した。更に、１０変数コックス・モデルは、１０変数ランダム・フォレスト・モデル（図１０）と比較すると、２年目において観測された転帰（図１２）に対して、より高い相関が得られた。

【0106】

[0149] 図１４は、ＣＫＤ進行を予測する９変数モデルを形成するために使用可能な、訓練データ集合１４１０に含まれる各患者についての、患者情報（例えば、性別１４１６Ａ、１４１６Ｂ、年齢１４１８Ａ、１４１８Ｂ）と、医療研究室データとを含む訓練データ集合１４１０の一例を概念的に示す。訓練データ集合１４１０は、図９の訓練データ集合９１０と同様であるが、尿ＡＣＲ測定値を削除している。図示のように、患者Ａ１４１２Ａに関連する医療研究室データ１４２０Ａは、ｅＧＦＲ１４２２Ａ、血清ナトリウム１４２６Ａ、血清塩化物１４２８Ａ、血清ヘモグロビン１４３２Ａ、尿素１４３４Ａ、血清カリウム１４３６Ａ、およびグルコース１４３８Ａの測定値を含む。同様に、図示のように、患者Ｂ１４１２Ｂに関連する医療研究室データ１４２０Ｂは、ｅＧＦＲ１４２２Ｂ、血清ナトリウム１４２６Ｂ、血清塩化物１４２８Ｂ、血清ヘモグロビン１４３２Ｂ、尿素１４３４Ｂ、血清カリウム１４３６Ｂ、およびグルコース１４３８Ｂの測定値を含む。任意の数の患者を訓練データ集合１４１０に含むこともできる。先に注記したように、訓練データ集合１４１０において表される１人以上の患者について、何らかの測定値が欠損しているおそれがある。

【0107】

[0150] 図１５は、２年の時間期間に対して、例えば、図１４に示すような訓練データ集合を使用して、コックス・モデルとして構成された機械学習モデルに対する較正プロットの一例を示すグラフである。図１６は、５年の時間期間に対して、例えば、図１４に示すような訓練データ集合を使用して、コックス・モデルとして構成された機械学習モデルに対する較正プロットの一例を示すグラフである。この実装した例について、図１５～図１６に示すグラフから明白なように、２年予測（図１５）は、５年予測（図１６）よりも、観測された転帰と密接に相関したが、双方の予測モデルは、患者管理および／または治療／予防判断を導くことができる有用な予測メトリックスを提供した。尚、９変数モデル（図１５および図１６）を使用する２年予測および５年予測は、１０変数モデル（図１２および図１３）を使用する２年予測および５年予測と同様の相関結果を生成し、ＡＣＲを省略してもなお、いずれの時間枠に対しても密接に相関する予測パワーを提供できることは、注記してしかるべきである。

【0108】

[0151] 図１７は、１６から２２変数の医療研究室データ集合を含む訓練データ集合１７１０の一例を示す。これは、慢性腎疾患進行予測を生成するように構成された機械学習モデルを訓練するために使用することができる。訓練データ集合１７１０は、図９における訓練データ集合９１０の一例であり（患者Ａ１７１２Ａおよび患者Ｂ１７１２Ｂについて、それぞれ、性別１７１６Ａおよび１７１６Ｂならびに年齢１７１８Ａおよび１７１８Ｂを含む）、訓練データ集合１７１０に含まれる少なくとも一部の患者について、追加の測定値が医療研究室データに含まれている。

【0109】

[0152] 図示のように、患者Ａ１７１２Ａに関連する医療研究室データ１７２０Ａは、ｅＧＦＲ１７２２Ａ、尿ＡＣＲ１７２４Ａ、血清ナトリウム１７２６Ａ、血清塩化物１７２８Ａ、血清ヘモグロビン１７３２Ａ、尿素１７３４Ａ、血清カリウム１７３６Ａ、グルコース１７３８Ａ、血清アルブミン１７２１Ａ、アルカリフォスターゼ１７２３Ａ、血清リン酸塩１７２５Ａ、血清重炭酸塩１７２７Ａ、血清マグネシウム１７２９Ａ、および血清カルシウム１７３１Ａの測定値を含む。

【0110】

[0153] 同様に、図示のように、患者Ｂ１７１２Ｂに関連する医療研究室データ１７２０Ｂは、ｅＧＦＲ１７２２Ｂ、尿ＡＣＲ１７２４Ｂ、血清ナトリウム１７２６Ｂ、血清塩化物１７２８Ｂ、血清ヘモグロビン１７３２Ｂ、尿素１７３４Ｂ、血清カリウム１７３６Ｂ、グルコース１７３８Ｂ、血清アルブミン１７２１Ｂ、アルカリフォスターゼ１７２３Ｂ、血清リン酸塩１７２５Ｂ、血清重炭酸塩１７２７Ｂ、血清マグネシウム１７２９Ｂ、および血清カルシウム１７３１Ｂの測定値を含む。ある実施態様では、患者Ａの医療研究室データ１７２０Ａおよび患者Ｂの医療研究室データ１７２０Ｂは、更に、ＡＳＴ、ＡＬＴ、ビリルビン、ＧＧＴ、ヘマトクリット、および／または血小板数１７４０Ａおよび１７４０Ｂをそれぞれ含む。訓練データ集合１７１０には、任意の数の患者を含めることができる。先に注記したように、訓練データ集合１７１０において表される１人以上の患者について、何らかの測定値が欠損しているおそれがある。

【0111】

[0154] ある実施形態では、訓練データ集合１７１０を使用して訓練される機械学習モデルは、２２変数モデルとして構成される。つまり、新たな患者の入力データ集合は、２２個もの多さの異なる研究室データ点／測定値（または更に多くも可能である）を含むこともできる。

【0112】

[0155] 図１８は、２年の時間期間に対して、例えば、図１７に示すような訓練データ集合の１６変数を使用する、機械学習モデルに対する較正プロットの一例を示すグラフである。図１９は、５年の時間期間に対して、例えば、図１７に示すような訓練データ集合の１６変数を使用する、機械学習モデルに対する較正プロットの一例を示すグラフである。この実装した例について、図１８および図１９に示すグラフから明白なように、５年予測（図１９）は、２年予測（図１８）よりも、観測された転帰と密接に相関したが、双方の予測モデルは、患者管理および／または治療／予防判断を導くことができる有用な予測メトリックスを提供した。更に、２年予測については、１６変数モデル（図１８）は、１０変数モデル（図１０）と比較すると、相関の改良を示したことは、注記してしかるべきである。しかしながら、５年予測については、１６変数モデル（図１９）および１０変数モデル（１１）の双方は、４０％予測閾値に対して実質的に同様の性能を示した。１６変数モデル（図１９）は、１０変数モデル（図１１）よりも低いパーセンテージ閾値によって、一層安定した相関を発揮した(provide)。

【0113】

[0156] 図２０は、５年目におけるｅＧＦＲの４０％低下または腎不全の予測のための２２変数ランダム・フォレスト・モデルに対する較正プロットを示すグラフである。

【0114】

[0157] 図２１は、１５から２１変数の医療研究室データを含む訓練データ集合２１１０の一例を示す。これは、慢性腎疾患進行予測を生成するように構成された機械学習モデルを訓練するために使用することができる。訓練データ集合２１１０は、図１７の訓練データ集合１７１０の一例であり（患者Ａ２１１２Ａおよび患者Ｂ２１１２Ｂについて、それぞれ、性別２１１６Ａおよび２１１６Ｂ、ならびに年齢２１１８Ａおよび２１１８Ｂを含む）が、例外として、訓練データ集合２１１０に含まれる各患者について尿素ＡＣＲの測定値を除外する。

【0115】

[0158] 図示のように、患者Ａ２１１２Ａに関連する医療研究室データ２１２０Ａは、ｅＧＦＲ２１２２Ａ、血清ナトリウム２１２６Ａ、血清塩化物２１２８Ａ、血清ヘモグロビン２１３２Ａ、尿素２１３４Ａ、血清カリウム２１３６Ａ、グルコース２１３８Ａ、血清アルブミン２１２１Ａ、アルカリフォスターゼ２１２３Ａ、血清リン酸塩２１２５Ａ、血清重炭酸塩２１２７Ａ、血清マグネシウム２１２９Ａ、および血清カルシウム２１３１Ａの測定値を含む。

【0116】

[0159] 同様に、図示のように、患者Ｂ２１１２Ｂに関連する医療研究室データ２１２０Ｂは、ｅＧＦＲ２１２２Ｂ、血清ナトリウム２１２６Ｂ、血清塩化物２１２８Ｂ、血清ヘモグロビン２１３２Ｂ、尿素２１３４Ｂ、血清カリウム２１３６Ｂ、グルコース２１３８Ｂ、血清アルブミン２１２１Ｂ、アルカリフォスターゼ２１２３Ｂ、血清リン酸塩２１２５Ｂ、血清重炭酸塩２１２７Ｂ、血清マグネシウム２１２９Ｂ、および血清カルシウム２１３１Ｂの測定値を含む。ある実施態様では、患者Ａの医療研究室データ２１２０Ａおよび患者Ｂの医療研究室データ２１２０Ｂは、更に、ＡＳＴ、ＡＬＴ、ビリルビン、ＧＧＴ、ヘマトクリット、および／または血小板数２１４０を含む。訓練データ集合２１１０には、任意の数の患者を含めることができる。先に注記したように、訓練データ集合２１１０において表される１人以上の患者について、何らかの測定値が欠損しているおそれがある。

【0117】

[0160] 図２２は、２年の時間期間に対して、例えば、図２１に示すような訓練データ集合（１５変数）を使用する、機械学習モデルに対する較正プロットの一例を示すグラフである。図２３は、５年の時間期間に対して、例えば、図２１に示すような訓練データ集合（１５変数）を使用する、機械学習モデルに対する較正プロットの一例を示すグラフである。この実装した例について、図２２および図２３に図示するグラフに示すように、５年予測（図２３）は、２年予測（図２２）よりも、観測された転帰と密接に相関したが、双方の予測モデルは、患者管理および／または治療／予防判断を導くことができる有用な予測メトリックスを提供した。更に、５年予測については、１５変数モデル（図２３）は、１６変数モデル（図１９）と同様の性能を示し、ＡＣＲの削除は、モデルによって提供される予測に重大な影響を及ぼさないことを示唆した。

【0118】

[0161] 図２４は、本明細書において開示されコックス・モデルとして構成された、４から１１個の変数を有する機械学習モデルの種々の例について、性能評価統計の概要の一例を示す表である。図２４に示すように、５年目における予測性能(predicted performance)に対して種々のモデルを評価した。考慮した変数には、年齢、ｅＧＦＲ、対数変換ＡＣＲ、ヘマトクリット、カリウム、塩化物、グルコース、ナトリウム、尿素、男性、および血小板数が含まれる。

【0119】

[0162] 他の検査（図示せず）において、本システムは、以下のランダム・フォレスト・モデルの出力に比較するために、２年目および５年目において完全に入手可能な追跡を有したコホートにおいて、コックス比例ハザード・モデルを評価した。この検査コホートにおいて、２年目における転帰の予測では、コックス比例ハザード・モデルは、ベースライン・モデルにおいて０．８４９２（ＳＥ０．００７）のＣ統計量を有し、５年目では０．８１５１（０．００６）に減少した。

【0120】

[0163] 尿ＡＣＲを削除したモデル（例えば、９および１５変数モデル）では、本システムは、Ｃ統計量が、２年目において０，８２６６（０．００８）、そして５年目において０．７９４２（０．００６）であることを認めた。コホートに２年の追跡を適用したモデルでは、ブライア・スコアは、ｅＧＦＲ低下または腎不全という転帰の予測に対して０．０２９８（０．００１）であり、５年の追跡を適用したコホートでは、ブライア・スコアは、検査コホートにおいて０．０８３２（０．００２）であった。尿ＡＣＲを削除したモデルでは、ブライアン・スコアは、２年目における転帰の予測に対して０．０３０５（０．００１）であり、５年目における転帰の予測に対して０．０８５５（０．００２）であった。

【0121】

[0164] 図２５は、４変数モデルおよび１１変数モデルを含む、コックス比例ハザード・モデルに対する較正プロットを示すグラフである。双方のモデルは、高い性能を発揮し、精度高くリスクを予測した。ｅＧＦＲの４０％低下または腎不全の転帰に対する最大追跡時間を５年として、死亡および追跡不能に対しては打ち切って、異なるコックス比例ハザード・モデルを評価した。これらに含まれたのは、（１）３０％以下の欠損を有した全ての変数、即ち、年齢、ｅＧＦＲ、男性、尿ＡＣＲ、血小板数、カリウム、ヘマトクリット、血清塩化物、グルコース、血清ナトリウム、および尿素を含む１１変数モデル、ならびに（２）年齢、ｅＧＦＲ、男性、および尿ＡＣＲを含む４変数モデルである。１１変数コックス・モデルでは、ハレルのＣ統計量は０．８４９（０．８３７から０．８６１の９５％信頼区間）と、ブライアン・スコアは４．４（２．４から６．３）であり、全てのリスク・レベルにおいて正しく較正された。同様に、４変数コックス・モデルでは、ハレルのＣ統計量は０．８２９（０．８１６から０．８４２）と、ブライアン・スコアは４．５（２．５～６．５）であり、図２５に示すように同様の較正が得られた。

【0122】

[0165] 図２６Ａは、ランダム・フォレスト・モデルとして構成された機械学習モデルの種々の例に対する性能評価統計の概要の一例を示す表である。１０変数を有するランダム・フォレスト・モデルでは、本システムは、ＲＯＣ下のエリアが、２年目において０．８４０６（ＳＥ０．００８０）、そして５年目において０．７９６６（０．００６９）であるという優れた判別を認めた。精度に関しては、本システムは、ブライアン・スコアが、２年目において０．０２９（ＳＥ０．００１）、そして５年目において０．０７７（０．００２）であることを認めた。２年目および５年目におけるベースライン・モデルでは、本システムは優れた較正を観測した。１６変数ランダム・フォレストでは、Ｃ統計量は、２年目における転帰の予測に対して０．８６９７（０．００７）、５年目における転帰の予測に対して０．８１９０（０．００６）であった。このモデルからＡＣＲを除外したとき、２年目におけるＣ統計量は０．８５９７（０．００７）であり、５年目におけるＣ統計量は０．８０１４（０．００７）であった。対応する図において、１６変数および１５変数（ＡＣＲを除外する）モデルに対する追加のモデル・メトリックおよび較正プロットを示す。

【0123】

[0166] 図２６Ｂは、ランダム・フォレスト・モデルにおけるモデル性能の概要を示す他の表である（先に説明した機械学習モデルの２２変数バージョン）。１．２％と２．６％との間である場合、低いリスクと判定した。９％と１７％との間である場合、高いリスクと判定した。２３，１５９人の患者から成る検査コホートにおいて、性能を評価した。２２変数を有するランダム・フォレスト・モデルにおいても、本システムは、優れた判別を認め、受信者動作特性（ＡＵＲＯＣ）曲線下の時間依存エリアが、最大５年の追跡に対して８６．９（９５％ＣＩは８５．８から８８．１）であり、ブライアン・スコアは４．２（２．５から６．０）であった。観測された結果には、優れた較正が含まれていた。同様の性能は、全てのサブグループにおいても、次のように、糖尿病（ＡＵＲＯＣ：８６．３、ブライア：５．２）、糖尿病なし（ＡＵＲＯＣ：８７．１、ブライア：３．１）、ＣＫＤ（ＡＵＲＯＣ：８３．５、ブライア：７．７）、ＣＫＤ病期Ｇ１～Ｇ３（ＡＵＲＯＣ：７９．８、ブライア：６．７）が観測された。

【0124】

[0167] 感度、特異性、および正予測値に対する統計を、リスクが高い患者（それぞれ、上位１０、１５、および２０％のリスク・スコア）において評価した。この評価検査において、危険スコアの上位１０％では、感度は４７％（１７％の５年リスク閾値）、特異性は９３％、正予測値は３６％であった。上位１５％（１２％の５年リスク閾値）では、感度は５９％、特異性は８９％、正予測値は３０％であった。上位２０％（９％の５年リスク閾値）では、モデルは、６７％の感度、８４％の特異性、２６％の正予測値を有した。

【0125】

[0168] 同様に、本システムは、リスクが低い患者（それぞれ、患者の内下位５０、４５、および３０％）においても、感度、特異性、および負予測値を評価した。低い方から５０％の患者（２，６％の５年リスク閾値）では、このモデルは、９１％の感度、５３％の特異性、および９９％の負予測値を有した。低い方から４５％の患者（２．１％の５年リスク閾値）では、このモデルは、９３％の感度、４８％の特異性、および９９％の負予測値を有した。最後に、低い方から３０％の患者（１．２％の５年リスク閾値）では、このモデルは、９６％の感度、３２％の特異性、および９９％の負予測値を有した。

【0126】

[0169] 図２７Ａ～図２７Ｄは、種々のサブグループにおいてランダム・フォレスト・モデルとして構成された２２変数モデルに対する種々の較正プロットを示す。例えば、図２７Ａは、糖尿病患者のサブグループに対する較正プロットを示す。図２７Ｂは、糖尿病でない患者のサブグループに対する較正プロットを示す。図２７Ｃは、ｅＧＦＲ＜６０ｍｌ／分／１．７３ｍ^２、または変換尿ＰＣＲを含む、尿ＡＣＲ＞３ｍｇ／ｍｍｏｌの患者に対する較正プロットを示す。図２７Ｄは、ＣＫＤ病期Ｇ１～Ｇ３の患者（例えば、ｅＧＦＲが３０～６０ｍｌ／分／１．７３ｍ＾２の間、またはｅＧＦＲ＞６０ｍｌ／分／１．７３ｍ＾２、および変換尿ＰＣＲを含む尿ＡＣＲ＞３ｍｇ／ｍｍｏｌ）のサブグループに対する較正プロットを示す。
ランダム・サバイバル・フォレスト・モデルの例（１つまたは複数）
[0170] ＣＫＤ進行予測を生成するランダム・サバイバル・フォレスト・モデルの一例を構築する(develop)ために、マニトバ健康政策センタからのデータを使用して、カナダ、マニトバ（人口１４０万人）における管理データから、構築コホートを導き出した。この県にいる全ての成人（年齢１８歳以上）個人の内、２００６年４月１日および２０１６年１２月３１日の間に利用可能な外来ｅＧＦＲ検査を受け、少なくとも１年のプレインデックス(pre-index)の間に有効なマニトバ健康登録を有する者を特定した。ＣＫＤ－病疫学協働研究方程式を使用して、利用可能な血清クレアチニン検査からｅＧＦＲを計算した。含まれた患者には、更に、少なくとも１つの尿ＡＣＲまたはタンパク／クレアチニン比（ＰＣＲ）検査の結果を含む、年齢および性別についての完全な人口統計情報を有することも要求した。腎不全の病歴（透析または移植）がある患者は、除外した。図５を参照して先に論じたコホートを、ランダム・サバイバル・フォレスト・モデルを構築するために、使用した。

【0127】

[0171] ＡｌｂｅｒｔａＨｅａｔｈ（アルベルタ県医療）データベースから、検証コホートを導き出した。このデータベースは、カナダのアルベルタ県（人口４４０万人）における全ての患者についての、人口統計データ、研究室データ、入院、および医師の請求(physician claim)についての情報を収容する。クレアチニン測定値およびＡＣＲ／ＰＣＲ値の正規研究室填補範囲は、２００５に完了した。しかしながら、追加の研究室値は、２００９年以降にようやく完全に填補されたに過ぎない。したがって、２００９年４月１日から開始して２０１６年１２月３１日までに、少なくとも１つの計算可能なｅＧＦＲ、有効な健康登録、およびＡＣＲ（または代入ＰＣＲ）値を有する個人のコホートを特定した。最終分析を実行し代入時間を短縮するために、外部コホートの１／３をランダムにサンプリングした。腎不全の病歴がある患者（透析または移植）は、除外した。図２８は、ランダム・サバイバル・フォレスト・モデルを外部検証するために使用された検証コホートの態様を示す。

【0128】

[0172] ランダム・サバイバル・フォレスト・モデルを構築するために、全ての候補モデルは、年齢、性別、ｅＧＦＲ、および尿ＡＣＲ（例えば、既に説明した通り）を含んだ。ベースラインｅＧＦＲは、全ての利用可能な外来ｅＧＦＲ結果の平均として計算し、研究期間中において最初に記録されたｅＧＦＲから開始して、６か月枠において最後に利用可能な検査まで前進し、この期間における検査の平均を計算した。患者の指標日は、この６か月期間における最終ｅＧＦＲの日付けと見なした。年齢を指標ｅＧＦＲの日付けとして決定し、誕生日およびその他の人口統計データを記録するマニトバ健康保険登録簿への連携を使用して、性別を判定した。尿ＡＣＲ検査が利用できなかった場合、公開および検証された公式を使用して、利用可能な尿ＰＣＲ検査を、対応する尿ＡＣＲに変換した。指標日の前後１年以内において、最も近い結果を選択した。歪んだ分布を処理する(handle)ために、尿ＡＣＲを対数変換した。

【0129】

[0173] 既に説明した変数（年齢、性別、ｅＧＦＲ、および尿ＡＣＲ）に加えて、化学パネル、肝臓酵素、および全血球計算パネルからの追加研究室結果の有効性(utility)を、サバイバル用ランダム・フォレスト・モデル(random forest model for survival)に含ませるかについて評価した。指標日から１年以内において、最も近い値を選択して含ませた。必要なときには、分布変換(distributional transformation)を適用した。最終的なランダム・サバイバル・フォレスト・モデルは、ｅＧＦＲ、尿ＡＣＲ、および追加の１８種類の研究室結果（即ち、尿素、血清ナトリウム、血清塩化物、血清ヘモグロビン、血清カリウム、グルコース、血清アルブミン、アルカリホスファターゼ、血清リン酸塩、血清重炭酸塩、血清マグネシウム、血清カルシウム、ＡＳＴ、ＡＬＴ、ビリルビン、ＧＧＴ、ヘマトクリット、および血小板数）を含んだ。図２９に、研究室パネルに対する欠損度の概要を示す。ランダム・フォレスト・モデルは、適応ツリー代入方法を使用して、欠損データに対して代入を適用した。

【0130】

[0174] 含まれている全ての研究室データは、マニトバ研究室情報システムの共有健康診断サービスから抽出し、退院情報データベースへの連携によって判定された、入院事象中に記録された値はいずれも、含まれなかった（入院検査）。検証コホートについては、ＡｌｂｅｒｔａＫｉｄｎｅｙＤｉｓｅａｓｅＮｅｔｗｏｒｋ（アルベルタ腎疾患ネットワーク）から、アルベルタ衛生研究室のデータを抽出した。マニトバ・モデルにおいて使用した１８通りの研究室検査の内、１６の研究室検査は、アルベルタ腎疾患ネットワークからも規則的に収集した。利用可能でない検査（アスパラギン酸アミノトランスフェラーゼおよびガンマ・グルタミル・トランスフェラーゼ）は、欠損データとして扱った。

【0131】

[0175] 本例における主要な転帰は、ｅＧＦＲの４０％低下または腎不全であった。ｅＧＦＲの４０％低下は、研究室データにおいてベースラインｅＧＦＲから４０％以上の低下があった最初のｅＧＦＲ検査のときに判定され、４０％以上の低下が明らかになった最初の検査結果後９０日以内に、患者が死亡したまたは腎不全を発症したのではない限り、最初の検査後９０日および２年の間に、第２の確認検査結果を要求した。したがって、患者のｅＧＦＲが１回で４０％の低下を表し、そして９０日以内に患者が死亡した場合、事象として扱われる。また、この期間に彼らが腎不全を発症した場合も、事象として扱われる。腎不全は、長期透析の開始、移植の受け入れ、またはｅＧＦＲ＜１０ｍｌ／分／１．７３ｍ^２として定められた。透析は、長期透析についてのマニトバ医療サービス・データベースにおける任意の２表示(claim)として定められ、移植は、腎臓移植用マニトバ医療サービス・データベースにおける任意の１表示として定められ、また退院情報データベース（ＤＡＤ）における入院は、腎移植の対応手順コードによって定められた（カナダ健康介入分類コードを使用または国際疾病分類、第９改訂、手順コード５５．６を使用すると、１ＰＣ８５または１ＯＫ８５）。透析および移植を識別するタリフ・コード(tariff code)の概要を図３０に示す。

【0132】

[0176] ｅＧＦＲの４０％低下または腎不全の転帰日は、これらの事象の内最初のものに基づいて判定された。前述の複合終点に達するまで、死亡（マニトバ健康保険登録簿への連携によって判定する）まで、最大５年間、または追跡不能(loss)になるまで、患者を追跡した。

【0133】

[0177] 以前に説明したマニトバ・コホートについて記載したような研究室クレアチニン測定値を使用して、ｅＧＦＲの４０％低下を特定した。腎不全も同様に定めたが、構造が異なる管理データ集合に必要とされる、細かい改変を加えた（図３０参照）。長期透析および腎臓移植は、北および南アルベルタ腎臓プログラム・データベース(renal program database)、腎機能代替の地方登録簿を使用して特定し、血液透析、腹膜透析、または移植に対して任意の１つのコードを使用した。（注記：登録は２００１年に開始したので、医師は、以前に移植または透析を行った個人を除外するときにもデータを使用することを請求した。）これらのデータは、一意の符合化された患者識別子によって、県の研究室レポジトリにリンクされたソースであった。

【0134】

[0178] 構築（内部訓練および検査）コホートおよび外部検証コホートに対するベースライン特性を、記述統計によって要約した。サバイバル・フォレストを右打ち切りデータと共に使用するサバイバル、回帰、および分類用Ｒパッケージ高速統一ランダム・フォレストを使用して、ランダム・フォレスト・モデルを構築した。１回の分割で、データを訓練（７０％）および検査（３０％）データ集合に分割し、次いで外部コホートにおいて検証した。受信者動作特性曲線の下にあるエリア、ブライア・スコア、および観測対予測リスクの較正プロットを使用して、モデルを精度について評価した。受信者動作特性曲線の下のエリアおよびブライア・スコアを、１年目から５年目における転帰の予測について、１年間隔で評価し、２年目および５年目において較正プロットを評価した。tune.rfsrc関数を使用してモデル・ハイパーパラメータを最適化し、終端ノードの最大サイズおよび変数の個数の比較を使用して、場合により (possibly) サバイバル、回帰、および分類用のランダム・フォレスト・パッケージからアウトオブバッグ誤り率まで、各ノードにおいて分割した。加えて、リスクが最も高いと予測された（高いリスク）の患者の内上位１０％、１５％、および２０％について、感度、特異性、負予測値（ＮＰＶ）、および正予測値（ＰＰＶ）を評価した。これには、リスクが最も低い（低いリスク）下位５０％、４５％、および３０％についての評価も含む。これらのメトリックを２年目および５年目において評価した。進行のリスク対予測された確率を可視化し、２年および５年にわたってプロットした。図３１に示すように、最終的に成長した２２変数サバイバル・フォレストを使用して、含まれたパラメータの変数重要度を評価した。

【0135】

[0179] ロバストネスを評価するために、検査および検証コホートの部分母集団において、ＣＫＤ病期および糖尿病の有無によって定められる主要転帰の５年予測について、モデルを評価した。感度分析のために、２つの比較モデルを考慮した。（ｉ）分類予測子としてのアルブミン尿の３レベル定義およびｅＧＦＲの５病期を対照(comparator)として使用し、指針に基づくリスク定義を使用して、コックス比例ハザード・モデルを評価した（ヒートマップ・モデル）。（ｉｉ）変数ｅＧＦＲ、尿ＡＣＲ、糖尿病、高血圧、脳卒中、心筋梗塞、年齢、および性別（臨床モデル）を含むコックス比例ハザード・モデルを評価した。加えて、研究室値が指標日の前の１年分しか含まれていない外部検証コホートにおいて、モデルを評価した。

【0136】

[0180] Ｒバージョン４．１．０を使用して、分析を行った。１／４０．０５を使用して、統計的有意性を先験的に特定した。構築コホート（訓練および検査）のために、７７，１９６の総サンプル・サイズを使用し、５４，０３７を訓練データ集合に割り当て（７０％）、２３，１５９を検査データ集合に割り当てた。検証コホートにおいて、合計３２１，３９６人の個人を特定し、１０７，０９７人のランダムな部分集合を、評価のために選択した。構築および検証コホート双方のコホート選択プロセスの詳細な概要を、図５および図２８に示す。

【0137】

[0181] 構築コホートの平均年齢は５９．３歳であり、平均ｅＧＦＲは８２．２ｍｌ／分／１．７３ｍ^２であり、尿ＡＣＲ中央値は１．１ｍｇ／ｍｍｏｌであった。患者の内、４８％は男性であり、４５％が糖尿病を患い、７０％が高血圧を患い、５％には鬱血性心不全の病歴があり、４％は以前に脳卒中を患い、３％は以前に心筋梗塞を患っていた（検査および訓練コホート間でも同様）。

【0138】

[0182] 検証コホートの方が多少若く、平均年齢が５５．５歳であり、平均ｅＧＦＲは８６．０ｍｌ／分／１．７３ｍ^２であり、ＡＣＲ中央値は０．８ｍｇ／ｍｍｏｌであった。検証コホートの方が、男性患者の割合が高く（５３％）、患者の４１％が糖尿病、５１％が高血圧、５％が鬱血性心不全、５％が前に脳卒中を患い、５％が以前に心筋梗塞を患っていた。ベースライン記述統計の概要を図３２に示す。

【0139】

[0183] ２２個の変数を有するランダム・サバイバル・フォレスト・モデルでは、検査コホートにおいて評価したとき、主要転帰の１年予測に対するＡＵＣが０．９０（０．８９～０．９２）であり、５年予測に対しては０．８４（０．８３～０．８５）であることが分かった。ブライア・スコアは、主要転帰の１年予測に対しては０．０２（０．０１～０．０２）であり、５年予測では０．０７（０．０６～０．０９）であった。１年から５年に対するＡＵＣおよびブライア・スコアを図３３に示す。ＡＵＣおよびブライア・スコアは、予め定められた複数のサブグループにおいて同様であった（図３４）。このモデルは、内部および外部検査コホート双方で、２年および５年双方において優れた較正を呈した（図３５Ａおよび図３５Ｂ参照）。加えて、ランダム・フォレスト・アルゴリズムによって生成された予測確率が高まるに連れて、主要転帰事象の発生間における関係が深くなった(increase)ことが観測された。

【0140】

[0184] リスクが高い患者（それぞれ、リスク・スコアの上位１０％、１５％、および２０％）において、感度、特異性、およびＰＰＶに対する統計を評価した。２年目における主要転帰の予測について、上位十分位数（１４％の２年リスク閾値）に入る患者は、５８％の感度、９２％の特異性、および２５％のＰＰＶを有することが分かった。同様に、患者の内上位１５％（１０％の２年リスク閾値）について、感度が６９％、特性が８７％、およびＰＰＶが２０％であることが分かった。患者の内上位２０％（７％の２年リスク閾値）では、感度は７６％であり、特性は８３％であり、ＰＰＶは１６％であった。リスクが高い患者およびリスクが中程度の患者を識別するために３０％の閾値を使用すると、２年以内に事象があった個人は８７％であり、５年以内では７７％であったことが確認された。

【0141】

[0185] リスクが低い患者では、患者の内下位５０％（１．９５％の２年リスク閾値）が９４％の感度、５２％の特異性、および＞９９％のＮＰＶを有することが分かった。低い方から４５％のリスク・スコア（１．６１％の２年リスク閾値）では、感度は９５％であり、特異性は４７％であり、ＮＰＶは＞９９％であった。最後に、低い方から３０％のリスク・スコア（０．８５％の２年リスク閾値）では、感度が９７％、特異性が３１％、およびＮＰＶが＞９９％であることが分かった。これらの統計は、５年目における転帰の予測についても検討され、同様の精度であることが分かった（図３６参照）。

【0142】

[0186] 尿ＡＣＲ（変換ＰＣＲを含む）は、ランダム・フォレスト・モデルにおいて最も影響力が強い変数であり、その後にｅＧＦＲ、尿素、ヘモグロビン、年齢、血清アルブミン、ヘマトクリット、およびグルコースが続いた。先に注記したように、重要度にしたがって順位付けしたモデル入力の概要を、図３１において詳しく示す。

【0143】

[0187] 性能は、外部検証コホートにおいて評価したときも同様であることが分かり、ＡＵＣは、１年予測に対する０．８７（０．８６～０．８９）から５年予測に対する０．８４（０．８４～０．８５）に低下し、ブライア・スコアは、１年において０．０１（０．０１～０．０１）であり、５年目において０．０４（０．０４～０．０４）であった（図３３）。外部検証コホートでは、２年目および５年目双方において、総合的なリスク(overall risk)が低下したが、モデルは優れた較正を呈し（図３７Ａおよび図３７Ｂ）、リスク・スコアの順位と複合転帰の確率との間における関連性(association)も同様に高くなった。

【0144】

[0188] 加えて、糖尿病患者および糖尿病でない患者、ＣＫＤ病期Ｇ１からＧ３、ならびにｅＧＦＲ＜６０ｍｌ／分／１．７３ｍ^２というサブグループの分析では、内部検査コホートと同様の転帰が得られた（図３４）。感度、特異性、ＮＰＶ、およびＰＰＶによって評価すると、外部検証コホートにおいて、構築コホートのそれと同様の診断精度が観測された（図３６）。

【0145】

[0189] コンパレータ分析(comparator analysis)では、ヒートマップ・モデルは、臨床モデル（５年目におけるＣ統計量が０．８１、Ｐ＜０．００１、図３９）と同様、構築コホート（５年目におけるＣ統計量０．７８対０．８４、図３８）において、２２変数ランダム・サバイバル・フォレスト・モデルよりも性能が劣った。指標日に先立つ１２か月における研究室値のみを検討すると、ランダム・フォレスト・モデルに対するモデル評価の結果は不変であった（1年ＡＵＣが０．８７、０．８６～０．８８、５年ＡＵＣが０．８４、０．８３～０．８５）。
結論
[0190] 開示した実施形態の少なくとも一部は、腎不全またはｅＧＦＲの４０％低下という転帰のために、外部評価された研究室ベースの予測モデルを提供する。開示したモデルは、日常的に収集された研究室データの単一時点尺度(single time point measure)に完全に基づくことができ、新規なバイオマーカについて検査するおよび／または機械学習方法を使用することを意図する、現行の標準的な治療モデルまたは市販のモデルよりも高い精度で、対象の転帰（ＣＫＤ進行）を予測することができる。本明細書において開示したモデルは、一緒に併せると、臨床および研究の場において実装することができる。

【0146】

[0191] 開示した機械学習モデルの内、ランダム・フォレストまたはランダム・サバイバル・フォレストを使用する少なくとも一部は、ＲｅｎａｌｙｔｉｘＡＩのような、市販の機械学習モデルよりも高い性能を有するように思われる。ＲｅｎａｌｙｔｉｘＡＩツールと比較すると、開示したモデルの少なくとも一部は、独立した母集団において外的妥当性を有したという利点があり、したがって過学習のリスクが低くなる。このステップは、機械学習モデルには特に重要であり、機械学習モデルは、多くの予測子によって小さいデータ集合において導き出されるときに、成長母集団(development population)を過学習する傾向があり、うまく一般化できないことが多い。更に、開示したモデルの内少なくとも一部は、容易にマッピングできる研究室データだけがあればよく、ＲｅｎａｌｙｔｉｘＡＩツールのように、複数の電子健康記録フィールドおよびデータ型を必要とするモデルよりも、容易に大規模実施することができる。

【0147】

[0192] 最後に、開示したモデルの少なくとも一部は、ＲｅｎａｌｙｔｉｘＡＩとは対照的に、新規のまたは独自のバイオマーカの測定も、入力としての使用も全く必要としない（そして明示的に省略することができる）。したがって、開示したモデルの少なくとも一部は、日常的な研究室の場で、または既に収集した研究室データを使用して実装することができる。

【0148】

[0193] 開示したモデルには、重要な臨床および研究の関わり(implications)がある。臨床の観点からは、医者は診察室において、開示したモデルの少なくともいくつかを使用して、ＣＫＤ過程の早期にある（ｅＧＦＲ＞６０ｍｌ／分／１．７３ｍ^２）が、次の５年間に進行のリスクが高い患者を特定することができる。この母集団におけるｅＧＦＲの傾斜に対するＳＧＬＴ２阻害薬のような介入の効果を考慮すると、病気の進行中に後になって介入を実施した場合では透析までの時間を遅らせるのに対して、これらの患者は、腎不全の生涯発症を未然に防ぐか、または完全に予防することが可能になるとして差し支えない。加えて、フィネレノン(finerenone)のように、治療法が新しくなるにつれて、ＣＫＤ進行を遅らせる追加効果(benefit)を得ることができる。しかしながら、このような新たな治療法および／または開発中の治療法については、腎機能を維持する患者において広く(largely)研究されており、効果を最大化しつつ費用負担および多剤併用を低減するためには、リスクが中程度および高いサブグループには、これらの治療法を当初は保留してもよい。開示したモデルを実装すると、危険に晒されている患者のために、目標を定めて効率的に、このような新たな治療法の使用を容易に指導することができる。

【0149】

[0194] 研究の観点からは、様々な大規模な臨床試験では、ｅＧＦＲの４０％低下または腎不全が主要な転帰として使用されており、これらの試験データ集合において、開示したモデルの少なくとも一部を検証することによって、リスク対策の相互影響(risk treatment interactions)を強調しやすくすることもできる。現在計画または登録段階にある今後の検査(trial)には、開示したモデルの少なくとも一部を使用すると、検査母集団の質を高め、妥当な時間枠において適正な数の転帰を生成するのに役立つことができる。

【0150】

[0195] 以上で論じた実施形態の少なくとも一部の長所(strengths)には、外部検証が含まれる。これは、機械学習モデルには特に重要である。何故なら、これらは、多くの予測子変数を有する小さなデータ集合を過学習する可能性があるからである。この論点に加えて、開示したモデルの少なくとも一部は、２つの変数が完全に欠損したコホートにおいて、外部検証して厳密な判別ができることが分かった。更に他の長所には、２つの詳しく説明したデータ集合に対するランダム・フォレスト方法論を含む、新規な研究方法が含まれ、その結果は、複数の腎臓の転帰および介入に一般化可能であることが証明されている。日常収集される研究室データだけに依存するので、電子健康記録および研究室情報システムへの迅速な統合を可能にすることは、注目に値する長所である。

【0151】

[0196] 結論として、日常的に収集される研究室データを使用し、ＣＫＤ進行（ｅＧＲＦの４０％低下または腎不全）を、全てのＣＫＤ患者（例えば、Ｇ１またはＧ２のような、ＣＫＤの早い病期の患者であっても）に高い精度で予測する機械学習モデルを開示する。
更に他の用語および定義
[0197] 本発明は、その主旨や本質的な特徴から逸脱することなく、他の特定形態においても具体化することができる。説明した実施形態は、あらゆる観点で、限定ではなく例示のみとして見なされるものとする。したがって、本発明の範囲は、以上の説明ではなく、添付する請求項によって示される。請求項の意味および均等の範囲に該当する全ての変更は、その範囲に含まれるものとする。更に、本明細書において図示および／または説明した任意の実施形態に関係付けて説明したエレメントが、本明細書において図示および／または説明した任意の他の実施形態に関係付けて説明したエレメントと組み合わせ可能であるのはもっともである。

【0152】

[0198] 「近似的に」(approximately)、「約」(about)、および「実質的に」(substantially)という用語は、本明細書において使用する場合、述べられた量または条件に近く、所望の機能を実行するまたは所望の結果を達成することに変わりない、量または条件を表す。例えば、「近似的に」、「約」、および「実質的に」という用語は、１０％未満だけ、または５％未満だけ、または１％未満だけ、または０．１％未満だけ、または０．０１％未満だけ、述べられた量または条件から逸脱する量または条件を指すとしてもよい。

【0153】

[0199] ある実施形態では、時間期間（または時点もしくは時間枠）は、１分、１時間、１日、１週間、または１年を指す。あるいは、ある実施形態では、時間期間は、複数時間にわたる、複数の日にわたる、複数の週にわたる、または複数の年にわたる、というような時間期間を指し、時間期間は、第１の開始時刻と、この第１の開始時刻の後にある第２の終了時間とを有する。通例、本明細書において説明したような、新たな患者についての入力データ集合は、１回の検査期間中に患者から得られた１つ以上のサンプルに基づく、医療研究室データ（通例、特定の１組の兆候または特定の病気、例えば、ＣＫＤを診断および／または治療するように予定される、１回の医師の診察または一連の関係するおよび／または集合的な医師の診察から指示される研究室データ(labs)）を含む。
更なるコンピュータ・システムの詳細
[0200] 本発明の実施形態は、以下で更に詳しく論じるように、コンピュータ・ハードウェアを含む、特殊目的または汎用コンピュータ（例えば、コンピューティング・システム１１０）を備えるまたは利用することができる。また、本発明の範囲内にある実施形態は、コンピュータ実行可能命令および／またはデータ構造を搬送もしくは格納するための物理コンピュータ読み取り可能媒体およびその他のコンピュータ読み取り可能媒体も含む。このようなコンピュータ読み取り可能媒体は、汎用または特殊目的コンピュータ・システムによってアクセスすることができる任意の利用可能な媒体にすることができる。コンピュータ実行可能命令（例えば、図１のコンピュータ読み取り可能命令１１８）を格納するコンピュータ読み取り可能媒体（例えば、図１のハードウェア記憶デバイス１４０）は、物理ハードウェア記憶媒体／デバイスであり、伝送媒体を除外する。コンピュータ実行可能命令またはコンピュータ読み取り可能命令（例えば、コンピュータ読み取り可能命令１１８）を１つ以上の搬送波または信号において搬送するコンピュータ読み取り可能媒体は、伝送媒体である。つまり、一例として、そして限定ではなく、本発明の実施形態は、少なくとも２つの明らかに異なる種類のコンピュータ読み取り可能媒体、即ち、物理コンピュータ読み取り可能記憶媒体／デバイスおよび送信コンピュータ読み取り可能媒体を含むことができる。

【0154】

[0201] 物理コンピュータ読み取り可能記憶媒体／デバイスは、ハードウェアであり、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭ、または他の光ディスク・ストレージ（ＣＤ、ＤＶＤ等のような）、磁気ディスク・ストレージ、または他の磁気記憶デバイス、あるいは所望のプログラム・コード手段をコンピュータ実行可能命令またはデータ構造の形態で格納するために使用することができ、更に汎用または特殊目的コンピュータによってアクセスすることができる任意の他のハードウェアを含む。

【0155】

[0202] 「ネットワーク」（例えば、図１のネットワーク１３０）とは、コンピュータ・システムおよび／またはモジュールおよび／または他の電子デバイス間における電子データの移送(transport)を可能にする１つ以上のデータ・リンクと定義する。ネットワークまたは他の通信接続（ハードワイヤ接続、ワイヤレス、またはハードワイヤ接続もしくはワイヤレスの組み合わせのいずれか）を通じてコンピュータに情報を転送または供給するとき、コンピュータは、この接続を伝送媒体と正しく見なす。伝送媒体は、搬送するために使用することができるネットワークおよび／またはデータ・リンク、あるいはコンピュータ実行可能命令またはデータ構造の形態とした所望のプログラム・コード手段を含むことができ、これらの伝送媒体には、汎用または特殊目的コンピュータによってアクセスすることができる。以上の組み合わせも、コンピュータ読み取り可能媒体の範囲内に含まれる。

【0156】

[0203] 更に、種々のコンピュータ・システム・コンポーネントに到達したとき、コンピュータ実行可能命令またはデータ構造の形態であるプログラム・コード手段を、自動的に送信コンピュータ読み取り可能媒体から物理コンピュータ読み取り可能記憶媒体に（またはその逆に）転送することができる。例えば、ネットワークまたはデータ・リンクを通じて受信されたコンピュータ実行可能命令またはデータ構造は、ネットワーク・インターフェース・モジュール（例えば、「ＮＩＣ」）内において、ＲＡＭにバッファすることができ、最終的にコンピュータ・システムのＲＡＭ、および／またはコンピュータ・システムにおける揮発性が更に低いコンピュータ読み取り可能物理記憶媒体に転送することができる。このように、コンピュータ読み取り可能物理記憶媒体は、伝送媒体も利用するコンピュータ・システム・コンポーネントに（または、伝送媒体を主に利用するコンピュータ・システム・コンポーネントにも）含めることができる。

【0157】

[0204] コンピュータ実行可能命令は、例えば、命令およびデータを含み、汎用コンピュータ、特殊目的コンピュータ、または特殊目的処理デバイスに、特定の機能または一群の機能を実行させる。コンピュータ実行可能命令は、例えば、バイナリ、アセンブリ言語のような中間フォーマット命令、またはソース・コードであってもよい。以上、主題について構造的特徴および／または方法論的アクトに特定的な文言で説明したが、添付した請求項において定められる主題は、必ずしも、以上で記載した特徴やアクトには限定されないことは理解されてしかるべきである。逆に、説明した特徴およびアクトは、請求項を実施する形態例として開示したまでである。

【0158】

[0205] 尚、本発明は、多くの型式のコンピュータ・システム構成を有するネットワーク・コンピューティング環境において実施できることは、当業者には認められよう。コンピュータ・システム構成には、パーソナル・コンピュータ、デスクトップ・コンピュータ、ラップトップ・コンピュータ、メッセージ・プロセッサ、ハンドヘルド・デバイス、マルチプロセッサ・システム、マイクロプロセッサ・ベースまたはプログラマブル・消費者用電子機器、ネットワークＰＣ、ミニコンピュータ、メインフレーム・コンピュータ、移動体電話機、ＰＤＡ、ページャ、ルータ、交換機等が含まれる。また、本発明は、分散型システム環境において実施することもできる。分散型システム環境では、ローカルおよびリモート・コンピュータ・システムが、ネットワークを通じてリンクされ（ハードワイヤ接続されたデータ・リンク、ワイヤレス・データ・リンクによって、またはハードワイヤ接続されたデータ・リンクおよびワイヤレス・データ・リンクの組み合わせによってのいずれかで）、双方がタスクを実行する。分散型システム環境では、プログラム・モジュールをローカルおよびリモート双方のメモリ記憶デバイスに配置することができる。

【0159】

[0206] あるいは、または加えて、本明細書において説明した機能は、少なくとも部分的に、１つ以上のハードウェア・ロジック・コンポーネントによって実行することができる。例えば、そして限定ではなく、使用することができるハードウェア・ロジック・コンポーネントの例示的な種類には、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、特定プログラム集積回路（ＡＳＩＣ）、特定プログラム標準製品（ＡＳＳＰ）、システム・オン・チップ・システム（ＳＯＣ）、複合プログラマブル・ロジック・デバイス（ＣＰＬＤ）等が含まれる。

【図1】