(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-07-06
(54)【発明の名称】臓器の組織学的データを評価するための方法及び関連装置
(51)【国際特許分類】
G16H 50/30 20180101AFI20230629BHJP
G01N 33/493 20060101ALI20230629BHJP
【FI】
G16H50/30
G01N33/493 A
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022575759
(86)(22)【出願日】2021-06-08
(85)【翻訳文提出日】2023-02-02
(86)【国際出願番号】 EP2021065230
(87)【国際公開番号】W WO2021249976
(87)【国際公開日】2021-12-16
(32)【優先日】2020-06-10
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】591100596
【氏名又は名称】アンスティチュ ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル
(71)【出願人】
【識別番号】591140123
【氏名又は名称】アシスタンス ピュブリク-オピトー ドゥ パリ
【氏名又は名称原語表記】ASSISTANCE PUBLIQUE - HOPITAUX DE PARIS
(71)【出願人】
【識別番号】520053762
【氏名又は名称】ユニヴェルシテ・パリ・シテ
【氏名又は名称原語表記】UNIVERSITE PARIS CITE
(74)【代理人】
【識別番号】110001508
【氏名又は名称】弁理士法人 津国
(72)【発明者】
【氏名】ルーピー,アレクサンドル
(72)【発明者】
【氏名】オベール,オリヴィエ
(72)【発明者】
【氏名】ジュヴァン,クサヴィエ
【テーマコード(参考)】
2G045
5L099
【Fターム(参考)】
2G045AA40
2G045CB03
2G045DA36
2G045DA42
5L099AA01
(57)【要約】
本発明は、医療の場面で使用される人工知能の分野に関する。組織生検は、特に診断に有用な組織学的情報を得るために広く使用されている侵襲的方法である。そこで、本発明者らは、このような侵襲性を制限することを検討した。このため、生検を行うことなく正確な結果を得ることができる組織生検の結果を予測する方法が提案される。
【特許請求の範囲】
【請求項1】
被検体の臓器、特にドナーからの移植片の少なくとも1つの組織学的情報を評価するための方法であって、前記方法がコンピュータ実装され、前記方法は、
被検体に関するパラメータを提供するステップと、
少なくとも1つの組織学的情報のそれぞれについて、提供された被検体データに予測関数を適用して、評価された組織学的情報を得るステップと、
を含み、
前記組織学的情報が数値である場合には前記評価された組織学的情報が前記臓器についての数値であり、又は、前記組織学的情報が異なる所定のクラスの中の1つの所定のクラスに属する場合には前記評価された組織学的情報が前記臓器についての前記異なる所定のクラスに属する確率であり、
各予測関数は、考慮される組織学的情報に特有であり、人工知能技術を用いて取得される、
方法。
【請求項2】
前記人工知能技術は、前記少なくとも1つの組織学的情報のそれぞれについて、
要素によって形成されるデータセットを準備する段階であって、各要素が前記評価された組織学的情報を被検体パラメータに関連付ける、段階と、
トレーニング済みモデルを取得するために、複数のモデルをトレーニングする段階と、
前記予測関数を取得する段階であって、
選択されたモデルを取得するために、性能基準に基づいて前記複数のトレーニング済みモデルの中からモデルを選択するステップと、
前記選択されたモデルの集約関数として前記予測関数を取得するステップと、
を含む、段階と、
を含む、請求項1に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項3】
前記臓器が腎臓であり、前記組織学的情報が糸球体硬化症の値であり、前記所定のクラスが動脈硬化症のステージ、細動脈硝子化のステージ、及び、間質性線維症/尿細管萎縮のステージであり、前記所定のクラスが好ましくは同種移植片病理の国際バンフ分類のクラスである、又は、
前記臓器が心臓であり、前記組織学的情報が急性細胞拒絶のステージであり、抗体媒介拒絶の所定のクラスのステージが、好ましくは国際心肺移植学会又は同種移植片病理の国際バンフ分類のクラスである、又は、
前記臓器が肺であり、前記組織学的情報が急性細胞拒絶のステージであり、抗体媒介拒絶の所定のクラスのステージが、好ましくは国際心肺移植学会又は同種移植片病理の国際バンフ分類のクラスである、
請求項1又は2に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項4】
前記臓器が移植片ドナーであり、前記提供される被検体パラメータが、
併存症であって、該併存症が、例えば、以下の質問、すなわち、前記ドナーが生存しているか死亡しているか、死亡している場合、前記死亡の原因が循環器疾患によるものか又は脳血管の原因によるものか、前記ドナーが高血圧を患っているか、前記ドナーが糖尿病を患っているか、前記ドナーが肝炎Cウイルスを患っているか、の中から選択される質問に対するバイナリ応答である、併存症と、
臨床データであって、該臨床データが、例えば、前記ドナーの年齢、前記ドナーの性別、前記ドナーの民族性及び前記ドナーのボディーマス指数の中から選択されるデータである、臨床データと、
生物学的データであって、該生物学的データが、例えば、ドナーのタンパク質尿率及びクレアチニン率の中から選択されるデータである、生物学的データと、
から成るリストの中から選択される少なくとも1つの情報を含む、請求項1~3のいずれか一項に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項5】
要素によって形成されたデータセットを準備する前記段階は、少なくとも1つの準備手順を実行するステップを含み、前記準備手順は、
初期要素を収集するステップと、帰属技術を使用することによって前記初期要素を完成させるステップとを含む第1の手順であって、前記帰属技術がランダムフォレスト技術を使用することを含む、第1の手順、
前記データセットをトレーニングセットと試験セットとに分割するステップを含む第2の手順、並びに、
前記準備する段階を含む第3の手順であって、特に被検体パラメータと同じ被検体パラメータの平均との間の差の比及び同じ被検体パラメータの標準偏差を計算することによる、被検体パラメータの標準化を含む、第3の手順、
の中から選択される準備技術である、請求項2に従属するときの請求項1~4のいずれか一項に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項6】
前記組織学的情報が異なる所定のクラスの中の1つの所定のクラスに属するものであり、前記異なる所定のクラスが4以上である場合、前記初期トレーニングデータセットは、前記考慮される組織学的情報のそれぞれの所定のクラスごとにそれぞれの数の要素を含み、前記準備する段階は、少なくとも1つの他の数よりも大きい第1の数を伴う前記トレーニングデータセット内に存在する要素を前記第1の数よりも小さい数を伴う前記トレーニングデータセット内に存在する要素にランダムに置き換える動作を、それぞれの所定のクラスごとの要素の数が前記取得されたトレーニングデータセット内で同じになるまで繰り返すステップを含む、
請求項2に従属するときの請求項1~5のいずれか一項に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項7】
前記トレーニングする段階は、2つの最上位クラスを誤って予測した場合にペナルティを課すステップを含み、及び/又は、各モデルは、トレーニングプロセスを制御するための少なくとも1つのハイパーパラメータを含み、前記トレーニングする段階がハイパーパラメータチューニングを含む、請求項6に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項8】
前記トレーニングする段階は、前記データセット内に異種性を生み出すステップを含み、前記異種性を生み出すステップは、好ましくは、反復k倍交差検証又はブートストラップを使用することを含む、請求項2に従属するときの請求項1~7のいずれか一項に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項9】
前記モデルは、
線形モデルであって、該線形モデルが、例えば、罰則付き多項回帰又は線形判別分析である、線形モデルと、
非線形モデルであって、該非線形モデルが、例えば、ラジアルサポートベクトルマシンである、非線形モデルと、
アンサンブルモデルであって、該アンサンブルモデルが、例えば、ランダムフォレスト、勾配ブースティングマシン、極勾配ブースティングツリー及びナイーブベイズから成るリストにおいて選択される、アンサンブルモデルと、
ディープラーニングモデルであって、該ディープラーニングモデルが、例えば、ニューラルネットワーク又はモデル平均化ニューラルネットワークである、ディープラーニングモデルと、
から成るリストにおいて選択される、請求項2に従属するときの請求項1~8のいずれか一項に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項10】
前記人工技術が評価段階を含み、前記評価段階が少なくとも1つの評価手順を実行するステップを含み、前記評価手順は、
前記組織学的情報が前記異なる所定のクラスの中の1つの所定のクラスに属するものである場合に、クラスの重み付けされていないペアワイズ識別能のマルチAUCを適用するステップを含む第1の手順、
数値であるそれぞれの組織学的情報ごとに、前記組織学的情報についての予測値と測定値との間の平均絶対誤差を計算するステップを含む第2の手順、
ロバスト性試験及び/又は耐久性試験を使用することを含む第3の技術、
ランダムフォレストアルゴリズムを含む第4の技術、並びに、
ブートストラップ技術を使用することを含む第5の技術、
の中から選択される評価手順である、請求項1~9のいずれか一項に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項11】
前記集約関数は、単純平均、加重平均、多数決、加重投票、及び、アンサンブルスタッキングから成るリストにおいて選択される、請求項2に従属するときの請求項1~10のいずれか一項に記載の少なくとも1つの組織学的情報を評価するための方法。
【請求項12】
被検体が疾患に罹患するリスクがあることを予測する方法であって、
請求項1~11のいずれか一項に記載の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、前記提供するステップが、評価された組織学的情報を得るために、疾患に罹患するリスクがある被検体に関するパラメータを受けることによって達成される、ステップと、
前記評価された組織学的情報に基づいて被検体が疾患に罹患するリスクがあることを予測するステップと、
を少なくとも含む方法と、
被検体の疾患を診断するための方法であって、
請求項1~11のいずれか一項に記載の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、前記提供するステップが、評価された組織学的情報を得るために、被検体に関するパラメータを受けることによって達成される、ステップと、
前記評価された組織学的情報に基づいて疾患を診断するステップと、
を少なくとも含む方法と、
疾患を予防及び/又は治療するための治療標的を同定するための方法であって、
第1の評価された組織学的情報を得るために、第1の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、前記第1の被検体が疾患に罹患しており、前記評価する方法が請求項1~11のいずれか一項に記載の方法であり、前記提供するステップが被検体に関するパラメータを受けることによって達成される、ステップと、
第2の評価された組織学的情報を得るために、第2の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、前記第2の被検体が疾患に罹患しておらず、前記評価する方法が請求項1~11のいずれか一項に記載の方法であり、前記提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップと、
第1及び第2の評価された組織学的情報の比較に基づいて治療標的を選択するステップと、
を少なくとも含む方法と、
疾患におけるバイオマーカーを同定する方法であって、前記バイオマーカーが、疾患の診断バイオマーカー、疾患の感受性バイオマーカー、疾患の予後バイオマーカー、又は、疾患の治療に応じた予測バイオマーカーであり、前記方法は、
第1の評価された組織学的情報を得るために、第1の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、前記第1の被検体が疾患に罹患しており、前記評価する方法が請求項1~11のいずれか一項に記載の方法であり、前記提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップと、
第2の評価された組織学的情報を得るために、第2の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、前記第2の被検体が疾患に罹患しておらず、前記評価する方法が請求項1~11のいずれか一項に記載の方法であり、前記提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップと、
第1の評価された組織学的情報と第2の評価された組織学的情報との比較に基づいてバイオマーカー標的を選択するステップと、
を少なくとも含む、方法と、
薬剤として有用な化合物をスクリーニングするための方法であって、前記化合物が、疾患を予防及び/又は治療するための既知の治療標的に対して効果を有し、前記方法は、
第1の評価された組織学的情報を得るために、第1の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、前記第1の被検体は、疾患に罹患しており、前記化合物を受けており、前記評価する方法が請求項1~11のいずれか一項に記載される方法であり、前記提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップと、
第2の評価された組織学的情報を得るために、第2の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、前記第2の被検体が疾患に罹患しており、前記化合物を受けておらず、前記評価する方法が請求項1~11のいずれか一項に記載される方法であり、前記提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップと、
第1の評価された組織学的情報と第2の評価された組織学的情報との比較に基づいてバイオマーカー標的を選択するステップと、
を少なくとも含む、方法と、
臨床試験に登録された患者をモニタリングして、前記患者の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行することによって、前記臨床試験に供される治療の治療有効性の定量的指標を提供する方法であって、前記評価する方法が請求項1~11のいずれか一項に記載される方法であり、前記提供するステップが、被検体に関するパラメータを受けることによって達成される、方法と、
から成るグループから選択される方法。
【請求項13】
コンピュータプログラム命令を含むコンピュータプログラムプロダクト(30)であって、前記コンピュータプログラム命令は、データ処理ユニット(38)にロード可能であり、前記データ処理ユニット(38)によって実行されると、請求項1~12のいずれか一項に記載の方法の実行を引き起こすようになっている、コンピュータプログラムプロダクト。
【請求項14】
データ処理ユニット(38)によって実行されると、請求項1~12のいずれか一項に記載の方法の実行を引き起こすコンピュータプログラム命令を含むコンピュータ可読媒体(48)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、被検体の臓器の少なくとも1つの組織学的情報を評価するための方法に関する。また、本発明は、評価するための方法のステップを実行する方法にも関連し、該方法は、被検体が疾患に罹患するリスクがあることを予測するための方法、疾患を診断するための方法、疾患を予防及び/又は治療するための治療標的を同定するための方法、疾患のバイオマーカーを同定するための方法、薬剤として有用な化合物をスクリーニングするための方法、及び、臨床試験に登録された患者をモニタリングするための方法の中から選択される。また、本発明は、これらの方法に関与するコンピュータプログラムプロダクト及びコンピュータ可読媒体にも関連する。
【背景技術】
【0002】
臓器移植は、現在、世界中で過小評価されているが増加する負担である末期腎疾患(ESRD)の患者に最適な治療として認識されている。実際、慢性腎臓疾患(CKD)は、世界中で8億5000万人の個人に発症している(比較すると、糖尿病、癌、及びHIV/AIDSは、それぞれ世界中で4億2200万人、4200万人、及び3700万人に影響を及ぼしている)。免疫抑制療法が進歩しているにもかかわらず、何千もの同種移植片が毎年失敗しており、死亡率、罹患率及び社会にとっての費用に関して患者に直ちに結果がもたらされている。最近、腎臓同種移植片の喪失が今日ではESRDの重要な原因であることが分かってきた。
【0003】
そのような問題を予測するために、移植時に0日目の生検を行って、組織学的情報を得ることが知られている。幾つかの移植プログラムで実施されるドナーの組織学的評価は、ドナー臓器の質を判断し、場合によっては、ドナーにおける基礎疾患の可能性を排除するために臨床医によって使用された。
【0004】
ドナー臓器生検試料の別の利点は、腎臓同種移植片のその後の生検の結果を比較することができ、また治療戦略を提唱することができる有益なベースラインを提供するという事実に依存する。
【0005】
また、ゼロ日生検は、移植後にドナーに伝達されるか又は獲得される組織学的病変を移植後に識別するのにも役立つ。更に、0日目の生検は、適切な割り当てプロセスを最適化するために使用される。
【0006】
しかしながら、生検は侵襲的で時間がかかり費用のかかる処置であり、外科的、医学的及び病理学的資源を必要とする。
【発明の概要】
【0007】
したがって、生検の侵襲性を制限する被検体の臓器の組織学的情報を得るための方法が必要とされている。
【0008】
要約すると、本発明は、医療の場面で使用される人工知能の分野に関する。組織生検は、特に診断に有用な組織学的情報を得るために広く使用されている侵襲的方法である。そこで、本発明者らは、このような侵襲性を制限することを検討した。
【0009】
最近、この問題は、臓器不足の状況において更に困難になっている。これは、高齢ドナー、心臓死後の提供、及び有意な臨床的危険因子を有するドナーからの腎臓の移植の増加によるものである。これらの脆弱な臓器は、移植時に動脈硬化症、萎縮性線維症、動脈ヒアリン症及び糸球体硬化症の病変を担持することがあり、これらは、それらの特異性がないために、移植後に見られた場合、薬物毒性、感染症又は同種免疫応答に誤って起因する可能性がある。
【0010】
このため、生検を行うことなく正確な結果を得ることができる組織生検の結果を予測する方法が提案される。
【0011】
このため、本明細書は、被検体の臓器、特にドナーからの移植片の少なくとも1つの組織学的情報を評価するための方法であって、方法がコンピュータ実装され、方法が、被検体に関するパラメータを提供するステップと、少なくとも1つの組織学的情報のそれぞれについて、提供された被検体データに予測関数を適用して、評価された組織学的情報を得るステップとを含み、組織学的情報が数値である場合には評価された組織学的情報が臓器についての数値であり、又は、組織学的情報が異なる所定のクラスの中の1つの所定のクラスに属する場合には評価された組織学的情報が臓器についての異なる所定のクラスに属する確率であり、各予測関数が、考慮される組織学的情報に特有であり、人工知能技術を用いて取得される、方法について記載する。
【0012】
そのような方法により、組織学的情報は、迅速かつ容易な方法でアクセス可能である。
【0013】
実際に、方法は、生検を必要とせず、したがって侵襲的又は外科的行為を必要としない。
【0014】
また、ケアユニットについては、評価のための方法を行う端末にデータを入力するだけで済む。したがって、関与するリソースはごく僅かである。特に、評価するための方法には研究室が関与していない。
【0015】
言い換えれば、評価するための本方法は、診断、治療法及び移植後の即時の患者管理をガイドし、更なる術後の問題を最小限に抑えるために、臨床医に仮想生検ツールを提供する。
【0016】
有利であるが強制的ではない評価のためのこの方法の更なる態様によれば、評価するための方法は、技術的に許容される任意の組み合わせで採用される以下の特徴の1つ又は幾つかを組み込むことができる。
-人工知能技術は、少なくとも1つの組織学的情報のそれぞれについて、要素によって形成されるデータセットを準備する段階であって、各要素が評価された組織学的情報を被検体パラメータに関連付ける段階と、トレーニング済みモデルを取得するために、複数のモデルをトレーニングする段階と、予測関数を取得する段階であって、選択されたモデルを取得するために、性能基準に基づいて複数のトレーニング済みモデルの中からモデルを選択するステップと、選択されたモデルの集約関数として予測関数を取得するステップとを含む、段階とを含む。
-臓器は腎臓であり、組織学的情報は糸球体硬化症の値であり、所定のクラスは、動脈硬化症のステージ、細動脈硝子化のステージ及び間質性線維症/尿細管萎縮のステージであり、所定のクラスは、好ましくは同種移植片病理の国際バンフ分類のクラスである。
-臓器は心臓であり、組織学的情報は急性細胞拒絶のステージであり、抗体媒介拒絶の所定のクラスのステージは、好ましくは国際心肺移植学会又は同種移植片病理の国際バンフ分類のクラスである。
-臓器は肺であり、組織学的情報は急性細胞拒絶のステージであり、抗体媒介拒絶の所定のクラスのステージは、好ましくは国際心肺移植学会又は同種移植片病理の国際バンフ分類のクラスである。
-提供される被検体パラメータは、併存症であって、該併存症が、例えば、以下の質問、すなわち、前記ドナーが生存しているか死亡しているか、死亡している場合、死亡の原因が循環器疾患によるものか又は脳血管の原因によるものか、ドナーが高血圧を患っているか、ドナーが糖尿病を患っているか、ドナーが肝炎Cウイルスを患っているか、の中から選択される質問に対するバイナリ応答である、併存症と、臨床データであって、該臨床データが、例えば、ドナーの年齢、ドナーの性別、ドナーの民族性及びドナーのボディーマス指数の中から選択されるデータである、臨床データと、生物学的データであって、該生物学的データが、例えば、ドナーのタンパク質尿率及びクレアチニン率の中から選択される、データと、から成るリストの中から選択される少なくとも1つの情報を含む。
-要素によって形成されたデータセットを準備する段階は、少なくとも1つの準備手順を実行するステップを含み、準備手順は、初期要素を収集するステップと、帰属技術を使用することによって初期要素を完成させるステップとを含む第1の手順であって、帰属技術がランダムフォレスト技術を使用することを含む、第1の手順、データセットをトレーニングセットと試験セットとに分割するステップを含む第2の手順、及び、準備する段階を含む第3の手順であって、特に被検体パラメータと同じ被検体パラメータの平均との間の差の比及び同じ被検体パラメータの標準偏差を計算することによる、被検体パラメータの標準化を含む、第3の手順、の中から選択される準備技術である。
-組織学的情報が異なる所定のクラスの中の1つの所定のクラスに属するものであり、異なる所定のクラスが4以上である場合、初期トレーニングデータセットは、考慮される組織学的情報のそれぞれの所定のクラスごとにそれぞれの数の要素を含み、準備する段階は、少なくとも1つの他の数よりも大きい第1の数を伴う前記トレーニングデータセット内に存在する要素を第1の数よりも小さい数を伴うトレーニングデータセット内に存在する要素にランダムに置き換える動作を、それぞれの所定のクラスごとの要素の数が前記取得されたトレーニングデータセット内で同じになるまで繰り返すステップを含む。
-トレーニングする段階は、2つの最上位クラスを誤って予測した場合にペナルティを課すことを含み、及び/又は、各モデルは、トレーニングプロセスを制御するためのハイパーパラメータを含み、トレーニングする段階は、ハイパーパラメータチューニングを含む。
-トレーニングする段階は、データセットに不均一性を生成することを含む。
-不均一性の生成は、反復k倍交差検証又はブートストラップを使用することを含む。
-モデルは、線形モデルであって、該線形モデルが、例えば、罰則付き多項回帰又は線形判別分析である、線形モデルと、非線形モデルであって、該非線形モデルが、例えば、ラジアルサポートベクトルマシンである、非線形モデルと、アンサンブルモデルであって、該アンサンブルモデルが、例えば、ランダムフォレスト、勾配ブースティングマシン、極勾配ブースティングツリー及びナイーブベイズから成るリストにおいて選択される、アンサンブルモデルと、ディープラーニングモデルであって、該ディープラーニングモデルが、例えば、ニューラルネットワーク又はモデル平均化ニューラルネットワークである、ディープラーニングモデルと、から成るリストにおいて選択される。
-人工技術が評価段階を含み、評価段階が少なくとも1つの評価手順を実行するステップを含み、評価手順は、組織学的情報が異なる所定のクラスの中の1つの所定のクラスに属するものである場合に、クラスの重み付けされていないペアワイズ識別能のマルチAUCを適用するステップを含む第1の手順、数値であるそれぞれの組織学的情報ごとに、組織学的情報についての予測値と測定値との間の平均絶対誤差を計算するステップを含む第2の手順、ロバスト性試験及び/又は耐久性試験を使用することを含む第3の技術、ランダムフォレストアルゴリズムを含む第4の技術、及び、ブートストラップ技術を使用することを含む第5の技術の中から選択される評価手順である。
-集約関数は、単純平均、加重平均、多数決、加重投票、及びアンサンブルスタッキングからなるリストで選択される。
【0017】
また、本明細書は、以下からなるグループから選択される方法についても記載する。
-被検体が疾患に罹患するリスクがあることを予測する方法であって、
-前述の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、提供するステップが、評価された組織学的情報を得るために、疾患に罹患するリスクがある被検体に関するパラメータを受けることによって達成される、ステップと、
-評価された組織学的情報に基づいて被検体が疾患に罹患するリスクがあることを予測するステップと、
を少なくとも含む方法、
-被検体の疾患を診断するための方法であって、
-前述の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、提供するステップが、評価された組織学的情報を得るために、被検体に関するパラメータを受けることによって達成される、ステップと、
-評価された組織学的情報に基づいて疾患を診断するステップと、
を少なくとも含む方法、
-疾患を予防及び/又は治療するための治療標的を同定するための方法であって、
-第1の評価された組織学的情報を得るために、第1の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、第1の被検体が疾患に罹患しており、評価する方法が前述の方法であり、提供するステップが被検体に関するパラメータを受けることによって達成される、ステップ、
-第2の評価された組織学的情報を得るために、第2の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、第2の被検体が疾患に罹患しておらず、評価する方法が前述の方法であり、前記提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップ、
-第1及び第2の評価された組織学的情報の比較に基づいて治療標的を選択するステップ、
を少なくとも含む方法、
-疾患におけるバイオマーカーを同定する方法であって、バイオマーカーが、疾患の診断バイオマーカー、疾患の感受性バイオマーカー、疾患の予後バイオマーカー、又は、疾患の治療に応じた予測バイオマーカーであり、方法は、
-第1の評価された組織学的情報を得るために、第1の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、第1の被検体が疾患に罹患しており、評価する方法が前述の方法であり、提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップと、
-第2の評価された組織学的情報を得るために、第2の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、第2の被検体が疾患に罹患しておらず、評価する方法が前述の方法であり、提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップと、
-第1の評価された組織学的情報と第2の評価された組織学的情報との比較に基づいてバイオマーカー標的を選択するステップと、
を少なくとも含む、方法、及び、
-薬剤として有用な化合物をスクリーニングするための方法であって、化合物が、疾患を予防及び/又は治療するための既知の治療標的に対して効果を有し、方法は、
-第1の評価された組織学的情報を得るために、第1の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、第1の被検体は、疾患に罹患しており、化合物を受けており、評価する方法が前述の方法であり、提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップと、
-第2の評価された組織学的情報を得るために、第2の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、第2の被検体が疾患に罹患しており、化合物を受けておらず、評価する方法が前述の方法であり、提供するステップが、被検体に関するパラメータを受けることによって達成される、ステップと、
-第1の評価された組織学的情報と第2の評価された組織学的情報との比較に基づいてバイオマーカー標的を選択するステップと、
を少なくとも含む、方法、及び、
-臨床試験に登録された患者をモニタリングして、患者の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行することによって、臨床試験に晒される治療の治療効果の定量的指標を提供する方法であって、評価する方法が前述の方法であり、提供するステップが、被検体に関するパラメータを受けることによって達成される、方法。
【0018】
また、本明細書は、コンピュータプログラム命令を含むコンピュータプログラムプロダクトに関し、コンピュータプログラム命令は、データ処理ユニットにロード可能であり、データ処理ユニットによって実行されたときに前述の方法の実行を引き起こすようになっている。
【0019】
本明細書は、データ処理ユニットによって実行されると、前述の方法の実行を引き起こすコンピュータプログラム命令を含むコンピュータ可読媒体を更に記載する。
【0020】
本発明は、本発明の目的を限定することなく、添付図面に対応して、例示的な例として与えられる以下の説明に基づいてより良く理解され得る。
【図面の簡単な説明】
【0021】
【
図1】評価するための方法を実行するようになっているシステムの概略図である。
【
図3】
図2の評価するための方法で使用される特定の人工知能技術の実行を示すフローチャートである。
【
図4】
図3に示される人工知能技術の例のステップの概略図である。
【発明を実施するための形態】
【0022】
システムの説明
システム20及びコンピュータプログラムプロダクト30が
図1に示されている。コンピュータプログラムプロダクト30とシステム20との間の相互作用は、後述するように、被検体の臓器の少なくとも1つの組織学的情報を評価するための方法を実行することを可能にする。そのような評価方法は、本明細書の残りの部分では「評価方法」と命名されている。
【0023】
この評価方法は、コンピュータ実装方法である。
【0024】
システム20は、デスクトップコンピュータである。変形例では、システム20は、ラックマウント型コンピュータ、ラップトップコンピュータ、タブレットコンピュータ、PDA又はスマートフォンである。
【0025】
特定の実施形態では、システム20は、リアルタイムで動作するようになっており、及び/又は特に飛行機などの車両に組み込まれたシステムである。
【0026】
図1の場合、システム20は、計算機32と、ユーザインタフェース34と、通信装置36とを備える。
【0027】
計算機32は、計算機32のレジスタ内の電子量又は物理量によって表されるデータ、及び/又はレジスタ若しくは他の種類の表示装置、送信装置若しくは記憶装置のメモリ内の物理データに対応する他の同様のデータ内のメモリを操作及び/又は変換するようになっている電子回路である。
【0028】
具体例として、計算機32は、モノコア又はマルチコアプロセッサ(CPU、GPU、マイクロコントローラ、DSP等)、プログラマブル論理回路(ASIC、FPGA、PLD、PLA等)、ステートマシン、ゲート論理及び個別ハードウェア構成要素を備える。
【0029】
計算機32は、特に計算を実行することによってデータを処理するようになっているデータ処理ユニット38と、データを記憶するようになっているメモリ40と、コンピュータ可読媒体を読み取るようになっているリーダ42とを備える。
【0030】
ユーザインタフェース34は、入力装置44及び出力装置46を備える。
【0031】
入力装置44は、システム20のユーザがシステム20に対して情報やコマンドを入力するための装置である。
【0032】
図1において、入力装置44はキーボードである。あるいは、入力装置44は、ポインティング装置(マウス、タッチパッド、デジタル化タブレットなど)、音声認識装置、アイトラッカー、又は触覚装置(モーションジェスチャ解析)である。
【0033】
出力装置46は、システム20のユーザに情報を提供するようになっている表示ユニットであるグラフィカルユーザインタフェースである。
【0034】
図1において、出力装置46は、出力の視覚的提示のための表示画面である。他の実施形態では、出力装置は、プリンタ、拡張及び/又は仮想ディスプレイユニット、出力の可聴提示のためのスピーカ又は別の音響発生装置、振動及び/又は臭気を生成するユニット、又は電気信号を生成するようになっているユニットである。
【0035】
特定の実施形態では、入力装置44及び出力装置46は、対話型画面などのマンマシンインタフェースを形成する同じ構成要素である。
【0036】
通信装置36は、システム20の構成要素間の一方向又は双方向の通信を可能にする。例えば、通信装置36は、バス通信システム又は入出力インタフェースである。
【0037】
通信装置36の存在は、幾つかの実施形態では、システム20の構成要素が互いに離れていることを可能にする。
【0038】
コンピュータプログラムプロダクト30は、コンピュータ可読媒体48を備える。
【0039】
コンピュータ可読媒体48は、計算機32のリーダ42によって読み取ることができる有形の装置である。
【0040】
特に、コンピュータ可読媒体48は、電波又は光パルス若しくは電子信号などの他の自由に伝搬する電磁波などの一時的な信号自体ではない。
【0041】
そのようなコンピュータ可読記憶媒体48は、例えば、電子記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置、又はそれらの任意の組み合わせである。
【0042】
より具体的な例の非網羅的なリストとして、コンピュータ可読記憶媒体48は、パンチカード又は溝内の隆起構造などの機械的に符号化された装置、ディスケット、ハードディスク、ROM、RAM、EROM、EEPROM、光磁気ディスク、SRAM、CD-ROM、DVD、メモリスティック、フロッピーディスク、フラッシュメモリ、SSD、又はPCMCIAなどのPCカードである。
【0043】
コンピュータ可読記憶媒体48には、コンピュータプログラムが記憶されている。コンピュータプログラムは、プログラム命令の1つ以上の格納されたシーケンスを含む。
【0044】
このようなプログラム命令は、データ処理ユニット38によって実行されると、後述する任意の方法のステップを実行させる。
【0045】
例えば、プログラム命令の形式は、ソースコード形式、コンピュータ実行可能形式、又はソースコードとコンピュータ実行可能形式との間の任意の中間形式、例えばインタープリタ、アセンブラ、コンパイラ、リンカ又はロケータを介したソースコードの変換から生じる形式である。変形例では、プログラム命令は、マイクロコード、ファームウェア命令、状態設定データ、集積回路(例えばVHDL)の構成データ、又はオブジェクトコードである。
【0046】
プログラム命令は、オブジェクト指向プログラミング言語(FORTRAN、C¨++、JAVA(登録商標)、HTML)、手続き型プログラミング言語(例えば言語C)などの1つ以上の言語の任意の組み合わせで記述される。
【0047】
あるいは、プログラム命令は、特にアプリケーションの場合のように、ネットワークを介して外部ソースからダウンロードされる。そのような場合、コンピュータプログラムプロダクトは、プログラム命令を格納したコンピュータ可読データキャリア、又はプログラム命令を符号化したデータキャリア信号を含む。
【0048】
いずれの場合も、コンピュータプログラムプロダクト30は、データ処理ユニット38にロード可能であり、データ処理ユニット38によって実行されると、後述する任意の方法のステップを実行させるようになっている命令を含む。実施形態によれば、実行は、システム20、すなわち単一のコンピュータ上で、又は(特にクラウドコンピューティングを介して)幾つかのコンピュータ間の分散システム内で、完全に又は部分的に達成される。
【0049】
システムの動作
ここで、システム20の動作を、評価方法、すなわち、ドナーからの移植片である被検体の腎臓の幾つかの組織学的情報を評価するための方法を実行する例を参照して説明する。
【0050】
「ドナー」という用語は、レシピエントに移植される臓器及び/又は組織の移植片又は移植片を提供する被検体を指す。
【0051】
これは、この段落に提示されるそのような場合、「被検体」という用語が、ドナーから得られた臓器及び/又は組織の移植片又は移植片を受けるレシピエントを指すことを意味する。
【0052】
この具体例では、被検体は人間である。
【0053】
より一般的には、被検体は、生きている被検体、特に動物である。
【0054】
例えば、被検体は哺乳動物、より具体的にはマウスなどの齧歯類である。
【0055】
図2に概略的に示すように、評価方法は、1つ以上の関数52の適用を介して、幾つかの組織学的情報54を被検体に関するパラメータ50(被検体パラメータ50と呼ぶ)に関連付ける方法である。この
図2では、被検体パラメータ50はそれぞれ長方形で表され、組織学的情報54はそれぞれ菱形で表され、幾つかの関数52のうちの1つはそれぞれ円で表される。
【0056】
換言すれば、評価方法は、提供ステップ及び適用ステップを含む。
【0057】
提供するステップでは、被検体パラメータ50が提供される。
【0058】
例えば、ユーザは、入力装置44にデータを入力する。
【0059】
あるいは、パラメータは、特にリモートサーバからシステム20によって受信される。
【0060】
本実施例では、提供される被検体パラメータは、併存症56、臨床データ58及び生物学的データ60を含む。
【0061】
定義により、併存症は、一次状態と同時に起こる1つ以上の追加の状態の存在である。
【0062】
この例では、併存症56は、幾つかの質問に対するバイナリ応答である。質問は以下の通りである。
・ドナーが生きているか死亡しているか(
図2の項目62)、
・ドナーが死亡した場合、その死因が心臓病などの循環器疾患によるものであるかどうか(
図2の項目64)、
・ドナーが死亡した場合、死因が脳血管性の原因によるものかどうか(
図2の項目66)、
・ドナーが高血圧に罹患しているかどうか(
図2の項目68)、
・ドナーが糖尿病に罹患しているかどうか(
図2の項目70)、
・前記ドナーがプロテイウリナに罹患しているかどうか(
図2の項目72)、及び
・ドナーが肝炎Cウイルスに罹患しているかどうか(
図2の項目74)。
【0063】
変形例又は補足において、提供された被検体パラメータ50は、特に項目62から74の前述のリストの中から選択された被検体の併存症を含む。
【0064】
「タンパク尿」という用語は、過剰なタンパク質が被検体の尿中に存在する状態を指す。ヒト被検体では、尿検査によってタンパク尿がしばしば診断される。臨床的には、タンパク尿は尿タンパク質/クレアチニンの比(クレアチニンのg/g)として表され、前記比は通常0と0.3との間に含まれる。この範囲から外れる場合、被検体はタンパク尿を患っていると考えられる。
【0065】
記載された例では、臨床データ58は以下の通りである。
・ドナーの年齢(
図2の項目76)、
・ドナーの性別(
図2の項目78)、及び
・ドナーのボディーマス指数(
図2の項目80)ボディーマス指数は、ドナーの体重(キログラム)を身長(メートル)の2乗で割ったものである。
【0066】
例示として、生物学的データ60は、1デシリットル(dL)当たりのミリグラム(mg)単位のクレアチニン速度である。血液中のクレアチニンの正常レベルは、成人男性ではデシリットル(dL)当たり約0.7から1.2ミリグラム(mg)であり、成人女性ではデシリットル当たり0.5から1.0ミリグラムである。
【0067】
定義により、組織学的情報は、生体組織の研究に関するデータ/情報である。
【0068】
本例において、組織学的情報54は、同種移植組織学的情報である。
【0069】
この具体例では、組織学的情報54は、固形臓器移植からの生検の報告のための国際コンセンサス分類であるバンフ分類に従って評価される。バンフ病変スコアは、腎移植生検の異なる区画における病理組織学的変化の存在及び程度を実際に評価し、拒絶において見られる診断的特徴に主に焦点を当てるが、排他的ではない。
【0070】
現在図示されている場合、組織学的情報52は、以下の4つの情報である。
・糸球体硬化症のパーセンテージの値、
・動脈硬化症のステージ、
・細動脈硝子化のステージ、
・間質性線維症のステージ、及び
・尿細管萎縮のステージ。
【0071】
この場合、ステージは、腎同種移植片病理の所定のクラスのバンフ分類のクラスである。
【0072】
より具体的には、糸球体硬化症は、腎臓における糸球体の硬化である。腎臓の小さな血管、糸球体、血液から尿素を濾過する腎臓の機能単位の瘢痕化を説明することが一般的な用語である。定義により、糸球体硬化症の値は、硬化した糸球体の数を生検で見つかった糸球体の数で割ることによって得られるパーセンテージである。そのような値は、
図2の項目Gによって表される。
【0073】
動脈硬化症は、Banff Lesion Score cvによって評価する。このスコアは、最も重度に罹患した動脈における動脈内膜肥厚の程度を反映する。スコアは、以下の4つのステージに従って評価される。
-cv0:慢性血管変化なし;
-cv1:線維内膜肥厚による最大25%の管腔領域の血管狭窄;
-cv2:線維内膜肥厚による26から50%の管腔領域の血管狭窄、及び
-cv3:50%を超える管腔領域の血管狭小化及び線維内膜肥厚。
【0074】
また、細動脈硝子化はBanff Lesion Score ahにより評価される。このスコアは、細動脈硝子化の程度を評価する。スコアは、以下の4つのステージに従って評価される。
-0期:PAS(PAS)陽性の硝子細動脈の肥厚なし;
-ステージ1:少なくとも1つの細動脈における軽度から中等度のPAS陽性硝子体肥厚;
-ステージ2:1つを超える細動脈における中等度~重度のPAS陽性硝子体肥厚、及び
-ステージ3:多くの細動脈における重度のPAS陽性硝子体肥厚。
【0075】
間質性線維症は、Banff Lesion Score ciによって評価される。このスコアは、皮質線維症の程度を評価する。スコアは、以下の4つのステージに従って評価される。
-ci0:皮質領域の最大5%の間質性線維症;
-ci1:皮質領域の6から25%における間質性線維症(軽度の間質性線維症);
-ci2:皮質領域の26~50%における間質性線維症(中程度の間質性線維症)、及び
ci3:皮質領域の50%超における間質性線維症(重度の間質性線維症)。
【0076】
間質性線維症は、Banff Lesion Score ctによって評価される。このスコアは、通常、間質性線維症に罹患した領域と密接に関連する皮質尿細管萎縮の程度を評価する。スコアは、以下の4つのステージに従って評価される。
-ct0:尿細管萎縮なし;
-ct1:皮質尿細管の面積の最大25%を伴う尿細管萎縮;
-ct2:皮質尿細管の面積の26~50%を伴う尿細管萎縮、及び
-ct3:皮質尿細管の面積の50%超が関与する尿細管萎縮。
【0077】
図2から明らかなように、各組織学的情報54に対して1つの関数がある。これは、各関数が1つの組織学的情報54に特異的であることを意味する。
【0078】
言い換えれば、現在の場合、F1、F2、F3、F4、及びF5という5つの関数がある。第1の関数F1は、糸球体硬化症の値(G)を予測し、第2の関数F2は、動脈硬化症のステージ(cv)を予測し、第3の関数F3は、細動脈硝子化のステージ(ah)を予測し、第4の関数F4は、間質性線維症のステージ(ci)を予測し、第5の関数F5は、尿細管萎縮のステージ(ct)を予測する。
【0079】
各予測関数F1、F2、F3、F4又はF5は、入力として提供される被検体パラメータ50に関連し、出力は、関数F1、F2、F3、F4又はF5が予測するようになっている組織学的情報54である。このようにして予測される組織学的情報54は、評価方法によって得られた評価された組織学的情報54のうちの少なくとも1つである。
【0080】
図2から明らかなように、各予測関数F1、F2、F3、F4又はF5は、被検体パラメータ50の一部又はそれぞれに適用される。
【0081】
例示として、第1の予測関数F1は各被検体パラメータ50に適用され(点線参照)、第4の予測関数F4は3つの被検体パラメータ60、72及び80にのみ適用される(実線参照)。
【0082】
各予測関数F1、F2、F3、F4、F5は、人工知能技術を用いて求められる。
【0083】
人工知能技術は、データに基づいてモデル(アルゴリズムとも呼ばれる)を確立することにある。
【0084】
特に、人工知能技術は、モデルを学習することを意味することが多い。したがって、「機械学習」という用語は、モデルがデータに基づいて機械によって学習されるという事実を示すために使用される。
【0085】
事例によれば、機械学習技術は、教師あり学習、教師なし学習、半教師あり学習、強化学習、自己学習、特徴学習、スパース辞書学習、異常検出学習、ロボット学習、及び関連規則学習のうちの学習を使用することを意味する。
【0086】
特に、本例では、機械学習手法は、教師あり学習手法、半教師あり学習手法又は強化学習手法である。
【0087】
人工知能技術で使用されるモデルは、ニューラルネットワーク、遺伝的アルゴリズム、サポートベクターマシン、k平均、カーネル回帰及び判別分析などの分類、クラスタリング、回帰及び次元削減のための計算モデル及びアルゴリズムなどの様々なモデル/アルゴリズムから選択することができる。
【0088】
より一般的には、人工知能技術は、以下の要素、すなわち、とりわけ、相互相関、主成分分析(PCA)、因子回転、ロジスティック回帰(LogReg)、線形判別分析(LDA)、固有遺伝子線形判別分析(ELDA)、サポートベクターマシン(SVM)、ランダムフォレスト(RF)、再帰的分割ツリー(RPART)、並びに他の関連する決定木分類技術、シュランケンセントロイド(SC)、StepAIC、Kth最近傍、ブースティング、決定木、ニューラルネットワーク、ベイジアンネットワーク、サポートベクターマシン、及び隠れマルコフモデルなどの確立された技術を含むパターン認識特徴を利用する、係数又は指数などの和、比、及び回帰演算子、バイオマーカー値変換及び正規化(限定されないが、臨床データ58、性別、年齢又は民族性などの臨床パラメータに基づくそれらの正規化スキームを含む)、規則及びガイドライン、統計的分類モデル、並びにニューラルネットワーク、構造及び構文統計的分類アルゴリズム、並びにリスクインデックス構築の方法のうちの1つ又は幾つかの使用を意味し得る。
【0089】
代替的又は補足的に、人工知能技術は、以下の要素、すなわち、平均1依存性推定器(AODE)、人工ニューラルネットワーク(例えば、バックプロパゲーション)、ベイズ統計(例えば、単純ベイズ分類器、ベイジアンネットワーク、ベイジアンナレッジベース)、ケースベース推論、決定木、誘導論理プログラミング、ガウス過程回帰、グループデータ処理方法(GMDH)、学習オートマタ、学習ベクトル量子化、最小メッセージ長(決定木、決定グラフなど)、ラジー学習、インスタンスベースの学習最近傍アルゴリズム、アナログモデリング、ほぼ正確な学習(PAC)学習、リップルダウンルール、知識取得方法、シンボル機械学習アルゴリズム、サブシンボリック機械学習アルゴリズム、サポートベクターマシン、ランダムフォレスト、分類器のアンサンブル、ストラップアグリゲーション(バギング)、ブースティング、回帰分析、ブートファジーネットワーク(IFN)、統計的分類、AODE、線形分類器(例えば、フィッシャー線形判別、ロジスティック回帰、ナイーブベイズ分類器、パーセプトロン、及びサポートベクターマシン)、二次分類器、k近傍分類器、ブースティング、決定木(例えば、C4.5、ランダムフォレスト)、ベイジアンネットワーク、及び隠れマルコフモデルのうちの1つ又は幾つかの使用を意味し得る。
【0090】
代替的又は補足的に、人工知能技術は、以下の要素、すなわち、人工ニューラルネットワーク、データクラスタリング、期待値最大化アルゴリズム、自己組織化マップ、半径基底関数ネットワーク、ベクトル量子化、生成トポグラフィックマップ、情報ボトルネック法、及びIBSEAD、アプリオリアルゴリズム、エクラットアルゴリズム及びFP成長アルゴリズムなどのルール学習アルゴリズム、単一リンケージクラスタリング及び概念的クラスタリングなどの階層クラスタリング、K平均アルゴリズム及びファジークラスタリングなどの階層クラスタリングのうちの1つ又は幾つかの使用を意味し得る。
【0091】
代替的又は補足的に、人工知能技術は強化学習アルゴリズムを使用する。強化学習アルゴリズムの例としては、時間差学習、Q学習、及びラーニングオートマタが挙げられるが、これらに限定されない。
【0092】
代替的又は補足的に、人工知能技術はデータ前処理を使用する。
【0093】
より具体的には、モデルは、線形モデル、非線形モデル、アンサンブルモデル、及びディープラーニングモデルの中から選択される。
【0094】
線形モデルは、入力と出力との間の線形関係を使用するモデルである。
【0095】
この場合、線形モデルは罰則付き多項回帰又は線形判別分析である。
【0096】
非線形モデルは、入力と出力との間の非線形関係を使用するモデルである。
【0097】
図2の場合、線形モデルはラジアルサポートベクトルマシンである。
【0098】
ラジアルサポートベクトルマシンは、クラスを分離し、マージンを最大にするために高次元決定境界を探索することを可能にする分類器である。
【0099】
アンサンブルモデルは、損失を低減するために複数のモデルを集約するモデルである。
【0100】
この場合、アンサンブルモデルは、幾つかのモデルの集約であり、特にランダムフォレストの集約(そのようなアルゴリズムは、損失を低減するために並行する複数の木を集約する)、勾配ブースティングマシン(そのようなアルゴリズムは、損失関数の勾配を使用することによって損失を低減するための逐次及び加法決定木に対応する)、極勾配ブースティングツリー(これは、勾配ブースティングよりも効率的で柔軟で規則的なアルゴリズムである)、ナイーブベイズ(これは非常に簡単で効率的な確率的分類器である。ナイーブベイズは、全ての特徴が独立していると単純に(強く)仮定する)である。
【0101】
ディープラーニングモデルは、複数の層を使用して生の入力からより高いレベルの特徴を漸進的に抽出するモデルである。
【0102】
図2の場合、ディープラーニングモデルはモデル平均化ニューラルネットワークである。
【0103】
ランダムフォレストと同様に、モデル平均化ニューラルネットワークは、複数のニューラルネットワークを作成して1つに平均化する。
【0104】
したがって、
図2の評価方法は、幾つかの組織学的情報を評価することを可能にする。
【0105】
評価方法は、被検体パラメータ50を提供することが唯一の要件である限りにおいて高速である。
【0106】
更に、そのような提供は、評価方法が使用される医療センターのデータベースに格納された医療ファイルラッパーを使用することによって、容易かつ特に達成することができる。
【0107】
更に、評価方法は、生検を実施しないため、生検を実施することの全ての欠点を回避することを可能にする。
【0108】
なお、評価方法は、人工知能技術を用いて、組織学的情報の確実かつ正確な予測(換言すれば、評価)を得ることができる。
【0109】
このような精度を向上させるために、以下のセクションで説明する特定の人工知能技術を実装することを考慮することができる。
【0110】
特定の人工知能技術の説明
図3は、関数F1、F2、F3、F4及びF5のうちの1つの関数のための特定の人工知能技術の実行を示すフローチャートである。
【0111】
具体的な例として、
図3は、動脈硬化のステージの評価に対応する関数F2の例を扱い、この例は、他の関数F1、F2、F3又はF5に容易に適合される。
【0112】
そのような方法は、システム20と同様のシステムによって実行される。
【0113】
図3の場合、人工知能技術は、準備段階P1、トレーニング段階P2、取得段階P3、及び評価段階P4である4つの段階を含む。
【0114】
準備段階P1の間に、データセットが形成される。
【0115】
データセットは、幾つかの要素を含み、各要素は、評価された組織学的情報54を被検体パラメータ50に関連付ける。換言すれば、データセットは、多くの被検体(例えば、100超、好ましくは1000超)に対して特定の被検体パラメータ50及び動脈硬化のステージを与えるデータの集合である。
【0116】
記載された特定の例では、準備段階P1は、帰属ステップ、分割ステップ、アップサンプリングステップ、及び標準化ステップを含む。
【0117】
帰属ステップの間、初期要素が収集される。
【0118】
次いで、初期要素は、帰属技術を使用することによって完成される。
【0119】
統計学において、帰属は、欠落データを置換値で置き換えるプロセスである。
【0120】
帰属は、欠落データに使用される要素を選択するためにランダムフォレスト技術を使用することを含む。
【0121】
分割ステップの間、帰属ステップの最後に得られたデータセットは、トレーニングセットと試験セットとに分割される。
【0122】
例えば、帰属ステップの終了時に取得されたデータセットの要素の3/4が初期トレーニングセットと見なされ、他の要素は試験セットと見なされる。
【0123】
あるいは、70/30又は80/20の比を分割ステップで使用することができる。
【0124】
アップサンプリングステップの間に、初期トレーニングセットがアップサンプリングされる。
【0125】
これは、トレーニングセットの各ステージの要素の数が同じになるように初期トレーニングセットが修正されることを意味する。
【0126】
実際には、初期トレーニングセットは、ステージが高くなるにつれて、より高いステージの確率が低くなるため、より少ない要素を含む。
【0127】
図示された事例では、初期トレーニングセットの初期再分割がステージ0については2000個の要素、ステージ1については2000個の要素、ステージ2については1000個の要素、及びステージ3については300個の要素であると仮定すると、アップサンプリングステップの目的は、ステージ(ここでは2000)の中で最も高い数の要素が各ステージについて同じである修正トレーニングセットを得ることである。したがって、修正されたトレーニングセットは、各段について2000個の要素を有する8000個の要素を用いて得られる。
【0128】
このために、アップサンプリングステップは、要素の数を増やし、置換の動作を繰り返すことを含む。
【0129】
データセットの要素数は、初期データセットからランダムに要素を選択することによって、データセットの要素数がステージ数(ここでは4)に最高クラスの要素数(ここでは2000)を乗じたものに等しくなるまで増加する。
【0130】
そして、置換する動作が繰り返される。
【0131】
置換する動作は、少なくとも1つの他の数よりも上位の第1の数を有するトレーニングデータセット内に存在する要素を、第1の数より下位の数を有するトレーニングデータセット内に存在する要素によってランダムに置換することにある。
【0132】
例えば、ここでは、ステージ1の要素は、ランダムに選択されたステージ3の要素に置き換えられる。
【0133】
置換の動作は、取得されたトレーニングデータセットにおいて各ステージの要素の数が同じになるまで繰り返される。
【0134】
あるいは、アップサンプリングステップは、初期トレーニングデータセットでは表されていないステージでランダムに選択された要素を追加することによって実行される。
【0135】
標準化ステップの間に、被検体パラメータ50の少なくとも幾つかが標準化される。
【0136】
換言すれば、標準化ステップは、定量的な被検体パラメータ50がトレーニング段階P2を促進することを可能にする同様の範囲になるように実行される。
【0137】
定量的パラメータの例は、年齢、クレアチニン値又はボディーマス指数である。
【0138】
例えば、標準化する被検体パラメータ50の値は、被検体パラメータ50の現在の値とデータセット内の前記被検体パラメータ50の値の平均との差と、データセット内の前記被検体パラメータ50の標準偏差との比に置き換えられる。
【0139】
現在の場合、標準化ステップはトレーニングデータセットとテストデータセットの両方に適用されるが、代わりにトレーニングデータセットにのみ適用することもできる。
【0140】
あるいは、準備段階P1は、全てが準備手順に対応する前述の全てのステップを実行しないことを含む。
【0141】
他の実施形態では、準備段階P1のステップは、異なる順序で実行され、例えば、標準化ステップは、実行される第1のステップである。
【0142】
いずれの場合も、準備段階P1の終わりに、適切なトレーニングデータセット及び適切なテストデータセットが得られる。
【0143】
トレーニング段階P2では、複数のモデルがトレーニングされる。
【0144】
トレーニング段階P2は教師なしトレーニングである。
【0145】
本実施例では、トレーニング段階は、トレーニングステップ、作成ステップ、及び調整ステップを含む。
【0146】
トレーニングステップの間、モデルは、適切なトレーニングデータセット及び適切なテストデータセットに基づいてトレーニングされる。
【0147】
このようなトレーニングステップは、動脈硬化の2つの最上位ステージを誤って予測した場合にペナルティを課すことによって行われる。
【0148】
これは、モデルをトレーニングするために使用される誤差関数が、予測がステージ2又は3であるべきであったときの予測の誤差が、予測がステージ0又は1であるべきであったときの予測の誤差よりも深刻であると考慮していることを意味する。
【0149】
これにより、この場合、ここでは作成ステップ及び調整ステップを実行することによって、改善されなければならないトレーニング済みモデルを得ることが可能になる。
【0150】
他の実施形態では、このステップで得られたトレーニング済みモデルは、トレーニング段階P2の終了時に得られたトレーニング済みモデルである。作成ステップの間に、データのセットに異種性が作成される。
【0151】
例えば、本実施例では、k倍交差検証が繰り返される。
【0152】
例えば、10倍の交差検証が、モデルのハイパーパラメータが調整される新しいトレーニングプロセスを用いてランダムに3回繰り返される。
【0153】
そのような作成ステップは、オーバーフィッティング及び起こり得るサンプリングバイアスの可能性を最小限に抑えることを可能にする。
【0154】
代替的に又は補足的に、作成ステップは、ブートストラップを使用することを含む。
【0155】
調整ステップの間、トレーニングプロセスを制御するようになっているモデルのハイパーパラメータが調整される。
【0156】
ハイパーパラメータ最適化とも呼ばれるそのような手順は、所与の独立したデータ上の所定の損失関数を最小化する最適なモデルをもたらすハイパーパラメータのタプルを見つける。目的関数は、ハイパーパラメータのタプルを取り、関連する損失を返す。
【0157】
この場合、ハイパーパラメータチューニングは、作成ステップの終了時に取得されたデータを使用することによって達成される。
【0158】
トレーニング段階P2の終わりに、複数のトレーニング済みモデルが取得される。
【0159】
取得段階P3では、予測関数F2が取得される。
【0160】
取得段階P3は、選択ステップ及び取得ステップを含む。
【0161】
選択ステップの間、複数のトレーニング済みモデルのうちの幾つかのモデルが、性能基準に基づいて選択される。
【0162】
性能基準は、予測された組織学的情報と真の組織学的情報との間の距離を数値的に評価することを可能にするメトリックである。
【0163】
数値については、組織学的情報についての予測値と測定値との間の平均絶対誤差が計算される。
【0164】
これは特に、硬化性糸球体の割合に当てはまる(
図2の項目G参照)。
【0165】
ステージの推定には、Hand and Tillの式によるクラスの重み付けされていないペアワイズ識別能のマルチクラスAUCを使用することができ、これは次の通りである。
【数1】
ここで、
・AUC
totalは、モデルを評価するために使用されるメトリックの値であり、
・Cはクラスの数(関数F2の場合は4)であり、
・AUC(c
i,c
j)は、クラスc
i及びc
jを含む2クラスROC曲線下面積である。受信者動作特性曲線又はROC曲線は、その識別閾値が変化するときのバイナリ分類器システムの診断能力を示すグラフプロットである。
【0166】
図示の場合、性能基準は、AUCtotalが所定の閾値を上回ったときに満たされる。
【0167】
【0168】
所定の閾値は、カットオフ値0.70に固定されている。
【0169】
【0170】
第1のモデルM1はランダムフォレストであり、第2のモデルM2は順序ランダムフォレストであり、第3のモデルM3は極勾配ブースティングツリーであり、第4のモデルM4はモデル平均化ネットワークであり、第5のモデルM5は線形判別分析であり、第6のモデルM6は多項回帰であり、第7のモデルM7は最大不確定性線形判別分析であり、第8のモデルM8はk最近傍である。
【0171】
5つの第1のモデルM1~M5のみが、所定の閾値0.70を上回る性能を提供しているように見える。
【0172】
したがって、この具体例では、選択されるモデルは、5つの第1のモデルM1~M5である。
【0173】
選択ステップの終わりに、幾つかの選択されたモデルがこのようにして得られる。
【0174】
取得ステップの間に、予測関数F2が取得される。
【0175】
予測関数F2は、選択されたモデルの集約関数である。
【0176】
言い換えれば、予測関数F2は、選択されたモデルのメタクラス化器であるか、又は予測関数F2は、複数のモデルの1つのスーパー学習器への組み合わせとして解釈することができる。
【0177】
集約関数は、例えば、多数決である。
【0178】
したがって、本例では、予測関数F2は、モデルM1~M5である最初の5つのモデルの多数決である。
【0179】
変形例によれば、集約関数は、単純平均、加重平均、加重投票、又はアンサンブルスタッキングである。
【0180】
そのような状況では、アンサンブルスタッキングは、多クラスカテゴリ変数(複数可)及び数値変数(複数可)に別個の関数を適用すること、特に算術平均(多クラスカテゴリ変数)及び予測結果に対する線形回帰を使用して確率的分類器の結果を単純に平均して平均絶対誤差(数値変数)を最小にすることに対応する。
【0181】
取得ステップの終了時に、予測関数F2が取得される。
【0182】
評価段階P4では、予測された関数F2、より具体的にはその性能が評価される。
【0183】
評価段階P4は、以前の性能基準を使用して実行することができる。
【0184】
これは、予測関数F2の総AUCが0.74に等しい
図4の場合である。
【0185】
予測関数F2の性能は、各モデルの最良の性能よりも良好であることに留意されたい。
【0186】
これは、予測関数F2が各モデルを最大限に活用している限り、驚くことではない。特に、1つのモデルが間違っている場合、他のモデルが正しい場合、予測関数F2の予測は正しいので、より良い性能が得られる。
【0187】
代替的又は補足的に、評価段階P4は、ロバスト性試験及び/又は耐久性試験を使用することを含む。
【0188】
例えば、試験データセット上に人工的に作成された逐次誤差を使用して、モデルの性能が逐次的にどのように低下するかを評価する。
【0189】
別の変形例又は補足によれば、評価段階P4は、ランダムフォレストアルゴリズムを使用することを含む。そのようなアルゴリズムは、組織学的情報を予測するために特徴の重要性を調べるために使用される。
【0190】
代替的又は補足的に、評価段階P4は、ブートストラップ技術を使用することを含む。そのようなブートストラップ技術は、予測の信頼区間を生成するために使用される。
【0191】
評価方法の他の実施形態
本評価方法は、多くの異なる方法で実施することができる。幾つかの例を以下に示す。
【0192】
評価方法は、予測された組織学的情報を出力するなどの更なるステップを含み得る。
【0193】
出力は、レーダープロット、値の列挙などであり得る。
【0194】
好ましくは、出力は、システム20の出力装置46に表示される。
【0195】
例えば、提供ステップでは、特定の被検体パラメータ50のみ、例えば、併存症56、臨床データ58又は生物学的データ60のうちの1つ又は2つが提供される。
【0196】
別の例として、被検体の民族性又は糸球体濾過率などのより多くの被検体パラメータ50が提供される。
【0197】
「糸球体濾過率」又は「GFR」という用語は、単位時間当たりに腎(腎臓)糸球体毛細血管からボーマン嚢に濾過された体液の量を指す。GFRは、被検体の腎機能を評価するために使用される。
【0198】
そのような糸球体濾過率は、例えば、推定GFRである。「推定GFR」又は「eGFR」という用語は、その内容が参照により本願に組み入れられ、Levey A S,ボッシュJ P,Lewis J B,Greene T,Rogers N,Roth D「血清クレアチニンから糸球体濾過率を推定するより正確な方法:新たな予測方程式。腎疾患における食事の変更研究グループ」Ann.Intern.Med.130(6):461-70(1999)に記載された腎疾患における食事の変更研究グループにより開発された腎疾患における食事の変更(MDRD)方程式を使用して計算される糸球体濾過率又はGFRの推定値を指す。一般的には、eGFRの測定単位は、mL/分/1、73m2である。一般的には、eGFRは、0から120mL/分/1、73m2の間に含まれる。
【0199】
評価された組織学的情報は、以前に提示された情報の組織学的情報の1つ又は幾つかであり得る。
【0200】
好ましくは、1つの組織学的情報は、少なくとも3つの組織学的病変のステージを含む。
【0201】
また、評価された組織学的情報は、異なって評価されてもよい。
【0202】
例えば、ci及びct値を評価する代わりに、間質性線維症/尿細管萎縮を評価することが考えられ得る。
【0203】
間質性線維症/尿細管萎縮(IFTA)をBanff Lesion Score i-IFTAによって評価する。このスコアは、瘢痕化した皮質における炎症の程度を評価する。スコアは、以下のように異なるステージによって評価される。
-0期(i-IFTA 0):炎症なし、又は瘢痕化した皮質実質の10%未満;
-ステージ1(i-IFTA 1):瘢痕化した皮質実質の10%~25%における炎症;
-ステージ2(i-IFTA 2):瘢痕化した皮質実質の26%~50%における炎症、及び
-ステージ3(i-IFTA 3):瘢痕化した皮質実質の50%超における炎症。
【0204】
ステージによらず数値的にスコアを評価することも考えられる。IFTAの場合、ステージを決定することなく炎症のパーセンテージを出力することができる。
【0205】
微小循環炎症、間質性炎症及び管炎並びに移植糸球体症などの他の組織学的情報を評価することができる。
【0206】
微小循環炎症(糸球体炎と尿細管周囲毛細血管炎の組み合わせに対応する)は、バンフ病変スコアg(糸球体炎のスコア)+バンフ病変スコアptc(尿細管周囲毛細血管炎のスコア)の加算から生じる。
【0207】
バンフ病変スコアgは、糸球体内の炎症の程度を評価する。糸球体炎は、微小血管炎症の一形態であり、抗体媒介性拒絶における組織との活性及び抗体相互作用の特徴である。スコアは以下のように評価される。
-g0:糸球体炎なし;
-g1:25%未満の糸球体に分節性又は全体性の糸球体炎;
-g2:25%~75%の糸球体に分節性又は全体性の糸球体炎
-g3:75%を超える糸球体における分節性又は全体的な糸球体炎。
【0208】
バンフ病変スコアptcは、尿細管周囲毛細血管(PTC)内の炎症の程度を評価する。糸球体炎と共に、尿細管周囲毛細血管炎は、活性抗体媒介性拒絶又は慢性活性抗体媒介性拒絶の特徴として微小血管炎症を構成する。スコアは以下のように評価される。
-ptc0:白血球の最大数<3;
-ptc1:最も重度に関与するPTCが3~4個の白血球を有する皮質PTCの10%以上に少なくとも1個の白血球細胞;
-ptc2:皮質PTCの10%以上に少なくとも1つの白血球、最も重度に関与しているPTCに5~10個の白血球、及び
-ptc3:皮質PTCの10%以上に少なくとも1つの白血球、及び最も重度に関与しているPTCに>10個の白血球。
【0209】
間質性炎症及び尿細管炎は、バンフ病変スコアi(間質性炎症のスコア)+バンフ病変スコアt(尿細管炎のスコア)の加算から生じる。
【0210】
バンフ病変スコアiは、しばしば急性T細胞媒介性拒絶のマーカーである皮質の非瘢痕領域(「間質性炎症」)における炎症の程度を評価する。スコアは以下のように評価される。
-i0:炎症なし、又は瘢痕のない皮質実質の10%未満;
-i1:瘢痕のない皮質実質の10から25%における炎症;
-i2:瘢痕のない皮質実質の26から50%における炎症、及び
-i3:瘢痕のない皮質実質の50%を超える炎症。
【0211】
バンフ病変スコアtは、皮質尿細管の上皮内の炎症の程度を評価する(「管炎」)。腎尿細管上皮の基底外側面における単核細胞の存在は、腎臓移植における急性T細胞媒介性拒絶の定義される病変の1つである。スコアは以下のように評価される。
-t0:尿細管に単核細胞がないか、又は尿細管炎のみの単一の焦点;
-t1:1~4個の単核細胞/管状断面(又は10個の管状細胞)を有する病巣;
-t2:5から10個の単核細胞/管状断面(又は10個の管状細胞)を有する病巣、及び
-t3:10個を超える単核細胞/管状断面を有する病巣、又はi2/i3炎症及び他の場所でのt2を伴う≧2面積の管状基底膜破壊の存在。
【0212】
移植糸球体症(cg)は、バンフcgスコアにより評価する。スコアは、最も重度に罹患した糸球体における糸球体基底膜(GBM)の二重輪郭又は多層の存在及び程度に基づく。スコアは以下のように評価される。
-cg0:光学顕微鏡(LM)又は電子顕微鏡(EM)によるGBM二重輪郭なし;
-cg1a:LMによるGBM二重輪郭はないが、EMによる少なくとも3つの糸球体毛細血管のGBM二重輪郭(不完全又は円周状)は関連する内皮腫大及び/又は内皮下の電子透過性拡大を伴う;
-cg1b:LMによる最も影響を受けた非硬化性糸球体の毛細管ループの1~25%におけるGBMの二重輪郭;EMが利用可能である場合、EMの確認が推奨される;
-cg2:最も影響を受ける糸球体の末梢毛細管ループの26~50%に影響を及ぼす二重輪郭
-cg3:最も影響を受けた糸球体の末梢毛細管ループの50%超に影響を及ぼす二重輪郭。
【0213】
組織学的情報54の評価が移植の状況で生検のために行われるだけではないという事実を考慮すると、これはなおさら当てはまる。生検は、腎臓疾患診断又は腎臓がんなどの他の状況にも使用される。
【0214】
そのような評価方法は、塗抹、穿刺液又は腎臓切除などの他の医学的行為において有利に使用することができるので、他の組織学的情報54も含まれる。
【0215】
また、評価方法は、他の臓器に対して行われる。
【0216】
例えば、腎臓である移植片を考慮する代わりに、移植片は心臓又は肺又は肝臓である。
【0217】
そのような場合、考慮される臓器に応じて他の組織学的情報54を考慮することができる。
【0218】
特に、臓器が心臓である場合、組織学的情報54は急性細胞拒絶のステージであり、抗体媒介拒絶の所定のクラスのステージは、好ましくは国際心肺移植学会又は同種移植片病理の国際バンフ分類のクラスである。
【0219】
別の例として、肺、組織学的情報54が急性細胞拒絶のステージである場合、抗体媒介拒絶の所定のクラスのステージは、好ましくは、国際心肺移植学会又は同種移植片病理の国際バンフ分類のクラスである。
【0220】
更に、そのような評価方法を他の臓器に使用することができるという事実に起因して、そのような評価方法は、心内膜心筋又は経気管支又は肺又は肝臓生検、スミア、穿刺液、並びに肺又は肝臓の切除などの他の医療行為において有利に使用することができる。
【0221】
先の実施形態のそれぞれは、評価方法が被検体の臓器の少なくとも1つの組織学的情報54、特にドナーからの移植片を評価するための方法である共通の特徴を共有し、この方法はコンピュータ実装され、この方法は、被検体50に関するパラメータを提供することと、少なくとも1つの組織学的情報のそれぞれについて、提供された被検体データに対して予測関数52を適用して、評価された組織学的情報を得ることとを含む。評価された組織学的情報54は、組織学的情報54が数値である場合、臓器における数値であり、又は、評価された組織学的情報54は、組織学的情報54が異なる所定のクラスの中の1つの所定のクラスに属する場合、臓器の異なる所定のクラスに属する確率である。更に、各予測関数52は、考慮される組織学的情報に固有のものであり、人工知能技術を使用することによって得られる。
【0222】
そのような評価方法は、いずれの場合も、非侵襲的技術を用いて情報の正確な組織片を得ることを可能にする。
【0223】
更に、そのような方法は、一般的に知られているか又は非侵襲的に測定することができる被検体パラメータ50を入力することによって実行することができるため、実施が容易である。そのような入力動作及び方法の実行は、各ケアユニットで一般に利用可能なシステム20を使用することによって達成することができる。
【0224】
システム20が予測関数を適用するのに必要な計算能力を有していない場合、リモートサーバと相互作用することによって計算を実行することができる。
【0225】
これらの場合のそれぞれにおいて、ケアユニット内に追加のハードウェアリソースを必要としない。
【0226】
更に、侵襲的行為が実行されないので、侵襲的行為を実行するために割り当てられたリソースが節約され、他のタスクに割り当てることができる。
【0227】
これは、評価方法が、生検などの侵襲的行為と同じ情報を提供しながら、ケアユニットのリソースを節約していることを意味する。
【0228】
用途
評価方法のこのような利点は、この方法を疾患に関連する多くの用途に適したものにする。
【0229】
文脈によれば、及び前述の例によれば、そのような疾患は、腎臓疾患又は心臓疾患であり得る。
【0230】
疾患の他の例は、急性細胞拒絶、抗体媒介性拒絶、原疾患の再発(アミロイドーシス、特に糖尿病)及びポリオマウイルス腎症である。
【0231】
移植片喪失、移植片拒絶、移植片対宿主病、狭窄、血栓症、急性尿細管腎炎、慢性移植腎症、腎不全、アテローム性動脈硬化症、動脈性高血圧、冠動脈疾患は、そのような種類の疾患の他の例である。
【0232】
各用途において、評価方法が使用される用途の疾患と、評価方法が適用される臓器との間には関連性が存在する。換言すれば、そのような疾患は、この臓器に関連する疾患又は障害である。
【0233】
したがって、被検体が疾患に罹患するリスクがあることを予測する方法において評価方法を使用することが考えられ得る。
【0234】
「リスク」という用語は、特定の期間にわたってイベントが発生する確率に関連し、被検体の「絶対」リスク又は「相対」リスクを意味し得る。絶対リスクは、関連する時間コホートの測定後の実際の観察を参照して、又は関連する期間にわたって追跡された統計的に有効な履歴コホートから開発された指標値を参照して測定することができる。相対リスクは、低リスクコホートの絶対リスク又は平均集団リスクのいずれかと比較した被検体の絶対リスクの比を指し、臨床的リスク因子の評価方法によって異なり得る。所定の試験結果に対する陽性事象対陰性事象の割合であるオッズ比も一般的に使用される(オッズは式p/(1-p)に従い、式中、pは事象の確率であり、(1-p)は事象がない確率である)。
【0235】
予測するための方法は、評価された組織学的情報を得るために、被検体に対して評価方法のステップを実施するステップ、及び評価された組織学的情報に基づいて、被検体が疾患に罹患するリスクがあることを予測するステップを少なくとも含む。
【0236】
あるいは、疾患を診断する方法は、評価された組織学的情報を得るために評価方法のステップを実行するステップと、評価された組織学的情報に基づいて疾患を診断するステップとを少なくとも含む、疾患を診断する方法と考えることができる。
【0237】
また、評価方法は、疾患を予防及び/又は治療するための治療標的を同定するための方法において有利に使用することができ、この方法は、第1の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行して、第1の評価された組織学的情報を得るステップであって、第1の被検体が疾患に罹患している被検体である、ステップと、第2の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行して、第2の評価された組織学的情報を得るステップであって、第2の被検体が疾患に罹患していない被検体である、ステップと、第1及び第2の評価された組織学的情報の比較に基づいて治療標的を選択するステップとを少なくとも含む。
【0238】
あるいは、評価方法は、疾患におけるバイオマーカーを同定する方法と見なすことができ、バイオマーカーは、疾患の診断バイオマーカー、疾患の感受性バイオマーカー、疾患の予後バイオマーカー、又は、疾患の治療に応じた予測バイオマーカーであり、方法は、第1の評価された組織学的情報を得るために、第1の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、第1の被検体が疾患に罹患している、ステップと、第2の評価された組織学的情報を得るために、第2の被検体の臓器の少なくとも1つの組織学的情報を評価するための方法のステップを実行するステップであって、第2の被検体が疾患に罹患していない、ステップと、第1の評価された組織学的情報と第2の評価された組織学的情報との比較に基づいてバイオマーカー標的を選択するステップとを少なくとも含む。
【0239】
また、評価方法は、薬剤として有用な化合物をスクリーニングする方法において有利に使用することもでき、化合物は、疾患を予防及び/又は治療するための既知の治療標的に対して効果を有し、方法は、第1の被検体の臓器の少なくとも1つの組織学的情報を評価する方法のステップを実行して、第1の評価された組織学的情報を得るステップであって、第1の被検体が、疾患に罹患しており、化合物を受けたことがある、ステップと、第2の被検体の臓器の少なくとも1つの組織学的情報を評価する方法のステップを実行して、第2の評価された組織学的情報を得るステップであって、第2の被検体が、疾患に罹患しており、化合物を受けたことがない、ステップと、第1及び第2の評価された組織学的情報の比較に基づいてバイオマーカー標的を選択するステップとを少なくとも含む。
【0240】
また、評価方法は、臨床試験に登録された患者をモニタリングして、前記患者に対して評価方法のステップを実行することによって、臨床試験に供される治療の治療有効性の定量的指標を提供する方法において有利である。
【0241】
より一般的には、評価方法は、好適には、組織学的情報が使用される任意の状況で、更には、そのような組織学的情報が侵襲的な方法でしか得られない場合に使用することができる。
【0242】
更に、当業者は、評価方法の前述の実施形態の特徴の任意の組み合わせを考慮して、特徴が技術的に適合する場合に新しい実施形態を得ることができる。
【0243】
実験セクション
このセクションは、本発明の利点を示す、本出願人によって実施された研究に専念する。
【0244】
状況で調査
本研究前の証拠
医学では、診断を決定し、治療法を導き、予後評価を行うために組織生検が日常的に行われている。腎移植では、0日目の生検を腎臓同種移植片のベースライン状態として使用して、その後の同種移植片生検で見出された病変をより良く状況把握し、意思決定プロセスを導く。しかしながら、生検は依然として、人的資源を動員し、それによって移植処置を遅延させる侵襲的で費用のかかる処置である。
【0245】
出願人は、言語制限なしで、(「非侵襲(noninvasive)」又は「非侵襲(non-invasive)」)、「生検」、「予測」、及び「機械学習」という用語を使用して、2000年1月から2021年1月までのPubMed及びMEDLINEを検索している。この検索により、164の研究が見出された。単一疾患診断(例えば、癌)を予測する12の研究を除外した後、124の研究は組織学的画像を使用し、28はオミクス診断に関連した。非侵襲的パラメータを使用して臓器病変の存在及び重症度を評価する仮想生検を生成するための研究は発表されなかった。
【0246】
この主張は、本特許出願が優先権を主張する出願に関して欧州特許庁(EPO)によって実施された欧州調査の結果によって確認される。
-題名「腎臓移植レシピエントにおける移植片生存を予測するために生存統計を使用する機械学習アプローチ:多施設コホート研究」、Scientific Reports,volume 7,number 1,Kyung Don YOO et al.による記事;
-Derek A DUBAY et al.による論文であり、その表題は「腎移植のための5年間の同種移植片生存モデルの開発と将来の展開」、Nephrology、第24巻、第8号である。
-その表題が「腎移植後の患者の生存:ランダム生存フォレスト解析を用いた予測モデリングによって決定される移植片維持因子の重要な役割」であるIrina SCHEFFNERらによる論文、Transplantation、第104巻、第5号;
-Vijaya B.KOLACHALAMAらによる論文であり、その表題は「Association of Pathological Fibrosis With Renal Survival Using Deep Neural Networks」、Kidney International Reports、第3巻、第2号、及び
-その表題が「腎疾患における人工知能の役割(Role of Artificial Intelligence in Kidney Disease)」、International Journal of Medical Science,volume 7,number 7であるQiongjing YUANらによる論文。
【0247】
ここでも、これらの文献のいずれも、非侵襲的パラメータを使用して臓器病変の存在及び重症度を評価する仮想生検を生成することを示唆していない。
【0248】
本研究の付加価値
この研究は、世界中の17のセンターからの適格なデータセットを使用することによって、医学における最初の仮想生検システムを開発及び検証する。本出願人は、一般的に評価された臨床的及び生物学的パラメータを使用して、組織線維症、動脈硬化症、動脈ヒアリン症及び糸球体硬化症に関連する特定の組織学的病変を予測し、グレード分類した。本出願人は、複数の機械学習アルゴリズムを使用して、導出された仮想生検システムの堅牢で正確な識別及び較正を達成し、複数の臨床シナリオにおける本出願人の結果の一般化可能性を示した。
【0249】
入手可能な全ての証拠の示唆
この研究は、非侵襲的仮想生検システムの性能を実証し、これは、毎日の移植の実施において実現可能かつ容易に実施可能であり、移植患者管理のための意思決定プロセスを向上させるための新たな道を開く。日常的な臨床診療においてこのシステムを実装するために、本出願人は、臨床医が仮想生検結果を視覚化することを可能にするオンラインのすぐに使用できるアプリケーションを構築した。
【0250】
序論
医学において、生検は、悪性腫瘍、良性腫瘍の両方の診断を確立し、炎症性疾患及び他の病理学的過程を特徴付けるための標準的な検査となり、それによって治療管理を導く。
【0251】
移植医療では、Barryら及びパリのHamburgerの最初の先駆的研究以来、臓器の生検が行われており、同種移植片拒絶反応及び同種移植片を損傷する他の様々な病理学的過程を診断するためのゴールドスタンダードとなっている。「0日目の生検」とも呼ばれるドナーの組織学的評価は、ドナー臓器の質を判断し、場合によってはドナーの基礎疾患の可能性を排除するために、幾つかの移植プログラムでも実施されている。更に、0日目の生検は、腎臓同種移植片のその後の生検の結果を比較することができ、治療戦略を提唱することもできる貴重なベースラインを提供する。
【0252】
それらの潜在的有用性にもかかわらず、0日目の生検は、外科的、医学的、病理学的及び技術的資源の組織化を必要とする侵襲的で時間がかかり費用のかかる処置のままであるので、依然として多くの移植センターでは行われず、特定の状況でのみ行われる。更に、臓器の質を評価することは、高齢ドナーからの移植、循環死亡後の提供、及び重大な臨床的危険因子を有するドナーの現在の世界的な増加において更に困難になっている。これらの脆弱な臓器は、移植時に、動脈硬化、線維症、ヒアリン症及び糸球体硬化病変を担持し得る。移植後の生検で明らかにされたものが、0日目の生検では理解されない場合、これらの組織学的病変は、それらの非特異性のために、カルシニューリン阻害剤の毒性、感染症又はアロ免疫応答に誤って帰する可能性があり、意思決定及び患者管理に大きな影響を及ぼす。
【0253】
これらの制限を回避するために、本出願人は、腎臓の0日目の生検結果を予測するために日常的に収集されるドナーパラメータを使用する仮想生検システムを開発及び検証するための研究を設計した。機械学習は、多くの医療専門分野においてその臨床的関連性及びロジスティック回帰に対する優れた性能を実証しているので、本出願人は、国際バンフ同種移植組織病理分類の基準を用いた0日目の生検評価と共に、ドナーパラメータの日常的かつプロトコル化された収集を受けたドナーの大規模で適格な国際コホートを使用した機械学習法並びに従来の統計的アプローチに基づいた。
【0254】
本出願人の最終目的は、診断、治療法及び移植後の即時患者管理を誘導し、標準的なドナーパラメータのみを使用して0日目の生検を実施するための追加のリスク及びコストを最小限に抑えるための仮想生検システムを臨床医に提供することであった。
【0255】
方法
研究デザイン及び母集団
母集団は、腎臓移植の前に行われた腎生検を受けた、2000年1月1日~2019年12月31日に登録された腎臓移植のための生きている又は死亡したドナーに存する。この研究には、欧州、北米及びオーストラリアの7か国からの17の機関が関与した。合計14,080の腎生検を全体的に評価した。除外基準は、バンフ国際分類要件(n=1,088、7.7%)による不適切な生検であった。最終分析のために合計12,992の腎同種移植生検を含めた。
【0256】
全てのデータを匿名化し、臨床データを各施設から収集し、Paris Transplant Groupデータベース(フランスデータ保護局(CNIL)登録番号:363505)に入力した。2020年1月1日に、データベースからデータにアクセスした。試験プロトコルは、Paris Transplant Groupの施設内審査委員会(https://www.paristransplantgroup.org)によって承認された。移植時に全ての生体ドナーによって書面によるインフォームドコンセントが与えられた。移植時に、Paris Transplant Groupセンター(Necker病院、Saint Louis病院、Toulouse病院)からの全データを前向きに入力した。構造化プロトコルを使用して、研究センター間の調和を確保にした。データの正確性を確保するために、データが年間監査のために送られている。標準的な臨床手順の一部として、欧州、北米及びオーストラリアのセンターからの他のデータセットを編集し、地域及び国の規制基準に従ってセンターのデータベースに入力し、匿名でParis Transplant Groupに提出した。
【0257】
腎生検組織学的評価及びプロトコル
16ゲージの針装置又は直線ブレードを使用して外科医が標準的な慣例に従って臓器をドナーから取り出した後、ゼロ日の生検を実施した。組織をアルコール-ホルマリン-酢酸溶液中で直ちに固定し、その後、パラフィンに包埋するか、直ちに凍結した。生検切片(4μm)を過ヨウ素酸シッフ、マッソントリクローム、ヘマトキシリン及びエオシンで染色した。国際バンフスコアを使用して、19名の一般病理学者又はトレーニングされた腎臓病理学者が、以下の基準、すなわち、糸球体数、動脈硬化症、動脈ヒアリン症、間質性線維症及び尿細管萎縮、並びに硬化性糸球体の割合を使用して移植片生検病変を等級付けした。これらの病変のバンフ等級付けスキームを表6に詳細に記載する。
【0258】
他の参加センターの生検診療及び手順を要約する詳細な表を表7に示す。
【0259】
関心の結果
関心の結果は、i)最も重度に冒された動脈における動脈内膜肥厚によって定義される動脈硬化(Banff「cv」スコア)、ii)過ヨウ素酸シッフ(PAS)陽性の動脈硝子体肥厚によって定義される細動脈硝子化(Banff「ah」スコア)、及びiii)皮質線維症(Banff「ci」スコア)及び皮質尿細管萎縮(Banff「ct」スコア)の程度を用いて計算された間質線維症及び尿細管萎縮(Banff「IFTA」スコア)を含む、全ての腎区画に対して検証された半定量的順序等級付けスキームを使用する同種移植片病理の国際バンフ分類による生検結果であった。最後に、全体的硬化症に罹患した糸球体の総数の割合によって定義される硬化性糸球体の連続割合(Banff「糸球体硬化症」スコア)。バンフ等級付けスキームの詳細は、表6で入手可能である。
【0260】
腎生検の予測因子候補
ドナーの年齢、性別、型(生きているドナー又は死亡したドナー)、ドナーの脳血管死因、循環死亡後のドナー(DCD)、ドナーの高血圧の病歴、糖尿病、C型肝炎ウイルス(HCV)の状態、ボディーマス指数(BMI)、提供時の血清クレアチニン、及びドナーのタンパク尿の状態を含む、腎臓0日目の組織学的病変の合計11個の候補予測因子を調べた。
【0261】
統計学的分析
ベースライン特性の記述的分析
連続変数については、平均及び標準偏差(SD)を使用した。本発明者らは、スチューデントのt検定、分散分析(ANOVA)(又は適切な場合はマン・ホイットニー検定及びクラスカル・ウォリス)又はカイ二乗検定(又は適切な場合はフィッシャーの正確検定)を使用して、群間の平均及び割合を比較した。
【0262】
データセット分割
4日間のゼロ組織学的病変スコア(cv,ah,IFTAは順序変数であり、糸球体硬化は連続的である)の予測のために、データセットを無作為に一連のセット(75%)と試験セット(25%)とに分けた。トレーニングセット及び試験セットの両方がそれらからほぼ等しくバランスのとれた情報を共有することができるように、ランダムな区分を各組織学的病変スコアによって層別化した。重症/高悪性度よりも軽度/低悪性度であった病変スコアのデータ不均衡を最小限に抑えるために、本発明者らは、軽度/低悪性度からランダム値を再サンプリングすることによってアップサンプリング法を適用した。これらのデータセットの準備及び前処理ステップは、キャレットRパッケージを用いて行った。トレーニングセット及び試験セットのベースライン特性を表8に要約する。
【0263】
機械学習ベースの仮想生検システムの開発
仮想生検システムを開発するために、6つの機械学習モデル:ランダムフォレスト(RF)、モデル平均化ニューラルネットワーク(avNNet)、勾配ブースティングマシン(GBM)、極勾配ブースティングツリー(XGBoost)、線形判別分析(LDA)、及びナイーブベイズ(NB)から、各0日目の組織学的病変スコアについて確率を計算した。機械学習モデルと比較するために、従来の多項ロジスティック回帰(MNOM)も実行した。オーバーフィッティングを回避するために、モデルを調整するときに、ハイパーパラメータの組み合わせをロバストな10倍交差検証によって最適化した。更に、交差検証プロセスを3回繰り返してサンプリングバイアスを最小にした。そして、各モデルによって生成された確率を平均化することによって機械学習分類モデル(ベースモデル)を集約し、バイアスを低減し、予測性能を向上させた(アンサンブルモデル)。連続的な0日目の組織学的病変について、性能を高めるために回帰モデル(ベースモデル)の線形回帰を使用して、10倍の交差検証を3回繰り返して、糸球体硬化症の割合、アンサンブルモデルを作成した。本出願人は、MNOM、LDA、及びNBを実施して糸球体硬化症病変を予測することを控えたが、これは、それらがカテゴリ変数(分類)を予測するように排他的に設計されているためである。
【0264】
機械学習予測性能
連続的である糸球体硬化症に使用される機械学習モデルの識別性能を評価するために、平均絶対誤差(MAE)を使用した。順序日ゼロの組織学的病変スコア、動脈硬化(cv)、細動脈硝子化(ah)、並びに間質性線維症及び尿細管萎縮(IFTA)について、本発明者らは、Hand and Tillの式による組織学的病変スコアの重み付けされていないペアワイズ識別能の多曲線下面積(multi-AUC)を使用した。混同行列を用いてモデル較正を調べた。更に、予測性能のロバスト性を試験するために、本発明者らは、本発明者らの試験セットに人工ランダムエラーを導入し、次いでエラーの数を徐々に増加させ、本発明者らのアンサンブルモデルの予測性能がどのように影響を受けたかを調べた。
【0265】
欠落データの多重帰属
目的の予測子について少なくとも1つの欠落データ要素を有する生検の場合、missForest Rパッケージを使用してランダムフォレスト補完アルゴリズムを実行した。反復の最大回数は、多重帰属のために10回に設定された。
【0266】
欠損値は、missForest Rパッケージで実施されたランダムフォレストアルゴリズムで帰属された。帰属アルゴリズムで使用されたドナーパラメータ及び生検所見は、i)年齢、ii)性別、iii)ドナータイプ(生きている又は死亡したドナー)、iv)脳血管死亡原因、v)循環死亡後ドナー(DCD)、vi)高血圧の病歴、vii)糖尿病、viii)C型肝炎ウイルス(HCV)の状態、ix)ボディーマス指数(BMI)、x)血清クレアチニンによって定義される腎機能、xi)タンパク尿の状態、xii)動脈硬化症(Banff cvスコア)、xiii)細動脈硝子化(Banff ahスコア)、xiv)間質線維症及び尿細管萎縮症(Banff IFTAスコア)、xv)硬化性糸球体の割合(Banff糸球体硬化スコア)であった。最大反復回数は10回とした。
【0267】
転流プロセス及び結果の詳細を表9に示す。
【0268】
ソフトウェア
STATA(バージョン15、データ分析及び統計ソフトウェア)及びR(バージョン3.5.1、R Foundation for Statistical Computing)を用いて記述分析及び機械学習分析を行った。
【0269】
結果
コホートの特徴
2000年1月1日から2019年12月31日までの17の参加移植センターから合計12,992日間の生検を含め、そのうち5,905の生検(45.45%)は10の欧州センターから、6,663(51.29%)は6つの北米センターから、424(3.26%)はオーストラリアセンターからであった。平均ドナー年齢は49.75±15.13歳であった。6,082人(46.85%)が女性であり、9,449人(72.73%)が死亡ドナーであった。平均血清クレアチニンは1.07±0.74mg/dlであった。ベースラインのドナー特性及び欧州、北米及びオーストラリアのコホート間の比較を表1に詳細に示す。
【0270】
母集団の詳細については、欧州センターには、フランスのパリにあるNecker Hospital(n=1218)、フランスのパリにあるセントルイス病院(n=856)、フランスのトゥルーズにあるトゥルーズ病院(n=522)、ビセトル病院、フランスのクレムリンビセトル(n=575)、ベルギーのリューヴェンにある大学病院(n=915)、ベルギーのリエージュにある大学病院(n=130)、クロアチアのザグレブにある大学病院センターザグレブ(n=566)、スペインのバルセロナのバルセロナ州立病院(n=486)、スペインのバルセロナにあるバルデブロン病院(n=454)、及び、スペインのバルセロナにあるベルヴィッチ大学病院(n=183)が含まれている。北米センターには、ミネソタ州ロチェスターのメイヨークリニック(n=2922)、アリゾナ州フェニックスのメイヨークリニック(n=92)、米国ニューヨーク州ニューヨークのコロンビア大学医療センター(n=871)、カナダのバンクーバーにあるブリティッシュコロンビア大学(n=465)、カナダのエドモントンにあるアルバータ大学(n=1226)、臓器共有のための統合臓器ネットワーク(UNOS,n=1087)が含まれている。オーストラリアのセンターには、オーストラリアのアデレードの王立アデレード病院が含まれていた(n=424)。
【0271】
国及び施設によって層別化されたドナーのベースライン特性も表3、4.1及び4.2に示す。
【0272】
腎生検結果
表1は、欧州、北米及びオーストラリアのコホートによって層別化された0日目の腎生検結果を示す。糸球体硬化症の平均パーセンテージは7.67%±10.87(死亡ドナーの間では8.39%±11.28)であった。動脈硬化(cv)病変スコアの分布は、バンフスコア0、1、2、及び3について、それぞれ52.32%、29.76%、16.05%、及び1.87%であった。細動脈硝子化(ah)病変スコアの分布は、スコア0、1、2、3についてそれぞれ61.57%、26.93%、9.58%及び1.91%であった。最後に、間質性線維症及び尿細管萎縮(IFTA)病変スコアの分布は、スコア0、1、2、及び3についてそれぞれ60.19%、31.29%、8.00%、及び0.52%であった。最も中程度又は重度(スコア2又は3)の病変は、死亡ドナー由来であった(表5参照)。
【0273】
機械学習を用いた仮想生検システムの開発
4日間のゼロ組織学的病変スコアの予測のために、データセットを無作為に一連のセット(75%)と試験セット(25%)とに分けた。トレーニングセットと試験セットとの比較を表8、8.1、8.2、8.3及び8.4に示す。
【0274】
動脈硬化(cv)、細動脈硝子化(ah)、間質性線維症及び尿細管萎縮(IFTA)、及び糸球体硬化症を含む生検病変スコアについて複数の機械学習モデルを生成し、以下の11の予測変数、すなわち、年齢、性別、ドナーの種類(生きている又は死亡したドナー)、脳血管死後のドナー、循環死後のドナー、高血圧の病歴、糖尿病、HCV状態、BMI、血清クレアチニン、及びタンパク尿状態を使用してトレーニングセットにおけるドナーの特性を評価した。
【0275】
次に、性能を改善するために幾つかの機械学習モデルを一緒にグループ化するアンサンブルモデルを生成した。本発明者らは、順序性動脈硬化症(cv)、細動脈硝子化(ah)、及び間質性線維症及び尿細管萎縮(IFTA)の0日目の病変スコアのスコア確率法と、仮想生検システムとしての糸球体硬化率の交差検証中の最良性能モデルとを平均化して、アンサンブルモデルを選択した。
【0276】
予測モデル性能
アンサンブルモデルは、動脈硬化症(cv)、細動脈硝子化(ah)、並びに間質性線維症及び尿細管萎縮(IFTA)についてそれぞれ、0.738、0.817、0.788の試験セットでマルチAUCを達成した(表2)。ランダムフォレストモデルは、糸球体硬化症病変の交差検証中に最良の結果を示し、試験セットにおける平均絶対誤差(MAE)は4.766であった。表2は、生成された全てのモデルの性能をまとめたものである。全ての順序病変スコアについて、アンサンブルモデルが最良の性能のモデルであった。糸球体硬化症病変について、XGBoostモデルは、試験セットにおいて4.703のMAEで最良の識別を達成した。較正は、表10、10.1及び10.2に混同行列として示されている。
【0277】
ドナーパラメータの病変スコア予測に対する相対的重要性
アンサンブルモデルで使用される11個のドナーパラメータSの重要性を各トレーニングセットで調べた。生検病変を予測する3つの最も重要なパラメータは、動脈硬化(cv)及び細動脈硝子化(ah)については、年齢、血清クレアチニン及び肥満度指数(BMI)であり、間質性線維症及び尿細管萎縮(IFTA)及び糸球体硬化については、年齢、クレアチニン及び高血圧の病歴であった。
【0278】
臨床医のための仮想生検オンラインアプリケーションの構築
出願人は、臨床医に我々の仮想ゼロ日生検システムへのオープンアクセスを提供するために、すぐに使用できるオンラインアプリケーションを構築した。このアプリケーションにより、臨床医は、所定のドナーの基本人口統計、過去の病歴、併存症、臨床パラメータ、腎機能を含む生物学的パラメータ、及びタンパク尿レベルなどの単一の患者のデータを入力して、i)各0日目の組織学的病変スコアに属する対応する確率、ii)レーダーチャートによる対応する視覚化を得ることができる。
【0279】
感度分析
本発明者らの結果のロバスト性及びモデルの一般化可能性を更に高めるために、様々な感度分析を行った。
【0280】
異なる亜集団及び臨床シナリオにおける仮想生検システムの検証
仮想生検システムのロバスト性は、i)大陸、ii)ドナータイプ(生きているドナー又は死亡したドナー)、iii)民族性(アフリカ系アメリカ人又は非アフリカ系アメリカ人ドナー)、及びiv)生検タイプ(移植前又は灌流後の0日生検)を含む試験セットの異なる亜集団及び臨床シナリオで確認された(表11を参照)。
【0281】
従来の多項ロジスティック回帰と比較した機械学習モデルの性能
機械学習モデルの性能を多項ロジスティック回帰と比較し、機械学習モデル、特にツリーベースのモデル(例えばランダムフォレスト)が古典的な多項ロジスティック回帰モデルよりも優れていることを確認した(表2)。
【0282】
結果のロバスト性を確認するための追加の分析
仮想生検システムのロバスト性は、組織学的病変スコアに人工誤差を生成して、本発明者らのアンサンブルモデルの劇的な変化を観察することによって、試験セットに対して評価した。出願人は、アウトカム指標(1ステップ当たりの平均でそれぞれ7.64%、6.87%、7.22%)での増分的に発生した誤差が、分類器の性能の急激で一定の低下を伴うことを確認した。
【0283】
考察
世界中の17のセンターからの腎移植生検のこの大規模な国際コホート研究において、本発明者らは、組織学的病変を予測するために非侵襲的で日常的に収集されるドナーパラメータを使用する新規な仮想生検システムを導出し、検証した。予測性能を最大化するために、機械学習方法のアンサンブルを用いて仮想生検システムを開発した。全体として、それは、様々な領域及び臨床シナリオにおいて良好な識別、較正、ロバスト性及び一般化可能性を示した。特に、仮想生検システムは、病変の存在を予測する(バイナリ分類)だけでなく、腎臓同種移植片のスペクトルを予測し(マルチクラス分類)、より完全な臨床解釈を促進する。
【0284】
過去10年間にわたって、併存症を有する高齢ドナーからの腎臓の使用は腎臓のプールを拡大させ、提供された腎臓の病理学的検査が臓器の質をより良好に特徴付けるのに役立ち得るか、又は臓器の割り当ての非効率性を促進し得るかという疑問が提起されている。更に、多くの施設は、冷虚血時間を増加させ得る侵襲的で時間のかかる処置のままであるので、0日目の生検を実施することを推奨していない。
【0285】
本出願人は、仮想生検システムが多くの潜在的な影響を有すると考えている。
【0286】
第1に、この仮想生検システムは、ドナーから遺伝する可能性がある移植後病変を評価し、状況を把握するために医師を支援することができる。これは、慢性病変が免疫抑制毒性又はドナーから作り出されるかどうかを評価することによって精密医療及び患者モニタリングを強化することができる。
【0287】
第2に、選択バイアスを回避するために、ベースライン特性だけでなく腎臓ドナーの慢性病変も使用して移植時の患者のランダム化を改善するのを助けることによって、臨床試験にとって魅力的であり得る。更に、新しい治療の有効性は、線維症及び動脈硬化症などの慢性病変を見出すことができるプロトコル生検に基づくことが非常に多い。抗体媒介性拒絶又は免疫抑制毒性がそれらの病変を誘発し得るので、それらの起源(それらがドナーから遺伝したか、又は治療無効の結果から遺伝したか)を知ることは、結果の誤った解釈及び潜在的な有用な治療の喪失を回避するために重要である。
【0288】
第3に、計算能力及び巨大なデジタル化された病歴記録の急速な改善により、多くの研究者は、機械学習を使用して未知の医療分野を精査するための統合的アプローチを試みるようになったが、医療専門家にとって現実にこれらのツールにアプローチすることは依然として困難である。したがって、本発明者らが臨床医を支援して適用性を強化するために生成した使いやすいオンラインアプリケーションは、この学際的研究の不可欠な側面である。
【0289】
最後に、機械学習アルゴリズムの力で生検結果を予測するために日常的にアクセス可能なドナーパラメータを使用する仮想生検システムの概念は、他の医療分野で容易に交差受精させることができ、患者の予後の解釈を高めるために特定の病変を予測する必要性は同等である。
【0290】
制限
本研究には幾つかの制限がある。第1に、順序日ゼロ組織学的病変、動脈硬化症(cv)、細動脈硝子化(ah)、並びに間質性線維症及び尿細管萎縮(IFTA)は、本発明者らのデータセットにおいて不均衡である。これは実生活では一般的であるが、その結果、モデルは、最も代表されるクラス(より低い組織学的病変スコア)を最も代表されないクラス(より高い組織学的病変スコア)よりも正確に予測するより強い力を有する。これを可能な限り最良に回避するために、本出願人は、マイナークラスをランダムに再サンプリングするアップサンプリング法を使用して、マイナークラスを予測する力を増幅して、メジャー病変クラスとマイナー病変クラスのバランスを均等にした。更に、アップサンプリング法は交差検証のオーバーフィッティングを行うが、これは試験セットの最終的な識別には無視できる程度にしか影響しない。最後に、本出願人のアンサンブルモデルは複雑であり、再生に数十時間を必要とする場合がある。しかしながら、オンラインアプリケーションは、仮想生検のリアルタイム評価を提供する。
【0291】
結論
要約すると、本出願人は、移植時に容易にアクセス可能なドナーパラメータを使用する機械学習ベースの仮想腎同種移植生検システムを初めて導出した。仮想生検システムは、17の地理的に異なるセンター及び多くの臨床シナリオにおいて正確な性能及びロバスト性を実証する。このシステムは、ゼロ日の生検結果の信頼できる推定を臨床医に提供することができ、侵襲的で時間のかかる処置のコストを削減し、更なる生検の解釈及び患者管理を導くのに役立つ。
【0292】
付録
付録では、前に引用した様々な表を詳述する。
【表1】
【表2】
【表3】
【表4】
【表5】
【表6】
【表7】
【表8】
【表9】
【表10】
【表11】
【表12】
【表13】
【表14】
【表15】
【表16】
【表17】
【国際調査報告】