IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ジェネンテック, インコーポレイテッドの特許一覧

特許7553467深層学習を用いた病理組織学的画像における卵巣毒性評価
<>
  • 特許-深層学習を用いた病理組織学的画像における卵巣毒性評価 図1
  • 特許-深層学習を用いた病理組織学的画像における卵巣毒性評価 図2
  • 特許-深層学習を用いた病理組織学的画像における卵巣毒性評価 図3
  • 特許-深層学習を用いた病理組織学的画像における卵巣毒性評価 図4
  • 特許-深層学習を用いた病理組織学的画像における卵巣毒性評価 図5
  • 特許-深層学習を用いた病理組織学的画像における卵巣毒性評価 図6
  • 特許-深層学習を用いた病理組織学的画像における卵巣毒性評価 図7
  • 特許-深層学習を用いた病理組織学的画像における卵巣毒性評価 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-09
(45)【発行日】2024-09-18
(54)【発明の名称】深層学習を用いた病理組織学的画像における卵巣毒性評価
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240910BHJP
   G01N 33/48 20060101ALI20240910BHJP
   G01N 33/483 20060101ALI20240910BHJP
【FI】
G06T7/00 350C
G06T7/00 630
G01N33/48 P
G01N33/483 C
【請求項の数】 47
(21)【出願番号】P 2021560893
(86)(22)【出願日】2020-04-14
(65)【公表番号】
(43)【公表日】2022-06-20
(86)【国際出願番号】 US2020028100
(87)【国際公開番号】W WO2020214580
(87)【国際公開日】2020-10-22
【審査請求日】2023-04-11
(31)【優先権主張番号】62/834,237
(32)【優先日】2019-04-15
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】509012625
【氏名又は名称】ジェネンテック, インコーポレイテッド
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】フー, ファン-ヤオ
【審査官】佐藤 実
(56)【参考文献】
【文献】Charlotte Sonigo et al.,High-throughput ovarian follicle counting by an innovative deep learning approach,Scientific Reports,2018年09月10日,volume 8,https://www.nature.com/articles/s41598-018-31883-8
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G01N 33/48
G01N 33/483
(57)【特許請求の範囲】
【請求項1】
ある量の化合物によって処理された1つ以上の卵巣から組織スライスの画像のセットを取得することと、
損失関数の少なくとも一部として焦点損失を使用する1段階検出器として構築されたニューラルネットワークモデルに前記画像のセットを入力することと、
前記ニューラルネットワークモデルを使用して、黄体(CL)として識別される前記画像のセット内の1つ以上のオブジェクトの周りの境界ボックスの座標を予測することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された前記座標に基づいて前記CLとして識別された前記1つ以上のオブジェクトの周りに前記境界ボックスを有する前記画像のセットを出力することと、
記ニューラルネットワークから出力された前記画像のセット内の前記境界ボックスをカウントし、前記卵巣のCLカウントを取得することと、
前記卵巣についての前記CLカウントに基づいて、前記ある量の化合物の卵巣毒性を判定することと、を含む、方法。
【請求項2】
前記組織スライスがヘマトキシリン・エオシン(H&E)によって染色される、請求項1に記載の方法。
【請求項3】
さらに、
前記1つ以上の卵巣から前記組織スライスを取得することと、
前記組織スライスを複数のスライド上に載置することと、
前記複数のスライドをヘマトキシリン・エオシン(H&E)染色剤によって処理することと、
前記複数のスライドの各スライドを撮像装置によって撮像して、前記組織スライスの前記画像のセットを生成することと、を含む、請求項1または2に記載の方法。
【請求項4】
前記1つ以上の卵巣が、複数の卵巣であり、前記画像のセットが、前記複数の卵巣の各卵巣からの組織スライスの少なくとも1つの画像を含む、請求項1、2または3に記載の方法。
【請求項5】
前記1つ以上の卵巣が、1つ以上の被験体からのものである、請求項1、2、3または4に記載の方法。
【請求項6】
前記ニューラルネットワークモデルが、シングルショットマルチボックス検出器(SSD)アーキテクチャ、ユー・オンリー・ルック・ワンス(YOLO)アーキテクチャ、およびRetinaNetアーキテクチャからなる群から選択されたモデルアーキテクチャに基づいて構築される、請求項1、2、3、4または5に記載の方法。
【請求項7】
前記ニューラルネットワークモデルが、訓練データのセットを使用して訓練された複数のパラメータを含み、前記訓練データのセットが、
卵巣からの組織切片のH&E染色スライドの複数の画像の訓練セットであって、前記複数の画像の訓練セットからの画像の各訓練セットが、複数の異なる被験体のうちの1つからのものであり、前記複数の異なる被験体が、(i)同じまたは異なる化合物によって処理されている、(ii)前記同じまたは異なる化合物によって処理されていない、または(iii)それらの組み合わせである、複数の画像の訓練セットと、
複数の境界ボックスのセットであって、各境界ボックスが、前記複数の画像の訓練セットからの画像のうちの1つにおいて識別された前記CLに関連する、複数の境界ボックスのセットと、を含み、
前記損失関数が、前記パラメータおよび前記複数の画像の訓練セットを前記複数の境界ボックスのセットに関連させ、前記焦点損失が、前記複数の画像の訓練セット内の非CL形態または背景についての訓練中に予測された境界ボックスをダウンウェイトし、前記CLについて予測された境界ボックスに訓練を集中させる、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記複数の画像の訓練セットのうちの少なくとも1つの画像の訓練セットが、前記少なくとも1つの画像の訓練セット内の画像の複数の色チャネルのそれぞれについての画像平均の差に従って訓練に使用される前に調整され、前記画像平均の差が、前記複数の画像の訓練セットのうちの別の画像の訓練セットに対して計算される、請求項7に記載の方法。
【請求項9】
前記画像の複数の色チャネルのそれぞれについての前記画像平均が、前記少なくとも1つの画像の訓練セット内の画像にわたる前記色チャネルの平均値として計算される、請求項8に記載の方法。
【請求項10】
前記ニューラルネットワークモデルを使用して、前記画像のセット内の前記1つ以上のオブジェクトを前記CLであると識別することをさらに含み、前記識別することが、前記CLとして識別される前記1つ以上のオブジェクトのうちの各オブジェクトについての確率スコアを生成することを含み、前記カウントすることが、前記CLとして識別され、且つ所定の確率スコア閾値よりも大きい確率スコアを有する前記1つ以上のオブジェクトの周りの前記画像のセット内の前記境界ボックスをカウントすることのみを含む、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記卵巣毒性を判定することが、前記卵巣についての前記CLカウントを所定の毒性閾値と比較することと、前記CLカウントが前記所定の毒性閾値を上回る場合、前記ある量の化合物が前記卵巣に対して毒性でないと判定することと、前記CLカウントが前記所定の毒性閾値以下である場合、前記ある量の化合物が前記卵巣に対して毒性であると判定することと、を含む、請求項1から10のいずれか一項に記載の方法。
【請求項12】
前記組織スライスの前記画像のセットが、前記ある量の化合物によって処理された被験体の卵巣から取得され、前記方法が、
前記ある量の化合物によって処理された前記被験体の別の卵巣から組織スライスの別の画像のセットを取得することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された座標に基づいて、前記別の画像のセット内の前記CLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りに境界ボックスを有する前記別の画像のセットを生成することと、
記ニューラルネットワークから出力された前記別の画像のセット内の前記境界ボックスをカウントし、前記別の卵巣の別のCLカウントを取得することと、
前記卵巣についての前記CLカウントおよび前記別の卵巣についての前記別のCLカウントを平均化し、平均CLカウントを取得することと、をさらに含み、
前記ある量の化合物の前記卵巣毒性が前記平均CLに基づいて判定される、請求項1から11のいずれか一項に記載の方法。
【請求項13】
未処理のまたは異なる量の前記化合物によって処理されたかのいずれかである1つ以上の他の卵巣から組織スライスの別の画像のセットを取得することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された座標に基づいて、前記別の画像のセット内の前記CLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りに境界ボックスを有する前記別の画像のセットを生成することと、
記ニューラルネットワークから出力された前記別の画像のセット内の前記境界ボックスをカウントし、前記卵巣の別のCLカウントを取得することと、をさらに含み、
前記ある量または前記異なる量の化合物の前記卵巣毒性が、前記1つ以上の卵巣についての前記CLカウントと前記1つ以上の他の卵巣についての前記別のCLカウントとの間の傾向に基づいて判定される、請求項1から12のいずれか一項に記載の方法。
【請求項14】
ある量の異なる化合物によって処理された1つ以上の他の卵巣から組織スライスの別の画像のセットを取得することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された座標に基づいて、前記別の画像のセット内の前記CLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りに境界ボックスを有する前記別の画像のセットを生成することと、
記ニューラルネットワークから出力された前記別の画像のセット内の前記境界ボックスをカウントし、前記別の被験体の前記卵巣についての別のCLカウントを取得することと、
前記1つ以上の他の卵巣についての前記CLカウントに基づいて、前記ある量の異なる化合物の卵巣毒性を判定することと、を含む、請求項1から12のいずれか一項に記載の方法。
【請求項15】
前記画像のセットに、前記CLとして識別される前記オブジェクトのうちの各オブジェクトの周りの前記境界ボックス、前記1つ以上の卵巣についての前記CLカウント、前記ある量の化合物の前記卵巣毒性、またはそれらの任意の組み合わせを付与することをさらに含む、請求項1から14のいずれか一項に記載の方法。
【請求項16】
前記ある量の化合物の前記卵巣毒性に基づいて前記化合物による処理を施すことをさらに含む、請求項15に記載の方法。
【請求項17】
前記ある量の化合物の前記卵巣毒性に基づいて前記化合物を製造することまたは製造したことをさらに含む、請求項15に記載の方法。
【請求項18】
1つ以上のデータプロセッサに、動作を実行させるように構成された命令を含むコンピュータプログラムであって、前記動作が、
ある量の化合物によって処理された1つ以上の卵巣から組織スライスの画像のセットを取得することと、
損失関数の少なくとも一部として焦点損失を使用する1段階検出器として構築されたニューラルネットワークモデルに前記画像のセットを入力することと、
前記ニューラルネットワークモデルを使用して、黄体(CL)として識別される前記画像のセット内の1つ以上のオブジェクトの周りの境界ボックスの座標を予測することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された前記座標に基づいて前記CLとして識別された前記1つ以上のオブジェクトの周りに前記境界ボックスを有する前記画像のセットを出力することと、
記ニューラルネットワークから出力された前記画像のセット内の前記境界ボックスをカウントし、前記卵巣のCLカウントを取得することと、
前記卵巣についての前記CLカウントに基づいて、前記ある量の化合物の卵巣毒性を判定することと、を含む、コンピュータプログラム。
【請求項19】
前記組織スライスがヘマトキシリン・エオシン(H&E)によって染色される、請求項18に記載のコンピュータプログラム。
【請求項20】
前記動作が、
前記1つ以上の卵巣から前記組織スライスを取得することと、
前記組織スライスを複数のスライド上に載置することと、
前記複数のスライドをヘマトキシリン・エオシン(H&E)染色剤によって処理することと、
前記複数のスライドの各スライドを撮像装置によって撮像して、前記組織スライスの前記画像のセットを生成することと、をさらに含む、請求項18または19に記載のコンピュータプログラム。
【請求項21】
前記1つ以上の卵巣が、複数の卵巣であり、前記画像のセットが、前記複数の卵巣の各卵巣からの組織スライスの少なくとも1つの画像を含む、請求項18、19または20に記載のコンピュータプログラム。
【請求項22】
前記1つ以上の卵巣が、1つ以上の被験体からのものである、請求項18、19、20または21に記載のコンピュータプログラム。
【請求項23】
前記ニューラルネットワークモデルが、シングルショットマルチボックス検出器(SSD)アーキテクチャ、ユー・オンリー・ルック・ワンス(YOLO)アーキテクチャ、およびRetinaNetアーキテクチャからなる群から選択されたモデルアーキテクチャに基づいて構築される、請求項18、19、20、21または22に記載のコンピュータプログラム。
【請求項24】
前記ニューラルネットワークモデルが、訓練データのセットを使用して訓練された複数のパラメータを含み、前記訓練データのセットが、
卵巣からの組織切片のH&E染色スライドの複数の画像の訓練セットであって、前記複数の画像の訓練セットからの画像の各訓練セットが、複数の異なる被験体のうちの1つからのものであり、前記複数の異なる被験体が、(i)同じまたは異なる化合物によって処理されている、(ii)前記同じまたは異なる化合物によって処理されていない、または(iii)それらの組み合わせである、複数の画像の訓練セットと、
複数の境界ボックスのセットであって、各境界ボックスが、前記複数の画像の訓練セットからの画像のうちの1つにおいて識別された前記CLに関連する、複数の境界ボックスのセットと、を含み、
前記損失関数が、前記パラメータおよび前記複数の画像の訓練セットを前記複数の境界ボックスのセットに関連させ、前記焦点損失が、前記複数の画像の訓練セット内の非CL形態または背景についての訓練中に予測された境界ボックスをダウンウェイトし、前記CLについて予測された境界ボックスに訓練を集中させる、請求項18から23のいずれか一項に記載のコンピュータプログラム。
【請求項25】
前記複数の画像の訓練セットのうちの少なくとも1つの画像の訓練セットが、前記少なくとも1つの画像の訓練セット内の画像の複数の色チャネルのそれぞれについての画像平均の差に従って訓練に使用される前に調整され、前記画像平均の差が、前記複数の画像の訓練セットのうちの別の画像の訓練セットに対して計算される、請求項24に記載のコンピュータプログラム。
【請求項26】
前記画像の複数の色チャネルのそれぞれについての前記画像平均が、前記少なくとも1つの画像の訓練セット内の画像にわたる前記色チャネルの平均値として計算される、請求項25に記載のコンピュータプログラム。
【請求項27】
前記動作が、前記ニューラルネットワークモデルによって、前記画像のセット内の前記1つ以上のオブジェクトを前記CLであると識別することをさらに含み、前記識別することが、前記CLとして識別される前記1つ以上のオブジェクトのうちの各オブジェクトについての確率スコアを生成することを含み、前記カウントすることが、前記CLとして識別され、且つ所定の確率スコア閾値よりも大きい確率スコアを有する前記1つ以上のオブジェクトの周りの前記画像のセット内の前記境界ボックスをカウントすることのみを含む、請求項18から26のいずれか一項に記載のコンピュータプログラム。
【請求項28】
前記卵巣毒性を判定することが、前記卵巣についての前記CLカウントを所定の毒性閾値と比較することと、前記CLカウントが前記所定の毒性閾値を上回る場合、前記ある量の化合物が前記卵巣に対して毒性でないと判定することと、前記CLカウントが前記所定の毒性閾値以下である場合、前記ある量の化合物が前記卵巣に対して毒性であると判定することと、を含む、請求項18から27のいずれか一項に記載のコンピュータプログラム。
【請求項29】
前記組織スライスの前記画像のセットが、前記ある量の化合物によって処理された被験体の卵巣から取得され、前記動作が、
前記ある量の化合物によって処理された前記被験体の別の卵巣から組織スライスの別の画像のセットを取得することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された座標に基づいて、前記別の画像のセット内の前記CLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りに境界ボックスを有する前記別の画像のセットを生成することと、
記ニューラルネットワークから出力された前記別の画像のセット内の前記境界ボックスをカウントし、前記別の卵巣の別のCLカウントを取得することと、
前記卵巣についての前記CLカウントおよび前記別の卵巣についての前記別のCLカウントを平均化し、平均CLカウントを取得することと、をさらに含み、
前記ある量の化合物の前記卵巣毒性が前記平均CLに基づいて判定される、請求項18から28のいずれか一項に記載のコンピュータプログラム。
【請求項30】
前記動作が、
未処理のまたは異なる量の前記化合物によって処理されたかのいずれかである1つ以上の他の卵巣から組織スライスの別の画像のセットを取得することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された座標に基づいて、前記別の画像のセット内の前記CLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りに境界ボックスを有する前記別の画像のセットを生成することと、
記ニューラルネットワークから出力された前記別の画像のセット内の前記境界ボックスをカウントし、前記卵巣の別のCLカウントを取得することと、をさらに含み、
前記ある量または前記異なる量の化合物の前記卵巣毒性が、前記1つ以上の卵巣についての前記CLカウントと前記1つ以上の他の卵巣についての前記別のCLカウントとの間の傾向に基づいて判定される、請求項18から28のいずれか一項に記載のコンピュータプログラム。
【請求項31】
前記動作が、
ある量の異なる化合物によって処理された1つ以上の他の卵巣から組織スライスの別の画像のセットを取得することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された座標に基づいて、前記別の画像のセット内の前記CLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りに境界ボックスを有する前記別の画像のセットを生成することと、
記ニューラルネットワークから出力された前記別の画像のセット内の前記境界ボックスをカウントし、前記別の被験体の前記卵巣についての別のCLカウントを取得することと、
前記1つ以上の他の卵巣についての前記CLカウントに基づいて、前記ある量の異なる化合物の卵巣毒性を判定することと、をさらに含む、請求項18から28のいずれか一項に記載のコンピュータプログラム。
【請求項32】
前記動作が、前記画像のセットに、前記CLとして識別される前記オブジェクトのうちの各オブジェクトの周りの前記境界ボックス、前記1つ以上の卵巣についての前記CLカウント、前記ある量の化合物の前記卵巣毒性、またはそれらの任意の組み合わせを付与することをさらに含む、請求項18から31のいずれか一項に記載のコンピュータプログラム。
【請求項33】
1つ以上のデータプロセッサと、
前記1つ以上のデータプロセッサ上で実行されると、前記1つ以上のデータプロセッサに、動作を実行させる命令を含む非一時的コンピュータ可読記憶媒体と、を備え、前記動作が、
ある量の化合物によって処理された1つ以上の卵巣から組織スライスの画像のセットを取得することと、
損失関数の少なくとも一部として焦点損失を使用する1段階検出器として構築されたニューラルネットワークモデルに前記画像のセットを入力することと、
前記ニューラルネットワークモデルを使用して、1つ以上のオブジェクトの分類に基づいて黄体(CL)として識別される前記画像のセット内の前記オブジェクトの周りの境界ボックスの座標を予測することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された前記座標に基づいて前記CLとして識別された前記1つ以上のオブジェクトの周りに前記境界ボックスを有する前記画像のセットを出力することと、
記ニューラルネットワークから出力された前記画像のセット内の前記境界ボックスをカウントし、前記卵巣のCLカウントを取得することと、
前記卵巣についての前記CLカウントに基づいて、前記ある量の化合物の卵巣毒性を判定することと、を含む、システム。
【請求項34】
前記組織スライスがヘマトキシリン・エオシン(H&E)によって染色される、請求項33に記載のシステム。
【請求項35】
前記動作が、
前記1つ以上の卵巣から前記組織スライスを取得することと、
前記組織スライスを複数のスライド上に載置することと、
前記複数のスライドをヘマトキシリン・エオシン(H&E)染色剤によって処理することと、
前記複数のスライドの各スライドを撮像装置によって撮像して、前記組織スライスの前記画像のセットを生成することと、をさらに含む、請求項33または34に記載のシステム。
【請求項36】
前記1つ以上の卵巣が、複数の卵巣であり、前記画像のセットが、前記複数の卵巣の各卵巣からの組織スライスの少なくとも1つの画像を含む、請求項33、34または35に記載のシステム。
【請求項37】
前記1つ以上の卵巣が、1つ以上の被験体からのものである、請求項33、34、35または36に記載のシステム。
【請求項38】
前記ニューラルネットワークモデルが、シングルショットマルチボックス検出器(SSD)アーキテクチャ、ユー・オンリー・ルック・ワンス(YOLO)アーキテクチャ、およびRetinaNetアーキテクチャからなる群から選択されたモデルアーキテクチャに基づいて構築される、請求項33、34、35、36または37に記載のシステム。
【請求項39】
前記ニューラルネットワークモデルが、訓練データのセットを使用して訓練された複数のパラメータを含み、前記訓練データのセットが、
卵巣からの組織切片のH&E染色スライドの複数の画像の訓練セットであって、前記複数の画像の訓練セットからの画像の各訓練セットが、複数の異なる被験体のうちの1つからのものであり、前記複数の異なる被験体が、(i)同じまたは異なる化合物によって処理されている、(ii)前記同じまたは異なる化合物によって処理されていない、または(iii)それらの組み合わせである、複数の画像の訓練セットと、
複数の境界ボックスのセットであって、各境界ボックスが、前記複数の画像の訓練セットからの画像のうちの1つにおいて識別された前記CLに関連する、複数の境界ボックスのセットと、を含み、
前記損失関数が、前記パラメータおよび前記複数の画像の訓練セットを前記複数の境界ボックスのセットに関連させ、前記焦点損失が、前記複数の画像の訓練セット内の非CL形態または背景についての訓練中に予測された境界ボックスをダウンウェイトし、前記CLについて予測された境界ボックスに訓練を集中させる、請求項33から38のいずれか一項に記載のシステム。
【請求項40】
前記複数の画像の訓練セットのうちの少なくとも1つの画像の訓練セットが、前記少なくとも1つの画像の訓練セット内の画像の複数の色チャネルのそれぞれについての画像平均の差に従って訓練に使用される前に調整され、前記画像平均の差が、前記複数の画像の訓練セットのうちの別の画像の訓練セットに対して計算される、請求項39に記載のシステム。
【請求項41】
前記画像の複数の色チャネルのそれぞれについての前記画像平均が、前記少なくとも1つの画像の訓練セット内の画像にわたる前記色チャネルの平均値として計算される、請求項40に記載のシステム。
【請求項42】
前記動作が、前記ニューラルネットワークモデルによって、前記画像のセット内の前記1つ以上のオブジェクトを前記CLであると識別することをさらに含み、前記識別することが、前記CLとして識別される前記1つ以上のオブジェクトのうちの各オブジェクトについての確率スコアを生成することを含み、前記カウントすることが、前記CLとして識別され、且つ所定の確率スコア閾値よりも大きい確率スコアを有する前記1つ以上のオブジェクトの周りの前記画像のセット内の前記境界ボックスをカウントすることのみを含む、請求項33から41のいずれか一項に記載のシステム。
【請求項43】
前記卵巣毒性を判定することが、前記卵巣についての前記CLカウントを所定の毒性閾値と比較することと、前記CLカウントが前記所定の毒性閾値を上回る場合、前記ある量の化合物が前記卵巣に対して毒性でないと判定することと、前記CLカウントが前記所定の毒性閾値以下である場合、前記ある量の化合物が前記卵巣に対して毒性であると判定することと、を含む、請求項33から42のいずれか一項に記載のシステム。
【請求項44】
前記組織スライスの前記画像のセットが、前記ある量の化合物によって処理された被験体の卵巣から取得され、前記動作が、
前記ある量の化合物によって処理された前記被験体の別の卵巣から組織スライスの別の画像のセットを取得することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された座標に基づいて、前記別の画像のセット内の前記CLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りに境界ボックスを有する前記別の画像のセットを生成することと、
記ニューラルネットワークから出力された前記別の画像のセット内の前記境界ボックスをカウントし、前記別の卵巣の別のCLカウントを取得することと、
前記卵巣についての前記CLカウントおよび前記別の卵巣についての前記別のCLカウントを平均化し、平均CLカウントを取得することと、をさらに含み、
前記ある量の化合物の前記卵巣毒性が前記平均CLに基づいて判定される、請求項33から43のいずれか一項に記載のシステム。
【請求項45】
前記動作が、
未処理のまたは異なる量の前記化合物によって処理されたかのいずれかである1つ以上の他の卵巣から組織スライスの別の画像のセットを取得することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された座標に基づいて、前記別の画像のセット内の前記CLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りに境界ボックスを有する前記別の画像のセットを生成することと、
記ニューラルネットワークから出力された前記別の画像のセット内の前記境界ボックスをカウントし、前記卵巣の別のCLカウントを取得することと、をさらに含み、
前記ある量または前記異なる量の化合物の前記卵巣毒性が、前記1つ以上の卵巣についての前記CLカウントと前記卵巣についての前記別のCLカウントとの間の傾向に基づいて判定される、請求項33から43のいずれか一項に記載のシステム。
【請求項46】
前記動作が、
ある量の異なる化合物によって処理された1つ以上の他の卵巣から組織スライスの別の画像のセットを取得することと、
前記ニューラルネットワークモデルを使用して、前記境界ボックスについて予測された座標に基づいて、前記別の画像のセット内の前記CLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りに境界ボックスを有する前記別の画像のセットを生成することと、
記ニューラルネットワークから出力された前記別の画像のセット内の前記境界ボックスをカウントし、前記別の被験体の前記卵巣についての別のCLカウントを取得することと、
前記1つ以上の他の卵巣についての前記CLカウントに基づいて、前記ある量の異なる化合物の卵巣毒性を判定することと、をさらに含む、請求項33から43のいずれか一項に記載のシステム。
【請求項47】
前記動作が、前記画像のセットに、前記CLとして識別される前記オブジェクトのうちの各オブジェクトの周りの前記境界ボックス、前記1つ以上の卵巣についての前記CLカウント、前記ある量の化合物の前記卵巣毒性、またはそれらの任意の組み合わせを付与することをさらに含む、請求項33から46のいずれか一項に記載のシステム。
【発明の詳細な説明】
【関連出願の相互参照】
【0001】
本出願は、2019年4月15日に出願された「OVARIAN TOXICITY ASSESSMENT IN HISTOPATHOLOGICAL IMAGES USING DEEP LEARNING」という名称の米国仮出願第62/834,237号の優先権および利益を主張し、その全内容は、あらゆる目的のために参照により本明細書に組み込まれる。
【技術分野】
【0002】
本開示は、卵巣毒性評価に関し、特に、卵巣内の黄体を識別することができる深層学習ニューラルネットワーク、および卵巣内で識別された黄体をカウントし、黄体のカウントに基づいて化合物の卵巣毒性を推測することができるルールベースの技術に関する。
【背景技術】
【0003】
前臨床試験における卵巣病変の識別は、卵母細胞が再生能力を有さず、卵巣の任意の異常が女性の生殖能力の障害に直接関連し得るため、新規治療薬の一般的な安全性評価において重要である。卵巣の病態の識別および卵巣の病態に関する特定の情報の提供は、典型的には、卵巣内の卵胞の定性的および定量的評価を含む。卵巣は複雑な構造であり、その形態は発情周期と共に変化するため、卵巣機能障害の検出は、正常な卵巣形態および発情周期を通じた卵巣形態の変動の完全な理解を必要とする。特に、卵胞の成長およびそれらの退行、ならびに視床下部-下垂体-性腺制御系の知識は、卵巣の異常の評価に不可欠である。
【0004】
卵巣内の始原生殖細胞は、胎児発達中に増殖する。出生時に、卵巣は、一次卵母細胞を含有する数千個の原始卵胞を含有する。これらの一次卵母細胞は、それ以上の有糸分裂を受けず、それらは、性的成熟まで、減数分裂Iの初期段階に停止したままである。性的成熟において、脳下垂体によって産生される2つのホルモン:卵胞刺激ホルモン(FSH)および黄体形成ホルモン(LH)は、これらの原始卵胞を発達させる。各発情周期において、いくつかの原始卵胞が活性化されて成熟を開始する。しかしながら、全ての卵胞が完全に成熟するわけではなく、残りは卵巣の内分泌機能に寄与する。活性化されると、第1の減数分裂が完了し、一次卵胞が成熟して二次卵胞になる。次いで、第2の分裂が開始し、グラフィア卵胞が形成される。グラフィア卵胞は、二次卵母細胞を含有する。この第2の分裂は、卵子が受精しない限り完了しない。
【0005】
グラフィア卵胞への始原卵胞の発達および成熟は、エストロゲンが卵胞細胞によって分泌されるため、エストロゲンレベルの増加をもたらす。このエストロゲンレベルの増加は、下垂体にフィードバックし、FSHのさらなる放出を抑制する(負のフィードバック)。卵胞はまた、インヒビンと呼ばれる第2のホルモンを放出し、これもFHSのさらなる産生を抑制する。エストロゲンレベルが上昇するにつれて、これは、LHにおける中周期サージを引き起こし、それにより、グラフィア卵胞を破裂させる(排卵)。LHはまた、破裂したグラフィア卵胞を黄体化させ、黄体(CL)と呼ばれる一時的な内分泌器官を形成する。これは、その色素性ルテイン細胞のために黄色に見える。CLは、プロゲステロンおよびエストロゲンを分泌する。プロゲステロンレベルは、下垂体にフィードバックし、LHのさらなる放出を抑制する。受精が起こらない場合、CLは、白体と呼ばれる小さな白色の線維性瘢痕に変性する。結果として生じるプロゲステロン(およびある程度のエストロゲン)レベルの低下は、月経を促進する。エストロゲンレベルの低下は、下垂体にフィードバックし、対応するFSHの増加があり、再び発情周期を開始する。卵巣の連続切片を使用する定性的および定量的な卵胞分析は、妊孕性および毒物学の双方の評価に受け入れられるが、このアプローチは、非常に面倒で時間がかかる。
【発明の概要】
【0006】
様々な実施形態では、ある量の化合物によって処理された1つ以上の卵巣から組織スライスの画像のセットを取得することと、損失関数の少なくとも一部として焦点損失を使用する1段階検出器として構築されたニューラルネットワークモデルに画像のセットを入力することと、ニューラルネットワークモデルを使用して、CLとして識別される画像のセット内の1つ以上のオブジェクトの周りの境界ボックスの座標を予測することと、ニューラルネットワークモデルを使用して、境界ボックスについて予測された座標に基づいてCLとして識別された1つ以上のオブジェクトの周りに境界ボックスを有する画像のセットを出力することと、深層学習ニューラルネットワークから出力された画像のセット内の境界ボックスをカウントし、卵巣のCLカウントを取得することと、卵巣についてのCLカウントに基づいて、ある量の化合物の卵巣毒性を判定することと、を含む、方法が提供される。
【0007】
いくつかの実施形態では、組織スライスがヘマトキシリン・エオシン(H&E)によって染色される。
【0008】
いくつかの実施形態では、方法は、1つ以上の卵巣から組織スライスを取得することと、組織スライスを複数のスライド上に載置することと、複数のスライドをヘマトキシリン・エオシン(H&E)染色剤によって処理することと、複数のスライドの各スライドを撮像装置によって撮像して、組織スライスの画像のセットを生成することと、をさらに含む。
【0009】
いくつかの実施形態では、1つ以上の卵巣は、複数の卵巣であり、画像のセットは、複数の卵巣の各卵巣からの組織スライスの少なくとも1つの画像を含む。
【0010】
いくつかの実施形態では、1つ以上の卵巣は、1つ以上の被験体からのものである。
【0011】
いくつかの実施形態では、ニューラルネットワークモデルは、シングルショットマルチボックス検出器(SSD)アーキテクチャ、ユー・オンリー・ルック・ワンス(YOLO)アーキテクチャ、およびRetinaNetアーキテクチャからなる群から選択されたモデルアーキテクチャに基づいて構築される。
【0012】
いくつかの実施形態では、ニューラルネットワークモデルは、訓練データのセットを使用して訓練された複数のパラメータを含み、訓練データのセットが、卵巣からの組織切片のH&E染色スライドの画像の複数の訓練セットであって、複数の画像の訓練セットからの画像の各訓練セットが、複数の異なる被験体のうちの1つからのものであり、複数の異なる被験体が、(i)同じまたは異なる化合物によって処理されている、(ii)同じまたは異なる化合物によって処理されていない、または(iii)それらの組み合わせを含む、複数の画像の訓練セットと、境界ボックスの複数のセットであって、各境界ボックスが、複数の画像の訓練セットからの画像のうちの1つにおいて識別されたCLに関連し、損失関数が、パラメータおよび複数の画像の訓練セットを複数の境界ボックスのセットに関連させ、焦点損失が、複数の画像の訓練セット内の非CL形態または背景についての訓練中に予測された境界ボックスをダウンウェイトし、CLについて予測された境界ボックスに訓練を集中させる、境界ボックスの複数のセットと、を含む。
【0013】
いくつかの実施形態では、複数の画像の訓練セットのうちの少なくとも1つの画像の訓練セットは、少なくとも1つの画像の訓練セット内の画像の複数の色チャネルのそれぞれについての画像平均の差に従って訓練に使用される前に調整され、画像平均の差は、複数の画像の訓練セットのうちの別の画像の訓練セットに対して計算される。
【0014】
いくつかの実施形態では、画像の複数の色チャネルのそれぞれについての画像平均は、少なくとも1つの画像の訓練セット内の画像にわたる色チャネルの平均値として計算される。
【0015】
いくつかの実施形態では、方法は、ニューラルネットワークモデルを使用して、画像のセット内の1つ以上のオブジェクトをCLであると識別することをさらに含み、識別することは、CLとして識別された1つ以上のオブジェクトのうちの各オブジェクトについての確率スコアを生成することを含み、カウントすることは、CLとして識別され、且つ所定の確率スコア閾値よりも大きい確率スコアを有する1つ以上のオブジェクトの周りの画像のセット内の境界ボックスをカウントすることのみを含む。
【0016】
いくつかの実施形態では、卵巣毒性を判定することは、卵巣についてのCLカウントを所定の毒性閾値と比較することと、CLカウントが所定の毒性閾値を上回る場合、ある量の化合物が卵巣に対して毒性でないと判定することと、CLカウントが所定の毒性閾値以下である場合、ある量の化合物が卵巣に対して毒性であると判定することと、を含む。
【0017】
いくつかの実施形態では、組織スライスの画像のセットは、ある量の化合物によって処理された被験体の卵巣から取得され、方法は、ある量の化合物によって処理された被験体の別の卵巣から組織スライスの別の画像のセットを取得することと、ニューラルネットワークモデルを使用して、境界ボックスについて予測された座標に基づいて、別の画像のセット内のCLとして識別されるオブジェクトのうちの各オブジェクトの周りに境界ボックスを有する別の画像のセットを生成することと、深層学習ニューラルネットワークから出力された別の画像のセット内の境界ボックスをカウントし、別の卵巣の別のCLカウントを取得することと、卵巣についてのCLカウントおよび別の卵巣についての別のCLカウントを平均化し、平均CLカウントを取得することと、をさらに含み、ある量の化合物の卵巣毒性が平均CLに基づいて判定される。
【0018】
いくつかの実施形態では、方法は、未処理のまたは異なる量の化合物によって処理された1つ以上の他の卵巣から組織スライスの別の画像のセットを取得することと、ニューラルネットワークモデルを使用して、境界ボックスについて予測された座標に基づいて、別の画像のセット内のCLとして識別されるオブジェクトのうちの各オブジェクトの周りに境界ボックスを有する別の画像のセットを生成することと、深層学習ニューラルネットワークから出力された別の画像のセット内の境界ボックスをカウントし、卵巣の別のCLカウントを取得することと、をさらに含み、ある量または異なる量の化合物の卵巣毒性が、1つ以上の卵巣についてのCLカウントと1つ以上の他の卵巣についての別のCLカウントとの間の傾向に基づいて判定される。
【0019】
いくつかの実施形態では、方法は、ある量の異なる化合物によって処理された1つ以上の他の卵巣から組織スライスの別の画像のセットを取得することと、ニューラルネットワークモデルを使用して、境界ボックスについて予測された座標に基づいて、別の画像のセット内のCLとして識別されるオブジェクトのうちの各オブジェクトの周りに境界ボックスを有する別の画像のセットを生成することと、深層学習ニューラルネットワークから出力された別の画像のセット内の境界ボックスをカウントし、別の被験体の卵巣についての別のCLカウントを取得することと、1つ以上の他の卵巣についてのCLカウントに基づいて、ある量の異なる化合物の卵巣毒性を判定することと、をさらに含む。
【0020】
いくつかの実施形態では、方法は、CLとして識別されるオブジェクトのうちの各オブジェクトの周りの境界ボックス、1つ以上の卵巣についてのCLカウント、ある量の化合物の卵巣毒性、またはそれらの任意の組み合わせを有する画像のセットを提供することをさらに含む。
【0021】
いくつかの実施形態では、方法は、ある量の化合物の卵巣毒性に基づいて化合物による処理を施すことをさらに含む。
【0022】
いくつかの実施形態では、方法は、ある量の化合物の卵巣毒性に基づいて化合物を製造することまたは製造したことをさらに含む。
【0023】
いくつかの実施形態では、1つ以上のデータプロセッサと、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部を実行させる命令を含む非一時的コンピュータ可読記憶媒体と、を含む、システムが提供される。
【0024】
いくつかの実施形態では、非一時的機械可読記憶媒体に有形に具現化され、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部を実行させるように構成された命令を含むコンピュータプログラム製品が提供される。
【0025】
本開示のいくつかの実施形態は、1つ以上のデータプロセッサを含むシステムを含む。いくつかの実施形態では、システムは、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させる命令を含む非一時的コンピュータ可読記憶媒体を含む。本開示のいくつかの実施形態は、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させるように構成された命令を含む、非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品を含む。
【0026】
使用された用語および表現は、限定ではなく説明の用語として使用され、そのような用語および表現の使用において、示されて説明された特徴の均等物またはその一部を除外する意図はないが、特許請求の範囲に記載された発明の範囲内で様々な変更が可能であることが認識される。したがって、特許請求の範囲に記載された本発明は、実施形態および任意の特徴によって具体的に開示されているが、本明細書に開示された概念の変更および変形は、当業者によってあてにされてもよく、そのような変更および変形は、添付の特許請求の範囲によって定義される本発明の範囲内にあると見なされることを理解されたい。
【図面の簡単な説明】
【0027】
本開示は、以下の添付の図面と併せて説明される:
【0028】
図1】様々な実施形態にかかる卵巣毒性評価のための例示的なコンピューティング環境を示している。
【0029】
図2】様々な実施形態にかかるRetinaNetアーキテクチャを表す例示的な概略図を示している。
【0030】
図3】様々な実施形態にかかる卵巣毒性を評価するプロセスを示している。
【0031】
図4】様々な実施形態にかかる、卵巣毒性を検出する例示的な方法および例示的なモデルを示すフローチャートを示している。
【0032】
図5A】様々な実施形態にかかる、訓練された例示的なモデルがCLを正確に検出することができることを示している。
図5B】様々な実施形態にかかる、訓練された例示的なモデルがCLを正確に検出することができることを示している。
図5C】様々な実施形態にかかる、訓練された例示的なモデルがCLを正確に検出することができることを示している。
図5D】様々な実施形態にかかる、訓練された例示的なモデルがCLを正確に検出することができることを示している。
【0033】
図6A】様々な実施形態にかかる、訓練されたモデルからのCLカウントの誤差が病理学者間の変動に類似しており、訓練されたモデルからのCLカウントが病理学者の結果と非常に相関があった例示的なモデルの性能を示している。
図6B】様々な実施形態にかかる、訓練されたモデルからのCLカウントの誤差が病理学者間の変動に類似しており、訓練されたモデルからのCLカウントが病理学者の結果と非常に相関があった例示的なモデルの性能を示している。
図6C】様々な実施形態にかかる、訓練されたモデルからのCLカウントの誤差が病理学者間の変動に類似しており、訓練されたモデルからのCLカウントが病理学者の結果と非常に相関があった例示的なモデルの性能を示している。
図6D】様々な実施形態にかかる、訓練されたモデルからのCLカウントの誤差が病理学者間の変動に類似しており、訓練されたモデルからのCLカウントが病理学者の結果と非常に相関があった例示的なモデルの性能を示している。
【0034】
図7A】様々な実施形態にかかる、CLカウントが卵巣組織面積およびレベルによって影響を受けることを示す例示的な結果を示している。
図7B】様々な実施形態にかかる、CLカウントが卵巣組織面積およびレベルによって影響を受けることを示す例示的な結果を示している。
図7C】様々な実施形態にかかる、CLカウントが卵巣組織面積およびレベルによって影響を受けることを示す例示的な結果を示している。
【0035】
図8A】様々な実施形態にかかる、卵巣毒性を有する組織が、組織面積に対して正規化された有意に低いCLカウントを示したことを示す例示的な結果を示している。
図8B】様々な実施形態にかかる、卵巣毒性を有する組織が、組織面積に対して正規化された有意に低いCLカウントを示したことを示す例示的な結果を示している。
図8C】様々な実施形態にかかる、卵巣毒性を有する組織が、組織面積に対して正規化された有意に低いCLカウントを示したことを示す例示的な結果を示している。
【0036】
添付の図面において、同様の構成要素および/または特徴は、同じ参照ラベルを有することができる。さらに、同じ種類の様々な構成要素は、参照ラベルの後に同様の構成要素を区別するダッシュおよび第2のラベルを続けることによって区別することができる。本明細書において第1の参照ラベルのみが使用される場合、説明は、第2の参照ラベルに関係なく、同じ第1の参照ラベルを有する同様の構成要素のいずれかに適用可能である。
【発明を実施するための形態】
【0037】
I.概要
本開示は、卵巣毒性を評価する技術を記載する。より具体的には、本開示の様々な実施形態は、卵巣内のCLを識別することができる深層学習ニューラルネットワーク、および卵巣内で識別されたCLをカウントし、CLのカウントに基づいて化合物の卵巣毒性を推測することができるルールベースの技術を提供する。
【0038】
動物毒性試験(例えば、マウス試験)における卵巣病理の識別は、新規治療薬の一般的な安全性評価において重要である。いくつかの患者集団では、薬物関連卵巣毒性の耐容性は、患者のリスク/利益に関して慎重に考慮する必要があり、卵巣病理に関する特定の情報は、卵保存および他の生殖補助手順の潜在的必要性などの生殖毒性の臨床管理に情報を提供することができる。
【0039】
一般毒性および妊孕性試験における卵巣の評価のための現在のゴールドスタンダードは、ヘマトキシリン・エオシン(H&E)染色切片の病理学者による組織病理学的検査である。病理学者は、典型的には、CLの有無、卵胞の段階および数を評価し、生殖管の他の器官の組織学的変化との関連で卵巣の病理学的変化を統合する。ラットの約4~6日の短い発情周期を考えると、げっ歯類の卵巣にはかなりの動的な構造的および生理学的不均一性がある。これは、標準的な単一切片評価を使用して明確な試験物関連の効果(例えば、治療候補化合物からの効果)を識別することを困難にする場合がある。
【0040】
反復用量および受精能試験からの単一のH&E切片の卵巣組織病理評価の妥当性を比較する産業横断的共同試験では、CL数の有意な増加および減少の双方が卵巣毒性の証拠として病理学者によって識別された。(Sanbuissho,A.,Yoshida,M.,Hisada,S.,Sagami,F.,Kudo,S.,Kumazawa,T.,Ube,M.,Komatsu,S.,Ohno,Y.,2009.Collaborative work on evaluation of ovarian toxicity by repeated-dose and fertility studies in female rats.J Toxicol Sci 34 Suppl 1,SP1-22)。しかしながら、単一組織切片からのCLの列挙は、サンプリング誤差を被ることが報告されている。(Meredith,S.,Dudenhoeffer,G.,Jackson,K.,1999.Single-section counting error when distinguishing between primordial and early primary follicles in sections of rat ovary of different thickness.J Reprod Fertil 117(2),339-343)。さらに、Bucciらはまた、1%サンプル戦略からの卵胞数がより大きな誤差項を有することを実証した。(Bolon,B.,Bucci,T.J.,Warbritton,A.R.,Chen,J.J.,Mattison,D.R.,Heindel,J.J.,1997.Differential follicle counts as a screen for chemically induced ovarian toxicity in mice:results from continuous breeding bioassays.Fundam Appl Toxicol 39(1),1-10)。さらに、各組織切片で評価される必要がある多数の卵巣構造が組み合わされた単一の試験に含まれる多数の動物を考えると、これらの切片の組織病理学的評価は、時間がかかり、誤差の可能性を有する。単一のH&E切片を用いた試験からのCLの定量化は、卵巣毒性を検出することができるが、限られた試験では、組織学的に検査された切片の切片化位置および数に起因して、卵巣切片化位置または組織面積がCLカウントおよび潜在的な試験品(例えば、治療候補化合物)の解釈に及ぼさない影響が調査されている。この全てを考慮すると、卵巣の完全な形態学的特徴付けのために、CLまたは卵胞を定量化するための立体学または修正された立体学的アプローチが実行されるべきであるが、この種の分析は、病理学者による時間のかかる検査および連続切片の手動注釈を必要とする。
【0041】
これらの制限および問題に対処するために、卵巣毒性を評価するための本明細書に記載の技術は、卵巣の黄体を識別することができる深層学習ニューラルネットワークの使用、および卵巣において識別されたCLをカウントし、CLのカウントに基づいて化合物の卵巣毒性を推測することができるルールベースの技術を含む。本開示の1つの例示的な実施形態は、ある量の化合物によって処理された1つ以上の卵巣から組織スライスの画像のセットを取得することと、損失関数の少なくとも一部として焦点損失を使用する1段階検出器として構築されたニューラルネットワークモデルに画像のセットを入力することと、ニューラルネットワークモデルを使用して、画像のセットの各画像内のオブジェクトを識別することと、ニューラルネットワークモデルを使用して、オブジェクトを識別することに基づいてCLとして識別されるオブジェクトのうちの1つ以上のオブジェクトの周りの境界ボックスの座標を予測することと、ニューラルネットワークモデルを使用して、境界ボックスについて予測された座標に基づいてCLとして分類された1つ以上のオブジェクトのうちの各オブジェクトの周りに境界ボックスを有する画像のセットを出力することと、深層学習ニューラルネットワークから出力された画像のセット内の境界ボックスをカウントし、卵巣のCLカウントを取得することと、卵巣についてのCLカウントに基づいて、ある量の化合物の卵巣毒性を判定することと、を含む、方法に関する。
【0042】
有利には、これらのアプローチは、卵巣のCLを正確に識別し、卵巣毒性を再現可能に検出することができる深層ニューラルネットワークアーキテクチャを提供し、これは、卵巣の連続切片の検査および手動注釈の時間および費用の削減を含む病理学者の作業負荷を潜在的に低減する。さらに、これらのアプローチは、ゴールドスタンダードの病理学者の光学顕微鏡評価と同様の精度で卵巣(例えば、哺乳動物の卵巣)のCLを定量化するためのヘマトキシリン・エオシン染色(H&E染色)切片の自動デジタル画像分析を提供することができる。H&E染色切片を利用することによって、治療候補化合物の日常的なスクリーニングにおいてコストおよび時間遅延を追加するであろう特別な染色の必要性(例えば、CLを強調するためのプロゲステロン/プロラクチン)が回避されることができる。
II.定義
【0043】
本明細書で使用される場合、動作が何かに「基づく」場合、これは、動作が何かの少なくとも一部に少なくとも部分的に基づくことを意味する。
【0044】
本明細書で使用される場合、「実質的に(substantially)」、「およそ(approximately)」、および「約(about)」という用語は、当業者によって理解されるように、大部分が指定されるものであるが、必ずしも完全には指定されないもの(および完全に指定されるものを含む)として定義される。任意の開示された実施形態では、「実質的に」、「およそ」、または「約」という用語は、指定されたものの「[パーセンテージ]以内」で置き換えられることができ、パーセンテージは、0.1、1、5、および10%を含む。
【0045】
本明細書で使用される場合、「被験体」は、1つ以上の細胞、組織、または生物を包含する。被験体は、インビボ、エクスビボ、またはインビトロ、雄性または雌性を問わず、ヒトまたは非ヒトとすることができる。被験体は、ヒト、マウス、またはラットなどの哺乳動物とすることができる。
【0046】
本明細書で使用される場合、「化合物」は、化学的に一体に結合した2つ以上の異なる元素である。化合物は、抗体または薬理学的薬物などの治療候補化合物とすることができる。
III.卵巣毒性の評価技術
【0047】
様々な実施形態では、卵巣毒性の評価は、2つの部分に分けられる。評価の第1の部分は、卵巣のCLを識別するために深層学習ニューラルネットワークを使用することを含む。深層学習ニューラルネットワークは、簡単な例をダウンウェイトするために修正損失関数(すなわち、焦点損失)によって構築され、したがって、ハードネガティブに焦点を合わせて訓練し、深層学習ニューラルネットワークを訓練するために使用される訓練データの不均衡な性質を解消する。さらに、深層学習ニューラルネットワークは、訓練された深層学習ニューラルネットワークが、卵巣スライスの典型的な使用事例の画像に見られる拡張された範囲の色および/または彩度レベルにわたって卵巣形態内のCLを識別することができるように、拡張データセットを使用して訓練されてもよい。訓練された深層学習ニューラルネットワークは、卵巣スライスの入力画像として取り込み、卵巣スライス内の推測されたCLの各インスタンスの周りに境界ボックスを有する画像を出力する。いくつかの例では、各境界ボックスは、境界ボックス内に存在するCLの関連確率スコアを有する。評価の第2の部分は、境界ボックスに基づいて卵巣のCLをカウントし、CLのカウントに基づいて化合物の卵巣毒性を推測するためにルールベースの技術を使用することを含む。その後、CLのインスタンス、CLのカウント、および/または化合物の卵巣毒性についての境界ボックスおよび確率スコアを有する画像が、エンドユーザによる保存および使用のために出力される。
III.A例示的なコンピューティング環境
【0048】
図1は、様々な実施形態にかかる、深層学習ニューラルネットワークを使用した卵巣毒性評価のための例示的なコンピューティング環境100(すなわち、データ処理システム)を示している。図1に示すように、この例でコンピューティング環境100によって実行される卵巣毒性評価は、いくつかの段階、すなわち、モデル訓練段階105、CL識別段階110、CLカウント段階115、および卵巣毒性評価段階120を含む。モデル訓練段階105は、他の段階によって使用されるべき1つ以上のモデル125a~125n(「n」は任意の自然数を表す)(本明細書では個別にモデル125と呼ばれてもよく、まとめてモデル125と呼ばれてもよい)を構築して訓練する。モデル125は、例えば、例えば初期ニューラルネットワークなどの畳み込みニューラルネットワーク(「CNN」)、残差ニューラルネットワーク(「Resnet」)、RetinaNet、シングルショットマルチボックス検出器(「SSD」)ネットワーク、ユー・オンリー・ルック・ワンス(「YOLO」)ネットワークなどの機械学習(「ML」)モデル、または、例えば、長・短期記憶(「LSTM」)モデルもしくはゲーティッドリカレントユニット(「GRU」)モデルなどのリカレントニューラルネットワーク(「RNN」)、またはそれらの任意の組み合わせとすることができる。モデル125はまた、三次元CNN(「3DCNN」)、動的時間圧伸(「DTW」)技術、隠れマルコフモデル(「HMM」)など、またはそのような技術のうちの1つもしくは複数の組み合わせ、例えば、CNN-HMMもしくはMCNN(マルチスケール畳み込みニューラルネットワーク)など、画像からのオブジェクト検出において訓練された任意の他の適切なMLモデルとすることができる。コンピューティング環境100は、卵巣内のCLの識別のために同じタイプのモデルまたは異なるタイプのモデルを使用することができる。特定の例では、モデル125は、本明細書においてさらに詳細に説明するように、卵巣の非CL形態と卵巣のCLとの間の各画像内の不均衡な性質を補償する損失関数としての焦点損失によって構築される。
【0049】
この例でモデル125を訓練するために、デジタル画像を取得し、画像を訓練用の画像のサブセット130a(例えば、90%)と検証用の画像のサブセット130b(例えば、10%)とに分割し、画像のサブセット130aと画像のサブセット130bとを前処理し、画像のサブセット130aを増強し、画像のサブセット130aにラベル135によって注釈を付けることによってサンプル130が生成される。画像は、卵巣組織切片のものであり、データベース、画像システム(例えば、光学顕微鏡カメラ)などのデータ記憶構造から取得されることができる(例えば、卵巣組織切片の5倍の拡大走査が光学顕微鏡のカメラによって取得された20倍の走査から抽出されることができる)。画像は、1つ以上の被験体の右および/または左卵巣内の様々なレベルからの卵巣組織切片のものとすることができる。いくつかの例では、画像は、カルミン、硝酸銀、ギムザ、トリクローム染色、グラム染色、ヘマトキシリン、およびH&E染色などの組織学的染色によって染色された卵巣組織切片のものである。特定の例では、組織学的染色は、H&E染色である。特定の例では、訓練のための画像サブセット130a内の画像は、画像の実質的に全てまたは全てが化合物によって処理されておらず且つCLの正常なカウントを有する(例えば、1から1.5カウント/組織面積mm)被験体の卵巣のものであるように、プロトコルまたは制約に従って取得される。一方、検証のための画像サブセット130b内の画像は、画像の一部が化合物によって治療されておらず且つCLの正常なカウントを有する(例えば、1.0から1.5カウント/組織面積mm)被験体の卵巣のものであり、画像の一部が化合物によって処理されており且つCLのカウントが低下して異常である(例えば、0.5から1.0カウント/組織面積mm)被験体の卵巣のものであり、および/または画像の一部が化合物によって処理されており且つCLのカウントが非常に低く異常である(例えば、0.0から0.5カウント/組織面積mm)被験体の卵巣のものであるように、異なるプロトコルまたは制約に従って取得される。
【0050】
分割は、ランダムに(例えば、90/10%または70/30%)実行されてもよく、または、分割は、サンプリングバイアスおよびオーバーフィッティングを最小限に抑えるために、K-分割交差検証、一個抜き交差検証、一群抜き交差検証、入れ子交差検証などのより複雑な検証技術に従って実行されてもよい。前処理は、各画像が単一の卵巣切片のみを含むように画像を切り取ることを含むことができる。いくつかの例では、前処理は、全ての特徴を同じスケール(例えば、本明細書においてさらに詳細に説明するように、同じサイズスケールまたは同じカラースケールまたは彩度スケール)に置くための標準化または正規化をさらに含むことができる。特定の例では、画像は、所定の画素(例えば、2500画素)の最小辺(幅または高さ)または所定の画素(例えば、3000画素)の最大辺(幅または高さ)でサイズ変更され、元のアスペクト比を維持する。
【0051】
増強が使用されて、データセット内に画像の修正バージョンを作成することによって、画像のサブセット130aのサイズを人工的に拡大することができる。画像データ増強は、元の画像と同じクラスに属するデータセット内の画像の変換バージョンを作成することによって実行されることができる。変換は、シフト、フリップ、ズームなどの画像操作の分野からの動作の範囲を含む。いくつかの例では、動作は、モデル125が画像のサブセット130aから利用可能な状況外の状況下で実行することができることを保証するために、ランダム消去、シフト、輝度、回転、ガウスぼかし、および/または弾性変換を含む。追加的または代替的に、本明細書においてさらに詳細に説明するように、増強が使用されて、展開後にモデル125が入力として取り込むことができる画像の色スペクトルおよび/または彩度レベルを人工的に拡張することができる。色スペクトルおよび/または彩度レベル増強は、画像サブセット130aの画像群の画像(例えば、第1の毒物学的試験から取得された画像)間の色および/または彩度(例えば、赤色チャネル)の画像平均と、画像サブセット130aの画像の1つ以上の他の群(例えば、他の毒物学的試験から取得された画像)の色および/または彩度(例えば、赤色チャネル)の画像平均との差を取得し、差にランダム係数(例えば、-20から-40の範囲)を乗算して拡張色スペクトルおよび/または彩度レベルを取得し、さらなるデータ増強のために画像サブセット130aの画像の異なる群に拡張色スペクトルおよび/または彩度レベルを追加することによって実行されることができる。このさらなるデータ増強は、様々なソースまたは試験からの推測のために入力された画像に対するモデル125の性能を改善することができる。
【0052】
注釈付けは、画像サブセット130aの各画像内のCLの1つ以上のインスタンスの存在を確認し、CLの1つ以上のインスタンスにラベル135を提供する、例えば、注釈ソフトウェアを使用して、CLの1つ以上のインスタンスを含むように人間によって確認された領域の周りに境界ボックス(グラウンドトゥルース)を描画する、1人以上の人間(病理学者などの注釈者)によって手動で実行されることができる。特定の例では、境界ボックスは、CLである確率が50%を超えるインスタンスついてのみ描画されてもよい。複数の注釈者によって注釈付けされる画像については、全ての注釈者からの境界ボックスが使用される。同じCLが複数の注釈者によって識別された場合、個々の注釈は、単一の境界ボックスに結合される。より小さい境界ボックスは、より大きい境界ボックスに置き換えられる。各画像についての総CLカウントは、各卵巣切片の境界ボックスの数をカウントすることによって計算されることができ、ラベル135を使用して情報が画像に注釈付けされることができる。
【0053】
モデル125の訓練プロセスは、モデル125のハイパーパラメータを選択することと、モデル125の損失または誤差関数を最小化するモデルパラメータ(例えば、重みおよび/またはバイアス)のセットを見つけるために、画像のサブセット130aからモデル125に画像を入力する反復動作を実行することとを含む。ハイパーパラメータは、モデル125の挙動を制御するために調整または最適化されることができる設定である。ほとんどのモデルは、メモリまたは実行コストなどのモデルの異なる態様を制御するハイパーパラメータを明示的に定義する。しかしながら、モデルを特定のシナリオに適合させるために、追加のハイパーパラメータが定義されることができる。例えば、ハイパーパラメータは、モデルの隠れユニットの数、モデルの学習率、またはモデルの畳み込みカーネル幅を含むことができる。訓練の各反復は、モデルパラメータのセットを使用する損失または誤差関数の値が、前の反復におけるモデルパラメータの異なるセットを使用する損失または誤差関数の値よりも小さくなるように、(ハイパーパラメータの定義されたセットによって構成された)モデル125のモデルパラメータのセットを見つけることを含むことができる。損失または誤差関数は、モデル125を使用して推測された出力(この例では、CLの1つ以上のインスタンスの周りの境界ボックス)と、ラベル135を使用して画像に注釈付けされたグラウンドトゥルース境界ボックスとの間の差を測定するように構築されることができる。
【0054】
モデルパラメータのセットが識別されると、モデル125は、訓練されており、画像のサブセット130a(試験または検証データセット)を使用して検証されることができる。検証プロセスは、ハイパーパラメータを調整し、最終的に最適なハイパーパラメータのセットを見つけるために、K-分割交差検証、一個抜き交差検証、一群抜き交差検証、入れ子交差検証などの検証技術を使用して、画像のサブセット130bからモデル125に画像を入力する反復動作を含む。最適なハイパーパラメータのセットが取得されると、画像のサブセット130bからの画像の予約試験セットがモデル125に入力されて出力(この例では、CLの1つ以上のインスタンスの周りの境界ボックス)を取得し、ブランドアルトマン法およびスピアマンの順位相関係数などの相関技術を使用し、誤差、精度、正確さ、再現率、受信機動作特性曲線(ROC)などの性能メトリックを計算して、出力がグラウンドトゥルース境界ボックスに対して評価される。
【0055】
理解されるべきであるように、他の訓練/検証機構が想定され、コンピューティング環境100内に実装されてもよい。例えば、モデルは、訓練されてもよく、ハイパーパラメータは、画像のサブセット130aからの画像上で調整されてもよく、画像のサブセット130bからの画像は、モデルの性能を試験および評価するためにのみ使用されてもよい。さらに、本明細書において説明される訓練機構は、新たなモデル125を訓練することに焦点をあてている。これらの訓練機構はまた、他のデータセットから訓練された既存のモデル125を微調整するために利用されることができる。例えば、いくつかの例では、モデル125は、他の生物学的構造の画像(非卵巣切片)を使用して、または他の被験体もしくは試験からの卵巣切片(例えば、ヒト試験またはマウス実験)から事前訓練されていてもよい。それらの場合、モデル125は、転移学習に使用され、本明細書において説明するようにサンプル130を使用して再訓練/検証されることができる。
【0056】
モデル訓練段階105は、1つ以上の訓練されたCLオブジェクト検出モデル140を含む訓練されたモデルを出力する。CL識別段階110では、1つ以上のCLオブジェクト検出モデル140が使用されて、CLの関連する確率スコアが境界ボックスに存在する推定CLの各インスタンスの周りの境界ボックスを取得することができる。CL識別段階110は、画像データ145を取得するためのプロセス(例えば、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させる命令)を含むことができる。いくつかの例では、取得することは、データベース、画像システムなどのデータ記憶構造から卵巣組織切片の画像を取得することを含む。画像は、1つ以上の被験体の右および/または左卵巣内の様々なレベルからの卵巣組織切片のものとすることができる。いくつかの例では、画像は、カルミン、硝酸銀、ギムザ、トリクローム染色、グラム染色、ヘマトキシリン、およびH&E染色などの組織学的染色によって染色された卵巣組織切片のものである。画像データ145内の画像は、未処理のまたは同じまたは異なる化合物によって処理された同じまたは異なる被験体の卵巣のものとすることができる。
【0057】
CL識別段階110は、画像データ145を前処理するための任意のプロセスをさらに含んでもよい。いくつかの例では、前処理は、全ての特徴を同じスケール(例えば、本明細書においてさらに詳細に説明するように、同じサイズスケールまたは同じカラースケールまたは彩度スケール)に置くための標準化または正規化を含む。特定の例では、画像は、所定の画素(例えば、2500画素)の最小辺(幅または高さ)または所定の画素(例えば、3000画素)の最大辺(幅または高さ)でサイズ変更され、元のアスペクト比を維持する。CL識別段階110は、画像データ145を(前処理の有無にかかわらず)CLオブジェクト検出モデル140に入力してCLオブジェクト検出モデル140を実行するプロセスをさらに含む。CLオブジェクト検出モデル140は、モデルパラメータに基づいて各画像内のCLの1つ以上のインスタンスを推測し、推測されたCLの各インスタンスの周りに境界ボックスを有する画像150を出力する。特定の例では、各境界ボックスは、境界ボックス内に存在するCLの関連する確率スコアを有する。
【0058】
CLカウント段階115は、CL識別段階110から出力画像150を取得または受信するためのプロセス(例えば、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させる命令)を含む。CLカウント段階115は、出力画像150内のCLの推測された1つ以上のインスタンスをカウントするためにルールベースの技術を実行するためのプロセスをさらに含む。いくつかの例では、ルールベースの技術は、非験体からの卵巣に関連する各画像内の境界ボックスをカウントし、卵巣のCLの総カウント155を取得することができる。他の例では、ルールベースの技術は、被験体からの第1の卵巣(例えば、左卵巣)に関連する各画像内の境界ボックスをカウントして、第1の卵巣のCLの総カウント155を取得し、被験体からの第2の卵巣(例えば、右卵巣)に関連する各画像内の境界ボックスをカウントして、第2の卵巣のCLの総カウント155を取得することができる。特定の例では、ルールベースの技術は、被験体についての平均CLカウント155を取得するために、第1の卵巣についてのCLの総カウントおよび第2の卵巣についてのCLの総カウントの平均をとる(または別の同様の統計的アプローチを適用する)ことができる。所定の閾値(例えば、0.5または0.75)未満の確率スコアを有する境界ボックスは、ルールベース技術によってカウントされなくてもよい。さらに他の例では、ルールベースの技術は、サンプルに関連する各画像内の境界ボックスに対して任意の他のカウント方法を使用することができ、これは、任意に関連する確率スコアを考慮して、サンプルのCLの総カウントを取得する。
【0059】
CL卵巣毒性評価段階120は、CLカウント段階115から総カウントまたは平均カウント155を取得または受信するためのプロセス(例えば、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させる命令)を含む。CL卵巣毒性評価段階120は、総カウントまたは平均カウント155に基づいて化合物の卵巣毒性160(哺乳動物の卵巣毒性)を推測するためのルールベースの技術を実行するためのプロセスをさらに含む。卵巣毒性は、同じCLオブジェクト検出モデル140を使用して、異なる量および異なる化合物にわたって判定されることができる。第一に、驚くべきことに、(実施例に関して本明細書に記載されるデータによって裏付けされるように)化合物の卵巣毒性を伴うCLトラックの個々のカウントがどの程度良好且つ正確であるかが発見された。従来、化合物または環境の卵巣毒性評価は、CLの有無と組み合わせた卵胞の形態および数を含むいくつかの因子の定性的および定量的分析に基づいている。第二に、驚くべきことに、(複数の化合物についての実施例に関して本明細書で論じられるデータによって支持されるように)広範囲の異なる化合物の卵巣毒性評価を用いてCLトラックの個々のカウントがどの程度良好且つ正確であるかが発見された。
【0060】
いくつかの例では、ルールベースの技術は、所定の毒性閾値(例えば、1.5カウント/組織面積mm未満の総CLカウントまたは平均CLカウントは、卵巣に対する化合物の毒性を示す)に基づいて、総カウントまたは平均カウント155からバイナリ結果(例えば、化合物が毒性であるか、または化合物が毒性でないか)として卵巣毒性160を推測することができる。他の例では、ルールベースの技術は、化合物の2つ以上の用量レベル(例えば、ベースラインまたは被験体に導入された化合物なし、および被験体に導入された化合物の用量レベル)に関連する総カウントまたは平均カウント155の傾向からバイナリ結果(例えば、化合物が毒性であるか、または化合物が毒性でないか)として卵巣毒性160を推測することができる。さらに他の例では、ルールベースの技術は、サンプルに関連する毒性評価のための任意の他の推測方法(例えば、非バイナリ)を使用することができ、これは、任意に化合物の2つ以上の用量レベルを考慮して、化合物の卵巣毒性160を判定する。
【0061】
明示的に示されていないが、コンピューティング環境100は、開発者に関連付けられた開発者装置をさらに含むことができることが理解されよう。開発者装置からコンピューティング環境100の構成要素への通信は、深層学習ニューラルネットワークにどの種類の入力画像が使用されるべきか、使用されるべき深層学習ニューラルネットワークの数および種類、各深層学習ニューラルネットワークのハイパーパラメータ、例えば、学習率および隠れ層の数、データ要求がどのようにフォーマットされるべきか、どの訓練データが使用されるべきか(例えば、および訓練データへのアクセスを得る方法)およびどの検証技術が使用されるべきか、および/またはルールベース技術がどのように構成されるべきかを示すことができる。
III.Bモデル訓練のための例示的なデータ増強
【0062】
いくつかの実施形態では、深層学習ニューラルネットワークは、化合物によって処理されておらず、且つカルミン、硝酸銀、ギムザ、トリクローム染色、グラム染色、ヘマトキシリン、およびH&E染色などの組織学的染色によって染色された被験体の卵巣からの卵巣切片の画像に対して訓練される。組織学的染色剤は、サンプル内の天然の形態を可視化するために使用される着色剤であり、サンプル内の特定の構造を選択的に同定するための免疫組織化学染色剤などの染色剤ではない。これは、免疫組織化学染色などのより高価で複雑な染色プロセスを介して取得される画像と比較して、H&E染色などの安価でかなり単純な染色プロセスを介して取得される画像に対して深層学習ニューラルネットワークが訓練および使用されることを可能にする。
【0063】
しかしながら、組織学的染色によって染色されたサンプルは、色の変動の傾向を有する(例えば、H&E染色は、濃い紫から薄いピンクの間の色スペクトルに沿って染色されるサンプルの同じ構造をもたらすことができる)。この色の変動は、染色または染色プロセスの変動に起因することができ、例えば、染色プロセスのタイミングの変動、例えば、短期間に対して染色剤をスライド上に長期間放置することは、暗い色または明るい色をもたらすことができ、染色剤を作製するために使用される成分の変動、例えば、顔料または染料を再構成するために使用される水中の異なる化学物質は、スペクトルに沿って異なる色をもたらすことができる。色および/または彩度レベルのこの変動に対処するために、訓練データの画像は、拡張された範囲の色および/または彩度レベルにわたって卵巣形態内のCLを識別するように深層学習ニューラルネットワークが訓練されるように増強される。さらに、他のデータセットからの画像のRGB色のカラーマッピングなどの従来の技術は、そのような変化が通常は再マッピングされた色のノイズ(色相、彩度、または値のいずれかにおける)を導入し、モデル性能に影響を与えるため、この変動問題に対処するには不十分である。代わりに、これらの制限および問題に対処するために、訓練データの異なるサブセット間の色および/または彩度の差をキャプチャし、キャプチャされた差によって訓練データの1つ以上のサブセットを増強して訓練データの増強サブセットを取得し、訓練データの元のサブセットおよび訓練データの増強サブセットを使用して深層学習ニューラルネットワークを訓練して、展開後に深層学習ニューラルネットワークが入力としてとることができる色空間および彩度レベルを拡張するための増強技術が提供される。
【0064】
より具体的には、増強は、訓練データからの画像群の画像(例えば、第1の毒物学試験から取得された画像)間の色および/または彩度(例えば、赤色チャネル)についての画像平均と、訓練データからの1つ以上の他の画像(例えば、他の毒物学試験から取得された画像)群の色および/または彩度(例えば、赤色チャネル)についての画像平均との差を取得することによって実行されてもよい。次いで、計算された差は、ランダム係数(例えば、-20から-40、0から-40、-10から-60などのランダム値の範囲)によって乗算されて、拡張色スペクトルおよび/または彩度レベルを取得する。拡張された色スペクトルおよび/または彩度が加算され(増強画像=元の画像+差*ランダム係数)、データ増強のための訓練データの1つ以上の画像群を生成する。
【0065】
例として、仮想試験Aは、訓練データとして使用されるべき2つの画像(画像-1および画像-2)を有し、仮想試験Bは、訓練データとして使用されるべき2つの画像(画像-3および画像-4)を有すると仮定する。試験Aでは、画像-1-赤(画像-1-R)チャネル(各画像全体の合計)および画像-2-Rチャネルは、単一数meanARに平均化され、同様に緑および青チャネルについても数meanAGおよびmeanABを生成する。試験Bでは、画像-1-Rチャネルおよび画像-2-Rチャネルは、単一数meanBRに、同様に緑色チャネルおよび青色チャネルについてもmeanBGおよびmeanBBに平均化される。
【0066】
次いで、(各色についての)画像平均の差が以下のように計算されることができる:
赤色の差dR=meanAR-meanBR
緑色の差dG=meanAG-meanBG
青色の差dB=meanAR-meanBB
赤色、緑色、および青色の差(dR、dB、およびdG)は、ランダム係数(例えば、-20から-40、0から-40、-10から-60などのランダム値の範囲)によって乗算されて、拡張色スペクトルおよび/または彩度レベル(exR、exB、exG)を取得する。拡張色スペクトルおよび/または彩度レベル(exR、exB、exG)は、試験Aの2つの画像および/または試験Bの2つの画像のRGBチャネルに加算され、増強画像のセットを取得する。次いで、試験Aおよび試験Bのそれぞれからの元の2つの画像および増強画像が使用されてモデルを訓練する。このデータ増強は、様々なソースまたは試験からの推測のために入力される画像(色および/または彩度の変動を有する傾向がある画像)についてのモデルの性能を改善することができる。
III.C.例示的な深層学習ニューラルネットワーク
【0067】
様々な実施形態では、卵巣のCLを識別することができる深層学習ニューラルネットワーク(境界ボックスを記述する4つの座標値の全てを予測することを含むオブジェクト検出タスク)が提供される。オブジェクト検出タスクの場合、2つの異なるアプローチが使用されることができる。(i)グリッド上で固定数の予測を行い(1段階)、(ii)または提案ネットワークを活用してオブジェクトを見つけ、次いで第2のネットワークを使用して提案を微調整し、最終予測を出力する(2段階)。利用可能な訓練データのより小さいセットで訓練することがより容易であり、モデルアーキテクチャがはるかに単純で高速であるため、本実施形態の深層学習ネットワークには1段階の検出(すなわち、直接)が選択された。いくつかの例では、深層学習ニューラルネットワークは、CNN、例えば、初期ニューラルネットワーク、Resnet、RetinaNet、またはそれらの任意の組み合わせである。
【0068】
深層学習ニューラルネットワークは、発情周期の様々な段階における被験体の卵巣からの卵巣切片の画像に対して訓練され、化合物(例えば、治療候補化合物)によって処理されていない。これは、各スライスについて平均して卵巣あたり約10から30CLおよび約1から1.5CLカウント/組織面積mmのCLカウントを有する、訓練のための画像の十分大きなプールを確保する。しかしながら、画像は、存在する場合、少量のCLと比較して多量の非CL卵巣形態および背景を有し、したがって、容易に分類される背景の例によって支配される境界ボックスの候補位置の大きなセットを有する。訓練中、モデルは、候補オブジェクト位置の数をより少ない数に絞り込むための領域的提案の中間ステップを有しない我々の「グリッド上の予測」アプローチの性質に起因してオブジェクトが含まれない大量の境界ボックスで終わることが多いため、1段階検出器についてのクラス不均衡問題を引き起こす。従来、このクラス不均衡問題は、ブートストラッピングまたはオンラインハードサンプルマイニングによって対処されている。しかし、これらの技術は、以下のためにこの例では効率的に機能しない:(i)使用される訓練サンプルは、全てCL(正のクラス)を含み、したがって、CLのない一連の画像は、ブートストラップ目的に使用されることができず、(ii)オンラインハードの実例マイニングは、別のクラス不均衡問題を引き起こす訓練データセットの大部分である容易な例を完全に破棄する。
【0069】
クラス不均衡問題を解消し、限られた訓練データセットによるCLの正確な識別および定量化を達成するために、深層学習ニューラルネットワークは、修正損失関数(すなわち、焦点損失)によって構築される。焦点損失は、クロスエントロピー損失を再成形することによって画像の不均衡な性質を補償し、その結果、十分に分類された例に割り当てられた損失をダウンウェイトし、ハードネガティブに対する訓練に焦点をあてる。例えば、バイナリ分類の交差エントロピー損失は、以下のように表される:
ここで、y∈{±1}は、グランドトゥルースクラスであり、p∈[0,1]は、モデルの推定確率である。表記の便宜上、pが定義され、CEは、以下のように書き換えられる:
この交差エントロピー損失関数CEは、交差エントロピー損失CEに変調係数(1-pγを加えることによって再成形され、γは、所定の正のスカラー値または集束パラメータである。
【0070】
したがって、ある例が誤って分類され、pが小さい場合、変調因子(1-pγは、1に近く、損失は影響を受けない。p→1として、変調因子(1-pγは0になり、十分に分類された例の損失はダウンウェイトされる。焦点パラメータγは、容易な例がダウンウェイトされる速度を滑らかに調整する。γ=0の場合、FLはCEに相当する。γが増加すると、同様に、変調因子(1-pγの効果が増加する。焦点損失は、本質的に、容易な例(例えば、全ての非CL卵巣形態および背景)の損失の累積によって勾配が超えられることを回避する手段である。代わりに、焦点損失は、ハード例のまばらなセット(例えば、稀な例のCL)に訓練を集中させ、訓練中に膨大な数の容易なネガティブ(例えば、非CL卵巣形態および背景)が検出器を圧倒するのを防ぐ。
【0071】
様々な実施形態では、焦点損失は、分類損失関数としてRetinaNetに実装される。図2に示すように、RetinaNet200は、以下から構成されることができる:(i)バックボーンネットワーク205が任意のサイズの画像を撮像し且つ特徴ピラミッドネットワーク210内の複数のレベルにおいて比例サイズの特徴マップを出力することを可能にする、完全に畳み込み的な方法でResNet215の上に構築された特徴ピラミッドネットワーク210から構成されるバックボーンネットワーク205、(ii)バックボーンの出力を使用して各アンカーボックスおよびオブジェクトクラスについて、各空間位置にオブジェクトが存在する確率を予測する役割を担う第1のサブネットワーク220、(iii)バックボーンの出力を使用して各グランドトゥルースオブジェクトについてアンカーボックスからの境界ボックスのオフセットを回帰する役割を担う第2のサブネットワーク225。ResNet215は、ボトムアップ経路を提供し、これは、入力画像サイズまたはバックボーンに関係なく、異なるスケールで特徴マップを計算する。ResNet215のいくつかの連続層は、同じスケールの特徴マップを出力することができるが、一般に、より深い層の特徴マップは、より小さいスケール/解像度を有する。ボトムアップ経路は、同じスケールの特徴マップを出力する連続層の各群の最後の特徴マップを選択することによって達成される。
【0072】
これらの選択された特徴マップは、トップダウン経路および横方向接続を提供する特徴ピラミッドネットワーク210の基礎として使用される。トップダウン経路は、より高いピラミッドレベルから空間的に粗い特徴マップをアップサンプリングし、横方向接続は、同じ空間サイズを有するトップダウン層とボトムアップ層とをマージする。より具体的には、最近傍アップサンプリングを使用して、ボトムアップ経路からの最後の特徴マップは、最後から2番目の特徴マップと同じスケールに拡張される。次いで、これらの2つの特徴マップは、要素ごとの加算によってマージされて、新たな特徴マップを形成する。このプロセスは、ボトムアップ経路からの各特徴マップが、横方向接続によって接続された対応する新たな特徴マップを有するまで繰り返される。より高いレベルの特徴マップは、画像のより大きな領域をカバーするグリッドセルを含み、したがって、より大きなオブジェクトを検出するのにより適している。対照的に、より低いレベルの特徴マップからのグリッドセルは、より小さいオブジェクトを検出するのにより優れている。これらの特徴マップは、境界ボックスの予測を行うために独立して使用されることができ、したがって、スケール不変であり且つ速度および精度の双方に関してより良好な性能を提供することができるモデルに寄与する。
【0073】
第1のサブネットワーク220は、特徴ピラミッドネットワーク210の各レベルに搭載された完全畳み込みネットワーク(FCN)であり、各アンカーボックス(A)およびオブジェクトクラス(K)についての各空間位置にオブジェクトが存在する確率を予測する。第1のサブネットワーク220は、複数のフィルタ(例えば、256)を有する複数の(例えば、4つの)畳み込み層と、それに続く整流線形ユニット(RELU)アクティベーションとから構成されてもよい。続いて、K×AK×Aフィルタを有する別の畳み込み層が適用され、続いてシグモイドアクティベーションすることができる。第1のサブネットワーク220は、全レベルにわたってパラメータを共有している。出力特徴マップの形状は、(W,H,KA)であってもよく、ここで、WおよびHは、入力特徴マップの幅および高さに比例し、KおよびAは、オブジェクトクラスおよびアンカーボックスの数である。各アンカーボックスは、それがカバーする領域内のK個のクラスからのオブジェクトの存在を検出する役割を担う。したがって、各アンカーボックスは、クラス確率を示すK個の数字に対応し、グリッドごとにA個の境界ボックスがあるため、第1のサブネットワーク220の出力特徴マップは、KA個のチャネルを有する。
【0074】
第2のサブネットワーク225は、特徴ピラミッドネットワーク210の各特徴マップに搭載され且つ第1のサブネットワーク220と並列な回帰サブネットである。第2のサブネットワーク225の設計は、最後の畳み込み層が4A個のフィルタを有することを除いて、第1のサブネットワーク220の設計と同一である。したがって、出力特徴マップの形状は、(W,H,4A)であり、ここで、WおよびHは、入力特徴マップの幅および高さに比例し、Aは、アンカーボックスの数である。第1のサブネットワーク220および第2のサブネットワーク225は双方とも、幅Wおよび高さHを有する出力特徴マップを有し、W×H個のスライスのそれぞれは、入力画像内の領域に対応する。第1のサブネットワーク220がオブジェクトの存在/クラスを検出することに加えて、各アンカーボックスはまた、オブジェクトのサイズ/形状を検出する役割も担う。これは、アンカーボックスとグラウンドトゥルースボックスとの間の相対オフセット(中心座標、幅、および高さに関して)を予測する各アンカーボックスについて4つの数を出力する、第2のサブネットワーク225を介して行われる。したがって、回帰サブネットの出力特徴マップは、4A個のチャネルを有する。したがって、サブネットは、以下のように表される総カウントに対して複数の値(第1のサブネットワーク220からのK、第2のサブネットワーク225からの4A個のチャネル)を生成する:
ここで、lは、ピラミッドのレベルを示し、WおよびHは、アンカーボックスのサブネットの出力特徴マップの幅および高さである。これらの数を使用してアンカーボックスを改良することにより、モデルが境界ボックスの4つの座標の予測を出力することが可能である。
【0075】
RetinaNet200を訓練するための損失を計算するために、境界ボックスの4つの座標の予測とグラウンドトゥルースの境界ボックスの座標との間で比較が行われる。RetinaNetの損失は、以下の2つの項を含むマルチタスク損失である:一方は局在化(Llocとして示される)であり、他方は分類(Lclsとして示される)である。マルチタスク損失は、以下のように表されることができる:
ここで、λは、2つのタスク損失LlocとLclsとの間のバランスを制御するハイパーパラメータである。局在化損失(Lloc)および分類損失(Lcls)は、境界ボックスの4つの座標の予測とグラウンドトゥルースの境界ボックスの座標との間で行われる比較に基づいて計算される。局在化損失(Lloc)は、回帰損失である。本明細書において説明するように、一致するアンカーボックスごとに、第2のサブネット225は、4つの数を予測する。最初の2つの数は、アンカーボックスの中心とグラウンドトゥルースとの間のオフセットを指定する一方で、最後の2つの数は、アンカーボックスの幅/高さとグラウンドトゥルースとの間のオフセットを指定する。これに対応して、これらの予測のそれぞれについて、アンカーボックスとグラウンドトゥルースとの間のオフセットとして計算された回帰ターゲットがある。この回帰ターゲットに基づいて回帰損失が定義されることができる。分類損失(Lcls)は、本明細書において詳細に説明するように、焦点損失である。焦点損失は、容易な例からの損失寄与を低減し、誤って分類された例を修正する重要性を高める。
【0076】
RetinaNet200は、卵巣内のCLの推定インスタンスの周りの境界ボックスを記述する4つの座標値の予測を生成する。卵巣切片の各入力画像について、以下のように表される特徴ピラミッドネットワーク210の全てのレベルからのいくつかのアンカーボックスがある:
各アンカーボックスについて、第1のサブネットワーク220は、画像中のCLの存在の確率分布を示すK個の数を予測する一方で、第2のサブネットワーク225は、各アンカーボックスと対応する境界ボックスとの間のオフセットを示す4つの数を予測する。性能を考慮するために、RetinaNet200のハイパーパラメータは、モデルが特徴ピラミッドネットワーク210の各レベルから境界ボックス内に存在するCLの最も高い確率スコアを有するせいぜい所定数のアンカーボックス(例えば、100)を選択するように、または特徴ピラミッドネットワーク210の各レベルからアンカーボックス内に存在するCLの所定の閾値確率スコア(例えば、0.75)を超えるアンカーボックス(例えば、100)を選択するように、または所定数のアンカーボックスおよび所定の閾値確率スコアに基づくそれらの組み合わせで設定されることができる。これらのアンカーボックスのみが、RetinaNet200によって実行される残りの段階に含まれる。この段階で、複数のアンカーボックスを用いて画像内のCLが予測されることができる。冗長性を除去するために、非最大抑制(NMS)がCL予測に適用されることができ、これは、最も高い確率スコアを有するアンカーボックスを繰り返し選択し、0.5などの設定値よりも大きいIntersection over Unionを有する任意の重複するアンカーボックスを除去する。最後の段階では、CL識別のための残りの各アンカーボックスについて、第2のサブネットワーク225は、識別されたCLの各インスタンスの最終的な境界ボックス予測を得るためにアンカーボックスを改良するために使用されることができるオフセット予測を与える。
IV.卵巣毒性評価のための技術
【0077】
図3は、様々な実施形態にかかる卵巣毒性評価のためのプロセス300を示している。
【0078】
プロセス300は、ブロック305で始まり、ここで、組織スライスが、1つまたは複数の被験体の1つまたは複数の卵巣から取得される(例えば、マウス被験体の左および右卵巣)。いくつかの例では、被験体は、ある量の化合物(例えば、ある用量の治療薬)によって処理されている。他の例では、被験体は、ある量の化合物(例えば、ベースライン)によって処理されていない。ブロック310において、組織スライスがスライド上に載置される。スライドは、顕微鏡によって使用するための基材である。ブロック315において、スライドは、H&E染色などの組織学的染色によって処理される。特定の例では、複数のスライドは、H&E染色剤以外の任意の他の染色剤によって処理されない。ブロック320において、各スライドは、組織スライスについての画像を生成するために、撮像装置(例えば、顕微鏡に取り付けられたカメラ)を用いて撮像される。画像は、複数の卵巣の各卵巣からの組織スライスの少なくとも1つの画像を含む画像のセットとすることができる。画像と卵巣との関連付けは、メタデータタグなどの識別子を使用して画像データ内で維持されてもよい。
【0079】
任意のブロック325において、組織スライスの画像が前処理される。前処理は、各画像が単一の卵巣切片のみを含むように画像を切り取ることを含むことができる。いくつかの例では、前処理は、全ての特徴を同じスケール(例えば、本明細書においてさらに詳細に説明するように、同じサイズスケールまたは同じカラースケールまたは彩度スケール)に置くための標準化または正規化をさらに含むことができる。特定の例では、画像は、所定の画素(例えば、2500画素)の最小辺(幅または高さ)または所定の画素(例えば、3000画素)の最大辺(幅または高さ)でサイズ変更され、元のアスペクト比を維持する。
【0080】
ブロック330において、画像は、損失関数の少なくとも一部として焦点損失を使用して1段階検出器として構築されたニューラルネットワークモデルに入力される。入力することは、1つの卵巣からの組織スライスの画像のセットからの各画像を反復的に入力し、次いで、別の卵巣からの組織スライスの別の画像のセットからの各画像を反復的に入力し、画像内の全ての画像のセットがニューラルネットワークモデルによって処理されるまでこのプロセスを繰り返すことを含むことができる。
【0081】
ニューラルネットワークモデルは、SSDアーキテクチャ、YOLOアーキテクチャ、またはRetinaNetアーキテクチャなどのオブジェクト検出モデルアーキテクチャに基づいて構築することができる。いくつかの例では、ニューラルネットワークモデルは、訓練データのセットを使用して訓練された複数のパラメータを含み、(i)卵巣からの組織切片のH&E染色スライドなどの染色スライドの画像の複数の訓練セットであって、複数の訓練セットの画像からの画像の各訓練セットが、複数の異なる被験体のうちの1つからのものである、複数の訓練セットと、(ii)複数の訓練セットの画像からの画像のうちの1つにおいて識別されたCLに関連付けられた境界ボックスの複数のセットとを含む、複数のパラメータを含む。ニューラルネットワークモデルの損失関数は、パラメータおよび複数の画像の訓練セットを複数の境界ボックスのセットに関連させ、焦点損失は、複数の画像の訓練セット内の非CL形態または背景についての訓練中に予測された境界ボックスをダウンウェイトし、CLについて予測された境界ボックスに訓練を集中させる。特定の例では、複数の画像の訓練セットのうちの少なくとも1つの画像の訓練セットは、少なくとも1つの画像の訓練セット内の画像の複数の色チャネルのそれぞれについての画像平均の差に従って訓練に使用される前に調整され、画像平均の差は、複数の画像の訓練セットのうちの別の画像の訓練セットに対して計算される。画像の複数の色チャネルのそれぞれについての画像平均は、少なくとも1つの画像の訓練セット内の画像にわたる色チャネルの平均値として計算される。
【0082】
ブロック335において、画像内の1つ以上のオブジェクトは、ニューラルネットワークモデルを使用してCLであるとして識別される(例えば、識別することは、背景オブジェクトからのCLオブジェクトの分類スキーマの一部として、または他の卵巣構造および/または細胞種類および背景オブジェクトからのCLオブジェクトのマルチクラス分類スキーマとして実行されることができる)。いくつかの例では、CLは、ニューラルネットワークモデル内の特徴ピラミッドネットワークを介して生成された特徴マップに基づいて識別または分類される。特定の例では、識別または分類することは、CLとして識別または分類された1つ以上のオブジェクトのうちの各オブジェクトについて確率スコアを生成することを含む。ブロック340において、ブロック335からのオブジェクトの識別または分類に基づいて、CLとして識別されたオブジェクトのうちの1つ以上のオブジェクトの周りの境界ボックスについての座標が予測される。ブロック345において、CLとして識別されたオブジェクトのうちの1つ以上のオブジェクトの周りの境界ボックスを有する画像は、境界ボックスについて予測された座標に基づいて出力される。
【0083】
ブロック350において、深層学習ニューラルネットワークから出力された画像内の境界ボックスがカウントされて、1つまたは複数の被験体の1つまたは複数の卵巣についてのCLカウントを取得する。CLカウントは、被験体ごとのカウントに基づいて生成されることができ、所与の被験体(被験体の1つまたは複数の卵巣)に関連する画像内の全ての境界ボックスがCLカウントを取得するためにカウントされる。あるいは、CLカウントは、所与の卵巣に関連する画像内の全ての境界ボックスがCLカウントを取得するためにカウントされる卵巣ごとのカウントに基づいて生成されることができる。その後、同じ被験体に関連付けられた各卵巣について生成されたCLアカウントが平均化されて、被験体についての平均CLカウントを取得することができる。特定の例では、カウントすることは、CLとして分類され且つ所定の確率スコア閾値よりも大きい確率スコアを有するオブジェクトの周りの画像内の境界ボックスをカウントすることのみを含む。他の例では、
【0084】
ブロック355において、卵巣または被験体のCLカウント、または被験体の平均CLカウントに基づいて、ある量の化合物(例えば、ある用量の治療薬)について卵巣毒性が判定される。卵巣毒性は、同じニューラルネットワークモデルを使用して、異なる量および異なる化合物にわたって判定されることができる。いくつかの例では(例えば、画像が単一量の化合物に曝露された被験体から取得される場合)、卵巣毒性を判定することは、卵巣もしくは被験体についてのCLカウントまたは被験体についての平均CLカウントを所定の毒性閾値と比較することを含む。卵巣もしくは被験体についてのCLカウント、または被験体についての平均CLカウントが所定の毒性閾値を超える場合、ある量の化合物は、卵巣に対して毒性ではないと判定される。卵巣もしくは被験体についてのCLカウント、または被験体についての平均CLカウントが所定の毒性閾値以下である場合、ある量の化合物は、卵巣に対して毒性であると判定される。他の例(例えば、画像が複数量の化合物に曝露された複数の被験体から取得される場合(複数量の化合物によって処理された被験体からの画像および任意量の化合物によって処理されていない被験体からのベースライン画像))では、卵巣毒性を判定することは、卵巣または被験体についての第1のCLカウント、または被験体についての平均CLカウントを、別の卵巣または被験体についての第2、第3、第4などのCLカウント、または別の被験体についての平均CLカウントと比較することと、比較に基づいて、第1、第2、第3、第4などのCLカウントの間の傾向を判定することと、傾向に基づいて卵巣毒性を判定することと、を含む。例えば、傾向が化合物の量が増加するにつれてCLカウントが減少することを示す場合、化合物が卵巣に対して毒性であると判定されることができる。一方、傾向が、傾向が化合物の量が増加するにつれてCLカウントが安定していることを示す場合、化合物が卵巣に対して毒性ではないと判定されることができる。この傾向に基づく判定は、化合物が卵巣に対して毒性であるかまたは毒性でない量をよりよく理解および推測するために、所定の毒性閾値をさらに考慮に入れることができる。
【0085】
ブロック360において、CL、卵巣のCLカウント、ある量の化合物の卵巣毒性、またはそれらの任意の組み合わせとして分類されるオブジェクトのうちの各オブジェクトの周りの境界ボックスを有する画像のセットが提供される。例えば、画像のセット、卵巣のCLカウント、ある量の化合物の卵巣毒性、またはそれらの任意の組み合わせは、局所的に提示されるか、または別の装置に送信されることができる。画像のセット、卵巣のCLカウント、ある量の化合物の卵巣毒性、またはそれらの任意の組み合わせは、被験体の識別子と共に出力されることができる。いくつかの例では、画像のセット、卵巣のCLカウント、ある量の化合物の卵巣毒性、またはそれらの任意の組み合わせは、エンドユーザまたは記憶装置に出力される。任意のブロック365において、化合物は、ある量の化合物の卵巣毒性に基づいて製造されるかまたは製造されている。任意のブロック370において、ある量の化合物の卵巣毒性に基づいて、化合物による処理が実施される。
V.実施例
【0086】
様々な実施形態において実装されるシステムおよび方法は、以下の実施例を参照することによってよりよく理解されることができる。
V,A.実施例1.-5つの反復投与毒性試験からの卵巣切片
【0087】
完了した化合物開発プログラムをサポートして行われた5つの反復用量毒性試験からの卵巣切片をこの遡及的試験に含めた。雌のSprague-Dawleyラットを5つ全ての試験に使用した。
V.A.1 試験設計および訓練の概要
【0088】
図4は、この実施例の試験設計をまとめたものである。本明細書において説明する例示的な実施形態では、RetinaNetであるオブジェクト検出深層学習ニューラルネットワークを、試験1からの全ての切片(訓練セットの切片の90%および検証セットの切片の10%)によって訓練してCLを識別した。モデルは、訓練セットにおいて病理学者AおよびBからの注釈によって訓練された。試験1における切片のサブセット(試験1サブセット)もまた、病理学者Aおよび病理学者Bの双方によって注釈が付けられ、検証セットの一部として機能した。このサブセット内で、病理学者AおよびBは、互いの注釈を見えなくし、変動を計算した。次に、試験2の切片のサブセットにおいて、CLを病理学者AおよびCによってカウントし、ゴールドスタンダード試験セットとして使用した。訓練されたモデルをこの同じ試験セットに適用して、ゴールドスタンダードと比較したCLカウントにおけるモデルの精度を評価した。試験セットのモデルからのCLカウントの精度を試験1の病理学者間の変動と比較した。検証の最後のステップでは、モデルを卵巣病理所見の有無にかかわらず試験に適用して、深層学習方法が病理学者からの所見と同様の所見をもたらすかどうかを調査した。試験3、4および5について、処理群と対照群との間のモデルCLカウントを比較した。試験3では、組織面積とCLカウントとの関係も調査した。表1は、5つの毒性試験、および各試験について病理学者が卵巣病理を所見したか否かをまとめたものである。
【0089】
表1は、試験設計の概要を示している。試験1は、2人の病理学者が注釈を付け、モデルの訓練および検証に使用した。試験2は、モデルと病理学者との間の一致を評価するために使用された。試験3、4、5のCLカウントをモデルから取得した。*50匹のラットは、26週間の投与後、15週間の回復期間を経た。**100匹の動物のうち79匹のみが病理学者からの手動CLカウントを有していた。
V.A.2 組織切片およびデジタル化
【0090】
試験では、ラットを剖検時に肉眼的に検査し、顕微鏡検査のために切片に加工するために固定した。単一のH&E切片が本発明者らの分析に適切であると予想されたが、卵巣の段階切片が個々の試験結果の一般的結論(対照と比較したCLカウントの変化)を潜在的に変化させるか否かを調べ、したがって、150μm離れた6つの5μm厚の切片を前向きに分析した。切片を、それぞれ、(第1の段階切片によって定義されるように)L1、L2、L3、L4、L5およびL6(最後の段階切片は、ブロック内の組織の量が最も少ない可能性が高い)とラベリングした。複数の切片において同じCLを捕捉する可能性を制限しながら、ほとんどの個々のCLを検出するために、CLのサイズに基づいて個々の150μmの段階切片を選択した。段階切片の分析からの知見に基づいて、試験2、4および5について、各卵巣からの単一の5μm厚のH&E切片を使用して試験を進めた。全スライド明視野スキャナを使用して、全てのH&E切片をデジタル化した。試験1、2および3からの切片をNanozoomerスキャナによってスキャンし、試験4および5からの切片をAperioスキャナによって20倍の倍率でスキャンした。
V.A.3 病理学者からの手動注釈
【0091】
試験1の全てのH&E切片は、CLについて病理学者Aおよび病理学者Bによって手動で注釈が付けられた。Aperio ImageScopeを使用して識別目的のために、組織切片に存在する全てのCLの周りに境界ボックスを描いた。総CLカウントは、各卵巣部分の境界ボックスの数をカウントすることによって計算した。病理学者間の変動を評価するために、全てのレベルから224個の卵巣H&E切片をランダムに選択し、双方の病理学者によって注釈を付けた。これらの224個の切片は、前述のように試験1サブセットとして定義された。残りの卵巣切片を半分に分割し、病理学者Aまたは病理学者Bのいずれかによって注釈を付けた。試験2では、試験セット(155個の卵巣切片)からの総CLカウントのみが病理学者AおよびCから報告された。試験2では、残りの卵巣切片について総CLカウントは報告されなかった。試験3、4および5の病理学者が手動で注釈を付けたCLはなかった。
V.A.4 画像処理、モデル訓練および推測
【0092】
5倍の倍率の画像を、全ての試験について20倍のスキャンから抽出した。画像をグレースケールに変換した後、Otsuの方法を使用して卵巣組織を識別した。次に、各画像が単一の卵巣のみを含むように画像を切り取った。卵巣の面積は、Otsuの閾値を適用した後の正の画素数を合計することによって計算した。
【0093】
例示的な一実施形態では、バックボーンとしての深層残差ニューラルネットワーク(50層バージョン)から構成されるRetinaNetをCL検出に使用した。ImageNetからの事前訓練された深層残差ニューラルネットワークを転移学習に使用した。試験1の切り取られた卵巣画像および注釈を使用して、RetinaNetを訓練した。病理学者Aおよび病理学者Bの双方が注釈付けした試験1サブセットについては、双方の病理学者からの境界ボックスを使用した。同じCLが双方の病理学者によって識別された場合、個々の注釈を単一の境界ボックスに組み合わせた。より小さい境界ボックスは、より大きい境界ボックスに置き換えられた。
【0094】
試験1の切片をランダムに訓練セット(90%)と検証セット(10%)とに分割した。切り取られた画像は、2500画素の最小辺(幅または高さ)または3000画素の最大辺(幅または高さ)でサイズ変更され、元のアスペクト比を維持した。ランダム消去、シフト、輝度、回転、ガウスぼかし、および弾性変換をデータ増強に使用して、モデルが訓練データのみから利用可能な状況外の状況下で実行することができることを保証した。特に、様々な試験は、試験1と同様の方法で捕捉された画像に対してモデルが実行された可能性があるが、必ずしも他の試験(例えば、試験4および5)ではないように、異なるシナリオで捕捉された。
【0095】
さらに、他の試験画像のRGB色のカラーマッピングなどの従来の増強技術は不十分であった。そのような変化は、通常、再マッピングされた色のノイズ(色相、彩度、または値のいずれかにおける)を導入し、これは、モデル性能に影響を与える。この問題に対処するために、試験1の画像間の画像平均と他の試験の画像の画像平均との間の差にランダム係数(-20から-40の範囲)を乗算し、さらなるデータ増強のために元の訓練画像に加算した。このさらなるデータ増強は、様々な試験からの推測のために挿入された画像のモデル性能を改善した。
【0096】
モデル訓練は、1のバッチサイズを使用して30エポックについて3000のステップサイズで行った。平滑L1損失(σ=3)を回帰損失に使用し、焦点損失(α=0.4およびγ=2)を分類損失に使用した。Adam最適化装置を最適化のために使用した(学習率=1×10-5)。
【0097】
訓練されたモデルを、試験2、3、4および5における切り取られた卵巣画像に適用した。推測中、切り取られた卵巣画像は、最初に上記と同じ方法を使用してサイズ変更され、次いで訓練されたモデルに供給された。CLの確率スコアを有する境界ボックスは、訓練されたモデルを切り取られた卵巣画像に適用した後に生成された。確率スコアが0.5未満の境界ボックスは無視した。各卵巣について、識別されたモデルCLの総カウントをカウントした。左右の卵巣の双方からの平均CLカウントも計算した。
V.A.5 統計分析
【0098】
前のセクションに記載した例示的なモデルの総CLカウントの精度を評価するために、訓練されたモデルを異なる実験プロトコルを用いた試験で試験し、試験セットの病理学者AおよびCからの共評価に対して検証した。ブランドアルトマン法およびスピアマンの順位相関係数を使用して、試験1サブセットにおける病理学者Aと病理学者Bとの間の卵巣あたりの総CLカウントの一致、ならびに病理学者(AおよびC)からの共評価と試験セットにおける訓練されたモデルとの間の一致を評価した。
【0099】
組織面積は、CLカウントと直線的に相関があることが予想された。切片化レベルに関連して組織面積とCLカウントとの間の関係を評価するために、スピアマンの順位相関係数を、試験3の全てのレベルおよび各レベルからの組織面積とCLカウントとの間で計算した。面積がより小さい組織は、CLがより少ない可能性が高いため、正規化のためにCLカウントを卵巣組織面積で除算した。クラスカル・ワリス検定を、全てのレベルからの正規化されたCLカウントの間ならびに試験3の全ての処理群および対照群からの正規化されたCLカウントの間で実施した。次に、全てのレベルから組織面積に対して正規化した平均CLカウントをラットごとに計算した。試験3、4および5の処理群(低用量、中用量および高用量)と対照群との間の組織面積に正規化した平均CLカウントを、それぞれウィルコクソン順位和検定を用いて比較した。画像分析および統計分析をPythonによって行った。モデルを、Keras/Tensorflowを使用して訓練した。訓練および推測は、単一のグラフィックス処理装置(Nvidia、P6000)を使用して実行した。
V.A.6 各毒性試験の詳細な試験プロトコル
【0100】
試験1:合計80匹のラットを試験1に含めた。ラットを、20対照群、低用量群、中用量群および高用量群に分け、化合物Aを、それぞれ、26週間、ビヒクル(逆浸透水中0.5%(w/v)ヒドロキシプロピルメチルセルロースおよび0.2%(w/v)ポリソルベート80、pH3.0)中、0、15、50および100(mg/kg/日)の用量レベルで、強制経口投与により1日2回投与した。
【0101】
試験2:合計100匹の雌ラットを試験2に含めた。ラットを2つの終末群と2つの回復群とに分けた(n=25ラット/群)。2つの終末群を、それぞれ1日2回の強制経口投与により、0および100(mg/kg/日)のビヒクルおよびビヒクル中の化合物B(逆浸透水中0.5%(w/v)ヒドロキシプロピルメチルセルロースおよび0.2%(w/v)ポリソルベート80)によって処理した。処理された終末群を、最終用量投与の5日後に未処理ラットと交配させた。共存期間の終了後、処理および未処理の雌ラットを、推定妊娠の13日目に病理検査のために安楽死させた。同じ投与プロトコルを2つの回復群に適用し、回復群の処理ラットを最終用量投与後15週間の回復後に未処理雄ラットと交配させた。共生期間後、雌を推定妊娠の13日目に安楽死させた。
【0102】
試験3:75匹のラットを試験3に含めた。ラットを対照、低、中、中-高、および高用量群に分割した(n=15ラット/群)。化合物Aを、それぞれ、13週間、0、10、15、150および500(mg/kg/日)の用量レベルで、経口胃管栄養法によって1日2回投与した。
【0103】
試験4:40匹のラットを4つの群(n=10ラット/群;対照、低、中および高用量群)に割り当てた。動物に、ビヒクル(10%ポリエチレングリコール400(PEG)/100mM N-メチルグルカミン(NMG)、pH8.5)またはビヒクル中の化合物Cのいずれかを、50、100または200mgの化合物C/kg体重(mg/kg)の用量レベルで、13週間にわたって1日1回経口投与した。
【0104】
試験5:40匹のラットを4つの群(n=10ラット/群;対照、低、中および高用量群)に割り当てた。動物に、ビヒクル(注射用水(pH6.7±0.3)中0.5%(w/v)メチルセルロース(20から30cps)および0.2%(w/v)ポリソルベート80)またはビヒクル中の化合物Dのいずれかを、10、30または100mg/kg体重(mg/kg)の化合物Dの用量レベルで、4週間にわたって1日1回経口投与した。
V.A.6 分析された全体的な組織面積は、存在するCLの数に影響を与える
【0105】
方法を開発および試験する最初のステップは、組織中のCLを正確に識別するようにモデルを訓練することであった。図5A図5B図5Cおよび図5Dは、試験2、3、4および5からの複数のCLを含むかまたはCLを含まない代表的な画像を示している。CLは、卵巣組織に存在する場合に正確に識別され、逆もまた同様であった。境界ボックスの上方の数字は、ボックス内に存在するCLの確率スコアを示している。(スケールバー:1mm)。CLの存在は、代表的な画像において病理学者によって確認された。CLを含む確率が50%を超える領域に境界ボックスを描いた。次に、CLカウントにおける訓練されたモデルの精度を定量化するために、訓練されたモデルを試験2に適用し、結果を試験1サブセットにおける病理学者間の変動と比較した。図6Aは、試験1における224個の卵巣組織からのCLカウントの病理学者間変動(病理学者Aと病理学者Bとの間)を評価するブランドアルトマンプロットを示している。図6Bは、病理学者(病理学者AおよびCの双方によって検討された)と、155個の卵巣組織についての試験3におけるCLカウントの訓練されたモデルとの間の一致を評価するブランドアルトマンプロットである。試験2は、訓練プロセスにおいてモデルに対して盲検化される。CLカウントの平均絶対差は、試験1のサブセットでは病理学者Aと病理学者Bとの間で0.64±0.088(平均および標準誤差)であり、CLカウントの平均絶対差は、試験セットでは病理学者と訓練されたモデルとの間で0.57±0.096であった。図6Cおよび図6Dは、試験1サブセットにおける病理学者Aおよび病理学者BからのCLカウント、ならびに試験セットにおける病理学者および訓練されたモデルからのCLカウントの散布図をそれぞれ示している。破線赤色線は、95%の一致限界を示している。実線赤色線は、病理学者A対病理学者Bまたは病理学者(AおよびC)対モデルのCLカウントの平均差を示している。ドットサイズは、同一のCLカウント数をlogスケールで表したものである。黒色破線は、CLカウントの完全な一致を示している。CLカウントを、試験1サブセットの病理学者AおよびBからの最大CLカウント、ならびに可視化目的のためにそれぞれ試験セットの病理学者およびモデルからの最大CLカウントで除算した。病理学者AとBとの間のCLカウントは強い相関があり(R=0.99、p<<0.01)、病理学者と訓練されたRetinaNetとの間のCLカウントも強い相関があった(R=0.97 p<<0.01)。
V.A.7 分析された全体的な組織面積は、存在するCLの数に影響を与える
【0106】
卵巣のさらなる切片化が、(標準的な一枚のスライドと比較して)試験所見のCL列挙数および全体的な解釈に影響を及ぼすかどうかに関する疑問に対処するために、150μm離れた6個の段階切片を評価に使用した。図7Aは、試験3の全レベルからのCLカウントに対する卵巣組織面積の散布図を示している。全てのレベルの全てのCLカウントを使用すると、CLカウントと卵巣組織面積との間に強い相関(R=0.73、p<<0.01)が観察され、評価された組織面積が少ないほど、存在するCLの数が少ないことを示した。各レベルにおいて、CLカウントおよび卵巣組織面積も有意に相関があった(L1、L2、L3、L4、L5およびL6について、それぞれ、R=0.57、0.52、0.64、0.73、0.75、0.73、全てp<<0.01)。CLカウントは、各レベルにおいて組織面積と有意に相関があったため、組織面積によってCLカウントを正規化すると、組織面積の影響を軽減することができた。各レベルにおけるCLカウントおよび組織面積ならびに正規化CLカウントの平均および標準誤差を表2にまとめた。
【0107】
表2は、試験3における各レベルでのCLカウントおよび組織面積の要約を示している。CLカウント、組織面積および正規化CLカウントの平均および標準誤差を計算した。切片化レベルがレベル1から6に変化したとき、CLカウントおよび組織面積は、約50%減少したが、正規化CLカウントは、比較的同じままであった。(N=75個の卵巣切片)
【0108】
レベルが増加すると、CLカウントおよび組織面積の双方が減少した。正規化されたCLカウントは、レベルが増加したときに比較的安定していた。図7Bは、異なるレベルの切片化において組織面積に対して正規化されたCLカウントを示している。クラスカル・ワリス検定から、全レベル間で組織面積に対する正規化CLカウントに有意差は認められなかった。試験3における各レベルおよび各用量群のCLカウントと組織面積との関係を調査するために、全ての用量群の各レベルでのCLカウントおよび組織面積ならびに正規化CLカウントの平均および標準誤差を表3に要約した。
【0109】
表3は、試験3における各用量群についての各レベルでのCLエンドポイントの要約である。CLカウントエンドポイントの平均および標準誤差を計算した。CLカウントおよび組織面積の双方は、レベルの増加と共に減少したが、正規化されたCLカウントは、各用量群について比較的同じままである。さらに、同じ切片化レベル内において、CLカウントおよび組織面積は、毒性が全ての用量群について卵巣に示されなかった場合、比較的同じであった。同じ切片化レベルを維持することは困難であり得るため、正規化が推奨される。(N=15個の卵巣切片/用量群あたりのレベル)
【0110】
レベルが増加すると、CLカウントおよび組織面積の双方が各用量群について減少した。全ての用量群間のCLカウントおよび組織面積は、各レベル内で同様の範囲であったが、正規化は、依然としてCLカウントに対する組織面積の影響を低減することができ、したがって推奨される。図7Cから、組織面積に対して正規化されたCLカウントは、全ての用量群について組織面積に対して正規化されたCLカウントが有意に異ならなかったことを示している。組織面積に対して正規化されたCLカウントは、未処理CLカウントと比較して、異なるレベルおよび用量群にわたって比較的安定していた。
V.A.8 組織面積に対して正規化した場合、モデル生成CLカウントは病理学者の試験解釈と一致する
【0111】
画像の病理学者の全体的な解釈および試験の結論に対する方法を試験するために、卵巣毒性所見を有する試験3に加えて、病理学者によってCLカウントの用量依存的変化が観察された2つの試験からの切片を使用した。図8A図8Bおよび図8Cは、試験3、4および5の対照群ならびに処理群のラットの組織面積に対して正規化した平均CLカウントを示している。試験3では、化合物Aを用いたラットについて卵巣毒性は識別されなかった(図8Aを参照)。試験4では化合物C(図8Bを参照)および試験5では化合物D(図8Cを参照)によって処理したラットについて卵巣毒性を識別した。対照ラットは、試験4および5の双方において、処理ラットよりも組織面積に対して正規化されたCLカウントを有意に示したが、対照ラットおよび処理ラットの組織面積に対して正規化されたCLカウントは類似していた。さらに、100mg/kg/日の用量群のラットは、10mg/kg/日の用量群よりも有意に組織面積に正規化されたCLカウントを示した。P値をウィルコクソン順位和検定(*:p<0.05、**:p<0.01)から計算した。試験4および5における対照群の組織面積に対して正規化されたCLカウントは、双方とも、双方の試験において全ての処理群よりも有意に高かった(対照群を任意の処理群と比較した場合、p<<0.01)が、試験3では正規化されたCLカウントに有意差は観察されなかった(p=0.27)。興味深いことに、図8Cでは、組織面積に対して正規化されたCLカウントは、試験5の高用量群と比較した場合、低用量群において有意に低かった(p<0.05)。
VI.さらなる考察
【0112】
本開示のいくつかの実施形態は、1つ以上のデータプロセッサを含むシステムを含む。いくつかの実施形態では、システムは、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させる命令を含む非一時的コンピュータ可読記憶媒体を含む。本開示のいくつかの実施形態は、1つ以上のデータプロセッサに、本明細書に開示された1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させるように構成された命令を含む、非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品を含む。
【0113】
使用された用語および表現は、限定ではなく説明の用語として使用され、そのような用語および表現の使用において、示されて説明された特徴の均等物またはその一部を除外する意図はないが、特許請求の範囲に記載された発明の範囲内で様々な変更が可能であることが認識される。したがって、特許請求の範囲に記載された本発明は、実施形態および任意の特徴によって具体的に開示されているが、本明細書に開示された概念の変更および変形は、当業者によってあてにされてもよく、そのような変更および変形は、添付の特許請求の範囲によって定義される本発明の範囲内にあると見なされることを理解されたい。
【0114】
その後の説明は、好ましい例示的な実施形態のみを提供し、本開示の範囲、適用可能性または構成を限定することを意図しない。むしろ、好ましい例示的な実施形態のその後の説明は、様々な実施形態を実装するための可能な説明を当業者に提供する。添付の特許請求の範囲に記載の趣旨および範囲から逸脱することなく、要素の機能および配置に様々な変更を加えることができることが理解される。
【0115】
実施形態の完全な理解を提供するために、以下の説明において具体的な詳細が与えられる。しかしながら、これらの具体的な詳細なしで実施形態が実施されることができることが理解されよう。例えば、回路、システム、ネットワーク、プロセス、および他の構成要素は、実施形態を不必要に詳細に不明瞭にしないために、ブロック図形式の構成要素として示されてもよい。他の例では、実施形態を不明瞭にすることを避けるために、周知の回路、プロセス、アルゴリズム、構造、および技術が不必要な詳細なしに示されてもよい。
図1
図2
図3
図4
図5
図6
図7
図8