IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ ロックフェラー ユニバーシティーの特許一覧

特表2022-504174無バイアス機械学習を使用して生物活性剤を特定するためのシステムおよび方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-01-13
(54)【発明の名称】無バイアス機械学習を使用して生物活性剤を特定するためのシステムおよび方法
(51)【国際特許分類】
   C12Q 1/02 20060101AFI20220105BHJP
   C12M 1/00 20060101ALI20220105BHJP
   C12M 1/34 20060101ALI20220105BHJP
   G06T 7/00 20170101ALI20220105BHJP
【FI】
C12Q1/02
C12M1/00 A
C12M1/34 Z
G06T7/00 350C
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021518464
(86)(22)【出願日】2019-10-04
(85)【翻訳文提出日】2021-05-27
(86)【国際出願番号】 US2019054826
(87)【国際公開番号】W WO2020072977
(87)【国際公開日】2020-04-09
(31)【優先権主張番号】62/741,107
(32)【優先日】2018-10-04
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TENSORFLOW
2.MATLAB
3.プルロニック
(71)【出願人】
【識別番号】592054292
【氏名又は名称】ザ ロックフェラー ユニバーシティー
(74)【代理人】
【識別番号】100092783
【弁理士】
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100103182
【弁理士】
【氏名又は名称】日野 真美
(74)【代理人】
【識別番号】100120134
【弁理士】
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100196966
【弁理士】
【氏名又は名称】植田 渉
(74)【代理人】
【識別番号】100104282
【弁理士】
【氏名又は名称】鈴木 康仁
(72)【発明者】
【氏名】メッガー,ヤコブ
(72)【発明者】
【氏名】エトック,フレッド
(72)【発明者】
【氏名】ブリヴァンロー,アリ
(72)【発明者】
【氏名】シッジャ,エリック
【テーマコード(参考)】
4B029
4B063
5L096
【Fターム(参考)】
4B029AA01
4B029AA07
4B029BB11
4B029CC02
4B029FA01
4B029FA09
4B029FA12
4B029GA03
4B029GB06
4B063QA01
4B063QA18
4B063QA19
4B063QQ02
4B063QQ08
4B063QQ42
4B063QQ70
4B063QQ79
4B063QR32
4B063QR48
4B063QR66
4B063QS33
4B063QS39
4B063QX01
4B063QX02
5L096BA06
5L096BA13
5L096GA30
5L096HA11
5L096JA22
5L096KA04
(57)【要約】
疾患に対して生物学的に活性である分子を特定するためのシステムおよび方法であって、試験分子の存在下のオルガノイド形成条件下で第1の哺乳動物細胞集団を培養して、第1のオルガノイドを得るステップであって、第1の哺乳動物細胞集団は、試験分子の非存在下のオルガノイド形成条件下で培養されると、疾患表現型を有するオルガノイドをもたらす、ステップ;試験分子に曝露した後で第1のオルガノイドを画像化するステップ;第1のオルガノイドの1つまたは複数の画像を、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるようにトレーニングされているニューラルネットワークを使用して分析するステップ;第1のオルガノイドに0%~100%の範囲の確率スコアを割り当てるステップを含み得、第1のオルガノイドの確率スコアが、非疾患のカットオフ確率スコアよりも高いか、または疾患のカットオフ確率スコアよりも低い場合、試験分子は、疾患に対して生物学的に活性である、方法が提供される。
【選択図】図1
【特許請求の範囲】
【請求項1】
試験オルガノイドを分類するための方法であって、
試験オルガノイドを画像化して、オルガノイド画像を準備するステップ;
前記試験オルガノイドに分類を割り当てるようにトレーニングされているトレーニングされたニューラルネットワークを用いて前記オルガノイド画像を分析するステップであって、前記分類が、疾患表現型または非疾患表現型を含む、ステップ
を含む方法。
【請求項2】
疾患表現型を有する前記オルガノイドの細胞が、前記疾患表現型を付与する1つまたは複数の突然変異を含む、請求項1に記載の方法。
【請求項3】
非疾患分類および疾患分類を有する前記オルガノイドの細胞が、同質遺伝子性である、請求項1または2に記載の方法。
【請求項4】
前記オルガノイドが、多細胞凝集体、幹細胞、多能性細胞、誘導多能性細胞、ヒト胚性幹細胞、成体幹細胞、全能性幹細胞、または非胚細胞を含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
疾患が、ハンチントン病を含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
画像化が、前記オルガノイドを1つまたは複数のマーカーについて染色することを含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記1つまたは複数のマーカーが、細胞小器官マーカー、細胞分化マーカー、細胞区画マーカー、またはそれらの組合せを含む、請求項6に記載の方法。
【請求項8】
前記1つまたは複数のマーカーが、核マーカー、膜マーカー、分化マーカー、またはそれらの組合せを含む、請求項6~7のいずれか一項に記載の方法。
【請求項9】
各オルガノイドの少なくとも2つの画像が分析され、各々が、異なるマーカーおよび異なる色チャネルに対応する、請求項6~8のいずれか一項に記載の方法。
【請求項10】
前記オルガノイド画像が、二次元画像または三次元画像を含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記トレーニングされたニューラルネットワークが、非疾患分類に属するオルガノイドの複数の画像および疾患分類に属するオルガノイドの複数の画像でトレーニングされたニューラルネットワークであり、前記ニューラルネットワークが、複数の層、および2つのノードを含む最終層を含む、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、前記全結合層が、少なくとも10個のノード、少なくとも100個のノード、少なくとも250個のノード、少なくとも400個のノード、少なくとも500個のノード、少なくとも600個のノード、少なくとも800個のノード、または少なくとも1000個のノードを含む、請求項11に記載の方法。
【請求項13】
疾患に対して生物学的に活性である試験分子を特定するための方法であって、
(a)第1の哺乳動物細胞集団をオルガノイド形成条件下で培養して、第1のオルガノイドを得るステップであって、前記オルガノイド形成条件が、試験分子への曝露を含み、前記第1の哺乳動物細胞集団が、生物学的に活性な分子の非存在下の前記オルガノイド形成条件で培養されると、疾患表現型を有するオルガノイドをもたらす、ステップ;
(b)前記試験分子への曝露後に、前記第1のオルガノイドを画像化するステップ;
(c)0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるようにトレーニングされているニューラルネットワークを使用して、前記第1のオルガノイドの1つまたは複数の画像を分析するステップ;
(d)前記第1のオルガノイドに0%~100%の範囲の確率スコアを割り当てるステップ
を含み、
前記第1のオルガノイドの前記確率スコアが、非疾患のカットオフ確率スコアよりも高いか、または疾患のカットオフ確率スコアよりも低い場合、前記試験分子が前記疾患に対して生物学的に活性であり、任意選択で、前記第1の哺乳動物細胞集団が、前記疾患表現型を付与する1つまたは複数の突然変異を含む、方法。
【請求項14】
前記ニューラルネットワークが、0%~100%の範囲の毒性または非毒性の確率スコアを割り当てるようにさらにトレーニングされており、前記方法が、任意選択で、前記第1のオルガノイドに、0%~100%の範囲の毒性または非毒性の確率スコアを割り当てるステップをさらに含む、請求項13に記載の方法。
【請求項15】
前記ニューラルネットワークの正確性を検証するステップをさらに含み、任意選択で、前記ニューラルネットワークの正確性の検証が、
(e)前記第1の細胞集団と同じ細胞タイプの第2の哺乳動物細胞集団を、オルガノイド形成条件下で培養して、前記疾患表現型を有しないオルガノイドをもたらす第2のオルガノイドを得るステップ;
(f)前記第2のオルガノイドを画像化するステップ;および
(g)前記第2のオルガノイドに、0%~100%の範囲の確率スコアを割り当てるステップであって、
前記第2のオルガノイドの確率スコアが、非疾患のカットオフ確率スコアより高いか、もしくは疾患のカットオフ確率スコアより低い場合、前記ニューラルネットワークが正確であるとみなされる、ステップ;
または
(h)前記第1の細胞集団と同じ細胞タイプの第2の哺乳動物細胞集団をオルガノイド形成条件下で培養して、前記疾患表現型を有するオルガノイドをもたらす第3のオルガノイドを得るステップ;
(i)前記第3のオルガノイドを画像化するステップ;および
(j)前記第3のオルガノイドに、0%~100%の範囲の確率スコアを割り当てるステップであって、
前記第3のオルガノイドの確率スコアが、非疾患のカットオフ確率スコアより低いか、もしくは疾患のカットオフ確率スコアより高い場合、前記ニューラルネットワークが正確であるとみなされる、ステップ
を含む、請求項13に記載の方法。
【請求項16】
前記第1の哺乳動物細胞集団が、前記疾患表現型を付与する1つまたは複数の突然変異を含み、前記第2の哺乳動物細胞集団が、前記1つまたは複数の突然変異以外、前記第1の哺乳動物細胞集団と同質遺伝子性である、請求項15に記載の方法。
【請求項17】
ステップ(e)が、ステップ(a)と同時に実施される、請求項15または請求項16に記載の方法。
【請求項18】
a. 前記第1の哺乳動物細胞集団が、前記試験分子の存在下で少なくとも3日間培養されるか、
b. 前記培養中の前記試験分子の濃度が、10nM~100μM、任意選択で1μM~20μMの範囲であるか、
c. 前記オルガノイド形成条件が、哺乳動物細胞集団をマイクロパターン上で培養することを含むか、
d. 前記第1の哺乳動物細胞集団が、幹細胞、任意選択で、全能性幹細胞、ヒト胚性幹細胞、もしくは多能性幹細胞の集団であり、任意選択で、前記オルガノイド形成条件が、培養培地中に1つもしくは複数の分化因子を含み、任意選択で、前記分化因子が神経分化因子であり、任意選択で、前記神経分化因子がBMP4であるか、または
e. a.~d.の任意の組合せである、
請求項13~17のいずれか一項に記載の方法。
【請求項19】
前記第1の哺乳動物細胞集団が、延長されたポリグルタミンリピートを有するハンチンチンタンパク質をコードし、任意選択で、前記延長されたポリグルタミンリピートが、42~150個のグルタミン残基を含む、請求項13~18のいずれか一項に記載の方法。
【請求項20】
前記第1の哺乳動物細胞集団が、マイクロウェルプレートで培養され、任意選択で、前記マイクロウェルプレートが、24ウェルマイクロウェルプレートである、請求項13~19のいずれか一項に記載の方法。
【請求項21】
前記第1の哺乳動物細胞集団が、1ウェル当たり20~30個のオルガノイドを産生する条件下で培養される、請求項20に記載の方法。
【請求項22】
前記オルガノイドを1つまたは複数のマーカーについて染色するステップをさらに含み、任意選択で、前記1つまたは複数のマーカーが、細胞小器官マーカー、細胞分化マーカー、細胞区画マーカー、またはそれらの組合せを含む、請求項13~21のいずれか一項に記載の方法。
【請求項23】
各オルガノイドの少なくとも2つの画像が分析され、各々が、異なるマーカーおよび異なる色チャネルに対応する、請求項13~22のいずれか一項に記載の方法。
【請求項24】
前記確率スコアが、0~1のスケールで与えられ、および/または前記カットオフ確率スコアが95%である、請求項13~23のいずれか一項に記載の方法。
【請求項25】
少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の前記カットオフ確率スコアが、非疾患を示す、請求項13~24のいずれか一項に記載の方法。
【請求項26】
疾患に対して生物学的に活性である分子を特定するために試験分子のコレクションをスクリーニングするための方法であって、前記コレクション内の各試験分子について、請求項13~25のいずれか一項に記載の方法を実施するステップを含み、任意選択で、試験分子が、個々にスクリーニングされるか、またはプール中でスクリーニングされる、方法。
【請求項27】
前記ニューラルネットワークが、畳み込みニューラルネットワークであり、任意選択で、前記ニューラルネットワークが、任意選択で18~152層を含む残差ネットワークであり、任意選択で、前記層が、畳み込み層、バッチ正規化(BatchNorm)層、および正規化線形ユニット(ReLU)層を含み、任意選択で、前記畳み込み層が、入力画像の3×3ピクセルブロックを畳み込むことが可能であり、任意選択で、前記ReLU層が、関数f(x)=max(0,x)を入力に適用することが可能であり、および任意選択で、前記BatchNorm層が、ニューラルネットワーク活性化を正規化することが可能である、請求項13~26のいずれか一項に記載の方法。
【請求項28】
前記ニューラルネットワークが、事前トレーニングされ、任意選択で、前記ネットワークが、
(a)疾患表現型を有するオルガノイドの入力画像の第1のトレーニングセット、および非疾患表現型を有するオルガノイドの入力画像の第2のトレーニングセットを受け取るステップ;
(b)前記入力画像の疾患または非疾患の確率スコアを、それらの真の値と比較するステップ;ならびに
(c)前記ニューラルネットワークにわたる逆伝播プロセス中に、前記ニューラルネットワークのノードの重みを更新するステップ
を含む方法により、疾患または非疾患の確率スコアを割り当てるようにトレーニングされる、請求項27に記載の方法。
【請求項29】
a. 入力画像の前記第1のトレーニングセットおよび入力画像の前記第2のトレーニングセットが各々、少なくとも500枚の画像を含み、および/または
b. 前記ネットワークが、前記入力画像を無作為の順序で受け取る
請求項28に記載の方法。
【請求項30】
ステップ(a)~(c)を少なくとも200~800回繰り返すステップをさらに含み、ステップ(a)~(c)の実施が、1回のエポックを含み、任意選択で、前記方法が、500回のエポックを含む、請求項28または29に記載の方法。
【請求項31】
(a)前記第1の細胞集団と同じ細胞タイプの第3の哺乳動物細胞集団を、前記疾患表現型を有するオルガノイドをもたらすオルガノイド形成条件下で培養するステップ;
(b)前記第1の細胞集団と同じ細胞タイプの第4の哺乳動物細胞集団を、前記疾患表現型を有しないオルガノイドをもたらすオルガノイド形成条件下で培養するステップ;
(c)前記第3および前記第4の哺乳類細胞集団から形成された前記オルガノイドを画像化するステップ;ならびに
(d)前記第3の哺乳動物細胞集団から形成された前記オルガノイドの1つまたは複数の画像および前記第4の哺乳動物細胞集団から形成された前記オルガノイドの1つまたは複数の画像を、前記ニューラルネットワークを使用して分析して、前記疾患表現型および非疾患表現型の潜在ベクトルを得るステップ
をさらに含む、請求項1~30のいずれか一項に記載の方法。
【請求項32】
前記ニューラルネットワークが、
(a)2つの最終ノードの上流にある全結合層を抽出するステップ;および
(b)試験分子と接触した前記第1の哺乳動物細胞集団に関連付けられる潜在ベクトルと、試験分子と接触していない前記第1の細胞集団に関連付けられる潜在ベクトルと、前記第2の細胞集団に関連付けられる潜在ベクトルとの間の差異を定量化して、試験分子と接触した前記第1の哺乳動物細胞集団と、試験分子と接触していない前記第1の細胞集団に関連付けられる潜在ベクトルと、前記第2の細胞集団に関連付けられる前記潜在ベクトルとの間の差異の程度を提供するステップ
を含む方法により、毒性または非毒性の確率スコアを、試験分子に曝露されたオルガノイドに割り当てる、請求項14~31のいずれか一項に記載の方法。
【請求項33】
前記差異の程度が、試験分子と接触した前記第1の哺乳動物細胞集団に関連付けられる前記潜在ベクトルと、試験分子と接触していない前記第1の細胞集団に関連付けられる潜在ベクトルと、前記第2の細胞集団に関連付けられる前記潜在ベクトルとの間の差異の最小値を取ることにより算出され、任意選択で、前記差異の程度が、潜在空間全体にわたって決定される、請求項32に記載の方法。
【請求項34】
(a)プロセッサ;および
(b)請求項1~12のいずれか一項の前記分析ステップを実装するプロセッサ実行可能命令を含む非一時的記憶媒体
を含むシステム。
【請求項35】
(a)プロセッサ;および
(b)請求項13~25のいずれか一項のステップ(c)を実装するプロセッサ実行可能命令を含む非一時的記憶媒体
を含むシステム。
【請求項36】
オルガノイド画像を受け取るため、およびニューラルネットワークを使用して、オルガノイドの1つまたは複数の画像をニューラルネットワークを使用して分析し、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるためのプロセッサ実行可能命令を含む非一時的な記憶媒体。
【請求項37】
オルガノイドの1つまたは複数の画像を分析し、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるようにニューラルネットワークをトレーニングするための方法であって、
(a)疾患表現型を有するオルガノイドの入力画像の第1のトレーニングセット、および非疾患表現型を有するオルガノイドの入力画像の第2のトレーニングセットを受け取るステップ;
(b)前記入力画像の疾患または非疾患の確率スコアを、それらの真の値と比較するステップ;ならびに
(c)前記ニューラルネットワークにわたる逆伝播プロセス中に、前記ニューラルネットワークのノードの重みを更新するステップ
を含む方法。
【請求項38】
(a)オルガノイドを画像化することが可能な画像化デバイス;
(b)(i)前記画像化デバイスからオルガノイド画像を受け取るように、および
(ii)ニューラルネットワークを使用して、前記オルガノイドの1つまたは複数の画像をニューラルネットワークを使用して分析し、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるように
構成されているプロセッサ
を含むシステム。
【請求項39】
(a)オルガノイドを画像化することが可能な画像化デバイス;
(b)(i)前記画像化デバイスからオルガノイド画像を受け取るように、および
(ii)ニューラルネットワークをトレーニングして、オルガノイドの1つまたは複数の画像を分析し、請求項37に記載の方法に従って0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるように
構成されているプロセッサ
を含むシステム。
【請求項40】
a. オルガノイドを画像化することが可能な画像化デバイス;
b. i.前記画像化デバイスからオルガノイド画像を受け取るように、
ii.ニューラルネットワークをトレーニングして、オルガノイドの1つまたは複数の画像を分析し、請求項37に記載の方法に従って0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるように、および
iii.前記ニューラルネットワークを使用して、前記オルガノイドの1つまたは複数の画像をニューラルネットワークを使用して分析し、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるように
構成されているプロセッサ
を含むシステム。
【請求項41】
試験分子の毒性を決定するための方法であって、
a)請求項13に記載の方法;
(b)潜在空間から野生型と疾患との間の距離を除去するステップ;
(c)野生型表現型および疾患表現型の平均ベクトルから距離を算出するステップ;
(d)ステップ(c)で算出された距離ならびに前記野生型表現型および前記疾患表現型の標準偏差を比較するステップ;ならびに
(e)毒性値を決定するステップ
を含む方法。
【発明の詳細な説明】
【技術分野】
【0001】
1.連邦政府が支援する研究に関する声明
本発明は、国立衛生研究所が授与したNIHR01GM101653および国立科学財団が授与したSTTR助成金に基づく政府支援によりなされた。連邦政府は、本発明にある特定の権利を有する。
【背景技術】
【0002】
2.背景
幹細胞をin vitroで分化させることにより、幹細胞が本来的に有するオルガノイドへの自己組織化能力を明らかにすることができる。理論上、オルガノイドは、in vitroで疾患をモデル化するために、および潜在的な治療剤を試験するためのツールとして使用するために、大いに有望である。しかしながら、こうした大型の多細胞構造は本来的に不均質性であるため、生物学的複雑性を十分に利用し、それを有用な治療予測へと変換することができる新しい定量化ツールが必要とされている。
【0003】
オルガノイドが定型的組織化を示すという事実は、原理的には、「野生型」(「WT」または「非疾患」)オルガノイドとその対応物である「疾患」オルガノイドとの間の表現型の差異を認識および定量化することを可能にする。故に、疾患表現型をWTに復帰させる薬理学的化合物について、オルガノイドをスクリーニングすることができる。
【0004】
オルガノイドに対するこのようなスクリーニングの下流における理想的な分析スキームでは、各化合物について、ヒット化合物の臨床への移行に関連する2つの量が定量化されることになる。第1に、治療能力を正確に決定する必要がある。第2に、毒性化合物を早期に拒絶することにより臨床治験の失敗が防止され、多額の無駄な投資が節減されることになるため、理想的には、有害な潜在的オフターゲット効果および細胞毒性が定量化される。
【発明の概要】
【0005】
3.概要
本開示は、疾患に対して生物学的に活性である試験分子を特定するための方法、および/または試験分子の潜在的毒性を定量化するための方法で使用することができる人工ニューラルネットワークを提供する。例示的なニューラルネットワークの特徴は、セクション5.2に記載されており、番号付きの実施形態は、セクション7に示されている。
【0006】
一部の実施形態では、ニューラルネットワークは、非疾患表現型と疾患表現型との間の差異を学習することができる。人工ニューロンの重みは、画像データベースの、例えば数百万枚の画像を有するImageNetデータベースの数多くの画像で事前トレーニングすることができる。その後、事前トレーニングしたネットワークを、非疾患オルガノイドおよび疾患オルガノイドの画像でトレーニングして、様々な利用可能なチャネルからの画像特徴の最良の組合せを学習させ、最適で無バイアスの非疾患および疾患フィンガープリントを特定することができる。トレーニングは、グラフィックスプロセッシングユニット(GPU)で実施することができ、多数の層を有するディープネットワークでさえ、トレーニングのサイズ、数、および難易度に応じて、わずか数分~数時間でトレーニングすることができる。トレーニング後、本開示のトレーニングされたネットワークの未見画像への適用は、一般に非常に高速であり、例えば、数千枚の画像を数秒で分析することができる。
【0007】
本開示は、疾患に対して生物学的に活性である試験分子を特定するための方法、および/または試験分子の潜在的毒性を定量化するための方法をさらに提供する。
【0008】
一態様では、本開示は、疾患に対して生物学的に活性である分子を特定するための方法であって、試験分子の存在下のオルガノイド形成条件下で哺乳動物細胞集団を培養してオルガノイドを得るステップであって、哺乳動物細胞集団は、生物活性分子の非存在下のオルガノイド形成条件下で培養されると、疾患表現型を有するオルガノイドをもたらす、ステップ;オルガノイドを画像化するステップ;0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるようにトレーニングされているニューラルネットワークを使用して、オルガノイドの1つまたは複数の画像を分析するステップ;およびオルガノイドに0%~100%の範囲の確率スコアを割り当てるステップを含む方法を提供する。その代わり、確率スコアの範囲は、0~1、0~10、またはいかなる任意の範囲であってもよい。試験分子は、オルガノイドの確率スコアが、非疾患のカットオフ確率スコアよりも高いか、または疾患のカットオフ確率スコアよりも低い場合、疾患に対して生物学的に活性であるとみなすことができる。疾患に対して生物学的に活性である分子を特定するための例示的な方法は、セクション5.2.5および5.3、ならびに番号付き実施形態1~122に記載されている。
【0009】
有利には、本開示のニューラルネットワークおよび方法の種々の実施形態は、疾患とWTとの間の利用可能な差異を最適な様式で使用することができる。第一に、試験分子の治療能力は、表現型復帰の程度により規定されるものとして測定することができる。加えて、WT表現型および疾患表現型を認識することできる分類子は、毒性表現型がどのように見え得るかを事前に指定することなく、毒性表現型に対応する第3のクラスの規定を可能にする。このクラスは、試験分子による処置に反応するが、表現型をWTに復帰させない様式で反応するオルガノイドを含んでいてもよい。この第3のクラスは、一般に、in vivoにて有害効果を示す可能性が高いと思われる化合物を含む。したがって、一部の実施形態では、本開示の方法は、本開示のニューラルネットワークを使用して、試験化合物で処置されたオルガノイドに、0%~100%の範囲(または0~1、0~10、もしくはあらゆる任意の範囲)の毒性または非毒性の確率スコアを割り当てるステップを含むかまたはさらに含む。毒性または非毒性の確率スコアを割り当てるための例示的な方法は、セクション5.2.6および5.3、ならびに番号付き実施形態1~122に記載されている。
【0010】
本開示は、プロセッサ、ならびに本開示の方法の分析および/または割り当てステップを実装するためのプロセッサ実行可能命令を含む非一時的記憶媒体(例えば、ハードディスク、フラッシュドライブ、CD、またはDVD)を含むシステムをさらに提供する。本システムは、オルガノイドを画像化することが可能な画像化デバイス(例えば、カメラを有する顕微鏡)をさらに含んでいてもよい。例示的なシステムは、番号付き実施形態1~122に記載されている。
【0011】
本開示は、オルガノイドの画像を分析し、疾患または非疾患の確率スコアを割り当てるようにニューラルネットワークをトレーニングするための方法をさらに提供する。例示的な方法は、セクション5.2.4および番号付き実施形態1~122に記載されている。
【0012】
本特許または出願ファイルは、カラーで処理された少なくとも1つの図面を含む。カラー図面を有する本特許または特許出願公報の複製は、請求および必要な料金の支払いに応じて当局から提供されることになる。
【図面の簡単な説明】
【0013】
図1】本開示の例示的なニューラルネットワークの構造を示す図である。
図2-1】本開示の例示的なニューラルネットワークをトレーニングするための態様、および試験化合物の治療能力および毒性を分析するためのそれらの使用を示すフローチャートである。図2Aは、ニューラルネットワークをトレーニングするための例示的なステップを示すフローチャートである。
図2-2】本開示の例示的なニューラルネットワークをトレーニングするための態様、および試験化合物の治療能力および毒性を分析するためのそれらの使用を示すフローチャートである。図2Bは、試験分子の治療能力を分析するための例示的なステップを示すフローチャートである。
図2-3】本開示の例示的なニューラルネットワークをトレーニングするための態様、および試験化合物の治療能力および毒性を分析するためのそれらの使用を示すフローチャートである。図2Cは、試験分子の治療能力および毒性を両方とも分析するための例示的なステップを示すフローチャートである。
図3-1】HDモデルオルガノイドの免疫蛍光分析を示す図である。図3A:側面図:DAPI、PAX6(緑色)、およびN-CAD(オレンジ色)。図3B:上面図:DAPI、神経マーカーPAX6(緑色)、神経堤マーカーSOX10(赤色)、および頭蓋プラコードマーカーSIX1(黄色)。
図3-2】HDモデルオルガノイドの免疫蛍光分析を示す図である。図3C:非神経外胚葉マーカーTFAP2A(青色)を含む側面図。表皮細胞は、TFAP2A+のみである。すべての縮尺バーは50μmを表す。
図3-3】HDモデルオルガノイドの免疫蛍光分析を示す図である。図3D:原腸陥入時のヒト胚の模式図。図3E:ヒトHDモデルオルガノイドの模式図。
図4-1】ハンチントン病(HD)細胞株の表現型シグネチャを示す図である。図4A:HDモデルオルガノイドアッセイにおける様々なHD同質遺伝子系統のPAX6区域の代表的な画像。PAX6染色は、Pax6区域の視覚化を可能にする。
図4-2】ハンチントン病(HD)細胞株の表現型シグネチャを示す図である。図4B:コロニー面積により正規化されたPAX6面積の関連定量化。
図5-1】HDモデルオルガノイド表現型の96ウェルプレートへの適応を示す図である。図5A:WT HDモデルオルガノイドを有するウェルのPAX6染色。図5B:HDモデルオルガノイドを有するウェルのPAX6染色。
図5-2】HDモデルオルガノイド表現型の96ウェルプレートへの適応を示す図である。図5C:2つの独立した96ウェルプレートの複数ウェルにおける2つの異なる遺伝的背景のPAX6+面積を、閾値に基づく区分化により定量化した。
図6-1】実施例1におけるアッセイZ’係数の測定を示す図である。図6A:WT/20CAG対照プレート(左)またはHD/56CAG対照プレート(右)における区分化によるPAX6+面積の測定。各ウェルは、その平均PAX6面積に応じて色分けされている。
図6-2】実施例1におけるアッセイZ’係数の測定を示す図である。図6B:ウェル間Z’係数の算出。各ウェルはZ’係数で色分けされており、関連する値が報告されている。
図7】機械学習支援表現型分析を示す図である。図7A:野生型表現型および疾患表現型を最適に認識するための例示的なネットワークのトレーニング。図7B:表現型復帰の定量化を示す。疾患表現型に薬物1を添加する:(下段)ネットワークは、今度は、薬物がない場合(上段)よりも野生型クラスに属する可能性がより高いことを示す。
図8】機械学習支援表現型分析を示す図である。図8A:異なる遺伝的背景からの画像の例:WT(RUES2)、Htt-/-、およびHtt過剰発現を伴うHtt-/-。WT(RUES2)画像およびHtt-/-画像を認識するようにネットワークをトレーニングした。図8B:ネットワークがこれまでにまったく見たことのない画像を分類するためにネットワークが検索され、ネットワークは、各画像について確率pwtを割り当てた。1の値は、画像がWTとして分類されたことを意味し、0の値は、画像がHtt-/-として分類されたことを意味する。WT画像およびKO画像は正確に分類された。レスキュー過剰発現実験の画像は、WTに属する可能性がより高いことを示した。
図9】正しく特定されたおよび誤って特定された20CAG(WT)画像および56CAG(疾患)画像のパーセンテージを示す図である。検証画像の総数:754枚(WT)および692枚(疾患)。
図10】ニューラルネットワーク支援表現型分析によるZ’係数のレスキューを示す図である。図10A:通常の区分化スキーム(黒丸)または機械学習ツールボックス(×印)を使用して算出したZ’係数の比較。すべてのウェルは、機械学習ツールボックスではZ’>0を示した。図10B:機械学習に基づく分析から得られたZ’スコアの分布。
図11】各化合物がHD疾患表現型をWTに復帰させる確率の分布を示す図である。この確率はpwtとして示されている。ほとんどの化合物は、疾患表現型を変化させなかったが、1に近いところにある低くてブロードなピークは、一部の化合物が疾患表現型の復帰に成功したことを示した。
図12】最終分類層上流に全結合潜在ベクトルを有する例示的なネットワークアーキテクチャ(図12A)、ならびに対照ウェルおよび化合物で処置されたウェルに対応する潜在ベクトルのt-SNEクラスター化(図12B)を示す図である。
図13】例示的なニューラルネットワークトレーニングおよび化合物の分類を示す図である。例示的なネットワークの最終予測であるWT対疾患は、薬物の表現型復帰の量を定量化する。最終分類前の潜在ベクトルを使用して、WTおよび疾患までの距離を両方とも規定することができ、それを毒性の尺度として使用することができる。
図14】ハンチントン病の突然変異を保持する幹細胞に由来する神経胚形成オルガノイドを使用した表現型復帰のスクリーニング結果を示す図である。各データポイントは、およそ25個のオルガノイドを有する1つのウェルを表す。緑色の点は、未処置対照ウェルに対応し、オレンジ色は、野生型対照ウェルである。5つの化合物は、野生型(WT)の角に近いところにあり、疾患表現型をWTに復帰させることが成功したことを示す。
図15】オートエンコーダーの例を示す図である。エンコーダーおよびデコーダーニューラルネットワークは、再構築されたデータが、入力データと可能な限り緊密に一致するようにトレーニングされており、潜在空間におけるデータの低次元表現がもたらされる。
図16】潜在ベクトルの視覚化を示す図である。(a)野生型(WT)画像および疾患画像の潜在ベクトルの主成分分析(PCA)であり、最初の2つの主成分(PC1、PC2)が表示されている。(b)同じベクトルを化合物のセットと重ね合わせたもの。(c)(a)と同じベクトルだが、WTと疾患との間の変分が除去されている。(d)(b)と同じベクトルだが、WTと疾患との間の変分が除去されている。
図17】本明細書に記載の方法(オートエンコーダー、「AE」)ならびに従来の「MTT」アッセイにより決定された、様々な薬物および濃度での細胞生存率を示す図である。
【発明を実施するための形態】
【0014】
5.詳細な説明
本開示は、疾患に対して生物学的に活性である試験分子を特定するために、および/または試験分子の潜在的毒性を定量化するために使用することができる人工ニューラルネットワークを提供する。例示的なニューラルネットワークは、セクション5.2に記載されており、番号付きの実施形態は、セクション7に示されている。
【0015】
一態様では、試験オルガノイドを分類するための方法は、試験オルガノイドを画像化して、オルガノイド画像を提供するステップ;試験オルガノイドに分類を割り当てるようにトレーニングされているトレーニングされたニューラルネットワークを用いてオルガノイド画像を分析するステップを含み、分類は、疾患表現型または非疾患表現型を含む。試験オルガノイドを分類するための例示的な方法は、セクション5.2.3~5.2.5および番号付き実施形態1~26に記載されている。
【0016】
一態様では、疾患に対して生物学的に活性である分子を特定するための方法は、試験分子の存在下のオルガノイド形成条件下で哺乳動物細胞集団を培養してオルガノイドを得るステップであって、哺乳動物細胞集団は、試験分子の非存在下のオルガノイド形成条件下で培養されると、疾患表現型を有するオルガノイドをもたらす、ステップ;オルガノイドを画像化するステップ;オルガノイドの1つまたは複数の画像を、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるようにトレーニングされているニューラルネットワークを使用して分析するステップ;およびオルガノイドに0%~100%の範囲の確率スコアを割り当てるステップを含む。試験分子は、オルガノイドの確率スコアが、非疾患のカットオフ確率スコアよりも高いか、または疾患のカットオフ確率スコアよりも低い場合、疾患に対して生物学的に活性であるとみなすことができる。疾患に対して生物学的に活性である分子を特定するための例示的な方法は、セクション5.2.5および5.3、ならびに番号付き実施形態27~121に記載されている。
【0017】
一部の実施形態では、本開示の方法は、試験化合物で処置されたオルガノイドに、0%~100%の範囲(または0~1、0~10、もしくはあらゆる任意の範囲)の毒性または非毒性の確率スコアを割り当てることを含むかまたはさらに含む。毒性または非毒性の確率スコアを割り当てるための例示的な方法は、セクション5.2.6および5.3、ならびに番号付き実施形態122~136に記載されている。
【0018】
本開示は、本開示の方法の分析ステップおよび割り当てステップを実装するためのプロセッサ実行可能命令を含む非一時的記憶媒体(例えば、ハードディスク、フラッシュドライブ、CD、またはDVD)、ならびにそのような非一時的記憶媒体およびプロセッサを含むシステムをさらに提供する。本システムは、オルガノイドを画像化することが可能な画像化デバイス(例えば、カメラを有する顕微鏡)をさらに含んでいてもよい。例示的なシステムは、番号付き実施形態140および141に記載されている。
【0019】
本開示は、オルガノイドの画像を分析し、疾患または非疾患の確率スコアを割り当てるようにニューラルネットワークをトレーニングするための方法をさらに提供する。例示的な方法は、セクション5.2.4および番号付き実施形態142~159に記載されている。
【0020】
5.1.定義
本明細書で別様に定義されていない限り、本明細書で使用されるすべての技術用語および科学用語は、当業者が一般的に理解するものと同じ意味を有する。本明細書に含まれている用語を含む種々の科学辞書は周知であり、当業者であれば利用可能である。本明細書で開示されている実施形態の実施には、本明細書に記載のものと類似のまたは等価な任意の方法および材料を使用することができる。
【0021】
直下で定義されている用語は、本明細書全体を参照することでより完全に理解される。定義は、特定の実施形態を説明することが目的であり、本明細書に記載の複雑な概念の理解を支援するためのものに過ぎない。定義は、本開示の完全な範囲を制限することが意図されているものではない。具体的には、本開示は、記載されている特定の配列、組成物、アルゴリズム、システム、方法論、プロトコール、および試薬に限定されないことを理解されたい。それらは、当業者が使用する状況に応じて様々であり得るからである。
【0022】
本明細書および添付の特許請求の範囲で使用される場合、単数形「a」、「an」、および「the」は、内容および状況による明確な別様の指定がない限り、複数の指示対象を含む。したがって、例えば、「デバイス」への言及は、2つまたはそれよりも多くのそのようなデバイスの組合せなどを含む。
【0023】
別様の指示がない限り、接続詞「または」は、ブール論理演算子としてのその正確な意味で使用されることが意図されており、選択肢における特徴の選択(Aの選択がBとは相互に排他的である場合の、AまたはB)、および特徴の同時選択(AおよびBが両方とも選択される場合の、AまたはB)を両方とも包含する。本文中の一部の箇所では、「および/または」という用語は同じ目的で使用されており、「または」は、相互に排他的な選択肢を参照するために使用されていることを示唆すると解釈されるべきではない。
【0024】
本明細書全体を通して、量は、範囲により、ならびに範囲の下限および上限により規定される。各下限を各上限と組み合わせることにより、範囲を規定することができる。下限および上限は、各々が別々の要素であるとみなされるべきである。
【0025】
「オルガノイド」という用語は、天然臓器に存在する細胞自己組織化、アーキテクチャ、およびシグナル伝達相互作用の側面を再現する、細胞の不均質な3D凝集塊を形成する細胞または組織培養物を指す。「オルガノイド」という用語は、懸濁細胞培養物から形成されるスフェロイドまたは細胞クラスター、ならびにマイクロパターン上で分化した幹細胞を含む。
【0026】
「スフェロイド」という用語は、単層としての成長ではなく3D成長を可能にするように培養された細胞の凝集体または集合体を指す。「スフェロイド」という用語は、凝集体が幾何学的な球体であることを示唆しないことに留意されたい。凝集体は、はっきりと規定された形態学的特徴を伴って高度に組織化されていてもよく、または組織化されていない塊であってもよく、単一の細胞タイプまたは1つよりも多くの細胞タイプを含んでいてもよい。
【0027】
「マイクロパターン」という用語は、マイクロ規模の特徴を有するパターンを指す。例えば、マイクロパターンは、マイクロメートル規模の直径を有する円もしくは球の繰り返しを含んでいてもよく、またはマイクロパターンは、マイクロメートル規模の線幅を有する線の繰り返しを含んでいてもよく、またはマイクロパターンは、繰り返し単位、例えば、正方形、三角形、ダイヤモンド形、ひし形、または他の二次元もしくは三次元の幾何学的形状であって、マイクロメートル規模の少なくとも1つの特徴、例えば、高さ、幅、長さなどを有する形状を含んでいてもよい。本開示の方法では他のマイクロパターンの使用が企図されており、自由形態の形状および/または幾何学的形状などを挙げることができる。マイクロパターンは、これらに限定されないが、リソグラフィー、ステンシル、およびエッチングなどを含む、当技術分野で認識されているマイクロパターン化技法を使用して生成することができる。
【0028】
「マーカー」または「バイオマーカー」という用語は、一般に、培養細胞集団におけるその発現または存在を標準的な方法(または本明細書で開示されている方法)により検出することができ、特定のタイプの細胞である培養細胞集団中の1つまたは複数の細胞と一致する、DNA、RNA、タンパク質、炭水化物、または糖脂質に基づく分子マーカーを指す。マーカーは、細胞により発現されるポリペプチドであってもよく、または遺伝子、制限エンドヌクレアーゼ認識部位、もしくは天然細胞により発現されるポリペプチドをコードする核酸(例えば、mRNA)などの、染色体上の特定可能な物理的位置であってもよい。マーカーは、「遺伝子発現マーカー」と呼ばれる遺伝子の発現領域であってもよく、または既知のコード機能を有していないDNAの一部のセグメントであってもよい。バイオマーカーは、細胞由来産物、例えば分泌産物であってもよい。
【0029】
「スクリーニング」は、1つまたは複数の分子の1つまたは複数の特性が決定されるプロセスを指す。例えば、典型的なスクリーニングプロセスとしては、1つまたは複数のライブラリーのメンバーである1つまたは複数の分子の1つまたは複数の特性が決定されるプロセスが挙げられる。
【0030】
「ライブラリー」は、小分子化合物、タンパク質、ペプチド、または核酸など、少なくとも2つの異なる分子のコレクションを指す。例えば、ライブラリーは、典型的には、少なくとも約10個の異なる分子を含む。大規模ライブラリーは、典型的には、少なくとも約100個の異なる分子、より典型的には少なくとも約1,000個の異なる分子を含む。一部の応用では、ライブラリーは、少なくとも約10,000個またはそれよりも多くの異なる分子を含む。
【0031】
「選択」は、1つまたは複数の分子を、1つまたは複数の目的の特性を有するものであると特定するプロセスを指す。したがって、例えば、ライブラリーをスクリーニングして、疾患表現型のWT(非疾患)表現型への復帰または毒性など、1つまたは複数のライブラリーメンバーの1つまたは複数の特性を決定することができる。ライブラリーメンバーの1つまたは複数が、目的の特性を保有すると特定された場合(例えば、疾患表現型のWT表現型への復帰)、それが選択される。選択は、ライブラリーメンバーを単離すること、および例えば動物モデルにおいてさらに試験することを含み得る。さらに、選択およびスクリーニングは、同時であってもよく、同時であることが多い。
【0032】
「細胞外マトリックス成分」という用語は、細胞付着および細胞成長のための基材として機能する、天然であるかまたは合成であるかを問わない分子または材料を指す。細胞外マトリックス成分の例としては、限定ではないが、コラーゲン、ラミニン、フィブロネクチン、ビトロネクチン、エラスチン、グリコサミノグリカン、プロテオグリカン、およびこうした成分の一部またはすべての組合せが挙げられる(例えば、MATRIGEL(商標)、Collaborative Research、カタログ番号40234)が挙げられる。
【0033】
「組織付着表面」という用語は、細胞がin vitroで接着することができるテクスチャ、電荷、またはコーティングを有する表面を指す。付着表面の例としては、限定ではないが、ステンレス鋼ワイヤー、VELCRO(登録商標)、縫合材料、天然腱、共有結合で修飾されたプラスチック(例えば、RGD複合体)、およびテクスチャ加工表面を有するシリコンゴムチューブが挙げられる。
【0034】
「トレーニングセット」は、1つまたは複数のモデルが、それに適用され、それに基づいて構築される、画像のセットを指す。例えば、オルガノイド表現型モデルの場合、トレーニングセットは、以下のセクション5.2.4に記載されているように、任意選択で1つまたは複数のマーカーで染色された非疾患および疾患オルガノイドの画像を含む。
【0035】
5.2.ニューラルネットワーク
5.2.1.ネットワークアーキテクチャ
人工ニューラルネットワーク(ANN)は、はるかに小規模ではあるものの哺乳動物大脳皮質の神経構造を概略的にモデル化した処理デバイス(アルゴリズムまたは実際のハードウェア)である。ANNにおける計算の基本単位はニューロンである。本明細書で使用される場合、「ニューロン」という用語は、「ノード」という用語と同義的に使用される。大規模なANNは、数百または数千または数百万個のニューロンを有することができる。
【0036】
ニューラルネットワークは、典型的には、層状に組織化されている。層は、「活性化関数」を含む数多くの相互結合「ノード」で構成されている。パターンは、「入力層」を介してネットワークに提示され、入力層は、1つまたはそれよりも多くの「隠れ層」と通信し、実際の処理は、隠れ層において、重み付けされた「結合」の方式で行われる。本明細書で使用される場合、「隠れ層」という用語は、「潜在層」という用語と同義的に使用される。次いで、隠れ層は、図1の例示的なネットワークに示されているように、答えが出力される「出力層」に結合されている。
【0037】
本開示のニューラルネットワークは、PyTorchまたはTensorFlowなどの機械学習フレームワークを使用してコードすることができる。
【0038】
5.2.2.畳み込みニューラルネットワーク
畳み込みニューラルネットワーク(ConvNetまたはCNN)は、画像認識および分類に使用されるANNの一種である。CNN画像分類は、入力画像を取得し、それを処理し、それをカテゴリーに分類し、特徴を手動で抽出する必要が排除されている。コンピューターは、入力画像をピクセルの配列として捉えるため、画像解像度によって、コンピューターが画像をそれへと処理することになる行列の配列タイプ(h×w×dの点で。この場合h=高さ、w=幅、d=次元である)が決定されることになる。例えば、RGBは、配列が6×6×3(3はRGB値を指す)の行列の画像であり、グレースケール画像は、配列が4×4×1の行列の画像である。
【0039】
CNNは、各々が画像の異なる特徴の検出を学習する数十または数百個の層を有していてもよい。CNNは、トレーニング画像のセットをCNNに表示することによりトレーニングすることができる。様々な解像度の各トレーニング画像にフィルターを適用することができ、各畳み込み画像の出力が、次の層への入力として使用される。フィルターは、輝度および輪郭などの非常に単純な関数から開始して、物体を一意的に規定する特徴へと複雑さを増加させることができる。
【0040】
他のニューラルネットワークと同様に、CNNは、入力層、出力層、および一般にその間にある多数の隠れ層で構成されている。こうした層は、データに特異的な特徴を学習する目的でデータを変更する操作を実施する。最も一般的な3つの層は、畳み込み、活性化、またはReLU、およびプーリングである。
【0041】
ディープラーニングCNNを用いてトレーニングおよび分析を実施する場合、各入力画像は、一般に、フィルター(カーネル)層、プーリング層、および全結合層(FC)を有する一連の畳み込み層を通過し、最終ソフトマックス関数が、物体を0~1(または0%~100%、0~10、もしくはあらゆる任意の範囲)の確率値で分類することになる。
【0042】
5.2.2.1.畳み込み層
畳み込みは、入力画像から特徴を抽出するための最初の層である。畳み込みでは、入力データの小さな正方形を使用して画像の特徴を学習することにより、ピクセル間の関係性が保存される。これは、画像行列およびフィルターまたはカーネルなど2つの入力をとる数学演算である。様々なフィルターを用いた画像の畳み込みでは、フィルターを適用することにより、輪郭検出、不鮮明化、および鮮明化などの操作を実施することができる。
【0043】
5.2.2.2.ストライド
ストライドは、入力行列をシフトさせるピクセル数である。ストライドが1の場合、フィルターは、一度に1ピクセルだけ移動する。ストライドが2の場合、フィルターは、一度に2ピクセルだけ移動するなどである。
【0044】
5.2.2.3.パディング
フィルターは、入力画像と完全には適合しないことがある。その場合、画像が適合するように画像をゼロでパディングし(ゼロパディング)するか、またはフィルターが適合しない画像の部分を削除することができる。後者は、有効パディングと呼ばれ、画像の有効部分のみが維持される。
【0045】
5.2.2.4.非線形性(ReLU)
ReLUは、非線形演算のための正規化線形ユニット(RectifiedLinearUnit)の略である。出力は、f(x)=max(0,x)である。ReLUの目的は、ConvNetが、入力画像と分類との間の非線形関係性を学習するために、ConvNetに非線形性を導入することである。ReLUの代わりに使用することもできるtanhまたはシグモイドなどの他の非線形関数が存在する。性能的にはReLUが他の2つよりも優れているため、ReLUが好ましい。
【0046】
5.2.2.5.プーリング層
プーリング層は、画像が大きすぎる場合にパラメーターの数を低減することができる。空間プーリング(サブサンプリングまたはダウンサンプリングとも呼ばれる)は、各マップの次元性を低減するが、重要な情報は維持される。空間プーリングは、最大プーリング、平均プーリング、合計プーリング(sum pooling)など、異なるタイプのものであってもよい。最大プーリングは、正規化特徴マップ(rectified feature map)から最も大きな要素をとる。平均プーリング層では、入力を長方形プーリング領域に分割し、各領域の平均値を算出することにより、ダウンサンプリングが実施される。特徴マップの全要素の合計は、合計プーリングと呼ばれる。
【0047】
5.2.2.6.全結合層
全結合層は、その前の層の全ニューロンをとり、それらを全結合層が有する1つ1つのニューロンと結合させる。全結合層では、行列をベクトルへと平坦化し、ニューラルネットワークと同様に全結合層へと供給することができる。本開示のニューラルネットワークは、1つよりも多くの全結合層を有してもよい。全結合層を用いると、特徴を一緒に組み合わせてモデルを作出することができる。ソフトマックスまたはシグモイドなどの活性化関数を使用して、出力を、例えば野生型(非罹患)または疾患に分類することができる。
【0048】
5.2.3.非疾患オルガノイドおよび疾患オルガノイドを分析するためのニューラルネットワーク
事前トレーニングされた畳み込みネットワークは、通常、トレーニングされていないネットワークよりも相当程度に効率的であり、したがって、一部の実施形態では、非疾患表現型または疾患表現型を有するオルガノイドの画像を分類するためのニューラルネットワークを製作するために、事前トレーニングされたネットワークが使用される。2D画像の場合、ImageNetデータベースで事前トレーニングされた畳み込みNNを提供するフレームワークが市販されている(例えば、ResNet、DenseNet、またはVGG16)。3D画像の場合、Kineticsデータセットで事前にトレーニングされたNNが市販されている(例えば、ResNetまたはDenseNet)。事前トレーニングは、ImageNetまたはKinetics以外のデータベースで実行してもよいが、ImageNetおよびKineticsは、非常に大規模で包括的な画像のデータセットを提供する。他のネットワークアーキテクチャも使用することできるが、畳み込みネットワークは、画像分類に優れており、好ましい。
【0049】
畳み込みネットワークのサブクラスである残差ネットワーク(ResNets)は、画像分類が特に効率的である。一部の実施形態では、18~152層のResNetが、本開示のシステムおよび方法に使用される。様々な深さ(18、34、50、101、または152個の層を有する)の事前トレーニングされたResNetが、主要な機械学習フレームワーク(例えば、ResNet18、ResNet34、ResNet50、ResNet101、またはResNet152)にて利用可能である。それらは、畳み込み層、バッチ正規化(BatchNorm)層、および正規化線形(ReLU)層で構成される層のブロックを含んでいてもよい。事前トレーニングされたResNetに提供されている最終平均プーリングおよび密結合層(final Average Pooling and densely connected layer)を削除して、本明細書に記載のようなカスタム層に置き換えてもよい。畳み込み層を使用して、トレーニングプロセス中に学習されたフィルターを用いて入力画像の3×3ピクセルブロックを畳み込んでもよい。ReLUは、関数f(x)=max(0,x)を入力すべてに適用するために使用することができる非線形活性化層である。これは、画像と分類との間の非線形関係性を学習するために必要な非線形性をネットワークに導入する。BatchNorm層を使用して、ネットワーク活性を正規化することができ、これにより、安定性が向上し、より効率的なトレーニングが可能になる。
【0050】
NNの最終層は、一般に、初期層よりもデータセットに特異的であり、したがって、既製の事前トレーニングされたネットワークの最終平均プーリングおよび全結合層を削除して、全結合層に加えて、トレーニングされていない適応平均プーリング層(Adaptive Average Pooling)、適応最大プーリング層(Adaptive Maximum Pooling)、Batch Norm層、ドロップアウト層の一部またはすべてに置き換えて、続いて非疾患表現型または疾患表現型を有するオルガノイドの画像を分類するための最終ソフトマックス演算を行ってもよい。好ましくは、ニューラルネットワークは、適応平均プーリング層、適応最大プーリング層、Batch Norm層、およびドロップアウト層を含むが、Batch Normおよび/またはドロップアウトなど、そうした層の一部が省略されている実施形態も企図される。プーリング層は、表現されているものの空間サイズを低減し、ドロップアウト層は、過剰適合を回避することができ、全結合層は、その前の層のすべての活性化にアクセスを有し、それらをすべて一緒にまとめる(これは、分類ネットワークの最終層の初期設定である)。好ましい実施形態では、512個ニューロンの全結合層が使用され、その直後の最終全結合層は、各々1つが非疾患用および疾患用である2つのニューロンのみからなる。最終ソフトマックスを使用して、こうしたニューロンの活性化を合計で1になる確率へと変換することができる。
【0051】
5.2.4.トレーニング
ほとんどのANNは、それに提示される入力パターンに従って結合の重みを変更する何らかの形態の「学習ルール」を含む。
【0052】
ニューラルネットワークにより使用される学習ルールには多数の異なる種類が存在し、そのうちの1つはデルタルールと呼ばれる。デルタルールは、「逆伝播ニューラルネットワーク(backpropagational neural networks)」(BPNN)と呼ばれる最も一般的なクラスのANNにより使用されることが多い。逆伝播は、誤差の後方伝播の略語である。
【0053】
デルタルールを用いると、他のタイプの逆伝播の場合と同様に、「学習」は、前方出力活性化フローおよび重み調整の後方誤差伝播により各サイクル(「エポック」とも呼ばれる)で生じる教師付きプロセスである。より簡単に言えば、パターンが最初にニューラルネットワークへと提示されると、ネットワークはそれが何であり得るかについて無作為な「推測」を行う。次いで、ネットワークは、その答えが実際の答えからどれだけ離れていたかを確認し、結合の重みを適切に調整する。
【0054】
各隠れ層ノード内には、非線形性を導入するシグモイド活性化関数が存在する。
【0055】
逆伝播では、誤差表面の最も急峻なベクトルに沿って「グローバル最小値」へと向かう、解のベクトル空間内での勾配降下が実施される。グローバル最小値は、最も低い考え得る誤差を有する理論解である。ほとんどの問題では、解スペースは、非常に不規則であり、ネットワークが最良の全体解ではない「局所的最小値」に定着してしまうことを引き起こし得る少なからぬ「ピット」および「ヒル」を有する。
【0056】
誤差空間の性質を事前に知ることはできないため、ニューラルネットワーク分析は、最良の解を決定するために数多くの個々の実行を必要とすることが多い。学習ルールには、一般に、学習の「速度」(β係数)および学習の「モメンタム」を制御する、このプロセスを支援するための数学的な項が組み込まれている。学習の速度は、実際には、現在の解とグローバル最小値との間の収束速度である。モメンタムは、ネットワークが、誤差表面の障害物(局所的最小値)を克服し、グローバル最小値にまたはその付近に定着することを援助する。
【0057】
ニューラルネットワークを過剰トレーニングしてしまう可能性もあり、これは、ネットワークが1つのタイプの入力のみに正確に応答するようにトレーニングされていることを意味する。過剰トレーニングされたネットワークは、新しい入力に対しては良好に機能しないため、有用ではない。
【0058】
本開示のニューラルネットワークは、トレーニング画像(例えば、70%)および検証画像(例えば、30%)に分割された非疾患オルガノイド画像および疾患オルガノイド画像のセット(好ましくは、マルチチャネルである)を使用してトレーニングすることができる。好ましくは、トレーニング画像は、少なくとも300枚の非疾患画像および300枚の疾患画像(例えば、各々300~2000枚の画像、各々300~1500枚の画像、各々300~1000枚の画像、または各々300~500枚の画像)またはそれよりも多くを含む。画像は、2D画像であってもよくまたは3D画像であってもよい。次いで、ニューラルネットワーク(NN)を、トレーニングデータセットでトレーニングすることができる。
【0059】
トレーニングセット内の画像は、細胞小器官マーカー、細胞分化マーカー、細胞区画マーカー、またはそれらの組合せなどの1つまたは複数のマーカーについて染色されたオルガノイドの画像を含んでいてもよい。1つまたは複数のマーカーとしては、好ましくは、オルガノイドの肉眼的な形態学的特徴および/またはオルガノイドに含まれる特定の細胞集団を強調する1つまたは複数のマーカーが挙げられる。例示的な染色試薬としては、核染色(例えば、DAPIおよびヘキスト核染色)、BrdU、カルセイングリーン、DiI、DiO、DiD、およびDiRなどの膜色素、GM130に対する蛍光標識抗体などのゴルジ染色試薬、ER-Tracker(商標)Green(Cell Signaling Technology)などのER染色試薬、ファロイジン、ならびにN-カドヘリン、E-カドヘリン、ZO-1、およびコラーゲンに対する蛍光標識抗体が挙げられる。
【0060】
特定のタイプのオルガノイドまたは特定のタイプの分化細胞に特異的な試薬も使用することができる。例えば、ニューロフィラメントまたはネスチンを染色するための試薬(例えば、蛍光標識抗体)を使用して、脳オルガノイドを染色することができる。PAX6染色試薬を使用して、神経細胞集団を染色することができる。SOX10染色試薬を使用して、神経堤細胞を染色することができる。
【0061】
トレーニングは、画像をネットワークに対して表示し、WTまたは疾患の出力確率を真の値と比較し、画像が次回にネットワークに対して表示される際に、ネットワークが真の値により近い予測を示すことになるように、ネットワークの重みを変化させることにより実施することができる。好ましくは、画像は、トレーニング中に無作為の順序でネットワークに対して表示される。適合手順は、主要なニューラルネットワークフレームワークに実装されている逆伝播アルゴリズムを使用して実施される。画像は、ネットワークに対して、何回も、例えば、200~800回、300~700回、または400~600回(例えば、約200回、約300回、約400回、約500回、約600回、約700回)表示される。画像は、画像の内容を著しくは変化させないが、ネットワークが学習することができる画像のプールを拡大する1組の画像変換を各画像に適用することにより「拡張」される。データ拡張操作としては、以下のもの:回転、トリミング、画像の90~110%拡大縮小、および画像のコントラストの変更の一部またはすべて(例えば、1、2、3、または4つすべて)を挙げることができる。トレーニングを様々なハイパーパラメーター(層の数、モメンタムおよび学習速度、ドロップアウトパーセンテージ、エポック数)で数回実行して、こうしたパラメーターの最適なセットを見出すことができる。一部の実施形態では、ハイパーパラメーターは、以下のもの:層の数、モメンタムおよび学習速度、ドロップアウトパーセンテージ、およびエポック数の2つ、3つ、または4つの組合せを含む。
【0062】
データ拡張およびドロップアウトは、過剰適合を回避するための2つの戦略である。トレーニングセットおよび検証セットでネットワーク性能を比較することにより、過剰適合および過小適合を試験することができる。トレーニング正確性が検証正確性よりも高い場合、ネットワークは過剰適合しており、その逆の場合は過小適合している。分類の正確性は、正しく分類された画像のパーセンテージを算出することにより検証画像セットを使用して評価することができる。この評価から、ネットワークの正確性を測定する「Z’」スコアを算出することができる。0.5よりも高いZ’スコアは、良好なスクリーニングアッセイであることを示す。事前トレーニングされたネットワークでは、トレーニング用の画像の数は比較的少なくてもよく、好ましくは、最低で約500枚のトレーニング画像であってもよい。
【0063】
WTおよび疾患への分類は、画像がWTであるか疾患であるかに関する情報がトレーニング中にネットワークに与えられるため、教師付き学習の例である。教師付きトレーニング戦略は、画像クラス(WTおよび疾患)が事前に判明している場合、当然の選択である。
【0064】
一部の実施形態では、教師なし学習を、本明細書に記載の方法に従って使用する。教師なし学習の例としては、オートエンコーダーの使用が挙げられる。図1を参照されたい。エンコーダーおよびデコーダーニューラルネットワークは、再構築されたデータが、入力データと可能な限り緊密に一致するようにトレーニングされており、潜在空間におけるデータの低次元表現をもたらす。オートエンコーダーは、入力を出力として再現することを目的とする、教師なしの様式で効率的なデータコーディングを学習するために使用される一種の人工ニューラルネットワークである。オートエンコーダーは、典型的には、シグナル「ノイズ」を無視するようにネットワークをトレーニングすることにより、典型的には次元性削減のためにデータセットの表現(エンコーディング)を学習するように設計されている。低減側と共に、再構築側が学習され、オートエンコーダーは、低減されたエンコーディングから、その元の入力にできるだけ近い表現、つまりその名称の生成を試みる。
【0065】
典型的なオートエンコーダーは、入力層、隠れ層、および出力層を含む。さらに、入力データは入力層を通過し、隠れ層に入る。隠れ層のノード数は、典型的には、入力層のノード数よりも少なく、データの次元が低減される。したがって、圧縮またはエンコーディングが実施される。エンコーディングに続いて、隠れ層からのデータ出力は出力層に入る。典型的には、出力層のノード数は、隠れ層のノード数よりも大きいため、データの次元が増加する。したがって、解凍またはデコーディングが実施される。
【0066】
この機械学習方法が教師なしであるという性質には、オートエンコーダーが、データに関する追加情報(それが野生型細胞株に由来するかまたは疾患細胞株に由来するかなど)を一切用いずにデータの表現を学習するという利点があり、したがって化合物毒性の推定にバイアスがかからない。また、ベクトルによるデータ表現には、野生型表現型と疾患表現型との差異をベクトル空間から除去することができるという利点もある。それは、この差異が毒性決定には関連性がないからである。例示的な実施形態では、オートエンコーダー、特に畳み込みオートエンコーダーを使用して、
(a)潜在空間から野生型と疾患との間の距離を除去するステップ;
(b)野生型表現型および疾患表現型の平均ベクトルから距離を算出するステップ;
(c)ステップ(b)で算出された距離ならびに野生型表現型および疾患表現型の標準偏差を比較するステップ;ならびに
(d)毒性値を決定するステップ
により毒性を決定することができる。
【0067】
ニューラルネットワークトレーニングの例示的実装を示すフローチャートが図2Aに示されている。トレーニングプロセス100は、トレーニング画像セットを用いてブロック110から始まる。トレーニング画像セット110は、上記に記載のような非疾患表現型オルガノイドおよび疾患表現型オルガノイドの画像を含んでいてもよい。まず、一組の画像変換を適用することにより画像を拡張する(例えば、上記に記載のように)。ブロック111では、個々の画像を、ニューラルネットワークにより分析し、次いでブロック112でニューラルネットワークにより疾患オルガノイドまたは非疾患オルガノイドに分類する。ブロック113では、分類を真の値と比較し、画像が次回にニューラルネットワークに対して表示される際に、分類が真の値により近づく可能性がより高くなるように、ネットワークの重みが更新される。トレーニングセット内のすべての画像をネットワークに対して表示したら、このプロセスを、所定の回数(例えば、約500回)繰り返す。すべての繰り返しが完了したらトレーニングは完了であり、ブロック115にて、トレーニングされたニューラルネットワークが提供される。
【0068】
5.2.5.分析
ニューラルネットワークが満足のいくレベルに「トレーニング」されたら、他のデータの分析ツールとして使用することができる。そのために、ユーザーは、もはや一切のトレーニング実行を指定せず、代わりにネットワークが順伝播モードでのみ動作することを許可する。新しい入力が、入力パターンに対して提示され、そこに新しい入力がフィルタリングされて入り、あたかもトレーニングが行われているかの如く中間層により処理されるが、この時点で出力は維持されており、逆伝播は生じない。順伝播実行の出力は、データの予測モデルであり、その後それをさらなる分析および解釈に使用することができる。
【0069】
本開示のニューラルネットワークを使用して、試験分子に曝露されたオルガノイドの画像を分析することができる。試験分子で処置されたオルガノイドの画像を、ネットワークにより分析することができる。ネットワークは、0~1(または0%~100%、0~10、もしくはあらゆる任意の範囲)の確率スコアを各画像に割り当てることができる。この場合、1はWTを表し、0は疾患を表す。同じ化合物で処置した異なるオルガノイドのスコアを平均してもよい(例えば、化合物のスコアを得るために)。このスコアは、疾患表現型がどの程度WTへと復帰したかの指標である。化合物をそれらのスコアで順位付けすることができ、スコアが>0.95である化合物は、疾患表現型をWTへと非常に明確に復帰させたと特定することができる。
【0070】
ネットワークの正確性は、好ましくは、未処置対照オルガノイドを使用することにより検証される。未処置対照オルガノイド、好ましくは非疾患オルガノイドおよび疾患オルガノイドの両方を、処置オルガノイドと同様に疾患または非疾患に分類することができ、カットオフ量よりも大きな対照オルガノイドが正しく分類されれば、ニューラルネットワークは正確であるとみなすことができる。例えば、対照オルガノイドが、50%よりも高い確率で、60%よりも高い確率で、70%よりも高い確率で、80%よりも高い確率で、90%よりも高い確率で、または95%よりも高い確率で非疾患または疾患に正しく分類される場合、ニューラルネットワークは、正確であるとみなすことができる。一部の実施形態では、正確性検証は、化合物スクリーニングと同時に実施される。
【0071】
疾患に対して生物学的に活性である分子を特定するためのプロセスの例示的実装を示すフローチャートが図2Bに示されている。プロセス101は、疾患オルガノイドを試験分子に曝露させるブロック120から始まる(例えば、セクション5.3.3に記載のように)。次いで、オルガノイドを、ブロック121で画像化して、オルガノイドの1つまたは複数の画像を得る。次いで、画像を、ブロック122にて、疾患または非疾患の確率スコアを割り当てるようにトレーニングされているトレーニングされたニューラルネットワークで分析する。最後に、ニューラルネットワークは、ブロック123にて、試験分子に曝露された疾患オルガノイドに、疾患または非疾患の確率スコアを割り当てる。確率スコアが、疾患表現型の非疾患表現型への復帰を示す場合(例えば、確率スコアをセクション5.3.3に記載のようにカットオフと比較することにより決定される)、試験分子は、疾患に対して生物学的に活性であると特定することができる。
【0072】
5.2.6.毒性
毒性は、上記に記載のものと同じ分類ネットワークを使用するが、最後の2つのニューロンの上流にある全結合層のニューロン(例えば、セクション5.2.1に記載のような512個のニューロン)を使用することにより分析することもできる。好ましい実施形態では、最後から2番目の全結合層が使用される。512個ニューロンの全結合上流層は、最終的な二次元(非疾患対疾患)ベクトルよりも多くの情報を含む512次元ベクトルとみなすことができる。この高次元の潜在ベクトルに含まれる情報を使用して、化合物がどの程度毒性であるかの尺度を規定することができる。一部の実施形態では、オートエンコーダー(例えば、畳み込みオートエンコーダー、または変分オートエンコーダー、スパースオートエンコーダー、またはノイズ除去オートエンコーダーなどの他のオートエンコーダー)が、毒性分析に使用される。
【0073】
ネットワークにより分析される各オルガノイド画像は、表現型(WT対疾患)スコアに加えて、潜在ベクトルをもたらす。同じ化合物に曝露されたオルガノイドの潜在ベクトルを、WT潜在ベクトルおよび疾患潜在ベクトルと同様に平均することができる。こうしたベクトルは、任意選択で、t分布型確率的近傍埋め込み法(t-distributed stochastic neighbor embedding(t-SNE)を使用して二次元空間へとクラスター化することができる。主成分分析(PCA)のような他の次元性低減法も使用することができる。試験分子で処置したオルガノイドの潜在ベクトルと、最も近い未処置オルガノイドベクトル(WTまたは疾患)との距離は、処置オルガノイドが、WTまたは疾患のいずれかからどれくらい離れているかの尺度をもたらすため、化合物の毒性として規定することができる。好ましい実施形態では、上流潜在ベクトルは、距離を決定する前にクラスター化される。この距離を、WT-疾患軸に追加される軸に当てはまるように、0~1(または0~10、0%~100%、もしくはあらゆる任意の範囲)に正規化される。WTと疾患との差異は、より毒性の高い試験化合物では関連性がより少ないとみなすことができる。したがって、毒性が増加するほど、WT-疾患軸が線形的に圧縮され得、それにより、各化合物は正三角形内に配置される結果となり、その角は、それぞれWT表現型、疾患表現型、または毒性表現型を有する化合物を意味する。これは、図13に図示されている。
【0074】
一実施形態では、毒性は、まず(a)2つの最終ノードの上流にある全結合層を抽出すること;および(b)試験分子と接触した第1の哺乳動物細胞集団と、試験分子と接触していない第1の細胞集団に関連付けられる潜在ベクトルと、第2の細胞集団に関連付けられる潜在ベクトルとの間の差異を定量化して、試験分子と接触した第1の哺乳動物細胞集団と、試験分子と接触していない第1の細胞集団に関連付けられる潜在ベクトルと、第2の細胞集団に関連付けられる潜在ベクトルとの間の差異の程度を提供することにより決定される。
【0075】
差異の程度は、試験分子と接触した第1の哺乳動物細胞集団に関連付けられる潜在ベクトルと、試験分子と接触していない第1の細胞集団に関連付けられる潜在ベクトルと、第2の細胞集団に関連付けられる潜在ベクトルとの間の差異の最小値を取ることにより算出される。
【0076】
差異の程度は、潜在空間全体にわたって決定することができる。一実施形態では、潜在空間は、少なくとも10、少なくとも100、少なくとも250、少なくとも400、少なくとも500、少なくとも600、少なくとも800、または少なくとも1000次元を含む。
【0077】
疾患に対して生物学的に活性である分子を特定し、毒性を評価するためのプロセスの例示的実装を示すフローチャートが、図2Cに示されている。プロセス102では、ブロック120、121、122、および123は、図2Bに示されているプロセス101のブロック120、121、122、および123に相当する。プロセス102は、ブロック130において1つまたは複数の対照オルガノイドを培養することをさらに含み、対照オルガノイドは、試験分子に曝露されていないオルガノイドであり、好ましくは非疾患オルガノイドおよび疾患オルガノイドを含む。対照オルガノイドは、ブロック121において画像化され、ブロック122において、トレーニングされたニューラルネットワークで分析される。ブロック131において、トレーニングされたニューラルネットワークは、毒性または非毒性の確率スコアを、試験分子に曝露された疾患オルガノイドに割り当てる。一部の場合では、例えば、生物学的に活性であると以前に特定された試験分子の毒性を評価する場合、ブロック123を省略してプロセス102を実施することが望ましい場合がある。
【0078】
一実施形態では、毒性は、潜在空間における距離を最大発生距離で正規化することにより、0(毒性なし)~1(最大の毒性、つまり潜在空間において非疾患オルガノイドから最も遠く離れている、試験分子と接触した非疾患オルガノイド)のスケールで規定することができる。
【0079】
5.2.7.用量反応分析
本開示のシステムおよび方法は、IC50およびLC50など、任意選択の用量反応分析特徴をさらに含んでいてもよい。以下の4パラメーターロジスティック関数を使用して、用量反応にフィティングすることができる。
y=最小+(最大-最小)/(1+10^((x-log(IC50))傾き))
式中、xは、試験分子濃度の対数であり、yは、治療能力である。パラメーターIC50は、要求値である。同じ関数をLC50にも使用することができる。この数式の4つのパラメーターを、非線形最小二乗フィティングを使用して(例えば、レーベンバーグ-マーカート(Levenberg-Marquardt)アルゴリズムまたは信頼領域反映(Trust Region Reflective)アルゴリズムを使用して)データにフィティングすることができる。オープンソースPythonパッケージスクリプトまたはカーブフィッティングを有する任意の他のソフトウェア、例えば、Matlab、R、またはExcelを使用することができる。
【0080】
5.2.8.コンピューター使用要件
ネットワークトレーニングおよび分析は、任意のコンピューターで実施することができるが、好ましくは、グラフィカルプロセッシングユニット(GPU)で実施することが望ましい。それは、トレーニング中に実施される計算は、GPUにおいて最適な様式で実行することができるため(例えば、GPUはトレーニングプロセスを大幅に高速化することができるため)である。GPU、例えば、NVIDIA GeForce 1080 Tiを搭載した最新のコンピューター(例えば、12コア、64GB RAM)を用いると、数千枚の画像によるトレーニングを1時間未満で実行することができる。より高い計算能力、例えば、複数のグラフィックカードを並列で使用するコンピューターを用いると、トレーニング時間を低減することができる。
【0081】
5.3.本開示のニューラルネットワークの応用
本開示のシステムおよび方法は、大きな生物学的変動性の背後に隠されている疾患表現型およびそれらの復帰を特定および解釈するために使用することができる。本明細書に記載のディープニューラルネットワークは、WTオルガノイドと疾患オルガノイドとの間で異なる複数の特徴を最適な無バイアス様式で特定および組み合わせることができるため、この課題に理想的に好適である。
【0082】
各オルガノイドの単一のまたは複数の顕微鏡画像を撮像することができ、各オルガノイドの画像は複数であることが好ましい。画像は、2Dまたは3Dのいずれであってもよい。オルガノイドの各画像は、本明細書では「チャネル」と呼ばれる。複数のチャネルは、例えば、異なるフィルター(例えば、3~4個のフィルター)を使用することにより得ることができる。構造および様々なタンパク質発現(例えば、分化マーカー、DAPI、膜染色、ミトコンドリアマーカーなど)に関する情報を組み合わせて、WT表現型および疾患表現型の固有フィンガープリントを得ることができる。フィンガープリントとしては、細胞の数/シグナルの面積、強度、形状などを挙げることができる。本開示の方法では、オルガノイドの代わりに、単一細胞および細胞層を使用することもできるが、マイクロパターンを使用して製作されたオルガノイドは、単一細胞または細胞層よりも高再現性であり得るため、オルガノイドが好ましい。
【0083】
一実施形態では、オルガノイドは、1、2、3、4、または5つの異なる染色で染色されており、各染色は、異なる色を有する。
【0084】
本開示のニューラルネットワークを使用して、トレーニング中に、WT細胞、細胞層、およびオルガノイドと、疾患細胞、細胞層、およびオルガノイドとの間の差異を学習させることができる。その後、本開示のトレーニングされたネットワークに対して、試験分子により処置されたオルガノイドの画像を表示することができ、ネットワークは、WTにどの程度類似しているかに関して、0~1(または0~10もしくは0%~100%もしくはあらゆる任意の範囲)のスコアに基づき画像を分類することができる。スコアが1に近い画像は、表現型のレスキューに成功したヒットとして規定することができる。ヒット化合物の潜在的毒性も同時に分析することができる。
【0085】
本開示のニューラルネットワークおよび方法は、薬物の試験に有用であるだけでなく、表現型復帰のための遺伝子操作の有効性を試験するためにも使用することができる。例えば、疾患を引き起こす突然変異を保持する対立遺伝子をサイレンシングしてもよく、または罹患遺伝子が機能の喪失を引き起こす場合は、野生型遺伝子を過剰発現させて、補償を試みてもよい。実施例に例示されているように、この戦略は、ハンチントン病の場合にうまくいくことが示されており、この場合、野生型ハンチンチン遺伝子を、ハンチンチンノックアウト(KO)を保持する細胞株の背景で過剰発現させた。本明細書に記載の方法を用いて、誘導されたオルガノイドを表現型復帰について試験することができる。そのようなオルガノイドを試験する際に毒性表現型を追加する必要は必ずしもないため、一部の実施形態では、毒性を評価せずに、改変オルガノイドを野生型である確率について得点化してもよい。
【0086】
有利には、本開示のシステムおよび方法の種々の実施形態では、画像化データから生物学的特性/分析物を特定および定量化し、次いで定量化された生物学的特性/分析物に基づいて1つまたは複数の病理を特定および特徴付けることができる階層分析フレームワークが使用される。病理を評価するための中間段階として画像化を使用して根底にある生物学的特徴を検査するためのこの階層的手法は、根底にある画像化データから病理を直接的に決定および特徴付けるように構成されているシステムおよび方法に対して、多数の分析的および処理的な利点を提供する。
【0087】
5.3.1.オルガノイド形成
オルガノイドは、1つよりも多くの細胞タイプを含む。オルガノイドは、典型的には、1つの細胞、またはいかなる空間的組織化も呈さない小さな凝集体から始まる。時間と共に、自己組織化が起こり、様々な細胞タイプが発生し、それらは、オルガノイド内で動的にそれらの正しい位置を取る。特定の空間的組織化は、オルガノイドのタイプ毎に異なり得るが、分化パターンまたは領域は常に存在する。
【0088】
種々の実施形態では、オルガノイドは、約もしくは少なくとも1012細胞もしくはそれ以下、約もしくは少なくとも1011細胞もしくはそれ以下、約もしくは少なくとも1010細胞もしくはそれ以下、約もしくは少なくとも10細胞もしくはそれ以下、約もしくは少なくとも10細胞もしくはそれ以下、約もしくは少なくとも10細胞もしくはそれ以下、約もしくは少なくとも10細胞もしくはそれ以下、約もしくは少なくとも10細胞もしくはそれ以下、約もしくは少なくとも10細胞もしくはそれ以下、約もしくは少なくとも10細胞もしくはそれ以下、約もしくは少なくとも10細胞もしくはそれ以下、約もしくは少なくとも10細胞もしくはそれ以下、または上述の値のいずれか間の範囲の数の細胞(例えば、10~10細胞、または10細胞~1010細胞、または10~10細胞)を含む。
【0089】
本開示のある特定の態様では、オルガノイドは、初代培養細胞から生成される。
【0090】
他の態様では、オルガノイドは、培養中の不死化細胞から生成される。
【0091】
初代培養細胞および不死化細胞は、幹細胞、例えば、全能性幹細胞または多能性幹細胞であってもよい。
【0092】
例えば、以下の細胞:多能性細胞、誘導多能性細胞、成体幹細胞、非胚性細胞、または非胚性幹細胞を使用することができる。
【0093】
一部の実施形態では、幹細胞は、ヒト胚性幹細胞である。一部の実施形態では、細胞は、非胚性細胞または非胚性幹細胞であってもよい。他の実施形態では、幹細胞は成体幹細胞である。一部の実施形態では、幹細胞は、誘導多能性幹細胞である。好ましくは、幹細胞はヒト起源のものである。
【0094】
ある特定の具体的な実施形態では、オルガノイドは、幹細胞または前駆細胞を含む。具体的な実施形態では、幹細胞または前駆細胞は、胚性幹細胞、胚性胚芽細胞、誘導多能性幹細胞、間葉系幹細胞、骨髄由来間葉系幹細胞、骨髄由来間葉系間質細胞、臍帯幹細胞、羊水肝細胞、羊膜由来付着細胞(AMDAC)、骨形成胎盤付着細胞(OPAC)、脂肪幹細胞、角膜縁幹細胞、歯髄幹細胞、筋芽細胞、内皮前駆細胞、神経幹細胞、剥離歯由来幹細胞、毛嚢胞幹細胞、皮膚幹細胞、単為生殖由来幹細胞(parthenogenically derived stem cell)、再プログラムされた幹細胞、羊膜由来付着細胞、またはサイドポピュレーション幹細胞(side population stem cell)である。ある特定の他の具体的な実施形態では、オルガノイドは、造血幹細胞または造血前駆細胞を含む。
【0095】
ある特定の他の具体的な実施形態では、本明細書に記載のオルガノイドのいずれかは、分化細胞を含む。より具体的な実施形態では、分化細胞は、以下の1つまたは複数を含む:
・内皮細胞、上皮細胞、皮膚細胞、内胚葉細胞、中胚葉細胞、線維芽細胞、骨細胞、軟骨細胞、ナチュラルキラー細胞、樹状細胞、肝細胞、膵臓細胞、または間質細胞;
・唾液腺粘膜細胞、唾液腺漿液細胞、フォンエブネル腺細胞、乳腺細胞、涙腺細胞、耳道腺細胞、エクリン汗腺暗細胞、エクリン汗腺明細胞、アポクリン汗腺細胞、モル細胞の腺(gland of Moll cells)、皮脂腺細胞、ボーマン腺細胞、ブルンネル腺細胞、精嚢細胞、前立腺細胞、球尿道腺細胞、バルトリン腺細胞、リトレ細胞の腺(gland of Littre cells)、子宮内膜細胞、単離杯細胞、胃内壁粘膜細胞、胃腺酵素原細胞、胃腺酸分泌細胞、膵腺房細胞、パネート細胞、II型肺細胞、クララ細胞、成長ホルモン産生細胞、乳腺刺激ホルモン分泌細胞、甲状腺刺激ホルモン産生細胞、性腺刺激ホルモン産生細胞、副腎皮質刺激ホルモン分泌細胞、脳下垂体中葉細胞、大細胞性神経分泌細胞、腸細胞、気道細胞、甲状腺上皮細胞、傍濾胞細胞、副甲状腺細胞、副甲状腺主細胞、好酸性細胞、副腎細胞、クロム親和性細胞、ライディッヒ細胞、内卵胞膜、黄体細胞、顆粒膜黄体細胞、卵胞膜黄体細胞、傍糸球体細胞、密集斑細胞、周血管極細胞、メサンギウム細胞、
・血管およびリンパ管内皮有窓細胞(blood vessel and lymphatic vascular endothelial fenestrated cell)、血管およびリンパ管内皮連続細胞(blood vessel and lymphatic vascular endothelial continuous cell)、血管およびリンパ管内皮脾細胞(blood vessel and lymphatic vascular endothelial splenic cell)、滑膜細胞、漿膜細胞(腹膜、胸膜、および囲心腔の内皮)、扁平上皮細胞、円柱細胞、暗細胞、前庭膜細胞(耳の内リンパ腔の内皮)、血管条基底細胞、血管条周辺細胞(耳の内リンパ腔の内皮)、クラウジウス細胞、ベッチェル細胞、脈絡叢細胞、軟くも膜扁平上皮細胞、色素繊毛体上皮細胞、無色素繊毛体上皮細胞、角膜内皮細胞、peg細胞、
・気道繊毛細胞、卵管繊毛細胞、子宮内膜繊毛細胞、精巣網繊毛細胞、輸出管繊毛細胞、繊毛上衣細胞、
・表皮ケラチノサイト、表皮基底細胞、手指爪および足指爪ケラチノサイト、爪床基底細胞、髄質毛幹細胞、皮質毛幹細胞、角質毛幹細胞、角質毛根鞘細胞、ハクスリ層の毛根鞘細胞、ヘンレ層の毛根鞘細胞、外部毛根鞘細胞、毛母細胞;
・重層扁平上皮の表面上皮細胞、上皮基底細胞、泌尿器上皮細胞、
・コルチ器官の聴覚外有毛細胞、コルチ器官の聴覚内有毛細胞、嗅上皮基底細胞、低温感受性一次感覚ニューロン、高温感受性一次感覚ニューロン、表皮のメルケル細胞、臭覚受容体ニューロン、疼痛感受性一次感覚ニューロン、光受容体桿体細胞、光受容体青色感受性錐体細胞、光受容体緑色感受性錐体細胞、光受容体赤色感受性錐体細胞、固有受容性一次感覚ニューロン、接触感受性一次感覚ニューロン、I型頸動脈小体細胞、II型頸動脈小体細胞(血液pHセンサー)、耳の前庭器のI型有毛細胞(加速度および重力)、耳の前庭器のII型有毛細胞、I型味蕾細胞、
・コリン作動性神経細胞、アドレナリン作動性神経細胞、ペプチド動作性神経細胞、
・コルチ器官の内柱細胞、コルチ器官の外柱細胞、コルチ器官の内部支持細胞、コルチ器官の外部支持細胞、コルチ器官の境界細胞、コルチ器官のヘンゼン細胞、前庭器支持細胞、味蕾支持細胞、嗅上皮支持細胞、シュワン細胞、衛星細胞、腸グリア細胞、
・アストロサイト、ニューロン、オリゴデンドロサイト、紡錘ニューロン、
・前水晶体上皮細胞、クリスタリン含有水晶体線維細胞、肝実質細胞、脂肪細胞、白色脂肪細胞、褐色脂肪細胞、肝臓脂質細胞、
・腎臓糸球体傍細胞、腎臓糸球体有足細胞、腎臓近位尿細管刷子縁細胞、ヘンレ係蹄薄セグメント細胞(loop of Henle thin segment cell)、腎臓遠位尿細管細胞、腎臓集合管細胞、I型肺細胞、膵管細胞、非線条導管細胞(nonstriated duct cell)、管細胞、腸刷子縁細胞、外分泌腺線条導管細胞(exocrine gland striated duct cell)、胆嚢上皮細胞、精巣輸出管非繊毛細胞、上皮主細胞、精巣上体基底細胞、エナメル芽細胞上皮細胞、半月面上皮細胞、コルチ器官歯間上皮細胞、疎性結合組織線維芽細胞、角膜実質細胞、腱線維芽細胞、骨髄細網組織線維芽細胞、非上皮性線維芽細胞、周皮細胞、髄核細胞、セメント芽細胞/セメント細胞、象牙芽細胞、象牙細胞(odontocyte)、硝子軟骨軟骨細胞、繊維軟骨軟骨細胞、弾性軟骨軟骨細胞、骨芽細胞、骨細胞、破骨細胞、骨前駆細胞、硝子体細胞、星細胞(耳)、肝星細胞(伊東細胞)、膵星細胞(pancreatic stelle cell)、
・赤色骨格筋細胞、白色骨格筋細胞、中間骨格筋細胞、筋紡錘の核嚢細胞、筋紡錘の核鎖細胞(nuclear chain cells of muscle spindle)、衛星細胞、通常心筋細胞、結節性心筋細胞(nodal heart muscle cell)、プルキニエ線維細胞、平滑筋細胞、虹彩の筋上皮細胞、外分泌腺の筋上皮細胞、
・網状赤血球、巨核球、単球、結合組織マクロファージ、表皮ランゲルハンス細胞、樹状細胞、小グリア細胞、好中球、好酸球、好塩基球、マスト細胞、ヘルパーT細胞、サプレッサーT細胞、細胞障害性T細胞、ナチュラルキラーT細胞、B細胞、ナチュラルキラー細胞、
・メラノサイト、網膜色素上皮細胞、または
・卵原細胞/卵母細胞、精子細胞、精母細胞、精原細胞、精子、卵胞細胞、セルトリ細胞、胸腺上皮細胞、および/もしくは間質性腎臓細胞。
【0096】
本明細書に提示されているオルガノイドのいずれかのある特定の具体的な実施形態では、オルガノイドは、肝臓、腎臓、膵臓、甲状腺、肺、腸、結腸、前立腺、脳、乳房、卵巣、胃、食道、舌組織、味蕾、内耳、または網膜の少なくとも1つの機能を実施する。
【0097】
哺乳動物細胞の適切な培養条件は、当技術分野で周知であるか、または当業者であれば決定することができ(例えば、Animal Cell Culture: A Practical Approach 2nd Ed., Rickwood, D. and Hames, B. D., eds. (Oxford University Press: New York, 1992)を参照)、選択した特定の細胞によって様々である。市販の培地を使用することができる。培地の非限定的な例としては、例えば、ダルベッコ変法イーグル培地(DMEM、Life Technologies)、ダルベッコ変法イーグル培地/栄養素混合物F-12(DMEM/F-12、Life Technologies)、最小必須培地(MEM、Sigma、セントルイス、ミズーリ州)、および肝実質細胞培地が挙げられる。
【0098】
上記に記載の培地は、必要に応じてまたは望ましくは任意選択の成分を適切な濃度または量で含む、補完成分または構成成分で必要に応じて補完されていてもよい。細胞培地溶液は、以下のカテゴリーの1つまたはそれよりも多くの少なくとも1つの成分を提供する:(1)通常はグルコースなどの炭水化物の形態であるエネルギー源;(2)必須アミノ酸すべて、および通常は20種のアミノ酸+システインの基本セット;(3)低濃度で必要とされるビタミンおよび/または他の有機化合物;(4)遊離脂肪酸または脂質、例えば、リノール酸;ならびに(5)典型的には非常に低い濃度で、通常はマイクロモル範囲で必要とされる無機化合物または天然に存在する元素であると定義される微量元素。
【0099】
また、培地は、以下のカテゴリーのいずれかの1つまたは複数の成分で選択的に補完されていてもよい:(1)塩、例えば、マグネシウム、カルシウム、およびリン酸塩;(2)血清、インスリン、トランスフェリン、上皮成長因子、および線維芽細胞成長因子などのホルモンならびに他の成長因子;(3)タンパク質および組織加水分解物、例えば、精製ゼラチン、植物材料、または動物副産物から得ることができるペプトンまたはペプトン混合物;(4)ヌクレオシド、ならびにアデノシン、チミジン、およびヒポキサンチンなどの塩基;(5)HEPESなどの緩衝剤;(6)ゲンタマイシンまたはアンピシリンなどの抗生物質;(7)細胞保護剤、例えば、プルロニックポリオール;ならびに(8)ガラクトース。
【0100】
培養は、オルガノイド形成を促進するための試薬で補完されていてもよい。オルガノイド形成を促進するために当技術分野で使用されている例示的な試薬としては、EGF、FGF10、HGF、R-スポンジン、BMP4、WNT3A、レチノイン酸、GSK3β阻害剤、TGF-β阻害剤、HDAC阻害剤、ROCK阻害剤、ノギン、アクチビンA、p38阻害剤、およびガストリンが挙げられる。下記の表1には、様々なタイプのオルガノイドの形成を促進するために使用することができる試薬が示されている。
【0101】
【表1-1】
【0102】
【表1-2】
【0103】
培養中で維持されている細胞は、以前の培養から、新鮮な培地を有する培養へと細胞を移動させることにより継代することができる。一実施形態では、オルガノイド産生細胞(例えば、ヒト胚性幹細胞、ヒト上皮細胞に由来するiPSC)は、細胞培養において、少なくとも3継代、少なくとも4継代、少なくとも5継代、少なくとも6継代、少なくとも7継代、少なくとも8継代、少なくとも9継代、少なくとも10継代、少なくとも11継代、少なくとも12継代、少なくとも13継代、少なくとも14継代、少なくとも15継代、少なくとも20継代、少なくとも25継代、または少なくとも30継代にわたって安定的に維持することができる。
【0104】
オルガノイド産生細胞は、プラスミドなどの導入発現ベクトル(構築物)を内包することができる。発現ベクトル構築物は、形質転換、マイクロインジェクション、トランスフェクション、リポフェクション、エレクトロポレーション、または感染により導入することができる。発現ベクトルは、発現および産生させるタンパク質をコードするコード配列またはその部分を含んでいてもよい。産生されるタンパク質およびポリペプチドをコードする配列、ならびに適切な転写および翻訳制御エレメントを含む発現ベクトルは、当業者に周知であり当業者により実施される方法を使用して生成することができる。こうした方法としては、J. Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, Plainview, N.Y.およびF. M. Ausubel et al., 1989, Current Protocols in Molecular Biology, John Wiley & Sons, New York, N.Y.に記載されている合成技法、in vitro組換えDNA技法、およびin vivo遺伝子組換えが挙げられる。
【0105】
一部の実施形態では、オルガノイド産生細胞は、マイクロウェルプレート(例えば、24または96ウェルプレート)において、好ましくは1ウェル当たり20~30個のオルガノイドを産生する条件下で培養される。
【0106】
一実施形態では、オルガノイド産生細胞は、1ウェルあたり75,000細胞の最終密度で24ウェルプレートのウェルにプレーティングされる。別の実施形態では、細胞は、1ウェル当たり約50,000細胞、1ウェル当たり約55,000細胞、1ウェル当たり約60,000細胞、1ウェル当たり約65,000細胞、1ウェル当たり約70,000細胞、1ウェル当たり約75,000細胞、1ウェル当たり約80,000細胞、1ウェル当たり約85,000細胞、1ウェル当たり約90,000細胞、1ウェル当たり約95,000細胞、または1ウェル当たり約100,000細胞の最終密度で24ウェルプレートのウェルにプレーティングされる。
【0107】
別の実施形態では、細胞は、1ウェル当たり少なくとも50,000細胞、1ウェル当たり少なくとも55,000細胞、1ウェル当たり少なくとも60,000細胞、1ウェル当たり少なくとも65,000細胞、1ウェル当たり少なくとも70,000細胞、1ウェル当たり少なくとも75,000細胞、1ウェル当たり少なくとも80,000細胞、1ウェル当たり少なくとも85,000細胞、1ウェル当たり少なくとも90,000細胞、1ウェル当たり少なくとも95,000細胞、または1ウェル当たり少なくとも100,000細胞の最終密度で24ウェルプレートのウェルにプレーティングされる。
【0108】
一実施形態では、培地の全交換は3日毎に行われる。一実施形態では、培地の全交換は4日毎に行われる。別の実施形態では、媒体の全交換は、少なくとも毎日、少なくとも2日毎に、少なくとも3日毎に、少なくとも4日毎に、少なくとも5日毎、少なくとも6日毎、少なくとも7日毎に、少なくとも8日毎に、少なくとも9日毎に、少なくとも10日毎に、少なくとも11日毎に、少なくとも12日毎に、少なくとも13日毎に、または少なくとも14日毎に行われる。
【0109】
種々のタイプの幹細胞を使用してオルガノイドを製作することができる。例えば、誘導多能性幹細胞(iPSC)などのヒト多能性幹細胞(hPSC)(例えば、McCracken et al., 2014, Nature 516(7531):400-4;Spence et al., 2011, Nature 470(7332):105-9;Si-Tayeb et al., 2010, Hepatology 51(1):297-305;Dye et al., 2015, eLife. 4: e05098;Lancaster et al., 2013, Nature 501(7467):373;Takasato et al., 2015, Nature 526(7574):564-8;Takasato et al., 2016, Nat. Protoc. 11(9):1681-92を参照)およびヒト脂肪由来幹細胞(hAdSC)(例えば、Bartfeld et al., 2015, Gastroenterology 148(1):126-136;Sato et al., 2011, Gastroenterology 141(5):1762-72;Huch et al., 2015, Cell 160(1-2):299-312;Boj et al., 2015, Cell 160(1-2):324-38;Karthaus et al., 2014, Cell 159(1):163-175を参照)を使用することができる。RUES-1またはRUES-2(rues.rockefeller.edu)などのヒト胚性幹細胞株も使用することができる。
【0110】
細胞外マトリックス成分の溶液の組成は、産生される組織に応じて様々だろう。代表的な細胞外マトリックス成分の例としては、これらに限定されないが、コラーゲン、ラミニン、フィブロネクチン、ビトロネクチン、エラスチン、グリコサミノグリカン、プロテオグリカン、およびこうした成分の一部またはすべての組合せが挙げられる(例えば、Matrigel(商標)、Collaborative Research、カタログ番号40234)。機械的力に応答性である細胞タイプを含む組織では、細胞外マトリックス成分の溶液は、好ましくは、細胞がゲルの内部張力に関連付けられる力に曝露されるようにゲル化または癒合する。
【0111】
オルガノイド形成は、分化中に幹細胞を空間的に閉じ込めることにより促進することができる。幹細胞は、細胞コロニーの幾何学的形状を制御するために、ラミニンなどのマイクロパターン化細胞外マトリックスタンパク質を有する表面上に播種することができる。マイクロパターンのサイズおよび培地のタイプは両方とも、分化パターン結果に影響を及ぼす(例えば、Deglincerti et al. 2016, Nature Protocols 11: 2223-2232;Deglincerti et al. 2016, Current Topics in Developmental Biology, (116):99-113;Metzger et al., 2018, Current Opinion in Genetics & Development, 52:86-91;Etoc et al., 2016, Developmental Cell, 39(3):302-315を参照)。マイクロパターン上で幹細胞を分化させることにより、異なる組織タイプを再現可能な様式で生成することが可能になる。例えば、Matrigel(商標)などのヒドロゲルを使用して製作された3D足場も使用することができる(例えば、Yin et al., 2016, Cell Stem Cell, 18(1):25-28を参照)。
【0112】
他の実施形態では、オルガノイドは、例えば、下記に記載されている例示的なプロセスに従って、目的の組織の個々の細胞からin vitroで産生される。
【0113】
このプロセスの最初のステップとして、脱凝集または部分的に脱凝集された細胞を、細胞外マトリックス成分の溶液と混合して、懸濁物を作出する。次いで、この懸濁物を、組織のin vivoの肉眼的な形態学的特徴に近似し、容器にカップリングされている組織付着表面を含む、三次元幾何学的形状を有する容器内に入れる。次いで、細胞および細胞外マトリックス成分が容器内で癒合またはゲル化することを可能にし、容器を培養チャンバー内に入れ、細胞が、付着表面に結合した組織化組織を形成することが可能な条件下にて、容器を培地で取り囲む。
【0114】
この方法は、多種多様な組織のin vitro産生と適合性であるが、個々の細胞の少なくともサブセットが、組織発生、リモデリング、または正常な生理学的機能中に機械的な力に曝露され影響を受ける組織に特に好適である。そのような組織の例としては、筋肉、骨、皮膚、神経、腱、軟骨、結合組織、内皮組織、上皮組織、および肺が挙げられる。より具体的な例としては、骨格筋および心筋(つまり、横紋筋)および平滑筋、階層化または層板骨、ならびに硝子軟骨が挙げられる。組織が複数の細胞タイプを含む場合、異なるタイプの細胞は、同じまたは異なる生物、同じまたは異なるドナー、および同じまたは異なる組織から得ることができる。さらに、細胞は、初代細胞または不死化細胞であってもよい。さらに、組織の細胞のすべてまたは一部は、生物活性化合物(本明細書に記載のような)に対して応答を示す外来性DNA配列(例えば、受容体をコードする外来性DNA配列)を含んでいてもよい。
【0115】
細胞外マトリックス成分の溶液の組成は、産生される組織に応じて様々だろう。代表的な細胞外マトリックス成分の例としては、これらに限定されないが、コラーゲン、ラミニン、フィブロネクチン、ビトロネクチン、エラスチン、グリコサミノグリカン、プロテオグリカン、およびこうした成分の一部またはすべての組合せが挙げられる(例えば、Matrigel(商標)、Collaborative Research、カタログ番号40234)。機械的力に応答性である細胞タイプを含む組織では、細胞外マトリックス成分の溶液は、好ましくは、細胞がゲルの内部張力に関連付けられる力に曝露されるようにゲル化または癒合する。
【0116】
in vivo様の肉眼的および細胞性の形態学的特徴を有する組織をin vitroで産生するための装置は、組織のin vivoの肉眼的な形態学的特徴に近似する三次元幾何学的形状を有する容器を含む。この装置は、容器にカップリングされた組織付着表面も含む。そのような容器は、細胞および組織の培養と適合性であり(例えば、滅菌可能であり、細胞外マトリックス成分の特定の溶液と適合性である)、目的の組織のin vivoの肉眼的な形態学的特徴と近似する三次元幾何学的形状へと形成可能である様々な材料で構築することができる。組織付着表面(例えば、ステンレス鋼メッシュまたはVelcro(登録商標)など)は、組織がin vitroで形成されると共に、細胞が付着表面に接着および付着表面間に整列することができるように、容器にカップリングされ、配置されている。組織付着表面は、細胞および組織の培養に適合性である(例えば、滅菌可能であるか、または細胞接着のために適切な表面電荷、テクスチャ、もしくはコーティングを有する)様々な材料で構築することができる。
【0117】
組織付着表面は、様々な様式で、容器の内側表面または外側表面にカップリングされていてもよい。その代わりに、組織付着表面は、それらが容器に隣接して配置され、組織形成中に細胞が接近可能であるように、培養チャンバーにカップリングされていてもよい。付着表面は、接着点としての役目を果たすことに加えて、ある特定の組織タイプ(例えば、筋肉)では、対向する付着表面の間の組織による張力の発生を可能にする。
【0118】
5.3.2.疾患表現型を有するオルガノイド
本開示の方法は、オルガノイドの疾患表現型を復帰させる分子を特定することを含む。一部の実施形態では、疾患表現型は、CNS障害に関連付けられる。例えば、疾患表現型は、神経変性障害(例えば、ハンチントン病、アルツハイマー病、パーキンソン病、レット症候群、またはALS)、自閉症スペクトラム障害、または精神疾患(例えば、統合失調症、双極性障害、てんかん)に関連付けることができる。他の実施形態では、疾患表現型はがんに関連付けられる。さらに他の実施形態では、疾患表現型は感染症に関連付けられる。さらに他の実施形態では、疾患表現型はCFに関連付けられる。
【0119】
オルガノイドの疾患表現型は、例えば、正常な幹細胞株を、目的の疾患表現型に関連付けられる遺伝的欠陥を含むように遺伝子改変することにより(例えば、CRISPR-Cas9またはTALENを使用して)作出することができる。したがって、一部の実施形態では、疾患表現型を有するオルガノイドは、正常な細胞株と比較して、疾患表現型を付与する1つまたは複数の突然変異を含む。具体的な実施形態では、疾患表現型を有するオルガノイドは、ポリグルタミン(「ポリQ」)リピートが延長されているハンチンチンタンパク質をコードする。例えば、国際公開第2017/147536号パンフレットを参照されたい。ポリQリピートは、例えば、42~150個のグルタミン残基(例えば、42、45、58、50、56、58、67、72、74、または150個のグルタミン残基)であってもよい。
【0120】
疾患表現型を有するオルガノイドは、化学的誘導因子を使用することにより、ウイルス感染により、または導入遺伝子の発現により、疾患を有する対象に由来するiPSCから生成することもできる。例えば、Clevers, 2018, Cell 165:1586-1597; Ho et al., 2018, Int J Mol Sci. 19(4):936;Dutta et al., 2017, Trends Mol Med. 23(5):393-410を参照されたい。
【0121】
同じまたは緊密に類似した遺伝子型を有する細胞は、「同質遺伝子性」であるとみなすことができる。例えば、正常な幹細胞を、疾患形態の遺伝子を有するように改変することができ、得られる改変細胞株は、正常な細胞株に対して同質遺伝子性であるとみなすことができる。別の例として、疾患表現型に関連付けられる突然変異遺伝子を有する幹細胞株を修正して、親幹細胞株と同質遺伝子性である非疾患表現型を有する幹細胞株を提供することができる。他の変異としては、1つ、2つ、3つ、もしくはそれよりも多くのマーカー、および/または親細胞株を改変する際に意図せずに導入される1つもしくは複数の変異(例えば、CRISPR-Cas9媒介性遺伝子編集を使用する際に導入されるオフターゲット突然変異)の組込みを挙げることができる。得られる細胞は、依然として、それから改変された細胞に対して同質遺伝子性であるとみなされることになる。本明細書に記載の方法の一部では、同質遺伝子性対照細胞または同質遺伝子性野生型細胞が使用される。同質遺伝子性である細胞株対(およびそのような細胞株対から製作されたオルガノイド)は、例えば、1つまたは少数(2、3、4、5、または10個など)の不一致(例えば、細胞を遺伝的に改変することにより導入される不一致)を除いて同じ遺伝的背景を共有し、野生型細胞と比較して具体的な遺伝的不一致を研究することを可能にし、多数の遺伝的特徴(特に、しかしながら排他的ではないが、未知の遺伝的特徴)が異なり得る様々な患者細胞を比較することにより導入される複雑性を軽減する。
【0122】
表2には、当技術分野で製作されており、本開示の方法で使用することができる様々なタイプのオルガノイドが示されている(例えば、総説論文Dutta et al., 2017, Trends Mol Med. 23(5):393-410およびその中で引用されている文献を参照)。
【0123】
【表2】
【0124】
5.3.3.治療能力を有する分子を特定するための方法
本開示のニューラルネットワークは、疾患に対して生物学的活性を有する分子を特定するために使用することができる。
【0125】
一実施形態では、治療能力は、ソフトマックス層後のネットワークの最終スコアにより与えられる。治療能力は、範囲が0(疾患)~1(野生型)である。1は、最も高いスコアであり、疾患から野生型への表現型の復帰に最も効率的である。
【0126】
例えば、疾患に対して生物学的に活性である分子は、試験分子の存在下のオルガノイド形成条件下(例えば、Dutta et al., 2017, Trends Mol Med. 23(5):393-410;Clevers, 2018, Cell 165:1586-1597;またはHo et al., 2018, Int J Mol Sci. 19(4):936に記載のような)で哺乳動物細胞集団を培養してオルガノイドを得ることであって、哺乳動物細胞集団は、試験分子の非存在下のオルガノイド形成条件下で培養されると、疾患表現型を有するオルガノイドをもたらすこと;試験分子に曝露した後でオルガノイドを画像化すること;オルガノイドの1つまたは複数の画像を、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるようにトレーニングされているニューラルネットワークを使用して分析すること;オルガノイドに0%~100%の範囲の確率スコアを割り当てること、により特定することができ、試験分子は、オルガノイドの確率スコアが、非疾患のカットオフ確率スコアよりも高いか、または疾患のカットオフ確率スコアよりも低い場合、疾患に対して生物学的に活性である。その代わりに、試験分子を、オルガノイド形成後に適用し、画像化は、試験分子への曝露期間後に実施してもよい。試験分子への曝露期間(オルガノイド形成中に存在するかまたはオルガノイド形成後に存在するかに関わらず)は、特に試験分子が実験の全期間中に適用される場合、数時間から数日間、数週間、または数ヶ月間までの範囲であってもよい。培養培地中の試験分子の濃度は、10nM~100μMの範囲であってもよい(例えば、10nM~1μM、10nM~50μM、10nM~20μM、1μM~100μM、1μM~50μM、1μM~20μM、1μM~10μM、10μM~50μM、20μM~50μM、または50μM~100μM)。
【0127】
非疾患のカットオフ確率スコアは、例えば、60%~95%、70%~95%、80%~95%、90%~95%、または95%~99%の範囲の値であってもい(例えば、カットオフは、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、または99%であってもよい)。疾患のカットオフ確率スコアは、例えば、5%~40%、5%~30%、5%~20%、5%~10%、または1%~5%の範囲の値であってもよい(例えば、カットオフは、40%、35%、30%、25%、20%、15%、10%、5%、4%、3%、2%、または1%であってもよい)。したがって、例えば、試験分子に曝露された疾患オルガノイドの非疾患の確率スコアが96%であり、非疾患のカットオフ確率スコアが95%である場合、試験分子は、疾患に対して生物学的に活性であるとみなすことができる。別の例として、試験分子に曝露された疾患オルガノイドの疾患の確率スコアが2%であり、疾患のカットオフ確率スコアが5%である場合、試験分子は、疾患に対して生物学的に活性であるとみなすことができる。さらに別の例として、試験分子に曝露された疾患オルガノイドの非疾患の確率スコアが60%であり、非疾患のカットオフ確率スコアが90%である場合、試験分子は、疾患に対して生物学的に活性ではないとみなすことができる。
【0128】
本開示の方法でオルガノイドを画像化する前に、オルガノイドを、細胞小器官マーカー、細胞分化マーカー、細胞区画マーカー、またはそれらの組合せなどの1つまたは複数のマーカーについて染色してもよい。1つまたは複数のマーカーとしては、好ましくは、オルガノイドの肉眼的な形態学的特徴および/またはオルガノイドに含まれる特定の細胞集団を強調する1つまたは複数のマーカーが挙げられる。例示的な染色試薬としては、核染色(例えば、DAPIおよびヘキスト核染色)、BrdU、カルセイングリーン、DiI、DiO、DiD、およびDiRなどの膜色素、GM130に対する蛍光標識抗体などのゴルジ染色試薬、ER-Tracker(商標)Green(Cell Signaling Technology)などのER染色試薬、ファロイジン、ならびにN-カドヘリン、E-カドヘリン、ZO-1、およびコラーゲンに対する蛍光標識抗体が挙げられる。
【0129】
特定のタイプのオルガノイドまたは特定のタイプの分化細胞に特異的な試薬も使用することができる。例えば、ニューロフィラメントまたはネスチンを染色するための試薬(例えば、蛍光標識抗体)を使用して、脳オルガノイドを染色することができる。PAX6染色試薬を使用して、神経細胞集団を染色することができる。SOX10染色試薬を使用して、神経堤細胞を染色することができる。
【0130】
試験は、試験分子のコレクション、例えば、小化合物ライブラリーの全部または一部(例えば、100~100,000個の範囲またはそれよりも多くの試験分子のコレクション)に対して実施することができる。化合物は、個々にまたはプールして(例えば、5~100個、10~50個、10~20個、50~100個、5~20個、または5~10個の化合物をプールして)スクリーニングすることができる。分子のプールをスクリーニングした際にヒットが特定された場合、プールの分子を個々に試験して、具体的なヒット分子を特定することができる。したがって、本開示のニューラルネットワークおよび方法は、試験化合物のハイスループットスクリーニングに有用である。
【0131】
5.3.3.1.検証
単一濃度の試験分子を、分子の初期スクリーニングに使用ことができる(例えば、10μM)。ヒットとして特定した後で、試験分子を1つまたは複数の追加濃度で再試験して、疾患表現型に対するその活性を検証することができる。高い初期濃度を使用する場合、非常に高いIC50は試験分子の非特異性が高いことを示している可能性があるため、ヒットの検証には、1つまたは複数のより低い濃度でヒットを再試験することが有用であり得る。
【0132】
検証は、初期スクリーニングで特定された分子を1つまたは複数の異なる濃度で再試験して、用量反応曲線を準備することを含んでいてもよい。その代わりにまたはそれに加えて、検証は、疾患の動物モデルにおいて分子を試験することを含んでいてもよい。
【0133】
5.3.3.1.1.用量反応曲線
検証は、試験分子のIC50および/またはLC50を決定することを含んでいてもよい。試験分子のIC50値は、本開示のネットワークを使用し、試験濃度を、例えば、WT-疾患-毒性三角形(例えば、図14に示されるような三角形)の底辺に沿って、ネットワークにより測定された治療能力と比較することにより生成することができる。試験分子のLC50値は、本開示のネットワークを使用し、試験濃度を、例えば、WT-疾患-毒性三角形(例えば、図14に示されるような三角形)の縦軸に沿って、ネットワークにより測定された毒性と比較することにより生成することができる。
【0134】
IC50は、3つまたはそれよりも多くの異なる濃度の試験分子(例えば、3~10個、5~10個、または3~5個)を試験し、非線形最小二乗フィッティングアルゴリズムを使用して、様々な濃度での疾患または非疾患の確率スコアを分析することにより測定することができる。同様に、LC50は、3つまたはそれよりも多くの異なる濃度の試験分子(例えば、3~10個、5~10個、または3~5個)を試験し、非線形最小二乗フィッティングアルゴリズムを使用して、様々な濃度での疾患または非疾患の確率スコアを分析することにより測定することができる。
【0135】
5.3.3.1.2.有効容量
一般に、WT-疾患-毒性三角形のWT表現型の角に最も近い試験分子を、さらなる分析および/または開発のために選択することになり、5μM未満のIC50を有する化合物がさらなる開発に好ましい。LC50値は、IC50よりも何倍も大きいことが理想的であり、一部の実施形態では、LC50がIC50よりも大きい場合、LC50がIC50よりも少なくとも10倍大きい場合、またはLC50がIC50よりも少なくとも100倍大きい場合、試験分子を、さらなる分析または開発のために選択する。さらなる開発は、元の試験分子よりもより低いIC50(例えば、100nM未満)および/またはより高いLC50を有する誘導体を特定するために、誘導体を調製することを含んでいてもよい。
【実施例
【0136】
6.実施例
[実施例1]
6.1.実施例1:HDモデルオルガノイドの産生および特徴付け
神経胚形成段階のヒト胚を模倣するhESC系自己組織化構造であるHDモデルオルガノイドにおけるHDの表現型シグネチャを特徴付けた。
【0137】
6.1.1.材料および方法
HDモデルオルガノイドに使用するためのヒト胚性幹細胞株の生成。
【0138】
背景技術のセクションで述べられているように、ハンチントン病(HD)は、ハンチンチンタンパク質(HTT)のN末端のポリQリピートの延長に結び付く突然変異により引き起こされる優性常染色体神経変性疾患である。長年の詳細な検討にも関わらず、現行の動物モデルは、おそらくは種特異的な差異のため、ヒトHDの病態生理を正確に再現することができない。そのため、この疾患に有効な療法候補を見出すための進歩が妨げられている。この例では、健康な細胞および>40Qの細胞におけるHTTの機能および機能不全を研究するための薬物スクリーニングおよび研究ツールとしてのヒトプラットフォームを提供するために、CRISPR/Cas9ゲノム編集技術を使用して、最初のHD同質遺伝子性ヒト胚性幹細胞株(および同質遺伝子性野生型対照)を生成したことが記載されている。
【0139】
この例では、CRISPR-Cas9を使用した逆編集戦略を応用して、正常なhESCにポリQトラクトの長い延長を導入し、したがって野生型対応物と遺伝的に同一であり(HTT遺伝子のポリQ延長を除いて)、したがって同質遺伝子性と呼ぶことができるHD株を生成したことが記載されている。この手法には、安定性であり、HDにおいて障害を受け易いものを含むあらゆる細胞タイプを生成することができるヒト多能性細胞が使用されるという利点がある。こうした株の比較グローバルトランスクリプトームおよび無バイアスメタボローム分析は、単一のゲノム遺伝子座に延長されたポリQトラクトを挿入することによってのみ引き起こされる、以前は検出されていない差異を明らかにした。
【0140】
1A.同質遺伝子性ヒト胚性幹細胞株の生成
手短に言えば、CRISPR-Cas9技術を使用して、以前に派生されたRUES2 hESC株を遺伝的に操作した。親細胞株であるRUES2は、NIHに登録されており(NIHhESC-09-0013)、ロックフェラー大学およびWiCell(ロット番号WB33127)から入手可能である。これは、1つの対立遺伝子に22Qをコードし、2つ目の対立遺伝子に24Qをコードする野生型HTT遺伝子座(染色体4pl6.3)を有する雌(XX)株である。128Qを追加することにより22Q対立遺伝子を改変し、したがって150Q株(RUES2-Q150)を生成した。疾患表現型の出現を加速するために、比較的多数のポリQが得られたものを選択したが、本明細書に記載のように40Qまたはそれよりも多くのQである限り、より少ない数のものを使用してもよい。
【0141】
系統追跡マーカーであるmCherryおよびブラスチシジンカセットもRUES2 hESCに組み込んだ。
【0142】
野生型HTT遺伝子を有する他の胚性細胞株を代わりに使用し、本明細書に記載のように遺伝子改変して、改変されたhESC細胞株および同質遺伝子性対照を作出することもできる。加えて、正常な対立遺伝子(20個のCAGコドン)を有する3つの未改変同質遺伝子性細胞株を対照として生成した。
【0143】
インサートの長さ(150Q HTT遺伝子を作出するための)は、起こり得る差異を発見する可能性を最大化するために、疾患の最悪の場合である早期発症若年型HDをモデル化するように選択した。(後で分かったことだが、このようにポリQの数を多くすることはその役割を果たしたものの、必要ではなかった。)系統追跡および選択の目的で、自己切断性ペプチド2A部位により隣接されたmCherry-ブラスチシジンカセットを開始コドンの上流に挿入した(図1A)。遺伝子座改変の成功は、PCRで確認した。得られたRUES2-Q150細胞は、核型に関して正常であり、HTTの細胞溶解物のウエスタンブロッティングにより証明されるように、HTT対立遺伝子を両方とも発現した。1つのHTT対立遺伝子の発現は、HD表現型を呈するのに十分であるだろうと予想される。mCherryの発現は、蛍光画像化を使用して確認した。
【0144】
ゲノム編集戦略が、hESCの基本的特性に影響を及ぼさなかったことを示すために、多能性条件下(これは、POU5F1(a/k/a OCT4)、SOX2、NANOG、LIN28A、LIN28B、およびDNMT3などの1つまたは複数の多能性マーカーの発現を試験することにより確かめることができ、これらはすべてここで試験された)で成長させた際に、RUES2-Q150細胞が、正常なhESC形態学的特徴を維持し、例えば、野生型RUES2細胞と同様のレベルで多能性マーカーを発現したことを確認した(図1B)。加えて、EdU組込みによる細胞増殖の速度ならびにアポトーシスの速度を、活性化カスパーゼ-3免疫染色により調査した。2つの株間に差異は見出されなかった。
【0145】
最後に、HDに関連する系統へのこうした細胞の分化能を決定するために、SB431542およびLDN193189を含む二重SMAD阻害を使用して、ニューロン運命を初期設定で誘導した。その代わり、SB(SB431542)およびノギンの組合せを使用して、ニューロン運命を誘導することもできた。RUES2-Q150細胞は、ニューロン特異的マーカーPAX6およびN-カドヘリンを発現する、典型的な形態学的特徴を有するロゼットを形成した。SOX17、EOMES、T(BRA)、CDX2、FOXA2、およびFOXG1などの他の分化マーカーも発現された。分化したことを示すためには、こうしたマーカーのいずれか1つで十分だっただろう。しかしながら、すべてが明らかになれば、種々の胚葉を視覚化し、各層の分化を評価することができる。まとめると、こうした結果により、ゲノム編集が、同質遺伝子性hESCの基本的特性を変化させなかったことが実証された。
【0146】
IB.検出可能で選択可能なマーカーを用いない、HD患者に見出される種々の範囲のポリCAG長にわたるESCの生成
種々のポリQ長のHTT遺伝子を含み、検出可能なマーカー(発現マーカー)mCherryおよびブラスチシジンカセットを含むHD ESC株に加えて、本出願人らは、種々のポリQ長を含むが、検出可能なマーカーおよび選択可能なマーカーのカセットを欠如する細胞も生成した。本発明者らは、HD患者に見出される典型的な範囲のポリCAG長である42、48、56、67、および150個のCAGにわたる一組の>40Q ESC株を生成した(図13A)。この場合も、RUES2 hESC株を親株として使用した。天然においてもそうであるようにCAAであった最後から2番目のコドンを除いて、コドンのすべてはCAGだった。しかしながら、150Q改変細胞で行われたように、CAGコドンおよびCAAコドンの混合物を使用することもできただろう。手短に言えば、下記の材料および方法に記載のように、CRISPR技術を使用して細胞を生成した。ポリQトラクトがHD患者に見出されるものと同じである細胞(本質的にCAGリピートのみを含む)を生成するために、本発明者らは、以下の細胞:Coriell InsitituteのND38548、GENEA BiocellsのGENEA020、ならびにTabrizi laboratory(英国)のQS-001およびQS-004線維芽細胞を使用して突然変異ハンチントン遺伝子遺伝子座を患者試料から直接的に増幅するためにPCRを使用した。ドナープラスミドを製作するためのPCRの出発物質として、こうした細胞を使用した。線維芽細胞は、多数の公的および商業的供給源から入手可能であり、それらを代わりに使用することもできただろう。同じことが残りの細胞にも当てはまり、それらは別の供給源から入手可能である。CAGトリヌクレオチドのみを含むポリQトラクトは、実験室でも合成することができる。
【0147】
加えて、本出願人は、ePigybac転位因子を含んでいた選択可能なマーカーを使用した。そのため、選択した細胞を特定した後でマーカーを除去することが可能だった。切り出しのみのトランスポサーゼ(excision-only trasnposase)は、Transposagen(レキシントン、ケンタッキー州 40508)から購入した。したがって最終的には、こうした細胞は選択可能なマーカーを含まず、ポリQトラクトの長さのみが同質遺伝子性野生型対照細胞と異なる。重要なことには、こうした改変細胞株はすべて、疾患表現型を呈した。
【0148】
こうした細胞は、同質遺伝子性正常対照細胞と比較した場合、発現マーカーおよび選択可能マーカーのカセットを含む細胞よりも差異がより少数であることを考慮すると、ポリQトラクトが導入されたことを除いて挿入配列が本質的に欠けている、ハンチントン病をモデル化するための別のセットの実施形態を提供する。
【0149】
6.1.2.考察
6.1.2.1. HDモデルオルガノイドにおけるHDのシグネチャ
神経胚形成は、中枢神経系が経る1つの重要な発生上の移行期である。特定の誘導プロトコールと併せてマイクロパターン培養を行うと、神経胚形成段階で外胚葉区画を再構成する自己組織化細胞集合体の形成をもたらすことができる。こうした再構成胚部分は、神経堤運命(SOX10+、赤色集団)およびプラコード運命(SIX1+、黄色細胞)と共に、表皮細胞(TFAP2+のみ、青色)の層に覆われた、神経ロゼットへと組織化された発生中の中枢神経系(PAX6+細胞、緑色、図3)を中央に示す。in vitro神経胚形成オルガノイドモデルと、in vivo対応物との比較(図3D~3E)は高レベルの類似性を示し、したがって、HDオルガノイドモデルアッセイは、ヒト遺伝障害を研究するための理想的なエンドポイントである。
【0150】
数多くの均質で定型的な自己組織化オルガノイドの出現は、神経上皮形態発生と結び付けられているため、本発明者らは、それらをハンチントン病(HD)のモデル化に使用することができるか否かを調査した。したがって、本発明者らは、一連のHD同質遺伝子性hESC株を使用することによりHDモデルオルガノイドを使用し、1つの主要な特徴であるPAX6面積を抽出した。図4A~4Bに示されているように、CAG延長は、PAX6+面積の増加に関連付けられた。興味深いことに、HTT-/-株が、最も劇的な表現型を示した。
【0151】
6.1.2.2. 96ウェルプレートでのHDモデルオルガノイド表現型の観察
HDモデルオルガノイド形成を、マイクロパターン化96ウェルプレートに適応させた。HD特異的オルガノイド表現型は、96ウェルプレートで再現性よく観察され、1ウェルあたり平均で28個のHDモデルオルガノイドが観察された(図5)。HD遺伝的背景を有する形成されたHDモデルオルガノイド(図5B)は、WT hESCよりも有意に大きなPAX6+領域を有していた(図5A)。標準的な閾値に基づく分析スキームを使用して、各コロニーの個々のPAX6+領域を区分化した。図5Cは、WT背景およびHD背景の複数ウェルの定量化の例を示す。以前の結果と一致して、HD特異的オルガノイド表現型が96ウェルプレートで観察された。PAX6+面積は、WTよりもHD背景の方が有意により大きかった。したがって、HDモデルオルガノイド形成プロトコールを96ウェルプレートに適応させることに成功し、ハイスループットスクリーニング作戦にて表現型復帰について化合物をスクリーニングする能力が与えられた。
【0152】
6.1.2.3.スクリーニングのロバストネス:Z’係数の算出
ハイスループットスクリーニング(HTS)を実施する場合、高率の偽陽性および偽陰性を回避するために、ロバストなアッセイが必要とされる。これは、陽性対照および陰性対照の強力な分離を示唆する。アッセイのロバストネスを測定するためにHTS分野で広く使用されているツールは、Z’係数である。陽性対照と陰性対照との分離が非常に大きい理想的な場合では、Z’は1の値に向かって収束する。良好なスクリーンアッセイは、良好なスクリーニングプラットフォームの構成に十分な程度にロバストであるためには、>0.5のZ’を有するべきであるが、複雑な表現型のスクリーニングの場合には、Z’>0でも許容されることが広く認識されている。負の値は、そのアッセイが、スクリーニング作戦の基盤であり得ないことを意味する。
【0153】
Z’係数を測定するために、対照96ウェルプレートにおける2つの異なる遺伝的背景の平均PAX6+面積を定量化した。全体として、WT/20CAG対照プレートは、HD/56CAGプレートよりも大きなPAX6陽性面積を有したことが観察された(図6A)。次いで、各ウェルのアッセイに関連付けられるZ’係数を測定した。行rおよび列cに配置されたすべてのウェルについて、以下を測定した。
【0154】
【数1】
【0155】
この計算を実施した際に(図6B)、1)陽性対照と陰性対照との分離は、十分には良好ではなく、正のZ’スコアを得ることができず、2)顕著な縁端効果があり、プレートの中央で最も良好なZ’スコアが得られ、縁端で最も悪いスコアが得られたことが判明した。しかしながら、正の値は達成されず、プレート全体の平均Z’は-17だった。したがって、正のZ’係数を得るために別の分析スキームを使用することに決めた。
【0156】
[実施例2]
6.2.実施例2:HDオルガノイドを認識するためのニューラルネットワークのトレーニング
なお、図5Cに示されている定量化は、データが大きくばらついており、陽性対照と陰性対照との分離は小さいことを示すが、WT表現型とHD表現型と区別は、人間の目には自明であると思われた(図5A~5B)。これは、人間の脳が、図5Cで定量化されたPAX6面積のような固有の特徴を比較するだけでなく、多数の他のもの:領域の形状、相対強度、および気づいてさえない多数の他の特徴を統合することにより、画像認識の複雑なタスクを実施するためである。このプロセスを計算で再構成するために、機械学習手法を使用した。
【0157】
ディープニューラルネットワークは、過去数年にわたって無バイアス画像分類のために頻繁に使用されてきた。例えば、注釈付きの画像データベースでトレーニングされた複雑なニューラルネットワークが構築されたため、Google画像検索では、今や、以前に見たこともない猫の写真を「猫」として分類することができるようになった。同様の手法を表現型分析に使用することができ、スクリーニング技術のロバストネスを向上させることができるという仮説を立てた。GPU計算を備えたコンピューターおよび公的に利用可能なディープニューラルネットワークアーキテクチャを出発点として使用した。
【0158】
使用した戦略は、2つのステップで説明することができる。第1のトレーニング相(図7A)では、ネットワークには、対照条件で得られたWT背景およびHD背景に属する画像のセットが表示されることになる。トレーニングの終了時には、ネットワークは、両表現型の認識を学習し、以前に見たことがない画像を、WT背景またはHD背景に由来するものであると正確に分類することができるようになっているだろう。第2の相では、トレーニングされたネットワークを使用して、スクリーニングからの画像でネットワークを検索することにより、本発明者らのスクリーニング作戦の結果を分析することになる。DMSOで処置した疾患HDオルガノイドは、ネットワークによりHDクラスに属するものとして分類されることになるが、ヒット化合物は表現型をWTへと復帰させ、画像は、今度はWTであると分類されることになる(図7B)。
【0159】
第1の概念実証では、最も劇的なHD表現型がHtt-/-背景で得られることが本発明者らの初期研究により示されていたため(図4)、本発明者らは、WTおよびHtt-/- HDモデルオルガノイドを効率的に認識するようにネットワークをトレーニングすることを試みた(図8A)。ネットワークを、400枚のWT HDモデルオルガノイド画像および400枚のHD HTt-/- HDモデルオルガノイド画像でトレーニングした。以前に見たことがないWTオルガノイドまたはHtt-/- HDモデルオルガノイドをネットワークに表示したところ、それらを97%の正確性で正しいクラスに正確に分類することができた。この結果は図8Bに示されている。重要なことに、ネットワークは、新しい検索画像がWTクラス画像に属するかまたはHDクラスの画像に属するかを判定することができる。さらなるステップでは、このツールを表現型復帰の分析に使用することができることを証明するために、Htt遺伝子を、別々の細胞株でHtt-/-背景に加えて過剰発現させることにより再発現させた。これは、タンパク質発現のレスキューは、HDモデルオルガノイド表現型をレスキューすることになるということを根拠にしている。Httが過剰発現されたHtt-/-背景のHDモデルオルガノイドの画像をネットワークで検索すると(図8B)、それらは、より高い確率でWTクラスに属すると分類され、したがって表現型レスキューが定量的に実証された。
【0160】
[実施例3]
6.3.実施例3:HD表現型の復帰に関する化合物ライブラリーのハイスループットスクリーニング
ネットワークを、HD表現型を復帰させる化合物の発見を目的としたハイスループットスクリーニング作戦に適用した。HDモデルオルガノイドを、上記に記載のように同質遺伝子性WT hESCおよびHD hESCから、マイクロパターン化96ウェルプレートに調製した。WT細胞を有する複数の陽性対照プレートおよび未処置56CAG HD株を有する複数の陰性対照プレートを準備した。次いで、化合物を、56CAG HD株を含む96ウェルプレートのウェルに添加した。
【0161】
Z’係数により定量化されたアッセイのロバストネスを増強することができるか否かをまず試験した。対照ウェル(WTおよびHD)のHDモデルオルガノイドを、各々無作為にトレーニングセットおよび検証セットにそれぞれ70%および30%の割合で分割した。したがって、各々67個のトレーニングウェルおよび各々29個の検証ウェルが存在し、各ウェルはおよそ25個のオルガノイドで構成されていた。次いで、1750枚のWT画像および1691枚のHD画像を用いて、ニューラルネットワークをトレーニングセットで、方法セクションに記載の通りにトレーニングした。トレーニングされたネットワークを、検証セットで評価した。個々の画像を分類する正確性は、図9に示されている。
【0162】
次いで、本発明者らは、本発明者らの機械学習手法を使用して、Z’係数により定量化される本発明者らのアッセイのロバストネスを増強することができるか否かを試験した。マルチウェルプレートでの予備実験を、ニューラルネットワーク手法で再検討し、96ウェルプレートの様々なウェルのZ’係数を算出した。スクリーニング品質の目覚ましい向上が観察され(図10A)、以前の区分化に基づく方法を使用した場合では大幅に負であったZ’係数が、この場合では正になった。1ウェル当たりのZ’係数を詳しく調査すると(図10B)、ほとんどのZ’係数が0.5よりも高く、すべてが正であることが実証された。1つのウェルのみがわずかに負のZ’を示したが、このウェルは、実際のスクリーニング中に対照ウェルとしての役目を果たしたプレート角のウェル、ならびにプレートの最初の行および最後の行に対応するため、それほど重要ではない。この特定のウェルの他は、ウェルがプレートの縁端にあるか中央にあるかに関わりなく、すべてのZ’値が正だった。したがって、本明細書に記載の革新的な機械学習ツールボックスは、ヒット分子を見出すための理想的な条件で、HD特異的な表現型スクリーニングを分析することができる。
【0163】
次いで、800個の分子のスクリーニング作戦を実施した。この特定のデータセットでニューラルネットワークをトレーニングするために、WT(RUES2)対照の1つの対照プレートおよび1つのHD/56CAG対照プレートが含まれていた。すべての他のプレートでは、HD/56CAGオルガノイド(HDモデルオルガノイド)が形成され、それらに化合物を適用した。インタクトなオルガノイドが10個未満であるウェルは、そうした場合では化合物が毒性効果を示したと仮定して、分析から除外した。他の場合、ネットワークは、以前のセクションに記載されているツールに基づいて、表現型を復帰させる化合物の能力を各ウェル毎に測定した。ネットワークは、各HDモデルオルガノイドに、0(疾患)~1(WT)の間のスコアpWTを割り当てた。これは、化合物が疾患HD表現型をWT状態へと復帰させる確率である。次いで、このスコアを各ウェルにわたって平均した。得られた1ウェル毎のスコアのヒストグラムが図11に示されている。
【0164】
予想通り、ほとんどの化合物は、HD/56CAG表現型を変化させず、野生型クラスに属するそれらの関連確率pwtはゼロに近かった。これは、HDモデルオルガノイドが影響を受けず、依然としてHDクラスに属するとネットワークが認識したことを意味する。しかしながら、少数の化合物は、表現型復帰を示し、野生型クラスに属する確率pwtを1に近づけることができた。さらにより興味深いことに、13個の化合物のpwtは>0.95だった。
【0165】
[実施例4]
6.4.実施例4:毒性の分析
実施例3のスクリーニングではヒット数が比較的多かったため、本発明者らは、ネットワークがWTおよびHDの2つのクラスにのみ結び付けられているという事実のため一部の偽陽性化合物がヒットリストに出現する可能性があるか否かを調査した。したがって、本発明者らは、HDモデルオルガノイドに対して有害効果を及ぼし、外観をWT表現型でもHD表現型でもないものにする毒性化合物という第3のクラスをネットワークから抽出することを決めた。こうした化合物は、むしろHDモデルオルガノイドを完全に異なるものにし、それは毒性の兆候である。したがって、本発明者らは、WTとHDとのバイナリ選択を出力として示す本発明者らの以前のネットワークを使用したが、2つの最終ニューロンの上流にある全結合層を抽出した。この層は512個のニューロンを有し、それらの活性は512次元の潜在ベクトルとして解釈することができ、それにより、同じ潜在空間の各表現型を表現し、2つの表現型が互いにどの程度異なるかを定量化することが可能になる。この潜在ベクトルを有するネットワークは、図12Aに示されている。
【0166】
このネットワークアーキテクチャを使用して、各化合物の効果を、2つの関連成分:その毒性レベルおよびその治療能力に分解した。治療能力は、図11に例示されるような2つのWTニューロンおよび疾患ニューロンの出力により測定した。毒性は、化合物処置コロニーと2つの対照表現型WTおよび疾患との間の差異を評価することにより測定した。この差異の程度は、化合物処置コロニーに関連付けられる潜在的ベクトルと2つの対照に関連付けられる潜在的ベクトルとの差異の最小値を取ることにより算出した。これを、512次元潜在空間全体で実行することができた。しかしながら、例えばt分布型確率的近傍埋め込み法(t-SNE)または主成分分析(PCA)を使用して、ベクトルにコードされている最も関連性の高い情報のみを抽出するためには、まずベクトルの次元性を低減することが有利だった。次いで、低減された空間でのベクトルの差異を算出した。対照ウェルおよび処置ウェルに対応するベクトルのt-SNEクラスター化は、図12Bに示されている。
【0167】
結果を最適に表示するため、各化合物の効果を、図13に示されているような三角形の表現型マップにプロットした。
【0168】
この方法論を使用してスクリーニングの結果をプロットした場合(図14)、高い治療能力(プロットのWT角にクラスター化され、高い表現型復帰を示す)ならびに低い毒性(三角形の毒性角から依然として離れている)を示す5つの化合物が見出された。
【0169】
[実施例5]
6.5 実施例5:オートエンコーダーによる毒性の分析
畳み込みオートエンコーダーに基づく方法を使用して、毒性を評価した。こうした教師なしのニューラルネットワークは、データをコードし、それを低次元の潜在表現へと圧縮する(図15)。
【0170】
この機械学習法が教師なしであるという性質は、オートエンコーダーが、データに関する追加情報(野生型細胞株または疾患細胞株に由来するなど)を一切用いずにデータの表現を学習するという利点を有し、したがって化合物毒性の推定にバイアスがかからない。また、ベクトルによるデータ表現には、野生型表現型と疾患表現型との差異をベクトル空間から取り除くことができるという利点もある。それは、この差異が毒性の決定には関連性がないからである。毒性を以下の方法で決定した。まず、野生型と疾患との差異を潜在空間から取り除く。次いで、野生型表現型および疾患表現型の平均ベクトルからの距離を算出し、野生型表現型および疾患表現型の標準偏差と比較する。この距離を、毒性と定義する(図16)。
【0171】
この方法の正確性は、既知の毒性効果を示す薬物を様々な濃度で適用し、その結果を、56CAG RUES2細胞を使用して実施した細胞生存率の従来の比色「MTT」アッセイと比較することにより試験した(ここでは、生存率は、毒性の逆数として定義される)。比較は一貫した結果を示し、毒性を決定するためのオートエンコーダー法が有効であることが確認される(図17)。
【0172】
7.具体的な実施形態
本開示は、以下の具体的な実施形態により例示される。
1.試験オルガノイドを分類するための方法であって、
試験オルガノイドを画像化して、オルガノイド画像を準備するステップ;
試験オルガノイドに分類を割り当てるようにトレーニングされているトレーニングされたニューラルネットワークを用いてオルガノイド画像を分析するステップであって、分類が、疾患表現型または非疾患表現型を含む、ステップ
を含む方法。
2.疾患表現型を有するオルガノイドの細胞が、疾患表現型を付与する1つまたは複数の突然変異を含む、実施形態1に記載の方法。
3.非疾患分類および疾患分類を有するオルガノイドの細胞が、同質遺伝子性である、実施形態1または2に記載の方法。
4.オルガノイドが、多細胞凝集体、幹細胞、多能性細胞、誘導多能性細胞、ヒト胚性幹細胞、成体幹細胞、全能性幹細胞、または非胚細胞を含む、実施形態1~3のいずれか1つに記載の方法。
5.疾患が、ハンチントン病を含む、実施形態1~4のいずれか1つに記載の方法。
6.画像化が、オルガノイドを1つまたは複数のマーカーについて染色することを含む、実施形態1~5のいずれか1つに記載の方法。
7.1つまたは複数のマーカーが、細胞小器官マーカー、細胞分化マーカー、細胞区画マーカー、またはそれらの組合せを含む、実施形態6に記載の方法。
8.1つまたは複数のマーカーが、核マーカーを含む、実施形態6または7に記載の方法。
9.1つまたは複数のマーカーが、膜マーカーを含む、実施形態6~8のいずれか1つに記載の方法。
10.1つまたは複数のマーカーが、細胞分化マーカーを含む、実施形態6~9のいずれか1つに記載の方法。
11.各オルガノイドの少なくとも2つの画像が分析され、各々が、異なるマーカーおよび異なる色チャネルに対応する、実施形態6~10のいずれか1つに記載の方法。
12.各オルガノイドの少なくとも3つの画像が分析され、各画像が、異なるマーカーおよび異なる色チャネルに対応する、実施形態6~11のいずれか1つに記載の方法。
13.オルガノイド画像が、二次元画像を含む、実施形態1~12のいずれか1つに記載の方法。
14.オルガノイド画像が、三次元画像を含む、実施形態1~13のいずれか1つに記載の方法。
15.トレーニングされたニューラルネットワークが、非疾患分類に属するオルガノイドの複数の画像および疾患分類に属するオルガノイドの複数の画像でトレーニングされたニューラルネットワークであり、ニューラルネットワークが、複数の層、および2つのノードを含む最終層を含む、実施形態1~14のいずれか1つに記載の方法。
16.ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、全結合層が、少なくとも10個のノードを含む、実施形態15に記載の方法。
17.ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、全結合層が、少なくとも100個のノードを含む、実施形態15に記載の方法。
18.ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、全結合層が、少なくとも250個のノードを含む、実施形態15に記載の方法。
19.ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、全結合層が、少なくとも400個のノードを含む、実施形態15に記載の方法。
20.ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、全結合層が、少なくとも500個のノードを含む、実施形態15に記載の方法。
21.ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、全結合層が、少なくとも600個のノードを含む、実施形態15に記載の方法。
22.ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、全結合層が、少なくとも800個のノードを含む、実施形態15に記載の方法。
23.ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、全結合層が、少なくとも1000個のノードを含む、実施形態15に記載の方法。
24.ニューラルネットワークが、最終の2つのノードの上流に全結合層を含み、全結合層が、512個のノードを含む、実施形態15~23のいずれか1つに記載の方法。
25.最終の2つのノードの上流にある全結合層が、最後から2番目の層である、実施形態1~24のいずれか1つに記載の方法。
26.分析が、
2つの最終ノードの上流にある全結合層を抽出すること、および
差異の程度を算出すること
をさらに含む、実施形態15~25のいずれか1つに記載の方法。
27.疾患に対して生物学的に活性である試験分子を特定するための方法であって、
(a)第1の哺乳動物細胞集団をオルガノイド形成条件下で培養して、第1のオルガノイドを得るステップであって、オルガノイド形成条件が、試験分子への曝露を含み、第1の哺乳動物細胞集団が、生物学的に活性な分子の非存在下のオルガノイド形成条件で培養されると、疾患表現型を有するオルガノイドをもたらす、ステップ;
(b)試験分子への曝露後に、第1のオルガノイドを画像化するステップ;
(c)0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるようにトレーニングされているニューラルネットワークを使用して、第1のオルガノイドの1つまたは複数の画像を分析するステップ;
(d)第1のオルガノイドに0%~100%の範囲の確率スコアを割り当てるステップ
を含み、
第1のオルガノイドの確率スコアが、非疾患のカットオフ確率スコアよりも高いか、または疾患のカットオフ確率スコアよりも低い場合、試験分子が疾患に対して生物学的に活性である、方法。
28.第1の哺乳動物細胞集団が、疾患表現型を付与する1つまたは複数の突然変異を含む、実施形態27に記載の方法。
29.疾患に対する試験分子の活性を検証するステップをさらに含む、実施形態27または実施形態28に記載の方法。
30.検証が、試験分子のIC50を決定することを含む、実施形態29に記載の方法。
31.試験分子のIC50の測定が、少なくとも3つの異なる濃度の試験分子を使用して実施形態27に記載の方法を繰り返すこと、および非線形最小二乗フィッティングアルゴリズムを使用して、異なる濃度での疾患または非疾患の確率スコアを分析することを含む、実施形態30に記載の方法。
32.試験分子のIC50が5μM未満である場合、試験分子を、さらなる分析または開発のために選択するステップをさらに含む、実施形態31に記載の方法。
33.より低いIC50を有する誘導体を見出すために、試験分子の誘導体を調製するステップを含む、実施形態32に記載の方法。
34.より低いIC50が、100nMよりも低い、実施形態33に記載の方法。
35.ニューラルネットワークが、0%~100%の範囲の毒性または非毒性の確率スコアを割り当てるようにさらにトレーニングされている、実施形態27~34のいずれか1つに記載の方法。
36.第1のオルガノイドに、0%~100%の範囲の毒性または非毒性の確率スコアを割り当てるステップをさらに含む、実施形態35に記載の方法。
37.試験分子のLC50を決定するステップをさらに含む、実施形態35または実施形態36に記載の方法。
38.試験分子のLC50の決定が、少なくとも3つの異なる濃度の試験分子を使用して実施形態36に記載の方法を繰り返すこと、および非線形最小二乗フィッティングアルゴリズムを使用して、異なる濃度での毒性または非毒性の確率スコアを分析することを含む、実施形態37に記載の方法。
39.試験分子のIC50およびLC50を決定するステップ、およびさらなる分析のために、IC50よりも大きなLC50を有する試験分子を選択するステップをさらに含む、実施形態27~38のいずれか1つに記載の方法。
40.LC50が、IC50より少なくとも10倍大きい、実施形態39に記載の方法。
41.LC50が、IC50より少なくとも100倍大きい、実施形態39に記載の方法。
42.疾患の動物モデルにおいて試験分子の活性をアッセイするステップをさらに含む、実施形態27~41のいずれか1つに記載の方法。
43.ニューラルネットワークの正確性を検証するステップをさらに含む、実施形態27~42のいずれか1つに記載の方法。
44.ニューラルネットワークの正確性の検証が、
(e)第1の細胞集団と同じ細胞タイプの第2の哺乳動物細胞集団を、オルガノイド形成条件下で培養して、疾患表現型を有しないオルガノイドをもたらす第2のオルガノイドを得るステップ;
(f)第2のオルガノイドを画像化するステップ;および
(g)第2のオルガノイドに0%~100%の範囲の確率スコアを割り当てるステップであって、
ニューラルネットワークが、第2のオルガノイドの確率スコアが、非疾患のカットオフ確率スコアより高いか、もしくは疾患のカットオフ確率スコアより低い場合、正確であるとみなされる、ステップ;
または
(h)第1の細胞集団と同じ細胞タイプの第2の哺乳動物細胞集団を、オルガノイド形成条件下で培養して、疾患表現型を有するオルガノイドをもたらす第3のオルガノイドを得るステップ;
(i)第3のオルガノイドを画像化するステップ;および
(j)第3のオルガノイドに0%~100%の範囲の確率スコアを割り当てるステップであって、
ニューラルネットワークが、第3のオルガノイドの確率スコアが、非疾患のカットオフ確率スコアより低いか、もしくは疾患のカットオフ確率スコアより高い場合、正確であるとみなされる、ステップ
を含む、実施形態43に記載の方法。
45.第1の哺乳動物細胞集団が、疾患表現型を付与する1つまたは複数の突然変異を含み、第2の哺乳動物細胞集団が、1つまたは複数の突然変異以外、第1の哺乳動物細胞集団と同質遺伝子性である、実施形態44に記載の方法。
46.ステップ(e)が、ステップ(a)と同時に実行される、実施形態44または実施形態45に記載の方法。
47.第1の哺乳動物細胞集団が、試験分子の存在下で少なくとも3日間培養される、実施形態27~46のいずれか1つに記載の方法。
48.培養中の試験分子の濃度が、10nM~100μMの範囲である、実施形態27~47のいずれか1つに記載の方法。
49.試験分子の濃度が、1μM~20μMの範囲である、実施形態48に記載の方法。
50.オルガノイド形成条件が、哺乳動物細胞集団をマイクロパターン上で培養することを含む、実施形態27~49のいずれか1つに記載の方法。
51.第1の哺乳動物細胞集団が、幹細胞の集団である、実施形態27~50のいずれか1つに記載の方法。
52.幹細胞が、全能性幹細胞である、実施形態51に記載の方法。
53.幹細胞が、ヒト胚性幹細胞である、実施形態51に記載の方法。
54.幹細胞が、多能性幹細胞である、実施形態51に記載の方法。
55.オルガノイド形成条件が、培養培地中に1つまたは複数の分化因子を含む、実施形態51~54のいずれか1つに記載の方法。
56.分化因子が、神経分化因子である、実施形態55に記載の方法。
57.神経分化因子が、BMP4である、実施形態56に記載の方法。
58.第1の哺乳動物細胞集団が、延長されたポリグルタミンリピートを有するハンチンチンタンパク質をコードする、実施形態27~57のいずれか1つに記載の方法。
59.延長されたポリグルタミンリピートが、42~150個のグルタミン残基を含む、実施形態58に記載の方法。
60.延長されたポリグルタミンリピートが、42個のグルタミン残基を含む、実施形態59に記載の方法。
61.延長されたポリグルタミンリピートが、45個のグルタミン残基を含む、実施形態59に記載の方法。
62.延長されたポリグルタミンリピートが、48個のグルタミン残基を含む、実施形態59に記載の方法。
63.延長されたポリグルタミンリピートが、50個のグルタミン残基を含む、実施形態59に記載の方法。
64.延長されたポリグルタミンリピートが、56個のグルタミン残基を含む、実施形態59に記載の方法。
65.延長されたポリグルタミンリピートが、58個のグルタミン残基を含む、実施形態59に記載の方法。
66.延長されたポリグルタミンリピートが、67個のグルタミン残基を含む、実施形態59に記載の方法。
67.延長されたポリグルタミンリピートが、72個のグルタミン残基を含む、実施形態59に記載の方法。
68.延長されたポリグルタミンリピートが、74個のグルタミン残基を含む、実施形態59に記載の方法。
69.延長されたポリグルタミンリピートが、150個のグルタミン残基を含む、実施形態59に記載の方法。
70.第1の哺乳動物細胞集団が、マイクロウェルプレートで培養される、実施形態27~69のいずれか1つに記載の方法。
71.マイクロウェルプレートが、24ウェルマイクロウェルプレートである、実施形態70に記載の方法。
72.第1の哺乳動物細胞集団が、1ウェル当たり20~30個のオルガノイドを産生する条件下で培養される、実施形態70または実施形態71に記載の方法。
73.オルガノイドを1つまたは複数のマーカーについて染色するステップをさらに含む、実施形態27~72のいずれか1つに記載の方法。
74.1つまたは複数のマーカーが、細胞小器官マーカー、細胞分化マーカー、細胞区画マーカー、またはそれらの組合せを含む、実施形態73に記載の方法。
75.1つまたは複数のマーカーが、核マーカーを含む、実施形態74に記載の方法。
76.1つまたは複数のマーカーが、膜マーカーを含む、実施形態74または実施形態75に記載の方法。
77.1つまたは複数のマーカーが、細胞分化マーカーを含む、実施形態74~76のいずれか1つに記載の方法。
78.各オルガノイドの少なくとも2つの画像が分析され、各々が、異なるマーカーおよび異なる色チャネルに対応する、実施形態27~77のいずれか1つに記載の方法。
79.各オルガノイドの少なくとも3つの画像が分析され、各々が、異なるマーカーおよび異なる色チャネルに対応する、実施形態27~77のいずれか1つに記載の方法。
80.画像が、二次元画像を含む、実施形態27~79のいずれか1つに記載の方法。
81.画像が、三次元画像を含む、実施形態27~79のいずれか1つに記載の方法。
82.確率スコアが、0~1のスケールで与えられる、実施形態27~79のいずれか1つに記載の方法。
83.カットオフ確率スコアが、95%である、実施形態27~81のいずれか1つに記載の方法。
84.少なくとも85%のカットオフ確率スコアが、非疾患を示す、実施形態27~81のいずれか1つに記載の方法。
85.少なくとも90%のカットオフ確率スコアが、非疾患を示す、実施形態27~81のいずれか1つに記載の方法。
86.少なくとも95%のカットオフ確率スコアが、非疾患を示す、実施形態27~81のいずれか1つに記載の方法。
87.少なくとも99%のカットオフ確率スコアが、非疾患を示す、実施形態27~81のいずれか1つに記載の方法。
88.疾患に対して生物学的に活性である分子を特定するために試験分子のコレクションをスクリーニングするための方法であって、コレクション内の各試験分子について実施形態27~87のいずれか1つに記載の方法を実施するステップを含む方法。
89.コレクションが、小分子化合物ライブラリーのすべてまたは部分を表現する、実施形態88に記載の方法。
90.コレクションが、100~100,000個の試験分子を含む、実施形態88または実施形態89に記載の方法。
91.試験分子が、個々にスクリーニングされる、実施形態88~90のいずれか1つに記載の方法。
92.試験分子が、プール中でスクリーニングされる、実施形態88~90のいずれか1つに記載の方法。
93.非疾患のカットオフ確率スコアよりも高いかまたは疾患のカットオフ確率スコアよりも低い確率スコアをもたらすプールの個々のメンバーに対して、実施形態27~87のいずれか1つに記載の方法を実施するステップをさらに含む、実施形態92に記載の方法。
94.ニューラルネットワークが、畳み込みニューラルネットワークである、実施形態27~93のいずれか1つに記載の方法。
95.ニューラルネットワークが、残差ネットワークである、実施形態94に記載の方法。
96.ニューラルネットワークが、18~152個の層を含む、実施形態94または実施形態95に記載の方法。
97.層が、畳み込み層、バッチ正規化(BatchNorm)層、および正規化線形ユニット(ReLU)層を含む、実施形態96に記載の方法。
98.畳み込み層が、入力画像の3×3ピクセルブロックを畳み込むことが可能である、実施形態94~97のいずれか1つに記載の方法。
99.ReLU層が、関数f(x)=max(0,x)を入力に適用することが可能である、実施形態72~76のいずれか1つに記載の方法。
100.BatchNorm層が、ニューラルネットワークの活性化を正規化することが可能である、実施形態94~99のいずれか1つに記載の方法。
101.ニューラルネットワークが、プーリング層をさらに含む、実施形態94~100のいずれか1つに記載の方法。
102.ニューラルネットワークが、ドロップアウト層をさらに含む、実施形態94~101のいずれか1つに記載の方法。
103.ニューラルネットワークが、全結合層をさらに含む、実施形態94~102のいずれか1つに記載の方法。
104.ニューラルネットワークが、ソフトマックス演算を実行することが可能である、実施形態94~103のいずれか1つに記載の方法。
105.ニューラルネットワークが、事前トレーニングされている、実施形態94~104のいずれか1つに記載の方法。
106.ネットワークが、
(a)疾患表現型を有するオルガノイドの入力画像の第1のトレーニングセット、および非疾患表現型を有するオルガノイドの入力画像の第2のトレーニングセットを受け取るステップ;
(b)入力画像の疾患または非疾患の確率スコアを、それらの真の値と比較するステップ;ならびに
(c)ニューラルネットワークにわたる逆伝播プロセス中に、ニューラルネットワークのノードの重みを更新するステップ
を含む方法により、疾患または非疾患の確率スコアを割り当てるようにトレーニングされている、実施形態105に記載の方法。
107.入力画像の第1のトレーニングセットおよび入力画像の第2のトレーニングセットが各々、少なくとも500枚の画像を含む、実施形態106に記載の方法。
108.ネットワークが、入力画像を無作為な順序で受け取る、実施形態106または実施形態107に記載の方法。
109.ステップ(a)~(c)を少なくとも200~800回繰り返すことをさらに含み、ステップ(a)~(c)の実施が、1回のエポックを含む、実施形態106~108のいずれか1つに記載の方法。
110.約500回のエポックを含む、実施形態109に記載の方法。
111.入力画像を各後続のエポックの前に拡張するステップをさらに含む、実施形態106~110のいずれか1つに記載の方法。
112.拡張が、画像を回転させること、トリミングすること、拡大縮小すること、もしくは画像のコントラストを変化させること、または2つ、3つ、もしくは4つすべての操作の組合せを含む、実施形態111に記載の方法。
113.異なるハイパーパラメーターを用いて、ステップ(a)~(c)を少なくとも5回繰り返すステップを含む、実施形態106~112のいずれか1つに記載の方法。
114.異なるハイパーパラメーターを用いて、ステップ(a)~(c)を少なくとも10回繰り返すステップを含む、実施形態106~112のいずれか1つに記載の方法。
115.異なるハイパーパラメーターを用いて、ステップ(a)~(c)を少なくとも20回繰り返すステップを含む、実施形態106~112のいずれか1つに記載の方法。
116.ハイパーパラメーターが、層の数およびタイプ、モメンタムおよび学習速度、ドロップアウトパーセンテージ、エポック数、または2つ、3つ、または4つすべてのハイパーパラメーターの組合せを含む、実施形態113~115のいずれか1つに記載の方法。
117.ニューラルネットワークが、512個のノードを有する全結合層を含む、実施形態89~97のいずれか1つに記載の方法。
118.最終全結合層が、疾患表現型および非疾患表現型を反映する2つのノードを有する、実施形態89~98のいずれか1つに記載の方法。
119.
(a)第1の細胞集団と同じ細胞タイプの第3の哺乳動物細胞集団を、疾患表現型を有するオルガノイドをもたらすオルガノイド形成条件下で培養するステップ;
(b)第1の細胞集団と同じ細胞タイプの第4の哺乳動物細胞集団を、疾患表現型を有しないオルガノイドをもたらすオルガノイド形成条件下で培養するステップ;
(c)第3および第4の哺乳類細胞集団から形成されたオルガノイドを画像化するステップ;ならびに
(d)第3の哺乳動物細胞集団から形成されたオルガノイドの1つまたは複数の画像および第4の哺乳動物細胞集団から形成されたオルガノイドの1つまたは複数の画像を、ニューラルネットワークを使用して分析して、疾患表現型および非疾患表現型の潜在ベクトルを得るステップ
をさらに含む、実施形態103~118のいずれか1つに記載の方法。
120.第1および第3の哺乳動物細胞集団が、疾患表現型を付与する1つまたは複数の突然変異を含み、第4の哺乳動物細胞集団が、1つまたは複数の突然変異以外は、第1および第3の哺乳動物細胞集団と同質遺伝子性である、実施形態119に記載の方法。
121.第1の哺乳動物細胞集団の培養、第3の哺乳動物細胞集団の培養、および第4の哺乳動物細胞集団の培養が、同時に実施される、実施形態119または実施形態120に記載の方法。
122.ニューラルネットワークが、
(a)2つの最終ノードの上流にある全結合層を抽出するステップ;および
(b)試験分子と接触した第1の哺乳動物細胞集団に関連付けられる潜在ベクトルと、試験分子と接触していない第1の細胞集団に関連付けられる潜在ベクトルと、第2の細胞集団に関連付けられる潜在ベクトルとの間の差異を定量化して、試験分子と接触した第1の哺乳動物細胞集団と、試験分子と接触していない第1の細胞集団に関連付けられる潜在ベクトルと、第2の細胞集団に関連付けられる潜在ベクトルとの間の差異の程度を提供するステップ
を含む方法により、試験分子に曝露されたオルガノイドに毒性または非毒性の確率スコアを割り当てる、実施形態35~121のいずれか1つに記載の方法。
123.差異の程度が、試験分子と接触した第1の哺乳動物細胞集団に関連付けられる潜在ベクトルと、試験分子と接触していない第1の細胞集団に関連付けられる潜在ベクトルと、第2の細胞集団に関連付けられる潜在ベクトルとの間の差異の最小値を取ることにより算出される、実施形態122に記載の方法。
124.差異の程度が、潜在空間全体にわたって決定される、実施形態123に記載の方法。
125.潜在空間が、少なくとも10個の次元を含む、実施形態124に記載の方法。
126.潜在空間が、少なくとも100個の次元を含む、実施形態124に記載の方法。
127.潜在空間が、少なくとも250個の次元を含む、実施形態124に記載の方法。
128.潜在空間が、少なくとも400個の次元を含む、実施形態124に記載の方法。
129.潜在空間が、少なくとも500個の次元を含む、実施形態124に記載の方法。
130.潜在空間が、少なくとも600個の次元を含む、実施形態124に記載の方法。
131.潜在空間が、少なくとも800個の次元を含む、実施形態124に記載の方法。
132.潜在空間が、少なくとも1000個の次元を含む、実施形態124に記載の方法。
133.潜在空間が、低減される、実施形態123~132のいずれか1つに記載の方法。
134.次元削減法が、t分布型確率的近傍埋め込み法(t-SNE)または主成分分析法(PCA)である、実施形態133に記載の方法。
135.疾患または非疾患の確率スコアおよび毒性または非毒性の確率スコアを、グラフ形式でプロットするステップをさらに含む、実施形態133または実施形態134に記載の方法。
136.グラフ形式が、正三角形であり、その角が、非疾患表現型、疾患表現型、および毒性表現型を意味する、実施形態135に記載の方法。
137.
(a)プロセッサ;および
(b)請求項1~19のいずれかの分析ステップを実装するプロセッサ実行可能命令を含む非一時的記憶媒体
を含むシステム。
138.
(a)プロセッサ;および
(b)実施形態27~84のいずれか1つのステップ(c)を実装するプロセッサ実行可能命令を含む非一時的記憶媒体
を含むシステム。
139.
(a)プロセッサ;および
(b)実施形態27のステップ(c)を実装するプロセッサ実行可能命令を含む非一時的記憶媒体
を含むシステム。
140.オルガノイド画像を受け取るため、およびニューラルネットワークを使用して、オルガノイドの1つまたは複数の画像をニューラルネットワークを使用して分析し、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるためのプロセッサ実行可能命令を含む非一時的な記憶媒体。
141.実施形態94~118および122~136のいずれか1つに記載の方法で使用されるニューラルネットワークを含む、実施形態140に記載の非一時的記憶媒体。
142.オルガノイドの1つまたは複数の画像を分析し、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるようにニューラルネットワークをトレーニングするための方法であって、
(a)疾患表現型を有するオルガノイドの入力画像の第1のトレーニングセット、および非疾患表現型を有するオルガノイドの入力画像の第2のトレーニングセットを受け取るステップ;
(b)入力画像の疾患または非疾患の確率スコアを、それらの真の値と比較するステップ;ならびに
(c)ニューラルネットワークにわたる逆伝播プロセス中に、ニューラルネットワークのノードの重みを更新するステップ
を含む方法。
143.入力画像の第1のトレーニングセットおよび入力画像の第2のトレーニングセットが各々、少なくとも500枚の画像を含む、実施形態142に記載の方法。
144.ネットワークが、入力画像を無作為な順序で受け取る、実施形態142または実施形態143に記載の方法。
145.ステップ(a)~(c)を少なくとも200回繰り返すステップをさらに含む、実施形態142~144のいずれか1つに記載の方法。
146.ステップ(a)~(c)を少なくとも400回繰り返すステップをさらに含む、実施形態142~144のいずれか1つに記載の方法。
147.ステップ(a)~(c)を少なくとも500回繰り返すステップをさらに含む、実施形態142~144のいずれか1つに記載の方法。
148.ステップ(a)~(c)を少なくとも600回繰り返すステップをさらに含む、実施形態142~144のいずれか1つに記載の方法。
149.ステップ(a)~(c)を少なくとも800回繰り返すステップをさらに含む、実施形態142~144のいずれか1つに記載の方法。
150.ステップ(a)~(c)を少なくとも1000回繰り返すステップをさらに含む、実施形態142~144のいずれか1つに記載の方法。
151.約500回のエポックを含む、実施形態145に記載の方法。
152.入力画像を各後続のエポックの前に拡張するステップをさらに含む、実施形態145~151のいずれか1つに記載の方法。
153.拡張が、画像を回転させること、トリミングすること、拡大縮小すること、もしくは画像のコントラストを変化させること、または2つ、3つ、もしくは4つすべての操作の組合せを含む、実施形態152に記載の方法。
154.異なるハイパーパラメーターを用いて、ステップ(a)~(c)を少なくとも5回繰り返すステップを含む、実施形態142~153のいずれか1つに記載の方法。
155.異なるハイパーパラメーターを用いて、ステップ(a)~(c)を少なくとも10回繰り返すステップを含む、実施形態142~153のいずれか1つに記載の方法。
156.異なるハイパーパラメーターを用いて、ステップ(a)~(c)を少なくとも20回繰り返すステップを含む、実施形態142~153のいずれか1つに記載の方法。
157.ハイパーパラメーターが、層の数、モメンタムおよび学習速度、ドロップアウトパーセンテージ、エポック数、または2つ、3つ、もしくは4つすべてのハイパーパラメーターの組合せを含む、実施形態154に記載の方法。
158.512個のノードを有する全結合層を含む、実施形態142~157のいずれか1つに記載の方法。
159.最終全結合層が、疾患表現型および非疾患表現型を反映する2つのノードを有する、実施形態142~158のいずれか1つに記載の方法。
160.
(a)オルガノイドを画像化することが可能な画像化デバイス;
(b)(i)画像化デバイスからオルガノイド画像を受け取るように、および
(ii)ニューラルネットワークを使用して、オルガノイドの1つまたは複数の画像をニューラルネットワークを使用して分析し、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるように
構成されているプロセッサ
を含むシステム。
161.ニューラルネットワークが、実施形態94~118および122~136のいずれか1つに記載の方法で使用されるニューラルネットワークである、実施形態160に記載のシステム。
162.
(a)オルガノイドを画像化することが可能な画像化デバイス;
(b)(i)画像化デバイスからオルガノイド画像を受け取るように、および
(ii)ニューラルネットワークをトレーニングして、オルガノイドの1つまたは複数の画像を分析し、実施形態142~159のいずれか1つに記載の方法に従って、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるように
構成されているプロセッサ
を含むシステム。
163.
(a)オルガノイドを画像化することが可能な画像化デバイス;
(b)i.画像化デバイスからオルガノイド画像を受け取るように、
ii.ニューラルネットワークをトレーニングして、オルガノイドの1つまたは複数の画像を分析し、実施形態142~159のいずれか1つに記載の方法に従って、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるように、および
iii.ニューラルネットワークを使用して、オルガノイドの1つまたは複数の画像をニューラルネットワークを使用して分析し、0%~100%の範囲の疾患または非疾患の確率スコアを割り当てるように
構成されているプロセッサ
を含むシステム。
164. 試験分子の毒性を決定するための方法であって、
a)実施形態27~136のいずれか1つに記載の方法を実施するか、または方法からデータを収集もしくは得るステップであって、例えば、その結果、生成または収集されたデータ(例えば、画像データ)が潜在空間中に表現される、ステップ;
(b)潜在空間から野生型と疾患との間の距離を除去するステップ;
(c)野生型表現型および疾患表現型の平均ベクトルから距離を算出するステップ;
(d)ステップ(c)で算出された距離ならびに野生型表現型および疾患表現型の標準偏差を比較するステップ;ならびに
(e)毒性値を決定するステップ
を含み、
任意選択で、ステップ(a)~(e)が、オートエンコーダー、例えば畳み込みオートエンコーダーにより実施される、方法。
165.毒性値の決定が、0%~100%の範囲の毒性または非毒性の確率スコアを割り当てることを含む、実施形態164に記載の方法。
166.第1のオルガノイドに、0%~100%の範囲の毒性または非毒性の確率スコアを割り当てるステップをさらに含む、実施形態165に記載の方法。
167.試験分子のLC50を決定するステップをさらに含む、実施形態165または実施形態166に記載の方法。
168.試験分子のLC50の決定が、少なくとも3つの異なる濃度の試験分子を使用して実施形態166に記載の方法を繰り返すこと、および非線形最小二乗フィッティングアルゴリズムを使用して、異なる濃度での毒性または非毒性の確率スコアを分析することを含む、実施形態167に記載の方法。
169.試験分子のIC50およびLC50を決定するステップ、およびさらなる分析のために、IC50よりも大きなLC50を有する試験分子を選択するステップをさらに含む、実施形態164~168のいずれか1つに記載の方法。
170.LC50が、IC50より少なくとも10倍大きい、実施形態169に記載の方法。
171.LC50が、IC50より少なくとも100倍大きい、実施形態169に記載の方法。
172.ニューラルネットワークが、オートエンコーダーを含み、任意選択で、オートエンコーダーが、畳み込みオートエンコーダーである、実施形態1~26のいずれか1つに記載の方法。
173.分類が、毒性表現型をさらに含む、実施形態1~26のいずれか1つに記載の方法。
174.毒性表現型が、オートエンコーダーにより割り当てられる、実施形態173に記載の方法。
175.毒性表現型が、実施形態164~171のいずれか1つの(a)~(e)を実施するオートエンコーダーにより決定される、実施形態174に記載の方法。
176.実施形態164~171のいずれか1つのステップ(a)~(e)に従って毒性スコアを割り当てるように構成されているオートエンコーダーを含む、実施形態137~139および160~164のいずれか1つに記載のシステム。
177.実施形態164~171のいずれか1つに記載の方法のステップ(a)~(e)により毒性スコアを割り当てるように構成されている、実施形態140または実施形態141に記載の非一時的記憶媒体。
【0173】
本出願で引用されている刊行物、特許、特許出願、および他の文書がすべて、個々の刊行物、特許、特許出願、または他の文書が、あらゆる目的のために参照により組み込まれることが個々に示されている場合と同じ程度に、あらゆる目的のためにそれらの全体が参照により本明細書に組み込まれる。
【0174】
種々の具体的な実施形態が図示および記載されているが、本発明の趣旨および範囲から逸脱することなく、種々の変更をなすことができることが理解されるだろう。
図1
図2-1】
図2-2】
図2-3】
図3-1】
図3-2】
図3-3】
図4-1】
図4-2】
図5-1】
図5-2】
図6-1】
図6-2】
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
【国際調査報告】