IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ グラクソスミスクライン、インテレクチュアル、プロパティー、ディベロップメント、リミテッドの特許一覧 ▶ ユーシーエル ビジネス パブリック リミテッド カンパニーの特許一覧

特表2022-550083クローン細胞株の生産安定性を予測する方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-11-30
(54)【発明の名称】クローン細胞株の生産安定性を予測する方法
(51)【国際特許分類】
   C12Q 1/68 20180101AFI20221122BHJP
   C12N 5/071 20100101ALI20221122BHJP
   C12Q 1/6841 20180101ALI20221122BHJP
【FI】
C12Q1/68
C12N5/071
C12Q1/6841 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022519237
(86)(22)【出願日】2020-09-25
(85)【翻訳文提出日】2022-05-25
(86)【国際出願番号】 EP2020076831
(87)【国際公開番号】W WO2021058709
(87)【国際公開日】2021-04-01
(31)【優先権主張番号】62/906,798
(32)【優先日】2019-09-27
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TWEEN
(71)【出願人】
【識別番号】513032275
【氏名又は名称】グラクソスミスクライン、インテレクチュアル、プロパティー、ディベロップメント、リミテッド
【氏名又は名称原語表記】GLAXOSMITHKLINE INTELLECTUAL PROPERTY DEVELOPMENT LIMITED
(71)【出願人】
【識別番号】506417186
【氏名又は名称】ユーシーエル ビジネス リミテッド
(74)【代理人】
【識別番号】100091487
【弁理士】
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100120617
【弁理士】
【氏名又は名称】浅野 真理
(74)【代理人】
【識別番号】100126099
【弁理士】
【氏名又は名称】反町 洋
(72)【発明者】
【氏名】アレクサンダー、ヘンダーソン
(72)【発明者】
【氏名】ニコラ、リッチモンド
(72)【発明者】
【氏名】シャフラ、サレヒ
(72)【発明者】
【氏名】レンベン、タラバン
【テーマコード(参考)】
4B063
4B065
【Fターム(参考)】
4B063QA17
4B063QA18
4B063QA20
4B063QQ08
4B063QQ42
4B063QR32
4B063QR35
4B063QR55
4B063QS34
4B063QX02
4B065AA90X
4B065AA90Y
4B065BD14
4B065CA60
(57)【要約】
本発明は、クローン細胞株の生産安定性および/または生産不安定性を予測する方法であって、a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;b)各細胞培養の細胞の核型分析を行う工程;およびc)工程(b)の核型分析からゲノム不安定性値を導出する工程を含んでなる方法に関する。本発明はまた、治療タンパク質を発現する細胞株を選択する方法および大規模治療タンパク質生産のための高力価生産クローン細胞株を選択する方法に関する。
【特許請求の範囲】
【請求項1】
クローン細胞株の生産安定性および/または生産不安定性を予測する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;および
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程
を含んでなる、方法。
【請求項2】
治療タンパク質を発現する細胞株を選択する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程;および
(d)工程(c)のゲノム不安定性に基づいてクローン細胞株を選択する工程
を含んでなる、方法。
【請求項3】
大規模治療タンパク質生産のための高力価生産クローン細胞株を選択する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程;および
(d)工程(c)のゲノム不安定性に基づいてクローン細胞株を選択する工程
を含んでなる、方法。
【請求項4】
核型分析がクローン細胞株の染色体異常を同定することを含んでなる、請求項1~3のいずれか一項に記載の方法。
【請求項5】
核型分析が多色蛍光in situハイブリダイゼーション(MFISH)、スペクトル核型分析(SKY)またはGiesmaバンド分染法(Gバンド分染法)を行うことを含んでなる、請求項1~4のいずれか一項に記載の方法。
【請求項6】
工程(b)の後に核型により各細胞培養の亜集団を決定する工程をさらに含んでなる、請求項1~5のいずれか一項に記載の方法。
【請求項7】
ゲノム不安定性値を導出することが、各亜集団を、クローン染色体異常(CCA)を含んでなるものまたは非クローン染色体異常(NCCA)を含んでなるものとして割り当てることを含んでなる、請求項6に記載の方法。
【請求項8】
ゲノム値を導出することが各クローン細胞株のCCAパーセンテージおよび/またはNCCAパーセンテージを決定する工程をさらに含んでなる、請求項7に記載の方法。
【請求項9】
ゲノム不安定性値を導出することが、平均マッチングコスト分布を決定することを含んでなる、請求項1~5のいずれか一項に記載の方法。
【請求項10】
ゲノム不安定性値を導出することが、平均マッチングコスト分布の分散を決定することを含んでなる、請求項9に記載の方法。
【請求項11】
前記ゲノム不安定性値が、i)CCA%または平均マッチングコスト分布の分散によってクローン細胞をランク付けするため;(ii)CCA%閾値または平均マッチングコスト分布閾値の分散を導出するため;および(iii)四分位数閾値を導出するために使用される、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記ゲノム不安定性値がCCA%閾値を導出するために使用され、場合により、CCA%閾値は少なくとも70%であり、さらに場合により、CCA%閾値は78%である、請求項11に記載の方法。
【請求項13】
各細胞培養の細胞の核型分析を行う工程および/または核型分析からゲノム不安定性値を導出する工程が自動化されている、請求項1~12のいずれか一項に記載の方法。
【請求項14】
自動化がコンピューターに実装される自動化である、請求項13に記載の方法。
【請求項15】
各細胞培養の細胞の核型分析を行う工程が10世代~40世代の間に行われ、場合により、各細胞培養の細胞の核型分析を行う工程が10、15または20世代後に行われる、請求項1~14のいずれか一項に記載の方法。
【請求項16】
前記クローン細胞株が哺乳動物細胞株である、請求項1~15のいずれか一項に記載の方法。
【請求項17】
前記哺乳動物細胞株がチャイニーズハムスター卵巣(CHO)細胞株である、請求項16に記載の方法。
【請求項18】
前記CHO細胞株がCHO-K1である、請求項17に記載の方法。
【請求項19】
前記CHO細胞株がグルタミンシンセターゼ(GS)ノックアウト細胞である、請求項17または18に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は一般に、治療タンパク質生産のための細胞株を開発する方法、特に、クローン細胞株の生産安定性および/または生産不安定性を予測する方法に関する。本発明はまた、治療タンパク質を発現する細胞株を選択する方法および大規模治療タンパク質生産のための高力価生産クローンを選択するための方法にも関する。
【背景技術】
【0002】
発明の背景
哺乳動物細胞株は、組換え治療タンパク質の生産のために使用される。このような哺乳動物細胞株の例としては、マウス骨髄腫細胞(NS0)、ベビーハムスター腎臓細胞(BHK)、ヒト胎児腎臓細胞(HEK-293)およびチャイニーズハムスター卵巣細胞(CHO)が挙げられ、現在承認されている組換えタンパク質の80%以上がCHOプラットフォームで発現されている(Butler & Spearman, 2014; Walsh, 2018)。このプラットフォームとしてのCHO細胞株の成功は、主として、高密度で培養できる能力、外因性DNAの取り込みの容易さ、および無血清浮遊培養への適応の比較的容易さに大きく起因する可能性がある。
【0003】
哺乳動物細胞を使用して治療タンパク質を生産する方法の主なボトルネックは、生産が安定しているクローン細胞株を単離するためにかかる時間である。産業上、
生産安定性評価は60~>100世代の間で変化する可能性があり(BioPhorum Development Group, Stability Survey 2018)、生産的に不安定である細胞が大部分を占めるために、かなりの数の細胞株を評価する必要がある。製造スケジュールは通常、少なくとも1年前までに予約されるため、製造期間中、生産力価を維持しないと、プロセス収率がタイムラインに大きな影響を与える可能性がある。従って、予想外に低い生産力価は、スケジューリングに多大な影響を及ぼし、製品流通にノックオン効果をもたらす繰り返しの製造実施に至ることがある。
【0004】
よって、当技術分野では、生産安定性を有するクローン細胞株を同定するためにかかる時間を短縮する方法が必要である。
【発明の概要】
【0005】
発明の概要
発明の1つの側面によれば、クローン細胞株の生産安定性および/または生産不安定性を予測する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;および
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程
を含んでなる方法が提供される。
【0006】
本発明のさらなる側面において、治療タンパク質を発現する細胞株を選択する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程;および
(d)工程(c)のゲノム不安定性に基づいてクローン細胞株を選択する工程
を含んでなる方法が提供される。
【0007】
本発明のさらに別の側面において、大規模治療タンパク質生産のための高力価生産クローン細胞株を選択する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程;および
(d)工程(c)のゲノム不安定性に基づいてクローン細胞株を選択する工程
を含んでなる方法が提供される。
【0008】
1つの実施形態おいて、核型分析は、クローン細胞株の染色体異常を同定することを含んでなる核型分析を行うことを含んでなる。別の実施形態では、核型分析は、多色蛍光in situハイブリダイゼーション(MFISH)、スペクトル核型分析(SKY)またはGiesmaバンド分染法(Gバンド分染法)を行うことを含んでなる。
【0009】
さらなる実施形態において、この方法は、工程(b)の後に核型により各細胞培養の亜集団を決定する工程をさらに含んでなる。
【0010】
いくつかの実施形態において、ゲノム不安定性値を決定することは、各亜集団を、クローン染色体異常(CCA)を含んでなるものまたは非クローン染色体異常(NCCA)を含んでなるものとして割り当てることを含んでなる。1つの実施形態において、ゲノム値を決定することは、各クローン細胞株のCCAパーセンテージおよび/またはNCCAパーセンテージを決定する工程をさらに含んでなる。
【0011】
いくつかの実施形態において、ゲノム不安定性値を決定することは、平均マッチングコスト分布を決定することを含んでなる。いくつかの実施形態において、ゲノム不安定性値を導出することは、平均マッチングコスト分布の分散を決定することを含んでなる。いくつかの実施形態において、ゲノム不安定性値は、i)CCA%または平均マッチングコスト分布の分散によってクローン細胞をランク付けするため;(ii)CCA%閾値または平均マッチングコスト分布閾値の分散を導出するため;および(iii)四分位数閾値を導出するために使用される。1つの実施形態において、ゲノム不安定性値は、CCA%閾値を導出するために使用される。1つの実施形態において、CCA%閾値は、少なくとも70%である。1つの実施形態において、CCA%閾値は78%である。
【0012】
いくつかの実施形態において、各細胞培養の細胞の核型分析を行う工程および/または核型分析からゲノム不安定性値を導出する工程は自動化されている。1つの実施形態において、自動化は、コンピューターに実装される自動化である。
【0013】
いくつかの実施形態において、各細胞培養の細胞の核型分析を行う工程は、10世代~40世代の間に行われる。いくつかの実施形態において、各細胞培養の細胞の核型分析を行う工程は、10、15または20世代後に行われる。
【0014】
1つの実施形態において、クローン細胞株は、哺乳動物細胞株である。1つの実施形態において、哺乳動物細胞株は、チャイニーズハムスター卵巣(CHO)細胞株である。1つの実施形態において、CHO細胞株は、CHO-K1である。いくつかの実施形態において、CHO細胞株は、グルタミンシンセターゼ(GS)ノックアウト細胞である。
【図面の簡単な説明】
【0015】
図1A】安定性および時点のカテゴリーに分割された各細胞株の集団円グラフ。CCA(斑点)およびNCCA(無地)の円セグメントは、安定と不安定および初期と後期を比較した場合のNCCA集団の増加を強調する。
図1B】総CCAおよびNCCA頻度を各安定性群について計算し、各群の間の違いは統計的に有意であった(2元配置ANOVA、P=0.01)。総平均は78%と計算され、これは生産安定性と指定するための潜在的閾値を示す。
図1C】初期時点と後期時点の間のCCAおよびNCCA集団頻度の違いは統計的に有意であり(2元配置ANOVA、P=<0.0001)、NCCA集団は長期間の細胞培養にわたって増加してより不均一になることを示す。三角は集団平均および95%信頼区間を表し、青い線は標準偏差を示す。
図1D】染色体によって分類された突然変異;細胞株は異なる模様のセグメントによって表される。染色体6および8は、最も多い突然変異を保持し、染色体6は14のうち11の細胞株で変異している。
図1E】安定性によって選別されていること以外はDと同様の棒グラフ。2、17、18、および19を除く総ての染色体は、安定細胞株および不安定細胞株の両方で突然変異を獲得していた。具体的な染色体変異のパターンは観察しなかった。
図2A】結果分析の後、細胞株の盲検解除の前に、3つの異なる予測方法を考案した。細胞株をCCA%によって高から低まで選別し、異なる予測方法を適用し、予測成功率を計算した。最も安定な細胞株および最も不安定な細胞株を特定するために使用した上位および下位25%。
図2B】結果分析の後、細胞株の盲検解除の前に、3つの異なる予測方法を考案した。細胞株をCCA%によって高から低まで選別し、異なる予測方法を適用し、予測成功率を計算した。最初の生産安定細胞株および不安定細胞株パネルに基づく閾値予測;CCA78%閾値設定。CCA≧78%を生産安定細胞株と見なすのに対し、<78%を生産不安定細胞株と見なす。
図2C】結果分析の後、細胞株の盲検解除の前に、3つの異なる予測方法を考案した。細胞株をCCA%によって高から低まで選別し、異なる予測方法を適用し、予測成功率を計算した。細胞株のトリアージのための上位25%および下位50%を特定するために、CCAパーセンテージ(%)によって選別された細胞株を四分位数に分割した。
図2D】結果分析の後、細胞株の盲検解除の前に、3つの異なる予測方法を考案した。細胞株をCCA%によって高から低まで選別し、異なる予測方法を適用し、予測成功率を計算した。生産安定群および生産不安定群におけるCCA%およびNCCA%の比較(プールしたT検定、P=<0.0001)。
図3A】生産実施中8日目にサンプリングした生産安定細胞株および生産不安定細胞株のCCA集団(斑点)およびNCCA集団(無地)。0日の時点は、生産実施環境に入る前の細胞株のベースラインの不均一性を表す。NCCA集団の増加は、生産環境内で8日後に見られた。8日目gH2AXは、生産実施期間に1ng/mlネオカルジノスタチンで処理した同じ細胞株を表す。ネオカルジノスタチンの添加は、NCCA集団をさらに増加させた(赤いセグメント)。
図3B】0日目、8日目および8日目gH2AX(ネオカルジノスタチン処理)の安定細胞株のCCA%およびNCCA%。安定細胞株は、生産実施環境内で8日後にCCA集団の減少を示した(2元配置ANOVA、ホッホバーグ補正したP値、P=<0.001***)。CCA集団の減少は、DNA損傷剤の添加によって0日目および8日目に比べてさらに進んでいた(それぞれP=<0.0001***およびP=<0.01**)。
図3C】0日目、8日目および8日目gH2AXの不安定細胞株の%CCAおよび%NCCA。%CCAは0日目~8日目の間に17.5%減少したが、これは有意でなかった(P=0.07n.s)。CCA集団はネオカルジノスタチンの存在下で減少し、0日目に比べて約40%の減少(P=<0.0001***)、8日目に比べて約23%の減少(P=0.015)をもたらした。
図4図4 A1およびA2)U-Netモデルを用いた自動画像セグメント化。染色体の忠実なセグメント化は、ガウス混合モデル(B1およびB2)を使用する堅牢な疑似着色を可能にする。C1およびC2)染色体のペアワイズ線形割り当てと関連するマッチングコスト。10および19の転座は、アルゴリズムにより大きなマッチングコストによって検出可能である。
図5A】各細胞株内でCCA比およびNCCA比に類似の特性を示す手動および自動(APW)計算CCAおよびNCCA亜集団の比較。
図5B】手動分析で見られたように、安定細胞株と不安定細胞株の間で明確な分離を示す(P=<0.05)自動予測ワークフローによって生成されるCCA%およびNCCA%の比較。
図5C】細胞株平均コストマッチング分布分散とNCCA%の間で相関を示すドットプロットであって、平均マッチングコスト分布の分散が遺伝的不安定性の計算バイオマーカーとして使用可能であることを示す(大きな分散=マッチングコストの変動の増大=突然変異の数が多い)。
【発明の具体的説明】
【0016】
発明の詳細な説明
定義
特に定義されない限り、本明細書で使用される総ての技術用語および科学用語は、本発明が属す技術分野の熟練者によって共通に理解されているものと同じ意味を有する。本明細書に参照される総ての特許および刊行物は、それらの全内容が参照により本明細書の一部とされる。
【0017】
用語「含んでなる」は、「含む」または「からなる」を包含し、例えば、Xを「含んでなる」は、例外なくXからなり得る、または何らかの追加、例えばX+Yを含み得る。
【0018】
用語「から本質的になる」は、その特徴の範囲を、指定された材料または工程および特許請求される特性の基本的特徴に実質的に影響を及ぼさないものに限定する。
【0019】
用語「からなる」は、いずれの付加的成分の存在も排除する。
【0020】
用語「約」は、数値xに関して、例えば、x±10%、5%、2%または1%を意味する。
【0021】
用語「クローン細胞株」は、本明細書において使用する場合、単一細胞選別を行った、対象遺伝子を含んでなる宿主細胞を指す。クローン細胞株は、本明細書に記載されるような治療タンパク質生産安定性評価を受けてもよく、その間に単一細胞選別されたクローン細胞株が細胞培養で増殖される。前記細胞培養で増殖した細胞は、それぞれの細胞株に対して共通の祖先を有する。「2つ以上のクローン細胞株」が使用される場合、これは同じ対象治療タンパク質を発現するクローン細胞株を指すと理解されるべきである。
【0022】
用語「核型」は、本明細書において使用する場合、細胞内の染色体の集合体を指す。この用語はまた、細胞の染色体の画像も指す。核型は、細胞の染色体構成の分析または決定(すなわち、核型分析)、例えば、染色体異常の分析または決定のために使用することができる。
【0023】
用語「染色体異常」は、本明細書において使用する場合、染色体の構造または数を含む異常を指す。染色体異常の例としては、転座、欠失、倍加および逆位が挙げられる。細胞のクローン集団は、同じまたは類似の染色体異常を含んでなる細胞の亜集団に分割され得る。
【0024】
用語「クローン染色体異常」は、本明細書において使用する場合、細胞のクローン集団内の20~40の無作為に調べた有糸分裂像で少なくとも2回検出される染色体異常である。
【0025】
用語「非クローン染色体異常」は、本明細書において使用する場合、細胞のクローン集団内の20~40の無作為に調べた有糸分裂像で単一細胞にのみ検出される染色体異常である。
【0026】
用語「ゲノム不安定性測定基準」は、本明細書において使用する場合、細胞系列のゲノム内の染色体異常のレベルが評価され得る測定基準を指す。言い換えれば、ゲノム不安定性測定基準は、クローン集団の核型の不均一性が測定され得る測定基準である。「ゲノム不安定性値」は、クローン細胞株から増殖した細胞の核型にそのゲノム不安定性測定基準を適用することによって導出される。
【0027】
用語「生産安定性」は、本明細書において使用する場合、クローン細胞株による治療タンパク質の生産の安定性、すなわち、4~6か月にわたる一貫した力価の治療タンパク質の生産を指す。いくつかの例において、一貫した力価は、治療タンパク質の<30%の低下と定義される。
【0028】
用語「初期時点」は、本明細書において使用する場合、細胞のサンプルがそれらの核型を決定するために採取された初期の時点を指す。これはおよそ10~20世代の間に採取される。
【0029】
用語「後期時点」は、本明細書において使用する場合、細胞のサンプルがそれらの核型を決定するために採取された後期の時点を指す。これはおよそ80~150世代前後の間に採取される。
【0030】
宿主細胞株は、治療タンパク質生産クローン細胞株を作出するための哺乳動物細胞工場として使用される。抗体を治療タンパク質の例に取れば、その抗体をコードする核酸配列を発現ベクターにクローニングし、次に宿主細胞株にトランスフェクトする。トランスフェクトプールをバルク化し、単一細胞選別を行い、その後、これらの単一細胞選別されたクローン細胞株の増殖を、それらの抗体生産(IgG力価)に関して評価する。クローン細胞株を、それらの力価に基づいてランク付けし、生産安定性評価に入るためにおよそ50のクローン細胞株が選択されるまで一連のトリアージイベントを行う。
【0031】
クローン細胞株の生産安定性評価は必須である。クローン細胞株が製造段階に進むためには、それが製造ウインドウ(一般に、4~6か月)にわたって一貫した量の治療タンパク質を生産しなければならない。標準的な生産安定性評価は、製造ウインドウの時間の長さを反映するために、4~6か月の期間にわたってディープウェルプレート、振盪フラスコまたはミニバイオリアクターなどの容器内でクローン細胞株を培養することを含む。生産安定性を計算するために、種々の時点で最大力価の測定を行い、時系列の力価変化パーセントが計算される。一般に、安定性評価の際にそれらのタンパク質発現をそれらの元のピーク力価の30%以内に維持することができるクローン細胞株は安定であると見なされる(BioPhorum Survey, 2018)。
【0032】
マウス骨髄腫(NS0)およびヒト胚腎臓(HEK-293)を含むいくつかの異なる宿主細胞株が規制当局の承認を得たが、生物医薬生産のための哺乳動物細胞培養法の80%は、チャイニーズハムスター卵巣(CHO)懸濁細胞を使用する(Walsh, 2018; Wurm,2004)。治療タンパク質を発現する際には、mAb-FcγR相互作用に重要な哺乳動物翻訳後修飾が保存されているためにCHO細胞が好ましい。不適切な翻訳後修飾は、 タンパク質安定性の変化、標的化抗原に対する低い親和性、異常なクリアランス速度および免疫原性特性などの望まれない影響をもたらし得る。さらに、レギュレーターを備えた生物学的工場としてのCHOの強力な実績は、よりスムーズな承認プロセスを可能とする(Walsh, 2018)。
【0033】
いくつかの研究は、CHOK1ラインの核型不均一性を強調しており、突然変異が多い環境を示している。Deavan and Petersonによる研究(Deaven and Petersen, 1973)は、それらの細胞の24%が、予想される22(染色体番号19~23)とは異なる染色体番号を含んでおり、この現象は今日までなお続いていることを強調している(Auer et al., 2018; Vcelar et al., 2018a; Vcelar et al., 2018b; Yusufi et al., 2017)。
【0034】
製薬用CHO細胞ライフサイクル中、CHO細胞は、クローン細胞株における表現型の差異に寄与することが示されている一定のゲノム修飾を受ける(Derouazi et al., 2006)。CHOK1細胞株の自然な突然変異の傾向に加えて、メトトレキサート(MTX)またはメチオニンスルホキシイミン(MSX)選択システムの使用は、複合突然変異誘発も示されている。破断、二動原体染色体およびテロメア構造の破壊などの高頻度の染色体障害は、ヒト、マウス、およびハムスター細胞株でも十分に報告されている。
【0035】
産業環境では、各治療タンパク質について、50のクローン細胞株が一般に生産安定性の評価まで進み、それから製造可能と思われる単一のクローン細胞株が選択される。
【0036】
本発明者らは、細胞のクローン集団内の遺伝的安定性/不安定性と生産安定性/不安定性との相関、およびそれぞれのクローン細胞株の生産安定性/不安定性を予測するために遺伝子安定性/不安定性を測定および分析する方法を特定した。細胞株の開発中、特に、クローン細胞株の生産安定性を評価するための4~6か月間の初期段階で本方法を適用することにより、細胞株の開発(CLD)中に生産不安定と予測されるクローン細胞株をトリアージし、それにより、CLD能を高め、化学的、製造および制御(CMC)タイムラインを縮小することができる。
【0037】
従って、本発明の1つの側面によれば、クローン細胞株の生産安定性および/または生産不安定性を予測する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;および
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程
を含んでなる方法が提供される。
【0038】
本発明のさらなる側面において、治療タンパク質を発現する細胞株を選択する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程;および
(d)工程(c)のゲノム不安定性に基づいてクローン細胞株を選択する工程
を含んでなる方法が提供される。
【0039】
本発明のさらに別の側面において、大規模治療タンパク質生産のための高力価生産クローン細胞株を選択する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程;および
(d)工程(c)のゲノム不安定性に基づいてクローン細胞株を選択する工程
を含んでなる方法が提供される。
【0040】
1つの実施形態において、この方法は、クローン細胞株の生産不安定性を予測するためのものである。1つの実施形態において、この方法は、クローン細胞株の生産安定性を予測するためのものである。
【0041】
1つの実施形態において、クローン細胞株の生産安定性を予測する方法は、工程(c)のゲノム不安定性に基づいて生産安定性を有すると予測されるクローン細胞株を特定する工程をさらに含んでなる。
【0042】
1つの実施形態において、クローン細胞株の生産安定性を予測する方法は、細胞株の開発の継続のために工程(c)のゲノム不安定性に基づいて生産安定性を有すると予測されるクローン細胞株を選択する工程をさらに含んでなる。
【0043】
1つの実施形態において、クローン細胞株の生産不安定性を予測する方法は、工程(c)のゲノム不安定性に基づいて生産不安定性を有すると予測されるクローン細胞株を選択する工程をさらに含んでなる。
【0044】
1つの実施形態において、クローン細胞株の生産不安定性を予測する方法は、工程(c)のゲノム不安定性に基づいて細胞株の開発から生産不安定性を有すると予測されるクローン細胞株トリアージする工程をさらに含んでなる。
【0045】
1つの実施形態において、治療タンパク質を発現する細胞株を選択する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程;および
(d)工程(c)のゲノム不安定性に基づいてクローン細胞株をトリアージする工程
を含んでなる方法が提供される。
【0046】
1つの実施形態において、大規模治療タンパク質生産のための高力価生産クローン細胞株を選択する方法であって、
(a)2つ以上のクローン細胞株を別個の細胞培養で増殖させる工程;
(b)各細胞培養の細胞の核型分析を行う工程;
(c)工程(b)の核型分析からゲノム不安定性値を導出する工程;および
(d)工程(c)のゲノム不安定性に基づいて細胞株をトリアージする工程
を含んでなる方法が提供される。
【0047】
ゲノム不安定性値は、クローン細胞株の生産安定性および/または生産不安定性を特定または予測するために使用される。いくつかの実施形態において、ゲノム不安定性値は、クローン細胞株の生産不安定性を特定または予測するために使用される。1つの実施形態において、ゲノム不安定性値は、クローン細胞株の生産安定性を特定または予測するために使用される。
【0048】
クローン細胞株の遺伝的安定性/不安定性は、クローン細胞株の核型を分析すること、およびその核型分析から遺伝的不安定性値を導出することによって評価され得る。
【0049】
核型は、細胞の染色体構成または特徴であり、核型分析は、細胞のゲノムワイド特徴を得るために細胞の染色体(細胞遺伝学)を分析する方法である。細胞の核型は一般に、細胞の染色体の画像を得ることによって分析される。核型分析は、染色体不安定性、例えば、染色体異常の検出のために使用され得る。染色体異常は、染色体の構造または数を含む異常である。染色体異常の例としては、転座、欠失、倍加および逆位が挙げられる。
【0050】
本発明において、クローン細胞株の遺伝的安定性/不安定性は、細胞培養においてクローン細胞株を増殖させることによってクローン集団を得ること、および継続的細胞培養下で自発的に形成された、クローン集団内の染色体異常を核型分析によって評価することにより決定される。
【0051】
よって、1つの実施形態において、核型分析は、クローン細胞株の染色体異常を特定することを含んでなる。1つの実施形態において、核型分析は、細胞のクローン集団内の染色体異常を特定することを含んでなる。
【0052】
1つの実施形態において、各細胞培養の細胞(すなわち、クローン集団)の核型分析は、20以上、30以上、40以上、50以上、60以上、70以上、80以上、90以上または100以上の細胞の核型分析を行うことを含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、20~100細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、20、30、40、50、60、70、80、90または100細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、20細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、30細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、40細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、50細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、60細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、70細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、80細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、90細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析は、100細胞の核型分析を含んでなる。1つの実施形態において、各細胞培養の細胞の核型分析の工程は、生産安定性評価における初期時点で行われる。1つの実施形態において、クローン細胞株、すなわち、クローン集団から増殖した細胞の核型分析の工程は、10~20世代の細胞増殖の間に行われる。1つの実施形態において、核型分析の工程は、15~40世代の細胞増殖の間に行われる。1つの実施形態において、核型分析の工程は、10世代以上、15世代以上、20世代以上、25世代以上、30世代以上、35世代以上または40世代以上の細胞増殖の後に行われる。1つの実施形態において、核型分析は、10、11、12、13、14,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39または40世代の細胞増殖の後に行われる。1つの実施形態において、核型分析は、10世代の細胞増殖の後に行われる。1つの実施形態において、核型分析は、15世代の細胞増殖の後に行われる。1つの実施形態において、核型分析は、20世代の細胞増殖の後に行われる。1つの実施形態において、核型分析の工程は、細胞培養培地にクローン細胞株を植え込んでから約1か月後に行われる。1つの実施形態において、核型分析の工程は、5回の継代培養、10回の継代培養、15回の継代培養、20回の継代培養、25回の継代培養、40回の継代培養、または35回の継代培養の後に行われる。1つの実施形態において、核型分析の工程は、6回の継代培養の後に行われる。1つの実施形態において、核型分析の工程は、約7回の継代培養の後に行われる。1つの実施形態において、核型分析の工程は、10回の継代培養の後に行われる。
【0053】
核型分析は一般に、染色体が最も濃く、従って最も鮮明に見える中期で休止された有糸分裂細胞を用いて行われる。当業者は、細胞が次の後期に進まないようにコルセミドまたはコルヒチンとのインキュベーションにより紡錘糸を破壊し、低張溶液で処理し、分析のためにスライド上に固定する前にカルノア固定液で細胞を膨潤状態で保存するなどの染色体単離技術に精通している。当業者はまた、染色体染色技術を行うための方法にも精通している。
【0054】
染色体染色技術は、当技術分野で周知である。例えば、Giesmaバンド分染法(Gバンド分染法)、多色蛍光in situハイブリダイゼーション(MFISH)、比較ゲノムハイブリダイゼーション(CGH)およびスペクトル核型分析(SKY)などの染色体染色技術は、染色体異常の分析を含む効果的な核型分析を可能とする。Gバンド分染法を用いる場合、Giesma染色液で染色する。Giesmaは、インターカレーションを介してDNAに結合する可視光色素である。MFISHは、種々の蛍光団にコンジュゲートされた種特異的および染色体特異的配列を用い、ハイブリダイゼーション後に「ペイントされた」染色体の核型画像を作成するために多色の組合せを可能とする技術である。染色体のペイントは、核型変異を評価する際にバンドパターンを使用して核型を分析する主観性を減らす。倍数性に関連するコピー数多型を分析するための方法である比較ゲノムハイブリダイゼーション(CGH)と比較して、MFISHは大きな構造変異とバランスの取れた転座を視覚化する能力を備えている。MFISHは、集団レベルで突然変異の状況を理解するための堅牢な方法を提供する。MFISHは主に、癌患者のサンプル内の数値的および構造的変化など、ヒト染色体生物学を特徴付けるために診療所で適用されてきた。他の特定の用途としては、照射誘発突然変異と比較した自発的微小核形成の理解、および胃癌患者における相互に排他的な遺伝子増幅の同定が挙げられる。
【0055】
1つの実施形態において、細胞培養の細胞の核型分析の工程は、中期の間に行われる。さらなる実施形態において、核型分析は、多色蛍光in situハイブリダイゼーション(MFISH)、Giesmaバンド分染法(Gバンド分染法)、比較ゲノムハイブリダイゼーション(CGH)またはスペクトル核型分析(SKY)の使用を含んでなる。1つの実施形態において、核型分析は、MFISHまたはGバンド分染法の使用を含んでなる。1つの実施形態において、核型分析は、MFISHによる。1つの実施形態において、細胞培養の細胞の核型分析の工程は、定量的蛍光in situハイブリダイゼーション(Q-FISH)の実施を含んでなる。ペプチド-核酸プローブを用いたQ-FISHは、テロメアを分析するために使用できる。
【0056】
ゲノム不安定性値は、クローン集団の細胞の核型にゲノム不安定性測定基準を適用することによって導出する。ゲノム不安定性測定基準は、ある細胞系列のゲノム内の染色体異常のレベルが評価される測定基準である。ある細胞系列のゲノム内の染色体異常のレベルは様々な方法で評価することができる。本明細書では、2つのゲノム不安定性測定基準:(i)各クローン細胞株(すなわち、クローン集団)のクローン染色体異常(CCA)パーセンテージおよび/または非クローン染色体異常パーセンテージ、ならびに(ii)クローン集団の平均マッチングコスト分布の標準偏差または分散が提供される。
【0057】
よって、1つの実施形態において、ゲノム不安定性値は、各クローン細胞株のクローン染色体異常パーセンテージ(CCA%)および/または非クローン染色体異常パーセンテージ(NCCA%)を導出することによって得られる。従って、この実施形態では、CCAおよびNCCAは、ゲノム不安定性値を導出するために使用されるゲノム不安定性測定基準である。CCAおよびNCCAは、細胞株内の全体的な突然変異状態を説明する一般的な突然変異測定基準である(Henry Heng et al, Molecular Cytogenetics, 2016)。
【0058】
クローン染色体異常は、20~40の無作為に調べた有糸分裂像内で少なくとも2回検される出染色体異常である。これに対して、非クローン染色体異常は、20~40の無作為に調べた有糸分裂像内で単一細胞にのみ検出される染色体異常である。よって、40の有糸分裂像を考える場合、CCAは集団の5%以上に見られる染色体異常であり、NCCAは集団の5%未満に見られる染色体異常である。
【0059】
各クローン細胞株から増殖した1以上の細胞の核型は、同じ染色体異常、従って同じ核型を有している可能性がある。同じまたは類似の染色体特性を有する(すなわち、同じまたは類似の突然変異事象を受けた)細胞を分類することにより、各細胞培養の細胞、すなわち集団を核型によって亜集団に分類することができる。このように、所与の亜集団における細胞(画像)の数を用い、全集団サイズ(例えば、所与の細胞集団について分析された画像の総数)に基づいて、各亜集団をCCAまたはNCCAを含むものとして割り当てることが可能である。
【0060】
よって、1つの実施形態において、本発明の方法は、各細胞培養の細胞(すなわち、クローン細胞株から増殖した細胞)の亜集団を核型によって決定する工程をさらに含んでなる。別の実施形態において、ゲノム不安定性値を導出する工程は、各亜集団をCCAまたはNCCAを含むものとして割り当てることを含んでなる。
【0061】
本発明者らは、クローン集団の総CCA%およびNCCA%とクローン集団が由来するそれぞれのクローン細胞株の生産安定性および不安定性との間の強い相関を特定した。高いパーセンテージのCCA集団頻度は、生産安定細胞株に相関する。逆に、より高いパーセンテージのNCCA集団頻度は、細胞株パネルの不安定アームに保持されていた。従って、初期時点の安定細胞株および不安定細胞株のCCA%およびNCCA%の明確な分類は、このゲノム測定基準が生産安定性予測因子として利用できることを示している。
【0062】
1つの実施形態において、CCAは、クローン集団の2%以上、3%以上、4%以上、5%以上、6%以上、7%以上、8%以上、9%以上、10%以上、11%以上、12%以上、13%以上、14%以上、15%以上、20%以上、25%以上、30%以上に検出される染色体異常である。1つの実施形態において、CCAは、クローン集団の2%~10%に検出される染色体異常である。1つの実施形態において、CCAは、クローン集団の5%~10%に検出される染色体異常である。1つの実施形態において、CCAは、クローン集団の5%に検出される染色体異常である。1つの実施形態において、NCCAは、クローン集団の5%以下、4%以下、3%以下、2%以下または1%以下に検出される染色体異常である。当業者は、それぞれのCCAまたはNCCA%によって定義されるようなクローン集団のCCAまたはNCCAの頻度は、調べた有糸分裂画像のサンプルサイズに依存することを理解するであろう。
【0063】
1つの実施形態において、ゲノム不安定性値の導出は、各クローン細胞株の細胞集団のCCAパーセンテージおよび/またはNCCAパーセンテージを決定することをさらに含んでなる。
【0064】
本発明者らはまた、平均マッチングコスト分布の分散または標準偏差に基づいて、生産安定細胞株と生産不安定細胞株の間に明確な分離があることも特定した。従って、平均マッチングコストの分散または標準偏差は、ゲノム不安定性値を導出するために使用されるゲノム不安定性測定基準である。よって、1つの実施形態において、ゲノム不安定性値は、平均マッチングコスト分布の標準偏差を導出することにより得られる。別の実施形態において、ゲノム不安定性値は、平均マッチングコスト分布の分散を導出することにより得られる。
【0065】
平均マッチングコスト分布の分散または標準偏差は、例えば蛍光プローブによって発生されるような個々の染色体の色(すなわち、蛍光強度)に基づいて、染色体セット間の変動の量を定量するために使用される。染色体の色に基づき、この測定基準は、クローン集団の核型において異なる着色パターンの頻度の定量を可能とする。
【0066】
マッチングコストは、2つの核型(すなわち、2画像)の間の染色体ペアの色の不一致パーセンテージである。小さいマッチングコストは、カラープロファイルの類似性(ゲノム類似性)を表し、大きいマッチングコストは、遺伝的非類似性を表す。2つの核型の総マッチングコストは、各核型から1つずつ、最も色が類似している染色体ペアのセットのマッチングコストの合計である。
【0067】
細胞株の細胞間の染色体数の変動を説明するために、染色体ペアの数について2細胞の総マッチングコストの平均がとられる。画像ペア(すなわち、2つの核型)の平均マッチングコストは、前記画像ペアの対応する染色体の総てのペアのマッチングコストの合計の平均を求めることによって計算される。各核型(すなわち、画像)は、クローン集団から取得したサンプル内の他の総ての核型と比較し、比較した各画像ペアについて、平均マッチングコストが得られる。このようにして、各クローン集団の平均マッチングコストの分布が得られる。この分布から、分散または標準偏差が計算され、平均マッチングコスト分布の分散または標準偏差が得られる。クローン細胞株の平均マッチングコスト分布の分散または標準偏差が小さいほど、それぞれのクローン細胞株はゲノム的に安定している。本発明者らは、平均マッチングコスト分布の分散がCCA%/NCCA%とよく相関することを示した。
【0068】
よって、1つの実施形態において、ゲノム不安定性値を導出する工程は、平均マッチングコスト分布を決定することを含んでなる。さらなる実施形態において、ゲノム不安定性値を導出する工程は、平均マッチングコスト分布の標準偏差を決定することを含んでなる。別の実施形態において、ゲノム不安定性値を導出する工程は、平均マッチングコスト分布の分散を決定することを含んでなる。
【0069】
いくつかの実施形態において、マッチングコストは、クローン細胞株の亜集団(すなわち、クローン集団の亜集団)を決定するために使用され得る。上記のように、マッチングコストは、2つの画像間の各染色体ペアに関して生成され得る。低いマッチングコストは、染色体マスク内の蛍光色構成に基づいて類似している染色体を表す。マスクは、染色体を識別し、画像の非染色体領域を差し引くための、画像上のオーバーレイである。高いマッチングコストは、一方の染色体の蛍光色がもう一方の染色体から有意に逸脱した際に発生した突然変異イベントを示す。従って、高いマッチングコストは、2つの亜集団間の遺伝子変異を特定する。後続の各画像は、新しい亜集団またはすでに特定されている亜集団のいずれかに割り当てることができ、各集団の頻度スコアを提供する。
【0070】
いくつかの実施形態において、特定された亜集団の頻度を計算し、クローン染色体異常(遺伝学的安定、CCA)集団および非クローン(遺伝学的不安定、NCCA)集団に指定することができる。あるいは、上記で概略を示したように、細胞株の細胞間のマッチングコストの分散または標準偏差もまたゲノム安定性測定基準として使用することができ、ここで、マッチングコストの拡散の増大は、分析された画像の染色体異常の量が多いことを示す。
【0071】
一旦導出されると、ゲノム不安定性値は、生産安定クローン細胞株および/または生産不安定クローン細胞株を特定するために使用される。このような特定(すなわち、予測)は、全安定性評価を完了した後(70~150+/-10世代)にクローン細胞株の生産安定性を決定する場合と比較して、はるかに早い時点(例えば、10、15、または20世代)で不安定細胞株をトリアージするための手段を提供するため、細胞株開発のタイムラインに有益である。
【0072】
ゲノム不安定性値は、生産安定細胞株を選択するため、または生産不安定細胞株を除外するために、様々な方法で使用することができる。1つの方法は、CCA%、または平均マッチングコスト分布の分散もしくは標準偏差(SD)をランク付けすることによる。例えば、各細胞株のCCA%のランク付けに基づき上位6および下位6の予測は、安定(細胞株の進行の場合)および不安定(トリアージの場合)クローン細胞株を迅速に特定する能力を有する。
【0073】
あるいは、ゲノム不安定性値に基づく四分位数予測を使用して、CCA%、または平均マッチングコスト分布の分散もしくはSDに基づいて、上位25%の安定細胞株と下位50%の生産不安定細胞株を容易に特定することができる。下位50%を確実にトリアージすると、限られたミニバイオリアクターのスペースを空けることによって細胞株の開発能力が大幅に向上するであろう。
【0074】
別の予測は、CCA%閾値、または参照として既知の生産安定性/不安定性指定を有するクローン細胞株のゲノム不安定性値から導出された平均マッチングコスト分布閾値の分散もしくはSDに基づくものであり得る。閾値は、生産安定クローン細胞株と生産不安定クローン細胞株を分離するゲノム不安定性値であり得る。この予測の潜在的な利点は、多くのデータが生成されるにつれて閾値が精密化され、潜在的に高い予測的中率が得られる。
【0075】
1つの実施形態において、CCA%閾値は、≧60%、≧65%、≧70%、≧75%、≧80%、≧85%、≧90%、≧95%である。1つの実施形態において、CCA%閾値は70%である。すなわち、70%以上のCCAパーセンテージを有するクローン細胞株は生産安定性があるが、CCAが70%未満のクローン細胞株は不安定であると見なすことができる。1つの実施形態において、CCA%閾値は78%である。1つの実施形態において、CCA%閾値は、60%~95%である。1つの実施形態において、CCA%閾値は、70%~95%である。1つの実施形態において、CCA%閾値は、75%~95%である。1つの実施形態において、CCA%閾値は、80%~95%である。1つの実施形態において、CCA%閾値は、85%~95%である。1つの実施形態において、CCA%閾値は、90%~95%である。1つの実施形態において、CCA%閾値は、70%、75%、78%、80%、85%または90%である。
【0076】
1つの実施形態において、平均マッチングコスト分布閾値の分散は、≦100、≦90、≦80、≦75、≦70、≦65、≦60、≦55、≦50、≦45、≦40、≦35、≦30、≦25、≦20、≦15、≦10または≦5である。すなわち、特定された分散閾値以下の分散は、生産安定性があると見なされる。1つの実施形態において、平均マッチングコスト分布閾値の分散は≦70である。1つの実施形態において、平均マッチングコスト分布閾値の分散は≦65である。1つの実施形態において、平均マッチングコスト分布閾値の分散は≦60である。1つの実施形態において、平均マッチングコスト分布閾値の分散は≦55である。1つの実施形態において、平均マッチングコスト分布閾値の分散は≦50である。1つの実施形態において、平均マッチングコスト分布閾値の分散は≦45である。1つの実施形態において、平均マッチングコスト分布閾値の分散は≦40である。1つの実施形態において、平均マッチングコスト分布閾値の分散は≦35である。1つの実施形態において、平均マッチングコスト分布閾値の分散は≦30である。1つの実施形態において、平均マッチングコスト分布閾値の分散は25~70である。1つの実施形態において、平均マッチングコスト分布閾値の分散は25~60である。1つの実施形態において、平均マッチングコスト分布閾値の分散は30~45である。
【0077】
1つの実施形態において、平均マッチングコスト分布閾値のSDは、≦10、≦9、≦8、≦7、≦6.5、≦6、≦5.5、≦5、≦4.5、≦4または≦3.5である。すなわち、特定されたSD閾値以下の分散は、生産安定性があると見なされる。1つの実施形態において、平均マッチングコスト分布閾値のSDは≦8である。1つの実施形態において、平均マッチングコスト分布閾値のSDは≦7.5である。1つの実施形態において、平均マッチングコスト分布閾値のSDは≦7である。1つの実施形態において、平均マッチングコスト分布閾値のSDは≦6.5である。1つの実施形態において、平均マッチングコスト分布閾値のSDは≦6である。1つの実施形態において、平均マッチングコスト分布閾値のSDは≦5.5である。1つの実施形態において、平均マッチングコスト分布閾値のSDは≦5である。1つの実施形態において、平均マッチングコスト分布閾値のSDは≦4.5である。1つの実施形態において、平均マッチングコスト分布閾値のSDは≦4である。1つの実施形態において、平均マッチングコスト分布閾値のSDは5~8.5である。1つの実施形態において、平均マッチングコスト分布閾値のSDは5~8であある。1つの実施形態において、平均マッチングコスト分布閾値のSDは5.5~7である。
【0078】
1つの実施形態において、平均マッチングコスト分布閾値の分散またはSDは、2つの安定性種を最良に分離する生産安定性または不安定性であることが知られている平均マッチングコスト分布のクローン細胞株SDまたは分散上に決定木を構築することによって計算される。次に、決定木によって特定された閾値を、新しい細胞株の平均マッチングコスト分布の分散またはSDに適用することができる。実験プロトコールが変更された場合、閾値が目的に適合しなくなったと見なされた場合は、生産安定性の結果が既知の新しい細胞株MFISH画像上で閾値を確認して再推定するべきである。
【0079】
本発明の1つの実施形態において、各細胞培養のクローン細胞の生産安定性および/または不安定性を予測する工程は、i)CCA%、平均マッチングコスト分布の分散または平均マッチングコスト分布のSDによってクローン細胞をランク付けすること;(ii)CCA%閾値、平均マッチングコスト分布閾値の分散または平均マッチングコスト分布閾値のSDを適用すること;および(iii)四分位数閾値を適用することのうち1以上を含んでなる。1つの実施形態において、各細胞培養の生産安定性および/または生産不安定性は、CCA%閾値、または89平均マッチングコスト分布閾値の分散もしくはSDを適用することによって予測される。1つの実施形態において、CCA%閾値は、≧70%、≧75%、≧80%、≧85%、≧90%、≧95%である。1つの実施形態において、CCA%閾値は70%である。さらなる実施形態において、CCA%閾値は78%である。1つの実施形態において、CCA%閾値は70%~95%である。1つの実施形態において、CCA%閾値は、70%、75%、78%、80%、85%または90%である。
【0080】
1つの実施形態において、正確な予測率は約60%~約100%、約70%~約100%、約80%~約100%、または約90%~約100%である。1つの実施形態において、正確な予測率は約70%~約100%である。1つの実施形態において、正確な予測率は約60%、約70%、約80%、約90%または約100%である。
【0081】
1つの実施形態において、CCA%、平均マッチングコスト分布の分散または平均マッチングコスト分布のSDによってクローン細胞をランク付けすることによる正確な予測率は83%である。1つの実施形態において、CCA%、平均マッチングコスト分布の分散または平均マッチングコスト分布のSDによってクローン細胞をランク付けすることによる生産不安定細胞株を正確に特定する予測率は100%である。1つの実施形態において、CCA%、平均マッチングコスト分布の分散または平均マッチングコスト分布のSDによってクローン細胞をランク付けすることによる生産不安定細胞株を正確に特定する予測率は65%である。
【0082】
1つの実施形態において、CCA%閾値または平均マッチングコスト分布の分散または平均マッチングコスト分布閾値のSDを適用することによる正確な予測率は80%である。1つの実施形態において、CCA%閾値、平均マッチングコスト分布の分散または平均マッチングコスト分布閾値のSDを適用することによって生産不安定細胞株を正確に特定する予測率は83%である。1つの実施形態において、CCA%閾値、平均マッチングコスト分布の分散または平均マッチングコスト分布閾値のSDを適用することによって生産安定細胞株を正確に特定する予測率は75%である。
【0083】
1つの実施形態において、CCA%四分位数閾値、平均マッチングコスト分布四分位数閾値の分散または平均マッチングコスト分布四分位数閾値のSDを適用することによる正確な予測率は70%である。1つの実施形態において、CCA%四分位数閾値(下位25%)、平均マッチングコスト分布四分位数閾値の分散(下位25%)または平均マッチングコスト分布四分位数閾値のSD(下位25%)を適用することによって生産不安定細胞株を正確に特定する予測率は100%である。1つの実施形態において、CCA%四分位数閾値(上位25%)、平均マッチングコスト分布四分位数閾値の分散(上位25%)または平均マッチングコスト分布四分位数閾値のSD(上位25%)を適用することによって生産安定細胞株を正確に特定する予測率は68%である。
【0084】
本発明の方法の種々の工程は自動化することができる。1つの実施形態において、各細胞培養の細胞の核型分析を行う工程および/または核型分析からゲノム不安定性値を導出する工程は自動化されている。1つの実施形態において、細胞の核型分析を行う工程は自動化されていてもよい。
【0085】
1つの実施形態において、自動化は、コンピューターに実装される自動化である。自動化は一般に、コンピューター実装によって達成される(すなわち、それはコンピューターに実装される工程である)。コンピューター実装は、画像分類システムを含み得る。コンピューターに実装される工程または画像分類システムは、機械学習システム、例えば、人工ニューラルネットワーク、より具体的には畳み込みニューラルネットワークを含み得る。
【0086】
自動化プロセスは、核型分析および/またはゲノム不安定性値の導出中の手動画像分析に関連する主観性を取り除き得る。従って、1つの実施形態において、各細胞培養の細胞の核型分析を行う工程および/または核型分析からゲノム不安定性値を導出する工程は、自動画像分析を含んでなる。
【0087】
1つの実施形態において、画像分析は、ソフトウェアを使用することによって自動化することができる。画像分析は多くの場合、蛍光画像の特徴付けを可能とするソフトウェアを用いて実行される。一例はCellrofiler(商標)である。染色された(例えば、蛍光)画像は、蛍光画素強度を画像内の個々の染色体と相関させることができるように個々の染色体から蛍光強度を抽出するためにCellProfiler(商標)ワークフローを用いて分析することができる。画像は、バックグラウンド蛍光を除去するために閾値補正を受けてもよい。
【0088】
1つの実施形態において、画像分析の自動化は、画像内の染色体のセグメント化を含んでなる。画像内の染色体を忠実にセグメント化することは、自動化パイプラインの重要な工程である。画像内のアーティファクトの存在、照明の違い、および近位染色体は、セグメン化に多くの課題を提示する。これらの課題を克服するために、マスクを導出するための深層学習に基づくアプローチ(DL)が自動化プロセスに含まれる場合がある。マスクは、染色体を識別し、画像の非染色体領域を差し引くための画像上のオーバーレイである。セグメント化された染色体画素は、蛍光シグナルに応じて着色することができる。
【0089】
染色体の着色は、蛍光強度に適用される事前に訓練されたガウス混合モデルによるものであり得、これは、蛍光強度を一連の所定の疑似色クラスの1つにさらに分類する。
【0090】
画像分析の自動化されたプロセスでは、染色体は多色の円グラフによって特徴付けられ、疑似色のセクターのサイズは、その色として分類された染色体の画素の割合を反映する。2つのセグメント化された疑似カラー画像が与えられた場合、各画像から1つずつ、染色体と染色体のペアのセットが、コスト行列(行と列がそれぞれ画像1と画像2の染色体によってインデックス付けされ、そのij番目のエントリーは、画像1からの染色体iを画像2からの染色体jに一致させるコストである)を計算すること;およびこのコスト行列の線形割り当て問題を解くことによって導出することができる。この線形割り当て問題の解は、最小の総マッチングコストが得られる染色体と染色体のペアのセットである。上手くペアリングされた染色体の数を考慮したこの総マッチングコストの平均は、2つの染色体集団が同じまたは類似の核型を有しているかどうかの指標を提供する。
【0091】
1つの実施形態において、各細胞株はゲノム安定性に関して、画像の各ペアについて平均マッチングコストを計算すること、平均マッチングコスト分布を形成することおよびこの分布の分散または標準偏差(SD)を計算することにより評価される。この分散または標準偏差は、CCA%測定基準と相関する。
【0092】
別の実施形態において、各細胞株はゲノム安定性に関して、画像の各ペアについて平均マッチングコストを計算すること、平均マッチングコスト分布および平均マッチングコスト分布を形成することおよびこの分布の分散を計算することにより評価される。
【0093】
クローン細胞株のゲノム不安定性は、染色体のテロメアを分析することにより評価することができる。1つの実施形態において、核型分析は、染色体のテロメアを分析することを含んでなる。1つの実施形態において、染色体のテロメアの分析は、定量的蛍光in situハイブリダイゼーション(Q-FISH)を含んでなる。
【0094】
通常のホメオスタシスでは、テロメアは染色体の末端に存在する。テロメアはGリッチリピート(TTAGGGn)により形成され、6員タンパク質複合体であるシェルテリンにより保護され、このシェルテリンはテロメアに特異的に結合し、POT1による隔離を介して一本鎖テロメアDNAのDNA損傷経路を阻害する(de Lange, 2005)。チャイニーズハムスター卵巣(CHO)細胞株では、四肢に比べて間質性テロメア配列(ITS)が豊富にある。シェルテリン複合体はITSに結合することが知られているが、局所的なDNA損傷に対するその阻害作用は十分に定義されていない(Schmutz and de Lange, 2016)。
【0095】
末端では、細胞分裂の際に、テロメアの長さは、アポトーシスが引き起こされるテロメアの臨界長であるヘイフリック限界に達するまで短くなる(Hayflick, 1965; Hayflick and Moorhead, 1961)。テロメアがこの臨界長まで短縮すると、シェルテリン複合体が著しくに失われ、ssDNAが脱保護され、DNA損傷応答(DDR)経路が活性化される。DDR経路は、毛細血管拡張性運動失調症変異(ATM)と運動失調症およびRad3関連タンパク質(ATR)の作用により、通常、細胞周期の進行を遅らせるCDKタンパク質の阻害によって有糸分裂を進行する前に遺伝的損傷の修復をもたらす(Huen and Chen, 2008)。修復すると、アポトーシス経路を活性化することなく細胞周期が進行する(Roos and Kaina, 2006)。
【0096】
CHO細胞は、HeLaおよび間接的にはHEK293Tなどの癌細胞株と類似する、増殖能が高く、不死化した細胞株を表す。癌組織に由来するものではないが、HEK293T細胞は、pRetinoblastoma(RB)およびp53経路の調節を解除して細胞周期を撹乱させるAd5 E1A/E1Bタンパク質を発現する(Berk, 2005; Sha et al., 2010)。遺伝的損傷が適切に修正されず、不死化細胞株が細胞周期の進行を可能にする突然変異を獲得した場合、遺伝的不安定性が生じ得る。遺伝子損傷がテロメアで特異的に生じれば、腫瘍抑制因子p53結合タンパク質(TP53BP1)が動員され、染色体末端での非相同末端結合(NHEJ)を促進する。TP53BP1の作用は、p53およびRB経路がない場合にのみ可能となる(O’Sullivan and Karlseder, 2010)。
【0097】
融合した染色体を取得し、有糸分裂を通過する能力を獲得した細胞は、染色体が非相互的に分裂して2つの遺伝的に異なる娘染色体を作り出す、切断-融合-架橋(BFB)サイクルに至る(Marotta et al., 2013)。BFBサイクルは腫瘍内の不均一性に関連付けられており、DNA増幅および染色体喪失を促進することが示されている(Gisselsson et al., 2000; Lo et al., 2002; Thomas et al., 2018)。これは、CHO細胞株のゲノム不安定性に至る経路を表している可能性がある(Vcelar et al., 2018a; Vcelar et al., 2018b)。
【0098】
CHO(チャイニーズハムスター卵巣)、BHK、NS0、Jurkat、K562、HeLa、PerC6などの哺乳動物細胞は、バイオ医薬品業界でバイオ医薬品を製造するために慣用されている。これらの細胞は遺伝子操作された後に得られた細胞株がバイオリアクターで培養された際に所望のタンパク質の高力価発現が見られるように選択される。このような宿主細胞はまた、有利な遺伝子型および/または表現型の改変を含んでよく、例えば、CHO-DG44宿主株では、dhfr遺伝子のコピーが無効になっているが(例えば、CHOKla-GS-KO)、他の宿主では、グルタミンシンセターゼ遺伝子が無効になっている場合がある。タンパク質のグリコシル化に関与する酵素機構に対する別の改変もあり得る。他のものは、宿主のアポトーシス、発現および生存経路に対する有利な遺伝子型および/または表現型の改変を有するものであり得る。単独または組み合わせた宿主のこれらおよび他の改変は、非宿主または宿主遺伝子の過剰発現、遺伝子ノックアウトアプローチ、遺伝子サイレンシングアプローチ(例えば、siRNA)、または望ましい表現型を持つ亜系統の進化および選択などの標準的な技術によって生成することができる。このような技術は当技術分野で十分に確立されている。
【0099】
1つの実施形態において、クローン細胞株は哺乳動物細胞株である。1つの実施形態において、哺乳動物細胞はCHO(チャイニーズハムスター卵巣)細胞、BHK細胞、NS0細胞、Jurkat細胞、K562細胞、HeLa細胞またはPerC6細胞である。1つの実施形態において、哺乳動物細胞はCHO細胞である。1つの実施形態において、哺乳動物細胞はCHOK1細胞である。1つの実施形態において、CHO細胞株はグルタミンシンセターゼ(GS)ノックアウト細胞である。1つの実施形態において、哺乳動物細胞はCHOK1a-GS-KOである。
【0100】
以下、以下の非限定的な実施例を参照して本発明をさらに詳細に説明する。
【実施例
【0101】
実施例1:方法
細胞培養
細胞株
生産安定性がすでに決定されている細胞株は、GlaxoSmithKline(GSK)の液体窒素保存株から得た。使用した細胞株は、CHOKla-GS-KO、CHOKla、DG44、HEK293TおよびCHOKla-GS-KO(タンパク質2、3、4、および5)であった。治療タンパク質2、3、および5の細胞株は、生産安定性および生産不安定性の比較実験に使用され、タンパク質4は、MFISH生産安定性予測法の盲検検証に使用した。
【0102】
生細胞のカウント
500μlの細胞懸濁液を4mlのサンプリングチューブに傾斜により移した。500μlのTrypLE(Gibco、#12605010)を細胞懸濁液に加え、サンプルをVi-Cell XR(BeckmanCoulter)によって処理し、総細胞数および生存細胞数、生存率%および細胞径の測定基準を得た。
【0103】
細胞株の解凍
細胞バイアルを37℃のPBS中で解凍し、10mLの培地に再懸濁させた。細胞株は、ViCell(Beckman Coulter)上で、500μLの細胞懸濁液に500μLのTrypLE(Gibco、#12605036)を加えることによってカウントした。培養フラスコで、20mLの培地中に0.5×10細胞を播種し、37℃、5%COおよび140rpmに設定した加湿振盪インキュベーター中でインキュベートした。
【0104】
細胞培養の維持
細胞が>95%に回復したところで、細胞株を維持し、栄養素+25μMのMSXを添加した培地で3日または4日ごとに30ml中、0.3×10細胞で継代培養した。播種密度は、ViCell(Beckman Coulter)を用いて計算した。
【0105】
細胞遺伝学
染色体の採取
各細胞株につき0.5mLの細胞を、5mLの新鮮培地を含むT25フラスコに加えた。細胞を静止インキュベーター(37℃、5%CO)に入れ、3日間培養した。各T25において2mLの培地を2mLの新鮮培地に置き換え、100μlのKaryoMAXコルセミド(Gibco、#15212012)を加え、T25を振盪インキュベーター(37℃、5%CO)に一晩置いた。
【0106】
次に、細胞を室温(RT)にて5分間、1200rpmで回転沈降させ、上清を廃棄し、ペレットを5mLの加温(37℃)0.075M KCL(Sigma、#P5405)に再懸濁させ、インキュベーター(37℃)に5分間入れた。2mLの予冷固定溶液(-20℃)、メタノール(Sigma、#34860):酢酸(Sigma、#A6283)の3:1溶液を加え、1200rpmで5分間、細胞を回転沈降させた。
【0107】
上清を廃棄し、ペレットを5mLの固定溶液に再懸濁させ、その後、-20℃で30分間インキュベートした。細胞を回転沈降させ、これらの中期スプレッドをスライドに適用するために適当な容量/密度で再懸濁させた。その後、プローブを適用するまで、スライドを-20℃で保存した。
【0108】
テロメア蛍光in-situハイブリダイゼーション
サンプル中期を含むスライドを、40mlのTBS溶液(Agilent Dako、K532711-8)を含むコプリンジャーに入れ、室温で2分間インキュベートした。スライドを40mlのTBS溶液を含む別のコプリンジャーに入れ、さらに2分間インキュベートした。スライドを70%、90%および100%のエタノールシリーズで各2分間処理した。スライドをチャンバーから取り出し、乾燥させた。
【0109】
5μlのテロメアプローブ(Agilent Dako、K532711-8)をスライドに加え、18×18mmのカバーガラスをかけ、フィクソガム(VWR、ICNA11FIXO0125)で密封した。スライドを加湿チャンバー(ThermoBrite)に立てて入れ、37℃で2時間インキュベートした。スライドを加湿チャンバーから取り出し、フィクソガムおよびカバーガラスを除去した。スライドを、40mlのリンス溶液(Agilent Dako、K532711-8)を含むコプリンジャーに入れ、2分間インキュベートした。
【0110】
次に、スライドを、65℃で5分間、40mlの洗浄溶液(Agilent Dako、K532711-8)中でインキュベートした。スライドを70%、90%および100%のエタノールシリーズで各2分間処理した。スライドを乾燥させ、予温した(37℃)20μlのDAPI II対比染色(Abbott Molecular、06J50-001)を適用した。スライドに22×50mmのカバースライドをかけ、フィクソガムで密封した。画像は、Axio Z2イメージャーを使用し、メタシステムソフトウェア(V5.7.4)を用いてキャプチャーした。
【0111】
Thermo Brite Elite(Leica Biosystems)で実施されるテロメアFISH
サンプル中期像を含むスライドをインキュベーションチャンバーに表を下にして置いた。各チャンバーに30mlのTBS溶液を加え、室温で2分間、ロッキング条件(12/分)下でインキュベートした。チャンバーを排出し、チャンバーにTBSを再び加え、さらに2分間ロッキング条件下でインキュベートした。
【0112】
スライドを70%、90%および100%のエタノールシリーズで各2分間処理した。スライドをチャンバーから取り出し、乾燥させた。5μlのテロメアプローブ(Agilent Dako、K532711-8)をスライドに加え、18×18mmのカバーガラスをかけ、フィクソガム(VWR、ICNA11FIXO0125)で密封した。スライドをチャンバーに立てて入れ、チャンバーに水を満たし、37℃で2時間インキュベートした。スライドをチャンバーから取り出し、フィクソガムおよびカバーガラスを除去した。
【0113】
スライドをチャンバーに表を下にして入れ、チャンバーに30mlのリンス溶液を満たした、2分間インキュベートした。チャンバーを排出し、チャンバー当たり30mlの洗浄溶液を満たし、スライドを65℃で5分間インキュベートした。チャンバーを排出し、スライドを70%、90%および100%のエタノールシリーズで各2分間処理した。スライドを乾燥させ、予温した(37℃)20μlのDAPI II対比染色(Abbott Molecular、06J50-001)を適用した。スライドに22×50mmのカバースライドをかけ、ゴム糊で密封した。画像は、Axio Z2イメージャーを使用し、メタシステムソフトウェア(V5.7.4)を用いてキャプチャーした。
【0114】
多色FISH(MFISH)
MFISHは、メタシステム12XCHamster(D-1526-060-DI)プローブセットを用いて行った。簡単に述べると、0.1×SSC(Invitrogen、#15557044)および2×SSCを含むコプリンジャーを4℃に置き、70℃に予温した2×SSCを追加した。スライドを70℃ 2×SSC中に30分間置き、次いで水浴から取り出し、20分間冷却した。この工程の間、スライド当たり5μlの12XCHamsterプローブを、PCR機にて75℃5分、10℃30秒、37℃30分のプログラムを用いて調製した。
【0115】
次に、スライドを0.1×SSCに室温(RT)にて1分間移し、その後、RTで1分間、0.07N NaOH(Sigma、#S2770)中で変性させた。次に、スライドを4℃で各1分間、0.1×SSCおよび2×SSC中に順次入れ、70%、80%、90%および100%のエタノール(Sigma、#51976)シリーズ中で各1分間脱水した。風乾後、5μlの変性し、プレハイブリダイズしたプローブを中期スプレッド上に載せ、カバーガラスをかけ、ゴム糊で密封した。スライドを加湿チャンバー(ThermoBrite、Leica Biosystems)中、37℃で1~2日間インキュベートした。
【0116】
インキュベーション後、ゴム糊およびカバーガラスを除去し、スライドを予温した(72℃)0.4×SSC中に2分間入れた。次に、スライドを2×SSCT(0.05%Tween20を含有する2×SSC、pH7~7.5)中にRTで1~2分間入れた。結晶の形成を避けるためにスライドを蒸留水で2回軽く洗浄し、風乾した。20μlのDAPI/退色防止剤(D-0902-500-DA)を中期像に適用し、カバーガラスをかけた。画像は、メタシステム自動獲得プラットフォームを用いてキャプチャーした。このソフトウェアは、6種類の個々のカラーチャネル(DAPI、アクア、グリーン、オレンジ、レッドおよびゴールド)をキャプチャーするようにプログラムされ、画像は、集団決定の節に概略を示すように分析した。
【0117】
Thermobrite Elite(Leica Biosystems)で実施される多色FISH(MFISH)
MFISHは、メタシステム12XCHamuster(D-1526-060-DI)プローブセットおよびThermo Brite Eliteを用いて行った。サンプル中期像を含むスライドをインキュベーションチャンバーに表を下にして置いた。チャンバー当たり30mlの2×SCC+0.05%Tween20溶液を加え、37℃で30分間、ロッキング条件下(12/分)でインキュベートした。スライド当たり5μlの12XCHamsterプローブを、PCR機にて、75℃5分、10℃30秒、37℃30分のプログラムを用いて調製した。
【0118】
チャンバーを排出し、デミ水をチャンバーに加え、30秒、ロッキング条件下でインキュベートした。デミ水洗浄を2回繰り返した。次に、30mlの0.07N NaOHをチャンバーに加え、1分間、ロッキング条件下でインキュベートした。チャンバーを排出し、次いで、氷冷0.1×SCCをチャンバーに加え、1分間インキュベートした。その後、氷冷2×SCCを加え、1分間インキュベートした。スライドをデミ水で30秒間洗浄した。次に、スライドを70%、95%および100%エタノールを含んでなるエタノールシリーズに入れた。
【0119】
スライドをチャンバーから取り出し、エタノールが蒸発するまで乾燥させた。次に、先に調製したプローブを中期像に適用し、カバーガラスおよびゴム糊を載せた。その後、スライドをチャンバー内に立てて、30mlのデミ水中、37℃で一晩ハイブリダイズさせた。カバーガラスを除去し、チャンバーに表を下にして置いた。30mlの0.4×SSCをチャンバーに加え、68℃で2分間インキュベートした。チャンバーを排出し、30mlの2×SSCおよび0.05%Tween20溶液を再び満たし、25℃で2分間インキュベートした。チャンバーを排出し、次に、スライドを、70%、80%および100%エタノールを含有するエタノールシリーズ中で処理した。スライドを取り出し、余分なエタノールを蒸発させた。20μlの退色防止剤DAPI(Metasystems D-0902-500-DA)をスライドに加え、カバーガラスを上に載せ、ゴム糊で密封した。次に、スライドを、Axio Imager Z.2を用いて画像化した。
【0120】
画像分析
集団の決定
亜集団を、単一細胞を表す各個の画像の分析によって評価した。
【0121】
新たな亜集団を、突然変異誘発事象(例えば転座)を目撃することによって定義した。この例において、転座は、染色体が互いに近接しているだけでなく、互いに付着していることを確認するためにDAPIチャネル画像を検証すことによって確認した。さらに、平均染色体カラープロファイル(総ての非変異染色体にわたる染色体のカラーパーセンテージ)と変異染色体カラープロファイルの間のカラーパーセンテージの変化を、CellProfiler(商標)(https://cellprofiler.org/)によって抽出される平均蛍光強度を用いて確認した。
【0122】
染色体の数の欠落または増加は、同じ異常を含む3つの中期スプレッドを目撃することによって確認しなければならない。これは、欧州細胞遺伝学協会のガイドライン(https://www.e-c-a.eu/en/GUIDELINES.html)で概説されているように、異常が中期スプレッド標本のアーティファクトではないことを確認するためである。
【0123】
各集団に属す各中期像の頻度を記録して、異常がクローン性であるか非クローン性であるかを決定した。クローン染色体異常(CCA)は、全集団の5%より多くを占める亜集団として定義され、優勢集団として定着しているので、染色体的に安定した亜集団と見なされる。非クローン染色体異常(NCCA)は、全集団の5%以下と定義された(Henry Heng et al, Molecular Cytogenetics, 2016)。全集団におけるNCCAの数の増加は、染色体の不安定性につながる変異原性の背景の増大を示し得る。
【0124】
CellProfilerを使用した突然変異の確認
以下のワークフローは、CellProfiler(商標)にて実施する。DAPI、グリーン、レッド、ゴールド、オレンジ、およびアクアフィルターセットをカバーする単一チャネル画像は、Metaferソフトウェア(Metasystems、V5.7.4)から.tif形式でエクスポートした。このワークフローでは、近接または交差した染色体が適切にセグメント化されないことから、画像はその広がりに基づいて選択した。1.1補正係数閾値を使用して選択されたGlobal-Otsuアルゴリズムとともに閾値モジュールを使用して6つの単一チャネル画像の閾値処理を行った。閾値値処理後にガウスフィルターを使用して画像を平滑化した。
【0125】
染色体の識別を改善するためにSobelアルゴリズムモジュールを使用することによって画像のエッジを増強した。モジュール自動閾値戦略を用いて画像内の染色体を識別するために、主要対象の識別を使用する。次に、結果として得られた画像マスクを、DAPIチャネル画像をガイドとして、編集画像モジュールを使用して手動で編集し、元の画像を忠実にマスキングできるようにした。各染色体に任意に番号を割り当て、この染色体識別子は分析された総ての集団で一貫性を保っていた。突然変異誘発事象が発生した場合でも、染色体数は一定のままである。各染色体および単一チャネルの蛍光強度値は、測定対象強度モジュールを使用して抽出した。蛍光強度は、総てのチャネルの合計を100%として、パーセンテージに変換した。次に、視覚的に識別された染色体内の突然変異を、この方法で抽出された蛍光強度色の組合せを使用して確認した。
【0126】
CellProfiler(商標)を使用したテロメア長の定量
次のワークフローはCellProfiler(商標)にて実施した。単一チャネル画像は、1.1閾値補正値を用いて選択されたグローバル大津アルゴリズムとともに閾値モジュールを使用して閾値処理した。モジュール内の自動化戦略を使用して、画像内の染色体を識別するために、主要対象の識別を使用した。画像マスクは、画像の忠実なマスキングを保証するために、編集マスクモジュールを使用して手動で編集した。次に、グローバル大津アルゴリズムを使用した二次対象の識別によって、テロメアシグナルを染色体内で識別した。テロメアの蛍光強度が染色体領域内でのみ計算されるように、2つの閾値処理された画像を、関連画像モジュールを使用して関連付けた。染色体数および当該染色体内のテロメアの蛍光強度の値は、測定対象強度モジュールによって抽出した。
【0127】
染色体数のカウント
染色体数のカウントは、ソフトウェアのセルカウンターモジュールを使用することにより、Fiji(画像J、バージョン1.51)を使用して実施した。各時点の50枚の画像がFijiに読み込み、セルカウンターを初期化した。適切に広がった中期染色体を含む画像を使用して、総ての染色体が単一の細胞源に由来することを確認した。カウント後、分析画像は、カウンターマーカーを含むように保存した。
【0128】
データ分析およびグラフ作成
ここに示されている総てのグラフは、特に断りのない限り、JMPソフトウェア(バージョン14)を用いて作成した。平均マッチングコスト分布の分散v%CCAの散布図(図5c)は、Tibco Spotfireを用いて作成した。
【0129】
統計分析
総ての統計分析は、JMPまたはInVivoStatソフトウェア(バージョン3.7)のいずれかを使用して実施した。
【0130】
実施例2:宿主細胞株のベースライン特性(テロメアおよび変異ベースラインプロファイル)
CHO治療タンパク質生産不安定性表現型を駆動する可能性のあるテロメアにより促進されるゲノム不安定性に基づいて潜在的な経路を解明するために、宿主細胞株の特性評価を行った。CHOK1宿主変異体は、テロメアプロファイルによって評価され、癌様細胞株であるHEK293Tと比較した。これらの結果のベースラインを使用して、宿主細胞株(目的の遺伝子を含まない)のテロメアプロファイルを治療タンパク質発現細胞株と比較し、治療タンパク質生産細胞株の細胞株開発過程に生じ得る変化を評価した。CHOKla-GS-KO宿主を生産安定細胞株と生産不安定細胞株のその後の分析に使用したので、CHOKla-GS-KO宿主は、ベースライン染色体変異とテロメア保護プロファイルについてさらに分析した。
【0131】
6か月の安定性評価にわたるCHOKla、CHOKla-GS-KO、およびHEK293T細胞株のテロメアFISHプロファイル
テロメア配列プロファイルを定性的に評価し、HEK293T細胞株と比較した。HEK293は、哺乳動物細胞株で予想される通常のテロメアシグナルプロファイルを表し、従って、CHO宿主株を分析する際の参照点として使用される。6か月の培養期間にわたるテロメアプロファイルの変化は、ゲノム不安定性の兆候を表し得る。
【0132】
CHOKla、CHOKla-GS-KO、DG44、およびHEK293T細胞株を解凍し、培地中で回復させた。細胞が>98%の生存率に達したら、6代目に各細胞株から染色体を採取した。染色体の採取は、治療タンパク質生産の安定性評価で行われたように、6か月の細胞培養を模倣するために10代刻みで行った。培養期間にわたってテロメアプロファイルに有意な変化があるかどうかを解明するために、一般的に使用されるCHOK1宿主を使用したこの模擬安定性評価を行った。
【0133】
HEK293Tと比較すると、総てのCHOK1宿主変異体は、ほとんどのテロメア配列を間質に持っており、各CHOK1宿主間で様々な程度の異なるパターンがある。CHOK1は、BFBサイクルが生じて非相互転座または増幅に至る可能性があることを示すテロメアパターンを有するCHOK1-GS-KOと比較して、1つの染色体上にTTAGGGnリピートの大きなブロックを有する。注目すべきことに、閾値処理時に、染色体の末端に目に見えるテロメアシグナルはなく、一方、間質テロメアリピートはリピートの大きなブロックに存在する。染色体の末端にテロメア配列がない場合、テロメア特異的DNA損傷応答経路の活性化が増加し、CHO染色体の不安定性を増進する可能性がある。治療用生産タンパク質に基づくさらなる分析は、CHOK1-GS-KOから導かれる。細胞株は、治療タンパク質生産細胞株に対するベースライン比較を確立するためにさらに特徴付けた。
【0134】
6か月の安定期間にわたるCHOKla-GS-KO宿主細胞株の染色体数分布およびテロメアFISH定量
染色体数の分布およびテロメア配列の蛍光シグナルを6か月の安定期間にわたって定量し、CHOKla-GS-KO治療タンパク質生産細胞株に対する比較対象として利用するCHOKla-GS-KO宿主細胞株のベースライン特性を得た。宿主細胞株は、製造過程でゲノム安定性を促進するためにテロメア的に安定しているべきである。染色体数およびテロメア長の変動は、6か月の安定期間にわたる宿主内の遺伝的不安定性の増大を示唆している可能性がある。
【0135】
細胞バンクから解凍した後、CHOKla-GS-KO宿主細胞株を生存率が98%を超えるまで継代培養し、染色体を採取し、カウントした。初期時点では、染色体数の中央値は19であり、これは従前の報告を反映している(Vcelar et al., 2018a; Vcelar et al., 2018b)。モーダル染色体範囲は18~21染色体であり、全染色体数の範囲は15~37であった。モーダル染色体範囲の外れ値の頻度は7細胞に見られ、ほとんどのデータはモデル範囲に分散していた(43)。逆に、後期時点では、染色体数の中央値は20に増加し(2サンプルT検定、P=0.0384)、6か月の培養期間にわたってさらなる染色体増加があったことを示している。
【0136】
モーダル染色体範囲は同じままであったが、全染色体数範囲(7~39染色体)および外れ値頻度(12)が増加した。これは、異常な数の染色体を獲得する細胞が増加するため、6か月の安定期間にわたって染色体の不安定性が増大したことを示唆している可能性がある。これが染色体の不安定性に起因する可能性がある場合、このデータは、それが宿主細胞株に固有であることを示唆する。
【0137】
CellProfiler(商標)を使用して、テロメアの蛍光強度を分析するために、半自動テロメア定量ワークフローが作成された。テロメアプローブは、PNA-TTAGGG(n)リピートと共役Cy3蛍光団で形成されている。蛍光強度はテロメアシグナルに比例し、蛍光強度の変化は染色体内に存在するテロメア配列の変化に関連している。DAPI画像上に生成された染色体マスク内に存在するテロメアシグナルを測定し、染色体特異的なテロメア長の定量を提供する。
【0138】
50の画像を時点ごとに分析し、テロメア蛍光強度とDAPI強度の比(テロメア比率%)を時点間で比較した。相対シグナルを使用して、安定期間にわたってテロメア長に変化があったかどうかを評価することができる。初期時点で得られた平均テロメア比率は2.9%であった。6か月の連続培養で、平均テロメア比率は8.9%に増加した(T検定、P=<0.0001)。定量されたテロメアシグナルは間質性テロメアリピートとして染色体内にのみ存在し、これらの配列の増幅が末端ではなく染色体(ITS増幅)自体の中に残っていたことを示唆する。これは、染色体の末端にあるテロメアシグナルについて後期画像を検査することによって視覚的に確認された。
【0139】
結果
本明細書に提示されたデータは、CHOKla-GS-KO宿主内に固有の遺伝的不安定性があることを示唆する。これは、6か月の培養での染色体数の中央値の増加(2サンプルT検定、P=0.0384)によって確認され、付加的染色体を取得する優性染色体集団へのシフトを示唆する。さらに、テロメア配列の増加(P=<0.0001)は、間質性テロメアリピートで起こった増幅が存在していたことを示唆する。これらの形質は、従前の研究で強調されているように(Gisselsson et al., 2000; Lo et al., 2002; Thomas et al., 2018)、染色体レベルでの遺伝的不安定性を示す。
【0140】
6か月の安定期間にわたるCHOKla-GS-KO宿主の核型変化を評価するための多色蛍光insituハイブリダイゼーション(MFISH)の使用
CHOKla-GS-KO核型の均一性および経時的な核型の変動を評価した。治療タンパク質の生産に使用される宿主細胞株は、単一細胞クローニングからの遺伝的均一性を保持し、通常の培養中に遺伝的安定性を維持するべきである。宿主レベルで見られた均一性は、誘導された生産細胞株に受け継がれ得る。
【0141】
多色蛍光insituハイブリダイゼーション(MFISH)を、CHOKla-GS-KO細胞株で初期(20世代前後)および後期(150世代前後)に実施した。MFISHは染色体を「ペイント」して、染色体構成要素の視覚化を可能にする。チャイニーズハムスターゲノムに特異的なプローブを、初代細胞株(Metasystems)に対して作製し、各個の染色体のカラーコードを提供する(例えば、染色体1=赤、2=茶色など)。従って、それは宿主細胞培養内の染色体変異を評価するための手段を提供し、細胞株と時点の間の内部の両方での比較を可能にする。突然変異は単一細胞レベルで追跡することができ、特定の染色体変異は表現型形質に起因する可能性がある。細胞培養集団は、従前に記載した方法論を使用して手動で決定した。
【0142】
核型が異なる細胞は一意の亜集団IDを取得し、一致する核型は同じ亜集団識別子の下に一緒に分類される。無作為に選択した40枚の画像を分析し、各亜集団の頻度を評価した。この頻度に基づいて、クローン染色体異常(CCA、>5%)または非クローン染色体異常(NCCA、<=5%)を各亜集団に割り当て、集団の遺伝的安定性に反映した。
【0143】
初期時点で、18の異なる亜集団が特定され、亜集団1および2は、それぞれ45%および13%と、培養の大部分に相当した。亜集団1および2はCCA集団と指定されたが、15の亜集団の頻度は<=5%であり、NCCA集団として分類された。6か月の連続培養後の核型亜集団の分析により、16の異なる亜集団が明らかになり、培養過程で2つの亜集団が失われたことが示唆されたが、これは分析された画像数のアーティファクトである可能性がある。3/16の亜集団は、13のNCCAと比較してCCA亜集団と呼称した。元の18の亜集団のうち6つは、6か月の過程で維持され、10の新たな亜集団が発生した。NCCA亜集団6、8、13、および14は培養期間にわたって維持されたが、それらのNCCA指定は変更されず、獲得された突然変異が増殖の優位性を提供しなかったことを示唆する。
【0144】
10の新たな亜集団のうち、亜集団4が宿主培養で優勢となった。新たな亜集団4は増殖の優位性を得て、培養内で2番目に大きい亜集団になり、初期時点から保持された亜集団2を上回った。亜集団2の頻度は13%から8%に減少し、一方、亜集団4は15%の頻度を獲得した。初期と後期の時点での核型の比較により、初期の亜集団2は、染色体6の明らかな倍加を除けば核型が同一であるため、新たな亜集団4の前提条件であった可能性がある。
【0145】
染色体6の倍加は、細胞がフラスコ内の主要な集団として定着できるようにするための増殖上の優位性を提供した可能性がある。
【0146】
新たに異なる亜集団の作出につながった染色体変異を定量した。染色体2、4、5、7、10、11、14、15、18、19は、6か月の培養期間にわたって新しい集団を作出する転座を獲得しておらず、CHOKla-GS-KO宿主染色体の大部分がゲノムの安定性を維持していたことを示唆する。染色体8は他の染色体と比較して最も頻繁に変異しており、両時点で11の異なる集団を占めており、CHOKla-GS-KO宿主細胞株の天然の不均一性に寄与するこの染色体内の固有の不安定性を示唆する。6か月の連続培養の後、染色体6および13(染色体8に加えて)に顕著な突然変異の増加があり、これにより7つの新たに異なる集団(染色体8を含む場合は合計13の集団)となった。
【0147】
染色体6、8および13に内在する弱点は、突然変異を誘発して競争上の優位性を獲得するメカニズムを提供する可能性がある。これは、新たな亜集団4が培養期間の終わりに2番目に顕著な集団として定着することを可能にした染色体6の倍加によって裏付けられる(図6a、b、c、d、e)。
【0148】
染色体変異は変異タイプに分類され、染色体によって色分けして、宿主内に不均一性を生み出す主要な突然変異様式を評価した。初期時点での染色体1、8、9、12および16と、後期の時点での染色体3、6、8および13の転座は、19の新たに異なる集団に寄与した。欠失(染色体8および13)および染色体の切断(染色体3および6)は後期時点にのみ見られ、これらの突然変異が長期的な培養ストレスを示し得ることを示唆する。
【0149】
各時点での集団の総CCAおよびNCCA頻度を分析すると、CCAとNCCAの比率は同じままであった。CCA頻度は初期から後期時点で57.5%から67.5%に増加し、CCAの増加に寄与した新たな亜集団4の生成による遺伝的安定性へのわずかなシフトを示唆する。逆に、NCCAは42.5%から32.5%に減少し、これは集団4が増加し、初期時点から2つのNCCA亜集団が失われたためである。
【0150】
全体として、本明細書に提示したデータは、初期および後期の両方の時点での慣例培養中に突然変異を獲得した単一細胞クローン宿主を強調している。宿主の長期培養はこの問題を悪化させ、培養の初期段階で示されるようなゲノムの不均一性を維持していると思われる。染色体8は核型の不均一性の生成と維持に役割を果たしていると思われ、転座は新たな集団を作成する主要なタイプの突然変異である。治療タンパク質を異種宿主にトランスフェクトすると、異なる亜集団のいずれか1つにプラスミドが入るので、単一細胞の選別時にクローンの増殖が遺伝的に異なるというシナリオが成り立つ。このように、宿主細胞のバックグラウンドのゲノム不均一性は、同じ宿主から選別された単一細胞であるクローンが、製造条件において表現型に影響を与え得る異なるCHO’micプロファイルを有する可能性がある環境を作り出す。
【0151】
実施例3:生産不安定性表現型の因果関係を特定する差次的パターンを特定するための生産安定性細胞株および生産不安定性細胞株の特性評価と比較
染色体数の分布および相対テロメア長は、初期および後期時点での安定および不安定治療タンパク質生産細胞株の間で変化する
CHOKla-GS-KO宿主内の染色体数の分布は、初期および後期時点で、それぞれ19および20の染色体数の中央値を得た。両時点で、広範囲の染色体数が観察された。これは、生産安定性群と不安定性群の間の染色体数の変動を評価するためにCHOKla-GS-KO生産細胞株内で調べた。さらに、テロメア長は経時的に増加することが示され、従って、異なる群間でITS長の変化があるかどうかを評価するために、安定および不安定生産細胞株で初期および後期時点でITS長を定量した。
【0152】
結果
CHOKla-GS-KO宿主の特性評価に続いて、3つの治療タンパク質(タンパク質2、3および5)を生産する18の細胞株を染色体分布およびテロメア長について特性評価した。生産安定性を評価するために使用される業界標準のミニバイオリアクターであるAmbr15sを使用して従前に解明された生産安定性に基づき、細胞株を選択した。ここで、安定性は、6か月の生産ウインドウにわたって、最大力価損失閾値+/-30%以内で同じレベルの力価を生産できることと定義される。
【0153】
生産安定細胞株または生産不安定細胞株を示し得る基本的な染色体数の違いがあるかどうかを理解するために、染色体数を定量した。18の細胞株のうち14は、CHOKla-GS-KO宿主細胞株を反映する19または20の染色体数の中央値を保持していた。18の細胞株のうち4つは、染色体数の中央値が35~38染色体であり、単一細胞で選別されたクローンが、「異数性」数の染色体を獲得した宿主細胞株のトランスフェクト細胞に由来したことを示唆する(表1)。「異数性」細胞株は染色体数の広がりが最も大きく、90%信頼区間(Cl)の範囲が17~41染色体に広がっており、これらの細胞株は「半数体」細胞株と比較して大部分が不均一な核型を有することを示す。
【0154】
興味深いことに、「二倍体」と見なされる4つの細胞株のうち3つは生産安定性であり、遺伝物質の増加が、安定性評価期間にわたって細胞株が生産ストレスに上手く対処できるメカニズムを提供することを示唆する。染色体数分布のモーダル範囲および90%Cl範囲はどちらも、宿主細胞株に戻って比べると類似しており、選択剤の使用が染色体数に劇的な影響を及ぼさないことを示唆する。
【0155】
二元配置ANOVAアプローチを利用して、異なる治療タンパク質内の細胞株数の中央値を比較し、安定群および不安定群の間の有意差を評価した。治療タンパク質と安定性を因子として比較すると、有意差はなかった(P=0.108)。計画された比較アプローチ(表2)を使用したペアワイズ比較が適用され、ペアワイズ比較は、最初は未調整であり、その後、選択した比較ペアに事後検定が適用される。ホッホバーグの手順を行って、安定群および不安定群で各治療タンパク質の染色体数の分布を比較したが、統計的に有意なペアワイズ比較はなかった。これは、染色体数の分布が安定性と時点群の間で変動しないことを示し、選択圧法と生産細胞株の異なる培地組成が数のレベルで染色体の安定性を与えることを示唆する。
【0156】
【表1】
【0157】
【表2】
【0158】
生産安定細胞株および生産不安定細胞株におけるテロメア長の変化を特徴付けるため、CHOKla-GS-KO宿主テロメア分析のためにテロメアの定量を行った。テロメア長が生産安定性に役割を果たすかどうかを確認するために、同じ18の細胞株を、TTAGGGn蛍光プローブを使用して染色した。時間の他、安定細胞株と不安定細胞株の間でテロメア長が変動するかどうかを評価するために、初期および後期の時点で各細胞株の200枚の画像についてテロメア長を計算した。テロメア長データセットにデータの多数の変数を考慮する最小二乗平均(LSM)モデルを適用した。算術平均とは対照的に、LSMは、共変量(例えば、時点、染色体数、タンパク質など)に関して補正された線形モデルに基づく平均であり、真の集団平均のより良い推定値が得られる。
【0159】
安定性、初期および後期時点を考慮した、モーダル染色体数にわたるテロメア長のLSM計算をプロットした(データは示さず)。タンパク質2では、安定細胞株と不安定細胞株を比較すると、テロメア比率平均で大きな差が得られ、95%の信頼限界バーは、平均間の差がデータセット全体で大きく重複していることを示す。安定テロメア比率と不安定なテロメア比率のLSMの間で観察されたタンパク質2の違いは、タンパク質3および5と共有されておらず、安定細胞株のテロメア比率の増加がタンパク質固有の違いにすぎない可能性があることを示す。
【0160】
全体として、テロメア長の変化のパターンは、この細胞株パネルで一貫しているとは思われない。タンパク質2のテロメア長の比率は、初期時点から後期時点で減少するが、タンパク質3と5は、染色体数のカテゴリーに応じて混合プロファイル(テロメア長の増加と減少)を有する。LSMプロットで特定された初期時点および後期時点での様々なプロファイルは、プールされたデータを初期および後期のカテゴリーと比較することの無意味さに反映され(プールされたT検定、P=0.58、データは示さず)、長期間の培養期間にわたるテロメア長さの比率の違いはないという概念が確認される。
【0161】
安定細胞株と不安定細胞株でテロメア長に全体的な違いがあるかどうかを評価するために、データを安定カテゴリーと不安定カテゴリーにプールした(データは示さず)。不安定細胞株の平均テロメア長は、安定細胞株カテゴリーの2%から0.3%増加することが示された。この差は有意性が高いことがわかったが(P=<0.0001)、各群で分析された多数の画像が統計的検定の感度の向上に寄与した可能性がある。さらに、0.3%は、生理学的応答を引き出すのに十分な大きさではない可能性もある。
【0162】
生産不安定表現型のゲノム変異の状況を理解するための安定細胞株と不安定細胞株の核型を特性決定
治療タンパク質の生産に使用されるCHOKla-GS-KO宿主は、6か月の培養期間にわたって維持される不均一な核型を有する。ここでは、MFISHを利用して、初期および後期の時点で生産安定細胞株および生産不安定細胞株を特徴付け、異なる群のゲノム不安定性プロファイルの相違点または共通点を特定している。
【0163】
結果
安定細胞株および不安定細胞株のパネルからの中期染色体を採取し、従前に記載したようにMFISHを使用して「ペイント」した。各細胞株の染色体集団を、集団決定法を使用して初期および後期の時点で評価した。
【0164】
自動ミニバイオリアクター(Ambr 15)で評価した場合の所定の生産安定性に基づいて、種々の治療タンパク質(P2、P3、P5)を発現する6つの安定細胞株および8つの不安定細胞株を選択した。細胞株を解凍した後、3回継代培養して回復させた(>98%の生存率)。
【0165】
染色体数の中央値が19~20の細胞株を次の分析のために選択し、「異数体」と見なされる染色体数を有する細胞株は、これらの細胞株がここで特定された一般的な細胞株集団を代表するものではないために分析から除外した(表1)および他所。
【0166】
図1Aは、安定性と時点のカテゴリーに分割された各細胞株の集団円グラフを示す。CCA(斑点)およびNCCA(無地)の円セグメントは、安定と不安定、および初期と後期を比較すると、NCCA集団の増加を強調する。総CCAおよびNCCA頻度を各安定群で計算し、各群間の差は統計的に有意であった(二元配置ANOVA、P=0.01)。 総平均は78%と計算され、生産安定性指定の潜在的閾値を示している(図1B)。図1Cは、初期および後期の時点でのCCA集団とNCCAの集団の頻度の差が統計的に有意であることを示し(二元配置ANOVA、P=<0.0001)、NCCA集団が長期間の細胞培養で増加し、不均一性が高まることを示す。三角は集団平均と95%信頼区間を表し、青い線は標準偏差を示す。D)染色体によって分類された突然変異;細胞株は、異なる模様のセグメントで表される。染色体6と8は最も多くの突然変異を保持し、染色体6は14の細胞株のうち11で変異していた。E)安定性によって選別したこと以外は、図IDと同様の棒グラフ。2、17、18、および19を除く総ての染色体は、安定細胞株と不安定細胞株の両方で突然変異を獲得していた。特定の染色体変異のパターンは観察しなかった。
【0167】
安定細胞株と不安定細胞株のパネルでは、総てが複数の核型的に異なる集団を獲得し、CCAおよびNCCAの集団頻度の比率が異なるだけであった(図1a)。これは、宿主のトランスフェクションおよび単一細胞選別事象の後に、全体的な染色体変異の傾向が維持されていることを示す。安定群と不安定群の間の集団構成の比較は、不安定群内のNCCA集団の比率が高いことを示す。安定カテゴリーおよび不安定なカテゴリーの総CCAおよびNCCAパーセント頻度を計算すると、CCA集団の高いパーセント頻度が、生産安定細胞株と相関していることを示す(図1b)。逆に、NCCA集団のより高いパーセント頻度は、細胞株パネルの不安定アームで保持されていた(図1bおよび表3および4、二元配置ANOVA、P=0.0003)。安定細胞株と不安定細胞株のCCA%とNCCA%の明確な分類は、このゲノム測定基準が生産安定性予測因子として利用できることを示す。
【0168】
6か月の培養後、細胞株を再分析し、同じ方法を使用してそれらの集団を再決定した。タンパク質3、細胞株7(図1a、P3.C7)後期集団データは、図1cの分析から除外した。これは、細胞株が6か月の培養過程で「異数体」となるためであり、従って、残りのデータセットと比較不能である(データは示さず)。NCCA集団の分布は、タンパク質5、細胞株16(P5.C16))を除いて、安定性に関係なく劇的に増加した(図1a)。総CCAパーセント頻度と総NCCAパーセント頻度の比較は、細胞培養期間にわたってCCA頻度の減少とNCCA頻度の増加を同時に示す(図1cおよび表3、二元配置ANOVA、P=<0.0001)。NCCA集団の増加は、細胞株が生産の安定性に関係なく、経時的により不均一になることを示す(表4、P=0.4434)。不均一な培養物は、安定性評価での全力価の変動につながり得る異なる量の治療タンパク質を生産する細胞を獲得し、従って、CHO細胞株内で観察される生産不安定性を引き起こす可能性がある。細胞株開発環境では、このデータは、初期時点で顕著なレベルの遺伝的不安定性を有すると特定された細胞株が、経時的にますます不均一かつ遺伝的に不安定になり、その治療タンパク質を均一に発現する能力に大きな影響を与え、それにより発現の安定性に影響を与える。
【0169】
安定群を特定できる可能性のある細胞株に共通の染色体変異があるかどうかを理解するために、初期時点から確認された突然変異を染色体番号でまとめ、細胞株および安定性により着色した(それぞれ図Idおよびle)。分析された総ての染色体は、1以上の細胞株で突然変異を獲得し、これは、総ての染色体が、明らかなパターンは認識されないが、欠失、増幅、再配列および/または転座を受けやすいことを示している。安定性によって突然変異を区別することは、染色体6と8が全体的に最も高い突然変異率を有し、突然変異の大部分が不安定細胞株に属することを示す。14の細胞株のうち11が染色体6に突然変異を獲得し、11のうち3つは生産安定性であり、8つは生産不安定性である。3つの安定株のうち2つは同じ治療タンパク質を発現し、これは分析された全細胞株の57%で生産安定性を与える染色体6の潜在的能力に関して治療タンパク質特有の違いを特定する可能性がある。染色体8に突然変異を獲得した8つの細胞株のうち5つは生産不安定性であると考えられ、この染色体の突然変異が分析された不安定細胞株の36%を占め得ることを示す。まとめると、これらの結果は、生産とゲノム不安定性の間の潜在的な因果関係を示し、初期時点での生産安定性を決定するためのこの方法の予測力を強調する。
【0170】
【表3】
【0171】
【表4】
【0172】
これまでに、安定細胞株群と不安定細胞株群の間で、CCA%とNCCA%の頻度の明確な分離が特定された(図1b)。細胞株は初期時点(約20世代)で分析されたため、初期時点で生産安定性の指標となるゲノム安定性測定基準としてCCA%頻度対NCCA%頻度が利用できる可能性を検討した。これは、全安定性評価(70~150+/-10世代)を完了するよりもはるかに早い時点(20世代)で細胞株をトリアージする手段を提供できるため、細胞株開発のタイムラインに有益であり得る。
【0173】
タンパク質4を発現する22の細胞株は、任意の新しいライブプロジェクトの生産安定細胞株および生産不安定細胞株の正規分布を表すように選択され、CCAおよびNCCA集団が分析されるまで、生産安定性は盲検を維持した。CCA%のランク付けに基づいて細胞株の生産安定性を予測する能力は、生産安定性が不明な細胞株をトリアージするための細胞株開発(CLD)のクリティカルパスでの使用を模倣することから、この方法の予測力を提供する。データの盲検解除の前に、3つの別の予測方法を試験した(図2)。
【0174】
CCA%のランク付けに基づく上位6および下位6(図2a)の予測は、生産安定細胞株(細胞株の進行の場合)および生産不安定細胞株(トリアージの場合)を迅速に識別する可能性がある。全体として、タンパク質4発現細胞株の正確な予測率は82.5%であったが、これは、生産安定細胞株(確度67.5%)と比較して、生産不安定細胞株(確度100%)を正確に識別する方向に偏っていた。
【0175】
本発明者らの従前の細胞株パネルから定義されたCCA%閾値に基づく2番目の予測方法(78%閾値、図1b)は、予測の成功において同様の傾向を示した(図2b)。CCAが78%以上の場合は生産安定性があると見なされ、CCAが78%未満の場合は不安定であると見なされた。タンパク質4細胞株は、全体的に約80%の正確な予測を獲得し、これは、安定した正確な予測と不安定な正確な予測の間でそれぞれ75%と82.5%という、より一様なバランスが取れていた。この予測方法の潜在的な利点は、多くのデータが生成されるほどCCA%の閾値がより適切に調整され、予測率が向上する可能性があることである。
【0176】
四分位数予測(図1c)を利用して、上位25%の安定細胞株と下位50%の生産不安定細胞株を容易に特定できる。下位50%を堅牢にトリアージすると、限られたミニバイオリアクターのスペースを空けることによって細胞株の開発能力が大幅に高めることができる。タンパク質4は全体で70%の正確な予測を獲得したが、これは主に下位50%(中の下=確度80%、下位25%=確度100%)で得られたが、安定細胞株の上位25%では67.5%の正確な予測率が得られた。
【0177】
全体的に見れば、3つの予測方法総てを使用した予測は上手くいった。
【0178】
ここに提示したデータは、集団がCCAおよびNCCAの指定によって分類された場合、生産安定細胞株と生産不安定細胞株の間の不均一性に有意差があることを示す。興味深いことに、総ての細胞株が、培養期間が長くなると悪化する不均一な核型を獲得し、これは、約100世代後に細胞株の力価が大幅に低下するという所見を反映している(データは示さず)。NCCA集団の増加は、その治療タンパク質の生産を維持する細胞株の能力に影響を与えると思われる遺伝子の不均一性の増大につながる。逆に、獲得されたが細胞が培養フラスコ内に定着することを可能にする新たな突然変異(>=5%頻度)は生産安定性と相関していると思われ、これは主にCCAである不均一な集団を持つ細胞株は全体として生産安定性であるからである(図1a、b、および表3)。ここに提示されたデータは、細胞株の業界関連パネル(4つの異なる治療タンパク質にわたる40の細胞株)における細胞株生産安定性の潜在的なメカニズムに関する新しい発見を調査するための最初の研究といえる。複数の治療タンパク質発現細胞株にわたる有望な生産安定性予測結果は、予測方法が業界の設定で利用できるほど十分に堅牢であり得るという証拠を提供する。
【0179】
実施例4:生産安定性に対する遺伝的安定性の影響
生産安定細胞株および生産不安定細胞株の核型の不均一性は、これまで慣例の維持培養中に評価されてきた(実施例3)。CHOKla-GS-KO系の細胞株の不均一性が生産環境内でどのように変動するかを理解するために、これを治療タンパク質の生産の増加を促進するために最適化し、通常の生産実施条件およびDNA損傷剤の存在下でのゲノム不安定性を評価するための実験を設計した。
【0180】
実験は、DNA損傷剤としてネオカルジノスタチンを使用して、生産環境内の全体的なDNA損傷効果を評価するために設計した。従前に分析した、初期に生産安定と生産不安定の細胞株、および盲検化した細胞株の検証パネルから、6つの生産安定細胞株と6つの生産不安定細胞株を選択した(実施例3)。細胞株生産培養は2反復で設定し、2群の未処理細胞株を含み、24ディープウェル生産実施法を使用して、0日目のみ1ng/mlのネオカルジノスタチンで処理した。核型集団の不均一性を評価するために、生産実施の8日目に染色体を採取した。8日目は、分析のための適切なサンプリングを可能にするのに十分高いVCC%(生細胞数)を維持しながら、生産環境のストレスが潜在的な影響を引き出すことを可能にする潜在的な時点として選択された(データは示さず)。
【0181】
核型の不均一性は、従前に記載したようにMFISHを使用して評価した。核型集団には、発生頻度に基づいてCCA(>5%)またはNCCA(=<5%)の指定が割り当てられた。0日目は、細胞にできるだけ多くの治療タンパク質を生産させるように設計した生産実施プロトコールを進める前に細胞株が獲得したベースラインの核型の不均一性を表す。従前の安定細胞株パネルおよび不安定な細胞株パネルで観察されたように、生産安定細胞株は、生産不安定対応部分と比較して、CCA集団の約29%大きな割合を得た(図3a、bおよびc、表5および6、P=0.004)。
【0182】
生産実施環境内で8日後、CCA%は安定細胞株で32%減少し、不安定細胞株で約17%減少した(図3bおよびc、表5および6、それぞれP=<0.0001***およびP=0.07n.s)。これは、0日目のストレスの少ない維持環境と比較してNCCA集団が増加するため(約32%および約17%)、生産実施の環境ストレスが遺伝的安定性に影響を与えることを示唆する。DNA損傷剤の添加は、8日目と比較して、安定細胞株では約26%、不安定細胞株では23%、NCCA集団の増加を促した(図3bおよびc、表5および6、それぞれP=0.006およびP=0.014)。
【0183】
DNA損傷剤の添加時のNCCA集団の増加は、細胞内のDNA損傷の増加が目撃されたゲノム不安定性(NCCA集団の増加)につながるという証拠となる。
【0184】
【表5】
【0185】
【表6】
【0186】
実施例5:データ分析ワークフロー
細胞の特性評価および分析は工業的にスケーラブルであり、細胞株開発中の事業タイムラインに影響を与えることなく、より深い宿主細胞の特性評価を提供するようにデータは迅速に生成される必要がある。主として、遺伝学的スクリーニングの画像分析および液体の取り扱いは、これらのタイプの分析の主要なボトルネックとして特定された。画像分析の工業化を可能にするために概念化および実装された解決策の概要を示す。
【0187】
画像分析は、多くの場合、蛍光画像の特性評価を可能にするソフトウェアを使用して実施されるが、多くの場合、手動かつ主観的な方法で実施される(例えば、ImageJ)。この主観性を分析から取り除き、分析のタイムラインを短縮するために、画像分析ワークフローが、CellProfiler(商標)(http://cellprofiler.org/)にて、観察された突然変異を確認するために組み込みの画像分析モジュールを使用して作成された。ここでは、ワークフローと、それらをCLDクリティカルパスに適用する方法について述べる。
【0188】
蛍光に基づく画像分析は、細胞の特性評価のための重要なツールである。目的の表現型を調べる際に、基礎となる細胞生物学のより良い説明を補助する、細胞内のタンパク質またはDNA配列(適切な抗体およびプローブが利用可能な場合)を視覚化する能力を提供する。ただし、画像分析は歴史的に手動で分析されてきたため、分析が結果の出力に影響を及ぼし得る意図しないバイアスおよび主観性に開かれる。
【0189】
結果
上記の実施例では、CHOKla-GS-KO宿主のMFISH核型、生産安定細胞株および不安定細胞株の分析を手動で行った。突然変異の同定における潜在的な主観性およびバイアスを取り除くために、各個の染色体の5つの別々のカラーチャネルから蛍光強度を抽出するためのCellProfiler(商標)ワークフローを作成した。シングルチャネル画像はMetaferソフトウェア(Metasystems、V5.7.4)から抽出し、一連の閾値補正を行ってバックグラウンド蛍光を除去する。
【0190】
染色体マスクは、DAPIチャネルを使用したアインデンティファイ・プライマリ・オブジェクト・モジュールを介して識別さる。画像内のアーティファクト(例えば、細胞または残渣)除去するように自動マスクを手動で編集する。さらに、近接している染色体を個々のマスクに分割して、元の画像を忠実に複製することができる。半自動化された染色体のセグメント化により、マスク内に含まれる各カラーチャネルの画素の蛍光強度値の抽出が可能となる。
【0191】
単一の染色体マスク内の各チャネルからの蛍光画素強度を互いのパーセンテージとして表すと、視覚的に識別される染色体変異を確認するために利用される染色体カラープロファイルが得られる(データは示さず)。これにより、分析者は対象とする突然変異のカラープロファイルを取得でき、分析者が観察した突然変異が蛍光画素強度レベルで反映されるというさらなる証拠が得られる。染色体は、独自のMetasystemsソフトウェアに組み込まれているカラーコーディングシステムを使用して「ペイント」される。
【0192】
半自動CellProfiler(商標)ワークフローは、MFISH核型分析中に観察された染色体変異をプロファイリングする客観的な手段を提供するが、各個の画像の手動編集と蛍光強度データの分析後処理のため、ワークフローはやはり労力がかかる。現在、人工知能と機械学習(AI/ML)への関心が高まっているため、AI/MLに基づく方法を使用して、MFISH画像から安定性予測までのエンドツーエンドの工程を完全に自動化し、主観性を排除し、再現性を高め、全体的な分析のタイムラインを短縮した。エンドツーエンドの自動データ分析パイプラインは例6に記載する。
【0193】
自動突然変異検出の例を図4に示す。番号10および19が割り当てられた染色体は、画像1内で分離されていることが示される(alとbl、丸で囲んだ部分)。画像2内で、これらの染色体は転座事象を受けており、これはDAPIチャネルと疑似カラー画像(a2とb2、丸で囲んだ部分)を使用して確認することができる。ペアワイズ線形割り当て(C1=画像1およびC2=画像2)を実行すると、染色体10に一致するものは見つからず(画像2には存在しないため)、染色体19は変異した染色体に一致していたが、マッチングコストは82.48と大きかった。この値を文脈に置くためには、遺伝的類似性を有する2つの染色体(番号6)のマッチングコストは0.88となる。従って、マッチングコスト閾値を適用して、大きな画像セットの突然変異を迅速に特定することができる(例えば、>50のマッチングコスト=突然変異)。
【0194】
エンドツーエンドの自動データ分析パイプライン(APWと呼称)を検証するために、手動MFISH分析で使用した画像をAPWアルゴリズムで分析し、データを手動法と比較しました。CCAおよびNCCA集団のAPWの識別は、手動法に比べてほぼ一貫していた(図5a)。手動分析で観察されたように、不安定細胞株は、それらの安定対応物と比較して、より大きな割合のNCCA集団を獲得した。CCAとNCCAの頻度を比較すると、手動分析で観察されたように、安定群と不安定群の間に有意差が示された(図5b、プールされたT検定、P=<0.05)。CCA%と平均マッチングコストの分散を比較すると、マッチングコストの分散に基づいて安定細胞株と不安定細胞株の間に明確な分離があることが認められ、これは、平均マッチングコストの分散が、CCA指定集団およびNCCA指定集団に類似した別のゲノム不安定性測定基準として使用可能であることを示す(図5c)。
【0195】
48の細胞株に対して細胞株当たり40画像の核型分析を行う手動MFISHを実施すると、合計159時間の分析時間(サンプル前処理を除く)となる。同じ分析を1.3時間で完了できるAPWとは対照的に、研究者にとっては約157時間の時間の節約となる。
【0196】
手動分析の極めて労力がかかるという性質のために、サンプル当たり40画像を分析した。APW分析時間の節約は、分析される画像を細胞株当たり40から200~400画像に増やす手段を提供し、細胞培養フラスコのより詳細な特性決定を提供する。APWは、32.9日というアップスケールされた(細胞株当たり200画像、48細胞株)分析時間の節約をもたらし、事業タイムラインに影響を与えることなく、CLDのクリティカルパスに統合できる工業化アルゴリズムを提供する。
【0197】
CLDのクリティカルパスに統合されると、APWは初期細胞株トリアージ法として利用される。標準的な安定性評価には、単一の治療タンパク質に属する48の細胞株が必要であり、これは、細胞株の生産安定性が確認される前に4~6か月間培養される。細胞株の盲検パネルで安定性予測を行うことにより、予測ワークフローが不安定細胞株に対してより正確な予測結果を得たことが認められた。この方法を使用して不安定細胞株をトリアージすると、1か月後に安定細胞株の存在度が増し、完全な安定性評価の対象となる細胞株の数が治療タンパク質当たり12細胞株に減少する。従って、4つの治療タンパク質は、7か月間に1回の安定性実施でそれらの安定性評価を行うことができた。現在の一般的な一連の形式(1つの治療タンパク質、48の細胞株、タンパク質当たり4~6か月)では、4つの治療タンパク質細胞株の安定性を評価するのに16か月かかる。従って、APWを実装すると、CLD容量の4倍に増加とCMCタイムラインの節約がもたらされ得る。
【0198】
実施例6:エンドツーエンド自動データ分析パイプライン(APWと呼称)
MFISH生産安定性予測のタイムラインを合理化し、工業上スケーラブルなデータ分析ツールを提供するために考案されたエンドツーエンド自動データ分析パイプライン
MFISHでゲノム不安定性を評価する背後にある理論的根拠は、クローン細胞株生産不安定性の早期予測因子を取得し、サイクル時間を短縮してさらなるリソースを空けるために、より早期の時点で不要なクローン細胞株をトリアージすることである。MFISHの価値を実現するためには、画像の目視検査および手動のデータ処理に必要とされる時間とリソースを回避するために、自動画像分析パイプラインが必要である。自動画像分析パイプラインが手動に優るさらなる利点は、客観性と再現性である。
【0199】
結果
生産現場でのMFISHの使用を確保するために、エンドツーエンド自動画像分析パイプラインを設計して、一連のMFISH画像から細胞株の生産安定性/不安定性を予測した。
【0200】
各MFISH画像は6チャネルのTIFFであり、チャネル1はセグメント化に使用されるDAPIチャネルであり、残りの5チャネル(2、...、6)は、12色のパレットから画素の疑似色を決定するために使用される。
【0201】
分析パイプラインは5段階で構成され、所与の細胞株のMFISH画像セットについて次のように説明することができる。
1.染色体のセグメント化:全画像の全画素について、染色体に属する場合は画素を1に、そうでない場合は0に分類する。
2.染色体の説明:全画像の全染色体画素に、1から12までの疑似カラーラベルを割り当て、全画像の全染色体を、i番目のセクターが疑似カラーiに対応する12セクターの円で記述し、セクターiのサイズは、カラーiの染色体画素の比率である。
3.染色体のマッチ:全画像ペアについて、最初の画像の染色体と2番目の画像の染色体の間で、1対1の対応、および関連する染色体当たりの平均マッチングコストを決定する。
4.ゲノム安定性バイオマーカーの計算:平均マッチングコスト分布の分散を計算する。
5.タンパク質生産安定性の予測:所定の閾値を分散に適用して、細胞株をタンパク質生産安定性または不安定性のいずれかに分類する。
【0202】
染色体のセグメント化
画像は、いくつかのトレーニング画像で細胞核をセグメント化するように設計された畳み込みニューラルネットワークであるU-Netを使用してセグメント化した。このアーキテクチャは、畳み込み、正規化線形ユニット、および最大プーリング層を介した収縮の繰り返し層と、それに続くデコンボリューション層およびアップサンプリング層を介した拡張の繰り返し層からなるフィードフォワードネットワークである。収縮層と拡張層も連結によって接続され、アーキテクチャにU字型を与える。
【0203】
染色体のセグメント化にはいくつかの課題があり、U-Netの標準的なトレーニングと展開に変更を必要とした。最初の変更は、バイナリのクロスエントロピー損失関数に対するものであり、これにより、近接する染色体の境界での画素の誤分類に大きなペナルティーが科される。画像のij番目の位置の画素が近接した染色体間にある場合、損失関数にij番目のエントリーが高い重み行列を掛けた。2番目の変更は、画像アーティファクトの存在を克服し、他の非染色体細胞構造を除外することであった。2つのU-Netモデルがトレーニングした。1つ目は、前景画素(すなわち、染色体に属するもの)を予測することであり、2つ目は背景画素を予測することであった。この画素分類の2つのセットは、交差を介して併合され、最終的なセグメント化に到達した。
【0204】
染色体の記述
染色体は、単一の細胞株からの画像セットでトレーニングしたガウス混合モデルを使用して着色した。染色体に属するものとして分類された画素は、5次元空間色空間内の点と見なすことができ、ここで、次元iは、i番目のカラーチャネル内の画素のグレースケール強度に相当する。色空間内の画素の位置は、その疑似色を決定する。ガウス混合モデルは、データポイントを亜集団にクラスタリングするために使用できる確率モデルである。疑似着色モデルを構築するために、単一の細胞株からの画像をまずセグメント化し、次にそれらの染色体画素を、色空間での座標に基づいて、ガウス混合モデルによって12の疑似色集団に割り当てた。次に、このモデルを残りの全細胞株の全セグメント化画像に適用した。これらの結果を、Metabaseソフトウェアを使用して生成された結果と比較した。
【0205】
セグメント化された疑似色の染色体は、単一の細胞株の染色体との比較を容易にするために、それらの疑似色の比率によって特徴付けることができる。より具体的には、各染色体には12タプルのフィンガープリントが割り当てられ、そのi番目の成分は疑似色iの染色体のパーセンテージである。このような染色体のフィンガープリントは、i番目のセクターが疑似色iで着色され、フィンガープリントのi番目の成分をサイズとする円グラフで視覚的に表すことができます。
【0206】
染色体のマッチング
セグメント化された疑似色のMFISH画像のペアが与えられた場合、タスクは、類似の疑似色パターンを有する染色体がマッチするように、画像1の染色体と画像2の染色体の1対1の対応のセットを識別することであった。このマッチングは、全細胞株で画像化された染色体集団間の比較を可能にするために必要なステップであった。マッチングの程度は、染色体のペア間の疑似色の不一致を定量するコスト関数を使用して計算することができる。対応のセットは、行と列がそれぞれ画像1と2の染色体によってインデックス付けされ、ij番目のエントリーが画像1からの染色体iと画像2からの染色体jのマッチングのコストであるコスト行列Cを使用して線形割り当て問題を解くことによって決定された。
【0207】
線形割り当て問題を解くために使用されたハンガリーのアルゴリズムの出力は、総マッチングコストを最小化する画像化された染色体集団間の1対1の対応のセットであった。設計上、マッチした染色体はマッチングコストが低く、類似の疑似色フィンガープリントを有する傾向がある。染色体異常のために集団がまったく異なる場合、総マッチングコストは期待値よりも高くなる。集団内の染色体数の変動を説明するために、染色体数に対する総マッチングコストの平均を求めた。この平均は、画像セット内の総ての一意の画像ペアに対して計算された他の総ての平均とともに、平均マッチングコスト分布を形成する。アルゴリズムのこの段階からの出力の例を図4に示す。19の染色体の画像が18の染色体の画像とマッチし、これにより、1つの染色体に一致が割り当てられないことになることに留意されたい。図4から見て取れるように、画像1の染色体10にはコスト最適マッチがないため、この染色体にはペアがない。また、画像1の染色体19は、画像2の染色体19とペアになり、外れ値のマッチングコストは82%であることにも留意されたい。画像2の染色体19は、画像1の染色体10と19の融合体である。この染色体異常は、画像1および2の染色体19の統計的に高いマッチングコストに反映されている。
【0208】
ゲノム安定性測定基準の計算
ゲノム不安定性の測定基準は、細胞株の平均マッチングコスト分布の分散である。分散が大きい場合はゲノムの不安定性が高いことを示し、分散が小さい場合は細胞株がゲノム的に安定していることを示唆する。この観察結果は、図5の散布図c)に示すように、分散と手動で導出されたCCA%との相関関係によって確認される。
【0209】
タンパク質生産安定性の予測
新しい細胞株でのタンパク質生産安定性を予測するためには、既存の平均マッチングコスト分布の分散から適切な閾値を推定し、その後、新しい細胞株に由来する分散に適用しなければならない。これまでに分析された14の細胞株は、既知のタンパク質生産安定性の結果を示し、図5、c)手動で導出されたCCA%に対する自動分散計算の分散プロット(ここで、各ポイントは、安定なタンパク質生産の場合には斑点のある細胞株に、不安定なタンパク質生産の場合には無地の細胞株に対応する)は、2つのタンパク質生産安定性クラス間の明確な分離を示す。それを超えると細胞株がタンパク質生産不安定性である、そうでなければ安定性であると予測される適切な変動閾値を特定するために、既存の14の細胞株を使用して決定木を構築したが、これは厳密には必要ではない。実験プロトコールに変更がないと仮定すると、この閾値を新しいデータに適用して、細胞株のタンパク質生産安定性を予測することができる。
【0210】
実験プロトコールに変更が行われた場合、ワークフローに配備された総ての機械学習モデルは、新しいデータに対して再トレーニングする必要があることに留意されたい。明示的に、これは、セグメントテーションモデル、疑似カラーリングモデル、最後に決定木モデルを再構築することを意味する。
【0211】
実施例7:結論
本願に提示された結果は、CHOKla-GS-KO宿主およびCHOKla-GS-KOに基づく生産細胞株内のゲノムと生産不安定性の間の相互関係の特性決定を提供した。従前の研究(Vcelar et al., 2018a; Vcelar et al., 2018b)は、慣例の維持中にCHOK1に基づく宿主細胞株のゲノム不安定性の特性決定を提供し、様々な細胞培養条件での単一細胞クローニング工程においてゲノムの不均一性を追跡した。これらの従前の研究では、観察された不均一性の原因経路を解明する試みは行われなかった。
【0212】
Vcelar et al. (Vcelar et al., 2018a; Vcelar et al., 2018b) による観察と一致して、CHOKla-GS-KO宿主とCHOKla-GS-KO生産細胞株の両方で、安定性にかかわらず膨大な不均一性が観察された。本明細書に開示される研究は、疾患診断のために細胞遺伝学分野で使用されるクローン(CCA)および非クローン(NCCA)染色体異常指定を適用することによってこれらの発見をさらに拡大し、細胞培養フラスコ内の全体的な突然変異の状況を説明する一般的な突然変異測定基準を提供する。安定細胞株は複数の集団を有する可能性があるが、細胞株の全体的なゲノム安定性を定義するのは、CCA(遺伝的に安定な突然変異)またはNCCA(遺伝的に不安定/希れ)の比率である。
【0213】
この測定基準を適用して、本発明者らは、突然変異の増加(高NCCA%)と生産不安定性との間に相関関係を確立し、これは、4つの治療タンパク質を発現する細胞株で一貫した傾向を示した。さらに、本発明者らは、この測定基準が初期時点の生産安定性予測に使用できることを示し、細胞株の盲検パネルで方法論を試験して、実際のCLD事業でのその使用を概括した。この研究は、フルサイズの治療タンパク質を生産する細胞株の工業関連パネル(4つの治療タンパク質にわたる36の細胞株)で新しい発見を初めて試験するものである。
【0214】
本発明者らはさらに、平均マッチングコストの分散もCCA%に類似しており、従って、平均マッチングコストの分散もまた、さらなるゲノム不安定性測定基準として使用され得ることを示した。さらに、分散とSDの間の数学的関係により、平均マッチングコストのSDもゲノム不安定性測定基準として使用することができる。
【0215】
手動のMFISHに基づく安定性予測方法の自動化により、手動結果とよく相関する結果を有するサンプルの迅速な客観的分析が可能となった。これにより、より多くの特性評価(分析される細胞数の増加)と迅速な分析を可能として工業的時間枠内で出力結果を提供する完全にスケーラブルな方法が提供される。
【0216】
全体として、本願で開示された結果は、突然変異を追跡し、CCA%もしくはNCCA%、平均マッチングコスト分布の分散、または平均マッチングコスト分布のSDを、生産安定性予測に利用できる実行可能なゲノム安定性測定基準として示す方法を提供する。
【0217】
参照文献
図1A
図1B
図1C
図1D
図1E
図2A
図2B
図2C
図2D
図3A-1】
図3A-2】
図3B
図3C
図4-1】
図4-2】
図5A
図5B
図5C
【国際調査報告】