IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士フイルム株式会社の特許一覧

特開2024-73504培養状態の推定方法、情報処理装置及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024073504
(43)【公開日】2024-05-29
(54)【発明の名称】培養状態の推定方法、情報処理装置及びプログラム
(51)【国際特許分類】
   C12Q 1/02 20060101AFI20240522BHJP
   C12M 1/34 20060101ALI20240522BHJP
   C12M 1/42 20060101ALI20240522BHJP
   G01N 21/65 20060101ALI20240522BHJP
   G16B 45/00 20190101ALI20240522BHJP
【FI】
C12Q1/02
C12M1/34 Z
C12M1/42
G01N21/65
G16B45/00
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2024033386
(22)【出願日】2024-03-05
(62)【分割の表示】P 2022516908の分割
【原出願日】2021-03-23
(31)【優先権主張番号】P 2020075480
(32)【優先日】2020-04-21
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】306037311
【氏名又は名称】富士フイルム株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】中村 直貴
(72)【発明者】
【氏名】原口 暢之
【テーマコード(参考)】
2G043
4B029
4B063
【Fターム(参考)】
2G043AA01
2G043AA03
2G043BA16
2G043EA03
2G043KA01
4B029AA02
4B029AA07
4B029BB01
4B029FA01
4B029FA15
4B063QA01
4B063QA20
4B063QQ05
4B063QQ61
4B063QQ79
4B063QS36
4B063QS39
4B063QX04
(57)【要約】      (修正有)
【課題】推定結果を即時に得ることができ、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない場合にも適用可能な培養状態の推定方法、情報処理装置及びプログラムを提供する。
【解決手段】細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得する。スペクトルデータについて前処理を行う。前処理によって得られた処理済みデータと、細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によってソフトセンサを構築する。培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータについての処理済みデータをソフトセンサに入力することによってソフトセンサから出力される状態データを取得する。
【選択図】図4
【特許請求の範囲】
【請求項1】
細胞及び培養液を含み、前記細胞の濃度が35×10cells/mL以上である細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、
前記スペクトルデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記スペクトルデータを入力とし、前記状態データを出力とするソフトセンサを構築し、
培養中の細胞を含む細胞懸濁液について取得された前記スペクトルデータを前記ソフトセンサに入力することによって前記ソフトセンサから出力される前記状態データを取得する
ことを含む培養状態の推定方法。
【請求項2】
細胞及び培養液を含む細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、
前記スペクトルデータについて前処理を行い、
前記前処理によって得られた処理済みデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記処理済みデータを入力とし、前記状態データを出力とするソフトセンサを構築し、
培養中の細胞を含む細胞懸濁液について取得された前記スペクトルデータについての前記処理済みデータを前記ソフトセンサに入力することによって前記ソフトセンサから出力される前記状態データを取得する
ことを含む培養状態の推定方法。
【請求項3】
前記前処理は、前記スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、前記学習用データとして用いるものの選別を行う処理を含む
請求項2に記載の推定方法。
【請求項4】
前記選別により、前記スペクトルデータに含まれる波数または波長毎の強度のうち、前記学習用データとして用いるものの数を5以上1000未満とする
請求項3に記載の推定方法。
【請求項5】
前記選別をスパースモデリングによって行う
請求項3または請求項4に記載の推定方法。
【請求項6】
前記前処理は、前記スペクトルデータのうち、前記状態データとの相関性が相対的に高い高相関スペクトルデータを、前記処理済みデータとして特定することを含む
請求項2から請求項5のいずれか1項に記載の推定方法。
【請求項7】
前記スペクトルデータは、前記細胞懸濁液に照射された光の散乱光のスペクトルを示すデータである
請求項1から請求項6のいずれか1項に記載の推定方法。
【請求項8】
前記状態データは、前記培養液に含まれる抗体の量、前記抗体の分解物の量、前記抗体の凝集物の量または前記抗体と構造が類似した未成熟糖鎖の量に関するデータである
請求項1から請求項7のいずれか1項に記載の推定方法。
【請求項9】
前記状態データは、前記培養液に含まれる成分の量に関するデータである
請求項1から請求項7のいずれか1項に記載の推定方法。
【請求項10】
前記状態データは、前記細胞の数に関するデータである
請求項1から請求項7のいずれか1項に記載の推定方法。
【請求項11】
少なくとも1つのプロセッサを含む情報処理装置であって、
前記プロセッサは、
細胞及び培養液を含む細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて前処理を行い、
前記前処理によって得られた処理済みデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記処理済みデータを入力とし、前記状態データを出力とするソフトセンサを構築する
情報処理装置。
【請求項12】
細胞及び培養液を含む細胞懸濁液に照射され、前記細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて前処理を行い、
前記前処理によって得られた処理済みデータと前記細胞または前記培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって前記処理済みデータを入力とし、前記状態データを出力とするソフトセンサを構築する
処理をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
開示の技術は、培養状態の推定方法、情報処理装置及びプログラムに関する。
【背景技術】
【0002】
培養中の細胞または培養液の状態を推定する培養状態の方法に関する技術として、以下の技術が知られている。例えば、特開2019-110767号公報には、培養液を封入して細胞を培養することによって目的物質を生産する培養槽と、培養槽の運転状態を計測する計測手段と、計測手段による計測値が、予め設定された制御目標値に一致するように、各種通気ガス供給手段等を個別に制御する個別制御手段と、個別制御手段と双方向通信可能に接続されているとともに、予め構築した統計的数値演算モデルを有するソフトセンサと、を備えた細胞培養装置の制御方法が記載されている。ソフトセンサは、個別制御手段による個別の制御値が入力された後、制御値と統計的数値演算モデルとを用いて培養槽内における目的物質の品質性状を推定し、推定された品質性状が予め設定した基準値を下回る場合に制御目標値を修正する。
【0003】
また、特表2008-526203号公報には、細胞成長容器とセンサーとを備えたバイオリアクターが記載されている。センサーは、容器内部の状態を測定し、モデルフリーな適応コントローラへの入力を提供するように構成され、分光測光などの方法により生成物品質属性との相関関係を示す状態を測定する。適応コントローラは、人工ニューラルネットワークを用いた動的なフィードバックシステムを含んで構成され、アクチュエータに出力を提供するように構成されている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
細胞の培養期間中における培養状態のモニタリングは、培養容器からサンプリングされた一部の細胞または培養液について、所定の計測項目を実測することにより行われる。しかしながら、このようなオフライン処理によれば、サンプルに対する前処理が必要となり、モニタリング結果を得るまでに比較的長い時間を要する。従って、培養期間中に何等かの異常が生じた場合に即時に対処することが困難となる。
【0005】
また、培養状態のモニタリング手法として、分光法を用いることが考えられる。分光法を用いた培養状態のモニタリングでは、細胞及び培養液を含む細胞懸濁液に電磁波を照射し、細胞懸濁液の作用を受けた電磁波の波数または波長毎の強度を示すスペクトルデータを、PLS(Partial Least Squares Regression)等の多変量解析手法を用いて解析することで、モニタリング対象(例えば、細胞から産生される抗体)に関する推定値を取得する。しかしながら、培養容器内における細胞の密度が高く(すなわち、夾雑物が多く)、且つモニタリング対象の含有量が僅かである実際の培養プロセスにおいて、PLS等の多変量解析手法を用いて培養状態の推定を行うと、推定精度が著しく低くなる場合がある。
【0006】
開示の技術は、上記の点に鑑みてなされたものであり、推定結果を即時に得ることができ、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない場合にも適用可能な培養状態の推定方法、情報処理装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
開示の技術に係る培養状態の推定方法は、細胞及び培養液を含み、細胞の濃度が35×10cells/mL以上である細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、スペクトルデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によってスペクトルデータを入力とし、状態データを出力とするソフトセンサを構築し、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータをソフトセンサに入力することによってソフトセンサから出力される状態データを取得することを含む。
【0008】
また、開示の技術に係る他の培養状態の推定方法は、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得し、スペクトルデータについて前処理を行い、前処理によって得られた処理済みデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって処理済みデータを入力とし、状態データを出力とするソフトセンサを構築し、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータについての処理済みデータをソフトセンサに入力することによってソフトセンサから出力される前記状態データを取得することを含む。
【0009】
上記前処理は、スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、学習用データとして用いるものの選別を行う処理を含み得る。上記選別により、スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、前記学習用データとして用いるものの数を5以上1000未満とすることが好ましい。上記選別をスパースモデリングを用いて行ってもよい。上記の前処理は、スペクトルデータのうち、状態データとの相関性が相対的に高い高相関スペクトルデータを、処理済みデータとして特定することを含む。
【0010】
スペクトルデータは、細胞懸濁液に照射された光の散乱光のスペクトルを示すデータであってもよい。
【0011】
状態データは、培養液に含まれる抗体の量、抗体の分解物の量、抗体の凝集物の量または抗体と構造が類似した未成熟糖鎖の量に関するデータであってもよい。また、状態データは、培養液に含まれる成分の量に関するデータであってもよい。また、状態データは、細胞の数に関するデータであってもよい。
【0012】
開示の技術に係る情報処理装置は、少なくとも1つのプロセッサを含む情報処理装置であって、プロセッサは、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて前処理を行い、前処理によって得られた処理済みデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって処理済みデータを入力とし、状態データを出力とするソフトセンサを構築する。
【0013】
開示の技術に係るプログラムは、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータについて所定の処理を行い、前記前処理によって得られた処理済みデータと細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって処理済みデータを入力とし、状態データを出力とするソフトセンサを構築する処理をコンピュータに実行させるためのプログラムである。
【発明の効果】
【0014】
開示の技術によれば、推定結果を即時に得ることができ、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない場合にも適用可能な培養状態の推定方法及び情報処理装置が提供される。
【図面の簡単な説明】
【0015】
図1】開示の技術の実施形態に係る培養状態の推定方法の一例を示す図である。
図2】スペクトルデータを取得する方法の一例を示す図である。
図3】開示の技術の実施形態に係る学習用データの一例を示す図である。
図4】開示の技術の実施形態に係る培養状態の推定方法の一例を示す図である。
図5】開示の技術の実施形態に係る情報処理装置のハードウェア構成の一例を示す図である。
図6】開示の技術の実施形態に係る推定モデルの構造の一例を示す図である。
図7】開示の技術の実施形態に係る学習フェーズにおける情報処理装置の機能的な構成の一例を示す機能ブロック図の一例である。
図8】開示の技術の実施形態に係るソフトセンサ構築処理の流れの一例を示すフローチャートである。
図9】開示の技術の実施形態に係る運用フェーズにおける情報処理装置の機能的な構成の一例を示す機能ブロック図の一例である。
図10】開示の技術の実施形態に係る推定処理の流れの一例を示すフローチャートである。
図11】ソフトセンサによって取得可能な状態データの一例を示す図である。
図12A】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12B】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12C】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12D】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12E】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12F】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12G】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12H】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12I】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12J】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12K】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図12L】開示の技術の実施形態に係るソフトセンサによって取得された推定値と、サンプリングによって取得した実測値との関係を示すグラフである。
図13】培養液に含まれるグルタミンの濃度の推定値を、ソフトセンサを用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合のそれぞれについて、実測値との関係を示したグラフである。
図14A】培養液に含まれる各成分の濃度の推定値を、ソフトセンサを用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合のそれぞれについて、決定係数を示したグラフである。
図14B】培養液に含まれる各成分の濃度の推定値を、ソフトセンサを用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合のそれぞれについて、決定係数を示したグラフである。
【発明を実施するための形態】
【0016】
以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一または等価な構成要素及び部分には同一の参照符号を付与し、重複する説明は適宜省略する。
【0017】
開示の技術の実施形態に係る培養状態の推定方法は、細胞及び培養液を含む細胞懸濁液に照射され、細胞懸濁液による作用を受けた電磁波の、波数または波長毎の強度を示すスペクトルデータを取得するステップと、取得したスペクトルデータについて前処理を行うステップと、前処理によって得られた処理済みデータと、細胞または培養液の状態を示す状態データとの複数の組み合わせを学習用データとして用いた機械学習によって、処理済みデータを入力とし、状態データを出力とするソフトセンサを構築するステップとを含む。前処理の方法としては、 スパースモデリング、PCA(主成分分析)、LSA(SVD)(潜在意味解析 (特異値分解))、LDA (線形判別分析)、ICA(独立成分分析)、PLS(部分的最小二乗回帰)等のdimentional reduactionの手法があり、スペクトルデータに含まれる波数または波長毎のスペクトル強度値のうち、学習用データとして用いるものの選別を行う処理を含んでいてもよい。この場合、選別されて残った波数または波長のスペクトル強度値が処理済みデータとなる。スペクトルデータを構成する波数または波長毎のスペクトル強度値は、膨大な数に及ぶことが想定される。学習用データとして用いるデータの選別を行うことでモデルデータへの過学習による予測精度低下を防ぐことができる。スペクトルデータの選別は、例えば、スパースモデリングによって行うことが可能である。すなわち、スペクトルデータについて行われる前処理は、スパースモデリングによって、スペクトルデータのうち、状態データに対する相関性が相対的に低いデータを除外することにより、スペクトルデータのうち、状態データとの相関性が相対的に高い高相関スペクトルデータを、処理済みデータとして特定することを含んでいてもよい。スペクトルデータに含まれる波数または波長毎の強度データのうち、前記学習用データとして用いるものの数を、前処理によって5以上1000未満にまで選別することが好ましく、5以上800以下がより好ましく、5以上500以下がさらに好ましく、11以上334以下が最も好ましい。
【0018】
本実施形態において、スパースモデリングとは、スペクトルデータに含まる波数または波長毎のスペクトル強度値を説明変数とし、状態データを目的変数とする回帰モデルついて、説明変数を選別(すなわち、説明変数の一部を除外)すること意味する。スパースモデリングの手法としては、例えば、lasso回帰を用いることが可能である。Lasso回帰は、二乗平均平方根誤差(RMSE: root mean squared error)に罰則項(ペナルティ項)を加算することにより算出されるコスト関数が最小になるように説明変数の選択を行う手法である。本実施形態では、スペクトルデータのうち、状態データとの相関性が相対的に低い低相関スペクトルデータを除外することにより説明変数の選別を行う。罰則項は、例えばK分割交差検証に代表されるcross-validationなどで決定してもよい。以下の説明では、スペクトルデータについて行われる前処理が、高相関スペクトルデータを特定する処理である場合を例に説明する。
【0019】
開示の技術の実施形態に係る培養状態の推定方法は、図1に示すように、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータのうち、高相関スペクトルデータを処理済みデータとしてソフトセンサ20に入力することによってソフトセンサ20から出力される状態データを取得するステップを含む。ソフトセンサ20は、入力される高相関スペクトルデータに基づいて状態データを出力する処理をソフトウェアによって実現するものである。ソフトセンサ20は、後述する情報処理装置10(図2図5参照)において構築される。
【0020】
本実施形態において、ソフトセンサ20は、ラマン分光法による解析手法を適用したものである。すなわち、ソフトセンサ20に入力されるスペクトルデータとして、ラマン散乱光のスペクトルデータが適用される。ラマン分光法は、ラマン散乱光を用いて物質の評価を行う分光法である。光を物質に照射すると、光が物質と相互作用することで入射光と異なる波長を持つラマン散乱光が発生する。入射光とラマン散乱光の波長差は、物質が持つ分子振動のエネルギー分に相当するため、分子構造の異なる物質間で、異なる波長(波数)を持ったラマン散乱光が得られる。また、ラマン散乱光を用いて、応力、温度、電気特性、配向、結晶性などの様々な物性を推定することができる。
【0021】
図2は、培養中の細胞を含む細胞懸濁液31についてスペクトルデータを取得する方法の一例を示す図である。細胞は、培養液とともに培養容器30に収容された状態で培養される。スペクトルデータは、公知のラマン分光解析用のプローブ40及びアナライザ41を用いて取得することが可能である。図2に示すように、プローブ40の先端は、培養容器30に収容された細胞及び培養液を含む細胞懸濁液31中に浸漬される。プローブ40の先端に設けられた光出射部(図示せず)から出射した励起光が細胞懸濁液31に照射される。励起光と細胞懸濁液31との相互作用によって発生したラマン散乱光は、プローブ40の先端に設けられた受光部(図示せず)によって受光される。取得されたラマン散乱光は、アナライザ41によって、波数(波長の逆数)毎に分解され、波数毎のスペクトル強度値であるスペクトルデータが生成される。なお、スペクトルデータは、波長毎のスペクトル強度値であってもよい。細胞培養の方式が灌流培養方式である場合においてスペクトルデータを取得する場合、細胞の濃度が35×10cells/mL以上である細胞懸濁液に電磁波を照射することが好ましい。細胞の濃度は、40×10cells/mL以上300×10cells/mL以下であることがより好ましく、60×10cells/mL以上220×10cells/mL以下であることが更に好ましく、80×10cells/mL以上1300×10cells/mL以下であることが最も好ましい。細胞培養が、抗体の製造を目的とする場合、培養する細胞の濃度が高い程、抗体の製造効率を高めることができる。従って、細胞の濃度を35×10cells/mL以上とすることで、一定の製造効率を確保することができる。一方、細胞の濃度が過度に高いと、スペクトルデータに混入するノイズ成分の量が多くなる。ノイズ成分を多く含むスペクトルデータを学習用データとして用いた機械学習によってソフトセンサ20を構築すると、学習モデルの精度低下及び過学習を招き、実使用に耐え得るソフトセンサを構築することができないおそれがある。細胞の濃度が300×10cells/mL以下に調整された細胞懸濁液についてスペクトルデータを取得することで、スペクトルデータに混入するノイズ成分の量を許容範囲に抑えることが可能となる。スペクトルデータは、情報処理装置10に供給される。なお、灌流培養とは、培養容器30から抗体等の産生物を含む培地を連続的に抜き出す一方、新鮮な培地を連続的に培養容器30に供給する方式である。
【0022】
ソフトセンサ20から出力される状態データは、スペクトルデータに相関性を有する、細胞または培養液の状態を示すデータである。状態データは、例えば、培養液に含まれる抗体の量、抗体の分解物の量、抗体の凝集物の量または抗体と構造が近似した未成熟糖鎖の量に関するデータであってもよい。抗体は、培養中の細胞から産生される産生物である。また、状態データは、培養液に含まれる成分の量に関するデータであってもよい。なお、「量に関するデータ」は、培養液中における、当該成分の含有量であってもよいし、含有率(濃度)であってもよい。また、状態データは、培養容器30内における生細胞の数に関するデータであってもよい。「生細胞の数に関するデータ」は、培養液中における生細胞の総数であってもよいし、密度であってもよい。これらの状態データは、実測によるインラインモニタが容易ではない。ソフトセンサ20を用いることで、実測によるインラインモニタが比較的容易なスペクトルデータに基づいて、状態データのインラインでの取得が可能となる。
【0023】
ソフトセンサ20は、スペクトルデータと状態データとの複数の組み合わせを学習用データとして用いた機械学習によって構築される。図3は、学習用データ50の一例を示す図である。学習用データ50は、例えば、予備的に実施されるテスト培養において取得される。すなわち、学習用のスペクトルデータは、テスト培養において培養容器30内に収容された細胞懸濁液から取得される。学習用の状態データは、テスト培養において培養容器30内で培養されている細胞または培養液を測定対象として、従来のサンプリング手法による実測により取得することが可能である。例えば、学習用の状態データとして培養液に含まれる抗体の濃度を取得する場合、HPLC(high performance liquid chromatography)等の手法を用いることが可能である。テスト培養は、所定期間に亘って行われ、学習用データは、テスト培養期間中における複数の時点で取得される。各時点における学習用のスペクトルデータ及び学習用の状態データは、互いに対応付けられる。
【0024】
ここで、アナライザ41は、スペクトルデータとして、例えば波数500cm-1から3000cm-1までの範囲のスペクトル強度値を1cm-1刻みで出力する。従って、取得されるスペクトルデータの数は膨大となり、全てのスペクトルデータを学習用データとして用いると、学習負荷が過大となり、機械学習を実施するために、高性能なプロセッサが必要となる。また、スペクトルデータを構成するラマン散乱光のスペクトル強度値の中には、モニタリング対象の状態データに対する相関性が低い波数のスペクトル強度値が含まれている場合がある。例えば、ラマン散乱光のある特定の波数値のスペクトル強度値は、抗体の濃度に対する相関性が低いことが考えられる。モニタリング対象の状態データとの相関性が低い波数のスペクトル強度値を含むスペクトルデータを学習用データとして用いた機械学習によってソフトセンサ20を構築すると、ソフトセンサ20の出力値の精度が低下するおそれがある。
【0025】
そこで、本実施形態においては、スペクトルデータに対する前処理として、アナライザ41から出力されるスペクトルデータのうち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値を高相関スペクトルデータとして特定する。そして、機械学習によってソフトセンサ20を構築する段階である学習フェーズにおいては、高相関スペクトルデータと状態データとの複数の組み合わせを学習データとして用いた機械学習によってソフトセンサ20を構築する。一方、構築されたソフトセンサ20を運用して、培養中の細胞または培養液について状態データを取得する運用フェーズにおいては、図4に示すように、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータのうち、モニタリング対象の状態データとの相関性が相対的に高い高相関スペクトルデータをソフトセンサ20に入力することによってソフトセンサ20から出力される状態データを取得する。ソフトセンサ20の構築及びソフトセンサ20を用いた状態データの取得は情報処理装置10によって行われる。
【0026】
図5は、情報処理装置10のハードウェア構成の一例を示す図である。情報処理装置10は、CPU(Central Processing Unit)101、一時記憶領域としてのメモリ102、及び不揮発性の記憶部103を含む。また、情報処理装置10は、液晶ディスプレイ等の表示部104、キーボードとマウス等の入力部105、ネットワークに接続されるネットワークI/F(InterFace)106、及びアナライザ41が接続される外部I/F107を含む。CPU101、メモリ102、記憶部103、表示部104、入力部105、ネットワークI/F106、及び外部I/F107は、バス108に接続される。
【0027】
記憶部103は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、またはフラッシュメモリ等の記憶媒体によって実現される。記憶部103には、学習用データ50、推定モデル60、ソフトセンサ構築プログラム70及び、推定プログラム80が記憶される。学習用データ50は、図3に示すように、スペクトルデータと状態データとの複数の組み合わせであり、テスト培養において取得されたものである。
【0028】
図6は、推定モデル60の構造の一例を示す図である。推定モデル60は、入力層、複数の中間層、及び出力層を含むニューラルネットワークとされている。推定モデル60の入力層には、ラマン散乱光の波数毎のスペクトル強度値、すなわちスペクトルデータが入力される。推定モデル60の出力層からは、入力層に入力されたスペクトルデータに対応する状態データが出力される。
【0029】
学習フェーズにおいて、CPU101は、記憶部103からソフトセンサ構築プログラム70を読み出してからメモリ102に展開し、実行する。運用フェーズにおいて、CPU101は、記憶部103から推定プログラム80を読み出してからメモリ102に展開し、実行する。なお、情報処理装置10の例としては、サーバコンピュータ等が挙げられる。CPU101は、開示の技術におけるプロセッサの一例である。
【0030】
図7は、学習フェーズにおける情報処理装置10の機能的な構成の一例を示す機能ブロック図の一例である。学習フェーズにおいて、情報処理装置10は、特定部11及び学習部12を含んで構成される。記憶部103には、学習用データ50及び推定モデル60が格納されているものとする。
【0031】
特定部11は、学習用データ50に対してスパースモデリングの一例であるLasso回帰による回帰分析を行うことにより、学習用データ50に含まれるスペクトルデータのうち、状態データとの相関性が相対的に高い波数のスペクトル強度値を高相関スペクトルデータとして特定する。具体的には、特定部11は、以下の処理を行う。特定部11は、学習用データ50含まれるスペクトルデータについて、ランダムに定めた波数のスペクトル強度値を間引く処理を行い、間引きしたスペクトルデータと対応する状態データとの関係性を示す回帰モデル(回帰式)を生成する。特定部11は生成した回帰モデルについて、二乗平均平方根誤差(RMSE: root mean squared error)に罰則項を加算したコスト関数を導出する。特定部11は、上記の各処理を所定回数繰り返し実施することにより、間引きされる波数が互いに異なる複数のスペクトルデータの各々について回帰モデルを生成するとともに、各回帰モデルについて上記のコスト関数を導出する。特定部11は、所定回数の繰り返し計算の中で、上記のコスト関数を最小とすることが可能な最少数のスペクトル強度値を高相関スペクトルデータとして特定する。例えば、グルタミンに本前処理を適用した場合、本前処理前のスペクトルデータの数:2500個、コスト関数:0.23に対し、前処理後のスペクトルデータの数:20個、コスト関数:0.015の結果を得た。
【0032】
学習部12は、学習用データ50のうち、特定部11によって特定された高相関スペクトルデータと、対応する状態データとの組み合わせを教師データとして用いた機械学習によって、推定モデル60を学習させる。これにより、高相関スペクトルデータを入力とし、状態データを出力とするソフトセンサ20が構築される。
【0033】
学習部12は、学習用データ50を用いて、機械学習の一例としての誤差逆伝播法に従って、推定モデル60を学習させる。具体的には、学習部12は、学習用データ50に含まれる、学習用のスペクトルデータから、特定部11によって特定された高相関スペクトルデータを抽出する。学習部12は抽出した高相関スペクトルデータを推定モデル60に入力し、推定モデル60から出力される状態データを取得する。学習部12は、取得した状態データによって示されるスコア(例えば、抗体の濃度を示すスコア)と、学習用データ50に含まれる、当該高相関スペクトルデータに対応する学習用の状態データによって示されるスコアとの差が最小となるように、推定モデル60を学習させる。学習部12は、推定モデル60を学習させる処理を、学習用データ50に含まれる高相関スペクトルデータと、状態データとの全部または一部の組み合わせを用いて行う。なお、機械学習の手法としては、誤差逆伝播法の他、ランダムフォレスト、線形回帰、非線形回帰(SVM:Sapport vector machine、ベイジアン回帰)、ロジスティック回帰等、挙げられるが、誤差逆伝搬法が好ましい。
【0034】
図8は、学習フェーズにおいて、CPU101が、ソフトセンサ構築プログラム70を実行することによって実施されるソフトセンサ構築処理の流れの一例を示すフローチャートである。ソフトセンサ構築プログラム70は、例えば、ユーザによって入力部105を介してソフトセンサ構築処理の実行指示が入力された場合に実行される。
【0035】
ステップS1において、特定部11は、記憶部103に格納されている学習用データ50に含まれるスペクトルデータから除外する波数のスペクトル強度値をランダムに選択する。すなわち、特定部11は、波数1cm-1刻みで取得されるスペクトル強度値のうち、一部の波数についてのスペクトル強度値を間引く処理を行う。除外する波数の数は、予め定められた数であってもよいし、ランダムに定められた数であってもよい。
【0036】
ステップS2において、特定部11は、ステップS1において選択された除外対象の波数以外の波数のスペクトル強度値によって構成されるスペクトルデータ(すなわち、間引きされたスペクトルデータ)と、対応する状態データとの関係性を示す回帰モデル(回帰式)を生成する。具体的には、間引きされたスペクトルデータを説明変数とし、対応する状態データを目的変数とする回帰モデルを統計的手法によって推計する。回帰モデルは、線形モデルであってもよいし、非線形モデルであってもよい。
【0037】
ステップS3において、特定部11は、ステップS2において生成した回帰モデルについてコスト関数を導出する。コスト関数は、回帰モデルの精度を示す指標値として用いられる。
【0038】
ステップS4において、特定部11は、ステップS1からステップS3までの処理の繰り返し回数が所定回数に達したか否かを判定する。特定部11は、繰り返し回数が所定回数に達するまで、ステップS1からステップS3までの処理を繰り返し実施する。これにより、除外対象の波数が互いに異なる複数の間引きされたスペクトルデータの各々について回帰モデルが生成され、生成された回帰モデルの各々についてコスト関数が導出される。
【0039】
ステップS5において、特定部11は、コスト関数が最小となる回帰モデルを生成する際に用いた、間引きされたスペクトルデータを高相関スペクトルデータとして特定する。コスト関数が最小となる回帰モデルを生成する際に用いたスペクトルデータは、状態データとの相関性が相対的に高い波数のスペクトル強度値によって構成される。このように特定部11は、回帰分析により、状態データとの相関性が相対的に高い波数のスペクトル強度値によって構成されるスペクトルデータを高相関スペクトルデータとして特定する。
【0040】
ステップS6において、学習部12は、記憶部103に格納された学習用データ50に含まれるスペクトルデータからステップS5において特定された高相関スペクトルデータを抽出し、抽出した高相関スペクトルデータと、対応する状態データとの複数の組み合わせを教師データとする機械学習により推定モデル60を学習させる。具体的には、学習部12は、ステップS5において特定された高相関スペクトルデータを推定モデル60に入力し、推定モデル60から出力される状態データによって示されるスコアと、学習用データ50に含まれる、当該高相関スペクトルデータに対応する学習用の状態データによって示されるスコアとの差が最小となるように、推定モデル60を学習させる。これにより、ソフトセンサ20が構築される。
【0041】
ソフトセンサ20は、モニタリングしようとする状態データの種別毎に構築される。例えば、培養液に含まれる抗体の量に関するデータを状態データとしてソフトセンサ20に出力させる場合、スペクトルデータのうち抗体の量に対して高い相関性を有する波数のスペクトル強度値が高相関スペクトルデータとして特定される。そして、特定された高相関スペクトルデータと、実測によって取得された抗体の量に関する状態データとの複数の組み合わせを学習用データとして用いた機械学習によって、高相関スペクトルデータに基づいて抗体の量に関する推定値を出力するソフトセンサ20が構築される。一方、細胞の数に関するデータを状態データとしてソフトセンサ20に出力させる場合、スペクトルデータのうち細胞の数に対して高い相関性を有する波数のスペクトル強度値が高相関スペクトルデータとして特定される。そして、特定された高相関スペクトルデータと、実測によって取得された細胞の数に関する状態データとの複数の組み合わせを学習用データとして用いた機械学習によって、高相関スペクトルデータに基づいて細胞の数に関する推定値を出力するソフトセンサ20が構築される。
【0042】
図9は、運用フェーズにおける情報処理装置10の機能的な構成の一例を示す機能ブロック図の一例である。運用フェーズにおいて、情報処理装置10は、取得部13、抽出部14及び推定部15を含んで構成される。記憶部103には、ソフトセンサ20として機能する学習済みの推定モデル60が格納されているものとする。
【0043】
開示の技術の実施形態に係る培養状態の推定方法は、例えば、培養容器に収容された培養中の細胞または培養液の状態を推定する場合に適用される。図2に示すように、培養容器30に収容された培養中の細胞を含む細胞懸濁液31についてプローブ40及びアナライザ41によってスペクトルデータが取得される。
【0044】
取得部13は、アナライザ41から出力されるスペクトルデータを取得する。抽出部14は、取得部13によって取得されたスペクトルデータのうち、特定部11によって特定された高相関スペクトルデータ、すなわち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値を抽出する。
【0045】
推定部15は、ソフトセンサ20として機能する学習済みの推定モデル60を記憶部103から読み出して、抽出部14によって抽出された高相関スペクトルデータを、推定モデル60に入力し、推定モデル60から出力される状態データを取得する。推定部15は、取得した状態データを表示部104に表示させる制御を行ってもよい。また、推定部15は、取得した状態データを記憶部103に記憶させてもよい。
【0046】
図10は、運用フェーズにおいて、CPU101が、推定プログラム80を実行することによって実施される推定処理の流れの一例を示すフローチャートである。推定プログラム80は、例えば、ユーザによって入力部105を介して推定処理の実行指示が入力された場合に実行される。
【0047】
ステップS11において、取得部13は、アナライザ41から出力されるスペクトルデータを取得する。ステップS12において、抽出部14は、取得部13によって取得されたスペクトルデータのうち、特定部11によって特定された高相関スペクトルデータ、すなわち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値を抽出する。ステップS13において推定部15は、ソフトセンサ20として機能する学習済みの推定モデル60を記憶部103から読み出して、ステップS12において抽出された高相関スペクトルデータを、読み出した推定モデル60に入力し、推定モデル60から出力される状態データを取得する。推定部15は、取得した状態データを表示部104に表示させる制御を行う。
【0048】
図11は、ソフトセンサ20を用いて取得された状態データの一例を示す図である。ソフトセンサ20を用いることで、細胞に関する項目として、例えば生細胞密度を推定することが可能である。また、ソフトセンサ20を用いることで、産生物に関する項目として、例えば抗体濃度、抗体と構造が近似した未成熟糖鎖の濃度、抗体凝集物の濃度及び抗体分解物の濃度を推定することが可能である。また、ソフトセンサ20を用いることで、培養液に含まれる成分に関する項目として、例えば乳酸の濃度、グルコースの濃度、クエン酸の濃度、グルタミンの濃度、アスパラギンの濃度、フェニルアラニンの濃度及びロイシンの濃度を推定することが可能である。
【0049】
図12A図12Lは、ソフトセンサ20から出力された状態データである、図11に示した各項目の推定値と、サンプリングによって取得した実測値との関係を示すグラフである。いずれの項目においても、ソフトセンサ20によって取得した推定値の、実測値からの乖離の程度を示す決定係数Rの値が0.95以上であり、ソフトセンサ20の出力値の精度が極めて高いことが確認された。
【0050】
図13は、培養液に含まれるグルタミンの濃度の推定値を、ソフトセンサ20を用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合のそれぞれについて、実測値との関係を示したグラフである。図14A及び図14Bは、培養液に含まれる各成分の濃度の推定値を、ソフトセンサ20を用いて取得した場合及び従来のPLSによる多変量解析手法を用いて取得した場合について、実測値からの乖離の程度を示す決定係数Rを示したグラフである。ソフトセンサ20を用いる場合については、高相関スペクトルデータを特定する前処理を実施した場合及び前処理を実施しない場合のそれぞれの場合について決定係数Rを取得した。各手法(ソフトセンサ(前処理あり)、ソフトセンサ(前処理なし)、PLS)における濃度推定において使用した波数の数(説明変数の数)を表1に示す。PSLの場合、ラマン散乱光の全波数帯(2500)を解析対象に含めた場合、精度が著しく悪くなる。そのため、濃度推定を行う上記各成分に存在するC-H、C-O等の結合に起因したピークが立つといわれている500cm-1から1500cm-1までの1000個の波数を解析対象とした。各手法における濃度推定に使用したスペクトルデータは、同一の培養実験にて得られたスペクトルデータである。なお、乳酸及びクエン酸の濃度については、PLSによる多変量解析手法を用いて推定値を取得することはできなかった。図13図14A及び図14Bに示すように、培養液に含まれるいずれの成分についても、ソフトセンサ20を用いて取得した推定値は、従来のPLSによる多変量解析手法を用いて取得した推定値よりも高精度であることが確認された。また、ソフトセンサ20を用いる場合において、高相関スペクトルデータを特定する前処理を実施することによって、推定値の精度が更に高くなることが確認された。本実施形態では、前処理によって、スペクトルデータに含まれる波数または波長毎のスペクトル強度値(データ数2500)のうち、ソフトセンサ20を構築する際の学習用データとして用いるものの数を11以上334以下にまで選別した。
【表1】

【0051】
以上のように、開示の技術の実施形態に係る培養状態の推定方法によれば、培養中の細胞を含む細胞懸濁液について取得されたスペクトルデータをソフトセンサに入力することによってソフトセンサから出力される状態データを取得することで、培養状態の推定が行われる。スペクトルデータは、実測によるインラインモニタが比較的容易であるため、培養状態の推定をインラインで行うことが可能である。また、培養状態の推定結果を、即時に取得することができるので、培養期間中に何等かの異常が生じた場合に即時に対処することが可能となる。
【0052】
また、ソフトセンサは、実際の培養環境下において取得されたスペクトルデータと状態データとの複数の組み合わせを学習用データとして用いた機械学習によって構築されるので、培養容器内の細胞の密度が高く、且つモニタリング対象の含有量が少ない実際の培養環境下においても、PLS等の多変量解析手法を用いて細胞状態の推定を行う場合と比較して、高い精度で培養状態の推定を行うことが可能である。
【0053】
また、アナライザ41から出力されるスペクトルデータのうち、モニタリング対象の状態データとの相関性が相対的に高い波数のスペクトル強度値によって構成される高相関スペクトルデータが学習データとして用いられるので、アナライザ41から出力される全てのスペクトルデータを学習用データとして用いる場合と比較して、学習負荷を小さくすることができ、また、ソフトセンサ20の出力値の精度を向上させることが可能となる。状態データについて、ソフトセンサによって取得した推定値とサンプリングによって取得した実測値からの乖離の程度を示す決定係数Rの値は0.8以上であることが好ましく、0.9以上がより好ましく、0.95以上が最も好ましい。
【0054】
また、開示の技術の実施形態に係る培養状態の推定方法によれば、培養液に含まれる抗体の量、抗体の分解物の量、抗体の凝集物の量または抗体と構造が類似した未成熟糖鎖の量に関する推定値を、状態データとして取得することが可能である。抗体の分解物は、培養中に生成される分解酵素により抗体が分解することにより形成される。抗体の凝集物は、例えば、細胞から産生される抗体の濃度が過度に高くなる、または熱等のストレスが加わると、形成されやすい。抗体と構造が類似した未成熟糖鎖は、例えば、培養液中の老廃物の量が増加する、または培養液中の酸素濃度が不足すると形成されやすい。抗体の分解物、抗体の凝集物、及び抗体と構造が類似した未成熟糖鎖については、培養期間中における生成量を極力少なくすることが好ましい。従って、抗体の分解物の量、抗体の凝集物の量または抗体と構造が類似した未成熟糖鎖の量に関する推定値を状態データとして取得することは、良好な培養状態を維持する上で有効である。
【0055】
また、開示の技術の実施形態に係る培養状態の推定方法によれば、培養液に含まれる成分の量に関する推定値を、状態データとして取得することが可能である。培養液には、細胞の培養に必要な栄養分等が含まれる。培養期間中において、必要な栄養分が培養液に過不足なく含まれていることが好ましい。従って、培養液に含まれる成分の量に関する推定値を状態データとして取得することは、良好な培養状態を維持する上で有効である。
【0056】
また、開示の技術の実施形態に係る培養状態の推定方法によれば、培養容器30内で培養されている細胞の数に関する推定値を状態データとして取得することが可能である。培養容器30内で培養されている細胞の数が過度に多くなると、細胞に供給される酸素及び栄養分が不足し、細胞の生存率が低下するおそれがある。一方、抗体の製造を目的とする細胞培養においては、培養容器30内で培養されている細胞の数が過度に少なくなると、抗体の製造効率が低下する。従って、培養容器30内で培養されている細胞の数に関する推定値を状態データとして取得することは、良好な培養状態を維持する上で有効である。
【0057】
なお、本実施形態では、スペクトルデータとして、ラマン散乱光のスペクトルを用いる形態を例示したが、この態様に限定されない。例えば、細胞懸濁液に照射された赤外線の吸収スペクトルをスペクトルデータとして用いることも可能である。また、核磁気共鳴スペクトルをスペクトルデータとして用いることも可能である。
【0058】
また、本実施形態では、スペクトルデータについて前処理を行い、前処理によって得られた処理済みデータと状態データとの複数の組み合わせを学習用データとして用いた機械学習によってソフトセンサを構築する場合を例示したが、学習負荷及び過学習による推定モデルの精度低下が問題とならない場合には、前処理が施されていないスペクトルデータを、学習用データとして用いてもよい。
【0059】
また、本実施形態では、前処理として、スペクトルデータのうち、状態データとの相関性が相対的に高い高相関スペクトルデータを特定する処理を例示したが、これに限定されるものではない。例えば、アナライザ41によって取得されたスペクトルデータのうち、予め定められた波数のスペクトル強度値を学習用データから除外する処理を前処理として行ってもよい。また、アナライザ41によって取得されたスペクトルデータについて、波数の近いもの同士が同じ波数グループに属するようにグループ分けを行い、波数グループ毎に散乱光の強度の平均値、標準偏差、中央値、最大値、最小値等を算出する処理を前処理として行ってもよい。この場合、波数グループ毎のスペクトル強度値が学習用データとして用いられる。また、波数または波長毎の強度を示すスペクトルデータと状態データとの複数の組み合わせによって構成される学習データについて、次元数を削減する処理を前処理として行ってもよい。
【0060】
また、上記実施形態において、例えば、特定部11、学習部12、取得部13、抽出部14、推定部15といった各種の処理を実行する処理部(processing unit)のハードウェア的な構造としては、次に示す各種のプロセッサ(processor)を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPUに加えて、FPGA等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
【0061】
1つの処理部は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種または異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせや、CPUとFPGAとの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。
【0062】
複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアント及びサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System on Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの1つ以上を用いて構成される。
【0063】
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)を用いることができる。
【0064】
また、上記実施形態では、ソフトセンサ構築プログラム70及び推定プログラム80が記憶部103に予め記憶(インストール)されている態様を説明したが、これに限定されない。ソフトセンサ構築プログラム70及び推定プログラム80は、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、ソフトセンサ構築プログラム70及び推定プログラム80は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【0065】
なお、2020年4月21日に出願された日本国特許出願2020-075480の開示は、その全体が参照により本明細書に取り込まれる。また、本明細書に記載された全ての文献、特許出願および技術規格は、個々の文献、特許出願、および技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12A
図12B
図12C
図12D
図12E
図12F
図12G
図12H
図12I
図12J
図12K
図12L
図13
図14A
図14B