(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024143371
(43)【公開日】2024-10-11
(54)【発明の名称】推定モデル生成装置、推定装置、推定モデル生成方法、推定方法、及びプログラム
(51)【国際特許分類】
C12Q 1/02 20060101AFI20241003BHJP
C12M 1/00 20060101ALI20241003BHJP
【FI】
C12Q1/02
C12M1/00 C
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023056014
(22)【出願日】2023-03-30
(71)【出願人】
【識別番号】000000941
【氏名又は名称】株式会社カネカ
(74)【代理人】
【識別番号】100141139
【弁理士】
【氏名又は名称】及川 周
(74)【代理人】
【識別番号】100134359
【弁理士】
【氏名又は名称】勝俣 智夫
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(74)【代理人】
【識別番号】100178847
【弁理士】
【氏名又は名称】服部 映美
(72)【発明者】
【氏名】加茂 文貴
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA01
4B029AA07
4B029CC01
4B029FA01
4B029FA11
4B029FA12
4B029FA15
4B063QA05
4B063QQ05
(57)【要約】
【課題】化学的・生物学的プロセスにおいて、精度高い予測を行う。
【解決手段】槽のプロセス変数、前記プロセス変数の空間分布の統計量データ、及び前記槽から生成される生成物の情報を教師データとして、槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力データとして入力したときに、前記槽から生成される生成物の情報を推定する推定モデルを生成する、推定モデル生成方法。
【選択図】
図1
【特許請求の範囲】
【請求項1】
槽のプロセス変数、前記プロセス変数の空間分布の統計量データ、及び前記槽から生成される生成物の情報を教師データとして、槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力データとして入力したときに、前記槽から生成される生成物の情報を推定する推定モデルを生成する、
推定モデル生成方法。
【請求項2】
前記教師データに含まれる前記プロセス変数の空間分布の統計量データは、前記プロセス変数をシミュレーションすることで生成されるデータである、
請求項1に記載の推定モデル生成方法。
【請求項3】
槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力データとして入力したときに、前記槽から生成される生成物の情報を推定するように機械学習の手法により学習された推定モデルに、槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力することで、前記槽から生成される生成物の情報を推定する、
推定方法。
【請求項4】
前記推定モデルに入力される前記プロセス変数の空間分布の統計量データは、前記プロセス変数に基づいてサロゲートモデルにより生成されるデータである、
請求項3に記載の推定方法。
【請求項5】
槽のプロセス変数、前記プロセス変数の空間分布の統計量データ、及び前記槽から生成される生成物の情報を教師データとして、槽のプロセス変数、前記プロセス変数の空間分布の統計量データを入力データとして入力したときに、前記槽から生成される生成物の情報を推定する推定モデルを生成する、
推定モデル生成装置。
【請求項6】
槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力データとして入力したときに、前記槽から生成される生成物の情報を推定する推定モデルに、槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力することで、前記槽から生成される生成物の情報を推定する、
推定装置。
【請求項7】
コンピュータに、請求項1に記載の推定モデル生成方法を実行させるプログラム。
【請求項8】
コンピュータに、請求項3に記載の推定方法を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推定モデル生成装置、推定装置、推定モデル生成方法、推定方法、及びプログラムに関する。
【背景技術】
【0002】
化学反応や培養などの化学的・生物学的プロセスにおいて、反応槽や培養槽内などの空間不均一性を考慮しなければその性能の予測精度は低くなるケースがある。特許文献1は機械学習を利用せずにシミュレーションにて空間不均一性を算出した予測手法が開示されているが、必要な計算資源及び計算負荷が膨大になるなどの問題がある。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、精度高い性能予測を可能にする推定モデル生成装置、推定装置、推定モデル生成方法、推定方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0005】
本発明の一態様は、槽のプロセス変数、前記プロセス変数の空間分布の統計量データ、及び前記槽から生成される生成物の情報を教師データとして、槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力データとして入力したときに、前記槽から生成される生成物の情報を推定する推定モデルを生成する、推定モデル生成方法である。
【0006】
本発明の一態様は、槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力データとして入力したときに、前記槽から生成される生成物の情報を推定するように機械学習の手法により学習された推定モデルに、槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力することで、前記槽から生成される生成物の情報を推定する、推定方法である。
【0007】
槽のプロセス変数、前記プロセス変数の空間分布の統計量データ、及び前記槽から生成される生成物の情報を教師データとして、槽のプロセス変数、前記プロセス変数の空間分布の統計量データを入力データとして入力したときに、前記槽から生成される生成物の情報を推定する推定モデルを生成する、推定モデル生成装置である。
【0008】
槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力データとして入力したときに、前記槽から生成される生成物の情報を推定する推定モデルに、槽のプロセス変数及び前記プロセス変数の空間分布の統計量データを入力することで、前記槽から生成される生成物の情報を推定する、推定装置である。
【発明の効果】
【0009】
本発明によれば、精度高い性能予測をすることができる。
【図面の簡単な説明】
【0010】
【
図1】第1の実施形態に係る推定モデル生成装置の構成を示す図である。
【
図2】第1の実施形態に係る推定モデル生成装置の動作を示すフローチャートである。
【
図3】第1の実施形態に係る推定装置の構成を示す図である。
【
図4】第1の実施形態に係る推定装置の動作を示すフローチャートである。
【
図5】第2の実施形態に係る推定モデル生成装置の構成を示す図である。
【
図6】第2の実施形態に係る推定装置の構成を示す図である。
【発明を実施するための形態】
【0011】
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
《推定モデル生成装置の構成》
図1は、第1の実施形態に係る推定モデル生成装置1の構成を示す図である。推定モデル生成装置1は、教師データ取得部10、推定モデル生成部12、推定モデル出力部14とを備える。
【0012】
教師データ取得部10は、教師データを取得する。教師データは、槽のプロセス変数、当該プロセス変数の当該槽内の空間分布の統計量データ、及び当該槽から生成される生成物の情報とが対応付けられたデータである。
槽は例えば培養槽、反応槽又は精製槽である。プロセス変数は、当該槽における培養工程、反応工程又は精製工程における特徴量であって、例えば、槽内温度、槽内圧力、pH、粘度、液密度、液量、水分量、添加剤の添加速度、添加物濃度、添加物温度、異物情報、槽内の流速、攪拌機の攪拌数、せん断速度、攪拌電流値、電圧値、電力、電力値、攪拌モーターの電流値、電圧値、電力、電力量、通気量、気液比、OUR(Oxygen Uptake Rate)、除熱量、基質濃度、DO(dissolved oxygen)、菌体・粒子濃度、界面張力、酸素濃度、二酸化炭素濃度、RQ(respiratory quotient)、原料・配合比データなどを含む。また、この対象としている槽に前工程が存在する場合は前工程で取得されたデータも特徴量として加えてもよい。空間分布を持つ統計量データとしては、上記プロセス変数の中でも槽内分布を用いうるもので、槽内温度、槽内圧力、pH、粘度、水分量、添加物濃度、添加物温度、異物情報、槽内の流速、攪拌機のせん断速度、気液比、基質濃度、DO、菌体・粒子濃度、酸素濃度、二酸化炭素濃度、RQなどのデータが例として挙げられる。
生成物の情報は、例えば、生産性を示す数値、品質を示す数値、代謝挙動を示す数値、生成における異常を示す数値である。また、特徴量及び生成物の情報は、数値でなくてもよく、例えば「良い」「悪い」といったカテゴリカルな指標であってもよい。
【0013】
推定モデル生成部12は、教師データに基づいて機械学習の手法により推定モデルを生成する。推定モデルは、槽のプロセス変数及び当該プロセス変数の当該槽内の空間分布の統計量データを入力データとして、当該槽から生成される生成物の情報を出力するモデルである。推定モデル生成部12は、空間不均一性を考慮した性能予測モデルを生成する。ここで推定モデルの構成は主に3つのパターンがある。第一に、全てをブラックボックスモデルで推定する。第二に、性能予測部には現象論に即した物理モデル(ホワイトボックスモデル)を用い、空間不均一性を含む性能予測部の入力・出力の補正や変換をブラックボックスモデルで実施する。第三に性能予測部にはホワイトボックスとブラックボックスを組み合わせたグレイボックスモデルを用い、空間不均一性を含む性能予測部の入力・出力の補正をブラックボックスモデルで推定する。推定モデルのモデルが単一でなく複数のある場合、モデルの組み合わせ方は直列でも並列でも構わない。
【0014】
ホワイトボックスモデルの例は、培養が対象であればモノーの式やメカエリスメンテン式、反応が対象であれば反応速度式などがあり、これら一般的な物理式から派生させた式もホワイトボックスに含む。次にブラックボックスモデルの例として、線形回帰手法であれば、重回帰、ロジスティック回帰、Ridge回帰、Elastic Net回帰、Lasso回帰、PLS回帰、PCR、GPRなどがある。非線形回帰手法であれば、SVR、カーネルトリックを用いたGPRやPCR、アンサンブル学習モデル、ニューラルネットワーク、深層学習モデルを含む。グレイボックスモデルでは上記に示したホワイトボックスモデルとブラックボックスモデルを組み合わせたモデルを含む。
【0015】
アンサンブル学習モデルの例として、RandomForest、XGBoost、LightGBMなどがある。また、上記ブラックボックスモデルで提示したモデルを単一で用いるのではなく、複数のモデルをスタッキングして予測精度を向上させてもよい。
【0016】
推定モデル出力部14は、推定モデル生成部12により生成される推定モデルを出力する。推定モデル出力部14は、例えば後述する推定装置2に推定モデルを出力する。
【0017】
図2は、第1の実施形態に係る推定モデル生成装置1の動作を示すフローチャートである。教師データ取得部10が、教師データを取得する(ステップS101)。推定モデル生成部12が、推定モデルを生成する(ステップS102)。推定モデル出力部14が、推定モデルを出力する(ステップS103)。
【0018】
図3は、第1の実施形態に係る推定装置2の構成を示す図である。
推定装置2は、データ取得部20、記憶部22、推定部24及び推定結果出力部26を備える。推定装置2は、槽のプロセス変数及び当該プロセス変数の当該槽内の空間分布の統計量データに基づいて、当該槽から生成される生成物の情報を推定する。
【0019】
データ取得部20は、入力データを取得する。入力データは、槽のプロセス変数及び当該プロセス変数の当該槽内の空間分布の統計量データである。記憶部22は、推定モデルを記憶する。記憶部22は、例えば推定モデル生成装置1が出力する推定モデルを記憶する。
【0020】
推定部24は、入力データに基づいて、槽から生成される生成物の情報を推定する。推定部24は、記憶部22に記憶される推定モデルに入力データを入力することで槽から生成される生成物の情報を推定する。
【0021】
推定結果出力部26は、推定部24による推定結果を出力する。推定結果出力部26は、例えば外部の記憶装置に推定結果を出力し、推定結果を蓄積する。推定結果出力部26は、例えば外部の表示装置に推定結果を出力し、推定結果を表示させる。
【0022】
図4は、第1の実施形態に係る推定装置2の動作を示すフローチャートである。
データ取得部20が、入力データを取得する(ステップS201)。推定部24が、入力データに基づいて、槽から生成される生成物の情報を推定する(ステップS202)。推定結果出力部26は、推定部24による推定結果を出力する(ステップS203)。
【0023】
第1の実施形態に係る推定モデル生成装置1により生成される推定モデルは、入力データとしてプロセス変数の槽内の空間分布の統計量データを含む。空間分布の統計量データが示す空間不均一性は、槽内における反応等に影響を与える。従来の技術における反応・代謝反応の推定モデルは、通常、予備実験結果を基に作成し、槽内温度や溶存気体濃度、添加物濃度は均一と仮定して生成される。しかし、実際のところ槽内を完全な均一状態に制御できていることは稀であり、少なからず空間不均一性が生じている。そのため、第1の実施形態に係る推定モデル生成装置1により生成される推定モデルは、空間不均一性の影響を考慮することで、より正確に生成物の情報を推定することができる。
【0024】
図5は、第2の実施形態に係る推定モデル生成装置1の構成を示す図である。第2の実施形態に係る推定モデル生成装置1は、第1の実施形態に係る推定モデル生成装置1に加え、空間分布データ推定部16を備える。また、第2の実施形態に係る教師データ取得部10は、槽のプロセス変数と当該槽から生成される生成物の情報とが対応付けられた教師データを取得すればよく、教師データに槽内の空間分布の統計量データが含まれていなくてもよい。
【0025】
空間分布データ推定部16は、槽のプロセス変数に基づいて当該プロセス変数の当該槽内の空間分布の統計量データを推定する。空間分布データ推定部16は、例えばCFD(computational fluid dynamics)シミュレーションやDEM(Discrete Element Method)シミュレーション、またはCFDとDEMを組み合わせたCFD-DEMにより当該槽内の空間分布の統計量データを推定する。CFDシミュレーションは連続相のシミュレート手法であり、オイラー方程式やナビエストークス方程式に基づき、オイラー的に連続相の流動をシミュレートする格子法や、連続体近似を行い運動方程式のラグランジェ記述に基づいて、連続相を仮想粒子としてシミュレートする粒子法がある。DEMシミュレーションは物理的な粒子の集合体である離散体のシミュレートを行う手法である。
第2の実施形態に係る推定モデル生成部12は、教師データ取得部10が取得した槽のプロセス変数と当該槽から生成される生成物の情報と、当該槽のプロセス変数から空間分布データ推定部16により推定された当該槽内の空間分布の統計量データに基づき、推定モデルを生成する。
【0026】
CFDシミュレーションの手法は流動の状態によってモデルを使い分ける。層流の場合は層流モデル、乱流の場合はRANS(Reynolds-Averaged Navier-Stokes)、LES(Large Eddy Simulation)、DNS(Direct Numerical Simulation)などを用いる。乱流時は渦流が生じる為、渦流をどこまで近似せずに計算するかで精度や計算時間が決定する。渦流について時間平均をとっているのがRANSであり、メッシュより小さな渦流のみ補間モデルで近似するのがLES、一切の近似をせずに直接計算する手法がDNSである。近似が少ないほど計算負荷は増加し、DNSでの大型スケールの計算は非現実的な計算負荷である為、通常はRANSやLESが用いられる。
次に用いる槽内の状態、精度良く求めたい物理量によって手法を使い分ける。例えば混相流である場合はオイラー・オイラー混相流モデルやオイラー・ラグランジェ混相流モデル、VOF(Volume of Fluid)などのモデルが用いられる。ここで、界面状態を追跡したい場合はVOF、分散相の分裂・合一・成長・溶解といった変化を追跡したい場合はオイラー・オイラー混相流モデルとポピュレーションバランスモデルの組み合わせやオイラー・ラグランジェモデルが用いられる。また、流動中の粉体の弾性や付着力までを考慮したい場合は、CFD-DEMが用いられる。
【0027】
槽内の空間分布に関するデータは測定により取得することは難しい。第2の実施形態に係る推定モデル生成装置1は、シミュレーションにより槽内の空間分布に関するデータを推定することで、槽内の空間分布に関するデータを取得することができる。
【0028】
図6は、第2の実施形態に係る推定装置2の構成を示す図である。第2の実施形態に係る推定装置2は、第1の実施形態に係る推定装置2に加え、空間分布データ推定部28を備える。また、第2の実施形態に係るデータ取得部20は、槽のプロセス変数を取得すればよく、槽内の空間分布の統計量データを取得しなくてもよい。
【0029】
空間分布データ推定部28は、槽のプロセス変数に基づいて当該プロセス変数の当該槽内の空間分布の統計量データを推定する。空間分布データ推定部28は、例えばサロゲートモデルを用いることで当該槽内の空間分布の統計量データを推定する。サロゲートモデルは、例えば空間分布データ推定部16が用いるCFDシミュレーションを機械学習により代替したモデルである。
第2の実施形態に係る推定部24は、データ取得部20により取得される槽のプロセス変数及び空間分布データ推定部28により推定される当該槽内の空間分布の統計量データに基づいて、槽から生成される生成物の情報を推定する。なお、第1の実施形態及び第2の実施形態に係る記憶部22が記憶する推定モデルは、第1の実施形態に係る推定モデル生成装置1から入力される推定モデルであっても、第2の実施形態に係る推定モデル生成装置1から入力される推定モデルであってもよい。
【0030】
槽内の空間分布に関するデータを推定するシミュレーションは多くの計算資源を必要とし、時間を要する。第2の実施形態に係る推定装置2はサロゲートモデルを使用することで、槽内のプロセス変数からより少ない時間で当該プロセス変数の当該槽内の空間分布の統計量データを推定することができる。これにより、リアルタイムに近い形態で槽から生成される生成物の情報を推定することができる。
【0031】
〈他の実施形態〉
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【0032】
上述した実施形態における推定モデル生成装置1及び推定装置2の一部又は全部をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記録装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものを含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。また、推定モデル生成装置1及び推定装置2の一部または全部は、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
【符号の説明】
【0033】
1 推定モデル生成装置、10 教師データ取得部、12 推定モデル生成部、14 推定モデル出力部、16 空間分布データ推定部、2 推定装置、20 データ取得部、22 記憶部、24 推定部、26 推定結果出力部、28 空間分布データ推定部