(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024036914
(43)【公開日】2024-03-18
(54)【発明の名称】重要度判定方法、重要度判定装置、およびコンピュータプログラム
(51)【国際特許分類】
C12Q 1/02 20060101AFI20240311BHJP
C12M 1/34 20060101ALI20240311BHJP
【FI】
C12Q1/02
C12M1/34 Z
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022141468
(22)【出願日】2022-09-06
(71)【出願人】
【識別番号】000102692
【氏名又は名称】NTN株式会社
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】近江 ▲祥▼平
(72)【発明者】
【氏名】塚本 佳也
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA01
4B029BB11
4B029DF10
4B029FA15
4B063QQ03
4B063QQ08
4B063QQ53
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS39
4B063QX02
(57)【要約】
【課題】細胞の成熟化のための知見を取得できるようにするための技術を提供する。
【解決手段】重要度判定装置は、細胞を成熟化させるための実験について、1種類以上の実験条件および1種類以上の実験結果を含む推定用データの入力を受け付ける(ステップS14)。そして、重要度判定装置は、1種類以上の実験条件および1種類以上の実験結果を、推定モデルに対して入力することにより、1種類以上の実験結果のそれぞれに対する1種類以上の実験条件のそれぞれの重要度の算出結果を取得する(ステップS23,ステップS24)。
【選択図】
図3
【特許請求の範囲】
【請求項1】
未成熟な細胞の成熟に必要な実験条件を判定する方法であって、
細胞を成熟化させるための実験について、1種類以上の実験条件および1種類以上の実験結果を含む推定用データの入力を受け付けるステップと、
1種類以上の実験条件および1種類以上の実験結果を入力することにより、1種類以上の実験条件を入力されることによって1種類以上の実験結果を出力するように学習処理を施されている、推定モデルを構築するステップと、
前記推定モデルに1種類以上の実験条件および1種類以上の実験結果を入力することにより、1種類以上の実験結果のそれぞれに対する、1種類以上の実験条件のそれぞれの重要度の算出結果を取得するステップと、を備える、重要度判定方法。
【請求項2】
前記推定モデルは、回帰モデルまたは分類モデルである、請求項1に記載の重要度判定方法。
【請求項3】
前記推定モデルは、決定木、主成分分析、ランダムフォレスト、サポートベクターマシン、線形判別分析、二次判別分析、二項ロジスティック回帰、確率的後輩降下法、アダブースティング、人工ニューラルネットワーク、単純ベイズ法、ガウス過程、または、近傍法を用いたモデルである、請求項1または請求項2に記載の重要度判定方法。
【請求項4】
前記推定モデルは、勾配ブースティング決定木を用いたモデルである、請求項1または請求項2に記載の重要度判定方法。
【請求項5】
前記重要度を定量化する手法として、SHAPまたはPermutation Importanceが利用される、請求項1または請求項2に記載の重要度判定方法。
【請求項6】
定量化された前記推定用データに含まれる1種類以上の実験条件のそれぞれの重要度を合算し、合算された値の上位の所定数の種類の実験条件を成熟化に必要な実験条件として出力するステップをさらに備える、請求項1または請求項2に記載の重要度判定方法。
【請求項7】
前記入力を受け付けるステップは、作業者端末から前記推定用データの入力を受け付け、
前記出力するステップは、前記成熟化に必要な実験条件を、前記作業者端末に出力することを含む、請求項6に記載の重要度判定方法。
【請求項8】
前記未成熟な細胞として、哺乳類細胞を用いる、請求項1または請求項2に記載の重要度判定方法。
【請求項9】
前記未成熟な細胞として、生体由来あるいは人工多能性幹細胞由来の細胞を用いる、請求項1または請求項2に記載の重要度判定方法。
【請求項10】
前記未成熟な細胞として、神経、心臓、肝臓、膵臓、腎臓、免疫細胞を用いる、請求項1または請求項2に記載の重要度判定方法。
【請求項11】
1以上のプロセッサと、
メモリと、を備え、
前記メモリは、前記1以上のプロセッサによって実行されることにより、前記1以上のプロセッサに、請求項1または請求項2に記載の重要度判定を実施させる、重要度判定装置。
【請求項12】
コンピュータによって実行されることにより、前記コンピュータに、請求項1または請求項2に記載の重要度判定を実施させる、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、重要度判定方法に関し、特に、未成熟な細胞の成熟化の実験における1種類以上の実験条件のそれぞれの重要度の判定に関する。
【背景技術】
【0002】
細胞培養における実験条件の決定は、従来、研究者の経験や勘を頼りに行われてきた部分が大きい。近年、そのような経験や勘を数値化する取り組みがある。また多くの実験条件や実験結果が数値化され多量のデータを取り扱うようになってきたため、各条件の相関を人が判断することは不可能に近い状態になってきている。
【0003】
一方で、機械学習を用いると、実験条件と実験結果のデータから細胞のクオリティチェックを行うことができ、実験条件の最適化を行うことができる。例えば、特許文献1(特開2019-193587号公報)は、培養目的に応じた培養条件を実現するための培養環境を制御することを目的とし、決定木を用いて培養条件・環境を最適化する技術を開示している。
【0004】
バイオ分野、特に細胞を用いたin vitroの評価においては、生体で起こる現象の1つの評価パラメータに着目した評価が一般的である。しかし、生体では様々なパラメータが複合的に変化することで様々な現象を引き起こしている。このため、現在のin vitroの1つのパラメータに焦点を当てた評価は生体を模倣した評価としては不十分であると考えられている。そこで、in vitroの評価で得られた複数のパラメータの結果と機械学習を用いて、薬剤に応答したか否かを判定している。例えば、非特許文献1(E. K. Lee, et al, Stem Cell Reports, 2017, 9, 1560-1570、2017年11月14日)には、心筋細胞に対して薬剤を添加した際に、従来のように1つのパラメータを用いて薬剤の応答を判断することなく、機械学習を用いて得られたすべてのパラメータから薬剤の応答を判定する、技術が開示されている。
【0005】
幹細胞(iPS細胞やES細胞)から分化した細胞は、一般的に未成熟であることが知られている。これらの細胞はヒト細胞であれば成人より胎児の細胞に機能的にも構造的にも近いと言われている。そして、幹細胞由来の細胞を成熟させる研究が世界中で行われている。例えば、iPS心筋細胞については、非特許文献2(K. Ronaldson - Bouchard et al.、 Nature, 2018, 556, 239、2018年4月12日)に、iPS心筋細胞と線維芽細胞を共培養し、3次元構造を構築した上で電気刺激を行い、成熟化を行う、技術が開示されている。iPS心筋細胞については、他細胞との共培養、3次元培養、および電気刺激によって成熟化することが知られており、これらの3つの手法を同時に行った成熟化が試みられている。
【0006】
非特許文献2では、成熟の評価実験として、蛍光免疫染色や電子顕微鏡観察、活動電位、収縮力、Caトランジエント、遺伝子の発現量など多くの実験が行われている。しかしながら、このような成熟化の研究では課題がある。成熟した細胞と未成熟な細胞を比較して、各種実験の1つの評価パラメータを切り出して成熟化の有無を判断している。このため1つの研究の中で複数の評価実験を行った際に、複数の実験結果を相互的かつ包括的に評価できていない。
【先行技術文献】
【特許文献】
【0007】
【非特許文献】
【0008】
【非特許文献1】E. K. Lee, et al, Stem Cell Reports, 2017, 9, 1560-1570、2017年11月14日
【非特許文献2】K. Ronaldson - Bouchard et al., Nature, 2018, 556, 239, 2018年4月12日
【発明の概要】
【発明が解決しようとする課題】
【0009】
幹細胞(iPS細胞やES細胞)から分化した細胞は、一般的に未成熟であることが知られている。これらの細胞はヒト細胞であれば成人より胎児の細胞に機能的にも構造的にも近いと言われている。これら幹細胞由来の細胞を成熟させる研究が世界中で行われている。しかし、この成熟化の研究にはいくつかの課題がある。なかでも成熟した細胞と未成熟な細胞を比較して、各種実験の1つの評価パラメータを切り出して成熟化の有無を判断している点が大きな課題である。このため1つの研究の中で複数の評価実験を行った際に、複数の実験結果を相互的かつ包括的に評価できていない。
【0010】
例えば、特許文献1における課題としては、複数の実験結果データから培養環境を制御することができない。実験結果データは1つのみを用いており、複数の実験を相互的かつ包括的に評価する必要のある成熟化の実験には不向きである。すなわち、上記細胞の研究において、細胞の成熟化のための知見を取得することには大きな意義がある。
【0011】
本発明は、係る実情に鑑み考え出されたものであり、その目的は、細胞の成熟化のための知見を取得できるようにするための技術を提供することである。
【課題を解決するための手段】
【0012】
本開示は、未成熟な細胞の成熟に必要な実験条件を判定する方法である、重要度判定方法を提供する。重要度判定方法は、1種類以上の実験条件および1種類以上の実験結果を入力することにより、1種類以上の実験条件を入力されることによって1種類以上の実験結果を出力するように学習処理を施されている、推定モデルを構築するステップと、前記推定モデルに1種類以上の実験条件および1種類以上の実験結果を入力することにより、1種類以上の実験結果のそれぞれに対する、1種類以上の実験条件のそれぞれの重要度の算出結果を取得するステップと、を備える。
【発明の効果】
【0013】
本開示の重要度判定方法によれば、細胞を成熟化させるための実験について、1種類以上の実験条件および1種類以上の実験結果を含む推定用データが入力されれば、上記1種類以上の実験条件のそれぞれに対する、上記1種類以上の実験結果のそれぞれに対する重要度が取得される。これにより、細胞の成熟化のための知見が取得できるようになる。
【図面の簡単な説明】
【0014】
【
図2】重要度判定装置1のCPU12およびストレージ14によって実現される機能を表すブロック図である。
【
図3】重要度判定装置1が実施する処理のフローチャートである。
【
図4】実験条件データと実験結果データの関係の一例を模式的に示す図である。
【
図5】複数種類の実験条件のそれぞれに対して算出されたSHAP値の配列の一例を示す図である。
【
図6】実験条件とSHAP値との相関を模式的に示す図である。
【
図7】各実験条件のSHAP値の合算値の算出方法を説明するための図である。
【発明を実施するための形態】
【0015】
以下、本発明の実施の形態について図面を参照しつつ説明する。なお、以下の図面において同一または相当する部分には同一の参照番号を付し、その説明は繰り返さない。
【0016】
[装置構成]
図1は、重要度判定装置1の構成を示す。重要度判定装置1は、たとえば、汎用のコンピュータによって実現される。重要度判定装置1は、ディスプレイ10、入力デバイス11、CPU(Central Processing Unit)12、メモリ13、ストレージ14、およびデータバス15を含む。ディスプレイ10、入力デバイス11、CPU12、メモリ13、およびストレージ14は、データバス15を介して相互接続されている。入力デバイス11は、たとえば、キーボードおよび/またはマウスによって実現される。CPU12は、メモリ13を一次メモリとして利用し、ストレージ14に格納されたプログラムを実行する。ストレージ14には、プログラムの実行に必要な種々のデータ、および、プログラムの実行結果の情報を表す種々のデータが格納される。
【0017】
図2は、重要度判定装置1のCPU12およびストレージ14によって実現される機能を表すブロック図である。
【0018】
ストレージ14には、教師データ141、学習済みモデル142、および作動プログラム143が格納されている。作動プログラム143は、推定モデルの学習および利用するためのプログラムである。本明細書では、学習処理を施された推定モデルを「学習済みモデル142」とも称する。
図2に示されるCPU12の各機能は、CPU12が作動プログラム143を実行することによって実現される。
【0019】
重要度判定装置1は、作業者端末2と通信可能に構成されている。通信は、有線であってもよいし、無線であってもよい。
【0020】
重要度判定装置1は、作業者端末2から、または、入力デバイス11から、実験条件・実験結果を入力される。CPU12は、実験条件・結果取得部121において、実験条件および実験結果の入力を受け付ける。実験条件は、細胞を成熟化させるための実験についての実験条件である。実験結果は、細胞を成熟化させるための実験において得られた実験結果である。実験条件・結果取得部121は、入力データ全てを、ストレージ14の教師データ141に保存し、データ選択部122に入力する。実験条件・結果取得部121は、さらに、教師データとして、実験条件と実験結果の各組における実験結果、および、実験条件と実験結果の各組に付与された「重要度」を、教師データ141としてストレージ14に保存する。重要度とは、実験条件・実験結果の組を構成する1種類以上の実験結果のそれぞれに対する1種類以上の実験条件のそれぞれの重要性の度合いを表す。教師データ141として保存される重要度は、作業者によって実験条件と実験結果の各組に対して予め付与されたものであってもよい。また、当該重要度は、実験結果と実験結果の組に対して重要度算出部125から出力された重要度であってもよい。
【0021】
データ選択部122において、入力データの一部が選択され、選択されたデータがモデル構築用のデータとして、モデル構築部123に入力される。
【0022】
データ選択部122におけるデータの選択割合は任意に設定され得る。一実現例では、全入力モデルの30%のデータが、モデル構築部123に入力されるデータとして選択される。選択方法は、推定モデルの種類によって特定されてもよい。より具体的には、推定モデルが回帰モデルである場合には、データは無作為に選択され、推定モデルが分類モデルである場合には、分類する組となるデータを少なくとも1サンプルずつ選択する必要が望ましい。すなわち、推定モデルが分類モデルである場合には、実験条件・実験結果の組を〇か×に分類する際に、モデル構築部123に入力するデータとして、最低1セットの「〇」に分類されるべき実験条件・実験結果のデータの組と、最低1セットの「×」に分類されるべき実験条件・実験結果のデータの組とが含まれるように、データが選択されてもよい。分類の一例は、実験条件が、所与の薬剤の添加を含むか否かである。この例では、実験条件は、薬剤Aを添加することを表す場合は分類「〇」を付与され、添加しないことを表す場合は分類「×」を付与される。
【0023】
モデル構築部123は、データ選択部122から入力されたデータ(選択されたデータ)、または、教師データ141(実験条件・結果取得部121に入力されたすべてのデータ、および重要度算出部125から入力された重要度のすべてのデータ)を用いて、推定モデルの学習処理を実施する。学習処理において、入力データは「実験条件のデータ」「実験結果のデータ」であり、出力データは推定モデルである。この学習処理により、推定モデルは、「実験条件のデータ」を入力することにより、推定される「実験結果のデータ」を出力する。学習処理により、学習済みモデル142が作成される。作成された学習済みモデル142はストレージに保存される。一実現例では、学習済みモデル142は、推定モデルおよび当該推定モデルの(学習の結果として特定された)1以上のパラメータとしてストレージ14に保存される。
【0024】
モデル取得部124では、学習済みモデル142が取得される。学習済みモデル142の取得とは、一実現例では、推定モデルのパラメータを読み出すことを意味する。重要度算出部125では、モデル取得部124において取得された学習済みモデル142とデータ選択部122において取得したデータとを用いて、重要度が算出される。
【0025】
算出された重要度は、スコアリング算出部126において、スコアリングされ、判定部127において、成熟と相関のある実験条件を判定するための情報を出力する。また、算出されたデータは教師データ141に出力される。判定された情報を、ディスプレイを介して作業者端末に出力する。
【0026】
[処理の流れ]
図3は、重要度判定装置1が実施する処理のフローチャートである。
図3の処理は、CPU12が作動プログラム143を実行することによって実現される。以下、
図3を参照して、重要度判定に関する処理の流れを説明する。
【0027】
ステップS10にて、重要度判定装置1は、実験条件を設定する。ステップS10における実験条件の取得は、たとえば、作業者端末2から実験条件のデータの入力を受け付けることにより実現される。ステップS12にて、重要度判定装置1は、ステップS10において設定された実験条件に従った実験の結果(実験結果)を取得する。ステップS12における実験結果の取得は、たとえば、作業者端末2から実験結果のデータの入力を受け付けることにより実現される。
【0028】
ステップS14にて、重要度判定装置1は、作業者端末2から入力された実験条件・実験結果のデータを、実験条件・結果取得部121に入力する。
【0029】
ステップS16にて、重要度判定装置1は、学習済みモデル142が構築されているか否かを判断する。一実現例では、ストレージ14に学習済みモデル142が格納されていれば、学習済みモデル142が構築されていると判断し、ストレージ14に学習済みモデル142が格納されていなければ、学習済みモデル142が構築されていないと判断する。重要度判定装置1は、学習済みモデル142が構築されていると判断すると(ステップS16にてYES)、ステップS22へ制御を進め、そうでなければ(ステップS16にてNO)、ステップS18へ制御を進める。
【0030】
ステップS18にて、重要度判定装置1は、データ選択部122に、推定モデルの学習のためのデータを選択させる。推定モデルの学習のために利用される実験条件・実験結果のデータは、ステップS14において入力された実験条件・実験結果のデータのうち、重要度の算出に利用されるデータ(後述されるステップS23において学習済みモデル142に入力されるデータ)とは別の、学習用データである。
【0031】
ステップS20にて、重要度判定装置1は、モデル構築部123に、推定モデルの学習処理を実施させる。
【0032】
ステップS22にて、重要度判定装置1は、モデル取得部124に、学習済みモデル142を取得させる。
【0033】
ステップS23にて、重要度判定装置1は、重要度算出部125として機能することにより、学習済みモデル142に、ステップS14において入力された「実験条件・実験結果のデータ」を入力する。本明細書では、ステップS14において入力された「実験条件・実験結果のデータ」のうち、ステップS23において学習済みモデル142に入力されるデータを、推定用データとも称する。
【0034】
ステップS24にて、重要度判定装置1は、重要度算出部125に、学習済みモデル142に、「実験条件・実験結果のデータ」に含まれる1種類以上の実験条件のそれぞれの、「実験条件・実験結果のデータ」を構成する1種類以上の実験結果それぞれに対する重要度を算出させ、その算出結果を取得する。
【0035】
ステップS25にて、重要度判定装置1は、教師データ141に、ステップS24において取得された重要度を入力する。これにより、「実験条件・実験結果のデータ」に含まれる1種類以上の実験条件のそれぞれの、教師データ(重要度)が保存される。
【0036】
ステップS26にて、重要度判定装置1は、スコアリング算出部126に、「実験条件・実験結果のデータ」に含まれる実験条件に対するスコアリングを実施させる。一実現例では、スコアリングは、上記1種類以上の実験条件の重要度の合計の算出である。そして、ステップS26にて、重要度判定装置1は、スコアリングの結果、上位に位置する所定数の種類の実験条件を、成熟化に必要な実験条件として出力する。出力は、作業者端末2への通知でもよいし、ディスプレイ10で表示することでもよい。出力される実験条件の種類の数は、後述される
図5において条件x
8、条件x
2、および条件x
4として示されるように「3」とすることができる。ただし、このような種類の数は、単なる一例であって、本実施形態の技術が適用される状況ごとに適宜設定され得る。
【0037】
ステップS28にて、判定部127に、成熟に必要な実験条件の判定を実施させ、成熟と相関する実験条件を降順または昇順で列記した結果を作業者端末へ通知させる。一実現例では、成熟に必要な実験条件の判定は、SHAP値が利用される。より具体的には、ある実験条件のSHAP値が所与の閾値以上であることを条件として、当該実験条件は成熟に必要な実験条件として特定される。
【0038】
[スコアリング]
本実施形態では、実験結果に対する重要度のスコアリングは、以下の手順で実施される。すなわち、まず、任意のi個の実験条件(x1~xi(i=1,2,3…))を用いて未成熟な細胞の成熟化を行い、成熟の判定に用いるj個の実験結果(y1~yj(j=1,2,3…))が得られた場合に、機械学習を用いて1つの実験結果yjそれぞれに対する実験条件x1~xiの重要度g(yj)(j=1,2,3…)を算出する。そして、それぞれの実験条件の重要度g(yj)を合算することで複数の実験結果に対する重要度をスコアリングすることができる。
【0039】
[推定モデルおよびその学習]
推定モデルおよびその学習について説明する。
【0040】
本実施形態では、推定モデルとして、線形回帰、ロジスティック回帰、サポートベクターマシン(SVM)、決定木、ランダムフォレスト、ディープラーニング(ニューラルネットワーク)、ナイーブベイズ、k-means、主成分分析(PCA)、LightGBM、XGBoost、Convolutional Neural Network(CNN)、Recurrent Neural Network(RNN)、Generative Adversarial Networks(GAN)などを用いることができる。
【0041】
なかでも、分類の条件を確認できる決定木、ランダムフォレスト、LightBGM、XGBoostのような決定木方式が好ましい。さらに、欠損値まで扱うことのできる勾配ブースティング決定木方式のLightBGMやXGBoostは、学習に利用される実験条件・実験結果の組において、実験条件の一部の種類の値が欠損している場合にも学習が可能になることから、本実施形態において利用される推定モデルとしては好ましいと言える。
【0042】
また、機械学習モデルは予測精度が高くなるように回帰あるいは分類を任意で使い分けることが好ましい。
【0043】
さらに、上記の方法で算出した推定モデルから重要度を算出するために、実験条件と実験結果の相関を定量化できるSHapley Additive exPlanations(SHAP)やPermutation Importanceなどを用いることが望ましい。なかでも、SHAPは、ブラックボックスになりがちな予測モデルの各変数の寄与率を正負で算出することが可能であり、SHAP値(Shapley Value)という値で表現され得る。
【0044】
1種類以上の実験条件と成熟判定用の1種類以上の実験結果とを用いて、各種類の実験条件についてのSHAP値を算出することで、抽出された1種類以上の実験結果の組から、成熟化に対する重要な実験条件を予測することができる。そして、成熟判定用の1種類以上の実験結果のそれぞれについて、1種類以上の実験条件のそれぞれに対して算出されたSHAP値を合算することにより、1種類以上の実験条件の組に対してスコアリングすることで、複数の実験結果の組を用いた包括的な成熟化の判定が可能を行うことができ、さらにその成熟に相関している実験条件を予測することが可能となる。さらに、複数の機械学習手法を用いることで、より精度、理解度を高めることが可能となる。
【0045】
複数の機械学習手法を利用する一例として、SHAPとXGBoostとを利用する例を以下に説明する。
【0046】
図4は、実験条件データと実験結果データの関係の一例を模式的に示す図である。任意の実験条件x
1~x
i(i=1,2,3…)を用いてn個の未成熟な細胞の成熟化操作を行い、成熟の判定に用いる実験結果y
1~y
j(j=1,2,3…)が得られた場合に、
図4のような実験条件データと実験結果データの表を作成する。
【0047】
図4には、n個のサンプルのそれぞれについて、i種類の実験条件とj種類の実験結果が登録されている状態が示されている。1番目のサンプルについて、実験条件x
1の値は「x
1-1」で、実験結果y
1の値は「y
1-1」で、それぞれ模式的に示されている。また、n番目のサンプルについて、実験条件x
1の値は「x
1-n」として、実験結果y
1の値は「y
1-n」として、それぞれ模式的に示されている。
【0048】
そして、SHAPとXGBoostを用いて、i種類の実験条件のそれぞれに対してj種類の実験結果のそれぞれに対応するSHAP値の絶対値を算出する。
【0049】
図5は、複数種類の実験条件のそれぞれに対して算出されたSHAP値の配列の一例を示す図である。
図5では、SHAP値の絶対値が降順で示されている。
図5に示された例では、実験結果y
j(j=1,2,3…)と相関の高い実験条件はx
8,x
2,x
4の順であることが示されている。
【0050】
図6は、実験条件とSHAP値との相関を模式的に示す図である。
図6には、各実験条件とSHAP値との相関が示されている。
図6において、SHAP値が対応する実験条件の数値(Feature value)が高い場合には、スポットは丸形で示される。SHAP値が対応する実験条件の数値が低い場合には、スポットは三角形で示されている。
【0051】
実験条件の数値(Feature value)の一例は、所与の薬剤を添加したか否かを表す。実験条件が所与の薬剤が添加されたことを示す場合には、数値が高いとされる。実験条件が所与の薬剤を添加されなかったことを示す場合には、数値が低いとされる。
【0052】
実験条件の数値の他の例は、培養日数を表す。培養日数が所与の日数より長い場合には、数値が高いとされる。培養日数が所与の日数以下である場合には、数値が低いとされる。
【0053】
実験条件の数値のさらに他の例は、培養方法を表す。培養方法が三次元培養である場合には、数値が高いとされる。培養方法が二次元培養である場合には、数値が低いとされる。
【0054】
図6の例において、条件x
8内の数値(Feature value)の高い条件の方が、SHAP値が高く、条件x
2内の数値は低い条件の方が、SHAP値が高い。
図6に示されたような情報を提供されることにより、作業者は、実験条件ごとに、細胞を成熟させるために、当該実験条件を、数値が高くなるように設定するべきか否かを判断できる。
【0055】
たとえば、
図6に示された条件x
8、条件x
2、および条件x
4について、以下の具体例を想定する。
【0056】
条件x8=培養日数
条件x2=薬剤Aの添加の有無
条件x4=培養方法(二次元培養・三次元培養)
そして、この場合において、作業者は、任意に、培養日数の長い14日を上記数値が「高い」に対応させ、薬剤Aの添加ありを上記数値が「高い」に対応させ、三次元培養を上記数値が「高い」に対応させる。
【0057】
図6では、条件x
8、条件x
2、および条件x
4の3つの実験条件の中で、SHAP値の大きさは、条件x
8が最も大きく、次に、条件x
2が大きく、条件x
4が最も小さい。
【0058】
このようなSHAP値の大きさの順序は、細胞の成熟に対して想定される各実験条件の関与の大きさの順序を表す。より具体的には、上記3つの実験条件の中で、「培養日数」が最も大きく成熟に関与し、次に「薬剤Aの添加の有無」が成熟に関与し、次に「培養方法」が成熟に関与する。
【0059】
図6に示された情報は、さらに、各実験条件に対して、細胞の成熟のための方向性を指し示す。
【0060】
より具体的には、
図6から、各実験条件の数値(Feature value)の高低が、SHAP値と正負のどちらの相関があるかが理解される。
【0061】
図6の例では、培養日数は「高い=長い」方がSHAP値の正の値をより多く示している。このため、
図6は、「培養日数が長い」ことが細胞の成熟に寄与する可能性を示すことになる。
【0062】
一方、
図6の例では、薬剤Aの添加の有無については「低い=添加なし」の方がSHAP値と正の値をより多く示している。このため、
図6は、薬剤Aの添加をしないことが細胞の成熟に寄与する可能性を示すことになる。
【0063】
図7は、各実験条件のSHAP値の合算値の算出方法を説明するための図である。
図7には、条件X
1~X
jのそれぞれのSHAP値の合算値が棒グラフとして示されている。
【0064】
図7において、たとえば、条件X
1のSHAP値の合算値は、条件X
1に対して算出された結果y
1~y
jのSHAP値の合計として示されている。すなわち、各実験条件のSHAP値の合算値は、各実験条件の条件X
1に対して算出された結果y
1~y
jのSHAP値の合算値として算出される。合算値の算出は、スコアリングを意味する。
図7の例では、スコアリングは、結果y
1~y
jのSHAP値の加算により算出されているが、スコアリングの方法は、加算に限定されず、乗算などの他の方法によるものでも良い。
【0065】
図7のスコアリング表の中で、合算されたSHAP値が高い実験条件は成熟に必要な実験条件である。さらに、
図6を用いて各実験条件の正負の相関を確認することで、成熟に必要な実験条件の最適化(細胞の成熟のために、各実験条件を、高い数値に対応するように設定するか、または、低い数値に対応するように設定するか)を行うことができる。
【0066】
[細胞の成熟化のための実験条件の判定の具体例]
さらに、具体的にiPS心筋細胞の成熟化について例示する。
【0067】
iPS心筋細胞を成熟化させる際の実験条件として、培養日数、細胞のロット、細胞の直径、播種時の生存率、培地の種類、添加因子の種類、二次元・三次元培養、培地量などを用いることができる。実験結果として、PCRによるαMHC、βMHC、KCNJ2、SERCA2などの遺伝子の発現量や、収縮力、Caトランジエントの波形の各パラメータ(拍動数、振幅、ピーク幅(PWD10-90)、各スロープ(Rising Slope, Falling Slope)、波形の面積など)、薬剤(E-4031、Isoproterenol、Propranolol、など)の応答性などを用いることができる。この際、SHAPとXGBoostを用いると、スコアリングの値は先行研究でiPS心筋細胞を成熟化させる条件である、添加因子の種類や、培養日数が高くなる。
【0068】
未成熟な細胞は、動物種、生体由来、人工多能性幹細胞由来のいずれを用いても良い。動物種はヒト、マウス、ラットを始めとし、哺乳類、爬虫類、魚類、鳥類などいずれを用いても良い。また生体から採取した初代細胞やiPS細胞やES細胞を始めとする人工多能性幹細胞から分化させた細胞を用いても良い。また細胞種としては神経細胞、心筋細胞、肝細胞、線維芽細胞、上皮細胞、血管内皮細胞、α細胞、β細胞、δ細胞、T細胞など、生体を構築するいずれの細胞を用いても良い。
【0069】
機械学習に用いる実験条件は、細胞の状態、培養環境、操作条件など、いずれを用いても良い。細胞の状態とは、生体由来細胞であれば、採取した生体の育った環境、性別、採取した際の操作者、採取した際の時間などを用いても良い。人工多能性幹細胞由来の場合は、人工多能性幹細胞を作成した際に用いた細胞を採取した、動物種、人種、年齢、性別などの条件、および、人工多能性幹細胞を作成した際に用いた試薬の種類や量、試薬のロット、操作手順、操作者などを実験条件として用いても良い。また人工多能性幹細胞から各細胞への分化誘導の際の試薬の種類や量、試薬のロット、操作手順、操作者などを実験条件として用いても良い。さらにいずれの細胞においても、生存率や細胞の平均直径、各種バイオマーカーの発現量などを実験条件として用いても良い。
【0070】
培養環境、操作条件は、培地量、培地交換の間隔、培地の構成成分、培地への添加因子の種類、培養温度、二酸化炭素濃度、操作時の気温、湿度、時間帯などを実験条件として用いても良い。
【0071】
実験結果としては、一般的に成熟化を判定する実験の結果を用いる。PCRやウェスタンブロッティングであれば成熟化を判定するRNAやタンパクの発現量を用いても良い。膜電位や細胞外電位、Caトランジエント、力学的応答性、代謝活性、薬剤に対する応答性など種々の実験結果を用いても良い。
【0072】
以上説明した本実施の形態の重要度判定装置によって実施される重要度判定方法によれば、推定用データに含まれる1種類以上の実験条件のそれぞれについて、推定用データに含まれる1種類以上の実験結果のそれぞれに対する重要度の算出結果が取得される。これにより、複数の実験における実験条件を相互的かつ包括的に評価する必要のある細胞の成熟化について、有益な知見が取得され得る。
【0073】
今回開示された実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施の形態の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0074】
1 重要度判定装置、2 作業者端末、10 ディスプレイ、11 入力デバイス、13 メモリ、14 ストレージ、15 データバス、121 結果取得部、122 データ選択部、123 モデル構築部、124 モデル取得部、125 重要度算出部、126 スコアリング算出部、127 判定部、141 教師データ、142 学習済みモデル、143 作動プログラム。