IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ネクスジェン株式会社の特許一覧

特開2022-66730細胞評価、分類または純化装置、システムおよび方法。
<>
  • 特開-細胞評価、分類または純化装置、システムおよび方法。 図1
  • 特開-細胞評価、分類または純化装置、システムおよび方法。 図2
  • 特開-細胞評価、分類または純化装置、システムおよび方法。 図3
  • 特開-細胞評価、分類または純化装置、システムおよび方法。 図4
  • 特開-細胞評価、分類または純化装置、システムおよび方法。 図5
  • 特開-細胞評価、分類または純化装置、システムおよび方法。 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022066730
(43)【公開日】2022-05-02
(54)【発明の名称】細胞評価、分類または純化装置、システムおよび方法。
(51)【国際特許分類】
   C12M 1/34 20060101AFI20220422BHJP
【FI】
C12M1/34 D
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2020175244
(22)【出願日】2020-10-19
(71)【出願人】
【識別番号】516322980
【氏名又は名称】ネクスジェン株式会社
(74)【代理人】
【識別番号】100114188
【弁理士】
【氏名又は名称】小野 誠
(74)【代理人】
【識別番号】100196483
【弁理士】
【氏名又は名称】川嵜 洋祐
(74)【代理人】
【識別番号】100160255
【弁理士】
【氏名又は名称】市川 祐輔
(72)【発明者】
【氏名】宮西 正憲
(72)【発明者】
【氏名】宮塚 功
(72)【発明者】
【氏名】リー マイ アン
【テーマコード(参考)】
4B029
【Fターム(参考)】
4B029AA07
4B029BB11
4B029CC01
4B029FA04
(57)【要約】      (修正有)
【課題】フローサイトメトリー法よりも単純かつ対象細胞への影響が少ない、様々な生物学的機能を有する細胞を同定・純化するための方法を提供する。
【解決手段】細胞の分化段階を判別するシステムであって、細胞の画像が入力された場合に、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階を出力する学習済みモデルに、細胞の画像データを入力するデータ入力部と、前記学習済みモデルから出力された、細胞の分化段階を出力するデータ出力部とを有するシステムを開示する。
【選択図】図4
【特許請求の範囲】
【請求項1】
細胞の分化段階を判別するシステムであって、
細胞の画像が入力された場合に、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階を出力する学習済みモデルに、細胞の画像データを入力するデータ入力手段と、
前記学習済みモデルから出力された、細胞の分化段階を出力するデータ出力手段と
を有するシステム。
【請求項2】
前記数値データの組み合わせから特定される各分化段階が、数値データの組み合わせから生成される細胞配置空間構造を分画することによって特定されたものである、請求項1に記載のシステム。
【請求項3】
前記数値データの組み合わせが、FACS解析によって得られたデータの組み合わせを含む、請求項1または2に記載のシステム。
【請求項4】
前記分化段階が、CLP(common lymphoid progenitor)、CMP(common myeloid progenitor)、MEP(megakaryocyte erythrocyte progenitor)、GMP(granulocyte monocyte progenitor)、Flk2+(Flk2+ multipotent progenitor)、MPPa(multipotent progenitors subset A)、MPPb(multipotent progenitors subset B)、ST-HSC(Hoxb5- pHSC)、LT-HSC(Hoxb5+ pHSC)からなる群の1つ以上を含む、請求項1~3のいずれか一項に記載のシステム。
【請求項5】
前記細胞の画像が明視野画像である、請求項1~4のいずれか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は細胞を評価、分類、純化する装置、システムおよび方法、並びに学習済みモデルおよび学習済みモデルを生成する装置、システムおよび方法に関する。
【背景技術】
【0002】
生体中の細胞は基本的に同じ遺伝子セットを有しており、受精卵細胞という単一の細胞の分裂によって生み出されているにも関わらず、その生物学的機能は様々に異なっている。細胞は固有の生物学的機能に基づいて、一定の生物学的特性を有する細胞(群)として、他の細胞と区別されている。例えば、生体中の各組織、例えば骨髄、筋肉に見出される細胞はそれぞれ形態においても、生物学的機能においても異なっている。
【0003】
一方、生体の各種細胞は、各遺伝子から発現されるタンパク質の細胞内含量、細胞表面に露出されるタンパク質の種類、タンパク質の翻訳後修飾の状態、細胞形態等の様々な物理的特性において固有の状態を有しており、これらの物理的特性の組み合わせによって、一定の生物学的機能を有する細胞を特定することが可能である。従来、一般的に様々な生物学的機能を有する細胞を同定・純化するためには、各細胞がそれぞれその表面に発現するタンパク質等の分子を認識する蛍光標識されたモノクローナル抗体と、結合した抗体の蛍光標識の組合せに応じて細胞を分離することのできるフローサイトメーターを併用した手法(フローサイトメトリー法)が主に用いられてきた。
【0004】
フローサイトメトリー法は、個々の細胞を流体中に分散させ、その流体を微細に流下させて光学的に分析する技術であり、一般的には流路中に観察対象となる細胞等の微粒子を高速に流下しながらレーザー光を照射し、当該照射光と概ね同一の方向に生じる前方散乱光(Forward Scatter, FSC)と、照射光と直角の方向に生じる側方散乱光(Side Scatter, SSC)を検出し、細胞等の微粒子の物理的または化学的性質を推定する(非特許文献1)。観察対象の細胞等の微粒子に様々な蛍光標識を付加し、照射レーザー光によって蛍光標識を励起し、生じる蛍光を検出することで細胞等の微粒子の様々な物理的または化学的性質に関する情報を取得することができる。上記細胞等の微粒子について得られた散乱光に関する情報に基づいて個々の微粒子を分離するセルソーターをフローサイトメーターと組み合わせることにより、一定の物理的または化学的性質を有する細胞等の微粒子を高速に単離又は純化することができる(非特許文献1)。
【0005】
フローサイトメトリー法を用いて様々な生物学的機能を有する細胞を同定・純化する際には、目的細胞について既知のタンパク質発現情報を利用して細胞を同定・純化するために、各細胞がそれぞれその表面に発現するタンパク質等の分子を認識する蛍光標識されたモノクローナル抗体を複数組み合わせることが一般的である。しかしながら、当該手法は複雑であり、抗体の結合特性がフローサイトメトリーの結果に及ぼす影響を考慮する必要がある他、抗体の結合が対象細胞の生存または特性に影響を及ぼす可能性があり、また、蛍光を励起する波長の照射レーザー光も対象細胞の特性または生存に影響を及ぼすことが考えられる。したがって、より単純かつ対象細胞への影響が少ない、細胞の同定または純化方法が求められている。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Cytotechnology. 2012 Mar; 64(2): 109-130.
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記のような従来技術を踏まえ、本開示は対象細胞への影響を極力避けつつも、極めて高速に細胞を評価、分類、純化する装置、システム、方法およびプログラム、並びに学習済みモデルおよび学習済みモデルを生成する装置、システム、方法、およびプログラムを提供する。
【課題を解決するための手段】
【0008】
本開示は第1の態様において下記を提供する。
細胞の分化段階を判別するシステムであって、
細胞の画像が入力された場合に、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階を出力する学習済みモデルに、細胞の画像データを入力するデータ入力部と、
前記学習済みモデルから出力された、細胞の分化段階を出力するデータ出力部と
を有するシステム。
【0009】
また、本開示は第2の態様において下記を提供する。
細胞の分化段階を判別する情報処理装置であって、
細胞の画像が入力された場合に、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階を出力する学習済みモデルに、細胞の画像データを入力するデータ入力部と、
前記学習済みモデルから出力された、細胞の分化段階を出力するデータ出力部と
を有する情報処理装置。
【0010】
また、本開示は第3の態様において下記を提供する。
細胞の画像が入力された場合に、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階を出力する学習済みモデルに、細胞の画像データを入力し、
前記学習済みモデルから出力された、細胞の分化段階を出力する
処理をコンピュータに実行させる情報処理方法。
【0011】
また、本開示は第4の態様において下記を提供する。
細胞の画像データが入力される入力層と、
前記細胞の分化段階を出力する出力層と、
特定の分化段階に属する細胞の画像データと、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階と、の関連が学習された中間層とを備え、
特定の分化段階に属する細胞の画像データが前記入力層に入力された場合に、前記中間層による演算を経て、前記細胞の分化段階を前記出力層から出力するように
コンピュータを機能させる学習済みモデル。
【0012】
また、本開示は第5の態様において下記を提供する。
細胞の画像データと、細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階との関連が学習された学習済みモデルに、細胞の画像データが入力された場合に、前記学習済みモデルから出力された細胞の分化段階を出力する処理をコンピュータに実行させるプログラム。
【0013】
また、本開示は第6の態様において下記を提供する。
細胞の画像データと、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階と、を関連付けて記録した教師データを入力する入力手段と、
細胞の画像データが入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成する処理手段と
を有するシステム。
【0014】
また、本開示は第7の態様において下記を提供する。
細胞の画像データと、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階と、を関連付けて記録した教師データを入力する入力部と、
細胞の画像データが入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成する処理部
を有する装置。
【0015】
また、本開示は第8の態様において下記を提供する。
細胞の画像と、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階とを関連付けて記録した教師データを取得し、
細胞の画像が入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成する処理をコンピュータに実行させる学習済みモデルの生成方法。
【0016】
また、本開示は第9の態様において下記を提供する。
細胞の画像データと、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階と、を関連付けて記録した教師データを取得し、
細胞の画像データが入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成する処理をコンピュータに実行させるプログラム。
【発明の効果】
【0017】
本開示によれば、より単純かつ対象細胞への影響が少ない、細胞を評価、分類、純化する装置、システム、方法およびプログラム、並びに学習済みモデルおよび学習済みモデルを生成する装置、システム、方法およびプログラムを提供することができる。
【0018】
なお、上記効果は例示的なものであるにすぎず限定的なものではない。本開示は上記効果に加えて、または上記効果に代えて、本開示中に記載された他の効果、または当業者に自明の効果を奏する。
【図面の簡単な説明】
【0019】
図1図1は、生体組織における細胞分化系統と、本開示の細胞配置空間構造の類似性を示す模式図である。
図2図2は、本開示の細胞配置空間構造において、分化階層に応じて当該空間構造を分画する処理内容の一態様を示す模式図である。
図3図3は、本開示の細胞の分化段階を判別する情報処理システムの一態様を示す模式図である。
図4図4は、造血系細胞系列の分化階層を示す模式図である。
図5図5は、本開示の情報処理方法を実行するシステムまたは装置に含まれるコンピュータの構成の一態様を示す模式図である。
図6図6は、CLP(common lymphoid progenitor)、CMP(common myeloid progenitor)、MEP(megakaryocyte erythrocyte progenitor)、GMP(granulocyte monocyte progenitor)、Flk2+(Flk2+ multipotent progenitor)、MPPa(multipotent progenitors subset A)、MPPb(multipotent progenitors subset B)、ST-HSC(Hoxb5- pHSC)およびLT-HSC(Hoxb5+ pHSC)の位相差明視野画像データの例を示す画像である。
【発明を実施するための形態】
【0020】
以下、本開示の実施形態について説明する。以下の説明は単なる例示であり、本開示の範囲はこれらの説明に拘束されることはなく、本開示の趣旨を損なわない範囲で適宜変更し実施することができる。
【0021】
(定義)
本開示において、複数の数値の範囲が示された場合、それら複数の範囲の任意の下限値および上限値の組み合わせからなる範囲も同様に意味する。
【0022】
本開示において、「分化」とは当分野において通常用いられる意味を有し、典型的には、特殊化の程度が低い細胞が、例えば、神経細胞又は筋肉細胞などのより特殊化した細胞に変化するプロセスを意味する。「分化した」または「分化している」は、相対的な用語であり、「分化した細胞」または「分化細胞」は、それが比較されている細胞よりも発生経路のさらに先へ進み、より特殊化されていることを意味する。
【0023】
本開示において、「細胞の画像」とは、当分野において通常用いられる意味を有し、典型的には様々な種類の顕微鏡を用いて取得された細胞の画像を意味する。細胞の画像の一例として、細胞の明視野画像を用いることが好ましい。細胞の明視野画像とは、光学顕微鏡において細胞に光を照射した際に、回折されずに直進する直接光と、試料に当り回折した光とに分かれた光が、それぞれ対物レンズを通り対物レンズ後側焦点面に形成した回折像を意味する。当該細胞の明視野画像には、直接光の位相を調整して位相差を強調した位相差画像が含まれる。
本開示において、「細胞の画像データ」とは、当分野において画像を表現するために通常用いられるデータ構造を意味し、例えば、各座標におけるR、G、Bの諧調を8、12、16、24ビットの諧調で表現した画像データを利用することができる。画像データはカラー画像データもよく、グレースケールデータでもよい。
【0024】
1.本開示の細胞の分化段階を判別するシステム
本開示の細胞の分化段階を判別するシステムは、細胞の画像が入力された場合に、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階を出力する学習済みモデルに、細胞の画像データを入力するデータ入力手段と、前記学習済みモデルから出力された、細胞の分化段階を出力するデータ出力手段とを有する。
【0025】
一般に生体の各種細胞は、各遺伝子から発現されるタンパク質の細胞内含量、細胞表面に露出されるタンパク質の種類、タンパク質の翻訳後修飾の状態、細胞形態等の様々な物理的特性において固有の状態を有しており、これらの物理的特性の組み合わせによって、固有の生物学的機能を有する細胞を特定することが可能である。これらの物理的特性は公知の各種方法により一定の基準に基づいて定量化することが可能であり、したがって、一定の生物学的機能を有する各種細胞は、その定量物理的特性に関する数値データの組み合わせで特定することができる。さらに、当該定量物理的特性データの組み合わせと、生物学的特性に関する分析から得られた数値データを組み合わせることにより、より詳細に細胞を特定することができる。
【0026】
一方、細胞分化は階層性を有しており、細胞分化階層中においてより近縁の細胞は、その定量物理的特性データにおいてもより類似していると理解される。
【0027】
したがって、定量物理的特性に関する数値データおよび/または生物学的特性に関する数値データから選択される複数の数値データの類似性に基づいて細胞配置空間構造を生成することにより、分化系統上近接した位置にある細胞が近接した位置を占める細胞配置空間構造を得ることができる。そして、既知の分化マーカー等を利用することにより、当該細胞配置空間構造上の分化方向を特定することができる(図1、2)。当該細胞配置空間構造を得る方法は、本開示の発明者らによる特願2018-247567、PCT/JP2019/051270およびPCT/JP2020/025915において開示されている。
【0028】
より具体的には、このような細胞配置空間構造を生成するための物理的特性についての数値データは、公知の各種方法により取得することが可能である。例えば、当該方法として上記フローサイトメーターを用いて細胞形態や細胞表面のタンパク質の発現量を定量化する方法(FACS解析など)、次世代シークエンサー(NGS)などの装置を用いて単一細胞レベルで全ゲノムmRNA発現量を定量する方法、標識化と組み合わせてイメージングにより各種定量物理的特性を定量する方法などを用いることができるが、これらに限定されない。複数の細胞表面マーカー分子を同時に定量する場合には、市販のマーカーセット(Surface Marker Screening Panel/BDBiosciences社、LEGEND SCREENING /BIO LEGEND社など)を利用することができる。物理的特性を示す数値データとして、一細胞あたり任意の数の数値データを用いることができ、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80.90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000あるいは10000超の数値データを用いることができるがこれらに限定されない。
【0029】
また、生物学的特性についての数値データとして、公知の各種生物学的実験の結果から得られた数値データを使用することができる。
【0030】
前記物理的特性および生物学的特性についての数値データとして、特定時点における細胞集団から取得した利用することができ、また、複数時点において被検体から取得した細胞集団のデータを用いることができる。さらに、異なる被検体の同様の組織から取得したデータを混在して用いてもよい。
【0031】
一方、このような数値データから構成された細胞配置空間構造において、既知の分化マーカー等を利用して特定の分化段階の細胞が存在する領域を特定することにより、当該分化段階の細胞を特定するための物理的特性の数値データおよび/または生物学的特定の数値データの範囲の組み合わせが得られる。
【0032】
本開示のシステムでは、細胞の画像データと、物理的特性の数値データおよび/または生物学的特定の数値データの範囲の組み合わせにより特定された各分化段階の関連を学習することで生成された学習済みモデルを利用する。
本開示の学習済みモデルの学習に用いられる教師データは、各細胞について、画像データと、当該細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データを取得し、画像データと、当該数値データから特定される細胞の分化段階とを関連付けて記録することにより得られる。
【0033】
当該教師データを用いることにより、細胞の画像データが入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成することができる。当該教師データに用いるデータ数およびデータの種類は、生成する学習済みモデルの精度等に合わせて当業者が適宜選択することができる。
【0034】
当該学習済みモデルは細胞の画像データと任意の数の分化段階を関連付けることができ、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80.90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000超の分化段階と関連付けることができるがこれらに限定されない。
当該学習済みモデルを使用することにより、ヒトの目視による判断では不可能であった、細胞の画像データを利用した、細胞の分化段階の評価、同定および/または純化を行うことが可能となった。
【0035】
本開示のシステムにおいて、細胞の画像データを入力するデータ入力手段と、細胞の分化段階を出力するデータ出力手段は、同一または複数の装置により実行されてもよい。また、学習済みモデルによるデータ処理を、データ入力手段またはデータ出力手段を有する装置で行ってもよく、別の装置で行ってもよい。例えば、上記データ入力手段、データ出力手段は、学習済みモデルを実行するデータ処理手段とコンピュータをネットワーク回線で接続してもよく、システム全体としてCloudネットワーク構成を有していてもよい(図3)。
【0036】
データ入力手段は、画像取得手段および又は解析手段と連結することができる。データ出力手段は、データを画像、表、数値データおよび任意の形式のデジタルデータとして出力することができる。
【0037】
2.本開示の細胞の分化段階を判別する情報処理装置
本開示の細胞の分化段階を判別する情報処理装置は、細胞の画像が入力された場合に、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階を出力する学習済みモデルに、細胞の画像データを入力するデータ入力部と、前記学習済みモデルから出力された、細胞の分化段階を出力するデータ出力部とを有する。
【0038】
データ入力部は、画像取得装置および又は解析部と連結することができる。
データ出力部は、データを画像、表、数値データおよび任意の形式のデジタルデータとして出力することができる。
【0039】
3.本開示の細胞の分化段階を出力する処理をコンピュータに実行させる情報処理方法
本開示の細胞の分化段階を出力する処理をコンピュータに実行させる情報処理方法は、細胞の画像が入力された場合に、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階を出力する学習済みモデルに、細胞の画像データを入力し、前記学習済みモデルから出力された、細胞の分化段階を出力する処理をコンピュータに実行させる。
【0040】
4.本開示の細胞の分化段階を出力する学習済みモデル。
本開示の細胞の分化段階を出力する学習済みモデルは、細胞の画像データが入力される入力層と、前記細胞の分化段階に関する予想を出力する出力層と、特定の分化段階に属する細胞の画像データと、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階と、の関連が学習された中間層とを備え、特定の分化段階に属する細胞の画像データが前記入力層に入力された場合に、前記中間層による演算を経て、前記細胞の分化段階を前記出力層から出力するようにコンピュータを機能させる。
当該学習済みモデルは、上記学習済みモデルを生成する処理をコンピュータに実行させるプログラム等によって生成することができる。
【0041】
5.本開示の学習済みモデルを生成する処理をコンピュータに実行させるプログラム。
本開示の学習済みモデルを生成する処理をコンピュータに実行させるプログラムは、細胞の画像データと、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階と、を関連付けて記録した教師データを取得し、細胞の画像データが入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成する処理をコンピュータに実行させる。
【0042】
当該教師データは、各細胞について画像データと、細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データを取得し、画像データと、当該数値データから特定される細胞の分化段階とを関連付けて記録することにより得られる。
【0043】
当該教師データを用いることにより、細胞の画像データが入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成することができる。当該教師データに用いるデータ数およびデータの種類は、生成する学習済みモデルの精度等に合わせて当業者が適宜選択することができる。
【0044】
6.学習済みモデルを生成するシステム
本開示の学習済みモデルを生成するシステムは、細胞の画像データと、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階と、を関連付けて記録した教師データを入力する入力手段と、細胞の画像データが入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成する処理手段とを有する。
【0045】
生成されたモデルは、例えば機械学習のアルゴリズム構成と当該構成についてのパラメータのセットを表すデータとして記憶手段に記憶されてもよく、出力手段を介してシステム外に出力することもできる。
【0046】
本開示のシステムにおいて、入力手段と処理手段は、同一または異なる装置で行うことができる。例えば、入力手段と処理手段をネットワーク回線で接続してもよく、システム全体としてCloudネットワーク構成を有していてもよい。
【0047】
データ入力手段は、画像取得手段および又は解析手段と連結することができる。データ出力手段は、データを画像、表、数値データおよび任意の形式のデジタルデータとして出力することができる。
【0048】
7.学習済みモデルを生成する装置
本開示の学習済みモデルを生成する装置は、細胞の画像データと、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階と、を関連付けて記録した教師データを入力する入力部と、細胞の画像データが入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成する処理部を有する。
【0049】
上記データ入力部は、画像取得装置および又は解析部と連結することができる。データ出力部は、データを画像、表、数値データおよび任意の形式のデジタルデータとして出力することができる。
【0050】
8.本開示の学習済みモデルの生成方法
本開示の細胞の学習済みモデルの生成方法は、細胞の画像と、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階とを関連付けて記録した教師データを取得し、細胞の画像が入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成する処理をコンピュータに実行させる。
生成された学習済みモデルは、例えば機械学習のアルゴリズム構成と当該構成についてのパラメータのセットを表すデータとして、ハードディスクやソリッドステートドライブなどの一般的な情報記憶媒体に保存することができる。
【0051】
9.本開示の学習済みモデルを生成するプログラム
本開示の細胞の学習済みモデルの生成方法は、細胞の画像と、前記細胞の物理的特性を示す数値データおよび細胞の生物学的機能を示す数値データから選択される複数の数値データの組み合わせから特定される各分化段階とを関連付けて記録した教師データを取得し、細胞の画像が入力された場合に、前記細胞の分化段階を出力する学習済みモデルを生成する処理をコンピュータに実行させる。
生成された学習済みモデルは、例えば機械学習のアルゴリズム構成と当該構成についてのパラメータのセットを表すデータとして、ハードディスクやソリッドステートドライブなどの一般的な情報記憶媒体に保存することができる。
【0052】
(細胞の分化段階)
本開示の上記各方法、プログラムまたは装置において、「細胞の分化段階」として、任意の細胞系列における任意の数の分化段階を選択することができる。例えば、神経系の細胞系列、造血系の細胞系列などの健康体における細胞系列のほか、がん細胞が形成する細胞系列を選択することができる。細胞の分化段階として、幹細胞、複数種の前駆細胞および複数種の成熟細胞の一つまたは複数を含む階層を選ぶことができる。好ましくは、幹細胞および複数種の前駆細胞を含む階層が選択され、例えば造血系の細胞系列を選択した場合、分化段階としてCLP(common lymphoid progenitor)、CMP(common myeloid progenitor)、MEP(megakaryocyte erythrocyte progenitor)、GMP(granulocyte monocyte progenitor)、Flk2+(Flk2+ multipotent progenitor)、MPPa(multipotent progenitors subset A)、MPPb(multipotent progenitors subset B)、ST-HSC(Hoxb5- pHSC)およびLT-HSC(Hoxb5+ pHSC)から選択される分化段階の1つ以上を選択することができるが、これに限定されない(図4)。
【0053】
(細胞の画像データ)
本開示の各方法、プログラムまたは装置において、「細胞の画像データ」として、通常の光学顕微鏡によって取得される画像データを使用することができる。当該画像データとして、位相差画像を使用することが好ましい。画像データの形式としては任意の形式を利用することができ、例えば各ピクセル16ビットのグレースケール画像を使用することができる。
「細胞の画像データ」は、本開示の方法、プログラムまたは装置に使用する前に、当分野において一般的な方法により、強調、サイズ変更、ノイズ軽減などの処理を行うことができる。
【0054】
(機械学習)
本開示の各方法、プログラムまたは装置において、「機械学習」として、当業者に知られた様々な学習アルゴリズムを使用することができる。好ましくは、Resnet構成を有する人工ニューラルネットワークを利用するがこれに限定されない。
【0055】
(情報処理方法を実行するコンピュータ)
本開示のシステムもしくは装置に含まれるコンピュータ、または本開示の情報処理方法もしくは学習済みモデル生成方法を実行するコンピュータの構成は、当分野において一般的に使用される構成を有することができる。図5にその例を示すが、当該構成は例示に過ぎず、本開示の情報処理方法に使用するコンピュータまたは装置に含まれるコンピュータは、ここに示される構成要素の全てを備える必要はなく、一部を省略した構成をとることも可能であるし、また、他の構成要素を加えることも可能である。
【0056】
図5に示したコンピュータ100は、CPU等から構成されるプロセッサ101、RAM、ROM、および/またはフラッシュメモリを含むメモリ102、I/O制御回路103、HDDまたはSSD等で構成される主記憶装置104含み、これらの各構成要素が制御ライン及びデータラインを介して互いに電気的に接続される。I/O制御回路103はさらに、コンピュータ外部の根ネットワーク回線105、キーボード、マウス、ディスプレイなどの入力/出力デバイス106、フローサイトメーター、セルソーターなどの分析デバイス107と同様に接続される。
【0057】
図5に示したコンピュータ100において、本開示の情報処理方法を規定するプログラムコードは、主記憶装置104に記憶されている。当該プログラムコードは、I/O制御回路103を通じてプロセッサ101に読み込まれ実行される。メモリ102は、プログラムが実行される間、データの書き込み及び読み込みを実行するために一時的に用いられる。
なお、プロセッサ101は、単一または複数のCPUで構成され得る。
【0058】
I/O制御回路103に接続したネットワーク回路は、有線または無線ネットワークであり、プログラムの実行に必要なデータの送受信等に使用される。I/O制御回路103に接続した入出力デバイス106は、プログラムの実行にあたってヒトがコンピュータを操作する際に使用するマウス、キーボードなどの入力デバイス、および/または、LCDディスプレイ、スピーカなどの、コンピュータの処理結果をヒトに認識させるための出力デバイスによって構成される。I/O制御回路103に接続した分析デバイス107は、フローサイトメーターや光学顕微鏡等のデバイスによって構成され、物理学的特性データや画像の取得に使用される。
【0059】
本開示の一態様において、上記入出力デバイス106は、画像データを入力するためのインターフェイス、または分類結果を表示する画像表示部を有する。
【実施例0060】
細胞の画像を利用した血液系細胞の分化段階の評価
【0061】
(1-1)細胞の採取
長期造血幹細胞特異的レポーターマウス(ゲノム上のHoxb5遺伝子を3コピーのmcherry蛍光タンパク質をコードする遺伝子と融合したHoxb5遺伝子と置換したマウス;nature、2016年、Vol.530,pp.223-227)骨髄より、骨髄細胞を採取した。
【0062】
(1-2)細胞の物理的特性に関する数値データの取得
市販のマーカーセットを利用してフローサイトメーターにより、各細胞のmcherry蛍光タンパク質の蛍光強度を含む、物理的特性に関する数値データを取得した。
当該得られた物理的特性に関する数値データの近似度に基づいて、細胞配置空間構造を生成し、Hoxb5の蛍光強度データ等、各分化段階に特異的に発言することの知られたマーカーのデータを利用して、細胞配置空間構造においてCLP(common lymphoid progenitor)、CMP(common myeloid progenitor)、MEP(megakaryocyte erythrocyte progenitor)、GMP(granulocyte monocyte progenitor)、Flk2+(Flk2+ multipotent progenitor)、MPPa(multipotent progenitors subset A)、MPPb(multipotent progenitors subset B)、ST-HSC(Hoxb5- pHSC)、LT-HSC(Hoxb5+ pHSC)の9分化段階に対応する領域を画分し、各領域に含まれる細胞の分化段階を特定した。これら9分化段階の分化系統上の関係の概略を図4に示す(Wiley Interdiscip Rev Syst Biol Med.,2010,Vol.2,no.6,pp.640-53;Nature,2016,Vol.530,no.7589,pp.223-227; Stem Cell Reports,2014,Vol.3,no.5,pp.707-715)。
各分化段階の細胞を定義するマーカーの組み合わせを下記に示す。
【0063】
(1-3)細胞の画像の取得
上記物理的特性に関する数値データの取得するためのフローサイトメーターとオンラインに接続された光学顕微鏡(BZ-X810、KEYENCE社)を用いて、1細胞あたり1回の撮像を行い、各24ビットの諧調を有する252x244ピクセルからなる位相差明視野画像データを得た。
【0064】
(1-4)教師データの作成
得られた細胞の画像の70%から30%を、訓練データと試験データとに無作為に分割し、訓練データに選択した細胞の画像データと当該細胞の分化段階を関連付けた教師データを作成した。各分画に属する細胞の明視野画像の例を図6に示す。これらの細胞の位相差明視野画像は類似しており、目視によりこれらの細胞の分化段階を特定することは不可能である。
【0065】
(1-5)細胞の画像と分化段階の関連についての機械学習および学習済みモデルの評価
作成した教師データを用いて、標準的なResnet構成を有するニューラルネットワークとMixup強調処理を利用して機械学習を行った。
得られた学習済みモデルを用いて細胞の画像試験データを前記9分化段階に分類したところ、95.2%という驚くべき高さの分類精度(正しく分類された画像データ数/全画像データ数)が得られた。
【0066】
(1-6)様々な分化段階による学習結果
上記と同様の機械学習を、前記9分化段階以外の様々な分化段階の組み合わせについて、細胞の画像データと細胞の分化段階の関連付けの機械学習を行い、得られた学習済みモデルの精度を確認した。その結果、下記表に示すとおり、広範囲の組み合わせにおいて極めて高い分類精度が得られた。
本結果は、本開示の学習済みモデルを使用するシステム、装置および方法、並びに当該学習済みモデルを作成するシステム、装置、および方法が、さまざまな分化段階の細胞を分類するために適用し得ることを示している。
【産業上の利用可能性】
【0067】
本開示の学習済みモデルを使用するシステム、装置および方法、並びに当該学習済みモデルを作成するシステム、装置および方法は、分類対象とする細胞の生存、特性に影響を与えることなく、またはこれを大幅に軽減し、非侵襲的に細胞の分類を行うことを可能とする。本開示の学習済みモデルを使用するシステム、装置および方法並びに当該学習済みモデルを作成するシステム、装置および方法は、生体から採取した細胞の評価、分類、純化、または生体外で培養される細胞の品質管理などに幅広い分野において有益な技術を提供する。
図1
図2
図3
図4
図5
図6