(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6284988
(24)【登録日】2018年2月9日
(45)【発行日】2018年2月28日
(54)【発明の名称】細胞内反応シミュレーション装置及び方法
(51)【国際特許分類】
G06F 19/12 20110101AFI20180215BHJP
【FI】
G06F19/12
【請求項の数】16
【全頁数】10
(21)【出願番号】特願2016-159152(P2016-159152)
(22)【出願日】2016年8月15日
(65)【公開番号】特開2017-54499(P2017-54499A)
(43)【公開日】2017年3月16日
【審査請求日】2016年8月15日
(31)【優先権主張番号】10-2015-0129167
(32)【優先日】2015年9月11日
(33)【優先権主張国】KR
(73)【特許権者】
【識別番号】516171207
【氏名又は名称】コリア インスティテュート オブ サイエンス アンド テクノロジー インフォメーション
(74)【代理人】
【識別番号】230104019
【弁護士】
【氏名又は名称】大野 聖二
(74)【代理人】
【識別番号】100109841
【弁理士】
【氏名又は名称】堅田 健史
(72)【発明者】
【氏名】ユ,ソク ジョン
【審査官】
田付 徳雄
(56)【参考文献】
【文献】
特開2005−229805(JP,A)
【文献】
特開2007−047994(JP,A)
【文献】
特開2004−129626(JP,A)
【文献】
特表2004−533037(JP,A)
【文献】
山口 類,State space model approach to analyse cDNA microarray time course data of yeast,情報処理学会研究報告,日本,社団法人情報処理学会,2005年12月22日,第2005巻第128号,第67-73頁,ISSN:0919-6072
(58)【調査した分野】(Int.Cl.,DB名)
G06F 19/10 − 19/28
(57)【特許請求の範囲】
【請求項1】
細胞内反応シミュレーション装置であって、
細胞モデルを生成するための細胞に関連した情報を含むデータベースと、
前記データベースから前記細胞に関連した情報を受け取って細胞モデルを生成するモデル生成モジュールと、
前記データベースから前記細胞に関連した情報を受け取って、タンパク質定量化のための数値モデルを構成する発現体モジュールと、
前記形成された細胞モデル内の細胞反応を少なくとも1つのコンピュータに割り当ててシミュレーションするシミュレーションモジュールとを備えてなり、
前記数値モデルは、個別タンパク質の発現情報を時系列で定量化するものであり、
前記発現体モジュールは、前記個別タンパク質の発現情報に基づいて時系列で前記個別タンパク質の発現量を測定し、前記測定された個別タンパク質の発現量に基づいて時系列で必要な個別タンパク質の生成量を計算し、及び前記計算された必要な個別タンパク質の生成量に基づいて、生成された個別タンパク質を実時間でシミュレーションモジュールに入力するものであり、
前記生成された個別タンパク質は、プロテアーゼによってタンパク質が消滅する反応条件を含むものであることを特徴とする、細胞内反応シミュレーション装置。
【請求項2】
前記シミュレーションを行う少なくとも1つのコンピュータが分析したシミュレーション結果情報を保存する分析結果保存モジュールと、
前記分析結果保存モジュールから前記シミュレーション結果情報をローディングして3次元細胞空間に表示する可視化モジュールとをさらに備えてなる、請求項1に記載の細胞内反応シミュレーション装置。
【請求項3】
前記データベースが、
生命体をなしている構成物質に関する情報を含むオミックスデータベースと、
生命体の細胞構造に関する情報を含む細胞骨格データベースと、
細胞内の反応に関する反応式情報を含む細胞反応データベースとを備えることを特徴とする、請求項1又は2に記載の細胞内反応シミュレーション装置。
【請求項4】
前記数値モデルが、マイクロアレイ又はRNA−seq実験によって得られる個別タンパク質を時間によって定量化することを特徴とする、請求項1〜3の何れか一項に記載の細胞内反応シミュレーション装置。
【請求項5】
前記シミュレーションモジュールが、細胞内空間をキューブ状の3次元格子空間に分離した後、前記格子空間を前記少なくとも1つのコンピュータに個別的に割り当てて分析することを特徴とする、請求項1〜4の何れか一項に記載の細胞内反応シミュレーション装置。
【請求項6】
前記シミュレーションモジュールが、実際細胞内における反応と類似に具現するために、前記発現体モジュールで生成されるタンパク質の情報に基づいて持続して細胞空間内に前記タンパク質を生成し消滅させながらシミュレーションすることを特徴とする、請求項1〜5の何れか一項に記載の細胞内反応シミュレーション装置。
【請求項7】
細胞内反応シミュレーション方法であって、
細胞モデルを生成するための細胞に関連した情報をデータベースから受け取るステップと、
前記データベースから前記細胞に関連した情報を受け取って細胞モデルを生成するステップと、
前記データベースから前記細胞に関連した情報を受け取って、タンパク質定量化のための数値モデルを構成するステップと、
前記数値モデルは、個別タンパク質の発現情報を時系列で定量化するものであり、
前記個別タンパク質の発現情報に基づいて、時系列で前記個別タンパク質の発現量を測定し、前記測定された個別タンパク質の発現量に基づいて、時系列で必要な個別タンパク質の生成量を計算し、及び、前記計算された必要な個別タンパク質の生成量に基づいて、生成された個別タンパク質を実時間でシミュレーションモジュールに入力するステップと、
前記生成された個別タンパク質は、プロテアーゼによってタンパク質が消滅する反応条件を含むものであり、
前記形成された細胞モデル内の細胞反応を少なくとも1つのコンピュータに割り当ててシミュレーションするステップとを含んでなることを特徴とする、細胞内反応シミュレーション方法。
【請求項8】
前記シミュレーションを行う少なくとも1つのコンピュータが分析したシミュレーション結果情報を保存するステップと、
前記保存されたシミュレーション結果情報をローディングして3次元細胞空間に表示するステップとをさらに備えてなる、請求項7に記載の細胞内反応シミュレーション方法。
【請求項9】
前記データベースが、
生命体をなしている構成物質に関する情報を含むオミックスデータベースと、
生命体の細胞構造に関する情報を含む細胞骨格データベースと、
細胞内の反応に関する反応式情報を含む細胞反応データベースとを備えることを特徴とする、請求項7又は8に記載の細胞内反応シミュレーション方法。
【請求項10】
前記数値モデルは、マイクロアレイ又はRNA−seq実験によって得られる個別タンパク質を時間によって定量化することを特徴とする、請求項7〜9の何れか一項に記載の細胞内反応シミュレーション方法。
【請求項11】
前記シミュレーションするステップが、細胞内空間をキューブ状の3次元格子空間に分離した後、前記格子空間を前記少なくとも1つのコンピュータに個別的に割り当てて分析することを特徴とする、請求項7〜10の何れか一項に記載の細胞内反応シミュレーション方法。
【請求項12】
前記シミュレーションするステップが、実際細胞内における反応と類似に具現するために、発現体モジュールで生成されるタンパク質の情報に基づいて持続して細胞空間内に前記タンパク質を生成し消滅させながらシミュレーションすることを特徴とする、請求項7〜11の何れか一項に記載の細胞内反応シミュレーション方法。
【請求項13】
細胞内反応シミュレーションプログラムを格納した格納媒体であって、
細胞モデルを生成するための細胞に関連した情報をデータベースから受け取り、
前記データベースから前記細胞に関連した情報を受け取って細胞モデルを生成し、
前記データベースから前記細胞に関連した情報を受け取ってタンパク質定量化のための数値モデルを構成し、
前記数値モデルは、個別タンパク質の発現情報を時系列で定量化するものであり、
前記個別タンパク質の発現情報に基づいて、時系列で前記個別タンパク質の発現量を測定し、前記測定された個別タンパク質の発現量に基づいて、時系列で必要な個別タンパク質の生成量を計算し、及び、前記計算された必要な個別タンパク質の生成量に基づいて、生成された個別タンパク質を実時間でシミュレーションモジュールに入力し、
前記生成された個別タンパク質は、プロテアーゼによってタンパク質が消滅する反応条件を含むものであり、
前記形成された細胞モデル内の細胞反応を少なくとも1つのコンピュータに割り当ててシミュレーションし、
前記シミュレーションが前記定量化されたタンパク質を受け取ってシミュレーションすることを特徴とする、細胞内反応シミュレーションプログラムを格納した格納媒体。
【請求項14】
前記数値モデルが、マイクロアレイ又はRNA−seq実験によって得られる個別タンパク質を時間によって定量化することを特徴とする、請求項13に記載の細胞内反応シミュレーションプログラムを格納した格納媒体。
【請求項15】
前記シミュレーションモジュールが、細胞内空間をキューブ状の3次元格子空間に分離した後、前記格子空間を前記少なくとも1つのコンピュータに個別的に割り当てて分析することを特徴とする、請求項13又は14に記載の細胞内反応シミュレーションプログラムを格納した格納媒体。
【請求項16】
前記シミュレーションモジュールが、実際細胞内における反応と類似に具現するために、発現体モジュールで生成されるタンパク質の情報に基づいて持続して細胞空間内に前記タンパク質を生成し消滅させながらシミュレーションすることを特徴とする、請求項13〜15の何れか一項に記載の細胞内反応シミュレーションプログラムを格納する格納媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、様々な細胞内反応を遺伝子発現情報などを用いて3次元でシミュレーションすることができる装置及び方法に関する。
【背景技術】
【0002】
システム生物学の研究が活発に行われつつ、細胞内のイオン、タンパク質などの、生体を構成する化学物質の情報が蓄積されている。近年、細胞内の化学物質の代謝反応、信号伝達反応などの様々な反応を分析可能なツールが開発されることにより、細胞モデリングに対する重要性が台頭している。特に、BioModels(https://www.ebi.ac.uk/biomodels−main/)では、最近にキュレーションされたバイオモデルが約577個、キュレーションされる前段階のバイオモデルが約722個と報告されており、その数字は増加の一途にある。
【0003】
生物学モデルを数学的に予測可能に分析できるようになったのは、バイオモデルをシミュレーションできるツール又はプログラムが開発されたためである。初期研究において、バイオモデルの分析は主として代謝経路に対する分析であり、これは、常微分方程式(Ordinary differential equation)の解を求めるGepasi、Copasiなどのツールに基づいて行われた。
【0004】
しかしながら、細胞内の大部分の主要反応は、信号伝達過程(Signal transduction pathway)によって一層複雑な調節機作を理解しなければならず、前述した方法、研究又はツールによる分析には限界があった。そこで、VCellなどをはじめとする細胞の信号伝達をシミュレーションできるツールが開発された。また、常微分方程式を解く既存のツールとは違い、実際細胞の3次元空間を対象に実際細胞内の反応をシミュレーションできるMCellが開発されており、最近に開発されたCellBlenderは、生物モデルの設計、編集及び可視化を支援している。また、最近に開発されたSmoldynは細胞の3次元空間をモデリングし、細胞内の分子をブラウン運動によって拡散させながら、確率的にそれぞれの物質が結合して反応するかを、確率モデルとしてシミュレーションすることができる。
【0005】
しかしながら、上述したシミュレーションツール又は方法は、初期条件及び反応式に基づいて化学反応を起こして特定時間までの反応の様相を測定する断片的なシミュレーションしかできず、細胞内実際に発生するタンパク質の生成と消滅による細胞のライフサイクルにわたるシミュレーションはできないという短所があり、また、細胞小器官及び細胞質間の物質移動及び生化学反応を精密に分析し難い。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、上記のような問題点を解決するためのものであり、短時間の細胞内反応ではなく細胞のライフサイクルに対する細胞内反応を、遺伝子発現情報などを用いて3次元でシミュレーションできる装置及び方法に関する。
【課題を解決するための手段】
【0007】
上記目的を達成するための、本発明の第一の側面によれば、本発明に係る細胞内反応シミュレーション装置、細胞の3次元モデルを生成するための細胞に関連した情報を含むデータベースと、前記データベースから前記細胞に関連した情報を受け取って細胞モデルを生成するモデル生成モジュールと、前記データベースから前記細胞に関連した情報を受け取って、タンパク質定量化のための数値モデルを構成する発現体モジュールと、前記形成された細胞モデル内の細胞反応を少なくとも1つのコンピュータに割り当ててシミュレーションするシミュレーションモジュールとを備える。
【0008】
また、本発明の第2側面によれば、本発明に係る細胞内反応シミュレーション方法は、細胞モデルを生成するための細胞に関連した細胞の3次元構造情報をデータベースから受け取るステップと、前記データベースから前記細胞に関連した生化学反応情報を受け取って細胞モデルを生成するステップと、前記データベースから前記細胞に関連した情報を受け取って、タンパク質定量化のための数値モデルを構成するステップと、前記形成された細胞モデル内の細胞反応を長時間にわたってシミュレーションするために少なくとも1つのコンピュータに割り当てて分散シミュレーションするステップとを有する。
【発明の効果】
【0009】
本発明の一実施例に係る細胞内反応をシミュレーションする装置及び方法によれば、タンパク質発現情報に基づいて長時間に細胞のライフサイクルに対する細胞内の様々な反応に対してシミュレーションが可能である。
【0010】
また、本発明の一実施例に係る細胞内反応をシミュレーションする装置及び方法は、細胞間の機能分析及び細胞内の信号伝達反応間の相関関係を分析する上で重要な技術として活用することができる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、本発明の一実施例に係る細胞内反応シミュレーション過程を説明するためのモジュール構成図である。
【
図2】
図2は、本発明の一実施例に係る細胞内反応シミュレーション装置を説明するための図である。
【
図3】
図3は、本発明の一実施例に係る細胞内反応シミュレーション方法を説明するためのフローチャートである。
【発明を実施するための形態】
【0012】
本発明の一実施例を、添付の図面を参照して詳しく説明する。また、本発明を説明するにあたり、関連する公知構成又は機能に関する具体的な説明が本発明の要旨をあいまいにさせ得ると判断される場合には、その詳細な説明を省略する。
【0013】
図1は、本発明の一実施例に係る細胞内反応シミュレーション過程を説明するための図である。
【0014】
図1を参照すると、本発明に係る細胞内反応シミュレーション装置は、データベース100、モデル生成部110、発現体部120、シミュレーション部130を備えることができる。以下、各ブロックについて説明する。
【0015】
データベース100は、細胞モデルを生成するための遺伝体情報、遺伝体情報に関連したタンパク質情報、細胞構造情報、細胞内生化学反応情報などを含むことができる。モデル生成部110は、データベースから細胞モデルを生成するための情報を受け取り、細胞内反応を分析してシミュレーションするための細胞の3次元モデルを生成することができる。発現体部120は、タンパク質生成に対する数値モデルを構成するための遺伝子の細胞内発現情報を提供することができる。シミュレーション部130は、3次元細胞モデルに対する生命現象を摸写する機能として、分散環境でシミュレーションを行うことができる。すなわち、シミュレーション部130は、分析しようとする細胞内の反応をN個のコンピュータに割り当ててシミュレーションを行うことができる。分散分析のために、細胞内の小器官に対してシミュレーションを行うM個のコンピュ−ティングノードを割り当て、細胞質と小器官との境界の物質移動は、コンピュ−ティングノード間の情報交換によって行う。
【0016】
図2は、本発明の一実施例に係る細胞内反応シミュレーション装置を説明するためのモジュール構成図である。
【0017】
図2を参照すると、本発明に係る細胞内反応シミュレーション過程において、前述したデータベースは100は、オミックスデータベース200、細胞骨格データベース210、細胞内生化学反応データベース220を備えることができる。オミックスデータベース200は、生命体の遺伝体情報、遺伝体情報から生産されるタンパク質情報、及び細胞内の様々なペプチド、脂質体、炭水化物、イオンなど、生命体をなしている全般的な構成物質に関する情報を含むことができる。細胞骨格データベース210は、生体を構成する細胞構造に関する情報を含むことができる。具体的には、細胞を構成する核、ミトコンドリア、小包体などの、細胞内の小器官の立体的構造情報も含むことができる。細胞反応データベース220は、現在まで知られた様々な細胞内の反応経路、細胞内の反応に対する反応式などを含むことができる。
【0018】
モデル生成モジュール230は、モデル生成部110の機能を果たすことができ、オミックススデータベース200から生命体の構成物質に関する情報、細胞骨格データベース210から細胞構造に関する情報、細胞反応データベース220からモデル生成に必要な少なくとも1つの生化学反応に関する情報を受信して細胞モデルを生成し、これをシミュレーションの初期環境として設定することができる。具体的に、細胞モデルを生成するための細胞に関連した細胞の3次元構造情報をデータベースから受け取り、前述したデータベースから細胞に関連した生化学反応情報を受け取って、細胞モデルを生成することができる。発現体モジュール240は、発現体部120の機能を果たし、タンパク質生成のための数値モデルを構成してシミュレーションモジュール250に提供することができる。数値モデルは、個別タンパク質の発現情報を時系列で定量化することを意味する。具体的に、前述した数値モデルは、マイクロアレイ又はRNA−seq実験又は質量分析機を用いた蛋白体情報から得られる個別タンパク質の発現情報を時間によって定量化することを意味する。そのために、発現体モジュールは、前述したデータベース100から情報を受信し、前述した実験によって時間によってタンパク質の発現量を測定し、時間によって(時系列で)必要なタンパク質生成量を計算して定量化することができる。定量化された情報は、遺伝子からタンパク質として生成される化学反応式の情報に変換されてシミュレーションに活用される。また、前述した発現体モジュールは実時間で、前述の定量化されたタンパク質量をシミュレーションモジュール250に伝達してシミュレーションに反映することができる。
【0019】
また、発現体モジュール240は、生体内の現象と類似にさせるために、タンパク質生成空間を核の周囲又はリボソームと決定することができる。また、前述した発現体モジュール240で生成された個別タンパク質客体には反応条件を含めることができる。前述した反応条件の具体的な例としてプロテアーゼ(protease)があり、これは、細胞内の特定タンパク質に出会うとそのタンパク質を分解する役割を担い、最終的には、遺伝子から生成されたタンパク質個体を細胞内の3次元空間から消えるようにする機能を有する。このような過程によってタンパク質の生成と消滅が動的に具現され、実際細胞と類似な条件のシミュレーションを具現することができる。発現体モジュールは、個別タンパク質の発現情報に基づいて時系列で個別タンパク質の発現量を測定することができる。発現体モジュールは、測定された発現量に基づいて時系列で必要な個別タンパク質生成量を計算し、計算された生成量に基づいて、生成された個別タンパク質を実時間でシミュレーションモジュールに入力することができる。生成された個別タンパク質はプロテアーゼによってタンパク質が消滅する反応条件を含むことができる。
【0020】
シミュレーションモジュール250は、シミュレーション部130の機能を果たすことができる。具体的に、シミュレーションモジュール250は、大規模で長時間にわたるシミュレーションを具現するために、分散環境のシミュレーションを行うことができる。分散環境のシミュレーションとは、シミュレーションするコンピュータ計算を複数のコンピュータに分散して行うことをいう。細胞内反応は、細胞内のそれぞれの構成物質が衝突する時に発生する粒子基盤シミュレーション(Particle−based simulation)により、既存の化学反応式に基づく常微分方程式を解く数値モデルに比べて、実際細胞内の生化学反応と類似な特徴を示す。これを具現するために、細胞の3次元空間をキューブ状の3次元格子構造に区分して細胞空間を生成する。シミュレーションモジュール250は、上記キューブ状の3次元格子空間をそれぞれのコンピュ−ティングノードに割り当てて分析することができる。シミュレーションモジュール250は、分析しようとするN個の細胞内のキューブ空間をクラスターコンピュータのノードに割り当て、シミュレーションしようとする初期細胞モデルに関する情報に基づいて、3次元空間にタンパク質を生成することができる。生成されたタンパク質はブラウン運動によって細胞空間を移動し、他のタンパク質又は物質に出会って、所望の条件が満たすと生化学反応を誘発する。また、個別コンピュータに割り当てられた細胞内の3次元格子空間を外れるタンパク質、化合物などのような構成物質がある場合、シミュレーションモジュール250は、細胞内3次元格子空間を担当する計算ノードの格子空間を外れる該当の物質(タンパク質、化合物など)を、担当シミュレーションを行うコンピュ−ティングノードに伝送し、持続してシミュレーションが行われるようにすることができる。また、細胞小器官で生成される構成物質の場合、シミュレーションモジュール250は、前述したデータベース100における該当の構成物質の初期位置情報を用いて3次元細胞空間内で生成位置を設定することができる。具体的な例として、シミュレーションモジュール250は、膜タンパク質の場合、細胞内膜構造内でのみ移動できるように制限しながらシミュレーションを行うことができる。また、シミュレーションモジュール250は、実際細胞内における反応と類似に具現するために、発現体モジュール240で生成される個別タンパク質客体の情報を用いて持続して3次元細胞空間内にタンパク質個体を生成し消滅させながらシミュレーションすることができる。また、シミュレーションモジュール250は、それぞれのタンパク質客体が細胞空間をブラウン運動によって移動しながらぶつかる物質との生化学反応をシミュレーションすることができる。
【0021】
分析結果保存モジュール260は、シミュレーションを行うそれぞれのコンピュータが分析する細胞内3次元位置空間座標内の各物質の時間別移動経路に関する情報を保存することができる。また、分析結果保存モジュール260は、特に、2個以上の物質がぶつかって生化学反応が起こると決定された場合、新しく生成或いは消滅される物質に関する情報を保存することができる。物質が新しく生成された場合には、分析結果保存モジュール260は、これに関する客体情報を保存することができ、その後、他の客体と同様に、位置情報の記録と生化学反応の追跡を可能にさせてもよい。シミュレーションは持続して進行されるため、前述した保存されたファイルは実時間で保存用マスターノードに伝達され、全体細胞空間内の客体情報は一つのファイルとして管理されてもよい。
【0022】
可視化モジュール270は、3次元細胞空間及び細胞内小器官に対する構造的空間可視化と、細胞空間内に存在するタンパク質をはじめとする様々な細胞内化合物に対する位置情報の可視化とを行うことができる。可視化モジュール270は、時系列でシミュレーションされた細胞内客体位置情報を分析結果保存モジュール260から読み込んで3次元細胞空間に表示することができる。可視化モジュール270は、時間による細胞内の客体(タンパク質、化合物など)の移動と化学反応を視覚化するためにそれぞれの客体移動を可視化し、直観的に細胞内の位置分布及び反応状況を視覚的に認識できるようにする。
【0023】
図3は、本発明の一実施例に係る細胞内反応シミュレーション方法を説明するためのフローチャートである。
【0024】
図3を参照すると、本発明によって細胞内反応シミュレーション方法は、細胞モデルを生成するための細胞に関連した情報をデータベースから受け取る段階(S300)、データベースから細胞に関連した情報を受け取って細胞モデルを生成する段階(S310)、データベースから細胞に関連した情報を受け取って、タンパク質定量化のための数値モデルを構成する段階(S320)、形成された細胞モデル内の細胞反応を、少なくとも1つのコンピュータに割り当ててシミュレーションする段階(S330)と、を有する。
【0025】
データベース100は、細胞モデルを生成するための細胞に関連した情報をデータベースから受け取る段階(S300)を行うことができる。これに関する具体的な説明は、
図2で前述したとおりである。モデル生成モジュール230は、データベースから細胞に関連した情報を受け取って細胞モデルを生成する段階(S310)を行うことができる。これに関する具体的な説明は、
図2で前述したとおりである。発現体モジュール240は、データベースから細胞に関連した情報を受け取って、タンパク質定量化のための数値モデルを構成する段階(S320)を行うことができる。これに関する具体的な説明は、
図2で前述したとおりである。シミュレーションモジュール250は、形成された細胞モデル内の細胞反応を少なくとも1つのコンピュータに割り当ててシミュレーションする段階(S330)を行うことができる。これに関する具体的な説明は、
図2で前述したとおりである。
【符号の説明】
【0026】
100: データベース
110: モデル生成部
120: 発現体部
130: シミュレーション部
【0027】
200: オミックスDB
210: 細胞骨格DB
220: 細胞反応DB
230: モデル生成モジュール
240: 発現体モジュール
250: シミュレーションモジュール
260: 分析結果保存モジュール
270: 可視化モジュール
【0028】
S300: 細胞モデルを生成するための細胞に関連した情報を受け取る段階
S310: データベースから細胞に関連した情報を受け取って細胞モデルを生成する段階
S320: データベースから細胞に関連した情報を受け取って、タンパク質定量化のための数値モデルを構成する段階
S330: 形成された細胞モデル内の細胞反応を少なくとも1つのコンピュータに割り当ててシミュレーションする段階