【発明が解決しようとする課題】
【0007】
非特許文献1のような方法の問題点は、実際には細胞集団は3次元の構造を持ち2次元で射影した画像データ中では複数の細胞が重なっている領域が多数あるが、そのクロストークを考慮していないことである。
【0008】
また、非特許文献2の方法は、現実の大容量データを処理するには多くの問題点が存在する。
【0009】
以下に、非特許文献2に開示されている既存処理の内容とその問題点について図面を参照しながら説明を行う。
(既存処理)
図4は、非特許文献2に示される既存処理を行う情報処理装置の一構成例を示す機能ブロック図であり、
図5は、非特許文献2に示される既存処理の流れを示すフローチャート図である。まず、ステップS101で情報処理を開始すると、ステップS102で、データ読み込み部101が、データの読み込みを行う。読み込むデータとして、位置(x,y)における時刻tでの蛍光強度f(t,x,y)がデータとして与えられる。ただし、t,x,yはそれぞれT,X,Y以下の自然数で、サンプリングレートおよび空間解像度から決まるスケールになっているとする。蛍光強度fは相対的な値であるため、何らかのベースラインを規定する必要がある。
【0010】
【0011】
【数1】
【0012】
時間軸に対するカルシウム濃度はスパイク(
図3参照)によりデルタ関数的に増加し、その後、減衰する。u
c(0)=v
c(0)よりu
c,v
cは一方の時系列からもう一方が線形変換で導出可能である。
【0013】
【数2】
【0014】
【0015】
【数3】
【0016】
【0017】
【数4】
【0018】
ベースラインは平均あるいはmedianで初期設定する。
【0019】
【数5】
v
c(t)=0として、式(4)よりσ
2を設定する。
【0020】
但し、細胞の個数Cおよび細胞の形状a
c(x,y)の求め方は規定されておらず、これらの初期条件を得る何らかの手順を別途設定する必要があるが、解が適切に収束するためには初期条件が解に十分近い必要がある。
【0021】
次いで、ステップS104において、カルシウム濃度/スパイク時系列演算部105が、カルシウム濃度vおよびスパイク時系列uを求める。上記の式(1),(2),(3)において、a
c,a
baselineおよびパラメータσ,λ
cを固定して、u,vに関するMAP(事後分布最大化)推定を行うと、式(2)の条件下で次の二次計画問題を解くことになる。このとき、ベースラインが固定されており、かつ非負拘束条件が設定されているため、固定されたベースラインの影響を強く受け系全体としての適切な解が得られない。
【0022】
【数6】
【0023】
Log障壁法とニュートン法を用いてこの最小化問題を解く。C=1ならば3重対角行列になり比較的容易に解けるが、C>1では3重ブロック対角行列を考える必要があり、精度よく解くことは困難である。
【0024】
次いで、ステップS105において、正規化部107が、各細胞候補のスパイク時系列と細胞形状を正規化する処理を行う。
【0025】
各細胞の信号はf
c(t,x,y)=a
c(x,y)v
c(t)と表されるが、
【数7】
としても信号全体は変わらない。
【0026】
しかし、式(7)は最小二乗の項とuに対するペナルティ項の和になっているため、式(2)より、s
cを大きくすればするほどペナルティ項が小さくなり目的関数の値は小さくなってしまう。これではペナルティ項の意味がないため、何らかの形で正規化する必要がある。そこで、s
c=maxv
cとする。しかし、拘束条件s
c=maxv
cをいれて問題を解いたわけではないため、正規化後は式(7)の解になっていない。
【0027】
ステップS106で、細胞形状/ベースライン演算部が、細胞形状a
cおよびベースラインa
baselineを求める。ここではu,vを固定して、式(7)が最小となるa
c,a
baselineを求める。最尤法を行うと、ピクセルごとに独立して考えることができて、(9)式をそれぞれ解けばよい。
【0028】
【数8】
【0029】
これは、拘束条件がないので簡単に解けるが、a
c(x,y)には負の値も含まれるため細胞の形状はノイズの影響を強く受け、安定しない。
【0030】
ステップS107で、パラメータ更新部111が、パラメータの更新を行う。式(4)、(5)に従いパラメータを更新する。しかしながら、真の解で規定されるべきパラメータを現在の仮の値で近似しており、事前分布が変数から定義されることになるため、目的関数を正しく設定できない。
【0031】
ステップS104とS107の処理を、反復・収束判定部117が、反復・収束判定する。ステップS108で処理が終了すると、出力部121が結果を出力する。
【0032】
正規化処理の説明においても述べたように、そもそも問題設定が不良のため最終的な収束判定が不能であるため、各ステップを適当な回数繰り返したところで打ち切ることになる。
【0033】
このように、非特許文献2の問題点としては、アルゴリズム中で細胞数が固定であること、初期条件として細胞の形状を正しい形状に十分近くしなければならないこと、示された解法では速度および精度が不十分であること、多数の細胞が存在する際に適切な収束が得られないこと、などである。
【0034】
本発明は、画像に含まれる細胞数が不明な状態から初期条件を個別に設定することなく高速に十分な精度で安定して細胞数およびそれぞれの細胞の形状、活動時系列を推定する技術を提供することを目的とする。
【課題を解決するための手段】
【0035】
本発明では、パラメータの非負拘束条件と適切な事前分布の設定による正規化項(ペナルティ項)をモデルに導入し得られる解の精度を向上させた上で、多数の細胞候補を画像中に重なりを持たせて密に埋め尽くす様な初期条件設定と、細胞候補の取捨選択の工夫により、細胞数とパラメータを正しく推定できる装置(プログラム)を開発した。主たるアルゴリズムとしては、形状と時間変化を交互に反復して改善する反復法を用い、途中でノイズレベル以下の小さな信号しか持たない細胞候補を取り除き、類似した活動状態を持つ細胞候補を統合することで計算量を削減しながら画像中に含まれる活動した細胞をすべて正しく検出する。各ステップで必要な非線形計画の解法には、主双対内点法および大規模一次方程式の高速な解法としての共役勾配法を用いた独自の並列化実装を用いる。
【0036】
最終的に、画像に含まれる細胞数が不明な状態から初期条件を個別に設定することなく高速に十分な精度で安定して細胞数およびそれぞれの細胞の形状、活動時系列を推定することができるプログラムが得られた。
【0037】
従来法2では、細胞数が固定かつ初期条件が厳しいという問題点がある。そこで、多数の細胞候補を画像中に重なりを持たせて密に埋め尽くす様に初期条件を設定し、解が疎になるような条件をモデルに付け加える。前者の工夫により、真の細胞はいずれかの細胞候補の十分近くにあることになるため取りこぼすことなく細胞を検出でき、かつ後者の工夫とクロストークをきちんと考慮したモデルを用いている効果により多数の細胞候補があっても必要以上に真の細胞が複数の細胞候補に分割されてしまうことを防ぐことができる。実際、アルゴリズムの反復を繰り返すと関連度自動決定と呼ばれる効果により大きな信号を持つ細胞候補と、ノイズレベル以下の小さな信号しか持たない細胞候補が生じるようになるため、小さな信号の細胞候補を取り除き、類似した活動状態を持つ細胞候補を統合することで最終的に画像中に含まれる活動した細胞をすべて正しく検出できる。ここで新しく提案した手法は、観測画像が各細胞の活動の和であるというモデルに対して適切な拘束条件を入れることで、反復法が正しく収束することをサポートしている。
【0038】
この手法では、多数の細胞候補を用意するという性質上、多くのメモリおよび計算量を必要とすることになるが、画像を適切なサイズに分割して前処理しそれらの結果を統合する方針をとることで計算量を大幅に削減することができ、個々のステップでの適切な解法と並列化による高速化した実装により現実的な実行時間で目的を達成することができるようになっている。
【0039】
最終的に、画像に含まれる細胞数が不明な状態から初期条件を個別に設定することなく高速に十分な精度で安定して細胞数およびそれぞれの細胞の形状、活動時系列を推定することができる様になった。
【0040】
本発明の一観点によれば、細胞の活動を非負の値で表現される細胞形状a
c(x,y)と非負の値で表現されるスパイク時系列u
c(t)より導出されるカルシウム濃度変化v
c(t)の積により表現し、観測データf(t,x,y)を複数の細胞活動の線形和とベースラインを用いて記述するモデルに基づいて、観測データとモデルと事前分布を元にしたベイズ理論に基づく推定により想定される細胞の位置と活動を求める情報処理装置であって、細胞のスパイク生成に起因する細胞内のカルシウム濃度の上昇に伴って起こる蛍光タンパク質からの発光を位置(x,y)における時刻tでの蛍光強度f(t,x,y)として読み取るデータ読み取り部と、スパイク時系列u
c(t)とカルシウム濃度変化v
c(t)との関係式と細胞形状a
c(x,y)とスパイク時系列u
c(t)に関する事前分布を設定するパラメータ設定部と、前記データ読み取り部により読みとられた位置(x,y)における時刻tでの蛍光強度f(t,x,y)に基づいて細胞形状a
c(x,y)の細胞候補を配置し、ベースラインを蛍光強度f(t,x,y)の統計量に基づいて設定する初期設定部と、前記ベイズ理論に基づく推定で導出される最小化問題の目的関数を減少させ、細胞形状a
c(x,y)、カルシウム濃度変化v
c(t)およびベースラインをより真の解に近い推定値に更新する演算部と、前記演算部における更新で目的関数の変化が十分小さくなった場合に目的関数が収束したと判定して処理を終了する収束判定部と、を有することを特徴とする情報処理装置が提供される。
【0041】
前記演算部において、空間ベースラインa
baseline(x,y)に加えて時間ベースラインv
baseline(t)を導入したモデルに基づいた推定値更新を行うことを特徴とする。
【0042】
また、前記パラメータ設定部において、スパイク時系列に対するカルシウム濃度変化のインパルス応答に基づいた変換行列により、スパイク時系列とカルシウム濃度変化との関係式を設定し、前記演算部において、変換行列に基づいた推定値更新を行うことを特徴とする。
【0043】
また、前記パラメータ設定部において、細胞cの細胞形状a
c(x,y)とスパイク時系列u
c(t)の事前分布を細胞の平均サイズ、スパイクの発火率、それらの積である信号強度を考慮した指数分布として設定し、前記演算部において、設定された事前分布に基づいた推定値更新を行うことを特徴とする。
【0044】
また、前記演算部においてスパイク時系列u
c(t)に加えて細胞形状a
c(x,y)に対する非負拘束条件を導入したモデルに基づいた推定値更新を行うことを特徴とする。
【0045】
これにより、疎な解を得られるような条件で推定を行うことで関連度自動決定の効果が働き、不要な細胞候補は自動的に縮退し(信号が小さくなり)細胞数が自動的に決定される。
【0046】
また、前記初期設定部において、想定される細胞のサイズより大きめの特定の領域を覆うような細胞候補を十分な重なりを持たせて画像全体を埋め尽くすように真の細胞の位置に無関係に多数配置することを特徴とする。
【0047】
さらに、前記スパイク時系列/時間方向のベースライン演算部と、前記細胞形状/空間方向のベースライン演算部と、の出力の少なくともいずれか一方に対して縮退した細胞候補の除去を行う縮退細胞候補除去部を有することを特徴とする。
【0048】
さらに、前記スパイク時系列/時間方向のベースライン演算部と、前記細胞形状/空間方向のベースライン演算部と、の出力の少なくともいずれか一方に対して類似した細胞候補を統合する類似細胞統合部を有することを特徴とする。
【0049】
また、前記演算部は、定められたモデル、拘束条件、事前分布のもとでMAP推定の目的関数を減少させる演算を行う。尚、MAP推定はベイズ推定という枠組みの中の比較的簡易な推定方法の例示であり、広く「ベイズ理論に基づく推定」を用いることができる。具体的には、定められたモデル、拘束条件、事前分布のもとで事後分布を近似したテスト関数が真の事後分布に近づくような演算を行う。
【0050】
このベイズ推定法による定量的カルシウム動態推定については、以下発表を参照することができる。
角田敬正・織田善晃・大森敏明・井上雅司・宮川博義・岡田真人・青西亨、信学技報, vol. 111, no. 483, NC2011-175, pp. 317-322, 2012年3月.
http://www.ieice.org/ken/paper/20120316a0pt/
【0051】
さらに、前記演算部は、細胞形状a
c(x,y)と空間ベースラインa
baseline(x,y)を固定し、スパイク時系列の変数値が非負という拘束条件のもとで、MAP推定の目的関数を最小化するカルシウム濃度変化v
c(t)と時間ベースラインv
baseline(t)を求める(C+1)T次元の二次計画問題を解くカルシウム濃度変化/時間方向ベースライン演算部と、カルシウム濃度変化v
c(t)と時間ベースラインv
baseline(t)を固定し、細胞形状の変数値が非負という拘束条件のもとで、MAP推定の目的関数を最小化する細胞形状a
c(x,y)と空間ベースラインa
baseline(x,y)を求めるXY個の(C+1)次元の二次計画問題を解く細胞形状/空間方向ベースライン演算部とを有することを特徴とする。
【0052】
前記カルシウム濃度変化/時間方向ベースライン演算部において、当該二次計画問題を主双対内点法と(前処理付き)共役勾配法を用いて反復的に解くことを特徴とする。
【0053】
本発明の他の観点によれば、細胞の活動を非負の値で表現される細胞形状a
c(x,y)と非負の値で表現されるスパイク時系列u
c(t)より導出されるカルシウム濃度変化v
c(t)の積により表現し、観測データf(t,x,y)を複数の細胞活動の線形和とベースラインを用いて記述するモデルに基づいて、観測データとモデルと事前分布を元にしたベイズ理論に基づく推定により想定される細胞の位置と活動を求める情報処理装置を用いた情報処理方法であって、細胞のスパイク生成に起因する細胞内のカルシウム濃度の上昇に伴って起こる蛍光タンパク質からの発光位置(x,y)における時刻tでの蛍光強度f(t,x,y)を読み取るデータ読み取りステップと、スパイク時系列u
c(t)とカルシウム濃度変化v
c(t)との関係式と細胞形状a
c(x,y)とスパイク時系列u
c(t)に関する事前分布を設定するパラメータ設定ステップと、前記データ読み取り部により読みとられた位置(x,y)における時刻tでの蛍光強度f(t,x,y)に基づいて細胞形状a
c(x,y)の細胞候補を配置し、ベースラインを蛍光強度f(t,x,y)の統計量に基づいて設定する初期設定ステップと、前記ベイズ理論に基づく推定で導出される最小化問題の目的関数を減少させ、細胞形状a
c(x,y)、カルシウム濃度変化v
c(t)およびベースラインをより真の解に近い推定値に更新する演算ステップと、前記演算ステップにおける更新で目的関数の変化が十分小さくなった場合に目的関数が収束したと判定して処理を終了する収束判定ステップとを有することを特徴とする情報処理方法が提供される。
【0054】
本発明は、コンピュータに上記に記載の情報処理方法を実行させるためのプログラムであっても良く、当該プログラムを記録するコンピュータ読み取り可能な記憶媒体であっても良い。