【文献】
Mark Reimers,Quality assessment of microarrays: Visualization of spatial artifacts and quantitation of regional biases,BMC Bioinformatics,2005年 7月,Vol.6 No.1,p.166-1〜166-8
【文献】
Yingdong Zhao et al.,Evaluation of normalization methods for two-channel microRNA microarrays,JOURNAL OF TRANSLATIONAL MEDICINE,2010年 7月,Vol.8 No.1,pp.69-1〜69-7
(58)【調査した分野】(Int.Cl.,DB名)
担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより標識の検出強度として得られる、上記被検査物質の選択的結合量の信頼性を判定する判定方法であって、
上記担体における上記検出強度を画像化した画像データにおいて上記スポットの位置を決定して、当該スポットに対応するピクセル群を抽出するピクセル群抽出ステップと、
上記ピクセル群抽出ステップにて抽出された上記ピクセル群における上記検出強度のメジアン値と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における上記検出強度のメジアン値と、の比または差を算出するメジアン算出ステップと、
上記メジアン算出ステップにて算出された上記比または上記差と、所定の基準値とに基づいて、上記信頼性の良否を判定する信頼性判定ステップと、
を含むことを特徴とする、判定方法。
担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより標識の検出強度として得られる、上記被検査物質の選択的結合量の信頼性を判定する、制御部を少なくとも備えた判定装置において、
上記制御部は、
上記担体における上記検出強度を画像化した画像データにおいて上記スポットの位置を決定して、当該スポットに対応するピクセル群を抽出するピクセル群抽出手段と、
上記ピクセル群抽出手段により抽出された上記ピクセル群における上記検出強度のメジアン値と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における上記検出強度のメジアン値と、の比または差を算出するメジアン算出手段と、
上記メジアン算出手段により算出された上記比または上記差と、所定の基準値とに基づいて、上記信頼性の良否を判定する信頼性判定手段と、
を備えたことを特徴とする、判定装置。
担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより得られる標識の検出強度を読取る検出装置と、上記検出強度として得られる、上記被検査物質の選択的結合量の信頼性を判定する制御部を少なくとも備えた判定装置と、を接続して構成した判定システムにおいて、
上記判定装置の上記制御部は、
上記検出装置を介して読取られた上記担体における上記検出強度を、画像化した画像データとして取得する画像データ取得手段と、
上記画像データ取得手段により取得された上記画像データにおいて上記スポットの位置を決定して、当該スポットに対応するピクセル群を抽出するピクセル群抽出手段と、
上記ピクセル群抽出手段により抽出された上記ピクセル群における上記検出強度のメジアン値と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における上記検出強度のメジアン値と、の比または差を算出するメジアン算出手段と、
上記メジアン算出手段により算出された上記比または上記差と、所定の基準値とに基づいて、上記信頼性の良否を判定する信頼性判定手段と、
を備えたことを特徴とする、判定システム。
担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより標識の検出強度として得られる、上記被検査物質の選択的結合量の信頼性を判定する方法を、制御部を少なくとも備えたコンピュータに実行させるためのプログラムであって、
上記制御部において、
上記担体における上記検出強度を画像化した画像データにおいて上記スポットの位置を決定して、当該スポットに対応するピクセル群を抽出するピクセル群抽出ステップと、
上記ピクセル群抽出ステップにて抽出された上記ピクセル群における上記検出強度のメジアン値と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における上記検出強度のメジアン値と、の比または差を算出するメジアン算出ステップと、
上記メジアン算出ステップにて算出された上記比または上記差と、所定の基準値とに基づいて、上記信頼性の良否を判定する信頼性判定ステップと、
を含む上記方法を実行させるためのプログラム。
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、従来法におけるスポット均一性判定方法では、被検査物質の選択的結合量の信頼性を適切に判定することができないという問題があった。
【0010】
特に、特許文献1に記載の均一性評価方法では、複数のスポット間の均一性を評価することができるものの、単一のスポット内の均一性を評価することができないという問題がある。
【0011】
また、特許文献2に記載のCV値による評価方法では、スポットを構成するピクセル群のうち、ごみの付着等により一部のピクセルの強度が極端に高い場合や低い場合には標準偏差が大きくなりCV値が閾値を超えるため、一部ピクセル以外のピクセル群については強度データが使えるにも関わらず、当該データを排除してしまっており過検出であるという問題がある。
【0012】
すなわち、一般的に、DNAチップ等のスポットのシグナル強度の代表値としては、画像中のスポット内のピクセル群におけるメジアン(中央値)を用いている。例えば、画像において、直径100μmの円形のスポットで位置合わせを行った場合、円形に含まれる約70個(ピクセルサイズ:10μm四方)のピクセル群において強度のメジアン(スポットメジアン)を求める。
【0013】
これは、ピクセル群の強度の平均値を用いるよりも、外れ値に依存して変動することが少ないためである。すなわち、スポット内のピクセル群の検出強度において、極端に高い値や極端に低い値等の外れ値があると、全体平均が外れ値に引っ張られることになるからである。
【0014】
ここで、
図1は、2枚のDNAチップにおいて同一の被検査物質をハイブリダイズさせた場合の検出強度を示すスキャッタープロットである。横軸は、一方のDNAチップにおける各スポットの検出強度を表しており、縦軸は、他方のDNAチップにおける各スポットの検出強度を表している。すなわち、1つの点の座標(X,Y)は、同一の選択結合性物質を固定したスポットについて、一方のDNAチップにおいて測定された検出強度(X)と、他方のDNAチップにおいて測定された検出強度(Y)を表している。
【0015】
この例では、2枚のDNAチップにおいて同一の被検査物質をハイブリダイズさせているので、理想的にはY=Xとなるべきである。しかしながら、
図1に示すように、スポット1および2の強度プロットは、Y=Xのラインから大きく外れており、スポット不良と考えられる。ここで、
図2は、スポット1の強度画像(左図)と、スポット1の縦断線における検出強度の変動グラフ(右図)を示す図である。また、
図3は、スポット2の強度画像(左図)と、スポット2の縦断線における検出強度の変動グラフ(右図)を示す図である。なお、強度画像において、破線の円はスポット箇所を示しており、白色階調値で検出強度が表されている。
【0016】
図2および
図3の左図に示すように、スポット箇所の強度画像においては、検出強度は均一な円となっておらず、不均一なムラとなっている。変動グラフ(右図)は、横1ピクセル縦十数ピクセルにわたってスポット箇所を縦断するラインにおける検出強度の変動を表しており、理想的には一定の強度であるべきところ大きく変動している。不良の原因は、主に、スポットの不良(選択結合性物質の固定時の不良など)やごみの付着である。
【0017】
特許文献2等の先行技術においては、このような不良スポットを排除するために、以下の式で求められるCV値を用いて、スポットの良否を判定していた。
CV値=(ピクセル群における強度の標準偏差)/(ピクセル群における強度の平均値)
【0018】
すなわち、CV値が所定の基準値以上であれば不良スポットとしてデータを排除していた。その場合、ごみ等がスポットの一部に付着する等によって、上述の例で70個のピクセル群のうち5ピクセルが極端に大きい値を示した場合、CV値が基準値以上となり、データが排除される。
【0019】
しかしながら、スポットのシグナル強度の代表値としては、通常、スポット内のピクセル群におけるメジアンを用いているのであって、たとえスポット内の一部に外れ値が含まれていても変動することが少ないので、データとしては十分使用できる可能性がある。すなわち、CV値を用いた従来の評価方法では、十分使用できるにも関わらず不良スポットを過検出してデータを排除してしまっているという問題点を有していた。
【0020】
本発明は、上記に鑑みてなされたもので、マイクロアレイ実験等から得られるデータにおいて、非生物学的影響を考慮して被検査物質の選択的結合量の信頼性を適切に評価することができる、判定方法、判定装置、判定システム、および、プログラムを提供することを目的とする。
【課題を解決するための手段】
【0021】
このような目的を達成するため、本発明の判定方法は、担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより標識の検出強度として得られる、上記被検査物質の選択的結合量の信頼性を判定する判定方法であって、上記担体における上記検出強度を画像化した画像データにおいて上記スポットの位置を決定して、当該スポットに対応するピクセル群を抽出するピクセル群抽出ステップと、上記ピクセル群抽出ステップにて抽出された上記ピクセル群における上記検出強度のメジアン値と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における上記検出強度のメジアン値と、の比または差を算出するメジアン算出ステップと、上記メジアン算出ステップにて算出された上記比または上記差と、所定の基準値とに基づいて、上記信頼性の良否を判定する信頼性判定ステップと、を含むことを特徴とする。
【0022】
また、本発明の判定方法は、上記記載の判定方法において、上記メジアン算出ステップは、以下の式1および/または式2によって得られる比の値を算出し、上記信頼性判定ステップは、上記メジアン算出ステップにて算出された上記比の値が上記基準値以上であれば不良と判定することを特徴とする。
|X−Xt|/X …(式1)
|X−Xb|/X …(式2)
(ここで、Xは、上記ピクセル群における上記検出強度のメジアン値であり、Xtは、当該ピクセル群から上位所定割合のピクセルを除いた群における上記検出強度のメジアン値であり、Xbは、当該ピクセル群から下位所定割合のピクセルを除いた群における上記検出強度のメジアン値である。)
【0023】
また、本発明の判定方法は、上記記載の判定方法において、上記基準値は、以下の式3によって得られる値であることを特徴とする。
S=C+Z/X …(式3)
(ここで、Sは、上記基準値であり、Cは、定数であり、Zは、上記標識の検出強度を検出する装置の感度設定によるオフセット値であり、Xは、上記ピクセル群における上記検出強度のメジアン値である。)
【0024】
また、本発明の判定方法は、上記記載の判定方法において、上記標識の検出強度を検出する装置は、フォトマルチプライヤーであり、上記オフセット値は、以下の式4によって得られる値であることを特徴とする。
Z=X^(A)*B …(式4)
(ここで、Zは、上記オフセット値であり、Xは、上記フォトマルチプライヤーのゲイン電圧であり、AおよびBは、定数である。)
【0025】
また、本発明の判定方法は、上記記載の判定方法において、上記担体は、マイクロアレイであり、上記標識は、蛍光標識であり、上記検出強度は、蛍光量であり、上記信頼性判定ステップは、上記信頼性の良否としてスポットの良否を判定することを特徴とする。
【0026】
また、本発明の判定装置は、担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより標識の検出強度として得られる、上記被検査物質の選択的結合量の信頼性を判定する、制御部を少なくとも備えた判定装置において、上記制御部は、上記担体における上記検出強度を画像化した画像データにおいて上記スポットの位置を決定して、当該スポットに対応するピクセル群を抽出するピクセル群抽出手段と、上記ピクセル群抽出手段により抽出された上記ピクセル群における上記検出強度のメジアン値と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における上記検出強度のメジアン値と、の比または差を算出するメジアン算出手段と、上記メジアン算出手段により算出された上記比または上記差と、所定の基準値とに基づいて、上記信頼性の良否を判定する信頼性判定手段と、を備えたことを特徴とする。
【0027】
また、本発明の判定システムは、担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより得られる標識の検出強度を読取る検出装置と、上記検出強度として得られる、上記被検査物質の選択的結合量の信頼性を判定する制御部を少なくとも備えた判定装置と、を接続して構成した判定システムにおいて、上記判定装置の上記制御部は、上記検出装置を介して読取られた上記担体における上記検出強度を、画像化した画像データとして取得する画像データ取得手段と、上記画像データ取得手段により取得された上記画像データにおいて上記スポットの位置を決定して、当該スポットに対応するピクセル群を抽出するピクセル群抽出手段と、上記ピクセル群抽出手段により抽出された上記ピクセル群における上記検出強度のメジアン値と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における上記検出強度のメジアン値と、の比または差を算出するメジアン算出手段と、上記メジアン算出手段により算出された上記比または上記差と、所定の基準値とに基づいて、上記信頼性の良否を判定する信頼性判定手段と、を備えたことを特徴とする。
【0028】
また、本発明のプログラムは、担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより標識の検出強度として得られる、上記被検査物質の選択的結合量の信頼性を判定する方法を、制御部を少なくとも備えたコンピュータに実行させるためのプログラムであって、上記制御部において、上記担体における上記検出強度を画像化した画像データにおいて上記スポットの位置を決定して、当該スポットに対応するピクセル群を抽出するピクセル群抽出ステップと、上記ピクセル群抽出ステップにて抽出された上記ピクセル群における上記検出強度のメジアン値と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における上記検出強度のメジアン値と、の比または差を算出するメジアン算出ステップと、上記メジアン算出ステップにて算出された上記比または上記差と、所定の基準値とに基づいて、上記信頼性の良否を判定する信頼性判定ステップと、を含む上記方法を実行させることを特徴とする。
【0029】
また、本発明は記録媒体に関するものであり、上記記載のプログラムを記録したことを特徴とする。
【発明の効果】
【0030】
本発明の判定方法、判定装置、判定システム、および、プログラムによれば、マイクロアレイ実験等から得られるデータにおいて、非生物学的影響を考慮して被検査物質の選択的結合量の信頼性を適切に評価することができるという効果を奏する。
【発明を実施するための形態】
【0032】
以下に、本発明にかかる本発明の判定方法、判定装置、判定システム、および、プログラムの実施の形態を図面に基づいて詳細に説明する。特に、以下に示す実施形態は、本発明の技術思想を具体化するための判定システムを例示するものであって、本発明をこの判定システムにおいて行われることを限定するものではなく、特許請求の範囲に含まれるその他の実施形態の判定方法や判定装置にも等しく適用し得るものである。例えば、以下の実施形態においては、判定システムにおいて実行される判定方法について説明する場合があるが、これに限られず、判定方法は人により手動にて行う方法であってもよい。また、以下の実施形態においては、判定装置は、画像データ等を取得する測定装置等の入力装置に接続された例について説明するが、本発明はこれに限られず、判定装置は、入力装置に接続されることなく、予め記憶部に画像データを記憶していてもよく、通信により外部から画像データを取得してもよい。
【0033】
[本実施形態の概要]
以下、本実施形態の概要について説明し、その後、本実施形態の構成および処理等について図面を参照しながら詳細に説明する。本願発明者らは、鋭意検討した結果、一例として以下に示す本実施形態による判定方法を開発するに至った。
【0034】
すなわち、本実施形態は、概略的に、以下の基本的特徴を有する。本実施形態は、担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより標識の検出強度として得られる、被検査物質の選択的結合量の信頼性を判定する。
【0035】
ここで、「被検査物質」とは、細胞や組織等から直接または間接的に得られる試料のことであり、例えば、ゲノムDNA、RNA、cDNA、aRNA(cDNAまたはその相補配列を鋳型として増幅されたRNA)、タンパク質、糖鎖、脂質などである。また、「標識」とは、検出手段によって検出することができる物質のことであり、蛍光標識や生物発光による標識、放射性同位体による標識等である。また、「選択結合性物質」とは、ある物質と選択的に結合する物質のことであり、例えば、DNAに対する相補的DNA、DNAに対する相補的RNA、抗原に対する抗体、化学物質に対する酵素などである。
【0036】
また、「担体」は、一般的な、DNAチップやマイクロアレイ等の基板のほか、凹凸構造を持つポリメチルメタクリレート製DNAチップ基板(3D−Gene(商品名)、製造販売 東レ株式会社(会社名)、特開2004−264289参照)であってもよく、その場合には凸部にスポットを行う。
【0037】
まず、本実施形態は、担体における検出強度を画像化した画像データにおいてスポットの位置を決定して、当該スポットに対応するピクセル群を抽出する。すなわち、画像上の1つのスポット箇所を構成している一群のピクセルをスポット毎に抽出する。
【0038】
そして、本実施形態は、抽出したピクセル群における検出強度のメジアン値(X)と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における検出強度のメジアン値(Xt/Xb)と、の比または差を算出する。例えば、本実施形態は、以下の式1および/または式2に基づいて比を算出してもよい。
|X−Xt|/X …(式1)
|X−Xb|/X …(式2)
(ここで、Xは、抽出したピクセル群における検出強度のメジアン値であり、Xtは、当該ピクセル群から上位所定割合のピクセルを除いた群における検出強度のメジアン値であり、Xbは、当該ピクセル群から下位所定割合のピクセルを除いた群における検出強度のメジアン値である。)
【0039】
なお、以下に記載の実施例では、Xt、Xbを求める際に、除いた上位所定割合・下位所定割合は、いずれも抽出したピクセル群の30%としたが、これに限られず、例えば、20〜40%の範囲の任意の値で使用してもよい。
【0040】
そして、本実施形態は、算出された比または差と、所定の基準値Sとに基づいて、信頼性の良否を判定する。例えば、本実施形態は、算出した比または差の値が基準値S以上であれば不良と判定してもよい。なお、
図2のスポット1において、式1の値(%)は、34%であり、式2の値(%)は、22.2%であった。また、
図3のスポット2において、式1の値(%)は、30%であり、式2の値(%)は、22.3%であった。スポット1および2の両方において十分なデータが得られるので、これらを排除しないために、基準値Sは25%〜30%程度としてもよい。
【0041】
ここで、基準値Sは、以下の式3によって得られる値であってもよい。
S=C+Z/X …(式3)
(ここで、Sは、基準値であり、Cは、定数であり、Zは、標識の検出強度を検出する装置の感度設定によるオフセット値であり、Xは、ピクセル群における検出強度のメジアン値である。)
【0042】
ここで、オフセット値Zは、以下の式4によって得られる値であってもよい。
Z=X^(A)*B …(式4)
(ここで、Zは、オフセット値であり、Xは、フォトマルチプライヤーのゲイン電圧であり、AおよびBは、定数である。)
【0043】
以上が本実施形態の概要である。これにより、マイクロアレイ実験等から得られるデータにおいて、非生物学的影響を考慮して被検査物質の選択的結合量の信頼性を適切に評価することができる。特に、スポット内の一部に外れ値が含まれていても、十分使用できるデータを過検出して排除してしまうことを防ぐことができる。
【0044】
[判定システムの構成]
まず、本実施形態における判定システムの構成について説明する。
図4は、本実施形態における判定システムの全体構成の一例を示すブロック図である。
【0045】
図4に示すように、本実施形態における判定システムは、概略的に、標識の検出強度を読取る検出手段として機能する入力装置112と、出力装置114と、判定装置100とを備える。
【0046】
判定装置100は、概略的に、判定装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112や出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブルなどを格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。ここで、
図4に示すように、判定装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介してネットワーク300に接続されてもよく、更に、ネットワーク300を介して外部システム200に接続されてもよい。
【0047】
記憶部106に格納される各種のデータベースやテーブル(画像データファイル106aおよびピクセル群ファイル106b)は、固定ディスク装置等のストレージ手段であってもよい。例えば、記憶部106は、各種処理に用いる各種のプログラム、テーブル、ファイル、データベース、および、ウェブページ等を格納してもよい。
【0048】
これら記憶部106の各構成要素のうち、画像データファイル106aは、担体における検出強度を画像化した画像データを記憶する画像データ記憶手段である。例えば、画像データファイル106aに記憶される画像データは、検出手段によって担体平面上の検出強度をスキャンすることによって得られた画像情報であってもよい。なお、画像データファイル106aは、予め画像データを記憶してもよく、後述する検出手段として機能する入力装置112から入力された画像データであってもよく、ネットワーク300を介して外部システム200から受信した画像データであってもよい。一例として、画像データファイル106aは、画像データとして、検出強度を階調値としたグレースケール画像データを記憶する。
【0049】
また、ピクセル群ファイル106bは、スポット毎にピクセル群の情報(強度情報等)を記憶するピクセル群記憶手段である。例えば、ピクセル群ファイル106bに記憶される情報は、スポットを一意に特定する識別情報(担体のブロック番号と行番号と列番号など)に対応付けた、各ピクセルの検出強度の値(階調値など)や、ピクセル群のメジアン値等である。例えば、一枚のバイオチップに4ブロックあり、1ブロックあたり64(8x8)スポット、合計256遺伝子の発現パターンを検出することができる担体(バイオチップ)を用いたとすると、ピクセル群ファイル106bは、個々の遺伝子に対応する選択結合性物質(DNA断片等)が配置された位置(ブロック番号とスポットの行番号および列番号)を、当該スポット内のピクセル群の階調値等と対応付けて記憶する。
【0050】
また、
図4において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、プリンタ、記録媒体出力装置等を用いることができる。また、入力装置112としては、キーボード、マウス等の他、標識の検出強度を読取る検出装置(検出手段)であってもよい。
【0051】
ここで、「検出手段」とは、担体上にスポットとして固定化された選択結合性物質に、標識された被検査物質が結合することにより得られる標識の検出強度を読取る手段である。例えば、検出手段は、選択結合性物質がスポットされた位置を特定するとともに検出強度を取得するための検査手段、例えば蛍光顕微鏡カメラなどであってもよい。標識が、蛍光標識や生物発光による標識の場合、検出手段は、フォトマルチプライヤー(光電子増倍管)であってもよい。なお、検出手段は、蛍光顕微鏡カメラのように検出強度を画像化する手段に限らず、検出強度を読取る手段であればよく、担体平面に沿ってスキャン(走査)させることにより、判定装置100側で画像化してもよい。選択結合性物質がDNAの場合、微量の二本鎖DNA結合性蛍光物質を取り込ませ、選択的結合量を検出してもよい。また、検出手段は、DNA固有の吸収波長を検出してもよい。また、選択結合性物質がタンパク質、糖鎖等であった場合でも、選択結合性物質の性質に応じて、吸収波長、蛍光物質、放射性同位体(ラジオアイソトープ)、ハイブリダイゼーション、抗原抗体反応などの技術を用いて検出するようにしてもよい。
【0052】
また、
図4において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、画像データ取得部102a、ピクセル群抽出部102b、メジアン算出部102c、信頼性判定部102d、基準値決定部102eを備えて構成されている。
【0053】
このうち、画像データ取得部102aは、担体における検出強度を画像化した画像データを取得する画像データ取得手段である。例えば、画像データ取得部102aは、検出手段として機能する入力装置112を介して読取られた担体における検出強度を、画像化した画像データとして取得してもよい。ここで、画像データ取得部102aは、蛍光顕微鏡カメラ等の入力装置112から画像データを直接取得してもよく、フォトマルチプライヤー等の入力装置112を担体平面に沿ってスキャン(走査)させることにより得られた座標ごとの検出強度を画像化してもよい。また、画像データ取得部102aは、ネットワーク300を介して、外部システム200から画像データを受信してもよい。なお、画像データ取得部102aは、取得した画像データを画像データファイル106aに格納する。
【0054】
また、ピクセル群抽出部102bは、画像データファイル106aに記憶された画像データにおいてスポットの位置を決定して、当該スポットに対応するピクセル群を抽出するピクセル群抽出手段である。例えば、ピクセル群抽出部102bは、担体上の選択結合性物質が配置された位置(スポット箇所)の配列(スポット中心座標およびピクセル半径等)に基づいて、画像上で各スポット箇所を区画化し、各区画内のピクセル群を抽出してもよい。なお、ピクセル群抽出部102bは、画像データおよび配列パターンデータを重畳的に出力装置114に表示し、マウス等の入力装置112を介して表示上の配列パターンを移動させる入力を利用者により行わせることによって、位置決めを行ってもよい。また、ピクセル群抽出部102bは、スポット毎にピクセル群の情報(強度情報等)をピクセル群ファイル106bに格納する。例えば、ピクセル群抽出部102bは、スポットを一意に特定する識別情報(担体のブロック番号と行番号と列番号など)に対応付けて、各ピクセルの検出強度の値(階調値など)をピクセル群ファイル106bに格納してもよい。
【0055】
また、メジアン算出部102cは、ピクセル群ファイル106bに格納されたピクセル群における検出強度のメジアン値(X)と、当該ピクセル群から上位所定割合および/または下位所定割合のピクセルを除いた群における検出強度のメジアン値(Xt/Xb)と、の比または差を算出するメジアン算出手段である。例えば、本実施形態は、以下の式1および/または式2に基づいて比を算出してもよい。例えば、メジアン算出部102cは、ピクセル群ファイル106bに格納された、あるスポットのピクセル群の検出強度(階調値等)を、昇順または降順にソートすることにより並べ替え、上位所定割合(x%)を除いた群における中位の検出強度、および、下位所定割合(y%)を除いた群における中位の検出強度を得てもよい。
|X−Xt|/X …(式1)
|X−Xb|/X …(式2)
(ここで、Xは、抽出したピクセル群における検出強度のメジアン値であり、Xtは、当該ピクセル群から上位所定割合のピクセルを除いた群における検出強度のメジアン値であり、Xbは、当該ピクセル群から下位所定割合のピクセルを除いた群における検出強度のメジアン値である。)
【0056】
また、信頼性判定部102dは、メジアン算出部102cにより算出された比または差と、所定の基準値とに基づいて、信頼性の良否を判定する信頼性判定手段である。例えば、信頼性判定部102dは、メジアン算出部102cにより算出された比または差が基準値S以上であれば不良と判定してもよい。信頼性判定部102dは、信頼性の判定結果に基づいて、不良スポットのデータを分析から除外してもよく、信頼性の判定結果を出力装置114に出力してもよい。なお、制御部102は、信頼性判定部102dによる信頼性の判定結果に基づいて処理(不良スポットデータの除外等)を行い、データ分析結果を出力装置114に出力してもよい。なお、出力は、出力装置114としてモニタに出力することに限られず、プリンタや、記録媒体出力装置を介して記録媒体等に出力してもよい。また、信頼性判定部102d等の制御部102は、通信制御インターフェース
部104を制御して、ネットワーク300を介して、外部システム200に信頼性の判定結果や分析結果のデータを送信してもよい。
【0057】
また、基準値決定部102eは、信頼性判定部102dによる信頼性判定の基準とする基準値を決定する基準値決定手段である。例えば、基準値決定部102eは、以下の式3によって基準値Sを決定してもよい。
S=C+Z/X …(式3)
(ここで、Sは、基準値であり、Cは、定数であり、Zは、標識の検出強度を検出する装置の感度設定によるオフセット値であり、Xは、ピクセル群における検出強度のメジアン値である。)
【0058】
ここで、基準値決定部102eは、以下の式4に基づいて、式3におけるオフセット値Zを決定してもよい。
Z=X^(A)*B …(式4)
(ここで、Zは、オフセット値であり、Xは、フォトマルチプライヤーのゲイン電圧であり、AおよびBは、定数である。)
【0059】
また、
図4において、通信制御インターフェース部104は、判定装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。ネットワーク300は、判定装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。外部システム200は、ネットワーク300を介して、判定装置100と相互に接続され、標識の検出強度データ等に関する外部データベースや外部プログラム等を提供する機能を有する。
【0060】
ここで、外部システム200は、WEBサーバやASPサーバ等のサーバ装置や、端末装置として構成していてもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成していてもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。なお、判定装置100の利用者は、ネットワーク300を介して、外部システム200が提供するDNAチップ等に関する検出強度データベースや、遺伝子配置データベース等の外部データベース、または判定方法を実行させるためのプログラム等の外部プログラムを提供するウェブサイトにアクセスすることによって検出強度値データや、配置データ、プログラム等を入手するようにしてもよい。これにて、本実施形態の判定システムおよび判定装置100の構成の説明を終える。
【0061】
[判定装置100の処理]
次に、このように構成された本実施形態における判定装置100の処理の一例について、以下に
図5および
図6を参照しながら詳細に説明する。
図5は、本実施の形態における本判定装置100の基本処理の一例を示すフローチャートである。
【0062】
まず、
図5に示すように本判定装置100において、画像データ取得部102aは、担体における検出強度を画像化した画像データを取得し、画像データファイル106aに格納する(ステップSA−1)。例えば、画像データ取得部102aは、検出手段として機能する入力装置112を介して読取られた担体における検出強度を画像化した画像データとして取得してもよい。ここで、画像データ取得部102aは、蛍光顕微鏡カメラ等の入力装置112から画像データを直接取得してもよく、フォトマルチプライヤー等の入力装置112を担体平面に沿ってスキャン(走査)させることにより得られた座標ごとの検出強度を画像化してもよい。ここで、画像データ取得部102aは、入出力制御インターフェース部108を介して、検出強度データまたは画像データを格納した外部記録媒体からデータを読み込んでもよい。
【0063】
そして、ピクセル群抽出部102bは、画像データファイル106aに記憶された画像データにおいてスポットの位置を決定して当該スポットに対応するピクセル群を抽出し、抽出したピクセル群の情報をピクセル群ファイル106bに格納する(ステップSA−2)。例えば、ピクセル群抽出部102bは、担体上の選択結合性物質が配置された位置(スポット箇所)の配列(スポット中心座標およびピクセル半径等)に基づいて、画像上で各スポット箇所を区画化し、各区画内のピクセル群を抽出してもよい。なお、ピクセル群抽出部102bは、スポット毎にピクセル群の情報(強度情報等)をピクセル群ファイル106bに格納する。例えば、ピクセル群抽出部102bは、スポットを一意に特定する識別情報(担体のブロック番号と行番号と列番号など)に対応付けて、各ピクセルの検出強度の値(階調値など)をピクセル群ファイル106bに格納してもよい。
【0064】
そして、メジアン算出部102cは、ピクセル群ファイル106bに格納されたピクセル群における検出強度のメジアン値(X)を取得する(ステップSA−3)。例えば、メジアン算出部102cは、あるスポットのピクセル群の検出強度(階調値等)を、昇順または降順にソートすることにより並べ替え、中位(ランキングで中央の位置)の検出強度値を取得することによりメジアン値(X)を得てもよい。
【0065】
そして、メジアン算出部102cは、ピクセル群ファイル106bに格納されたピクセル群から上位所定割合(x%)のピクセルを除いた群における検出強度のメジアン値(Xt)および/または当該ピクセル群から下位所定割合(y%)のピクセルを除いた群における検出強度のメジアン値(Xb)を取得する(ステップSA−4)。上位所定割合(x%)および下位所定割合(y%)は、例えば30%であってもよい。一例として、メジアン算出部102cは、あるスポットのピクセル群の検出強度(階調値等)を、昇順または降順にソートすることにより並べ替え、上位所定割合(x%)を除いた群における中位の検出強度(Xt)、および、下位所定割合(y%)を除いた群における中位の検出強度(Xb)を得てもよい。ここで、
図6は、スポットメジアン(X)と、上位所定割合を除いた場合のメジアン(Xt:Top Cut Median)と、下位所定割合を除いた場合のメジアン(Xb:Bottom Cut Median)の関係を示す図である。棒グラフの1本は、1つのピクセルに対応しており、長さは、当該ピクセルの階調値に対応する検出強度である。また、横軸に沿って、当該スポットにおけるピクセル群を強度で降順にソートしている。
【0066】
図6に示すように、スポットメジアン(X)は、ピクセル群の強度のランクで中位(中央の位置)の値である。このピクセル群から上位所定割合(この例では4ピクセル)を除いた群において中央の位置の値を求めたものが、メジアンXt(Top Cut Median)である。また、同ピクセル群から下位所定割合(この例では4ピクセル)を除いた群において中央の位置の値を求めたものが、メジアンXb(Bottom Cut Median)となる。
【0067】
再び
図5に戻り、メジアン算出部102cは、スポットメジアンXと上位所定割合を除いたメジアンXtとの比または差、および/または、スポットメジアンXと下位所定割合を除いたメジアンXbとの比または差を算出する(ステップSA−5)。なお、
図6の両矢印は、スポットメジアンXと上位所定割合を除いたメジアンXtとの差、および、スポットメジアンXと下位所定割合を除いたメジアンXbとの差を表している。ここで、メジアン算出部102cは、以下の式1および/または式2に基づいて比を算出してもよい。
|X−Xt|/X …(式1)
|X−Xb|/X …(式2)
(ここで、Xは、抽出したピクセル群における検出強度のメジアン値であり、Xtは、当該ピクセル群から上位所定割合のピクセルを除いた群における検出強度のメジアン値であり、Xbは、当該ピクセル群から下位所定割合のピクセルを除いた群における検出強度のメジアン値である。)
【0068】
そして、信頼性判定部102dは、メジアン算出部102cにより算出された比または差と、所定の基準値とに基づいて、信頼性の良否を判定する(ステップSA−6)。例えば、信頼性判定部102dは、メジアン算出部102cにより算出された比または差(差の絶対値等)が所定の基準値S(%)以上であれば不良と判定してもよい。ここで、基準値S(%)は、一定値C(%)であってもよく、シグナル強度が弱い領域で電気回路系などからのホワイトノイズが無視できない場合には基本C(%)を基準値決定部102eにより補正してもよい(詳細を後述する)。
【0069】
以上が、判定装置100の基本処理の一例である。
【0070】
[基準値の補正処理]
上述の判定装置100の基本処理においては、基準値Sは、一定値Cとしたが、基準値決定部102eが、基準値を補正して決定する補正処理の一例について以下に説明する。ここで、
図7は、シグナル強度が弱い領域におけるホワイトノイズと補正曲線を示す図である。
図7において、横軸は、シグナル強度を代表するスポットメジアンXであり、縦軸は、式1および式2によって得られた比の値である。なお、この例では、式1および式2において絶対値を求めていないので、縦軸の正の領域は、式2によって求めた値、負の領域は、式1によって求めた値がプロットされている。
【0071】
図7に示すように、シグナル強度が弱くなるほど離散的になり、ホワイトノイズの影響が無視できなくなり、算出される比の絶対値は大きくなる。したがって、基準値S(%)は、一定値C(%)よりも、適切に補正する方が好ましい。鋭意検討の結果、本願発明者らは、これを補正するための補正曲線(Y=10+13/XおよびY=−10−13/X)を見出した。これを一般化した式を以下に示す。すなわち、基準値決定部102eは、以下の式3に基づいて基本C(%)を補正して基準値Sを決定してもよい。
S=C+Z/X …(式3)
(ここで、Sは、基準値であり、Cは、定数であり、Zは、標識の検出強度を検出する装置の感度設定によるオフセット値であり、Xは、ピクセル群における検出強度のメジアン値である。)
【0072】
ここで、オフセット値Zは、同一の設定においては一定であるが、スキャン時のフォトマルチプライヤーのゲイン設定を変更すると変化する値である。ここで、
図8および
図9は、同一の被検査物質を供した同一の担体を、ゲイン電圧(%)の設定が「40」(この場合、光電子倍増管のコントロール電圧が40%×1V=0.4V)の場合と「55」(55%×1V=0.55V)の場合で測定した結果を示す図である。
【0073】
図8および
図9に示すように、ゲイン電圧(増感コントロール電圧)を変更すると散布状態も変化するので、それによって閾値曲線を変更する必要がある。その変化は、閾値曲線S=C+Z/Xのオフセット値Zに依存的であり、
図8の例ではオフセット値を13に、
図9の例ではオフセット値を80に設定すれば好適な閾値曲線が得られる。
【0074】
ここで、
図10は、オフセット値とゲイン電圧(増感コントロール電圧)をプロットしたグラフ図である。横軸は、フォトマルチプライヤー(PMT)のゲイン電圧の対数値を表し、縦軸はオフセット値の対数値を表す。
【0075】
図10に示すように、オフセット値は、ゲイン電圧に依存的に変化し、標識の種類(cy3およびcy5)に非依存的である。また、オフセット値の対数値とゲイン電圧の対数値は線形式で表される(
図10中の式)。なお、傾きと切片は、スキャナー機体(フォトマルチプライヤー)に固有の値であった。このオフセット値とゲイン電圧の関係式を一般化すると以下の式4になる。すなわち、基準値決定部102eは、以下の式4に基づいてオフセット値Zを決定してもよい。
Z=X^(A)*B …(式4)
ここで、Zは、オフセット値であり、Xは、フォトマルチプライヤーのゲイン電圧であり、AおよびBは、定数である。
図10の例では、グラフの傾きは、5.1639〜5.12552程度であり、切片は、−7.1363〜−7.2711程度である。すなわち、Aの範囲は−7.1363〜−7.2711程度であり、Bの範囲は5.1639〜5.12552程度である。
【0076】
以上で、基準値の補正処理の説明を終える。
【0077】
[実施例1]
適切な閾値についての検討を行った実施例1について以下に説明する。まず、2枚のDNAチップにおいて同一の被検査物質をハイブリダイズさせ、検出強度に大きな差異がないことを確かめた。
図11は、2枚のDNAチップにおいて同一の被検査物質をハイブリダイズさせた場合の検出強度を示すスキャッタープロットである。横軸は、一方のDNAチップにおける各スポットの検出強度を表しており、縦軸は、他方のDNAチップにおける各スポットの検出強度を表している。
【0078】
その結果、
図11に示すように、2枚のDNAチップにおいて検出強度に大きな差異はなく正常であることが確かめられた。なお、
図12に示すように、スポットの内側が不均一なものもあったが、メジアンを用いる場合にはデータとして十分使用できると考えて、排除しなかった。
【0079】
つぎに、これらスポットのうち、検出強度がゲイン電圧設定値「40」(光電子倍増管のコントロール電圧が、40%×1V)で、スポットメジアンが2000以上のスポットについて、以下の式1および式2の値を算出した。なお、スポットメジアンが2000以上のスポットについて検討した理由は、前述したように、シグナルが弱い部分では、電気回路などのホワイトノイズを無視できないためである(例えば、
図7、
図8参照)。
(X−Xt)/X*100(%) …(式1)
(X−Xb)/X*100(%) …(式2)
(ここで、Xは、ピクセル群における検出強度のメジアン値であり、Xtは、当該ピクセル群から上位所定割合のピクセルを除いた群における検出強度のメジアン値であり、Xbは、当該ピクセル群から下位所定割合のピクセルを除いた群における検出強度のメジアン値である。)
【0080】
図13は、スポット毎に求めた式1の値を昇順にソートした結果を示す図である。また、
図14は、スポット毎に求めた式2の値を降順にソートした結果を示す図である。なお、Blockはブロック番号、Columnは
列番号、Rowは
行番号を表しており、これらによりスポットが一意に特定される。また、S_532_Medianの項目において、スポットメジアンを示す。
【0081】
図13および
図14に示すように、式1の値においても式2の値においても、絶対値が25%以下であれば、スポットの形状不良によるばらつきは生じないと判断できる。したがって、信頼性の良否を判断する基準値は、絶対値で25%程度が好ましいと考えられる。
【0082】
[実施例2]
適切なオフセット値についての検討を行った実施例2について以下に説明する。実施例2においては、担体として、3D−Gene(登録商標) Human Ver1.1(東レ製)のチップを2枚使用した。また、被検査物質として、Stratagene社製Human Reference RNAを用いて、プロトコルに記載のとおりにハイブリダイゼーションまでを行った。また、検出手段として、3D−Gene(登録商標) Scanner(東レ製)を用いた。
【0083】
ハイブリダイゼーションを行った2枚のチップのうち1枚について、3D−Gene(登録商標) Scanner(東レ製)のフォトマルチプライヤー(PMT)の設定を40%、55%、70%と変えて測定し、それぞれのスポットについて式1および式2の値を算出した。PMTの設定を変えると、PMTのコントロール電圧が比例して変化する。したがって、光電子倍増管ゲインも変化する。ここで、
図15は、PMT設定40%の場合の結果を示すスキャッタープロットであり、
図16は、PMT設定55%の場合の結果を示すスキャッタープロットであり、
図17は、PMT設定70%の場合の結果を示すスキャッタープロットである。カット値は30%であり、横軸にスポットメジアン、縦軸に絶対値の計算を除く式1および式2による2つの値をプロットした。
【0084】
そして、
図15〜
図17のそれぞれについて、Y=±10±Z/X(Xはスポットメジアン、Zは定数)の曲線を描画し、その曲線が式1および式2の2つの値の広がりの裾に来るように、PMTの3条件におけるオフセット値Zを求めた。その結果、
図15〜
図17に示すように、PMT設定40%の場合はオフセット値13であり、PMT設定55%の場合はオフセット値80であり、PMT設定70%の場合はオフセット値230であった。
【0085】
つづいて、PMT値とオフセット値の相関を調べたところ、
図18に示すように、その関係は両対数グラフにおいて直線になることが示された。相関係数0.99以上であり、この補正の妥当性が示された。オフセット値補正用の式4を以下に示す。
Z=X^(A)*B …(式4)
ここで、Zは、オフセット値であり、Xは、フォトマルチプライヤーのゲイン電圧である。本実施例2において、Aは、−7.13であり、Bは、5.16であった。
【0087】
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
【0088】
特に、本発明の実施の形態については、選択結合性物質としてDNAを用いた例について説明したが、これに限られず、選択結合性物質には、抗体などのタンパク質ライブラリや、化合物のライブラリ等を配置してもよい。また、「担体」の材料は、ガラスに限られず、メンブレンやプラスチックでもよい。
【0089】
また、上述の実施の形態においては、標識として蛍光化学物質(例えばCy3,Cy5)を用いたが、これに限られず、標識には、蛍光特性を持たない色素や、放射性同位体、GFP・GRPなどのタンパク質、Hisタグ、ビオチン化などを用いることができる。
【0090】
また、判定装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、判定装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。
【0091】
また、実施の形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データ等を含む情報、データベース構成については、特記する場合を除いて任意に変更することができる。
【0092】
また、判定装置100に関して、図示の各構成要素は機能概略的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
【0093】
例えば、判定装置100の各装置が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、後述する記録媒体に記録されており、必要に応じて判定装置100に機械的に読み取られる。すなわち、ROMまたはHDなどの記憶部106などは、OS(Operating System)として協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御装置を構成する。
【0094】
また、このコンピュータプログラムは、判定装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
【0095】
また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、メモリーカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD、および、Blu−ray(登録商標) Disc等の任意の「可搬用の物理媒体」を含むものとする。
【0096】
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
【0097】
記憶部106に格納される各種のデータベース等(画像データファイル106a〜ピクセル群ファイル106b)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。
【0098】
また、判定装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置として構成してもよく、また、該情報処理装置に任意の周辺装置を接続して構成してもよい。また、100は、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
【0099】
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。