【文献】
LightCycler 480 Instrument Operator's Manual Software Version 1.5,[online],2008年 2月,p.241,[平成28年11月21日検索],URL,http://icob.sinica.edu.tw/pubweb/bio-chem/Core%20Facilities/Data/R401-core/LightCycler480%20II_Manual_V1.5.pdf
【文献】
Sumeet Mahajan et al,SERS-Melting: A New Method for Discriminating Mutations in DNA Sequences,J. AM. CHEM. SOC.,2008年10月29日,Vol.130 No.46,pp.15589-15601
(58)【調査した分野】(Int.Cl.,DB名)
前記第1のデータセットの菱形プロットを表示することをさらに含み、前記菱形プロットは、複製群の中心化傾向および分散を表示する、請求項6に記載のコンピュータ可読媒体。
前記第1のデータセットの菱形プロットを形成することをさらに含み、前記菱形プロットは、複製群の中心化傾向および分散を表示する、請求項11に記載のコンピュータ実装方法。
【発明を実施するための形態】
【0007】
当業者は、タンパク質の融解温度(T
m)の決定を利用する、種々のアッセイを認識し得る。例えば、三次構造を有する、タンパク質が、その三次構造から、ランダムコイル構造となるプロセスは、当技術分野では、例えば、タンパク質変性、タンパク質アンフォールディング、およびタンパク質融解と称されるが、それらに限定されない。加えて、種々のサンプル溶液条件下におけるタンパク質は、サンプル溶液条件の関数として、そのタンパク質に対して観察されるT
mにおいて変動またはシフトを示し得る。熱融解アッセイ(TMA)、熱シフトアッセイ(TSA)、タンパク質熱シフト(PTS)分析、および示差走査型蛍光定量法(DSF)等の種々の用語は、タンパク質または複数のタンパク質のT
mの決定が、分析の中心に置かれる技術分野の用語の実施例である。
【0008】
タンパク質の化学的性質に適用される測定科学の側面に関して、検出器信号振幅の変化は、タンパク質が折り畳まれた状態(folded state)の変化の関数として観察され得る。その点において、種々の分析は、タンパク質サンプルに適用される温度変化の変化に対して変動する蛍光信号振幅の増加または減少のいずれかに基づき得る。
【0009】
例えば、種々の分析では、信号振幅は、トリプトファン等のタンパク質のアミノ酸残基から生じ得る。当業者によって理解されるように、トリプトファンの最大蛍光放出の強度、量子収率、および波長は、非常に溶媒依存性である。トリプトファン残基を取り囲む溶媒の極性が減少するにつれて、蛍光スペクトルは、より短い波長にシフトし、蛍光の強度は、増加する。したがって、タンパク質が変性する(unfolded)につれて、埋め込まれたトリプトファン残基は、より極性の水性溶媒環境に暴露され得、減少する信号振幅が、折り畳まれた状態から、変性された状態に観察され得る。
【0010】
タンパク質分子から生じる内因性信号を使用する代わりに、他の分析は、タンパク質の折り畳まれた状態を示すための色素を利用し得る。例えば、Sypro(登録商標)Orange等の蛍光色素を利用して、タンパク質の折り畳まれた状態を監視し得る。極性溶媒環境におけるSypro(登録商標)Orangeに対しては、蛍光信号の消滅が観察される。溶液中の折り畳まれたタンパク質の表面基に関連付けられたSypro(登録商標)Orangeに対しては、色素は、水性環境にあって、その蛍光信号が消滅される。タンパク質が、例えば、熱変性を使用して、変性されるにつれて、疎水性領域または残基が、暴露され得る。Sypro(登録商標)Orangeは、次いで、疎水性領域または残基に結合し得、蛍光は、それによって、増加され得る。そのようなSypro(登録商標)Orangeアッセイに対して、次いで、折り畳まれた状態から、変性された状態となる、増加する信号振幅が、観察され得る。水性環境では消滅される、1−アニリノナフタレン−8−スルホン酸(1,8−ANS)および4,4′−ジアニリノ−1,1′−ビナフチル−5,5′−ジスルホン酸(Bis−ANS)等の色素は、タンパク質折り畳みを監視するために有用であることが示されており、1,8ANSおよびBis−ANSの蛍光は、例えば、タンパク質再折り畳みのプロセスにおいて、実質的に、増加し得る。
【0011】
タンパク質科学の当業者によって理解されるように、タンパク質熱安定性の監視は、種々の理由から、研究機関ならびに産業の両方において行われ得る。例えば、限定されないが、タンパク質融解曲線研究または熱研究は、例えば、部位特異的突然変異誘発法の結果としての標的タンパク質に対する突然変異の調査のために行われ得る。加えて、タンパク質熱安定性研究は、種々のインビトロ処理および保管条件による、タンパク質安定性に及ぼす影響のスクリーニングのために行われ得る。そのようなタンパク質熱安定性研究は、緩衝剤、リガンド、および有機剤等の種々の添加剤が、着目タンパク質の熱安定性に及ぼし得る影響をスクリーニングし得る。薬物候補のタンパク質標的への結合の高処理量スクリーニングもまた、薬物候補の結合が、タンパク質熱安定性に及ぼし得る影響によって監視され得る。故に、タンパク質熱安定性に影響を及ぼす条件の識別は、タンパク質精製、結晶化、および機能的特性評価に影響を及ぼす、種々の所望の条件の識別を向上させ得る。
【0012】
続いて、より詳細に論じられるように、システムおよび方法の種々の実施形態は、タンパク質融解アッセイのために定義された温度範囲の全体にわたって収集された検出器信号データを利用し得る。そのような信号は、種々のコンピュータ可読媒体内に記憶され得る。本教示に従う、種々の実施形態では、コンピュータプログラム製品が、提供され得、コンピュータプログラム製品は、そのコンテンツが、プロセッサ上で実行されると、エンドユーザに、連続して、かつ迅速に、タンパク質融解曲線データを分析および評価する能力を提供するための方法を実施する命令を伴うプログラムを含む、有形コンピュータ可読記憶媒体を含み得る。
【0013】
図1は、本教示の実施形態が実装され得る、種々の実施形態による、処理機能性を果たすために採用され得る、コンピュータシステム100を図示する、ブロック図である。コンピューティングシステム100は、プロセッサ104等の1つ以上のプロセッサを含むことができる。プロセッサ104は、例えば、マイクロプロセッサ、コントローラ、または他の制御論理等の汎用または特殊目的処理エンジンを使用して、実装することができる。本実施例では、プロセッサ104は、バス102または他の通信媒体に接続される。
【0014】
さらに、
図1のコンピューティングシステム100は、ラック搭載コンピュータ、メインフレーム、スーパーコンピュータ、サーバ、クライアント、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、ハンドヘルドコンピューティングデバイス(例えば、PDA、携帯電話、スマートフォン、パームトップ等)、クラスタグリッド、ネットブック、内蔵システム、あるいは所与の用途または環境に対して望ましい、または適切であり得る、任意の他のタイプの特殊または汎用コンピューティングデバイス等のいくつかの形態のいずれかにおいて具現化され得ることを理解されたい。加えて、コンピューティングシステム100は、クライアント/サーバ環境および1つ以上のデータベースサーバを含む、従来のネットワークシステム、またはLIS/LIMSインフラストラクチャとの統合を含むことができる。ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)を含み、かつ無線および/または有線構成要素を含む、いくつかの従来のネットワークシステムは、当技術分野において公知である。加えて、クライアント/サーバ環境、データベースサーバ、およびネットワークは、当技術分野において詳しく説明されている。
【0015】
コンピューティングシステム100は、情報を通信するためのバス102または他の通信機構と、情報を処理するために、バス102と連結されたプロセッサ104とを含み得る。
【0016】
コンピューティングシステム100はまた、プロセッサ104によって実行されるべき命令を記憶するために、バス102に連結される、ランダムアクセスメモリ(RAM)または他の動的メモリであり得る、メモリ106を含む。メモリ106はまた、プロセッサ104によって実行されるべき命令の実行の間、一時的変数または他の中間情報を記憶するために使用され得る。コンピューティングシステム100はさらに、プロセッサ104のための静的情報および命令を記憶するために、バス102に連結される、読取専用メモリ(ROM)108または他の静的記憶デバイスを含む。
【0017】
コンピューティングシステム100はまた、情報および命令を記憶するために提供され、バス102に連結される、磁気ディスク、光ディスク、または半導体ドライブ(SSD)等の記憶デバイス110を含み得る。記憶デバイス110は、メディアドライブおよびリムーバブル記憶インターフェースを含み得る。メディアドライブは、ハードディスクドライブ、フロッピー(登録商標)ディスクドライブ、磁気テープドライブ、光ディスクドライブ、CDまたはDVDドライブ(RまたはRW)、フラッシュドライブ、あるいは他のリムーバブルまたは固定媒体ドライブ等の固定またはリムーバブル記憶媒体をサポートする、ドライブまたは他の機構を含み得る。これらの実施例が、例証するように、記憶媒体は、そこに記憶された、特に、コンピュータソフトウェア、命令、および/またはデータを有する、コンピュータ可読記憶媒体を含み得る。
【0018】
代替実施形態では、記憶デバイス110は、コンピュータプログラムあるいは他の命令またはデータが、コンピューティングシステム100にロードされることを可能にする、他の類似機器を含み得る。そのような機器は、例えば、プログラムカートリッジおよびカートリッジインターフェース、リムーバブルメモリ(例えば、フラッシュメモリまたは他のリムーバブルメモリモジュール)およびメモリスロット、ならびにソフトウェアおよびデータが、記憶デバイス110からコンピューティングシステム100に転送されることを可能にする、他のリムーバブル記憶ユニットおよびインターフェース等のリムーバブル記憶ユニットおよびインターフェースを含み得る。
【0019】
コンピューティングシステム100はまた、通信インターフェース118を含むことができる。通信インターフェース118は、ソフトウェアおよびデータが、コンピューティングシステム100と外部デバイスとの間で転送されることを可能にするために使用されることができる。通信インターフェース118の実施例として、モデム、ネットワークインターフェース(イーサネット(登録商標)または他のNICカード等)、通信ポート(例えば、USBポート、RS−232Cシリアルポート等)、PCMCIAスロットおよびカード、Bluetooth(登録商標)、および同等物が挙げられ得る。通信インターフェース118を介して転送されるソフトウェアおよびデータは、通信インターフェース118によって受信可能な電子、電磁、光学、または他の信号であり得る、信号の形態である。これらの信号は、無線媒体、ワイヤまたはケーブル、光ファイバ、あるいは他の通信媒体等のチャネルを介して、通信インターフェース118によって伝送および受信され得る。チャネルのいくつかの実施例として、電話回線、携帯電話リンク、RFリンク、ネットワークインターフェース、ローカルまたは広域ネットワーク、および他の通信チャネルが挙げられる。
【0020】
コンピューティングシステム100は、通信インターフェース118を通して、情報をコンピュータユーザに表示するためのブラウン管(CRT)、液晶ディスプレイ(LCD)、および発光ダイオード(LED)ディスプレイ等のディスプレイ112と通信し得る。種々の実施形態では、コンピューティングシステム100は、バスを通して、ディスプレイに連結され得る。英数字および他のキーを含む、入力デバイス114は、例えば、プロセッサ104に情報およびコマンド選択を通信するために、バス102に連結される。入力デバイスはまた、タッチスクリーン入力能力とともに構成される、LCDディスプレイ等のディスプレイであり得る。ユーザ入力デバイスの別のタイプは、方向情報およびコマンド選択をプロセッサ104に通信し、ディスプレイ112上のカーソル移動を制御するためのマウス、トラックボール、またはカーソル方向キー等のカーソル制御116である。本入力デバイスは、典型的には、2つの軸、第1の軸(例えば、x)および第2の軸(例えば、y)における2自由度を有し、デバイスが、平面上の位置を指定することを可能にする。コンピューティングシステム100は、データ処理を提供し、そのようなデータに対する信頼性レベルをもたらす。本教示の実施形態のある実装によると、データ処理および信頼値は、プロセッサ104が、メモリ106内に含まれる1つ以上の命令の1つ以上のシーケンスを実行することに応答して、コンピューティングシステム100によって提供される。そのような命令は、記憶デバイス110等の別のコンピュータ可読媒体から、メモリ106に読み取られ得る。メモリ106内に含まれる命令のシーケンスの実行は、プロセッサ104に、本明細書に説明されるプロセス状態を果たさせる。代替として、有線回路が、本教示の実施形態を実装するためのソフトウェア命令の代わりに、またはそれと組み合わせて、使用され得る。したがって、本教示の実施形態の実装は、ハードウェア回路およびソフトウェアの任意の具体的組み合わせによって限定されない。
【0021】
本明細書で使用されるような用語「コンピュータ可読媒体」および「コンピュータプログラム製品」は、一般に、実行のために、1つ以上のシーケンスまたは1つ以上の命令をプロセッサ104に提供することに関与する、任意の媒体を指す。そのような命令は、概して、実行されると、コンピューティングシステム100が、本発明の実施形態の特徴または機能を果たさせる、「コンピュータプログラムコード」(コンピュータプログラムの形態における群または他の群であり得る)と称される。これらおよび他の形態のコンピュータ可読媒体は、不揮発性媒体、揮発性媒体、および伝送媒体を含むが、それらに限定されない、多くの形態をとり得る。不揮発性媒体は、例えば、記憶デバイス110等の半導体、光学、または磁気ディスクを含む。揮発性媒体は、メモリ106等の動的メモリを含む。伝送媒体は、バス102への接続を含む、同軸ケーブル、銅ワイヤ、および光ファイバを含む。
【0022】
コンピュータ可読媒体の一般的形態として、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、または任意の他の磁気媒体、CD−ROM、任意の他の光学媒体、パンチカード、紙テープ、ある穿孔パターンを伴う、任意の他の物理的媒体、RAM、PROM、およびEPROM、フラッシュ−EPROM、任意の他のメモリチップまたはカートリッジ、本明細書に後述されるような搬送波、またはコンピュータが読み取ることができる任意の他の媒体が挙げられる。
【0023】
種々の形態のコンピュータ可読媒体が、実行のために、1つ以上の命令の1つ以上のシーケンスをプロセッサ104に搬送することに関与し得る。例えば、命令は、最初に、遠隔コンピュータの磁気ディスク上に担持され得る。遠隔コンピュータは、命令をその動的メモリにロードし、モデムを使用して、電話回線を経由して、命令を送信することができる。コンピューティングシステム100にローカルなモデムは、電話回線上でデータを受信し、赤外線送信機を使用して、データを赤外線信号に変換することができる。バス102に連結された赤外線検出器は、赤外線信号内で搬送されるデータを受信し、データをバス102上に置くことができる。バス102は、データをメモリ106に搬送し、そこから、プロセッサ104は、命令を読み取り、実行する。メモリ106によって受信される命令は、随意に、プロセッサ104による実行前または後のいずれかにおいて、記憶デバイス110上に記憶され得る。
【0024】
当業者は、種々の実施形態の動作が、必要に応じて、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組み合わせを使用して、実装され得ることを認識するであろう。例えば、いくつかのプロセスは、ソフトウェア、ファームウェア、または有線論理の制御下、プロセッサまたは他のデジタル回路を使用して、行うことができる。(用語「論理」は、本明細書では、列挙された機能を行うための、当業者によって認識されるであろうような、固定ハードウェア、プログラム可能論理、および/または適切なそれらの組み合わせを指す。)ソフトウェアおよびファームウェアは、コンピュータ可読媒体上に記憶することができる。いくつかの他のプロセスは、当業者に周知のように、アナログ回路を使用して、実装することができる。加えて、メモリまたは他のストレージ、ならびに通信構成要素も、本発明の実施形態において採用され得る。
【0025】
明確にするために、前述の説明は、異なる機能的ユニットおよびプロセッサを参照して、本発明の実施形態を説明していることを理解されるであろう。しかしながら、異なる機能的ユニット、プロセッサ、またはドメイン間の機能性の任意の好適な分布が、本発明から逸脱することなく、使用され得ることは、明白であろう。例えば、別個のプロセッサまたはコントローラによって実施されるべき図示される機能性は、同一のプロセッサまたはコントローラによって実施され得る。故に、具体的機能的ユニットの参照は、厳密な論理的あるいは物理的構造または編成を示すのではなく、説明される機能性を提供するための好適な手段の参照にすぎないものとして見なされる。
【0026】
本教示に従う、タンパク質融解曲線データの分析のための方法およびシステムの種々の実施形態は、
図2に示されるブロック図に描写されるように、循環機器の種々の実施形態を利用し得る。
【0027】
前述のように、タンパク質が、変性され得る方法の1つは、熱変性を使用するものであり、変性は、温度が増加するにつれて、進行し得る。本教示に従う、タンパク質融解曲線の分析のためのシステムおよび方法の種々の実施形態は、
図2に示されるブロック図に描写されるように、熱循環機器の種々の実施形態を利用し得る。
図2に示されるように、熱循環機器は、サンプル支持デバイス内に含まれる複数のサンプル216を覆って設置される、加熱されたカバー214を含み得る。種々の実施形態では、サンプル支持デバイスは、複数のサンプル領域を伴う、ガラス、金属、あるいはプラスチックスライドまたは基板であり得、サンプル領域は、サンプル領域と加熱されたカバー214との間にカバーを有する。サンプル支持デバイスのいくつかの実施例として、標準的マイクロタイター96ウェル、384ウェルプレート、分析あたり数千個のサンプルを処理可能なマイクロデバイス、またはマイクロカード等のマルチウェルプレート、もしくは、例えば、限定ではないが、ガラス、金属、あるいはプラスチックスライドまたは基板から加工される、種々のマイクロ流体デバイス、マイクロカードデバイス、およびマイクロチップデバイス等の実質的平面支持が挙げられ得るが、それらに限定されない。サンプル支持デバイスの種々の実施形態におけるサンプル領域は、スライドまたは基板の表面上に形成された規則的あるいは不規則的アレイにパターン化された、陥凹、くぼみ、孔、リッジ、およびそれらの組み合わせを含み得る。熱循環機器の種々の実施形態として、サンプルブロック218、加熱および冷却のための要素220、および熱交換器222が挙げられ得る。
【0028】
熱循環機器の種々の実施形態は、複数のサンプルを同時に、処理することができ、タンパク質融解曲線データの生成および取得において使用され得る。
図2では、熱循環システム200の種々の実施形態は、タンパク質融解曲線データを生成するために行われる温度範囲の全体にわたって、複数の生物学的サンプルにおける各サンプルに対して、信号のランタイム取得のための検出システムを提供する。検出システムは、電磁エネルギーを放出する照明源と、サンプル支持デバイス内において、電磁エネルギーをサンプル216から受信するための検出器または撮像機210とを有し得る。故に、熱循環機器は、タンパク質融解曲線データの生成および取得の有用なプラットフォームであり得るが、当業者は、検出およびサンプル温度調整能力を有する機器が、タンパク質融解曲線データを生成するために有用であり得ることを認識するであろう。
【0029】
制御システム224は、検出、加熱されたカバー、および熱ブロックアセンブリの機能を制御するために使用され得る。制御システムは、熱循環機器200のユーザインターフェース226を通して、エンドユーザにアクセス可能であり得る。
図1に描写されるようなコンピュータシステム100は、熱循環機器の機能ならびにユーザインターフェース機能の制御を提供する役割を果たし得る。加えて、コンピュータシステム100は、データ処理、ディスプレイ、および報告準備機能を提供し得る。そのような機器制御機能は全て、ローカルに熱循環機器専用であり得、またはコンピュータシステム100は、制御、分析、および報告機能の一部または全部の遠隔制御を提供し得る。
【0030】
前述のように、大量のタンパク質融解曲線データが、同一の実行の間、分析される多数のサンプルの各々に対して、タンパク質融解アッセイのための定義された温度範囲の全体にわたって収集される検出器信号データとして生成され得る。タンパク質融解曲線データの複雑性と相まって、大量のデータを前提として、本教示のシステムおよび方法の種々の実施形態は、サンプル支持デバイス内の各サンプルに対する温度の関数として、検出器信号出力として収集された初期タンパク質融解曲線データから処理されたデータを生成し得る、コンピュータ可読媒体の実施形態を提供する。
【0031】
加えて、本教示のシステムおよび方法の種々の実施形態は、エンドユーザが、双方向ユーザインターフェースを使用して、大きなデータセットおよびその選択されたサブセットを動的に分析するための柔軟性を可能にし得る、コンピュータ可読媒体の実施形態を提供する。そのような双方向ユーザインターフェースは、エンドユーザが、例えば、限定されないが、分析パラメータの新しいセット、データが分析され得る別の方法、データの選択された複製セットに対するデータの検証、ならびに複製セットに対して関連付けられた統計、およびサンプルの標的セットと比較して、選択された閾値内にあり得る、そのデータのセットの検証の選択を補助し得る。
【0032】
図3は、タンパク質融解曲線データの分析のシステムおよび方法の種々の実施形態が、エンドユーザに、タンパク質融解曲線データの大きなデータセットを動的に分析する能力を提供し得る、プロセスを伝えることを意図する、入力/出力図を描写する。
図3に描写されるように、一次入力は、例えば、限定されないが、プレート設定情報、ならびに実行全体にわたって、各サンプルに対して収集された検出器出力信号を含み得る。プレート設定情報は、識別するサンプル名、緩衝剤、リガンドまたは試験化合物のタイプ、タンパク質サンプルのタイプ等、試験される条件とを含む。種々の実施形態では、プレート設定情報は、後に、複製ウェルを識別し、複製統計を含む各試験される条件に対する最終結果を提示するために使用され得る。本教示のシステムおよび方法の種々の実施形態によると、プレート設定情報は、分析前に、エンドユーザによって、一次入力として入力され得、次いで、結果を生成する自動モードの種々の実施形態における分析エンジンにインポートされ得る。そのような情報は、限定されないがサンプルタイプ、サンプル濃度、緩衝剤タイプ、ならびに多数の他のアッセイ条件等の条件に対する値を提供する。種々の実施形態では、プレート設定情報は、アッセイ条件に対する値の手動割当を使用して、エンドユーザによって、二次入力として、実行後に手動で編集することができる。本教示のシステムおよび方法の種々の実施形態に対して、分析群は、実行前に、一次入力として、または実行後分析の間、二次入力としてのいずれかにおいて、エンドユーザによって定義され得る。種々の実施形態では、エンドユーザは、分析群として、マイクロタイタープレート等のサンプル支持デバイス全体から、サンプルデータを定義し得る。種々の実施形態に対して、分析群は、複数のサンプル支持デバイスからのサンプルデータを備え得る。種々の実施形態では、分析群は、1つまたは複数のサンプル支持デバイスから選択されたマイクロタイタープレートからのウェル等、選択されたサンプル領域からのサンプルデータとして、エンドユーザによって定義され得る。種々の実施形態では、単一サンプル支持デバイスから選択されたサンプル領域からのサンプルデータは、複数の分析群に分割され得る。分析群は、同一のまたは異なる条件下、アッセイされる1つのサンプルに対するデータから成り得、または同一のまたは異なる条件下、アッセイされる複数のサンプルから成り得、および任意のそれらの組み合わせであり得る。故に、本教示のシステムおよび方法の種々の実施形態は、エンドユーザに、例えば、限定されないが、プレート設定情報、分析群、分析設定、および閾値設定を定義するための動的柔軟性を提供する。
【0033】
図3における分析エンジンとして描写される、コンピュータ可読媒体の種々の実施形態は、一次または二次入力をとり、処理された融解曲線データ、例えば、限定されないが、検出器信号応答対温度の融解曲線プロット、融解曲線プロットのn次導関数プロット、T
mの決定、それらのデータおよび分析の種々の側面にわたって、エンドユーザにアラートするためのフラグ、およびサンプルの複製として、エンドユーザによって識別されるサンプル群に対する複製群統計(種々の複製群は、分析群を備え得る)を生成することができる。自動または手動モードのいずれかにおける分析設定は、
図3に示されるような各サンプルに対するウェルレベル結果を生成するために使用され得る、検出器出力およびプレート設定情報等の一次入力を利用し得る。エンドユーザによって入力されるプレート設定情報はまた、複製レベル結果および統計を算出するために使用され得る。タンパク質融解曲線分析のためのシステムおよび方法の種々の実施形態では、ユーザインターフェースは、一次入力から処理されたデータの結果を表示し得る。本教示のシステムおよび方法の種々の実施形態に対して、一次入力から処理されたデータの表示を検証し終えると、ユーザインターフェースを通して、エンドユーザは、二次入力の選択によって、データ処理に影響を及ぼすパラメータを変更し得る。本教示のタンパク質融解曲線分析のためのシステムおよび方法の種々の実施形態によると、二次入力は、一次入力に続いて生じる、任意のユーザ入力である。その点において、本教示のシステムおよび方法の種々の実施形態に対して、エンドユーザが、データを分析および表示するためのパラメータを反復的に選択し得る、方法の数は、制限されない。加えて、エンドユーザは、種々のタイプのコンピュータ可読媒体上に記憶された任意の一次データからのデータを並行して分析し得る。その点において、エンドユーザは、エンドユーザがタンパク質融解曲線データの選択および分析を所望し得る、異なる機器、異なる実行、異なる実験条件、または任意の組み合わせから、データを並行して分析し得る。そのようなパラメータとして、例えば、限定されないが、分析設定、分析閾値、分析モード、あるいはT
mが決定され得る方法の選択、サンプルまたは複製群のT
mを別のサンプルまたは複製群と比較する方法、ユーザ選択された実験変数の関数としての複製群表示、およびユーザ定義値の関数としての複製群表示が挙げられ得る。プレート設定関連情報は、特に、ΔTm、複製レベルフラグ、および統計分析等を生成するために、2つ以上のウェルを要求する全結果に影響を及ぼし得る。
【0034】
図4−
図6では、初期タンパク質融解曲線データを分析するための方法の種々の実施形態が、示される。方法300のための
図3、方法310の
図4、および方法320の
図5のステップ10では、初期タンパク質融解曲線データのデータセットは、複数のサンプルのために、プロセッサによって受信される。前述のように、初期タンパク質融解曲線データは、複数のサンプル内の各サンプルに対して、温度の関数として検出器信号を備える。
【0035】
図4−
図6を参照すると、それぞれ、複数のサンプルタンパク質融解曲線の各々を前処理する、方法300および310のためのステップ20は、検出から収集されたデータの雑音を除去するために行われ得る。信号処理の当業者によって理解されるように、データの雑音除去は、限定されないが、精選、正規化、変換、特徴抽出、および特徴選択等のプロセスステップを含み得る。種々の実施形態に対して、第1のグローバル平滑化ステップが、行われ得、より高い周波数雑音成分が、除去され得る。種々の実施形態では、フーリエ変換平滑化が、適用され得る。種々の実施形態によると、第2のローカル平滑化が、行われ得る。種々の実施形態では、ローカル回帰平滑化が、行われ得、サンプル融解曲線は、定義されたウィンドウにわたって、連続して平滑化される。種々の実施形態に対して、ウィンドウは、データ点の数およびシステム雑音等の要因に基づいて、選択され得る。種々の実施形態によると、限定されないが、二次回帰、線形回帰、およびSavitzky−Golay平滑化関数等のローカル平滑化関数が、適用され得る。種々の実施形態では、ロバストな二次または線形平滑化関数が、使用され得る。
【0036】
タンパク質融解曲線データの分析のための種々のシステムおよび方法に対する、方法300の
図4のステップ30および方法310の
図5のステップ40を参照すると、前処理データのステップ後、分析の領域を選択するステップが、行われ得る。
【0037】
タンパク質融解曲線データの分析のためのシステムおよび方法の種々の実施形態によると、分析の領域を識別するステップ後、ボルツマン適合が、サンプルタンパク質融解曲線に適用され得る。種々の実施形態によると、ボルツマン適合を記述する式は、以下によって求められ得る。
【0038】
【数1】
式中、
F
Tinitial=データが適合される、初期温度に対する信号振幅であり、
F
Tfinal=データが適合される、最終温度に対する信号振幅であり、
T=F
TinitialとF
Tfinalとの間の任意のデータ点に対する温度であり、T
m=適合に対して解決されるべき、曲線に対するタンパク質融解温度であり、
C=定数である。
【0039】
式1の検討から分かるように、ボルツマン適合関数は、初期温度における信号振幅および最終温度における信号振幅に対して、項を有する。種々の実施形態によると、方法300のための
図4のステップ30および方法310のための
図5のステップ40に示されるように、データを適合するために、初期および最終温度範囲を定義する分析の領域が、識別され得る。種々の実施形態によると、方法310のための
図5および方法320のための
図6のステップ30に示されるように、データの少なくとも1つのn次導関数が、分析の領域を選択するために、サンプルタンパク質融解曲線に関して行われ得る。種々の実施形態では、データの一次導関数が、求められ得る。種々の実施形態に対して、平滑化されたデータの一次導関数が、求められ得、導関数信号が、さらに平滑化され、高周波数成分を除去し得る。故に、種々の実施形態に対して、信号の単調上昇の領域が、本平滑化された導関数プロファイル上の正の信号値の領域から識別され得る。種々の実施形態では、信号上昇の最長および最急傾斜区画が、分析の領域として選択され得る。種々の実施形態では、データの一次導関数が、求められ得る。種々の実施形態に対して、平滑化されたデータの一次導関数が、求められ得る。種々の実施形態によると、高次導関数が、初期または平滑化されたデータから求められ得る。種々の実施形態では、分析の領域を正確に識別するために、導関数信号は、種々のスケーリング(反転等)を受け、信号の数学的および/またはデータ提示特性を改善し得る。
【0040】
方法300のための
図4のステップ40および方法310のための
図5のステップ50に描写されるように、サンプル曲線に対する最良適合融解温度T
mが、見出され得る。種々の実施形態によると、かつ式1を参照すると、最良適合T
mは、最良適合が決定された場合、ボルツマン適合関数から導出され得る。種々の実施形態によると、定数Cは、自己無撞着プロセスを通して、サンプルタンパク質融解曲線データに対する適合プロセスにおいて解決され、定数は、式1にデータを適合する反復プロセスにおいて定義される。種々の実施形態に対して、最良適合は、平均2乗誤差項が、閾値に収束するとき、適合プロセスにおいて収束され得る。種々の実施形態によると、Levenberg−Marquardtアルゴリズム等のアルゴリズムが、タンパク質融解曲線データ等のデータ間の最小誤差、およびそのようなデータへの非線形最小二乗適合が、到達されるであろうモデルの種々のパラメータを捜すために使用され得る。
【0041】
図4に示されるような方法300、
図5の方法310、および
図6の方法320の種々の実施形態に対して、式1に示されるようなボルツマン式は、複数の分析属性にわたって変動性を有する、種々のタンパク質融解曲線データへの適合を提供し得る。種々の実施形態に対して、分析属性として、例えば、限定されないが曲線形状、背景信号、信号振幅変化、および雑音が挙げられ得る。
【0042】
図5の方法310および
図6の320の種々の実施形態によると、分析の領域を識別する基礎を提供する、n次導関数に加え、T
m値も、n次導関数を使用することによって決定され得る。本教示の種々のシステムおよび方法によると、エンドユーザは、n次導関数を使用して、ボルツマン適合によって決定されるT
m値と比較することによって決定されたT
m値を使用し得る。種々の実施形態では、エンドユーザは、ボルツマン決定T
m値またはn次導関数によって決定されたT
m値のいずれかを選択し得る。
【0043】
図6の方法320の種々の実施形態に対して、移動閾値が、n次導関数データに関して使用され、ピークを識別し得る。
図6の方法320の種々の実施形態に対して、ステップ10−30は、
図4の方法300および
図5の方法310の対応するステップに関して前述されたように実施され得る。当業者によって理解されるように、タンパク質は、多相融解を受け得る。故に、そのようなタンパク質に対して、多相融解を受けるタンパク質の融解曲線に対して決定され得る、複数のT
m値が存在し得る。エンドユーザは、
図4の方法300および
図5の方法310の種々の実施形態に従って、分析の種々の選択された領域に対してボルツマン適合を使用して、多相融解曲線を分析し得る。加えて、エンドユーザは、
図6の方法320の種々の実施形態に従って、多相融解曲線を分析し得る。
【0044】
図6の方法320の種々の実施形態に対して、ステップ40では、分析の領域は、多相融解曲線のn次導関数プロットの信号限界R
1およびR
2内で選択され得る。種々の実施形態では、多相融解曲線のn次導関数プロットの限界R
1およびR
2は、信号値の約20%から約99%であり得る。種々の実施形態に対して、多相融解曲線のn次導関数プロットの限界R
1およびR
2は、信号値の約10%から約99%であり得る。種々の実施形態に対して、下限は、明確に、背景雑音から区別された分析信号以上であるように選択され得る。種々の実施形態では、エンドユーザが、多相融解曲線のn次導関数プロットの限界R
1およびR
2を選択し得る。
【0045】
図6の方法320の種々の実施形態によると、ステップ50では、閾値は、多相融解曲線のn次導関数プロットの限界R
1およびR
2内において、段階的に連続して移動され得る。種々の実施形態によると、段階的に求められる閾値の数は、約50閾値から約1000閾値であり得る。種々の実施形態では、段階的に求められる閾値の数は、約200閾値から約600閾値であり得る。種々の実施形態に対して、段階的に求められる閾値の数は、エンドユーザによって選択され得る。例えば、アッセイ毎および機器毎に変動し得る、ショルダーピーク等の多相融解曲線のn次導関数プロットにおける特徴、および雑音が存在し得る。小さいショルダー特徴を有する多相融解曲線のn次導関数プロットに対して、より多数のステップが、そのような特徴を分析するために、必要であり得る。対照的に、雑音の多いデータに対して、多過ぎるステップは、分析アーチファクトをもたらし得る。加えて、信号限界R
1とR
2との間の段階的に求められる閾値の数が増加すると、分析時間も増加する。
【0046】
図6の方法320の種々の実施形態によると、ステップ50では、ピークは、任意の1つのステップにおいて、任意の1つの閾値における閾値を上回る、連続的領域として識別され得る。種々の実施形態では、2つ以上のピークが、エンドユーザによるデータ検討において視覚的に明確であり得る、連続的領域に対して、最大規模のピークが、そのステップにおけるピークとしてカウントされ得る。例えば、
図7では、タンパク質に対する多相融解の一次導関数グラフが、描写される。
図7では、ラインI−VIはそれぞれ、4つの異なるステップにおいて選択された閾値を表す。連続閾値I−IIの各々において、ピークは、閾値を上回る連続的領域として定義され得る。例えば、
図7では、ステップ1の閾値Iにおいて、2つのピーク(P
1およびP2)が、決定されるであろう一方、ステップ2の閾値IIでは、3つのピーク(P
1、P
2、およびP
3)が、決定されるであろう。しかしながら、ステップ3の閾値IIIでは、最大規模のピークである、P
2のみ、カウントされるように、P
2およびP
3を含む連続的領域が生じる。そして、ステップ3の閾値IIIに対して、2つのピーク(P
1およびP
3)が、カウントされる。最後に、ステップ6の閾値VIでは、3つのピーク(P
1、P
2、およびP
4)が、カウントされる。
【0047】
図6の方法320の種々の実施形態に対して、閾値は、連続して、多相融解曲線のn次導関数プロットの限界R
1とR
2の間で段階的に移動され、カウントされたピークの頻度が、決定され得る。種々の実施形態によると、正規化値は、以下のように、ピークに対するカウントの最高頻度、
Norm=max(N
1,N
2,・・・N
n)
に基づいて、得られ得る。
本式では、N
1、N
2,・・・N
nは、ピーク(P
1、P
2・・・P
n)が、多相融解曲線のn次導関数プロットの限界R
1とR
2との間の連続移動閾値に対して段階的にカウントされる回数を表す。加えて、
図3の方法120の種々の実施形態に対して、ピーク検出頻度値は、以下のように、各ピークに対して決定され得る。
Γ(n)=N
1/max(N
1,N
2,・・・N
n),N
2/max(N
1,N
2,・・・N
n),...Ν
n/max(N
1,N
2,・・・N
n)
本式では、各ピークに対するピーク検出頻度は、ピークが、正規化値によって除算される連続移動閾値に対して連続的にカウントされる回数の商として決定される。
【0048】
図6の方法320の種々の実施形態によると、棄却限界が、選択された限界未満の値を有するいずれのピークも、カウントされないように、Γ(n)に対して設定され得る。
X%=Nr/max(N
1,N
2,・・・N
n)
種々の実施形態では、棄却限界X%は、約0.5%から約6%であり得る。種々の実施形態では、エンドユーザが、棄却限界を選択し得る。
図3の方法120の種々の実施形態の実施例は、
図8に描写される。
図8では、19の連続的段階的閾値が、求められ、ピークの数が、19の閾値の各々において決定された。本実施例では、P
1は、Γ(1)16%で、3回、カウントされ、P
2は、Γ(1)5%で、1回、カウントされ、P
3は、Γ(1)100%で、19回、カウントされる。2%に設定された棄却限界に対しては、本実施例における全ピークが、一次導関数ピーク値によって決定されたT
m値を有するピークとして選択されるであろう。6%に設定された棄却限界に対しては、P
2は、棄却され、2つのピークP
1およびP
3が、一次導関数ピーク値によって決定されたT
m値を有するピークとして選択されるであろう。
【0049】
本教示に従うタンパク質融解曲線データの分析のためのシステムおよび方法の種々の実施形態において、方法300の
図4のステップ50、および、方法310および320のための
図5および
図6のステップ6に関し、
図3に描写されるような分析エンジンが、処理されたデータを生成し得る。前述のように、分析エンジンは、一次および二次入力の両方から処理されたデータを生成し得、二次入力は、一次入力に続いて生じる、任意のユーザ入力である。その点において、本教示のシステムおよび方法の種々の実施形態に対して、エンドユーザは、データを分析および表示するためのパラメータを反復的に選択し得る。そのようなパラメータとして、例えば、限定されないが、分析設定、分析閾値、T
mが決定され得る方法、サンプルまたは複製群のT
mを別のサンプルまたは複製群と比較する方法、ユーザ選択された実験変数の関数としての複製群表示、およびユーザ定義閾値の関数としての複製群表示、ならびにエンドユーザによって二次入力として入力されたプレート設定情報が挙げられ得る。本方式では、エンドユーザは、潜在的に大きなセットのタンパク質融解曲線データに対して、実行中および実行間の分析の両方から生成される、データおよびデータのサブセットを双方向的かつ反復的に分析し得る。その点において、エンドユーザは、並行して、種々のタイプのコンピュータ可読媒体上に記憶された任意の一次データからデータを分析し得る。故に、エンドユーザは、並行して、異なる機器、異なる実行、異なる実験条件、またはエンドユーザが、タンパク質融解曲線データを選択および分析することを所望し得る、任意の組み合わせから、データを分析し得る。したがって、生成される結果は、グラフィカルに表示され、加えて、テーブル形式で提示され得る。種々の実施形態によると、続いて、より詳細に論じられるように、そのようなグラフィカルおよびテーブル表示は、同一のディスプレイ上で動的に同期され得る。故に、テーブル形式内の行入力を選択することによって、グラフィカルディスプレイエリア上の対応するプロットがハイライトされるであろう。種々の実施形態では、エンドユーザは、独立して、情報の詳細な検証のための任意のグラフィックを拡大し得る。種々の実施形態に対して、テーブル形式で表示される情報は、例えば、マウスまたはキーストロークを使用して、列ヘッダ名として入力される複数の属性のいずれかを選択し、それによって、選択された属性別にソートされたテーブル形式内の情報を提供することによって、ソートされ得る。
【0050】
例えば、式1の検討から分かるように、ボルツマン適合関数は、初期温度における信号振幅および最終温度における信号振幅に対する項を有する。種々の実施形態によると、
図9に示されるように、双方向GUI400は、データ430へのボルツマン適合をデータ435のn次導関数と比較するために、初期410および最終420温度範囲を定義する、分析の領域の表示を提供し得る。種々の実施形態では、データの一次導関数が、
図9に示されるように、求められ得る。データ435の一次導関数と比較して、データ430へのボルツマン適合を表示する、双方向GUIの種々の実施形態に対して、データは、サンプル450のデータテーブルリストと動的に同期され得る。種々の実施形態に対して、サンプルライン452が、エンドユーザによって、テーブル内でハイライトされ得、対応するデータ440、445が、それぞれ、ボルツマン適合データセット430およびデータ435の一次導関数セット内で視覚的に明確にされる。種々の実施形態では、エンドユーザは、対応するグラフの選択的閲覧のために、任意のラインまたはラインの組み合わせを選択し得る。加えて、サンプルテーブル450上に示されるのは、フラグアイコン454の実施例であり、続いて、より詳細に論じられるように、エンドユーザに、データ品質およびデータ分析に影響を及ぼすいくつかの要因をアラートし得る。サンプル450のデータテーブルリストとデータプロット430、435の動的同期は、エンドユーザが、選択されたデータ群を視覚的に評価することを促進し得、そのような評価の迅速反復を可能にし得る。例えば、限定されないが、そのような動的同期は、エンドユーザが、ボルツマン適合が、選択されたデータ群に対して適切な適合であるかどうかを評価することを可能にし得る。さらに、エンドユーザに、データ品質およびデータ分析に影響を及ぼす要因をアラートするフラグは、エンドユーザが、分析の全体的品質に影響を及ぼす重要な問題を検証することを容易にし得る。
【0051】
図9では、エンドユーザによって動的に選択されるグラフが、ボルツマン適合グラフ440および一次導関数グラフ445内でハイライトされ、全データセットとの比較を可能にするが、本教示に従う、双方向GUIの種々の実施形態では、
図10Aおよび
図10Bに示されるように、双方向GUI500は、エンドユーザが、選択されたボルツマン適合データ540および対応する一次導関数データ545(
図10B)のみ閲覧可能にする、ポップアップウィンドウ580(
図10A)から選択を行うこと可能にし得る。分析される全データの関連の中でウェルレベルデータ検証に加え、エンドユーザは、種々の実験条件の関連の中でデータを査定することを所望し得る。この目的を達成するために、研究されるアッセイ条件は、色に関連付けられるように、エンドユーザによって、入力され得る。
【0052】
これらの色の関連付けは、分析エンジンによって保存され得、
図11に示されるように、グラフィカルディスプレイ内で起動されることができ、曲線は、具体的条件の属性値によって色分けされる。
図11に示されるディスプレイ内で使用されるデータは、経時的研究として生成され、そこでは、色素濃度が変動し、したがって、変動が、時間および色素濃度を示すための色コードを使用して表示された。種々の実施形態によると、異なる条件カテゴリは、例えば、ドロップダウンメニューから、エンドユーザによって選択され得る。種々の実施形態によると、エンドユーザはさらに、色を使用して、データ分析を向上させる一方、テーブル形式とグラフィカル形式との間の同期した相互作用を維持し得る。
図3に関して前述のように、エンドユーザが、データ検証の間、プレート設定詳細を編集する場合、そのような二次入力が、考慮され、属性を表示するための色の使用は、ウェルレベル属性値のための新しい色コードを伴って再表示されるであろう。
【0053】
図11に描写されるように、分析の領域は、第1の温度選択410および第2の温度選択420によって境界され、自動的に、決定され得、またはエンドユーザによって手動で選択され得る。
図11では、2つのセットの曲線、430および432が、研究中の同時点から得られるが、色素濃度に差異を示す。
図11に描写されるように、曲線435および437は、それぞれ、曲線430および432の一次微分プロットである。サンプルテーブル450は、
図11に部分的に提示されるデータの分析群を定義するために使用された、複数のサンプル支持デバイス内の単一サンプル支持デバイスから選択されたサンプルデータに対する情報を示す。
【0054】
前述のように、分析群は、エンドユーザによって、種々の方法で選択され得る。エンドユーザは、分析群として、マイクロタイタープレート等のサンプル支持デバイス全体から、サンプルデータを定義し得ることを思い出されたい。種々の実施形態に対して、分析群は、複数のサンプル支持デバイスからのサンプルデータを備え得る。種々の実施形態では、分析群は、1つまたは複数のサンプル支持デバイスから選択される、マイクロタイタープレートからのウェル等の選択されたサンプル領域からのサンプルデータとして、エンドユーザによって定義され得る。種々の実施形態では、単一サンプル支持デバイスから選択されたサンプル領域からのサンプルデータは、複数の分析群に分割され得る。分析群は、同一のまたは異なる条件下でアッセイされた1つのサンプルに対するデータから成り得、または同一のまたは異なる条件下でアッセイされた複数のサンプルから成り得、および任意のそれらの組み合わせであり得る。さらに、分析群は、実行前の一次入力として、または実行後分析の間の二次入力としてのいずれかにおいて、エンドユーザによって定義され得る。例証の目的のために、2つのセットのサンプルデータが、
図11における本研究から表示されるが、ウィンドウ470は、表示のために含まれるサンプルデータが、352のサンプル領域によって定義された分析群から求められることを示す(サンプル領域は、本実施例では、複数のサンプル支持デバイス、本実施例では、マイクロタイタープレートから得られたサンプルウェル)。種々の実施形態では、分析群を定義するサンプルデータは、約1から約100のサンプル支持デバイスから選択され得る。したがって、本教示に従う、システムおよび方法の種々の実施形態は、エンドユーザに、大量かつ複雑なデータを双方向的に表示し、動的に分析する能力を提供する。
【0055】
前述のように、タンパク質融解データは、限定されないが曲線形状、背景信号、信号振幅変化、および雑音等の種々の分析属性によって影響を受け得る。加えて、バイオポリマーの部類としてのタンパク質は、三次および四次折り畳みモチーフに関する一次および二次構造の複雑性を前提として、複雑な融解曲線を有し得る。その点において、エンドユーザに、双方向GUIを通して、連続かつ迅速に、複数のサンプルに対して複雑なタンパク質融解曲線データを評価するための柔軟性を提供することは、データ分析プロセスを促進し得る。
【0056】
本教示に従う、双方向GUIの種々の実施形態によると、エンドユーザによる双方向選択が、行われ得、タンパク質融解曲線実験における複数のサンプルに対するデータの迅速かつ連続評価を可能にする。例えば、
図12のGUI600に示されるように、曲線640のボルツマン適合に対して決定されたT
m642の評価対n次導関数645によって決定されたT
m644は、エンドユーザに、ボルツマン適合が、評価されているデータに適切であるかどうかの評価のためのツールを提供し得る。本実施例から分かるように、ボルツマン適合640に対して決定されたT
m642対一次導関数645によって決定されたT
m644は、非常に近接する。しかしながら、続いて論じられるように、タンパク質融解データの複雑性を前提として、比較は、エンドユーザに、T
mが決定され得る方法を決定するためのツールを提供し得る。
【0057】
前述のように、タンパク質融解曲線データに対するT
mの決定は、分析の領域を識別するステップ後、ボルツマン適合されたデータから行われ得る。本教示に従う、
図13の双方向GUI700の種々の実施形態に対して、エンドユーザは、ボルツマングラフに対して、かつ同期して、一次導関数グラフ等のn次導関数グラフに対して、分析の領域を容易かつ反復的に変更し得る。これは、例えば、限定されないが、双方向ツールをドラッグアンドドローすることによって行うことができる。そのような双方向ツールは、エンドユーザが、初期の第1の境界710を新しい第1の境界711に移動することによって、分析の新しい分析領域を選択することを可能にするであろう。加えて、エンドユーザは、初期の第2の境界720を新しい第2の境界721に移動することによって、分析の新しい分析領域を選択する。本教示に従う、システムおよび方法の種々の実施形態に対して、
図3に示されるように、分析エンジンは、次いで、エンドユーザからの新しい入力に従って、データを生成して表示し得る。分析の領域の反復選択は、エンドユーザに、タンパク質融解曲線データに対するT
mの決定に及ぼす、分析の領域の選択の影響を理解するための迅速かつ視覚的手段を与え得る。
【0058】
ボルツマン適合を使用して決定されるT
mの比較は、一次導関数等のn次導関数を使用して決定されるT
mの決定と関連して、検討することによって評価され得るが、本教示に従う、双方向GUIの種々の実施形態はまた、そのような評価のための追加のツールを提供し得る。
図14の双方向GUI800の種々の実施形態によると、ボルツマン適合810は、データ曲線840と一致して、かつ一次導関数曲線845等のn次導関数曲線と同期して、視覚的に表示され得る。
図12に対して前述のように、ボルツマン適合されたデータ810から決定されたT
m842は、直接、n次導関数曲線845から決定されたT
m844と比較され得る。
【0059】
タンパク質構造の複雑な性質は、各相遷移に対して、決定されるT
mが存在し得る多相融解曲線と結び付く。そのような多相データのセットは、
図14および
図15に描写される。そのような多相融解曲線データに対して、ボルツマン適合は、適切な適合モデルではない場合がある。
図15の双方向GUI900の種々の実施形態では、エンドユーザは、サンプルテーブル950からデータ952のサブセットを選択し得、サンプル融解曲線930の多相セットに対するデータ952のサブセットが、視覚的に明確となり940、曲線935のn次導関数セットに対して同期して明確となる945。本方式では、エンドユーザは、サンプルテーブル952から、連続して、データのセットの任意のものを選択し、融解曲線セット930ならびに曲線935のn次導関数セット内のデータを閲覧し得る。そのような相互作用GUIディスプレイは、エンドユーザが、多相融解プロファイルを表示するタンパク質の相遷移の各々に対して、T
mを容易に決定することを可能にし得る。
【0060】
代替として、
図16の双方向GUI1000に示されるように、エンドユーザは、具体的には、サンプルテーブル内で選択されたデータのサブセットのみ、表示するように選ぶことができる。本教示に従う、双方向GUIの種々の実施形態によると、エンドユーザは、第1の境界1010および第2の境界1020を有し、かつその選択された適合に対して決定されたT
m1027を有する定義された分析領域にわたって、融解曲線1040へのボルツマン適合1025を評価し得る。GUI1000の種々の実施形態に対して、導関数曲線1045は、同期して表示され得る。
図16の検討から分かるように、そのようなT
m決定は、分析のモードまたは方法として選択されたボルツマン適合に対してと、別個に決定された各相に対してとでは、有意に異なり得る。
【0061】
前述のように、本教示のシステムおよび方法の種々の実施形態は、グラフィカルディスプレイ内で色を使用して、エンドユーザに、例えば、限定されないが、種々の実験条件を視覚的に識別するためのツールを提供し得る。したがって、研究される属性または条件の離散値は、プレート設定情報内において、エンドユーザからの入力によって色分けされ得る。
図16に示されるように、色はまた、適合曲線1025対多相曲線1040を区別するために利用され得る。故に、本教示のシステムおよび方法の種々の実施形態は、色またはラインタイプ等の、サンプルデータのグラフィック表示のための種々の形式選択を利用して、エンドユーザに、複数の変数に従って、サンプルデータの種々のグラフィック入力を容易に視覚的に区別する容易性を提供し得る。
【0062】
加えて、
図15のGUI900または
図16のGUI1000のいずれかに対して、
図13に対して前述のように、エンドユーザは、多相融解データ内の相の各々に対して、分析領域を選択するための双方向手段を利用し得る。
【0063】
示されるように、例えば、限定されないが、
図15と比較して、
図9では、
図9の複数の融解曲線430に対する基線は、実質的に、整列されて見える一方、
図15における複数の融解曲線930に対する基線は、縦座標値のある範囲にわたってシフトされて現れるように見える。本教示の種々の実施形態によると、エンドユーザは、曲線を容易に整列させ得る。それぞれ、
図17Aおよび17Bの双方向GUI1100および1110に描写されるように、エンドユーザは、
図17Aに示されるように、曲線1140Aおよび1140Bを整列させるためのポップアップボックス(図示せず)から、整列機能を選択し、
図17Bに描写されるような整列をもたらし得る。種々の実施形態では、整列機能が、エンドユーザによって選択されると、平均縦座標オフセットが、計算され、曲線の選択されたセットの曲線は、次いで、
図17Bに示されるように、整列されるように、平均値に調節される。そのような基線整列特徴は、例えば、エンドユーザが、曲線の選択されたセットの曲線間の類似性および差異を視覚的に比較することを可能にし得る。例えば、限定されないが、そのような基線整列特徴は、エンドユーザが、x−オフセットを評価することを可能にし得、または選択されたデータセットの曲線形状の差異の評価を可能にし得る。
【0064】
本教示に従う、双方向GUIの種々の実施形態は、タンパク質融解データセットの複数のサンプルに及ぼす実験変数の影響の理解を促進し得る。そのような変数として、例えば、限定されないが、中性塩タイプおよび濃度、カオトロピック剤タイプおよび濃度、緩衝剤タイプ、すなわち、pHおよび濃度、タンパク質サンプル、ならびに分析群が挙げられ得る。タンパク質融解曲線データの分析のためのシステムおよび方法の種々の実施形態に対して、
図3に描写されるような分析エンジンは、選択された分析群に対する種々の複製群統計を決定し得る。そのような複製群統計として、例えば、限定されないが、平均値および中央値等の中心化傾向の表現、ならびに標準偏差およびCV%等の分散の表現が挙げられ得る。
図3に描写されるように、一次または二次入力から決定される、そのような複製群統計は、次いで、双方向ユーザインターフェース上に表示され得る。
【0065】
例えば、本教示に従う、双方向インターフェースの種々の実施形態は、
図18のフレームI−IIIに描写されるように、表示され得る。
図17の上2つのフレームでは、プロット(I)は、基準複製サンプルのセットに対する複製群統計の視覚的描写である。複製データのユーザ選択されたセットに関して、分析エンジンによって生成された複製された群統計に対して、複製群統計が、視覚的に表され得る。
【0066】
本教示に従う、双方向GUIの種々の実施形態によると、
図18に描写されるように、複製群統計が、プロット(I)に示されるように、菱形プロットによって、部分的に、視覚的に表され得る。本菱形プロットに対して、T
m値の平均は、第1の頂点のセットを交差する、第1の垂直ラインによって示される一方、水平ラインによって交差される第2の頂点セットは、平均値の95%信頼区間を表す。複製データのユーザ選択されたセットに関して、分析エンジンによって生成されるT
m値の中央値は、第2の異なる垂直ラインとして描写される。本実施例に対して、プロット(I)に対する複製群統計は、前述のようなコンピュータおよび機器システムの種々の実施形態を使用して、実行された別個の分析に対する2つの別個のサンプル支持デバイス上で実行された基準サンプルのセットに対して、ユーザ選択されたデータによって生成された。各プレートからの各サンプルに対する複製T
m値は、白色円形によって描写される、第1のセットとして、容易に視覚的に識別され得、第2のセットは、黒色円形によって描写される。そのようなT
m値に対する中心化傾向および分散の視覚的表示は、エンドユーザが、例えば、データ品質を評価することを容易に可能にし得る。例えば、「X」によって表されるデータ点は、続いて、より詳細に論じされるように、分析フラグに基づいて、省略されるべきであるとエンドユーザによって選択されたデータ点である。加えて、複製群統計T
m値の視覚的比較は、実験結果の容易な理解を可能にし得る。その点において、
図18のプロットIIに示される表現は、プロットIにおけるサンプルの基準セットとの比較のために選択されたサンプルの実験セットに対するものである。示されるように、一見しただけで、エンドユーザは、基準および実験セットの複製群統計を容易に比較し得る。例えば、限定されないが、エンドユーザは、容易に、一見しただけで、サンプルの実験セットに対する平均T
mが、サンプルの基準セットに対する平均T
mより高い温度にシフトされたことを判別し得る。加えて、菱形プロットの形状は、視覚的にほぼ同一であり、2つのデータセットの分散が、ほぼ同一であることを示す。本教示のシステムおよび方法の種々の実施形態によると、種々の幾何学的および線形状、色、ならびに形式は、エンドユーザに、複製群タンパク質融解曲線データを視覚的に与えるために使用され得る。
【0067】
図18では、プロットIIIは、三相融解を有するデータセットに対する複製群統計の相別(staggered)セットを示す。続いて、より詳細に論じられるように、そのような多相タンパク質融解遷移に対して、平均T
mは、各遷移に対して決定され、関連付けられた視覚的分散が、ユーザインターフェースに反映され得る。
【0068】
図9のフラグ454の実施例において前述されたように、タンパク質融解曲線データの分析のためのシステムおよび方法の種々の実施形態は、エンドユーザに、例えば、限定されないが、信号の品質等の初期データ属性、複数相の検出、ならびに曲線適合および複製群比較等の問題に関して、アラートを提供する。
図19では、エンドユーザがアラートされ得る問題のいくつかのタイプを示す、テーブルが示される。
図19から分かるように、タンパク質融解曲線分析のためのシステムおよび方法の種々の実施形態に対して識別され得る、各タイプの問題に対して、アイコンが、選択され得る。アイコンとフラグの関連付けは、したがって、全数のサンプル実行またはその任意のサブセットの容易な視覚的アラートとして作用し得る。これらのフラグのサブセットは、プレート設定編集によって変更されない、ウェルレベル(サンプルレベル)フラグであり、
図3に従って、二次入力として、エンドユーザによって入力され得る。残りの複製群フラグは、プレート設定編集によって変更され、複製群を備えるサンプルの指定を変更し得る。
【0069】
図20の双方向GUI1200の種々の実施形態に対して、複製群テーブル1260が、前述のようなサンプルウェルテーブル1250に加え、エンドユーザに提供され得る。複製群テーブル1260は、サンプルタンパク質1264の識別された群1262に属する複製サンプルの選択ならびに種々の実験変数(1266、1268)を含み得る。本教示のシステムおよび方法の種々の実施形態によると、複製群データ(1230−1236)は、例えば、GUI1200内に、それぞれ、緩衝剤、塩、分析群、およびタンパク質として表示される、実験変数1270−1276の選択されたセットに対するT
m値に関して、閲覧され得る。複製は、菱形プロット1230−1236によって表され得、前述のように、複製群の中心化傾向および分散に関する重要な情報を視覚的に伝達する。重複していない菱形プロットは、実験変数が、例えば、
図13に示されるように、複製の選択されたセットに対するT
m値に及ぼし得る影響を視覚的に表示する。
図9の双方向GUI1200に示されるように、実験変数は、複製群表1260内ならびに複製群データの表示(1230−1236)に隣接しての両方で示される。
【0070】
本教示に従う、双方向GUIの種々の実施形態では、ポップアップボックスが、変数の順序、ひいては、階層を変化させるために使用され得る。これは、エンドユーザが、連続して、かつ迅速に、実験変数を変化させ、タンパク質融解サンプルのセットから選択された複製に及ぼす変数の影響を評価する能力を可能にし得る。例えば、
図21および
図22において、そのような変化が、実証される。
図21に対して、双方向GUI1300の種々の実施形態は、変数の選択を表示する、条件付き階層ツリーポップアップボックス1380を有し得る。エンドユーザは、条件付き階層ツリーポップアップボックス1390に示されるように、任意の実験変数を選択し、次いで、選択された変数1395を新しい位置に移動させ得る。
図22では、菱形プロット1430−1436の新しいセットが、閲覧され得るように、緩衝剤が、別の位置にシフトされたことが、
図20の菱形プロット1230−1236と比較して、明確である。
図22の変数1470−1476の順序は、本時点において、
図20の変数1270−1276の順序に対して、リセットされている。
図23では、さらに別の順序の選択が、GUI1500の1570−1576に対して行われている。エンドユーザが、
図22に示されるように、例えば、塩濃度と比較した分析群の関数として、菱形プロット1530−1532のシフトを容易に選別し得ることが明白である。
【0071】
図24A−
図24Cは、二相性融解プロファイルを有するタンパク質に対する基準および実験データの複製セットのための処理されたデータを表示する、双方向GUI1600の種々の実施形態を描写する。
図24Aでは、GUI1600の種々の実施形態は、タンパク質融解曲線1630の第1のセットおよび導関数曲線1635の対応する第1のセットを表示し得る。加えて、種々の実施形態は、エンドユーザに、タンパク質融解曲線セット1630′等のタンパク質融解曲線の追加のセットまたは複数のセットおよび導関数曲線1635′の対応するセットの選択を提供し得、第1のセットと同時に閲覧され得る。本方式では、エンドユーザは、例えば、異なる実験条件を使用して、求められた、または異なる実行から求められたデータのセットを動的に比較し得る。タンパク質融解曲線データを分析するためのシステムおよび方法の種々の実施形態に対して、第1の曲線セットは、選択された第2のセットより視覚的により明瞭に現れ、第2のセットへの視覚的参照を維持しながら、第1のセットの双方向分析に焦点を当てることを可能にし得る。
図24Aでは、例えば、タンパク質融解曲線1630および対応する導関数曲線1635の第1の基準セットは、タンパク質融解曲線1630′および対応する導関数曲線1635′の実験セットよりはっきりしている。GUI1610に対する
図24Bにおける比較において、実験タンパク質融解曲線1630′および対応する導関数曲線1635′のセットは、閲覧用にエンドユーザによって分析のために選択されており、タンパク質融解曲線1630および対応する導関数曲線1635の基準セットより顕著に現れる。加えて、エンドユーザは、
図24Aおよび
図24Bに示されるように、タンパク質融解曲線の基準セットのための分析の領域を選択可能である。
図24Aでは、例えば、タンパク質融解曲線の基準セットに対して、タンパク質融解の第1の相は、1610−1620によって選択された領域によって境界される一方、タンパク質融解の第2の相に対しては、1611−1621によって境界された領域が、選択されている。
【0072】
図24Cでは、双方向GUI1700の種々の実施形態に対して、複製群統計は、
図24Aおよび24Bに示されるように、二相性融解を表示する、タンパク質に対して描写される。上図では、第1の菱形プロット1730および第2の菱形プロット1732が、
図24Aに示されるような選択された曲線1630の第1および第2の融解相に対する複製群統計を描写する。下図では、第1の菱形プロット1740および第2の菱形プロット1742が、
図24Bに示されるような選択された曲線1630′の第1および第2の融解相に対する複製群統計を描写する。例えば、リガンドは、実際には、天然タンパク質融解1730−1732と比較して、ピーク1740、1742をシフトさせ得る。そのような比較は、本教示のシステムおよび方法の種々の実施形態による、複製群可視化の種々の実施形態を使用することによって、エンドユーザに容易に観察可能となり得る。
【0073】
複数のサンプルからの複製の選択された群に及ぼす、実験変数の影響の容易な検討に加え、菱形プロットは、エンドユーザ定義閾値に関して、評価され得る。
図25AのGUI1800の種々の実施形態に対して、ポップアップボックス1880が、エンドユーザによって選択され得る。本教示のシステムおよび方法の種々の実施形態によると、陽性ヒット設定ボックス1882は、エンドユーザが、データの曲線適合の方法によって定義されるΔT
m1884に対して、負の閾値を選択し、ならびにn次導関数によって定義されるΔT
m1886に対して、負の閾値を選択することを可能にし得る。例えば、
図25AのGUI1900では、エンドユーザは、特に、基準より3単位より小さいT
mを有する、任意の複製群をハイライトすることを所望する。
図25BのGUI1900では、そのように選択された閾値は、エンドユーザが、選択された基準の選択された閾値を下回る群の菱形プロット1940−1948の位置を確認することを可能にし得る。
図25BのGUI1900では、基準菱形プロット1930が、示される。実験セット1940−1948に対する菱形プロットは、選択された閾値を下回るためハイライトされるが、菱形プロット1932は、明らかに、選択範囲外にある。その点において、菱形プロット1940−1948が、エンドユーザに着目複製群として、視覚的にハイライトされる。
【0074】
さらに、
図26Aおよび26Bに示されるように、エンドユーザはまた、正の閾値を選択し得る。
図26AのGUI2000の種々の実施形態に対して、ポップアップボックス2080が、エンドユーザによって選択され得る。本教示のシステムおよび方法の種々の実施形態によると、陽性ヒット設定ボックス2082は、エンドユーザが、データの曲線適合の方法によって定義されるΔT
m2084に対して、正の閾値を選択し、ならびにn次導関数によって定義されるΔT
m2086に対して、正の閾値を選択することを可能にし得る。例えば、
図26AのGUI2000では、エンドユーザは、特に、基準よりも2単位より大きいT
mを有する任意の複製群をハイライトすることを所望する。
図25BのGUI1900では、そのように選択された閾値は、エンドユーザが、選択された基準の選択された閾値を下回る群の菱形プロット1940−1948の位置を確認することを可能にし得る。
図26BのGUI2100では、基準菱形プロット2130が、示される。実験セット2140−2147に対する菱形プロットが、選択された閾値を上回るためハイライトされるが、菱形プロット2132−2136は、明らかに、選択範囲外にある。その点において、菱形プロット2140−2147が、エンドユーザに着目複製群として、視覚的にハイライトされる。
【0075】
本教示の双方向GUIの種々の実施形態によると、
図25A、25B、26Aおよび26Bに描写されるように、そのような双方向GUIは、エンドユーザが、実験値のセットが、所望の影響を有していたかどうかを評価することを容易に可能にし得る。例えば、変数のあるセットが、複製の選択されたセットに対して、T
m値を増加または減少させ得るかどうかを確認するために、実験が設計された場合、予期される値に対する閾値が設定され、菱形プロットが、予期される閾値に対して評価され得る。
【0076】
最後に、
図4のステップ60ならびに
図5および
図6のステップ70に関して、前述のように、かつ当業者が、容易に認識し得るように、多数のデバイスを使用して、多数の形式でエンドユーザに、タンパク質融解曲線情報を出力する種々の方法が存在する。例えば、限定されないが、融解曲線プロット、T
m値、およびΔT
m値である。例えば、タンパク質融解曲線情報の形式に関して、情報は、グラフィカル形式において、報告書として、またはそれらの組み合わせで提示され得る。出力デバイスに関して、タンパク質融解曲線情報は、限定されないが、プリンタ、ブラウン管(CRT)ディスプレイ、液晶ディスプレイ(LCD)、および発光ダイオード(LED)ディスプレイ等のデバイスに出力され得る。
【0077】
タンパク質融解曲線データの分析のためのシステムおよび方法の種々の実施形態の原理が、具体的実施形態に関連して説明されたが、これらの説明は、一例にすぎず、本発明の範囲を限定することを意図するものではないことを明白に理解されたい。本明細書に開示されるものは、例証および説明の目的のために提供される。包括的である、または開示されるものを説明される精密な形態に限定することを意図するものではない。多くの修正および変形は、実施当業者に明白となるであろう。本開示は、説明される技術分野の開示される実施形態の原理および実践的用途を最良に説明し、それによって、他の当業者が、想定される特定の使用に好適な種々の実施形態および種々の修正を理解することを可能にするために、選択および説明された。本開示の範囲は、以下の請求項およびその均等物によって定義されることが意図される。