(58)【調査した分野】(Int.Cl.,DB名)
前記予測する工程(4)が、前記標的データと、前記第1のデータおよび前記第2のデータとを比較し、前記標的データに類似するデータを与えた対象の特性を、前記標的の特性と特定することを含む、請求項1に記載の方法。
前記標的データ、前記第1のデータおよび前記第2のデータの、前記予測パラメータセットについての多変量解析によって、前記標的データが、前記第1のデータまたは前記第2のデータのいずれと類似するかを決定することを含む、請求項2に記載の方法。
前記バースト構造パラメータが、バースト長、バースト中スパイク数、IBI、IPI、PS、ピーク時間パーセンテージ、バースト内平均ISI、バースト内中央ISI、バースト内中央ISI/平均ISIを含む、請求項16または17に記載の方法。
前記周期性に関するパラメータが、バースト長、バースト中スパイク数、IBI、IPI、PS、ピーク時間パーセンテージ、バースト内平均ISI、バースト内中央ISI、バースト内中央ISI/平均ISIのそれぞれの変動係数と、バースト内CV ISIの平均値、バースト内CV ISIの標準偏差、バースト内CV ISIの中央絶対偏差、およびバースト内CV ISIの変動係数とをさらに含む、請求項19または20に記載の方法。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、対象化合物等の標的の未知の特性を予測する方法等を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、例えば、以下の項目を提供する。
【0007】
(項目1)
標的の特性の予測方法であって、
(1)第1の対象に対する第1のデータを得る工程と、
(2)第2の対象に対する第2のデータを得る工程と、
(3)候補パラメータセット中の各候補パラメータの全ての組み合わせについて、前記第1のデータおよび前記第2のデータの多変量解析を行い、予測パラメータセットを特定する工程と、
(4)前記標的に対する標的データから、前記予測パラメータセットに基づいて前記特性を予測する工程
を包含する、方法。
【0008】
(項目2)
前記予測パラメータセットを特定する工程(3)が、前記多変量解析によって前記第1の対象と前記第2の対象とを分離可能な前記候補パラメータの組み合わせを、前記予測パラメータセットと特定することを含む、項目1に記載の方法。
【0009】
(項目3)
前記予測する工程(4)が、前記標的データと、前記第1のデータおよび前記第2のデータとを比較し、前記標的データに類似するデータを与えた対象の特性を、前記標的の特性と特定することを含む、項目1または2に記載の方法。
【0010】
(項目4)
前記標的データ、前記第1のデータおよび前記第2のデータの、前記予測パラメータセットについての多変量解析によって、前記標的データが、前記第1のデータまたは前記第2のデータのいずれと類似するかを決定することを含む、項目3に記載の方法。
【0011】
(項目5)
前記類似が、ユークリッド距離、コサイン類似度、またはその組み合わせによって決定される、項目4に記載の方法。
【0012】
(項目6)
(5)前記工程(4)で予測された特性に対応する第2の予測パラメータセットに基づいて、前記標的に対する第2の標的データから、第2の特性を予測する工程
をさらに包含する、項目1〜5のいずれか1項に記載の方法。
【0013】
(項目7)
前記多変量解析が主成分解析またはクラスター分析である、項目1〜6のいずれか1項に記載の方法。
【0014】
(項目8)
前記標的が化合物である、項目1〜7のいずれか1項に記載の方法。
【0015】
(項目9)
前記特性が、前記化合物の薬効、毒性、作用機序の1つまたは複数を含む、項目8に記載の方法。
【0016】
(項目10)
前記データが、神経細胞の活動データである、項目9に記載の方法。
【0017】
(項目11)
前記活動データが、微小電極アレイ、Ca
2+イメージング法、膜電位イメージング法のうちの1つを用いて得られたものである、項目10に記載の方法。
【0018】
(項目12)
前記神経細胞は神経幹細胞である、項目10または11に記載の方法。
【0019】
(項目13)
前記神経幹細胞はiPS細胞である、項目12に記載の方法。
【0020】
(項目14)
前記候補パラメータセットが、基本活動パラメータを含む、項目10〜13のいずれか1項に記載の方法。
【0021】
(項目15)
前記基本活動パラメータが、TS、NoB、バースト周波数、バーストパーセンテージ、およびバースト長の四分位範囲を含む、項目14に記載の方法。
【0022】
(項目16)
前記候補パラメータセットが、バースト構造パラメータの平均値を含む、項目10〜15のいずれか1項に記載の方法。
【0023】
(項目17)
前記候補パラメータセットが、バースト構造パラメータの標準偏差または中央絶対偏差を含む、項目10〜15のいずれか1項に記載の方法。
【0024】
(項目18)
前記バースト構造パラメータが、バースト長、バースト中スパイク数、IBI、IPI、PS、ピーク時間パーセンテージ、バースト内平均ISI、バースト内中央ISI、バースト内中央ISI/平均ISIを含む、項目16または17に記載の方法。
【0025】
(項目19)
前記候補パラメータセットが、周期性パラメータに関するパラメータをさらに含む、項目10〜18のいずれか1項に記載の方法。
【0026】
(項目20)
前記周期性に関するパラメータが、周期性パラメータを含む、項目19に記載の方法。
【0027】
(項目21)
前記周期性に関するパラメータが、バースト長、バースト中スパイク数、IBI、IPI、PS、ピーク時間パーセンテージ、バースト内平均ISI、バースト内中央ISI、バースト内中央ISI/平均ISIのそれぞれの変動係数と、バースト内CV ISIの平均値、バースト内CV ISIの標準偏差、バースト内CV ISIの中央絶対偏差、およびバースト内CV ISIの変動係数とをさらに含む、項目19または20に記載の方法。
【0028】
(項目22)
前記候補パラメータセットが、周波数解析パラメータを含む、項目10〜21のいずれか1項に記載の方法。
【0029】
(項目23)
前記周波数解析パラメータが、約250Hz以下の周波数解析パラメータを含む、項目22に記載の方法。
【0030】
(項目24)
前記候補パラメータセットが、非線形時系列解析パラメータを含む、項目10〜23のいずれか1項に記載の方法。
【0031】
(項目25)
標的の特性の予測方法であって、
第1の対象、第2の対象および前記標的それぞれに対する、データを得る工程、
それぞれのデータに対して、予測パラメータセットについて多変量解析を行う工程と、
前記標的のデータが前記第1の対象のデータまたは前記第2の対象のデータいずれに類似しているかを決定する工程と、
前記標的のデータが前記第2の対象のデータよりも前記第1の対象のデータに類似していると決定された場合に、前記第1の対象の特性を前記標的の前記特性であると特定する工程と
を包含する、方法。
【0032】
(項目26)
前記予測パラメータセットが、周期性パラメータ、約250Hz以下の周波数解析パラメータ、または非線形時系列解析パラメータの1または複数を含む、項目25に記載の方法。
【0033】
(項目27)
標的の特性を予測するためのコンピュータシステムであって、
第1の対象に対する第1のデータおよび第2の対象に対する第2のデータを受信する手段と、
候補パラメータセット中の各候補パラメータの全ての組み合わせについて、前記第1のデータおよび前記第2のデータの多変量解析を行う手段と、
前記多変量解析の結果に基づいて予測パラメータセットを特定する手段と、
前記標的に対する標的データから、前記予測パラメータセットに基づいて前記特性を予測する手段と
を備えているコンピュータシステム。
【0034】
(項目28)
標的の特性を予測するためのプログラムであって、前記プログラムは、プロセッサを備えるコンピュータシステムにおいて実行され、前記プログラムは、
(1)第1の対象に対する第1のデータを受信する工程と、
(2)第2の対象に対する第2のデータを受信する工程と、
(3)候補パラメータセット中の各候補パラメータの全ての組み合わせに対して、前記第1のデータおよび前記第2のデータの多変量解析を行い、予測パラメータセットを特定する工程と、
(4)前記標的に対する標的データから、前記予測パラメータセットに基づいて前記特性を予測する工程と
を包含する処理を前記プロセッサに実行させる、方法。
【0035】
(項目29)
標的の特性を予測するためのコンピュータシステムであって、
第1の対象、第2の対象および前記標的それぞれに対する、データを受信する手段と、
それぞれのデータに対して、予測パラメータセットについて多変量解析を行う手段と、
前記標的のデータが前記第1の対象のデータまたは前記第2の対象のデータいずれに類似しているかを決定する手段と、
前記標的のデータが前記第2の対象のデータよりも前記第1の対象のデータに類似していると決定された場合に、前記第1の対象の特性を前記標的の前記特性であると特定する手段と
を備えている、コンピュータシステム。
【0036】
(項目30)
標的の特性を予測するためのプログラムであって、前記プログラムは、プロセッサを備えるコンピュータシステムにおいて実行され、前記プログラムは、
第1の対象、第2の対象および前記標的それぞれに対する、データを受信する工程と、
それぞれのデータに対して、予測パラメータセットについて多変量解析を行う工程と、
前記標的のデータが前記第1の対象のデータまたは前記第2の対象のデータいずれに類似しているかを決定する工程と、
前記標的のデータが前記第2の対象のデータよりも前記第1の対象のデータに類似していると決定された場合に、前記第1の対象の特性を前記標的の前記特性であると特定する工程と
を包含する処理を前記プロセッサに実行させる、プログラム。
【発明の効果】
【0037】
本発明によれば、対象化合物等の標的の未知の特性(例えば、神経系への毒性や薬効)を予測する方法等を提供することができる。
【発明を実施するための形態】
【0039】
以下、本発明を説明する。本明細書において使用される用語は、特に言及しない限り、当該分野で通常用いられる意味で用いられることが理解されるべきである。したがって、他に定義されない限り、本明細書中で使用される全ての専門用語および科学技術用語は、本発明の属する分野の当業者によって一般的に理解されるのと同じ意味を有する。矛盾する場合、本明細書(定義を含めて)が優先する。
【0040】
(定義)
本明細書において、「対象化合物」とは、特性を予測する対象の化合物のことをいう。対象化合物は、未知の化合物であってもよいし、既知の化合物であってもよい。対象化合物の特性は、例えば、薬効、毒性、作用機序を含むがこれらに限定されない。
【0041】
本明細書において、「薬効」とは、薬剤を対象に適用した場合に結果として生じる効果のことである。例えば、薬剤が抗がん剤であった場合、薬効は、X線観察下におけるがん面積の縮小、がんの進行の遅延、およびがん患者の生存期間の延長等の対象に生じる直接的効果であってもよいし、がんの進行と相関するバイオマーカーの減少などの間接的効果であってもよい。本明細書において、「薬効」とは、任意の適用条件下における効果が企図される。例えば、薬剤が抗がん剤であった場合、薬効は、特定の対象(例えば、80歳以上の男性)における効果であってもよいし、特定の適用条件(例えば、他の抗がん療法との併用下)における効果であってもよい。一つの実施形態では、薬剤は、単一の薬効を有してもよいし、複数の薬効を有してもよい。一つの実施形態では、薬剤は、異なる適用条件下において異なる薬効を有してもよい。一般的に、薬効は、達成を目的とする効果を指す。
【0042】
本明細書において、「毒性」とは、薬剤を対象に適用した場合に生じる好ましくない効果である。一般的に、毒性は、薬剤の目的とする効果とは異なる効果である。毒性は、薬効とは異なる作用機序で生じる場合もあるし、薬効と同じ作用機序で生じる場合もある。例えば、薬剤が抗がん剤であった場合、細胞増殖抑制の作用機序を介して、がん細胞殺傷の薬効と同時に正常な肝細胞の殺傷による肝毒性が生じる場合もあるし、細胞増殖抑制の作用機序を介したがん細胞殺傷の薬効と同時に膜安定化の作用機序を介した神経機能障害の毒性が生じる場合もある。
【0043】
本明細書において、「作用機序」とは、薬剤が生物的機構と相互作用する様式である。例えば、薬剤が抗がん剤であった場合、作用機序は、免疫系の活性化、増殖速度の速い細胞の殺傷、増殖性シグナル伝達の遮断、特定の受容体の遮断、特定の遺伝子の転写阻害など種々のレベルの事象であり得る。作用機序が特定されると、蓄積された情報に基づいて、薬効、毒性および/または適切な利用形態が予測され得る。
【0044】
本明細書において、「約」とは、後に続く数値の±10%を意味する。
【0045】
1.対象化合物の特性の予測
本発明の発明者は、非臨床試験において対象化合物の神経系に対する特性を評価するために、多変量解析を用いて対象化合物の特性を予測する手法を開発した。本発明の方法においては、複数の候補パラメータを含むパラメータセット中の複数(好ましくは全て)の組み合わせに対して、多変量解析を用いることにより、既知化合物の応答の分離に好適な予測パラメータセットを導出することができる。その予測パラメータセットを用いて、対象化合物を神経細胞に投与したときに取得された活動データを解析することによって、対象化合物の特性がどの既知化合物の特性に類似するかを予測する。
【0046】
例えば、分離すべき特性をそれぞれ有する複数の既知化合物(例えば、「毒性の有無」の特性を分離する場合、「毒性有り」の特性を有する既知化合物Aおよび「毒性無し」の特性を有する既知化合物B)をそれぞれ神経細胞に投与したときに取得された活動データを多変量解析することにより、その特性を分離可能な予測パラメータセットを導出する。この予測パラメータセットを用いて、対象化合物を神経細胞に投与したときに取得された活動データを解析することによって、対象化合物の特性が「毒性有り」であるのか、「毒性無し」であるのかを予測することができる。分離すべき特性に応じた予測パラメータセットを導出することによって、対象化合物が、どのような薬効を有するか、または、どのような毒性を有するか、または、どのような作用機序を有するかを予測することができるようになる。これにより、非臨床試験において、対象化合物の薬効、毒性、作用機序を予測することが可能になる。例えば、ヒトiPS細胞を用いて解析を行うことにより、ヒト神経系への化合物作用や毒性が予測でき、医薬品の開発や化合物全般の開発を迅速かつ低コストに実現できるようになる。
【0047】
さらに、本手法によると、例えば、対象化合物が、予測された薬効においてどのような作用機序を有するか、または、予測された毒性において、どのような作用機序を有するかも予測して出力することができる。このように、対象化合物の抽象的な特性のみならず、具体的な特性までも予測することができる。
【0048】
また、予測パラメータセットを導出する際に、細胞種間差、サンプル間差、または、施設間差を有するデータを用いることにより、導出される予測パラメータセットが、細胞種間差、サンプル間差、施設間差に依存しないものとなる。これにより、神経活動データを用いた統一的な薬剤評価系の構築が可能になる。
【0049】
このような多変量解析を用いて対象化合物の特性を予測することは、例えば、以下に説明する対象化合物の特性を予測するためのコンピュータシステムによって実現され得る。
【0050】
以下、図面を参照しながら、本発明の実施の形態を説明する。
【0051】
2.対象化合物の特性を予測するためのコンピュータシステムの構成
図1は、本発明の対象化合物の特性を予測するためのコンピュータシステム100の構成の一例を示す。
【0052】
コンピュータシステム100は、受信手段110と、プロセッサ120と、メモリ130と、出力手段140とを備える。コンピュータシステム100は、データベース部200に接続され得る。
【0053】
受信手段110は、コンピュータシステム100の外部からデータを受信することが可能であるように構成されている。受信手段110は、例えば、コンピュータシステム100の外部からネットワークを介してデータを受信してもよいし、コンピュータシステム100に接続された記憶媒体(例えば、USBメモリ、光ディスク等)またはデータベース部200からデータを受信してもよい。ネットワークを介してデータを受信する場合は、ネットワークの種類は問わない。受信手段110は、例えば、Wi−fi等の無線LANを利用してデータを受信してもよいし、インターネットを介してデータを受信してもよい。
【0054】
受信手段110は、例えば、既知化合物または対象化合物に対する神経細胞の活動データを受信する。神経細胞の活動データは、公知の任意の手法によって取得され得るデータである。
【0055】
神経細胞の活動データは、例えば、微小電極アレイ(MEA:Micro−Eelectrode Array)を用いて測定された電位データである。この電位データは、例えば、MEA上に神経細胞を培養し、培養された神経細胞に既知化合物または対象化合物を投与したときの神経細胞の活動電位およびシナプス電流成分を測定することによって取得される。例えば、CMOSを利用するCMOS−MEAをMEAとして用いてもよい。CMOS−MEAを用いると、比較的に高分解能のデータを取得することが可能になる。
【0056】
神経細胞の活動データは、例えば、多点電極を用いて測定された電位データである。この電位データは、例えば、動物実験において動物の脳に多点電極を刺し、既知化合物または対象化合物を投与したときの神経細胞の活動電位を測定することによって取得される。
【0057】
神経細胞の活動データは、例えば、光計測法によって取得される画像データであってもよい。光計測法は、例えば、Ca
2+イメージング法である。神経細胞に既知化合物または対象化合物を投与したときの神経細胞の活動の様子をCa
2+イメージング法で画像化することによって画像データが取得される。光計測法は、例えば、膜電位感受性色素を用いた膜電位イメージング法である。例えば、神経細胞に既知化合物または対象化合物を投与したときの神経細胞の活動の様子を膜電位イメージング法で画像化することによって画像データが取得される。
【0058】
1つの実施形態において、時間分解能の観点から、MEAを用いることが好ましくあり得る。MEAは、Ca
2+イメージング法および膜電位イメージング法に比べて、時間分解能が高く、1つ1つのスパイクを正確に検出することができ、得られる活動データの情報量が多くなるからである。膜電位イメージング法は、Ca
2+イメージング法よりも時間分解能が高い。
【0059】
別の実施形態において、長期計測の観点から、MEAを用いることが好ましくあり得る。MEAは、Ca
2+イメージング法および膜電位イメージング法に比べて、非侵襲性が高いからである
【0060】
さらに別の実施形態において、細胞分解能の観点から、Ca
2+イメージング法または膜電位イメージング法を用いることが好ましくあり得る。Ca
2+イメージング法または膜電位イメージング法は、顕微鏡観察により全ての細胞をマーキングすることができるため、MEAに比べて空間分解能が高く、後続処理においてラスタープロット画像を容易に作成することができるからである。
【0061】
受信手段110は、例えば、既知化合物または対象化合物に対する神経細胞の活動データを変換した画像を受信するようにしてもよい。変換した画像は、例えば、電位データとして取得された神経細胞の活動データ、または、画像データとして取得された神経細胞の活動データを変換したラスタープロット画像であってもよく、電位データとして取得された神経細胞の活動データ、または、画像データとして取得された神経細胞の活動データを変換したヒストグラムであってもよく、電位データとして取得された神経細胞の活動データから変換された波形画像であってもよく、電位データとして取得された神経細胞の活動データを周波数成分解析(例えば、ウェーブレット変換)することにより変換された周波数の強度マップであってもよい。
【0062】
ここで、神経細胞は、例えば、神経幹細胞である。神経幹細胞は、例えば、動物の神経幹細胞であってもよく、ヒト神神経幹細胞であってもよい。神経幹細胞は、例えば、iPS細胞である。神経細胞は、例えば、動物から採取された初代神経細胞であってもよい。
【0063】
受信手段110が受信したデータは、後続の処理のために、プロセッサ120に渡される。
【0064】
プロセッサ120は、コンピュータシステム100全体の動作を制御する。プロセッサ120は、メモリ130に格納されているプログラムを読み出し、そのプログラムを実行する。これにより、コンピュータシステム100を所望のステップを実行する装置として機能させることが可能である。プロセッサ120は、単一のプロセッサによって実装されてもよいし、複数のプロセッサによって実装されてもよい。プロセッサ120によって処理されたデータは、出力のために、出力手段140に渡される。
【0065】
メモリ130には、コンピュータシステム100における処理を実行するためのプログラムやそのプログラムの実行に必要とされるデータ等が格納されている。メモリ130には、例えば、対象化合物の特性を予測するためのプログラム(例えば、後述する
図7、
図8、
図9に示される処理を実現するプログラム)が格納されている。メモリ130には、任意の機能を実装するアプリケーションが格納されていてもよい。例えば、受信した電位データまたは画像データをラスタープロット画像、ヒストグラム、波形画像等に変換するためのプログラムを格納してもよい。ここで、プログラムをどのようにしてメモリ130に格納するかは問わない。例えば、プログラムは、メモリ130にプリインストールされていてもよい。あるいは、プログラムは、ネットワークを経由してダウンロードされることによってメモリ130にインストールされるようにしてもよい。メモリ130は、任意の記憶手段によって実装され得る。
【0066】
出力手段140は、コンピュータシステム100の外部にデータを出力することが可能であるように構成されている。出力手段140がどのような態様でコンピュータシステム100から情報を出力することを可能にするかは問わない。例えば、出力手段140が表示画面である場合、表示画面に情報を出力するようにしてもよい。あるいは、出力手段140がスピーカである場合には、スピーカからの音声によって情報を出力するようにしてもよい。あるいは、出力手段140がデータ書き込み装置である場合、コンピュータシステム100に接続された記憶媒体またはデータベース部200に情報を書き込むことによって情報を出力するようにしてもよい。あるいは、出力手段140が送信器である場合、送信器がネットワークを介してコンピュータシステム100の外部に情報を送信することにより出力してもよい。この場合、ネットワークの種類は問わない。例えば、送信器は、インターネットを介して情報を送信してもよいし、LANを介して情報を送信してもよい。例えば、出力手段140は、データの出力先のハードウェアまたはソフトウェアによって取り扱い可能な形式に変換して、または、データの出力先のハードウェアまたはソフトウェアによって取り扱い可能な応答速度に調整してデータを出力するようにしてもよい。
【0067】
コンピュータシステム100に接続されているデータベース部200には、例えば、既知化合物に対する神経細胞の活動データが格納され得る。既知化合物に対する神経細胞の活動データは、その既知化合物の特性と関連付けられて格納されてもよい。データベース部200には、例えば、対象化合物に対する神経細胞の活動データが格納され得る。データベース部200には、例えば、コンピュータシステム100によって出力されたデータ(例えば、予測された対象化合物の特性)が格納され得る。データベース部200には、特定された予測パラメータが格納されてもよい。データベース部200には、既知化合物に対する神経細胞の活動データおよび/または対象化合物に対する神経細胞の活動データの多変量解析の結果データが格納されてもよい。
【0068】
図1に示される例では、データベース部200は、コンピュータシステム100の外部に設けられているが、本発明はこれに限定されない。データベース部200をコンピュータシステム100の内部に設けることも可能である。このとき、データベース部200は、メモリ130を実装する記憶手段と同一の記憶手段によって実装されてもよいし、メモリ130を実装する記憶手段とは別の記憶手段によって実装されてもよい。いずれにせよ、データベース部200は、コンピュータシステム100のための格納部として構成される。データベース部200の構成は、特定のハードウェア構成に限定されない。例えば、データベース部200は、単一のハードウェア部品で構成されてもよいし、複数のハードウェア部品で構成されてもよい。例えば、データベース部200は、コンピュータシステム100の外付けハードディスク装置として構成されてもよいし、ネットワークを介して接続されるクラウド上のストレージとして構成されてもよい。
【0069】
図2は、プロセッサ120の構成の一例を示す。
【0070】
プロセッサ120は、少なくとも、多変量解析手段121と、予測パラメータ特定手段122と、予測手段123とを備える。
【0071】
多変量解析手段121は、入力されたデータに対して多変量解析を行うように構成されている。例えば、多変量解析手段121は、受信された第1の既知化合物に対する神経細胞の活動データおよび第2の既知化合物に対する神経細胞の活動データに対して多変量解析を行う。多変量解析は、例えば、主成分解析である。主成分解析によって、データの少なくとも第1主成分および第2主成分を算出することができる。例えば、主成分解析によって、第3主成分、第4主成分・・・第n−1主成分を算出するようにしてもよい(ここで、nは入力されたデータの次元数)。多変量解析は、例えば、クラスター分析である。クラスター分析によって、データを複数のクラスターに分類することができる。クラスター分析のアルゴリズムとして、例えば、ward法(内部平方距離)を用いることができ、平均の距離、重心間の距離、最大距離、最短距離を用いることもできる。類似度を決定するための指標として、例えば、ユークリッド距離を用いることができ、マハラノビス距離、スピアマンの順位相関を用いることもできる。類似度を決定するための指標として、例えば、コサイン類似度を用いることもできる。類似度を決定するための指標として、例えば、ユークリッド距離とコサイン類似度との組み合わせを用いることもできる。類似度を決定するための指標の閾値は、データに応じて任意の値に設定することができる。
【0072】
多変量解析手段121に入力されるデータは、例えば、同一の化合物を異なる細胞種に投与した場合の複数のデータ、同一の化合物を異なるベンダーから供給された同一の細胞種に投与した場合の複数のデータ、同一の化合物を同一のベンダーから供給された異なるロットのサンプルに投与した場合の複数のデータ、同一の化合物を同一のベンダーから異なる日に供給されたサンプルに投与した場合の複数のデータ、同一の化合物を異なる施設で試験した場合の複数のデータを含み得る。このように、複数のデータを多変量解析手段121で処理することにより、後述する予測パラメータ特定手段122によって、サンプル間差、細胞種間差、施設間差に依存しない予測パラメータセットを特定することができるようになる。
【0073】
多変量解析手段121に入力されるデータは、例えば、既知化合物または対象化合物に対する神経細胞の活動データまたはそれを変換した画像であり得る。変換した画像は、例えば、電位データとして取得された神経細胞の活動データ、または、画像データとして取得された神経細胞の活動データを変換したラスタープロット画像であってもよく、電位データとして取得された神経細胞の活動データ、または、画像データとして取得された神経細胞の活動データを変換したヒストグラムであってもよく、電位データとして取得された神経細胞の活動データから変換された波形画像であってもよく、電位データとして取得された神経細胞の活動データを周波数成分解析(例えば、ウェーブレット変換)することにより変換された周波数の強度マップであってもよい。変換した画像は、例えば、受信手段110によって受信されたものであってもよいし、多変量解析手段121の前段でプロセッサ120によって変換された画像であってもよい。
【0074】
多変量解析手段121は、例えば、候補パラメータセット中の各候補パラメータの全ての組み合わせについて、第1の既知化合物に対する神経細胞の活動データおよび第2の既知化合物に対する神経細胞の活動データに対して多変量解析を行う。多変量解析手段121は、例えば、候補パラメータセット中の各候補パラメータの全ての組み合わせについて、3以上の化合物に対する神経細胞の活動データに対して多変量解析を行ってもよい。
【0075】
多変量解析のためのパラメータ組は、2つ以下の候補パラメータでは多変量解析ができないため、3つ以上の候補パラメータを含む必要がある。例えば、候補パラメータセットが10個の候補パラメータから成る場合、各候補パラメータの全ての組み合わせは、968個のパラメータ組となる(各パラメータ組は、3〜10個の候補パラメータを含む)。このとき、多変量解析手段121は、968個のパラメータ組のそれぞれについて、第1の既知化合物に対する神経細胞の活動データおよび第2の既知化合物に対する神経細胞の活動データに対して多変量解析を行う。
【0076】
図3は、候補パラメータセットに含まれる候補パラメータの一例を説明する図である。
図3のグラフは、ラスタープロット画像と、そのラスタープロット画像から生成されたヒストグラムとを組み合わせた図であり、グラフの下側にラスタープロット画像が示され、グラフの上側にヒストグラムが示されている。ラスタープロット画像では、縦軸が電極を示し、横軸が時間を示しており、黒色のプロットがスパイクを表している。ヒストグラムでは、縦軸が1秒当たりのスパイク数を示し、横軸が時間を示している。
【0077】
候補パラメータは、例えば、
(1)Total Spikes(TS:計測中に検出されたスパイクの総数)、
(2)Number of SBF(NoB:計測中に検出された同期バースト発火の総数)、
(3)Inter Burst Interval(IBI:同期バースト発火の終点から次の同期バースト発火の始点までの時間)、
(4)Duration of SBF(バースト長:同期バースト発火の始点から終点までの時間)、
(5)Spikes in a SBF(バースト中スパイク数:同期バースト発火中に検出されたスパイク数)、
(6)Peak Spikes(PS:スパイク数のヒストグラムのピーク値)、
(7)CV of Peak Spikes(PSの変動係数。変動係数(CV)=標準偏差/平均値)、
(8)Inter Peak Interval(IPI:ヒストグラムのピーク値から次のピーク値までの時間)、
(9)CV of Inter Peak Interval(IPIの変動係数)
を含む。
【0078】
(基本活動パラメータ)
候補パラメータは、例えば、基本活動パラメータを含む。基本活動パラメータは、
・TS、
・NoB、
・Burst Frequency(バーストの周波数:NoB/計測時間(s))、
・Burst percentage(バーストパーセンテージ:全同期バースト発火中のスパイク数/TS)、および
・Burst Duration Interquartile Range(バースト長の四分位範囲)
を含む。候補パラメータセットに、基本活動パラメータ、特にTS、NoB等のパラメータを含めることにより、神経ネットワーク活動の増減という概念を含んで多変量解析がなされるため、化合物投与による神経ネットワーク活動の基本的な変化と方向性とを指標として化合物の応答を分離することができるという効果が得られる。また、基本活動パラメータは、発火数やバースト発火回数等の増減に化合物応答が顕著に見られる化合物の分離に有効であり得、必須でもあり得る。候補パラメータセットに、基本活動パラメータを含めることにより、既知化合物の分離および対象化合物の予測の精度が向上し、誤った予測を防ぐことができるという利点も有する。
【0079】
(バースト構造パラメータ)
候補パラメータは、例えば、バースト構造パラメータの全バーストでの平均値を含む。バースト構造パラメータは、同期バースト発火に関するパラメータであり、例えば、
・バースト長、
・バースト中スパイク数、
・IBI、
・IPI、
・PS、
・Peak time percentage(ピーク時間パーセンテージ:バースト長を100%としたときにバースト内のピークスパイクが現れる時刻を%で表した値。バーストの開始時刻でピークスパイクが現れると0%、バーストの終了時刻でピークスパイクが現れると100%となる)、
・mean ISI within Burst(バースト内平均ISI:バースト内のISI(Inter spike interval:スパイク間隔)の平均値)、
・median ISI within Burst(バースト内中央ISI:バースト内のISIの中央値)、
・median/mean ISI within Burst(バースト内中央ISI/平均ISI:バースト内のISIの中央値/平均値)
を含む。候補パラメータセットに、バースト構造パラメータを含めることにより、バースト構造パラメータに変化が認められる化合物応答を分離するように多変量解析がなされるため、化合物の用量依存的な変化の検出、化合物応答の分離、および、作用機序予測の精度が向上するという効果が得られる。
【0080】
候補パラメータは、例えば、バースト構造パラメータ(例えば、バースト長、バースト中スパイク数、IBI、IPI、PS、ピーク時間パーセンテージ、バースト内平均ISI、バースト内中央ISI、バースト内中央ISI/平均ISIのうちの少なくとも1つ)の全バーストでの標準偏差または中央絶対偏差を含んでもよい。候補パラメータは、例えば、バースト構造パラメータ(例えば、バースト長、バースト中スパイク数、IBI、IPI、PS、ピーク時間パーセンテージ、バースト内平均ISI、バースト内中央ISI、バースト内中央ISI/平均ISIのうちの少なくとも1つ)の全バーストでの中央値を含んでもよい。候補パラメータは、例えば、バースト構造パラメータ(例えば、バースト長、バースト中スパイク数、IBI、IPI、PS、ピーク時間パーセンテージ、バースト内平均ISI、バースト内中央ISI、バースト内中央ISI/平均ISIのうちの少なくとも1つ)の全バーストでの標準誤差を含んでもよい。
【0081】
(周期性に関するパラメータ)
候補パラメータは、周期性に関するパラメータを含む。周期性に関するパラメータは、例えば、Periodicity(周期性パラメータ)を含む。Periodicity(周期性パラメータ)は、以下の式で表される。
【数1】
ここで、All frequency bandは、スパイク数のヒストグラムに対して周波数解析を行ったときに含まれる周波数の全帯域幅であり、例えば約5Hzである。Dominant frequency bandは、スパイク数のヒストグラムに対して周波数解析を行ったときのパワーが閾値を超える周波数の帯域幅である。Periodicity(周期性パラメータ)は、例えば、
図4A〜
図4Cに示されるように導出される。
【0082】
図4A−aは、ラスタープロット画像と、そのラスタープロット画像から生成されたヒストグラムとを組み合わせた図であり、グラフの下側にラスタープロット画像が示され、グラフの上側にヒストグラムが示されている。ラスタープロット画像では、縦軸が電極を示し、横軸が時間を示しており、黒色のプロットがスパイクを表している。ヒストグラムでは、縦軸が1秒当たりのスパイク数を示し、横軸が時間を示している。上から、ビヒクルを投与した場合のラスタープロット画像およびヒストグラム、約0.1μMで化合物を投与した場合のラスタープロット画像およびヒストグラム、約0.3μMで化合物を投与した場合のラスタープロット画像およびヒストグラム、約1μMで化合物を投与した場合のラスタープロット画像およびヒストグラム、約3μMで化合物を投与した場合のラスタープロット画像およびヒストグラム、約10μMで化合物を投与した場合のラスタープロット画像およびヒストグラムである。
【0083】
図4A−bは、
図4A−aのヒストグラムに対して離散フーリエ変換(DFT)を行うことによって導出されるパワースペクトルを示す。縦軸がパワーを示し、横軸が周波数を示している。上から、ビヒクルを投与した場合のパワースペクトル、約0.1μMで化合物を投与した場合のパワースペクトル、約0.3μMで化合物を投与した場合のパワースペクトル、約1μMで化合物を投与した場合のパワースペクトル、約3μMで化合物を投与した場合のパワースペクトル、10μMで化合物を投与した場合のパワースペクトルである。
【0084】
図4A−bのパワースペクトルの各々において、基本波のピーク値の約10%を閾値として、
図4Bに示されるように、当該閾値を超える周波数帯域の帯域幅をDominant frequency bandと定義し、パワースペクトルに含まれる周波数の全帯域幅をAll frequency bandとして定義する。これにより、
図4A−bのパワースペクトルの各々において、Periodicityを算出することができる。例えば、
図4Bに示されるように、複数の帯域幅が閾値を超える場合、Dominant frequency bandの値は、複数の帯域幅の合計値となる。
【0085】
図4Cは、ビヒクルを投与した場合の値を100%としたときのPeriodicityおよびNoBの値を示す棒グラフである。黒の棒グラフがPeriodicityの値を示し、白の棒グラフがNoBの値を示す。
図4Cのグラフから分かるように、NoBの値は、化合物の濃度に応じてほとんど変化しない一方、Periodicityの値は、化合物の濃度に応じて大きく変化している。すなわち、Periodicityの値は、濃度変化を反映した指標であると言える。
【0086】
周期性に関するパラメータは、例えば、バースト構造パラメータ(例えば、バースト長、バースト中スパイク数、IBI、IPI、PS、ピーク時間パーセンテージ、バースト内平均ISI、バースト内中央ISI、バースト内中央ISI/平均ISIのうちの少なくとも1つ)の変動係数(CV)を含んでもよい。候補パラメータセットに、バースト構造パラメータのCVを含めることにより、バーストの概形の規則性という概念を含んで多変量解析がなされるため、バーストの概形の規則性が変化する既知化合物の分離および対象化合物の予測の精度が向上するという効果が得られる。
【0087】
周期性に関するパラメータは、例えば、CV ISI within Burst(バースト内CV ISI:バースト内のISIの変動係数)の全バーストでの平均値、標準偏差、標準誤差、中央値、中央絶対偏差、または、変動係数を含んでもよい。これらはそれぞれ、バースト毎にISIの変動係数が算出されるため、それぞれのバーストのISIの変動係数を用いて、全バーストでの平均値、標準偏差、中央絶対値、または、変動係数が算出される。候補パラメータセットに、バースト内ISIの変動係数を含めることにより、バースト内発火の規則性という概念を含んで多変量解析がなされるため、バースト内発火の規則性が変化する既知化合物の分離および対象化合物の予測の精度が向上するという効果が得られる。
【0088】
上述した周期性に関するパラメータを候補パラメータセットに含めることにより、バースト発火の発生に周期性が認められる薬剤応答を分離するように多変量解析がなされるため、化合物の用量依存的な変化の検出、化合物応答の分離、および、作用機序予測の精度が向上するという効果が得られる。例えば、周期性に関するパラメータは、神経ネットワーク活動を興奮させる化合物(痙攣陽性化合物)の種類を分離するのに有効である。周期性に関するパラメータを候補パラメータセットに含めることにより、分離することのできる化合物の種類を増やすことができるという利点も有する。
【0089】
(周波数解析パラメータ)
候補パラメータは、例えば、周波数解析パラメータを含む。周波数解析パラメータは、例えば、約250Hz以下の周波数成分を解析することが可能なパラメータである。約250Hz以下の周波数成分は、活動電位成分(約1kHz以上)よりも低く、神経機能で重要となるシナプス後電流成分が反映されているため、約250Hz以下の周波数成分を解析するパラメータにより、神経細胞に対する化合物の特性を検出することが可能になる。さらに、約250Hz以下の周波数成分を解析するパラメータは、in vivo脳波と比較可能な指標であり、in vivoとin vitroとの相関を取ることを可能にする。
【0090】
周波数解析パラメータは、例えば、電位データまたは波形画像から算出された強度を含む。この強度は、電位データまたは波形画像を複数の周波数成分に分解し、分解された各周波数成分に対して以下の式で表される。
【数2】
【0091】
複数の周波数成分は、例えば、約4〜約8Hzのθ波帯、約8〜約14Hzのα波帯、約15〜約30Hzのβ波帯、約35〜約50Hzのγ波帯、約80〜約150Hzのhigh−γ波帯、および、約150〜約200Hzを含む。波形画像は、例えば、
図5Aに示されるように複数の周波数成分に分解される。分解は、例えば、各周波数成分に対応するバンドパスフィルタを用いて行われる。
【0092】
図5Aは、複数の周波数成分に分解された波形画像の一例を概略的に示す。
図5Aに示されるグラフは、電位波形画像であり、縦軸が電位を示し、横軸が時間を示す。
【0093】
図5Aに示される例では、1つのバーストを含む周期の波形が抽出されて、約4〜約8Hzのθ波帯、約8〜約14Hzのα波帯、約15〜約30Hzのβ波帯、約35〜約50Hzのγ波帯、約80〜約150Hzのhigh−γ波帯、および、約150〜約200Hzの周波数成分に分解されている。
【0094】
図5Bは、
図5Aの各周波数成分において強度を算出した結果の一例を示すグラフである。縦軸が化合物投与前の値を100%としたときの強度の値を示す。
図5Bでは、複数の濃度(約1μM、約10μM、約100μM、約1mM)における結果が示されている。
図5Bのグラフから分かるように、各周波数成分において、強度の値は、化合物の濃度に応じて変化している。すなわち、強度の値は、濃度変化を反映した指標であると言える。
【0095】
周波数解析パラメータは、例えば、ウェーブレット変換から算出された強度を含む。この強度は、電位データまたは波形画像をウェーブレット変換することによって形成されるスカログラムから算出される。例えば、化合物投与前のデータをウェーブレット変換することによって形成されたスカログラムと、化合物投与後のデータをウェーブレット変換することによって形成されたスカログラムとの差分をとることによって強度を算出することができる。
【0096】
ウェーブレット変換によって形成されたスカログラムでは、X軸のピクセル数がバースト長によって変動し、Y軸のピクセル数が例えば170ピクセルである。各周波数帯を占めるY軸のピクセル数は、各周波数帯で異なっており、例えば、約5〜約8Hzの周波数帯のY軸のピクセル数は21ピクセルであり、約8〜約14Hzの周波数帯のY軸のピクセル数は15ピクセルであり、約15〜約25Hzの24ピクセルであり、約30〜約50Hzの周波数帯のY軸のピクセルは31ピクセルであり、約70〜約150Hzの周波数帯のY軸のピクセルは34ピクセルであり、約150〜約200Hzの周波数帯のY軸のピクセルは13ピクセルである。従って、各周波数帯の強度を単純に比較することはできない。しかしながら、以下の式を用いて規格化を行うことにより、各周波数の強度を比較することが可能になる。
【数3】
ここで、WT
Aは、各周波数帯の1ピクセルあたりのウェーブレット変換係数であり、WT
Aは、各周波数帯の1ピクセルあたりのウェーブレット変換係数であり、WT
Bは、各周波数帯域のウェーブレット変換係数の合計値であり、N
Xは、X軸のピクセル数であり、N
Y(f)は、各周波数帯のY軸のピクセル数である。化合物投与前のデータをウェーブレット変換することによって形成されたスカログラムにおいてWT
Aを導出し、化合物投与後のデータをウェーブレット変換することによって形成されたスカログラムにおいてWT
Aを導出し、化合物投与前のWT
Aと化合物投与後のWT
Aとの差分をとることによって強度を算出することができる。
【0097】
(非線形時系列解析パラメータ)
候補パラメータは、例えば、非線形時系列解析パラメータを含む。非線形時系列解析パラメータは、例えば、Detrended fluctuation analysis(DFA)によって算出されるスケーリング指数αである。DFAは、非定常な変動成分(トレンド)を除き、ゆらぎの長期相関をスケーリング指数αによって特徴づける手法である。DFAによって算出される変動F(n)は、
【数4】
の関係を有し、ここで、スケーリング指数αが、0.5である場合、長期相関が無いことを示し、α>0.5である場合、正の相関があることを示し、α<0.5である場合、負の相関があることを示し、α=1である場合、1/fノイズであることを示す。
【0098】
例えば、発火タイミングの規則性に着目し、時系列のISIに対してDFAを行うことにより、時系列のISIをスケーリング指数αで定量化することができる。
【0099】
候補パラメータは、例えば、以下のパラメータを含んでもよい。
・Normalized Duration IQR(中央値で正規化したバースト長の四分位範囲)
・Full Width at Half Height of Normalized Cross Correlation(Cross−Correlogramの半値幅)
【0100】
候補パラメータセットは、上述したパラメータの全てを含んでもよいし、上述したパラメータの一部を含んでもよい。候補パラメータセットは、基本活動パラメータのうちの少なくとも1つと、バースト構造パラメータのうちの少なくとも1つと、周期性に関するパラメータのうちの少なくとも1つと、周波数解析パラメータのうちの少なくとも1つと、非線形時系列解析パラメータのうちの少なくとも1つとを含むことが好ましくあり得る。これにより、スパイク情報、周波数解析によるシナプス電流成分の情報、非線形時系列解析によるスパイク発生の時間列情報を含んだ解析が可能となるからである。候補パラメータセットは、上述した候補パラメータセットの全てを含むことがさらに好ましくあり得る。これにより、対象化合物の特性を高い精度で予測することが可能になるからである。
【0101】
再び
図2を参照すると、予測パラメータ特定手段122は、多変量解析手段121による多変量解析の結果に基づいて予測パラメータセットを特定するように構成されている。予測パラメータ特定手段122は、例えば、多変量解析の結果に基づいて、第1の既知化合物と第2の既知化合物とを分離可能な候補パラメータの組み合わせを予測パラメータセットとして特定する。予測パラメータ特定手段122は、例えば、多変量解析の結果に基づいて、3以上の化合物を分離可能な候補パラメータの組み合わせを予測パラメータセットとして特定するようにしてもよい。
【0102】
例えば、多変量解析が主成分解析である場合、或る候補パラメータの組み合わせについての主成分解析の結果から、第1の既知化合物に対する神経細胞の活動データの第1主成分得点および第2の既知化合物に対する神経細胞の活動データの第1主成分得点に対して有意差検定を行い、有意差が認められれば、その候補パラメータの組み合わせを予測パラメータセットとして特定することができる。例えば、或る候補パラメータの組み合わせについての主成分解析の結果から、第1の既知化合物に対する神経細胞の活動データの第1主成分得点、第2の既知化合物に対する神経細胞の活動データの第1主成分得点、・・・第nの既知化合物に対する神経細胞の活動データの第1主成分得点に対して有意差検定を行い、有意差が認められれば、その候補パラメータの組み合わせを予測パラメータセットとして特定することができる。このような有意差検定を、多変量解析を行った候補パラメータの全ての組み合わせについて行い、有意差が認められた1つまたは複数の候補パラメータの組み合わせを予測パラメータセットとして特定する。
【0103】
予測パラメータ特定手段122は、任意の有意差検定手法を用いて有意差検定を行うことができる。有意差検定は、例えば、ANOVA(分散分析)を用いて行うことができ、多変量の場合は、MANOVA(多変量分散分析)を用いて行うことができる。例えば、ANOVA(分散分析)またはMANOVA(多変量分散分析)を行い、得られたp値が0.05以下の場合に有意差が認められ得る。有意差が認められるp値の閾値は、0.05に限られず、任意の値とすることができる。
【0104】
例えば、多変量解析がクラスター分析である場合、或る候補パラメータの組み合わせについてのクラスター分析の結果、第1の既知化合物に対する神経細胞の活動データおよび第2の既知化合物に対する神経細胞の活動データがそれぞれ別のクラスターに分類された場合に、その候補パラメータの組み合わせを予測パラメータセットとして特定することができる。例えば、或る候補パラメータの組み合わせについてのクラスター分析の結果、第1の既知化合物に対する神経細胞の活動データ、第2の既知化合物に対する神経細胞の活動データ、・・・第nの既知化合物に対する神経細胞の活動データが全て別のクラスターに分類された場合に、その候補パラメータの組み合わせを予測パラメータセットとして特定することができる。このように、クラスター分析を候補パラメータの全ての組み合わせについて行い、全データがそれぞれ別のクラスターに分類された1つまたは複数の候補パラメータの組み合わせを予測パラメータセットとして特定する。
【0105】
予測パラメータ特定手段122は、複数の組の化合物をそれぞれ分離可能な複数の予測パラメータセットを特定することが好ましくあり得る。これにより、複数の特性を予測することが可能になるからである。予測パラメータ特定手段122は、関連する複数の組の化合物をそれぞれ分離可能な複数の予測パラメータセットを特定することがさらに好ましくあり得る。関連する複数の組の化合物を段階的に分離することにより、段階的な特性の予測が可能になり、高い精度の特性予測が可能になるからである。
【0106】
予測手段123は、入力されたデータから、予測パラメータ特定手段122によって特定された予測パラメータセットに基づいて特性を予測するように構成されている。予測手段123は、予測パラメータセット122から予測パラメータセットを受け取り、かつ、受信手段110によって受信された対象化合物に対するデータも受け取る。対象化合物に対するデータは、例えば、対象化合物に対する神経細胞の活動データまたはそれを変換した画像データ(例えば、ラスタープロット画像、ヒストグラム、波形画像等)であり得る。
【0107】
予測手段123は、例えば、対象化合物に対するデータが、第1の既知化合物に対するデータまたは第2の既知化合物に対するデータのいずれと類似するかを決定し、決定された第1の既知化合物または第2の既知化合物の特性を、対象化合物の特性として予測する。
【0108】
予測手段123は、例えば、予測パラメータセットについて対象化合物に対するデータに対して多変量解析を行い、その結果に基づいていずれと類似するかを決定するようにしてもよい。例えば、多変量解析が主成分解析である場合には、予測手段123は、予測パラメータセットについて対象化合物に対するデータの主成分得点を算出し、主成分得点をプロットした主成分プロットに基づいて類似するかを決定する。例えば、主成分プロット間のユークリッド距離、コサイン類似度、またはその組み合わせによって類似するかを決定する。例えば、多変量解析がクラスター分析である場合には、予測手段123は、予測パラメータセットについて、第1の既知化合物に対するデータ、第2の既知化合物に対するデータ、および、対象化合物に対するデータをクラスター分析し、第1の既知化合物に対するデータ、第2の既知化合物に対するデータ、および、対象化合物に対するデータそれぞれをクラスターに分類する。対象化合物に対するデータが第1の既知化合物に対するデータまたは第2の既知化合物に対するデータと同じクラスターに分類されるか否かに基づいて類似するかを決定する。このとき、対象化合物に対するデータが、第1の既知化合物に対するデータが分類されたクラスターまたは第2の既知化合物に対するデータが分類されたクラスターのいずれにも分類されなかった場合には、対象化合物に対するデータは、第1の既知化合物に対するデータまたは第2の既知化合物に対するデータのいずれにも類似していないことになる。
【0109】
上述した例では、プロセッサが、多変量解析手段121および予測パラメータ特定手段122を備えることを説明したが、予測パラメータセットが予め決定されている場合には、プロセッサは、多変量解析手段121および予測パラメータ特定手段122を備えなくてもよい。この場合、プロセッサは、予め決定された予測パラメータセットを受信し、受信した予測パラメータセットに基づいて特性を予測する。
【0110】
例えば、プロセッサは、予め決定された予測パラメータセットについて、対象化合物に対するデータ、第1の既知化合物に対するデータおよび第2の既知化合物に対するデータに対して多変量解析を行い、その結果に基づいて対象化合物に対するデータが、第1の既知化合物に対するデータまたは第2の既知化合物に対するデータのいずれと類似するかを決定し、決定された第1の既知化合物または第2の既知化合物の特性を、対象化合物の特性として予測する。例えば、予め決定された予測パラメータセットについて、対象化合物に対するデータ、第1の既知化合物に対するデータおよび第2の既知化合物に対するデータに対して主成分解析を行い、主成分プロットに基づいて(例えば、類似度Sに基づいて)、第1の既知化合物に対するデータまたは第2の既知化合物に対するデータのいずれと類似するかを決定し、決定された第1の既知化合物または第2の既知化合物の特性を、対象化合物の特性として予測する。例えば、予め決定された予測パラメータセットについて、対象化合物に対するデータ、第1の既知化合物に対するデータおよび第2の既知化合物に対するデータに対してクラスター分析を行い、対象化合物に対するデータが第1の既知化合物に対するデータまたは第2の既知化合物に対するデータと同じクラスターに分類されるか否かに基づいて、第1の既知化合物に対するデータまたは第2の既知化合物に対するデータのいずれと類似するかを決定し、決定された第1の既知化合物または第2の既知化合物の特性を、対象化合物の特性として予測する。
【0111】
図1に示される例では、コンピュータシステム100の各構成要素がコンピュータシステム100内に設けられているが、本発明はこれに限定されない。コンピュータシステム100の各構成要素のいずれかがコンピュータシステム100の外部に設けられることも可能である。例えば、プロセッサ120、メモリ130のそれぞれが別々のハードウェア部品で構成されている場合には、各ハードウェア部品が任意のネットワークを介して接続されてもよい。このとき、ネットワークの種類は問わない。各ハードウェア部品は、例えば、LANを介して接続されてもよいし、無線接続されてもよいし、有線接続されてもよい。コンピュータシステム100は、特定のハードウェア構成には限定されない。例えば、プロセッサ120をデジタル回路ではなくアナログ回路によって構成することも本発明の範囲内である。コンピュータシステム100の構成は、その機能を実現できる限りにおいて上述したものに限定されない。
【0112】
図2に示される例では、プロセッサ120の各構成要素が同一のプロセッサ120内に設けられているが、本発明はこれに限定されない。プロセッサ120の各構成要素が、複数のプロセッサ部に分散される構成も本発明の範囲内である。
【0113】
3.対象化合物の特性を予測するためのコンピュータシステムにおける処理
図7は、対象化合物の特性を予測するためのコンピュータシステム100における処理の一例を示す。
図7に示される例では、対象化合物の特性を予測するための処理700を説明する。
【0114】
ステップS701では、コンピュータシステム100が受信手段110を介して、第1の既知化合物に対する神経細胞の第1の活動データを受信する。第1の活動データは、例えば、第1の既知化合物を異なる細胞種に投与した場合の複数のデータ、第1の既知化合物を異なるベンダーから供給された同一の細胞種サンプルに投与した場合の複数のデータ、第1の既知化合物を同一のベンダーから供給された異なるロットのサンプルに投与した場合の複数のデータ、第1の既知化合物を同一のベンダーから異なる日に供給されたサンプルに投与した場合の複数のデータ、第1の既知化合物を異なる施設で試験した場合の複数のデータを含み得る。受信された活動データは、プロセッサ120に渡される。
【0115】
ステップS702では、コンピュータシステム100が受信手段110を介して、第2の既知化合物に対する神経細胞の第2の活動データを受信する。第2の活動データは、例えば、第2の既知化合物を異なる細胞種に投与した場合の複数のデータ、第2の既知化合物を異なるベンダーから供給された同一の細胞種サンプルに投与した場合の複数のデータ、第2の既知化合物を同一のベンダーから供給された異なるロットのサンプルに投与した場合の複数のデータ、第2の既知化合物を同一のベンダーから異なる日に供給されたサンプルに投与した場合の複数のデータ、第2の既知化合物を異なる施設で試験した場合の複数のデータを含み得る。受信された活動データは、プロセッサ120に渡される。
【0116】
ステップS703では、プロセッサ120が、候補パラメータセット中の各候補パラメータの全ての組み合わせに対して、第1の活動データおよび第2の活動データの多変量解析を行い、予測パラメータセットを特定する。例えば、プロセッサ120の多変量解析手段121が、候補パラメータセット中の各候補パラメータの全ての組み合わせに対して、第1の活動データおよび第2の活動データの多変量解析を行い、プロセッサ120の予測パラメータ特定手段122が、多変量解析の結果に基づいて予測パラメータセットを特定する。
【0117】
予測パラメータセットが特定され、コンピュータシステム100が受信手段110を介して、対象化合物に対する神経細胞の標的活動データを受信すると、ステップS704では、プロセッサ120が、対象化合物に対する神経細胞の標的活動データから、ステップS703で特定された予測パラメータセットに基づいて特性を予測する。例えば、プロセッサ120の予測手段123が特性を予測する。このようにして、対象化合物の特性を予測することができる。
【0118】
図8は、ステップS704でプロセッサ120が対象化合物の特性を予測する処理の一例を示す。
【0119】
ステップS801では、プロセッサ120の予測手段123が、ステップS703で特定された予測パラメータセットについて対象化合物の標的活動データの多変量解析を行う。これにより、標的活動データが、第1の活動データおよび第2の活動データに対して既に行われた予測パラメータセットについての多変量解析の結果と比較できるようになる。多変量解析は、例えば、主成分解析である。例えば、予測手段123は、主成分解析により、標的活動データの主成分得点を算出する。多変量解析は、例えば、クラスター分析である。例えば、予測手段123は、クラスター分析により、標的活動データをクラスターに分類する。
【0120】
ステップS801で行われる多変量解析は、ステップS703で行われた多変量解析と同じ手法であってもよいし、異なる手法であってもよい。例えば、ステップS703で主成分解析を行うことにより、予測パラメータセットを特定した場合、ステップS801では、同じく主成分解析を行ってもよいし、異なる多変量解析(例えば、クラスター分析)を行ってもよい。例えば、ステップS703でクラスター分析を行うことにより、予測パラメータセットを特定した場合、ステップS801では、同じくクラスター分析を行ってもよいし、異なる多変量解析(例えば、主成分解析)を行ってもよい。
【0121】
ステップS802では、プロセッサ120の予測手段123が、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定する。
【0122】
予測手段123は、例えば、ステップS801で算出された主成分得点に基づいて、類似するか否かを決定することができる。例えば、主成分得点に基づいて作成された主成分プロットに基づいて標的活動データと第1の活動データとの類似度および標的活動データと第2の活動データとの類似度を算出することができる。
【0123】
例えば、予測パラメータセットについて、第1の活動データの第1主成分得点および第2主成分得点をプロットし、第2の活動データの第1主成分得点および第2主成分得点をプロットし、標的活動データの第1主成分得点および第2主成分得点をプロットした後、標的活動データのプロットと第1の活動データのプロットとのユークリッド距離と、標的活動データのプロットと第2の活動データのプロットとのユークリッド距離とを比較することにより、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定することができる。例えば、標的活動データのプロットと第1の活動データのプロットとのコサイン類似度と、標的活動データのプロットと第2の活動データのプロットとのコサイン類似度とを比較することにより、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定することができる。例えば、標的活動データのプロットと第1の活動データのプロットとのユークリッド距離およびコサイン類似度と、標的活動データのプロットと第2の活動データのプロットとのユークリッド距離およびコサイン類似度とを比較することにより、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定することができる。なお、複数の第1の活動データまたは複数の第2の活動データによって複数の点がプロットされる場合には、全プロットの平均値を算出し、その点を代表点として標的活動データとのユークリッド距離またはコサイン類似度を求めるようにしてもよい。
【0124】
好ましくは、主成分プロットのユークリッド距離およびコサイン類似度の組み合わせによって類似度を決定する。例えば、
図6Aに示されるように、対象化合物(標的活動データ)のプロットと第1の既知化合物(第1の活動データ)のプロットとの間のユークリッド距離d
1と、対象化合物(標的活動データ)のプロットと第2の既知化合物(第2の活動データ)のプロットとの間のユークリッド距離d
2とが等しい場合でも、コサイン類似度によって類似度を判別可能だからである。主成分プロットのユークリッド距離およびコサイン類似度の組み合わせを用いる場合、類似度Sは、
【数5】
で表される。
【0125】
予測手段123は、例えば、ステップS801で標的活動データがどのクラスターに分類されたかに基づいて、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定することができる。
【0126】
ステップS802で標的活動データが第2の活動データよりも第1の活動データに類似すると決定された場合、ステップS803に進み、第1の既知化合物の特性を対象化合物の特性として特定する。例えば、第1の既知化合物が「毒性有り」との特性を有している場合には、対象化合物の特性が「毒性有り」と特定される。例えば、第1の既知化合物が「GABAに効く」という特性(作用機序)を有している場合には、対象化合物の作用機序が「GABAに効く」と特定される。
【0127】
ステップS802で標的活動データが第2の活動データよりも第1の活動データに類似しない、すなわち、標的活動データが第1の活動データよりも第2の活動データに類似していると決定された場合、ステップS804に進み、第2の既知化合物の特性を対象化合物の特性として特定する。例えば、第2の既知化合物が「毒性無し」との特性を有している場合には、対象化合物の特性が「毒性無し」と特定される。例えば、第1の既知化合物が「Kチャンネルに効く」という特性(作用機序)を有している場合には、対象化合物の作用機序が「Kチャンネルに効く」と特定される。
【0128】
上述した例では、第1の既知化合物に対する第1の活動データおよび第2の既知化合物に対する第2の活動データを用いて処理700を行ったが、これに加えて、第3の既知化合物に対する第3の活動データ、第4の既知化合物に対する第4の活動データ、・・・第nの化合物に対する第nの活動データ(ここで、nは3以上の整数)を用いて処理700を行うようにしてもよい。このとき、ステップS802では、標的活動データと、第1の活動データ、第2の活動データ、・・・第nの活動データそれぞれとの類似度を比較することになる。
【0129】
例えば、第1の既知化合物に対する第1の活動データ、第2の既知化合物に対する第2の活動データ、・・・第11の既知化合物に対する第11の活動データを用いて処理700を行うことができる。この場合に、ステップS801で多変量解析としてクラスター分析を行ったときの結果の一例を
図6Bに示す。
【0130】
図6Bは、第1〜第11の既知化合物と対象化合物Aおよび対象化合物Bとについてクラスター分析を行った場合の結果の一例を示す。縦軸がユークリッド距離を示している。
図6Bでは、ユークリッド距離が近い化合物(例えば、ユークリッド距離が約150(
図6Bにおいて二点鎖線で示される)以下の化合物)が同一のクラスターに分類されており、同一のクラスター内の化合物は同一の特性を有する。例えば、第1〜第5の既知化合物は、それぞれ同じ特性1を有し、第6の既知化合物は、特性2を有し、第7の既知化合物は、特性3を有し、第8の既知化合物は、特性4を有し、第9の既知化合物および第10の既知化合物は、それぞれ同じ特性5を有し、第11の既知化合物は、特性6を有する。ここで、対象化合物Aは、第6の既知化合物と同じクラスターに分類されるため、特性2を有すると予測される。対象化合物Bは、第9の既知化合物および第10の既知化合物と同じクラスターに分類されるため、特性5を有すると予測される。
【0131】
ステップS803またはステップS804で対象化合物の特性が特定された後、第2の予測パラメータセットを用いてステップS704を繰り返すようにしてもよい。このとき、第2の予測パラメータセットは、例えば、第3の既知化合物および第4の既知化合物を用いてステップS701〜ステップS703の処理を行うことによって特定された予測パラメータセットであってもよい。あるいは、第2の予測パラメータセットは、ステップS803で第1の既知化合物の特性を対象化合物の特性として特定した場合には、第1の既知化合物および第3の既知化合物を用いてステップS701〜ステップS703の処理を行うことによって特定された予測パラメータセットであってもよいし、ステップS804で第2の既知化合物の特性を対象化合物の特性として特定した場合には、第2の既知化合物および第3の既知化合物を用いてステップS701〜ステップS703の処理を行うことによって特定された予測パラメータセットであってもよい。これにより、第2の予測パラメータセットがステップS803またはステップS804で特定された対象化合物の特性に対応するようになる。これは、特性を段階的に特定できるようになるという点で好ましくあり得る。
【0132】
例えば、ステップS803またはステップS804で対象化合物の特性が「GABAに効く」と特定された場合、「GABA−Aに効く」という特性(作用機序)を有する第3の既知化合物と「GABA−Bに効く」という特性(作用機序)を有する第1の既知化合物または第4の既知化合物とを用いてステップS701〜ステップS703の処理を行うことによって特定された第2の予測パラメータセットを用いてステップS704を繰り返すことができる。これにより、「GABAに効く」という対象化合物の特性が、「GABA−Aに効く」のか、「GABA−Bに効く」のかという具体的な特性まで特定できる。
【0133】
図9は、対象化合物の特性を予測するためのコンピュータシステム100における処理の一例を示す。
図7に示される例では、予測パラメータセットが予め決定されている場合の、対象化合物の特性を予測するための処理900を説明する。予め決定されている予測パラメータセットは、上述した候補パラメータのうちの少なくとも1つを含む。
【0134】
ステップS901では、コンピュータシステム100が受信手段110を介して、第1の既知化合物に対する神経細胞の第1の活動データ、第2の既知化合物に対する神経細胞の第2の活動データ、対象化合物に対する神経細胞の標的活動データを受信する。第1の活動データは、例えば、第1の既知化合物を異なる細胞種に投与した場合の複数のデータ、第1の既知化合物を異なるベンダーから供給された同一の細胞種サンプルに投与した場合の複数のデータ、第1の既知化合物を同一のベンダーから供給された異なるロットのサンプルに投与した場合の複数のデータ、第1の既知化合物を同一のベンダーから異なる日に供給されたサンプルに投与した場合の複数のデータ、第1の既知化合物を異なる施設で試験した場合の複数のデータを含み得る。第2の活動データは、例えば、第2の既知化合物を異なる細胞種に投与した場合の複数のデータ、第2の既知化合物を異なるベンダーから供給された同一の細胞種サンプルに投与した場合の複数のデータ、第2の既知化合物を同一のベンダーから供給された異なるロットのサンプルに投与した場合の複数のデータ、第2の既知化合物を同一のベンダーから異なる日に供給されたサンプルに投与した場合の複数のデータ、第2の既知化合物を異なる施設で試験した場合の複数のデータを含み得る。受信された活動データは、プロセッサ120に渡される。
【0135】
ステップS902では、プロセッサ120の予測手段123が、それぞれのデータに対して、予測パラメータセットについて多変量解析を行う。多変量解析は、例えば、主成分解析である。例えば、予測手段123は、主成分解析により、第1の活動データの主成分得点、第2の活動データの主成分得点、および、標的活動データの主成分得点を算出する。多変量解析は、例えば、クラスター分析である。例えば、予測手段123は、クラスター分析により、標的活動データをクラスターに分類する。
【0136】
ステップS903では、プロセッサ120の予測手段123が、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定する。予測手段123は、例えば、ステップS902で算出された主成分得点に基づいて、類似するか否かを決定することができる。例えば、主成分得点に基づいて作成された主成分プロットに基づいて標的活動データと第1の活動データとの類似度および標的活動データと第2の活動データとの類似度を算出することができる。
【0137】
例えば、予測パラメータセットについて、第1の活動データの第1主成分得点および第2主成分得点をプロットし、第2の活動データの第1主成分得点および第2主成分得点をプロットし、標的活動データの第1主成分得点および第2主成分得点をプロットした後、標的活動データのプロットと第1の活動データのプロットとのユークリッド距離と、標的活動データのプロットと第2の活動データのプロットとのユークリッド距離とを比較することにより、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定することができる。例えば、標的活動データのプロットと第1の活動データのプロットとのコサイン類似度と、標的活動データのプロットと第2の活動データのプロットとのコサイン類似度とを比較することにより、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定することができる。例えば、標的活動データのプロットと第1の活動データのプロットとのユークリッド距離およびコサイン類似度と、標的活動データのプロットと第2の活動データのプロットとのユークリッド距離およびコサイン類似度とを比較することにより、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定することができる。なお、複数の第1の活動データまたは複数の第2の活動データによって複数の点がプロットされる場合には、全プロットの平均値を算出し、その点を代表点として標的活動データとのユークリッド距離またはコサイン類似度を求めるようにしてもよい。
【0138】
予測手段123は、例えば、ステップS902で標的活動データがどのクラスターに分類されたかに基づいて、標的活動データが第2の活動データよりも第1の活動データと類似するか否かを決定することができる。
【0139】
ステップS903で標的活動データが第2の活動データよりも第1の活動データに類似すると決定された場合、ステップS904に進み、第1の既知化合物の特性を対象化合物の特性として特定する。例えば、第1の既知化合物が「毒性有り」との特性を有している場合には、対象化合物の特性が「毒性有り」と特定される。例えば、第1の既知化合物が「GABAに効く」という特性(作用機序)を有している場合には、対象化合物の作用機序が「GABAに効く」と特定される。
【0140】
ステップS903で標的活動データが第2の活動データよりも第1の活動データに類似しない、すなわち、標的活動データが第1の活動データよりも第2の活動データに類似していると決定された場合、ステップS905に進み、第2の既知化合物の特性を対象化合物の特性として特定する。例えば、第1の既知化合物が「毒性無し」との特性を有している場合には、対象化合物の特性が「毒性無し」と特定される。例えば、第2の既知化合物が「Kチャンネルに効く」という特性(作用機序)を有している場合には、対象化合物の作用機序が「Kチャンネルに効く」と特定される。
【0141】
上述した例では、第1の既知化合物に対する第1の活動データおよび第2の既知化合物に対する第2の活動データを用いて処理900を行ったが、これに加えて、第3の既知化合物に対する第3の活動データ、第4の既知化合物に対する第4の活動データ、・・・第nの化合物に対する第nの活動データ(ここで、nは3以上の整数)を用いて処理700を行うようにしてもよい。このとき、ステップS903では、第1の活動データと、第2の活動データと、・・・第nの活動データとの類似度を比較することになる。
【0142】
上述した例では、特定の順序で処理が行われることを説明したが、各処理の順序は説明されたものに限定されず、論理的に可能な任意の順序で行われることに留意されたい。
【0143】
上述した例では、コンピュータシステム100を用いて対象化合物の特性を予測することを説明したが、予測することができる対象は、化合物の特性に限定されない。特性を分離可能な予測パラメータセットが存在する限り、任意の標的の特性を予測することができるコンピュータシステムも本発明の範囲内である。
【0144】
例えば、本発明は、標的として、神経ネットワークを対象とすることができ、本発明のコンピュータシステムによって、未知の神経ネットワークの特性を予測することができる。神経ネットワークは、例えば、iPS細胞から作製され神経ネットワークであり得る。
【0145】
例えば、候補パラメータセット(化合物の特性を予測する場合に用いた候補パラメータセットと同じ候補パラメータセットであり得る)中の各候補パラメータの全ての組み合わせに対して、既知の疾患ニューロンの電気活動データの多変量解析を行うことにより、異なる疾患ニューロンの電気活動データを分離可能な予測パラメータセットを特定し、特定された予測パラメータセットに基づいて、未知の神経ネットワークがどの疾患ニューロンに近い機能を有するかを予測することができる。これにより、例えば、健常人から作製された未知の神経ネットワークが、どの疾患ニューロンに類似する電気活動を示すかを特定し、その健常者の将来の疾患を予測することが可能となり得る。
【0146】
例えば、候補パラメータセット(化合物の特性を予測する場合に用いた候補パラメータセットと同じ候補パラメータセットであり得る中の各候補パラメータの全ての組み合わせに対して、脳の各部位の既知の神経ネットワークの電気活動データの多変量解析を行うことにより、脳の各部位の神経ネットワークの電気活動データを分離可能な予測パラメータセットを特定し、特定された予測パラメータセットに基づいて、未知の神経ネットワークがどの脳の部位に近い挙動を有するかを予測することができる。
【0147】
上述した例では、電気活動データに加えて、遺伝子発現のデータ、シナプス機能データ、代謝機能のデータ等のデータを用いることにより、予測の精度の向上させることができる。また、分離可能な特性を増加させることもできる。
【0148】
例えば、本発明は、標的として、細胞を対象とすることができ、本発明のコンピュータシステムによって、未知の細胞の特性を予測することができる。
【0149】
例えば、候補パラメータセット(各種細胞性状解析の定量データ(例えば、遺伝子発現、オートファジー、ミトコンドリア、老化細胞の定量データ)のためのパラメータを含む候補パラメータセットであり得る)中の各候補パラメータの全ての組み合わせに対して、疾患既知患者の細胞から得られた種々のデータ(例えば、遺伝子発現のデータ、オートファジーのデータ、ミトコンドリア解析のデータ、老化細胞解析のデータ等)の多変量解析を行うことにより、異なる疾患既知患者の細胞データを分離可能な予測パラメータセットを特定し、特定された予測パラメータセットに基づいて、疾患未知患者の細胞がどの疾患既知患者の細胞に近い特性を有するかを予測することができる。これにより、例えば、疾患未知患者の疾患の診断や病気の予測が可能となり得る。
【0150】
このような任意の標的の特性を予測することができるコンピュータシステムは、コンピュータシステム100と同様の構成を有することができ、コンピュータシステム100と同様の処理によって、任意の標的の特性を予測することができる。例えば、上述した処理700と同様の処理によって、任意の標的の特性を予測することができる。
【0151】
ステップS701では、コンピュータシステム100が受信手段110を介して、第1の対象に対する第1のデータを受信する。第1の対象は、例えば、第1の既知の疾患ニューロン、脳の第1の部位の神経ネットワーク、第1の疾患既知患者の細胞等であり得、第1のデータはそれぞれ、第1の既知の疾患ニューロンの電気活動データ、脳の第1の部位の神経ネットワークの電気活動データ、第1の疾患既知患者の細胞の種々のデータ(例えば、遺伝子発現のデータ、オートファジーのデータ、ミトコンドリア解析のデータ、老化細胞解析のデータ等)であり得る。受信されたデータは、プロセッサ120に渡される。
【0152】
ステップS702では、コンピュータシステム100が受信手段110を介して、第2の対象に対する第2のデータを受信する。第2の対象は、例えば、第2の既知の疾患ニューロン、脳の第2の部位の神経ネットワーク、第2の疾患既知患者の細胞等であり得、第2のデータはそれぞれ、第2の既知の疾患ニューロンの電気活動データ、脳の第2の部位の神経ネットワークの電気活動データ、第2の疾患既知患者の細胞の種々のデータ(例えば、遺伝子発現のデータ、オートファジーのデータ、ミトコンドリア解析のデータ、老化細胞解析のデータ等)であり得る。受信されたデータは、受信された活動データは、プロセッサ120に渡される。
【0153】
ステップS703では、プロセッサ120が、候補パラメータセット中の各候補パラメータの全ての組み合わせに対して、第1のデータおよび第2のデータの多変量解析を行い、予測パラメータセットを特定する。例えば、プロセッサ120の多変量解析手段121が、候補パラメータセット中の各候補パラメータの全ての組み合わせに対して、第1のデータおよび第2のデータの多変量解析を行い、プロセッサ120の予測パラメータ特定手段122が、多変量解析の結果に基づいて予測パラメータセットを特定する。
【0154】
予測パラメータセットが特定され、コンピュータシステム100が受信手段110を介して、標的に対する標的データを受信すると、ステップS704では、プロセッサ120が、標的に対する標的データから、ステップS703で特定された予測パラメータセットに基づいて特性を予測する。例えば、プロセッサ120の予測手段123が特性を予測する。標的は、例えば、未知の神経ネットワーク、疾患未知患者の細胞等であり得、標的データはそれぞれ、未知の神経ネットワークの電気活動データ、疾患未知患者の細胞の種々のデータ(例えば、遺伝子発現のデータ、オートファジーのデータ、ミトコンドリア解析のデータ、老化細胞解析のデータ等)であり得る。このようにして、任意の標的の特性を予測することができる。
【0155】
図7、
図8、
図9を参照して上述した例では、
図7、
図8、
図9に示される各ステップの処理は、プロセッサ120およびメモリ130に格納されたプログラムによって実現することが説明されたが、本発明はこれに限定されない。
図7、
図8、
図9に示される各ステップの処理のうちの少なくとも1つは、制御回路などのハードウェア構成によって実現されてもよい。
【0156】
上述した例では、コンピュータシステム100を用いて対象の特性を予測することを説明したが、本発明はこれに限定されない。コンピュータシステム100を用いることなく、人が手計算で対象の特性を予測することも本発明の範囲である。この場合、例えば、処理700および処理900は、データを受信するステップ(ステップS701、ステップS702、ステップS901)の代わりに、対象からデータを得るステップを含み得る。得られたデータをもとに、後続ステップを手計算で行うことができる。
【実施例】
【0157】
一実施例において、5つの既知化合物(4AP、Phenytoin、PTX(Picrotoxin)、Strychnine、Amoxiciline)のそれぞれを、神経細胞に投与した際の活動データをMEAを用いて取得した。ここで、神経細胞として、AxolBioscience社のHuman iPSC−derived neural stem cells(ax0019)を用い、MEAとして、アルファメッドサイエンティフィック社のMEA 24well Plate−comfortを用い、その計測装置として、アルファメッドサイエンティフィック社のMED64−Presto(MED−A384iN)を用いた。4APは、約30μMの濃度で投与され、Phenytoinは、約100μMの濃度で投与され、PTX(Picrotoxin)は、約3μMの濃度で投与され、Strychnineは、約30μMの濃度で投与され、Amoxicilineは、約100μMの濃度で投与された。取得されたデータを本発明のコンピュータシステムに投入し、候補パラメータセット中の各候補パラメータの全ての組み合わせに対して、それらのデータの主成分解析を行った。候補パラメータセットは、10個のパラメータ((1)TS、(2)NoB、(3)IBI、(4)バースト長、(5)バースト中スパイク数、(6)PS、(7)PSの変動係数、(8)IPI、(9)IPIの変動係数、(10)Periodicity)から成り、10個のパラメータのうちの3個以上を組み合わせて構成される968個のパラメータ組のそれぞれに対して主成分解析を行った。主成分解析および有意差検定の結果、5つの既知化合物の作用機序を分離することができる予測パラメータセットとして、IBI、バースト中スパイク数、PS、Periodicityから成るパラメータ組が特定された。
【0158】
PTX(Picrotoxin)と同様の作用機序を有する化合物を対象化合物Aとして、対象化合物Aから得られた活動データについて特定されたパラメータ組を用いて主成分解析を行った。対象化合物Aおよび各既知化合物に対して10回試行した。
【0159】
図10Aおよび
図10Bは、本実施例における対象化合物Aの作用機序の予測結果を示す図である。
【0160】
図10Aは、対象化合物Aおよび5つの既知化合物の主成分プロットを示すグラフである。
図10Aにおいて、横軸が第1主成分を表し、縦軸が第2主成分を表す。
【0161】
図10B(a)は、対象化合物Aの主成分プロットの平均値と、5つの既知化合物のそれぞれの主成分プロットの平均値とユークリッド距離を示すグラフであり、
図10B(b)は、各ユークリッド距離を棒グラフで示している。一番左の棒グラフが、対象化合物Aの主成分プロットの平均値と、4APの主成分プロットの平均値とのユークリッド距離を示し、左から2番目の棒グラフが、対象化合物Aの主成分プロットの平均値と、Phenytoinの主成分プロットの平均値とのユークリッド距離を示し、左から3番目の棒グラフが、対象化合物Aの主成分プロットの平均値と、PTX(Picrotoxin)の主成分プロットの平均値とのユークリッド距離を示し、左から4番目の棒グラフが、対象化合物Aの主成分プロットの平均値と、Strychnineの主成分プロットの平均値とのユークリッド距離を示し、左から5番目の棒グラフが、対象化合物Aの主成分プロットの平均値と、Amoxicilineの主成分プロットの平均値とのユークリッド距離を示している。
【0162】
図10Bから分かるように、対象化合物Aの主成分プロットの平均値とユークリッド距離が最も近い既知化合物は、PTX(Picrotoxin)であり、対象化合物Aの作用機序は、PTX(Picrotoxin)と同じであると予測される。このように、対象化合物Aの作用機序を正しく予測することができた。
【0163】
本発明は、上述した実施形態に限定されるものではない。本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。当業者は、本発明の具体的な好ましい実施形態の記載から、本発明の記載および技術常識に基づいて等価な範囲を実施することができることが理解される。
【解決手段】本発明の標的の特性の予測方法は、(1)第1の対象に対する第1のデータを得る工程と、(2)第2の対象に対する第2のデータを得る工程と、(3)候補パラメータセット中の各候補パラメータの全ての組み合わせについて、前記第1のデータおよび前記第2のデータの多変量解析を行い、予測パラメータセットを特定する工程と、(4)前記標的に対する標的データから、前記予測パラメータセットに基づいて前記特性を予測する工程を包含する