【文献】
川上恭子,Excel VBAでデータ分析,日本,株式会社マイナビ 中川 信行,2015年 3月23日,第1版,p192-208
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0028】
以下、添付の図面を参照しながら、本発明の実施形態を説明する。
【0029】
以下の開示において、分子ターゲットとは、生体内にあり、臨床的障害や疾患を引き起こす原因と深く関わっており、それを何らかの方法で制御することにより、その疾患を予防および/または治療することができる機能性高分子を意味する。具体的には、受容体(例えば、イオンチャネル共役型受容体、チロシンキナーゼ共役型受容体、Gタンパク質共役型受容体等の細胞表面受容体、レチノイン酸受容体、ステロイドホルモン受容体等の核内受容体等)、酵素(例えば、デヒドロゲナーゼ、レダクターゼ、オキシダーゼ、オキシゲナーゼ、ヒドロペルオキシダーゼ等の酸化還元酵素、メチルトランスフェラーゼ、ヒドロキシメチルトランスフェラーゼ、ホルミルトランスフェラーゼ、カルボキシルトランスフェラーゼ、カルバモイルトランスフェラーゼ、アミドトランスフェラーゼ、アシルトランスフェラーゼ、アミノアシルトランスフェラーゼ、グリコシルトランスフェラーゼ、アミノトランスフェラーゼ、オキシミノトランスフェラーゼ、ホスホトランスフェラーゼ(例えば、キナーゼ等)、ヌクレオチジルトランスフェラーゼ、スルファートランスフェラーゼ、スルホトランスフェラーゼ、CoAトランスフェラーゼ等の転移酵素、プロテアーゼ、エステラーゼ、グリコシダーゼ、ペプチダーゼ等の加水分解酵素、アルドラーゼ、デカルボキシラーゼ、デヒドラターゼ、カルボキシキナーゼ等のリアーゼ、ラセマーゼ、エピメラーゼ、シス−トランスイソメラーゼ、糖イソメラーゼ、トートメラーゼ、Δ−イソメラーゼ、ムターゼ、シクロイソメラーゼ等の異性化酵素、DNAリガーゼ等のリガーゼ等)、輸送体タンパク質(例えば、イオンチャネル、イオンポンプ等)、核酸(例えば、micro‐RNA、RNA、DNA等)等が挙げられる。
【0030】
また、創薬ターゲットとは、分子ターゲットのうち、創薬の対象とするターゲットを意味する。創薬ターゲットは、好ましくは酵素であり、より好ましくは、転移酵素であり、特に好ましくは、キナーゼである。創薬ターゲットは、酵素以外に、受容体または輸送体タンパク質であってもよい。
【0031】
また、リード化合物とは、創薬ターゲットにおける活性を有し、該創薬ターゲット以外の分子ターゲットにおける活性が該創薬ターゲットにおける活性よりも弱い化合物であって、構造変換によって医薬品になりうる化合物を意味する。創薬ターゲットにおける活性は、まだ十分に強くない場合もある。また、目的とする医薬品によっては、2以上の創薬ターゲットにおける活性を有するリード化合物が望まれることもある。
【0032】
散布図とは、縦軸、横軸に2つの項目(特性)について量や大きさ等を対応させてデータをシンボルでプロットした図である。すなわち、各データは2つの項目(特性)について量や大きさ等を有する。
【0033】
(実施の形態1)
1.四次元散布図
最初に、リード化合物の抽出または創薬ターゲットの選択に使用する四次元散布図について説明する。
【0034】
図1は、本実施形態における四次元散布図の一例を示した図である。同図に示す四次元散布図は、ある対象キナーゼ(創薬ターゲットまたは分子ターゲットの一例)に対する化合物の活性値(例えば、pIC
50)、選択性(例えば、エントロピースコア)、リガンド効率、分子量の4つのパラメータに基づいて、複数の化合物をプロットした散布図である。同図に示すように、四次元散布図は、横軸(X軸)を選択性とし、縦軸(Y軸)を活性値とし、選択性−活性値の二次元平面上に化合物を示すシンボル3(○マーク)がプロットされて生成される。化合物を示すシンボル3の色及び大きさは化合物の分子量及びリガンド効率のそれぞれに基づいて決定される(詳細は後述)。このような四次元散布図によれば、化合物の4つの特性を同時に視覚的に把握することが可能となり、また、データを俯瞰的に捉えることが可能となり、合成展開の可能性の予測が可能となる。
【0035】
以下、四次元散布図の生成に使用される活性値、選択性およびリガンド効率の算出方法について説明する。
【0036】
(1)活性値の算出
創薬ターゲットに対するリード化合物の活性としては、受容体結合活性、受容体制御活性、受容体シグナル伝達活性化活性、受容体シグナル伝達阻害活性、酵素制御活性、酵素活性化活性、酵素阻害活性、チャネル結合活性、チャネル制御活性、チャネル活性化活性、チャネル阻害活性、ポンプ結合活性、ポンプ制御活性、ポンプ活性化活性、ポンプ阻害活性、タンパク‐タンパク相互作用の阻害剤等が挙げられる。
【0037】
活性値の表記方法は、特に限定されないが、例えば、活性化率、阻害率、制御率、半数活性化濃度(EC
50)、pEC
50、半数阻害濃度(IC
50)、pIC
50、見積り半数阻害濃度(eIC
50)、peIC
50、半数致死濃度(LC
50)、pLC
50、活性化定数(K
a)、pK
a、阻害定数(K
i)、pK
i、解離定数(K
d)、pK
d、半数有効用量(ED
50)、pED
50、半数阻害用量(ID
50)、pID
50、半数致死用量(LD
50)、pLD
50、結合速度定数(k
on)、解離速度定数(k
off)、滞留時間(Residence time)、自由エネルギー(ΔG)、エンタルピー(ΔH)、エントロピー(ΔS)、融解温度(Tm)等が挙げられる。好ましくは、活性化率、阻害率、半数活性化濃度、pEC
50、半数阻害濃度、pIC
50、活性化定数、pK
a、阻害定数、pK
i、解離定数、pK
dであり、より好ましくは、半数活性化濃度、pEC
50、半数阻害濃度、pIC
50、活性化定数、pK
a、阻害定数、pK
i、解離定数、pK
dであり、特に好ましくは、半数阻害濃度(IC
50)、pIC
50である。
【0038】
本実施形態では、活性値の表記方法の例として半数阻害濃度IC
50(pIC
50)を用いた。以下、酵素阻害活性についての半数阻害濃度(IC
50(pIC
50))の算出方法を説明する。
【0039】
アッセイバッファー(20mM HEPES, 0.01% Triton X-100, 2mM DTT, pH7.5)にて調製した5mLの4倍濃度被験物質溶液(数千化合物)、5mLの4倍濃度基質/ATP/金属イオン(マグネシウムイオン、所望によりさらにマンガンイオンを加える(キナーゼによって異なる))溶液および10mLの2倍濃度キナーゼ溶液(数百種類)をポリプロピレン製384ウェルプレートのウェル内で混合し、室温にて1もしくは5時間(キナーゼによって異なる)反応させた。60mLのTermination Buffer(QuickScout Screening Assist MSA; Carna Biosciences社製)を添加して反応を停止させた。反応溶液中の基質ペプチドとリン酸化ペプチドをLabChip3000 system(Caliper LifeScience社製)にて分離、定量した。キナーゼ反応は基質ペプチドピーク高さ(S)とリン酸化ペプチドピーク高さ(P)から計算される生成物比(P/(P+S))にて評価した。
【0040】
全ての反応コンポーネントを含むコントロールウェルの平均シグナルを0% Inhibition、バックグランドウェル(酵素非添加)の平均シグナルを100% Inhibitionとし、各被験物質試験ウェルのシグナルから阻害率(%)を計算した。
【0041】
基質のリン酸化を50%阻害する化合物濃度をIC
50と定義した。IC
50値は、得られた阻害率を以下のlogistic式に入れて最小二乗法により算出した。
Y=Bottom+(Top−Bottom)/(1+10^(HillSlope×(logIC
50−log
10 (X)))
ここで、Y:阻害率(%)、X:濃度、Top:最大の阻害率(当実験では100)、Bottom:最小の阻害率(当実験では0)、HillSlope:傾き(当実験では1)
【0042】
上式において、決定係数R
2 > 0.5, LogIC
50最大誤差 < 1を満たさない場合は、最大評価濃度の阻害率(%)を用いて、下記の式によりIC
50値を算出した。
IC
50= 100×X/Y−X
ここで、Y:阻害率(%)、X:濃度(μM)
【0043】
最大評価濃度での阻害率(%)が20%以下、すなわち活性を示さなかった場合は、後の選択性の指標とするエントロピースコアの算出に用いるため、一定の値とした。今回の場合は最大評価濃度が10μMのときのIC
50値は4,000μM、最大評価濃度が100μMの時のIC
50値は40,000μMとした。
【0044】
上記方法により算出したIC
50値を、pIC
50値すなわちモル濃度での−logIC
50値に変換し、これを活性値とした。
【0045】
(2)選択性の算出
リード化合物の選択性とは、対象とする創薬ターゲット以外の分子ターゲットにおけるリード化合物の活性に対する、対象とする創薬ターゲットにおけるリード化合物の活性の比率を意味する。
【0046】
リード化合物の創薬ターゲットに対する選択性の指標は、特に限定されないが、例えば、エントロピースコア(Entropy Score)、選択性エントロピー(selectivity entropy)、情報エントロピー(information entropy)、シャノンエントロピー(Shannon entropy)、選択性スコア(selectivity score)、選択性指数(selectivity index)、ジニ係数(Gini coefficient)、ジニスコア(Gini score)、分配係数(partition coefficient)等が挙げられる。好ましくは、エントロピースコア、選択性スコア、選択性指数、ジニ係数、分配係数であり、より好ましくは、ジニ係数、エントロピースコアであり、特に好ましくは、エントロピースコアである。
【0047】
本実施形態では、選択性の指標としてエントロピースコア(Entropy Score)を用いた。エントロピースコアは、上記方法で算出したIC
50値から非特許文献(BMC Bioinformatics、2011、12、94)にしたがって算出した。選択性の指標として、エントロピースコアに代えて、選択性スコア(Nature Biotechnology, 2008, 26, 1, 127)、ジニ係数(J.Med.Chem., 2007, 50, 23, 5773)、分配係数(J.Med.Chem., 2010, 53, 11, 4502)などを用いてもよい。
【0048】
(3)リガンド効率の算出
リガンド効率とは、分子の大きさ当たりの活性の強さを見積もった化合物の評価指標を意味する。
【0049】
リガンド効率の指標は、特に限定されないが、例えば、リガンド効率(ligand efficiency)、パーセント阻害効率指数(percentage efficiency index)、結合効率指数(binding efficiency index)、表面結合効率指数(surface-binding efficiency index)、フィットクオリティスコア(fit quality score)、パーセント阻害効率(Percent Ligand Efficiency)、グループ効率(group efficiency、GE)、リガンド脂溶性効率(ligand lipophilicity efficiency、LLE)等が挙げられる。好ましくは、リガンド効率、パーセント阻害効率指数、結合効率指数,表面結合効率指数であり、より好ましくは、リガンド効率,パーセント阻害効率指数であり、特に好ましくは、リガンド効率である。
【0050】
本実施形態では、リガンド効率は、上記方法で算出したIC
50値と、化合物の水素を除外した原子(重原子)の数とを用いて、文献(Drug Discovery Today, 2005, 10, 987)に記載の方法にしたがって算出した。
【0051】
各創薬ターゲットに対して上記方法で算出した活性値(pIC
50)、選択性(エントロピースコア(Entropy Score))、リガンド効率、そして分子量の4つの特性を用いて
図1に示すような四次元散布図を作成した。すなわち、四次元散布図の縦軸(Y軸)を活性値とし、横軸(X軸)を選択性として、化合物を示すシンボル3をプロットした。さらに、プロットするシンボル3の色を分子量に応じて異ならせた。
図1の例では、化合物を、分子量が300未満の第1グループ、分子量が300以上かつ350未満の第2グループ、分子量が350以上の第3グループの3つのグループに分類し、それぞれのグループ毎に化合物を示すシンボル3の色(例えば、赤、黄、青)を異ならせている。
【0052】
また、シンボル3の大きさを、リガンド効率に応じて異ならせた。
図1の例では、リガンド効率の値が大きいときは、シンボル3の大きさをより大きな大きさとし、リガンド効率の値が小さいときは、シンボル3の大きさをより小さい大きさとした。また、リガンド効率の値が一定値よりも大きいときには、シンボル3の大きさをある一定の大きさとして表わし、リガンド効率の値が一定値よりも小さいときには、シンボル3の大きさをある一定の小ささとして表わした。
【0053】
活性値としてpIC
50を用いた場合、リード化合物のpIC
50としては、好ましくは、4以上であり、より好ましくは、5以上であり、特に好ましくは、6以上である。選択性としてエントロピースコアを用いた場合、リード化合物のエントロピースコアとしては、好ましくは、4以下であり、より好ましくは、3以下であり、特に好ましくは、2以下である。リード化合物の分子量としては、500以下が好ましく、400以下がより好ましく、350以下が特に好ましい。リード化合物のリガンド効率としては、0.25以上が好ましく、0.3以上がより好ましく、0.35以上が特に好ましい。
【0054】
図1に示す四次元散布図では、縦軸に示した活性値は数値が大きいほど活性が強く、横軸に示した選択性は数値が小さいほど選択性が良い化合物を示す。リード化合物の抽出のための、四次元散布図上の所定領域としては、活性値としてpIC
50を用い、選択性の評価方法としてエントロピースコアを用いた場合、好ましくは、pIC
50が6以上、かつエントロピースコアが4以下であり、より好ましくは、pIC
50が7以上、かつエントロピースコアが3以下であり、特に好ましくは、pIC
50が8以上、かつエントロピースコアが2以下である。すなわち、活性が8以上かつ選択性が2以下の領域は、リード化合物として特に好ましい化合物が含まれる領域を示す。このことから、高活性・高選択性の領域5を示す枠を四次元散布図上に配置した。高活性・高選択性の領域5は、リード化合物としてより好ましい化合物が含まれる領域である。この領域5に含まれる化合物に着目することにより、リード化合物として好ましい化合物を容易に認識することができる。
【0055】
一般に、リード化合物はより低分子量で高活性と高選択性を持つことが好ましい。四次元散布図では、分子量に応じてシンボルの色を異ならせることにより、分子量の変化に伴って活性や選択性が向上していることが認識し易くなる。さらに、四次元散布図では、リガンド効率をその値に応じてシンボルの大きさで表現した。これにより、分子量の小さい化合物でも活性を示すような効率の良い化合物も一目で理解することができる。シンボル(○マーク)が大きいほどその化合物が効率よく活性を獲得していることを示す(
図1参照)。
【0056】
図2(A),(B)はそれぞれ、2種のキナーゼ(創薬ターゲット)A,Bに対する、既存の可視化形態である活性と選択性を用いた二次元散布図を示している。キナーゼA,Bの双方とも、高活性・高選択的な領域5に化合物がプロットされている。既存の可視化形態では、高活性・高選択性の化合物が良質なリード化合物に成り得るか否かは不明である。
【0057】
図3は、キナーゼ(創薬ターゲット)A,Bに対する、本発明の実施形態である四次元散布図を示した図である。
図3に示す四次元散布図においては、良質なリード化合物として重要な因子である分子量の分布が理解でき、さらにリガンド効率も一目で認識できる。例えば、
図3(A)を参照すると、キナーゼAについて領域5内には、分子量300未満および300以上350未満であって、且つリガンド効率の良い化合物が複数存在する。これに対し、
図3(B)を参照すると、キナーゼBの領域5内の化合物は、ほとんどが分子量350以上であってリガンド効率の悪い化合物である。たとえ高活性・高選択的な化合物であっても、リガンド効率が悪ければ、リード化合物としては適当ではない。すなわち、キナーゼBよりもキナーゼAの方がより良質なリード化合物を取得できることがわかる。
【0058】
2.リード化合物の抽出方法
四次元散布図における高活性・高選択性の領域5は、リード化合物としてより好ましい化合物が含まれる領域である。よって、この領域5に含まれる化合物群の中から化合物を抽出する。これによりリード化合物として好ましい化合物を抽出することができる。なお、高活性・高選択性の領域5に含まれる化合物群の中から、さらに、分子量及び/またはリガンド効率が所定の条件を満たす化合物を選択するようにしてもよい。所定の条件として、例えば、分子量については所定値以下であり、リガンド効率について所定値以上としてもよい。例えば、高活性・高選択性の領域5に含まれる化合物のうち、リガンド効率が0.3以上のものをリード化合物として抽出してもよい。または、高活性・高選択性の領域5に含まれる化合物のうち、分子量が350以下でかつリガンド効率が0.3以上のものをリード化合物として抽出してもよい。
【0059】
3.合成展開の可能性を予測するための矢印の表示
図4は、合成展開の可能性を予測するための矢印7をさらに配置した四次元散布図を示した図である。
図5は、
図4に示す図において、プロットされたシンボルを排除して合成展開の可能性を予測するための矢印7、化合物の分布の重心G1,G2,G3、及び化合物の分布の重心の好ましい領域を示した図である。四次元散布図に配置された矢印7を参照することにより、四次元散布図に示す対象キナーゼ(換言すれば、創薬ターゲット候補である分子ターゲット)についてリード化合物からの合成展開の可能性を予測することができ、その対象キナーゼ(分子ターゲット)が創薬ターゲットとして適切か否かを判断することが可能となる。
【0060】
矢印7を求めるにあたっては、最大評価濃度の阻害率が20%以下の化合物データを除外した。各キナーゼについて、分子量分類ごとに活性値(pIC
50)、選択性、リガンド効率の各データにおいて、平均値よりも良い化合物のデータを採用した。本例では、平均よりも良いデータを採用する作業であるが、上位から任意の数のより良いデータを使用することも可能である。
【0061】
各キナーゼにおいて、分子量の3つの分類グループの各々において、選択性−活性値の二次元平面における化合物の分布の重心G1,G2,G3を算出し、
図4、
図5に示すように、分子量の範囲が隣接するグループ間で重心G1,G2,G3を矢印7で結んだ。すなわち、重心G1-G2間及び重心G2-G3間を矢印7で結んだ。この矢印7は、分子量が小さい方から大きい方へ変化する際の分布の重心の変化の方向(すなわち、分布の変化方向)を示す。重心G1は分布の変化の始点を示し、重心G3は分布の変化の終点を示す。重心G1,G2,G3は、それぞれ分子量について分類された第1ないし第3グループにおける選択性−活性値の二次元平面上での分布の重心であり、具体的には、活性値と選択性のそれぞれの特性値について下記式により求められる。
Gx=(X1+X2+…+Xn)/ n (1)
ここで、Xn:活性値(Y座標値)または選択性の値(X座標値)、Gx:特性値の重心(x=1〜3)、n:分子量に基づき分類された各グループに属する化合物の数。
【0062】
または、標準化した活性、選択性、リガンド効率の値を用いて、活性値と選択性のデータにリガンド効率のデータで重み付けした後に、各キナーゼにおいて、分子量分類ごとに活性値、選択性の各重心を算出し、算出した重心から重み付けした矢印7を求めてもよい。
Sx=(Xi−Xmin)/(Xmax−Xmin) (2)
ここで、Xi:活性値(Y座標値)または選択性の値(X座標値)(i=1〜n)、Sx:標準化後の特性値の値、Xmin:最小値、Xmax:最大値。
Wz=(Wi−Wmin)/(Wmax−Wmin) (3)
ここで、Wi:リガンド効率の値(i=1〜n)、Wz:標準化後の特性値の値、Wmin:最小値、Wmax:最大値。
G'x={(S1×W1)+(S2×W2)+…+(Sn×Wn)}/ΣWi (4)
ここで、G'x:重み付けした特性値の重心(x=1〜3)。
【0063】
4.創薬ターゲットの選択方法
以上のようにして、ある分子ターゲットに対して求めた重心G1,G2,G3の位置及び重心G1-G2間、G2-G3間の矢印の方向に基づいて、その分子ターゲットが創薬ターゲットとして適しているか否かを判断する。具体的には、以下に示す条件Aを満たすとともに、条件B1、B2及びB3の少なくともいずれか一方を満たす場合に、その分子ターゲットが創薬ターゲットとして適していると判断する。
条件A)重心G1-G2間の矢印(重心G1から重心G2へ向かう矢印)が領域の方向(散布図における左上方向、以下「高活性・高選択性領域5」ともいう)を向いている。
条件B1)重心G2が高活性・高選択性領域5内に含まれる。
条件B2)重心G2-G3間の矢印(重心G2から重心G3へ向かう矢印)が領域の方向(散布図における左上方向)を向いている。かつ、分布の変化の終点として示される重心G3が、高活性・高選択性領域5内に含まれる。
条件B3)重心G2-G3間の矢印が領域の方向(散布図における左上方向)を向いている。かつ、分布の変化の終点として示される重心G3が所定の活性値(pIC
50が5以上)の範囲に含まれる。
【0064】
図6に、5種の分子ターゲット(キナーゼ)A〜Eに対する四次元散布図の例を示す。
図7は、分子ターゲットA〜Eの四次元散布図から発生させた、合成展開の可能性を予測するための矢印7、化合物の分布の重心G1,G2,G3、化合物の分布の重心の好ましい領域、及び所定の活性値の範囲を示した図である。
図7では、高活性・高選択性領域5を、活性(pIC
50)>7.0、選択性(エントロピースコア)<2.5の領域とし、所定の活性値の範囲をpIC
50が5以上の領域としている。
【0065】
分子ターゲットA:分子量300未満の化合物群の重心G1に対して、分子量300以上350未満の化合物群の重心G2は左上にプロットされ(条件A)、さらに重心G3が高活性・高選択性領域5(活性(pIC
50)>7.0、選択性(エントロピースコア)<2.5)に含まれる(条件B1)。すなわち、条件Aと条件B1を満たすことから、分子ターゲットAは有望な創薬ターゲットと判断できる。
【0066】
分子ターゲットB:重心G1に対して、重心G2、そして分子量350以上の化合物群の重心G3は左上にプロットされ(条件A)、さらに重心G2が高活性・高選択性領域5に含まれる(条件B2)。すなわち、条件Aと条件B2を満たすことから、分子ターゲットBは有望な創薬ターゲットと判断できる。
【0067】
分子ターゲットC:重心G1に対して、重心G2、そして重心G3は左上にプロットされるが(条件A)、重心G2、重心G3は高活性・高選択性領域5に含まれない。すなわち、条件Aは満たすが、条件B1は満たさない。しかし分子量の増加にともない、重心G2から重心G3への矢印7が高活性・高選択性領域5の方向に向いていること、重心G3が合成展開する上で必要と判断した活性pIC
50>5.0を満たす(条件B3)。すなわち、条件Aと条件B3を満たすことから、分子ターゲットCは有望な創薬ターゲットであると判断できる。
【0068】
分子ターゲットD:重心G1に対して、重心G2は左上にプロットされるが、重心G3は左上ではなく、活性が減弱する左下にプロットされる(条件B2、B3を満たさない)。すなわち、分子量の増加にも関わらず活性が上がらない。また、重心G3は高活性・高選択性領域5内に含まれない(条件B1を満たさない)。すなわち、条件Aは満たすが、条件B1〜B3のいずれも満たさないことから、分子ターゲットDは有望な創薬ターゲットとして好ましくないと判断できる。
【0069】
分子ターゲットE:重心G1に対して、重心G2と重心G3は左上にプロットされるが、重心G3は、高活性・高選択性領域5内に含まれないし(条件B1、B2を満たさない)、合成展開する上で必要と判断した活性pIC
50>5.0も満たさない(条件B3を満たさない)。すなわち、条件Aは満たすが、条件B1〜B3のいずれも満たさないことから、分子ターゲットEは有望な創薬ターゲットとして好ましくないと判断できる。
【0070】
以上のように、合成展開の可能性を予測するための矢印7により、ある分子ターゲットが有望な創薬ターゲットであるか否かを判断することができる。すなわち、矢印7及び重心を参照することにより、複数の分子ターゲットの中から有望な創薬ターゲットを選択することができる。
【0071】
このような合成展開の可能性を予測するための矢印7を参照することにより、種々のキナーゼの中から創薬ターゲットとして有望なキナーゼを自動的に選択することが可能となる(詳細は後述)。また、分子ターゲットCは、
図6に示すように、高活性・高選択性の領域5に化合物が存在していないため、その時点では良質なリード化合物を得ることができなかった。しかし、
図7に示す分子ターゲットCの矢印7を参照した判断結果では、分子ターゲットCは有望な創薬ターゲットとして判断できる。言い換えると、分子ターゲットCは、より多くの化合物(例えば、数万化合物)のスクリーニングや合成展開をすることで良質なリード化合物を得ることができる分子ターゲットであると予測できる。
【0072】
以下に示すとおり、実際に分子ターゲットCに対して数万化合物のスクリーニングを実施し、ターゲットCに対して活性を示した数十化合物に対して、数百種のキナーゼに対する活性を評価した。先の方法で得られた阻害率(%)を用いて、下記の式によりIC
50値を算出した。
IC
50= 100×X/Y−X
ここで、Y:阻害率(%)、X:濃度(μM)
【0073】
最大評価濃度での阻害率(%)が20%以下の場合、すなわち活性を示さなかった場合は、後の選択性の指標とするエントロピースコアの算出に用いるため、IC
50値を一定の値とした。また、最大評価濃度が0.1μMのときのIC
50値は40μM、最大評価濃度が1μMの時のIC
50値は400μMとした。また最小評価濃度での阻害率(%)が99%以上の場合もIC
50値を一定値とした。今回の場合は最小評価濃度が0.1μMのときのIC
50値は0.001μM、最小評価濃度が1μMの時のIC
50値は0.01μMとした。
【0074】
上記方法により算出したIC
50値を用いて、活性値(pIC
50)、選択性(エントロピースコア)、リガンド効率を算出した。
図8に、
図6に示すターゲットCの四次元散布図上にさらに数十化合物を示すシンボル(□マーク)をプロットした。その結果、複数化合物が高活性・高選択性の領域5に配置された。すなわち、ターゲットCは、合成展開によって高活性かつ高選択性を有する化合物が得られる創薬ターゲットであることが示された。
【0075】
このように四次元散布図上にプロットされたシンボルからでは良質なリード化合物を得ることができなかったと判断された分子ターゲットであっても、矢印7を参照することにより、有望な創薬ターゲットとして選択される場合もある。
【0076】
5.四次元散布図生成装置
上述した四次元散布図を生成して表示する四次元散布図生成装置(可視化装置の一例)の構成、動作について以下に説明する。
【0077】
5.1 装置の構成
図9は、四次元散布図を生成して表示する四次元散布図生成装置のハードウェア構成を示した図である。四次元散布図生成装置100は、パーソナルコンピュータのような情報処理装置で構成される。四次元散布図生成装置100は、その全体動作を制御する制御部11と、画面表示を行う表示部17と、ユーザが操作を行う操作部19と、データやプログラムを記憶するデータ格納部21とを備える。
【0078】
表示部17は例えば、液晶ディスプレイや有機ELディスプレイで構成される。操作部19はキーボード、マウス、タッチパネル等を含む。
【0079】
さらに、四次元散布図生成装置100は、外部機器やネットワークに接続するためのインタフェース部25を含む。インタフェース部25は、USBやHDMI(登録商標)等のインタフェースに準拠した種々の機器(プリンタ、通信装置、入力装置等)を接続可能であり、接続した機器と四次元散布図生成装置100間のデータや制御コマンドの通信を可能とする。
【0080】
制御部11は四次元散布図生成装置100全体の動作を制御するものであり、プログラムを実行することで所定の機能を実現するCPUやMPUで構成される。制御部11で実行されるプログラムは通信回線や、CD、DVD、メモリカード等の記録媒体を介して提供されてもよい。制御部11は、所定の機能を実現するように設計された専用のハードウェア回路(FPGA,ASIC等)で構成されてもよい。
【0081】
データ格納部21はデータやプログラムを記憶する装置であり、例えばハードディスク(HDD)、SSD、半導体メモリ素子、光ディスクで構成することができる。データ格納部21は、四次元散布図の生成や表示を行うための制御プログラム31や、化合物のデータを格納する化合物ライブラリデータベース(以下「化合物ライブラリDB」と称する)32、生成した四次元散布図等の情報を格納する。
【0082】
化合物ライブラリDB32は、複数の化合物について各化合物の特性に関する情報を管理するデータベースである。具体的には、化合物ライブラリDB32は、各化合物について、少なくとも、複数のキナーゼに対する活性値や選択性、化合物の分子量、化合物のリガンド効率に関する特性値を格納している。化合物ライブラリDB32は例えば下記のフォーマットを有する。
【表1】
【0083】
すなわち、化合物ライブラリDB32は、複数の化合物のそれぞれについて、複数のキナーゼに対する活性値や選択性、及び化合物の分子量、化合物のリガンド効率に関する特性値を格納している。化合物ライブラリDB32は、CD、DVD、メモリカード等の記録媒体や、通信回線を通じて外部サーバから提供されてもよい。
【0084】
5.2 装置の動作
5.2.1 四次元散布図の表示
四次元散布図生成装置100の動作を説明する。
図10は、四次元散布図生成装置100における、四次元散布図の表示動作を示すフローチャートである。
図10を参照して、四次元散布図生成装置100における四次元散布図の表示動作を説明する。
【0085】
制御部11は、リード化合物を抽出したい分子ターゲットに対して種々の化合物の特性値に関する情報を化合物ライブラリDB32から取得する(S11)。具体的には、制御部11は、化合物ライブラリDB32から、各化合物について、少なくとも、分子ターゲットに対する活性値及び選択性、分子量、リガンド効率に関する情報を取得する。このとき、制御部11は、化合物ライブラリDB32に含まれる化合物の中から、所定の条件(例えば、最大評価濃度の阻害率が20%以上)を満たす化合物のみを選択して取得するようにしてもよい。
【0086】
次に、制御部11は、取得した化合物群の中の一つの化合物について、分子ターゲットに対するその化合物の活性、選択性に基づき、その化合物を示すシンボルをプロットする四次元散布図上の位置を決定する(S12)。
【0087】
さらに、制御部11は、その化合物の分子量に基づき、その化合物を示すシンボルの色を決定する(S13)。具体的には、分子量が300未満である場合は、シンボルの色を赤色に設定し、分子量が300以上かつ350未満の場合、シンボルの色を黄色に設定し、分子量が350以上の場合、シンボルの色を青色に設定する。
【0088】
さらに、制御部11は、その化合物のリガンド効率に基づき、その化合物を示すシンボルの大きさを決定する(S14)。具体的には、リガンド効率の値に応じたシンボルの大きさとする。すなわち、リガンド効率の値が大きいときに、シンボルの大きさをより大きな大きさとし、リガンド効率の値が小さいときに、シンボルの大きさをより小さい大きさとする。なお、リガンド効率の値が一定値よりも大きいときには、シンボルの大きさをある一定の大きさとして表わし、リガンド効率の値が一定値よりも小さいときには、シンボルの大きさをある一定の小ささとして表わしてもよい。
【0089】
以上のようにして一つの化合物に対して、シンボルの配置位置や属性(色、大きさ)が決定される(S12〜S14)。以後、制御部11は、化合物ライブラリDB32から取得した化合物のすべてに対して、四次元散布図に配置するシンボルの位置や属性(色、大きさ)を決定する(S15)。
【0090】
取得した化合物のすべてに対して、四次元散布図に配置するシンボルの位置や属性(色、大きさ)が決定されると(S15でYES)、制御部11は、決定したシンボルの位置や属性(色、大きさ)に基づき各化合物を示すシンボルを、選択性−活性値の二次元平面上に配置して四次元散布図(すなわち、四次元散布図を示す画像データ)を生成して、表示部17に表示する(S16)。これにより、表示部17上に例えば
図1に示すような四次元散布図が表示される。このとき、制御部11は、生成した四次元散布図を表示部17に表示する代わりに又は表示するとともに、四次元散布図を示す画像データをデータ格納部21に格納したり、または、インタフェース部25を介して外部機器に出力したりしてもよい。
【0091】
制御部11は、四次元散布図上において、高活性・高選択性の領域5を示す枠を合わせて表示させる。高活性・高選択性の領域5は、リード化合物としてより好ましい化合物が含まれる領域であり、例えば、活性(pIC
50)>8.0、かつ、選択性(エントロピースコア)<2.0となる領域、または、活性(pIC
50)>7.0、かつ、選択性(エントロピースコア)<3.0となる領域に設定される。
【0092】
このとき、制御部11は、高活性・高選択性の領域5内に含まれる化合物を抽出し、リード化合物候補として抽出し、抽出した化合物に関する情報(化合物名等)を、分子ターゲットと関連づけて、データ格納部21に格納したり、表示部17に表示させたりしてもよい。また、制御部11は、高活性・高選択性の領域5内に含まれる化合物のうち、分子量及び/またはリガンド効率が所定の条件を満たす化合物のみを抽出するようにしてもよい。データ格納部21に格納された又は表示部17に表示された化合物に関する情報を参照することにより、リード化合物としてより好ましい化合物を容易に認識することができる。
【0093】
また、制御部11は、
図11に示すように、高活性・高選択性の領域について、有望な化合物が含まれる領域(第2優先領域)5Bと、より有望な化合物が含まれる領域(第1優先領域)5Aをそれぞれ示す枠をさらに表示させてもよい。例えば、第1優先領域5Aは、活性(pIC
50)が8以上かつ選択性(エントロピースコア)が2以下に設定し、第2優先領域5Bは、活性(pIC
50)が7以上かつ8未満、かつ選択性(エントロピースコア)が2より大きくかつ3以下に設定する。これによって、優先して抽出すべきリード化合物候補を段階的に認識することができる。
【0094】
なお、
図10のフローチャートは一つの分子ターゲットに対する四次元散布図の表示処理を説明した。
図3や
図6に示すように、複数の分子ターゲットに対する四次元散布図を複数同時に表示させる場合は、
図10のフローチャートの処理を分子ターゲット毎に複数回実行すればよい。
【0095】
5.2.2 合成展開の可能性を予測するための矢印の表示
図12は、
図4、
図5等に示す合成展開の可能性を予測するための矢印7の生成処理を示すフローチャートである。
図12を参照して、四次元散布図生成装置100における合成展開の可能性を予測するための矢印7の生成処理を説明する。
【0096】
制御部11は、化合物を、分子量に関して3つのグループ、すなわち、分子量が300未満の第1グループ、分子量が300以上かつ350未満の第2グループ、分子量が350以上の第3グループの3つのグループに分類して管理している。そして、制御部11は、分子量のグループ毎に、選択性−活性値の二次元平面における各シンボルの分布(選択性−活性値の二次元平面における分布)の重心G1,G2,G3を算出する(S21)。
【0097】
具体的には、制御部11は、第1グループに属する化合物について、式(1)を用いて、活性値および選択性それぞれについて平均値を算出することで、第1グループに属する化合物の分布における重心G1を算出する。同様に、制御部11は、式(1)を用いて、第2グループに属する化合物について、活性値および選択性それぞれについて平均値を算出することで第2グループに属する化合物の分布における重心G2を算出し、第3グループに属する化合物について、活性値および選択性それぞれについて平均値を算出することで第3グループに属する化合物の分布における重心G3を算出する。なお、重心G1,G2,G3は、重みづけした式(3)を用いて算出してもよい。
【0098】
制御部11は、分子量の範囲が隣接するグループ間の重心G1‐G2間、重心G2‐G3間をそれぞれ矢印で結び、四次元散布図上に表示させる(S22)。これにより、例えば、
図4(A)(B)に示すように分布の変化を示す矢印7が四次元散布図上に表示される。
【0099】
なお、制御部11は、
図5(A)(B)に示すように、プロットされたシンボルを示さずに矢印7のみを表示してもよい。または、
図7に示すように、複数の分子ターゲットに対する矢印を並べて表示してもよい。この場合、
図12のフローチャートの処理を複数の分子ターゲットのそれぞれに対して実行すればよい。
【0100】
また、制御部11は、算出した重心G1〜G3の位置や矢印7の向き(傾き)に応じて、分子ターゲットが有望な創薬ターゲットであるか否かを判定し、判定結果をデータ格納部21に格納したり、表示部17に表示したりしてもよい。これにより、四次元散布図で示された分子ターゲットが有望な創薬ターゲットであるか否かを装置の利用者に提示することができる。
【0101】
以下、重心の位置や矢印の向きに基づき分子ターゲットが有望な創薬ターゲットであるか否かを判定する動作について説明する。
図13は、制御部11のその判定動作のフローチャートである。
【0102】
制御部11はまず、重心G1-G2間の矢印(重心G1から重心G2へ向かう矢印)が高活性・高選択性領域5の方に向かっているか否か(条件A)を判断する(S31)。具体的には、制御部11は、重心G1-G2間の矢印が選択性−活性値の二次元平面において左上方向を向いているか否かを判断する。重心G1-G2間の矢印が高活性・高選択性領域5の方に向かっていない場合(S31でNO)、制御部11は、当該分子ターゲットを有望な創薬ターゲットでないと判定する(S37)。
【0103】
重心G1-G2間の矢印が高活性・高選択性領域5の方に向かっている場合(S31でYES)、制御部11は、重心G2が高活性・高選択性領域5内に含まれるか否か(条件B1)を判断する(S32)。重心G2が高活性・高選択性領域5内に含まれる場合(S32でYES)、制御部11は、当該分子ターゲットを有望な創薬ターゲットであると判定する(S36)。
【0104】
重心G2が高活性・高選択性領域5内に含まれない場合(S32でNO)、制御部11は、重心G2-G3間の矢印(重心G2から重心G3へ向かう矢印)が高活性・高選択性領域5の方に向かっているか否かを判断する(S33)。重心G2-G3間の矢印が高活性・高選択性領域5の方に向かっていない場合(S33でNO)、制御部11は、当該分子ターゲットを有望な創薬ターゲットでないと判定する(S37)。重心G2-G3間の矢印が高活性・高選択性領域5の方に向かっている場合(S33でYES)、制御部11は、重心G3が高活性・高選択性領域5内に含まれるか否か(条件B2)を判断する(S34)。重心G3が高活性・高選択性領域5内に含まれる場合(S34でYES)、制御部11は、当該分子ターゲットを有望な創薬ターゲットであると判定する(S36)。
【0105】
重心G3が高活性・高選択性領域5内に含まれない場合(S34でNO)、制御部11は、重心G3が所定の活性値以上(例えば、pIC
50が5以上)の領域内に含まれるか否か(条件B3)を判断する(S35)。重心G3が所定の活性値以上の領域内に含まれる場合(S35でYES)、制御部11は、当該分子ターゲットを有望な創薬ターゲットであると判定する(S36)。重心G3が所定の活性値以上の領域内に含まれない場合(S35でNO)、制御部11は、当該分子ターゲットを有望な創薬ターゲットでないと判定する(S37)。
【0106】
以上のようにして制御部11は、重心の位置や矢印の向きに基づき分子ターゲットが有望な創薬ターゲットであるか否かを判定し、その判定結果をデータ格納部21に格納したり、表示部17に表示したりする(S38)。
【0107】
ここでの高活性・高選択性の領域5は、重心が配置されるより好ましい領域であり、例えば、活性(pIC
50)>5.0、かつ、選択性(エントロピースコア)<4.0となる領域、活性(pIC
50)>6.0、かつ、選択性(エントロピースコア)<3.0となる領域、活性(pIC
50)>7.0、かつ、選択性(エントロピースコア)<2.5となる領域、または、活性(pIC
50)>7.0、かつ、選択性(エントロピースコア)<2.0となる領域に設定してもよい。
【0108】
また、複数の分子ターゲットのそれぞれに対して、合成展開の可能性を予測するための矢印を表示する際の表示態様は、
図7に示すような縦横に並べて表示する態様に限定されるものではない。例えば、
図14に示すように横方向に一例に並べて表示してもよいし、
図15に示すように縦方向に一例に並べて表示してもよい。いずれの表示態様であっても、各分子ターゲットの矢印の傾向を把握でき、矢印の位置や向きに基づき各分子ターゲットが有望な創薬ターゲットであるか否かを判断することができる。
【0109】
6.効果、等
以上説明した四次元散布図は、分子ターゲットに対する化合物の選択性(第1の特性の一例)及び活性値(第2の特性)に基づきシンボルの配置位置が決定され、化合物の分子量(第3の特性の一例)及びリガンド効率(第4の特性の一例)に基づきシンボルの属性(色、大きさ)が決定される。この四次元散布図によれば、データを俯瞰的に捉えることが可能となり、合成展開の可能性の予測が可能となる。また、四次元散布図により、良質なリード化合物として重要な因子である分子量の分布が理解でき、さらにリガンド効率も一目で認識できる。また、四次元散布図における所定の領域(高活性・高選択性の領域5)に着目することにより、リード化合物としてより好ましい化合物を容易に認識することができる。
【0110】
本実施形態で開示したリード化合物の抽出方法は、四次元散布図上の所定領域(高活性・高選択性の領域)5内に配置されたシンボルが示す化合物の中からリード化合物を抽出する。これにより、合成展開の可能性を期待できる良質なリード化合物を抽出することができる。
【0111】
また、四次元散布図上に、分子量に基づき分類された化合物のシンボルの分布の変化を示す矢印を表示してもよい。本実施形態で開示した創薬ターゲットの選択方法は、そのような四次元散布図上での、分子量に基づき分類された化合物のシンボルの分布の変化の方向に基づいて、所定のターゲットを、創薬に用いる創薬ターゲットとして選択するか否かを決定する。このように、分子量で区別された化合物のシンボルの分布の変化の方向に基づいて、創薬ターゲットであるか否かを判定することで、対象の創薬ターゲットが、将来的に合成展開することによって医薬品の候補化合物が得られるものか否かを判断することができる。
【0112】
また、上記の実施形態によれば、所定の創薬ターゲットおよび/または分子ターゲットに対する複数の化合物の特性を示す四次元散布図を生成する四次元散布図生成装置100が提供される。四次元散布図生成装置100は制御部11を備える。制御部11は、複数の化合物について、化合物の種々の特性に関する特性情報を取得する取得手段(S11)、及び、複数の化合物について、取得した特性情報にしたがい各化合物を示すシンボルを配置して四次元散布図を生成して出力する散布図作成手段(S12-S16)として機能する。この四次元散布図生成装置100により四次元散布図を生成することができる。
【0113】
(他の実施の形態)
上記の実施の形態は本発明の一実施形態を開示したものであり、本発明の思想は上記の実施の形態に限定されるものではない。開示した技術に対して、適宜、変更、修正、置換、付加、省略等を行うことも可能である。以下、それらの変形例をいくつか説明する。
【0114】
(1)上記の説明では、四次元散布図にプロットする際に用いる化合物の特性として、活性(第1の特性の一例)、選択性(第2の特性の一例)、分子量(第3の特性の一例)、リガンド効率(第4の特性の一例)を用いたが、化合物の特性はこれらに限定されない。化合物の特性は、創薬において用いられる評価項目であればよく、例えば、活性、選択性、分子量、リガンド効率、脂溶性(logP、logD、clogP、AlogP、MlogP等)、重原子数、水素結合供与体数、水素結合受容体数、回転可能結合数、極性表面積(PSA、TPSA等)、芳香族環数、忌避構造数、酸解離定数、QED(quantitative estimate of drug-likeness)、CNS MPO(central nervous system multiparameter optimization)、溶解性、熱安定性、湿度安定性、光安定性、膜透過性、経口吸収性、ヒト腸管吸収(HIA)性、血液脳関門(BBB)移行性、シトクロムP450(CYP3A4、CYP2D6等)代謝安定性、シトクロムP450阻害(CYP3A4等)活性、発がん性、変異原性(Ames試験等)、皮膚感作性、蓄積性、hERG阻害、染色体異常発現性等が挙げられる。また、これらのうちの2以上の特性を組み合わせて示される特性(例えば、活性と脂溶性を組み合わせて示される特性であるリガンド脂溶性効率等)を用いてもよい。しかし、活性、選択性、分子量およびリガンド効率の組み合わせが好ましい組み合わせである。
【0115】
(2)上記の説明では、化合物の分子量に基づきシンボルの色を設定し、リガンド効率に基づきシンボルの大きさを設定したが、化合物の分子量に基づきシンボルの大きさを設定し、リガンド効率に基づきシンボルの色を設定してもよい。
【0116】
(3)また、シンボルの形状は円形状としたが、シンボルの形状はその形状に限定されるものではない。シンボルは三角、四角、星形、×等任意の形状で表すことができる。
【0117】
(4)また、シンボルの属性として色と大きさを用い、それらを化合物の特性(分子量、リガンド効率)に応じて変化させたが、シンボルの属性としてさらに形状や3次元座標(選択性を示すX軸及び活性を示すY軸で定まる平面に垂直なZ軸上の座標)を加えても良い。すなわち、色、大きさ、形状、3次元座標の中から選択した2つの属性を、化合物の特性(分子量、リガンド効率)に応じて変化させるようにしてもよい。
【0118】
例えば、化合物の分子量及びリガンド効率のいずれか1つに応じてZ軸座標を決定した場合、四次元散布図は3次元的に表現される。
【0119】
(5)また、化合物の一つの特性に基づきシンボルの一つの属性を変化させたが、化合物一つの特性に基づきシンボルの複数の属性を変化させてもよい。例えば、化合物の分子量に応じてシンボルの色と形状を組み合わせて変化させてもよい。
【0120】
(6)上記の説明では、対象データの4つの特性のそれぞれをシンボルの位置や色等の属性に反映された四次元散布図を作成したが、散布図はこれに限定されるものではない。散布図を、5つ以上の特性を同時に視認できるように、プロットするシンボルの属性を変化させて生成してもよい。例えば、5つの特性のそれぞれに応じて、シンボルの位置(X軸、Y軸)、シンボルの色、大きさ、形状を決定して散布図を生成してもよい。
【0121】
(7)上記の例では、良質なリード化合物の抽出や創薬ターゲットの選択に有効なデータ可視化方法を説明した。しかし、上記の実施の形態で開示した四次元散布図を用いたデータ可視化方法は、リード化合物の抽出や創薬ターゲットの選択に用いる化合物候補の特性データの可視化に限定されるものではない。上記の実施の形態で開示したデータ可視化方法は、一般的な四次元以上の特性を持つデータを可視化する際の可視化方法にも適用することができる。このような可視化方法は、ビッグデータの解析や、その結果に基づく方針決定に有効に適用することができる。
【0122】
例えば、下記の分野における様々なデータの可視化にも適用することができる。
−医療(例えば、診療データ分析、投薬情報分析、検査結果分析、バイタルデータ分析、罹患リスク分析、感染予測分析、地域情報分析等)
−金融や保険(例えば、不正解析、取引分析、リスク分析、位置情報分析等)、
−通信や放送(例えば、通信ログ分析、ネットワーク解析、視聴率分析、コンテンツ分析等)
−流通や小売(例えば、POSデータ分析、購買ログ分析、ロイヤリティ分析、プロモーション分析、コールセンター分析、アイトラッキング分析、リピート率分析、サービス利用状況分析、ポイント活用状況分析、クリックストリーム分析等)、
−製造(例えば、品質分析、需要分析、トレーサビリティ、故障事前検知、故障時期予測等)
−WEB等のメディア(例えば、アクセス分析、コンテンツ分析、ソーシャルメディア分析等)、
−公共や公益(例えば、気象データ分析、地震データ分析、エネルギー消費分析、リスク分析(防衛、犯罪等)、橋脚異常検知、社会インフラの効率的運用等)、
−交通(例えば、自動車走行データ分析、渋滞予測、事故原因分析、CO2排出量分析等)、
−観光(例えば、観光客のニーズ分析等)、
−農業や水産業(例えば、動態分析、生育状況分析、漁場予測等)
【0123】
すなわち、この可視化方法は、少なくとも第1ないし第4の特性を有する複数の解析対象のデータについて、第1及び第2の特性に基づき、各データを示すシンボルを配置する位置を決定する。さらに、第3及び第4の特性に基づき、各データを示すシンボルの属性を決定する。そして、決定した位置及び属性に基づいて各データを示すシンボルを配置することにより四次元散布図を生成する。このようにして生成された四次元散布図を参照することで、解析対象データの4つの特性について同時に視覚的に認識することができ、解析対象データの傾向を容易かつ直感的に把握することができる。
【0124】
例えば、気象データにおける、気温、湿度、観測年、および降水量の4つの特性に基づき、
図16のような四次元散布図を得ることができる。データとして、日本の気象データであり、京都、札幌、東京、沖縄の四都市について1900年から2015年までの平均気温、湿度、降水量のデータを使用した。四次元散布図においては、横軸に「気温」、縦軸に「湿度」、シンボルの色に「観測年」(輝度が低いほど新しい)、シンボルの大きさに「降水量」を割り当てている。
図16を参照すると、各都市において近年に近づくほど気温が上昇しているのが見られる。すなわち、地球温暖化の傾向が読み取れる。さらに、気温の上昇に伴い湿度も低下してきていることが把握できる。このように気象に関する四次元散布図を参照することで、環境変化の傾向を容易かつ直感的に把握することができる。
【0125】
また、例えば、医療データにおける、がんによる死亡率、喫煙率、調査年、および人口の4つの特性に基づき、
図17のような四次元散布図を得ることができる。データとして、日本の医療データであり、日本の各都道府県について、2001年から3年毎に2013年までの、がんによる県別の死亡率(悪性新生物75歳未満年齢調整死亡率、人口10万対)、県別の喫煙率、人口のデータを使用した。四次元散布図においては、横軸に「喫煙率」、縦軸に「がんによる死亡率」、シンボルの色に「調査年」(輝度が低いほど新しい)、シンボルの大きさに「人口」を割り当てている。
図17を参照すると、まず、喫煙率とがんによる死亡率には相関が見られる。また、各調査毎の全国平均の喫煙率およびがんによる死亡率をプロットし(
図17中の太字丸)、それらを矢印で結ぶと、ほぼ調査毎に、喫煙率とがんによる死亡率が共に低下してきていることが把握できる。このように医療に関する四次元散布図を参照することで、がんによる死亡率変化の傾向を容易かつ直感的に把握することができる。
【0126】
この場合、四次元散布図生成装置100の制御部11を下記の機能を実現するように構成すればよい。すなわち、制御部11は、解析対象データの第1ないし第4の特性を有する複数の解析対象のデータについて、第1及び第2の特性に基づき、各データを示すシンボルを配置する位置を決定すればよい。さらに、制御部11は、第3及び第4の特性に基づき、各データを示すシンボルの属性を決定すればよい。そして、制御部11は、決定した位置及び属性に基づいて各データを示すシンボルを配置することにより四次元散布図を生成すればよい。さらに、制御部11は、第3の特性に関して所定の条件でデータを複数のグループに分類し、分類した複数のグループに属するデータのシンボルの分布の重心を結ぶ矢印を散布図上に配置してもよい。この矢印の方向や重心の位置を参照することで、第3の特性に関して分類した解析対象のデータの分布の変化の傾向を視覚的に容易に認識することができる。
【0127】
(本開示)
上記の実施の形態において下記の思想が開示されている。
【0128】
(1)創薬ターゲットに対して複数の化合物の中からリード化合物を抽出する方法。
その抽出する方法は、
複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、
散布図上の所定領域内に配置されたシンボルが示す化合物の中からリード化合物を抽出するステップと、を含む。
散布図において、化合物の第1及び第2の特性に基づきシンボルの配置位置が決定され、化合物の第3及び第4の特性に基づきシンボルの属性が決定されている。
【0129】
(2)(1)において、シンボルの属性は、シンボルに関する、色、形状、大きさ及び前記第1及び第2の特性に基づきシンボルが配置される平面に垂直な方向の位置を示す3次元座標のうちの少なくとも2つを含んでもよい。
【0130】
(3)(1)において、第1の特性は、所定の創薬ターゲットに対する化合物の選択性であり、第2の特性は、所定の創薬ターゲットに対する化合物の活性であり、第3の特性は化合物の分子量であり、第4の特性は化合物のリガンド効率であってもよい。
【0131】
(4)(3)において、所定領域は、化合物の選択性及び化合物の活性の双方が所定値以上となる領域であってもよい。
【0132】
(5)(4)において、所定領域に配置されたシンボルが示す化合物のうちリガンド効率が0.3以上である化合物を抽出してもよい。
【0133】
(6)(1)から(5)のいずれかの方法において、創薬ターゲットは、酵素、受容体または輸送体タンパク質であってもよい。
【0134】
(7)創薬ターゲットに対して複数の化合物の中からリード化合物を抽出する方法。
その抽出する方法は、
複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、
散布図上の所定領域内に配置されたシンボルが示す化合物の中からリード化合物を抽出するステップと、を含む。
散布図において、化合物の第1及び第2の特性に基づきシンボルの配置位置が決定される。第1の特性は、所定の創薬ターゲットに対する化合物の選択性であり、第2の特性は、所定の創薬ターゲットに対する化合物の活性である。所定領域は、化合物の選択性及び化合物の活性の双方が所定値以上となる領域であり、所定領域に配置されたシンボルが示す化合物のうちリガンド効率が0.3以上である化合物を抽出する。
【0135】
(8)創薬ターゲットの選択方法。
その選択方法は、所定の分子ターゲットについて、複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、
散布図上に配置されたシンボルの分布に基づいて、前記所定の分子ターゲットを創薬ターゲットとして選択するステップと、を含む。
散布図において、化合物の第1及び第2の特性に基づきシンボルの配置位置が決定され、化合物の第3及び第4の特性に基づきシンボルの属性が決定される。化合物は、第3の特性に関して所定の条件で複数のグループに分類されている。選択するステップは、各グループに属する化合物のシンボルの分布の変化の方向及び変化の終点に基づいて、所定の分子ターゲットを創薬ターゲットとして選択するか否かを決定する。
【0136】
(9)(8)において、シンボルの属性は、シンボルに関する、色、形状、大きさ及び前記第1及び第2の特性に基づきシンボルが配置される平面に垂直な方向の位置を示す3次元座標のうちの少なくとも2つを含んでもよい。
【0137】
(10)(8)において、第1の特性は、所定の分子ターゲットに対する化合物の選択性であり、第2の特性は、所定の分子ターゲットに対する化合物の活性であり、第3の特性は化合物の分子量であり、前記第4の特性は化合物のリガンド効率である。
【0138】
(11)(10)において、複数の化合物が分子量に基づき複数のグループに分類されてもよい。各グループに属する化合物のシンボルの分布の重心を結ぶ矢印が散布図上に配置されてもよい。
【0139】
(12)(11)において、各グループに属する化合物のシンボルの分布の重心を結ぶ矢印が、散布図上の所定領域に向かう場合に、当該分子ターゲットを創薬ターゲットとして選択してもよい。
【0140】
(13)(12)において、散布図上の変化の終点となる分布についてその分布の重心の位置が、選択性が所定値以上となりかつ活性が所定値以上となる領域に含まれる場合に、当該分子ターゲットを創薬ターゲットとして選択してもよい。
【0141】
(14)(8)ないし(13)のいずれかにおいて、前記創薬ターゲットおよび/または分子ターゲットは、酵素、受容体または輸送体タンパク質でもよい。
【0142】
(15)所定の創薬ターゲットに対する複数の化合物の特性を示す散布図を生成する散布図生成装置。散布図生成装置は、
複数の化合物について、化合物の種々の特性に関する特性情報を取得する取得手段と、
複数の化合物について、取得した特性情報にしたがい各化合物を示すシンボルを配置して散布図を生成して出力する散布図作成手段と、を備える。
散布図作成手段は、化合物毎に、化合物の第1及び第2の特性に基づき散布図上のシンボルの配置位置を決定し、化合物の第3及び第4の特性に基づきシンボルの属性を決定して、決定した位置及び属性に基づき化合物を示すシンボルを散布図上に配置する。
【0143】
(16)(15)において、シンボルの属性は、シンボルに関する、色、形状、大きさ及び第1及び第2の特性に基づきシンボルが配置される平面に垂直な方向の位置を示す3次元座標のうちの少なくとも2つを含んでもよい。
【0144】
(17)(15)において、第1の特性は、所定の創薬ターゲットに対する化合物の選択性であってもよい。第2の特性は、所定の創薬ターゲットに対する化合物の活性であってもよい。第3の特性は化合物の分子量であってもよい。第4の特性は化合物のリガンド効率であってもよい。
【0145】
(18)(17)において、散布図作成手段は、化合物の選択性が所定値以上で、かつ、化合物の活性が所定値以上となる領域を示す情報を散布図上に配置してもよい。
【0146】
(19)(18)において、前記領域内にシンボルが配置された化合物の中の少なくとも1つをリード化合物として抽出する抽出手段をさらに備えてもよい。
【0147】
(20)(17)において、散布図作成手段は、複数の化合物を分子量に基づき複数のグループに分類し、各グループに属する化合物のシンボルの分布の重心を結ぶ矢印を散布図上に配置してもよい。
【0148】
(21)(15)ないし(20)のいずれかにおいて、創薬ターゲットは、酵素、受容体または輸送体タンパク質であってもよい。
【0149】
(22)コンピュータに、所定の創薬ターゲットに対する複数の化合物の特性を示す散布図を生成させるプログラム。
そのプログラムはコンピュータを、
複数の化合物について、化合物の種々の特性に関する特性情報を取得する取得手段、及び複数の化合物について、取得した特性情報にしたがい各化合物を示すシンボルを配置して散布図を生成する散布図作成手段として動作させる。
散布図作成手段は、化合物毎に、化合物の第1及び第2の特性に基づき散布図上のシンボルの配置位置を決定し、化合物の第3及び第4の特性に基づき、シンボルの属性を決定し、決定した配置位置及び属性に基づき化合物を示すシンボルを散布図上に配置する。
【0150】
(23)少なくとも第1ないし第4の特性を有する複数のデータの傾向を可視化する第1の方法。その可視化する第1の方法は、
第1及び第2の特性に基づき、各データを示すシンボルを配置する位置を決定し、
第3及び第4の特性に基づき、各データを示すシンボルの属性を決定し、
決定した位置及び属性に基づいて、各データを示すシンボルを散布図上に配置する。
【0151】
(24)(23)の方法において、第3の特性に関して所定の条件でデータが分類され、分類された複数のグループに属するデータのシンボルの分布の重心を結ぶ矢印が散布図上に配置されてもよい。
【0152】
(25)少なくとも第1ないし第3の特性を有する複数のデータの傾向を可視化する第2の方法。その可視化する第2の方法は、
第1及び第2の特性に基づき、各データを示すシンボルを配置する位置を決定し、
決定した位置に基づいて、各データを示すシンボルを散布図上に配置し、
第3の特性に関して所定の条件でデータを複数のグループに分類し、分類した複数のグループに属するデータのシンボルの分布の重心を結ぶ矢印を前記散布図上に配置する。
【0153】
(26)少なくとも第1ないし第4の特性を有するデータの傾向を可視化する装置。
その可視化する装置は、
複数のデータについて、データ毎の特性に関する特性情報を取得する取得手段と、
取得したデータの特性情報に基づいて散布図を生成する散布図生成手段と、を備える。
散布図生成手段は、第1及び第2の特性に基づき、各データを示すシンボルを配置する位置を決定し、第3及び第4の特性に基づき、各データを示すシンボルの属性を決定し、決定した位置及び属性に基づき各データを示すシンボルを散布図上に配置する。
【0154】
以上、本発明の具体的な例として、上述の特定の実施形態を説明したが、当業者にとっては、特許請求の範囲及びその均等の範囲において、他の多くの変形例、修正、置換、付加、省略等を行うことができる。