IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-139949評価プログラム、評価装置及び評価方法
<>
  • 特開-評価プログラム、評価装置及び評価方法 図1
  • 特開-評価プログラム、評価装置及び評価方法 図2
  • 特開-評価プログラム、評価装置及び評価方法 図3
  • 特開-評価プログラム、評価装置及び評価方法 図4
  • 特開-評価プログラム、評価装置及び評価方法 図5
  • 特開-評価プログラム、評価装置及び評価方法 図6
  • 特開-評価プログラム、評価装置及び評価方法 図7
  • 特開-評価プログラム、評価装置及び評価方法 図8
  • 特開-評価プログラム、評価装置及び評価方法 図9
  • 特開-評価プログラム、評価装置及び評価方法 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024139949
(43)【公開日】2024-10-10
(54)【発明の名称】評価プログラム、評価装置及び評価方法
(51)【国際特許分類】
   G16C 20/00 20190101AFI20241003BHJP
【FI】
G16C20/00
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023050905
(22)【出願日】2023-03-28
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】谷田 義明
(72)【発明者】
【氏名】佐藤 博之
(57)【要約】
【課題】化合物の構造を効率よく評価する。
【解決手段】評価プログラムが、所定環境における化合物の構造から計算される集団変数の分布を1以上のクラスタに分割し、クラスタそれぞれに含まれる構造から、クラスタを代表する代表構造を決定し、分布に含まれる構造のうち代表構造から所定距離の範囲に存在する構造の割合に基づくスコアを計算する処理をコンピュータに実行させる。
【選択図】図3
【特許請求の範囲】
【請求項1】
所定環境における化合物の構造から計算される集団変数の分布を1以上のクラスタに分割し、
前記クラスタそれぞれに含まれる前記構造から、前記クラスタを代表する代表構造を決定し、
前記分布に含まれる前記構造のうち前記代表構造から所定距離の範囲に存在する前記構造の割合に基づくスコアを計算する、
処理をコンピュータに実行させるための評価プログラム。
【請求項2】
前記スコアは、前記クラスタごとの前記割合の総和である、
請求項1に記載の評価プログラム。
【請求項3】
前記代表構造は、前記クラスタ内の密度に基づいて決定する、
請求項1に記載の評価プログラム。
【請求項4】
rを前記集団変数とし、iを前記クラスタの番号とし、rを前記距離とし、ρを前記割合とし、cc refを前記代表構造とし、次式により前記スコアを計算する、
【数3】
請求項1に記載の評価プログラム。
【請求項5】
前記化合物は、物性が既知の化合物を改変した化合物である、
請求項1から4のいずれかに記載の評価プログラム。
【請求項6】
前記物性は、標的物質への結合活性、膜透過性及び熱耐性のいずれかを含む、
請求項5に記載の評価プログラム。
【請求項7】
前記集団変数は、前記構造を示す指標である、
請求項1から4のいずれかに記載の評価プログラム。
【請求項8】
前記集団変数は、前記化合物中の原子位置の平均二乗偏差である、
請求項7に記載の評価プログラム。
【請求項9】
所定環境における化合物の構造から計算される集団変数の分布を1以上のクラスタに分割する分割部と、
前記クラスタそれぞれに含まれる前記構造から、前記クラスタを代表する代表構造を決定する決定部と、
前記分布に含まれる前記構造のうち前記代表構造から所定距離の範囲に存在する前記構造の割合に基づくスコアを計算する計算部と、
を備える評価装置。
【請求項10】
所定環境における化合物の構造から計算される集団変数の分布を1以上のクラスタに分割し、
前記クラスタそれぞれに含まれる前記構造から、前記クラスタを代表する代表構造を決定し、
前記分布に含まれる前記構造のうち前記代表構造から所定距離の範囲に存在する前記構造の割合に基づくスコアを計算する、
処理をコンピュータが実行する評価方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、評価プログラム、評価装置及び評価方法に関する。
【背景技術】
【0002】
創薬の分野では、物性が向上するリード化合物の探索が行われる。リード化合物の探索は、標的タンパク質に結合するヒット化合物の一部を改変した改変化合物の物性を評価することが行われる。
【0003】
例えば、特許文献1には、ドッキングされるべき第1入力構造と第2入力構造の相対配置に応じた相互作用エネルギーを表すドッキングスコアを計算する複合体構造予測装置が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008-287529号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来技術では、化合物の物性を評価するための時間的コスト及び経済的コストが大きいという課題がある。構造が類似する化合物同士は物性も類似することが期待されるため、化合物の構造的特徴を評価する手法が求められている。
【0006】
一つの側面では、化合物の構造を効率よく評価することを目的とする。
【課題を解決するための手段】
【0007】
一態様によれば、評価プログラムは、所定環境における化合物の構造から計算される集団変数の分布を1以上のクラスタに分割し、クラスタそれぞれに含まれる構造から、クラスタを代表する代表構造を決定し、分布に含まれる構造のうち代表構造から所定距離の範囲に存在する構造の割合に基づくスコアを計算する処理をコンピュータに実行させる。
【発明の効果】
【0008】
化合物の構造を効率よく評価することができる。
【図面の簡単な説明】
【0009】
図1】分子構造評価システムの全体構成の一例を示すブロック図である。
図2】コンピュータのハードウェア構成の一例を示すブロック図である。
図3】評価装置の機能構成の一例を示すブロック図である。
図4】スコア関数の一例を示す図である。
図5】平均二乗偏差の第1の例を示す図である。
図6】平均二乗偏差の第2の例を示す図である。
図7】安定性スコアの第1の例を示す図である。
図8】安定性スコアの第2の例を示す図である。
図9】評価方法の一例を示すフローチャートである。
図10】結合活性の増減予測の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明の各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0011】
[実施形態]
計算機支援による新薬開発は、創薬等と呼ばれる。創薬の分野は、ビッグデータ又は専用計算機等のブームにより、大きな変革期にある。創薬では、標的タンパク質に結合する既知のヒット化合物の一部(例えば、アミノ酸残基等)を改変しながら、より物性が向上するリード化合物を探索することが行われる。創薬においては、例えば、結合活性、膜透過性及び熱耐性等を向上することが求められる。
【0012】
従来、ヒット化合物からデザインした改変化合物の結合活性は、実験により求めていた。実験では、改変化合物の合成及び結合活性の測定等を行うため、時間的コスト及び経済的コストが大きい。計算機支援による新薬開発も進められているが、計算コストが非常に高いシミュレーションが必要となる。例えば、標的分子とヒット化合物とが結合した複合体構造の取得、相互作用を解析するシミュレーション、改変化合物に変化した場合のシミュレーション、結合活性を評価するための結合自由エネルギー計算等が必要とされる。
【0013】
複合体構造を計算機実験で決定することは非常に困難であり、X線実験等を併用する必要がある。また、薬剤の候補となる化合物は水中で電荷状態にあることが多いため、結合自由エネルギー計算も非常に困難である。
【0014】
従来の創薬では、計算コストを低減するために、簡易的なスコア関数で表現した結合活性のランキング計算が主流となっている。しかしながら、従来の簡易的なスコア関数は、精度が十分ではなく、実験値とほぼ相関しないことが多い。そのため、従来のスコア関数は、創薬効率化への寄与は限定的である。
【0015】
本実施形態では、化合物の立体構造的特徴を数値化するスコア関数を導入する。一つの側面では、本実施形態のスコア関数により計算されたスコアに基づいて、溶媒中の化合物の立体構造的特徴を評価することが可能となる。
【0016】
本実施形態のスコアを応用することで、ヒット化合物からデザインされた改変化合物の構造の類似性を評価する手法を実現することができる。また、本実施形態のスコアを用いれば、例えば膜透過性のように、化合物が特定の環境を通過するか否かを評価する方法を実現することができる。さらに、本実施形態のスコアを用いれば、改変化合物の結合活性の増減、膜透過可能性及び熱耐性等を予測することが可能となる。
【0017】
<分子構造評価システムの全体構成>
本発明の一実施形態は、化合物の立体構造を評価する分子構造評価システムである。分子構造評価システムは、分子動力学法等の分子シミュレーションを用いて化合物の立体構造を計算し、化合物の立体構造の安定性を示すスコア(以下、「安定性スコア」とも呼ぶ)を計算する。
【0018】
本実施形態における分子構造評価システムの全体構成を、図1を参照しながら説明する。図1は、本実施形態における分子構造評価システムの全体構成の一例を示すブロック図である。
【0019】
図1に示されているように、本実施形態における分子構造評価システム1は、評価装置10及び利用者端末20を含む。評価装置10及び利用者端末20は、LAN(Local Area Network)又はインターネット等の通信ネットワークN1を介してデータ通信可能に接続されている。
【0020】
評価装置10は、化合物の安定性スコアを計算するパーソナルコンピュータ、ワークステーション、サーバ等の情報処理装置である。評価装置10は、利用者端末20から改変化合物に関する構造情報を受信し、改変化合物の安定性スコアを計算する。評価装置10は、改変化合物の安定性スコアを含む評価結果を、利用者端末20に送信する。
【0021】
構造情報は、評価対象とする改変化合物の立体構造を示す情報、及び改変化合物の物性を評価する環境を示す情報を含む。環境を示す情報は、例えば、溶媒分子の立体構造を示す情報である。溶媒は、評価する物性により異なる。例えば、改変化合物の結合活性又は熱耐性を評価するときには、溶媒は水である。また、例えば、改変化合物の膜透過性を評価するときには、溶媒はクロロホルムはるながたを用いることができる。
【0022】
利用者端末20は、分子構造評価システム1の利用者が操作するパーソナルコンピュータ、スマートフォン、タブレット端末等の情報処理端末である。利用者端末20は、利用者の操作に応じて、改変化合物に関する構造情報を生成し、評価装置10に送信する。利用者端末20は、評価装置10から改変化合物の評価結果を受信し、利用者に対して出力する。
【0023】
なお、図1に示した分子構造評価システム1の全体構成は一例であって、用途や目的に応じて様々なシステム構成例があり得る。例えば、評価装置10及び利用者端末20の1つ以上が、分子構造評価システム1に複数台含まれていてもよい。例えば、評価装置10は、複数台のコンピュータにより実現してもよいし、クラウドコンピューティングのサービスとして実現してもよい。図1に示す評価装置10、利用者端末20のような装置の区分は一例である。
【0024】
<分子構造評価システムのハードウェア構成>
本実施形態における分子構造評価システム1に含まれる各装置のハードウェア構成を、図2を参照しながら説明する。
【0025】
≪コンピュータのハードウェア構成≫
本実施形態における評価装置10及び利用者端末20は、例えばコンピュータにより実現される。図2は、本実施形態におけるコンピュータのハードウェア構成の一例を示すブロック図である。
【0026】
図2に示されているように、本実施形態におけるコンピュータ500は、CPU(Central Processing Unit)501、ROM(Read Only Memory)502、RAM(Random Access Memory)503、HDD(Hard Disk Drive)504、入力装置505、表示装置506、通信I/F(Interface)507及び外部I/F508を有する。CPU501、ROM502及びRAM503は、いわゆるコンピュータを形成する。コンピュータ500の各ハードウェアは、バスライン509を介して相互に接続されている。なお、入力装置505及び表示装置506は外部I/F508に接続して利用する形態であってもよい。
【0027】
CPU501は、ROM502又はHDD504等の記憶装置からプログラムやデータをRAM503上に読み出し、処理を実行することで、コンピュータ500全体の制御や機能を実現する演算装置である。コンピュータ500は、CPU501に加えて又はCPU501に代えて、GPU(Graphics Processing Unit)を有していてもよい。
【0028】
ROM502は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)の一例である。ROM502は、HDD504にインストールされている各種プログラムをCPU501が実行するために必要な各種プログラム、データ等を格納する主記憶装置として機能する。具体的には、ROM502には、コンピュータ500の起動時に実行されるBIOS(Basic Input/Output System)、EFI(Extensible Firmware Interface)等のブートプログラムや、OS(Operating System)設定、ネットワーク設定等のデータが格納されている。
【0029】
RAM503は、電源を切るとプログラムやデータが消去される揮発性の半導体メモリ(記憶装置)の一例である。RAM503は、例えば、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等である。RAM503は、HDD504にインストールされている各種プログラムがCPU501によって実行される際に展開される作業領域を提供する。
【0030】
HDD504は、プログラムやデータを格納している不揮発性の記憶装置の一例である。HDD504に格納されるプログラムやデータには、コンピュータ500全体を制御する基本ソフトウェアであるOS、及びOS上において各種機能を提供するアプリケーション等がある。なお、コンピュータ500はHDD504に替えて、記憶媒体としてフラッシュメモリを用いる記憶装置(例えばSSD:Solid State Drive等)を利用するものであってもよい。
【0031】
入力装置505は、ユーザが各種信号を入力するために用いるタッチパネル、操作キーやボタン、キーボードやマウス、音声等の音データを入力するマイクロホン等である。
【0032】
表示装置506は、画面を表示する液晶や有機EL(Electro-Luminescence)等のディスプレイ、音声等の音データを出力するスピーカ等で構成されている。
【0033】
通信I/F507は、通信ネットワークに接続し、コンピュータ500がデータ通信を行うためのインタフェースである。
【0034】
外部I/F508は、外部装置とのインタフェースである。外部装置には、ドライブ装置510等がある。
【0035】
ドライブ装置510は、記録媒体511をセットするためのデバイスである。ここでいう記録媒体511には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体511には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。これにより、コンピュータ500は外部I/F508を介して記録媒体511の読み取り及び/又は書き込みを行うことができる。
【0036】
なお、HDD504にインストールされる各種プログラムは、例えば、配布された記録媒体511が外部I/F508に接続されたドライブ装置510にセットされ、記録媒体511に記録された各種プログラムがドライブ装置510により読み出されることでインストールされる。あるいは、HDD504にインストールされる各種プログラムは、通信I/F507を介して、通信ネットワークとは異なる他のネットワークよりダウンロードされることでインストールされてもよい。
【0037】
<分子構造評価システムの機能構成>
本実施形態における分子構造評価システムの機能構成を、図3を参照しながら説明する。図3は、本実施形態における分子構造評価システム1の機能構成の一例を示すブロック図である。
【0038】
≪評価装置の機能構成≫
図3に示されているように、本実施形態における評価装置10は、入力部11、構造解析部12、集団変数計算部13、クラスタ分割部14(分割部の一例)、代表構造決定部15(決定部の一例)、スコア計算部16(計算部の一例)及び出力部17を備える。
【0039】
入力部11、構造解析部12、集団変数計算部13、クラスタ分割部14、代表構造決定部15、スコア計算部16及び出力部17は、例えば、図2に示されているHDD504からRAM503上に展開されたプログラムがCPU501に実行させる処理によって実現される。
【0040】
入力部11は、評価対象とする改変化合物に関する構造情報の入力を受け付ける。入力部11は、利用者端末20から構造情報を受信することで、構造情報を受け付ける。入力部11は、利用者により評価装置10の入力装置505に入力された構造情報を取得することで、構造情報を受け付けてもよい。
【0041】
構造解析部12は、入力部11に入力された構造情報に基づいて、改変化合物の立体構造を解析する。構造解析部12は、まず、分子動力学法に基づく分子シミュレーションを用いて、所定環境における改変化合物の立体構造を計算する。次に、構造解析部12は、分子シミュレーションにより生成される改変化合物の立体構造を、所定の時間範囲において所定の時間間隔でサンプリングする。
【0042】
立体構造をサンプリングする時間範囲は、評価するために十分なサンプルが得られる時間長であればよい。ただし、シミュレーションを開始した直後は、分子の立体構造が安定しないため、ある程度時間が経過してからサンプリングを開始するとよい。立体構造をサンプリングする時間間隔は、任意に定めればよい。
【0043】
本実施形態では、シミュレーション開始後200ナノ秒以上経過してからサンプリングを開始し、10ピコ秒ごとに、200ナノ秒間サンプリングを行うものとする。したがって、本実施形態では、20000サンプルの立体構造がサンプリングされる。
【0044】
集団変数計算部13は、構造解析部12によりサンプリングされた立体構造それぞれについて、所定の集団変数を計算する。集団変数計算部13は、計算した集団変数を構造空間に配置する。構造空間は、改変化合物のすべての構造を含む空間である。これにより、集団変数計算部13は、所定環境における改変化合物の集団変数の分布を取得する。
【0045】
本実施形態における集団変数は、構造空間上で各立体構造を分離することができる集団変数であるとよい。集団変数は、構造空間上で各立体構造を完全に分離できるものであることが好ましい。本実施形態では、集団変数の一例として、主鎖及びCβの原子位置の平均二乗偏差(RMSD; Root Mean Square Deviation)を用いる。
【0046】
クラスタ分割部14は、集団変数計算部13により取得された集団変数の分布を1以上のクラスタに分割する。本実施形態では、一例として、密度ピーククラスタリング法により集団変数の分布をクラスタリングする。クラスタの数は限定されないが、1以上10以下程度であるとよい。これにより、クラスタ分割部14は、構造空間に1以上のクラスタを形成する。
【0047】
代表構造決定部15は、クラスタ分割部14により形成された各クラスタについて、クラスタを代表するクラスタセンタ構造(代表構造の一例)を決定する。代表構造決定部15は、まず、構造空間のうち各クラスタに含まれる空間を部分空間に分割する。部分空間の大きさは、任意に設定すればよい。本実施形態における部分空間のサイズは、一例として、1オングストロームとする。
【0048】
また、代表構造決定部15は、各部分空間それぞれの密度を計算する。代表構造決定部15は、最も密度が高い部分空間において、中心に最も近い位置に配置された集団変数に対応する立体構造を特定し、クラスタセンタ構造として決定する。
【0049】
スコア計算部16は、代表構造決定部15により決定されたクラスタセンタ構造に基づいて、安定性スコアTccを計算する。安定性スコアTccの詳細は後述する。
【0050】
出力部17は、スコア計算部16により計算された安定性スコアTccを含む評価結果を出力する。出力部17は、構造情報を利用者端末20から受信した場合、評価結果を利用者端末20に送信する。出力部17は、入力装置505に入力された構造情報を受け付けた場合、評価結果を表示装置506に表示する。
【0051】
≪安定性スコアTccの詳細≫
創薬の分野では、実験等によりヒット化合物(薬候補化合物)を発見した後、薬候補化合物の一部を改変して、標的分子と相互作用する部位を調査する。標的分子(標的タンパク質)と相互作用する部位が判明すると、相互作用を保ったまま、他の部位を改変しながら、結合活性が向上する化合物を探索する。すなわち、化合物の探索では、薬候補化合物と標的分子の結合サイト及び結合ポーズを維持することを基本とする。
【0052】
ヒット化合物は標的分子に対して結合活性を持つ。ヒット化合物と標的分子とが結合する際には、溶媒中のヒット化合物が持っていたエントロピーが損失する。そのため、結合活性を向上させるためには、溶媒中でも可能な限りエントロピーを少なくしておくことが重要である。標的分子との相互作用によるゲインを見積もることは難しいため、相互作用する部位を維持したまま、ヒット化合物の構造をより安定化させることが重要となる。したがって、化合物の立体構造とヒット化合物の立体構造との類似性を評価可能なスコアが求められる。
【0053】
安定性スコアTccは、化合物の立体構造的特徴を数値化したスコアである。安定性スコアTccは、化合物の立体構造から計算される集団変数の分布をクラスタに分割し、各クラスタを代表するクラスタセンタ構造から所定距離の範囲に存在する構造の割合に基づいて計算される。
【0054】
具体的には、本実施形態における安定性スコアTccは、式(1)のスコア関数Tcc(r)により計算される。
【0055】
【数1】
【0056】
ただし、iはクラスタ番号である。rは集団変数である。rは所定のカットオフ半径である。cc refはクラスタiのクラスタセンタ構造である。ρ(r)はクラスタiの存在割合である。
【0057】
クラスタiの存在割合ρは、集団変数r全体のうち、クラスタセンタ構造cc refからカットオフ半径r以内の範囲に存在する集団変数rの割合である。カットオフ半径rは、任意に設定することができる。本実施形態におけるカットオフ半径rは、一例として、2オングストロームである。
【0058】
図4は、本実施形態におけるスコア関数の一例を示す図である。図4に示されているように、構造空間300の中には、複数のクラスタ310-1~310-3が形成されている。各クラスタ310-1~310-3には、クラスタセンタ構造cc ref~cc refが決定されている。なお、図4では、説明のために2次元の構造空間300を例示したが、構造空間の次元数は集団変数の次元数と一致する。例えば、集団変数を平均二乗偏差とした場合、構造空間は1次元となる。
【0059】
クラスタ310-1では、クラスタセンタ構造cc refを中心としてカットオフ半径r以内の領域320-1が定義される。構造空間300に配置された集団変数r全体のうち領域320-1に含まれる集団変数rの割合がクラスタ310-1の存在割合ρとなる。クラスタ320-2,320-3についても同様にして存在割合ρ,ρを計算することができる。安定性スコアTccは、存在割合ρ~ρの総和である。
【0060】
安定性スコアTccは、0以上1以下の値を取る。安定性スコアTccは、値が大きいほど、構造の揺らぎ幅が大きいことを表す。一方、安定性スコアTccは、値が小さいほど、構造の揺らぎ幅が小さいことを表す。したがって、安定性スコアTccが1に近いほど化合物の立体構造が安定していることを表す。
【0061】
≪安定性スコアTccの妥当性≫
安定性スコアTccの妥当性を検証した結果について、図5乃至図8を参照しながら説明する。検証では、2つの異なる化合物について分子シミュレーションを実施し、構造の揺らぎ幅と安定性スコアTccとの関係を解析した。
【0062】
図5は、平均二乗偏差の第1の例を示す図である。図6は、平均二乗偏差の第2の例を示す図である。図5及び図6は、それぞれ異なる化合物の1分子の立体構造を所定の時間間隔でサンプリングし、各サンプルについて計算した平均二乗偏差(RMSD)の時間変化を示したグラフである。グラフの横軸は時間(ナノ秒単位)であり、縦軸はRMSD(オングストローム単位)である。
【0063】
図5に示した平均二乗偏差は、ほぼ一定の値を取っている。これは、溶媒中で安定な構造の周りに非常に小さな構造揺らぎが発生していることを示している。一方、図6に示した平均二乗偏差は、値の範囲が大きく変動している。これは、大きな構造揺らぎが生じていることを示している。また、図6に示した平均二乗偏差は、複数の構造の間を遷移しながら揺らいでいることも示している。
【0064】
図7は、安定性スコアの第1の例を示す図である。図7に示す安定性スコアは、図5に示した平均二乗偏差から計算した安定性スコアの一例である。図8は、安定性スコアの第2の例を示す図である。図8に示す安定性スコアは、図6に示した平均二乗偏差から計算した安定性スコアの一例である。
【0065】
図7に示した例では、クラスタリングにより1つのクラスタ(#1)が形成され、クラスタ#1の安定性スコアTccが1.00であった。したがって、図5に示したような平均二乗偏差をもつ化合物は、溶媒中で非常に安定した構造を取ることがわかる。
【0066】
図8に示した例では、クラスタリングにより4つのクラスタ(#1~#4)が形成され、クラスタ#1~#4の安定性スコアTccの総和が0.40であった。したがって、図6に示したような平均二乗偏差をもつ化合物は、溶媒中で構造が安定しないことがわかる。
【0067】
図5乃至図8に示した検証結果により、安定性スコアTccは、溶媒中の化合物の立体構造的特徴(安定性)を表す指標であることが示された。
【0068】
<評価方法の処理手順>
本実施形態における分子構造評価システム1が実行する評価方法について、図9を参照しながら説明する。図9は、本実施形態における評価方法の一例を示すフローチャートである。
【0069】
ステップS1において、利用者端末20は、利用者の操作に応じて、ヒット化合物の構造の一部を改変した改変化合物の構造を生成する。改変化合物の構造は、例えば、公知の分子モデリングソフトウェア等を利用して生成することができる。また、利用者端末20は、利用者の操作に応じて、改変化合物の物性を評価する環境(例えば、溶媒分子)を決定する。
【0070】
利用者端末20は、改変化合物の構造を示す情報及び改変化合物の物性を評価する環境に関する情報に基づいて、構造情報を生成する。そして、利用者端末20は、構造情報を評価装置10に送信する。
【0071】
評価装置10では、入力部11が、利用者端末20から構造情報を受信する。入力部11は、受信した構造情報を受け付ける。そして、入力部11は、構造情報を構造解析部12に送る。
【0072】
ステップS2において、評価装置10の構造解析部12は、入力部11から構造情報を受け取る。次に、構造解析部12は、分子動力学法に基づく分子シミュレーションを用いて、所定環境における改変化合物の立体構造を計算する。続いて、構造解析部12は、分子シミュレーションにより生成される改変化合物の立体構造を、所定の時間範囲において所定の時間間隔でサンプリングする。そして、構造解析部12は、サンプリングにより取得した立体構造群を集団変数計算部13に送る。
【0073】
ステップS3において、評価装置10の集団変数計算部13は、構造解析部12から立体構造群を受け取る。次に、集団変数計算部13は、立体構造それぞれについて、所定の集団変数を計算する。続いて、集団変数計算部13は、計算した集団変数を構造空間に配置する。これにより、改変化合物の集団変数の分布が生成される。そして、集団変数計算部13は、集団変数の分布をクラスタ分割部14に送る。
【0074】
ステップS4において、評価装置10のクラスタ分割部14は、集団変数計算部13から集団変数の分布を受け取る。次に、クラスタ分割部14は、集団変数の分布を1以上のクラスタに分割する。これにより、構造空間に1以上のクラスタが形成される。そして、クラスタ分割部14は、クラスタが形成された構造空間を代表構造決定部15に送る。
【0075】
ステップS5において、評価装置10の代表構造決定部15は、クラスタ分割部14から構造空間を受け取る。次に、代表構造決定部15は、構造空間のうち各クラスタに含まれる空間を部分空間に分割する。続いて、代表構造決定部15は、各部分空間それぞれの密度を計算する。
【0076】
さらに、代表構造決定部15は、最も密度が高い部分空間において、中心に最も近い位置に配置された集団変数に対応する立体構造を特定する。次に、代表構造決定部15は、特定した立体構造をクラスタセンタ構造として決定する。そして、代表構造決定部15は、各クラスタにクラスタセンタ構造が設定された構造空間をスコア計算部16に送る。
【0077】
ステップS6において、評価装置10のスコア計算部16は、代表構造決定部15から構造空間を受け取る。次に、スコア計算部16は、クラスタセンタ構造が設定された構造空間に基づいて、安定性スコアTccを計算する。そして、スコア計算部16は、安定性スコアTccを出力部17に送る。
【0078】
ステップS7において、評価装置10の出力部17は、スコア計算部16から安定性スコアTccを受け取る。次に、出力部17は、少なくとも安定性スコアTccを含む評価結果を生成する。そして、出力部17は、評価結果を利用者端末20に送信する。
【0079】
利用者端末20は、評価装置10から評価結果を受信する。そして、利用者端末20は、受信した評価結果を表示装置506に表示する。
【0080】
利用者は、利用者端末20の表示装置506に表示された評価結果を参照することで、改変化合物の安定性を評価することができる。また、利用者は、評価結果に基づいて改変化合物の物性を予測し、リード化合物の探索に利用することができる。
【0081】
<応用例>
安定性スコアTccは、改変化合物の物性予測に応用することができる。例えば、標的分子に対するヒット化合物の安定性スコアTccに基づいて、ヒット化合物を改変することによる結合活性の増減、膜透過可能性、熱耐性等を予測することが可能となる。本応用例では、結合活性の増減予測について説明する。その他の物性の予測も同様に行うことができる。
【0082】
結合活性の増減予測について、図10を参照しながら説明する。図10は、結合活性の増減予測の一例を示す図である。
【0083】
図10は、改変化合物に対して分子シミュレーションを実施し、得られた立体構造群に対して、ヒット化合物のクラスタセンタ構造との安定性スコアTccを計算した結果である。安定性スコアTccは、ヒット化合物の立体構造との類似性を示す指標になっている。安定性スコアTccが1に近づけばヒット化合物との類似性が高く、0に近ければヒット化合物との類似性が低いことを示している。ヒット化合物は標的分子との結合活性が大きいため、安定性スコアTccと標的分子に対する結合活性の増減との間には相関があることが期待される。
【0084】
標的タンパク質に対する環状ペプチドのヒット化合物に対して、3つの改変化合物A,B,Cを作成し、安定性スコアTccを計算した。その後、改変化合物A,B,Cを実際に合成し、実験によって結合活性値Kdを測定した。図10は、横軸を結合活性値Kd(nM)とし、縦軸を安定性スコアTcc(×10)として、ヒット化合物(Hit compound)及び改変化合物(A,B,C)のデータをプロットしたグラフである。図10に示されているように、安定性スコアTccと結合活性値Kdとの間には、高い相関が認められる結果となった。
【0085】
図10に示した結果により、ヒット化合物の安定性スコアTccに基づいて、改変化合物の結合活性の増減傾向を予測することが可能であることが示された。
【0086】
なお、改変化合物の膜透過可能性は、以下のように予測することができる。まず、細胞膜に相当する溶媒(例えばクロロホルム)中で改変化合物の安定性スコアTccを計算する。次に、細胞膜相当の溶媒中の立体構造群から決定したクラスタセンタ構造を参照し、水中における改変化合物の安定性スコアTccを計算する。水中における安定性スコアTccが0であれば、膜透過しないと予測することができる。一方、水中における安定性スコアTccが有限であれば膜透過すると予測することができる。
【0087】
また、改変化合物の熱耐性は、以下のように予測することができる。まず、レプリカ交換法による分子シミュレーションで改変化合物の立体構造をサンプリングする。次に、サンプリングされた立体構造群に基づいて、安定性スコアTccを計算する。安定性スコアTccが大きく変化する温度を見積もることで、改変化合物の熱耐性を予測することができる。
【0088】
<実施形態の効果>
本実施形態における評価装置10は、所定環境における化合物の構造から計算される集団変数の分布を1以上のクラスタに分割し、クラスタそれぞれに含まれる構造からクラスタを代表するクラスタセンタ構造を決定し、分布に含まれる構造のうちクラスタセンタ構造から所定距離の範囲に存在する構造の割合に基づくスコアを計算する。したがって、本実施形態における評価装置10によれば、化合物の構造を効率よく評価することができる。
【0089】
本実施形態における評価装置10は、物性が既知の化合物を改変した化合物に関するスコアを計算する。当該スコアは化合物の構造の安定性を示すため、化合物の物性は、既知の物性と類似することが期待される。したがって、本実施形態における評価装置10によれば、化合物の物性を効率よく評価することができる。
【0090】
本実施形態における評価装置10は、標的物質への結合活性、膜透過性及び熱耐性のいずれかが既知の化合物を改変した化合物に関するスコアを計算する。結合活性、膜透過性及び熱耐性は薬候補化合物にとって重要な物性である。したがって、本実施形態における評価装置10によれば、薬候補化合物を効率よく探索するためのスコアを計算することができる。
【0091】
本実施形態における安定性スコアTccは、分子の特徴を表す指標となる。値が大きければ溶媒中での安定で系の構造の揺らぎ幅が小さく、小さければ複数の安定構造群で特徴づけられ、系の構造の揺らぎ幅が大きいことを表す。
【0092】
本実施形態における安定性スコアTccが、ヒット化合物の構造的特徴を表すことを用いれば、ヒット化合物からデザインした改変化合物のヒット化合物に対する構造類似性を数値化できる。安定性スコアTccが大きくなれば、標的分子に対する結合活性は増加する。一方、安定性スコアTccが小さくなれば、標的分子に対する結合活性は減少する。
【0093】
<ビジネスシーンにおける効能>
本実施形態における分子構造評価システム1は、例えば創薬分野で利用することができる。創薬分野では、新規薬剤の開発コストが膨大となることが課題となっている。その一因として、ヒット化合物からリード化合物を探索するために、実験又は計算コストが高いシミュレーションが必要であり、時間的コスト及び経済的コストが大きいことが挙げられる。
【0094】
本実施形態における分子構造評価システム1は、化合物の物性を効率よく評価することができる。したがって、本実施形態における分子構造評価システム1によれば、リード化合物を探索するための時間的コスト及び経済的コストを低減することができる。その結果、新規で有用な薬剤を低コストかつ短いリードタイムで開発することが可能となる。
【0095】
[付記]
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
所定環境における化合物の構造から計算される集団変数の分布を1以上のクラスタに分割し、
前記クラスタそれぞれに含まれる前記構造から、前記クラスタを代表する代表構造を決定し、
前記分布に含まれる前記構造のうち前記代表構造から所定距離の範囲に存在する前記構造の割合に基づくスコアを計算する、
処理をコンピュータに実行させるための評価プログラム。
(付記2)
前記スコアは、前記クラスタごとの前記割合の総和である、
付記1に記載の評価プログラム。
(付記3)
前記代表構造は、前記クラスタ内の前記構造の密度に基づいて決定する、
付記1又は付記2に記載の評価プログラム。
(付記4)
rを前記集団変数とし、iを前記クラスタの番号とし、rを前記距離とし、ρを前記割合とし、cc refを前記代表構造とし、次式により前記スコアを計算する、
【数2】
付記1から付記3のいずれかに記載の評価プログラム。
(付記5)
前記化合物は、物性が既知の化合物を改変した化合物である、
付記1から付記4のいずれかに記載の評価プログラム。
(付記6)
前記物性は、標的物質への結合活性、膜透過性及び熱耐性のいずれかを含む、
付記5に記載の評価プログラム。
(付記7)
前記集団変数は、前記構造を示す指標である、
付記1から付記6のいずれかに記載の評価プログラム。
(付記8)
前記集団変数は、前記化合物中の原子位置の平均二乗偏差である、
付記7に記載の評価プログラム。
(付記9)
所定環境における化合物の構造から計算される集団変数の分布を1以上のクラスタに分割する分割部と、
前記クラスタそれぞれに含まれる前記構造から、前記クラスタを代表する代表構造を決定する決定部と、
前記分布に含まれる前記構造のうち前記代表構造から所定距離の範囲に存在する前記構造の割合に基づくスコアを計算する計算部と、
を備える評価装置。
(付記10)
所定環境における化合物の構造から計算される集団変数の分布を1以上のクラスタに分割し、
前記クラスタそれぞれに含まれる前記構造から、前記クラスタを代表する代表構造を決定し、
前記分布に含まれる前記構造のうち前記代表構造から所定距離の範囲に存在する前記構造の割合に基づくスコアを計算する、
処理をコンピュータが実行する評価方法。
【0096】
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0097】
1 分子構造評価システム
10 評価装置
11 入力部
12 構造解析部
13 集団変数計算部
14 クラスタ分割部
15 代表構造決定部
16 スコア計算部
17 出力部
20 利用者端末
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10