特許第6934662号(P6934662)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 独立行政法人産業技術総合研究所の特許一覧

特許6934662化合物設計装置と化合物設計方法及び化合物設計プログラム
<>
  • 特許6934662-化合物設計装置と化合物設計方法及び化合物設計プログラム 図000004
  • 特許6934662-化合物設計装置と化合物設計方法及び化合物設計プログラム 図000005
  • 特許6934662-化合物設計装置と化合物設計方法及び化合物設計プログラム 図000006
  • 特許6934662-化合物設計装置と化合物設計方法及び化合物設計プログラム 図000007
  • 特許6934662-化合物設計装置と化合物設計方法及び化合物設計プログラム 図000008
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6934662
(24)【登録日】2021年8月26日
(45)【発行日】2021年9月15日
(54)【発明の名称】化合物設計装置と化合物設計方法及び化合物設計プログラム
(51)【国際特許分類】
   G16C 20/40 20190101AFI20210906BHJP
【FI】
   G16C20/40
【請求項の数】9
【全頁数】11
(21)【出願番号】特願2017-162303(P2017-162303)
(22)【出願日】2017年8月25日
(65)【公開番号】特開2019-40422(P2019-40422A)
(43)【公開日】2019年3月14日
【審査請求日】2020年6月4日
(73)【特許権者】
【識別番号】301021533
【氏名又は名称】国立研究開発法人産業技術総合研究所
(72)【発明者】
【氏名】石原 司
【審査官】 岡北 有平
(56)【参考文献】
【文献】 特開2007−277188(JP,A)
【文献】 MOEsaicによるMMP解析とR-group解析,インターネット,2017年07月,https://www.molsis.co.jp/wp-content/uploads/moe_201707.pdf,[検索日:2021年4月15日]
【文献】 Jonh G. Cumming, et al.,Chemical predictive modelling to improve compound quality,インターネット,2013年12月,p.949-962,https://www.nature.com/articles/nrd4128.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00 − 99/00
G16B 5/00 − 99/00
DB名
PubMed
(57)【特許請求の範囲】
【請求項1】
化合物データを用いて化合物を設計する装置であって、
化合物の任意の部分構造を選定する部分構造選定手段と、
前記化合物データにおいて、前記部分構造選定手段により選定された前記部分構造に対 して共起する部分構造を検出する部分構造検出手段と、
前記部分構造検出手段により検出された複数の前記部分構造を対象として、連関規則解析により得られる支持度若しくは確信度を算出することにより、前記共起の度合いを定量化する共起性定量化手段とを備えた化合物設計装置。
【請求項2】
前記部分構造検出手段は、
共通の基本構造を有する化合物の組を抽出するマッチド・モレキュラー・ペア解析手段と、
前記マッチド・モレキュラー・ペア解析手段により抽出された前記共起する部分構造の一覧を生成するマッチド・モレキュラー・シリーズ解析手段を含む、請求項1に記載の化合物設計装置。
【請求項3】
前記部分構造は、原子記号の文字列として表記されたものである、請求項1に記載の化合物設計装置。
【請求項4】
化合物設計装置が、化合物データを用いて化合物を設計する方法であって、
前記化合物設計装置に含まれた部分構造選定手段が、前記化合物の任意の部分構造を選定する第一のステップと、
前記化合物設計装置に含まれた部分構造検出手段が、前記化合物データにおいて、前記第一のステップで選定された前記部分構造に対して共起する部分構造を検出する第二のステップと、
前記化合物設計装置に含まれた共起性定量化手段が、前記第二のステップで検出された複数の前記部分構造を対象として、連関規則解析により得られる支持度若しくは確信度を算出することにより、前記共起の度合いを定量化する第三のステップとを有する化合物設計方法。
【請求項5】
前記第二のステップは、共通の基本構造を有する化合物の組を抽出するマッチド・モレキュラー・ペア解析ステップと、
前記マッチド・モレキュラー・ペア解析ステップで抽出された前記共起する部分構造の一覧を生成するマッチド・モレキュラー・シリーズ解析ステップを含む、請求項に記載の化合物設計方法。
【請求項6】
前記部分構造は、原子記号の文字列として表記されたものである、請求項に記載の化合物設計方法。
【請求項7】
コンピュータに化合物データを用いて化合物を設計させるためのプログラムであって、前記プログラムは、前記コンピュータに対して、
化合物の任意の部分構造を選定させる第一の手順と、
前記化合物データにおいて、前記第一の手順で選定された前記部分構造に対して共起する部分構造を検出させる第二の手順と、
前記第二の手順で検出された複数の前記部分構造を対象として、連関規則解析により得られる支持度若しくは確信度を算出することにより、前記共起の度合いを定量化させる第三の手順とを有する化合物設計プログラム。
【請求項8】
前記第二の手順は、
共通の基本構造を有する化合物の組を抽出するマッチド・モレキュラー・ペア解析手順と、
前記マッチド・モレキュラー・ペア解析手順で抽出された前記共起する部分構造の一覧を生成するマッチド・モレキュラー・シリーズ解析手順を含む、請求項に記載の化合物設計プログラム。
【請求項9】
前記部分構造は、原子記号の文字列として表記されたものである、請求項に記載の化合物設計プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、化合物を設計するための装置と方法及びプログラムに関するものである。
【背景技術】
【0002】
従来から医薬品を製造するための化合物を探索する医薬品探索においては、創薬化学者の属人的経験に多くを依存しているが、近年においては特許文献1に見られるように、化合物のデータから頻出パターンを抽出する技術も考案されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−63277号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1に開示された発明は、同文献の段落[0001]に記されているように、「所定の特性を有する複数のオブジェクトの多くに含まれる多頻度部分グラフを抽出する」ものに過ぎないため、上記所定の特性を有する複数のオブジェクトに適用範囲が限られているという問題がある。
【0005】
本発明は、このような問題を解決するためになされたもので、より広い範囲で効率的な医薬品探索が可能な化合物設計装置と化合物設計方法及び化合物設計プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するため、本発明は、化合物データを用いて化合物を設計する装置であって、化合物の任意の部分構造を選定する部分構造選定手段と、化合物データにおいて、部分構造選定手段により選定された部分構造に対して共起する部分構造を検出する部分構造検出手段と、部分構造検出手段により検出された複数の部分構造を対象として、上記共起の度合いを定量化する共起性定量化手段とを備えた化合物設計装置を提供する。
【0007】
また、上記課題を解決するため、本発明は、化合物データを用いて化合物を設計する方法であって、化合物の任意の部分構造を選定する第一のステップと、化合物データにおいて、第一のステップで選定された部分構造に対して共起する部分構造を検出する第二のステップと、第二のステップで検出された複数の部分構造を対象として、上記共起の度合いを定量化する第三のステップとを有する化合物設計方法を提供する。
【0008】
また、上記課題を解決するため、本発明は、コンピュータに化合物データを用いて化合物を設計させるためのプログラムであって、上記プログラムは、上記コンピュータに対して、化合物の任意の部分構造を選定させる第一の手順と、化合物データにおいて、第一の手順で選定された部分構造に対して共起する部分構造を検出させる第二の手順と、第二の手順で検出された複数の部分構造を対象として、上記共起の度合いを定量化させる第三の手順とを有する化合物設計プログラムを提供する。
【発明の効果】
【0009】
本発明によれば、より広い範囲で効率的な医薬品探索が可能な化合物設計装置と化合物設計方法及び化合物設計プログラムを提供することができる。
【図面の簡単な説明】
【0010】
図1】本発明の実施の形態に係る化合物設計装置1の構成を示すブロック図である。
図2】本発明の実施の形態に係る化合物設計方法を示すフローチャートである。
図3図2に示されたステップS2における部分構造の検出方法を説明するための第一の図である。
図4図2に示されたステップS2における部分構造の検出方法を説明するための第二の図である。
図5】本発明の他の実施の形態に係る化合物設計装置30の構成を示すブロック図である。
【発明を実施するための形態】
【0011】
以下において、本発明の実施の形態を図面を参照しつつ詳しく説明する。なお、図中同一符号は同一又は相当部分を示す。
【0012】
図1は、本発明の実施の形態に係る化合物設計装置1の構成を示すブロック図である。図1に示されるように、本発明の実施の形態に係る化合物設計装置1は、入出力端子2と、入出力端子2に接続されたバス3と、それぞれバス3に接続された部分構造選定部4、部分構造検出部5、共起性定量化部6、記憶部7、表示部8、及び操作部9を備える。ここで、部分構造検出部5は、それぞれバス3に接続されたマッチド・モレキュラー・ペア解析部51とマッチド・モレキュラー・シリーズ解析部52を含む。
【0013】
図2は、本発明の実施の形態に係る化合物設計方法を示すフローチャートである。以下においては、図2を参照しつつ、本化合物設計方法を、図1に示された化合物設計装置1の動作により実現する場合につき説明するが、本化合物設計方法は化合物設計装置1を用いた場合に限られず広く適用できることは言うまでもない。
【0014】
ステップS1では、部分構造選定部4は、ユーザによる操作部9の操作に応じて、化合物の任意の部分構造を選定する。なお、上記部分構造は具体的には、当該化合物を構成する原子を表す原子記号の文字列により表記されたものであり、以下においても同様である。
【0015】
次に、ステップS2では、部分構造検出部5は、ユーザによる操作部9の操作に応じて、化合物データにおいて、ステップS1で選定された部分構造に対して共起する部分構造を検出する。なお、共起とは、ある部分構造が化合物中に見出されたとき、当該化合物と基本構造を共通とする他の化合物に別の限られた部分構造が出現する状態を意味する。
【0016】
ここで、上記化合物データは、入出力端子2に外部接続された化合物データベース、又は記憶部7に格納された化合物データのいずれであっても良い。
【0017】
なお、本部分構造の検出は、化合物の集合データを対象として、同一基本構造に対して一部の部分構造のみが異なる化合物対を検索する技術であるマッチド・モレキュラー・ペア(Matched Molecular Pair)解析と、それに続くマッチド・モレキュラー・シリーズへの変換によって検出するが、本検出方法については後に詳しく説明する。
【0018】
次に、ステップS3では、共起性定量化部6は、ユーザによる操作部9の操作に応じて、ステップS2で検出された複数の部分構造を対象として、共起の度合いを定量化する。
【0019】
上記定量化においては、例えば、頻出する要素間の組み合わせに関する規則を検索する技術である連関規則解析が用いられる。
【0020】
このとき、大規模データベースに対する連関規則解析では、一般に、膨大な規則が抽出されるため、本実施の形態では例えば、上記連関規則解析により標準的に導出される支持度若しくは確信度を評価指標とし、入力した部分構造と関連性があるとして検出された部分構造が関連性の強い順に順位付けされる。
【0021】
ここで、検索対象の化合物及び検索対象の部分構造が以下の表1のように選定されたとき、検索対象の部分構造と関連性の強い上位5位までについて、確信度、共起する部分構造、及び設計された化合物をランキングした例が、以下の表2に示される。なお、上記関連性が強いほど、表2における確信度の値が高くなるという関係がある。
【0022】
【表1】
【0023】
【表2】
【0024】
このようにして、検索対象の部分構造と強い関連性があるものとして抽出された部分構造を用いて、検索対象の化合物における当該部分構造を代替させることにより、医薬品製造のための新たな化合物を設計することができる。
【0025】
なお、上記連関規則解析では、例えばアプリオリ(Apriori)アルゴリズムやエクラット(Eclat)アルゴリズムを用いることができるが、これらに限定されるものではない。
【0026】
また、ステップS3における定量化により得られたデータは記憶部7に保存されるが、ユーザによる操作部9の操作に応じて、表示部8に表示され、又はバス3及び入出力端子2を介して外部へ出力される。
【0027】
以下において、図3及び図4を参照しつつ、上記ステップS2における部分構造の検出方法を詳しく説明する。
【0028】
まず、マッチド・モレキュラー・ペア解析部51は、共通の基本構造を有する化合物の組を抽出する機能を有する。なお、抽出された化合物の組は記憶部7、又は、入出力端子2に外部接続されたデータベース等に保存される。以下、具体例を挙げて本機能について説明する。
【0029】
図3に示された3つの化合物11〜13が化合物データの構成要素であるとき、これらの化合物11〜13は、最左端の置換された環構造が相互に異なる化合物群をなす。従って、これら3つの化合物11〜13においては、共通する基本構造10を有する3組の部分構造対14が挙げられる。
【0030】
このことから、3つの化合物11〜13からは、基本構造を共通とした化合物の組、すなわちマッチド・モレキュラー・ペアが3組抽出される。
【0031】
次に、マッチド・モレキュラー・シリーズ解析部52は、上記のようにマッチド・モレキュラー・ペア解析部51により抽出された化合物の組を基に、共起する部分構造の一覧を生成する。すなわち、マッチド・モレキュラー・シリーズ解析部52は、対になる二つの部分構造の要素から構成されるマッチド・モレキュラー・ペアの概念を、二つ以上の部分構造の要素から構成されるマッチド・モレキュラー・シリーズへと拡張する機能を有するが、以下、具体例を挙げて本機能について説明する。
【0032】
なお、生成された部分構造の一覧は記憶部7、又は、入出力端子2に外部接続されたデータベース等に保存される。
【0033】
ここで、上記マッチド・モレキュラー・シリーズとは、基本構造が共通な化合物の群と定義され、上記3つの化合物11〜13においては、共起する部分構造の一覧として一つの部分構造シリーズ15が生成されるため、化合物11〜13は一つのマッチド・モレキュラー・シリーズをなすことになる。
【0034】
従って、マッチド・モレキュラー・シリーズ解析部52による上記拡張機能は、図3に示された3組の部分構造対14(マッチド・モレキュラー・ペア)から一つの部分構造シリーズ15(マッチド・モレキュラー・シリーズ)への変換を意味する。以下において、化合物データの構成要素として、図4に示されるように、化合物11〜13だけでなく化合物21〜23も含まれる場合を例に挙げて、上記変換を具体的に説明する。
【0035】
図4に示されるように、化合物11〜13から上記のように3組の部分構造対14(若しくはマッチド・モレキュラー・ペア)が得られるが、同様に化合物21〜23から3組の部分構造対24(若しくはマッチド・モレキュラー・ペア)が得られる。ここで、化合物11〜13は同一の基本構造10を有し、化合物21〜23は同一の基本構造20を有する。
【0036】
そこで、得られたマッチド・モレキュラー・ペアをそれらの基本構造で集約、すなわち同一基本構造をキーとして各マッチド・モレキュラー・ペアをグルーピングすることにより、それぞれ基本構造10に対しては部分構造シリーズ15、基本構造20に対しては部分構造シリーズ25に対応したマッチド・モレキュラー・シリーズを得ることができる。
【0037】
そして、図2に示されたステップS3において、共起性定量化部6は上記のようにして得られたマッチド・モレキュラー・シリーズを対象として、以下のように、高い頻度で共に出現する部分構造を検出する。
【0038】
図4に示された部分構造11pは、同一の基本構造10を介して部分構造12pと共起しており、同様に、部分構造13pと共起していることが分かる。一方で、図4に示された部分構造21pは、同一の基本構造20を介して部分構造22pと共起しており、同様に、部分構造23pと共起している。
【0039】
従って、同一の部分構造11p,21pは、同一の部分構造12p,22pと二度、部分構造13p及び部分構造23pとそれぞれ一度共起していることが分かる。
【0040】
結果として、部分構造11pに対して相対的に高い頻度で共に出現する部分構造として、部分構造12p,22pを検出することになる。
【0041】
なお、本発明の実施の形態に係る上記の化合物設計方法は、本方法を実現するアルゴリズムをコンピュータプログラムにより記述した化合物設計プログラムを、例えば、図5に示された入出力端子31及びバス32を介して化合物設計装置30のメモリ34へ格納し、バス32に接続された中央演算処理装置(Central Processing Unit: CPU)33に上記化合物設計プログラムをメモリ34から読み出して実行させることによっても実現することができる。
【0042】
以上より、本発明の実施の形態に係る化合物設計装置1,30と化合物設計方法及び化合物設計プログラムによれば、マッチド・モレキュラー・ペア解析と連関規則解析を融合することにより、化合物データを対象として検出された共起対の頻度分布を基に一般的構造変換の指針を獲得することができる。
【0043】
また、上記化合物設計装置1,30と化合物設計方法及び化合物設計プログラムによれば、ユーザが指定する部分構造に対して、探索の過程で高頻度に共起した部分構造を抽出することができるため、広範囲における効率的な医薬品探索を実現することができる。
【0044】
そして、抽出された上記高頻度に共起した部分構造で、最初に選定された化合物の対応する部分構造を代替させることにより、医薬品製造のための新たな化合物を設計することができる。
【0045】
また、上記化合物設計装置1,30と化合物設計方法及び化合物設計プログラムによれば、これまで創薬化学者の力量に依存してきた化合物設計の自動化を実現することができることになる。
【符号の説明】
【0046】
1,30 化合物設計装置、4 部分構造選定部、5 部分構造検出部、6 共起性定量化部、33 中央演算処理装置(CPU)。
図1
図2
図3
図4
図5