IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人高知大学の特許一覧

特許7583450核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム
<>
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図1
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図2
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図3
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図4
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図5
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図6
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図7
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図8
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図9
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図10
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図11
  • 特許-核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-06
(45)【発行日】2024-11-14
(54)【発明の名称】核磁気共鳴の化学シフト値の予測方法、予測装置及び予測プログラム
(51)【国際特許分類】
   G01N 24/00 20060101AFI20241107BHJP
   G01N 23/20 20180101ALI20241107BHJP
【FI】
G01N24/00 530K
G01N23/20
【請求項の数】 8
(21)【出願番号】P 2021552484
(86)(22)【出願日】2020-10-16
(86)【国際出願番号】 JP2020039187
(87)【国際公開番号】W WO2021075575
(87)【国際公開日】2021-04-22
【審査請求日】2023-10-16
(31)【優先権主張番号】P 2019189855
(32)【優先日】2019-10-17
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】504174180
【氏名又は名称】国立大学法人高知大学
(74)【代理人】
【識別番号】110000796
【氏名又は名称】弁理士法人三枝国際特許事務所
(72)【発明者】
【氏名】関 安孝
【審査官】嶋田 行志
(56)【参考文献】
【文献】米国特許出願公開第2010/0143580(US,A1)
【文献】米国特許出願公開第2015/0300968(US,A1)
【文献】特開2005-181104(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 24/00-G01N 24/14
G01N 23/00-G01N 23/2276
G01N 33/48-G01N 33/98
G01N 27/60-G01N 27/70
G01N 27/92
JSTPlus/JMEDPlus/JST7580(JDreamIII)
ACS PUBLICATIONS
Science Direct
KAKEN
(57)【特許請求の範囲】
【請求項1】
ペプチドの核磁気共鳴化学シフト値の予測方法であって、
目的とするペプチドを構成する各アミノ酸残基の主鎖の2面角値(Φ及びΨの値で表される)の出現頻度分布をクラスタリングし、複数のクラスターの分布を取得する工程と、
スコア関数を用いて、取得された各クラスターの分布と、アミノ酸3残基データベースに登録された基準となる主鎖2面角値との類似度を算出する工程と、
算出された類似度から、前記目的とするペプチドの核磁気共鳴化学シフト値を予測する工程と
を含む、予測方法。
【請求項2】
各アミノ酸残基の主鎖の2面角値の出現頻度分布をクラスタリングする前に、側鎖の2面角値(χの値で表される)に基づいて事前クラスタリングを行うことをさらに含む、請求項1に記載の予測方法。
【請求項3】
解鎖タンパク質の核磁気共鳴化学シフト値を予測するためのものである、請求項1又は2に記載の予測方法。
【請求項4】
クラスタリングが、混合ガウス分布により行われる、請求項1から3のいずれか一項に記載の予測方法。
【請求項5】
類似度の算出が積分法により行われる、請求項4に記載の予測方法。
【請求項6】
コンピュータに、
目的とするペプチドを構成する各アミノ酸残基の主鎖の2面角値(Φ及びΨの値で表される)の出現頻度分布をクラスタリングし、複数のクラスターの分布を取得するステップと、
スコア関数を用いて、取得された各クラスターの分布と、アミノ酸3残基データベースに登録された基準となる主鎖2面角値との類似度を算出するステップと、
算出された類似度から、前記目的とするペプチドの核磁気共鳴化学シフト値を予測するステップと、
を実行させる、前記ペプチドの核磁気共鳴化学シフト値の予測プログラム。
【請求項7】
ペプチドの核磁気共鳴化学シフト値を予測する予測装置であって、
前記予測装置は、処理部を備え、
前記処理部は、
目的とするペプチドを構成する各アミノ酸残基の主鎖の2面角値(Φ及びΨの値で表される)の出現頻度分布をクラスタリングし、複数のクラスターの分布を取得し、
スコア関数を用いて、取得された各クラスターの分布と、アミノ酸3残基データベースに登録された基準となる主鎖2面角値との類似度を算出し、
算出された類似度から、前記目的とするペプチドの核磁気共鳴化学シフト値を予測する、
前記予測装置。
【請求項8】
ペプチドの核磁気共鳴化学シフト値の予測方法であって、
目的とするペプチドを構成する各アミノ酸残基の主鎖の2面角値(Φ及びΨの値で表される)、及び側鎖の2面角値(χの値で表される)の出現頻度分布をクラスタリングし、三次元での複数のクラスターの分布を取得する工程と、
スコア関数を用いて、取得された各クラスターの分布と、アミノ酸3残基データベースに登録された基準となる主鎖2面角値との類似度を算出する工程と、
算出された類似度から、前記目的とするペプチドの核磁気共鳴化学シフト値を予測する工程と
を含む、予測方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、核磁気共鳴解析における化学シフト値を予測する方法、予測装置、及び予測プログラムに関する。
【背景技術】
【0002】
現在、創薬の分野では、天然変性タンパク質(intrinsically disordered proteins:IDPsともいう)や、天然変性領域(intrinsically disordered regions:IDRs)を持つタンパク質をターゲットとして新たな薬剤を開発する試みがなされている。
【0003】
核磁気共鳴(Nuclear Magnetic Resonance:NMR)法は、IDPsにおいて有用なツールである(非特許文献1)。NMR解析において、化学シフト(δ/ppm)は最も基本的、かつ重要な観測量(パラメータ)であり、原子の三次元座標で表されるペプチドの立体構造の予測に用いられている(非特許文献2)。IDPsの構造も、NMR解析における化学シフトを予測することによりその構造を特定することが試みられている。IDPsの構造解析では、標的タンパク質の予測構造をなるべく多くサンプリングし、その実験再現性を評価する必要がある(非特許文献3)。
【先行技術文献】
【非特許文献】
【0004】
【文献】M. R. Jensen, et al.:Chem. Rev., 2014, 114, 6632-6660
【文献】Y. Shen and A. Bax:J. Biomol. NMR, 2007, 38, 289-302
【文献】M. Schwalbe, et al.: Structure, 2014, 22, 238-249
【発明の概要】
【発明が解決しようとする課題】
【0005】
非特許文献3に記載の方法では、IDPsの一種であるTauタンパク質とα-synucleinの構造解析を行うにあたり、目的ペプチド集団に含まれる個々のペプチドの構造について、X線小角散乱(small angle X-ray scattering:SAXS)解析及びNMR解析等を組み合わせて数多くの実験を行い解析しなければならない。
【0006】
また、非特許文献2に記載の方法は、目的ペプチドの立体構造から、化学シフトを予測できる点において有用である。例えば、ペプチドを構成するアミノ酸の主鎖の2面角値(Φ及びΨの値)とペプチドの側鎖の2面角値(χの値)から、化学シフトを予測し、実験値と比較することができる。しかし、この方法は、IDPsやIDRsなど、ペプチドの構造に多様性がある場合、解析に膨大な時間を要する。
【0007】
本発明は、より短時間で目的とするペプチドの立体構造を予測することを課題とする。
【課題を解決するための手段】
【0008】
本発明者は、鋭意研究を重ねたところ、アミノ酸残基の2面角出願頻度をクラスター分析し、得られたクラスター分布を使用することで、より短時間で、目的ペプチドの化学シフト値を予測できることを見出した。
本発明は、当該知見に基づいて完成されたものであり、以下の態様を含む。
項1.
ペプチドの核磁気共鳴化学シフト値の予測方法であって、
目的とするペプチドを構成する各アミノ酸残基の主鎖の2面角値(Φ及びΨの値で表される)の出現頻度分布をクラスタリングし、複数のクラスターの分布を取得する工程と、
スコア関数を用いて、取得された各クラスターの分布と、アミノ酸3残基データベースに登録された基準となる主鎖2面角値との類似度を算出する工程と、
算出された類似度から、前記目的とするペプチドの核磁気共鳴化学シフト値を予測する工程と
を含む、予測方法。
項2.
各アミノ酸残基の主鎖の2面角値の出現頻度分布をクラスタリングする前に、側鎖の2面角値(χの値で表される)に基づいて事前クラスタリングを行うことをさらに含む、項1に記載の予測方法。
項3.
解鎖タンパク質の核磁気共鳴化学シフト値を予測するためのものである、項1又は2に記載の予測方法。
項4.
クラスタリングが、混合ガウス分布により行われる、項1から3のいずれか一項に記載の予測方法。
項5.
類似度の算出が積分法により行われる、項4に記載の予測方法。
項6.
コンピュータに、
目的とするペプチドを構成する各アミノ酸残基の主鎖の2面角値(Φ及びΨの値で表される)の出現頻度分布をクラスタリングし、複数のクラスターの分布を取得するステップと、 スコア関数を用いて、取得された各クラスターの分布と、アミノ酸3残基データベースに登録された基準となる主鎖2面角値との類似度を算出するステップと、
算出された類似度から、前記目的とするペプチドの核磁気共鳴化学シフト値を予測するステップと、
を実行させる、前記ペプチドの核磁気共鳴化学シフト値の予測プログラム。
項7.
ペプチドの核磁気共鳴化学シフト値を予測する予測装置であって、
前記予測装置(10,20)は、処理部(101,201)を備え、
前記処理部(101,201)は、
目的とするペプチドを構成する各アミノ酸残基の主鎖の2面角値(Φ及びΨの値で表される)の出現頻度分布をクラスタリングし、複数のクラスターの分布を取得し、
スコア関数を用いて、取得された各クラスターの分布と、アミノ酸3残基データベースに登録された基準となる主鎖2面角値との類似度を算出し、
算出された類似度から、前記目的とするペプチドの核磁気共鳴化学シフト値を予測する、
前記予測装置(10,20)。
項8.
ペプチドの核磁気共鳴化学シフト値の予測方法であって、
目的とするペプチドを構成する各アミノ酸残基の主鎖の2面角値(Φ及びΨの値で表される)、及び側鎖の2面角値(χの値で表される)の出現頻度分布をクラスタリングし、三次元での複数のクラスターの分布を取得する工程と、
スコア関数を用いて、取得された各クラスターの分布と、アミノ酸3残基データベースに登録された基準となる主鎖2面角値との類似度を算出する工程と、
算出された類似度から、前記目的とするペプチドの核磁気共鳴化学シフト値を予測する工程と
を含む、予測方法。
【発明の効果】
【0009】
本発明によれば、目的ペプチドのNMRの化学シフト値をより短時間で予測することができる。
【図面の簡単な説明】
【0010】
図1】本発明の概要を示す。図1(a)は、目的ペプチドの2面角の出現頻度分布図を示す。図1(b)は、目的ペプチドの分子モデルの一部を示す。図1(c)は、2面角の出現頻度分布図を混合ガウス分布でクラスタリングしたクラスター分布を示す。図1(d)は、混合ガウス分布のi-1番目、i番目、i+1番目のアミノ酸残基の、2面角の出現頻度のクラスターの組合せを示す。
図2】予測システム1000,2000のハードウェアの構成を示す。
図3】予測装置10のハードウェアの構成を示す。
図4】予測装置10の機能ブロックを示す。
図5】予測プログラム1042の処理の流れを示す。
図6図5に示すステップS5及び図9に示すステップS26の化学シフト値予測処理のフローチャートを示す。
図7】予測装置10のハードウェアの構成を示す。
図8】予測装置10の機能ブロックを示す。
図9】予測プログラム1042の処理の流れを示す。
図10】unfolded apomyoglobinについて、本発明の方法で予測した核磁気共鳴化学シフト値と、SPARTAプログラムで予測した核磁気共鳴化学シフト値の比較を示す。図中C、CA、CB、N、NH、HAはそれぞれ、13C’、13α13β15N、αを示す。
図11】グルタミン残基のχの値で事前クラスタリングして得られた3つのクラスタリング結果を示す。左側の列は「ゴーシュ+」を示し、真ん中の列は「トランス」を示し、右の列は「ゴーシュ-」を示す。上段はクラスタリング結果を示し、下段は予測された主鎖2面角データを示す。
図12】尿素変性アポミオグロビンの化学シフト実験データの再現性を示す。図中C、CA、CB、HAはそれぞれ、13C’、13α13βαを示す。
【発明を実施するための形態】
【0011】
1.本発明の概要と用語の説明
本明細書において、「目的とするペプチド」とは、化学シフト値を予測したいペプチドを意図する。以下、「目的とするペプチド」を単に「目的ペプチド」と呼ぶことがある。
【0012】
各種アミノ酸の「残基」とは、ペプチドを構成するアミノ酸の構成単位であり、アミノ酸から、主鎖のアミノ基については水素原子が除かれ、及び/又は主鎖のカルボキシル基については-OHが除かれてなる基を表す。
【0013】
アミノ酸は、特に制限されないが、好ましくは天然アミノ酸である。より好ましくは、バリン、イソロイシン、ロイシン、メチオニン、リジン、フェニルアラニン、トリプトファン、スレオニン、ヒスチジン、アルギニン、グリシン、アラニン、セリン、チロシン、システイン、アスパラギン、グルタミン、プロリン、アスパラギン酸、及びグルタミン酸から選択される。
【0014】
「目的とするペプチドを構成する各アミノ酸残基」とは、目的ペプチドを構成するアミノ酸残基一つ一つを意図する。言い換えると、例えば、目的ペプチドが100アミノ酸残基から構成される場合、100アミノ酸残基のそれぞれについて、主鎖2面角Φ、及び主鎖2面角Ψが存在する。また、側鎖が存在するアミノ酸の場合、側鎖2面角χが存在する。しかし、グリシン残基とアラニン残基は側鎖を有さないため、側鎖2面角χは存在しない。また、プロリン残基は、実質的に1つの側鎖2面角χしか存在しない。
【0015】
本明細書において、「化学シフト値」は核磁気共鳴化学シフト値を意図する。
【0016】
図1を用いて、技術分野における従来技術と本発明の概要を説明する。
図1の上段枠内の従来法は、ペプチドの立体構造(構成原子の3次元座標)を使って、タンパク質を構成するペプチドの主鎖原子の化学シフト値を、SPARTAプログラム(非特許文献2)を使用して予測する方法である。
【0017】
1-1.従来の予測方法
従来法では、目的ペプチドの連続する3アミノ酸残基(以下、アミノ酸残基を単に「残基」と呼ぶことがある)の立体構造を,化学シフトの実験値を含む3残基データベース中の構造と定量的に比較する。
そのスコア関数Sを下式(1)に示す。
【0018】
【数1】
式中、iは目的ペプチドを構成するアミノ酸の残基番号をjは3残基データベース中の残基番号を示す。rは原子の核種(15N,α13α13β13C)を表す。
【0019】
右辺の和は,連続する3残基それぞれのスコアを足し合わすことを示している。右辺の各項は左からそれぞれ、アミノ酸残基種(ResType)、主鎖2面角Φ、主鎖2面角Ψ、側鎖2面角χの類似度を示している。また式中のkn,rはパラメータであり、天然球状タンパク質の化学シフト予測に最適化した値が非特許文献2に示されている。3残基データベースには24,166個のデータが登録されており、その全てについてスコア関数を計算し、その中からスコア値Sが低い20個の化学シフト値の重み付き平均を推定値とする。従来法である、SPARTAを解鎖タンパク質に適用する場合、はじめに解鎖タンパク質の構造集団を構築し、その集団に含まれる個々のペプチドの立体構造に対してSPARTAの予測値の集団平均を求める必要があり、その計算量は膨大である。
【0020】
ここで、球状タンパク質とは、固有の立体構造を形成するペプチドを意図する。また、解鎖タンパク質とは、鎖がほどけた変性状態のペプチドを意図する。解鎖タンパク質には、変性タンパク質等を含み得る。ここで、球状タンパク質は、天然球状タンパク質であることが好ましい。また、変性タンパク質は天然変性タンパク質であることが好ましい。ここで、天然とは、変性剤等を用いて人為的に操作したタンパク質、又はペプチドではないことを意図する。
【0021】
ペプチドの主鎖2面角(Φ,Ψ)は、共有結合を軸とした回転角を意図する。したがって、その値は-πからπの範囲内で定義され、周期2πの周期性を持つ。
【0022】
また、ペプチドの主鎖構造は(Φ,Ψ)の値(以下、「2面角値」ともいう)でよく表現できるため、その出現頻度分布(以下、主鎖2面角頻度分布)図は、天然球状タンパク質の局所構造分類や立体構造の品質管理などで広く用いられている。この主鎖2面角頻度分布は、解鎖タンパク質の構造解析において利用され得る。図1(a)に示すように、主鎖2面角頻度分布には、高頻度な幾つかの領域がある一方、ほとんど構造が現れない領域もある。
【0023】
ペプチドの主鎖又は側鎖の2面角は、X線回折法、中性子線回折法等による測定や、量子化学計算等の計算機シミュレーション等により求めることができる。
【0024】
従来法では、はじめに図1(a)に示す目的ペプチドの主鎖構造の2面角値(以下、「目的ペプチド2面角値」ともいう)の分布から、10個~10個程度の目的ペプチド2面角値をサンプリングする。目的ペプチドの主鎖構造の2面角値は、複数の目的ペプチドから取得された値が含まれる。次に、サンプリングした全て目的ペプチド2面角値と、例えば、図1に示すアミノ酸3残基データベース(Tripeptide Database:TPDB)30に登録されている、3残基データベース内に記録されているアミノ酸残基3つからなる24,166個のペプチドのそれぞれの構造の2面角値(以下、「基準2面角値」ともいう)との類似度を求める。類似度は、スコア関数により求めることができる。続いて、スコア関数より求められた類似度に基づいて、図1(b)に示す類似する構造の原子13C’、13α13β15N、、又はαの化学シフト値を記録したデータベースから抽出し、目的ペプチドの予測化学シフト値とする。
【0025】
アミノ酸3残基データベースとして、例えば非特許文献2に記載されているように、RCSB Protein Data Bank(RCSB PDB: https://www.rcsb.org/)等のタンパク質の構造データベースに立体構造が登録されており、かつ、例えばBioMagResBank(BMRB: http://www.bmrb.wisc.edu/)等のデータベースに化学シフト値が登録されているタンパク質を選択し、そのタンパク質に含まれる各アミノ酸残基の各原子核種(13C’、13α13β15N、、又はα)の化学シフト値と前後1アミノ酸残基を合わせたアミノ酸3残基の主鎖及び側鎖の2面角値をデータベース化したものを挙げることができる。アミノ酸3残基データベースにはアミノ酸3残基の主鎖及び側鎖の2面角値、3残基を構成するアミノ酸残基名、各アミノ酸残基を構成する各原子の核種の化学シフト値等が含まれ得る。非特許文献2に記載のアミノ酸3残基データベースは、前記要件を満たす200個のタンパク質に含まれるアミノ酸3残基から構築されている。
【0026】
1-2.本発明の予測方法
本発明のある実施形態は、ペプチドの核磁気共鳴の化学シフト値の予測方法に関する。本実施形態は、(1)目的とするペプチドを構成する各アミノ酸残基の主鎖の2面角値(Φ及びΨの値で表される)の出現頻度分布をクラスタリングし、複数のクラスターの分布を取得する工程と、(2)スコア関数を用いて、取得された各クラスターの分布と、アミノ酸3残基データベースに登録された基準となる主鎖2面角値との類似度を算出する工程と、(3)算出された類似度から、目的とするペプチドの核磁気共鳴化学シフト値を予測する工程とを含み得る。
【0027】
(1)クラスターの分布の取得
本発明では、図1(c)に示すように、目的ペプチドの主鎖の2面角値の出現頻度分布をクラスタリングし、そのクラスターの分布に基づいて、上記1-1.で述べた3残基データベース内に記録されている基準2面角値から類似する構造を抽出する。このクラスタリングでは、1つの2面角頻度分布図におけるクラスターの数は、複数であり得る。好ましくは、クラスターの数は、4個から6個程度であり得る。本明細書において、主鎖の2面角値を「主鎖2面角値」と略記することがある。また、主鎖の2面角値の出現頻度分布を「主鎖2面角分布」と略記することがある。
【0028】
また、前記クラスタリングの前に、あらかじめ、目的ペプチドを構成する各アミノ酸残基の側鎖の2面角(χ)の値をクラスタリングする事前クラスタリングを行ってもよい。本明細書において、側鎖の2面角を「側鎖2面角」と略記することがある。また、側鎖の2面角(χ)の値は、「側鎖2面角値」又は「χの値」とも称することがある。
【0029】
事前クラスタリングは、目的ペプチドを構成するアミノ酸残基の中で、グリシン残基、アラニン残基及びプロリン残基以外のアミノ酸残基について、χの3つのピーク(角度)における出現頻度分布を取得することを意図する。具体的には、χのピークが+60°付近にある「ゴーシュ+」、-60°付近にある「ゴーシュ-」、+180°付近にある「トランス」の3つである。ここで、「+」は「プラス」を意図し、「-」は、「マイナス」を意図する。この3つのχのピークで示される側鎖2面角(χ)の値を考慮すると、アミノ酸残基ごとに目的ペプチドの主鎖2面角値を取得する際、1つのアミノ酸残基について、χの値に応じて異なる3つの主鎖2面角分布を取得することができる。χの値に応じた主鎖2面角分布を、χの少なくとも1つのピークについて取得し、クラスタリングに使用してもよい。好ましくは、χの値に応じた主鎖2面角分布を、χの少なくとも2つのピークについて取得し、クラスタリングに使用する。より好ましくは、χの値に応じた主鎖2面角分布を、χの3つのピークについて取得し、クラスタリングに使用する。目的ペプチドを構成するアミノ酸残基の側鎖2面角(χ)に応じて前記アミノ酸の主鎖2面角分布の群を取得することができ、それぞれの前記アミノ酸の主鎖2面角分布の群について、クラスタリングを行うことができる。
【0030】
χの値と主鎖2面角の出現頻度に相関がある。したがって、同じアミノ酸残基でも側鎖の構造(χ)に依存して主鎖の2面角頻度分布を変えることにより、算出された予測化学シフト値と実験値との相関がより向上することが期待される。一方、χ値は、主鎖2面角値に応じて出現頻度分布が大きく変わることは少ないと考えられる。
【0031】
ここで、グリシン残基、アラニン残基、及びプロリン残基については、χを考慮できないため、これらのアミノ酸については、後述する式(2)において、k^χ_n,rを「0(ゼロ)」と定義することが好ましい。
【0032】
クラスタリングの方法は、一つの2面角頻度分布内の各2面角値の分布を、クラスタリングできる限り制限されない。例えば、クラスタリングは、混合ガウス分布モデル、フォン・ミーゼス分布モデル等により行うことができる。コスト面から、混合ガウス分布モデルを用いることが好ましい。クラスタリングの際、EMアルゴリズム、最尤推定,MAP推定、ベイズ推定等によりパラメータの推定を行うことができる。混合ガウス分布モデルによりクラスタリングを行う場合、EMアルゴリズムによりパラメータの推定を行うことが好ましい。
【0033】
ここで、主鎖2面角値の分布のクラスタリングは、Φの値とΨの値との二次元で行うこととなる。また、側鎖2面角値の分布の事前クラスタリングは、χの値のみの一次元で行う。
【0034】
さらに、事前クラスタリングを行わずに主鎖2面角値の分布と側鎖2面角値を用いて、Φの値とΨの値とχの値との三次元でクラスタリングを行うことも可能である。三次元のクラスタリングでは、1つの2面角頻度分布図におけるクラスターの数は、複数であり得る。好ましくは、クラスターの数は、12個から18個程度であり得る。
【0035】
(2)類似度の算出
以下に、混合ガウス分布を用いた場合を例にして、本実施形態について説明する。
本実施形態では、式(1)に示したスコア関数の主鎖2面角に関する項を、混合ガウス分布を構成する1つのガウス分布(1つの領域)についてスコア関数へ拡張する。スコア関数へ拡張は、1つのガウス分布(1つの領域)を積分法を用いて、3残基データベース内に記録されているアミノ酸残基3つからなるペプチドのそれぞれの構造の2面角値を下式により比較する。
【0036】
【数2】
式中、iは、式(1)とは異なり、主鎖2面角分布の領域(ガウス分布)を示している。他の記号は、式(1)と同様である。
【0037】
また、式(2)中のΦとΨに関する類似度は、以下の積分式で表される。
【数3】
ここで、θは主鎖2面角(Φ,Ψ)を表している。FWNは、下記Wrapped Normal Distribution関数を表す。
【0038】
【数4】
FWNのパラメータである平均値μθと分散σθ は、主鎖2面角分布の各領域についてそれぞれ与えられる。式(3)の積分を実行する。
【0039】
【数5】
ここでxは周期的なので、x’=x-μθとおいても積分結果は変わらない。
【0040】
そこで
【数6】
ただし、θ’=θ-μθとおいた。積分の結果を以下に示す。なお、計算の詳細は後述する。
【0041】
【数7】
【0042】
アミノ酸3残基データベースに関するθは、(7)式の第1項のみに関係し、(1)式と同じ形式をしている。第2項以降は、ガウス分布の分散σθ のみで計算できるので、データベースとの比較と関係なく事前計算できる。さらに、主鎖2面角頻度分布を“周期的でないガウス分布”と仮定すると、積分結果は(7)式の第2項までと同じ形になる。すなわち、(7)式の第3、4項は、ガウス分布の周期性を考慮したことによって出現する項であり、σθが周期2πよりも十分小さければ、これらの項は無視できる。後述するように、主鎖2面角頻度分布におけるσθの最大値を30°とするとk=1の計算のみで十分な精度が得られる。
【0043】
その結果、SPARTAプログラムを使って、ペプチド1つを予測する計算時間と、1つの主鎖2面角分布パターンに対する解鎖タンパク質集団の予測時間が同等となる。言い換えると、SPARTAプログラムを使って、ペプチド1つを予測する計算時間は、SPARTAプログラムを使用した場合、複数の解鎖タンパク質を含む集団であって、かつその解鎖のパターンが様々である場合、その構造数倍の時間を要することとなる。しかし、本発明の予測方法では、複数の解鎖タンパク質を含む集団であっても短時間で構造を予測することができ、その時間は、SPARTAプログラムを使って1つのペプチドの構造を予測した場合と同等である。主鎖2面角頻度分布が4~6つの領域で近似できれば、3残基の主鎖2面角頻度分布パターンは64(=4)~216(=6)である。この数は、解鎖タンパク質の構造集団の構造数10~10より圧倒的に少なく、計算時間を大幅に短縮できる。
【0044】
次に、化学シフトを予測したい目的ペプチドの主鎖2面角分布(μθ,σθ )とアミノ酸3残基データベース中の対応する2面角値(θ)から、主鎖2面角の類似度sθ(j)を計算するためのアルゴリズムを説明する。アルゴリズムは、下記1~3のステップにより示される。式中の角度は、一部を除き単位はラジアンである。
【0045】
ステップ1:計算精度を満たすkmaxを見積もる。指数関数と誤差関数の誤差を10-7以下とすれば、
【数8】
分布の標準偏差の単位を度(degree:deg)で表示すると
【数9】
例えば現実的なσθ,deg≦30°の場合、k=1である。
この計算は、σθが変わらなければ再度する必要はない。
【0046】
ステップ2:事前計算を実行する。
【数10】
主鎖2面角頻度分布の領域数(例えば4~6個の領域)だけ計算し、記録する。
この式は、アミノ酸3残基データベースとは無関係である。
【0047】
ステップ3:分布の中心からの2面角値(θ)を求め、スコア関数sθ(j)を計算する。
【数11】
得られた値を2乗し、ステップ2の値を加えてsθ(j)を計算する。
この計算を、アミノ酸3残基データベースの全てについて計算する。
【0048】
次に、上述した式(6)の具体的な計算を以下に示す。ただし、以下の数式においてプライムは省略される。
【数12】
【0049】
まず、変数置換x=t-2πkを行う。
【数13】
【0050】
第1項は、積分範囲を分割して積分し、後で和をとっているだけなので、ガウス分布の2次モーメント計算と同じである。
【数14】
【0051】
次に第2項は、通常に積分を実行する。
【数15】
【0052】
ここで、k=0は0であるので、kの絶対値が同じものを書き下すと、
【数16】
となる。
【0053】
最後に第3項は、誤差関数
【数17】
を使って変換する。
【0054】
すなわち変数変換
【数18】
を実行する。
【数19】
【0055】
ここでk=0の場合、
【数20】
となる。
【0056】
さらに第2項と同様にkの絶対値が同じものを書き下すと、
【数21】
となる。ここで、θ が現れる2つの式は、和記号の後半の式は、常にkが一つ前の前半とキャンセルする。
【0057】
例えば、数21をk=4まで書き下すと、
【数22】
となる。
【0058】
したがって、
【数23】
となる。
【0059】
故に、第1、2、3項の結果を使って、
【数24】
となる。
【0060】
最後にθの定義に戻って数24を書き直すと、
【数25】
となる。
【0061】
このようにして、目的ペプチドの各アミノ酸残基と2面角値が類似している基準アミノ酸を抽出することができる。
【0062】
(3)化学シフト値の予測
上記(2)の方法において、目的ペプチドの各アミノ酸残基と主鎖2面角分布の組み合わせに対し、類似しているとしてアミノ酸3残基データベースから抽出された3アミノ酸残基に対応する各原子の核種(例えば、15N,α13α13β13C)の化学シフト値を得る。目的ペプチドの主鎖2面角分布の全ての組み合わせの化学シフト値に、各組み合わせの頻度確率を乗算したものの和を取り、目的ペプチドの各アミノ酸残基における各原子の核種の予測化学シフト値とする。
【0063】
事前クラスタリングを行う場合には、「ゴーシュ+」、「ゴーシュ-」、及び「トランス」のそれぞれの頻度確率を目的ペプチドの主鎖2面角分布の全ての組み合わせの化学シフト値に乗算したものの和を取り、目的ペプチドの各アミノ酸残基における各原子の核種の予測化学シフト値とする。
【0064】
2.予測システム1000及び予測装置10
2-1.予測システム1000
図2に、第1の実施形態にかかるペプチドの核磁気共鳴化学シフト値を予測する予測装置10(以下、単に「予測装置10」ともいう)を備えるペプチドの核磁気共鳴化学シフト値を予測する予測システム1000(以下、単に「予測システム1000」ともいう)のハードウェアの構成を示す。予測システム1000において、予測装置10は有線又は無線のネットワークを介して、アミノ酸3残基データベース30と通信可能に接続している。
【0065】
2-2.予測装置10
(1)予測装置10のハードウェアの構成
図3に、予測装置10のハードウェアの構成を示す。予測装置10は、入力デバイス111と、出力デバイス112と、記憶媒体113とに接続されていてもよい。
【0066】
予測装置10において、CPU101と、メモリ102と、ROM(read only memory)103と、記録デバイス104と、通信インタフェース(I/F)105と、入力インタフェース(I/F)106と、出力インタフェース(I/F)107と、メディアインターフェース(I/F)108は、バス109によって互いにデータ通信可能に接続されている。メモリ102と記録デバイス104とを合わせて、単に記憶部と呼ぶこともある。記録デバイス104には、例えば米国マイクロソフト社が製造販売するWindows(登録商標)などのグラフィカルユーザインタフェース環境を提供するオペレーションシステム(OS)1041、本発明のアプリケーションソフトであると予測プログラム1042、目的ペプチド2面角値を格納する目的ペプチド2面角値データベース1043を不揮発性に記録する。
【0067】
CPU101は、予測装置10の処理部である。CPU101が、記録デバイス104又はROM103に記憶されているOS1041と予測プログラム1042とを協働させて実行し、図5に示すステップS1からステップS5の処理を行うことにより、コンピュータが予測装置10として機能する。
【0068】
ROM103は、マスクROM、PROM、EPROM、EEPROMなどによって構成され、CPU101により実行されるコンピュータプログラム及びこれに用いるデータが記録されている。CPU101はMPU101としてもよい。ROM103は、予測装置10の起動時に、CPU101によって実行されるブートプログラムや予測装置10のハードウェアの動作に関連するプログラムや設定を記憶する。
【0069】
メモリ102は、SRAM又はDRAMなどのRAM(Random access memory)によって構成される。メモリ102は、ROM103及び記録デバイス104に記録されているコンピュータプログラムの読み出しに用いられる。また、メモリ102は、CPU101がこれらのコンピュータプログラムを実行するときの作業領域として利用される。
【0070】
通信I/F105は、USB、IEEE1394、RS-232Cなどのシリアルインタフェース、SCSI、IDE、IEEE1284などのパラレルインタフェース、及びD/A変換器、A/D変換器などからなるアナログインタフェース、ネットワークインタフェースコントローラ(Network interface controller:NIC)等から構成される。通信I/F105は、CPU101の制御下で、測定部30又は他の外部機器からのデータを受信し、必要に応じて予測装置10が保存又は生成する情報を、外部に送信又は表示する。通信I/F105は、ネットワークを介して外部データベースからデータを受信する。
【0071】
入力I/F106は、例えばUSB、IEEE1394、RS-232Cなどのシリアルインタフェース、SCSI、IDE、IEEE1284などのパラレルインタフェース、及びD/A変換器、A/D変換器などからなるアナログインタフェースなどから構成される。入力I/F106は、入力デバイス111から文字入力、クリック、音声入力等を受け付ける。受け付けた入力内容は、メモリ102又は記録デバイス104に記憶される。
【0072】
入力デバイス111は、タッチパネル、キーボード、マウス、ペンタブレット、マイク等から構成され、予測装置10に文字入力又は音声入力を行う。入力デバイス111は、予測装置10の外部から接続されても、予測装置10と一体となっていてもよい。
出力I/F107は、例えば入力I/F106と同様のインタフェースから構成される。出力I/F107は、CPU101が生成した情報を出力デバイス112に出力する。出力I/F107は、CPU101が生成し、記録デバイス104に記憶した情報を、出力デバイス112に出力する。
【0073】
出力デバイス112は、例えばディスプレイ、プリンター等で構成され、測定部30から送信される測定結果及び予測装置10における各種操作ウインドウ、分析結果等を表示する。
【0074】
メディアI/F108は、記憶媒体113に記憶された例えばアプリケーションソフト等を読み出す。読み出されたアプリケーションソフト等は、メモリ102又は記録デバイス104に記憶される。また、メディアI/F108は、CPU101が生成した情報を記憶媒体113に書き込む。メディアI/F108は、CPU101が生成し、記録デバイス104に記憶した情報を、記憶媒体113に書き込む。
【0075】
記憶媒体113は、フレキシブルディスク、CD-ROM、又はDVD-ROM等で構成される。記憶媒体113は、フレキシブルディスクドライブ、CD-ROMドライブ、又はDVD-ROMドライブ等によってメディアI/F108と接続される。記憶媒体113には、コンピュータがオペレーションを実行するためのアプリケーションプログラム等が格納されていてもよい。
【0076】
CPU101は、予測装置10の制御に必要なアプリケーションソフトや各種設定をROM103又は記録デバイス104からの読み出しに代えて、ネットワークを介して取得してもよい。前記アプリケーションプログラムがネットワーク上のサーバコンピュータの補助記憶部内に格納されており、このサーバコンピュータに予測装置10がアクセスして、コンピュータプログラムをダウンロードし、これをROM103又は記録デバイス104に記憶することも可能である。
【0077】
また、ROM103又は記録デバイス104には、例えば米国マイクロソフト社が製造販売するWindows(登録商標)などのグラフィカルユーザインタフェース環境を提供するオペレーションシステムがインストールされている。第2の実施形態にかかるアプリケーションプログラムは、前記オペレーティングシステム上で動作するものとする。すなわち、予測装置10は、パーソナルコンピュータ等であり得る。
【0078】
(2)予測装置10の機能
図4に、予測装置10の機能構成を示す。予測装置10のCPU101は、サンプル2面角値取得部1、基準2面角値取得部3、クラスタリング部5、クラスター分布比較部7、化学シフト予測部9として機能する。サンプル2面角値取得部1は後述する図5においてステップS1に該当し、基準2面角値取得部3は後述する図5においてステップS2に該当し、クラスタリング部5は後述する図5においてステップS3に該当し、クラスター分布比較部7は後述する図5においてステップS4に該当し、化学シフト予測部9は後述する図5においてステップS5に該当する。
【0079】
(3)予測プログラム1042が実行する処理
図5及び図6に、予測プログラム1042によって実行される処理の流れを示す。
【0080】
図5のステップS1において、CPU101は記録デバイス104に格納されたサンプル2面角値データベース1043から、目的ペプチドの主鎖2面角値を取得する。この処理は、ユーザが入力デバイス111から、目的ペプチドの主鎖2面角値の取得要求を行うことにより開始される。
【0081】
図5のステップS2において、CPU101は、通信I/F107を介して、図2に示すアミノ酸3残基データベース30に格納された基準2面角値を取得する。この処理は、ユーザが入力デバイス111から、基準2面角値の取得要求を行うことにより開始される。
【0082】
ここで、図5のステップS1とステップS2は、逆であってもよい。また、CPU101は、あらかじめ図2に示すアミノ酸3残基データベース30に格納された基準2面角値を取得しておき、記録デバイス104内に記録していてもよい。
【0083】
図5のステップS3において、CPU101は、ステップS1で取得した目的ペプチドの主鎖2面角値のクラスタリングを行い、クラスター分布を取得する。クラスタリングの方法は、上記1-2.(1)において説明したとおりである。
【0084】
図5のステップS4において、CPU101は、ステップS3におけるクラスタリングにより取得されたクラスター分布とステップS2で取得した基準2面角値を比較し類似度を算出する。類似度の算出方法は、上記1-2.(2)において説明したとおりである。
【0085】
図5のステップS5において、CPU101は、ステップS4で取得した類似度に基づいて、ステップS3で求めたクラスター分布に類似する基準2面角値に対応する各原子の核種の化学シフト値を目的ペプチドの各アミノ酸に含まれる各原子の核種の化学シフトの予測値として取得する。
【0086】
図6を用いて、CPU101による図5に示すステップS5の処理をより詳細に説明する。
【0087】
図6に示すステップS51において、CPU101は、図5に示すステップS4において類似度の高かった基準2面角値を有する構造をアミノ酸3残基データベース30から抽出する。
【0088】
次に、図6に示すステップS52において、CPU101は、ステップS51において抽出された構造に対応する化学シフト値をアミノ酸3残基データベース30から取得する。
【0089】
続いて、CPU101は、図6に示すステップS53において、全ての原子核種について、化学シフト値を取得したかを判定し、全ての化学シフト値を取得していない場合(「No」の場合)には、ステップS52に戻り、まだ化学シフトを取得していない原子核種について、化学シフト値を取得する。
【0090】
CPU101は、図6に示すステップS53において、全ての原子核種について、全ての化学シフト値を取得した場合(「Yes」の場合)には、ステップS54へ進み、核種について取得した化学シフト値を目的ペプチドの予測化学シフト値として記録デバイス104に記録する。
【0091】
図6に示すステップS51からS54の詳細は、上記1-2.(2)に従う。
ここで、図6に示すステップS51における類似度の高かった基準2面角値を有する構造の抽出は、図5に示すステップS4の後にユーザが入力デバイス111から抽出指示を入力し、前記抽出指示をCPU101が受け付けてもよい。あるいは、図5に示すステップS4の終了をトリガーとして、CPU101が類似の高い基準2面角値を有する構造をアミノ3残基データベース30から自動的に抽出してもよい。
【0092】
図6に示すステップS52における化学シフト値の取得はステップS51の後にユーザが入力デバイス111から取得指示を入力し、前記取得指示をCPU101が受け付けてもよい。あるいは、ステップS51の終了をトリガーとして、CPU101が抽出された構造に基づいて、アミノ3残基データベース30から自動的に取得してもよい。
3.予測システム2000及び予測装置20
3-1.予測システム2000
図2に、第2の実施形態にかかるペプチドの核磁気共鳴化学シフト値を予測する予測装置20(以下、単に「予測装置20」ともいう)を備えるペプチドの核磁気共鳴化学シフト値を予測する予測システム2000(以下、単に「予測システム2000」ともいう)のハードウェアの構成を示す。予測システム2000において、予測装置20は有線又は無線のネットワークを介して、アミノ酸3残基データベース30と通信可能に接続している。
【0093】
3-2.予測装置20
(1)予測装置20のハードウェアの構成
図7に、予測装置10のハードウェアの構成を示す。予測装置20は、入力デバイス211と、出力デバイス212と、記憶媒体213とに接続されていてもよい。
【0094】
予測装置20において、CPU201と、メモリ202と、ROM(read only memory)203と、記録デバイス204と、通信インタフェース(I/F)205と、入力インタフェース(I/F)206と、出力インタフェース(I/F)207と、メディアインターフェース(I/F)208は、バス209によって互いにデータ通信可能に接続されている。メモリ202と記録デバイス204とを合わせて、単に記憶部と呼ぶこともある。記録デバイス204には、例えば米国マイクロソフト社が製造販売するWindows(登録商標)などのグラフィカルユーザインタフェース環境を提供するオペレーションシステム(OS)2041、本発明のアプリケーションソフトであると予測プログラム2042、目的ペプチド2面角値を格納する目的ペプチド2面角値データベース2043を不揮発性に記録する。
【0095】
CPU201と、メモリ202と、ROM203と、記録デバイス204と、通信I/F205と、入力I/F206と、出力I/F207と、メディアI/F208と、バス209と、オペレーションシステム(OS)2041と、目的ペプチド2面角値データベース2043は、それぞれ、予測装置10におけるCPU101と、メモリ102と、ROM103と、記録デバイス104と、通信I/F105と、入力I/F106と、出力I/F107と、メディアI/F108と、バス109と、オペレーションシステム(OS)1041、及び目的ペプチド2面角値データベース1043に対応する。
【0096】
(2)予測装置20の機能
図8に、予測装置20の機能構成を示す。予測装置20のCPU201は、サンプル2面角値取得部21、基準2面角値取得部23、側鎖2面角値事前クラスタリング部24、主鎖2面角値クラスタリング部25、クラスター分布比較部27、化学シフト予測部29として機能する。サンプル2面角値取得部21は後述する図9においてステップS21に該当し、基準2面角値取得部23は後述する図9においてステップS22に該当し、側鎖2面角値事前クラスタリング部24は後述する図9においてステップS23に該当し、主鎖2面角値クラスタリング部25は後述する図9においてステップS24に該当し、クラスター分布比較部27は後述する図9においてステップS25に該当し、化学シフト予測部29は後述する図9においてステップS26に該当する。
【0097】
(3)予測プログラム2042が実行する処理
図9及び図6に、予測プログラム2042によって実行される処理の流れを示す。
【0098】
図9のステップS21において、CPU201は記録デバイス204に格納されたサンプル2面角値データベース2043から、目的ペプチドの主鎖2面角値と側鎖2面角値を取得する。この処理は、ユーザが入力デバイス211から、目的ペプチドの主鎖2面角値と側鎖2面角値の取得要求を行うことにより開始される。
【0099】
図9のステップS22において、CPU201は、通信I/F207を介して、図2に示すアミノ酸3残基データベース30に格納された基準2面角値を取得する。この処理は、ユーザが入力デバイス211から、基準2面角値の取得要求を行うことにより開始される。
【0100】
ここで、図9のステップS21とステップS22は、逆であってもよい。また、CPU201は、あらかじめ図2に示すアミノ酸3残基データベース30に格納された基準2面角値を取得しておき、記録デバイス204内に記録していてもよい。
【0101】
図9のステップS23において、CPU201は、側鎖2面角値を用いた事前クラスタリングを実行する。事前クラスタリングの方法は、上記1-2.(1)において説明したとおりである。
【0102】
図9のステップS24において、CPU201は、ステップS23で取得した側鎖のχに応じて、χごとに目的ペプチドの主鎖2面角値のクラスタリングを行い、クラスター分布を取得する。クラスタリングの方法は、上記1-2.(1)において説明したとおりである。
【0103】
図9のステップS25において、CPU201は、ステップS24におけるクラスタリングにより取得されたクラスター分布とステップS22で取得した基準2面角値を比較し類似度を算出する。類似度の算出方法は、上記1-2.(2)において説明したとおりである。
【0104】
図9のステップS26において、CPU201は、ステップS25で取得した類似度に基づいて、ステップS24で求めたクラスター分布に類似する基準2面角値に対応する各原子の核種の化学シフト値を目的ペプチドの各アミノ酸に含まれる各原子の核種の化学シフトの予測値として取得する。
【0105】
図6を用いて、CPU201による図9に示すステップS26の処理をより詳細に説明する。
【0106】
図6に示すステップS51において、CPU101は、図9に示すステップS25において類似度の高かった基準2面角値を有する構造をアミノ酸3残基データベース30から抽出する。
【0107】
次に、図6に示すステップS52において、CPU201は、ステップS51において抽出された構造に対応する化学シフト値をアミノ酸3残基データベース30から取得する。
【0108】
続いて、CPU201は、図6に示すステップS53において、全ての原子核種について、化学シフト値を取得したかを判定し、全ての化学シフト値を取得していない場合(「No」の場合)には、ステップS52に戻り、まだ化学シフトを取得していない原子核種について、化学シフト値を取得する。
【0109】
CPU201は、図6に示すステップS53において、全ての原子核種について、全ての化学シフト値を取得した場合(「Yes」の場合)には、ステップS54へ進み、核種について取得した化学シフト値を目的ペプチドの予測化学シフト値として記録デバイス204に記録する。
【0110】
図6に示すステップS51からS54の詳細は、上記1-2.(2)に従う。
ここで、図6に示すステップS51における類似度の高かった基準2面角値を有する構造の抽出は、図9に示すステップS25の後にユーザが入力デバイス211から抽出指示を入力し、前記抽出指示をCPU201が受け付けてもよい。あるいは、図9に示すステップS25の終了をトリガーとして、CPU201が類似の高い基準2面角値を有する構造をアミノ3残基データベース30から自動的に抽出してもよい。
【0111】
図6に示すステップS52における化学シフト値の取得はステップS51の後にユーザが入力デバイス211から取得指示を入力し、前記取得指示をCPU201が受け付けてもよい。あるいは、ステップS51の終了をトリガーとして、CPU201が抽出された構造に基づいて、アミノ3残基データベース30から自動的に取得してもよい。
【0112】
4.予測プログラムを記録した記憶媒体
予測プログラム1042及び予測プログラム2042は、本発明にかかるペプチドの核磁気共鳴化学シフト値を予測するためのコンピュータプログラムとしてコンピュータ上で実行されうる。
【0113】
前記コンピュータプログラムは、記憶媒体等のプログラム製品として提供されうる。前記コンピュータプログラムは、ハードディスク、フラッシュメモリ等の半導体メモリ素子、光ディスク等の記憶媒体に記憶される。前記記憶媒体へのプログラムの記憶形式は、前記制御部が前記プログラムを読み取り可能である限り制限されない。前記記憶媒体への記憶は、不揮発性であることが好ましい。
【0114】
5.発明の効果の検証
5-1.第1実施形態の検証
図10にunfolded apomyoglobinについて、第1実施形態にかかる予測方法で予測した核磁気共鳴化学シフト値と、SPARTAプログラムで予測した核磁気共鳴化学シフト値のパターンの比較を示す。図中C、CA、CB、N、NH、HAはそれぞれ、13C’、13α13β15N、αを示す。赤線(グレースケールでは灰色線)は本発明の予測値、黒線はSPARTAプログラムによる予測値を示す。縦軸は化学シフト値(ppm)、横軸は残基番号を示す。残基番号は、N末端を残基番号1とする。
【0115】
第1実施形態にかかる予測方法により得られた化学シフト値は、SPARTAプログラムで予測した化学シフト値とほぼ一致していた。
【0116】
したがって、本発明の予測方法は、SPARTAプログラムに匹敵する予測機能を有していると考えられた。
【0117】
5-2.第2実施形態の検証
第2実施形態にかかる予測方法の効果を検証した。
図11にグルタミン残基のχの値で事前クラスタリングして得られた3つのクラスタリング結果を示す。左側の列は「ゴーシュ+」を示し、真ん中の列は「トランス」を示し、右の列は「ゴーシュ-」を示す。上段はクラスタリング結果を示し、下段は予測された主鎖2面角データを示す。
【0118】
図12に尿素変性アポミオグロビンの化学シフト実験データの再現性を示す。C、CA、CB、HA(それぞれ、13C’、13α13βαを示す)の4つの核種について計算した。白丸はχの値を考慮せずに算出した予測値を示す。黒丸は、χの値を考慮して算出した予測値を示す。χの値を考慮して算出した予測値は、χの値を考慮しなかった予測値よりも実験値に近い値を示した。したがって、χの値で各アミノ残基の主鎖2面角分布の各ガウス分布の重みを修正することによって、予測値を実験値により近付けることが可能となった。
【符号の説明】
【0119】
10,20 予測装置
101,201 処理部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12