特許7057004 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人東京工業大学の特許一覧

特許7057004予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3A
3B
4A
4B
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2022-04-11

(45)【発行日】2022-04-19

(54)【発明の名称】予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム

(51)【国際特許分類】

G16B 35/00 20190101AFI20220412BHJP

【ＦＩ】

G16B35/00

【請求項の数】 33

(21)【出願番号】P 2021035648

(22)【出願日】2021-03-05

【審査請求日】2021-08-10

【新規性喪失の例外の表示】特許法第３０条第２項適用令和２年３月５日ｈｔｔｐｓ：／／ｉｐｓｊ．ｉｘｓｑ．ｎｉｉ．ａｃ．ｊｐ／ｅｊ／？ａｃｔｉｏｎ＝ｐａｇｅｓ＿ｖｉｅｗ＿ｍａｉｎ＆ａｃｔｉｖｅ＿ａｃｔｉｏｎ＝ｒｅｐｏｓｉｔｏｒｙ＿ｖｉｅｗ＿ｍａｉｎ＿ｉｔｅｍ＿ｄｅｔａｉｌ＆ｉｔｅｍ＿ｉｄ＝２０３８７３＆ｉｔｅｍ＿ｎｏ＝１＆ｐａｇｅ＿ｉｄ＝１３＆ｂｌｏｃｋ＿ｉｄ＝８にて公開

【新規性喪失の例外の表示】特許法第３０条第２項適用令和２年３月１２日第６１回ＢＩＯ研究発表会にて公開

【早期審査対象出願】

(73)【特許権者】

【識別番号】304021417

【氏名又は名称】国立大学法人東京工業大学

(74)【代理人】

【識別番号】110001519

【氏名又は名称】特許業務法人太陽国際特許事務所

(72)【発明者】

【氏名】秋山泰

(72)【発明者】

【氏名】大上雅史

(72)【発明者】

【氏名】柳澤渓甫

(72)【発明者】

【氏名】吉川寧

(72)【発明者】

【氏名】李佳男

【審査官】渡邉加寿磨

(56)【参考文献】

【文献】米国特許出願公開第２０２１／００２７８６２（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１５／００１５５６９（ＵＳ，Ａ１）

【文献】特開２０１０－２２５１２０（ＪＰ，Ａ）

【文献】特開２０２０－３５１３４（ＪＰ，Ａ）

【文献】中国特許出願公開第１１２４２０１２３（ＣＮ，Ａ）

【文献】米国特許出願公開第２０１２／０２６５５１３（ＵＳ，Ａ１）

【文献】李佳男，機械学習を用いた環状ペプチドの体内安定性予測手法の改良，情報処理学会研究報告バイオ情報学（ＢＩＯ）２０１９－ＢＩＯ－５８［ｏｎｌｉｎｅ］，日本，情報処理学会，2019年06月10日，p.1-8，ISSN:2188-8590

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

Ｇ１６Ｂ５／００－９９／００

Ｇ１６Ｃ１０／００－９９／００

Ｇ１６Ｈ１０／００－８０／００

Ｇ１６Ｚ９９／００

(57)【特許請求の範囲】

【請求項1】

体内持続性の予測対象の環状ペプチドから、前記環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す予測用特徴ベクトルの各々を抽出する抽出部と、
前記抽出部により抽出された複数の予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための予め学習された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する生成部と、
を含む予測装置。

【請求項2】

前記生成部は、複数の予測用特徴ベクトルの各々を、前記学習済みモデルへ入力し、前記学習済みモデルから出力された複数の特徴ベクトルの各々に対する前記予測対象の環状ペプチドの体内持続性の予測値の代表値を生成する、
請求項１に記載の予測装置。

【請求項3】

前記抽出部により抽出された予測用特徴ベクトルの長さが、所定長さとなるように調整する調整部を更に含み、
前記生成部は、前記調整部により長さが調整された複数の予測用特徴ベクトルを、前記学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する、
請求項１又は請求項２に記載の予測装置。

【請求項4】

前記調整部は、パディング法又は線形補間法による変換によって、前記予測用特徴ベクトルの長さを調整する、
請求項３に記載の予測装置。

【請求項5】

複数の学習用の環状ペプチドの各々から、前記学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す学習用特徴ベクトルを抽出する学習用抽出部と、
複数の学習用の環状ペプチドの各々について、前記学習用抽出部により抽出された複数の学習用特徴ベクトルと前記学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する学習部と、
を含む学習済みモデルの生成装置。

【請求項6】

前記学習用抽出部により抽出された、複数の学習用の環状ペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整する学習用調整部を更に含み、
前記学習部は、前記学習用調整部により長さが調整された前記学習用特徴ベクトルと前記学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、前記学習済みモデルを生成する、
請求項５に記載の学習済みモデルの生成装置。

【請求項7】

複数の学習用の環状ペプチドの各々から特徴を表す第１学習用特徴ベクトルを抽出する学習用抽出部と、
前記学習用抽出部により抽出された前記第１学習用特徴ベクトルの各々に対して、前記第１学習用特徴ベクトルの要素を巡回シフトさせることにより複数の第２学習用特徴ベクトルを生成し、前記第１学習用特徴ベクトル及び複数の前記第２学習用特徴ベクトルと学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データを生成する学習用データ生成部と、
前記学習用データ生成部により生成された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する学習部と、
を含む学習済みモデルの生成装置。

【請求項8】

体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出する抽出部と、
前記抽出部により抽出された前記予測用特徴ベクトルを、請求項７に記載の学習済みモデルの生成装置によって生成された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する生成部と、
を含む予測装置。

【請求項9】

複数の学習用の環状ペプチドの各々から抽出された特徴を表す学習用特徴ベクトルと複数の学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データに基づいて、前記学習用特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを用いて機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルを生成する学習部、
を含む学習済みモデルの生成装置。

【請求項10】

体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出する抽出部と、
前記抽出部により抽出された前記予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルの両端の要素を隣接させる両端隣接層を有する学習済み畳み込みニューラルネットワークモデルであって、かつ前記特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する生成部と、
を含む予測装置。

【請求項11】

体内持続性の予測対象のペプチドが取りうる配座を複数生成する配座生成部と、
所定の選定基準に基づいて、前記配座生成部により生成された複数の配座から、ドッキング計算を行う対象の配座を選定する選定部と、
前記選定部により選定された配座に対応する予測対象のペプチドと血漿タンパク質との間においてドッキング計算を行うことにより、前記予測対象のペプチドの体内持続性を予測する予測部と、
を含む予測装置。

【請求項12】

前記選定部は、
前記配座を取った場合の前記予測対象のペプチドの側鎖の長さ、
前記配座を取った場合の前記予測対象のペプチドの側鎖の直線度合い、
前記配座を取った場合の前記予測対象のペプチドの側鎖の付根部分の構造、
前記配座を取った場合の前記予測対象のペプチドの側鎖の先端部付近の３次元形状、及び
前記配座を取った場合の前記予測対象のペプチドの側鎖に含まれる荷電原子の有無の物理的条件の少なくとも１つに基づいて、複数の配座からドッキング計算を行う対象の配座を選定する、
請求項１１に記載の予測装置。

【請求項13】

体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドの体内持続性を表す第１の体内持続性の予測値を計算するドッキング計算部と、
前記予測対象のペプチドから抽出される特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記ペプチドの体内持続性を表す第２の体内持続性の予測値を生成する学習済みモデル予測部と、
前記ドッキング計算部によって生成された前記第１の体内持続性の予測値と、前記学習済みモデル予測部により生成された前記第２の体内持続性の予測値とを統合することにより、前記ペプチドの体内持続性を計算する計算部と、
を含む予測装置。

【請求項14】

体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドと前記血漿タンパク質との間のドッキングスコアを含むドッキングプロファイルを計算するドッキング計算部と、
前記ドッキング計算部により計算された前記ドッキングプロファイルを含む予測用特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する学習済みモデル予測部と、
を含む予測装置。

【請求項15】

前記ドッキングプロファイルには、前記ペプチドと前記血漿タンパク質のポケット内の各残基との間のドッキングスコア及び前記ペプチドと前記血漿タンパク質との間の全体ドッキングスコアの少なくとも一方が含まれる、
請求項１４に記載の予測装置。

【請求項16】

前記予測対象のペプチドから特徴を表す特徴量を抽出する抽出部を更に含み、
前記学習済みモデル予測部は、前記ドッキングプロファイルと前記抽出部により抽出された前記特徴量とを含む前記予測用特徴ベクトルを、前記学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する、
請求項１４又は請求項１５に記載の予測装置。

【請求項17】

複数の学習用のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記学習用のペプチドのドッキングスコアを含むドッキングプロファイルである学習用のドッキングプロファイルを計算する学習用ドッキング計算部と、
複数の前記学習用のペプチドの各々について、前記学習用ドッキング計算部により計算された学習用のドッキングプロファイルを含む学習用特徴ベクトルと前記学習用のペプチドの体内持続性の正解値との対を表す学習用データに基づいて、機械学習アルゴリズムを実行することにより、ペプチドのドッキング計算により得られるドッキングプロファイルを含む特徴ベクトルから、ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する学習部と、
を含む学習済みモデル生成装置。

【請求項18】

体内持続性の予測対象のペプチドから残基を抽出する抽出部と、
複数種類の残基の各々についての、前記残基と血漿タンパク質との間のドッキング計算結果を表すドッキングプロファイルが記憶された記憶部から、前記抽出部により抽出された前記残基に対応するドッキングプロファイルを読み出し、読み出した前記予測対象の残基のドッキングプロファイルを含む特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性を予測する学習済みモデル予測部と、
を含む予測装置。

【請求項19】

体内持続性の予測対象の環状ペプチドから、前記環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す予測用特徴ベクトルの各々を抽出し、
抽出された複数の予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための予め学習された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する、
処理をコンピュータが実行する予測方法。

【請求項20】

抽出された前記予測用特徴ベクトルの長さが、所定長さとなるように調整し、
長さが調整された前記予測用特徴ベクトルを、前記学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する、
請求項１９に記載の予測方法。

【請求項21】

複数の学習用の環状ペプチドの各々から、前記学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す学習用特徴ベクトルを抽出し、
複数の学習用の環状ペプチドの各々について、抽出された複数の学習用特徴ベクトルと前記学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。

【請求項22】

抽出された、複数の学習用の環状ペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整し、
長さが調整された前記学習用特徴ベクトルと前記学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、前記学習済みモデルを生成する、
請求項２１に記載の学習済みモデルの生成方法。

【請求項23】

複数の学習用の環状ペプチドの各々から特徴を表す第１学習用特徴ベクトルを抽出し、
抽出された前記第１学習用特徴ベクトルの各々に対して、前記第１学習用特徴ベクトルの要素を巡回シフトさせることにより複数の第２学習用特徴ベクトルを生成し、前記第１学習用特徴ベクトル及び複数の前記第２学習用特徴ベクトルと学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データを生成し、
生成された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。

【請求項24】

体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出し、
抽出された前記予測用特徴ベクトルを、請求項２３に記載の学習済みモデルの生成方法によって生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する、
処理をコンピュータが実行する予測方法。

【請求項25】

複数の学習用の環状ペプチドの各々から抽出された特徴を表す学習用特徴ベクトルと複数の学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データに基づいて、前記学習用特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを用いて機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。

【請求項26】

体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出し、
抽出された前記予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルの両端の要素を隣接させる両端隣接層を有する学習済み畳み込みニューラルネットワークモデルであって、かつ前記特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する、
処理をコンピュータが実行する予測方法。

【請求項27】

体内持続性の予測対象のペプチドが取りうる配座を複数生成し、
所定の選定基準に基づいて、生成された複数の配座から、ドッキング計算を行う対象の配座を選定し、
選定された配座に対応する予測対象のペプチドと血漿タンパク質との間においてドッキング計算を行うことにより、前記予測対象のペプチドの体内持続性を予測する、
処理をコンピュータが実行する予測方法。

【請求項28】

体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドの体内持続性を表す第１の体内持続性の予測値を計算し、
前記予測対象のペプチドから抽出される特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記ペプチドの体内持続性を表す第２の体内持続性の予測値を生成し、
生成された前記第１の体内持続性の予測値と、生成された前記第２の体内持続性の予測値とを統合することにより、前記ペプチドの体内持続性を計算する、
処理をコンピュータが実行する予測方法。

【請求項29】

体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドと前記血漿タンパク質との間のドッキングスコアを含むドッキングプロファイルを計算し、
計算された前記ドッキングプロファイルを含む予測用特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する、
処理をコンピュータが実行する予測方法。

【請求項30】

複数の学習用のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記学習用のペプチドのドッキングスコアを含むドッキングプロファイルである学習用のドッキングプロファイルを計算し、
複数の前記学習用のペプチドの各々について、計算された学習用のドッキングプロファイルを含む学習用特徴ベクトルと前記学習用のペプチドの体内持続性の正解値との対を表す学習用データに基づいて、機械学習アルゴリズムを実行することにより、ペプチドのドッキング計算により得られるドッキングプロファイルを含む特徴ベクトルから、ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。

【請求項31】

体内持続性の予測対象のペプチドから残基を抽出し、
複数種類の残基の各々についての、前記残基と血漿タンパク質との間のドッキング計算結果を表すドッキングプロファイルが記憶された記憶部から、抽出された前記残基に対応するドッキングプロファイルを読み出し、読み出した前記予測対象の残基のドッキングプロファイルを含む特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性を予測する、
処理をコンピュータが実行する予測方法。

【請求項32】

請求項１９、請求項２０、請求項２４、請求項２６、請求項２７、請求項２８、請求項２９、及び請求項３１の何れか１項に記載の予測方法の処理をコンピュータに実行させるための予測プログラム。

【請求項33】

請求項２１、請求項２２、請求項２３、請求項２５、及び請求項３０の何れか１項に記載の学習済みモデルの生成方法の処理をコンピュータに実行させるための学習済みモデルの生成プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラムに関する。

【背景技術】

【0002】

特許文献１には、生体高分子の構造解析において、次元集合に含まれるすべての指標次元それぞれを座標軸とする多次元空間において複数の構造のクラスタリングを行い、いずれのクラスタにも含まれないはずれ値となった構造を初期構造とする分子動力学シミュレーションを行うことが開示されている（例えば、請求項４）。

【0003】

特許文献２には、タンパク質の立体構造を予測するタンパク質立体構造予測プログラムが開示されている。このタンパク質立体構造予測プログラムを実行するコンピュータは、タンパク質のアミノ酸配列を読み込み、２次構造情報を予測する。次に、このコンピュータは、２次構造情報に基づいてターンを形成するアミノ酸の個数を算出し、算出されたアミノ酸の個数と２次構造情報とによって、存在確率の高いターンのターン構造情報を取得してターンを予測再現し、タンパク質の立体構造を予測する。

【0004】

また、特許文献３には、新生抗原のセットのそれぞれのペプチド配列を、機械学習させた提示モデルに入力することにより、患者についての新生抗原のセットについての数値的提示尤度のセットをそれぞれの患者について生成する方法が開示されている（例えば、請求項１）。

【0005】

また、特許文献４には、コンピュータのプロセッサを使用してペプチドの数値ベクトルをディープラーニング提示モデルに入力して、新生抗原のセットについての提示尤度のセットを生成する方法が開示されている（例えば、請求項１）。

【先行技術文献】

【特許文献】

【0006】

【文献】特開2017-37378号公報

【文献】国際公開第2003/054743号

【文献】特表2020-523010号公報

【文献】特表2020-519246号公報

【発明の概要】

【発明が解決しようとする課題】

【0007】

ところで、近年、中分子医薬の一つとしてペプチド医薬が注目されている。しかし、ペプチドの体内動態については不明な点が多い。特に、体内におけるペプチドの持続性（以下、単に「体内持続性」と称する）は、ペプチドが医薬品として採用される際の重要な要素である。このため、医薬として採用され得るペプチドがどの程度の体内持続性を有しているのか、といったことを精度良く予測することが求められている。

【0008】

この体内持続性は、アルブミンをはじめとする血漿中のタンパク質とペプチドとの間の結合率を表す血漿タンパク結合（Plasma Protein Binding:PPB）率が支配的な要素である。従来の低分子創薬においては、血漿タンパク結合率が高くなり過ぎないように薬剤の脂溶性を抑えることが主な課題であった。一方、ペプチド創薬においてはペプチドの血漿タンパク結合率が低く、好ましい体内持続性を保てないケースも多くみられるなど、従来の低分子創薬における体内持続性予測とは異なる課題が生じている。

【0009】

上記特許文献１～４に開示されている技術は、生体高分子の分子動力学シミュレーションを実行する技術、コンピュータによってタンパク質の立体構造を予測する技術、及び新生抗原に対して有効なペプチドを予測する技術であり、ペプチドの体内持続性を予測するものではない。このため、上記特許文献１～４の技術は、ペプチドの体内持続性を予測することはできない、という課題がある。

【0010】

本開示は上記事実を考慮して、ペプチドの体内持続性を予測することを目的とする。

【課題を解決するための手段】

【0011】

本開示の第１の態様の予測装置、予測方法、及び予測プログラムは、体内持続性の予測対象のペプチドから特徴を表す予測用特徴ベクトルを抽出し、抽出された前記予測用特徴ベクトルの長さが、所定長さとなるように調整し、長さが調整された前記予測用特徴ベクトルを、ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための予め学習された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する。

【0012】

本開示の第２の態様の学習済みモデルの生成装置、学習済みモデルの生成方法、及び学習済みモデルの生成プログラムは、複数の学習用のペプチドの各々から特徴を表す学習用特徴ベクトルを抽出し、抽出された、複数の学習用のペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整し、長さが調整された前記学習用特徴ベクトルと前記学習用のペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。

【0013】

本開示の第３の態様の予測装置、予測方法、及び予測プログラムは、体内持続性の予測対象の環状ペプチドから、前記環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す予測用特徴ベクトルの各々を抽出し、抽出された複数の予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための予め学習された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する。

【0014】

本開示の第４の態様の学習済みモデルの生成装置、学習済みモデルの生成方法、及び学習済みモデルの生成プログラムは、複数の学習用の環状ペプチドの各々から、前記学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す学習用特徴ベクトルを抽出し、複数の学習用の環状ペプチドの各々について、抽出された複数の学習用特徴ベクトルと前記学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。

【0015】

本開示の第５の態様の学習済みモデルの生成装置、学習済みモデルの生成方法、及び学習済みモデルの生成プログラムは、複数の学習用の環状ペプチドの各々から特徴を表す第１学習用特徴ベクトルを抽出し、抽出された前記第１学習用特徴ベクトルの各々に対して、前記第１学習用特徴ベクトルの要素を巡回シフトさせることにより複数の第２学習用特徴ベクトルを生成し、前記第１学習用特徴ベクトル及び複数の前記第２学習用特徴ベクトルと学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データを生成し、生成された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する

【0016】

本開示の第６の態様の予測装置、予測方法、及び予測プログラムは、体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出し、抽出された前記予測用特徴ベクトルを、第５の態様の学習済みモデルの生成装置、学習済みモデルの生成方法、及び学習済みモデルの生成プログラムによって生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する。

【0017】

本開示の第７の態様の学習済みモデルの生成装置、学習済みモデルの生成方法、及び学習済みモデルの生成プログラムは、複数の学習用の環状ペプチドの各々から抽出された特徴を表す学習用特徴ベクトルと複数の学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データに基づいて、前記学習用特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを用いて機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルを生成する。

【0018】

本開示の第８の態様の予測装置、予測方法、及び予測プログラムは、体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出し、抽出された前記予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルの両端の要素を隣接させる両端隣接層を有する学習済み畳み込みニューラルネットワークモデルであって、かつ前記特徴ベクトルからペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する。

【0019】

本開示の第９の態様の予測装置、予測方法、及び予測プログラムは、体内持続性の予測対象のペプチドが取りうる配座を複数生成し、所定の選定基準に基づいて、生成された複数の配座から、ドッキング計算を行う対象の配座を選定し、選定された配座に対応する予測対象のペプチドと血漿タンパク質との間においてドッキング計算を行うことにより、前記予測対象のペプチドの体内持続性の予測値を予測する。

【0020】

本開示の第１０の態様の予測装置、予測方法、及び予測プログラムは、体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドの体内持続性を表す第１の体内持続性の予測値を計算し、前記予測対象のペプチドから抽出される特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記ペプチドの体内持続性を表す第２の体内持続性の予測値を生成し、生成された前記第１の体内持続性の予測値と、生成された前記第２の体内持続性の予測値とを統合することにより、前記ペプチドの体内持続性の予測値を計算する。

【0021】

本開示の第１１の態様の予測装置、予測方法、及び予測プログラムは、体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドと前記血漿タンパク質との間のドッキングスコアを含むドッキングプロファイルを計算し、計算された前記ドッキングプロファイルを含む予測用特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する。

【0022】

本開示の第１２の態様の学習済みモデルの生成装置、学習済みモデルの生成方法、及び学習済みモデルの生成プログラムは、複数の学習用のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記学習用のペプチドのドッキングスコアを含むドッキングプロファイルである学習用のドッキングプロファイルを計算し、複数の前記学習用のペプチドの各々について、計算された学習用のドッキングプロファイルを含む学習用特徴ベクトルと前記学習用のペプチドの体内持続性の正解値との対を表す学習用データに基づいて、機械学習アルゴリズムを実行することにより、ペプチドのドッキング計算により得られるドッキングプロファイルを含む特徴ベクトルから、ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。

【0023】

本開示の第１３の態様の予測装置、予測方法、及び予測プログラムは、体内持続性の予測対象のペプチドから特徴量を抽出し、前記予測対象のペプチドが有する残基の種類を特定し、複数種類の残基の各々について前記残基のドッキング計算結果が記憶された記憶部から、特定された前記残基の種類に対応するドッキング計算結果を読み出し、読み出した前記予測対象の残基のドッキング計算結果と、抽出された特徴量とを含む予測用特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記ペプチドの体内持続性を予測する。

【発明の効果】

【0024】

本開示によれば、ペプチドの体内持続性を予測することができる、という効果が得られる。

【図面の簡単な説明】

【0025】

【図1】第１実施形態に係る予測装置を示すブロック図である。

【図2】データ記憶部１２に格納されるデータの一例を示す図である。

【図3A】環状ペプチドを説明するための図である。

【図3B】環状ペプチドの構造を説明するための図である。

【図4A】学習用データ記憶部１６に格納される学習用データの一例を示す図である。

【図4B】学習済みモデルを説明するための図である。

【図5】第１実施形態に係る予測装置を実現するコンピュータを示す図である。

【図6】第１実施形態に係る予測装置において実行される学習済みモデルの生成処理ルーチンの一例を示す図である。

【図7】第１実施形態に係る予測装置において実行される予測処理ルーチンの一例を示す図である。

【図8】第２実施形態に係る予測装置を示すブロック図である。

【図9】第２実施形態に係る予測装置において実行される学習済みモデルの生成処理ルーチンの一例を示す図である。

【図10】第２実施形態に係る予測装置において実行される予測処理ルーチンの一例を示す図である。

【図11】第３実施形態に係る予測装置を示すブロック図である。

【図12】第２学習用特徴ベクトルの生成を説明するための図である。

【図13】従来の畳み込みニューラルネットワークモデルの構成図である。

【図14】第４実施形態の畳み込みニューラルネットワークモデルの構成図である。

【図15】ペプチドと血漿タンパク質との結合の様子を表す図である。

【図16】ペプチドと血漿タンパク質との結合の様子を表す図である。

【図17】第５実施形態に係る予測装置を示すブロック図である。

【図18】第５実施形態に係る予測装置において実行される予測処理ルーチンの一例を示す図である。

【図19】第６実施形態に係る予測装置を示すブロック図である。

【図20】第７実施形態に係る予測装置を示すブロック図である。

【図21】第７実施形態に係る予測装置において実行される学習済みモデルの生成処理ルーチンの一例を示す図である。

【図22】第７実施形態に係る予測装置において実行される予測処理ルーチンの一例を示す図である。

【図23】第８実施形態に係る予測装置を示すブロック図である。

【図24】第８実施形態に係る予測装置において実行される予測処理ルーチンの一例を示す図である。

【発明を実施するための形態】

【0026】

以下、図面を参照して本発明の実施形態を詳細に説明する。

【0027】

［第１実施形態］

【0028】

図１は、第１実施形態に係る予測装置１０の構成の一例を示すブロック図である。予測装置１０は、機能的には、図１に示されるように、データ記憶部１２と、学習用抽出部１４と、学習用データ記憶部１６と、学習部１８と、学習済みモデル記憶部２０と、抽出部２２と、生成部２４とを備えている。

【0029】

本実施形態の予測装置１０は、環状ペプチドの体内持続性を予測する。

【0030】

データ記憶部１２には、学習用の環状ペプチドを表す学習用のペプチド情報と、学習用の環状ペプチドの体内持続性の正解値とが対応付けられて格納されている。なお、ペプチド情報は、ペプチドの構造式、ペプチドのＳＭＩＬＥＳ表記、ペプチドの一次構造、ペプチドの二次構造、ペプチドの三次構造、及びペプチドの四次構造のうちの少なくとも１つの情報が含まれている情報である。

【0031】

学習用の環状ペプチドの体内持続性の正解値は、例えば、学習用の環状ペプチドに対して既知の実験を行うことにより得られるデータである。図２に、データ記憶部１２に格納されるデータの一例を示す。図２に示されるように、学習用のペプチド情報と、当該学習用の環状ペプチドの体内持続性の正解値とが対応付けられてデータ記憶部１２に格納される。

【0032】

学習用抽出部１４は、データ記憶部１２に格納されている複数の学習用のペプチド情報の各々から、環状ペプチドの特徴を表す学習用特徴ベクトルを抽出する。なお、特徴ベクトルは、既知の手法によってペプチド情報から抽出される。

【0033】

図３Ａ及び図３Ｂに環状ペプチドの構造を説明するための図を示す。図３Ａは環状ペプチドの一例を示す図である。図３Ａに示されるように、環状ペプチドは複数の残基を備えており、それらの残基によって環が形成されている。また、図３Ｂは、環状ペプチドの構成を模式的に表した図である。図３Ｂに示されるような環状ペプチドから、環状ペプチド全体の特徴ベクトル及び残基毎の特徴ベクトルを抽出することで、環状ペプチドの特徴ベクトルを構成する際には、どの残基を環状配列の開始点とするのかによって特徴ベクトルの構成が異なるものとなる。

【0034】

例えば、図３Ｂに示される残基１を環状配列の開始点として特徴ベクトルを構成する場合には、残基１から抽出される特徴量Ｆ１を開始点とする特徴ベクトル［Ｆ１，Ｆ２，・・・，Ｆ８］が構成される。一方、残基８を環状配列の開始点として特徴ベクトルを構成する場合には、残基８から抽出される特徴量Ｆ８を開始点とする特徴ベクトル［Ｆ８，Ｆ１，Ｆ２，・・・，Ｆ７］が抽出される。

【0035】

このため、同一の環状ペプチドであっても、環状配列の開始点とする残基が異なる場合には特徴ベクトルが異なるものとなってしまう。この場合には、環状ペプチドの体内持続性を適切に予測することができない。

【0036】

そこで、本実施形態では、環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴ベクトルの各々を抽出し、それら複数の特徴ベクトルに基づいて体内持続性を予測する。

【0037】

具体的には、学習用抽出部１４は、複数の学習用の環状ペプチドのペプチド情報の各々から、学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す特徴ベクトルを抽出する。

【0038】

例えば、学習用抽出部１４は、図３Ｂに示される残基１を環状配列の開始点とした場合の特徴ベクトル１、残基２を環状配列の開始点とした場合の特徴ベクトル２、・・・、残基８を環状配列の開始点とした場合の特徴ベクトル８の各々を抽出する。

【0039】

学習用抽出部１４は、抽出された１つの特徴ベクトルを１つの学習用特徴ベクトルとして設定する。このため、１つの学習用の環状ペプチドから抽出された特徴ベクトルの集合は、学習用特徴ベクトルの集合に相当する。

【0040】

そして、学習用抽出部１４は、複数の学習用の環状ペプチドの各々について、学習用特徴ベクトルの集合と学習用のペプチドの体内持続性の正解値とを対応付けて、学習用データ記憶部１６へ格納する。

【0041】

学習用データ記憶部１６には、複数の学習用データが格納される。１つの学習用データは、学習用特徴ベクトルと学習用のペプチドの体内持続性の正解値との対である。図４Ａに、学習用データ記憶部１６に格納される学習用データの一例を示す。図４Ａに示されるように、学習用特徴ベクトルと、当該学習用のペプチドの体内持続性の正解値とが対応付けられて学習用データ記憶部１６に格納される。この学習用データは、後述する学習済みモデルの生成に用いられる。なお、例えば、図４Ａの例における、複数の学習用特徴ベクトルＦｖ１，Ｆｖ２，・・・は、環状配列の開始点を異ならせることにより得られた学習用特徴ベクトルである。

【0042】

学習部１８は、学習用データ記憶部１６に格納された複数の学習用データに基づいて、既知の教師あり機械学習アルゴリズムを実行することにより、特徴ベクトルからペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。そして、学習部１８は、学習済みモデルを学習済みモデル記憶部２０へ格納する。なお、学習済みモデル自体は既知のモデルであり、例えば、ニューラルネットワークモデル、サポートベクターマシン、又はロジスティック回帰モデル等である。なお、ニューラルネットワークモデルには、深層学習により得られるディープニューラルネットワークモデルも含まれる。

【0043】

図４Ｂに、学習済みモデルを説明するための図を示す。図４Ｂに示されるように、体内持続性の予測対象の環状ペプチドから抽出された特徴ベクトルが学習済みモデルへ入力されると、予測対象の環状ペプチドの体内持続性の予測値が出力される。

【0044】

なお、後述するように、体内持続性の予測対象の環状ペプチドからも、環状配列の開始点を異ならせることにより複数の特徴ベクトルが抽出される。それら複数の特徴ベクトルの各々を学習済みモデルへ入力することにより、複数の特徴ベクトルの各々に対応する体内持続性の予測値が得られる。

【0045】

学習済みモデル記憶部２０には、学習部１８により生成された学習済みモデルが格納される。なお、学習済みモデルは、モデルの構造と学習済みのパラメータとが対応付けられたデータである。

【0046】

抽出部２２は、体内持続性の予測対象の環状ペプチドから特徴を表す特徴ベクトルを抽出する。具体的には、抽出部２２は、体内持続性の予測対象の環状ペプチドのペプチド情報から、環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す特徴ベクトル（以下、予測用特徴ベクトルと称する。）の各々を抽出する。

【0047】

生成部２４は、抽出部２２により得られた複数の予測用特徴ベクトルを、学習済みモデル記憶部２０に格納された学習済みモデルへ入力することにより、予測対象の環状ペプチドの体内持続性の予測値を生成する。

【0048】

具体的には、生成部２４は、抽出部２２により得られた複数の予測用特徴ベクトルの各々を学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値の各々を生成する。ここで、１つの予測値は１つの予測用特徴ベクトルに対応する。そして、生成部２４は、複数の予測値の代表値を生成することにより、その代表値を予測対象のペプチドの体内持続性とする。例えば、生成部２４は、複数の予測値の平均値を代表値として生成する。または、生成部２４は、複数の予測値の最大値又は最小値を代表値として生成する。

【0049】

なお、生成部２４により生成された体内持続性の代表値又は複数の予測値は、表示部（図示省略）に表示される。

【0050】

このように、第１実施形態の予測装置１０は、環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴ベクトルの各々を抽出し、それら複数の特徴ベクトルに基づいて体内持続性を予測する。これにより、環状ペプチドの回転対称性を考慮した複数の特徴ベクトルが得られ、それらの特徴ベクトルに基づき、環状ペプチドの体内持続性を適切に予測することができる。

【0051】

予測装置１０は、例えば、図５に示すようなコンピュータ５０によって実現することができる。予測装置１０を実現するコンピュータ５０は、ＣＰＵ５１、一時記憶領域としてのメモリ５２、及び不揮発性の記憶部５３を備える。また、コンピュータは、入出力装置等（図示省略）が接続される入出力interface（Ｉ／Ｆ）５４、及び記録媒体５９に対するデータの読み込み及び書き込みを制御するread/write（Ｒ／Ｗ）部５５を備える。また、コンピュータは、インターネット等のネットワークに接続されるネットワークＩ／Ｆ５６を備える。ＣＰＵ５１、メモリ５２、記憶部５３、入出力Ｉ／Ｆ５４、Ｒ／Ｗ部５５、及びネットワークＩ／Ｆ５６は、バス５７を介して互いに接続される。

【0052】

記憶部５３は、Hard Disk Drive（ＨＤＤ）、Solid State Drive（ＳＳＤ）、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部５３には、コンピュータを機能させるためのプログラムが記憶されている。ＣＰＵ５１は、プログラムを記憶部５３から読み出してメモリ５２に展開し、プログラムが有するプロセスを順次実行する。

【0053】

次に、第１実施形態の予測装置１０の作用について説明する。

【0054】

予測装置１０は、学習済みモデルの生成処理の指示を表す指示信号を受け付けると、図６に示される学習済みモデルの生成処理ルーチンを実行する。

【0055】

ステップＳ１００において、学習用抽出部１４は、複数の学習用の環状ペプチドのペプチド情報の各々から、学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す学習用特徴ベクトルを抽出する。

【0056】

ステップＳ１０２において、学習用抽出部１４は、上記ステップＳ１００で抽出された学習用特徴ベクトルの集合と学習用の環状ペプチドの体内持続性の正解値とを対応付けて学習用データを生成し、学習用データ記憶部１６へ一旦格納する。

【0057】

ステップＳ１０４において、学習部１８は、学習用データ記憶部１６に格納された複数の学習用データに基づいて、既知の教師あり機械学習アルゴリズムを実行することにより、特徴ベクトルからペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。

【0058】

ステップＳ１０６において、学習部１８は、上記ステップＳ１０４で生成された学習済みモデルを学習済みモデル記憶部２０へ格納する。

【0059】

学習済みモデル記憶部２０に学習済みモデルが格納され、体内持続性の予測対象のペプチド情報が予測装置１０へ入力されると、予測装置１０は図７に示される予測処理ルーチンを実行する。

【0060】

ステップＳ２００において、抽出部２２は、体内持続性の予測対象のペプチド情報を受け付ける。

【0061】

ステップＳ２０２において、抽出部２２は、上記ステップＳ２００で受け付けたペプチド情報から、環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す予測用特徴ベクトルの各々を抽出する。

【0062】

ステップＳ２０４において、生成部２４は、上記ステップＳ２０２で抽出された複数の予測用特徴ベクトルの各々を、学習済みモデル記憶部２０に格納された学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を複数生成する。

【0063】

ステップＳ２０６において、生成部２４は、上記ステップＳ２０４で生成された複数の予測値の各々から代表値を生成する。

【0064】

ステップＳ２０８において、生成部２４は、上記ステップＳ２０６で生成された体内持続性の予測値の代表値を結果として出力する。

【0065】

以上詳細に説明したように、第１実施形態の予測装置は、複数の学習用の環状ペプチドの各々から、学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す学習用特徴ベクトルの集合を抽出する。そして、予測装置は、複数の学習用の環状ペプチドの各々について、抽出された複数の学習用特徴ベクトルと学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。これにより、環状ペプチドの体内持続性を予測するための学習済みモデルを得ることができる。なお、この学習済みモデルは、複数の残基の各々を環状配列の開始点とした場合の学習用特徴ベクトルに基づき学習されているため、環状ペプチドの体内持続性の予測に適したモデルとなっている。

【0066】

また、第１実施形態の予測装置は、体内持続性の予測対象の環状ペプチドから、環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す特徴ベクトルの各々を抽出する。そして、予測装置は、複数の特徴ベクトルを学習済みモデルへ入力することにより、予測対象の環状ペプチドの体内持続性の予測値を生成する。これにより、環状ペプチドの体内持続性を予測することができる。具体的には、上述したように、学習済みモデルは、複数の残基の各々を環状配列の開始点とした場合の学習用特徴ベクトルに基づき学習されているため、環状ペプチドの体内持続性の予測に適したモデルとなっている。このため、環状ペプチドの構造を考慮して体内持続性の予測値を生成することができる。

【0067】

［第２実施形態］

【0068】

次に、第２実施形態について説明する。第２実施形態の予測装置は、複数の特徴ベクトルの長さを揃える点が第１実施形態と異なる。なお、第１実施形態では環状ペプチドを対象とする場合を例に説明したが、第２実施形態では環状ペプチドに限らず直鎖状のペプチドも対象とする。また、第２実施形態に係る予測装置の構成のうちの第１実施形態の予測装置と同様の部分は、同一符号を付して説明を省略する。

【0069】

図８は、第２実施形態に係る予測装置２１０の構成の一例を示すブロック図である。予測装置２１０は、機能的には、図８に示されるように、データ記憶部１２と、学習用抽出部１４と、学習用データ記憶部１６と、学習用調整部１５と、学習部１８と、学習済みモデル記憶部２０と、抽出部２２と、調整部２３と、生成部２４とを備えている。

【0070】

学習用調整部１５は、学習用抽出部１４により抽出された複数の学習用のペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整する。

【0071】

ペプチドは複数の残基を備えている。このため、残基の数が異なるペプチド間においては、特徴ベクトルの長さが異なるものとなる。具体的には、特徴ベクトルの要素の数が残基の数に応じたものとなるため、残基の数が異なるペプチド間においては、特徴ベクトルの長さが異なるということになる。なお、ニューラルネットワークモデル等の学習モデルに入力される特徴ベクトルの長さは一定であることが好ましい。例えば、特徴ベクトルの要素の数が１０である場合には、学習モデルの一例であるニューラルネットワークモデルの入力層のノードの数は１０である必要があるといった対応が求められる。

【0072】

このため、複数のペプチドの各々から抽出される特徴ベクトルの長さが異なる場合には、何らかの適切な処置を取らない限り、ニューラルネットワークモデル等の機械学習アルゴリズムを用いて学習済みモデルを構築することができず、またそのような学習済みモデルを用いてペプチドの体内持続性を予測することもできない。

【0073】

そこで、第２実施形態の予測装置は、ペプチドから抽出される特徴ベクトルの長さを揃えることにより、それらの特徴ベクトルを用いて機械学習アルゴリズムによる学習を可能なようにする。さらに、学習によって得られた学習済みモデルを用いてペプチドの体内持続性を予測可能なようにする。

【0074】

具体的には、例えば、学習用調整部１５は、複数の学習用特徴ベクトルのうちの最大長さの学習用特徴ベクトルを特定し、他の複数の学習用特徴ベクトルの長さが最大長さとなるように調整する。または、例えば、学習用調整部１５は、複数の学習用特徴ベクトルの各々の長さが所定長さとなるように調整する。なお、この場合の所定長さは、予めユーザによって設定される。

【0075】

例えば、学習用調整部１５は、既知のパディング法による変換によって学習用特徴ベクトルの長さを揃える。パディング法は、対象のうちの空いている箇所に対して代替となる値等を埋める方法である。このため、例えば、学習用調整部１５は、学習用特徴ベクトルが［0.13,0.45,0.82］でありその長さが３であった場合、所定長さが５であるときにはパディング法により［0.00,0.13,0.45,0.82,0.00］とすることにより、長さ５の学習用特徴ベクトルを生成する。なお、学習用調整部１５は、学習用特徴ベクトルの長さを調整する際に、長さ調整前の残基数等、長さ調整前の情報をその要素として追加するようにしてもよい。

【0076】

または、例えば、学習用調整部１５は、線形補間法による変換によって学習用特徴ベクトルの長さを揃える。具体的には、学習用調整部１５は、学習用特徴ベクトルの要素である特徴量ｘ’を、以下の式（１）に従って算出する。

【0077】

【数1】

（１）

【0078】

学習用調整部１５は、上記式（１）に従って、残基長ｋのペプチドから得られる長さｋの学習用特徴ベクトルを、長さｍの学習用特徴ベクトルへと変換する。なお、ｘ_ｉは変換前の学習用特徴ベクトルｘのｉ番目の要素に位置する特徴量であり、ｘ’_ｊは変換後の学習用特徴ベクトルｘ’のｊ番目の要素に位置する特徴量である。これにより、複数の学習用特徴ベクトルの長さが揃えられることになる。

【0079】

そして、学習用調整部１５は、長さが揃えられた学習用特徴ベクトルと学習用のペプチドの体内持続性の正解値とを対応付けて、学習用データ記憶部１６へ格納する。

【0080】

学習用データ記憶部１６には、複数の学習用データが格納される。

【0081】

学習部１８は、学習用データ記憶部１６に格納された複数の学習用データに基づいて、既知の教師あり機械学習アルゴリズムを実行することにより、特徴ベクトルからペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。そして、学習部１８は、学習済みモデルを学習済みモデル記憶部２０へ格納する。

【0082】

学習済みモデル記憶部２０には、学習部１８により生成された学習済みモデルが格納される。

【0083】

抽出部２２は、体内持続性の予測対象のペプチドから特徴を表す予測用特徴ベクトルを抽出する。

【0084】

調整部２３は、抽出部２２により抽出された予測用特徴ベクトルの長さが、学習用データと同一の所定長さとなるように調整する。具体的には、調整部２３は、上記の学習用調整部１５と同様の手法によって予測用特徴ベクトルの長さを調整する。

【0085】

生成部２４は、調整部２３により長さが調整された予測用特徴ベクトルを、学習済みモデル記憶部２０に格納された学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。

【0086】

なお、生成部２４により生成された体内持続性の予測値は、表示部（図示省略）に表示される。

【0087】

次に、第２実施形態の予測装置２１０の作用について説明する。

【0088】

予測装置２１０は、学習済みモデルの生成処理の指示を表す指示信号を受け付けると、図９に示される学習済みモデルの生成処理ルーチンを実行する。

【0089】

ステップＳ３００において、学習用抽出部１４は、データ記憶部１２に格納されている複数の学習用のペプチド情報の各々から、学習用のペプチドの特徴を表す学習用特徴ベクトルを抽出する。

【0090】

ステップＳ３０２において、学習用調整部１５は、上記ステップＳ３００で抽出された複数の学習用のペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整する。

【0091】

ステップＳ３０４において、学習用調整部１５は、上記ステップＳ３０２で長さが揃えられた学習用特徴ベクトルと学習用のペプチドの体内持続性の正解値とを対応付けて学習用データを生成し、学習用データ記憶部１６へ一旦格納する。

【0092】

ステップＳ３０６において、学習部１８は、学習用データ記憶部１６に格納された複数の学習用データに基づいて、既知の教師あり機械学習アルゴリズムを実行することにより、ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。

【0093】

ステップＳ３０８において、学習部１８は、上記ステップＳ３０６で生成された学習済みモデルを学習済みモデル記憶部２０へ格納する。

【0094】

学習済みモデル記憶部２０に学習済みモデルが格納され、体内持続性の予測対象のペプチド情報が予測装置２１０へ入力されると、予測装置２１０は図１０に示される予測処理ルーチンを実行する。

【0095】

ステップＳ４００において、抽出部２２は、体内持続性の予測対象のペプチド情報を受け付ける。

【0096】

ステップＳ４０２において、抽出部２２は、上記ステップＳ４００で受け付けたペプチド情報から予測用特徴ベクトルを抽出する。

【0097】

ステップＳ４０４において、調整部２３は、上記ステップＳ４０２で抽出された予測用特徴ベクトルの長さが、所定長さとなるように調整する。

【0098】

ステップＳ４０６において、生成部２４は、上記ステップＳ４０４で長さが調整された予測用特徴ベクトルを、学習済みモデル記憶部２０に格納された学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。

【0099】

ステップＳ４０８において、生成部２４は、上記ステップＳ４０６で生成された体内持続性の予測値を結果として出力する。

【0100】

以上詳細に説明したように、第２実施形態の予測装置は、複数の学習用のペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整する。そして、予測装置は、長さが調整された学習用特徴ベクトルと学習用のペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、ペプチドから抽出される特徴ベクトルからペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。これにより、複数の残基から構成されるペプチド間において、その残基の数が異なる場合であっても、ペプチドの体内持続性を予測するための学習済みモデルを得ることができる。

【0101】

また、第２実施形態の予測装置は、体内持続性の予測対象のペプチドから抽出された特徴ベクトルの長さが所定長さとなるように調整し、長さが調整された特徴ベクトルを学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。これにより、複数の残基から構成されるペプチド間において、その残基の数が異なる場合であってもペプチドの体内持続性を予測することができる。

【0102】

［第３実施形態］

【0103】

次に、第３実施形態について説明する。第３実施形態の予測装置は、環状ペプチドの構造上の性質に注目したデータオーギュメンテーションによって学習用データを増加させ、増加させた学習用データに基づいて学習済みモデルを生成する点が第１及び第２実施形態と異なる。なお、第３実施形態に係る予測装置の構成のうちの第１又は第２実施形態の予測装置と同様の部分は、同一符号を付して説明を省略する。

【0104】

第３実施形態の予測装置は、学習用特徴ベクトルを増加させる際に、第２実施形態と同様の長さ調整を行った後の学習用特徴ベクトルの要素を巡回シフトさせることにより、複数の学習用特徴ベクトルを生成する。これにより、環状ペプチドの構成上の特徴を考慮しつつ学習用データを増加させることができる。

【0105】

図１１は、第３実施形態に係る予測装置３１０の構成の一例を示すブロック図である。予測装置３１０は、機能的には、図１１に示されるように、データ記憶部１２と、学習用抽出部１４と、学習用データ記憶部１６と、学習用データ生成部３１５と、学習部１８と、学習済みモデル記憶部２０と、抽出部２２と、生成部２４とを備えている。

【0106】

第３実施形態の学習用抽出部１４は、複数の学習用の環状ペプチドのペプチド情報の各々から、学習用の環状ペプチドの特徴を表す第１学習用特徴ベクトルの集合を抽出する。

【0107】

具体的には、まず、学習用データ生成部３１５は、第２実施形態と同様に、複数の第１学習用特徴ベクトルの長さを所定長さに揃える。次に、学習用データ生成部３１５は、学習用抽出部１４により抽出された第１学習用特徴ベクトルの集合に含まれる第１学習用特徴ベクトルの各々に対して、第１学習用特徴ベクトルの要素を巡回シフトさせることにより第２学習用特徴ベクトルの集合を生成する。

【0108】

図１２に第２学習用特徴ベクトルの生成を説明するための図を示す。図１２における「１」等の番号は、特徴ベクトルにおける要素の位置を表す。図１２に示される例では、例えば、ある環状ペプチドの１番目の残基から特徴量Ｂが抽出され、２番目の残基から特徴量Ｃが抽出され、３番目の残基から特徴量Ｄが抽出され、４番目の残基から特徴量Ｅが抽出される。そして、長さ４の特徴ベクトルを長さ６の特徴ベクトルとするために、番号１の箇所に特徴量Ａが挿入され、番号６の箇所に特徴量Ｆが挿入される。このようにして、要素Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｆが第１学習用特徴ベクトルの要素となる。

【0109】

次に、学習用データ生成部３１５は、図１２に示されるように、第１学習用特徴ベクトルの要素Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｆを距離１だけ左に巡回シフトさせることにより、第２学習用特徴ベクトル［Ｂ，Ｃ，Ｄ，Ｅ，Ｆ，Ａ］を生成する。また、同様に、第１学習用特徴ベクトルの要素Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｆを距離２だけ左に巡回シフトさせることにより、第２学習用特徴ベクトル［Ｃ，Ｄ，Ｅ，Ｆ，Ａ，Ｂ］が生成される。この処理は、文字列又はビット列におけるローテーション処理と同様に、前後の順序は変えずに配列上の位置を一定距離だけずらして配置し、端点での回り込みを表現する処理である。このような処理により、１つの環状ペプチドから、第１学習用特徴ベクトル及び複数の第２学習用特徴ベクトルが得られ、これらは学習用データとして用いることが可能となる。

【0110】

学習用データ生成部３１５は、第１学習用特徴ベクトルの集合及び第２学習用特徴ベクトルの集合と、学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データを生成する。そして、学習用データ生成部３１５は、生成した複数の学習用データを学習用データ記憶部１６へ格納する。

【0111】

学習部１８は、学習用データ記憶部１６に格納された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。

【0112】

なお、第３実施形態の予測装置３１０の他の構成及び作用については、第１実施形態又は第２実施形態と同様であるため、説明を省略する。

【0113】

以上説明したように、第３実施形態の予測装置は、複数の学習用の環状ペプチドの各々から特徴を表す第１学習用特徴ベクトルを抽出する。予測装置は、第１学習用特徴ベクトルの各々に対して、第１学習用特徴ベクトルの長さを所定長さに調整した後に、第１学習用特徴ベクトルの要素を巡回シフトさせることにより第２学習用特徴ベクトルの集合を生成し、第１学習用特徴ベクトルの集合及び第２学習用特徴ベクトルの集合と学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データを生成する。そして、予測装置は、生成された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。これにより、環状ペプチドの構成上の特徴を考慮しつつ学習用データを増加させることができる。また、環状ペプチドの構成を考慮して生成された多くの学習用データに基づいて学習済みモデルを得ることができる。

【0114】

［第４実施形態］

【0115】

次に、第４実施形態について説明する。第４実施形態の予測装置は、環状ペプチドの構造上の性質に対応するために特徴ベクトルの両端の要素を隣接させる層を有する畳み込みニューラルネットワークモデルを用いて、環状ペプチドの体内持続性の予測値を生成する点が第１～第３実施形態と異なる。なお、第４実施形態に係る予測装置の構成のうちの第１～第３実施形態の何れかの予測装置と同様の部分は、同一符号を付して説明を省略する。

【0116】

環状ペプチドから抽出される特徴ベクトルは、環状ペプチドを構成する残基の環を表現する必要がある。この点、ベクトルは要素を単に一次元的に並べたものであり開始端と終端が生じてしまうため、環状ペプチドのうちの残基の環としての連続性が適切に表現されていないとも考えられる。

【0117】

そこで、第４実施形態の予測装置は、特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを用いて、環状ペプチドの体内持続性の予測値を生成する。これにより、環状ペプチドの残基の構成が畳み込みニューラルネットワークモデル内において表現される。

【0118】

図１３は、従来の畳み込みニューラルネットワークモデルの構成図である。図１３に示されるように、従来の畳み込みニューラルネットワークモデルＣＮＮ１は、入力層Ｉと、畳み込み層Ｃｖと、を備えている。なお、他の畳み込み層及びプーリング層等の図示は省略されている。図１３に示されるように、入力層Ｉに特徴ベクトル［０，Ａ，Ｂ，Ｃ，０］が入力された場合、畳み込み層Ｃｖにおいて畳み込み処理が行われ、特徴ベクトルから［０，Ａ，Ｂ］、［Ａ，Ｂ，Ｃ］、［Ｂ，Ｃ，０］が抽出される。しかし、従来の畳み込みニューラルネットワークモデルＣＮＮ１では、入力された特徴ベクトルに対して単に畳み込み処理がなされるのみで、特徴ベクトルが抽出された環状ペプチドの構造は考慮されていない。

【0119】

これに対し、第４実施形態の畳み込みニューラルネットワークモデルでは、環状ペプチドの構造上の特徴を考慮した層を備える。図１４は、第４実施形態の畳み込みニューラルネットワークモデルの構成図である。図１４に示されるように、第４実施形態の畳み込みニューラルネットワークモデルＣＮＮ２は、入力層Ｉと、畳み込み層Ｃｖと、両端隣接層Ｉ’とを備えている。両端隣接層Ｉ’は、特徴ベクトルの両端の要素を左右に再度配置し隣接させる層である。具体的には、図１４に示されるように、Ａの左隣にＣが隣接され、Ｃの右隣にＡが隣接している。これにより、環状ペプチドの残基の環が表現される。

【0120】

第４実施形態の学習部１８は、複数の学習用データに基づいて、学習用特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを学習させることにより、特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルを生成する。そして、学習部１８は、学習済みの畳み込みニューラルネットワークモデルを学習済みモデル記憶部２０に格納する。

【0121】

第４実施形態の生成部２４は、体内持続性の予測対象の環状ペプチドから抽出された特徴ベクトルを、学習済みモデル記憶部２０に格納された学習済み畳み込みニューラルネットワークモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。

【0122】

なお、第４実施形態の予測装置の他の構成及び作用については、第１～第３実施形態の何れかの予測装置と同様であるため、説明を省略する。

【0123】

以上説明したように、第４実施形態の予測装置は、複数の学習用データに基づいて、学習用特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを学習させることにより、特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルを生成する。これにより、環状ペプチドの構成上の特徴を考慮した学習済みの畳み込みニューラルネットワークモデルを得ることができる。

【0124】

また、予測装置は、体内持続性の予測対象の環状ペプチドから抽出された特徴ベクトルを、特徴ベクトルの両端の要素を隣接させる両端隣接層を有する学習済み畳み込みニューラルネットワークモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。これにより、環状ペプチドの構成上の特徴を考慮した体内持続性の予測値を得ることができる。

【0125】

［第５実施形態］

【0126】

次に、第５実施形態について説明する。第５実施形態の予測装置は、ペプチドと血漿タンパク質とのドッキング計算を実行することにより、ペプチドの体内持続性の予測値を生成する点が第１～第４実施形態と異なる。なお、第５実施形態に係る予測装置の構成のうちの第１～第４実施形態の何れかの予測装置と同様の部分は、同一符号を付して説明を省略する。

【0127】

図１５は、血漿タンパク質の一例であるヒト血清アルブミンＡＬと、ペプチドの一例であるダルババンシンＤＡとの結合を表す模式図である。なお、図１５に関連する研究成果は、参考文献１に開示されている。

【0128】

参考文献１：Sho Ito, Akinobu Senoo, Satoru Nagatoishi, Masahito Ohue, Masaki Yamamoto, Kouhei Tsumoto, and Naoki Wakui, "Structural Basis for the Binding Mechanism of Human Serum Albumin Complexed with Cyclic Peptide Dalbavancin", J. Med. Chem. 2020, 63, 22, 14045-14053, Publication Date:November 13, 2020

【0129】

また、図１６は、図１５におけるヒト血清アルブミンＡＬとダルババンシンＤＡとの結合部分の拡大図である。図１６に示されるように、ダルババンシンＤＡの側鎖ＳＣは、ヒト血清アルブミンＡＬの疎水性ポケットＨに挿さるような状態となっていることが分かる。また、ダルババンシンＤＡの環状部Ｒは、ヒト血清アルブミンＡＬに覆いかぶさるような状態となっていることが分かる。

【0130】

このように、ヒト血清アルブミンＡＬとダルババンシンＤＡとの１つの結合形態は、図１５及び図１６のような結合形態であることから、ダルババンシンＤＡが取り得る配座の中に、側鎖ＳＣの状態、側鎖ＳＣの先端部Ｔの状態、及び側鎖ＳＣの付根部分ＲＴの状態等がヒト血清アルブミンＡＬへの結合に適した配座が含まれていることが、体内持続性の因子であったと予想される。

【0131】

そこで、第５実施形態の予測装置は、体内持続性の予測対象のペプチドが取りうる配座を複数生成し、それら複数の配座の各々について、ペプチドと血漿タンパク質との間において既知のドッキング計算を行う。

【0132】

なお、本実施形態では、生成した複数の配座から血漿タンパク質との結合の可能性が高い配座を選択し、選択された配座についてのみドッキング計算を実行する。これにより、ペプチドが取り得る全ての配座についてドッキング計算を行うことなく、血漿タンパク質との結合の可能性が高い配座についてのみドッキング計算を行うことが可能となる。このため、ドッキング計算を効率的に実行することができ、結果として、体内持続性の予測対象のペプチドの体内持続性を効率的に得ることができる。

【0133】

図１７は、第５実施形態に係る予測装置５１０の構成の一例を示すブロック図である。予測装置５１０は、機能的には、図１７に示されるように、ドッキング計算用データ記憶部３０と、配座生成部３２と、選定部３３と、予測部３４とを備えている。

【0134】

ドッキング計算用データ記憶部３０には、ドッキング計算を実行するための各種データが格納されている。後述する配座生成部３２、選定部３３、及び予測部３４は、ドッキング計算用データ記憶部３０に格納されている各種データに基づいて、ドッキング計算を実行すると共に、体内持続性を予測する。なお、ドッキング計算用データ記憶部３０には、ドッキング計算によって得られたデータも格納される。

【0135】

配座生成部３２は、体内持続性の予測対象のペプチドが取りうる配座を複数生成する。具体的には、配座生成部３２は、ドッキング計算用データ記憶部３０に格納されている、体内持続性の予測対象のペプチドのペプチド情報を取得する。そして、配座生成部３２は、ペプチド情報に含まれている各種情報（ペプチドの一次構造、ペプチドの二次構造、又はペプチドの三次構造）に基づいて、ペプチドが取りうる仮想的な配座を複数生成する。

【0136】

選定部３３は、所定の選定基準に基づいて、配座生成部３２により生成された複数の配座から、ドッキング計算を行う対象の配座を選定する。

【0137】

具体的には、まず、選定部３３は、配座生成部３２により生成された複数の配座から、血漿タンパク質と結合する可能性が高い配座を選定する。

【0138】

上記図１６に示されるように、ダルババンシンＤＡとヒト血清アルブミンＡＬとの結合形態の１つとして、ダルババンシンＤＡの側鎖ＳＣがヒト血清アルブミンＡＬの疎水性ポケットＨに挿さるような状態となる場合がある。このため、ペプチドの側鎖の長さは体内持続性の因子であるとも考えられる。また、ペプチドの側鎖の直線度合いも体内持続性の重要な因子であるとも考えられる。

【0139】

また、上記図１６に示される例では、ダルババンシンＤＡの環状部Ｒがヒト血清アルブミンＡＬに覆いかぶさるような状態となっているため、ペプチドの側鎖の付根部分ＲＴの構造も体内持続性の重要な因子であるとも考えられる。

【0140】

また、上記図１６に示されるように、ダルババンシンＤＡの側鎖ＳＣの先端部分Ｔの３次元形状も、ヒト血清アルブミンＡＬの疎水性ポケットＨの最深部の形状に対応し得るため、ペプチドの側鎖の先端部分の３次元形状も、体内持続性の重要な因子であるとも考えられる。また、ヒト血清アルブミンＡＬの疎水性ポケットＨは荷電原子を好まないため、側鎖に含まれる荷電原子の有無等の物理的条件も重要であるとも考えられる。

【0141】

そこで、例えば、選定部３３は、配座生成部３２により生成された複数の配座から、血漿タンパク質と結合する可能性が高い配座として、ペプチドの側鎖の長さが所定値以上であるペプチドの配座を選定する。

【0142】

また、例えば、選定部３３は、配座生成部３２により生成された複数の配座から、血漿タンパク質と結合する可能性が高い配座として、ペプチドの側鎖の直線度合いが所定度合い以上であるペプチドの配座を選定する。なお、例えば、図１６に示されるような、ペプチドの複数の原子Ｎの座標に基づき最小二乗法等によって得られた近似直線と、ペプチドの複数の原子Ｎの座標との間の差分の総和が小さいほど、ペプチドの側鎖の直線度合いが高いものとして、側鎖の直線度合いを計算するようにしてもよい。

【0143】

また、例えば、選定部３３は、配座生成部３２により生成された複数の配座から、血漿タンパク質と結合する可能性が高い配座として、ペプチドの側鎖の付根部分ＲＴの各原子が広がっているペプチドの配座を選定する。例えば、選定部３３は、ペプチドの側鎖の付根部分ＲＴの各原子Ｎの座標の分散が所定値以上であるペプチドの配座を選定する。

【0144】

また、例えば、選定部３３は、配座生成部３２により生成された複数の配座から、血漿タンパク質と結合する可能性が高い配座として、ペプチドの側鎖の先端部Ｔの各原子が広がっているペプチドの配座を選定する。例えば、選定部３３は、ペプチドの側鎖の先端部Ｔの各原子Ｎの座標の分散が所定値以上であるペプチドの配座を選定する。

【0145】

また、例えば、選定部３３は、配座生成部３２により生成された複数の配座から、血漿タンパク質と結合する可能性が高い配座として、ペプチドの側鎖に含まれる荷電原子の有無等を表す物理的条件を満たす配座を選定する。例えば、図１６の例においては、ペプチドの側鎖に荷電原子が含まれている場合には、血漿タンパク質と結合する可能性が低いと考えられるためである。

【0146】

選定部３３は、配座生成部３２により生成された複数の配座から、上述のような選定基準を満たす配座を選定する。なお、選定部３３は、上述のような選定基準を満たす配座から、更に配座を選定するようにしてもよい。

【0147】

例えば、上述のような選定基準を満たす複数の配座が同じような配座である場合には、配座の多様性が低いため、それらを選定しドッキング計算を実行したとしても同じような結果となることが予想される。

【0148】

そのため、例えば、選定部３３は、上述のような選定基準を満たす複数の配座から、なるべく多様性のある配座を選定するために、上述のような選定基準を満たす各配座間の原子間距離の平均二乗偏差ＲＭＳＤ（Root Mean Square Deviation）値を計算する。なお、ペプチドの全原子を用いるのではなく、例えばペプチドの複数の原子を選択して、これらのみに基づいてＲＭＳＤ値を計算しても良い。そして、選定部３３は、ＲＭＳＤ値に基づいて既知の手法によるクラスタリングを行い、各クラスタから１つ以上の配座をさらに選定する。これにより、多様性のある配座が選定される。

【0149】

予測部３４は、選定部３３により選定された配座に対応する予測対象のペプチドと血漿タンパク質との間においてドッキング計算を行うことにより、予測対象のペプチドの体内持続性を予測する。

【0150】

具体的には、予測部３４は、選定部３３により選定された複数の配座の各々に対応する予測対象のペプチドの各々と血漿タンパク質との間においてドッキング計算を行う。そして、予測部３４は、選定部３３により選定された複数の配座の各々に対して得られたドッキング計算結果であるドッキングプロファイルに基づいて、予測対象のペプチドの体内持続性を予測する。なお、ドッキングプロファイルは、例えば、血漿タンパク質側の残基毎に得られるドッキングスコアを要素として持つベクトルである。なお、ドッキングプロファイルには、残基毎のドッキングスコアと、ペプチドの全体ドッキングスコアとが含まれていてもよい。残基毎のドッキングスコアは、例えば、血漿タンパク質の各残基とペプチドとの間の静電相互作用エネルギー計算値及び疎水性相互作用エネルギー計算値等である。また、ペプチドの全体ドッキングスコアは、例えば、残基毎のドッキングスコアから計算される値である。

【0151】

なお、予測部３４は、血漿タンパク質のうちの予め設定された領域とペプチドとの間においてドッキング計算を実行するようにしてもよい。例えば、上記図１５に示されるように、血漿タンパク質であるヒト血清アルブミンＡＬの疎水性ポケットＨの位置は、既知であるため、疎水性ポケットＨの周辺領域である予め設定された領域において、ドッキング計算を実行するようにしてもよい。また、この設定された領域は複数に分かれていてもよい。

【0152】

次に、第５実施形態の予測装置５１０の作用について説明する。

【0153】

第５実施形態の予測装置５１０は、予測処理開始の指示を表す指示信号を受け付けると、図１８に示される予測処理ルーチンを実行する。

【0154】

ステップＳ５００において、配座生成部３２は、ドッキング計算用データ記憶部３０に格納されている、体内持続性の予測対象のペプチドのペプチド情報を取得する。

【0155】

ステップＳ５０２において、配座生成部３２は、上記ステップＳ５００で取得されたペプチド情報に基づいて、体内持続性の予測対象のペプチドが取りうる配座を複数生成する。そして、配座生成部３２は、複数の配座に関する情報をドッキング計算用データ記憶部３０に一旦格納する。

【0156】

ステップＳ５０４において、選定部３３は、上述したような所定の選定基準に基づいて、上記ステップＳ５０２で生成された複数の配座から、ドッキング計算を行う対象の配座を選定する。そして、配座生成部３２は、選定された配座に関する情報をドッキング計算用データ記憶部３０に一旦格納する。

【0157】

ステップＳ５０６において、予測部３４は、上記ステップＳ５０４で選定された配座の各々について、当該配座に対応する予測対象のペプチドと血漿タンパク質との間においてドッキング計算を行う。そして、予測部３４は、ドッキング計算結果であるドッキングプロファイルをドッキング計算用データ記憶部３０に一旦格納する。

【0158】

ステップＳ５０８において、予測部３４は、上記ステップＳ５０６で得られたドッキングプロファイルに基づいて、予測対象の体内持続性を計算することにより、予測対象のペプチドの体内持続性を予測する。

【0159】

ステップＳ５１０において、予測部３４は、上記ステップＳ５０８で計算されたペプチドの体内持続性の予測値を結果として出力する。

【0160】

以上説明したように、第５実施形態の予測装置は、体内持続性の予測対象のペプチドが取りうる配座を複数生成する。予測装置は、所定の選定基準に基づいて、生成された複数の配座から、ドッキング計算を行う対象の配座を選定する。そして、予測装置は、選定された配座に基づいて予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、予測対象のペプチドの体内持続性を予測する。これにより、予測対象のペプチドの体内持続性を効率的に予測することができる。また、予測対象のペプチドの体内持続性を予測する際に、選定された配座に基づいてペプチドと血漿タンパク質との間のドッキング計算を行い、計算結果に基づいて体内持続性を計算することにより、ペプチドの体内持続性を精度良く予測することができる。特に、機械学習の手法では前例となる学習用データが不足しているために予測が困難であるような新規のペプチドについても、予測が可能となる点に特徴がある。

【0161】

［第６実施形態］

【0162】

次に、第６実施形態について説明する。第６実施形態の予測装置は、ドッキング計算によって得られたペプチドの体内持続性の予測値と、機械学習によって構築された学習済みモデルによって得られた体内持続性の予測値とを統合することにより、ペプチドの体内持続性の予測値を計算する点が第１～第５実施形態と異なる。なお、第６実施形態に係る予測装置の構成のうちの第１～第５実施形態の何れかの予測装置と同様の部分は、同一符号を付して説明を省略する。

【0163】

図１９は、第６実施形態に係る予測装置６１０の構成の一例を示すブロック図である。予測装置６１０は、機能的には、図１９に示されるようにドッキング計算部４０と、学習済みモデル記憶部４２と、学習済みモデル予測部４４と、計算部４６とを備えている。

【0164】

ドッキング計算部４０は、体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を実行することにより、ペプチドの体内持続性を表す第１の体内持続性の予測値を生成する。例えば、ドッキング計算部４０は、第５実施形態の予測装置と同様の手法によってペプチドの体内持続性を表す第１の体内持続性の予測値を生成する。

【0165】

学習済みモデル記憶部４２には、ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための学習済みモデルが格納されている。例えば、学習済みモデル記憶部４２には、上記第１～第４実施形態の何れか１つの予測装置によって生成された学習済みモデルが格納されている。

【0166】

学習済みモデル予測部４４は、体内持続性の予測対象のペプチドから特徴を表す予測用特徴ベクトルを抽出し、予測用特徴ベクトルを、学習済みモデル記憶部４２に格納された学習済みモデルへ入力することにより、ペプチドの体内持続性を表す第２の体内持続性の予測値を生成する。

【0167】

計算部４６は、ドッキング計算部４０によって生成された第１の体内持続性の予測値と、学習済みモデル予測部４４により生成された第２の体内持続性の予測値とを統合することにより、ペプチドの体内持続性の予測値を計算する。例えば、計算部４６は、第１の体内持続性の予測値と第２の体内持続性の予測値とを平均することにより、ペプチドの体内持続性の予測値を計算する。または、計算部４６は、第１の体内持続性の予測値と第２の体内持続性の予測値とのうちの大きい値又は小さい値をペプチドの体内持続性の予測値として計算する。

【0168】

計算部４６は、ペプチドの体内持続性の予測値を結果として出力する。

【0169】

以上説明したように、第６実施形態の予測装置は、予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、ペプチドの体内持続性を表す第１の体内持続性の予測値を生成する。また、予測装置は、ペプチドから特徴を表す予測用特徴ベクトルを抽出し、予測用特徴ベクトルを、予め構築された学習済みモデルへ入力することにより、ペプチドの体内持続性を表す第２の体内持続性の予測値を生成する。そして、予測装置は、生成された第１の体内持続性の予測値と、第２の体内持続性の予測値とを統合することにより、ペプチドの体内持続性の予測値を計算する。これにより、ドッキング計算によって得られた予測値と学習済みモデルにより得られた予測値との両方が反映された予測値を得ることができる。

【0170】

［第７実施形態］

【0171】

次に、第７実施形態について説明する。第７実施形態の予測装置は、ドッキング計算によって得られたドッキングプロファイルとペプチドから抽出される特徴量とに基づいて、機械学習アルゴリズムを用いて学習済みモデルを構築する点が第１～第６実施形態と異なる。なお、第７実施形態に係る予測装置の構成のうちの第１～第６実施形態の何れかの予測装置と同様の部分は、同一符号を付して説明を省略する。

【0172】

図２０は、第７実施形態に係る予測装置７１０の構成の一例を示すブロック図である。予測装置７１０は、機能的には、図２０に示されるように、データ記憶部１２と、学習用抽出部１４と、学習用ドッキング計算部７１４と、学習用データ生成部７１５と、学習用データ記憶部７１６と、学習部７１８と、学習済みモデル記憶部７２０と、ドッキング計算部７２１と、抽出部７２２と、学習済みモデル予測部７２４と、を備えている。

【0173】

学習用抽出部１４は、複数の学習用のペプチドの各々について、第１～第６実施形態の何れか１つの予測装置と同様の手法によって、学習用のペプチドのペプチド情報から特徴量を抽出する。

【0174】

学習用ドッキング計算部７１４は、データ記憶部１２から複数の学習用のペプチドのペプチド情報を読み出す。そして、学習用ドッキング計算部７１４は、複数の学習用のペプチドの各々について、学習用のペプチド情報と血漿タンパク質との間のドッキング計算を行うことにより、学習用のペプチドのドッキングプロファイルである学習用ドッキングプロファイルを計算する。

【0175】

学習用データ生成部７１５は、複数の学習用のペプチドの各々について、学習用抽出部１４によって抽出された特徴量と、学習用ドッキング計算部７１４によって計算された学習用ドッキングプロファイルとを要素として持つ学習用特徴ベクトルを生成する。そして、学習用データ生成部７１５は、複数の学習用のペプチドの各々について、学習用特徴ベクトルと体内持続性の正解値との対を表す学習用データを生成する。そして、学習用データ生成部７１５は、生成した複数の学習用データを学習用データ記憶部７１６へ格納する。

【0176】

学習用データ記憶部７１６には、学習用特徴ベクトルと体内持続性の正解値との対を表す学習用データが複数格納される。なお、学習用データ記憶部７１６に格納されている学習用特徴ベクトルは、学習用抽出部１４によって学習用のペプチドから抽出された特徴量と、学習用ドッキング計算部７１４により計算された学習用ドッキングプロファイルとを要素として含む学習用特徴ベクトルである。

【0177】

学習部７１８は、学習用データ記憶部７１６に格納された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、学習済みモデルを生成する。この学習済みモデルは、ペプチドのドッキング計算により得られるドッキングプロファイルとペプチドから抽出される特徴量とを含む特徴ベクトルから、ペプチドの体内持続性の予測値を出力するためのモデルである。

【0178】

学習済みモデル記憶部７２０には、学習部７１８により生成された学習済みモデルが格納される。

【0179】

ドッキング計算部７２１は、体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、予測対象のペプチドのドッキングプロファイルを計算する。なお、例えば、ドッキング計算部７２１は、既知のドッキング計算を行ってもよいし、上記第５実施形態と同様のドッキング計算を行ってもよい。

【0180】

抽出部７２２は、体内持続性の予測対象のペプチドのペプチド情報から特徴量を抽出する。

【0181】

学習済みモデル予測部７２４は、抽出部７２２によって抽出された特徴量及びドッキング計算部７２１によって計算されたドッキングプロファイルを要素として持つ予測用特徴ベクトルを生成する。そして、学習済みモデル予測部７２４は、予測用特徴ベクトルを学習済みモデル記憶部７２０に格納されている学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。

【0182】

このように、学習済みモデルを生成する際の学習用データに、ドッキング計算によって得られるドッキングプロファイルも含めることにより、予測対象のペプチドの体内持続性をより精度良く予測することができる。

【0183】

次に、第７実施形態の予測装置７１０の作用について説明する。

【0184】

予測装置７１０は、学習済みモデルの生成処理の指示を表す指示信号を受け付けると、図２１に示される学習済みモデルの生成処理ルーチンを実行する。

【0185】

ステップＳ７００において、学習用抽出部１４は、データ記憶部１２に格納されている複数の学習用のペプチド情報の各々から、学習用のペプチドの特徴量を抽出する。

【0186】

ステップＳ７０２において、学習用ドッキング計算部７１４は、データ記憶部１２に格納されている複数の学習用のペプチド情報の各々について、学習用のペプチド情報と血漿タンパク質との間のドッキング計算を行うことにより、学習用のペプチドの学習用ドッキングプロファイルを計算する。

【0187】

ステップＳ７０４において、学習用データ生成部７１５は、複数の学習用のペプチドの各々について、上記ステップＳ７００で抽出された特徴量と、上記ステップＳ７０２で計算された学習用のドッキングプロファイルとを要素として持つ学習用特徴ベクトルを生成する。

【0188】

ステップＳ７０６において、学習用データ生成部７１５は、複数の学習用のペプチドの各々について、上記ステップＳ７０４で生成された学習用特徴ベクトルと体内持続性の正解値との対を表す学習用データを生成する。そして、学習用データ生成部７１５は、生成した複数の学習用データを学習用データ記憶部７１６へ格納する。

【0189】

ステップＳ７０８において、学習部７１８は、学習用データ記憶部７１６に格納された複数の学習用データに基づいて、既知の教師あり機械学習アルゴリズムを実行することにより、ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。

【0190】

ステップＳ７１０において、学習部７１８は、上記ステップＳ７０８で生成された学習済みモデルを学習済みモデル記憶部７２０へ格納する。

【0191】

学習済みモデル記憶部７２０に学習済みモデルが格納され、体内持続性の予測対象のペプチド情報が予測装置７１０へ入力されると、予測装置７１０は図２２に示される予測処理ルーチンを実行する。

【0192】

ステップＳ７２０において、抽出部７２２は、体内持続性の予測対象のペプチド情報を受け付ける。

【0193】

ステップＳ７２２において、抽出部７２２は、上記ステップＳ７２０で受け付けたペプチド情報から特徴量を抽出する。

【0194】

ステップＳ７２４において、ドッキング計算部７２１は、上記ステップＳ７２０で受け付けたペプチド情報に対応するペプチドと血漿タンパク質との間のドッキング計算を行うことにより、予測対象のペプチドのドッキングプロファイルを計算する。

【0195】

ステップＳ７２６において、学習済みモデル予測部７２４は、上記ステップＳ７２２で抽出された特徴量と、上記ステップＳ７２４で計算されたドッキングプロファイルとを要素として持つ予測用特徴ベクトルを生成する。

【0196】

ステップＳ７２８において、学習済みモデル予測部７２４は、上記ステップＳ７２４で生成された予測用特徴ベクトルを、学習済みモデル記憶部７２０に格納された学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。

【0197】

ステップＳ７３０において、学習済みモデル予測部７２４は、上記ステップＳ７２８で生成された体内持続性の予測値を結果として出力する。

【0198】

以上詳細に説明したように、第７実施形態の予測装置は、複数の学習用のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、学習用のペプチドのドッキングプロファイルである学習用ドッキングプロファイルを計算する。予測装置は、複数の学習用のペプチドの各々について、学習用のペプチドから抽出される特徴量及び学習用ドッキングプロファイルを含む学習用特徴ベクトルと学習用のペプチドの体内持続性の正解値との対を表す学習用データに基づいて、機械学習アルゴリズムを実行することにより、ペプチドのドッキング計算により得られるドッキングプロファイルとペプチドから抽出される特徴量とを含む特徴ベクトルから、ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する。このように、学習済みモデルを生成する際の学習用データに、ドッキング計算によって得られるドッキングプロファイルも含めることにより、予測対象のペプチドの体内持続性をより精度良く予測するための学習済みモデルを得ることができる。

【0199】

また、第７実施形態の予測装置は、体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、ペプチドと前記血漿タンパク質との間のドッキングスコアを含むドッキングプロファイルを計算する。なお、ドッキングスコアは、残基毎のドッキングスコア及び全体ドッキングスコアの少なくとも一方である。そして、予測装置は、計算されたドッキングプロファイルを含む予測用特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。これにより、予測対象のペプチドの体内持続性をより精度良く予測することができる。具体的には、ドッキングプロファイルには体内持続性を予測する際に有用な情報が多く含まれているため、そのドッキングプロファイルを利用することにより、予測対象のペプチドの体内持続性をより精度良く予測することができる。より詳細には、ペプチドから抽出される特徴量には血漿タンパク質の立体構造情報が含まれない一方で、ドッキングプロファイルには血漿タンパク質の立体構造情報が含まれ、体内持続性を物理的な側面からも予測することができるようになる。このことから、ドッキングプロファイルを利用することにより、予測対象のペプチドの体内持続性をより精度良く予測することができる。

【0200】

［第８実施形態］
次に、第８実施形態について説明する。第８実施形態の予測装置は、ペプチドの残基を血漿タンパク質とドッキング計算させたときの残基ドッキング計算のドッキングプロファイルを利用して、予測対象のペプチドの体内持続性を予測する点が第１～第７実施形態と異なる。なお、第８実施形態に係る予測装置の構成のうちの第１～第７実施形態の何れかの予測装置と同様の部分は、同一符号を付して説明を省略する。

【0201】

上記第７実施形態の予測装置７１０は、ペプチド全体のドッキング計算結果であるドッキングプロファイルを利用して体内持続性を予測する。しかし、この場合には、予測対象のペプチド毎にドッキング計算を必ず実行する必要がある。例えば、残基［Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｆ］からなるペプチドと、残基［Ａ’，Ｂ，Ｃ，Ｄ，Ｅ，Ｆ］からなるペプチドのように、単一の残基だけがわずかに異なったペプチド対についても、各々のペプチドについてペプチド全体のドッキング計算を必ず実行することになる。

【0202】

この点、例えば、上述したように、ペプチドの残基は、血漿タンパク質の疎水性ポケットに結合しうるため、体内持続性を予測する際には、残基毎の残基ドッキング計算の結果が重要な因子となりうる。

【0203】

そこで、第８実施形態では、複数種類のペプチドの残基の各々について血漿タンパク質との間の残基ドッキング計算を個別に実施しておく。そして、第８実施形態の予測装置は、予測対象のペプチドの体内持続性を予測する際には、予め計算されている残基ドッキング計算のドッキングプロファイルを利用して、ペプチドの体内持続性を予測する。以下、具体的に説明する。

【0204】

図２３は、第８実施形態に係る予測装置８１０の構成の一例を示すブロック図である。予測装置８１０は、機能的には、図２３に示されるように、ドッキング計算結果記憶部８１９と、学習済みモデル記憶部８２０と、抽出部８２２と、残基特定部８２４と、学習済みモデル予測部８２６と、を備えている。

【0205】

ドッキング計算結果記憶部８１９には、複数種類の残基の各々について当該残基の残基ドッキング計算結果である、残基のドッキングプロファイルが記憶されている。残基の種類は限定されているため、第８実施形態では、それら残基のドッキングプロファイルを予め計算しておき、ドッキング計算結果記憶部８１９に格納しておく。

【0206】

学習済みモデル記憶部８２０には、ペプチドの残基のドッキングプロファイルとペプチドから抽出される特徴量とを含む特徴ベクトルから、ペプチドの体内持続性を予測するための学習済みモデルが格納されている。なお、この学習済みモデルは、学習用のペプチドの特徴ベクトルと学習用のペプチドの体内持続性の正解値との対を表す学習用データに基づく、機械学習アルゴリズムによって予め生成される。なお、この場合の学習用の特徴ベクトルは、学習用のペプチドの残基のドッキングプロファイルと、学習用のペプチドから抽出される特徴量とを要素として持つ。学習済みモデルを用いた体内持続性の予測については後述する。

【0207】

抽出部８２２は、体内持続性の予測対象のペプチドのペプチド情報から特徴量を抽出する。なお、この特徴量は複数存在していてもよい。

【0208】

残基特定部８２４は、体内持続性の予測対象のペプチドが有する残基の種類を特定する。この残基の種類は、ドッキング計算結果記憶部８１９に格納されているドッキングプロファイルを選択する際に利用される。

【0209】

学習済みモデル予測部８２６は、残基特定部８２４により特定された残基の種類に対応するドッキングプロファイルを読み出し、読み出した予測対象の残基のドッキングプロファイルと、抽出部８２２により抽出された特徴量とを含む予測用特徴ベクトルを生成する。そして、学習済みモデル予測部８２６は、予測用特徴ベクトルを学習済みモデル記憶部８２０に格納されている学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。

【0210】

このように、ペプチドが有する残基について予め残基ドッキング計算を実行しておき、それらのドッキングプロファイルを利用することにより、予測対象のペプチドの体内持続性をより効率的に予測することができる。また、残基は体内持続性の重要な因子であるとも考えられるため、そのドッキングプロファイルを利用することにより、予測対象のペプチドの体内持続性を精度良く予測することができる。

【0211】

次に、第８実施形態の予測装置８１０の作用について説明する。学習済みモデル記憶部８２０に学習済みモデルが格納され、体内持続性の予測対象のペプチド情報が予測装置８１０へ入力されると、予測装置８１０は図２４に示される予測処理ルーチンを実行する。

【0212】

ステップＳ８００において、抽出部８２２は、体内持続性の予測対象のペプチド情報を受け付ける。

【0213】

ステップＳ８０２において、抽出部８２２は、上記ステップＳ８００で受け付けたペプチド情報から特徴量を抽出する。

【0214】

ステップＳ８０４において、残基特定部８２４は、上記ステップＳ８００で受け付けたペプチド情報に対応するペプチドが有する残基の種類を特定する。

【0215】

ステップＳ８０５において、学習済みモデル予測部８２６は、上記ステップＳ８０４で特定された残基の種類に対応するドッキングプロファイルを、ドッキング計算結果記憶部８１９から読み出す。

【0216】

ステップＳ８０６において、学習済みモデル予測部８２６は、上記ステップＳ８０２で抽出された特徴量及び上記ステップＳ８０５で読み出された、ドッキングプロファイルを要素として持つ予測用特徴ベクトルを生成する。

【0217】

ステップＳ８０８において、学習済みモデル予測部８２６は、上記ステップＳ８０６で生成された予測用特徴ベクトルを、学習済みモデル記憶部８２０に格納された学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性の予測値を生成する。

【0218】

ステップＳ８１０において、学習済みモデル予測部８２６は、上記ステップＳ８０８で生成された体内持続性の予測値を結果として出力する。

【0219】

以上詳細に説明したように、第８実施形態の予測装置は、体内持続性の予測対象のペプチドから残基を抽出する。そして、予測装置は、複数種類の残基の各々についての、残基と血漿タンパク質との間の残基ドッキング計算結果を表すドッキングプロファイルが記憶された記憶部から、抽出された残基に対応するドッキングプロファイルを読み出す。そして、予測装置は、読み出した予測対象の残基のドッキングプロファイルを含む予測用特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、予測対象のペプチドの体内持続性を予測する。これにより、予測対象のペプチドの体内持続性をより効率的に予測することができる。また、残基の種類は体内持続性の重要な因子であるとも考えられるため、そのドッキングプロファイルを利用することにより、予測対象のペプチドの体内持続性を精度良く予測することができる。

【0220】

なお、本開示は、上述した実施形態に限定されるものではなく、この開示の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

【0221】

例えば、上記第１実施形態では、環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴ベクトルの各々を抽出し、それら複数の特徴ベクトルを学習済みモデルへ入力し、学習済みモデルから出力された体内持続性の予測値の代表値を得る場合を例に説明したがこれに限定されるものではない。例えば、環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴ベクトルの各々から１つの特徴ベクトルを生成し、その１つの特徴ベクトルを学習済みモデルへ入力して、体内持続性の予測値を得るようにしてもよい。この場合には、例えば、複数の特徴ベクトルを重み付き平均することにより、１つの特徴ベクトルが生成される。または、例えば、複数の特徴ベクトルから所定の特徴ベクトルを選択し、選択された複数の特徴ベクトルを重み付き平均することにより、１つの特徴ベクトルが生成される。また、学習済みモデルを生成する際にも、環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の学習特徴ベクトルの各々から１つの学習用特徴ベクトルを生成し、その学習用特徴ベクトルを用いて学習済みモデルを生成するようにしてもよい。

【0222】

また、上記第７実施形態では、学習用特徴ベクトル及び予測用特徴ベクトルが、ペプチドから抽出される特徴量とドッキングプロファイルとを要素として持つベクトルである場合を例に説明したがこれに限定されるものではない。例えば、学習用特徴ベクトル及び予測用特徴ベクトルが、ドッキングプロファイルのみを要素として持つベクトルであってもよい。また、そのドッキングプロファイルには、血漿タンパク質側の残基毎に得られるドッキングスコアのみが含まれていてもよいし、残基毎のドッキングスコアの総和を表す全体ドッキングスコアが更に含まれていてもよい。

【0223】

また、上記第７実施形態では、残基毎のドッキングプロファイルが予め計算されている場合を例に説明したがこれに限定されるものではない。例えば、各残基から主鎖構造を除いた側鎖部分のみでドッキング計算を予め実行し、側鎖毎のドッキングプロファイルがドッキング計算結果記憶部８１９に予め格納されていてもよい。

【0224】

また、上記実施形態では、学習用データに基づき学習済みモデルが生成される場合を例に説明したがこれに限定されるものではない。例えば、他の学習済みモデルに基づく蒸留モデルとして本実施形態の学習済みモデルが生成されてもよい。

【0225】

また、上記では本発明に係るプログラムが記憶部（図示省略）に予め記憶（インストール）されている態様を説明したが、本発明に係るプログラムは、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ及びマイクロＳＤカード等の記録媒体に記録されている形態で提供することも可能である。

【0226】

なお、上記実施形態でＣＰＵがソフトウェア（プログラム）を読み込んで実行した処理を、ＣＰＵ以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、ＦＰＧＡ（Field-Programmable Gate Array）等の製造後に回路構成を変更可能なＰＬＤ（Programmable Logic Device）、及びＡＳＩＣ（Application Specific Integrated Circuit）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、各処理を、これらの各種のプロセッサのうちの１つで実行してもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡ、及びＣＰＵとＦＰＧＡとの組み合わせ等）で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。

【0227】

また、本実施形態の各処理を、汎用演算処理装置及び記憶装置等を備えたコンピュータ又はサーバ等により構成して、各処理がプログラムによって実行されるものとしてもよい。このプログラムは記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。もちろん、その他いかなる構成要素についても、単一のコンピュータやサーバによって実現しなければならないものではなく、ネットワークによって接続された複数のコンピュータに分散して実現してもよい。

【符号の説明】

【0228】

１０，２１０，３１０，５１０，６１０，７１０，８１０予測装置
１２データ記憶部
１４学習用抽出部
１５学習用調整部
１６，７１６学習用データ記憶部
１８，７１８学習部
２０，４２，７２０，８２０学習済みモデル記憶部
２２，７２２，８２２抽出部
２３調整部
２４生成部
３０ドッキング計算用データ記憶部
３２配座生成部
３３選定部
３４予測部
４０，７２１ドッキング計算部
４４，７２４，８２６学習済みモデル予測部
４６計算部
３１５，７１５学習用データ生成部
７１４学習用ドッキング計算部
８１９ドッキング計算結果記憶部
８２４残基特定部

【要約】

【課題】ペプチドの体内持続性を予測する。
【解決手段】予測装置１０は、体内持続性の予測対象の環状ペプチドから当該環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す予測用特徴ベクトルの各々を抽出する。予測装置１０は、複数の予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための予め学習された学習済みモデルへ入力することにより、予測対象の環状ペプチドの体内持続性の予測値を生成する。
【選択図】図１