特許7236253 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 合同会社みらか中央研究所の特許一覧

特許7236253情報処理方法および学習モデル

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-03-01

(45)【発行日】2023-03-09

(54)【発明の名称】情報処理方法および学習モデル

(51)【国際特許分類】

G16B 40/20 20190101AFI20230302BHJP

G06N 3/02 20060101ALI20230302BHJP

G06N 99/00 20190101ALI20230302BHJP

G16H 70/60 20180101ALI20230302BHJP

【ＦＩ】

G16B40/20

G06N3/02

G06N99/00

G16H70/60

【請求項の数】 5

(21)【出願番号】P 2018210050

(22)【出願日】2018-11-07

(65)【公開番号】P2020077206

(43)【公開日】2020-05-21

【審査請求日】2021-08-16

(73)【特許権者】

【識別番号】517448489

【氏名又は名称】合同会社Ｈ．Ｕ．グループ中央研究所

(74)【代理人】

【識別番号】100114557

【弁理士】

【氏名又は名称】河野英仁

(74)【代理人】

【識別番号】100078868

【弁理士】

【氏名又は名称】河野登夫

(72)【発明者】

【氏名】山下英俊

【審査官】渡邉加寿磨

(56)【参考文献】

【文献】米国特許出願公開第２０１４／００３２１８６（ＵＳ，Ａ１）

【文献】米国特許第６５８７８４５（ＵＳ，Ｂ１）

【文献】米国特許第９９２２２８５（ＵＳ，Ｂ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

Ｇ１６Ｂ５／００－９９／００

Ｇ１６Ｃ１０／００－９９／００

Ｇ０６Ｎ３／０２

Ｇ０６Ｎ２０／００

Ｇ１６Ｈ７０／６０

(57)【特許請求の範囲】

【請求項1】

プロトタイプ抗体の物性、および、前記プロトタイプ抗体を所定の標的抗原と組み合わせた場合の活性を教師データとして取得し、
取得した物性を入力データとし、取得した活性を出力データとする学習モデルを生成し、
前記プロトタイプ抗体と異なる複数の変異抗体の物性をそれぞれ取得し、
取得したそれぞれの前記変異抗体の物性を前記学習モデルに入力して、前記変異抗体の推定活性値を取得し、
取得した推定活性値に基づいて活性が高いと推定される変異抗体を抽出し、
抽出された前記変異抗体のアミノ酸配列を状態、前記変異抗体のアミノ酸配列の変更を行動、前記変異抗体の立体構造と前記標的抗原の立体構造とに基づいて算出した活性の変化を報酬として、前記報酬が大きくなるようにアミノ酸配列を改変する強化学習を行ない、前記変異抗体よりも活性が高い第２変異抗体のアミノ酸配列を出力する
処理をコンピュータに実行させる情報処理方法。

【請求項2】

前記第２変異抗体を前記標的抗原と組み合わせて測定した活性を取得し、
前記第２変異抗体の物性と、取得した活性とを前記教師データに追加して前記学習モデルを更新する
請求項１に記載の情報処理方法。

【請求項3】

前記変異抗体は、前記プロトタイプ抗体のアミノ酸配列を構成するアミノ酸を所定の置換頻度に基づいて置換して生成される
請求項１または請求項２に記載の情報処理方法。

【請求項4】

前記学習モデルの更新と、前記強化学習とを繰り返す
請求項１から請求項３のいずれか一つに記載の情報処理方法。

【請求項5】

前記入力データは、抗体分子にかかる分子量、極性表面積、炭素原子数、窒素原子数、二重結合数、分子屈折率または油水分配係数を含み、
前記出力データは、抗体分子と前記標的抗原との結合定数、解離定数、結合速度定数、解離速度定数、阻害活性、抗体価、抗原特異性、保存安定性、ｐＨプロファイルまたは凝集性を含む
請求項１から請求項４のいずれか一つに記載の情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理方法および学習モデルに関する。

【背景技術】

【0002】

研究用および臨床検査用の試薬、および、抗体医薬品に抗体が使用される。抗体は、特定の抗原に特異的に結合するタンパク質である。実験動物に抗原を投与して所定期間飼育することにより、その実験動物の血液から、投与した標的抗原と結合する多様な抗体を得ることができる。

【0003】

抗原を実験動物に免疫した後、その実験動物の血液等からＢ細胞のゲノムまたは転写産物を取得することにより、実験動物の体内で生成された多様な抗体をコードする遺伝子を取得できる。取得した遺伝子の核酸塩基配列は、ＮＧＳ（Next Generation Sequencer：次世代シーケンサ）等を用いて決定できる。

【0004】

ファージディスプレイ法等の実験手法により、多様な抗体をコードする遺伝子のライブラリの中から、抗原への親和性が優れた抗体を選択できる。以上の手法により取得した核酸塩基配列に基づいて、抗原に結合するポリペプチドを含む配列を決定するシステムが提案されている（特許文献１）。

【0005】

抗体をコードする核酸塩基配列を用いることにより、実験動物、動物細胞、微生物、ウイルス等の内部で生成された多種類の抗体にかかる情報を網羅的に取得できる。実験動物には、マウス、ウサギ、ヒツジ、ヤギまたはラクダ等が用いられる。動物細胞には、哺乳動物細胞、鳥類細胞または昆虫細胞等が用いられる。微生物には、バクテリアまたは酵母等が用いられる。

【先行技術文献】

【特許文献】

【0006】

【文献】国際公開第２０１５／０７６３５５号

【文献】H. Moriwaki et. al., "Mordred: a molecular descriptor calculator", Journal of Cheminformatics, 2018 10:4

【発明の概要】

【発明が解決しようとする課題】

【0007】

しかしながら、特許文献１に開示された発明では、実験動物およびウイルス等から得た抗体を改変して、より高い活性を有する抗体を得ることはできない。

【0008】

一つの側面では、より高い活性を有する抗体を得る情報処理方法等を提供することを目的とする。

【課題を解決するための手段】

【0009】

情報処理方法は、プロトタイプ抗体の物性、および、前記プロトタイプ抗体を所定の標的抗原と組み合わせた場合の活性を教師データとして取得し、取得した物性を入力データとし、取得した活性を出力データとする学習モデルを生成し、前記プロトタイプ抗体と異なる複数の変異抗体の物性をそれぞれ取得し、取得したそれぞれの前記変異抗体の物性を前記学習モデルに入力して、前記変異抗体の推定活性値を取得し、取得した推定活性値に基づいて活性が高いと推定される変異抗体を抽出し、抽出された前記変異抗体のアミノ酸配列を状態、前記変異抗体のアミノ酸配列の変更を行動、前記変異抗体の立体構造と前記標的抗原の立体構造とに基づいて算出した活性の変化を報酬として、前記報酬が大きくなるようにアミノ酸配列を改変する強化学習を行ない、前記変異抗体よりも活性が高い第２変異抗体のアミノ酸配列を出力する処理をコンピュータに実行させる。

【発明の効果】

【0010】

一つの側面では、より高い活性を有する抗体を得る情報処理方法等を提供できる。

【図面の簡単な説明】

【0011】

【図1】抗体を開発する手順の概要を説明する説明図である。

【図2】情報処理装置の構成を示す説明図である。

【図3】抗体の構成を説明する模式図である。

【図4】抗体の物性および活性を説明する説明図である。

【図5】学習モデルの概要を説明する説明図である。

【図6】抗体を開発する手順の概要を説明する説明図である。

【図7】強化学習段階を説明する説明図である。

【図8】強化学習段階を説明する説明図である。

【図9】ニューラルネットワークモデルの構成を示す説明図である。

【図10】教師データＤＢのレコードレイアウトを説明する説明図である。

【図11】変異配列ライブラリＤＢのレコードレイアウトを説明する説明図である。

【図12】強化後ＤＢのレコードレイアウトを説明する説明図である。

【図13】プログラムの処理の流れを示すフローチャートである。

【図14】教師あり学習モデル生成のサブルーチンの処理の流れを示すフローチャートである。

【図15】ライブラリ作成のサブルーチンの処理の流れを示すフローチャートである。

【図16】強化学習のサブルーチンの処理の流れを示すフローチャートである。

【図17】実施の形態２のプログラムの処理の流れを示すフローチャートである。

【図18】実施の形態４の情報処装置の機能ブロック図である。

【図19】実施の形態５の情報処理装置の構成を示す説明図である。

【発明を実施するための形態】

【0012】

［実施の形態１］
図１は、抗体を開発する手順の概要を説明する説明図である。まず、抗体を開発する対象である、標的抗原および抗原決定基（エピトープ）を定める。マウスまたはウサギ等の実験動物に、注射等により標的抗原を投与して免疫反応を惹起する。標的抗原の投与は、十分な免疫反応が得られるまで複数回繰り返して行なう。

【0013】

実験動物のＢ細胞で、標的抗原と結合する抗体が産生され、血液中に放出される。これらの抗体は、標的抗原のさまざまな部位にそれぞれ結合する多くの種類の抗体を含む、ポリクローナル抗体である。

【0014】

ポリクローナル抗体に含まれる多種類の抗体をそれぞれ、抗体開発の原形であるプロトタイプ抗体に使用する。プロトタイプ抗体を各種の手法を用いて解析することで、一次構造であるアミノ酸配列を取得する。さらに、実測または物性シミュレーションにより、プロトタイプ抗体自体の物性と、プロトタイプ抗体と標的抗原との組合せである活性とを取得する。物性および活性の詳細については、後述する。

【0015】

なお、プロトタイプ抗体はモノクローナル抗体であってもよい。プロタイプ抗体は、免疫グロブリンの５つのアイソタイプ、すなわち、Ｉｇ（Immunoglobulin）Ｇ、ＩｇＭ、ＩｇＡ、ＩｇＤ、ＩｇＥ、ＩｇＹのいずれであってもよい。プロトタイプ抗体はまた、全長抗体であってもよい。全長抗体とは、可変領域および定常領域を各々含む重鎖および軽鎖を含む抗体であり、２つのＦａｂ（Fragment, antigen binding）部分およびＦｃ（Fragment, crystallizable）部分を含む。

【0016】

抗体はまた、このような全長抗体に由来する抗体断片であってもよい。抗体断片は全長抗体の一部であり、たとえば、Ｆ（ａｂ’）₂、Ｆａｂ’、ＦａｂおよびＦｖ（Fragment, variable）等の定常領域欠失抗体が挙げられる。プロトタイプ抗体はまた、単鎖抗体等の改変抗体であってもよい。好ましくは、プロトタイプ抗体は、ＩｇＧ、ＩｇＭ、またはそれらの抗体断片である。

【0017】

取得した物性と活性との組合せを教師データＤＢ（Database）５１に記録する。教師あり機械学習により、物性を入力した場合に、推定活性値（以下、活性とも呼ぶ）を出力する学習モデル５３を生成する。教師データＤＢ５１および学習モデル５３の詳細については、後述する。

【0018】

プロトタイプ抗体のアミノ酸配列の一部を変異させた変異配列を多数自動作成する。変異配列は、プロトタイプ抗体のアミノ酸配列の一部を別のアミノ酸に置換した置換配列、プロトタイプ抗体のアミノ酸配列の一部を欠失させた欠失配列、および、プロトタイプ抗体のアミノ酸配列に他のアミノ酸配列を挿入した挿入配列を含む。

【0019】

物性シミュレーションにより、それぞれの変異配列に対応する抗体（以下、変異抗体と呼ぶ）の物性を計算して、変異配列ライブラリＤＢ５２に記録する。変異配列ライブラリＤＢ５２、および、変異配列の作成の詳細については、後述する。

【0020】

変異配列ライブラリＤＢ５２に記録された物性を学習モデル５３に入力して、変異抗体の推定活性値を出力する。その中から高い推定活性値を予測した変異配列を抽出する。以上の処理により、自動作成した多数の変異配列を、学習モデル５３を使用してスクリーニングする。

【0021】

変異抗体の立体構造を変異配列から推定する立体構造シミュレーションを行なう。その後、立体構造に基づいて変異抗体と標的抗原との結合状態を計算するドッキングシミュレーションを行ない、推定結合活性値（以下、活性とも呼ぶ）を算出する。ドッキングシミュレーションにより算出した推定結合活性値を高めるように、抗体のアミノ酸配列を置換、欠失または挿入（以下、変異とも呼ぶ）させる強化学習を行ない、アミノ酸配列を改変する。強化学習の詳細については、後述する。

【0022】

強化学習により所定の条件のアミノ酸配列を算出した後に、遺伝子組み換え技術により変異抗体を実際に作製して、活性および物性を実測する。実測データを教師データＤＢ５１に追加して、再度教師あり学習を行ない、学習モデル５３を更新する。教師データＤＢ５１の更新により、学習モデル５３の精度が改善される。以後、学習モデル５３を利用した変異配列の抽出と、強化学習を用いた変異配列の改良と、実測と、教師データＤＢ５１の更新とを、所望の活性が得られるまで繰り返す。

【0023】

以上により、膨大な時間および実験費用を要する実測の回数を抑えながら、活性の高い抗体を作製できる。そのため、新しい標的抗原に対して、短い期間で、所望の活性を有する抗体を作製できる。

【0024】

図２は、情報処理装置２０の構成を示す説明図である。情報処理装置２０は、制御部２１、主記憶装置２２、補助記憶装置２３、通信部２４、表示部２５、入力部２６およびバスを備える。制御部２１は、本実施の形態のプログラムを実行する演算制御装置である。制御部２１は、一または複数のＣＰＵ（Central Processing Unit）、マルチコアＣＰＵまたはＧＰＵ（Graphics Processing Unit）等により構成される。制御部２１は、バスを介して情報処理装置２０を構成するハードウェア各部と接続されている。

【0025】

主記憶装置２２は、ＳＲＡＭ（Static Random Access Memory）、ＤＲＡＭ（Dynamic Random Access Memory）、フラッシュメモリ等の記憶装置である。主記憶装置２２には、制御部２１が行なう処理の途中で必要な情報および制御部２１で実行中のプログラムが一時的に保存される。

【0026】

補助記憶装置２３は、ＳＲＡＭ、フラッシュメモリまたはハードディスク等の記憶装置である。補助記憶装置２３には、教師データＤＢ５１、変異配列ライブラリＤＢ５２、強化後ＤＢ５８、学習モデル５３、ニューラルネットワークモデル６０、物性シミュレータ５５、ドッキングシミュレータ５６、立体構造シミュレータ５９、制御部２１に実行させるプログラム、およびプログラムの実行に必要な各種データが保存される。

【0027】

なお、教師データＤＢ５１、変異配列ライブラリＤＢ５２、強化後ＤＢ５８、学習モデル５３およびニューラルネットワークモデル６０は、情報処理装置２０に接続された外部の大容量記憶装置等に保存されていても良い。

【0028】

物性シミュレータ５５は、物性シミュレーションを行なうアプリケーションソフトウェアである。物性シミュレータ５５には、たとえば、Ｄｒａｇｏｎ、ＰａＤＥＬ－Ｄｅｓｃｒｉｐｔｏｒ、Ｃｏｄｅｓｓａ、ｍｏｒｄｒｅｄ、または、ＲＤＫｉｔ等の公知のソフトウェアを利用できる。物性シミュレータ５５の詳細については後述する。

【0029】

ドッキングシミュレータ５６は、ドッキングシミュレーションを行なうアプリケーションソフトウェアである。ドッキングシミュレータ５６には、たとえばＡｕｔｏＤｏｃｋ、ＡｕｔｏＤｏｃｋＶｉｎａ、ＧＯＬＤ、ＡｃｃｅｌｒｙｓＤｉｓｃｏｖｅｒｙＳｔｕｄｉｏ、または、ＭＯＥ等の公知のソフトウェアを利用できる。

【0030】

立体構造シミュレータ５９は、アミノ酸配列に基づいて高分子の立体構造を推定するソフトウェアである。立体構造シミュレータ５９により推定された立体構造は、物性シミュレータ５５およびドッキングシミュレータ５６への入力データに用いられる。立体構造シミュレータ５９には、たとえばＭｏｄｅｌｌｅｒ、ＳｗｉｓｓＭｏｄｅｌ、ＨＯＭＣＯＳ、Ｒｏｓｅｔｔａ、ＥＶｆｏｌｄ、ＺＤＯＣＫまたはＨＡＤＤＯＣＫ等の公知のソフトウェアを利用できる。立体構造シミュレータ５９の詳細については後述する。

【0031】

物性シミュレータ５５、立体構造シミュレータ５９およびドッキングシミュレータ５６は、情報処理装置２０に接続された外部のサーバ等にインストールされていても良い。このようにする場合、制御部２１は物性シミュレーション、立体構造シミュレーションおよびドッキングシミュレーションに入力するデータを送信し、それぞれのシミュレーションを行なった結果を受信する。

【0032】

通信部２４は、情報処理装置２０とネットワークとの間の通信を行なうインターフェイスである。表示部２５は、液晶表示装置または有機ＥＬ（Electro Luminescence）表示装置等である。入力部２６は、キーボードおよびマウス等である。表示部２５と入力部２６とは、積層されてタッチパネルを構成してもよい。

【0033】

本実施の形態の情報処理装置２０は、汎用のパソコン、タブレット、大型計算機、または、大型計算機上で動作する仮想マシンである。情報処理装置２０は、複数のパソコン、タブレットまたは大型計算機等のハードウェアにより構成されても良い。情報処理装置２０は、量子コンピュータにより構成されても良い。

【0034】

図３は、抗体の構成を説明する模式図である。抗体は複数の免疫グロブリンから構成されている。ラット等の実験動物やヒトの場合、抗体の基本となる構造単位はＩｇＧと呼ばれる略Ｙ字型の立体構造を持つタンパク質である。ＩｇＧは、２本のＨ（Heavy）鎖と、２本のＬ（Light）鎖とにより構成されている。Ｙ字型の下側の縦棒の部分は、Ｈ鎖のみで構成されている。Ｙ字型の上側の二股の部分は、Ｈ鎖とＬ鎖とのペアにより構成されている。ＩｇＧは蛋白質分解酵素パパインによって、Ｙ字型の上側の二股の部分であるＦａｂ領域と、Ｙ字型の下型の縦棒の部分であるＦｃ部分に分解される。Ｆａｂ断片はＨ鎖とＬ鎖とのペアにより構成され、Ｆｃ断片はＨ鎖のみで構成されている。

【0035】

Ｙ字型の二股の部分の上部（Ｆａｂ領域）のＨ鎖およびＬ鎖は可変領域を含み、結合する抗原に対応して大きく変化するアミノ酸配列を有する。可変領域を除く部分（Ｆｃ領域）は、定常領域と呼ばれ、結合する抗原が異なる抗体間でも共通配列を多く保持する。

【0036】

Ｈ鎖およびＬ鎖のそれぞれの可変部は、ＣＤＲ（Complementarity Determining Region：相補性決定領域）１、ＣＤＲ２およびＣＤＲ３を有する。ＣＤＲ１からＣＤＲ３は、それぞれ約２個から約３１個のアミノ酸により構成されたポリペプチドである。なおＩｇＧ構造を持たないアルパカ等のラクダ科の実験動物のＨ鎖やサメ等の軟骨魚類のＨ鎖も可変領域を持ち、同様に３種類のＣＤＲ領域を保有する。

【0037】

ＣＤＲは、可変領域内でも特に結合する抗原に応じて配列の多様性の大きい部分である。抗体は、主にＣＤＲの配列が形成する立体構造を介して抗原との結合特異性を発揮する。

【0038】

図４は、抗体の物性および活性を説明する説明図である。図４Ａは、抗体の物性を説明する説明図である。物性は、たとえば分子量、極性表面積、炭素原子数、窒素原子数、二重結合数、油水分配係数あるいはその対数（LogP）、分子屈折率、水素結合受容体数、水素結合供与体数、回転可能な結合数、部分電荷、総電荷、力場ＭＭＦＦ（Merck Molecular Force Field）９２ｓ下におけるエネルギー、および、立体的体積等の各種分子記述子を含む、抗体分子自体の性質である。

【0039】

これらの物性のうち、分子量、炭素原子数、窒素原子数、二重結合数等については、アミノ酸配列から直接算出できる。極性表面積、油水分配係数等の、アミノ酸配列からは直接算出できない物性については、抗体分子を遺伝子組み換え技術等を用いて作製して実測するか、または、物性シミュレータ５５を用いて推定する。

【0040】

物性シミュレータ５５の詳細について説明する。物性シミュレータ５５は、いわゆる2D descriptorまたは3D descriptor 等の物性を推定可能である。2D descriptor は、たとえば油水分配係数もしくはその対数、および、ＴＰＳＡ（Topological Polar Surface Area：位相幾何学的極性表面積）のようにアミノ酸配列から推定可能な物性である。

【0041】

3D descriptor は、たとえばＣＰＳＡ（Charged Polar Surface Area）およびＭｏＲＳＥ（Molecule Representation of Structure based on Electron diffraction）のように、立体構造シミュレータ５９により生成した立体構造に基づいて推定可能な物性である。ＣＰＳＡおよびＭｏＲＳＥは、ＨＯＭＯ（orbital energies of Highest Occupied Molecular Orbital）、または、ＬＵＭＯ（Lowest Unoccupied Molecular Orbital）のような量子化学計算に基づいて算出されても良い。

【0042】

立体構造シミュレータ５９の詳細について説明する。立体構造シミュレータ５９によるポリペプチドの立体構造の推定には、たとえばホモロジーモデリング法、および、ab initio法（de novo法）が用いられる。

【0043】

ホモロジーモデリング法は立体構造が公知となっている蛋白質を構成するアミノ酸配列と、立体構造を予測したい蛋白質を構成するアミノ酸配列とを比較し、両者の配列類似度が高い場合に利用される。ホモロジーモデリング法においては、立体構造が公知である蛋白質の立体構造上の位置に、立体構造を予測したい蛋白質のアミノ酸を配列する。アミノ酸同士の立体障害およびエネルギーの最小化等により、公知である立体構造からは少し変化した新たな立体構造が構築される。

【0044】

ab initio法は、立体構造が公知となっている蛋白質を構成するアミノ酸配列との配列類似度が低い蛋白質の立体構造を推定する場合に利用される。たとえば、タンパク質の部分構造を組み合わせるフラグメントアセンブリ法等を用いて立体構造を予測できる。

【0045】

ホモロジーモデリング法を用いて標的抗体単独の立体構造を予測する場合には、前述のＭｏｄｅｌｌｅｒまたはＳｗｉｓｓＭｏｄｅｌ等のソフトウェアを利用できる。
ホモロジーモデリング法を用いて標的抗体および標的抗原の複合体の立体構造を予測する場合には、前述のＭｏｄｅｌｌｅｒまたはＨＯＭＣＯＳ等のソフトウェアを利用できる。

【0046】

ab initio法を用いて標的抗体単独の立体構造を予測する場合には、前述のＲｏｓｅｔｔａまたはＥＶｆｏｌｄ等のソフトウェアが使用できる。ab initio法を用いて標的抗体および標的抗原の複合体の立体構造を予測する場合には、前述のＺＤＯＣＫ、ＨＡＤＤＯＣＫ等のソフトウェアを使用できる。

【0047】

それぞれの物性は、抗体全体について定義しても、Ｌ鎖、Ｈ鎖、Ｈ鎖の可変領域等、抗体の一部について定義しても良い。図示を省略するが、抗体のＦａｂ領域、Ｆ（ａｂ’）₂領域、Ｖ_L（Variable region Light）領域、Ｖ_H（Variable region Heavy）領域等について、物性を定義しても良い。

【0048】

なお、上記に列挙したのは物性の一例である。公知の数千種類の分子記述子（非特許文献１）から、後述の活性との関連性があると期待する任意の分子記述子を選択して、本実施の形態の物性に使用できる。新たな分子記述子を定義して、本実施の形態の物性に使用しても良い。

【0049】

図４Ｂは、抗体の活性を説明する説明図である。活性は、たとえば結合定数、解離定数、結合速度定数、解離速度定数、抗体価、抗原特異性、保存安定性、ｐＨプロファイルおよび凝集性、阻害活性（活性を５０％阻害する濃度であるＩＣ５０、活性を５０％中和する濃度であるＮＤ５０等）等の、抗体と抗原との組合せに関する性質である。

【0050】

上記のうち、結合定数、解離定数、結合速度定数および解離速度定数は、抗原と抗体とが結合する抗原抗体反応における結合性能、すなわち親和性を示す指標の例である。抗体価は、抗原と複合体を形成するのに必要な抗体量を示す指標である。特異性は、標的抗原と、これに類似する物質とを識別する能力を示す指標である。保存安定性は、親和性の経時変化の程度を示す指標である。ｐＨプロファイルは、ｐＨの変化による親和性の変化の程度を示す指標である。

【0051】

活性には、抗体のコロイド安定性、すなわち抗体と溶液との組合せを示す指標である凝集性を加えても良い。活性には、遺伝子組み換え培養細胞による抗体の産生量、すなわち抗体と培養細胞との組合せを示す指標である、抗体産生細胞の発現効率を加えても良い。

【0052】

活性は、抗体分子を作製して実測するか、または、ドッキングシミュレーションを用いて推定結合活性値を算出する。

【0053】

図５は、学習モデル５３の概要を説明する説明図である。学習モデル５３の入力データは抗体の物性であり、学習モデル５３の出力データは抗体の活性を推定した推定活性値である。学習モデル５３は入力層５３１、中間層５３２および出力層５３３を有する。なお、物性および活性は、たとえば基準値に対する比の値等への無次元化等の処理を行った値であっても良い。

【0054】

入力層５３１の入力ニューロンの数は、入力データに使用する物性の項目数である。出力層５３３の出力ニューロンの数は、１個である。学習モデル５３は、入力層５３１に抗体の物性が入力された場合に、出力層５３３に抗体の推定活性値を出力する。出力層５３３は、所定の複数のクラスの代表値の中から最も確率の高い値を出力してもよい。出力層５３３は、ベイズニューラルネットワークの手法等を用いて、推定活性値と、その値の信頼度または分散とを出力してもよい。

【0055】

補助記憶装置２３には、たとえば結合定数、解離定数、結合速度定数、解離速度定数、抗体価、抗原特異性、保存安定性、ｐＨプロファイル、凝集性、阻害濃度等の活性を出力層５３３に出力する学習モデル５３がそれぞれ保存されている。

【0056】

制御部２１は、既知の物性と活性とを関連づけて記録した教師データＤＢ５１を用いて、誤差逆伝播法等を用いて中間層５３２のパラメータを演算し、学習モデル５３を生成する。

【0057】

教師あり機械学習は、たとえばロジスティック回帰、ＳＶＭ（Support Vector Machine）、ランダムフォレスト、ＣＮＮ（Convolution Neural Network：畳み込みニューラルネットワーク）、ＲＮＮ（Recurrent Neural Network：再起型ニューラルネットワーク）または、ＸＧＢｏｏｓｔ（eXtreme Gradient Boosting）等の任意の手法により行なえる。

【0058】

数千もの分子記述子を物性として用いることで説明変数の取りこぼしを回避したい場合には、機械学習の目的関数に正則化項を付与することで、推定に有効な説明変数を効率的に絞り込むことができる。たとえば、ＬＡＳＳＯ（Least Absolute Shrinkage and Selection Operator）ロジスティック回帰、Ｒｉｄｇｅ回帰またはＥｌａｓｔｉｃＮｅｔ回帰等を用いることで推定精度を高めることができる。

【0059】

本実施の形態においては、制御部２１は、複数の手法を用いてそれぞれ学習モデル５３を生成し、活性を予測する精度の高い学習モデル５３を採用する。学習モデル５３の精度を評価するためには、制御部２１は、教師データを訓練データと評価データとに分ける。制御部２１は、訓練データに基づいて学習モデル５３を生成する。

【0060】

制御部２１は、評価データに基づいて学習モデル５３の精度を評価する。精度には、正確度（Accuracy）、陽性的中率（Precision）、感度（Recall）、特異度（Specificity）およびＦ値（F-measure）等の複数の評価指標がある。

【0061】

なお、高い精度を得られる手法が判っている場合には、制御部２１はその手法を用いて学習モデル５３を生成しても良い。

【0062】

図６は、抗体を開発する手順の概要を説明する説明図である。前述の通り、動物等に標的抗原を投与して、プロトタイプ抗体を得る。制御部２１は、プロトタイプ抗体のアミノ酸配列をランダムに変異させて、多数の変異配列を自動生成する。変異配列は、たとえばプロトタイプ抗体のアミノ酸配列の任意の箇所に、アミノ酸の置換、挿入、または欠失の処理を行って生成する。変異配列は、変異抗体のアミノ酸配列である。

【0063】

制御部２１は、アミノ酸の置換、挿入、または欠失の処理を、プロトタイプ抗体のアミノ酸配列のうちの１箇所に対して行なっても、複数個所に対して行なっても良い。制御部２１は、１ヶ所の置換、挿入、または欠失の処理を、プロトタイプ抗体のアミノ酸配列のうちの１個のアミノ酸について行なっても、連続する複数のアミノ酸について行なっても良い。

【0064】

なお、変異配列を、プロトタイプ抗体を構成するアミノ酸の一部を置換した配列に限定してもよい。このように限定することにより、抗体を探索する範囲が狭くなる代わりに、処理速度が向上する。

【0065】

変異配列を、プロトタイプ抗体の可変領域を構成するアミノ酸の一部を置換、挿入または欠失した配列に限定してもよい。このように限定することにより、変異配列ライブラリＤＢ５２に抗体の性質を有さない変異配列が含まれにくくなるため、処理速度が向上する。

【0066】

変異配列を、プロトタイプ抗体のＣＤＲを構成するアミノ酸の一部を置換、挿入または欠失した配列に限定してもよい。このように限定することにより、変異配列ライブラリＤＢ５２に抗体の性質を有さない変異配列が含まれにくくなるため、処理速度が向上する。

【0067】

図６においては、変異配列を抗体の形状の相違により模式的に表現する。制御部２１は、自動生成したそれぞれの変異配列について、物性シミュレーションにより物性を算出する。制御部２１は、算出した物性を学習モデル５３に入力して、推定活性値を得る。制御部２１は、推定活性値の高い変異配列を選択する。以上の処理により、自動作成した多数の変異配列を、学習モデル５３を使用してスクリーニングする。

【0068】

制御部２１は、選択した強化配列に対して強化学習を行ない改良する。制御部２１は、改良の結果、活性が非常に高くなった変異配列を選択して出力する。ユーザは、出力された変異配列について、実験抗体を作製して、物性および活性を実測する。

【0069】

実測の結果、所望の活性が得られた場合に、標的抗原に対する抗体の設計を終了する。所望の活性が得られない場合、ユーザは実測した結果を教師データＤＢ５１に追加する。制御部２１は、学習モデル５３を更新する。

【0070】

強化学習の概要を説明する。強化学習は、ある環境下におかれたエージェントが現在の状態を観測し、取るべき行動を決定する問題を扱う機械学習アルゴリズムである。エージェントは行動を選択することで、行動の結果に対応する報酬を得る。エージェントは複数の行動を繰り返す試行錯誤を通じて、報酬を最大化するような行動を学習する。なお、強化学習は、複数のエージェントを用いて実装されても良い。

【0071】

本実施の形態においては、状態は抗体のアミノ酸配列および活性である。行動は、アミノ酸配列の変更である。行動により抗体の活性が上昇した場合に、エージェントは正の報酬を得、行動により活性が低下した場合にエージェントは負の報酬、すなわちペナルティを得る。

【0072】

図７は、強化学習段階を説明する説明図である。図７を使用して、１順目の強化学習の概要を説明する。制御部２１は、学習モデル５３により推定活性値が高いと判定された抗体候補のアミノ酸配列を、変異生成部５４に入力する。変異生成部５４は、制御部２１により実行されるソフトウェア、または制御部２１による制御に基づいて動作するハードウェアにより構成されている。

【0073】

変異生成部５４は、ニューラルネットワークモデル６０に接続されている。ニューラルネットワークモデル６０は、強化学習におけるエージェントの一例である。ニューラルネットワークモデル６０の詳細については、後述する。

【0074】

変異生成部５４は、ニューラルネットワークモデル６０の出力に基づいて、入力されたアミノ酸配列を変異させる。本実施の形態においては、変異生成部５４はいずれかのＣＤＲを構成するポリペプチドのうちの、１個のアミノ酸を、他のアミノ酸に置換する。

【0075】

制御部２１は、変異生成部５４で変異させたアミノ酸配列をドッキングシミュレータ５６に入力して、標的抗原とのドッキングシミュレーションを行ない、推定結合活性値を算出する。制御部２１は、活性の増減に基づいて定めた報酬を、変異生成部５４を介してニューラルネットワークモデル６０に入力して、強化学習を行なう。以上の処理を繰り返すことにより、ＣＤＲ全体を変異させることが可能である。

【0076】

なお、ニューラルネットワークモデル６０および変異生成部５４は、抗体の可変領域のアミノ酸配列から、変異させるアミノ酸を選択しても良い。ニューラルネットワークモデル６０および変異生成部５４は、抗体全体のアミノ酸配列から、変異させるアミノ酸を選択しても良い。

【0077】

図８は、強化学習段階を説明する説明図である。図８においては、強化学習の１手法であるＱ学習により、深層強化学習を行なう場合を例にして説明する。変異生成部５４は、状態ｓ_nを取得して、ニューラルネットワークモデル６０に入力する。状態ｓ_nは、深層強化学習の第ｎ回目のループで処理する抗体のアミノ酸配列および活性の組合せである。

【0078】

ニューラルネットワークモデル６０は、状態ｓ_nに対して変異生成部５４が取り得る行動のそれぞれについて、Ｑ関数の値であるＱ値を算出して出力する。Ｑ関数は、それぞれの行動の価値を算出する関数である。

【0079】

行動ａ_nは、変更するアミノ酸の位置、および、変更後のアミノ酸の種類の２つのパラメータにより定められる、アミノ酸配列の変更である。表１に、行動ａ_nを定めるパラメータの例を示す。

【0080】

【表1】

【0081】

表１において、変更するアミノ酸の位置は、ＣＤＲを構成するアミノ酸に連番で付与した番号により示す。Alaはアラニンを、Asnはアスパラギンを、Glnはグルタミンをそれぞれ意味する３文字表記である。タンパク質を構成するアミノ酸は、２０種類である。変更するアミノ酸の位置と、変更後のアミノ酸とは、それぞれ独立して選択される。

【0082】

図９は、ニューラルネットワークモデル６０の構成を示す説明図である。ニューラルネットワークモデル６０は入力層６０１、中間層６０２および出力層６０３を有する。

【0083】

入力層６０１の入力ニューロンの数は、状態ｓ_nを表現する項目の数である。図９においては、入力ニューロンの数は、活性の項目数に１を加えた数である。抗体のアミノ酸配列のそれぞれのアミノ酸を入力ニューロンに対応させても良い。そのようにする場合は、入力ニューロンの数は活性の項目数に、アミノ酸の数を加えた数である。ＣＤＲ１からＣＤＲ３のそれぞれのポリペプチドのアミノ酸配列を、入力ニューロンに対応させても良い。

【0084】

出力層６０３の出力ニューロンは、状態ｓ_nにある場合に行動ａ_nを行なうことの行動価値を示すＱ関数、Ｑ（ｓ_n，ａ_n）に基づいてＱ値を出力する。行動ａ_nは、変更するアミノ酸の位置と、変更後のアミノ酸との組により表現される。

【0085】

たとえば、強化学習により変異させる対象を、ＶＨ領域のＣＤＲ３のポリペプチドに限定し、取り得るすべての行動ａ_nを出力する場合、出力ニューロンはアミノ酸の種類数２０を、ＣＤＲ３に含まれるアミノ酸の数である８乗した、２５６億個である。同様に、強化学習により変異させる対象を、ＶＬ領域のＣＤＲ３のポリペプチドに限定し、取り得るすべての行動ａ_nを出力する場合、出力ニューロンはアミノ酸の種類数２０を、ＣＤＲ３に含まれるアミノ酸の数である９乗した、５１２０億個である。

【0086】

図８に戻って説明を続ける。変異生成部５４は、出力ニューロンに出力されたＱ値から、比較的Ｑ値が高い行動ａ_nを１つ選択する。変異生成部５４は、εの確率でランダムに行動ａ_nを選択し、（１－ε）の確率でＱ値が最大である行動ａ_nを選択する、εグリーディ法に基づいて行動ａ_nを選択しても良い。このようにすることにより、強化学習の探索範囲が狭くなりすぎることを防止できる。

【0087】

変異生成部５４は、選択した行動ａ_nを実行して、抗体のアミノ酸配列を変異させる。制御部２１は、変異生成部５４が変異させたアミノ酸配列をドッキングシミュレータ５６に入力する。ドッキングシミュレータ５６が、ドッキングシミュレーションにより活性を算出する。

【0088】

制御部２１は、算出された活性を報酬算出部５７に入力する。報酬算出部５７は、算出された活性に基づいて行動ａ_nに対する報酬ｒ_n+1を算出する。報酬ｒ_n+1は、活性が上昇した場合に正の値になり、活性が低下した場合に負の値になる。なお、図４を使用して説明した活性を示す多くの項目のうち、どの項目の変化を重視するかは、所望の抗体の特性により定められる。

【0089】

たとえば、標的抗原と強く結合する抗体を開発する場合には、結合定数が増加することを重視して報酬ｒ_n+1を算出するように、算出方法が定められる。標的抗原と速やかに結合する抗体を開発する場合には、結合速度定数が増加することを重視して報酬ｒ_n+1を算出するように、算出方法が定められる。報酬算出部５７は、制御部２１により実行されるソフトウェア、または制御部２１による制御に基づいて動作するハードウェアにより構成されている。

【0090】

制御部２１は、状態ｓ_n+1、および、前回の行動ａ_nに対する報酬ｒ_n+1を変異生成部５４を介してニューラルネットワークモデル６０に入力する。制御部２１は、（１）式に基づいてニューラルネットワークモデル６０を更新する。

【0091】

Ｑ（ｓ_n，ａ_n）←Ｑ（ｓ_n，ａ_n）
＋α｛ｒ_n+1＋γ・maxＱ（ｓ_n+1，ａ_n+1）－Ｑ（ｓ_n，ａ_n）｝
‥‥‥（１）
αは、学習係数である。
γは割引率である。
ｒ_n+1は、行動ａ_nの結果得られる報酬である。

【0092】

学習係数αは、学習の速度を決定するパラメータである。αは、
０＜α＜１
を満たす。

【0093】

割引率γは、未来の状態に対する評価をどの程度割り引いて評価するかを示すパラメータである。γは、
０＜γ＜１
を満たす。

【0094】

Ｑ学習においては、（１）式の第２項である｛ｒ_n+1＋γ・maxＱ（ｓ_n+1，ａ_n+1）－Ｑ（ｓ_n，ａ_n）｝がゼロになるように、誤差逆伝播法等を用いて中間層６０２のパラメータを学習する。これは、行動価値Ｑ（ｓ_n，ａ_n）が、報酬ｒ_n+1と、次の状態ｓ_n+1において可能な行動のなかで最大の行動価値maxＱ（ｓ_n+1，ａ_n+1）との和になるように学習することを意味する。

【0095】

制御部２１は、学習後のニューラルネットワークモデル６０に、行動ｓ_n+1を入力して、行動ａ_n+1を出力させる。制御部２１は、出力された行動ａ_n+1を、変異生成部５４に入力する。

【0096】

制御部２１は、以上に説明したニューラルネットワークモデル６０の更新を、所定の回数、または、所定の条件を満足するまで繰り返すことにより、報酬ｒ_n+1を最大化するようにニューラルネットワークモデル６０を調整する。所定の条件は、たとえば報酬ｒ_n+1が所定の閾値以下になった場合である。

【0097】

強化学習の手法は、Ｑ学習に限定しない。たとえば、ＴＤ（Temporal Difference Learning）学習、ＳＡＲＳＡ、モンテカルロ法等、任意の強化学習アルゴリズムを使用できる。

【0098】

図１０は、教師データＤＢ５１のレコードレイアウトを説明する説明図である。教師ＤＢ５１は、既知抗体のアミノ酸配列と、物性と、活性とを関連づけて記録するＤＢである。教師ＤＢ５１は、教師ＩＤ（Identifier）フィールドと、アミノ酸配列フィールドと、物性フィールドと、活性フィールドとを有する。

【0099】

物性フィールドは、たとえば分子量フィールド、極性表面積フィールド等の、各種の物性を記録するサブフィールドを有する。活性フィールドは、たとえば結合定数フィールド、解離定数フィールド、結合速度定数フィールド、および、解離速度定数フィールド等の、各種の活性を記録するフィールドを有する。

【0100】

教師ＩＤフィールドには、教師データに固有に付与された教師ＩＤが記録されている。アミノ酸配列フィールドには、抗体のアミノ酸配列が記録されている。物性フィールドの各サブフィールドには、物性がそれぞれ記録されている。活性フィールドの各サブフィールドには、活性がそれぞれ記録されている。教師データＤＢ５１は、１組の教師データについて１つのフィールドを有する。初期状態においては、教師データＤＢ５１には図１を使用して説明したプロトタイプ抗体にかかる情報が記録されている。

【0101】

図１１は、変異配列ライブラリＤＢ５２のレコードレイアウトを説明する説明図である。変異配列ライブラリＤＢ５２は、抗体のアミノ酸配列と、物性と、学習モデル５３を用いて得た推定活性値と、推定活性値を判定した判定結果とを関連づけて記録するＤＢである。変異配列ＤＢ５２は、教師ＩＤフィールドと、アミノ酸配列フィールドと、物性フィールドと、活性フィールドと、判定フィールドとを有する。

【0102】

物性フィールドは、たとえば分子量フィールド、極性表面積フィールド等の、各種の物性を記録するサブフィールドを有する。変異配列ライブラリＤＢ５２の物性フィールドのサブフィールドは、教師データＤＢ５１の物性フィールドのサブフィールドに対応している。活性フィールドは、たとえば結合定数フィールド、解離定数フィールド等の、各種の活性を記録するフィールドを有する。変異配列ライブラリＤＢ５２の活性フィールドのサブフィールドは、教師データＤＢ５１の活性フィールドのサブフィールドに対応している。

【0103】

教師ＩＤフィールドには、変異配列を作成する元に使用された教師データに固有に付与された教師ＩＤが記録されている。アミノ酸配列フィールドには、抗体のアミノ酸配列が記録されている。物性フィールドの各サブフィールドには、物性がそれぞれ記録されている。活性フィールドの各サブフールドには、物性フィールドに記録された物性を学習モデル５３に入力して得た活性が記録されている。判定フィールドには、活性の良否を判定した判定結果が記録されている。判定フィールドの初期値は「未」である。「高」は活性が高いことを、「低」は活性が低いことをそれぞれ意味する。

【0104】

図４Ｂを使用して説明した活性を示す多くの項目のうち、どの項目の値を重視して判定を行なうか、および判定を行なう際の閾値は、所望の抗体の特性により定められる。たとえば、標的抗原と強く結合する抗体を開発する場合には、結合定数が所定の閾値よりも大きい場合に「高」と判定する。標的抗原と速やかに結合する抗体を開発する場合には、結合速度定数が所定の閾値よりも大きい場合に「高」と判定する。制御部２１は、活性に関する複数の項目のデータを演算した結果に基づいて判定しても良い。

【0105】

判定フィールドには活性を定量的に評価した数値が記録されても良い。活性フィールドは、複数のサブフィールドを有し、複数の観点でそれぞれ評価した活性が記録されても良い。教師データＤＢ５１は、一つの変異配列について１つのフィールドを有する。

【0106】

図１２は、強化後ＤＢ５８のレコードレイアウトを説明する説明図である。強化後ＤＢ５８は、強化学習により改良した変異配列と、点数とを関連づけて記録するＤＢである。

【0107】

強化後ＤＢ５８は、教師ＩＤフィールドと、アミノ酸配列フィールドと、点数フィールドとを有する。教師ＩＤフィールドには、強化学習を開始する際に用いた変異配列の元に使用された教師データに固有に付与された教師ＩＤが記録されている。アミノ酸配列フィールドには、強化学習により得たアミノ酸配列が記録されている。点数フィールドには、活性を評価して定めた点数が記録されている。強化後ＤＢ５８は、強化学習により得た１個のアミノ酸配列について、１つのレコードを有する。

【0108】

図１３は、プログラムの処理の流れを示すフローチャートである。制御部２１は、教師あり学習モデル生成のサブルーチンを起動する（ステップＳ５０１）。教師あり学習モデル生成のサブルーチンは、教師データＤＢ５１に記録された教師データに基づいて、学習モデル５３を生成するサブルーチンである。教師あり学習モデル生成のサブルーチンの処理の流れは後述する。

【0109】

制御部２１は、ライブラリ作成のサブルーチンを起動する（ステップＳ５０２）。ライブラリ作成のサブルーチンは、教師データＤＢ５１に記録された抗体のアミノ酸配列に基づいて、変異配列を作成するサブルーチンである。ライブラリ作成のサブルーチンの処理の流れは後述する。

【0110】

制御部２１は、変異配列ライブラリＤＢ５２から１つのレコードを抽出し、物性フィールドに記録された物性を取得する（ステップＳ５０３）。制御部２１は、物性を複数の学習モデル５３のそれぞれに入力して、推定活性値を取得する（ステップＳ５０４）。制御部２１は、推定活性値に基づいて、それぞれの活性の良否を判定する。

【0111】

制御部２１は、ステップＳ５０３で抽出したレコードの活性フィールドおよび判定フィールドに、推定活性値および活性の良否の判定結果を記録する（ステップＳ５０５）。

【0112】

制御部２１は、処理を終了するか否かを判定する（ステップＳ５０６）。たとえば、制御部２１は、変異配列ライブラリＤＢ５２に記録されたレコードのうち、所定の数のレコードの処理を行なった場合に、処理を終了すると判定する。制御部２１は、ステップＳ５０５において所望の活性を有すると判定したアミノ酸配列が、所定の数を越えた場合に、処理を終了すると判定しても良い。

【0113】

終了していないと判定した場合（ステップＳ５０６でＮＯ）、制御部２１はステップＳ５０３に戻る。終了したと判定した場合（ステップＳ５０６でＹＥＳ）、制御部２１は、高い活性を有すると判定されたアミノ酸配列を１個取得する（ステップＳ５０７）。具体的には、制御部２１は、変異配列ライブラリＤＢ５２から、判定フィールドに高い活性が記録されたレコードを１個取得する。制御部２１は、アミノ酸配列フィールドに記録されたアミノ酸配列を取得する。

【0114】

なお、ステップＳ５０７で取得したアミノ酸配列が、既に処理済であるアミノ酸配列と類似している場合には、制御部２１は別のアミノ酸配列を取得しなおしても良い。ここで類似するとは、たとえば数個のアミノ酸を除いて同一のアミノ酸配列である場合である。次の強化学習のプロセスにおいては、類似したアミノ酸配列から開始した場合には、同一の結果に収束する可能性があるためである。

【0115】

制御部２１は、強化学習のサブルーチンを起動する（ステップＳ５０８）。強化学習のサブルーチンは、強化学習を用いてアミノ酸配列を変更し、抗体の活性を改善するサブルーチンである。強化学習のサブルーチンの処理の流れは後述する。

【0116】

制御部２１は、強化学習による抗体の改善を終了するか否かを判定する（ステップＳ５０９）。たとえば制御部２１は、変異配列ライブラリＤＢ５２に記録されたレコードのうち、所定の数のレコードの処理を終了した場合に、強化学習による抗体の改善を終了すると判定する。制御部２１は、ステップＳ５０５において所定の活性を有すると判定したアミノ酸配列の処理を終了した場合に、強化学習による抗体の改善を終了すると判定しても良い。

【0117】

終了しないと判定した場合（ステップＳ５０９でＮＯ）、制御部２１はステップＳ５０７に戻る。終了すると判定した場合（ステップＳ５０９でＹＥＳ）、制御部２１は高い活性を有すると判定されたアミノ酸配列を出力する（ステップＳ５１０）。出力の形式は、たとえば所定のアミノ酸配列を有するタンパク質を合成する合成装置への入力データである。出力の形式は、アミノ酸配列をコードした核酸塩基配列であっても良い。

【0118】

ユーザは、ステップＳ５１０で出力された配列に基づいて実験抗体を作製し、活性を実験的に測定する（ステップＳ５１１）。制御部２１は、ユーザにより測定された活性の測定結果を取得する。ユーザは、目標とする抗体の開発を終了するか否かを判定する（ステップＳ５１２）。開発を終了するとユーザが判定した場合（ステップＳ５１２でＹＥＳ）、ユーザの指示に基づいて制御部２１は処理を終了する。

【0119】

目標とする抗体の開発を終了しないとユーザが判定した場合（ステップＳ５１２でＮＯ）、ユーザの指示に基づいて制御部２１は測定結果を取得する（ステップＳ５１３）。制御部２１は、教師データＤＢ５１に新規レコードを追加して、ステップＳ５１０で取得したアミノ酸配列と、ステップＳ５１３で取得した活性とを記録する（ステップＳ５１４）。

【0120】

制御部２１は、教師あり学習モデル生成のサブルーチンを起動して、学習モデル５３の再学習を行なう（ステップＳ５１５）。教師あり学習モデル生成のサブルーチンは、ステップＳ５０１で起動したサブルーチンと同一のサブルーチンである。制御部２１は、ステップＳ５０３に戻る。

【0121】

図１４は、教師あり学習モデル生成のサブルーチンの処理の流れを示すフローチャートである。教師あり学習モデル生成のサブルーチンは、教師データＤＢ５１に記録された教師データに基づいて、学習モデル５３を生成するサブルーチンである。

【0122】

制御部２１は、教師データＤＢ５１から、物性と活性とを組にした訓練データを取得する（ステップＳ５２１）。訓練データは、教師データから後に使用する評価データを除いたデータである。評価データは、教師データＤＢ５１に記録されたレコードからランダムに選択することが望ましい。

【0123】

制御部２１は、たとえばロジスティック回帰、ＳＶＭ、ランダムフォレスト、ＣＮＮ、ＲＮＮまたはＸＧＢｏｏｓｔ等の任意の手法を用いた教師あり機械学習により、図５を使用して説明した中間層５３２を調整して、学習モデル５３を生成する（ステップＳ５２２）。

【0124】

制御部２１は、教師データＤＢ５１から評価データを取得する（ステップＳ５２３）。制御部２１は、評価データの物性をステップＳ５２２で生成した学習モデル５３に入力して出力された推定活性値と、評価データに記録された活性とを対比して、学習モデル５３の精度を評価する（ステップＳ５２４）。

【0125】

たとえば、制御部２１は、学習モデル５３から出力された推定活性値と、実測活性値、評価データに記録された活性との残差が、実測活性値の２割以内である場合に推定活性値は正答であり、それ以外の場合に誤答であると判定する。制御部２１は、正答数と誤答数とに基づいて、Accuracy、Precision、Recall、SpecificityまたはF-measure等の、学習モデルの精度に関する指標を算出する。

【0126】

図４を使用して説明した活性を示す多くの項目のうち、どの項目を重視して学習モデル５３の精度を評価するかは、所望の抗体の特性により定められる。たとえば、標的抗原と強く結合する抗体を開発する場合には、結合定数が一致することを重視して評価を定める。標的抗原と速やかに結合する抗体を開発する場合には、結合速度定数が一致することを重視して評価を定める。

【0127】

制御部２１は、補助記憶装置２３または主記憶装置２２に、学習モデル５３の精度を記録する（ステップＳ５２５）。制御部２１は、所定の手法による学習モデル５３の作成を終了したか否かを判定する（ステップＳ５２６）。終了していないと判定した場合（ステップＳ５２６でＮＯ）、制御部２１はステップＳ５２２に戻る。

【0128】

終了したと判定した場合（ステップＳ５２６でＹＥＳ）、制御部２１はステップＳ５２５で記録したそれぞれの学習モデル５３の評価に基づいて、どの学習モデル５３を以後の工程で使用するかを選択する（ステップＳ５２７）。制御部２１は、選択した学習モデル５３を補助記憶装置２３に記録する。制御部２１は、処理を終了する。

【0129】

適切な教師あり学習モデル生成手法が知られている場合には、ステップＳ５２５およびステップＳ５２６を省略しても良い。本サブルーチンを２回目以降に実行する場合には、前回の手法で学習モデル５３を生成し、ステップＳ５２５およびステップＳ５２６を省略しても良い。

【0130】

ステップＳ５２３において、所定の精度が得られていると判定した場合、ステップＳ５２５において制御部２１は処理を終了すると判定しても良い。

【0131】

図１５は、ライブラリ作成のサブルーチンの処理の流れを示すフローチャートである。ライブラリ作成のサブルーチンは、教師データＤＢ５１に記録された抗体のアミノ酸配列に基づいて、変異配列を作成するサブルーチンである。

【0132】

制御部２１は、教師データＤＢ５１から１個のレコードを取得して、アミノ酸配列フィールドに記録されたアミノ酸配列を取得する（ステップＳ５３１）。制御部２１は、取得したアミノ酸配列の任意の箇所に、任意のアミノ酸の置換、挿入、または欠失の処理を行って、変異配列を生成する（ステップＳ５３２）。

【0133】

ステップＳ５３２において、制御部２１は、置換、挿入、または欠失を行なう場所をランダムに選択する。制御部２１は、置換、挿入または欠失のいずれの処理を行なうかをランダムに選択する。置換または挿入の処理を行なう場合、制御部２１は置換または挿入を行なうアミノ酸をランダムに選択する。

【0134】

制御部２１は、アミノ酸の置換、挿入、または欠失の処理を、ステップＳ５３１で取得したアミノ酸配列のうちの１箇所に対して行なっても、複数個所に対して行なっても良い。制御部２１は、１ヶ所の置換、挿入、または欠失の処理を、アミノ酸配列のうちの１個のアミノ酸について行なっても、連続する複数のアミノ酸について行なっても良い。

【0135】

制御部２１は、ステップＳ５３２における処理を、ステップＳ５３１で取得したアミノ酸配列に含まれるアミノ酸の一部を他のアミノ酸に置換する処理に限定しても良い。このように限定することにより、抗体を探索する範囲が狭くなる代わりに、処理速度が向上する。

【0136】

制御部２１は、ステップＳ５３２において、アミノ酸の置換、挿入または欠失の処理を行なう場所を、抗体の可変領域を構成するアミノ酸に限定してもよい。このように限定することにより、変異配列ライブラリＤＢ５２に抗体の性質を有さない変異配列が含まれにくくなるため、処理速度が向上する。

【0137】

制御部２１は、ステップＳ５３２において、アミノ酸の置換、挿入または欠失の処理を行なう場所を、抗体のＣＤＲを構成するアミノ酸に限定してもよい。このように限定することにより、変異配列ライブラリＤＢ５２に抗体の性質を有さない変異配列が含まれにくくなるため、処理速度が向上する。

【0138】

制御部２１は、ステップＳ５３２で生成した変異配列を物性シミュレータ５５に入力して、物性を取得する（ステップＳ５３３）。制御部２１は、変異配列ライブラリＤＢ５２に新規レコードを作成し、ステップＳ５３１で取得したアミノ酸配列の教師ＩＤ、ステップＳ５３２で生成したアミノ酸配列およびステップＳ５３３で取得した物性を記録する（ステップＳ５３４）。制御部２１は、新規レコードの判定フィールドを「未」を記録する。

【0139】

制御部２１は、ステップＳ５３１で取得したアミノ酸配列に関する変異配列の作成を終了するか否かを判定する（ステップＳ５３５）。制御部２１は、たとえば所定の数のレコードを変異配列ＤＢ５２に記録した場合に、変異配列ライブラリＤＢ５２の作成を終了すると判定する。終了しないと判定した場合（ステップＳ５３５でＮＯ）、制御部２１はステップＳ５３２に戻る

【0140】

ステップＳ５３１で取得したアミノ酸配列に関する変異配列の作成を終了すると判定した場合（ステップＳ５３５でＹＥＳ）、制御部２１は、すべての教師データに関する変異配列の作成を終了したか否かを判定する（ステップＳ５３６）。終了していないと判定した場合（ステップＳ５３６でＮＯ）、制御部２１はステップＳ５３１に戻る。終了していると判定した場合（ステップＳ５３６でＹＥＳ）、制御部２１は処理を終了する。

【0141】

図１６は、強化学習のサブルーチンの処理の流れを示すフローチャートである。強化学習のサブルーチンは、強化学習を用いてアミノ酸配列を変更し、抗体の活性を改善するサブルーチンである。

【0142】

制御部２１は、抗体のアミノ酸配列をドッキングシミュレータ５６に入力して推定結合活性値を算出する、ドッキングシミュレーションを実施する（ステップＳ５４０）。ドッキングシミュレータ５６の処理においては、制御部２１はアミノ酸配列、すなわち抗体の一次構造に基づいて、抗体の立体構造を算出する。制御部２１は、抗体の立体構造と、標的抗原の立体構造とに基づいて、両者の結合状態をシミュレーションすることにより、推定結合活性値を算出する。

【0143】

制御部２１は、図９を使用して説明したニューラルネットワークモデル６０に状態ｓ、すなわち抗体のアミノ酸配列および活性を入力する。制御部２１は、状態ｓに対して取り得るそれぞれの行動ａに対するＱ（ｓ，ａ）をニューラルネットワークモデル６０から取得する（ステップＳ５４１）

【0144】

制御部２１は、Ｑ（ｓ，ａ）の高い行動ａを選択する（ステップＳ５４２）。制御部２１は、取得した行動ａに基づいて、変異配列を作成する（ステップＳ５４３）。制御部２１は、変異配列をドッキングシミュレータ５６に入力して推定結合活性値を算出する、ドッキングシミュレーションを実施する（ステップＳ５４４）。制御部２１は、推定結合活性値の変化に基づいて報酬ｒを算出する（ステップＳ５４５）。

【0145】

ステップＳ５４５において、制御部２１は、所定の評価方法に基づいて変異配列の推定結合活性値の点数を算出する。所定の評価方法は、所望の抗体の特性に基づいて定められている。たとえば、標的抗原と強く結合する抗体を開発する場合には、結合定数が増加した場合に高得点になる評価方法が採用される。標的抗原と速やかに結合する抗体を開発する場合には、結合速度定数が増加した場合に高得点になる評価方法が採用される。制御部２１は、点数の変化に基づいて報酬ｒを定める。なお、制御部２１は、点数自体に基づいて報酬を定めても良い。

【0146】

制御部２１は、処理を終了するか否かを判定する（ステップＳ５４６）。たとえば、所定の回数繰り返し処理を行った場合、報酬ｒが所定の値以下になった場合、または推定結合活性値の点数が所定の値以上になった場合等に、制御部２１は処理を終了すると判定する。

【0147】

処理を終了しないと判定した場合（ステップＳ５４６でＮＯ）、制御部２１は（１）式に基づいてニューラルネットワークモデル６０を更新する（ステップＳ５４７）。具体的には、制御部２１は誤差逆伝播法等を用いてニューラルネットワークモデル６０の中間層６０２のパラメータを演算して学習を行なう。制御部２１は、ステップＳ５４１に戻る。

【0148】

処理を終了すると判定した場合（ステップＳ５４６でＹＥＳ）、制御部２１は処理中の教師データにかかる教師ＩＤと、ステップＳ５４３で作成した変異配列と、ステップＳ５４４で算出した点数とを、強化後ＤＢ５８に記録する（ステップＳ５４８）。

【0149】

なお、制御部２１は、ステップＳ５４４のドッキングシミュレーションで算出した推定結合活性値を強化後ＤＢ５８に記録しても良い。

【0150】

本実施の形態によると、所望の活性を有する抗体を得る情報処理方法を提供できる。変異配列ライブラリＤＢ５２に多様なアミノ酸配列を作成して、学習モデル５３を用いて推定活性値を求めることにより、少ない計算量で多種多様な変異配列を評価して、有望なアミノ酸配列を選択できる。

【0151】

学習モデル５３を用いて選択した有望なアミノ酸配列について、強化学習を用いることにより、高い活性の抗体を得られる。学習モデル５３を用いて選択したアミノ酸配列から強化学習を開始することにより、いわゆるローカルミニマムに陥ることを防止できる。

【0152】

複数の手法を用いて作成した学習モデル５３の精度を比較して精度の高い学習モデル５３を選択することにより、標的抗原の特性に応じて適切な学習モデル５３を使用できる。

【0153】

計算量の多いドッキングシミュレーションを行なう対象を、計算量の少ない物性シミュレーションおよび学習モデル５３を用いて絞り込むことにより、全体の計算量を節約できる。ドッキングシミュレーションによりアミノ酸配列を絞り込んだ上で、実際に抗体を作製し、活性を実測することにより、抗体開発に要する期間および費用を節約できる。

【0154】

実測結果を教師データＤＢ５１に追加して学習モデル５３を更新することにより、学習モデル５３の精度を高めることができる。そのため、ループを繰り返すことにより所望する条件を満たす配列を発見する可能性が向上する情報処理方法を提供できる。

【0155】

既に標的抗原に対応する抗体が知られており、活性を向上させた抗体を設計する場合には、図１を使用して説明した実験動物を用いた抗体産生の工程を省略し、既知の抗体をプロトタイプ抗体の代わりに使用できる。同様に、プロトタイプ抗体の種類が少ない場合、または、プロトタイプ抗体が得られない場合も、既知の抗体をプロトタイプ抗体の代わりに使用できる。既知の抗体が、本実施の形態の情報処理装置２０を用いて設計された場合、設計に用いたニューラルネットワークモデル６０を初期状態として、深層強化学習を開始することにより、ニューラルネットワークモデル６０の学習時間を短縮できる。

【0156】

たとえば、Ｆａｂフラグメント等の、断片化した抗体の設計に本実施の形態の情報処理装置２０を使用しても良い。

【0157】

［実施の形態２］
本実施の形態は、教師データを追加する都度、変異配列ライブラリＤＢ５２を作成する情報処理装置２０に関する。実施の形態１と共通する部分については、説明を省略する。図１７は、実施の形態２のプログラムの処理の流れを示すフローチャートである。

【0158】

ステップＳ５１４までの処理は、図１３を使用して説明した実施の形態１のプログラムの処理の流れと同一であるため、説明を省略する。制御部２１は、ステップＳ５０１に戻る。

【0159】

本実施の形態によると、新たに追加された教師データに対しても変異配列を作成するため、アミノ酸配列の検索を行なう範囲を広くできる。

【0160】

なお、ステップＳ５０２で起動するライブラリ作成のサブルーチンで作成する変異配列の数を実施の形態１よりも少なくしても良い。教師データ、すなわち有望なアミノ酸配列の周辺を重点的に調べる情報処理方法を提供できる。

【0161】

［実施の形態３］
本実施の形態は、変異配列ライブラリＤＢ５２に記録するアミノ酸配列を、所定の置換行列に基づいて作成する情報処理装置２０に関する。実施の形態１と共通する部分については、説明を省略する。

【0162】

ＢＬＯＳＵＭ行列（Blocks Substitution Matrix：ブロックアミノ酸置換行列）、および、ＰＡＭ（Point Accepted Mutation）行列等の、進化上のアミノ酸の置換の発生頻度を表わす置換行列が使用されている。ＢＬＯＳＵＭ行列には、ＢＬＯＳＵＭ５０、ＢＬＯＳＵＭ６２、ＢＬＯＳＵＭ６４等の種々のバリエーションが存在する。

【0163】

置換行列は、たとえば（２）式のように表現できる。なお（２）式は一部を省略して示すが、右辺は２０行×２０列の２次元行列である。

【0164】

【数1】

【0165】

本実施の形態においては、図１５を使用して説明したライブラリ作成のサブルーチンのステップＳ５３２において、制御部２１は、アミノ酸の置換を行なう場所をランダムに選択する。制御部２１は、選択した場所のアミノ酸を取得する。制御部２１は、（２）式を使用して説明した置換行列において、選択した場所のアミノ酸に対応する行に示される置換の発生頻度に基づいて、置換後のアミノ酸を定める。以上により、制御部２１は、アミノ酸の置換を行った後の変異配列を作成する。

【0166】

具体例を挙げて説明する。置換行列において元のアミノ酸がアラニンに置換される頻度が５０パーセント、アルギニンに置換される頻度が５０パーセント、それ以外のアミノ酸に置換される頻度が０パーセントである場合、制御部２１は、乱数または擬似乱数に基づいて、確率的発生頻度が置換行列と等しくなるという条件下でランダムにアラニンまたはアルギニンを置換後のアミノ酸に決定する。

【0167】

制御部２１は、置換後のアミノ酸をランダムに定めた後に、（２）式に示す置換行列を参照して、当該置換の発生頻度が所定の閾値未満である場合には、置換後のアミノ酸を定めなおしても良い。

【0168】

本実施の形態によると、公知の置換行列を用いることにより、進化上のアミノ酸の置換頻度に基づいて変異配列を生成できる。このようにして生成した変異配列は、抗体の機能を有する確率が高い。したがって、少ない試行回数で、良好な特性を有する抗体を生成できる可能性が高い情報処理装置２０を提供できる。

【0169】

置換行列は、公知の行列に限定しない。たとえば、所定の性質を有する抗体の蛋白質配列を多数収集して、独自の置換行列を作成しても良い。

【0170】

置換行列は、（３）式に示す、２０行×２１列の２次元行列であっても良い。

【0171】

【数2】

【0172】

１列目から２０列目までは、（２）式と同様であるので、説明を省略する。２１列目の２番目の添え字「＊」は、アミノ酸が欠失することを意味する。具体的には、１行２１列のＸ_A,*は、アラニンが欠失する頻度を示す値である。

【0173】

（３）式に示す置換行列を使用することにより、元の配列からアミノ酸が欠失した変異配列も作成可能な情報処理装置２０を提供できる。

【0174】

置換行列は、（４）式に示す、２０行×２１列を超える２次元行列であっても良い。

【0175】

【数3】

【0176】

１列目から２１列目までは、（３）式と同様であるので、説明を省略する。１行２２列のＸ_A,AAは、１個のアラニンが２個のアラニンに置換される頻度、すなわちアラニンの後ろにアラニンが挿入される頻度を示す値である。同様に、２行２２列のＸ_R,RAは、アルギニンの後ろにアラニンが挿入される頻度を示す値である。

【0177】

（３）式に示す置換行列を使用することにより、元の配列にアミノ酸が挿入された変異配列も作成可能な情報処理装置２０を提供できる。

【0178】

置換行列は、１個のアミノ酸が３個以上のアミノ酸に置換される頻度を示す列を有しても良い。

【0179】

［実施の形態４］
図１８は、実施の形態４の情報処理装置２０の機能ブロック図である。情報処理装置２０は、取得部７１と生成部７２とを有する。取得部７１は、プロトタイプ抗体の物性、および、プロトタイプ抗体を所定の標的抗原と組み合わせた場合の活性を教師データとして取得する。生成部７２は、取得した物性を入力データとし、取得した活性を出力データとする学習モデルを生成する。

【0180】

［実施の形態５］
本実施の形態は、汎用のコンピュータ９０とプログラム９７とを組み合わせて動作させることにより、本実施の形態の情報処理装置２０を実現する形態に関する。図１９は、実施の形態５の情報処理装置２０の構成を示す説明図である。実施の形態１と共通する部分については、説明を省略する。

【0181】

本実施の形態のコンピュータ９０は、制御部２１、主記憶装置２２、補助記憶装置２３、通信部２４、表示部２５、入力部２６、読取部２８およびバスを備える。コンピュータ９０は、汎用のパーソナルコンピュータ、タブレットまたはサーバマシン等の情報機器である。

【0182】

プログラム９７は、可搬型記録媒体９６に記録されている。制御部２１は、読取部２８を介してプログラム９７を読み込み、補助記憶装置２３に保存する。また制御部２１は、コンピュータ９０内に実装されたフラッシュメモリ等の半導体メモリ９８に記憶されたプログラム９７を読出しても良い。さらに、制御部２１は、通信部２４および図示しないネットワークを介して接続される図示しない他のサーバコンピュータからプログラム９７をダウンロードして補助記憶装置２３に保存しても良い。

【0183】

プログラム９７は、コンピュータ９０の制御プログラムとしてインストールされ、主記憶装置２２にロードして実行される。これにより、コンピュータ９０は上述した情報処理装置２０として機能する。

【0184】

各実施例で記載されている技術的特徴（構成要件）はお互いに組合せ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものでは無いと考えられるべきである。本発明の範囲は、上記した意味では無く、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

【符号の説明】

【0185】

２０情報処理装置
２１制御部
２２主記憶装置
２３補助記憶装置
２４通信部
２５表示部
２６入力部
５１教師データＤＢ
５２変異配列ライブラリＤＢ
５３学習モデル
５３１入力層
５３２中間層
５３３出力層
５４変異生成部
５５物性シミュレータ
５６ドッキングシミュレータ
５７報酬算出部
５８強化後ＤＢ
５９立体構造シミュレータ
６０ニューラルネットワークモデル
６０１入力層
６０２中間層
６０３出力層
７１取得部
７２生成部
９０コンピュータ
９６可搬型記録媒体
９７プログラム
９８半導体メモリ

【図1】