(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-01
(45)【発行日】2023-03-09
(54)【発明の名称】情報処理方法および学習モデル
(51)【国際特許分類】
G16B 40/20 20190101AFI20230302BHJP
G06N 3/02 20060101ALI20230302BHJP
G06N 99/00 20190101ALI20230302BHJP
G16H 70/60 20180101ALI20230302BHJP
【FI】
G16B40/20
G06N3/02
G06N99/00
G16H70/60
(21)【出願番号】P 2018210050
(22)【出願日】2018-11-07
【審査請求日】2021-08-16
(73)【特許権者】
【識別番号】517448489
【氏名又は名称】合同会社H.U.グループ中央研究所
(74)【代理人】
【識別番号】100114557
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】山下 英俊
【審査官】渡邉 加寿磨
(56)【参考文献】
【文献】米国特許出願公開第2014/0032186(US,A1)
【文献】米国特許第6587845(US,B1)
【文献】米国特許第9922285(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G16B 5/00-99/00
G16C 10/00-99/00
G06N 3/02
G06N 20/00
G16H 70/60
(57)【特許請求の範囲】
【請求項1】
プロトタイプ抗体の物性、および、前記プロトタイプ抗体を所定の標的抗原と組み合わせた場合の活性を教師データとして取得し、
取得した物性を入力データとし、取得した活性を出力データとする学習モデルを生成
し、
前記プロトタイプ抗体と異なる複数の変異抗体の物性をそれぞれ取得し、
取得したそれぞれの前記変異抗体の物性を前記学習モデルに入力して、前記変異抗体の推定活性値を取得し、
取得した推定活性値に基づいて活性が高いと推定される変異抗体を抽出し、
抽出された前記変異抗体のアミノ酸配列を状態、前記変異抗体のアミノ酸配列の変更を行動、前記変異抗体の立体構造と前記標的抗原の立体構造とに基づいて算出した活性の変化を報酬として、前記報酬が大きくなるようにアミノ酸配列を改変する強化学習を行ない、前記変異抗体よりも活性が高い第2変異抗体のアミノ酸配列を出力する
処理をコンピュータに実行させる情報処理方法。
【請求項2】
前記
第2変異抗体を前記標的抗原と組み合わせて測定した活性を取得し、
前記
第2変異抗体の物性と、取得した活性とを前記教師データに追加して前記学習モデルを更新する
請求項1に記載の情報処理方法。
【請求項3】
前記変異抗体は、前記プロトタイプ抗体のアミノ酸配列を構成するアミノ酸を所定の置換頻度に基づいて置換して生成される
請求項1または請求項2に記載の情報処理方法。
【請求項4】
前記学習モデルの更新と、前記強化学習とを繰り返す
請求項1から請求項3のいずれか一つに記載の情報処理方法。
【請求項5】
前記入力データは、抗体分子にかかる分子量、極性表面積、炭素原子数、窒素原子数、二重結合数、分子屈折率または油水分配係数を含み、
前記出力データは、抗体分子と前記標的抗原との結合定数、解離定数、結合速度定数、解離速度定数、阻害活性、抗体価、抗原特異性、保存安定性、pHプロファイルまたは凝集性を含む
請求項1から
請求項4のいずれか一つに記載の情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法および学習モデルに関する。
【背景技術】
【0002】
研究用および臨床検査用の試薬、および、抗体医薬品に抗体が使用される。抗体は、特定の抗原に特異的に結合するタンパク質である。実験動物に抗原を投与して所定期間飼育することにより、その実験動物の血液から、投与した標的抗原と結合する多様な抗体を得ることができる。
【0003】
抗原を実験動物に免疫した後、その実験動物の血液等からB細胞のゲノムまたは転写産物を取得することにより、実験動物の体内で生成された多様な抗体をコードする遺伝子を取得できる。取得した遺伝子の核酸塩基配列は、NGS(Next Generation Sequencer:次世代シーケンサ)等を用いて決定できる。
【0004】
ファージディスプレイ法等の実験手法により、多様な抗体をコードする遺伝子のライブラリの中から、抗原への親和性が優れた抗体を選択できる。以上の手法により取得した核酸塩基配列に基づいて、抗原に結合するポリペプチドを含む配列を決定するシステムが提案されている(特許文献1)。
【0005】
抗体をコードする核酸塩基配列を用いることにより、実験動物、動物細胞、微生物、ウイルス等の内部で生成された多種類の抗体にかかる情報を網羅的に取得できる。実験動物には、マウス、ウサギ、ヒツジ、ヤギまたはラクダ等が用いられる。動物細胞には、哺乳動物細胞、鳥類細胞または昆虫細胞等が用いられる。微生物には、バクテリアまたは酵母等が用いられる。
【先行技術文献】
【特許文献】
【0006】
【文献】国際公開第2015/076355号
【文献】H. Moriwaki et. al., "Mordred: a molecular descriptor calculator", Journal of Cheminformatics, 2018 10:4
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1に開示された発明では、実験動物およびウイルス等から得た抗体を改変して、より高い活性を有する抗体を得ることはできない。
【0008】
一つの側面では、より高い活性を有する抗体を得る情報処理方法等を提供することを目的とする。
【課題を解決するための手段】
【0009】
情報処理方法は、プロトタイプ抗体の物性、および、前記プロトタイプ抗体を所定の標的抗原と組み合わせた場合の活性を教師データとして取得し、取得した物性を入力データとし、取得した活性を出力データとする学習モデルを生成し、前記プロトタイプ抗体と異なる複数の変異抗体の物性をそれぞれ取得し、取得したそれぞれの前記変異抗体の物性を前記学習モデルに入力して、前記変異抗体の推定活性値を取得し、取得した推定活性値に基づいて活性が高いと推定される変異抗体を抽出し、抽出された前記変異抗体のアミノ酸配列を状態、前記変異抗体のアミノ酸配列の変更を行動、前記変異抗体の立体構造と前記標的抗原の立体構造とに基づいて算出した活性の変化を報酬として、前記報酬が大きくなるようにアミノ酸配列を改変する強化学習を行ない、前記変異抗体よりも活性が高い第2変異抗体のアミノ酸配列を出力する処理をコンピュータに実行させる。
【発明の効果】
【0010】
一つの側面では、より高い活性を有する抗体を得る情報処理方法等を提供できる。
【図面の簡単な説明】
【0011】
【
図1】抗体を開発する手順の概要を説明する説明図である。
【
図4】抗体の物性および活性を説明する説明図である。
【
図6】抗体を開発する手順の概要を説明する説明図である。
【
図9】ニューラルネットワークモデルの構成を示す説明図である。
【
図10】教師データDBのレコードレイアウトを説明する説明図である。
【
図11】変異配列ライブラリDBのレコードレイアウトを説明する説明図である。
【
図12】強化後DBのレコードレイアウトを説明する説明図である。
【
図13】プログラムの処理の流れを示すフローチャートである。
【
図14】教師あり学習モデル生成のサブルーチンの処理の流れを示すフローチャートである。
【
図15】ライブラリ作成のサブルーチンの処理の流れを示すフローチャートである。
【
図16】強化学習のサブルーチンの処理の流れを示すフローチャートである。
【
図17】実施の形態2のプログラムの処理の流れを示すフローチャートである。
【
図18】実施の形態4の情報処装置の機能ブロック図である。
【
図19】実施の形態5の情報処理装置の構成を示す説明図である。
【発明を実施するための形態】
【0012】
[実施の形態1]
図1は、抗体を開発する手順の概要を説明する説明図である。まず、抗体を開発する対象である、標的抗原および抗原決定基(エピトープ)を定める。マウスまたはウサギ等の実験動物に、注射等により標的抗原を投与して免疫反応を惹起する。標的抗原の投与は、十分な免疫反応が得られるまで複数回繰り返して行なう。
【0013】
実験動物のB細胞で、標的抗原と結合する抗体が産生され、血液中に放出される。これらの抗体は、標的抗原のさまざまな部位にそれぞれ結合する多くの種類の抗体を含む、ポリクローナル抗体である。
【0014】
ポリクローナル抗体に含まれる多種類の抗体をそれぞれ、抗体開発の原形であるプロトタイプ抗体に使用する。プロトタイプ抗体を各種の手法を用いて解析することで、一次構造であるアミノ酸配列を取得する。さらに、実測または物性シミュレーションにより、プロトタイプ抗体自体の物性と、プロトタイプ抗体と標的抗原との組合せである活性とを取得する。物性および活性の詳細については、後述する。
【0015】
なお、プロトタイプ抗体はモノクローナル抗体であってもよい。プロタイプ抗体は、免疫グロブリンの5つのアイソタイプ、すなわち、Ig(Immunoglobulin)G、IgM、IgA、IgD、IgE、IgYのいずれであってもよい。プロトタイプ抗体はまた、全長抗体であってもよい。全長抗体とは、可変領域および定常領域を各々含む重鎖および軽鎖を含む抗体であり、2つのFab(Fragment, antigen binding)部分およびFc(Fragment, crystallizable)部分を含む。
【0016】
抗体はまた、このような全長抗体に由来する抗体断片であってもよい。抗体断片は全長抗体の一部であり、たとえば、F(ab’)2、Fab’、FabおよびFv(Fragment, variable)等の定常領域欠失抗体が挙げられる。プロトタイプ抗体はまた、単鎖抗体等の改変抗体であってもよい。好ましくは、プロトタイプ抗体は、IgG、IgM、またはそれらの抗体断片である。
【0017】
取得した物性と活性との組合せを教師データDB(Database)51に記録する。教師あり機械学習により、物性を入力した場合に、推定活性値(以下、活性とも呼ぶ)を出力する学習モデル53を生成する。教師データDB51および学習モデル53の詳細については、後述する。
【0018】
プロトタイプ抗体のアミノ酸配列の一部を変異させた変異配列を多数自動作成する。変異配列は、プロトタイプ抗体のアミノ酸配列の一部を別のアミノ酸に置換した置換配列、プロトタイプ抗体のアミノ酸配列の一部を欠失させた欠失配列、および、プロトタイプ抗体のアミノ酸配列に他のアミノ酸配列を挿入した挿入配列を含む。
【0019】
物性シミュレーションにより、それぞれの変異配列に対応する抗体(以下、変異抗体と呼ぶ)の物性を計算して、変異配列ライブラリDB52に記録する。変異配列ライブラリDB52、および、変異配列の作成の詳細については、後述する。
【0020】
変異配列ライブラリDB52に記録された物性を学習モデル53に入力して、変異抗体の推定活性値を出力する。その中から高い推定活性値を予測した変異配列を抽出する。以上の処理により、自動作成した多数の変異配列を、学習モデル53を使用してスクリーニングする。
【0021】
変異抗体の立体構造を変異配列から推定する立体構造シミュレーションを行なう。その後、立体構造に基づいて変異抗体と標的抗原との結合状態を計算するドッキングシミュレーションを行ない、推定結合活性値(以下、活性とも呼ぶ)を算出する。ドッキングシミュレーションにより算出した推定結合活性値を高めるように、抗体のアミノ酸配列を置換、欠失または挿入(以下、変異とも呼ぶ)させる強化学習を行ない、アミノ酸配列を改変する。強化学習の詳細については、後述する。
【0022】
強化学習により所定の条件のアミノ酸配列を算出した後に、遺伝子組み換え技術により変異抗体を実際に作製して、活性および物性を実測する。実測データを教師データDB51に追加して、再度教師あり学習を行ない、学習モデル53を更新する。教師データDB51の更新により、学習モデル53の精度が改善される。以後、学習モデル53を利用した変異配列の抽出と、強化学習を用いた変異配列の改良と、実測と、教師データDB51の更新とを、所望の活性が得られるまで繰り返す。
【0023】
以上により、膨大な時間および実験費用を要する実測の回数を抑えながら、活性の高い抗体を作製できる。そのため、新しい標的抗原に対して、短い期間で、所望の活性を有する抗体を作製できる。
【0024】
図2は、情報処理装置20の構成を示す説明図である。情報処理装置20は、制御部21、主記憶装置22、補助記憶装置23、通信部24、表示部25、入力部26およびバスを備える。制御部21は、本実施の形態のプログラムを実行する演算制御装置である。制御部21は、一または複数のCPU(Central Processing Unit)、マルチコアCPUまたはGPU(Graphics Processing Unit)等により構成される。制御部21は、バスを介して情報処理装置20を構成するハードウェア各部と接続されている。
【0025】
主記憶装置22は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、フラッシュメモリ等の記憶装置である。主記憶装置22には、制御部21が行なう処理の途中で必要な情報および制御部21で実行中のプログラムが一時的に保存される。
【0026】
補助記憶装置23は、SRAM、フラッシュメモリまたはハードディスク等の記憶装置である。補助記憶装置23には、教師データDB51、変異配列ライブラリDB52、強化後DB58、学習モデル53、ニューラルネットワークモデル60、物性シミュレータ55、ドッキングシミュレータ56、立体構造シミュレータ59、制御部21に実行させるプログラム、およびプログラムの実行に必要な各種データが保存される。
【0027】
なお、教師データDB51、変異配列ライブラリDB52、強化後DB58、学習モデル53およびニューラルネットワークモデル60は、情報処理装置20に接続された外部の大容量記憶装置等に保存されていても良い。
【0028】
物性シミュレータ55は、物性シミュレーションを行なうアプリケーションソフトウェアである。物性シミュレータ55には、たとえば、Dragon、PaDEL-Descriptor、Codessa、mordred、または、RDKit等の公知のソフトウェアを利用できる。物性シミュレータ55の詳細については後述する。
【0029】
ドッキングシミュレータ56は、ドッキングシミュレーションを行なうアプリケーションソフトウェアである。ドッキングシミュレータ56には、たとえばAutoDock、AutoDock Vina、GOLD、Accelrys Discovery Studio、または、MOE等の公知のソフトウェアを利用できる。
【0030】
立体構造シミュレータ59は、アミノ酸配列に基づいて高分子の立体構造を推定するソフトウェアである。立体構造シミュレータ59により推定された立体構造は、物性シミュレータ55およびドッキングシミュレータ56への入力データに用いられる。立体構造シミュレータ59には、たとえばModeller、Swiss Model、HOMCOS、Rosetta、EVfold、ZDOCKまたはHADDOCK等の公知のソフトウェアを利用できる。立体構造シミュレータ59の詳細については後述する。
【0031】
物性シミュレータ55、立体構造シミュレータ59およびドッキングシミュレータ56は、情報処理装置20に接続された外部のサーバ等にインストールされていても良い。このようにする場合、制御部21は物性シミュレーション、立体構造シミュレーションおよびドッキングシミュレーションに入力するデータを送信し、それぞれのシミュレーションを行なった結果を受信する。
【0032】
通信部24は、情報処理装置20とネットワークとの間の通信を行なうインターフェイスである。表示部25は、液晶表示装置または有機EL(Electro Luminescence)表示装置等である。入力部26は、キーボードおよびマウス等である。表示部25と入力部26とは、積層されてタッチパネルを構成してもよい。
【0033】
本実施の形態の情報処理装置20は、汎用のパソコン、タブレット、大型計算機、または、大型計算機上で動作する仮想マシンである。情報処理装置20は、複数のパソコン、タブレットまたは大型計算機等のハードウェアにより構成されても良い。情報処理装置20は、量子コンピュータにより構成されても良い。
【0034】
図3は、抗体の構成を説明する模式図である。抗体は複数の免疫グロブリンから構成されている。ラット等の実験動物やヒトの場合、抗体の基本となる構造単位はIgGと呼ばれる略Y字型の立体構造を持つタンパク質である。IgGは、2本のH(Heavy)鎖と、2本のL(Light)鎖とにより構成されている。Y字型の下側の縦棒の部分は、H鎖のみで構成されている。Y字型の上側の二股の部分は、H鎖とL鎖とのペアにより構成されている。IgGは蛋白質分解酵素パパインによって、Y字型の上側の二股の部分であるFab領域と、Y字型の下型の縦棒の部分であるFc部分に分解される。Fab断片はH鎖とL鎖とのペアにより構成され、Fc断片はH鎖のみで構成されている。
【0035】
Y字型の二股の部分の上部(Fab領域)のH鎖およびL鎖は可変領域を含み、結合する抗原に対応して大きく変化するアミノ酸配列を有する。可変領域を除く部分(Fc領域)は、定常領域と呼ばれ、結合する抗原が異なる抗体間でも共通配列を多く保持する。
【0036】
H鎖およびL鎖のそれぞれの可変部は、CDR(Complementarity Determining Region:相補性決定領域)1、CDR2およびCDR3を有する。CDR1からCDR3は、それぞれ約2個から約31個のアミノ酸により構成されたポリペプチドである。なおIgG構造を持たないアルパカ等のラクダ科の実験動物のH鎖やサメ等の軟骨魚類のH鎖も可変領域を持ち、同様に3種類のCDR領域を保有する。
【0037】
CDRは、可変領域内でも特に結合する抗原に応じて配列の多様性の大きい部分である。抗体は、主にCDRの配列が形成する立体構造を介して抗原との結合特異性を発揮する。
【0038】
図4は、抗体の物性および活性を説明する説明図である。
図4Aは、抗体の物性を説明する説明図である。物性は、たとえば分子量、極性表面積、炭素原子数、窒素原子数、二重結合数、油水分配係数あるいはその対数(LogP)、分子屈折率、水素結合受容体数、水素結合供与体数、回転可能な結合数、部分電荷、総電荷、力場MMFF(Merck Molecular Force Field)92s下におけるエネルギー、および、立体的体積等の各種分子記述子を含む、抗体分子自体の性質である。
【0039】
これらの物性のうち、分子量、炭素原子数、窒素原子数、二重結合数等については、アミノ酸配列から直接算出できる。極性表面積、油水分配係数等の、アミノ酸配列からは直接算出できない物性については、抗体分子を遺伝子組み換え技術等を用いて作製して実測するか、または、物性シミュレータ55を用いて推定する。
【0040】
物性シミュレータ55の詳細について説明する。物性シミュレータ55は、いわゆる2D descriptorまたは3D descriptor 等の物性を推定可能である。2D descriptor は、たとえば油水分配係数もしくはその対数、および、TPSA(Topological Polar Surface Area:位相幾何学的極性表面積)のようにアミノ酸配列から推定可能な物性である。
【0041】
3D descriptor は、たとえばCPSA(Charged Polar Surface Area)およびMoRSE(Molecule Representation of Structure based on Electron diffraction)のように、立体構造シミュレータ59により生成した立体構造に基づいて推定可能な物性である。CPSAおよびMoRSEは、HOMO(orbital energies of Highest Occupied Molecular Orbital)、または、LUMO(Lowest Unoccupied Molecular Orbital)のような量子化学計算に基づいて算出されても良い。
【0042】
立体構造シミュレータ59の詳細について説明する。立体構造シミュレータ59によるポリペプチドの立体構造の推定には、たとえばホモロジーモデリング法、および、ab initio法(de novo法)が用いられる。
【0043】
ホモロジーモデリング法は立体構造が公知となっている蛋白質を構成するアミノ酸配列と、立体構造を予測したい蛋白質を構成するアミノ酸配列とを比較し、両者の配列類似度が高い場合に利用される。ホモロジーモデリング法においては、立体構造が公知である蛋白質の立体構造上の位置に、立体構造を予測したい蛋白質のアミノ酸を配列する。アミノ酸同士の立体障害およびエネルギーの最小化等により、公知である立体構造からは少し変化した新たな立体構造が構築される。
【0044】
ab initio法は、立体構造が公知となっている蛋白質を構成するアミノ酸配列との配列類似度が低い蛋白質の立体構造を推定する場合に利用される。たとえば、タンパク質の部分構造を組み合わせるフラグメントアセンブリ法等を用いて立体構造を予測できる。
【0045】
ホモロジーモデリング法を用いて標的抗体単独の立体構造を予測する場合には、前述のModellerまたはSwiss Model等のソフトウェアを利用できる。
ホモロジーモデリング法を用いて標的抗体および標的抗原の複合体の立体構造を予測する場合には、前述のModellerまたはHOMCOS等のソフトウェアを利用できる。
【0046】
ab initio法を用いて標的抗体単独の立体構造を予測する場合には、前述のRosettaまたはEVfold等のソフトウェアが使用できる。ab initio法を用いて標的抗体および標的抗原の複合体の立体構造を予測する場合には、前述のZDOCK、HADDOCK等のソフトウェアを使用できる。
【0047】
それぞれの物性は、抗体全体について定義しても、L鎖、H鎖、H鎖の可変領域等、抗体の一部について定義しても良い。図示を省略するが、抗体のFab領域、F(ab’)2領域、VL(Variable region Light)領域、VH(Variable region Heavy)領域等について、物性を定義しても良い。
【0048】
なお、上記に列挙したのは物性の一例である。公知の数千種類の分子記述子(非特許文献1)から、後述の活性との関連性があると期待する任意の分子記述子を選択して、本実施の形態の物性に使用できる。新たな分子記述子を定義して、本実施の形態の物性に使用しても良い。
【0049】
図4Bは、抗体の活性を説明する説明図である。活性は、たとえば結合定数、解離定数、結合速度定数、解離速度定数、抗体価、抗原特異性、保存安定性、pHプロファイルおよび凝集性、阻害活性(活性を50%阻害する濃度であるIC50、活性を50%中和する濃度であるND50等)等の、抗体と抗原との組合せに関する性質である。
【0050】
上記のうち、結合定数、解離定数、結合速度定数および解離速度定数は、抗原と抗体とが結合する抗原抗体反応における結合性能、すなわち親和性を示す指標の例である。抗体価は、抗原と複合体を形成するのに必要な抗体量を示す指標である。特異性は、標的抗原と、これに類似する物質とを識別する能力を示す指標である。保存安定性は、親和性の経時変化の程度を示す指標である。pHプロファイルは、pHの変化による親和性の変化の程度を示す指標である。
【0051】
活性には、抗体のコロイド安定性、すなわち抗体と溶液との組合せを示す指標である凝集性を加えても良い。活性には、遺伝子組み換え培養細胞による抗体の産生量、すなわち抗体と培養細胞との組合せを示す指標である、抗体産生細胞の発現効率を加えても良い。
【0052】
活性は、抗体分子を作製して実測するか、または、ドッキングシミュレーションを用いて推定結合活性値を算出する。
【0053】
図5は、学習モデル53の概要を説明する説明図である。学習モデル53の入力データは抗体の物性であり、学習モデル53の出力データは抗体の活性を推定した推定活性値である。学習モデル53は入力層531、中間層532および出力層533を有する。なお、物性および活性は、たとえば基準値に対する比の値等への無次元化等の処理を行った値であっても良い。
【0054】
入力層531の入力ニューロンの数は、入力データに使用する物性の項目数である。出力層533の出力ニューロンの数は、1個である。学習モデル53は、入力層531に抗体の物性が入力された場合に、出力層533に抗体の推定活性値を出力する。出力層533は、所定の複数のクラスの代表値の中から最も確率の高い値を出力してもよい。出力層533は、ベイズニューラルネットワークの手法等を用いて、推定活性値と、その値の信頼度または分散とを出力してもよい。
【0055】
補助記憶装置23には、たとえば結合定数、解離定数、結合速度定数、解離速度定数、抗体価、抗原特異性、保存安定性、pHプロファイル、凝集性、阻害濃度等の活性を出力層533に出力する学習モデル53がそれぞれ保存されている。
【0056】
制御部21は、既知の物性と活性とを関連づけて記録した教師データDB51を用いて、誤差逆伝播法等を用いて中間層532のパラメータを演算し、学習モデル53を生成する。
【0057】
教師あり機械学習は、たとえばロジスティック回帰、SVM(Support Vector Machine)、ランダムフォレスト、CNN(Convolution Neural Network:畳み込みニューラルネットワーク)、RNN(Recurrent Neural Network:再起型ニューラルネットワーク)または、XGBoost(eXtreme Gradient Boosting)等の任意の手法により行なえる。
【0058】
数千もの分子記述子を物性として用いることで説明変数の取りこぼしを回避したい場合には、機械学習の目的関数に正則化項を付与することで、推定に有効な説明変数を効率的に絞り込むことができる。たとえば、LASSO(Least Absolute Shrinkage and Selection Operator)ロジスティック回帰、Ridge回帰またはElastic Net回帰等を用いることで推定精度を高めることができる。
【0059】
本実施の形態においては、制御部21は、複数の手法を用いてそれぞれ学習モデル53を生成し、活性を予測する精度の高い学習モデル53を採用する。学習モデル53の精度を評価するためには、制御部21は、教師データを訓練データと評価データとに分ける。制御部21は、訓練データに基づいて学習モデル53を生成する。
【0060】
制御部21は、評価データに基づいて学習モデル53の精度を評価する。精度には、正確度(Accuracy)、陽性的中率(Precision)、感度(Recall)、特異度(Specificity)およびF値(F-measure)等の複数の評価指標がある。
【0061】
なお、高い精度を得られる手法が判っている場合には、制御部21はその手法を用いて学習モデル53を生成しても良い。
【0062】
図6は、抗体を開発する手順の概要を説明する説明図である。前述の通り、動物等に標的抗原を投与して、プロトタイプ抗体を得る。制御部21は、プロトタイプ抗体のアミノ酸配列をランダムに変異させて、多数の変異配列を自動生成する。変異配列は、たとえばプロトタイプ抗体のアミノ酸配列の任意の箇所に、アミノ酸の置換、挿入、または欠失の処理を行って生成する。変異配列は、変異抗体のアミノ酸配列である。
【0063】
制御部21は、アミノ酸の置換、挿入、または欠失の処理を、プロトタイプ抗体のアミノ酸配列のうちの1箇所に対して行なっても、複数個所に対して行なっても良い。制御部21は、1ヶ所の置換、挿入、または欠失の処理を、プロトタイプ抗体のアミノ酸配列のうちの1個のアミノ酸について行なっても、連続する複数のアミノ酸について行なっても良い。
【0064】
なお、変異配列を、プロトタイプ抗体を構成するアミノ酸の一部を置換した配列に限定してもよい。このように限定することにより、抗体を探索する範囲が狭くなる代わりに、処理速度が向上する。
【0065】
変異配列を、プロトタイプ抗体の可変領域を構成するアミノ酸の一部を置換、挿入または欠失した配列に限定してもよい。このように限定することにより、変異配列ライブラリDB52に抗体の性質を有さない変異配列が含まれにくくなるため、処理速度が向上する。
【0066】
変異配列を、プロトタイプ抗体のCDRを構成するアミノ酸の一部を置換、挿入または欠失した配列に限定してもよい。このように限定することにより、変異配列ライブラリDB52に抗体の性質を有さない変異配列が含まれにくくなるため、処理速度が向上する。
【0067】
図6においては、変異配列を抗体の形状の相違により模式的に表現する。制御部21は、自動生成したそれぞれの変異配列について、物性シミュレーションにより物性を算出する。制御部21は、算出した物性を学習モデル53に入力して、推定活性値を得る。制御部21は、推定活性値の高い変異配列を選択する。以上の処理により、自動作成した多数の変異配列を、学習モデル53を使用してスクリーニングする。
【0068】
制御部21は、選択した強化配列に対して強化学習を行ない改良する。制御部21は、改良の結果、活性が非常に高くなった変異配列を選択して出力する。ユーザは、出力された変異配列について、実験抗体を作製して、物性および活性を実測する。
【0069】
実測の結果、所望の活性が得られた場合に、標的抗原に対する抗体の設計を終了する。所望の活性が得られない場合、ユーザは実測した結果を教師データDB51に追加する。制御部21は、学習モデル53を更新する。
【0070】
強化学習の概要を説明する。強化学習は、ある環境下におかれたエージェントが現在の状態を観測し、取るべき行動を決定する問題を扱う機械学習アルゴリズムである。エージェントは行動を選択することで、行動の結果に対応する報酬を得る。エージェントは複数の行動を繰り返す試行錯誤を通じて、報酬を最大化するような行動を学習する。なお、強化学習は、複数のエージェントを用いて実装されても良い。
【0071】
本実施の形態においては、状態は抗体のアミノ酸配列および活性である。行動は、アミノ酸配列の変更である。行動により抗体の活性が上昇した場合に、エージェントは正の報酬を得、行動により活性が低下した場合にエージェントは負の報酬、すなわちペナルティを得る。
【0072】
図7は、強化学習段階を説明する説明図である。
図7を使用して、1順目の強化学習の概要を説明する。制御部21は、学習モデル53により推定活性値が高いと判定された抗体候補のアミノ酸配列を、変異生成部54に入力する。変異生成部54は、制御部21により実行されるソフトウェア、または制御部21による制御に基づいて動作するハードウェアにより構成されている。
【0073】
変異生成部54は、ニューラルネットワークモデル60に接続されている。ニューラルネットワークモデル60は、強化学習におけるエージェントの一例である。ニューラルネットワークモデル60の詳細については、後述する。
【0074】
変異生成部54は、ニューラルネットワークモデル60の出力に基づいて、入力されたアミノ酸配列を変異させる。本実施の形態においては、変異生成部54はいずれかのCDRを構成するポリペプチドのうちの、1個のアミノ酸を、他のアミノ酸に置換する。
【0075】
制御部21は、変異生成部54で変異させたアミノ酸配列をドッキングシミュレータ56に入力して、標的抗原とのドッキングシミュレーションを行ない、推定結合活性値を算出する。制御部21は、活性の増減に基づいて定めた報酬を、変異生成部54を介してニューラルネットワークモデル60に入力して、強化学習を行なう。以上の処理を繰り返すことにより、CDR全体を変異させることが可能である。
【0076】
なお、ニューラルネットワークモデル60および変異生成部54は、抗体の可変領域のアミノ酸配列から、変異させるアミノ酸を選択しても良い。ニューラルネットワークモデル60および変異生成部54は、抗体全体のアミノ酸配列から、変異させるアミノ酸を選択しても良い。
【0077】
図8は、強化学習段階を説明する説明図である。
図8においては、強化学習の1手法であるQ学習により、深層強化学習を行なう場合を例にして説明する。変異生成部54は、状態s
nを取得して、ニューラルネットワークモデル60に入力する。状態s
nは、深層強化学習の第n回目のループで処理する抗体のアミノ酸配列および活性の組合せである。
【0078】
ニューラルネットワークモデル60は、状態snに対して変異生成部54が取り得る行動のそれぞれについて、Q関数の値であるQ値を算出して出力する。Q関数は、それぞれの行動の価値を算出する関数である。
【0079】
行動anは、変更するアミノ酸の位置、および、変更後のアミノ酸の種類の2つのパラメータにより定められる、アミノ酸配列の変更である。表1に、行動anを定めるパラメータの例を示す。
【0080】
【0081】
表1において、変更するアミノ酸の位置は、CDRを構成するアミノ酸に連番で付与した番号により示す。Alaはアラニンを、Asnはアスパラギンを、Glnはグルタミンをそれぞれ意味する3文字表記である。タンパク質を構成するアミノ酸は、20種類である。変更するアミノ酸の位置と、変更後のアミノ酸とは、それぞれ独立して選択される。
【0082】
図9は、ニューラルネットワークモデル60の構成を示す説明図である。ニューラルネットワークモデル60は入力層601、中間層602および出力層603を有する。
【0083】
入力層601の入力ニューロンの数は、状態s
nを表現する項目の数である。
図9においては、入力ニューロンの数は、活性の項目数に1を加えた数である。抗体のアミノ酸配列のそれぞれのアミノ酸を入力ニューロンに対応させても良い。そのようにする場合は、入力ニューロンの数は活性の項目数に、アミノ酸の数を加えた数である。CDR1からCDR3のそれぞれのポリペプチドのアミノ酸配列を、入力ニューロンに対応させても良い。
【0084】
出力層603の出力ニューロンは、状態snにある場合に行動anを行なうことの行動価値を示すQ関数、Q(sn,an)に基づいてQ値を出力する。行動anは、変更するアミノ酸の位置と、変更後のアミノ酸との組により表現される。
【0085】
たとえば、強化学習により変異させる対象を、VH領域のCDR3のポリペプチドに限定し、取り得るすべての行動anを出力する場合、出力ニューロンはアミノ酸の種類数20を、CDR3に含まれるアミノ酸の数である8乗した、256億個である。同様に、強化学習により変異させる対象を、VL領域のCDR3のポリペプチドに限定し、取り得るすべての行動anを出力する場合、出力ニューロンはアミノ酸の種類数20を、CDR3に含まれるアミノ酸の数である9乗した、5120億個である。
【0086】
図8に戻って説明を続ける。変異生成部54は、出力ニューロンに出力されたQ値から、比較的Q値が高い行動a
nを1つ選択する。変異生成部54は、εの確率でランダムに行動a
nを選択し、(1-ε)の確率でQ値が最大である行動a
nを選択する、εグリーディ法に基づいて行動a
nを選択しても良い。このようにすることにより、強化学習の探索範囲が狭くなりすぎることを防止できる。
【0087】
変異生成部54は、選択した行動anを実行して、抗体のアミノ酸配列を変異させる。制御部21は、変異生成部54が変異させたアミノ酸配列をドッキングシミュレータ56に入力する。ドッキングシミュレータ56が、ドッキングシミュレーションにより活性を算出する。
【0088】
制御部21は、算出された活性を報酬算出部57に入力する。報酬算出部57は、算出された活性に基づいて行動a
nに対する報酬r
n+1を算出する。報酬r
n+1は、活性が上昇した場合に正の値になり、活性が低下した場合に負の値になる。なお、
図4を使用して説明した活性を示す多くの項目のうち、どの項目の変化を重視するかは、所望の抗体の特性により定められる。
【0089】
たとえば、標的抗原と強く結合する抗体を開発する場合には、結合定数が増加することを重視して報酬rn+1を算出するように、算出方法が定められる。標的抗原と速やかに結合する抗体を開発する場合には、結合速度定数が増加することを重視して報酬rn+1を算出するように、算出方法が定められる。報酬算出部57は、制御部21により実行されるソフトウェア、または制御部21による制御に基づいて動作するハードウェアにより構成されている。
【0090】
制御部21は、状態sn+1、および、前回の行動anに対する報酬rn+1を変異生成部54を介してニューラルネットワークモデル60に入力する。制御部21は、(1)式に基づいてニューラルネットワークモデル60を更新する。
【0091】
Q(sn,an)←Q(sn,an)
+α{rn+1+γ・maxQ(sn+1,an+1)-Q(sn,an)}
‥‥‥(1)
αは、学習係数である。
γは割引率である。
rn+1は、行動anの結果得られる報酬である。
【0092】
学習係数αは、学習の速度を決定するパラメータである。αは、
0<α<1
を満たす。
【0093】
割引率γは、未来の状態に対する評価をどの程度割り引いて評価するかを示すパラメータである。γは、
0<γ<1
を満たす。
【0094】
Q学習においては、(1)式の第2項である{rn+1+γ・maxQ(sn+1,an+1)-Q(sn,an)}がゼロになるように、誤差逆伝播法等を用いて中間層602のパラメータを学習する。これは、行動価値Q(sn,an)が、報酬rn+1と、次の状態sn+1において可能な行動のなかで最大の行動価値maxQ(sn+1,an+1)との和になるように学習することを意味する。
【0095】
制御部21は、学習後のニューラルネットワークモデル60に、行動sn+1を入力して、行動an+1を出力させる。制御部21は、出力された行動an+1を、変異生成部54に入力する。
【0096】
制御部21は、以上に説明したニューラルネットワークモデル60の更新を、所定の回数、または、所定の条件を満足するまで繰り返すことにより、報酬rn+1を最大化するようにニューラルネットワークモデル60を調整する。所定の条件は、たとえば報酬rn+1が所定の閾値以下になった場合である。
【0097】
強化学習の手法は、Q学習に限定しない。たとえば、TD(Temporal Difference Learning)学習、SARSA、モンテカルロ法等、任意の強化学習アルゴリズムを使用できる。
【0098】
図10は、教師データDB51のレコードレイアウトを説明する説明図である。教師DB51は、既知抗体のアミノ酸配列と、物性と、活性とを関連づけて記録するDBである。教師DB51は、教師ID(Identifier)フィールドと、アミノ酸配列フィールドと、物性フィールドと、活性フィールドとを有する。
【0099】
物性フィールドは、たとえば分子量フィールド、極性表面積フィールド等の、各種の物性を記録するサブフィールドを有する。活性フィールドは、たとえば結合定数フィールド、解離定数フィールド、結合速度定数フィールド、および、解離速度定数フィールド等の、各種の活性を記録するフィールドを有する。
【0100】
教師IDフィールドには、教師データに固有に付与された教師IDが記録されている。アミノ酸配列フィールドには、抗体のアミノ酸配列が記録されている。物性フィールドの各サブフィールドには、物性がそれぞれ記録されている。活性フィールドの各サブフィールドには、活性がそれぞれ記録されている。教師データDB51は、1組の教師データについて1つのフィールドを有する。初期状態においては、教師データDB51には
図1を使用して説明したプロトタイプ抗体にかかる情報が記録されている。
【0101】
図11は、変異配列ライブラリDB52のレコードレイアウトを説明する説明図である。変異配列ライブラリDB52は、抗体のアミノ酸配列と、物性と、学習モデル53を用いて得た推定活性値と、推定活性値を判定した判定結果とを関連づけて記録するDBである。変異配列DB52は、教師IDフィールドと、アミノ酸配列フィールドと、物性フィールドと、活性フィールドと、判定フィールドとを有する。
【0102】
物性フィールドは、たとえば分子量フィールド、極性表面積フィールド等の、各種の物性を記録するサブフィールドを有する。変異配列ライブラリDB52の物性フィールドのサブフィールドは、教師データDB51の物性フィールドのサブフィールドに対応している。活性フィールドは、たとえば結合定数フィールド、解離定数フィールド等の、各種の活性を記録するフィールドを有する。変異配列ライブラリDB52の活性フィールドのサブフィールドは、教師データDB51の活性フィールドのサブフィールドに対応している。
【0103】
教師IDフィールドには、変異配列を作成する元に使用された教師データに固有に付与された教師IDが記録されている。アミノ酸配列フィールドには、抗体のアミノ酸配列が記録されている。物性フィールドの各サブフィールドには、物性がそれぞれ記録されている。活性フィールドの各サブフールドには、物性フィールドに記録された物性を学習モデル53に入力して得た活性が記録されている。判定フィールドには、活性の良否を判定した判定結果が記録されている。判定フィールドの初期値は「未」である。「高」は活性が高いことを、「低」は活性が低いことをそれぞれ意味する。
【0104】
図4Bを使用して説明した活性を示す多くの項目のうち、どの項目の値を重視して判定を行なうか、および判定を行なう際の閾値は、所望の抗体の特性により定められる。たとえば、標的抗原と強く結合する抗体を開発する場合には、結合定数が所定の閾値よりも大きい場合に「高」と判定する。標的抗原と速やかに結合する抗体を開発する場合には、結合速度定数が所定の閾値よりも大きい場合に「高」と判定する。制御部21は、活性に関する複数の項目のデータを演算した結果に基づいて判定しても良い。
【0105】
判定フィールドには活性を定量的に評価した数値が記録されても良い。活性フィールドは、複数のサブフィールドを有し、複数の観点でそれぞれ評価した活性が記録されても良い。教師データDB51は、一つの変異配列について1つのフィールドを有する。
【0106】
図12は、強化後DB58のレコードレイアウトを説明する説明図である。強化後DB58は、強化学習により改良した変異配列と、点数とを関連づけて記録するDBである。
【0107】
強化後DB58は、教師IDフィールドと、アミノ酸配列フィールドと、点数フィールドとを有する。教師IDフィールドには、強化学習を開始する際に用いた変異配列の元に使用された教師データに固有に付与された教師IDが記録されている。アミノ酸配列フィールドには、強化学習により得たアミノ酸配列が記録されている。点数フィールドには、活性を評価して定めた点数が記録されている。強化後DB58は、強化学習により得た1個のアミノ酸配列について、1つのレコードを有する。
【0108】
図13は、プログラムの処理の流れを示すフローチャートである。制御部21は、教師あり学習モデル生成のサブルーチンを起動する(ステップS501)。教師あり学習モデル生成のサブルーチンは、教師データDB51に記録された教師データに基づいて、学習モデル53を生成するサブルーチンである。教師あり学習モデル生成のサブルーチンの処理の流れは後述する。
【0109】
制御部21は、ライブラリ作成のサブルーチンを起動する(ステップS502)。ライブラリ作成のサブルーチンは、教師データDB51に記録された抗体のアミノ酸配列に基づいて、変異配列を作成するサブルーチンである。ライブラリ作成のサブルーチンの処理の流れは後述する。
【0110】
制御部21は、変異配列ライブラリDB52から1つのレコードを抽出し、物性フィールドに記録された物性を取得する(ステップS503)。制御部21は、物性を複数の学習モデル53のそれぞれに入力して、推定活性値を取得する(ステップS504)。制御部21は、推定活性値に基づいて、それぞれの活性の良否を判定する。
【0111】
制御部21は、ステップS503で抽出したレコードの活性フィールドおよび判定フィールドに、推定活性値および活性の良否の判定結果を記録する(ステップS505)。
【0112】
制御部21は、処理を終了するか否かを判定する(ステップS506)。たとえば、制御部21は、変異配列ライブラリDB52に記録されたレコードのうち、所定の数のレコードの処理を行なった場合に、処理を終了すると判定する。制御部21は、ステップS505において所望の活性を有すると判定したアミノ酸配列が、所定の数を越えた場合に、処理を終了すると判定しても良い。
【0113】
終了していないと判定した場合(ステップS506でNO)、制御部21はステップS503に戻る。終了したと判定した場合(ステップS506でYES)、制御部21は、高い活性を有すると判定されたアミノ酸配列を1個取得する(ステップS507)。具体的には、制御部21は、変異配列ライブラリDB52から、判定フィールドに高い活性が記録されたレコードを1個取得する。制御部21は、アミノ酸配列フィールドに記録されたアミノ酸配列を取得する。
【0114】
なお、ステップS507で取得したアミノ酸配列が、既に処理済であるアミノ酸配列と類似している場合には、制御部21は別のアミノ酸配列を取得しなおしても良い。ここで類似するとは、たとえば数個のアミノ酸を除いて同一のアミノ酸配列である場合である。次の強化学習のプロセスにおいては、類似したアミノ酸配列から開始した場合には、同一の結果に収束する可能性があるためである。
【0115】
制御部21は、強化学習のサブルーチンを起動する(ステップS508)。強化学習のサブルーチンは、強化学習を用いてアミノ酸配列を変更し、抗体の活性を改善するサブルーチンである。強化学習のサブルーチンの処理の流れは後述する。
【0116】
制御部21は、強化学習による抗体の改善を終了するか否かを判定する(ステップS509)。たとえば制御部21は、変異配列ライブラリDB52に記録されたレコードのうち、所定の数のレコードの処理を終了した場合に、強化学習による抗体の改善を終了すると判定する。制御部21は、ステップS505において所定の活性を有すると判定したアミノ酸配列の処理を終了した場合に、強化学習による抗体の改善を終了すると判定しても良い。
【0117】
終了しないと判定した場合(ステップS509でNO)、制御部21はステップS507に戻る。終了すると判定した場合(ステップS509でYES)、制御部21は高い活性を有すると判定されたアミノ酸配列を出力する(ステップS510)。出力の形式は、たとえば所定のアミノ酸配列を有するタンパク質を合成する合成装置への入力データである。出力の形式は、アミノ酸配列をコードした核酸塩基配列であっても良い。
【0118】
ユーザは、ステップS510で出力された配列に基づいて実験抗体を作製し、活性を実験的に測定する(ステップS511)。制御部21は、ユーザにより測定された活性の測定結果を取得する。ユーザは、目標とする抗体の開発を終了するか否かを判定する(ステップS512)。開発を終了するとユーザが判定した場合(ステップS512でYES)、ユーザの指示に基づいて制御部21は処理を終了する。
【0119】
目標とする抗体の開発を終了しないとユーザが判定した場合(ステップS512でNO)、ユーザの指示に基づいて制御部21は測定結果を取得する(ステップS513)。制御部21は、教師データDB51に新規レコードを追加して、ステップS510で取得したアミノ酸配列と、ステップS513で取得した活性とを記録する(ステップS514)。
【0120】
制御部21は、教師あり学習モデル生成のサブルーチンを起動して、学習モデル53の再学習を行なう(ステップS515)。教師あり学習モデル生成のサブルーチンは、ステップS501で起動したサブルーチンと同一のサブルーチンである。制御部21は、ステップS503に戻る。
【0121】
図14は、教師あり学習モデル生成のサブルーチンの処理の流れを示すフローチャートである。教師あり学習モデル生成のサブルーチンは、教師データDB51に記録された教師データに基づいて、学習モデル53を生成するサブルーチンである。
【0122】
制御部21は、教師データDB51から、物性と活性とを組にした訓練データを取得する(ステップS521)。訓練データは、教師データから後に使用する評価データを除いたデータである。評価データは、教師データDB51に記録されたレコードからランダムに選択することが望ましい。
【0123】
制御部21は、たとえばロジスティック回帰、SVM、ランダムフォレスト、CNN、RNNまたはXGBoost等の任意の手法を用いた教師あり機械学習により、
図5を使用して説明した中間層532を調整して、学習モデル53を生成する(ステップS522)。
【0124】
制御部21は、教師データDB51から評価データを取得する(ステップS523)。制御部21は、評価データの物性をステップS522で生成した学習モデル53に入力して出力された推定活性値と、評価データに記録された活性とを対比して、学習モデル53の精度を評価する(ステップS524)。
【0125】
たとえば、制御部21は、学習モデル53から出力された推定活性値と、実測活性値、評価データに記録された活性との残差が、実測活性値の2割以内である場合に推定活性値は正答であり、それ以外の場合に誤答であると判定する。制御部21は、正答数と誤答数とに基づいて、Accuracy、Precision、Recall、SpecificityまたはF-measure等の、学習モデルの精度に関する指標を算出する。
【0126】
図4を使用して説明した活性を示す多くの項目のうち、どの項目を重視して学習モデル53の精度を評価するかは、所望の抗体の特性により定められる。たとえば、標的抗原と強く結合する抗体を開発する場合には、結合定数が一致することを重視して評価を定める。標的抗原と速やかに結合する抗体を開発する場合には、結合速度定数が一致することを重視して評価を定める。
【0127】
制御部21は、補助記憶装置23または主記憶装置22に、学習モデル53の精度を記録する(ステップS525)。制御部21は、所定の手法による学習モデル53の作成を終了したか否かを判定する(ステップS526)。終了していないと判定した場合(ステップS526でNO)、制御部21はステップS522に戻る。
【0128】
終了したと判定した場合(ステップS526でYES)、制御部21はステップS525で記録したそれぞれの学習モデル53の評価に基づいて、どの学習モデル53を以後の工程で使用するかを選択する(ステップS527)。制御部21は、選択した学習モデル53を補助記憶装置23に記録する。制御部21は、処理を終了する。
【0129】
適切な教師あり学習モデル生成手法が知られている場合には、ステップS525およびステップS526を省略しても良い。本サブルーチンを2回目以降に実行する場合には、前回の手法で学習モデル53を生成し、ステップS525およびステップS526を省略しても良い。
【0130】
ステップS523において、所定の精度が得られていると判定した場合、ステップS525において制御部21は処理を終了すると判定しても良い。
【0131】
図15は、ライブラリ作成のサブルーチンの処理の流れを示すフローチャートである。ライブラリ作成のサブルーチンは、教師データDB51に記録された抗体のアミノ酸配列に基づいて、変異配列を作成するサブルーチンである。
【0132】
制御部21は、教師データDB51から1個のレコードを取得して、アミノ酸配列フィールドに記録されたアミノ酸配列を取得する(ステップS531)。制御部21は、取得したアミノ酸配列の任意の箇所に、任意のアミノ酸の置換、挿入、または欠失の処理を行って、変異配列を生成する(ステップS532)。
【0133】
ステップS532において、制御部21は、置換、挿入、または欠失を行なう場所をランダムに選択する。制御部21は、置換、挿入または欠失のいずれの処理を行なうかをランダムに選択する。置換または挿入の処理を行なう場合、制御部21は置換または挿入を行なうアミノ酸をランダムに選択する。
【0134】
制御部21は、アミノ酸の置換、挿入、または欠失の処理を、ステップS531で取得したアミノ酸配列のうちの1箇所に対して行なっても、複数個所に対して行なっても良い。制御部21は、1ヶ所の置換、挿入、または欠失の処理を、アミノ酸配列のうちの1個のアミノ酸について行なっても、連続する複数のアミノ酸について行なっても良い。
【0135】
制御部21は、ステップS532における処理を、ステップS531で取得したアミノ酸配列に含まれるアミノ酸の一部を他のアミノ酸に置換する処理に限定しても良い。このように限定することにより、抗体を探索する範囲が狭くなる代わりに、処理速度が向上する。
【0136】
制御部21は、ステップS532において、アミノ酸の置換、挿入または欠失の処理を行なう場所を、抗体の可変領域を構成するアミノ酸に限定してもよい。このように限定することにより、変異配列ライブラリDB52に抗体の性質を有さない変異配列が含まれにくくなるため、処理速度が向上する。
【0137】
制御部21は、ステップS532において、アミノ酸の置換、挿入または欠失の処理を行なう場所を、抗体のCDRを構成するアミノ酸に限定してもよい。このように限定することにより、変異配列ライブラリDB52に抗体の性質を有さない変異配列が含まれにくくなるため、処理速度が向上する。
【0138】
制御部21は、ステップS532で生成した変異配列を物性シミュレータ55に入力して、物性を取得する(ステップS533)。制御部21は、変異配列ライブラリDB52に新規レコードを作成し、ステップS531で取得したアミノ酸配列の教師ID、ステップS532で生成したアミノ酸配列およびステップS533で取得した物性を記録する(ステップS534)。制御部21は、新規レコードの判定フィールドを「未」を記録する。
【0139】
制御部21は、ステップS531で取得したアミノ酸配列に関する変異配列の作成を終了するか否かを判定する(ステップS535)。制御部21は、たとえば所定の数のレコードを変異配列DB52に記録した場合に、変異配列ライブラリDB52の作成を終了すると判定する。終了しないと判定した場合(ステップS535でNO)、制御部21はステップS532に戻る
【0140】
ステップS531で取得したアミノ酸配列に関する変異配列の作成を終了すると判定した場合(ステップS535でYES)、制御部21は、すべての教師データに関する変異配列の作成を終了したか否かを判定する(ステップS536)。終了していないと判定した場合(ステップS536でNO)、制御部21はステップS531に戻る。終了していると判定した場合(ステップS536でYES)、制御部21は処理を終了する。
【0141】
図16は、強化学習のサブルーチンの処理の流れを示すフローチャートである。強化学習のサブルーチンは、強化学習を用いてアミノ酸配列を変更し、抗体の活性を改善するサブルーチンである。
【0142】
制御部21は、抗体のアミノ酸配列をドッキングシミュレータ56に入力して推定結合活性値を算出する、ドッキングシミュレーションを実施する(ステップS540)。ドッキングシミュレータ56の処理においては、制御部21はアミノ酸配列、すなわち抗体の一次構造に基づいて、抗体の立体構造を算出する。制御部21は、抗体の立体構造と、標的抗原の立体構造とに基づいて、両者の結合状態をシミュレーションすることにより、推定結合活性値を算出する。
【0143】
制御部21は、
図9を使用して説明したニューラルネットワークモデル60に状態s、すなわち抗体のアミノ酸配列および活性を入力する。制御部21は、状態sに対して取り得るそれぞれの行動aに対するQ(s,a)をニューラルネットワークモデル60から取得する(ステップS541)
【0144】
制御部21は、Q(s,a)の高い行動aを選択する(ステップS542)。制御部21は、取得した行動aに基づいて、変異配列を作成する(ステップS543)。制御部21は、変異配列をドッキングシミュレータ56に入力して推定結合活性値を算出する、ドッキングシミュレーションを実施する(ステップS544)。制御部21は、推定結合活性値の変化に基づいて報酬rを算出する(ステップS545)。
【0145】
ステップS545において、制御部21は、所定の評価方法に基づいて変異配列の推定結合活性値の点数を算出する。所定の評価方法は、所望の抗体の特性に基づいて定められている。たとえば、標的抗原と強く結合する抗体を開発する場合には、結合定数が増加した場合に高得点になる評価方法が採用される。標的抗原と速やかに結合する抗体を開発する場合には、結合速度定数が増加した場合に高得点になる評価方法が採用される。制御部21は、点数の変化に基づいて報酬rを定める。なお、制御部21は、点数自体に基づいて報酬を定めても良い。
【0146】
制御部21は、処理を終了するか否かを判定する(ステップS546)。たとえば、所定の回数繰り返し処理を行った場合、報酬rが所定の値以下になった場合、または推定結合活性値の点数が所定の値以上になった場合等に、制御部21は処理を終了すると判定する。
【0147】
処理を終了しないと判定した場合(ステップS546でNO)、制御部21は(1)式に基づいてニューラルネットワークモデル60を更新する(ステップS547)。具体的には、制御部21は誤差逆伝播法等を用いてニューラルネットワークモデル60の中間層602のパラメータを演算して学習を行なう。制御部21は、ステップS541に戻る。
【0148】
処理を終了すると判定した場合(ステップS546でYES)、制御部21は処理中の教師データにかかる教師IDと、ステップS543で作成した変異配列と、ステップS544で算出した点数とを、強化後DB58に記録する(ステップS548)。
【0149】
なお、制御部21は、ステップS544のドッキングシミュレーションで算出した推定結合活性値を強化後DB58に記録しても良い。
【0150】
本実施の形態によると、所望の活性を有する抗体を得る情報処理方法を提供できる。変異配列ライブラリDB52に多様なアミノ酸配列を作成して、学習モデル53を用いて推定活性値を求めることにより、少ない計算量で多種多様な変異配列を評価して、有望なアミノ酸配列を選択できる。
【0151】
学習モデル53を用いて選択した有望なアミノ酸配列について、強化学習を用いることにより、高い活性の抗体を得られる。学習モデル53を用いて選択したアミノ酸配列から強化学習を開始することにより、いわゆるローカルミニマムに陥ることを防止できる。
【0152】
複数の手法を用いて作成した学習モデル53の精度を比較して精度の高い学習モデル53を選択することにより、標的抗原の特性に応じて適切な学習モデル53を使用できる。
【0153】
計算量の多いドッキングシミュレーションを行なう対象を、計算量の少ない物性シミュレーションおよび学習モデル53を用いて絞り込むことにより、全体の計算量を節約できる。ドッキングシミュレーションによりアミノ酸配列を絞り込んだ上で、実際に抗体を作製し、活性を実測することにより、抗体開発に要する期間および費用を節約できる。
【0154】
実測結果を教師データDB51に追加して学習モデル53を更新することにより、学習モデル53の精度を高めることができる。そのため、ループを繰り返すことにより所望する条件を満たす配列を発見する可能性が向上する情報処理方法を提供できる。
【0155】
既に標的抗原に対応する抗体が知られており、活性を向上させた抗体を設計する場合には、
図1を使用して説明した実験動物を用いた抗体産生の工程を省略し、既知の抗体をプロトタイプ抗体の代わりに使用できる。同様に、プロトタイプ抗体の種類が少ない場合、または、プロトタイプ抗体が得られない場合も、既知の抗体をプロトタイプ抗体の代わりに使用できる。既知の抗体が、本実施の形態の情報処理装置20を用いて設計された場合、設計に用いたニューラルネットワークモデル60を初期状態として、深層強化学習を開始することにより、ニューラルネットワークモデル60の学習時間を短縮できる。
【0156】
たとえば、Fabフラグメント等の、断片化した抗体の設計に本実施の形態の情報処理装置20を使用しても良い。
【0157】
[実施の形態2]
本実施の形態は、教師データを追加する都度、変異配列ライブラリDB52を作成する情報処理装置20に関する。実施の形態1と共通する部分については、説明を省略する。
図17は、実施の形態2のプログラムの処理の流れを示すフローチャートである。
【0158】
ステップS514までの処理は、
図13を使用して説明した実施の形態1のプログラムの処理の流れと同一であるため、説明を省略する。制御部21は、ステップS501に戻る。
【0159】
本実施の形態によると、新たに追加された教師データに対しても変異配列を作成するため、アミノ酸配列の検索を行なう範囲を広くできる。
【0160】
なお、ステップS502で起動するライブラリ作成のサブルーチンで作成する変異配列の数を実施の形態1よりも少なくしても良い。教師データ、すなわち有望なアミノ酸配列の周辺を重点的に調べる情報処理方法を提供できる。
【0161】
[実施の形態3]
本実施の形態は、変異配列ライブラリDB52に記録するアミノ酸配列を、所定の置換行列に基づいて作成する情報処理装置20に関する。実施の形態1と共通する部分については、説明を省略する。
【0162】
BLOSUM行列(Blocks Substitution Matrix:ブロックアミノ酸置換行列)、および、PAM(Point Accepted Mutation)行列等の、進化上のアミノ酸の置換の発生頻度を表わす置換行列が使用されている。BLOSUM行列には、BLOSUM50、BLOSUM62、BLOSUM64等の種々のバリエーションが存在する。
【0163】
置換行列は、たとえば(2)式のように表現できる。なお(2)式は一部を省略して示すが、右辺は20行×20列の2次元行列である。
【0164】
【0165】
本実施の形態においては、
図15を使用して説明したライブラリ作成のサブルーチンのステップS532において、制御部21は、アミノ酸の置換を行なう場所をランダムに選択する。制御部21は、選択した場所のアミノ酸を取得する。制御部21は、(2)式を使用して説明した置換行列において、選択した場所のアミノ酸に対応する行に示される置換の発生頻度に基づいて、置換後のアミノ酸を定める。以上により、制御部21は、アミノ酸の置換を行った後の変異配列を作成する。
【0166】
具体例を挙げて説明する。置換行列において元のアミノ酸がアラニンに置換される頻度が50パーセント、アルギニンに置換される頻度が50パーセント、それ以外のアミノ酸に置換される頻度が0パーセントである場合、制御部21は、乱数または擬似乱数に基づいて、確率的発生頻度が置換行列と等しくなるという条件下でランダムにアラニンまたはアルギニンを置換後のアミノ酸に決定する。
【0167】
制御部21は、置換後のアミノ酸をランダムに定めた後に、(2)式に示す置換行列を参照して、当該置換の発生頻度が所定の閾値未満である場合には、置換後のアミノ酸を定めなおしても良い。
【0168】
本実施の形態によると、公知の置換行列を用いることにより、進化上のアミノ酸の置換頻度に基づいて変異配列を生成できる。このようにして生成した変異配列は、抗体の機能を有する確率が高い。したがって、少ない試行回数で、良好な特性を有する抗体を生成できる可能性が高い情報処理装置20を提供できる。
【0169】
置換行列は、公知の行列に限定しない。たとえば、所定の性質を有する抗体の蛋白質配列を多数収集して、独自の置換行列を作成しても良い。
【0170】
置換行列は、(3)式に示す、20行×21列の2次元行列であっても良い。
【0171】
【0172】
1列目から20列目までは、(2)式と同様であるので、説明を省略する。21列目の2番目の添え字「*」は、アミノ酸が欠失することを意味する。具体的には、1行21列のXA,*は、アラニンが欠失する頻度を示す値である。
【0173】
(3)式に示す置換行列を使用することにより、元の配列からアミノ酸が欠失した変異配列も作成可能な情報処理装置20を提供できる。
【0174】
置換行列は、(4)式に示す、20行×21列を超える2次元行列であっても良い。
【0175】
【0176】
1列目から21列目までは、(3)式と同様であるので、説明を省略する。1行22列のXA,AAは、1個のアラニンが2個のアラニンに置換される頻度、すなわちアラニンの後ろにアラニンが挿入される頻度を示す値である。同様に、2行22列のXR,RAは、アルギニンの後ろにアラニンが挿入される頻度を示す値である。
【0177】
(3)式に示す置換行列を使用することにより、元の配列にアミノ酸が挿入された変異配列も作成可能な情報処理装置20を提供できる。
【0178】
置換行列は、1個のアミノ酸が3個以上のアミノ酸に置換される頻度を示す列を有しても良い。
【0179】
[実施の形態4]
図18は、実施の形態4の情報処理装置20の機能ブロック図である。情報処理装置20は、取得部71と生成部72とを有する。取得部71は、プロトタイプ抗体の物性、および、プロトタイプ抗体を所定の標的抗原と組み合わせた場合の活性を教師データとして取得する。生成部72は、取得した物性を入力データとし、取得した活性を出力データとする学習モデルを生成する。
【0180】
[実施の形態5]
本実施の形態は、汎用のコンピュータ90とプログラム97とを組み合わせて動作させることにより、本実施の形態の情報処理装置20を実現する形態に関する。
図19は、実施の形態5の情報処理装置20の構成を示す説明図である。実施の形態1と共通する部分については、説明を省略する。
【0181】
本実施の形態のコンピュータ90は、制御部21、主記憶装置22、補助記憶装置23、通信部24、表示部25、入力部26、読取部28およびバスを備える。コンピュータ90は、汎用のパーソナルコンピュータ、タブレットまたはサーバマシン等の情報機器である。
【0182】
プログラム97は、可搬型記録媒体96に記録されている。制御部21は、読取部28を介してプログラム97を読み込み、補助記憶装置23に保存する。また制御部21は、コンピュータ90内に実装されたフラッシュメモリ等の半導体メモリ98に記憶されたプログラム97を読出しても良い。さらに、制御部21は、通信部24および図示しないネットワークを介して接続される図示しない他のサーバコンピュータからプログラム97をダウンロードして補助記憶装置23に保存しても良い。
【0183】
プログラム97は、コンピュータ90の制御プログラムとしてインストールされ、主記憶装置22にロードして実行される。これにより、コンピュータ90は上述した情報処理装置20として機能する。
【0184】
各実施例で記載されている技術的特徴(構成要件)はお互いに組合せ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものでは無いと考えられるべきである。本発明の範囲は、上記した意味では無く、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0185】
20 情報処理装置
21 制御部
22 主記憶装置
23 補助記憶装置
24 通信部
25 表示部
26 入力部
51 教師データDB
52 変異配列ライブラリDB
53 学習モデル
531 入力層
532 中間層
533 出力層
54 変異生成部
55 物性シミュレータ
56 ドッキングシミュレータ
57 報酬算出部
58 強化後DB
59 立体構造シミュレータ
60 ニューラルネットワークモデル
601 入力層
602 中間層
603 出力層
71 取得部
72 生成部
90 コンピュータ
96 可搬型記録媒体
97 プログラム
98 半導体メモリ