IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

<>
  • 特開-配列生成装置および配列生成方法 図1
  • 特開-配列生成装置および配列生成方法 図2
  • 特開-配列生成装置および配列生成方法 図3
  • 特開-配列生成装置および配列生成方法 図4
  • 特開-配列生成装置および配列生成方法 図5
  • 特開-配列生成装置および配列生成方法 図6
  • 特開-配列生成装置および配列生成方法 図7
  • 特開-配列生成装置および配列生成方法 図8
  • 特開-配列生成装置および配列生成方法 図9
  • 特開-配列生成装置および配列生成方法 図10
  • 特開-配列生成装置および配列生成方法 図11
  • 特開-配列生成装置および配列生成方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024170880
(43)【公開日】2024-12-11
(54)【発明の名称】配列生成装置および配列生成方法
(51)【国際特許分類】
   G16B 30/00 20190101AFI20241204BHJP
   G16B 40/00 20190101ALI20241204BHJP
   G06N 20/00 20190101ALI20241204BHJP
【FI】
G16B30/00
G16B40/00
G06N20/00
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023087628
(22)【出願日】2023-05-29
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110002572
【氏名又は名称】弁理士法人平木国際特許事務所
(72)【発明者】
【氏名】豊村 崇
(72)【発明者】
【氏名】木戸 邦彦
(72)【発明者】
【氏名】松森 正樹
(57)【要約】
【課題】結合親和性を高く維持しつつ、多様な配列を生成する。
【解決手段】配列生成装置は、複数のアミノ酸から構成される配列に対する代理評価値を算出する配列代理評価部と、学習モデルを用いて前記配列を生成する配列生成部と、を備える。前記配列生成部は、前記学習モデルによって生成された前記配列の一部の前記アミノ酸を所定確率で変更し、変更前のアミノ酸に特性がより近いアミノ酸がより高確率で選択されるような確率密度関数を用いて、変更後のアミノ酸を選択し、アミノ酸が変更された後の配列に対する前記代理評価値に基づき、より高い代理評価値を示す配列を生成するよう前記学習モデルを学習させ、これによって学習済みモデルを生成し、前記学習済みモデルを用いて生成配列を生成する。
【選択図】図3
【特許請求の範囲】
【請求項1】
複数のアミノ酸から構成される配列に対する代理評価値を算出する配列代理評価部と、
学習モデルを用いて前記配列を生成する配列生成部と、
を備える配列生成装置であって、
前記配列生成部は、
‐前記学習モデルによって生成された前記配列の一部の前記アミノ酸を所定確率で変更し、変更前のアミノ酸に特性がより近いアミノ酸がより高確率で選択されるような確率密度関数を用いて、変更後のアミノ酸を選択し、
‐アミノ酸が変更された後の配列に対する前記代理評価値に基づき、より高い代理評価値を示す配列を生成するよう前記学習モデルを学習させ、これによって学習済みモデルを生成し、
‐前記学習済みモデルを用いて生成配列を生成する、
配列生成装置。
【請求項2】
前記代理評価値は、前記配列によって表される抗体と、抗原との結合親和性を表す、請求項1に記載の配列生成装置。
【請求項3】
前記特性は疎水性を含む、請求項1に記載の配列生成装置。
【請求項4】
確率密度関数は、変更前のアミノ酸の疎水性インデックスと、変更後のアミノ酸の疎水性インデックスとの差分が大きくなるにつれて徐々に確率が小さくなる関数である、請求項1に記載の配列生成装置。
【請求項5】
前記配列代理評価部は、
前記配列の第一特性を示す第一代理評価値を算出する第一配列代理評価部と、
前記配列の第二特性を示す第二代理評価値を算出する第二配列代理評価部と、
を備え、
前記配列代理評価部は、前記第一代理評価値と前記第二代理評価値とに基づき、前記代理評価値を算出する、
請求項1に記載の配列生成装置。
【請求項6】
前記第一特性は、前記配列によって表される抗体と、抗原との結合親和性を表し、
前記第二特性は、前記配列によって表される抗体の溶解性を表す、
請求項5に記載の配列生成装置。
【請求項7】
前記配列代理評価部は、前記第一代理評価値と前記第二代理評価値との重み付き加算に基づいて前記代理評価値を算出する、請求項5に記載の配列生成装置。
【請求項8】
前記配列生成装置は、さらに、配列出力部と、評価真値入力部と、配列蓄積部とを備え、
前記配列出力部は、前記生成配列を出力し、
前記評価真値入力部は、前記生成配列に対する評価真値を取得し、
前記配列蓄積部は、前記生成配列と前記評価真値の組を格納し、
前記配列代理評価部は、前記配列蓄積部から前記生成配列と前記評価真値の前記組を取得し、これに基づいて機械学習を行う、
請求項1に記載の配列生成装置。
【請求項9】
前記配列生成装置は、第一配列生成群と、第二配列生成群と、配列生成選択部とを備え、
前記第一配列生成群および前記第二配列生成群は、いずれも、
‐前記配列の第一特性を示す第一代理評価値を算出する第一配列代理評価部と、
‐前記配列の第二特性を示す第二代理評価値を算出する第二配列代理評価部と、
を備え、
前記第一配列生成群は、前記第一代理評価値と前記第二代理評価値との、第一比率による重み付き加算によって前記代理評価値を算出し、
前記第二配列生成群は、前記第一代理評価値と前記第二代理評価値との、前記第一比率とは異なる第二比率による重み付き加算によって前記代理評価値を算出し、
前記配列生成選択部は、前記第一配列生成群が算出した複数の前記代理評価値の平均値と、前記第二配列生成群が算出した複数の前記代理評価値の平均値とに基づき、前記第一配列生成群および前記第二配列生成群を含む配列生成群グループからいずれか1つを選択し、
前記配列出力部は、前記配列生成選択部によって選択された前記1つによって生成された前記生成配列を出力する、
請求項8に記載の配列生成装置。
【請求項10】
複数のアミノ酸から構成される配列に対する代理評価値を算出する配列代理評価ステップと、
学習モデルを用いて前記配列を生成する配列生成ステップと、
を備える配列生成方法であって、
前記配列生成ステップは、
‐前記学習モデルによって生成された前記配列の一部の前記アミノ酸を所定確率で変更し、変更前のアミノ酸に特性がより近いアミノ酸がより高確率で選択されるような確率密度関数を用いて、変更後のアミノ酸を選択するステップと、
‐アミノ酸が変更された後の配列に対する前記代理評価値に基づき、より高い代理評価値を示す配列を生成するよう前記学習モデルを学習させ、これによって学習済みモデルを生成するステップと、
‐前記学習済みモデルを用いて生成配列を生成するステップと、
を含む、配列生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は配列生成装置および配列生成方法に関し、とくにアミノ酸から構成される配列を生成するものに関する。
【背景技術】
【0002】
抗体は、抗体医薬として利用される。抗体は20種類のアミノ酸が合計で1500程度連なって構成されている。このため、1つの抗体を構成するアミノ酸の配列において、アミノ酸の組み合わせは20の1500乗程度になりうる。このような膨大な数の配列を実際に作製して実験で評価するのは非現実的である。
【0003】
実験を効率的に行うために、計算機上で配列を生成してシミュレーションで評価し、有望な配列だけを実際に作製して実験で評価するという手法が可能である。しかしながら、配列の評価項目は多岐にわたり(結合親和性、粘性、溶解性、免疫原性など)、シミュレーションで評価できるのは評価項目の一部のみである。このため、シミュレーションで高く評価された有望な配列であっても、実際の実験での評価は低く合格基準をクリアできないことが多い。
【0004】
実際の実験での合格基準のクリア率を上げるために、様々な手法が提案されている。
【0005】
特許文献1では、配列のあらかじめ同定した位置に対して突然変異を行い、親和性スコアまたは安定性スコアが向上する配列を選択する。突然変異は網羅的であり、親和性スコアや安定性スコアによる評価は単純なランキングである。
【0006】
特許文献2では、結合領域に関する閾値量が非ヒト抗体と同一で、重鎖および軽鎖フレームワーク領域に関する閾値量がヒト抗体と同一であるアミノ酸配列をGAN(Generative Adversarial Network)で生成する。疎水性アミノ酸が他の疎水性アミノ酸に変更されることに対するペナルティを設けている。
【0007】
特許文献3では、LSTM(Long Short Term Memory)を用いて結合親和性が高い配列を生成するモデルを用いる。アミノ酸の位置や前後関係を用いることが特徴である。
【0008】
また、強化学習を用いる例も知られている。たとえば、配列の結合親和性をシミュレーションで評価し、この評価値がより高くなる配列を出力するように強化学習を行う。ここで、一般的な強化学習では、結合親和性は高いがアミノ酸の構成が似ている配列ばかりを生成してしまう場合がある。構成が似ている配列は特性も似ているので、多数の配列を生成しても実際の実験で全滅する可能性がある。
【0009】
このような問題に対し、非特許文献1では、GFlowNets(Generative Flow Networks)を用い、結合親和性が高い多様な配列を生成することで、全滅を回避している。GFlowNetsは、強化学習の探索においてある状態に至るまでの確率値合計とその状態以降の確率値合計が一致するようにQ関数を学習する点に特徴がある。一般的な強化学習では一定の割引率に応じた単調なQ関数を用いるため、最終的な報酬が高い単一の経路に誘導されやすいが、GFlowNetsでは各状態でより適切な行動価値が得られるため多様なモードからのサンプリングが可能になる。こうして学習したQ関数は、それまでに生成された部分的配列に基づいて、次のアミノ酸候補20種類それぞれについてQ値を計算する。Q値が最も高くなるアミノ酸候補が、次のアミノ酸として選択され、生成される配列に組み込まれる。
【0010】
ここで、常にQ値に従ってアミノ酸を選択すると、その時点のQ関数が低くなるようなアミノ酸が選択されにくくなる。このため、選択されなかったアミノ酸を用いてより良い配列を構成する可能性については見逃されてしまう可能性がある。これを解決するために、GFlowNetsでは一定確率でアミノ酸をランダムに変更する機能(突然変異機能)を有している。
【先行技術文献】
【特許文献】
【0011】
【特許文献1】米国特許出願公開第2020/0126640号明細書
【特許文献2】米国特許出願公開第2023/0005567号明細書
【特許文献3】米国特許出願公開第2022/0253669号明細書
【非特許文献】
【0012】
【非特許文献1】Jain, M.、他、「Biological Sequence Design with GFlowNets」、arXiv:2203.04115、DOI: 10.48550/arXiv.2203.04115、[online]、2022年、[令和5年4月11日検索]、インターネット<URL:https://arxiv.org/abs/2203.04115>
【発明の概要】
【発明が解決しようとする課題】
【0013】
しかしながら、従来の技術では、結合親和性を高く維持しつつ、多様な配列を生成することが困難であるという課題があった。
【0014】
たとえば非特許文献1のようにアミノ酸をランダムに変更してしまうと、1か所のアミノ酸が変わっただけでも抗体の特性が大きく変わってしまう場合がある。そのような場合には、結合親和性が低い配列が生成されてしまい、実際の実験でのクリア率が低下する。このため、アミノ酸の変更は大きすぎない範囲で適度に行う必要がある。
【0015】
本発明はこのような課題を解決するためになされたものであり、結合親和性を高く維持しつつ、多様な配列を生成できる、配列生成装置および配列生成方法を提供することを目的とする。
【課題を解決するための手段】
【0016】
本発明に係る配列生成装置の一例は、
複数のアミノ酸から構成される配列に対する代理評価値を算出する配列代理評価部と、
学習モデルを用いて前記配列を生成する配列生成部と、
を備える配列生成装置であって、
前記配列生成部は、
‐前記学習モデルによって生成された前記配列の一部の前記アミノ酸を所定確率で変更し、変更前のアミノ酸に特性がより近いアミノ酸がより高確率で選択されるような確率密度関数を用いて、変更後のアミノ酸を選択し、
‐アミノ酸が変更された後の配列に対する前記代理評価値に基づき、より高い代理評価値を示す配列を生成するよう前記学習モデルを学習させ、これによって学習済みモデルを生成し、
‐前記学習済みモデルを用いて生成配列を生成する。
【0017】
本発明に係る配列生成方法の一例は、
複数のアミノ酸から構成される配列に対する代理評価値を算出する配列代理評価ステップと、
学習モデルを用いて前記配列を生成する配列生成ステップと、
を備える配列生成方法であって、
前記配列生成ステップは、
‐前記学習モデルによって生成された前記配列の一部の前記アミノ酸を所定確率で変更し、変更前のアミノ酸に特性がより近いアミノ酸がより高確率で選択されるような確率密度関数を用いて、変更後のアミノ酸を選択するステップと、
‐アミノ酸が変更された後の配列に対する前記代理評価値に基づき、より高い代理評価値を示す配列を生成するよう前記学習モデルを学習させ、これによって学習済みモデルを生成するステップと、
‐前記学習済みモデルを用いて生成配列を生成するステップと、
を含む。
【発明の効果】
【0018】
本発明に係る配列生成装置および配列生成方法は、結合親和性を高く維持しつつ、多様な配列を生成することができる。
【図面の簡単な説明】
【0019】
図1】本発明の実施例1に係る配列生成装置の構成例。
図2図1の配列生成装置における処理の概要を説明する図。
図3図1の配列生成装置の処理の流れを表すフローチャート。
図4】選択の基準となる特性の例。
図5】具体的な確率密度関数の例。
図6】実施例2に係る配列生成装置の構成例。
図7図6の配列生成装置における処理の概要を説明する図。
図8図6の配列生成装置の処理の流れを表すフローチャート。
図9】実施例3に係る配列生成装置の構成例。
図10図10の配列生成装置の処理の流れを表すフローチャート。
図11】実施例4に係る配列生成装置の構成例。
図12図11の配列生成装置の処理の流れを表すフローチャート。
【発明を実施するための形態】
【0020】
以下、本発明の実施形態を添付図面に基づいて説明する。
[実施例1]
図1に、本発明の実施例1に係る配列生成装置10の構成例を示す。配列生成装置10は、複数のアミノ酸から構成される配列を生成する装置である。配列とは、たとえば抗体におけるアミノ酸の配列である。
【0021】
配列生成装置10は、配列代理評価部11と、配列生成部12とを備える。配列代理評価部11は、MLP(Multi Layer Perceptron)等の関数を用いて配列に対する代理評価値を算出する。配列生成部12は、学習モデルを用いて配列を生成する。
【0022】
配列生成装置10は、公知のコンピュータとしてのハードウェア構成を有し、たとえば演算手段および記憶手段を備える。演算手段はたとえばプロセッサを含み、記憶手段はたとえば半導体メモリ装置および磁気ディスク装置等の記憶媒体を含む。記憶媒体の一部または全部が、過渡的でない(non-transitory)記憶媒体であってもよい。
【0023】
また、配列生成装置10は入出力手段を備えてもよい。入出力手段は、たとえばキーボードおよびマウス等の入力装置と、ディスプレイおよびプリンタ等の出力装置と、ネットワークインタフェース等の通信装置とを含む。
【0024】
配列生成装置10の記憶手段はプログラムを記憶してもよい。プロセッサがこのプログラムを実行することにより、コンピュータが本実施例において説明される機能を実現し、これによって配列生成装置10が構成されてもよい。
【0025】
図2を用いて、配列生成装置10における処理の概要を説明する。Q関数は、機械学習によって生成可能な学習モデルであり、非特許文献1に記載されるものを用いることができる。Q関数の入力は、それまでに生成された部分的配列(0個以上のアミノ酸からなる配列)を表す状態であり、図2の例では2個のアミノ酸を含む。状態は、生成開始時点では空(0個のアミノ酸)であり、生成処理が進行するにつれて長くなる。
【0026】
なお図2では、慣習に従って、異なる種類のアミノ酸(全20種類)をそれぞれ異なるアルファベット1文字で表しており、これは他の図および以下の記載でも同様である。
【0027】
Q関数の出力は、20種類のアミノ酸それぞれに対するQ値である。配列生成部12は、その時点のQ関数に従って、Q値が最も高いアミノ酸を選択する。
【0028】
アミノ酸の選択後に、突然変異が発生するか否かが決定される。突然変異が発生する場合には、確率密度関数を用いてランダムに変更後のアミノ酸を選択する。
【0029】
図3は、配列生成装置10の処理の流れを表すフローチャートである。配列生成装置10は、このフローチャートに係る方法を実行することにより配列を生成することができる。以下、フローチャートに沿って配列生成装置10の動作を説明する。
【0030】
図3の処理において、ステップS1~S8はQ関数の学習処理であり、これによって学習済みモデルとしてのQ関数が生成される。まず配列生成部12は、配列先頭から順番に一つずつ、Q関数に従ってアミノ酸を選択する(ステップS1)。
【0031】
次に、配列生成部12は、事前に決定される一定の確率に基づき、突然変異を発生させるか否かを決定する(ステップS2)。
【0032】
突然変異を発生させると決定された場合には、配列生成部12は、変更後のアミノ酸を選択するための確率密度関数を生成する(ステップS3)。ここで、確率密度関数は変更前のアミノ酸によって異なり、変更前のアミノ酸に特性がより近いアミノ酸が、より高確率で選択されるような確率密度関数が生成される。
【0033】
図4に、選択の基準となる特性の例を示す。この例では、特性は疎水性を含む。疎水性を表す値として、Eisenbergの疎水性インデックスを用いることができる。疎水性インデックスを用いれば、アミノ酸の特性の近さを数値で表すことができる。疎水性は、抗体医薬の様々な評価項目(溶解性、凝集、結合親和性、など)に影響を与える重要指標の一つであり、これを基準としてアミノ酸を選択することにより、実験での合格基準のクリア率をより高く維持することができる。
【0034】
図5に、具体的な確率密度関数の例を示す。確率密度関数はたとえば離散化されたガウス分布を用いることができ、横軸を疎水性インデックスとすることができる。図5の確率密度関数は、変更前のアミノ酸の疎水性インデックスと、変更後のアミノ酸の疎水性インデックスとの差分が大きくなるにつれて徐々に確率が小さくなる関数である。
【0035】
図5(a)は変更前のアミノ酸がYである場合の確率密度関数を表し、Yに特性がより近いアミノ酸が、より高確率で選択されるようになっている。図5(b)は変更前のアミノ酸がTである場合の確率密度関数を表し、Tに特性がより近いアミノ酸が、より高確率で選択されるようになっている。
【0036】
ここで、確率密度関数は、すべてのアミノ酸からすべてのアミノ酸への突然変異が可能となるように設計されるので、配列の多様性が高まる。すなわち、変更前のアミノ酸に関わらず、いずれのアミノ酸も、それぞれ異なる確率で選択される。なお、変更前のアミノ酸と同一のアミノ酸が選択された場合には、突然変異が発生しなかった場合と同一の配列となる。
【0037】
配列生成部12は、ステップS3で生成された確率密度関数を用いて、変更後のアミノ酸を選択する(ステップS4)。
【0038】
ステップS2において突然変異を発生させないと決定された場合には、ステップS3およびS4は実行されず、すなわちステップS1で選択されたアミノ酸がそのまま用いられる。
【0039】
配列生成部12は、ステップS1またはS4で選択されたアミノ酸を配列の末尾に追加し、所定の長さの配列生成が完了したか否かを判定する(ステップS5)。完了していない場合には、処理はステップS1に戻り、すなわち次のアミノ酸が追加される。
【0040】
配列生成が完了した場合には、配列代理評価部11により、生成された配列の代理評価値を取得する(ステップS6)。アミノ酸の配列に基づいて、特定の評価値を取得するための手法は、公知技術等に基づいて当業者が適宜設計可能である。
【0041】
代理評価値の具体例は、配列によって表される抗体と、抗原との結合親和性を表す値として表現することができる。このような代理評価値を用いることにより、実験における結合親和性の合格基準のクリア率が高い配列に対して、高い代理評価値を与えることができる。
【0042】
なお、1回以上の突然変異が発生していた場合には(一般的にはその確率が高い)、この代理評価値は、アミノ酸が変更された後の配列に対する代理評価値であるということができる。
【0043】
次に、配列生成部12が、配列代理評価部11から代理評価値を取得し、この代理評価値に基づき、より高い代理評価値を示す配列を生成するようにQ関数を学習させ更新する(ステップS7)。
【0044】
次に、配列生成部12は、Q関数を所定の回数だけ更新したか否かを判定する(ステップS8)。所定の回数に達していない場合には、処理はステップS1に戻り、すなわち次の配列が生成される。
【0045】
所定の回数に達した場合には、Q関数の機械学習が完了し、学習済みモデルとしてのQ関数が生成される。配列生成部12は、生成されたQ関数を用いて、配列(生成配列)を生成する(ステップS9)。
【0046】
以上説明するように、実施例1では、Q関数の学習処理において、Q関数によって生成された配列の一部のアミノ酸を配列生成部12が所定確率で変更するが、ここで、変更前のアミノ酸に特性(たとえば疎水性)がより近いアミノ酸がより高確率で選択されるような確率密度関数が用いられる。このため、特性のより近い配列(たとえば結合親和性が高い配列)を生成でき、実際の実験における合格基準のクリア率が向上する。
【0047】
[実施例2]
実施例2は、実施例1において、単一の配列代理評価部に代えて、それぞれ異なる代理評価値を算出する複数の配列代理評価部を用いるものである。以下、実施例2について説明するが、実施例1と共通する部分については説明を省略する場合がある。
【0048】
図6に、実施例2に係る配列生成装置20の構成例を示す。配列生成装置20は、配列代理評価部として、配列の第一特性を示す第一代理評価値を算出する第一配列代理評価部21と、配列の第二特性を示す第二代理評価値を算出する第二配列代理評価部22とを備える。また、配列生成装置20は、実施例1(図1)と同様の配列生成部12を備える。
【0049】
図7を用いて、配列生成装置20における処理の概要を説明する。配列の代理評価値を算出する手法は様々なものが考えられ、複数の手法を組み合わせることができる。配列に対して複数の代理評価値を算出し、それらを加算した結果(加算代理評価値)を総合的な代理評価値とする。
【0050】
図7の例では、第一特性は、配列によって表される抗体と、抗原との結合親和性を表し、第二特性は、配列によって表される抗体の溶解性を表す。溶解性の定義は当業者が適宜決定可能であるが、たとえば水、生理食塩水または任意の体液に対する溶解性を表す。このような特性を用いることにより、実験の合格基準をクリアできる可能性が高まる。
【0051】
配列生成部12は、第一代理評価値と第二代理評価値とに基づき、総合的な代理評価値を算出する。たとえば単純に加算してもよいが、重み付き加算に基づいて総合的な代理評価値を算出するように構成すると、より柔軟な評価が可能となる。
【0052】
図8は、配列生成装置20の処理の流れを表すフローチャートである。実施例1(図3)のステップS6が、実施例2(図8)ではステップS6a~S6cに置き換えられている。他のステップは実施例1と同様とすることができる。以下ではステップS6a~S6cのみについて説明する。
【0053】
配列生成が完了した後、第一配列代理評価部21により、生成された配列の第一代理評価値を取得し(ステップS6a)、第二配列代理評価部22により、生成された配列の第二代理評価値を取得する(ステップS6b)。上述のように、第一代理評価値に係る第一特性の例は結合親和性であり、第二代理評価値に係る第二特性の例は溶解性である。
【0054】
次に、配列生成部12は、第一代理評価値と第二代理評価値を加算して(たとえば重み付き加算により)、総合的な代理評価値を算出する(ステップS6c)。
【0055】
以上説明するように、実施例2では、複数の特性について実際の実験の評価を織り込んだ配列を生成できるので、実際の実験の合格基準のクリア率がさらに向上する。
【0056】
図7の例では2種類の特性を用いているが、3個以上の配列代理評価部を備えることにより、3種類以上の特性を用いることも可能である。
【0057】
実施例2の変形例として、他の条件に基づいて確率密度関数を変更してもよい。たとえば、それまでに生成された配列の溶解性評価値が小さい場合(たとえば水または所定の体液に対する溶解性評価値が所定閾値以下である場合)には、確率密度関数の右半分を確率値ゼロに置換してもよい。すなわち、変更前のアミノ酸よりも疎水性の高いアミノ酸が選択されないようにしてもよい。
【0058】
[実施例3]
実施例3は、実施例1において、実際の実験の評価をシミュレーションにフィードバックするよう変更したものである。以下、実施例3について説明するが、実施例1と共通する部分については説明を省略する場合がある。
【0059】
図9に、実施例3に係る配列生成装置30の構成例を示す。配列生成装置30は、実施例1(図1)と同様の配列代理評価部11および配列生成部12を備える。さらに、配列生成装置30は、出力装置を含む配列出力部13と、入力装置を含む評価真値入力部14と、記憶装置を含む配列蓄積部15とを備える。
【0060】
図10は、配列生成装置30の処理の流れを表すフローチャートである。まず配列生成装置30は、実施例1の処理またはこれと同様の処理により、配列を生成する。
【0061】
次に、配列出力部13は、生成された配列を出力する(ステップS11)。出力は、たとえば表示装置による表示、印刷装置による印刷、通信ネットワークを介した送信、等により、配列生成装置30の外部に向けて行われる。
【0062】
図10には示さないが、ステップS11の後、配列生成装置30の使用者は、出力された配列を実験により評価し、当該配列に対する実際の評価値(評価真値)を取得して配列生成装置30に入力する。入力は、たとえばキーボード、タッチパネル、通信ネットワークを介した送信、等により、配列生成装置30の外部から行われる。
【0063】
これに応じ、評価真値入力部14は、ステップS11で出力された配列に対する評価真値を取得する(ステップS12)。その後、配列蓄積部15は、ステップS11で出力された配列と、ステップS12で取得された評価真値との組を格納する。
【0064】
次に、配列代理評価部11は、配列蓄積部15から配列と評価真値の組を取得し、これに基づいて機械学習を行って自身を更新する(ステップS13)。たとえば代理評価値を与える関数が更新され、これによって配列代理評価部11が更新される。
【0065】
次に、配列代理評価部11は、配列代理評価部11の更新が所定の回数完了したか否かを判定する(ステップS14)。所定の回数に達していない場合には、処理はステップS1~S9に戻り、すなわち次の配列が生成される。所定の回数に達した場合には、図10の処理は終了する。
【0066】
以上説明するように、実施例3では、実際の実験結果による評価真値を用いて代理評価値の精度を改善するので、生成された配列がシミュレーションでは合格基準をクリアしたが実際の実験ではクリアできない、といった事態を低減することができる。
【0067】
実施例3においても、実施例1または2と同様の変形を施すことができる。
【0068】
[実施例4]
実施例4は、実施例2において、2種類の特性を加算する際の重み付けを最適化できるように、実施例3を組み合わせつつ変更したものである。とくに、重みの異なる配列生成部を複数用意し、重み付き評価値の平均値が最も大きい配列生成部を採用するアルゴリズム(いわゆる多腕バンディットアルゴリズム)を用いる。以下、実施例4について説明するが、実施例1~3のいずれかと共通する部分については説明を省略する場合がある。
【0069】
図11に、実施例4に係る配列生成装置40の構成例を示す。配列生成装置40は、第一配列生成群41と、第二配列生成群42と、配列生成選択部43とを備える。第一配列生成群41および第二配列生成群42は、いずれも、実施例2(図6)と同様の第一配列代理評価部21、第二配列代理評価部22および配列生成部12を備える。
【0070】
図12は、配列生成装置40の処理の流れを表すフローチャートである。まず配列生成装置40は、実施例2の処理またはこれと同様の処理により、複数の配列を生成する。
【0071】
次に、第一配列生成群41は、生成された配列のそれぞれについて第一代理評価値と第二代理評価値との重み付き加算に基づいて代理評価値(加算代理評価値)を算出し、その後、それらの加算代理評価値の平均値を算出する(ステップS21)。平均値は複数の加算代理評価値から代表値を算出する手法の一例であって、加算代理評価値の中央値や最大値を用いてもかまわない。ここで、重み付き加算は、第一比率によって行われる。具体例として、第一代理評価値に0.7を乗算したものと、第二代理評価値に0.3を乗算したものとを加算する。
【0072】
次に、第二配列生成群42も同様に、生成された配列のそれぞれについて第一代理評価値と第二代理評価値との重み付き加算に基づいて代理評価値(加算代理評価値)を算出し、その後、それらの加算代理評価値の平均値を算出する(ステップS22)。ここで、重み付き加算は、第一配列生成群41が用いる第一比率とは異なる第二比率によって行われる。具体例として、第一代理評価値に0.3を乗算したものと、第二代理評価値に0.7を乗算したものとを加算する。
【0073】
次に、配列生成選択部43は、第一配列生成群41が算出した加算代理評価値の平均値と、第二配列生成群42が算出した加算代理評価値の平均値とに基づき、第一配列生成群41および第二配列生成群42のいずれか一方を選択する(ステップS23)。たとえば、平均値が大きいほうを選択する。
【0074】
次に、配列出力部13は、配列生成選択部43によって選択された配列生成群によって生成された配列を出力する(ステップS11)。
【0075】
次に、評価真値入力部14は、ステップS11で出力された配列に対する評価真値を取得する(ステップS12)。ここで、実施例4では複数の特性を用いているので、複数の評価真値を取得する。たとえば、結合親和性に係る評価真値と、溶解性に係る評価真値とが取得される。
【0076】
次に、第一配列生成群41および第二配列生成群42は、配列と評価真値の組を取得し、これに基づいて機械学習を行ってそれぞれ自身を更新する(ステップS13)。たとえば、結合親和性に係る評価真値に基づいてそれぞれの第一配列代理評価部21が更新され、溶解性に係る評価真値に基づいてそれぞれの第二配列代理評価部22が更新される。
【0077】
以上説明するように、実施例4では、2種類の特性を加算する際の重み付けを最適化でき、より良い加算評価値を得た配列に基づいて学習が行われるので、生成された配列について実際の実験の合格基準のクリア率がさらに向上する。
【0078】
図11および12の例では2個の配列生成群を用いているが、3個以上の配列生成群を用いることも可能である。その場合には、ステップS23において、3個以上の配列生成群を含む配列生成群グループから、平均値が最も大きいいずれか1つの配列生成群が選択される。
【0079】
実施例4においても、実施例1~3と同様の変形を施すことができる。
【0080】
当業者は、上述の実施例1~4およびその変形例において、本発明の範囲内で、構成要素を任意に追加、変更または削除することができる。たとえば、配列生成装置は、通信ネットワークを介して接続された複数のコンピュータによって構成することができる。
【符号の説明】
【0081】
10,20,30,40…配列生成装置
11…配列代理評価部
12…配列生成部
13…配列出力部
14…評価真値入力部
15…配列蓄積部
21…第一配列代理評価部
22…第二配列代理評価部
41…第一配列生成群
42…第二配列生成群
43…配列生成選択部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12