IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7451653分子セット生成方法及び装置、端末及び記憶媒体
<>
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図1
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図2
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図3
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図4
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図5
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図6a
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図6b
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図6c
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図6d
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図6e
  • 特許-分子セット生成方法及び装置、端末及び記憶媒体 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-08
(45)【発行日】2024-03-18
(54)【発明の名称】分子セット生成方法及び装置、端末及び記憶媒体
(51)【国際特許分類】
   G16C 20/50 20190101AFI20240311BHJP
   G06F 16/908 20190101ALI20240311BHJP
【FI】
G16C20/50
G06F16/908
【請求項の数】 13
(21)【出願番号】P 2022180670
(22)【出願日】2022-11-11
(65)【公開番号】P2023022074
(43)【公開日】2023-02-14
【審査請求日】2022-11-11
(31)【優先権主張番号】202111647796.6
(32)【優先日】2021-12-29
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100118913
【弁理士】
【氏名又は名称】上田 邦生
(74)【代理人】
【識別番号】100142789
【弁理士】
【氏名又は名称】柳 順一郎
(74)【代理人】
【識別番号】100201466
【弁理士】
【氏名又は名称】竹内 邦彦
(72)【発明者】
【氏名】チェン, ツィユアン
(72)【発明者】
【氏名】ファン, シャオミン
(72)【発明者】
【氏名】ワン, ファン
(72)【発明者】
【氏名】ヘ, ジンチョウ
【審査官】岡北 有平
(56)【参考文献】
【文献】特表2021-500660(JP,A)
【文献】国際公開第2021/207160(WO,A1)
【文献】国際公開第2021/146432(WO,A1)
【文献】米国特許出願公開第2021/0098084(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00 - 99/00
G06F 16/908
(57)【特許請求の範囲】
【請求項1】
分子セット生成装置によって実行される分子セット生成方法であって、
事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得するステップと、
前記第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、前記物理的情報に基づいて、前記少なくとも1つの初期化分子を選別し、選別された分子セットを得るステップと、
前記選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得するステップと、
前記少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得るステップと、
を含み、
事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得するステップが、
遺伝的アルゴリズムを利用して前記初期化分子セットを選別し、第2の初期化分子サブセットを取得するステップと、
事前選別モデルによって前記第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別し、第1の初期化分子サブセットを得るステップと、
を含み、
事前選別モデルによって前記第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別し、第1の初期化分子サブセットを得るステップが、
前記事前選別モデルに対応する選択策略を取得するステップであって、前記選択策略は分子スコア及び空間的多様性条件を含むステップと、
前記第2の初期化分子サブセットにおける前記選択策略を満たす少なくとも1つの初期化分子を取得し、第1の初期化分子サブセットを得るステップと、
を含む分子セット生成方法。
【請求項2】
前記少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得るステップが、
第3の初期化分子サブセットを再取得し、前記第3の初期化分子サブセットを前記第1の初期化分子サブセットとし、前記選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得するステップを再実行するステップと、
前記選別された分子セットにおける各分子の対応する生化学実験評価値の変化量が変化量閾値未満である場合、第3の初期化分子サブセットを取得するステップの実行を停止するステップと、
を含む請求項1に記載の方法。
【請求項3】
事前選別モデルによって初期化分子セットにおける初期化分子サブセットを取得するステップの前に、
ニューラルネットワークモデルによってサンプリングして少なくとも1つの初期化シードを取得するステップと、
生成モデルによって前記少なくとも1つの初期化シードに対応する初期化分子セットを取得するステップと、
を含む請求項1に記載の方法。
【請求項4】
ニューラルネットワークモデルによってサンプリングして少なくとも1つの初期化シードを取得するステップが、
ニューラルネットワークモデルを利用して初期化されたモデル潜在空間からサンプリングして少なくとも1つの初期化シードを得るステップ、または、
前記ニューラルネットワークモデルを利用して生成された空間からサンプリングして前記少なくとも1つの初期化シードを得るステップと、
を含む請求項に記載の方法。
【請求項5】
前記少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得るステップの後、
前記目標分子セットにおける少なくとも1つの目標分子に対応する属性情報及び検証情報を取得するステップと、
前記少なくとも1つの目標分子に対応する前記属性情報及び前記検証情報に基づいて前記事前選別モデルをトレーニングし、トレーニングされた事前選別モデルを得るステップと、
を含む請求項1に記載の方法。
【請求項6】
事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得するように構成されるサブセット取得ユニットと、
前記第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、前記物理的情報に基づいて、前記少なくとも1つの初期化分子を選別し、選別された分子セットを得るように構成される分子選別ユニットと、
前記選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得するように構成される評価値取得ユニットと、
前記少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得るように構成されるセット取得ユニットと、
を備え
前記サブセット取得ユニットが、セット選別サブユニット及びサブセット選別サブユニットを備え、前記サブセット取得ユニットが、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得するように構成され、
前記セット選別サブユニットが、遺伝的アルゴリズムを利用して前記初期化分子セットを選別し、第2の初期化分子サブセットを取得するように構成され、
前記サブセット選別サブユニットが、事前選別モデルによって前記第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別し、第1の初期化分子サブセットを得るように構成され、
前記事前選別モデルに対応する選択策略を取得し、前記選択策略は分子スコア及び空間的多様性条件を含み、
前記第2の初期化分子サブセットにおける前記選択策略を満たす少なくとも1つの初期化分子を取得し、第1の初期化分子サブセットを得るように構成される分子セット生成装置。
【請求項7】
前記セット取得ユニットが、サブセット再取得サブユニット及びステップ停止サブユニットを備え、前記セット取得ユニットが、前記少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得るように構成され、
前記サブセット再取得サブユニットが、第3の初期化分子サブセットを再取得し、前記第3の初期化分子サブセットを前記第1の初期化分子サブセットとし、前記選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得するステップを再実行するように構成され、
前記ステップ停止サブユニットが、前記選別された分子セットにおける各分子の対応する生化学実験評価値の変化量が変化量閾値未満である場合、第3の初期化分子サブセットを取得するステップの実行を停止するように構成される請求項に記載の装置。
【請求項8】
シード取得ユニット及びセット生成ユニットを備え、事前選別モデルによって初期化分子セットにおける初期化分子サブセットを取得するように構成され、
前記シード取得ユニットが、ニューラルネットワークモデルによってサンプリングして少なくとも1つの初期化シードを取得するように構成され、
前記セット生成ユニットが、生成モデルによって前記少なくとも1つの初期化シードに対応する初期化分子セットを取得するように構成される請求項に記載の装置。
【請求項9】
前記シード取得ユニットが、ニューラルネットワークモデルによってサンプリングして少なくとも1つの初期化シードを取得するように構成され、
ニューラルネットワークモデルを利用して初期化されたモデル潜在空間からサンプリングして少なくとも1つの初期化シードを得て、または、
前記ニューラルネットワークモデルを利用して生成された空間からサンプリングして前記少なくとも1つの初期化シードを得るように構成される請求項に記載の装置。
【請求項10】
前記少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得た後に、
前記目標分子セットにおける少なくとも1つの目標分子に対応する属性情報及び検証情報を取得し、
前記少なくとも1つの目標分子に対応する前記属性情報及び前記検証情報に基づいて前記事前選別モデルをトレーニングし、トレーニングされた事前選別モデルを得るように構成されるモデルトレーニングユニットを備える請求項に記載の装置。
【請求項11】
少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサに通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行できる指令が記憶されており、前記指令が、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが請求項1からのいずれか一項に記載の方法を実行できる電子機器。
【請求項12】
コンピュータ指令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ指令は、コンピュータが請求項1からのいずれか一項に記載の方法を実行するために使用される非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項13】
プロセッサによって実行される場合、請求項1からのいずれか一項に記載の方法が実現されるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、コンピュータ技術の分野に関し、特に、薬物のゼロからの設計技術の分野に関し、具体的には、分子セット生成方法及び装置、端末及び記憶媒体に関する。
【背景技術】
【0002】
薬物設計の目標は、巨大な化学空間からある理想的な性質を持つ分子を見つけ出すことである。薬物のゼロからの設計(De novo design)は、必要な薬理特性を持つ新しい分子エンティティをゼロから生産することであり、薬物類分子の化学空間の基数は、1060~10100桁と推定されているため、薬物設計における最も挑戦的なコンピュータ支援タスクの1つと考えられることが多い。分子セット生成は、薬物のゼロからの設計のための重要なツールとし、低コスト、高効率で全く新しい分子構造を生成し、薬物設計のプロセスを加速させることができる。
【発明の概要】
【0003】
本開示は、効率がより高い分子セット生成方法及び装置、端末及び記憶媒体を提供する。
【0004】
本開示の一態様によれば、分子セット生成方法が提供され、前記分子セット生成方法は、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得するステップと、前記第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、前記物理的情報に基づいて、前記少なくとも1つの初期化分子を選別し、選別された分子セットを得るステップと、前記選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得するステップと、前記少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得るステップと、を含む。
【0005】
本開示の他の態様によれば、分子セット生成装置が提供され、前記分子セット生成装置は、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得するように構成されるサブセット取得ユニットと、前記第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、前記物理的情報に基づいて、前記少なくとも1つの初期化分子を選別し、選別された分子セットを得るように構成される分子選別ユニットと、前記選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得するように構成される評価値取得ユニットと、前記少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得るように構成されるセット取得ユニットと、を備える。
【0006】
本開示の他の態様によれば、電子機器が提供され、前記電子機器は、少なくとも1つのプロセッサと、該少なくとも1つのプロセッサに通信可能に接続されるメモリと、を備え、前記メモリには、前記少なくとも1つのプロセッサによって実行できる指令が記憶されており、前記指令は、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが前述した一態様のいずれかに記載の方法を実行できる。
【0007】
本開示の他の態様によれば、コンピュータ指令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体が提供され、前記コンピュータ指令は、コンピュータが前述した一態様のいずれかに記載の方法を実行するために使用される。
【0008】
本開示の他の態様によれば、コンピュータプログラムが提供され、前記コンピュータプログラムがプロセッサによって実行される場合、前述した一態様のいずれかに記載の方法が実現される。
【0009】
本開示の1つ又は複数の実施例において、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得し、前記第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、前記物理的情報に基づいて、前記少なくとも1つの初期化分子を選別し、選別された分子セットを得て、前記選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得し、前記少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得る。したがって、分子セット生成の効率を向上させることができる。
【0010】
なお、本部分に記載された内容は、本開示の実施例の肝心又は重要な特徴を限定することを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明によって容易に理解されやすくなる。
【図面の簡単な説明】
【0011】
図面は、本技術案をよりよく理解するために使用され、本開示を限定するものではない。
図1】本開示の実施例の分子セット生成方法を実現するための概略背景図である。
図2】本開示の実施例の分子セット生成方法を実現するためのシステム構成図である。
図3】本開示の第1の実施例に係る分子セット生成方法の概略フローチャートである。
図4】本開示の第2の実施例に係る分子セット生成方法の概略フローチャートである。
図5】本開示の実施例の第1の初期化分子サブセットの取得を実現するための概略シナリオ図である。
図6a】本開示の実施例の分子セット生成方法を実現するための第1の分子セット生成装置の概略構成図である。
図6b】本開示の実施例の分子セット生成方法を実現するための第2の分子セット生成装置の概略構成図である。
図6c】本開示の実施例の分子セット生成方法を実現するための第3の分子セット生成装置の概略構成図である。
図6d】本開示の実施例の分子セット生成方法を実現するための第4の分子セット生成装置の概略構成図である。
図6e】本開示の実施例の分子セット生成方法を実現するための第5の分子セット生成装置の概略構成図である。
図7】本開示の実施例の分子セット生成方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0012】
以下、図面を組み合わせて本開示の例示的な実施例を説明し、理解を容易にするためにその中には本開示の実施例の様々な詳細事項が含まれ、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本開示の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができる。同様に、わかりやすくかつ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。
【0013】
科学技術の発展に伴って、分子セット生成は、新しい化学構造を自動的に提案し、必要な分子特徴を最適な方式で満たす過程である。分子セット生成は、リガンドに基づく生成及び標的に基づく生成の2つの方式を含む。ここで、リガンドに基づく生成とは、既存の売薬分子に基づいてモデルによってその構造情報を修正することにより、新しい分子を生成することであり、こういう方式は、標的情報を無視しており、既知の活性リガンドと構造が類似する分子しか生成できず、適用シナリオが限られている。標的に基づく生成方式とは、標的ポケット情報に基づいて、標的ポケットと効果的に結合できる分子構造を設計することである。こういう方式は、標的情報を効果的に結合し、最適化の目標がより明確になり、特定の標的タンパク質に対して有効な高活性分子を生成することができ、より現実的な意義がある。
【0014】
いくつかの実施例によれば、図1は、本開示の実施例の分子セット生成方法を実現するための概略背景図を示す。図1に示すように、端末が標的に基づく生成方式によって分子を生成する際に、端末は、標的に基づく生成モデルによって分子を生成することができる。端末が生成された分子を取得すると、端末は、目標関数を呼び出して現在の分子の目標スコアを取得し、現在の目標スコアに基づいて生成策略を調整することにより、生成された分子の目標スコアでの最大化を達成することができる。
【0015】
いくつかの実施例において、図2は、本開示の実施例に係る分子セット生成方法を実現するためのシステム構成図を示す。図2に示すように、端末21は、標的に基づく生成モデルによって分子を生成し、ネットワーク22によって生成された分子をサーバ23にアップロードする。サーバ23が生成された分子を取得すると、サーバ23は、目標関数を呼び出して現在の分子の目標スコアを取得し、ネットワーク22によって目標スコアを端末21に送信し、端末21は、目標スコアに基づいて生成策略を調整することにより、生成された分子の目標スコアでの最大化を達成することができる。
【0016】
標的情報に基づく分子生成方式は、生成された分子に対して合理的な評価プロセスを設計しておらず、大量の計算又は実験評価の回数を必要とし、大量の時間、計算リソース、材料などを大量に消費する必要があり、コストが高く、実用性が低いことを容易に理解することができる。
【0017】
以下に、具体的な実施例を組み合わせて本願を詳細に説明する。
【0018】
第1の実施例において、図3に示すように、図3は、本開示の第1の実施例に係る分子セット生成方法の概略フローチャートを示し、当該方法は、コンピュータプログラムに依存して実現することができ、分子セット生成を行う装置で実行することができる。当該コンピュータプログラムは、アプリケーションに統合されてもよいし、独立したツール系アプリケーションとして実行されてもよい。
【0019】
ここで、分子セット生成装置は、分子セット生成機能を有する端末であってもよく、当該端末は、ウェアラブルデバイス、ハンドヘルドデバイス、パーソナルコンピュータ、タブレット、車載デバイス、スマートフォン、コンピューティングデバイス、又は無線モデムに接続された他の処理デバイスなどを含むが、これらに限定されない。端末は、異なるネットワークで異なる名前、例えば、ユーザ装置、アクセス端末、加入者ユニット、加入者局、移動局、移動ステーション、遠隔局、遠隔端末、モバイル装置、ユーザ端末、端末、無線通信装置、ユーザエージェント又はユーザ装置、携帯電話、コードレス電話、パーソナルデジタル処理装置(PDA)、第5世代移動通信技術(5th Generation Mobile Communication Technology、5G)ネットワーク、第4世代移動通信技術(the 4th generation mobile communication technology、4G)ネットワーク、第3世代移動通信技術(3rd-Generation、3G)ネットワーク、または未来の進化したネットワークにおける端末などと呼ぶことができる。
【0020】
具体的には、当該分子セット生成方法は、以下のステップを含む。
【0021】
S301において、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得し、いくつかの実施例によれば、初期化分子セットとは、端末で生成された選別されていない分子セットである。当該初期化分子セットは、ある固定セットを特に指すものではない。例えば、初期化分子の数が変化すると、当該初期化分子セットも変化する。初期化分子の種類が変化すると、当該初期化分子セットも変化する。
【0022】
いくつかの実施例において、第1の初期化分子サブセットとは、初期化分子セットの中で最も評価潜在力を有する分子セットである。当該第1の初期化分子サブセットは、ある固定セットを特に指すものではない。例えば、初期化分子セットが変化すると、当該第1の初期化分子サブセットも変化する。事前選別モデルが変化すると、当該第1の初期化分子サブセットも変化する。
【0023】
いくつかの実施例において、事前選別モデルとは、端末が初期化分子セットから第1の初期化分子サブセットを選択する時に使用されるモデルである。当該事前選別モデルは、ある固定モデルを特に指すものではない。端末が事前選別モデルに対するモデル修正指令を取得すると、当該事前選別モデルもそれなりに変化する。事前選別モデルには、従来の機械学習におけるランダムフォレストモデル、深層学習におけるグラフィックニューラルネットワークなどが含まれるが、これらに限定されない。
【0024】
端末が分子セットを生成する中に、端末が初期化分子セットを取得すると、端末は、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得できることを容易に理解することができる。
【0025】
ステップS302において、第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、物理的情報に基づいて、少なくとも1つの初期化分子を選別し、選別された分子セットを得て、いくつかの実施例によれば、物理的情報とは、分子が化学的変化を経ることなく表現された情報である。当該物理的情報は、ある固定情報を特に指すものではない。当該物理的情報には、結合自由エネルギー、結合活性、毒性、自由エネルギー摂動などが含まれるが、これらに限定されない。
【0026】
いくつかの実施例において、結合自由エネルギーとは、リガンドとレセプターとの間に存在する相互作用であり、その負の値が高いほど、結合を特徴付ける力が強くなり、結合を破壊するのに必要なエネルギーも大きくなり、結合自由エネルギーが正の値である場合、表面結合は自発的に形成されない。自由エネルギー摂動は、自由エネルギーを計算するための一般的な方法である。
【0027】
いくつかの実施例において、選別とは、端末が少なくとも1つの初期化分子を何回絞り出し、評価潜在力のある分子を得るプロセスである。選別の方式は、ある固定方式を特に指すものではない。端末が選別方式に対する方式修正指令を取得すると、当該選別方式もそれなりに変化する。選別の方式は、計算モデルによる選別などであってもよい。
【0028】
いくつかの実施例において、すべての選別された評価潜在力のある分子を同一のセットに入れることによって選別された分子セットを得ることができる。当該選別された分子セットは、ある固定セットを特に指すものではない。例えば、選別方式が変化すると、当該選別された分子セットも変化する。第1の初期化分子サブセットが変化すると、当該選別された分子セットも変化する。
【0029】
端末が第1の初期化分子サブセットを取得すると、端末は、第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得できることを容易に理解することができる。端末が少なくとも1つの初期化分子の物理的情報を取得すると、端末は、物理的情報に基づいて、少なくとも1つの初期化分子を選別し、選別された分子セットを得ることができる。
【0030】
S303において、選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得し、いくつかの実施例によれば、生化学実験評価値とは、実験によって得られた分子の真の属性値である。当該属性値には、結合自由エネルギー、結合活性、毒性、自由エネルギー摂動などが含まれるが、これらに限定されない。当該生化学実験評価値は、ある固定評価値を特に指すものではない。例えば、属性値の種類が変化すると、当該生化学実験評価値も変化する。分子が変化すると、当該分子に対応する生化学実験評価値も変化する。
【0031】
端末が選別された分子セットを取得した場合、端末は、選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得できることを容易に理解することができる。
【0032】
S304において、少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得る。
【0033】
いくつかの実施例によれば、目標分子セットとは、端末が少なくとも1つの分子の生化学実験評価値に基づいて、選別された分子セットから取得した目標分子生成品質に達した分子のセットである。当該目標分子セットは、ある固定セットを特に指すものではない。例えば、選別された分子セットが変化すると、当該目標分子セットも変化する。目標分子生成品質が変化すると、当該目標分子セットも変化する。
【0034】
端末が少なくとも1つの分子の生化学実験評価値を取得すると、端末は、目標分子生成品質に達する目標分子セットを取得できることを容易に理解することができる。
【0035】
本開示の実施例において、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得し、第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、物理的情報に基づいて、少なくとも1つの初期化分子を選別し、選別された分子セットを得て、選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得し、少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得る。したがって、分子の物理的情報及び生化学実験評価値を計算して目標分子セットを取得することができ、計算の回数を減らし、分子セット生成の効率を向上させ、資源コストの消費を低減し、実用性を向上させ、ひいてはユーザの使用体験を向上させることができる。
【0036】
図4を参照すると、図4は、本開示の第2の実施例に係る分子セット生成方法の概略フローチャートを示す。具体的には、S401において、ニューラルネットワークモデルによってサンプリングして少なくとも1つの初期化シードを取得し、いくつかの実施例によれば、ニューラルネットワークモデルとは、ニューロンの数学的モデルに基づいて記述され、ネットワークトポロジ、ノード特性、及び学習規則によって表される数学的モデルである。当該ニューラルネットワークモデルは、ある固定モデルを特に指すものではない。当該ニューラルネットワークモデルには、逆方向伝播(Back propagation、BP)ニューラルネットワークモデル、ホップフィールド(Hopfield)ニューラルネットワークモデル、適応共振理論(Adaptive Resonance Theory、ART)ニューラルネットワークモデル、Kohonenネットワークモデルなどが含まれるが、これらに限定されない。
【0037】
いくつかの実施例において、初期化シードとは、初期化分子を生成するために端末が使用するシードである。当該初期化シードは、ある固定シードを特に指すものではない。例えば、ニューラルネットワークモデルが変化すると、当該初期化シードも変化する。サンプリング方法が変化すると、当該初期化シードも変化する。
【0038】
いくつかの実施例において、端末がニューラルネットワークモデルによってサンプリングして初期化シードを取得する方式は、モデル潜在空間サンプリング及び生成された空間サンプリングを含み、ここで、端末がモデル潜在空間サンプリング方式を利用する場合、端末は、ニューラルネットワークモデルを利用して初期化されたモデル潜在空間からサンプリングして少なくとも1つの初期化シードを得る。端末が生成された空間サンプリングを利用する場合、端末は、ニューラルネットワークモデルを利用し、生成された空間からサンプリングして少なくとも1つの初期化シードを得る。したがって、端末が初期化シードを取得する精度を向上させることができる。
【0039】
いくつかの実施例において、モデル潜在空間とは、ニューラルネットワークモデルによって生データが圧縮された後のデータ空間である。当該モデル潜在空間は、ある固定空間を特に指すものではない。例えば、生データが変化すると、当該モデル潜在空間も変化する。ニューラルネットワークモデルが変化すると、当該モデル潜在空間も変化する。サンプリングの精度を向上させるために、当該モデル潜在空間は、例えば標準正規分布とすることができる。
【0040】
端末が分子セットを生成する中に、端末は、ニューラルネットワークモデルによってサンプリングして少なくとも1つの初期化シードを取得できることを容易に理解することができる。
【0041】
S402において、生成モデルによって少なくとも1つの初期化シードに対応する初期化分子セットを取得し、具体的なプロセスは上記の通りであり、ここでは詳しく説明しない。
【0042】
いくつかの実施例によれば、生成モデルとは、端末が少なくとも1つの初期化シードに基づいて対応する初期化分子セットを取得する際に適用されるモデルである。当該生成モデルは、ある固定モデルを特に指すものではない。当該生成モデルには、生成対抗ネットワーク(GAN)、可変自己符号化器(VAE)、フロー(Flow)などが含まれるが、これらに限定されない。
【0043】
端末が少なくとも1つの初期化シードを取得すると、端末は、生成モデルによって少なくとも1つの初期化シードに対応する初期化分子セットを取得できることを容易に理解することができる。生成モデルは、ある固定モデルを特に指すものではないので、分子セット生成方法のモデルへの依存を減らし、分子セット生成方法の実行の柔軟性を向上させることができる。
【0044】
S403において、遺伝的アルゴリズムを利用して初期化分子セットを選別し、第2の初期化分子サブセットを得て、いくつかの実施例によれば、遺伝的アルゴリズム(genetic algorithm、GA)とは、ダーウィン生物進化論の自然選択と遺伝学的機構の生物進化過程をシミュレートする計算モデルであり、自然進化過程をシミュレートすることによって最適解を探索する方法である。遺伝的アルゴリズムは、数学的にコンピュータシミュレーション演算を利用して問題の求解過程を生物進化における染色体遺伝子の交差や変異などに似た過程に変換することができる。
【0045】
いくつかの実施例において、第2の初期化分子サブセットとは、端末が初期化分子セットを遺伝的アルゴリズムによって選別して得られた粗ふるい分子セットである。当該第2の初期化分子サブセットは、ある固定セットを特に指すものではない。例えば、初期化分子セットが変化すると、当該第2の初期化分子サブセットも変化する。遺伝的アルゴリズムが変化すると、当該第2の初期化分子サブセットも変化する。
【0046】
端末が初期化分子セットを取得すると、端末は、遺伝的アルゴリズムを利用して初期化分子セットを選別し、第2の初期化分子サブセットを取得できることを容易に理解することができる。
【0047】
S404において、事前選別モデルによって第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別し、第1の初期化分子サブセットを得て、具体的なプロセスは上記の通りであり、ここでは詳しく説明しない。
【0048】
いくつかの実施例によれば、端末が事前選別モデルによって第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別する中に、端末は事前選別モデルに対応する選択策略を取得することができる。端末が選択策略を取得すると、端末は、第2の初期化分子サブセットにおける選択策略を満たす少なくとも1つの初期化分子を取得することにより、第1の初期化分子サブセットを得ることができる。したがって、端末が第1の初期化分子サブセットを取得する精度を向上させることができる。
【0049】
いくつかの実施例において、選択策略とは、事前選別モデルが第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別する中に利用される選択思想である。当該選択策略は、ある固定策略を特に指すものではない。当該選択策略の種類には、アクティブ・ラーニング(active learning)、ベイズ最適化(Bayesian optimization)、制約グローバル最適化(Constrained Global Optimization)、行列式点プロセス(determinantal point process:DPP)などが含まれるが、これらに限定されない。
【0050】
いくつかの実施例において、選択策略の内容には、分子スコア及び空間的多様性条件などが含まれるが、これらに限定されない。したがって、端末は、第1の初期化分子サブセットを取得する中に、分子スコアと空間的多様性条件とを両立させることにより、選別された分子が、高分子スコアを満足しつつ、空間的分布における離散度が高くなり、第1の初期化分子サブセットにおける分子の多様性と新規性をさらに向上させることができる。
【0051】
例えば、端末は、第1の初期化分子サブセットを取得する中に、第2の初期化分子サブセットにおけるスコアが類似する分子を5つ取得したが、その中の3つの分子の位置が近いため、端末は、これら3つの位置が近い分子から分子スコアが最も高い分子及び残りの2つの位置が近くない分子を選択して第1の初期化分子サブセットに入れることができる。図5に示すように、端末は第2初期化分子サブセットにおけるN1-N5の5つの分子スコアが類似する分子を取得し、N3、N4、N5の3つの位置が近い分子のうちN3の分子スコアが90、N4の分子スコアが85、N5の分子スコアが80であるため、端末は、N1、N2、N3の3つの分子を第1初期化分子サブセットに入れる。
【0052】
端末が第2の初期化分子サブセットを取得すると、端末は、事前選別モデルによって第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別し、第1の初期化分子サブセットを取得できることを容易に理解することができる。
【0053】
S405において、第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、物理的情報に基づいて、少なくとも1つの初期化分子を選別し、選別された分子セットを得て、具体的なプロセスは上記の通りであり、ここでは詳しく説明しない。
【0054】
いくつかの実施例によれば、端末が物理的情報に基づいて少なくとも1つの初期化分子を選別する中に、選別計算の方面には、結合自由エネルギーの計算、結合活性の計算、毒性の計算及び自由エネルギー摂動の計算などが含まれるが、これらに限定されない。ここで、端末は、分子ドッキング(docking)により結合自由エネルギーを計算し、分子活性予測モデルにより結合活性を計算し、毒性(Admet)予測モデルにより毒性を計算し、delta delta Gにより自由エネルギー摂動を計算することができる。したがって、端末は、docking、Admet予測モデル、分子活性予測モデルなどの様々な技術と効果的かつ柔軟に結合することができ、結合される生成モデルの形式に依存しない。
【0055】
例えば、端末は、いずれかの初期化分子の物理的情報に基づいて、当該初期化分子の選別計算を行い、当該初期化分子の結合自由エネルギーがA、結合活性がB、毒性がC、自由エネルギー摂動がDであると決定する。ここで、結合自由エネルギーAは、結合自由エネルギー閾値より小さく、結合活性Bは、結合活性閾値より大きく、毒性Cは、毒性閾値より大きく、自由エネルギー摂動Dは、自由エネルギー摂動閾値より大きい。すると、端末は、当該初期化分子を選別された分子セットに入れることができる。
【0056】
端末が第1の初期化分子サブセットを取得すると、端末は、第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得できることを容易に理解することができる。端末が少なくとも1つの初期化分子の物理的情報を取得すると、端末は、物理的情報に基づいて、少なくとも1つの初期化分子を選別し、選別された分子セットを得ることができる。
【0057】
S406において、選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得し、具体的なプロセスは上記の通りであり、ここでは詳しく説明しない。
【0058】
いくつかの実施例によれば、端末が選別された分子セットのいずれかの分子の少なくとも1つの属性値を生化学実験によって取得した場合、端末は、当該少なくとも1つの属性値の平均値又は重み付け平均値を決定することにより、当該分子の生化学実験評価値を得ることができる。例えば、端末が、選別された分子セットにおける分子Mの属性値1がM1、属性値2がM2、属性値3がM3であることを生化学実験によって取得すると、端末は、当該分子の生化学実験評価値が(M1+M2+M3)/3であることを得ることができる。
【0059】
端末が選別された分子セットを取得すると、端末は、選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得できることを容易に理解することができる。
【0060】
S407において、少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得て、具体的なプロセスは上記の通りであり、ここでは詳しく説明しない。
【0061】
いくつかの実施例によれば、端末は、取得された分子が目標分子生成の品質に達するまで、反復方式により少なくとも1つの分子の生化学実験評価値に基づいてステップS401~S406を少なくとも1回繰り返すことにより、目標分子セットを得ることができる。
【0062】
いくつかの実施例において、端末が反復する中に、第3の初期化分子サブセットを再取得し、第3の初期化分子サブセットを第1の初期化分子サブセットとし、選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得するステップを再実行し、選別された分子セットにおける各分子の対応する生化学実験評価値の変化量が変化量閾値未満である場合、第3の初期化分子サブセットを取得するステップの実行を停止する。したがって、取得した目的分子セットの品質を向上させることができる。
【0063】
いくつかの実施例において、第3の初期化分子サブセットとは、端末がステップS401~S404に基づいて再取得した最も評価潜在力のある分子セットである。当該第3の初期化分子サブセットは、ある固定セットを特に指すものではない。例えば、初期化分子セットが変化すると、当該第3の初期化分子サブセットも変化する。事前選別モデルが変化すると、当該第3の初期化分子サブセットも変化する。
【0064】
いくつかの実施例において、変化量閾値は、ある固定閾値を特に指すものではない。端末が変化量閾値に対する閾値修正指令を取得すると、当該変化量閾値もそれなりに変化する。
【0065】
端末が少なくとも1つの分子の生化学実験評価値を取得すると、端末は、目標分子生成品質に達する目標分子セットを取得できることを容易に理解することができる。
【0066】
S408において、目標分子セットにおける少なくとも1つの目標分子に対応する属性情報及び検証情報を取得し、いくつかの実施例によれば、属性情報とは、目標分子に対応する物理的情報及び生化学的実験情報である。当該属性情報は、ある固定情報を特に指すものではない。当該属性情報には、結合自由エネルギー、結合活性、毒性、自由エネルギー摂動などが含まれるが、これらに限定されない。
【0067】
いくつかの実施例において、検証情報とは、目標分子に対応する生化学実験評価値に含まれる少なくとも1つの属性値である。当該検証情報には、結合自由エネルギー、結合活性、毒性、自由エネルギー摂動などが含まれるが、これらに限定されない。
【0068】
端末が目標分子セットを取得すると、端末は、目標分子セットにおける少なくとも1つの目標分子に対応する属性情報及び検証情報を取得できることを容易に理解することができる。
【0069】
S409において、少なくとも1つの目標分子に対応する属性情報及び検証情報に基づいて事前選別モデルをトレーニングし、トレーニングされた事前選別モデルを得る。
【0070】
端末が目標分子セットにおける少なくとも1つの目標分子に対応する属性情報及び検証情報を取得すると、端末は、目標分子及び目標分子に対応する属性情報及び検証情報をトレーニングサンプルとして事前選別モデルをトレーニングし、トレーニングされた事前選別モデルを取得できることを容易に理解することができる。
【0071】
本開示の実施例において、端末は、ニューラルネットワークモデルによってサンプリングして少なくとも1つの初期化シードを取得し、生成モデルによって少なくとも1つの初期化シードに対応する初期化分子セットを取得するため、初期化分子セット取得の効率を向上させることができる。次に、遺伝的アルゴリズムを利用して初期化分子セットを選別し、第2の初期化分子サブセットを得て、事前選別モデルによって第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別し、第1の初期化分子サブセットを得て、したがって、第1の初期化分子サブセットの取得の精度を向上させることができる。また、第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、物理的な情報に基づいて、少なくとも1つの初期化分子を選別し、選別された分子セットを得て、選別された分子セットにおける少なくとも1つの分子の生化学実験的評価値を取得し、少なくとも1つの分子の生化学実験評価値に基づいて、目標分子セット体を得るため、分子の物理的情報や生化学実験評価値を計算することにより目標分子セットを取得することができ、計算回数を減らし、分子セット生成の効率を向上させ、資源コストの消費を低減し、実用性を向上させ、ひいてはユーザの使用体験を向上させることができる。最後に、目標分子セットにおける少なくとも1つの目標分子に対応する属性情報及び検証情報を取得し、少なくとも1つの目標分子に対応する属性情報及び検証情報に基づいて事前選別モデルをトレーニングし、トレーニングされた事前選別モデルを得て、したがって、事前選別モデルの精度を向上させることができる。
【0072】
本開示の技術案において、係るユーザの個人情報の収集、記憶、使用、加工、伝送、提供及び公開などの処理は、いずれも関連法律法規の規定に適合し、公序良俗に反しない。
【0073】
以下は、本開示の装置の実施例であり、本開示の方法の実施例を実行するために使用することができる。本開示の装置の実施例に開示されていない詳細については、本開示の方法の実施例を参照されたい。
【0074】
図6aを参照すると、図6aは、本開示の実施例に係る分子セット生成方法を実現するための第1の分子セット生成装置の概略構成図を示す。当該分子セット生成装置600は、ソフトウェア、ハードウェア又は両方の組み合わせによって、装置の全部又は一部として実現されてもよい。当該分子セット生成装置600は、サブセット取得ユニット601、分子選別ユニット602、評価値取得ユニット603及びセット取得ユニット604を備え、サブセット取得ユニット601は、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得するように構成され、分子選別ユニット602は、第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、物理的情報に基づいて、少なくとも1つの初期化分子を選別し、選別された分子セットを得るように構成され、評価値取得ユニット603は、選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得するように構成され、セット取得ユニット604は、少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得るように構成される。
【0075】
選択可能に、図6bは、本開示の実施例の分子セット生成方法を実現するための第2の分子セット生成装置の概略構成図を示し、図6bに示すように、サブセット取得ユニット601は、セット選別サブユニット611及びサブセット選別サブユニット621を備え、サブセット取得ユニット601は、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得するように構成され、セット選別サブユニット611は、遺伝的アルゴリズムを利用して初期化分子セットを選別し、第2の初期化分子サブセットを得るように構成され、サブセット選別サブユニット621は、事前選別モデルによって第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別し、第1の初期化分子サブセットを得るように構成される。
【0076】
選択可能に、サブセット選別サブユニット621は、事前選別モデルによって第2の初期化分子サブセットにおける少なくとも1つの初期化分子を選別し、第1の初期化分子サブセットを得るように構成され、具体的には、事前選別モデルに対応する選択策略を取得し、選択策略は分子スコア及び空間的多様性条件を含み、第2の初期化分子サブセットにおける選択策略を満たす少なくとも1つの初期化分子を取得し、第1の初期化分子サブセットを得るように構成される。
【0077】
選択可能に、図6cは、本開示の実施例の分子セット生成方法を実現するための第3の分子セット生成装置の概略構成図を示し、図6cに示すように、セット取得ユニット604は、サブセット再取得サブユニット614及びステップ停止サブユニット624を備え、セット取得ユニット604は、少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得るように構成され、サブセット再取得サブユニット614は、第3の初期化分子サブセットを再取得し、第3の初期化分子サブセットを第1の初期化分子サブセットとし、選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得するステップを再実行するように構成され、ステップ停止サブユニット624は、選別された分子セットにおける各分子の対応する生化学実験評価値の変化量が変化量閾値未満である場合、第3の初期化分子サブセットを取得するステップの実行を停止するように構成される。
【0078】
選択可能に、図6dは、本開示の実施例の分子セット生成方法を実現するための第4の分子セット生成装置の概略構成図を示し、図6dに示すように、分子セット生成装置600は、シード取得ユニット605及びセット生成ユニット606をさらに備え、事前選別モデルによって初期化分子セットにおける初期化分子サブセットを取得するように構成され、シード取得ユニット605は、ニューラルネットワークモデルによってサンプリングして少なくとも1つの初期化シードを取得するように構成され、セット生成ユニット606は、生成モデルによって少なくとも1つの初期化シードに対応する初期化分子セットを取得するように構成される。
【0079】
選択可能に、シード取得ユニット605は、ニューラルネットワークモデルによってサンプリングして少なくとも1つの初期化シードを取得するように構成され、具体的には、ニューラルネットワークモデルを利用して初期化されたモデル潜在空間からサンプリングして少なくとも1つの初期化シードを得て、または、ニューラルネットワークモデルを利用して生成された空間からサンプリングして少なくとも1つの初期化シードを得るように構成される。
【0080】
選択可能に、図6eは、本開示の実施例の分子セット生成方法を実現するための第5の分子セット生成装置の概略構成図を示し、図6eに示すように、分子セット生成装置600は、少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得た後に、目標分子セットにおける少なくとも1つの目標分子に対応する属性情報及び検証情報を取得し、少なくとも1つの目標分子に対応する属性情報及び検証情報に基づいて事前選別モデルをトレーニングし、トレーニングされた事前選別モデルを得るように構成されるモデルトレーニングユニット607をさらに備える。
【0081】
なお、上記実施例に係る分子セット生成装置が分子セット生成方法を実行する場合、上記各機能モジュールの分割のみを例に説明したが、実際の応用では、上記機能の割り当ては、必要に応じて異なる機能モジュールによって行われてもよく、すなわち、機器の内部構造は、上記機能の全部又は一部を達成するために、異なる機能モジュールに分割される。また、上記実施例に係る分子セット生成装置は、分子セット生成方法の実施例と同一の発想に属するものであり、その実現過程は方法の実施例を参照し、ここでは詳しく説明しない。
【0082】
上記本開示の実施例の番号は、単に説明のためのものであり、実施例の優劣を示すものではない。
【0083】
本開示の1つ又は複数の実施例において、サブセット取得ユニットは、事前選別モデルによって初期化分子セットにおける第1の初期化分子サブセットを取得することができ、分子選別ユニットは、第1の初期化分子サブセットにおける少なくとも1つの初期化分子の物理的情報を取得し、物理的情報に基づいて、少なくとも1つの初期化分子を選別し、選別された分子セットを得ることができ、評価値取得ユニットは、選別された分子セットにおける少なくとも1つの分子の生化学実験評価値を取得することができ、セット取得ユニットは、少なくとも1つの分子の生化学実験評価値に基づいて目標分子セットを得ることができる。したがって、分子の物理的情報及び生化学実験評価値を計算することにより目標分子セットを取得することができ、計算の回数を減らし、分子セット生成の効率を向上させ、資源コストの消費を低減し、実用性を向上させ、ひいてはユーザの使用体験を向上させることができる。
【0084】
本開示の技術案において、係るユーザ個人情報の取得、記憶及び適用などは、いずれも関連法律法規の規定に適合し、公序良俗に反しない。
【0085】
本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体及びコンピュータプログラムをさらに提供する。
【0086】
図7は、本開示の実施例を実施するための例示的な電子機器700の概略ブロック図を示す。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセッサ、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本開示の実現を制限するものではない。
【0087】
図7に示すように、機器700は、リードオンリーメモリ(ROM)702に記憶されているコンピュータプログラム、又は記憶ユニット708からランダムアクセスメモリ(RAM)703にロッドされたコンピュータプログラムに基づいて、様々な適切な動作及び処理を実行することができる計算ユニット701を備える。RAM703には、機器700の動作に必要な様々なプログラム及びデータが記憶されていてもよい。計算ユニット701、ROM702及びRAM703は、バス704を介して互いに接続されている。入出力(I/O)インタフェース705もバス704に接続されている。
【0088】
機器700における、キーボード、マウスなどの入力ユニット706と、様々なタイプのディスプレイ、スピーカなどの出力ユニット707と、磁気ディスク、光ディスクなどの記憶ユニット708と、ネットワークカード、モデム、無線通信トランシーバなどの通信ユニット709と、を備える複数のコンポーネントは、入出力(I/O)インタフェース705に接続されている。通信ユニット709は、機器700がインターネットなどのコンピュータネットワーク及び/又は様々な電気通信ネットワークを介して他のデバイスと情報/データを交換することを可能にする。
【0089】
計算ユニット701は、各種の処理及び計算能力を有する汎用及び/又は専用処理コンポーネントであってもよい。計算ユニット701のいくつかの例は、セントラルプロセッシングユニット(CPU)、グラフィックスプロセッシングユニット(GPU)、各種の専用人工知能(AI)計算チップ、各種の機械学習モデルアルゴリズムを運行する計算ユニット、デジタルシグナルプロセッサ(DSP)、及びいずれかの適宜なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット701は、上述したそれぞれの方法及び処理、例えば、分子セット生成方法を実行する。例えば、いくつかの実施例で、分子セット生成方法は、記憶ユニット708のような機械読み取り可能な媒体に具体的に含まれるコンピュータソフトウェアプログラムとして実装されてもよい。いくつかの実施例で、コンピュータプログラムの一部又は全部は、ROM702及び/又は通信ユニット709を介して機器700にロッド及び/又はインストールすることができる。コンピュータプログラムがRAM703にロッドされて計算ユニット701によって実行された場合、上述した分子セット生成方法の1つ又は複数のステップを実行することができる。または、他の実施例で、計算ユニット701は、他の任意の適切な形態で(例えば、ファーとウェアにより)分子セット生成方法を実行するように構成されてもよい。
【0090】
本明細書で上述したシステム及び技術の各種の実施方式は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、コンプレックス・プログラマブル・ロジック・デバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア及び/又はそれらの組合せにおいて実現してもよい。これらの各種の実施方式は、少なくとも1つのプログラマブルプロセッサを備えるプログラマブルシステムにおいて実行及び/又は解釈することができる1つ又は複数のコンピュータプログラムにおいて実現されてもよく、当該プログラマブルプロセッサは、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、当該記憶システム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置にデータ及び命令を伝送することができる専用及び/又は汎用プログラマブルプロセッサであってもよい。
【0091】
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせで書くことができる。これらのプログラムコードは、プロセッサ又はコントローラによって実行された際に、フローチャート及び/又はブロック図に規定された機能/動作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよい。プログラムコードは、完全に機械上で実行され、部分的に機械上で実行され、スタンドアロンパッケージとし、部分的に機械上で実行され、かつ部分的にリモート機械上で実行され、又は完全にリモート機械又はサーバ上で実行されてもよい。
【0092】
本開示の文脈では、機械読み取り可能な媒体は、命令実行システム、装置、又はデバイスによって使用されるために、又は命令実行システム、装置、又はデバイスと組み合わせて使用するためのプログラムを含むか、又は格納することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体システム、装置又はデバイス、又はこれらの任意の適切な組み合わせを含むことができるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、1つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROM)又はフラッシュメモリ、光ファイバ、ポータブルコンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶装置、磁気記憶装置、又はこれらの任意の適切な組み合わせを含む。
【0093】
ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
【0094】
ここで説明されるシステム及び技術は、バックエンドユニットを備えるコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアユニットを備えるコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンドユニットを備えるコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする)、又はこのようなバックエンドユニットと、ミドルウェアユニットと、フロントエンドユニットの任意の組み合わせを備えるコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットと、ブロックチェーンネットワークとを含む。
【0095】
コンピュータシステムは、クライアントとサーバとを備えることができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、且つ互いにクライアント-サーバ関係を有するコンピュータプログラムによって、クライアントとサーバとの関係が生成される。サーバは、クラウドコンピューティングサーバ又はクラウドホストとも呼ばれるクラウドサーバであってもよく、従来の物理ホスト及びVPSサービス(「Virtual Private Server」、又は「VPS」と略称する)における、管理難度が大きく、ビジネスの拡張性が低いという欠点を解決するクラウドコンピューティングサービスシステムのホスト製品の1つである。サーバは、分散システムのサーバであってもよいし、ブロックチェーンを組み合わせたサーバであってもよい。
【0096】
なお、上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができる。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案が所望の結果を実現することができれば、本明細書では限定しない。
【0097】
上記の具体的な実施形態は、本開示の保護範囲を制限するものではない。当業者は、設計要件と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。本開示の精神と原則内で行われる任意の修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。
図1
図2
図3
図4
図5
図6a
図6b
図6c
図6d
図6e
図7