特許7430406 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ　ボード　オブ　トラスティーズ　オブ　ザ　レランド　スタンフォード　ジュニア　ユニバーシティーの特許一覧

特許7430406深層特徴抽出を用いた能動的転移学習のためのシステムおよび方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-02-02

(45)【発行日】2024-02-13

(54)【発明の名称】深層特徴抽出を用いた能動的転移学習のためのシステムおよび方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20240205BHJP

G06N 3/08 20230101ALI20240205BHJP

【ＦＩ】

G06N20/00

G06N3/08

【請求項の数】 24

(21)【出願番号】P 2021521821

(86)(22)【出願日】2019-10-22

(65)【公表番号】

(43)【公表日】2022-01-14

(86)【国際出願番号】 US2019057468

(87)【国際公開番号】W WO2020086604

(87)【国際公開日】2020-04-30

【審査請求日】2022-02-22

(31)【優先権主張番号】62/749,653

(32)【優先日】2018-10-23

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】503115205

【氏名又は名称】ザボードオブトラスティーズオブザレランドスタンフォードジュニアユニバーシティー

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(72)【発明者】

【氏名】フェインバーグ，エバンエヌ．

(72)【発明者】

【氏名】パンデ，ビジャイエス．

【審査官】円子英紀

(56)【参考文献】

【文献】特開２０１７－０９７８０７（ＪＰ，Ａ）

【文献】特開２０１６－０６２５４４（ＪＰ，Ａ）

【文献】国際公開第２０１８／０７９０２０（ＷＯ，Ａ１）

【文献】特開２００９－０５７３３７（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１８／０２０４１１１（ＵＳ，Ａ１）

【文献】特開２０１６－１９１９６６（ＪＰ，Ａ）

【文献】中山英樹，深層畳み込みニューラルネットによる画像特徴抽出と転移学習，電子情報通信学会技術研究報告，日本，一般社団法人電子情報通信学会，2015年07月09日，第115巻, 第146号，第55頁-第59頁，ISSN:0913-5685

【文献】小川恭子, ほか３名，機械学習およびニューラルネットワークによる競馬予測，電気学会研究会資料情報システム研究会ＩＳ－１８－００１～０１５・０１７～０２０，日本，一般社団法人電気学会，2018年03月22日，第57頁-第60頁

【文献】桃田侑典、猪口明博，人工化合物を用いたディープラーニングによる変異原性の予測，第１１４回知識ベースシステム研究会資料（ＳＩＧ－ＫＢＳ－Ｂ８０１），日本，一般社団法人人工知能学会，2018年08月10日，第7頁-第13頁

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

Ｇ０６Ｆ１８／００－１８／４０

(57)【特許請求の範囲】

【請求項1】

創薬のためのコンピュータ実装方法であって、
分子の１つ以上のデータセットを収集することであって、分子の各データセットは、複数の分子を特徴付け、各分子について、前記分子の１つ以上の分子性質を特徴付ける、ことと、
前記分子の１つ以上のデータセットを使用して複数の分子予測タスクを実施するように深層特徴抽出器ニューラルネットワークを訓練することと、
前記深層特徴抽出器ニューラルネットワークを使用して分子予測タスクを実施するように機械学習モデルを訓練することであって、前記機械学習モデルを訓練することは、前記分子の１つ以上のデータセットからの複数の分子の各々について、
前記深層特徴抽出器ニューラルネットワークの中間出力を生成するために、前記深層特徴抽出器ニューラルネットワークを使用して、前記分子を特徴付けるデータを処理することと、
前記分子の予測された性質を特徴付ける出力を生成するために、前記分子のために前記深層特徴抽出器ニューラルネットワークによって生成された前記中間出力を処理するように前記機械学習モデルを訓練することと
を含む、ことと、
前記訓練された機械学習モデルを使用して、薬物候補を識別することと
を含む、方法。

【請求項2】

前記深層特徴抽出器ニューラルネットワークの加重をフリーズさせることをさらに含む、請求項１に記載の方法。

【請求項3】

前記深層特徴抽出器ニューラルネットワークを訓練することは、１つ以上のエポックに関して前記深層特徴抽出器ニューラルネットワークを訓練することを含む、請求項１に記載の方法。

【請求項4】

各エポックは、前記深層特徴抽出器ニューラルネットワークを１つ以上のデータセット上で訓練することを含む、請求項３に記載の方法。

【請求項5】

分子の各データセットは、前記分子のデータセット内に含まれる分子の異なる分子性質を特徴付ける、請求項１に記載の方法。

【請求項6】

前記機械学習モデルを検証することをさらに含む、請求項１に記載の方法。

【請求項7】

前記機械学習モデルを検証することは、前記機械学習モデルに関するアウトオブバッグスコアを算出することを含む、請求項６に記載の方法。

【請求項8】

前記機械学習モデルを検証することは、
（ａ）前記深層特徴抽出器ニューラルネットワークを訓練データセット上で訓練することと、
（ｂ）前記機械学習モデルを前記訓練データセット上で訓練することと、
（ｃ）検証データセットに基づいて、前記機械学習モデルに関する検証スコアを算出することと
を含む、請求項６に記載の方法。

【請求項9】

前記深層特徴抽出器ニューラルネットワークは、マスタモデルおよび複数の二次モデルを備え、
前記分子の１つ以上のデータセットからの前記複数の分子の各々について、前記深層特徴抽出器ニューラルネットワークの前記中間出力を生成するために、前記深層特徴抽出器ニューラルネットワークを使用して、前記分子を特徴付ける前記データを処理することは、
前記深層特徴抽出器ニューラルネットワークに含まれる前記マスタモデルの１つ以上の層の出力として前記深層特徴抽出器ニューラルネットワークの前記中間出力を生成すること
を含む、請求項１に記載の方法。

【請求項10】

前記機械学習モデルは、ランダムフォレストモデル、サポートベクトルマシンモデル、ＸＧＢｏｏｓｔモデル、線形回帰モデル、最近傍法モデル、単純ベイズモデル、決定木モデル、ニューラルネットワークモデル、またはｋ－平均クラスタリングモデルのうちの少なくとも１つを備える、請求項１に記載の方法。

【請求項11】

前記訓練された機械学習モデルを使用して、前記薬物候補を識別することは、前記深層特徴抽出器ニューラルネットワークのマスタモデルおよび前記機械学習モデルを合成モデルとして合成し、新しい入力のセットを分類することを含む、請求項１に記載の方法。

【請求項12】

前記分子の１つ以上のデータセットを前処理することをさらに含む、請求項１に記載の方法。

【請求項13】

前記１つ以上のデータセットを前処理することはさらに、フォーマッティング、クリーニング、サンプリング、スケーリング、分解、データフォーマットの変換、または集約のうちの少なくとも１つを含む、請求項１２に記載の方法。

【請求項14】

前記訓練された機械学習モデルを使用して、前記薬物候補を識別することは、前記訓練された機械学習モデルを使用して前記薬物候補の性質を予測することを含む、請求項１に記載の方法。

【請求項15】

前記薬物候補の前記性質は、吸収率、分布率、代謝率、消失率、毒性、可溶性、代謝安定性、インビボエンドポイント、エクスビボエンドポイント、分子量、効能、親油性、水素結合、浸透性、選択性、ｐＫａ、クリアランス、半減期、分布容積、血漿濃度、および安定性から成る群から選択される少なくとも１つを備える、請求項１４に記載の方法。

【請求項16】

前記分子の１つ以上のデータセットは、リガンド分子および／または標的分子を含む、請求項１に記載の方法。

【請求項17】

前記標的分子は、タンパク質である、請求項１６に記載の方法。

【請求項18】

前記機械学習モデルは、非微分可能モデルである、請求項１に記載の方法。

【請求項19】

前記機械学習モデルは、ニューラルネットワークではない、請求項１に記載の方法。

【請求項20】

前記機械学習モデルは、ランダムフォレストモデルを含む、請求項１に記載の方法。

【請求項21】

前記機械学習モデルは、アンサンブルモデルを含む、請求項１に記載の方法。

【請求項22】

前記機械学習モデルは、前記深層特徴抽出器ニューラルネットワークと勾配情報を共有しない、請求項１に記載の方法。

【請求項23】

１つ以上のコンピュータと、
前記１つ以上のコンピュータに通信可能に結合された１つ以上の記憶デバイスと
を備え、前記１つ以上の記憶デバイスは、命令を記憶し、前記命令は、前記１つ以上のコンピュータによって実行されると、請求項１～２２のいずれか一項に記載のそれぞれの方法の動作を前記１つ以上のコンピュータに実施させる、システム。

【請求項24】

命令を記憶する１つ以上の非一過性コンピュータ記憶媒体であって、前記命令は、１つ以上のコンピュータによって実行されると、請求項１～２２のいずれか一項に記載のそれぞれの方法の動作を前記１つ以上のコンピュータに実施させる、１つ以上の非一過性コンピュータ記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

（関連出願の相互参照）
本願は、「ＳｙｓｔｅｍｓａｎｄＭｅｔｈｏｄｓｆｏｒＡｃｔｉｖｅＴｒａｎｓｆｅｒＬｅａｒｎｉｎｇｗｉｔｈＤｅｅｐＦｅａｔｕｒｉｚａｔｉｏｎ」と題され、２０１８年１０月２３日に出願された、米国仮特許出願第６２／７４９，６５３号の利益および優先権を主張する。米国仮特許出願第６２／７４９，６５３号の開示は、参照することによってその全体として本明細書に組み込まれる。

【0002】

本発明は、概して、機械学習モデルのための学習に関し、より具体的には、深層特徴抽出を用いた能動的転移学習に関する。

【背景技術】

【0003】

教師あり機械学習（ＭＬ）は、入力サンプルを表す入力特徴をグラウンドトゥルース出力ラベルにマッピングするための一連の機能形態および最適化スキームの総称である。深層ニューラルネットワーク（ＤＮＮ）は、中間ニューラルネットワーク層内の目前の予測タスクに関連する特徴を学習することによる、前世代のＭＬ方法よりも多くの点で優れている、機能形態のセットを示す。

【0004】

深層ニューラルネットワークは、特徴エンジニアリングの代わりに、特徴学習を採用することによって、その前世代のものよりも多くの点で優れている。従来的教師あり機械学習（ＭＬ）技法は、固定された、多くの場合、手作業で作られる、特徴を出力ラベルにマッピングする、モデルを訓練する。対照的に、深層ニューラルネットワークは、多くの場合、入力として、入力のより基本的特徴抽出、すなわち、画像に関するピクセルのグリッド、自然言語に関するワンホットエンコーディングワードをとり、ニューラルネットワークの中間層内の目前のタスクに最も直接的に関連する特徴を「学習」する。ニューラルネットワークを訓練するための効率的手段は、特に、異なる分野および用途を横断して識別することが困難であり得る。

【発明の概要】

【課題を解決するための手段】

【0005】

本発明の実施形態による、能動的転移学習のためのシステムおよび方法が、図示される。一実施形態は、深層特徴抽出器を訓練するための方法を含む。本方法は、マスタモデルおよび１つ以上の二次モデルのセットを訓練するステップであって、マスタモデルは、１つ以上の層のセットを含む、ステップと、マスタモデルの加重をフリーズさせるステップと、マスタモデルから１つ以上の出力のセットを生成するステップと、１つ以上の直交モデルのセットを出力の生成されたセット上で訓練するステップとを含む。

【0006】

さらなる実施形態では、マスタモデルを訓練するステップは、いくつかのエポックに関するマスタモデルを訓練するステップを含む。

【0007】

さらに別の実施形態では、各エポックは、マスタモデルおよび二次モデルのセットをいくつかのデータセット上で訓練するステップを含む。

【0008】

なおもさらなる実施形態では、１つ以上の出力のセットを生成するステップは、マスタモデルを通して、いくつかのデータセットを伝搬させるステップを含む。

【0009】

さらに別の実施形態では、いくつかのデータセットの各データセットは、データセットの入力の異なる特性のためのラベルを有する。

【0010】

なおもさらなる実施形態では、本方法はさらに、マスタモデルおよび直交モデルのセットを検証するステップを含む。

【0011】

別の付加的実施形態では、直交モデルのセットを検証するステップは、直交モデルのセットに関するアウトオブバッグスコアを算出するステップを含む。

【0012】

さらなる付加的実施形態では、直交モデルのセットを検証するステップは、マスタモデルを、訓練データセットおよび検証データセットを含む、マスタデータセット上で訓練するステップと、直交モデルのセットを訓練データセット上で訓練するステップと、検証データセットに基づいて、直交モデルに関する検証スコアを算出するステップとを含む。

【0013】

再び、別の実施形態では、出力の生成されたセットは、マスタモデルの層である。

【0014】

再び、さらなる実施形態では、直交モデルのセットは、ランダムフォレストおよびサポートベクトルマシンのうちの少なくとも１つを含む。

【0015】

なおもさらに別の実施形態では、マスタモデルを訓練するステップは、複数のエポックに関してマスタモデルを訓練するステップを含み、本方法はさらに、特定の直交モデル毎に、マスタモデルおよび特定の直交モデルを検証することによって、複数のエポックの最適エポックを識別するステップを含む。本方法はさらに、最適エポックにおけるマスタモデルおよび特定の直交モデルを合成モデルとして合成し、新しい入力のセットを分類するステップを含む。

【0016】

なおも別のさらなる実施形態では、二次モデルのセットの少なくとも１つの二次モデルは、１つ以上の層のセットを含む、ニューラルネットワークである。

【0017】

一実施形態は、深層特徴抽出器を訓練するためのプロセッサ命令を含有する、非一過性機械可読媒体を含み、プロセッサによる命令の実行は、プロセッサに、マスタモデルおよび１つ以上の二次モデルのセットを訓練するステップであって、マスタモデルは、１つ以上の層のセットを含む、ステップと、マスタモデルの加重をフリーズさせるステップと、マスタモデルから１つ以上の出力のセットを生成するステップと、１つ以上の直交モデルのセットを出力の生成されたセット上で訓練するステップとを含む、プロセスを実施させる。

【0018】

一実施形態は、１つ以上の分子の１つ以上のデータセットを収集するステップと、深層特徴抽出器を訓練するステップであって、深層特徴抽出器を訓練するステップは、マスタモデルおよび１つ以上の二次モデルのセットを訓練するステップであって、マスタモデルは、１つ以上の層のセットを含む、ステップと、マスタモデルから１つ以上の出力のセットを作成するステップと、１つ以上の直交モデルのセットを生成された１つ以上の出力のセット上で訓練するステップとを含む、ステップと、訓練されたマスタモデルまたは訓練された直交モデルを使用して、薬物候補を識別するステップとを含む、創薬のためのコンピュータ実装方法を含む。

【0019】

なおもさらなる実施形態では、１つ以上の出力のセットを作成するステップに先立って、本方法は、マスタモデルの加重をフリーズさせるステップを含む。

【0020】

別の付加的実施形態では、直交モデルのセットは、ランダムフォレスト、サポートベクトルマシン、ＸＧＢｏｏｓｔ、線形回帰、最近傍法、単純ベイズ、決定木、ニューラルネットワーク、およびｋ－平均クラスタリングのうちの少なくとも１つを含む。

【0021】

さらなる付加的実施形態では、本方法はさらに、マスタモデルおよび直交モデルのセットを合成モデルとして合成し、新しい入力のセットを分類するステップを含む。

【0022】

再び、別の実施形態では、本方法はさらに、深層特徴抽出器を訓練するステップに先立って、１つ以上の分子の１つ以上のデータセットを前処理するステップを含む。

【0023】

再び、さらなる実施形態では、１つ以上のデータセットを前処理するステップはさらに、以下、すなわち、フォーマッティング、クリーニング、サンプリング、スケーリング、分解、データフォーマットの変換、または集約のうちの少なくとも１つを含む。

【0024】

なおもさらに別の実施形態では、訓練されたマスタモデルまたは訓練された直交モデルは、薬物候補の性質を予測する。

【0025】

なおも別のさらなる実施形態では、薬物候補の性質は、吸収率、分布率、代謝率、消失率、毒性、可溶性、代謝安定性、インビボエンドポイント、エクスビボエンドポイント、分子量、効能、親油性、水素結合、浸透性、選択性、ｐＫａ、クリアランス、半減期、分布容積、血漿濃度、および安定性から成る群のうちの少なくとも１つを含む。

【0026】

さらに別の付加的実施形態では、１つ以上の分子は、リガンド分子および／または標的分子である。

【0027】

なおもさらに付加的実施形態では、標的分子は、タンパク質である。

【0028】

再び、さらに別の実施形態では、本方法はさらに、１つ以上のデータセットを前処理するステップを含む。

【0029】

再び、なおもさらなる実施形態では、１つ以上のデータセットを前処理するステップはさらに、以下、すなわち、フォーマッティング、クリーニング、サンプリング、スケーリング、分解、データフォーマットの変換、または集約のうちの少なくとも１つを含む。

【0030】

さらに別の付加的実施形態では、本方法はさらに、薬物候補を識別するステップに先立って、深層特徴抽出器から１つ以上の出力の特徴セットを作成するステップを含む。

【0031】

なおもさらに付加的実施形態では、本方法はさらに、訓練されたマスタモデルまたは訓練された直交モデルを特徴セット上で使用して、薬物候補を識別するステップを含む。

【0032】

一実施形態は、個々または集合的に、１つ以上の分子の１つ以上のデータセットを収集するように構成される、１つ以上のプロセッサを備える、創薬のためのシステムを含む。プロセッサは、マスタモデルおよび１つ以上の二次モデルのセットを訓練するステップと、マスタモデルから１つ以上の出力のセットを作成するステップと、１つ以上の直交モデルのセットを生成された１つ以上の出力のセット上で訓練するステップとによって、深層特徴抽出器を訓練するように構成される。マスタモデルは、１つ以上の層のセットを含む。プロセッサはさらに、薬物候補を識別するように構成され、１つ以上のプロセッサは、個々または集合的に、訓練されたマスタモデルまたは訓練された直交モデルを使用するように構成される。

【0033】

別の実施形態では、マスタモデルから１つ以上の出力のセットを作成することに先立って、１つ以上のプロセッサはさらに、マスタモデルの加重をフリーズさせるように構成される。

【0034】

さらに別の実施形態では、１つ以上のプロセッサは、個々または集合的に、１つ以上のエポックに関してマスタモデルを訓練するように構成される。

【0035】

再び、さらに別の実施形態では、エポック毎に、マスタモデルを訓練することは、マスタモデルおよび二次モデルのセットを１つ以上のデータセット上で訓練することを含む。

【0036】

再び、なおもさらなる実施形態では、１つ以上の出力のセットを作成することは、マスタモデルを通して、１つ以上のデータセットを伝搬させることを含む。

【0037】

再び、別の付加的実施形態では、１つ以上のデータセットの各データセットは、データセットの入力の異なる特性のためのラベルを有する。

【0038】

再び、さらなる付加的実施形態では、１つ以上のプロセッサはさらに、マスタモデルおよび直交モデルのセットを検証するように構成される。

【0039】

なおもさらに別の付加的実施形態では、直交モデルのセットを検証することは、直交モデルのセットに関するアウトオブバッグスコアを算出することを含む。

【0040】

さらなる実施形態では、直交モデルのセットを検証することは、マスタモデルを、訓練データセットおよび検証データセットを含む、マスタデータセット上で訓練することと、直交モデルのセットを訓練データセット上で訓練することと、検証データセットに基づいて、直交モデルに関する検証スコアを算出することとを含む。

【0041】

なおもさらなる実施形態では、直交モデルのセットは、ランダムフォレスト、サポートベクトルマシン、ＸＧＢｏｏｓｔ、線形回帰、最近傍法、単純なベイズ、決定木、ニューラルネットワーク、およびｋ－平均クラスタリングのうちの少なくとも１つを含む。

【0042】

さらに別の実施形態では、１つ以上のプロセッサはさらに、マスタモデルおよび直交モデルのセットを合成モデルとして合成し、新しい入力のセットを分類するように構成される。

【0043】

なおもさらなる実施形態では、深層特徴抽出器を訓練することに先立って、１つ以上のプロセッサはさらに、１つ以上の分子の１つ以上のデータセットを前処理するように構成される。

【0044】

別の付加的実施形態では、１つ以上のデータセットを前処理することはさらに、以下、すなわち、フォーマッティング、クリーニング、サンプリング、スケーリング、分解、データフォーマットの変換、または集約のうちの少なくとも１つを含む。

【0045】

さらなる付加的実施形態では、訓練されたマスタモデルまたは訓練された直交モデルは、薬物候補の性質を予測するように構成される。

【0046】

再び、別の実施形態では、薬物候補の性質は、吸収率、分布率、代謝率、消失率、毒性、可溶性、代謝安定性、インビボエンドポイント、エクスビボエンドポイント、分子量、効能、親油性、水素結合、浸透性、選択性、ｐＫａ、クリアランス、半減期、分布容積、血漿濃度、および安定性から成る群のうちの少なくとも１つを含む。

【0047】

なおも別のさらなる実施形態では、１つ以上のプロセッサはさらに、１つ以上のデータセットを前処理するように構成される。

【0048】

さらに別の付加的実施形態では、個々または集合的に、１つ以上のデータセットを前処理するように構成される、１つ以上のプロセッサはさらに、以下、すなわち、フォーマッティング、クリーニング、サンプリング、スケーリング、分解、データフォーマットの変換、または集約のうちの少なくとも１つを含む。

【0049】

なおもさらに付加的実施形態では、薬物候補を識別することに先立って、１つ以上のプロセッサはさらに、深層特徴抽出器から１つ以上の出力の特徴セットを作成するように構成される。

【0050】

さらに別の実施形態では再び、１つ以上のプロセッサはさらに、訓練されたマスタモデルまたは訓練された直交モデルを特徴セット上で使用し、薬物候補を識別するように構成される。

【0051】

付加的実施形態および特徴が、部分的に、続く説明に記載され、部分的に、本明細書の精査に応じて当業者に明白となるであろう、または本発明の実践によって習得され得る。本発明の本質および利点のさらなる理解は、本開示の一部を形成する、明細書の残りの部分および図面を参照することによって実現され得る。

【図面の簡単な説明】

【0052】

説明および請求項は、本発明の例示的実施形態として提示され、本発明の範囲の完全列挙として解釈されるべきではない、以下の図およびデータグラフを参照して、より完全に理解されるであろう。

【0053】

【図1】図１は、深層特徴抽出を用いた能動的転移学習のための方法の実施例を図示する。

【0054】

【図2】図２および３は、本発明の実施形態による、能動的転移学習プロセスを図示する。

【図3】図２および３は、本発明の実施形態による、能動的転移学習プロセスを図示する。

【0055】

【図4】図４は、本発明のいくつかの実施形態による、機械学習モデルを訓練する、システムを図示する。

【0056】

【図5】図５は、マスタおよび／または直交モデルを訓練するプロセスを実施するための命令を実行する、モデル訓練要素の実施例を図示する。

【0057】

【図6】図６は、本発明のある実施形態による、訓練タスクを提供するための訓練アプリケーションの実施例を図示する。

【発明を実施するための形態】

【0058】

ここで図面に目を向けると、深層特徴抽出器を訓練するためのシステムおよび方法が、下記に説明される。ある実施形態では、深層特徴抽出器は、（限定ではないが）畳み込みニューラルネットワークおよびグラフ畳み込みネットワーク等のニューラルネットワークであって、これは、入力から特徴を識別するために使用され得る。深層特徴抽出器（またはマスタモデル）は、所与の入力に関するラベルを予測し、深層特徴抽出器を訓練し（例えば、逆伝搬を通して）、所与のラベルに関する特徴を識別するために、分類器（または二次モデル）を用いて訓練されることができる。本発明の種々の実施形態による、深層特徴抽出器は、単一深層特徴抽出器を訓練し、入力のための異なるラベルを識別するためにより一般的に有用な特徴を識別するために、複数の異なるラベルと関連付けられる、複数の異なるデータセットを用いて訓練されることができる。多くの実施形態では、深層特徴抽出器はさらに、深層特徴抽出器および／または分類器の中間出力（例えば、最後から２番目の全結合層）に照準を当てる、直交モデルを用いて訓練される。本発明のいくつかの実施形態による、直交モデルは、マスタモデルと勾配情報を共有せず、（限定ではないが）ランダムフォレストおよびサポートベクトルマシン等の微分不可能および／またはアンサンブルモデルを含むことができる。いくつかの実施形態では、直交モデルは、入力を分類し、かつ深層特徴抽出器の性能を検証するために使用されることができる。深層特徴抽出器、分類器、および直交モデルのそのようなシステムは、任意の特定のデータセットへの過剰適合を回避しながら、モデルの効率的訓練を可能にすることができる。加えて、本発明の多くの実施形態による、そのような様式における訓練は、可変重複度を有し得る、１つ以上のデータセットを使用して、モデルの効率的かつ効果的訓練を可能にすることができる。

【0059】

例えば、医薬開発では、化学者は、それぞれ、分子構造を少なくとも１つの着目化学性質にマッピングする、データセットへのアクセスを有する。例えば、化学者は、１０，０００種の化学物質および関連付けられる肝毒性転帰、１５，０００種の化学物質および関連付けられるＬｏｇＤ測定値、２５，０００種の化学物質および関連付けられる受動的膜浸透性測定値等のデータベースへのアクセスを有し得る。多くの場合、そのようなデータセット間には、可変重複度が存在する。本発明の種々の実施形態による、方法は、データセット毎の別個のモデルの個々の訓練の実施に優り得る、全ての着目タスクのためのより優れた深層学習モデルを構築するために、それに対してアクセスを有する、化学データの全てを活用することができる。化学性質予測の状況における技術的問題は、所与の特性のセットに関する利用可能な高品質の標識された訓練データの相対的不足から生じ得る。例えば、その受容体媒介毒性に関して標識された分子のＴｏｘ２１データセットは、わずか１０，０００種の標識された分子を含有する。本発明の多数の実施形態による、プロセスは、多くの場合、広範囲の重複割合が異なる性質データセット間に存在し得る、分子を異なる性質（例えば、ＬｏｇＤ、毒性、可溶性、膜浸透性、ある標的に対する効能等）にマッピングする、多くの異なるデータセットへのアクセスを有する、創薬および他の化学状況に適用されることができる。本発明の種々の実施形態による、分子（または薬物）候補性質は、物理化学、生化学、薬物動態学、および薬力学性質を含むことができる。本発明のいくつかの実施形態による、性質の実施例は、（限定ではないが）吸収率、分布率、代謝率、消失率、毒性、可溶性、代謝安定性、インビボエンドポイント、エクスビボエンドポイント、分子量、効能、親油性、水素結合、浸透性、選択性、ｐＫａ、クリアランス、半減期、分布容積、血漿濃度、および安定性を含むことができる。本明細書に説明される実施例の多くは、分子構造を参照して説明されるが、当業者は、説明される方法およびシステムが、本発明から逸脱することなく、種々の分野および用途に適用されることができることを認識するであろう。

【0060】

本発明の種々の実施形態による、システムおよび方法は、深層ニューラルネットワーク（ＤＮＮ）を微分可能特徴抽出器として取り扱う。多くの実施形態では、異なるアプローチが、ＤＮＮの中間層内に含有される豊富な情報を利用することによって、入力サンプルから出力ラベルへの正確なマッピングを学習するために提供される。多数の実施形態では、ランダムフォレスト等のより低次の分散学習器を中間層上で訓練することは、一連の後続全結合層と比較して、予測性能を改良することができる。本発明のいくつかの実施形態による、深層特徴抽出は、能動的転移学習と称される、新規技法を採用し、異なるデータセットまたはタスクからのラベルのより効率的予測を可能にする。異なるデータセットに基づいて、単一マスタモデルを訓練し、異なるタスク（または属性）を予測することによって、本発明のいくつかの実施形態による、方法は、関連性があって、より一般化可能な特徴を入力から識別し、データの任意の特定のクラスへの過剰適合を回避し得る、マスタモデルを生成することができる。複数の異なるタスク間でモデルを訓練するための他の方法は、転移学習およびマルチタスク学習を含む。多くの場合、転移学習は、新しいモデルを訓練するために使用されることができる。転移学習は、第１のタスクのために訓練されたモデルを異なる第２のタスクのためのモデルを訓練するための開始点として使用することを伴う。事前に訓練されたモデルは、新しいモデルの訓練における訓練時間およびリソースの観点から、非常に有利なスタートを提供することができる。加えて、事前訓練は、いったん訓練が所望のタスク上で完了されると、より良好な性能（すなわち、より正確な予測）につながり得る。転移学習は、多くの場合、モデルを１つのデータセット上で事前に訓練し、加重を別のモデルに転移し、別の着目データセット上でさらに訓練することを伴う。マルチタスク学習は、それに関する訓練データを有する、全ての性質に関する値を出力する、単一マスタニューラルネットワークの同時訓練を伴う。

【0061】

いくつかの実施形態では、厳密にエンドツーエンドの微分可能ニューラルネットワーク訓練の代わりに、能動的転移学習を展開することはまた、予測正確度における有意な利得につながり得る。ニューラルネットワークは、訓練データを過剰適合する傾向を有することが公知である。より良好な一般化性能、または訓練セット内のものと非常に異なる、分子の性質を予測するためのより高い正確度を達成するために、マスタモデル（例えば、一連のグラフ畳み込み層および全結合層等の一連の層を構成する、ニューラルネットワーク）を訓練し、訓練の１つ以上のエポックにおいて、訓練された層のうちの１つ以上のものの出力をとり、合成モデル（例えば、グラフ畳み込み層＋直交学習器（例えば、ランダムフォレストまたはＳＶＭ））を訓練することができる。本発明の種々の実施形態による、プロセスは、次いで、生産モデルとして、結果として生じる合成モデルを、分子のいくつかのホールドアウトされたセット上での性能が最も正確なエポックから選択された合成モデルのためのパラメータと併用することができる。結果として生じる合成モデルは、１つのタスクに関して１つのデータセット上でのみ訓練された場合でも、マスタモデルの性能を超え得る。

【0062】

本発明のいくつかの実施形態による、能動的転移学習は、それに対して他のタスク特有の学習器（または二次モデル）が接続される、単一「深層特徴抽出器」（またはマスタモデル）を伴う。本発明のある実施形態による、システムは、（限定ではないが）化学性質予測を含む、種々の異なる設定に容易に適用されることができる。化学性質予測では、多くの場合、可変サンプル重複度をデータセット間に伴う、異なる性質に対応する、多くの（時として、比較的に小）化学データセットへのアクセスを有する。本明細書に説明される実施例の多くは、化学性質予測に関連するが、当業者は、類似プロセスが、本発明の異なる実施形態による、種々の異なる分野に適用されることができることを認識するであろう。本発明のある実施形態による、深層特徴抽出を用いた能動的転移学習は、多くのタスク上での正確度を改良することができる。正確度における改良のためのいくつかの可能性として考えられる解説が、存在する。例えば、これは、少なくとも部分的に、統合訓練スキームによってもたらされる、分散低減、典型的には、深層ニューラルネットワークより少ない分散を有し、過剰適合を受けにくい、ランダムフォレスト等の直交モデルを展開することによってもたらされる、分散低減、異なるデータセット／予測タスク間の共通深層特徴抽出器マスタモデル内で加重を共有することが、次いで他のタスクのそれぞれから個々に利益を享受し得るものより豊富な特徴抽出が学習されることを意味することに起因し得る。

【0063】

本発明のいくつかの実施形態による、深層特徴抽出器は、データセットから特徴を識別するために使用されることができる。ある実施形態では、深層特徴抽出器は、（限定ではないが）畳み込みニューラルネットワーク、サポートベクトルマシン、ランダムフォレスト、アンサンブルネットワーク、再帰ニューラルネットワーク、およびグラフ畳み込みネットワークを含む、種々の異なるモデルを含むことができる。本発明のある実施形態による、グラフ畳み込みフレームワークは、分子をグラフとして取り扱い、結合部およびノードとしての原子間の縁としての空間および３Ｄ畳み込みニューラルネットワークに沿って情報を通過させる。グラフ畳み込みネットワークは、第ＵＳ２０１９－０２７２４６８号として公開され、「ＳｙｓｔｅｍｓａｎｄＭｅｔｈｏｄｓｆｏｒＳｐａｔｉａｌＧｒａｐｈＣｏｎｖｏｌｕｔｉｏｎｓｗｉｔｈＡｐｐｌｉｃａｔｉｏｎｓｔｏＤｒｕｇＤｉｓｃｏｖｅｒｙａｎｄＭｏｌｅｃｕｌａｒＳｉｍｕｌａｔｉｏｎ」と題され、２０１９年３月５日に出願された、米国特許出願第１６／２９３，５８６号（その内容は、その全体として参照することによって本明細書に組み込まれる）により詳細に説明される。本発明の多くの実施形態による、深層特徴は、所与の化学物質を種々の性質にマッピングするための機能を学習するための種々の異なる方法において利用されることができる。

【0064】

ロジスティック回帰の傑出と深層ニューラルネットワークの進歩との間の移行期には、多数の他の方法（例えば、ランダムフォレスト、ブースティング、およびサポートベクトルマシン）が、固定された入力特徴の所与の出力へのその概してより効率的マッピングに起因して、登場した。そのような方法は、ロジスティック回帰の性能より多くの点で優る。ランダムフォレストの成功は、例えば、部分的に、それぞれ、入力特徴および訓練データのランダムサブセット上で訓練される、決定木間の無相関の自己正則化および分散低減性質に起因して生じると考えられる。残念ながら、ランダムフォレスト、ブースティング、および類似方法は、微分可能深層ニューラルネットワーク内でエンドツーエンドで訓練されることができない。深層ニューラルネットワークは、一連の行列乗算および点毎非線形性から成る、持続的かつ微分可能な機能であるが、ランダムフォレストおよびブースティングは、ＤＮＮと同一方法において、確率的勾配降下法を用いて訓練されることができない。

【0065】

深層学習は、豊富な利用可能な訓練データが存在する領域において最も成功を収めている一方、ランダムフォレストのようなより低次の分散方法は、正しい特徴を提供されると、多くの場合、低データ体系では、ニューラルネットワークより優れている。本発明の種々の実施形態による、方法は、１つまたはいくつかのいずれかの小データセットが利用可能である設定のために、ＭＬモデルの性能を最適化する、両方のアプローチの側面を活用する。

【0066】

視覚および自然言語の領域と異なり、化学学習の分野は、利用可能な高品質の標識された訓練データの相対的不足に直面する。ＩｍａｇｅＮｅｔは、Ｏ（１０，０００，０００）枚の標識された画像を含有するが、その受容体媒介毒性に関して標識された分子のＴｏｘ２１データセットは、わずかＯ（１０，０００）種の標識された分子を含有する。

【0067】

マルチタスク学習は、深層ニューラルネットワークを多くのより小さいデータセット上でともに学習し、多くのシングルタスクネットワークを別個に訓練することよりも性能を改良するための１つの方法として導入されている。マルチタスクネットワークは、各入力サンプル（分子）を多くの（Ｋ）個の出力性質にマッピングする。マルチタスク学習は、同時に、全てのＫ個のタスクに関する予測を出力する、出力層からの勾配情報を入力層に伝搬する。

【0068】

転移学習は、マルチタスク学習の非同期相対物である。転移学習は、ニューラルネットワークを、それに関するより多くの訓練データが利用可能である、別個のタスク上で「事前に訓練」し、次いで、加重を初期設定としてのデータが乏しい着目タスクのための新しいニューラルネットワークに転移することを伴う。
深層特徴抽出に基づくアンサンブル方法

【0069】

本設定では、所与のタスクおよびそのタスクと関連付けられる標識されたデータセットに関して、本発明のある実施形態による、プロセスのためのステップは、特徴Ｘおよびラベルｙを取得するステップと、ニューラルネットワークＮＮを定義するステップとを含む。種々の実施形態では、プロセスは、ＸをｙにマッピングするためのＮＮのエンドツーエンド訓練のＴ個のエポックに関して、周期的に（例えば、Ｔ／Ｅエポック毎に）、エポックｔ（ＮＮ^（ｔ））におけるＮＮのパラメータをフリーズさせ、ネットワークを通して、Ｘを順方向伝搬させ、ＮＮ^（ｔ）から層ｈ^（ｔ）の出力（すなわち、ｈ^（ｔ）（Ｘ））を取得し、非エンドツーエンド微分可能学習器（例えば、ランダムフォレスト）を訓練し、層ｈ^（ｔ）の出力をｙにＲＦ^（ｔ）マッピングするであろう。プロセスは、次いで、単一エポックｔ、または、例えば、検証スコアが最良である、エポック｛ｅ｝のセットにおける、ＮＮ^（ｔ）（Ｘ）およびＲＦ（Ｘ）を返すことができる。

【0070】

本実施例では、プロセスは、直交学習器を訓練し、算出された特徴をラベルｙにマッピングするために、周期的に（すなわち、Ｔ／Ｅエポック毎に）、マスタモデルのパラメータをフリーズさせ、ネットワークを通して、入力のセットを伝搬させ、層ｈ^（ｔ）における入力に関する特徴を算出する。多数の実施形態では、直交モデルおよび／または深層特徴抽出器は、各Ｔ／Ｅエポックにおいて検証され、最適エポックにおける直交モデルおよび／または深層特徴抽出器が、直交モデルのための特徴を生成する深層特徴抽出器を用いて、合成モデルを構築するように選択される。

【0071】

本発明の実施形態による、能動的転移学習のための具体的プロセスが、上記に説明される。しかしながら、当業者は、任意の数のプロセスが、本発明の実施形態による、具体的用途の要件の必要に応じて利用されることができることを認識するであろう。
（訓練および有効データの両方を用いたニューラルネットワーク訓練）

【0072】

ランダムフォレストを含む、いくつかのアンサンブル方法は、木のそれぞれからホールドアウトされたデータ上でのモデル内のサブ決定木の一般化性能を監視することを可能にする、「アウトオブバッグ」スコアまたは均等物を有する。これは、過剰適合を回避するために、訓練または試験セットからの素集合である、ホールドアウトされた検証セットを必要とせず、最終モデルが全ての利用可能な訓練データ上で訓練されるという利点を与える。同一データセット上で検証しながら訓練するための類似プロシージャは、深層ニューラルネットワークの領域には存在しない。典型的には、ＤＮＮ訓練の状況では、素分解訓練、検証、および試験データサブセットが、定義され、勾配情報が、訓練セットから導出され、ニューラルネットワークの加重を最適化し、検証セット上での実施が、早期停止およびモデル選択のために使用される。

【0073】

種々の実施形態では、「アウトオブバッグ」誤差もまた、訓練および検証セットの連結上で検証しながら訓練することを可能にする、ニューラルネットワークのための早期停止基準として使用されることができる。本発明の種々の実施形態による、例示的プロセスは、特徴Ｘおよびラベルｙを取得し、ニューラルネットワークＮＮを定義することができる。いくつかの実施形態では、プロセスは、ＸをｙにマッピングするためのＮＮのエンドツーエンド訓練のＴ個のエポックに関して、周期的に（例えば、Ｔ／Ｅエポック毎に）、エポックｔ（ＮＮ^（ｔ））におけるＮＮのパラメータをフリーズさせ、ネットワークを通して、Ｘを順方向伝搬させ、便宜上、ＮＮ^（ｔ）から層ｈ^（ｔ）の出力を取得し、アンサンブル学習器（例えば、ランダムフォレスト）を訓練し、ｈ^（ｔ）をｙにＲＦ^（ｔ）マッピングし、エポックｔにおけるアウトオブバッグスコアを記録することができる。プロセスは、次いで、アウトオブバッグスコアが最良である、エポックｔにおけるＮＮ^（ｔ）およびＲＦ^（ｔ）を返すことができる。

【0074】

いくつかの実施形態では、訓練および検証セットとして典型的に描かれるものは両方とも、ニューラルネットワークの訓練および検証の両方のために使用されることができる。例えば、特徴Ｘおよびラベルｙに関して、本発明のいくつかの実施形態による、プロセスは、Ｔ個のエポックに関して、ともに連結された［Ｘ_{ｔｒａｉｎ}，Ｘ_{ｖａｌｉｄ}］および［ｙ_{ｔｒａｉｎ}，ｙ_{ｖａｌｉｄ}］のエンドツーエンド訓練を実施することができる。いくつかの実施形態では、プロセスは、周期的に、ＮＮのパラメータをフリーズさせ、アンサンブル学習器（例えば、ランダムフォレスト）を訓練データ上でのみ訓練し、Ｘ^{（ｔｒａｉｎ）}をｙ^{（ｔｒａｉｎ）}にマッピングすることができる。本発明のある実施形態による、プロセスは、Ｘ^{（ｖａｌｉｄ）}に関する予測を行い、

【化1】

を取得し、

【化2】

とｙ^{（ｖａｌｉｄ）}を比較することによって、検証スコアを算出することができる。
（深層特徴抽出を用いた能動的転移学習）

【0075】

転移学習は、ＤＮＮを（典型的には）大データセットを伴うタスク上で訓練し、結果として生じるパラメータを初期設定として新しいタスクおよび関連付けられる着目データセット上で訓練されることになる新しいＤＮＮに転移することを伴う。対照的に、マルチタスク学習は、全ての所望のタスクに関する予測を出力する、単一「マスタ」ネットワーク上での同時学習を伴う。転移学習は、殆どまたは全く重複が異なるデータセット／タスク内の訓練サンプル間に存在しないシナリオにおいても効果的であり得る。対照的に、マルチタスク学習は、実質的（理想的には、完全）重複が異なるデータセット／タスク内の訓練サンプル間に存在するシナリオに最良に適用される。データセット間に重複が殆ど存在しないとき、またはタスク間に相関が殆ど存在しないときのいずれかでは、マルチタスク学習は、実際には、ＤＮＮの性能を改良するのではなく、低減させ得る。一般に、大Ｎ×Ｋ行列（Ｎは、訓練サンプルの総数であり、Ｋは、タスクの数である）としての訓練ラベルｙを想定する場合、行列が疎らであるほど、または列の相関が少ないほど、減少された、またはある場合には、逆効果のマルチタスク効果につながる。

【0076】

創薬および他の化学状況では、多くの場合、異なる性質データセット間に広範囲の重複割合を伴う、分子を異なる性質（例えば、ＬｏｇＤ、毒性、可溶性、膜浸透性、ある標的に対する効能）にマッピングする、多くの異なるデータセットへのアクセスを有する。深層特徴抽出を用いた能動的転移学習は、そのような問題に対処することが示されている。能動的転移学習のためのプロシージャの実施例は、下記に提供される。

【0077】

本実施例では、本発明のいくつかの実施形態による、プロセスは、マスタ特徴抽出器ニューラルネットワークＮＮ^（ｆ）を定義することができる。プロセスは、次いで、全てのＫ個のタスク／データセット（または単一タスク／データセット）のタスクｋ毎に、サブニューラルネットワークＮＮ^（ｋ）を定義し、特徴Ｘ^（ｋ）およびラベルｙ^（ｋ）を取得することができる。次いで、Ｔ個のエポックに関して、全てのＫ個のタスク／データセットのタスクｋ毎に、本発明のいくつかの実施形態による、プロセスは、ＮＮ^（ｆ）とＮＮ^（ｋ）をリンクさせ、ＮＮ^{［ｆ，ｋ］}を形成し、（Ｘ^（ｋ），ｙ^（ｋ））を伴う１つのエポックに関して、ＮＮ^{［ｆ，ｋ］}を訓練することができる。周期的に（例えば、エポックｔが、Ｔ／Ｅの倍数であるとき）、プロセスは、エポックｔにおいて、ＮＮ^（ｆ）のパラメータＮＮ^ｆｔをフリーズさせ、ネットワークＮＮ^ｆｔを通して、Ｘを順方向伝搬させ、ＮＮ^（ｆｔ）から層ｈ^{（ｋ，ｔ）}の出力を取得し、アンサンブル学習器（例えば、ランダムフォレスト）を訓練し、ｈ^{（ｋ，ｔ）}（Ｘ）をｙ^（ｋ）（Ｘ）にＲＦ^{（ｋ，ｔ）}マッピングすることができる。プロセスは、次いで、検証スコアが最適である、エポックｔ_ｋにおけるタスクｋ毎に、セット｛ＮＮ^{（ｋ，ｔ）}｝およびセット｛ＲＦ^{（ｋ，ｔ）}｝を返すことができる。

【0078】

本方法の例証は、図１に提供される。図１は、データセット１－Ｋを示し、これは、いくつかのエポックを横断して単一特徴抽出器ＤＮＮ（例えば、ＰｏｔｅｎｔｉａｌＮｅｔまたは別のグラフ畳み込みニューラルネットワーク）を訓練するために使用される。訓練の全てのエポックは、それぞれ、勾配情報を深層特徴抽出器を通して入力に戻るように通過させる、その独自の全結合層を有する、個々のデータセット毎に、エポックを訓練することを伴う。層は、次いで、フリーズされ、データは、順方向伝搬され、深層特徴抽出されたデータセット１－Ｋを生成する。別個のモデル（例えば、ランダムフォレスト、ＳＶＭ、線形回帰、ＸＧＢｏｏｓｔ等）が、次いで、深層特徴抽出されたデータセット毎に訓練される。集約検証スコア（例えば、平均ＯＯＢスコア）が最良である、エポックが、最終モデルのために選択される。多数の実施形態では、Ｔ個のエポックのそれぞれにおけるＫ個のデータセット毎に、プロセスは、勾配情報をマスタＤＮＮ特徴抽出器と共有する、多層パーセプトロン（ＭＬＰ）ＤＮＮの訓練のエポックを実施することができる。

【0079】

本発明のある実施形態による、能動的転移学習プロセスが、図２に示される。プロセス２００が、いくつかのエポックに関して、マスタモデルを二次モデルを用いて訓練する（２０５）。二次モデルはそれぞれ、ラベルの異なるセットに関してマスタモデルを訓練することができる。種々の実施形態では、エポックの数は、設定数のエポックまたは乱数のエポックであることができる。いくつかの実施形態では、いくつかのデータセットが、各エポックにおいて訓練され、各データセットは、モデルをラベルまたは性質の異なるサブセット上で訓練する。プロセス２００は、マスタモデルの加重をフリーズさせる（２１０）。入力データは、次いで、マスタモデルを通して処理され、入力データから特徴を識別する（２１５）。本発明のいくつかの実施形態による、識別された特徴は、特徴ベクトルおよび他の特徴記述子を含む。プロセス２００は、次いで、直交モデルを識別された特徴上で訓練する（２２０）。本発明の種々の実施形態による、直交モデルは、（限定ではないが）ランダムフォレスト等の非微分可能アンサンブルモデルを含むことができる。ある実施形態では、特徴抽出器および１つ以上の直交モデルのセットの組み合わせが、入力を予測または分類するためにともに使用される。

【0080】

本発明のある実施形態による、能動的転移学習プロセスが、図３に示される。プロセス３００が、１つ以上のデータセットを横断して１つ以上のラベルに関してマスタモデルを訓練する（３０５）。プロセス３００は、次いで、モデルを評価するかどうかを決定する（３１０）。種々の実施形態では、プロセスは、設定数のエポック後、モデルを評価することを決定することができる。本発明のある実施形態による、プロセスは、ランダム方式においてモデルを評価することを決定することができる。プロセス３００が、モデルを評価することを決定すると、プロセスは、ラベルに関して１つ以上の直交モデルを訓練する（３１５）。いくつかの実施形態では、別個の直交モデルが、ラベルおよび／またはデータセット毎に、分類するように訓練される。このように、本発明の種々の実施形態による、プロセスは、特徴抽出器として作用する深層ニューラルネットワークと、各入力サンプルの特徴を着目出力性質にマッピングする、最終予測を行う、別の学習器とから成る、ハイブリッドモデルを訓練する。プロセス３００は、マスタモデルおよび／または直交モデルに関する１つ以上の検証スコアを計算する（３２０）。本発明の種々の実施形態による、検証スコアは、（限定ではないが）「アウトオブバッグ」誤差およびデータセットから選別された検証セットに基づくモデルに関する検証スコアを含むことができる。プロセス３００は、次いで、実施すべきさらなるエポックが存在するかどうかを決定する（３２５）。該当する場合、プロセス３００は、ステップ３０５に戻る。プロセスが、実施されるべきさらなるエポックが存在しないと決定すると（３２５）、プロセスは、最適エポックを識別する（３３５）。種々の実施形態では、最適エポックは、（限定ではないが）平均、最大値等の集約検証スコアに基づいて識別される。種々の実施形態では、最適エポックは、次いで、合成モデルを生産するために使用されることができる。本発明のある実施形態による、プロセスは、マスタモデルの加重された層および最適エポックにおける訓練された直交モデルの組み合わせを使用して、合成モデルを構築することができる。

【0081】

本発明の実施形態による、能動的転移学習のための具体的プロセスが、上記に説明される。しかしながら、当業者は、任意の数のプロセスが、本発明の実施形態による具体的用途の要件の必要に応じて利用されることができることを認識するであろう。

【0082】

本発明のいくつかの実施形態による、機械学習モデルを訓練するシステムが、図４に示される。ネットワーク４００は、通信ネットワーク４６０を含む。通信ネットワーク４６０は、ネットワーク４６０に接続されるデバイスが、他の接続されるデバイスと通信することを可能にする、インターネット等のネットワークである。サーバシステム４１０、４４０、および４７０は、ネットワーク４６０に接続される。サーバシステム４１０、４４０、および４７０はそれぞれ、ネットワーク４６０を経由して、クラウドサービスをユーザに提供する、プロセスを実行する、内部ネットワークを介して相互に通信可能に接続される、１つ以上のサーバのグループである。本議論の目的のために、クラウドサービスは、１つ以上のサーバシステムによって実行され、ネットワークを経由して、データおよび／または実行可能アプリケーションをデバイスに提供する、１つ以上のアプリケーションである。サーバシステム４１０、４４０、および４７０はそれぞれ、内部ネットワーク内に３つのサーバを有するように示される。しかしながら、サーバシステム４１０、４４０、および４７０は、任意の数のサーバを含んでもよく、任意の付加的数のサーバシステムが、ネットワーク４６０に接続され、クラウドサービスを提供してもよい。本発明の種々の実施形態によると、本発明のある実施形態による、マスタおよび直交モデルを訓練する、システムおよび方法を使用する、深層学習ネットワークは、単一サーバシステムおよび／またはネットワーク４６０を経由して通信するサーバシステムのグループ上で実行されているプロセスによって提供されてもよい。

【0083】

ユーザは、ネットワーク４６０に接続し、本発明の種々の実施形態による、深層学習ネットワークを提供し、および／またはそれと相互作用するためのプロセスを実施する、パーソナルデバイス４８０および４２０を使用してもよい。示される実施形態では、パーソナルデバイス４８０は、ネットワーク４６０への従来の「有線」接続を介して接続される、デスクトップコンピュータとして示される。しかしながら、パーソナルデバイス４８０は、デスクトップコンピュータ、ラップトップコンピュータ、スマートテレビ、エンターテインメントゲーム用コンソール、または「有線」接続を介してネットワーク４６０に接続する、任意の他のデバイスであってもよい。モバイルデバイス４２０は、無線接続を使用して、ネットワーク１６０に接続する。無線接続は、無線周波数（ＲＦ）信号、赤外線信号、または任意の他の形態の無線シグナリングを使用して、ネットワーク４６０に接続する、接続である。図４では、モバイルデバイス４２０は、移動電話機である。しかしながら、モバイルデバイス４２０は、本発明から逸脱することなく、携帯電話、携帯情報端末（ＰＤＡ）、タブレット、スマートフォン、または無線接続を介してネットワーク４６０に接続する、任意の他のタイプのデバイスであってもよい。
（モデル訓練要素）

【0084】

本発明の種々の実施形態による、ネットワークに接続される他のデバイスを用いてマスタおよび／または直交モデルを訓練する、プロセスを実施するため、および／または訓練タスクを提供するための命令を実行する、モデル訓練要素の実施例が、図５に示される。本発明の多くの実施形態による、訓練要素は、（限定ではないが）モバイルデバイス、コンピュータ、サーバ、およびクラウドサービスのうちの１つ以上のものを含むことができる。訓練要素５００は、プロセッサ５１０と、通信インターフェース５２０と、メモリ５３０とを含む。

【0085】

当業者は、特定の訓練要素が、本発明から逸脱することなく、簡潔にするために省略される、他のコンポーネントを含んでもよいことを認識するであろう。プロセッサ５１０は、（限定ではないが）メモリ５３０内に記憶される命令を実施し、メモリ内に記憶されるデータを操作する、プロセッサ、マイクロプロセッサ、コントローラ、またはプロセッサ、マイクロプロセッサ、および／またはコントローラの組み合わせを含むことができる。プロセッサ命令は、本発明のある実施形態による、プロセスを実施するように、プロセッサ５１０を構成することができる。通信インターフェース５２０は、訓練要素５００が、プロセッサ５１０によって実施される命令に基づいて、ネットワークを経由して、データを伝送および受信することを可能にする。

【0086】

メモリ５３０は、訓練アプリケーション５３２と、訓練データ５３４と、モデルデータ５３６とを含む。本発明のいくつかの実施形態による、訓練アプリケーションは、マスタモデル、二次モデル、および／または直交モデルの訓練を通して、特徴抽出器を訓練するために使用される。本発明のいくつかの実施形態による、特徴抽出器は、入力の特徴を使用して、入力のいくつかの異なる特性を予測し得る、マスタモデルおよび１つ以上の直交モデルから成る、合成モデルである。いくつかの実施形態では、訓練アプリケーションは、特徴抽出器モデルを訓練し、入力クラス（例えば、化学化合物）の一般化可能かつ関連する特徴を識別することができる。本発明のある実施形態による、訓練アプリケーションは、訓練データを使用して、１つ以上のマスタモデル、二次モデル、および／または直交モデルを訓練し、入力のセットを特徴抽出するための最適化された特徴抽出器を決定することができる。

【0087】

訓練要素５００の具体的実施例が、図５に図示されるが、種々の訓練要素のいずれも、本発明の実施形態による具体的用途の要件の必要に応じて、本明細書に説明されるものに類似するプロセスを実施するために利用されることができる。
（訓練アプリケーション）

【0088】

本発明のある実施形態による、深層特徴抽出器を訓練するための訓練アプリケーションが、図６に図示される。訓練アプリケーション６００は、マスタ訓練エンジン６０５と、二次訓練エンジン６１０と、直交訓練エンジン６１５と、検証エンジン６２０と、合成エンジン６２５とを含む。本発明の多くの実施形態による、訓練アプリケーションは、深層特徴抽出器を訓練データの限定されたセット上で訓練し、いくつかの異なるラベルを横断して新しい入力を予測または分類することができる。

【0089】

種々の実施形態では、マスタ訓練エンジンは、マスタモデルを訓練し、複数のクラスまたはタスクを横断して入力データから一般化可能特徴を識別するために使用されることができる。多くの実施形態では、マスタモデルおよび１つ以上の直交モデルのセットは、広く一般化可能特徴を使用して、新しい入力を分類することが可能である、合成モデルを構成する。

【0090】

本発明の種々の実施形態による、二次訓練エンジンは、マスタモデルをデータのセット上で訓練するための二次モデルを訓練するために使用されることができる。いくつかの実施形態では、二次訓練エンジンは、分類器（限定ではないが、全結合層等）を使用して、マスタモデルを通して逆伝搬され得る、損失を算出する。いくつかの実施形態では、別個の二次モデルが、複数の異なるデータセット毎に訓練され、マスタモデルが複数の異なるラベルセットを横断して訓練されることを可能にする。例えば、いくつかの実施形態では、各データセットは、１つ以上の性質（限定ではないが、ＬｏｇＤ、毒性、可溶性、膜浸透性、ある標的に対する効能等）のセットと関連付けられ、異なる二次モデルが、性質のセット毎に訓練される。

【0091】

本発明の多くの実施形態による、直交訓練エンジンは、マスタモデルを訓練するための直交モデルを訓練するために使用されることができる。多くの実施形態では、直交モデルは、（限定ではないが）ランダムフォレストおよびサポートベクトルマシンを含むことができる。本発明のいくつかの実施形態による、直交モデルは、訓練の間、マスタモデルの層上で訓練され、マスタモデルの加重を調節するための直交損失を提供することができる。

【0092】

本発明の多数の実施形態による、検証エンジンは、直交モデルおよび／またはマスタモデルの結果を検証し、マスタおよび／または直交モデルのための最適化された停止点を決定するために使用される。種々の実施形態では、検証エンジンは、アウトオブバッグ誤差を算出し、モデルの一般化性能を監視し、合成モデルのための最適加重の選択を可能にすることができる。

【0093】

種々の実施形態では、合成エンジンは、上記に説明される訓練プロセスおよびシステムに基づいて、深層特徴抽出器として合成モデルを生成することができる。本発明のある実施形態による、合成モデルは、マスタモデルと、１つ以上の直交モデルのセットとを含むことができる。マスタモデルおよび直交モデルのセットは、それに関して検証スコア（限定ではないが、アウトオブバッグスコア等）が最良である、加重のセットに基づいて、加重されることができる。

【0094】

訓練アプリケーションの具体的実施例が、図６に図示されるが、種々の訓練アプリケーションのいずれも、本発明の実施形態による具体的用途の要件の必要に応じて、本明細書に説明されるものに類似するプロセスを実施するために利用されることができる。
（結果）

【0095】

本説明に説明される方法は、公的に入手可能なデータセットおよび専有の大量の医薬データセットの両方を用いて検証されている。本節では、３つの公的に入手可能な化学データセット（ＥＳＯＬ（可溶性）、ＳＡＭＰＬ（可溶性）、および親油性）上でのモデル性能に関する結果が、提供される。ランダム分割が、化学機械学習モデルの実世界性能を過大評価すると広く考えられているため、スキャフォールド分割の形態（円形フィンガープリント空間上に投影された化学サンプルのＫ－平均クラスタリング）が、本実施例のために使用される。下記の表は、データセット毎に、本発明のいくつかの実施形態による、能動的転移学習を用いた統合訓練が、グラフ畳み込みＰｏｔｅｎｔｉａｌＮｅｔのみを用いた訓練より優れていることを示す。

【表1】

【0096】

本発明は、ある具体的側面において説明されているが、多くの付加的修正および変形例が、当業者に明白となるであろう。したがって、本発明は、具体的に説明されるもの以外で実践されてもよいことを理解されたい。したがって、本発明の実施形態は、あらゆる点において、例証的であって、制限的ではないと見なされるべきである。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版