(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-03-23
(54)【発明の名称】ニューラルネットワークを使用して新規化学製剤の化学データシーケンスを生成する方法、システム及び装置
(51)【国際特許分類】
G16C 20/70 20190101AFI20230315BHJP
G16C 20/50 20190101ALI20230315BHJP
G06N 3/044 20230101ALI20230315BHJP
G06N 3/0442 20230101ALI20230315BHJP
G06N 3/045 20230101ALI20230315BHJP
【FI】
G16C20/70
G16C20/50
G06N3/044
G06N3/0442
G06N3/045
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022540454
(86)(22)【出願日】2021-01-26
(85)【翻訳文提出日】2022-08-25
(86)【国際出願番号】 US2021015108
(87)【国際公開番号】W WO2021154740
(87)【国際公開日】2021-08-05
(32)【優先日】2020-01-27
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522258396
【氏名又は名称】ポーション エーアイ,インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】ステック,アレクサンダー アンソニー
(72)【発明者】
【氏名】サイイド,ヤヒヤ ムハンマド
(72)【発明者】
【氏名】ヘ,キジャン
(57)【要約】
幾つかの実施形態では、方法は、化学製品製剤に関連付けられた標的属性のセット及び複数の標的属性の優先値のセットを受け取ることを含む。方法は、(1)第1のニューラルネットワーク、(2)標的属性のセット、及び(3)優先値のセットに基づいて、サンプル製剤のセットを決定することを含む。方法は、サンプル製剤のセットに基づいてスコアのセットを決定することを含む。方法は、スコアのセット及び標的属性のセットに基づいて、サンプル製剤のセットから、スコアのセットからの残りのスコアよりも大きいスコアを有するサンプル製剤を選択することを含む。方法は、サンプル製剤に関連付けられた由来を特定することを含む。由来が所定のグループに含まれる場合、方法は、化学製品製剤としてサンプル製剤を含むレポートを生成することを含む。
【特許請求の範囲】
【請求項1】
化学製品製剤に関連付けられた複数の標的属性、及び前記複数の標的属性の複数の優先値を受け取ることと、
(1)第1のニューラルネットワーク、(2)前記複数の標的属性、及び(3)前記複数の優先値に基づいて、複数のサンプル製剤を決定することであって、前記複数のサンプル製剤からの各サンプル製剤は、複数の成分を含む、決定することと、
前記複数のサンプル製剤に基づいて複数のスコアを決定することであって、前記複数のスコアからの各スコアは、前記複数のサンプル製剤からのサンプル製剤に関連付けられる、決定することと、
前記複数のスコア及び前記複数の標的属性に基づいて、前記複数のサンプル製剤から、前記複数のスコアからの残りのスコアよりも大きいスコアを有するサンプル製剤を選択することと、
前記サンプル製剤に関連付けられた由来を特定することと、
前記由来が所定のグループに含まれる場合、前記化学製品製剤として前記サンプル製剤を含むレポートを生成することと
を含む方法。
【請求項2】
前記複数のサンプル製剤は、第1の複数のサンプル製剤であり、
前記サンプル製剤は、第1のサンプル製剤であり、
前記方法は、
前記第1のニューラルネットワークに関連付けられた複数の重みを変更して、第2の複数のサンプル製剤を決定すること、
前記第2の複数のサンプル製剤から第2のサンプル製剤を選択すること
を更に含み、
前記レポートは、前記化学製品製剤として前記第2のサンプル製剤を含む、請求項1に記載の方法。
【請求項3】
前記複数のサンプル製剤は、第1の複数のサンプル製剤であり、
前記サンプル製剤は、第1のサンプル製剤であり、
前記方法は、
前記第1のサンプル製剤を変更して、変更されたサンプル製剤を生成すること、
前記第1のニューラルネットワーク及び前記変更されたサンプル製剤に基づいて、第2の複数のサンプル製剤を決定すること
を更に含み、
前記レポートは、前記化学製品製剤として、前記第2の複数のサンプル製剤から選択された第2のサンプル製剤を含む、請求項1に記載の方法。
【請求項4】
所定の条件が満たされるまで、
新たな複数のサンプル製剤を決定することと、
前記新たな複数のサンプル製剤から新たなサンプル製剤を選択することと
を繰り返すことを更に含む、請求項1に記載の方法。
【請求項5】
前記複数の標的属性は、分類、粘度又はpHレベルの少なくとも1つを含む、請求項1に記載の方法。
【請求項6】
前記第1のニューラルネットワークは、リカレントサブネットワークを含む、請求項1に記載の方法。
【請求項7】
前記化学製品製剤は、スキンケア製品である、請求項1に記載の方法。
【請求項8】
プロセッサによって実行される命令を表すコードを記憶する非一時的プロセッサ可読媒体であって、前記コードは、前記プロセッサに、
化学製剤の複数の標的属性を受け取ることと、
前記複数の標的属性を符号化して、信号を生成することと、
第1の入力としての前記信号と共に第1のニューラルネットワークを使用して、(1)複数の成分を含む化学データシーケンス、及び(2)複数の特性値を決定することであって、前記複数の成分からの各成分は、前記複数の特性値からの特性値に関連付けられる、決定することと、
第2のニューラルネットワークを使用して及び前記化学データシーケンスと前記複数の特性値とを第2の入力として用いて、前記複数の成分の複数のスコアであって、前記複数の標的属性に関連付けられた複数のスコアを決定することと、
前記複数のスコアを増大させるように、前記第1のニューラルネットワークに関連付けられた複数の重みを変更し、及び変更されたニューラルネットワークを生成することと、
前記変更されたニューラルネットワークに基づいて、変更された複数の成分を含む変更された化学データシーケンスを決定することと、
前記複数の標的属性に関連付けられた前記変更された化学データシーケンスを有する前記化学製剤を含むレポートを生成することと
を行わせるコードを含む、非一時的プロセッサ可読媒体。
【請求項9】
前記化学製剤は、パーソナルケア製品製剤である、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項10】
前記プロセッサに前記レポートを生成させる前記コードは、前記プロセッサに、
前記変更された化学データシーケンスを第3の入力として使用して、前記変更された化学データシーケンスに関連付けられた由来を決定することと、
前記由来が所定のグループに含まれる場合、前記レポートを生成することと
を行わせるコードを更に含む、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項11】
前記複数の特性値からの各特性値は、前記複数の成分からの成分の、複数の濃度割合からの濃度割合に関連付けられる、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項12】
前記複数の特性値からの各特性値は、前記複数の成分からの成分の、複数の混合段階からの混合段階に関連付けられる、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項13】
前記複数の標的属性は、分類、粘度又はpHレベルの少なくとも1つを含む、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項14】
前記複数の標的属性を符号化して、信号を生成する前記コードは、前記プロセッサにワンホット符号化を行わせるコードを含む、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項15】
前記複数の標的属性を符号化して、前記信号を生成する前記コードは、前記複数の標的属性が連続する場合、前記プロセッサに、前記複数の標的属性を離散値の所定のセットにマッピングさせるコードを含む、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項16】
前記第1のニューラルネットワークは、リカレントサブネットワーク及び1つ又は複数の出力層を含み、
前記リカレントサブネットワークは、積層長短期メモリセルを含み、及び
前記1つ又は複数の出力層は、時間分散高密度層を含む、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項17】
前記コードは、前記プロセッサに、基本化学データシーケンスを受け取らせるコードを更に含み、
前記化学データシーケンスを決定する前記コードは、前記プロセッサに、前記基本化学データシーケンスに基づいて前記化学データシーケンスを決定させるコードを含む、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項18】
前記複数の標的属性からの各標的属性は、複数の優先値からの優先値に関連付けられ、
前記プロセッサに、前記第1のニューラルネットワークに関連付けられた前記複数の重みを変更させる前記コードは、前記複数の優先値に基づく、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項19】
前記コードは、前記プロセッサに、トレーニングデータセットに基づいて、バックプロパゲーション技法と共に確率的勾配降下を使用して前記第1のニューラルネットワークをトレーニングさせるコードを更に含む、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項20】
前記プロセッサに前記複数の重みを変更させる前記コードは、前記プロセッサに、強化学習を使用して前記複数の重みを変更させるコードを更に含む、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項21】
前記コードは、前記プロセッサに、所定の条件が満たされるまで、新たな化学データシーケンスを決定することを繰り返させるコードを更に含む、請求項8に記載の非一時的プロセッサ可読媒体。
【請求項22】
プロセッサと、
前記プロセッサに動作可能に結合されたメモリと
を含む装置であって、前記メモリは、プロセッサによって実行される命令を表すコードを記憶し、前記コードは、前記プロセッサに、
化学製品製剤に関連付けられた複数の標的属性を受け取ることと、
第1のニューラルネットワークに基づいて、前記複数の標的属性に関連付けられた第1の複数のサンプル製剤を決定することであって、前記第1の複数のサンプル製剤からの各サンプル製剤は、複数の成分を含む、決定することと、
第1の複数のスコアを決定することであって、前記第1の複数のスコアからの各スコアは、前記第1の複数のサンプル製剤からのサンプル製剤に関連付けられる、決定することと、
前記第1の複数のスコア及び前記複数の標的属性に基づいて、前記第1の複数のサンプル製剤から、前記第1の複数のスコアからの残りのスコアよりも大きいスコアを有する第1のサンプル製剤を選択することと、
前記第1のニューラルネットワーク及び前記第1のサンプル製剤に基づいて、第2の複数のサンプル製剤を決定することと、
第2の複数のスコアを決定することであって、前記第2の複数のスコアからの各スコアは、前記第2の複数のサンプル製剤からのサンプル製剤に関連付けられる、決定することと、
前記第2の複数のスコア及び前記複数の標的属性に基づいて、前記第2の複数のサンプル製剤から、前記第2の複数のスコアからの残りのスコアよりも大きいスコアを有する第2のサンプル製剤を選択することと、
前記第2のサンプル製剤に関連付けられた由来を特定することと、
前記由来が所定のグループに含まれる場合、前記化学製品製剤として前記第2のサンプル製剤を含むレポートを生成することと
を行わせるコードを含む、装置。
【請求項23】
前記コードは、前記プロセッサに、所定の条件が満たされるまで、
新たな複数のサンプル製剤を決定することと、
前記新たな複数のサンプル製剤から新たなサンプル製剤を選択することと
を繰り返させるコードを更に含む、請求項22に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
[0001] 本願は、2020年1月27日付けで出願された「Methods, Systems and Apparatus for Generating Chemical Data Sequences Using Neural Networks for De Novo Chemical Formulations」という名称の米国仮特許出願第62/966,409号に対する優先権及びその利益を主張するものであり、この特許出願の全開示は、参照により全体として本明細書に援用される。
【0002】
背景
[0002] 本明細書に記載の幾つかの実施形態は、概して、人工知能の方法、システム及び装置に関する。特に、限定されないが、本明細書に記載の幾つかの実施形態は、ニューラルネットワークを使用して新規化学製剤(de novo chemical formulation)のための化学データシーケンスを生成する方法、システム及び装置に関する。
【背景技術】
【0003】
[0003] 化学製剤は、典型的には、多くの場合、製品調剤者により又は美容製品の場合には化粧品化学者により、経験的方法論又は基本モデリング方法論を使用して作成、設計及び/又は製剤される。そのような方法論は、時間がかかり、高価であり、精密ではなく、一般に最適な設計/製剤に繋がらない。特定の標的属性(選択された効能又は物理特性等)を有する新たな化学製剤を作成する場合、調剤者は、典型的には、標的目的のために単独で最適化される新規製剤を作成するのとは対照的に、製剤ベースとしての役割を果たす既存の製剤に依存する。この手法は、標的目的を満たすように基礎から設計される新規製剤と比較して劣った製剤をもたらす。更に、このようにして設計された製剤は、多くの場合、安定性の問題に直面し、製品の高い割合は、最終的に、製品分離等の予期しない問題に起因してテスト段階で不合格になる。最後に、これらの方法論は、1)製剤における種々の構成化学物質の互いの相互作用、及び2)外部対象(例えば、人間の皮膚)との製剤の相互作用を含め、長い間にわたって調剤者が成し遂げられなかった他の問題のサブセットについて最適化されない。
【発明の概要】
【発明が解決しようとする課題】
【0004】
[0004] したがって、そのような方法の欠点をなくす、よりよい方法論が必要とされている。
【課題を解決するための手段】
【0005】
概要
[0005] 本明細書は、1つ又は複数の場所における1つ又は複数のコンピュータでコンピュータプログラムとして実施される装置がどのように入力として所望の製剤属性を取り、化学製剤を構成する化学データシーケンスを生成するかを説明する。例えば、化学データシーケンスは、顔用保湿剤等のスキンケア製品製剤を表すことができる。
【0006】
[0006] 本装置は、入力として1つ又は複数の標的属性を受け取り、本装置内の他のサブシステムに通信するために、信号としてこれらの属性を符号化するように構成される、信号エンコーダと呼ばれる1つ又は複数のコンピュータによって実施される信号符号化サブシステムを含む。本装置は、本装置が、その後、対応する化学製剤に変換する化学データシーケンスを生成するように構成される、生成器と呼ばれる1つ又は複数のコンピュータによって実施されるサブシステムを含む。
【0007】
[0007] 革新的な一態様では、生成器は、入力として、(i)化学データシーケンスと、(ii)幾つかの実施形態では所望の製剤属性で構成された信号と、を取るよう構成されると共に、化学製剤を構成する化学データの出力シーケンスを生成するように構成される、生成器シーケンスサブシステムと呼ばれる、1つ又は複数のコンピュータによって実施されるニューラルネットワークサブシステムを含む。生成器シーケンスサブシステムは、部分的に又は完全に、1つ又は複数の信号処理層と、1つ又は複数の出力層とを含むリカレントニューラルネットワークで構成され得る。生成器シーケンスサブシステムは、現在の化学データシーケンスを処理して、現在の時間ステップのための代替表現を生成するように更に構成され得る。したがって、この代替表現は、現在の化学データシーケンスが生成器シーケンスサブシステムによって符号化された数値表現、即ち数値の順序付き集合を含み得る。出力層は、全ての時間ステップについて、時間ステップの代替表現を受け取って処理し、その時間ステップの化学データ出力を生成するように構成され得る。幾つかの実施形態では、生成器サブシステムは、生成器シーケンスサブシステムと協働し、時間ステップ間で生成器シーケンスサブシステムによって生成された化学データシーケンスを変更し得る、テンプレートサブシステムと呼ばれるサブシステムも含む。
【0008】
[0008] 幾つかの実施形態における本装置は、入力として、化学製剤を表す化学データシーケンスを受け取るように構成される、予測器と呼ばれる、1つ又は複数のコンピュータによって実施されるニューラルネットワークサブシステムも含む。予測器は、部分的又は完全に、外部メモリで増強され得るリカレントニューラルサブネットワークで構成され得る。サブネットワークは、1つ又は複数の信号処理層及び1つ又は複数の出力層で構成され得、出力層は、入力化学データシーケンスによって表される所与の化学製剤が、その特定の出力層に対応する標的属性を顕現する程度を予測するように構成される。
【0009】
[0009] 幾つかの実施形態における本装置は、予測器と同じフォーマットの入力を受け取るように構成される、弁別器と呼ばれる、1つ又は複数のコンピュータによって実施されるニューラルネットワークサブシステムも含む。幾つかの実施形態では、弁別器は、部分的に又は全体的に、外部メモリで増強され得るリカレントニューラルサブネットワークで構成され得、他の実施形態では、弁別器は、部分的に又は全体的に、畳み込みニューラルネットワークで構成され得る。サブネットワークは、1つ又は複数の信号処理層及び出力層を含み得、出力層は、入力された化学データシーケンスによって表される化学製剤が由来する複数のセット、例えば生成器によって生成されたもの対市場に現在存在する製品のセットのメンバのいずれを割り当てるかに関連付けられた値を予測するように構成される。
【0010】
[0010] 幾つかの実施形態における本装置は、入力として、(i)所望の製剤属性で構成された信号と、(ii)生成器シーケンスサブシステムと、(iii)予測器サブシステム、及び(iv)弁別器サブシステムの1つ又は複数とを受け取るように構成される、チューナと呼ばれる、1つ又は複数のコンピュータによって実施される強化学習サブシステムも含む。チューナは、出力化学データシーケンスが、所望の属性を示す化学製剤を表す可能性を高めるように生成器シーケンスサブシステムを変更することを目的として、生成器シーケンスサブシステムのニューラルネットワーク重みを変更する(幾つかの実装形態では、スコアを増大させるように変更されたニューラルネットワークを生成する)ように構成される。
【0011】
[0011] 本装置は、生成器によって生成された化学データシーケンスを化学製剤に変換し、次いで本装置の出力として取るためのこれらの製剤のサブセットを選択する、製剤セレクタと呼ばれるサブシステムも含む。幾つかの実施形態では、製剤セレクタサブシステムは、入力として、受け取った化学データシーケンスに対応する予測器サブシステム及び弁別器サブシステムの一方又は両方からの出力も受け取る。製剤セレクタは、所望の属性に対応するスコアで高得点である化学データシーケンスによって表される製剤の選択を最適化するように構成され得る。
【0012】
[0012] 本開示は、コンピュータ実施方法として、又はコンピュータシステムとして、又は1つ若しくは複数のコンピュータに本方法を実行させ、本コンピュータシステムを実施させるプログラム命令を記憶するコンピュータプログラム製品(1つ若しくは複数のコンピュータ記憶媒体等)として表現され得る。本明細書に記載される主題の1つ又は複数の実施形態の詳細は、添付図面及び以下の説明に記載される。本主題の他の特徴、態様及び利点も説明、図面及び特許請求の範囲から明らかになるであろう。
【0013】
[0013] 幾つかの実施形態では、方法は、化学製品製剤に関連付けられた標的属性のセット及び複数の標的属性の優先値のセットを受け取ることを含む。本方法は、(1)第1のニューラルネットワーク、(2)標的属性のセット、及び(3)優先値のセットに基づいて、サンプル製剤のセットを決定することを含む。サンプル製剤のセットからの各サンプル製剤は、成分のセットを含む。本方法は、サンプル製剤のセットに基づいてスコアのセットを決定することを含む。スコアのセットからの各スコアは、サンプル製剤のセットからのサンプル製剤に関連付けられる。本方法は、スコアのセット及び標的属性のセットに基づいて、サンプル製剤のセットから、スコアのセットからの残りのスコアよりも大きいスコアを有するサンプル製剤を選択することを含む。本方法は、サンプル製剤に関連付けられた由来を特定することを含む。由来が所定のグループに含まれる場合、本方法は、化学製品製剤としてそのサンプル製剤を含むレポートを生成することを含む。
【0014】
[0014] 幾つかの実施形態では、非一時的プロセッサ可読媒体は、プロセッサによって実行される命令を表すコードを記憶する。コードは、プロセッサに、化学製剤の標的属性のセットを受け取らせるコードを含む。コードは、プロセッサに、標的属性のセットを符号化して、信号を生成させるコードを含む。コードは、プロセッサに、第1の入力としての信号と共に第1のニューラルネットワークを使用して、(1)成分のセットを含む化学データシーケンス、及び(2)特性値のセットを決定させるコードを含む。成分のセットからの各成分は、特性値のセットからの特性値に関連付けられる。コードは、プロセッサに、第2のニューラルネットワークを使用して及び化学データシーケンスと特性値のセットとを第2の入力として用いて、成分のセットのスコアのセットであって、標的属性のセットに関連付けられたスコアのセットを決定させるコードを含む。コードは、プロセッサに、スコアのセットを増大させるように、第1のニューラルネットワークに関連付けられた重みのセットを変更させ、及び変更されたニューラルネットワークを生成させるコードを含む。コードは、プロセッサに、変更されたニューラルネットワークに基づいて、変更された成分のセットを含む変更された化学データシーケンスを決定させるコードを含む。コードは、プロセッサに、標的属性のセットに関連付けられた変更された化学データシーケンスを有する化学製剤を含むレポートを生成させるコードを含む。
【0015】
[0015] 幾つかの実施形態では、装置は、プロセッサと、プロセッサに動作可能に結合されたメモリとを含む。メモリは、プロセッサによって実行される命令を表すコードを記憶する。コードは、プロセッサに、化学製品製剤に関連付けられた標的属性のセットを受け取らせるコードを含む。コードは、プロセッサに、第1のニューラルネットワークに基づいて、標的属性のセットに関連付けられたサンプル製剤の第1のセットを決定させるコードを含む。サンプル製剤の第1のセットからの各サンプル製剤は、成分のセットを含む。コードは、プロセッサに、スコアの第1のセットを決定させるコードを含む。スコアの第1のセットからの各スコアは、サンプル製剤の第1のセットからのサンプル製剤に関連付けられる。コードは、プロセッサに、スコアの第1のセット及び標的属性のセットに基づいて、サンプル製剤の第1のセットから、スコアの第1のセットからの残りのスコアよりも大きいスコアを有する第1のサンプル製剤を選択させるコードを含む。コードは、プロセッサに、第1のニューラルネットワーク及び第1のサンプル製剤に基づいて、サンプル製剤の第2のセットを決定させるコードを含む。コードは、プロセッサに、スコアの第2のセットを決定させるコードを含む。スコアの第2のセットからの各スコアは、サンプル製剤の第2のセットからのサンプル製剤に関連付けられる。コードは、プロセッサに、スコアの第2のセット及び標的属性のセットに基づいて、サンプル製剤の第2のセットから、スコアの第2のセットからの残りのスコアよりも大きいスコアを有する第2のサンプル製剤を選択させるコードを含む。コードは、プロセッサに、第2のサンプル製剤に関連付けられた由来を特定させるコードを含む。由来が所定のグループに含まれる場合、コードは、プロセッサに、化学製品製剤として第2のサンプル製剤を含むレポートを生成させるコードを含む。
【図面の簡単な説明】
【0016】
図面の簡単な説明
【
図1】[0016]一実施形態による、所望の製剤属性を有する製品の化学製剤のための装置を示す。
【
図2】[0017]一実施形態による、所望の製剤属性を有する製品の化学製剤のための別の装置を示す。
【
図3】[0018]一実施形態による、化学データシーケンスの自己回帰生成を実行するように構成されたニューラルネットワーク生成器シーケンスサブシステムを示す。
【
図4】[0019]一実施形態による、1つの生成器シーケンスサブシステム及び1つのテンプレートサブシステムを含む生成器サブシステムを示す。
【
図5】[0020]一実施形態による、3つの生成器シーケンスサブシステム及び2つのテンプレートサブシステムを含む生成器サブシステムを示す。
【
図6】[0021]一実施形態による、入力化学データシーケンスによって表される化学製剤の属性を予測する予測器サブシステムを示す。
【
図7】[0022]一実施形態による、所望の属性を示す製剤を表す可能性がより高い化学データシーケンスを生成するように生成器シーケンスサブシステムを調整する方法を示す。
【
図8】[0023]一実施形態による、所望の製剤属性を有する製品の化学製剤の方法を示す。
【発明を実施するための形態】
【0017】
詳細な説明
[0024] ここで、1つ又は複数の実施形態によるシステム、方法及びデバイスについて説明する。実施形態例は、例示を目的として本開示に提示され、本開示の範囲の制限又は限定を意図されず、代わりに他の適したシステム、方法及びデバイスにより広く適用可能である。
【0018】
[0025] 本明細書に記載の実施形態は、1つ又は複数の標的属性を示す化学製品を製剤する技法を提供する。ここで、製剤とは、特定の標的属性を有する製品を生成するように設計された化学物質の混合物である。幾つかの実施形態では、製剤は、製品を構成する成分のセットとして提供される。成分のセットは、製品中の重量%による成分濃度の降順に従ってリストにおいて順序付けられ得る。幾つかの実施形態では、製剤は、各成分に関連付けられた1つ又は複数の値と併せた成分のセット又はリストである。各成分に関連付けられたこれらの値は、その特定の成分の使用に関する製品の製剤における追加指示を提供し得る。例として、1つの数値は、最終製品中の重量%による各成分の濃度に対応することができる。別の例として、1つの数値は、いずれの混合段階において各成分が製品に組み込まれたか、即ち成分が一緒に混合される順序及び様式を示すことができる。
【0019】
[0026] 本明細書は、上述したように化学製剤によって与えられる製品と併せて「標的属性」という用語を使用する。ここで、属性は、一般に、製品の固有部分である品質又は特徴であり、属性が標的であるとの指定は、一般に、製品がその特定の属性を示すことが望ましいことを意味する。一例として、化学製剤によって生成される製品の属性は、製品の分類、例えばスキンケア対ヘアケアであり得、製品の粘度又はpHレベル等の製品の物理的属性であり得る。本明細書に記載の1つ又は複数の実施形態は、1つ又は複数の標的属性を示すように最適化され選択された製品製剤を出力するように設計される。この最適化について、製剤の出力を担当するサブシステムが詳述されるときにより詳細に後述する。
【0020】
[0027]
図1は、入力として所望の属性を取り、1つ又は複数の標的属性信号を通信して、化学製品製剤によって与えられる1つ又は複数の製品を製剤する化学製品製剤装置100を示す。化学製品製剤は、成分のセットを含むことができる。化学製品製剤は、例えば、パーソナルケア(例えば、スキンケア)製品製剤であり得る。化学製品製剤装置100は、信号エンコーダ110、生成器サブシステム120及び製剤セレクタ130を含む。
図1に示すように、信号エンコーダ110は、生成器サブシステム120及び製剤セレクタ130に動作可能に結合されて通信し、生成器サブシステム120は、予測器サブシステム140、弁別器サブシステム150及び製剤セレクタ130に動作可能に結合されて通信し、予測器サブシステム140及び弁別器サブシステム150は、それぞれ製剤セレクタ130に動作可能に結合されて通信する。化学製品製剤装置100は、1つ又は複数のプロセッサ(
図1に示されず)と、1つ又は複数のプロセッサに動作可能に結合されたメモリ(
図1に示されず)とを含む。メモリは、1つ又は複数のプロセッサによって実行される命令を表すコードを記憶する。コードは、1つ又は複数のプロセッサに、信号エンコーダ110、生成器サブシステム120、製剤セレクタ130、予測器サブシステム140及び弁別器サブシステム150を実行させるコードを含む。
【0021】
[0028] 幾つかの実施形態では、装置は、任意選択的に、予測器サブシステム140も含む。幾つかの実施形態では、装置は、任意選択的に、弁別器サブシステム150も含む。
図1は、化学製品製剤装置100の可能な一構成のみを示すことに留意されたい。幾つかの他の実施形態では、予測器サブシステム140及び弁別器サブシステム150の一方又は両方は、含まれなくてよい。
図2は、予測器サブシステム140も弁別器サブシステム150も存在しない化学製品製剤装置200の可能な一構成を示す。この実施形態では、製剤セレクタ230のみが標的属性信号211及び生成された化学データシーケンスを生成器サブシステム220から入力として受け取る。
図1の化学製品製剤装置100と同様の物理的構造及び機能において、
図2の化学製品製剤装置200は、1つ又は複数のプロセッサ(
図2に示されず)と、1つ又は複数のプロセッサに動作可能に結合されたメモリ(
図2に示されず)とを含むこともできる。メモリは、1つ又は複数のプロセッサによって実行される命令を表すコードを記憶する。コードは、1つ又は複数のプロセッサに、信号エンコーダ210、生成器サブシステム220、製剤セレクタ230を実行させるコードを含む。
【0022】
[0029]
図1に戻ると、信号エンコーダ110は、入力として1つ又は複数の標的属性を受け取り、幾つかの実装形態では、これらの属性を製剤セレクタ130に通信するために信号として符号化するように構成される。幾つかの実装形態では、信号エンコーダ110がこれらの1つ又は複数の標的属性を符号化せず、生成器サブシステム120は、1つ又は複数の標的属性を入力として受け取る。幾つかの実施形態では、符号化された標的属性信号111は、任意選択的に、製剤セレクタ130に加えて生成器サブシステム実装形態120に通信することができる。幾つかの実装形態では、標的属性信号は、部分的又は全体的に、ワンホットエンコード又は化学製品製剤装置100の出力において製剤によって表される製品の分類又はカテゴリを指定する他の表現を含み得る。連続属性は、標的属性信号中の離散値の所与のセット(又は離散値の所定のセット)にマッピングされ、及びしたがって分類標的として取り扱われ得る。幾つかの実施形態では、属性信号は、部分的又は全体的に、化学製品製剤装置100の出力において製剤によって表される製品に出現すべき数値属性、例えば標的値の粘度等の物理的属性を指定する連続値のベクトルを含み得る。
【0023】
[0030] 幾つかの実装形態では、信号エンコーダ110が標的属性信号111を符号化した後、化学製品製剤装置100(化学製品製剤装置100のメモリに記憶された命令に基づいて生成器サブシステム120を実行する)におけるプロセッサは、入力としての符号化信号と共にニューラルネットワークを使用して、成分のセット及び特性値のセットを含む化学データシーケンスを決定することができる。複数の成分のうちの各成分は、複数の特性値のうちの特性値に関連付けられる。生成器サブシステム120は、製剤セレクタ130に通信される化学データシーケンスを作成するように構成される。幾つかの実装形態では、生成器サブシステム120は、ニューラルネットワーク生成器シーケンスサブシステムを含む。幾つかの実装形態では、標的属性信号111は、生成器サブシステム120(又は第1のニューラルネットワーク)への入力として使用される。この場合、ニューラルネットワーク生成器シーケンスサブシステムは、ニューラルネットワーク生成器シーケンスサブシステムへのニューラルネットワーク入力として使用される標的属性信号111に従って化学データシーケンスを出力するように調整される。幾つかの実装形態では、生成器サブシステム120は、ニューラルネットワーク生成器シーケンスサブシステムに加えてテンプレートサブシステムを含む。
【0024】
[0031]
図3は、一例のニューラルネットワーク生成器シーケンスサブシステム300を示す。一例のニューラルネットワーク生成器シーケンスサブシステム300は、化学製品製剤装置(
図1の化学製品製剤装置100又は
図2の化学製品製剤装置200と同様)のメモリに記憶され、プロセッサによって実行することができる。幾つかの実装形態では、生成器シーケンスサブシステム300は、標的属性信号311を入力として取る。生成器シーケンスサブシステム300は、複数の時間ステップの各々における成分サンプルを含む化学データシーケンス、例えば化学製剤を構成する成分のシーケンスを生成する。所与の化学データシーケンス中の各時間ステップは、化学製剤中の成分に対応し、これらの成分は、化学データシーケンスの時間ステップにわたる降順濃度で並べることができる。幾つかの実装形態では、シーケンス中の各時間ステップにおける化学データサンプルは、その特定の時間ステップにおける成分サンプル又はシーケンス全体についての情報を提供する特性値のセットを含むことができる。特性値のセットは、例えば、成分のセットからの成分の濃度割合、化学製品製剤中の成分の機能、成分のセットからの成分の混合段階等を含むことができる。例えば、幾つかの実装形態では、シーケンス中の各時間ステップにおける化学データサンプルは、その時間ステップで構成される化学データシーケンス全体に関連する、その時間ステップに対応する成分サンプルの濃度、並びに他の複数の時間ステップの各々における全ての成分のサンプル及びそれぞれの濃度を含むことができる。別の例として、各時間ステップにおける化学データサンプルに含まれる値は、化学製品製剤における成分の機能、例えば保湿剤等のスキンケア製品を構成する化学データシーケンスを生成する場合、製剤中の水の役割を記述する、溶媒機能に対応する値であり得る。
【0025】
[0032]
図3に示すように、ニューラルネットワーク生成器シーケンスサブシステム300は、リカレントサブネットワーク310と、1つ又は複数の出力層320(簡潔にするために、そのうちの1つのみが
図3に記される)とを含む。リカレントサブネットワーク310及び出力層320は、1つ又は複数の信号処理層で構成され得る。例として、リカレントネットワーク310は、積層長短期メモリ(LSTM)セルを含むことができ、出力層320は、リカレントネットワーク310上の時間分散高密度層であり得る。幾つかの実装形態では、リカレントサブネットワークは、外部メモリ構成要素に対する書き込み及び読み出しを行う。一般に、ニューラルネットワーク生成器シーケンスサブシステム300は、化学データシーケンスを自己回帰生成する。したがって、化学データシーケンス中の各時間ステップについて、ニューラルネットワーク生成器シーケンスサブシステム300は、シーケンスにおいて先に生成された化学データサンプル、即ちその特定の時間ステップよりも前の時間ステップの全て又はサブセットにおける化学データサンプルを所与として、その特定の時間ステップにおける化学データサンプルを生成する。幾つかの実装形態では、生成が依然として開始されていない場合、第1の時間ステップにおけるリカレントネットワーク310への最初の入力は、生成を開始するように構成される。幾つかの実装形態では、ニューラルネットワーク生成器シーケンスサブシステム300は、何らかの停止条件に達し、生成が止まるまで、任意の数の時間ステップでシーケンスを生成する。例えば、幾つかの実装形態では、生成は、所定の条件が満たされるまで無期限に続けられる(又は繰り返される)。所定の条件は、幾つかの実装形態では、ニューラルネットワーク生成器シーケンスサブシステム300のニューラルネットワークが、生成がその特定の時間ステップで停止することになることを示す特定の化学データサンプルを生成することであり得る。幾つかの他の実装形態では、所定の条件は、特定数の時間ステップにわたって実行されてから停止するように生成を構成し得ることであり得る。
【0026】
[0033] 化学データシーケンスの生成中の各時間ステップにおいて、リカレントサブネットワーク310は、入力として現在の化学データシーケンスを受け取る。幾つかの実施形態では、現在の化学データシーケンスは、その時間ステップの時点で生成器によって部分的又は全体的に生成された化学データシーケンスである。幾つかの実装形態では、現在の化学シーケンスは、リカレントサブネットワーク310によって事前に生成されず、入力として与えられ得る。リカレントサブネットワーク310は、現在の化学データシーケンスを処理し、その特定の時間ステップにおける現在の化学シーケンスの代替表現を作成する。例として、
図3は、化学データシーケンスの自己回帰生成を示す。化学データサンプルを生成するために、リカレントサブネットワーク310は、現在の時間ステップ前の時間ステップに対応する化学データサンプルで構成された現在の化学データシーケンスを受け取り、現在の化学データシーケンスを代替表現312(簡潔にするために、そのうちの1つのみが
図3に記される)に変換する。
【0027】
[0034] リカレントサブネットワーク310が各時間ステップにおいて代替表現312を生成した後、この代替表現312は、対応する時間ステップにおける各出力層320によって入力として受け取られる。
【0028】
[0035] 幾つかの実装形態では、化学製品製剤装置100におけるプロセッサ(化学製品製剤装置100のメモリに記憶された命令に基づいてニューラルネットワーク生成器シーケンスサブシステム300を実行する)は、ニューラルネットワークを使用し、化学データシーケンス及び特性値のセットを入力として、標的属性のセットに関連付けられた、成分のセットのスコアのセットを決定するように構成することができる。1つの出力層は、その時間ステップで可能な成分サンプルにわたるスコア分布(又はスコアのセット)を生成する。スコア分布は、複数の可能な成分サンプルの各々の各スコアで構成される。幾つかの実装形態では、1つの出力層は、その時間ステップで可能な成分機能にわたるスコア分布を生成し、スコア分布は、複数の可能な成分機能の各々の各スコアで構成される。ここで、成分「機能」は、製剤中にその成分を使用することの意図される目的、例えば溶媒として作用する水又は保湿剤として作用するプロピレングリコールとして定義される。幾つかの実装形態では、1つの出力層は、その時間ステップで可能な成分濃度ビンにわたるスコア分布を生成し、スコア分布は、複数の可能な成分濃度ビン、例えば0%~1%、1%~3%等の各々での各スコアで構成される。これらの例は、網羅的であることを意図せず、1つ又は複数の出力層が、その時間ステップで可能なシーケンス属性カテゴリにわたるスコア分布を生成し、スコア分布が複数の可能なシーケンス属性カテゴリの各々の各スコアで構成される幾つかの他の実装形態を容易に実施することができる。幾つかの実装形態では、複数の可能な選択肢にわたるスコア分布を生成する出力層は、ソフトマックス出力層である。幾つかの実装形態では、1つ又は複数の出力層は、その特定の時間ステップのシーケンス属性に相関する数値を生成する。例として、これは、その特定の時間ステップにおける成分サンプルの濃度に対応する数値を含むことができる。幾つかの実装形態では、数値を生成する出力層は、正規化線形層である。
【0029】
[0036] 幾つかの実装形態では、出力層の1つ又は複数が、特定の時間ステップにおけるその出力層に可能な複数のサンプルに対応するスコア分布を生成した場合、生成器シーケンスサブシステム310は、その時間ステップにおいて出力層によって生成されたスコア分布に従い、その特定の時間ステップにおける出力層の各々のサンプルを選択する。例として、特定の時間ステップにおける所与の出力層に選択されるサンプルは、その時間ステップにおいて所与の出力層によって生成されるスコア分布における最高スコアを有するサンプルを選択することによって選択することができる。別の例として、特定の時間ステップにおいて所与の出力層に選択されるサンプルは、その時間ステップにおいて所与の出力層によって生成されたスコア分布におけるそのスコアに従い、選択される各サンプルの尤度を重み付けすることにより、可能なサンプルをサンプリングすることによって選択することができる。全ての出力層からの全てのサンプル及び値のセットは、その時間ステップの完全な化学データサンプルを構成する。ここで、「完全」は、特定の時間ステップの化学データサンプルが、後続する時間ステップにおける化学データサンプルの生成に必要な全情報を含むことを示す。
【0030】
[0037] 幾つかの実装形態では、生成器シーケンスサブシステム300は、追加のニューラルネットワーク入力を取るように構成される。幾つかの実装形態では、ニューラルネットワーク入力は、1つ又は複数の局所特徴を含む。ここで、局所特徴は、化学データシーケンス中の複数の時間ステップの各々で異なり得る特徴である。幾つかの実装形態では、ニューラルネットワーク入力は、1つ又は複数の大域特徴を含む。ここで、大域特徴は、化学データシーケンス全体にわたって変わらない特徴である。例として、大域特徴は、生成器が出力シーケンスとして生成するように構成される製品のタイプ、例えばスキンケア製品に関連して顔用保湿剤対洗顔剤であり得る。生成器シーケンスサブシステムが入力として標的属性信号311を取る幾つかの実装形態では、信号は、ニューラルネットワーク入力として取られる。
【0031】
[0038] 生成器シーケンスサブシステムの1つのみのインスタンスを有する生成器サブシステムについてこれまで考察してきたが、実施形態は、この構成に限定されない。幾つかの他の実施形態では、生成器サブシステムは、生成器シーケンスサブシステムの複数のインスタンスを含み得る。幾つかのそのような実施形態では、生成器は、並列動作して、出力として1つ又は複数の化学データシーケンスを生成する。生成器サブシステムの出力は、全ての生成器シーケンスサブシステムによって生成される化学データシーケンスの集合として取られる。
【0032】
[0039]
図4は、生成器シーケンスサブシステム410と、テンプレートサブシステム420とを有する生成器サブシステム400を示す。生成器サブシステム400は、化学製品製剤装置(
図1の化学製品製剤装置100又は
図2の化学製品製剤装置200と同様)のメモリに記憶され、プロセッサによって実行することができる。一般に、2つのサブシステムが存在する場合、生成器シーケンスサブシステム410は、上述したように入力を受け取って出力を生成するが、テンプレートサブシステム420は、各時間ステップが生成される前に、サブシステム410に入力され、及び/又はサブシステム410によって生成される化学データシーケンスを変更する能力を有する。幾つかの実施形態では、2つのサブシステムは、順次機能する。現在の化学データシーケンスは、テンプレートサブシステム420に通信され、テンプレートサブシステム420は、シーケンスに変更を行い得るか又は変更を行わなくてよく、次いで、テンプレートサブシステム420は、変更された現在の化学データシーケンスを出力し、これは、生成器シーケンスサブシステム410に通信し戻される。
【0033】
[0040] 幾つかの実装形態では、テンプレートサブシステム420は、生成器シーケンスサブシステム410に、生成器シーケンスサブシステム410が自己回帰生成を実行する1つ又は複数の時間ステップの基本化学データシーケンスを提供することができる。例えば、化学データシーケンスが成分及び各時間ステップにおけるその対応する濃度で構成される場合、テンプレートサブシステム420は、生成器シーケンスサブシステム410の前の出力ではないソースからの化学データシーケンスの最初の2つの時間ステップを生成器シーケンスサブシステム410に提供し得る。この例では、開始信号から生成を開始する代わりに、生成器シーケンスサブシステム410は、3番目の時間ステップにおいて生成を開始する。幾つかの実装形態では、テンプレートサブシステム420は、1つ又は複数の時間ステップを現在の化学データシーケンスに添付し得る。例えば、テンプレートサブシステム420は、特定の時間ステップに達した後、化学データシーケンスに別の時間ステップを挿入するように構成され得る。別の例として、テンプレートサブシステム420は、特定の成分サンプルが、最も新しく生成された時間ステップに存在する等、化学データシーケンスにおける特定の条件が満たされた後、別の時間ステップを化学データシーケンスに挿入するように構成され得る。前に与えられた例は、テンプレートサブシステム420が現在の化学データシーケンスを変更することができる唯一の方法ではなく、多くのそのような例が可能であることが容易に理解されることに留意されたい。
【0034】
[0041]
図4は、生成器シーケンスサブシステム及びテンプレートサブシステムの各々を少なくとも1つを含む生成器サブシステムの可能な1つのみの実施形態を示すことに留意されたい。生成器サブシステムの代替の実施形態は、生成器シーケンスサブシステム及びテンプレートサブシステムの複数のインスタンスを含み得る。
図5は、2つのテンプレートサブシステム521及び522と、3つの生成器シーケンスサブシステム511~513とを含む生成器サブシステム500の可能な一構成を示す。生成器サブシステム500は、化学製品製剤装置(
図1及び
図2にそれぞれ記載される化学製品製剤装置100及び200と同様)のメモリに記憶された命令に基づいて化学製品製剤装置のプロセッサによって実行することができる。生成器サブシステムの実施形態には、任意の数の任意のトポロジの生成器シーケンスサブシステム及びテンプレートサブシステムを構成し得る。単一のテンプレートサブシステムを1つ又は複数の生成器シーケンスサブシステムに結合し得る。
【0035】
[0042]
図1に戻ると、生成器サブシステム120によって生成された化学データシーケンスは、予測器サブシステム140に通信され、予測器サブシステム140によって入力として使用される。幾つかの実施形態では、予測器サブシステム600は、リカレントサブネットワーク610と、1つ又は複数の出力層620とを含む。予測器サブシステム600は、化学製品製剤装置(
図1及び
図2にそれぞれ記載される化学製品製剤装置100及び200と同様)のメモリに記憶された命令に基づいて化学製品製剤装置のプロセッサによって実行することができる。リカレントサブネットワーク610及び出力層620は、1つ又は複数の信号処理層で構成され得る。一般に、予測器サブシステム又は予測器は、入力として、先に定義されたように化学データシーケンス601を受け取り、出力として、入力された化学データシーケンス601に関連付けられた製剤の属性に関連付けられた数値及び/又は分類を生成する。例えば、出力は、LSTMセルで構成されたリカレントサブネットワークによって生成された化学製剤の成分構成要素を含む化学データシーケンスに従って製剤された製品の最終pH値であり得る。
【0036】
[0043] リカレントサブネットワーク610は、入力された化学データシーケンス601を処理し、全体として現在の化学データシーケンスの代替表現611を作成する。例として、
図6は、入力された化学データシーケンス601に従って製剤された製品の属性予測を示す。
【0037】
[0044] リカレントサブネットワーク610が、入力された化学データシーケンス601の代替表現611を生成した後、この代替表現611は、1つ又は複数の出力層620の各々によって入力として受け取られる。幾つかの実装形態では、1つ又は複数の出力層620は、各出力層の重みがトレーニングされたシーケンスの可能な属性カテゴリにわたるスコア分布を生成する。スコア分布は、各属性について、可能な複数の属性カテゴリの各々の各スコアで構成される。例として、化学製剤の成分構成要素を表す化学データシーケンスで予測する予測器サブシステムの場合、出力層がスコア分布を生成する予測属性は、製剤の構成要素成分のいずれかが石油由来であるか否かであり得る。この属性の2つの可能なカテゴリは、成分のいずれも石油由来ではない場合におけるいいえ、及び成分の1つ又は複数が石油由来である場合におけるはい、である。幾つかの実装形態では、複数の可能な選択肢にわたるスコア分布を生成する出力層は、ソフトマックス出力層である。
【0038】
[0045] 幾つかの実装形態では、1つ又は複数の出力層620は、化学シーケンス属性に相関する数値を生成する。例として、製品化学データシーケンス601が化学製剤の成分構成要素を表すことを予測する予測器サブシステム600の場合、出力層620が数値を生成する予測属性は、化学データシーケンス601によって製剤される製品のpHレベルであり得る。幾つかの実装形態では、数値を生成する出力層620は、正規化線形層である。
【0039】
[0046] 幾つかの実装形態では、出力層620の1つ又は複数が、その出力層に可能な複数の属性カテゴリに対応するスコア分布を生成した場合、予測器サブシステム600は、その出力層によって生成されたスコア分布に従って出力層620の各々の属性カテゴリを選択する。例として、所与の出力層620に選択されるサンプルは、所与の出力層によって生成されたスコア分布における最高スコアを有するサンプルを選択することによって選択することができる。換言すれば、化学製品製剤装置におけるプロセッサは、スコア及び標的属性に基づいて、サンプル製剤のセットから、スコアのセットからの残りのスコアよりも大きいスコアを有するサンプル製剤を選択するように構成することができる。別の例として、所与の出力層620に選択されるサンプルは、所与の出力層によって生成されたスコア分布におけるそのスコアに従い、選択される各サンプルの尤度を重み付けすることにより、可能なサンプルをサンプリングすることによって選択することができる。幾つかの他の実装形態では、1つ又は複数の出力層620によって生成されるスコア分布は、その特定の層の出力として取り得る。
【0040】
[0047]
図1に戻ると、予測器140によって与えられた出力は、製剤セレクタ130に通信される。ここで、出力は、予測器サブシステム140の各出力層で予測器サブシステム140によって生成される出力の集合、例えばリスト又はセットとして取られる。
【0041】
[0048] 幾つかの実装形態では、生成器サブシステム120によって生成される化学データシーケンスは、弁別器サブシステム150(化学製品製剤装置100のメモリに記憶された命令に基づいて化学製品製剤装置100のプロセッサによって実行される)に通信されて入力として使用される。幾つかの実装形態では、弁別器サブシステム150は、リカレントサブネットワーク及び出力層(
図1に示されず)を含む。リカレントサブネットワーク及び出力層は、1つ又は複数の信号処理層(
図1に示されず)で構成され得る。幾つかの実装形態では、弁別器サブシステム150は、畳み込みサブネットワーク及び出力層(
図1に示されず)を含む。畳み込みサブネットワークは、1つ又は複数の信号処理層で構成され得、異なるフィルタサイズを有する幾つかの層を並列に使用し得る。例えば、畳み込みサブネットワークは、積層1D畳み込み層で構成することができる。一般に、弁別器サブシステム150又は弁別器は、入力として、先に定義したように化学データシーケンスを受け取り、出力として、複数の可能な選択肢の中から化学入力シーケンスによって製剤される製品の由来に関連付けられた分類を生成する。幾つかの実装形態では、弁別器150は、化学データシーケンスを入力として使用して、化学データシーケンスに関連付けられた由来を特定し、由来が所定のグループに含まれる(例えば、化学製品製剤装置によって生成されたもの対市場に現在存在する製品のセットのメンバであるもの)場合、レポートを生成するように構成される。
【0042】
[0049] サブネットワークは、入力化学データシーケンスを処理し、全体として現在の化学データシーケンスの代替表現を作成する。サブネットワークが入力化学データシーケンスの代替表現を生成した後、この代替表現は、入力として、入力化学データシーケンスの可能なソースにわたるスコア分布を生成する出力層によって受け取られる。
【0043】
[0050] 幾つかの実装形態では、弁別器サブシステム150は、出力層によって生成されるスコア分布に従って入力化学データシーケンスのソースを選択する。例として、所与の出力層に選択されるサンプルは、出力層によって生成されるスコア分布における最高スコアを有するサンプルを選択することによって選択することができる。別の例として、出力層に選択されるサンプルは、出力層によって生成されたスコア分布におけるそのスコアに従い、選択される各サンプルの尤度を重み付けすることにより、可能なサンプルをサンプリングすることによって選択することができる。幾つかの他の実装形態では、出力層によって生成されるスコア分布は、弁別器150の出力として取られ得る。
【0044】
[0051]
図1に示すように、弁別器150によって与えられる出力は、製剤セレクタ130に通信される。
【0045】
[0052] 生成器サブシステム120が化学データシーケンスを生成した後、これらの化学データシーケンスは、信号エンコーダ110によって符号化される標的属性信号111に加えて製剤セレクタ130に通信される。
【0046】
[0053] 製剤セレクタ130(化学製品製剤装置100のメモリに記憶された命令に基づいて化学製品製剤装置100のプロセッサによって実行される)は、入力化学データシーケンスを実現可能な化学製剤に変換することを担当する。幾つかの実装形態では、製剤に関連する全ての情報は、化学データシーケンスに符号化される。幾つかの他の実装形態では、化学データシーケンスは、製剤に関連する情報の幾つかの部分を含み、製剤セレクタ130は、変換プロセス中、任意の残りの情報を提供する。例えば、化学データシーケンスは、成分サンプル及び各時間ステップにおける対応するその濃度を含み得る。成分濃度が合計で100%にならない場合、製剤セレクタは、成分濃度が合計で100%になるように値をスケーリングし得る。その場合、製剤は、化学データシーケンスに見られる成分のリスト及び対応するそれらのスケーリングされた濃度値を含む。
【0047】
[0054] 製剤セレクタ130は、製剤セレクタの出力として取られる各入力化学データシーケンスに対応する化学製剤のサブセットを選択することを担当する。製剤セレクタ130は、広範囲の目的を達成するように、1つ又は複数の特定の製剤を選択し得る。幾つかの実装形態では、この選択は、標的属性信号111によって通知される。同様に言えば、製剤セレクタ130は、スコア分布及び標的属性に基づいて、スコア製剤のセットから、スコア分布からの残りのスコアよりも大きいスコアを有するサンプル製剤を選択するように構成することができる。サブセットは、空セットから、変換された化学データシーケンスのフルセットに及ぶことができる。製剤セレクタ130が、任意の構成の製剤セレクタ130の出力になる、変換された化学製剤のサブセットを決定し得る多くの可能な方法がある。例えば、装置が予測器も弁別器も含まない構成では、製剤セレクタは、単に、任意の数のランダムに選択された変換された化学製剤を選択し得る。
【0048】
[0055] 幾つかの実装形態では、化学製品製剤装置100が予測器サブシステム140を含むように構成される場合、製剤セレクタは、入力として、各化学データシーケンスに対応する予測属性値を受け取ることもできる。幾つかの実装形態では、化学製品製剤装置100が弁別器サブシステム150を含むように構成される場合、製剤セレクタ130は、入力として、各化学データシーケンスに対応する弁別器サブシステム150の出力を受け取ることもできる。幾つかの実装形態では、変換された化学製剤は、標的属性信号111の、標的属性信号111で見られるものに対応する予測器140及び/又は弁別器150の出力値とのマッチングを最良に最適化するように選択される。例えば、標的属性信号111が、所望のpH5を符号化する信号を含む場合、製剤は、それらの製剤に関連付けられた製剤pH値に対応する予測属性値がpH5に最も近いように選択され得る。換言すれば、化学製品製剤装置におけるプロセッサは、スコアのセット及び標的属性のセットに基づいて、サンプル製剤のセットから、スコアのセットからの残りのスコアよりも大きいスコアを有するサンプル製剤を選択するように構成することができる。
【0049】
[0056] 属性が数値である場合、属性値が標的値に可能な限り近い製品を製剤することが望ましい。例えば、pH値5を有する製品等の1つの標的属性を有する実施形態では、pH5.1を有する出力製品は、pH値6を有する出力製品よりも望ましいと見なされる。属性がカテゴリ値又は分類値である場合、標的カテゴリ若しくは分類に属する製品又は標的カテゴリ若しくは分類と同様の分類に属する製品を製剤することが望ましい。場合によっては、製剤セレクタ130が最適化する複数の上記標的属性があり得る。幾つかの実装形態では、標的属性は、最適化の重要性の順にランク付けされ得る。この場合、最適化は、標的属性ランク(又は標的属性の優先値)の順に行われ得、即ち、製剤は、最高ランクの標的属性で最適化され、次いで次に最も高いランクの属性で最適化される等である。例えば、一方がカテゴリであり、一方が数値である2つの標的属性にわたってそのように最適化するように構成された一実装形態は、まず、特定の製品カテゴリに属する製剤のみを選択し、次いでこのサブセットにわたって最適化し、標的数値属性値に最も近い製剤を選択し得る。幾つかの実装形態では、各標的属性は、重みを与えられ得、選択される製剤は、2つ以上の標的属性の加重結合を使用して決定される。例えば、そのように構成された実装形態は、加重結合を使用して、製品効能と製剤のコストとのバランスを取り得る。実施形態は、これらの構成に限定されず、他の実施形態では、製剤セレクタ130は、他の方法を使用して、1つ又は複数の標的属性にわたる最適化及び選択を実行し得る。
【0050】
[0057] 変換された化学製剤の選択されたサブセットは、製剤セレクタ130の出力として取られる。
図1は、製剤セレクタ130の1つのみのインスタンスを有する化学製品製剤装置100を示すが、実施形態は、この構成に限定されない。幾つかの他の実施形態では、化学製品製剤装置は、製剤セレクタの複数のインスタンスを含み得る。幾つかのそのような実施形態では、製剤セレクタは、並列に動作して、出力として1つ又は複数の化学製剤を生成する。化学製品製剤装置の出力は、全ての製剤セレクタサブシステムによって生成される化学製剤の集合として取られる。幾つかの実装形態では、化学製品製剤装置におけるプロセッサは、標的属性に関連付けられた変換された化学製剤の選択されたサブセットに関連付けられた情報を有するレポート(又は出力)を生成するように構成される。
【0051】
[0058] 幾つかの実施形態では、化学製品製剤装置におけるプロセッサは、所定の条件が満たされるまで、
図1~
図6に記載の1つ又は複数のステップの実行を繰り返すことができる。プロセッサは、サンプル製剤の新たなセットを決定し、サンプル製剤の新たなセットから新たなサンプル製剤を選択することによって繰り返すように構成することができる。所定の条件は、幾つかの実装形態では、ニューラルネットワークのインスタンスが、その特定の時間ステップで生成を停止できることを示す特定の化学データサンプルを生成することであり得る。所定の条件は、幾つかの実装形態では、特定の標的属性を有する化学データサンプルの生成であり得る。所定の条件は、幾つかの実装形態では、所定の時間期間の終了であり得る。
【0052】
[0059] 生成器サブシステム120が、所望の標的属性を有する化学製剤に変換すべき化学データシーケンスを生成するように調整するのに標的属性信号111を使用することに加えて、装置が使用される前に、ニューラルネットワーク生成器シーケンスサブシステムが、上記目的を達成する可能性がより高い化学データシーケンスを生成する傾向を有するように、ニューラルネットワーク生成器シーケンスサブシステムをトレーニングすることもできる。
図7は、サブシステムの一実施形態でニューラルネットワーク生成器シーケンスサブシステムをトレーニングする方法700を示す。方法700は、化学製品製剤装置(
図1の化学製品製剤装置100又は
図2の化学製品製剤装置200と同様)のメモリに記憶された命令に従って化学製品製剤装置のプロセッサによって実行することができる。
【0053】
[0060] ニューラルネットワーク生成器シーケンスサブシステムパラメータはランダムに初期化し得る(710)。幾つかの実施形態では、ニューラルネットワーク生成器シーケンスサブシステムは、サブシステムによって生成すべき化学データシーケンスが既知である入力のセットに対して、既知の機械学習トレーニング技法、例えばバックプロパゲーションを用いる確率的勾配降下を使用して、パラメータを有する全ての層でトレーニングされ得る(720)。例えば、入力は、先に製剤され、化学的に安定していることが分かっている既存の化学製品を表す化学データシーケンスであり得る。この場合、シーケンスの任意の時点において、生成すべき任意の特定の時間ステップにおける次の出力は、入力シーケンス中の次の時間ステップである。
【0054】
[0061] ニューラルネットワーク生成器シーケンスサブシステムは、730において、サブシステムによって生成される化学データシーケンスに対応する製剤が、標的属性信号を通して通信された所望の属性を示す可能性がより高くなるように、標的属性信号を使用して更にトレーニングすることができる。幾つかの実装形態では、これは、調整サブシステム又はチューナ(図示せず)と呼ばれる強化学習サブシステムの使用を通して達成される。チューナは、入力として標的属性信号及び生成器シーケンスサブシステム並びに以下:予測器サブシステムが存在する場合には予測器サブシステムの出力、弁別器サブシステムが存在する場合には弁別器サブシステムの1つ又は複数の出力を受け取るように構成される。チューナは、出力される化学データシーケンスによって表される製剤が、標的属性信号に符号化される所望の属性を示すように、ニューラルネットワーク生成器シーケンスサブシステムの出力を変更する(又は成分のスコアを増大させる)ことを目的として、ニューラルネットワーク生成器シーケンスサブシステムのニューラルネットワーク重みを変更するように構成される。幾つかの実装形態では、チューナ(又は化学製品製剤装置のメモリに記憶された命令に基づいてチューナを実行する化学製品製剤装置におけるプロセッサ)は、変更されたニューラルネットワークを生成するようにニューラルネットワークの重みを変更する。化学製品製剤装置におけるプロセッサは、変更されたニューラルネットワークに基づいて、変更された複数の成分を含む変更された化学データシーケンスを決定することができる。幾つかの実装形態では、チューナは、標的属性に関連付けられた優先値に基づいてニューラルネットワークの重みを変更することができる。例えば、化学製品製剤のpHレベルが化学製品製剤の粘度よりも高い優先度を有する場合、チューナは、所望のpHレベルを達成するようにニューラルネットワークの重みを変更することができる。調整サブシステムは、例えば、ポリシー勾配法を使用することにより、既知の強化学習技法を使用してトレーニングし得る。
【0055】
[0062]
図8は、所望の製剤属性を有する製品の化学製剤の方法800を示す。方法800は、化学製品製剤装置(
図1の化学製品製剤装置100又は
図2の化学製品製剤装置200と同様)のメモリに記憶された命令に従って化学製品製剤装置のプロセッサによって実行することができる。方法は、810で開始され、所望の属性の入力から標的属性信号を符号化する。次に、820において、1つ又は複数の化学データシーケンスが生成される。822において、化学データシーケンスによって表される製剤の属性が予測される。821において、化学データシーケンスによって表される製剤のソースが予測される。830において、生成された化学データシーケンスは、次いで、化学製剤に変換され、製剤のサブセットが出力として選択される。出力に選択される製剤は、標的信号並びに任意選択的な821及び822がそれぞれ存在する場合、それらの対応する予測された属性及び予測されたソースによって決定される。
【0056】
[0063] 本明細書に記載される実装形態、主題及び動作機能は、デジタル電子回路、有形コンピュータソフトウェア若しくはファームウェア、この説明で考察される構造及びそれらの構造的均等物を含むコンピュータハードウェア又は複数の実施形態の組合せで構築することができる。
【0057】
[0064] 本明細書に記載される本発明の実装形態、主題及び動作機能は、1つ又は複数のコンピュータプログラムとして構築することができる。「コンピュータプログラム」という用語は、データ処理装置によって実行されるか、又はデータ処理装置の動作を制御する有形非一時的プログラムキャリアに符号化されたコンピュータプログラム命令の1つ若しくは複数のモジュールを記述するために使用される。これらのプログラム命令は、機械生成の電気信号、光学信号又は電磁信号等のデジタル伝播信号に符号化することができる。これらの信号は、データ処理装置による実行のために適した受信機装置に送信するために、プログラム命令情報を符号化するのに生成される。コンピュータ記憶媒体は、機械可読記憶装置、機械可読記憶基板、ランダム若しくはシリアルアクセスメモリデバイス又はそれらの1つ若しくは複数の組合せであり得る。
【0058】
[0065] 「データ処理装置」という用語は、プログラマブルプロセッサ、コンピュータ又はこれらの組合せを含め、データを処理する多様な異なる装置、デバイス及び機械を包含する。装置は、FPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)等の専用論理回路を含むことができる。装置は、限定されないが、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム又はこれらの組合せを構成するコード等、対象のコンピュータプログラムを実行する環境を作り出すコードを含むこともできる。
【0059】
[0066] コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、モジュール、ソフトウェアモジュール、スクリプト又はコードと呼ばれるか又は記載されることもある)は、コンパイル型若しくはインタプリタ型言語又は宣言型若しくは手続き型言語を含め、任意の形態のプログラミング言語で記述することができ、独立型プログラム又はモジュール、コンポーネント、サブルーチン若しくは計算環境での使用に適する他のユニットとしてのものを含め、任意の形態で展開することができる。コンピュータプログラムは、ファイルシステム中のファイルに対応し得るが、そうである必要はない。プログラムは、他のプログラム又はデータを保持するファイルの一部分、例えばマークアップ言語ドキュメントに記憶された1つ若しくは複数のスクリプト、対象のプログラム専用の単一ファイル又は複数の連携ファイル、例えば1つ若しくは複数のモジュール、サブプログラム若しくはコードの部分を記憶するファイルに記憶することができる。コンピュータプログラムは、1つのコンピュータ又は一カ所に配置されるか若しくは複数の場所に分散し、通信ネットワークによって相互接続される複数のコンピュータで実行するように展開することができる。
【0060】
[0067] 本明細書に記載されたプロセス及び論理フローは、入力データに対して動作して出力を生成することにより、1つ又は複数のコンピュータプログラムを実行して機能を実行する1つ又は複数のプログラマブルコンピュータによって実行することができる。プロセス及び論理フローは、専用論理回路、例えばFPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)によって実行され得、装置は、専用論理回路、例えばFPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)として実施され得る。
【0061】
[0068] コンピュータプログラムの実行に適したコンピュータは、例として、汎用若しくは専用マイクロプロセッサ若しくは両方又は任意の他の種類の中央演算処理装置を含み、例として、汎用若しくは専用マイクロプロセッサ若しくは両方又は任意の他の種類の中央演算処理装置に基づき得る。一般に、中央演算処理装置は、命令及びデータを読み取り専用メモリ、ランダムアクセスメモリ又は両方から受け取る。コンピュータは、命令を実行又は遂行する中央演算処理装置と、命令及びデータを記憶する1つ又は複数のメモリデバイスとを含むことができる。一般に、コンピュータは、データを記憶する1つ若しくは複数の大容量記憶装置、例えば磁気ディスク、磁気光学ディスク若しくは光ディスクを含むこともできるか、又は動作可能に結合されて、データの受け取り、データの転送若しくは両方を行うこともできる。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。更に、コンピュータは、別のデバイス、例えば携帯電話、個人情報端末(PDA)、モバイルオーディオ若しくはビデオプレーヤ、ゲームコンソール、全地球測位システム(GPS)レシーバ又はポータブル記憶装置、少数の例を挙げれば、例えばユニバーサルシリアルバス(USB)、フラッシュドライブに組み込むことができる。
【0062】
[0069] コンピュータプログラム命令及びデータを記憶するコンピュータ可読媒体は、例として、半導体メモリデバイス、例えばEPROM、EEPROM及びフラッシュメモリデバイス;磁気ディスク、例えば内部ハードディスク又はリムーバブルディスク;磁気光学ディスク;及びCD ROM及びDVD-ROMディスクを含む全ての形態の不揮発性メモリ、メディア及びメモリデバイスを含む。プロセッサ及びメモリは、専用論理回路によって補足することができるか、又は専用論理回路に組み込むことができる。
【0063】
[0070] ユーザとの対話を提供するために、本明細書に記載の主題の実施形態は、情報をユーザに表示するディスプレイデバイス、例えばCRT(陰極線管)又はLCD(液晶ディスプレイ)モニタと、ユーザ入力をコンピュータに提供できるようにするキーボード及びポインティングデバイス、例えばマウス又はトラックボールとを有するコンピュータで実施することができる。他の種類のデバイスを使用して、ユーザとの対話を提供することも同様に可能であり、例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック、例えば視覚フィードバック、聴覚フィードバック又は触覚フィードバックであり得、ユーザからの入力は、音響入力、発話入力又は触覚入力を含め、任意の形態で受け取ることができる。加えて、コンピュータは、ユーザによって使用されるデバイスにドキュメントを送信し、ユーザによって使用されるデバイスからドキュメントを受け取ることにより、例えばウェブブラウザから要求を受け取ったことに応答して、ウェブページをユーザのクライアントデバイスのウェブブラウザに送信することによってユーザと対話することができる。
【0064】
[0071] 本明細書に記載の実施形態は、例えば、データサーバとしてバックエンド構成要素を含むか、又はミドルウェア構成要素、例えばアプリケーションサーバを含むか、又はフロントエンド構成要素、例えばユーザが本明細書に記載の主題の実装形態と対話できるようにするグラフィカルユーザインターフェース若しくはウェブブラウザを有するクライアントコンピュータを含むか、又は1つ若しくは複数のそのようなバックエンド、ミドルウェア若しくはフロントエンド構成要素の任意の組合せを含む計算システムで実施することができる。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信、例えば通信ネットワークによって相互接続することができる。通信ネットワークの例には、ローカルエリアネットワーク(「LAN」)及び広域ネットワーク(「WAN」)、例えばインターネットがある。
【0065】
[0072] 計算システムは、クライアント及びサーバを含むことができる。クライアント及びサーバは、一般に、互いからリモートであり、典型的には通信ネットワークを通して対話する。クライアントとサーバとの関係は、各コンピュータで実行され、互いに対してクライアント-サーバ関係を有するコンピュータプログラムによって生じる。
【0066】
[0073] 本明細書は、多くの具体的な実装形態の詳細を含むが、これらは、本開示の範囲又は特許請求され得るものの範囲への限定として解釈されるべきではなく、むしろ特定の実施形態に固有であり得る特徴の説明として解釈されるべきである。別個の実施形態に関して本明細書に記載された特定の特徴は、単一の実施形態で組み合わせて実施することもできる。逆に、単一の実施形態に関して記載された種々の特徴は、複数の実施形態で別個に又は任意の適した下位組合せで実施することもできる。更に、特徴は、特定の組合せにおいて作用するとして上述され、そのように請求項に最初に記載され得るが、請求項に記載された組合せからの1つ又は複数の特徴は、幾つかの場合、その組合せから削除することができ、請求項に記載された組合せは、下位組合せ又は下位組合せの変形形態を対象とすることも可能である。
【0067】
[0074] 同様に、動作は、図面において特定の順序で示されるが、これは、所望の結果を達成するために、そのような動作が示された特定の順序で若しくは順次実行されること又は示された全ての動作が実行されることを必要とするものとして理解されるべきではない。特定の状況では、マルチタスク及び並列処理が有利であり得る。更に、上述した実施形態における種々のシステムモジュール及び構成要素の分離は、全ての実施形態においてそのような分離が必要とされるものとして理解されるべきではなく、記載されたプログラム構成要素及びシステムは、一般に、単一のソフトウェア製品に一緒に統合することができるか、又は複数のソフトウェア製品にパッケージできることが理解されるべきである。
【0068】
[0075] 特定の実装形態、主題及びその動作機能について説明した。また、添付の概略図に示されるプロセスは、所望の結果を達成するために、示される特定の順序又は連続的な順序を必ずしも必要としない。特定の実装形態に関連して、マルチタスク及び並列処理が有利であり得る。
【国際調査報告】