(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-25
(54)【発明の名称】埋め込み空間に埋め込みを生成するための電子化学センサの較正
(51)【国際特許分類】
G01N 33/00 20060101AFI20240618BHJP
G06N 20/00 20190101ALI20240618BHJP
【FI】
G01N33/00 C
G06N20/00 130
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023571289
(86)(22)【出願日】2022-05-04
(85)【翻訳文提出日】2023-11-16
(86)【国際出願番号】 US2022027629
(87)【国際公開番号】W WO2022245543
(87)【国際公開日】2022-11-24
(32)【優先日】2021-05-17
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】523174538
【氏名又は名称】オズモ ラブズ, ピービーシー
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ウィルトシュコ, アレクサンダー
(57)【要約】
電子化学センサは、化合物の感知に応じて電気信号の生データを出力できるが、電気信号の生データを解釈するのが難しい場合がある。電気信号データを機械学習済モデルで処理して埋め込み空間に埋め込み出力を生成すると、電気信号データをより良く理解できるようになる。さらに、既存の化学特性予測モデルを利用して埋め込み空間に他の埋め込みを生成することが、電気信号データのより正確かつ効率的な分類タスクを可能にする。本開示の1つの例示的な態様は、コンピューティングシステムを対象とする。
【選択図】
図4
【特許請求の範囲】
【請求項1】
コンピューティングシステムであって、
環境の1つ以上の化合物の存在を示す電気信号を生成するように構成されたセンサ、
前記電気信号を受信して処理し、埋め込み空間に埋め込みを生成するようにトレーニングされる、機械学習済モデルであって、
前記機械学習済モデルは、複数のトレーニングの例を含むトレーニングデータセットを使用してトレーニングされ、各トレーニングの例は、1つ以上のトレーニング用化合物にさらされたときに1つまたは複数のテストセンサによって生成される電気信号のセットに適用されるグラウンドトゥルース特性ラベルを含み、各グラウンドトゥルース特性ラベルは、前記1つ以上のトレーニング用化合物の特性を記述する、前記機械学習済モデル、
1つまたは複数のプロセッサ、及び
前記1つまたは複数のプロセッサによって実行されるときに、前記コンピューティングシステムに動作を実行させる命令をまとめて格納する、1つまたは複数の非一時的なコンピュータ可読媒体を含み、前記動作は、
前記センサによって、前記環境の特定の化合物の存在を示すセンサデータを生成すること、及び
前記1つまたは複数のプロセッサによって、前記機械学習済モデルを用いて前記センサデータを処理して、前記埋め込み空間に埋め込み出力を生成すること、
を含む、前記コンピューティングシステム。
【請求項2】
前記埋め込み出力に基づいてタスクを実行することをさらに含む、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項3】
前記タスクが、前記埋め込み出力に基づいて感覚特性予測を提供することを含む、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項4】
前記タスクが、前記埋め込み出力に基づいて嗅覚特性予測を提供することを含む、いずれかの先行請求項に記載のコンピュータシステム。
【請求項5】
前記タスクは、前記埋め込み出力に少なくとも部分的に基づいて疾患の状態を特定することである、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項6】
前記タスクは、前記埋め込み出力に少なくとも部分的に基づいて悪臭の状態を判定することである、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項7】
前記タスクは、前記埋め込み出力に少なくとも部分的に基づいて腐敗が発生したかどうかを判定することである、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項8】
前記タスクは、人間が入力したラベルを表示用に提示することを含み、前記人間が入力したラベルは、前記埋め込み空間の前記埋め込み出力との関連付けによって判定される、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項9】
前記人間が入力したラベルは、特定の食品の名前を記述するものである、請求項8に記載のコンピューティングシステム。
【請求項10】
前記機械学習済モデルは、グラフニューラルネットワークと共同でトレーニングされ、トレーニングは、前記機械学習済モデルと前記グラフニューラルネットワークを共同でトレーニングして、前記埋め込み空間内部で単一の結合された出力を生成することを含む、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項11】
前記グラフニューラルネットワークは、前記特定の化合物のグラフベースの表現を入力として受け取り、前記埋め込み空間のそれぞれの埋め込みを出力するようにトレーニングされる、請求項10に記載のコンピューティングシステム。
【請求項12】
前記機械学習済モデルは、
電気信号トレーニングデータ及びそれぞれのトレーニングラベルを含む化合物トレーニングの例を取得することであって、前記電気信号トレーニングデータ及び前記それぞれのトレーニングラベルは特定のトレーニング用化合物を記述するものである、前記取得すること、
前記機械学習済モデルを用いて前記電気信号トレーニングデータを処理して、化合物の埋め込み出力を生成すること、
分類モデルを用いて前記化合物の埋め込み出力を処理して、化合物ラベルを判定すること、
前記化合物ラベルと前記それぞれのトレーニングラベルとの間の差を評価する損失関数を評価すること、及び
前記損失関数に少なくとも部分的に基づいて、前記機械学習済モデルの1つまたは複数のパラメータを調整すること、によりトレーニングされている、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項13】
前記機械学習済モデルは、教師あり学習によってトレーニングされている、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項14】
前記センサデータは、電圧または電流のうちの少なくとも1つを記述する、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項15】
前記機械学習済モデルは、トランスフォーマモデルを含む、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項16】
前記埋め込み出力を格納することをさらに含む、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項17】
前記センサデータは、1つ以上の電気信号の電圧または電流の一方または両方の振幅を記述する、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項18】
前記1つまたは複数のプロセッサによって、前記機械学習済モデルを用いて前記センサデータを処理して、前記埋め込み空間に前記埋め込み出力を生成することは、前記センサデータを固定の長さのベクトル表現に圧縮することを含む、いずれかの先行請求項に記載のコンピューティングシステム。
【請求項19】
コンピュータ実装方法であって、
1つまたは複数のプロセッサを備えるコンピューティングシステムによって、1つまたは複数のセンサでセンサデータを取得することであって、前記センサデータは、環境の1つまたは複数の化合物の存在によって生成される電気信号を記述する、前記取得すること、
前記コンピューティングシステムにより、機械学習済モデルを用いて前記センサデータを処理し、埋め込み空間に埋め込み出力を生成することであって、前記機械学習済モデルは、電気信号を記述するデータを受信して処理し、前記埋め込み空間に埋め込みを生成するようトレーニングされる、前記生成すること、
前記コンピューティングシステムによって、前記埋め込み空間の前記埋め込み出力に関連付けられた1つまたは複数のラベルを判定すること、及び
前記コンピューティングシステムによって、表示用の前記1つまたは複数のラベルを提示すること、
を含む、前記方法。
【請求項20】
1つまたは複数のプロセッサによって実行されるときに、コンピューティングシステムに動作を実行させる命令をまとめて格納する、1つまたは複数の非一時的なコンピュータ可読媒体であって、前記動作は、
1つまたは複数のセンサでセンサデータを取得することであって、前記センサデータは、環境の1つまたは複数の化合物の存在によって生成される電気信号を記述する、前記取得すること、
機械学習済モデルを用いて前記センサデータを処理し、埋め込み空間に埋め込み出力を生成することであって、前記機械学習済モデルは、電気信号を記述するデータを受信して処理し、前記埋め込み空間に埋め込みを生成するようにトレーニングされる、前記生成すること、
複数の格納された感覚特性データセットを取得することであって、前記複数の格納された感覚特性データセットは、前記それぞれの格納された埋め込みに関連付けられたそれぞれの感覚特性データセットと対になった、前記埋め込み空間の格納された埋め込みを含む、前記取得すること、
前記埋め込み空間の前記埋め込み出力及び前記複数の格納された感覚特性データセットに基づいて1つまたは複数の感覚特性を判定すること、及び
表示用に前記1つまたは複数の感覚特性を提示すること、
を含む、1つまたは複数の非一時的なコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2021年5月17日に提出された米国仮特許出願第63/189,501号に対する優先権及び利益を主張する。米国仮特許出願第63/189,501号は、その全体が参照により本明細書に組み込まれる。
【0002】
本開示は、一般に、化学分子の表現を検出及び/または生成するためのセンサデータの処理に関する。より具体的には、本開示は、センサデータを生成すること、機械学習済モデルでセンサデータを処理して埋め込み出力を生成すること、及び埋め込み出力を使用して様々なタスクを実行することに関する。
【背景技術】
【0003】
コンピューティングデバイスはビジュアルコンピューティングまたはオーディオ処理に使用できるが、コンピューティングデバイスは匂いを確実に感知することができない。利用可能な化学センサはあるが、それらは解釈が難しい生の信号を生成する。化学センサは、可能性のある匂いの空間全体にわたって、生の信号を「オレンジ」または「シナモン」などの人間が解釈できるラベルに変換することはできない。一部のコンピューティングデバイスは、個人のトレーニングに基づいて匂いの小規模なサブセットを判断するように構成されているが、これらのコンピューティングデバイスはトレーニングされていない特性を判断できない。
【0004】
さらに、考えられるすべての匂いを個別にトレーニングすることは、時間がかかり、最終的に構成された後に計算負荷がかかり、そのようなトレーニングの後でも、既知の匂いの組み合わせを判定することはできない。香りは入力されたデータとのみ関連付けられ、新しい混合物の嗅覚特性を判定することは不可能になる。
【発明の概要】
【課題を解決するための手段】
【0005】
本開示の実施形態の態様及び利点は、以下の説明に部分的に記載されるか、説明から知ることができるか、または実施形態の実践を通じて知ることができる。
【0006】
本開示の1つの例示的な態様は、コンピューティングシステムを対象とする。コンピューティングシステムは、環境の1つまたは複数の化合物の存在を示す電気信号を生成するよう構成されるセンサ、及び電気信号を受信及び処理して埋め込み空間に埋め込みを生成するようにトレーニングされる機械学習済モデルを含むことができる。いくつかの実施態様では、機械学習済モデルは、複数のトレーニングの例を含むトレーニングデータセットを使用してトレーニングされていてもよく、各トレーニングの例は、1つ以上のトレーニング用化合物にさらされたときに1つまたは複数のテストセンサによって生成される電気信号のセットに適用されるグラウンドトゥルース特性ラベルを含む。各グラウンドトゥルース特性ラベルは、1つ以上のトレーニング化合物の特性を記述することができる。コンピューティングシステムは、1つまたは複数のプロセッサと、1つまたは複数のプロセッサによって実行されるときに、コンピューティングシステムに動作を実行させる命令をまとめて格納する、1つまたは複数の非一時的なコンピュータ可読媒体とを含むことができ、その動作は、環境の特定の化合物の存在を示すセンサデータをセンサによって生成すること、及び埋め込み空間への埋め込み出力を生成するために、機械学習済モデルを用いてセンサデータを1つまたは複数のプロセッサによって処理することが含まれ得る。
【0007】
いくつかの実施態様では、動作は、埋め込み出力に基づいてタスクを実行することを含み得る。タスクには、埋め込み出力に基づいて感覚特性予測を提供することが含まれ得る。いくつかの実施態様では、タスクは、埋め込み出力に基づいて嗅覚特性予測を提供することを含み得る。タスクは、埋め込み出力に少なくとも部分的に基づいて疾患の状態を特定することである場合がある。いくつかの実施態様では、タスクは、埋め込み出力に少なくとも部分的に基づいて悪臭の状態を判定することであり得る。タスクは、埋め込み出力に少なくとも部分的に基づいて腐敗が発生したかどうかを判定することであり得る。タスクは、人間が入力したラベルを表示用に提示することを含み得、人間が入力したラベルは、埋め込み空間の埋め込み出力との関連付けによって判定され得る。人間が入力したラベルは、特定の食品の名前を記述するものにすることができる。
【0008】
いくつかの実施態様では、機械学習済モデルは、グラフニューラルネットワークと共同でトレーニングすることができ、トレーニングは、機械学習済モデルとグラフニューラルネットワークを共同でトレーニングして、埋め込み空間内部で単一の結合された出力を生成することを含み得る。グラフニューラルネットワークは、特定の化合物のグラフベースの表現を入力として受け取り、埋め込み空間のそれぞれの埋め込みを出力するようにトレーニングされ得る。
【0009】
いくつかの実施態様では、機械学習済モデルは、電気信号トレーニングデータ及びそれぞれのトレーニングラベルを含む化合物トレーニングの例を取得することによって、トレーニングされている可能性がある。電気信号トレーニングデータとそれぞれのトレーニングラベルは、特定のトレーニング化合物を記述することができる。機械学習済モデルは、電気信号トレーニングデータを機械学習済モデルで処理して化合物埋め込み出力を生成すること、化合物埋め込み出力を分類モデルで処理して化合物ラベルを判定すること、化合物ラベルとそれぞれのトレーニングラベルの間の差を評価する損失関数を評価すること、及び損失関数に少なくとも部分的に基づいて、機械学習済モデルの1つ以上のパラメータを調整すること、によってトレーニングされている可能性がある。
【0010】
いくつかの実施態様では、機械学習済モデルは教師あり学習でトレーニングできる。センサデータは、電圧または電流の少なくとも1つを記述することができる。機械学習済モデルにはトランスフォーマモデルを含めることができる。いくつかの実施態様では、動作は、埋め込み出力を格納することを含み得る。センサデータは、1つ以上の電気信号の電圧または電流の一方または両方の振幅を記述することができる。1つまたは複数のプロセッサによって、機械学習済モデルを用いてセンサデータを処理して、埋め込み空間に埋め込み出力を生成することは、センサデータを固定の長さのベクトル表現に圧縮することを含み得る。
【0011】
本開示の別の例示的な態様は、コンピュータ実装方法を対象とする。この方法は、1つまたは複数のプロセッサを含むコンピューティングシステムによって、1つまたは複数のセンサでセンサデータを取得することを含むことができる。いくつかの実施態様では、センサデータは、環境に1つまたは複数の化合物が存在するために生成される電気信号を記述することができる。方法は、コンピューティングシステムによって、機械学習済モデルを用いてセンサデータを処理して、埋め込み空間に埋め込み出力を生成することを含むことができる。機械学習済モデルは、電気信号を記述するデータを受信して処理し、埋め込み空間に埋め込みを生成するようにトレーニングできる。方法は、コンピューティングシステムによって、埋め込み空間の埋め込み出力に関連付けられた1つまたは複数のラベルを判定すること、及びコンピューティングシステムによって、表示用の1つまたは複数のラベルを提示することを含むことができる。
【0012】
本開示の別の例示的な態様は、1つまたは複数のプロセッサによって実行されるときに、コンピューティングシステムに動作を実行させる命令をまとめて格納する、1つまたは複数の非一時的なコンピュータ可読媒体を対象とする。動作には、1つまたは複数のセンサを使用してセンサデータを取得することが含まれ得る。いくつかの実施態様では、センサデータは、環境に1つまたは複数の化合物が存在するために生成される電気信号を記述することができる。方法は、機械学習済モデルを用いてセンサデータを処理して、埋め込み空間に埋め込み出力を生成することを含むことができる。機械学習済モデルは、電気信号を記述するデータを受信して処理し、埋め込み空間に埋め込みを生成するようにトレーニングできる。動作は、複数の格納された感覚特性データセットを取得することを含むことができ、複数の格納された感覚特性データセットは、それぞれの格納された埋め込みに関連付けられたそれぞれの感覚特性データセットと対になった、埋め込み空間の格納された埋め込みを含むことができる。動作は、埋め込み空間の埋め込み出力及び複数の格納された感覚特性データセットに基づいて1つまたは複数の感覚特性を判定すること、及び表示のために1つまたは複数の感覚特性を提示することを含むことができる。
【0013】
本開示の他の態様は、様々なシステム、装置、非一時的なコンピュータ可読媒体、ユーザインターフェース、及び電子デバイスを対象とする。
【0014】
本開示の様々な実施形態のこれら及び他の特徴、態様及び利点は、以下の説明及び添付の請求項を参照すると、よりよく理解される。この明細書に組み込まれ、この明細書の一部を構成する添付の図面は、本開示の例示的な実施形態を示し、この説明と併せて、関連する原理を説明するよう機能する。
【0015】
当業者に向けられた、添付の図を参照する実施形態の詳細な説明が、本明細書に記載されている。
【図面の簡単な説明】
【0016】
【
図1A】本開示の例示的な実施形態によるセンサデータ処理を実行する例示的なコンピューティングシステムのブロック図を示す。
【
図1B】本開示の例示的な実施形態によるセンサデータ処理を実行する例示的なコンピューティングデバイスのブロック図を示す。
【
図1C】本開示の例示的な実施形態によるセンサ処理を実行する例示的なコンピューティングデバイスのブロック図を示す。
【
図2】本開示の例示的な実施形態による例示的な分類プロセスのブロック図を示す。
【
図3】本開示の例示的な実施形態による、例示的な電子化学センサシステムのブロック図を示す。
【
図4】本開示の例示的な実施形態による例示的なトレーニングプロセスのブロック図を示す。
【
図5】本開示の例示的な実施形態による例示的なセンサデータ機械学習済モデル処理のブロック図を示す。
【
図6】本開示の例示的な実施形態によるセンサデータ処理を実行する例示的な方法のフローチャートの図表を示す。
【
図7】本開示の例示的な実施形態によるセンサデータ処理を実行する例示的な方法のフローチャートの図表を示す。
【
図8】本開示の例示的な実施形態による機械学習済モデルトレーニングを実行する例示的な方法のフローチャートの図表を示す。
【
図9】本開示の例示的な実施形態による例示的なトレーニングプロセスのブロック図を示す。
【発明を実施するための形態】
【0017】
複数の図にわたって繰り返される参照番号は、様々な実装において同じ特徴を特定することを意図している。
【0018】
概要
一般に、本開示は、化学分子の存在を記述するセンサデータの処理に関する。システム及び方法は、電気信号処理のために使用して、電子化学センサデバイスから得られたセンサデータを解釈することを可能にすることができる。本明細書に開示されるシステム及び方法は、トレーニングされた機械学習済モデルを利用してセンサデータを処理し、その後、様々なタスクを実行するために使用できる埋め込み空間に、埋め込み出力を生成することができる。機械学習済モデルのトレーニングでは、グラウンドトゥルースデータセットを使用でき、既存の化学分子特性データのデータベースを利用することもできる。
【0019】
より具体的には、いくつかの実施態様では、本明細書に開示されるシステムは、電気信号を生成するように構成されたセンサを含むことができる。電気信号は、環境の1つまたは複数の化合物の存在を示すことができ、機械学習済モデルは、電気信号を受信及び処理して埋め込み空間に埋め込みを生成するようにトレーニングすることができる。機械学習済モデルは、複数のトレーニングの例を含むトレーニングデータセットを使用して、トレーニングすることができる。トレーニングの例には、1つ以上のトレーニング化合物にさらされたときにセンサによって生成される、電気信号のそれぞれのセットに適用される、グラウンドトゥルース特性ラベルを含めることができる。グラウンドトゥルース特性ラベルは、1つ以上のトレーニング化合物の特性を記述することができる。さらに、システムは、1つまたは複数のプロセッサと、1つまたは複数のプロセッサによって実行されるときに手持ち式遠隔制御デバイスに動作を実行させる命令をまとめて格納する、1つまたは複数の非一時的なコンピュータ可読媒体とを、含むことができる。これらのコンポーネントを含めると、センサが電気信号に基づいてセンサデータを生成し、次いで機械学習済モデルで処理して埋め込み空間に埋め込み出力を生成できるようにすることができる。より具体的には、本明細書に開示されるシステム及び方法は、センサの化学的特徴が環境内の化合物と反応するときに生成される電気信号を記述するセンサデータを生成するために使用することができる。センサデータは、次いで、機械学習済モデルによって処理されて、埋め込み空間に埋め込み出力を生成することができる。いくつかの実施態様では、埋め込み空間は、電気信号に基づいて生成された埋め込み、及び化合物のグラフ表現に基づいて生成された埋め込みによって、定着(populate)させることができる。さらに、いくつかの実施態様では、埋め込み空間には、人間の入力または自動予測に基づいて生成され得る、化学的混合物の名前または特性を説明する埋め込みラベルを定着させることができる。
【0020】
いくつかの実施態様では、システム及び方法は、埋め込み出力に基づいてタスクを実行することをさらに含むことができる。タスクには、分類出力の提供、特性予測の判定、アラートの提示、及び/または埋め込み出力の保存が含まれ得る。例えば、埋め込み出力を処理して1つ以上の特性予測を判定し得、それを次いでユーザに表示するために提示することができる。特性予測は、嗅覚特性予測または揮発性予測などの感覚特性予測であり得、これらを判定して危険な化学警報を提示することにつながり得る。
【0021】
いくつかの実施態様では、機械学習済モデルは、電気信号データセット及びそれぞれのトレーニングラベルを含む複数のトレーニングの例を取得することによって、トレーニングすることができる。電気信号トレーニングデータセットとそれぞれのトレーニングラベルは、特定の化合物を記述することができる。電気信号を処理して埋め込み出力を生成できる。次に、埋め込み出力を分類モデルによって処理して、各電気信号データセットのそれぞれの化合物ラベルを判定できる。結果のラベルをグラウンドトゥルースラベルと比較して、機械学習済モデルのパラメータを調整する必要があるかどうかを判断できる。さらに、一部の実施態様では、機械学習済モデルは、グラフ表現または電気信号を使用して埋め込みを生成するために、グラフニューラルネットワーク(GNN)モデルと共同でトレーニングさせてもよく、それは次いで、分類タスクに使用することができる。一部の実施態様では、トレーニングに教師あり学習を含めることができる。
【0022】
トレーニングされた機械学習済モデルは、次に、電気信号に基づいたサンプルの特性の予測、作物が疾患にかかっているかどうかの判断、食品の腐敗の特定、疾患の診断、悪臭の有無の判断など、様々なタスクに使用できる。機械学習済モデルは、電気化学センサデバイスの一部としてコンピューティングデバイスにローカルに格納することができるか、または、より大きなコンピューティングシステムの一部として保存してアクセスすることができる。システムとプロセスは、個人使用、商用使用、または産業用途で様々な用途に使用できる。
【0023】
電子化学センサは、1つ以上のセンサと、任意選択で、1つ以上のプロセッサを含むことができる。デバイスは1つまたは複数のセンサを使用して、環境を記述するセンサデータを取得できる。センサデータは、環境内の化合物を記述し得る。いくつかの実施態様では、センサデータを処理して、混合物の組成を判定することができる。センサデータを機械学習済モデルで処理して、混合物を判定できる。混合物の判定には、センサデータを処理して埋め込みを生成し、それを次いで分類モデルで処理して、混合物の組成を判定することが含まれ得る。いくつかの実施態様では、判定プロセスは、ラベル付き埋め込みを使用して生成された、ラベル付き埋め込み空間を利用することができる。判定された混合物は、ラベル付けされた埋め込み空間の判定された1つまたは複数の混合物ラベルに基づいて判定され得る。
【0024】
混合物または特性を判定するために電子化学センサデバイスを較正することは、複数の混合物データセットを取得することを含むことができる。混合物データセットは、それぞれの混合物の1つ以上の感覚特性を記述することができる。複数の混合物の各混合物について、1つまたは複数の混合物ラベルを取得することができる。複数の混合物データセットを機械学習済モデルで処理して、複数の混合物埋め込みを生成することができる。各混合物埋め込みは、それぞれの混合物データセットに関連付けることができる。次いで、複数の埋め込みを、それぞれの混合物ラベルと対にさせることができる。ラベル付き埋め込みを使用して、ラベル付き埋め込み空間を生成できる。
【0025】
いくつかの実施態様では、混合物ラベルは、人間が入力したラベルであってもよい。いくつかの実施態様では、システムは、較正のために人間がラベル付けした正確なセンサデータ(例えば、人間がラベル付けした臭気データ)を収集することができる。較正された電子化学センサデバイスは、次いで、各分子の濃度が異なる可能性のある分子の混合物で構成される化学物質を検出できる。いくつかの実施態様では、1つまたは複数のセンサは、センサデータを生成できる鼻用電子センサを含むことができる。センサデータは電子信号を記述する場合がある。1つまたは複数のセンサには、カーボンナノチューブ、DNA結合カーボンナノチューブ、カーボンブラックポリマー、光感受性化学センサ、シリコンと結合した生体センサによって構築されたセンサ、幹細胞から培養されたまたは生物から採取された嗅覚ニューロン、嗅覚受容体及び/または、金属酸化物センサが含まれ得るが、これらに限定されない。結果として得られるセンサデータは、電圧データまたは電流データを含む生データである可能性がある。
【0026】
いくつかの実施態様では、人間のラベルと電子信号の両方を同一のサンプル、またはかなり類似したサンプルで収集できる実験を、較正に使用することができる。いくつかの実施態様では、機械学習済モデルは、複数の感覚データセット及び複数の混合物ラベルを含むグラウンドトゥルーストレーニングデータを使用してトレーニングすることができる。機械学習済モデルには、1つまたは複数のトランスフォーマモデル及び/または1つまたは複数のGNN埋め込みモデルが含まれ得る。
【0027】
さらに、電子化学センサデバイスの較正は、人間のラベルを埋め込み空間(例えば、匂い埋め込み空間)にマッピングすることを含むことができる。マッピングにはトレーニング済みのGNNを利用できる。そのとき、デバイスの使用には、得られた電気信号を埋め込み空間にマッピングすることが含まれ得る。マッピングされた位置(つまり、埋め込み空間の値)を使用して、「シナモン」、「キュウリ」、「リンゴ」、及び「糞便」などの人間のラベルが付いた匂い、またはその他の感覚特性を自動的に認識できる。電気信号のマッピングは、ディープニューラルネットワークを使用して、電子鼻信号でトレーニングされたGNNを使用して実行できる。いくつかの実施態様では、埋め込みをRGB番号付けと同様に構成できる。いくつかの実施態様では、センサデータ及び埋め込み空間を処理することは、機械学習済モデルを用いてセンサデータを処理して埋め込みを生成すること、埋め込みを埋め込み空間にマッピングすること、及び1つ以上の混合物ラベルに関連する埋め込みの位置に基づいて、一致するラベルを判定することを含むことができる。
【0028】
人間のラベルの予測精度は、電子センサ信号で評価できる。「シナモン」などの特定の人間のラベルについて精度が低い場合は、センサがその匂いを正確に検出できないことを示し得る。特定のラベルの精度が高い場合は、センサがその匂いを正確に検出できることを示し得る。
【0029】
いくつかの実施態様では、電子化学センサは、カメラが赤と緑の両方の色を感知できる方法と同様に、多数の別個の感知要素で構成することができる。人間のラベル付きデータと電子信号データを共に収集するこのシステムを使用して、システムは、新しい感知要素(カメラがこのとき青色を感知できるようになったと仮定)が、人間が認識できる匂いの空間をカバーする能力を向上させるかどうか、または特定の匂いラベルを認識する能力を向上させるかどうかを評価できる。
【0030】
人間が定義した臭気ラベルを認識する代わりに、システムは代わって、特徴的な臭気を発する、疾患状態にある人間、動物、または植物の存在もしくは非存在として、ラベルを定義することもできる。
【0031】
いくつかの実施態様では、本明細書に開示されるシステム及び方法は、収集されたセンサデータに基づいて、食品または特定のフレーバーを特定するために実装され得る。例えば、オレンジジュースの入ったグラスをセンサの下に置き、1つ以上の化学物質への曝露を記述するセンサデータを生成できる。センサデータは、機械学習済モデルによって処理されて、埋め込み空間に埋め込み出力を生成することができる。埋め込み出力は、次いで食品ラベル及び/またはフレーバーラベルを判定するために使用できる。例えば、埋め込み出力は、オレンジラベルまたはオレンジジュースラベルと組み合わせた埋め込みに最も類似していると判断できる。いくつかの実施態様では、埋め込み出力を分析して、感知された化学物質が柑橘系のフレーバーを示していると判定することができる。食品の種類とフレーバーの判定には、分類モデル、閾値の判定、及び/またはラベル付けされた埋め込み空間またはマップの分析が含まれ得る。
【0032】
本明細書に開示されるシステム及び方法の別の例示的使用には、人間の診断、動物の診断、または植物の診断のための診断センサの有効化が含まれ得る。特定の化学物質の存在は、特定の疾患の状態を示し得る。例えば、人間の呼気に見出せる化合物は、特定の病や疾患(胃食道逆流症、歯周炎、歯周病、糖尿病、肝臓や腎臓の疾患など)の存在や段階に関する貴重な情報を提供する可能性がある。したがって、いくつかの実施態様では、センサデータは、口から吐き出された、または患者からサンプルとして採取された化学物質への曝露を記述することができる。センサデータは、機械学習済モデルによって処理されて、埋め込み出力を生成することができる。埋め込み出力は、感知された疾患状態を示す埋め込みと比較することができ、または疾患状態を示す化学物質が存在するかどうかを判断するための診断用にトレーニングされた分類ヘッドによって処理することもできる。分類ヘッドの出力には、1つまたは複数の疾患状態のそれぞれが存在する確率が含まれ得る。
【0033】
電子化学センサデバイスは、コンロや排気フードなどの調理器具に実装して、調理を支援し、調理プロセスに関するアラートを提示することができる。いくつかの実施態様では、電子化学センサデバイスを実装して、焦げた食品を示す化学物質が存在するというアラートを提示することができる。例えば、埋め込み出力を分類ヘッドに入力することができ、それは埋め込み出力を処理して、焦げた食品が存在する確率を判定する。確率が閾値確率を超える場合、アラートがアクティブ化され得る。
【0034】
さらに、いくつかの実施態様では、トレーニング済み機械学習済モデルを備えた電子化学センサデバイスを地上車両や低空飛行UAVなどの農業機器に実装して、病気の作物の存在を検出すること、または植物が収穫に際して熟しているかどうかを検出することができる。例えば、埋め込み出力を分類ヘッドに入力することができ、それは埋め込み出力を処理して、植物が収穫に際して熟している確率を判定する。
【0035】
いくつかの実施態様では、本明細書に開示されるシステム及び方法は、機械を制御し、及び/またはアラートを提示するために使用され得る。システム及び方法は、製造機械を制御してより安全な作業環境をもたらしたり、混合物の組成を変更して所望の生産量をもたらしたりするために使用することができる。さらに、いくつかの実施態様では、リアルタイムのセンサデータを生成及び処理して、アラート(例えば、危険な状態、食品の腐敗、疾患の状態、異臭などを示すアラート)を提示する必要があるかどうかを判定するために分類できる埋め込み出力を生成することができる。例えば、いくつかの実施態様では、判定された分類には、輸送サービスに使用される車両の香りについての嗅覚特性予測などの特性予測が含まれてもよい。次いで、分類を処理して、いつ新しい香り製品を輸送デバイスに配置すべきか、及び/または輸送デバイスが清掃ルーチンを受けるべきかどうかを判定することができる。悪臭が存在するという判定は、そのとき、ユーザのコンピューティングデバイスにアラートとして送信され得るか、自動購入を設定するために使用され得る。別の例では、輸送デバイス(例えば、自律走行車)は、清掃ルーチンを受けるために施設に自動的に呼び戻され得る。別の例では、機械学習モデルによって生成された特性予測が、動物または人にとって危険な環境が空間内部に存在することを示している場合に、アラートを提示することができる。例えば、建物で感知された化学物質に基づいて安全性の欠如の予測が生成された場合、建物で音声アラートを鳴らすことができる。例として、埋め込み出力を分類ヘッドに入力することができ、分類ヘッドは埋め込み出力を処理して環境に危険な化学物質が含まれる確率を判定することができる。確率が閾値確率を超える場合、アラートを発することができ、及び/またはアラームを作動させることができる。
【0036】
いくつかの実施態様では、システムは、環境の特性予測を生成するために、埋め込みモデル及び分類モデルに入力されるセンサデータを取り込むことができる。例えば、システムは、環境の分子の存在及び/または濃度に関連するデータを取り込むために、1つまたは複数のセンサを利用することができる。システムは、センサデータを処理して埋め込みモデルの入力データを生成し、分類モデルを処理して環境の特性予測を生成できる。これには、環境の匂いまたは環境の他の特性に関する1つ以上の予測が含まれ得る。予測に特定の不快な臭気が含まれている場合、システムは、清掃サービスを完了させるようにユーザのコンピューティングデバイスにアラートを送信することができる。いくつかの実施態様では、システムは、不快な臭気を判定すると、アラートをバイパスし、清掃サービスに予約リクエストを送信することができる。
【0037】
別の例示的な実施態様には、バックグラウンド処理及び/または安全対策のためのアクティブな監視が含まれる場合がある。例えば、システムは、製造工場のセンサで取得したセンサデータをアクティブに生成及び処理して、メーカがいずれかの危険を確実に認識できるようにすることができる。いくつかの実施態様では、センサデータは間隔を置いてまたは断続的に生成され、埋め込みモデル及び分類モデルによって処理されて、特性予測を判定することができる。特性予測には、環境にある化学物質が可燃性、有毒、不安定、または何らかの形で危険であるかどうかを含めることができる。例えば、特性予測は、存在する複数の環境的に危険な状態のそれぞれに対する確率スコアを含むことができる。環境で感知された化学物質が何らかの形で危険であると判断された場合、例えば、任意の1つまたは複数の環境的に危険な状態の確率スコアがそれぞれの閾値を超えた場合、アラートが送信され得る。代替的に及び/または追加的に、システムは、いずれかの潜在的な現在または将来の危険から保護するために、1つまたは複数のマシンを制御して処理を停止及び/または抑止することができる。
【0038】
システム及び方法は、他の製造システム、産業システム、または商業システムに適用して、特性予測に応じて自動化されたアラートまたは自動化されたアクションをもたらすことができる。これらの適用には、感知された化学物質の特定、感知された化学物質の特性の判定、疾患の特定、食品の腐敗の特定、作物の問題の判定が含まれ得る。
【0039】
いくつかの実施態様では、本明細書に開示されるシステム及び方法は、化学混合物特性予測データベースを活用して、埋め込み出力を分類することができる。データベースは、予測特性を判定するための埋め込みモデル及び予測モデルを使用して理論的化学混合物の特性予測を生成することによって生成され得る。
【0040】
例えば、システム及び方法は、1つまたは複数の分子の分子データ及び1つまたは複数の分子の混合物に関連する混合物データを取得することを含むことができる。分子データは、混合物を構成する複数の分子の各分子のそれぞれの分子データを含むことができる。いくつかの実施態様では、混合物データは、混合物の全体の組成とともに、混合物中の各分子の濃度に関連するデータを含むことができる。混合物データは、混合物の化学的な配合を記述することができる。分子データを埋め込みモデルで処理して、複数の埋め込みを生成することができる。それぞれの分子のそれぞれの分子データは、混合物中のそれぞれの分子についてそれぞれの埋め込みを生成するために、埋め込みモデルで処理され得る。いくつかの実施態様では、埋め込みは、埋め込みデータの個々の分子特性を記述するデータを含むことができる。一部の実施態様では、埋め込みは数値のベクトルにすることができる。場合によっては、埋め込みはグラフや分子特性の説明を表す場合がある。埋め込み及び混合物データは、予測モデルによって処理されて、1つまたは複数の特性予測を生成できる。1つ以上の特性予測は、1つ以上の埋め込み及び混合物データに少なくとも部分的に基づくことができる。特性予測には、混合物の味、匂い、色合いなどに関する様々な予測が含まれ得る。いくつかの実施態様では、システム及び方法は、1つまたは複数の特性予測を保存することを含むことができる。一部の実施態様では、モデルの一方または両方に機械学習済モデルを含めることができる。
【0041】
次に、埋め込みとそのそれぞれの特性予測をラベル付きセットとして対にして、埋め込み空間にラベル付き埋め込みを生成できる。機械学習済モデルは、感知された化合物の特性の判定またはセンサによって感知された化学混合物の判定などの分類タスクのために、埋め込み空間内のラベルとその後比較できる埋め込み出力を出力するようにトレーニングできる。
【0042】
本開示のシステム及び方法は、多くの技術的効果及び利点を提供する。一例として、システム及び方法は、電気信号の理解及び解釈を可能にできるデバイス及びプロセスを提供することができ、これにより、効率的かつ正確な特定プロセスにつながり得る。システム及び方法はさらに、電気センサによる食品の腐敗の特定、または植物、動物、または人間の疾患の状態の特定に使用することができる。さらに、このシステム及び方法は、電子化学センサによって生成された電気信号データに基づいて化合物を特定するための自動プロセスを可能にすることができる。
【0043】
本開示のシステム及び方法の別の技術的利点は、電気信号の分類のために匂い埋め込み空間を利用できることである。既知の混合物または特性をすべて特定するためにモデルを手動でトレーニングするのは面倒な場合があるが、生成された匂い埋め込み空間を使用すると、トレーニングを最初から開始する必要なく、容易にアクセスできるデータを提示できる。
【0044】
技術的な効果及び利点の別の例は、計算効率の向上及びコンピューティングシステムの機能の改善に関するものである。例えば、特定の既存のシステムは、単一の化合物または少数の化合物の存在を特定するようにトレーニングされている。化合物ごとに個別にトレーニングするのは時間がかかる可能性があるが、システムが化合物が存在するか存在しないかをテストするだけであるとき、計算が非効率になる可能性もある。対照的に、機械学習済モデルをトレーニングして埋め込み空間に埋め込み出力を生成することにより、システムは埋め込み特性を利用して化合物または化学特性を効率的に判定できる。したがって、提案されたシステム及び方法は、プロセッサの使用量、メモリの使用量、及び/またはネットワーク帯域幅などの計算リソースを節約することができる。
【0045】
ここで図面を参照して、本開示の例示的な実施形態をさらに詳細に説明する。
【0046】
例示的なデバイス及びシステム
図1Aは、本開示の例示的な実施形態による、電気信号の処理を実行する、例示的なコンピューティングシステム100のブロック図を示す。システム100は、ネットワーク180を介して通信可能に結合されたユーザコンピューティングデバイス102、サーバコンピューティングシステム130、及びトレーニングコンピューティングシステム150を含む。
【0047】
ユーザコンピューティングデバイス102は、例えば、パーソナルコンピューティングデバイス(例えば、ラップトップまたはデスクトップ)、モバイルコンピューティングデバイス(例えば、スマートフォンまたはタブレット)、ゲームコンソールまたはコントローラ、ウェアラブルコンピューティングデバイス、埋め込みコンピューティングデバイス、またはその他いずれかのタイプのコンピューティングデバイスなどの、いずれかのタイプのコンピューティングデバイスであり得る。
【0048】
ユーザコンピューティングデバイス102は、1つまたは複数のプロセッサ112及びメモリ114を含む。1つまたは複数のプロセッサ112は、任意の適切な処理デバイス(例えば、プロセッサコア、マイクロプロセッサ、ASIC、FPGA、コントローラ、マイクロコントローラなど)とすることができ、1つのプロセッサまたは動作可能に接続される複数のプロセッサとすることができる。メモリ114は、RAM、ROM、EEPROM、EPROM、フラッシュメモリデバイス、磁気ディスクなど、及びそれらの組み合わせなどの1つまたは複数の非一時的なコンピュータ可読記憶媒体を含むことができる。メモリ114は、ユーザコンピューティングデバイス102に動作を実行させるためにプロセッサ112によって実行されるデータ116及び命令118を格納することができる。
【0049】
いくつかの実施態様では、ユーザコンピューティングデバイス102は、1つまたは複数の電気信号処理モデル120を格納または含むことができる。例えば、電気信号処理モデル120は、ニューラルネットワーク(例えば、ディープニューラルネットワーク)、または非線形モデル及び/または線形モデルを含む他の種類の機械学習済モデルなどの様々な機械学習済モデルであってもよいし、そうでなければそれを含むこともできる。ニューラルネットワークには、フィードフォワードニューラルネットワーク、リカレントニューラルネットワーク(例えば長期短期記憶リカレントニューラルネットワーク)、畳み込みニューラルネットワーク、または他の形式のニューラルネットワークが含まれ得る。例示的な電気信号処理モデル120については、
図4、5、及び9を参照して説明する。
【0050】
いくつかの実施態様では、1つまたは複数の電気信号処理モデル120は、ネットワーク180を介してサーバコンピューティングシステム130から受信され、ユーザコンピューティングデバイスメモリ114に格納され、その後、1つまたは複数のプロセッサ112によって使用されるか、さもなければ実装され得る。いくつかの実施態様では、ユーザコンピューティングデバイス102は、単一の電気信号処理モデル120の複数の並列インスタンスを実装することができる(例えば、感知されている異なる化合物の複数のインスタンスにわたって並列電気信号処理を実行するため)。
【0051】
より具体的には、電気信号処理モデルは、化合物を示す電気信号を記述するセンサデータを受信し、センサデータを処理し、埋め込み空間に埋め込み出力を出力するようにトレーニングされた機械学習済モデルであり得る。埋め込み出力は、そのとき様々なタスクの実行に使用できる。例えば、埋め込み出力を分類モデルで処理して、化合物の分子と濃度、または化合物の特性を判定することができる。その後、結果をユーザに提示できる。
【0052】
加えて、または代わりに、1つまたは複数の電気信号処理モデル140は、クライアント-サーバ関係に従ってユーザコンピューティングデバイス102と通信するサーバコンピューティングシステム130に含まれるか、またはそれによって格納及び実装され得る。例えば、電気信号処理モデル140は、ウェブサービス(例えば、電子化学センササービス)の一部としてサーバコンピューティングシステム140によって実装することができる。したがって、1つまたは複数のモデル120をユーザコンピューティングデバイス102に格納及び実装することができ、及び/または1つまたは複数のモデル140をサーバコンピューティングシステム130に格納及び実装することができる。
【0053】
ユーザコンピューティングデバイス102はまた、ユーザ入力を受け取る1つまたは複数のユーザ入力コンポーネント122を含むこともできる。例えば、ユーザ入力コンポーネント122は、ユーザ入力オブジェクト(例えば、指またはスタイラス)のタッチを感知するタッチ感知コンポーネント(例えば、タッチ感知表示画面またはタッチパッド)であり得る。タッチセンサコンポーネントは、仮想キーボードを実装するために機能する。他の例示的なユーザ入力コンポーネントは、マイク、従来のキーボード、またはユーザがユーザの入力を実行できるその他の手段が含まれる。
【0054】
サーバコンピューティングシステム130は、1つまたは複数のプロセッサ132及びメモリ134を含む。1つまたは複数のプロセッサ132は、任意の適切な処理デバイス(例えば、プロセッサコア、マイクロプロセッサ、ASIC、FPGA、コントローラ、マイクロコントローラなど)とすることができ、1つのプロセッサまたは動作可能に接続される複数のプロセッサとすることができる。メモリ134は、RAM、ROM、EEPROM、EPROM、フラッシュメモリデバイス、磁気ディスクなど、及びそれらの組み合わせなどの1つまたは複数の非一時的なコンピュータ可読記憶媒体を含むことができる。メモリ134は、サーバコンピューティングシステム130に動作を実行させるためにプロセッサ132によって実行されるデータ136及び命令138を格納することができる。
【0055】
いくつかの実施態様では、サーバコンピューティングシステム130は、1つまたは複数のサーバコンピューティングデバイスを含むか、またはそれによって実装される。サーバコンピューティングシステム130が複数のサーバコンピューティングデバイスを含む場合、そのようなサーバコンピューティングデバイスは、逐次コンピューティングアーキテクチャ、並列コンピューティングアーキテクチャ、またはそれらの組み合わせに従って動作することができる。
【0056】
上述のように、サーバコンピューティングシステム130は、1つ以上の機械学習された電気信号処理モデル140を格納するか、そうでなければ含むことができる。例えば、モデル140は、様々な機械学習済モデルであってもよく、あるいはそれを含むことができる。例示的な機械学習済モデルは、ニューラルネットワークまたはその他の多層非線形モデルが含まれる。例示的なニューラルネットワークは、フィードフォワードニューラルネットワーク、ディープニューラルネットワーク、リカレントニューラルネットワーク、及び畳み込みニューラルネットワークを含む。例示的なモデル140について、
図4、5、及び9を参照して説明する。
【0057】
ユーザコンピューティングデバイス102及び/またはサーバコンピューティングシステム130は、ネットワーク180を介して通信可能に結合されたトレーニングコンピューティングシステム150との対話を介して、モデル120及び/または140をトレーニングすることができる。トレーニングコンピューティングシステム150は、サーバコンピューティングシステム130とは別個であってもよいし、サーバコンピューティングシステム130の一部であってもよい。
【0058】
トレーニングコンピューティングシステム150は、1つまたは複数のプロセッサ152及びメモリ154を含む。1つまたは複数のプロセッサ152は、任意の適切な処理デバイス(例えば、プロセッサコア、マイクロプロセッサ、ASIC、FPGA、コントローラ、マイクロコントローラなど)とすることができ、1つのプロセッサまたは動作可能に接続される複数のプロセッサとすることができる。メモリ154は、RAM、ROM、EEPROM、EPROM、フラッシュメモリデバイス、磁気ディスクなど、及びそれらの組み合わせなどの1つまたは複数の非一時的なコンピュータ可読記憶媒体を含むことができる。メモリ154は、トレーニングコンピューティングシステム150に動作を実行させるためにプロセッサ152によって実行されるデータ156及び命令158を格納することができる。いくつかの実施態様では、トレーニングコンピューティングシステム150は、1つまたは複数のサーバコンピューティングデバイスを含むか、またはそれによって実装される。
【0059】
トレーニングコンピューティングシステム150は、例えば、エラーの逆方向伝播のような様々なトレーニングまたは学習技術を使用して、ユーザコンピューティングデバイス102及び/またはサーバコンピューティングシステム130に格納された機械学習済モデル120及び/または140をトレーニングするモデルトレーナー160を含むことができる。例えば、損失関数は、(例えば、損失関数の勾配に基づいて)モデル(複数可)の1つまたは複数のパラメータを更新するために、モデル(複数可)を通して逆伝播され得る。平均二乗誤差、尤度損失、クロスエントロピー損失、ヒンジ損失、及び/または他の様々な損失関数など、様々な損失関数を使用できる。勾配降下法を使用すると、トレーニングを何回も繰り返して、パラメータを繰り返し更新することができる。
【0060】
いくつかの実施態様では、エラーの逆伝播を実行することは、打ち切り型通時的逆伝搬を実行することを含むことができる。モデルトレーナー160は、トレーニング中のモデルの一般化能力を向上させるために、多くの一般化技術(例えば、重み減衰、ドロップアウトなど)を実行することができる。
【0061】
特に、モデルトレーナー160は、一組のトレーニングデータ162に基づいて電気信号処理モデル120及び/または140をトレーニングすることができる。トレーニングデータ162は、例えば、対にしたデータのセットを含むことができ、各対にしたセットは、電気信号トレーニングデータと、それぞれの電気信号トレーニングデータに対するグラウンドトゥルーストレーニングラベルとを含む。
【0062】
いくつかの実施態様では、ユーザが同意した場合、トレーニングの例が、ユーザコンピューティングデバイス102によって提示され得る。したがって、そのような実施態様では、ユーザコンピューティングデバイス102に提供されるモデル120は、ユーザコンピューティングデバイス102から受信したユーザ固有のデータに基づいてトレーニングコンピューティングシステム150によってトレーニングすることができる。場合によっては、このプロセスをモデルのパーソナライズと呼ぶこともある。
【0063】
モデルトレーナー160は、所望の機能をもたらすために利用されるコンピュータロジックを含む。モデルトレーナー160は、ハードウェア、ファームウェア、及び/または汎用プロセッサを制御するソフトウェアで実装することができる。例えば、いくつかの実施態様では、モデルトレーナー160は、記憶装置に格納され、メモリにロードされ、1つまたは複数のプロセッサによって実行されるプログラムファイルを含む。他の実施態様では、モデルトレーナー160は、RAMハードディスク、光学媒体または磁気媒体などの有形のコンピュータ可読記憶媒体に格納されるコンピュータ実行可能命令の1つまたは複数のセットを含む。
【0064】
ネットワーク180は、ローカルエリアネットワーク(例えば、イントラネット)、ワイドエリアネットワーク(例えば、インターネット)、またはそれらの組み合わせなどの任意のタイプの通信ネットワークであり得、任意の数の有線または無線リンクを含み得る。一般に、ネットワーク180での通信は、多種多様な通信プロトコル(例えば、TCP/IP、HTTP、SMTP、FTP)、エンコーディングまたはフォーマット(例えば、HTML、XML)、及び/または保護スキーム(VPN、セキュアHTTP、SSLなど)を使用して、任意のタイプの有線及び/または無線接続を介して実行することができる。
【0065】
図1Aは、本開示を実装するために使用できるコンピューティングシステムの一例を示す。他のコンピューティングシステムも同様に使用できる。例えば、いくつかの実施態様では、ユーザコンピューティングデバイス102は、モデルトレーナー160及びトレーニングデータセット162を含むことができる。このような実施態様では、モデル120は、ユーザコンピューティングデバイス102においてローカルにトレーニング及び使用することができる。このような実施態様のいくつかでは、ユーザコンピューティングデバイス102は、モデルトレーナー160を実装して、ユーザ固有のデータに基づいてモデル120をパーソナライズすることができる。
【0066】
図1Bは、本開示の例示的な実施形態により実行する例示的なコンピューティングデバイス10のブロック図を示す。コンピューティングデバイス10は、ユーザコンピューティングデバイスまたはサーバコンピューティングデバイスであり得る。
【0067】
コンピューティングデバイス10は、多数のアプリケーション(例えば、アプリケーション1からN)を含む。各アプリケーションは、独自の機械学習ライブラリと機械学習済モデル(複数可)を含む。例えば、各アプリケーションは機械学習済モデルを含めることができる。例示的アプリケーションは、テキストメッセージングアプリケーション、電子メールアプリケーション、ディクテーションアプリケーション、仮想キーボードアプリケーション、ブラウザアプリケーションなどが含まれる。
【0068】
図1Bに示すように、各アプリケーションは、例えば、1つ以上のセンサ、コンテキストマネージャ、デバイス状態コンポーネント、及び/または追加のコンポーネントなど、コンピューティングデバイスの他の多くのコンポーネントと通信することができる。いくつかの実施態様では、各アプリケーションは、API(例えば、パブリックAPI)を使用して各デバイスコンポーネントと通信することができる。一部の実施態様では、各アプリケーションで使用されるAPIはそのアプリケーションに固有である。
【0069】
図1Cは、本開示の例示的な実施形態により実行する例示的なコンピューティングデバイス50のブロック図を示す。コンピューティングデバイス50は、ユーザコンピューティングデバイスまたはサーバコンピューティングデバイスであり得る。
【0070】
コンピューティングデバイス50は多数のアプリケーション(アプリケーション1からNなど)含をむ。各アプリケーションは中央のインテリジェンス層と通信する。例示的アプリケーションは、テキストメッセージングアプリケーション、電子メールアプリケーション、ディクテーションアプリケーション、仮想キーボードアプリケーション、ブラウザアプリケーションなどが含まれる。一部の実施態様では、各アプリケーションは、API(すべてのアプリケーションにわたる共通APIなど)を使用して中央インテリジェンス層(及びそこに格納されているモデル(複数可))と通信できる。
【0071】
中央インテリジェンス層には、多数の機械学習済モデルが含まれている。例えば、
図1Cに示すように、それぞれの機械学習済モデル(例えば、モデル)がアプリケーションごとに設けられ、中央インテリジェンス層によって管理されることが可能である。他の実施態様では、2つ以上のアプリケーションが単一の機械学習済モデルを共有できる。例えば、いくつかの実施態様では、中央インテリジェンス層は、すべてのアプリケーションに対して単一のモデル(例えば、単一のモデル)を設けることができる。いくつかの実施態様では、中央インテリジェンス層は、コンピューティングデバイス50のオペレーティングシステムの内部に含まれるか、またはそれによって実装される。
【0072】
中央インテリジェンス層は、中央デバイスデータ層と通信できる。中央デバイスデータ層は、コンピューティングデバイス50のためのデータの集中リポジトリであり得る。
図1Cに示すように、中央デバイスデータ層は、例えば、1つ以上のセンサ、コンテキストマネージャ、デバイス状態コンポーネント、及び/または追加のコンポーネントなど、コンピューティングデバイスの他の多くのコンポーネントと通信することができる。いくつかの実施態様では、中央デバイスデータ層は、API(例えば、プライベートAPI)を使用して各デバイスコンポーネントと通信することができる。
【0073】
例示的なモデルの配置
図2は、本開示の例示的な実施形態による例示的な二足分類システム200のブロック図を示す。いくつかの実施態様では、二足分類システム200は、化合物のグラフ表現210または化合物を記述する電気信号データ220のいずれかを受信し、入力データ210及び220の受信の結果として、入力データを特定の化合物または特定の特性に関連するものとして分類する出力データ230を提示するようにトレーニングされる。したがって、いくつかの実施態様では、二足分類システム200は、グラフ表現210を処理するように動作可能なグラフニューラルネットワーク212と、電気信号データ220を処理するように動作可能な機械学習済モデル222とを含むことができる。
【0074】
特に、
図2は、センサデータまたはグラフ表現データのいずれかを処理することによって分類を提供できるシステム200を示す。図示されたシステム200は、1つまたは複数の分子210のグラフ表現を処理するための第1のフットと、1つまたは複数の分子の電気信号データまたはセンサデータを処理するための第2のフット220とを含む。ただし、一部の実施態様では、単一のモデルアーキテクチャでグラフ表現210とセンサデータ220の両方を処理できる。
【0075】
グラフ表現210の処理は、グラフニューラルネットワーク(GNN)モデル212を用いてグラフ表現210を記述するデータを処理して、埋め込み214を生成することを含むことができる。埋め込みは、少なくとも部分的に分子濃度に基づくことができる。埋め込み214は、埋め込み空間での埋め込みであり得る。
【0076】
電気信号データ220の処理は、機械学習済モデル222を用いて電気信号データ220を処理して、ML出力224を生成することを含むことができる。いくつかの実施態様では、電気信号データ220は、1つまたは複数のセンサから取得されるか、またはそれを用いて生成され得る。1つまたは複数のセンサは、電子化学センサを含むことができる。さらに、いくつかの実施態様では、電気信号データ220は、化合物への曝露に応答して生成される1つまたは複数の電気信号を記述するセンサデータを含むことができる。機械学習済モデル222には、1つまたは複数の埋め込みモデル及び/または1つまたは複数のトランスフォーマモデルが含まれ得る。さらに、ML出力224は、埋め込み空間における埋め込み出力とすることができる。
【0077】
いくつかの実施態様では、GNNモデル212及び機械学習済モデル22は、同じ埋め込み空間に埋め込み214及び埋め込み出力224を設けるようにトレーニングすることができる。さらに、いくつかの実施態様では、GNNモデル212及び機械学習済モデル222は、単一の共有モデルであってもよい。2つのモデルは、同じモデルアーキテクチャの一部である可能性がある。
【0078】
次に、埋め込み214及びML出力224を分類モデルで処理して、分類230を判定することができる。分類230は、人間が入力したラベルのセットに少なくとも部分的に基づくことができる。いくつかの実施態様では、分類230は、埋め込み空間での特性予測ラベルに少なくとも部分的に基づくことができる。特性予測ラベルは、理論的混合物の特性予測を判定するために埋め込みモデル及び予測モデルを利用する化学混合物特性予測システムに少なくとも部分的に基づくことができる。
【0079】
図3は、本開示の例示的な実施形態による、例示的な電子化学センサデバイスシステム300のブロック図を示す。いくつかの実施態様では、電子化学センサデバイスシステム300は、機械学習済モデル312、1つまたは複数のセンサ314、ユーザインターフェース316、プロセッサ318、メモリ320、及びGNN埋め込みモデル330を備えたセンサコンピューティングシステム310を含むことができる。
【0080】
特に、センサコンピューティングシステム310は、化合物の曝露を感知するための1つ以上のセンサ314を含む電子化学センサデバイスを含むことができる。センサ314は、1つ以上の分子への曝露に応答して得られる電気信号を記述するセンサデータを生成するように構成することができる。
【0081】
さらに、センサコンピューティングシステム310は、センサデータを処理して埋め込み空間に埋め込み出力を生成するための機械学習済モデル312を含むことができる。センサコンピューティングシステムは、グラフ表現を処理するための、及び/または機械学習済モデル312をグラフニューラルネットワーク埋め込みモデル330と共同してトレーニングするための埋め込みモデル330をさらに含んでもよい。
【0082】
いくつかの実施態様では、センサコンピューティングシステムは、埋め込み空間データ322、電気信号データ324、ラベル付きデータセット326、他のデータ、及び1つまたは複数の動作または機能を実行するための命令を格納するための1つまたは複数のメモリコンポーネント320を含むことができる。特に、メモリ320は、埋め込みラベル対のデータベースを使用して生成された埋め込み空間データ322を格納することができる。例えば、埋め込み空間データ322は、グラフ表現またはセンサデータに基づいて生成された埋め込みと、化学混合物または特性予測を記述するそれぞれの対のラベルを含む複数の対のセットを含むことができる。埋め込み空間データ322は、センサが曝露された化合物を判定するなどの分類タスクを支援することができる。
【0083】
メモリコンポーネントは、過去の電気信号データ324及びラベル付けされたデータ326も格納し得る。過去の電気信号データ324は、トレーニング、分類タスクのために、及び/または過去の取り込みデータのデータログを保持するために、格納することができる。例えば、一組の電気信号データ324は、いずれかの格納されたラベルまたはクラスの閾値分類スコアに達しない可能性があるため、新しい分類ラベルまたはクラスとして格納され得る。しかしながら、いくつかの実施態様では、電気信号データ324は、分類閾値と一致するが、トレーニングデータからの偏差値を含む場合がある。センサコンピューティングシステムは、過去の電気信号データ324または過去のセンサデータを記録して、センサの較正またはパラメータ調整の必要性を示し得る、再発する偏差傾向またはエラーを判定することができる。
【0084】
代替的に及び/または追加的に、メモリコンポーネント320は、埋め込み空間データ322の代わりに、またはそれと組み合わせて、ラベル付きデータセット326を格納することができる。ラベル付きデータセット326は、分類タスクまたは機械学習済モデル312のトレーニングに利用することができる。いくつかの実施態様では、センサコンピューティングシステム310は、分類タスクの精度を向上させるため、または将来のトレーニングのために、人間が入力したラベルをアクティブに取り込むことができる。
【0085】
センサコンピューティングシステムは、ユーザ入力を受け取り、ユーザに通知及びフィードバックを提示するためのユーザインターフェース316を含むことができる。例えば、いくつかの実施態様では、センサコンピューティングシステム310は、埋め込み値、センサデータ分類などについての通知を提供するユーザインターフェースを表示できる、電子化学センサの上にある、またはそれに取り付けられたディスプレイを含んでもよい。いくつかの実施態様では、電子化学センサは電子化学センサの使用を支援するためにユーザからの入力を受け取るためのタッチスクリーンディスプレイを含めることができる。
【0086】
センサコンピューティングシステム310は、ネットワーク350を介して1つまたは複数の他のコンピューティングシステムと通信することができる。例えば、センサコンピューティングシステム310は、ネットワーク350を介してサーバコンピューティングシステム360と通信することができる。サーバコンピューティングシステム360は、機械学習済モデル362、グラフニューラルネットワーク埋め込みモデル364、格納データ366、及び1つまたは複数のプロセッサ368を含むことができる。いくつかの実施態様では、サーバコンピューティングシステム360は、機械学習済モデルの再トレーニングまたは診断タスクを支援するために、センサコンピューティングシステムからセンサデータまたはラベル付きデータ326を受信することができる。いくつかの実施態様では、サーバコンピューティングシステム360の格納データ366は、分類タスク及びトレーニングを支援するためにネットワークを介してセンサコンピューティングシステム310によってアクセスできるラベル付き埋め込みデータベースを含むことができる。いくつかの実施態様では、サーバコンピューティングシステム360は、更新されたモデルを1つまたは複数のセンサコンピューティングシステム310に提供することができる。さらに、いくつかの実施態様では、センサコンピューティングシステム310は、1つまたは複数のセンサ314によって生成されたセンサデータを処理するために、サーバコンピューティングシステム360の1つまたは複数のプロセッサ368及び機械学習済モデル362を利用することができる。
【0087】
いくつかの実施態様では、センサコンピューティングシステム370は、通知を提示するため、他のコンピューティングデバイス370からのセンサデータを処理するため、または他のコンピューティングタスクのために、1つまたは複数の他のコンピューティングデバイス370と通信することができる。
【0088】
図4は、本開示の例示的な実施形態による、機械学習済モデルをトレーニングするための例示的なシステム400のブロック図を示す。いくつかの実施態様では、機械学習済モデルをトレーニングするためのシステム400は、化合物を記述する入力データセット404を受信し、入力データ404の受信の結果として、予測された特性ラベルまたは化学混合物ラベルを記述する出力データ416を提供するように機械学習済モデル410をトレーニングすることを含むことができる。したがって、いくつかの実施態様では、機械学習済モデルをトレーニングするためのシステム400は、生成された埋め込み412を分類するように動作可能な分類モデル414を含むことができる。
【0089】
機械学習済モデルは、グラウンドトゥルースラベルを使用してトレーニングできる。いくつかの実施態様では、機械学習済モデルは、センサデータ408を処理して、生成された埋め込み出力412を出力するようにトレーニングされた埋め込みモデル410であり得、これはその後、他の様々なタスクに使用することができる。
【0090】
いくつかの実施態様では、埋め込みモデル400のトレーニングは、特性402の人間によるラベルを有する1つまたは複数のトレーニング化学物質から開始することができる。1つまたは複数の化学物質404は、1つまたは複数のセンサ406に曝露されて、1つまたは複数の化学物質404への曝露を記述するセンサデータを生成することができる。いくつかの実施態様では、センサデータは、電子化学センサによって生成される電気信号(例えば、電圧または電流)を記述することができる。
【0091】
生成されるセンサデータ408は、次いで埋め込みモデル410によって処理され得、埋め込み出力412を生成する。埋め込みモデル410には、1つまたは複数のトランスフォーマモデルが含まれ得る。いくつかの実施態様では、埋め込みモデル410は、グラフニューラルネットワークモデルを含むことができ、グラフ表現とセンサデータ408の両方を処理できるようにトレーニングされ得る。さらに、生成された埋め込み412は、埋め込み空間の埋め込み出力であり得、カラー表示用のRGB値と同様の識別子の値のセットを含むことができる。
【0092】
次いで、生成された埋め込み412は、分類ヘッド414によって処理されて、1つまたは複数の一致する予測特性ラベル416を判定することができる。予測特性ラベル416は、匂い、味、または色などの感覚特性ラベルを含むことができる。次いで、予測特性ラベル416及び人間が入力した特性ラベル420を使用して、損失関数422を評価することができる。次に、損失関数422を使用して、損失を逆伝播してモデルパラメータ418を学習/最適化することによって、機械学習済モデル410の1つまたは複数のパラメータを調整することができる。
【0093】
プロセス400は、機械学習済モデル410をトレーニングして、分類タスクを実行するか、取得されたセンサデータ408に基づいて他のタスクを実行するために使用できる埋め込み出力412を生成するために、複数のトレーニングの例について反復的に完了することができる。
【0094】
図5は、本開示の例示的な実施形態による、例示的なトレーニングされた機械学習済モデルシステム500のブロック図を示す。いくつかの実施態様では、トレーニングされた機械学習済モデルシステム500は、1つまたは複数の化学物質を記述する入力データ504のセットを受信し、入力データ504の受信の結果として、生成された埋め込みを含む出力データ512を提示するようにトレーニングされる。したがって、いくつかの実施態様では、トレーニングされた機械学習済モデルシステム500は、予測された特性ラベル516を判定するように動作可能な分類ヘッド514を含むことができる。
【0095】
トレーニングされた機械学習済モデル510は、その後、特性予測タスクを含む様々なタスクに使用することができる。
【0096】
例えば、1つまたは複数の化学物質502を1つまたは複数のセンサ506に曝露して504、センサデータ508を生成することができる。1つまたは複数のセンサ506は、1つまたは複数の化学物質502へ曝露している最中に観察される電気信号データを記述するセンサデータ508を生成することができる1つまたは複数の電子化学センサを含むことができる。さらに、1つまたは複数の化学物質502は、制御された環境(例えば、研究室空間)または非制御の環境(例えば、車、オフィスなど)で1つまたは複数のセンサ506に曝露504され得る。
【0097】
センサデータ508は、次いでトレーニングされた埋め込みモデル510によって処理され得、埋め込み出力512を生成する。埋め込み出力512は、埋め込み空間の埋め込みとすることができ、ベクトル値を記述する複数の値を含むことができる。
【0098】
いくつかの実施態様では、埋め込み出力512だけでも、異なる化学物質520のセンサデータから生成された埋め込みに基づいて類似の化学物質をクラスタリングするのに有用であり得る。埋め込み出力512は、埋め込み空間及び埋め込み空間の異なる化学物質の特性をより良く理解するために使用することもできる。あるいは、及び/またはさらに、埋め込み出力のみを、化学特性空間のより直観的な描写を提供するための埋め込み空間の視覚化の生成を含み得る様々なタスクに利用できる。生成された埋め込み出力は、さらなるモデルのトレーニングまたはその他の様々なタスクに使用できる。
【0099】
埋め込み出力512の他のアプリケーションは、分類タスク518を含むことができ、これは、1つまたは複数の関連する予測特性ラベル516を判定するために、分類ヘッド514を用いて埋め込み出力512を処理することを含むことができる。分類ヘッド514は、嗅覚特性予測などの特性予測タスクのためにトレーニングすることができ、これを使用して、いつ車を清掃サービスによって整備する必要があるかを判断するか、またはいつ悪臭が存在するかを判断することができる。
【0100】
代替的に及び/または追加的に、埋め込み出力512は、異なるタスク522用にトレーニングされた異なるヘッドによって処理されて、タスク524の実行を支援する予測タスク出力524をもたらすことができる。いくつかの実施態様では、異なるヘッド522は、埋め込み出力が食品の腐敗、疾患の状態を記述するかどうか、または化学物質が抗真菌などの有益な特性を有する可能性があるかどうか分類するように、トレーニングすることができる。
【0101】
図9は、本開示の例示的な実施形態による、機械学習済モデルをトレーニングするための例示的なシステム900のブロック図を示す。機械学習済モデルをトレーニングするためのシステム900は、機械学習済モデルをトレーニングするためのシステム900がグラフ表現を処理するようにシステムをトレーニングすることをさらに含むことを除いて、
図4の機械学習済モデルをトレーニングするためのシステム400と同様である。
【0102】
いくつかの実施態様では、機械学習済モデル910及び926は、グラウンドトゥルースラベルを使用してトレーニングできる。いくつかの実施態様では、機械学習済モデルは、センサデータ908及び/またはグラフ表現924を記述するデータを処理して、生成された埋め込み出力912を出力するようにトレーニングされた埋め込みモデル910及び926であり得、これはその後、他の様々なタスクに使用することができる。
【0103】
いくつかの実施態様では、埋め込みモデル900のトレーニングは、特性902の人間によるラベルを有する1つまたは複数のトレーニング化学物質から開始することができる。1つまたは複数の化学物質904は、1つまたは複数のセンサ906に曝露されて、1つまたは複数の化学物質904への曝露を記述するセンサデータを生成することができる。いくつかの実施態様では、センサデータは、電子化学センサによって生成される電気信号(例えば、電圧または電流)を記述することができる。
【0104】
生成されるセンサデータ908は、次いで埋め込みモデル910によって処理され得、埋め込み出力912を生成する。埋め込みモデル910には、1つまたは複数のトランスフォーマモデルが含まれ得る。いくつかの実施態様では、埋め込みモデル910は、グラフニューラルネットワークモデル926を含むことができ、グラフ表現924及びセンサデータ908の両方を処理できるようにトレーニングされ得る。さらに、生成された埋め込み912は、埋め込み空間の埋め込み出力とすることができ、カラー表示用のRGB値と同様の識別子の値のセットを含むことができる。
【0105】
いくつかの実施態様では、システムは、センサデータ908またはグラフ表現924を記述するデータのいずれかを処理して、埋め込み出力912を生成することができる二足システムであり得る。さらに、いくつかの実施態様では、グラフニューラルネットワークモデル926及び埋め込みモデル910を共同でトレーニングすることができる。いくつかの実施態様では、グラフ表現データ924は、埋め込みモデル910によって処理される前に、グラフニューラルネットワークモデル926によって処理され得る。しかしながら、いくつかの実施態様では、GNNモデル926は、埋め込みモデル910によって処理されることなく、予測特性ラベル916を判定するために分類ヘッド914によって処理され得る埋め込みを出力し得る。
【0106】
次いで、生成された埋め込み912は、分類ヘッド914によって処理されて、1つまたは複数の一致する予測特性ラベル916を判定することができる。予測特性ラベル916は、匂い、味、または色などの感覚特性ラベルを含むことができる。次いで、予測特性ラベル916及び人間が入力した特性ラベル920を使用して、損失関数922を評価することができる。次に、損失関数922を使用して、損失を逆伝播してモデルパラメータ918を学習/最適化することによって、機械学習済モデル910及び/または926の少なくとも1つのうちの1つまたは複数のパラメータを調整することができる。
【0107】
プロセス900は、機械学習済モデル910及び926をトレーニングして、分類タスクを実行するか、取得されたセンサデータ908に基づいて他のタスクを実行するために使用できる埋め込み出力912を生成するために、複数のトレーニングの例について反復的に完了することができる。
【0108】
例示的な方法
図6は、本開示の例示的な実施形態により実行する例示的な方法のフローチャートの図表を示す。
図6は、例示及び論考の目的で特定の順序で実行されるステップを示しているが、本開示の方法は、特に図示された順序または配置に限定されない。方法600の様々なステップは、本開示の範囲から逸脱することなく、様々な方法で省略、再配置、組み合わせ、及び/または適合させることができる。
【0109】
602で、コンピューティングシステムはセンサデータを生成することができる。センサデータは、電子化学センサを含むことができる1つ以上のセンサを使用して生成できる。いくつかの実施態様では、センサデータは、1つ以上の分子への曝露に応答してセンサによって生成される電気信号(例えば、電圧または電流)を記述することができる。
【0110】
604において、コンピューティングシステムは、機械学習済モデルを用いてセンサデータを処理することができる。機械学習済モデルには、1つまたは複数のトランスフォーマモデル及び/または1つまたは複数のGNN埋め込みモデルが含まれ得る。さらに、機械学習済モデルは、センサデータを処理して埋め込み空間に埋め込み出力を生成するようにトレーニングされた機械学習済モデルであり得る。
【0111】
606で、コンピューティングシステムは、埋め込み出力を生成することができる。埋め込み出力には、カラー表示のRGB値に類似した1つ以上の値を含めることができる。
【0112】
608で、コンピューティングシステムは、埋め込み出力に基づいてタスクを実行することができる。例えば、埋め込み出力を分類モデルによって処理して、感知された化学物質または感知された化学物質の特性を判定することができる。埋め込み出力の分類には、埋め込み空間でのラベル付き埋め込みの使用、トレーニングの例、またはその他の分類手法が含まれる場合がある。いくつかの実施態様では、埋め込み出力は、感知された化学物質の感覚特性(例えば、匂い、味、色など)を判定するために、分類ヘッドによって処理され得る。他の実施態様では、分類ヘッドは、埋め込み出力に基づいて疾患の状態を特定するようにトレーニングされ得る。埋め込み出力を使用して、センサデバイスが食品の腐敗、病気の作物、悪臭などを、リアルタイムで特定できるようにし得る。
【0113】
図7は、本開示の例示的な実施形態により実行する例示的な方法のフローチャートの図表を示す。
図7は、例示及び論考の目的で特定の順序で実行されるステップを示しているが、本開示の方法は、特に図示された順序または配置に限定されない。方法700の様々なステップは、本開示の範囲から逸脱することなく、様々な方法で省略、再配置、組み合わせ、及び/または適合させることができる。
【0114】
702で、コンピューティングシステムはセンサデータを取得することができる。センサデータは1つ以上のセンサで取得でき、1つ以上の分子への曝露を記述することができる。
【0115】
704において、コンピューティングシステムは、機械学習済モデルを用いてセンサデータを処理することができる。機械学習済モデルは、電気信号の生データを記述するセンサデータを処理し、埋め込み出力を生成するようにトレーニングされる1つ以上の埋め込みモデルを含み得る。
【0116】
706で、コンピューティングシステムは、埋め込み出力を生成することができる。
【0117】
708で、コンピューティングシステムは、分類モデルを用いて埋め込み出力を処理して、分類を判定することができる。分類モデルには、埋め込み空間の1つまたは複数の一致するラベルを特定するようにトレーニングされた1つまたは複数の分類ヘッドを含めることができる。いくつかの実施態様では、分類モデルは、埋め込み出力の値または埋め込み空間の埋め込み出力の位置において少なくとも部分的に判定される閾値の類似度に基づいて、埋め込み出力に関連するラベルを判定することができる。
【0118】
710で、コンピューティングシステムは、表示のための分類を提供することができる。分類は、化学混合物の特定、1つ以上の特性予測、または別の形式の分類(例えば、病状の分類、食品腐敗の分類、熟度の分類、悪臭の分類、病気の作物の分類など)であり得る。ディスプレイには、LEDディスプレイ、LCDディスプレイ、ELDディスプレイ、プラズマディスプレイ、QLEDディスプレイ、またはラベルの上に貼られた1つ以上のライトが含まれ得る。いくつかの実施態様では、分類は、埋め込み空間の埋め込み出力の視覚的表現とともに表示され得る。さらに、いくつかの実施態様では、異なる分類の類似性スコアが表示され得る。どの分類でも閾値が満たされない場合、システムは類似性スコアとともに最も近いクラスを表示することがある。
【0119】
図8は、本開示の例示的な実施形態により実行する例示的な方法のフローチャートの図表を示す。
図8は、例示及び論考の目的で特定の順序で実行されるステップを示しているが、本開示の方法は、特に図示された順序または配置に限定されない。方法800の様々なステップは、本開示の範囲から逸脱することなく、様々な方法で省略、再配置、組み合わせ、及び/または適合させることができる。
【0120】
802で、コンピューティングシステムは、化合物のトレーニングの例を取得することができる。化合物トレーニングの例は、電気信号トレーニングデータとそれぞれのトレーニングラベルを含むことができる。電気信号トレーニングデータとそれぞれのトレーニングラベルは、特定のトレーニング化合物を記述することができる。
【0121】
804で、コンピューティングシステムは、機械学習済モデルを用いてトレーニング電気信号データを処理して、化合物の埋め込み出力を生成することができる。化合物の埋め込み出力は、埋め込み空間の埋め込みを含み得る。
【0122】
806で、コンピューティングシステムは、分類モデルを用いて化合物の埋め込み出力を処理して、化合物ラベルを判定することができる。分類モデルは、1つ以上の関連する化合物ラベルを特定するようにトレーニングできる。いくつかの実施態様では、分類モデルは、特定の分類用にトレーニングされた1つまたは複数の分類ヘッドを含むことができる。
【0123】
808で、コンピューティングシステムは、化合物ラベルとそれぞれのトレーニングラベルとの間の差を評価する損失関数を評価することができる。
【0124】
810で、コンピューティングシステムは、損失関数に少なくとも部分的に基づいて、機械学習済モデルの1つまたは複数のパラメータを調整することができる。
【0125】
追加的な開示
本明細書で説明する技術では、サーバ、データベース、ソフトウェアアプリケーション、その他のコンピュータベースのシステム、及び実行されるアクション、及びそのようなシステムとの間で送受信される情報について言及している。コンピュータベースのシステム固有の柔軟性が、コンポーネント間でのタスクと機能の多種多様な可能な構成、組み合わせ、及び分割を有効にする。例えば、本明細書で説明するプロセスは、単一のデバイスまたはコンポーネント、または組み合わせて動作する複数のデバイスまたはコンポーネントを使用して実装することができる。データベースとアプリケーションは、単一のシステムにおいて実装することも、複数のシステムに分散して実装することもできる。分散させたコンポーネントは、順次または並行して動作できる。
【0126】
本発明の主題をその様々な特定の例示的な実施形態に関して詳細に説明してきたが、各例は説明のために提示されたものであり、本開示を限定するものではない。当業者は、前述の内容を理解したら、そのような実施形態に対する変更、変形、及び等価物を容易に生み出すことができる。したがって、本開示は、当業者にとって容易に明白となるような、本主題に対するそのような修正、変形、及び/または追加を含むことを妨げるものではない。例えば、一実施形態の一部として図示または説明された特徴を別の実施形態とともに使用して、さらに別の実施形態を得ることができる。したがって、本開示はそのような変更、変形、及び均等物を網羅することが意図されている。
【国際調査報告】