IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ムーディファイ リミテッドの特許一覧

特表2024-512350機械学習を使用した分子の嗅覚的特質の予測
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-19
(54)【発明の名称】機械学習を使用した分子の嗅覚的特質の予測
(51)【国際特許分類】
   G16C 60/00 20190101AFI20240312BHJP
   G16C 20/70 20190101ALI20240312BHJP
【FI】
G16C60/00
G16C20/70
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023553963
(86)(22)【出願日】2022-03-09
(85)【翻訳文提出日】2023-11-01
(86)【国際出願番号】 IL2022050265
(87)【国際公開番号】W WO2022190096
(87)【国際公開日】2022-09-15
(31)【優先権主張番号】63/158,529
(32)【優先日】2021-03-09
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】523336310
【氏名又は名称】ムーディファイ リミテッド
【氏名又は名称原語表記】Moodify Ltd
(74)【代理人】
【識別番号】110001302
【氏名又は名称】弁理士法人北青山インターナショナル
(72)【発明者】
【氏名】シルバー,デヴィッド
(72)【発明者】
【氏名】キリエフスキー,キリル
(72)【発明者】
【氏名】ハッソン,ギヨラ
(72)【発明者】
【氏名】ママ,ヤニヴ
(72)【発明者】
【氏名】シャロン,イーガル
(57)【要約】
化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測するシステムおよび方法が提供される。方法は、分子の化学構造に対応する分子の空間的表面表現(SSR)の情報を有するデータを取得した際に、SSR上でN個の複数の表面点を選択することと、各選択された表面点ごとに選択された表面点のSSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR)を生じることと、SPRに従って少なくとも1つの嗅覚的特質に関する予測データを提供するようにトレーニングされた機械学習(ML)モデルに、SPRの情報を有するデータを入力することと、MLモデルの出力として、分子の少なくとも1つの嗅覚的特質に関する予測データを受信することとを含む。1つまたは複数の嗅覚的特質を可能にする分子化学構造を予測するシステムおよび方法も提供される。
【選択図】なし
【特許請求の範囲】
【請求項1】
化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測するコンピュータベースの方法であって、
コンピュータによって、
前記分子の前記化学構造に対応する前記分子の空間的表面表現(SSR:spatial surface representation)の情報を有するデータを取得した際に、前記SSR上でN個の複数の表面点を選択することと、
各選択された表面点ごとに前記選択された表面点の前記SSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR:surface points representation)を生じることと、
SPRに従って少なくとも1つの嗅覚的特質に関する予測データを提供するようにトレーニングされた機械学習(ML:Machine-Learned)モデルに、前記SPRの情報を有するデータを入力することと、
前記MLモデルの出力として、前記分子の前記少なくとも1つの嗅覚的特質に関する予測データを受信することと
を含む、方法。
【請求項2】
前記局所的物理化学的特質が、曲率、波カーネルシグネチャ、熱カーネルシグナル、幾何学的および距離パラメータ、電気陰性度、電子親和力、質量、部分電荷、自由電子-陽子、ならびに疎水性を含むグループから選択された1つまたは複数のパラメータによって特性付けられる、請求項1に記載の方法。
【請求項3】
分子の嗅覚的特質に関する前記予測データが、分子が特定の嗅覚知覚品質を有するか否かを示す予測データと、1つまたは複数の嗅覚的特質クラスに分子を分類する情報を有する予測データと、予測された香気/臭気の強度の情報を有する予測データと、2つ以上の分子の嗅覚的特質の類似度を示す予測データと、2つ以上の分子の混合物の嗅覚的特質に対する前記2つ以上の分子の影響の情報を有する予測データと、原臭を定義するために使用可能な予測データと、におい混合物の知覚的類似度を予測するために使用可能な予測データとを含むグループから選択される、請求項1または2に記載の方法。
【請求項4】
前記分子に関する1つまたは複数の生成物を作製することを可能にするために、前記予測データを使用することをさらに含み、
前記作製することが、所望の臭気のためのレシピを生成することと、所望の嗅覚的特徴をもつ合成の新しい単分子および/または混合物を設計することと、得られる臭気に対する影響力なく所与のレシピを再定式化することと、前記分子を合成することとのうちの少なくとも1つを含む、
請求項1から3のいずれか一項に記載の方法。
【請求項5】
1つまたは複数の原臭に対応する1つまたは複数のSPRパッチを認識するようにさらにトレーニングされた前記MLモデルへの入力として、SPRの情報を有する前記データを使用することをさらに含み、
前記分子の前記少なくとも1つの嗅覚的特質に関する出力された前記予測データが、前記分子との相互作用によって知覚されることが予期される前記1つまたは複数の原臭の情報を有するものである、
請求項1から4のいずれか一項に記載の方法。
【請求項6】
臭気のデジタル化のために、原臭の情報を有する前記受信された予測データを使用することをさらに含む、請求項5に記載の方法。
【請求項7】
前記SPRを前処理することをさらに含み、
前記前処理の結果が、前記SPRの情報を有する前記データとして使用される、
請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記SPRを前処理することが、前記選択された表面点を2次元の行列に変換することを含む、請求項7に記載の方法。
【請求項9】
前記表面点が、三角形メッシュのノードとして選択される、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記MLモデルが、畳み込みニューラルネットワークである、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記表面点が、均等に選択され、点群の幾何学的データ構造として扱われる、請求項1から8のいずれか一項に記載の方法。
【請求項12】
前記MLモデルが、PointNetニューラルネットワークである、請求項11に記載の方法。
【請求項13】
プロセッサおよびメモリを備える1つまたは複数のコンピューティングデバイスであって、前記1つまたは複数のコンピューティングデバイスが、コンピュータ実行可能命令を介して、化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測することが可能なシステムをクラウドコンピューティング環境において動作させるための動作を実施するように構成され、
前記動作が、
前記分子の前記化学構造に対応する前記分子の空間的表面表現(SSR:spatial surface representation)の情報を有するデータを取得した際に、前記SSR上でN個の複数の表面点を選択することと、
各選択された表面点ごとに前記選択された表面点の前記SSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR:surface points representation)を生じることと、
SPRに従って少なくとも1つの嗅覚的特質に関する予測データを提供するようにトレーニングされた機械学習(ML:Machine-Learned)モデルに、前記SPRの情報を有するデータを入力することと、
前記MLモデルの出力として、前記分子の前記少なくとも1つの嗅覚的特質に関する予測データを受信することと
を含む、
1つまたは複数のコンピューティングデバイス。
【請求項14】
請求項2から12のいずれか一項に記載の動作を実施するようにさらに構成された、請求項13に記載の1つまたは複数のコンピューティングデバイス。
【請求項15】
コンピューティングシステムによって実行可能な複数のプログラムコンポーネントを記憶するメモリを備える前記コンピューティングシステムによって実行されたときに、前記コンピューティングシステムを請求項1から12のいずれか一項に従って動作させる命令を含む、非一時的コンピュータ可読媒体。
【請求項16】
化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測するコンピュータベースの方法であって、
コンピュータによって、
前記分子の前記化学構造に対応する前記分子の空間的表面表現(SSR:spatial surface representation)の情報を有するデータを取得した際に、前記SSR上でN個の複数の表面点を選択することと、
各選択された表面点ごとに前記選択された表面点の前記SSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR:surface points representation)を生じることと、
1つまたは複数の原臭に対応する1つまたは複数のSPRパッチを認識するようにトレーニングされた機械学習(ML:Machine-Learned)モデルに、前記SPRの情報を有するデータを入力することと、
前記MLモデルの出力として、前記分子との相互作用によって知覚されることが予期される原臭の組合せの情報を有する予測データを受信することと
を含む、方法。
【請求項17】
原臭の前記組合せの情報を有する予測データを臭気放出ユニットに送信することであり、前記組合せが、それぞれの原臭のIDおよび割合によって特性付けられ、前記臭気放出が、物質のセットを含むディフューザを備え、各物質が、それぞれの原臭のにおいの知覚を可能にする、送信することと、
前記臭気放出が、前記分子との相互作用によって知覚されることが予期される原臭の前記組合せについての前記受信されたデータに従って、物質の前記セットからの物質を放出することを可能にすることと
をさらに含む、請求項16に記載の方法。
【請求項18】
前記SSRの情報を有するデータが、データ通信ネットワークを介して受信されたものである、請求項17に記載の方法。
【請求項19】
プロセッサおよびメモリを備える1つまたは複数のコンピューティングデバイスであって、前記1つまたは複数のコンピューティングデバイスが、コンピュータ実行可能命令を介して、化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測することが可能なシステムをクラウドコンピューティング環境において動作させるための動作を実施するように構成され、
前記動作が、
前記分子の前記化学構造に対応する前記分子の空間的表面表現(SSR:spatial surface representation)の情報を有するデータを取得した際に、前記SSR上でN個の複数の表面点を選択することと、
各選択された表面点ごとに前記選択された表面点の前記SSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR:surface points representation)を生じることと、
1つまたは複数の原臭に対応する1つまたは複数のSPRパッチを認識するようにトレーニングされた機械学習(ML:Machine-Learned)モデルに、前記SPRの情報を有するデータを入力することと、
前記MLモデルの出力として、前記分子との相互作用によって知覚されることが予期される原臭の組合せの情報を有する予測データを受信することと
を含む、
1つまたは複数のコンピューティングデバイス。
【請求項20】
前記動作が、
原臭の前記組合せの情報を有する予測データを臭気放出ユニットに送信することであり、前記組合せが、それぞれの原臭のIDおよび割合によって特性付けられ、前記臭気放出が、物質のセットを含むディフューザを備え、各物質が、それぞれの原臭のにおいの知覚を可能にする、送信することと、
前記臭気放出が、前記分子との相互作用によって知覚されることが予期される原臭の前記組合せについての前記受信されたデータに従って、物質の前記セットからの物質を放出することを可能にすることと
をさらに含む、
請求項19に記載の1つまたは複数のコンピューティングデバイス。
【請求項21】
コンピューティングシステムによって実行可能な複数のプログラムコンポーネントを記憶するメモリを備える前記コンピューティングシステムによって実行されたときに、前記コンピューティングシステムを請求項16から18のいずれか一項に従って動作させる命令を含む、非一時的コンピュータ可読媒体。
【請求項22】
分子との相互作用によって知覚されることが予期され、請求項16に記載の方法の支援により予測される、原臭の組合せ。
【請求項23】
1つまたは複数の嗅覚的特質を可能にする分子化学構造を予測するコンピュータベースの方法であって、
コンピュータによって、
分子の少なくとも1つの嗅覚的特質に関する要件の情報を有する要件データを受信した際に、要件データに従って前記分子の空間的表面表現(SSR:spatial surface representation)上に位置する複数の点の局所的物理化学的特質の情報を有する表面点表現(SPR:surface points representation)を予測するようにトレーニングされた機械学習(ML:Machine-Learned)モデルを、前記要件データに適用することと、
前記MLモデルの出力として、前記要件データに対応する予測されたSPRの情報を有するデータを受信することと、
前記要件に合致するであろう分子の予測されるSSRおよび対応する予測される化学構造を計算するために、前記予測されたSPRを使用することと
を含む、方法。
【請求項24】
前記局所的物理化学的特質が、曲率、波カーネルシグネチャ、熱カーネルシグナル、幾何学的および距離パラメータ、電気陰性度、電子親和力、質量、部分電荷、自由電子-陽子、ならびに疎水性を含むグループから選択された1つまたは複数のパラメータによって特性付けられる、請求項23に記載の方法。
【請求項25】
前記分子に関する1つまたは複数の生成物を作製することを可能にするために、前記予測データを使用することをさらに含み、
前記作製することが、所望の臭気のためのレシピを生成することと、所望の嗅覚的特徴をもつ合成の新しい単分子および/または混合物を設計することと、得られる臭気に対する影響力なく所与のレシピを再定式化することと、前記分子を合成することとのうちの少なくとも1つを含む、
請求項23または24に記載の方法。
【請求項26】
前記要件データが、原臭の重み付けされた組合せとして臭気を指定し、
前記MLモデルが、前記所与の原臭に従って表面点表現(SPR)のパッチを予測するようにトレーニングされ、
前記方法は、
a.トレーニングされた前記MLモデルを、前記要件データによって指定された各原臭に適用することと、
b.各所与の原臭ごとに、前記MLモデルの出力として、予測されたSPRのパッチの情報を有するデータを受信することと、
c.必要とされる前記臭気に対応するSPRを計算するために、要求された前記重み付けされた組合せにおける前記原臭に対して予測された前記SPRパッチを使用することであり、前記SPRが、前記要件に合致するであろう前記分子の前記予測される化学構造を計算するために使用可能である、使用することと
をさらに含む、
請求項23から25のいずれか一項に記載の方法。
【請求項27】
プロセッサおよびメモリを備える1つまたは複数のコンピューティングデバイスであって、前記1つまたは複数のコンピューティングデバイスが、コンピュータ実行可能命令を介して、1つまたは複数の嗅覚的特質を可能にする分子化学構造を予測することが可能なシステムをクラウドコンピューティング環境において動作させるための動作を実施するように構成され、
前記動作が、
分子の少なくとも1つの嗅覚的特質に関する要件の情報を有する要件データを受信した際に、要件データに従って前記分子の空間的表面表現(SSR:spatial surface representation)上に位置する複数の点の局所的物理化学的特質の情報を有する表面点表現(SPR:surface points representation)を予測するようにトレーニングされた機械学習(ML:Machine-Learned)モデルを、前記要件データに適用することと、
前記MLモデルの出力として、前記要件データに対応する予測されたSPRの情報を有するデータを受信することと、
前記要件に合致するであろう分子の予測されるSSRおよび対応する予測される化学構造を計算するために、前記予測されたSPRを使用することと
を含む、
1つまたは複数のコンピューティングデバイス。
【請求項28】
請求項24から26のいずれか一項に記載の動作を実施するようにさらに構成された、請求項26に記載の1つまたは複数のコンピューティングデバイス。
【請求項29】
コンピューティングシステムによって実行可能な複数のプログラムコンポーネントを記憶するメモリを備える前記コンピューティングシステムによって実行されたときに、前記コンピューティングシステムを請求項23から26のいずれか一項に従って動作させる命令を含む、非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年3月9日に出願され、その全体が参照により本明細書に組み込まれる、米国仮出願第63/158,529号の利益を主張する。
【0002】
本開示の主題は、分子の嗅覚的特質を予測する技法に関し、より詳細には、機械学習の支援により分子の嗅覚的特質を予測する技法に関する。
【背景技術】
【0003】
嗅覚は、生物において、優勢で、重要で、影響を及ぼすものである。それは、近くの環境からの意識的および無意識のメッセージを提供する。嗅覚的メッセージは、多様であり得、たとえば、それらは、社会的化学信号、危険についての警報、腐った食べ物か食べられる食べ物かを指し示すことなどであり得る。
【0004】
生物は物体(たとえば、花)のにおいを感じないことが知られている。知覚される臭気は、これらの物体から放出された揮発性分子の表面との嗅覚レセプタの相互作用の結果である。分子構造と、その嗅覚的特質(たとえば、受容者によって観測される心理的、生理的および/または生物学的特質)との間には複雑な関係がある。
【0005】
構造と臭気の関係(SOR:structure-odor relationship)、および分子の嗅覚的特質の予測という問題は、従来技術において認識されており、様々な技法、たとえば、以下のものが、解決策を提供するために開発されている。
【0006】
米国特許出願公開第2012/0143804号は、臭気を評価するための装置および方法を開示している。装置は、臭気にかけられ、臭気を識別する構造を出力するための電子鼻と、抽出された構造を臭気の心地よさの事前学習された軸上の第1の位置にマッピングするニューラルネットワークと、前記第1の位置に基づいてかけられた臭気の評価を出力するための出力とを備える。評価は、ユーザが臭気をどのくらい心地よいと考えるかの予測であり得る。
【0007】
米国特許出願公開第2018/0107803号は、分子構造に基づいて人間の嗅覚知覚を予測し、分子サンプルのグループに関連付けられた分子記述子を示す分子記述子データを取得する技法を開示している。嗅覚知覚インジケータ(OPI:olfactory perception indicator)のセットのためのOPIデータも、分子サンプルに関して取得され得る。分子属性を、単一の個人のための、または個人の集合にわたるOPIと相関させる出力モデルをもたらすために、トレーニングモデルが、分子記述子データおよびOPIデータ上で実行され得る。出力モデルは、特定の化合物または混合物について、どのOPIが出力モデルにおいてその化合物または混合物の分子記述子と相関されているかに基づいて、嗅覚知覚を予測するために使用され得る。出力モデルはまた、反転され、所望のOPIのセットと相関されている分子記述子を識別するために使用され得る。次いで、分子記述子を有する分子構成体が、生成され得る。
【0008】
米国特許出願公開第2019/0156224号は、嗅覚知覚を予測するための技法を開示している。技法は、複数のインデックス付けられた嗅覚的記述子を含むライブラリを受信することと、嗅覚的ターゲット記述子を受信することと、係数行列、およびインデックス付けられた嗅覚的記述子と嗅覚的ターゲット記述子との間の知覚的距離を計算することと、嗅覚的ターゲットについての知覚的記述子予測を生成することとを含む。
【0009】
国際特許公開WO20/163860は、分子の嗅覚的特質を予測するための技法を開示している。技法は、分子に関連付けられた化学構造データに少なくとも部分的に基づいて、分子の嗅覚的特質を予測するようにトレーニングされた機械学習グラフニューラルネットワークを取得することと、選択された分子の化学構造を図式的に記述するグラフを取得することと、機械学習グラフニューラルネットワークへの入力としてグラフを提供することと、機械学習グラフニューラルネットワークの出力として、選択された分子の1つまたは複数の予測された嗅覚的特質を記述する予測データを受信することと、出力として、選択された分子の1つまたは複数の予測された嗅覚的特質を記述する予測データを提供することとを含む。
【0010】
本特許出願において引用される参考文献は、本開示の主題に適用可能であり得る背景情報を教示する。これらの公報の全内容は、適切な場合、追加または代替の詳細、特徴および/または技術背景の適切な教示のために、参照により本明細書に組み込まれる。
【発明の概要】
【0011】
分子表面の特質は、その分子との相互作用の性質を定義する。しかしながら、分子表面上の特質は、幾何学の観点からも、化学の観点からも、均一ではない。発明者らは、分子の嗅覚的特質を予測する際に分子表面の局所的特質を考えることの必要性を認識した。
【0012】
本開示の主題のいくつかの態様によれば、化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測するコンピュータベースの方法であって、分子の化学構造に対応する分子の空間的表面表現(SSR:spatial surface representation)の情報を有するデータを取得した際に、SSR上でN個の複数の表面点を選択することと、各選択された表面点ごとに選択された表面点のSSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR:surface points representation)を生じることと、SPRに従って少なくとも1つの嗅覚的特質に関する予測データを提供するようにトレーニングされた機械学習(ML:Machine-Learned)モデルに、SPRの情報を有するデータを入力することと、MLモデルの出力として、分子の少なくとも1つの嗅覚的特質に関する予測データを受信することとを含む、方法が提供される。
【0013】
局所的物理化学的特質は、曲率、波カーネルシグネチャ、熱カーネルシグナル、幾何学的および距離パラメータ、電気陰性度、電子親和力、質量、部分電荷、自由電子-陽子、疎水性などを含むグループから選択された1つまたは複数のパラメータによって特性付けられ得る。
【0014】
分子の嗅覚的特質に関する予測データは、分子が特定の嗅覚知覚品質を有するか否かを示す予測データと、1つまたは複数の嗅覚的特質クラスに分子を分類する情報を有する予測データと、予測された香気/臭気の強度の情報を有する予測データと、2つ以上の分子の嗅覚的特質の類似度を示す予測データと、2つ以上の分子の混合物の嗅覚的特質に対する2つ以上の分子の影響の情報を有する予測データと、原臭を定義するために使用可能な予測データと、におい混合物の知覚的類似度を予測するために使用可能な予測データなどを含むグループから選択され得る。
【0015】
本方法は、分子に関する1つまたは複数の生成物を作製することを可能にするために、予測データを使用することをさらに含むことができる。作製することは、所望の臭気のためのレシピを生成することと、所望の嗅覚的特徴をもつ合成の新しい単分子および/または混合物を設計することと、得られる臭気に対する影響力なく所与のレシピを再定式化することと、分子を合成することなどのうちの少なくとも1つを含むことができる。
【0016】
本方法は、SPRを前処理することをさらに含むことができ、前処理の結果が、SPRの情報を有するデータとして使用される。随意に、SPRを前処理することは、選択された表面点を2次元の行列に変換することを含むことができる。
【0017】
表面点は、三角形メッシュのノードとして選択され得る、均等に選択され、点群の幾何学的データ構造として扱われ得る、などである。
【0018】
MLモデルは、畳み込みニューラルネットワーク、PointNetニューラルネットワークもしくは任意の他の好適なMLモデルまたはそれらの組合せであり得る。
【0019】
さらなる態様によれば、および随意に本開示の主題の他の態様と組み合わせて、本方法は、1つまたは複数の原臭に対応する1つまたは複数のSPRパッチを認識するようにさらにトレーニングされたMLモデルへの入力として、SPRの情報を有するデータを使用することをさらに含むことができ、分子の少なくとも1つの嗅覚的特質に関する出力された予測データは、分子との相互作用によって知覚されることが予期される1つまたは複数の原臭の情報を有するものである。原臭の情報を有する受信された予測データは、臭気のデジタル化のために使用され得る。
【0020】
本開示の主題の他の態様によれば、プロセッサおよびメモリを備える1つまたは複数のコンピューティングデバイスであって、1つまたは複数のコンピューティングデバイスが、コンピュータ実行可能命令を介して、化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測することが可能なシステムをクラウドコンピューティング環境において動作させるための動作を実施するように構成された、1つまたは複数のコンピューティングデバイスが提供される。動作は、分子の化学構造に対応する分子の空間的表面表現(SSR)の情報を有するデータを取得した際に、SSR上でN個の複数の表面点を選択することと、各選択された表面点ごとに選択された表面点のSSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR)を生じることと、SPRに従って少なくとも1つの嗅覚的特質に関する予測データを提供するようにトレーニングされた機械学習(ML)モデルに、SPRの情報を有するデータを入力することと、MLモデルの出力として、分子の少なくとも1つの嗅覚的特質に関する予測データを受信することとを含む。
【0021】
本開示の主題の他の態様によれば、化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測するコンピュータベースの方法が提供される。本方法は、分子の化学構造に対応する分子の空間的表面表現(SSR)の情報を有するデータを取得した際に、SSR上でN個の複数の表面点を選択することと、各選択された表面点ごとに選択された表面点のSSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR)を生じることと、1つまたは複数の原臭に対応する1つまたは複数のSPRパッチを認識するようにトレーニングされた機械学習(ML)モデルに、SPRの情報を有するデータを入力することと、MLモデルの出力として、分子との相互作用によって知覚されることが予期される原臭の組合せの情報を有する予測データを受信することとを含む。
【0022】
さらなる態様によれば、および随意に本開示の主題の他の態様と組み合わせて、本方法は、原臭の組合せの情報を有する予測データを臭気放出ユニットに送信することであり、組合せが、それぞれの原臭のIDおよび割合によって特性付けられ、臭気放出が、物質のセットを含むディフューザを備え、各物質が、それぞれの原臭のにおいの知覚を可能にする、送信することと、臭気放出が、分子との相互作用によって知覚されることが予期される原臭の組合せについての受信されたデータに従って、物質のセットからの物質を放出することを可能にすることとをさらに含む。
【0023】
本開示の主題の他の態様によれば、プロセッサおよびメモリを備える1つまたは複数のコンピューティングデバイスであって、1つまたは複数のコンピューティングデバイスが、コンピュータ実行可能命令を介して、化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測することが可能なシステムをクラウドコンピューティング環境において動作させるための動作を実施するように構成された、1つまたは複数のコンピューティングデバイスが提供される。動作は、分子の化学構造に対応する分子の空間的表面表現(SSR)の情報を有するデータを取得した際に、SSR上でN個の複数の表面点を選択することと、各選択された表面点ごとに選択された表面点のSSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR)を生じることと、1つまたは複数の原臭に対応する1つまたは複数のSPRパッチを認識するようにトレーニングされた機械学習(ML)モデルに、SPRの情報を有するデータを入力することと、MLモデルの出力として、分子との相互作用によって知覚されることが予期される原臭の組合せの情報を有する予測データを受信することとを含む。
【0024】
動作は、原臭の組合せの情報を有する予測データを臭気放出ユニットに送信することであり、組合せが、それぞれの原臭のIDおよび割合によって特性付けられ、臭気放出が、物質のセットを含むディフューザを備え、各物質が、それぞれの原臭のにおいの知覚を可能にする、送信することと、臭気放出が、分子との相互作用によって知覚されることが予期される原臭の組合せについての受信されたデータに従って、物質のセットからの物質を放出することを可能にすることとをさらに含むことができる。
【0025】
本開示の主題の他の態様によれば、1つまたは複数の嗅覚的特質を可能にする分子化学構造を予測するコンピュータベースの方法が提供される。本方法は、分子の少なくとも1つの嗅覚的特質に関する要件の情報を有する要件データを受信した際に、要件データに従って分子の空間的表面表現(SSR)上に位置する複数の点の局所的物理化学的特質の情報を有する表面点表現(SPR)を予測するようにトレーニングされた機械学習(ML)モデルを、要件データに適用することと、MLモデルの出力として、要件データに対応する予測されたSPRの情報を有するデータを受信することと、要件に合致するであろう分子の予測されるSSRおよび対応する予測される化学構造を計算するために、予測されたSPRを使用することとを含む。
【0026】
さらなる態様によれば、および随意に本開示の主題の他の態様と組み合わせて、要件データは、原臭の重み付けされた組合せとして臭気を指定することができ、MLモデルは、所与の原臭に従って表面点表現(SPR)のパッチを予測するようにトレーニングされ得る。本方法は、トレーニングされたMLモデルを、要件データによって指定された各原臭に適用することと、各所与の原臭ごとに、MLモデルの出力として、予測されたSPRのパッチの情報を有するデータを受信することと、必要とされる臭気に対応するSPRを計算するために、要求された重み付けされた組合せにおける原臭に対して予測されたSPRパッチを使用することであり、SPRが、要件に合致するであろう分子の予測される化学構造を計算するために使用可能である、使用することとを含むことができる。
【0027】
本開示の主題の他の態様によれば、プロセッサおよびメモリを備える1つまたは複数のコンピューティングデバイスであって、1つまたは複数のコンピューティングデバイスが、コンピュータ実行可能命令を介して、1つまたは複数の嗅覚的特質を可能にする分子化学構造を予測することが可能なシステムをクラウドコンピューティング環境において動作させるための動作を実施するように構成された、1つまたは複数のコンピューティングデバイスが提供される。動作は、分子の少なくとも1つの嗅覚的特質に関する要件の情報を有する要件データを受信した際に、要件データに従って分子の空間的表面表現(SSR)上に位置する複数の点の局所的物理化学的特質の情報を有する表面点表現(SPR)を予測するようにトレーニングされた機械学習(ML)モデルを、要件データに適用することと、MLモデルの出力として、要件データに対応する予測されたSPRの情報を有するデータを受信することと、要件に合致するであろう分子の予測されるSSRおよび対応する予測される化学構造を計算するために、予測されたSPRを使用することとを含む。
【0028】
本開示の主題の他の態様によれば、コンピューティングシステムによって実行可能な複数のプログラムコンポーネントを記憶するメモリを備えるコンピューティングシステムによって実行されたときに、コンピューティングシステムを上記の態様のうちのいずれかに従って動作させる命令を含む、非一時的コンピュータ可読媒体が提供される。
【0029】
本開示の主題のいくつかの実施形態の利点の一つは、分子表面の局所的特質を考慮することによって、分子の1つまたは複数の嗅覚的特徴に関するデータの予測の精度を改善することである。
【図面の簡単な説明】
【0030】
本発明を理解するために、および本発明がどのように実践され得るかを検討するために、実施形態が、添付の図面を参照しながら非限定的な例として説明される。
【0031】
図1図1は、本開示の主題のいくつかの実施形態に従って構成された予測システムのブロック図である。
図2図2aは、本開示の主題のいくつかの実施形態に従って、嗅覚的特質に関するデータの予測の一般化されたフローチャートである。図2bは、本開示の主題のいくつかの実施形態に従って、分子の化学構造に対応する原臭の予測の一般化されたフローチャートである。図2cは、デジタル化された臭気に基づく、および本開示の主題のいくつかの実施形態に従って構成された、臭気通信システムの一般化されたブロック図である。
図3図3aは、本開示の主題のいくつかの実施形態に従って、本開示の主題のいくつかの実施形態による1つまたは複数の嗅覚的特質を可能にする分子化学構造の予測の一般化されたフローチャートである。図3bは、本開示の主題のいくつかの実施形態に従って、原臭の重み付けされた組合せを可能にする分子化学構造の予測の一般化されたフローチャートである。
図4図4aおよび図4bは、本開示の主題の他のいくつかの実施形態による、MLモデルを適用する前のメッシュベースの表面点表現(SPR)処理の例示的な一般化された図である。
図5図5a~図5cは、本開示の主題の他のいくつかの実施形態による、PointNetベースのMLモデルの適用の例示的な一般化された図である。
図6図6aおよび図6bは、データの例示的な交差検証スプリットのために計算されたスコアの平均値および標準偏差値を図示する図である。
図7図7a~図7dは、臭気強度の分散の予測の例示的な結果を図示する図である。
図8図8は、様々な濃度に対する分子の臭気強度の予測の例示的な結果を図示する図である。
【発明を実施するための形態】
【0032】
以下の発明を実施するための形態では、本発明の完全な理解を提供するために、多数の具体的な詳細が記載される。しかしながら、本開示の主題はこれらの具体的な詳細なしに実践され得ることが、当業者には理解されよう。他の事例では、よく知られている方法、手順、構成要素および回路は、本開示の主題を不明瞭にしないように、詳細には説明されない。
【0033】
別段に明記されない限り、以下の議論から明らかなように、本明細書全体にわたって、「取得すること」、「計算すること」、「選択すること」、「マッピングすること」、「入力すること」、「出力すること」などの用語を利用する議論は、データを操作し、および/またはデータを他のデータに変換するコンピュータの作用および/またはプロセスを指し、前記データは、電子的などの物理的な量として表現される、および/または、前記データは、物理的物体を表現することを諒解されたい。「コンピュータ」という用語は、非限定的な例として本出願において開示される予測システムを含む、データ処理能力をもつ任意の種類のハードウェアベースの電子デバイスを包含すると広く解釈されるべきである。
【0034】
本明細書の教示による動作は、所望の目的のために特別に構築されたコンピュータによって、または非一時的コンピュータ可読記憶媒体に記憶されたコンピュータプログラムによって所望の目的のために特別に構成された汎用コンピュータよって実施され得る。
【0035】
例証の目的のみで、以下の説明は、人間によって観測可能な嗅覚的特質に関わるものである。当業者は、本開示の主題の教示が、同様に、他の生物によって観測可能な嗅覚的特質に適用可能であることを容易に諒解するであろう。
【0036】
これを念頭において、本開示の主題のいくつかの実施形態に従って、単一の分子および/またはその混合物の嗅覚的特質に関する予測データを提供するために使用可能な予測システム100の一般化されたブロック図を図示する図1に注目する。予測システム100は、それぞれの分子に関する生成物を作製する前に、または作製プロセスの一部として使用され得る。予測システム100の動作が、図2図8を参照しながらさらに詳述される。
【0037】
非限定的な例として、分子の嗅覚的特質に関する予測データは、
- 分子が特定の嗅覚知覚品質を有するか否かを示す予測データ、
- (たとえば、テキストラベルまたは非テキスト臭気表現に対応する)1つまたは複数の嗅覚的特質クラスに分子を分類する情報を有する予測データ、
- 予測された香気/臭気の強度の情報を有する予測データ、
- 2つ以上の分子の嗅覚的特質の類似度を示す予測データ、
- 2つ以上の分子の混合物の嗅覚的特質に対する2つ以上の分子の影響の情報を有する予測データ、
- 分子構造に対する変更が、その嗅覚的特質にどのように影響を及ぼす可能性があるかを示す予測データ、
- 1つまたは複数の所望の嗅覚的特質を提供するであろう分子化学構造の予測データ、
- 原臭を定義するために使用可能な予測データ、
- におい混合物の知覚的類似度を予測するために使用可能な予測データ
などを含むことができる。
【0038】
分子の嗅覚的特質に関する予測データは、それぞれの分子に関する生成物を作製するために使用可能であり得る。作製することは、所望の臭気をもつレシピを生成することと、所望の嗅覚的特徴をもつ合成の新しい単分子および混合物を設計することと、得られる臭気に対する影響力なく所与のレシピを再定式化することと、原臭(においのRGB)を使用することと、においのデジタル化と、結果を合成することなどを含むことができる。
【0039】
予測システム100は、ハードウェアベースの入出力(I/O)インターフェース103およびグラフィカルユーザインターフェース(GUI)110に動作可能に接続された処理およびメモリ回路(PMC:processing and memory circuitry)104を備える。
【0040】
PMC104は、図2図8を参照しながらさらに詳述されるように、予測システムを動作させるのに必要な処理を提供するように構成される。PMC104は、プロセッサおよびメモリ(PMC104内では別々に示されていない)を備える。
【0041】
PMC104のプロセッサは、非一時的コンピュータ可読メモリ上に実装されたコンピュータ可読命令に従っていくつかのプログラムコンポーネントを実行するように構成され得る。そのような実行可能プログラムコンポーネントは、PMCに備えられた機能ブロックとして以下で言及される。機能ブロックは、ファームウェアおよび/またはハードウェアとのソフトウェアの任意の適切な組合せで実装され得る。
【0042】
PMC104に備えられた機能モジュールは、表面モデリングユニット108に動作可能に接続された点ベースの入力モデリングユニット109に動作可能に接続された予測エンジン105を含む。
【0043】
予測エンジンは、トレーニングユニット106と実行時ユニット107とを備える。
【0044】
トレーニングユニット106は、1つまたは複数のMLモデル(たとえば、非線形モデルおよび/または線形モデルを含む、深層ニューラルネットワーク、サポートベクターマシン(SVM)、ランダムフォレストMLモデル、または他のタイプの機械学習モデル)を備え、トレーニングデータのセット上で1つまたは複数のMLモデルをトレーニングするように構成される。
【0045】
トレーニングデータのセットは、各分子ごとに、分子の表面上で選択されたN個の複数の点の局所的物理化学的特性および空間的位置に基づく、関連付けられた一意表現(「表面点表現」と以下で呼ばれる)を含む。随意に、トレーニングデータは、それぞれの分子の空間的表面構造の情報を有するデータをさらに含むことができる。
【0046】
いくつかの実施形態では、トレーニングユニット106は、I/Oインターフェース103を介して予測システム100に動作可能に接続されたトレーニングデータデータベース102からトレーニングデータを取得することができる。代替または追加として、トレーニングデータの少なくとも一部は、利用可能な産業データベース(たとえば、公共の、またはプライベートの分子データベース101)から得られる、専門家によって手動で提供される、予測システム100の以前の動作の結果である、などであり得る。非限定的な例として、トレーニングデータの少なくとも一部は、におい分子キャラクタ記述のための定量データベースおよび全知覚空間の定義を表現するDravnieksのsmell atlas[1]に含まれるデータ、314個の原材料の知覚される強度曲線を含むWakayamaデータベース[2]に含まれるデータ、などから得られ得る。
【0047】
1つまたは複数のMLモデルは、表面点表現の情報を有する入力データに応答して嗅覚的特質に関する予測データを提供するようにトレーニングされる(またはその逆も同様である)。たとえば、Wakayamaによって行われた実験結果は、予測された結果を学習し、テストし、検証するためのグランドトゥルースとして使用され得る。随意に、MLモデルは、それぞれの予測の信頼性レベルを提供するようにさらにトレーニングされ得る。
【0048】
実行時ユニット107は、分子の表面点表現に1つまたは複数のトレーニングされたMLモデルを適用するように、およびそれぞれの嗅覚的特徴に関するデータを出力するように構成される。同じように、実行時ユニット107は、1つまたは複数の所望の嗅覚的特徴に関するデータに1つまたは複数のトレーニングされたMLモデルを適用するように、ならびに(既存の、または仮想の)分子およびそれらの化学的特質を一意に特性付ける表面点表現を出力するように構成され得る。
【0049】
嗅覚的特質に関する取得された予測データは、記憶ユニット111に送られる、および/または1つまたは複数のユーザデバイスに送信され得る。記憶ユニット111は、オペレーティングシステム100に必要な任意のデータ、たとえば、システム100の入力および出力に関するデータ、ならびにシステム100によって生成された中間処理結果を記憶するようにさらに構成され得る。
【0050】
GUI110は、ユーザ指定の入力を可能にし、システム100に関する出力をレンダリングするように構成される。
【0051】
随意に、予測システム100は、通信ネットワーク110(たとえばインターネット)を介して、(131-1~131-3で示される)1つまたは複数のユーザコンピュータに動作可能に接続され得る。予測システム100は、初期入力データ(たとえば、所望の嗅覚的特質または1つまたは複数の分子の指定)を指定する要求をユーザコンピュータから受信し、嗅覚的特質に関するそれぞれの予測データを生成し、生成されたデータをユーザ(人またはアプリケーション)に提供するように構成され得る。
【0052】
本開示の主題の教示は、図1を参照しながら説明された予測システムによって限定されないことに留意されたい。均等なおよび/または修正された機能が、別の様式で統合または分割され得、ファームウェアおよび/またはハードウェアとのソフトウェアの任意の適切な組合せで実装され、1つまたは複数の好適なデバイス上で実行され得る。予測システムの機能の少なくとも一部は、クラウドならびに/または分散および/もしくは仮想化されたコンピューティング装置で実装され得る。データベース101および/もしくは102、ストレージ111、GUI110、表面モデリングユニット108ならびに/またはトレーニングユニット106の少なくとも一部は、予測システム100の外部にあり、I/Oインターフェース103を介するデータ通信において動作することができる。
【0053】
図2aを参照すると、本開示の主題のいくつかの実施形態による、嗅覚的特質に関するデータの実行時予測の一般化されたフローチャートが提供される。
【0054】
予測システム100は、関心の分子およびその化学構造を示すデータを取得する(201)。そのようなデータは、ユーザコンピュータから受信される、GUIまたはI/Oインターフェースを介して受信された要求に応答して分子DB101から受信される、などであり得る。予測システムは、分子の化学構造のデータを(たとえば、CASまたはCIDデータベースにおける)そのIDに従って取得するか、(たとえば、簡略化された分子-入力ライン-エントリシステム(SMILES:simplified molecular-input line-entry system)文字列として、および/または同様のもの)分子の化学構造の規格化された説明としてそれを受信するか、またはそれ以外であり得る。
【0055】
予測システム100(たとえば、表面モデリングユニット108)は、分子の化学構造に対応する分子の空間的表面表現(SSR)の情報を有するデータをさらに取得する(202)。そのようなデータは、当技術分野において知られている任意の好適な技法(たとえば、[3]を参照されたい)を使用して予測システム100によって生成されるか、または分子DB101から(利用可能な場合)受信され得る。
【0056】
図4図8を参照しながらさらに詳述されるように、予測システム100(たとえば、点ベースの入力モデリングユニット108)は、SSR上でN個の複数の点を分子の選択し(203)、各選択された表面点ごとに選択された表面点のSSR上の空間的位置および局所的物理化学的特質の情報を有するデータを取得し(そのようなデータは、それぞれの表面点の局所的データと以下で呼ばれる)、表面点表現(SPR)を生じる(204)。
【0057】
表面点の物理化学的特質は、表面点が選択された点の間の平均距離より小さい(および好ましくは、実質的により小さい)半径をもつ表面点の近接度を特性付けるとき、局所的とみなされることに留意されたい。
【0058】
物理化学的特質は、以下の物理化学的パラメータ、すなわち、曲率、波カーネルシグネチャ、熱カーネルシグナル、幾何学的および距離パラメータ、電気陰性度、電子親和力、質量、部分電荷、自由電子-陽子、疎水性などのうちの1つまたは複数によって特性付けられ得る。
【0059】
所与の選択された点の物理化学的パラメータは、様々な技法によって計算され得る。非限定的な例として、パラメータは、直接的な幾何学的計算の支援により計算され得、各ノードについての値は、分子内の全ての原子の重み付けされた距離平均として計算される。随意に、この計算について、パラメータは、それぞれのパラメータの幾何学に関わるふるまいに従って因子化され得る。別の非限定的な例として、物理化学的パラメータは、密度汎関数理論(DFT:Density Functional Theory)ソフトウェア(たとえば、[3]を参照されたい)の支援により計算され得る。
【0060】
予測システム100(たとえば、実行時ユニット107)は、SPRに従って少なくとも1つの嗅覚的特質に関する予測データを提供するようにトレーニングされた機械学習(ML)モデルに、表面点表現(またはその派生物)を入力し(205)、MLモデルの出力として、分子の少なくとも1つの嗅覚的特質に関する予測データを受信する(206)。
【0061】
予測データは、分子に関する1つまたは複数の生成物を作製することを可能にするために使用され得る(207)。
【0062】
本開示の主題のいくつかの実施形態によれば、図2aに図示されているプロセスは、分子の化学構造に対応する1つまたは複数の原臭を予測するように修正され得る。原臭は、それらによって他の臭気が組み合わせられ得る臭気のセットを構成する。原臭の概念は、いかなる色も三原色(たとえば赤、緑および青)の組合せによって表現され得るという、視覚におけるRGB概念と同様である。
【0063】
分子の化学構造に対応する原臭の実行時予測の一般化されたフローチャートが、図2bに図示されている。動作201~204において表面点表現を取得した際に、予測システム100は、少なくとも1つの原臭に対応する少なくとも1つのSPRパッチを認識するようにトレーニングされた機械学習(ML)モデルへの入力としてSPR(またはその派生物)を使用する(215)。予測システム100は、MLモデルの出力として、分子との相互作用によって知覚されることが予期される少なくとも1つの原臭の情報を有する予測データを受信する(216)。そのようなデータは、においのデジタル化に基づく多様な応用のために使用可能である。
【0064】
図2cを参照すると、デジタル化された臭気に基づく臭気通信システムの一般化されたブロック図が図示されている。臭気通信システムは、臭気認識ユニット221(たとえば、e-ノーズ、GC機器など)および臭気放出ユニット222に(たとえば、データ通信ネットワーク223を介して)動作可能に接続された予測システム100を備える。におい認識ユニットは、検知された臭気に対応する分子の化学構造を識別するように構成される。予測システム100は、識別された化学構造の情報を有するデータをにおい認識ユニット221から受信し、図2bを参照しながら詳述された様式で、この化学構造に対応し、それにより、検知された臭気を達成するために必要とされる、原臭の組合せを定義するように構成される。予測システム100は、原臭(たとえば、それぞれの原臭のID、および必要とされる割合)のそれぞれの組合せの情報を有するデータを、臭気放出ユニット222に送信する。放出ユニット222は、原臭のセットに対応する物質(換言すれば、それぞれの原臭のにおいの知覚を可能にする各物質)を含むディフューザを備え、原臭の組合せについての受信されたデータに従ってそれぞれの物質を放出するように構成される。
【0065】
図3aを参照すると、本開示の主題の他のいくつかの実施形態による、1つまたは複数の嗅覚的特質を可能にする分子化学構造の実行時予測の一般化されたフローチャートが提供されている。
【0066】
予測システム100は、(「要件データ」と以下で呼ばれる)分子の少なくとも1つの嗅覚的特質に関する要件の情報を有する要求を受信する(301)。非限定的な例として、要求は、ユーザデバイスから、またはGUIを介して受信され得、所望の嗅覚的特質、類似する分子などを指定することができる。
【0067】
予測システム100は、要件データに従ってSPRを予測するようにトレーニングされたMLモデルを、要件データに適用し(302)、MLモデルの出力として、SPRの情報を有するデータ、換言すれば、各々がそれぞれの局所的データによって特性付けられた複数の表面点の情報を有するデータを受信する(303)。
【0068】
予測システム100は、予測された空間的表面表現、したがって、要件に合致するであろう(既知の、または仮想の)分子の予測される化学構造を計算するために、予測されたSPRを使用し(304)、分子に関する1つまたは複数の生成物を作製することを可能にするために、予測された化学構造データを使用する(305)。
【0069】
本開示の主題のいくつかの実施形態によれば、図3aに図示されているプロセスは、原臭のために必要とされる分子の断片を予測するように修正され得る。
【0070】
原臭の重み付けされた組合せを可能にする分子化学構造の実行時予測の一般化されたフローチャートが、図3bに図示されている。原臭の重み付けされた組合せとして臭気を指定する要求を取得した(311)後に、予測システム100は、所与の原臭に従って表面点表現(SPR)のパッチを予測するようにトレーニングされたMLモデルを、各所与の原臭に適用する(312)。各所与の原臭ごとに、予測システム100は、MLモデルの出力として、予測されたSPRのパッチの情報を有するデータを受信する(313)。MLモデルは、あらかじめ定義された信頼性レベルに合致する予測を提供する最も小さい埋め込み特徴ベクトルに対応するものとしてパッチを定義することができる。
【0071】
予測システム100は、必要とされる臭気に対応するSPRを計算するために、要求された重み付けされた組合せにおける原臭に対して予測されたSPRパッチを使用する(314)。計算されたSPRは、必要とされる臭気の知覚を可能にする予測される化学構造を計算するためにさらに使用される(315)。
【0072】
いくつかの実施形態によれば、予測システム100は、におい混合物の知覚的類似度を予測するようにさらに動作することができる。分子の嗅覚的特質に関する予測データは、知覚空間における予測出力ベクトルを生成するために使用され得る。予測出力ベクトルは、知覚的記述子の各タイプのためのスコアを含むベクトルであり、そのようなスコアは、MLモデルの出力として取得され得る。
【0073】
分子のSPRは、その知覚的特質に相関し、異なるSPRパッチの組合せは、特定のにおいをもたらす。これにより、MLモデルは、混合物中の2つ以上の分子のSPRパッチの組合せを予測するように、したがって、その1つまたは複数の知覚特質を予測するようにさらにトレーニングされ得る。
【0074】
2つ以上の分子の任意の混合物が、分子の予測出力ベクトルの組合せに対応する合成ベクトルによって知覚空間において表現され得る。この組合せは、直接的ではない。キャラクタXを伴うベクトルにキャラクタYを伴うベクトルを加えると、キャラクタZを伴う合成ベクトルになり得る。たとえば、V1(3;0;0,...)にV2(0;3;0...)を加えると、V3(0;0;2...)に等しくなり、追加の例は、イチゴのにおいにキャラメルのにおいを加えたときに、パイナップルのにおいが得られるということである。
【0075】
知覚空間における同様の合成ベクトルによって特性付けられる異なる混合物は、同等の知覚特質を有することになる。そのような合成ベクトルの間の距離は、それらの間の差異のレベルを決定することになり、距離が大きくなればなるほど、差異は大きくなる。合成ベクトルの間の距離は、コサイン、相関、ユークリッド距離などとして計算され得る。混合物の間の距離(差異)は、任意の所与の混合物に合致した式を作成するためおよびその再定式化のために使用され得る。
【0076】
随意に、所望のにおいは、原臭の組合せとして定義され得、出力ベクトルは、たとえば、図3bを参照しながら詳述されたように取得されたそれぞれのSPRパッチを使用して定義され得る。
【0077】
図1図3を参照しながら上記で詳述されたように、表面点表現(SPR)は、選択された表面点SSR上での空間的位置および局所的物理化学的特質の情報を有するデータに基づく。分子のSPRは、様々なモデルを使用することによって生成され得る。たとえば、SPR上の点は、三角形メッシュまたは他のタイプのメッシュのノードとみなされ得る、点群の幾何学的データ構造として選択され、扱われ得る、などである。選択される表面点の数およびその選択様式は、適用されるモデルに依存する。
【0078】
非限定的な例として、表面点は、[4]に開示されているMSMSプログラム、open3dライブラリ、または三角形メッシュを作成することに好適な任意の他のプログラムによって作成された三角形メッシュのノードとして選択され得る。
【0079】
いくつかの実施形態は、SPR前処理と、それぞれのSPR派生物にMLモデルを適用することとを含むことができる。そのような実施形態の非限定的な例が、図4aおよび図4bに図示されている。例示的な一般化された図は、3次元の特殊表面表現(SSR)401上で選択された(Pとして示された)表面点を、2次元の行列402に変換するようにSPRを前処理することと、さらに、行列402を畳み込みニューラルネットワーク(CNN)403に入力することとを図示する。
【0080】
SPR変換は、すべてのデータの連続性を保ち周期性を倍加するように、シームレスで連続的な様式で提供され、したがって、循環パディングを伴う畳み込みが、表面の元の境界状態を保存する。あらゆる分子について、著しい数の拡大が可能である。
【0081】
非限定的な例として、変換は、2つのステップ、すなわち、表面から球体への変換と、それに続く、球体から像への変換とを含むことができる。表面から球体への変換は、たとえば、[5]に開示されている様式で提供され得、球体から像への変換は、[6]または[7]に開示されている技法の支援により提供され得る。得られた2次元の像(行列402)は、少なくとも1つの嗅覚的特徴の情報を有する予測データを提供するようにトレーニングされたCNN403に入力される。
【0082】
図5a~図5cは、本開示の主題の他のいくつかの実施形態による、PointNetベースのMLモデルの適用の例示的な一般化された図を図示する。
【0083】
PointNetは、ボクセル化またはレンダリングを必要としない、幾何学的データ構造として点群を直接消費する、ニューラルネットワークの一種である。分類ネットワークとして実装されるとき(たとえば、[8]を参照されたい)、PointNetは、入力としてn個の点を取り、入力および特徴変換を適用し、次いで、最大プーリングによって点特徴を集約する。出力は、m個のクラスのための分類スコアである。セグメンテーションネットワークは、分類ネットへの拡張である。それは、全体特徴および局所的特徴を連結し、点スコアごとに出力する。
【0084】
本開示の主題のいくつかの実施形態によれば、SPR501は、N個の均等に選択された表面点を表現し、各表面点は、その空間座標および物理化学的特質を含むM個の特徴によって特性付けられる。正規化時に、N個の点の情報を有するデータは、[N点×M特徴]サイズの入力層502をもつPointNetモデルに入力される。非限定的な例として、Nは、256≦N≦1024と定義され得る。特徴は、x座標、y座標、z座標、曲率、原子質量、疎水性、部分電荷および電子供与体を含むことができる。
【0085】
PointNetモデルの出力は、(CNN分類と同様の)あらゆる可能なクラスについての可能性のベクトル、または(セマンティックセグメンテーションと同様の)あらゆる点のクラスを記述する行列であり得る。
【0086】
非限定的な例として、図5aに図示されているPointNetモデルは、マルチクラス分類の支援により、またはマルチラベルタスクとして知覚に関わる嗅覚的特質を予測するために使用可能であり得る。
【0087】
図示されたPointNetモデルは、特徴抽出層503および予測層504を備える。特徴抽出層503は、各点が、同じ点の他の特徴を用いて評価されているように特徴の非線形組合せを提供するように構成される。特徴抽出層503の出力は、[N点×ボトルネックサイズ]のサイズを有し、ここで、ボトルネックサイズは、特徴集約によって取得される全体特徴ベクトルの長さである。非限定的な例として、ボトルネックサイズは、128、526または1024として選択され得る。
【0088】
非限定的な例として、図5bに図示されているPointNetモデルは、臭気強度を予測するために適用され得る。強度予測結果は、2つの主なタスク、すなわち、(1)飽和強度(I max)および(2)強度曲線に細分され得る。第2のタスクは、平均値と標準偏差値とに分割され得る。
【0089】
I maxタスクは、1つの出力ニューロンを生じ、学習は、L2損失を使用して最適化される。ニューラルネットワークの精度を評価するためのメトリックは、相関と2乗平均平方根誤差(RMSE)の両方であり得る。図6aは、データの例示的な交差検証スプリットのために計算されたスコアの平均値および標準偏差値を示す。図6bは、スプリットのうちの1つについてI maxの実際の値に対して予測される散布図を図示する。
【0090】
臭気強度は正確な測度を有さず、各評価器は、(それ自体の間で、および他のものと比較して)大きな分散を有して臭気強度を推定し得ることが知られている。本開示の主題のいくつかの実施形態によれば、図5cのPointNetモデルは、強度の変動値を予測するように構成される。PointNetモデルは、ヒートマップを予測するようにトレーニングされた2次元の行列を生成する、追加された逆畳み込みネットワーク505を含むように修正される。ヒートマップは、あらゆる濃度について強度の可能性の情報を有するものであり、各ピクセルは、分子がある濃度(水平軸)についてある強度(垂直軸)を有する可能性の情報を有するものである。
【0091】
図7a~図7dを参照すると、臭気強度の分散の予測の例示的な結果が図示されている。図7aは、グランドトゥルースヒートマップを図示し、図7bは、MLモデルによる予測ヒートマップを図示し、図7cは、穴を閉じた後の図7bのヒートマップを図示する。図7dは、予測結果の、上側および下側境界曲線を抽出するための平滑化ならびにシグモイド関数への近似の後の、抽出されたエッジを図示する。
【0092】
図8は様々な濃度に対する分子の臭気強度の予測の例示的な結果を図示する。MLモデルは、シグモイド関数に近似するようにさらに後処理された40個の値を予測した。ラベルデータは、異なる濃度について分子の強度についての情報を含むWakayamaデータベースから受信した。
【0093】
参考文献:
[1]Dravnieks,A.、(1985)、Atlas of odor character profiles
[2]Wakayama,H.、Sakasai,M.、Yoshikawa,K.、およびInoue,M.、(2019)、Method for Predicting Odor Intensity of Perfumery Raw Materials Using Dose-Response Curve Database、Industrial&Engineering Chemistry Research、58(32)、15036~15044
[3]Computational Chemistry、David Young、Wiley-Interscience、2001、Appendix A.A.1.6、330ページ、Spartan
[4]Sanner、Michel F.、Arthur J.Olson、およびJean-Claude Spehner、「Reduced surface:an efficient way to compute molecular surfaces」、Biopolymers、38.3、(1996):305~320
[5]Lam,K.C.、P.T.Choi、およびL.M.Lui、「FLASH:Fast Landmark Aligned Spherical Harmonic Parameterization for Genus-0 Closed Brain Surfaces」、UCLA CAM Report、(2013):13~79
[6]Solanilla,Leonardo、Arnold Oostra、およびJuan Pablo Yanez、「Peirce quincuncial projection」、Revista Integracion、34.1、(2016):23~38
[7]Peirce C.S.、「A Quincuncial Projection of the Sphere」、Amer.J.Math.2、(1879)、No.4、394~396
[8]Charles R.Qi、Hao Su、Kaichun Mo、Leonidas J.Guibas、「PointNet:Deep Learning on Point Sets for 3D Classification and Segmentation」、スタンフォード大学、Conference on Computer Vision and Pattern Recognition(CVPR)、2017
【0094】
本発明は、本明細書に含まれている説明に記載されている、または図面に図示されている詳細に、その適用が限定されないことを理解されたい。本発明は、他の実施形態が可能であり、様々なやり方で実践され、実行されることが可能である。それゆえに、本明細書で採用される表現および用語は、説明のためのものであり、限定するものとみなされるべきではないことを理解されたい。したがって、当業者は、本開示が基づく概念が、本開示の主題のいくつかの目的を実行するための他の構造、方法、およびシステムを設計するための基礎として容易に利用され得ることを諒解されよう。
【0095】
本発明によるシステムは、少なくとも部分的に、適切にプログラムされたコンピュータ上で実施され得ることも理解されよう。同じように、本発明は、本発明の方法を実行するためにコンピュータによって可読であるコンピュータプログラムを企図する。本発明は、本発明の方法を実行するためにコンピュータによって実行可能な命令のプログラムを有形に具現化する非一時的コンピュータ可読メモリをさらに企図する。
【0096】
様々な修正および変更が、先に説明された本発明の実施形態に、添付の特許請求の範囲においておよびそれらによって定義される範囲から逸脱することなく、適用され得ることを当業者は容易に諒解されよう。
図1
図2-1】
図2-2】
図2-3】
図3-1】
図3-2】
図4
図5-1】
図5-2】
図5-3】
図6
図7
図8
【手続補正書】
【提出日】2023-11-13
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測するコンピュータベースの方法であって、
コンピュータによって、
前記分子の前記化学構造に対応する前記分子の空間的表面表現(SSR:spatial surface representation)の情報を有するデータを取得した際に、前記SSR上でN個の複数の表面点を選択することと、
各選択された表面点ごとに前記選択された表面点の前記SSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR:surface points representation)を生じることと、
SPRに従って少なくとも1つの嗅覚的特質に関する予測データを提供するようにトレーニングされた機械学習(ML:Machine-Learned)モデルに、前記SPRの情報を有するデータを入力することと、
前記MLモデルの出力として、前記分子の前記少なくとも1つの嗅覚的特質に関する予測データを受信することと
を含む、方法。
【請求項2】
前記分子に関する1つまたは複数の生成物を作製することを可能にするために、前記予測データを使用することをさらに含み、
前記作製することが、所望の臭気のためのレシピを生成することと、所望の嗅覚的特徴をもつ合成の新しい単分子および/または混合物を設計することと、得られる臭気に対する影響力なく所与のレシピを再定式化することと、前記分子を合成することとのうちの少なくとも1つを含む、
請求項1に記載の方法。
【請求項3】
1つまたは複数の原臭に対応する1つまたは複数のSPRパッチを認識するようにさらにトレーニングされた前記MLモデルへの入力として、SPRの情報を有する前記データを使用することをさらに含み、
前記分子の前記少なくとも1つの嗅覚的特質に関する出力された前記予測データが、前記分子との相互作用によって知覚されることが予期される前記1つまたは複数の原臭の情報を有するものである、
請求項1に記載の方法。
【請求項4】
臭気のデジタル化のために、原臭の情報を有する前記受信された予測データを使用することをさらに含む、請求項3に記載の方法。
【請求項5】
前記SPRを前処理することをさらに含み、
前記前処理の結果が、前記SPRの情報を有する前記データとして使用され、前記SPRを前処理することが、前記選択された表面点を2次元の行列に変換することを含む、
請求項1に記載の方法。
【請求項6】
プロセッサおよびメモリを備える1つまたは複数のコンピューティングデバイスであって、前記1つまたは複数のコンピューティングデバイスが、コンピュータ実行可能命令を介して、化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測することが可能なシステムをクラウドコンピューティング環境において動作させるための動作を実施するように構成され、
前記動作が、
前記分子の前記化学構造に対応する前記分子の空間的表面表現(SSR:spatial surface representation)の情報を有するデータを取得した際に、前記SSR上でN個の複数の表面点を選択することと、
各選択された表面点ごとに前記選択された表面点の前記SSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR:surface points representation)を生じることと、
SPRに従って少なくとも1つの嗅覚的特質に関する予測データを提供するようにトレーニングされた機械学習(ML:Machine-Learned)モデルに、前記SPRの情報を有するデータを入力することと、
前記MLモデルの出力として、前記分子の前記少なくとも1つの嗅覚的特質に関する予測データを受信することと
を含む、
1つまたは複数のコンピューティングデバイス。
【請求項7】
請求項1に記載の動作を実施するようにさらに構成された、請求項6に記載の1つまたは複数のコンピューティングデバイス。
【請求項8】
コンピューティングシステムによって実行可能な複数のプログラムコンポーネントを記憶するメモリを備える前記コンピューティングシステムによって実行されたときに、前記コンピューティングシステムを請求項1に従って動作させる命令を含む、非一時的コンピュータ可読媒体。
【請求項9】
化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測するコンピュータベースの方法であって、
コンピュータによって、
前記分子の前記化学構造に対応する前記分子の空間的表面表現(SSR:spatial surface representation)の情報を有するデータを取得した際に、前記SSR上でN個の複数の表面点を選択することと、
各選択された表面点ごとに前記選択された表面点の前記SSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR:surface points representation)を生じることと、
1つまたは複数の原臭に対応する1つまたは複数のSPRパッチを認識するようにトレーニングされた機械学習(ML:Machine-Learned)モデルに、前記SPRの情報を有するデータを入力することと、
前記MLモデルの出力として、前記分子との相互作用によって知覚されることが予期される原臭の組合せの情報を有する予測データを受信することと
を含む、方法。
【請求項10】
原臭の前記組合せの情報を有する予測データを臭気放出ユニットに送信することであり、前記組合せが、それぞれの原臭のIDおよび割合によって特性付けられ、前記臭気放出が、物質のセットを含むディフューザを備え、各物質が、それぞれの原臭のにおいの知覚を可能にする、送信することと、
前記臭気放出が、前記分子との相互作用によって知覚されることが予期される原臭の前記組合せについての前記受信されたデータに従って、物質の前記セットからの物質を放出することを可能にすることと
をさらに含む、請求項9に記載の方法。
【請求項11】
プロセッサおよびメモリを備える1つまたは複数のコンピューティングデバイスであって、前記1つまたは複数のコンピューティングデバイスが、コンピュータ実行可能命令を介して、化学構造によって特性付けられる分子の嗅覚的特質に関するデータを予測することが可能なシステムをクラウドコンピューティング環境において動作させるための動作を実施するように構成され、
前記動作が、
前記分子の前記化学構造に対応する前記分子の空間的表面表現(SSR:spatial surface representation)の情報を有するデータを取得した際に、前記SSR上でN個の複数の表面点を選択することと、
各選択された表面点ごとに前記選択された表面点の前記SSR上の空間的位置および局所的物理化学的特質の情報を有する局所的データを取得し、表面点表現(SPR:surface points representation)を生じることと、
1つまたは複数の原臭に対応する1つまたは複数のSPRパッチを認識するようにトレーニングされた機械学習(ML:Machine-Learned)モデルに、前記SPRの情報を有するデータを入力することと、
前記MLモデルの出力として、前記分子との相互作用によって知覚されることが予期される原臭の組合せの情報を有する予測データを受信することと
を含む、
1つまたは複数のコンピューティングデバイス。
【請求項12】
前記動作が、
原臭の前記組合せの情報を有する予測データを臭気放出ユニットに送信することであり、前記組合せが、それぞれの原臭のIDおよび割合によって特性付けられ、前記臭気放出が、物質のセットを含むディフューザを備え、各物質が、それぞれの原臭のにおいの知覚を可能にする、送信することと、
前記臭気放出が、前記分子との相互作用によって知覚されることが予期される原臭の前記組合せについての前記受信されたデータに従って、物質の前記セットからの物質を放出することを可能にすることと
をさらに含む、
請求項11に記載の1つまたは複数のコンピューティングデバイス。
【請求項13】
コンピューティングシステムによって実行可能な複数のプログラムコンポーネントを記憶するメモリを備える前記コンピューティングシステムによって実行されたときに、前記コンピューティングシステムを請求項9に従って動作させる命令を含む、非一時的コンピュータ可読媒体。
【請求項14】
分子との相互作用によって知覚されることが予期され、請求項9に記載の方法の支援により予測される、原臭の組合せ。
【請求項15】
1つまたは複数の嗅覚的特質を可能にする分子化学構造を予測するコンピュータベースの方法であって、
コンピュータによって、
分子の少なくとも1つの嗅覚的特質に関する要件の情報を有する要件データを受信した際に、要件データに従って前記分子の空間的表面表現(SSR:spatial surface representation)上に位置する複数の点の局所的物理化学的特質の情報を有する表面点表現(SPR:surface points representation)を予測するようにトレーニングされた機械学習(ML:Machine-Learned)モデルを、前記要件データに適用することと、
前記MLモデルの出力として、前記要件データに対応する予測されたSPRの情報を有するデータを受信することと、
前記要件に合致するであろう分子の予測されるSSRおよび対応する予測される化学構造を計算するために、前記予測されたSPRを使用することと
を含む、方法。
【請求項16】
前記局所的物理化学的特質が、曲率、波カーネルシグネチャ、熱カーネルシグナル、幾何学的および距離パラメータ、電気陰性度、電子親和力、質量、部分電荷、自由電子-陽子、ならびに疎水性を含むグループから選択された1つまたは複数のパラメータによって特性付けられる、請求項15に記載の方法。
【請求項17】
前記分子に関する1つまたは複数の生成物を作製することを可能にするために、前記予測データを使用することをさらに含み、
前記作製することが、所望の臭気のためのレシピを生成することと、所望の嗅覚的特徴をもつ合成の新しい単分子および/または混合物を設計することと、得られる臭気に対する影響力なく所与のレシピを再定式化することと、前記分子を合成することとのうちの少なくとも1つを含む、
請求項15に記載の方法。
【請求項18】
前記要件データが、原臭の重み付けされた組合せとして臭気を指定し、
前記MLモデルが、前記所与の原臭に従って表面点表現(SPR)のパッチを予測するようにトレーニングされ、
前記方法は、
a.トレーニングされた前記MLモデルを、前記要件データによって指定された各原臭に適用することと、
b.各所与の原臭ごとに、前記MLモデルの出力として、予測されたSPRのパッチの情報を有するデータを受信することと、
c.必要とされる前記臭気に対応するSPRを計算するために、要求された前記重み付けされた組合せにおける前記原臭に対して予測された前記SPRパッチを使用することであり、前記SPRが、前記要件に合致するであろう前記分子の前記予測される化学構造を計算するために使用可能である、使用することと
をさらに含む、
請求項15のいずれか一項に記載の方法。
【請求項19】
プロセッサおよびメモリを備える1つまたは複数のコンピューティングデバイスであって、前記1つまたは複数のコンピューティングデバイスが、コンピュータ実行可能命令を介して、1つまたは複数の嗅覚的特質を可能にする分子化学構造を予測することが可能なシステムをクラウドコンピューティング環境において動作させるための動作を実施するように構成され、
前記動作が、
分子の少なくとも1つの嗅覚的特質に関する要件の情報を有する要件データを受信した際に、要件データに従って前記分子の空間的表面表現(SSR:spatial surface representation)上に位置する複数の点の局所的物理化学的特質の情報を有する表面点表現(SPR:surface points representation)を予測するようにトレーニングされた機械学習(ML:Machine-Learned)モデルを、前記要件データに適用することと、
前記MLモデルの出力として、前記要件データに対応する予測されたSPRの情報を有するデータを受信することと、
前記要件に合致するであろう分子の予測されるSSRおよび対応する予測される化学構造を計算するために、前記予測されたSPRを使用することと
を含む、
1つまたは複数のコンピューティングデバイス。
【請求項20】
コンピューティングシステムによって実行可能な複数のプログラムコンポーネントを記憶するメモリを備える前記コンピューティングシステムによって実行されたときに、前記コンピューティングシステムを請求項15に従って動作させる命令を含む、非一時的コンピュータ可読媒体。
【国際調査報告】