(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023143424
(43)【公開日】2023-10-06
(54)【発明の名称】色素材料の探索方法、情報処理装置、及びプログラム
(51)【国際特許分類】
G16C 20/70 20190101AFI20230928BHJP
G06N 20/00 20190101ALI20230928BHJP
【FI】
G16C20/70
G06N20/00
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022050780
(22)【出願日】2022-03-25
(11)【特許番号】
(45)【特許公報発行日】2022-11-30
(71)【出願人】
【識別番号】000002886
【氏名又は名称】DIC株式会社
(74)【代理人】
【識別番号】100177426
【弁理士】
【氏名又は名称】粟野 晴夫
(74)【代理人】
【識別番号】100141601
【弁理士】
【氏名又は名称】貴志 浩充
(74)【代理人】
【識別番号】100164471
【弁理士】
【氏名又は名称】岡野 大和
(72)【発明者】
【氏名】石井 融
(72)【発明者】
【氏名】中谷 泰博
(72)【発明者】
【氏名】山▲崎▼ 雄大
(57)【要約】
【課題】色素材料の探索技術を改善する。
【解決手段】情報処理装置10が実行する色素材料の探索方法であって、所定の表記法で表された色素材料情報を入力として、色素材料情報に相当する潜在空間5上の潜在変数を出力するVAEエンコーダ3と、潜在空間5上の任意の潜在変数を入力として所定の表記法で表された色素材料情報を出力するVAEデコーダ4と、をそれぞれ訓練するステップと、VAEエンコーダ3と、VAEデコーダ4と、色素材料の複数の物性に係るデータとに基づき、複数の物性の全てを満足する所望の色素材料を特定するステップと、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
情報処理装置が実行する色素材料の探索方法であって、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練するステップと、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定するステップと、
を含む、色素材料の探索方法。
【請求項2】
請求項1に記載の探索方法であって、
潜在空間の任意の変数を入力として前記複数の物性の予測値を出力する物性予測モデルを訓練するステップを含み、前記色素材料の複数の物性に係るデータは、前記物性予測モデルの訓練に使用され、
前記特定するステップにおいて、前記物性予測モデルに基づく最適化処理により前記所望の色素材料に対応する潜在変数を探索する、色素材料の探索方法。
【請求項3】
請求項2に記載の探索方法であって、
前記色素材料の複数の物性に係るデータの一部を前記VAEエンコーダ、及び前記VAEデコーダに入力することで前記所望の色素材料を特定する、色素材料の探索方法。
【請求項4】
請求項3に記載の探索方法であって、さらに
前記色素材料の複数の物性に係るデータの一部を前記物性予測モデルにも入力することで前記所望の色素材料を特定する、色素材料の探索方法。
【請求項5】
請求項1に記載の探索方法であって、
前記色素材料の複数の物性に係るデータを前記VAEエンコーダ、及び前記VAEデコーダに入力することで前記所望の色素材料を特定する、色素材料の探索方法。
【請求項6】
請求項1乃至5のいずれか一項に記載の探索方法であって、
前記複数の物性は、色味に関する情報を含む、色素材料の探索方法。
【請求項7】
請求項1乃至5のいずれか一項に記載の探索方法であって、
前記複数の物性は、安定性に関する情報を含む、色素材料の探索方法。
【請求項8】
請求項1乃至7のいずれか一項に記載の探索方法であって、
前記訓練するステップにおいて、色素材料として用いられる組成物の実績データと、色素材料以外の用途で用いられる組成物の実績データとを用いて、前記VAEエンコーダと、前記VAEデコーダとを訓練する、色素材料の探索方法。
【請求項9】
請求項2乃至4のいずれか一項に記載の探索方法であって、
前記最適化処理はベイズ最適化処理である、色素材料の探索方法。
【請求項10】
請求項1乃至9のいずれか一項に記載の探索方法であって、
前記複数の物性に係るデータの少なくとも一部が、連続値情報、離散値情報、又はカテゴリカル情報である、色素材料の探索方法。
【請求項11】
請求項1乃至10に記載の探索方法であって、
前記色素材料は、二色性色素材料であり、前記複数の物性は、最大吸収波長、及び二色比を含む、色素材料の探索方法。
【請求項12】
制御部を備え、色素材料の探索をする情報処理装置であって、
前記制御部は、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練し、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定する情報処理装置。
【請求項13】
情報処理装置が実行する色素材料の探索をするプログラムであって、コンピュータに、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練することと、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定することと
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、色素材料の探索方法、情報処理装置、及びプログラムに関する。
【背景技術】
【0002】
従来から機械学習により新規材料を探索する技術が知られている。例えば非特許文献1及び2では、新規の薬剤をベイズ最適化等により探索する技術が提案されている。
【先行技術文献】
【特許文献】
【0003】
【非特許文献1】Rafael Gomez-Bombarelli et. al. “Automatic Chemical Design Using a Data-Driven Continuous Representation of Molecules”ACS Cent. Sci. 2018, 4, 2, 268-276.
【非特許文献2】Ryan-Rhys Griffiths et. al. “Constrained Bayesian Optimization for Automatic Chemical Design using Variational Autoencoders”Chem. Sci. 2020, 11, 577-586.
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1及び2に記載の物質の探索技術は薬剤を探索対象としたものであるところ、新規の色素材料を探索することについては従来技術では考慮されていなかった。換言すると色素材料の探索技術には改善の余地があった。
【0005】
かかる事情に鑑みてなされた本開示の目的は、色素材料の探索技術を改善することにある。
【課題を解決するための手段】
【0006】
本開示の一実施形態に係る色素材料の探索方法は、
情報処理装置が実行する色素材料の探索方法であって、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練するステップと、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定するステップと、
を含む。
【0007】
また本開示の一実施形態に係る色素材料の探索方法は、
潜在空間の任意の変数を入力として前記複数の物性の予測値を出力する物性予測モデルを訓練するステップを含み、前記色素材料の複数の物性に係るデータは、前記物性予測モデルの訓練に使用され、
前記特定するステップにおいて、前記物性予測モデルに基づく最適化処理により前記所望の色素材料に対応する潜在変数を探索する。
【0008】
また本開示の一実施形態に係る色素材料の探索方法は、
前記色素材料の複数の物性に係るデータの一部を前記VAEエンコーダ、及び前記VAEデコーダに入力することで前記所望の色素材料を特定する。
【0009】
また本開示の一実施形態に係る色素材料の探索方法は、
前記色素材料の複数の物性に係るデータの一部を前記物性予測モデルにも入力することで前記所望の色素材料を特定する。
【0010】
また本開示の一実施形態に係る色素材料の探索方法は、
前記色素材料の複数の物性に係るデータを前記VAEエンコーダ、及び前記VAEデコーダに入力することで前記所望の色素材料を特定する。
【0011】
また本開示の一実施形態に係る色素材料の探索方法は、
前記複数の物性が、色味に関する情報を含む。
【0012】
また本開示の一実施形態に係る色素材料の探索方法は、
前記複数の物性が、安定性に関する情報を含む。
【0013】
また本開示の一実施形態に係る色素材料の探索方法は、
前記訓練するステップにおいて、色素材料として用いられる組成物の実績データと、色素材料以外の用途で用いられる組成物の実績データとを用いて、前記VAEエンコーダと、前記VAEデコーダとを訓練する。
【0014】
また本開示の一実施形態に係る色素材料の探索方法は、
前記最適化処理がベイズ最適化処理である。
【0015】
また本開示の一実施形態に係る色素材料の探索方法は、
前記複数の物性に係るデータの少なくとも一部が、連続値情報、離散値情報、又はカテゴリカル情報である。
【0016】
また本開示の一実施形態に係る色素材料の探索方法は、
前記色素材料が、二色性色素材料であり、前記複数の物性が、最大吸収波長、及び二色比を含む。
【0017】
また本開示の一実施形態に係る情報処理装置は、
制御部を備え、色素材料の探索をする情報処理装置であって、
前記制御部は、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練し、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定する。
【0018】
また本開示の一実施形態に係るプログラムは、
情報処理装置が実行する色素材料の探索をするプログラムであって、コンピュータに、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練することと、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定することと
を実行させる。
【発明の効果】
【0019】
本開示の一実施形態に係る色素材料の探索方法、情報処理装置、及びプログラムによれば、色素材料の探索技術を改善することができる。
【図面の簡単な説明】
【0020】
【
図1】本開示の一実施形態に係る色素材料の探索技術の概要を示す図である。
【
図2】本開示の一実施形態に係る色素材料の探索方法の概要を示すフローチャートである。
【
図3】本開示の一実施形態に係る色素材料の探索方法を実行する情報処理装置の概略構成を示すブロック図である。
【
図4】本開示の一実施形態に係る色素材料の探索方法の第1の具体例を示す図である。
【
図5】本開示の一実施形態に係る色素材料の探索方法の第1の具体例に係るフローチャートである。
【
図6】最大吸収波長に係るペナルティの一例を示す図である。
【
図7】最大吸収波長に係るペナルティの変形例及び比較例を示す図である。
【
図8】最大吸収波長に係る各ペナルティに対応する出力結果の相違を示す図である。
【
図9】二色比に係るペナルティの一例を示す図である。
【
図10】耐光性に係るペナルティの一例を示す図である。
【
図11】本開示の一実施形態に係る色素材料の探索方法の第2の具体例を示す図である。
【
図12】本開示の一実施形態に係る色素材料の探索方法の第2の具体例に係るフローチャートである。
【
図13】本開示の一実施形態に係る色素材料の探索方法の第2の具体例の変形例を示す図である。
【
図14】本開示の一実施形態に係る色素材料の探索方法の第3の具体例を示す図である。
【
図15】本開示の一実施形態に係る色素材料の探索方法の第3の具体例に係るフローチャートである。
【発明を実施するための形態】
【0021】
以下、本開示の実施形態に係る色素材料の探索技術ついて、図面を参照して説明する。
【0022】
各図中、同一又は相当する部分には、同一符号を付している。本実施形態の説明において、同一又は相当する部分については、説明を適宜省略又は簡略化する。
【0023】
まず、
図1及び
図2を参照して本実施形態の概要について説明する。本実施形態に係る色素材料の探索技術では
図1に示す実験データ1及び公開データベース2(公開DB2)が用いられる。本探索技術による探索対象の色素材料は、例えば二色性色素であるがこれに限られない。実験データ1及び公開DB2は、色素材料に係る情報(以下、色素材料情報ともいう。)及び色素材料に係る実績データを含む。なお本実施形態に係る色素材料の探索技術では実験データ1及び公開DB2の両方が用いられる例を示すが、これに限られない。本実施形態に係る色素材料の探索技術において、実験データ1又は公開DB2のいずれか一方のみが用いられてもよい。
【0024】
色素材料情報は、色素材料の分子構造に係る情報を含む。かかる色素材料情報は所定の表記法で表される。本実施の形態では所定の表記法は、SMILES表記であるものとして説明するがこれに限られない。
【0025】
色素材料に係る実績データは、色素材料に係る複数の物性に係るデータ(以下、物性データともいう。)であって実験等により得られたデータを含む。また本実施形態に係る色素材料の探索技術は情報処理装置10により実行される方法であり、VAEエンコーダ3とVAEデコーダ4とを含む。換言すると本実施形態に係る色素材料の探索技術ではVariational Autoencoder(変分オートエンコーダ、VAE)が用いられる。
【0026】
VAEエンコーダ3は、色素材料情報を入力として、色素材料情報に相当する潜在変数を出力する学習モデルである。潜在変数は、潜在空間5上の変数である。
図1では潜在空間5を2次元座標により示しているが潜在空間5の次元数は2に限られない。潜在空間の次元数は3以上であってもよい。VAEデコーダ4は、潜在空間5上の任意の潜在変数を入力として、色素材料情報を出力する学習モデルである。
【0027】
図2に示すように、VAEエンコーダ3及びVAEデコーダ4は、色素材料情報に基づき訓練される(ステップS10)。そして本実施形態に係る色素材料の探索技術では学習済みのVAEエンコーダ3及びVAEデコーダ4と、物性データとに基づき、複数の物性の全てを満足する所望の色素材料を特定する(ステップS20)。かかる特定処理は、各種の手法を採用することができる。例えばステップS20において、物性データにより訓練された予測モデルが用いられてもよい。かかる予測モデルは、潜在空間5上の潜在変数を入力して、当該潜在変数に対応する物性の予測値を出力するモデルである。予測モデルが用いられる場合、予測モデルに基づく最適化処理により、複数の物性の全てを満足する所望の色素材料が特定される。なお後述するように、当該予測モデルを用いない方法により複数の物性の全てを満足する所望の色素材料が特定されてもよい。
【0028】
このように本実施形態に係る色素材料の探索技術によれば、VAEエンコーダ3、VAEデコーダ4、及び物性データを用いて、任意の物性を満足する色素材料を特定することができる。そのため、複数の物性の全てを満足する所望の色素材料の探索ができるという点で、色素材料の探索技術が改善される。
【0029】
(情報処理装置の構成)
次に、情報処理装置10の各構成について詳細に説明する。情報処理装置10は、ユーザによって使用される任意の装置である。例えばパーソナルコンピュータ、サーバコンピュータ、汎用の電子機器、又は専用の電子機器が、情報処理装置10として採用可能である。
【0030】
図3に示されるように、情報処理装置10は、制御部11と、記憶部12と、入力部13と、出力部14とを備える。
【0031】
制御部11には、少なくとも1つのプロセッサ、少なくとも1つの専用回路、又はこれらの組み合わせが含まれる。プロセッサは、CPU(central processing unit)若しくはGPU(graphics processing unit)などの汎用プロセッサ、又は特定の処理に特化した専用プロセッサである。専用回路は、例えば、FPGA(field-programmable gate array)又はASIC(application specific integrated circuit)である。制御部11は、情報処理装置10の各部を制御しながら、情報処理装置10の動作に関わる処理を実行する。
【0032】
記憶部12には、少なくとも1つの半導体メモリ、少なくとも1つの磁気メモリ、少なくとも1つの光メモリ、又はこれらのうち少なくとも2種類の組み合わせが含まれる。半導体メモリは、例えば、RAM(random access memory)又はROM(read only memory)である。RAMは、例えば、SRAM(static random access memory)又はDRAM(dynamic random access memory)である。ROMは、例えば、EEPROM(electrically erasable programmable read only memory)である。記憶部12は、例えば、主記憶装置、補助記憶装置、又はキャッシュメモリとして機能する。記憶部12には、情報処理装置10の動作に用いられるデータと、情報処理装置10の動作によって得られたデータとが記憶される。
【0033】
入力部13には、少なくとも1つの入力用インタフェースが含まれる。入力用インタフェースは、例えば、物理キー、静電容量キー、ポインティングデバイス、ディスプレイと一体的に設けられたタッチスクリーンである。また入力用インタフェースは、例えば、音声入力を受け付けるマイクロフォン、又はジェスチャー入力を受け付けるカメラ等であってもよい。入力部13は、情報処理装置10の動作に用いられるデータを入力する操作を受け付ける。入力部13は、情報処理装置10に備えられる代わりに、外部の入力機器として情報処理装置10に接続されてもよい。接続方式としては、例えば、USB(Universal Serial Bus)、HDMI(登録商標)(High-Definition Multimedia Interface)、又はBluetooth(登録商標)などの任意の方式を用いることができる。
【0034】
出力部14には、少なくとも1つの出力用インタフェースが含まれる。出力用インタフェースは、例えば、情報を映像で出力するディスプレイ等である。ディスプレイは、例えば、LCD(liquid crystal display)又は有機EL(electro luminescence)ディスプレイである。出力部14は、情報処理装置10の動作によって得られるデータを表示出力する。出力部14は、情報処理装置10に備えられる代わりに、外部の出力機器として情報処理装置10に接続されてもよい。接続方式としては、例えば、USB、HDMI(登録商標)、又はBluetooth(登録商標)などの任意の方式を用いることができる。
【0035】
情報処理装置10の機能は、本実施形態に係るプログラムを、情報処理装置10に相当するプロセッサで実行することにより実現される。すなわち、情報処理装置10の機能は、ソフトウェアにより実現される。プログラムは、情報処理装置10の動作をコンピュータに実行させることで、コンピュータを情報処理装置10として機能させる。すなわち、コンピュータは、プログラムに従って情報処理装置10の動作を実行することにより情報処理装置10として機能する。
【0036】
本実施形態においてプログラムは、コンピュータで読取り可能な記録媒体に記録しておくことができる。コンピュータで読取り可能な記録媒体は、非一時的なコンピュータ読取可能な媒体を含み、例えば、磁気記録装置、光ディスク、光磁気記録媒体、又は半導体メモリである。プログラムの流通は、例えば、プログラムを記録したDVD(digital versatile disc)又はCD-ROM(compact disc read only memory)などの可搬型記録媒体を販売、譲渡、又は貸与することによって行う。またプログラムの流通は、プログラムを外部サーバのストレージに格納しておき、外部サーバから他のコンピュータにプログラムを送信することにより行ってもよい。またプログラムはプログラムプロダクトとして提供されてもよい。
【0037】
情報処理装置10の一部又は全ての機能が、制御部11に相当する専用回路により実現されてもよい。すなわち、情報処理装置10の一部又は全ての機能が、ハードウェアにより実現されてもよい。
【0038】
本実施形態において記憶部12は、実験データ1、公開DB2、VAEエンコーダ3、及びVAEデコーダ4を記憶する。
【0039】
上述したように実験データ1及び公開DB2は、色素材料情報と、物性データとを含む。例えば物性データとして、色味に関する情報を含んでよい。また物性データは、安定性に関する情報を含んでもよい。さらに色素材料が二色性色素である場合、色味に関する情報は、例えば最大吸収波長、及び二色比を含んでよい。また色素材料が二色性色素である場合、安定性に関する情報は、例えば耐光性を含んでよい。以下、本実施の形態では、一例として色素材料が二色性色素である場合について説明する。また、上記複数の物性は、最大吸収波長、二色比、及び耐光性を含む場合について説明する。
【0040】
なお、実験データ1、公開DB2、VAEエンコーダ3、及びVAEデコーダ4は、情報処理装置10とは別の外部装置に記憶されていてもよい。その場合、情報処理装置10は、外部通信用インタフェースを備えていてもよい。通信用インタフェースは、有線通信又は無線通信のいずれのインタフェースであってよい。有線通信の場合、通信用インタフェースは例えばLANインタフェース、USBである。無線通信の場合、通信用インタフェースは例えば、LTE、4G、若しくは5Gなどの移動通信規格に対応したインタフェース、Bluetooth(登録商標)などの近距離無線通信に対応したインタフェースである。通信用インタフェースは、情報処理装置10の動作に用いられるデータを受信し、また情報処理装置10の動作によって得られるデータを送信可能である。
【0041】
(第1の具体例)
図4及び
図5を参照して、本開示の一実施形態に係る色素材料の探索方法の第1の具体例及び動作について説明する。
【0042】
図4に示すように第1の具体例は、VAEエンコーダ103とVAEデコーダ104と、物性予測モデル106とを含む。つまりこの場合、記憶部12は、VAEエンコーダ103、VAEデコーダ104、及び物性予測モデル106を記憶する。
【0043】
VAEエンコーダ103は、色素材料情報を入力として、色素材料情報に相当する潜在変数を出力する学習モデルである。上述したように色素材料情報はSMILES表記のデータである。VAEエンコーダ103により出力される潜在変数は、潜在空間105上の変数である。
図4では潜在空間105を2次元座標により示しているが潜在空間105の次元数は2に限られない。潜在空間の次元数は3以上であってもよい。VAEエンコーダ103は色素材料情報に基づき訓練される。
【0044】
VAEデコーダ104は、潜在空間105上の任意の潜在変数を入力として、色素材料情報を出力する学習モデルである。VAEデコーダ104は色素材料情報に基づき訓練される。
【0045】
物性予測モデル106は、潜在空間105上の潜在変数を入力して、当該潜在変数に対応する物性予測値を出力する学習モデルである。物性予測モデル106は、物性データに基づき訓練される。かかる訓練は、ある入力に対する物性予測モデル106の出力と、物性データ(学習データ)との誤差に基づくパラメータ修正を行うことにより実行される。ここで物性予測モデル106は、各物性に対応する複数の予測モデルから構成される。つまり本実施形態においては、物性予測モデル106は最大吸収波長に係る予測モデル、二色比に係る予測モデル、及び耐光性に係る予測モデルから構成される。最大吸収波長に係る予測モデル、二色比に係る予測モデル、及び耐光性に係る予測モデルは、物性データに基づき訓練される。つまり最大吸収波長に係る予測モデル、二色比に係る予測モデル、及び耐光性に係る予測モデルは、それぞれ色素材料の最大吸収波長、二色比、及び耐光性の実績データにより訓練される。
【0046】
図5は、本開示の一実施形態に係る色素材料の探索方法の第1の具体例に係るフローチャートである。
【0047】
ステップS110:情報処理装置10の制御部11は、VAEエンコーダ103及びVAEデコーダ104を、色素材料情報に基づき訓練する。
【0048】
ステップS120:制御部11は、物性予測モデル106を物性データに基づき訓練する。つまり制御部11は、物性予測モデル106を構成する最大吸収波長に係る予測モデル、二色比に係る予測モデル、及び耐光性に係る予測モデルを、それぞれ色素材料の最大吸収波長、二色比、及び耐光性の実績データにより訓練する。なお、物性予測モデル106の訓練は、ステップS110におけるVAEエンコーダ103及びVAEデコーダ104の訓練と並行して実行されてもよい。
【0049】
ステップS130:制御部11は、物性予測モデル106に基づく最適化処理により所望の色素材料に対応する潜在変数を特定する。かかる最適化処理は、ベイズ最適化処理を含む。つまり例えば制御部11は、ベイス最適化処理により所望の色素材料に対応する潜在変数を特定する。
【0050】
ここでベイズ最適化処理において制御部11は、物性予測値に対応するペナルティの合計により定められた総合指標値を最小化する潜在変数を探索する。複数の物性が最大吸収波長、二色比、及び耐光性である場合、当該ペナルティの合計は、最大吸収波長の予測値に対応するペナルティ、二色比の予測値に対応するペナルティ、及び耐光性の予測値に対応するペナルティの総和により定められる。以下、各ペナルティについて説明する。
【0051】
図6は、最大吸収波長の予測値に対応するペナルティの一例を示す図である。最大吸収波長の予測値に対応するペナルティは、第1目標範囲からの乖離の増加に応じて増加する関数により定められる。第1目標範囲は、例えばシアン色素の場合、600nm以上700nm以下である。また例えばマゼンダ色素の場合、第1目標範囲は500nm以上600nm以下である。またイエロー色素の場合、第1目標範囲は400nm以上500nm以下である。
図6に示すペナルティは、シアン色素の最大吸収波長に係るペナルティを示している。
図6のペナルティは最大吸収波長が第1目標範囲の中心の値(ここでは650nm)である場合にゼロであり、中心から乖離すると一定勾配でペナルティが増加する関数である。かかる勾配は、第1目標範囲から所定値乖離した場合において、ペナルティが第1閾値となるように設定される。
図6において所定量は20nmである。また第1閾値は50である。つまり、第1目標範囲の下限より20nm低い580nmにおいて、ペナルティが50であるように勾配が設定される。また第1目標範囲の上限より20nm高い720nmにおいて、ペナルティが50であるように勾配が設定される。なお
図6では勾配が一定である例(ペナルティが一次関数である例)を示しているが、これに限られない。ペナルティは高次関数であってもよい。また第1閾値が50である例を示したがこれに限られない。第1閾値は例えば20であってもよい。第1閾値は、二色比に係るペナルティを基準に適宜定められる。
【0052】
図7に、最大吸収波長の予測値に対応するペナルティの変形例及び比較例を示す。
図9に示す関数f0からf5のうち、f1からf5は、最大吸収波長の予測値に対応するペナルティとして採用可能である。f1は
図6に示すペナルティと同一である。f2からf5は、f1の変形例である。f2からf5も、f1と同様に、第1目標範囲からの乖離の増加に応じてペナルティが増加する関数により定められる関数である。他方でf0は、最大吸収波長に係るペナルティの比較例である。f0は、第1目標範囲からの乖離が増加しても、ペナルティが一定である。
【0053】
図8は、最大吸収波長の予測値に対応する各ペナルティに対応する出力結果の相違を示す図である。
図8に示すように、最大吸収波長の予測値に対応するペナルティをf0により定めた場合、ベイズ最適化の結果探索された色素材料で、最大吸収波長を満たさない候補が比較的多く探索されてしまう。したがって最大吸収波長の予測値に対応するペナルティは、f1~f5のように、第1目標範囲からの乖離の増加に応じてペナルティが増加する関数により定めることが好ましい。
【0054】
図9は、二色比の予測値に対応するペナルティの一例を示す図である。二色比の予測値に対応するペナルティは、二色比の増加に応じて減少する関数により定められる。また二色比の予測値に対応するペナルティは、最小値が第2閾値となるように定められる。第2閾値は例えば20である。
図9において二色比の予測値に対応するペナルティは、一次関数により定められている。また当該ペナルティの勾配は例えば-1である。なお
図9では勾配が一定である例(ペナルティが一次関数である例)を示しているが、これに限られない。ペナルティは高次関数であってもよい。
【0055】
図10は、耐光性の予測値に対応するペナルティの一例を示す図である。耐光性の予測値に対応するペナルティは、シグモイド関数等の関数により定められる。本実施形態において当該関数は、シグモイド関数、ステップ関数、及びシグモイド関数と似た性質を持つ関数(累積正規分布関数、ゴンペルツ関数、グーデルマン関数等)を含む。
図10に示すペナルティはステップ関数であり、耐光性指標が目標範囲(耐光性指標(1000時間OK確率)が50%~100%)である場合に0である。また耐光性指標が目標範囲外の場合(0%~50%)である場合にペナルティは第3閾値(ここでは20)となるように定められている。第3閾値は、二色比に係るペナルティを基準に適宜定められる。第3閾値は、第1閾値と同一の値であってもよく、第1閾値と異なる値であってもよい。
【0056】
制御部11は、上述のように定められたペナルティの合計(以下、総合指標値ともいう。)に基づき、総合指標値を最小化する潜在変数を探索する。当該潜在変数に対応する色素材料が、所望の色素材料に相当する。なお本実施形態において総合指標値が小さい場合を望ましい場合としたが、これに限られない。例えばペナルティの定め方によっては総合指標値が大きい場合を望ましい場合と定めてもよい。この場合、制御部11は総合指標値を最大化する潜在変数を探索する。
【0057】
ステップS140:制御部11は、ステップS130において特定した潜在変数に対応する所望の色素材料をVAEデコーダ104により出力する。具体的には制御部11は、VAEデコーダ104により出力された色素材料情報がSMILESの文法規則に適合しているか否かを確認する。出力された色素材料情報がSMILESの文法規則に適合している場合、制御部11は、当該色素材料情報を所望の色素材料として出力する。
【0058】
このように、本実施形態によれば、色素材料情報により訓練されたVAEエンコーダ103及びVAEデコーダ104、及び物性データに基づき訓練された物性予測モデル106を用いて、複数の物性の全てを満足する所望の色素材料の探索を行うことができる。
【0059】
(第2の具体例)
図11及び
図12を参照して、本開示の一実施形態に係る色素材料の探索方法の第2の具体例及び動作について説明する。
【0060】
図11に示すように第2の具体例は、VAEエンコーダ203とVAEデコーダ204と、物性予測モデル206とを含む。つまりこの場合、記憶部12は、VAEエンコーダ203、VAEデコーダ204、及び物性予測モデル206を記憶する。
【0061】
VAEエンコーダ203は、物性データの一部及び色素材料情報を入力として、色素材料情報に相当する潜在変数を出力する学習モデルである。物性データの一部は、複数の物性のうち任意の物性に係るデータである。かかるデータは、連続値情報であってもよく、連続値情報でなくてもよい。換言するとかかるデータは、連続値情報、離散値情報、又はカテゴリカル情報のいずれであってもよい。本実施形態では、かかる物性データの一部は、耐光性に係るデータであり、かつカテゴリカル情報(以下、カテゴリカル物性ともいう。)であるとして説明する。
【0062】
上述したように色素材料情報はSMILES表記のデータである。VAEエンコーダ203により出力される潜在変数は、潜在空間205上の変数である。
図4では潜在空間205を2次元座標により示しているが潜在空間205の次元数は2に限られない。潜在空間の次元数は3以上であってもよい。VAEエンコーダ203はカテゴリカル物性及び色素材料情報に基づき訓練される。つまり本実施形態においてVAEエンコーダ203は、耐光性に係るデータ及び色素材料情報に基づき訓練される。
【0063】
VAEデコーダ204は、カテゴリカル物性及び潜在空間205上の任意の潜在変数を入力として、色素材料情報を出力する学習モデルである。VAEデコーダ204はカテゴリカル物性及び色素材料情報に基づき訓練される。
【0064】
物性予測モデル206は、カテゴリカル物性及び潜在空間205上の潜在変数を入力して、当該潜在変数に対応する物性予測値を出力する学習モデルである。物性予測モデル206は、カテゴリカル物性及び物性データに基づき訓練される。ここで物性予測モデル206は、各物性に対応する複数の予測モデルから構成される。つまり本実施形態においては、物性予測モデル206は最大吸収波長に係る予測モデル、及び二色比に係る予測モデルから構成される。最大吸収波長に係る予測モデル、及び二色比に係る予測モデルは、カテゴリカル物性及び対応する物性データに基づき訓練される。つまり最大吸収波長に係る予測モデルは、色素材料の最大吸収波長の実績データ及び耐光性の実績データにより訓練される。また二色比に係る予測モデルは、二色比の実績データ及び耐光性の実績データにより訓練される。
【0065】
図11は、本開示の一実施形態に係る色素材料の探索方法の第2の具体例に係るフローチャートである。
【0066】
ステップS210:情報処理装置10の制御部11は、VAEエンコーダ203及びVAEデコーダ204を、色素材料情報及びカテゴリカル物性に基づき訓練する。
【0067】
ステップS220:制御部11は、物性予測モデル206を物性データ及びカテゴリカル物性に基づき訓練する。つまり制御部11は、物性予測モデル206を構成する最大吸収波長に係る予測モデル、及び二色比に係る予測モデルを、それぞれ色素材料の最大吸収波長及び耐光性の実績データ、並びに二色比及び耐光性の実績データにより訓練する。なお、物性予測モデル206の訓練は、ステップS210におけるVAEエンコーダ203及びVAEデコーダ204の訓練と並行して実行されてもよい。
【0068】
ステップS230:制御部11は、物性予測モデル206に基づく最適化処理により所望の色素材料に対応する潜在変数を特定する。かかる最適化処理は、ベイズ最適化処理を含む。つまり例えば制御部11は、ベイス最適化処理により所望の色素材料に対応する潜在変数を特定する。ベイズ最適化処理において制御部11は、物性予測値に対応するペナルティの合計により定められた総合指標値を最小化する潜在変数を探索する。ペナルティの設定方法は第1の具体例と同様である。
【0069】
ステップS240:制御部11は、ステップS230において特定した潜在変数に対応する所望の色素材料をVAEデコーダ204により出力する。具体的には制御部11は、VAEデコーダ204により出力された色素材料情報がSMILESの文法規則に適合しているか否かを確認する。出力された色素材料情報がSMILESの文法規則に適合している場合、制御部11は、当該色素材料情報を所望の色素材料として出力する。
【0070】
このように、本実施形態によれば、色素材料情報及びカテゴリカル物性により訓練されたVAEエンコーダ203及びVAEデコーダ204、並びに物性データ及びカテゴリカル物性に基づき訓練された物性予測モデル206を用いて、複数の物性の全てを満足する所望の色素材料の探索ができる。特に第2の具体例に係る方法によれば、実績データにカテゴリカル物性を含む場合であっても、精度良く複数の物性の全てを満足する所望の色素材料の探索ができる。例えば耐光性に係る実績データ等は、実験条件又は評価基準等が、実験毎又はデータベース毎によって相違する場合がある。本実施形態によればこのような場合であっても、実績データをカテゴリカル情報又は離散値情報として取り扱うことで精度良く複数の物性の全てを満足する所望の色素材料の探索ができる。
【0071】
なお物性予測モデル206は、カテゴリカル物性及び潜在空間205上の潜在変数を入力して、当該潜在変数に対応する物性予測値を出力する学習モデルであるとして説明したがこれに限られない。物性予測モデル206は、潜在空間205上の潜在変数を入力して、当該潜在変数に対応する物性予測値を出力する学習モデルであってもよい。換言すると物性予測モデル206の入力には、カテゴリカル物性が含まれなくてもよい。例えばカテゴリカル物性が予測対象の物性と独立である場合は、物性予測モデル206にカテゴリカル物性を入力しなくても予測対象の物性を高精度で予測することができる。
【0072】
(第2の具体例の変形例)
図13を参照して、本開示の一実施形態に係る色素材料の探索方法の第2の具体例の変形例について説明する。
【0073】
図13に示すように第2の具体例の変形例は、VAEエンコーダ203とVAEデコーダ204と、物性予測モデル206と、学習済み予測モデル207とを含む。つまりこの場合、記憶部12は、VAEエンコーダ203、VAEデコーダ204、物性予測モデル206、及び学習済み予測モデル207を記憶する。
【0074】
VAEエンコーダ203、VAEデコーダ204、及び物性予測モデル206は、第2の具体例と同一である。学習済み予測モデル207は、色素材料情報を入力として、当該色素材料情報に対応する物性の予測値を出力する学習モデルである。かかる予測値は、VAEエンコーダ203の入力されるカテゴリカル物性に対応する予測値である。本実施形態において学習済み予測モデル207により出力される予測値は、耐光性に係る予測値であるものとして説明する。
【0075】
第2の具体例の変形例では、学習済み予測モデル207により予測された物性の予測値(ここでは耐光性に係る予測値)を、VAEエンコーダ203、VAEデコーダ204、及び物性予測モデル206の入力として用いる。このようにすることで、カテゴリカル物性に係る実績データが不足している場合であっても、複数の物性の全てを満足する所望の色素材料の探索ができる。例えば耐光性に係る実績データ等は、そもそも実験結果として測定されていない場合、又は明示されていない場合がある。このような場合でも、学習済み予測モデル207を用いることにより、不足する実績データを補うことができる。また不足する実績データを学習済み予測モデル207により補完することで、第2の具体例と同様に、精度良く複数の物性の全てを満足する所望の色素材料の探索ができる。
【0076】
(第3の具体例)
図14を参照して、本開示の一実施形態に係る色素材料の探索方法の第3の具体例及び動作について説明する。
【0077】
図14に示すように第3の具体例は、VAEエンコーダ303とVAEデコーダ304とを含む。つまりこの場合、記憶部12は、VAEエンコーダ303、及びVAEデコーダ304を記憶する。
【0078】
VAEエンコーダ303は、物性データ及び色素材料情報を入力として、色素材料情報に相当する潜在変数を出力する学習モデルである。上述したように物性データは色素材料に係る複数の物性値である。かかる物性値は、連続値情報、離散値情報、又はカテゴリカル情報のいずれであってもよい。あるいは物性値は、連続値情報、離散値情報をカテゴリカル情報に変換したものであってもよい。ここでは物性データはカテゴリカル情報であるものとする。上述したように色素材料情報はSMILES表記のデータである。VAEエンコーダ303により出力される潜在変数は、潜在空間305上の変数である。
図14では潜在空間305を2次元座標により示しているが潜在空間305の次元数は2に限られない。潜在空間の次元数は3以上であってもよい。VAEエンコーダ303は物性データ及び色素材料情報に基づき訓練される。
【0079】
VAEデコーダ304は、潜在空間305上の任意の潜在変数及び物性データを入力として、色素材料情報を出力する学習モデルである。VAEデコーダ304は物性データ及び色素材料情報に基づき訓練される。
【0080】
図15は、本開示の一実施形態に係る色素材料の探索方法の第3の具体例に係るフローチャートである。
【0081】
ステップS310:情報処理装置10の制御部11は、VAEエンコーダ303及びVAEデコーダ304を、色素材料情報及び物性データに基づき訓練する。
【0082】
ステップS320:制御部11は、潜在空間の中からランダムに選択した潜在変数をVAEデコーダ304に入力して、対応する色素材料情報を出力させる。潜在変数の選択方法は各種手法を採用できる。例えば制御部11は、潜在空間から単純にランダムに潜在変数を選択してもよい。また制御部11は、対応する実験データがある既知の色素材料に対応する潜在変数の周辺でランダムに潜在変数を選択してもよい。あるいは制御部11は、所望の物性を満たし得る潜在変数の周辺(換言するとターゲットとする色素材料の周辺)でランダムに潜在変数を選択してもよい。
【0083】
ステップS330:制御部11は、ステップS320において出力された色素材料情報が所定基準を満たす場合、所望の色素材料として出力する。所定基準とは、例えば出力された色素材料情報がSMILESの文法規則に適合していることである。つまり例えば制御部11は、ステップS320において出力された色素材料情報がSMILESの文法規則に適合している場合、当該色素材料情報を、所望の色素材料として出力する。
【0084】
このように、本実施形態によれば、色素材料情報及び物性データにより訓練されたVAEエンコーダ303及びVAEデコーダ304を用いて、複数の物性の全てを満足する所望の色素材料の探索ができる。特に第3の具体例に係る方法によれば、複数の物性値の実績データの全てがカテゴリカル情報であったとしても、複数の物性の全てを満足する所望の色素材料の探索ができる。
【0085】
なお、実験データ1及び公開DB2は、色素材料に係る情報及び色素材料に係る実績データを含むとしたがこれに限られない。実験データ1及び公開DB2は、色素材料以外の用途で用いられる組成物の実績データを含んでもよい。また上述のVAEエンコーダ3、VAEエンコーダ103、VAEエンコーダ203、VAEエンコーダ303、VAEデコーダ4、VAEデコーダ104、VAEデコーダ204、及びVAEデコーダ304、物性予測モデル106、物性予測モデル206、学習済み予測モデル207は、いずれも当該色素材料以外の用途で用いられる組成物の実績データを用いて訓練されてよい。換言すると本実施形態におけるVAEエンコーダ、VAEデコーダ、物性予測モデル、及び学習済み予測モデルは、色素材料として用いられる組成物の実績データと、色素材料以外の用途で用いられる組成物の実績データとの両方を用いて訓練されてもよい。このようにVAEエンコーダ、VAEデコーダ、物性予測モデル、及び学習済み予測モデルを訓練する処理において、訓練に用いる教師データに広範囲の用途の組成物を含むことにより、外挿による精度の低下を防止することができる。
【0086】
本開示を諸図面及び実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形及び修正を行うことが容易であることに注意されたい。したがって、これらの変形及び修正は本開示の範囲に含まれることに留意されたい。例えば、各手段又は各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の手段又はステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。
【符号の説明】
【0087】
1 実験データ
2 公開データベース
3、103、203、303 VAEエンコーダ
4、104、204、304 VAEデコーダ
5、105、205、305 潜在空間
10 情報処理装置
11 制御部
12 記憶部
13 入力部
14 出力部
106、206 物性予測モデル
207 学習済み予測モデル
【手続補正書】
【提出日】2022-09-26
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
情報処理装置が実行する色素材料の探索方法であって、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練するステップと、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定するステップと、
を含み、
前記訓練するステップにおいて、色素材料として用いられる組成物の実績データと、色素材料以外の用途で用いられる組成物の実績データとを用いて、前記VAEエンコーダと、前記VAEデコーダとを訓練する色素材料の探索方法。
【請求項2】
情報処理装置が実行する色素材料の探索方法であって、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練するステップと、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定するステップと、
を含み、
前記色素材料は、二色性色素材料であり、前記複数の物性は、最大吸収波長、及び二色比を含む、色素材料の探索方法。
【請求項3】
請求項1又は2に記載の探索方法であって、
潜在空間の任意の変数を入力として前記複数の物性の予測値を出力する物性予測モデルを訓練するステップを含み、前記色素材料の複数の物性に係るデータは、前記物性予測モデルの訓練に使用され、
前記特定するステップにおいて、前記物性予測モデルに基づく最適化処理により前記所望の色素材料に対応する潜在変数を探索する、色素材料の探索方法。
【請求項4】
請求項3に記載の探索方法であって、
前記色素材料の複数の物性に係るデータの一部を前記VAEエンコーダ、及び前記VAEデコーダに入力することで前記所望の色素材料を特定する、色素材料の探索方法。
【請求項5】
請求項4に記載の探索方法であって、さらに
前記色素材料の複数の物性に係るデータの一部を前記物性予測モデルにも入力することで前記所望の色素材料を特定する、色素材料の探索方法。
【請求項6】
請求項1又は2に記載の探索方法であって、
前記色素材料の複数の物性に係るデータを前記VAEエンコーダ、及び前記VAEデコーダに入力することで前記所望の色素材料を特定する、色素材料の探索方法。
【請求項7】
請求項3乃至5のいずれか一項に記載の探索方法であって、
前記最適化処理はベイズ最適化処理である、色素材料の探索方法。
【請求項8】
請求項1乃至7のいずれか一項に記載の探索方法であって、
前記複数の物性に係るデータの少なくとも一部が、連続値情報、離散値情報、又はカテゴリカル情報である、色素材料の探索方法。
【請求項9】
制御部を備え、色素材料の探索をする情報処理装置であって、
前記制御部は、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練し、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定し、
前記訓練において前記制御部は、色素材料として用いられる組成物の実績データと、色素材料以外の用途で用いられる組成物の実績データとを用いて、前記VAEエンコーダと、前記VAEデコーダとを訓練する情報処理装置。
【請求項10】
制御部を備え、色素材料の探索をする情報処理装置であって、
前記制御部は、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練し、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定し、
前記色素材料は、二色性色素材料であり、前記複数の物性は、最大吸収波長、及び二色比を含む、情報処理装置。
【請求項11】
情報処理装置が実行する色素材料の探索をするプログラムであって、コンピュータに、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練することと、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定することと
を実行させ、
前記訓練において、色素材料として用いられる組成物の実績データと、色素材料以外の用途で用いられる組成物の実績データとを用いて、前記VAEエンコーダと、前記VAEデコーダとを訓練するプログラム。
【請求項12】
情報処理装置が実行する色素材料の探索をするプログラムであって、コンピュータに、
所定の表記法で表された色素材料情報を入力として、前記色素材料情報に相当する潜在空間上の潜在変数を出力するVAEエンコーダと、前記潜在空間上の任意の潜在変数を入力として前記所定の表記法で表された色素材料情報を出力するVAEデコーダと、をそれぞれ訓練することと、
前記VAEエンコーダと、前記VAEデコーダと、前記色素材料の複数の物性に係るデータとに基づき、前記複数の物性の全てを満足する所望の色素材料を特定することと
を実行させ、
前記色素材料は、二色性色素材料であり、前記複数の物性は、最大吸収波長、及び二色比を含む、プログラム。