(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-05-27
(45)【発行日】2024-06-04
(54)【発明の名称】物質の探索支援方法、物質の探索支援装置、コンピュータプログラム及び物質の製造方法
(51)【国際特許分類】
G16C 20/50 20190101AFI20240528BHJP
G16C 60/00 20190101ALI20240528BHJP
【FI】
G16C20/50
G16C60/00
(21)【出願番号】P 2023058078
(22)【出願日】2023-03-31
【審査請求日】2023-04-28
【早期審査対象出願】
(73)【特許権者】
【識別番号】000002093
【氏名又は名称】住友化学株式会社
(74)【代理人】
【識別番号】100114557
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】押木 淳
(72)【発明者】
【氏名】西田 理彦
(72)【発明者】
【氏名】栗田 靖之
【審査官】鈴木 和樹
(56)【参考文献】
【文献】特開2021-039534(JP,A)
【文献】特開2010-009257(JP,A)
【文献】特開2020-095310(JP,A)
【文献】特表2003-529843(JP,A)
【文献】特開昭62-085331(JP,A)
【文献】米国特許出願公開第2021/0125691(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
物質に対する要求物性及び合成経路に対する要求条件を取得し、
前記要求条件は、物質の構造に応じた合成経路を予測する合成経路予測ツールによる合成経路の予測の信頼度に関する条件を含み、
複数の物質について、物質の構造を表す構造情報を取得し、
物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、
予測した前記物性が前記要求物性を満たす物質を選別し、
選別した前記要求物性を満たす物質について、物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測し、
予測した前記合成経路が前記要求条件を満たす物質を選別する
処理をコンピュータが実行する物質の探索支援方法。
【請求項2】
前記要求条件は、前記合成経路におけるステップ数に関する条件、同一反応ステップ数に関する条件、同一出発化合物数に関する条件及び出発化合物のライブラリに関する条件の少なくとも1つをさらに含む
請求項1に記載の物質の探索支援方法。
【請求項3】
既知の物質を記憶する物質データベースに基づいて、前記要求物性又は前記要求条件を満たすとして選別された前記物質の構造情報が既知であるか否かを判定する
処理を前記コンピュータが実行する請求項1又は請求項2に記載の物質の探索支援方法。
【請求項4】
前記合成経路予測ツールにより予測された前記合成経路のうち、取得した前記要求条件を満たす前記合成経路を特定し、
特定された前記合成経路を一覧で示す一覧情報を出力する
処理を前記コンピュータが実行する請求項1又は請求項2に記載の物質の探索支援方法。
【請求項5】
物質に対する要求物性及び合成経路に対する要求条件を取得し、
前記要求条件は、物質の構造に応じた合成経路を予測する合成経路予測ツールによる合成経路の予測の信頼度に関する条件を含み、
複数の物質について、物質の構造を表す構造情報を取得し、
物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、
予測した前記物性が前記要求物性を満たす物質を選別し、
選別した前記要求物性を満たす物質について、物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測し、
予測した前記合成経路が前記要求条件を満たす物質を選別する
処理を実行する制御部を備える
物質の探索支援装置。
【請求項6】
物質に対する要求物性及び合成経路に対する要求条件を取得し、
前記要求条件は、物質の構造に応じた合成経路を予測する合成経路予測ツールによる合成経路の予測の信頼度に関する条件を含み、
複数の物質について、物質の構造を表す構造情報を取得し、
物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、
予測した前記物性が前記要求物性を満たす物質を選別し、
選別した前記要求物性を満たす物質について、物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測し、
予測した前記合成経路が前記要求条件を満たす物質を選別する
処理をコンピュータに実行させるためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、物質の探索支援方法、物質の探索支援装置、コンピュータプログラム及び物質の製造方法に関する。
【背景技術】
【0002】
新規物質や代替物質の研究開発において、実験を繰り返し行うことによって好ましい物質を探索することに代えて、コンピュータとデータマイニング等の情報処理技術とを用いて物質を探索する技術が提案されている。
【0003】
例えば特許文献1には、立体構造の立体構造フィンガープリントの間の類似性の評価に基づいて、リード化合物と類似しているために活性な可能性のある合成類似体を、基礎単位化合物の参照ライブラリから迅速に検索する方法が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の技術は、合成経路を考慮した物質の探索を支援することができないという問題がある。
【0006】
本開示の目的は、合成経路を考慮した物質の探索を支援することができる物質の探索支援方法等を提供することである。
【課題を解決するための手段】
【0007】
本開示の一態様に係る物質の探索支援方法は、物質の構造を表す構造情報を取得し、物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測する処理をコンピュータが実行する。
【0008】
本開示の一態様に係る物質の探索支援装置は、物質の構造を表す構造情報を取得し、物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測する処理を実行する制御部を備える。
【0009】
本開示の一態様に係るコンピュータプログラムは、物質の構造を表す構造情報を取得し、物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測する処理をコンピュータに実行させる。
【0010】
本開示の一態様に係る物質の製造方法は、物質の構造を表す構造情報を取得する工程と、物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測する工程と、物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測する工程と、予測した物性及び合成経路に基づいて、物性に対する要求物性及び合成経路に対する要求条件を満たす物質を選別する工程と、予測した合成経路に従い選別した物質を合成する工程と、を含む。
【発明の効果】
【0011】
本開示によれば、合成経路を考慮した物質の探索を支援することができる。
【図面の簡単な説明】
【0012】
【
図1】本実施形態の製造システムの構成例を示すブロック図である。
【
図3】合成経路の予測時に表示される画面の一例を示す模式図である。
【
図4】合成経路の予測時に表示される画面の一例を示す模式図である。
【
図5】探索支援装置が実行する処理手順の一例を示すフローチャートである。
【
図6】探索支援装置が実行する処理手順の一例を示すフローチャートである。
【
図7】第2実施形態の探索支援装置が実行する処理手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0013】
本開示をその実施の形態を示す図面を参照して具体的に説明する。
【0014】
(第1実施形態)
図1は、本実施形態の製造システム100の構成例を示すブロック図である。製造システム100は、探索支援装置1と製造装置2とを備える。本実施形態の製造システム100は、新規物質、代替物質の研究、開発などのために、複数の候補物質の物性及び合成経路を予測することにより製造対象となり得る物質を探索し、探索結果に応じた物質を製造する。
【0015】
本実施形態では一例として、物質が有機材料(有機分子)であり、物性として光吸収波長を予測する場合について説明する。有機材料は、例えば有機太陽電池等の電子デバイスにおける光吸収物質としての使用が想定される。分子が吸収する光の波長や強さは、分子によって異なる。電子デバイスの作製においては、分子が吸収する光の強さや波長を調整する必要があることから、所望の波長の光を吸収する有機分子を設計することが重要である。
【0016】
探索支援装置1は、種々の情報処理、情報の送受信が可能な情報処理装置であり、例えばパーソナルコンピュータ、サーバコンピュータ、量子コンピュータ等である。探索支援装置1は、複数の候補物質の物性を予測し、予測結果に基づいて、候補物質の中から所望の物性を満たし得る物質を選別する。探索支援装置1はまた、候補物質の合成経路を予測し、予測した合成経路に対する評価を加味して物質を選別する。
【0017】
製造装置2は、選別された有機材料を製造する。製造装置2は、例えば有機材料の原材料を混合する混合部(不図示)を備え、有機材料の原材料を混合して有機材料を製造する。製造装置2はさらに、有機材料を含む有機半導体膜を形成する成膜部を備え、有機半導体膜を製造してもよい。なお、製造装置2は、製造対象となる物質に応じて適宜構成されてよい。
【0018】
図1に示すように、探索支援装置1は、制御部11、記憶部12、通信部13、入力部14、及び出力部15等を備える。探索支援装置1は、複数台のコンピュータで構成し分散処理する構成でもよく、1台のサーバ内に設けられた複数の仮想マシンによって実現されていてもよく、クラウドサーバを用いて実現されていてもよい。
【0019】
制御部11は、一又は複数のCPU(Central Processing Unit)、GPU(Graphics Processing Unit)等を用いたプロセッサを備える。制御部11は、内蔵するROM(Read Only Memory)又はRAM(Random Access Memory)等のメモリ、クロック、カウンタ等を用い、各構成部を制御して処理を実行する。なお、探索支援装置1の機能は、ソフトウェア的に実現してもよいし、一部又は全部を、例えばASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等のハードウェアで実現してもよい。
【0020】
記憶部12は、例えばハードディスク、フラッシュメモリ、SSD(Solid State Drive)等の不揮発性メモリを備える。記憶部12は、探索支援装置1に接続された外部記憶装置であってもよい。記憶部12は、制御部11が参照する各種コンピュータプログラム及びデータを記憶する。
【0021】
本実施形態の記憶部12は、物性の予測に関する処理をコンピュータに実行させるためのプログラム1Pと、このプログラム1Pの実行に必要な物性予測モデル121及び合成経路予測ツール122とを記憶している。物性予測モデル121は、物質の構造に応じた物性を予測するモデルである。合成経路予測ツール122は、物質の構造に応じた合成経路を予測する。
【0022】
プログラム1Pを含むコンピュータプログラム(コンピュータプログラム製品)は、当該コンピュータプログラムを読み取り可能に記録した非一時的な記録媒体1Aにより提供されてもよい。記憶部12は、不図示の読出装置によって記録媒体1Aから読み出されたコンピュータプログラムを記憶する。記録媒体1Aは、例えば磁気ディスク、光ディスク、半導体メモリ等である。また、通信ネットワークに接続されている外部サーバからコンピュータプログラムをダウンロードし、記憶部12に記憶させてもよい。プログラム1Pは、単一のコンピュータプログラムでも複数のコンピュータプログラムにより構成されるものでもよく、また、単一のコンピュータ上で実行されても通信ネットワークによって相互接続された複数のコンピュータ上で実行されてもよい。
【0023】
通信部13は、不図示のネットワークを介して外部装置と通信するための通信モジュールを備える。制御部11は、通信部13を介して外部装置との間でデータを送受信する。通信部13は省略してもよい。
【0024】
入力部14は、候補物質に対する要求物性、合成経路に関する要求条件等、物質探索の実施に必要な各種データの入力を受け付ける。入力部14は、受け付けた入力内容を制御部11へ送出する。入力部14は、例えばキーボード、マウス、ディスプレイ内蔵のタッチパネルデバイス、外部からデータを取り込むインタフェース等を備える。
【0025】
出力部15は、予測された物性、合成経路、候補物質の選別結果等、物質探索の実施に伴う各種データを出力する。出力部15は、制御部11からの指示に従って各種の情報を出力する。出力部15は、例えばディスプレイ装置を備える。
【0026】
探索支援装置1は、外部に接続されたコンピュータを通じて操作を受付け、通知すべき情報を外部のコンピュータへ出力する構成であってもよい。この場合、探索支援装置1は、入力部14及び出力部15を備えていなくてもよい。
【0027】
図2は、物性予測モデル121の概要を示す説明図である。本実施形態の物性予測モデル121は、機械学習により生成された学習モデルである。物性予測モデル121は、人工知能ソフトウェアの一部を構成するプログラムモジュールとしての利用が想定される。物性予測モデル121は、物質の構造を表す構造情報を入力として、当該物質の物性を示す情報を出力する。
図2に示す例にて、物性予測モデル121は、有機材料(有機分子)の分子記述子を入力として有機材料の吸収波長を予測する。分子記述子は、構造情報の一例である。
【0028】
物性予測モデル121は、例えばニューラルネットワークである。物性予測モデル121は、分子記述子が入力される入力層と、物性値を出力する出力層と、特徴量を抽出する中間層(隠れ層)とを備える。中間層は、畳み込み層、プーリング層及び全結合層等を含んでもよい。中間層は、入力データの特徴量を抽出する複数のノードを有し、各種パラメータを用いて抽出された特徴量を出力層に受け渡す。入力層に分子記述子が入力された場合、学習済みパラメータによって中間層で演算が行なわれ、出力層から、物性を示す出力情報が出力される。
【0029】
物性予測モデル121の入力層に入力される構造情報は、例えば物質の化学的構造データ、物理的構造データ等を含む。構造情報は、物質の特徴量に相当する。構造情報の一例としての分子記述子は、物質の持つ構造的特徴や物理化学的特性等を計算機で扱いやすくするために数値化したものである。分子記述子は、物質の構造式から計算可能であり、公知のソフトウェア、例えばRDKit、mordred、MOE、alvaDesc、PaDEL-Descriptor、Codessa等を用いて求めることができる。物性予測モデル121の説明変数となる分子記述子には、複数の記述子項目に係る分子記述子の値が含まれてもよい。説明変数に用いる分子記述子の数及び種類は、予測対象の物質や物性に応じて適宜設定されてよい。
【0030】
構造情報は、分子記述子に限らず、例えば、化学構造式をグラフ情報に変換したもの、物理的状態(例えば固体状、液体状、気体状、膜状等)等を含んでもよい。
【0031】
物性予測モデル121の説明変数は、物質の構造情報に限らず、物質に関する各種情報を含んでよい。物性予測モデル121の説明変数は、例えば、物質の特性を表す情報、物質におけるプロセスに関する情報、物質の発光スペクトルに関するスペクトルデータ、物質の画像データ、物質が掲載されるカタログから抽出されたカタログデータ等を含んでもよい。
【0032】
物性予測モデル121の出力層は1つのノードを有し、当該ノードから吸収波長を表す連続値を出力する。なお、予測すべき吸収波長に関する情報を得ることができれば、出力層の構成は特に限定されない。物性予測モデル121は、複数種類の物性を予測可能に構成されてもよい。物性予測モデル121は、例えば、吸収波長に加えて、吸収強度、発光波長及び発光強度のうちの少なくとも1つを予測する構成であってもよい。
【0033】
物性予測モデル121は、有機材料の構造情報に対し、既知の吸収波長を示すデータがラベリングされた訓練データを用意し、当該訓練データを用いて未学習のニューラルネットワークを機械学習させることにより生成することができる。
【0034】
探索支援装置1は、訓練データに含まれる構造情報を物性予測モデル121の入力層に入力し、中間層での演算処理を経て、出力層から出力される吸収波長を取得する。探索支援装置1は、出力層から出力された吸収波長と、訓練データに含まれる吸収波長とを比較し、出力層から出力される吸収波長が正解値に近づくように、ニューロン間の重み(結合係数)等のパラメータを最適化する。パラメータの最適化の方法は特に限定されないが、例えば探索支援装置1は誤差逆伝播法を用いて各種パラメータの最適化を行う。学習が開始される前の段階では、物性予測モデル121を記述する定義情報には、初期設定値が与えられているものとする。誤差、学習回数等が所定基準を満たすことによって学習が完了すると、最適化されたパラメータが得られる。上述の処理により、有機材料の構造情報に対し吸収波長を適切に予測可能に学習された物性予測モデル121が構築される。
【0035】
物性予測モデル121は、探索支援装置1が生成するものに限定されない。探索支援装置1は、外部サーバにおいて生成された学習済みの物性予測モデル121を取得し、記憶部12に記憶してもよい。物性予測モデル121は、外部サーバにおいて生成され、探索支援装置1において学習されてもよい。
【0036】
物性予測モデル121の構成は限定されず、物質の構造に対し当該物質の物性を識別可能であればよい。物性予測モデル121は、例えば、Transformer、CNN(Convolution Neural Network)、RNN(Recurrent Neural Network)、GNN(Graph Neural Network)、サポートベクタマシン、ロジスティクス回帰、決定木、XGBoost(eXtreme Gradient Boosting )等、その他の学習アルゴリズムに基づくモデルであってもよい。物性予測モデル121は、機械学習モデルに限られず、ルールベースの手法や特定の数式によって物性を導出するものであってもよい。
【0037】
合成経路予測ツール122は、所定の経路探索手法を用いて物質の合成経路を予測するためのツールである。合成経路予測ツール122は、例えば、物質の構造情報に応じた合成経路を生成する機械学習モデルを備え、当該機会学習モデルにより、物質の構造に応じた一又は複数の合成経路を生成し、生成した合成経路を出力する。合成経路予測ツール122の機械学習モデルに入力される構造情報と、物性予測モデル121に入力される構造情報とは異なるものであってもよい。このような合成経路予測ツール122としては、公知のソフトウェアを用いてもよい。
【0038】
本実施形態の探索支援装置1による物質探索の概要を説明する。探索支援装置1は、物質探索を実行する際、コンピュータ上で複数の物質を生成し、生成した各物質の吸収波長を上述の物性予測モデル121により予測する。探索支援装置1は、吸収波長の予測結果に基づいて、候補物質の中から所望の吸収波長を満たす物質を選別する。さらに探索支援装置1は、合成経路予測ツール122を用いて、選別された各物質の合成経路を予測する。探索支援装置1は、選別された物質の中から、予測された合成経路が所定条件を満たす物質を選別する。これにより、所望の特性及び合成経路に関する要求条件の両方を満たす有機材料の候補が得られる。
【0039】
図3及び
図4は、合成経路の予測時に表示される画面の一例を示す模式図である。探索支援装置1は、例えば出力部15としてのディスプレイ装置を介して、
図3及び
図4に示す画面を表示させる。画面の表示データは探索支援装置1によって用意される。
【0040】
図3は、合成経路の予測対象となる候補物質を受け付ける受付画面30を示す。受付画面30は、例えば、合成経路を予測すべき候補物質を受け付ける物質受付部301、合成経路に対する要求条件を受け付ける条件受付部302、及び合成経路を予測させるための入力ボタン303を備える。
【0041】
物質受付部301は、有機分子の構造を表す構造情報の入力を受け付ける。ユーザは、所定の入力装置を用いて物質受付部301に有機分子の構造情報を入力する。例えば、物性予測結果に基づき選別された候補物質を一覧で示す一覧情報の中から、いずれか1つの物質をユーザが選択することにより、当該物質に対応する構造情報が入力部14に入力されてもよい。
図3に示す例では、物質受付部301は、SMILES表記のデータ(SMILES文字列)の入力を受け付けるものとするが、構造情報の入力態様は限られない。物質受付部301は、例えば、SMILES表記以外の表記法による構造情報を受け付けてもよく、構造式を受け付けてもよい。
【0042】
物質受付部301は、
図3に示すように、構造情報のフォーマットの選択を受け付けるフォーマット受付部304を備えてもよい。ユーザは、所定の入力装置を用いて、入力を希望する構造情報のフォーマットを選択することが可能である。
【0043】
条件受付部302は、有機分子に対する要求条件の入力を受け付ける。
図3に示す例にて、条件受付部302は、合成経路の予測に関する信頼度の閾値を受け付ける受付部305、合成経路の深さの閾値を受け付ける受付部306、合成経路における同一反応ステップの閾値を受け付ける受付部307、合成経路における同一出発化合物の閾値を受け付ける受付部308、及び出発化合物のライブラリの選択を受け付けるチェックボックス309を備える。
【0044】
受付部305は、信頼度の下限値を受け付ける。信頼度は、合成経路予測ツール122による合成経路の予測の確からしさを表す。信頼度は、例えば0~1までの間の値であり、信頼度が大きい程、信頼性が高いことを意味する。受付部306は、合成経路におけるステップ数の上限値を受け付ける。受付部307は、合成経路において許容される同じ反応ステップの上限値を受け付ける。受付部308は、合成経路において許容される同じ出発化合物の上限値を受け付ける。チェックボックス309は、出発化合物が収録されるライブラリの選択を受け付ける。
図3では、ライブラリの一例として、出発化合物を収録する製品カタログの選択を受け付ける。
【0045】
ユーザは、所定の入力装置を用いて受付部305~308に希望する各種閾値を入力するとともに、希望するライブラリに対応付けられたチェックボックス309を選択することにより、各項目の要求条件を設定することが可能である。ユーザは、要求条件の設定を希望する一又は複数の項目について要求条件を入力するものであってよい。未入力の項目については、要求条件が設定されていないと判定することができる。
【0046】
要求条件は、上述の例に限らない。要求条件は、例えばステップ数に対する信頼度の比率(信頼度/ステップ数)の閾値、上記比率でソートした場合の順位の閾値等であってもよい。要求条件は、合成経路の予測毎に、ユーザからの入力を受け付けることにより設定されてもよい。
【0047】
受付画面30上で、物質受付部301に有機分子の構造情報が入力されるとともに、条件受付部302に各項目の要求条件が入力された状態で、入力ボタン303が選択された場合、探索支援装置1は、合成経路の予測要求を受け付ける。
【0048】
探索支援装置1は、合成経路予測ツール122を用いて、予測要求を受け付けた有機分子の構造情報に応じた合成経路を予測する。詳細には、探索支援装置1は、合成経路予測ツール122に有機分子の構造情報を入力して、合成経路予測ツール122から出力される合成経路を取得する。なお、探索支援装置1は、物質受付部301で受け付けた構造情報に基づき合成経路予測ツール122への入力に適した形式の構造情報を生成し、生成した構造情報を合成経路予測ツール122に入力してもよい。
【0049】
探索支援装置1は、合成経路予測ツール122により予測された合成経路と、予測要求時に受け付けた要求条件とに基づいて、予測された合成経路のうち、要求条件を満たす一又は複数の合成経路を特定する。探索支援装置1は、予測された各合成経路が各入力項目に対する要求条件を満たすか否かを判定し、全ての入力項目に対する要求条件を満たす合成経路を抽出する。
【0050】
図4は、合成経路の予測結果を表示する結果画面31を示す。結果画面31には、特定された要求条件を満たす合成経路が一覧で表示される。合成経路の一覧は、例えば表形式であり、項目として、合成経路ID、合成経路、ステップ数、信頼度、及び詳細ルート情報等が表示される。合成経路の一覧の項目はさらに、同一反応ステップ数、同一出発化合物数、出発化合物のカタログ名称等が含まれてもよい。
【0051】
探索支援装置1は、要求条件を満たす合成経路を特定した場合、特定した各合成経路にIDを付与し、付与したIDの降順に、合成経路の簡略を合成経路列に表示させる。合成経路列には、例えば出発化合物が表示される。また探索支援装置1は、特定した合成経路について、ステップ数、信頼度、及び詳細ルートを取得する。
【0052】
ステップ数は、例えば予測された合成経路に基づいて、探索支援装置1が自動的に算出する。信頼度は、例えば合成経路予測ツール122における機械学習モデルから得る。機械学習モデルにおける出力データとしての合成経路の確率(スコア)、すなわち機械学習モデルの出力の信頼度を、予測の信頼度とすることができる。信頼度は、機械学習モデルの出力の信頼度を用いるものに限らない。信頼度は、例えば合成経路に応じた合成経路の確からしさを評価する評価モデルを用いて探索支援装置1が算出してもよい。
【0053】
詳細ルートは、予測された合成経路の全ステップを表す情報を含む。
図4に示す例にて、詳細ルート列には、全ステップを表示する詳細画面へリンクするためのリンク情報が含まれ、当該リンク情報を選択することにより、詳細画面へ遷移し、合成経路の詳細を確認することができる。詳細画面には、全ステップとともに、同一反応ステップ数、同一出発化合物数、出発化合物のカタログ名称等が表示されてもよい。探索支援装置1は、合成経路予測ツール122により予測された合成経路を取得し、取得した合成経路の詳細を表示する詳細画面を生成し、生成した詳細画面へのリンク情報を詳細ルート列に表示させる。
【0054】
探索支援装置1は、複数の合成経路を所定のソート条件に従いソートし、ソートされた合成経路を上から下に順に表示させてもよい。ソート条件としては、例えば設定された一又は複数の要求条件をソート項目とする降順又は降順が挙げられる。具体的には、ソート条件としては、信頼度をソート項目とする降順、ステップ数をソート項目とする昇順、同一反応ステップ数をソート項目とする昇順、同一出発化合物をソート項目とする昇順、ステップ数に対する信頼度の比の降順、及びそれらの組み合わせ等が挙げられる。ソート条件は、予め設定されていてもよく、ユーザからの選択を受け付けることにより決定されてもよい。
【0055】
図5及び
図6は、探索支援装置1が実行する処理手順の一例を示すフローチャートである。以下の各フローチャートにおける処理は、探索支援装置1の記憶部12に記憶するプログラム1Pに従って制御部11によって実行される。
【0056】
探索支援装置1の制御部11は、製造対象となる有機材料(有機分子)に要求される吸収波長、すなわち要求物性を取得する(ステップS11)。要求物性は、例えば吸収波長の上限値及び下限値で規定される吸収波長の範囲である。制御部11は、例えば入力部14を介して、ユーザからの入力を受け付けることで要求物性を取得する。制御部11は、通信接続された外部装置から送信される情報を受信することにより要求物性を取得してもよく、予め設定された要求物性を記憶部12から読み出すことにより要求物性を取得してもよい。
【0057】
制御部11は、複数の候補有機材料を生成する(ステップS12)。ステップS12において、候補有機材料はコンピュータ上で生成される。
【0058】
制御部11は、生成した候補有機材料それぞれについて構造情報を導出する(ステップS13)。制御部11は、例えば、公知のソフトウェアを用いて、生成した候補有機材料の分子構造を表す構造式から所定の記述子項目に係る分子記述子を構造情報として算出する。
【0059】
制御部11は、導出した構造情報を物性予測モデル121に入力する(ステップS14)。制御部11は、物性予測モデル121から出力される吸収波長を取得する(ステップS15)。制御部11は、生成した各候補有機材料に対し上述の処理を実行して、吸収波長をそれぞれ予測する。
【0060】
制御部11は、吸収波長の予測結果に基づいて、生成した候補有機材料の中から要求物性を満たす候補有機材料を選別し(ステップS16)、要求物性を満たす候補有機材料を抽出する。ステップS16において、制御部11は、物性の予測誤差を考慮し、要求物性に対し所定のマージンを加味した物性値を選別処理の閾値としてもよい。
【0061】
制御部11は、出力部15を通じて、要求物性を満たす候補有機材料の選別結果を出力する(ステップS17)。制御部11は、例えば要求物性を満たす候補有機材料と、吸収波長の予測値とを対応付けて一覧で閲覧可能な画面情報を出力する。
【0062】
制御部11は、製造対象となる有機材料の合成経路に要求される要求条件を取得する(ステップS18)。要求条件は、例えば合成経路における予測の信頼度の範囲、ステップ数の範囲、同一反応ステップ数の範囲、同一出発化合物数の範囲、及び出発化合物のライブラリの範囲の少なくとも1つを含む。制御部11は、例えば
図3に示した受付画面30を利用して、ユーザからの入力を受け付けることで要求条件を取得する。制御部11は、通信接続された外部装置から送信される情報を受信することにより要求条件を取得してもよく、予め設定された要求条件を記憶部12から読み出すことにより要求条件を取得してもよい。
【0063】
制御部11は、ステップS16で選別した要求物性を満たす候補有機材料の中から選択された候補有機材料であって、合成経路の予測対象となる候補有機材料の構造情報を取得する(ステップS19)。制御部11は、要求条件と同様に、例えば
図3に示した受付画面30を利用して、ユーザからの入力を受け付けることで構造情報を取得する。ユーザは、ステップS17で出力された画面情報を確認し、選別された候補有機材料のうちの一又は複数の候補有機材料を合成経路の予測対象として選択することができる。ユーザは、選別された要求物性を満たす候補有機材料の全部を順に受付画面30に入力してもよい。
【0064】
制御部11は、取得した候補有機材料の構造情報を合成経路予測ツール122に入力する(ステップS20)。制御部11は、合成経路予測ツール122から出力される一又は複数の合成経路を取得する(ステップS21)。
【0065】
制御部11は、取得した一又は複数の合成経路のうち、要求条件を満たす合成経路を特定する(ステップS22)。要求条件を満たす合成経路が存在しない場合、制御部11は、要求条件を満たす合成経路がゼロであると特定するものであってよい。ステップS22の処理は、候補有機材料における要求条件を満たす合成経路の有無の判定処理に相当する。
【0066】
制御部11は、出力部15を通じて、特定した要求条件を満たす一又は複数の合成経路を出力する(ステップS23)。制御部11は、例えば、
図4に示す如く、要求条件を満たす合成経路を一覧で示す一覧表を含む画面情報を出力する。制御部11は、取得した各候補有機材料に対し上述の処理を実行して、合成経路の予測及び要求条件を満たす合成経路の特定を行う。
【0067】
制御部11は、要求条件を満たす合成経路の有無の特定結果に基づいて、ステップS19で取得した候補有機材料の中から要求条件を満たす有機材料を選別し(ステップS24)、要求条件を満たす有機材料を抽出する。上述の処理により、要求物性及び要求条件を満たす有機材料が選別される。
【0068】
制御部11は、出力部15を通じて、要求物性及び要求条件を満たす有機材料の選別結果を出力する(ステップS25)。制御部11は、例えば要求物性及び要求条件を満たす有機材料と、吸収波長の予測値及び要求条件を満たす合成経路と、を対応付けて一覧で閲覧可能な画面情報を出力する。
【0069】
製造装置2では、探索支援装置1で選別された有機材料の組成に対応する原材料を用意し、用意した原材料を混合して、有機材料を製造する。製造装置2は、公知の合成手法に従い原材料を合成することにより、有機材料を得ることができる。有機材料は、例えば、カップリング反応、アミノ化反応、縮合反応等の反応やハロゲン化反応等の官能基変換反応等を組み合わせることにより得られる。製造装置2はさらに、例えばスピンコート法、真空蒸着法、インクジェット法等により有機材料を成膜し、有機半導体膜を製造してもよい。
【0070】
上述の処理において、探索支援装置1は、ステップS16又はステップS24で選別した有機材料が既知物質であるか否かを判定してもよい。既知物質とは、分子構造が公知な物質であり、新規な物質でないものを意味する。
【0071】
探索支援装置1は、例えば論文、専門書、公知の構造式検索手段等を用いて既知物質の構造式を収集し、収集した既知物質の構造式を不図示の物質データベースに記憶する。探索支援装置1は、ステップS16又はステップS24で選別した各有機材料の構造式と、物質データベースに記憶する既知物質の構造式とを比較することにより、ステップS16又はステップS24で選別した各有機材料の構造情報が既知であるか否かを判定する。探索支援装置1は、判定結果に基づいて、ステップS16又はステップS24で選別した有機材料の中から、既知化合物である有機材料を除外し、既知化合物ではない有機材料のみを選別することができる。上記構成によれば、新規物質の探索を効率的に実行することができる。
【0072】
上記では、物性予測を行った後に合成経路予測を行う例を説明したが、合成経路予測及び物性予測の処理順序は限定されない。合成経路予測を行い、予測された合成経路が要求条件を満たす有機材料を選別し、選別された有機材料に対し物性予測を行って、要求物性を満たす有機材料を選別してもよい。又は、物性予測と合成経路予測とを並行して行い、要求物性及び要求条件を満たす有機材料を選別してもよい。
【0073】
上述の物性予測モデル121により予測する物性項目は単なる例示であり、予測すべき物質に応じた各種物性を予測するものであってよい。物性予測の対象となる物質は、例えば有機化合物、無機化合物、又はそれらの混合物であってもよい。物性予測の対象となる物質は、材料物質に限定されず、例えば医薬品、生体物質、食品等であってもよい。
【0074】
本実施形態において、上述の予測及び選別方法を適用した物質の製造方法を提供できる。実施形態の物質の製造方法は、物質の構造を表す構造情報を取得する工程と、物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測する工程と、物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測する工程と、予測した物性及び合成経路に基づいて、物性に対する要求物性及び合成経路に対する要求条件を満たす物質を選別する工程と、予測した合成経路に従い選別した物質を合成する工程と、を含む。
【0075】
上記工程のうち、物質の構造情報を取得する工程と、予測モデルを用いて物質の物性を予測する工程と、合成経路予測ツールを用いて物質の合成経路を予測する工程と、要求物性及び合成経路に対する要求条件を満たす物質を選別する工程とは、上述の
図5及び
図6で説明した予測及び選別工程に対応する。予測した合成経路に従い選別した物質を合成する工程は、製造装置により行われる工程に対応する。
【0076】
本実施形態によれば、物性予測モデル121と合成経路予測ツール122とを組み合わせて使用し、物性及び合成経路の両方を考慮して物質探索を行うことができる。物性と、合成経路との両方の最適化を図ることで、実際の製造により適した物質を設計することができる。
【0077】
合成経路に対する要求条件を適宜設定することで、ユーザの希望に応じた合成経路を有する物質を選別することができるため、合成作業の効率性を向上し得る。
【0078】
合成経路予測ツール122を用いることにより、合成経路を容易且つ精度よく予測することができる。合成経路予測ツール122で精度よく予測された合成経路について、要求条件で絞り込みを行うことで、要求条件を満たす合成経路を効率的に特定することができる。
【0079】
要求条件を満たす合成経路の特定結果を一覧で閲覧可能にユーザへ提供することで、所望の合成経路を容易且つ明確に認識することができる。複数の合成経路を比較しながら、希望の合成経路を決定することができ、利便性が向上する。
【0080】
要求物性を満たす物質を選別し、選別された物質について要求条件を満たす合成経路の有無に基づきさらに選別を行うことで、探索支援装置1の演算負荷を低減しつつ、大量の物質の中から高精度に所望の物質を抽出することができる。
【0081】
(第2実施形態)
第2実施形態の探索支援装置1は、記憶部12に記憶されるプログラム1Pを実行することにより、候補物質の生成から、物性予測及び合成経路予測までを一連の処理として自動で実行する。プログラム1Pは、物性予測モデル121及び合成経路予測ツール122を含む、又はこれらとアプリケーション間連携するものであってもよい。
【0082】
図7は、第2実施形態の探索支援装置1が実行する処理手順の一例を示すフローチャートである。
【0083】
探索支援装置1の制御部11は、製造対象となる有機材料に要求される要求物性を取得する(ステップS31)。制御部11は、製造対象となる有機材料の合成経路に要求される要求条件を取得する(ステップS32)。制御部11は、例えば、ユーザからの入力を受け付ける、外部装置から送信される情報を受信する、予め設定された要求物性を記憶部12から読み出す等により、要求物性及び要求条件それぞれを取得する。
【0084】
制御部11は、コンピュータ上で、複数の候補有機材料を生成する(ステップS33)。
【0085】
制御部11は、
図5のステップS13~ステップS16と同様の処理を実行し、生成した候補有機材料それぞれについて構造情報を導出し(ステップS34)、構造情報を物性予測モデル121に入力し(ステップS35)、物性予測モデル121から出力される吸収波長を取得し(ステップS36)、候補有機材料の中から要求物性を満たす候補有機材料を選別する(ステップS37)。
【0086】
制御部11は、選別した要求物性を満たす候補有機材料の構造情報を合成経路予測ツール122に入力する(ステップS38)。制御部11は、必要に応じて、候補有機材料の構造式から合成経路予測ツール122への入力に適した構造情報を導出してもよい。制御部11は、合成経路予測ツール122から出力される合成経路を取得する(ステップS39)。
【0087】
制御部11は、取得した合成経路のうち、要求条件を満たす一又は複数の合成経路を特定する(ステップS40)。ステップS40では、制御部11は、取得した合成経路を所定のソート条件に従いソートし、ソートされた合成経路の優先順位の高い順に所定数の合成経路を抽出してもよい。制御部11は、ステップS37で選別した各候補有機材料に対し上述の処理を実行して、合成経路の予測及び要求条件を満たす合成経路の特定を行う。
【0088】
制御部11は、要求条件を満たす合成経路の有無の特定結果に基づいて、ステップS37で選別した候補有機材料の中から、要求条件を満たす有機材料を選別する(ステップS41)。
【0089】
制御部11は、出力部15を通じて、要求物性及び要求条件を満たす有機材料の選別結果を出力する(ステップS42)。
【0090】
本実施形態によれば、候補物質の生成から要求物性及び要求条件を満たす物質の抽出までの一連の処理を自動化し、物質の探索を迅速に実行でき、物質の探索担当者の手間を軽減することができる。なお、候補物質は必ずしも複数生成されるものに限らず、1つの候補物質を生成し、生成した候補物質の合成経路予測を行うことで、候補物質の適否を判定してもよい。
【0091】
今回開示した実施の形態は、全ての点で例示であって、制限的なものではないと考えられるべきである。各実施例にて記載されている技術的特徴は互いに組み合わせることができ、本発明の範囲は、特許請求の範囲内での全ての変更及び特許請求の範囲と均等の範囲が含まれることが意図される。
各実施形態に示すシーケンスは限定されるものではなく、矛盾の無い範囲で、各処理手順はその順序を変更して実行されてもよく、また並行して複数の処理が実行されてもよい。各処理の処理主体は限定されるものではなく、矛盾の無い範囲で、各装置の処理を他の装置が実行してもよい。
【0092】
各実施形態に記載した事項は相互に組み合わせることが可能である。また、特許請求の範囲に記載した独立請求項及び従属請求項は、引用形式に関わらず全てのあらゆる組み合わせにおいて、相互に組み合わせることが可能である。さらに、特許請求の範囲には他の2以上のクレームを引用するクレームを記載する形式(マルチクレーム形式)を用いているが、これに限るものではない。マルチクレームを少なくとも一つ引用するマルチクレーム(マルチマルチクレーム)を記載する形式を用いて記載してもよい。
【0093】
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
物質の構造を表す構造情報を取得し、
物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、
物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測する
処理をコンピュータが実行する物質の探索支援方法。
(付記2)
予測した前記物性及び前記合成経路に基づいて、前記物性に対する要求物性及び前記合成経路に対する要求条件を満たす物質を選別する
付記1に記載の物質の探索支援方法。
(付記3)
前記要求条件は、前記合成経路における予測の信頼度に関する条件、ステップ数に関する条件、同一反応ステップ数に関する条件、同一出発化合物数に関する条件及び出発化合物のライブラリに関する条件の少なくとも1つを含む
付記2に記載の物質の探索支援方法。
(付記4)
前記合成経路に対する要求条件を受け付け、
予測した前記合成経路が受け付けた前記要求条件を満たす物質を選別する
付記1から付記3のいずれか1つに記載の物質の探索支援方法。
(付記5)
前記物性が要求物性を満たす物質を選別し、
選別した前記要求物性を満たす物質について前記合成経路を予測し、
予測した前記合成経路が要求条件を満たす物質を選別する
付記1から付記4のいずれか1つに記載の物質の探索支援方法。
(付記6)
既知の物質を記憶する物質データベースに基づいて、取得した前記物質の構造情報が既知であるか否かを判定する
付記1から付記5のいずれか1つに記載の物質の探索支援方法。
(付記7)
前記合成経路に対する要求条件を取得し、
予測した前記合成経路のうち、取得した前記要求条件を満たす前記合成経路を特定し、
特定された前記合成経路を一覧で示す一覧情報を出力する
付記1から付記6のいずれか1つに記載の物質の探索支援方法。
(付記8)
物質の構造を表す構造情報を取得し、
物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、
物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測する
処理を実行する制御部を備える
物質の探索支援装置。
(付記9)
物質の構造を表す構造情報を取得し、
物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、
物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測する
処理をコンピュータに実行させるためのコンピュータプログラム。
(付記10)
物質の構造を表す構造情報を取得する工程と、
物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測する工程と、
物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記物質の合成経路を予測する工程と、
予測した物性及び合成経路に基づいて、物性に対する要求物性及び合成経路に対する要求条件を満たす物質を選別する工程と、
予測した合成経路に従い選別した物質を合成する工程と、を含む
物質の製造方法。
【符号の説明】
【0094】
1 探索支援装置
11 制御部
12 記憶部
13 通信部
14 入力部
15 出力部
1A 記録媒体
1P プログラム
121 物性予測モデル
122 合成経路探索ツール
2 製造装置
【要約】
【課題】合成経路を考慮した物質の探索を支援することができる物質の探索支援方法等を提供する。
【解決手段】物質の探索支援方法は、物質の構造を表す構造情報を取得し、物質の構造に応じた物性を予測する物性予測モデルを用いて、取得した前記物質の構造情報に基づき前記物質の物性を予測し、物質の構造に応じた合成経路を予測する合成経路予測ツールを用いて、前記物質の構造情報に基づき前記各物質の合成経路を予測する処理をコンピュータが実行する。
【選択図】
図1