(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-23
(45)【発行日】2024-07-31
(54)【発明の名称】データ処理方法、データ処理装置及びデータ処理システム
(51)【国際特許分類】
G16C 60/00 20190101AFI20240724BHJP
【FI】
G16C60/00
(21)【出願番号】P 2023148671
(22)【出願日】2023-09-13
(62)【分割の表示】P 2020572208の分割
【原出願日】2020-02-06
【審査請求日】2023-09-13
(31)【優先権主張番号】P 2019022362
(32)【優先日】2019-02-12
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004178
【氏名又は名称】JSR株式会社
(74)【代理人】
【識別番号】110001771
【氏名又は名称】弁理士法人虎ノ門知的財産事務所
(72)【発明者】
【氏名】大西 裕也
(72)【発明者】
【氏名】永井 智樹
【審査官】山田 倍司
(56)【参考文献】
【文献】特開2007-039437(JP,A)
【文献】国際公開第2010/016109(WO,A1)
【文献】国際公開第2014/034577(WO,A1)
【文献】米国特許出願公開第2018/0032663(US,A1)
【文献】特表2021-524622(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
物性値の真値が既知の複数の第1化合物それぞれについて、前記物性値としての第1の計算値を、フォンノイマン型コンピュータにより実行される第1の計算法により取得する第1の取得ステップと、
前記複数の第1化合物それぞれについて、前記物性値としての第2の計算値を、前記第1の計算法により計算結果が取得できない領域で計算結果を取得可能な計算法であって、 量子演算装置により実行される第2の計算法により取得する第2の取得ステップと、
前記第1の計算値を前記真値に補正する第1の補正モデルと、前記第2の計算値を前記真値に補正する第2の補正モデルとを生成する生成ステップと、
物性値の真値が未知の第2化合物について、前記第1の計算法により物性値としての第3の計算値を取得する第3の取得ステップと、
少なくとも前記第1の計算法により計算結果が取得できる領域を含む領域において得られた前記第3の計算値を前記第1の補正モデルにより補正し、補正した値を前記第2化合物の前記物性値の真値としてデータベースに格納する第1の格納ステップと、
少なくとも前記第1の計算法により計算結果が取得できない領域を含む領域において、前記第2の計算法により前記第2化合物の物性値としての第4の計算値を取得する第4の取得ステップと、
前記第4の計算値を前記第2の補正モデルにより補正し、補正した値を前記第2化合物の物性値の真値として前記データベースに格納する第2の格納ステップと、
を含む、データ処理方法。
【請求項2】
前記第2の計算法は、量子位相推定法である、請求項1に記載のデータ処理方法。
【請求項3】
前記データベースを用いて所定の特徴量を有する新規化合物を探索する探索ステップ、
を更に含む、請求項1に記載のデータ処理方法。
【請求項4】
前記第3の取得ステップは、前記新規化合物について前記第3の計算値を取得し、
前記第1の格納ステップは、少なくとも前記第1の計算法により計算結果が取得できる領域を含む領域において得られた前記第3の計算値を前記第1の補正モデルにより補正した値を前記新規化合物の前記物性値の真値として前記データベースに格納し、
前記第4の取得ステップは、少なくとも前記第1の計算法により計算結果が取得できない領域を含む領域において、前記第2の計算法により前記新規化合物の物性値としての前記第4の計算値を取得し、
前記第2の格納ステップは、前記第4の計算値を前記第2の補正モデルにより補正した値を前記新規化合物の物性値の真値として前記データベースに格納する、
請求項3に記載のデータ処理方法。
【請求項5】
前記探索ステップは、前記データベースを用いた機械学習により前記新規化合物を探索する、
請求項3又は4に記載のデータ処理方法。
【請求項6】
前記生成ステップは、前記複数の第1化合物それぞれについて、前記真値と前記第1の計算値と前記第2の計算値とを比較し、前記第1の計算値が前記真値と相関を有する範囲において前記第1の補正モデルを生成し、前記第2の計算値が前記真値と相関を有する範囲において前記第2の補正モデルを生成する、
請求項1~5のいずれか1つに記載のデータ処理方法。
【請求項7】
前記生成ステップは、記第2の化合物について、前記第1の格納ステップで前記データベースに前記物性値の真値として格納した値と、前記第2の計算法により前記物性値として取得された計算値とを更に用いて、前記第2の補正モデルを生成する、
請求項1~6のいずれか1つに記載のデータ処理方法。
【請求項8】
前記第1化合物の前記物性値の真値は、実験により求められた実験値である、
請求項1~7のいずれか1つに記載のデータ処理方法。
【請求項9】
前記第1の計算法は、密度汎関数理論に基づく計算法であり、
前記第2の計算法は、変分量子固有値計算である、
請求項1に記載のデータ処理方法。
【請求項10】
前記第1の取得ステップ及び前記第3の取得ステップそれぞれは、前記フォンノイマン型コンピュータにより前記第1の計算法を実行させることで、前記第1の計算値及び前記第3の計算値をそれぞれ取得し、
前記第2の取得ステップ及び前記第4の取得ステップそれぞれは、前記量子演算装置により前記第2の計算法を実行させることで、前記第2の計算値及び前記第4の計算値をそれぞれ取得する、
請求項1~9のいずれか1つに記載のデータ処理方法。
【請求項11】
前記量子演算装置は、NISQ(Noisy Intermediate-Scale Quantum device)である、
請求項10に記載のデータ処理方法。
【請求項12】
物性値の真値が既知の複数の第1化合物それぞれについて、前記物性値としての第1の計算値を、フォンノイマン型コンピュータにより実行される第1の計算法により取得し、前記複数の第1化合物それぞれについて、前記物性値としての第2の計算値を、前記第1の計算法により計算結果が取得できない領域で計算結果を取得可能な計算法であって、量子演算装置により実行される第2の計算法により取得する取得部と、
前記第1の計算値を前記真値に補正する第1の補正モデルと、前記第2の計算値を前記真値に補正する第2の補正モデルとを生成する生成部と、
物性値の真値が未知の第2化合物について、前記第1の計算法により物性値として前記取得部が取得した第3の計算値であって、少なくとも前記第1の計算法により計算結果が取得できる領域を含む領域において得られた前記第3の計算値を前記第1の補正モデルにより補正し、補正した値を前記第2化合物の前記物性値の真値としてデータベースに格納し、少なくとも前記第1の計算法により計算結果が取得できない領域を含む領域において、前記第2の計算法により前記第2化合物の物性値として前記取得部が取得した第4の計算値を前記第2の補正モデルにより補正し、補正した値を前記第2化合物の物性値の真値として前記データベースに格納する格納部と、
を備える、データ処理装置。
【請求項13】
物性値の真値が既知の複数の第1化合物それぞれについて、前記物性値としての第1の計算値を、フォンノイマン型コンピュータにより実行される第1の計算法により取得し、前記複数の第1化合物それぞれについて、前記物性値としての第2の計算値を、前記第1の計算法により計算結果が取得できない領域で計算結果を取得可能な計算法であって、量子演算装置により実行される第2の計算法により取得する取得部と、
前記第1の計算値を前記真値に補正する第1の補正モデルと、前記第2の計算値を前記真値に補正する第2の補正モデルとを生成する生成部と、
物性値の真値が未知の第2化合物について、前記第1の計算法により物性値として前記取得部が取得した第3の計算値であって、少なくとも前記第1の計算法により計算結果が取得できる領域を含む領域において得られた前記第3の計算値を前記第1の補正モデルにより補正し、補正した値を前記第2化合物の前記物性値の真値としてデータベースに格納し、少なくとも前記第1の計算法により計算結果が取得できない領域を含む領域において、前記第2の計算法により前記第2化合物の物性値として前記取得部が取得した第4の計算値を前記第2の補正モデルにより補正し、補正した値を前記第2化合物の物性値の真値として前記データベースに格納する格納部と、
を備える、データ処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理方法、データ処理装置及びデータ処理システムに関する。
【背景技術】
【0002】
近年、新規材料探索の手法として、材料科学と情報科学とを融合したマテリアルズインフォマティクス(Materials Informatics)が注目されている。マテリアルズインフォマティクスは、材料(化合物)に関する構造や物性等の様々な情報が登録されたデータベースを解析することで、材料探索を行う。
【0003】
マテリアルズインフォマティクスでは、データベースを利用したデータマイニングや機械学習により材料探索が行われる(例えば、非特許文献1を参照)。
【先行技術文献】
【非特許文献】
【0004】
【文献】Joanne Hill, et al., "Materials science with large-scale data and informatics: Unlocking new opportunities", MRS Bulletin, Volume 41, Issue 5 (Nucleation in Atomic, Molecular, and Colloidal Systems) May 2016, pp. 399-409
【発明の概要】
【発明が解決しようとする課題】
【0005】
ここで、新規化合物の探索対象となり得る化合物の数は、理論上、膨大である。しかし、探索対象となり得る化合物の数に対して、データベースに物性値が登録されている化合物の数は、現状、十分ではない。
【0006】
本発明は、新規材料探索に利用されるデータベースの情報量を増大することができるデータ処理方法、データ処理装置及びデータ処理システムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本発明は、物性値の真値が既知の複数の第1化合物それぞれについて、前記物性値としての第1の計算値を、フォンノイマン型コンピュータにより実行される第1の計算法により取得する第1の取得ステップと、前記複数の第1化合物それぞれについて、前記物性値としての第2の計算値を、前記第1の計算法により計算結果が取得できない領域で計算結果を取得可能な計算法であって、量子演算装置により実行される第2の計算法により取得する第2の取得ステップと、前記第1の計算値を前記真値に補正する第1の補正モデルと、前記第2の計算値を前記真値に補正する第2の補正モデルとを生成する生成ステップと、物性値の真値が未知の第2化合物について、前記第1の計算法により物性値としての第3の計算値を取得する第3の取得ステップと、少なくとも前記第1の計算法により計算結果が取得できる領域を含む領域において得られた前記第3の計算値を前記第1の補正モデルにより補正し、補正した値を前記第2化合物の前記物性値の真値としてデータベースに格納する第1の格納ステップと、少なくとも前記第1の計算法により計算結果が取得できない領域を含む領域において、前記第2の計算法により前記第2化合物の物性値としての第4の計算値を取得する第4の取得ステップと、前記第4の計算値を前記第2の補正モデルにより補正し、補正した値を前記第2化合物の物性値の真値として前記データベースに格納する第2の格納ステップと、を含む、データ処理方法である。
【0008】
また、本発明は、物性値の真値が既知の複数の第1化合物それぞれについて、前記物性値としての第1の計算値を、フォンノイマン型コンピュータにより実行される第1の計算法により取得し、前記複数の第1化合物それぞれについて、前記物性値としての第2の計算値を、前記第1の計算法により計算結果が取得できない領域で計算結果を取得可能な計算法であって、量子演算装置により実行される第2の計算法により取得する取得部と、前記第1の計算値を前記真値に補正する第1の補正モデルと、前記第2の計算値を前記真値に補正する第2の補正モデルとを生成する生成部と、物性値の真値が未知の第2化合物について、前記第1の計算法により物性値として前記取得部が取得した第3の計算値であって、少なくとも前記第1の計算法により計算結果が取得できる領域を含む領域において得られた前記第3の計算値を前記第1の補正モデルにより補正し、補正した値を前記第2化合物の前記物性値の真値としてデータベースに格納し、少なくとも前記第1の計算法により計算結果が取得できない領域を含む領域において、前記第2の計算法により前記第2化合物の物性値として前記取得部が取得した第4の計算値を前記第2の補正モデルにより補正し、補正した値を前記第2化合物の物性値の真値として前記データベースに格納する格納部と、を備える、データ処理装置である。
【0009】
また、本発明は、物性値の真値が既知の複数の第1化合物それぞれについて、前記物性値としての第1の計算値を、フォンノイマン型コンピュータにより実行される第1の計算法により取得し、前記複数の第1化合物それぞれについて、前記物性値としての第2の計算値を、前記第1の計算法により計算結果が取得できない領域で計算結果を取得可能な計算法であって、量子演算装置により実行される第2の計算法により取得する取得部と、前記第1の計算値を前記真値に補正する第1の補正モデルと、前記第2の計算値を前記真値に補正する第2の補正モデルとを生成する生成部と、物性値の真値が未知の第2化合物について、前記第1の計算法により物性値として前記取得部が取得した第3の計算値であって、少なくとも前記第1の計算法により計算結果が取得できる領域を含む領域において得られた前記第3の計算値を前記第1の補正モデルにより補正し、補正した値を前記第2化合物の前記物性値の真値としてデータベースに格納し、少なくとも前記第1の計算法により計算結果が取得できない領域を含む領域において、前記第2の計算法により前記第2化合物の物性値として前記取得部が取得した第4の計算値を前記第2の補正モデルにより補正し、補正した値を前記第2化合物の物性値の真値として前記データベースに格納する格納部と、を備える、データ処理システムである。
【発明の効果】
【0010】
本発明によれば、新規材料探索に利用されるデータベースの情報量を増大することができる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、実施形態のデータ処理システムの概略構成の一例を示す図である。
【
図2】
図2は、実施形態のデータ処理装置のハードウェア構成の一例を示す図である。
【
図3】
図3は、実施形態のデータ処理装置が有する機能の一例を示す図である。
【
図5】
図5は、実施形態のデータ処理システムの動作例を示すフローチャートである。
【
図6】
図6は、DFT計算結果及びQVE計算結果の傾向を概念的に示す図である。
【
図7】
図7は、
図5に示すフローチャートのステップS1の詳細を示すフローチャートである。
【
図8】
図8は、
図7における取得部及び生成部の処理を説明するための図である。
【
図9】
図9は、
図7における生成部の処理を説明するための図である。
【
図10】
図10は、
図5に示すフローチャートのステップS2の詳細を示すフローチャートである。
【
図11】
図11は、ステップS2の処理後のデータベースを説明するための図である。
【
図12】
図12は、ステップS2の処理結果を説明するための図である。
【
図14】
図14は、
図5に示すフローチャートのステップS4の詳細を示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、添付図面を参照しながら、本発明に係るデータ処理方法、データ処理装置及びデータ処理システムの実施形態を詳細に説明する。以下では、本明細書で開示するデータ処理方法を実行するシステムを実施形態として説明する。
【0013】
(実施形態)
図1は、実施形態のデータ処理システム1の概略構成の一例を示す図である。
図1に示すように、実施形態のデータ処理システム1は、データ処理装置10と、量子演算装置20とを含む。
図1に例示する各装置は、LAN(Local Area Network)やWAN(Wide Area Network)等のネットワークにより、直接的、又は間接的に相互に通信可能な状態となっている。
【0014】
データ処理装置10は、量子力学的な重ね合わせを用いて並列性を実現するコンピュータである量子コンピュータに対比して、所謂、古典コンピュータと呼ばれるフォンノイマン型コンピュータである。
図1に示すデータ処理装置10は、例えば、密度汎関数理論(Density Functional Theory:DFT)に基づく計算法を実行可能なワークステーションである。
【0015】
量子演算装置20は、量子コンピュータや量子アニーラーにより実現される演算装置である。量子演算装置20は、完全な誤り訂正機能を持った量子コンピュータではなく、ノイズを含んだ計算結果を出力するNISQ(Noisy Intermediate-Scale Quantum device)である。
図1に示す量子演算装置20は、例えば、変分量子固有値計算(Variational Quantum Eigensolver:VQE)を実行可能である。
【0016】
図2は、データ処理装置10のハードウェア構成の一例を示す図である。
図2に示すように、データ処理装置10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、補助記憶装置14と、入力装置15と、表示装置16と、外部I/F17とを備える。
【0017】
CPU11は、プログラムを実行することにより、データ処理装置10の動作を統括的に制御し、データ処理装置10が有する各種の機能を実現する。データ処理装置10が有する各種の機能については後述する。
【0018】
ROM12は、不揮発性のメモリであり、データ処理装置10を起動させるためのプログラムを含む各種データ(データ処理装置10の製造段階で書き込まれる情報)を記憶する。RAM13は、CPU11の作業領域を有する揮発性のメモリである。補助記憶装置14は、CPU11が実行するプログラム等の各種データを記憶する。補助記憶装置14は、例えばHDD(Hard Disc Drive)等で構成される。
【0019】
入力装置15は、データ処理装置10を使用するユーザが各種の操作を行うためのデバイスである。入力装置15は、例えばマウス、キーボード、タッチパネル又はハードウェアキーで構成される。
【0020】
表示装置16は、各種情報を表示する。例えば、表示装置16は、CPU11の処理結果や、ユーザから各種操作を受け付けるためのGUI(Graphical User Interface)等を表示する。表示装置16は、例えば液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ又はブラウン管ディスプレイで構成される。なお、例えばタッチパネルのような形態で、入力装置15と表示装置16とが一体に構成されても良い。
【0021】
外部I/F17は、量子演算装置20等の外部装置と接続(通信)するためのインタフェースである。
【0022】
図3は、データ処理装置10が有する機能の一例を示す図である。なお、
図3の例では、実施形態に関する機能のみを例示しているが、データ処理装置10が有する機能はこれらに限られるものではない。
図3に示すように、データ処理装置10は、ユーザインタフェース部101、記憶部102、取得部103、生成部104、格納部105及び探索部106を有する。
【0023】
ユーザインタフェース部101は、ユーザの入力を受け付ける機能、及び、各種情報を表示する機能を有する。ユーザインタフェース部101は、例えば
図2に示す入力装置15及び表示装置16で実現される。
【0024】
記憶部102は、例えば
図2に示す補助記憶装置14(例えばHDD)で実現される。記憶部102は、実施形態のデータ処理方法を実行するためデータとして、化合物ごとに、当該化合物の化学的特徴が対応付けられたデータベース(化合物データベース)を記憶する。具体的には、記憶部102は、化合物ごとに、当該化合物の部分構造の特性を示す数値(分子記述子)や、物性を示す物性値の真値等が対応付けられたデータベースを記憶する。
【0025】
図4は、
図3に示す記憶部を説明するための図である。例えば、記憶部102には、
図4に示すように、化合物ごとに、化学構造を示す文字列(分子記述子)と、イオン化ポテンシャル(ionization potential:IP)の真値と、電子親和力(electron affinity:EA)の真値とが登録されたデータベース102aを記憶している。なお、データベース102aに登録される物性値の真値は、実験により求められた実験値であっても、高精度な計算により求められた計算値であっても良い。
【0026】
また、実施形態のデータ処理方法を実行するためデータとして、記憶部102は、
図4に示すように、学習済みモデル102bを記憶する。学習済みモデル102bは、後述する探索部106の処理に用いられるものである。学習済みモデル102bは、教師データを用いた機械学習により生成される。学習済みモデル102bの生成に用いられる教師データは、例えば、物性Aの物性値の真値として、イオン化ポテンシャルの真値と、電子親和力の真値とが既知の化合物のリストである。例えば、教師データは、データベース102aである。或いは、教師データは、データベース102aとは異なるデータベースでありデータベース102aと同様の構造を有するデータベースである。或いは、教師データは、データベース102a、及び、データベース102aとは異なるデータベースでありデータベース102aと同様の構造を有するデータベースである。
【0027】
かかる学習済みモデル102bは、ユーザから物性Aについて所望する物性値「AX」(所定の特徴量の一例)が入力された場合、物性値「AX」を有する新規化合物を推定し、出力する。例えば、物性Aは、イオン化ポテンシャルや電子親和力である。例えば、学習済みモデル102bは、後述する探索部106から、物性Aの物性値として、イオン化ポテンシャルの物性値「AX」が入力されると、物性値「AX」を有すると推定される化学構造の文字列を出力する。また、学習済みモデル102bは、後述する探索部106から、物性Aの物性値として、電子親和力の物性値「AX」が入力されると、物性値「AX」を有すると推定される化学構造の文字列を出力する。また、学習済みモデル102bは、後述する探索部106から、物性Aの物性値として、イオン化ポテンシャルの物性値「AX1」及び電子親和力の物性値「AX2」が入力されると、物性値「AX1」及び物性値「AX2」を有すると推定される化学構造の文字列を出力する。なお、学習モデル102bは、データ処理装置10により生成される場合であっても、別の装置で生成される場合であっても良い。
【0028】
このように、データ処理装置10は、上記のデータベース101aを利用して新規材料探索を実行する。ここで、新規化合物の探索対象となり得る化合物の数は、理論上、膨大である。しかし、探索対象となり得る化合物の数に対して、データベース101aに物性値が登録されている化合物の数は、十分ではない。そこで、データ処理装置10は、新規材料探索に利用されるデータベース101aの情報量を増大するため、量子演算装置20と協働して、以下に説明するデータ処理方法を実行する。
図5は、実施形態のデータ処理システムの動作例を示すフローチャートである。以下、各ステップについて説明する。
【0029】
(ステップS1)
まず、データ処理装置10は、補正モデルを生成する(ステップS1)。ステップS1は、
図3に示す取得部103及び生成部104により実行される処理である。
【0030】
ステップS1において、取得部103は、物性値の真値が既知の複数の第1化合物それぞれについて、物性値としての第1の計算値を第1の計算法により取得する(第1の取得ステップ)。実施形態では、第1の計算法は、上述したDFTであり、取得部103が有するDFT計算部103aにより実行される。また、ステップS1において、取得部103は、複数の第1化合物それぞれについて、物性値としての第2の計算値を、第2の計算法により取得する(第2の取得ステップ)。実施形態では、第2の計算法は、上述したVQEであり、取得部103が有するVQE計算命令部103bが量子演算装置20に計算命令を送出することで実行される。そして、ステップS1において、生成部104は、第1の計算値を真値に補正する第1の補正モデルと、第2の計算値を真値に補正する第2の補正モデルとを生成する(生成ステップ)。
【0031】
ここで、第2の計算法の一例であるVQE計算は、第1の計算法(DFT)により計算結果が取得できない領域で計算結果を取得可能な計算法である。この点について、
図6を用いて説明する。
図6は、イオン化ポテンシャルの計算値を横軸とし、イオン化ポテンシャルの真値を縦軸として、DFTによる計算結果と真値との関係と、VQEによる計算と真値との関係を示している。なお、
図6に示す関係は、実施形態のデータ処理方法の概念を説明するための一例であり、実際のイオン化ポテンシャルの計算結果を含め、全ての物性の計算結果について同様の関係が成立することを意図するものではない。
【0032】
図6に示すように、DFT計算では、DFTにより計算結果が取得できる領域1000と、DFTにより計算結果が取得できない領域1100とがある。領域1000は、DFT計算により、真値と相関を有する計算結果が得られる領域である。換言すると、領域1000は、DFTにより定性的に正しい計算結果が得られる領域であり、DFTにより妥当な計算結果が取得できる領域である。
【0033】
一方、領域1100は、DFTにより妥当でない計算結果が取得される領域1200と、DFT計算が不正終了する領域1300とに分けられる。領域1200は、DFT計算により計算結果が得られるが、領域1000と比較して、真値との相関が低い計算結果が得られる領域である。
【0034】
これに対して、VQE計算では、原理的には、計算不可能な領域はなく、定性的には正しい計算結果が得られる。ここで、NISQ(量子演算装置20)で実行されるVQE計算では、
図6に示すように、統計的に一定のノイズを含んだ計算値が得られる。すなわち、VQE計算では、DFT計算で計算結果が取得されない領域1000に含まれる化合物であっても、定性的に正しい計算結果を得ることができる。ただし、VQE計算はDFT計算に比べて、計算時間がかかるため、高速な処理のためにはDFT計算が可能な分子はDFT計算によりデータの収集を行う。
【0035】
そこで、実施形態では、ステップS1において、生成部104は、複数の第1化合物それぞれについて、真値と第1の計算値(DFT計算結果)と第2の計算値(VQE計算結果)とを比較する。そして、生成部104は、第1の計算値が真値と相関を有する範囲において第1の補正モデル(DFT補正モデル)を生成し、第2の計算値が真値と相関を有する範囲において第2の補正モデル(VQE補正モデル)を生成する。
【0036】
ステップS1の具体的な処理について、
図7~
図9を用いて説明する。
図7は、
図5に示すフローチャートのステップS1の詳細を示すフローチャートであり、
図8は、
図7における取得部103及び生成部104の処理を説明するための図であり、
図9は、
図7における生成部104の処理を説明するための図である。
【0037】
図7に示すように、取得部103は、物性値の真値が既知の第1化合物のリストを取得する(ステップS11)。例えば、取得部103は、記憶部102が記憶するデータベース102aからデータを取得する。なお、ステップS11で取得される「イオン化ポテンシャル及び電子親和力の真値が既知の化合物のリスト」は、ユーザインタフェース部101を介して外部から取得されても良い。
【0038】
DFT計算部103aは、第1化合物の化学構造からDFT計算用の計算式を作成し、DFT計算を実行し計算結果を取得する(ステップS12)。また、ステップS12と並行して、VQE計算命令部103bは、第1化合物の化学構造からVQE計算用の計算式を作成し、作成した計算式を量子演算装置20に送信することで、量子演算装置20にVQE計算を実行させ、計算結果を取得する(ステップS13)。なお、ステップS12は、ステップS13の実行前に実行される場合であっても、ステップS13の実行後に実行される場合であっても良い。
【0039】
図8は、取得部103がイオン化ポテンシャルの計算結果を取得する場合の一例を示している。
図8の上段では、「化合物:CK1、真値:IP_1」について、DFTの計算結果が「IPD_1」であり、VQEの計算結果が「IPV_1」であったことを示している。同様に、
図8の上段では、「化合物:CK2、真値:IP_2」について、DFTの計算結果が「IPD_2」であり、VQEの計算結果が「IPV_2」であったことを示している。そして、
図8の上段では、「化合物:CKn、真値:IP_n」について、VQEの計算結果が「IPV_n」であるが、DFTの計算結果が取得できなかったことを示している。すなわち、「化合物:CKn」は、DFT計算では領域1300に該当する化合物である。
【0040】
図7に戻って、生成部104は、計算結果と真値とを比較する(ステップS14)。ステップS14では、生成部104は、DFTの計算結果それぞれについて、真値と相関を有するか否かを判定する。同様に、ステップS14では、生成部104は、VQEの計算結果それぞれについて、真値と相関を有するか否かを判定する。
図8の下段では、生成部104は、DFTの計算結果「IPD_2」が真値と相関を有さない値であると判定する。この判定結果は、「化合物:CK2」が、DFT計算では領域1200に含まれる計算結果が取得される化合物であることを示している。なお、
図6に示す一例では、VQE計算の結果は、全て真値と相関を有すると判定される。
【0041】
そして、生成部104は、DFT補正モデルとVQE補正モデルとを生成する(ステップS15)。例えば、生成部104は、
図9に示すように、DFTの計算結果が、領域1000の範囲に含まれる場合に、DFTの計算結果を真値に補正するDFT補正モデルを生成する。また、生成部104は、
図9に示すように、VQEの計算結果を真値に補正するDFT補正モデルを生成する。なお、ステップS1では、イオン化ポテンシャルについて、DFT計算とVQE計算とが実行され、DFT補正モデルとVQE補正モデルとが生成されるとともに、電子親和力についても、DFT計算とVQE計算とが実行され、DFT補正モデルとVQE補正モデルとが生成される。
【0042】
ステップS1により生成されたDFT補正モデルとVQE補正モデルを用いることで、以下のステップS2で説明するように、広範な分子に適用可能な補正処理が可能となる。
【0043】
(ステップS2)
図5に戻って、ステップS1の後、データ処理装置10は、データベースを構築する(ステップS2)。ステップS2は、
図3に示す取得部103及び格納部105により実行される処理である。
【0044】
ステップS2において、取得部13(DFT計算部103a)は、物性値の真値が未知の第2化合物について、第1の計算法(DFT)により物性値としての第3の計算値を取得する(第3の取得ステップ)。そして、格納部105は、少なくとも第1の計算法(DFT)により計算結果が取得できる領域(領域1000)を含む領域において得られた第3の計算値を第1の補正モデル(DFT補正モデル)により補正し、補正した値を第2化合物の物性値の真値としてデータベース102aに格納する(第1の格納ステップ)。
【0045】
そして、取得部13(VQE計算命令部103b)は、少なくとも第1の計算法により計算結果が取得できない領域(領域1100)を含む領域において、第2の計算法(QVE)により前記第2化合物の物性値としての第4の計算値を取得する(第4の取得ステップ)。そして、格納部105は、第4の計算値を第2の補正モデル(VQE補正モデル)により補正し、補正した値を第2化合物の物性値の真値としてデータベース102aに格納する(第2の格納ステップ)。
【0046】
ステップS2の具体的な処理について、
図10~
図12を用いて説明する。
図10は、
図5に示すフローチャートのステップS2の詳細を示すフローチャートであり、
図11は、ステップS2の処理後のデータベースを説明するための図であり、
図12は、ステップS2の処理結果を説明するための図である。
【0047】
図10に示すように、取得部103は、物性値の真値が未知の第2化合物のリストを取得する(ステップS21)。例えば、ユーザインタフェース部101は、ユーザが入力した「イオン化ポテンシャル及び電子親和力の真値が未知の化合物のリスト」を取得し、取得部103に引き渡す。第2化合物のリストに含まれる化合物の数は、第1化合物のリストに含まれる化合物の数より多い。なお、以下に説明するステップS22以降の処理は、リストに含まれる化合物それぞれについて繰り返し行われる。
【0048】
DFT計算部103aは、第2化合物について、DFT計算を実行し(ステップS22)、格納部105は、DFT計算により計算結果が取得できたか否かを判定する(ステップS23)。すなわち、格納部105は、DFT計算部103aの計算が不正終了したか否か、或いは、DFT計算部103aが得た計算結果が領域1200に該当する値であるか否かを判定する。換言すると、格納部105は、DFT計算により得られた計算結果が領域1000に該当する値であるか否かを判定する。
【0049】
以下、判定方法の具体例について説明する。例えば、格納部105は、実験により既知となっている真値とDFT計算結果とに相関がある領域において、一次近似により近似関数を得る。格納部105は、DFT計算で得られた値が、かかる近似関数により外挿した直線から乖離する範囲の値である場合、すなわち、領域1200にある値である場合、DFT計算により計算結果が取得できなかったと判定する。また、格納部105は、DFT計算で得られた値が、対象となる物性に応じて予め設定された閾値を用いて、妥当な計算結果か否かを判定する。例えば、IPをDFT計算により求める場合、2eV以下の領域では妥当な計算結果が得られないことが知られている。このことから、格納部105は、DFT計算で得られたIPの値が、2eV以下の場合、DFT計算により計算結果が取得できなかったと判定する。また、格納部105は、解の安定性解析を行なうことで、DFT計算により計算結果が取得できたか否かを判定する。例えば、格納部105は、非制限法によるDFT波動関数に一重項不安定性が存在するか否かを調べ、存在する場合、DFT計算により計算結果が取得できなかったと判定し、存在しない場合、DFT計算により計算結果が取得できたと判定する。
【0050】
ここで、DFT計算により計算結果が取得できている場合(ステップS23、Yes)、格納部105は、DFTの計算結果をDFT補正モデルにより補正し(ステップS24)、補正値を第2化合物の物性値の真値としてデータベース102aに格納する(ステップS27)。
【0051】
一方、DFT計算により計算結果が取得できなかった場合(ステップS23、No)、VQE計算命令部103bは、量子演算装置20にVQE計算を実行させ、計算結果を取得する(ステップS25)。そして、格納部105は、VQEの計算結果をVQE補正モデルにより補正し(ステップS26)、補正値を第2化合物の物性値の真値としてデータベース102aに格納する(ステップS27)。
【0052】
上述したステップS2(ステップS21~S27)の処理により、多数の第2化合物について、イオン化ポテンシャルの真値と、電子親和力の真値とが得られる。これにより、
図11に示すように、第2化合物を第1化合物としてデータベース102aに登録することができ、データベース102aされる情報量を大幅に増大することができる。概念的には、
図12で例示するように、イオン化ポテンシャル及び電子親和力それぞれについて、DFTでデータベースの構築が可能な領域に、VQEでデータベースを拡張できる領域を合わせることで、分子のデータベース空間を拡大することができる。また、NISQは、理論上全ての範囲で真値と相関性のある計算値を出力することができるが、現時点ではハードウェアリソースの問題やコストの問題により、NISQによるVQE計算が適用できる化合物の範囲は、古典コンピュータと呼ばれるフォンノイマン型コンピュータによるDFT計算が適用できる範囲に比べて、限定的である。この点、上述したステップS2では、DFT計算により計算結果が取得できなかった場合に、NISQによるVQE計算を実行することで、NISQを利用したデータベース拡張を効率的に行うことができる。
【0053】
(ステップS3)
図5に戻って、ステップS2の後、データ処理装置10は、ステップ2により情報量が増大したデータベース102aを用いて新規化合物を探索する(ステップS3)。ステップS3は、
図3に示す探索部106により実行される処理である。
図13は、探索部106を説明するための図である。
【0054】
例えば、入力装置15を介してユーザから物性Aについて所望する物性値「AX」を受け付けると、探索部106は、
図13に示すように、物性値「AX」を学習済みモデル102bに入力する。学習済みモデル102bは、物性Aの物性値が「AX」となる可能性のある化合物Xの構造を推定する。例えば、学習済みモデル102bは、探索部106から、物性Aの物性値として、イオン化ポテンシャルの物性値「AX」が入力されると、物性値「AX」を有すると推定される化学構造の文字列を出力する。また、学習済みモデル102bは、探索部106から、物性Aの物性値として、電子親和力の物性値「AX」が入力されると、物性値「AX」を有すると推定される化学構造の文字列を出力する。なお、図示していないが、学習済みモデル102bは、探索部106から、物性Aの物性値として、イオン化ポテンシャルの物性値「AX1」及び電子親和力の物性値「AX2」が入力されると、物性値「AX1」及び物性値「AX2」を有すると推定される化学構造の文字列を出力する。
【0055】
実施形態では、ステップS2により情報量が増大したデータベース102aを用いることで、新規化合物の探索効率を向上することができる。
【0056】
(ステップS4)
図5に戻って、ステップS3の後、データ処理装置10は、ステップ3により探索された新規化合物について、データベース102aを更新する(ステップS4)。ステップS4は、ステップS2と同様、
図3に示す取得部103及び格納部105により実行される処理である。
【0057】
ステップS4では、取得部13(DFT計算部103a)は、DFTにより新規化合物について第3の計算値を取得する。そして、格納部105は、少なくとも第1の計算法(DFT)により計算結果が取得できる領域(領域1000)を含む領域において得られた第3の計算値を第1の補正モデル(DFT補正モデル)により補正した値を新規化合物の物性値の真値としてデータベース102aに格納する。
【0058】
そして、取得部13(VQE計算命令部103b)は、少なくとも第1の計算法により計算結果が取得できない領域(領域1100)を含む領域において、第2の計算法(QVE)により新規化合物の物性値としての第4の計算値を取得する。そして、格納部105は、第4の計算値を第2の補正モデル(VQE補正モデル)により補正した値を新規化合物の物性値の真値としてデータベース102aに格納する。
【0059】
ステップS4の具体的な処理について、
図14を用いて説明する。
図14は、
図5に示すフローチャートのステップS4の詳細を示すフローチャートである。
【0060】
図14に示すように、新規化合物の入力を受け付けると(ステップS31)、DFT計算部103aは、新規化合物について、DFT計算を実行し(ステップS32)、格納部105は、DFT計算により計算結果が取得できたか否かを判定する(ステップS33)。ここで、DFT計算により計算結果が取得できている場合(ステップS33、Yes)、格納部105は、DFTの計算結果をDFT補正モデルにより補正し(ステップS34)、補正値を新規化合物の物性値の真値としてデータベース102aに格納する(ステップS37)。
【0061】
一方、DFT計算により計算結果が取得できなかった場合(ステップS33、No)、VQE計算命令部103bは、量子演算装置20にVQE計算を実行させ、計算結果を取得する(ステップS35)。そして、格納部105は、VQEの計算結果をVQE補正モデルにより補正し(ステップS36)、補正値を新規化合物の物性値の真値としてデータベース102aに格納する(ステップS37)。
【0062】
ステップS4の処理により、新規化合物についても物性値の真値を取得することができ、データベース102aの情報量を更に増大することができる。なお、真値として計算値を含めずに実験値に限定すると、ステップS4で得られる物性値の真値は、予測真値となる。
【0063】
上述したように、実施形態では、限られた数の第1化合物について、イオン化ポテンシャルや電子親和力の計算値をDFT計算及びVQE計算で取得し、計算結果を限られた数の真値と比較することで、広範な分子に適用可能な計算結果の補正モデルを求める。そして、実施形態では、広範な分子に適用可能な計算結果の補正モデルを用いて、膨大な数の第2化合物について、イオン化ポテンシャルや電子親和力の計算値を真値に変換する。これにより、実施形態では、新規材料探索に利用されるデータベース102aの情報量を増大することができる。
【0064】
また、実施形態では、情報量が増大したデータベース102aを用いることで、化合物探索の効率を向上することができるとともに、新規化合物についても、広範な分子に適用可能な計算結果の補正モデルを用いて、物性値の真値を求めることができ、データベース102aの情報量を更に増大することができる。
【0065】
以上、本発明に係る実施形態について説明したが、本発明は、上述の実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上述の実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除しても良い。
【0066】
(変形例)
以下に変形例を記載する。
【0067】
(1)変形例1
上述した実施形態で説明したステップS2の処理では、DFTにより(妥当な)計算結果が取得できる領域1000において、DFT計算で得られた計算結果(第3の計算値)がDFT補正モデルにより補正され、データベースに格納される。また、ステップS2の処理では、DFTにより計算結果が取得できない領域1100において、VQE計算で得られた計算結果(第4の計算値)が、VQE補正モデルにより補正され、データベースに格納される。ここで、ステップS2の処理では、DFTにより妥当でない計算結果が取得される領域1200において、DFTの計算結果(第3の計算値)及びVQEの計算結果(第4の計算値)の双方が取得されるが、VQE計算で得られた計算結果(第4の計算値)が、VQE補正モデルにより補正され、データベースに格納される。
【0068】
ところで、領域1200と領域1000との境界は、DFT計算結果と真値とに相関が有る範囲とDFT計算結果と真値とに無い範囲との境界となる。かかる境界は、例えば、相関係数等に対して設定された閾値や、ユーザの判断により設定される。このため、境界近傍では、第3の計算値を補正した値と、第4の計算値を補正した値とのどちらが真値として適切であるのか不明な場合がある。
【0069】
そこで、変形例1では、以下のような処理を行う。例えば、領域1200と領域1000との境界に対応するDFT計算値を「A」とし、初期設定或いはユーザ設定により「α」が与えられているとする。変形例1では、第2化合物「Z」のイオン化ポテンシャルのDFT計算値「Y1」が「A-α≦Y1≦A+α」であった場合、格納部105は、「Y1」をDFT補正モデルで補正した補正値「Y1DFT」と、第2化合物「Z」のVQE計算値「Y2」をVQE補正モデルで補正した補正値「Y2VQE」とを表示装置16に表示させる。その際、格納部105は、第2化合物「Z」の化学構造も表示装置16に表示させる。ユーザは、化学構造を考慮して、補正値「Y1DFT」と補正値「Y2VQE」とのうち、適切と判定した補正値を選択する。そして、格納部105は、ユーザが選択した補正値を、第2化合物「Z」の真値としてデータベース102aに格納する。
【0070】
変形例1では、DFTの計算結果(第3の計算値)が領域1200に含まれていても、当該計算結果が、DFT補正モデルにより補正され、データベースに格納される場合がある。また、変形例1では、DFTの計算結果(第3の計算値)が領域1000に含まれていても、第3の計算値が上記の範囲内であれば、VQEの計算結果(第4の計算値)が取得され、当該計算結果がVQE補正モデルにより補正され、データベースに格納される場合がある。変形例1の処理により、境界領域における物性値の真値として適切な値を得ることができる。
【0071】
なお、上記の変形例1では、補正値の選択がユーザにより行われる場合について説明したが、補正値の選択が自動的に行われる場合であっても良い。かかる場合、例えば、探索部106は、データベース102aを用いたデータマイニングにより、第2化合物「Z」のイオン化ポテンシャルの値を推定する。そして、格納部106は、「Y1DFT」と「Y2VQE」とのうち、探索部106が推定した値に近い値を、第2化合物「Z」の真値としてデータベース102aに格納する。
【0072】
(2)変形例2
上述した実施形態で説明したステップS2の処理で、第2の化合物についてDFT計算で得られた計算結果(第3の計算値)をDFT補正モデルにより補正した補正値が真値としてデータベース102aに格納された場合、生成部104は、以下の変形例2の処理を行っても良い。
【0073】
変形例2にかかる生成部104は、DFT計算結果をDFT補正モデルにより補正した補正値を真値とした第2の化合物について、VQEによる計算結果を、VQE計算命令部103bを介して更に取得する。そして、生成部104は、真値として格納された値と、VQEによる計算値とを更に用いて、第2の補正モデル(VQE補正モデル)を生成する。かかる変形例2の処理を随時行うことにより、第2の補正モデルを更新することでき、その結果、補正の精度を向上させることができる。
【0074】
(3)変形例3
上述した実施形態では、第1の計算法がDFTであり、第2の計算法がVQEである場合について説明したが、これに限定されるものではない。第1の計算法により計算結果が取得できない領域で計算結果を取得可能な第2の計算法であるならば、本明細書で開示したデータ処理方法に適用される第1の計算法と第2の計算法は、如何なる組み合わせでも適用可能である。例えば、第1の計算法としては、摂動論や結合クラスター理論による計算法が挙げられる。また、例えば、第2の計算法としては、量子位相推定が挙げられる。
【0075】
(4)変形例4
上述した実施形態では、物性値としてイオン化ポテンシャルと電子親和力とを計算する場合について説明したが、本明細書で開示したデータ処理方法に適用可能な第1の計算法及び第2の計算法の双方で計算可能な物性値であれば、如何なる種類の物性値であっても良い。
【0076】
(5)変形例5
上述した実施形態では、化学構造とIPとの相関、化学構造とEAとの相関、化学構造とIP及びEAとの相関を学習した学習済みモデル102bにより、所望のIPを有する化学構造、所望のEAを有する化学構造、所望のIP及びEAを有する化学構造を推定する場合について説明したが、これに限定されるものではない。例えば、学習済みモデル102bと以下に説明する第2学習済みモデルを用いることで、IP及びEAとは異なる第3の物性(物性B)を有する化学構造を推定することも可能である。例えば、第2学習済みモデルは、IPの真値と、EAの真値と、物性Bの真値とが既知の化合物のリストを教師データとして用いた機械学習により生成される。第2学習済みモデルは、探索部106から物性Bについてユーザが所望する物性値「BX」が入力されると、物性値「BX」となる可能性のあるIPの値(IPBX)と、EAの値(EABX)とを出力する。探索部106は、IPBXとEABXとを学習済みモデル102bに入力することで、物性値「BX」を有すると推定される化学構造の文字列を取得する。かかる処理により探索された新規化合物についても、ステップS4の処理を行って、IPやEAの物性値の真値を得ることができる。
【0077】
(6)変形例6
上述した実施形態におけるデータ処理システム1は、データ処理装置10と、量子演算装置20とを含んで構成されているが、実施形態のデータ処理システム1は、上述したデータ処理装置10が有する複数の機能と、量子演算装置20が有する機能とが、複数の装置に分散して配置される形態であっても良い。
【0078】
例えば、データ処理システム1は、取得部103、生成部104及び格納部105を有するデータベース構築装置と、量子演算装置20と、学習済みモデル102b及び探索部106を有する探索装置と、データベース102aを記憶する記憶装置とを含む場合であっても良い。また、記憶装置が記憶するデータベース102aは、複数のデータベース構築装置それぞれが構築したデータベースが統合されたものであっても良い。
【0079】
上述の実施形態は、以上の変形例と任意に組み合わせることができるし、以上の変形例同士を任意に組み合わせても良い。
【0080】
また、上述した実施形態のデータ処理装置10で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、光磁気ディスク(Magneto-Optical disk)、CD-R、DVD、 Blu-ray Disc(登録商標)、USB(Universal Serial Bus)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成しても良いし、インターネット等のネットワーク経由で提供又は配布するように構成しても良い。また、各種プログラムを、例えばROM等の不揮発性の記憶媒体に予め組み込んで提供するように構成しても良い。
【符号の説明】
【0081】
1 データ処理システム
10 データ処理装置
101 ユーザインタフェース部
102 記憶部
103 取得部
103a DFT計算部
103b VQE計算命令部
104 生成部
105 格納部
106 探索部
20 量子演算装置