(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023027564
(43)【公開日】2023-03-02
(54)【発明の名称】情報処理装置、プログラム、及び、情報処理方法
(51)【国際特許分類】
G16C 20/70 20190101AFI20230222BHJP
G06N 20/00 20190101ALI20230222BHJP
H01M 10/48 20060101ALI20230222BHJP
G06F 16/90 20190101ALI20230222BHJP
【FI】
G16C20/70
G06N20/00
H01M10/48 P
G06F16/90
【審査請求】有
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2021132735
(22)【出願日】2021-08-17
(71)【出願人】
【識別番号】501440684
【氏名又は名称】ソフトバンク株式会社
(71)【出願人】
【識別番号】899000079
【氏名又は名称】慶應義塾
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】齊藤 貴也
(72)【発明者】
【氏名】高柳 良基
(72)【発明者】
【氏名】宮川 絢太郎
(72)【発明者】
【氏名】緒明 佑哉
(72)【発明者】
【氏名】坂野 公亮
【テーマコード(参考)】
5B175
5H030
【Fターム(参考)】
5B175DA06
5B175FB04
5H030AA10
5H030AS20
5H030FF43
5H030FF44
(57)【要約】 (修正有)
【課題】二次電池の電極材料の特徴に基づいて二次電池の特性を予測する情報処理装置、方法及びプログラムを提供する。
【解決手段】材料探索システム100における情報処理方法は、予測の対象となる電極材料である対象材料を決定し、予測の対象となる特性である対象特性を決定し、対象特性が、対象材料が二次電池の正極活物質として用いられた場合の正極の反応電位である場合、対象材料の分子のLUMO準位のエネルギーの値及び対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値を取得し、取得した値を予測モデルに入力して、対象材料の対象特性の予測値を出力する。予測モデルは、材料が二次電池の正極活物質として用いられた場合の正極の電位を目的変数とし、材料の分子のLUMO準位のエネルギー及び材料の分子のLUMO準位から1つ上の準位のエネルギーを記述子として含む回帰モデルである。
【選択図】
図1
【特許請求の範囲】
【請求項1】
二次電池の電極材料の特徴に基づいて前記二次電池の特性を予測する情報処理装置であって、
前記予測の対象となる前記電極材料である対象材料を決定する材料決定部と、
前記予測の対象となる前記特性である対象特性を決定する特性決定部と、
前記対象特性が、前記対象材料が前記二次電池の正極活物質として用いられた場合の正極の反応電位である場合、(i)前記対象材料の分子のLUMO準位のエネルギーの値、及び、(ii)前記対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値を取得する入力値取得部と、
前記入力値取得部が取得した前記値を予測モデルに入力して、前記対象材料の前記対象特性の予測値を出力する予測部と、
を備え、
前記予測モデルは、
材料が二次電池の正極活物質として用いられた場合の正極の電位を目的変数とし、
(a)前記材料の分子のLUMO準位のエネルギー及び(b)前記材料の分子のLUMO準位から1つ上の準位のエネルギーを記述子として含む、
回帰モデルである、
情報処理装置。
【請求項2】
二次電池の電極材料の特徴に基づいて前記二次電池の特性を予測する情報処理装置であって、
前記予測の対象となる前記電極材料である対象材料を決定する材料決定部と、
前記予測の対象となる前記特性である対象特性を決定する特性決定部と、
前記対象特性が、前記対象材料が前記二次電池の正極活物質として用いられた場合の容量である場合、(iii)前記対象材料の分子構造から導出される前記対象材料及び前記二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)前記対象材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得部と、
前記入力値取得部が取得した前記値を予測モデルに入力して、前記対象材料の前記対象特性の予測値を出力する予測部と、
を備え、
前記予測モデルは、
材料が二次電池の正極活物質として用いられた場合の容量を目的変数とし、
(c)前記材料の分子構造から導出される前記材料及び前記二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)前記材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む、
回帰モデルである、
情報処理装置。
【請求項3】
二次電池の電極材料の特徴に基づいて前記二次電池の特性を予測する情報処理装置であって、
前記予測の対象となる前記電極材料である対象材料を決定する材料決定部と、
前記予測の対象となる前記特性である対象特性を決定する特性決定部と、
前記対象特性が、前記対象材料が前記二次電池の正極活物質として用いられた場合のエネルギー密度である場合、(i)前記対象材料の分子のLUMO準位のエネルギーの値、(ii)前記対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値、(iii)前記対象材料の分子構造から導出される前記対象材料及び前記二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)前記対象材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得部と、
前記入力値取得部が取得した前記値を予測モデルに入力して、前記対象材料の前記対象特性の予測値を出力する予測部と、
を備え、
前記予測モデルは、
材料が前記二次電池の正極活物質として用いられた場合のエネルギー密度を目的変数とし、
(a)前記材料の分子のLUMO準位のエネルギー、(b)前記材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)前記材料の分子構造から導出される前記材料及び前記二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)前記材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む、
回帰モデルである、
情報処理装置。
【請求項4】
前記回帰モデルは、線形回帰式又は非線形回帰式により表される、
請求項1から請求項3までの何れか一項に記載の情報処理装置。
【請求項5】
機械学習により前記予測モデルを構築するモデル構築部、
をさらに備え、
前記モデル構築部は、
それぞれが前記材料の特徴を表すN個の説明変数(Nは、2以上の正の整数である。)の中から、M個の説明変数(Mは、1以上N以下の正の整数である。)を、前記回帰モデルの前記記述子又は前記記述子の候補として選択する第1変数選択部、
を有する、
請求項1から請求項4までの何れか一項に記載の情報処理装置。
【請求項6】
前記第1変数選択部は、スパースモデリング法により前記M個の説明変数を選択する、
請求項5に記載の情報処理装置。
【請求項7】
前記第1変数選択部は、さらに、
前記M個の説明変数のそれぞれに対応する回帰係数又は偏回帰係数を決定する、
請求項5又は請求項6に記載の情報処理装置。
【請求項8】
前記材料は、有機分子又はその塩であり、
前記N個の説明変数は、
(a)前記材料の分子のLUMO準位のエネルギー、
(b)前記材料の分子のLUMO準位から1つ上の準位のエネルギー、
(c)前記材料の分子構造から導出される前記材料及び前記二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、
(d)前記材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数、
を含み、
前記N個の説明変数は、
(e)前記材料及び前記二次電池の電解液のハンセン溶解性パラメータの分散項、
(f)前記ハンセン溶解性パラメータの分極項、
(g)前記ハンセン溶解性パラメータの水素結合項、
(h)前記材料の分子の双極子モーメント、
(i)前記材料の分子の部分電荷密度の最小値、及び、
(j)前記材料の分子に含まれる炭素、水素及び酸素以外の元素の数であって、1分子当たりの元素数、
からなる群から選択される少なくとも1つをさらに含む、
請求項5から請求項7までの何れか一項に記載の情報処理装置。
【請求項9】
前記N個の説明変数は、
(k)前記材料の分子のLUMO準位から2つ上の準位のエネルギー、
(l)前記材料の分子のLUMO準位から3つ上の準位のエネルギー、
(m)前記材料の分子のLUMO準位から4つ上の準位のエネルギー、
(n)前記材料の分子の分子量、
(o)前記材料の分子に含まれるπ結合で共役している炭素の数であって、1分子当たりの炭素数、
(p)前記材料の分子の軌道のうち0以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数、
(q)前記材料の1分子当たりの前記0以下のエネルギー準位の総和の絶対値、及び、
(r)前記材料の分子の部分電荷密度の最大値、
をさらに含む、
請求項8に記載の情報処理装置。
【請求項10】
前記材料は、有機分子又はその塩であり、
前記M個の説明変数は、
(a)前記材料の分子のLUMO準位のエネルギー、
(b)前記材料の分子のLUMO準位から1つ上の準位のエネルギー、
(c)前記材料の分子構造から導出される前記材料及び前記二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、
(d)前記材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数、
から選択される少なくとも2つを含む、
請求項5から請求項9までの何れか一項に記載の情報処理装置。
【請求項11】
前記モデル構築部は、
ユーザの指示に基づいて、前記M個の説明変数の中から、K個の説明変数(Kは、1以上M以下の正の整数である。)を、前記記述子として選択する第2変数選択部、
をさらに有する、
請求項5から請求項10までの何れか一項に記載の情報処理装置。
【請求項12】
前記モデル構築部は、
それぞれが前記材料の特徴を表すL個の説明変数(Lは、N以上の正の整数である。)の中から、N個の説明変数を、前記記述子の候補として選択する第3変数選択部、
をさらに有し、
前記第3変数選択部は、
前記L個の説明変数のそれぞれについて、他の説明変数との相関関係の程度を決定し、
相関関係の程度が予め定められた基準よりも強い複数の説明変数のうち、一の説明変数を残し、他の説明変数を除外することで、L個の説明変数の中からN個の説明変数を選択する、
請求項5から請求項11までの何れか一項に記載の情報処理装置。
【請求項13】
二次電池の電極材料の特徴に基づいて前記二次電池の特性を予測するための予測モデルを構築する情報処理装置であって、
前記予測モデルは、前記二次電池の前記特性を目的変数とし、前記電極材料に関する1以上の特徴のそれぞれを記述子とする回帰モデルであり、
前記情報処理装置は、
それぞれが材料の特徴を表すN個の説明変数(Nは、2以上の正の整数である。)の中から、M個の説明変数(Mは、1以上N以下の正の整数である。)を、前記回帰モデルの前記記述子又は前記記述子の候補として選択する第1変数選択部、
を備え、
前記第1変数選択部は、
複数の材料のそれぞれについて、当該材料が前記電極材料として用いられた場合の前記二次電池に関する一の特性の値と、当該材料の特徴に関するN個の説明変数の値とが対応付けられた教師データ群が入力され、
機械学習に基づく回帰分析を実行することで、前記N個の説明変数の中から前記M個の説明変数を選択し、
前記N個の説明変数は、
(a)前記材料の分子のLUMO準位のエネルギー、
(b)前記材料の分子のLUMO準位から1つ上の準位のエネルギー、
(c)前記材料の分子構造から導出される前記材料及び前記二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、
(d)前記材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数、
を含み、
前記N個の説明変数は、
(e)前記材料及び前記二次電池の電解液のハンセン溶解性パラメータの分散項、
(f)前記ハンセン溶解性パラメータの分極項、
(g)前記ハンセン溶解性パラメータの水素結合項、
(h)前記材料の分子の双極子モーメント、
(i)前記材料の分子の部分電荷密度の最小値、及び、
(j)前記材料の分子に含まれる炭素、水素及び酸素以外の元素の数であって、1分子当たりの元素数、
からなる群から選択される少なくとも1つをさらに含む、
情報処理装置。
【請求項14】
コンピュータを、請求項1から請求項13までの何れか一項に記載の情報処理装置として機能させるためのプログラム。
【請求項15】
二次電池の電極材料の特徴に基づいて前記二次電池の特性を予測する情報処理方法であって、
コンピュータが、前記予測の対象となる前記電極材料である対象材料を決定する材料決定段階と、
前記コンピュータが、前記予測の対象となる前記特性である対象特性を決定する特性決定段階と、
前記対象特性が、前記対象材料が前記二次電池の正極活物質として用いられた場合の正極の電位である場合、前記コンピュータが、(i)前記対象材料の分子のLUMO準位のエネルギーの値、及び、(ii)前記対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値を取得する入力値取得段階と、
前記コンピュータが、前記入力値取得段階において取得された前記値を予測モデルに入力して、前記対象材料の前記対象特性の予測値を出力する予測段階と、
を有し、
前記予測モデルは、
材料が二次電池の正極活物質として用いられた場合の正極の電位を目的変数とし、
(a)前記材料の分子のLUMO準位のエネルギー及び(b)前記材料の分子のLUMO準位から1つ上の準位のエネルギーを記述子として含む、
回帰モデルである、
情報処理方法。
【請求項16】
二次電池の電極材料の特徴に基づいて前記二次電池の特性を予測する情報処理方法であって、
コンピュータが、前記予測の対象となる前記電極材料である対象材料を決定する材料決定段階と、
前記コンピュータが、前記予測の対象となる前記特性である対象特性を決定する特性決定段階と、
前記対象特性が、前記対象材料が前記二次電池の正極活物質として用いられた場合の容量である場合、前記コンピュータが、(iii)前記対象材料の分子構造から導出される前記対象材料及び前記二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)前記対象材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得段階と、
前記コンピュータが、前記入力値取得段階において取得された前記値を予測モデルに入力して、前記対象材料の前記対象特性の予測値を出力する予測段階と、
を有し、
前記予測モデルは、
材料が二次電池の正極活物質として用いられた場合の容量を目的変数とし、
(c)前記材料の分子構造から導出される前記材料及び前記二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)前記材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む、
回帰モデルである、
情報処理方法。
【請求項17】
二次電池の電極材料の特徴に基づいて前記二次電池の特性を予測する情報処理方法であって、
コンピュータが、前記予測の対象となる前記電極材料である対象材料を決定する材料決定段階と、
前記コンピュータが、前記予測の対象となる前記特性である対象特性を決定する特性決定段階と、
前記対象特性が、前記対象材料が前記二次電池の正極活物質として用いられた場合のエネルギー密度である場合、前記コンピュータが、(i)前記対象材料の分子のLUMO準位のエネルギーの値、(ii)前記対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値、(iii)前記対象材料の分子構造から導出される前記対象材料及び前記二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)前記対象材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得段階と、
前記コンピュータが、前記入力値取得段階において取得された前記値を予測モデルに入力して、前記対象材料の前記対象特性の予測値を出力する予測段階と、
を有し、
前記予測モデルは、
材料が二次電池の正極活物質として用いられた場合のエネルギー密度を目的変数とし、
(a)前記材料の分子のLUMO準位のエネルギー、(b)前記材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)前記材料の分子構造から導出される前記材料及び前記二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)前記材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む、
回帰モデルである、
情報処理方法。
【請求項18】
二次電池の電極材料の特徴に基づいて前記二次電池の特性を予測するための予測モデルを構築する情報処理方法であって、
前記予測モデルは、前記二次電池の前記特性を目的変数とし、前記電極材料に関する1以上の特徴のそれぞれを記述子とする回帰モデルであり、
前記情報処理方法は、
コンピュータが、それぞれが材料の特徴を表すN個の説明変数(Nは、2以上の正の整数である。)の中から、M個の説明変数(Mは、1以上N以下の正の整数である。)を、前記回帰モデルの前記記述子又は前記記述子の候補として選択する第1変数選択段階、
を有し、
前記第1変数選択段階は、
前記コンピュータが、複数の材料のそれぞれについて、当該材料が前記電極材料として用いられた場合の前記二次電池に関する一の特性の値と、当該材料の特徴に関するN個の説明変数の値とが対応付けられた教師データ群を取得する段階と、
コンピュータが、機械学習に基づく回帰分析を実行することで、前記N個の説明変数の中から前記M個の説明変数を選択する段階と、
を含み、
前記N個の説明変数は、
(a)前記材料の分子のLUMO準位のエネルギー、
(b)前記材料の分子のLUMO準位から1つ上の準位のエネルギー、
(c)前記材料の分子構造から導出される前記材料及び前記二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、
(d)前記材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数、
を含み、
前記N個の説明変数は、
(e)前記材料及び前記二次電池の電解液のハンセン溶解性パラメータの分散項、
(f)前記ハンセン溶解性パラメータの分極項、
(g)前記ハンセン溶解性パラメータの水素結合項、
(h)前記材料の分子の双極子モーメント、
(i)前記材料の分子の部分電荷密度の最小値、及び、
(j)前記材料の分子に含まれる炭素、水素及び酸素以外の元素の数であって、1分子当たりの元素数
からなる群から選択される少なくとも1つをさらに含む、
情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、プログラム、及び、情報処理方法に関する。
【背景技術】
【0002】
例えば、特許文献1には、分析目的と関連のある材料データを集めたデータベースから化合物空間を利用者が選択し、オートエンコーダの学習を行うことによって、より分析目的に合致した効果的な材料特徴量を生成することが開示されている。特許文献2には、ナノカーボンによる酵素-電極間電子伝達を増強する作用の有無を、当該作用に関連する記述子の関数として表される予測モデルを用いて予測することが開示されている。非特許文献1~3には、マテリアルズインフォマティクスを用いて、物質又はプロセスを探索することが開示されている。
[先行技術文献]
[特許文献]
[特許文献1]特開2021-39534号公報
[特許文献2]特開2021-40633号公報
[非特許文献]
[非特許文献1]G. Nakada, Y. Igarashi, H. Imai, Y. Oaki, Adv. Theory Simul. 2019, 2, 1800180.
[非特許文献2]H. Numazawa, Y. Igarashi, K. Sato, H. Imai, Y. Oaki, Adv. Theory Simul. 2019, 2, 1900130.
[非特許文献3]R. Mizuguchi, Y. Igarashi, H. Imai, Y. Oaki, Nanoscale 2021, 13, 3853.
【発明の概要】
【0003】
本発明の第1の態様によれば、情報処理装置が提供される。上記の情報処理装置は、例えば、二次電池の電極材料の特徴に基づいて二次電池の特性を予測する。上記の情報処理装置は、例えば、予測の対象となる電極材料である対象材料を決定する材料決定部を備える。上記の情報処理装置は、例えば、予測の対象となる特性である対象特性を決定する特性決定部を備える。上記の情報処理装置は、例えば、対象特性が、対象材料が二次電池の正極活物質として用いられた場合の正極の反応電位である場合、(i)対象材料の分子のLUMO準位のエネルギーの値、及び、(ii)対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値を取得する入力値取得部を備える。上記の情報処理装置は、例えば、入力値取得部が取得した値を予測モデルに入力して、対象材料の対象特性の予測値を出力する予測部を備える。上記の情報処理装置において、予測モデルは、例えば、材料が二次電池の正極活物質として用いられた場合の正極の電位を目的変数とし、(a)材料の分子のLUMO準位のエネルギー及び(b)材料の分子のLUMO準位から1つ上の準位のエネルギーを記述子として含む回帰モデルである。
【0004】
本発明の第2の態様によれば、情報処理装置が提供される。上記の情報処理装置は、例えば、二次電池の電極材料の特徴に基づいて二次電池の特性を予測する。上記の情報処理装置は、例えば、予測の対象となる電極材料である対象材料を決定する材料決定部を備える。上記の情報処理装置は、例えば、予測の対象となる特性である対象特性を決定する特性決定部を備える。上記の情報処理装置は、例えば、対象特性が、対象材料が二次電池の正極活物質として用いられた場合の容量である場合、(iii)対象材料の分子構造から導出される対象材料及び二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)対象材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得部を備える。上記の情報処理装置は、例えば、入力値取得部が取得した値を予測モデルに入力して、対象材料の対象特性の予測値を出力する予測部を備える。上記の情報処理装置において、予測モデルは、例えば、材料が二次電池の正極活物質として用いられた場合の正極容量を目的変数とし、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む回帰モデルである。
【0005】
本発明の第3の態様によれば、情報処理装置が提供される。上記の情報処理装置は、例えば、二次電池の電極材料の特徴に基づいて二次電池の特性を予測する。上記の情報処理装置は、例えば、予測の対象となる電極材料である対象材料を決定する材料決定部を備える。上記の情報処理装置は、例えば、予測の対象となる特性である対象特性を決定する特性決定部を備える。上記の情報処理装置は、例えば、対象特性が、対象材料が二次電池の正極活物質として用いられた場合のエネルギー密度である場合、(i)対象材料の分子のLUMO準位のエネルギーの値、(ii)対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値、(iii)対象材料の分子構造から導出される対象材料及び二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)対象材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得部を備える。上記の情報処理装置は、例えば、入力値取得部が取得した値を予測モデルに入力して、対象材料の対象特性の予測値を出力する予測部を備える。上記の情報処理装置において、予測モデルは、例えば、材料が二次電池の正極活物質として用いられた場合のエネルギー密度を目的変数とし、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む回帰モデルである。
【0006】
上記の第1の態様から第3までの態様に係る情報処理装置(単に、上記の情報処理装置と称される場合がある。)において回帰モデルは、線形回帰式又は非線形回帰式により表されてよい。
【0007】
上記の情報処理装置は、機械学習により予測モデルを構築するモデル構築部を備えてもよい。上記の情報処理装置において、モデル構築部は、それぞれが材料の特徴を表すN個の説明変数(Nは、2以上の正の整数である。)の中から、M個の説明変数(Mは、1以上N以下の正の整数である。)を、回帰モデルの記述子又は記述子の候補として選択する第1変数選択部を有してよい。上記の情報処理装置において、第1変数選択部は、スパースモデリング法によりM個の説明変数を選択してよい。上記の情報処理装置において、第1変数選択部は、M個の説明変数のそれぞれに対応する回帰係数又は偏回帰係数を決定してよい。
【0008】
上記の情報処理装置において、材料は、有機分子又はその塩であってよい。上記の情報処理装置において、N個の説明変数は、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含んでよい。上記の情報処理装置において、N個の説明変数は、(e)材料及び二次電池の電解液のハンセン溶解性パラメータの分散項、(f)ハンセン溶解性パラメータの分極項、(g)ハンセン溶解性パラメータの水素結合項、(h)材料の分子の双極子モーメント、(i)材料の分子の部分電荷密度の最小値、及び、(j)材料の分子に含まれる炭素、水素及び酸素以外の元素の数であって、1分子当たりの元素数からなる群から選択される少なくとも1つをさらに含んでよい。
【0009】
上記の情報処理装置において、N個の説明変数は、(k)材料の分子のLUMO準位から2つ上の準位のエネルギー、(l)材料の分子のLUMO準位から3つ上の準位のエネルギー、(m)材料の分子のLUMO準位から4つ上の準位のエネルギー、(n)材料の分子の分子量、(o)材料の分子に含まれるπ結合で共役している炭素の数であって、1分子当たりの炭素数、(p)材料の分子の軌道のうち0以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数、(q)材料の1分子当たりの0以下のエネルギー準位の総和の絶対値、及び、(r)材料の分子の部分電荷密度の最大値を含んでよい。
【0010】
上記の情報処理装置において、材料は、有機分子又はその塩であってよい。上記の情報処理装置において、M個の説明変数は、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数から選択される少なくとも2つを含んでよい。
【0011】
上記の情報処理装置において、モデル構築部は、ユーザの指示に基づいて、M個の説明変数の中から、K個の説明変数(Kは、1以上M以下の正の整数である。)を、記述子として選択する第2変数選択部を有してよい。上記の情報処理装置において、モデル構築部は、それぞれが材料の特徴を表すL個の説明変数(Lは、N以上の正の整数である。)の中から、N個の説明変数を、記述子の候補として選択する第3変数選択部を有してよい。上記の情報処理装置において、第3変数選択部は、L個の説明変数のそれぞれについて、他の説明変数との相関関係の程度を決定てよい。第3変数選択部は、相関関係の程度が予め定められた基準よりも強い複数の説明変数のうち、一の説明変数を残し、他の説明変数を除外することで、L個の説明変数の中からN個の説明変数を選択してよい。
【0012】
本発明の第4の態様によれば、情報処理装置が提供される。上記の情報処理装置は、例えば、二次電池の電極材料の特徴に基づいて二次電池の特性を予測するための予測モデルを構築する。上記の情報処理装置において、予測モデルは、例えば、二次電池の特性を目的変数とし、電極材料に関する1以上の特徴のそれぞれを記述子とする回帰モデルである。上記の情報処理装置は、例えば、それぞれが材料の特徴を表すN個の説明変数(Nは、2以上の正の整数である。)の中から、M個の説明変数(Mは、1以上N以下の正の整数である。)を、回帰モデルの記述子又は記述子の候補として選択する第1変数選択部を備える。上記の情報処理装置において、第1変数選択部は、例えば、複数の材料のそれぞれについて、当該材料が電極材料として用いられた場合の二次電池に関する一の特性の値と、当該材料の特徴に関するN個の説明変数の値とが対応付けられた教師データ群が入力される。第1変数選択部は、例えば、機械学習に基づく回帰分析を実行することで、N個の説明変数の中からM個の説明変数を選択する。
【0013】
上記の情報処理装置において、N個の説明変数は、例えば、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含む。上記の情報処理装置において、N個の説明変数は、例えば、(e)材料及び二次電池の電解液のハンセン溶解性パラメータの分散項、(f)ハンセン溶解性パラメータの分極項、(g)ハンセン溶解性パラメータの水素結合項、(h)材料の分子の双極子モーメント、(i)材料の分子の部分電荷密度の最小値、及び、(j)材料の分子に含まれる炭素、水素及び酸素以外の元素の数であって、1分子当たりの元素数、からなる群から選択される少なくとも1つを含む。
【0014】
本発明の第5の態様によれば、情報処理方法が提供される。上記の情報処理方法は、例えば、二次電池の電極材料の特徴に基づいて二次電池の特性を予測するための方法である。上記の情報処理方法は、例えば、コンピュータが、予測の対象となる電極材料である対象材料を決定する材料決定段階を有する。上記の情報処理方法は、例えば、コンピュータが、予測の対象となる特性である対象特性を決定する特性決定段階を有する。上記の情報処理方法は、例えば、対象特性が、対象材料が二次電池の正極活物質として用いられた場合の正極の電位である場合、コンピュータが、(i)対象材料の分子のLUMO準位のエネルギーの値、及び、(ii)対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値を取得する入力値取得段階を有する。上記の情報処理方法は、例えば、コンピュータが、入力値取得段階において取得された値を予測モデルに入力して、対象材料の対象特性の予測値を出力する予測段階を有する。上記の情報処理方法において、予測モデルは、例えば、材料が二次電池の正極活物質として用いられた場合の正極の電位を目的変数とし、(a)材料の分子のLUMO準位のエネルギー及び(b)材料の分子のLUMO準位から1つ上の準位のエネルギーを記述子として含む回帰モデルである。
【0015】
本発明の第6の態様によれば、情報処理方法が提供される。上記の情報処理方法は、例えば、二次電池の電極材料の特徴に基づいて二次電池の特性を予測するための方法である。上記の情報処理方法は、例えば、コンピュータが、予測の対象となる電極材料である対象材料を決定する材料決定段階を有する。上記の情報処理方法は、例えば、コンピュータが、予測の対象となる特性である対象特性を決定する特性決定段階を有する。上記の情報処理方法は、例えば、対象特性が、対象材料が二次電池の正極活物質として用いられた場合の正極容量である場合、コンピュータが、(iii)対象材料の分子構造から導出される対象材料及び二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)対象材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得段階を有する。上記の情報処理方法は、例えば、コンピュータが、入力値取得段階において取得された値を予測モデルに入力して、対象材料の対象特性の予測値を出力する予測段階を有する。上記の情報処理方法において、予測モデルは、例えば、材料が二次電池の正極活物質として用いられた場合の正極容量を目的変数とし、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む回帰モデルである。
【0016】
本発明の第7の態様によれば、情報処理方法が提供される。上記の情報処理方法は、例えば、二次電池の電極材料の特徴に基づいて二次電池の特性を予測するための方法である。上記の情報処理方法は、例えば、コンピュータが、予測の対象となる電極材料である対象材料を決定する材料決定段階を有する。上記の情報処理方法は、例えば、コンピュータが、予測の対象となる特性である対象特性を決定する特性決定段階を有する。上記の情報処理方法は、例えば、対象特性が、対象材料が二次電池の正極活物質として用いられた場合のエネルギー密度である場合、コンピュータが、(i)対象材料の分子のLUMO準位のエネルギーの値、(ii)対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値、(iii)対象材料の分子構造から導出される対象材料及び二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)対象材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得段階を有する。上記の情報処理方法は、例えば、コンピュータが、入力値取得段階において取得された値を予測モデルに入力して、対象材料の対象特性の予測値を出力する予測段階を有する。上記の情報処理方法において、予測モデルは、例えば、材料が二次電池の正極活物質として用いられた場合のエネルギー密度を目的変数とし、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む回帰モデルである。
【0017】
本発明の第8の態様によれば、情報処理方法が提供される。上記の情報処理方法は、例えば、二次電池の電極材料の特徴に基づいて二次電池の特性を予測するための予測モデルを構築するための方法である。上記の情報処理方法において、予測モデルは、例えば、二次電池の特性を目的変数とし、電極材料に関する1以上の特徴のそれぞれを記述子とする回帰モデルである。上記の情報処理方法は、例えば、コンピュータが、それぞれが材料の特徴を表すN個の説明変数(Nは、2以上の正の整数である。)の中から、M個の説明変数(Mは、1以上N以下の正の整数である。)を、回帰モデルの記述子又は記述子の候補として選択する第1変数選択段階を有する。上記の情報処理方法において、第1変数選択段階は、例えば、コンピュータが、複数の材料のそれぞれについて、当該材料が電極材料として用いられた場合の二次電池に関する一の特性の値と、当該材料の特徴に関するN個の説明変数の値とが対応付けられた教師データ群を取得する段階を含む。第1変数選択段階は、例えば、コンピュータが、機械学習に基づく回帰分析を実行することで、N個の説明変数の中からM個の説明変数を選択する段階を含む。
【0018】
上記の情報処理方法において、N個の説明変数は、例えば、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含む。上記の情報処理方法において、N個の説明変数は、例えば、(e)材料及び二次電池の電解液のハンセン溶解性パラメータの分散項、(f)ハンセン溶解性パラメータの分極項、(g)ハンセン溶解性パラメータの水素結合項、(h)材料の分子の双極子モーメント、(i)材料の分子の部分電荷密度の最小値、及び、(j)材料の分子に含まれる炭素、水素及び酸素以外の元素の数であって、1分子当たりの元素数、からなる群から選択される少なくとも1つを含む。
【0019】
本発明の第9の態様においては、プログラムが提供される。上記のプログラムを格納するコンピュータ可読媒体が提供されてもよい。コンピュータ可読媒体は、非一時的コンピュータ可読媒体であってもよく、コンピュータ可読記録媒体であってもよい。上記のプログラムは、コンピュータを、上記の第1の態様から第4の態様に係る情報処理装置として機能させるためのプログラムであってよい。上記のプログラムは、コンピュータに、上記の第5の態様から第8の態様に係る情報処理方法を実行させるためのプログラムであってもよい。
【0020】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0021】
【
図1】材料探索システム100のシステム構成の一例を概略的に示す。
【
図2】格納部118の内部構造の一例を概略的に示す。
【
図3】データベース構築部120における情報処理の一例を概略的に示す。
【
図4】データセット生成部142における情報処理の一例を概略的に示す。
【
図5】再構築用データセット460の生成処理の一例を概略的に示す。
【
図6】予測モデル構築部140における情報処理の一例を概略的に示す。
【
図7】予測モデル構築部140における情報処理の他の例を概略的に示す。
【
図8】特性予測部160における情報処理の一例を概略的に
【
図9】材料探索システム100における情報処理方法の一例を概略的に示す。
【
図10】コンピュータ3000のシステム構成の一例を概略的に示す。
【
図11】実施例1の平均反応電位の予測値及び実測値の関係を示す。
【
図12】実施例1の単位質量当たりの正極容量の予測値及び実測値の関係を示す。
【
図13】実施例1の質量エネルギー密度の予測値及び実測値の関係を示す。
【
図14】実施例1~実施例6の平均反応電位のRMSEを示す。
【
図15】実施例1~実施例6単位質量当たりの正極容量のRMSEを示す。
【
図16】実施例1~実施例6質量エネルギー密度のRMSEを示す。
【発明を実施するための形態】
【0022】
近年、蓄電池の電池性能のさらなる向上が望まれている。例えば、蓄電池の電位、容量、及び、エネルギー密度の大きさは、電極材料(例えば、正極材料である。)に大きく依存する。例えば、質量エネルギー密度が400~500[Wh/kg‐蓄電池]を超える蓄電池を開発する場合、既存の正極材料の正極容量を大きく超える正極材料を開発することが望まれる。
【0023】
また、有機材料は軽量で比較的安価に入手できることから、正極材料として有機材料を用いることで、質量エネルギー密度が大きく、安価な蓄電池を作製することが期待されている。しかしながら、正極材料として利用可能な有機材料の種類は1060種類以上とも言われている。このような多種多様な有機材料の中から、電極材料として利用可能な新たな材料を探索することは容易ではない。
【0024】
この点に関し、近年、データ科学的手法を利用して、材料、プロセスなどを探索するマテリアルズインフォマティクス(MIと称される場合がある。)が注目を集めている。一般に、MIでは学習用に大規模なデータが必要とされている。しかしながら、上述された新規な電極材料の探索にMIを適用する場合、大規模なデータを準備することが難しい。
【0025】
本技術の一実施形態によれば、機械学習と、研究者の経験及び考察とを適度に融合したMIを利用することで、比較的小規模なデータを用いて、二次電池の電極材料の特徴に基づいて二次電池の特性を予測するための予測モデルが構築される。本実施形態によれば、例えば、上記の二次電池の特性として、正極の電位、二次電池の容量、又は、二次電池のエネルギー密度を予測するための予測モデルを構築するための機械学習に用いられる教師データが、新規な説明変数を含む。これにより、新規な予測モデルが構築され得る。また、本実施形態によれば、例えば、スパースモデリング法により、研究者の経験及び考察に基づいて列挙された複数の特徴を表す説明変数の中から、予測モデルの記述子として用いられる説明変数が選択される。これにより、比較的小規模なデータを用いて、予測精度の良好な予測モデルが構築され得る。
【0026】
本技術の他の実施形態によれば、予測モデルを用いて、二次電池の電極材料の候補材料が探索される。具体的には、二次電池の特性を目的変数とし、電極材料に関する1以上の特徴のそれぞれを記述子とする回帰モデルを用いて、二次電池の正極活物質の候補材料が探索される。例えば、上記の回帰モデルを用いて、二次電池の正極活物質の候補材料が探索される。
【0027】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0028】
[材料探索システム100の概要]
図1は、材料探索システム100のシステム構成の一例を概略的に示す。本実施形態においては、材料探索システム100が、二次電池の電極材料の特徴に基づいて二次電池の特性を予測する場合を例として、材料探索システム100の詳細が説明される。また、本実施形態においては、二次電池の電極材料が正極活物質として用いられる材料である場合を例として、材料探索システム100の詳細が説明される。
【0029】
本実施形態において、材料探索システム100は、二次電池の特性を表すデータと、二次電池の電極材料の特徴を表すデータとを教師データとして、機械学習により予測モデルを構築する。例えば、材料探索システム100は、上記の教師データを用いた機械学習に基づく回帰分析により、回帰モデルを構築する。材料探索システム100は、1以上の特性のそれぞれについて予測モデルを構築してよい。
【0030】
本実施形態において、材料探索システム100は、予測対象となる材料(対象材料と称される場合がある。)の1以上の特徴のそれぞれを表す入力データを取得する。また、材料探索システム100は、予測対象となる二次電池の特性(対象特性と称される場合がある。)を示す情報を取得する。材料探索システム100は、上記入力データを、対象特性を予測するための予測モデルに入力することで、当該対象材料が二次電池の電極材料として用いられた場合における対象特性の予測値を出力する。
【0031】
二次電池の種類は特に限定されるものではないが、二次電池の種類としては、リチウムイオン電池、ナトリウムイオン電池、カリウムイオン電池などが例示される。電極材料は、無機材料であってもよく、有機材料であってもよく、無機材料及び有機材料の組み合わせであってもよい。電極材料として有機材料が用いられた場合、高電位及び/又は高容量の電極が安価に作製され得る。有機材料としては、有機分子又はその塩が例示される。
【0032】
探索対象となる材料は特に限定されるものではないが、二次電池の正極活物質として探索対象となる有機材料は、π結合を有する共役系有機分子又はその塩であってよい。上記の有機材料は、2以上のπ結合を有する共役系有機分子又はその塩であってもよい。上記の有機材料としては、キノン及びその誘導体並びにこれらの塩(キノン系有機化合物と称される場合がある)、ジスルフィド及びその誘導体並びにこれらの塩(ジスルフィド系有機化合物と称される場合がある)、芳香族イミン及びその誘導体並びにこれらの塩(イミン系有機化合物と称される場合がある)などが例示される。
【0033】
予測の対象となる二次電池の特性としては、二次電池の正極の電位[V]、二次電池の正極の容量[Ah]、二次電池のエネルギー密度[Wh/kg又はWh/L]などが例示される。電位[V]は、充放電曲線等の電気化学測定から求められた対象化合物の酸化還元反応がおこる電位であってよい。電位は、標準電極電位であってよい。電位は、平均反応電位であってよい。二次電池がリチウムイオン電池である場合、電位[V]は、リチウムの酸化還元反応が起こるポテンシャルを基準とした電位[V vs Li/Li+]であってもよい。正極の容量(正極容量、容量などと称される場合がある。)は、単位質量当たりの正極容量[mAh/g又はAh/kg]であってよい。エネルギー密度は、質量エネルギー密度[Wh/kg又はWh/g]であってもよく、体積エネルギー密度[Wh/L]であってもよい。
【0034】
予測に用いられる電極材料の特徴は、文献値、カタログ値、実験値又は計算値として取得可能なものであればよく、その種類は特に限定されない。例えば、電極材料が有機材料である場合、電極の特徴として、有機材料を構成する分子(構成分子と称される場合がある。)に関する様々な特性が用いられ得る。上記の特性としては、物理的性質、化学的性質、量子的性質などが例示される。物理的性質としては、力学的性質、熱的性質、電気的性質、磁気的性質、光学的性質などが例示される。化学的性質としては、分子量、双極子モーメント、分子構造の性質、構成元素の性質、官能基の性質、溶解性、官能基の数、ヘテロ元素の数などが例示される。量子的性質としては、分子軌道の性質、部分電荷密度などが例示される。
【0035】
[第1の特徴群]
本実施形態において、電極材料が有機材料である場合の電極材料の特徴としては、(A)構成分子の融点、(B)構成分子の分子量、(C)構成分子の双極子モーメント、(D)構造分子に含まれる炭素のうち、π結合で共役している炭素の数、(E)構造分子に含まれる、炭素、水素及び酸素以外の元素の数、(F)構成分子に含まれるカルボキシル基の数、(G)構造分子の分子構造から導出される、構造分子と二次電池の金属イオンとの反応数、(H)構成分子の分子内における電荷の偏りを示す指標(例えば、密度汎関数法で計算される電子密度の偏りを示す部分電荷密度である。)の最大値及び最小値、(I)構成分子の軌道に関する少なくとも1つのエネルギー準位のエネルギー、(J)構成分子の軌道に関する2つのエネルギー準位の間のエネルギー差、(K)構成分子の軌道のうち第1条件に合致する軌道の数、(L)構成分子の軌道のうち第2条件に合致する軌道のエネルギー準位の総和の絶対値、(M)構造分子と二次電池の電解液とのハンセン溶解性パラメータの分散項、(N)構造分子と二次電池の電解液とのハンセン溶解性パラメータの分極項、(O)構造分子と二次電池の電解液とのハンセン溶解性パラメータの水素結合項、並びに、(P)構造分子とカーボネート系電解液とのHSP値の差からなる群(第1の特徴群と称される場合がある。)から選択される少なくとも1つの特徴が例示される。上記の特徴の値は、構成分子の1分子当たりの値であってよい。第1特徴群に含まれる特徴は、発明者らの経験及び考察に基づいて列挙された特徴の一例であってよい。
【0036】
本実施形態において、(C)構成分子の双極子モーメント、(H)構成分子の分子内における電荷の偏りを示す指標の最大値及び最小値、(I)構成分子の軌道に関する少なくとも1つのエネルギー準位のエネルギー、(J)構成分子の軌道に関する2つのエネルギー準位の間のエネルギー差、(K)構成分子の軌道のうち第1条件に合致する軌道の数、及び、(L)構成分子の軌道のうち第2条件に合致する軌道のエネルギー準位の総和の絶対値は、例えば、公知のDFT計算により導出される。DFT計算の一例として、交換相関汎関数としてB3LYPが用いられ、基底関数として6-311Gが用いられる。
【0037】
MIを用いて正極材料を探索する場合、候補となる化合物の構造情報に基づいて記述子を生成することが考えられる。化合物の構造情報は、例えば、SMILES記法に基づいて記述される。一方、本実施形態においては、化合物の構造情報に基づいてDFT計算を実行し、当該実行結果を記述子候補となる上記の特徴として用いる。これにより、研究者がSMILESからのみではわからないものの、明らかに性能を発揮しえない分子や爆発などの危険性を持ちうる分子を候補から排除することができる。
【0038】
本実施形態において、(M)構造分子と二次電池の電解液とのハンセン溶解性パラメータの分散項、(N)構造分子と二次電池の電解液とのハンセン溶解性パラメータの分極項、(O)構造分子と二次電池の電解液とのハンセン溶解性パラメータの水素結合項、及び、(P)構造分子とカーボネート系電解液とのHSP値の差は、例えば、公知のハンセン溶解性パラメータの計算手法を用いて導出される。二次電池の電解液としては、例えば、電解液自体のイオンの移動度及び/又は伝導度、正極及び/又は負極に用いる物質の種類、充放電にかかわる条件により決定される任意の電解液が用いられる。カーボネート系電解液としては、例えば、公知のカーボネート系電解液が用いられる。
【0039】
(I)構成分子の軌道に関する少なくとも1つのエネルギー準位のエネルギーとしては、最低空軌道(LUMO)のエネルギー準位(LUMO準位と称される場合がある。)のエネルギー、LUMO準位から1つ上の準位のエネルギー、LUMO準位から2つ上の準位のエネルギー、LUMO準位から3つ上の準位のエネルギー、LUMO準位から4つ上の準位のエネルギー、最高被占軌道のエネルギー準位(HOMO準位と称される場合がある。)のエネルギー、HOMO準位から1つ下の準位のエネルギー、HOMO準位から2つ下の準位のエネルギー、HOMO準位から3つ下の準位のエネルギー、HOMO準位から4つ下の準位のエネルギーなどが例示される。(J)構成分子の軌道に関する2つのエネルギー準位の間のエネルギー差としては、上述された複数の準位のうちから選択される任意の2つの準位の間のエネルギー差が例示される。
【0040】
(K)構成分子の軌道のうち第1条件に合致する軌道の数としては、二次電池のキャリアとなるイオンを還元して得られる金属(例えば、リチウムイオン電池の場合、リチウムである。)の仕事関数以下のエネルギー準位をもつ軌道の数、0以下のエネルギー準位をもつ軌道の数などが例示される。(L)構成分子の軌道のうち第2条件に合致する軌道のエネルギー準位の総和の絶対値としては、エネルギー準位が0以下である軌道のエネルギー準位の総和の絶対値が例示される。
【0041】
これにより、第1の特徴群を構成する1以上の特徴のそれぞれを表す1以上の記述子を含む予測モデルが構築される。その結果、後述される実施例において示されるとおり、対象物質の対象特性が精度よく予測される。
【0042】
[第2の特徴群]
上述されたとおり、第1特徴群を構成する複数の特徴は、発明者らの経験及び考察に基づいて選択された特徴である。そのため、第1の特徴群には、互いに相関する複数の特徴の組が含まれる可能性がある。そこで、発明者らは、第1の特徴群に含まれる複数の特徴の相関関係を考慮して、記述子の候補となる電極材料の特徴を決定することを検討した。
【0043】
本実施形態において、電極材料が有機材料である場合の電極材料の特徴としては、(B)構成分子の分子量、(C)構成分子の双極子モーメント、(D)構造分子に含まれる炭素のうち、π結合で共役している炭素の数、(E)構造分子に含まれる、炭素、水素及び酸素以外の元素の数、(G)構造分子の分子構造から導出される、構造分子と二次電池の金属イオンとの反応数、(H)構成分子の分子内における電荷の偏りを示す指標(例えば、部分電荷密度である。)の最大値及び最小値、(I)構成分子の軌道に関する少なくとも1つのエネルギー準位のエネルギー、(K)構成分子の軌道のうち第1条件に合致する軌道の数、(L)構成分子の軌道のうち第2条件に合致する軌道のエネルギー準位の総和の絶対値、(M)構造分子と二次電池の電解液とのハンセン溶解性パラメータの分散項、(N)構造分子と二次電池の電解液とのハンセン溶解性パラメータの分極項、(O)構造分子と二次電池の電解液とのハンセン溶解性パラメータの水素結合項からなる群(第2の特徴群と称される場合がある。)から選択される少なくとも1つの特徴が例示される。上記の特徴の値は、構成分子の1分子当たりの値であってよい。
【0044】
第2の特徴群において、(I)構成分子の軌道に関する少なくとも1つのエネルギー準位のエネルギーとしては、最低空軌道(LUMO)のエネルギー準位(LUMO準位と称される場合がある。)のエネルギー、LUMO準位から1つ上の準位のエネルギー、LUMO準位から2つ上の準位のエネルギー、LUMO準位から3つ上の準位のエネルギー、及び、LUMO準位から4つ上の準位のエネルギーが例示される。第2の特徴群における(K)構成分子の軌道のうち第1条件に合致する軌道の数、及び、(L)構成分子の軌道のうち第2条件に合致する軌道のエネルギー準位の総和の絶対値は、第1の特徴群と同様であってよい。
【0045】
これにより、第2の特徴群を構成する1以上の特徴のそれぞれを表す1以上の記述子を含む予測モデルが構築される。その結果、後述される実施例において示されるとおり、対象物質の対象特性が精度よく予測される。
【0046】
[第3の特徴群]
本実施形態において、二次電池の正極活物質として用いられる有機材料を探索するための予測モデルを構築する場合、上記の電極材料の特徴としては、(a)構成分子のLUMO準位のエネルギー、(b)構成分子のLUMO準位から1つ上の準位のエネルギー、(c)構成分子の分子構造から導出される構成分子及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、(d)構成分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数、(e)構成分子及び二次電池の電解液のハンセン溶解性パラメータの分散項、(f)構成分子及び二次電池の電解液のハンセン溶解性パラメータの分極項、(g)構成分子及び二次電池の電解液のハンセン溶解性パラメータの水素結合項、(h)構成分子の双極子モーメント、(i)構成分子の部分電荷密度の最小値、及び、(j)構成分子に含まれる炭素、水素及び酸素以外の元素の数であって、1分子当たりの元素数からなる群(第3の特徴群と称される場合がある。)から選択される少なくとも1つの特徴が例示される。上記の特徴の値は、構成分子の1分子当たりの値であってよい。
【0047】
上記の電極材料の特徴は、(a)構成分子のLUMO準位のエネルギー、(b)構成分子のLUMO準位から1つ上の準位のエネルギー、(c)構成分子の分子構造から導出される構成分子及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)構成分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含んでよい。上記の電極材料の特徴は、(a)~(d)のうちの少なくとも2つを含んでよい。
【0048】
例えば、正極の電位を予測するための予測モデルを構築する場合、上記の電極材料の特徴は、(a)構成分子のLUMO準位のエネルギー及び(b)構成分子のLUMO準位から1つ上の準位のエネルギーを含んでよい。例えば、正極の容量を予測するための予測モデルを構築する場合、上記の電極材料の特徴は、(c)構成分子の分子構造から導出される構成分子及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)構成分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含んでよい。例えば、二次電池のエネルギー密度を予測するための予測モデルを構築する場合、上記の電極材料の特徴は、(a)構成分子のLUMO準位のエネルギー、(b)構成分子のLUMO準位から1つ上の準位のエネルギー、(c)構成分子の分子構造から導出される構成分子及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)構成分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含んでよい。
【0049】
上記の電極材料の特徴は、上述されたこれらの説明変数の組み合わせに加えて、他の説明変数をさらに含んでよい。例えば、上記の電極材料の特徴は、(e)構成分子及び二次電池の電解液のハンセン溶解性パラメータの分散項、(f)構成分子及び二次電池の電解液のハンセン溶解性パラメータの分極項、(g)構成分子及び二次電池の電解液のハンセン溶解性パラメータの水素結合項、(h)構成分子の双極子モーメント、(i)構成分子の部分電荷密度の最小値、及び、(j)構成分子に含まれる炭素、水素及び酸素以外の元素の数であって、1分子当たりの元素数からなる群から選択される少なくとも1つをさらに含む。
【0050】
これにより、例えば、上記の特徴群を構成する1以上の特徴のそれぞれを表す1以上の記述子を含む予測モデルが構築される。その結果、後述される実施例において示されるとおり、対象物質の対象特性が精度よく予測される。
【0051】
[材料探索システム100の各部の概要]
本実施形態において、材料探索システム100は、例えば、制御部112と、入力部114と、出力部116と、格納部118とを備える。本実施形態において、材料探索システム100は、例えば、データベース構築部120と、予測モデル構築部140と、特性予測部160とを備える。
【0052】
本実施形態において、予測モデル構築部140は、例えば、データセット生成部142と、スパースモデリング部144と、記述子調整部146と、再構築部148とを有する。本実施形態において、特性予測部160は、例えば、対象材料決定部162と、対象特性決定部164と、予測値出力部166とを有する。材料探索システム100の各部は、例えば、互いに情報を送受可能に構成される。
【0053】
本実施形態において、制御部112は、材料探索システム100の動作を制御する。制御部112は、材料探索システム100における各種の情報処理を制御してもよい。上記の情報処理としては、入出力処理、データベースの構築処理、予測モデルの構築処理、予測処理などが例示される。
【0054】
本実施形態において、入力部114は、ユーザ又は他の情報処理装置からの入力又は要求を受け付ける。例えば、入力部114は、材料探索システム100に対するユーザの指示を受け付ける。入力部114は、データベースの構築処理において、ユーザからのデータ入力を受け付けてよい。
【0055】
入力部114としては、入力装置、通信装置などが例示される。入力装置としては、キーボード、ポインティングデバイス、タッチパネル、マイク、カメラなどが例示される。
【0056】
本実施形態において、出力部116は、ユーザ又は他の情報処理装置に情報を出力する。例えば、出力部116は、ユーザに材料探索システム100における情報処理の結果を示すための画面を出力する。出力部116は、ユーザが材料探索システム100に対する指示などを入力するための画面を出力してもよい。
【0057】
出力部116としては、出力装置、通信装置などが例示される。出力装置としては、表示装置、音声出力装置、振動出力装置などが例示される。表示装置としては、ディスプレイ、プロジェクタなどが例示される。
【0058】
本実施形態において、格納部118は、各種の情報を格納する。一実施形態において、格納部118は、材料探索システム100の情報処理において使用される各種の情報を格納する。他の実施形態において、格納部118は、材料探索システム100の情報処理において生成される各種の情報を格納する。格納部118の詳細は後述される。
【0059】
[データベースの構築]
本実施形態において、データベース構築部120は、各種のデータベースを構築する。一実施形態において、データベース構築部120は、複数の材料のそれぞれについて、当該材料が二次電池の電極材料として用いられた場合における当該二次電池に関する少なくとも1つの特性の値と、上述された各種の特徴の値とを対応付けて格納するデータベース(第1DBと称される場合がある。)を構築する。他の実施形態において、探索対象となる複数の材料のそれぞれについて、上述された各種の特徴の値を格納するデータベース(第2DBと称される場合がある。)を構築する。データベース構築部120の詳細は後述される。
【0060】
[予測モデルの構築]
本実施形態において、予測モデル構築部140は、二次電池の電極材料の特徴に基づいて二次電池の特性を予測するための予測モデルを構築する。予測モデル構築部140は、例えば、機械学習により予測モデルを構築する。
【0061】
より具体的には、予測モデル構築部140は、二次電池の特性を表すデータと、二次電池の電極材料の特徴を表すデータとを教師データとして、機械学習により予測モデルを構築する。例えば、材料探索システム100は、上記の教師データを用いた機械学習に基づく回帰分析により、予測モデルを構築する。上記の予測モデルは、線形回帰式又は非線形回帰式により表される回帰モデルであってよい。上記の予測モデルは、二次電池の特性を目的変数とし、電極材料に関する1以上の特徴のそれぞれを記述子とする回帰モデルであってよい。上記の予測モデルは、二次電池の特性を目的変数とし、電極材料に関する複数の特徴のそれぞれを記述子とする線形の重回帰モデルであってよい。
【0062】
[正極電位の予測モデル]
一実施形態において、予測モデルは、材料が二次電池の正極活物質として用いられた場合の正極の電位(例えば、反応電位である。)を目的変数とし、(a)材料の分子のLUMO準位のエネルギー及び(b)材料の分子のLUMO準位から1つ上の準位のエネルギーを記述子として含む回帰モデルであってよい。本実施形態によれば、特性予測部160が上記の予測モデルを用いることで、対象材料が二次電池の正極活物質として用いられた場合の正極の電位が精度よく予測され得る。
【0063】
[正極容量の予測モデル]
他の実施形態において、予測モデルは、材料が二次電池の正極活物質として用いられた場合の正極の容量(例えば、単位質量当たりの容量である。)を目的変数とし、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む回帰モデルであってよい。本実施形態によれば、特性予測部160が上記の予測モデルを用いることで、対象材料が二次電池の正極活物質として用いられた場合の二次電池の正極の容量が精度よく予測され得る。
【0064】
[エネルギー密度の予測モデル]
さらに他の実施形態において、予測モデルは、材料が二次電池の正極活物質として用いられた場合の二次電池のエネルギー密度(例えば、質量エネルギー密度である。)を目的変数とし、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む回帰モデルであってよい。本実施形態によれば、特性予測部160が上記の予測モデルを用いることで、対象材料が二次電池の正極活物質として用いられた場合の二次電池のエネルギー密度が精度よく予測され得る。
【0065】
本実施形態において、データセット生成部142は、例えば、スパースモデリング部144における機械学習に用いられる各種のデータセットを生成する。データセット生成部142は、例えば、複数の材料のそれぞれについて、当該材料が電極材料として用いられた場合の二次電池に関する一の特性の値と、当該材料の複数の特徴のそれぞれを表す複数の説明変数(材料に関する説明変数と称される場合がある。)の値とが対応付けられたデータセットを、スパースモデリング部144における機械学習の教師データ群として生成する。データセット生成部142は、再構築部148における予測モデルの構築に用いられる各種のデータセットを生成する。データセット生成部142は、例えば、上述された第1DBを参照して、機械学習に用いられる各種のデータセットを生成する。
【0066】
データセット生成部142は、例えば、再構築部148における予測モデルの構築に用いられる各種のデータセットを生成する。データセット生成部142は、例えば、再構築部148における機械学習に用いられる各種のデータセットを生成する。データセット生成部142は、スパースモデリング部144における機械学習用のデータセットと同様の手順により、例えば、再構築部148における機械学習用のデータセットを生成してよい。データセット生成部142の詳細は後述される。
【0067】
本実施形態において、スパースモデリング部144は、予測モデルの候補を生成する。スパースモデリング部144は、二次電池の1以上の特性のそれぞれに関する予測モデルの候補を生成してよい。
【0068】
上述されたとおり、予測モデルの候補は、線形回帰式又は非線形回帰式により表される回帰モデルであってよい。 予測モデルの候補は、二次電池の特性を目的変数とし、電極材料に関する1以上の特徴のそれぞれを記述子とする回帰モデルであってよい。予測モデルの候補は、二次電池の特性を目的変数とし、電極材料に関する複数の特徴のそれぞれを記述子とする線形の重回帰モデルであってよい。
【0069】
例えば、スパースモデリング部144は、データセット生成部142が生成したデータセットを教師データとして、機械学習により予測モデルの候補を生成する。スパースモデリング部144は、例えば、正極の電位を予測するための予測モデルの候補を生成する。スパースモデリング部144は、例えば、二次電池の正極容量を予測するための予測モデルの候補を生成する。スパースモデリング部144は、例えば、二次電池のエネルギー密度を予測するための予測モデルの候補を生成する。
【0070】
このとき、スパースモデリング部144は、材料の特徴を表す複数の説明変数の中から、予測モデルの記述子又は記述子の候補として用いられる説明変数を選択してよい。上述されたとおり、本実施形態においては、回帰モデルが予測モデルとして用いられる。例えば、スパースモデリング部144は、それぞれが材料の特徴を表すN個の説明変数(Nは、2以上の正の整数である。)の中から、M個の説明変数(Mは、1以上N以下の正の整数である。Mは、1以上N未満の正の整数であってもよい)を、回帰モデルの記述子又は記述子の候補として選択する。
【0071】
より具体的には、例えば、スパースモデリング部144には、複数の材料のそれぞれについて、当該材料が電極材料として用いられた場合の二次電池に関する一の特性の値と、当該材料の特徴に関するN個の説明変数の値とが対応付けられたデータセットが、教師データ群として入力される。二次電池に関する一の特性としては、正極の電位、二次電池の正極容量、又は、二次電池のエネルギー密度が例示される。上記のN個の説明変数のそれぞれは、上述された第1の特徴群、第2の特徴群又は第3の特徴群に含まれる複数の特徴のうちのN個の特徴のそれぞれを表す説明変数であってよい。N個の説明変数のそれぞれは、第2の特徴群に含まれるN個の特徴を表す説明変数であってもよい。N個の説明変数のそれぞれは、第3の特徴群に含まれるN個の特徴を表す説明変数であってもよい。
【0072】
スパースモデリング部144は、機械学習に基づく回帰分析を実行することで、N個の説明変数の中からM個の説明変数を選択する。スパースモデリング部144は、さらに、M個の説明変数のそれぞれに対応する回帰係数又は偏回帰係数を決定してよい。スパースモデリング部144は、回帰モデルの回帰定数を決定してもよい。これにより、予測モデルの候補が生成される。
【0073】
スパースモデリング部144は、例えば、スパースモデリング法により、N個の説明変数の中からM個の説明変数を選択する。M個の説明変数のそれぞれは、第2の特徴群に含まれるM個の特徴を表す説明変数であってもよい。M個の説明変数のそれぞれは、第3の特徴群に含まれるM個の特徴を表す説明変数であってもよい。M個の説明変数は、第3の特徴群に関連して説明された説明変数の組み合わせのうち少なくとも2つを含んでもよい。スパースモデリング部144は、スパースモデリング法により、M個の説明変数のそれぞれに対応する回帰係数又は偏回帰係数をさらに決定してよい。スパースモデリング部144は、スパースモデリング法により、回帰定数をさらに決定してもよい。
【0074】
スパースモデリング法としては、変数を選択するための公知の回帰分析手法が採用され得る。スパースモデリング法による回帰分析手法としては、(i)全状態探索法(Exhaustive search for linear regression。ES-LiR、総当たり法などと称される場合がある。)のように説明変数の全ての組み合わせを探索するアプローチ、ラッソ回帰(least absolute shrinkage and selection operator、 LASSOなどと称される場合がある)などの緩和法的な近似的アプローチ、サンプリング手法によるサンプリングアプローチなどが例示される。
【0075】
スパースモデリング部144は、M個の説明変数として、例えば、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数から選択される少なくとも2つを選択する。これにより、正極活物質を探索する場合において、予測精度に優れた予測モデルが構築され得る。
【0076】
一実施形態において、回帰モデルの目的変数が正極の電位である場合、スパースモデリング部144は、(a)材料の分子のLUMO準位のエネルギー及び(b)材料の分子のLUMO準位から1つ上の準位のエネルギーを含む、M個の説明変数を選択してよい。これにより、正極活物質を探索する場合において、予測精度に優れた新規な予測モデルが構築され得る。特に、材料の分子のLUMO準位から1つ上の準位のエネルギーに基づいて正極の電位を予測する新たな予測モデルが構築される。
【0077】
他の実施形態において、回帰モデルの目的変数が二次電池の正極容量である場合、スパースモデリング部144は、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含む、M個の説明変数を選択してよい。これにより、正極活物質を探索する場合において、予測精度に優れた新規な予測モデルが構築され得る。
【0078】
さらに他の実施形態において、回帰モデルの目的変数が二次電池のエネルギー密度である場合、スパースモデリング部144は、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含む、M個の説明変数を選択してよい。これにより、正極活物質を探索する場合において、予測精度に優れた新規な予測モデルが構築され得る。
【0079】
本実施形態において、記述子調整部146は、スパースモデリング部144が選択したM個の説明変数の中から、K個の説明変数(Kは、1以上M以下の正の整数である。Kは、1以上M未満の正の整数であってよい。)を、回帰モデルの記述子として選択する。記述子調整部146は、例えば、ユーザの指示に基づいて、M個の説明変数の中から、K個の説明変数を選択する。記述子調整部146は、選択されたK個の説明変数を示す情報を再構築部148に出力する。
【0080】
記述子調整部146は、K個の説明変数として、例えば、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数から選択される少なくとも2つを選択する。 これにより、正極活物質を探索する場合において、予測精度に優れた新規な予測モデルが構築され得る。
【0081】
一実施形態において、回帰モデルの目的変数が正極の電位である場合、記述子調整部146は、(a)材料の分子のLUMO準位のエネルギー及び(b)材料の分子のLUMO準位から1つ上の準位のエネルギーを含む、K個の説明変数を選択してよい。これにより、正極活物質を探索する場合において、予測精度に優れた新規な予測モデルが構築され得る。
【0082】
他の実施形態において、回帰モデルの目的変数が二次電池の正極容量である場合、記述子調整部146は、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含む、K個の説明変数を選択してよい。これにより、正極活物質を探索する場合において、予測精度に優れた新規な予測モデルが構築され得る。
【0083】
さらに他の実施形態において、回帰モデルの目的変数が二次電池のエネルギー密度である場合、記述子調整部146は、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含む、K個の説明変数を選択してよい。これにより、正極活物質を探索する場合において、予測精度に優れた新規な予測モデルが構築され得る。
【0084】
本実施形態において、再構築部148は、記述子調整部146が出力したK個の説明変数に基づいて予測モデルを構築する。再構築部148は、二次電池の1以上の特性のそれぞれに関する予測モデルを構築してよい。再構築部148は、例えば、データセット生成部142が生成したデータセットを教師データとして、機械学習により予測モデルを構築する。再構築部148は、二次電池の一の特性を目的変数とし、当該一の特性に関して記述子調整部146が出力したK個の説明変数を記述子として含む回帰モデルを構築してよい。
【0085】
[電池特性の予測]
本実施形態において、特性予測部160は、二次電池の電極材料の特徴に基づいて二次電池の特性を予測する。特性予測部160は、例えば、予測モデル構築部140が構築した予測モデルを用いて、対象材料を二次電池の電極材料として用いた場合における、二次電池の対象特性を予測する。これにより、ユーザは、新規な電極材料を探索することができる。
【0086】
本実施形態において、対象材料決定部162は、予測の対象となる電極材料である対象材料を決定する。対象材料決定部162は、例えば、入力部114が受け付けたユーザからの指示に基づいて、対象材料を決定する。対象材料決定部162は、対象材料を示す情報を予測値出力部166に出力してよい。
【0087】
本実施形態において、対象特性決定部164は、予測の対象となる特性である対象特性を決定する。対象特性決定部164は、例えば、入力部114が受け付けたユーザからの指示に基づいて、対象特性を決定する。対象特性決定部164は、対象特性を示す情報を予測値出力部166に出力してよい。
【0088】
本実施形態において、予測値出力部166は、対象材料の対象特性の予測値を出力する。例えば、予測値出力部166は、対象材料の1以上の特徴のそれぞれを表す入力データを取得する。予測値出力部166は、上記の入力データを、対象特性を予測するための予測モデルに入力することで、当該対象材料が二次電池の電極材料として用いられた場合における対象特性の予測値を出力する。予測値出力部166の詳細は後述される。
【0089】
[材料探索システム100の各部の具体的な構成]
材料探索システム100の各部は、ハードウエアにより実現されてもよく、ソフトウエアにより実現されてもよく、ハードウエアとソフトウエアとの組み合わせにより実現されてもよい。材料探索システム100の各部は、その少なくとも一部が、単一のサーバによって実現されてもよく、複数のサーバによって実現されてもよい。材料探索システム100の各部は、その少なくとも一部が、仮想マシン上又はクラウドシステム上で実現されてもよい。材料探索システム100の各部は、その少なくとも一部が、パーソナルコンピュータ又は携帯端末によって実現されてもよい。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどを例示することができる。材料探索システム100の各部は、ブロックチェーンなどの分散型台帳技術又は分散型ネットワークを利用して、情報を格納してもよい。
【0090】
材料探索システム100を構成する構成要素の少なくとも一部がソフトウエアにより実現される場合、当該ソフトウエアにより実現される構成要素は、一般的な構成の情報処理装置において、当該構成要素に関する動作を規定したソフトウエア又はプログラムを起動することにより実現されてよい。上記の一般的な構成の情報処理装置は、(i)CPU、GPUなどのプロセッサ、ROM、RAM、通信インタフェースなどを有するデータ処理装置と、(ii)キーボード、ポインティングデバイス、タッチパネル、カメラ、音声入力装置、ジェスチャ入力装置、各種センサ、GPS受信機などの入力装置と、(iii)表示装置、音声出力装置、振動装置などの出力装置と、(iv)メモリ、HDD、SSDなどの記憶装置(外部記憶装置を含む。)とを備えてよい。
【0091】
上記の一般的な構成の情報処理装置において、上記のデータ処理装置又は記憶装置は、上記のソフトウエア又はプログラムを記憶してよい。上記のソフトウエア又はプログラムは、プロセッサによって実行されることにより、上記の情報処理装置に、当該ソフトウエア又はプログラムによって規定された動作を実行させる。上記のソフトウエア又はプログラムは、非一時的なコンピュータ可読記録媒体に格納されていてもよい。上記のソフトウエア又はプログラムは、コンピュータを、材料探索システム100又はその一部として機能させるためのプログラムであってよい。上記のソフトウエア又はプログラムは、コンピュータに、材料探索システム100又はその一部における情報処理方法を実行させるためのプログラムであってよい。
【0092】
一実施形態において、上記の情報処理方法は、二次電池の電極材料の特徴に基づいて二次電池の特性を予測する情報処理方法であってよい。上記の情報処理方法は、例えば、予測の対象となる電極材料である対象材料を決定する材料決定段階を有する。上記の情報処理方法は、例えば、予測の対象となる特性である対象特性を決定する特性決定段階を有する。上記の情報処理方法は、例えば、対象特性が、対象材料が二次電池の正極活物質として用いられた場合の正極の電位である場合、(i)対象材料の分子のLUMO準位のエネルギーの値、及び、(ii)対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値を取得する入力値取得段階を有する。上記の情報処理方法は、例えば、入力値取得段階において取得された値を予測モデルに入力して、対象材料の対象特性の予測値を出力する予測段階を有する。上記の情報処理方法において、予測モデルは、例えば、材料が二次電池の正極活物質として用いられた場合の正極の電位を目的変数とし、(a)材料の分子のLUMO準位のエネルギー及び(b)材料の分子のLUMO準位から1つ上の準位のエネルギーを記述子として含む回帰モデルである。
【0093】
他の実施形態において、上記の情報処理方法は、二次電池の電極材料の特徴に基づいて二次電池の特性を予測する情報処理方法であってよい。上記の情報処理方法は、例えば、予測の対象となる電極材料である対象材料を決定する材料決定段階を有する。上記の情報処理方法は、例えば、予測の対象となる特性である対象特性を決定する特性決定段階を有する。上記の情報処理方法は、例えば、対象特性が、対象材料が二次電池の正極活物質として用いられた場合の正極容量である場合、(iii)対象材料の分子構造から導出される対象材料及び二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)対象材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得段階を有する。上記の情報処理方法は、例えば、入力値取得段階において取得された値を予測モデルに入力して、対象材料の対象特性の予測値を出力する予測段階を有する。上記の情報処理方法において、予測モデルは、例えば、材料が二次電池の正極活物質として用いられた場合の正極容量を目的変数とし、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む回帰モデルである。
【0094】
さらに他の実施形態において、上記の情報処理方法は、二次電池の電極材料の特徴に基づいて二次電池の特性を予測する情報処理方法であってよい。上記の情報処理方法は、例えば、予測の対象となる電極材料である対象材料を決定する材料決定段階を有する。上記の情報処理方法は、例えば、予測の対象となる特性である対象特性を決定する特性決定段階を有する。上記の情報処理方法は、例えば、対象特性が、対象材料が二次電池の正極活物質として用いられた場合のエネルギー密度である場合、(i)対象材料の分子のLUMO準位のエネルギーの値、(ii)対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値、(iii)対象材料の分子構造から導出される対象材料及び二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)対象材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する入力値取得段階を有する。上記の情報処理方法は、例えば、入力値取得段階において取得された値を予測モデルに入力して、対象材料の対象特性の予測値を出力する予測段階を有する。上記の情報処理方法において、予測モデルは、例えば、材料が二次電池の正極活物質として用いられた場合のエネルギー密度を目的変数とし、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を記述子として含む回帰モデルである。
【0095】
さらに他の実施形態において、上記の情報処理方法は、二次電池の電極材料の特徴に基づいて二次電池の特性を予測するための予測モデルを構築する情報処理方法であってよい。上記の情報処理方法において、予測モデルは、例えば、二次電池の特性を目的変数とし、電極材料に関する1以上の特徴のそれぞれを記述子とする回帰モデルである。
【0096】
上記の情報処理方法は、例えば、それぞれが材料の特徴を表すN個の説明変数(Nは、2以上の正の整数である。)の中から、M個の説明変数(Mは、1以上N以下の正の整数である。)を、回帰モデルの記述子又は記述子の候補として選択する第1変数選択段階を有する。上記の情報処理方法において、第1変数選択段階は、例えば、複数の材料のそれぞれについて、当該材料が電極材料として用いられた場合の二次電池に関する一の特性の値と、当該材料の特徴に関するN個の説明変数の値とが対応付けられた教師データ群を取得する段階を含む。第1変数選択段階は、例えば、機械学習に基づく回帰分析を実行することで、N個の説明変数の中からM個の説明変数を選択する段階を含む。上記の情報処理方法において、N個の説明変数は、例えば、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数を含む。N個の説明変数は、例えば、(e)材料及び二次電池の電解液のハンセン溶解性パラメータの分散項、(f)ハンセン溶解性パラメータの分極項、(g)ハンセン溶解性パラメータの水素結合項、(h)材料の分子の双極子モーメント、(i)材料の分子の部分電荷密度の最小値、及び、(j)材料の分子に含まれる炭素、水素及び酸素以外の元素の数であって、1分子当たりの元素数からなる群から選択される少なくとも1つをさらに含む。
【0097】
材料探索システム100は、情報処理装置の一例であってよい。予測モデル構築部140は、モデル構築部又は情報処理装置の一例であってよい。スパースモデリング部144は、第1変数選択部、モデル構築部又は情報処理装置の一例であってよい。記述子調整部146は、第2変数選択部の一例であってよい。特性予測部160は、情報処理装置の一例であってよい。対象材料決定部162は、材料決定部の一例であってよい。対象特性決定部164は、特性決定部の一例であってよい。予測値出力部166は、情報処理装置の一例であってよい。構成分子は、材料の分子の一例であってよい。機械学習に用いられる各種のデータセットは、教師データ群の一例であってよい。
【0098】
[別実施形態の一例]
本実施形態においては、スパースモデリング部144が、スパースモデリング法により、N個の説明変数の中からM個の説明変数を選択することで、予測モデルの候補を生成する場合を例として、材料探索システム100の一例が説明された。しかしながら、材料探索システム100は本実施形態に限定されない。
【0099】
他の実施形態において、スパースモデリング部144は、任意の線形又は非線形の回帰分析手法を用いて予測モデルの候補を生成してよい。線形の回帰手法としては、上述された全状態探索法(ES-LiR法と称される場合がある)、ラッソ回帰(LASSOと称される場合がある)、重回帰(MLRと称される場合がある)、MCP回帰などが例示される。非線形の回帰手法としては、ランダムフォレスト回帰(RFと称される場合がある)、ニューラルネット回帰(NNと称される場合がある)、サポートベクター回帰(SVRと称される場合がある)、ロジスティック回帰などが例示される。
【0100】
本実施形態においては、スパースモデリング部144が予測モデルの候補を生成した後、記述子調整部146及び再構築部148における情報処理を経て予測モデルが構築される場合を例として、材料探索システム100の一例が説明された。しかしながら、材料探索システム100は本実施形態に限定されない。
【0101】
他の実施形態において、記述子調整部146及び再構築部148における情報処理の少なくとも一部が省略されてよい。この場合、例えば、スパースモデリング部144の生成した予測モデルの候補が、予測モデルとして出力される。
【0102】
図2は、格納部118の内部構造の一例を概略的に示す。本実施形態において、格納部118は、材料データベース220と、モデルデータベース240とを備える。本実施形態において、材料データベース220は、1以上の材料のそれぞれについて、材料ID222と、物質ID224と、二次電池の特性を表す情報226と、材料の特徴を表す情報228とを対応付けて格納する。本実施形態において、モデルデータベース240は、1以上の予測モデルのそれぞれについて、モデルID242と、目的変数ID244と、予測モデルを表す情報246とを対応づけて格納する。
【0103】
本実施形態において、材料ID222には、1以上の材料のそれぞれを識別するための識別情報が入力される。上記の識別情報は、各材料に割り当てられた記号であってもよく、各材料の名称であってもよい。
【0104】
1以上の材料のそれぞれは、既知の電極材料であってもよく、探索対象となる材料であってもよい。材料ID222により識別される材料が既知の電極材料である場合、当該材料のレコードは、例えば、予測モデル構築部140における機械学習処理の教師データとして利用される。材料ID222により識別される材料が探索対象となる材料である場合、当該材料のレコードは、例えば、特性予測部160における予測処理の入力データとして利用される。
【0105】
本実施形態において、物質ID224には、各材料に含まれる物質、又は、各材料を構成する物質を識別するための識別情報が入力される。上記の識別情報は、各物質に割り当てられた記号であってもよく、各物質の名称であってもよい。識別情報は、各物質の構造情報を含んでもよい。
【0106】
本実施形態において、二次電池の特性を表す情報226には、各材料が二次電池の電極材料として用いられた場合における当該二次電池の特性の値が入力される。例えば、二次電池の特性を表す情報226には、各材料が二次電池の正極活物質として用いられた場合における当該二次電池の特性の値が入力される。上述されたとおり、二次電池の特性としては、正極の電位、二次電池の正極容量、二次電池のエネルギー密度などが例示される。
【0107】
材料ID222により識別される材料が既知の電極材料である場合、二次電池の特性を表す情報226には、当該特性の実験値、文献値などが入力される。一方、材料ID222により識別される材料が探索対象となる材料である場合、二次電池の特性を表す情報226に当該情報が不明であることを示す記号が入力されてもよく、二次電池の特性を表す情報226は空欄であってもよい。
【0108】
本実施形態において、材料の特徴を表す情報228には、各材料の1以上の特徴のそれぞれの値が入力される。
図1の電極材料の特徴に関連して説明されたとおり、材料の特徴を表す情報228には、各材料の特徴を表す文献値、カタログ値、実験値、計算値などが入力される。計算値としては、DFT計算の計算値、ハンセン溶解性パラメータの各項の計算値、ハンセン溶解性パラメータの計算値などが例示される。
【0109】
本実施形態において、モデルID242には、1以上の予測モデルのそれぞれを識別するための識別情報が入力される。上記の識別情報は、各予測モデルに割り当てられた記号であってもよく、各予測モデルの名称であってもよい。
【0110】
本実施形態において、目的変数ID244には、各予測モデルの目的変数の識別情報が入力される。上記の識別情報は、各目的変数に割り当てられた記号であってもよく、各目的変数にの名称であってもよい。
【0111】
本実施形態において、予測モデルを表す情報246には、予測モデルを特定するための各種の情報が入力される。例えば、予測モデルを表す情報246には、各予測モデルに含まれる1以上の記述子のそれぞれを識別するための識別情報(記述子IDと称される場合がある。)と、各記述子に対応する回帰係数の値を示す情報とが対応づけて入力される。予測モデルを表す情報246には、各予測モデルの回帰定数の値を示す情報が入力されてもよい。
【0112】
図3は、データベース構築部120における情報処理の一例を概略的に示す。本実施形態において、データベース構築部120は、材料データ登録部322と、材料データ計算部324とを備える。
【0113】
本実施形態において、材料データ登録部322は、制御部112の指示に従って、材料データの登録処理を開始する。制御部112は、例えば、入力部114からの指示又は要求に基づいて、材料データの登録処理を開始することを決定する。材料データの登録処理が開始されると、材料データ登録部322は、例えば、出力部116に表示される材料データベース220を構築するためのデータ入力画面を介して、ユーザからの各種のデータ入力を受け付ける。材料データ登録部322は、ユーザからの入力値を取得し、当該入力値を材料データベース220に登録する。
【0114】
また、材料データ登録部322は、材料データ計算部324に対して、材料の特徴を表す情報228に入力される特徴のうち、予め定められた種類の特徴を導出するための計算処理の実行を要求する。材料データ登録部322は、材料データ計算部324が出力した計算値を取得し、当該計算値を材料データベース220に登録する。
【0115】
本実施形態において、材料データ計算部324は、各種の計算処理を実行する。例えば、材料データ計算部324は、材料データ登録部322から計算処理の対象となる材料の物質IDを取得する。材料データ計算部324は、物質IDにより識別される物質に関するDFT計算を実行する。材料データ計算部324は、DFT計算の計算結果を材料データ登録部322に出力する。材料データ計算部324は、ハンセン溶解パラメータの各項の値を計算してもよく、ハンセン溶解パラメータの値を計算してもよい。
【0116】
図4は、データセット生成部142における情報処理の一例を概略的に示す。本実施形態においては、データセット生成部142が、訓練用データセット420と、検証用データセット440と、再構築用データセット460とを生成する場合を例として、データセット生成部142の詳細が説明される。
【0117】
本実施形態において、データセット生成部142は、例えば、スパースモデリング部144が予測モデルの構築処理を開始したことに応じて、訓練用データセット420と、検証用データセット440とを生成する。データセット生成部142は、スパースモデリング部144が生成する予測モデルの目的変数に応じて、適切なデータセットを生成し、生成されたデータセットをスパースモデリング部144に出力する。
【0118】
訓練用データセット420は、例えば、正極の電位を予測するための予測モデルの学習に用いられるデータセット422、二次電池の正極容量を予測するための予測モデルの学習に用いられるデータセット424、及び/又は、二次電池のエネルギー密度を予測するための予測モデルの学習に用いられるデータセット426を含む。検証用データセット440は、例えば、正極の電位を予測するための予測モデルの検証に用いられるデータセット442、二次電池の正極容量を予測するための予測モデルの検証に用いられるデータセット444、及び/又は、二次電池のエネルギー密度を予測するための予測モデルの検証に用いられるデータセット446を含む。
【0119】
例えば、データセット生成部142は、まず、材料データベース220の二次電池の特性を表す情報226を参照して、複数の材料のそれぞれについて、スパースモデリング部144が生成する予測モデルの目的変数に対応する値を抽出する。また、データセット生成部142は、例えば、抽出された予測モデルの目的変数に対応する値と、材料データベース220の材料の特徴を表す情報228に含まれる各材料に関する複数の説明変数の値とを対応付けて、教師データ群となるデータセットを生成する。次に、データセット生成部142は、教師データ群となるデータセットを分割して、訓練用データセット420と、検証用データセット440とを生成する。
【0120】
また、本実施形態において、データセット生成部142は、例えば、再構築部148が予測モデルの構築処理を開始したことに応じて、再構築用データセット460を生成する。再構築用データセット460は、例えば、正極の電位を予測するための予測モデルの学習に用いられるデータセット462、二次電池の正極容量を予測するための予測モデルの学習に用いられるデータセット464、及び/又は、二次電池のエネルギー密度を予測するための予測モデルの学習に用いられるデータセット466を含む。再構築用データセット460は、データセット462、データセット464、及び、データセット466のそれぞれに対応する予測モデルの検証用のデータセット(図示されていない。)を含んでもよい。
【0121】
一実施形態において、データセット生成部142は、訓練用データセット420及び/又は検証用データセット440と同様の手順により、再構築用データセット460を生成する。再構築用データセット460として、訓練用データセット420及び/又は検証用データセット440が再利用されてもよい。
【0122】
他の実施形態において、データセット生成部142は、訓練用データセット420及び/又は検証用データセット440の中から、予測モデルの目的変数に対応する値が予め定められた条件に合致するデータを抽出することで、再構築用データセット460を生成する。上記の条件としては、予測モデルの目的変数に対応する値が予め定められた数値範囲の範囲内であるという条件が例示される。上記の数値範囲は、上限のみが定められていてもよく、下限のみが定められていてもよく、上限及び下限が定められていてもよい。
【0123】
これにより、例えば、外れ値が除外されたり、望ましい結果が得られるデータが抽出されたりする。その結果、予測精度に優れた予測モデルが構築され得る。
【0124】
訓練用データセット420は、教師データ群の一例であってよい。データセット422は、教師データ群の一例であってよい。データセット424は、教師データ群の一例であってよい。データセット426は、教師データ群の一例であってよい。
【0125】
図5は、再構築用データセット460の生成処理の一例を概略的に示す。本実施形態においては、データセット生成部142が、P個(Pは1以上の正の整数である。)のデータを含むデータセット422に基づいて、Q個(Qは1以上P以下の正の整数である。)のデータを含むデータセット462を生成する場合を例として、再構築用データセット460の生成処理の詳細が説明される。
【0126】
本実施形態において、データセット生成部142は、データセット422の中から、予測モデルの目的変数に対応する値が予め定められた条件に合致するデータを抽出することで、データセット462を生成する。上記の条件は、例えば、入力部114が受け付けたユーザからの指示に基づいて設定される。上述されたとおり、上記の条件としては、予測モデルの目的変数に対応する値が予め定められた数値範囲の範囲内であるという条件が例示される。
【0127】
例えば、データセット生成部142は、データセット422の中から、正極の電位の値が予め定められた値よりも大きなデータを抽出することで、データセット462を生成する。データセット生成部142は、データセット422の中から、記述子調整部146が選択した記述子以外の記述子に関するデータを削除することで、データセット462を生成してもよい。
【0128】
図6は、予測モデル構築部140における情報処理の一例を概略的に示す。本実施形態によれば、まず、制御部112が、例えばユーザからの要求に応じて、スパースモデリング部144に予測モデルの構築処理を開始させる。このとき、制御部112は、予測モデルの構築処理に関する各種の設定の内容を示す情報(設定情報と称される場合がある。)をスパースモデリング部144に出力してよい。上記の設定としては、回帰手法の種類、予測モデルの種類、交差検証に関する各種の設定、記述子の選定などが例示される。
【0129】
また、制御部112は、データセット生成部142に対して、訓練用データセット420及び検証用データセット440の生成処理を開始させる。このとき、制御部112は、予測モデルの目的変数の種類を示す情報をデータセット生成部142に出力してよい。
【0130】
データセット生成部142は、制御部112からの指示に応じて、訓練用データセット420及び検証用データセット440を生成する。上述されたとおり、訓練用データセット420及び検証用データセット440のそれぞれは、複数の材料のそれぞれに対応する複数のレコードを含み、複数のレコードのそれぞれは、単一の目的変数の値と、N個の説明変数の値とを対応付けて格納する。
【0131】
データセット生成部142は、訓練用データセット420を構築部642に出力する。データセット生成部142は、検証用データセット440を検証部644に出力する。
【0132】
次に、スパースモデリング部144が、入力された訓練用データセット420を教師データ群とする機械学習により、ユーザにより指示された二次電池の特性を目的変数とする予測モデルの候補を生成する。このとき、スパースモデリング部144は、スパースモデリング法により、訓練用データセット420に含まれるN個の説明変数の中から、M個の説明変数を選択してよい。
【0133】
一実施形態において、スパースモデリング部144は、モデルに含まれる記述子の組み合わせを変えて、構築部642によるモデルの構築と、検証部644によるモデルの検証とを繰り返すことで、記述子の組み合わせを最適化する。訓練用データセット420に含まれるN個の説明変数の全ての組み合わせについて、構築部642によるモデルの構築と、検証部644によるモデルの検証とが終了すると、出力部646が、最適化された記述子の組み合わせを出力する。出力部646は、選択されたM個の説明変数を示す情報と、当該M個の説明変数に対応する回帰係数の値を示す情報とを出力してよい。出力部646は、回帰定数の値を示す情報を出力してもよい。これにより、予測モデルの候補が生成される。このとき、選択されなかった説明変数に対応する回帰係数の値は0であってよい。これにより、訓練用データセット420に含まれるN個の説明変数の中から、M個の説明変数が選択される。
【0134】
他の実施形態において、スパースモデリング部144は、L1正則化を利用して記述子数を絞るLASSO回帰や複数の決定木を組み合わせてアンサンブル学習を行うランダムフォレスト、マージン最大化の考え方を利用しε-不感損失関数を最小化するサポートベクター回帰等の機械学習手法を活用し、モデルに含まれる記述子の組み合わせを変えてモデルを構築・検証を繰り返すことで記述子の組み合わせを最適化する。出力部では最適化された記述子の組み合わせを出力する。線形回帰手法を利用した場合には、出力部は選択されたM個の説明変数を示す情報と、当該M個の説明変数に対応する回帰係数の値を示す情報とを出力してよい。非線形回帰手法を利用した場合には、出力部は選択されたM個の説明変数を示す情報と、同M個の説明変数によるモデルのハイパーパラメータを出力する。これにより、訓練用データセット420に含まれるN個の説明変数の中から、M個の説明変数が選択される。
【0135】
次に、記述子調整部146が、スパースモデリング部144が選択したM個の説明変数の中から、K個の説明変数を、予測モデルの記述子として選択する。例えば、記述子調整部146は、出力部116に、スパースモデリング部144の出力結果を示すための画面を表示させる。また、記述子調整部146は、出力部116に、ユーザによる説明変数の選択指示を受け付けるための入力画面を表示させる。記述子調整部146は、ユーザが入力部114に入力した選択指示を受け付け、当該選択指示に基づいて、K個の説明変数を予測モデルの記述子として選択する。記述子調整部146は、選択結果を示す情報を再構築部148に出力する。
【0136】
次に、再構築部148が、記述子調整部146が出力したK個の説明変数に基づいて予測モデルを構築する。また、データセット生成部142が、制御部112からの指示に応じて、再構築用データセット460を生成する。再構築部148は、例えば、入力された再構築用データセット460を教師データ群とする機械学習により、ユーザにより指示された二次電池の特性を目的変数とし、記述子調整部146が出力したK個の説明変数により説明される材料の特徴を表すK個の記述子を含む予測モデルを構築する。再構築部148は、構築された予測モデルに関する各種の情報をモデルデータベース240に格納する。
【0137】
図7は、予測モデル構築部140における情報処理の他の例を概略的に示す。本実施形態において、予測モデル構築部140は、記述子調整部146に代えて記述子調整部746を備え、再構築部148を備えない点で、
図6に関連して説明された実施形態と相違する。また、本実施形態においては、データセット生成部142が訓練用データセット420及び検証用データセット440を生成する前に、記述子調整部746が訓練用データセット420及び検証用データセット440を構成する説明変数を調整する点で、
図6に関連して説明された実施形態と相違する。上記の相違点以外の特徴に関し、
図7に関連して説明される実施形態は、
図6に関連して説明された実施形態と同様の構成を有してよい。
【0138】
上述されたとおり、本実施形態においては、データセット生成部142が訓練用データセット420及び検証用データセット440を生成する前に、記述子調整部746が訓練用データセット420及び検証用データセット440を構成する説明変数を調整する。より具体的には、例えば、データセット生成部142が制御部112からの指示を受信すると、データセット生成部142は、まず、材料データベース220を参照して、訓練用データセット420などと同様の手順により、調整用データセット720を生成する。
【0139】
本実施形態において、調整用データセット720は、複数の材料のそれぞれに対応する複数のレコードを含み、複数のレコードのそれぞれは、制御部112により示された目的変数の値と、L個の説明変数(Lは、N以上の正の整数である。Lは、Nを超える正の整数であってよい。)の値とを対応付けて格納する。L個の説明変数のそれぞれは、材料に関する複数の特徴のそれぞれを表す。L個の説明変数のそれぞれは、上述された第1の特徴群、第2の特徴群又は第3の特徴群に含まれる複数の特徴のうちのL個の特徴のそれぞれを表す説明変数であってよい。L個の説明変数のそれぞれは、第1の特徴群に含まれるN個の特徴を表す説明変数であってもよい。データセット生成部142は、生成された調整用データセット720を記述子調整部746に出力する。
【0140】
次に、記述子調整部746が、調整用データセット720に含まれるL個の説明変数の中から、N個の説明変数を、予測モデルの記述子の候補として選択する。例えば、記述子調整部746は、L個の説明変数のそれぞれについて、他の説明変数との相関関係の程度を決定する。記述子調整部746は、相関関係の程度が予め定められた基準よりも強い複数の説明変数のうち、一の説明変数を残し、他の説明変数を除外することで、L個の説明変数の中からN個の説明変数を選択する。
【0141】
これにより、説明変数の個数が調整される。記述子調整部746は、調整結果を示す情報をデータセット生成部142に出力する。調整結果を示す情報は、例えば、記述子調整部746により選択されたN個の説明変数のそれぞれの識別情報を含む。
【0142】
次に、データセット生成部142が、材料データベース220を参照して、記述子調整部746により選択されたN個の説明変数の値を取得し、訓練用データセット420及び検証用データセット440を生成する。上述されたとおり、訓練用データセット420及び検証用データセット440のそれぞれは、複数の材料のそれぞれに対応する複数のレコードを含み、複数のレコードのそれぞれは、単一の目的変数の値と、N個の説明変数の値とを対応付けて格納する。データセット生成部142は、生成された訓練用データセット420及び検証用データセット440をスパースモデリング部144に出力する。
【0143】
次に、スパースモデリング部144が、
図6に関連して説明された手順と同様の手順により、予測モデルの候補を生成する。本実施形態においては、記述子調整部146及び再構築部148における情報処理が省略される。そのため、上記の予測モデルの候補が、予測モデルとして出力される。スパースモデリング部144は、構築された予測モデルに関する各種の情報をモデルデータベース240に格納する。
【0144】
記述子調整部746は、第3変数選択部の一例であってよい。調整用データセット720を構成する複数の説明変数は、L個の説明変数の一例であってよい。
【0145】
[別実施形態の一例]
本実施形態においては、予測モデル構築部140が記述子調整部146及び再構築部148を備えない場合を例として、材料探索システム100の一例が説明された。しかしながら、材料探索システム100は本実施形態に限定されない。他の実施形態において、予測モデル構築部140は、記述子調整部746に加えて、記述子調整部146及び再構築部148を備えてよい。
【0146】
図8は、特性予測部160における情報処理の一例を概略的に示す。本実施形態によれば、まず、対象材料決定部162が、対象材料を決定する。対象材料決定部162は、例えば、入力部114が受け付けたユーザからの指示に基づいて、対象材料を決定する。また、対象特性決定部164が、対象特性を決定する。対象特性決定部164は、例えば、入力部114が受け付けたユーザからの指示に基づいて、対象特性を決定する。
【0147】
次に、予測値出力部166が、対象特性を予測するための予測モデルを特定する。予測値出力部166は、例えば、モデルデータベース240を参照して、対象特性決定部164が決定した対象特性を目的変数とする予測モデルを特定する。また、予測値出力部166は、モデルデータベース240を参照して、特定された予測モデルに含まれる記述子を特定する。
【0148】
次に、予測値出力部166は、例えば、材料データベース220にアクセスして、特定された予測モデルに含まれる記述子に対応する説明変数の値を示す情報を取得する。予測値出力部166は、取得された値を予測モデルに入力して、対象材料の対象特性の予測値を出力する。出力部116は、予測値出力部166が出力した予測値をユーザに提示する。
【0149】
一実施形態において、対象特性が、対象材料が二次電池の正極活物質として用いられた場合の正極の電位である場合、予測値出力部166は、(i)対象材料の分子のLUMO準位のエネルギーの値、及び、(ii)対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値を取得する。予測値出力部166は、取得された値を上述された正極電位の予測モデルに入力して、対象材料が二次電池の正極活物質として用いられた場合の正極の電位の予測値を出力する。
【0150】
他の実施形態において、対象特性が、対象材料が二次電池の正極活物質として用いられた場合の正極容量である場合、予測値出力部166は、(iii)対象材料の分子構造から導出される対象材料及び二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)対象材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する。予測値出力部166は、取得された値を上述された正極容量の予測モデルに入力して、対象材料が二次電池の正極活物質として用いられた場合の二次電池の正極容量の予測値を出力する。
【0151】
さらに他の実施形態において、対象特性が、対象材料が二次電池の正極活物質として用いられた場合のエネルギー密度である場合、予測値出力部166は、(i)対象材料の分子のLUMO準位のエネルギーの値、(ii)対象材料の分子のLUMO準位から1つ上の準位のエネルギーの値、(iii)対象材料の分子構造から導出される対象材料及び二次電池の金属イオンの反応数の1分子当たりの値、及び、(iv)対象材料の分子の軌道のうち二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数の1分子当たりの値を取得する。予測値出力部166は、取得された値を上述されたエネルギー密度の予測モデルに入力して、対象材料が二次電池の正極活物質として用いられた場合の二次電池のエネルギー密度の予測値を出力する。
【0152】
図9は、材料探索システム100における情報処理方法の一例を概略的に示す。本実施形態によれば、まず、ステップ912(ステップがSと省略される場合がある。)において、データベース構築部120が、材料データベース220を構築する。
【0153】
次に、S922、S924及びS926において、特定の特性を目的変数とする予測モデルが構築される。まず、S922において、予測モデルに含まれる記述子の候補となる説明変数が決定される。例えば、記述子調整部746が、L個の説明変数の中からN個の説明変数を選択する。また、スパースモデリング部144が、N個の説明変数の中からM個の説明変数を選択する。S924において、記述子の候補となる説明変数の中から、予測モデルに用いられる記述子が決定される。例えば、記述子調整部146が、スパースモデリング部144により選択されたN個の説明変数の中からM個の説明変数を選択する。その後、S926において、選択された記述子を用いて予測モデルを構築する。例えば、再構築部148が、記述子調整部146により選択されたK個の説明変数を記述子として含む予測モデルを構築する。
【0154】
次に、S932において、特性予測部160が、予測モデル構築部140により構築された予測モデルを用いて、対象特性の予測値を算出する。これにより、処理が終了する。
【0155】
図10は、本発明の複数の態様が全体的又は部分的に具現化されてよいコンピュータ3000の一例を示す。材料探索システム100の少なくとも一部は、コンピュータ3000により実現されてよい。例えば、データベース構築部120の少なくとも一部が、コンピュータ3000により実現される。例えば、予測モデル構築部140の少なくとも一部が、コンピュータ3000により実現される。例えば、特性予測部160の少なくとも一部が、コンピュータ3000により実現される。
【0156】
コンピュータ3000にインストールされたプログラムは、コンピュータ3000に、本発明の実施形態に係る装置に関連付けられるオペレーション又は当該装置の1又は複数の「部」として機能させ、又は当該オペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ3000に、本発明の実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ3000に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU3012によって実行されてよい。
【0157】
本実施形態によるコンピュータ3000は、CPU3012、RAM3014、グラフィックコントローラ3016、及びディスプレイデバイス3018を含み、それらはホストコントローラ3010によって相互に接続されている。コンピュータ3000はまた、通信インターフェース3022、ハードディスクドライブ3024、DVD-ROMドライブ3026、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ3020を介してホストコントローラ3010に接続されている。コンピュータはまた、ROM3030及びキーボード3042のようなレガシの入出力ユニットを含み、それらは入出力チップ3040を介して入出力コントローラ3020に接続されている。
【0158】
CPU3012は、ROM3030及びRAM3014内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ3016は、RAM3014内に提供されるフレームバッファ等又はそれ自体の中に、CPU3012によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス3018上に表示されるようにする。
【0159】
通信インターフェース3022は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ3024は、コンピュータ3000内のCPU3012によって使用されるプログラム及びデータを格納する。DVD-ROMドライブ3026は、プログラム又はデータをDVD-ROM3001から読み取り、ハードディスクドライブ3024にRAM3014を介してプログラム又はデータを提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
【0160】
ROM3030はその中に、アクティブ化時にコンピュータ3000によって実行されるブートプログラム等、及び/又はコンピュータ3000のハードウェアに依存するプログラムを格納する。入出力チップ3040はまた、様々な入出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ3020に接続してよい。
【0161】
プログラムが、DVD-ROM3001又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもあるハードディスクドライブ3024、RAM3014、又はROM3030にインストールされ、CPU3012によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ3000に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ3000の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。
【0162】
例えば、通信がコンピュータ3000及び外部デバイス間で実行される場合、CPU3012は、RAM3014にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェース3022に対し、通信処理を命令してよい。通信インターフェース3022は、CPU3012の制御の下、RAM3014、ハードディスクドライブ3024、DVD-ROM3001、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
【0163】
また、CPU3012は、ハードディスクドライブ3024、DVD-ROMドライブ3026(DVD-ROM3001)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM3014に読み取られるようにし、RAM3014上のデータに対し様々なタイプの処理を実行してよい。CPU3012は次に、処理されたデータを外部記録媒体にライトバックしてよい。
【0164】
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU3012は、RAM3014から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM3014に対しライトバックする。また、CPU3012は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU3012は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0165】
上で説明したプログラム又はソフトウェアモジュールは、コンピュータ3000上又はコンピュータ3000近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それにより、上記のプログラムを、ネットワークを介してコンピュータ3000に提供する。
【0166】
上記実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び/又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び/又はアナログハードウェア回路を含んでよく、集積回路(IC)及び/又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ(FPGA)、及びプログラマブルロジックアレイ(PLA)等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。
【0167】
コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROM又はフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(登録商標)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0168】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、及び「C」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。
【0169】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【実施例0170】
以下、実施例を示し、本技術を具体的に説明する。なお、本技術は下記の実施例に制限されるものではない。
【0171】
[実施例1]
(教師データの作成)
まず、下記の手順に従って、材料データベースを構築した。17報(参考文献1~17と称される。)の有機正極活物質の先行研究に基づいて、26種のキノン系有機化合物、2種のジスルフィド系有機化合物、及び、5種のイミン系有機化合物を含む38種類の低分子化合物について、平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]に関する文献値を収集した。また、上記の38種類の低分子化合物のそれぞれについて、DFT計算、ハンセン溶解度パラメータ計算などにより、上述の第1特徴群に関連して説明された46種類の説明変数の値を用意した。38種類の低分子化合物(化合物1~38と称される。)の構造式は下記のとおりであった。
【0172】
【0173】
【0174】
また、参考文献1~参考文献17は下記のとおりであった。
[参考文献1]M. M. Doeff, S. J. Visco, L. C. De Jonghe, J. Appl. Elctrochem, 1992, 22, 307.
[参考文献2]S. R. Deng, L. B. Kong, G. Q. Hu, T. Wu, D. Li, Y. H. Zhou, Z. Y. Li, Electrochemica Acta, 2006, 51, 2589.
[参考文献3]M. Lee, J. Hong, D. H. Seo, D. H. Nam, K. T. Nam, K. Kang, C. B. Park, Angew. Chem. Int. Ed, 2013, 52, 8322.
[参考文献4]S. Nishide, Y. Yamamoto, T. Takui, Y. Morita, ChemSusChem, 2013, 6, 794.
[参考文献5]T. Yokoji, Y. Kameyama, S. Sakaida, N. Maruyama, M. Satoh, H. Matsubara, Chem. Lett, 2015, 44, 1726.
[参考文献6]M. Yao, H. Senoh, S. Yamazaki, Z. Siroma, T. Sakai, K. Yasuda, Journal of Power Sources, 2010, 195, 8336.
[参考文献7]T. Yokoji, Y. Kameyama, N. Maruyama, H. Matsubara, J. Mater. Chem. A, 2016, 4, 5457.
[参考文献8]Y. Liang, P. Zhang, J. Chen, Chem. Sci, 2013, 4, 1330.
[参考文献9]Y. Liang, P. Zhang, S. Yang, Z. Tao, J. Chen, Adv. Energy Mater, 2013, 3, 600.
[参考文献10]Z. Luo, L. Liu, Q. Zhao, F. Li, J. Chen, Angew. Chem. Int. Ed, 2017, 56, 12561.
[参考文献11]A. Shimizu, H. Kuramoto, Y. Tsujii, T. Nokami, Y. Inatomi, N. Hojo, H. Suzuki, J. Yoshida, Journal of Power Sources, 2014, 260, 211.
[参考文献12]W. Wan, H. Lee, X. Yu, C. Wang, K. W. Nam, X. Q. Yang, H. Zhou, RSC Adv, 2014, 4, 19878.
[参考文献13]T. Yokoji, H. Matsubara, M. Satoh, J. Mater. Chem. A, 2014, 2, 19347.
[参考文献14]S. Gottis, A. L. Barres, F. Dolhem, P. Poizot, ACS Appl. Mater. Interfaces, 2014, 6, 10870.
[参考文献15]R. Zeng, L. Xing, Y. Qiu, Y. Wang, W. Huang, W. Li, S. Yang, Electrochemica Acta, 2014, 146, 447.
[参考文献16]M. Yao, S. Yamazaki, H. Senoh, T. Sakai, T. Kiyobayashi, Mater. Sci. Engineering B, 2012, 177, 483.
[参考文献17]B. Tian, Z. Ding, G. H. Ning, W. Tang, C. Peng, B. Liu, J. Su, C. Su, K. P. Loh, Chem. Commun, 2017, 53, 2914.
【0175】
次に、46種類の説明変数の相関関係に基づいて、28種類の説明変数の値を削除した。これにより、上記の38種類の低分子化合物のそれぞれについて、(i)平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]に関する文献値と、(ii)上記の第2特徴群に関連して説明された18種類の説明変数の値とが対応づけられたデータセットが構築された。
【0176】
(予測モデルの構築)
次に、上記のデータセットを教師データとして用いて、全状態探索法に基づくスパースモデリングを実行することにより説明変数を削減した。スパースモデリングにおいては、38種類の低分子化合物のデータのうち、30種類前後の低分子化合物のデータを訓練用データとして利用し、10種類前後の低分子化合物のデータを検証用データとして利用した。
【0177】
次に、化学的考察と、データ取得の容易性とを考慮して、スパースモデリングにより抽出された説明変数をさらに削減した。これにより、平均反応電位[V]の予測モデルの記述子として、(a)材料の分子のLUMO準位のエネルギーと、(b)材料の分子のLUMO準位から1つ上の準位のエネルギーとを抽出した。また、単位質量当たりの正極容量[mAh/g]の予測モデルの記述子として、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数と、(d)材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数とを抽出した。さらに、質量エネルギー密度[Wh/g]の予測モデルの記述子として、(a)材料の分子のLUMO準位のエネルギーと、(b)材料の分子のLUMO準位から1つ上の準位のエネルギーと、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数と、(d)材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数とを抽出した。
【0178】
次に、平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]のそれぞれの予測モデルについて、上述されたデータセットを用いて、抽出された記述子からなる線形回帰モデルの機械学習を実行した。このとき、38種類の低分子化合物のデータを訓練用データとして利用した。
【0179】
[実施例2]
予測モデルの構築時に、全状態探索法に基づくスパースモデリングを実行することにより説明変数を削減する代わりに、ラッソ回帰(LASSO)に基づくスパースモデリングを実行することにより説明変数を削減した点を除いて、実施例1と同様の手順により、平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]のそれぞれの予測モデルを構築した。
【0180】
[実施例3]
予測モデルの構築時に、全状態探索法に基づくスパースモデリングを実行することにより説明変数を削減する代わりに、重回帰(MLR)に基づくスパースモデリングを実行することにより説明変数を削減した点を除いて、実施例1と同様の手順により、平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]のそれぞれの予測モデルを構築した。
【0181】
[実施例4]
予測モデルの構築時に、全状態探索法に基づくスパースモデリングを実行することにより説明変数を削減する代わりに、ランダムフォレスト回帰(RF)に基づくスパースモデリングを実行することにより説明変数を削減した点を除いて、実施例1と同様の手順により、平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]のそれぞれの予測モデルを構築した。
【0182】
[実施例5]
予測モデルの構築時に、全状態探索法に基づくスパースモデリングを実行することにより説明変数を削減する代わりに、ニューラルネット回帰(NN)に基づくスパースモデリングを実行することにより説明変数を削減した点を除いて、実施例1と同様の手順により、平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]のそれぞれの予測モデルを構築した。
【0183】
[実施例6]
予測モデルの構築時に、全状態探索法に基づくスパースモデリングを実行することにより説明変数を削減する代わりに、サポートベクター回帰(SVR)に基づくスパースモデリングを実行することにより説明変数を削減した点を除いて、実施例1と同様の手順により、平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]のそれぞれの予測モデルを構築した。
【0184】
[予測モデルの評価]
(評価用データセットの作成)
下記の手順に従って、予測モデルの評価用のデータセットを作成した。まず、教師データの作成に用いた17報の先行研究とは異なる21報の先行研究に基づいて、15種のキノン系有機化合物及び6種のイミン系有機化合物を含む22種類の低分子化合物について、平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]に関する文献値を収集した。22種類の低分子化合物は、上述された38種類の低分子化合物とは異なる化合物である。
【0185】
また、上記の22種類の低分子化合物のそれぞれについて、DFT計算、ハンセン溶解度パラメータ計算などにより、(a)材料の分子のLUMO準位のエネルギー、(b)材料の分子のLUMO準位から1つ上の準位のエネルギー、(c)材料の分子構造から導出される材料及び二次電池の金属イオンの反応数であって、1分子当たりの反応数、及び、(d)材料の分子の軌道のうち前記二次電池の金属イオンの仕事関数以下のエネルギー準位を有する軌道の数であって、1分子当たりの軌道数の4個の説明変数のそれぞれの値を用意した。これにより、上記の22種類の低分子化合物のそれぞれについて、(i)平均反応電位[V]、単位質量当たりの正極容量[mAh/g]、及び、質量エネルギー密度[Wh/g]に関する文献値と、(ii)上記の4種類の説明変数の値とが対応づけられた評価用データセットが構築された。
【0186】
(実施例1の予測モデルの評価)
評価用データセットに含まれる22種類の低分子化合物のそれぞれについて、実施例1において構築された各予測モデルに、評価用データセットに含まれる説明変数の値を入力して、平均反応電位、単位質量当たりの正極容量、及び、質量エネルギー密度のそれぞれの予測値を算出した。また、参考として、教師データに含まれる38種類の低分子化合物のそれぞれについて、実施例1において構築された各予測モデルに、教師データに含まれる説明変数の値を入力して、平均反応電位、単位質量当たりの正極容量、及び、質量エネルギー密度のそれぞれの予測値を算出した。
【0187】
図11に、平均反応電位の予測値及び実測値の関係を示す。
図12に、単位質量当たりの正極容量の予測値及び実測値の関係を示す。
図13に、質量エネルギー密度の予測値及び実測値の関係を示す。
図11~
図13において、縦軸は予測値を示し、横軸は実測値(文献値)を示す。
図11~
図13において、丸形のマーカは、教師データを用いた場合における予測値及び実測値の関係を示し、三角形のマーカは、評価用データを用いた場合における予測値及び実測値の関係を示す。
【0188】
平均反応電位、単位質量当たりの正極容量、及び、質量エネルギー密度のそれぞれの予測値と、評価用データセットに含まれるそれぞれの実測値とを比較したところ、平均反応電位の二乗平均平方誤差(RMSE)は、0.240[V]であった。単位質量当たりの正極容量の二乗平均平方誤差(RMSE)は、52.2[mAh/g]であった。質量エネルギー密度の二乗平均平方誤差(RMSE)は、0.160[Wh/g]であった。
【0189】
なお、評価用データセット(テストデータと)に対するRMSEはそれぞれ、0.293[V]100[mAh/g]、0.263[Wh/g]であった。これにより、実施例1の予測モデルは十分な予測精度を有することが示された。
【0190】
また、
図11~
図13に示されるとおり、教師データが存在しない領域に存在する評価用データについても精度よく予測できていることがわかる。これにより、実施例1の予測モデルは外挿性を有することが示された。
【0191】
(実施例2~実施例6の予測モデルの評価)
実施例2~実施例6の予測モデルについても、実施例1の予測モデルと同様の手順により、評価用データセットに含まれる22種類の低分子化合物のそれぞれについて、平均反応電位、単位質量当たりの正極容量、及び、質量エネルギー密度のそれぞれの予測値を算出した。また、参考として、教師データに含まれる38種類の低分子化合物のそれぞれについて、平均反応電位、単位質量当たりの正極容量、及び、質量エネルギー密度のそれぞれの予測値を算出した。
【0192】
実施例2~実施例6の各予測モデルの結果に関して、実施例1の予測モデルと同様の手順により、評価用データセットを用いた場合における、平均反応電位、単位質量当たりの正極容量及び質量エネルギー密度の二乗平均平方誤差(RMSE)を算出した。また、教師データを用いた場合における、平均反応電位、単位質量当たりの正極容量及び質量エネルギー密度の二乗平均平方誤差(RMSE)を算出した。
【0193】
図14に、実施例1~実施例6における平均反応電位のRMSEを示す。
図15に、実施例1~実施例6における単位質量当たりの正極容量のRMSEを示す。
図16に、実施例1~実施例6における質量エネルギー密度のRMSEを示す。
図14~
図16において、縦軸は各特性のRMSEの大きさを示す。
図14~
図16において、各実施例の左側の棒グラフは教師データが用いられた場合におけるRMSEを示し、各実施例の右側の棒グラフは評価用データセットが用いられた場合におけるRMSEを示す。
【0194】
図14~
図16に示されるとおり、実施例2~実施例6の予測モデルも十分な予測精度を有することがわかる。また、本明細書の記載に接した当業者であれば、実施例1~3の実施例を考慮して、MCP回帰などの他の線形の回帰手法によっても比較的精度のよい予測モデルが得られることを理解することができる。同様に、本明細書の記載に接した当業者であれば、実施例4~6の実施例を考慮して、ロジスティック回帰など他の非線形の回帰手法によっても比較的精度のよい予測モデルが得られることを理解することができる。
【0195】
また、特に、実施例1の手法によれば、他の実施例の手法と比較して、平均反応電位、単位質量当たりの正極容量及び質量エネルギー密度の全てにおいて、RMSEが小さく、教師データに対するRMSE及び評価用データセットに対するRMSEの差が小さいことがわかる。このように、実施例1の手法によれば、平均反応電位、単位質量当たりの容量及び質量エネルギー密度の全てにおいて、汎化性能に優れた予測モデルが構築され得る。
【0196】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。また、技術的に矛盾しない範囲において、特定の実施形態について説明した事項を、他の実施形態に適用することができる。また、各構成要素は、名称が同一で、参照符号が異なる他の構成要素と同様の特徴を有してもよい。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0197】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
100 材料探索システム、112 制御部、114 入力部、116 出力部、118 格納部、120 データベース構築部、140 予測モデル構築部、142 データセット生成部、144 スパースモデリング部、146 記述子調整部、148 再構築部、160 特性予測部、162 対象材料決定部、164 対象特性決定部、166 予測値出力部、220 材料データベース、222 材料ID、224 物質ID、226 情報、228 情報、240 モデルデータベース、242 モデルID、244 目的変数ID、246 情報、288 情報、322 材料データ登録部、324 材料データ計算部、420 訓練用データセット、422 データセット、424 データセット、426 データセット、440 検証用データセット、442 データセット、444 データセット、446 データセット、460 再構築用データセット、462 データセット、464 データセット、466 データセット、642 構築部、644 検証部、646 出力部、720 調整用データセット、746 記述子調整部、3000 コンピュータ、3001 DVD-ROM、3010 ホストコントローラ、3012 CPU、3014 RAM、3016 グラフィックコントローラ、3018 ディスプレイデバイス、3020 入出力コントローラ、3022 通信インターフェース、3024 ハードディスクドライブ、3026 DVD-ROMドライブ、3030 ROM、3040 入出力チップ、3042 キーボード