(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-18
(45)【発行日】2023-12-26
(54)【発明の名称】結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム
(51)【国際特許分類】
G16C 60/00 20190101AFI20231219BHJP
G06F 30/10 20200101ALI20231219BHJP
【FI】
G16C60/00
G06F30/10
(21)【出願番号】P 2019147747
(22)【出願日】2019-08-09
【審査請求日】2022-04-07
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100107515
【氏名又は名称】廣田 浩一
(72)【発明者】
【氏名】大淵 真理
【審査官】渡邉 加寿磨
(56)【参考文献】
【文献】特開2019-87107(JP,A)
【文献】特開2010-168354(JP,A)
【文献】特開2007-106708(JP,A)
【文献】米国特許出願公開第2015/0127307(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00-99/00
G06Q 10/00-99/00
G16Z 99/00
G06F 30/10
(57)【特許請求の範囲】
【請求項1】
原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有するグラフであって、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有し、かつ前記単位格子内の2つの前記原子の化学結合のデータである格子内エッジを有し、更に、前記単位格子内の前記原子と化学結合を有する原子であって前記単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有し、かつ前記格子内ノードに当たる原子と前記拡張ノードに当たる原子との間の化学結合のデータである拡張エッジとを有するグラフを用いて、結晶材料の解析を行う解析部を有
し、
前記グラフにおいて、1つの結晶材料における全ノードの数が、前記1つの結晶材料における前記格子内ノードの数の27倍以下であり、
前記グラフを用いた前記結晶材料の解析が、
複数の結晶材料の前記グラフから算出した類似度のスコアに基づく前記複数の結晶材料の結晶構造の類似性の分析である、及び/又は
複数の結晶材料の前記グラフと前記複数の結晶材料の特性データとを用いて学習した学習モデルによる結晶材料の特性の予測であることを特徴とする結晶材料解析装置。
【請求項2】
前記グラフを有するグラフデータベースを有する請求項1に記載の結晶材料解析装置。
【請求項3】
前記格子内エッジ、及び前記拡張エッジが、前記格子内ノード間、並びに前記格子内ノード及び前記拡張ノード間のボロノイ分割により作成される請求項1又は2に記載の結晶材料解析装置。
【請求項4】
前記結晶材料が、無機化合物である請求項1から
3のいずれかに記載の結晶材料解析装置。
【請求項5】
コンピュータが、
原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有するグラフであって、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有し、かつ前記単位格子内の2つの前記原子の化学結合のデータである格子内エッジを有し、更に、前記単位格子内の前記原子と化学結合を有する原子であって前記単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有し、かつ前記格子内ノードに当たる原子と前記拡張ノードに当たる原子との間の化学結合のデータである拡張エッジとを有するグラフを用いて、結晶材料の解析を行
い、
前記グラフにおいて、1つの結晶材料における全ノードの数が、前記1つの結晶材料における前記格子内ノードの数の27倍以下であり、
前記グラフを用いた前記結晶材料の解析が、
複数の結晶材料の前記グラフから算出した類似度のスコアに基づく前記複数の結晶材料の結晶構造の類似性の分析である、及び/又は
複数の結晶材料の前記グラフと前記複数の結晶材料の特性データとを用いて学習した学習モデルによる結晶材料の特性の予測であることを特徴とする結晶材料解析方法。
【請求項6】
コンピュータに、
原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有するグラフであって、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有し、かつ前記単位格子内の2つの前記原子の化学結合のデータである格子内エッジを有し、更に、前記単位格子内の前記原子と化学結合を有する原子であって前記単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有し、かつ前記格子内ノードに当たる原子と前記拡張ノードに当たる原子との間の化学結合のデータである拡張エッジとを有するグラフを用いて、結晶材料の解析を行わせ
、
前記グラフにおいて、1つの結晶材料における全ノードの数が、前記1つの結晶材料における前記格子内ノードの数の27倍以下であり、
前記グラフを用いた前記結晶材料の解析が、
複数の結晶材料の前記グラフから算出した類似度のスコアに基づく前記複数の結晶材料の結晶構造の類似性の分析である、及び/又は
複数の結晶材料の前記グラフと前記複数の結晶材料の特性データとを用いて学習した学習モデルによる結晶材料の特性の予測であることを特徴とする結晶材料解析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、結晶材料の解析に有用な結晶材料解析装置、結晶材料解析方法、及び結晶構造解析プログラムに関する。
【背景技術】
【0002】
新しい化学物質の設計、既存の化学物質の特性の予測、及び既存の化学物質の新しい用途の探索などに、コンピュータを用いた評価、予測、及び推論などが用いられている。
【0003】
例えば、有機化学の分野では、分子の構造、すなわち原子と、原子同士の結合関係とは、
図21(酢酸)及び
図22(酢酸メチル)のようにノード(球)とエッジ(棒)とを用いたグラフにより表される。そして、グラフを利用したグラフ類似性評価により、又はグラフを入力データとした機械学習により、材料探索、又は設計が行われている。
【0004】
しかし、結晶材料に関しては、単位格子が周期的にほぼ無限に繰り返されている。そのため、通常、結晶構造をグラフにより表そうとしても、グラフの大きさを決めることができない。そのため、結晶材料をグラフにより表し、類似性評価などの解析を行うことは容易ではない。
【先行技術文献】
【特許文献】
【0005】
【文献】特開平8-44701号公報
【文献】国際公開第2011/021279号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0006】
本件は、結晶材料の解析に有用な結晶材料解析装置、結晶材料解析方法、及び結晶構造解析プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
1つの態様では、本件の結晶材料解析装置は、
原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有するグラフであって、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有し、かつ前記単位格子内の2つの前記原子の化学結合のデータである格子内エッジを有し、更に、前記単位格子内の前記原子と化学結合を有する原子であって前記単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有し、かつ前記格子内ノードに当たる原子と前記拡張ノードに当たる原子との間の化学結合のデータである拡張エッジとを有するグラフを用いて、結晶材料の解析を行う解析部を有する。
【0008】
他の1つの態様では、本件の結晶材料解析方法は、
コンピュータが、
原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有するグラフであって、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有し、かつ前記単位格子内の2つの前記原子の化学結合のデータである格子内エッジを有し、更に、前記単位格子内の前記原子と化学結合を有する原子であって前記単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有し、かつ前記格子内ノードに当たる原子と前記拡張ノードに当たる原子との間の化学結合のデータである拡張エッジとを有するグラフを用いて、結晶材料の解析を行う。
【0009】
他の1つの態様では、本件の結晶材料解析プログラムは、
コンピュータに、
原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有するグラフであって、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有し、かつ前記単位格子内の2つの前記原子の化学結合のデータである格子内エッジを有し、更に、前記単位格子内の前記原子と化学結合を有する原子であって前記単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有し、かつ前記格子内ノードに当たる原子と前記拡張ノードに当たる原子との間の化学結合のデータである拡張エッジとを有するグラフを用いて、結晶材料の解析を行わせる。
【発明の効果】
【0010】
一つの側面では、結晶材料の解析に有用な結晶材料解析装置を提供できる。
また、一つの側面では、結晶材料の解析に有用な結晶材料解析方法を提供できる。
また、一つの側面では、結晶材料の解析に有用な結晶材料解析プログラムを提供できる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、結晶材料の結晶構造の一例の模式図である。
【
図3】
図3は、結晶材料の結晶構造の他の例の模式図である。
【
図4】
図4は、本件の技術のグラフ化により作成した、
図1の結晶構造の単位格子のグラフである。
【
図5】
図5は、本件の技術のグラフ化により作成した、
図3の結晶構造の単位格子のグラフである。
【
図6】
図6は、本件の技術のグラフ化を説明するための図である。
【
図7】
図7は、本件の技術のグラフ化の一例のフローチャートである。
【
図8】
図8は、
図4のグラフに対してラベルを付したグラフである。
【
図9】
図9は、結晶材料の結晶構造の他の例の模式図である。
【
図10】
図10は、本件の技術のグラフ化により作成した
図9の結晶構造の単位格子のグラフである。
【
図11】
図11は、本件の技術のグラフ化により作成した
図1の結晶構造の単位格子のグラフである。
【
図12】
図12は、本件の結晶材料解析装置の構成例を表す図である。
【
図13】
図13は、本件の結晶材料解析装置の他の構成例を表す図である。
【
図14】
図14は、本件の結晶材料解析装置の他の構成例を表す図である。
【
図15】
図15は、本件の結晶材料解析装置の一実施形態としての機能構成例を示す図である。
【
図16】
図16は、本件の結晶材料解析装置の他の実施形態としての機能構成例を示す図である。
【
図17】
図17は、本件で開示する技術の一例を用いて結晶構造を解析する際のフローチャートの例である。
【
図18】
図18は、Li
1.865CoP
2O
7〔#261899(14)〕の単位格子の模式図である。
【
図19】
図19は、Li
2Mn(P
2O
7)〔#419562(14)〕の単位格子の模式図である。
【
図20】
図20は、LiMo(P2O7)〔#83647(4)〕の単位格子の模式図である。
【発明を実施するための形態】
【0012】
(結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム)
本件の結晶材料解析装置は、解析部を有し、更に必要に応じてグラフデータベースを有する。
本件の結晶材料解析方法は、コンピュータが、グラフを用いて結晶材料の解析を行う。
本件の結晶材料解析プログラムは、コンピュータに、グラフを用いて結晶材料の解析を行わせる。
本件の結晶材料解析装置は、例えば、本件の結晶材料解析方法を行う。
本件の結晶材料解析方法は、例えば、本件の結晶材料解析プログラムにより行われる。
【0013】
グラフは、原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有する。
グラフは、結晶材料の1つの単位格子内の原子のデータであるノード(以下、「格子内ノード」と称することがある)を有する。
グラフは、単位格子内の2つの原子の化学結合のデータであるエッジ(以下、「格子内エッジ」と称することがある)を有する。
グラフは、単位格子内の原子と化学結合を有する原子であって単位格子に隣接する単位格子(以下、「隣接単位格子」と称することがある)内の原子のデータであるノード(以下、「拡張ノード」と称することがある)を有する。
グラフは、格子内ノードに当たる原子と拡張ノードに当たる原子との間の化学結合のデータであるエッジ(以下、「拡張エッジ」と称することがある)を有する。
【0014】
ここで本件の技術におけるグラフの一例を、模式図を用いて説明する。
図1は、結晶材料の結晶構造の模式図である。
結晶構造は、単位格子の無限の繰り返しにより構成される。そのため、通常、結晶構造をグラフで表そうとしても、無理であるか、ある程度の大きさに限定したとしても、非常に多くのノード及びエッジが必要になる。
他方、単位格子をグラフで表しても、そのグラフでは、1つの結晶構造のみを表すことができず、複数の結晶構造を含むことになる場合がある。その一例を説明する。
図1において、結晶材料の結晶構造100Xは、原子A及び原子Bを含む単位格子100を繰り返し単位として有する。なお、
図1において、上下左右の点線は、単位格子100が繰り返されていることを意味する。
もしも、
図1の結晶構造100Xの単位格子100をグラフで表すと、通常、
図2のようになる。
図2は、単位格子100のグラフの一例である。
図2のグラフは、原子Aのデータであるノード101Aと、原子Bのデータであるノード101Bと、原子Aと原子Bとの化学結合のデータであるエッジ102とを有する。
ここで、単位格子100を繰り返し単位として有する結晶構造は、
図1の結晶構造100Xの他に、
図3の結晶構造100Yなどもある。なお、
図3において、上下左右の点線は、単位格子100が繰り返されていることを意味する。
そして、
図1の結晶構造100Xの単位格子100を
図2のグラフで表した方法と同じ方法で
図3の結晶構造100Yの単位格子をグラフで表すと、
図2となる。
そうすると、
図2のグラフでは、1つの結晶構造のみを表したことにはならない。
【0015】
他方、本件の技術におけるグラフでは、
図1の結晶構造に対応するグラフは、
図4のようなグラフとなる。
図4は、
図1の結晶構造の単位格子100に関するグラフである。
図4のグラフは、単位格子100内の原子Aのデータである格子内ノード111Aと、単位格子100内の原子Bのデータである格子内ノード111Bと、単位格子内の原子Aと原子Bとの結合関係のデータである格子内エッジ112とを有する。
図4のグラフは、更に、以下の拡張ノード及び拡張エッジを有する。
・単位格子100内の原子と化学結合を有する隣接単位格子内の原子Aのデータである拡張ノード121A(3つ)
・単位格子100内の原子と化学結合を有する隣接単位格子内の原子Bのデータである拡張ノード121B(3つ)
・格子内ノード111Aと拡張ノード121Aとの間のエッジである拡張エッジ122AA(2つ)
・格子内ノード111Aと拡張ノード121Bとの間のエッジである拡張エッジ122AB(1つ)
・格子内ノード111Bと拡張ノード121Bとの間のエッジである拡張エッジ122BB(2つ)
・格子内ノード111Bと拡張ノード121Aとの間のエッジである拡張エッジ122BA(1つ)
【0016】
他方、本件の技術におけるグラフでは、
図3の結晶構造に対応するグラフは、
図5のようなグラフとなる。
図5は、
図3の結晶構造の単位格子100に関するグラフである。
図5のグラフは、単位格子100内の原子Aのデータである格子内ノード111Aと、単位格子100内の原子Bのデータである格子内ノード111Bと、単位格子内の原子Aと原子Bとの結合関係のデータである格子内エッジ112とを有する。
図5のグラフは、更に、以下の拡張ノードを有する。
・単位格子100内の原子と化学結合を有する隣接単位格子内の原子Aのデータである拡張ノード121A(3つ)
・単位格子100内の原子と化学結合を有する隣接単位格子内の原子Bのデータである拡張ノード121B(3つ)
ここまでは、
図4のグラフと同じである。
図5のグラフは、更に、以下の拡張エッジを有する。
・格子内ノード111Aと拡張ノード121Bとの間のエッジである拡張エッジ122AB(3つ)
・格子内ノード111Bと拡張ノード121Aとの間のエッジである拡張エッジ122BA(3つ)
ここで、拡張エッジの種類、及び種類毎の数が
図4のグラフとは異なる。
【0017】
以上をまとめると、単位格子を
図2のようにグラフ化すると、1つの結晶構造のみを表したことにはならない。
一方で、
図6に示すように、本件のグラフ化の技術では、単位格子が同じであるが、結晶構造が異なる2以上の結晶構造を、異なったグラフで表すことができる。
結晶構造が異なる2以上の結晶構造を異なったグラフで表すことができれば、結晶材料の解析(例えば、結晶材料の類似性の分析、及び結晶材料の特性の予測など)において、解析精度を高くすることができる。
そのため、本件のグラフ化の技術は、コンピュータ技術を用いた結晶材料の解析に有用である。
【0018】
<グラフデータベース>
グラフは、例えば、グラフデータベースに格納されている。
【0019】
<<グラフ>>
グラフは、原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有する。グラフとは、ノード(頂点)群とノード間の連結関係を表すエッジ(枝)群で構成される抽象データ型である。グラフは、G=(V,E)で表され、Vはノードの集合であり、Eはエッジの集合である。Vは有限の集合であり、EはVから選んだ2つの元からなる集合の集合である。
グラフは、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有する。
グラフは、単位格子内の2つの原子の化学結合のデータである格子内エッジを有する。
グラフは、単位格子内の原子と化学結合を有する原子であって単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有する。
グラフは、格子内ノードに当たる原子と拡張ノードに当たる原子との間の化学結合のデータである拡張エッジを有する。
格子内ノード及び拡張ノードは、例えば、原子の種類、原子の価数、原子の電荷などのデータを有する。
格子内エッジ及び拡張エッジは、例えば、結合の種類、結合の角度、結合の距離、結合次数などのデータを有する。結合の角度、及び結合の距離は、例えば、原子又は化学結合の座標データとして有されている。
【0020】
グラフは、格子内ノード、及び拡張ノード以外のノードを有していてもよい。
グラフにおいては、1つの結晶材料における全ノードの数が、1つの結晶材料における格子内ノードの数の27倍以下であることが好ましい。ある単位格子は、通常、その周囲に、26の隣接する単位格子を有する。そのことから、ある単位格子に隣接する全ての単位格子内の原子の全てが、ある単位格子内の原子と結合している場合でも、グラフにおける全ノードの数は、格子内ノードの27倍である。そのため、本件の技術のグラフを作成する場合、グラフのノードの数としては、1つの結晶材料における全ノードの数が、1つの結晶材料における格子内ノードの数の27倍以下であれば、本件の技術のグラフを作成するのに十分である。
なお、グラフのエッジの数は、ノードの数に応じて、適宜選択される。
【0021】
格子内エッジ、及び拡張エッジは、格子内ノード間、並びに格子内ノード及び拡張ノード間のボロノイ分割により作成されることがより好ましい。
ボロノイ分割とは、隣り合うノード間を結ぶ直線に垂直二等分線を引き、各ノードの最近隣領域を分割する手法である。
ここで、ボロノイ図及びボロノイ分割について簡単に説明する。
ボロノイ図(Voronoi diagram)は、ある距離空間上の任意の位置に配置された複数個の点(母点)に対して、同一距離空間上の他の点がどの母点に近いかによって領域分けされた図のことである。また、その領域分けをボロノイ分割という。母点の位置のみによって分割パターンが決定される。
結晶材料の単位格子を、化学結合を含めて模式的に表す場合、結晶材料の単位格子の化学結合は、通常、一意に定まるものではない。しかし、ボロノイ分割によりエッジ(格子内エッジ、拡張エッジ)を作成することで、エッジ(格子内エッジ、拡張エッジ)を一意に定めることができる。その結果、複数の結晶材料について、一意にエッジを定めることができるため、結晶材料の解析の精度を高めることができる。
【0022】
結晶材料としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、有機化合物、無機化合物、タンパク質、ポリマーなどが挙げられる。
【0023】
ここで、本件の技術のグラフ化の一例を、フローチャートを用いて説明する。
図7は、本件の技術のグラフ化の一例のフローチャートである。ここでは、
図1に示す結晶構造の単位格子のグラフ化について説明する。
まず、単位格子の情報を取得する(S1)。単位格子の情報としては、周期性、単位格子内の原子の種類と位置などが挙げられる。単位格子100内の原子の数(n)は2である。
次に、直交座標(x,y,z)のx,y,z方向のそれぞれについて、-1~1までの周期の原子配置を作成する(S2)。ここで、ある単位格子の座標を(0,0,0)とすると、その単位格子の原子配置、及びその単位格子の周囲にある単位格子(0,0,1)~(1,1,1)(26個)の原子配置を作成する。ここで、これら全ての単位格子の原子の総数は、3×3×3×n=27n=54となる。
次に、(x,y,z)=(0,0,0)の単位格子内の原子について、ボロノイ分割により単位格子内および隣接単位格子内の原子27n個との結合関係を決定する(S3)。ここで、通常、結晶材料中の原子は周囲のあらゆる原子と結合できるわけではなく、原子の種類、価数、電荷などにより、結合できる原子の組み合わせは制限される。上記結合関係の決定は、そのような結合できる原子の組み合わせを考慮して行われる。
次に、隣接単位格子内の26n個の原子の内、(x,y,z)=(0,0,0)の単位格子内の原子と結合している原子(α個)に拡張したラベルを作成する(S4)。
図8に、
図4のグラフに対してラベルを付したグラフを示した。
図8のグラフでは、単位格子100内の原子A及び原子BがそれぞれA0及びB0で表されている。そして、拡張したラベルは、単位格子100外の原子A、及び原子Bに付されている。そのラベルを、
図8においては、それぞれA1、A2、A3、B1、B2、及びB3とした。
A0及びB0を格子内ノードとし、拡張したラベルA1、A2、A3、B1、B2、及びB3を付したノードを拡張ノードとする。更に、格子内ノード間のエッジ、及び格子内ノードと拡張ノードとの間のエッジを選択することで、
図8のグラフとなる。
【0024】
また、本件の技術のグラフ化によると、単位格子の大きさの違いに影響されず結晶構造を対比し、解析することもできる。例えば、
図9に示す結晶構造100Zの単位格子1001に対して、
図10に示すようなグラフを作成した場合を考える。一方、
図1に示す結晶構造100Xの単位格子100に対するグラフは、
図11のとおりである。なお、
図11のグラフは、
図4のグラフと同じである。ここで、
図10のグラフは、部分的に
図11のグラフを有する。そのことから、この場合、
図11のグラフに対応する単位格子100を持つ結晶構造100Xと、
図11のグラフに対応する単位格子100の2倍の大きさを持つ
図10のグラフに対応する単位格子1001を持つ結晶構造100Zとを類似性の高い結晶構造として解析することが可能となる。即ち、単位格子の大きさが異なっている場合、それでもって類似性が低いと評価されるのではなく、単位格子の大きさの違いに影響されず、結晶構造を対比し、解析することもできる。
【0025】
<解析部>
解析部においては、本件の技術のグラフを用いて結晶材料の解析を行う。
結晶材料の解析としては、例えば、複数の結晶材料の結晶構造の類似性の分析、結晶材料の特性の予測などが挙げられる。
【0026】
<<類似性の分析>>
複数の結晶材料の結晶構造の類似性の分析の方法としては、本件の技術のグラフを用いて、ある結晶材料の結晶構造と他の結晶材料の結晶構造との類似性を分析する方法であれば、特に制限はなく、目的に応じて適宜選択することができ、例えば、類似度のスコアを算出し、スコアが大きいほど類似性が高いと判断する方法などが挙げられる。
【0027】
類似度のスコアを算出する方法としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、以下の方法(1)及び(2)などが挙げられる。
(1)フィンガープリント法
(2)化合物間において共通する部分構造の探索を、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより化合物の類似性の分析を行う手法(例えば、以下の非特許文献X参照)
非特許文献X:Maritza Hernandez, Arman Zaribafiyan, Maliheh Aramon, Mohammad Naghibi “A Novel Graph-based Approach for Determining Molecular Similarity”. arXiv:1601.06693(https://arxiv.org/pdf/1601.06693.pdf)
フィンガープリント法では、例えば、問い合わせ化合物における部分構造が、比較対象の化合物に含まれているか否かを、0又は1で表して類似度を評価する。
最大独立集合問題とは、グラフ理論において、与えられたグラフG(V,E)に対して、頂点集合V’⊆VのうちV’内の頂点間に枝(エッジ)が存在しないようなもの(独立集合)で大きさが最大のものを求める問題である。
なお、類似度のスコアの算出の方法はこれらの方法に限定されず、例えば、類似度の計算に関するコサイン類似度、相関係数、相関関数、編集距離(レーベンシュタイン距離ともいう)などにより類似度のスコアを算出してもよい。
【0028】
<<特性の予測>>
結晶材料の特性の予測の方法としては、本件の技術のグラフを用いて結晶材料の特性の予測を行う方法であれば、特に制限はなく、目的に応じて適宜選択することができ、例えば、学習モデルを用いた特性の予測などが挙げられる。
【0029】
学習モデルを用いた特性の予測としては、例えば、機械学習により学習モデルを作成し、当該学習モデルを用いて結晶材料の特性の予測を行う方法などが挙げられる。
機械学習としては、例えば、教師あり学習、教師なし学習などが挙げられる。
機械学習により学習モデルを作成する際の学習の方法としては、特に制限はなく、目的に応じて適宜選択することができる。
機械学習における教師データは、例えば、本件の技術のグラフと、当該グラフに当たる結晶材料の特性のデータとを有する。
特性としては、特に制限はなく、目的に応じて適宜選択することができ、化学的特性であってもよいし、物理的特性であってもよい。特性の具体例としては、例えば、電気伝導性、イオン導電性、放電電位、比誘電率、熱伝導率、比熱などが挙げられる。
【0030】
教師あり学習の場合、例えば、ある結晶材料のグラフと、その結晶材料の特性をラベルとして有する教師データのデータセットを用い、学習を行う。
【0031】
また、特性の予測を行う際には、本件の技術のグラフ(グラフ構造のデータ)を加工して用いてもよい。例えば、グラフをテンソルに変換することで、機械学習(例えば、深層学習)技術を用いてグラフ構造のデータを高精度に学習することができる。
ここで、テンソルとは、行列、ベクトルなどの概念を一般化した、多次元の配列で表現したデータを意味する。
【0032】
本件で開示する結晶材料解析プログラムは、内蔵ハードディスク、外付けハードディスクなどの記録媒体に記録しておいてもよいし、CD-ROM、DVD-ROM、MOディスク、USBメモリなどの記録媒体に記録しておいてもよい。
さらに、本件で開示する結晶材料解析プログラムを、上記の記録媒体に記録する場合には、必要に応じて、コンピュータシステムが有する記録媒体読取装置を通じて、これを直接又はハードディスクにインストールして使用することができる。また、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域(他のコンピュータなど)に本件で開示する結晶材料解析プログラムを記録しておいてもよい。この場合、外部記憶領域に記録された本件の結晶材料解析プログラムは、必要に応じて、外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用することができる。
なお、本件の結晶材料解析プログラムは、複数の記録媒体に、任意の処理毎に分割されて記録されていてもよい。
【0033】
(記録媒体)
本件で開示する記録媒体は、本件の結晶材料解析プログラムを記録してなる。
記録媒体は、コンピュータが読み取り可能である。
記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、CD-ROM、DVD-ROM、MOディスク、USBメモリなどが挙げられる。
また、記録媒体は、本件で開示する結晶材料解析プログラムが任意の処理毎に分割されて記録された複数の記録媒体であってもよい。
記録媒体は、一過性であってもよいし、非一過性であってもよい。
【0034】
図12に、本件の結晶材料解析装置のハードウェア構成例を示す。
結晶材料解析装置10においては、例えば、制御部11、メモリ12、記憶部13、表示部14、入力部15、出力部16、及びI/Oインターフェース部17がシステムバス18を介して接続されている。
【0035】
制御部11は、演算(四則演算、比較演算、焼き鈍し法の演算等)、ハードウェア及びソフトウェアの動作制御などを行う。
制御部11としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、CPU(Central Processing Unit)であってもよい。
本件で開示する結晶材料解析装置における解析部は、例えば、制御部11により実現することができる。
【0036】
メモリ12は、RAM(Random Access Memory)、ROM(Read Only Memory)などのメモリである。RAMは、ROM及び記憶部13から読み出されたOS(Operating System)及びアプリケーションプログラムなどを記憶し、制御部11の主メモリ及びワークエリアとして機能する。
【0037】
記憶部13は、各種プログラム及びデータを記憶する装置であり、例えば、ハードディスクである。記憶部13には、制御部11が実行するプログラム、プログラム実行に必要なデータ、OSなどが格納される。例えば、グラフデータベースは、記憶部13に格納される。
また、本件で開示する結晶材料解析プログラムは、例えば、記憶部13に格納され、メモリ12のRAM(主メモリ)にロードされ、制御部11により実行される。
【0038】
表示部14は、表示装置であり、例えば、CRTモニタ、液晶パネルなどのディスプレイ装置である。
入力部15は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス(例えば、マウス等)などである。
出力部16は、各種データの出力装置であり、例えば、プリンタなどである。
I/Oインターフェース部17は、各種の外部装置を接続するためのインターフェースである。I/Oインターフェース部17は、例えば、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、MOディスク(Magneto-Optical disk)、USBメモリ〔USB(Universal Serial Bus) flash drive〕などのデータの入出力を可能にする。
【0039】
図13に、本件で開示する結晶材料解析装置の他のハードウェア構成例を示す。
図13に示す結晶材料解析装置は、結晶材料解析装置をクラウド型にした場合の例であり、制御部11が、記憶部13などとは独立している。
図13に示す例においては、ネットワークインターフェース部19、20を介して、記憶部13などを格納するコンピュータ20と、制御部11を格納するコンピュータ40とが接続される。
ネットワークインターフェース部19、20は、インターネットを利用して、通信を行うハードウェアである。
【0040】
図14に、本件で開示する結晶材料解析装置の他のハードウェア構成例を示す。
図14に示す結晶材料解析装置は、結晶材料解析装置をクラウド型にした場合の例であり、記憶部13が、制御部11などとは独立している。
図14に示す例においては、ネットワークインターフェース部19、20を介して、制御部11等を格納するコンピュータ30と、記憶部13を格納するコンピュータ40とが接続される。
【0041】
図15に、本件で開示する結晶材料解析装置の一実施形態としての機能構成例を示す。
図15に示す結晶材料解析装置1Aは、解析部2を有する。
【0042】
図16に、本件で開示する結晶材料解析装置の他の実施形態としての機能構成例を示す。
図16に示す結晶材料解析装置1Bは、解析部2及び、グラフデータベース3を有する。
【0043】
図17に、本件で開示する技術の一例を用いて結晶構造を解析する際のフローチャートの例を示す。
まず、他のデータベースから結晶構造データを抜き出す(S11)。他のデータベースとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、無機結晶構造データベース(Inorganic Crystal Structure Database:ICSD)などが挙げられる。なお、抜き出す結晶構造データの数、種類としては、特に制限はなく、目的に応じて適宜選択することができる。例えば、ある特定の元素を有する化学物質の結晶構造データのみを抜き出してもよい。
次に、抜き出された結晶構造データを用いて、本件の技術のグラフ化により、グラフを作成し、当該グラフを有するグラフデータベースを作成する(S12)。グラフの作成は、例えば、
図7に示したフローチャートに従って行う。
次に、グラフデータベースのグラフを用いて結晶構造の解析を行う(S13)。解析としては、例えば、類似性評価が挙げられる。類似性評価は、例えば、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより行う。当該方法は、例えば、以下の非特許文献を参照して行うことができる。
非特許文献:Maritza Hernandez, Arman Zaribafiyan, Maliheh Aramon, Mohammad Naghibi “A Novel Graph-based Approach for Determining Molecular Similarity”. arXiv:1601.06693(https://arxiv.org/pdf/1601.06693.pdf)
以上により、結晶構造の解析の一つである結晶構造の類似性評価を行うことができる。
【実施例】
【0044】
以下に、実施例を用いて、開示の技術を具体的に説明する。なお、開示の技術は以下の実施例に限定されない。
【0045】
(実施例1)
ICSDに収録されている約9,000個のLi化合物について、開示の技術のグラフを作成し、全固体リチウム二次電池の正極材料の一つであるLi
1.865CoP
2O
7(
図18)に対する類似性の評価を行った。具体的な方法を以下に示す。
なお、
図18において、♯に続く6桁の番号は、ICSDにおける当該LI化合物の番号であり、カッコ内の数字は、空間群の番号である。
【0046】
ICSDに収録されている約9,000個のLi化合物の結晶構造データ(cifファイル形式)をICSDから抜き出し、それらの結晶構造データについて、
図7のフローチャートに従って、グラフ化した。
続いて、得られたグラフについて、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことにより、Li
1.865CoP
2O
7に対する類似度を算出した。
結果を表1に示した。表1では、類似度を降順で20位まで示した。
【0047】
【0048】
ここで、分母(A)の列は、Li1.865CoP2O7のグラフにおけるノード(原子)の数(236)である。
分母(B)の列は、それぞれのLi化合物におけるノード(原子)の数である。
比(A)は、類似度/分母(A)である。そのため、比(A)の数値の順序は、類似度の数値の順序と同じである。
比(B)は、類似度/分母(B)である。
これらは、以下の表2においても同じである。
表2においては、同じ結果について、比(B)を降順で20位まで示した。
【0049】
【0050】
表1のように、Li
1.865CoP
2O
7との類似度を求めると、Li
1.865CoP
2O
7との類似度が最も高いLi化合物〔Li
1.865CoP
2O
7自身を除き、比(A)が最も大きいLi化合物〕として、
図19に示すLi化合物が見つかった。
一方、表2に示すように、比(B)を求めたところ、Li
1.865CoP
2O
7との類似度が最も高いLi化合物〔Li
1.865CoP
2O
7自身を除き、比(B)が最も大きいLi化合物〕として、
図20に示す化合物が見つかった。
ここで、
図19に示すLi化合物は、単位格子の大きさが同じ程度の大きさである場合に、類似度が高いLi化合物である。それに対して、
図20に示すLi化合物は、見かけ上は単位格子の大きさが大きく異なるため、類似度が低いように見えるが、単位格子の大きさの違いによらず、
図18のLi化合物(Li
1.865CoP
2O
7)との類似度が高いLi化合物であると評価することができる。即ち、
図20に示すLi化合物の単位格子を、そのノード(原子)の数(79)が
図18のLi化合物のノード(原子)の数(236)に近づくように大きくすると、
図18で示すLi化合物の単位格子と類似した構造となると評価することができる。
【0051】
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有するグラフであって、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有し、かつ前記単位格子内の2つの前記原子の化学結合のデータである格子内エッジを有し、更に、前記単位格子内の前記原子と化学結合を有する原子であって前記単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有し、かつ前記格子内ノードに当たる原子と前記拡張ノードに当たる原子との間の化学結合のデータである拡張エッジとを有するグラフを用いて、結晶材料の解析を行う解析部を有することを特徴とする結晶材料解析装置。
(付記2)
前記グラフを有するグラフデータベースを有する付記1に記載の結晶材料解析装置。
(付記3)
前記格子内エッジ、及び前記拡張エッジが、前記格子内ノード間、並びに前記格子内ノード及び前記拡張ノード間のボロノイ分割により作成される付記1又は2に記載の結晶材料解析装置。
(付記4)
前記グラフにおいて、1つの結晶材料における全ノードの数が、前記1つの結晶材料における前記格子内ノードの数の27倍以下である付記1から3のいずれかに記載の結晶材料解析装置。
(付記5)
前記結晶材料が、無機化合物である付記1から4のいずれかに記載の結晶材料解析装置。
(付記6)
前記結晶材料の解析が、複数の結晶材料の結晶構造の類似性の分析である付記1から5のいずれかに記載の結晶材料解析装置。
(付記7)
前記結晶材料の解析が、結晶材料の特性の予測である付記1から5のいずれかに記載の結晶材料解析装置。
(付記8)
コンピュータが、
原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有するグラフであって、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有し、かつ前記単位格子内の2つの前記原子の化学結合のデータである格子内エッジを有し、更に、前記単位格子内の前記原子と化学結合を有する原子であって前記単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有し、かつ前記格子内ノードに当たる原子と前記拡張ノードに当たる原子との間の化学結合のデータである拡張エッジとを有するグラフを用いて、結晶材料の解析を行う、
ことを特徴とする結晶材料解析方法。
(付記9)
前記格子内エッジ、及び前記拡張エッジが、前記格子内ノード間、並びに前記格子内ノード及び前記拡張ノード間のボロノイ分割により作成される付記8に記載の結晶材料解析方法。
(付記10)
前記グラフにおいて、1つの結晶材料における全ノードの数が、前記1つの結晶材料における前記格子内ノードの数の27倍以下である付記8又は9に記載の結晶材料解析方法。
(付記11)
前記結晶材料が、無機化合物である付記8から10のいずれかに記載の結晶材料解析方法。
(付記12)
前記結晶材料の解析が、複数の結晶材料の結晶構造の類似性の分析である付記8から11のいずれかに記載の結晶材料解析方法。
(付記13)
前記結晶材料の解析が、結晶材料の特性の予測である付記8から11のいずれかに記載の結晶材料解析方法。
(付記14)
コンピュータに、
原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有するグラフであって、結晶材料の1つの単位格子内の原子のデータである格子内ノードを有し、かつ前記単位格子内の2つの前記原子の化学結合のデータである格子内エッジを有し、更に、前記単位格子内の前記原子と化学結合を有する原子であって前記単位格子に隣接する隣接単位格子内の原子のデータである拡張ノードを有し、かつ前記格子内ノードに当たる原子と前記拡張ノードに当たる原子との間の化学結合のデータである拡張エッジとを有するグラフを用いて、結晶材料の解析を行わせる、
ことを特徴とする結晶材料解析プログラム。
(付記15)
前記格子内エッジ、及び前記拡張エッジが、前記格子内ノード間、並びに前記格子内ノード及び前記拡張ノード間のボロノイ分割により作成される付記14に記載の結晶材料解析プログラム。
(付記16)
前記グラフにおいて、1つの結晶材料における全ノードの数が、前記1つの結晶材料における前記格子内ノードの数の27倍以下である付記14又は15に記載の結晶材料解析プログラム。
(付記17)
前記結晶材料が、無機化合物である付記14から16のいずれかに記載の結晶材料解析プログラム。
(付記18)
前記結晶材料の解析が、複数の結晶材料の結晶構造の類似性の分析である付記14から17のいずれかに記載の結晶材料解析プログラム。
(付記19)
前記結晶材料の解析が、結晶材料の特性の予測である付記14から17のいずれかに記載の結晶材料解析プログラム。
【符号の説明】
【0052】
10 結晶材料解析装置
11 解析部
12 メモリ
13 記憶部
14 表示部
15 入力部
16 出力部
17 I/Oインターフェース部
18 システムバス
19 ネットワークインターフェース部
20 ネットワークインターフェース部
30 コンピュータ
40 コンピュータ