IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

特開2023-7005構造解析方法、構造解析装置およびそのためのプログラム
<>
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図1
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図2
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図3
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図4
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図5
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図6
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図7
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図8
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図9
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図10
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図11
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図12
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図13
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図14
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図15
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図16
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図17
  • 特開-構造解析方法、構造解析装置およびそのためのプログラム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023007005
(43)【公開日】2023-01-18
(54)【発明の名称】構造解析方法、構造解析装置およびそのためのプログラム
(51)【国際特許分類】
   G16C 20/00 20190101AFI20230111BHJP
【FI】
G16C20/00
【審査請求】未請求
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2021109943
(22)【出願日】2021-07-01
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000350
【氏名又は名称】ポレール弁理士法人
(72)【発明者】
【氏名】北川 功
(57)【要約】
【課題】分子内部のミクロ構造に起因する物性について、計算負荷を抑制しつつ高精度に予測する。
【解決手段】本発明の構造解析方法は、解析対象の空間を複数に分割するステップと、分割された各空間における原子の占有率を算出するステップと、所定の占有率よりも低い空間に基づき空孔を特定するステップと、特定された前記空孔を出力するステップと、を備える。また、本発明の構造解析装置は、解析対象の空間を複数に分割する空間分割部と、前記空間分割部によって分割された各空間における原子の占有率を算出する原子占有率算出部と、所定の占有率よりも低い空間に基づき空孔を特定する空孔特定部と、前記空孔特定部によって特定された前記空孔を出力する空孔出力部と、を備える。
【選択図】図4
【特許請求の範囲】
【請求項1】
解析対象の空間を複数に分割するステップと、
分割された各空間における原子の占有率を算出するステップと、
所定の占有率よりも低い空間に基づき空孔を特定するステップと、
特定された前記空孔を出力するステップと、
を備える構造解析方法。
【請求項2】
請求項1に記載の構造解析方法において、
解析対象の空間は、分子内の各原子の座標点を中心とするボロノイ多面体に分割され、
前記原子の占有率は、前記ボロノイ多面体に含まれる原子の半径に基づく有効原子球体積Vaと、前記ボロノイ多面体の体積Vvと、の比であるVa/Vvであり、
前記Va/Vvが所定の閾値以下となる前記ボロノイ多面体のうち、隣接するものを連結することで、前記空孔が特定されることを特徴とする構造解析方法。
【請求項3】
請求項2に記載の構造解析方法において、
前記閾値、または、前記有効原子球体積を算出する際に用いられる係数、の範囲を設定するステップと、
設定された範囲内における前記閾値または前記係数の候補を複数用いて、逐次的に前記空孔を特定していくステップと、
前記空孔の数が最大となるような前記閾値または前記係数の候補を、最終的な前記閾値または前記係数として判定するステップと、
をさらに備える構造解析方法。
【請求項4】
請求項2に記載の構造解析方法において、
前記閾値の範囲を設定するステップと、
設定された範囲内における前記閾値の候補を複数用いて、前記空孔が生成されてから消滅するまでの生存時間を逐次的に計算していくステップと、
前記生存時間が所定時間よりも長くなるような前記閾値の候補を、最終的な前記閾値として判定するステップと、
をさらに備える構造解析方法。
【請求項5】
請求項2に記載の構造解析方法において、
前記空孔の出力態様として、
連結後の前記空孔の境界を出力しつつ、各ボロノイ多面体の稜線も出力する態様と、
連結後の前記空孔の境界を出力しつつ、各ボロノイ多面体の稜線は出力しない態様と、
を選択できることを特徴とする構造解析方法。
【請求項6】
請求項2に記載の構造解析方法において、
前記解析対象は、高分子であることを特徴とする構造解析方法。
【請求項7】
解析対象の空間を複数に分割する空間分割部と、
前記空間分割部によって分割された各空間における原子の占有率を算出する原子占有率算出部と、
所定の占有率よりも低い空間に基づき空孔を特定する空孔特定部と、
前記空孔特定部によって特定された前記空孔を出力する空孔出力部と、
を備える構造解析装置。
【請求項8】
請求項7に記載の構造解析装置において、
前記空間分割部は、分子内の各原子の座標点を中心とするボロノイ多面体に分割するものであり、
前記原子の占有率は、前記ボロノイ多面体に含まれる原子の半径に基づく有効原子球体積Vaと、前記ボロノイ多面体の体積Vvと、の比であるVa/Vvであり、
前記空孔特定部は、前記Va/Vvが所定の閾値以下となる前記ボロノイ多面体のうち、隣接するものを連結することで、前記空孔を特定することを特徴とする構造解析装置。
【請求項9】
請求項8に記載の構造解析装置において、
設定入力部と、判定部と、をさらに備え、
前記設定入力部は、前記閾値、または、前記有効原子球体積を算出する際に用いられる係数の範囲を設定するものであり、
前記空孔特定部は、前記設定入力部で設定された範囲内における前記閾値または前記係数の候補を複数用いて、逐次的に前記空孔を特定していくものであり、
前記判定部は、前記空孔の数が最大となるような前記閾値または前記係数の候補を、最終的な前記閾値または前記係数として判定するものであることを特徴とする構造解析装置。
【請求項10】
請求項8に記載の構造解析装置において、
前記閾値の範囲を設定する設定入力部と、
前記設定入力部で設定された範囲内における前記閾値の候補を複数用いて、前記空孔が生成されてから消滅するまでの生存時間を逐次的に計算していく生存時間算出部と、
前記生存時間が所定時間よりも長くなるような前記閾値の候補を、最終的な前記閾値として判定する判定部と、
をさらに備える構造解析装置。
【請求項11】
請求項8に記載の構造解析装置において、
前記空孔出力部は、
連結後の前記空孔の境界を出力しつつ、各ボロノイ多面体の稜線も出力する態様と、
連結後の前記空孔の境界を出力しつつ、各ボロノイ多面体の稜線は出力しない態様と、
を選択的に出力することを特徴とする構造解析装置。
【請求項12】
請求項8に記載の構造解析装置において、
前記解析対象は、高分子であることを特徴とする構造解析装置。
【請求項13】
コンピュータを構造解析装置として機能させるプログラムであって、
解析対象の空間を複数に分割する空間分割部、
前記空間分割部によって分割された各空間における原子の占有率を算出する原子占有率算出部、
所定の占有率よりも低い空間に基づき空孔を特定する空孔特定部、および、
前記空孔特定部によって特定された前記空孔を出力する空孔出力部、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、構造解析方法および構造解析装置に関する。
【背景技術】
【0002】
近年、X線、中性子線、NMRなどで分子構造を同定する精度が向上しており、同定された分子構造は、データベースに登録され、多くのデータが利用できるようになっている。
【0003】
分子構造から特徴量を抽出する方法の1つとして、定量的構造活性相関解析法(QSAR)がある。QSAR解析は、分子構造から構造記述子といわれる構造的、量子化学的および物理化学的な特徴量を計算し、これらを説明変数として化合物の有する生理活性を統計的に予測する手法である。この手法の場合、主に創薬分野において、ディープラーニング技術を用いて、分子画像ファイルを入力情報として、情報縮約を行い、より低次元のデータ表現にしてQSARを行う方法が提案されている。このような方法では、情報縮約モデルを構築するために、多種多様の分子の立体配座情報を入手し、様々な角度からの厖大な分子画像ファイルによる教師データを作成する必要がある。このような情報縮約モデルを構築するのは、高コストであるし、得られた縮約モデルが有効に機能しているかの検証は困難である。
【0004】
また、分子の特徴量の1つとして、自由体積の概念が使用されている。例えば、自由体積の実験的な計測方法として、陽電子消滅寿命測定法(PALS: Positron annihilation lifetime spectroscopy)がある。この方法では、陽電子をプローブとし、陽電子の寿命から自由体積のサイズを測定する。このように、実験的に得られた自由体積の測定値は、一般に、分子のマクロな物性との関連性を特定する場合には有用である。しかし、特定の原子の近くに何があるか等、分子内部のミクロ構造に起因する物性との関連性については、特定することが困難である。
【0005】
ここで、分子のミクロ構造と自由体積の関係を積極的に調べようとするアプローチの1つとして、例えば、非特許文献1に記載されているように、分子動力学などの分子シミュレーションを活用した方法がある。このようなアプローチでは、自由体積の定義は分子内に着目した1つの原子が動き回れる体積として定義されている。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Y. Lu, X. Lu, Z. Qin, J. Shen, “Direct visualization of free-volume-triggered activation of β relaxation in colloidal glass”, PHYSICAL REVIEW E94, 012606 (2016), 6 July 2016
【発明の概要】
【発明が解決しようとする課題】
【0007】
自由体積に基づく分子のミクロ構造へのアプローチでは、原子を動かすシミュレーションを1つずつ実行する必要があるため、高分子になるほど計算負荷が大きくなり、シミュレーションが困難となるか高コスト化する可能性がある。また、自由体積は、各分野で独自に定義がされており、例えば、上記PALSで測定された体積と、分子シミュレーションで計算された体積と、は必ずしも一致しない。
【0008】
本発明の目的は、分子内部のミクロ構造に起因する物性について、計算負荷を抑制しつつ高精度に予測することにある。
【課題を解決するための手段】
【0009】
本発明の構造解析方法の一例を挙げるならば、解析対象の空間を複数に分割するステップと、分割された各空間における原子の占有率を算出するステップと、所定の占有率よりも低い空間に基づき空孔を特定するステップと、特定された前記空孔を出力するステップと、を備えるものである。
【0010】
また、本発明の構造解析装置の一例を挙げるならば、解析対象の空間を複数に分割する空間分割部と、前記空間分割部によって分割された各空間における原子の占有率を算出する原子占有率算出部と、所定の占有率よりも低い空間に基づき空孔を特定する空孔特定部と、前記空孔特定部によって特定された前記空孔を出力する空孔出力部と、を備えるものである。
【発明の効果】
【0011】
本発明によれば、分子内部のミクロ構造に起因する物性について、計算負荷を抑制しつつ高精度に予測できる。
【図面の簡単な説明】
【0012】
図1】データの入出力装置と、計算および記録を行う解析装置と、が別の計算機に分かれた構造解析システムを示す構成図。
図2】データの入出力装置と、計算および記録を行う解析装置と、が一体となった構造解析システムを示す構成図。
図3】実施例1に係る構造解析装置が実行する機能を示すブロック図。
図4】実施例1に係る構造解析装置によって、分子構造の特徴量として空孔を抽出する方法を示すフローチャート。
図5】原子の座標点とボロノイ多面体の位置関係の一例を表した図。
図6】ボロノイ多面体の情報のデータ構造の一例を示す図。
図7図5で示した5つのボロノイ多面体の情報の集合をネットワーク型のデータ形式で表した図。
図8図5で示した5つのボロノイ多面体の情報の集合をリスト型のデータ形式で表した図。
図9】入力された座標情報と形成された空孔を含む領域を可視化した例を示す図。
図10】入力された座標情報と空孔を含む領域だけでなく、空孔を形成する各ボロノイ多面体の稜線まで可視化した例を示す図。
図11】分子構造と空孔構造を並べて可視化した例を示す図。
図12】エメラルドの結晶構造を示す図。
図13】実施例1の解析により抽出された空孔を可視化した結果を示す図。
図14】実施例2に係る構造解析装置が実行する機能を示すブロック図。
図15】実施例2に係る構造解析装置において、設定された範囲内で複数の解析を逐次的に実行する方法を示すフローチャート。
図16】実施例3に係る構造解析装置が実行する機能を示すブロック図。
図17】実施例3に係る構造解析装置において、設定された範囲内で複数の解析を逐次的に実行する方法を示すフローチャート。
図18】空孔の生存時間がAV閾値により変化する様子を示す図。
【発明を実施するための形態】
【0013】
本発明の実施形態に関し、図1および図2を用いて説明する。
【0014】
図1は、データの入出力装置と、計算および記録を行う解析装置と、が別の計算機(コンピュータ)に分かれた構造解析システムを示す構成図である。図1に示すように、データ入出力装置402と、解析装置410と、がネットワーク420によって接続されている。このため、ユーザが操作するデータ入出力装置402では、構造解析の計算や記録を行う必要がない。
【0015】
データ入出力装置402は、入力デバイス413と、画面表示部414と、入出力制御部412と、ネットワークI/O部404と、で構成される。一方、解析装置410は、CPU408と、メモリ406と、ネットワークI/O部404と、ストレージ418と、バス部409と、で構成される。
【0016】
構造解析装置は、解析装置410のコンピュータにおいて、所定のプログラムがメモリ406上に格納され、CPU408がメモリ406上のプログラムを実行することにより実現できる。この所定のプログラムは、図示していない読取装置を介して当該プログラムが記憶された記憶媒体から、または、ネットワークI/O部404を介してネットワーク420から、直接メモリ406上に格納するか、もしくは、一旦ストレージ418に保存してからメモリ406に格納される。
【0017】
図2は、データの入出力装置と、計算および記録を行う解析装置と、が一体となった構造解析システムを示す構成図である。すなわち、本システムにおいては、解析装置410が、入力デバイス413と、画面表示部414と、入出力制御部412と、ネットワークI/O部404と、CPU408と、メモリ406と、ストレージ418と、バス部409と、を備える。
【実施例0018】
図3は、実施例1に係る構造解析装置が実行する機能を示すブロック図である。図3に示すように、本実施例の構造解析装置は、設定入力部501と、空間分割部502と、原子占有率算出部503と、空孔特定部504と、空孔出力部505と、を備える。設定入力部501は、原子に関する情報の入力や、解析に必要な閾値などの設定を行うものである。空間分割部502は、解析対象の空間を複数に分割するものである。原子占有率算出部503は、空間分割部502によって分割された各空間における原子の占有率を算出するものである。空孔特定部504は、所定の占有率よりも低い空間に基づき空孔を特定するものである。空孔出力部505は、空孔特定部504によって特定された空孔を出力するものである。このような図3に示す各機能は、解析装置410のコンピュータのメモリ406に格納された所定のプログラムを、CPU408が動作させることで、実行される。なお、本実施例では、樹脂、繊維およびタンパク質などを含む高分子を解析対象とした場合を例に挙げて説明する。
【0019】
図4は、実施例1に係る構造解析装置によって、分子構造の特徴量として空孔を抽出する方法を示すフローチャートである。
【0020】
[データの入力(ステップS101)]
まず、ユーザは、入力デバイス413を用いて、解析対象の高分子の原子位置および元素に関する情報を入力する。ここで、原子位置の情報は、X線、中性子線、NMRなどを用いた測定や、シミュレーションを用いた計算によって取得される。また、元素の情報には、元素の原子半径が含まれる。原子半径は、ユーザが任意に指定できるが、好適な例としては、各元素に対応する共有結合半径やファンデルワールス半径である。さらに、空孔の特定に用いられるAV閾値や、物質内部の原子の振動運動の大きさを表すm_coef係数も、入力デバイス413を介して入力される。なお、入力デバイス413を介して入力された情報は、CPU408の入力設定部によって読み込まれ、メモリ406に保持される。
【0021】
[解析空間の多面体分割(ステップS102)]
次に、空間分割部502は、メモリ406に保持されている原子位置のデータを用いて、分子内の各原子の座標点を中心とするボロノイ多面体を計算する。図5は、原子の座標点とボロノイ多面体の位置関係の一例を表した図である。図5に示すように、解析の境界1000に囲まれた解析対象の空間全体は、5つの各原子の座標点(原子Aの座標点1021、原子Bの座標点1022、原子Cの座標点1023、原子Dの座標点1024、原子Eの座標点1025)間の垂直二等分面によって、各原子の座標点を中心とするボロノイ多面体(原子Aのボロノイ多面体1101、原子Bのボロノイ多面体1102、原子Cのボロノイ多面体1103、原子Dのボロノイ多面体1104、原子Eのボロノイ多面体1105)に分割される。
【0022】
図6は、ボロノイ多面体の情報のデータ構造の一例を示す図である。図6に示すように、ボロノイ多面体の情報5000は、ボロノイ多面体に関する幾何学的な情報(頂点座標リスト5100、稜線リスト5200、面リスト5300、体積を構成する面の指定5400)に加え、原子の元素記号5600、原子半径5700、原子位置5500および原子占有率5800を含む。ここでの原子占有率5800は、ボロノイ多面体に含まれる原子の半径に基づく有効原子球体積Vaと、ボロノイ多面体の体積Vvと、の比のVa/Vvとする。
【0023】
頂点座標リスト5100には、頂点のラベル5101と、当該頂点の座標値5102と、が格納されている。稜線リスト5200には、稜線のラベル5201と、当該稜線の値5202(始点となる頂点のラベルと終点となる頂点のラベル)と、が格納されている。面リスト5300には、面のラベル5301と、当該面の値5302(周囲の稜線のラベル)と、が格納されている。
【0024】
また、ボロノイ多面体の情報5000に、原子の持つ化学的性質、例えば、元素番号、質量、電子数、電気陰性度、電子配置などを含ませる場合もある。なお、解析対象が高分子以外であって、空間が結晶のように周期的な構造となっている場合にも、結晶の格子を解析の境界1000とすることで、同様にボロノイ多面体に分割できる。
【0025】
このように、空間全体は、複数のボロノイ多面体で分割されるため、解析結果は、ボロノイ多面体の情報の集合2000として、メモリ406に保持される。ボロノイ多面体の情報の集合2000は、ネットワーク型、リスト型、グラフ型などの形式のデータとして、メモリ406に格納されるのが好適である。
【0026】
図7は、図5で示した5つのボロノイ多面体の情報の集合をネットワーク型のデータ形式で表した図である。図7では、5つの原子位置に対応してAからEまでの5つのノード(2001~2005)が配置され、原子位置を含むボロノイ多面体が互いに隣接している2つはノード間が連結され、この連結状態がエッジ2011~2019として記録される。例えば、ノードA(2001)は、ノードC(2003)、ノードB(2002)およびノードD(2004)と連結され、ノードC(2003)は、ノードA(2001)、ノードB(2002)、ノードD(2004)およびノードE(2005)と連結されている。また、各ノードには、それぞれのボロノイ多面体の情報5001~5005が関連づけられている。なお、ボロノイ多面体の情報の集合をネットワーク型のデータ形式で表す別の方法として、原子位置を座標点としたドロネー図形を作成しても良い。
【0027】
図8は、図5で示した5つのボロノイ多面体の情報の集合をリスト型のデータ形式で表した図である。リスト型のデータ形式で情報をメモリ406に格納する場合、リスト(配列)の参照番号のリストベクトルが用いられる。例えば、ノードA(2001)には、ノード間の連結状態に対応したエッジリスト2021と、ボロノイ多面体の情報5001と、が格納される。なお、エッジリスト2021には、ノードAの連結先であるノードC、ノードBおよびノードDの名称が格納される。
【0028】
図7または図8のようなデータ形式で、ボロノイ多面体の情報の集合2000を格納すると、様々な条件に応じて、ボロノイ多面体を集合の中から除去または追加することが容易に実行できる。例えば、図7に示すノードBに属するボロノイ多面体の情報を集合から除去する場合には、ノードBを削除するとともに、エッジ2016、エッジ2012およびエッジ2017を削除すれば良い。図8に示すノードBに属するボロノイ多面体の情報を集合から除去する場合には、ノードBを削除するとともに、エッジリスト2021、エッジリスト2023およびエッジリスト2025からノードBの名称を削除すれば良い。
【0029】
また、本ステップS102において、解析対象の空間が解析の境界1000の外側から孤立して存在しており、周期境界条件を使用しない場合は、解析の境界1000の頂点、辺または面に属する座標点を頂点座標リスト5100内に含むボロノイ多面体を、ボロノイ多面体の情報の集合2000から削除する。例えば、図5の例では、原子Cの座標点1023のボロノイ多面体1103以外のボロノイ多面体が、解析対象から除外される。
【0030】
[原子占有率の算出(ステップS103)]
次に、原子占有率算出部503は、ボロノイ多面体の情報5000に含まれる元素の情報から原子半径5700を参照し、有効原子球体積Vaを算出する。このとき、原子半径をr_aとすると、有効原子球体積Vaは、以下の(式1)で表せる。
【0031】
Va=4/3*pi(r_a)^3 (式1)
また、有効原子球体積Vaは、m_coef係数を用いた場合、以下の(式2)でも表せる。
【0032】
Va=4/3*pi(r_a*m_coef)^3 (式2)
次に、原子占有率算出部503は、原子占有率5800として、有効原子球体積Vaと、ボロノイ多面体の情報5000に含まれるボロノイ多面体の体積Vvと、の比Va/Vvを算出し、ボロノイ多面体の情報5000の1つとしてメモリ406に保持する。Va/Vvの値の算出と保持は、ボロノイ多面体の情報の集合2000に含まれるすべてのボロノイ多面体に対して行われる。
【0033】
[空孔の判定(ステップS104)]
Va/Vvが大きい場合、当該ボロノイ多面体は原子占有が大きく、密な状態であるため、空孔を構成する部分としては不適当と考えられる。そこで、ステップS104において、空孔特定部504は、原子占有率(Va/Vv)を、予め設定したAV閾値と比較し、AV閾値よりも大きい場合、当該ボロノイ多面体は、空孔を構成するための条件に適合しないため、ボロノイ多面体の情報の集合2000から削除する。空孔特定部504は、ボロノイ多面体の情報の集合2000に含まれるすべてのボロノイ多面体に対し、このような判定を行う。その結果、原子占有率がAV閾値以下となる疎な状態のボロノイ多面体のみが、ボロノイ多面体の情報の集合2000の中に残る。
【0034】
[空孔の生成(ステップS105)]
次に、空孔特定部504は、空孔のボロノイ多面体の情報の集合2000に残っている各ボロノイ多面体同士の連結性を確認し、隣接するものを連結して1つのグループ(空孔)とする。この作業が完了すると、連結したボロノイ多面体のグループ(空孔)の個数は、0、1、2以上、の3つの状態となる。なお、グループ化することで特定された空孔に関する情報は、ストレージ418等に保存される。
【0035】
[データの出力(ステップS106)]
次に、空孔出力部505は、特定された空孔を出力する。図9は、入力された座標情報と形成された空孔を含む領域を可視化した例を示す図である。図9に示すように、解析結果表示部3000には、分子を構成する原子3001と、原子間の結合3002の他、複数のボロノイ多面体によって形成された空孔に対応する領域3003と、単一のボロノイ多面体によって形成された空孔に対応する領域3004と、が重ねて表示されている。図9の例では、空孔の個数は2個である。空孔出力部505が図9のように空孔を出力することで、ユーザは、空孔と判定された領域に含まれる原子を容易に認識できる。また、図9では、結合後の空孔の境界は出力されているものの、各ボロノイ多面体の稜線は出力されておらず、簡素化した表示となっているので、特に高分子など複雑な構造を確認する場合には有効である。
【0036】
図10は、入力された座標情報と空孔を含む領域だけでなく、空孔を形成する各ボロノイ多面体の稜線3005まで可視化した例を示す図である。例えば、結晶構造のように分子が大きくない場合に、空孔内部の詳細をユーザが確認したいときに有効である。また、高分子であっても、部分的に詳細を確認したいときには有効である。図10では、空孔を形成しないボロノイ多面体の稜線3006も出力しているが、この稜線3006は出力しないようにしても良い。
【0037】
図11は、分子構造と空孔構造を並べて可視化した例を示す図である。図11の左側には、分子構造として、ステップS101で入力された座標情報(と原子間の結合)のみが表示され、図11の右側には、空孔構造として、図9に対応する情報が表示される。図11のように可視化することで、ユーザが分子構造と空孔構造を比較するが容易となる。
【0038】
この他のデータの出力態様として、入力値であるAV閾値と連動させ、空孔の数、空孔の体積、空孔を形成するボロノイ多面体の数、空孔の(幾何学的な)重心位置、ボロノイ多面体の(幾何学的な)重心位置、などを表示させても良い。さらに他の出力態様として、入力値であるAV閾値およびm_coef係数と連動させて、空孔の数、空孔の体積、空孔を形成するボロノイ多面体の数、空孔の重心位置、ボロノイ多面体の重心位置、などを表示させても良い。
【0039】
非特許文献1に示すように、1つの原子が動き回れる体積を自由体積として定義すると、特に、高分子の場合は、シミュレーションによる計算の処理が困難である。しかし、本実施例のように、自由体積を、分子内部の空孔として捉えることにより、計算量を抑制しつつ、分子の特性を高精度に予測することが可能である。また、分子の空孔に関する情報が、空孔内に属する原子の情報と関連づけられているので、分子のマクロな特性の支配要因分析において、化学的な情報を用いたケモメトリックス解析が可能となる。
【0040】
図12は、エメラルド(Be3Al2Si6O18)の結晶構造を示す図であり、図13は、本実施例の解析により抽出された空孔を可視化した結果を示す図である。図12および図13によれば、エメラルドの結晶構造についても、酸素原子を中心とする円筒状の空孔の抽出が可能であることが分かる。すなわち、本実施例による空孔解析は、無機の分子にも適用できる。
【実施例0041】
実施例2は、AV閾値およびm_coef係数の範囲をユーザが予め指定し、当該範囲内の複数のAV閾値およびm_coef係数の候補を用いて、複数の解析(空孔特定)を逐次的に実行していき、その実行結果の中から判定条件に合致した候補を、最終的なAV閾値およびm_coef係数とするものである。
【0042】
図14は、実施例2に係る構造解析装置が実行する機能を示すブロック図である。図14に示すように、本実施例の構造解析装置は、実施例1と異なり、さらに、判定部506を備える。判定部506は、条件に合致するAV閾値およびm_coef係数の候補、具体的には、空孔の数が最大となるようなAV閾値またはm_coef係数、を判定するものである。このような図14に示す各機能は、解析装置410のコンピュータのメモリ406に格納された所定のプログラムを、CPU408が動作させることで、実行される。
【0043】
図15は、実施例2に係る構造解析装置において、設定された範囲内で複数の解析を逐次的に実行する方法を示すフローチャートである。
【0044】
[入力値範囲の設定(ステップS201)]
解析を実行する前に、ユーザは、入力デバイス413を用いて、解析対象の原子位置および元素に関する情報に加えて、空孔の特定に用いられるAV閾値の上限値および下限値と、m_coef係数の上限値および下限値と、分割ステップ数と、を入力する。
【0045】
[入力値リストの生成(ステップS202)]
入力デバイス413を介して入力された情報は、CPU408の入力設定部によって読み込まれ、複数のAV閾値を格納したリストと、複数のm_coef係数を格納したリストと、が生成され、メモリ406に保持される。なお、本ステップS202で生成されるリストは、AV閾値かm_coef係数のいずれか一方だけでも良い。
【0046】
[空孔解析の実行(ステップS203)]
次に、原子占有率算出部503および空孔特定部504は、生成された入力値リストから、AV閾値やm_coef係数を逐次的に取得し、連続的な解析を実行する。このとき、原子占有率算出部503および空孔特定部504は、AV閾値のリストとm_coef係数のリストの直積(デカルト積)を作成し、これを逐次的に用いて、連続的な解析を実行しても良い。また、解析結果は、メモリ406またはストレージ418に記録される。
【0047】
[判定(ステップS204)]
次に、判定部506は、解析結果が所定の条件に達したか否かを判定し、達していなければステップS203に戻って解析を繰り返す。所定の条件とは、例えば、最大の空孔数である。
【0048】
ここで、分子中の空孔数が少ない場合としては、原子間距離が短く原子が稠密に存在し分子内に隙間がない状況と、空孔を形成するボロノイ多面体の連結が分子全体に渡っている状況と、に大別される。後者の状況は、入力値であるAV閾値やm_coef係数が、分子構造の特徴を表現するのに適した値になっていないことに起因する可能性がある。このため、本実施例では、設定された範囲内のAV閾値やm_coef係数を複数用いて、複数の解析を実行することで、最適な解析結果を得るようにしている。
【0049】
[表示(ステップS205)]
判定の結果、所定の条件を満たすAV閾値やm_coef係数が、画面表示部414に表示され、メモリ406またはストレージ418に記録される。
【実施例0050】
実施例3は、複数の解析(空孔特定)を逐次的に実行していくに際に、分子動力学トラジェクトリから特徴的な時間を抽出できるAV閾値の候補を、最終的なAV閾値とするものである。
【0051】
図16は、実施例3に係る構造解析装置が実行する機能を示すブロック図である。図16に示すように、本実施例の構造解析装置は、実施例2と異なり、さらに、生存時間算出部507を備える。生存時間算出部507は、設定入力部501で設定された範囲内におけるAV閾値の候補を複数用いて、空孔が生成されてから消滅するまでの生存時間を逐次的に計算していくものである。このような図16に示す各機能は、解析装置410のコンピュータのメモリ406に格納された所定のプログラムを、CPU408が動作させることで、実行される。
【0052】
図17は、実施例3に係る構造解析装置において、設定された範囲内で複数の解析を逐次的に実行する方法を示すフローチャートである。ここで、分子動力学の計算を開始した時刻をゼロとし、計算終了までの時間ステップでカウントする時刻を解析時刻とする。分子動力学の計算によって得られるトラジェクトリは、解析時刻で分子構造(分子内の原子位置)を指定できる時系列データである。
【0053】
[入力値範囲の設定(ステップS301)]
解析を実行する前に、ユーザは、入力デバイス413を用いて、解析対象の原子位置および元素に関する情報に加えて、空孔の特定に用いられるAV閾値の上限値および下限値と、分割ステップ数と、を入力する。
【0054】
[入力値リストの生成(ステップS302)]
入力デバイス413を介して入力されたAV閾値の範囲に関する情報が、CPU408の入力設定部によって読み込まれ、複数のAV閾値を格納したリストが生成され、メモリ406に保持される。生成されたリストから1つのAV閾値が選択され、入力値とされる。
【0055】
[解析時刻の初期化(ステップS303)]
解析時刻(t)がゼロにセットされる。
【0056】
[解析時刻(t)の分子構造の読み込み(ステップS304)]
解析時刻(t)の分子構造が読み込まれる。
【0057】
[空孔解析の実行(ステップS305)]
原子占有率算出部503および空孔特定部504は、解析を実行する。解析結果は、AV閾値と関連付けてメモリ406で保持され、各結果に含まれる空孔に番号が付される。
【0058】
[解析時刻の変更(ステップS306)]
解析時刻が更新される。更新はt=t+Δtで行う。
【0059】
[判定1(ステップS307)]
解析時刻がシミュレーション終了まで達したか否かが判定され、達していない場合には、ステップS304に戻る。
【0060】
[判定2(ステップS308)]
リストに格納された複数のAV閾値による解析がすべて実行されたか否かが判定され、実行されていない場合には、次のAV閾値を入力値として、ステップS303に戻る。
【0061】
[生存時間の算出(ステップS309)]
複数のAV閾値による解析がすべて実行された場合、まず、生存時間算出部507は、解析時刻(t)での空孔解析結果と、同じAV閾値を用いた解析時刻(t+Δt)での空孔解析結果と、を比較する。ここで、Δtは、分子動力学シミュレーションの時間ステップである。比較の結果、解析時刻(t)の結果と解析時刻(t+Δt)の結果とでは、空孔の変化が抽出される可能性がある。例えば、解析時刻(t)に存在していた空孔が、解析時刻(t+Δt)に消滅している変化や、逆に、解析時刻(t)では存在していなかった空孔が、解析時刻(t+Δt)では生成されている変化、が抽出される。本実施例では、空孔が生成してから消滅するまでの時間を生存時間と定義する。また、あるAV閾値について、同じ原子位置を含む空孔に生成と消滅の繰り返しがある場合、その空孔の生存時間の和を積算生存時間と定義する。
【0062】
次に、生存時間算出部507は、上記の定義に基づき、各空孔の生存時間を算出する。生存時間算出部507が、解析時刻を逐次的に変化させた空孔解析を、リストに格納されたすべてのAV閾値について実行すると、空孔の生成および消滅の変化がAV閾値ごとに生じ、AV閾値によって生存時間や積算生存時間が変化することが分かる。
【0063】
[AV閾値の決定(ステップS310)]
図18は、空孔の生存時間がAV閾値により変化する様子を示す図である。横軸は解析時刻であり、縦軸はAV閾値である。あるAV閾値に対して、空孔が生成(6002)および消滅(6004)する時刻を黒丸で示し、その間である生存時間を実線(6006)で示す。図18の例では、AV(3)というAV閾値の生存時間は、AV(2)やAV(1)に比べて長いことが分かる。
【0064】
ここで、物理現象や化学反応において、動力学的な緩和時間や拡散時間は、現象や反応を支配する特徴的な時間である。したがって、緩和時間や拡散時間よりも長く存在する空孔は、分子の特性との関連性が高いと考えられる。そこで、本実施例では、対象とする物理現象や化学反応における緩和時間や拡散時間が分かっている場合、生存時間や積算生存時間がこれらの時間よりも長くなるようなAV閾値を、求めるべきAV閾値としている。
【実施例0065】
実施例4は、分子構造の特徴量として、空孔に関する情報を用いて、分子の特性を予測するモデルを構築するものである。特徴量の具体例としては、空孔の総和体積、各空孔の体積およびこれらの度数分布、空孔重心、空孔半径およびこれらの度数分布などが挙げられる。回帰解析および特性予測モデルの構築においては、説明変数に特徴量を含ませ、目的変数に分子の特性(吸水率、透過率、屈折率、磁気特性、ヤング率など)を含ませる。特性予測モデルの構築においては、説明変数および目的変数をそれぞれ学習用とテスト用に分け、学習用データのみを特性予測モデルへの入力として扱う。その後、学習には用いていない新しいテスト用データを用いて、特性予測モデルの性能評価を行う。なお、製造過程の情報と、分子構造の特徴量と、の関係をモデル化する場合には、実際に試料分子を作成するプロセス条件を説明変数とし、特徴量を目的変数に設定して、モデルの学習を行う。
【0066】
特に、高分子の特性は、化学構造、プロセス条件に対して非線形で複雑な変化を示す場合が多い。すなわち、高分子の原子位置およびその時系列データは、非常に高次元のデータであり、この全てのデータを用いて、プロセス条件や特性の関係を求めることは、高次元の予測モデルを構築することになり、モデル構築に用いる学習データおよび学習コストが膨大になってしまう。一方、分子の平均的な特性(密度、分子量など)を用いた予測モデルでは、学習データや学習コストは低減できるものの、得られる予測精度は高くないものが多い。しかし、本実施例のように、高分子の状態に即した適切な特徴量として、空孔の考え方を採用することにより、学習データや学習コストを低減しつつ、予測精度の高いモデルを構築することができる。
【符号の説明】
【0067】
402:データ入出力装置、404:ネットワークI/O部、406:メモリ、408:CPU、409:バス部、410:解析装置、412:入出力制御部、413:入力デバイス、414:画面表示部、418:ストレージ、420:ネットワーク、501:設定入力部、502:空間分割部、503:原子占有率算出部、504:空孔特定部、505:空孔出力部、506:判定部、507:生存時間算出部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18