(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-10
(54)【発明の名称】高分子グラフニューラルネットワーク及びその実現方法
(51)【国際特許分類】
G16C 20/70 20190101AFI20241203BHJP
G06N 3/04 20230101ALI20241203BHJP
【FI】
G16C20/70
G06N3/04 100
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024531544
(86)(22)【出願日】2023-10-16
(85)【翻訳文提出日】2024-05-27
(86)【国際出願番号】 KR2023015926
(87)【国際公開番号】W WO2024085562
(87)【国際公開日】2024-04-25
(31)【優先権主張番号】10-2022-0134831
(32)【優先日】2022-10-19
(33)【優先権主張国・地域又は機関】KR
(31)【優先権主張番号】10-2023-0136974
(32)【優先日】2023-10-13
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】500239823
【氏名又は名称】エルジー・ケム・リミテッド
(74)【代理人】
【識別番号】110000040
【氏名又は名称】弁理士法人池内アンドパートナーズ
(72)【発明者】
【氏名】ムン、ヒ-ヨン
(72)【発明者】
【氏名】ペ、チェ-スン
(72)【発明者】
【氏名】イ、キュ-ファン
(72)【発明者】
【氏名】シン、ヒョン-ア
(57)【要約】
本発明は、高分子の化学構造から当該高分子の特性情報を予測するコンピューター実現方法を提供する。本発明は、高分子の化学構造をグラフィック的に表わす方法を提供し、高分子の繰り返し単位体を構成する各原子及び繰り返される繰り返し単位体が接続される接続ノードの間の相互間の接続関係を規定する情報を基に、高分子の化学構造を機械学習して、高分子のグラフ情報から当該高分子の特性情報を算出する方法及びシステムを提供する。
【特許請求の範囲】
【請求項1】
高分子の化学構造をコンピューター処理可能なようにデータ化させる方法において、
選択された高分子の繰り返し単位体を構成する各原子を表わすノード及び前記ノードのうち、繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を高分子ノード接続変数として設定する高分子ノード接続変数設定ステップと、
前記設定された高分子ノード接続変数に前記ノード及び前記接続ノードの間の相互間の接続関係の属性値を割り当てる高分子グラフノード接続情報割当てステップと、
を含んでなる、高分子化学構造のデータ処理方法。
【請求項2】
選択された高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの情報を高分子ノード属性変数として設定する高分子ノード属性変数設定ステップと、
前記設定された高分子ノード属性変数に前記ノード及び前記接続ノードの属性値を割り当てる高分子グラフノード属性情報割当てステップと、
をさらに含む、請求項1に記載の高分子化学構造のデータ処理方法。
【請求項3】
選択された高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの情報を高分子エッジ属性変数として設定する高分子エッジ属性変数設定ステップと、
前記設定された高分子エッジ属性変数に前記エッジ及び前記接続エッジの属性値を割り当てる高分子グラフエッジ属性情報割当てステップと、
をさらに含む、請求項2に記載の高分子化学構造のデータ処理方法。
【請求項4】
選択された高分子の化学構造をグラフィック的に記述し、前記高分子の所定の特性を分析するコンピューター実現モデルの生成方法であって、
多数の学習高分子の化学構造情報及び当該高分子の所定の特性情報の既知の値から構成された基本データ取得ステップと、
前記基本データのうち、当該学習高分子の化学構造情報を高分子グラフ情報に変換するデータ前処理過程と、
高分子グラフ情報の入力を受けて当該高分子の所定の特性情報予測値を出力するように高分子特性情報予測人工ニューラルネットワークを構成する高分子特性情報予測人工ニューラルネットワーク構成ステップと、
前記学習高分子の高分子グラフ情報及び前記学習高分子の所定の特性情報を前記高分子特性情報予測人工ニューラルネットワークに入力する学習データ入力ステップと、
前記高分子特性情報予測人工ニューラルネットワークが出力する学習高分子の所定の特性情報予測値と前記学習高分子の所定の特性情報の既知の値との比較結果に基づいて、前記高分子特性情報予測人工ニューラルネットワークのパラメーターを更新する高分子特性情報予測人工ニューラルネットワークの学習ステップと、
を含む、高分子特性分析モデルの生成方法。
【請求項5】
前記高分子グラフ情報は、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である高分子グラフノード接続情報と、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性を表わす情報である高分子ノード属性情報と、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの属性を表わす情報である高分子エッジ属性情報と、
のうちの少なくとも1つ以上を含むことを特徴とする、請求項4に記載の高分子特性分析モデルの生成方法。
【請求項6】
選択された高分子の化学構造をグラフィック的に記述し、前記高分子の所定の特性を分析するコンピューター実現方法であって、
前記選択された高分子と関連する化学構造データに少なくとも部分的に基づいて前記高分子の所定の特性を予測するように機械学習される人工ニューラルネットワークを生成する高分子特性情報算出人工ニューラルネットワーク構成ステップと、
前記選択された高分子の化学構造をグラフィック的なデータにより記述する高分子グラフ情報を取得する高分子グラフ情報取得ステップと、
前記取得された高分子グラフ情報を前記機械学習されたグラフニューラルネットワークの入力として提供する高分子グラフ入力ステップと、
前記選択された高分子の前記所定の特性を記述する予測データを前記機械学習されたグラフニューラルネットワークの出力として受信するステップと、
を含んでなり、
前記選択された高分子の化学構造をグラフ情報により記述する高分子グラフ情報は、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である高分子グラフノード接続情報と、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性を表わす情報である高分子ノード属性情報と、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの属性を表わす情報である高分子エッジ属性情報と、
のうちの少なくとも1つ以上を含むことを特徴とする、コンピューター実現方法。
【請求項7】
前記取得された高分子グラフ情報を前記機械学習されたグラフニューラルネットワークの入力として提供するステップは、
前記単分子を構成するそれぞれの原子を表わす2つ以上のノードの間の相互間の接続関係を表わす隣接行列を構成する高分子隣接行列構成ステップと、
前記構成したグラフ行列を前記グラフニューラルネットワークとして入力する高分子隣接行列入力ステップと、
を含み、
前記高分子隣接行列は、
前記接続ノードと前記ノードとの間の接続関係情報をさらに含むことを特徴とする、請求項6に記載のコンピューター実現方法。
【請求項8】
前記取得された高分子グラフ情報を前記機械学習されたグラフニューラルネットワークの入力として提供するステップは、
前記それぞれのノードの間の結合を表わす1本以上のエッジ及び前記ノードと前記接続ノードとの間の接続を表わす接続エッジの属性情報を含む高分子エッジ属性行列を生成し、かつ入力する高分子エッジ属性行列入力ステップと、
を含むことを特徴とする、請求項7に記載のコンピューター実現方法。
【請求項9】
1台以上のコンピューター装置により、高分子と関連する化学構造データに少なくとも部分的に基づいて前記高分子の所定の特性を予測するように機械学習されたグラフニューラルネットワークを取得するステップは、
1台以上のコンピューター装置により、複数の例示的な高分子の化学構造及び前記例示的な高分子の化学構造を有する前記例示的な高分子の所定の特性を記述する所定の特性ラベル値を含む学習データを取得するステップと、
前記例示的な高分子の化学構造をグラフィック的に記述するグラフ情報を取得してグラフニューラルネットワークに入力し、前記グラフニューラルネットワークが出力する前記例示的な高分子の所定の特性を記述する所定の特性ラベルが出力されるようにグラフニューラルネットワークを学習する学習ステップと、
を含む、請求項6に記載のコンピューター実現方法。
【請求項10】
前記例示的な高分子の化学構造をグラフィック的に記述するグラフ情報は、
前記高分子を形成する単分子を構成するそれぞれの原子を表わす2つ以上のノード情報と、
前記それぞれの原子の間の結合を表わす1つ以上のエッジ情報と、
前記単分子が繰り返して接続される個所である接続ノード情報と、
前記原子と前記接続ノードとの間の接続を表わす接続エッジ情報と、
を含んでなることを特徴とする、請求項9に記載のコンピューター実現方法。
【請求項11】
選択された高分子の化学構造をグラフィック的に記述し、前記高分子の所定の特性を分析するシステムであって、
選択された高分子の化学構造を高分子グラフ情報により表わして高分子グラフ情報の入力を受ける高分子グラフ情報入力部と、
前記高分子グラフ情報から前記選択された高分子の所定の特性情報の予測値を出力する高分子特性情報予測部と、
を備えてなり、
前記高分子グラフ情報は、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である高分子グラフノード接続情報を含み、
前記高分子特性情報予測部は、
前記高分子グラフノード接続情報を含む高分子グラフ情報から、所定の高分子特性情報予測値を出力するように学習された人工ニューラルネットワークを備える、高分子特性情報予測システム。
【請求項12】
前記高分子グラフ情報入力部は、
前記高分子の化学構造を前記高分子グラフ情報に変換し、
前記高分子グラフ情報は、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性を表わす情報である高分子ノード属性情報、及び前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの属性を表わす情報である高分子エッジ属性情報のうちの少なくとも1つ以上をさらに含む、請求項11に記載の高分子特性情報予測システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、高分子の構造をコンピューター装置が認識可能なように表わす方法及びそのシステムに関する。
【背景技術】
【0002】
化合物の構造をコンピューター装置に入力して所定の処理を施すために、化合物構造をコンピューター装置が認識可能なように表わす多種多様な方式が提案されてきている。代表的に、化合物の構造を文字列で表わすSMILES、もしくはSMILESに変換した文字列を記述子により表わす方式が挙げられる。
【0003】
ところが、単量体ではない高分子に対しては、SMILES方式を用いて表わし難いため、BigSMILESや階層的記述子が提案されている。
【0004】
しかしながら、このような従来の技術は、分子が大きくなれば大きくなるほど、その表現方式が益々複雑化し、断片的に高分子を表わすことに留まっており、当該表現に基づいて分子を処理可能な技術がなく、繰り返し単位体が無限に繰り返される高分子の特性をまともに表わすことができないなどの問題があった。
【0005】
これと関連する従来の技術は、下記の通りである。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】大韓民国公開特許公報第2021-0042777号
【特許文献2】大韓民国公開特許公報第2021-0110539号
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、上述した問題を解決するために、高分子物質をグラフィック情報により表わすデータ構造を提供し、さらに、高分子のグラフィック情報を表わすデータ構造を用いて高分子の所定の特性を予測する方法及びシステムを提供することにその目的がある。
【課題を解決するための手段】
【0008】
上述した従来の技術の問題を解決するために、本発明は、高分子の化学構造をコンピューター処理可能なようにデータ化させる方法において、選択された高分子の繰り返し単位体を構成する各原子を表わすノード及び前記ノードのうち、繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を高分子ノード接続変数として設定する高分子ノード接続変数設定ステップと、前記設定された高分子ノード接続変数に前記ノード及び接続ノードの間の相互間の接続関係の属性値を割り当てる高分子グラフノード接続情報割当てステップと、前記設定された高分子ノード接続変数に前記ノード及び接続ノードの間の相互間の接続関係の属性値を割り当てる高分子グラフノード接続情報割当てステップと、を含んでなる高分子化学構造のデータ処理方法を提供する。
【0009】
本発明の高分子化学構造のデータ処理方法は、選択された高分子を形成する繰り返し単位体の構成原子に対応するノードの属性情報及びノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの情報を高分子ノード属性変数として設定する高分子ノード属性変数設定ステップと、前記設定された高分子ノード属性変数に前記ノード及び接続ノードの属性値を割り当てる高分子グラフノード属性情報割当てステップと、をさらに含んでいてもよく、選択された高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及びノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの情報を高分子ノード属性変数として設定する高分子ノード属性変数設定ステップと、前記設定された高分子ノード属性変数に前記ノード及び接続ノードの属性値を割り当てる高分子グラフノード属性情報割当てステップと、 選択された高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの情報を高分子エッジ属性変数として設定する高分子エッジ属性変数設定ステップと、前記設定された高分子エッジ属性変数に前記エッジ及び接続エッジの属性値を割り当てる高分子グラフエッジ属性情報割当てステップと、をさらに含んでいてもよい。
【0010】
また、本発明は、選択された高分子の化学構造をグラフィック的に記述し、前記高分子の所定の特性を分析するコンピューター実現モデルの生成方法であって、多数の学習高分子の化学構造情報及び当該高分子の所定の特性情報の既知の値から構成された基本データ取得ステップと、前記基本データのうち、当該学習高分子の化学構造情報を高分子グラフ情報に変換するデータ前処理過程と、高分子グラフ情報の入力を受けて当該高分子の所定の特性情報予測値を出力するように高分子特性情報予測人工ニューラルネットワークを構成する高分子特性情報予測人工ニューラルネットワーク構成ステップと、前記学習高分子の高分子グラフ情報及び学習高分子の所定の特性情報を前記高分子特性情報予測人工ニューラルネットワークに入力する学習データ入力ステップと、前記高分子特性情報予測人工ニューラルネットワークが出力する学習高分子の所定の特性情報予測値と前記学習高分子の所定の特性情報の既知の値との比較結果に基づいて、前記高分子特性情報予測人工ニューラルネットワークのパラメーターを更新する高分子特性情報予測人工ニューラルネットワークの学習ステップと、を含む高分子特性分析モデルの生成方法を提供し、このとき、前記高分子グラフ情報は、前記高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である高分子グラフノード接続情報と、前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及びノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性を表わす情報である高分子ノード属性情報と、前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの属性を表わす情報である高分子エッジ属性情報と、のうちの少なくとも1つ以上を含むことを特徴とするコンピューター実現方法を提供する。
【0011】
さらに、本発明は、選択された高分子の化学構造をグラフィック的に記述し、前記高分子の所定の特性を分析するコンピューター実現方法であって、前記選択された高分子と関連する化学構造データに少なくとも部分的に基づいて前記高分子の所定の特性を予測するように機械学習される人工ニューラルネットワークを生成する高分子特性情報算出人工ニューラルネットワーク構成ステップと、前記選択された高分子の化学構造をグラフィック的なデータにより記述する高分子グラフ情報を取得する高分子グラフ情報取得ステップと、前記取得された高分子グラフ情報を前記機械学習されたグラフニューラルネットワークの入力として提供する高分子グラフ入力ステップと、前記選択された高分子の前記所定の特性を記述する予測データを前記機械学習されたグラフニューラルネットワークの出力として受信するステップと、を含んでなり、前記選択された高分子の化学構造をグラフ情報により記述する高分子グラフ情報は、前記高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である高分子グラフノード接続情報と、前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及びノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性を表わす情報である高分子ノード属性情報と、前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの属性を表わす情報である高分子エッジ属性情報と、のうちの少なくとも1つ以上を含むことを特徴とする。
【0012】
このとき、前記取得された高分子グラフ情報を前記機械学習されたグラフニューラルネットワークの入力として提供するステップは、前記単分子を構成するそれぞれの原子を表わす2つ以上のノードの間の相互間の接続関係を表わす隣接行列を構成する高分子隣接行列構成ステップと、前記構成したグラフ行列を前記グラフニューラルネットワークとして入力する高分子隣接行列入力ステップと、を含み、前記高分子隣接行列は、前記接続ノードと前記ノードとの間の接続関係情報をさらに含んでいてもよい。
【発明の効果】
【0013】
本発明によれば、高分子をコンピューターにて利用可能なグラフィック的な情報により表わすことが可能なデータ構造を提供することにより、グラフニューラルネットワーク(GNN:Graph Neural Network)、メッセージパッシングニューラルネットワーク(MPNN:Message Passing Neural Network)を用いた高分子物質の分子構造と特性情報との間の関係を機械学習して、高分子物質の特性情報を予測する方法及びシステムを実現することが可能である。また、従来の技術に比べて正確性が向上した高分子特性情報の予測方法及びシステムを提供することが可能になった。
【0014】
本明細書に添付される図面は、本発明の望ましい実施形態を例示するものであり、発明の内容とともに本発明の技術的な思想をさらに理解させる役割のためのものであるため、本発明は図面に記載された事項だけに限定されて解釈されるものではない。
【図面の簡単な説明】
【0015】
【
図1】(a)及び(b)は、従来の技術に係る単量体及び高分子のグラフィック的な表現方式を示す図である。
【
図2】(a)及び(b)は、本発明に係る高分子のグラフィック的な表現を示す図である。
【
図3】(a)及び(b)は、本発明に係る高分子のグラフィック的な表現を説明するための例示図である。
【
図4】(a)及び(b)は、本発明に係る高分子のグラフィック的な表現によるメッセージパッシング(message passing)に基づく学習の進行態様を示す図である。
【
図5】(a)及び(b)は、本発明に係る高分子のグラフィック的な表現を用いて高分子の特性情報を算出する人工ニューラルネットワークを実現する手続きを示す図である。
【
図6】本発明に係る高分子特性情報予測システムを示す図である。
【
図7a】従来の技術及び本発明に係る高分子グラフ情報化の例を示す図である。
【
図7b】従来の技術及び本発明に係る高分子グラフ情報化の例を示す図である。
【
図8a】従来の技術及び本発明に係る高分子グラフ情報化の他の例を示す図である。
【
図8b】従来の技術及び本発明に係る高分子グラフ情報化の他の例を示す図である。
【発明を実施するための形態】
【0016】
1.本発明に係る高分子のグラフ表現方法
【0017】
まず、本発明に係る、高分子をグラフィック的に表わす方式を
図1及び
図2に基づいて説明する。
【0018】
図1の(a)と(b)は、互いに異なる高分子と各高分子を形成する単量体の構造を示す図である。ところが、人工ニューラルネットワークを用いて分子構造データを処理しようとするとき、特に、GNNなどに適用するために分子構造をグラフにより表わそうとするとき、高分子の化学構造を効果的にグラフにより表わす方法がなかった。
【0019】
図1の(a)と(b)に示されている高分子を形成する単量体は互いに異なるものであるが、単量体の末端の一部を除いては互いに同じであるため、その単量体グラフが非常に類似していると表わされるので、高分子のグラフを単に単量体のグラフとして表わし、高分子グラフを単量体グラフの繰り返しであると表わすことは不正確であった。
【0020】
このため、本発明においては、
図2に示されているような新規な方式の高分子のグラフ表現方式を提案する。以下、
図2に基づいて、本発明に係る高分子のグラフ情報表現方式について説明する。
【0021】
まず、本発明の高分子のグラフ表現方式においては、高分子を構成する単量体及び繰り返されて高分子を構成する繰り返し単位体を導き出す。
図1は、従来の高分子の表現の例示及び当該高分子を構成する単量体の表示を示し、
図2は、
図1の高分子を構成する繰り返し単位体を示す図である。
図2の繰り返し単位体において、本発明の高分子の表現方式のために、それぞれの原子をノード(node)10で表わし、前記原子の間の結合をエッジ(edge)20で表わす。次いで、本発明の特徴の1つである、繰り返し単位体がり返して高分子を形成するとき、繰り返し単位体が繰り返して接続される個所を接続点(attach point)30で表わし、接続点が接続されるノードを「接続ノード」で表わす。また、前記接続点(attach point)30は、繰り返し接続される隣接の繰り返し単位体の接続ノードを仮想的に表わしたものであり、前記接続点と前記接続ノードとを接続する接続を接続エッジ(attach edge)40で表わす。
【0022】
このような本発明の高分子のグラフ表現方式によれば、高分子の化学構造を基に人工ニューラルネットワークモデルを学習する場合、特に、メッセージパッシングに基づくMPNN(message passing neural network)、GNN(graph neural network)の人工ニューラルネットワークモデルを適用して学習を進める場合、単量体構造情報に加えて最小限の情報の追加だけでも単量体が接続される反対側のノードの情報が受け渡される学習が可能になり、高分子のユニット繰り返し特性が反映される学習が可能になる。
【0023】
図4は、単量体及び高分子の構造情報を二進木(binary tree)の形式により表わした例であるが、
図4の(a)の単量体二進木に加えて、
図4の(b)に示されているように、接続点木(ツリー)を加えることにより、反対側のノードの情報を含むことになることを示す。
【0024】
2.本発明に係る高分子のグラフ表現をコンピューターにて利用可能なようにデータ化
【0025】
本発明は、上述した高分子の分子構造ないし化学構造をグラフィック的に表わすグラフ表現方式により、高分子の化学構造をコンピューター演算処理に利用可能な形態のデータ構造、すなわち、「グラフ情報(graph data)」に変換する。本発明においては、これを「高分子グラフ情報(polymer graph data)」と称する。
【0026】
本発明に係る、所定のもしくは選択された高分子の化学構造をグラフィック情報により記述する高分子グラフ情報は、前記高分子を形成する単量体の繰り返し単位体を構成するそれぞれの原子を表わす2つ以上のノードを表わすノード10及びノード10と関連するデータであるノード情報(node data)、前記それぞれのノードの間の結合を表わす1本以上のエッジ20と関連するデータであるエッジ情報(edge data)、前記ノードのうち、前記高分子を形成する繰り返し単位体が繰り返して接続される個所である少なくとも1つの接続ノードと関連するデータである接続ノード情報(attaching node data)、前記接続点(attach point)30と前記接続ノードとを接続する接続である接続エッジ(attach edge)40と関連するデータである接続エッジ情報(attach edge data)のうちの少なくとも1つ以上の情報を含んでなる。
【0027】
単量体グラフ情報と本発明の高分子グラフ情報との相違点は、本発明の高分子グラフ情報は、前記単量体グラフ情報を含む繰り返し単位体のグラフ情報の表現において、前記接続点30と接続されるノード10及びそのエッジ情報を接続ノード及び接続エッジにより表わすものであるというところにある。
【0028】
2.1.隣接行列(adjacency matrix)と特性行列(feature matrix)
【0029】
単量体のグラフ構造をコンピューターにて利用可能なようにデータ化させるとき、多種多様なデータの表現方式があり得るが、通常、前記エッジ情報とノード情報をそれぞれ隣接行列と特性行列により表わすことができる。エッジ情報は、原子の間の結合と関連する情報であり、ノード情報は、各原子と関連する情報である。
【0030】
本発明に係る高分子表現方法によれば、従来の単量体グラフ表現方法に加えて、接続点30と接続されるノード及び接続エッジ40の情報をさらに加えて高分子グラフをコンピューターにて認識可能なデータに変換可能である。
【0031】
(1)単量体グラフの隣接行列の表現
【0032】
説明の簡略化のために、
図3に示すような簡単な構造を例にとって説明すれば、ノード1、2、3、4から構成された単量体繰り返し単位体の隣接行列Aは、下記のように表わされ得る。
【0033】
【0034】
隣接行列Aは、ノードの数に見合う分の行と列を有し、各成分A-i,jは、i(i=1, …, 4)番目のノードとj(j=1, …, 4)番目のノードとが接続されているか否かを表わす情報である。各行列成分の値は、他のノードとの接続情報を示す。例えば、ノード1はノード2にのみ接続され、ノード1、3、4とは接続されていないことから、隣接行列のA1,j(j=1, …,4)=[0 1 0 0]で表わされる。
【0035】
(2)本発明に係る高分子グラフの隣接行列の表現
【0036】
本発明の高分子グラフ情報表現方式によれば、
図3の例示に伴う高分子グラフの隣接行列の表現である高分子隣接行列PA(polymer Adjacence matrix)は、下記のように表わすことができる。
【0037】
【0038】
高分子隣接行列PAは、
図3に示されているように、2つの接続点5、6が追加され、これらはそれぞれ隣接単量体のノード4と1を意味するため、ノード1、4は、それぞれノード4、1と接続されたと表わされる。すなわち、単量体においては、ノード1、4が接続されたノードがないため、ノード1とノード4との接続関係を表示する行列値がA
1,4=0、A
4,1=0であったが、本発明の高分子表現方法においては、ノード1、4が隣接単量体のノード4、1にそれぞれ接続されるため、高分子隣接行列PAのPA
1,4=1、PA
4,1=1により表示されて、高分子の繰り返し的な接続情報を含むことになる。すなわち、単量体においては、接続されていなかったノード1、4が高分子においては互いに接続されるので、その接続エッジ情報を表示する高分子隣接行列においては、互いに接続されたと表わすのである。
【0039】
但し、この場合、単量体内においてノード1、4は互いに接続されたものではないため、単量体内における接続ではなく、隣接の繰り返し単位体のノードとの接続であることを表わすために、当該ノード接続関係を負数で表わして高分子隣接行列を下記のように表わしたり、後述するノード特性行列において当該ノードの特性に接続点と接続される「接続ノード」特性を与えたり、エッジ特性行列に隣接の繰り返し単位体接続属性を与えたりして区別することができる。
【0040】
【0041】
再び説明すれば、本発明に係る高分子の化学構造をグラフ化させ、これをグラフィック的なデータにより記述するグラフ情報は、単量体繰り返し単位体のグラフ情報に加えて、単量体が繰り返して接続されるノードである接続ノードを表わす接続ノード情報と前記接続ノードと接続される接続エッジ40の情報をも含むことになる。
【0042】
前記高分子隣接行列PAの表現方式によれば、ノード1、2、3、4から構成される単量体繰り返し単位体が、ノード1、4において隣接の繰り返し単位体のノード4、1にそれぞれ接続されて繰り返されることを表わすことになるのである。但し、このとき、
図3のノード1、4は、単量体内において互いに接続されるものではなく、隣接の繰り返し単位体のノードと接続されるものであるため、これらのノードを「接続ノード」と指定し、ノード特性行列に接続ノード属性を与えたり、エッジ特性行列に隣接の繰り返し単位体接続属性を与えたりして区別することができる。
【0043】
これは、高分子の化学構造をコンピューター処理可能なようにデータ化させるために、埋め込む(embedding)手続きとして活用可能であるが、選択された高分子の単量体繰り返し単位体を構成する各原子を表わすノード及び前記単量体が繰り返して接続される個所である接続ノードの間の相互間の接続関係を高分子接続エッジ変数として設定する高分子エッジ変数設定ステップ及び設定された高分子エッジ変数に前記ノード及び接続ノードの間の相互間の接続関係の属性値を割り当てる高分子グラフエッジ情報割当てステップを用いて成し遂げられる。上記の高分子隣接行列PAから明らかなように、前記ノード及び接続ノードの間の相互間の接続関係の属性値は、接続/非接続を示す「1」、「0」として決定可能であり、これを行列により表わしたのが、前記高分子隣接行列である。本発明の高分子隣接行列は、通常の隣接行列と同様に、その成分値を有し、但し、前述した通り、接続ノードを通常の単分子グラフノードに追加したことにより異なってくる。
【0044】
(3)単量体グラフの特性行列
【0045】
化合物のグラフ表現は、ノードの間の接続関係を示す前記隣接行列の他にも、各ノードの所定の属性情報、各エッジの所定の属性情報を表わす特性行列をグラフ情報として有することができる。
図3の例示的な単量体グラフにおいて各原子の属性値情報(例示的に、3つの属性情報)を有している単量体ノード特性行列は、下記のように表わされ得る。
【0046】
【0047】
ノード特性行列NFは、各ノードの数に見合う分の行と各ノードに対して表わそうとする特性値の種類の数に見合う分の列を有して、各原子の表わそうとする所定の属性を表わすことができる。各成分NFi,jは、i番目のノードのj番目の特性値を有する。前記単量体特性行列NFは、説明のために各ノードが3つの任意の属性値を有する場合を例として記載したものである。
【0048】
単量体グラフは、エッジ特性行列EFによりその情報が表わされ得るが、各行は単量体の各エッジを、各行の列データは各エッジの所定の属性値を表わすように表わされ得る。エッジ属性値としては、化学結合の種類(単一結合、二重結合など)、リングの有無、共役の有無などがあり得る。例えば、
図3の単量体の場合、接続エッジが3本あるため、そのエッジ特性行列は3つの行を有し、情報を収容しようとするエッジ属性値が各列に割り当てられる。3つの任意のエッジ属性値を有するエッジ特性行列の例示は、下記の通りである。
【0049】
【0050】
(4)本発明に係る高分子グラフの特性行列
【0051】
本発明に係る高分子グラフ情報は、上述した単量体ノード特性行列が有する属性値に追加される別途の属性値を有することができる。例えば、
図3の例示的な高分子グラフの特性行列である高分子ノード特性行列PF(Polymer Feature matrix)もまた、下記の例示のように、第3列に追加の属性情報を有することができ、これを各ノードが接続ノードであるか否かを表わす属性値で表わすことができる。例えば、下記の高分子ノード特性行列PNFは、先の4つのノードの3種類の属性情報を収容した前記単量体ノード特性行列NFに加えて、下記のように、第4列に接続ノード属性情報を有することができる。
図3の例示においては、ノード1、4がそれぞれ隣接の繰り返し単位体と接続される接続ノードであるため、「1」の値を有し、他のノードは、第4列において「0」の値を有すると表わされている。
【0052】
【0053】
これは、選択された高分子を形成する単量体の各原子及び前記単量体が繰り返して接続される個所である接続ノードを高分子ノード変数として設定する高分子ノード変数設定ステップと、前記設定された高分子ノード変数に接続される接続ノードを割り当て、各ノードにノード属性値を割り当てる高分子グラフノード情報割当てステップを用いて成し遂げられる。ノードに割り当てられるノード属性値としては、原子番号、混成化(SP3、SP2など)、水素の数、電子の数、リングの有無などがあり得、特に、本発明の一実施形態として、隣接繰り返し単位値に接続されるノードの有無の属性値である接続ノード属性値を有することができる。
【0054】
本発明の他の実施形態として、接続ノード情報は、エッジ特性行列により表わされ得る。例えば、先の高分子ノード特性行列のように、ノード属性値により接続ノードであるか否かを表わす代わりに、あるいは、それと併せて、エッジ特性行列に接続エッジの有無を表わす属性値を表わす。
図3の(b)を表わす下記の例示において、接続ノード1、4を接続するエッジ、すなわち、
図3の(b)においてエッジ5_1、4_6の情報を収容するために、第4行と第5行のデータが追加されており、第4列に接続エッジの有無を表わす属性情報列が追加されていることが分かる。
【0055】
【0056】
すなわち、本発明によれば、高分子の構造をグラフにより表わし、これをコンピューターにて利用可能なようにデータ化させる方法は、下記の方式のうちのいずれか1つ以上から選択され得る。
【0057】
1)少なくとも1つの単量体からなる繰り返し単位体の各ノードの接続関係を表わす隣接行列において、隣接の繰り返し単位体と接続される「接続ノード」の成分を「接続」属性として割り当てる。
【0058】
2)前記繰り返し単位体の各ノードの属性を表わすノード属性行列に、「接続有無」属性フィールドを与え、前記「接続ノード」の「接続有無」属性フィールドに「接続」を割り当てる。
【0059】
3)前記繰り返し単位体のエッジ属性行列に接続ノードに接続されたエッジを接続エッジに追加し、エッジ属性に「接続有無」属性フィールドを与え、接続エッジの当該フィールドに「接続」を割り当てる。
【0060】
2.2.高分子の化学構造をコンピューター処理可能なようにデータ化させる方法
【0061】
本発明においては、後述する人工ニューラルネットワークモデルの学習を行い、かつ、学習された人工ニューラルネットワークを用いて高分子物質の特性を予測するに当たって、高分子物質の化学構造をコンピューター処理可能なようにデータ化させなければならないが、下記のような本発明の方法に従ってデータ化させる。
【0062】
(1)繰り返し単位体情報取得ステップ
【0063】
単量体が繰り返されて高分子を形成する単位である繰り返し単位体情報を取得するステップである。本発明の特徴の1つである、繰り返し単位体において接続ノード情報をデータ化させるために高分子を形成する繰り返し単位体情報を取得する。繰り返し単位体情報は、繰り返されて高分子を形成する繰り返し単位体が単一の単量体としてもしくは単一の単量体の結合として繰り返されるか否かを確認し、当該繰り返し単位体をグラフィック的な表現により記述するステップである。繰り返し単位体は、
図2の(a)に示されているように単一の単量体である場合と
図2の(b)に示されているように2つの単量体が接続された場合とがあり得る。
図2の(b)に示すような場合は、既に隣接しているノードが接続点(attach point)となる場合である。
【0064】
(2)高分子グラフノード接続情報割当てステップ
【0065】
本発明において高分子グラフ情報を処理する方法は、分析の対象として選択された高分子の繰り返し単位体を構成する各原子を表わすノード及び前記ノードのうち、繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を変数として設定する過程を有する。
【0066】
このようにして設定された高分子ノード接続変数に前記ノード及び接続ノードの間の相互間の接続関係の属性値を割り当てる。高分子ノード接続変数に各接続関係の属性値を割り当てることは、以上において例として挙げた高分子隣接行列を活用することができる。
【0067】
(3)高分子グラフノード属性情報割当てステップ
【0068】
また、本発明の高分子グラフ情報処理方法は、選択された高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及びノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性情報を高分子ノード属性変数として設定する高分子ノード属性変数設定ステップを有することができる。
【0069】
このようにして設定された高分子ノード属性変数に前記ノード及び接続ノードの属性値を割り当てる高分子グラフノード属性情報割当てステップをさらに有する。ノード属性情報は、当該ノードが接続ノードであるか否かを表示する属性値を有し、接続ノードのノード属性情報として、接続ノードではないノードとは異なり、高分子内において隣り合う繰り返し単位体の接続ノードと接続されることを表示する接続ノード属性値が与えられる。
【0070】
(4)高分子グラフエッジ属性情報割当てステップ
【0071】
さらに、本発明の高分子グラフ情報処理方法は、選択された高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの情報を高分子エッジ属性変数として設定する高分子エッジ属性変数設定ステップを有することができる。接続エッジは、接続ノードと他のノードとを接続するエッジである。
【0072】
さらにまた、本発明は、前記設定された高分子エッジ属性変数に前記エッジ及び接続エッジの属性値を割り当てる高分子グラフエッジ属性情報割当てステップを有し、接続エッジには、そのエッジ属性変数として、接続ノードと他のノードとを接続することを意味する接続エッジ属性値が割り当てられる。
【0073】
<実施例及び比較例>
【0074】
上述した本発明に係る高分子グラフ情報の表現例について説明する。
【0075】
図7aは、高分子の例としてポリエチレンテレフタレート(PET:Polyethylene Terephthalate)の分子構造を従来の技術に従ってグラフ情報により表わした方式を示し、
図7bは、本発明に係る高分子グラフ情報の表現方式を示す。
【0076】
従来の方式によれば、
図7aに示されているように、高分子の単位体構造のみをグラフに変換する。このとき、ノード特性行列のノード属性値としては、原子番号、リングの有無、水素の数が使われた。エッジ特性行列は、結合の種類、芳香族の如何、共役の有無をエッジ属性値として有する。
【0077】
これに対し、本発明に係るグラフ情報の表現方式は、
図7bに示されているように、ノード特性行列のノード属性値として、接続ノード属性情報をさらに有し、例示においてノード1とノード14とが接続されるため、接続ノード属性情報値として「1」を有する。エッジ特性行列は、接続エッジ属性情報としてさらにエッジ属性値を有し、接続エッジ「14-1」が接続エッジとして属性情報「1」を有する。
【0078】
図8は、他の高分子として、ポリビニルベンジルクロリド(PVBC:poly vinyl benzyl chloride)の分子構造をグラフ情報化させる例を示す。
【0079】
図8aは、従来の技術に係る方法により表わした隣接行列、ノード特性行列、エッジ特性行列を示す。
【0080】
図8bは、本発明に係る方法であって、PVBCの分子構造をグラフ情報化させた例を示すものであって、
図8aの従来の技術に係る方法に比べて、ノード特性行列が接続ノード属性情報をさらに有し、例示においてノード1、2、11、12が接続ノードとなるため、これらのノードのノード属性情報値を「1」として設定する。PVBCのように、繰り返し単位体の既に隣接しているノードが接続点(attach point)となる場合、2つの単量体が接続された繰り返し単位体を用いてグラフ情報に変換する。これは、
図2の(b)と関連して説明したような場合である。図示のごとく、エッジ特性行列は、接続エッジ属性情報をさらに含み、接続エッジ「2-11」、「1-12」の接続エッジ属性情報を「1」として設定した。
【0081】
3.本発明に係る高分子のグラフ表現を用いた高分子特性の分析方法
【0082】
以下では、上述した本発明の高分子のグラフ表現方法に従い、人工ニューラルネットワークにおいて高分子データを処理する方法について説明する。
【0083】
本発明は、上述した高分子のグラフ表現方法を適用して高分子の所定の特性を分析する人工ニューラルネットワークモデルを構成し、機械学習して高分子の所定の特性を算出する方法を提供する。
【0084】
3.1.高分子特性分析モデルの生成方法
【0085】
図5の(a)は、本発明に係る高分子特性分析モデルの生成方法を示す。これに基づいて、本発明のグラフ情報の表現方式に従い、選択された高分子の化学構造から当該高分子の所定の特性情報を予測するコンピューター実現高分子特性分析モデルの生成方法について説明する。
【0086】
(1)学習データ用意過程(T10)
【0087】
まず、任意の所定の特性情報が既知である多数の学習高分子の化学構造情報及び当該高分子の所定の既知の特性情報から構成された基本データから、前記学習高分子の化学構造情報を上述した方式により本発明の高分子グラフ情報に変換する学習データ用意過程(T10)を有する。これは、基本データのデータ前処理過程に相当する。このようにして用意された学習データは、{学習高分子グラフ情報、当該高分子の既知の所定の特性情報}を1つの組とする多数のデータセットから構成され得る。ここで、高分子の既知の所定の特性情報とは、高分子の特性情報の実測値、実際の値もしくは定められた特性情報のことを意味する。
【0088】
(2)人工ニューラルネットワークの構築及び学習データ入力ステップ(T20)
【0089】
次いで、学習データを用いて学習させるべき人工ニューラルネットワークモデルを構築する。本発明における人工ニューラルネットワークモデルとしては、公知の人工ニューラルネットワークモデルを使用し、特に、メッセージパッシングに基づくMPNN(message passing neural network)、GNN(graph neural network)の人工ニューラルネットワークモデルを適用することができる。
【0090】
例えば、GNNを適用する場合、教師あり学習の場合を説明すれば、グラフニューラルネットワーク(GNN)モデルに、先において構成された{高分子グラフ情報、当該高分子の所定の特性情報}の組からなる分子学習データを入力する。前記高分子の所定の特性情報としては、例えば、高分子の屈折率、ガラス転移温度、密度などが挙げられる。
【0091】
このとき、高分子グラフ情報は、ニューラルネットワークモデルの入力値であって、当該高分子の所定の特性情報は、出力値の真値(labeled data)として入力される。このとき、入力される高分子グラフ情報は、前述した高分子グラフノード接続情報、高分子グラフノード属性情報、高分子グラフエッジ属性情報のうちの少なくとも1つ以上を含み、高分子隣接行列、高分子ノード/エッジ特性行列に埋め込まれて入力可能である。
【0092】
(3)人工ニューラルネットワークモデルの学習ステップ(T30)
【0093】
入力された高分子グラフ情報及び高分子の所定の特性情報に基づいて、ニューラルネットワークモデルのパラメーターを更新してニューラルネットワークモデルを学習する過程である。ニューラルネットワークの学習過程は、公知のニューラルネットワークモデル学習過程に準拠し、一例として、前記高分子グラフ情報の入力を受けてニューラルネットワークモデルから算出される高分子の特性情報予測値と学習データのうちの当該高分子の所定の特性情報との差分として定義される誤差関数が最小となるように人工ニューラルネットワークのパラメーターが更新される。
【0094】
3.2.高分子特性の分析方法
【0095】
前述した本発明の高分子特性分析モデルの生成方法に従い生成された人工ニューラルネットワークに選択された高分子のグラフ情報を入力して選択された高分子の特性情報を予測する方法である。
図5(b)に基づいて説明する。
【0096】
(1)高分子グラフ情報化前処理過程(S10)
【0097】
特性情報を予測しようとする選択された高分子の化学構造から高分子グラフ情報を取得する前処理過程を行う。高分子グラフ情報は、前述した通り、高分子を構成する単量体のノード及びエッジ情報に加えて、繰り返される単量体の間の接続ノードと接続エッジ40の情報を含む。すなわち、高分子グラフ情報は、上述した高分子グラフノード接続情報、高分子グラフノード属性情報、高分子グラフエッジ属性情報のうちの少なくとも1つ以上を含むように前処理される。
【0098】
(2)高分子グラフ情報入力ステップ(S20)
【0099】
選択された高分子の化学構造に基づく高分子グラフ情報を先に学習したニューラルネットワークモデルに入力するステップである。このとき、入力される高分子グラフ情報は、上述した高分子グラフノード接続情報、高分子グラフノード属性情報、高分子グラフエッジ属性情報のうちの少なくとも1つ以上を含み、前述した高分子隣接行列、高分子ノード/エッジ特性行列に埋め込まれて入力可能である。
【0100】
(3)高分子特性情報予測ステップ(S30)
【0101】
入力された選択された高分子の高分子グラフ情報から選択された高分子の特性情報を前記学習された人工ニューラルネットワークモデルにより算出して出力するステップである。
【0102】
4.本発明に係る高分子特性情報予測システム300
【0103】
図6に基づいて、本発明に係る高分子特性情報予測システムについて説明する。
【0104】
(1)高分子グラフ情報入力部100
【0105】
高分子グラフデータ入力部100は、選択された高分子の化学構造をグラフィック的なデータにより記述する高分子グラフ情報に変換して入力を受ける構成要素である。
【0106】
高分子グラフ入力部100は、特性情報を予測しようとする選択された高分子の化学構造から高分子グラフ情報を取得する高分子グラフ情報取得部110を備える。
【0107】
高分子グラフ情報取得部110は、前述したような高分子を構成する単量体のノード及びエッジ情報に加えて、繰り返される繰り返し単位体の間の接続ノードと接続エッジ情報をそれぞれの変数に割り当てて処理して高分子グラフ情報を生成する。すなわち、高分子グラフ情報は、上述した高分子グラフノード接続情報、高分子グラフノード属性情報、高分子グラフエッジ属性情報のうちの少なくとも1つ以上を含んでなるデータセットであり、高分子グラフ接続情報は、高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である。
【0108】
高分子グラフ入力部100は、高分子グラフ情報を後述する人工ニューラルネットワークモデル部200に入力するに当たって、高分子の単分子を構成するそれぞれの原子を表わす2つ以上のノードの間の相互間の接続関係及び前記接続ノードと前記ノードとの間の接続関係情報を表わす高分子隣接行列、前記それぞれのノードの間の結合を表わす1本以上のエッジ及び前記ノードと接続ノードとの間の接続を表わす接続エッジの属性情報を含む高分子エッジ属性行列を生成して入力する行列変換部120をさらに備えていてもよい。
【0109】
このとき、前記高分子グラフ情報は、前述した通り、前記高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である高分子グラフノード接続情報、前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及びノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性を表わす情報である高分子ノード属性情報及び前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの属性を表わす情報である高分子エッジ属性情報のうちの少なくとも1つ以上を含んでいてもよい。
【0110】
(2)高分子特性情報予測部200
【0111】
高分子特性情報予測部200は、前記高分子グラフ情報から前記高分子の所定の特性情報を予測して算出するように学習された人工ニューラルネットワーク210を備えてなる。
【0112】
前記人工ニューラルネットワークは、前述した高分子グラフ情報の入力を受けて当該高分子の所定の特性情報予測値を出力するように構成され、所定の学習高分子の高分子グラフ情報から前記高分子の所定の特性情報の予測値を算出し、特性情報のラベル値との差分として定義される誤差関数が最小となるように前述した手続きに従ってニューラルネットワークのパラメーターを更新して機械学習されたものである。
【0113】
(3)コンピューター装置
【0114】
本発明に係る高分子特性情報予測システム300は、単一の演算システムもしくは多数の演算システムがネットワークにより結ばれたコンピューター装置から構成され得る。コンピューター装置は、上述した高分子グラフ情報入力部100及び高分子特性情報予測部200をコンピューター装置を構成するメモリ装置310、演算装置320から構成し得る。すなわち、コンピューター装置300は、メモリ装置310及び演算装置320を備えてなり、上述した高分子グラフ情報入力部100及び高分子特性情報予測部200は、メモリ装置310及び演算装置320の所定の機能及び部分を占めてなる。
【0115】
前記高分子グラフ情報入力部100及び高分子特性情報予測部200は、前記高分子グラフ情報を生成し、かつ処理するに当たって、前記コンピューター装置のメモリ装置310に記憶され、前記演算装置320から読み込んで各手続きを行うコンピューターアルゴリズムを含んでなり得るか、あるいは、前記コンピューターアルゴリズムから構成され得る。
【0116】
本発明の説明の欄において使われている図面の符号及び各名称は、下記の通りである。
【符号の説明】
【0117】
10…ノード
20…エッジ
30…接続点
40…接続エッジ
100…高分子グラフ情報入力部
110…高分子グラフ情報取得部
120…行列変換部
200…高分子特性情報予測部
210…人工ニューラルネットワーク
310…メモリ装置
320…演算装置
【手続補正書】
【提出日】2024-05-27
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
高分子の化学構造をコンピューター処理可能なようにデータ化させる方法において、
選択された高分子の繰り返し単位体を構成する各原子を表わすノード及び前記ノードのうち、繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を高分子ノード接続変数として設定する高分子ノード接続変数設定ステップと、
前記設定された高分子ノード接続変数に前記ノード及び前記接続ノードの間の相互間の接続関係の属性値を割り当てる高分子グラフノード接続情報割当てステップと、
を含んでなる、高分子化学構造のデータ処理方法。
【請求項2】
選択された高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの情報を高分子ノード属性変数として設定する高分子ノード属性変数設定ステップと、
前記設定された高分子ノード属性変数に前記ノード及び前記接続ノードの属性値を割り当てる高分子グラフノード属性情報割当てステップと、
をさらに含む、請求項1に記載の高分子化学構造のデータ処理方法。
【請求項3】
選択された高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの情報を高分子エッジ属性変数として設定する高分子エッジ属性変数設定ステップと、
前記設定された高分子エッジ属性変数に前記エッジ及び前記接続エッジの属性値を割り当てる高分子グラフエッジ属性情報割当てステップと、
をさらに含む、請求項2に記載の高分子化学構造のデータ処理方法。
【請求項4】
選択された高分子の化学構造をグラフィック的に記述し、前記高分子の所定の特性を分析するコンピューター実現モデルの生成方法であって、
多数の学習高分子の化学構造情報及び当該
学習高分子の所定の特性情報の既知の値から構成された基本データ取得ステップと、
前記基本データのうち、当該学習高分子の化学構造情報を高分子グラフ情報に変換するデータ前処理過程と、
高分子グラフ情報の入力を受けて当該高分子の所定の特性情報予測値を出力するように高分子特性情報予測人工ニューラルネットワークを構成する高分子特性情報予測人工ニューラルネットワーク構成ステップと、
前記学習高分子の高分子グラフ情報及び前記学習高分子の所定の特性情報を前記高分子特性情報予測人工ニューラルネットワークに入力する学習データ入力ステップと、
前記高分子特性情報予測人工ニューラルネットワークが出力する学習高分子の所定の特性情報予測値と前記学習高分子の所定の特性情報の既知の値との比較結果に基づいて、前記高分子特性情報予測人工ニューラルネットワークのパラメーターを更新する高分子特性情報予測人工ニューラルネットワークの学習ステップと、
を含む、高分子特性分析モデルの生成方法。
【請求項5】
前記高分子グラフ情報は、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である高分子グラフノード接続情報と、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性を表わす情報である高分子ノード属性情報と、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの属性を表わす情報である高分子エッジ属性情報と、
のうちの少なくとも1つ以上を含むことを特徴とする、請求項4に記載の高分子特性分析モデルの生成方法。
【請求項6】
選択された高分子の化学構造をグラフィック的に記述し、前記高分子の所定の特性を分析するコンピューター実現方法であって、
前記選択された高分子と関連する化学構造データに少なくとも部分的に基づいて前記高分子の所定の特性を予測するように機械学習される人工ニューラルネットワークを生成する高分子特性情報算出人工ニューラルネットワーク構成ステップと、
前記選択された高分子の化学構造をグラフィック的なデータにより記述する高分子グラフ情報を取得する高分子グラフ情報取得ステップと、
前記取得された高分子グラフ情報を前記機械学習されたグラフニューラルネットワークの入力として提供する高分子グラフ
情報入力ステップと、
前記選択された高分子の前記所定の特性を記述する予測データを前記機械学習されたグラフニューラルネットワークの出力として受信するステップと、
を含んでなり、
前記選択された高分子の化学構造をグラフ情報により記述する高分子グラフ情報は、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である高分子グラフノード接続情報と、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性を表わす情報である高分子ノード属性情報と、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの属性を表わす情報である高分子エッジ属性情報と、
のうちの少なくとも1つ以上を含むことを特徴とする、コンピューター実現方法。
【請求項7】
前記取得された高分子グラフ情報を前記機械学習されたグラフニューラルネットワークの入力として提供する
高分子グラフ情報入力ステップは、
前記
高分子を形成する単分子を構成するそれぞれの原子を表わす2つ以上のノードの間の相互間の接続関係を表わす隣接行列を構成する高分子隣接行列構成ステップと、
前記構成した
高分子隣接行列を前記グラフニューラルネットワークとして入力する高分子隣接行列入力ステップと、
を含み、
前記高分子隣接行列は、
前記接続ノードと前記ノードとの間の接続関係情報をさらに含むことを特徴とする、請求項6に記載のコンピューター実現方法。
【請求項8】
前記取得された高分子グラフ情報を前記機械学習されたグラフニューラルネットワークの入力として提供する
高分子グラフ情報入力ステップは、
前記それぞれのノードの間の結合を表わす1本以上のエッジ及び前記ノードと前記接続ノードとの間の接続を表わす接続エッジの属性情報を含む高分子エッジ属性行列を生成し、かつ入力する高分子エッジ属性行列入力ステップと、
を含むことを特徴とする、請求項7に記載のコンピューター実現方法。
【請求項9】
1台以上のコンピューター装置により、高分子と関連する化学構造データに少なくとも部分的に基づいて前記高分子の所定の特性を予測するように機械学習されたグラフニューラルネットワークを取得するステップは、
1台以上のコンピューター装置により、複数の例示的な高分子の化学構造及び前記例示的な高分子の化学構造を有する前記例示的な高分子の所定の特性を記述する所定の特性ラベル値を含む学習データを取得するステップと、
前記例示的な高分子の化学構造をグラフィック的に記述するグラフ情報を取得してグラフニューラルネットワークに入力し、前記グラフニューラルネットワークが出力する前記例示的な高分子の所定の特性を記述する所定の特性ラベルが出力されるようにグラフニューラルネットワークを学習する学習ステップと、
を含む、請求項6に記載のコンピューター実現方法。
【請求項10】
前記例示的な高分子の化学構造をグラフィック的に記述するグラフ情報は、
前記高分子を形成する単分子を構成するそれぞれの原子を表わす2つ以上のノード情報と、
前記それぞれの原子の間の結合を表わす1つ以上のエッジ情報と、
前記単分子が繰り返して接続される個所である接続ノード情報と、
前記原子と前記接続ノードとの間の接続を表わす接続エッジ情報と、
を含んでなることを特徴とする、請求項9に記載のコンピューター実現方法。
【請求項11】
選択された高分子の化学構造をグラフィック的に記述し、前記高分子の所定の特性を分析するシステムであって、
選択された高分子の化学構造を高分子グラフ情報により表わして高分子グラフ情報の入力を受ける高分子グラフ情報入力部と、
前記高分子グラフ情報から前記選択された高分子の所定の特性情報の予測値を出力する高分子特性情報予測部と、
を備えてなり、
前記高分子グラフ情報は、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノード及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの間の相互間の接続関係を表わす情報である高分子グラフノード接続情報を含み、
前記高分子特性情報予測部は、
前記高分子グラフノード接続情報を含む高分子グラフ情報から、所定の高分子特性情報予測値を出力するように学習された人工ニューラルネットワークを備える、高分子特性情報予測システム。
【請求項12】
前記高分子グラフ情報入力部は、
前記高分子の化学構造を前記高分子グラフ情報に変換し、
前記高分子グラフ情報は、
前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードの属性情報及び前記ノードのうち、前記繰り返し単位体が繰り返して接続される個所である接続点に接続される接続ノードの属性を表わす情報である高分子ノード属性情報、及び前記高分子を形成する繰り返し単位体を構成する各原子に対応するノードを互いに接続するエッジ及び前記ノードのうちの少なくとも1つと前記接続ノードとを接続する接続エッジの属性を表わす情報である高分子エッジ属性情報のうちの少なくとも1つ以上をさらに含む、請求項11に記載の高分子特性情報予測システム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0105
【補正方法】変更
【補正の内容】
【0105】
高分子グラフ情報入力部100は、選択された高分子の化学構造をグラフィック的なデータにより記述する高分子グラフ情報に変換して入力を受ける構成要素である。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0106
【補正方法】変更
【補正の内容】
【0106】
高分子グラフ情報入力部100は、特性情報を予測しようとする選択された高分子の化学構造から高分子グラフ情報を取得する高分子グラフ情報取得部110を備える。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0108
【補正方法】変更
【補正の内容】
【0108】
高分子グラフ情報入力部100は、高分子グラフ情報を後述する人工ニューラルネットワーク210に入力するに当たって、高分子の単分子を構成するそれぞれの原子を表わす2つ以上のノードの間の相互間の接続関係及び前記接続ノードと前記ノードとの間の接続関係情報を表わす高分子隣接行列、前記それぞれのノードの間の結合を表わす1本以上のエッジ及び前記ノードと接続ノードとの間の接続を表わす接続エッジの属性情報を含む高分子エッジ属性行列を生成して入力する行列変換部120をさらに備えていてもよい。
【国際調査報告】