IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立化成株式会社の特許一覧

特許7571781情報処理システム、情報処理方法、および情報処理プログラム
<>
  • 特許-情報処理システム、情報処理方法、および情報処理プログラム 図1
  • 特許-情報処理システム、情報処理方法、および情報処理プログラム 図2
  • 特許-情報処理システム、情報処理方法、および情報処理プログラム 図3
  • 特許-情報処理システム、情報処理方法、および情報処理プログラム 図4
  • 特許-情報処理システム、情報処理方法、および情報処理プログラム 図5
  • 特許-情報処理システム、情報処理方法、および情報処理プログラム 図6
  • 特許-情報処理システム、情報処理方法、および情報処理プログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-15
(45)【発行日】2024-10-23
(54)【発明の名称】情報処理システム、情報処理方法、および情報処理プログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20241016BHJP
   G16C 20/70 20190101ALI20241016BHJP
【FI】
G06N20/00
G16C20/70
【請求項の数】 11
(21)【出願番号】P 2022501762
(86)(22)【出願日】2021-02-02
(86)【国際出願番号】 JP2021003767
(87)【国際公開番号】W WO2021166634
(87)【国際公開日】2021-08-26
【審査請求日】2023-12-04
(31)【優先権主張番号】P 2020025017
(32)【優先日】2020-02-18
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004455
【氏名又は名称】株式会社レゾナック
(74)【代理人】
【識別番号】100088155
【弁理士】
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100128381
【弁理士】
【氏名又は名称】清水 義憲
(74)【代理人】
【識別番号】100169454
【弁理士】
【氏名又は名称】平野 裕之
(74)【代理人】
【識別番号】100144440
【弁理士】
【氏名又は名称】保坂 一之
(72)【発明者】
【氏名】花岡 恭平
【審査官】大倉 崚吾
(56)【参考文献】
【文献】特開平08-006646(JP,A)
【文献】特開2019-008571(JP,A)
【文献】特開2001-045307(JP,A)
【文献】特開2019-179319(JP,A)
【文献】ZENG, Minggang et al.,"Graph Convolutional Neural Networks for Polymers Property Prediction",arXiv [online],2018年,p. 1-7,[2024年07月22日検索],インターネット<URL:https://arxiv.org/abs/1811.06231v1>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00- 99/00
C08L 101/00-101/16
G16C 20/30
G16C 20/70
(57)【特許請求の範囲】
【請求項1】
少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得し、
前記複数の成分オブジェクトに対応する複数の前記数値表現を機械学習モデルに入力することで、前記複数の成分オブジェクトのそれぞれの特徴ベクトルを算出し、
前記機械学習モデルに関連して、前記複数の成分オブジェクトに対応する複数の前記複合比の適用を実行し、
前記複数の複合比が反映された複数の前記特徴ベクトルを集約関数に入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出し、
前記複合特徴ベクトルを出力する、
情報処理システム。
【請求項2】
少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得し、
前記複数の成分オブジェクトに対応する複数の前記数値表現を第1機械学習モデルに入力することで、前記複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出し、
複数の前記第1特徴ベクトルを第2機械学習モデルに入力することで、前記複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出し、
前記第1機械学習モデルおよび前記第2機械学習モデルから選択される少なくとも一つの機械学習モデルに関連して、前記複数の成分オブジェクトに対応する複数の前記複合比の適用を実行し、
前記複数の複合比が反映された複数の前記第2特徴ベクトルを集約関数に入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出し、
前記複合特徴ベクトルを出力する、
情報処理システム。
【請求項3】
前記第1機械学習モデルが、非定型データである前記数値表現から、固定長ベクトルである前記第1特徴ベクトルを生成する機械学習モデルである、
請求項に記載の情報処理システム。
【請求項4】
前記機械学習モデルに関連した前記複数の複合比の適用が、前記機械学習モデルの中間層の出力データに前記複数の複合比を適用することである、
請求項1~3のいずれか一項に記載の情報処理システム。
【請求項5】
前記少なくとも一つのプロセッサが、
前記複合特徴ベクトルを別の機械学習モデルに入力することで、前記複合オブジェクトの特性の予測値を算出し、
前記予測値を出力する、
請求項1~4のいずれか一項に記載の情報処理システム。
【請求項6】
前記成分オブジェクトが材料であり、前記複合オブジェクトが多成分物質である、
請求項1~5のいずれか一項に記載の情報処理システム。
【請求項7】
前記材料がポリマーであり、前記多成分物質がポリマーアロイである、
請求項に記載の情報処理システム。
【請求項8】
少なくとも一つのプロセッサを備える情報処理システムにより実行される情報処理方法であって、
複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現を機械学習モデルに入力することで、前記複数の成分オブジェクトのそれぞれの特徴ベクトルを算出するステップと、
前記機械学習モデルに関連して、前記複数の成分オブジェクトに対応する複数の前記複合比の適用を実行するステップと、
前記複数の複合比が反映された複数の前記特徴ベクトルを集約関数に入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
を含む情報処理方法。
【請求項9】
少なくとも一つのプロセッサを備える情報処理システムにより実行される情報処理方法であって、
複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現を第1機械学習モデルに入力することで、前記複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出するステップと、
複数の前記第1特徴ベクトルを第2機械学習モデルに入力することで、前記複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出するステップと、
前記第1機械学習モデルおよび前記第2機械学習モデルから選択される少なくとも一つの機械学習モデルに関連して、前記複数の成分オブジェクトに対応する複数の前記複合比の適用を実行するステップと、
前記複数の複合比が反映された複数の前記第2特徴ベクトルを集約関数に入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
を含む情報処理方法。
【請求項10】
複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現を機械学習モデルに入力することで、前記複数の成分オブジェクトのそれぞれの特徴ベクトルを算出するステップと、
前記機械学習モデルに関連して、前記複数の成分オブジェクトに対応する複数の前記複合比の適用を実行するステップと、
前記複数の複合比が反映された複数の前記特徴ベクトルを集約関数に入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
をコンピュータに実行させる情報処理プログラム。
【請求項11】
複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現を第1機械学習モデルに入力することで、前記複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出するステップと、
複数の前記第1特徴ベクトルを第2機械学習モデルに入力することで、前記複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出するステップと、
前記第1機械学習モデルおよび前記第2機械学習モデルから選択される少なくとも一つの機械学習モデルに関連して、前記複数の成分オブジェクトに対応する複数の前記複合比の適用を実行するステップと、
前記複数の複合比が反映された複数の前記第2特徴ベクトルを集約関数に入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
をコンピュータに実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の一側面は情報処理システム、情報処理方法、および情報処理プログラムに関する。
【背景技術】
【0002】
複数の成分オブジェクトを複合させることで得られる複合オブジェクトを、機械学習を用いて解析する手法が用いられている。例えば、特許文献1には、生体高分子の立体構造と化合物の立体構造との結合性を予測する方法が記載されている。この方法は、生体高分子の立体構造と化合物の立体構造とに基づいて生体高分子と化合物との複合体の予測立体構造を生成するステップと、その予測立体構造を、相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、機械学習アルゴリズムを用いてその予測立体構造ベクトルを判別することによって生体高分子の立体構造と化合物の立体構造との結合性を予測するステップとを含む。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-28879号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
成分オブジェクトが多様であったり多数存在したりする場合には、これらの成分オブジェクトについて十分な量のデータを用意することができず、その結果、複合オブジェクトの解析の精度が、期待する水準に達しない可能性がある。そこで、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げるための仕組みが望まれている。
【課題を解決するための手段】
【0005】
本開示の一側面に係る情報処理システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得し、複数の成分オブジェクトに対応する複数の数値表現および複数の複合比に基づいて、機械学習と該複数の複合比の適用とを実行することで、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
【0006】
本開示の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される。情報処理方法は、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現および複数の複合比に基づいて、機械学習と該複数の複合比の適用とを実行することで、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとを含む。
【0007】
本開示の一側面に係る情報処理プログラムは、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現および複数の複合比に基づいて、機械学習と該複数の複合比の適用とを実行することで、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとをコンピュータに実行させる。
【0008】
このような側面においては、各成分オブジェクトについて機械学習と複合比の適用とが実行されるので、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。
【発明の効果】
【0009】
本開示の一側面によれば、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることができる。
【図面の簡単な説明】
【0010】
図1】実施形態に係る情報処理システムを構成するコンピュータのハードウェア構成の一例を示す図である。
図2】実施形態に係る情報処理システムの機能構成の一例を示す図である。
図3】実施形態に係る情報処理システムの動作の一例を示すフローチャートである。
図4】複合特徴ベクトルを算出する手順の一例を示す図である。
図5】機械学習の途中において複合比を適用する一例を示す図である。
図6】複合特徴ベクトルを算出する手順の具体例を示す図である。
図7】複合特徴ベクトルを算出する手順の他の例を示す図である。
【発明を実施するための形態】
【0011】
以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
【0012】
[システムの概要]
実施形態に係る情報処理システム10は、複数の成分オブジェクトを所与の複合比で複合させることで得られる複合オブジェクトに関する解析を実行するコンピュータシステムである。成分オブジェクトとは、複合オブジェクトを生成するために用いられる有体物または無体物のことをいう。複合オブジェクトは有体物または無体物であり得る。有体物の例として任意の物質または物体が挙げられる。無体物の例としてデータおよび情報が挙げられる。「複数の成分オブジェクトを複合させる」とは、複数の成分オブジェクトを一つのオブジェクト、すなわち複合オブジェクトにする処理のことをいう。複合させる手法は限定させず、例えば、配合、調合、合成、結合、混合、合併、組合せ、化合、または合体でもよいし、他の手法でもよい。複合オブジェクトに関する解析とは、複合オブジェクトの何らかの特徴を示すデータを得るための処理のことをいう。
【0013】
複数の成分オブジェクトは任意の複数種類の材料でもよく、この場合には、複合オブジェクトはそれらの材料によって生成される多成分物質である。材料とは多成分物質を生成するために用いられる任意の構成要素である。例えば、複数の材料は任意の複数種類の分子、原子、分子構造、結晶構造、またはアミノ酸配列でもよく、この場合には、複合オブジェクトは、それらの分子、原子、分子構造、結晶構造、またはアミノ酸配列を任意の手法で複合することにより得られる多成分物質である。例えば、材料はポリマーでもよく、これに対応して、多成分物質はポリマーアロイでもよい。材料はモノマーでもよく、これに対応して、多成分物質はポリマーでもよい。材料は薬物、すなわち、薬理作用を有する化学物質でもよく、これに対応して、多成分物質は薬剤でもよい。
【0014】
情報処理システム10は複合オブジェクトに関する解析のために機械学習を実行する。機械学習とは、与えられた情報に基づいて学習することで法則またはルールを自律的に見つけ出す手法である。機械学習の具体的な手法は限定されない。例えば、情報処理システム10は、ニューラルネットワークを含んで構成される計算モデルである機械学習モデルを用いた機械学習を実行してもよい。ニューラルネットワークとは、人間の脳神経系の仕組みを模した情報処理のモデルのことをいう。より具体的な例として、情報処理システム10は、グラフニューラルネットワーク(GNN)、畳み込みニューラルネットワーク(CNN)、再帰型ニューラルネットワーク(RNN)、アテンションRNN(Attention RNN)、およびマルチヘッド・アテンション(Multi-Head Attention)のうちの少なくとも一つを用いて機械学習を実行してもよい。
【0015】
[システムの構成]
情報処理システム10は1台以上のコンピュータで構成される。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの情報処理システム10が構築される。
【0016】
図1は、情報処理システム10を構成するコンピュータ100の一般的なハードウェア構成の一例を示す図である。例えば、コンピュータ100は、オペレーティングシステム、アプリケーション・プログラム等を実行するプロセッサ(例えばCPU)101と、ROMおよびRAMで構成される主記憶部102と、ハードディスク、フラッシュメモリ等で構成される補助記憶部103と、ネットワークカードまたは無線通信モジュールで構成される通信制御部104と、キーボード、マウス等の入力装置105と、モニタ等の出力装置106とを備える。
【0017】
情報処理システム10の各機能要素は、プロセッサ101または主記憶部102の上に予め定められたプログラムを読み込ませてプロセッサ101にそのプログラムを実行させることで実現される。プロセッサ101はそのプログラムに従って、通信制御部104、入力装置105、または出力装置106を動作させ、主記憶部102または補助記憶部103におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部102または補助記憶部103内に格納される。
【0018】
図2は情報処理システム10の機能構成の一例を示す図である。情報処理システム10は機能要素として取得部11、算出部12、および予測部13を備える。
【0019】
取得部11は複数の成分オブジェクトに関するデータを取得する機能要素である。具体的には、取得部11は複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得する。成分オブジェクトの数値表現とは、成分オブジェクトの任意の属性を複数の数値を用いて表現したデータのことをいう。成分オブジェクトの属性とは、成分オブジェクトが備える性質または特徴のことをいう。数値表現は様々な手法で可視化されてよく、例えば、数字、英字、テキスト、分子グラフ、ベクトル、画像、時系列データ等の手法によって可視化されてもよいし、これらの手法のうちの任意の2以上の組合せによって可視化されてもよい。数値表現を構成する個々の数値は、十進法で表されてもよいし、二進法、十六進法等の他の表記法によって表されてもよい。成分オブジェクトの複合比とは、複数の成分オブジェクトの間の割合のことをいう。複合比の具体的な種類、単位、および表現方法は限定されず、成分オブジェクトまたは複合オブジェクトに応じて任意に定められてよい。例えば複合比は百分率等の比率、またはヒストグラムによって表されてもよいし、個々の成分オブジェクトの絶対量で表されてもよい。
【0020】
算出部12は、複数の成分オブジェクトに対応する複数の数値表現および複数の複合比に基づいて、機械学習と該複数の複合比の適用とを実行することで、複合特徴ベクトルを算出する機能要素である。複合特徴ベクトルとは、複合オブジェクトの特徴を示すベクトルのことをいう。複合オブジェクトの特徴とは、該複合オブジェクトを他のオブジェクトと異ならせる任意の要素のことをいう。ベクトルとは、n個の数値を有するn次元の量のことをいい、1次元の配列として表現することができる。一例では、算出部12は複合特徴ベクトルを算出する過程において、複数の成分オブジェクトのそれぞれの特徴ベクトルを算出する。特徴ベクトルは成分オブジェクトの特徴を示すベクトルである。成分オブジェクトの特徴とは、該成分オブジェクトを他のオブジェクトと異ならせる任意の要素のことをいう。
【0021】
算出部12は、埋込み部121、相互作用部122、集約部123、および比率適用部124を含む。埋込み部121は機械学習を用いてベクトルの集合から同じ数の別のベクトルの集合を生成する機能要素である。一例では、埋込み部121は非定型データから特徴ベクトルを生成する。非定型データとは、固定長ベクトルによって表現できないデータのことをいう。相互作用部122は機械学習または他の手法を用いてベクトルの集合から同じ数の別のベクトルの集合を生成する機能要素である。一例では、相互作用部122は、既に機械学習によって得られた特徴ベクトルの入力を受け付けてもよい。集約部123は機械学習または他の手法を用いてベクトル集合(複数のベクトル)を一つのベクトルに集約する機能要素である。比率適用部124は複合比を適用する機能要素である。
【0022】
予測部13は、複合オブジェクトの特性を予測し、その予測値を出力する機能要素である。複合オブジェクトの特性とは、複合オブジェクトが持つ特有の性質のことをいう。
【0023】
一例では、本実施形態で用いられる少なくとも一つの機械学習モデルのそれぞれは、推定精度が最も高いと期待される学習済みモデルであり、したがって「最良の機械学習モデル」ということができる。しかし、この学習済みモデルは“現実に最良である”とは限らないことに留意されたい。学習済みモデルは、入力ベクトルとラベルとの多数の組合せを含む教師データを所与のコンピュータが処理することで生成される。所与のコンピュータは、入力ベクトルを機械学習モデルに入力することで出力ベクトルを算出し、算出された出力ベクトルから得られる予測値と、教師データで示されるラベルとの誤差(すなわち、推定結果と正解との差)を求める。そして、コンピュータはその誤差に基づいて機械学習モデル内の所与のパラメータを更新する。コンピュータはこのような学習を繰り返すことで学習済みモデルを生成する。学習済みモデルを生成するコンピュータは限定されず、例えば情報処理システム10でもよいし別のコンピュータシステムでもよい。学習済みモデルを生成する処理は学習フェーズということができ、その学習済みモデルを利用する処理は運用フェーズということができる。
【0024】
一例では、本実施形態で用いられる機械学習モデルの少なくとも一部は、入力の順序に依存しない関数によって記述されてもよい。この仕組みにより、機械学習において複数のベクトルの並び順の影響を排除することができる。
【0025】
[データ]
上述したように、それぞれの成分オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、成分オブジェクト(材料)の数値表現は材料の化学構造を示す数値を含んでもよいし、材料の化学構造の構成繰返し単位(CRU)を示す数値を含んでもよい。複合比は配合比または混合比でもよい。複合オブジェクト(多成分物質)の特性の予測値は、多成分物質のガラス転移温度(Tg)および弾性率のうちの少なくとも一つを示してもよい。
【0026】
[システムの動作]
図3図6を参照しながら、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。図3は情報処理システム10の動作の一例を処理フローS1として示すフローチャートである。図4は複合特徴ベクトルを算出する手順の一例を示す図である。図5は機械学習の途中において複合比を適用する一例を示す図である。図6は、複合特徴ベクトルを算出する手順の具体例を示す図であり、図4に対応する。
【0027】
図3に示すように、ステップS11では、取得部11が、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得する。一例として、二つの成分オブジェクトEa,Ebに関する情報が入力されるとするならば、取得部11は例えば、成分オブジェクトEaの数値表現{1,1,2,3,4,3,3,5,6,7,5,4}と、成分オブジェクトEbの数値表現{1,1,5,6,4,3,3,5,1,7,0,0}と、成分オブジェクトEa,Ebの複合比{0.7、0.3}とを取得する。この例では、それぞれの数値表現はベクトルで示されている。複合比{0.7、0.3}は、成分オブジェクトEa,Ebを7:3の割合で用いて複合オブジェクトを得ることを意味する。
【0028】
取得部11は複数の成分オブジェクトのそれぞれのデータを任意の手法で取得してよい。例えば、取得部11は所与のデータベースにアクセスすることでデータを読み出してもよいし、他のコンピュータまたはコンピュータシステムからデータを受信してもよいし、情報処理システム10のユーザにより入力されたデータを受け付けてもよい。あるいは、取得部11はこれらのような手法のうちの任意の2以上によってデータを取得してもよい。
【0029】
ステップS12では、算出部12が、複数の成分オブジェクトに対応する複数の数値表現および複数の複合比に基づいて複合特徴ベクトルを算出する。この計算において、算出部12は機械学習と複合比の適用とのそれぞれを少なくとも一回実行する。複合特徴ベクトルを算出する手順は限定されず、様々な手法を採用することができる。
【0030】
図4を参照しながら、ステップS12の詳細の一例を説明する。この例では、算出部12は複数の成分オブジェクトに対応する複数の数値表現Xおよび複数の複合比Rに基づいて複合特徴ベクトルaを算出する。
【0031】
ステップS121では、埋込み部121が、ベクトルの特徴を計算するための埋込み関数(embedding function)用の機械学習によって、複数の成分オブジェクトについて数値表現Xから特徴ベクトルZを算出する。埋込み関数では入力ベクトル(この例では数値表現X)と出力ベクトル(この例では特徴ベクトルZ)とは1対1の関係にある。埋込み部121は、複数の成分オブジェクトに対応する複数の数値表現Xを埋込み関数用の機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの特徴ベクトルZを算出する。一例では、埋込み部121は、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトに対応する数値表現Xを埋込み関数用の機械学習モデルに入力することで該成分オブジェクトの特徴ベクトルZを算出する。特徴ベクトルZは成分オブジェクトの特徴を示すベクトルである。一例では、埋込み関数用の機械学習モデルは、非定型データである数値表現Xから、固定長ベクトルである特徴ベクトルZを生成してもよい。機械学習モデルは限定されず、成分オブジェクトおよび複合オブジェクトの種類等の要因を考慮して任意の方針で決められてよい。例えば、埋込み部121はグラフニューラルネットワーク(GNN)、畳み込みニューラルネットワーク(CNN)、または再帰型ニューラルネットワーク(RNN)を用いて埋込み関数用の機械学習を実行してもよい。
【0032】
ステップS122では、比率適用部124が埋込み関数(より具体的には、埋込み関数用の機械学習モデル)に関連して複合比Rの適用を実行する。複合比Rを適用するタイミングは限定されない。例えば、比率適用部124は数値表現Xに複合比Rを適用してもよく、したがって、ステップS122はステップS121より前に実行されてもよい。あるいは、比率適用部124は特徴ベクトルZに複合比Rを適用してもよく、したがって、ステップS122はステップS121より後に実行されてもよい。あるいは、比率適用部124は埋込み関数用の機械学習の途中において、或る中間層の出力データ(すなわち機械学習での途中結果)に複合比Rを適用してもよく、したがって、ステップS122はステップS121の一部であってもよい。
【0033】
本開示において「或る関数に関連して複合比の適用を実行する」とは、該関数の入力データ、該関数の出力データ、または該関数の途中結果(中間データ)のうちの少なくとも一つに複合比を適用することをいう。「或る機械学習モデルに関連して複合比の適用を実行する」とは、該機械学習モデルへの入力データ(入力ベクトル)、該機械学習モデルからの出力データ(出力ベクトル)、または該機械学習モデルでの途中結果(或る中間層での出力データ)のうちの少なくとも一つに複合比を適用することをいう。本開示において、「(或る対象データに)複合比を適用する」とは、複合比によってその対象データを変化させる処理のことをいう。複合比の適用方法は限定されない。例えば、比率適用部124は、対象データに複合比を追加の成分として連結することでその適用を実行してもよい。あるいは、比率適用部124は対象データのそれぞれの成分に複合比を乗ずるかまたは足すことでその適用を実行してもよい。比率適用部124はこれらのような簡単な演算によって複合比の適用を実行することができる。
【0034】
図5を参照しながら、多層構造を有する機械学習の途中で複合比を適用する処理の一例を説明する。この例では、比率適用部124は機械学習モデルの第N層からの出力値のそれぞれに比率を適用する。比率が適用された出力値は第N+1層の入力値として処理される。第N層および第N+1層のそれぞれについて、それぞれのノードは、対応する一つの成分オブジェクトを示す。第N層の各ノードの出力値がx1,x2,x3,x4,…であり、複数の成分オブジェクトの複合比Rが“r1:r2:r3:r4:…”で表されるとする。複合比r1,r2,r3,r4はそれぞれ、出力値x1,x2,x3,x4に対応する。比率適用部124は出力値x1に複合比r1を適用することで出力値x1´を求め、出力値x2に複合比r2を適用することで出力値x2´を求め、出力値x3に複合比r3を適用することで出力値x3´を求め、出力値x4に複合比r4を適用することで出力値x4´を求める。これらの出力値x1´,x2´,x3´,x4´が第N+1層の入力値として処理される。
【0035】
図5の例のように機械学習モデルの中間層の出力データに複数の複合比を適用することで、その機械学習モデルに入力されるデータが非定型であるか定型であるかにかかわらず、複合比を適切に適用できる。一例として、非定型データを固定長のベクトルに変換する埋込み関数を含む機械学習モデルが用いられるとする。その機械学習モデルによる処理の前に非定型データに複合比を適用しようとすると、非定型データの個々の数値と複合比の個々の数値との対応が自明でないので、その適用が難しい。加えて、埋込み関数がその非定型データに対して本来の性能を発揮できない可能性がある。一例では、埋込み関数を含む機械学習モデルの中間層の出力データに複数の複合比を適用することで、その機械学習モデルが所望の性能を発揮することも期待できる。
【0036】
ステップS123では、相互作用部122が、複数のベクトルを相互に作用させるための相互作用関数(interaction function)用の機械学習によって、複数の成分オブジェクトについて特徴ベクトルZから別の特徴ベクトルMを算出する。相互作用関数では入力ベクトル(この例では特徴ベクトルZ)と出力ベクトル(この例では別の特徴ベクトルM)とは1対1の関係にある。一例では、相互作用部122は、複数の成分オブジェクトに対応する複数の特徴ベクトルZの集合を相互作用関数用の機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて別の特徴ベクトルMを算出する。機械学習モデルは限定されず、成分オブジェクトおよび複合オブジェクトの種類等の要因を考慮して任意の方針で決められてよい。例えば、相互作用部122は畳み込みニューラルネットワーク(CNN)、または再帰型ニューラルネットワーク(RNN)を用いて相互作用関数用の機械学習を実行してもよい。別の例では、相互作用部122は機械学習を用いない相互作用関数によって特徴ベクトルMを算出してもよい。
【0037】
ステップS124では、比率適用部124が相互作用関数(より具体的には、相互作用関数用の機械学習モデル)に関連して複合比Rの適用を実行する。複合比Rを適用するタイミングは限定されない。例えば、比率適用部124は特徴ベクトルZに複合比Rを適用してもよく、したがって、ステップS124はステップS123より前に実行されてもよい。あるいは、比率適用部124は別の特徴ベクトルMに複合比Rを適用してもよく、したがって、ステップS124はステップS123より後に実行されてもよい。あるいは、比率適用部124は相互作用関数用の機械学習の途中において、或る中間層の出力データ(すなわち機械学習での途中結果)に複合比Rを適用してもよく、したがって、ステップS124はステップS123の一部であってもよい。上述したように、複合比の適用方法は限定されない。
【0038】
ステップS125では、集約部123が複数のベクトルを一つのベクトルに集約する。一例では、集約部123は複数のベクトルを一つのベクトルに集約するための集約関数(aggregation function)用の機械学習によって、複数の特徴ベクトルMから一つの複合特徴ベクトルaを算出する。集約関数では入力ベクトル(この例では特徴ベクトルM)と出力ベクトル(複合特徴ベクトルa)とはN対1の関係にある。一例では、集約部123は、複数の成分オブジェクトに対応する複数の特徴ベクトルMの集合を集約関数用の機械学習モデルに入力することで複合特徴ベクトルaを算出する。機械学習モデルは限定されず、成分オブジェクトおよび複合オブジェクトの種類等の要因を考慮して任意の方針で決められてよい。例えば、集約部123は畳み込みニューラルネットワーク(CNN)、または再帰型ニューラルネットワーク(RNN)を用いて集約関数用の機械学習を実行してもよい。別の例では、集約部123は機械学習を用いない集約関数によって複合特徴ベクトルaを算出してもよく、例えば、複数の特徴ベクトルMを加算することで複合特徴ベクトルaを算出してもよい。
【0039】
ステップS126では、比率適用部124が集約関数に関連して複合比Rの適用を実行する。複合比Rを適用するタイミングは限定されない。例えば、比率適用部124は特徴ベクトルMに複合比Rを適用してもよく、したがって、ステップS126はステップS125より前に実行されてもよい。あるいは、比率適用部124は集約関数用の機械学習の途中において、或る中間層の出力データ(すなわち機械学習モデルでの途中結果)に複合比Rを適用してもよく、したがって、ステップS126はステップS125の一部であってもよい。上述したように、複合比の適用方法は限定されない。
【0040】
図4の例において、特徴ベクトルZは第1特徴ベクトルの一例である。特徴ベクトルMは第2特徴ベクトルの一例であり、複数の複合比が反映された第2特徴ベクトルの一例でもある。埋込み関数用の機械学習モデルは第1機械学習モデルの一例であり、相互作用関数用の機械学習モデルは第2機械学習モデルの一例である。
【0041】
図6を参照しながら、ステップS12の具体例を説明する。この例では、成分オブジェクトとして、ポリスチレン、ポリアクリル酸、およびポリメタアクリル酸ブチルという3種類の材料(ポリマー)を示す。これらの材料のそれぞれについて、任意の形式の数値表現Xが用意される。この例での複合比は、ポリスチレンについては0.28、ポリアクリル酸については0.01、ポリメタアクリル酸ブチルについては0.71である。算出部12はこれらのデータに基づいてステップS12(より具体的にはステップS121~S126)を実行することで、この3種類の材料から得られる多成分物質(ポリマーアロイ)の特徴を示す複合特徴ベクトルaを算出することができる。
【0042】
図3に戻り、ステップS13では、算出部12が複合特徴ベクトルを出力する。本実施形態では、算出部12は情報処理システム10での後続処理のために複合特徴ベクトルを予測部13に出力する。しかし、複合特徴ベクトルの出力方法はこれに限定されず、任意の方針で設計されてよい。例えば、算出部12は複合特徴ベクトルを、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。
【0043】
ステップS14では、予測部13が複合特徴ベクトルから複合オブジェクトの特性の予測値を算出する。予測方法は限定されず、任意の方針で設計されてよい。例えば、予測部13は機械学習によって複合特徴ベクトルから予測値を算出してもよい。具体的には、予測部13は、複合特徴ベクトルを所与の機械学習モデルに入力することで予測値を算出する。予測値を得るための機械学習モデルは限定されず、複合オブジェクトの種類等の要因を考慮して任意の方針で決められてよい。例えば、予測部13は回帰問題または分類問題を解く任意のニューラルネットワークを用いて機械学習を実行してもよい。典型的には、回帰問題の予測値は数値で表され、分類問題の予測値はカテゴリを示す。予測部13は機械学習以外の手法を用いて予測値を算出してもよい。
【0044】
ステップS15では、予測部13がその予測値を出力する。予測値の出力方法は限定されない。例えば、予測部13は予測値を、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。あるいは、予測部13は情報処理システム10での後続処理のために予測値を他の機能要素に出力してもよい。
【0045】
上述したように、複合特徴ベクトルを算出する手順は限定されない。図7を参照しながらその計算手順の他の例について説明する。図7はステップS12の詳細に関する他の例を示す図である。
【0046】
図7の例(a)のように、算出部12は、相互作用関数用の機械学習を用いることなく、埋込み関数用の機械学習と集約関数とによって複合特徴ベクトルを算出してもよい。一例では、算出部12はステップS121,S122,S125を実行することで複合特徴ベクトルを算出する。ステップS121では、埋込み部121が埋込み関数用の機械学習によって、複数の成分オブジェクトについて数値表現Xから特徴ベクトルZを算出する。ステップS122では、比率適用部124が埋込み関数用の機械学習モデルに関連して複合比Rの適用を実行する。上記の通り、複合比Rを適用するタイミングは限定されない。ステップS125では、集約部123が、複数の複合比Rが反映された複数の特徴ベクトルZから複合特徴ベクトルaを算出する。一例では、集約部123はその複数の特徴ベクトルZの集合を集約関数用の機械学習モデルに入力することで複合特徴ベクトルaを算出する。あるいは、集約部123は機械学習を用いない集約関数にその複数の特徴ベクトルZの集合を入力することで複合特徴ベクトルaを算出してもよい。
【0047】
図7の例(a)では、埋込み関数用の機械学習が含まれるので、数値表現Xが、固定長ベクトルによって表現されないデータである非定型データである場合でも、固定長ベクトルである特徴ベクトルZをその数値表現Xから生成できる。このような処理を表現学習という。この表現学習によって、機械学習モデル(学習済みモデル)の構築に必要なドメイン知識を少なくすることが可能になり、また、予測精度の向上も可能になる。
【0048】
図7の例(b)のように、算出部12は、埋込み関数用の機械学習を用いることなく、相互作用関数用の機械学習と集約関数とによって複合特徴ベクトルを算出してもよい。一例では、算出部12はステップS123,S124,S125を実行することで複合特徴ベクトルを算出する。ステップS123では、相互作用部122が相互作用関数用の機械学習によって、複数の成分オブジェクトについて数値表現Xから特徴ベクトルMを算出する。ステップS124では、比率適用部124が相互作用関数用の機械学習モデルに関連して複合比Rの適用を実行する。上記の通り、複合比Rを適用するタイミングは限定されない。ステップS125では、集約部123が、複数の複合比Rが反映された複数の特徴ベクトルMから複合特徴ベクトルaを算出する。一例では、集約部123はその複数の特徴ベクトルMの集合を集約関数用の機械学習モデルに入力することで複合特徴ベクトルaを算出する。あるいは、集約部123は機械学習を用いない集約関数にその複数の特徴ベクトルMの集合を入力することで複合特徴ベクトルaを算出してもよい。
【0049】
図7の例(b)では、相互作用関数用の機械学習が含まれるので、数値表現Xの組合せが変わることに起因する非線形な応答を高精度に学習することが可能になる。
【0050】
図7の例(c)のように、算出部12は、埋込み関数用の機械学習および相互作用関数用の機械学習を用いることなく、集約関数用の機械学習によって複合特徴ベクトルを算出してもよい。一例では、算出部12はステップS125,S126を実行することで複合特徴ベクトルを算出する。ステップS125では、集約部123が、複数の成分オブジェクトに対応する複数の数値表現Xの集合を集約関数用の機械学習モデルに入力することで複合特徴ベクトルaを算出する。ステップS126では、比率適用部124が集約関数用の機械学習モデルに関連して複合比Rの適用を実行する。上記の通り、複合比Rを適用するタイミングは限定されない。
【0051】
図7の例(c)では、複合特徴ベクトルを算出するための処理手順が簡易なので、計算負荷を低減させることができる。
【0052】
このように、複数の数値表現Xから複合特徴ベクトルaを求める手順については様々な手法が考えられる。いずれにしても、算出部12は機械学習と複合比の適用とのそれぞれを少なくとも一回実行することで複合特徴ベクトルを算出する。
【0053】
埋込み部121および相互作用部122の少なくとも一つと、集約部123と、比率適用部124とが一つのニューラルネットワークによって構築されてもよい。すなわち、算出部12は一つのニューラルネットワークによって構築されてもよい。言い換えると、埋込み部121、相互作用部122,集約部123、および比率適用部124はいずれも、該一つのニューラルネットワークの一部である。このような一つのニューラルネットワークが用いられる場合には、比率適用部124は、図5に示すように、中間層において比率を適用する。
【0054】
[プログラム]
コンピュータまたはコンピュータシステムを情報処理システム10として機能させるための情報処理プログラムは、該コンピュータシステムを取得部11、算出部12(埋込み部121、相互作用部122、集約部123、および比率適用部124)、および予測部13として機能させるためのプログラムコードを含む。この情報処理プログラムは、CD-ROM、DVD-ROM、半導体メモリ等の有形の記録媒体に非一時的に記録された上で提供されてもよい。あるいは、情報処理プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された情報処理プログラムは例えば補助記憶部103に記憶される。プロセッサ101が補助記憶部103からその情報処理プログラムを読み出して実行することで、上記の各機能要素が実現する。
【0055】
[効果]
以上説明したように、本開示の一側面に係る情報処理システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得し、複数の成分オブジェクトに対応する複数の数値表現および複数の複合比に基づいて、機械学習と該複数の複合比の適用とを実行することで、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
【0056】
本開示の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される。情報処理方法は、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現および複数の複合比に基づいて、機械学習と該複数の複合比の適用とを実行することで、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとを含む。
【0057】
本開示の一側面に係る情報処理プログラムは、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現および複数の複合比に基づいて、機械学習と該複数の複合比の適用とを実行することで、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとをコンピュータに実行させる。
【0058】
このような側面においては、各成分オブジェクトについて機械学習と複合比の適用とが実行されるので、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。
【0059】
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の数値表現を機械学習モデルに入力することで、複数の成分オブジェクトのそれぞれの特徴ベクトルを算出し、機械学習モデルに関連して複数の複合比の適用を実行し、複数の複合比が反映された複数の特徴ベクトルを集約関数に入力することで複合特徴ベクトルを算出してもよい。この一連の手順によって、成分オブジェクトについて十分な量のデータを用意できない場合にも、複合オブジェクトの解析の精度を上げることが可能になる。
【0060】
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の数値表現を第1機械学習モデルに入力することで、複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出し、複数の第1特徴ベクトルを第2機械学習モデルに入力することで、複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出し、第1機械学習モデルおよび第2機械学習モデルから選択される少なくとも一つの機械学習モデルに関連して複数の複合比の適用を実行し、複数の複合比が反映された複数の第2特徴ベクトルを集約関数に入力することで複合特徴ベクトルを算出してもよい。このように機械学習を2段階で実行することで、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度をより上げることが可能になる。
【0061】
他の側面に係る情報処理システムでは、第1機械学習モデルが、非定型データである数値表現から、固定長ベクトルである第1特徴ベクトルを生成する機械学習モデルであってもよい。この第1機械学習モデルを用いることで、固定長ベクトルによって表現できない数値表現から複合特徴ベクトルを得ることができる。
【0062】
他の側面に係る情報処理システムでは、機械学習モデルに関連した複数の複合比の適用が、機械学習モデルの中間層の出力データに複数の複合比を適用することであってもよい。複合比を適用するタイミングをこのように設定することで、機械学習モデルに入力されるデータが非定型であるか定型であるかにかかわらず、複合比を適切に適用できる。
【0063】
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複合特徴ベクトルを別の機械学習モデルに入力することで、複合オブジェクトの特性の予測値を算出し、予測値を出力してもよい。この処理によって、複合オブジェクトの特性を精度良く算出することが可能になる。
【0064】
他の側面に係る情報処理システムでは、成分オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、材料について十分な量のデータを用意できない場合にも多成分物質の解析の精度を上げることが可能になる。
【0065】
他の側面に係る情報処理システムでは、材料がポリマーであり、多成分物質がポリマーアロイであってもよい。この場合には、ポリマーについて十分な量のデータを用意できない場合にもポリマーアロイの解析の精度を上げることが可能になる。ポリマーアロイは非常に多様であり、これに対応して、ポリマーの種類も膨大である。このようなポリマーおよびポリマーアロイについては、一般に、取り得る組合せの一部についてしか実験を行うことができず、したがって十分な量のデータを得られないことが多い。本側面によれば、このようにデータが不十分である場合でも精度よくポリマーアロイを解析することが可能になる。
【0066】
[変形例]
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
【0067】
上記実施形態では情報処理システム10が予測部13を備えるが、この機能要素は省略可能である。すなわち、複合オブジェクトの特性を予測する処理は、情報処理システムとは異なるコンピュータシステムによって実行されてもよい。
【0068】
少なくとも一つのプロセッサにより実行される情報処理方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップ(処理)の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正または削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。例えば、ステップS14,S15の処理が省略されてもよい。図4に示すステップS12において、ステップS122,S124,S126のうちの任意の一つまたは二つが省略されてもよい。
【0069】
情報処理システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」の二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。
【0070】
本開示において、「少なくとも一つのプロセッサが、第1の処理を実行し、第2の処理を実行し、…第nの処理を実行する。」との表現、またはこれに対応する表現は、第1の処理から第nの処理までのn個の処理の実行主体(すなわちプロセッサ)が途中で変わる場合を含む概念を示す。すなわち、この表現は、n個の処理のすべてが同じプロセッサで実行される場合と、n個の処理においてプロセッサが任意の方針で変わる場合との双方を含む概念を示す。
【符号の説明】
【0071】
10…情報処理システム、11…取得部、12…算出部、13…予測部、121…埋込み部、122…相互作用部、123…集約部、124…比率適用部。
図1
図2
図3
図4
図5
図6
図7