(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-24
(45)【発行日】2024-07-02
(54)【発明の名称】情報処理システム、情報処理方法、および情報処理プログラム
(51)【国際特許分類】
G06F 30/27 20200101AFI20240625BHJP
G06F 30/10 20200101ALI20240625BHJP
G16C 20/30 20190101ALI20240625BHJP
G16C 20/70 20190101ALI20240625BHJP
G06F 113/26 20200101ALN20240625BHJP
【FI】
G06F30/27
G06F30/10
G16C20/30
G16C20/70
G06F113:26
(21)【出願番号】P 2021556104
(86)(22)【出願日】2020-11-10
(86)【国際出願番号】 JP2020041905
(87)【国際公開番号】W WO2021095725
(87)【国際公開日】2021-05-20
【審査請求日】2023-09-12
(31)【優先権主張番号】P 2019204089
(32)【優先日】2019-11-11
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004455
【氏名又は名称】株式会社レゾナック
(74)【代理人】
【識別番号】100088155
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100128381
【氏名又は名称】清水 義憲
(74)【代理人】
【識別番号】100169454
【氏名又は名称】平野 裕之
(74)【代理人】
【識別番号】100144440
【氏名又は名称】保坂 一之
(72)【発明者】
【氏名】花岡 恭平
【審査官】合田 幸裕
(56)【参考文献】
【文献】特開2003-058582(JP,A)
【文献】特開平10-055348(JP,A)
【文献】特開2004-086892(JP,A)
【文献】特開平07-227832(JP,A)
【文献】国際公開第2019/198644(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 30/27
G06F 30/10
G16C 20/30
G16C 20/70
G06F 113/26
IEEE Xplore
JSTPlus(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、
複数の参照オブジェクトのそれぞれについて数値表現を取得し、
前記複数の成分オブジェクトに対応する複数の前記数値表現と、前記複数の参照オブジェクトに対応する複数の前記数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、
複数の前記成分特徴ベクトルおよび複数の前記参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、
複数の前記確率ベクトルおよび複数の前記複合比に基づいて、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、前記複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、
前記複合特徴ベクトルを出力する、
情報処理システム。
【請求項2】
前記複数の成分オブジェクトの個数をmとし、前記複数の参照オブジェクトの個数をnとし、前記複数の確率ベクトルのそれぞれがn次元であり、前記複数の確率ベクトルをVp
1,Vp
2,…,Vp
mとし、前記複数の複合比をr
1,r
2,…,r
mとし、前記複合特徴ベクトルをVcとして、前記少なくとも一つのプロセッサが前記複合特徴ベクトルを下記式(1)
Vc=r
1×Vp
1+r
2×Vp
2+…+r
m×Vp
m …(1)
によって算出する、
請求項1に記載の情報処理システム。
【請求項3】
前記少なくとも一つのプロセッサが、
前記複合特徴ベクトルを第3機械学習モデルに入力することで、前記複合オブジェクトの特性の予測値を算出し、
前記予測値を出力する、
請求項1または2に記載の情報処理システム。
【請求項4】
前記成分オブジェクトが材料であり、前記複合オブジェクトが多成分物質である、
請求項1~3のいずれか一項に記載の情報処理システム。
【請求項5】
前記材料がポリマーであり、前記多成分物質がポリマーアロイである、
請求項4に記載の情報処理システム。
【請求項6】
少なくとも一つのプロセッサを備える情報処理システムにより実行される情報処理方法であって、
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、
複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現と、前記複数の参照オブジェクトに対応する複数の前記数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、
複数の前記成分特徴ベクトルおよび複数の前記参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、
複数の前記確率ベクトルおよび複数の前記複合比に基づいて、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、前記複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
を含む情報処理方法。
【請求項7】
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、
複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現と、前記複数の参照オブジェクトに対応する複数の前記数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、
複数の前記成分特徴ベクトルおよび複数の前記参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、
複数の前記確率ベクトルおよび複数の前記複合比に基づいて、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、前記複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
をコンピュータに実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の一側面は情報処理システム、情報処理方法、および情報処理プログラムに関する。
【背景技術】
【0002】
複数の成分オブジェクトを複合させることで得られる複合オブジェクトを、機械学習を用いて解析する手法が用いられている。例えば、特許文献1には、生体高分子の立体構造と化合物の立体構造との結合性を予測する方法が記載されている。この方法は、生体高分子の立体構造と化合物の立体構造とに基づいて生体高分子と化合物との複合体の予測立体構造を生成するステップと、その予測立体構造を、相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、機械学習アルゴリズムを用いてその予測立体構造ベクトルを判別することによって生体高分子の立体構造と化合物の立体構造との結合性を予測するステップとを含む。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
成分オブジェクトが多様であったり多数存在したりする場合には、これらの成分オブジェクトについて十分な量のデータを用意することができず、その結果、複合オブジェクトの解析の精度が、期待する水準に達しない可能性がある。そこで、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げるための仕組みが望まれている。
【課題を解決するための手段】
【0005】
本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の参照オブジェクトのそれぞれについて数値表現を取得し、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
【0006】
このような側面においては、複合比を考慮する前に、複合オブジェクトを構成する各成分オブジェクトの特徴が個々の参照オブジェクトとの関連度を用いて顕在化される。したがって、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。
【発明の効果】
【0007】
本開示の一側面によれば、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることができる。
【図面の簡単な説明】
【0008】
【
図1】実施形態に係る情報処理システムを構成するコンピュータのハードウェア構成の一例を示す図である。
【
図2】実施形態に係る情報処理システムの機能構成の一例を示す図である。
【
図3】実施形態に係る情報処理システムの動作の一例を示すフローチャートである。
【
図4】実施形態に係る情報処理システムの動作をデータの具体例を用いて説明する図である。
【発明を実施するための形態】
【0009】
以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
【0010】
[システムの概要]
実施形態に係る情報処理システム10は、複数の成分オブジェクトを所与の複合比で複合させることで得られる複合オブジェクトに関する解析を実行するコンピュータシステムである。成分オブジェクトとは、複合オブジェクトを生成するために用いられる有体物または無体物のことをいう。複合オブジェクトは有体物または無体物であり得る。有体物の例として任意の物質または物体が挙げられる。無体物の例としてデータおよび情報が挙げられる。「複数の成分オブジェクトを複合させる」とは、複数の成分オブジェクトを一つのオブジェクト、すなわち複合オブジェクトにする処理のことをいう。複合させる手法は限定させず、例えば、配合、調合、合成、結合、混合、合併、組合せ、化合、または合体でもよいし、他の手法でもよい。複合オブジェクトに関する解析とは、複合オブジェクトの何らかの特徴を示すデータを得るための処理のことをいう。
【0011】
複数の成分オブジェクトは任意の複数種類の材料でもよく、この場合には、複合オブジェクトはそれらの材料によって生成される多成分物質である。材料とは多成分物質を生成するために用いられる任意の構成要素である。例えば、複数の材料は任意の複数種類の分子または原子材料でもよく、この場合には、複合オブジェクトは、それらの分子または原子を任意の手法で複合することにより得られる多成分物質である。例えば、材料はポリマーでもよく、これに対応して、多成分物質はポリマーアロイでもよい。材料はモノマーでもよく、これに対応して、多成分物質はポリマーでもよい。材料は薬物、すなわち、薬理作用を有する化学物質でもよく、これに対応して、多成分物質は薬剤でもよい。
【0012】
情報処理システム10は複合オブジェクトに関する解析のために機械学習を実行する。機械学習とは、与えられた情報に基づいて学習することで法則またはルールを自律的に見つけ出す手法である。機械学習の具体的な手法は限定されない。例えば、情報処理システム10は、ニューラルネットワークを含んで構成される計算モデルである機械学習モデルを用いた機械学習を実行してもよい。ニューラルネットワークとは、人間の脳神経系の仕組みを模した情報処理のモデルのことをいう。より具体的な例として、情報処理システム10は、グラフニューラルネットワーク(GNN)、畳み込みニューラルネットワーク(CNN)、再帰型ニューラルネットワーク(RNN)、アテンションRNN(Attention RNN)、およびマルチヘッド・アテンション(Multi-Head Attention)のうちの少なくとも一つを用いて機械学習を実行してもよい。
【0013】
[システムの構成]
情報処理システム10は1台以上のコンピュータで構成される。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの情報処理システム10が構築される。
【0014】
図1は、情報処理システム10を構成するコンピュータ100の一般的なハードウェア構成の一例を示す図である。例えば、コンピュータ100は、オペレーティングシステム、アプリケーション・プログラム等を実行するプロセッサ(例えばCPU)101と、ROMおよびRAMで構成される主記憶部102と、ハードディスク、フラッシュメモリ等で構成される補助記憶部103と、ネットワークカードまたは無線通信モジュールで構成される通信制御部104と、キーボード、マウス等の入力装置105と、モニタ等の出力装置106とを備える。
【0015】
情報処理システム10の各機能要素は、プロセッサ101または主記憶部102の上に予め定められたプログラムを読み込ませてプロセッサ101にそのプログラムを実行させることで実現される。プロセッサ101はそのプログラムに従って、通信制御部104、入力装置105、または出力装置106を動作させ、主記憶部102または補助記憶部103におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部102または補助記憶部103内に格納される。
【0016】
図2は情報処理システム10の機能構成の一例を示す図である。情報処理システム10は機能要素として取得部11、第1学習部12、第2学習部13、比率適用部14、および予測部15を備える。
【0017】
取得部11は複数の成分オブジェクトに関するデータと、複数の参照オブジェクトに関するデータとを取得する機能要素である。参照オブジェクトとは、成分オブジェクトに対応して設定される有体物または無体物のことをいい、より具体的には、成分オブジェクトと同じ種類またはカテゴリに属するオブジェクトのことをいう。したがって、複数の参照オブジェクトは任意の複数種類の材料でもよく、例えば、ポリマー、モノマー、または薬物であり得る。
【0018】
取得部11は複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得する。さらに、取得部11は複数の参照オブジェクトのそれぞれについて数値表現を取得する。成分オブジェクト(または参照オブジェクト)の数値表現とは、成分オブジェクト(または参照オブジェクト)の任意の属性を複数の数値を用いて表現したデータのことをいう。成分オブジェクト(または参照オブジェクト)の属性とは、成分オブジェクト(または参照オブジェクト)が備える性質または特徴のことをいう。本開示では、成分オブジェクトの数値表現を「成分数値表現」ともいい、参照オブジェクトの数値表現を「参照数値表現」ともいう。数値表現は様々な手法で可視化されてよく、例えば、数字、英字、テキスト、分子グラフ、ベクトル、画像、時系列データなどの手法によって可視化されてもよいし、これらの手法のうちの任意の2以上の組合せによって可視化されてもよい。数値表現を構成する個々の数値は、十進法で表されてもよいし、二進法、十六進法などの他の表記法によって表されてもよい。成分オブジェクトの複合比とは、複数の成分オブジェクトの間の割合のことをいう。複合比の具体的な種類、単位、および表現方法は限定されず、成分オブジェクトまたは複合オブジェクトに応じて任意に定められてよい。例えば複合比は百分率などの比率、またはヒストグラムによって表されてもよいし、個々の成分オブジェクトの絶対量で表されてもよい。
【0019】
成分オブジェクトの個数と参照オブジェクトの個数とは同じでもよいし異なってもよい。成分オブジェクトの個数は参照オブジェクトの個数より多くてもよいし少なくてもよい。
【0020】
第1学習部12は、第1機械学習モデルを用いた第1機械学習によって、複数の成分オブジェクトおよび複数の参照オブジェクトのそれぞれについて、該オブジェクトの特徴を示すベクトルを算出する機能要素である。成分オブジェクトの特徴を示すベクトルを成分特徴ベクトルといい、参照オブジェクトの特徴を示すベクトルを参照特徴ベクトルという。成分オブジェクト(または参照オブジェクト)の特徴とは、該成分オブジェクト(または該参照オブジェクト)を他のオブジェクトと異ならせる任意の要素のことをいう。ベクトルとは、n個の数値を有するn次元の量のことをいい、1次元の配列として表現することができる。
【0021】
第2学習部13は、第2機械学習モデルを用いた第2機械学習によって、複数の成分オブジェクトのそれぞれについて、複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出する機能要素である。確率ベクトルとは、成分オブジェクトがそれぞれの参照オブジェクトとどのくらい関連するかを示すベクトルであり、言い換えると、成分オブジェクトがそれぞれの参照オブジェクトに帰属する度合いを示すベクトルである。関連度とは、成分オブジェクトと参照オブジェクトとの間の関連の強さを示す指標であり、言い換えると、成分オブジェクトが参照オブジェクトに帰属する度合いを示す指標である。
【0022】
比率適用部14は、複数の成分オブジェクトに対応する複数の確率ベクトルと各成分オブジェクトの複合比とに基づいて、複合オブジェクトの特徴を示す複合特徴ベクトルを算出する機能要素である。複合オブジェクトの特徴とは、該複合オブジェクトを他のオブジェクトと異ならせる任意の要素のことをいう。具体的には、複合特徴ベクトルは、複数の参照オブジェクトのそれぞれとの関連度を示す。
【0023】
予測部15は、複合オブジェクトの特性を予測し、その予測値を出力する機能要素である。複合オブジェクトの特性とは、複合オブジェクトが持つ特有の性質のことをいう。
【0024】
一例では、第1および第2の機械学習モデルはいずれも、推定精度が最も高いと期待される学習済みモデルであり、したがって「最良の機械学習モデル」ということができる。しかし、この学習済みモデルは“現実に最良である”とは限らないことに留意されたい。学習済みモデルは、入力ベクトルとラベルとの多数の組合せを含む教師データを所与のコンピュータが処理することで生成される。所与のコンピュータは、入力ベクトルを機械学習モデルに入力することで出力ベクトルを算出し、算出された出力ベクトルから得られる予測値と、教師データで示されるラベルとの誤差(すなわち、推定結果と正解との差)を求める。そして、コンピュータはその誤差に基づいて機械学習モデル内の所与のパラメータを更新する。コンピュータはこのような学習を繰り返すことで学習済みモデルを生成する。学習済みモデルを生成するコンピュータは限定されず、例えば情報処理システム10でもよいし別のコンピュータシステムでもよい。学習済みモデルを生成する処理は学習フェーズということができ、その学習済みモデルを利用する処理は運用フェーズということができる。
【0025】
[データ]
上述したように、それぞれの成分オブジェクトおよびそれぞれの参照オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、成分数値表現および参照数値表現は、材料の化学構造を示す数値を含んでもよいし、材料の化学構造の構成繰返し単位(CRU)を示す数値を含んでもよい。複合比は配合比または混合比でもよい。複合オブジェクト(多成分物質)の特性の予測値は、多成分物質のガラス転移温度(Tg)および弾性率のうちの少なくとも一つを示してもよい。
【0026】
[システムの動作]
図3および
図4を参照しながら、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。
図3は情報処理システム10の動作の一例を処理フローS1として示すフローチャートである。
図4は、情報処理システム10の動作をデータの具体例を用いて示す図である。
【0027】
ステップS11では、取得部11が、複数の成分オブジェクトのそれぞれについて数値表現(成分数値表現)および複合比を取得する。
図4では複数の成分オブジェクトの例として二つの成分オブジェクトEa,Ebを示す。成分オブジェクトEaの数値表現は{1,1,2,3,4,3,3,5,6,7,5,4}であり、成分オブジェクトEbの数値表現は{1,1,5,6,4,3,3,5,1,7,0,0}である。成分オブジェクトEa,Ebの複合比はそれぞれ0.7、0.3であり、したがって、これは、成分オブジェクトEa,Ebを7:3の割合で用いて複合オブジェクトを得ることを意味する。
【0028】
ステップS12では、取得部11が、複数の参照オブジェクトのそれぞれについて数値表現(参照数値表現)を取得する。
図4では複数の参照オブジェクトの例として二つの参照オブジェクトRa,Rbを示す。参照オブジェクトRaの数値表現は{1,2,5,1,4,1,3,1,1,1,0,0}であり、参照オブジェクトRbの数値表現は{1,2,0,0,4,1,3,1,0,1,0,0}である。
【0029】
図4の例では成分オブジェクトの個数と参照オブジェクトの個数とが同じであるが、上述したように両者の個数は異なってもよい。また、
図4の例では成分オブジェクトと参照オブジェクトとの間で数値表現の次元数が同じであるが、両者の次元数が異なってもよい。
【0030】
取得部11は複数の成分オブジェクトおよび複数の参照オブジェクトのデータを任意の手法で取得してよい。例えば、取得部11は所与のデータベースにアクセスすることでデータを読み出してもよいし、他のコンピュータまたはコンピュータシステムからデータを受信してもよいし、情報処理システム10のユーザにより入力されたデータを受け付けてもよい。あるいは、取得部11はこれらのような手法のうちの任意の2以上によってデータを取得してもよい。
【0031】
ステップS13では、第1学習部12が第1機械学習によって、各成分オブジェクトの成分特徴ベクトルと、各参照オブジェクトの参照特徴ベクトルとを算出する。
【0032】
第1学習部12は、複数の成分オブジェクトに対応する複数の数値表現(成分数値表現)を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルを算出する。一例では、第1学習部12は、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトに対応する数値表現を第1機械学習モデルに入力することで該成分オブジェクトの成分特徴ベクトルを算出する。
【0033】
さらに、第1学習部12は、複数の参照オブジェクトに対応する複数の数値表現(参照数値表現)を第1機械学習モデルに入力することで、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルを算出する。一例では、第1学習部12は、複数の参照オブジェクトのそれぞれについて、該参照オブジェクトに対応する数値表現を第1機械学習モデルに入力することで該参照オブジェクトの参照特徴ベクトルを算出する。
【0034】
第1機械学習モデルは限定されず、成分オブジェクトおよび参照オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、第1学習部12はグラフニューラルネットワーク(GNN)、畳み込みニューラルネットワーク(CNN)、または再帰型ニューラルネットワーク(RNN)を用いて第1機械学習を実行してもよい。
【0035】
成分オブジェクトに対応する数値表現が入力される第1機械学習モデルと、参照オブジェクトに対応する数値表現が入力される第1機械学習モデルとは、同じでもよいし相異なってもよい。本開示では、「複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力する」とは、成分オブジェクトのための第1機械学習モデルと、参照オブジェクトのための第1機械学習モデルとが同じ場合と相異なる場合との双方を含む概念であることに留意されたい。
【0036】
図4の例では、第1学習部12は成分オブジェクトEaの数値表現{1,1,2,3,4,3,3,5,6,7,5,4}を第1機械学習モデルに入力することで成分特徴ベクトル{1,1,4,1,3,1}を算出する。また、第1学習部12は成分オブジェクトEbの数値表現{1,1,5,6,4,3,3,5,1,7,0,0}を第1機械学習モデルに入力することで成分特徴ベクトル{3,3,1,1,0,0}を算出する。第1学習部12は参照オブジェクトRaの数値表現{1,2,5,1,4,1,3,1,1,1,0,0}を第1機械学習モデルに入力することで参照特徴ベクトル{1,4,2,1,1,0}を算出する。また、第1学習部12は参照オブジェクトRbの数値表現{1,2,0,0,4,1,3,1,0,1,0,0}を第1機械学習モデルに入力することで参照特徴ベクトル{2,1,0,1,0,0}を算出する。
図4の例では成分特徴ベクトルと参照特徴ベクトルとの間で次元数が同じであるが、両者の次元数が異なってもよい。
【0037】
ステップS14では、第2学習部13が第2機械学習によって、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルから、複数の成分オブジェクトのそれぞれの確率ベクトルを算出する。一例では、第2学習部13は、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトに対応する成分特徴ベクトルと、複数の参照特徴ベクトルの集合との組合せを第2機械学習モデルに入力することで、該成分オブジェクトの確率ベクトルを算出する。個々の成分オブジェクトの確率ベクトルは、複数の参照オブジェクトに対応する複数の数値(ベクトル成分)で構成される。確率ベクトルの次元数は参照オブジェクトの個数と一致する。第2機械学習モデルは限定されず、成分オブジェクトおよび参照オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、第2機械学習モデルは、集合の要素の組合せの影響を考慮できる学習モデルでもよいし、その影響を考慮できない学習モデルでもよい。前者の例として、アテンションRNN(Attention RNN)またはマルチヘッド・アテンション(Multi-Head Attention)が挙げられる。
【0038】
図4の例では、第2学習部13は成分オブジェクトEaの成分特徴ベクトル{1,1,4,1,3,1}と、参照オブジェクトRaの参照特徴ベクトル{1,4,2,1,1,0}と、参照オブジェクトRbの参照特徴ベクトル{2,1,0,1,0,0}とを第2機械学習モデルに入力することで、成分オブジェクトEaの確率ベクトル{0.4,0.6}を算出する。この確率ベクトルは、成分オブジェクトEaと参照オブジェクトRaとの関連度が0.4であり、成分オブジェクトEaと参照オブジェクトRbとの関連度が0.6であることを示す。
【0039】
さらに、第2学習部13は成分オブジェクトEbの成分特徴ベクトル{3,3,1,1,0,0}と、参照オブジェクトRaの参照特徴ベクトルと、参照オブジェクトRbの参照特徴ベクトルとを第2機械学習モデルに入力することで、成分オブジェクトEbの確率ベクトル{0.2,0.8}を算出する。この確率ベクトルは、成分オブジェクトEaと参照オブジェクトRaとの関連度が0.2であり、成分オブジェクトEaと参照オブジェクトRbとの関連度が0.8であることを示す。
【0040】
ステップS15では、比率適用部14が複数の確率ベクトルおよび複数の複合比から複合特徴ベクトルを生成する。複合特徴ベクトルは、複数の参照オブジェクトに対応する複数の数値(ベクトル成分)で構成される。複合特徴ベクトルの構成および算出方法はいずれも限定されない。一例では、複合特徴ベクトルの次元数は参照オブジェクトの個数と一致する。すなわち、複合特徴ベクトルは確率ベクトルと同じ構造を有する。
【0041】
成分オブジェクトの個数をmとし、参照オブジェクトの個数をnとする。また、個々の成分オブジェクトの確率ベクトルをVp1,Vp2,…,Vpmで表すとする。個々の確率ベクトルはn次元である。また、個々の成分オブジェクトの複合比をr1,r2,…,rmとする。これらの前提において、一例では、比率適用部14はn次元の複合特徴ベクトルVcを下記の式(1)によって算出する。
Vc=r1×Vp1+r2×Vp2+…+rm×Vpm …(1)
【0042】
図4の例では、比率適用部14は以下の計算により複合特徴ベクトルVcを{0.34,0.66}と算出する。
Vc=0.7×{0.4,0.6}+0.3×{0.2,0.8}={0.28,0.42}+{0.06,0.24}={0.34,0.66}
【0043】
ステップS16では、比率適用部14が複合特徴ベクトルを出力する。本実施形態では、比率適用部14は情報処理システム10での後続処理のために複合特徴ベクトルを予測部15に出力する。しかし、複合特徴ベクトルの出力方法はこれに限定されず、任意の方針で設計されてよい。例えば、比率適用部14は複合特徴ベクトルを、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。
【0044】
ステップS17では、予測部15が複合特徴ベクトルから複合オブジェクトの特性の予測値を算出する。予測方法は限定されず、任意の方針で設計されてよい。例えば、予測部15は第3機械学習によって複合特徴ベクトルから予測値を算出してもよい。具体的には、予測部15は、複合特徴ベクトルを第3機械学習モデルに入力することで予測値を算出する。第3機械学習モデルは限定されず、複合オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、予測部15は回帰問題または分類問題を解く任意のニューラルネットワークを用いて第3機械学習を実行してもよい。典型的には、回帰問題の予測値は数値で表され、分類問題の予測値はカテゴリを示す。予測部15は機械学習以外の手法を用いて予測値を算出してもよい。
【0045】
ステップS18では、予測部15がその予測値を出力する。予測値の出力方法は限定されない。例えば、予測部15は予測値を、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。あるいは、予測部15は情報処理システム10での後続処理のために予測値を他の機能要素に出力してもよい。
【0046】
[プログラム]
コンピュータまたはコンピュータシステムを情報処理システム10として機能させるための情報処理プログラムは、該コンピュータシステムを取得部11、第1学習部12、第2学習部13、比率適用部14、および予測部15として機能させるためのプログラムコードを含む。この情報処理プログラムは、CD-ROM、DVD-ROM、半導体メモリ等の有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、情報処理プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された情報処理プログラムは例えば補助記憶部103に記憶される。プロセッサ101が補助記憶部103からその情報処理プログラムを読み出して実行することで、上記の各機能要素が実現する。
【0047】
[効果]
以上説明したように、本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の参照オブジェクトのそれぞれについて数値表現を取得し、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
【0048】
本発明の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される。情報処理方法は、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとを含む。
【0049】
本発明の一側面に係る情報処理プログラムは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとをコンピュータに実行させる。
【0050】
このような側面においては、複合比を考慮する前に、複合オブジェクトを構成する各成分オブジェクトの特徴が個々の参照オブジェクトとの関連度を用いて顕在化される。したがって、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。
【0051】
他の側面に係る情報処理システムでは、複数の成分オブジェクトの個数をmとし、複数の参照オブジェクトの個数をnとし、複数の確率ベクトルのそれぞれがn次元であり、複数の確率ベクトルをVp1,Vp2,…,Vpmとし、複数の複合比をr1,r2,…,rmとし、複合特徴ベクトルをVcとして、少なくとも一つのプロセッサが複合特徴ベクトルを下記式(1)によって算出してもよい。
Vc=r1×Vp1+r2×Vp2+…+rm×Vpm …(1)
この場合には、精度が高いと推定される複合特徴ベクトルを簡単な演算によって得ることができる。
【0052】
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複合特徴ベクトルを第3機械学習モデルに入力することで、複合オブジェクトの特性の予測値を算出し、予測値を出力してもよい。この処理によって、複合オブジェクトの特性を精度良く算出することが可能になる。
【0053】
他の側面に係る情報処理システムでは、成分オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、複合比を考慮する前に、多成分物質を構成する各材料の特徴が顕在化される。したがって、材料について十分な量のデータを用意できない場合にも多成分物質の解析の精度を上げることが可能になる。
【0054】
他の側面に係る情報処理システムでは、材料がポリマーであり、多成分物質がポリマーアロイであってもよい。この場合には、複合比を考慮する前に、ポリマーアロイを構成する各ポリマーの特徴が顕在化される。したがって、ポリマーについて十分な量のデータを用意できない場合にもポリマーアロイの解析の精度を上げることが可能になる。ポリマーアロイは非常に多様であり、これに対応して、ポリマーの種類も膨大である。このようなポリマーおよびポリマーアロイについては、一般に、取り得る組合せの一部についてしか実験を行うことができず、したがって十分な量のデータを得られないことが多い。本側面によれば、このようにデータが不十分である場合でも精度よくポリマーアロイを解析することが可能になる。
【0055】
[変形例]
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
【0056】
上記実施形態では情報処理システム10が予測部15を備えるが、この機能要素は省略可能である。すなわち、複合オブジェクトの特性を予測する処理は情報処理システムとは異なるコンピュータシステムによって実行されてもよい。
【0057】
予測部は、複合特徴ベクトルに加えて参照特徴ベクトルなどの他の情報を用いて予測を実行してもよい。あるいは、予測部は複合特徴ベクトルに基づくデータを用いて予測を実行してもよく、例えば、複合特徴ベクトルによる参照特徴ベクトルの重み付き平均を用いて予測を実行してもよい。
【0058】
少なくとも一つのプロセッサにより実行される情報処理方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップ(処理)の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正または削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。例えばステップS17,S18の処理が省略されてもよい。
【0059】
情報処理システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」の二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。
【0060】
本開示において、「少なくとも一つのプロセッサが、第1の処理を実行し、第2の処理を実行し、…第nの処理を実行する。」との表現、またはこれに対応する表現は、第1の処理から第nの処理までのn個の処理の実行主体(すなわちプロセッサ)が途中で変わる場合を含む概念を示す。すなわち、この表現は、n個の処理のすべてが同じプロセッサで実行される場合と、n個の処理においてプロセッサが任意の方針で変わる場合との双方を含む概念を示す。
【符号の説明】
【0061】
10…情報処理システム、11…取得部、12…第1学習部、13…第2学習部、14…比率適用部、15…予測部。