(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-11-27
(45)【発行日】2023-12-05
(54)【発明の名称】材料創出を支援するシステム及び方法、プログラム
(51)【国際特許分類】
G16C 60/00 20190101AFI20231128BHJP
【FI】
G16C60/00
(21)【出願番号】P 2023543393
(86)(22)【出願日】2023-03-09
(86)【国際出願番号】 JP2023009174
【審査請求日】2023-07-19
(31)【優先権主張番号】P 2022037335
(32)【優先日】2022-03-10
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】000004064
【氏名又は名称】日本碍子株式会社
(74)【代理人】
【識別番号】110002365
【氏名又は名称】弁理士法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】木俣 貴文
(72)【発明者】
【氏名】冨田 崇弘
(72)【発明者】
【氏名】阿閉 恭平
(72)【発明者】
【氏名】森本 健司
(72)【発明者】
【氏名】惣川 真吾
(72)【発明者】
【氏名】加藤 泰輔
(72)【発明者】
【氏名】西脇 孝文
(72)【発明者】
【氏名】稲垣 篤則
【審査官】岡北 有平
(56)【参考文献】
【文献】特開2020-060955(JP,A)
【文献】特開2021-043325(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
製法レシピを表す製法レシピデータセットを入力とし材料特性を表す材料特性データセットを出力とするモデルである第1のモデルと、
材料特徴を表す材料特徴データセットを入力とし材料特性データセットを出力とするモデルである第2のモデルと、
製法レシピデータセットを入力とし材料特徴データセットを出力とするモデルである第3のモデルと、
前記第1乃至第3のモデルの少なくとも一つのモデルの精度に応じて、前記第1のモデルを用いた推論と、前記第2のモデル及び前記第3のモデルを用いた推論とのいずれかの推論を行い、当該推論において、材料の製法レシピと材料特性との関連付けを表すデータであるレシピ特性データを生成又は更新する処理部と
を備える材料創出支援システム。
【請求項2】
前記処理部は、前記第1のモデルの精度が第1の閾値以上である、又は、前記第1のモデルの精度が前記第2のモデル及び前記第3のモデルの精度よりも高い場合、前記第1のモデルを用いた推論を行う、
請求項1に記載の材料創出支援システム。
【請求項3】
前記処理部は、前記第2のモデル及び前記第3のモデルの学習又は推論において特定又は生成された製法レシピデータセット及び材料特性データセットを用いて、前記第1のモデルを学習する、
請求項2に記載の材料創出支援システム。
【請求項4】
前記処理部は、
前記第2のモデルの学習において、複数の材料特徴データセットから、前記第2のモデルの精度が閾値以上となる要因としての一つ以上の材料特徴データセットを特定又は生成し、
前記第3のモデルの学習において、複数の製法レシピデータセットから、前記第2のモデルの学習又は推論において特定又は生成された一つ以上の材料特徴データセットに対応の一つ以上の製法レシピデータセットを特定又は生成し、
前記第3のモデルの学習又は推論において特定又は生成された一つ以上の製法レシピデータセットと、当該一つ以上の製法レシピデータセットに対応の一つ以上の材料特性データセットとを用いて、前記第1のモデルを学習する、
請求項3に記載の材料特性支援システム。
【請求項5】
材料特徴データセットは、材料特徴に属する特徴項目毎に数値としての特徴量で構成されたデータセットである、
請求項1に記載の材料創出支援システム。
【請求項6】
前記処理部は、再学習を行う場合、再学習後の第1のモデルを用いた推論、及び/又は、再学習後の第2のモデル及び再学習後の第3のモデルを用いた推論において、レシピ特性データを新たに生成又は更新する、
請求項1に記載の材料創出支援システム。
【請求項7】
前記処理部は、前記第1のモデルの精度が前記閾値未満の場合、前記第2のモデル及び前記第3のモデルの学習又は推論において特定又は生成された製法レシピデータセットの他に、当該製法レシピデータセットに対応し前記第2のモデルの学習又は推論において特定又は生成された材料特徴データセットを前記第1のモデルの入力として前記第1のモデルの学習を行う、
請求項3に記載の材料特性支援システム。
【請求項8】
前記処理部は、前記第1のモデルの学習に材料特徴データセットを用いた場合、前記第1のモデルを用いた推論において、製法レシピの他に材料特徴を材料特性に関連付けたレシピ特性データを生成又は更新する、
請求項7に記載の材料特性支援システム。
【請求項9】
前記処理部は、前記第1のモデルを用いた推論、及び/又は、前記第2のモデル及び前記第3のモデルを用いた推論を、前記第1のモデル、前記第2のモデル及び前記第3のモデルの学習と並行して行う、
請求項3に記載の材料特性支援システム。
【請求項10】
前記処理部は、材料特性が指定された問合せを受け付け、当該問合せで指定されている特性に対応の製法レシピを、前記レシピ特性データを基に特定し、当該特定された製法レシピを提供する、
を更に備える請求項1に記載の材料特性支援システム。
【請求項11】
前記処理部は、
製法レシピが指定された問合せを受け付け、
当該問合せで指定されている製法レシピに対応の材料特性を、前記レシピ特性データを基に特定し、又は、当該製法レシピを表す製法レシピデータセットを入力とした推論を前記処理部に実行させることで特定し、
当該特定された材料特性を提供する、
請求項10に記載の材料特性支援システム。
【請求項12】
前記処理部は、前記第1のモデルの精度が第1の閾値未満である、又は、前記第1のモデルの精度が前記第2のモデル及び前記第3のモデルの精度よりも低い場合、前記第2のモデル及び前記第3のモデルを用いた推論を行う、
請求項1に記載の材料創出支援システム。
【請求項13】
前記処理部は、
材料特徴データセットと当該材料特徴データセットに対応する材料特性データセットとを用いて前記第2のモデルを学習
し、
当該第2のモデルの学習後に、当該第2のモデルの学習において特定された材料特徴の材料特徴データセットと、当該材料特徴データセットに対応の製法レシピデータセットとを用いて前記第3のモデルを学習する、
請求項1に記載の材料創出支援システム。
【請求項14】
前記処理部は、前記第2のモデル及び前記第3のモデルを用いた推論において入力又は出力されたデータセットに基づく実験によって得られたデータセットを前記第1乃至第3のモデルの少なくとも一つの学習に使用することを、第1のケースよりも第2のケースについて優先し、
前記第1のケースは、前記第2のモデル及び前記第3のモデルを用いた推論が、前記第3のモデルの精度が第3の閾値未満である場合に行われた推論であるケースであり、
前記第2のケースは、前記第2のモデル及び前記第3のモデルを用いた推論が、前記第3のモデルの精度が第3の閾値以上である場合に行われた推論であるケースである、
請求項13に記載の材料創出支援システム。
【請求項15】
前記第2のモデルの精度が第2の閾値未満である場合、
前記第2のモデル及び前記第3のモデルの精度が前記第1のモデルの精度よりも高ければ、前記処理部は、前記第2のモデル及び前記第3のモデルを用いた推論を行い、
前記第2のモデル及び前記第3のモデルの精度が前記第1のモデルの精度と同じかそれよりも低ければ、前記処理部は、前記第1のモデルを用いた推論を行う、
請求項14に記載の材料創出支援システム。
【請求項16】
コンピュータが、第1乃至第3のモデルの少なくとも一つのモデルの精度に応じて、前記第1のモデルを用いた推論と、前記第2のモデル及び前記第3のモデルを用いた推論とのいずれかの推論を行い、
コンピュータが、当該推論において、材料の製法レシピと材料特性との関連付けを表すデータであるレシピ特性データを生成又は更新し、
前記第1のモデルは、製法レシピを表す製法レシピデータセットを入力とし材料特性を表す材料特性データセットを出力とするモデルであり、
前記第2のモデルは、材料特徴を表す材料特徴データセットを入力とし材料特性データセットを出力とするモデルであり、
前記第3のモデルは、製法レシピデータセットを入力とし材料特徴データセットを出力とするモデルである、
材料創出支援方法。
【請求項17】
第1乃至第3のモデルの少なくとも一つのモデルの精度に応じて、前記第1のモデルを用いた推論と、前記第2のモデル及び前記第3のモデルを用いた推論とのいずれかの推論を行い、
当該推論において、材料の製法レシピと材料特性との関連付けを表すデータであるレシピ特性データを生成又は更新する、
ことをコンピュータに実行させ、
前記第1のモデルは、製法レシピを表す製法レシピデータセットを入力とし材料特性を表す材料特性データセットを出力とするモデルであり、
前記第2のモデルは、材料特徴を表す材料特徴データセットを入力とし材料特性データセットを出力とするモデルであり、
前記第3のモデルは、製法レシピデータセットを入力とし材料特徴データセットを出力とするモデルである、
コンピュータプログラム。
【請求項18】
第1乃至第3のモデルの少なくとも一つのモデルの精度に応じて、前記第1のモデルを用いた推論と、前記第2のモデル及び前記第3のモデルを用いた推論とのいずれかの推論を行い、
当該推論において、材料の製法レシピと材料特性との関連付けを表すデータであるレシピ特性データを生成又は更新する、
ことをコンピュータに実行させるコンピュータプログラムを記憶
する記憶媒体であって、
前記第1のモデルは、製法レシピを表す製法レシピデータセットを入力とし材料特性を表す材料特性データセットを出力とするモデルであり、
前記第2のモデルは、材料特徴を表す材料特徴データセットを入力とし材料特性データセットを出力とするモデルであり、
前記第3のモデルは、製法レシピデータセットを入力とし材料特徴データセットを出力とするモデルである、
記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、概して、材料創出を支援する技術に関する。
【背景技術】
【0002】
材料創出支援方法の一つとして、マテリアルズインフォマティクス(MI)が知られている。MIは、インフォマティクスの手法により材料創出を支援する方法であり、一般に、材料特性に関するデータを集約し、機械学習を用いて、新たな材料特性を有する材料を探索する方法である(例えば特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えば、有機材料に関しては、化学組成から分子の特性のシミュレーション(例えば第一原理計算)は容易である。このため、特性に関する高精度なシミュレーションデータを多く取得でき、故に、MIの適用が容易である。
【0005】
しかし、材料種類によっては、MIの適用が難しい。例えば、無機材料(セラミックス)に関しては、結晶粒子が多数集まった複雑な高次構造(例えば、粒径、粒度分布及び粒界相等)が特性に影響し、故に、特性のシミュレーションは困難である。このため、特性に関する高精度なシミュレーションデータを取得することは難しく、故に、MIの適用が難しい。
【課題を解決するための手段】
【0006】
材料創出支援システムは、第1乃至第3のモデルと、処理部とを有する。第1のモデルは、製法レシピを表す製法レシピデータセットを入力とし材料特性を表す材料特性データセットを出力とするモデルである。第2のモデルは、材料特徴を表す材料特徴データセットを入力とし材料特性データセットを出力とするモデルである。第3のモデルは、製法レシピデータセットを入力とし材料特徴データセットを出力とするモデルである。処理部は、第1乃至第3のモデルの少なくとも一つのモデルの精度に応じて、第1のモデルを用いた推論と、第2のモデル及び第3のモデルを用いた推論とのいずれかの推論を行い、当該推論において、材料の製法レシピと材料特性との関連付けを表すデータであるレシピ特性データを生成又は更新する。
【発明の効果】
【0007】
本発明によれば、所望の材料特性を持つ材料の開発を支援する製法レシピの提案に貢献することができる。
【図面の簡単な説明】
【0008】
【
図1】本発明の一実施形態におけるシステム構成の一例を示す。
【
図2】MIプラットフォームシステム100の構成の一例を示す。
【
図4】学習部351が行う処理のフローの一例を示す。
【
図5】推論部352が行う処理のフローの一例を示す。
【
図7】第1のモデル301の学習の一変形例を示す。
【発明を実施するための形態】
【0009】
以下の説明では、「インターフェース装置」は、1つ以上のインターフェースデバイスでよい。当該1つ以上のインターフェースデバイスは、下記のうちの少なくとも1つでよい。
・1つ以上のI/O(Input/Output)インターフェースデバイス。I/O(Input/Output)インターフェースデバイスは、I/Oデバイスと遠隔の表示用計算機とのうちの少なくとも1つに対するインターフェースデバイスである。表示用計算機に対するI/Oインターフェースデバイスは、通信インターフェースデバイスでよい。少なくとも1つのI/Oデバイスは、ユーザインターフェースデバイス、例えば、キーボード及びポインティングデバイスのような入力デバイスと、表示デバイスのような出力デバイスとのうちのいずれでもよい。
・1つ以上の通信インターフェースデバイス。1つ以上の通信インターフェースデバイスは、1つ以上の同種の通信インターフェースデバイス(例えば1つ以上のNIC(Network Interface Card))であってもよいし2つ以上の異種の通信インターフェースデバイス(例えばNICとHBA(Host Bus Adapter))であってもよい。
【0010】
また、以下の説明では、「メモリ」は、1つ以上の記憶デバイスの一例である1つ以上のメモリデバイスであり、典型的には主記憶デバイスでよい。メモリにおける少なくとも1つのメモリデバイスは、揮発性メモリデバイスであってもよいし不揮発性メモリデバイスであってもよい。
【0011】
また、以下の説明では、「永続記憶装置」は、1つ以上の記憶デバイスの一例である1つ以上の永続記憶デバイスでよい。永続記憶デバイスは、典型的には、不揮発性の記憶デバイス(例えば補助記憶デバイス)でよく、具体的には、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、NVME(Non-Volatile Memory Express)ドライブ、又は、SCM(Storage Class Memory)でよい。
【0012】
また、以下の説明では、「記憶装置」は、メモリと永続記憶装置の少なくともメモリでよい。
【0013】
また、以下の説明では、「プロセッサ」は、1つ以上のプロセッサデバイスでよい。少なくとも1つのプロセッサデバイスは、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサデバイスでよいが、GPU(Graphics Processing Unit)のような他種のプロセッサデバイスでもよい。少なくとも1つのプロセッサデバイスは、シングルコアでもよいしマルチコアでもよい。少なくとも1つのプロセッサデバイスは、プロセッサコアでもよい。少なくとも1つのプロセッサデバイスは、処理の一部又は全部を行うハードウェア記述言語によりゲートアレイの集合体である回路(例えばFPGA(Field-Programmable Gate Array)、CPLD(Complex Programmable Logic Device)又はASIC(Application Specific Integrated Circuit))といった広義のプロセッサデバイスでもよい。
【0014】
また、以下の説明では、「yyy部」の表現にて機能を説明することがあるが、機能は、1つ以上のコンピュータプログラムがプロセッサによって実行されることで実現されてもよいし、1つ以上のハードウェア回路(例えばFPGA又はASIC)によって実現されてもよいし、それらの組合せによって実現されてもよい。プログラムがプロセッサによって実行されることで機能が実現される場合、定められた処理が、適宜に記憶装置及び/又はインターフェース装置等を用いながら行われるため、機能はプロセッサの少なくとも一部とされてもよい。機能を主語として説明された処理は、プロセッサあるいはそのプロセッサを有する装置が行う処理としてもよい。プログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えば、プログラム配布計算機又は計算機が読み取り可能な記録媒体(例えば非一時的な記録媒体)であってもよい。各機能の説明は一例であり、複数の機能が1つの機能にまとめられたり、1つの機能が複数の機能に分割されたりしてもよい。
【0015】
以下、図面を参照して、本発明の一実施形態を説明する。なお、以下の説明では、「MI」は、マテリアルズインフォマティクスの略であり、「DB」は、データベースの略である。
【0016】
図1は、本発明の一実施形態におけるシステム構成の一例を示す。
【0017】
材料創出を支援する材料創出支援システム10が構築される。材料創出支援システム10は、物理的な計算機システムでもよいし、物理的な計算機システムに基づく論理的な計算機システムでもよいし、物理的な計算機システムの少なくとも一部と論理的な計算機システムの少なくとも一部との組合せでもよい。物理的な計算機システムは、一つ又は複数の物理計算機で構成されてよく、インターフェース装置、記憶装置及びそれらに接続されたプロセッサを備えてよい。論理的な計算機システムは、仮想マシンを含んでもよいし、クラウドコンピューティングサービスとしてのシステムを含んでもよい。
【0018】
材料創出支援システム10は、データ提示部50、データ取得部60及びデータ変換部70を有する。これらの機能50、60及び70は、コンピュータプログラムがプロセッサに実行されることにより実現されてよい。
【0019】
データ提示部50は、定期的に又は問合せの受信の都度に、データマート107からデータを取得し、対象データを提示する。以下、データマート107内のデータを、「整理済データ」と呼ぶ。対象データは、当該取得された整理済データと、当該整理済データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である。データマート107は、第1のデータソースの一例である。当該データとしては、セラミックス材料に関するデータを含むことが好ましい。
【0020】
データ取得部60は、当該対象データに基づく実験により得られたデータである実験データを電子実験ノート131、作製DB121及び評価DB122に格納する。電子実験ノート131、作製DB121及び評価DB122が、第2のデータソースの一例である。また、本実施形態において、「実験データ」とは、実験のサマリ、詳細、結果又は評価など実験に関わるデータでよい。
【0021】
データ変換部70は、電子実験ノート131、作製DB121及び評価DB122から実験データを取得し、当該実験データを既存の又は新たなデータマート107に含まれるデータに変換する。
【0022】
実験データに基づく整理済データが既存のデータマート107に格納された後、又は、実験データに基づく整理済データを含んだ新たなデータマート107が作成された後、対象データは、更新された又は新たに作成されたデータマート107、すなわち、過去に提示された対象データに基づき行われた実験の実験データの整理済データに基づいている。このため、創出対象の材料の種類が、材料特性に関する高精度なシミュレーションデータを得られる材料種類であるか否かに関わらず、材料創出に有用なデータが提示される可能性を高めることができる。結果として、インフォマティクスの手法による材料創出支援が可能な材料種類が拡張される。具体的には、例えば、創出対象の材料の種類が無機材料(セラミックス)であっても、材料創出に有用なデータを提示することができる。
【0023】
以下、本実施形態を詳細に説明する。
【0024】
材料創出支援システム10に関し、インターフェース装置は、実験システム110、データ取得部60及び研究者端末11Aの少なくとも一つと通信可能に接続されてよい。記憶装置には、電子実験ノート131、作製DB121、評価DB122、各種データ150、データレイク102及びデータマート107のうちの少なくとも一部のデータが格納されてよい。プロセッサは、コンピュータプログラムを実行することにより上述の機能50、60及び70を実現してよい。
【0025】
データ提示部50及びデータ変換部70が、MIプラットフォームシステム100に備えられる。データ取得部60は、MIプラットフォームシステム100の外(又は中)に備えられる。MIプラットフォームシステム100は、物理的な計算機システムでもよいし、論理的な計算機システムでもよいし、物理的な計算機システムの少なくとも一部と論理的な計算機システムの少なくとも一部との組合せでもよい。本実施形態では、MIプラットフォームシステム100は、
図2に示す通り、物理的な計算機システムであり、インターフェース装置201、記憶装置202、及び、それらに接続されたプロセッサ203を有する。インターフェース装置201を通じて、研究者端末11(少なくとも研修者端末11A)と通信がされてよい。記憶装置202に、データレイク102やデータマート107が設けられデータが格納されてよい。また、記憶装置202に、プログラムが格納されてよい。プロセッサ203が記憶装置202からプログラムを読み出し実行することでMIプラットフォームシステム100におけるデータ提示部50及びデータ変換部70の少なくとも一部の機能が実現されてよい。
【0026】
データ提示部50は、AI(Artificial Intelligence)部108及びIF(インターフェース)部109を有する。
【0027】
AI部108は、機械学習モデルの学習や、機械学習モデルを用いた推論を行う。AI部108は、例えばIF部109からの指示に応答して、データマート107から取得された整理済データを機械学習モデルに入力することにより得られた推論結果をIF部109に対し出力する。
【0028】
IF部109は、研究者端末11Aから問合せを受け、当該問合せに応答して対象データを研究者端末11Aに提示する。研究者端末11Aは、材料研究者5A(ユーザの一例)の情報処理端末(例えば、パーソナルコンピュータ又はスマートフォン)である。研究者端末11Aは、対象データの問合せの送信元の一例であり、また、対象データの提示先の一例である。IF部109は、研究者端末11Aから問合せを受けた場合に(又は定期的に)、対象データ(データマート107から取得された整理済データ、及び/又は、AI部108に指示することにより得られた推論結果に基づくデータ)が表す対象を提示する。提示される対象は、例えば、製法レシピ又は材料特性でよい。本実施形態において、「製法レシピ」とは、材料の創出の方法を意味し、典型的には、材料組成及び/又は合成プロセスを含んでよい。「材料組成」は、例えば、調合組成等でよく、「合成プロセス」は、原料種類(例えば粒径違い)やプロセス条件等でよい。製法レシピは、材料開発戦略を含んでもよい。
【0029】
材料研究者5Aは、提示された対象データを基に、新材料を創出したり、対象データに基づく実験を行ったりする。対象データの提示先(送信先)は、研究者端末11Aに代えて又は加えて、実験システム110のようなシステムでもよい。
【0030】
材料研究者5Aにより、提示された対象に基づき、実験システム110を用いた実験が行われる。例えば、実験システム110を用いた実験は、コンビナトリアル実験でよい。実験システム110は、一つ又は複数の装置、例えば、セラミックスの作製装置111(例えば、大気焼成炉)、及び、セラミックスの評価装置112(例えば、熱膨張率を評価する装置)を含んでよい。作製装置111及び評価装置112といった実験装置から実験データが出力される。出力された実験データは、データサーバ120に送信され格納される。また、コンビナトリアル実験は、実験の一例であり、コンビナトリアル実験に代えて又は加えて、ハイスループット実験、ロボットを用いた自動実験、及び、人手による作業が主体の実験、のうちの少なくとも一つが採用されてもよい。
【0031】
データ取得部60は、データサーバ120及び実験ノート部130を含む。
【0032】
データサーバ120は、実験システム110からの実験データが格納されるDBを管理する。データサーバ120が管理するDBは、実験装置の種類毎に存在してよい。例えば、作製装置111からの実験データが格納される作成DB121と、評価装置112からの実験データが格納される評価DB122とが管理されてよい。実験システム110からの実験データは、データサーバ120により構造化データとされ、DBに格納される。
【0033】
実験ノート部130は、データサーバ120が管理するDBから取得された実験データを電子実験ノート131として管理する。電子実験ノート131は、構造化されたデータ、例えばDBである。
【0034】
データ変換部70が、収集部101、特徴量計算部103、画像解析部104、自然言語解析部105及び整理部106を有する。
【0035】
収集部101は、電子実験ノート131やデータサーバ120のDBから実験データを収集し、収集された実験データを整形して、整形された実験データをデータレイク102に格納する。ここで言う「整形」とは、実験データの構成を所定の構成に整えることである。
【0036】
また、収集部101は、各種データ150を収集してよい。各種データ150は、実験データを含んでよい。具体的には、例えば、各種データ150は、過去実験の数値データ、有償又は無償で利用可能な材料データベース、過去の実験(例えば、実験内容及び実験結果)を表す言語データ、シミュレーション等の計算により得られた材料データ、及び、特許文献や論文の言語データ、の少なくとも一つを含んでよい。各種データ150のデータソースは一つ以上存在してよい。例えば、過去実験の数値データのデータソースと特許文献や論文の言語データのデータソースは異なっていてよい。各種データ150は、センサによる計測値を含んだデータであるセンサデータを含んでもよい。各種データ150の少なくとも一部のデータがデータレイク102に格納されてよい。
【0037】
特徴量計算部103は、整形された実験データにおける所定の一種類以上のデータの特徴量を算出する。これにより、当該一種類以上のデータの各々が数値化され、結果として、AI部108による処理が可能となる。例えば、一種類以上のデータは、画像データとテキストデータでよい。画像データは、画像解析部104により解析され、その解析の結果を基に、特徴量計算部103が、画像データの特徴量計算を行う。また、テキストデータは、自然言語解析部105によりテキストマイニングされ、そのテキストマイニングの結果を基に、特徴量計算部103が、テキストデータの特徴量計算を行う。特徴量計算には、上記のニューラルネットワークを用いてもよい。データレイク102内に、実験データの複製が生成され、当該複製における所定の一種類以上のデータの各々が、計算された特徴量(数値)に変換されてよい。
【0038】
整理部106が、データレイク102を、所定の条件に適合するデータ集合としての一つ又は複数のデータマート107に整理する。例えば、AI部108非経由で対象データの少なくとも一部として提示され得る整理済データを含んだデータマート107と、AI部108経由で対象データの少なくとも一部として提示され得る整理済データを含んだデータマート107とが生成されてよい。
【0039】
このように、MIプラットフォームシステム100に収集され整形された実験データに基づく整理済データが用意され、整理済データを基に対象データがMIプラットフォームシステム100により材料研究者5Aに提示される。
【0040】
また、材料研究者5Aに対するデータの提示は、MIプラットフォームシステム100非経由に行われてもよい。例えば、別の材料研究者5Bが、研修者端末11Bを用いて、電子実験ノート131から実験データを取得し、当該実験データを整理して、AI部140に入力してよい。AI部140は、研修者端末11Bの外(又は中)に実現されてよい。AI部140も、AI部108と同様に、入力された整理済データを機械学習モデルに入力することで推論を行ってよい。この推論の結果に基づくデータが材料研究者5Aに提示されてよい。この提示されたデータを基に材料研究者5Aが実験を行ってもよい。この実験のデータも、実験システム110からデータサーバ120に格納され、MIプラットフォームシステム100に収集されてよい。
【0041】
研究者端末11Aの中又は外に実現される所定の機能により、提示された対象データに基づく実験が促進されてよい。例えば、当該機能が、材料研究者5Aに対し、どのような実験を推奨するかを決定し、決定した事項を材料研究者5Aに提示してよい。或いは、対象データが、どのような実験を推奨するかを表すデータを含んでよい。
【0042】
上述の実施形態によれば、対象データの提示→実験→実験データの収集→実験データの整理済データへの変換→整理済データに基づく対象データの提示といったサイクルを高効率且つ高速に行うことが期待できる。このように、実験データを主体としたMIが実現される。このため、材料特性に関する高精度なシミュレーションデータを取得することが困難な材料種類の材料、例えば、セラミックスの複雑な高次構造の材料の創出を支援することができる。
【0043】
また、上述した実施形態によれば、MIプラットフォームシステム100を提供する組織(例えば企業)の内部又は外部の種々のデータをMIプラットフォームシステム100に集約し構造化して管理しデータマート107に反映できる。このため、提示される対象データが材料創出に有用である可能性がより高まる。
【0044】
上述の説明を基に下記の表現が可能である。下記の表現は、上述の説明の補足説明又は変形例の説明を含んでよい。
<表現1>
定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示するデータ提示部(50)と、
当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納するデータ取得部(60)と、
前記第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換するデータ変換部(70)と
を備える材料創出支援システム。
<表現2>
前記第1のデータソースから取得されたデータ、前記提示された対象データ、前記実験データ、及び、前記既存の又は新たな第1のデータソースに含まれるデータ、のうちの少なくとも一つのデータが、セラミックス材料に関するデータを含む、
表現1に記載の材料創出支援システム。
<表現3>
(A)定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示し、
(B)当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納し、
(C)前記第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換する、
材料創出支援方法。
<表現4>
前記機械学習モデルは、前記実験データの取得によって既存の又は新たな第1のデータソースに含まれる更新されたデータを取得し、パラメータを学習する、
表現3に記載の材料創出支援方法。
具体的には、例えば、次の通りである。(C)により取得された実験データ(例えばデータ変換部70により取得された実験データ)を基に、既存のデータマート107内のデータが更新される、又は、当該取得された実験データに基づくデータを含んだ新たなデータマート107が生成される。このため、既存の又は新たなデータマート107が、当該取得された実験データに基づくデータである更新データを含むこととなる。AI部108が、更新データをデータマート107から取得し、当該AI部108が使用する機械学習モデルのパラメータを学習(例えば、更新)してよい。
<表現5>
既存又は新たな実験データを収集し、第1のデータソースに含まれるデータに変換し、
定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示する、
材料創出支援方法。
例えば、この材料創出支援方法は、MIプラットフォームシステム100により行われてよい。別の言い方をすれば、材料創出支援システム10は、データ提示部50及びデータ変換部70を有しデータ取得部60を有していなくてもよい。
<表現6>
前記第1のデータソースから取得されたデータ、前記提示された対象データ、前記実験データ、前記既存の又は新たな第1のデータソースに含まれるデータ、及び、前記推論結果に基づくデータ、のうちの少なくとも一つのデータが、セラミックス材料に関するデータを含む、
表現3~5の何れか一つの表現に記載の材料創出支援方法。
<表現7>
(A)定期的に又は問合せの受信の都度に、第1のデータソースからデータを取得し、当該データと、当該データを機械学習モデルに入力することにより得られた推論結果に基づくデータとのうちの少なくとも一方である対象データを提示し、
(B)当該対象データに基づく実験により得られたデータである実験データを第2のデータソースに格納し、
(C)前記第2のデータソースから実験データを取得し、当該実験データを既存の又は新たな第1のデータソースに含まれるデータに変換し、
(D)前記(C)の第1のデータソースに含まれる学習用データを用いて、製法レシピ又は材料組成を示す推奨推論結果を出力する機械学習モデルの学習処理を実行する、
材料創出支援モデルの生成方法。
<表現8>
前記第1のデータソースから取得されたデータ、前記提示された対象データ、前記実験データ、前記既存の又は新たな第1のデータソースに含まれるデータ、前記学習用データ、及び、前記推奨推論結果を表すデータ、のうちの少なくとも一つのデータが、セラミックス材料に関するデータを含む、
表現7に記載の材料創出支援モデルの生成方法。
<表現9>
表現3~6の何れか一つの表現に記載の材料創出支援方法をコンピュータに実行させるためのプログラム。
<表現10>
表現7又は8に記載の材料創出支援モデルの生成方法をコンピュータに実行させるためのプログラム。
【0045】
さて、以下、本実施形態に係るAI部108を詳細に説明する。以下の説明では、創出対象の材料は、セラミックスであるとする。また、以下の説明では、用語の定義は下記の通りである。
・「データセット」とは、アプリケーションプログラムのようなプログラムから見た一つの論理的な電子データの塊であり、例えば、レコード、ファイル、キーバリューペア及びタプル等のうちのいずれでもよい。
・「研究者入力情報」とは、研究者5Aから入力された情報である。研究者入力情報は、IF部109に入力される。本実施形態では、研究者入力情報は、典型的には、製法レシピ又は材料特性を表す情報である。
・「研究者出力情報」とは、研究者5Aに対し出力(提供)される情報である。研究者出力情報は、IF部109から出力される。本実施形態では、研究者出力情報は、典型的には、材料特性又は製法レシピを表す情報である。
・「製法レシピデータセット」とは、材料の製法レシピを表すデータセットである。研究者入力情報が製法レシピを表す情報の場合、製法レシピデータセットは、当該研究者入力情報に基づくデータセットでよい。
・「材料特性データセット」とは、材料特性を表すデータセットである。研究者出力情報が材料特性を表す情報の場合、当該研究者出力情報は、材料特性データセットに基づく情報でよい。
【0046】
【0047】
AI部108は、データセットをIF部109から受けてもよいし(すなわち、研究者入力情報に基づくデータセットがIF部109により生成されてもよいし)、研究者入力情報をIF部109から受け当該研究者入力情報に基づくデータセットを生成してもよい。また、AI部108は、データセットをIF部109に出力してもよいし(すなわち、データセットに基づく研究者出力情報がIF部109により生成されてもよいし)、データセットに基づく研究者出力情報をIF部109に出力してもよい。また、IF部109はAI部108に含まれてもよい。
【0048】
AI部108は、機械学習モデルを用いた推論において、製法レシピデータセット311を入力し材料特性データセット313を出力(予測)する。また、本実施形態では、研究者入力情報が材料特性を表す情報である場合、AI部108は、当該材料特性を持つ材料の創出が期待される製法レシピの製法レシピデータセット311を特定し、当該製法レシピデータセット311(又は当該製法レシピデータセット311に基づく研究者出力情報)をIF部109に出力する。すなわち、研究者5Aは、製法レシピを表す情報をMIプラットフォームシステム100に入力すれば、当該製法レシピで創出されたと仮定された材料の予測される材料特性を表す情報の提供をMIプラットフォームシステム100から受けることができる。また、研究者5Aは、材料特性を表す情報をMIプラットフォームシステム100に入力すれば、当該材料特性を持つ材料の創出が期待される材料の製法レシピを表す情報の提供をMIプラットフォームシステム100から受けることができる。
【0049】
AI部108は、機械学習モデルの学習を行う学習部351と、学習済の機械学習モデルを用いた推論(つまり上述の推論)を行う推論部352とを有する。また、機械学習モデルとして、第1~第3のモデル301~303がある。第1~第3のモデル301~303は、記憶装置202に格納される。
【0050】
第1のモデル301は、製法レシピデータセット311を入力とし材料特性データセット313を出力とするモデルである。セラミックスは、結晶粒子が多数集まった複雑な高次構造(例えば、粒径、粒度分布及び粒界相等)を有するが、このような高次構造を含んだ材料特徴がセラミックスの材料特性に影響するため、一般に、製法レシピから材料特性を高精度に予測することは難しい。
【0051】
そこで、本実施形態では、材料特徴が材料特性に影響すること、言い換えれば、材料特徴と材料特性とに相関があることに基づき、材料特徴データセット312(材料特徴を表すデータセット)を入力とし材料特性データセット313を出力とする第2のモデル302が用意される。そして、材料特性データセット313を、材料特徴データセット312という中間的なデータセットを介して製法レシピデータセット311から予測可能とするために、製法レシピデータセット311を入力とし材料特徴データセット312を出力とする第3のモデル303が用意される。
【0052】
製法レシピデータセット311が表す「製法レシピ」は、上述したように、材料組成及び/又は合成プロセスを含んでよく、具体的には、例えば、一つ又は複数のレシピ項目(例えば、合成温度)と、当該一つ又は複数のレシピ項目の各々についての値(典型的には数値)とを含んでよい。
【0053】
材料特性データセット313が表す「材料特性」は、材料としての物質(例えば構造体)が示す性質を意味し、具体的には、例えば、一つ又は複数の特性項目(例えば、強度、熱膨張率等)と、当該一つ又は複数の特性項目の各々についての値(典型的には数値)とを含んでよい。
【0054】
材料特徴データセット312が表す「材料特徴」は、材料としての物質が示す物理的及び/又は化学的な状態を意味し、具体的には、例えば、一つ又は複数の特徴項目(例えば、結晶粒径、粒径分布等)と、当該一つ又は複数の特徴項目の各々についての値(典型的には数値)とを含んでよい。特徴項目毎に特徴量が材料特徴データセット312に含まれてよい。例えば、第2のモデル302を用いて、複数の特徴項目についての値を含む材料特徴から一つ又は複数の特性項目についての値を含む材料特性を予測することも、一つの特徴項目についての値を含む材料特徴から、一つ又は複数の特性項目についての値を含む材料特性を予測することも可能である。
【0055】
材料特徴データセット312は、特徴量計算部103により計算された特徴量を表すデータセットでよく、データマート107に格納されていて、データマート107から取得されてよい。材料特徴データセット312が表す一つ又は複数の特徴量は、画像データ(例えばSEM画像)やスペクトルデータからデータ処理(例えば、CNNを用いた処理)を活用して特徴量計算部103により抽出される。なお、SEMは「Scanning Electron Microscope」の略であり、CNNは「Convolutional Neural Network」の略である。
【0056】
第1~第3のモデル301~303の各々について、当該モデルは、線形回帰(例えば、Ridge回帰、Lasso回帰、Elastic Net回帰)、ロジスティクス回帰、SVM(Support Vector Machine)、決定木モデル(例えば、ランダムフォレスト、XGBoost(Xtreme Gradient Boosting)、LightGBM(Light Gradient Boosting Machine))、ニューラルネットワーク(例えば、CNN、RNN(Recurrent Neural Network)、ResNet(Residual Network))、ベイズ最適化、k-NN(k-Nearest Neighbor)、又は、それらのうちの任意の二つ以上のモデルの組合せでよい。好ましくは、例えば、第1~第3のモデル301~303の各々について、当該モデルは、ランダムフォレスト、XGBoost、LightGBM、CNN、ベイズ最適化、又は、それらのうちの任意の二つ以上のモデルの組合せでよい。例えば、下記が期待される。
・学習用のデータとして製法レシピデータセット311の数は比較的少ないが、ベイズ最適化は、予測偏差を含めた上での予測が可能であり、データ追加候補点を見つけることに優れ、データを増やしながら最適値を見つけていくこと。
・決定木モデル(例えば、ランダムフォレスト、XGBoost、LightGBM)は、単純な二項分布問題の組み合わせであるため、計算コストが少なく高精度であること。例えば、XGBoost又はLightGBMは、複数の決定木を作成し、予測誤差のある対象に対して重みづけ対応することで、過学習を防ぎ、ロバスト性が高くなる。
・CNNは、自由度が高く、複雑系に対応でき、特徴量が多いときに有用であり、適切に学習回数(典型的にはエポック数)を制御することで過学習度合を調整可能である。
【0057】
本実施形態では、第1~第3のモデル301~303の各々は、回帰式である。
【0058】
図4は、学習部351が行う処理のフローの一例を示す。
【0059】
学習部351は、第1のモデル301の学習用データ、具体的には、一つ以上の製法レシピデータセット311と、当該一つ以上の製法レシピデータセット311に対応する一つ以上の材料特性データセット313とを取得する(S401)。これらのデータセット311及び/又は313は、学習処理において研究者5Aから入力されてもよいし、学習用のデータとして予め用意されていてもよいし、実験データ及び/又は各種データ150等のデータから取得されてもよいし、或る製法レシピデータセット311が表す製法レシピにおけるレシピ項目又は値範囲が絞られた製法レシピ(又はレシピ項目や値範囲が拡張された製法レシピ)を表す製法レシピデータセット311(新たに学習部351により生成された製法レシピデータセット311)でもよい。
【0060】
学習部351は、取得されたデータセット311及び313を用いて第1のモデル301を学習する(S402)。具体的には、例えば、学習部351は、製法レシピデータセット311と当該製法レシピデータセット311に対応する材料特性データセット313(製法レシピとその製法レシピにより創出された材料の材料特性)とを用いて第1のモデル301を学習する。
【0061】
学習部351は、第1のモデル301の学習を終了するか否かを判定する(S403)。例えば、第1のモデル301の精度(予測精度)が第1の精度閾値以上の場合(又は、第1のモデル301の精度が第2のモデル302及び第3のモデル303の精度よりも高い場合)、S403の判定結果が真(S403:Yes)である。この場合、学習部351の処理が終了する。
【0062】
S403の判定結果が偽の場合(S403:No)、学習部351は、第2のモデル302の学習用データ、具体的には、一つ以上の材料特徴データセット312と、当該一つ以上の材料特徴データセット312に対応する一つ以上の材料特性データセット313とを取得する(S404)。これらのデータセット312及び/又は313は、学習処理において研究者5Aから入力されてもよいし、学習用のデータとして予め用意されていてもよいし、実験データ及び/又は各種データ150等のデータから取得されてもよいし、或る材料特徴データセット312が表す材料特徴における特徴項目又は値範囲が絞られた材料特徴(又は特徴項目や値範囲が拡張された材料特徴)を表す材料特徴データセット312(新たに学習部351により生成された材料特徴データセット312)でもよい。
【0063】
学習部351は、取得されたデータセット312及び313を用いて第2のモデル302を学習する(S405)。具体的には、例えば、学習部351は、材料特徴データセット312と当該材料特徴データセット312に対応する材料特性データセット313(材料特徴とその材料特徴を持つ材料の材料特性)とを用いて第2のモデル302を学習する。この学習の目的は、材料特性と強い相関のある材料特徴を見つけること、別の言い方をすれば、材料特性に対応の材料特徴を特定することにある。
【0064】
学習部351は、第2のモデル302の学習を終了するか否かを判定する(S406)。例えば、第2のモデル302の精度(予測精度)が第2の精度閾値以上の場合、S406の判定結果が真(S406:Yes)である。第2のモデル302の精度が閾値以上であるということは、重要な特徴項目及び/又は値(特徴量)が特定されたということである。別の言い方をすると、重要な特徴項目及び/又は値(特徴量)が特定されない場合、典型的には、第2のモデル302の精度は閾値以上にならない。
【0065】
S406の判定結果が真の場合、学習部351は、第3のモデル303の学習用データ、具体的には、第2のモデル302の学習において特定された一つ以上の材料特徴データセット312と、当該一つ以上の材料特徴データセット312に対応の一つ以上の製法レシピデータセット311とを取得する(S407)。材料特徴データセット312に対応の製法レシピデータセット311は、例えば、材料特徴データセット312に対応の材料特性データセット313に対応する製法レシピデータセット311でよい。これらのデータセット312及び/又は311は、この学習処理において用いられたデータセットから取得されたデータセットでもよいし、或る製法レシピデータセット311が表す製法レシピにおけるレシピ項目又は値範囲が絞られた製法レシピ(又はレシピ項目や値範囲が拡張された製法レシピ)を表す製法レシピデータセット311(新たに学習部351により生成された製法レシピデータセット311)でもよい。
【0066】
学習部351は、取得されたデータセット312及び311を用いて第3のモデル303を学習する(S408)。具体的には、例えば、学習部351は、材料特徴データセット312と当該材料特徴データセット312に対応する製法レシピデータセット311(材料特徴とその材料特徴を持つ材料の創出のための製法レシピ)とを用いて第3のモデル303を学習する。
【0067】
なお、第3のモデル303の学習(S407及びS408)は、第2のモデル302の学習(S404及びS405)と並行して行われてもよい。S407で取得される材料特徴データセット312は、第2のモデル302の学習において特定された(絞り込まれた)特徴量を表すデータセットでもよいし、そのような特定がされる前の材料特徴データセット312でもよい。
【0068】
学習部351は、第3のモデル303の学習を終了するか否かを判定する(S409)。第3のモデル303の精度(予測精度)が第3の精度閾値以上の場合、S409の判定結果が真(S409:Yes)である。なお、上述した第1~第3の精度閾値は、同じ値でもよいし異なる値であってもよい。
【0069】
S409の判定結果が真の場合、学習部351は、再度、S401を行う。S401では、第3のモデル303の学習において特定された(又は新たに生成された)製法レシピデータセット311と、当該製法レシピデータセット311に対応の材料特性データセット313とが取得されてよい。
【0070】
図4に示した処理によれば、上述したように、第1のモデル301の精度が第1の精度閾値以上になり学習が終了する場合、学習部351の処理が終了する。なお、S403の判定がN回(Nは2以上の整数)行われても第1のモデル301の精度が第1の精度閾値未満の場合(S403の判定結果が真とならない場合)、学習部351の処理が終了してもよい。
【0071】
本実施形態において、「再学習」とは、学習部351の処理が一旦終了し再度学習部351の処理が行われることを意味する。再学習は、所定の契機で開始されてよい。所定の契機は、例えば、下記のうちの少なくとも一つでよい。
・モデル301~303の少なくとも一つについて、前回の学習から学習データが十分に増えた(例えば、一定量を超える学習データが増えた)こと。
・モデル301~303の少なくとも一つ(例えば、第1のモデル301)の精度が、第1の精度閾値未満に劣化したこと。
【0072】
推論部352による推論は、学習部351の処理に並行して行われてよい。また、推論部352による推論において得られたデータセットが、モデル301~303のいずれかの学習に使用されてもよい。具体的には、例えば、下記のうちの少なくとも一つが採用されてよい。
・S403の判定結果が真の場合(第1のモデル301の学習が終了の場合)、第1のモデル301を用いた推論が行われ、製法レシピの提供が適宜に行われてよい。
・S406の判定結果が偽の場合(第2のモデル302の学習が未終了の場合)、第2のモデル302を用いた推論が行われ、材料特徴の提供が適宜に行われてよい。第2のモデル302を用いた推論は、例えば、第2のモデル302の精度と第2の精度閾値との差分が所定差分以下の場合に可能であってよい。
・S409の判定結果が偽の場合(第3のモデル303の学習が未終了の場合)、第3のモデル303を用いた推論が行われ、製法レシピの提供が適宜に行われてよい。第3のモデル303を用いた推論は、例えば、第3のモデル303の精度と第3の精度閾値との差分が所定差分以下の場合に可能であってよい。
・S409の判定結果が真の場合(第3のモデル303の学習が終了の場合)、且つ、S403の判定結果が偽の場合(第1のモデル301の学習が未終了の場合)、第2のモデル302及び第3のモデル303を用いた推論が行われ、製法レシピの提供が適宜に行われてよい。
・推論が行われ提供された製法レシピを基に、又は、推論が行われ提供された材料特徴を基に研究者5Aが推定した製法レシピを基に、研究者5Aにより決定された新規条件で実験が行われ、その実験に関わる製法レシピ、材料特性及び材料特徴を表す実験データが蓄積されてよい。その実験データから得られる製法レシピデータセット311、材料特徴データセット312及び材料特性データセット313が、S403、S406及びS409のいずれかの判定結果を真とするための学習、又は、再学習において、使用されてよい。新規条件は、推論結果に基づく条件を含んでもよいし、研究者5Aの知見に基づき推論結果と無関係に決定された条件を含んでもよい。
【0073】
図5は、推論部352が行う処理のフローの一例を示す。
【0074】
推論部352は、再学習がされたか否かを判定する(S501)。S501の判定結果が真の場合(S501:Yes)、推論部352は、リストを無効化する(S502)。ここで言う「リスト」とは、推論において生成又は更新されたデータであり、材料特性と製法レシピ及び/又は材料特徴との関係が記録されたデータである。リストは、推論部352により記憶装置202(
図2参照)に格納され、IF部109が参照可能である。また、リストの「無効化」とは、リストをIF部109が参照不可にすることであり、具体的には、例えば、記憶装置202からリストを削除することであってもよいし、リストに無効を意味するデータを関連付けることであってもよいし、リストを或る記憶領域から別の記憶領域に退避させることであってもよい。また、S502は無くてもよい。例えば、リストが新たに生成又は更新される都度に、最新のリストが、有効(製法レシピ又は材料特性の提供のために参照されるリスト)とされてよい。
【0075】
推論部352は、第1のモデル301の学習が終了しているか否かを判定する(S503)。S503の判定結果が真の場合(S503:Yes)、推論部352は、第1のモデル301を用いた推論を行う(S504)。具体的には、例えば、推論部352は、複数の製法レシピデータセット311を取得し、取得された製法レシピデータセット311毎に、製法レシピデータセット311を第1のモデル301に入力することにより材料特性データセット313を取得してよい。複数の製法レシピデータセット311の各々は、新たに追加された実験データや各種データ150から取得されたデータセットでもよいし、レシピ項目の組合せやレシピ項目毎の値を違えることで生成されたデータセットでもよい(例えば、推論部352は、合成温度の値を一定値ずつ増やす又は減らすなど製法レシピを繰り返し変えることで製法レシピデータセット311を増やしてよい)。推論部352は、入力された製法レシピデータセット311と取得された材料特性データセット313との組毎に、製法レシピデータセット311が表す製法レシピと材料特性データセット313が表す材料特性とをリストに記録する。また、材料特性は、当該材料特性が所定の条件に該当する場合(例えば、或る特性項目の値が所定の値範囲に含まれる場合)にリストに記録されてもよい。
【0076】
S503の判定結果が偽の場合(S503:No)、推論部352は、第3のモデル303の学習が終了しているか否かを判定する(S505)。S505の判定結果が真の場合(S505:Yes)、推論部352は、第2及び第3のモデル302及び303を用いた推論を行う(S506)。具体的には、例えば、推論部352は、材料特徴データセット312を第2のモデル302に入力することで材料特性データセット313を取得する。取得された材料特性データセット313が表す材料特性を持つ材料作成に向けて(すなわち、当該材料特性データセット313の取得のために入力された材料特徴データセット312が出力となる製法レシピデータセット311の特定のために)、推論部352は、製法レシピデータ311を第3のモデル303に入力することで、材料特徴データセット312を取得してよい。推論部352は、入力された製法レシピデータセット311と取得された材料特徴データセット312と取得された材料特性データセット313との組毎に、製法レシピデータセット311が表す製法レシピと材料特徴データセット312が表す材料特徴と材料特性データセット313が表す材料特性とをリストに記録する。リストには、更に、製法レシピと材料特性とに対応する材料特徴も記録されてよい。また、材料特性は、当該材料特性が所定の条件に該当する場合(例えば、或る特性項目の値が所定の値範囲に含まれる場合)にリストに記録されてもよい。また、複数の製法レシピデータセット311又は材料特徴データセット312の各々は、新たに追加された実験データや各種データ150から取得されたデータセットでもよいし、各項目の組合せや項目毎の値を違えることで生成されたデータセットでもよい(例えば、推論部352は、合成温度の値を一定値ずつ増やす又は減らすなど製法レシピを繰り返し変えることで製法レシピデータセット311を増やしてよい)。
【0077】
なお、S505では、第3のモデル303の学習が終了しているか否かの判定に加えて、推論部352は、第2及び第3のモデル302及び303を用いた推論の精度が閾値以上か否かを判定してよい。この判定の結果も真の場合、推論部352は、S506(第2及び第3のモデル302及び303を用いた推論)を行ってよい。
【0078】
S505の判定結果が偽の場合(S505:No)、推論部352は、第2のモデル302の学習が終了しているか否かを判定する(S507)。S507の判定結果が真の場合(S507:Yes)、推論部352は、第2のモデル302及び第3のモデル303を用いた推論を行う(S508)。具体的には、例えば、推論部352は、まず、第2のモデル302を用いて、目的の材料特性を満たすために必要な材料特徴(目的の材料特性を表す材料特性データセット313が出力となるような入力としての材料特徴データセット312)を特定する。そして、推論部352は、第3のモデル303を用いて、その特定された材料特徴を得るための製法レシピを推論する(具体的には、その特定された材料特徴を表す材料特徴データセット312が出力となるような入力としての製法レシピデータセット311を特定する)。推論部352は、入力としての製法レシピデータセット311と取得された材料特徴データセット312と取得された材料特性データセット313との組毎に、製法レシピと材料特徴と材料特性とをリストに記録する。なお、複数の製法レシピデータセット311又は材料特徴データセット312の各々は、新たに追加された実験データや各種データ150から取得されたデータセットでもよいし、レシピ項目の組合せやレシピ項目毎の値を違えることで生成されたデータセットでもよい(例えば、推論部352は、合成温度の値を一定値ずつ増やす又は減らすなど製法レシピを繰り返し変えることで製法レシピデータセット311を増やしてよい)。
【0079】
S507の判定結果が偽の場合(S507:No)、推論部352は、第2及び第3のモデル302及び303という二つのモデル、若しくは、第1のモデル301を用いた推論を行う(S509)。具体的には、例えば、推論部352は、下記の(S509-1)又は(S509-2)を行う。より具体的には、例えば、第2のモデル302及び第3のモデル303の予測精度が第1のモデル301の予測精度よりも高い場合には、推論部352は、(S509-1)を行い、第2のモデル302及び第3のモデル303の予測精度が第1のモデル301の予測精度と同じかそれよりも低い場合には、(S509-2)を行ってよい。なお、下記において、複数の製法レシピデータセット311又は材料特徴データセット312の各々は、新たに追加された実験データや各種データ150から取得されたデータセットでもよいし、各項目の組合せや項目毎の値を違えることで生成されたデータセットでもよい(例えば、推論部352は、合成温度の値を一定値ずつ増やす又は減らすなど製法レシピを繰り返し変えることで製法レシピデータセット311を増やしてよい)。
(S509-1)推論部352は、材料特徴データセット312を第2のモデル302に入力することで材料特性データセット313を取得する。取得された材料特性データセット313が表す材料特性を持つ材料作成に向けて(すなわち、当該材料特性データセット313の取得のために入力された材料特徴データセット312が出力となる製法レシピデータセット311の特定のために)、推論部352は、製法レシピデータ311を第3のモデル303に入力することで、材料特徴データセット312を取得する。推論部352は、入力された製法レシピデータ311と取得された材料特徴データセット312と取得された材料特性データセット313との組毎に、製法レシピデータ311が表す製法レシピと材料特徴データセット312が表す材料特徴と材料特性データセット313が表す材料特性とをリストに記録する。
(S509-2)推論部352は、製法レシピデータ311を第1のモデル301に入力することで材料特性データ313を取得する(実際の実験では、材料特徴の評価のために材料特徴データセット312も収集されてよい)。推論部352は、入力された製法レシピデータセット311と取得された材料特性データセット313との組毎に、製法レシピデータセット311が表す製法レシピと材料特性データセット313が表す材料特性とをリストに記録する。
【0080】
推論部352は、推論の処理を終了するか否かを判定する(S510)。S510の判定結果が真の場合(S510:Yes)、処理が終了する。S510の判定結果が偽の場合(S510:No)、処理がS501に戻る。
【0081】
図5に示した処理において、
図6に示すリスト600が生成又は更新される。IF部109が、研究者5Aから、材料特性を指定した問合せを受けた場合、当該材料特性を持つ材料の創出ための製法レシピを、リスト600を基に特定し、特定された製法レシピを研究者5Aに提供する。
【0082】
以上、一実施形態を説明したが、これは本発明の説明のための例示であって、本発明の範囲をこの実施形態にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実行することが可能である。
【0083】
例えば、
図1に示したAI部140は、上述のAI部108と同じ機能を有していてよい。
【0084】
また、例えば、収集部101が収集する「実験データ」は、コンビナトリアル実験から出るデータ、過去の実験データが蓄積されている電子実験ノート131から取得されたデータ、外部のサイト等から取得されたデータ、のうちの少なくとも一部のデータを含んでよい。また、「実験データ」は、計算データ(例えば、第一原理計算や別途機械学習で予測したデータ)を含んでもよいし、言語データを含んでもよい。また、データセット311~313のうちの少なくとも一つも、計算データや言語データを含んでもよい。
・また、学習において、画像が生成されてもよいが、実施形態では、学習において画像生成は不要である。これにより、計算負荷が小さく、且つ、モデルがシンプルであることが期待される。
【0085】
また、例えば、上述の説明を、下記のように総括することができる。下記の総括は、上述の説明の補足説明や変形例の説明を含んでよい。
【0086】
材料創出支援システム10は、例えば、入力デバイス及び表示デバイスを有する装置であるユーザ装置(例えば研究者端末11A)に接続されるインターフェース装置201と、モデル301~303が格納された記憶装置202と、インターフェース装置201及び記憶装置202に接続されたプロセッサ203とを備えてよい。プロセッサ203は、例えばコンピュータプログラムを実行することでAI部108とIF部(インターフェース部)109とを実現してよい。AI部108は、第1~第3のモデル301~303の少なくとも一つのモデルの精度(例えば予測精度)に応じて、第1のモデル301を用いた推論と、第2のモデル302及び第3のモデル303を用いた推論とのいずれかの推論を行い、リスト600(製法レシピと材料特性との関連付けを表すデータであるレシピ特性データの一例)を生成又は更新する。IF部109は、材料特性が指定された問合せを受け付け、当該問合せで指定されている特性に対応の製法レシピを、リスト600を基に特定し、当該特定された製法レシピを提供してよい。
【0087】
材料特徴と材料特性とに相関があることに基づき第2のモデル302が用意され、材料特徴データセット312という中間的なデータセットを介して製法レシピデータセット311から材料特性データセット313を予測可能とするために第3のモデル303が用意される。第2及び第3のモデル302及び303があることで、実験データの量が不十分又はその他の理由により第1のモデル301の精度が不十分でも、研究者所望の材料特性を持つ材料の創出のための製法レシピの提案に貢献することができる。
【0088】
AI部108は、第1のモデル301の精度が第1の精度閾値以上である、又は、第1のモデル301の精度が第2及び第3のモデル302及び303の精度よりも高い場合、第1のモデル301を用いた推論においてリスト600を生成又は更新してよい。これにより、製法レシピの提供に使用されるリスト600を生成又は更新するための推論をより小さい計算負荷で(材料特徴データセット312としての中間データセットの入出力無しに)行うことができる。なお、「第2のモデル302及び第3のモデル303の精度」とは、第2のモデル302の精度と第3のモデル303の精度といった個々の精度ではなく、第2のモデル302及び第3のモデル303の両方が用いられる場合の精度である。
【0089】
AI部108は、第2及び第3のモデル302及び303の学習又は推論において特定又は生成された製法レシピデータセット311及び材料特性データセット313を用いて、第1のモデル301を学習してよい。例えば、第2及び第3のモデル302及び303の学習又は推論において合成時間というレシピ項目が製法レシピにある又は無い方が好ましいことが特定され得る。このように、第2及び第3のモデル302及び303の学習又は推論において、レシピ項目の拡張又は削減や、レシピ項目についての値の拡張又は削減がされ、結果として、第1のモデル301の学習に好ましい製法レシピデータセット311が増えることが期待される。故に、第1のモデル301の精度を高めることが期待できる。
【0090】
例えば、実験データから学習用のデータセットが取得されるため、実験データが不十分であると、学習用のデータセットも不十分であり、結果として、モデル301~303の精度も不十分であり得る。また、実験データが十分になるには時間もかかるし、いつ十分になるかを保証することは困難である。そこで、AI部108は、第1のモデル301を用いた推論、及び/又は、第2及び第3のモデル302及び303を用いた推論を、モデル301~303の学習と並行して行ってよい。例えば、学習の切り替えに伴い(いずれのモデルの学習が終了したかに応じて)、AI部108は、推論で使うモデルを切り替えて(選択して)よい。
【0091】
AI部108は、第2のモデル302の学習において、複数の材料特徴データセット312から、第2のモデル302の精度が第2の精度閾値以上となる要因としての一つ以上の材料特徴データセット312を特定又は生成してよい。AI部108は、第3のモデル303の学習において、複数の製法レシピデータセット311から、第2のモデル302の学習又は推論において特定又は生成された一つ以上の材料特徴データセット312に対応の一つ以上の製法レシピデータセット311を特定又は生成してよい。AI部108は、第3のモデル303の学習又は推論において特定又は生成された一つ以上の製法レシピデータセット311と、当該一つ以上の製法レシピデータセット311に対応の一つ以上の材料特性データセット313とを用いて、第1のモデルを学習してよい。これにより、第3のモデル303の学習又は推論において材料特徴データセット312が絞り込まれるので、小さい計算負荷で第3のモデル303の精度を高めることができる。また、そのような絞り込まれた材料特徴データセット312に対応の製法レシピデータセット311が第1のモデル301の学習に用いられるため、小さい計算負荷で第1のモデル301の精度を高めることができる。
【0092】
材料特徴データセット312は、材料特徴に属する特徴項目毎に数値としての特徴量で構成されたデータセットでよい。これにより、学習及び推論にかかる計算負荷を小さくでき、且つ、第2及び第3のモデル302及び303をシンプルにすることができる。
【0093】
AI部108は、再学習を行う場合、リスト600を破棄し、再学習後の第1のモデル301を用いた推論、及び/又は、再学習後の第2のモデル302及び再学習後の第3のモデル303を用いた推論において、リスト600を新たに生成又は更新してよい。これにより、精度がより向上するまえの古いモデルを用いた推論において生成又は更新されたリストがIF部109によりレシピ提供されることを回避できる。
【0094】
また、一変形例として、次の変形例があってよい。すなわち、例えば
図7に示すように、AI部108は、第1のモデル301の精度が第1の精度閾値未満の場合(例えば、第1のモデル301の学習を所定回数実施しても第1のモデル301の精度が第1の精度閾値以上にならない場合)、第2及び第3のモデル302及び303の学習において特定又は生成された製法レシピデータセット311の他に、当該製法レシピデータセット311に対応し第2のモデル302の学習又は推論において特定又は生成された材料特徴データセット312を第1のモデル301の入力として第1のモデル301の学習(製法レシピ及び材料特徴のセットと材料特性との対応関係の学習)を行ってよい。これにより、第1のモデル301の精度を第1の精度閾値以上にできる可能性を高めることが期待できる。なお、この場合、AI部108は、第1のモデル301を用いた推論において、製法レシピの他に材料特徴を材料特性に関連付けたリスト600(つまり、製法レシピ、材料特徴及び材料特性の関係を記録したリスト600)を生成又は更新してよい。IF部109は、材料特性の他に材料特徴が指定された問合せを受け付け、当該問合せで指定されている材料特性及び材料特徴に対応した製法レシピを、リスト600を基に特定し、当該特定された製法レシピを提供してよい。
【0095】
一つのユースケースとして、例えば次のユースケースがあってよい。すなわち、材料特徴は、(1)アルキメデス法により数値化された密度及び気孔率、及び、(2)SEM画像特徴量(例えば、組成面積比及び組成面積偏差))を含んでよい。目的特性(研究者所望の材料特性)へ影響し得る特徴項目(特徴因子)は、気孔率、結晶周長、組成面積比及び組成面積偏差であってよい(「組成面積偏差」とは、一つの画像(ここではSEM画像)を構成する複数の分割領域の組成比のばらつきを表す特徴量である)。第1のモデル301は、Ridge回帰でよい(入力は、組成比、材料中継及び焼成温度などの製造条件でよく、出力は、曲げ強度及び熱膨張係数でよい)。第2のモデル302は、Ridge回帰又はLightGBMでよい(入力は、上記(1)密度及び気孔率、及び、(2)SEM画像特徴量でよく、出力は、曲げ強度及び熱膨張係数でよい)。第3のモデル303は、Ridge回帰でよい(入力は、組成比、材料粒径及び焼成温度などの製造条件でよく、出力は、上記(1)密度及び気孔率、及び、(2)SEM画像特徴量でよい)。研究者5Aからの問合せ(材料特性が指定された問合せ)に応答して、製法レシピが提供されてよい(研究者端末11Aに表示されてよい)。また、モデル301~303のいずれも、出力としての要素(例えば目的変数)毎に回帰式を含んでよい。つまり、モデル301~303のいずれも、一つ以上の回帰式を含んでよい。また、モデル301~303のいずれについても、入力としてのデータセットは共通でよいが、典型的には、モデルにおける回帰式毎に、説明変数や重み付けは異なる。
【0096】
また、
図5に例示の処理の意義は、例えば以下の通りである。
【0097】
すなわち、推論の目的として、(1)希望の材料特性をもつ材料を作製する製法レシピを見出すこと、及び、(2)モデル精度向上のため、実験データ追加用の製法レシピ候補を見出すこと、を挙げることができる。
図5のS504の推論は、(1)の目的に対応する(モデル学習が完了しているためである)。一方、
図5のS506、S508及びS509の推論は、(2)の目的に対応する(モデル学習が完了していないためである)。
【0098】
(2)の目的に対応の推論において特定された組合せ(例えば、製法レシピと材料特性との組合せ)の中から、有用又はモデル学習に効果的なデータセット(例えば、製法レシピ)を選択し、そのデータセットを基に実際に実験して得られたデータセットが学習用のデータセットとして追加され、追加されたデータセットを用いてモデル学習が行われる。このようにデータセットが増強されるため、モデルをより精度よく学習することができる。
【0099】
S505:Yesの場合、第2のモデル302及び第3のモデル303を用いた推論の精度は十分であるとみなすことができる。そのため、その推論において入出力されたデータセットを基に追加の学習用のデータセットを用意することができる。推論において入出力されたデータセットに加えて、研究者(例えば実験者)が考えて生成したデータセットも、追加の学習用のデータセットの用意に用いられてもよい。
【0100】
一方、S505:Noの場合、第2のモデル302及び第3のモデル303を用いた推論の精度は不十分であるとみなすことができる。そのため、その推論において入出力されたデータセットだけを基に追加の学習用のデータセットを用意することは困難であり、追加の学習用のデータセットを用意するために、研究者が考えて生成したデータセットも用いられることがされてよい。
【0101】
第2のモデル302の学習が第3のモデル303の学習よりも先に行われるため、S507よりもS505の判定が先に実施される方が効率的である。なお、判定の順番は、
図5に例示の順番(すなわち、S503→S505→S507の順番)に限られないでよい。
【0102】
以上の説明を基に、下記のような表現が可能である。
【0103】
AI部108は、第1のモデル301の精度が第1の閾値未満である、又は、第1のモデル301の精度が第2のモデル302及び第3のモデル303の精度よりも低い場合、第2のモデル302及び第3のモデル302を用いた推論を行ってよい。
【0104】
AI部108は、第3のモデル303よりも先に第2のモデル302を学習してよい。AI部108は、第2のモデル302及び第3のモデル303を用いた推論において入力又は出力されたデータセットを第1乃至第3のモデルの少なくとも一つの学習に使用することを、第1のケースよりも第2のケースについて優先してよい。
第1のケース:第2のモデル302及び第3のモデル303を用いた推論が、第3のモデル303の精度が第3の閾値未満である場合に行われた推論であるケース。
第2のケース:第2のモデル302及び第3のモデル303を用いた推論が、第3のモデル303の精度が第3の閾値以上である場合に行われた推論であるケース。
【0105】
第2のモデル302の精度が第2の閾値未満である場合、第2のモデル302及び第3のモデル303の精度が第1のモデル301の精度よりも高ければ、AI部108は、第2のモデル302及び第3のモデル303を用いた推論を行ってもよく、第2のモデル302及び第3のモデル303の精度が第1のモデル301の精度と同じかそれよりも低ければ、AI部108は、第1のモデル301を用いた推論を行ってもよい。
【符号の説明】
【0106】
10…材料創出支援システム 100…MIプラットフォームシステム
【要約】
システムが、第1乃至第3のモデルの少なくとも一つのモデルの精度に応じて、第1のモデルを用いた推論と、第2のモデル及び前記第3のモデルを用いた推論とのいずれかの推論を行い、当該推論において、材料の製法レシピと材料特性との関連付けを表すデータであるレシピ特性データを生成又は更新する。第1のモデルは、製法レシピを表す製法レシピデータセットを入力とし材料特性を表す材料特性データセットを出力とするモデルである。第2のモデルは、材料特徴を表す材料特徴データセットを入力とし材料特性データセットを出力とするモデルである。第3のモデルは、製法レシピデータセットを入力とし材料特徴データセットを出力とするモデルである。