IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧

特許7180791材料開発支援装置、材料開発支援方法、および材料開発支援プログラム
<>
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図1
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図2
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図3
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図4
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図5
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図6
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図7
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図8
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図9
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図10
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図11
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図12
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図13
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図14
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図15
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図16
  • 特許-材料開発支援装置、材料開発支援方法、および材料開発支援プログラム 図17
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-21
(45)【発行日】2022-11-30
(54)【発明の名称】材料開発支援装置、材料開発支援方法、および材料開発支援プログラム
(51)【国際特許分類】
   G16C 60/00 20190101AFI20221122BHJP
【FI】
G16C60/00
【請求項の数】 7
(21)【出願番号】P 2021565164
(86)(22)【出願日】2019-12-16
(86)【国際出願番号】 JP2019049168
(87)【国際公開番号】W WO2021124392
(87)【国際公開日】2021-06-24
【審査請求日】2022-03-28
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】100098394
【弁理士】
【氏名又は名称】山川 茂樹
(74)【代理人】
【識別番号】100153006
【弁理士】
【氏名又は名称】小池 勇三
(74)【代理人】
【識別番号】100064621
【弁理士】
【氏名又は名称】山川 政樹
(74)【代理人】
【識別番号】100121669
【弁理士】
【氏名又は名称】本山 泰
(72)【発明者】
【氏名】深田 健太
(72)【発明者】
【氏名】瀬山 倫子
【審査官】田付 徳雄
(56)【参考文献】
【文献】国際公開第2019/048965(WO,A1)
【文献】特開2003-44827(JP,A)
【文献】特開2012-79286(JP,A)
【文献】特開平6-208956(JP,A)
【文献】特開平7-37821(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
薄膜を形成する下地の材料と、前記薄膜の機能とを含む入力データを取得する入力データ取得部と、
薄膜の形成に用いられる複数の材料の各々と、材料によって得られる機能との関係が予め学習された第1学習モデルに対して、予め設定された検証対象の材料を入力として与え、前記第1学習モデルの演算を行い、前記検証対象の材料によって得られる機能の複数の候補を出力し、候補データを生成する候補データ生成部と、
前記薄膜を形成する下地との相性を予め学習により獲得した第2学習モデルに対して、前記入力データに含まれる前記下地の材料と、前記候補データに含まれる前記機能の複数の候補のなかから、前記入力データに含まれる前記薄膜の機能が得られる材料を選択し、選択された材料とを入力として与え、前記第2学習モデルの演算を行い、前記薄膜の構造の候補を出力する逆解析部と、
前記逆解析部により出力された前記薄膜の構造の候補を提示する提示部と
を備える材料開発支援装置。
【請求項2】
請求項1に記載の材料開発支援装置において、
複数の文書データの各々から、前記薄膜の機能を示す、予め設定されている複数の機能名を抽出する第1抽出部と、
複数の文書データの各々から、前記薄膜の形成に用いられる材料を示す、予め設定されている複数の材料名を抽出する第2抽出部と、
前記第1抽出部によって抽出された前記複数の機能名と、前記第2抽出部によって抽出された前記複数の材料名とに基づいて、前記複数の材料名の各々について、材料と、材料によって得られる機能との関係を対応付けた第1学習データを生成する第1学習データ生成部と、
前記第1抽出部によって抽出された前記複数の機能名と、前記第2抽出部によって抽出された前記複数の材料名と、抽出元の文書データとに基づいて、前記複数の材料名で示される材料の各々と、前記薄膜を形成する下地との相性とを対応付けた第2学習データを生成する第2学習データ生成部と、
前記第1学習データを用いて、予め設定されている第1機械学習モデルの学習を行い、材料と、材料によって得られる機能の関係を学習した、前記第1学習モデルを構築する第1学習処理部と、
前記第2学習データを用いて、予め設定されている第2機械学習モデルの学習を行い、前記薄膜を形成する下地との相性を学習により獲得した、前記第2学習モデルを構築する第2学習処理部と、
学習済みの前記第1学習モデルを格納する第1学習モデル格納部と、
学習済みの前記第2学習モデルを格納する第2学習モデル格納部と
をさらに備える
ことを特徴とする材料開発支援装置。
【請求項3】
複数の文書データの各々から、薄膜の機能を示す、予め設定されている複数の機能名を抽出する第1抽出部と、
複数の文書データの各々から、前記薄膜の形成に用いられる材料を示す、予め設定されている複数の材料名を抽出する第2抽出部と、
前記第1抽出部によって抽出された前記複数の機能名と、前記第2抽出部によって抽出された前記複数の材料名とに基づいて、前記複数の材料名の各々について、材料と、材料によって得られる機能との関係を対応付けた第1学習データを生成する第1学習データ生成部と、
前記第1抽出部によって抽出された前記複数の機能名と、前記第2抽出部によって抽出された前記複数の材料名と、抽出元の文書データとに基づいて、前記複数の材料名で示される材料の各々と、前記薄膜を形成する下地との相性とを対応付けた第2学習データを生成する第1学習データ生成部と、
前記第1学習データを用いて、予め設定されている第1機械学習モデルの学習を行い、材料と、材料によって得られる機能の関係を学習した、第1学習モデルを構築する第1学習処理部と、
前記第2学習データを用いて、予め設定されている第2機械学習モデルの学習を行い、前記薄膜を形成する下地との相性を学習により獲得した、第2学習モデルを構築する第2学習処理部と、
学習済みの前記第1学習モデルを格納する第1学習モデル格納部と、
学習済みの前記第2学習モデルを格納する第2学習モデル格納部と、
前記第1学習モデルおよび前記第2学習モデルを、外部へ送出する出力部と
を備える材料開発支援装置。
【請求項4】
薄膜を形成する下地の材料と、前記薄膜の機能とを含む入力データを取得する入力データ取得ステップと、
薄膜の形成に用いられる複数の材料の各々と、材料によって得られる機能との関係が予め学習された第1学習モデルに対して、予め設定された検証対象の材料を入力として与え、前記第1学習モデルの演算を行い、前記検証対象の材料によって得られる機能の複数の候補を出力し、候補データを生成する候補データ生成ステップと、
前記薄膜を形成する下地との相性を予め学習により獲得した第2学習モデルに対して、前記入力データに含まれる前記下地の材料と、前記候補データに含まれる前記機能の複数の候補のなかから、前記入力データに含まれる前記薄膜の機能が得られる材料を選択し、選択された材料とを入力として与え、前記第2学習モデルの演算を行い、前記薄膜の構造の候補を出力する逆解析ステップと、
前記逆解析ステップで出力された前記薄膜の構造の候補を提示する提示ステップと
を備える材料開発支援方法。
【請求項5】
請求項4に記載の材料開発支援方法において、
複数の文書データの各々から、前記薄膜の機能を示す、予め設定されている複数の機能名を抽出する第1抽出ステップと、
複数の文書データの各々から、前記薄膜の形成に用いられる材料を示す、予め設定されている複数の材料名を抽出する第2抽出ステップと、
前記第1抽出ステップで抽出された前記複数の機能名と、前記第2抽出ステップで抽出された前記複数の材料名とに基づいて、前記複数の材料名の各々について、材料と、材料によって得られる機能との関係を対応付けた第1学習データを生成する第1学習データ生成ステップと、
前記第1抽出ステップで抽出された前記複数の機能名と、前記第2抽出ステップで抽出された前記複数の材料名と、抽出元の文書データとに基づいて、前記複数の材料名で示される材料の各々と、前記薄膜を形成する下地との相性とを対応付けた第2学習データを生成する第2学習データ生成ステップと、
前記第1学習データを用いて、予め設定されている第1機械学習モデルの学習を行い、材料と、材料によって得られる機能の関係を学習した、前記第1学習モデルを構築する第1学習処理ステップと、
前記第2学習データを用いて、予め設定されている第2機械学習モデルの学習を行い、前記薄膜を形成する下地との相性を学習により獲得した、前記第2学習モデルを構築する第2学習処理ステップと、
学習済みの前記第1学習モデルを第1学習モデル格納部に格納する第1格納ステップと、
学習済みの前記第2学習モデルを第2学習モデル格納部に格納する第2格納ステップと
をさらに備える
ことを特徴とする材料開発支援方法。
【請求項6】
コンピュータに、
薄膜を形成する下地の材料と、前記薄膜の機能とを含む入力データを取得する入力データ取得ステップと、
薄膜の形成に用いられる複数の材料の各々と、材料によって得られる機能との関係が予め学習された第1学習モデルに対して、予め設定された検証対象の材料を入力として与え、前記第1学習モデルの演算を行い、前記検証対象の材料によって得られる機能の複数の候補を出力し、候補データを生成する候補データ生成ステップと、
前記薄膜を形成する下地との相性を予め学習により獲得した第2学習モデルに対して、前記入力データに含まれる前記下地の材料と、前記候補データに含まれる前記機能の複数の候補のなかから、前記入力データに含まれる前記薄膜の機能が得られる材料を選択し、選択された材料とを入力として与え、前記第2学習モデルの演算を行い、前記薄膜の構造の候補を出力する逆解析ステップと、
前記逆解析ステップで出力された前記薄膜の構造の候補を提示する提示ステップと
を実行させる材料開発支援プログラム。
【請求項7】
請求項6に記載の材料開発支援プログラムにおいて、
前記コンピュータに、
複数の文書データの各々から、前記薄膜の機能を示す、予め設定されている複数の機能名を抽出する第1抽出ステップと、
複数の文書データの各々から、前記薄膜の形成に用いられる材料を示す、予め設定されている複数の材料名を抽出する第2抽出ステップと、
前記第1抽出ステップで抽出された前記複数の機能名と、前記第2抽出ステップで抽出された前記複数の材料名とに基づいて、前記複数の材料名の各々について、材料と、材料によって得られる機能との関係を対応付けた第1学習データを生成する第1学習データ生成ステップと、
前記第1抽出ステップで抽出された前記複数の機能名と、前記第2抽出ステップで抽出された前記複数の材料名と、抽出元の文書データとに基づいて、前記複数の材料名で示される材料の各々と、前記薄膜を形成する下地との相性とを対応付けた第2学習データを生成する第2学習データ生成ステップと、
前記第1学習データを用いて、予め設定されている第1機械学習モデルの学習を行い、材料と、材料によって得られる機能の関係を学習した、前記第1学習モデルを構築する第1学習処理ステップと、
前記第2学習データを用いて、予め設定されている第2機械学習モデルの学習を行い、前記薄膜を形成する下地との相性を学習により獲得した、前記第2学習モデルを構築する第2学習処理ステップと、
学習済みの前記第1学習モデルを第1学習モデル格納部に格納する第1格納ステップと、
学習済みの前記第2学習モデルを第2学習モデル格納部に格納する第2格納ステップと
をさらに実行させることを特徴とする材料開発支援プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、材料開発支援装置、材料開発支援方法、および材料開発支援プログラムに関し、特にマテリアルインフォマティクス技術に関する。
【背景技術】
【0002】
近年、マテリアルインフォマティクスと呼ばれる情報科学や計算科学的手法を用いたデータ駆動による材料開発が目覚しい発展をとげている。マテリアルインフォマティクスは、従来の実験的手法では容易に行うことができない網羅的かつ迅速な材料探索技術として大きな注目を集めている。
【0003】
マテリアルインフォマティクスが対象とする分野は、例えば、バッテリー、触媒、バイオマテリアルなど多岐にわたる。さらに、分子動力学シミュレーションなど原子や分子レベルでの計算科学による材料設計技術から、機械学習などの人工知能(AI)技術との組み合わせにより、合成経路の探索や製造プロセスの最適化など多様なアプローチが検討されている。
【0004】
このような従来のマテリアルインフォマティクスの分野では、熱電変換や導電性、触媒活性、リガンドと受容体の結合などを中心として、エネルギー計算によってその性質を表現できる対象が選択されるケースが多い。
【0005】
一方、数学的に統一的な議論をすることが難しい場合、例えば、生体適合性、機械耐久性、透明性などの「複数の機能」を対象としたケースでは、各機能がトレードオフの関係であったり、独立していたりするため扱い難い場合がある。そのため、複数の機能を対象としたマテリアルインフォマティクスの適用事例は依然として少数となっている。
【0006】
しかしながら、製品を実用化するためには一つの機能だけでなく、安全性や耐久性、価格などを考慮し、複数の機能について同時に一定以上の性能を満たすことが求められる。そのため、複数の機能を対象とした材料開発技術を実現することは、マテリアルインフォマティクスの分野においても重要であるといえる。
【0007】
例えば、非特許文献1は、過去の論文などのテキスト情報を学習データとして用いて、複数の機能を満たす薄膜設計をデータ駆動により行う技術を開示している。非特許文献1では、「薄膜」に関する論文数百本をもとに、入力情報として単分子膜の官能基などの化学的性質、出力情報として接触角や血液付着性能などの複数の機能を正解ラベルとして学習させている。非特許文献1では、この学習データをもとにデータ駆動による薄膜開発を推進している。
【先行技術文献】
【非特許文献】
【0008】
【文献】Hiroyuki Tahara et al.“Data-driven Design of Protein- and Cell-resistant Surfaces: A Challenge to Design Biomaterials Using Material Informatics”. Vacuum and Surface Vol.62, No.3 (2019/3/10):p.141-146
【発明の概要】
【発明が解決しようとする課題】
【0009】
従来の技術では、複数の機能を有する「単分子膜」を用いて、生体分子と単分子膜の界面での吸着現象などに着目をしている。しかしながら、単分子膜では耐久性に課題があることや、複数の界面を有する「多層膜」には同様の手法を利用できないという課題があった。
【0010】
また学習データを作成するためには膜中の元素や官能基、結合等を論文中のデータから人手で読み解かねばならず、データベース構築のハードルが高いという点も課題となっていた。特に、多層膜の設計では層の上に別の層を製膜できるか否かを判断する処理や、論文中のテキストから機械的に収集できるデータを用いてデータベースを構築できる手法が新たに必要となる。このことからも、非特許文献1に記載された技術では、マテリアルインフォマティクスの対象を「多層膜」まで拡大し、さらにデータ収集を容易にすることは困難であった。
【0011】
本発明は、上述した課題を解決するためになされたものであり、より容易に複数の機能を有する多層膜の設計の候補を提示することを目的とする。
【課題を解決するための手段】
【0012】
上述した課題を解決するために、本発明に係る材料開発支援装置は、膜を形成する下地の材料と、前記薄膜の機能とを含む入力データを取得する入力データ取得部と、薄膜の形成に用いられる複数の材料の各々と、材料によって得られる機能との関係が予め学習された第1学習モデルに対して、予め設定された検証対象の材料を入力として与え、前記第1学習モデルの演算を行い、前記検証対象の材料によって得られる機能の複数の候補を出力し、候補データを生成する候補データ生成部と、前記薄膜を形成する下地との相性を予め学習により獲得した第2学習モデルに対して、前記入力データに含まれる前記下地の材料と、前記候補データに含まれる前記機能の複数の候補のなかから、前記入力データに含まれる前記薄膜の機能が得られる材料を選択し、選択された材料とを入力として与え、前記第2学習モデルの演算を行い、前記薄膜の構造の候補を出力する逆解析部と、前記逆解析部により出力された前記薄膜の構造の候補を提示する提示部とを備える。
【0013】
上述した課題を解決するために、本発明に係る材料開発支援装置は、複数の文書データの各々から、薄膜の機能を示す、予め設定されている複数の機能名を抽出する第1抽出部と、複数の文書データの各々から、前記薄膜の形成に用いられる材料を示す、予め設定されている複数の材料名を抽出する第2抽出部と、前記第1抽出部によって抽出された前記複数の機能名と、前記第2抽出部によって抽出された前記複数の材料名とに基づいて、前記複数の材料名の各々について、材料と、材料によって得られる機能との関係を対応付けた第1学習データを生成する第1学習データ生成部と、前記第1抽出部によって抽出された前記複数の機能名と、前記第2抽出部によって抽出された前記複数の材料名と、抽出元の文書データとに基づいて、前記複数の材料名で示される材料の各々と、前記薄膜を形成する下地との相性とを対応付けた第2学習データを生成する第1学習データ生成部と、前記第1学習データを用いて、予め設定されている第1機械学習モデルの学習を行い、材料と、材料によって得られる機能の関係を学習した、第1学習モデルを構築する第1学習処理部と、前記第2学習データを用いて、予め設定されている第2機械学習モデルの学習を行い、前記薄膜を形成する下地との相性を学習により獲得した、第2学習モデルを構築する第2学習処理部と、学習済みの前記第1学習モデルを格納する第1学習モデル格納部と、学習済みの前記第2学習モデルを格納する第2学習モデル格納部と、前記第1学習モデルおよび前記第2学習モデルを、外部へ送出する出力部とを備える。
【0014】
上述した課題を解決するために、本発明に係る材料開発支援方法は、薄膜を形成する下地の材料と、前記薄膜の機能とを含む入力データを取得する入力データ取得ステップと、薄膜の形成に用いられる複数の材料の各々と、材料によって得られる機能との関係が予め学習された第1学習モデルに対して、予め設定された検証対象の材料を入力として与え、前記第1学習モデルの演算を行い、前記検証対象の材料によって得られる機能の複数の候補を出力し、候補データを生成する候補データ生成ステップと、前記薄膜を形成する下地との相性を予め学習により獲得した第2学習モデルに対して、前記入力データに含まれる前記下地の材料と、前記候補データに含まれる前記機能の複数の候補のなかから、前記入力データに含まれる前記薄膜の機能が得られる材料を選択し、選択された材料とを入力として与え、前記第2学習モデルの演算を行い、前記薄膜の構造の候補を出力する逆解析ステップと、前記逆解析ステップで出力された前記薄膜の構造の候補を提示する提示ステップとを備える。
【0015】
上述した課題を解決するために、本発明に係る材料開発支援プログラムは、コンピュータに、薄膜を形成する下地の材料と、前記薄膜の機能とを含む入力データを取得する入力データ取得ステップと、薄膜の形成に用いられる複数の材料の各々と、材料によって得られる機能との関係が予め学習された第1学習モデルに対して、予め設定された検証対象の材料を入力として与え、前記第1学習モデルの演算を行い、前記検証対象の材料によって得られる機能の複数の候補を出力し、候補データを生成する候補データ生成ステップと、前記薄膜を形成する下地との相性を予め学習により獲得した第2学習モデルに対して、前記入力データに含まれる前記下地の材料と、前記候補データに含まれる前記機能の複数の候補のなかから、前記入力データに含まれる前記薄膜の機能が得られる材料を選択し、選択された材料とを入力として与え、前記第2学習モデルの演算を行い、前記薄膜の構造の候補を出力する逆解析ステップと、前記逆解析ステップで出力された前記薄膜の構造の候補を提示する提示ステップとを実行させる。
【発明の効果】
【0016】
本発明によれば、薄膜を形成する下地との相性を予め学習により獲得した第2学習モデルに対して、入力データに含まれる下地の材料と、候補データに含まれる機能の複数の候補のなかから、入力データに含まれる薄膜の機能が得られる材料を選択し、選択された材料とを入力として与え、第2学習モデルの演算を行い、薄膜の構造の候補を出力するので、より容易に多層膜の設計の候補を提示することができる。
【図面の簡単な説明】
【0017】
図1図1は、本発明の第1の実施の形態に係る材料開発支援装置の機能構成を示すブロック図である。
図2図2は、第1の実施の形態に係る材料開発支援装置を実現するコンピュータ構成の一例を示すブロック図である。
図3図3は、本発明に係る材料開発支援装置の具体的な構成例を示すブロック図である。
図4図4は、本発明に係る材料開発支援装置の使用例を説明するための図である。
図5図5は、第1の実施の形態に係る材料開発支援方法を説明するフローチャートである。
図6図6は、第1の実施の形態に係る抽出処理を説明するための図である。
図7図7は、第1の実施の形態に係る抽出処理を説明するためのフローチャートである。
図8図8は、第1の実施の形態に係る学習データの生成処理を説明するための図である。
図9図9は、第1の実施の形態に係る学習データの生成処理を説明するためのフローチャートである。
図10図10は、第1の実施の形態に係る学習処理を説明するための図である。
図11図11は、第1の実施の形態に係る学習処理を説明するための図である。
図12図12は、第2の実施の形態に係る材料開発支援装置の機能構成を示すブロック図である。
図13図13は、第2の実施の形態に係る材料開発支援方法を説明するフローチャートである。
図14図14は、第2の実施の形態に係る候補データの生成処理を説明するための図である。
図15図15は、第2の実施の形態に係る逆解析処理を説明するための図である。
図16図16は、第2の実施の形態に係る逆解析処理を説明するためのフローチャートである。
図17図17は、第2の実施の形態に係る材料開発支援装置の効果を説明するための図である。
【発明を実施するための形態】
【0018】
以下、本発明の好適な実施の形態について、図1から図17を参照して詳細に説明する。
【0019】
[発明の概要]
はじめに、本発明の実施の形態に係る材料開発支援装置1の概要について説明する。本実施の形態に係る材料開発支援装置1は、論文などの複数の文書データから薄膜の機能を示す予め設定された機能名と、薄膜の形成に用いられる材料を示す、予め設定された材料名を抽出し、抽出されたデータに基づいて、機械学習に用いる学習用のデータを生成する。
【0020】
材料開発支援装置1は、学習データに基づいて予め用意された機械学習モデル(第1機械学習モデル)の学習を行い、材料と、材料によって得られる機能との関係を学習した、前記第1学習モデルを構築する。また、材料開発支援装置1は、学習データを用いて、予め設定されている機械学習モデル(第2機械学習モデル)の学習を行い、薄膜を形成する下地との相性を学習により獲得した、第2学習モデルを構築する。さらに、材料開発支援装置1は、学習済みの第1学習モデルおよび第2学習モデルを外部に出力する。
【0021】
[第1の実施の形態]
まず、本発明の第1の実施の形態に係る材料開発支援装置1の構成の概要を説明する。第1の実施の形態に係る材料開発支援装置1は、機械学習を用いた学習処理を実行し、学習済みの第1学習モデルおよび第2学習モデルを構築する。図1は、材料開発支援装置1の機能構成を示すブロック図である。
【0022】
[材料開発支援装置の機能ブロック]
材料開発支援装置1は、文書DB10、第1抽出部11、第2抽出部12、学習データ生成部13、学習処理部14、記憶部15、第1学習モデル格納部16、第2学習モデル格納部17、および提示部18を備える。
【0023】
文書DB10は、論文などのテキスト情報を記憶する。文書DB10は、特定の技術、例えば、薄膜などに関する複数の文書が予め記憶されている。文書DB10は、例えば、英語など、特定の言語の文書データを記憶することができる。文書DB10に記憶されている文書データは、例えば、論文の場合には、タイトル、要約、実験方法、結果や考察など、画像データ以外のテキストデータを含む。
【0024】
なお、以下において「文」は、テキストデータを意味する。また、「文」とは、句点あるいはピリオドによって区切られた文字列のテキストデータをいい、「文書」は、複数の「文」で構成される文章を含む自然言語のテキストデータのファイルをいう。
【0025】
第1抽出部11は、文書DB10に記憶されている複数の文書データの各々から、薄膜の機能を示す、予め設定されている複数の機能名を抽出する。本実施の形態では、「機能」とは、例えば、熱電変換など、エネルギー計算などによって数学的に統一的に示すことができる機能だけでなく、数学的な関連性が比較的低い情報も含まれる。例えば、耐久性、透明性、撥液性、柔軟性などが薄膜の機能として挙げられる。これらの予め設定された機能に関する単語は、記憶部15に記憶されている。例えば、第1抽出部11は、記憶部15に記憶されている機能を示す単語、例えば、「wettability」、「conductivity」などを、文書データから抽出する。本実施の形態では、第1抽出部11は、文書データごとに機能を示す単語を抽出することができる。
【0026】
第2抽出部12は、文書DB10に記憶されている複数の文書データの各々から、薄膜の形成に用いられる材料を示す、予め設定されている複数の材料名を抽出する。「材料」とは、例えば、「methyl」、「ethyl」、「vinyl」、「fluoro」などの官能基、金属の組成、および基板(下地)の材料、例えば、「glass」、「cellulose」などが含まれる。第2抽出部12は、記憶部15に記憶されている材料を示す単語を、文書データから抽出する。第2抽出部12は、文書データごとに材料を示す単語を抽出することができる。
【0027】
第1抽出部11および第2抽出部12は、特定の単語を文書データから検出する際に、公知の文字列検索アルゴリズム、例えば、Boyer-Moore(BM)アルゴリズム、Knuth-Morris-Pratt(KMP)アルゴリズムなどを用いることができる。第1抽出部11および第2抽出部12によって文書データごとに抽出された「材料」および「機能」を含む抽出データは、記憶部15に記憶される。
【0028】
学習データ生成部13は、第1抽出部11および第2抽出部12によって予め設定された「機能」および「材料」を示す単語が抽出された抽出データに基づいて、学習用のデータを生成する。
【0029】
より詳細には、学習データ生成部(第1学習データ生成部)13は、第1抽出部11によって抽出された複数の機能名と、第2抽出部12によって抽出された複数の材料名とに基づいて、複数の材料名の各々について、材料と、材料によって得られる機能との関係を対応付けた第1学習データを生成する。材料間の相性とは、薄膜の成膜時に考慮される材料の性質を反映する基準である。
【0030】
例えば、連続もしくは同一プロセスで利用する材料のうち、薄膜の製造の順序として相性がよく、近しい手順の中で利用された実績がある場合にそれらの材料は相性が良いと定義される。一方において、薄膜の製造の順序として相性が悪く、近しい手順の中で利用された実績がない材料同士は、相性が悪いと定義される。成膜材料の選択には、一定の順序性があり、これを反映する情報が材料間の相性である。第1学習データは、例えば、2種類の材料の組み合わせに対して正解のラベルとして、相性を示す情報が付与されたデータである。
【0031】
学習データ生成部13は、文書データに含まれる、成膜プロセスに関する複数の連続するプロセスを示すテキストデータを、1つのプロセスを構成するセグメントに分割する。また、学習データ生成部13は、ある前段の材料Aと後段の材料Bとが、同一あるいは連続するプロセスの中で出現している場合に、材料Aと材料Bとに対して、相性が良いことを示すラベルを付与する。連続するプロセスとは、前段の材料Aの次に、後段の材料Bを成膜するケースのみをさしており、後段の材料Bの次に、前段の材料Aがプロセスにおいて成膜される場合には、相性が良いとはしない。例えば、前段の材料をガラス基板、後段の材料をエッチング液とすることは通常ありえるが、前段の材料がエッチング液、後段の材料がガラス基板となることは製造の順序として起こりえないことを反映している。
【0032】
また、学習データ生成部(第2学習データ生成部)13は、第1抽出部11によって抽出された複数の機能名と、第2抽出部12によって抽出された複数の材料名と、抽出元の文書データとに基づいて、複数の材料名で示される材料の各々と、薄膜を形成する下地(基板)との相性とを対応付けた第2学習データを生成する。例えば、導電材料は、ジュール熱によるヒータ膜に利用される。また、同じ導電材料であっても、電磁遮蔽膜として利用される場合がある。各材料は、利用される目的に応じた機能の実現に寄与している。
【0033】
このように、第2学習データは、第2抽出部12によって抽出された材料に、各材料が有する第1抽出部11によって抽出された機能が正解ラベルとして付与されたデータである。学習データ生成部13によって生成された第1学習データおよび第2学習データは、記憶部15に記憶される。
【0034】
学習処理部14は、学習データ生成部13によって生成された学習データにより、予め用意されている機械学習モデルなどを用いて学習モデルの学習を行い、学習済みモデルを構築する。学習処理部14は、例えば、再帰型ニューラルネットワーク(RNN)、オートエンコーダ、畳み込みニューラルネットワーク(CNN)、LSTMネットワークなどの多層ニューラルネットワークなどの公知の機械学習モデルの教師あり学習を行うことができる。なお、学習対象の機械学習モデルは任意に設定することができ、教師あり学習だけでなく、半教師あり学習などを行うこともできる。
【0035】
より詳細には、学習処理部(第1学習処理部)14は、第1学習データを用いて、予め設定されている機械学習モデルの学習を行い、材料と、材料によって得られる機能との関係を学習した、第1学習モデルを構築する。例えば、学習処理部14は、多層ニューラルネットワークを学習させて、2つの材料間の相性を表す特徴量、すなわち、多層ニューラルネットワークの構成パラメータの値を更新し、調整して、最終的な値を決定する。第1学習データを用いた学習により構築された第1学習モデルは、第1学習モデル格納部16に格納される。
【0036】
また、学習処理部(第2学習処理部)14は、第2学習データを用いて、予め設定されている機械学習モデルの学習を行い、薄膜を形成する下地との相性を学習により獲得した、第2学習モデルを構築する。
【0037】
記憶部15は、第1抽出部11および第2抽出部12によって文書データから抽出された薄膜の機能と材料とを含む抽出データを記憶する。また、記憶部15は、学習データ生成部13によって生成された第1学習データおよび第2学習データを記憶する。また、記憶部15は、学習処理部14が学習の対象として用いる予め設定された機械学習モデルに関する情報を記憶している。
【0038】
第1学習モデル格納部16は、学習処理部14によって構築された学習済みの第1学習モデルを格納する。より詳細には、第1学習モデル格納部16には、学習処理部14による学習処理で決定された多層ニューラルネットワークの重みパラメータの値等が格納されている。
【0039】
第2学習モデル格納部17は、学習処理部14によって構築された学習済みの第2学習モデルを格納する。
【0040】
提示部(出力部)18は、第1抽出部11および第2抽出部12によって文書データごとに抽出された「材料」および「機能」を示す抽出データや、学習処理部14による学習処理で得られた学習済みの第1学習モデルや第2学習モデルを外部の図示されないサーバなどに提示することができる。
【0041】
[材料開発支援装置のハードウェア構成]
次に、上述した機能を有する材料開発支援装置1を実現するコンピュータ構成の一例について、図2を参照して説明する。
【0042】
図2に示すように、材料開発支援装置1は、例えば、バス101を介して接続されるプロセッサ102、主記憶装置103、通信I/F104、補助記憶装置105、入出力I/O106を備えるコンピュータと、これらのハードウェア資源を制御するプログラムによって実現することができる。材料開発支援装置1は、例えば、外部に設けられた入力装置107と、表示装置108とがそれぞれバス101を介して接続されている。
【0043】
主記憶装置103には、プロセッサ102が各種制御や演算を行うためのプログラムが予め格納されている。プロセッサ102と主記憶装置103とによって、図1に示した第1抽出部11、第2抽出部12、学習データ生成部13、学習処理部14を含む材料開発支援装置1の各機能が実現される。
【0044】
通信I/F104は、通信ネットワークNWを介して各種外部電子機器との通信を行うためのインターフェース回路である。
【0045】
通信I/F104としては、例えば、3G、4G、5G、無線LAN、Bluetooth(登録商標)などの無線データ通信規格に対応した通信制御回路およびアンテナが用いられる。
【0046】
補助記憶装置105は、読み書き可能な記憶媒体と、その記憶媒体に対してプログラムやデータなどの各種情報を読み書きするための駆動装置とで構成されている。補助記憶装置105には、記憶媒体としてハードディスクやフラッシュメモリなどの半導体メモリを使用することができる。
【0047】
補助記憶装置105は、材料開発支援装置1が抽出処理、学習データ生成処理、学習処理を含む材料開発支援処理を行うためのプログラムを格納するプログラム格納領域を有する。補助記憶装置105によって、図1で説明した記憶部15、第1学習モデル格納部16、および第2学習モデル格納部17が実現される。補助記憶装置105は、例えば、上述したデータやプログラムやなどをバックアップするためのバックアップ領域などを有していてもよい。
【0048】
入出力I/O106は、外部機器からの信号を入力したり、外部機器へ信号を出力したりするI/O端子により構成される。
【0049】
入力装置107は、キーボードやタッチパネルなどで構成され、外部からの操作入力を受け付け、操作入力に応じた信号を生成する。
【0050】
表示装置108は、液晶ディスプレイなどによって実現される。
【0051】
[材料開発支援装置の具体的な構成例]
上述した構成を有する材料開発支援装置1の具体的構成の一例について、図3のブロック図を参照して説明する。例えば、材料開発支援装置1は、サーバ100、200、および通信端末装置300によって実現することができる。サーバ100、200、および通信端末装置300は、通信ネットワークNWを介して接続されている。なお、図3の実線で示すフローが本実施の形態に係る材料開発支援装置1に係る処理フローである(図3の「学習フェーズ」)。したがって、第1の実施の形態に係る材料開発支援装置1は、学習フェーズに関与するサーバ100、200によって実現される。
【0052】
サーバ100は、例えば、図1で説明した文書DB10、第1抽出部11、第2抽出部12、および学習データ生成部13を備える。
【0053】
サーバ200は、例えば、図1で説明した学習処理部14、第1学習モデル格納部16、および第2学習モデル格納部17を備える。
【0054】
サーバ100、200は、図2で説明したようなプロセッサ、主記憶装置、通信I/F、補助記憶装置を含むコンピュータ構成によって実現される。また、図3に示すように、サーバ100は、生成した学習データを通信ネットワークNWを介してサーバ200へ送信する。
【0055】
このように、本実施の形態に係る材料開発支援装置1は、図1に示した各機能がネットワーク上に分散した構成により実現することができる。
【0056】
[材料開発支援方法]
次に上述した構成を有する材料開発支援装置1の動作について、図3から図11を参照して説明する。
【0057】
本実施の形態に係る材料開発支援装置1は、2つの多層ニューラルネットなどの機械学習モデルの学習をそれぞれ行い、学習済みの第1学習モデルおよび第2学習モデルを構築する。図4に示すように、材料開発支援装置1によって構築される2つの学習モデルは、後述の推論処理に用いられる。すなわち、学習済みモデルに対して、ユーザによって指定される多層膜に用いられる基板の材料と、多層膜の所望とされる機能とを入力として与えることで、多層膜の各層の材料の候補が出力として提示される。
【0058】
[材料開発支援方法の概要]
まず、図5のフローチャートを参照して、本実施の形態に係る材料開発支援装置1の動作の概要を説明する。
【0059】
図5に示すように、まず、第1抽出部11および第2抽出部12は、文書DB10に格納されている文書データの一つ一つから、予め設定された薄膜の「材料」および「機能」を示す単語を抽出する(ステップS1)。
【0060】
その後、学習データ生成部13は、ステップS1で抽出された「材料」および「機能」を示す単語、および抽出対象の文書データに基づいて、材料によって得られる機能を示す第1学習データ、および2つの材料間の相性を示す第2学習データを生成する(ステップS2)。
【0061】
次に、学習処理部14は、ステップS2で生成された第1学習データを用いて所定の機械学習モデルの学習を行い、学習済みの第1学習モデルを出力し、かつ、第2学習データを用いて所定の機械学習モデルの学習を行い、学習済みの第2学習モデルを出力する(ステップS3)。より詳細には、学習処理部14は、材料間の相性を学習した第1学習モデルを構築し、かつ、材料と機能との関係を学習した第2学習モデルを構築する。
【0062】
その後、学習済みの第1学習モデルおよび第2学習モデルは、それぞれ第1学習モデル格納部16および第2学習モデル格納部17に格納される(ステップS4)。
【0063】
[抽出処理]
次に、第1抽出部11および第2抽出部12によって実行される抽出処理の具体的な例について図6および図7を参照して説明する。なお、以下においては、文書DB10に格納されている文書データが、薄膜に関する複数の論文である場合について説明する。
【0064】
また、図6に示すように、第1抽出部11および第2抽出部12によって抽出された成膜のプロセスで使用される原料を含む材料名を抽出した抽出データを中間ファイルに作成する。中間ファイルとしては、例えばCSV形式のテキストファイルを用いることができる。
【0065】
ここで、プロセスとは、図6に示すように、「coated」、「sprayed」、「modified」などの成膜に関する単語を含む文を1プロセスとして定義する(図6に示す[プロセス1(P=1)]など)。また、文の終わりは、「ピリオド、カンマ、and then」などの区切りを表す文字の出現によって判断するが、文の終わりについては任意に定義することができる。
【0066】
また、多層膜が成膜される場合には、複数のプロセスからなることから、第2抽出部12は、各プロセスで用いられる材料名を抽出して中間ファイルに抽出データを作成する。第2抽出部12は、論文データに含まれる「実験方法」の段落などに対して抽出処理を実施する。
【0067】
また、第1抽出部11は、論文データに含まれる「要約」の段落などに対して予め設定されている機能に関する単語として、例えば、「wettability」、「conductivity」などを抽出する(図6に示す「撥液性(F1)」「透明性(F3)」など)。第1抽出部11および第2抽出部12によって抽出されたデータから、図6に示す中間ファイル(抽出データ)が作成される。
【0068】
以下において、図7に示すフローチャートを用いてプロセッサ102によって実現される第1抽出部11および第2抽出部12によって実行される抽出処理につて説明する。
【0069】
まず、プロセッサ102は、抽出結果を記録する中間ファイルをオープンする(ステップS100)。次に、プロセッサ102は、ステップS102からステップS113までの処理を、文書DB10に格納されている複数の論文データの全てに対して繰り返して実行するループ処理を開始する(ステップS101)。
【0070】
次に、プロセッサ102は、文書DB10から論文データを一つ取得し、ステップS100でオープンした中間ファイルを編集する(ステップS102)。より詳細には、図6の「中間ファイルDim」に示すように、プロセッサ102は、論文データを1件取得するごとに中間ファイルに1行追加し、論文の「タイトル」ごとに付与されるT列の値を+1、「プロセス」を示すP列の値を0とする。また、プロセッサ102は、基板の材料を1つの論文データの全体から特定し、中間ファイルの「材料」を示すM列の値に、対応する材料番号を書き込む。
【0071】
次に、プロセッサ102は、論文データに含まれる実験に関する段落を特定し、段落の第1文目から最終文まで、ステップS104からステップS109までの処理を繰り返し実行する(ステップS103)。例えば、文書DB10に記憶されている論文データの各々には、予め「実験方法」の段落や「要約」の段落に、これらを識別可能な情報が付与されている。
【0072】
次に、プロセッサ102は、論文データに含まれる実験の段落を識別し、成膜に関する文を抽出する(ステップS104)。例えば、プロセッサ102は、論文データに含まれる「実験方法」の段落の第1文目から順番に、抽出を行う。
【0073】
プロセッサ102は、抽出対象の文に、成膜に関する予め設定された単語が含まれている場合には(ステップS104:YES)、中間ファイルのP列の値をインクリメント(+1)する(ステップS105)。一方において、抽出対象の文に、成膜に関する予め設定された単語が含まれていない場合には(ステップS104:NO)、結合子Bを介して処理はステップS111に移行する。
【0074】
次に、プロセッサ102は、ステップS107からステップS108までの処理を、抽出対象の1文の終了まで繰り返し実行する(ステップS106)。より詳細には、プロセッサ102は、抽出対象の1文に含まれる成膜に関する材料名を、例えば、IUPAC名などの統一可能な材料名に変換する(ステップS107)。
【0075】
次に、プロセッサ102は、中間ファイルを編集する(ステップS108)。より詳細には、プロセッサ102は、中間ファイルに1行追加し、図6に示すように、M列に材料に対応する材料番号を書き込む。また、プロセッサ102は、中間ファイルにおいて、材料の組成を表すC列に、IUPAC名などから示される官能基や金属などの名称に対応する列(図6の「C1~C5」)の値を1とし、それ以外の値を0に設定する。なお、IUPAC名で示される官能基や金属などに関するデータは、予め補助記憶装置105に記憶されている。
【0076】
また、プロセッサ102は、1文中に複数の材料が存在するときには、すべての材料に対して行を追加して中間ファイルを編集する。例えば、図6に示す中間ファイルの第2行目と第3行目は、P列の値が同一の「1」であるが、M列の値は「1」および「2」が記述されており、1文中に2つの材料が存在することが示されている。
【0077】
プロセッサ102は、1文の終了まで、ステップS107およびステップS108の処理を繰り返した後に(ステップS109)、結合子Aを介してステップS110に移行し、さらに、論文データに含まれる「実験方法」の段落の終了までステップS104からステップS109までの処理が実行される(ステップS110)
【0078】
次に、プロセッサ102は、材料名が抽出された論文データの「要約」の段落など指定の段落を検索対象として、検索条件の機能名が当てはまった場合には(ステップS112:YES)、中間ファイルを編集する(ステップS113)。
【0079】
より詳細には、プロセッサ102は、処理対象となっている同一タイトルの論文データにおいて、機能を示すF列に1を書き込む。一方、機能名が検索にヒットしない場合には(ステップS112:NO)、F列の値を0とする。例えば、図6に示すように、中間ファイルのT列の値「1」で示される、第1行目から第5行目までの同一タイトルの論文データにおいて、撥液性(F1)および透明性(F3)の値に「1」が書き込まれている。
【0080】
その後、プロセッサ102は、予め指定されている複数の機能名の全てについての検索を実行し(ステップS114)、さらに文書DB10に格納されている全ての論文データに対する上記処理が実行されると(ステップS115)、中間ファイルをクローズする(ステップS116)。
【0081】
[学習データ生成処理]
次に、プロセッサ102によって実現される学習データ生成部13による学習データの生成処理の具体的な例について、図8および図9を参照して説明する。
【0082】
図8に示すように、学習データ生成部13は、第1抽出部11および第2抽出部12によって抽出された成膜に関する「材料」および「機能」から作成された中間ファイルより、第1学習データ(図8の「Dtr1」)、および第2学習データ(図8の「Dtr2」)を生成する。これらの学習データは、中間ファイルと同様にCSV形式のデータを用いることができ。
【0083】
第1学習データは、材料と機能とが対応付けて記憶された学習データである。学習データ生成部13は、中間ファイルに格納されている材料番号(M)、材料組成(C)、および機能(F)を抜き出して第1学習データを生成する。
【0084】
第2学習データのデータ構造としては、2つの材料の材料番号(M)と材料の組成(C)、相性とが設定されている。「相性」とは、連続もしくは同一プロセスで利用する2つの材料に対しては1、それ以外を0として定義される。「相性」は、例えば、成膜の際に考慮される材料の性質を反映するものである。
【0085】
具体的な例を挙げて説明すると、i)正に帯電した表面には負に帯電した材料を成膜できるので連続的に利用されやすいが、正に帯電した表面に正に帯電した材料は製膜しがたいので連続的に利用されることが少ない。ii)また、疎水性の表面には疎水基-疎水基相互作用により疎水性の材料がなじみやすいので同時に利用されやすい。iii)チオール、ビニル基を有する材料はthiol-ene反応を利用するため連続的に利用されやすい。2つの材料間の相性とは、このような成膜材料が選択される際の一定の順序性を反映するものである。
【0086】
ここで、図8に示す第2学習データの生成処理について図9のフローチャートを用いて説明する。
【0087】
図9に示すように、プロセッサ102は、中間ファイルに記憶されている論文データのタイトルの数だけ、ステップS201からステップS206までの処理を繰り返し実行する(ステップS200)。より詳細には、プロセッサ102は、中間ファイルの中で、同一タイトル(T列の値が同じ)のもとで利用されている材料の個数Nをカウントする(ステップS201)。
【0088】
次に、プロセッサ102は、N個の材料の中から任意の2つの材料を選び、一方を前段の材料A、他方を後段の材料Bとする処理を(×2!)回繰り返す(ステップS202)。プロセッサ102は、図8に示す第2学習データを生成する。第2学習データは、「前段のプロセス」と「後段のプロセス」と「相性」とが互いに関連付けて記録される。また、「相性」の列には、相性が良いことを示す値「1」あるいは相性が悪いことを示す値「0」が予め格納されている。
【0089】
次に、プロセッサ102は、ステップS202で選択された前段の材料Aと後段の材料Bとが第2学習データにおいて、相性の値が0である場合には(ステップS203:YES)、中間ファイルのP列の値から、同一のプロセスまたは連続するプロセスの中で前段において材料A、後段において材料Bが利用されているか否かを判定する(ステップS204)。材料Aと材料Bとが同一または連続するプロセスを示すP列の値を有する場合には(ステップS204:YES)、第2学習データの該当する行の列の「相性」の値を「1」に変更する(ステップS205)。
【0090】
一方において、材料Aおよび材料Bの相性が第2学習データにおいて1である場合には(ステップS203:NO)、処理はステップS206に移行する。また、ステップS204において、前段の材料Aおよび後段の材料Bが、中間ファイルにおいて同一または連続するプロセスにない場合においても(ステップS204:NO)、処理はステップS206に移行する。すなわち、プロセッサ102は、第2学習データの前段の材料Aと後段の材料Bとの相性の値を変更しない。
【0091】
次に、プロセッサ102は、N個の材料についてのステップS203からステップS205までの処理を、組み合わせの総数である(×2!)回繰り返し実行し(ステップS206)、さらに、中間ファイルの論文データのタイトルの数(T列の番号「1,2,・・・」)の全てについて、2つの材料間の相性の値の更新を行った後(ステップS207)、処理は終了する。
【0092】
[学習処理]
次に、学習処理部14によって実行される学習処理について、図10および図11を参照して説明する。図10は、第2学習データをもとに実行される学習処理を示す図である。
【0093】
学習処理部14は、第2学習データを用いて、ニューラルネットワークNN2の学習を行う。前述したように第2学習データは、2つの材料とこれらの材料間の相性とが関連付けられたデータである。図10の例では、入力In側に前段のプロセスで利用する材料の組成情報(C)、出力y側に、相性のデータを設定している。また、図10および図11の例では、材料の組成(C)は、図中の上側の材料の組成は、多層膜の下層側の材料の組成を示し、下側の材料の組成は、上層側の材料の組成を示している。
【0094】
学習処理部14は、入力として与えられた前段の材料の組成に基づいて、ニューラルネットワークNN2の演算を行い、正解ラベルである相性が出力されるように、重みなどのパラメータの値を調整、更新および決定して、学習済みの第2学習モデルを得る。学習済みの第2学習モデルは、2つの材料に対する成膜プロセスとしての相性が学習されたモデルである。なお、ニューラルネットワークNN2の入出力のデータ構造は図10の例に限らない。
【0095】
図11に示すように、学習処理部14は、第1学習データを用いて、予め用意されているニューラルネットワークNN1の学習を行う。前述したように、第1学習データは、材料と機能との関係を示す学習データである。
【0096】
学習処理部14は、入力として材料の組成(C)を与え、ニューラルネットワークNN1の演算を行い、正解ラベルである出力の機能(F)が出力されるように、重みなどのパラメータを調整および決定し、学習済みの第1学習モデルを得る。第1学習モデルは、材料に対する機能が学習されたモデルである。なお、ニューラルネットワークNN1の入出力のデータ構造は図11の例に限らない。また、図11の例では、入力に対して1つの正解ラベルを有する場合について示しているが、機能ごとに学習を行わせる構成としてもよく、入力に対して複数の正解ラベルを持つニューラルネットワークNN1としてもよい。
【0097】
以上説明したように、第1の実施の形態に係る材料開発支援装置1によれば、多数の成膜に関する論文データから、予め設定された成膜に関する「材料」および「材料」が有する「機能」を示す単語を抽出し、抽出データを作成する。また、材料開発支援装置1は、抽出データに基づいて、2つの材料に対する成膜プロセスにおける相性を示す第2学習データを生成する。また、材料開発支援装置1は、抽出データに基づいて、材料に対する機能を示す第1学習データを生成する。
【0098】
また、材料開発支援装置1は、第1学習データを用いて、予め用意された機械学習モデルの学習を行い、材料に対する機能を学習させて、学習済みの第1学習モデルを得る。
【0099】
材料開発支援装置1は、第2学習データを用いて、予め用意された機械学習モデルの学習を行い、2つの材料に対する成膜プロセスにおける相性を学習させて、学習済みの第2学習モデルを得る。
【0100】
このように、材料開発支援装置1は、大量のテキストデータから成膜に関する情報をより効果的に収集し材料間の相性および材料に対する機能を学習するので、ユーザの成膜材料の開発を支援することができる。
【0101】
また、材料開発支援装置1は、材料に対する機能として、透明性、撥液性、導電性など数学的な関連性が比較的低い機能についても特徴量を学習するので、ユーザの成膜材料の開発をより効果的に支援できる。
【0102】
また、材料開発支援装置1は、論文データに含まれる「実験方法」や「要約」などから学習データを作成しているので、容易に学習データを生成することができる。
【0103】
[第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。なお、以下の説明では、上述した第1の実施の形態と同じ構成については同一の符号を付し、その説明を省略する。
【0104】
第1の実施の形態では、学習処理により成膜に関する材料間の相性を学習した第1学習モデル、および材料に対する機能を学習した第2学習モデルを、予め用意された機械学習モデルの学習により獲得する場合について説明した。これに対して、第2の実施の形態では、学習処理によって得られた第1学習モデルおよび第2学習モデルを用いた推論処理を実行する。
【0105】
本実施の形態に係る材料開発支援装置1Aによって実行される推論処理は、図4に示すように、入力として、例えば、多層膜を形成する際に用いる基板の材料、および多層膜に要求する機能を入力として与え、学習済みの第1学習モデル、および学習済みの第2学習モデルを用いた演算を行い、多層膜の構造の候補を出力する。多層膜の構造の候補は、入力された機能を有すると考えられる基板から垂直方向の成膜材料の候補である。
【0106】
この点において、従来からの実験を主体とした多層膜の設計指針の取得では、図4に示すように、はじめに多層膜の設計を行い、設計に基づいて薄膜を形成し、所望とされる機能の発現を得ることを目指していた。このよう従来例に係る解決手法を、順問題の解決という。一方において、本実施の形態に係る材料開発支援装置1Aでは、機能から多層膜の設計を求める順問題とはアプローチが逆となる逆問題により解決する。
【0107】
[材料開発支援装置の機能ブロック]
図12は、本実施の形態に係る材料開発支援装置1Aの構成を示すブロック図である。
材料開発支援装置1Aは、第1の実施の形態で説明した学習処理装置を構成する機能部に加え、推論処理装置を構成する候補データ生成部19、入力データ取得部20、逆解析部21、記憶部22、および出力データ生成部23を備える。以下、第1の実施の形態と異なる構成を中心に説明する。
【0108】
候補データ生成部19は、学習済みの第1学習モデルに対して、予め設定された検証対象の材料が含まれる検証データを入力し、第1学習モデルの演算を行い、各材料の有する機能を調査し、検証対象の材料によって得られる機能の複数の候補を出力し、候補データ(図14の「Dc」)を生成する。検証データ(Dv)は、図8に示すように、第1抽出部11および第2抽出部12によって文書データから抽出された「材料」および「機能」の抽出データ(中間ファイル)から、検証する対象の材料(M)の材料組成(C)が抽出されたデータである。
【0109】
入力データ取得部20は、入力装置107が受け付けたユーザによって指定された基板の材料と、所望とされる薄膜の機能に関する情報を含むデータである。取得された入力データ(図15の「Di」)は、記憶部22に記憶される。
【0110】
逆解析部21は、入力データと、候補データに含まれる任意の材料のデータとを学習済みの第2学習モデルに入力して与え、第2学習モデルの演算を実行し、出力として、ユーザの要望を満たす可能性のある材料、層の順序、および製造方法を出力する。
【0111】
記憶部22は、候補データ生成部19で生成された候補データを記憶する。また、記憶部22は、逆解析部21による出力を記憶する。
【0112】
出力データ生成部23は、逆解析部21から出力される多層膜の構造の候補を示すデータを生成する。
【0113】
提示部18は、出力データ(図15の「Dout」)を表示画面に表示することができる。
【0114】
[推論処理]
次に、上述した機能構成を有する材料開発支援装置1Aによって実行される推論処理について図13のフローチャートを用いて説明する。以下において、図12に示す学習処理装置において、事前に第1学習モデルおよび第2学習モデルが学習処理によって構築され、それぞれ第1学習モデル格納部16、および第2学習モデル格納部17に格納されているものとする。また、第1抽出部11および第2抽出部12によって抽出されたデータから生成された抽出データ(中間ファイル)より、予め検証対象の材料(M)および材料組成(C)を抽出した検証データ(図8)が記憶部22に記憶されているものとする。
【0115】
図13に示すように、まず、候補データ生成部19は、第1学習モデル格納部16から学習済みの第1学習モデルを読み込み、事前に用意された検証データを入力として与え、第1学習モデルの演算を行い、各材料の有する機能の候補を示す候補データを出力する(ステップS20)。
【0116】
候補データは、記憶部22に記憶される。なお、候補データには、抽出データである中間ファイルに格納されていない材料、すなわち、論文データにない材料を検証データに加えて、その材料に対する機能の候補を出力することもできる。これにより全く新しい膜を、材料開発における候補として提示することができる可能性がある。本実施の形態では、成膜に関する材料を官能基などによって多面的に捉えているからこそ、このような新たな膜の候補が提示可能となる。
【0117】
図14は、候補データ生成部19の動作を説明するためのブロック図である。図14の例では、出力結果(F1、F2、F3、・・・)の確率の和が1となる正解ラベルが一つのニューラルネットワークNN1を利用している。そのため、材料と機能との間の関係がより密接であるほど、ニューラルネットワークNN1の出力値が1に近くなることを表している。そのため、候補データには、入力データが有する機能の順位に関する情報が含まれることになる。入力に対応する材料は、順位がより高い機能を有する可能性が高く、順位が低い機能に関してはその機能を有する可能性が低いことになる。
【0118】
このように学習済みの第1学習モデルを用いて、候補データを生成することで、入力データ取得部20が取得する入力データで指定される機能を満たす可能性が比較的低い材料を予め排除することができる。もちろん、1つの材料には複数の機能を有することがあるので、機能ごとに確率を算出する機械学習アルゴリズムを用いることもできる。その場合には、機能ごとに確率が提示されるので、任意のしきい値によって判定処理を行うことができる。このように候補データ生成部19は、学習済みの第1学習モデルの演算より、機能に対応する材料の項となる候補データを得る。
【0119】
図13に戻り、逆解析部21は、入力データ取得部20によって取得された入力データおよび候補データを入力として与え、学習済みの第2学習モデルの演算を行い、多層膜の構造の候補を出力する逆解析処理を実行する(ステップS21)。出力データ生成部23は、逆解析部21からの出力より、多層膜の材料、膜の順序の候補を示す出力データを生成する。
【0120】
その後、提示部18は、出力データ生成部23によって生成された出力データを表示画面に表示する(ステップS22)。
【0121】
[逆解析処理]
まず、図15を参照して、逆解析処理の概要を説明する。
図15に示すように、学習済みの第2学習モデルに対して、入力データと、候補データに含まれる任意のデータとを入力として与える。入力データは、ユーザによって指定される基板の材料、および多層膜に要求する機能である。入力データとしては、例えばテキスト形式のデータを用いることができる。
【0122】
また、候補データから選択される任意のデータは、入力データでユーザに指定されている機能を満たす材料から、任意に選択して、多層膜を構成する1層目の材料として学習済みの第2学習モデルに入力される。
【0123】
図15に示すニューラルネットワークNN2は、学習済みの第2学習モデルであり、ニューラルネットワークNN2の1層目L1、2層目L2、および3層目L3の入出力が示されている。
【0124】
上述したように、ニューラルネットワークNN2の1層目L1には、入力データからのユーザ指定の基板材料、および候補データからユーザ指定の機能を満たす材料のなかから選択された材料が、多層膜の1層目の材料として入力される。ニューラルネットワークNN2は、材料間の相性が学習された学習モデルであり、入力された基板の材料と多層膜の1層目の材料との相性を、ニューラルネットワークNN2の演算により出力する。
【0125】
ニューラルネットワークNN2の1層目L1の出力から、入力された基板の材料と、多層膜の1層目の材料との相性が良いとする推論結果が得られた場合に、ニューラルネットワークNN2の2層目L2の演算を実行する。2層目L2には、基板材料との相性がよいとされた多層膜の1層目の材料、および候補データよりユーザ指定の機能を満たす材料から任意に選択された多層膜の2層目の材料を入力として与える。同様にニューラルネットワークNN2の演算結果として、多層膜の1層目の材料と、2層目の材料との相性が出力され、同様に、これらの材料間の相性が良い出力が得られると、多層膜の3層目の材料、・・・、N層目の材料まで、ニューラルネットワークNN2の演算が繰り返し実行される。
【0126】
次に、図16のフローチャートを用いて、プロセッサ102で実現される逆解析部21による逆解析処理を説明する。
【0127】
まず、プロセッサ102は、入力データからユーザによって指定された基板の材料Xを示す情報を取得する(ステップS300)。次に、プロセッサ102は、予め指定された回数のステップS302からステップS305までの逆解析処理を繰り返し実行する(ステップS301)。より詳細には、プロセッサ102は、候補データから、例えば、多層膜の材料Yを示す情報を取得する(ステップS302)。
【0128】
その後、プロセッサ102は、材料Xを前段プロセス、材料Yを後段プロセスとして、それぞれの材料の材料組成(C)を学習済みの第2学習モデルに入力として与える(ステップS303)。
【0129】
次に、プロセッサ102は、第2学習モデルの演算を行い、出力として材料Xと材料Yとの「相性が良い」、および「相性が悪い」のそれぞれのクラスにおける確率値を出力として求め、「相性が良い」確率値の方が「相性が悪い」確率値より高い場合(ステップS304:YES)、後段の材料Yを前段の材料として第2学習モデルの演算を実行する(ステップS305)。
【0130】
その後、プロセッサ102は、指定回数の逆解析処理を実行すると(ステップS306)、出力データを生成する(ステップS307)。一方において、ステップS304において、2つの材料間の「相性が悪い」確率値の方が高い場合には(ステップS304:NO)、処理はステップS307に移行し、プロセッサ102は、出力データを生成する(ステップS307)。
【0131】
以上の処理によって、基板からの垂直方向の材料の連続的な候補を出力データとして得ることができる。なお、図16で説明した逆解析処理の例では、ステップS304において、材料間の相性が悪い判定となっている場合には、処理を終了しているが、後段のニューラルネットワークNN2の演算を継続してもよい。また、ステップS302において、特定の材料、例えば、最表面に頻出する材料などが選択された場合に、処理を終了(ステップS307)する構成とすることもできる。
【0132】
さらに、成膜時の温度や溶媒への可溶性などから、ステップS302で候補データより選択される材料について制約条件を付与することで、予め候補として入力する材料の絞り込みを行うこともできる。制約条件は事前に記憶部22に記憶されている。
【0133】
また、上記制約条件の他にも、例えば、膜厚や表面の粗さ、空隙率なども多層膜が指定される機能を発現するうえで重要なファクターであるため、これらの情報についても候補データから材料を選択する際に考慮される構成とすることができる。
【0134】
[材料開発支援装置の具体的な構成例]
上述した構成を有する材料開発支援装置1Aの具体的構成の一例について、図3のブロック図を参照して説明する。例えば、材料開発支援装置1Aは、サーバ100、200、および通信端末装置300によって実現することができる。サーバ100、200、および通信端末装置300は、通信ネットワークNWを介して接続されている。なお、図3の実線で示すフローが本実施の形態に係る材料開発支援装置1Aが備える学習処理装置によって実行される処理フローである(図3の「学習フェーズ」)。
【0135】
また、図3の破線で示すフローは、本実施の形態に係る材料開発支援装置1Aが備える推論処理装置によって実行される処理フローである(図3の「推論フェーズ」)。したがって、本実施の形態に係る材料開発支援装置1Aの学習処理装置は、サーバ100、200によって実現され、推論処理装置はサーバ200、および通信端末装置300によって実現される。
【0136】
サーバ100は、例えば、図12で説明した文書DB10、第1抽出部11、第2抽出部12、および学習データ生成部13を備える。
【0137】
サーバ200は、例えば、図12で説明した学習処理部14、第1学習モデル格納部16、第2学習モデル格納部17、候補データ生成部19、記憶部22、および逆解析部21を備える。
【0138】
サーバ100、200、および通信端末装置300は、図2で説明したようなプロセッサ、主記憶装置、通信I/F、補助記憶装置を含むコンピュータ構成によって実現される。また、図3に示すように、サーバ100は、生成した学習データを通信ネットワークNWを介してサーバ200へ送信する。また、通信端末装置300とサーバ200とは通信ネットワークNWを介してデータのやり取りを行う。
【0139】
このように、本実施の形態に係る材料開発支援装置1Aは、図1に示した各機能がネットワーク上に分散した構成により実現することができる。
【0140】
[材料開発支援装置の効果]
次に、図17を参照して、本実施の形態に係る材料開発支援装置1Aの効果について説明する。
【0141】
図17は、本実施の形態に係る材料開発支援装置1Aによる学習処理および推論処理を行った結果の説明図である。本例では、有機、無機・金属材料の積層薄膜に関する文献から任意に抽出された論文39本中(「Avijit Baidya, ACS Nano 2017, 11, 11091-11099」、「Junsheng Li, Nano Lett. 2015, 15, 675-681.」など)の成膜に関する学習データを用いて、学習に用いていない論文1本中(「Jiaqi Guo, ACS Appl. Mater. Interfaces 2016, 8, 34115-34122.」)の成膜方法を予測できるかどうかを検証した。
【0142】
図17の上段は、従来例による指向と実験による順問題として膜の構造を予測する場合の手順を示している。また、図17の下段は、本実施の形態に係る材料開発支援装置1Aによって、学習済みの機械学習モデルに対して、基板の材料、および要求される機能を入力することで、出力として膜の構造が得られる逆問題としての解決処理を示している。
【0143】
図17の下段において、入力データ(「入力.txt」)では、基板の材料として「cellulose」、機能として、「撥液性」「透明性」「柔軟性」が指定されている。つまり、「透明でフレキシブル、かつ汚れなく紙」を製造する方法を逆解析によって求めることを試行している。
【0144】
また、逆解析の結果として、基板から垂直方向に沿って、「trichlorovinylsilane」、「1H,1H,2H,2H-perfluorodecanethiol」、「perfluoroalkylether」を成膜することを提案する出力データ(「出力.txt」)を得ることができる。これは、学習に用いていない論文1本中の製造方法に近しい材料の選択結果となっており、実現性が高い解といえる。
【0145】
これに対して、図17の上段に示す従来例では、多数の論文データを参照しながら、新しい機能を発現する材料を探索する実験的手法が行われている。本ケースでも、学習中のデータで利用される材料と、それらによって作成される膜の機能とを組み合わせて試行することで、学習に用いていない論文中の膜の製造方法と実現された機能には関連性があることを推定することができるものとなっている。
【0146】
つまり、本実施の形態に係る材料開発支援装置1Aは、人間が新しい技術を開発する際の思考方法のひとつを、機械学習を用いた逆解析によって模倣した技術ということもできる。さらに、模倣するだけではなく、ユーザの主観や検知によらないより合理的な材料選択や、人手では到底不可能とされる材料の組み合わせ数に対しても、網羅的な探索を実施することができる。
【0147】
以上説明したように、第2の実施の形態によれば、学習済みの第1学習モデル、および学習済みの第2学習モデルを用いて、逆解析処理を実行するので、より容易に複数の機能を有する多層膜の設計の候補を提示することができる。
【0148】
なお、説明した実施の形態では、材料開発支援装置1Aが学習処理装置、および推論処理装置を備える場合について図12において説明したが、推論処理装置は、学習処理装置とは独自した構成とするともできる。
【0149】
以上、本発明に係る材料開発支援装置、材料開発支援方法、および材料開発支援プログラムにおける実施の形態について説明したが、本発明は説明した実施の形態に限定されるものではなく、請求項に記載した発明の範囲において当業者が想定し得る各種の変形を行うことが可能である。例えば、材料開発支援方法の各ステップの順序は上記説明した順序に限られない。
【符号の説明】
【0150】
1、1A…材料開発支援装置、10…文書DB、11…第1抽出部、12…第2抽出部、13…学習データ生成部、14…学習処理部、15、22…記憶部、16…第1学習モデル格納部、17…第2学習モデル格納部、18…提示部、19…候補データ生成部、20…入力データ取得部、21…逆解析部、23…出力データ生成部、100、200…サーバ、300…通信端末装置、101…バス、102…プロセッサ、103…主記憶装置、104…通信I/F、105…補助記憶装置、106…入出力I/O、107…入力装置、108…表示装置。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17