IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社CrowdChemの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-10-08
(45)【発行日】2024-10-17
(54)【発明の名称】情報処理システム及びプログラム
(51)【国際特許分類】
   G16C 20/30 20190101AFI20241009BHJP
   G06Q 50/10 20120101ALI20241009BHJP
   G06N 20/00 20190101ALI20241009BHJP
【FI】
G16C20/30
G06Q50/10
G06N20/00 130
【請求項の数】 24
(21)【出願番号】P 2024531428
(86)(22)【出願日】2023-12-27
(86)【国際出願番号】 JP2023046964
【審査請求日】2024-05-24
(31)【優先権主張番号】P 2022212206
(32)【優先日】2022-12-28
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】522039108
【氏名又は名称】株式会社CrowdChem
(74)【代理人】
【識別番号】100174137
【弁理士】
【氏名又は名称】酒谷 誠一
(72)【発明者】
【氏名】池端 久貴
【審査官】塩田 徳彦
(56)【参考文献】
【文献】特開2022-167397(JP,A)
【文献】特開2021-174294(JP,A)
【文献】特開2022-82064(JP,A)
【文献】特表2012-524357(JP,A)
【文献】特表2023-537933(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00-99/00
G06Q 10/00-99/00
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
ユーザから受け付けた原材料それぞれを識別する情報の組み合わせと当該原材料それぞれの量を取得し、当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する予測対象物性名の物性値の予測値を取得する少なくとも一つのプロセッサを備え、
前記第1の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであり、
前記第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである情報処理システム。
【請求項2】
前記第1の機械学習モデルまたは前記第2の機械学習モデルは、複数の分野で用いられる原材料について複数の物性をまとめて学習されて構築されている、
請求項1に記載の情報処理システム。
【請求項3】
前記原材料には、添加剤が含まれており、
前記第1の機械学習モデルまたは前記第2の機械学習モデルの入力には原材料の種類または当該種類に基づく数値群が含まれており、
前記プロセッサは、ユーザから取得した原材料の種類または当該種類に基づく数値群を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する前記予測対象物性名の物性値の予測値を取得する
請求項1または2に記載の情報処理システム。
【請求項4】
前記第1の機械学習モデルまたは前記第2の機械学習モデルの入力には更に原材料の物性または当該物性に基づく数値群が含まれており、
前記プロセッサは、ユーザから取得した原材料の物性または当該物性に基づく数値群を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する前記予測対象物性名の特性値の予測値を取得する
請求項1に記載の情報処理システム。
【請求項5】
前記第1の機械学習モデルまたは前記第2の機械学習モデルの入力には原材料の特徴または当該特徴に基づく数値群が含まれており、
前記プロセッサは、ユーザから取得した原材料の特徴または当該特徴に基づく数値群を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する前記予測対象物性名の物性値の予測値を取得する
請求項1に記載の情報処理システム。
【請求項6】
前記第1の機械学習モデルまたは前記第2の機械学習モデルの入力にはプロセス条件及び/またはプロセスに使う装置に関する情報または当該情報に基づく数値群が含まれており、
前記プロセッサは、ユーザから取得したプロセス条件及び/またはプロセスに使う装置に関する情報または当該情報に基づく数値群を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する前記予測対象物性名の物性値の予測値を取得する
請求項1に記載の情報処理システム。
【請求項7】
前記プロセッサは、
ユーザから受け付けた原材料の製品名、原材料のメーカ名、原材料のカテゴリ、原材料の用途の少なくとも一つに基づいて、少なくとも一つの原材料候補を抽出し、
前記抽出された原材料候補を選択可能に表示するための情報を出力する、
請求項1に記載の情報処理システム。
【請求項8】
少なくとも一つのプロセッサを備え、
前記プロセッサは、
原材料の組み合わせと当該原材料それぞれの量の組を親個体群とみなして、遺伝的アルゴリズムに従って、次の世代の子個体群を作出し、
前記作出された次の世代の子個体群が示す原材料の組み合わせと当該原材料それぞれの量を用いて、適応度関数の値を算出し、
ユーザによって指定された物性値範囲に基づく終了条件を満たすまで、次の世代の子個体群を作出する処理を繰り返し、前記終了条件を満たす場合、最後に作出した次の世代の子個体群それぞれが示す原材料の組み合わせと当該原材料それぞれの量を含む情報を出力する
情報処理システム。
【請求項9】
前記プロセッサは、所望の物性名についてユーザによって入力された所望の物性値の範囲の組を少なくとも一組取得し、原材料の初期組み合わせに含まれる原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、前記物性名の物性値の予測値を取得し、
前記取得された物性値の予測値のうち、前記ユーザによって指定された所望の物性値の範囲を満たす原材料の組み合わせと当該原材料それぞれの量の組に絞り込み、
絞り込まれた原材料の組み合わせと当該原材料それぞれの量の組を親個体群とみなして、遺伝的アルゴリズムに従って、次の世代の子個体群を作出し、
前記第1の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであり、
前記第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換されて得られた数値群を入力とし、物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである
請求項8に記載の情報処理システム。
【請求項10】
前記第1の機械学習モデルまたは前記第2の機械学習モデルは、物性名毎に構築されており、
前記プロセッサは、ユーザから受け付けた物性名に対応する第1の機械学習モデルまたは第2の機械学習モデルを用いることによって、予測対象物性名の物性値の予測値を取得する
請求項9に記載の情報処理システム。
【請求項11】
前記プロセッサは、更に最後に作出した次の世代の子個体群それぞれが示す前記所望の物性名の物性値の予測値を出力する
請求項9または10に記載の情報処理システム。
【請求項12】
前記プロセッサは、前記出力された原材料の一つがユーザに選択された場合、当該原材料を販売する販売会社の連絡先の情報及び/または原材料の詳細な情報を出力する
請求項8に記載の情報処理システム。
【請求項13】
特許文献の実施例に関するデータが格納されている少なくとも一つの記憶装置と、
少なくとも一つのプロセッサと、
を備え、
前記プロセッサは、
前記記憶装置に格納されている実施例のうち、ユーザによって指定された原材料を使用している実施例及び/または当該原材料の組み合わせで実現される物性値が類似の原材料のうち入力された原材料を使っていない実施例を抽出し、
前記抽出された実施例が記載されている特許文献の出願人または特許権者のリストを表示するための情報を出力する
情報処理システム。
【請求項14】
前記プロセッサは、前記実施例を抽出した後、ユーザによって指定された対象の原材料を、他の原材料に置き換えたときに、物性値が類似となる原材料に絞り込む
請求項13に記載の情報処理システム。
【請求項15】
前記プロセッサは、ユーザによって指定された対象の原材料を、他の原材料に置き換えたときに、物性値が類似となる原材料に絞り込む際に、当該他の原材料と当該他の原材料の量の組を、第1の実施形態の学習済みの機械学習モデルに入力することによって、予測対象物性名の物性値の予測値をそれぞれ決定し、当該物性値の予測値それぞれを対象の原材料の物性値と比較することによって、物性値の予測値がユーザによって指定された原材料の物性値と同等以上になる原材料または類似する原材料を抽出する
請求項14に記載の情報処理システム。
【請求項16】
前記リストには、前記抽出された実施例に記載の類似の原材料が、置き換え対象の原材料として含まれている
請求項13から15のいずれか一項に記載の情報処理システム。
【請求項17】
少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサは、ユーザによって指定された目標の物性値を取得し、
ユーザによって指定された配合量の範囲を取得し、
候補原材料それぞれについてユーザによって指定された配合量の範囲で候補配合量を複数決定し、候補原材料の組と当該候補原材料のそれぞれの候補配合量の全組み合わせについて物性値を予測し、
目標の物性値と予測された物性値それぞれとの比較に基づいて、候補原材料の組及び当該候補原材料のそれぞれの量を出力する
情報処理システム。
【請求項18】
前記少なくとも一つのプロセッサは、ユーザによって指定された物質のカテゴリを取得し、ユーザによって指定された物質のカテゴリに属する原材料それぞれを前記候補原材料として抽出する
請求項17に記載の情報処理システム。
【請求項19】
少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサは、対象の組成物を構成する原材料の一部をユーザによって指定された別の原材料に置き換えた場合において、その別の原材料の量をユーザによって指定された範囲で量の候補値を複数決定する手順、
前記決定された複数の量の候補値の全てについて物性値の予測値を決定する手順、
複数の量の候補値それぞれに対応づけて物性値の予測値を提示するための情報を出力する手順、を実行し、
前記物性値の予測値を決定する手順において、前記少なくとも一つのプロセッサは、原材料それぞれに対応するSMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、物性値の予測値を取得し、
前記第1の機械学習モデルは、原材料それぞれに対応するSMILES文字列 または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであり、
前記第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである情報処理システム。
【請求項20】
原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整された第1の機械学習モデル、または原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整された学習された第2の機械学習モデルを記憶する少なくとも一つの記憶装置を参照可能なコンピュータに、
ユーザから受け付けた原材料それぞれを識別する情報の組み合わせと当該原材料それぞれの量を取得し、当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する予測対象物性名の物性値の予測値を取得する手順を実行させるためのプログラム。
【請求項21】
コンピュータに、
原材料の組み合わせと当該原材料それぞれの量の組を親個体群とみなして、遺伝的アルゴリズムに従って、次の世代の子個体群を作出する手順、
前記作出された次の世代の子個体群が示す原材料の組み合わせと当該原材料それぞれの量を用いて、適応度関数の値を算出する手順、
ユーザによって指定された物性値範囲に基づく終了条件を満たすまで、次の世代の子個体群を作出する処理を繰り返し、前記終了条件を満たす場合、最後に作出した次の世代の子個体群それぞれが示す原材料の組み合わせと当該原材料それぞれの量を含む情報を出力する手順、
を実行させるためのプログラム。
【請求項22】
特許文献の実施例に関するデータが格納されている少なくとも一つの記憶装置を参照可能なコンピュータに、
記憶装置に格納されている実施例のうち、ユーザによって指定された原材料を使用している実施例及び/または当該原材料の組み合わせで実現される物性値が類似の原材料のうち入力された原材料を使っていない実施例を抽出する手順、
前記抽出された実施例が記載されている特許文献の出願人または特許権者のリストを表示するための情報を出力する手順、
を実行させるためのプログラム。
【請求項23】
コンピュータに、
ユーザによって指定された目標の物性値を取得する手順、
ユーザによって指定された配合量の範囲を取得する手順、
候補原材料それぞれについてユーザによって指定された配合量の範囲で候補配合量を複数決定し、候補原材料の組と当該候補原材料のそれぞれの候補配合量の全組み合わせについて物性値を予測する手順、
目標の物性値と予測された物性値それぞれとの比較に基づいて、候補原材料の組及び当該候補原材料のそれぞれの量を出力する手順、
を実行させるためのプログラム。
【請求項24】
コンピュータに、
対象の組成物を構成する原材料の一部をユーザによって指定された別の原材料に置き換えた場合において、その別の原材料の量をユーザによって指定された範囲で量の候補値を複数決定する手順、
前記決定された複数の量の候補値の全てについて物性値の予測値を決定する手順、
複数の量の候補値それぞれに対応づけて物性値の予測値を提示するための情報を出力する手順、
を実行させるためのプログラムであって、
前記物性値の予測値を決定する手順において、原材料それぞれに対応するSMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、物性値の予測値を取得し、
前記第1の機械学習モデルは、原材料それぞれに対応するSMILES文字列 または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであり、
前記第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム及びプログラムに関する。
【背景技術】
【0002】
組成物の物性データを予測する手法が開発されている。例えば特許文献1では、複数の加硫ゴム組成物に関する物性データと、加硫ゴム組成物における原材料の識別名称と、前記原材料の配合比率と、前記加工条件の情報と、を用いて、前記物性データをコンピュータの予測モジュールに機械学習させることが記載されている。また特許文献1には、機械学習した予測モジュールに、予測対象加硫ゴム組成物の加硫前の未加硫ゴム組成物を構成する構成原材料の名称と、該構成原材料の配合比率と、前記予測対象加硫ゴム組成物を作製するための加工における加工条件と、を用いて、前記予測対象加硫ゴム組成物の物性データを予測させることが記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2020-038495号公報
【非特許文献】
【0004】
【文献】https://arxiv.org/abs/1712.02034
【文献】https://docs.dgl.ai/en/0.8.x/guide/training-graph.html
【発明の概要】
【課題を解決するための手段】
【0005】
本発明の第1の態様に係る情報処理システムは、ユーザから受け付けた原材料それぞれを識別する情報の組み合わせと当該原材料それぞれの量を取得し、当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する予測対象物性名の物性値の予測値を取得する少なくとも一つのプロセッサを備え、前記第1の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであり、前記第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。
【0006】
本発明の第2の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記第1の機械学習モデルまたは前記第2の機械学習モデルは、予測対象物性名毎に構築されており、前記プロセッサは、ユーザから受け付けた予測対象物性名に対応する第1の機械学習モデルまたは第2の機械学習モデルを用いることによって、予測対象物性名の物性値の予測値を取得する。あるいは本発明の第2の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記第1の機械学習モデルまたは前記第2の機械学習モデルは、複数の分野で用いられる原材料について複数の物性をまとめて学習されて構築されていてもよい。
【0007】
本発明の第3の態様に係る情報処理システムは、第1または第2の態様に係る情報処理システムであって、前記第2の機械学習モデルの入力として更に、添加剤それぞれに対応する第2化学フィンガープリント、第2SMILES文字列または第2化学グラフ構造と当該添加剤それぞれの量を用いて変換して得られた数値群を含み、前記プロセッサは、原材料それぞれに対応する前記化学フィンガープリント、SMILES文字列または化学グラフ構造のいずれかに基づく数値群と、添加剤それぞれに対応する前記第2化学フィンガープリント、第2SMILES文字列または第2化学グラフ構造のうちいずれかに基づく数値群を前記第2の機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を取得する。あるいは本発明の第3の態様に係る情報処理システムは、第1または第2の態様に係る情報処理システムであって、前記原材料には、添加剤が含まれており、前記第1の機械学習モデルまたは前記第2の機械学習モデルの入力には原材料の種類が含まれており、前記プロセッサは、ユーザから取得した原材料の種類を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する前記予測対象物性名の物性値の予測値を取得してもよい。
【0008】
本発明の第4の態様に係る情報処理システムは、第1または第2の態様に係る情報処理システムであって、前記第1の機械学習モデルの入力として更に、添加剤それぞれに対応する第2SMILES文字列または第2化学グラフ構造を含み、前記プロセッサは、原材料それぞれに対応するSMILES文字列または化学グラフ構造及び当該原材料それぞれの量と、添加剤それぞれに対応する第2SMILES文字列または第2化学グラフ構造及び当該添加剤それぞれの量を前記第1の機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を取得する。あるいは本発明の第4の態様に係る情報処理システムは、第1から第3の態様のいずれかに係る情報処理システムであって、前記第1の機械学習モデルまたは前記第2の機械学習モデルの入力には更に原材料の物性または当該物性に基づく数値群が含まれており、前記プロセッサは、ユーザから取得した原材料の物性または当該物性に基づく数値群を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、前記予測対象物性名の特性値の予測値を取得してもよい。
【0009】
本発明の第5の態様に係る情報処理システムは、第1から4のいずれかの態様に係る情報処理システムであって、前記第1の機械学習モデルまたは前記第2の機械学習モデルの入力には原材料の特徴または当該種類に基づく数値群が含まれており、前記プロセッサは、ユーザから取得した原材料の特徴または当該種類に基づく数値群を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、前記予測対象物性名の物性値の予測値を取得する。
【0010】
本発明の第6の態様に係る情報処理システムは、第1から5のいずれかの態様に係る情報処理システムであって、前記第1の機械学習モデルまたは前記第2の機械学習モデルの入力にはプロセス条件及び/またはプロセスに使う装置に関する情報または当該情報に基づく数値群が含まれており、前記プロセッサは、ユーザから取得したプロセス条件及び/またはプロセスに使う装置に関する情報または当該情報に基づく数値群を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する前記予測対象物性名の物性値の予測値を取得する。
【0011】
本発明の第7の態様に係る情報処理システムは、第1から6のいずれかの態様に係る情報処理システムであって、前記プロセッサは、ユーザから受け付けた原材料の製品名、原材料のメーカ名、原材料のカテゴリ、原材料の用途の少なくとも一つに基づいて、少なくとも一つの原材料候補を抽出し、前記抽出された原材料候補を選択可能に表示するための情報を出力する。
【0012】
本発明の第8の態様に係る情報処理システムは、少なくとも一つのプロセッサを備え、前記プロセッサは、原材料の組み合わせと当該原材料それぞれの量の組を親個体群とみなして、遺伝的アルゴリズムに従って、次の世代の子個体群を作出し、前記作出された次の世代の子個体群が示す原材料の組み合わせと当該原材料それぞれの量を用いて、適応度関数の値を算出し、ユーザによって指定された物性値範囲に基づく終了条件を満たすまで、次の世代の子個体群を作出する処理を繰り返し、前記終了条件を満たす場合、最後に作出した次の世代の子個体群それぞれが示す原材料の組み合わせと当該原材料それぞれの量を含む情報を出力する。
【0013】
本発明の第9の態様に係る情報処理システムは、第8の態様に係る情報処理システムであって、前記プロセッサは、所望の物性名についてユーザによって入力された所望の物性値の範囲の組を少なくとも一組取得し、原材料の初期組み合わせに含まれる原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、前記物性名の物性値の予測値を取得し、前記取得された物性値の予測値のうち、前記ユーザによって指定された所望の物性値の範囲を満たす原材料の組み合わせと当該原材料それぞれの量の組に絞り込み、絞り込まれた原材料の組み合わせと当該原材料それぞれの量の組を親個体群とみなして、遺伝的アルゴリズムに従って、次の世代の子個体群を作出し、前記第1の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであり、前記第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データと当該原材料それぞれの量を用いて変換されて得られた数値群を入力とし、物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。
【0014】
本発明の第10の態様に係る情報処理システムは、第9の態様に係る情報処理システムであって、前記第1の機械学習モデルまたは前記第2の機械学習モデルは、物性名毎に構築されており、前記プロセッサは、ユーザから受け付けた物性名に対応する第1の機械学習モデルまたは第2の機械学習モデルを用いることによって、予測対象物性名の物性値の予測値を取得する。
【0015】
本発明の第11の態様に係る情報処理システムは、第9または10の態様に係る情報処理システムであって、前記プロセッサは、更に最後に作出した次の世代の子個体群それぞれが示す前記所望の物性名の物性値の予測値を出力する。
【0016】
本発明の第12の態様に係る情報処理システムは、第8から11のいずれかの態様に係る情報処理システムであって、前記プロセッサは、前記出力された原材料の一つがユーザに選択された場合、当該原材料を販売する販売会社の連絡先の情報及び/または原材料の詳細な情報を出力する。
【0017】
本発明の第13の態様に係る情報処理システムは、特許文献の実施例に関するデータが格納されている少なくとも一つの記憶装置と、少なくとも一つのプロセッサと、を備え、前記プロセッサは、前記記憶装置に格納されている実施例のうち、ユーザによって指定された原材料を使用している実施例及び/または当該原材料の組み合わせで実現される物性値が類似の原材料のうち入力された原材料を使っていない実施例を抽出し、前記抽出された実施例が記載されている特許文献の出願人または特許権者のリストを表示するための情報を出力する。
【0018】
本発明の第14の態様に係る情報処理システムは、第13の態様に係る情報処理システムであって、前記プロセッサは、前記実施例を抽出した後、ユーザによって指定された対象の原材料を、他の原材料に置き換えたときに、物性値が類似となる原材料に絞り込む。
【0019】
本発明の第15の態様に係る情報処理システムは、第13の態様に係る情報処理システムであって、前記プロセッサは、ユーザによって指定された対象の原材料を、他の原材料に置き換えたときに、物性値が類似となる原材料に絞り込む際に、当該他の原材料と当該他の原材料の量の組を、第1の実施形態の学習済みの機械学習モデルに入力することによって、予測対象物性名の物性値の予測値をそれぞれ決定し、当該物性値の予測値それぞれを対象の原材料の物性値と比較することによって、物性値の予測値がユーザによって指定された原材料の物性値と同等以上になる原材料または類似する原材料を抽出する。
【0020】
本発明の第16の態様に係る情報処理システムは、第13から15のいずれかの態様に係る情報処理システムであって、前記リストには、前記抽出された実施例に記載の類似の原材料が、置き換え対象の原材料として含まれている。
【0021】
本発明の第17の態様に係る情報処理システムは、少なくとも一つのプロセッサを備え、前記少なくとも一つのプロセッサは、ユーザによって指定された目標の物性値を取得し、ユーザによって指定された配合量の範囲を取得し、候補原材料それぞれについてユーザによって指定された配合量の範囲で候補配合量を複数決定し、候補原材料の組と当該候補原材料のそれぞれの候補配合量の全組み合わせについて物性値を予測し、目標の物性値と予測された物性値それぞれとの比較に基づいて、候補原材料の組及び当該候補原材料のそれぞれの量を出力する。
【0022】
本発明の第18の態様に係る情報処理システムは、第17の態様に係る情報処理システムであって、前記少なくとも一つのプロセッサは、ユーザによって指定された物質のカテゴリ を取得し、ユーザによって指定された物質のカテゴリに属する原材料それぞれを前記候補原材料として抽出する。
【0023】
本発明の第19の態様に係る情報処理システムは、少なくとも一つのプロセッサを備え、前記少なくとも一つのプロセッサは、対象の組成物を構成する原材料の一部をユーザによって指定された別の原材料に置き換えた場合において、その別の原材料の量をユーザによって指定された範囲で量の候補値を複数決定する手順、前記決定された複数の量の候補値の全てについて物性値の予測値を決定する手順、複数の量の候補値それぞれに対応づけて物性値の予測値を提示するための情報を出力する手順、を実行し、前記物性値の予測値を決定する手順において、前記少なくとも一つのプロセッサは、原材料それぞれに対応するSMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、物性値の予測値を取得し、前記第1の機械学習モデルは、原材料それぞれに対応するSMILES文字列 または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであり、前記第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。
【0024】
本発明の第20の態様に係るプログラムは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整された第1の機械学習モデル、または原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データの組み合わせと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整された学習された第2の機械学習モデルを記憶する少なくとも一つの記憶装置を参照可能なコンピュータに、ユーザから受け付けた原材料それぞれを識別する情報の組み合わせと当該原材料それぞれの量を取得し、当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する予測対象物性名の物性値の予測値を取得する手順を実行させるためのプログラムである。
【0025】
本発明の第21の態様に係るプログラムは、コンピュータに、原材料の組み合わせと当該原材料それぞれの量の組を親個体群とみなして、遺伝的アルゴリズムに従って、次の世代の子個体群を作出する手順、前記作出された次の世代の子個体群が示す原材料の組み合わせと当該原材料それぞれの量を用いて、適応度関数の値を算出する手順、ユーザによって指定された物性値範囲に基づく終了条件を満たすまで、次の世代の子個体群を作出する処理を繰り返し、前記終了条件を満たす場合、最後に作出した次の世代の子個体群それぞれが示す原材料の組み合わせと当該原材料それぞれの量を含む情報を出力する手順、を実行させるためのプログラムである。
【0026】
本発明の第22の態様に係るプログラムは、特許文献の実施例に関するデータが格納されている少なくとも一つの記憶装置を参照可能なコンピュータに、記憶装置に格納されている実施例のうち、ユーザによって指定された原材料を使用している実施例及び/または当該原材料の組み合わせで実現される物性値が類似の原材料のうち入力された原材料を使っていない実施例を抽出する手順、前記抽出された実施例が記載されている特許文献の出願人または特許権者のリストを表示するための情報を出力する手順、を実行させるためのプログラムである。
【0027】
本発明の第23の態様に係るプログラムは、コンピュータに、ユーザによって指定された目標の物性値を取得する手順、ユーザによって指定された配合量の範囲を取得する手順、候補原材料それぞれについてユーザによって指定された配合量の範囲で候補配合量を複数決定し、候補原材料の組と当該候補原材料のそれぞれの候補配合量の全組み合わせについて物性値を予測する手順、目標の物性値と予測された物性値それぞれとの比較に基づいて、候補原材料の組及び当該候補原材料のそれぞれの量を出力する手順、を実行させるためのプログラムである。
【0028】
本発明の第24の態様に係るプログラムは、コンピュータに、対象の組成物 を構成する原材料の一部をユーザによって指定された別の原材料に置き換えた場合において、その別の原材料の量をユーザによって指定された範囲で量の候補値を複数決定する手順、前記決定された複数の量の候補値の全てについて物性値の予測値を決定する手順、複数の量の候補値それぞれに対応づけて物性値の予測値を提示するための情報を出力する手順、を実行させるためのプログラムであって、前記物性値の予測値を決定する手順において、原材料それぞれに対応するSMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、物性値の予測値を取得し、前記第1の機械学習モデルは、原材料それぞれに対応するSMILES文字列 または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであり、前記第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであるプログラムである。
【図面の簡単な説明】
【0029】
図1】各実施形態に共通する情報処理システムの概略構成図である。
図2】各実施形態に共通する端末の概略構成図である。
図3】各実施形態に共通するコンピュータシステムの概略構成図である。
図4】コンピュータシステムの記憶装置に記憶されているテーブルの一例である。
図5】第1の実施形態の端末に表示される原材料選択のための画面の一例を示す図である。
図6図5の続きの画面の一例である。
図7】第2の実施形態の端末に表示される原材料選択のための画面の一例を示す図である。
図8図7の続きの画面の一例である。
図9】第2の実施形態に係る探索プロセスの流れの一例を示すフローチャートである。
図10図9のステップS250における遺伝的アルゴリズムでの探索処理の流れの一例を示すフローチャートである。
図11】第3の実施形態の端末における画面遷移の一例を示す図である。
図12図11の続きの画面の一例である。
図13】第3の実施形態に係る販売先候補ボタンが押された際の処理の流れの一例を示すフローチャートである。
図14】原料種と配合量のグリッドサーチを説明するための図である。
図15A】第4の実施形態における端末の画面の一例を示す図である。
図15B】第4の実施形態における特許文献検索画面の一例を示す図である。
図16】第4の実施形態における実施例選択画面の一例である。
図17図16の画面G12において、選択された特許文献の実施例1に関連付けられた「AI製品探索」ボタンB121が押された場合の画面の一例である。
図18図17の画面G13において、例えば「変更」ボタンB131が押された場合の画面の一例である。
図19】第4の実施形態における物性値の予測結果の画面の一例である。
【発明を実施するための形態】
【0030】
以下、各実施形態について、図面を参照しながら説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
【0031】
<第1の課題>
原材料を組み合わせて得られる組成物の物性値を得ることが難しいという問題がある。
【0032】
本発明の一実施形態は、上記問題に鑑みてなされたものであり、原材料を組み合わせて得られる組成物の物性値を得ることを容易化することを第1の課題とする。
【0033】
<第2の課題>
またユーザが得たい材料特性を満たす原材料の組み合わせを得ることが難しいという問題がある。本発明の一実施形態は、上記問題に鑑みてなされたものであり、得たい材料特性を満たす原材料の組み合わせを得ることを容易化することを第2の課題とする。
【0034】
<第3の課題>
また原材料メーカ等にとって、対象の原材料を使用してくれる可能性がある会社を探索するのが難しいという問題がある。本発明の一実施形態は、上記問題に鑑みてなされたものであり、対象の原材料を使用してくれる可能性がある会社の探索を容易化することを第3の課題とする。
【0035】
各実施形態では、上記問題に鑑みてなされたものであり、これらの問題のうち少なくとも一つを改善することを可能とする情報処理システム及びプログラムを提供することを目的とする。
【0036】
<第1の実施形態>
第1の実施形態では、第1の課題を解決する情報処理システムについて説明する。図1は、各実施形態に共通する情報処理システムの概略構成図である。図1に示すように、情報処理システムSは、ユーザが使用する端末1-1、…、1-N(Nは自然数)とコンピュータシステム2とを備える。端末1-1、…、1-Nの各々は、コンピュータシステム2と通信回路網CNを介して通信可能に接続されている。端末は、例えばスマートフォン、タブレット端末、ノートパソコン、またはパソコンなどのコンピュータ等である。以下、端末1-1、…、1-Nを総称して端末1ともいう。
【0037】
図2は、各実施形態に共通する端末の概略構成図である。図2に示すように、端末1は一例として、入力インタフェース11と、通信モジュール12と、記憶装置13と、メモリ14と、出力インタフェース15と、プロセッサ16とを備える。なお、ここでは一態様として端末1は一つのプロセッサ16を備えるとして説明するが、複数あってもよく、すなわち一以上のプロセッサを備えればよい。またここでは一態様として端末1は一つの記憶装置13を備えるとして説明するが、複数あってもよく、すなわち一以上の記憶装置を備えればよい。
【0038】
入力インタフェース11は、端末1のユーザからの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ16へ出力する。通信モジュール12は、通信回路網CNに接続されており、コンピュータシステム2と通信する。この通信は有線であっても無線であってもよい。
【0039】
記憶装置13は例えばストレージであり、プロセッサ16が読み出して実行するためのプログラム及び各種のデータが格納されている。メモリ14は、データ及びプログラムを一時的に保持する。メモリ14は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
【0040】
出力インタフェース15は、外部のディスプレイ17と接続可能であり、当該ディスプレイ17へ信号を出力可能である。プロセッサ16は、記憶装置13からプログラムをメモリ14にロードし、当該プログラムに含まれる一連の命令を実行することによって各種の処理を行う。
【0041】
図3は、各実施形態に共通するコンピュータシステムの概略構成図である。図3に示すように、コンピュータシステム2は一例として、入力インタフェース21と、通信モジュール12と、記憶装置23と、メモリ24と、出力インタフェース25と、プロセッサ26とを備える。なお、ここでは一態様としてコンピュータシステム2は一つのプロセッサ26を備えるとして説明するが、複数あってもよく、すなわち一以上のプロセッサを備えればよい。またここでは一態様としてコンピュータシステム2は一つの記憶装置13を備えるとして説明するが、複数あってもよく、すなわち一以上の記憶装置を備えればよい。
【0042】
入力インタフェース21は、コンピュータシステム2の管理者(例えば、管理団体の従業員)からの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ26へ出力する。通信モジュール22は、通信回路網CNに接続されており、端末1-1、…、1-Nの各々と通信する。この通信は有線であっても無線であってもよい。
【0043】
記憶装置23は例えばストレージであり、プロセッサ26が読み出して実行するためのプログラム及び各種のデータが格納されている。メモリ24は、データ及びプログラムを一時的に保持する。メモリ24は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
【0044】
出力インタフェース25は、外部の装置と接続可能であり、当該外部の装置へ信号を出力可能である。プロセッサ26は、記憶装置23からプログラムをメモリ24にロードし、当該プログラムに含まれる一連の命令を実行することによって、後述する各種の処理を行う。
【0045】
図4は、コンピュータシステムの記憶装置に記憶されているテーブルの一例である。図4に示すように、テーブルT1には、化学組成物毎のデータが格納されている。例えばテーブルT1において、一つのレコードは、一つの化学組成物を構成する1番目の原材料名、その量、その単位、…、m番目(mは自然数)の原材料名、その量、その単位が含まれる。更に一つのレコードは、その化学組成物を作るプロセス条件、その化学組成物の1番目の特性名、その測定条件、その測定値、…、その化学組成物のn番目(nは自然数)の特性名、その測定条件、その測定値の組が含まれる。化学組成物によって、1つの原材料から構成されるものもあるし、複数の原材料から構成されるものもある。複数の原材料から構成される場合であっても、化学組成物によって構成される原材料の数も異なり得る。
【0046】
続いて図5及び図6を用いて、第1の実施形態の端末における画面遷移について説明する。図5は、第1の実施形態の端末に表示される原材料選択のための画面の一例を示す図である。図6は、図5の続きの画面の一例である。図5に示すように、画面G1において、原材料となる製品の検索条件を設定するための画面領域R1と、その検索結果を表示する画面領域R2が設けられている。画面領域R1には、現在製品名を入力するためのテキストボックスR11、メーカ名を入力R12、カテゴリ(具体例としてはアクリル樹脂、酸化チタン、ジルコニアなど)を選択するセレクトボックスR13、用途(具体例としては接着剤など)を入力するテキストボックスR14、予測対象物性名を選択するセレクトボックスR15、「絞り込む」ボタンB1が設けられている。条件を設定して絞り込みをする場合には、「絞り込む」ボタンB1が押下される。「絞り込む」ボタンB1が押下された場合、画面領域R2に検索結果が表示される。画面領域R2には、検索によってヒットした製品候補リストが表示され、例えば、ヒットした製品毎に、選択ボックスR21、製品名、メーカ名、CAS登録番号が表示される。
【0047】
記憶装置23にはデータベースが構築されており、製品テーブル、用途マスタテーブル、カテゴリマスタテーブル、物性値テーブルが格納されている。製品テーブルには、例えば製品を識別する製品識別情報の一例である製品IDに対して、製品名、メーカID、CAS登録番号、用途を識別する用途ID、カテゴリを識別するカテゴリIDが関連付けられて格納されている。また用途マスタテーブルでは用途IDと用途名が関連付けられて格納されている。また物性値テーブルには、製品IDと当該製品の物性値が関連付けられて格納されている。
【0048】
図5の画面G1における「絞り込む」ボタンB1が押下された場合において、製品候補リストを表示するまでのプロセッサ26の処理について説明する。プロセッサ26は、ユーザから受け付けた原材料の製品名、原材料のメーカ名、原材料のカテゴリ、原材料の用途の少なくとも一つに基づいて、少なくとも一つの原材料候補を抽出し、抽出された原材料候補を選択可能に表示するための情報を出力し、端末1へ送信する。これによって、この情報を受信した端末1の画面G1の画面領域R2には、検索によってヒットした製品候補リストが表示される。
【0049】
画面G1の画面領域R2の選択ボックスR21を少なくとも一つ選択した状態で、追加ボタンB2が押下されると、図6の画面G2に遷移する。図6の画面G2において、原材料について名称を入力可能なテキストボックスR22、量を入力可能なテキストボックスR23、単位を入力可能なテキストボックスR24が表示されており、原材料名それぞれについて名称、量、単位が入力可能である。また添加剤について名称を入力可能なテキストボックスR25、量を入力可能なテキストボックスR26が表示されており、添加剤の名称と量が入力可能である。また予測対象物性名を入力可能なテキストボックスR27が表示されており、予測対象物性名が入力可能である。
【0050】
ここでは一例として画面G1の画面領域R2において選択された選択ボックスR21に対応する原材料名がテキストボックスR22に表示される。また一例として画面G1の画面領域R1のセレクトボックスR15において選択された予測対象物性名がテキストボックスR27に表示される。
【0051】
なお、図6の画面G2において、更に加工に用いる装置名を入力可能に表示されていてもよいし、加工条件を入力可能に表示されてもよい。この場合には、機械学習モデルの入力に、装置名及び/または加工条件が追加されてもよい。
【0052】
少なくとも一つの原材料及びその量と単位、予測対象物性名が入力され、必要に応じて添加剤が入力された状態で、物性値予測ボタンB12が押下された場合、画面G3に遷移する。
【0053】
画面G3では、入力された原材料の組み合わせとそれぞれの量及び添加剤の組み合わせとそれぞれの量で生成される組成物について、入力された予測対象物性名の物性値の予測結果が表示される。図6の画面G3の例では一例としてガラス転移温度の予測値が表示される。
【0054】
<予測対象物性名の物性値の予測方法>
続いて、予測対象物性名の物性値の予測方法について、まず処理の概要を説明した後、具体的な処理方法について説明する。
記憶装置13には、学習済みの機械学習モデルが記憶されている。具体的には例えば記憶装置13には、予測対象物性名毎に構築された機械学習モデルが記憶されている。場合によって、予測対象物性名を追加して、当該追加した予測対象物性名について機械学習モデルが構築されてもよい。なお、プロセッサは、ゼロから学習して機械学習モデルを構築してもよいし、記憶されている機械学習モデルに対して教師データを追加または更新して再学習させてもよい。ここで機械学習モデルは例えば、化学組成物を構成する原材料の名称の組み合わせと当該原材料それぞれの量を変換して得られた化学フィンガープリントを入力とし、予測対象物性名の物性値を出力とする学習データセットによって学習されたモデルである。この場合、ユーザが原材料の名称の組み合わせと当該原材料それぞれの量を入力すると、プロセッサ26は例えば、原材料が複数入力された場合、入力された複数の原材料をフィンガープリントに変換し得られたフィンガープリントそれぞれの数値を、それぞれの量で加重平均することによって、対応する化学フィンガープリントに変換してもよい。ここでフィンガープリントに変換する工程においては、ユーザによって原材料が入力された場合、プロセッサ26は例えば、この原材料を、SMILES(Simplified Molecular Input Line Entry System)の表記により構造式を文字や記号を用いて1行の文字列(例えば、CC1=CC2など)に変換し(または文字列として読み込み)、更に変換後の文字列を、数値列で表される化学フィンガープリントに変換してもよい。
一方、プロセッサ26は原材料が1つだけ入力された場合、その原材料を化学フィンガープリントに変換してもよい。
【0055】
別の方法として、機械学習モデルは例えば、化学組成物を構成する原材料それぞれを変換した化学フィンガープリントと原材料それぞれの量を入力として含み、予測対象物性名の物性値を出力とする学習データセットによって学習されたモデルであってもよい。この場合、ユーザが原材料の名称の組み合わせと当該原材料それぞれの量を入力すると、プロセッサ26は、入力された原材料それぞれを対応する化学フィンガープリントに変換してもよい。
更に別の方法として、機械学習モデルは例えば、化学組成物を構成する原材料を識別する情報(例えば、インデックス、名称、CAS登録番号など)それぞれと当該原材料それぞれの量を入力として含み、予測対象物性名の物性値を出力とする学習データセットによって学習されたモデルであってもよい。
【0056】
プロセッサ26は、ユーザから受け付けた原材料の名称の組み合わせと当該原材料それぞれの量を取得し、当該原材料の名称の組み合わせと当該原材料それぞれの量から化学フィンガープリントに変換し、得られた化学フィンガープリントを、記憶装置23に記憶された学習済みの機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を取得する。より具体的には例えばプロセッサ26は、ユーザから受け付けた予測対象物性名に対応する機械学習モデルに、当該化学フィンガープリントを入力することによって、予測対象物性名の物性値の予測値を取得する。
【0057】
なお、機械学習モデルには、複数のフィンガープリントが入力可能であってもよく、入力されるフィンガープリントは2つだけに限らず、3つ以上であってもよい。具体的には機械学習モデルは、複数のフィンガープリントを入力とし予測対象物性名の物性値の予測値を出力として学習したモデルであってもよい。その一例として第2の機械学習モデルの入力として更に、添加剤それぞれに対応する化学フィンガープリントを当該添加剤それぞれの量で例えば加重平均して変換して得られた第2化学フィンガープリントを含んでもよい。この場合、プロセッサ26は、少なくとも一つの前記化学フィンガープリントと少なくとも一つの前記第2化学フィンガープリントを学習済みの第2の機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を取得してもよい。例えば添加剤を種別で区別する場合、第2化学フィンガープリントに加えて、第3フィンガープリント以降があってもよい。また役割の違う原材料(例えばポリマー)2種類以上のそれぞれのフィンガープリントと、役割の違う添加剤2種類以上のフィンガープリント、あわせて4つ以上の場合であってもよく、これらの4つ以上のフィンガープリントを学習済みの第2の機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を取得してもよい。
【0058】
なお、これまで化学フィンガープリントに変換する例について説明したが、これに限ったものではない。プロセッサ26は、少なくとも一つの原材料(及び/または少なくとも一つの添加物)の化学式をSMILESの表記により文字列(以下、SMILES文字列ともいう)に変換し、変換後のSMILES文字列またはSMILES文字列それぞれを変換した数値群(例えばベクトル)を機械学習モデル(例えば文字列を入力する場合には自然言語処理系の機械学習モデル、例えば数値群を入力する場合にはニューラルネットワーク)に入力して、予測対象物性名の物性値の予測値を出力してもよい。ここで、ベクトルへの変換方法としては例えば非特許文献1に記載のSmiles2vecという技術を用いて、SMILES文字列をベクトルに変換してもよい。このSmiles2vecという技術は、RNN(リカレントネットワーク:再帰的ニューラルネットワーク)の考えに基づいたLSTM(Long short-term memory)やGRU(Gated recurrent unit)などの層を使う。ここで、機械学習モデルは、SMILES文字列またはSMILES文字列に基づく数値群(例えば上記変換されたベクトル)を入力とし予測対象物性名の物性値の予測値を出力とする学習データによって学習されたモデルである。この数値群はベクトル(例えば1次元配列)であってもよいし、行列(多次元配列)であってもよい。
【0059】
あるいは、プロセッサ26は、少なくとも一つの原材料(及び/または少なくとも一つの添加物)の化学式を、化学グラフ構造を表す化学グラフ構造データ(例えば、隣接行列を含む)に変換し、変換された情報を機械学習モデル(例えば前段のグラフニューラルネットワークと後段の全結合のニューラルネットワークを含む機械学習モデル)に入力して、予測対象物性名の物性値の予測値を出力してよい。例えば隣接行列の場合には、グラフ畳み込みニューラルネットワークでベクトルに変換して、変換されたベクトルが全結合のニューラルネットワークに入力される。一方、例えば、化学グラフ構造データをベクトル(例えばフィンガープリント、MACCS Keysなど特定のルールを満たすか否かで0または1に変換する)に変換してもよく、そのベクトルが(例えば全結合)のニューラルネットワークに入力されてもよい。
【0060】
ここで、機械学習モデルは、化学グラフ構造データまたは化学グラフ構造データに基づいて変換された数値群(例えばベクトル)を入力とし予測対象物性名の物性値の予測値を出力とする学習データによって学習されたモデルである。この数値群はベクトル(1次元配列)であってもよいし、行列(多次元配列)であってもよい。
【0061】
ここでグラフ構造を表す数値列(例えばベクトル)への変換方法としては例えば、MACCS Keysなど特定のルールを満たすか否かで0または1に変換することで、フィンガープリントに変換することでグラフ構造を表す数値列(例えばベクトル)を取得してもよい。一方、グラフ構造を表す隣接行列の場合には、この隣接行列をグラフ畳み込みネットワークに入力し、グラフ畳み込みネットワークの最終層から出力されるベクトルを変換後のベクトルとしてもよい。ここで、グラフ構造からベクトルに変換するには例えば、1回以上の畳み込み処理、その後に続く非特許文献2(https://docs.dgl.ai/en/0.8.x/guide/training-graph.html)に記載のReadout関数を用いて変換してもよい。この際には例えば、グラフの特定の特徴量(例えば、C-C結合の数など)を数えてベクトルに落とし込むなどしてもよい。そして、グラフ構造からベクトルにした後、それぞれを分量に応じて加重平均したベクトルを作成するオペレーションをニューラルネットワーク(例えば全結合のニューラルネットワーク)の中で作ってもよい。
【0062】
ここで化合物aと化合物bを分量に応じて加重平均したベクトルを作成する処理の具体例について説明する。化合物aの隣接行列をG_aとする。この隣接行列は例えば、原子をノード(node)、結合をエッジ(edge)と置いて、それぞれのノードとノードの間のエッジの有無(1か0)が格納された正方行列である。H_aは、例えば化合物aの隣接行列に対して、1回以上の畳み込み処理とその後のReadout関数を実行して得られたベクトルである。
【0063】
同様に、化合物bの隣接行列をG_bとし、H_bは、化合物bの隣接行列に対して、1回以上の畳み込み処理とその後のReadout関数を実行して得られたベクトルである。
化合物aと化合物bを分量に応じて加重平均したベクトル(以下、加重平均ベクトルともいう)H_totalは例えば次の式で表される。
【0064】
H_total = H_a×化合物aの量 + H_b×化合物bの量
【0065】
上記の加重平均ベクトルH_totalが、この機械学習モデルの後段層(例えば全結合層)に入力され、機械学習モデルの出力層から物性の予測値が出力される。このような機械学習モデルを用いることによって、様々な表現形式の化学構造とその量から物性の予測精度を高めることができる。
【0066】
このように、第2の機械学習モデルの入力として更に、添加剤それぞれに対応する第2化学フィンガープリント、第2SMILES文字列または第2化学グラフ構造と当該添加剤それぞれの量を用いて変換して得られた数値群を含み、プロセッサ26は、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造のいずれかに基づく数値群と、添加剤それぞれに対応する第2化学フィンガープリント、第2SMILES文字列または第2化学グラフ構造のうちいずれかに基づく数値群を第2の機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を取得してもよい。
【0067】
あるいは、第1の機械学習モデルの入力として更に、添加剤それぞれに対応する第2SMILES文字列または第2化学グラフ構造を含み、プロセッサ26は、原材料それぞれに対応するSMILES文字列または化学グラフ構造及び当該原材料それぞれの量と、添加剤それぞれに対応する第2SMILES文字列または第2化学グラフ構造及び当該原材料それぞれの量を第1の機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を取得してもよい。
【0068】
以下、具体的な処理の詳細について説明する。例えば記憶装置23にはデータベースが構築されており、特許文献から収集された実施例に関するデータ(例えば原材料名と構造、物性、原材料それぞれの使用量、プロセス条件、特性値など)、その実施例と類似または同じ用途に使用される原材料データ(例えば原材料名、構造データ、カタログ記載特性情報、CAS番号などの入手できる情報)が記憶されている。
【0069】
続いて機械学習モデルの構築方法の一例について説明する。
(ステップS10)例えば収集された実施例のデータは機械学習用のデータに加工される。具体的には実施例データの単位を揃え、化学フィンガープリントに変換される。実施例が混合物の場合は、混合物に含まれる原材料の量による重み付き平均をすることによって、混合物が化学フィンガープリントに変換される。外れ値があれば除外される。
【0070】
(ステップS20)続いて機械学習モデルを構築する。機械学習モデルは例えば、ランダムフォレスト、ガウス過程回帰、ニューラルネットワークモデル、その他ベイズモデルなどである。
【0071】
<機械学習モデルの構築プロセス>
以下の機械学習モデルの構築プロセスを一例として、予測対象物性名毎に実行することによって、予測対象物性名毎に第1の機械学習モデル(または第2の機械学習モデル)が構築される。ここでは第1の機械学習モデルの一例として機械学習モデルは、原材料それぞれに対応する化学フィンガープリントと当該原材料それぞれの量を用いて変換されて得られた数値群を入力とし、物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。
なお、ここでは一つの物性に対して学習するモデルを例に説明するが、複数の物性に対して同時に学習するモデルであってもよい。例えば、ニューラルネットワークの場合、マルチタスクラーニングを用いて複数の物性に対して同時に学習してもよい。この機械学習モデルに、回帰分析手法も含まれる。この回帰分析手法には、ベイズ線形回帰、部分的最小二乗回帰(Partial Least Squares Regression, PLS)などが含まれる。例えば回帰分析の一例として、部分的最小二乗回帰(Partial Least Squares Regression, PLS)という回帰分析手法を用いて、複数の物性を対象としてもよい。入力の変数と出力の変数を同時に学習するので、複数の物性を推定してもよい。PCR(Principal Component Regression:主成分回帰)でもよいし、ベイズモデル(例えばベイズ線形回帰や階層ベイズモデル)で1つ以上の物性を予測してもよい。
(ステップS21)汎化性能を高めるため、同一の特許文献に含まれる実施例ごとにグループにして、全実施例をGroup-K foldを用いて、K通り(Kは自然数)の訓練、検証データに分ける。
(ステップS22)選んだ機械学習モデルのハイパーパラメータの最適な組み合わせを、検証データを用いて検証する。それぞれのハイパーパラメータの組み合わせをK通りの訓練データで学習し、検証データで精度を計算する。K通りの精度の平均値をそれぞれ選択したハイパーパラメータの精度とする。検証データで最も精度が良かったハイパーパラメータの組み合わせを選択する。
(ステップS23)最も精度が高かったハイパーパラメータの組み合わせで全データを学習して機械学習モデルを保存する。
【0072】
<機械学習モデルの推定プロセス>
プロセッサ26は例えば、ユーザによって入力された原材料を識別する情報(例えば、インデックス、名称、CAS登録番号など)の組み合わせと当該原材料それぞれの量を上記と同様の方法を用いて化学フィンガープリントの重み付き平均を得る。その後、プロセッサ26は、得られた化学フィンガープリントを、上記ステップS23で保存された機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を得る。
【0073】
以上、第1の実施形態に係る情報処理システムSはユーザから受け付けた原材料それぞれを識別する情報(例えば、インデックス、名称、CAS登録番号など)の組み合わせと当該原材料それぞれの量を取得し、当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を取得する少なくとも一つのプロセッサ26を備える。ここで第1の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。
【0074】
この構成によれば、ユーザは原材料の組み合わせと当該原材料それぞれの量を入力することによって、原材料を組み合わせて得られる組成物の予測対象物性名の物性値の予測値が得られる。これにより、原材料を組み合わせて得られる組成物の物性値を得ることを容易化することができる。
【0075】
<第2の実施形態>
続いて第2の実施形態について説明する。第2の実施形態では上記第2の課題を解決する情報処理システムについて説明する。第2の実施形態では、所望の物性値の範囲を入力すると、原材料の組み合わせの候補を出力する。第2の実施形態に係る情報処理システムのハードウェア構成は第1の実施形態の情報処理システムのものと同様であるので、その説明を省略する。
【0076】
図7は、第2の実施形態の端末に表示される原材料選択のための画面の一例を示す図である。図8は、図7の続きの画面の一例である。
図7の画面G4において、所望の物性名を入力可能なテキストボックスR41、所望の物性値下限を入力可能なテキストボックスR42、所望の物性値上限を入力可能なテキストボックスR43、その単位を入力可能なテキストボックスR44が表示されている。
また図7の画面G4において、所望の物性値範囲を得るのに最低限使用したい原材料について、当該原材料の名称を入力可能なテキストボックスR45、当該原材料の量下限を入力可能なテキストボックスR46、当該原材料の量上限を入力可能なテキストボックスR47、その量の単位を入力可能なテキストボックスR48が表示されている。図7の画面G4において、原材料探索ボタンB41が押下された場合、図8の画面G5に遷移する。
【0077】
図8の画面G5は、原材料探索結果を表示する画面である。例えば、図7の画面G4において指定された物性名について、各原材料の物性値が2次元状にプロットされた物性マップが表示される。図8の画面G5には、原材料の探索の結果、得られた原材料リストが表示される。原材料リストには、各種の物性値、物質名の組み合わせ、当該物質名それぞれの量が含まれる。図8では、簡単のために、物質名が1つの場合を示している。
【0078】
物質名については、その物質の情報を含むWEBページへのリンクが張られている。ここで、その物質の情報を含むページには例えば、その物質の説明、物性値、及びメーカ(または代理店)の問い合わせ先が含まれる。ここで特定の物質名(ここでは例えば「ポリスチレン」)に対して特定の操作(例えば左クリック)が実行されると、当該特定の物質名(ここでは例えば「ポリスチレン」)の情報を含む画面G6に遷移する。画面G6には、特定の物質名(ここでは例えば「ポリスチレン」)の説明、物性値、及びメーカ(または代理店)の問い合わせ先が含まれる。
【0079】
第1の実施形態と同様に、第2の実施形態における記憶装置23には、学習済みの機械学習モデルが記憶されている。具体的には例えば、記憶装置23には、物性名毎に構築された機械学習モデルが記憶されている。ここで機械学習モデルは例えば、原材料の組み合わせと当該原材料それぞれの量を変換して得られた化学フィンガープリントを入力とし、物性名の物性値を出力とする学習データセットによって学習されたモデルである。
【0080】
続いて機械学習モデルの構築方法の一例について説明する。
(ステップS110)第1の実施形態のステップS10と同様に、例えば収集された実施例のデータは機械学習用のデータに加工される。具体的には実施例データの単位を揃え、化学フィンガープリントに変換される。実施例が混合物の場合は、混合物に含まれる原材料の量による重み付き平均をすることによって、混合物が化学フィンガープリントに変換される。外れ値があれば除外される。
【0081】
(ステップS120)続いて第1の実施形態のステップS20と同様に、機械学習モデルを構築する。機械学習モデルは例えば、ランダムフォレスト、ガウス過程回帰、ニューラルネットワークモデル、その他ベイズモデルなどである。
【0082】
<機械学習モデルの構築プロセス>
以下の機械学習モデルの構築プロセスを一例として、予測対象物性名毎に実行することによって、予測対象物性名毎に機械学習モデル(具体的には例えば第1の機械学習モデルまたは第2の機械学習モデル)が構築される。
(ステップS121)第1の実施形態のステップS21と同様に、汎化性能を高めるため、同一の特許文献に含まれる実施例ごとにグループにして、全実施例をGroup-K foldを用いて、K通り(Kは自然数)の訓練、検証データに分ける。
(ステップS122)第1の実施形態のステップS22と同様に、選んだ機械学習モデルのハイパーパラメータの最適な組み合わせを、検証データを用いて検証する。それぞれのハイパーパラメータの組み合わせをK通りの訓練データで学習し、検証データで精度を計算する。K通りの精度の平均値をそれぞれ選択したハイパーパラメータの精度とする。検証データで最も精度が良かったハイパーパラメータの組み合わせを選択する。
(ステップS123)第1の実施形態のステップS23と同様に、最も精度が高かったハイパーパラメータの組み合わせで全データを学習して機械学習モデルを保存する。
【0083】
<探索プロセス>
図9は、第2の実施形態に係る探索プロセスの流れの一例を示すフローチャートである。
(ステップS210)端末1が例えば図7の画面G4において、ユーザによる入力を受け付ける。ここでユーザから受け付けた情報は、物性名、当該物性名の値の範囲、当該値の単位である。これに加えてユーザから受け付けた情報は、候補原材料、当該原材料の量の範囲、当該量の単位である。端末1は、これらのユーザから受け付けた情報をコンピュータシステム2へ送信する。
【0084】
(ステップS220)プロセッサ26がステップS210で送信された情報を受信した場合において、ユーザによって候補原材料が指定されたか否か(すなわち受信した情報に候補の原材料が含まれているか否か)を判定する。
【0085】
(ステップS230)ユーザによって候補の原材料が指定されたとき(すなわち受信した情報に候補の原材料が含まれるとき)、プロセッサ26は、例えば図7においてユーザによって指定された候補原材料に対して、代替可能原材料をカタログから取得し、取得した代替可能原材料で候補原材料を置き換えることで得られる原材料の組み合わせを取得する。
【0086】
(ステップS240)プロセッサ26は、ステップS230で取得した原材料の組み合わせに含まれる原材料それぞれを化学フィンガープリントに変換し、得られた化学フィンガープリント(及び原材料それぞれの量)を、ステップS120で得られた学習済みの機械学習モデルに入力することによって、例えば図7においてユーザによって指定された物性名の物性値の予測値を取得してもよい。ここで、それぞれの原材料の量の初期値は予め設定されていてもよいし、ユーザによって指定されてもよい。
【0087】
(ステップS245)プロセッサ26は、取得された物性値の予測値のうち、ユーザによって指定された所望の物性値の範囲を満たす原材料の組み合わせと当該原材料それぞれの量の組に絞り込む。
【0088】
(ステップS250)そして、プロセッサ26は、図7においてユーザによって設定された物性値範囲を満たす原材料とその量の組み合わせを遺伝的アルゴリズムで探索する。その一例としてプロセッサ26は、ユーザによって設定された物性値が最も高いまたは低いもしくは特定の範囲(例えば100~200など)に含まれる代替可能原材料とその量の組み合わせを遺伝的アルゴリズムで探索してもよい。
ここで、記憶装置23に記憶されてカタログから代替可能な原材料を取得してもよいし、インターネットを介してWEB上のカタログ情報から代替可能な原材料を取得してもよい。
【0089】
<遺伝的アルゴリズムでの探索方法の具体例>
ここでステップS250における遺伝的アルゴリズムでの探索方法の具体例について説明する。図10は、図9のステップS250における遺伝的アルゴリズムでの探索処理の流れの一例を示すフローチャートである。
【0090】
(ステップS251:遺伝的アルゴリズムの初期個体)プロセッサ26は例えば、ステップS245で絞り込まれた原材料の組み合わせと当該原材料それぞれの量の組を初期個体としてもよい。ここで個体は、原材料を識別する情報(例えば、原材料名)の組み合わせと原材料それぞれの量で特定される。
あるいはプロセッサ26は、遺伝的アルゴリズムの初期個体を、特許文献の実施例に記載の原材料名の組み合わせと原材料それぞれの量のうちからランダムに選定してもよい。ここで、特許文献の実施例に記載の原材料を識別する情報(例えば、原材料名)の組み合わせと原材料それぞれの量は記憶装置23に記憶されていてもよく、その場合、プロセッサ26は原材料を識別する情報(例えば、原材料名)の組み合わせと原材料それぞれの量を記憶装置23から取得してもよい。
【0091】
(ステップS252:変異)プロセッサ26は、原材料を識別する情報(例えば、原材料名)をランダムにその他の原材料を識別する情報(例えば、原材料名)に置き換える。
【0092】
(ステップS253:変異2)プロセッサ26は、原材料の量をランダムに選び、ランダムに選ばれた原材料の量をランダムに変更する。
【0093】
(ステップS254:交叉)プロセッサ26は、原材料を識別する情報(例えば、原材料名)と原材料の量の組を一つの個体とみなして個体をランダムに選び、ランダムに選ばれた個体間の原材料を識別する情報(例えば、原材料名)と原材料の量を交換する。その際にプロセッサ26は、例えば量比が合計100になるように調整する。
【0094】
(ステップS255)プロセッサ26は、変異させた各個体の適応度関数を計算する。適応度関数は例えば、原材料を識別する情報(例えば、原材料名)の組み合わせと当該原材料それぞれの量を用いて、例えば原材料それぞれに対応する化学フィンガープリントを当該原材料それぞれに量で加重平均することによって化学フィンガープリントに変換し、変換後の化学フィンガープリントを学習済みの機械学習モデルに入力して得られた物性値の予測値とユーザによって設定された物性値範囲の代表値(例えば、中央値、平均値、最大値または最小値など)との差を用いてもよいし、機械学習モデルが確率分布を出力できるモデルの場合、尤度関数のようなものでもよい。
なお、ここでは一例として、変換後の化学フィンガープリントを学習済み機械学習モデル(上述した第2の機械学習モデル)に入力して物性値の予測値を得ると説明したが、これに限らず、原材料それぞれに対応するSMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量を、上述した第1の機械学習モデルに入力して物性値の予測値を得てもよい。
また、ここでは一例として、原材料それぞれに対応する化学フィンガープリント及び当該原材料それぞれの量に基づく数値群である変換後の化学フィンガープリントを学習済み機械学習モデル(上述した第2の機械学習モデル)に入力して物性値の予測値を得ると説明したが、これに限ったものではない。原材料それぞれに対応するSMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力して物性値の予測値を得てもよい。
【0095】
(ステップS256)プロセッサ26は、適応度関数に応じて、生存する個体(生存個体ともいう)を決定する。なお、その際に、プロセッサ26は、ユーザによって指定された範囲(例えばユーザによって指定された原材料を含み、及び/またはユーザによって指定された物性値が〇~〇の範囲など)を外れた場合、適応度関数にペナルティを課すプロセスを実行してもよい。これによって、効率的に探索できる。
【0096】
(ステップS257)プロセッサ26は、生存個体に対応する原材料の組み合わせと当該原材料それぞれの量を用いて、例えば原材料に対応する化学フィンガープリントを当該原材料それぞれに量で加重平均することによって化学フィンガープリントに変換し、変換後の化学フィンガープリントを学習済み機械学習モデルに入力することによって、物性値の予測値を取得する。その際、プロセッサ26は例えば、生存個体に対応する原材料それぞれをフィンガープリントに変換し、得られたフィンガープリントそれぞれの数値を、それぞれの量で加重平均することによって化学フィンガープリントに変換してもよい。
【0097】
(ステップS258)そして、プロセッサ26は、ユーザによって指定された物性値範囲に基づく終了条件を満たすか否か判定し、終了条件を満たさない場合、ステップS251に戻って、上述した処理を繰り返す。このようにして、プロセッサ26は終了条件を満たすまで上述した処理を繰り返す。終了条件は、ステップS257で取得された物性値の予測値がユーザによって指定された物性値範囲を満たす最適な物性値(最適解ともいう)が見つかるという条件であってもよい。あるいはステップS257で取得された物性値の予測値がユーザによって指定された物性値範囲を満たす候補原材料の組み合わせが設定数以上見つかるという条件であってもよい。ここで候補原材料の組み合わせは、1つの候補原材料からなる場合と、複数の候補原材料からなる場合がある。
【0098】
(ステップS258)ステップS257で予め決められた終了条件を満たす場合、プロセッサ26は例えば、候補原材料の組み合わせを一覧表示(例えばランキング表示)するための情報を出力する。
【0099】
(ステップS260)図9に戻って、プロセッサ26は例えば、候補原材料の組み合わせを一覧表示するための情報を端末1へ送信する。
【0100】
(ステップS270)端末1は、一覧表示するための情報を受信した場合、この情報を用いて候補原材料の組み合わせを一覧表示する。これによって図8の画面G5に示すように、端末1で、候補原材料の組み合わせが一覧(例えばランキング表示)で表示される。プロセッサ26は、一覧表示するための情報を出力する際に、例えば、原材料名にリンクが設定されるように情報を出力してもよい。これによって、図8の画面G5に示すように、端末1で、一覧表示されるときに、原材料名にリンクが設定される。これにより、ユーザが原材料に設定されたリンクをクリックすることで、図8に示すように当該原材料の商品情報(例えばカタログ、メーカへのコンタクト方法など)のWEBページ(例えば画面G6参照)に遷移することができる。
【0101】
以上、第2の実施形態に係る情報処理システムは、少なくとも一つのプロセッサを備える。プロセッサは、原材料の組み合わせと当該原材料それぞれの量の組を親個体群とみなして、遺伝的アルゴリズムに従って、次の世代の子個体群を作出し、前記作出された次の世代の子個体群が示す原材料の組み合わせと当該原材料それぞれの量を用いて、適応度関数の値を算出し、ユーザによって指定された物性値範囲に基づく終了条件を満たすまで、次の世代の子個体群を作出する処理を繰り返し、前記終了条件を満たす場合、最後に作出した次の世代の子個体群それぞれが示す原材料の組み合わせと当該原材料それぞれの量を含む情報を出力する。
【0102】
この構成により、ユーザは、ユーザによって指定された物性値範囲を満たす原材料の組み合わせと当該原材料それぞれの量を取得することができる。
またプロセッサ26は、最後に作出した次の世代の子個体群それぞれが示す前記所望の物性名の物性値の予測値を更に出力してもよい。これにより、ユーザは、記所望の物性名の物性値の予測値を把握することができる。
【0103】
また上記ステップS257において、生存個体に対応する原材料の組み合わせと当該原材料それぞれの量を用いて、例えば原材料に対応する化学フィンガープリントを当該原材料それぞれに量で加重平均することによって化学フィンガープリントに変換し、変換後の化学フィンガープリントを学習済み機械学習モデルに入力することによって、物性値の予測値を取得したが、これに限ったものではない。プロセッサは例えば、所望の物性名についてユーザによって入力された所望の物性値の範囲の組を少なくとも一組取得し、原材料の初期組み合わせに含まれる原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント(ただし、この化学フィンガープリントを用いた具体例がステップS257に相当)、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、第1の実施形態と同様に、前記物性名の物性値の予測値を取得してもよい。ここで第1の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。また第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データと当該原材料それぞれの量を用いて変換されて得られた数値群を入力とし、物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。
プロセッサは例えば、前記取得された物性値の予測値のうち、前記ユーザによって指定された所望の物性値の範囲を満たす原材料の組み合わせと当該原材料それぞれの量の組に絞り込み、絞り込まれた原材料の組み合わせと当該原材料それぞれの量の組を親個体群とみなして、遺伝的アルゴリズムに従って、次の世代の子個体群を作出する。
【0104】
これにより、絞り込まれた原材料の組み合わせと当該原材料それぞれの量の組を親個体群とみなして、遺伝的アルゴリズムを実行するので、より短時間に、ユーザによって指定された物性値範囲を満たす原材料の組み合わせと当該原材料それぞれの量を取得することができる。
【0105】
記憶装置23には、物性名毎に構築された機械学習モデルが記憶されていてもよい。このように、前記第1の機械学習モデルまたは前記第2の機械学習モデルは、物性名毎に構築されていてもよい。この場合、プロセッサ26は、ユーザから受け付けた物性名に対応する機械学習モデルに、前記変換された化学フィンガープリントを入力することによって、予測対象物性名の物性値の予測値を取得してもよい。この構成により、物性名毎に物性値の予測値を取得することができるので、ユーザが所望する物性名について、ユーザによって指定された物性値範囲を満たす原材料の組み合わせと当該原材料それぞれの量を取得することができる。
【0106】
またプロセッサ26は、前記出力された原材料の一つがユーザに選択された場合、当該原材料を販売する販売会社の連絡先の情報を出力してもよい。この構成により、ユーザによる原材料の入手を容易に進めることができるとともに、当該コンピュータシステム2の管理者は、当該原材料を販売する販売会社から広告収入またはアフィリエイト収入を得ることができる。
またプロセッサ26は、前記出力された原材料の一つがユーザに選択された場合、当該原材料の詳細な情報を出力してもよい。この構成により、ユーザによって指定された物性値範囲を満たす原材料についての詳細な情報をユーザが容易に取得することができる。
【0107】
<第3の実施形態>
続いて第3の実施形態について説明する。第3の実施形態では第3の課題を解決する情報処理システムについて説明する。第3の実施形態では、記憶装置に格納されている特許文献の実施例のデータから、ユーザによって入力された原材料名(または製品名)を使用している実施例及び/または抽出した実施例の物性値と類似の物性値を示す実施例のうち入力された原材料を使っていない実施例を抽出し、その出願人(使用している会社)のリストを出力する。これによって、ユーザによって入力された原材料名(または製品名)の製品を使用してくれる可能性の高い会社名を得ることができる。
【0108】
また第3の実施形態において、類似の物性値を示す実施例に含まれる原材料のリストを出力してもよい。これによって、ユーザは、置き換えられる可能性の高い原材料名のリストを取得することができ、ユーザによって入力された原材料名(または製品名)の営業または販売促進に利用することができる。
【0109】
記憶装置23には例えば、特許文献に含まれる実施例に関するデータ(例えば原材料名及び/または製品名、構造、物性、原材料それぞれの使用量、プロセス条件、物性値など)が記憶されており、上記に加えて、出願日、出願人名、加えて、特許文献に記載される原材料のメーカ名が記憶されている。これらの情報は記憶装置23にデータベースが構築されて記憶されていてもよい。
【0110】
図11は、第3の実施形態の端末における画面遷移の一例を示す図である。図12は、図11の続きの画面の一例である。
図11の画面G7において、ユーザが製品名を入力するためのテキストボックスR71が示されている。例えばテキストボックスR71においてユーザが製品名の一部を入力した場合に、部分一致で候補リストがチェックボックスとともに表示され、ユーザがチェックボックスで選択するようにしてもよい。ユーザが製品名を思いつかない場合に備えて、画面G7には例えば、製品に含まれる原材料の化学式を入力するためのテキストボックスR72が設けられている。同様にユーザが製品名を思いつかない場合に備えて、製品に含まれる原材料の構造を描画するための構造描画ボタンB71が設けられていてもよい。構造描画ボタンB71が押された場合、ポップアップで別画面が表示され、ユーザは構造を描画することができる。
【0111】
各原材料の特性値が記憶装置23のデータベースに予め保存されている。図11の画面G7において、特性名を入力するためのテキストボックスR73、特性値下限を入力するためのテキストボックスR74、特性値上限を入力するためのテキストボックスR75、その単位を入力するためのテキストボックスR76が設けられている。また検索ボタンB72が設けられている。これによって、ユーザは、製品名、原材料の化学式または原材料の構造を指定して検索ボタンB72を押すことによって、原材料名を検索可能である。またユーザは、特性名と特性値の範囲を指定して検索ボタンB72を押すことによって、原材料名を検索可能である。
【0112】
検索ボタンB72が押された場合、画面G8sに遷移する。画面G8には、検索の結果、ヒットした原材料名が表示される。この原材料名の原材料がユーザが販売先候補を探したい対象の原材料である。この原材料の販売先候補を探索するために、画面G8には、販売先候補ボタンB73が設けられている。販売先候補ボタンB73が押された場合、図12の画面G9に遷移する。画面G9には、対象の原材料の販売先候補リスト(以下、有望販売先リストともいう)が表示される。
【0113】
有望販売先リストには例えば、販売先候補企業、置き換え対象となる原材料の実施例が記載された特許文献を識別する情報の一例である特許公開番号(または特許番号)、対象の原材料による置き換え対象となる原材料、置き換え対象となる製品の特性値(置き換え前特性値ともいう)、対象の原材料で置き換え後の特性値(置き換え後特性値ともいう)が設けられている。
【0114】
販売先候補ボタンが押された際に、販売先候補リストを出力する処理の流れ処理の流れについて、以下図13を用いて説明する。図13は、第3の実施形態に係る販売先候補ボタンが押された際の処理の流れの一例を示すフローチャートである。ここでは処理の一例として、ユーザによって指定された原材料が使われていない実施例だけを抽出する例について説明する。
【0115】
(ステップS310)プロセッサ26は、ユーザによって指定された原材料が使用されている実施例の物性値と類似の物性値を示す実施例を記憶装置23のデータベースから検索する。
【0116】
(ステップS320)プロセッサ26は一例として、検索でヒットした実施例のうち、ユーザによって指定された特定の原材料が使われていない実施例に絞り込む。あるいは、プロセッサ26は検索時に、ユーザによって指定された特定の原材料が使われていない実施例を抽出してもよい。
【0117】
(ステップS330)プロセッサ26は、絞り込まれた実施例それぞれについて、ユーザによって指定された原材料に類似する(例えば製品データベースにおいて、同一カテゴリに属するものもしくは化学フィンガープリントの類似度が一定以内のもの)原材料を、指定された原材料に置き換えたときに、物性値が同等以上になる(または物性値が類似する)ものに絞り込む。
ここで物性値が同等以上になるものを絞り込むときは、第1の実施形態で構築された機械学習モデルを用いてもよい。具体的には例えば、プロセッサ26は、ユーザによって入力された原材料名の対象の原材料を、他の原材料に置き換えたときに、物性値が類似となる原材料に絞り込む際に、当該他の原材料と当該他の原材料の量の組を、第1の実施形態の学習済みの機械学習モデルに入力することによって、予測対象物性名の物性値の予測値をそれぞれ決定し、当該物性値の予測値それぞれを対象の原材料の物性値と比較することによって、物性値の予測値がユーザによって指定された原材料の物性値と同等以上になる原材料(または類似する原材料)を抽出してもよい。
【0118】
(ステップS340)プロセッサ26は、絞り込まれた原材料を用いた実施例が記載されている特許文献の出願人(または特許権者)を記憶装置23のデータベースから読み出し、読み出した出願人(または特許権者)のリストを、対象の原材料の販売先候補リスト(有望販売先リスト)として出力する。この有望販売先リストには、抽出された実施例中に記載された原材料が、置き換え対象製品として含まれてもよい。
【0119】
以上、第3の実施形態に係る情報処理システムは、特許文献の実施例が格納されている少なくとも一つの記憶装置と、少なくとも一つのプロセッサと、を備える。プロセッサは、記憶装置に格納されている実施例のうち、ユーザによって指定された原材料を使用している実施例及び/または当該原材料の組み合わせで実現される物性値が類似の原材料のうち入力された原材料を使っていない実施例を抽出し、抽出された実施例が記載されている特許文献の出願人または特許権者のリストを表示するための情報を出力する。このリストには、抽出された実施例に記載の類似の原材料が、置き換え対象の原材料として含まれていてもよい。
【0120】
この構成により、ユーザによって指定された原材料または当該原材料に類似する原材料が実施例に記載されている特許文献に記載の出願人を出力するので、対象の原材料を使用してくれる可能性がある会社の探索を容易化することができる。
【0121】
またプロセッサは、前記実施例を抽出した後、ユーザによって指定された対象の原材料を、他の原材料に置き換えたときに、物性値が類似となる原材料に絞り込んでもよい。
【0122】
またプロセッサは、ユーザによって指定された対象の原材料を、他の原材料に置き換えたときに、物性値が類似となる原材料に絞り込む際に、当該他の原材料と当該他の原材料の量の組を、第1の実施形態の学習済みの機械学習モデルに入力することによって、予測対象物性名の物性値の予測値をそれぞれ決定し、当該物性値の予測値それぞれを対象の原材料の物性値と比較することによって、物性値の予測値がユーザによって指定された原材料の物性値と同等以上になる原材料または類似する原材料を抽出してもよい。
【0123】
<変形例>
上述した実施形態では、第1の機械学習モデルへの入力は、当該原材料それぞれに対応するSMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量としたが、これに限らず、製品名または物質名及び当該原材料それぞれの量であってもよい。すなわち、原材料それぞれに対応するSMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルへ入力してもよい。この場合、第1の機械学習モデルは、原材料それぞれに対応するSMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。
【0124】
同様に、第2の機械学習モデルへの入力は、当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データ及び当該原材料それぞれの量に基づく数値群としたが、これに限らず、製品名または物質名及び当該原材料それぞれの量に基づく数値群であってもよい。すなわち、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルへ入力してもよい。この場合、第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整された学習されたモデルである。
【0125】
また上述した実施形態では一例として、第1の機械学習モデルまたは第2の機械学習モデルは、予測対象物性名毎に構築されているとして説明したが、これに限ったものではない。第1の機械学習モデルまたは第2の機械学習モデルは、複数の分野で用いられる原材料について複数の物性(例えば、洗剤の洗浄力、研磨液による表面の荒さなど)をまとめて学習されて構築されていてもよい。
また上述した実施形態では一例として、原材料と添加剤を分けてそれぞれ、第1化学フィンガープリント、第2化学フィンガープリントと区別して説明したが、これに限ったものではなく、原材料に添加剤が含まれていてもよい。この場合、それぞれの原材料には、ポリマー、重合開始剤、難燃剤など原材料のタイプ(種類)があり、第1の機械学習モデルまたは第2の機械学習モデルの入力には原材料の種類または当該種類に基づく数値群(例えば数値列、具体的に例えばベクトル)が含まれていてもよい。この場合、少なくとも一つのプロセッサは、ユーザから取得した原材料の種類または当該種類に基づく数値群を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する前記予測対象物性名の物性値の予測値を取得してもよい。
【0126】
また第1の機械学習モデルまたは第2の機械学習モデルの入力には更に原材料の物性(例えば、繊維長など)または当該物性に基づく数値群(例えば数値列、具体的に例えばベクトル)が含まれていてもよい。その場合、プロセッサは、ユーザから取得した原材料の物性(例えば、繊維長など)または当該物性に基づく数値群を更に第1の機械学習モデルまたは第2の機械学習モデルに入力することによって、予測対象物性名の特性値の予測値を取得してもよい。
【0127】
第1の機械学習モデルまたは第2の機械学習モデルの入力には原材料の特徴(例えばポリマーの場合、高次構造など)または当該特徴に基づく数値群(例えば数値列、具体的に例えばベクトル)が含まれていてもよい。その場合、プロセッサは、ユーザから取得した原材料の特徴(例えばポリマーの場合、高次構造など)または当該特徴に基づく数値群を更に第1の機械学習モデルまたは第2の機械学習モデルに入力することによって、予測対象物性名の物性値の予測値を取得してもよい。ここで特徴は文章で記述されていてもよく、その場合、その文章が数値列(例えばベクトル)に変換されて入力されてもよい。
【0128】
また第1の機械学習モデルまたは前記第2の機械学習モデルの入力には製造プロセス条件及び/またはプロセスに使う装置(例えば、設備、機械または仕掛けなど)に関する情報または当該情報に基づく数値群(例えば数値列、具体的に例えばベクトル)が含まれていてもよい。このプロセス条件には例えば、製造時の条件(例えば原材料を混ぜるときの条件、具体的には温度、圧力及びこれらの時系列変化、維持時間または時間変化率など)、測定装置の名称、測定条件、測定の規格のうち少なくとも一つが含まれていてもよい。またプロセスに使う装置に関する情報には、製造装置(例えば原材料を混ぜる機械など)の名称、または製造装置の仕様(例えば、3Dプリンタのノズル直径など)が含まれていてもよい。その場合、プロセッサは、ユーザから取得したプロセス条件及び/またはプロセスに使う装置に関する情報を更に前記第1の機械学習モデルまたは前記第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する前記予測対象物性名の物性値の予測値を取得してもよい。
【0129】
図14は、原料種と配合量のグリッドサーチを説明するための図である。図14では、例えば原料種別に配合量を10%刻みのグリッドに分け、個々のグリッドに相当する原料種と配合量の組があることが示されている。図14では簡単のために原材料が一種類選ばれる場合のグリッドサーチの際の探索範囲は2次元で表されるが、原材料が複数選ばれる場合、これに応じてグリッドの探索範囲は増える。例えば、原材料が2種類の場合には、グリッドの探索範囲が4次元になる。
【0130】
例えば少なくとも一つのプロセッサは、ユーザによって指定された目標の物性値を取得し、ユーザによって指定された配合量の範囲を取得してもよい。
この場合、少なくとも一つのプロセッサは候補原材料それぞれについてユーザによって指定された配合量の範囲で候補配合量を複数決定し、候補原材料の組と当該候補原材料のそれぞれの候補配合量の全組み合わせについて物性値を予測してもよい。ここで候補原材料は、ユーザによって指定された候補原材料それぞれをプロセッサが取得してもよい。あるいは、プロセッサがユーザによって指定された物質のカテゴリ(例えば熱可塑性樹脂など)を取得し、ユーザによって指定された物質のカテゴリに属する原材料それぞれを前記候補原材料として抽出してもよい。ここで候補配合量は、図14に示すように所定の刻み幅で選択されてもよく、その場合、いわゆるグリッドサーチで候補原材料の組と当該候補原材料のそれぞれの候補配合量の全組み合わせが決定されてもよい。
この場合、少なくとも一つのプロセッサは、目標の物性値と予測された物性値それぞれとの比較に基づいて、候補原材料の組及び当該候補原材料のそれぞれの量を出力してもよい。具体的には例えば少なくとも一つのプロセッサは、予測された物性値が目標の物性値から近い順に、候補原材料の組及び当該候補原材料のそれぞれの量を出力してもよい。
【0131】
<第4の実施形態>
続いて第4の実施形態について説明する。第4の実施形態では、ユーザが特許文献中の実施例を選択し、選択した実施例の組成物を構成する原材料のうち1つ以上の対象原材料を、1つ以上の候補原材料及び当該候補原材料の配合量の範囲をユーザが指定した場合、少なくとも一つのプロセッサは、当該対象原材料をそれぞれの候補原材料に変更した場合で且つ指定された範囲に含まれる候補配合量それぞれについて物性の予測値を出力する。ユーザが得たい材料物性を満たす原材料と当該原材料の配合量の最適な組み合わせを得ることを容易化することを課題とする。
【0132】
図15図19の端末の画面の一例を用いて端末の画面遷移について説明する。図15Aは、第4の実施形態における端末の画面の一例を示す図である。図15Aに示すように、画面G11には、参照する実施例を選択するために、「特許実施例を選択」ボタンB111が示されている。この「特許実施例を選択」ボタンB111が押された場合、不図示の特許文献検索画面が例えばポップアップで表示される。図15Bは、第4の実施形態における特許文献検索画面の一例を示す図である。例えば特許文献に関する情報が用途毎に収集されてもよく、その場合、特許文献に関する情報が当該特許文献に関する技術の用途(例えば、リチウムイオン電池、封止材または化粧品など)毎に記憶装置23に記憶されていてもよいし、特許文献に関する情報と当該特許文献に関する技術の用途が関連付けられて記憶装置23に記憶されてもよい。ここで特許文献に関する情報には例えば、特許文献を識別する情報(例えば出願番号及び/または公開番号及び/または特許番号)、発明の名称、出願人、出願日、要約、本文、実施例毎の物性の名称及びその物性値の組などが含まれる。その場合この特許文献検索画面において、キーワード検索などの条件を指定することによって特許文献を検索することができる。具体的には例えば特許文献検索画面G11Pにおいて、用途を選択するためのセレクトボックスB112、発明の名称内を検索するキーワードを入力するためのテキストボックスB113、出願人を選択するためのセレクトボックスB114、出願日の範囲の開始日を入力するテキストボックスB115A、出願日の範囲の終了日を入力するテキストボックスB115B、要約テキスト内を検索するキーワードを入力するためのテキストボックスB116、本文テキスト内を検索するキーワードを入力するためのテキストボックスB117が表示されている。また特許文献検索画面G11Pにおいて物性の名称、または物性の名称とその物性値の範囲の組を指定可能であってもよい。特許文献検索画面G11Pにおいて「絞り込み」ボタンB118が押されると設定された条件で検索が実行され、検索結果が表示される。ここでは検索結果結果として入り例として画面領域R111、R112に特許文献が示されている。この特許文献検索画面において、例えば一つの特許文献(ここでは一例として画面領域R112の特許文献)が選択された場合、図16の画面G12に遷移する。
【0133】
図16は、第4の実施形態における実施例選択画面の一例である。図16の画面G12において、選択された特許文献に関する情報(例えば、発明の名称、公開番号、出願人の名称、出願日、要約など)が示されている。また図16の画面G12において、選択された特許文献に記載された実施例毎に、その組成物(例えば、ポリフェニレンエーテル樹脂組成物)を構成する原材料の名称と当該原材料それぞれの配合量が示され、そのときの特性(例えば、ガラス転移温度Tg、誘電率、誘電正接、引張強度、化粧品の例の場合、保湿性や髪のツヤなど)が示されている。
図16の画面G12において、各実施例に関連付けられて「AI製品探索」ボタンB121、B122、B123、B124が一例として示されている。そのうちの一つのボタンが押された場合、図17の画面G13に遷移する。ここでは一例として、選択された特許文献の実施例1に関連付けられた「AI製品探索」ボタンB121が押された場合について、以下、説明する。
【0134】
図17は、図16の画面G12において、選択された特許文献の実施例1に関連付けられた「AI製品探索」ボタンB121が押された場合の画面の一例である。図17の画面G13において、組成物(例えば、ポリフェニレンエーテル樹脂組成物)を構成する原材料それぞれに関連づけられて「変更」ボタンB131~B136が示されている。ユーザは、この「変更」ボタンB131~B136を押すことによって、該当する原材料を別の原材料に変更すること、及び/または配合量を変更することを実施することができる。以下、一例として図17の画面G13において、例えば「変更」ボタンB131が押された場合について説明する。
【0135】
図18は、図17の画面G13において、例えば「変更」ボタンB131が押された場合の画面の一例である。図18の画面G14において、「製品」に関連付けられたプラスボタンが示されており、プラスボタンが押された場合、候補原材料の選択画面が例えばポップアップで表示される。この候補原材料の選択画面においてユーザが候補原材料を選択された場合、画面G14において候補原材料(ここでは一例として製品名)がラベルとして表示される。画面G14の例では、「PP-600」、「SMA―EF-40」、「NORYLTM PPE 640」が候補原材料としてユーザによって選択された結果、「PP-600」のラベルL141、「SMA―EF-40」のラベルL142、「NORYLTM PPE 640」のラベルL143が表示されている。またこれらの候補原材料の配合量の下限を入力するためのテキストボックスT141、これらの候補原材料の配合量の上限を入力するためのテキストボックスT142が示されている。また「確定」ボタンB141と「取消」ボタンB142が表示されており、「確定」ボタンB141が押されると、選択された候補原材料と配合量範囲が決定される。一方、「取消」ボタンB142が押されると、選択された候補原材料と配合量範囲が取り消される。画面G14において、「上記条件で製品検索」ボタンB143が押下された場合、例えば図19の物性値の予測結果の画面に遷移する。
【0136】
なお、ユーザによって候補原材料が直接指定される例について説明したが、これに限らず、ユーザが物質のカテゴリ(例えば熱可塑性樹脂など)を指定してもよい。この場合、少なくとも一つのプロセッサ(例えばプロセッサ26)は、ユーザによって指定された物質のカテゴリ(例えば熱可塑性樹脂など)に属する候補原材料を決定してもよい。具体的には例えば、記憶装置23において、原材料を識別する識別情報と関連付けられて物質のカテゴリが記憶されていてもよく、少なくとも一つのプロセッサ(例えばプロセッサ26)は、記憶装置23を参照して、ユーザによって指定された物質のカテゴリに対応する原材料を候補原材料として記憶装置23から読み出すことにより候補原材料を決定してもよい。
【0137】
図19は、第4の実施形態における物性値の予測結果の画面の一例である。図19の画面G15において、図18で設定された候補原材料と配合量範囲においてグリッドサーチで決定された候補原材料と当該候補原材料のそれぞれの候補配合量の全組み合わせについて、予測された物性値の結果を示すグラフである。図19の画面G15において、グラフの横軸(x軸)を選択可能なセレクトボックスB151とグラフの縦軸(y軸)を選択可能なセレクトボックスB152が表示されている。ここでは一例としてグラフの縦軸(y軸)が誘電率、横軸(x軸)がガラス転移温度Tgである。図19の画面G15のグラフ上には、一例として実施例の物性値がプロットされ、候補原材料と当該候補原材料のそれぞれの候補配合量のそれぞれの組み合わせについて物性の予測値がプロットされている。これによって、ユーザは物性の予測値を比べることができるので、候補原材料と配合量の最適な組み合わせを選択することができる。例えばグラフの1つのプロットにマウスを重ねると、そのマウスを重ねたプロットに対応する候補原材料の名称(例えば製品名または物質名)と配合量と物性(例えば、ガラス転移温度Tg、誘電率、誘電正接、剥離強度)の予測値を含む情報が一例としてポップアップで表示されるとともに、一例として画面G15の向かって右側に、そのマウスを重ねたプロットに対応する候補原材料の名称と配合量、物性の予測値及び「詳細へ」というリンクL151が表示される。このリンクL151が押されると当該候補原材料の詳細が表示される。
【0138】
図19の画面G15を出力するには、以下の工程が実行されてもよい。少なくとも一つのプロセッサ(例えばプロセッサ26)は、対象の組成物を構成する原材料の一部をユーザによって指定された別の原材料に置き換えた場合において、その別の原材料の量をユーザによって指定された範囲で量の候補値を複数決定する。ここで対象の組成物は例えば、ユーザによって選択された特許文献中のユーザによって選択された実施例に記載されたものである。
少なくとも一つのプロセッサ(例えばプロセッサ26)は、前記決定された複数の量の候補値の全てについて物性値の予測値を決定する。そして少なくとも一つのプロセッサ(例えばプロセッサ26)は、複数の量の候補値それぞれに対応づけて物性値の予測値を提示するための情報を出力する。
【0139】
ここで前記物性値の予測値を決定する手順において、少なくとも一つのプロセッサ(例えばプロセッサ26)は、原材料それぞれに対応するSMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、物性値の予測値を取得する。
【0140】
ここで第1の機械学習モデルは、原材料それぞれに対応するSMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。また第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。この構成によれば、ユーザは物性の予測値を比べることができるので、候補原材料と配合量の最適な組み合わせを選択することができる。
【0141】
なお、上述した実施形態で説明したコンピュータシステム2の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、コンピュータシステム2の少なくとも一部の機能を実現するプログラムをコンピュータ読み取り可能な記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0142】
また、コンピュータシステム2の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0143】
さらに一つまたは複数の情報機器によってコンピュータシステム2を機能させてもよい。複数の情報機器を用いる場合、そのうちの1つをコンピュータとし、当該コンピュータが所定のプログラムを実行することによりコンピュータシステム2の少なくとも1つの手段として機能が実現されてもよい。
【0144】
また、方法の発明においては、全ての工程(ステップ)をコンピュータによって自動制御で実現するようにしてもよい。また、各工程をコンピュータに実施させながら、工程間の進行制御を人の手によって実施するようにしてもよい。また、さらには、全工程のうちの少なくとも一部を人の手によって実施するようにしてもよい。
【0145】
以上、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【符号の説明】
【0146】
S 情報処理システム
1 端末
11 入力インタフェース
12 通信モジュール
13 記憶装置
14 メモリ
15 出力インタフェース
16 プロセッサ
17 ディスプレイ
2 情報処理システム
21 入力インタフェース
22 通信モジュール
23 記憶装置
24 メモリ
25 出力インタフェース
26 プロセッサ

【要約】
ユーザから受け付けた原材料それぞれを識別する情報の組み合わせと当該原材料それぞれの量を取得し、当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を第1の機械学習モデルに入力するか、または当該原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量に基づく数値群を第2の機械学習モデルに入力することによって、当該原材料それぞれから構成される組成物に対する予測対象物性名の物性値の予測値を取得する少なくとも一つのプロセッサを備え、当該第1の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つ及び当該原材料それぞれの量を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルであり、当該第2の機械学習モデルは、原材料それぞれに対応する化学フィンガープリント、SMILES文字列または化学グラフ構造データまたは製品名または物質名のうち少なくとも一つと当該原材料それぞれの量を用いて変換して得られた数値群を入力とし、予測対象物性名の物性値を出力とする学習データセットによって入力から出力を予測できるようにパラメータが調整されたモデルである。
【選択図】 図6
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15A
図15B
図16
図17
図18
図19