(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-08
(45)【発行日】2024-07-17
(54)【発明の名称】塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物の生成方法、コンピュータシステム、コンピュータプログラム、及びシステム
(51)【国際特許分類】
C09D 201/00 20060101AFI20240709BHJP
G01N 33/32 20060101ALI20240709BHJP
C09D 7/40 20180101ALI20240709BHJP
【FI】
C09D201/00
G01N33/32
C09D7/40
(21)【出願番号】P 2021556355
(86)(22)【出願日】2020-03-13
(86)【国際出願番号】 EP2020056961
(87)【国際公開番号】W WO2020187788
(87)【国際公開日】2020-09-24
【審査請求日】2023-02-06
(32)【優先日】2019-03-18
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】519414848
【氏名又は名称】エボニック オペレーションズ ゲーエムベーハー
【氏名又は名称原語表記】Evonik Operations GmbH
【住所又は居所原語表記】Rellinghauser Strasse 1-11, 45128 Essen, Germany
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】クロール、オリヴァー
(72)【発明者】
【氏名】ブランダ、ガエタノ
(72)【発明者】
【氏名】シルバー、ステファン
(72)【発明者】
【氏名】フセン、インガ
(72)【発明者】
【氏名】ビットーフ、サンドラ
(72)【発明者】
【氏名】イスケン、フィリップ
(72)【発明者】
【氏名】シェーネベルク、ウルフ
【審査官】水野 明梨
(56)【参考文献】
【文献】特開平10-055348(JP,A)
【文献】特開2006-309485(JP,A)
【文献】特開2004-189835(JP,A)
【文献】特表2011-506961(JP,A)
【文献】特表2008-509486(JP,A)
【文献】米国特許出願公開第2014/0244558(US,A1)
【文献】米国特許第06421612(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
C09D 1/00-201/10
G01J 1/00-4/04
G01J 7/00-9/04
G06N 3/00-99/00
G06F 18/00-18/40
(57)【特許請求の範囲】
【請求項1】
塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物を生成する方法であって、
前記組成物はコンピュータシステムによって生成され、前記コンピュータシステムはデータベースにアクセスし、既知の組成物がコンポーネントおよびその特性と一緒に前記データベースに記憶され、前記コンピュータシステムは、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物を生成および検査するため、装置に接続されており、前記コンピュータシステムは、畳み込みニューラルネットワークおよびアクティブラーニングモジュールを有しており、以下の工程、すなわち、
a.データベースに記憶されている既知の組成物を用いて、畳み込みニューラルネットワークを訓練する工程であって、損失関数を最小にする工程と、
b.損失関数の値が所定の基準を満たすか否かを検査する工程であって、前記基準が満たされない場合には、以下の工程、すなわち、
i.アクティブラーニングモジュールによって、所定の試験組成物
の群から試験組成物を選択する工程、
ii.前記選択された試験組成物を生成および検査するため、前記装置を前記コンピュータシステムによって起動する工程、
iii.前記選択された試験組成物および前記装置によって検出されるその特性を用いて、前記畳み込みニューラルネットワークを訓練する工程、および
iv. 工程bを反復する工程
が実行される工程と、
c.
1つ以上の特性を特定する入力ベクトルを前記畳み込みニューラルネットワークに入力することにより、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の予測組成物を生成する工程と、
d.前記畳み込みニューラルネットワークによって、前記予測組成物を出力する工程とを有するものである
方法。
【請求項2】
前記アクティブラーニングモジュールによって、前記所定の試験組成物の群から前記試験組成物を選択する工程は、前記畳み込みニューラルネットワークの現在の予測モデルの誤差を最大に減少させるであろう前記試験組成物を選択する工程である
請求項1に記載の方法。
【請求項3】
前記アクティブラーニングモジュールによって、前記所定の試験組成物の群から前記試験組成物を選択する工程は、前記畳み込みニューラルネットワークの現在の予測モデルにより、多次元データ空間における分離線または分離面に最も近い前記試験組成物を選択する工程である
請求項1に記載の方法。
【請求項4】
前記アクティブラーニングモジュールは、前記畳み込みニューラルネットワークの前記現在の予測モデルに基づいて、1つ以上の前記特性または前記コンポーネントに関して、前記試験組成物によってカバーされるデータ空間を亜空間に分割できるサポートベクトルマシンである
請求項3に記載の方法。
【請求項5】
請求項1
から4のいずれか一項に記載の方法において、前記
所定の試験組成物
の群は、試験計画プログラムによって自動的に生成されるものである方法。
【請求項6】
請求項1
から5のいずれか一項に記載の方法において、前記コンポーネントは、固形物、例えば、色素および/または充填剤、結合剤、溶媒、樹脂、硬化剤、および種々の添加剤、例えば増粘剤、分散剤、湿潤剤、接着促進剤、消泡剤、表面変性剤、均染剤、触媒的に活性な添加剤、および特定作用の添加剤から成る群から選択されるものである方法。
【請求項7】
請求項1
から6のいずれか一項に記載の方法において、前記既知の組成物は、固形物および分散剤を有するものである方法。
【請求項8】
請求項1
から7のいずれか一項に記載の方法において、前記特性は、保存安定性、pH値、流動性、特に粘性、密度、相対質量、彩色、特に色の濃さ、製造中のコスト削減、および色素の収量の改善から成る群から選択されるものである方法。
【請求項9】
請求項1
から8のいずれか一項に記載の方法において、前記予測組成物は、前記コンピュータシステムのユーザーインターフェースに出力されるものである方法。
【請求項10】
請求項1
から9のいずれか一項に記載の方法において、前記装置は少なくとも2つの処理ステーションを有し、前記少なくとも2つの処理ステーションは、前記組成物および/または前記生成された組成物のコンポーネントを輸送するため、自動推進式の手段が前記処理ステーション間を移動できるようになっている輸送システムを通して、相互に連結されており、前記方法は、前記装置を制御するプロセッサに組成物を入力する工程を更に有し、前記プロセッサに入力される組成物は、前記選択された試験組成物または前記予測組成物であり、前記プロセッサは、前記入力された組成物を生成するために前記装置を作動し、前記入力された組成物の生成および前記入力された組成物の特性の測定は、前記少なくとも2つの処理ステーションで実行され、その後、前記測定された特性は前記コンピュータシステムのユーザーインターフェースに出力される、および/または前記測定された特性は前記データベースに記憶されるものである方法。
【請求項11】
請求項1
から10のいずれか一項に記載の方法において、前記コンピュータシステムは、前記データベースおよび/または塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物の生成および検査のための装置を用いて、通信インターフェースを通して通信するものであり、前記通信インターフェースは、USB、イーサーネット、WLAN、LAN、ブルートゥース(登録商標)、または別のネットワークインターフェースによって実施されるものである方法。
【請求項12】
請求項1
から11のいずれか一項に記載の方法において、前記組成物は調剤である方法。
【請求項13】
塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物を生成するためのコンピュータシステムであって、データベースおよびユーザーインターフェースを有し、
請求項1
から12のいずれか一項に記載の方法を実行するように構成されているものである
コンピュータシステム。
【請求項14】
コンピュータに、請求項1
から12のいずれか一項に記載の方法を実行させるための、コンピュータプログラム。
【請求項15】
システムであって、
塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物の生成および検査のための装置であって、前記装置は少なくとも2つの処理ステーションを有し、前記少なくとも2つの処理ステーションは、前記組成物および/または前記生成された組成物のコンポーネントを輸送するため、自動推進式の手段が前記処理ステーション間を移動できるようになっている輸送システムを通して、相互に連結されている装置と、
請求項
13に記載のコンピュータシステムとを有するものである
システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物の生成方法に関する。
【背景技術】
【0002】
塗料、ワニス、印刷インキの組成物、研削用樹脂、色素濃縮物、または他のコーティング剤は原料の複雑な混合体である。従来の塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物、配合、または調剤は、約20の原料(以後、コンポーネントとも呼ばれる)を有している。斯かる組成物は、例えば、固形物、例えば色素および/または充填剤、結合剤、溶媒、樹脂、硬化剤、および種々の添加剤、例えば増粘剤、分散剤、湿潤剤、接着促進剤、消泡剤、表面変性剤、均染剤、触媒的に活性な添加剤、例えば、乾燥剤および触媒、並びに特定作用の添加剤、例えば殺生物剤、光開始剤、および腐食阻害剤から選択される原料で構成される。
【0003】
従来、特定の好ましい特性を有する新しい組成物、調剤、および再調合は、経験値に基づいて特定され、その後化学的に合成され、試験されている。化学的、物理的、光学的、触覚的、および他の計測学的に検出可能な特性に関する特定の期待を満たす新しい組成物の構成は、相互作用の複雑さの故に、当業者にはほとんど予測不可能である。原料の広範囲な相互作用、およびそれに関連した複数の不合格試験の故に、斯かる方法は膨大な時間や経費を要するものである。
【0004】
化学組成を生成する認知コンピュータシステムは、(特許文献1)によって知られている。斯かるシステムは特定の制限を満足させる化学組成を決定し、その化学組成を生成および試験するものである。斯かるコンピュータシステムは、化学組成に関する既存データを用いることによる、学習システムの訓練に基づいている。しかし、斯かる既存データを用いて学習論理を訓練させるのに必要な十分規模のデータ記録を作成するのは、極めて複雑であり、かなりの時間と膨大な素材コストを必要とする。更に、ほとんどの実験室で利用可能な、既に合成され分析された組成物に関するデータ記録に、単純に依存できない場合が多い。それには種々の理由があるであろう。例えば、実験室は新しく設立されたばかりで、対応するデータセットをまだ有していないかもしれない。実験室は新しい製品ラインを確立したが、その新しい製品ラインの特徴に関する経験や対応するデータ記録をまだ有していないかもしれない。あるいは、データは利用可能であるが、その範囲は十分ではないかもしれない。あるいは、データは、訓練データ記録として使用可能な、歴史的に進化した構成と言う意味において、釣り合いがとれていない(偏り過ぎている)かもしれない。
【0005】
その結果、望ましい特性を有する組成物のコンポーネントの推定および予測は、人間および現在極めて狭い境界を有するコンピュータ支援手段の両方によって実行されている。これは多くの関連特性および多くのコンポーネントを有する複雑な組成物の場合に特に該当し、例えば、コンポーネントが複雑な経路で相互作用し、対応する化学製品の特性を決定する、塗料、ワニス、印刷インキの組成物、研削用樹脂、色素濃縮物、または他のコーティング剤などがその例である。
【0006】
斯かる理由により、新しい組成物は、現在、実際にまず化学的に製造され、その特性が測定され、その組成物が特に要求されている特性を有しているか否かについて、評価されなければならない。化学物質の特性を自動的に予測する手段は既に存在してはいるが、十分なサイズおよび品質を有する訓練データ記録の作成においては、問題の組成物を直接製造および試験する場合よりも更に複雑な場合が多い。塗料、ワニス、印刷インキの組成物、研削用樹脂、色素濃縮物、または他のコーティング剤に関する新しい組成物の開発は特に複雑であり、多くの時間を必要とする。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【課題を解決するための手段】
【0008】
従って、時間を節約し費用効果を高くすることにより、新しい組成物の開発または再調製方法の開発の達成方法を提供するのが、本発明の目的である。
【0009】
上記目的は、請求項1記載の、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物を生成する方法、並びに対応するコンピュータシステムおよびコンピュータプログラム製品によって達成される。本発明の実施形態は従属請求項に記載されている。本発明の実施形態は、互いに排除し合うものでない限り、自由に相互に組み合わせることができる。
【0010】
1つの態様において、本発明は塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物に関しており、当該組成物はコンピュータシステムによって生成されるものである。コンピュータシステムは、既知の組成物(そのコンポーネントおよび特性を含む)が記憶されているデータベースにアクセスできる。コンピューターシステムは、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物を生成および検査するための装置に接続されている。コンピューターシステムは、畳み込みニューラルネットワーク(CNN)およびアクティブラーニングモジュールを有している。本方法は、以下の工程、すなわち、
a.データベースに記憶されている既知の組成物を用いて、畳み込みニューラルネットワークを訓練する工程であって、損失関数を最小にする工程と、
b.損失関数の値が所定の基準を満たすか否かを検査する工程であって、基準が満たされない場合には、以下の工程、すなわち、
i.アクティブラーニングモジュールによって、一組の所定の試験組成物から試験組成物を選択する工程、
ii.選択された試験組成物を生成および検査するため、装置をコンピュータシステムによって起動する工程、
iii.選択された試験組成物および装置によって検出されるその特性を用いて、畳み込みニューラルネットワークを訓練する工程、および
iv. 工程bを反復する工程が、選択的に実行される工程と、
c.入力ベクトルを前記畳み込みニューラルネットワークに入力することにより、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の予測組成物を生成する工程と、
d.前記畳み込みニューラルネットワークによって、前記予測組成物を出力する工程とを有している。
【0011】
斯かる方法は有利である。何故ならば、完全自動または半自動反復プロセスにおいて、意味のある更なる訓練データにより、試験組成物および実証的に確認されたその特性の形態で、既存の訓練データを増進的かつ慎重に拡大することができ、各反復中に、拡大した訓練データを用いて、ニューラルネットワークの更新訓練が実行でき、それにより、損失関数が基準を満足させるまで、すなわちネットワークの予測誤差が十分小さくなるまで、各反復後に、ネットワークの予測品質を向上させることができるからである。
【0012】
以前に知られている組成物の数が制限されているので、最初の訓練段階後に取得される訓練されたニューラルネットワークは、数多くの望ましい特性を有する予測組成を確実に予測できない場合が多い。使用されるデータセットは、斯かる目的にとっては小さ過ぎる場合が多い。
【0013】
アクティブラーニングモジュールによって訓練データ記録を拡張するやり方は、少数の試験組成物の慎重な選択を可能にするので、ニューラルネットワークおよびその予測の質にとって特に有利である。従って、ニューラルネットワークの予測モデルの特に優れた向上を約束する試験組成物の自動かつ慎重な選択、並びに特定の選択された試験組成物に基づく、自動的に実行される合成および分析工程を通して、複数の反復により、ニューラルネットワークの予測力を迅速かつ効果的に向上させることが可能である。反復後、損失関数が基準を満たすことが確立されたならば、訓練されたニューラルネットワークの予測力は十分であると見なされるので、訓練データ記録の拡張はもはや必要ではなくなる。
【0014】
別の有利な態様においては、アクティブラーニングモジュールは、ニューラルネットワークの予測力を特別に向上させる試験組成物の自動選択を通して、既知の組成物の既存のデータ目録を拡張できるので、訓練データの偏向はほとんど自動的に補足可能である。
【0015】
本発明の実施形態によれば、一組の試験組成物は、試験計画プログラムによって自動的に生成される。例えば、試験組成物は、周知の組成物に基づいて、コンポーネントを追加したり削除したり、あるいは1つ以上のコンポーネントの量または濃度を変更したりすることにより、自動的に生成可能である。
【0016】
膨大な数の試験組成物が自動的に生成できるのであるから、斯かるやり方は有利であろう。従って、候補組成物を用いて大きいデータ空間がカバーできる。各コンポーネントは、試験組成物を生成するのに、実質的に広範囲なデータ空間をカバーする類似の変化(除去、追加、濃度の変化)を経験する訳であるから、試験組成物によってカバーされるデータ空間は、例えば、試験計画プログラムが試験組成物を生成するように設計されている場合、偏向が少ないという特長を有している。
【0017】
本発明の実施形態によれば、周知の組成物および/または試験組成物のコンポーネントは、固形物、例えば、色素および/または充填剤、結合剤、溶媒、樹脂、硬化剤、および種々の添加剤、例えば増粘剤、分散剤、湿潤剤、接着促進剤、消泡剤、表面変性剤、均染剤、触媒的に活性な添加剤、および特定作用の添加剤から成る群から選択される。
【0018】
本発明の実施形態によれば、装置によって検出される試験組成物の特性は、保存安定性、pH値、流動性、特に粘性、密度、相対質量、彩色、特に色の濃さ、製造中のコスト削減、および色素の収量の改善から成る群から選択される。
【0019】
本発明の実施形態によれば、予測組成物の出力は、コンピュータシステムのユーザーインターフェース上で行われる。ユーザーインターフェースは、例えば、モニター、拡声器、および/またはプリンターであってもよい。
【0020】
ユーザーは、組成物が合成のために化学装置へ送られる前に、もう一度予測組成物の可能性を手動で確認できるので、斯かる方法は有利であろう。
【0021】
実施形態によると、装置は少なくとも2つの処理ステーションを有している。少なくとも2つの処理ステーションは、組成物および/または生成された組成物のコンポーネントを輸送するため、自動推進式の手段が処理ステーション間を移動できるようになっている輸送システムを通して、相互に連結されている。
【0022】
実施形態によると、本方法は、装置を制御するプロセッサに組成物を入力する工程を更に有し、プロセッサに入力される組成物は、選択された試験組成物または予測組成物であり、プロセッサは、入力された組成物を生成するために装置を作動し、入力組成物の生成および入力組成物の特性の測定は、少なくとも2つの処理ステーションで実行され、その後、測定された特性はコンピュータシステムのユーザーインターフェースに出力される、および/または測定された特性はデータベースに記憶される。プロセッサは、例えば、装置と一体化した、あるいはネットワークを通して動作可能に装置に接続された、装置の主制御コンピュータのプロセッサであってもよい。
【0023】
ニューラルネットワークを反復して改善するため、完全自動システムまたは半自動システム(ユーザー確認が必要な場合)が提供され、既に存在する特定の訓練データ記録が慎重に拡張されるのであるから、訓練データ記録を拡張するのに、試験組成物を反復合成および検査(特性の決定)するやり方は有利であろう。従って、ニューラルネットワークに基づく予測方法は、化学装置の適切な制御および訓練データ記録拡張のために生成される経験データの自動使用を通して、独立的、自動的、および反復的に改善されるものである。
【0024】
ユーザーは化学製品の望ましい特性を特定するだけであり、それを行うのに必要な組成物の確認および望ましい特性を有する製品の生成は自動的に行われるのであるから、予測組成物が、入力ベクトルに特定される必要な特性について、ニューラルネットワークによって確認できるならば、予測組成物を合成および検査(特性の決定)するやり方は有利であろう。
【0025】
実施形態によると、コンピュータシステムは、データベースおよび/または塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物の生成および検査のための装置を用いて、通信インターフェースを通して通信するように設計されている。通信インターフェースは、USB、イーサーネット、WLAN、LAN、ブルートゥース(登録商標)、または別のネットワークインターフェースによって実施される。
【0026】
実施形態によると、組成物は調剤を有する、または調剤から成るものである。
【0027】
別の態様では、本発明は、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物を生成するためのコンピュータシステムに関する。コンピュータシステムは、データベースおよびユーザーインターフェースを有し、本発明の実施形態に基づく組成物を生成する方法を実行するように構成されている。
【0028】
別の態様では、本発明は、プロセッサによって実行可能な命令を含む、コンピュータプログラム、デジタル記憶媒体、またはコンピュータプログラム製品に関するものであり、それらは、プロセッサによって実行される場合、本発明の実施形態に基づく組成物を生成する方法を実行するようにプロセッサに指示を与える。
【0029】
別の態様では、本発明は、上述のコンピュータシステムおよび装置を有するシステムに関する。当該装置は、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物の生成および検査のための装置である。当該装置は少なくとも2つの処理ステーションを有している。少なくとも2つの処理ステーションは、組成物および/または生成された組成物のコンポーネントを輸送するため、自動推進式の手段が処理ステーション間を移動できるようになっている輸送システムを通して、相互に連結されている。
【0030】
本明細書では、「組成物」とは、少なくとも化学製品を形成する原料(「コンポーネント」)のタイプを特定する、当該化学製品の明細を意味するものと理解されたい。組成物の生成または検査が本出願の文脈で述べられる場合、要約に特記されているような、組成物および任意にその濃度に関する情報に従って化学製品が製造されること、あるいは当該化学製品が「検査される」こと、すなわちその特性が計測学的に検出されることを意味するものと理解されたい。
【0031】
本明細書では、「調剤」とは、コンポーネントの情報に加え、特定のコンポーネントに関する量または濃度情報を追加的に有する組成物を意味するものと理解されたい。
【0032】
「既知の組成物」とは、化学製品を特定する組成物であって、ニューラルネットワークの訓練中に、その特性が訓練を実行する人または組織には既知である組成物を意味するものであり、それは当該既知の組成物が化学製品を製造するのに、かって既に使用されており、その製品の特性が実証的に測定されているからであると理解されたい。測定は必ずしも化学実験室のオペレータによって実行されているものでなくてもよく、他の実験室によって実行および出版されているものであってもよい(その場合、特性は技術文献から導かれる)。上述の定義による組成物はサブセットとして機能する調剤も含んでいるので、本発明の実施形態による「既知の組成物」は「既知の調剤」も含む、あるいは「既知の調剤」でもある。
【0033】
「試験組成物」とは、化学製品を特定する組成物であって、ニューラルネットワークの訓練中に、その特性が訓練を実行する人または組織には未だ知られていない組成物を意味するものであると理解されたい。試験組成物は、例えば、手動でまたは自動的に特定された組成物であってもよいが、化学製品を実際に製造するのには未使用の組成物である。従って、その製品の特性も未知である。上述の定義による組成物はサブセットとして機能する調剤も含んでいるので、本発明の実施形態による「試験組成物」は「試験調剤」も含む、あるいは「試験調剤」でもある。
【0034】
本明細書では、「予測組成物」とは、訓練されたニューラルネットワークが予測する組成物であって、特性がユーザーによって予め規定された望ましい特性の明細に対応する化学製品を特定した組成物を意味するものと理解されたい。例えば、望ましい特性の明細は、入力ベクトルとしてニューラルネットワークに提供されてもよく、各望ましい特性の望ましいまたは好ましいパラメーター値またはパラメーター値の範囲を示すものである。
【0035】
本明細書では、「データベース」とは、任意のデータ記憶、あるいはデータ、特に構造データが記憶されている記憶領域を意味するものと理解されたい。データベースは、1つ以上のテキストファイル、スプレッドシートファイル、ディレクトリツリーのディレクトリであるデータベース、あるいはMySQLやPostgreSQLなどの比較データベース管理システム(DBMS)のデータベースであってよい。
【0036】
予測問題の「損失関数」(目的関数とも呼ばれる)とは、ニューラルネットワークの訓練中に使用され、値を出力する関数であり、その絶対値は、訓練されたニューラルネットワークの予測モデルの質の表示を提供するものであり、斯かる値の絶対値は、ニューラルネットワークの予測の間違いを示すものであるから、訓練コース中に最小化されなければならない関数である。
【0037】
本明細書では、組成物を生成および検査するための「装置」とは、複数の実験室装置および輸送ユニットで構成されるシステムであって、化学的ワークフローを自動的または半自動的に実行するため、実験室装置および輸送ユニットを統一されたやり方で共同で制御する位置にあるシステムを意味するものと理解されたい。ワークフローは、例えば、合成ワークフロー、分析ワークフロー、または両方のワークフローの組み合わせであってもよい。
【0038】
装置による「組成物の検査」とは、組成物の情報に従って生成された化学製品の特性の計測学的検出(「分析」)を意味するものと理解されたい。
【0039】
「アクティブラーニングモジュール」とは、1組の試験組成物から(比較的小さい)試験組成物のサブセットを慎重に選択するように設計されたソフトウェアプログラムまたはソフトウェアプログラムのモジュールを意味するものであり、斯かる選択された試験組成物の合成および実証的測定の後に、並びにニューラルネットワークの訓練中に斯かるデータを考慮した後に、特別に強力な学習効果を生じさせるものであると理解されたい。
【図面の簡単な説明】
【0040】
本発明の実施形態は、以下の図面において、例示的に、更に詳細に記載される。
【0041】
【
図1】ニューラルネットワークを訓練する方法、特性予測のために訓練されたネットワークを使用する方法、および/または液体媒体の組成物を予測する方法のフローチャートを示している。
【
図2】ニューラルネットワークの訓練および訓練されたネットワークの使用のための分散システムのブロック図を示している。
【
図3】「アクティブラーニングモジュール」がデータポイントを慎重に選択する多次元データ空間の2D部分を示している。
【
図4】入力および出力ベクトルを含む、ニューラルネットワークの構造を示している。
【発明を実施するための形態】
【0042】
図1は、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物を生成するためのコンピュータ実施方法のフローチャートを示している。本方法は、例えば、
図2に示されるようなコンピュータシステムによって実行されてもよい。
【0043】
工程102a)において、上述のカテゴリの化学製品の1つ以上の望ましい特性を含む入力ベクトル受け取ると、それに応答して、斯かる望ましい特性を有する予測組成物を予測するため、畳み込みニューラルネットワークを訓練する目的で、既知の組成物が「最初の訓練データ記録」として使用される。予測組成物は、少なくとも上述のタイプの化学製品(塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤)のコンポーネントのタイプ、および任意にその各量または濃度を特定するものである。既知の組成物と斯かる既知の組成物によって特定される既知の実証的に確認された化学製品の特性との組み合わせは、最初の訓練データ全体に含まれる個々のデータポイントまたはデータ記録を示すものである。
【0044】
次の工程104(b)において、損失関数の値が所定の基準を満たすか否かに関する検査が実行される。基準を満たすとは、訓練されたニューラルネットワークの予測の正確度は十分であると見なされることを意味する。その後に記載される工程106~112は、基準が満たされない場合に選択的に実行されるものである。そうでなければ、訓練は終了し(工程114)、完全に訓練されたニューラルネットワークが戻される。
【0045】
工程106において、アクティブラーニングモジュールが、1組の所定の試験組成物から試験組成物を選択する。本発明の実施形態に従って使用可能な複数の異なるアクティブラーニング手法が存在する。
【0046】
実施の変形体として、アクティブラーニングモジュールは「予期されるモデル変更」手法に従い、訓練されたニューラルネットワークの現在の予測モデルを最も良く変更するであろう試験組成物を選択する(ネットワークを新しく訓練する場合、斯かる試験組成物および実際に測定されたその特性が考慮される)。
【0047】
実施の別の変形体として、アクティブラーニングモジュールは「予期される誤差削減」手法に従い、訓練されたニューラルネットワークの現在の予測モデルの誤差を最大に減少させるであろう試験組成物を選択する。
【0048】
実施の別の変形体として、アクティブラーニングモジュールは「最小限界超平面」手法に従い、訓練されたニューラルネットワークの現在の予測モデルにより、多次元データ空間における分離線または分離面に最も近い試験組成物を選択する。分離線または分離面とは、予測モデルが分類決定を行う多次元データ空間内の境界線、すなわち分離線または分離面の一方側にあるデータポイントを分離線の反対側にあるデータポイントとは異なるクラスまたはカテゴリに割り当てる境界線である。データポイントが分離線に近ければ、予測モデルは分類決定に関して不確実であり、ニューラルネットワークを更に訓練するため、実際に測定された斯かる分離線の近くからのデータ記録(コンポーネントの組み合わせ、任意にその濃度、および斯かるコンポーネントの組み合わせに従って生成される化学製品の測定された特性で構成される)が追加測定されるならば、特に高レベルの恩恵がもたらされるであろうと解釈される。
【0049】
組成物の1つがデータベースから選択された後、工程108において、コンピュータシステムは、化学組成物を生成および検査するための装置を起動し、化学製品が、選択された試験組成物の情報に従って自動的に生成および検査されるようにする。斯かる検査は、化学製品の1つ以上の特性の計測学的検出、すなわち、例えば、pH値、明度、粘度などの測定を意味するものと理解されたい。
【0050】
工程108で得られる実際に測定された特性は、選択された試験組成物を補足するのに使用されるので、既知の組成物および既知の特性から成る更なる完全なデータポイントが作成され、a)または事前反復で使用される訓練データ記録の拡張においてそれが使用される。従って、ニューラルネットワークは、工程10において、拡張された訓練データ記録を用いて新たに訓練される。実施変形体次第ではあるが、拡張された訓練データ記録に基づいて、訓練が再び最初から実行されてもよいし、あるいは以前に学習した内容が保存され、新しい訓練データポイントを考慮してそれを修正することにより、工程10での訓練が増進的に実行されてもよい。
【0051】
工程112において、訓練されたニューラルネットワーク予測の質の再検査が行われ、ネットワークが十分な予測の質を有するまで(損失関数が基準をみたしている、すなわち、例えば、損失関数によって計算される「誤差値」が所定の最大値未満であると言う事実により明白となるまで)、工程104~112が反復される。
【0052】
完全に訓練されたニューラルネットワークは、1つ以上の望ましい特性を有する組成物を迅速かつ確実に予測する(いわゆる「予測組成物」)のに使用できる。ユーザーは、工程116において、斯かる目的で、1つ以上の望ましい特性を特定する入力ベクトルを訓練されたニューラルネットワークに入力する。例えば、入力ベクトルの要素は数値または値範囲(望ましいまたは好ましい値または値範囲であることは理解されたい)から構成されていてもよい。例えば、特定の値範囲の粘度および特定の彩色範囲の色を有するワニスの製造が要求されていてもよい。
【0053】
ネットワークは、意図的かつ慎重に拡張された訓練データ記録に基づき、何度か反復することにより、コンポーネント(および任意にその濃度)と結果的に得られる化学製品の特性との間の統計的相関関係を学習したのであるから、訓練されたニューラルネットワークは、工程118において、望ましい特性を有する予測組成を予測し、それを直接合成のため、ユーザーおよび/または化学装置へ出力する。
【0054】
ニューラルネットワークを訓練する目標は、訓練されたネットワークが、望ましい特性および対応するパラメーター値範囲の入力セット、すなわち少なくとも望ましい特性を有する化学製品のコンポーネントのタイプ、数、および任意に各量の指定に基づいて、予測組成物を予測することである。従って、コンポーネントが既知であり実際の特性が実証的に測定されている試験組成物が予測される場合、予測結果は、正しいか間違っているかのいずれかである。上述したように、訓練されたニューラルネットワークの予測の質を評価するのに、「損失関数」が使用される。
【0055】
最も単純な例の場合、予測問題(分類問題とも考えられる)用の損失関数(「目的関数」とも呼ばれる)は、例えば、1組の予測から正しく特定された予測だけを勘定するものであってもよい。正しい予測の割合が大きければ大きいほど、訓練されたニューラルネットワークの予測モデルの質は高い。例えば、流動特性(例えば、粘度)が所定の好ましい範囲内にあるか否かの疑問は、分類問題であると見なされてもよい。
【0056】
しかし、訓練されたニューラルネットワークの予測正確度を評価するのに、他の多くの損失関数および対応する基準の使用も可能である。例えば、ネットワークは、入力ベクトルの形態で望ましい特性を受け取り、斯かるデータを組成物のコンポーネントのタイプの予測に使用してもよい。斯かるアプリケーションの場合、ニューラルネットワークは、クラスではなく値、すなわち、例えば組成物のコンポーネントの量を推測する。斯かるアプリケーションの例は回帰問題と呼ばれる。斯かる目的には、異なる目的関数が必要である。例えば、回帰問題用の損失関数は、ネットワークが予測する値が、実際に測定された値とどの程度異なっているかを計算する関数であってもよい。例えば、損失関数は、各予測コンポーネントが、実際に使用される合成組成物のコンポーネントから逸脱している場合、その偏差の合計値と正の相関を有する出力値を持つ関数であってもよい。合計値は、例えば、相加平均であってもよい。例えば、実際に使用されるコンポーネントに関して、ネットワークによって予測される組成物の全コンポーネントの総合偏差(誤差)が所定の閾値未満であるならば、訓練されたニューラルネットワークの質は十分であると考えられてよい。この場合、ニューラルネットワークは、1つ以上の望ましい特性を有する化学製品を特定する未知の組成物の予測に使用できる。対照的に、予測コンポーネントの斯かる合計偏差が、実際に使用されるコンポーネントと比較して、所定の最大値から大幅に逸脱している場合、アクティブラーニングモジュールは、自動的に、訓練データ記録を拡張するように指示されるが、その場合、拡張された訓練データ記録を用いてニューラルネットワークを再訓練するために使用される、拡張訓練データ記録内の追加データポイントとして、更なる試験組成物を選択することにより、化学装置によってその合成および特性分析を指示することにより、並びに選択された試験組成物を測定された特性と一緒に使用することにより、それが行われる。
【0057】
各反復再訓練中に、装置が確認する特性に基づいて形成される入力ベクトルには、選択試験組成物に基づいて生成される製品の、実証的に測定された特性が含まれている。試験組成物の実際のコンポーネントと予測コンポーネントとを比較するのに損失関数が使用できるように、出力ベクトルには、選択された試験組成物の1組の予測コンポーネントが含まれている。損失関数を試験するのに使用される入力ベクトルは、損失関数によって計算される誤差値の変更が、入力ベクトルの変更ではなく、ネットワークの予測モデルの変更に帰することができるように、各反復中同一であるのが好ましい。いくつかの実施形態において、損失関数が特定の基準を満たすか否かの決定中に、データセットを拡張させるため、損失関数は、実証的に既知の特性を有する複数の試験組成物にも適用される。
【0058】
ネットワークの訓練が完了した後、訓練されたニューラルネットワークは、いくつかの望ましい特性および対応するパラメーター値範囲を特定する入力ベクトルに基づいて、予測組成物の予測の生成および出力を実行できる。出力はユーザーおよび/または装置に対して行われ、予測組成物に基づいて化学製品を生成する指示、およびその組成物が望ましい特性を有しているか否かに関して実証的に検査する指示が、自動的に出力される。
【0059】
概して、複数のコンポーネントおよびその相互作用の故に、適切な組成物の予測はほとんど不可能なので、本明細書記載の方法は、塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の製造において予測組成物を計算するのに有利である。例えば、一般的に、液体媒体中の固形物(例えば、色素、充填剤、または着色剤)を分散させるため、すなわち固形物の効果的な分散を達成し、分散に必要な機械的剪断力を減少させ、それと同時に可能な限り最大の充填レベルを達成するため、分散剤(分散添加剤とも呼ばれる)が使用される。分散剤は、凝集の分解を促進し、表面活性剤として機能し、分散対象の固形物または粒子の表面を湿潤および/または被覆して、好ましくない再凝集に対して斯かる固形物または粒子を安定させる。塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の製造中、分散剤は、外観および斯かるシステムの物理化学的特性を相当規模で決定し、重要な組成物成分として機能する、色素、着色剤、および充填剤などの固形物の導入を簡略化する。最適使用のためには、斯かる固形物は、調剤中に均一に分配されると同時に、一旦分配が達成されたならば安定化されるものでなければならない。固形物用の分散剤として複数の異なる物質が今日使用されている。極めて単純な低分子量化合物、例えばレシチン、脂肪酸、およびそれらの塩およびアルキルフェノールエトキシレートに加え、更に複雑な高分子量の構造体も分散剤として使用されている。広く使用されているのは、特に、アミノ官能性およびアミド官能性システムである。分散剤の選択および濃度は、製品の特性にかなりの影響を及ぼし得る。
【0060】
図2は、ニューラルネットワークの訓練、および組成物、特に塗料、ワニス、印刷インキ、研削用樹脂、色素濃縮物、または他のコーティング剤の組成物を予測するためのニューラルネットワークの使用に関する、分散システム200のブロック図である。
【0061】
当該システムは、既知の組成物206および試験組成物208を含むデータベース204を有している。最も簡単な例において、データベースは、既に上述したように、1つ以上のファイル、例えば、テキストファイルまたはコンマ区切りのファイルを記憶する記憶領域で構成されていてもよい。
図2に示される1つの実施形態において、データベース200は、データベース管理システム(DBMS)、例えば、MySQLなどの比較DBMSのデータベースである。特に、大規模なデータ記録の場合には、データ記録を管理し迅速に検索するのに、比較DBMSの使用が有利である(検索がより正確に特定でき、より迅速に実行できるからである)。例えば、既知の組成物206を第一データベース表に記憶し、試験組成物208を別のデータベース表に記憶することができる。しかし、全ての既知の組成物および試験組成物を1つの表に記憶させ、メタデータ/フラグを用いて、データ記録のタイプ毎にラベルを付すことも可能である。記憶タイプにより、2つの組成物タイプ間で論理的な区別が可能となる限り、当業者は、データをファイルする方法を自由に選択できる。
【0062】
既知の組成物206は、例えば、対応する化学製品を合成するために少なくとも1度既に実際に使用され、当該製品の化学的、物理的、触覚的、光学的、および/または他の計測学的に検出可能な特性を有する組成物を各々含む1組のデータ記録であってもよい。例えば、既知の組成物206は、特定の組織、特定の実験室、または特定の実験室装置244によって以前に既に合成され、前述の計測学的に検出可能なパラメーターのうち少なくともいくつかが実証的に記録されている組成物の総合であってもよい。
【0063】
従って、データベース204に記憶されている既知の組成物206は、そのコンポーネント(すなわち、個々の化学成分およびその量または濃度情報)だけでなく、斯かる組成物に基づいて合成された化学製品に関する少なくともいくつかの計測学的に検出可能な特性が既知の組成物であると性格付けられる。従って、化学製品の既知の組成物は、データ記録形式でデータベース204に各々示されており、斯かる製品のコンポーネントおよび斯かる製品に関する前述の計測学的に検出可能な特性がそれに含まれている。
【0064】
対照的に、データベース204に記憶されている試験組成物208は、化学的、物理的、触覚的、光学的、および/または他の計測学的に検出可能な特性が、少なくともデータベースおよび/または実験室装置244のオペレータには知られていない組成物である。これは
図2において疑問符によって示されている。従って、試験組成物は、化学製品のコンポーネント(すなわち、個々の化学成分およびその量または濃度情報)を示してはいるが、斯かる製品に関する前述の計測学的に検出可能な特性は示していないデータ記録形式で、データベース204に示されている。例えば、対応する組成物は、対応する化学製品を合成するために、対応する実験室または実験装置によって一度も使用されていない、あるいは少なくとも今までは一度も使用されていないので、前述の特性は入手可能ではないであろう。
【0065】
いくつかの実施形態において、試験組成物208は、当業者によって手動で作成され、データベースに記憶されたものであってもよい。例えば、化学者は、塗料およびワニスの合成、およびそれらの各特性に関する自らの経験に基づいて、当業者ならば特定の望ましい素材特性を有するであろうと期待する新しい試験組成物を特定できる。例えば、当業者が個々のコンポーネントを除去したり、新しく付加したりして、既知の組成物を修飾することにより、試験組成物を生成できる。組成物が1つ以上のコンポーネント(「調剤」、「拡張組成物」)の濃度を含む場合、斯かる拡張した試験組成物も、既知の組成物のコンポーネントの濃度を修飾することにより形成できる。
【0066】
他の実施形態において、試験組成物208は自動的に作成され、データベース204に記憶される。例えば、既知の組成物206の各々は、20の異なる化学的コンポーネントから成っている場合がある。試験組成物208は、組成物の個々のコンポーネントを他の物質で置き換えることにより自動的に作成される。
【0067】
組成物が濃度情報を含む「拡張」組成物である場合、既知の組成物206の個々のコンポーネントの量を変えることにより、例えば、10%増やすことにより、および/または10%減らすことにより、試験組成物を生成することもできる。10%増大、10%減少のコンポーネント量を用いて、単一のコンポーネントだけを一度に変化させるならば、コンポーネント当たりに、2つの変形体が形成される。従って、20コンポーネントの場合、この方法により、40の試験組成物が生成される。自動的に生成される試験組成物の数は、2つ以上のコンポーネントの濃度を既知の組成物の濃度と比較して同時に10%増大または減少させることにより、更に増大させるのが好ましい。従って、純粋に組み合わせたとしても、220=1,048,576の拡張試験組成物を自動的に生成することが可能である。更に多くの濃度変形体、すなわち、例えば、―20%、―10%、+10%、+20%を20のコンポーネントの各々について用いることにより、および/または化学的コンポーネントを用いて除去したり付加したりすることにより、試験組成物は更に膨大な数にまで増大させることができる。従って、試験組成物の組は膨大である(試験組成物の自動生成の場合には特にそうである)。
【0068】
いくつかの実施形態においては、試験組成物208は、手動で作成される試験組成物および自動生成される試験組成物の両方を有する。
【0069】
コンポーネントの膨大なパラメーター空間および任意にその濃度が迅速にカバーできるので、試験組成物の自動生成の方が有利であり、対応する試験組成物生成アルゴリズムが使用される場合には、個々のコンポーネントおよびその濃度が、広範囲かつワイドメッシュ的にカバーされることになる。
【0070】
手動による補足の試験組成物は、当業者がその専門知識に基づいて、ニューラルネットワークについて特に高度の学習効果を期待できる試験組成物であり得るし、当業者は、他の理由により、その合成を通して、発見と言う恩恵を享受することも期待できる。
【0071】
データベースは既知の組成物を100しか含んでいないが、試験組成物は900であると言う意味で、一般的に、
図2は膨大な数の試験組成物を暗に示すものである。既知の組成物と試験組成物との間の実際の割合は、個々の例で異なっている、すなわち、例えば、特定の実験室で既に生成された組成物の数、その化学的特性が既に決定されているか否か、データベースは既知の組成物およびその特性を外部情報源から取り入れたものであるか否か、および/または試験組成物は手動で作成されたものか、あるいは自動作成されたものか次第である。従って、データベース204は、数千の既知の組成物を有している可能性も確かに存在する。試験組成物の組は、コストおよび経済的効率の点で、実験室が物理的に実際に実行可能な実証的合成試験の組よりも、一般的にはるかに膨大なものである。
【0072】
分配システム200は更にコンピュータシステム224を有しており、コンピュータシステムは、ニューラルネットワーク226およびアクティブラーニングモジュール222を有している。アクティブラーニングモジュール222は、データベース204にアクセスする。アクセスは、少なくとも、1つ以上の選択された試験組成物およびそのコンポーネントをデータベース204から読み取ることが可能な読み取りアクセスである。いくつかの実施形態によると、アクティブラーニングモジュール、および/または選択された試験組成物に基づいて化学製品を合成および計測学的に分析する化学装置244は、データベース204に書き込む許可、すなわち選択された試験組成物に関して計測学的に検出された特性をデータベース204に記憶させる許可も有している。例えば、選択され新しく合成された試験組成物に関して計測学的に検出された特性を記憶させることにより、斯かる試験組成物は既知の組成物となり、それに従って、データベース204の異なる場所に記憶される、および/または他のメタデータ(「フラグ」)が提供される。例えば、アクティブラーニングモジュールおよび/または化学装置244のアクセスがネットワークを通して行われるように、DBMS202がデータベースサーバーに設置されてもよい。ネットワークは特に組織のイントラネットであってもよいが、インターネットであってもよい。
【0073】
他のシステム構造も可能である。例えば、データベース204またはDBMS202は、コンピュータシステム224または主制御プロセッサ246の一部であってもよいし、および/またはニューラルネットワーク226およびアクティブラーニングモジュール222は、異なるコンピュータシステムに設置されてもよい。実際に選択される構造体とは関係なく、
図2に示されるようなデータ210、212、214、218の交換は、当該方法に参加している全てのコンポーネントが、他のコンポーネントの必要入力データを取得できるような方法で、可能でなければならない。データ交換は、ゲートウェイなどの更なるコンポーネントを通して直接または間接に実行できる。例えば、いくつかの実施形態においては、化学装置は、選択された試験組成物に関して計測学的に検出された特性を直接データベース204に記憶できる、あるいはそれをコンピュータシステムへ送るだけであるが、コンピュータシステムはその特性をデータベース204に記憶するので、試験組成物のデータ記録はその特性によって補足され、その結果、「既知の組成物」となる。
【0074】
別の代替システム構造体によると、コンピュータシステム224および主制御プロセッサ246は、同じコンピュータシステムである。
【0075】
本発明の実施形態によれば、コンピュータシステム224またはそれに設置されたコンポーネント226、222は、まず既知の組成物206をデータベースから読み出し、ニューラルネットワーク226の最初の訓練用に、訓練データ記録210として既知の組成物206を使用するように設計されている。ニューラルネットワークの訓練中、ニューラルネットワークの予測モデルが生成されるが、それは、訓練データ記録に基づいて、化学製品(すなわち組成物)の合成に使用されるコンポーネントと合成された製品に関して計測学的に検出された特性との間の関係をマッピングする。訓練されたニューラルネットワークは、訓練コース中に取得される斯かる予測モデルを用いて、入力ベクトルの形式で入力される望ましい特性に基づき、望ましい特性を有すると考えられる製品を特定する組成物を予測することができる。例えば、望ましい特性は、化学製品の粘度が特定のパラメータ値範囲内にあるものであってもよい。
【0076】
既知の組成物206およびその特性数が制限されているので、最初の訓練段階後に取得される訓練されたニューラルネットワーク226は、多くの場合、望ましい特性のリストに基づいて、十分な確実性を持って組成物のコンポーネントを予測する位置にはまだ至っていない。使用されるデータセットは、斯かる目的には小さ過ぎる場合が多い。
【0077】
装置244の全試験組成物を合成し、その後その特性を計測学的に決定することによる訓練データの拡張は、通常コストが高過ぎるし、および/または複雑過ぎる。本発明の実施形態によれば、アクティブラーニングモジュールの慎重な使用により、僅かな試験組成物だけを選択し、可能な限り少ない合成で(従って、コストも複雑性も可能な限り低く)訓練データ記録を拡張するため、そのためだけに、対応する化学製品を化学装置244で合成および分析することが可能となり、それ故に、ニューラルネットワーク226の予測モデルの予測力は、拡張訓練データ記録を用いて新しく訓練することにより、大幅に向上する。ニューラルネットワークの予測力は、拡張訓練データ記録を用いてニューラルネットワークを再び訓練した後、損失関数228を用いて再び検査される。所定の基準が満たされない場合、すなわち、例えば、損失値が所定の最大値を超えている場合、ニューラルネットワークの質またはその予測モデルの質は未だ十分高くなく、更に拡張した訓練データ記録を用いて、新しい訓練が実行されなければならないことを、それは意味している。この場合、アクティブラーニングモジュールは、対応する媒体の合成のために以前に未だ選択されても使用されてもいない試験組成物に関して、新しい選択工程を実行する。上述したように、選択された試験組成物に基づく化学製品の合成、および斯かる製品の特性の計測学的検出が実行されるので、更に拡張した訓練データ記録に基づいてニューラルネットワーク226を再訓練するため、選択された試験組成物を測定された特性と一緒に、新しい訓練データ記録として、既存の訓練データに付け加えることが可能となる。従って、複数回の反復により、ニューラルネットワークの予測モデルの劇的な向上を約束する試験組成物を自動的かつ慎重に選択することにより、並びに特別に選択された試験組成物に基づいて合成および分析を自動的に実行することにより、ニューラルネットワークの予測力を迅速かつ効果的に向上させることが可能となる。反復後、損失関数が基準を満たすことが確立されたならば、訓練されたニューラルネットワークの予測力は十分であると見なし得るので、訓練データ記録の拡張はもはや必要ではない。
【0078】
選択対象の試験組成物の同定は、例えば、
図3に示される方法で行われる。アクティブラーニングモジュール222は、(例えば、比較データベースへのSELECTコマンドを用いて)データベース204から同定された試験組成物を読み取り、それを化学装置244へ送信するように構成されている。従って、コンピュータシステム224は、装置224と交信するためのインターフェースを有している、および/または装置の一体部分である。装置は、選択された試験組成物212に基づいて化学製品を合成し、合成された製品の1つ以上の特性を測定するように構成されている。例えば、化学製品の合成または分析中に1つ以上の工程またはその中間段階を実行する、複数の合成装置254,256または合成モジュールおよび複数の分析装置252(または分析モジュール)を有していてもよい。装置は、更に、コンポーネント、中間製品、および消耗品を異なる合成および/または分析ユニット間で輸送する1つ以上の輸送ユニット258、例えばコンベヤーベルトまたはロボットアームを有している。装置244は、制御ソフトウェア248を含む主制御プロセッサ246を有している、あるいはネットワークを通して、斯かるプロセッサ248に動作可能に接続されている。制御ソフトウェア248は、選択された組成物212の情報に基づく化学製品が合成され、その特性が計測学的に検出されるように、合成ユニット、分析ユニット、および輸送ユニットによって実行される合成、分析、および/または輸送工程を調整するように構成されている。制御ソフトウェアは、特性が記憶され、選択された試験組成物にリンクされるように、(直接またはコンピュータ224を通して)新しく合成された選択組成物に関して、検出された特性218をデータベース204に記憶させるものであるのが好ましい。プロセス中、選択された試験組成物の「不完全な」データ記録は、装置244で計測学的に検出された特性によって補足され、その結果、「既知の組成物」へと変換される。
【0079】
選択された試験組成物の特性218は、更にコンピュータシステム244へ送信されるので、アクティブラーニングモジュールによって選択される組成物212とその特性218との組み合わせが、新しい完全なデータ記録を提供し、それにより、訓練データの全体が拡張される。ニューラルネットワークは、拡張された訓練データセットに基づいて再訓練され、訓練データの拡張がニューラルネットワークの予測の質に及ぼす影響が、損失関数228を用いて試験される。損失関数の値が所定の基準を満たす場合、すなわち、例えば、最大値未満の損失値しか有していない場合には、訓練は終了される。そうでなければ、基準検査の結果はアクティブラーニングモジュールへ送信され、そこで別の試験組成物を選択するように指示される。
【0080】
化学製品の合成および分析用の装置244または複数の装置は、分散システム200の一体部分である。
【0081】
装置244は、大量処理環境装置(HTE装置)、例えば、塗料およびワニスの分析および製造用の大量処理環境装置であってもよい。HTE装置は、例えば、WO 2017/072351 A2に記載されているような、化学製品の自動試験および自動製造用のシステムであってもよい。
【0082】
当業者は、十分大規模な訓練データ記録を得るため、慎重さを欠きしかも複雑なやり方で複数の滴定段階およびコンポーネント組成物を合成および分析しなければならない作業を、
図2に示されるシステムを用いることにより回避できる。コンポーネント、その各組合せ、および濃度間の依存関係のとてつもない複雑さ、並びに計測学的に検出可能な化学製品の異なる特性とそのコンポーネントおよびその濃度との依存関係の複雑さの故に、人間である当業者が、斯かる依存関係の全てを知的に検出し、有望な組成物を手動で慎重に特定するのは一般的にほとんど不可能である。コンポーネントおよび濃度の可能性領域の組み合わせの膨大な規模に鑑み、人間である当業者は、斯かる可能性領域のうちの比較的小さく実質的にランダムに選択された部分だけを実証的に試験するに過ぎない。従って、今までは、組成物の合成および分析に膨大な時間と材料を消費せざるを得ず、結局、望ましくない製品特性しかもたらさず、および/または訓練データ記録の一体部分としてのその使用は、ニューラルネットワークの予測モデルの質の顕著な向上には至らなかった。僅かな数の試験組成物を慎重に選択するのにアクティブラーニングモジュールを使用することにより、正確なニューラルネットワークの開発に適した訓練データ記録を提供するプロセスが大幅に促進される。
【0083】
本発明の実施形態によれば、別の有利な態様において、歴史的に発展してきた既存の既知の組成物セットを試験組成物の慎重な選択を通して理想的に補足する、訓練データ記録を提供するのに、システム200が使用できる。既知の組成物206は、実験室または実験室装置の操作中に合成および分析され、対応するデータが記憶される、組成物およびその特性であってもよい。従って、既知の組成物は、組成物および任意に濃度の組み合わせ可能な空間全体に亘って均一に分散されているものではなく、実験室または実験室装置の操作の歴史からランダムに生じたものである可能性が高い。アクティブラーニングモジュールはニューラルネットワークの予測モデルを補足するのに使用され、そのように構成されてもよく、最初は既知の組成物206を用いた初期訓練に基づいて形成され、僅かな数の更なる実験的合成および分析が行われるので、例えば、既知の組成物206によって不十分にしかカバーされていないコンポーネントおよび濃度が、慎重に選択された試験組成物によってカバーされるようになる。
【0084】
ニューラルネットワークの反復訓練が終了した後、計測学的に検出可能な特性、すなわち、例えば、化学的、物理的、または他のパラメーターに関して、規定された望ましい値範囲内にある組成物を予測する(「予測組成物」)のに、訓練されたニューラルネットワークが使用可能である。斯かる目的において、望ましい特性は入力ベクトルの形式で示され、訓練されたニューラルネットワークに入力される。その結果、ニューラルネットワークはコンポーネントのタイプ(更に任意にその量)を確認するので、望ましい特性を有する化学製品が生成可能となる。予測組成物は、制御コマンドと一緒に、ニューラルネットワークから装置244へ自動的に送信され、予測組成物に基づく化学製品が生成される。制御コマンドは、任意に、斯かる製品の特性を自動的に測定し、取得された特性と一緒に、予測組成物をデータベースに記憶し、それによって既知の組成物のセットを拡張するように、装置に指示してもよい。
【0085】
図3は、「アクティブラーニングモジュール」が訓練データ記録を拡張するのにデータポイント308を慎重に選択するための、多次元データ空間300の2D部分を示している。ニューラルネットワークは、訓練コース中、組成物の特性を特定する入力ベクトルに基づいて、組成物、すなわち化学製品のコンポーネントの明細を示す出力ベクトルの計算を学習する。本発明の実施形態によれば、入力ベクトルで特定される特性には、以下の特性、すなわち保存安定性、pH値、流動性、特に粘性、密度、相対質量、彩色、特に色の濃さ、製造中のコスト削減、および色素の収量、並びに斯かる特性の2つ以上の組み合わせが含まれる。製造中のコスト削減が、例えば、組成物の合成中に化学装置によって記録され、所定の参照値とされる。しかし、人間がコストを手動で記録するのも可能である。一般的に、ニューラルネットワークを訓練するのに使用される訓練データ記録の一体部分でもある入力ベクトルに、斯かる特性だけを特定するのも可能である。
【0086】
ニューラルネットワークの最初の訓練後、ネットワークは、既知の組成物に基づいて、組成物のコンポーネントといくつかの特性との間の特定の関係を既に学習している。斯かる学習された関係は、本明細書では、分離線316によって図示されており、それは、特性「粘度」に関して、データ空間300を、分離線318の左下に流動学的に好ましい製品特性を有するデータ空間320と、分離線の右上に流動学的に好ましくない製品特性を有するデータ空間318に分割したものである。
図3は、2つの次元または2つの対応するコンポーネント(「色素P1の濃度」および「分散剤の濃度」)に限定された、データ空間300の部分態様を示すものに過ぎない。データ空間300は、例えば、それ自体で多次元的であり、20コンポーネントの場合、対応する20の次元を有してもよく、斯かる20の次元によって形成される斯かる空間の各々には、特別に考慮される特性に関する専用の分離線または多次元分離面(「超平面」)が含まれる。
【0087】
各例において、
図3に円形で示されるデータポイントは、試験組成物208の1つを示している。試験データポイントの1つの選択は、いわゆる「最小限界超平面」に従って行われてもよい。例えば、アクティブラーニングモジュールは、ニューラルネットワーク226によって既に学習した予測モデルに基づいて、1つ以上の特性(またはコンポーネント)に関して、試験組成物によってカバーされるデータ空間を亜空間に分割できるサポートベクトルマシンまたは別のアルゴリズムとして設計されてもよい。従って、本明細書において、以前に学習したニューラルネットワークのモデルは分離線または分離面316によって示される。分離線316からの距離が最も小さいデータポイントは、斯かる分離線316によって示される以前に学習した予測モデルは最も不確かなものであり、従って、斯かるデータポイントに属する試験組成物は、実際の特性(例えば、粘度)を実証的に決定するため、選択、合成、および分析されるべきであると、最小限界超平面は仮定する。従って、図示される例においては、特性「粘度」だけを考慮するアクティブラーニングモデルは、斯かる試験組成物のコンポーネントおよび実証的に測定されたその特性によって訓練データを拡張し、拡張された訓練データ記録を用いて、訓練によってニューラルネットワークを改善するため、データポイント308によって示される試験組成物を選択し、斯かる組成物の合成および分析を化学装置244に指示するであろう。例えば、ポイント306によって示される組成物の実証的測定値は、その粘度が流動学的に好ましくない範囲320にあることを示す可能性がある。拡張された訓練データ記録を用いる再訓練の結果、分離線316によって図示されているニューラルネットワークの予測モデルは、ポイント306によって示されるような組成物の将来予測において、その粘度が範囲320にあるように調整するであろう。従って、拡張された訓練データ記録を用いた新規の訓練結果として、分離線/分離面316は右上の方向へ「隆起する」ように修正され、その結果、改善されたニューラルネットワークは、ポイント308によって示される組成物は流動学的に好ましくない範囲320にあると認識し予測するようになるであろう。実際面において、対応するデータポイントと複数の特性の分離線との間の距離がデータポイントまたは対応する試験組成物の選択において考慮され、その結果、データ空間300の全分離線/分離面からの最小平均距離を有するデータポイントが選択されるのが好ましい。
【0088】
図4は、入力ベクトル402を入力として受け取り、それから出力ベクトル406を計算し、それを出力するように構成され訓練された、訓練ニューラルネットワークの構造を示している。入力ベクトルは、組成物の望ましい特性および対応するパラメーター値範囲を特定するが、そのコンポーネント(および任意に各コンポーネントの濃度または量)は、ニューラルネットワークによって予測されるべきである。出力ベクトル406は、予測組成物のコンポーネントおよび任意に予測組成物の斯かるコンポーネントの量または濃度を特定するが、その場合、予測組成物は、入力ベクトルに予め規定されたパラメーター値範囲内の特性を有していると、ニューラルネットワークが予測する組成物である。ネットワークは、数学的重み関数によって他の層のニューロンにリンクされた複数のニューロン層404を有しているので、入力ベクトルに特定された望ましい特性に基づいて、対応する組成物のコンポーネントを計算(すなわち予測)でき、斯かるコンポーネント、従って予測調剤そのものを出力ベクトル406の形式で出力できる。
【0089】
ニューラルネットワークのニューロンは、訓練前に、所定のまたはランダムなアクティベーション(重み)でまず初期化される。訓練中、ネットワークは、実証的に測定された既知の組成物の特性を示す入力ベクトルを受け取り、斯かる組成物の予測コンポーネント(および任意にコンポーネントの量)を含む出力ベクトルを計算し、実際に使用されるコンポーネントからの予測コンポーネントの偏差について、損失関数によってペナルティが科せられる。確認された予測誤差はバックプロパゲーションと呼ばれるプロセスによって特定のニューロンへ送り戻され、予測誤差(従って、損失関数の値)が減少するように、特定のニューロンのアクティベーション(重み)が変更される。数学的に、損失関数の最急上昇法が斯かる目的のために決定されてもよく、その結果、ニューロンのアクティベーションは指示された方法で修正され、損失関数によって出力される値は最小化される。予測誤差または損失関数の値が所定の閾値を下回るや否や、訓練されたニューラルネットワークは十分正確であると見なされ、更なる訓練は必要でなくなる。
【0090】
例えば、作業は、値範囲VWBの特定の粘度、値範囲FWBの特定の色、および値範囲AWBの摩耗抵抗を有する新しい未知の組成物を生成することであってもよい。この組成物が実験室で実際に合成される前に、粘度、色、および摩耗抵抗が値範囲VWB、FWB、およびAWB内にある組成物のコンポーネントを自動的に確認するのに、ニューラルネットワークがまず使用される。望ましい値範囲内の特性を有する予測組成物が見つからない場合、合成は最初から行わなくてもよいので、コスト節約が可能である。特性に関して明細を変更するのが有益な場合もある。
【0091】
この新しい組成物のコンポーネントおよび任意にその各濃度は、ニューラルネットワークの出力ベクトル406として、手動評価のためにユーザーへ、および/または化学装置へ出力される。出力ベクトルは、例えば、予測組成物または予測組成物に基づいて合成される化学製品が望ましい特性を有しているとニューラルネットワークが予測した当該組成物のコンポーネントを20有していてもよい。入力特性は、ニューラルネットワークの訓練中に既に考慮された特性である。他の実施形態においては、組成物のタイプあるいは関連性があると考えられる特性次第ではあるが、ベクトル402、406は、それよりも多くの、またはそれよりも少ない数の要素を有していてもよい。
【符号の説明】
【0092】
102~118 工程
200 分散システム
202 DBMS
204 データベース
206 特性を有する既知の組成物
208 試験組成物(特性は未知)
210 最初に使用される訓練データ記録
212 選択された試験組成物
214 試験組成物に関する選択コマンド
218 選択された試験組成物について実証的に確認された特性
222 アクティブラーニングモジュール
224 コンピュータシステム
226 ニューラルネットワーク
228 損失関数
244 化学装置
246 主制御プロセッサ
248 制御ソフトウェア
252 分析装置
254 分析装置
256 分析装置
258 輸送ユニット
300 試験組成物の多パラメーターデータ空間の2D部分
302~312 データポイント(各々試験組成物を示す)
316 訓練ニューラルネットワークの予測モデルの分離線
318 流動学的に好ましい範囲
320 流動学的に好ましくない範囲
400 ニューラルネットワークの構造
402 入力ベクトル
404 ニューラルネットワークの層
406 出力ベクトル