IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バテル メモリアル インスティチュートの特許一覧

特表2023-547792人工知能(AI)により支援された電子顕微鏡データの解析
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-11-14
(54)【発明の名称】人工知能(AI)により支援された電子顕微鏡データの解析
(51)【国際特許分類】
   G06T 7/00 20170101AFI20231107BHJP
   G06V 10/82 20220101ALI20231107BHJP
   G06V 20/69 20220101ALI20231107BHJP
   G06N 3/04 20230101ALI20231107BHJP
【FI】
G06T7/00 350C
G06V10/82
G06V20/69
G06N3/04
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023521495
(86)(22)【出願日】2021-10-08
(85)【翻訳文提出日】2023-05-12
(86)【国際出願番号】 US2021054308
(87)【国際公開番号】W WO2022076915
(87)【国際公開日】2022-04-14
(31)【優先権主張番号】63/089,080
(32)【優先日】2020-10-08
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.PYTHON
2.WINDOWS
3.Linux
4.MAC OS
5.JAVASCRIPT
(71)【出願人】
【識別番号】510300991
【氏名又は名称】バテル メモリアル インスティチュート
(74)【代理人】
【識別番号】100127926
【弁理士】
【氏名又は名称】結田 純次
(74)【代理人】
【識別番号】100140132
【弁理士】
【氏名又は名称】竹林 則幸
(74)【代理人】
【識別番号】100216105
【弁理士】
【氏名又は名称】守安 智
(72)【発明者】
【氏名】サラ・エム・リール
(72)【発明者】
【氏名】スティーブン・アール・スパージョン
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096CA18
5L096EA39
5L096FA32
5L096FA59
5L096GA30
5L096HA11
(57)【要約】
コンピュータ実装方法が、(i)関心対象の実データセットの少なくとも一部分を、各チップが関心対象の実データセットの部分の実データサブセットを含むチップのグリッドに分割し、実データセットの部分から選択されたグランドトゥルースの例に対応する少数のユーザ選択のチップを受信することであって、選択されたチップは、少数ショットクラスプロトタイプのサポートセットを定義することと;(ii)サポートセットの潜在空間表現を、埋め込みニューラルネットワークを用いて符号化し、少数ショットクラスプロトタイプをサポートセットの潜在空間表現の平均ベクトルとして定義することと;(iii)埋め込みニューラルネットワークを用いて、関心対象の実データセットの他のチップの潜在空間表現を符号化し、少数ショットニューラルネットワークを用いて、他のチップの潜在空間表現を少数ショットクラスプロトタイプと比較し、この比較に基づいて、他のチップに、少数のユーザ選択のチップに類似した関心対象の実データセットにおける特徴を識別するための少数ショットクラスプロトタイプラベルを割り当てることと、を含む。
【選択図】図3D
【特許請求の範囲】
【請求項1】
コンピュータ実装方法であって:
関心対象の実データセットの少なくとも一部分を、各チップが関心対象の実データセットの該部分の実データサブセットを含むチップのグリッドに分割し、実データセットの該部分から選択されたグランドトゥルースの例に対応する、少数のユーザ選択のチップを受信することであって、選択されたチップは、少数ショットクラスプロトタイプのサポートセットを定義することと;
サポートセットの潜在空間表現を、埋め込みニューラルネットワークを用いて符号化し、少数ショットクラスプロトタイプをサポートセットの潜在空間表現の平均ベクトルとして定義することと;
埋め込みニューラルネットワークを用いて、関心対象の実データセットの他のチップの潜在空間表現を符号化し、少数ショットニューラルネットワークを用いて、他のチップの潜在空間表現を少数ショットクラスプロトタイプと比較し、該比較に基づいて、他のチップに、少数のユーザ選択のチップに類似した関心対象の実データセットにおける特徴を識別するための少数ショットクラスプロトタイプラベルを割り当てることと、
を含む、前記コンピュータ実装方法。
【請求項2】
サポートセットの潜在空間表現を符号化することは、D次元を有するサポートデータセットを、学習可能なパラメータφを有する埋込み関数f(φ)を通じて、M次元を有する潜在空間表現に変換することを含む、請求項1に記載の方法。
【請求項3】
クラスプロトタイプのためのサポートセットSは、S={(x;y);...(x;y)}であり、xはチップiを表し、yは対応する真のクラスラベルであり、埋込み関数を用いて変換することにより、fφ(x)=zを通じて変換されたチップが生成され、クラスプロトタイプkのための埋め込まれたサポート点を含む平均ベクトルは:
【数1】
によって定義される、請求項2に記載の方法。
【請求項4】
他のチップの潜在空間表現を少数ショットクラスプロトタイプと比較し、該比較に基づいて、他のチップに少数ショットクラスプロトタイプラベルを割り当てることは、他のチップごとに:
チップの潜在空間表現と、少数ショットクラスプロトタイプとの間のユークリッド距離を計算することと;
softmaxを用いて距離をクラス確率に正規化することと;
少数ショットクラスプロトタイプラベルをチップに割り当てることであって、少数ショットクラスプロトタイプラベルは最も高いクラス確率を有することと、
を含む、請求項1に記載の方法。
【請求項5】
チップに関連付けられたクラス確率を、近傍のチップのラベル付けに基づいて重み付けすることによって、ラベル平滑化を適用することを更に含む、請求項1に記載の方法。
【請求項6】
サポートセットを定義するチップを調節することによってラベル平滑化を適用することを更に含む、請求項1に記載の方法。
【請求項7】
実データセットは1つまたはそれ以上の画像を含み、チップのグリッドは部分画像のグリッドを含む、請求項1に記載の方法。
【請求項8】
少数ショットクラスプロトタイプラベルを割り当てられたチップのパーセンテージおよび面積に基づいて、1つまたはそれ以上の画像における特徴タイプの総面積を推定することを更に含む、請求項7に記載の方法。
【請求項9】
埋め込みニューラルネットワークは、関心対象の実データセットに関連しているかまたは関連していないデータセットに対し事前トレーニングされた既製のニューラルネットワークである、請求項1に記載の方法。
【請求項10】
少数のユーザ選択のチップは、1個以上かつ10個以下のユーザ選択のチップを含む、請求項1に記載の方法。
【請求項11】
実データセットから選択されたグランドトゥルースの例に対応する別の少数のユーザ選択のチップを受信することであって、少数の追加の選択されたチップは第2の少数ショットクラスプロトタイプのための第2のサポートセットを定義することと、第2のサポートセットを用いて第2の少数ショットクラスプロトタイプを定義することと、潜在空間表現を第2の少数ショットクラスプロトタイプと比較し、該比較に基づいて、追加の少数のユーザ選択のチップに類似した関心対象の実データセットの特徴を識別するための第2の少数ショットクラスプロトタイプラベルをチップに割り当てることとを更に含む、請求項1に記載の方法。
【請求項12】
少数ショットクラスプロトタイプラベルの割り当てに応答して実データセットから選択されたグランドトゥルースの例に対応するユーザ選択のチップの別の少数の番号付けされたセットを受信することを更に含み、ここで、ユーザ選択のチップの追加の少数の番号付けされたセットの選択されたチップは、別の少数ショットクラスプロトタイプのためのサポートセットを定義する、請求項1に記載の方法。
【請求項13】
ユーザ選択のチップの追加の少数の番号付けされたセットの選択されたチップは、少数のユーザ選択のチップの以前の選択に対する調節を含む、請求項12に記載の方法。
【請求項14】
関心対象の実データセットは、経時的に変化する実データセットを含み、該方法は、少数ショットクラスプロトタイプを定義した後、後の時系列においてまたはデータ取得中に得られたデータに基づいて、新たな少数ショットクラスプロトタイプを追加するか、または少数ショットクラスプロトタイプを変更することを更に含む、請求項1に記載の方法。
【請求項15】
関心対象の実データセットは、第1の検出モダリティに従って取得され、該方法は、少数ショットクラスプロトタイプラベルを、第2の検出モダリティに関連付けられた関心対象の第2の実データセットの類似のチップに割り当てることを更に含む、請求項1に記載の方法。
【請求項16】
第2の検出モダリティに関連付けられた第2の少数ショットクラスプロトタイプのための第2のサポートセットとして割り当てられた少数ショットクラスプロトタイプラベルを有する類似のチップのうちの1つまたはそれ以上を定義することを更に含む、請求項1に記載の方法。
【請求項17】
関心対象の実データセットは、第1の検出モダリティに従って取得され、方法は:
第2の検出モダリティに関連付けられた第2の実データセットの一部分から選択されたグランドトゥルースの例に対応する少数のユーザ選択のチップの第2のセットを受信することを更に含み、ここで、選択されたチップは第2のサポートセットを定義し;
少数ショットクラスプロトタイプは、サポートセットおよび第2のサポートセットの潜在空間表現に関して定義された総計の少数ショットクラスプロトタイプであり;
少数ショットニューラルネットワークを用いることは、関心対象の実データセットおよび関心対象の第2の実データセットの他のチップの潜在空間表現を総計の少数ショットクラスプロトタイプと比較し、該比較に基づいて、関心対象の実データセットおよび関心対象の第2の実データセットの他のチップに、サポートセットおよび第2のサポートセットに類似した関心対象の実データセットおよび関心対象の第2の実データセットにおける特徴を識別するための総計の少数ショットクラスプロトタイプラベルを割り当てることを含む、請求項1に記載の方法。
【請求項18】
少数ショットニューラルネットワークを用いて早期融合データセットを形成する前に、関心対象の実データセットおよび関心対象の第2の実データセットを組み合わせることを更に含む、請求項17に記載の方法。
【請求項19】
少数ショットニューラルネットワークは、それぞれのサポートセットに基づいてそれぞれの実データセットをラベル付けするようにそれぞれ構成された別個のサブネットワークを含み、該方法は、サブネットワークの出力を組み合わせて後期融合出力を形成することを更に含む、請求項17に記載の方法。
【請求項20】
データ取得パラメータを調節し、割り当てられた少数ショットクラスプロトタイプラベルを有するチップロケーションにおいて別の実データセットを取得することによって、所望の特徴タイプを自動的に適応的にサンプリングすることを更に含む、請求項1に記載の方法。
【請求項21】
データ取得パラメータを自動的に調節することは、撮像システム移動ステージ、撮像システム倍率、撮像システムサンプリング特性、撮像システム検出器または撮像システム検出器選択を調節することを含む、請求項20に記載の方法。
【請求項22】
顕微鏡システムであって:
メモリと、
該メモリに結合された1つまたはそれ以上の処理ユニットと、
命令を記憶する1つまたはそれ以上の非一時的コンピュータ可読記憶媒体とを含み、
該命令は、実行されると、顕微鏡システムに、少なくとも、動作サブシステムおよび制御サブシステム間の動作を実行させ、実行される動作は:
動作サブシステムを通じて、ユーザ入力に応答して顕微鏡器具データの取得を指示し、指示レベル、通信レベルおよびハードウェアレベルを用いて少数ショットニューラルネットワークで取得された顕微鏡器具データを解析することであって、指示レベルは、データ取得および少数ショット機械学習アプリケーションとのユーザレベルのインタフェースを含むことと;
制御サブシステムを通じて、少なくとも、関心対象の特徴を含む顕微鏡器具データのユーザが選択したフレーム上に、調節可能なグリッドを重ねることを含む開ループ制御モードを通じて、データを取得することであって、グリッドはグリッドラインにおいて画像を複数のエリア形状に分割し、ユーザが選択したエリア形状は、少数ショット機械学習アプリケーションのための少数ショットサポートセットを定義し、少数ショット機械学習アプリケーションは、グリッドをフレームに適用し、取得データ内の各エリア形状を、少数ショットサポートセットに関連付けられたクラスのうちの1つに分類することによって、データ取得アプリケーションによって送信された顕微鏡器具データのユーザが選択したフレームおよび他のフレームを解析するように構成されることと、
を含む、前記顕微鏡システム。
【請求項23】
実行される動作は、制御サブシステムを通じて、
開ループ制御モードを通じて得られた少数ショット分類の座標に基づいて、適応的検索グリッドを形成することを含む、閉ループ制御モードを通じてデータを取得することと;
適応的検索グリッドを用いて、事前に選択された特徴タイプを自動的にサンプリングするようにデータ取得パラメータを調節することと、
を含む、請求項22に記載の顕微鏡システム。
【請求項24】
データ取得パラメータを調節することは、ステージ、撮像倍率、サンプリング分解能、電流/線量、ビーム傾き、アライメントおよび/または検出器のパラメータを調節することを含む、請求項23に記載の顕微鏡システム。
【請求項25】
透過型電子顕微鏡、走査電子顕微鏡、走査透過型電子顕微鏡または光学顕微鏡を含む、請求項22に記載の顕微鏡システム。
【請求項26】
ステージパラメータのセットに基づいて、関心対象の選択された領域にわたって画像を取得することであって、取得された画像間のパーセンテージ重複を含むことと;
(i)ステージパラメータに関連付けられた画像位置と、(ii)隣接画像の相互相関のピークに関連付けられた、隣接画像のミスアライメントの補正とに基づいて、関心領域にわたって画像モンタージュを形成するように画像をスティッチングすることと、
を更に含む、請求項22に記載の顕微鏡システム。
【請求項27】
コンピュータ実装方法であって:
関心対象の実データセットの少なくとも一部分を、各チップが関心対象の実データセットの該部分の実データサブセットを含むチップのグリッドに分割し、実データセットの該部分から選択されたグランドトゥルースの例に対応する少数のユーザ選択のチップを受信することであって、選択されたチップは、少数ショットクラスプロトタイプのサポートセットを定義することと;
少数のユーザ選択のチップに類似した関心対象の実データセット内の特徴の識別情報を受信および/または表示することと、
を含み、該識別情報は:
サポートセットの潜在空間表現を、埋め込みニューラルネットワークを用いて符号化し、少数ショットクラスプロトタイプをサポートセットの潜在空間表現の平均ベクトルとして定義することと;
埋め込みニューラルネットワークを用いて、関心対象の実データセットの他のチップの潜在的表現を符号化し、少数ショットニューラルネットワークを用いて、他のチップの潜在空間表現を少数ショットクラスプロトタイプと比較し、該比較に基づいて、他のチップに、少数ショットクラスプロトタイプラベルを割り当てることと、
によって生成される、前記コンピュータ実装方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、参照によってその全体を本明細書に組み入れる、2020年10月8日に出願された米国特許仮出願第63/089、080号の出願日の利益を主張する。
【0002】
分野はデータ解析である。
【0003】
政府支援の承認
本発明は、米国エネルギー省から受けた契約DE-AC0576RL01830により政府支援を受けた。政府は本発明に一定の権利を有する。
【背景技術】
【0004】
顕微鏡器具のオペレータは、多くの場合、材料の事前知識を用い、画像セットまたは分光学的セットの特定の特徴を調査し、次に、その事前知識およびデータ内で見つかった特徴に基づいて開始材料を記述するモデルを構築しようとする。しかしながら、電子顕微鏡および他の器具は、膨大なスケールで情報を生成する可能性があり、例えば、画像が毎秒数千フレームで収集され、これにより、人間のオペレータにはデータ内の特徴を手動で抽出する実際的な方法がないことになる。
【0005】
人工知能(AI)は、科学探究を再形成し、エネルギー貯蔵、量子コンピューティングおよび生物医学等の分野における飛躍的進歩となる発見を有効にする見込みがある。化学および材料系の研究における基礎である電子顕微鏡法は、AI駆動型の自動化から大きく利益を受ける立場にある。コンピュータビジョンおよびAIにおける多くの手法を用いて、画像内の特徴をより自動的に解析することができる。人間の画像における特徴が顔、眼、口、それらの間の比率等を含む場合があり、人物の詳細または特徴的性質を提供することができるのと同様に、顕微鏡材料も、局所的スケールで、集合体等として、粒界、欠陥、原子モチーフ等の特徴が豊富であり、これを用いて材料を識別することができる。多くのコンピュータビジョン手法は、良好に機能することができるが、多くの場合、調整に労働集約的なステップを必要とし、大量のデータまたはノイズの多いデータに対しスケーリングする能力が限られる。
【0006】
このため、低レベルの器具制御および一般化可能な特徴の検出に対する現在の障壁は、真に自動化された顕微鏡法を非実際的なものにしている。結果として、電子顕微鏡法および改善されたAI駆動型ツールによる利益を受けることができる他の分野において、そのようなツールが必要とされている。
【発明の概要】
【課題を解決するための手段】
【0007】
開示されるデータ解析ツールは、電子顕微鏡または他の器具から収集されたデータの人工知能(AI)により支援された解析のための柔軟性のあるパイプラインを提供することができる。いくつかの例において、データ収集中に、ほぼリアルタイムの画像定量化結果を提供することができ、更なる例は、データ収集中を含めて、ユーザからのフィードバックを組み込んで、性能を調節することができる。ツールをサポートする開示される方法は、大きな計算コストなしで、非常に僅かなデータ点を用いて、全く異なるデータにわたって高忠実度の100万パラメータディープラーニングモデルを利用する、少数ショット機械学習技法を適用する。
【0008】
開示される例は、開示される少数ショット解析技法等の新たに出現したスパースデータ解析により誘導される閉ループ器具制御プラットフォームも含むことができる。限られた事前知識に基づいて機械学習によって通知される集中型コントローラは、オンザフライ実験意思決定を駆動することができる。開示されるプラットフォームは、システムの範囲の実際的な自動化された解析を有効にし、新たな高スループットの統計的研究のステージを設定することができる。
【0009】
いくつかの例において、解析ソフトウェアは、特定のアプリケーション駆動型の特徴認識および分類ルーチンをオンザフライで受け入れ、データ収集中の意思決定をサポートすることによって、器具自動化プラットフォームと並行して実行することができる。例えば、顕微鏡は、多岐にわたるサンプルを調査することが可能であるため、開示されるツールは、再トレーニングのために数百万のトレーニングデータ点および数時間のGPU計算時間を必要とすることなく、新たなサンプルに一般化することができる高忠実度機械学習モデルを含むことができる。少数のトレーニングデータが、大きな事前トレーニングされたディープラーニングモデルを新たなタスクのために一般化するために用いられる少数ショット学習の実施を利用することによって。ここで、ディープラーニングは、通常、複数のネットワーク層を含む人工ニューラルネットワークを指す。開示される少数ショットの手法は、従来のディープラーニング方法の時間およびデータ要件を伴うことなく、完全に新しいサンプルに一般化する能力を用いて、ほぼリアルタイムでのモデル推論を可能にする。これにより、データが収集されているときに、顕微鏡使用者および他の器具のユーザに、それらのサンプルに関する情報を提供することができ、これにより、後にサンプルのいずれの領域から顕微鏡または他の器具を用いてデータを撮像または取得するかに関する決定について案内することができる。
【0010】
開示される技法は、リアルタイム顕微鏡法実験に特に適用可能とすることができるが、これらは、多数の他の器具および用途においても有用とすることができる。いくつかの例は、低温電子顕微鏡(Cryo-EM)を含む生体器具および用途に適用することができる。開示される技法は、自動化データ取得のためのSerialEMおよびLEGINONソフトウェアパッケージ、ならびにCryoSPARC、IMAGIC、RELION、ならびにセグメンテーションおよび再構成後処理のための他の商用およびオープンソースのソフトウェアツールのホストにおいて実施することができるか、またはこれらに結合することができる。生物学的実験は、任意の数の異なるタイプの特徴のスクリーニング、粒子カウント、およびプラットフォームにとらわれない一般的特徴分類のためにカスタマイズすることができる、開示されるデータ分類ツールから特に利益を受けることができる。多くの例は、光学顕微鏡、電子顕微鏡(例えば、TEM、SEM、STEM)、集束イオンビーム器具および分光法器具等の材料科学分野において適用することができる。位相および微細構造の自動化マッピング、粒子カウント、k空間ナビゲーション、モンタージュ生成、動的プロセスの物理的/化学的追跡等が早急に必要とされている。開示される例は、物質の新たな特性を発見および利用する大学および国立研究所における研究グループに適用可能であるのみでなく、品質制御メトリックとしてTEMデータに大きく依存するシリコンデバイス産業におけるもの等の産業プロセスにも適用可能である。
【0011】
開示される技術の上記および他の目的、構成および利点は、添付の図面を参照しながら行われる以下の詳細な説明からより明らかとなろう。
【図面の簡単な説明】
【0012】
図1A】リンク付けされた少数ショット機械学習アプリケーションから受信される、実験後または実験中の少数ショット機械学習分類も表示する、データ取得アプリケーションの例示的なユーザインタフェースのスクリーンショットである。
図1B図1Aにおけるユーザインタフェースのスクリーンショットの自動スクリプト部分の拡大図である。
図2】グラフィカルユーザインタフェースおよび関連セグメンテーション統計を通じた例示的なクラスプロトタイプ選択を示す一連のスクリーンショットである。
図3A】画像セグメンテーションの例示的な少数ショット方法の一連の画像および概略図を示す。図3Aに示す未加工STO/Ge画像は、図3Bに示すいくつかのより小さなチップに分割される。図3Cは、図3Bからの少数のユーザ選択のチップを用いてサポートセットにおける所望のセグメンテーションクラスを表す方式を示す。図3Dに示すように、このとき、図3Bからの各チップは、クエリとして作用することができ、サポートセットによって定義されるように図3Cからのプロトタイプに対し比較され、クエリと各プロトタイプとの間の最小ユークリッド距離に従ってカテゴリ化される。図3B図3Dを通じてセグメンテーションされた図3Aからの画像が図3Eに示される。
図3B】画像セグメンテーションの例示的な少数ショット方法の一連の画像および概略図を示す。図3Aに示す未加工STO/Ge画像は、図3Bに示すいくつかのより小さなチップに分割される。図3Cは、図3Bからの少数のユーザ選択のチップを用いてサポートセットにおける所望のセグメンテーションクラスを表す方式を示す。図3Dに示すように、このとき、図3Bからの各チップは、クエリとして作用することができ、サポートセットによって定義されるように図3Cからのプロトタイプに対し比較され、クエリと各プロトタイプとの間の最小ユークリッド距離に従ってカテゴリ化される。図3B図3Dを通じてセグメンテーションされた図3Aからの画像が図3Eに示される。
図3C】画像セグメンテーションの例示的な少数ショット方法の一連の画像および概略図を示す。図3Aに示す未加工STO/Ge画像は、図3Bに示すいくつかのより小さなチップに分割される。図3Cは、図3Bからの少数のユーザ選択のチップを用いてサポートセットにおける所望のセグメンテーションクラスを表す方式を示す。図3Dに示すように、このとき、図3Bからの各チップは、クエリとして作用することができ、サポートセットによって定義されるように図3Cからのプロトタイプに対し比較され、クエリと各プロトタイプとの間の最小ユークリッド距離に従ってカテゴリ化される。図3B図3Dを通じてセグメンテーションされた図3Aからの画像が図3Eに示される。
図3D】画像セグメンテーションの例示的な少数ショット方法の一連の画像および概略図を示す。図3Aに示す未加工STO/Ge画像は、図3Bに示すいくつかのより小さなチップに分割される。図3Cは、図3Bからの少数のユーザ選択のチップを用いてサポートセットにおける所望のセグメンテーションクラスを表す方式を示す。図3Dに示すように、このとき、図3Bからの各チップは、クエリとして作用することができ、サポートセットによって定義されるように図3Cからのプロトタイプに対し比較され、クエリと各プロトタイプとの間の最小ユークリッド距離に従ってカテゴリ化される。図3B図3Dを通じてセグメンテーションされた図3Aからの画像が図3Eに示される。
図3E】画像セグメンテーションの例示的な少数ショット方法の一連の画像および概略図を示す。図3Aに示す未加工STO/Ge画像は、図3Bに示すいくつかのより小さなチップに分割される。図3Cは、図3Bからの少数のユーザ選択のチップを用いてサポートセットにおける所望のセグメンテーションクラスを表す方式を示す。図3Dに示すように、このとき、図3Bからの各チップは、クエリとして作用することができ、サポートセットによって定義されるように図3Cからのプロトタイプに対し比較され、クエリと各プロトタイプとの間の最小ユークリッド距離に従ってカテゴリ化される。図3B図3Dを通じてセグメンテーションされた図3Aからの画像が図3Eに示される。
図4A】それぞれ、元の画像およびセグメンテーションされた画像の対を示し、3つの酸化物系のセグメンテーション性能を例証する。
図4B】それぞれ、元の画像およびセグメンテーションされた画像の対を示し、3つの酸化物系のセグメンテーション性能を例証する。
図4C】それぞれ、元の画像およびセグメンテーションされた画像の対を示し、3つの酸化物系のセグメンテーション性能を例証する。
図5】様々なセグメンテーション手法に従ってセグメンテーションされた画像結果である。
図6】少数ショットの機械学習画像セグメンテーションの例示的な方法のフローチャートである。
図7】電子顕微鏡のための例示的なマルチレベル動作システムの概略図である。
図8】開ループおよび閉ループ制御モードを有する自動システムのフローチャート概略図である。
図9】例示的なモンタージュ方法のフローチャート概略図である。
図10】本明細書に記載の技術と併せて用いることができる例示的なクラウドコンピューティング環境の概略図である。
図11】いくつかの記載の例を実施することができる例示的なコンピューティングシステムの概略図である。
【発明を実施するための形態】
【0013】
序論および概観
開示される例は、自動電子顕微鏡データ収集、トリアージおよび分類プラットフォームを含む。機械学習ベースの自動化は、電子顕微鏡および他の器具において、無人のバッチデータ収集、トリアージおよび分類を提供することができる。電子顕微鏡法は、例として、触媒作用、エネルギー貯蔵、および量子情報科学における展開および発見を知らせる材料特徴付けにおいて有用である。しかしながら、これまで、顕微鏡におけるデータ収集は、非常に人力的、非効率的、かつ主観的なものであり、より信頼性の高い、高スループットの自動化および解析のための新たなツールの必要性の動機付けとなっている。開示される例は、顕微鏡制御、自動化データ収集および少数ショット機械学習(ML)解析を用いる。論文「Rapid and Flexible Semantic Segmentation of Electron Microscopy Data Using Few-Shot Machine Learning」Akers他(doi:10.21203/rs.3.rs-346102/v1)、「Design of a Graphical User Interface for Few-Shot Machine Learning Classification of Electron Microscopy Data」Doty他(arXiv:2107.10387)、および「An Automated Scanning Transmission Electron Microscope Guided by Sparse Data Analytics」Olszta他(arXiv:2109.14772v1)を、参照によって本明細書に組み入れる。
【0014】
グラフィックコンピュータアプリケーションおよびバックエンドコードを用いて、電子顕微鏡データ収集、メタデータ構築および解析のプロセスを自動化することができる。いくつかの例において、ソフトウェアプログラムは、最小の人間の介入で顕微鏡を直接制御するように構成されたPythonベースの(または別のコンピュータソフトウェア言語)プラグインを実施する。自動化アプリケーションの例は、MLベースのデータトリアージおよび分類のために別個のアプリケーションとインタフェースするかまたはこれにリンク付けすることができる。自動化アプリケーションの例は、電子顕微鏡法研究のスループットおよび効率性を増大させ、バッテリおよび触媒等の、エネルギー材料における材料化学および欠陥の、より厳密で統計的に正当な分析を可能にすることができる。材料の微細構造分析は、例えば、核燃料サイクルの分析を改善することができる。
【0015】
コンピュータおよびバッテリ等の多くの最新技術は、透過型電子顕微鏡法(TEM)を用いて独自に検査することができる、ナノスケールでの化学および欠陥の複雑な工学に依拠する。しかしながら、顕微鏡動作の旧式のモデルは、通常、データ収集、データトリアージおよびデータ分類を制限する。例えば、データ収集中、移動ステージ、カメラおよび検出器は、データを取得するために手動で操作される。そのような手動の取得は、利用可能な人間の集中および人間の時間の制約によって物理的に制限され、顕微鏡を長期にわたって作動させることを不可能にし、生産性およびサンプルスループットを減少させる。データトリアージでは、関心領域の選択は、通常、既に見つかることが予期されるものに集中する傾向にあるオペレータの事前知識に基づき、新規の特徴を見過ごし、既存のバイアスを増大させる。データ分類の場合、データストリームの統合は、多くの場合、人間の認知によって制限され、これにより、非常に異なるタイプのデータ間(例えば画像およびスペクトル、または撮像モダリティ間)のより高次元の相関を容易に評価することができない。特徴間の微細な予期しない相関が多くの場合見過ごされ、これにより、材料特性および実験の結論に影響を及ぼす可能性がある。
【0016】
データ管理および顕微鏡通信のための適切なフレームワークは、既存および将来の解析モジュール、顕微鏡特徴、ならびに分光計および検出器等の一連の器具に柔軟に基づき、またそれに対応するように拡張可能とすることができる。選択された例において、PyJEMプラグインは、RPLにおいてライブコマンドをJEOL GrandARM TEMに送信するように構成された。自動化アプリケーションの例は、Windows OS等の様々なオペレーティングシステムを通じてグラフィカルユーザインタフェース(GUI)を用いて構成することができ、ユーザインタフェースおよび構成のための、NETフレームワーク、ならびに実験設計およびハードウェア制御のためのPythonスクリプトエンジンを含むことができる。図1A図1Bは、例示的なデータ取得アプリケーションのためのユーザインタフェース101のスクリーンショット100を示す。アプリケーションは、TEMデータ取得パラメータを制御するように構成された編集可能なスクリプト102(図1Bにも、より詳細に示される)を含む。アプリケーションは、ライブ顕微鏡ステータス読み値104および現在の取得画像106も含む。ユーザインタフェース101は、データ取得プロセス中にほぼリアルタイムで、強調された特徴110aおよび統計110bを示す、別個の少数ショット機械学習アプリケーションからのオンザフライで処理されたデータセクション108も含む。様々な例において、自動化は、任意の時点において休止、中断および/または調節することができる。
【0017】
データ取得および自動化のために構成されたアプリケーションと並行して、少数ショット機械学習アプリケーションは、ML画像解析を提供し、データを例示的なユーザインタフェース101に供給するように構成される。いくつかの例において、少数ショットアプリケーションは、粒子または他の特徴検出のために構成することができ、クラスプロトタイプのためのサポートセットを生成するのに用いられるチップ選択プロセスを通じてユーザによってカスタマイズ可能である。図2は、サポートセット選択のステップ単位の進行、分類されたアプリケーション出力、および分類の統計的表示を示す、例示的な一連のスクリーンショット200a、200b、200cを示す。コードは、ユーザによりラベル付けされた一握りの画像のみを用いて特徴を迅速に特定するように構成することができる。例えば、スクリーンショット200aにおいて、一般化されたネットワークは、ユーザが異なるクラス(クラスA、BおよびC)に対応する画像の少数の矩形を選択することによってカスタマイズされている。スクリーンショット200bにおいて、少数ショットネットワークをトレーニングしてクラスプロトタイプを形成した後、ニューラルネットワークは、ユーザが定義した少数ショットプロトタイプに基づいて画像内の他の矩形を分類し、その画像全体および後続の画像にわたってクラス選択を伝播する。スクリーンショット200cにおいて、豊富で繰り返し可能な統計が、データ収集後、またはデータ収集中にオンザフライで、多くの画像にわたって集められる。いくつかの例において、2つの粒子検出使用事例または特定の粒子特徴(位置、空間分布、サイズ分布等)の検出についてサポートセットを定義することができる。更なる試験の例において2つの商業規格サンプル:炭素支持膜上のナノ粒子、および炭素支持膜上のMoO3ナノ粒子が試験された。特定の実験において、10~50個のSTEM環形暗視野画像が様々な倍率で収集され、機械学習コードおよびアプリケーションユーザインタフェースの効率性のための試験データを提供した。
【0018】
選択された例は、原子スケールの電子顕微鏡画像における主要な微細構造特徴の意味的セグメンテーションのために用いることができ、これにより、多くの重要な材料および化学系における構造-特性関係の理解を改善することができる。しかしながら、開示される少数ショット手法は、本質的にバイアスがかかり、誤りを生じやすく、最新の器具類によって生成される大量のデータを受け入れることが不可能な、時間集約的手動解析を伴う現行の枠組みを上回って改善することができる。より自動化された手法が提案されたが、多くはデータの高い多様性に対しロバストでなく、多様な微細構造特徴および材料系に対し十分一般化されていない。本明細書に開示される選択された試験例は、以下の3つの酸化物材料系:(1)SrTiO3/Geのエピタキシャルヘテロ構造、(2)La0.8Sr0.2FeO3の薄膜、および(3)MoO3ナノ粒子、の走査透過型電子顕微鏡法画像の意味的セグメンテーションのための柔軟性のある半教師あり少数ショット機械学習手法を用いてこのロバスト性を実証する。開示された少数ショット学習技法は、ノイズに対しよりロバストであり、より再構成可能であり、他の画像解析方法よりも必要なデータが少ない。開示される例は、新たに出現した高スループットの自動顕微鏡プラットフォームに必要な、高速な画像分類および微細構造特徴マッピングを可能にすることができる。
【0019】
少数ショット機械学習の論考
I.序論
材料の微細構造は、触媒、エネルギー貯蔵デバイス、および新たに出現した量子コンピューティングアーキテクチャを含む多くの重要な技術の機能に影響を与える。走査透過型電子顕微鏡法(STEM)は、構造、化学および欠陥を、広範にわたる材料クラスについて原子スケールの分解能で同時に分解する能力に起因して、微細構造を研究するための基本的なツールとしての役割を長い間果たしてきた。STEMは、複雑な転位ネットワークから、二次位相および点欠陥に及ぶ微細構造特徴の性質を明らかにし、精緻化された構造特性モデルをもたらすのに役立ってきた。従来、STEM画像は、既知の特徴および未知の特徴を識別するためのシステムの事前知識を利用して、分野の専門家によって手動でまたは半自動的に解析されてきた。この手法は、小さなデータ量の限られた数の特徴を測定するのに適しているが、高密度の、稀な、またはノイズの多い特徴を有するサンプルには実用的でない。更に、手動の手法は、複数のデータモダリティを含めるようにスケーリングすることが困難であり、高速で実行することができず、最新の器具の最大の可能性を利用して、in situの相補的なまたは相関的な研究を行う能力の妨げとなる。より基本的なレベルにおいて、そのような測定が行われる方式の変動性、および標準化された手法の欠如は、実験における再現可能性のより広い問題に寄与する。そのような制限は、全ての材料クラスに当てはまる傾向にあるが、これらは、望ましくない欠陥が極微量であってもその特性が大きく影響を受ける複合酸化物の場合に特に顕著である。開示される例は、微細構造特徴を、既存の方法を用いて可能であるよりも高い正確度、速度および統計的厳密さで特徴付ける手法が緊急に必要とされていることに対処する。
【0020】
顕微鏡法画像データ(例えば、マイクログラフ)を定量的に記述することにおける中心的課題は、多岐にわたる可能な微細構造特徴およびデータモダリティである。例えば、1つのセッションにおいて原子分解能でインタフェースを調べるのに用いられる同じ器具を、次に、より低い倍率で粒子形態学または粒界分布を調べるのに用いることができる。各研究において、目標は、多くの場合、定量的かつ意味論的に有意な微細構造記述子を抽出して、測定値を基礎をなす物理モデルにリンク付けすることである。例えば、画像セグメンテーションを通じて、特定の位相または大量の特徴の面積率を推定することは、合成生成物および相転移動力学の理解の重要な部分である。いくつかの画像セグメンテーション方法が存在する(例えば、Otsu、ウォータシェッドアルゴリズム、k平均クラスタリング)が、いずれも、異なる材料系、画像タイプに容易に一般化可能でなく、大きな調整された画像前処理を必要とする場合がある。
【0021】
機械学習(ML)方法、特に、畳み込みニューラルネットワーク(CNN)が、長さスケールにわたる微細構造データの認識および特徴化のために近年採用されている。材料または微細構造クラス(例えば、「樹状」、「等軸」等)を表す画像全体にラベルを割り当てるか、または画像内の各ピクセルにラベルを割り当てて、それらが別個のカテゴリに分類されるようにする分類タスクが実行されてきた。後者の分類タイプは、意味的セグメンテーションと呼ばれる、局所的特徴(例えば、ライン欠陥、位相、結晶構造)を識別するための画像のセグメンテーションである。しかしながら、CNNをトレーニングするために大きなデータセットサイズが必要であること、および多岐にわたるデータに対し一般化可能な方法を開発することが困難であること等、意味的セグメンテーション方法の実際の適用において多くの課題が残っている。通常、ディープラーニング方法によるデータ解析は、大量のラベル付けされたトレーニングデータ(ImageNetデータベースを通じて入手可能な大きな画像データセット等)を必要とする。顕微鏡法において多くの場合に遭遇するが、データが収集される他の技術分野にも適用可能であるような、限られたトレーニングデータに基づいてデータセットを解析する能力は、材料およびデータ科学における重要な未開拓分野である。近年の進歩により、1ショットまたは少数ショット学習問題における人間レベルの性能を可能にする発展がもたらされたが、材料科学および他の関連データ収集領域におけるそのような方法に対する研究は限られている。多くの特徴付けツールは僅かな数のみのデータ点を提供する場合があるが、単一の電子顕微鏡写真(および潜在的には追加の撮像/スペクトルチャネル)は、関心対象の多くの微細構造特徴を包含する場合がある。開示される少数ショットの例は、過渡的なまたは不安定な材料の研究、および長いリードタイムの実験(腐食または中性子照射研究等)に起因して限られたサンプルしか解析に利用可能でない研究への大きな用途も有する。他の事例において、進化したデータ解析方法を適用することができる、非常に限られているかまたは理解が不良である場合がある以前の研究からのデータが存在する。
【0022】
開示される例は、STEM画像、他の器具および他のデータモダリティからの画像の、少数ショット機械学習を用いた認識およびセグメンテーションに対する高速で柔軟性のある手法を提供する。選択される実証例において、3つの酸化物材料系が、それらが保有する微細構造特徴の範囲、ならびに半導体、スピントロニクスおよび触媒用途におけるそれらの重要性に起因して、モデル展開(SrTiO3(STO)/Ge、La0.8Sr0.2FeO3(LSFO)薄膜およびMoO3ナノ粒子におけるエピタキシャルヘテロ構造)のために選択された。特定の微細構造特徴(例えば、結晶モチーフまたは特定の粒子形態)の例を表す5~8個のみの部分画像(チップと呼ばれる)を用いて、開示されるモデルは、分野の専門家によって生成されるものに匹敵するセグメンテーション結果をもたらした。画像マッピングの成功は、他のセグメンテーション方法(例えば、Otsu閾値処理、ウォータシェッド、k平均クラスタリング等)と比較した、少数ショット機械学習の低いノイズ感度および高い学習能力に起因することができる。少数ショット手法は、STEMデータストリームにわたる様々な微細構造特徴を迅速に識別し、これによりリアルタイム画像データ収集および解析を知らせることができ、材料発見および設計のために改善された微細構造特徴付けを有効にする、画像駆動による機械学習の能力を明確に示すことができる。
【0023】
II.結果および論考
図3A図3Eは、STEM画像の意味的セグメンテーションを提供するように構成された例示的な少数ショットのディープラーニング手法を示し、相関付けられた一連の画像および概略図300A~300Eを通じて示される。代表的な例において、少数ショット学習モデルは、特定のモデルが各クラスに対応する画像の領域を識別するために、クラスごとに非常に少数のラベル付けされた例(例えば、≦2、≦3、≦5、≦10等)を用いることができる。図3Aにおいて見てとることができるように、1つまたはそれ以上の検出モダリティからのデータが、例えば顕微鏡画像300Aの形態で提供される。図3Bにおける分割された画像300Bに示すように、画像300Aは、部分画像304のグリッド302に分割された入力画像を形成し、部分画像304は、本明細書においてチップと呼ぶことができる。図3Cは、分割された画像300Bから選択された部分画像304を用いてクラスプロトタイプ306a~306cを生成するモデル初期化概略図300Cを示す。図3Dは、分割された画像300Bの部分画像304または他の画像および部分画像の分類を生成するように構成されたモデル推論概略図300Dを示し、図3Eは、モデル推論からのセグメンテーションされたマイクログラフ出力300Eを示す。例えば、異なる材料タイプ、Pt/C、STO、およびGeのエリアを示す図3Aにおける表記に示すように、多くの例において、分割またはチッピングのプロセスは、材料微細構造の領域固有の知識によって強化することができる。
【0024】
A.前処理
位相がSTEM画像において様々なコントラストを有する状態で、材料の別個の位相を分離および測定するために、いくつかの例において元の画像データの前処理を行うことができる。図3A図3Eに示す実験的例において、コントラスト制限適応HE(CLAHE)と呼ばれる、大域アーチファクトを導入することなく局所画像品質を高めるように設計されたヒストグラム等化(HE)技法が使用のために選択された。CLAHE実施の詳細が表1に記載されている。
【0025】
【表1】
【0026】
図3Bに示すように、まず、CLAHEが元の画像に対し実行され、次に、処理された画像が、より小さな部分画像304のセットに分割された。チップサイズは、95×95ピクセル~32×32ピクセルで変動したが、全てのチップは、後のモデル推論埋め込みモジュール(ここでは、容易に入手可能なResNet101 CNN)において256×256にリサイズされた。図3A図3Bに見てとることができるように、変動可能なサイズにより、各チップが、微細構造モチーフを捕捉するのに十分大きく、隣り合った空間領域間の粒度を提供するのに十分小さくなることが可能になった。様々な例において、多岐にわたる部分画像形状および/または分割特性、例えば、正方形、矩形、六角形、円形等の形状、ならびに連続、離間、重複等の特性を用いることができることが理解される。実験において、用いられる最終前処理ステップは、ラプラシアン-ガウス(LoG)ブロブ検出ルーチンを用いて原子カラムの位置およびサイズをマーキングする強化技法であった。このステップは、クラス間の極度に僅かな差を強化するために、LSFO材料系に対し用いられた。
【0027】
B.モデルアーキテクチャ
図3A図3Eに示す少数ショットモデルは、畳み込みニューラルネットワーク(例えば、ResNet101)を含む埋め込みモジュール308と、少数ショットニューラルネットワーク(例えば、ProtoNet)を含む少数ショット類似性モジュール310とを含む。少数ショットモデルは、いくつかの例において100×100ピクセル以下の一連のより小さなチップxikに(分割された画像300Bに示すように)分解された約3000×3000ピクセルの高分解能を通常有する、前処理されたSTEM画像300Aを入力する。少数のこれらのチップは、例として用いられるか、または概略図300Cに示すような1つまたはいくつかのクラスの各々を定義するためのサポートセットとして用いられる。少数ショット学習を用いる他の画像アプリケーションは、通常、完全に異なるxikを用いて各クラス(S)のサポートセットを定義するが、開示される例において、Sは、元の画像300Aをより小さな部分画像304のグリッド302に分解することによって作成することができる。部分画像304のサブセットは、クラスごとに、例えば、サポートセットSについてチップ312a~312c、サポートセットSについてチップ314a~14c、サポートセットSについてチップ316a~316cがラベル付けされた。k=1,..,K個のクラスについてのN個のラベル付けされた例のセットが、S={(x,y),...(x,y)}によって定義されたサポートセットを構成する。ここで、xは画像iを表し、yは対応する真のクラスラベルである。
【0028】
プロトタイプネットワークは、類似性モジュール310のために用いることができ、その軽量の設計および単純性を踏まえると有利である。開示される少数ショットモデルは、各Sを単一のプロトタイプcによって表すことができるという前提に基づく。cを計算するために、各xikが、D次元画像を、学習可能なパラメータφを通じてM次元表現にマッピングする埋め込み関数fφを通じて最初に処理される。次元Mの数は、符号化ニューラルネットワークのタイプまたは深度に依拠することができる。変換されたチップまたはfφ(xik)=zikである場合、クラスkのためのプロトタイプ(例えば、プロトタイプ306a~306c)を、以下のような埋め込まれたサポート点cの平均ベクトルとして作成する:
【数1】
【0029】
300Cを通じてクラスプロトタイプが作成された後、類似性モジュール310(例えば、トレーニングされていないプロトタイプネットワーク)は、最初に、クエリを、埋め込み関数を通じて、例えば埋め込みモジュール308を通じて変換し、次に、埋め込まれたクエリベクトルと、クラスプロトタイプベクトルの各々との間の距離、例えばユークリッド距離を計算することによって、新たなデータ点またはクエリqを分類する。距離が計算された後、softmaxは、距離をクラス確率に正規化する。ここで、概略図300Dにおけるカテゴリ化ステップ318に示すように、最も高い確率を有するクラスが、クエリのラベルとなる。qごとのモデルの最終出力はセグメンテーションされた画像300Eを形成することができるそれぞれのクラスラベルである。セグメンテーションされた画像300Eは、例えば、それぞれのプロトタイプ306a~306cに最も近いチップに対応する色分けされたチップ320a~320cを用いてクラスラベルに従って色分けすることができるか、またはユーザによる視覚的区別のために、分類されたチップ間に別の差を設けることができる。
【0030】
C.モデル推論
STEM画像(空間次元においてnm~μmの範囲をとることができる)において相分数を定量化するために、各チップをクエリ点qとして用いることができ、それによって、クエリ点の集合Q全体が完全な画像を構成することができる。表IIに示すように、Qのサイズは、通常、各チップのサイズおよび完全な画像のサイズに正比例する。
【0031】
【表2】
【0032】
図3A図3Eに示す例において、最初に、全てのqが埋め込みモジュール308の埋め込み関数を通じて処理され、各プロトタイプ306a~306cに対する距離が選択された距離関数を用いて計算された。次に、類似性モジュール310の少数ショットネットワークが、距離にわたってsoftmaxを計算し、最も高い正規化値に従ってクラスラベルを割り当てることによって、K個のクラスの各々にわたる分布を生成した。
【0033】
モデル固有の実施および特定の例において用いられるパラメータが上記の表IIに提供される。他の機械学習手法におけるモデルパラメータの選択は、多くの場合に冗漫であるが、開示される少数ショットの例における特定のモデルパラメータは、通常、簡潔にすることができる。例えば、事前トレーニングされたモデルを、埋め込みモジュール308のためのアーキテクチャとして利用することができる。図3A図3Eに示す例において、101個の層を有する残余ネットワークResNet101が埋め込みアーキテクチャとして用いられた。ResNetは、特に、いくつかの関連画像認識タスクにおけるその成功を踏まえて選択された。ResNet101のためのモデル重みは、画像データベースImageNetに対しトレーニングされる、PyTorch pytorch/vision v0.6.0から入手可能である。また、ユークリッド距離メトリックが少数ショットネットワークにおいて用いられた。なぜなら、このメトリックは、通常、多岐にわたるベンチマークデータセットおよび分類タスクにわたって通常良好に機能するためである。事前トレーニングされたモデルは、指定されたパラメータおよびトレーニングされたモデル重みを備えている。しかしながら、多くの例において、任意の埋め込みアーキテクチャ、特に、セグメンテーションタスクによく適したものを用いることができることに留意されたい。いくつかの例において、マイクログラフセグメンテーションに対し既知の性能適用可能性を有しない既製のニューラルネットワークを用いることができる。更なる例において、顕微鏡法データまたは他の器具データについて不良なセグメンテーション性能を有することが知られているネットワークであっても用いることができる。
【0034】
類似性モジュール310は、任意の少数ショットまたはメタ学習アーキテクチャとすることもできるが;Protonetは通常、比較的単純であり、実施が容易である。モデルに必ずしも固有でないパラメータ、すなわちチップサイズおよびバッチサイズは、計算メモリ容量に加えて、各別個のマイクログラフのサイズを考慮に入れることができる。チップは、通常、単一のマイクログラフを包含するべきであり、完全な画像のサイズおよび倍率に応じて試行錯誤することができる。バッチサイズは、一度に評価するチップの数とすることができる。通常、少なくとも16GBのRAMおよび2.7GHzの処理能力を有するコンピューティングマシンは、64×64ピクセルを測定する100個のチップのバッチサイズで、0.5秒ごとに約1チップのレートでモデル予測を妥当に計算することができる。計算時間は、チップサイズおよび埋め込みモジュール308におけるパラメータ数に加えて、処理能力に依拠することができる。いくつかの例では、セグメンテーションおよび関連する処理は、局所的に、またはクラウドベースのリソースを通じて別個のコンピューティングユニットにおいて実行することができる。少数ショットモデルをトレーニングする場合、ここで示すような単純な推論ではなく、少なくとも1つのGPUが必要であり、サイズ調整可能なデータベースを仮定して収束に達するのに数日かかる場合がある。例えば、ImageNet54のような通常の画像データベースは1400万の画像を含む。このため、本明細書において論じられる代表的な例において、トレーニングされていない少数ショットモデルが用いられ、純粋な推論を用いて画像に関する判定を行う。
【0035】
D.分類
3つの酸化物系についてプロトタイプアーキテクチャを用いた少数ショット分類のセグメンテーション出力が図4A図4Cに示される。入力画像400A~400Cおよびそれぞれのモデル出力402A~402Cは、スーパーピクセル分類であり、すなわち、他のコンピュータビジョンアプリケーションがセグメンテーションにアプローチするのとほとんど同じ方式で、チップに属する全てのピクセルが同じラベルおよび対応する色を受ける。ここで、サポートセットクラス404A~404Cは、可能な出力ラベルのセットを定義する。それぞれの出力セグメンテーション402A~402Cの右側に示される、各クラスに属するチップのパーセンテージは、各別個のマイクログラフについての総面積推定値についてピクセルスケールの変換を用いて、面積に対するパーセンテージからスケーリングすることができる。
【0036】
STO/Ge系は、コントラストが画像全体にわたって不規則に変動するという点で、ほとんどの画像解析技法にとって特定の課題を提示する。サンプルは複数のインタフェースも含み、一般的な薄膜基板撮像データを表す。選択されたLSFO画像は、ペロブスカイト構造マトリックスにおける二次位相を示し、二次位相は、上部から下部への勾配を有するように見え、これは、2つのマイクログラフ間の非常に僅かな差を劇的に減少させる。2つの相互貫入微細構造領域の分離は、合成プロセス、および電導性等の結果として得られる特性を理解する必要がある。前処理は、これらの不規則性のいくつかについて調節することができるが、Otsu手法、およびウォータシェッド等の従来の閾値ベースのセグメンテーション技法は、一貫した解決に十分ロバストでない。更に、適応的方法であっても、勾配に対し失敗する可能性があり、複数の画像にわたって全体的に適用されるとき確実に失敗する。モデル出力においていくつかの不規則性が存在し、例えば、ここで、402Aにおける二次マイクログラフ領域が、一握りの誤分類チップ、およびいくつかの微細構造特徴(すなわちS)を識別する際のLSFOシステム402Bにおけるいくらかの非一貫性を含むが、いくつかの例は、そのようなタイプの課題を、事後空間平滑化を用いて補正することができる。例えば、或る半径以内の1つのラベルによって完全に取り囲まれたチップでクラス確率に重み付けすることができるか、またはサポートセットを定義するチップの選択に対し調節を行うことができる。例えば、チップサイズ、形状および/またはチップに対する変動は、データに対しオフセットすることができ、メッシュは、不規則性を低減するように調整することができる。また、開示される少数ショット技法は、いくつかの異なる材料系に容易に一般化することができる。なぜなら、1つの画像によって定義された単一のサポートセットは、画像系列の解析における一致していない時間節減のために、同じタイプの複数の画像(例えば、他の隣接画像、画像の時系列、倍率またはアパーチャ数等のいくつかの共通パラメータを有するデータ収集の異なるセッション、他の検出モダリティに対する多峰性 関係等)に対する調節なしで適用することができるためである。この容易に一般化可能であることは、Moナノ粒子について示すように、より大きなエリアマッピングの場合に特に有利とすることができる。ここでは、多岐にわたる可能な粒子形態学を調査するための画像モンタージュを収集することが必要である可能性がある。ここでもまた、開示される少数ショット方法は、不正確なラベル付けの最小の例を用いて、いくつかのナノ粒子の向きを炭素支持背景と区別することに成功する。特に、少数ショット手法は、この「フラット」カテゴリを定義する広範にわたる形状、コントラストおよびサイズを有する、402CにおけるSの視覚複雑度を受け入れる。402CにおけるSは、他のものよりもいくつか多いチップを用いて定義されるが、モデルは、コントラストベースの方法単独では不可能なセグメンテーションタスクを妥当に実行することができる。このため、異なる材料系に対し十分一般化するモデルの能力が、図4A図4Cに実証されている。これらは、様々な微細構造特徴が、STO、LSFOおよびMoOについてマッピングに成功したことを示す。
【0037】
E.他の方法との比較
最初に、特定のマイクログラフ、すなわちセグメンテーションにおける関心対象の微細構造特徴を定量化する目的で、いくつかの画像解析技法が探索された。単一のセグメンテーション方法のいずれも、コントラスト調節、平滑化および先鋭化等の前処理ステップがなければ良好に機能しない。これらの解析における前処理の目的は、人工コントラストテクスチャを大域的に最小限にし、オブジェクトのエッジを局所的に強調することであり得る。これは、ほとんどのセグメンテーションルーチンにとって重要なノイズ低減ステップである。前処理およびセグメンテーションは多くの場合に分離不可能であることを踏まえて、セグメンテーションおよび前処理の双方を併せた文脈において、比較可能なセグメンテーション方法が調査された。少数ショット手法を、より広く用いられるセグメンテーション方法と比較する目的で、STO/Ge系からの例示的な画像が、様々なノイズ感度およびセグメンテーション能力を有する技法を用いて解析された。その結果が図5に提示されている。
【0038】
セグメンテーションに対する最も単純な手法は、図5の第1の行に示す閾値処理技法のファミリーに入る。最上行に示すガウス当てはめ+Otsu、適応平均、および適応ガウスの3つの方法は、画像内のピクセルを、強度閾値に基づいて、2つ以上のクラスに分離するように設計される。これらの方法における閾値は、大域的に(最上行左)、およびピクセルの近傍を用いて局所的に(最上行中央および右)、ピクセル強度の分布に関する情報を用いて決定される。近傍方法は、一般的に、ノイズに対しより感度が高いのに対し、Otsuのより大域的な技法は、前景ピクセル(明)を背景(暗)から比較的良好に分離するように見える。
【0039】
単純な閾値処理を超えて動かし、背景および前景以外のクラスにピクセルを分離することを調べることができる。図5に示すセグメンテーション方法は、通常、強度を、再び画像内のピクセル強度の分布によって定義された複数のクラスに分離する能力を有する。理想的には、画像を2つの別個のマイクログラフに従ってセグメンテーションすることができるという前提を実証するために、2つのクラスがこれらのルーチンについて指定される。これらの手法は、通常、より大きなグループまたは形状の一部でないピクセルを除去するために、ぼかしフィルタおよび/またはモルフォロジカル演算も伴う。形状エッジは、図5の中央行に示すマルチOtsu、ウォータシェッド、およびYen手法において、最上行におけるより明確であるが、結果として得られるセグメンテーションは、依然として、背景/前景であるように見え、マイクログラフ構造間の区別に失敗する。これらの方法の直接実施の1つの制限は、結果として得られるクラスが、基礎をなすマイクログラフのサイズまたは形状ではなく、常に強度に基づくことである。これらの方法を、形状検出ルーチンを用いて層化することが可能である場合があり、ここでは、概ね同じサイズの形状を同じクラスにクラスタ化することができる。しかしながら、前景/背景セグメンテーション後に形状をクラスタ化することは、教師なし方式で、すなわち、厄介な手動の介入なしで微細構造特徴を明瞭に分離することが可能でないことがわかった。
【0040】
形状クラスタリングルーチンを既にセグメンテーションされた画像に加えるのではなく、クラスタベースの方法が、図3の最下行における未加工画像、または未加工画像の近傍に対し実施された。共通の教師なしK最近傍(KNN)クラスタリング方法が最下行右に示されており、ここで、クラスタリング結果が、再び、ピクセル強度または背景/前景分離に基づいて見られる。最下行中央は、第1の非強度ベースの手法を示す。平均構造類似性インデックス尺度(SSIM)は、領域間の類似性の尺度として、100×100ピクセルの非重複近傍について対ごとに計算される。各近傍の平均SSIMは、図5の最下行中央に示されるように2つのクラスにグループ化することができる二峰性分布である。しかしながら、SSIMにおけるカットオフは手動で決定されなくてはならない。最後に、開示される少数ショット技法マニュスクリプトによる少数ショットセグメンテーションが最下行左に示され、ここでは、別個のマイクログラフの2つの領域間の完全なセグメンテーションが見られる。少数ショットは、クラスタリング技法として含まれる。なぜなら、近傍が、クラスタリング技法が重心に対し比較を行う方式にいくつかの点において類似してプロトタイプに対し比較されるためである。
【0041】
図6は、別の例示的な少数ショット方法600のフローチャートを示す。600において、撮像もしくはスペクトルセンサ、または顕微鏡もしくは他の器具の別の検出器等の器具から入力データ画像が受信される。604において、入力データ画像が、より小さな部分画像の配列に分割される。606において、ユーザは、例えばマウスまたはタッチスクリーンインタフェースを用いて、関心対象の特徴の異なるクラスを表す関心対象の様々な部分画像を選択することによって、より小さな部分画像の配列から、少数ショット画像セグメンテーションのためのサポートセットを選択することができる。サポートセットは、関心対象のユーザによって選択された特徴を含むことができる。サポートセットは、関心のある特徴と区別されるべき領域、例えば、既知の背景材料もしくは物体、暗空間、白色空間、特定のテクスチャもしくは色、関心のない特定の材料もしくは物体等も含む可能性がある。608において、サポートセットは、埋め込みニューラルネットワークを通じて処理することによって、潜在空間表現に変換される。610において、クラスプロトタイプは、その後、少数ショットニューラルネットワークによって、配列の他の部分画像または他の取得された入力データ画像内の他の部分画像を分類するのに用いられるように形成される。612において、サポートセットが608において変換される時点で、または異なる時点で、入力画像の他の部分画像、または他の画像の部分画像は、埋め込みニューラルネットワークを通じて処理することによって、潜在空間表現に変換される。614において、入力データ画像の部分画像は、クラスプロトタイプとの比較に基づいて分類され、異なる部分画像が対応するクラスプロトタイプラベルを割り当てられる。616において、分類された出力画像は、例えば、コンピュータメモリに記憶されることによって、および/またはユーザに表示されることによって提供することができる。
【0042】
論じたように、顕微鏡は、多くの場合、異なる検出器チャネル、異なる粒子を検出するように構成された検出器、異なる向き、異なるタイプのデータ、ゲーティング、サンプリングレート、フレームレート等の異なるパラメータ構成を有する検出器等の2つ以上の検出モダリティを含む。いくつかの例において、複数の同時に取得された(または同時でない)データモダリティにおいて少数ショットサポートセットを定義することができる。次に、マルチモード少数ショットサポートセットを用いて、集約モダリティにおいてクラスを記述する、より高次のサポートセットベクトルを定義することができる。次に、未知のマルチモードデータを分類するクエリを、これらのより高次のサポートセットベクトルに対し行うことができる。例えば、1つのみのモダリティについて定義されたサポートセットに基づいてより高いクラス確率を有する可能性がある特徴は、他のモダリティの影響に起因して異なるクラス確率を有する可能性がある。いくつかの例において、検出モダリティに関連付けられたサポートセットは、第2の検出モダリティを通じて取得されたデータの類似のチップに割り当てることができる、異なるチップの分類ラベルを生成することができる。例えば、分類されたチップの座標は既知とすることができるため、関心対象の特徴を、第2の検出モダリティにおける画像にマッピングして、ユーザに有用な情報を提供することができる。いくつかの例において、ユーザは、第2のモダリティにおいて特徴のロケーションをレビューして、少数ショットサポートセットを精緻化することによって、第1のモダリティにおけるサポートセットを選択または選択解除することができる。更に、第2の検出モダリティにおけるサポートセット選択は、第1の検出モダリティからのラベルのマッピングによって支援することができる。いくつかの例において、第2の検出モダリティにおけるサポートセットは、第1の検出モダリティのために生成された分類ラベルに基づいて自動的にポピュレートすることができる。
【0043】
III.利点および用途
STEM画像セグメンテーションに対し柔軟性のある少数ショット学習手法を用いる開示される例は、より従来の画像処理方法と比較して、関心対象の位相、欠陥および他の微細構造特徴のマッピングおよび識別を大幅に加速することができる。3つの異なる材料系(STO/Ge、LSFO、およびMoO)を用いて、様々な原子スケールの特徴、このためモデル展開のための画像データにおける多様性で性能を検証した。開示された少数ショット学習手法を用いてセグメンテーションされた画像は、元のマイクログラフと良好な定量的一致を示す。
【0044】
他の技法と比較すると、ノイズ感度および/またはラベル付け能力は、適応的セグメンテーションおよびクラスタリングアルゴリズムにとって課題のままであることがわかった。調査された少数ショット技法は、優れた性能を呈し、材料一式を受け入れるのに十分柔軟性を保っている。少数ショット機械学習は、教師あり情報を有する僅かな数のサンプルのみを含む新たな分類タスクに高速に一般化することにますます成功しているが、経験リスク最小化器は僅かに信頼できないものとなる可能性があり、任意の所与のサポートセットについてモデルの信頼性の不確実性につながる。この不確実性のうちのいくらかは、例えば、モデルを、サポートセットにおける誤りを有する非最適解に向けて駆動することを回避するために、サポートセットを注意深く選択することにより軽減することができる。解における不確実性のうちのいくらかを低減することができる別の方式は、利用可能な場合、大量のラベル付けされたデータを用いて少数ショットモデルを実際にトレーニングし、新たな分類タスクが、完全に新しい異なる材料系においてであっても、最適化の利益を既に有するようにすることである。空間統計は、他の均一な材料領域から偽のセグメンテーション予測を平滑化するための方法も提供することができる。性能における不確実性に加えて、モデルの一般化が可能であることにおける利点も、モデル自体から抽出することができる物理的に有意味な情報の量を制限する。
【0045】
いくつかの例において、開示される少数ショットの例は、マルチモード少数ショットモデルにおけるスペクトル(電子エネルギー損失分光法(EELS)およびエネルギー分散X線分光法(EDS))および回折(4D-STEM)等の複数のデータストリームに適用することができる。マルチモードコンテキストにおける洞察は、より物理的に有意味な情報を抽出し、おそらくセグメンテーション性能を向上させるのに役立つ。
【0046】
理論上、この同じモデルは、多岐にわたるSTEM画像に対し一般化すべきであり、他のシステムに対する本発明による予備結果がこれを示す。まだ更に未知であるものは、所与のクラスについてのサポートセットにおけるサイズおよび多岐にわたる例の影響である。シミュレーション研究は、埋め込みのために他のモデルを用いる可能性、およびモデルトレーニングの利点を含む、これらの問いおよび他のものに回答するのを支援するように設計されている。テクスチャセグメンテーションのための少数ショットにおける最近の作業は、ピクセルレベルの表記が可能であることも示し、この手法の正確性をチップレベルの分解能よりも上に押し上げる。理想的には、少数ショットセグメンテーションは、そうでなければ手動で大規模に行うことが極度に高コストになるこれらの大きなトレーニングセットをキュレートし、表記することを支援することもできる。概して、この手法は、単一の画像について材料の微細構造の分析を標準化および自動化する潜在的に強力な手段を提供し、新たな高スループット特徴付けアーキテクチャへの道を開いている。
【0047】
IV.実験方法
上記の3つの実験システムが以下のように準備された。SrTiO3膜が分子線エピタキシー法(MBE)を用いてGe基板上に堆積された。La0.8Sr0.2FeO3膜がMBEを用いてSrTiO3(001)基板上に堆積された。薄膜の断面STEMサンプルが、FEIのHelios NanoLab DualBeam集束イオンビーム(FIB)顕微鏡および標準的な採取手順を用いて準備された。バルクMoO=粒子が、エタノール内の懸濁液からレース状炭素グリッド上にドロップキャストされた。STO/Geの高角度環状暗視野(STEM-HAADF)画像が、20.6mradの収束半角度および90~370mradの収集角度を有して200kVで動作しているプローブ補正されたJEOL ARM-200CF顕微鏡において収集された。LSFOおよびMoO3のSTEM-HAADF画像が、29.7mradの収束半角度および75~515mradの収集角度で、300kVで動作しているプローブ補正されたJEOL GrandARM-300F顕微鏡において収集された。この作業において解析された元の画像データは、(STO/Geの場合の)3042×3044ピクセル、(LSFOの場合の)2048×2048、およびMoO3の場合の512×512間で変動した。ビーム感度に起因して、示されるSTO/Ge画像は、フレーム平均化手法を用いて収集され;一連の10個のフレームが1024×1024pxサンプリングおよび2μs px-1を用いて取得され、次に、SmartAlignプラグインを用いて2回(2×)非剛体アラインおよびアップサンプリングされた。各材料系から数十個の画像が収集され、広範にわたる選択された欠陥特徴がこの研究において用いられた。前処理技法および少数ショットモデルのためのパラメータの特定の実施態様が、それぞれ表Iおよび表IIにおいて上記で説明される。全ての方法は、Pythonプログラミング言語v.3.6を用いて実施された。各画像は、16GB RAM 2.7GHz Intel Corei7 MacBook Proを用いて処理された。
【0048】
制御および自動化システムの例
科学の歴史は、自然界をより十分に探索するツール、手法およびプロトコルの発展によって強調される。ウォータシェッドの発見は、ますます明らかになる実験を設計および実行する際に人間を啓発することに直接関連してきた。クリーンエネルギー、シリコン革命およびデザイナー薬の台頭は、より良好な空間的、化学的および時間的レンズを通じて界を見た僅かな結果にすぎない。従来、手動の手法が実験に追いついていたが、現在では、全ての科学領域が人間の認知をはるかに超えた規模および複雑度でデータを生成する。この状況により、皮肉にも過剰なデータ、および迅速に作動可能な知識の不足が生じ、実験を変換する自動化および人工知能(AI)の開発の動機付けとなっている。化学的合成、結晶学および生物学等のいくつかのコミュニティが、この新たなパラダイムを早期に採用したが、硬物質の電子顕微鏡法等の分野は、長年にわたる実際の障壁に起因してこの遷移を始めたばかりである。閉じたまたは専用の器具プラットフォーム等のこれらの障壁のうちのいくつかは、企業推進力の結果であるのに対し、他の障壁は、アクセス可能な規格ベースの実験フレームワークの欠如から生じる。結果として、顕微鏡法におけるデータ科学の採用は、高度に断片化し、いくつかの機関は、強力なカスタム器具および解析プラットフォームを開発することができるのに対し、他の機関は、これらの実施を毎日の解析ワークフローに統合することができていない。現在、一般的な使用事例に対処するための実際的で一般化可能な自動化プラットフォームを設計することが大きく必要とされている。
【0049】
任意の自動化プラットフォームの2つの重要なコンポーネントは、低レベル器具制御および意思決定解析である。前者の場合、研究者は、通常、製造者によって設定された制御の制限を受容すること(多くの場合、性能仕様を保証する必要がある)または特注の器具を設計することの間で選択するように強制される。コミュニティは、細胞生物学、医療診断、および単一粒子の低温電子顕微鏡法の分野において最も顕著にではあるが、結晶学、半導体計量学および粒子分析においても、高スループットのスクリーニングおよび自動化に対する複数の革新的な手法を開発した。より近時では、製造者は、低レベルの器具機能に対するアクセスの増大を提供し始めた。これらのアプリケーションプログラミングインタフェース(API)は、潜在的に、既存の機械学習(ML)パイプラインに統合することができ、「有線測定(measure-by-wire)」自動調整およびガウスプロセス駆動型実験等の新たな制御フレームワークを有効にすることができる。しかしながら、これらのAPIは初期の開発段階にあり、プログラミング、ハードウェアおよび顕微鏡法の専門知識を必要とするため、これらを利用する僅かな制御システムしか設計されていない。更に状況を複雑化するのは、最新の機器が多くの場合に異なる製造者からのコンポーネント(例えば、カメラ、分光計、および走査装置)を組み込んでいることであり、その特徴およびアクセスパリティの欠如により任意の「オープンコントローラ」設計が複雑になる。理想的な「オープンコントローラ」は、(1)低レベル器具コマンドのための中心通信ハブとしての役割を果たし、(2)追加のハードウェアコンポーネントを含むようにスケーリングし、(3)データアーカイブの外部ソースに連結し、(4)解析から制御ループへのオンザフライのフィードバックを統合するべきである。最終的に、任意のそのようなシステムの目標は、低レベルコマンドを高レベルインタフェースに変換し、研究者またはオペレータが、高レベルの実験設計および実行に集中することを可能にすることである。この目標は、研究者が、器具の基礎をなす動作について無知であるべきことを意味するものではなく;むしろ、ほとんどの実験が、未加工(メタ)データ情報(例えば、ステージ座標、プローブ電流および検出器カウント)ではなく、物理的に有意味な材料および科学記述子(例えば、形態学、テクスチャおよび局所的状態密度)を収集することを目的とすることを確認する。
【0050】
実際の低レベル器具制御と並行して、意思決定解析は、任意の自動化プラットフォームの追加の重要な部分である。従来の器具動作は、技能を有するオペレータが実験パラメータを手動で定義し、データを収集し、出力を評価して、次のステップを決定するヒューマン・イン・ザ・ループ制御 に基づく。しかしながら、この手法は、ここで定期的に生成される大きなデータボリュームおよびタイプにあまり適しておらず;高次元のパラメータ空間を解析するのが困難な人間は、ステップをバイアスおよび省略する傾向があり、多くの場合、十分高速に応答することができない。したがって、閉ループ制御のための作動可能なメトリックを迅速に定義することができる解析手法が用いられなければならない。計算撮像の分野は、ノイズ除去および歪み補正等のデータ品質の改善と、成分解析およびML等の方法を用いた情報の抽出の双方に対する手法を開発した。畳み込みニューラルネットワーク(CNN)等のディープラーニング手法は、基礎をなす物理学の事前知識を有することなくデータにおける傾向について一般化可能なモデルを学習可能であることに起因して、顕微鏡法においてますます一般的になっている。これらの方法は、複数のモダリティにわたって大量のデータを効率的に問い合わせることができ、埋め込みコンピューティングハードウェアを用いて加速し、処理時間を低減することができる。その多くの用途の中で、MLは、原子スケールの構造モチーフを効率的に定量化および追跡するために用いられ、自動化顕微鏡プラットフォームの一部として最近成功を示している。これらの利点にかかわらず、従来のCNNは通常制約されている。なぜなら、これらは通常、大量の(100~10k超の画像)の冗漫に手作業でラベル付けされたまたはシミュレートされたトレーニングデータを必要とするためである。顕微鏡において研究される多岐にわたる実験およびシステムに起因して、そのようなデータは、多くの場合、時間を消費し、取得が不可能である。加えて、トレーニングセットは、通常、所定のタスクを念頭に置いて選択され、実験中に得られた新たな洞察を組み込むようにオンザフライで変更することが困難である。
【0051】
最近、少数ショットMLは、システムに関するほとんどまたは全くない事前情報に基づいて、新規の視覚概念を学習する代替的な手法として提案された。少数ショットは、限られたデータを用いてMLの課題に対処するスパースデータ解析のより広い分野の一部である。(上記で論じた)開示される少数ショット手法において、オフラインCNN事前トレーニングは、ResNet101等の通常のネットワークを用いて1回実行し、その後、ユーザによって提供された限られた数の例を用いて特殊化された少数ショットメタ学習器のオンラインアプリケーションによって実行することができる。例は、1回のみ実行することができるオフライントレーニング、および異なるタスクに対し適応することができる柔軟性を利用するため、これらの手法は、計算効率の利点を有する。少数ショットは、主に電子後方散乱回折(EBSD)パターンの解析における、材料科学コミュニティ内で最小の利用が見られるが、新規のシナリオでは、トリアージおよび分類タスクを知らせる大きな可能性を有する。本明細書に論じられる開示される少数ショット技法は、最近、電子顕微鏡画像のセグメンテーションのための効率性および柔軟性を実証した。グラフィカルユーザインタフェース(GUI)において2~10個のみのユーザが提供した例を用いて、原子分解能および低倍率画像の双方において微細構造特徴を迅速に分類することが可能である。少数ショット手法の出力は、比較的大量の異なる特徴に対する特徴マップおよび統計を含むことができる。また、閉ループ自動化システムにおいてフィードバックし、および/またはマルチモードサポートセットを形成するかもしくは複数の異なる検出モダリティの解析を向上させるための道筋を提供する、所望の特徴のためのピクセル座標を容易に抽出することが可能である。
【0052】
様々な電子顕微鏡および他の顕微鏡ならびに器具のための開示される自動化プラットフォームの例は、少数ショットMLによって通知される閉ループフィードバックに基づくことができる。いくつかの例において、器具データは、中央器具コントローラを通じて予め定義された検索パターンに従って自動的に取得することができる。いくつかの例において、データは、非同期通信ハブに渡すことができ、非同期通信ハブにおいて、データはユーザ入力に基づいて別個の少数ショットアプリケーションによって処理される。処理されたデータを用いて、データに関連付けられた所望の特徴を識別し、実験の後続のステップを案内することができる。選択された例において、ステージモンタージュアルゴリズムと組み合わせて、自動化データ収集を大きな関心領域(ROI)にわたって実行することができる。少数ショット手法の特定の利点は、新たな知識が得られるとオンザフライで変更することができるタスクによって、特徴を分類し、システムを案内することができることである。開示される手法は、多岐にわたるモードにおいて、よりインテリジェントな統計的実験をもたらすことができる。
【0053】
任意の顕微鏡制御システムの設計は、複数のベンダーからのハードウェアコンポーネントが、カスタムコントローラおよび解析アプリケーションにネットワーク接続されなくてはならないため、本質的に複雑である。いくつかの例示的なシステムは、3つのサブシステム:動作、制御およびデータ処理に分割することができる。動作システムは、複雑な低レベルのハードウェアコマンドを、単純な高レベルのユーザインタフェースに変換するプログラミング言語および通信ネットワークを含むことができる。制御システムは、少数ショットML特徴分類に基づいて、開および/または閉ループデータ取得モードを包含することができる。ここで、動作システムは、ハードウェアコマンドを変換し、制御システムは、未加工データを物理的に有意味な制御設定点に変換する。本明細書において、MoOナノ粒子の統計的解析の文脈において、例示的な動作が説明される。いくつかの例において、データ処理システムは、オンザフライのおよび事後のレジストレーション、アライメント、および撮像データのスティッチングを含むことができる。例示的なアーキテクチャは、広範にわたる顕微鏡法実験の、柔軟性があり、カスタマイズ可能な、自動化された動作を有効にすることができる。
【0054】
プラットフォームのバックボーンとして、代表的な例は、開ループ形式で画像データを取得するように構成された分散動作システムを含むことができ、そのデータを少数ショットMLを介して解析し、次に、場合により、閉ループ形式の実験の次のステップについて自動的に決定を行う。システムの分散特性は、別個の専用ML局における解析実行(例えば、リモートでの、またはクラウドベースの環境を用いた解析実行であり、並列処理のために最適化することができる)、リモート実験室における様々な器具の取得および制御、ならびにオフィスまたは自宅からのプロセスの視覚化を可能にする。リモートの視覚化を提供するように構成された例示的なシステムは、信頼性に影響を及ぼすレイテンシおよび通信ドロップアウトを被る可能性があるリモート動作方式と対照の立場にある。
【0055】
図7は、3つのレベル:指示レベル702、通信レベル704およびハードウェアレベル706に配置された電子顕微鏡701のための例示的な動作システム700を示す。代表的な例において、指示レベル702は、それぞれ、全体動作および少数ショットML解析を提供するように構成されたデータ取得アプリケーション708および少数ショット機械学習アプリケーション710を含む。アプリケーション708、710は、サンプルがロードされ、初期アライメントが実行されると、エンドユーザが顕微鏡とインタラクトするために用いる一次ツールである。アプリケーション708、710の各々は、別個のプロセスとすることができ、実際的である場合、別個のマシン上で実行することができる。データ取得アプリケーション708は、主要なデータ取得アプリケーションとすることができるが、他のアプリケーションをこれに結合することができる。データ取得アプリケーション708は、セッション構成情報等の命令を器具コントローラに送信し、器具コントローラからデータを受信し、所与の実験に関連付けられたデータ/メタデータを記憶するように構成することができる。データ取得アプリケーション708は、器具データを、少数ショットML解析のために少数ショット機械学習アプリケーション710に渡し、記憶およびリアルタイムの視覚化のために、返された解析されたデータを受信する。いくつかの例において、少数ショット機械学習アプリケーション710は、ウェブベースのPython Flask GUIを特徴とすることができる。少数ショット機械学習アプリケーション710を用いて、ユーザが定義した少数ショットサポートセットに基づいて、画像内の特徴または他の器具データグループを分類し、分類された特徴の量および座標を記録する。以下で更に説明されるように、解析の結果は、開ループ取得の終了時にユーザに表示することができ、閉ループ意思決定の基礎として用いることができる。
【0056】
通信レベル704は、エンドユーザアプリケーションを、低レベルハードウェアコマンドに連結するように構成することができる。例えば、通信レベル704は、より従来の顕微鏡システムでは低速で誤りを生じやすいプロセスである、複数のハードウェアサブシステムとの直接のユーザインタラクションの量を最小にするように特に構成することができる。システム700の様々な部分間の通信は、中央メッセージング中継器712によって扱うことができる。代表的な例において、中央メッセージング中継器は、非同期通信を提供することができる。いくつかの例において、中央メッセージング中継器712は、多くのソフトウェア言語およびハードウェアプラットフォームにポート接続されたソケットベースのメッセージングプロトコルであるZeroMQ(ZMQ)において実施することができる。ZMQパブリッシャ/サブスクライバモデルは、非同期通信を可能にすることに起因して有利とすることができ;すなわち、システム700のコンポーネントは、メッセージを発行し、次にその作業を継続することができる。例えば、データ取得アプリケーション708は、少数ショット機械学習アプリケーション710がサブスクライブするポート上に画像を発行することができる。データ取得アプリケーション708は、周期的に自身がサブスクライブする少数ショット機械学習アプリケーション710ポートをチェックしながら、画像を制御し、データを記憶および視覚化する自身の作業を継続することができる。逆に、少数ショット機械学習アプリケーション710コードは、ZMQ中継器を介してデータ取得アプリケーション708からの任意のメッセージをリスンすることができる。なぜなら、これらのメッセージは、少数ショット機械学習アプリケーション710によって処理される画像を含むためである。同じメッセージにおいて、データ取得アプリケーション708は、必要なチップサイズ、および単数または複数のサポートセット内の各クラスに割り当てられたチップの識別情報(微細構造特徴)等の、少数ショット解析に必要なパラメータを送信することができる。代替的に、ユーザは、実験の開始時に、または実験の主要な遷移点において、GUI内のこれらの同じパラメータを示すことができる。いくつかの例において、少数ショット解析からの出力は、処理された画像(例えば、画像内の各グリッドが分類により色分けされる)、各分類された特徴の座標、および/またはデータ取得アプリケーション708における表示のための概要統計とすることができる。少数ショット機械学習アプリケーション710は、少数ショット解析出力をZMQ中継器712に返送し、ここで、これはリソースが利用可能であるとき、データ取得アプリケーション708による作用を受けることができる。データ取得アプリケーション708は、1つまたはそれ以上のクラウドアーカイブ714に更に連結することができる。少数ショットサポートセットおよびモデル重み等のデータおよび方法は、実験の前に初期化することができ、次に、実験の終了時にアップロードすることができる。
【0057】
ハードウェアレベル706は、通常、実施が最も困難であった。なぜなら、直接低レベルハードウェア制御が、多くの場合、利用不可能であるか、または専用製造者フォーマットで符号化されるためである。多くの製造者は独自のスクリプト言語を提供してきたが、これらは通例、オープンPythonまたはC++/C#ベースのプログラミング言語と互換性のないサイロ化されたおよび限られたアプリケーション環境の外側でアクセス不可能である。しかしながら、PyJEM716およびGatan Microscopy Suite(GMS)Python718等の最近のAPIのリリースにより、ビーム制御720、アライメント722、ステージ位置決め724および検出器726を含む、多くの器具動作と直接インタフェースする能力が解除された。より高レベルの制御を定義するラッパをこれらのAPIの各々について提供することができ、これらは次にZMQ中継器712を通される。ハードウェアレベル706は、モジュール式であるように構成することができ、新たなハードウェアがアクセス可能にされ、追加のコンポーネントが設置される際、追加のラッパを通じて拡張することができる。動作システム700の3つのレベル702、704、706は合わせて、顕微鏡の制御を移し、これを例えば非同期通信中継器を介して豊富な自動化および解析アプリケーションにリンク付けする役割を果たす。
【0058】
図8は、動作システム700のために用いることができる様々な器具制御モードを示す。いくつかの例において、器具は、特徴分類806のプロセスによって分離された開ループ制御802または閉ループ制御804の下で実行することができる。開ループ制御動作において、システムは、データ取得アプリケーションにおいてユーザによって提供されるかまたはクラウドリポジトリからダウンロードされたパラメータに基づいて予め定義された検索グリッド808を実行することができる。データ取得アプリケーションにおいてユーザによって提供されたパラメータに基づいて予め定義された検索グリッドの実行は、例えば、ユーザが、サンプルが何を含むか不確実であるとき、新規のシナリオにおいて特に有用とすることができる。クラウドリポジトリ等の外部ソースから受信した提供されたパラメータに基づいて予め定義された検索グリッドの実行は、同じタイプのサンプルまたは特徴の大規模スクリーニングキャンペーンにおいて有用とすることができる。開示される手法の利点は、サンプリング方法を容易に標準化することができ、異なる器具ユーザ間、または更には異なる実験室もしくは産業環境間で共有することができることである。
【0059】
データは、開ループ制御802を介して取得されると、例えば、図7に示すようにZMQ中継器712を通じて特徴分類806のための少数ショット機械学習アプリケーションに渡される。少数ショット解析のためのサポートセットおよびモデルパラメータは、クラウドソースから初期化することができるか、または本明細書に記載のようなインタラクティブGUIにおいて動的に調節することができる。特徴分類806中、ユーザは、関心対象の微細構造特徴を含む第1のいくつかの取得フレームのうちの1つを選択することができる。調節可能なグリッドは、画像上に動的に重ね合わされ、画像がこれらのグリッドラインにおいて、正方形または他のエリア形状に分割され、これは、(上記で論じたように)チップと呼ぶことができ、このうちのいくつかは、その後、ユーザによって、少数ショットサポートセットを定義するためのクラスに割り当てられる。2~10個の僅かなチップを各サポートセットの例として用いて、少数ショットアプリケーションは、データ取得アプリケーションによって送信される後続の画像のうちのいくつかまたは全てに対し少数ショットpythonスクリプトを実行することができる。各画像における各チップは、サポートセットにおいて示されるクラスのうちの1つに分類することができる。グラフィカルユーザインタフェースアプリケーションに組み込まれた少数ショット機械学習アプリケーションは、色分けされたセグメンテーション画像、クラス座標および概要統計を、ユーザへの表示のためにデータ取得アプリケーションに返送することができる。
【0060】
ユーザが少数ショット解析のために関心対象の特徴を定義した後、器具を閉ループ制御モード804で動作させることができる。閉ループ制御804において、初期検索グリッドが、ユーザの初期指定に従って完了まで実行される。ユーザは、追跡解析において対象とする特徴タイプを事前に選択する。これは、適応的検索グリッドと呼ぶことができる。初期少数ショットMLの後、選択されたフレームに対し解析が行われ、各特徴のタイプおよび座標が識別され、データ取得アプリケーションに返して渡される。次に、システムは、ステージ座標(移動ステージを含む)、倍率、サンプリング分解能、電流/線量、ビーム傾き、アライメントおよび/または検出器等のパラメータを調節し、所望の特徴タイプを自動的に適応的にサンプリングすることができる。
【0061】
器具制御の現実世界の例を示すために、ナノ粒子分析を適切な使用事例とみなすことができる。三酸化モリブデン(MoO)フレークのサンプルが、広範にわたる粒子サイズ、向きおよび形態を呈するため、選択された。MoOは、重要な有機太陽電池(OPV)前駆体であり、表面上の抗菌的成長の防止において見込みを示し、Moに還元されるとき、オーステナイト系ステンレス鋼に対する腐食耐性をもたらすことができる。選択されたTEMサンプルは、従来、回折回転を較正するために利用されてきた。回折回転較正のために、様々な寸法(数百nm~μm)の小さな電子透過プレートレットが、炭素膜TEMグリッド上に蒸着される。
【0062】
図8の上部に示すように、ユーザは、まず、データ取得アプリケーション内の予め定義された検索グリッドを取得する。以下で更に論じられるように、検索グリッドは、特定の画像重複パラメータおよびステージの移動の知識を用いて収集し、取得後のスティッチングを促進することができる。観測された分布、および粒子の向きは、ビーム(それぞれ「ロッド」および「プレート」と呼ばれる)およびプレートクラスタに対し平行および垂直の双方にある個々のプレートレットを含む。次に、粒子座標およびタイプを、少数ショットML解析を介して自動的に測定することができる。これを行うために、開ループ取得における初期画像フレームは、少数ショット機械学習アプリケーションにおける非同期解析のためにZMQ中継器を通される。ユーザは、所望のタスクに従って関心対象の特徴の例を選択する。これは、他の機械学習手法を上回る少数ショット手法の大きな利点である。例えば、少数ショットモデルは、適切なサポートセットを選択することによって、全ての粒子を背景と区別するか、または特定の粒子タイプ(例えば、プレートおよびロッド)を分離するように調整することができる。重大なことに、このタスクは、新たな情報が取得される際に、オンザフライでまたは事後解析において容易に調節することができる。この情報を用いて、画像セグメンテーション、色分けおよび特徴分布の統計的解析が、開ループ収集が進行するにつれ後続のデータに対し行われる。この情報は、データ取得アプリケーションに戻して渡すことができ、データ取得アプリケーションにおいてユーザに動的に提示することができる。閉ループ動作の最終モードにおいて、様々なシステムパラメータ調節を行うことができる。例えば、ステージは、識別された粒子の特定の座標まで駆動することができ、倍率を調節することができ、および/またはビームサンプリングまたは検出器タイプまたは動作モード等の取得設定を調節することができる。そのような調節は、多くの場合、実験の最も困難な部分である。なぜなら、それらはステージ位置の厳密な呼び出し、および器具アライメントの安定性に依拠するためである。閉ループ制御は、より低い倍率およびより高い倍率の双方において適用することができる。より高い倍率において、ステージは機械的不正確性および焦点ドリフトの影響をはるかに受けやすく、これにより、制御方式におけるかなり多くのフィードバックが必要となる可能性がある。
【0063】
既に説明した動作および制御システムと並行して、より大きなエリアのデータ収集、レジストレーション、および画像のスティッチングのためのデータ処理システムを提供することができる。この処理は、ユーザを局所的微細構造特徴の大域的位置に向けるのに重要であり、閉ループ制御および正確な統計的解析の双方において有用である。上記で論じたMoOの例を基に、適切なデータ取得プロセスにおけるステップが図9に示される。そのようなサンプルは、異なる粒子形態および向きを含むため、適切であるが、これらの粒子のスパース性(すなわち、大きな割合の空の炭素背景)に起因して、解析が困難でもある。図9は、xおよび/またはyステージ方向における重複する隣接画像に有用とすることができ、粒子スパース性に特に適用可能とすることができる、より低い倍率におけるデータ取得を行うために用いることができる例示的なモンタージュ方法900を示す。モンタージュ方法900は、サポートグリッド上の所望の特徴を表す閉じた円によって示されるように、ユーザに、裂け目および高密度の粒子を有しないCU TEMグリッド内の単一の関心領域(ROI)902を選択させることを含む。このROIは、通常、全体視野(FOV)を増大させるようにより低い倍率で選択されるが、より高い倍率で選択することもできる。代替的に、ファインダグリッドの角部等の基準マーカを用いてROI902を定義することができる。いずれの場合も、ROI902の反対側の角部におけるx座標およびy座標は、それぞれ開始位置および終了位置の集合として定義される。
【0064】
所望のROIの選択時、ユーザに、倍率、およびモンタージュ内の連続画像間の所望の割合の重複の双方等のモンタージュパラメータ904を入力するように促すことができる。906において、開始位置および終了位置と組み合わせて、重複および画像サイズに基づいてROIのエリアを分割することによって、マップの数、および収集される各個々の画像のステージ座標が計算される。ユーザプリファレンスに依拠して、システムは、各画像を、蛇行形式で、または鋸歯ラスタ検索パターンで収集することができる。蛇行パターンは、左上角部(または別の角部)において開始し、行の終了(n番目のフレーム)に達するまで選択された方向(例えば、右)に移動することができる。次に、画像取得は、1つの行だけ下がり、左に向かって戻るようにトラバースし、このプロセスを、行ごとに、m番目の行に達し、モンタージュが完成するまで繰り返す。zラスタパターンは、左上において開始し、蛇行パターンと同様に、行の終了に達するまで右に動く。行の終了において、画像捕捉は1つの行だけ下がり、左まで戻る。モンタージュおよび画像処理の観点から、2つの方法には僅かな実際の差異が存在し、このため、蛇行方法の低減された移動時間が通常好ましい。モンタージュ捕捉方法900の開始時に、プログラムは、第1の画像908(画像1)を収集することができ、この時点において、図8に示す特徴分類プロセスを用いて所望の特徴を描くことができる。初期分類方式の選択時、第2の画像910が取得され(画像2)、方法900は、初期画像アライメントチェック914を実行するように予測された重複座標912を利用する。以下で更に説明されるモンタージュアルゴリズムは、特徴アライメントに必要とされる2つの画像908、910間の相対的変位の更なる精緻化のために用いられる。予測重複912フレームに示すように、アスタリスクで示される同じ粒子が各画像において観測されるが、互いに重複していない。914においてモンタージュアルゴリズムの更なる精緻化が適用されるとき、粒子が重複し、再び赤いアスタリスクによって示される。第1の行916(行1)の完了時、第2の行918(行2)が収集され、データのn個の行が捕捉され、終了位置に達するまで行われる。図9では完全な行として示されるが、動作中、各画像は、リアルタイムで収集された前のデータに対しモンタージュすることができる。全てのステージ位置が撮像された後、最終モンタージュ920を計算することができ、この時点において、ユーザは、顕微鏡が所望の位置および倍率を駆動するために、関心領域(例えば、アスタリスクで示された粒子)を手動でまたは自動的に選択するオプションを有する。
【0065】
モンタージュが、特に大きなエリアにわたって画像捕捉のみに基づくとき、最終的なスティッチングされたモンタージュに影響を及ぼす可能性がある多くの潜在的な複雑性が存在する。選択された走査透過型電子顕微鏡法(STEM)条件に依拠して、ビームドリフトにより、分散した回折ディスクが所与の検出器に近づく可能性があり(例えば、暗視野検出器に対する強力な回折)、これにより、収集される最初の画像から最後の画像へ撮像条件が歪む可能性がある。既に述べたように、粒子スパース性またはROI内のクラスタリングも困難を呈する。例えば、倍率が過度に高く設定されている場合、隣接エリア内に、レジストレーションのための大きなコントラストまたは特徴がない領域が存在する場合がある。そのような状況には、大きなエリアの粒子解析において、および均一なコントラストの粒分布において遭遇する場合がある。ステージの運動は、結果に大きな影響を及ぼす可能性があり、この場合、予測画像位置との不一致が存在する。画像タイミングもスティッチングの労力に大きく影響を及ぼす可能性があり、例えば、ステージが画像捕捉中に動いている場合、画像はぼやける可能性がある。更に、関心エリアが過度に大きい場合、サンプル高さの変化が、大きな焦点ずれに起因して画像品質に影響を及ぼす可能性がある。
【0066】
これらの困難に鑑みて、ステージの運動の知識、および画像特徴にのみ基づいた知識に基づいて様々なスティッチング手法が評価された。いくつかの例において、ステージの運動に基づいた予測を用いて、2つの画像間の重複を直接計算することができるが、スティッチングされた画像におけるアーチファクトが、ステージの移動および画像取得に関する多岐にわたる実際の要因に起因して存在する場合がある。例えば、いくつかの例では、モータヒステリシスまたはステージラッシュにより、ステージの移動のコマンドが発行されたコマンドからずれることになる。「予測重複」が隣接画像を正確にスティッチングすることに失敗する例がフレーム912に示される。したがって、画像ごとの補正を、手動または自動の手法を用いて事後に行うことができる。手動のスティッチングは、人間の眼がパターンの検出が得意であることに起因して、少数の画像の場合に良好に機能する。しかしながら、そのようなプロセスは時間がかかり、大きなモンタージュに対し十分スケーリングせず、自動取得のためのプログラム内で自動化することができない。このプロセスを自動化するために、いくつかのスタンドアローンソフトウェアパッケージが利用可能であるが、ユーザに、顕微鏡と直接インタフェースしながら迅速なフィードバックを提供することができない。処理システムの一部として、取得中に画像を動的にアラインしスティッチングするために、画像ベースのレジストレーションスクリプトを提供することができる。アルゴリズム914は、例えば、SciPyの信号処理ライブラリにおいて実施されているように、畳み込み理論を用いて隣接画像の相互相関を迅速に計算し、次に、相互相関のピークを識別し、最大アライメントのための正しい変位を得る。この正規化された相互相関から、フレーム914に示すように、予測重複に最も近い局所最大値から、最良のアライメントが得られる。次に、このアライメントプロセスは、モンタージュ全体920を構築するために取得される全ての画像について繰り返される。未加工画像の処理後、同じ補正を少数ショット分類モンタージュに適用し、ユーザに、それらのサンプルにおける特徴分布に対する統計の大域的調査を提供することができる。
【0067】
実施形態において、カスタムPython3.7.1スクリプトを用いてスティッチングが実行された。Python3.7.1スクリプトは、ライブラリとしてローカルで実行することができるか、または更なる処理能力を得るためにリモートマシン上でスタンドアローンアプリケーションとして実行することができる。いくつかの例において、取得された画像は、冗長な情報を取り除くためにグレイスケールに変換された。次に、画像は、0の平均ピクセル強度を有するように正規化され、強度の絶対値の最大値が、照明またはコントラストにおける差について調節するために1に対し正規化された。次に、2つの画像間の全ての可能な重複についてそれらの相互相関が計算された。効率性の目的からこのように計算されない場合、直感的に、相互相関を、1つの画像を他の画像の上にスライドし、重複点のピクセル値を点ごとに乗算し、次に合算することとみなすことができる。相互相関のより大きな値は、2つの画像の特徴におけるより良好な合致に対応する。なぜなら、類似の値は、正であれ負であれ、二乗して正の寄与になるためである。値が類似していない場合(例えば、正および負の値の混合)、これらは、相殺される傾向にあり、これにより、より不良な合致を示すより小さな値がもたらされる。したがって、この計算された値を用いて、可能な重複を検索し、局所最大値を得る。しかしながら、画像が周期的構造を示す場合、相互相関において多くの局所最小値が存在する可能性があるため、この最大値が決定される方式には繊細さが存在する。通常、大域最大値は、通常、画像がほぼ完全に重複しているときに生じる。なぜなら、全体アライメントが不良である場合であっても、合算されている多くのピクセルが存在するためである。この影響を補償するため、およびアライメントを優先している事実を強調するため、相互相関は、値を計算するために合算されたピクセル数によって正規化される。
【0068】
このため、例示的な自動化システムは、低レベルの器具制御を、少数ショットMLに基づいた閉ループ動作と組み合わせることができる。システムは、複数の製造者からの低レベルハードウェアコンポーネントの実際の変換を提供することができ、これは、エンドユーザによって、直感的GUIアプリケーションによって容易にプログラムすることができる。開ループ形式および閉ループ形式の双方における顕微鏡動作を提供することができ、より従来的な自動化手法と対照的に、タスクによるサンプルの容易な統計的解析が可能になる。
【0069】
いくつかの記載される実験において用いられる物理的顕微鏡ハードウェアは、pyJEMPythonAPIを設けられたプローブ補正されたJEOL GrandARM-300F走査透過型電子顕微鏡(STEM)である。示されるデータは、300kVの加速電圧においてSTEMモードにおいて取得される。データ処理は、Intel Xeon W-2102 2.9GHzプロセッサおよび1GB NVIDIA Quadro NVS 310 GPUを設けられた別個のリモートDell Precision T5820 Workstationにおいて実行される。
【0070】
動作システムは、異なるハードウェアコンポーネントにおいて動作する個々のソフトウェアコンポーネントを含む。ソフトウェアの例は、C#/Pythonにおいて実施され、Pythonスクリプトが.NETアプリケーション内から呼び出されることを可能にするライブラリであるPython.NETを用いる。スティッチングソフトウェアアプリケーションは、Pythonライブラリを用いて、画像をスティッチングし、モンタージュを形成する。他の説明されたアプリケーションのように、スティッチングソフトウェアアプリケーションは、ライブラリとしてローカルで実行することができるか、または更なる処理能力を得るためにリモートマシン上でスタンドアローンアプリケーションとして実行することができる。PyJEMラッパは、PyJEMライブラリをラッピングし、JEOLからTEMセンタEM制御アプリケーションへの通信を可能にするアプリケーションである。PyJEMラッパはPythonで書かれ、EMを制御するために用いられるPC上で実行される。Gatan Scriptingは、Gatan Microscopy Suite(GMS)制御ソフトウェアへの通信を可能にする。これは、GMS埋込み型スクリプトエンジンにおいてPythonスクリプトとして実行される。全てのコンポーネントは、ZeroMQに基づき、PyZMQにおいて実施されるプロトコルを用いて中央データ取得アプリケーションと通信する。これは、ZMQパブリッシャ/サブスクライバモデルを用いることにより、非同期となる。全てのpythonコンポーネントはマルチプラットフォームであり、Windows、LinuxおよびMac OSにおいて試験された。
【0071】
少数ショット機械学習アプリケーションの例は、Python、D3、JavaScript、HTML/CSS、およびVega-liteを、Flask、Pythonウェブフレームワークと統合する。フロントエンドインタラクティブ視覚化がJavaScriptおよびHTML/CSSを用いて作成された。Flask Frameworkは、フロントエンドユーザインタラクションからの入力がバックエンドにおけるPythonスクリプトへの入力として渡されることを可能にする。Pythonスクリプトは、画像を処理するための少数ショットコードと、画像を受信し、処理された画像を返送するための少数ショット機械学習コードとを含む。
【0072】
総論
本出願および請求項内で使用される場合、単数形「a」、「an」、および「the」は、文脈が明白に別途指示しない限り、複数形を含む。加えて、用語「含む(includes)」は、「含む(comprises)」を意味する。更に、用語「結合される(coupled)」は、結合されるものの間の中間要素の存在を排除しない。
【0073】
本明細書に記載されるシステム、装置、および方法は、いかようにも制限すると解釈されるべきではない。代わりに、本開示は、単独ならびに互いとの様々な組合せおよび副次的な組合せにおける、様々な開示された実施形態の全ての新規および非自明の構成および態様に向けられる。開示されたシステム、方法、および装置は、任意の特定の態様もしくは構成またはそれらの組合せに限定されることがなく、また開示されたシステム、方法、および装置は、任意の1つもしくはそれ以上の特定の利点が存在すること、または問題が解決されることを必要としない。動作のいかなる理論も、説明を促進するためのものであり、開示されたシステム、方法、および装置は、そのような動作の理論に限定されない。
【0074】
開示された方法のうちのいくつかの動作は、簡便な提示のために、特定の順序で説明されるが、このような説明の仕方は、特定の順番が以下に明記される具体的な言語により要求されない限り、再配置を包含することを理解されたい。例えば、連続的に説明される動作は、いくつかの場合においては、再配置されるか、または同時に実施される。更には、簡略性の目的で、添付の図面は、開示されたシステム、方法、および装置が、他のシステム、方法、および装置と併せて使用される様々な方式を示さない。加えて、本説明は、時として、開示された方法を説明するために「生成する(produce)」および「提供する(provide)」のような用語を使用する。これらの用語は、実施される実際の動作の高レベルの抽象化である。これらの用語に対応する実際の動作は、特定の実装形態に応じて様々であり、当業者によって容易に認識可能である。
【0075】
いくつかの例において、値、手順、または装置は、「最低」、「最良」、「最小」などと称される。そのような説明は、多くの使用される機能的代替案の中から選択がなされることを示すことが意図され、そのような選択は、他の選択よりも、優れている、小さい、または別途好ましい必要はないということを理解されたい。
【0076】
図10は、記載される技術を実施することができる例示的なクラウドコンピューティング環境1000を示す。クラウドコンピューティング環境1000は、クラウドコンピューティングサービス1010を含む。クラウドコンピューティングサービス1010は、コンピュータサーバ、データ記憶リポジトリ、ネットワーキングリソース等の、様々なタイプのクラウドコンピューティングリソースを含むことができる。クラウドコンピューティングサービス1010は、中央に位置する(例えば、企業または組織のデータセンタによって提供される)か、または分散される(例えば、異なるデータセンタ等の異なるロケーションに位置し、および/または異なる都市もしくは国に位置する様々なコンピューティングリソースによって提供される)ことができる。クラウドコンピューティングサービス1010は、コンピューティングデバイス1020、1022および1024等の様々なタイプのコンピューティングデバイス(例えば、クライアントコンピューティングデバイス)によって利用される。例えば、コンピューティングデバイス(例えば、1020、1022および1024)は、顕微鏡装置または他の器具の一部を含むかまたはこれに接続された、コンピュータ(例えば、デスクトップまたはラップトップコンピュータ)、モバイルデバイス(例えば、タブレットコンピュータまたはスマートフォン)、または他のタイプのコンピューティングデバイスとすることができる。例えば、コンピューティングデバイス(例えば、1020、1022および1024)は、クラウドコンピューティングサービス1010を利用して、コンピューティング動作(例えば、データ処理、データ記憶等)を実行することができる。
【0077】
図11は、記載される革新を実施することができる適切なコンピューティングシステム1100の一般化された例を示す。多様な汎用または専用コンピューティングシステムで革新を実施することができるため、コンピューティングシステム1100は、本開示の使用または機能の範囲に関していかなる限定も示唆するものとは意図されない。
【0078】
図11を参照すると、コンピューティングシステム1100は、1つまたはそれ以上の処理ユニット1110、1115およびメモリ1120、1125を含む。図11において、この基本構成1130は破線内に含まれる。処理ユニット1110、1115は、上記の図1図10のコンピューティング環境のコンポーネントを実装するため、または上記の図1図10に示したデータ(例えば、顕微鏡画像)出力を提供するためなど、コンピュータ実行可能命令を実行する。処理ユニットは、汎用中央処理装置(CPU)、特定用途向け集積回路(ASIC)におけるプロセッサ、または任意の他の種類のプロセッサとすることができる。マルチ処理システムでは、複数の処理ユニットがコンピュータ実行可能命令を実行して処理能力を上昇させる。例えば、図11は、中央処理装置1110の他にグラフィック処理ユニットまたはコプロセシングユニット1115を示す。有形のメモリ1120、1125は、揮発性メモリ(例えば、レジスタ、キャッシュ、RAM)、不揮発性メモリ(例えば、ROM、EEPROM、フラッシュメモリ等)、または処理ユニット1110、1115によってアクセス可能な、2つの何らかの組合せでもよい。メモリ1120、1125は、本明細書に記載される1つまたはそれ以上の革新を実施するソフトウェア1180を、処理ユニット1110、1115による実行に適するコンピュータ実行可能命令の形態で記憶する。
【0079】
コンピューティングシステム1100は追加の機能を有することができる。例えば、コンピューティングシステム1100は、ストレージ1140、1つまたはそれ以上の入力デバイス1150、1つまたはそれ以上の出力デバイス1160、および1つまたはそれ以上の通信接続1170を含む。バス、コントローラまたはネットワーク等の相互接続機構(図示せず)がコンピューティングシステム1100のコンポーネントを相互接続する。典型的に、オペレーティングシステムソフトウェア(図示せず)が、コンピューティングシステム1100で実行する他のソフトウェアのための動作環境を提供し、コンピューティングシステム1100のコンポーネントの活動を協調させる。
【0080】
有形のストレージ1140は取外し式または非取外し式とすることができ、磁気ディスク、磁気テープもしくはカセット、CD-ROM、DVD、または情報を非一時的に記憶するために用いることができ、コンピューティングシステム1100内でアクセスすることができる、任意の他の媒体を含む。ストレージ1140は、本明細書に記載される1つまたはそれ以上の革新を実装するソフトウェア1180のための命令を記憶する。
【0081】
入力デバイス1150は、キーボード、マウス、ペンもしくはトラックボール等のタッチ入力デバイス、音声入力デバイス、走査デバイス、またはコンピューティングシステム1100への入力を提供する別のデバイスとすることができる。出力デバイス1160は、ディスプレイ、プリンタ、スピーカ、CDライタ、またはコンピューティングシステム1100からの出力を提供する別のデバイスとすることができる。
【0082】
通信接続1170は、別のコンピューティングエンティティへの通信媒体を通じた通信を可能にする。通信媒体は、コンピュータ実行可能命令、オーディオもしくはビデオ入力もしくは出力、または他のデータ等の情報を変調データ信号で伝達する。変調データ信号は、その特性の1つまたはそれ以上が信号における情報を符合化するような方式で設定または変更される信号である。限定ではなく例として、通信媒体は、電気、光学、RFまたは他のキャリアを用いることができる。
【0083】
革新は、プログラムモジュールに含まれるもの等のコンピュータ実行可能命令が対象の実プロセッサまたは仮想プロセッサ上のコンピューティングシステムで実行される一般的な文脈で記載することができる。一般に、プログラムモジュールまたはコンポーネントは、特定のタスクを実行し、または特定の抽象データ型を実装する、ルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構造等を含む。プログラムモジュールの機能は、様々な実施形態において望まれるように、プログラムモジュール間で組み合わせ、または分割することができる。プログラムモジュールのコンピュータ実行可能命令は、ローカルまたは分散型コンピューティングシステム内で実行することができる。概して、コンピューティングシステムまたはコンピューティングデバイスはローカルまたは分散とすることができ、ソフトウェアが本明細書に記載される機能を実装しつつ、専用ハードウェアおよび/または汎用ハードウェアの任意の組合せを含むことができる。
【0084】
本明細書に記載の様々な例において、モジュール(例えば、コンポーネントまたはエンジン)は、特定の動作を実行するかまたは特定の機能を提供し、モジュールのためのコンピュータ実行可能命令を実行してそのような動作を実行することができることを示すか、そのような動作が実行されるようにするか、または他の形でそのような機能を提供するように、「コード化」することができる。ソフトウェアコンポーネント、モジュールまたはエンジンに関して説明した機能は、別個のソフトウェアユニット(例えば、プログラム、機能、クラス方法)として実行することができるが、別個のユニットとして実施される必要はない。すなわち、機能は、より大きなまたは汎用のプログラムにおけるコードの1つまたはそれ以上のライン等のより大きなまたはより汎用のプログラムに組み込むことができる。
【0085】
提示のために、発明を実施するための形態は、コンピューティングシステムにおけるコンピュータ動作について説明するために、「決定する」および「用いる」のような用語を使用する。これらの用語は、コンピュータによって実施される動作についての高レベルの抽象概念であり、人間によって実施される行為と混同されるべきではない。これらの用語に対応する実際のコンピュータ動作は、実装形態に応じて変動する。
【0086】
記載のアルゴリズムは、例えば、デジタルコンピュータによって実行されるソフトウェアまたはファームウェアの命令として具現化される。例えば、開示される少数ショット機械学習、自動化およびモンタージュ技法のいずれかは、1つまたはそれ以上のコンピュータ、またはデータ取得システムの一部である1つまたはそれ以上のコンピュータまたは他のコンピューティングハードウェアによって実行することができる。コンピュータは、1つまたはそれ以上のプロセッサ(処理デバイス)および有形、非一時的コンピュータ可読媒体(例えば、1つまたはそれ以上の光学媒体ディスク、揮発性メモリデバイス(DRAMまたはSRAMなど)、または不揮発性メモリもしくは記憶デバイス(ハードドライブ、NVRAM)、および固体ドライブ(例えば、フラッシュドライブ))を含むコンピュータシステムとすることができる。1つまたはそれ以上のプロセッサは、1つまたはそれ以上の有形、非一時的コンピュータ可読媒体に記憶されたコンピュータ実行可能命令を実行し、それによって、開示された技法のいずれも実施することができる。例えば、開示された実施形態のいずれかを実施するためのソフトウェアは、1つまたはそれ以上の揮発性、非一時的コンピュータ可読媒体にコンピュータ実行可能命令として記憶することができ、この命令は、1つまたはそれ以上のプロセッサによって実行されると、1つまたはそれ以上のプロセッサが、開示された技法または技法のサブセットのいずれかを実施する。計算の結果は、1つまたはそれ以上の有形、非一時的コンピュータ可読記憶媒体に記憶することができ、かつ/またはユーザに対し、例えば、グラフィカルユーザインタフェースを用いて画像セグメンテーションを表示デバイスに表示することによって、出力することもできる。
【0087】
例示された実施形態を参照して開示された技術の原理を説明および例示してきたが、例示された実施形態は、そのような原理から逸脱することなく、配置および細部を変更することができる認識される。例えば、ソフトウェアで示される例示された実施形態の要素は、ハードウェアで実装することができ、逆もまた同様である。また、任意の例からの技術は、他の例のうちの任意の1つまたはそれ以上において説明される技術と組み合わせることができる。例示された例を参照して説明されるもの等、手順および機能は、単一のハードウェアもしくはソフトウェアモジュールにおいて実施することができるか、または別個のモジュールを提供することができることを理解されたい。上記の特定の配置は、簡便な例示のために提供されるものであり、他の配置も用いることができる。
【0088】
開示された技術の原理を適用することができる多くの可能な実施形態の観点から、例示された実施形態は、代表的な例にすぎず、本開示の範囲を限定するとみなされるべきではないということを認識されたい。これらのセクションにおいて具体的に取り扱われる代替案は、単に例示にすぎず、本明細書に説明される実施形態に対する全ての可能な代替案を構成するものではない。例えば、本明細書に説明されるシステムの様々なコンポーネントは、機能および使用において組み合わせることができる。したがって、本発明者らは、添付の特許請求の範囲内に入るもの全てを特許請求する。
図1A
図1B
図2
図3A
図3B
図3C
図3D
図3E
図4A
図4B
図4C
図5
図6
図7
図8
図9
図10
図11
【国際調査報告】