IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セキュリティ マターズ リミテッドの特許一覧

特表2022-529624サンプルを分類する方法およびシステム
<>
  • 特表-サンプルを分類する方法およびシステム 図1
  • 特表-サンプルを分類する方法およびシステム 図2A
  • 特表-サンプルを分類する方法およびシステム 図2B
  • 特表-サンプルを分類する方法およびシステム 図3
  • 特表-サンプルを分類する方法およびシステム 図4
  • 特表-サンプルを分類する方法およびシステム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-06-23
(54)【発明の名称】サンプルを分類する方法およびシステム
(51)【国際特許分類】
   G01N 23/223 20060101AFI20220616BHJP
【FI】
G01N23/223
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021560551
(86)(22)【出願日】2020-04-05
(85)【翻訳文提出日】2021-12-13
(86)【国際出願番号】 IL2020050409
(87)【国際公開番号】W WO2020212969
(87)【国際公開日】2020-10-22
(31)【優先権主張番号】62/833,956
(32)【優先日】2019-04-15
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】518274043
【氏名又は名称】セキュリティ マターズ リミテッド
【氏名又は名称原語表記】SECURITY MATTERS LTD.
(74)【代理人】
【識別番号】100139723
【弁理士】
【氏名又は名称】樋口 洋
(72)【発明者】
【氏名】グロフ,ヤイール
(72)【発明者】
【氏名】ドセンコ,ドミトリー
(72)【発明者】
【氏名】カガルリツキー,ミリット
(72)【発明者】
【氏名】タル,ナタリー
(72)【発明者】
【氏名】ヨラン,ナダフ
(72)【発明者】
【氏名】アロン,ハガイ
【テーマコード(参考)】
2G001
【Fターム(参考)】
2G001AA01
2G001AA02
2G001BA04
2G001CA01
2G001FA06
2G001FA29
2G001KA20
2G001LA03
(57)【要約】
対象のサンプルをモデルベース分析しサンプル分類を管理するための方法およびシステムが提供される。所定のモデル化データが提供され、これは、スペクトル線の形状を有する所定の関数に基づくそれぞれのK個の測定スキームに対するK個のモデルを示すデータと、異なるサンプルが関連するM個の所定のグループのM個の特性ベクトルを示すデータと、M個のグループに対する重みの共通ベクトルを示すデータとを含む所定のモデル化データとを含む。データプロセッサがこのデータを利用し、前記所定のモデル化データを用いて対象のサンプルの測定スペクトルデータにモデルベース処理を適用し、前記M個の所定のグループの1つに対する前記対象の特定のサンプルの関係を示す分類データを生成するように動作する。
【特許請求の範囲】
【請求項1】
対象のサンプルをモデルベース分析する方法であって、
所定の異なる特性を有するM個のグループに関連する複数のN個の参照サンプルにおいて実行された数K個の測定スキームのスペクトル測定を示す参照データを提供する工程であって、該参照データは、複数の(NxK)個の測定参照スペクトルを含む未加工測定データを含み、かつ、前記参照サンプルのそれぞれが前記M個のグループのそれぞれ1つに対応することを示すデータを含む、工程;
前記複数の(NxK)個の測定基準スペクトルを処理して、前記K個の測定スキームにそれぞれ対応するK個のモデルを決定する工程であって、前記モデルは、スペクトル線の形状を有する所定の関数に基づいており、かつ、それぞれの測定スキームに関連している、工程;
前記K個のモデルのそれぞれに、それぞれの測定スキームに対応するN個の測定参照スペクトルのそれぞれをフィッティングし、かつ、前記参照サンプルのそれぞれについて、前記数K個の測定スキームについて前記サンプルの参照スペクトルのベクトル表現を作成し、それによって前記各参照サンプルをそれぞれの成分のベクトルで表現する工程;
前記M個のグループのそれぞれ1つに対する前記サンプルの各々の対応を示す前記データを利用し、各グループについて、前記グループに関連するサンプルの成分のベクトルを分析し、かつ、前記グループの特性ベクトルを示すデータを決定する工程;および
前記参照サンプルの成分のベクトルと前記グループの特性ベクトルとの間の距離関数に基づいて、前記参照サンプルの成分のベクトルのすべてをそれぞれのグループに関連付けるための複合尤度を最大にする距離関数の重みパラメータを決定し、それによって前記距離関数の前記重みパラメータの共通ベクトルを提供する工程;
それぞれのK個の測定スキームに対するK個のモデルを示すデータ、前記グループの特性ベクトルを示すデータ、および前記M個のグループに対する重みの共通ベクトルを示すデータを含むモデル化データを保存する工程であって、それによって、前記モデル化データを用いて対象のサンプルの未加工測定スペクトルデータをモデルベース分析することにより、対象のサンプルを分類して前記M個のグループの1つに関連付けることを可能にする、工程
を含む、方法。
【請求項2】
前記対象のサンプルの分類を行う工程をさらに含み、該工程が、
前記対象のサンプルの未加工測定スペクトルデータに基づいて、前記K個の測定スキームの下で前記対象のサンプルのK個の測定スペクトルに対応するK個のデータピースをそれぞれ決定する工程;
前記モデルベース分析を前記K個のデータピースに適用する工程
を含み、該適用する工程が、
前記保存されたK個のモデルを使用して、対象のサンプルに対する前記K個の測定スペクトルのそれぞれを前記保存されたK個のモデルのそれぞれ1つにフィッティングし、かつ、前記K個の測定スペクトルのそれぞれに対するベストフィット条件に基づいて、前記K個の測定スキームのすべてのサンプルの複合ベクトル表現を作成する工程;
前記重みの共通ベクトルに前記距離関数を適用して、前記サンプルの複合ベクトル表現の前記グループの特性ベクトルのそれぞれまでの距離を決定し、かつ、前記決定された距離が最小となるグループに前記サンプルを関連付ける工程
を含むことを特徴とする、請求項1に記載の方法。
【請求項3】
前記測定スキームの前記数Kが少なくとも2であることを特徴とする、請求項1または2に記載の方法。
【請求項4】
前記モデルが、スペクトル線の形状の前記所定の関数および特定のピースワイズ多項式関数に基づく混合モデルとして構成されることを特徴とする、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記距離関数が統計関数であることを特徴とする、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記グループの特性ベクトルが、同一グループの前記参照サンプルを表す成分ベクトル内の成分の平均値を含むことを特徴とする、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記距離関数が、前記ベクトルの成分の平均値および標準偏差に関連付けられ、それにより、前記成分ベクトル内の成分値の広がりの量が表現されることを特徴とする、請求項6に記載の方法。
【請求項8】
前記K個のモデルを決定するための前記複数の(NxK)個の測定された参照スペクトルの処理が、
i番目の測定スキーム(i=1、…、K)に対応するN個の参照サンプルの複数の測定された参照スペクトルの各i番目に対して、平均測定参照スペクトルを決定する工程;および
スペクトル線の形状を有する前記所定の関数に従って各i番目の平均測定基準スペクトルに対して所定の変換を適用し、前記i番目の測定スキームに対応するそれぞれのi番目のモデルを取得し、それによりK個の測定スキームについてK個のモデルを取得する工程
を含むことを特徴とする、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記所定の関数がガウス関数を含むことを特徴とする、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記サンプルが、以下のタイプ:鉱物、貴石、ダイヤモンドの少なくとも1つであることを特徴とする、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記M個のグループの所定の異なる特性が、以下:サンプルの原産地、およびサンプルの原産地の地理的な位置の1つまたは複数の構造パラメータ
の1つまたは複数を含むことを特徴とする、請求項10に記載の方法。
【請求項12】
前記サンプルの測定スペクトルデータが、X線またはガンマ線放射に対する前記サンプルの蛍光X線(XRF)応答を示すことを特徴とする、請求項1~11のいずれか一項に記載の方法。
【請求項13】
サンプルにおける測定をモデル化するデータ分析システムであって、
数Kの測定スキームの下で、所定の異なる特性のM個のグループに関連する複数のN個の参照サンプルに対してスペクトル測定を行い、前記M個のグループに関連する複数の(NxK)個の測定参照スペクトルを含む測定参照データを生成するように構成および動作可能である測定システム;
前記測定参照データに基づいて、対象のサンプルのさらなる分類を可能にするモデル化データを決定するように構成および動作可能なコントロールシステム
を含み、前記コントロールシステムが、
前記複数の(NxK)個の測定された参照スペクトルを処理して、前記K個の測定スキームにそれぞれ対応するK個のモデルを決定するように構成および動作可能なモデル作成モジュールであって、前記モデルは、スペクトル線の形状を有する所定の関数に基づいており、それぞれの測定スキームに関連する;
以下を実行するように構成および動作可能なフィッティングモジュール:前記K個のモデルのそれぞれについて、それぞれの測定スキームに対応するN個の測定された参照スペクトルの各々をモデルにフィッティングし;参照サンプルのそれぞれについて、前記数Kの測定スキームに対するサンプルの参照スペクトルのベクトル表現を作成し、それによって参照サンプルの各々をそれぞれの成分ベクトルで表現する;
前記M個のグループのそれぞれ1つに対する前記参照サンプルの各々の対応関係を示すデータを利用して、各グループについて、そのグループに関連するサンプルの成分ベクトルを分析し、そのグループの特性ベクトルを示すデータを決定するように構成および動作可能なグループ特性評価モジュール;
参照サンプルの成分ベクトルとグループの特性ベクトルとの間の距離関数に基づいて、参照サンプルの成分ベクトルのすべてをそれぞれのグループに関連付けるための複合尤度を最大にする距離関数の重みパラメータを決定し、それによって距離関数の前記重みパラメータの共通ベクトルを提供するように構成および動作可能な重み付けモジュール;および
それぞれのK個の測定スキームに対するK個のモデルを示すデータであって、グループの特性ベクトルを示すデータ、および、M個のグループに対する重みの共通ベクトルを示すデータを含む、保存されるモデル化データを生成するように構成および動作可能な出力ユーティリティ
を含むことを特徴とする、データ分析システム。
【請求項14】
サンプル分類システムであって、
数Kの測定スキームの下でサンプルのスペクトル測定を行い、かつ、測定されたサンプルのそれぞれについて、K個の測定スキームにそれぞれ対応する測定スペクトルを示すK個の測定データピースを含む測定スペクトルデータを生成するように構成および動作可能な測定システム;
前記測定システムと通信し対象の測定スペクトルデータを受信するように構成および動作可能であり、かつ、スペクトル線の形状を有する所定の関数に基づくそれぞれのK個の測定スキームに対するK個のモデルを示すデータと、異なるサンプルが関連するM個の所定のグループのM個の特性ベクトルを示すデータと、M個のグループに対する重みの共通ベクトルを示すデータとを含む所定のモデル化データを格納するメモリと通信するように構成および動作可能なコントロールシステムであって、前記所定のモデル化データを用いて対象のサンプルの受信した測定スペクトルデータにモデルベース処理を適用し、前記M個の所定のグループの1つに対する前記対象の特定のサンプルの関係を示す分類データを生成するように構成および動作可能なデータプロセッサを備える、コントロールシステム
を含むことを特徴とする、サンプル分類システム。
【請求項15】
前記コントロールシステムが、
以下を実行するように構成および動作可能なフィッティングモジュール:前記K個の測定スペクトルのそれぞれについて、測定スペクトルをそれぞれのモデルにフィッティングし、K個のベストフィット条件スペクトルを得る;および、前記K個のベストフィット条件スペクトルを用いて、前記K個の測定スキームすべてについて関心対象サンプルの複合ベクトル表現を作成する;
前記共通の重みベクトルを用いて所定の距離関数を利用し、前記M個のグループの前記M個の特性ベクトルのそれぞれまでの対象のサンプルの前記複合ベクトル表現の距離を決定し、決定された距離が最小となるグループに前記対象のサンプルを関連付けるように構成および動作可能な分類モジュール
を含むことを特徴とする、請求項14に記載のシステム。
【請求項16】
前記コントロールシステムが、前記M個のグループに関連する複数のN個の参照サンプル上で実行された前記測定スキームの数Kのスペクトル参照測定に対応する測定スペクトルデータに基づいて、所定のモデル化データを決定するようにさらに構成および動作可能であり、ここで、前記スペクトル参照データは複数の(NxK)個の測定参照スペクトルを含み、前記M個のグループのそれぞれの1つに対する参照サンプルのそれぞれの対応関係を示すデータを含み、
前記コントロールシステムは、
前記複数の(NxK)個の測定された参照スペクトルを処理して、前記K個の測定スキームにそれぞれ対応するK個のモデルを決定するように構成および動作可能なモデル作成モジュール;
以下を実行するように構成および動作可能なフィッティングモジュール:前記K個のモデルのそれぞれについて、それぞれの測定スキームに対応するN個の測定された参照スペクトルの各々をモデルにフィッティングし;参照サンプルのそれぞれについて、前記数Kの測定スキームに対するサンプルの参照スペクトルのベクトル表現を作成し、それによって参照サンプルの各々をそれぞれの成分ベクトルで表現する;
前記M個のグループのそれぞれ1つに対する前記参照サンプルの各々の対応関係を示すデータを利用して、各グループについて、そのグループに関連するサンプルの成分ベクトルを分析し、そのグループの特性ベクトルを示すデータを決定するように構成および動作可能なグループ特性評価モジュール;および
参照サンプルの成分ベクトルとグループの特性ベクトルとの間の距離関数に基づいて、参照サンプルの成分ベクトルのすべてをそれぞれのグループに関連付けるための複合尤度を最大にする前記所定の距離関数の重みパラメータを決定し、それによって距離関数の前記重みパラメータの前記共通ベクトルを提供するように構成および動作可能な重み付けモジュール
を含むことを特徴とする、請求項14または15に記載のシステム。
【請求項17】
サンプル分類の管理に使用するコントロールシステムであって、該コントロールシステムは、測定データプロバイダと通信し対象のサンプルの測定スペクトルデータを受信するように構成および動作可能であり、かつ、スペクトル線の形状を有する所定の関数に基づくそれぞれのK個の測定スキームに対するK個のモデルを示すデータと、異なるサンプルが関連するM個の所定のグループのM個の特性ベクトルを示すデータと、M個のグループに対する重みの共通ベクトルを示すデータとを含む所定のモデル化データを格納するメモリと通信するように構成および動作可能であり、前記コントロールシステムは、前記所定のモデル化データを用いて対象のサンプルの受信した測定スペクトルデータにモデルベース処理を適用し、前記M個の所定のグループの1つに対する前記対象の特定のサンプルの関係を示す分類データを生成するように構成および動作可能なデータプロセッサを備えることを特徴とする、コントロールシステム。
【請求項18】
以下を実行するように構成および動作可能なフィッティングモジュール:前記K個の測定スペクトルのそれぞれについて、測定スペクトルをそれぞれのモデルにフィッティングし、K個のベストフィット条件スペクトルを得る;および、前記K個のベストフィット条件スペクトルを用いて、前記K個の測定スキームすべてについて関心対象サンプルの複合ベクトル表現を作成する;および
前記共通の重みベクトルを用いて所定の距離関数を利用し、前記M個のグループの前記M個の特性ベクトルのそれぞれまでの対象のサンプルの前記複合ベクトル表現の距離を決定し、決定された距離が最小となるグループに前記対象のサンプルを関連付けるように構成および動作可能な分類モジュール
を含むことを特徴とする、請求項17に記載のコントロールシステム。
【請求項19】
前記M個のグループに関連する複数のN個の参照サンプル上で実行された前記測定スキームの数Kのスペクトル参照測定に対応する測定スペクトルデータに基づいて、所定のモデル化データを決定するようにさらに構成および動作可能であり、ここで、前記スペクトル参照データは複数の(NxK)個の測定参照スペクトルを含み、前記M個のグループのそれぞれの1つに対する参照サンプルのそれぞれの対応関係を示すデータを含む、コントロールシステムであって、
前記複数の(NxK)個の測定された参照スペクトルを処理して、前記K個の測定スキームにそれぞれ対応するK個のモデルを決定するように構成および動作可能なモデル作成モジュール;
以下を実行するように構成および動作可能なフィッティングモジュール:前記K個のモデルのそれぞれについて、それぞれの測定スキームに対応するN個の測定された参照スペクトルの各々をモデルにフィッティングし;参照サンプルのそれぞれについて、前記数Kの測定スキームに対するサンプルの参照スペクトルのベクトル表現を作成し、それによって参照サンプルの各々をそれぞれの成分ベクトルで表現する;
前記M個のグループのそれぞれ1つに対する前記参照サンプルの各々の対応関係を示すデータを利用して、各グループについて、そのグループに関連するサンプルの成分ベクトルを分析し、そのグループの特性ベクトルを示すデータを決定するように構成および動作可能なグループ特性評価モジュール;および
参照サンプルの成分ベクトルとグループの特性ベクトルとの間の距離関数に基づいて、参照サンプルの成分ベクトルのすべてをそれぞれのグループに関連付けるための複合尤度を最大にする前記所定の距離関数の重みパラメータを決定し、それによって距離関数の前記重みパラメータの前記共通ベクトルを提供するように構成および動作可能な重み付けモジュール
を含むことを特徴とする、請求項17または18に記載のコントロールシステム。
【請求項20】
対象のサンプルをモデルベース分析するコントロールシステムであって、
所定の異なる特性を有するM個のグループに関連する複数のN個の参照サンプルに対して行われる数Kの測定スキームのスペクトル測定を示す参照データを受信するように構成および動作可能であるデータ入力ユーティリティであって、前記参照データは、複数の(NxK)個の測定された参照スペクトルを含む未加工測定データを含み、かつ、前記M個のグループのそれぞれ1つに対する前記各参照サンプルの対応関係を示すデータを含む、データ入力ユーティリティ;
前記複数の(NxK)個の測定された参照スペクトルを処理して、前記K個の測定スキームにそれぞれ対応するK個のモデルを決定するように構成および動作可能なモデル作成モジュールであって、前記モデルは、スペクトル線の形状を有する所定の関数に基づいており、それぞれの測定スキームに関連する;
前記それぞれの測定スキームに対応するN個の測定された参照スペクトルの各々を前記K個のモデルの各々にフィッティングするように構成および動作可能であり、かつ、参照サンプルのそれぞれについて、前記数Kの測定スキームに対するサンプルの参照スペクトルのベクトル表現を作成し、それによって参照サンプルの各々をそれぞれの成分ベクトルで表現するフィッティングモジュール;
前記M個のグループのそれぞれ1つに対する前記参照サンプルの各々の対応関係を示すデータを利用して、各グループについて、そのグループに関連するサンプルの成分ベクトルを分析し、そのグループの特性ベクトルを示すデータを決定するように構成および動作可能なグループ特性評価モジュール;
参照サンプルの成分ベクトルとグループの特性ベクトルとの間の距離関数に基づいて、参照サンプルの成分ベクトルのすべてをそれぞれのグループに関連付けるための複合尤度を最大にする距離関数の重みパラメータを決定し、それによって距離関数の前記重みパラメータの共通ベクトルを提供するように構成および動作可能な重み付けモジュール;
前記それぞれのK個の測定スキームに対するK個のモデルを示すデータと、前記グループの特性ベクトルを示すデータと、前記M個のグループに対する重みの共通ベクトルを示すデータとを含むモデル化データを格納するためのストレージユーティリティ;および
前記モデル化データを用いて対象のサンプルの未加工測定スペクトルデータをモデルベース分析することにより、対象のサンプルを分類し前記M個のグループの1つに関連付けるように構成および動作可能である分類モジュール
を含むことを特徴とする、コントロールシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、サンプルの測定値をモデル化およびモデルに基づいた分析、およびサンプルの分類の分野にある。
【背景技術】
【0002】
本発明者らは、様々な産業、特に、鉱物やダイヤモンドなどの貴石のような対象物の製造および流通を扱う産業において、興味のある対象物/サンプルを、共通または類似の特性を持つ対象物/サンプルの特定のグループに関連するものとして識別/分類する必要があるかもしれないことを見出した。これには、対象物の原産地および/または対象物の原産地の地理的な位置の1つまたは複数の構造パラメータが含まれ得る。
【0003】
本発明者らはまた、同一のグループ(すなわち、予め定義されたグループ関連特性またはグループ固有の特性を有するグループ)に属する対象物が、その対象物のスペクトルによって、1つまたは複数の他のグループと区別される態様で分類できることを見出した。例えば、そのようなスペクトルデータは、X線またはガンマ線放射に対する対象物/サンプルの蛍光X線(XRF)応答を示すものでありうる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
したがって、本発明の技術は、測定されたスペクトルデータに基づいて対象のサンプルを関連するグループに分類する際に使用される、新規のモデルデータの作成を可能にする新規のモデル化技術を提供する。言い換えれば、本発明は、測定された1つまたは複数のスペクトルに基づいて、対象のサンプルを複数の予め定められたグループの1つに関連付けるための、特定の新規のモデルベースのアプローチを提供する。
【課題を解決するための手段】
【0005】
したがって、本発明の1つの広範な態様によれば、対象のサンプルをモデルベース分析する方法であって、所定の異なる特性を有する2つ以上の異なるグループに属する参照サンプルに関連する特定の参照スペクトルデータの分析、およびモデル化されたデータの作成を含む方法が提供される。より詳細には、本方法は以下の工程を含む:
所定の異なる特性を有するM個のグループに関連する複数のN個の参照サンプルにおいて実行された数K個の測定スキームのスペクトル測定を示す参照データを提供する工程であって、該参照データは、複数の(NxK)個の測定参照スペクトルを含む未加工測定データを含み、かつ、前記参照サンプルのそれぞれが前記M個のグループのそれぞれ1つに対応することを示すデータを含む、工程;
前記複数の(NxK)個の測定基準スペクトルを処理して、前記K個の測定スキームにそれぞれ対応するK個のモデルを決定する工程であって、前記モデルは、スペクトル線の形状を有する所定の関数に基づいており、かつ、それぞれの測定スキームに関連している、工程;
前記K個のモデルのそれぞれに、それぞれの測定スキームに対応するN個の測定参照スペクトルのそれぞれをフィッティングし、かつ、前記参照サンプルのそれぞれについて、前記数K個の測定スキームについてサンプルの参照スペクトルのベクトル表現を作成し、それによって参照サンプルのそれぞれをそれぞれの成分のベクトルで表現する工程;
前記M個のグループのそれぞれ1つに対する前記サンプルの各々の対応を示すデータを利用し、各グループについて、そのグループに関連するサンプルの成分のベクトルを分析し、かつ、そのグループの特性ベクトルを示すデータを決定する工程;および
前記参照サンプルの成分のベクトルと前記グループの特性ベクトルとの間の距離関数に基づいて、前記参照サンプルの成分のベクトルのすべてをそれぞれのグループに関連付けるための複合尤度(combined likelihood)を最大にする距離関数の重みパラメータを決定し、それによって前記距離関数の前記重みパラメータの共通ベクトルを提供する工程;
それぞれのK個の測定スキームに対するK個のモデルを示すデータ、グループの特性ベクトルを示すデータ、およびM個のグループに対する重みの共通ベクトルを示すデータを含むモデル化データを保存する工程であって、それによって、前記モデル化データを用いて対象のサンプルの未加工測定スペクトルデータをモデルベース分析することにより、対象のサンプルを分類して前記M個のグループの1つに関連付けることを可能にする、工程。
【0006】
1つまたは複数の測定スキームを使用して実行された前記サンプルの未加工測定スペクトルデータからの対象のサンプル(いわゆる「未知のサンプル」)の分類は、以下のように行うことができる:
対象のサンプルの未加工測定スペクトルデータに基づいて、K個のデータピースが、K個の測定スキームの下で対象のサンプルのK個の測定スペクトルに対応して決定され、
モデルベース分析は、K個のデータピースに適用され、以下の工程を含む:
保存されたK個のモデルを使用して、対象のサンプルに対する前記K個の測定スペクトルのそれぞれを保存されたK個のモデルのそれぞれ1つにフィッティングし、かつ、前記K個の測定スペクトルのそれぞれに対するベストフィット条件に基づいて、前記K個の測定スキームのすべてのサンプルの複合ベクトル表現を作成する工程;
前記重みの共通ベクトルに前記距離関数を適用して、前記サンプルの複合ベクトル表現の前記グループの特性ベクトルのそれぞれまでの距離を決定し、かつ、決定された距離が最小となるグループに前記サンプルを関連付ける工程。
【0007】
概して、本発明の技術は、適切なモデル化データを作成するとともに、未知のサンプルを適切に分類する。しかしながら、好ましくは、2つ以上の異なる測定スキームが使用される。測定スキーム/条件は、1つまたは複数のパラメータで互いに異なっていてもよい。いくつかの実施形態では、そのようなパラメータは、以下の1つまたは複数を含むことができる:一次放射線強度、一次放射線中の光子のエネルギー分布(これは、一次放射線を放出する管の電流および電圧によって設定されうる)、および/または放射線放出源におけるフィルタ。追加的に、または代替的に、異なる測定スキームでは、以下の1つまたは複数のバリエーションを使用することができ:一次放射線信号のコリメーション、照射スポットのサイズ、検出器での放射線応答信号のフィルタリング、放射線源の幾何学的構成、サンプルの表面および放射線源および/または放射線検出器の相対的な向きおよび配置(例えば、サンプルの表面、放射線源、および検出器の間の角度および距離)、これらは、スペクトルの測定に影響を与える可能性があり、異なる測定条件を作成するために変化させることができる。さらに、測定される一部またはすべてのスペクトルについて、サンプルを1つまたは複数の軸の周りに回転させ、様々なサンプルの方向付けの間にサンプルからの放出された放射線部分の計数を単一のスペクトルに収集してもよい。
【0008】
測定スキームごとに作成されたモデルは、スペクトル線の形状の所定の関数、および、ピースワイズ線形またはピースワイズ多項式関数である特定のピースワイズ(またはハイブリッド)関数に基づいて、混合モデルとして構成されている。このようなスペクトル線の形状を持つ関数としては、ローレンツ関数、ガウス関数および/またはフォークト関数が挙げられる。
【0009】
グループ特性ベクトルには、同一グループの参照サンプルを表す成分ベクトル内の成分の平均値が含まれている。この平均値および標準偏差に距離関数を対応させることで、成分ベクトル内の成分値の広がりの量が表現される。
【0010】
K個のモデルを決定するための、複数の(NxK)の測定された参照スペクトルの処理は、以下のように行われてもよい:
i番目の測定スキーム(i=1、…、K)に対応するN個の参照サンプルの複数の測定された参照スペクトルの各i番目に対して、平均測定参照スペクトルが決定され;かつ
スペクトル線の形状を有する所定の関数に従って各i番目の平均測定基準スペクトルに対して所定の変換を適用し、i番目の測定スキームに対応するそれぞれのi番目のモデルを取得し、それによりK個の測定スキームについてK個のモデルを取得する。
【0011】
本発明の別の広範な態様によれば、サンプル上の測定をモデル化するためのデータ分析システムが提供される。このシステムは、測定システム(例えば、X線またはガンマ線放射に対するサンプルの蛍光X線(XRF)応答を測定するためのもの)、および、測定された参照データに基づいて、対象のサンプルのさらなる分類を可能にするモデル化されたデータを決定するように構成および動作可能なコントロールを含む。より詳細には、測定システムは、数Kの測定スキームの下で、所定の異なる特性のM個のグループに関連する複数のN個の参照サンプルに対してスペクトル測定を行い、前記M個のグループに関連する複数の(NxK)個の測定参照スペクトルを含む測定参照データを生成するように構成および動作可能である。コントロールシステムは、以下を含む:
前記複数の(NxK)個の測定された参照スペクトルを処理して、前記K個の測定スキームにそれぞれ対応するK個のモデルを決定するように構成および動作可能なモデル作成モジュールであって、前記モデルは、スペクトル線の形状を有する所定の関数に基づいており、それぞれの測定スキームに関連する;
以下を実行するように構成および動作可能なフィッティングモジュール:前記K個のモデルのそれぞれについて、それぞれの測定スキームに対応するN個の測定された参照スペクトルの各々をモデルにフィッティングし;参照サンプルのそれぞれについて、前記数Kの測定スキームに対するサンプルの参照スペクトルのベクトル表現を作成し、それによって参照サンプルの各々をそれぞれの成分ベクトルで表現する;
前記M個のグループのそれぞれ1つに対する前記参照サンプルの各々の対応関係を示すデータを利用して、各グループについて、そのグループに関連するサンプルの成分ベクトルを分析し、そのグループの特性ベクトルを示すデータを決定するように構成および動作可能なグループ特性評価モジュール;
参照サンプルの成分ベクトルとグループの特性ベクトルとの間の距離関数に基づいて、参照サンプルの成分ベクトルのすべてをそれぞれのグループに関連付けるための複合尤度を最大にする距離関数の重みパラメータを決定し、それによって距離関数の前記重みパラメータの共通ベクトルを提供するように構成および動作可能な重み付けモジュール;および
それぞれのK個の測定スキームに対するK個のモデルを示すデータであって、グループの特性ベクトルを示すデータ、および、M個のグループに対する重みの共通ベクトルを示すデータを含む、保存されるモデル化データを生成するように構成および動作可能な出力ユーティリティ。
【0012】
本発明は、さらに広範な態様において、以下を含むサンプル分類システムを提供する:
数Kの測定スキームの下でサンプルのスペクトル測定を行い、かつ、測定されたサンプルのそれぞれについて、K個の測定スキームにそれぞれ対応する測定スペクトルを示すK個の測定データピースを含む測定スペクトルデータを生成するように構成および動作可能な測定システム;
前記測定システムと通信し対象の測定スペクトルデータを受信するように構成および動作可能であり、かつ、スペクトル線の形状を有する所定の関数に基づくそれぞれのK個の測定スキームに対するK個のモデルを示すデータと、異なるサンプルが関連するM個の所定のグループのM個の特性ベクトルを示すデータと、M個のグループに対する重みの共通ベクトルを示すデータとを含む所定のモデル化データを格納するメモリと通信するように構成および動作可能なコントロールシステムであって、前記所定のモデル化データを用いて対象のサンプルの受信した測定スペクトルデータにモデルベース処理を適用し、前記M個の所定のグループの1つに対する前記対象の特定のサンプルの関係を示す分類データを生成するように構成および動作可能なデータプロセッサを備える、コントロールシステム。
【0013】
いくつかの実施形態では、コントロールシステムは以下を含む:
以下を実行するように構成および動作可能なフィッティングモジュール:前記K個の測定スペクトルのそれぞれについて、測定スペクトルをそれぞれのモデルにフィッティングし、K個のベストフィット条件スペクトルを得る;および、前記K個のベストフィット条件スペクトルを用いて、前記K個の測定スキームすべてについて関心対象サンプルの複合ベクトル表現を作成する;
前記共通の重みベクトルを用いて所定の距離関数を利用し、前記M個のグループの前記M個の特性ベクトルのそれぞれまでの対象のサンプルの前記複合ベクトル表現の距離を決定し、決定された距離が最小となるグループに前記対象のサンプルを関連付けるように構成および動作可能な分類モジュール。
【0014】
いくつかの実施形態では、コントロールシステムは、前記M個のグループに関連する複数のN個の参照サンプル上で実行された前記測定スキームの数Kのスペクトル参照測定に対応する測定スペクトルデータに基づいて、所定のモデル化データを決定するようにさらに構成および動作可能であり、ここで、スペクトル参照データは複数の(NxK)個の測定参照スペクトルを含み、前記M個のグループのそれぞれの1つに対する参照サンプルのそれぞれの対応関係を示すデータを含む。コントロールシステムは、以下を含む:
前記複数の(NxK)個の測定された参照スペクトルを処理して、前記K個の測定スキームにそれぞれ対応するK個のモデルを決定するように構成および動作可能なモデル作成モジュール;
以下を実行するように構成および動作可能なフィッティングモジュール:前記K個のモデルのそれぞれについて、それぞれの測定スキームに対応するN個の測定された参照スペクトルの各々をモデルにフィッティングし;参照サンプルのそれぞれについて、前記数Kの測定スキームに対するサンプルの参照スペクトルのベクトル表現を作成し、それによって参照サンプルの各々をそれぞれの成分ベクトルで表現する;
前記M個のグループのそれぞれ1つに対する前記参照サンプルの各々の対応関係を示すデータを利用して、各グループについて、そのグループに関連するサンプルの成分ベクトルを分析し、そのグループの特性ベクトルを示すデータを決定するように構成および動作可能なグループ特性評価モジュール;および
参照サンプルの成分ベクトルとグループの特性ベクトルとの間の距離関数に基づいて、参照サンプルの成分ベクトルのすべてをそれぞれのグループに関連付けるための複合尤度を最大にする前記所定の距離関数の重みパラメータを決定し、それによって距離関数の前記重みパラメータの前記共通ベクトルを提供するように構成および動作可能な重み付けモジュール。
【0015】
本発明のさらに広範な態様によれば、サンプル分類の管理に使用するコントロールシステムが提供される。コントロールシステムは、測定データプロバイダと通信し対象のサンプルの測定スペクトルデータを受信するように構成および動作可能であり、かつ、スペクトル線の形状を有する所定の関数に基づくそれぞれのK個の測定スキームに対するK個のモデルを示すデータと、異なるサンプルが関連するM個の所定のグループのM個の特性ベクトルを示すデータと、M個のグループに対する重みの共通ベクトルを示すデータとを含む所定のモデル化データを格納するメモリと通信するように構成および動作可能である。コントロールシステムは、前記所定のモデル化データを用いて対象のサンプルの受信した測定スペクトルデータにモデルベース処理を適用し、前記M個の所定のグループの1つに対する前記対象の特定のサンプルの関係を示す分類データを生成するように構成および動作可能なデータプロセッサを備える。
【0016】
本明細書に開示されている主題をよりよく理解し、それが実際にどのように実施され得るかを例示するために、添付の図面を参照しながら非限定的な例としてのみ実施形態が説明される。
【図面の簡単な説明】
【0017】
図1】サンプルを分類するためのモデル化データを作成するための本発明のデータ分析システムのブロック図
図2A】モデル化データの作成に使用される参照スペクトルデータを例示するブロック図
図2B】サンプルの成分ベクトル表現に変換されたサンプルのスペクトルデータを例示するブロック図
図3】参照スペクトルデータの使用およびモデル化データの作成のための本発明の方法を例示するフロー図
図4】本発明の方法によって作成されたモデル化データを用いて、サンプルの未加工測定スペクトルデータをモデルベース処理することにより、サンプルを分類するための本発明の方法のフロー図
図5】未分類サンプルをクラスタ化するための本発明の方法における主要な工程のフロー図
【発明を実施するための形態】
【0018】
本発明は、サンプルの測定スペクトルに基づいて、類似/関連サンプルの特性グループに関する/関連するものとしてサンプルを分類するための新しいアプローチを提供する。上述したように、鉱物や貴石(特にダイヤモンド)のようないくつかのタイプのサンプル/対象物は、特定のグループとの関連性/関係性によって識別される必要がある。このグループは、サンプルの原産地および/またはサンプルの原産地の地理的位置の1つまたは複数の構造パラメータによって記述されうる。同じグループ(すなわち、予め定められたグループ関連のおよびグループ固有の特性を有するグループ)に関連するサンプルは、1つまたは複数の他のグループのサンプル/スペクトルと区別する態様で、そのスペクトルデータに基づいて分類することができる。
【0019】
本発明は、サンプルの未加工測定スペクトルデータに基づいて、対象のサンプルを関連するグループに分類するために使用される、新規のモデル化データを作成するための新規の技術を提供するものである。
【0020】
図1を参照すると、ブロック図によって、サンプルを分類するためにさらに使用されるモデル化データを作成するための本発明のデータ分析システム10が示されている。システム10は、測定データプロバイダ12とのデータ通信のために構成されたコントロールシステムである。コントロールシステム10は、典型的にはコンピュータシステムであり、測定データプロバイダの一部/またはそれと一体であってもよく、あるいは、例えばクラウドコンピューティング技術を用いて、任意の既知の適切な通信技術およびデータプロトコルを用いて、通信ネットワークを介して測定データプロバイダと通信してもよい。リモートエンティティ間のデータ通信ネットワークおよびプロトコルの構築および運用は、それ自体がよく知られており、本発明の一部を構成するものではないため、詳細に説明する必要はない。
【0021】
測定データプロバイダは、この非限定的な実施例に示すように、測定システム14自体によって構成されてもよいし、任意の既知の適切な通信技術を用いて、測定システムとデータ通信する別個の記憶装置であってもよい。この特定の実施例に示すように、測定システム14は、放射線源14A、放射線検出器14B、コントローラ14C、並びにサンプル支持ユニット14Dを含む。
【0022】
具体的に示されていないが、測定システムは、測定手順を管理するための様々な他のユニットおよびハードウェア/ソフトウェア・ユーティリティを含みうるが、これらは本発明の一部を構成するものではないため、以下の点を除いて詳細に説明する必要がないことを理解されたい:本発明の目的のために、モデル化データの作成に必要な測定データは、各サンプルについて、異なる測定条件/スキームで得られた所定の数K(K≧1)の測定スペクトルを含む。概して、モデル化データの作成には、単一の測定スキーム(K=1)を用いた測定が十分でありうる。しかしながら、スペクトル測定、さらに様々な形状および幾何形状の容積測定サンプルを扱う場合には、異なる測定スキームに対応する複数のスペクトルを提供することが好ましい。
【0023】
いくつかの実施形態では、表面上および/または容積内に様々なマーキングを有しうる貴石、特にダイヤモンドの測定に適しているスペクトルデータは、X線またはガンマ線放射に対するサンプルの蛍光X線(XRF)反応を示しうる。したがって、放射線源14Aは、一次励起放射線によってサンプルを照射して、サンプルから二次蛍光X線(XRF)反応の放出を誘発するように構成されたX線またはガンマ線の放射線源であってもよく、放射線検出器14Bは、蛍光X線(XRF)を検出し、検出された放射線を示す測定スペクトルデータを生成するように構成されている。このような測定システムは、例えば、国際特許出願公開第2016/157185号、同第2017/175219号、同第2018/051353号に記載されており、これらは全て本出願の譲受人に譲渡されており、参照により本明細書に組み込まれる。
【0024】
異なる測定スキームを設定するパラメータ/条件には、以下の1つまたは複数が含まれうる:一次放射線のパラメータ(例えば、強度、コリメーション、スポットサイズ、一次放射線中の光子のエネルギー分布など);検出される二次放射線のフィルタリングパラメータ/条件;並びに、例えばサンプルの支持ユニット14Dを1つまたは複数の軸の周りで回転させることによって達成される(様々なサンプルの向きからの計数が単一のスペクトルに収集されるように)、放射線源および/または検出器に対するサンプルの向き。したがって、支持ユニット14Dは、放射線源および/または検出器に対する測定平面の位置を調整するだけでなく、測定平面内の自身の位置を調整するための1つまたは複数のドライバと関連していてもよいことを理解すべきである。また、放射線源14Aは、放射線源の動作パラメータ(例えば、一次放射線を放出する管の電流および/または電圧;および/またはフィルタ)を調整/変化させるための1つまたは複数のドライバと関連していてもよい;並びに、検出器14Bは、放射線検出器の入力におけるフィルタを動作/変化させるためのフィルタリングアセンブリと関連していてもよい。さらに、システムの性能を改善/最適化するために、放射線源および検出器の幾何学的特性は可変/調整可能でもよい。このような幾何学的特性は、以下の1つまたは複数を含みうる:X線源からサンプルの所定の表面領域までの距離;この表面領域から検出器までの距離(検出面);照射チャネルの角度方向(X線源から伝搬する一次X線ビーム(一次ビーム伝搬軸)とサンプルの表面との間の角度);および収集/検出チャネルの角度方向(サンプルから検出器に向かってくる二次X線放射(二次ビーム軸)とサンプルの表面との間の角度)。
【0025】
したがって、システムコントローラ14Cは、K個の測定スキームのそれぞれを画定し、したがって各サンプル上で測定セッションを動作するために、測定システムの要素の上記に例示されたパラメータ/条件のいずれかを変化/調整するように構成され、動作可能である。
【0026】
モデル化データの作成時には、いわゆる「参照サンプル」に対してスペクトル測定が行われるため、図中では測定データを「参照データ」と称する。参照サンプルとは、特定のグループとの関連性が知られているサンプルである。
【0027】
したがって、測定システム12は、N個の参照サンプルにスペクトル測定を適用するように動作し、各サンプルはK個の異なる測定スキームで測定される。これらのN個の参照サンプルは、M個のグループに関連するサンプルを含み、各g番目のグループ(g=1、...、M)は、所定の異なる(グループ固有の/関連する)特性を有する。したがって、概して、第1グループGはnサンプルを含み、第2グループGはnサンプルを含み、…、M番目のグループGはnサンプルを含み、ここでは以下である。
【数1】
【0028】
コントロールシステム10に(測定システムから直接または記憶装置から)入力されている(アクセスされている)参照データは、(NxK)個の測定データピースを含み、すなわち、以下である。
【数2】
【0029】
各データピースは、参照サンプルRSの分光感度を示す/対応するものである。したがって、図2Aにも示されているように、参照測定データには以下が含まれる:
グループGについて:
【数3】
グループGについて:
【数4】
...
グループGについて:
【数5】
【0030】
ここでは、指標は以下のようであることを理解されたい:(RS(i) 、ここで、上付きのインデックスiはi番目の測定スキーム(i=1、…、K)に対応し,下付きのインデックスnおよびgはg番目のグループのn番目のサンプルに対応する。したがって、例えば(RS(2) (3)は、測定スキーム2に従って測定されたグループ4のサンプル3の参照スペクトルを称する。
【0031】
分類される対象の未知のサンプルに対して同様の測定が行われるが、その場合、グループとのサンプルの関連性は未知であり決定されるものであることが理解されるべきであり、以下にさらに説明される。したがって、このような未知のサンプルの場合、測定されたスペクトルデータは、モデル化データの作成に使用された異なる測定スキームに対応するKスペクトルを含む。
【0032】
上述したように、コントロールシステム10は、コンピュータシステムとして構成されており、これは、データ入力および出力ユーティリティ16、18;メモリ20;およびデータプロセッサ22のような主要な構造および機能パーツ/ユーティリティを含む。データプロセッサは、モデル作成モジュール22A、フィッティングモジュール22B、グループ特性化モジュール22Cおよび重み付けモジュール22Dを含む。受信される参照スペクトルデータは、典型的にはメモリ20に格納され、その後、プロセッサ22によって使用されてモデル化データを作成する。
【0033】
モデル作成モジュール22Aは、(NxK)個の測定された基準スペクトルを処理して、K個の測定スキームのそれぞれについてモデルを決定する、すなわち、サンプルのスペクトル応答を記述するK個のモデルを決定するように予めプログラムされている。このモデルは、スペクトル線の形状を有し、それぞれの測定スキームに関連する所定の関数に基づいている。そのようなスペクトル線の形状の所定の関数は、例えば、ローレンツ関数、ガウス関数またはフォークト関数を含むことができ、そのパラメータは、線の位置、最大の高さおよび幅(または半値幅)を含む。以下にさらに説明されるように、モデルは、このようなスペクトル線の形状の所定の関数、および、特定のピースワイズ線形関数を含んでいてもよい。モデル作成処理については、図3を参照してさらに以下でより具体的に説明する。
【0034】
フィッティングモジュール22Bは、反復的なフィッティング手順において、測定された参照スペクトルのそれぞれを、対応する測定スキームのモデルと比較するように構成されている。フィッティングの際には、ベストフィット条件を介してモデルパラメータが最適化され、各参照スペクトルに対してそのベクトル表現が決定される。言い換えれば、参照サンプルのそれぞれは、それぞれの成分ベクトルによって表される。このようなベクトル成分表現は、すべてのK個の測定スキームに対して結合されたものであり、これがサンプルの表現であることが理解されるべきであり、以下でさらに具体的に説明される。
【0035】
グループ特性評価モジュール22Cは、グループの特性ベクトルを決定するように動作する。この目的のために、モジュールは、M個のグループのそれぞれの1つに対する参照サンプルのそれぞれの対応関係を示すデータに基づいて、サンプルの成分ベクトルを分析する。
【0036】
重み付けモジュール22Dは、参照サンプルのすべての成分ベクトルをそれぞれのグループに関連付けるための複合尤度の最大値に対応するベクトル成分の重みパラメータを決定するように構成される。これにより、重みの共通ベクトルが決定される(すべてのグループに共通)。
【0037】
そのようにして決定されたデータは、以下を含むモデル化データを形成する:(i)K個の測定スキームのそれぞれに対するK個のモデルを示すデータ、(ii)グループの特性ベクトルを示すデータ、および(iii)すべてのグループに対して重みの共通ベクトルを示すデータ。
【0038】
次に図3を参照し、これは、上述のようにして得ることができかつM個のグループに関連するN個の参照サンプルについてK個の測定スキームで得られた参照スペクトルを含む、測定された参照データからモデル化データを生成/作成するための本発明の方法のフロー図100を例示する。概して、同じサンプルから、同じ測定スキームを用いて複数のスペクトルが得られることに留意すべきである。
【0039】
したがって、参照測定データが提供され(工程102)、測定システムまたは別個の記憶装置(すなわち、測定データプロバイダ)のいずれかでアクセスすることができる。必要に応じて、測定スペクトルの前処理を行ってもよい。これは、各スペクトルにおいて、モデル化および/または分類が行われる関心領域を決定すること、および/または、スペクトルからバックグラウンドノイズおよび/またはアーチファクト信号を識別および除去することを目的とすることができる。選択された関心領域は、概して、スペクトルが測定される測定条件によって影響を受ける可能性がある。ノイズおよびアーチファクト信号には、例えば、結晶性の材料で作製されたサンプルの場合、サンプルの結晶構造に起因するX線回折ピークが含まれうる。さらに、XRFスペクトルの場合、これらのアーチファクト信号には、放射線源、検出器、またはサンプルの周辺に見られる物質(サンプル自体にはない)に由来するピーク、並びに、パイルアップピークおよびバックグラウンド計数または他のプロセスに由来する信号が含まれうる。ノイズ、および/またはアーチファクト信号を除去するためにスペクトルを処理する目的で、任意の既知の適切な技術を使用することができ、例えば、本出願の譲受人に譲渡され参照により本明細書に組み込まれている上述の国際公開第2016/157185号に記載されている方法を使用することができる。
【0040】
したがって、モデル化データ作成のために処理される参照測定スペクトルは、前処理されたスペクトルであってもよく、また、サンプルに関連するスペクトルまたはサンプル内の以前に画定された関心領域のスペクトルであってもよい。このような前処理されたまたはされていない参照スペクトルデータが処理および分析されて、参照スペクトルの取得に使用されるK個の測定スキームに対応するK個のモデルを作成する(工程104)。この目的のために、各測定スキームについて、平均化されたスペクトルが得られる、すなわち、同じ測定スキームに対応する参照スペクトルについて、これらのスペクトルをすべて合計しサンプル数で割ることによって平均化が行われる。より詳細には、各i番目の測定スキーム(i=1、...、K)について以下である:
【数6】
ここで、
【数7】
は以下の測定スキームに対応する合計スペクトルである:
【数8】
【0041】
したがって、K個のそのような平均化されたスペクトルが決定される。各グループの平均化されたスペクトルはさらに、スペクトル線の形状(例えばガウス)を有する所定の基底関数BFおよびバックグラウンド関数AF(例えばピースワイズ線形関数またはピースワイズ多項式関数)に従って変換Tを平均化スペクトルに適用することによって、対応するモデル(いわゆる「混合モデル」)を作成するよう処理される。より詳細には、各i番目の測定スキームに対して以下である:
【数9】
【0042】
例えば、そのような変換の結果は、以下のようであり:
【数10】
ここで、AF=B(x)はバックグラウンド関数であり、BF=P(x)は基底関数であり、これは通常は主関数の領域の間隔xにおいて異なるピークを持つ複数のサブ関数(例えばガウス)の形をしており、インデックスjは基底関数のj番目のサブ関数(特定のガウス/ピークを持つ)に対応している。
【0043】
したがって、K個の測定スキームに対するK個の混合モデルがそれぞれ決定される(工程104):
【数11】
【0044】
本発明の目的のために、スペクトル測定データを考慮する場合、モデルはピーク関数およびバックグラウンド関数を持つように選択される。ピーク関数は、対応する平均化スペクトルのピークを表し、これは一般的にサンプル内の物質および元素に関連するが、さらに、サンプル、サンプルの近傍(例えば、サンプルカップ内)、放射線源または検出器内の様々な他の現象およびプロセスに関連しうる。例えば、放射線源にプリセットされた異物に対応しうるアーチファクトピークである。
【0045】
特定の非限定的な実施例では、測定されたスペクトルはX線スペクトルであり、アーチファクトピークには、コンプトンピーク、レイリーピーク、パイルアップピーク、制動放射、並びに他のプロセスに由来するピークが含まれうる。バックグラウンド関数は、対応する平均化スペクトルのバックグラウンドを表す。
【0046】
したがって、特定のi番目の測定条件/スキームの下で測定された平均化スペクトルに対応するスペクトルモデルは、以下のような形式であってもよい:
【数12】
ここで、B(x)はバックグラウンド関数であり、(入射光子の)エネルギーxについてカウント数またはカウント毎秒(CPS)に対するバックグラウンドの寄与を表す;P(x)はピーク関数であり、光子エネルギーxのカウント数またはCPSに対するピークの寄与を表す。
【0047】
ピーク関数は、一連のパラメータによって定義されてもよい。一例として、ピーク関数はガウス関数
【数13】
であり、その高さh、幅σ、および中心位置xなどのピークのパラメータ(空間的特徴)によって決定される。
【0048】
別の実施例では、ピーク関数はローレンツ関数である。ある実施例では、バックグラウンド関数B(x)は、区分けされた多項式関数によって定義されるスプラインである。ある実施例では、バックグラウンド関数は、指数多項式である。
【0049】
次いで、このようにして決定されたK個のモデルを用いて、各参照スペクトルについて、対応する成分ベクトルを決定する(工程106)。これは、i番目の測定スキームに対応するg番目のグループのn番目のサンプルの各参照スペクトル(R(i) (i=1、…、K)を、最良のフィッティング条件が得られるまで、選択されたモデルパラメータ(例えば、h、参照スペクトルのピークに主に対応するピークの高さ)の値を変化させながら、それぞれのi番目のモデルにフィッティングすることによって行われる。これにより、特定の測定スキームの特定のサンプルの参照スペクトルに対応するパラメータセットが得られる。次いで、特定のサンプルに対応するK個のパラメータセットをすべて組み合わせて、参照サンプルごとに単一のパラメータベクトルを作成する。これは、サンプルに適用されるすべての測定スキームについて、参照サンプルに関連する/参照サンプルを表すパラメータの「複合」ベクトルであることが理解されたい。
【0050】
より詳細には、モデルスペクトルのピークのパラメータを測定スペクトルに調整することによってフィッティングを行う。そのために、ピーク関数のパラメータの1つまたは複数を選択し、測定された参照スペクトルとモデルとの間の一致が得られるように設定する。これは、(所定の測定条件の)モデルと、選択されたピーク関数のパラメータによって決定されかつこれらのパラメータの不確実性にも依存しうる測定されたスペクトルとの間の距離の尺度を最小化するように、選択されたパラメータを設定することによって行うことができる。
【0051】
選択されたパラメータがピーク関数の高さである実施例では、モデルと測定されたスペクトル(どちらも同じ測定条件に対応する)の間の距離は次のように定義される:
【数14】
ここで、yはエネルギーrにおけるスペクトルの測定値である;Tは同じエネルギーにおけるモデル(変換関数)の対応する値である;そして、Δyは測定値の不確実性(測定の種類による)である;T(モデル)の値はベストフィット条件によって最適化される。カウントまたはカウント毎秒で測定されたピーク高さについて、不確実性は√yである。
【0052】
ある実施例において、フィッティングは、例えば非線形最小化によって反復的に行われる。設定されるピーク関数P(モデルTに含まれる)の1つまたは複数のパラメータは、特定のサンプルから特定の測定スキームの下で取られたスペクトルに対応するパラメータのベクトルにおける成分jとして定義される。サンプルsに対応する成分ベクトルは、サンプsに対応しK個の異なる測定条件およびバックグラウンドを特徴づけるパラメータ下で取られたすべてのスペクトルからのすべてのパラメータ/成分を、単一の複合成分ベクトルに結合することによって得られる。
【0053】
ある実施例において、モデルのピークを表すピーク関数はガウス関数であり、サンプルのスペクトルをモデルにフィッティングさせるために設定されるパラメータはガウスの高さhである。したがって、n番目のサンプルに対応する成分のベクトルは、次のような形になる:
【数15】
ここで、パラメータ/コンポーネントセットh、h、hのそれぞれは、異なる測定条件で測定されたスペクトルに対応していてもよく、bはバックグラウンドパラメータである。
【0054】
したがって、N個の測定された参照サンプルを表すN個の成分ベクトル
【数16】
が得られる(工程106)。これは図2Bにも示されており、これは、参照サンプルをグループに関連付けて、サンプルのスペクトルデータを、サンプルを表す成分のベクトルに変換したことを示す。
【0055】
このようにして得られたサンプルに関連する成分ベクトル、および、参照サンプルのグループへの関連性に関する既知のデータを用いて、各グループに対する特性ベクトルCVを決定する、すなわち、M個のグループに対するM個のそのような特性ベクトルCV、CV、…、CVを決定する(工程108)。この目的のために、成分のベクトルを処理して、各サンプルがグループ(サンプルのクラスタ)に属する可能性を推定するための式を得る。この推定は以下のように行うことができる。
【0056】
基準となる分類されたサンプル(g番目のグループに属する)に対応する成分のベクトルの各成分jについて、グループ平均(vj、g)およびグループ標準偏差(σj、g)を評価する。平均値および標準偏差は、成分ベクトル中の各成分の値の広がりを表す距離関数を画定する。上述したように、グループの特性ベクトルは、同一グループの参照サンプルを表す成分ベクトル中の成分の平均値を含んでいる。距離関数は、平均値および標準偏差に関連付けられており、次いでこれらの値を用いて、分類された各サンプルsが各グループに属する尤度L(g)について第1の値を計算する。これは、成分ごとに行うことができ、尤度は、成分ベクトルの各成分(サンプルsに関する)がg番目のグループに属する確率、P(j、g、w)の積として定義される:
【数17】
【0057】
確率P(j、g、w)は、平均値vj、gおよび標準偏差σj、gに依存し、非負の重みwにも依存するが、初期値は1に設定されている。
【0058】
ある実施例において、確率は以下のように定義されうる:
【数18】
【0059】
次に、すべてのグループに共通する重み付けベクトルを決定する(工程110)。この目的のために、距離関数の重みパラメータwは、参照サンプルの成分ベクトルのすべてをそれぞれのグループに関連付けるための複合尤度を最大にする条件に対応して決定される。これは、参照サンプルの成分のベクトルとグループの特性ベクトルとの間の距離関数に基づいて決定される。
【0060】
より具体的には、重みwの最適(最終)値は、分類されたサンプルがグループに正しく分類される確率Pcorrを最適化することで得られる。正しく分類される確率は、サンプルがグループに属する確率の、グループ内のすべてのサンプルに対する積のすべてのグループに対する積で表すことができる:
【数19】
ここで、サンプルsがグループgに属する確率は、正規化された尤度として定義される:
【数20】
【0061】
言い換えれば、Pcorrの値を最大化するように重みの値を設定する。最適化処理は、任意の非線形最適化手法(例えば、Levenberg-Marquardt、BFGS、GRG、進化的手法)によって行うことができる。
【0062】
上述のように、重みのベクトルwは、グループのM個の特性ベクトルCV、CV、...、CVと、K個の測定スキームに対応するK個のモデルとともに、未知/未分類の関心対象サンプルの分類に使用するモデル化データとして格納される。
【0063】
これに関連して、次に図4が参照され、これは、未分類のサンプルを分類されたサンプルのグループに関連付けるための、本発明の例示的な方法のフロー図200を示す。
【0064】
このために、K個の測定スキームに対応して、対象のサンプルの未加工測定スペクトルデータが提供される(工程202)。このような測定データは、上述のように、測定システム14を用いて得られてもよい。測定データは、測定システムから直接、または別の記憶装置から(概して、測定データプロバイダ12から)提供されてもよい。測定データは、K個の測定スキームの下で対象のサンプルのK個の測定スペクトル:MS(1)、MS(2)、...MS(K)にそれぞれ対応するK個のデータピースを含む。
【0065】
測定データは、上述のモデル化データを用いて、モデルベースの解析/処理が行われる。より詳細には、K個の測定スペクトルから各i番目の測定スペクトルMS(i)を、記憶されたK個のモデルのうちそれぞれi番目のモデルに、ベストフィット条件が得られるまでフィッティングし、K個の測定スペクトルに対するこれらのベストフィット条件のパラメータを用いて、K個のすべての測定スキームに対するサンプルの複合ベクトル表現CVRを作成する-工程204。次に、この複合ベクトル表現CVRを、グループの特性ベクトルCV、CV、…CVにフィッティングして、グループ関連の最大尤度を決定する-工程206。より詳細には、サンプルの複合ベクトル表現CVRについて、各グループに属する尤度L(g)が決定され(重みに対する最終値を用いて)、その尤度が最大となるグループがサンプルの関連/相関グループとして選択される(工程208)。この目的のために、重みの共通ベクトルを持つ上述の距離関数を使用して、サンプルの複合ベクトル表現の各グループの特性ベクトルへの距離を決定し、決定された距離が最小となるグループにサンプルを関連付ける。
【0066】
モデル(モデルスペクトル)を使用することで、次元を下げることができることを理解されたい。実際、未加工データ(測定されたスペクトル)には、約2000個のスペクトルチャネルのカウントまたはカウント毎秒が含まれ、それぞれが(入射光子の)エネルギーバンドに対応している。このモデルでは、特定のピークに属するこれらのチャンネルをすべてグループ化することで、ピークの数を大幅に減らすことができる(それぞれのピークは、例えばガウス関数として上述される)。パラメータの数を大幅に減らすことで、計算能力、時間などのリソースを削減することができる。さらに、モデルベースのアプローチによって、ノイズを低減することができる。チャネル内のカウント数hのノイズは√hであるため、複数のチャンネルのカウントを取得すれば、信号対雑音比を向上させることができる。
【0067】
本発明はまた、サンプル間の対応関係や相互関係に関する事前の知識を持たずに、サンプルをクラスタリングする、すなわちサンプルをグループやクラスタに分類するための新規技術を提供する。この技術では、「既知の」参照サンプルのグループ/クラスタへの関連付けを使用して準備されたモデル化データは存在しない。サンプルは、サンプルから放出される電磁信号の1つまたは複数のスペクトルを調べることによって分類される。これは、例えば、X線やガンマ線放射に対するサンプルの蛍光X線反応でもよい。
【0068】
これに関連して、図5を参照し、これは、サンプルをクラスタリングするための本発明の方法のフロー図300を示す。サンプルの測定データは、各サンプルからの1つまたは複数のスペクトルを含んで提供され、ここで、上述したモデリングおよび分類技術と同様に、サンプルごとの測定データは、K個の異なる測定条件/スキームの下で測定されたK個のスペクトルを含む(工程302)。したがって、N個のサンプルに関する測定データは、(NxK)個のスペクトルを含む:
MS (1)、MS (K)、...、MS (1)、MS (K)
【0069】
必要に応じて、上述の技術と同様に、測定スペクトルを処理して、各スペクトルに、クラスタリングが処理される関心領域を画定し、スペクトルからバックグラウンドノイズおよび/またはアーチファクト信号を識別および除去する。
【0070】
測定データは、上述の手法と同様に、平均化スペクトルを決定するために処理される(工程304)。この目的のために、1つまたは複数の和スペクトルが決定され、これらはそれぞれ、同じ測定スキームで測定されたすべてのスペクトルのカウント数(検出器での光子のカウント数)またはカウント毎秒(CPS)の合計、対、サンプルから到達する入射光子の測定周波数(エネルギー)に対応する。
【0071】
平均化スペクトルを使用して、図1~3を参照して上述した方法で、K個の測定スキームに対応するモデルを作成する(工程306)。各測定スペクトルは、対応するモデル(同じ測定スキームのスペクトルモデルである)にフィッティングされ、各サンプルについて、成分ベクトルが(上述した技術と同様に)決定される-工程308。
【0072】
これらの成分のベクトルを使用して、サンプルをグループに反復的に分類する-工程310。分類は、クラスタリングアルゴリズムを用いて実施してもよい。ある実施例では、クラスタリングは、セントロイドベースのクラスタリングアルゴリズムによって実施されてもよい。より詳細には、セットされたサンプルは、グループに分割され、グループの数Mは、サンプルに関する何らかの事前の知識(例えば、サンプルは既知の数のソースに由来しうる)に基づいて、またはランダムに決定される。サンプルのグループへの割り当ては、ランダムに行われてもよい。サンプルの各クラスタのセントロイドは、クラスタ内のサンプルに関連する成分のベクトルの各成分の平均値を評価することによって決定される。その平均値のベクトルをクラスタのセントロイドと画定する。
【0073】
特定の実施例では、K-means型アルゴリズムによってクラスタリングが行われ、クラスタリングは反復的に進行する。各反復において、パラメータの各ベクトルの各セントロイドへの距離が評価される。グループvjgのセントロイドからのベクトルvの距離は、ユークリッド距離または正規化ユークリッド距離として画定され、例えば、各成分の距離は、その成分のグループ標準偏差で正規化される:
【数21】
【0074】
その後、成分のベクトルは、そのクラスタ(すなわちセントロイド)までの距離が最短であれば、異なるクラスタに再割り当てされてもよい。ベクトル間の距離は、ユークリッド距離として画定されてもよい。さらに、階層型クラスタリング、密度ベースのクラスタリングなどのような、他のクラスタリング方法を使用してもよい。
【0075】
したがって、本発明は、サンプルの測定スペクトルデータをモデルベースで分析して、サンプルを関連/類似サンプルのグループに分類/関連付けるための新規技術、並びに、モデル化データ作成のための新規技術を提供する。本発明の技術は、サンプル/オブジェクトのクラスタリング/グループ化を扱う様々なアプリケーションに使用することができる。データ解析システムは、スペクトル測定システムと一体化していても、または別のコントロールシステムにあってもよく、また、データ解析プロセスは、いわゆる「オンライン」またはオフラインモードで実行されてもよい。
図1
図2A
図2B
図3
図4
図5
【国際調査報告】