IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツングの特許一覧

特開2023-103189異種のデータ点の距離尺度を決定するための距離メトリックを決定するための方法及び装置
<>
  • 特開-異種のデータ点の距離尺度を決定するための距離メトリックを決定するための方法及び装置 図1
  • 特開-異種のデータ点の距離尺度を決定するための距離メトリックを決定するための方法及び装置 図2
  • 特開-異種のデータ点の距離尺度を決定するための距離メトリックを決定するための方法及び装置 図3a
  • 特開-異種のデータ点の距離尺度を決定するための距離メトリックを決定するための方法及び装置 図3b
  • 特開-異種のデータ点の距離尺度を決定するための距離メトリックを決定するための方法及び装置 図3c
  • 特開-異種のデータ点の距離尺度を決定するための距離メトリックを決定するための方法及び装置 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023103189
(43)【公開日】2023-07-26
(54)【発明の名称】異種のデータ点の距離尺度を決定するための距離メトリックを決定するための方法及び装置
(51)【国際特許分類】
   G06N 20/00 20190101AFI20230719BHJP
【FI】
G06N20/00 130
【審査請求】未請求
【請求項の数】9
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023002899
(22)【出願日】2023-01-12
(31)【優先権主張番号】10 2022 200 288.1
(32)【優先日】2022-01-13
(33)【優先権主張国・地域又は機関】DE
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【弁理士】
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】コンラート グロー
(72)【発明者】
【氏名】マティアス ヴェールレ
(57)【要約】      (修正有)
【課題】複数の異種の変数クラスを有する1つのデータ点までの距離を決定するための距離メトリックを決定する方法及び装置を提供する。
【解決手段】方法は、夫々1つのデータ点をラベルに対応付けるものであり、訓練集合の訓練データ点と、検証集合の検証データ点とに分割されている訓練データセットを提供するS1と、データに基づいたシステムモデルを、訓練集合を用いて訓練して、当該システムモデルが、データ点に夫々1つのモデル出力を対応付けるようにするS2と、検証集合の夫々の検証データ点毎に、変数クラスの各々についてのシステムモデルの品質尺度と、該当する変数クラスに関して個々に特定される、最近傍の訓練データ点までの距離値とを決定するS3~S4と、変数クラスの各々についての最大の品質尺度の距離値を決定するS5と、変数クラスの各々についての最大の品質尺度の距離値に依存して、距離メトリックを決定するステップと、を有する。
【選択図】図2
【特許請求の範囲】
【請求項1】
複数の異種の変数クラスを有する1つのデータ点までの距離を決定するための距離メトリックを決定するためのコンピュータ実装された方法であって、
・訓練データセットを提供するステップ(S1)であって、前記訓練データセットは、それぞれ1つのデータ点をラベルに対応付けるものであり、訓練集合の訓練データ点と、検証集合の検証データ点とに分割されている、ステップ(S1)と、
・データに基づいたシステムモデル(4)を、前記訓練集合を用いて訓練して、当該システムモデル(4)が、データ点にそれぞれ1つのモデル出力を対応付けるようにするステップ(S2)と、
・前記検証集合のそれぞれの検証データ点ごとに、前記変数クラスの各々についての前記システムモデル(4)の品質尺度と、最近傍の訓練データ点までの距離値とを決定するステップ(S3,S4)であって、前記最近傍の訓練データ点までの前記距離値は、該当する変数クラスに関して個々に特定される、ステップ(S3,S4)と、
・前記変数クラスの各々についての最大の品質尺度の距離値を決定するステップ(S5)と、
・前記変数クラスの各々についての前記最大の品質尺度の前記距離値に依存して、前記距離メトリックを決定するステップと、
を有する方法。
【請求項2】
それぞれの前記検証データセットについての前記品質尺度は、前記システムモデル(4)のモデル出力と、該当する前記検証データセットの前記ラベルとの間の差に依存して決定される、
請求項1に記載の方法。
【請求項3】
1つのデータ点は、それぞれ個々の物理的変数、物理的変数の時系列、画像生成装置の画像データ、又は、画像生成装置の動画データに相当する複数の変数クラスを含み、
前記変数クラスのうちの少なくとも2つは、互いに50%よりも大きく相違している対応する値の値範囲を有する、
請求項1又は2に記載の方法。
【請求項4】
多次元の変数の場合には、該当する前記変数クラスに関する前記最近傍の訓練データ点までの前記距離値が、ユークリッド距離として特定される、
請求項1乃至3のいずれか一項に記載の方法。
【請求項5】
前記変数クラスの各々についての前記最大の品質尺度の前記距離値は、該当する前記変数クラスに関する前記最大の距離値の5%から95%までの間の範囲内のみにおいて決定される、
請求項1乃至4のいずれか一項に記載の方法。
【請求項6】
前記距離メトリックを使用して、
さらなるデータ点から評価されるべきデータ点までの、当該距離メトリックを用いて決定された距離尺度に基づいて異常が決定され、又は、
訓練データ空間内の空所を発見するために、若しくは、前記訓練データ空間からのデータ点の外れ値を決定するために、データ点が評価される、
請求項1乃至5のいずれか一項に記載の方法。
【請求項7】
請求項1乃至6のいずれか一項に記載の方法を実施するための装置。
【請求項8】
コンピュータプログラム製品であって、コンピュータによってプログラムが実行された場合に、請求項1乃至6のいずれか一項に記載の方法のステップを前記コンピュータに実行させるための命令を含むコンピュータプログラム製品。
【請求項9】
コンピュータによって実行された場合に、請求項1乃至6のいずれか一項に記載の方法のステップをコンピュータに実行させるための命令を含む機械可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特に異常識別等のための、例えば最近傍(Nearest-Neighbor)法の場合のように、データ点を評価するために距離メトリックを利用する方法に関する。特に、本発明は、複数の物理的変数を有する異種のデータ点の場合における距離メトリックの決定に関する。
【背景技術】
【0002】
背景技術
技術的システムの動作時には、通常、システム状態又は状態推移が評価される。システム状態又は状態推移は、通常、所定の時間刻み、即ち、ある時点又は時間区分に関してセンサによって又はモデルに基づいて特定され、さらなる評価のためのデータ点として提供される。そのようなデータ点の評価は、例えば物理又はデータに基づいた評価モデルを用いて実施可能である。
【0003】
さらなる基準データ点に関連してデータ点を評価するためのさらなる手段は、例えば、1つ又は複数の基準データ点から評価されるべきデータ点までの距離尺度を決定するための距離メトリックに基づいた最近傍法を使用することにある。
【発明の概要】
【発明が解決しようとする課題】
【0004】
発明の開示
本発明によれば、請求項1に記載の、複数の異種の変数クラスに対するデータ点の距離を決定するための距離メトリックを決定するための方法と、独立請求項に記載の対応する装置とが企図されている。
【0005】
さらなる実施形態は、従属請求項に記載されている。
【課題を解決するための手段】
【0006】
第1の態様によれば、複数の異種の変数クラスを有する1つのデータ点までの距離を決定するための距離メトリックを決定するための方法であって、
・訓練データセットを提供するステップであって、訓練データセットは、それぞれ1つのデータ点をラベルに対応付けるものであり、訓練集合の訓練データ点と、検証集合の検証データ点とに分割されている、ステップと、
・データに基づいたシステムモデルを、訓練集合を用いて訓練して、当該システムモデルが、データ点にそれぞれ1つのモデル出力を対応付けるようにするステップと、
・検証集合のそれぞれの検証データ点ごとに、変数クラスの各々についてのシステムモデルの品質尺度と、最近傍の訓練データ点までの距離値とを決定するステップであって、最近傍の訓練データ点までの距離値は、該当する変数クラスに関して個々に特定される、ステップと、
・変数クラスの各々についての最大の品質尺度の距離値を決定するステップと、
・変数クラスの各々についての最大の品質尺度の距離値に依存して、距離メトリックを決定するステップと、
を有する方法が企図されている。
【0007】
データ点は、通常、それぞれ異なる変数クラス、即ち、指示又は物理的変数に対応付けられた複数の値を有する。多種多様な方法は、さらなる基準データ点に関連してデータ点を評価するために距離メトリックを利用して、基準データ点に対する評価されるべきデータ点の位置を決定する。
【0008】
距離メトリックとして、評価されるべきデータ点における変数が同種である場合には、通常、ユークリッド距離又は距離尺度をL1ノルム又はL2ノルムの形態で表すことができる。これに対して、基礎となる物理的変数の値がそれぞれ異なる値範囲内に位置するようなデータ点の場合に、適当な距離メトリックを決定するためには、従来の距離メトリックを容易に使用することはできない。例えば、データ点における変数の値範囲が、評価されるべきデータ点におけるさらなる変数とは著しく異なっている場合には、距離尺度は、通常、値範囲の最大の上限又は最小の下限を有する値範囲を有する物理的変数によって支配される。このことは、通常、後続する評価の際に、例えば最近傍法を適用する際に、不所望な結果をもたらす。
【0009】
技術的システムを監視又は制御するために、技術的システムのその時々の現在の状態を指示するセンサシステムを用いて物理的な測定変数が検出される。測定変数の検出は、例えば、圧力センサ、温度センサ、加速度センサ、振動センサ、放射センサ、質量流量センサ、及び、カメラ、ライダセンサ又はレーダセンサのようなセンサを用いて実施され、これらの測定変数は、所与のサンプリング刻みで読み出される。1つのサンプリング刻み内においては、検出領域に関する個々の物理的変数や、個々のモデル値だけでなく、物理的変数の時系列、又は、1つ若しくは複数のカメラに基づいた画像データ若しくは動画データも、それぞれの変数クラスとして検出することができる。個々の変数クラスについてのこのようにして検出された測定データは、通常、さらなる評価のためにデータ点として統合されて、後続処理される。
【0010】
したがって、1つのデータ点は、それぞれ個々の物理的変数、物理的変数の時系列、画像生成装置の画像データ、又は、画像生成装置の動画データに相当する複数の変数クラスを含み得る。
【0011】
可能な後続処理は、最近傍法において評価することにあり、ここでは、該当する評価されるべきデータ点から他の基準点までの距離を決定しなければならない。したがって、その結果として得られる距離尺度に依存して、異常検出時の異常の有無に関する判定、又は、例えば訓練データ点として使用される場合のデータ点の品質に関する判定を実施することができる。距離尺度の決定は、従来、通常はユークリッド距離に基づいて構成されている距離メトリックを用いて実施される。
【0012】
データ点に、複数の異なる変数クラス、即ち、物理的な状態変数、物理的な推移変数、及び/又は、画像データがマッピングされる場合には、これらの変数は、それぞれ異なるフォーマットを有し得るものであり、それらの成分は、それぞれ異なる値範囲において定義されている。例えば、データ点は、時系列データ、画像データ、動画データ、及び、状態変数の個々のスカラ値の形態の変数クラスを含み得る。例えば、データ点xを、以下のフォーマット
【数1】
によって表すことができ、ここで、a,bは、状態変数のそれぞれの値に対応する個々の値に相当し、y1・・・yn及びz1・・・zmは、相応の物理的変数の時間区分1・・・n及び1・・・mの時系列データに相当し、
【数2】
は、画像データの画素のマトリクスに相当し、なお、a,b,y,z及び
【数3】
は、それぞれ1つの変数クラスを表す。
【0013】
したがって、これらの変数クラスは、それぞれ異なる値範囲内に位置する可能性があり、したがって、距離尺度が従来のように決定される場合には、通常、最も大きい値範囲を有する状態変数が支配的になる。
【0014】
距離メトリックの適合、即ち、距離尺度を決定するための測定方法の適合は、簡単な手法では不可能である。なぜなら、それぞれの状態変数がシステム挙動に及ぼす影響が既知でないからである。これに関連して、上記の方法は、それぞれの状態情報がシステム挙動に及ぼす影響を評価する距離メトリックを決定することを提案している。このために、上記の方法は、まず始めに、データ点を、相応の測定されたシステム変数に、又は、その他の手法により決定されたシステム変数にマッピングする、データに基づいたシステムモデルを提供することを企図している。即ち、システムモデルは、1つのデータ点が所定の時間刻み、時点、又は、時間区分に関する状態を表すような技術的システムを評価するために使用される。
【0015】
即ち、システムモデルは、距離関数を評価するための手段を提供する。近傍のデータ点は、より大きい距離を有するデータ点よりも、平均してより高い品質を有するべきである。即ち、訓練されるシステムモデルに対する距離関数と品質関数との間に(弱い)相関を予期することができる。この相関は、システムモデルがデータによって訓練されていない場合には予期することができない。
【0016】
システムモデルの訓練は、以前に訓練データセットの検証集合が取り出された訓練データセットの訓練集合に基づいて実施される。システムモデルは、収束するまで、即ち、収束基準が満たされるまで訓練される。即ち、品質関数の値が平均してもはや実質的に変化しなくなるまで訓練される。
【0017】
検証集合は、通常のスキームに従って選択可能であり、即ち、例えば、訓練された品質関数を最終的に評価するために、訓練集合の訓練データ点60%と、検証集合の検証データ点20%と、テストデータ点20%とを有する60/20/20の配分を選択可能である。しかしながら、他の分配も考えられる。メタパラメータが存在する場合には、これも考慮することができる(例えば、訓練データを、ミュンヘン及びシュトゥットガルトからのみとし、検証データをマグデブルクからとすることができる)。
【0018】
それぞれの検証データセットに対する品質尺度を、該当する検証データセットのラベルに関するシステムモデルのモデル出力との間の差に依存して決定することができる。
【0019】
以下においては、検証集合の検証データセットは、相応の距離メトリックを決定するために使用される。このために、それぞれの検証データ点ごとに、品質尺度が、所与の品質関数を用いて特定される。品質関数は、最も簡単なケースにおいては、検証データ点におけるシステムモデルによるモデル評価と、該当する検証データセットによって入力されたシステム変数との間の偏差を表すことができる。さらなる考えられる品質尺度は、訓練されたモデルの損失と、予測のソフトマックス確率とである。
【0020】
以下においては、それぞれの検証データ点ごとに、訓練集合の最近傍の訓練データ点までの距離値が決定される。最近傍の訓練データ点は、それぞれデータ点の複数の変数クラスのうちの1つのみに関して決定される。最近傍の訓練データ点は、それぞれの変数クラスにおける検証データ点までの最小距離値を有する訓練データ点に相当する。距離値は、単純な差に基づいて、又は、多次元の変数の場合にはユークリッド距離によって、決定可能である。このことは、検証データセットのデータ点における変数の各々について実施される。
【0021】
例えば、検証データセット又は訓練データセットが、圧力信号、時間指示(スカラ)、及び、温度指示(スカラ)の時系列ベクトルからなる場合には、それぞれ全ての検証データセットに関する圧力信号、時間指示及び温度指示に対して、該当する変数のそれぞれの次元に関して、即ち、2つのそれぞれ考察されるデータ点の圧力の時系列ベクトル間の距離(ユークリッド距離として)に関して、2つのそれぞれ考察されるデータ点の時間指示の時間的な距離に関して、又は、2つのそれぞれ考察されるデータ点の温度指示の距離に関して、最近傍の訓練データ点までの距離が特定される。
【0022】
このようにして、それぞれの検証データセットごとに、かつ、考察されるデータ点におけるそれぞれの変数クラスごとに、品質及び距離値が得られる。ここで、変数クラスの各々について、エッジ効果を取り除いて、即ち、例えば、特定された最大の距離値の、例えば5%から95%までの間の距離値の値範囲内において、品質の最大値が決定され、該当する対応する距離値が、相応の変数クラスに対応付けられる。
【0023】
ここで、このようにしてデータ点の変数クラスに関して特定された距離値を、それぞれの変数クラスの重みに対応付けることができる。このために、特定された対応付けられた距離値を1に正規化することができ、この距離値を、ユークリッド距離を特定する際に、変数クラスに対応付けられたそれぞれの平方項に適用するために利用することができる。
【0024】
このようにして、任意の異種のフォーマットのデータ点に対する距離尺度を決定するための距離メトリックが得られる。
【0025】
このようにして特定された距離メトリックを用いて特定されたそのような距離尺度を使用して、例えば、さらなるデータ点から評価されるべきデータ点までの距離に基づいて異常を決定することができる。さらに、そのような距離尺度を使用して、訓練データ空間内の空所又は訓練データ空間からのデータ点の外れ値を決定するために、ひいては、相応のモデルのさらなる訓練のための訓練データセットを決定するために、訓練データ空間を分析することによってデータ点又はデータ点セットを評価することもできる。
【0026】
さらなる態様によれば、上記の方法を実施するための装置が企図されている。
【0027】
以下においては、添付の図面に基づいて実施形態をより詳細に説明する。
【図面の簡単な説明】
【0028】
図1】ある時点又は時間区分における技術的システムに関する状態情報を検出するために使用される、一連のセンサを有する技術的システムの概略図である。
図2】技術的システムの距離メトリックを決定するための方法を説明するためのフローチャートである。
図3a】品質尺度の分布と、それぞれの変数クラスに限定された距離値とを表すための複数の異なる変数クラスに関する線図である。
図3b】品質尺度の分布と、それぞれの変数クラスに限定された距離値とを表すための複数の異なる変数クラスに関する線図である。
図3c】品質尺度の分布と、それぞれの変数クラスに限定された距離値とを表すための複数の異なる変数クラスに関する線図である。
図4】センサシステムと、図1に対応する異常識別とを有する噴射システムを示す図である。
【発明を実施するための形態】
【0029】
実施形態の説明
図1は、一連のセンサ2を有する技術的システム1の概略図を示し、これらのセンサ2は、技術的システム1の状態情報を検出するように構成されている。例えば、これらのセンサは、圧力センサ、温度センサ、加速度センサ、振動センサ、放射センサ、質量流量センサ、及び、カメラ、ライダセンサ又はレーダセンサ等を含み得る。状態情報は、フォーマットを有し、ある時間刻みに関して、即ち、ある時点又は時間区分に関して、スカラ変数として、時系列情報として、変数として、画像情報として、又は、動画情報として、存在し得る。
【0030】
センサデータを後続処理するために、これらのセンサデータは、所定の時点に又は所定の時間区分において検出されて、フォーマット化ブロック3において、複数の変数クラスを有する相応のデータフォーマットにされる。データフォーマットは、データベクトル又はデータテンソルの形態で提供されることができるデータ点をもたらす。このデータベクトル又はデータテンソルは、状態情報の複数の異なる変数クラスを統合し、これらの変数クラスを、データ点においてそれぞれ異なる個数の成分によってマッピングする。
【0031】
ここで、技術的装置5を監視及び/又は制御するために、特に、システム変数に基づいて下流に配置された機能を制御するために、技術的装置5を調整するために、又は、技術的システム1を監視するために使用されるシステム変数を特定するために、データに基づいたシステムモデル4において、データ点を評価することができる。
【0032】
複数の変数クラスにおける個々の状態情報の値範囲は、互いに大きく相違している可能性がある。
【0033】
さらに、それぞれ評価されるべきデータ点を取得する異常識別ブロック6を設けることができる。異常識別ブロック6は、通常動作を特徴付ける基準データ点に対する距離尺度を決定するように構成可能である。基準データ点は、所与であり、評価されるべきデータ点の距離尺度は、距離メトリックを用いて決定可能である。
【0034】
距離メトリックは、例えば、それぞれの変数クラスごとに固有の重み係数を企図している重み付きL2ノルムに基づくことができる。
【0035】
所与の距離メトリックから特定された距離尺度が所与の異常閾値を上回っている場合には、異常が識別され、信号Sによって相応に通知される。
【0036】
図2は、異常識別ブロック6において使用することができる距離メトリックのメトリックパラメータを特定するための方法を説明するためのフローチャートを概略的に示す。本方法は、コンピュータにおいて実施可能であり、異常識別ブロック6における異常識別モデルのパラメータ化のために使用される。
【0037】
このために、まず始めにステップS1において、訓練データセットが提供され、この訓練データセットは、データ点をラベルに対応付けるものであり、このラベルは、測定された、シミュレートされた若しくはモデリングされたシステム変数に相当し、又は、システム挙動を記述するその他の変数に相当する。特に、システム変数は、訓練データセットのデータ点において使用される全ての変数クラスに対して依存性を有するように選択されている。訓練データセットは、訓練集合と、検証集合とに分割される。
【0038】
ステップS2においては、データに基づいたシステムモデル4が、又は、訓練集合の訓練データ点を相応に対応付けられたラベルにマッピングする、データに基づいた他のモデルが、訓練データセットの訓練集合を用いて訓練される。
【0039】
ステップS3においては、訓練データセットの検証集合のそれぞれのデータ点ごとに、所与の品質関数に応じて品質尺度が特定される。可能な品質関数は、データに基づいたシステムモデル4のモデル出力と、検証集合のデータ点の各々におけるラベルとの間の単純な差に相当することができる。このようにして、検証集合のそれぞれのデータ点ごとに品質尺度が得られる。
【0040】
さらに、ステップS4においては、検証集合のそれぞれのデータ点ごとに、訓練集合の最近傍のデータ点までの距離値が決定される。距離値は、それぞれの変数クラスのみについて決定される。即ち、スカラ変数の場合における距離値は、訓練集合の最近傍のデータ点における相応の変数クラスとの単純な差又は二乗の差に相当する。訓練集合の最近傍のデータ点は、相応の変数クラスの最小の距離値を有するデータ点に相当する。
【0041】
時系列又は多次元の変数クラスの場合には、検証集合の評価されるべきデータ点と、訓練集合のデータ点との間の距離値は、例えばユークリッド距離に相当する。ここで、検証集合のデータ点の各々ごとに品質尺度が得られ、それぞれの変数クラスについて距離値が得られる。このことは、複数の異なる変数クラスに関する図3a乃至図3cの線図に基づいて例示的に示されており、図3aは、圧力のスカラ変数に相当し、図3bの変数クラスは、例示的なピエゾセンサの時系列信号に相当し、図3cは、時間指示の変数クラスに相当する。
【0042】
ステップS5においては、変数クラスに対する全ての距離値の中央領域における品質尺度の最大値が決定される。即ち、変数クラスに関して特に小さい距離値及び特に大きい距離値は、相応の品質尺度の最大値を決定する際には考慮されない。例えば、発生した距離値の全範囲は、該当する変数クラスの最大の距離値の5%から95%までの間、好ましくは10%から90%までの間のみにおいて決定可能である。最大の品質尺度の距離値は、特に相互の最大の品質の距離値が正規化された後に以下のようにして得られ、なお、最大の品質尺度の距離値の相互の相対的な比率が、距離メトリックのためのスケーリング係数w,w,w・・・を決定する。
【0043】
特に、変数クラスの、このようにして決定された距離値Aの中から、最大の距離値Amaxを決定することができる。この値は、wの重みに相当する。距離値の商w=Amax/Aは、他の変数クラスの重みを決定する。図面においては、Amaxは0.8であり、他の両方のピークは0.1であり、したがって、重み係数は、時間及び圧力の場合には8及び8であり、信号の場合には1である。
【0044】
例示的に、3つの異なる変数クラスx,・・・,xと、y,・・・,yと、z,・・・,zとを有する1つの信号が与えられているものとする。それぞれの変数クラスごとに、さらなる信号[a,・・・,a,b,・・・,b,z,・・・,z]までの距離が個々に決定される。これらの距離の各々は、特定された重みと乗算されて、次いで、共に合計される。
d([x,・・・,x,y,・・・,y,z,・・・,z],[a,・・・,a,b,・・・,b,z,・・・,z])=wd([x,・・・,x],[a,・・・,a])+wd([y,・・・,y],[b,・・・,b])+wd([z,・・・,z],[z,・・・,z])
【0045】
これに代えて、品質尺度の分布を補償するために、変数クラスの各々についての距離値を介してスケーリング係数w,w,w,・・・を特定するものとしてもよく、これらの距離値から、同じく正規化の後に、距離メトリックのための相応のスケーリング係数を決定することができる。このようにして特定されたスケーリング係数w,w,w,・・・を、異常識別モデルにおいて使用することができる。
【0046】
図4は、センサシステム1に関する例として、自動車の内燃機関12のための噴射システム10を示し、この内燃機関12に関して(特に複数のシリンダのうちの)1つのシリンダ13が例示的に示されている。内燃機関12は、好ましくは直噴装置を有するディーゼル機関として構成されているが、ガソリン機関として設けられるものとしてもよい。
【0047】
シリンダ13は、新鮮空気を供給するための吸気弁14と、燃焼排気を排出するための排気弁15とを有する。
【0048】
さらに、内燃機関12を動作させるための燃料が、噴射弁16を介してシリンダ13の燃焼室17内に噴射される。燃料は、このために燃料供給部18を介して噴射弁に供給され、この燃料供給部18を介して、燃料は、それ自体公知の形式(例えば、コモンレール)で、高燃料圧力下で提供される。
【0049】
噴射弁16は、電磁的又は圧電的に制御可能なアクチュエータユニット21を有し、このアクチュエータユニット21は、弁ニードル22に結合されている。弁ニードル22は、噴射弁16が閉弁された状態ではニードル座23に着座している。アクチュエータユニット21の制御によって、弁ニードル22が長手方向に移動させられて、ニードル座23における弁開口部の一部を解放し、これにより、圧力下にある燃料をシリンダ13の燃焼室17内に噴射する。
【0050】
噴射弁16は、噴射弁16内に配置されているピエゾセンサ25をさらに有する。ピエゾセンサ25は、噴射弁16を通って案内される燃料内の圧力変化によって変形させられ、センサ信号として電圧信号を生成する。
【0051】
噴射は、噴射されるべき燃料量をアクチュエータユニット21の通電によって設定する制御ユニット30によって制御されて実施される。センサ信号は、制御ユニット30においてA/D変換器31を用いて時間的に、特に0.5MHz乃至5MHzのサンプリングレートでサンプリングされる。
【0052】
さらに、噴射弁16の上流側における燃料圧力(レール圧力)を特定するために、圧力センサ18が設けられている。
【0053】
センサ信号は、内燃機関12の動作中、噴射弁16の具体的な開弁時点又は閉弁時点を特定するために使用される。このために、センサ信号は、A/D変換器31を用いて評価点時系列にデジタル化され、適当なセンサモデルによって評価され、ここから噴射弁16の開弁期間と、それに応じて噴射された燃料量とを、燃料圧力と、さらなる動作変数とに依存して特定することができる。開弁期間を決定するために、特に開弁時点及び閉弁時点が必要とされ、これらの変数の時間的な差として開弁期間が特定される。
【0054】
開弁時点及び/又は閉弁時点の特定は、サンプリングされたセンサ信号のセンサ信号時系列の考察から実施可能である。特に、開弁時点及び/又は閉弁時点は、データに基づいたシステムモデルを用いて感知可能である。追加的な状態変数として、レール圧力と、噴射弁16の開弁及び/又は閉弁が制御されるときの時間指示とを、システムモデルにおいて評価することができる。ここで、評価されるべきデータ点は、レール圧力のスカラ値のセンサ信号時系列と、時間指示のスカラ値とを含む。
【0055】
したがって、上記のセンサシステム1との関連において、訓練データ点は、ラベルのための開弁時点及び/又は閉弁時点としてのデータ点及び変化点時点に相当する。
【0056】
上記の噴射システム10の例においては、データ点の変数クラスのための距離メトリックを、上記の方法に応じて特定することができる。噴射システム10に関する距離メトリックを決定するために、上記のクラス分けモデルに応じて、検証集合のそれぞれのデータ点ごとに品質尺度Gを決定することができ、そこから、これに応じて図3a乃至図3cの線図を特定することができる。図3aの線図は、レール圧力の距離値Arailに関する品質尺度Gの分布を示し、図3bは、ピエゾ電圧のセンサ信号時系列の距離値Asensに関する品質尺度Gの分布を示し、図3cは、時間指示の距離値Atimeに関する品質尺度Gの分布を示す。それぞれ品質分布の最大値は、図3aにおいては約0.11、図3bにおいては約0.9、図3cにおいては約0.115にマーキングされている。これにより、以下の計算
【数4】
に応じて距離メトリックがもたらされる。
【0057】
2つの信号の距離は、[x,・・・,x50,t,p]及び[y,・・・,y50,s,q]である。この場合、x及びyは、第1の変数クラス(センサ信号)であり、t及びsは、それぞれ時間パラメータであり、p及びqは、それぞれ圧力パラメータである。
【0058】
ここで、この距離メトリックが、異常識別ブロック6における異常識別のために使用され、これにより、訓練データ点からデータ点までの距離尺度に依存して異常が決定される。
図1
図2
図3a
図3b
図3c
図4
【手続補正書】
【提出日】2023-03-17
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数の異種の変数クラスを有する1つのデータ点までの距離を決定するための距離メトリックを決定するためのコンピュータ実装された方法であって、
・訓練データセットを提供するステップ(S1)であって、前記訓練データセットは、それぞれ1つのデータ点をラベルに対応付けるものであり、訓練集合の訓練データ点と、検証集合の検証データ点とに分割されている、ステップ(S1)と、
・データに基づいたシステムモデル(4)を、前記訓練集合を用いて訓練して、当該システムモデル(4)が、データ点にそれぞれ1つのモデル出力を対応付けるようにするステップ(S2)と、
・前記検証集合のそれぞれの検証データ点ごとに、前記変数クラスの各々についての前記システムモデル(4)の品質尺度と、最近傍の訓練データ点までの距離値とを決定するステップ(S3,S4)であって、前記最近傍の訓練データ点までの前記距離値は、該当する変数クラスに関して個々に特定される、ステップ(S3,S4)と、
・前記変数クラスの各々についての最大の品質尺度の距離値を決定するステップ(S5)と、
・前記変数クラスの各々についての前記最大の品質尺度の前記距離値に依存して、前記距離メトリックを決定するステップと、
を有する方法。
【請求項2】
それぞれ検証データセットについての前記品質尺度は、前記システムモデル(4)のモデル出力と、該当する前記検証データセットの前記ラベルとの間の差に依存して決定される、
請求項1に記載の方法。
【請求項3】
1つのデータ点は、それぞれ個々の物理的変数、物理的変数の時系列、画像生成装置の画像データ、又は、画像生成装置の動画データに相当する複数の変数クラスを含み、
前記変数クラスのうちの少なくとも2つは、互いに50%よりも大きく相違している対応する値の値範囲を有する、
請求項に記載の方法。
【請求項4】
多次元の変数の場合には、該当する前記変数クラスに関する前記最近傍の訓練データ点までの前記距離値が、ユークリッド距離として特定される、
請求項に記載の方法。
【請求項5】
前記変数クラスの各々についての前記最大の品質尺度の前記距離値は、該当する前記変数クラスに関する前記最大の距離値の5%から95%までの間の範囲内のみにおいて決定される、
請求項に記載の方法。
【請求項6】
前記距離メトリックを使用して、
さらなるデータ点から評価されるべきデータ点までの、当該距離メトリックを用いて決定された距離尺度に基づいて異常が決定され、又は、
訓練データ空間内の空所を発見するために、若しくは、前記訓練データ空間からのデータ点の外れ値を決定するために、データ点が評価される、
請求項に記載の方法。
【請求項7】
コンピュータプログラであって、コンピュータによって当該コンピュータプログラムが実行された場合に、請求項に記載の方法のステップを前記コンピュータに実行させるための命令を含むコンピュータプログラ
【請求項8】
請求項7に記載のコンピュータプログラムを記憶している機械可読記憶媒体。
【請求項9】
請求項8に記載の機械可読記憶媒体を備えている装置。
【外国語明細書】