(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023010698
(43)【公開日】2023-01-20
(54)【発明の名称】局所ニューラル変換を用いた異常領域検出
(51)【国際特許分類】
G06N 20/00 20190101AFI20230113BHJP
G06N 3/044 20230101ALI20230113BHJP
G06N 3/04 20230101ALI20230113BHJP
【FI】
G06N20/00
G06N3/04 145
G06N3/04
【審査請求】未請求
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022111192
(22)【出願日】2022-07-11
(31)【優先権主張番号】17/372,204
(32)【優先日】2021-07-09
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【弁理士】
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】マヤ ルドルフ
(72)【発明者】
【氏名】チェン キュウ
(72)【発明者】
【氏名】ティム シュナイダー
(57)【要約】 (修正有)
【課題】局所ニューラル変換を介した機械学習システムでの時系列の異常領域検出方法及びシステムを提供する。
【解決手段】異常領域検出方法は、パッチにグループ化される時系列データを受信し、符号器のパラメータを介してデータを符号化して取得した局所潜在表現から表現損失を決定し、各パッチに関連する局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換し、ベクトル表現から動的決定論的対比損失(DDCL)を決定し、表現損失とDDCLとを組み合わせて取得した更新されたパラメータを用いて符号器のパラメータを更新し、DDCLを介してベクトル表現の各々をスコアリングして各パッチに関連する多様な意味論的要求スコアを取得し、取得したスコアを平滑化して損失領域を取得し、検証されたデータを取得するために、損失領域に関連するデータをマスキングし、検証されたデータを出力する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
パッチにグループ化される時系列データを受信するステップと、
前記各パッチについて局所潜在表現を取得するために、符号器のパラメータを介して前記データを符号化するステップと、
前記各パッチについて、前記局所潜在表現から表現損失を決定するステップと、
前記各パッチに関連する前記局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換するステップと、
前記一連の多様に変換されたベクトル表現から動的決定論的対比損失(DDCL)を決定するステップと、
更新されたパラメータを取得するために、前記表現損失と前記DDCLとを組み合わせるステップと、
前記更新されたパラメータを用いて前記符号器のパラメータを更新するステップと、
前記各パッチに関連する多様な意味論的要求スコアを取得するために、前記DDCLを介して前記一連の多様に変換されたベクトル表現の各々をスコアリングするステップと、
損失領域を取得するために、前記多様な意味論的要求スコアを平滑化するステップと、
検証されたデータを取得するために、前記損失領域に関連するデータをマスキングするステップと、
前記検証されたデータを出力するステップと、
を含む異常領域検出方法。
【請求項2】
前記データを符号化するステップは、リカレントニューラルネットワーク(RNN)又は畳み込みニューラルネットワーク(CNN)を介して実行される、請求項1に記載の異常領域検出方法。
【請求項3】
前記多様な意味論的要求スコアを平滑化するステップは、ビタビ復号化を介して実行される、請求項1に記載の異常領域検出方法。
【請求項4】
前記多様な意味論的要求スコアを平滑化するステップは、前記損失領域を取得するために、
前記多様な意味論的要求スコアの履歴を作成するステップと、
閾値を超えるスコアを有するデータをフィルタリングするステップと、
を含む、請求項1に記載の異常領域検出方法。
【請求項5】
前記表現損失を計算するステップは、対比予測符号化(CPC)損失を計算するステップである、請求項1に記載の異常領域検出方法。
【請求項6】
前記ベクトル表現から前記CPC損失を計算するステップは、次式
【数1】
に従って計算され、ここで、前記
【数2】
は、期待関数であり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記f
k(a,b)=f(a,W
kb)は、前記W
kによってパラメータ化された2つの引数間の比較関数であり、前記L
CPCは、前記対比予測符号化(CPC)損失であり、前記c
tは、コンテキスト表現である、請求項5に記載の異常領域検出方法。
【請求項7】
前記多様に変換されたベクトル表現からDDCL損失を計算するステップは、次式
【数3】
に従って計算され、ここで、前記
【数4】
は、期待関数であり、前記tは、時間インデックスであり、前記kは、時間インデックスの幅であり、前記lは、局所ニューラル変換のインデックスであり、前記
【数5】
は、スコアであり、前記L
DDCLは、動的な決定論的対比損失である、請求項1に記載の異常領域検出方法。
【請求項8】
前記一連の多様に変換されたベクトル表現の各々をスコアリングするステップは、次式
【数6】
に従って計算され、ここで、前記
【数7】
は、スコアであり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記
【数8】
は、コサイン類似性関数であり、前記c
tは、コンテキスト表現である、請求項1に記載の異常領域検出方法。
【請求項9】
前記方法は、前記検証されたデータに基づいて機械を動作させるステップをさらに含み、前記時系列データは、センサから受信される、請求項1に記載の異常領域検出方法。
【請求項10】
コントローラを含む異常領域検出システムであって、
前記コントローラは、
第1のセンサからパッチにグループ化される時系列データを受信し、
前記各パッチについて局所潜在表現を取得するために、符号器のパラメータを介して前記データを符号化し、
前記各パッチについて、局所潜在表現から対比予測符号化(CPC)損失を計算し、
前記各パッチに関連する局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換し、
前記一連の多様に変換されたベクトル表現から動的決定論的対比損失(DDCL)を計算し、
更新されたパラメータを取得するために、前記CPC損失と前記DDCLとを組み合わせ、
前記更新されたパラメータを用いて符号化のパラメータを更新し、
前記各パッチに関連する多様な意味論的要求スコアを取得するために、前記DDCLを介して前記一連の多様に変換されたベクトル表現の各々をスコアリングし、
損失領域を取得するために、前記多様な意味論的要求スコアを平滑化し、
検証されたデータを取得するために、前記損失領域に関連するデータをマスキングし、
前記検証されたデータに基づいて機械を動作させる
ように構成されている、異常領域検出システム。
【請求項11】
前記コントローラは、ビタビ復号化を介して前記多様な意味論的要求スコアを平滑化するように構成されている、請求項10に記載の異常領域検出システム。
【請求項12】
前記コントローラは、前記損失領域を取得するために、
前記多様な意味論的要求スコアの履歴を作成し、かつ、閾値を超えるスコアを有するデータをフィルタリングすることにより、前記多様な意味論的要求スコアを平滑化するように構成されている、請求項10に記載の異常領域検出システム。
【請求項13】
前記コントローラは、前記ベクトル表現から前記CPC損失を、次式
【数9】
に従って計算するように構成されており、ここで、前記
【数10】
は、期待関数であり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記f
k(a,b)=f(a,W
kb)は、前記W
kによってパラメータ化された2つの引数間の比較関数であり、前記L
CPCは、前記対比予測符号化(CPC)損失であり、前記c
tは、コンテキスト表現である、請求項10に記載の異常領域検出システム。
【請求項14】
前記第1のセンサは、光学的センサ、車載センサ、又は、音響的センサであり、前記機械は、自律的な車両である、請求項10に記載の異常領域検出システム。
【請求項15】
前記第1のセンサは、RFセンサであり、前記機械は、遠隔通信機械である、請求項10に記載の異常領域検出システム。
【請求項16】
コントローラを含む遠隔通信システムであって、
前記コントローラは、
パッチにグループ化される時系列データを受信し、
前記各パッチについて局所潜在表現を取得するために、符号器のパラメータを介して前記データを符号化し、
前記各パッチについて、前記局所潜在表現から対比予測符号化(CPC)損失を決定し、
前記各パッチに関連する前記局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換し、
前記一連の多様に変換されたベクトル表現から動的決定論的対比損失(DDCL)を計算し、
更新されたパラメータを取得するために、前記CPC損失と前記DDCLとを組み合わせ、
前記更新されたパラメータを用いて符号化のパラメータを更新し、
前記各パッチに関連する多様な意味論的要求スコアを取得するために、前記DDCLを介して前記一連の多様に変換されたベクトル表現の各々をスコアリングし、
損失領域を取得するために、前記多様な意味論的要求スコアを平滑化し、
検証されたデータを取得するために、前記損失領域に関連するデータをマスキングし、
前記検証されたデータに基づいて前記遠隔通信システムを動作させる
ように構成されている、遠隔通信システム。
【請求項17】
前記コントローラは、ビタビ復号化を介して前記多様な意味論的要求スコアを平滑化するように構成されている、請求項16に記載の遠隔通信システム。
【請求項18】
前記コントローラは、前記損失領域を取得するために、
前記多様な意味論的要求スコアの履歴を作成し、かつ、閾値を超えるスコアを有するデータをフィルタリングすることにより、前記多様な意味論的要求スコアを平滑化するように構成されている、請求項16に記載の遠隔通信システム。
【請求項19】
前記コントローラは、前記ベクトル表現から前記CPC損失を、次式
【数11】
に従って計算するように構成されており、ここで、前記
【数12】
は、期待関数であり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記f
k(a,b)=f(a,W
kb)は、前記W
kによってパラメータ化された2つの引数間の比較関数であり、前記L
CPCは、前記対比予測符号化(CPC)損失であり、前記c
tは、コンテキスト表現である、請求項16に記載の遠隔通信システム。
【請求項20】
前記コントローラは、前記一連の多様に変換されたベクトル表現の各々を、次式
【数13】
に従ってスコアリングするように構成されており、ここで、前記
【数14】
は、スコアであり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記
【数15】
は、コサイン類似性関数であり、前記c
tは、コンテキスト表現である、請求項16に記載の遠隔通信システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般に、機械学習システムにおける異常領域検出に関する。より具体的には、本出願は、局所ニューラル変換を介した機械学習システムでの時系列の異常領域検出における改善に関する。
【背景技術】
【0002】
背景技術
データ分析において、異常検出(外れ値検出とも称される)とは、データの大部分と大きく異なることによって疑念を抱かせる特定のデータ、イベントの識別又は観測のことである。典型的には、異常項目は、構造に関する欠陥、動作不良、誤動作、医療に関する問題、エラーなど、何らかの問題に変換される。
【発明の概要】
【課題を解決するための手段】
【0003】
概要
異常領域検出方法は、パッチにグループ化される時系列データを受信するステップと、各パッチについて局所潜在表現を取得するために、符号器のパラメータを介してデータを符号化するステップと、各パッチについて、局所潜在表現から表現損失を決定するステップと、各パッチに関連する局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換するステップと、一連の多様に変換されたベクトル表現から動的決定論的対比損失(DDCL)を決定するステップと、更新されたパラメータを取得するために、表現損失とDDCLとを組み合わせるステップと、更新されたパラメータを用いて符号器のパラメータを更新するステップと、各パッチに関連する多様な意味論的要求スコアを取得するために、DDCLを介して一連の多様に変換されたベクトル表現の各々をスコアリングするステップと、損失領域を取得するために、多様な意味論的要求スコアを平滑化するステップと、検証されたデータを取得するために、損失領域に関連するデータをマスキングするステップと、検証されたデータを出力するステップと、を含む。
【0004】
異常領域検出システムは、コントローラを含み、コントローラは、第1のセンサからパッチにグループ化される時系列データを受信し、各パッチについて局所潜在表現を取得するために、符号器のパラメータを介してデータを符号化し、各パッチについて、局所潜在表現から対比予測符号化(CPC)損失を計算し、各パッチに関連する局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換し、一連の多様に変換されたベクトル表現から動的決定論的対比損失(DDCL)を計算し、更新されたパラメータを取得するために、CPC損失とDDCLとを組み合わせ、更新されたパラメータを用いて符号化のパラメータを更新し、各パッチに関連する多様な意味論的要求スコアを取得するために、DDCLを介して一連の多様に変換されたベクトル表現の各々をスコアリングし、損失領域を取得するために、多様な意味論的要求スコアを平滑化し、検証されたデータを取得するために、損失領域に関連するデータをマスキングし、検証されたデータに基づいて機械を動作させるように構成されている。
【0005】
遠隔通信システムは、コントローラを含み、コントローラは、パッチにグループ化される時系列データを受信し、各パッチについて局所潜在表現を取得するために、符号器のパラメータを介してデータを符号化し、各パッチについて、局所潜在表現から対比予測符号化(CPC)損失を決定し、各パッチに関連する局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換し、一連の多様に変換されたベクトル表現から動的決定論的対比損失(DDCL)を計算し、更新されたパラメータを取得するために、CPC損失とDDCLとを組み合わせ、更新されたパラメータを用いて符号化のパラメータを更新し、各パッチに関連する多様な意味論的要求スコアを取得するために、DDCLを介して一連の多様に変換されたベクトル表現の各々をスコアリングし、損失領域を取得するために、多様な意味論的要求スコアを平滑化し、検証されたデータを取得するために、損失領域に関連するデータをマスキングし、検証されたデータに基づいて遠隔通信システムを動作させるように構成されている。
【図面の簡単な説明】
【0006】
【
図1】局所ニューラル変換(LNT)を介した異常領域検出システムのフローチャートである。
【
図2】潜在表現に関する局所ニューラル変換のフローチャートである。
【
図3】潜在空間におけるプッシュ/プルを伴う動的な決定論的対比損失(DDCL)のフローチャートである。
【
図4】前方スコアリング及び後方スコアリングのフローチャートである。
【
図6】異なる設計選択についての偽陽性率(FPR)に関する真陽性率(TPR)を表す局所ニューラル変換(LNT)の受信機動作特性(ROC)曲線のグラフ表示である。
【
図7】異常が注入された例示的な信号、スコア、及び、エラー検出信号のグラフ表示である。
【
図8】異常が注入された例示的な信号、スコア、及び、エラー検出信号のグラフ表示である。
【
図9】対比予測符号化(CPC)を介した異常領域検出システムのフローチャートである。
【
図10】対比予測符号化(CPC)損失値、並びに、画像及び損失値の両方の重畳に対応する画像の説明図である。
【
図11】車両を制御するように構成された制御システムの概略図である。
【
図12】製造機械を制御するように構成された制御システムの概略図である。
【
図13】電動工具を制御するように構成された制御システムの概略図である。
【
図14】自動化されたパーソナルアシスタントを制御するように構成された制御システムの概略図である。
【
図15】監視システムを制御するように構成された制御システムの概略図である。
【
図16】医療用撮像システムを制御するように構成された制御システムの概略図である。
【発明を実施するための形態】
【0007】
詳細な説明
必要に応じて、本発明の詳細な実施形態が本明細書に開示されるが、これらの実施形態は、様々な代替的形態で具現化され得る本発明の単なる例示に過ぎないことを理解されたい。図面は、必ずしも縮尺通りではなく、いくつかの特徴は、特定の構成要素の詳細を示すために、誇張又は最小化されている場合がある。従って、本明細書に開示された特定の構造的及び機能的詳細は、限定的に解釈されるべきではなく、単に、本発明を様々に採用することを当業者に教示するための代表的な基礎として解釈されるべきである。
【0008】
本明細書においては、用語「実質的に」とは、開示又は請求された実施形態を説明するために使用される場合がある。この用語「実質的に」は、本開示において開示又は請求された値又は相対特性を変更することができる。そのような場合、「実質的に」とは、変更される範囲が±0%、0.1%、0.5%、1%、2%、3%、4%、5%若しくは10%以内の値又は相対特性を意味し得る。
【0009】
用語「センサ」とは、物理的特性を検出し又は測定し、それを記録し、表示し又は他の手法により応答するデバイスを指す。用語「センサ」には、光学的センサ、光センサ、撮像センサ又は光子センサ(例えば、電荷結合素子(CCD)、CMOSアクティブ画素センサ(APS)、赤外線センサ(IR)、CMOSセンサなど)、音響的センサ、音センサ又は振動センサ(例えば、マイクロフォン、ジオフォン、ハイドロフォンなど)、車載センサ(例えば、車輪速センサ、パーキングセンサ、レーダ、酸素センサ、ブラインドスポットセンサ、トルクセンサ、LIDARなど)、化学センサ(例えば、イオンセンシティブ電界効果トランジスタ(ISFET)、酸素センサ、二酸化炭素センサ、ケミレジスタ、ホログラフィックセンサなど)、電流センサ、電位センサ、磁気センサ又は高周波センサ(例えば、ホール効果センサ、磁力計、磁気抵抗計、ファラデーカップ、ガルバノメータなど)、環境センサ、気象センサ、保湿量センサ又は湿度センサ(例えば、気象レーダ、アクチノメータなど)、流量センサ又は流速センサ(例えば、質量気流センサ、風速計流速計など)、電離放射線センサ又は素粒子センサ(例えば、電離箱、ガイガーカウンタ、中性子検出器など)、ナビゲーションセンサ(例えば、汎地球測位システム(GPS)センサ、磁気流体力学(MHD)センサなど)、位置センサ、角度センサ、変位センサ、距離センサ、速度センサ又は加速度センサ(例えば、LIDAR、加速度計、超広帯域レーダ、圧電センサなど)、力センサ、密度センサ又はレベルセンサ(例えば、歪みゲージ、核密度計など)、感熱センサ、加熱センサ又は温度センサ(例えば、赤外線温度計、パイロメータ、熱電対、サーミスタ、マイクロ波放射計など)、又は、物理的特性を検出し又は測定し、それを記録し、表示し又は他の手法により応答することを目的とした他のデバイス、モジュール、機械又はサブシステムなどが含まれる。
【0010】
具体的には、センサは、時系列信号の特性を測定することができ、空間内の場所などの空間的又は時空的な態様を含み得る。信号は、電気機械、音、光、電磁気、RF、又は、他の時系列データを含み得る。本出願において開示される技術は、例えば、無線電磁波用アンテナ、集音用マイクロフォンなどの他のセンサを用いた時系列撮像に適用することができる。
【0011】
用語「画像」とは、物理的特性の知覚(例えば、可聴音、可視光、赤外線、超音波、水中音響など)を描写する、写真や他の二次元画像などの表現物又は人工物を指し、これらは、サブジェクト(例えば、物理的被写体、シーン又はプロパティ)に類似しているので、その描写が提供される。画像は、時間、空間、強度、濃度、又は、他の特性の成分を含み得る点において多次元であるものとしてもよい。例えば、画像には時系列画像が含まれ得る。この技術は、3D音響源又はオブジェクトを画像化するために拡張することもできる。
【0012】
異常検出は、医療装置、セキュリティシステム、コンシューマシステム、自動車システム、自律的な運転システム、無線通信システム、センサ、機械ビジョンを用いた画像の欠陥検出など、様々なシステムにおいて適用可能である。それらは、データセットから異常なデータを除去するための前処理において使用されることが多い。教師あり学習において、データセットから異常データを除去することは、結果として統計的に有意な精度向上に結び付くことが多い。
【0013】
時系列内の異常領域の発見は、消費者、医療、産業、自動車及び航空を含む多くの用途において重要である。本開示においては、データ増補に基づく補助タスクは、深層アーキテクチャをトレーニングするために使用することができ、次いで、補助タスクの性能は、異常スコアとして使用されるものとしてもよい。本開示は、時系列データ又は表形式データなどのドメインに対する解決手段を提供する。これらのドメインは、拡張がデータから学習される場合に利益を得る。本開示においては、時系列内の異常領域を発見するタスクにこれらの方法を拡張するアプローチが提供される。本開示は、異常領域を検出するためのエンドツーエンドパイプラインである局所ニューラル変換(LNT)を提示する。このLNTは、時系列を局所的に埋め込みかつ拡張することを学習し、各時間ステップについて異常スコアを生成する。実験を介して、LNTは、LibriSpeechデータセットからの音声セグメントにおいて合成ノイズを発見し得ることが示されている。本開示は、時系列(temporal)に焦点を合わせているが、この構想は、空間又は時空間などの他のタイプのデータに適用することもできる。
【0014】
時系列における異常な動作の発見は、機械学習の多くの用途において重要なタスクである。本開示の一態様は、(潜在的に多変量の)時系列のラベル付けされていないデータセットを使用し、異常についての新たな時系列を走査し得る深層学習に基づくアプローチを学習することである。具体的には、異常はシーケンス全体についてではなく、サブシーケンスレベルで判断されるべきものなので、異常領域検出のタスクに焦点を合わせる。多くの用途においては、このセットアップは、異常な動作に迅速に応答するために極めて重要になる場合がある。
【0015】
本開示においては、データ増補は、深層特徴抽出器をトレーニングするためのタスクを定義するために使用され、タスクに関する性能は、異常スコアとして使用される。具体的には、自己教師あり異常検出を画像以外のドメインに適合させるための改良、データ増補の利点を利用した時系列異常検出のための深層手法である。
【0016】
本開示においては、時系列データにおける異常を発見するために、局所ニューラル変換(LNT)の変換学習アプローチが使用され得る。次いで、異常検出パイプラインは、特徴抽出器(対比予測符号化CPCなど)をニューラル変換学習と組み合わせる。最終的に、隠れマルコフモデル(HMM)に基づくスコアリング手法がスコアを組み合わせ、異常領域を検出する。本開示は、(1)表現学習と変換学習とを組み合わせた時系列における自己教師あり異常領域検出のための新規な方法と、(2)異なる損失寄与を時間ステップごとの異常スコアに組み合わせるスコアリングとを提示している。
【0017】
ここでは、局所ニューラル変換(LNT)を、時系列のための異常検出方法として適用することができる。即ち、時系列
【数1】
が与えられると、本明細書に開示された方法は、各個別のタイムステップの異常を表すスコア`
0:tを出力する。概要は、
図1に示されており、この図は、ニューラル変換が、2つの対比自己監視タスクを用いて局所表現を提供する符号器と共同してトレーニングされるものとしてもよいことを示している。これらのタスクに関する性能は、異常スコア
【数2】
を導出するために再利用されるものとしてもよい。
【0018】
図1は、局所ニューラル変換(LNT)を介した異常領域検出システム100のフローチャートである。符号器102は、符号器に対する内部パラメータを介してデータの局所潜在表現を作成する。この局所潜在表現は、局所ニューラル変換104を介して、一連の多様に変換されたベクトル表現に変換される。符号器は、CPC損失などの表現損失106も出力する。さらに、局所ニューラル変換104は、動的な決定論的対比損失(DDCL)108も出力する。
【0019】
局所時系列表現:第1のステップは、局所潜在表現z
tを得るために時系列を符号化することである。表現損失も生成され、これらはCPC損失又は自己符号器損失などの表現の品質を評価する損失である。時系列パッチx
t:t+τ(ウィンドウサイズτを有する)は、局所潜在表現z
tを取得するために、ストライド式畳み込みによって符号化される。そして次に、それらは、コンテキスト表現c
tを形成するために回帰型モデル(GRU)によって処理される。両者とも対比予測符号化(CPC)を用いてトレーニングされ、これは、提案分布Zから引き出された負のサンプルz
jに対して線形のk段階未来予測W
kc
tを対比することにより、コンテキスト埋め込みc
tが近傍パッチの予測を促すようにしている。結果として生じる損失(式1)は、指数化された類似性尺度
【数3】
を用いた負のサンプルの固定サイズセットZ~Zから正のサンプルを分類する交差エントロピーである。
【数4】
ここで、
【数5】
は、期待関数であり、z
tは、符号化された時系列の局所潜在表現であり、tは、時間インデックスであり、W
kは、パラメータの行列であり、kは、時間インデックスの幅であり、f
k(a,b)=f(a,W
kb)は、W
kによってパラメータ化された2つの引数間の比較関数であり、L
CPCは、対比予測符号化(CPC)損失であり、c
tは、コンテキスト表現である。
【0020】
局所ニューラル変換:次に、時系列表現は、各埋め込みの異なるビューを生成するために局所ニューラル変換によって処理される。これらの局所変換により、異常領域の検出が可能となる。
【0021】
図2は、潜在表現に関する局所ニューラル変換200のフローチャートである。符号器202は、符号器に対する内部パラメータを介してデータの局所潜在表現204を作成する。この局所潜在表現204は、局所ニューラル変換206を介して、一連の多様に変換されたベクトル表現208(208a,208b,208c,208d,208e)に変換される。
【0022】
例えば、画像の意味論的変換は、回転又は色歪みであり得る一方で、他のデータを用いた一実施形態においては、NeuTraLは、同一のサンプルの異なるビューに対する元のサンプルの対比によってデータからパラメータθlを用いたニューラル変換Tl(・)のセットを学習するために使用された。これは、ノイズ対比推定(NCE)のようにノイズ分布から引き出された負のサンプルに依存するものではなかったので、結果として決定論的対比損失を生じさせるものとなった。
【0023】
本開示は、異なる潜在ビューT
l(z
t)を獲得するために、このアプローチを、
図2に示すように学習された潜在表現z
tに適用することを提示する。さらに、本開示は、式2で与えられるように異なる局面kに対する未来予測W
kc
tを正のサンプルとして組み込むことにより、時間依存性を有する損失を動的な決定論的対比損失(DDCL)に拡張する。
【数6】
ここで、
【数7】
は、スコアであり、z
tは、符号化された時系列の局所潜在表現であり、tは、時間インデックスであり、W
kは、パラメータの行列であり、kは、時間インデックスの幅であり、
【数8】
は、コサイン類似性関数であり、c
tは、コンテキスト表現である。
【0024】
これは、結果として、異なる定言的なクロスエントロピー損失(式2)の合計(式3)を生じさせ、これらはすべて、
【数9】
で与えられる
【数10】
からの正のサンプルと、コサイン類似性尺度
【数11】
とを対比させている。この2つの自己監視タスク、詳細には変換学習と未来予測とを単一の決定論的対比損失に組み合わせることによれば、W
kc
tにおける異なるkによって引き起こされる変動に対処する必要があるため、総合的なタスクはより困難になる。
【数12】
ここで、
【数13】
は、期待関数であり、tは、時間インデックスであり、kは、時間インデックスの幅であり、lは、変換のインデックスであり、
【数14】
は、スコアであり、L
DDCLは、動的な決定論的対比損失である。
【0025】
最終的に、式1及び式3の2つの目的を、表現学習及び変換学習を平衡化するハイパーパラメータλを有する統合損失L=LCPC+λLDDCLを用いて共同的にトレーニングする。
【0026】
変換学習原理:データから学習されたあらゆる関数が意味のある変換(又はビュー)を作成するものとしてではなく、本開示は、学習された変換のために保持する必要がある3つの重要な原理を有する
図1におけるアーキテクチャの動機付けを提示する。
【0027】
2つの原理は、(1)意味論及び(2)多様性であり、これらは、変換学習の共通の有害な輪郭ケースを除外し、表形式データのための強力な変換学習を支援している。最初の2つの原理を強化し、第3の原理(3)局所性を強化することにより、異常領域検出の下流側タスクが想定されて提供される。
【0028】
意味論とは、元のサンプルと重要な意味論的情報を共有するはずの学習された変換によって生成されるビューである。
【0029】
多様性とは、各サンプルについての多様なビューを生成するはずの学習された変換であり、結果として、解決すべき強い意味論的特徴を必要とする多様で困難な自己監視タスクを生じる。
【0030】
局所性とは、系列の汎用的コンテキストを重んじながら、局所的な近傍においてのみデータに影響を与えるはずの変換である。
【0031】
局所性に関しては、系列のいくつかの汎用的コンテキスト内の異常な動作に対して局所的に敏感であるべき、誘導された自己監視タスクの性能が要求される。これにより、データセット全体に対して異常である「外れ値ウィンドウ」を検出することが期待されるが、それらが特定の系列のコンテキスト内においてのみ異常な場合は検出しない単純なスライディングウィンドウアプローチとは異なることが強調される。
【0032】
CPCからの重要な洞察は、時系列を局所表現ztと汎用表現ctとに分解することである。このプロパティは、ztのみにニューラル変換を適用し、局所性の原理を満たす変換をもたらすことによって活用されるものとしてもよい。
【0033】
異なる観点から、L
DDCLは、潜在空間において、
図3に見られるように、プッシュ及びプルを伴った異なる表現として解釈することができる。式2の分子は、プルを伴い学習された変換
【数15】
をW
kc
tに近づけ、意味論の原理を保証し、それに対して、分母は、プッシュを伴い異なる変換
【数16】
を引き離し、学習された変換の多様性を保証する。
【0034】
異常のスコアリング:特定の時点の異常をスコアリングするために、LDDCL損失の再利用が考慮される。これは、決定論的であるという利点を有し、従って、他の対比自己監視タスクが要求し得るような提案又はノイズ分布からの負のサンプルを引き出す必要がない。
【0035】
これにより、
図4に描写されているように、時間tに対するスコア`
tを導出するために、このアプローチ内へ時間依存性を統合するための2つの手段が可能である。
【0036】
図3は、潜在空間におけるプッシュ/プルを伴う動的な決定論的対比損失(DDCL)300のフローチャートである。符号器302は、符号器に対する内部パラメータを介して、データの局所潜在表現304を作成する。このフローチャートは、異なる時点、例えば、t、t-1、t-2、t+1などにおけるフローを示していることに留意されたい。この局所潜在表現304は、局所ニューラル変換306,310を介して、一連の多様に変換されたベクトル表現308に変換される。これらの局所変換306,310は、回帰型ニューラルネットワーク(RNN)として示されているが、畳み込みニューラルネットワーク(CNN)又は他のニューラル変換として実装することもできる。
【0037】
図4は、前方スコアリング400及び後方スコアリング450のフローチャートである。
【0038】
前方スコアリングは、時点tにおいて変換された表現
【数17】
とW
kc
t-kとを対比させるために、グローバルコンテキスト状態c
t-kの記録された履歴を使用する。これにより、いったん現在の表現z
tが到達すると、スコア
【数18】
のジャストインタイムの計算が可能になる。
【0039】
後方スコアリングは、後知恵的にスコアs
tを更新するために、来たるべき未来表現
【数19】
を使用する。従って、この方法は、スコア
【数20】
のためにK個の未来表現が到着するのを待機する必要がある。
【0040】
トレーニング中は、すべての損失寄与が合計されるので、これらの考慮は無意味であることに留意されたい。いくつかの実施形態における実験に基づけば、後方スコアリングは、前方スコアリングに比較して、予測を平滑化させかつ変位させた。従って、前方スコアリング及び後方スコアリングの両方が許容可能な結果を提供したが、以下の例においては、前方スコアリングが使用される。
【0041】
隠れマルコフモデル:異常についての二値決定を導出するために、1つの方法は、閾値と各時点のスコア`
tとを別個に比較するステップを含むこととなる。データの逐次性を活用することによれば、他の方法は、二値状態を有する下流側隠れマルコフモデル(HMM)を使用し、ビタビ復号化を用いて最尤状態軌跡を抽出することである。これは、
図7及び
図8に示すように、出力を平滑化し、異常と思われる領域全体の検出を支援することができる。
【0042】
遠隔通信システム、機械アーキテクチャ及び機械可読媒体の例。
図5は、本明細書に開示されたシステムの実装に適した又は本明細書に開示された方法の実行に適した電子計算機システムのブロック図である。
図5の機械は、上記の概念の実装に適しているスタンドアロンデバイスとして示されている。上述したサーバの態様については、データセンター、クラウドアーキテクチャの一部などで動作する複数のそのような機械を使用することができる。サーバの態様においては、図示された機能部及びデバイスのすべてが利用されるわけではない。例えば、ユーザがサーバ及び/又はクラウドアーキテクチャと相互作用するために使用するシステム、デバイスなどは、スクリーン、タッチスクリーン入力部などを有し得るが、サーバは、多くの場合、スクリーン、タッチスクリーン、カメラなどを有さず、典型的には、適当な入出力態様を有する接続システムを通してユーザと相互作用する。従って、以下のアーキテクチャは、複数のタイプのデバイス及び機械を包含するものとして受け取られるべきであり、様々な態様が、そのフォームファクタ及び目的に応じて、任意の特定のデバイス又は機械に存在したりしなかったりすることが可能である(例えば、サーバはほとんどカメラを有さないが、ウェアラブルはほとんど磁気ディスクを含まない)。しかしながら、
図5の例示的な説明は、当業者にとって、使用される特定のデバイス、機械などに対して図示の実施形態を適当に変更し、ハードウェアとソフトウェアとの適当な組合せを用いて、先に説明した実施形態をどのように実装し得るかを決定することができるようにするために適している。
【0043】
単一の機械のみが図示されているが、用語「機械」とは、本明細書において論じられる方法論のいずれか1つ以上を実行するための命令のセット(又は複数のセット)を個別に又は共同で実行する機械の任意の集合体も含むものと解釈されるべきである。
【0044】
機械500の例は、少なくとも1つのプロセッサ502(例えば、コントローラ、マイクロコントローラ、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、テンソル処理ユニット(TPU)、高度処理ユニット(APU)、又は、それらの組合せ)、メインメモリ504、静的メモリ506、又は、リンク508を介して相互に通信する他のタイプのメモリなどの1つ以上のメモリを含む。リンク508は、バス又は他のタイプの接続チャネルであるものとしてもよい。機械500は、任意のタイプのディスプレイを含むグラフィックスディスプレイユニット510などの、さらなる任意の態様を含み得る。機械500は、英数字入力デバイス512(例えば、キーボード、タッチスクリーンなど)、ユーザインタフェース(UI)ナビゲーションデバイス514(例えば、マウス、トラックボール、タッチデバイスなど)、記憶ユニット516(例えば、ディスクドライブ又は他の記憶デバイス)、信号発生デバイス518(例えば、スピーカ)、センサ522(例えば、全地球測位センサ、加速度計、マイクロフォン、カメラなど)、出力コントローラ528(例えば、ユニバーサルシリアルバス(USB)、近距離無線通信(NFC)、赤外線(IR)、シリアル/パラレルバスなどの1つ以上の他のデバイスと接続及び/又は通信する有線又は無線接続)、1つ以上のネットワーク526を介して接続及び/又は通信するためのネットワークインタフェースデバイス520(例えば、有線及び/又は無線)などの任意の他の態様も含み得る。
【0045】
様々なメモリ(即ち、504、506、及び/又は、プロセッサ502のメモリ)及び/又は記憶ユニット516は、本明細書に記載される任意の1つ以上の方法論又は機能部によって実施又は利用される命令及びデータ構造(例えば、ソフトウェア)524の1つ又は複数のセットを記憶することができる。これらの命令は、プロセッサ502によって実行されるときに、開示された実施形態を実装するための様々な動作を引き起こす。
【0046】
例示的な実験:LibriSpeechデータセットは、概念論証を実証し、所定の設計選択の利点を比較するためにも人工的異常領域と共に使用された。
【0047】
テストデータにおいては、データセット内に様々な周波数及び長さの加法的な純正弦波トーンをランダムに配置し、データの≒10%を構成する連続した異常領域がもたらされた。
【0048】
CPCハイパーパラメータは、ct∈R256、zt∈R512及びK=12として使用された。付加的に、L=12の別個の学習された変換Tl(zt)をトレーニングする。各々は、サイズ64で、ReLU活性化を伴い、かつ、バイアス項なしの3つの隠れ層を有するMLPからなり、これらは、入力ztに対してシグモイド活性化を伴う残余乗算マスクとして適用される。共同トレーニングについては、切り離された30エポックについての事前トレーニングを行い、その後λ=0.1を選択する。切り離されたトレーニング中は、ニューラル変換から表現への勾配フローを防止する、即ち、両方の部分を個別にトレーニングする。
【0049】
深層学習ベースラインとしてLSTM、THOCが使用され、古典的ベースラインとしてOC-SVM、LOFが使用された。後者は、特に、時系列用に設計されておらず、そのため、特徴は、固定されたサイズのスライディングウィンドウから抽出され、これらの特徴に対する検出に適用された。これらの特徴は、変換に対して不変であるべきである。音声データについては、メルスケールされたスペクトログラムが強力なドメイン固有特徴であるべきことが示されている。
【0050】
結果:各時間ステップについてのアルゴリズムによって予測される異常スコアが個々に比較された。長さ20480のサブシリーズを考慮すれば、結果として、サンプルごとに多くのスコアと決定とが生じ、テストセット全体については総合的に≒108となる。より小さいウィンドウサイズに依存するベースラインアルゴリズムの場合、複数のサブウィンドウからの結果をつなぎ合わせる。
【0051】
図6にレポートされた受信機動作特性(ROC)曲線を使用して、本開示において提示されたLNTを複数のベースラインと比較する。LNTは、学習された表現に依存するすべての深層学習方法よりも優れた性能を発揮しており、ドメイン固有の特徴に依存するOCSVMと同等の性能を発揮した。これらの特徴は、純粋な周波数に依存するこの特定の異常に特に良好に適しているが、本開示において提示されるLNTは、強力なドメイン固有の特徴が存在しない他のタスクに適用することができる。
【0052】
図6は、他のハイパーパラメータ、詳細には切り離されたトレーニング及びバイアス項を固定したまま、2つの異なる設計選択が異常検出性能に及ぼす影響を示すものである。切り離された単独トレーニングは、劣った異常検出を引き起こす。従って、共同トレーニングは、学習された表現に良い影響を与え、トレーニング後の損失が少なくなるだけでなく、異常検出もより良好になる。より強い効果でさえ、LNTにおけるバイアス項の存在によって釈明することができる。バイアス項は、学習された変換を、設計によってある程度入力に依存しないようにさせる。これにより、自己監視タスクの性能も、この異常検出方法の意味論的な原理を崩すような様々な入力の下で不変となる。
【0053】
図6は、異なる設計選択に対する偽陽性率(FPR)に対する真陽性率(TPR)を示す局所ニューラル変換(LNT)の受信機動作特性(ROC)曲線600のグラフ表示である。
【0054】
本開示は、表現学習と変換学習とを新規な手法により組み合わせた時系列のための異常領域検出方法であるLNT方法を提示する。さらに、本開示は、このシステム及び方法が、時系列内の異常領域を検出することができ、さらに、ドメイン固有の特徴に依存するのではなく、データ表現も獲得する一般的な深層学習ベースラインよりも優れた性能を発揮していることを示す結果を提供する。
【0055】
本開示においては明示的に論じられていないが、開示されるシステム及び方法は、注釈される異常を有する他の時系列データセットに適用することができ、特に、コンテキスト依存の異常を有するデータセット、空間的又は空間-時間的データセットに適用することができる。
【0056】
ニューラル変換学習:画像以外のドメインに対する自己教師あり異常検出方法を拡張する。最近では、表形式のデータに関する有望な結果が示されたが、時系列内の異常領域を検出するための拡張性はまだない。以下においては、重要となる考察を手短に論評する。
【0057】
決定論的対比損失(DCL)(式4参照)によってトレーニングされたパラメータを有する学習された変換x
k:=T
k(x)によってデータDを増補することを考慮する。この損失は、変換されたサンプルが、コサイン類似性h(・)に関して、その元のサンプルと類似している一方で、同一のサンプルの他のビューとは非類似であることを促進する。このことは、意味論と多様性とによって動機付けられる。
【数21】
【0058】
データのこれらの異なるビューを対比する能力は、異常なデータについては減少させ、Lの再利用によって決定論的異常スコアをもたらすことが期待される。データ増補に依存する先の異常検出方法にわたる1つの重要な利点は、学習された変換が、意味論的増補を手動により設計する手法が不明なドメインにおいても適用可能なことである。
【0059】
隠れマルコフモデル(HMM)におけるビタビ復号化:自己監視タスクの評価から二値決定を導出するために、2つの状態を有する隠れマルコフモデル(HMM)を考慮する。従って、HMMの状態stは、現在の時間ステップtが異常領域の一部であるかどうかという条件に対応している。次いで、スコア`tを、生成確率モデルの放出とみなす。確率の放出は、トレーニング後のLDDCLの値における平均を用いたガウス密度として選択され、それぞれ異常状態の場合はより高くなる。この設計選択は、双峰性によって特徴付けられる`tの分布によって動機付けられる。
【0060】
データの逐次性をさらに活用するために、状態遷移確率は、連続性に有利になるように選択される。1つの方法は、ビタビ復号化の支援を用いて、そのネットワークから最尤状態軌跡を抽出することである。
【0061】
テストセットからランダムに選択されたサンプルについての結果は、
図7及び
図8においてレポートされている。これらのプロットは、LNTによってもたらされるL
DDCL損失以下の、最上部行の黄色の斜線領域に配置された人工的異常を有するテストセットからのサンプルを示している。基準損失を伴って示されたベースラインは、破損なしの同一のサンプルが供給されたときの出力である。このベースラインは、可視化のためだけのものであり、いずれかの手法に対する入力ではないことに留意されたい。
【0062】
ビタビ復号化は、最下部行に示すように、跳躍的変化の少ない連続的な異常判定シーケンスを抽出することにより、対比自己監視タスクの性能が、異常領域に関して変化する効果を克服することができる。選択されたサンプルについては、異常領域がほぼ完全に検出されている。
【0063】
図7は、異常が注入された例示的な信号のグラフ表示700である。破損領域は、異常がデータストリームに注入された領域である。スコアのグラフ表示730は、
【数22】
を示し、これは、スコアであり、又は、多様な意味論的要件スコアとも称される。エラー検出信号のグラフ表示760も、損失領域と称される。
【0064】
図8は、異常が注入された例示的な信号のグラフ表示800である。破損領域は、異常がデータストリームに注入された領域である。スコアのグラフ表示830は、
【数23】
を示し、これは、スコアであり、又は、多様な意味論的要件スコアとも称される。エラー検出信号のグラフ表示860も、損失領域と称される。
【0065】
機械学習モデルを実際に展開する場合、信頼し得る異常の検出が極めて重要であるが、ラベル付けされたデータが不足しているため依然として困難である。対比学習アプローチの使用は、一般的に自己教師あり表現学習の設定で使用されるものとしてもよい。ここでは、対比異常検出アプローチが画像に適用され、異常セグメンテーションマスクの形態で解釈可能な結果を提供するように構成される。本開示のこのセクションにおいては、対比予測符号化モデルの使用が提示される。本開示は、異常スコアとして直接解釈することができるパッチ状の対比損失を提示し、異常セグメンテーションマスクの作成において使用される。結果として生じるモデルは、困難なMVTec-ADデータセット上において異常検出とセグメンテーションとの両方についてテストされたものである。
【0066】
異常(又は外れ値、新規性、分布外のサンプル)とは、データの大多数とは著しく異なる観測値のことである。異常検出(AD)は、データ中の「正常」とみなされるサンプルから異常なサンプルの区別を試みる。機械学習手法の信頼性をより高め、実世界のシナリオ、例えば、自動化された産業検査、医療診断又は自律的な運転などにおける適用性を向上させるために、これらの異常を検出することはますます重要になってきている。典型的には、異常検出は、教師なし学習問題として扱われる。なぜなら、ラベル付けされたデータは一般に利用することができず、これまで見られなかった異常を検出することができる方法を開発するためである。
【0067】
本開示においては、対比予測符号化(CPC)方法及びシステムを、画像内の異常を検出しかつセグメンテーションするために適用することができる。さらに、このシステムは、異常スコアとして直接解釈することができる表現損失(例えば、InfoNCE損失)を適用する。この損失においては、画像内からのパッチが相互に対比されるため、これらは、正確な異常セグメンテーションマスクの作成のために使用することができる。
【0068】
図9は、対比予測符号化(CPC)を介した異常領域検出システム900のフローチャートである。画像902はパッチ904にグループ化され、各パッチ906内のデータと共に局所潜在表現の作成のために符号器910によって符号化される。符号器は、局所潜在表現を計算するときに、負のサンプル908を含み得る。局所潜在表現は、局所ニューラル変換912を通過して、一連の多様に変換されたベクトル表現と、動的決定論的対比損失(DDCL)とが作成され、これらはどちらも、各パッチに関連する多様な意味論的要件スコアの作成のために使用される。
【0069】
画像における異常検出とセグメンテーションのための対比予測符号化の概略図においては、入力画像から(サブ)パッチを抽出した後、同一の画像内からの符号化された表現(zt,zt+k)がN-1個のランダムに整合化された表現(zt,zj)に対して対比させられる。結果として生じるInfoNCE損失は、サブパッチxt+kが異常であるか否かを決定するために使用される。
【0070】
図10は、MVTec-ADデータセットにおける異なるクラスについての異常領域の局所化を示した画像1000の説明図である。元の入力画像1002(1002a,1002b,1002c,1002d,1002e,1002f,1002g)、対応するInfoNCE損失値1004(1004a,1004b,1004c,1004d,1004e,1004f,1004g)(明るい影ほど高い損失値を表す)、及び、両方の重畳1006(1006a,1006b,1006c,1006d,1006e,1006f,1006g)である。これは、本開示において提示されるモデルが、多くのクラスにわたって異常領域を一貫して強調することを示す。
【0071】
異常検出のためのCPCモデルの性能を向上させるために、本開示は、2つの調整を含む。第1に、テスト中の負のサンプルのセットアップが適合させられ、それによって、異常なパッチが正のサンプル内にのみ出現し得るようになる。第2に、CPCモデルの自己回帰部分が省略される。これらの調整により、提示された本方法は、困難なMVTec-ADデータセットなどの実世界データで有望な性能を達成する。
【0072】
対比学習:
対比学習に基づく自己教師あり方法は、2つの(ランダム又は擬似ランダムに)変換された入力が、同一の入力サンプルに由来するのか、又は、データセット全体からランダムに抽出された2つのサンプルに由来するのかをモデルに決定させることによって機能する。異なる変換は、ドメインと下流側タスクとによって選択することができる。例えば、画像データにおいては、ランダムなトリミングやカラージッタリングなどのランダムなデータ増補が考慮される。本開示においては、対比予測符号化モデルは、時間的変換を使用する。これらのアプローチは、作成された表現の上面で線形分類器をトレーニングし、この線形分類器が下流側タスクで達成した性能を測定することによって評価された。
【0073】
異常検出:
異常検出方法は、3つのカテゴリに、即ち、密度、再構成及び識別に基づく方法に大別され得る。密度に基づく方法は、データの確率分布を推定することによって異常を予測する(例えば、GAN、VAE、又は、フローに基づくモデル)。再構成に基づく方法は、再構成目的でトレーニングされたモデルに基づいている(例えば、自己符号化器)。識別に基づく方法は、異常データと正常データとの間の決定境界を学習する(例えば、SVM、1クラス分類)。本開示において提案される方法は、識別的1クラス目的での密度に基づく方法を含むが、これらに限定されない。
【0074】
対比予測符号化:
対比予測符号化は、データの構造をてこ入れし、時間的に近接した入力が潜在空間において同様に符号化されるように強制する自己教師あり表現学習アプローチである。これは、サンプルの対が、時間的に近いサンプルで作り上げられているか、又は、ランダムに割り当てられたサンプルで作り上げられているかをモデルに決定させることによって達成される。このアプローチは、画像をパッチに分割し、パッチの各行を別個の時間ステップとして解釈することにより、静的画像データにも適用することができる。
【0075】
CPCモデルは、対比損失関数を使用しており、この関数は、ノイズ対比推定に基づき、かつ、パッチの潜在表現(z
t)とそれらの周辺パッチ(c
t+k)との間の相互情報を最適化するように設計されたInfoNCEとして既知の1つを含む。
【数24】
ここで、z
t=g
enc(x
t)及びg
encは、非線形符号器を表し、c
t=g
ar(z
≦t)及びg
arは、自己回帰モデルを表す。さらに、W
kは、k時間ステップ先の予測に使用する線形変換を記述している。サンプルのセットXは、1つの正のサンプル(x
t,x
t+k)と、x
jが現在のバッチ全体からランダムにサンプリングされたN-1個の負のサンプル(x
t,x
j)とからなっている。
【0076】
異常検出のためのCPC:
CPCモデルは、異常検出及びセグメンテーションのために適用される。この設定におけるCPCモデルの性能を向上させるために、そのアーキテクチャに対する2つの調整が考慮される(
図9参照)。第1に、自己回帰モデルg
arが省略される。その結果として、損失関数は以下のように変化する。
【数25】
ここで、
【数26】
は、期待関数であり、z
tは、符号化された時系列の局所潜在表現であり、tは、時間インデックスであり、W
kは、パラメータの行列であり、kは、時間インデックスの幅であり、exp(a)は、指数関数であり、L
Xは、対比予測符号化(CPC)損失であり、c
tは、コンテキスト表現である。
【0077】
この調整は、結果として有用な潜在表現を学習することができる一方で、より簡素なモデルを生じさせる。第2に、テスト中の負のサンプルのセットアップが変更される。CPCモデルの1つの実装においては、負のサンプルとして同一のテストバッチ内からのランダムなパッチが使用される。しかしながら、これは、結果として異常なパッチを含む負のサンプルを生じさせる場合があり、これは、モデルにとって正のサンプル内において異常なパッチを検出することが難しくなる可能性がある。これを回避するために、トレーニングセットの非異常画像のサブセットを使用する新規なサンプリングアプローチが考慮される。
【0078】
テスト段階において、式(6)における損失関数は、画像パッチx
t+kが異常として分類可能であるかどうかを決定するために使用することができる。
【数27】
【0079】
閾値τは、陰関数表示のままであり、受信機動作特性曲線下方領域(AUROC)は、性能指標として使用することができる。一方の解決手段は、パッチxt+kごとの異常スコアを使用することにより、異常セグメンテーションマスクを作成することであり、他方の解決手段は、画像内のパッチのスコアにわたる平均化によってサンプルが異常であるかどうかを決定することである。
【0080】
実験:
異常検出及びセグメンテーションのための提案された対比予測符号化モデルは、MVTec-ADデータセットで評価された。このデータセットは、画素精度の注釈を有する10個のオブジェクトと5個のテクスチャとの高解像度画像を含み、クラスごとに60から391の間のトレーニング画像を提供する。次に、すべての画像を768×768画素にランダムにトリミングし、それをサイズ256×256のパッチに分割し、ここで、各パッチは、隣接するパッチとの50%の重複部分を有する。これらのパッチは、さらにサイズ64×64のサブパッチに分割され、50%の重複部分も伴う。これらのサブパッチは、異常検出のためにInfoNCE損失(
図1)で使用される。トリミングされた画像は、トレーニング中に50%の確率で水平方向に反転させる。
【0081】
次いで、ResNet-18 v2が、符号器gencとして第3の残余ブロックまで使用された。別個のモデルは、1.5e-4の学習率を有するAdamオプティマイザーを使用して150のエポックについて16のバッチサイズで各クラスについてゼロからトレーニングされた。このモデルは、グレースケール画像によりトレーニングされかつ評価された。異常なパッチの指標としてのInfoNCE損失の精度を増加させるために、モデルが2方向において適用される。画像の最上部行から最下部行への方向及び最下部行から最上部行への方向の両方で共有の符号器が使用されるが、各方向については別個のWkが使用される。
【0082】
異常検出
異常検出のための提案されたモデルの性能は、トリミングされた画像内のすべてのサブパッチにわたって上位5%のInfoNCE損失値を平均化し、この値をAUROCスコアの計算のために使用することによって評価された。表1は、事前トレーニングされた特徴抽出器を使用しないシステムを含む例示的な比較である。提案されたCPC-ADモデルは、カーネル密度推定モデル(KDE)及び自動符号化モデル(Auto)を大幅に改善する。本開示のモデルの性能はCut-Pasteモデルに劣るが、CPC-ADは、異常検出のためのより一般的に適用可能なアプローチを提供する。Cut-Pasteモデルは、データセット内において遭遇する異常に類似するように設計された、ランダムにサンプリングされた人工的異常に大きく依存する。その結果として、異常が正常なデータとは意味論的に異なるk-classes-outタスクには適用することができない。
【0083】
【0084】
表1.MVTec-ADテストセットにおけるカテゴリごとの異常検出AUROCスコアである。提案されたCPC-ADアプローチは、カーネル密度推定モデル(KDE)及び自動符号化モデル(Auto)よりも大幅に優れており、そのトレーニングのためにデータセット固有の増補に大きく依存しているCutPasteモデルによって優れた性能を発揮している。
【0085】
異常セグメンテーション:
提案されたCPC-ADモデルの異常セグメンテーション性能の評価のために、サブパッチ単位のInfoNCE損失値が画素単位の正解レベルの注釈との整合のためにアップサンプリングされる。重複するサブパッチのInfoNCE損失が平均化され、結果として生じた値が、影響を受けたすべての画素に割り当てられる。トリミングされた画像(768×768)と同一次元の半分のサブパッチ(32×32画素)の解像度で異常セグメンテーションマスクが作成される。
【0086】
表2は、提案されたCPC-AD方法の異常セグメンテーション性能の例示的な比較である。MVTec-ADデータセットにおける最良の結果は、FCDD及びPaDiMなどのImageNet上において事前トレーニングされた、又は、CutPasteなどの追加の人工異常及びアンサンブル方法を使用する広範なモデルによって達成される。本開示において提示されるモデルは、ゼロからトレーニングされ、単に提供されたトレーニングデータを使用するため、複雑ではなくなり、より一般的な方法となる。提案されたCPC-ADアプローチは、2つの自動エンコードアプローチ(AE-SSIM、AE-L2)及びGANに基づくアプローチ(AnoGAN)によってさらに優れた性能を発揮している。
【0087】
本開示において提示されたモデルは、ほとんどのクラスにわたる大量の画像に対する正確なセグメンテーションマスクの生成を成功させている(
図10)。トランジスタなどの画素単位のAUROCスコアが低いクラスについてさえも、作成されたセグメンテーションマスクは、異常な入力領域を適正に強調することが見てとれる。これは、CPC-AD方法がこのクラスに対して比較的高い検出性能を達成していることに対応している(表1)。これらの結果は、(検出スコアに比較して)低いセグメンテーションスコアの一部が、正解レベルからの小さい空間偏差に起因し得ることを示している。この効果は、このパッチ単位のアプローチが作成するセグメンテーションマスクの比較的低い解像度によって悪化する可能性がある。
【0088】
【0089】
表2は、異常セグメンテーション、即ち、カテゴリごとのMVTec-ADテストセットにおける画素単位のAUROCスコアであり、AE-SSIM、AE-L2、AnoGAN、CutPaste、及び、事前トレーニングされた特徴抽出器を使用しない提示されたCPC-ADモデルである。(*印により示す)FCDD及びPaDiMは、これらの結果の向上のために事前トレーニングを使用している。
【0090】
総合的に、CPC-ADモデルは、対比学習が異常検出だけでなく、異常セグメンテーションにも適用することができることを示している。提案された方法は、データの大部分について他に負けない結果と共に異常検出タスクにおいて良好な性能を発揮している。さらに、このモデルは、最新のセグメンテーション方法よりも依然として優れた性能を発揮するという事実にもかかわらず、生成されたセグメンテーションマスクは、対比学習に基づく異常セグメンテーション方法への有望な第一歩を提供する。
【0091】
図11乃至
図16は、例示的な実施形態を示すが、本開示の概念は、付加的な実施形態に適用されるものとしてもよい。いくつかの例示的な実施形態には、態様がビデオ、ウエイト、IR、3Dカメラ及びサウンドを含み得る産業用途、態様がトルク、圧力、温度、距離又はサウンドを含み得る電動工具又は家電製品用途、態様が超音波、ビデオ、CATスキャン、MRI又はサウンドを含み得る医療用途、態様がビデオ、超音波、LIDAR、IR又はサウンドを含み得るロボット用途、態様がビデオ、サウンド、IR又はLIDARを含み得るセキュリティ用途が含まれる。これらの態様は、多様なデータセットを有し得るものであり、例えば、ビデオデータセットは、画像を含み得るものであり、LIDARデータセットは、点状クラウドを含み得るものであり、マイクロフォンデータセットは、時系列を含み得るものである。
【0092】
図11は、少なくとも部分的に自律的な車両であり得る車両又は少なくとも部分的に自律的なロボットを制御するように構成された制御システム1102の概略図である。この車両は、センサ1104とアクチュエータ1106とを含む。センサ1104は、1つ以上の波動エネルギーに基づくセンサ(例えば、電荷結合デバイスCCD又はビデオ)、レーダ、LiDAR、マイクロフォンアレイ、超音波、赤外線、熱映像、音響映像、又は、他の技術(例えばGPSなどの測位センサ)を含み得る。1つ以上の特定のセンサのうちの1つ以上は、車両内に統合されるものとしてもよい。代替的又は上記で特定された1つ以上の特定のセンサに対して付加的に、制御モジュール1102は、実行時に、アクチュエータ1104の状態を決定するように構成されたソフトウェアモジュールを含み得る。
【0093】
車両が少なくとも部分的に自律的な車両である実施形態においては、アクチュエータ1106は、車両のブレーキシステム、推進システム、エンジン、駆動系又は操舵システムにおいて具現化され得る。アクチュエータ制御コマンドは、車両が検出された物体との衝突を回避するようにアクチュエータ1106が制御されるように決定されるものとしてもよい。検出された物体は、分類器が、歩行者や樹木などの可能性が最も高いとみなすことに従って分類されるものとしてもよい。アクチュエータ制御コマンドは、分類に依存して決定するものとしてもよい。例えば、制御システム1102は、物体との衝突を回避するために、センサ1104からの(例えば、光学的、音響的、熱的)画像又は他の入力を、1つ以上の背景クラスと1つ以上の物体クラス(例えば、歩行者、自転車、車両、樹木、交通標識、交通信号、道路の破片、又は、建設現場用の樽/コーンなど)とに区分し、アクチュエータ1106に、この場合の具現化においてはブレーキシステム又は推進システムに制御命令を送信することができる。他の例においては、制御システム1102は、画像を1つ以上の背景クラスと1つ以上の標識クラス(例えば、車線標識、ガードレール、車道縁部、車両走路など)とに区分し、車両が標識の横断を回避して車線内に留まるように、ここでは操舵システム内において具現化されているアクチュエータ1106に制御命令を送信することができる。敵対的攻撃が発生し得るシナリオにおいては、上述したシステムは、物体をより良好に検出するために、又は、車両上のセンサ若しくはカメラに対する照明条件若しくは角度の変化を識別するために、さらにトレーニングされるものとしてもよい。
【0094】
車両1100が少なくとも部分的に自律的なロボットである他の実施形態においては、車両1100は、飛行、スイミング、ダイビング及びステッピングなどの1つ以上の機能を実行するように構成された移動型ロボットであるものとしてもよい。この移動型ロボットは、少なくとも部分的に自律的な芝刈り機又は少なくとも部分的に自律的な清掃ロボットであるものとしてもよい。そのような実施形態においては、アクチュエータ制御命令1106は、移動型ロボットが識別された物体との衝突を回避することができるように、移動型ロボットの推進ユニット、操舵ユニット及び/又はブレーキユニットが制御され得るように決定されるものとしてもよい。
【0095】
他の実施形態においては、車両1100は、園芸ロボットの形態の少なくとも部分的に自律的なロボットである。そのような実施形態においては、車両1100は、車両1100に近接する環境における植物の状態を決定するために、センサ1104として光学的センサを使用することができる。アクチュエータ1106は、化学薬品を噴霧するように構成されたノズルであるものとしてもよい。植物の識別された種及び/又は識別された状態に依存して、アクチュエータ制御命令1102は、アクチュエータ1106に、適当な量の適当な化学薬品を植物に噴霧させるように決定されるものとしてもよい。
【0096】
車両1100は、家庭用電化製品の形態の少なくとも部分的に自律的なロボットであるものとしてもよい。家庭用電化製品の非限定的な例には、洗濯機、ストーブ、オーブン、電子レンジ又は食器洗浄機が含まれる。そのような車両1100においては、センサ1104は、家庭用電化製品による処理を受ける物体の状態を検出するように構成された光学的又は音響的センサであるものとしてよい。例えば、家庭用電化製品が洗濯機である場合においては、センサ1104は、洗濯機内の洗濯物の状態を検出することができる。アクチュエータ制御命令は、洗濯物の検出された状態に基づいて決定されるものとしてもよい。
【0097】
本実施形態においては、制御システム1102は、センサ1104から(光学的又は音響的に)画像及び注釈情報を受信することとなる。これらの情報と、システム内に記憶されている所定のクラス数k及び類似性尺度
【数28】
とを使用することにより、制御システム1102は、センサ1104から受信した画像の各画素を分類するために
図10に記載の方法を使用することができる。この分類に基づいて、例えば、歩行者若しくは樹木との衝突を回避するために制動し若しくは旋回し、検出された車線標識の間に留まるように操舵し、又は、上述したようにアクチュエータ1106によって行われる任意の動作を行うために、信号は、アクチュエータ1106に送信されるものとしてよい。この分類に基づいて、例えば、カメラレンズの焦点合わせ又は移動のために、信号は、センサ1104に送信されるものとしてもよい。
【0098】
図12は、生産ラインの一部などの製造システム102のパンチカッタ、カッタ又はガンドリルなどのシステム1200(例えば、製造機械)を制御するように構成された制御システム1202の概略図を示している。この制御システム1202は、システム1200(例えば、製造機械)を制御するように構成されたアクチュエータ1206を制御するように構成されるものとしてもよい。
【0099】
システム1200(例えば、製造機械)のセンサ1204は、製造された製品の1つ以上の特性を捕捉するように構成された光学的センサ又は音響的センサ又はセンサアレイなどの波動エネルギーセンサであるものとしてもよい。制御システム1202は、捕捉された特性のうちの1つ以上から製造された製品の状態を決定するように構成されるものとしてもよい。アクチュエータ1206は、製造された製品の後続の製造ステップのために、製造された製品104の決定された状態に依存してシステム1202(例えば、製造機械)を制御するように構成されるものとしてもよい。アクチュエータ1206は、先の製造された製品の決定された状態に依存して、システム(例えば、製造機械)の後続の製造された製品に関する
図12の機能部(例えば、製造機械)を制御するように構成されるものとしてもよい。
【0100】
本実施形態においては、制御システム1202は、センサ1204から(例えば、光学的又は音響的に)画像及び注釈情報を受信することとなる。これらの情報と、システム内に記憶されている所定のクラス数k及び類似性尺度
【数29】
とを使用することにより、制御システム1202は、センサ1204から受信した画像の各画素を分類し、例えば、製造された物体の画像を2以上のクラスに分類し、製造された製品における異常を検出し、製造された製品上のバーコードなどの物体の存在を保証するために
図10に記載の方法を使用することができる。この分類に基づいて、信号がアクチュエータ1206に送信されるものとしてもよい。例えば、制御システム1202が製品において異常を検出した場合、アクチュエータ1206は、異常又は欠陥のある製品をマークすることができ又はラインから除去することができる。他の例においては、制御システム1202が、バーコード又は製品上に配置される他の物体の存在を検出した場合、アクチュエータ1206は、これらの物体を適用することができ又はそれらを除去することができる。この分類に基づいて、例えば、カメラレンズの焦点合わせや移動のために、信号は、センサ1204に送信されるものとしてもよい。
【0101】
図13は、少なくとも部分的に自律的なモードを有する電動ドリル又はドライバなどの電動工具1300を制御するように構成された制御システム1302の概略図を示している。この制御システム1302は、電動工具1300を制御するように構成されたアクチュエータ1306を制御するように構成されるものとしてもよい。
【0102】
電動工具1300のセンサ1304は、作業面及び/又は作業面に打ち込まれる留め具の1つ以上の特性を捕捉するように構成された光学的又は音響的センサなどの波動エネルギーセンサであるものとしてもよい。制御システム1302は、捕捉された特性のうちの1つ又は複数から、作業面の状態及び/又は留め具の作業面に対する状態を決定するように構成されるものとしてもよい。
【0103】
本実施形態においては、制御システム1302は、センサ1304から(例えば、光学的又は音響的に)画像及び注釈情報を受信することとなる。これらの情報と、システム内に記憶されている所定のクラス数k及び類似性尺度
【数30】
とを使用することにより、制御システム1302は、作業面又は留め具の画像を2以上のクラスに分類する又は作業面若しくは留め具の異常を検出する目的で、センサ1304から受信した画像の各画素を分類するために
図10に記載の方法を使用することができる。この分類に基づいて、信号は、例えば、工具の圧力若しくは速度、又は、上記の箇所において説明したようにアクチュエータ1306によって実行される任意の動作のためにアクチュエータ1306に送信されるものとしてもよい。この分類に基づいて、例えば、カメラレンズの焦点合わせや移動のために、信号は、センサ1304に送信されるものとしてもよい。他の例においては、画像は、電動工具がハンマドリル、ドリル、ハンマ(回転式又は解体式)、インパクトドライバ、レシプロソー、振動マルチツールであり、電動工具がコードレス又はコード式である場合の圧力、トルク、毎分回転数、温度、電流などの電動工具1300からの信号の時系列画像であるものとしてもよい。
【0104】
図14は、自動化されたパーソナルアシスタント1401を制御するように構成された制御システム1402の概略図を示している。この制御システム1402は、自動化されたパーソナルアシスタント1401を制御するように構成されたアクチュエータ1406を制御するように構成されるものとしてもよい。自動化されたパーソナルアシスタント1401は、洗濯機、ストーブ、オーブン、電子レンジ又は食器洗浄機などの家庭用電化製品を制御するように構成されるものとしてもよい。
【0105】
本実施形態においては、制御システム1402は、センサ1404から(例えば、光学的又は音響的に)画像及び注釈情報を受信することとなる。これらの情報と、システム内に記憶されている所定のクラス数k及び類似性尺度
【数31】
とを使用することにより、制御システム1402は、センサ1404から受信した画像の各画素を分類し、例えば、操作又は動作すべき家電製品又は他の物体の画像を区分するために、
図10に記載の方法を使用することができる。この分類に基づいて、例えば、自動化されたパーソナルアシスタント1401の可動部を制御して家庭用電化製品と相互作用するために、又は、上記の箇所において説明したようにアクチュエータ1406によって実行される任意の動作のために、信号は、アクチュエータ1406に送信されるものとしてよい。この分類に基づいて、例えば、カメラレンズの焦点合わせ又は移動のために、信号は、センサ1404に送信されるものとしてもよい。
【0106】
図15は、監視システム1500を制御するように構成された制御システム1502の概略図を示している。この監視システム1500は、ドア252を通るアクセスを物理的に制御するように構成されるものとしてもよい。センサ1504は、アクセスが許可されるか否かの決定において関連するシーンを検出するように構成されるものとしてもよい。センサ1504は、画像データ及び/又はビデオデータを生成し伝送するように構成された光学的又は音響的センサ又はセンサアレイであるものとしてもよい。そのようなデータは、人の顔を検出するために制御システム1502によって使用されるものとしてもよい。
【0107】
監視システム1500は、サーベイランスシステムであるものとしてもよい。そのような実施形態においては、センサ1504は、監視下にあるシーンを検出するように構成された光学的センサ、赤外線センサ、音響的センサなどの波動エネルギーセンサであるものとしてよい。制御システム1502は、ディスプレイ1508を制御するように構成される。制御システム1502は、シーンの分類、例えば、センサ1504によって検出されたシーンが不審であるか否かを決定するように構成される。最適でない条件(例えば、夜、霧、雨、背景ノイズの干渉など)においてシステムにそのようなオブジェクトの識別を可能にさせる目的で所定のタイプのオブジェクト検出のために摂動オブジェクトが利用されるものとしてもよい。制御システム1502は、分類に応じて、アクチュエータ制御命令をディスプレイ1508に伝送するように構成される。ディスプレイ1508は、アクチュエータ制御命令に応じて、表示されたコンテンツを調整するように構成されるものとしてもよい。例えば、ディスプレイ1508は、コントローラ1502によって疑わしいとみなされたオブジェクトを強調することができる。
【0108】
本実施形態においては、制御システム1502は、センサ1504から(光学的又は音響的に)画像及び注釈情報を受信することとなる。これらの情報と、システム内に記憶されている所定のクラス数k及び類似性尺度
【数32】
とを使用することにより、制御システム1502は、例えば、シーン内の不審な若しくは望ましくないオブジェクトの存在を検出し、照明若しくは視聴条件のタイプを検出し、又は、動作を検出する目的で、センサ1504から受信した画像の各画素を分類するために
図10に記載の方法を使用することができる。この分類に基づいて、信号は、例えば、ドア若しくは他の入口のロック若しくはロック解除のために、アラーム若しくは他の信号の起動のために、又は、上記の箇所において説明したようにアクチュエータ1506によって実行される任意の動作のために、アクチュエータ1506に送信されるものとしてもよい。この分類に基づいて、例えば、カメラレンズの焦点合わせや移動のために、信号は、センサ1504に送信されるものとしてもよい。
【0109】
図16は、例えば、MRI装置、X線撮像装置又は超音波装置などの撮像システム1600を制御するように構成された制御システム1602の概略図を示している。センサ1604は、例えば、撮像センサ又は音響的センサアレイであるものとしてもよい。制御システム1602は、感知された画像のすべて又は一部の分類を決定するように構成されるものとしてもよい。制御システム1602は、トレーニングされたニューラルネットワークによって取得された分類に応じて、アクチュエータ制御命令を決定又は選択するように構成されるものとしてもよい。例えば、制御システム1602は、(光学的又は音響的に)感知された画像の領域が潜在的に異常であると解釈することができる。この場合においては、アクチュエータ制御命令は、ディスプレイ1606に撮像を表示させ、潜在的に異常領域を強調させるように決定又は選択されるものとしてもよい。
【0110】
本実施形態においては、制御システム1602は、センサ1604から画像及び注釈情報を受信することとなる。これらの情報と、システム内に記憶されている所定のクラス数k及び類似性尺度
【数33】
とを使用することにより、制御システム1602は、センサ1604から受信した画像の各画素を分類するために、
図10に記載の方法を使用することができる。この分類に基づいて、例えば、画像の異常領域を検出するために、又は、上記の箇所において説明したようにアクチュエータによって実行される任意の動作のために、信号は、アクチュエータに送信されるものとしてよい。
【0111】
本明細書において説明したアルゴリズム及び/又は方法論を具現化したプログラムコードは、様々な異なる形態のプログラム製品として個別に又はまとめて配布することが可能である。このプログラムコードは、プロセッサに1つ以上の実施形態の態様を実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読記憶媒体を使用して配布されるものとしてもよい。本質的に非一時的であるコンピュータ可読記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール又は他のデータなどの情報を記憶するための任意の方法又は技術により実装された揮発性及び不揮発性並びに着脱可能及び非着脱可能な有形媒体を含み得る。コンピュータ可読記憶媒体は、RAM、ROM、消去可能プログラマブル読取り専用メモリ(EPROM)、電気的消去可能プログラマブル読取り専用メモリ(EEPROM)、フラッシュメモリ若しくは他の固体メモリ技術、携帯用コンパクトディスク読取り専用メモリ(CD-ROM)若しくは他の光学的ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ若しくは他の磁気的記憶デバイス、又は、所望の情報を記憶するために使用することができ、かつ、コンピュータによって読み取ることができる任意の他の媒体をさらに含み得る。コンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からコンピュータ、他の種類のプログラマブルデータ処理装置又は他のデバイスにダウンロードされるものとしてもよいし、ネットワークを介して外部のコンピュータ又は外部記憶デバイスにダウンロードされるものとしてもよい。
【0112】
コンピュータ可読媒体に記憶されたコンピュータ可読プログラム命令は、コンピュータ、他のタイプのプログラマブルデータ処理装置、又は、他のデバイスが特定の手法により機能するように指示するために使用されるものとしてもよく、それによって、コンピュータ可読媒体に記憶された命令は、フローチャート又はダイヤグラムに指定された機能、動作及び/又は操作を実施する命令を含む製造物品を生成するようにさせる。所定の代替的実施形態においては、フローチャート及びダイヤグラムにおいて指定された機能、動作及び/又は操作は、1つ以上の実施形態と整合するように、再順序付けされ、逐次的に処理され、及び/又は、同時に処理されるものとしてもよい。その上さらに、任意のフローチャート及び/又はダイヤグラムは、1つ以上の実施形態と整合するように示されたノード又はブロックよりも多い又は少ないノード又はブロックを含み得る。
【0113】
本発明のすべてが様々な実施形態の説明によって示され、これらの実施形態が非常に詳細に説明されてきたが、添付の請求項の権利範囲をそのような詳細に制限すること又はいかなる方法によっても限定することは、出願人の意図するところではない。付加的な利点及び変更は、当業者には容易に明らかになる。従って、その広範な態様における本発明は、図示され、説明されてきた特定の詳細、代表的な装置及び方法並びに例示的な実施例に限定されるものではない。従って、包括的な発明概念の精神又は範囲から逸脱することなく、そのような詳細を起点とすることができる。
【手続補正書】
【提出日】2022-09-12
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
コントローラを含む遠隔通信システムであって、
前記コントローラは、
パッチにグループ化される時系列データを受信し、
前記各パッチについて局所潜在表現を取得するために、符号器のパラメータを介して前記データを符号化し、
前記各パッチについて、前記局所潜在表現から対比予測符号化(CPC)損失を決定し、
前記各パッチに関連する前記局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換し、
前記一連の多様に変換されたベクトル表現から動的決定論的対比損失(DDCL)を計算し、
更新されたパラメータを取得するために、前記CPC損失と前記DDCLとを組み合わせ、
前記更新されたパラメータを用いて符号化のパラメータを更新し、
前記各パッチに関連する多様な意味論的要求スコアを取得するために、前記DDCLを介して前記一連の多様に変換されたベクトル表現の各々をスコアリングし、
損失領域を取得するために、前記多様な意味論的要求スコアを平滑化し、
検証されたデータを取得するために、前記損失領域に関連するデータをマスキングし、
前記検証されたデータに基づいて前記遠隔通信システムを動作させる
ように構成されている、遠隔通信システム。
【請求項2】
前記コントローラは、ビタビ復号化を介して前記多様な意味論的要求スコアを平滑化するように構成されている、請求項1に記載の遠隔通信システム。
【請求項3】
前記コントローラは、前記損失領域を取得するために、
前記多様な意味論的要求スコアの履歴を作成し、かつ、閾値を超えるスコアを有するデータをフィルタリングすることにより、前記多様な意味論的要求スコアを平滑化するように構成されている、請求項1に記載の遠隔通信システム。
【請求項4】
前記コントローラは、前記ベクトル表現から前記CPC損失を、次式
【数1】
に従って計算するように構成されており、ここで、前記
【数2】
は、期待関数であり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記f
k(a,b)=f(a,W
kb)は、前記W
kによってパラメータ化された2つの引数間の比較関数であり、前記L
CPCは、前記対比予測符号化(CPC)損失であり、前記c
tは、コンテキスト表現である、請求項
1に記載の遠隔通信システム。
【請求項5】
前記コントローラは、前記一連の多様に変換されたベクトル表現の各々を、次式
【数3】
に従ってスコアリングするように構成されており、ここで、前記
【数4】
は、スコアであり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記
【数5】
は、コサイン類似性関数であり、前記c
tは、コンテキスト表現である、請求項
1に記載の遠隔通信システム。
【請求項6】
パッチにグループ化される時系列データを受信するステップと、
前記各パッチについて局所潜在表現を取得するために、符号器のパラメータを介して前記データを符号化するステップと、
前記各パッチについて、前記局所潜在表現から表現損失を決定するステップと、
前記各パッチに関連する前記局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換するステップと、
前記一連の多様に変換されたベクトル表現から動的決定論的対比損失(DDCL)を決定するステップと、
更新されたパラメータを取得するために、前記表現損失と前記DDCLとを組み合わせるステップと、
前記更新されたパラメータを用いて前記符号器のパラメータを更新するステップと、
前記各パッチに関連する多様な意味論的要求スコアを取得するために、前記DDCLを介して前記一連の多様に変換されたベクトル表現の各々をスコアリングするステップと、
損失領域を取得するために、前記多様な意味論的要求スコアを平滑化するステップと、
検証されたデータを取得するために、前記損失領域に関連するデータをマスキングするステップと、
前記検証されたデータを出力するステップと、
を含む異常領域検出方法。
【請求項7】
前記データを符号化するステップは、リカレントニューラルネットワーク(RNN)又は畳み込みニューラルネットワーク(CNN)を介して実行される、請求項6に記載の異常領域検出方法。
【請求項8】
前記多様な意味論的要求スコアを平滑化するステップは、ビタビ復号化を介して実行される、請求項6に記載の異常領域検出方法。
【請求項9】
前記多様な意味論的要求スコアを平滑化するステップは、前記損失領域を取得するために、
前記多様な意味論的要求スコアの履歴を作成するステップと、
閾値を超えるスコアを有するデータをフィルタリングするステップと、
を含む、請求項6に記載の異常領域検出方法。
【請求項10】
前記表現損失を計算するステップは、対比予測符号化(CPC)損失を計算するステップである、請求項6に記載の異常領域検出方法。
【請求項11】
前記ベクトル表現から前記CPC損失を計算するステップは、次式
【数6】
に従って計算され、ここで、前記
【数7】
は、期待関数であり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記f
k(a,b)=f(a,W
kb)は、前記W
kによってパラメータ化された2つの引数間の比較関数であり、前記L
CPCは、前記対比予測符号化(CPC)損失であり、前記c
tは、コンテキスト表現である、請求項
10に記載の異常領域検出方法。
【請求項12】
前記多様に変換されたベクトル表現からDDCL損失を計算するステップは、次式
【数8】
に従って計算され、ここで、前記
【数9】
は、期待関数であり、前記tは、時間インデックスであり、前記kは、時間インデックスの幅であり、前記lは、局所ニューラル変換のインデックスであり、前記
【数10】
は、スコアであり、前記L
DDCLは、動的な決定論的対比損失である、請求項
6に記載の異常領域検出方法。
【請求項13】
前記一連の多様に変換されたベクトル表現の各々をスコアリングするステップは、次式
【数11】
に従って計算され、ここで、前記
【数12】
は、スコアであり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記
【数13】
は、コサイン類似性関数であり、前記c
tは、コンテキスト表現である、請求項
6に記載の異常領域検出方法。
【請求項14】
前記方法は、前記検証されたデータに基づいて機械を動作させるステップをさらに含み、前記時系列データは、センサから受信される、請求項6に記載の異常領域検出方法。
【請求項15】
コントローラを含む異常領域検出システムであって、
前記コントローラは、
第1のセンサからパッチにグループ化される時系列データを受信し、
前記各パッチについて局所潜在表現を取得するために、符号器のパラメータを介して前記データを符号化し、
前記各パッチについて、局所潜在表現から対比予測符号化(CPC)損失を計算し、
前記各パッチに関連する局所潜在表現を、少なくとも2つの局所ニューラル変換を介して一連の多様に変換されたベクトル表現に変換し、
前記一連の多様に変換されたベクトル表現から動的決定論的対比損失(DDCL)を計算し、
更新されたパラメータを取得するために、前記CPC損失と前記DDCLとを組み合わせ、
前記更新されたパラメータを用いて符号化のパラメータを更新し、
前記各パッチに関連する多様な意味論的要求スコアを取得するために、前記DDCLを介して前記一連の多様に変換されたベクトル表現の各々をスコアリングし、
損失領域を取得するために、前記多様な意味論的要求スコアを平滑化し、
検証されたデータを取得するために、前記損失領域に関連するデータをマスキングし、
前記検証されたデータに基づいて機械を動作させる
ように構成されている、異常領域検出システム。
【請求項16】
前記コントローラは、ビタビ復号化を介して前記多様な意味論的要求スコアを平滑化するように構成されている、請求項15に記載の異常領域検出システム。
【請求項17】
前記コントローラは、前記損失領域を取得するために、
前記多様な意味論的要求スコアの履歴を作成し、かつ、閾値を超えるスコアを有するデータをフィルタリングすることにより、前記多様な意味論的要求スコアを平滑化するように構成されている、請求項15に記載の異常領域検出システム。
【請求項18】
前記コントローラは、前記ベクトル表現から前記CPC損失を、次式
【数14】
に従って計算するように構成されており、ここで、前記
【数15】
は、期待関数であり、前記z
tは、符号化されたデータの局所潜在表現であり、前記tは、時間インデックスであり、前記W
kは、パラメータの行列であり、前記kは、時間インデックスの幅であり、前記f
k(a,b)=f(a,W
kb)は、前記W
kによってパラメータ化された2つの引数間の比較関数であり、前記L
CPCは、前記対比予測符号化(CPC)損失であり、前記c
tは、コンテキスト表現である、請求項
15に記載の異常領域検出システム。
【請求項19】
前記第1のセンサは、光学的センサ、車載センサ、又は、音響的センサであり、前記機械は、自律的な車両である、請求項15に記載の異常領域検出システム。
【請求項20】
前記第1のセンサは、RFセンサであり、前記機械は、遠隔通信機械である、請求項15に記載の異常領域検出システム。
【外国語明細書】