特許7499360 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌイーシー　ラボラトリーズ　アメリカ　インクの特許一覧

特許7499360深層学習によるコンパクトな表現と時系列セグメントの取得

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-06-05

(45)【発行日】2024-06-13

(54)【発明の名称】深層学習によるコンパクトな表現と時系列セグメントの取得

(51)【国際特許分類】

G06F 16/9032 20190101AFI20240606BHJP

G05B 23/02 20060101ALI20240606BHJP

【ＦＩ】

G06F16/9032

G05B23/02 Z

【請求項の数】 20

(21)【出願番号】P 2022578605

(86)(22)【出願日】2021-07-01

(65)【公表番号】

(43)【公表日】2023-07-31

(86)【国際出願番号】 US2021040081

(87)【国際公開番号】W WO2022010731

(87)【国際公開日】2022-01-13

【審査請求日】2023-02-16

(31)【優先権主張番号】63/048,680

(32)【優先日】2020-07-07

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】17/364,125

(32)【優先日】2021-06-30

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】504080663

【氏名又は名称】エヌイーシーラボラトリーズアメリカインク

【氏名又は名称原語表記】ＮＥＣＬａｂｏｒａｔｏｒｉｅｓＡｍｅｒｉｃａ，Ｉｎｃ．

(74)【代理人】

【識別番号】100123788

【弁理士】

【氏名又は名称】宮崎昭夫

(74)【代理人】

【識別番号】100127454

【弁理士】

【氏名又は名称】緒方雅昭

(72)【発明者】

【氏名】溝口毅彦

(72)【発明者】

【氏名】ソン、ドンジン

(72)【発明者】

【氏名】チェン、ユンコン

(72)【発明者】

【氏名】ルメザヌ、クリスチャン

(72)【発明者】

【氏名】チェン、ハイフォン

【審査官】齊藤貴孝

(56)【参考文献】

【文献】特開２０１３－２０６１９３（ＪＰ，Ａ）

【文献】国際公開第２０１９／１７６９８６（ＷＯ，Ａ１）

【文献】米国特許出願公開第２０１９／００３４４９７（ＵＳ，Ａ１）

【文献】特開２０１２－１３３３７１（ＪＰ，Ａ）

【文献】吉永直生、外２名，時系列データモデルフリー分析技術，ＮＥＣ技報，日本，日本電気株式会社，2019年10月31日，第７２巻，第１号，ｐ．１０４－１０８

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０５Ｂ２３／０２

(57)【特許請求の範囲】

【請求項1】

類似する多変量の時系列セグメントを取得する、コンピュータで実施される方法であって、
時系列セグメントからロング特徴ベクトル及びショート特徴ベクトルを抽出し（９２０）、
前記ロング特徴ベクトルをロングバイナリコードに変換し（９３０）、
前記ショート特徴ベクトルをショートバイナリコードに変換し（９３０）、
前記ショートバイナリコードに基づいて辞書ロングコードを保存するバイナリ辞書からロングバイナリコードのサブセットを取得し（９４０）、
辞書ロングコードと前記ロングバイナリコードとの各ペアの類似度を計算し（９５０）、
前記ロングバイナリコードと辞書ロングコードとの間の最も近い関係を示す類似度を有する所定の数の辞書ロングコードを識別し（９６０）、
前記所定の数の辞書ロングコードに関連する所定の数の時系列セグメントを検索する（９７０）、コンピュータで実施される方法。

【請求項2】

前記所定の数の時系列セグメントをユーザに表示することをさらに含む、請求項１に記載のコンピュータで実施される方法。

【請求項3】

前記ロング特徴ベクトル及び前記ショート特徴ベクトルは、長短期記憶（ＬＳＴＭ）を用いて前記時系列セグメントから抽出される、請求項１に記載のコンピュータで実施される方法。

【請求項4】

前記ロング特徴ベクトルは、前記ロング特徴ベクトルにおける全てのエントリの符号をチェックすることでロングバイナリコードに変換される、請求項３に記載のコンピュータで実施される方法。

【請求項5】

前記ショート特徴ベクトルは、線形写像によってショートバイナリコードに変換される、請求項４に記載のコンピュータで実施される方法。

【請求項6】

前記ショートバイナリコードをクラスに分類することをさらに含む、請求項５に記載のコンピュータで実施される方法。

【請求項7】

分類することは、前記時系列セグメントに関連付けられた複数のラベルのそれぞれに属する前記ショートバイナリコードの確率を計算することを含む、請求項６に記載のコンピュータによって実行される方法。

【請求項8】

類似する多変量の時系列セグメントを取得するための処理システムであって、
１つまたは複数のプロセッサ（１００４）と、
１つまたは複数のプロセッサと接続されたメモリ（１０２４）と、
時系列セグメントからロング特徴ベクトルを抽出する（９２０）ように構成された、メモリに格納されたロング特徴抽出器（３２０）と、
前記ロング特徴抽出器（３１０）によって生成されたロング特徴を、線形写像によって短い長さの特徴に変換する（９２０）ように構成された、メモリに格納されたショート特徴抽出器（３４０）と、
前記ロング特徴抽出器からのロング特徴を、ロング特徴と同じ長さを有するロングバイナリコードに変換する（９３０）ように構成された、メモリに格納されたロングバイナリ抽出器（３２０）と、
前記ショート特徴抽出器からのショート特徴を、ショート特徴と同じ長さを有するショートバイナリコードに変換する（９３０）ように構成された、メモリに記憶されたショートバイナリ抽出器（３５０）と、
クエリから抽出されたロングバイナリコードと辞書から検索された全てのロングバイナリコードとの間のペア毎の類似度（９５０）を計算し、所定のロングバイナリコードと辞書ロングコードとの間の最も近い関係を示す類似度を有する所定の数の辞書ロングコードを識別する、メモリに格納された類似度比較器（１１３０）と、
を有する、処理システム。

【請求項9】

前記ショート特徴抽出器からのショート特徴は、ショート特徴ベクトルにおける全てのエントリの符号をチェックすることで、前記ショート特徴と同じ長さを有するショートバイナリコードに変換される、請求項８に記載の処理システム。

【請求項10】

前記類似度比較器は、前記所定の数の辞書ロングコードに関連する所定の数の時系列セグメントを検索し、前記所定の数の時系列セグメントをユーザに表示するように構成された、請求項８に記載の処理システム。

【請求項11】

前記ロング特徴ベクトル及び前記ショート特徴ベクトルは、長短期記憶（ＬＳＴＭ）を用いて前記時系列セグメントから抽出される、請求項９に記載の処理システム。

【請求項12】

前記ロング特徴ベクトルは、前記ロング特徴ベクトルにおける全てのエントリの符号をチェックすることでロングバイナリコードに変換される、請求項１１に記載の処理システム。

【請求項13】

前記ショート特徴ベクトルは、線形写像によってショートバイナリコードに変換される、請求項９に記載の処理システム。

【請求項14】

前記ショートバイナリ抽出器は、前記ショートバイナリコードをクラスに分類するようにさらに構成された、請求項１３に記載の処理システム。

【請求項15】

類似する多変量の時系列セグメントを検索するための手順をコンピュータに実行させるためのプログラムであって、
前記コンピュータに、
時系列セグメントからロング特徴ベクトル及びショート特徴ベクトルを抽出し（９２０）、
前記ロング特徴ベクトルをロングバイナリコードに変換し（９３０）、
前記ショート特徴ベクトルをショートバイナリコードに変換し（９３０）、
前記ショートバイナリコードに基づいて辞書ロングコードを保存するバイナリ辞書からロングバイナリコードのサブセットを取得し（９４０）、
辞書ロングコードと前記ロングバイナリコードとの各ペアの類似度を計算し（９５０）、
前記ロングバイナリコードと辞書ロングコードとの間の最も近い関係を示す類似度を有する所定の数の辞書ロングコードを識別し（９６０）、
前記所定の数の辞書ロングコードに関連する所定の数の時系列セグメントを検索する（９７０）、手順を実行させるための、プログラム。

【請求項16】

前記コンピュータに、所定の数の時系列セグメントをユーザに表示させるための手順を実行させることをさらに含む、請求項１５に記載のプログラム。

【請求項17】

前記ロング特徴ベクトル及び前記ショート特徴ベクトルは、長短期記憶（ＬＳＴＭ）を用いて前記時系列セグメントから抽出される、請求項１５に記載のプログラム。

【請求項18】

前記ロング特徴ベクトルは、前記ロング特徴ベクトルにおける全てのエントリの符号をチェックすることでロングバイナリコードに変換される、請求項１７に記載のプログラム。

【請求項19】

前記ショート特徴ベクトルは、線形写像によってショートバイナリコードに変換される、請求項１８に記載のプログラム。

【請求項20】

前記コンピュータに、前記ショートバイナリコードをクラスに分類させるための手順を実行させることをさらに含み、前記分類は、前記ショートバイナリコードが前記時系列セグメントに関連付けられた複数のラベルのそれぞれに属する確率を計算することを含む、請求項１９に記載のプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

この出願は、２０２０年７月７日に出願された米国仮特許出願第６３／０４８，６８０号及び２０２１年６月３０日に出願された米国特許出願第１７／３６４，１２５号に対する優先権を主張し、それらの開示の全てをここに取り込む。

【0002】

本発明は、類似する多変量時系列の検索に関し、より詳細には、類似する多変量時系列を検索するためのニューラルネットワークの訓練及び実装に関する。

【背景技術】

【0003】

時系列は、ある期間にわたって時間順に収集された一連の観察またはデータポイントである。多変量時系列には複数の時間に依存する変数があり、変数の値は一定期間にわたって収集される。データポイントは時間において等間隔に配置できる。分析では、収集されたデータのパターン、特に周期性を探すことができる。時系列予測は、モデルを用いて以前に観測された値に基づき将来の値を予測することである。多変量時系列データは、現実世界のアプリケーション、例えば、発電所、炉の運転、飛行機や自動車のエンジン、大気汚染の監視のような複雑な物理システムの多くの分野で自然に発生する。時系列データは、産業プロセスの監視や、経済及びビジネスデータの追跡から発生する可能性がある。時系列データのモデルには多くの形式があり、様々な確率過程を表すことができる。

【0004】

ある期間にわたって収集された一連の観察またはデータポイントは、後で検索及び取り出すために識別及び保存できる。データポイントの各セットを識別して保存するために、バイナリコードを識別子として割り当てることができる。但し、データポイントの最適なバイナリコードを見つける問題はＮＰ困難である。

【発明の概要】

【0005】

本発明の一態様によれば、類似する多変量の時系列セグメントを検索するコンピュータで実施される方法が提供される。本方法は、時系列セグメントからロング特徴ベクトルとショート特徴ベクトルを抽出し、ロング特徴ベクトルをロングバイナリコードに変換し、ショート特徴ベクトルをショートバイナリコードに変換することを含む。さらに、本方法は、ショートバイナリコードに基づいて辞書ロングコードを保存するバイナリ辞書からロングバイナリコードのサブセットを取得することと、各辞書ロングコードを有するロング特徴ベクトルの各ペアについて類似度を計算することとを含む。さらに、本方法は、ロングバイナリコードと辞書ロングコードとの間の最も近い関係を示す類似度測度を有する所定の数の辞書ロングコードを識別すること、所定の数の辞書ロングコードに関連する所定の数の時系列セグメントを検索することとを含む。

【0006】

本発明の別の態様によれば、類似する多変量の時系列セグメントを検索するための処理システムが提供される。本システムは、１つまたは複数のプロセッサと、１つまたは複数のプロセッサに接続されたメモリとを含む。本システムは、メモリに保存されたロング特徴抽出器及びショート特徴抽出器をさらに含み、ロング特徴抽出器は、時系列セグメントからロング特徴ベクトルを抽出するように構成され、ショート特徴抽出器は、ロング特徴抽出器によって生成されたロング特徴を線形写像によりショート特徴に変換するように構成されている。本システムは、メモリに保存されたロングバイナリ抽出器及びショートバイナリ抽出器をさらに含み、ロングバイナリ抽出器は、ロング特徴抽出器からのロング特徴を、ロング特徴と同じ長さを有するロングバイナリコードに変換するように構成され、ショートバイナリ抽出器は、ショート特徴抽出器からのショート特徴を、ショート特徴と同じ長さを有するショートバイナリコードに変換するように構成されている。本システムは、メモリに保存された類似度比較器をさらに含み、類似度比較器は、クエリから抽出されたロングバイナリコードと辞書から取得された全てのロングバイナリコードとの間のペア毎の類似度を計算し、ロングバイナリコードと辞書のロングコードとの間の最も近い関係を示す類似度測度を有する、所定の数の辞書ロングコードを識別するように構成されている。

【0007】

本発明のさらに別の態様によれば、類似する多変量の時系列セグメントを検索するためのコンピュータプログラム製品であって、コンピュータプログラム製品は、プログラム命令が実装された非一時的にコンピュータで読み取り可能な記録媒体を含み、プログラム命令はコンピュータによって実行可能である。コンピュータによって実行可能なプログラム命令がコンピュータで実行されると、コンピュータに、時系列セグメントからロング特徴ベクトルとショート特徴ベクトルを抽出させ、ロング特徴ベクトルをロングバイナリコードに変換させ、ショート特徴ベクトルをショートバイナリコードに変換させる。コンピュータによって実行可能なプログラム命令は、さらにコンピュータに、ショートバイナリコードに基づいて辞書ロングコードを保存するバイナリ辞書からロングバイナリコードのサブセットを取得させ、各辞書ロングコードを有するロング特徴ベクトルの各ペアについて類似度を計算させる。コンピュータによって実行可能なプログラム命令はさらに、さらにコンピュータに、ロングバイナリコードと辞書ロングコードとの間の最も近い関係を示す類似度測度を有する所定の数の辞書ロングコードを識別させ、所定の数の辞書ロングコードに関連する所定の数の時系列セグメントを検索させる。

【0008】

これら及び他の特徴並びに利点は、以下の典型的な実施形態の詳細な説明を添付の図面と併せて読むことで明らかになるであろう。

【0009】

本開示では、後述するように、以下の図面を参照しながら好ましい実施形態について詳細に説明する。

【図面の簡単な説明】

【0010】

【図1】図１は、本発明の一実施形態による、ニューラルネットワークによってハッシュコードの後の生成のために複数のセンサから多変量時系列データを収集するための高レベルシステム／方法を示すブロック／フロー図である。

【0011】

【図2】図２は、本発明の一実施形態による、ハッシュコードを生成及び記憶するニューラルネットワークのシステム／方法を示すブロック／フロー図である。

【0012】

【図3】図３は、本発明の一実施形態による、ロング及びショート特徴抽出器を用いたロング及びショートバイナリコード生成のためのシステム／方法を示すフロー図である。

【0013】

【図4】図４は、本発明の一実施形態による、深層サブ線形ハッシングネットワーク（ＤＳＬＨＮ）のシステム／方法のアーキテクチャを示すブロック／フロー図である。

【0014】

【図5】図５は、本発明の一実施形態による、ローカルな境界を伴うトリプレット損失を示す図である。

【0015】

【図6】図６は、本発明の一実施形態による、包括的な境界を伴うトリプレット損失及び交差エントロピーを示す図である。

【0016】

【図7】図７は、本発明の一実施形態による、ハッシュコードの生成及び検索のためにニューラルネットワークを訓練する方法を示すブロック／フロー図である。

【0017】

【図8】図８は、本発明の一実施形態による、ハッシュコードの生成及び検索のためにニューラルネットワークを実施させる方法を示すブロック／フロー図である。

【0018】

【図9】図９は、本発明の一実施形態による、時系列検索のためにニューラルネットワークに実施させる方法を示すブロック／フロー図である。

【0019】

【図10】図１０は、本発明の一実施形態による、本方法及び本システムを適用できる例示的な処理システム１０００を示す図である。

【0020】

【図11】図１１は、本発明の一実施形態による、ＬＳＴＭ及びＧＲＵニューラルネットワーク及びデータベースに本方法を適用し、それらを使用できる例示的な処理システム１０００を示す図である。

【発明を実施するための形態】

【0021】

本発明の実施形態によれば、深層学習ニューラルネットワークを用いて大量の履歴データから関連性が最も高いデータを効率的に検索するために、履歴時系列データのコンパクトな表現を取得するためのシステム及び方法が提供される。多変量時系列検索のタスクは、システム状態の識別、障害検出及び障害予測を含む、複雑なシステムの多くのタスクに適用できる。センサを人に装着して健康状態を継続的に監視することもできる。システムから記録された大量の過去の多変量時系列データを用いて、同様の障害発生と比較することで、システムの現在の状態を理解できる。現在の時系列セグメントを用いてクエリを実行することで、関連する多変量の時系列セグメント（つまり、短い期間続く多変量の時系列のスライス）をデータベースから検索することを、多変量時系列検索と称す。

【0022】

しかしながら、保存されたオブジェクトを識別するために用いるメモリの量は、全てのオブジェクトコードがＲＡＭに収まるように十分に小さくすべきである。そうでない場合、すなわちオブジェクトコードの大部分をディスクに保存する必要がある場合、ディスクへのアクセスはＲＡＭへのアクセスよりもはるかに遅いため、クエリの応答時間が急激に悪化する。メモリの使用量を低減するために、時系列セグメントのより簡素な表現を取得する場合がある。未加工（raw）の入力空間における類似するサンプルは、トリプレット損失を最小限に抑制することで近くのバイナリコードに写像できるが、トリプレット損失によって捕捉される境界は、トリプレットのサンプルの選択によって異なる。交差エントロピー損失は、包括的な判定境界を捕捉するために利用できる。

【0023】

セマンティックなハッシングでは、データベースにおける各アイテムをコンパクトなバイナリコードで表すことができる。このコードは、類似するアイテムが類似のバイナリコードを有し、新しいオブジェクト入力のバイナリコードを計算できるように簡素な順伝播型ネットワークが構築されている。

【0024】

１つまたは複数の実施形態において、深層ニューラルネットワークを訓練することで、入力データのコンパクトなバイナリコードの表現を提供できる。多変量時系列検索では、バイナリ表現に基づいて現在の観測値をクエリすることで、膨大な量の履歴データから最も関連性が高い多変量の時系列セグメントを見つけることができる。例えば、発電所で何らかの障害が発生している場合、発電所のオペレータは、特定の異常な状態を識別するために、過去の同様の障害事例を参照する必要がある。したがって、関連する多変量の時系列セグメント（つまり、短期間の多変量の時系列データのスライス）をデータベースから検索するには、現在の障害状態に関する現在の時系列データセグメントをクエリする。バイナリコードは、未加工の入力空間における時系列の履歴データの相対的な類似関係をコンパクトな表現で保存できる。学習ベースのハッシングは、トリプレット損失を最小限に抑制することで、未加工の入力空間における類似するサンプルが近くのバイナリコードに写像されるように、ビット毎の表現を保持するコンパクトで類似度を学習することを目的としている。学習ベース（データ依存）のハッシュ法は、過去の訓練サンプルを活用してハッシュ関数を構築する。

【0025】

様々な実施形態において、包括的な判定境界を考慮した効率的な多変量時系列検索のために、エンドツーエンドアーキテクチャを提供することができる。相対的な類似関係を考慮するだけでは、判定境界の全体像を把握できない可能性があり、コンパクトなバイナリ表現であっても、多変量時系列データを取得するために高コストな手順が必要になる場合がある。コンパクトなバイナリ表現を用いても、関連性が最も高い時系列を取得するには、全ての履歴データの並べ替えや類似度検索等の高コストな手順が必要になる場合がある。

【0026】

様々な実施形態において、深層サブ線形ハッシングネットワーク（ＤＳＬＨＮ：Deep Sub-Linear Hashing Network）を用いて多変量時系列検索及び分類を実行できる。ＤＳＬＨＮは、長短期記憶（ＬＳＴＭ：Long Short-Term Memory）ユニットを用いて、時間ダイナミクスを捕捉する入力時系列セグメントから簡素な低次元特徴を抽出する。２つのハッシュ関数は、２つの異なる長さのバイナリコード（フルレングス（full-length）バイナリコードと、より短いサブ線形バイナリコード）を、２つの直列な全接続層によって特徴から予測できる。ＤＳＬＨＮは、１つの時系列セグメントから２つの長さが異なるバイナリコード（フルレングスバイナリコードと、より短いサブ線形バイナリコード）を生成できる。

【0027】

様々な実施形態において、教師有り学習ベースのハッシングにおける十分なラベル情報を利用するために分類器が用いられる。入力データからのコンパクトなバイナリ表現は、データ依存のハッシングまたは学習ベースのハッシングの場合がある。入力される多変量の時系列セグメント毎に異なる長さの２つのバイナリコードを抽出できるため、効率的な類似度検索を実行できる。

【0028】

１つまたは複数の実施形態において、ロング特徴抽出器及びショート特徴抽出器を含む深層ニューラルネットワークを用いて多変量時系列全体からセグメントを抽出し、ＬＳＴＭ／ＧＲＵ等の回帰型ニューラルネットワーク（ＲＮＮ）を用いて各セグメントの特徴を抽出する。ロングバイナリ抽出器は、特徴ベクトル内の全てのエントリの符号をチェックすることで、ロング特徴を同じ長さのバイナリコードに変換できる。抽出されたロングバイナリコードは、データベースに保存できる。ショート特徴抽出器は、線形写像によってロング特徴をショート特徴に変換できる。ショートバイナリ抽出器は、ショート特徴ベクトルの全てのエントリの符号をチェックすることで、ショート特徴を同じ長さのバイナリコードに変換できる。抽出されたショートバイナリコードは、データベースに保存できる。分類器は、各ラベルに属する確率を計算し、指定されたラベルに基づいて誤分類による損失を計算できる。スライディングウィンドウを用いて多変量時系列全体からセグメントを抽出できる。この場合、スライディングウィンドウの長さは、時系列の合計の長さよりも短くなる。

【0029】

本発明の態様は、特定の例示的なアーキテクチャに関して説明されることを理解されたい。しかしながら、他のアーキテクチャ、構造、構成要素及びプロセスの特徴及びステップは、本発明の態様の範囲内で変更してもよい。

【0030】

ここで、同じ数字が同一または同様の要素を表す図面、図１を詳細に参照すると、図１には、本発明の実施形態による、ニューラルネットワークによってハッシュコードの後の生成のために複数のセンサから多変量時系列データを収集するための高レベルシステム／方法を示すブロック／フロー図である。

【0031】

１つまたは複数の実施形態において、複数のセンサ１１０は、観察対象の対応するシステムに関するセンサ読み取り値を収集し、センサ読み取り値の多変量時系列データ１２０を出力１１５できる。ここで、各異なるセンサＡ、Ｂ、Ｃ、Ｄは、異なるタイプの時系列データを生成できる。センサ１１０は、例えば、温度、湿度、振動、圧力、電圧、電流、磁場、電場を測定するためのセンサ及び光センサ等の物理センサ、並びにコンピュータシステムで実行されているオペレーティングシステム及びアプリケーションの状態及び動作に関する情報を記録する、コンピュータシステムにインストールされたロギングユーティリティ等のソフトウェアセンサであり得る。収集された多変量時系列データ１２０は、センサ１１０からシステムの挙動の特定の特徴を捕捉する複数の時系列セグメント１２５、１２６から構成することが可能であり、観察対象のシステムの挙動を分析してシステムの動作を理解する及び／または予測することができる。多変量時系列データ１２０は、分析及び保存のためにニューラルネットワーク１４０に供給することが可能であり（１３０）、ニューラルネットワーク１４０は深層学習ニューラルネットワークとすることができる。

【0032】

様々な実施形態において、ニューラルネットワーク１４０は、回帰型ニューラルネットワーク（ＲＮＮ）、例えば、長短期記憶（ＬＳＴＭ）またはゲートリカレントユニット（ＧＲＵ：gated recurrent unit）であってもよい。ニューラルネットワークは、１つまたは複数の入力ノード１４２、隠れノード１４５及び出力ノード１４７を含むことができる。

【0033】

１つまたは複数の実施形態において、ニューラルネットワーク１４０は、多変量時系列データ１２０のロング及びショート特徴からバイナリコードを生成するように訓練された複数のニューラルネットワークを含むことができる。ニューラルネットワーク１４０は、バイナリコードを生成するための重みを含む１つ以上の隠れ層を有する深層ニューラルネットワークであってもよく、隠れノード１４５は１つ以上の隠れ層を形成し、隠れ層は全接続されていてもよい。

【0034】

様々な実施形態において、より最近の時系列データセグメント１２６は、同様の以前の時系列データセグメント１２５を識別するための基準となり得る。時系列検索タスクは、より最近のクエリ時系列セグメント１２６と履歴時系列セグメント１２５との間のペア毎の類似度に基づいて関連する時系列を識別し、履歴データベースから検索することを目的とする。

【0035】

様々な実施形態において、提案するモデルは、長短期記憶（ＬＳＴＭ）ユニットを用いて時間ダイナミクスを捕捉する入力時系列セグメントから簡素な低次元特徴を抽出する。２つの異なるハッシュ関数は、２つの連続する全接続層によって、特徴から長さが異なる２つのバイナリコードを予測できる。モデルはエンドツーエンドで訓練できるため、２つのバイナリコードの２つのトリプレット損失は相対的な類似関係と交差エントロピー損失とを同時に保存し、ラベル情報を十分に活用して包括的な判定境界を捕捉できる。実際の値の特徴とそれに対応するハッシュコードの両方が、ニューラルネットワークにおけるエンドツーエンドで共に学習できる。

【0036】

図２は、本発明の一実施形態による、ハッシュコードを生成及び記憶するニューラルネットワークのシステム／方法を示すブロック／フロー図である。

【0037】

様々な実施形態において、ニューラルネットワーク１４０は、多変量時系列データ１２０のセグメント１２５、１２６毎に個別のハッシュコード１６０を生成及び出力１５０するように訓練できる。これにより、ニューラルネットワーク１４０は、検索効率が向上した小さな検索スペースを提供するショートハッシュコード及び／またはロング特徴と同じ長さのロングハッシュコードを生成するように訓練できる。ロングハッシュコード及びショートハッシュコードは、その後の検索及び取り出しのためにデータベース１８０に保存１７０できる。

【0038】

様々な実施形態において、長さが異なる２つのバイナリコード（ハッシュコード）１６０は、サブ線形バイナリコードによって特定されるように、履歴時系列データのサブセットのみを検索することを含む、サブ線形検索を可能にする。バイナリコードは、（特徴空間距離またはセマンティック距離のいずれかに関して）類似するイメージを、低ハミング距離のバイナリ文字列に写像できる。

【0039】

様々な実施形態において、深層ニューラルネットワークは、ネットワークの最上位層で取得されたコードのための次の３つの基準を用いることで、ネットワークのパラメータを学習できる。（１）元の実数値の特徴と学習されたバイナリベクトルとの間の損失を最小化する。（２）バイナリコードは各ビットに均等に分散される。（３）各ビットは可能な限り独立している。ニューラルネットワークのパラメータは、最上位層の最適化目的関数に基づく誤差逆伝播法によって更新できる。

【0040】

様々な実施形態において、これらの２つのバイナリコードに対して２つのトリプレット損失を用いて、相対的な類似関係を同時に保存できる。潜在空間で包括的な判定境界を捕捉するためのラベル情報を十分に活用するために、交差エントロピー損失を用いることができる。深層サブ線形ハッシングネットワーク（ＤＳＬＨＮ）は、２つのトリプレット損失の合計と、確率的勾配降下法に基づくネットワーク全体の誤差逆伝播法による交差エントロピー損失を最小化することで、エンドツーエンドで訓練できる。サブ線形バイナリコードによって特定された履歴データのサブセットのみを検索する必要があるサブ線形検索が、クエリに関して実行できる。

【0041】

図３は、本発明の一実施形態による、ロング及びショート特徴抽出器を用いたロング及びショートバイナリコード生成のためのシステム／方法を示すブロック／フロー図である。

【0042】

様々な実施形態において、複数の時系列セグメントを含む多変量時系列１２０は、多変量時系列１２０全体からセグメント１２５を抽出するためにスライディングウィンドウを用いるロング特徴抽出器３１０に供給できる。回帰型ニューラルネットワーク（ＲＮＮ）、例えばＬＳＴＭまたはＧＲＵを用いて各セグメント１２５、１２６からロング特徴を抽出できる。各セグメントは、事前に定義された時間ステップ数の間続く（持続時間や期間等）多変量時系列のスライスにすることができる。時系列セグメント１２６は、時系列１２０からの最新の時系列セグメントであってもよい。

【0043】

様々な実施形態において、ロングバイナリ抽出器３２０は、ロング特徴抽出器３１０からロング特徴を受信し、ロング特徴と同じ長さを有するロングバイナリコード３３０に変換できる。ロングバイナリコード３３０は、データベースに保存できる。

【0044】

様々な実施形態において、例えばＬＳＴＭまたはＧＲＵ等の回帰型ニューラルネットワーク（ＲＮＮ）で実現できるショート特徴抽出器３４０を用いて、線形写像によりロング特徴抽出器３１０で生成されたロング特徴をより短い特徴に変換できる。

【0045】

様々な実施形態において、ショートバイナリ抽出器３５０は、ショート特徴抽出器３４０からショート特徴を受信し、ショート特徴ベクトルにおけるエントリの符号をチェックすることで、受信したショート特徴を該ショート特徴と同じ長さを有するショートバイナリコード３６０に変換できる。ショートバイナリコード３６０は、データベースに保存できる。様々な実施形態において、ショートバイナリコード３６０は、ロングバイナリコード３３０よりもはるかに短く、例えば、ロングコードは２５６ビット長であり、ショートコードは３２ビット長の場合がある。ショートコードは、例えば、ロングコードの１／８の長さであってもよく、ロングコードの約１／４から約１／１６の長さであってもよく、ロングコードの約１／６から約１／１２の長さであってもよく、他の長さの関係も考えられる。

【0046】

様々な実施形態において、分類器３７０は、ショート特徴を受け取り、該ショート特徴が属するクラスの確率を計算することが可能であり、各クラスはラベル３８０で識別され、提供されたラベル３８０に基づいて、分類器による誤分類からの損失を計算できる。損失は、ロング特徴抽出器３１０及び／またはショート特徴抽出器３４０のパラメータを更新するために使用できる。損失は、ロングバイナリコード及びショートバイナリコードの両方のトリプレット損失、並びにショート特徴の交差エントロピー損失の場合がある。パラメータは、トリプレットの最小化に基づいて更新できる。様々な実施形態において、分類器３７０は、ラベル３８０によって提供されるグラウンドトゥルースからの異なるクラスを含むマルチクラス分類器であり、ラベルによって特定される各クラスに属するショート特徴の確率を計算できる。例えば、３つのクラスｃ１、ｃ２及びｃ３が存在する場合、分類器３７０は、各クラスに属するショート特徴「ｆ」の確率を計算する、すなわち、ｐ（ｃ１｜ｆ）、ｐ（ｃ２｜ｆ）及びｐ（ｃ３｜ｆ）を計算する。

【0047】

様々な実施形態において、訓練を終了した後、新しい時系列セグメントを用いてハッシュ処理を実行できる。ショートバイナリコードと同じビットパターンを有するロングバイナリコードのセットを保存するロングバイナリ辞書を構築できる。

【0048】

様々な実施形態において、ラベル付けされた多変量の時系列セグメント

【数1】

（ここで、ｙはラベルを示す）は、ｄ次元及び長さｗのセグメント

【数2】

及びラベル

【数3】

のタプルとして示される。ここで、ｗはウィンドウの長さであり、

【数4】

は長さｗの時系列セグメントであり、

【数5】

は特定の時点ｔにおける時系列セグメントの全ての次元からのベクトルであり、Ｃは全てのクラスラベルのセットである。

【0049】

【数6】

で示される履歴時系列セグメントの集合があると仮定する。ここで、Ｎは該集合におけるセグメントの総数である。新しく入力される多変量の時系列セグメントのクエリ

【数7】

、すなわち以前はセットの構成要素ではなかったｗタイムステップ（例えば、時系列セグメント１２６）に続くｄ次元時系列のスライスを考えると、時系列検索のタスクは、新しい時系列セグメント１２６に最も類似するＤにおける時系列セグメントを見つけることである。すなわち、以下を取得することである。

【0050】

【数8】

【0051】

ここで、ｐは、Ｎ個のセグメントに関するｐ番目のセグメント

【数9】

のインデックスであり、

【数10】

は、２つの多変量の時系列セグメント間の類似度を測定する関数である。これは、ロング特徴ベクトルと辞書ロングコードとの各ペアの類似度を計算するために利用できる。

【0052】

特徴抽出層４１０。多変量時系列検索を効率的に実行するために、時間的なダイナミクスを捕捉する未加工の多変量の時系列セグメントの良好で簡素な表現が得られる。特徴抽出層４１０において、多変量の時系列セグメント

【数11】

但し、

【数12】

が与えられると、

【数13】

から簡素なｍ次元（ｍ＜＜ｄ×ｗ）の表現（特徴）ｈまでの非線形特徴抽出関数

【数14】

を学習する。ここで、ｈは、

【数15】

を伴う

【数16】

である。様々な実施形態において、例えば、ｍ＝２５６であり、ｄｘｗ＞２００００である。ｄｘｗは、ｍの値の約５０倍（５０×）から約１００倍（１００×）、または約７５倍（５０×）から約８０倍（８０×）の範囲であってもよい。

【0053】

様々な実施形態において、ＬＳＴＭは簡素であり、入力の時間的なダイナミクス及び長期依存性の両方を明示的に捕捉し、シーケンス用のシーケンス学習に使用できるため、多変量の時系列セグメントから特徴を抽出することは、ＬＳＴＭをＦとして利用できる。各ＬＳＴＭユニットは、状態

【数17】

を有するメモリセルと、メモリセルへのアクセスを制御する忘却ゲート

【数18】

、入力ゲート

【数19】

及び出力ゲート

【数20】

の３つのシグモイドゲートで構成される。ＬＳＴＭユニットの更新は、次のように要約できる。

【0054】

【数21】

【0055】

【数22】

【0056】

【数23】

【0057】

【数24】

【0058】

【数25】

である。

【0059】

ここで、

【数26】

は、先の隠れ状態ｈ_t-1の垂直連結であり、現在の入力

【数27】

は要素毎のロジスティックシグモイド関数であり、

【数28】

は要素毎の乗算演算子（すなわちアダマール積）である。

【0060】

重み

【数29】

及びバイアス

【数30】

は、学習するパラメータであり、重みは行列形式にできる。特徴抽出器において、ＬＳＴＭユニットｈ_wの最近の隠れ状態は未加工の多変量の時系列セグメントの特徴（簡素な表現）として使用される。

【0061】

図４は、本発明の一実施形態による、深層サブ線形ハッシングネットワーク（ＤＳＬＨＮ）のシステム／方法のアーキテクチャを示すブロック／フロー図である。

【0062】

特徴バイナリ層４２０。多変量時系列の簡素な表現であっても、クエリを用いて履歴時系列を検索することは、クエリと履歴データとの間の全てのペアの類似度を計算し、それらの類似度に基づいてペアをソートすることを含む、時間を要するプロセスである。このプロセスを回避するため、効率的な多変量時系列検索のためにはるかに簡素なバイナリ表現を利用するサブ線形検索戦略を採用できる。

【0063】

様々な実施形態において、特徴バイナリ層４２０では、長さが異なる２種類のバイナリコード３３０、３６０、すなわちｖ１がｖ２よりも長い（ｖ１＞ｖ２）、ｖ１ビットのフルレングスバイナリコード及びｖ２ビットのサブ線形バイナリコードは、回帰型ニューラルネットワーク（ＲＮＮ）として実装できるロング特徴抽出器３１０及びショート特徴抽出器３４０を含む、特徴抽出層４１０の出力から抽出できる。

【0064】

バイナリコード予測関数。未加工の多変量の時系列セグメントｈ_wの表現が与えられると、２つの写像

【数31】

及び

【数32】

を学習することを目指す。これらは、ｍ次元の実数値入力

【数33】

をｖ１ビット及びｖ２ビットのバイナリコードにそれぞれ圧縮する。これらの写像は、文献では全バイナリ埋め込みまたはハッシュ関数と呼ばれ、次のように表現される。

【0065】

【数34】

【0066】

ここで、ｓｇｎ（・）は、入力の各要素の符号を抽出する要素毎の符号関数であり、

【数35】

は、ＦＣ１及びＦＣ２で表される予測関数である。Ｈ₁及びＨ₂はそれぞれハッシュ関数である。特定のデータドメインや実用的なアプリケーションに対応するために、様々な予測機能を利用できる。様々な実施形態において、Ｇ１及びＧ２の線形予測関数は、

【0067】

【数36】

【0068】

【数37】

である。

【0069】

ここで、

【数38】

は、学習する重み行列である。各ビットをほぼ均衡させ、可能な限り多くの情報を取得するためのバイアス項は、

【数39】

及び

【数40】

である。ここで、

【数41】

は全てのサンプル

【数42】

の平均であり、

【数43】

は全てのサンプルのＧ₁（ｈ）の平均であり、

【0070】

【数44】

及び

【0071】

【数45】

である。

【0072】

ハッシュ関数Ｈ₁及びＨ₂全体は以下のようになる。

【0073】

【数46】

【0074】

【数47】

【0075】

これらは、それぞれＷ₁及びＷ₂によってパラメータ化される。以下の説明では、

【数48】

を表すのに、単にＨ₁（ｈ）及びＨ₂（ｈ）を用いる。

【0076】

トリプレット損失。所望のハッシュ関数は、入力空間における２つの多変量時系列間の関係から、２つのバイナリコード間の出力（ハミング）空間における相対的な類似関係を維持する必要がある。ペア毎の類似度のみを考慮するのではなく、トリプレット（ａ，ｐ，ｎ）∈Ｔ_tripletの形式の相対的な類似度を利用できる。そのインデックスペア（ａ，ｐ）は、（ａ，ｎ）によって割り当てられたセグメントペア（Ｘ_a，Ｘ_n）よりも類似する入力セグメントペア（Ｘ_a，Ｘ_p）を特定する。ここで、「ａ」はアンカーを表し、「ｎ」はネガティブを表し、「ｐ」はポジティブを表す。トリプレット損失（例えば、アンカー、ポジティブ、ネガティブ）を用いることで、アンカーとポジティブ間のハミング距離がアンカーとネガティブ間のハミング距離よりも小さくなるようにできる。Ｔ_tripletは、考えられる全てのトリプレットインデックスのセット｛｝である。トリプレットは、Ｘ_aとＸ_pが同じクラスに属し、Ｘ_aとＸ_nが異なるクラスに属するように選択されるクラスラベル、例えば（ａ，ｐ，ｎ）に基づいて選択される。直観的に、目的のハッシュ関数Ｈ_i(・)（ｉ＝１；２）は、ハミング空間内でＬ_tripletによって明らかにされたこれらの相対的な類似関係を保持すると予想される。つまり、埋め込みＨ_i(ｈ_a)とＨ_i(ｈ_p)との間のハミング距離をＨ_i(ｈ_a)とＨ_i(ｈ_n)との間のハミング距離よりも小さくする。ここで、ｈ_a、ｈ_p及びｈ_nは、Ｆ（・）によってＸ_a、Ｘ_p及びＸ_nから抽出されたアンカー、ポジティブ及びネガティブの特徴でである。

【0077】

上記の直観の下でハッシュ関数Ｈ_i（ｉ＝１；２）を評価するトリプレット損失は、次のようになる。

【0078】

【数49】

【0079】

ここで、

【数50】

は、

【数51】

との間のハミング距離であり、

【数52】

は、ｈの非ゼロエントリの数をカウントする

【数53】

ノルムであり、

【数54】

はマージンである。

【0080】

その式は、

【数55】

を定義するだけであり、ｑはｐまたはｎのいずれかである。ｈ_qは上述したｈ_pまたはｈ_nである。

【0081】

分類層４３０。特徴またはバイナリコードが、入力された多変量時系列のダイナミクスを捕捉できる豊富な情報を有する場合、トリプレット損失は十分に強力である。しかしながら、トリプレット損失は依然として相対距離の関係に基づいているため、特徴空間における判定境界の全体像は考慮されていない。Ｈ₂（・）によるサブ線形バイナリコードのような短いバイナリは、入力時系列セグメントを完全に表す情報が乏しいため、ハミング空間における判定境界があいまいな場合、大きな影響を与える可能性がある。したがって、利用可能であれば、クラスラベルからの十分な情報を用いて、境界の周りの特徴表現を区別することができる。

【0082】

分類層４３０は、ロジット４４０

【数56】

を計算する全接続（ＦＣ）ネットワーク３７０、すなわちＦＣ３を含むことができる。ここで、

【数57】

は、学習する重み行列である。

【数58】

はＧ₂（）によって抽出されたサブ線形特徴である。ＦＣ１及びＦＣ２は、中間の特徴を所望の次元の特徴に圧縮（再構成）できる。例えば、ＦＣ１は、ＬＳＴＭ出力を

【数59】

によってｖ１次元の特徴に再構成する。

【0083】

様々な実施形態において、

【数60】

によって予測確率を計算するためにソフトマックス層が追加される。ここで、ｚ_jはｚにおけるｊ番目のエントリである。

【0084】

交差エントロピー損失。異なるクラス間で区別された特徴表現を提供するために、標準的な分類戦略に従って、サブ線形特徴空間における誤分類にペナルティを課すために交差エントロピー損失を利用する。

【0085】

【数61】

【0086】

ここで、

【数62】

はｙ_iのワンホット表現であり、

【数63】

は両方の入力時系列セグメント

【数64】

の予測確率であり、

【数65】

は全て１の｜Ｃ｜長ベクトルである。

【0087】

全ての損失関数は、次のように要約できる。

【0088】

【数66】

【0089】

ここで、θはモデル

【数67】

における全ての訓練可能なパラメータのセットであり、

【数68】

は交差エントロピー損失

【数69】

の重要度を制御する重みパラメータである。

【0090】

残念ながら、ハッシュ関数Ｈ_i(・)（ｉ＝１；２）は離散写像であり、トリプレット損失

【数70】

のハミング距離は離散空間にあるため、目的を最適化するのは難しい。したがって、ネットワークアーキテクチャは本質的に離散的であり、それに関連する最適化問題は組み合わせ的に困難である。この問題に対処するため、元の離散的な目的を緩和して、連続的で微分可能な目的にすることができる。ハッシュ関数Ｈ₁（・）及びＨ₂（・）は次のように緩和できる。

【0091】

【数71】

【0092】

【数72】

【0093】

これらは微分可能である。この緩和は、標準近似

【数73】

に基づいている。ハミング距離も

【数74】

距離に緩和できる。すなわち、

【数75】

である。

【0094】

【数76】

は、

【数77】

または、

【数78】

のいずれかである。

【0095】

上述した緩和に基づいて、最終的に以下の連続して微分可能な目的を有する。

【0096】

【数79】

【0097】

ここで、

【0098】

【数80】

である。

【0099】

これらの緩和は、バイナリ埋め込みネットワークの最適化で本質的に使用されてきた。提案したネットワークの訓練可能なパラメータθを最適化するために、ミニバッチサイズが２５６の確率的勾配降下法（ＳＤＧ）に基づき、Ａｄａｍオプティマイザを用いて、ネットワーク全体で誤差逆伝播法を実行できる。

【0100】

サブ線形サーチに基づく多変量時系列検索。

【0101】

訓練が終了した場合、長さが異なる２つのバイナリコード

【数81】

が

【数82】

で示される履歴時系列セグメント

【数83】

に関して抽出される。

【0102】

ｖ２＜ｖ１であるため、

【数84】

から抽出される固有のサブ線形バイナリコードの数

【数85】

は、固有のフルレングスバイナリの数よりもはるかに少ないと予想される。すなわち、多くの異なるフルレングスバイナリコード

【数86】

は、同じサブ線形バイナリコードを共有することが期待される。この事実により、部分線形サーチによる効率的な多変量時系列検索が可能になる。

【0103】

多変量のための効率的なサブ線形サーチアルゴリズム。

【0104】

時系列検索は、以下のアルゴリズム１で要約される。

【0105】

【数87】

【0106】

【数88】

【0107】

【数89】

【0108】

【数90】

【0109】

【数91】

【0110】

【数92】

【0111】

【数93】

【0112】

【数94】

【0113】

【数95】

【0114】

【数96】

【0115】

【数97】

【0116】

【数98】

【0117】

全ての履歴時系列セグメントのフルレングス及びサブ線形バイナリコードを抽出した後、同じサブ線形バイナリコードを有する全てのインデックスのセット、すなわち、

【0118】

（Ｌにおけるアイテムは互いに素であることに注意されたい。）

【0119】

【数99】

である。

【0120】

Ｌ中のアイテムは互いに素である、すなわち、

【数100】

であることに注意されたい。

【0121】

クエリ時系列セグメントＸ_qに関して、フルレングス及びサブ線形バイナリコード

【数101】

は、ＤＳＬＨＮによって抽出される（第２行）。続いて、最初に

【数102】

によってデータベースにおいて時系列セグメントのインデックスを取得し、それらを候補インデックスＪに追加する（ｒ＝０の場合、第４～６行）。この時点で十分な数のインデックスを取得しない、すなわち、

【数103】

の場合、次に２番目に近いサブ線形バイナリコード、すなわち、

【数104】

のサブ線形バイナリコードｒ（≧１）のビットが

【数105】

と異なるＬを探す。予め定義された反転ビットの最大数ｒ_max(第３～７行)までで十分な候補（すなわち、

【数106】

）が得られるまで、ｒをインクリメントしつつこのプロセスを繰り返す。

【0122】

十分な数の候補インデックスが得られると、クエリセグメント

【数107】

のフルレングスバイナリコードと、Ｊによって割り当てられたデータベースセグメントのサブセットのものとの間のペア毎のハミング距離Δを計算する（第８行）。続いて、Δを昇順にソートし、上位から最大ｋ個までのインデックスを取得する（第９行）。例えば、

【数108】

がΔ内で最小の場合、ｊ’を

【数109】

として取得する。最後に、時系列セグメント

【数110】

を取得する。

【0123】

複雑性。ここでは、サブ線形検索アルゴリズムの時間複雑性について議論する。このアルゴリズムは、主に辞書アクセス（第４～６行）と再ランキング（第９行）とに分かれている。一般的なｒ_maxの場合、最悪のシナリオでは辞書アクセス数がｒ_maxに関して指数関数的、すなわち

【数111】

になる可能性があるため、組合せ爆発を避けるために、実際にはｒ_maxを最大で２に固定する。再ランキングの部分に関しては、

【数112】

時間の複雑さがある。候補

【数113】

の数は、履歴時系列セグメントのセットの属性に依存する。最良の場合はｋであり、Ｎは最悪の場合のシナリオであるが、完全な線形検索の複雑性Ｏ（ＮｌｏｇＮ）を超えることはない。

【0124】

ＤＳＬＨＮのハイパーパラメータλ_ceは、

【数114】

にわたるグリッドサーチに基づいて最適化される。

【0125】

ｘの変動のほとんどは、ｍ個の主成分（ＰＣ：principal component）によって説明できる。ここで、ｍ＜＜ｐ（可変成分の総数）である。元の変数を主成分に変換し、それに対応して情報を格納する変数の数を減らすことで複雑性を軽減し、それに対応してデータサイズを減らすことができる。高次元の実数値オブジェクト記述子をコンパクトなバイナリコードに変換すると、メモリ使用量と計算上の問題の両方に対処できる。データの変換と結果としての圧縮により、大量のバイナリコードをメモリに格納できる。類似するオブジェクトのコード間のハミング距離が小さいため、サーチ対象の特徴に関連付けられたバイナリコードの周辺にクエリを限定できる。これにより、クエリ時間とプロセッサの使用量がさらに削減される。クエリに関するコードの短いハミング距離内にあるコードを有するオブジェクトを取得できる。ハミング距離は、１秒あたり数百万の距離を計算できるハードウェア（つまり、ＣＰＵ、マルチコアグラフィックプロセッサ）を用いて効率的に計算できる。

【0126】

全てのケースについて、深層学習ベースの方法ＬＳＴＭ＋トリプレット、ＤＳＬＨＮ（ＣＥなし）（ＣＥ＝交差エントロピー）及びＤＳＬＨＮは、深層学習ベースのアプローチが時系列セグメント内の時間的ダイナミクスを捕捉できるため、奥行きのないＬＳＨ法やＩＴＱ法よりも着実に優れている。深層学習ベースの方法において、提案したＤＳＬＨＮは、検索タスクと分類タスクの両方でほぼ全てのケースで最高のパフォーマンスを提供する。また、提案したＤＳＬＨＮは、常にＤＳＬＨＮ（ＣＥなし）よりも優れていることが分かる。これは、交差エントロピー損失が、モデルの検索と分類の両方のパフォーマンスを確実に改善することを意味する。

【0127】

図５は、本発明の一実施形態による、ローカルな境界によるトリプレット損失を示す図である。

【0128】

Ｈ２（・）によるサブ線形バイナリコードのようなショートバイナリは、入力時系列セグメントを完全に表す情報が乏しいため、ハミング空間の判定境界が曖昧である場合、これが大きな影響を与える可能性がある。サブ線形ハッシュコードパターン５１０は、個々のクラス５２０に一意に写像されない。ハッシュコードのサブセット５１２は、ローカルの最小値により、２つ以上のクラスに写像することができる。したがって、（利用可能であれば）クラスラベルからの十分な情報を用いて、境界の周りの特徴表現を区別できる。但し、サブ線形バイナリコードのような貧弱な情報しかない場合は、ローカルな境界を考慮するだけでは不十分な場合がある。

【0129】

図６は、本発明の一実施形態による、包括的な境界を伴うトリプレット損失及び交差エントロピーを示す図である。

【0130】

交差エントロピー損失の追加は、包括的な最小値に基づいて特徴をさらに区別することができるため、各サブ線形ハッシュコードが単一のクラス５２０に写像される。交差エントロピー損失なしで２つ以上のクラスに写像されたサブ線形ハッシュコードのサブセット５１２は、２つ以上の異なるハッシュコード５１０が同じクラス５２０に写像される可能性があるとしても、それによって除去することができる。

【0131】

図７は。本発明の一実施形態による、ハッシュコードの生成及び検索のためにニューラルネットワークを訓練する方法を示すブロック／フロー図である。

【0132】

ブロック７１０において、スライディングウィンドウを用いて多変量時系列１２０全体から、所定の時間ステップ数の間持続する多変量時系列のスライスが抽出される。スライディングウィンドウの長さは、時系列データの収集方法によって異なる。例えば、データが５日間連続して１分毎に記録される場合、長さ６０のスライディングウィンドウを用いて１時間の時間ウィンドウで観測を要約できる。

【0133】

ブロック７２０において、回帰型ニューラルネットワークを用いてロング特徴ベクトル及びショート特徴ベクトルが抽出される。

【0134】

ブロック７３０において、特徴の全てのエントリの符号をチェックすることで、ロング特徴ベクトル及びショート特徴ベクトルからバイナリベクトルが生成される。

【0135】

ブロック７４０において、トリプレット損失が、ロングバイナリコード及びショートバイナリコードの両方について計算される。

【0136】

ブロック７５０において、異なるクラス間で特徴表現を区別するために、ショートバイナリコードに関する交差エントロピー損失が計算される。

【0137】

ブロック７６０において、トリプレット損失及び交差エントロピー損失に基づいて、ニューラルネットワークのパラメータが更新される。

【0138】

図８は、本発明の一実施形態による、ハッシュコードの生成及び検索のためのニューラルネットワークを実装する方法を示すブロック／フロー図である。

【0139】

訓練が完了した後、ハッシングプロセスを実行できる。

【0140】

ブロック８１０において、スライディングウィンドウを用いて、多変量時系列１２０全体から、所定の時間ステップ数の間持続する多変量時系列のスライスが抽出される。これは、ニューラルネットワークの訓練や検証で使用されていない、まだ観測されていない新しい時系列セグメントである可能性がある。

【0141】

ブロック８２０において、訓練された回帰型ニューラルネットワークを用いて時系列セグメントに関するロング特徴ベクトル及びショート特徴ベクトルが抽出される。

【0142】

ブロック８３０において、特徴の全てのエントリの符号をチェックすることで、訓練されたニューラルネットワークによって生成されたロング特徴ベクトル及びショート特徴ベクトルからバイナリベクトルが生成される。

【0143】

ブロック８４０において、ロングバイナリコード及びショートバイナリコードがデータベースに格納される。

【0144】

ブロック８５０において、ショートバイナリコードと同じビットパターンを有するロングバイナリコードのセットを保存するバイナリ辞書を構築できる。

【0145】

図９は、本発明の一実施形態による、時系列検索のためのニューラルネットワークを実装する方法を示すブロック／フロー図である。

【0146】

ブロック９１０において、システムは、同様の時系列セグメントのクエリ及び検索のための時系列セグメントを受け取ることができる。

【0147】

ブロック９２０において、現在観測されている時系列セグメントに関して、訓練中に学習された回帰型ニューラルネットワークに基づいてロング特徴及びショート特徴が抽出される。

【0148】

ブロック９３０において、クエリ時系列セグメントのロング特徴ベクトル及びショート特徴ベクトルは、これらの特徴ベクトル内の全てのエントリの符号をチェックすることで、ロングバイナリコード及びショートバイナリコードにそれぞれ変換される。

【0149】

ブロック９４０において、クエリ時系列セグメントのロング及びショート特徴ベクトルから抽出されたものと同じショートバイナリコードを有するロングバイナリコードのサブセットが、ハッシング段階で構築されたバイナリ辞書から取り出される。辞書からは十分な数のロングバイナリコードを取得する必要がある。十分な数とは、データベースから上位ｋ個の類似サンプルを取得するための、ｋよりも大きい値である。

【0150】

ブロック９５０において、クエリから抽出されたロングバイナリコードと、辞書から検索された全てのロングバイナリコードとの間のペア毎に類似度が計算される。

【0151】

ブロック９６０において、ロングバイナリコードと辞書ロングコードとの間の最も近い関係を示す類似度を有する所定の数の辞書ロングコードが識別される。

【0152】

ブロック９７０において、計算された類似度に基づいて、クエリに最も関連するものとして識別された所定の数の多変量の時系列セグメントを検索する。検索された多変量の時系列セグメントの数を用いて、関連する時系列セグメントの視覚的表現を含む、例えばディスプレイやモバイルユーザ装置等のユーザインタフェースへの出力を生成できる。所定の数の時系列セグメントを１人または複数のユーザに表示することが可能であり、表示された時系列セグメントは、観察対象のシステムの状態またはステータスをユーザに示すことができる。予め決められた数は、最も関連性が高いものから見たい数のサンプルである。

【0153】

図１０は、本発明の一実施形態による、本方法及びシステムを適用できる例示的な処理システム１０００を示している。

【0154】

処理システム１０００は、少なくとも１つのプロセッサ（ＣＰＵ）１００４を含むことができ、システムバス１００２を介して他の構成要素に動作可能に接続されたベクトル計算／処理を実行できるグラフィック処理（ＧＰＵ）１００５を有することができる。システムバス１００２には、キャッシュ１００６、読み取り専用メモリ（ＲＯＭ）１００８、ランダムアクセスメモリ（ＲＡＭ）１０１０、入出力（Ｉ／Ｏ）アダプタ１０２０、サウンドアダプタ１０３０、ネットワークアダプタ１０４０、ユーザインタフェースアダプタ１０５０、及び／またはディスプレイアダプタ１０６０も動作可能に接続されている。

【0155】

第１の記憶装置１０２２及び第２の記憶装置１０２４は、Ｉ／Ｏアダプタ１０２０によってシステムバス１００２に動作可能に接続され、本明細書に記載された機能を実施するためにニューラルネットワークが格納される。記憶装置１０２２及び１０２４は、ディスク記憶装置（例えば、磁気または光ディスク記憶装置）、ソリッドステート記憶装置、磁気記憶装置等のいずれであってもよい。記憶装置１０２２及び１０２４は、同じタイプの記憶装置であってもよく、異なるタイプの記憶装置であってもよい。

【0156】

スピーカ１０３２は、サウンドアダプタ１０３０によってシステムバス１００２に動作可能に接続されている。。トランシーバ１０４２は、ネットワークアダプタ１０４０によってシステムバス１００２に動作可能に接続されている。ディスプレイ装置１０６２は、ディスプレイアダプタ１０６０によってシステムバス１００２に動作可能に接続されている。

【0157】

第１のユーザ入力装置１０５２、第２のユーザ入力装置１０５４及び第３のユーザ入力装置１０５６は、ユーザインタフェースアダプタ１０５０によってシステムバス１００２に動作可能に接続されている。ユーザ入力装置１０５２、１０５４及び１０５６は、キーボード、マウス、キーパッド、イメージキャプチャ装置、モーション感知装置、マイクロホン、あるいはこれらの装置のうちの少なくとも２つの装置の機能を組み込んだ装置等のいずれであってもよい。もちろん、本発明の原理の主旨を維持しながら、他のタイプの入力装置を使用することもできる。ユーザ入力装置１０５２、１０５４及び１０５６は、同じタイプのユーザ入力装置であってもよく、異なるタイプのユーザ入力装置であってもよい。ユーザ入力装置１０５２、１０５４及び１０５６は、処理システム１０００に情報を入力し、処理システム１０００から情報を出力するために使用される。

【0158】

様々な実施形態において、処理システム１０００は、当業者であれば容易に思いつくような他の要素（図示せず）を含んでもよく、特定の要素を省略することも可能である。例えば、当業者であれば容易に理解できるが、処理システム１０００には、その詳細な実装に応じて他の様々なタイプの入力装置及び／または出力装置を含むことができる。例えば、無線及び／または有線による様々な入力装置及び／または出力装置を使用できる。さらに、当業者であれば容易に理解できるが、様々な構成の追加プロセッサ、コントローラ、メモリ等を使用することも可能である。処理システム１０００の上記及び他の変形例は、本明細書で提供される本原理の教示によって当業者であれば容易に考えられるであろう。

【0159】

さらに、処理システム１０００は、本方法／システムのそれぞれの実施形態を実施するためのシステムであることを理解されたい。処理システム１０００の一部または全部は、図１－８の要素のうちの１つまたは複数で実装され得る。さらに、処理システム１０００は、例えば、図１－８の方法の少なくとも一部を含む、本明細書に記載の方法の少なくとも一部を実行できることを理解されたい。

【0160】

図１１は、本発明の一実施形態による、ＬＳＴＭ及びＧＲＵニューラルネットワーク及びデータベースに本方法を適用し、それらを使用することができる例示的な処理システム１０００を示す図である。

【0161】

様々な実施形態において、ニューラルネットワーク（例えば、ＬＳＴＭ、ＧＲＵ等）は、記憶装置１０２４で保存できる、特徴抽出器の長短期メモリ１１４０及び類似度比較器１１３０のＧＲＵである処理システム１０００に実装できる。メモリで保存された類似度比較器１１３０は、クエリから抽出されたロングバイナリコードと辞書から検索された全てのロングバイナリコードとの間のペア毎の類似度を計算し、ロングバイナリコードと辞書ロングコードとの間の最も近い関係を示す、類似度を有する所定の数の辞書ロングコードを識別するように構成できる。受信及び収集された時系列データ１２０は、第１の記憶装置１０２２及び／または第２の記憶装置１０２４に存在するデータベースで保存される。センサ１１０は、ネットワークアダプタ１０４０及び／または通信ポートまたは他のアダプタを介してシステム１０００と接続されて電気的に通信できる。

【0162】

本明細書に記載する実施形態は、全てハードウェアで実現してもよく、全てソフトウェアで実現してもよく、ハードウェアとソフトウェアの両方の要素を含んでいてもよい。好ましい実施形態において、本発明は、ファームウェア、常駐ソフトウェア、マイクロコード等を含むが、これらに限定されないソフトウェアでも実現可能である。

【0163】

実施形態には、コンピュータもしくは任意の命令実行システムによって使用される、または関連して使用されるプログラムコードを提供する、コンピュータで使用可能な、またはコンピュータで読み取り可能な媒体からアクセスできる、コンピュータプログラム製品を含んでもいてよい。コンピュータで使用可能な、またはコンピュータで読み取り可能な媒体には、命令実行システム、機器、もしくは装置によって使用される、または関連して使用されるプログラムを格納、伝達、伝搬または転送する任意の機器を含んでいてもよい。該媒体は、磁気媒体、光学媒体、電子媒体、電磁気媒体、赤外線媒体または半導体システム（または機器もしくは装置）、あるいは伝搬媒体であってもよい。該媒体には、半導体または固体メモリ、磁気テープ、取り外し可能なコンピュータディスケット、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、リジッド磁気ディスク及び光ディスク等のコンピュータで読み取り可能な媒体を含んでいてもよい。

【0164】

各コンピュータプログラムは、汎用または特別な目的を持つプログラム可能なコンピュータで読み取ることができる、機械で読み取り可能なストレージメディアまたは装置（例えば、プログラムメモリまたは磁気ディスク）に格納される。該コンピュータプログラムは、ストレージメディアまたは装置から本明細書に記載された手順を実行するコンピュータで読み出される、該コンピュータの設定及び制御動作のためのものである。本発明のシステムには、本明細書に記載した機能を実行する、特定の及び事前に定義された方法をコンピュータに動作させるように構成されたコンピュータプログラムを含む、コンピュータで読み取り可能なストレージメディアも考慮される。

【0165】

プログラムコードを格納及び／または実行するのに適したデータ処理システムは、システムバスを介してメモリ要素に直接または間接的に接続された少なくとも１つのプロセッサを備えていてもよい。このメモリ要素には、処理の実行中にバルクメモリ装置からコードが検索される回数を減らすために、プログラムコードの実際の実行中に用いられるローカルメモリ、バルクメモリ装置及び少なくともいくつかのプログラムコードを一時的に記憶するキャッシュメモリを備えていてもよい。入出力またはＩ／Ｏ装置（限定されるものではないが、キーボード、ディスプレイ、ポインティング装置等を含む）は、直接またはＩ／Ｏコントローラを介してシステムに接続されてもよい。

【0166】

ネットワークアダプタは、データ処理システムが、プライベートネットワークまたは公衆ネットワークを介して、他のデータ処理システムまたはリモートプリンタもしくはメモリ装置に接続されることを可能にするために、上記システムと接続されていてもよい。モデム、ケーブルモデム及びイーサネット（登録商標）カードは、現在利用可能なタイプのネットワークアダプタのほんの一例である。

【0167】

本明細書で用いる「ハードウェアプロセッササブシステム」または「ハードウェアプロセッサ」という用語は、１つ以上の特定のタスクを実行するために協働するプロセッサ、メモリ、ソフトウェアまたはそれらの組み合わせを指すことができる。有用な実施形態において、ハードウェアプロセッササブシステムは、１つまたは複数のデータ処理要素（例えば、論理回路、処理回路、命令実行装置等）を含むことができる。１つまたは複数のデータ処理要素は、中央処理装置、グラフィックス処理装置及び／または個別のプロセッサまたはコンピューティング要素ベースのコントローラ（例えば、論理ゲート等）を含めることができる。ハードウェアプロセッササブシステムは、１つ以上のオンボードメモリ（例えば、キャッシュ、専用メモリアレイ、読み出し専用メモリ等）を含むことができる。任意の実施形態において、ハードウェアプロセッササブシステムは、オンボードまたはオフボードとすることができる、またはハードウェアプロセッササブシステム（例えば、ＲＯＭ、ＲＡＭ、基本入出力システム（ＢＩＯＳ）等）で用いるための専用の１つ以上のメモリを含むことができる。

【0168】

いくつかの実施形態において、ハードウェアプロセッササブシステムは、１つまたは複数のソフトウェア要素を含み、実行することができる。１つまたは複数のソフトウェア要素は、オペレーティングシステム及び／または１つまたは複数のアプリケーション及び／または特定の結果を達成するための特定のコードを含むことができる。

【0169】

他の実施形態において、ハードウェアプロセッササブシステムは、指定された結果を達成するために１つまたは複数の電子処理機能を実行する専用回路を含むことができる。そのような回路は、１つまたは複数の特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）及び／またはプログラマブルロジックアレイ（ＰＬＡ）を含むことができる。

【0170】

ハードウェアプロセッササブシステムのこれら及び他の変形例もまた、本発明の実施形態によって考えられる。

【0171】

本明細書では本発明の「一実施形態」または「一実施形態」、ならびにその他の変形形態に言及し、実施形態に関連して説明した特定の機能、構成、特徴などが、本発明の少なくとも１つの実施形態に含まれることを意味する。したがって、「一実施形態において」または「一実施形態において」という語句の出現、並びに本明細書全体を通して様々な場所に出現する任意の他の変形形態は、必ずしも全てが同じ実施形態を参照しているわけではない。しかしながら、本明細書で提供される本発明の教示が与えられると、１つまたは複数の実施形態の特徴を組み合わせることができることを理解されたい。

【0172】

要素が別の要素に「接続される」または「結合される」と称する場合、それは他の要素に直接接続または結合されるか、または介在する要素が存在し得ることが理解される。一方で、要素が別の要素に「直接接続されている」または「直接結合されている」と称する場合、介在する要素は存在しない。

【0173】

例えば、「Ａ／Ｂ」、「Ａ及び／またはＢ」、並びに「Ａ及びＢのうちの少なくとも１つ」の場合における「／」、「及び／または」、並びに「うちの少なくとも１つ」のうちのいずれかの使用は、第１に挙げた選択肢（Ａ）のみの選択、第２に挙げた選択肢（Ｂ）のみの選択、または両方の選択肢（Ａ及びＢ）の選択を含むことを意図したものと理解すべきである。さらに例を挙げれば、「Ａ、Ｂ及び／またはＣ」、並びに「Ａ、Ｂ及びＣのうちの少なくとも１つ」の場合、このような表現法は、第１に挙げた選択肢（Ａ）のみの選択、第２に挙げた選択肢（Ｂ）のみの選択、第３に挙げた選択肢（Ｃ）のみの選択、第１及び第２に挙げた選択肢（Ａ及びＢ）のみの選択、第１及び第３に挙げた選択肢（Ａ及びＣ）のみの選択、第２及び第３に挙げた選択肢（Ｂ及びＣ）のみの選択、または３つの選択肢全て（Ａ及びＢ及びＣ）の選択を含むことを意図したものである。上述した例は、当業者に容易に明らかとなるように、列挙される多数の項目に応じて拡大適用される。

【0174】

上記は、あらゆる観点において説明的かつ典型的であって限定的でないものと理解されるべきであり、本明細書で開示する本発明の範囲は、詳細な説明から決定されるべきではなく、特許法で認められた最大限の広さに基づいて解釈される特許請求の範囲から決定されるべきである。本明細書中に図示及び記載されている実施形態は、本発明の原理を説明するものにすぎず、本発明の範囲及び主旨から逸脱することなく当業者は様々な変更を実施することができることを理解されたい。当業者は、本発明の範囲及び精神から逸脱することなく、様々な他の特徴の組み合わせを実施できる。以上、本発明の態様について、特許法で要求される細部及び詳細な事項と共に説明したが、特許証で保護されることを要求する特許請求の範囲は、添付の特許請求の範囲に示されている。

【図1】