(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-29
(45)【発行日】2023-12-07
(54)【発明の名称】予め選択されたシグネチャを使用して任意長の時系列を特徴付けるためのシステムおよび方法
(51)【国際特許分類】
G06F 16/908 20190101AFI20231130BHJP
【FI】
G06F16/908
(21)【出願番号】P 2019115130
(22)【出願日】2019-06-21
【審査請求日】2022-06-21
(32)【優先日】2018-07-17
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】504407000
【氏名又は名称】パロ アルト リサーチ センター インコーポレイテッド
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109335
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【氏名又は名称】那須 威夫
(74)【代理人】
【識別番号】100158551
【氏名又は名称】山崎 貴明
(72)【発明者】
【氏名】アヌラーグ・ギャンガリ
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特開2007-241866(JP,A)
【文献】米国特許出願公開第2008/0286622(US,A1)
【文献】中国特許出願公開第1664555(CN,A)
【文献】特開2017-224264(JP,A)
【文献】特開平09-034719(JP,A)
【文献】特開2017-068765(JP,A)
【文献】特開2004-030599(JP,A)
【文献】特開2009-187175(JP,A)
【文献】米国特許出願公開第2018/0157743(US,A1)
【文献】米国特許出願公開第2016/0110478(US,A1)
【文献】米国特許出願公開第2016/0203036(US,A1)
【文献】米国特許出願公開第2018/0082201(US,A1)
【文献】欧州特許出願公開第02905780(EP,A1)
【文献】米国特許第08306931(US,B1)
【文献】米国特許出願公開第2017/0125020(US,A1)
【文献】米国特許出願公開第2018/0176243(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 18/00-18/40
(57)【特許請求の範囲】
【請求項1】
物理システムに関連付けられた時系列データの特徴付けを容易にするためのコンピュータ実施方法であって、
コンピューティングデバイスによって、1つ以上のシグネチャを決定することであって、シグネチャは既知の時系列データに対する基底関数を示す、決定することと、
既知の出力としての前記シグネチャに基づいてニューラルネットワークをトレーニングすることと、
前記トレーニングされたニューラルネットワークを前記時系列
データに適用して、前記時系列
データがそれぞれのシグネチャによって特徴付けられる確率を生成することと、
前記確率に基づいて前記時系列データおよび前記物理システムの分析を強化することと、を含む方法。
【請求項2】
前記トレーニングされたニューラルネットワークを前記時系列
データの第1の部分に適用して、各シグネチャについて、前記時系列
データがそれぞれのシグネチャによって特徴付けられる第1の確率を生成することであって、前記第1の部分は、第1の長さを有し、前記時系列
データのうちの第1の数の最新エントリを含む、生成することと、
前記時系列
データの第2の部分を決定することであって、前記第2の部分は、第2の長さを有し、前記時系列
データのうちの第2の数の最新エントリを含む、決定することと、
前記第2の数のエントリを減らすことと、
前記トレーニングされたニューラルネットワークを前記減らされた第2の数のエントリに適用して、各シグネチャについて、前記時系列
データがそれぞれのシグネチャによって特徴付けられる第2の確率を生成することと、
前記第1の確率および前記第2の確率に基づいて前記時系列
データを特徴付けることと、をさらに含む、請求項1に記載の方法。
【請求項3】
前記第2の部分を決定すること、前記第2の数のエントリを減らすこと、そして前記トレーニングされたニューラルネットワークを前記減らされた第2の数のエントリに適用することは、整数でスケーリングされた前記第1の部分の長さが前記時系列
データの全長よりも小さいと判定することに応答し、前記方法は、
前記第2の部分を前記第1の部分として設定することと、
前記整数に摂動を与えることと、をさらに含み、
前記時系列
データを特徴付けることはさらに1つ以上の第2の確率に基づく、請求項2に記載の方法。
【請求項4】
前記第2の数が整数でスケーリングされた前記第1の数に等しく、前記第2の数のエントリを減らすことは前記整数に基づき、
前記時系列
データは任意の長さである、請求項2に記載の方法。
【請求項5】
前記時系列
データは固定長である、請求項1に記載の方法。
【請求項6】
前記
ニューラルネットワークは、
前記シグネチャから生成されたデータ、
シグネチャに対応する時系列
データである入力、および
決定されたシグネチャの数に等しいサイズのワンホットベクトルである出力であって、1に等しい値を有するベクトルエントリはシグネチャに関連付けられた添字に対応する出力、のうちの1つ以上に基づいてトレーニングされる、請求項1に記載の方法。
【請求項7】
前記生成された確率は、各シグネチャについて、前記時系列
データが前記それぞれのシグネチャによって特徴付けられる相対的な割合または重みを示し、前記相対的な割合または重みは、決定されたすべてのシグネチャに対する前記それぞれのシグネチャの比較である、請求項1に記載の方法。
【請求項8】
前記ニューラルネットワークはリカレントニューラルネットワークである、請求項1に記載の方法。
【請求項9】
物理システムに関連付けられた時系列データの特徴付けを容易にするためのコンピュータシステムであって、
プロセッサと、
前記プロセッサによって実行されると、前記プロセッサに方法を行わせる命令を記憶している記憶デバイスと、を含んでおり、前記方法は、
1つ以上のシグネチャを決定することであって、シグネチャは既知の時系列データに対する基底関数を示す、決定することと、
既知の出力としての前記シグネチャに基づいてニューラルネットワークをトレーニングすることと、
前記トレーニングされたニューラルネットワークを前記時系列
データに適用して、前記時系列
データがそれぞれのシグネチャによって特徴付けられる確率を生成することと、
前記
確率に基づいて前記時系列データおよび前記物理システムの分析を強化することとを含む、コンピュータシステム。
【請求項10】
前記方法が、
前記トレーニングされたニューラルネットワークを前記時系列
データの第1の部分に適用して、各シグネチャについて、前記時系列
データがそれぞれのシグネチャによって特徴付けられる第1の確率を生成することであって、前記第1の部分は、第1の長さを有し、前記時系列
データのうちの第1の数の最新エントリを含む、生成することと、
前記時系列
データの第2の部分を決定することであって、前記第2の部分は、第2の長さを有し、前記時系列
データのうちの第2の数の最新エントリを含む、決定することと、
前記第2の数のエントリを減らすことと、
前記トレーニングされたニューラルネットワークを前記減らされた第2の数のエントリに適用して、各シグネチャについて、前記時系列
データがそれぞれのシグネチャによって特徴付けられる第2の確率を生成することと、
前記第1の確率および前記第2の確率に基づいて前記時系列
データを特徴付けることと、をさらに含む、請求項9に記載のコンピュータシステム。
【請求項11】
前記第2の部分を決定すること、前記第2の数のエントリを減らすこと、そして前記トレーニングされたニューラルネットワークを前記減らされた第2の数のエントリに適用することは、整数でスケーリングされた前記第1の部分の長さが前記時系列
データの全長よりも小さいと判定することに応答し、前記方法は、
前記第2の部分を前記第1の部分として設定することと、
前記整数に摂動を与えることと、をさらに含み、
前記時系列
データを特徴付けることはさらに1つ以上の第2の確率に基づく、請求項10に記載のコンピュータシステム。
【請求項12】
前記第2の数は整数でスケーリングされた前記第1の数に等しく、前記第2の数のエントリを減らすことは前記整数に基づき、
前記時系列
データは任意の長さである、請求項10に記載のコンピュータシステム。
【請求項13】
前記時系列
データは固定長である、請求項9に記載のコンピュータシステム。
【請求項14】
前記
ニューラルネットワークは、
前記シグネチャから生成されたデータ、
シグネチャに対応する時系列
データである入力、および
決定されたシグネチャの数に等しいサイズのワンホットベクトルである出力であって、1に等しい値を有するベクトルエントリはシグネチャに関連付けられた添字に対応する出力、のうちの1つ以上に基づいてトレーニングされる、請求項9に記載のコンピュータシステム。
【請求項15】
前記生成された確率は、各シグネチャについて、前記時系列
データが前記それぞれのシグネチャによって特徴付けられる相対的な割合または重みを示し、前記相対的な割合または重みは、決定されたすべてのシグネチャに対する前記それぞれのシグネチャの比較である、請求項9に記載のコンピュータシステム。
【請求項16】
前記ニューラルネットワークはリカレントニューラルネットワークである、請求項9に記載のコンピュータシステム。
【請求項17】
コンピュータによって実行されると、前記コンピュータに方法を行わせる命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記方法は、
コンピューティングデバイスによって、1つ以上のシグネチャを決定することであって、シグネチャは、既知の時系列データに対する基底関数を示す、決定することと、
既知の出力としての前記シグネチャに基づいてニューラルネットワークをトレーニングすることと、
前記トレーニングされたニューラルネットワークを物理システムに関連付けられた時系列データに適用して、前記時系列
データがそれぞれのシグネチャによって特徴付けられる確率を生成することと、
前記確率に基づいて前記時系列データおよび前記物理システムの分析を強化することと、を含む、記憶媒体。
【請求項18】
前記方法は、
前記トレーニングされたニューラルネットワークを前記時系列
データの第1の部分に適用して、各シグネチャについて、前記時系列
データがそれぞれのシグネチャによって特徴付けられる第1の確率を生成することであって、前記第1の部分は、第1の長さを有し、前記時系列
データのうちの第1の数の最新エントリを含む、生成することと、
前記時系列
データの第2の部分を決定することであって、前記第2の部分は、第2の長さを有し、前記時系列
データのうちの第2の数の最新エントリを含む、決定することと、
前記第2の数のエントリを減らすことと、
前記トレーニングされたニューラルネットワークを前記減らされた第2の数のエントリに適用して、各シグネチャについて、前記時系列
データがそれぞれのシグネチャによって特徴付けられる第2の確率を生成することと、
前記第1の確率および前記第2の確率に基づいて前記時系列
データを特徴付けることと、をさらに含む、請求項17に記載の記憶媒体。
【請求項19】
前記第2の部分を決定すること、前記第2の数のエントリを減らすこと、そして前記トレーニングされたニューラルネットワークを前記減らされた第2の数のエントリに適用することは、整数でスケーリングされた前記第1の部分の長さが前記時系列
データの全長よりも小さいと判定することに応答し、前記方法は、
前記第2の部分を前記第1の部分として設定することと、
前記整数に摂動を与えることと、をさらに含み、
前記時系列
データを特徴付けることはさらに1つ以上の第2の確率に基づく、請求項18に記載の記憶媒体。
【請求項20】
前記第2の数は整数でスケーリングされた前記第1の数に等しく、前記第2の数のエントリを減らすことは前記整数に基づき、
前記時系列
データは任意の長さである、請求項18に記載の記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、概して、時系列データを特徴付けることに関する。より具体的には、本開示は、予め選択されたシグネチャを使用して任意長の時系列を特徴付けるためのシステムおよび方法に関する。
【0002】
時系列データは、実変数またはカテゴリ変数の経時的配列である。すなわち、時系列データは、時間的順序で、かつ一般的には時間において連続的等間隔の点で添字付けされる(または別様に表される)一連のデータ点である。時系列データの一例は、風力タービンから経時的に生成される電力である。時系列データの分析は、データの次元数が大きいこと、および関心のある時間スケールの知識または変化の欠如が原因で、困難な場合がある。例えば、風力タービンの例における1分間の時系列データは、毎秒1,000サンプル、合計60,000サンプルを生成するセンサによって記録されるサンプルデータを含み得る。この時系列データの次元数(すなわち、膨大な量)は、データを分析する上で難題を生み出す可能性がある。大量の60,000のサンプルのどの部分が有用なデータが含み得るかに関する知識の欠如も、データを分析する上で難題を生み出す可能性がある。
【0003】
一実施形態は、物理システムに関連付けられた時系列データの特徴付けを容易にするためのシステムを提供する。動作中に、システムは、コンピューティングデバイスによって、1つ以上のシグネチャを決定し、ここで、シグネチャは、既知の時系列データに対する基底関数を示す。システムは、既知の出力としてのシグネチャに基づいてニューラルネットワークをトレーニングする。システムは、トレーニングされたニューラルネットワークを時系列に適用して、時系列がそれぞれのシグネチャによって特徴付けられる確率を生成する。システムは、確率に基づいて時系列データおよび物理システムの分析を強化する。
【0004】
いくつかの実施形態では、システムは、トレーニングされたニューラルネットワークを時系列の第1の部分に適用して、各シグネチャについて、時系列がそれぞれのシグネチャによって特徴付けられる第1の確率を生成し、ここで、第1の部分は、第1の長さを有し、時系列のうちの第1の数の最新エントリを含む。システムは、時系列の第2の部分を決定し、ここで、第2の部分は、第2の長さを有し、時系列のうちの第2の数の最新エントリを含む。システムは第2の数のエントリを減らす。システムは、トレーニングされたニューラルネットワークを減らされた第2の数のエントリに適用して、各シグネチャについて、時系列がそれぞれのシグネチャによって特徴付けられる第2の確率を生成する。システムは、第1の確率および第2の確率に基づいて時系列を特徴付ける。
【0005】
いくつかの実施形態では、第2の部分を決定し、第2の数のエントリを減らし、そしてトレーニングされたニューラルネットワークを減らされた第2の数のエントリに適用することは、整数でスケーリングされた第1の部分の長さが時系列の全長よりも小さいと判定することに応答することである。システムはまた、第2の部分を第1の部分として設定し、整数に摂動を与える。時系列を特徴付けることはさらに、1つ以上の第2の確率に基づく。
【0006】
いくつかの実施形態では、第2の数は整数でスケーリングされた第1の数に等しく、第2の数のエントリを減らすことは整数に基づき、時系列は任意の長さである。
【0007】
いくつかの実施形態では、時系列は固定長である。
【0008】
いくつかの実施形態では、ネットワークは、シグネチャから生成されるデータ、シグネチャに対応する時系列である入力、決定されたシグネチャの数に等しいサイズのワンホットベクトルである出力であって、1に等しい値を有するベクトルエントリがシグネチャに関連付けられた添字に対応する出力、のうちの1つ以上に基づいてトレーニングされる。
【0009】
いくつかの実施形態では、生成された確率は、各シグネチャについて、時系列がそれぞれのシグネチャによって特徴付けられる相対的な割合または重みを示し、相対的な割合または重みは、決定されたすべてのシグネチャに対するそれぞれのシグネチャの比較である。
【0010】
いくつかの実施形態では、ニューラルネットワークはリカレントニューラルネットワークである。
【図面の簡単な説明】
【0011】
【
図1】本発明の一実施形態に従う、任意長の時系列の特徴付けを容易にするための例示的な環境を示す。
【
図2】本発明の一実施形態に従う、任意長の時系列の特徴付けを容易にするための例示的な環境を示す。
【
図3】本発明の一実施形態に従う、例示的な時系列データを示す。
【
図4】本発明の一実施形態に従う、例示的なシグネチャを示す。
【
図5】本発明の一実施形態に従う、既知のシグネチャに基づいて例示的なネットワークをトレーニングすることを示す。
【
図6】本発明の一実施形態に従う、
図4の例示的なシグネチャに基づいて、固定長の時系列およびシグネチャ検出器を与えられ、確率ベクトルを決定することを示す。
【
図7】本発明の一実施形態に従う、シグネチャ検出器およびダウンサンプラモジュールを使用する任意長の時系列の特性付けを示す。
【
図8】本発明の一実施形態に従う、任意長の時系列の特徴付けを容易にするための方法を説明するフローチャートを表す。
【
図9】本発明の一実施形態に従う、任意長の時系列の特徴付けを容易にするための方法を説明するフローチャートを表す。
【
図10】本発明の一実施形態に従う、任意長の時系列の特徴付けを容易にする例示的な分散型コンピュータおよび通信システムを示す。
【発明を実施するための形態】
【0012】
以下の説明は、当業者に、実施形態を作り、使用するのを可能にさせるために提示され、特定の用途およびその要件の観点から提供されている。開示された実施形態に対する様々な修正形態が当業者にはすぐに明らかになり、本明細書に定義されている一般原則が、本開示の趣旨および範囲を逸脱しない限り、他の実施形態および用途に適用されてもよい。したがって、本発明は、示されている実施形態に限定されるものでなく、本明細書に開示されている原則および特徴と合致している最も広い範囲が与えられるべきである。
【0013】
概要
本明細書に記載の実施形態は、多量の時系列データを効果的に分析するという問題を解決する。時系列データは、実変数またはカテゴリ変数の経時的配列、例えば時間的順序で添字付けされた(または別様に表された)一連のデータポイントである。時系列データは、一般に、時間において連続的等間隔の点で取得される。時系列データの一例は、風力タービンから経時的に生成される電力である。時系列データの分析は、データの次元数が大きいこと、および関心のある時間スケールの知識または変化の欠如が原因で、困難な場合がある。例えば、風力タービンの例における1分間の時系列データは、毎秒1,000サンプル、合計60,000サンプルを生成するセンサによって記録されるサンプルデータを含み得る。この時系列データの次元数(すなわち、膨大な量)は、データを分析する上で難題を生み出す可能性がある。大量の60,000のサンプルのどの部分が有用なデータを含み得るかに関する知識の欠如も、データを効果的に分析する上で難題を生み出す可能性がある。
【0014】
本明細書に記載の実施形態は、固定長の時系列における既知のシグネチャの相対的割合を特定し、さらにシグネチャ検出器に基づいて任意長の時系列を特徴付けるシグネチャ検出器システムを提供することによってこれらの難題に対処する。システムは、予め選択された既知のシグネチャとトレーニングデータとに基づいてリカレントニューラルネットワークをトレーニングする。続いて、システムは、トレーニングされたリカレントニューラルネットワークへの入力として固定長の時系列データを使用し、各シグネチャについて、時系列がそれぞれのシグネチャによって特徴付けられる確率を出力として生成する。リカレントニューラルネットワークをトレーニングすることは、
図5に関連して以下に説明し、「シグネチャ検出器」に基づいて確率ベクトルを生成することは、
図6に関連して以下に説明する。
【0015】
システムは、次いで、固定長にダウンサンプリングされた増加する数のエントリを入力時系列セットとして順次使用することによって、シグネチャ検出器を使用して任意長の時系列を特徴付けることができる。この場合、シグネチャ検出器の出力は、各順次入力時系列セットに対する多数の確率ベクトルであり、各ベクトルは、各シグネチャについて、任意長の時系列がそれぞれのシグネチャによって特徴付けられる確率を含む。シグネチャ検出器およびダウンサンプリングモジュールを使用して任意長の時系列を特徴付けることは、
図7に関連して以下に説明する。
【0016】
したがって、本明細書に記載の実施形態は、物理システムに関連付けられた膨大な時系列データセットを分析する効率を向上させるコンピュータシステムを提供し、その向上は基本的に技術的なものである。向上された効率は、固定長の時系列における既知のシグネチャの相対的割合を特定するシグネチャ検出器を含み得、シグネチャ検出器は任意長の時系列データを特徴付けるために使用され得る。コンピュータシステムは、物理システムに関連付けられた大量の時系列データを分析するという技術的問題に対して技術的解決策(すなわち、予め選択されたシグネチャに基づいて物理システムに関連付けられた任意長の時系列データを特徴付けするための方法)を提供する。この技術的解決策は、膨大な量の時系列データの分析を強化し、物理システムの効率および有効性の両方を高めることができる。
【0017】
本明細書に記載の実施形態では、コンピュータシステムのユーザは、物理的対象に関連付けられた固定長の時系列データを使用して既知のシグネチャの相対的重みを決定し(例えば、その出力が確率ベクトルとして可視化されるシグネチャ検出器)、続いて、測定されている物理的対象に関連付けられた物理的特徴を変更することができる。さらに、ユーザは、シグネチャ検出器を使用して既知のシグネチャの相対的重みを決定し、測定されている物理的対象に関連付けられた物理的特徴を再び変更することができる。ユーザは、シグネチャ検出器の出力および物理システムに関連付けられた任意長の時系列データの特徴付けに基づいて、物理システムの効率および有効性を向上させるための任意の変更を加えることもできる。
【0018】
例示的な環境および通信
図1は、本発明の一実施形態に従う、任意長の時系列の特徴付けを容易にするための例示的な環境100を示す。環境100は、デバイス102および関連ユーザ112と、デバイス104および関連ユーザ114と、デバイス106とを含み得る。デバイス102、104、および106は、ネットワーク120を介して互いに通信できる。環境100はまた、ある期間にわたって周期的な間隔でデータを記録することができるセンサを備えた物理的対象を含み得る。例えば、物理的対象は、複数のセンサ110.1~110.nを備えたブレード110などの複数のブレードを備えた風力タービン108であり得る。各センサはデータを記録して別のデバイスに送信することができる。例えば、センサ110.3は、時系列データ130をデバイス104に送信することができ、デバイス104は時系列データ130をデバイス102および106に送信することができる。時系列データ130を受信すると、デバイス102は、ユーザ112を介して、時系列データ130の「固定」長を選択し、1つ以上のシグネチャを選択し、選択された長さおよびシグネチャ131をデバイス106に送信する。シグネチャは時系列のデータに対する基底関数を示すことができ、デバイス102は、ユーザ112を介して、データを分析するための戦略に基づいて関心のあるまたは適切であり得る任意の数Mのシグネチャを選択することができる。デバイス104は、ユーザ114を介して、トレーニングデータ136を生成してデバイス106に送信することもできる。
【0019】
したがって、時系列データ130、トレーニングデータ136、ならびに選択された長さおよびシグネチャ131を受信すると、デバイス106は、各入力時系列が1つのシグネチャに対応するリカレントニューラルネットワークをトレーニングすることができる(ネットワークトレーニング機能132)。出力はMサイズベクトル133であり、これは、1に等しいベクトルエントリがシグネチャに関連付けられた添字に対応するサイズMのワンホットベクトルである。デバイス106は、さらなる分析のためにMサイズベクトル133を生成してデバイス102に送り返すことができる。
【0020】
続いて、リカレントニューラルネットワークを使用して、固定サイズの入力を与えられると(同じくサイズMの)確率ベクトルを生成することができ、ここで、相対確率は、入力データに対する対応するシグネチャの相対的重みを示す。
図2は、本発明の一実施形態に従う、任意長の時系列の特徴付けを容易にするための例示的な環境200を示す。環境200では、センサ110.3は時系列データ140を記録してデバイス102、104、および106に送信することができる。時系列データ140を受信すると、デバイス102は、ユーザ112を介して、時系列データ140の長さLを選択し、選択された長さ141をデバイス106に送信することができる。
【0021】
時系列データ140および選択された長さ141の両方を受信すると、デバイス106は、(
図1に関して上述した)以前にトレーニングされたリカレントニューラルネットワークを使用して確率ベクトルを生成することができる(確率ベクトル生成機能142)。デバイス106は、さらなる分析のために確率ベクトル143をデバイス102に送り返すことができる。確率ベクトル143は、各シグネチャについて、時系列データ140がそれぞれのシグネチャによって特徴付けられる相対的重みを示す相対確率を有するMサイズベクトルとすることができる。
【0022】
例示的な時系列データおよびシグネチャ
図3は、本発明の一実施形態に従う、例示的な時系列データ300を示す。時系列データ300は、風力タービン108のブレード110のセンサ110.3などの物理的センサからある期間にわたって収集されたデータに対応し得る。
図3は、時間を表すx軸302、および電力(例えば、ブレード110.3によって生成される電力)を表すy軸304を含む。時間はx軸上に[(t-15)、(t-14)、(t-13)、…、(t)]で記され、それぞれの時間に対応するデータは[(X
t-15)、(X
t-14)、(X
t-13)、…、(X
t)]として記されている。時系列データ300は、時間とともに非線形的に変化する。本明細書に記載の実施形態は、固定長の時系列データにおける既知のシグネチャの相対的割合を特定するシグネチャ検出器のための第1の方法と、シグネチャ検出器を使用して任意長の時系列データを特徴付ける第2の方法とを提供する。
【0023】
図4は、本発明の一実施形態に従う、例示的なシグネチャ430を示す。例示的なシグネチャ430は、シグネチャ431、432、および433を含み得る。シグネチャ431は、直流(DC)信号、または時間とともに変化しない一定の信号であり得る。シグネチャ432は、時間とともに一定の勾配で増加するランプ信号であり得る。シグネチャ433は、特定の周波数(例えば、3ヘルツ)の正弦波信号、または交流(AC)信号であり得る。
【0024】
3つのシグネチャ431、432、および433は、サイズM=3のワンホットベクトルで表され得る。それぞれのシグネチャベクトルにおいて、1に等しい値を有するベクトルエントリは、それぞれのシグネチャの添字に対応する。例えば、シグネチャ431は、添字値[i1、i2、i3]=[1,0,0]を有するそれぞれのシグネチャベクトル441を有することができ、シグネチャ432は、添字値[i1、i2、i3]=[0、1、0]を有するそれぞれのシグネチャベクトル442を有することができ、そしてシグネチャ433は、添字値[i1、i2、i3]=[0、0、1]を有するそれぞれのシグネチャベクトル443を有することができる。シグネチャ431、432、および433を、
図7の例示的な確率ベクトルにおいて、以下に論じる。
【0025】
既知のシグネチャの相対的割合の特定
図5は、本発明の一実施形態に従う、既知のシグネチャに基づいて例示的なネットワーク500をトレーニングすることを示す。ネットワーク500は、ノード502、504、506、および508、ならびに対応するそれぞれの入力512、514、516、および518を有するリカレントニューラルネットワークとすることができる。各ノードは入力および出力を有することができる。例えば、現在のノード506は、ノード504からの第1の入力(W*S
t-2)と、入力516からの第2の入力(U*X
t-1)とを有する。ノード506は、第1の入力および第2の入力の非線形関数である出力を有することができる。すなわち、S
t-1=g(W*S
t-2+U*X
t-1)である。項「g」は非線形関数を示す。項「S
t-2」は、前のノードからの出力である入力である。項UおよびWは、リカレントニューラルネットワークの各ステップで一貫性のあるパラメータを表す。項「X
t-1」は、現在のノードへの別の入力である。
【0026】
ネットワーク500は、合成データまたはトレーニングデータを使用してトレーニングすることができる。システムは、所与の時系列(例えば、時系列300)の長さLを選択することができ、またM個の既知のシグネチャ(例えば、M=3、
図4の3つのシグネチャ)を選択することができる。システムは、シグネチャ431、432、および433に対応するワンホットベクトル530の既知の出力を与えられると、トレーニングデータを長さLの複数の入力時系列として使用する。トレーニングネットワーク500は、続いて、Uの適切な値を決定することができる。
【0027】
ネットワーク500をトレーニングすると、固定長Lの時系列を、サイズMの確率ベクトルを生成するための入力として渡すことができる。
図6は、本発明の一実施形態に従う、固定長の時系列612およびシグネチャ検出器610を与えられて確率ベクトル620を決定することを示す。システムは、長さL=4の入力612[(X
t-3)、(X
t-2)、(X
t-1)、(X
t)]をシグネチャ検出器610に渡し、出力614[P
sig_1、P
sig_2、P
sig_3]を生成することができる。出力614は、サイズM=3の確率ベクトル620[(p_sig620.1、p_sig620.2、p_sig620.3)に対応する。「p_sig620.1」は、所与の入力時系列612が対応するシグネチャ431によって特徴付けられ得る相対確率である。同様に、「p_sig620.2」は、所与の入力時系列612が対応するシグネチャ432によって特徴付けられ得る相対確率であり、「p_sig620.3」は、所与の入力時系列612が対応するシグネチャ433によって特徴付けられ得る相対確率である。確率ベクトル620(および出力614)は、[0.2、0.1、0.7]などの値を有することができる。
【0028】
したがって、既知のシグネチャの相対的割合を特定することによって、システムは、その出力が既知のシグネチャを表す成分を有する確率ベクトルであるシグネチャ検出器を提供する。システムは、既知のシグネチャに基づいて固定長の時系列を特徴付ける。この特徴付けは、別のシステムの効率を高めるための改善をなすようにユーザまたは他のクライアントを導くことができる。例えば、風力タービンの例では、システムは、センサ110.3からの固定長の示度を使用して、特定の既知のシグネチャの相対的割合を(確率ベクトルとして)決定することができ、確率ベクトルに基づいて、ユーザは、続いて、ブレード110の速度、サイズ、方向、もしくは他の特徴、またはセンサ110.3によって取得された示度に関する別の特徴を修正することができる。本明細書に記載の実施形態により、ユーザは、測定されている物理的対象に関連付けられた物理的特徴を修正することができ、それは、大量の時系列データの分析を強化することにより技術的問題に対する具体的な技術的解決策を提供する。
【0029】
任意長の時系列データの特徴付け
図7は、本発明の一実施形態に従う、シグネチャ検出器720およびダウンサンプラモジュール718を使用する任意長の時系列の特性付けを示す。
図7は、時間712、714、716、および718によって示される時間的順序の動作を含む。システムは、(
図3の時系列データ300のように)任意長Qの時系列を取得することができる。システムは、時系列のうちの最新のL個のエントリを選択し、
図5および
図6に関して前述したシグネチャ検出器を使用してMサイズの確率ベクトルを生成することができる。
【0030】
時間712において、システムは、長さL=4の入力732[(Xt-3)、(Xt-2)、(Xt-1)、(Xt)]をシグネチャ検出器720に渡し、出力714[Psig_1、Psig_2、Psig_3]を生成することができる。出力714は、サイズM=3であり、M個のシグネチャに対する相対確率に基づいて時系列を特徴付けるという点で確率ベクトル620と同様である。
【0031】
続いて、システムは、時系列のうちの最新のH*L個のエントリ(Hは任意の正の整数)を選択し、選択されたエントリを1/Hに減らして(すなわちダウンサンプリングして)L個のエントリを得ることができる。システムは、再びMサイズの確率ベクトルを生成することができる。システムは、H*Lが任意長Qよりも大きくなるまで、Hを増加させ、選択し、減らし、そして生成するというステップを繰り返し続けることができる。
【0032】
具体的には、時間714において、システムは、H=2を設定し、時系列のうちの最新の2*4=8個のエントリを選択することができる。システムは、H*L=8個のエントリを有する入力742[(Xt-7)、(Xt-6)、(Xt-5)、(Xt-4)、(Xt-3)、(Xt-2)、(Xt-1)、(Xt)]をダウンサンプラモジュール718に渡すことができる。ダウンサンプラモジュール718は、任意のダウンサンプリングアルゴリズムを使用し、エントリ数を1/H倍に減らしてL個のエントリを得ることができる。システムは、続いて、長さL=4のダウンサンプリングされた入力743[(Xt-7)、(Xt-5)、(Xt-3)、(Xt-1)]をシグネチャ検出器720に送り、そして出力744[Psig_1、Psig_2、Psig_3]を生成することができる。
【0033】
時間716において、システムは、Hを1だけ増加させ、H=2+1=3と設定し、時系列のうちの最新の3*4=12個のエントリを選択することができる。システムは、H*L=12個のエントリを有する入力752[(Xt-11)、(Xt-10)、(Xt-9)、(Xt-8)、(Xt-7)、(Xt-6)、(Xt-5)、(Xt-4)、(Xt-3)、(Xt-2)、(Xt-1)、(Xt)]をダウンサンプラモジュール718に渡すことができる。システムは、続いて、長さL=4のダウンサンプリングされた入力753[(Xt-11)、(Xt-8)、(Xt-4)、(Xt-1)]をシグネチャ検出器720に送り、そして出力754[Psig_1、Psig_2、Psig_3]を生成することができる。
【0034】
時間718において、システムは、Hを1だけ増加させ、H=3+1=4と設定し、時系列のうちの最新の4*4=16個のエントリを選択することができる。システムは、H*L=16個のエントリを有する入力762[(Xt-15)、(Xt-14)、(Xt-13)、(Xt-12)、(Xt-11)、(Xt-10)、(Xt-9)、(Xt-8)、(Xt-7)、(Xt-6)、(Xt-5))、(Xt-4)、(Xt-3)、(Xt-2)、(Xt-1)、(Xt)]をダウンサンプラモジュール718に渡すことができるシステムは、続いて、長さL=4のダウンサンプリングされた入力763[(Xt-15)、(Xt-11)、(Xt-7)、(Xt-3)]をシグネチャ検出器720に送り、そして出力764[Psig_1、Psig_2、Psig_3]を生成することができる。
【0035】
システムは、Hを再び増加させると、H*LがQよりも大きくなる(すなわち、5*4>16)と判断することができる。Mサイズの確率ベクトル(すなわち、出力734、744、754、および764)の集合は、選択されたM=3個のシグネチャを与えられて任意長Q=16の時系列を特徴付ける確率ベクトル780である。
【0036】
したがって、
図6および
図7のシグネチャ検出器を使用することによって、システムは、既知のシグネチャに基づいて任意長の時系列を特徴付けることができる。この特徴付けによって、ユーザまたは他のクライアントは物理システムの効率を高めるための改善をなすことができる。例えば、風力タービンの例では、システムはセンサ110.3から任意長の時系列データを取得することができる。システムは、増加およびダウンサンプリングされた数のエントリを入力として使用し、各々が特定の既知のシグネチャの相対的割合を示す複数の確率ベクトルを出力として生成することによって、時系列の特徴付けを決定することができる。これらの確率ベクトルに基づいて、ユーザは、続いて、ブレード110の速度、サイズ、方向、もしくは他の特徴、またはセンサ110.3によって取得された示度に関する別の特徴を修正し、大量の時系列データの分析および物理システムのパフォーマンスの両方を強化することができる。
【0037】
任意長の時系列データを特徴付ける方法
図8は、本発明の一実施形態に従う、任意長の時系列データの特徴付けを容易にするための方法を説明するフローチャート800を表す。動作中、システムは、コンピューティングデバイスによって、物理システムに関連付けられた時系列データに対する固定長を決定する(動作802)。システムは1つ以上のシグネチャを決定し、ここで、シグネチャは既知の時系列データに対する基底関数を表す(動作804)。システムは、既知の出力としてのシグネチャに基づいてリカレントニューラルネットワークをトレーニングする(動作806)。システムは、トレーニングされたニューラルネットワークを時系列に適用して、時系列がそれぞれのシグネチャによって特徴付けられる確率(動作808)、例えば、
図6の確率ベクトル620を生成する。システムは、確率に基づいて時系列データおよび物理システムの分析を強化する(動作810)。動作は、
図9のラベルAに記載のように継続する。
【0038】
したがって、固定長の時系列の特徴付けは、Mを予め選択されたシグネチャの数とすると、サイズMの確率ベクトル(例えば、
図6のサイズM=3の確率ベクトル620)として表すことができる。特徴付けは、
図6のシグネチャ検出器610としても示されている。
【0039】
図9は、本発明の一実施形態に従う、任意長の時系列の特徴付けを容易にするための方法を説明するフローチャート900を表す。動作中、システムは、トレーニングされたニューラルネットワークを時系列の第1の部分に適用して、各シグネチャについて、時系列がそれぞれのシグネチャによって特徴付けられる第1の確率を生成し、ここで、第1の部分は、第1の長さを有し、時系列のうちの第1の数の最新エントリを含む(動作902)。システムは、整数でスケーリングされた第1の部分の長さが時系列の全長よりも小さいかどうかを判定する(判断904)(例えば、
図7のようにH*L<Q)。
【0040】
整数でスケーリングされた第1の部分の長さが時系列の全長よりも小さくない場合、システムは時系列の第2の部分を決定し、ここで、第2の部分は、第2の長さと、整数でスケーリングされた第1の数に等しい第2の数の最新エントリとを有する(動作906)。システムは、整数に基づいて第2の数のエントリを減らす(動作908)(すなわち、
図7に関して上述したようにダウンサンプリングする)。システムは、トレーニングされたニューラルネットワークを減らされた第2の数のエントリに適用して、各シグネチャについて、時系列がそれぞれのシグネチャによって特徴付けられる第2の確率を生成する(動作910)。システムは、第2の部分を第1の部分として設定し、整数に摂動を与える(動作912)(例えば、
図7におけるようにH=H+1)。動作は判断904に戻る。(摂動を与えられた)整数でスケーリングされた第1の部分の長さが時系列の全長よりも小さい場合(判断904)、システムは第1の確率および第2の確率に基づいて時系列を特徴付ける(動作914)。
【0041】
したがって、任意長の時系列の特徴付けは、NをサイズMの出力確率ベクトルを得るために入力データがシグネチャ検出器を通過する回数とし、Mを予め選択されたシグネチャの数とすると、サイズN*Mの確率ベクトル(例えば、
図7のサイズN*M=4*3=12の確率ベクトル780)として表すことができる。
【0042】
例示的なコンピュータおよび通信システム
図10は、本発明の一実施形態に従う、任意長の時系列の特徴付けを容易にする例示的な分散型コンピュータおよび通信システム1002を示す。コンピュータシステム1002は、プロセッサ1004、メモリ1006、および記憶デバイス1008を含む。メモリ1006は、被管理メモリの役割を果たす揮発性メモリ(例えば、RAM)を含むことができ、1つ以上のメモリプールを記憶するのに使用され得る。さらに、コンピュータシステム1002は、表示デバイス1010、キーボード1012、およびポインティングデバイス1014に連結され得る。記憶デバイス1008は、オペレーティングシステム1016、コンテンツ処理システム1018、およびデータ1032を記憶することができる。
【0043】
コンテンツ処理システム1018は、コンピュータシステム1002によって実行されると、コンピュータシステム1002に本開示に記載の方法および/またはプロセスを行わせることができる命令を含むことができる。具体的には、コンテンツ処理システム1018は、コンピュータネットワークにわたって、データパケットを、他のネットワークノードにおよび/またはそこから、送信および/または受信するための命令を含み得る(通信モジュール1020)。データパケットは、時系列データ、トレーニングデータ、合成データ、ベクトル、選択された長さ、および選択されたシグネチャを含むことができる。
【0044】
コンテンツ処理システム1018は、1つ以上のシグネチャを決定するための命令をさらに含むことができ、ここで、シグネチャは時系列データに対する基底関数を示す(シグネチャ選択モジュール1022)。コンテンツ処理システム1018は、既知の出力としてのシグネチャに基づいてニューラルネットワークをトレーニングするための命令を含むことができる(ネットワークトレーニングモジュール1024)。コンテンツ処理システム1018は、トレーニングされたニューラルネットワークを時系列に適用して、時系列がそれぞれのシグネチャによって特徴付けられる確率を生成するための命令も含むことができる(確率生成モジュール1026)。コンテンツ処理システム1018は、確率に基づいて時系列データおよび物理システムの分析を強化するための命令を含むことができる(時系列特徴付けモジュール1028)。
【0045】
さらに、コンテンツ処理システム1018は、トレーニングされたニューラルネットワークを時系列の第1の部分に適用して、各シグネチャについて、時系列がそれぞれのシグネチャによって特徴付けられる第1の確率を生成するための命令を含むことができ、ここで、第1の部分は、第1の長さを有し、時系列のうちの第1の数の最新エントリを含む(確率生成モジュール1026)。コンテンツ処理システム1018は、時系列の第2の部分を決定するための命令を含むことができ、ここで、第2の部分は、第2の長さを有し、時系列のうちの第2の数の最新エントリを含む(時系列特徴付けモジュール1028)。コンテンツ処理システム1018は、第2の数のエントリを減らすための命令を含むこともできる(ダウンサンプリングモジュール1030)。コンテンツ処理システム1018は、トレーニングされたニューラルネットワークを減らされた第2の数のエントリに適用して、各シグネチャについて、時系列がそれぞれのシグネチャによって特徴付けられる第2の確率を生成するための命令を含むことができる(確率生成モジュール1026)。コンテンツ処理システム1018は、第1の確率および第2の確率に基づいて時系列を特徴付けるための命令をさらに含むことができる(時系列特徴付けモジュール1028)。
【0046】
データ1032は、本開示に記載の方法および/またはプロセスによって入力として要求されるかまたは出力として生成されるいかなるデータも含むことができる。具体的には、データ1032は少なくとも、シグネチャ、基底関数、時系列、長さ、ニューラルネットワーク、リカレントニューラルネットワーク、トレーニングされたネットワーク、入力、入力時系列、出力、出力ベクトル、ワンホットベクトル、添字、確率ベクトル、正の整数、時系列の一部、各シグネチャについて時系列がそれぞれのシグネチャによって特徴付けられる確率を示す確率ベクトル、時系列の最新の数のエントリ、減らされた数のエントリ、ダウンサンプリングアルゴリズム、シグネチャから生成されたデータ、各シグネチャについて時系列がそれぞれのシグネチャによって特徴付けられる相対的な割合または重み、および複数のシグネチャに対する1つのシグネチャの比較、を格納することができる。
【0047】
この詳細な説明に説明されているデータ構造およびコードは、コンピュータシステムによる使用のためのコードおよび/またはデータを格納することができるいずれのデバイスまたは媒体であってもよい、コンピュータ可読記憶媒体上に通常格納されている。コンピュータ可読記憶媒体は、揮発性メモリ、不揮発性メモリ、またディスクドライブ、磁気テープ、CD(コンパクトディスク)、DVD(デジタルバーサタイルディスクまたはデジタルビデオディスク)などの磁気および光記憶デバイス、または現在知られているかまたは後に開発されるコンピュータ可読媒体を格納することができる他の媒体を含むが、それらに限定されるものではない。
【0048】
詳細な説明の項に説明されている方法およびプロセスは、上に説明されているようなコンピュータ可読記憶媒体に格納され得る、コードおよび/またはデータとして具体化され得る。コンピュータシステムが、コンピュータ可読記憶媒体上に格納されているコードおよび/またはデータを読み取り、実行すると、コンピュータシステムは、データ構造およびコードとして具体化され、かつコンピュータ可読記憶媒体内に格納されている方法およびプロセスを行う。
【0049】
さらに、上に説明されている方法およびプロセスは、ハードウェアモジュールまたは装置に含まれ得る。ハードウェアモジュールまたは装置は、特定用途向け集積回路(ASIC:Application-Specific Integrated Circuit)チップ、フィールドプログラマブルゲートアレイ(FPGA:Field-Programmable Gate Array)、特定の時点で特定のソフトウェアモジュールまたは1つのコードを実行する専用または共有のプロセッサ、および現在知られているかまたは後に開発される他のプログラマブルロジックデバイスを含むことができるが、それらに限定されるものではない。ハードウェアモジュールまたは装置が起動されると、それらは、それら内に含まれている方法およびプロセスを行う。