(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-17
(54)【発明の名称】時系列データの異常監視方法、装置、電子機器及び記憶媒体
(51)【国際特許分類】
G06Q 10/06 20230101AFI20240110BHJP
【FI】
G06Q10/06
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023540756
(86)(22)【出願日】2021-09-17
(85)【翻訳文提出日】2023-06-29
(86)【国際出願番号】 CN2021119159
(87)【国際公開番号】W WO2022142494
(87)【国際公開日】2022-07-07
(31)【優先権主張番号】202011606882.8
(32)【優先日】2020-12-30
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】523248770
【氏名又は名称】ジンドン シティ (ベイジン) ディジッツ テクノロジー カンパニー リミテッド
(74)【代理人】
【識別番号】100118913
【氏名又は名称】上田 邦生
(74)【代理人】
【識別番号】100142789
【氏名又は名称】柳 順一郎
(74)【代理人】
【識別番号】100201466
【氏名又は名称】竹内 邦彦
(72)【発明者】
【氏名】リー, ティン
(72)【発明者】
【氏名】ヂャン, ジュンボ
(72)【発明者】
【氏名】シャオ, ヤンキン
(72)【発明者】
【氏名】ジェン, ユー
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049AA06
(57)【要約】
本願は、時系列データの異常監視方法、装置、電子機器及び記憶媒体を提供し、前記異常監視方法は、時系列データの複数の特徴情報を取得するステップと、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成するステップと、ターゲット特徴の組み合わせに基づいて異常結果を監視するステップとを含む。本願の実施例の異常監視方法は、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【選択図】
図1
【特許請求の範囲】
【請求項1】
時系列データの複数の特徴情報を取得するステップと、
前記複数の特徴情報に基づいてターゲット特徴の組み合わせを生成するステップと、
前記ターゲット特徴の組み合わせに基づいて異常結果を監視するステップと、
を含む、時系列データの異常監視方法。
【請求項2】
前記時系列データの複数の特徴情報を取得するステップが、前記時系列データの近接偏差特徴、周期偏差特徴、傾向偏差特徴及び残差特徴のうちの複数の特徴を取得するステップを含む請求項1に記載の時系列データの異常監視方法。
【請求項3】
前記複数の特徴情報に基づいてターゲット特徴の組み合わせを生成するステップが、
前記複数の特徴情報に基づいて、複数の特徴の組み合わせを生成するステップと、
前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択するステップと、
を含む請求項1に記載の時系列データの異常監視方法。
【請求項4】
前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択するステップが、
各前記特徴の組み合わせのうち、前記複数の特徴の間の相関係数を計算するステップと、
前記相関係数に基づいて、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択するステップと、
を含む請求項3に記載の時系列データの異常監視方法。
【請求項5】
各前記特徴の組み合わせのうち、前記複数の特徴の間の最小分散を計算し、前記相関係数と前記最小分散とに基づいて、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択するステップを含む請求項4に記載の時系列データの異常監視方法。
【請求項6】
前記ターゲット特徴の組み合わせに基づいて異常結果を監視するするステップが、
前記ターゲット特徴の組み合わせを複数の異常監視モデルに入力して、各前記異常監視モデルによって認識された異常点と正常点を生成するステップと、
各前記異常監視モデルによって出力された前記異常点と前記正常点とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択するステップと、
前記ターゲット特徴の組み合わせと前記ターゲット異常監視モデルとに基づいて、異常結果を監視するステップと、
を含む請求項1に記載の時系列データの異常監視方法。
【請求項7】
前記各前記異常監視モデルによって出力された前記異常点と前記正常点とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択するステップが、
前記異常点と前記正常点との間の距離を取得するステップと、
前記異常点と前記正常点との間の距離に基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択するステップと、
を含む請求項6に記載の時系列データの異常監視方法。
【請求項8】
前記異常点は複数であり、
前記複数の異常点と前記正常点との間の平均距離を取得し、前記異常点と前記正常点との間の距離と、前記平均距離とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択するステップを含む請求項7に記載の時系列データの異常監視方法。
【請求項9】
時系列データの複数の特徴情報を取得する取得モジュールと、
前記複数の特徴情報に基づいてターゲット特徴の組み合わせを生成する生成モジュールと、
前記ターゲット特徴の組み合わせに基づいて異常結果を監視する監視モジュールと、
を備える、時系列データの異常監視装置。
【請求項10】
前記取得モジュールが、前記時系列データの近接偏差特徴、周期偏差特徴、傾向偏差特徴及び残差特徴のうちの複数の特徴を取得する請求項9に記載の時系列データの異常監視装置。
【請求項11】
前記生成モジュールが、
前記複数の特徴情報に基づいて、複数の特徴の組み合わせを生成する第1の生成ユニットと、
前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択する第1の選択ユニットと、
を備える請求項9に記載の時系列データの異常監視装置。
【請求項12】
前記第1の選択ユニットが、各前記特徴の組み合わせのうち、前記複数の特徴の間の相関係数を計算し、前記相関係数に基づいて、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択する請求項11に記載の時系列データの異常監視装置。
【請求項13】
前記第1の選択ユニットが、各前記特徴の組み合わせのうち、前記複数の特徴の間の最小分散を計算し、前記相関係数と前記最小分散とに基づいて、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択する請求項12に記載の時系列データの異常監視装置。
【請求項14】
前記監視モジュールが、
前記ターゲット特徴の組み合わせを複数の異常監視モデルに入力して、各前記異常監視モデルによって認識された異常点と正常点を生成する第2の生成ユニットと、
各前記異常監視モデルによって出力された前記異常点と前記正常点とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択する第2の選択ユニットと、
前記ターゲット特徴の組み合わせと前記ターゲット異常監視モデルとに基づいて、異常結果を監視する監視ユニットと、
を含む請求項9に記載の時系列データの異常監視装置。
【請求項15】
前記第2の選択ユニットが、
前記異常点と前記正常点との間の距離を取得し、
前記異常点と前記正常点との間の距離に基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択する請求項14に記載の時系列データの異常監視装置。
【請求項16】
前記異常点は複数であり、
前記第2の選択ユニットが、前記複数の異常点と前記正常点との間の平均距離を取得し、前記異常点と前記正常点との間の距離と、前記平均距離とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択する請求項15に記載の時系列データの異常監視装置。
【請求項17】
メモリ、プロセッサ及びメモリに記憶され、プロセッサで実行可能なコンピュータープログラムを含み、前記プロセッサが前記プログラムを実行する場合、請求項1から8のいずれか一項に記載の時系列データの異常監視方法を実現する電子機器。
【請求項18】
コンピュータープログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
プログラムがプロセッサによって実行される場合、請求項1から8のいずれか一項に記載の時系列データの異常監視方法を実現するコンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】
【関連出願の相互参照】
【0001】
本願は、京東都市(北京)デジタルテクノロジーリミテッドカンパニーが2021年12月30日に提出した、発明の名称が「時系列データの異常監視方法、装置、電子機器及び記憶媒体」であり、中国特許出願号が「202011606882.8」である特許出願の優先権を主張する。
【技術分野】
【0002】
本願は、データ処理技術の分野に関し、特に時系列データの異常監視方法、装置、電子機器及び記憶媒体に関する。
【背景技術】
【0003】
現在、時系列データの異常監視は生産生活に広く応用されており、例えば商圏の流量監視は流量過多による事故、情報システムの状態異常監視などを予防することができる。
【0004】
関連技術では、時系列データに対する異常監視は、分野の専門家が与えたルールに基づいていることが多く、例えば専門家の経験と日常的な監視値とに基づいて、各技術指標の正常区間を規定し、正常区間内のデータは正常と判定し、正常区間外のデータは異常と判定する。しかし、この方法は柔軟性と正確性が悪く、コストが高く、コストが高く、拡張性が低い。
【0005】
関連技術では、自動機械学習方法によって時系列データの異常監視を行うこともできるが、この方法では、フィードバックを行ってモデルやパラメータを調整することなどを行うには、モデルの優劣を評価するメトリックを確立するためのラベル情報が必要であるが、実際にはラベルデータの取得が困難である。
【発明の概要】
【0006】
本願第1の態様の実施例は、時系列データの異常監視方法を提供し、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0007】
本願第2の態様の実施例は、時系列データの異常監視装置を提供する。
【0008】
本願第3の態様の実施例は、電子機器を提供する。
【0009】
本願第4の態様の実施例は、コンピュータ読み取り可能な記憶媒体を提供する。
【0010】
本願第1の態様の実施例は、時系列データの複数の特徴情報を取得するステップと、前記複数の特徴情報に基づいてターゲット特徴の組み合わせを生成するステップと、前記ターゲット特徴の組み合わせに基づいて異常結果を監視するステップとを含む時系列データの異常監視方法を提供する。
【0011】
本願の実施例の時系列データの異常監視方法では、まず、時系列データの複数の特徴情報を取得し、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成し、そして、ターゲット特徴の組み合わせに基づいて異常結果を監視する。これによって、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0012】
また、本願上記の実施例の時系列データの異常監視方法は、以下のような付加的な技術的特徴を有することができる。
【0013】
本願の一実施例では、前記時系列データの複数の特徴情報を取得するステップは、前記時系列データの近接偏差特徴、周期偏差特徴、傾向偏差特徴及び残差特徴のうちの複数の特徴を取得するステップを含む。
【0014】
本願の一実施例では、前記複数の特徴情報に基づいてターゲット特徴の組み合わせを生成するステップは、前記複数の特徴情報に基づいて、複数の特徴の組み合わせを生成するステップと、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択するステップと、を含む。
【0015】
本願の一実施例では、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択するステップは、各前記特徴の組み合わせのうち、前記複数の特徴の間の相関係数を計算するステップと、前記相関係数に基づいて、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択するステップとを含む。
【0016】
本願の一実施例では、上記の時系列データの異常監視方法は、各前記特徴の組み合わせのうち、前記複数の特徴の間の最小分散を計算し、前記相関係数と前記最小分散とに基づいて、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択するステップをさらに含む。
【0017】
本願の一実施例では、前記ターゲット特徴の組み合わせに基づいて異常結果を監視するステップは、前記ターゲット特徴の組み合わせを複数の異常監視モデルに入力して、各前記異常監視モデルによって認識された異常点と正常点を生成するステップと、各前記異常監視モデルによって出力された前記異常点と前記正常点とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択するステップと、前記ターゲット特徴の組み合わせと前記ターゲット異常監視モデルとに基づいて、異常結果を監視するステップとを含む。
【0018】
本願の一実施例では、前記各前記異常監視モデルによって出力された前記異常点と前記正常点とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択するステップは、前記異常点と前記正常点との間の距離を取得するステップと、前記異常点と前記正常点との間の距離に基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択するステップとを含む。
【0019】
本願の一実施例では、前記異常点は複数であり、前記方法は、前記複数の異常点と前記正常点との間の平均距離を取得し、前記異常点と前記正常点との間の距離と、前記平均距離とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択するステップをさらに含む。
【0020】
本願第2の態様の実施例は、時系列データの複数の特徴情報を取得する取得モジュールと、前記複数の特徴情報に基づいてターゲット特徴の組み合わせを生成する生成モジュールと、前記ターゲット特徴の組み合わせに基づいて異常結果を監視する監視モジュールと、を備える時系列データの異常監視装置を提供する。
【0021】
本願の実施例の時系列データの異常監視装置は、取得モジュールによって、時系列データの複数の特徴情報を取得し、生成モジュールによって、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成し、さらに、監視モジュールによって、ターゲット特徴の組み合わせに基づいて異常結果を監視する。これにより、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0022】
また、本願上記の実施例の時系列データの異常監視装置は、以下のような付加的な技術的特徴を有することができる。
【0023】
本願の一実施例では、前記取得モジュールは具体的には、前記時系列データの近接偏差特徴、周期偏差特徴、傾向偏差特徴及び残差特徴のうちの複数の特徴を取得する。
【0024】
本願の一実施例では、前記生成モジュールは、前記複数の特徴情報に基づいて、複数の特徴の組み合わせを生成する第1の生成ユニットと、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択する第1の選択ユニットとを備える。
【0025】
本願の一実施例では、前記第1の選択ユニットは具体的には、各前記特徴の組み合わせのうち、前記複数の特徴の間の相関係数を計算し、前記相関係数に基づいて、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択する。
【0026】
本願の一実施例では、前記第1の選択ユニットは、さらに、各前記特徴の組み合わせのうち、前記複数の特徴の間の最小分散を計算し、前記相関係数と前記最小分散とに基づいて、前記複数の特徴の組み合わせから、前記ターゲット特徴の組み合わせを選択する。
【0027】
本願の一実施例では、前記監視モジュールは、前記ターゲット特徴の組み合わせを複数の異常監視モデルに入力して、各前記異常監視モデルによって認識された異常点と正常点を生成する第2の生成ユニットと、各前記異常監視モデルによって出力された前記異常点と前記正常点とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択する第2の選択ユニットと、前記ターゲット特徴の組み合わせと前記ターゲット異常監視モデルとに基づいて、異常結果を監視する監視ユニットとを備える。
【0028】
本願の一実施例では、前記第2の選択ユニットは具体的には、前記異常点と前記正常点との間の距離を取得し、前記異常点と前記正常点との間の距離に基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択する。
【0029】
本願の一実施例では、前記異常点は複数であり、前記第2の選択ユニットは、さらに、前記複数の異常点と前記正常点との間の平均距離を取得し、前記異常点と前記正常点との間の距離と、前記平均距離とに基づいて、前記複数の異常監視モデルから、前記時系列に適したターゲット異常監視モデルを選択する。
【0030】
本願第3の態様の実施例は、メモリと、プロセッサ及びメモリに記憶され、プロセッサで実行可能なコンピュータープログラムを含み、前記プロセッサは、前記プログラムを実行する場合、上記第1の態様の実施例に記載の時系列データの異常監視方法を実現する電子機器を提供する。
【0031】
本願の実施例の電子機器は、プロセッサによって、メモリに記憶されているコンピュータープログラムを実行し、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0032】
本願第4の態様の実施例は、コンピュータープログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、このプログラムがプロセッサによって実行される場合、上記第1の態様の実施例に記載の時系列データの異常監視方法を実現するコンピュータ読み取り可能な記憶媒体を提供する。
【0033】
本願の実施例のコンピュータ読み取り可能な記憶媒体は、コンピュータープログラムを記憶してプロセッサで実行され、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0034】
本願の追加的な態様および利点は、以下の説明で部分的に示され、一部は以下の説明から明らかになるか、または本願の実践を通して理解される。
【図面の簡単な説明】
【0035】
本願の上述および/または追加的な態様および利点は、図面と関連した以下の実施形態の説明から明らかで理解しやすくなる。
【
図1】本願一実施例に係る時系列データの異常監視方法の概略フローチャートである。
【
図2】本願の別の実施例に係る時系列データの異常監視方法の概略フローチャートである。
【
図3】本願一実施例に係る時系列データの異常監視装置の概略ブロック図である。
【
図4】本願一実施例に係る電子機器の概略構成図である。
【発明を実施するための形態】
【0036】
以下、本明細書の実施例について詳細に説明する。本実施例の例は図面に示されており、最初から最後まで同一または類似の符号が同一または類似の要素、または同一または類似の機能を有する要素を表す。図面を参照して以下に説明する実施例は、本願を説明するための例示であり、本願に対する制限とは理解できない。
【0037】
以下、図面を参照して、本願の実施例の時系列データの異常監視方法、装置、電子機器及び記憶媒体を説明する。
【0038】
本願の実施例によって提供される時系列データの異常監視方法は、電子機器によって実行することができ、この電子機器は、PC(Personal Computer、パーソナルコンピュータ)コンピュータ、タブレット、またはサーバーなどであってもよいが、ここでは何ら限定されない。
【0039】
本願の実施例では、電子機器には、処理コンポーネントと、記憶コンポーネントと、駆動コンポーネントとが設けられてもよい。選択的に、駆動コンポーネント及び処理コンポーネントを統合して設定することができ、この記憶コンポーネントは、オペレーティングシステム、アプリケーションプログラム、又はその他のプログラムモジュールを記憶することができ、この処理コンポーネントは、記憶コンポーネントに記憶されたアプリケーションプログラムを実行することにより、本願の実施例によって提供される時系列データの異常監視方法を実現する。
【0040】
図1は、本願一実施例に係る時系列データの異常監視方法の概略フローチャートである。
【0041】
本願の実施例の時系列データの異常監視方法は、本願の実施例によって提供される時系列データの異常監視装置によって実行することができ、この装置は電子機器に配置することができ、それによって、時系列データの複数の特徴情報を取得し、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成し、ターゲット特徴の組み合わせに基づいて異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0042】
可能な場合として、本願の実施例の時系列データの異常監視方法は、サーバ側で実行することもでき、サーバはクラウドサーバであり、クラウド側でその時系列データの異常監視方法を実行することができる。
【0043】
図1に示すように、この時系列データの異常監視方法はステップ101~103を含むことができる。
【0044】
ステップ101、時系列データの複数の特徴情報を取得する。複数の特徴情報は、時系列データの近接偏差特徴、周期偏差特徴、傾向偏差特徴、及び残差特徴のうちの複数の特徴を含み得る。
【0045】
なお、本実施例で説明した時系列データは、ショッピングプラットフォームの販売履歴データであってもよく、例えば、ショッピングプラットフォーム側の時間(例えば、1日、1週間、1ヶ月など)内の販売履歴データであってもよく、ショッピングプラットフォームのページ閲覧履歴データであってもよく、あるいは商圏の流量履歴データであってもよく、ここでは何ら限定しない。ショッピングプラットフォームは、ショッピングサイト、ショッピングAPP(Application、携帯電話ソフト)、ショッピングシステムなどを含み得る。
【0046】
ステップ102、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成する。
【0047】
本願の実施例では、電子機器は、特徴の組み合わせに基づいて、モデル又は予め設定されたアルゴリズムを生成し、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成することができる。
【0048】
なお、本実施例で説明した特徴の組み合わせ生成モデルは、呼び出しを容易にするために、事前にトレーニングされ、電子機器の記憶空間に事前に記憶されてもよく、この記憶空間は、物理ベースの記憶空間、例えばハードディスクに限らず、この記憶空間は、電子機器に接続されたネットワークハードディスクの記憶空間(クラウドストレージ空間)であってもよい。本実施で説明した予め設定されたアルゴリズムは、実際の状況に基づいて標定することができる。
【0049】
ステップ103、ターゲット特徴の組み合わせに基づいて異常結果を監視する。
【0050】
具体的には、電子機器は、ショッピングプラットフォームから、時系列データを取得し、この時系列データを解析して計算して、時系列データの複数の特徴情報を生成し、そして、予め設定されたアルゴリズムと複数の特徴情報とに基づいてターゲット特徴の組み合わせを生成し、最後に、ターゲット特徴の組み合わせに基づいて異常結果を監視することができる。
【0051】
なお、通常、時系列データのうち、相対的に最近と周期の変化幅が大きいものは異常である可能性が高いが、本願の実施例の時系列データの異常監視方法により、時系列データのうち、相対的に最近と周期の変化幅をリアルタイムで監視することができる。
【0052】
本願の実施例では、まず、時系列データの複数の特徴情報を取得し、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成し、そして、ターゲット特徴の組み合わせに基づいて異常結果を監視する。これにより、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0053】
上述の実施例を明確にするために、本願の一実施例では、時系列データの複数の特徴情報を取得するステップは、時系列データの近接偏差特徴、周期偏差特徴、傾向偏差特徴、及び残差特徴のうちの複数の特徴を取得するステップを含むことができる。
【0054】
本願の実施例では、計算時系列データの近接偏差値、周期偏差値、傾向偏差値、及び残差値は、下記の式(1)、(2)、(3)、(4)によりそれぞれ計算することができる。
【数1】
Lは近接偏差値であり、Zは周期偏差値であり、Qは傾向偏差値であり、Cは残差値であり、Xtは、現在時刻の時系列データ(即ち、時系列値、例えば、現在時刻のショッピングプラットフォームの販売量)であり、Xt-1は、前時刻の時系列データであり、periodは、周期偏差間隔(例えば、曜日)であり、trendは、傾向偏差間隔(例えば、1ヶ月、2ヶ月、15日など)であり、
【数2】
は、時系列データの履歴平均値であり、σは、時系列データの分散であり得る。
【0055】
具体的には、電子機器は、時系列データを取得した後、上記の式(1)、(2)、(3)及び(4)によって時系列データの近接偏差値、周期偏差値、傾向偏差値、及び残差値をそれぞれ計算し、そして、時系列データの近接偏差値、周期偏差値、傾向偏差値、残差値、及び予め設定された特徴生成アルゴリズムのそれぞれに基づいて、時系列データの近接偏差特徴、周期偏差特徴、傾向偏差特徴及び残差特徴を生成することができる。予め設定された特徴生成アルゴリズムは、実際の状況に基づいて標定することができる。
【0056】
なお、本実施例で説明した残差値が大きいほど、現在時刻が平均値からずれる程度が大きい、すなわち異常である可能性が高いことを示しており、古典的な統計的時系列データに基づく異常監視方法では、平均値から3倍以上の分散を異常と見なし、すなわち残差値は時系列異常を判断する上で重要な特徴である。
【0057】
また、異常には、過大異常、過小異常など、異なるタイプがあってもよく、過大異常について、近接偏差値の計算方式は、max(Xt-Xt-1,0)であり、その他の偏差系指標(例えば、周期偏差値、傾向偏差値及び残差値)の計算方式も同様であり、過小異常について、近接偏差値の計算方式は、min(Xt-Xt-1,0)である。
【0058】
さらに、本願の一実施例では、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成するステップは、複数の特徴情報に基づいて、複数の特徴の組み合わせを生成し、複数の特徴の組み合わせから、ターゲット特徴の組み合わせを選択するステップを含む。
【0059】
具体的には、電子機器は、時系列データの複数の特徴情報を取得した後、複数の特徴情報の時系列データの近接偏差特徴、周期偏差特徴、傾向偏差特徴、及び残差特徴に対して特徴の組み合わせと次元削減を行い、最後に特徴評価の効果に基づいて再構成を行って、複数の特徴の組み合わせを取得することができる。 そして、電子機器は、特徴評価の効果に基づいて、複数の特徴の組み合わせから、最も優れた、(即ち、最も評価効果の高い)特徴の組み合わせをターゲット特徴の組み合わせとして選択することができる。
【0060】
なお、本実施例で説明した次元削減は、特徴に対して相関特徴合成およびノイズ除去処理を行うことに相当する。
【0061】
上記実施例を明確に説明するため、本願の一実施例では、複数の特徴の組み合わせから、ターゲット特徴の組み合わせを選択するステップは、各特徴の組み合わせのうち、複数の特徴の間の相関係数を計算し、相関係数に基づいて、複数の特徴の組み合わせから、ターゲット特徴の組み合わせを選択するステップを含み得る。
【0062】
なお、特徴間の相関係数が大きいほど、特徴が単一であるほど、特徴の質が悪いことを示している。相関は通常、ピアソン相関係数で評価することができ、ピアソン相関係数はcosine類似度に相当することができる。
【0063】
本願の実施例では、下記の式(5)によって、各特徴の組み合わせのうち、複数の特徴の間の相関係数を計算することができる。
【数3】
【数4】
は相関係数であり、nは時系列データの総時間であり、iは現在の時間であり、x1とx2はそれぞれ2つの特徴(即ち、上記の特徴の組み合わせのうちの2つの特徴)であり、
【数5】
と
【数6】
はそれぞれ2つの特徴の平均値であり得、即ち、x1とx2を平均値化したデータに相当する。
【0064】
具体的には、電子機器は、複数の特徴情報に基づいて、複数の特徴の組み合わせを生成した後、上記の式(5)によって、各特徴の組み合わせのうち、複数の特徴の間の相関係数をそれぞれ計算し、各特徴の組み合わせのうち、複数の特徴の間の相関係数を比較して、最も小さい複数の特徴の間の相関係数を決定し、この相関係数に対応する特徴の組み合わせをターゲット特徴の組み合わせとして、即ち、各特徴の組み合わせから、相関係数が最も小さい特徴の組み合わせをターゲット特徴の組み合わせとして選択することができる。
【0065】
さらに、本願の一実施例では、この時系列データの異常監視方法は、括各特徴の組み合わせのうち、複数の特徴の間の最小分散を計算し、相関係数と最小分散とに基づいて、複数の特徴の組み合わせから、ターゲット特徴の組み合わせを選択するステップをさらに含む。
【0066】
本願の実施例では、下記の式(6)によって、各特徴の組み合わせのうち、複数の特徴の間の最小分散を計算することができる。
【数7】
Gは、複数の特徴の間の最小分散であり、x1とx2はそれぞれ2つの特徴(即ち、上記の特徴の組み合わせのうちの2つの特徴)であり、
【数8】
と
【数9】
はそれぞれ2つの特徴の平均値であり、nは時系列データの総時間であり、iは現在の時間であり得る。
【0067】
具体的には、電子機器計は、各特徴の組み合わせのうち、複数の特徴の間の相関係数を計算した後、上記の式(6)によって、各特徴の組み合わせのうち、複数の特徴の間の最小分散をそれぞれ計算し、各特徴の組み合わせのうち、複数の特徴の間の最小分散を互いに比較して、第1の比較結果を生成することができる。そして、電子機器は、上記の式(5)によって、各特徴の組み合わせのうち、複数の特徴の間の相関係数をそれぞれ計算し、各特徴の組み合わせのうち、複数の特徴の間の相関係数を比較して、第2の比較結果を生成することができる。最後に、電子機器は、第1の比較結果と第2の比較結果とに基づいて、複数の特徴の組み合わせから、ターゲット特徴の組み合わせを選択することができる。例えば、最も小さい複数の特徴の間の相関係数と最小分散を選択し、対応する特徴の組み合わせをターゲット特徴の組み合わせとすることができる。これにより、選択されたターゲット特徴の組み合わせを現在の時系列データにより適合させることができる。
【0068】
本願の一実施例では、
図2に示すように、ターゲット特徴の組み合わせに基づいて異常結果を監視するステップは、ステップ201~203を含むことができる。
【0069】
ステップ201、ターゲット特徴の組み合わせを複数の異常監視モデルに入力して、各異常監視モデルによって認識された異常点と正常点を生成する。異常点と正常点はいずれも複数であってもよく、複数の異常監視モデルは、KNN(k-NearestNeighbor、最近接分類アルゴリズム)モデル、one-class SVM(One-Class Support Vector Machine、単一クラスのサポートベクターマシン)モデル、Isolation Forest(隔離森林)モデルなどを含むことができる。
【0070】
なお、この実施例で説明した複数の異常監視モデルは、呼び出しを容易にするために、事前にトレーニングされ、電子機器の記憶空間に事前に記憶されてもよい。
【0071】
さらに、上記の複数の異常監視モデルのトレーニングと生成は、関連するサーバによって行われることができ、このサーバは、クラウドサービスであってもよいし、コンピュータのホストであってもよく、このサーバと、本願の実施例によって提供される時系列データの異常監視方法を実行可能な電子機器との間には、無線ネットワーク接続と有線ネットワーク接続の少なくとも一方である通信接続が確立されている。サーバは、トレーニング済みの複数の異常監視モデルを電子機器に送信して、必要な時に電子機器が呼び出さないようにすることができて、電子機器の計算ストレスを大幅に減らすことができる。
【0072】
具体的には、電子機器は、ターゲット特徴の組み合わせを取得した後、ターゲット特徴の組み合わせを複数の異常監視モデルにそれぞれ入力し、複数の異常監視モデルによって、このターゲット特徴の組み合わせをそれぞれ処理することによって、各異常監視モデルが異常点と正常点、即ち各異常監視モデルによって認識された異常点と正常点を出力することができる。
【0073】
ステップ202、各異常監視モデルによって出力された異常点と正常点とに基づいて、複数の異常監視モデルから、時系列に適したターゲット異常監視モデルを選択する。
【0074】
本願の一実施例では、各異常監視モデルによって出力された異常点と正常点とに基づいて、複数の異常監視モデルから、時系列に適したターゲット異常監視モデルを選択するステップは、異常点と正常点との間の距離を取得し、異常点と正常点との間の距離に基づいて、複数の異常監視モデルから、時系列に適したターゲット異常監視モデルを選択するステップを含む。なお、この実施例で説明した距離は、異常点と正常点との間の最近距離であってもよい。
【0075】
本願の実施例では、下記の式(7)によって、異常点と正常点との間の距離を計算することができる。
【数10】
Vは異常点と正常点との間の距離であり、
【数11】
は、異常監視モデルによって出力されたすべての異常点のセットであり、
【数12】
は、異常監視モデルによって出力されたすべての正常点のセットであり、xiは異常点であり、xjは正常点であり得る。
【0076】
なお、本願は、各異常監視モデルによって出力された異常点と正常点の間の最近距離によって、各異常監視モデルの表現を評価することができ、この最近距離とは、異常点と正常点との間の距離の最小値を指し、通常、最小距離が遠いほど、異常の区別効果が顕著であること、すなわちモデルの表現効果が高いことを示している。
【0077】
ステップ203、ターゲット特徴の組み合わせとターゲット異常監視モデルとに基づいて、異常結果を監視する。
【0078】
具体的には、電子機器は、各異常監視モデルによって認識された異常点と正常点を取得した後、上記の式(7)によって、各異常監視モデルによって出力された異常点と正常点との間の最近距離をそれぞれ計算し、各異常監視モデルによって出力された異常点と正常点との間の最近距離を比較して、最も遠い異常点と正常点との間の最近距離を決定し、この最近距離に対応する異常監視モデルをターゲット異常監視モデルとすることができる。そして、電子機器は、このターゲット特徴の組み合わせとターゲット異常監視モデルとに基づいて、異常結果を監視する。
【0079】
時系列に適したターゲット異常監視モデルを選択する正確度を向上させるために、本願の一実施例では、異常点は複数であってもよく、この時系列データの異常監視方法は、複数の異常点と正常点との間の平均距離を取得し、異常点と正常点との間の距離と、平均距離とに基づいて、複数の異常監視モデルから、時系列に適したターゲット異常監視モデルを選択するステップを含み得る。なお、この実施例で説明した平均距離は、複数の異常点と正常点との間の平均最近距離であってもよい。
【0080】
本願の実施例では、下記の式(8)によって、複数の異常点と正常点との間の平均距離を計算することができる。
【数13】
Wは、複数の異常点と正常点との間の平均距離であり、
【数14】
は、異常監視モデルによって出力されたすべての異常点のセットであり、
【数15】
は、異常監視モデルによって出力されたすべての正常点のセットであり、
【数16】
は異常点の個数であり、xiは異常点であり、xjは正常点であり得る。
【0081】
なお、本願は、各異常監視モデルによって出力された複数の異常点と正常点の間の平均最近距離によって、各異常監視モデルの表現を評価することができ、この平均最近距離とは、複数の異常点から正常点までの間の最近距離の平均を指すことができ、通常、平均最近距離が遠いほどモデルの表現性能が良いことを示している。
【0082】
具体的には、電子機器は、各異常監視モデルによって認識された異常点と正常点を取得した後、上記の式(8)によって、各異常監視モデルによって出力された複数の異常点と正常点との間の最近距離の平均値をそれぞれ計算し、各異常監視モデルによって出力された異常点と正常点との間の最近距離の平均を比較して、第3の比較結果を生成することができる。そして、電子機器は、上記の式(7)によって、各異常監視モデルによって出力された異常点と正常点との間の最近距離をそれぞれ計算し、各異常監視モデルによって出力された異常点と正常点との間の最近距離を比較して、第4の比較結果を生成することができる。最後に、電子機器は、第3の比較結果と第4の比較結果とに基づいて、複数の異常監視モデルから、時系列に適したターゲット異常監視モデルを選択することができる。例えば、最も遠い異常点と正常点との間の最近距離と最近距離の平均値とを選択し、対応する異常監視モデルをターゲット異常監視モデルとすることができる。これにより、選択されたターゲット異常監視モデルを現在の時系列データにより適合させることができる。
【0083】
以上、本願の実施例の時系列データの異常監視方法は、まず、時系列データの複数の特徴情報を取得し、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成し、そして、ターゲット特徴の組み合わせに基づいて異常結果を監視する。これにより、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0084】
図3は本願一実施例に係る時系列データの異常監視装置の概略ブロック図である。
【0085】
本願の実施例の時系列データの異常監視装置は、電子機器に配置することができ、それによって、時系列データの複数の特徴情報を取得し、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成し、ターゲット特徴の組み合わせに基づいて異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0086】
図3に示すように、この時系列データの異常監視装置300は、取得モジュール310、生成モジュール320および監視モジュール330を備え得る。
【0087】
取得モジュール310は、時系列データの複数の特徴情報を取得する。
【0088】
生成モジュール320は、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成する。
【0089】
監視モジュール330は、ターゲット特徴の組み合わせに基づいて異常結果を監視する。
【0090】
本願の一実施例では、取得モジュール310は具体的には、時系列データの近接偏差特徴、周期偏差特徴、傾向偏差特徴、及び残差特徴のうちの複数の特徴を取得する。
【0091】
本願の一実施例では、
図3に示すように、生成モジュール320は、第1の生成ユニット321と第1の選択ユニット322とを備え得る。
【0092】
第1の生成ユニット321は、複数の特徴情報に基づいて、複数の特徴の組み合わせを生成する。
【0093】
第1の選択ユニット322は、複数の特徴の組み合わせから、ターゲット特徴の組み合わせを選択する。
【0094】
本願の一実施例では、第1の選択ユニット322は具体的には、各特徴の組み合わせのうち、複数の特徴の間の相関係数を計算し、相関係数に基づいて、複数の特徴の組み合わせから、ターゲット特徴の組み合わせを選択する。
【0095】
本願の一実施例では、第1の選択ユニット322は、さらに、各特徴の組み合わせのうち、複数の特徴の間の最小分散を計算し、相関係数と最小分散とに基づいて、複数の特徴の組み合わせから、ターゲット特徴の組み合わせを選択する。
【0096】
本願の一実施例では、
図3に示すように、監視モジュール330は、第2の生成ユニット331、第2の選択ユニット332および監視ユニット333を備え得る。
【0097】
第2の生成ユニット331は、ターゲット特徴の組み合わせを複数の異常監視モデルに入力して、各異常監視モデルによって認識された異常点と正常点を生成する。
【0098】
第2の選択ユニット332は、各異常監視モデルによって出力された異常点と正常点とに基づいて、複数の異常監視モデルから、時系列に適したターゲット異常監視モデルを選択する。
【0099】
監視ユニット333は、ターゲット特徴の組み合わせとターゲット異常監視モデルとに基づいて、異常結果を監視する。
【0100】
本願の一実施例では、第2の選択ユニット332は具体的には、異常点と正常点との間の距離を取得し、異常点と正常点との間の距離に基づいて、複数の異常監視モデルから、時系列に適したターゲット異常監視モデルを選択する。
【0101】
本願の一実施例では、異常点は複数であってもよく、第2の選択ユニット332は、さらに、複数の異常点と正常点との間の平均距離を取得し、異常点と正常点との間の距離と、平均距離とに基づいて、複数の異常監視モデルから、時系列に適したターゲット異常監視モデルを選択する。
【0102】
なお、本発明の実施例の時系列データの異常監視装置に記載されていない詳細は、本発明の実施例の時系列データの異常監視方法に記載された詳細を参照されたいため、具体的な説明は省略する。
【0103】
以上、本願の実施例の時系列データの異常監視装置は、取得モジュールによって、時系列データの複数の特徴情報を取得し、生成モジュールによって、複数の特徴情報に基づいてターゲット特徴の組み合わせを生成し、監視モジュールによって、ターゲット特徴の組み合わせに基づいて異常結果を監視する。これにより、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0104】
上記実施例を実現するために、
図4に示すように、本発明は、電子機器400を提供し、電子機器400はメモリ410、プロセッサ420及びメモリ410に記憶され、プロセッサ420で実行可能なコンピュータープログラムを含み、プロセッサ420は、プログラムを実行する場合、本願の上記の実施例に記載の時系列データの異常監視方法を実現するする。
【0105】
本願の実施例の電子機器は、プロセッサによって、メモリに記憶されているコンピュータープログラムを実行することにより、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0106】
上記実施例を実現するために、本発明は、コンピュータープログラムが記憶されているコンピュータ読み取り可能な記憶媒体をさらに提供し、このプログラムがプロセッサによって実行される場合、本願の上記の実施例に記載の時系列データの異常監視方法を実現する。
【0107】
本願の実施例のコンピュータ読み取り可能な記憶媒体は、コンピュータープログラムを記憶してプロセッサによって実行されることによって、ターゲット特徴の組み合わせを使用して異常結果を監視することによって、固定閾値を設定したり、ラベルデータを取得したりする必要がなく、コストが低く、拡張性が高い。
【0108】
本明細書の説明において、用語「第1」、「第2」は説明の目的のためにのみ使用され、相対的重要性を示す、または示された技術的特徴の数を暗黙的に示す、または暗示すると理解することはできない。したがって、「第1」、「第2」を規定する特徴は、少なくとも1つの特徴を明示的または暗黙的に含むことができる。本願の説明において、「複数」は、特に特定の限定がない限り、少なくとも2つ、例えば2つ、3つなどを意味する。
【0109】
本明細書の説明において、用語「一実施例」、「いくつかの実施例」、「例」、「具体例」、または「いくつかの例」などを参照する説明は、本実施例または例に関連して説明された具体的な特徴、構造、材料、または特定の点が本願の少なくとも1つの実施例または例に含まれることを意味する。本明細書において、上述の用語の概略的な表現は、必ずしも同じ実施形態または例を対象とする必要はない。さらに、記載された特定の特徴、構造、材料、または特徴は、いずれか1つまたは複数の実施形態または例において適切な方法で結合することができる。さらに、矛盾しない場合、当業者は、本明細書に記載された異なる実施例または例、および異なる実施例または例の特徴を組み合わせて組み合わせることができる。
【0110】
以上、本願の実施例を示し説明したが、上述の実施例は例示的であり、本願に対する制限と理解することはできず、当業者は、本願の範囲内で上述の実施例を変更、修正、置換、および変形することができることを理解することができる。
【国際調査報告】