IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧

特表2024-504691時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択
<>
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図1
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図2
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図3
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図4A
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図4B
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図5A
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図5B
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図6
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図7
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図8
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図9
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図10
  • 特表-時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-01
(54)【発明の名称】時系列表現学習におけるアンカー・ウィンドウ・サイズおよび位置選択
(51)【国際特許分類】
   G06N 3/049 20230101AFI20240125BHJP
   G06F 18/27 20230101ALI20240125BHJP
【FI】
G06N3/049
G06F18/27
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023544152
(86)(22)【出願日】2022-01-25
(85)【翻訳文提出日】2023-07-20
(86)【国際出願番号】 CN2022073816
(87)【国際公開番号】W WO2022161358
(87)【国際公開日】2022-08-04
(31)【優先権主張番号】17/162,649
(32)【優先日】2021-01-29
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【弁理士】
【氏名又は名称】太佐 種一
(74)【代理人】
【識別番号】100120710
【弁理士】
【氏名又は名称】片岡 忠彦
(74)【復代理人】
【識別番号】110000420
【氏名又は名称】弁理士法人MIP
(72)【発明者】
【氏名】パブルリ、ベンカタ ナガラジュ
(72)【発明者】
【氏名】スブラマニアン、ダーマシャンカー
(72)【発明者】
【氏名】チャン、ユアン-チ
(72)【発明者】
【氏名】ヴ、ロン
(72)【発明者】
【氏名】ディンガー、ティモシー、レア
(57)【要約】
コンピューティング・デバイスを使用して変量時系列データにおけるウィンドウ・サイズを決定する方法であって、方法は、コンピューティング・デバイスによって、機械学習モデルに関連付けられた変量時系列データを受け取ることを含む。コンピューティング・デバイスは、変量時系列データの移動ウィンドウ・サイズおよび標準偏差をセットする。コンピューティング・デバイスは、さらに、変量時系列データの移動ウィンドウ平均を計算する。コンピューティング・デバイスは、追加として、すべての変量時系列データを横断して標準偏差を計算する。コンピューティング・デバイスは、計算された標準偏差を降順にソートする。コンピューティング・デバイスは、さらに、少なくとも1つのアンカーが上記標準偏差のインデックスを訪れるまでそのインデックスを反復する。コンピューティング・デバイスは、前のアンカーが訪れた隣のアンカーをカバーするように各アンカーを反復して拡大する。コンピューティング・デバイスは、拡大されたアンカーに基づいてウィンドウ・サイズを決定する。
【特許請求の範囲】
【請求項1】
コンピューティング・デバイスを使用して変量時系列データにおけるウィンドウ・サイズを決定する方法であって、前記方法が、
コンピューティング・デバイスによって、機械学習モデルに関連付けられた変量時系列データを受け取ることと、
前記コンピューティング・デバイスによって、前記変量時系列データの移動ウィンドウ・サイズおよび標準偏差をセットすることと、
前記コンピューティング・デバイスによって、前記変量時系列データの移動ウィンドウ平均を計算することと、
前記コンピューティング・デバイスによって、すべての変量時系列データを横断して標準偏差を計算することと、
前記コンピューティング・デバイスによって、計算された前記標準偏差を降順にソートすることと、
前記コンピューティング・デバイスによって、少なくとも1つのアンカーが前記標準偏差のインデックスを訪れるまで前記インデックスを反復することと、
前記コンピューティング・デバイスによって、前のアンカーが訪れた隣のアンカーをカバーするように各アンカーを反復して拡大することと、
前記コンピューティング・デバイスによって、前記拡大されたアンカーに基づいてウィンドウ・サイズを決定することと
を含む方法。
【請求項2】
前記変量時系列データが、一変量時系列データまたは多変量時系列データである、請求項1に記載の方法。
【請求項3】
前記ウィンドウ・サイズが、前記変量時系列データの表現機械学習の三重項損失式で実装される、請求項2に記載の方法。
【請求項4】
前記反復することが、
最大標準偏差および現在のウィンドウ・サイズを使用して次のウィンドウ・サイズの始まりおよび終わりをセットすること
をさらに含む、請求項2に記載の方法。
【請求項5】
前記コンピューティング・デバイスによって、前記始まりと終わりとの間の前記ウィンドウ・サイズ位置をマークすること
をさらに含む、請求項4に記載の方法。
【請求項6】
前記コンピューティング・デバイスによって、標準偏差が閾値を超過するその隣まで前記移動ウィンドウ・サイズを反復して拡大すること
をさらに含む、請求項2に記載の方法。
【請求項7】
前記コンピューティング・デバイスによって、前記前のアンカーが訪れたことのない位置にある次の最大標準偏差を選択することと、
前記コンピューティング・デバイスによって、ウィンドウ・ベースの移動平均ベクトルにおけるすべての位置を訪れると、処理を終わらせることと
をさらに含む、請求項2に記載の方法。
【請求項8】
変量時系列データにおけるウィンドウ・サイズを決定するためのコンピュータ・プログラム製品であって、前記コンピュータ・プログラム製品が、プログラム命令が具体化されたコンピュータ可読ストレージ媒体を備え、前記プログラム命令が、
プロセッサによって、機械学習モデルに関連付けられた変量時系列データを受け取ることと、
前記プロセッサによって、前記変量時系列データの移動ウィンドウ・サイズおよび標準偏差をセットすることと、
前記プロセッサによって、前記変量時系列データの移動ウィンドウ平均を計算することと、
前記プロセッサによって、すべての変量時系列データを横断して標準偏差を計算することと、
前記プロセッサによって、計算された前記標準偏差を降順にソートすることと、
前記プロセッサによって、少なくとも1つのアンカーが前記標準偏差のインデックスを訪れるまで前記インデックスを反復することと、
前記プロセッサによって、前のアンカーが訪れた隣のアンカーをカバーするように各アンカーを反復して拡大することと、
前記プロセッサによって、前記拡大されたアンカーに基づいてウィンドウ・サイズを決定することと
を前記プロセッサに行わせるように前記プロセッサによって実行可能な、コンピュータ・プログラム製品。
【請求項9】
前記変量時系列データが、一変量時系列データまたは多変量時系列データである、請求項8に記載のコンピュータ・プログラム製品。
【請求項10】
前記ウィンドウ・サイズが、前記変量時系列データの表現機械学習の三重項損失式で実装される、請求項9に記載のコンピュータ・プログラム製品。
【請求項11】
前記反復することが、
最大標準偏差および現在のウィンドウ・サイズを使用して次のウィンドウ・サイズの始まりおよび終わりをセットすること
をさらに含む、請求項9に記載のコンピュータ・プログラム製品。
【請求項12】
前記プロセッサによって実行可能な前記プログラム命令が、
前記プロセッサによって、前記始まりと終わりとの間の前記ウィンドウ・サイズ位置をマークすること
を前記プロセッサにさらに行わせる、請求項11に記載のコンピュータ・プログラム製品。
【請求項13】
前記プロセッサによって実行可能な前記プログラム命令が、
前記プロセッサによって、標準偏差が閾値を超過するその隣まで前記移動ウィンドウ・サイズを反復して拡大すること
を前記プロセッサにさらに行わせる、請求項9に記載のコンピュータ・プログラム製品。
【請求項14】
前記プロセッサによって実行可能な前記プログラム命令が、
前記プロセッサによって、前記前のアンカーが訪れたことのない位置にある次の最大標準偏差を選択することと、
前記プロセッサによって、ウィンドウ・ベースの移動平均ベクトルにおけるすべての位置を訪れると、処理を終わらせることと
を前記プロセッサにさらに行わせる、請求項9に記載のコンピュータ・プログラム製品。
【請求項15】
装置であって、
命令を格納するように構成されたメモリと、
プロセッサであって、
機械学習モデルに関連付けられた変量時系列データを受け取ることと、
前記変量時系列データの移動ウィンドウ・サイズおよび標準偏差をセットすることと、
前記変量時系列データの移動ウィンドウ平均を計算することと、
すべての変量時系列データを横断して標準偏差を計算することと、
計算された前記標準偏差を降順にソートすることと、
少なくとも1つのアンカーが前記標準偏差のインデックスを訪れるまで前記インデックスを反復することと、
前のアンカーが訪れた隣のアンカーをカバーするように各アンカーを反復して拡大することと、
前記拡大されたアンカーに基づいてウィンドウ・サイズを決定することと
を行うための前記命令を実行するように構成された、プロセッサと
を備える装置。
【請求項16】
前記変量時系列データが、一変量時系列データまたは多変量時系列データである、請求項15に記載の装置。
【請求項17】
前記ウィンドウ・サイズが、前記変量時系列データの表現機械学習の三重項損失式で実装される、請求項16に記載の装置。
【請求項18】
前記反復することが、
最大標準偏差および現在のウィンドウ・サイズを使用して次のウィンドウ・サイズの始まりおよび終わりをセットすること
をさらに含む、請求項16に記載の装置。
【請求項19】
前記プロセッサが、
前記始まりと終わりとの間の前記ウィンドウ・サイズ位置をマークすることと、
標準偏差が閾値を超過するその隣まで前記移動ウィンドウ・サイズを反復して拡大することと
を行うための前記命令を実行するようにさらに構成される、請求項18に記載の装置。
【請求項20】
前記プロセッサが、
前記プロセッサによって、前記前のアンカーが訪れたことのない位置にある次の最大標準偏差を選択することと、
前記プロセッサによって、ウィンドウ・ベースの移動平均ベクトルにおけるすべての位置を訪れると、処理を終わらせることと
を行うための前記命令を実行するようにさらに構成される、請求項16に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態の分野は、コンピューティング・デバイスを使用して、一変量または多変量時系列データにおけるウィンドウ・サイズを決定することに関する。
【背景技術】
【0002】
表現学習は、多くの領域におけるデータの顕著な特性を捕らえる本質的な特徴を学習するのに有効であることがわかってきた。具体的には、三重損失(triple-loss)ベースの表現学習は、「三重項損失(triplet loss)」、すなわち、ベースライン(アンカー)入力が、正(おそらく真であろう)の入力および負(おそらく偽であろう)の入力と比較される、人工ニューラル・ネットワークのための損失関数を含み、表現空間においてベースライン(アンカー)入力から正(おそらく真)の入力への距離が最小化され、(表現空間において)ベースライン(アンカー)入力から負(おそらく偽)の入力への距離が最大化されるように表現が学習される。
【0003】
従来の最先端の時系列表現学習(RL:representation learning)は、三重項損失を伴う膨張時間畳み込みニューラル・ネットワーク(CNN)アーキテクチャに従い、この場合、アンカー・ウィンドウの位置およびサイズがランダムに選ばれ、正のサンプルがアンカー・ウィンドウの中でランダムに選ばれ、負のサンプルがアンカー・ウィンドウの外でランダムに選ばれる。ランダムな正/負は、三重項の容易な組立てを可能にするが、従来の時系列RLは、正を選択する際に自己相似性を強調するだけであり、相違点の負を完全に運任せにする。
【発明の概要】
【0004】
実施形態は、コンピューティング・デバイスを使用して、変量時系列データの時系列表現機械学習(ML)の三重項損失式におけるアンカー・ウィンドウ・サイズおよび位置を選択することに関する。一実施形態は、コンピューティング・デバイスを使用して変量時系列データにおけるウィンドウ・サイズを決定する方法を提供し、方法は、コンピューティング・デバイスによって、機械学習モデルに関連付けられた変量時系列データを受け取ることを含む。コンピューティング・デバイスは、変量時系列データの移動ウィンドウ・サイズおよび標準偏差をセットする。コンピューティング・デバイスは、さらに、変量時系列データの移動ウィンドウ平均を計算する。コンピューティング・デバイスは、追加として、すべての変量時系列データを横断して標準偏差を計算する。コンピューティング・デバイスは、計算された標準偏差を降順にソートする。コンピューティング・デバイスは、さらに、少なくとも1つのアンカーが上記標準偏差のインデックスを訪れるまでそのインデックスを反復する。コンピューティング・デバイスは、前のアンカーが訪れた隣のアンカーをカバーするように各アンカーを反復して拡大する。コンピューティング・デバイスは、拡大されたアンカーに基づいてウィンドウ・サイズを決定する。いくつかの特徴は、分類精度でおよび複数のML訓練実行を横断して測定された幅広い変動を低減させるという利点に寄与する。他の特徴は、特により難しいデータセットに対して、複数の訓練実行を横断した精度平均および範囲で表現MLを改善するという利点に寄与する。いくつかの特徴は、従来の技術より速く結果の最適化を収束させるという利点に寄与し、不十分な極小値でトラップされる可能性が低くなる。いくつかの実施形態は、自動サーチ時間を低減させるためにML自動化における実践的な利益を提供し、コンピューティング時間を低減させるために表現ML実行の数を低減させる。1つまたは複数の実施形態は、早期に停止される必要があるML実行時の改善された確実性を提供する。
【0005】
以下の特徴のうちの1つまたは複数が含まれてもよい。いくつかの実施形態では、方法は、変量時系列データが、一変量時系列データまたは多変量時系列データであることをさらに含んでもよい。
【0006】
いくつかの実施形態では、方法は、追加として、ウィンドウ・サイズが、変量時系列データの表現機械学習の三重項損失式で実装されることを含んでもよい。
【0007】
1つまたは複数の実施形態では、方法は、最大標準偏差および現在のウィンドウ・サイズを使用して次のウィンドウ・サイズの始まりおよび終わりをセットすることをさらに含んでもよい。
【0008】
いくつかの実施形態では、方法は、追加として、コンピューティング・デバイスによって、始まりと終わりとの間のウィンドウ・サイズ位置をマークすることを含んでもよい。
【0009】
1つまたは複数の実施形態では、方法は、コンピューティング・デバイスによって、標準偏差が閾値を超過するその隣まで移動ウィンドウ・サイズを反復して拡大することを含んでもよい。
【0010】
いくつかの実施形態では、方法は、コンピューティング・デバイスによって、その位置を前のアンカーが訪れたことがない次の最大標準偏差を選択することと、コンピューティング・デバイスによって、ウィンドウ・ベースの移動平均ベクトルにおけるすべての位置を訪れると、処理を終わらせることとをさらに含んでもよい。
【0011】
本実施形態のこれらおよび他の特徴、態様、および利点は、以下の説明、添付の特許請求の範囲、および付随の図を参照すると、理解されるであろう。
【図面の簡単な説明】
【0012】
図1】一実施形態による、一変量時系列データ処理の時系列表現機械学習(ML)の三重項損失式におけるアンカー・ウィンドウ・サイズおよび位置を選択するための流れ図である。
図2】一実施形態による、多変量時系列データ処理の時系列表現MLの三重項損失式におけるアンカー・ウィンドウ・サイズおよび位置を選択するための流れ図である。
図3】一実施形態による、分散駆動(variance driven)三重項アンカー・ウィンドウ選択ML学習処理のためのコンピューティング・プロセスの図である。
図4A】訓練セットからの異なるクラスのグラフである。
図4B】一実施形態による、図4Aのグラフに関する特定のウィンドウ・サイズに対する移動平均の標準偏差のグラフである。
図5A】別の訓練セットからの異なるクラスのグラフである。
図5B】一実施形態による、図5Aのグラフに関する特定のウィンドウ・サイズに対する移動平均の標準偏差のグラフである。
図6】一実施形態による、一変量または多変量時系列処理の表現ML学習の三重項損失式のためのアンカー・ウィンドウを決定するためのプロセスのブロック図である。
図7】実施形態による、クラウド・コンピューティング環境の図である。
図8】実施形態による、抽象化モデル層のセットの図である。
図9】実施形態による、一変量または多変量時系列処理の表現ML学習の三重項損失式におけるアンカーを決定するためのシステムのネットワーク・アーキテクチャの図である。
図10】実施形態による、図7のサーバもしくはクライアントまたはその両方に関連付けられ得る代表的なハードウェア環境の図である。
図11】一実施形態による、一変量または多変量時系列処理の表現ML学習の三重項損失式におけるアンカーを決定するための分散型システムを示すブロック図である。
【発明を実施するための形態】
【0013】
様々な実施形態の説明は、例証のために提示されてきたが、網羅的であること、または開示の実施形態に限定されることを意図するものではない。説明される実施形態の範囲から逸脱することなく、多くの変更形態および変形形態が当業者には明らかになるであろう。本明細書で使用される専門用語は、実施形態の原理、実用的応用、もしくは市場で見つかる技術に対する技術的改善を最も良く説明するように、または、本明細書で開示された実施形態を当業者が理解できるように選ばれた。
【0014】
実施形態は、コンピューティング・デバイスを使用して、変量時系列データの時系列表現機械学習(ML)の三重項損失式におけるアンカー・ウィンドウ・サイズおよび位置を選択することに関する。一実施形態は、コンピューティング・デバイスを使用して変量時系列データにおけるウィンドウ・サイズを決定する方法を提供し、方法は、コンピューティング・デバイスによって、機械学習モデルに関連付けられた変量時系列データを受け取ることを含む。コンピューティング・デバイスは、変量時系列データの移動ウィンドウ・サイズおよび標準偏差をセットする。コンピューティング・デバイスは、さらに、変量時系列データの移動ウィンドウ平均を計算する。コンピューティング・デバイスは、追加として、すべての変量時系列データを横断して標準偏差を計算する。コンピューティング・デバイスは、計算された標準偏差を降順にソートする。コンピューティング・デバイスは、さらに、少なくとも1つのアンカーが上記標準偏差のインデックスを訪れるまでそのインデックスを反復する。コンピューティング・デバイスは、前のアンカーが訪れた隣のアンカーをカバーするように各アンカーを反復して拡大する。コンピューティング・デバイスは、拡大されたアンカーに基づいてウィンドウ・サイズを決定する。いくつかの特徴は、分類精度でおよび複数のML訓練実行を横断して測定された幅広い変動を低減させるという利点に寄与する。他の特徴は、特により難しいデータセットに対して、複数の訓練実行を横断した精度平均および範囲で表現MLを改善するという利点に寄与する。いくつかの特徴は、従来の技術より速く結果の最適化を収束させるという利点に寄与し、不十分な極小値でトラップされる可能性が低くなる。いくつかの実施形態は、自動サーチ時間を低減させるためにML自動化における実践的な利益を提供し、コンピューティング時間を低減させるために表現ML実行の数を低減させる。1つまたは複数の実施形態は、早期に停止される必要があるML実行時の改善された確実性を提供する。いくつかの実施形態は、三重項損失関数最小化のためのアンカーの選択を提供する。
【0015】
以下の特徴のうちの1つまたは複数が含まれてもよい。いくつかの実施形態では、方法は、変量時系列データが、一変量時系列データまたは多変量時系列データであることをさらに含んでもよい。
【0016】
いくつかの実施形態では、方法は、追加として、ウィンドウ・サイズが、変量時系列データの表現機械学習の三重項損失式で実装されることを含んでもよい。
【0017】
1つまたは複数の実施形態では、方法は、最大標準偏差および現在のウィンドウ・サイズを使用して次のウィンドウ・サイズの始まりおよび終わりをセットすることをさらに含んでもよい。
【0018】
いくつかの実施形態では、方法は、追加として、コンピューティング・デバイスによって、始まりと終わりとの間のウィンドウ・サイズ位置をマークすることを含んでもよい。
【0019】
1つまたは複数の実施形態では、方法は、コンピューティング・デバイスによって、標準偏差が閾値を超過するその隣まで移動ウィンドウ・サイズを反復して拡大することを含んでもよい。
【0020】
いくつかの実施形態では、方法は、コンピューティング・デバイスによって、その位置を前のアンカーが訪れたことがない次の最大標準偏差を選択することと、コンピューティング・デバイスによって、ウィンドウ・ベースの移動平均ベクトルにおけるすべての位置を訪れると、処理を終わらせることとをさらに含んでもよい。
【0021】
1つまたは複数の実施形態は、1つまたは複数の人工知能(AI:artificial intelligence)モデルを採用する処理のための(例えば、プロセス100、プロセス200、プロセス300などのための)モデルを含む。AIモデルは、訓練済MLモデル(例えば、ニューラル・ネットワーク(NN)、畳み込みNN(CNN)、回帰NN(RNN)、長短期格納(LSTM)ベースのNN、ゲート回帰ユニット(GRU)ベースのRNN、ツリー・ベースのCNN、自己注意ネットワーク(例えば、注意メカニズムを基本的なビルディング・ブロックとして利用するNNであり、自己注意ネットワークは、シーケンス・モデリング・タスクに効果的であることが示されてきたが、回帰または畳み込みを有していない)、BiLSTM(双方向LSTM)などのモデル)を含んでもよい。人工NNは、ノードまたはニューロンの相互接続されたグループである。
【0022】
既存のアプローチは、アンカー・イメージをクロップすること/カットすること/書き換えること(例えば、正のためにアンカーをサブサンプリングすること)、および、ランダム・イメージを選ぶこと(例えば、負のためにランダム時系列区間を選ぶこと)など、イメージ・ベースの三重項生成を時系列にフィットさせようとする。イメージと違って、数値の時系列は、類似性およびコントラストのより自然な測定を提供する。1つまたは複数の実施形態は、三重項訓練のために正および負のサンプル選択が実行されてもよい。一実施形態では、複数の正のサンプルのより一般的なケースに修正された単一の(自己サブサンプリングされた)正のサンプルを使用する元の三重損失関数のために、ウィンドウ選択が実行され、これらも、自己サブサンプリングされることに制約されない。
【0023】
図1は、一実施形態による、一変量時系列データ処理100の時系列表現MLの三重項損失式におけるアンカー・ウィンドウ・サイズおよび位置を選択するための流れ図を示す。最先端の時系列表現学習は、イメージ、テキスト表現学習のCNNアーキテクチャに従う。従来の技術では、イメージにおけるアンカー畳み込みウィンドウ、文におけるアンカー・ワード・ウィンドウ(スパン)、および時系列におけるアンカー時間ウィンドウの位置およびサイズが、それぞれランダムに選ばれる。イメージおよびテキスト・コーパスと違って、実践的な時系列の問題は、ランダム選択を通じて効果的に学習するための、より少ない例を有する。従来の技術に伴う問題の1つは、ランダム・アンカー・ウィンドウ選択が、複数の訓練実行を横断して分類精度で測定される幅広い変動につながることである。
【0024】
一実施形態では、ブロック110において、処理100は、ノイズ入り信号を滑らかにするために領域知識に基づいて、移動平均ウィンドウ・サイズWを選択すること(またはセットすること)を含む。時系列では、「ウィンドウ」は、2次元行列m×sなどの、データの区間であり、ここで、mは、時系列の次元であり、sは、区間における時間ステップの数である。一実施形態では、標準偏差閾値(σ)がセットされる。ブロック120において、各時系列インスタンスに対して、ウィンドウ・ベースの移動平均ウィンドウ・サイズは、ベクトル長L-Wとして計算される。ブロック130において、処理100は、時系列インスタンスの(例えば、ML訓練セットにおける各インデックスKにおける)移動平均を横断して標準偏差をベクトル長L-Wとして計算する。ブロック140において、集約された標準偏差ベクトルは、降順にソートされる。ブロック150において、処理100は、最大標準偏差Kのインデックス位置から始める。ブロック160において、処理100は、アンカー・ウィンドウの始まりをK-Wとして、および終わりをK+Wとしてセットする。ブロック170において、処理100は、すべてのインデックスを訪れるまで、各反復に対して、K-WとK+Wのインデックス間の位置に、(少なくとも1つのアンカーが)訪れたとマークする(例えば、フラグ(例えば、真、偽など)、ビット(0、1)などをセットする)。ブロック175において、処理100は、(少なくとも1つのアンカーが)アンカー・ウィンドウの始まりK-Wおよび終わりK+Wの隣を訪れた場合、アンカー・ウィンドウの始まりK-Wおよび終わりK+Wを反復して拡大する。一実施形態では、ブロック175は、また、アンカー・ウィンドウを、σより大きい標準偏差を有するアンカー・ウィンドウの隣に拡大してもよい。ブロック180において、処理100は、現在のアンカー・ウィンドウを出力する(または放出する)。ブロック190において、処理100は、その位置を訪れたことがない次の最大標準偏差Kを選択(またはセット)し、処理100は、L-Wベクトルにおけるすべての位置を訪れると停止し、そうでなければ、処理100は、ブロック160に戻って処理100を続ける。
【0025】
一実施形態では、処理100は、MLモデル訓練中に表現MLの変動を改善し狭めるために、静的なアンカー・ウィンドウ選択を提供する。イメージおよび文と区別できるものとして、一実施形態では、処理100が、数値の時系列情報に対して、対照的な代数演算を実施することが提供される。1つまたは複数の実施形態では、アンカー・ウィンドウは、局所分散、または広く対照的な統計的尺度を通じて選択される。処理100は、複数の訓練実行を横断して精度平均および範囲で、特により難しいデータセットに対して、表現MLを改善する。一実施形態では、処理100は、従来の技術より速く収束させ、不十分な極小値においてトラップされる可能性が低くなる。いくつかの実施形態は、自動サーチ時間を低減させるためにML自動化における実践的な利益をもたらし、表現ML実行の数を低減させて、コンピューティング時間を低減させる。1つまたは複数の実施形態は、早期に停止される必要があるML実行時の改善された確実性を提供する。
【0026】
一実施形態では、処理100は、以下のような、一変量または多変量時系列のためのMLアンカー選択時に実行されてもよい。アンカー内で、ランダムな長さおよび位置のサンプルが選択され、正の母集団と呼ばれる。一実施形態では、アンカーは、複数の時系列オブジェクトの訓練バッチにおける各時系列オブジェクトから、適切な選択プロトコルを使用して選択される。一実施形態では、選択プロトコルは、複数の時系列オブジェクトの訓練バッチにおける各時系列オブジェクトに対する、対応する長さのランダムな部分区間の選択を含んでもよい。いくつかの実施形態では、アンカー選択は、局所分散ベースの選択プロトコルを使用することを含むが、このプロトコルは、時系列全体を通じて体系的にスイープするとともに、複数の時系列オブジェクトの訓練バッチに含まれる各時系列オブジェクトに対して、バッチを横断すると1つずつ選択される、アンカー・オブジェクトのシーケンスを生じるものである。
【0027】
図2は、一実施形態による、多変量時系列データ処理200の時系列表現MLの三重項損失式におけるアンカー・ウィンドウ・サイズおよび位置を選択するための流れ図を示している。一実施形態では、ブロック210において、処理200は、最大標準偏差Kのインデックス位置から始めることを含む。ブロック220において、処理200は、アンカー・ウィンドウの始まりをK-Wとして、および終わりをK+Wとしてセットする。ブロック230において、処理200は、すべてのインデックスを訪れるまで、各反復に対して、K-WとK+Wのインデックス間の位置に、(少なくとも1つのアンカーが)訪れたとマークする(例えば、フラグ(例えば、真、偽など)、ビット(0、1)などをセットする)。ブロック240において、処理200は、アンカー・ウィンドウの始まりK-Wおよび終わりK+Wの隣の標準偏差が、予めセットされた閾値(例えば、1.0など)を上回る場合、アンカー・ウィンドウの始まりK-Wおよび終わりK+Wを反復して(少なくとも1つのアンカーがすべてのインデックスを訪れるまで反復する)拡大する。ブロック250において、プロセス200は、(少なくとも1つのアンカーが)アンカー・ウィンドウの始まりK-Wおよび終わりK+Wの隣を訪れた場合、アンカー・ウィンドウの始まりK-Wおよび終わりK+Wを反復して拡大する。ブロック260において、処理200は、現在のアンカー・ウィンドウを出力する(または放出する)。ブロック270において、処理200は、訪れていない位置にある次の最大標準偏差Kを選択(またはセット)し、処理200は、L-Wベクトルにおけるすべての位置を訪れると停止するが、そうでなければ、処理200は、ブロック220に戻って処理200を続ける。
【0028】
図3は、一実施形態による、分散駆動の三重項アンカー・ウィンドウ選択ML学習処理のためのコンピューティング・プロセス300を示す。一実施形態では、プロセス300は、最大分散の周期をカバーするアンカー(xref)を漸進的に選択し、各ML反復においてカバレッジを拡大する。一実施形態では、プロセス300は、
【数1】
を、標準偏差が閾値
【数2】
(標準偏差ベクトル)>θ(標準偏差閾値)を超過するその隣まで反復して拡大する。プロセス300は、また、
【数3】
を、
【数4】
(訪れたベクトル)が真値を有するその隣まで反復して拡大する。一実施形態では、
【数5】
(訪れたベクトル)は、前の、より大きな分散アンカー・ウィンドウによってカバーされたインデックスを記録する。
【0029】
一実施形態では、いくつかの利点および利益は、プロセス300のための分散駆動の三重項アンカー・ウィンドウ選択ML学習が、複数の訓練実行を横断した精度範囲>5%の一変量データセットの精度を改善し、データセットの85%において平均精度を改善し、データセットの74%において範囲を狭めたことである。いくつかの実施形態は、複数の訓練実行を横断して最大、平均、および範囲の精度で、特に、より難しいデータセットに対して、表現学習を改善する。一実施形態では、プロセス300は、イメージ処理からのアイデアに時系列を無理矢理フィットさせるのではなく、時系列に自然な数値演算を活用する。一実施形態は、自己相似性/サブサンプリングのみよりも堅牢な距離ベースの正のサンプル・マイニングを提供し、類似の時間区間のより豊かなセットを生ずる。一実施形態では、ML自動化における実践的な利益は、自動サーチ時間を低減させ、表現学習実行の数を低減させて計算時間を節約し、学習実行が早期に停止される必要がある場合の確実性をより良くし、特徴エンジニアリング・ツール・ボックスへのより洗練された追加を提供する。追加として、1つまたは複数の実施形態は、訓練データ統計に基づいて、RLのためのアンカーを選択するように一般化されてもよい。
【0030】
図4Aは、訓練セットからの異なる12個のクラスの実例のグラフ400を示す。異なるクラス(最上部から最下部まで)は、訓練セット(例えば、3次元の加速度計データ)から名付けられる(2 4 3 5 1 8 10 9 7 11 6 12)。加速度計から生じた新しい時系列が提示されると、MLは、新しいシリーズを12個のクラスのうちの1つに分類しようとする。
【0031】
図4Bは、一実施形態による、図4Aのグラフに関する特定のウィンドウ・サイズに対する移動平均の標準偏差のグラフ410を示している。グラフ410では、プロセス300(図3)によって識別されたアンカー・ウィンドウは、グラフ410において1から15までの数字でラベル付けされている。数字1でラベル付けされたアンカー・ウィンドウは、最大コントラストが発生した訓練データのセグメントに置かれている。数字2でラベル付けされたアンカー・ウィンドウは、第2の最大コントラストが発生した訓練データのセグメントに置かれている。プロセス300に従って、その後のアンカー・ウィンドウが、さらに低いコントラスト・セグメントに置かれ、最後に、完全なシリーズを全体としてカバーする。最小アンカー・ウィンドウ長Wは、この例証的な例では、16にセットされている。
【0032】
図5Aは、別の訓練セットからの異なるクラスのグラフ500を示す。グラフ500に対して、訓練セットは、シェープレットのためにデザインされたシミュレートされたデータセットである。クラス(0 1)は、最上部から最下部まで使用され、示されている。図4Aとは対照的に、このデータセットは、視覚的により多くのノイズが入っており、人間の検査で区別するのは難しい。それでも、このデータセットは、2つのクラスを正確に分類するように、プロセス300(図3)を使用して学習されてもよい。
【0033】
図5Bは、一実施形態による、図5Aのグラフ500に関する特定のウィンドウ・サイズにわたる移動平均の標準偏差のグラフ510を示す。グラフ510では、標準偏差は、ウィンドウ・サイズ16にわたる移動平均の標準偏差に対して、1から23までの数字でラベル付けされている。グラフ410(図4B)に示されたラベル・コンベンションと同様に、数字1でラベル付けされたアンカー・ウィンドウは、最大コントラストが発生した訓練データのセグメントに置かれる。その後のアンカー・ウィンドウは、さらに低いコントラスト・セグメントにおいて漸増的に識別され、最後に、完全なシリーズを全体としてカバーする。
【0034】
図6は、一実施形態による、一変量または多変量時系列処理の表現ML学習の三重項損失式のためのアンカー・ウィンドウを決定するためのプロセス600のブロック図を示す。一実施形態では、ブロック610において、プロセス600は、(図7のコンピューティング・ノード710、図8のハードウェアおよびソフトウェア層860、図9の処理システム900、図10のシステム1000、図11のシステム1100などからの)コンピューティング・デバイスによって、機械学習モデルに関連付けられた変量時系列データを受け取る。ブロック620において、プロセス600は、さらに、コンピューティング・デバイスによって、変量時系列データの移動ウィンドウ・サイズおよび標準偏差をセットすることを行う。ブロック630において、プロセス600は、さらに、コンピューティング・デバイスによって、変量時系列データの移動ウィンドウ平均を計算することを行う。ブロック640において、プロセス600は、コンピューティング・デバイスによって、すべての変量時系列データを横断して標準偏差を計算することを行う。ブロック650において、プロセス600は、さらに、コンピューティング・デバイスによって、計算された標準偏差を降順にソートすることを行う。ブロック660において、プロセス600は、追加として、コンピューティング・デバイスによって、少なくとも1つのアンカーが上記標準偏差のインデックスを訪れるまでそのインデックスを反復することを行う。ブロック670において、プロセス600は、さらに、コンピューティング・デバイスによって、前のアンカーが訪れた隣のアンカーをカバーするように各アンカーを反復して拡大することを行う。ブロック680において、プロセス600は、さらに、コンピューティング・デバイスによって、拡大されたアンカーに基づいてウィンドウ・サイズを決定することを行う。
【0035】
一実施形態では、プロセス600は、変量時系列データが、一変量時系列データまたは多変量時系列データであるという特徴をさらに含んでもよい。
【0036】
一実施形態では、プロセス600は、ウィンドウ・サイズが、変量時系列データの表現機械学習の三重項損失式で実装されるという特徴をさらに含んでもよい。
【0037】
一実施形態では、プロセス600は、反復が、最大標準偏差および現在のウィンドウ・サイズを使用して次のウィンドウ・サイズの始まりおよび終わりをセットすることをさらに含むことを含んでもよい。
【0038】
一実施形態では、プロセス600は、コンピューティング・デバイスによって、始まりと終わりとの間のウィンドウ・サイズ位置をマークすることをさらに含んでもよい。
【0039】
一実施形態では、プロセス600は、コンピューティング・デバイスによって、標準偏差が閾値を超過するその隣まで移動ウィンドウ・サイズを反復して拡大することをさらに含んでもよい。
【0040】
一実施形態では、プロセス600は、コンピューティング・デバイスによって、前のアンカーが訪れたことのない位置にある次の最大標準偏差を選択することと、コンピューティング・デバイスによって、ウィンドウ・ベースの移動平均ベクトルにおけるすべての位置を訪れると、処理を終わらせることとを、さらに含んでもよい。
【0041】
本開示は、クラウド・コンピューティングについての詳細な説明を含むが、本明細書で列挙される教示の実装形態は、クラウド・コンピューティング環境に限定されないことが予め理解されている。むしろ、本実施形態の実施形態は、現在知られているか、後で開発される、他の任意のタイプのコンピューティング環境と共に実行される能力がある。
【0042】
クラウド・コンピューティングは、最低限の管理努力またはサービスの提供者との対話で迅速に提供および解放されることが可能な、構成可能なコンピューティング・リソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン(VM)、およびサービス)の共用プールへの、便利なオンデマンドのネットワーク・アクセスを可能にするためのサービス配信のモデルである。このクラウド・モデルは、少なくとも5つの特性、少なくとも3つのサービス・モデル、および少なくとも4つの展開モデルを含んでもよい。
【0043】
特性は、以下の通りである。
【0044】
オンデマンド・セルフ・サービス:クラウド利用者は、サービスの提供者との人間対話を必要とせずに、必要に応じてかつ自動的に、サーバ時間およびネットワーク・ストレージなどの、コンピューティング能力を一方的に提供することができる。
【0045】
ブロード・ネットワーク・アクセス:能力は、ネットワーク上で利用可能であり、シンまたはシック・クライアント・プラットフォーム(例えば、モバイル・フォン、ラップトップ、およびPDA)に、ヘテロジニアスによる使用を増進する標準メカニズムを通じてアクセスされる。
【0046】
リソース・プーリング:プロバイダのコンピューティング・リソースは、マルチ・テナント・モデルを使用して複数の利用者をサーブするためにプールされ、異なる物理および仮想リソースが、需要に応じて動的に割り当てられ、再割り当てされる。利用者が一般に、提供されたリソースの正確なロケーションに対する制御権も知識も有していないが、高レベルの抽象化(例えば、国、州、またはデータ・センタ)でロケーションを指定する能力があり得るという点で、位置独立の意味がある。
【0047】
迅速な弾力性:能力は、素早くスケール・アウトするために、迅速かつ弾力的に、および場合によっては自動的に提供され、素早くスケール・インするために迅速に解放されることが可能である。利用者にとって、提供するために利用可能な能力は、しばしば、無制限のように見え、任意の量でいつでも購入されることが可能である。
【0048】
測定されるサービス:クラウド・システムは、サービスのタイプ(例えば、ストレージ、処理、帯域幅、および、アクティブな利用者アカウント)に適切な、いくつかの抽象化レベルで計量能力を活用することによって、リソース使用を自動的に制御し、最適化する。リソース使用量は、モニタ、制御、およびレポートされることが可能であり、これにより、利用されるサービスの提供者と利用者双方に透明性をもたらす。
【0049】
サービス・モデルは、以下の通りである。
【0050】
サービスとしてのソフトウェア(SaaS):利用者に提供される能力は、クラウド・インフラストラクチャ上で動く提供者のアプリケーションを使用するための能力である。アプリケーションは、ウェブ・ブラウザ(例えば、ウェブ・ベースのeメール)などの、シン・クライアント・インターフェースを通じて様々なクライアント・デバイスからアクセス可能である。利用者は、限定的な利用者固有のアプリケーション構成設定についての可能な例外を除いて、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または、ことによると個々のアプリケーション能力を含む、基礎をなすクラウド・インフラストラクチャの管理も制御も行わない。
【0051】
サービスとしてのプラットフォーム(PaaS):利用者に提供される能力は、提供者によってサポートされるプログラミング言語およびツールを使用して作成された、利用者が作成または獲得したアプリケーションをクラウド・インフラストラクチャ上に展開するための能力である。利用者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含む、基礎をなすクラウド・インフラストラクチャの管理も制御も行わないが、展開されたアプリケーション、および場合によってはアプリケーション・ホスト環境構成に対する制御を行う。
【0052】
サービスとしてのインフラストラクチャ(IaaS):利用者に提供される能力は、処理、ストレージ、ネットワーク、および他の基本的なコンピューティング・リソースを提供するための能力であり、この場合、利用者は、オペレーティング・システムおよびアプリケーションを含むことができる任意のソフトウェアを展開し動かすことができる。利用者は、基礎をなすクラウド・インフラストラクチャの管理も制御も行わないが、オペレーティング・システム、ストレージ、展開されたアプリケーションに対する制御、および、場合によってはネットワーキング構成要素(例えば、ホスト・ファイアウォール)の選択についての限定的な制御を行う。
【0053】
展開モデルは、以下の通りである。
【0054】
プライベート・クラウド:クラウド・インフラストラクチャは、組織のためだけに運用される。クラウド・インフラストラクチャは、組織またはサード・パーティによって管理されてもよく、敷地内にあっても敷地外にあってもよい。
【0055】
コミュニティ・クラウド:クラウド・インフラストラクチャは、いくつかの組織によって共有され、懸念(例えば、ミッション、セキュリティ要件、ポリシ、およびコンプライアンス考慮)を共有してきた固有のコミュニティをサポートする。クラウド・インフラストラクチャは、組織またはサード・パーティによって管理されてもよく、敷地内にあっても敷地外にあってもよい。
【0056】
パブリック・クラウド:クラウド・インフラストラクチャは、一般大衆または大規模な業界団体が利用でき、クラウド・サービスを売る組織によって所有される。
【0057】
ハイブリッド・クラウド:クラウド・インフラストラクチャは、一意のエンティティのままであるが、データおよびアプリケーション可搬性を可能にする標準的または独自の技術(例えば、クラウド間の負荷分散のためのクラウド・バースティング)でまとめられた、2つ以上のクラウド(プライベート、コミュニティ、またはパブリック)の構成である。
【0058】
クラウド・コンピューティング環境は、無国籍、疎結合、モジュラリティ、および意味論的相互運用性に焦点を合わせたサービス指向のものである。クラウド・コンピューティングの中心には、相互接続されたノードのネットワークを備えるインフラストラクチャがある。
【0059】
図7をここで参照すると、例証的なクラウド・コンピューティング環境750が描写されている。図示のように、クラウド・コンピューティング環境750は、例えば、パーソナル・デジタル・アシスタント(PDA)またはセルラー電話754A、デスクトップ・コンピュータ754B、ラップトップ・コンピュータ754C、もしくは自動車コンピュータ・システム754N、またはそれらの組合せなど、クラウド利用者によって使用されるローカル・コンピューティング・デバイスが通信し得る、1つまたは複数のクラウド・コンピューティング・ノード710を備える。ノード710は、互いに通信してもよい。ノード710は、上記で説明されたような、プライベート、コミュニティ、パブリック、もしくはハイブリッド・クラウド、またはそれらの組合せなど、1つまたは複数のネットワークにおいて、物理的または仮想的にグループ化されてもよい(図示せず)。これは、クラウド利用者がローカル・コンピューティング・デバイス上でリソースを維持する必要がない、サービスとしてのインフラストラクチャ、プラットフォーム、もしくはソフトウェア、またはそれらの組合せを、クラウド・コンピューティング環境750が提供することを可能にする。図7に示されたコンピューティング・デバイス754A~Nのタイプは、例証のためのものにすぎず、コンピューティング・ノード710およびクラウド・コンピューティング環境750は、任意のタイプのネットワークもしくはネットワーク・アドレス可能接続またはその両方を介して(例えば、ウェブ・ブラウザを使用して)、任意のタイプのコンピュータ化デバイスと通信可能であることが理解されている。
【0060】
図8をここで参照すると、クラウド・コンピューティング環境750(図7)によって提供される機能抽象化層のセットが示されている。図8に示された構成要素、層、および機能は、例証のためのものにすぎず、実施形態はこれらに限定されないことを予め理解されたい。図示のように、以下の層および対応する機能が提供される。
【0061】
ハードウェアおよびソフトウェア層860は、ハードウェアおよびソフトウェア構成要素を含む。ハードウェア構成要素の例は、メインフレーム861、RISC(縮小命令セット・コンピュータ)アーキテクチャ・ベースのサーバ862、サーバ863、ブレード・サーバ864、ストレージ・デバイス865、ならびにネットワークおよびネットワーキング構成要素866を含む。いくつかの実施形態では、ソフトウェア構成要素は、ネットワーク・アプリケーション・サーバ・ソフトウェア867およびデータベース・ソフトウェア868を含む。
【0062】
仮想化層870は、仮想サーバ871、仮想ストレージ872、仮想プライベート・ネットワークを含む仮想ネットワーク873、仮想アプリケーションおよびオペレーティング・システム874、ならびに仮想クライアント875という、仮想エンティティの例が提供され得る抽象化層を提供する。
【0063】
一例では、管理層880は、下記で説明される機能を提供し得る。リソース提供881は、クラウド・コンピューティング環境内のタスクを実施するために利用されるコンピューティング・リソースおよび他のリソースの動的な調達を行う。計量および価格設定882は、クラウド・コンピューティング環境内でリソースが利用されるときのコスト追跡、および、これらのリソースの消費量に対する請求またはインボイスを行う。一例では、これらのリソースは、アプリケーション・ソフトウェア・ライセンスを含んでもよい。セキュリティは、クラウド利用者およびタスクの本人確認、ならびにデータおよび他のリソースの保護を提供する。ユーザ・ポータル883は、利用者およびシステム・アドミニストレータに、クラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理884は、要求されるサービス・レベルが満たされるように、クラウド・コンピューティング・リソースの配分および管理を行う。サービス・レベル・アグリーメント(SLA)計画およびフルフィルメント885は、SLAに応じて、将来の要件が予想されるクラウド・コンピューティング・リソースの事前配置および調達を行う。
【0064】
ワークロード層890は、クラウド・コンピューティング環境が利用され得る機能の例を提供する。この層から提供され得るワークロードおよび機能の例は、マッピングおよびナビゲーション891、ソフトウェア開発およびライフサイクル管理892、仮想クラスルーム教育配信893、データ分析処理894、トランザクション処理895、ならびに、コンピューティング・デバイスを使用して一変量または多変量時系列処理896の表現学習の三重項損失式のためのアンカー・ウィンドウを決定するためのもの(例えば、図1のプロセス100、図2のプロセス200、図3のプロセス300、図9のシステム900、図10のシステム1000、図11のシステム1100を参照)を含む。上述のように、図9に関して説明された前述の例のすべてが例証にすぎず、実施形態は、これらの例に限定されない。
【0065】
本開示は、クラウド・コンピューティングについての詳細な説明を含むが、本明細書で列挙される教示の実装形態は、クラウド・コンピューティング環境に限定されないことが繰り返して言われる。むしろ、実施形態は、現在知られているか、後で開発される、任意のタイプのクラスタ化されたコンピューティング環境で実行されてもよい。
【0066】
図9は、実施形態による、コンピューティング・デバイスを使用して、一変量または多変量時系列データ処理における特徴を認識するようにNNを訓練するための、システムのネットワーク・アーキテクチャ900である。図9に示されたように、第1のリモート・ネットワーク904および第2のリモート・ネットワーク906を含む、複数のリモート・ネットワーク902が提供される。ゲートウェイ901は、リモート・ネットワーク902とすぐ近くのネットワーク908との間で連結されてもよい。本ネットワーク・アーキテクチャ900の文脈では、ネットワーク904、906は、それぞれ、インターネット、公衆交換電話網(PSTN)、内線電話網などのLAN、WANを含むがこれらに限定されない、任意の形をしていてもよい。
【0067】
使用中、ゲートウェイ901は、リモート・ネットワーク902から、すぐ近くのネットワーク908への入口ポイントとして機能する。したがって、ゲートウェイ901は、ゲートウェイ901に到着したデータの所与のパケットを送る能力があるルータ、ならびに、ゲートウェイ901内および外の実際の経路を所与のパケットに与えるスイッチとして機能してもよい。
【0068】
ゲートウェイ901を介してリモート・ネットワーク902からアクセス可能な、すぐ近くのネットワーク908に連結された少なくとも1つのデータ・サーバ914がさらに含まれる。データ・サーバ914は、任意のタイプのコンピューティング・デバイス/グループウェアを含んでもよいことに留意されたい。複数のユーザ・デバイス916が、各データ・サーバ914に連結される。このようなユーザ・デバイス916は、デスクトップ・コンピュータ、ラップトップ・コンピュータ、ハンドヘルド・コンピュータ、プリンタ、もしくは他の任意のタイプのロジック内蔵デバイス、またはそれらの組合せを含んでもよい。ユーザ・デバイス916は、また、いくつかの実施形態では、ネットワークのいずれかに直接連結されてもよいことに留意されたい。
【0069】
例えば、ファクシミリ機、プリンタ、スキャナ、ハードディスク・ドライブ、ネットワーク化されたもしくはローカルなまたはその両方のストレージ・ユニットまたはシステムなどの周辺機器920または一連の周辺機器920は、ネットワーク904、906、908のうちの1つまたは複数に連結されてもよい。データベースもしくは追加の構成要素またはその両方は、ネットワーク904、906、908に連結された任意のタイプのネットワーク要素と共に利用されるか、これらに統合されてもよいことに留意されたい。本説明の文脈では、ネットワーク要素は、ネットワークの任意の構成要素を指してもよい。
【0070】
いくつかのアプローチによれば、本明細書で説明される方法およびシステムは、IBM(登録商標)z/OS環境をエミュレートするUNIX(登録商標)システム、MICROSOFT(登録商標)WINDOWS(登録商標)環境を仮想的にホストするUNIX(登録商標)システム、IBM(登録商標)z/OS環境をエミュレートするMICROSOFT(登録商標)WINDOWS(登録商標)システムなどの、1つまたは複数の他のシステムをエミュレートする仮想システムもしくはシステムまたはその両方と共に、またはこれらにおいて、またはその両方で、実行されてもよい。この仮想化もしくはエミュレーションまたはその両方は、いくつかの実施形態では、VMWARE(登録商標)ソフトウェアの使用を通じて実行されてもよい。
【0071】
図10は、一実施形態による、図9のユーザ・デバイス916もしくはサーバ914またはその両方に関連付けられた代表的なハードウェア・システム1000の環境を示す。一例では、ハードウェア構成は、マイクロプロセッサなどの中央処理ユニット1010、およびシステム・バス1012を介して相互接続されたいくつかの他のユニットを有するワークステーションを含む。図10に示されたワークステーションは、ランダム・アクセス・メモリ(RAM)1014、リード・オンリ・メモリ(ROM)1016、(ディスク・ストレージ・ユニット1020などの周辺機器デバイスをバス1012に接続するための)I/Oアダプタ1018、(キーボード1024、マウス1026、スピーカ1028、マイクロフォン1032、もしくは、タッチ・スクリーン、デジタル・カメラ(図示せず)などの他のユーザ・インターフェース・デバイス、またはそれらの組合せをバス1012に接続するための)ユーザ・インターフェース・アダプタ1022、(ワークステーションを通信ネットワーク1035(例えば、データ処理ネットワーク)に接続するための)通信アダプタ1034、および(バス1012を表示デバイス1038に接続するための)ディスプレイ・アダプタ1036を含んでもよい。
【0072】
一例では、ワークステーションは、その上に、MICROSOFT(登録商標)WINDOWS(登録商標)オペレーティング・システム(OS)、MAC OS(登録商標)、UNIX(登録商標)OSなどの、オペレーティング・システムを常駐させてもよい。一実施形態では、システム1000は、POSIX(登録商標)ベースのファイル・システムを採用する。また、他の例が、言及されたもの以外のプラットフォームおよびオペレーティング・システム上で実行されてもよいことが理解されよう。このような他の例は、オブジェクト指向プログラム方法と共に、JAVA(登録商標)、XML、C、もしくはC++言語、またはそれらの組合せ、または他のプログラミング言語を使用して書かれたオペレーティング・システムを含んでもよい。オブジェクト指向プログラミング(OOP)は、複雑なアプリケーションを開発するために、ますます使用されるようになってきており、同様に使用されてもよい。
【0073】
図11は、一実施形態による、コンピューティング・デバイスを使用して、一変量または多変量時系列データ処理における特徴を認識するようにNNを訓練するための、分散型システム1100を示すブロック図である。一実施形態では、システム1100は、クライアント・デバイス1110(例えば、モバイル・デバイス、スマート・デバイス、コンピューティング・システムなど)、クラウドまたはリソース共有環境1120(例えば、パブリック・クラウド・コンピューティング環境、プライベート・クラウド・コンピューティング環境、データ・センタなど)、およびサーバ1130を含む。一実施形態では、クライアント・デバイス1110は、クラウドまたはリソース共有環境1120を通じてサーバ1130からクラウド・サービスが提供される。
【0074】
1つまたは複数の実施形態は、統合の任意の可能な技術詳細レベルのシステム、方法、もしくはコンピュータ・プログラム製品、またはそれらの組合せでもよい。コンピュータ・プログラム製品は、本実施形態の態様をプロセッサに実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読ストレージ媒体(または複数の媒体)を含んでもよい。
【0075】
コンピュータ可読ストレージ媒体は、命令実行デバイスによる使用のための命令を保持および格納可能な有形デバイスであることが可能である。コンピュータ可読ストレージ媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁気ストレージ・デバイス、半導体ストレージ・デバイス、または前述の任意の適切な組合せでもよいがこれらに限定されない。コンピュータ可読ストレージ媒体のより具体的な例の完全に網羅されていないリストは、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、リード・オンリ・メモリ(ROM)、消去可能プログラマブル・リード・オンリ・メモリ(EPROMまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク・リード・オンリ・メモリ(CD-ROM)、デジタル・バーサタイル・ディスク(DVD)、メモリ・スティック、フロッピー(登録商標)ディスク、命令を記録したパンチ・カードまたは溝内隆起構造などの機械的にエンコードされたデバイス、および前述の任意の適切な組合せを含む。本明細書で使用されるようなコンピュータ可読ストレージ媒体は、電波もしくは他の自由に伝搬する電磁波、導波路もしくは他の伝送媒体を通じて伝搬する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、またはワイヤを通じて伝送される電気信号など、一時的な信号であると本質的に解釈されるべきではない。
【0076】
本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれの計算/処理デバイスに、あるいは、例えば、インターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、もしくはワイヤレス・ネットワーク、またはそれらの組合せといったネットワークを介して外部コンピュータまたは外部ストレージ・デバイスに、ダウンロードされることが可能である。ネットワークは、銅伝送ケーブル、光伝送ファイバ、ワイヤレス伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、もしくはエッジ・サーバ、またはそれらの組合せを備えてもよい。各計算/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、コンピュータ可読プログラム命令をネットワークから受け取り、それぞれの計算/処理デバイス内のコンピュータ可読ストレージ媒体に格納するためにコンピュータ可読プログラム命令を転送する。
【0077】
実施形態の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、インストラクション・セット・アーキテクチャ(ISA)命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路機器用の構成データ、または、Smalltalk(登録商標)、C++、もしくは同様のものなどのオブジェクト指向プログラミング言語、および「C」プログラミング言語もしくは類似のプログラミング言語などの手続き型プログラミング言語を含む1つもしくは複数のプログラミング言語の任意の組合せで書かれたソース・コードもしくはオブジェクト・コードでもよい。コンピュータ可読プログラム命令は、全面的にユーザのコンピュータ上で、もしくは部分的にユーザのコンピュータ上で、スタンド・アロンのソフトウェア・パッケージとして、または、部分的にユーザのコンピュータ上かつ部分的にリモート・コンピュータ上で、または全面的にリモート・コンピュータもしくはサーバ上で実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含む任意のタイプのネットワークを通じてユーザのコンピュータに接続されてもよく、または、接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを通じて)外部コンピュータに対して行われてもよい。いくつかの実施形態では、例えば、プログラム可能論理回路機器、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路機器は、本実施形態の態様を実施するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路機器を個別化にすることによって、コンピュータ可読プログラム命令を実行することができる。
【0078】
実施形態の態様は、方法、装置(システム)、およびコンピュータ・プログラム製品の流れ図もしくはブロック図またはその両方を参照しながら本明細書で説明される。流れ図もしくはブロック図またはその両方の各ブロック、および流れ図もしくはブロック図またはその両方におけるブロックの組合せは、コンピュータ可読プログラム命令によって実行可能であることが理解されよう。
【0079】
これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行する命令が、流れ図もしくはブロック図またはその両方の1つまたは複数のブロックで指定された機能/行為を実行するための手段を作り出すべく、コンピュータ、または機械を生み出すための他のプログラム可能データ処理装置のプロセッサに提供されてもよい。これらのコンピュータ可読プログラム命令は、また、流れ図もしくはブロック図またはその両方の1つまたは複数のブロックで指定された機能/行為の態様を実行する命令を含む製品を、命令を格納したコンピュータ可読ストレージ媒体が備えるべく、コンピュータ可読ストレージ媒体に格納されてもよく、特定の様式で機能するように、コンピュータ、プログラム可能データ処理装置、もしくは他のデバイス、またはそれらの組合せに指示することができる。
【0080】
コンピュータ可読プログラム命令は、また、コンピュータ、他のプログラム可能装置、または他のデバイス上で実行する命令が、流れ図もしくはブロック図またはその両方の1つまたは複数のブロックで指定された機能/行為を実行するべく、コンピュータ実行処理を生み出すために、コンピュータ、他のプログラム可能装置、または他のデバイス上で一連の動作ステップを実施させるように、コンピュータ、他のプログラム可能データ処理装置、または他のデバイスにロードされてもよい。
【0081】
図中の流れ図およびブロック図は、様々な実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実装形態のアーキテクチャ、機能、および動作を示す。この点に関して、流れ図またはブロック図における各ブロックは、指定の論理機能を実行するための1つまたは複数の実行可能命令を含む命令のモジュール、セグメント、または一部を表してもよい。いくつかの代替的な実装形態では、ブロックに記された機能は、図に記された順序とは無関係に行われてもよい。例えば、連続して示された2つのブロックは、実際には、同時に、実質的に同時に、部分的もしくは全面的に時間重複した様式で実行される、1つのステップとして遂行されてもよく、またはブロックは、時には、含まれる機能に応じて、逆の順序で実行されてもよい。ブロック図もしくは流れ図またはその両方の各ブロック、および、ブロック図もしくは流れ図またはその両方におけるブロックの組合せは、指定の機能もしくは行為を行うか、または、専用ハードウェアとコンピュータ命令の組合せを実行する専用ハードウェア・ベースのシステムによって実行可能であることも指摘される。
【0082】
特許請求の範囲における単数形の要素への言及は、そのように明示的に述べられない限り「1つおよび唯一」を意味するためのものではなく、むしろ「1つまたは複数」を意味する。当業者に現在知られているか、後で知られることになる、上述の例示的実施形態の要素に対するすべての構造的および機能的な同等物は、本特許請求の範囲によって包含されることが意図される。本明細書における請求要素は、要素が、「~のための手段」または「~のためのステップ」という句を使用して、明確に列挙されない限り、米国特許法第112条第6段落の規定に基づいて解釈されるべきではない。
【0083】
本明細書で使用される専門用語は、特定の実施形態を説明するためのものにすぎず、実施形態の限定であることを意図するものではない。本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が別途明らかに指示しない限り、複数形を同様に含むことを意図する。「備える(comprises)」もしくは「備える(comprising)」という用語またはその両方は、本明細書で使用されるとき、述べられた特徴、整数、ステップ、動作、要素、もしくは構成要素、またはそれらの組合せの存在を指定するが、1つまたは複数の他の特徴、整数、ステップ、動作、要素、構成要素、もしくはそのグループ、またはそれらの組合せの存在または追加を排除するものではないことがさらに理解されよう。
【0084】
下記の特許請求の範囲における機能要素に加えて、すべての手段またはステップの対応する構造、材料、行為、および同等物は、具体的に特許請求されるような、他の特許請求される要素と組み合わせて機能を実施するための任意の構造、材料、または行為を含むことを意図する。本実施形態の説明は、例証および説明のために提示されてきたが、網羅的であること、または開示の形の実施形態に限定されることを意図するものではない。実施形態の範囲から逸脱することなく、多くの変更形態および変形形態が当業者には明らかであろう。実施形態は、実施形態の原理および実践的応用を最も良く説明するように、および、意図される特定の使用に適するような、様々な修正を伴う様々な実施形態のための実施形態を他の当業者が理解できるように、選ばれ、説明された。
図1
図2
図3
図4A
図4B
図5A
図5B
図6
図7
図8
図9
図10
図11
【手続補正書】
【提出日】2023-08-10
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
コンピューティング・デバイスを使用して変量時系列データにおけるウィンドウ・サイズを決定する方法であって、
コンピューティング・デバイスによって、機械学習モデルに関連付けられた変量時系列データを受け取ることと、
前記コンピューティング・デバイスによって、前記変量時系列データの移動ウィンドウ・サイズおよび標準偏差をセットすることと、
前記コンピューティング・デバイスによって、前記変量時系列データの移動ウィンドウ平均を計算することと、
前記コンピューティング・デバイスによって、量時系列データを横断して標準偏差を計算することと、
前記コンピューティング・デバイスによって、計算された前記標準偏差を降順にソートすることと、
前記コンピューティング・デバイスによって、少なくとも1つのアンカーが前記標準偏差のインデックスを訪れるまで前記インデックスを反復することと、
前記コンピューティング・デバイスによって、前のアンカーが訪れた隣のアンカーをカバーするように各アンカーを反復して拡大することと、
前記コンピューティング・デバイスによって、前記拡大されたアンカーに基づいてウィンドウ・サイズを決定することと
を含む方法。
【請求項2】
前記変量時系列データが、一変量時系列データまたは多変量時系列データである、請求項1に記載の方法。
【請求項3】
前記ウィンドウ・サイズが、前記変量時系列データの表現機械学習の三重項損失式で実装される、請求項2に記載の方法。
【請求項4】
前記反復することが、
最大標準偏差および現在のウィンドウ・サイズを使用して次のウィンドウ・サイズの始まりおよび終わりをセットすること
をさらに含む、請求項2または3に記載の方法。
【請求項5】
前記コンピューティング・デバイスによって、前記始まりと終わりとの間の前記ウィンドウ・サイズ位置をマークすること
をさらに含む、請求項4に記載の方法。
【請求項6】
前記コンピューティング・デバイスによって、標準偏差が閾値を超過するその隣まで前記移動ウィンドウ・サイズを反復して拡大すること
をさらに含む、請求項2~5のいずれか1項に記載の方法。
【請求項7】
前記コンピューティング・デバイスによって、前記前のアンカーが訪れたことのない位置にある次の最大標準偏差を選択することと、
前記コンピューティング・デバイスによって、ウィンドウ・ベースの移動平均ベクトルにおける複数の位置を訪れると、処理を終わらせることと
をさらに含む、請求項2~6のいずれか1項に記載の方法。
【請求項8】
請求項1~7のいずれか1項に記載された方法を、コンピュータに対して実行させるためのコンピュータ・プログラム
【請求項9】
請求項8に記載のコンピュータ・プログラムを記録した、コンピュータ可読ストレージ媒体
【請求項10】
命令を格納するように構成されたメモリと、
プロセッサであって、
機械学習モデルに関連付けられた変量時系列データを受け取ることと、
前記変量時系列データの移動ウィンドウ・サイズおよび標準偏差をセットすることと、
前記変量時系列データの移動ウィンドウ平均を計算することと、
量時系列データを横断して標準偏差を計算することと、
計算された前記標準偏差を降順にソートすることと、
少なくとも1つのアンカーが前記標準偏差のインデックスを訪れるまで前記インデックスを反復することと、
前のアンカーが訪れた隣のアンカーをカバーするように各アンカーを反復して拡大することと、
前記拡大されたアンカーに基づいてウィンドウ・サイズを決定することと
を行うための前記命令を実行するように構成された、プロセッサと
を備える装置。
【国際調査報告】