特開2024-129032 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ キーサイト　テクノロジーズ，　インク．の特許一覧

特開2024-129032データ記録及び分析システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024129032

(43)【公開日】2024-09-26

(54)【発明の名称】データ記録及び分析システム

(51)【国際特許分類】

G06F 16/901 20190101AFI20240918BHJP

【ＦＩ】

G06F16/901

【審査請求】有

【請求項の数】17

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2024093064

(22)【出願日】2024-06-07

(62)【分割の表示】P 2019185614の分割

【原出願日】2019-10-09

(31)【優先権主張番号】16/373,443

(32)【優先日】2019-04-02

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】514046574

【氏名又は名称】キーサイトテクノロジーズ，インク．

(74)【代理人】

【識別番号】100099623

【弁理士】

【氏名又は名称】奥山尚一

(74)【代理人】

【識別番号】100125380

【弁理士】

【氏名又は名称】中村綾子

(74)【代理人】

【識別番号】100142996

【弁理士】

【氏名又は名称】森本聡二

(74)【代理人】

【識別番号】100166268

【弁理士】

【氏名又は名称】田中祐

(74)【代理人】

【識別番号】100180231

【弁理士】

【氏名又は名称】水島亜希子

(72)【発明者】

【氏名】後藤正治

(57)【要約】（修正有）

【課題】データストリームを記録し分析するシステム、データストリームを分析する方法及びコンピュータにデータストリームを分析する方法を実行させる命令を記憶するコンピュータ可読メモリを提供する。
【解決手段】システムは、データストリームを受け取る入力ポート、ディスクに圧縮データストリームを出力する出力ポート、ＦＩＦＯバッファ及びコントローラを備える。コントローラは、ＦＩＦＯバッファに記憶されたデータストリームの新たな抽出データセグメント（ＥＤＳ）と呼ばれるセグメントを識別する。新たなＥＤＳは、抽出プロトコルを満足させる。コントローラはまた、類似性プロトコルを使用して新たなＥＤＳを複数の参照データセグメント（ＲＤＳ）の各々と比較し、新たなＥＤＳが既存のＥＤＳに類似していない場合、新たなＲＤＳを生成し、類似している場合、ＲＤＳは、その新たなＥＤＳを識別する情報をＲＤＳデータベースに記憶する。
【選択図】図１

【特許請求の範囲】

【請求項1】

データストリームを記録し分析するシステムであって、
前記データストリームを受け取るように適合された入力ポートであって、該データスト
リームはデータ値の順序付けられたシーケンスを含む、入力ポートと、
前記データストリームを大容量記憶デバイスに通信するように適合された出力ポートと
、
前記データストリームが該システムによって受け取られる際に該データストリームの所
定部分を一時的に記憶するために、前記入力ポートに接続されたバッファと、
前記バッファに記憶された前記データストリームの、抽出プロトコルを満足させる新た
な抽出データセグメント（ＥＤＳ）と呼ばれるセグメントを識別し、第１の類似性プロト
コルを使用して前記新たなＥＤＳを複数の参照データセグメント（ＲＤＳ）の各々と比較
するコントローラであって、該コントローラは、前記第１の類似性プロトコルが、前記新
たなＥＤＳが前記ＲＤＳのうちの１つに類似していることを示す場合、該新たなＥＤＳを
識別する情報をＲＤＳデータベースに記憶し、該コントローラは、前記新たなＥＤＳが前
記ＲＤＳのうちのいずれとも類似していない場合、新たなＲＤＳを生成し、各ＲＤＳは、
そのＲＤＳと類似していることが分かった前記ＥＤＳと、該コントローラに前記新たなＲ
ＤＳを生成させた前記新たなＥＤＳとのリストを含む、コントローラと、
を備える、システム。

【請求項2】

前記第１の類似性プロトコルは、２つのデータセグメントの間の距離の尺度と類似性閾
値とを計算し、前記２つのデータセグメントは、前記距離が前記類似性閾値との所定関係
を有する場合、類似しているものとして定義される、請求項１に記載のシステム。

【請求項3】

前記コントローラは、既存のＲＤＳから、前記第１の類似性プロトコルより制限的であ
る第２の類似性プロトコルを使用して、そのＲＤＳに関連するＥＤＳを互いに比較するこ
とにより、複数の新たなＲＤＳを生成する、請求項２に記載のシステム。

【請求項4】

データ値の順序付けられたシーケンスを含むデータストリームを前記信号のクラスタに
対して分析するように、データ処理システムを動作させる方法であって、
前記データストリームを逐次受け取り、各データ値に、該データ値が受け取られる際に
インデックスを割り当てることと、
前記受け取られたデータストリームの一部をバッファに記憶することと、
前記バッファから、抽出プロトコルを満足させる新たなＥＤＳを抽出することと、
第１の類似性プロトコルを使用して、前記新たなＥＤＳを複数のＲＤＳの各々と比較す
ることであって、前記データ処理システムは、前記第１の類似性プロトコルが、前記新た
なＥＤＳが前記ＲＤＳのうちの１つに類似していることを示す場合、該新たなＥＤＳを識
別する情報をＲＤＳデータベースに記憶し、前記データ処理システムは、前記新たなＥＤ
Ｓが前記ＲＤＳのうちのいずれとも類似していない場合、新たなＲＤＳを生成することと
、
を含む、方法。

【請求項5】

前記抽出プロトコルは、前記新たなＥＤＳが開始する前記バッファにおけるデータ値と
、前記新たなＥＤＳが終了する前記バッファにおけるデータ値とを識別し、前記新たなＥ
ＤＳが終了する前記データ値は、前記新たなＥＤＳが開始した前記データ値からの一定数
のサンプル値である、請求項４に記載の方法又は請求項１に記載のシステム。

【請求項6】

前記データ処理システムは、２つのデータセグメントの間の距離の尺度と類似性閾値と
を計算し、前記距離が前記類似性閾値と所定関係を有する場合、前記２つのデータセグメ
ントは類似しているものとして定義され、前記データ処理システムは、前記第１の類似性
プロトコルより制限的ではない第２の類似性プロトコルによって判断される際に前記ＲＤ
Ｓが互いに類似している場合、ユーザ入力に応じて前記ＲＤＳのうちの２つを結合する、
請求項４に記載の方法又は請求項１に記載のシステム。

【請求項7】

前記データ処理システムは、２つのデータセグメントの間の距離の尺度と類似性閾値と
を計算し、前記距離が前記類似性閾値と所定関係を有する場合、前記２つのデータセグメ
ントは類似しているものとして定義され、前記データ処理システムは、前記第１の類似性
プロトコルより制限的である第２の類似性プロトコルを使用して、既存のＲＤＳから、そ
のＲＤＳに関連するＥＤＳを互いに比較することによって、複数の新たなＲＤＳを生成す
る、請求項４に記載の方法又は請求項１に記載のシステム。

【請求項8】

データ処理システムに、データ値の順序付けられたシーケンスを含むデータストリーム
を前記信号のクラスタに対して分析する方法を実行させる命令を含むコンピュータ可読メ
モリであって、前記方法は、
前記データストリームを逐次受け取り、各データ値に、該データ値が受け取られる際に
インデックスを割り当てることと、
前記受け取られたデータストリームの一部をメモリバッファに記憶することと、
前記バッファから、抽出プロトコルを満足させる新たなＥＤＳを抽出することと、
第１の類似性プロトコルを使用して、前記新たなＥＤＳを複数のＲＤＳの各々と比較す
ることであって、前記データ処理システムは、前記第１の類似性プロトコルが、前記新た
なＥＤＳが前記ＲＤＳのうちの１つに類似していることを示す場合、該新たなＥＤＳを識
別する情報をＲＤＳデータベースに記憶し、データ処理システムは、前記新たなＥＤＳが
前記ＲＤＳのうちのいずれとも類似していない場合、新たなＲＤＳを生成することと、
を含む、コンピュータ可読メモリ。

【請求項9】

前記データ処理システムは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前
記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成する、請
求項８に記載のコンピュータ可読メモリ、請求項１に記載のシステム、又は請求項４に記
載の方法。

【請求項10】

前記データ処理システムは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前
記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成し、前記
データ処理システムは、ＥＤＳの一部ではないデータ値の各シーケンスを、該シーケンス
におけるシンボルの数を示すカウントに置き換える、請求項８に記載のコンピュータ可読
メモリ、請求項１に記載のシステム、又は請求項４に記載の方法。

【発明の詳細な説明】

【背景技術】

【0001】

データ記録システムは、今では、大量のデータを記録することができ、その量が大きい
ため、記憶データを逐次読み出すことにより記録データを検索する時間が非常に長くなる
。テラバイトを超えるデータセットが日常的に記録される。従来のディスクドライブから
テラバイト分のデータを読み出す時間は、数時間である。このため、対象パターンを求め
て記録データを迅速に検索することは、難題を示す。

【発明の概要】

【0002】

本発明は、データストリームを記録し分析するシステムと、データストリームを分析す
る方法と、コンピュータにデータストリームを分析する方法を実行させる命令を記憶する
コンピュータ可読メモリとを含む。システムは、入力ポート、出力ポート、バッファ及び
コントローラを備える。入力ポートはデータストリームを受け取るように適合され、デー
タストリームはデータ値の順序付けられたシーケンスを含む。出力ポートは、データスト
リームを大容量記憶デバイスに通信するように適合されている。バッファは、データスト
リームがシステムによって受け取られる際にデータストリームの所定部分を一時的に記憶
するために、入力ポートに接続されている。コントローラは、バッファに記憶されたデー
タストリームの新たな抽出データセグメント（ＥＤＳ：extracted data segment）と呼ば
れるセグメントを識別し、新たなＥＤＳは抽出プロトコルを満足させる。コントローラは
、第１の類似性プロトコルを使用して新たなＥＤＳを複数の参照データセグメント（ＲＤ
Ｓ：reference data segments）の各々と比較し、コントローラは、第１の類似性プロト
コルが、新たなＥＤＳがＲＤＳのうちの１つに類似していることを示す場合、新たなＥＤ
Ｓを識別する情報をＲＤＳデータベースに記憶する。コントローラは、新たなＥＤＳがＲ
ＤＳのうちのいずれとも類似していない場合、新たなＲＤＳを生成する。各ＲＤＳは、そ
のＲＤＳと類似していることが分かったＥＤＳと、コントローラに新たなＲＤＳを生成さ
せた新たなＥＤＳとのリストを含む。

【0003】

１つの態様では、バッファはＦＩＦＯバッファを含む。

【0004】

別の態様では、抽出プロトコルは、新たなＥＤＳが開始するバッファにおけるデータ値
と、新たなＥＤＳが終了するバッファにおけるデータ値とを識別する。

【0005】

別の態様では、新たなＥＤＳが終了するデータ値は、新たなＥＤＳが開始したデータ値
からの一定数のサンプル値である。

【0006】

別の態様では、第１の類似性プロトコルは、２つのデータセグメントの間の距離の尺度
と類似性閾値とを計算し、距離が類似性閾値と所定関係を有する場合、２つのデータセグ
メントは類似しているものとして定義される。

【0007】

別の態様では、コントローラは、第１の類似性プロトコルより制限的ではない第２の類
似性プロトコルによって判断される際にＲＤＳが互いに類似している場合、ユーザ入力に
応じてＲＤＳのうちの２つを結合する。

【0008】

別の態様では、コントローラは、第１の類似性プロトコルより制限的である第２の類似
性プロトコルを使用して、既存のＲＤＳから、そのＲＤＳに関連するＥＤＳを互いに比較
することによって、複数の新たなＲＤＳを生成する。

【0009】

別の態様では、コントローラは、各ＥＤＳを、そのＥＤＳに類似していることが分かっ
たＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成する。

【0010】

別の態様では、コントローラは、ＥＤＳの一部ではないデータ値の各シーケンスを、そ
のシーケンスにおけるシンボルの数を示すカウントに置き換える。

【0011】

本発明はまた、データ値の順序付けられたシーケンスを含むデータストリームを信号の
クラスタに対して分析するようにデータ処理システムを動作させる方法も含む。本方法は
、データストリームを逐次受け取ることと、データ値が受けられる際に各データ値にイン
デックスを割り当てることとを含む。受け取られるデータストリームの一部は、バッファ
に記憶され、そのバッファから、抽出プロトコルを満足させる新たなＥＤＳが抽出される
。データ処理システムは、第１の類似性プロトコルを使用して新たなＥＤＳを複数のＲＤ
Ｓのうちの各々と比較し、データ処理システムは、第１の類似性プロトコルが、新たなＥ
ＤＳがＲＤＳのうちの１つに類似していることを示す場合、新たなＥＤＳを識別する情報
をＲＤＳデータベースに記憶し、新たなＥＤＳがＲＤＳのうちのいずれとも類似していな
い場合、新たなＲＤＳを生成する。

【0012】

【0013】

別の態様では、新たなＥＤＳが終了するデータ値は、新たなＥＤＳが開始したデータ値
からの一定数のサンプル値である。

【0014】

別の態様では、データ処理システムは、２つのデータセグメントの間の距離の尺度と類
似性閾値とを計算し、距離が類似性閾値と所定関係を有する場合、２つのデータセグメン
トは類似しているものとして定義される。

【0015】

別の態様では、データ処理システムは、第１の類似性プロトコルより制限的ではない第
２の類似性プロトコルによって判断される際にＲＤＳが互いに類似している場合、ユーザ
入力に応じてＲＤＳのうちの２つを結合する。

【0016】

別の態様では、データ処理システムは、既存のＲＤＳから、第１の類似性プロトコルよ
り制限的である第２の類似性プロトコルを使用して、そのＲＤＳに関連するＥＤＳを互い
に比較することにより、複数の新たなＲＤＳを生成する。

【0017】

別の態様では、データ処理システムは、各ＥＤＳを、そのＥＤＳに類似していることが
分かったＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成す
る。

【0018】

別の態様では、データ処理システムは、ＥＤＳの一部ではないデータ値の各シーケンス
を、そのシーケンスにおけるシンボルの数を示すカウントに置き換える。

【0019】

コンピュータ可読メモリは、データ処理システムに、データ値の順序付けられたシーケ
ンスを含むデータストリームを信号のクラスタに対して分析する方法を実行させる命令を
含む。上記方法は、データストリームを逐次受け取ることと、データ値が受けられる際に
各データ値にインデックスを割り当てることと、受け取られたデータストリームの一部を
メモリバッファに記憶することとを含む。そのバッファから、抽出プロトコルを満足させ
る新たなＥＤＳが抽出される。新たなＥＤＳは、第１の類似性プロトコルを使用して複数
のＲＤＳのうちの各々と比較され、データ処理システムは、第１の類似性プロトコルが、
新たなＥＤＳがＲＤＳのうちの１つに類似していることを示す場合、新たなＥＤＳを識別
する情報をＲＤＳデータベースに記憶し、新たなＥＤＳがＲＤＳのうちのいずれとも類似
していない場合、新たなＲＤＳを生成する。

【0020】

【0021】

別の態様では、データ処理システムは、ＥＤＳの一部ではないデータ値の各シーケンス
を、当該シーケンスにおけるシンボルの数を示すカウントに置き換える。

【図面の簡単な説明】

【0022】

【図1】本発明の１つの実施形態によるデータ記録装置を示す図である。

【図2】ＲＤＳからの距離の関数としての距離の分布の例示的なプロットを示す図である。

【発明を実施するための形態】

【0023】

本発明がその利点を提供する方法は、入来データチャネルにおける信号がデジタル化さ
れ、ディスクドライブ等のメモリデバイスに記憶されるデータロギングシステムに関連し
てより容易に理解することができる。データストリームは、「抽出アルゴリズム」によっ
て定義される対象信号と、以下の考察ではアイドル信号と呼ぶ、対象信号の間の信号とを
含むものとみなすことができる。

【0024】

概して、記録データのユーザは、データにおける様々な信号を理解し対象信号を検索す
ることができる必要がある。この考察の目的で、ユーザは、記録すべきデータストリーム
における全ての信号の詳細な知識は有していないと想定する。データストリーム信号の数
は、ユーザが一度に１つずつ検討するには多すぎるものと想定する。このため、ユーザは
、データストリーム全体を見ることなく信号の重要な特徴を完全に理解することができる
必要がある。この目的で、類似する信号のクラスタを定義することが有効である。こうし
たクラスタの代表的なメンバを検査することにより、ユーザは、記録される信号のより十
分な知識を取得し、対象信号を検索するために必要なパラメータを指定することができる
。

【0025】

本発明は、ユーザが、２つの信号の間の類似性に関連する類似度を計算する類似性アル
ゴリズムに基づいて、記録された信号の集まりにおいてクラスタを定義するのを可能にす
るツールを、ユーザに提供する。類似度に基づいてオブジェクトをクラスタリングするア
ルゴリズムは、本技術分野において既知である。不都合なことに、これらのアルゴリズム
の多くを適用する際に固有の計算作業負荷は、Ｎ２次以上である。数テラバイトの記録デ
ータストリームが数１００万を超える信号を有する可能性があるとすると、ユーザが信号
を探索する数分間で記録信号をクラスタリングすることは、多くの場合実際的ではない。

【0026】

後により詳細に説明するように、本発明は、記録プロセス中に対象信号の小クラスタを
検出する。そして、これらの小クラスタは、結合されて、入力データストリームにおける
信号のクラスタと一致するより大きいクラスタを提供する。クラスタは、クラスタリング
すべき信号の所定の記述を必要とすることなく構築される。理想的には、これらのクラス
タの各々は、入力ストリームに存在する基礎となる信号の単一クラスタのわずかな部分を
含む。各クラスタは、後述するように、入力ストリームにおける観測信号から開始する。
クラスタのサイズは、第２の信号が第１の信号と同じクラスタ内に含まれるべきか否かを
判断する閾値を含む類似性アルゴリズムによって求められる。クラスタが結合される、又
はクラスタがより小さいクラスタに分解される方法について、より詳細に後述する。

【0027】

本発明は、デジタル化データストリームを検査して、予めデータセグメントの詳細な知
識を必要とすることなく、対象となるデータストリーム内のデータのセグメントを検出す
る。データセグメントは、データストリームが大容量記憶デバイスに向かう途中にデータ
ロガーを通過する際、リアルタイムに識別される。データストリームは、主に、対象デー
タセグメントを含まない領域によって分離された個々の信号からなると想定する。抽出ア
ルゴリズムを満足させるデータストリームセグメントは、抽出データセグメント（ＥＤＳ
）と呼び、抽出アルゴリズムを満足させない信号を含むデータストリームセグメントをア
イドルデータセグメント（ＩＤＳ：idle data segments）と呼ぶ。

【0028】

理想的には、各ＥＤＳは、いかなる背景サンプルもなしに１つの対象信号に対応するデ
ータサンプルを含む。しかしながら、短期間でＥＤＳを識別する必要があることが、抽出
アルゴリズムを制約する。正確な対象信号セグメントを見つけるためには、定義された閾
値レベルを横切る立上りエッジ又は立下りエッジ等の容易に検出可能なイベントによって
信号の開始を検出し、信号の開始に対する一定数のサンプルであるように信号の終了を定
義することより、著しく長い時間が必要である。２つの信号が実際には同じであった場合
、２つの信号に対するＥＤＳは依然として一致する。このため、本発明の１つの態様では
、抽出アルゴリズムは、ＥＤＳの開始を定義するトリガ条件を指定し、ＥＤＳの終了は、
ＥＤＳの開始に対する一定数の入力サンプルであるように定義される。この近似が、最終
的なクラスタリングを干渉する場合、後述するように、長期記憶装置からＥＤＳを検索す
ることができ、信号のより正確な終了に基づくクラスタリングを利用することができる。

【0029】

ＥＤＳに遭遇すると、ＥＤＳは、更なる検査のためにバッファにコピーされ、データス
トリームにおけるＥＤＳの位置に関してＥＤＳを一意に識別するインデックス値が割り当
てられる。類似性アルゴリズムにより、ＥＤＳに対して「類似度（similarity measure）
」もまた定義される。類似度は、任意の２つの抽出データセグメントの間の類似性の程度
を反映する。類似度により、本開示のシステムは、抽出データセグメントを互いに類似す
るＥＤＳのクラスタにグループ化することができる。本発明の１つの態様では、類似性ア
ルゴリズムは閾値を含む。類似度が、閾値と所定関係を有する場合、２つのＥＤＳは、互
いに類似しているように定義される。例えば、類似度が閾値未満である場合、２つのＥＤ
Ｓは互いに類似しているように定義することができる。

【0030】

新たなＥＤＳが見つかると、システムは、ＥＤＳが既に見つけられているクラスタの一
部であるか否かを判断する。ＥＤＳが既存のクラスタの一部である場合、既存のクラスタ
は、新たなＥＤＳの追加を反映するように更新される。ＥＤＳが既存のクラスタのうちの
いずれにも十分に類似しない場合、新たなクラスタが定義され、そのクラスタにＥＤＳが
追加される。

【0031】

各クラスタは、参照データセグメント（ＲＤＳ）によって表される。抽出及びクラスタ
リングは、記録中にリアルタイムに実施され、そのため、ユーザは、新たに記憶されたデ
ータストリームからＥＤＳを回復する必要なしに、データストリームに存在するＥＤＳの
クラスタを見ることができる。データ記録及び初期クラスタリング中、データストリーム
において識別された新たなＥＤＳのみがメモリに保持される。クラスタリング動作を容易
にするために、ＲＤＳはシステムメモリに維持される。データストリームの記録が完了し
た後、クラスタリングされたＥＤＳを回復して更なる分類に使用することができる。

【0032】

ここで、本発明の１つの実施形態によるデータ記録装置を示す図１を参照する。アナロ
グ－デジタル変換器（ＡＤＣ）１１によって入来データストリームがデジタル化され、Ａ
ＤＣの出力はローカルＦＩＦＯバッファ１２に記憶される。ＦＩＦＯバッファ１２は、ロ
ーカルメモリ１６に実装することができることが留意されるべきである。クロック１３か
らの各クロックサイクルに対して、１つのサンプルがデジタル化される。コントローラ１
５が、各クロックサイクルにおいてインクリメントされる内部レジスタを維持し、ＦＩＦ
Ｏバッファ１２に転送されたばかりのデータサンプルで開始するデータセグメントを識別
するための一意のインデックスを提供する。新たなデータエントリは、ＦＩＦＯバッファ
１２に転送され、クロック１３の各サイクルにおいて、ＦＩＦＯバッファ１２における最
も古いエントリが読み出される。各クロックサイクルにおいて、コントローラ１５は、対
象データセグメントが開始したか又はその時点で完了しているかを判断する。コントロー
ラ１５は、対象データセグメントの開始を検出するハードウェアを含むことができ、又は
、コントローラ１５は、ＦＩＦＯバッファ１２の内容を検査して、対象データセグメント
が開始したか又はその時点で完了しているかを判断することができる。オシロスコープの
技術分野においてハードウェアトリガが使用され、それは、当業者には既知である。この
時点で、対象データシーケンスがＦＩＦＯバッファ１２内にある場合、コントローラ１５
は、そのデータシーケンスをＦＩＦＯバッファから新たなＥＤＳバッファ１７にコピーし
、データストリームにおける新たなＥＤＳの位置を確認し、その情報をＥＤＳデータベー
ス１９に入力する。

【0033】

ディスク１４からのＥＤＳの検索を容易にするために、ディスクデータベース２２が、
ディスク１４上のレコードの間の対応関係と、各ＥＤＳの開始に割り当てられたインデッ
クスとを記録する。概して、ディスク１４は、ランダムにアクセスすることができる複数
のディスクレコードとして編成される。コントローラ１５が、ディスク１４に記憶される
ＥＤＳを回復する必要がある場合、ディスクデータベース２２を使用して、ＥＤＳに関連
するインデックスが開始するディスクレコード番号が求められる。

【0034】

対象データシーケンスが先行するサンプルで開始したばかりである場合、コントローラ
１５は、データシーケンスがＥＤＳデータベースで開始したサンプルインデックスを記録
する。

【0035】

上述したように、抽出すべきデータセグメントを定義する所定の抽出アルゴリズムがな
ければならない。概して、抽出アルゴリズムは、抽出データセグメントとなるべきデータ
シーケンスの開始及び終了を定義する。抽出アルゴリズムを実行するコントローラは、デ
ータシーケンスがＦＩＦＯバッファ１２から出る前に識別を行うことができなければなら
ない。抽出アルゴリズムは、リアルタイムに動作しなければならない。オシロスコープへ
の入力における対象シーケンスの開始を識別するリアルタイムトリガアルゴリズムが本技
術分野において既知である。トリガアルゴリズムは、立上りエッジのように単純な特徴、
又は特定の信号のように複雑な特徴を識別する。本開示のシステムでは、対象データシー
ケンスの正確な性質は予め既知ではないため、抽出アルゴリズムは、好ましくは広範囲の
信号を選択し、そのため、大きい分類の信号を識別するリアルタイムトリガアルゴリズム
が好ましい。抽出データセグメントとなるべきデータシーケンスの開始は、リアルタイム
トリガを引き起こしたサンプルにおいて発生する必要はないことに留意されたい。例えば
、抽出データセグメントは、リアルタイムトリガによって識別されるサンプルの所定数前
のサンプルで開始することができる。

【0036】

抽出アルゴリズムはまた、対象データシーケンスの終了も指定しなければならない。１
つの例示的な実施形態では、抽出アルゴリズムは、トリガとＦＩＦＯバッファ１２におけ
る窓とを指定する。この例では、抽出データセグメントは窓の最後で終了し、対象信号が
窓における最後のデータ値より前に終了する可能性があっても、指定された窓内のサンプ
ルの全てがＥＤＳの一部である。

【0037】

別の例示的な実施形態では、抽出アルゴリズムは、抽出すべきデータシーケンスの終了
を通知するトリガを指定する。例えば、抽出アルゴリズムは、何らかの閾値未満の値で終
了し何らかの指定された数のサンプルに対してその値以下であり続ける立下りエッジを構
成するデータ値が、対象データセグメントの終了を通知することを必要とすることができ
る。したがって、ＥＤＳデータベースはまた、ＥＤＳの長さ、又はＥＤＳにおける最後の
データサンプルのインデックス等の等価な情報も含む。

【0038】

本発明の１つの態様では、ＥＤＳの終了を指定する情報もまた、ＥＤＳデータベース１
９内に含まれる。

【0039】

新たなＥＤＳが抽出されると、そのＥＤＳは、動的に生成された参照ライブラリ内の各
ＲＤＳと比較される。ＲＤＳライブラリは、ライブラリ内の各ＲＤＳに関する情報を記憶
するＲＤＳデータベース１８を含む。新たなＥＤＳがＲＤＳのうちの１つに十分に類似す
る場合、その関連を示すようにＥＤＳデータベースにおける新たなＥＤＳエントリが更新
され、ＲＤＳデータベースは、そのＲＤＳに関連するクラスタの一部であるものとして新
たなＥＤＳの識別を示すように更新される。新たなＥＤＳがＲＤＳのうちの１つに十分に
類似せず、新たなＥＤＳをＲＤＳデータベース内のＲＤＳの全てと比較した後に十分な処
理時間が残っている場合、ＲＤＳとして新たなＥＤＳを使用し、ＲＤＳデータベースに関
連データを入力して、新たなＲＤＳが開始される。十分な処理時間が利用可能でない場合
、ＥＤＳデータベースにおける新たなＥＤＳエントリは、割り当てられなかったものとし
てマーキングされる。例えば、ＲＤＳの全てが考慮される前に、ＥＤＳのＲＤＳへの照合
中に新たなＥＤＳが発見される可能性があり、そのため、コントローラ１５は、この新た
なＥＤＳのために新たなＥＤＳバッファを使用しなければならない。

【0040】

データストリームの処理の開始時、コントローラ１５は、２つのデータセグメントの間
の類似性を測定する類似性測定アルゴリズムを受け取る。本発明の１つの態様では、類似
性アルゴリズムは、２つのデータセグメントが類似しているか否かを判断する際に閾値と
比較される類似度を生成する。このアルゴリズムは、コントローラ１５によって、ＥＤＳ
とＲＤＳライブラリ内のＲＤＳとの類似性を測定するために使用される。類似性アルゴリ
ズムは、４つのタイプのアルゴリズムを考慮することによってより容易に理解することが
できる。最初の３つのタイプのアルゴリズムは、データ値自体に対して動作する。第４の
タイプのアルゴリズムは、各データシーケンスから導出される「シグネチャ」に対して動
作する。

【0041】

第１のタイプの類似性アルゴリズムは、データセグメントを直接比較してそれらの類似
性を求める。最も単純な場合では、２つのデータセグメントは同じ長さを有し、類似性関
数は、成分がデータ値である２つのベクトルの間の距離を測定する。例えば、ＥＤＳが、
ｉ＝１～Ｎに対してサンプル値ｐ（ｉ）を有し、ＲＤＳがｉ＝１～Ｎに対してサンプル値
ｑ（ｉ）を有する場合、ユークリッド距離

【数1】

は、２つのデータセグメントの類似性の程度の尺度である。Ｄ（ｐ，ｑ）が閾値Ｔ未満で
ある場合、２つのセグメントは互いに類似していると定義され、ここで、Ｔは所定の閾値
である。この目的でユークリッド距離の代わりに使用することができる多くの距離関数が
ある。より詳細に後述するように、いくつかの応用では、関数を計算する際の計算作業負
荷がより小さいため、特定の距離関数が好ましいものとなる。

【0042】

第２のタイプの類似性関数は、データセグメントの間の距離を測定する前にデータセグ
メントを標準化する。いくつかの応用では、データセグメントの形状は、データセグメン
トの正確な一致より重要である。例えば、データセグメントは、振幅が異なるが同じ形状
を有する２つの信号を表す場合がある。すなわち、ｐ（ｉ）＝Ｋｑ（ｉ）である。ユーザ
の目的が、信号の振幅とは無関係に同じ形状を有する信号を探すことである場合、各デー
タセグメントは、最初に、セグメントの間の距離を計算する前に平均振幅によって決まる
定数によって分割される。１つの例では、定数は、データセグメントの最大値である。別
の例では、定数は、データセグメントにおけるデータ値の絶対値の平均値である。

【0043】

第３のタイプの類似性関数は、相対的に小さいデータセグメントと相対的に大きいデー
タセグメントとの一致を探す。これは、ユーザが、何らかの相対的に小さいシーケンスを
含むデータセグメントを見つけたい場合に有用である。この状況は、データセグメントが
異なる長さである場合に発生する。基本的に、ユーザは、相対的に小さいデータシーケン
スに類似するシーケンスを含む相対的に大きいデータシーケンスを探すことを望む。１つ
の例では、相対的に小さいデータセグメントと相対的に大きいデータセグメントの対応す
る部分との間の距離が測定される。相対的に小さいデータセグメントが、ｉ＝１～ｍに対
してｐ（ｉ）であり、相対的に大きいデータセグメントがｉ＝１～Ｎに対してｑ（ｉ）で
ある場合、ｋ＝０～（Ｎ－ｍ－１）に対して、距離関数

【数2】

を定義することができる。Ｄは、ｋの様々な値に対して求められ、Ｄの最小値は、閾値と
比較すべき距離として選択される。上述したようにｐ及びｑの値を標準化することができ
る場合、この手続きを適用することができることが留意されるべきである。処理時間を短
縮するために、ｋは小さい範囲に制限することができる。ユーザに、開始時に２つのデー
タシーケンスが位置合わせされていると考える理由がある場合、ｋはゼロに制限すること
ができる。

【0044】

上記類似性関数は、比較されているデータセグメントに直接作用する。このタイプの類
似性関数は、クラスタリング分析における専門家ではない人が直観的に理解できる。しか
しながら、ＥＤＳを分類するときに類似度を計算する作業負荷は、ＥＤＳが大きい場合、
大きい可能性がある。さらに、ユーザがＥＤＳを分類するために使用したい類似性のタイ
プに応じて、第４のクラスの類似性関数が好ましい場合がある。

【0045】

第４のクラスの類似性分析では、各データセグメントからシグネチャベクトルが導出さ
れる。そして、シグネチャベクトルの間の距離を使用して、上述したものと類似する方法
で類似性を測定することができる。このタイプの類似性測定では、ＥＤＳの全てに対する
シグネチャベクトルは、データセグメントの長さが異なる場合であっても、同じ成分を有
する。概して、シグネチャベクトルにおける成分の数は、ＥＤＳにおけるデータ値の数よ
りはるかに小さく、このため、距離測定を実施する計算作業負荷は著しく低減するが、こ
の節約は、対応するデータセグメントからシグネチャベクトルの成分を導出する計算作業
負荷によって相殺される。概して、シグネチャベクトルの成分は、そのデータセグメント
を他のデータセグメントから識別する可能性が高いデータセグメントの任意の関数とする
ことができる。抽出アルゴリズムが異なる長さのデータセグメントを生成する場合、シグ
ネチャベクトルの１つの成分は、データセグメントの長さとすることができる。他の成分
は、データセグメントに適用される有限インパルス応答フィルタから導出することができ
る。例えば、データセグメントの周波数成分の振幅を表す成分を使用することができる。

【0046】

ＥＤＳを識別し、見つかった各新たなＥＤＳを考慮するようにＲＤＳライブラリを更新
するプロセスは、好ましくはリアルタイムで実行される。本開示の目的で、プロセスが、
本発明によりデータストリームがデータロガーに入る速度を低下させることなく完了する
ことができる場合、プロセスはリアルタイムで実行されると言う。処理のデータ抽出部分
の場合において、入力データストリームは、ＦＩＦＯを通った後、ディスク記憶装置に出
て行き、したがって、抽出処理、すなわち新たなＥＤＳの識別により、コントローラは、
抽出アルゴリズムを満足させるデータセグメントを識別し、そのデータセグメントをメモ
リ内のバッファに、そのデータセグメントの一部がＦＩＦＯバッファから出る前に、移動
させることができなければならない。

【0047】

予備的分類を完了しＲＤＳライブラリを更新する時間は、メモリの量と利用可能な並列
処理の程度とによって決まる。１つの態様では、新たなＥＤＳは、メモリ内のＥＤＳバッ
ファ１７に移動し、ライブラリ内のＲＤＳと比較される。ＲＤＳに対して新たなＥＤＳを
検査するために必要な時間は、比較中にメモリ内にＲＤＳを維持することによって改善す
ることができる。

【0048】

さらに、一致を見つける時間は、既存のＲＤＳへの一致を見つける尤度を反映する順序
で照合を実施することによって改善することができる。ＲＤＳデータベースは、そのＲＤ
Ｓに対して既に見つかったＥＤＳ一致のカウントを含む。それらのカウントは、対応する
ＲＤＳが次のＥＤＳと一致する尤度の尺度である。このため、各ＲＤＳに関連するカウン
トの順序で照合を実施することは、一致（存在する場合）を見つける速度を向上させる。

【0049】

経時的に尤度が変化する場合、経時的に減衰する別個の尤度変数を利用することができ
る。ＲＤＳにＥＤＳが割り当てられる度に、そのＲＤＳに対する尤度カウントは１だけイ
ンクリメントされる。周期的に、尤度カウントは、カウントに１未満である減衰因子を掛
けることによって減少する。一致の探索は、尤度カウントによって定義される順序で実行
される。

【0050】

最後に、並列処理により照合プロセス時間を短縮することができることが留意されるべ
きである。ＲＤＳのうちの１つへの新たなＥＤＳの照合は、ＲＤＳのうちの別のものへの
ＥＤＳの照合と並列に進むことができる。このため、約Ｍ分の１、照合時間を短縮するこ
とができ、ここで、Ｍは利用可能な並列プロセッサの数である。距離計算はまた、高性能
グラフィックディスプレイカードのグラフィカルプロセッサコアでも実施することができ
、このため、並列処理による速度の向上は、１０００分の１を超えることができる。

【0051】

照合プロセスにおいて、コントローラは、ＥＤＳを見つけて抽出するために必要な平均
時間で平均して１つのＥＤＳを処理すればよいこともまた留意されるべきである。処理を
待っている新たなＥＤＳを記憶するために十分なバッファがある場合、システムは、一致
を見つけるための最長時間ではなく、一致を見つけるための平均時間で１つのＥＤＳを処
理すればよい。

【0052】

依然として、ＲＤＳライブラリ内のＲＤＳに対するＥＤＳの照合は、一致を待っている
新たなＥＤＳを保持するバッファ容量を超える前に完了し損なう可能性がある。この場合
、照合されなかったＥＤＳに対するＥＤＳデータベースエントリは、一致が見つからなか
ったものとしてマーキングされ、処理は、照合されるのを待っている次のＥＤＳに進み、
したがって、照合されなかったＥＤＳを保持していたバッファを新たなＥＤＳによって使
用されるために空ける。照合されなかったＥＤＳは、記録期間の最後に、又は、記録期間
の後続する部分の間に新たなＥＤＳの発見が低速であるためにバッファ空間が利用可能と
なると、処理することができる。

【0053】

システムの１つの態様では、データ記録動作の開始時、参照データベースは空である。
新たな抽出データセグメントに遭遇すると、新たな抽出データセグメントのうちのいくつ
かは参照データセグメントになる。例えば、第１の抽出データセグメントは、参照データ
セグメントになる。第２の新たな抽出データセグメントは、新たな参照データセグメント
となることができ、又は、単に、先行して生成された参照データセグメントによって表さ
れるクラスタの一部としてラベル付けすることができる。

【0054】

本発明の別の態様では、ユーザは、比較に使用するべき１つ以上の参照データセグメン
トを入力することができる。参照セグメントは、ユーザによって生成される、又はデータ
ロギング装置の製造業者によって提供される、本発明に類似する装置によって分析された
別のデータストリームにおいて、見つけられている場合がある。

【0055】

本発明の１つの態様では、記録及び初期処理中にメモリに保持されるＲＤＳデータベー
ス及び関連ＲＤＳは、ユーザがロギングされているデータストリームを理解するのに役立
つように、記録中にユーザが見ることができる。１つの実施形態では、ユーザにはＲＤＳ
のリストが提示され、そのＲＤＳのリストは、そのＲＤＳと類似することが分かったＥＤ
Ｓの数のカウントによって順序付けられている。そして、ユーザは、表示するために１つ
以上のＲＤＳを選択することができる。

【0056】

上述したように、ＲＤＳデータベースは、各ＲＤＳに対して、特に、そのＲＤＳに類似
することが分かった各ＥＤＳの識別を列挙するエントリを含む。１つの態様では、識別は
、そのＥＤＳが見つかったデータストリームにおけるインデックスである。ここでＥＤＳ
が列挙されるのは、そのＥＤＳとＲＤＳとの間の類似性の尺度が何らかの所定の閾値条件
を満たしたためである。例えば、ＥＤＳとＲＤＳとの間の距離は、何らかの閾値未満であ
った。閾値条件が緩すぎる場合、大量のＥＤＳがＲＤＳに関連付けられる。より重要なこ
とには、単一のＲＤＳが、入力データストリームにおける信号の２つ以上の異なるクラス
タからの信号を含む可能性がある。後により詳細に説明するように、こうしたＲＤＳは回
避されるべきである。

【0057】

閾値条件が厳しすぎる場合、更に多くのＲＤＳがあることになり、各ＲＤＳによって定
義されるクラスタのサイズはより小さくなる。原則的に、記録後プロセス中に、相対的に
小さいＲＤＳクラスタを結合してより大きいクラスタを提供することができる。しかしな
がら、データ収集中に大量の小さいＲＤＳクラスタがあることにより、新たなＥＤＳをＲ
ＤＳクラスタに照合させることに関連する計算作業負荷が実質的に増大する。したがって
、閾値条件とＲＤＳクラスタの特異性との間にトレードオフがある。

【0058】

本発明の１つの態様では、各ＲＤＳに対するＲＤＳデータベースエントリはまた、その
ＲＤＳに関連する各ＥＤＳに対する実際の類似性の尺度も含む。これらの尺度のヒストグ
ラムは、任意選択的に、記録プロセス中及び記録後処理中にコントローラにより、ユーザ
の要求があるとユーザに提供される。ヒストグラムを見ることにより、特に、大量のＥＤ
ＳがＲＤＳに関連付けられる場合、ユーザは、クラスタの構造に関して洞察を得ることが
できる。例えば、ヒストグラムが複数のピークを明らかにした場合、クラスタは、入力デ
ータストリームにおける信号の複数のクラスタからのＥＤＳを含む可能性があり、そのた
め、後述するように、ＲＤＳが複数の新たなＲＤＳに拡張されることを必要とする可能性
がある。

【0059】

記録段階の最後に、本発明は、２つのデータベースを生成していることになる。第１の
データベースは、抽出アルゴリズムを満足させたデータセグメントの全てを識別する。こ
のデータベースは、記録データストリームにおける各ＥＤＳ、及びそのＥＤＳに類似する
ＲＤＳの全ての位置を含む。このデータベースを使用して、コントローラは、任意のＲＤ
Ｓに関連する任意のＥＤＳにアクセスすることができる。第２のデータベースは、記録プ
ロセス中に生成されたＲＤＳの全てを識別する。ＲＤＳデータベースにおける情報は、所
与のＲＤＳに関連するＥＤＳの全てと、記録データストリームにおいてＲＤＳを開始した
ＥＤＳの位置と、上述したようなＲＤＳに関する他の情報とを識別する。

【0060】

場合によっては、ＩＤＳのうちの１つ以上を検査することが有用である可能性がある。
例えば、抽出アルゴリズムがトリガ位置に対して固定窓を定義する場合、その窓は、トリ
ガに関連する信号の全てを取り込むためには小さ過ぎる可能性がある。ＥＤＳの後のアイ
ドルデータセグメントは、切り捨てられたＥＤＳの欠損部分を提供することができる。Ｅ
ＤＳの後のＩＤＳのディスク上のインデックスは、そのＥＤＳの最後のインデックスから
計算することができる。

【0061】

上述したように、比較の全てを行うために利用可能な時間が十分ではなかったために、
ＲＤＳライブラリに関して分類に失敗したＥＤＳがある可能性がある。ＥＤＳデータベー
スは、任意のこうしたＥＤＳにタグ付けする。記録後処理において、これらの失敗したＥ
ＤＳを再検討することができる。こうしたＥＤＳ各々の位置は、ＥＤＳデータベースに記
録される。そのＥＤＳは、記録データストリームから、データストリームにおけるその位
置が既知であるため検索することができる。さらに、記録データストリームがディスクド
ライブ又は同様のランダムアクセス記憶デバイス上にある場合、そのＥＤＳに達するため
に、記録データストリーム全体を再生する必要はない。このため、ＥＤＳを検索して現Ｒ
ＤＳライブラリに対して比較することができる。この時点で、類似性アルゴリズムを使用
して、ＲＤＳのうちの１つ以上にＥＤＳを関連付けることができ、又は十分に類似するＲ
ＤＳが見つからない場合、そのＥＤＳに対して新たなＲＤＳを定義することができる。

【0062】

本明細書に記載するデータロギングプロセスの目的のうちの１つは、互いに類似する信
号を登録し、そのため、ユーザが記録データにおける様々な信号タイプを理解するのを可
能にすることである。各ＲＤＳはＥＤＳのクラスタを表すが、ＲＤＳの集まりは、必ずし
も、ユーザが基礎となるＥＤＳのセットのクラスタリングを完全に理解するのを可能にす
るとは限らない。例えば、基礎となるＥＤＳのセットにあるクラスタよりはるかに大量の
ＲＤＳがある可能性がある。本発明は、基礎となる信号のクラスタリングに対する洞察を
提供する２つのツールを提供する。

【0063】

第１のツールは、同じ基礎となる信号クラスタの一部であるＲＤＳのグループを見つけ
るようにＲＤＳに対して作用する。ＲＤＳデータベースにおける各ＲＤＳエントリは、Ｅ
ＤＳの小さいグループを代表するＥＤＳを含む。このため、ＲＤＳのうちの選択されたも
のをクラスタリングすることにより、ユーザは、類似するＥＤＳのより大きいクラスタを
構築することができる。ＲＤＳの数がＥＤＳの数より実質的に少ないため、ＲＤＳのクラ
スタリングは、実質的により小さい計算作業負荷で実施することができる。以下の考察に
おいて術語を簡略化するために、ＲＤＳのクラスタをグループと呼ぶことにする。

【0064】

ＲＤＳをクラスタリングする目的は、単純な一例を参照してより容易に理解することが
できる。入力データストリームにおける信号のクラスタの中心にある又はその近くにある
ＲＤＳを考慮する。類似性アルゴリズムは、２つのデータセグメントの間の距離を測定す
るものと想定する。特に、そのＲＤＳの基礎を形成するＥＤＳから、ＥＤＳライブラリに
おける他のＥＤＳの各々までの距離を考慮する。図２に、ＲＤＳからの距離の関数として
のこうした距離の分布の例示的なプロットを示す。図２に示す例では、Ｔ１に、このＲＤ
Ｓに対応するＥＤＳを定義するために使用されたカットオフ距離を示し、ＲＤＳは、入力
信号の第１のクラスタ３１に対応するＥＤＳのみを含む。理想的には、結果として得られ
るグループがＴ３に示すような有効なカットオフ距離を有するように、このＲＤＳは他の
ＲＤＳと結合されるべきである。

【0065】

上述したように、Ｔ２に示すように元のカットオフ距離が大きすぎる場合、ＲＤＳは、
入力信号における第２のクラスタ３２に対応するＥＤＳを含む。こうしたＲＤＳが別のＲ
ＤＳと結合された場合、結果として得られるＲＤＳもまた、入力信号における２つのクラ
スタに属するＥＤＳを含み、そのため、結果として得られるグループは、入力信号におけ
る１つのクラスタに制限されない。上述したように、図２に示すもののような周波数分布
は、大きすぎるＲＤＳを識別する際に有用である可能性がある。

【0066】

ＲＤＳは、ＥＤＳからＲＤＳを生成するために使用された方法に類似する方法でグルー
プ化される。グループを形成する際、類似性関係及び閾値は、上述した方法に類似する方
法で定義される。これらの定義は、ユーザにより、ユーザインタフェース２１又はシステ
ム自体を介して提供することができる。最も単純な場合では、ＲＤＳを生成するために使
用されたものと同じ類似性関係を使用して、類似性閾値を、候補ＲＤＳをグループに入れ
る際にそれほど選択的でないように変更することにより、グループを生成する。しかしな
がら、異なる類似性関係を利用することができる。

【0067】

最初に、グループはなく、このため、第１のグループは、試験される第１のＲＤＳから
なる。本発明の１つの態様では、この第１のグループを開始するために、最多のＥＤＳを
有するＲＤＳが選択される。この態様は、ＥＤＳにおける基礎となるクラスタがＲＤＳの
うちの１つ又はその近くに中心を置くモデルに基づく。このため、最高カウントを有する
ＲＤＳが、こうしたクラスタの中心又はその近くに位置する可能性が高い。グループは、
２つのＲＤＳに対する類似度がそれら２つのＲＤＳが類似性条件を満たすことを示す場合
、未だグループに割り当てられていない残りのＲＤＳをそのグループに対して検査するこ
とにより、埋められる。そして、グループに未だ割り当てられていない最大カウントを有
するＲＤＳにより、プロセスは繰り返される。それ以上未割当ＲＤＳがない場合、プロセ
スは完了する。

【0068】

ユーザは、データ処理システムに与えられる適切なコマンドに応じて、各グループにお
けるＲＤＳに対応するデータセグメントを見ることができる。この表示は、各ＲＤＳの中
心として定義されるＥＤＳに、又はグループに関連するＥＤＳの全てに制限することがで
きる。これらの表示により、ユーザは、類似性関係を使用してグループ化された信号が、
実際に、ユーザに類似するように見えるか否かを判断することができる。最後に、ユーザ
は、グループ化プロセスが極端に実行されたか否かを判断するのに役立つように、図２に
示すもののような周波数分布を見ることができる。

【0069】

グループの数が依然として多すぎる場合、同じ類似性アルゴリズムを使用するが、類似
性を見つけるためにそれほど厳密ではないように選択された異なる閾値を用いて、プロセ
スを繰り返すことができる。さらに、異なる類似性アルゴリズムを使用してプロセスを繰
り返すことができる。類似性アルゴリズムに対する制限は、任意の２つのＥＤＳに対して
動作することができなければならないということのみである。例えば、異なる長さのＥＤ
Ｓに対して動作する類似性アルゴリズムは、２つのＥＤＳの長さが実質的に同じでない場
合に２つのＥＤＳが非類似となるように類似度を設定することにより、構築することがで
きる。２つのＥＤＳの長さが実質的に同じである場合、距離関数が計算され、閾値と比較
されて、２つのＥＤＳが類似しているか否かが判断される。別の例では、類似性アルゴリ
ズムは、最初に、比較すべきＥＤＳの各々に対するシグネチャを導出し、その後、シグネ
チャの間の距離を測定して２つのＥＤＳが類似しているか否かを判断することができる。

【0070】

上記説明は、ＲＤＳを再クラスタリングする特定のタイプのクラスタリングアルゴリズ
ムを想定する。しかしながら、第１のツールを用いて他のクラスタリング技法を利用する
ことができる。

【0071】

上述したように、ＲＤＳのうちの１つを生成するために使用された類似性基準が緩すぎ
る場合、そのＲＤＳは、非常に多数のＥＤＳを含む可能性がある。さらに、そのＲＤＳは
、入力信号クラスタ内で２つ以上のクラスタにわたる可能性がある。したがって、こうし
たＲＤＳを、各ＲＤＳに関連するより少数のＥＤＳを有する複数のＲＤＳと置き換えるこ
とが有用である。本発明の１つの態様では、ＲＤＳは、そのＲＤＳに関連するＥＤＳの全
てを検索し、より制限的である類似性カットオフ閾値を使用してそれらのＥＤＳを再クラ
スタリングすることにより、より小さいＲＤＳに分割することができる。再クラスタリン
グは、ＥＤＳの元のクラスタリングに関して上述した方法と類似する方法で進行する。第
１の新たなＲＤＳは、抽出されたＥＤＳのグループの第１のＥＤＳを含むように定義され
る。そして、各連続するＥＤＳは、新たなＲＤＳと比較される。新たなカットオフ値によ
って判断される際にＥＤＳがＲＤＳに類似する場合、そのＥＤＳはその新たなＲＤＳに含
まれる。ＥＤＳが、新たなＲＤＳのうちの１つに十分に類似していない場合、別の新たな
ＲＤＳが定義され、そのＲＤＳを開始するためにそのＥＤＳが使用される。ＲＤＳの新た
なセットがＲＤＳライブラリに含まれるとき、ＲＤＳのグループ化を繰り返すことができ
る。

【0072】

記録の後のＲＤＳのクラスタリングは、ＲＤＳにグループ化されたＥＤＳを選択する際
に使用された抽出アルゴリズムに基づく。最初に、上述したように、各ＲＤＳは複数のク
ラスタを含むことができる。こうしたＲＤＳは、上述したようにＲＤＳを再生成すること
により、又は、計算資源が許す場合、ＲＤＳに関連する全てのＥＤＳをロードし、それら
のＥＤＳに対して直接クラスタリングアルゴリズムを実行することにより、より小さいク
ラスタに分割することができる。代替的に、例えば、抽出アルゴリズムが、開始トリガに
対して固定サイズ位置の窓内のサンプルの全てを選択することによって動作する場合、結
果として得られるＥＤＳは、単に、対象信号のみを含むデータセグメントを近似する。窓
が大きすぎる場合、ＥＤＳは、距離計算を歪ませる可能性がある著しい数の背景サンプル
を含むことになる。同様に、窓が小さすぎる場合、対象信号の一部がカットオフされるこ
とになる。上述したように、ＥＤＳに続くＩＤＳにアクセスすることができ、固定窓によ
って切り捨てられた信号の喪失部分を復元することができる。したがって、ＥＤＳは、対
象データ信号に対する近似のみである。

【0073】

上述した第２のツールにより、ユーザは、これらの近似を補正し、そのため、クラスタ
リングを改善することができる。例えば、ＥＤＳ抽出アルゴリズムが固定窓に基づいた場
合、データ処理システムは、ＥＤＳに関連する停止位置を固定窓の最後から対象信号の物
理的な最後に一致する位置まで変更するトリミングアルゴリズムを実行することができる
。例えば、ＥＤＳの最後が、データチャネルにおける背景レベルを表すサンプルのストリ
ングである場合、ＥＤＳの最後は、背景を上回る最後のデータ値の位置であるように定義
することができる。同様に、ＥＤＳが窓によって切り捨てられ、当該ＥＤＳに隣接してア
イドルデータセグメントがある場合、アイドルデータセグメントにおけるデータの最後を
示すように、ＥＤＳの最後を変更することができる。

【0074】

これらの近似を補正するようにＥＤＳが更新された後、同じ類似性アルゴリズム又は異
なる類似性アルゴリズムを使用して、新たなＥＤＳの集まりをＲＤＳにクラスタリングす
ることができる。そして、第１のツールに関して上述したように、新たなＲＤＳのセット
をグループにクラスタリングすることができる。十分な計算資源が利用可能である場合、
元の大きいＲＤＳに置き換わるように新たなＲＤＳのセットを提供するように、再クラス
タリングされているＲＤＳに対応するＥＤＳの全てをグループとして組み立てて再クラス
タリングすることができる。

【0075】

上記２つのツールを使用する記録後処理中、ユーザは、１つ以上のクラスタに対応する
実際のＥＤＳを見ることができる。クラスタ内のＥＤＳがユーザに対して十分に類似して
いるように見えない場合、ユーザは、類似性を判断する際に使用された類似性アルゴリズ
ム及び閾値の両方又は一方を変更することができる。本発明の１つの態様では、ユーザは
、類似性アルゴリズムの所定のリストから類似性アルゴリズムを選択することができる。

【0076】

上述した実施形態では、ＲＤＳデータベースは、空で開始し、記録が進むに従って埋め
られる。しかしながら、記録の開始の前に１つ以上のＲＤＳが定義される実施形態もまた
構築することができる。これらの初期ＲＤＳにより、ユーザは、データストリームが受け
取られる際にデータストリームの内容を依然として認識しながら、特定の信号を探すこと
ができる。本発明に類似する装置によって分析された、又はユーザによって生成された別
のデータストリームにおいて、参照データセグメントが見つけられている場合もある。

【0077】

２つのデータセグメントの間の類似性を測定する前にＥＤＳ及びＲＤＳが標準化される
類似性アルゴリズムもまた利用することができる。例えば、各データセグメントは、比較
が形状における類似性を測定するように、データセグメントにおけるサンプルの最大値に
よって割ることができる。別の例では、ＥＤＳに定数が掛けられ、類似性が計算される。
プロセスは、異なる所定の定数に対して完了することができ、最高の類似度を使用するこ
とができる。

【0078】

本発明の１つの態様では、データストリームをリアルタイムで記録しながら、可能な限
り多くの予備的データを提供するように、処理が組織化される。そして、背景において、
又はデータ記録が完了した後、より高レベルの処理が実行される。大量のデータを記録す
る時点での処理により、抽出条件を満足させるデータセグメントの抽出、抽出データセグ
メントに基づく類似するデータセグメントの予備的分類、並びに、リアルタイム動作性能
を必要とする、入力データの記録を実行しながらの参照データセグメントの検出及び登録
が可能になる。最初に予備的分類の結果を使用して、予備的に分類された参照データセグ
メントに対するクラスタ分析によって分類を実行することができる。したがって、ユーザ
が、データが長期記録デバイスから回復されるのを待つ必要なしに、分析処理時間及びユ
ーザクエリに対する応答を提供することができる。

【0079】

言い換えれば、処理は、高速処理を最も優先し、したがって、最高の類似性を有するＲ
ＤＳを識別しないが、代わりに、所定の閾値の精度でＥＤＳに類似するＲＤＳを、こうし
たＲＤＳが見つかるとすぐにＥＤＳのタグとして採用し、それにより、処理を終了する。
詳細なデータセグメントの分類の実行がクラスタリングによって実施されるまで、完全な
分類決定を得る処理は延期される。

【0080】

記憶されるデータセグメント及びＲＤＳの数は、類似性評価のために分類閾値を設定す
ることによって調整することができる。その結果、予備的処理中に分類誤りを犠牲にして
予備的分類に対する時間を短縮させることができる。

【0081】

上述したように、上述したような並列処理を使用して処理時間を短縮させることができ
る。さらに、各ＲＤＳに関連するＥＤＳの数を反映する順序でＲＤＳを検査することによ
り、処理時間を更に短縮させることができる。さらに、予備的分類で使用される類似性評
価関数は、低い計算負荷を有するように選択することができ、それにより、後の処理で、
より複雑な類似度を使用してクラスタリングの精度を向上させることができる。

【0082】

上述した実施形態は一例としてデータロガーを使用するが、本発明は、２つの信号が類
似しているか否かを判断する類似性アルゴリズムと併せて抽出アルゴリズムを定義するこ
とができる広範囲のデータ信号に適用することができる。

【0083】

上述した実施形態では、入力データストリームは本質的にスカラであった。すなわち、
入力データストリームは、各クロックサイクルにおいて単一の値からなる。しかしながら
、本発明の教示は、ベクトル入力データストリームに適用することができる。こうしたデ
ータストリームでは、各クロックサイクルにおいて入力ベクトルを提供するように各チャ
ネルがＡＤＣによって処理される複数の入力データチャネルがある。新たなＥＤＳの開始
を定義するトリガ回路は、チャネルのうちの１つ又はチャネルのうちの複数に対して動作
することができる。こうしたベクトルデータストリームに上述した教示を適用することが
できる。

【0084】

上述した実施形態では、元のデータストリームは、元のアナログ信号をデジタル化する
ことによって導入された任意の量子化誤差を除き、損失なしにディスク又は他の長期記憶
デバイスから回復することができる。上述したように、この元のデータストリームに対す
る記憶要件は、何十テラバイトである可能性がある。いくつかの応用では、非可逆圧縮ア
ルゴリズムを使用して圧縮データストリームを提供することができることが有利である。
圧縮データストリームを提供するために使用することができる２つのタイプの近似がある
。第１の近似は、ＩＤＳを各ＩＤＳにおけるデータサンプルの数のカウントに置き換える
。これにより、各ＩＤＳが、それがＩＤＳであることを示すコードとカウントとまで縮小
する。

【0085】

第２の近似は、各ＥＤＳを、そのＥＤＳを含むＲＤＳにおけるＥＤＳに置き換える。各
ＲＤＳは代表的なＥＤＳを含み、そのＲＤＳに関連するＥＤＳの残りはそのＥＤＳに類似
する。このため、データストリームにおける各ＥＤＳは、そのＥＤＳが位置するＲＤＳの
識別情報に置き換えられる。しかしながら、この近似では、データストリームにＲＤＳの
ライブラリが一度含まれることが必要である。しかしながら、ＲＤＳの平均数がＥＤＳの
数よりはるかに小さいと想定すると、圧縮のレベルは著しい。各代表的なＥＤＳは、その
ＥＤＳの圧縮バージョンに置き換えることができる。代表的なＥＤＳを圧縮する際、エン
トロピ符号化等の可逆圧縮アルゴリズムを使用することができる。代替的に、代表的なＥ
ＤＳは、データ圧縮技術分野において既知である非可逆データ圧縮アルゴリズムのうちの
１つを使用して圧縮することができる。これらの従来のデータ圧縮技法は、可逆圧縮アル
ゴリズム及び非可逆圧縮アルゴリズムの両方を含むことができることが留意されるべきで
ある。

【0086】

本発明はまた、事前記録データセットにおける信号を理解するための分析的ツールとし
ても利用することができる。この場合、事前記録データセットは、図１に示す装置に類似
する装置に入力される。記録データが既にデジタル形態である場合、ＡＤＣ１１は省略す
ることができる。こうした応用では、コントローラ１５は、任意選択的に、データがシス
テムに入力される速度を制御することができる。したがって、次の新たなＥＤＳを処理し
なければならなくなる前に新たなＥＤＳをＲＤＳの各々と比較する十分な時間がない場合
、コントローラ１５は、システムが追いつくことができるようにデータの入力を単に停止
することができる。

【0087】

事前記録データの圧縮バージョンが望ましい場合、圧縮データストリームで使用するべ
きＲＤＳを決定した後、第２の時間で、データセットを読み出すことができる。そして、
ディスク１４に圧縮データストリームを出力することができる。

【0088】

上述したように、本発明のコントローラは、従来のコンピュータ又はマルチプロセッサ
とすることができる。ＥＤＳのＲＤＳへの照合は、マルチプロセッサを利用することによ
り速度を上昇させることができるプロセスであり、その理由は、新たなＥＤＳとＲＤＳの
うちの１つとの間の照合の結果は、そのＥＤＳとＲＤＳのうちの別のものとの照合と並列
に実行することができるためである。マルチプロセッサは、従来のマルチコアコンピュー
タ、又は、何千ものコアを有するグラフィック処理ボードとすることができる。

【0089】

本発明はまた、データ処理システムに本発明の方法を実行させる命令を記憶するコンピ
ュータ可読媒体も含む。コンピュータ可読媒体は、米国特許法第１０１条の下で特許とな
り得る主題を構成する任意の媒体であるように定義され、米国特許法第１０１条の下で特
許となり得る主題を構成しないいかなる媒体も排除する。こうした媒体の例としては、コ
ンピュータ又はデータ処理システムが可読であるフォーマットで情報を記憶するコンピュ
ータメモリデバイス等の非一時的媒体が挙げられる。

【0090】

【符号の説明】

【0091】

１１アナログ－デジタル変換器（ＡＤＣ）
１２ＦＩＦＯバッファ
１３クロック
１４ディスク
１５コントローラ
１６ローカルメモリ
１７ＥＤＳバッファ
１８ＲＤＳデータベース
１９ＥＤＳデータベース
２１ユーザインタフェース
２２ディスクデータベース

【図1】

【図2】

【手続補正書】

【提出日】2024-07-08

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

データストリームを記録し分析するシステムであって、
前記データストリームを受け取るように適合された入力ポートであって、該データストリームはデータ値の順序付けられたシーケンスを含む、入力ポートと、
前記データストリームを大容量記憶デバイスに通信するように適合された出力ポートと、
前記データストリームが該システムによって受け取られる際に該データストリームの所定部分を一時的に記憶するために、前記入力ポートに接続されたバッファと、
前記バッファに記憶された前記データストリームの、抽出プロトコルを満足させる新たな抽出データセグメント（ＥＤＳ）と呼ばれるセグメントを識別し、第１の類似性プロトコルを使用して前記新たなＥＤＳを複数の参照データセグメント（ＲＤＳ）の各々と比較するコントローラであって、該コントローラは、前記第１の類似性プロトコルが前記新たなＥＤＳが前記ＲＤＳのうちの１つに類似していることを示す場合には、該新たなＥＤＳを識別する情報をＲＤＳデータベースに記憶し、該コントローラは、前記新たなＥＤＳが前記ＲＤＳのうちのいずれとも類似していない場合には、新たなＲＤＳを生成し、各ＲＤＳは、そのＲＤＳと類似していることが分かった前記ＥＤＳと、該コントローラに前記新たなＲＤＳを生成させた前記新たなＥＤＳとのリストを含む、コントローラと
を備えるシステム。

【請求項2】

前記第１の類似性プロトコルは、２つのデータセグメントの間の距離の測定値と類似性閾値とを計算し、前記２つのデータセグメントは、前記距離が前記類似性閾値との所定関係を有する場合には、類似しているものとして定義される、請求項１に記載のシステム。

【請求項3】

前記コントローラは、既存のＲＤＳから、前記第１の類似性プロトコルより制限的である第２の類似性プロトコルを使用して、そのＲＤＳに関連するＥＤＳを互いに比較することにより、複数の新たなＲＤＳを生成する、請求項２に記載のシステム。

【請求項4】

前記抽出プロトコルは、前記新たなＥＤＳが開始する前記バッファにおけるデータ値と、前記新たなＥＤＳが終了する前記バッファにおけるデータ値とを識別し、
前記新たなＥＤＳが終了するところの前記データ値は、前記新たなＥＤＳが開始したところの前記データ値からの一定数のサンプル値である、請求項１に記載のシステム。

【請求項5】

前記第１の類似性プロトコルは、２つのデータセグメントの間の距離の測定値と類似性閾値とを計算し、前記距離の測定値が前記類似性閾値と所定関係を有する場合には、前記２つのデータセグメントは類似しているものとして定義され、
前記コントローラは、前記第１の類似性プロトコルより制限的ではない第２の類似性プロトコルによって判断される際に前記ＲＤＳが互いに類似している場合には、ユーザ入力に応じて前記ＲＤＳのうちの２つを結合する、請求項１に記載のシステム。

【請求項6】

前記第１の類似性プロトコルは、２つのデータセグメントの間の距離の測定値と類似性閾値とを計算し、前記距離の測定値が前記類似性閾値と所定関係を有する場合には、前記２つのデータセグメントは類似しているものとして定義され、
前記コントローラは、前記第１の類似性プロトコルより制限的である第２の類似性プロトコルを使用して、既存のＲＤＳから、そのＲＤＳに関連するＥＤＳを互いに比較することによって、複数の新たなＲＤＳを生成する、請求項１に記載のシステム。

【請求項7】

前記コントローラは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成する、請求項１に記載のシステム。

【請求項8】

前記コントローラは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成し、
前記コントローラは、ＥＤＳの一部ではないデータ値の各シーケンスを、該シーケンスにおけるシンボルの数を示すカウントに置き換える、請求項１に記載のシステム。

【請求項9】

データ値の順序付けられたシーケンスを含むデータストリームを信号のクラスタに対して分析するように、データ処理システムを動作させる方法であって、
前記データストリームを逐次受け取り、各データ値に、該データ値が受け取られる際にインデックスを割り当てることと、
前記受け取られたデータストリームの一部をバッファに記憶することと、
前記バッファから、抽出プロトコルを満足させる新たな抽出データセグメント（ＥＤＳ）を抽出することと、
第１の類似性プロトコルを使用して、前記新たなＥＤＳを複数の参照データセグメント（ＲＤＳ）の各々と比較することであって、前記データ処理システムは、前記第１の類似性プロトコルが前記新たなＥＤＳが前記ＲＤＳのうちの１つに類似していることを示す場合には、該新たなＥＤＳを識別する情報をＲＤＳデータベースに記憶し、前記データ処理システムは、前記新たなＥＤＳが前記ＲＤＳのうちのいずれとも類似していない場合には、新たなＲＤＳを生成することと
を含む方法。

【請求項10】

前記抽出プロトコルは、前記新たなＥＤＳが開始する前記バッファにおけるデータ値と、前記新たなＥＤＳが終了する前記バッファにおけるデータ値とを識別し、
前記新たなＥＤＳが終了するところの前記データ値は、前記新たなＥＤＳが開始したところの前記データ値からの一定数のサンプル値である、請求項９に記載の方法。

【請求項11】

前記データ処理システムは、２つのデータセグメントの間の距離の測定値と類似性閾値とを計算し、前記距離の測定値が前記類似性閾値と所定関係を有する場合には、前記２つのデータセグメントは類似しているものとして定義され、
前記データ処理システムは、前記第１の類似性プロトコルより制限的ではない第２の類似性プロトコルによって判断される際に前記ＲＤＳが互いに類似している場合には、ユーザ入力に応じて前記ＲＤＳのうちの２つを結合する、請求項９に記載の方法。

【請求項12】

前記データ処理システムは、２つのデータセグメントの間の距離の測定値と類似性閾値とを計算し、前記距離の測定値が前記類似性閾値と所定関係を有する場合には、前記２つのデータセグメントは類似しているものとして定義され、
前記データ処理システムは、前記第１の類似性プロトコルより制限的である第２の類似性プロトコルを使用して、既存のＲＤＳから、そのＲＤＳに関連するＥＤＳを互いに比較することによって、複数の新たなＲＤＳを生成する、請求項９に記載の方法。

【請求項13】

前記データ処理システムは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成する、請求項９に記載の方法。

【請求項14】

前記データ処理システムは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成し、
前記データ処理システムは、ＥＤＳの一部ではないデータ値の各シーケンスを、該シーケンスにおけるシンボルの数を示すカウントに置き換える、請求項９に記載の方法。

【請求項15】

データ処理システムに、データ値の順序付けられたシーケンスを含むデータストリームを信号のクラスタに対して分析する方法を実行させる命令を含むコンピュータ可読メモリであって、前記方法は、
前記データストリームを逐次受け取り、各データ値に、該データ値が受け取られる際にインデックスを割り当てることと、
前記受け取られたデータストリームの一部をメモリバッファに記憶することと、
前記バッファから、抽出プロトコルを満足させる新たな抽出データセグメント（ＥＤＳ）を抽出することと、
第１の類似性プロトコルを使用して、前記新たなＥＤＳを複数の参照データセグメント（ＲＤＳ）の各々と比較することであって、前記データ処理システムは、前記第１の類似性プロトコルが前記新たなＥＤＳが前記ＲＤＳのうちの１つに類似していることを示す場合には、該新たなＥＤＳを識別する情報をＲＤＳデータベースに記憶し、データ処理システムは、前記新たなＥＤＳが前記ＲＤＳのうちのいずれとも類似していない場合には、新たなＲＤＳを生成することと
を含むコンピュータ可読メモリ。

【請求項16】

前記データ処理システムは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成する、請求項１５に記載のコンピュータ可読メモリ。

【請求項17】

前記データ処理システムは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成し、
前記データ処理システムは、ＥＤＳの一部ではないデータ値の各シーケンスを、該シーケンスにおけるシンボルの数を示すカウントに置き換える、請求項１５に記載のコンピュータ可読メモリ。

【手続補正2】

【補正対象書類名】明細書

【補正対象項目名】００４１

【補正方法】変更

【補正の内容】

【0041】

第１のタイプの類似性アルゴリズムは、データセグメントを直接比較してそれらの類似性を求める。最も単純な場合では、２つのデータセグメントは同じ長さを有し、類似性関数は、成分がデータ値である２つのベクトルの間の距離を測定する。例えば、ＥＤＳが、ｉ＝１～Ｎに対してサンプル値ｐ（ｉ）を有し、ＲＤＳがｉ＝１～Ｎに対してサンプル値ｑ（ｉ）を有する場合、ユークリッド距離

【数1】

は、２つのデータセグメントの類似性の程度を測るものである。Ｄ（ｐ，ｑ）が閾値Ｔ未満である場合、２つのセグメントは互いに類似していると定義され、ここで、Ｔは所定の閾値である。この目的でユークリッド距離の代わりに使用することができる多くの距離関数がある。より詳細に後述するように、いくつかの応用では、関数を計算する際の計算作業負荷がより小さいため、特定の距離関数が好ましいものとなる。

【手続補正3】

【補正対象書類名】明細書

【補正対象項目名】００９０

【補正方法】変更

【補正の内容】

【0090】

本発明の上述した実施形態は、本発明の種々の態様を示すために提供されている。しかし、異なる特定の実施形態において示される本発明の異なる態様を組み合わせて、本発明の他の実施形態を提供することができることが理解される。さらに、本発明に対する種々の変更形態が、上記の説明及び添付図面から明らかになるであろう。したがって、本発明は、添付の特許請求の範囲の範囲だけによって制限される。
なお、親出願の出願当初の特許請求の範囲の記載は以下の通りである。
請求項１：
データストリームを記録し分析するシステムであって、
前記データストリームを受け取るように適合された入力ポートであって、該データストリームはデータ値の順序付けられたシーケンスを含む、入力ポートと、
前記データストリームを大容量記憶デバイスに通信するように適合された出力ポートと、
前記データストリームが該システムによって受け取られる際に該データストリームの所定部分を一時的に記憶するために、前記入力ポートに接続されたバッファと、
前記バッファに記憶された前記データストリームの、抽出プロトコルを満足させる新たな抽出データセグメント（ＥＤＳ）と呼ばれるセグメントを識別し、第１の類似性プロトコルを使用して前記新たなＥＤＳを複数の参照データセグメント（ＲＤＳ）の各々と比較するコントローラであって、該コントローラは、前記第１の類似性プロトコルが、前記新たなＥＤＳが前記ＲＤＳのうちの１つに類似していることを示す場合、該新たなＥＤＳを識別する情報をＲＤＳデータベースに記憶し、該コントローラは、前記新たなＥＤＳが前記ＲＤＳのうちのいずれとも類似していない場合、新たなＲＤＳを生成し、各ＲＤＳは、そのＲＤＳと類似していることが分かった前記ＥＤＳと、該コントローラに前記新たなＲＤＳを生成させた前記新たなＥＤＳとのリストを含む、コントローラと、
を備える、システム。
請求項２：
前記第１の類似性プロトコルは、２つのデータセグメントの間の距離の尺度と類似性閾値とを計算し、前記２つのデータセグメントは、前記距離が前記類似性閾値との所定関係を有する場合、類似しているものとして定義される、請求項１に記載のシステム。
請求項３：
前記コントローラは、既存のＲＤＳから、前記第１の類似性プロトコルより制限的である第２の類似性プロトコルを使用して、そのＲＤＳに関連するＥＤＳを互いに比較することにより、複数の新たなＲＤＳを生成する、請求項２に記載のシステム。
請求項４：
データ値の順序付けられたシーケンスを含むデータストリームを前記信号のクラスタに対して分析するように、データ処理システムを動作させる方法であって、
前記データストリームを逐次受け取り、各データ値に、該データ値が受け取られる際にインデックスを割り当てることと、
前記受け取られたデータストリームの一部をバッファに記憶することと、
前記バッファから、抽出プロトコルを満足させる新たなＥＤＳを抽出することと、
第１の類似性プロトコルを使用して、前記新たなＥＤＳを複数のＲＤＳの各々と比較することであって、前記データ処理システムは、前記第１の類似性プロトコルが、前記新たなＥＤＳが前記ＲＤＳのうちの１つに類似していることを示す場合、該新たなＥＤＳを識別する情報をＲＤＳデータベースに記憶し、前記データ処理システムは、前記新たなＥＤＳが前記ＲＤＳのうちのいずれとも類似していない場合、新たなＲＤＳを生成することと、
を含む、方法。
請求項５：
前記抽出プロトコルは、前記新たなＥＤＳが開始する前記バッファにおけるデータ値と、前記新たなＥＤＳが終了する前記バッファにおけるデータ値とを識別し、前記新たなＥＤＳが終了する前記データ値は、前記新たなＥＤＳが開始した前記データ値からの一定数のサンプル値である、請求項４に記載の方法又は請求項１に記載のシステム。
請求項６：
前記データ処理システムは、２つのデータセグメントの間の距離の尺度と類似性閾値とを計算し、前記距離が前記類似性閾値と所定関係を有する場合、前記２つのデータセグメントは類似しているものとして定義され、前記データ処理システムは、前記第１の類似性プロトコルより制限的ではない第２の類似性プロトコルによって判断される際に前記ＲＤＳが互いに類似している場合、ユーザ入力に応じて前記ＲＤＳのうちの２つを結合する、請求項４に記載の方法又は請求項１に記載のシステム。
請求項７：
前記データ処理システムは、２つのデータセグメントの間の距離の尺度と類似性閾値とを計算し、前記距離が前記類似性閾値と所定関係を有する場合、前記２つのデータセグメントは類似しているものとして定義され、前記データ処理システムは、前記第１の類似性プロトコルより制限的である第２の類似性プロトコルを使用して、既存のＲＤＳから、そのＲＤＳに関連するＥＤＳを互いに比較することによって、複数の新たなＲＤＳを生成する、請求項４に記載の方法又は請求項１に記載のシステム。
請求項８：
データ処理システムに、データ値の順序付けられたシーケンスを含むデータストリームを前記信号のクラスタに対して分析する方法を実行させる命令を含むコンピュータ可読メモリであって、前記方法は、
前記データストリームを逐次受け取り、各データ値に、該データ値が受け取られる際にインデックスを割り当てることと、
前記受け取られたデータストリームの一部をメモリバッファに記憶することと、
前記バッファから、抽出プロトコルを満足させる新たなＥＤＳを抽出することと、
第１の類似性プロトコルを使用して、前記新たなＥＤＳを複数のＲＤＳの各々と比較することであって、前記データ処理システムは、前記第１の類似性プロトコルが、前記新たなＥＤＳが前記ＲＤＳのうちの１つに類似していることを示す場合、該新たなＥＤＳを識別する情報をＲＤＳデータベースに記憶し、データ処理システムは、前記新たなＥＤＳが前記ＲＤＳのうちのいずれとも類似していない場合、新たなＲＤＳを生成することと、
を含む、コンピュータ可読メモリ。
請求項９：
前記データ処理システムは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成する、請求項８に記載のコンピュータ可読メモリ、請求項１に記載のシステム、又は請求項４に記載の方法。
請求項１０：
前記データ処理システムは、各ＥＤＳを、そのＥＤＳに類似していることが分かった前記ＲＤＳを表すシンボルに置き換えることにより、圧縮データストリームを生成し、前記データ処理システムは、ＥＤＳの一部ではないデータ値の各シーケンスを、該シーケンスにおけるシンボルの数を示すカウントに置き換える、請求項８に記載のコンピュータ可読メモリ、請求項１に記載のシステム、又は請求項４に記載の方法。

【外国語明細書】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版