特許第6153486号(P6153486)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許6153486異なるイベント同士を統合する情報統合プログラム、装置及び方法
<>
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000002
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000003
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000004
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000005
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000006
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000007
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000008
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000009
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000010
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000011
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000012
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000013
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000014
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000015
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000016
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000017
  • 特許6153486-異なるイベント同士を統合する情報統合プログラム、装置及び方法 図000018
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6153486
(24)【登録日】2017年6月9日
(45)【発行日】2017年6月28日
(54)【発明の名称】異なるイベント同士を統合する情報統合プログラム、装置及び方法
(51)【国際特許分類】
   G06F 17/30 20060101AFI20170619BHJP
【FI】
   G06F17/30 220Z
   G06F17/30 170Z
   G06F17/30 210D
【請求項の数】12
【全頁数】18
(21)【出願番号】特願2014-44803(P2014-44803)
(22)【出願日】2014年3月7日
(65)【公開番号】特開2015-170152(P2015-170152A)
(43)【公開日】2015年9月28日
【審査請求日】2016年7月7日
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(72)【発明者】
【氏名】黒川 茂莉
【審査官】 樋口 龍弥
(56)【参考文献】
【文献】 米国特許出願公開第2007/0288635(US,A1)
【文献】 川島 英之,黒川 茂莉,ストリームイベントの効率的なオンライン名寄せ処理,電子情報通信学会2014年総合大会講演論文集 通信2,日本,一般社団法人電子情報通信学会,2014年 3月 4日,p.602
【文献】 渡辺 陽介,横田 治夫,低遅延ストリーム処理のための結合演算並列実行方式,情報処理学会研究報告 2012年度3,日本,一般社団法人情報処理学会,2012年10月15日,p.1-8
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
装置に搭載されたコンピュータを、第1のストリームにおける種々の第1のイベントと、第2のストリームにおける種々の第2のイベントとの間の相関度を導出するように機能させる情報統合プログラムであって、
種々の第1のイベントが時系列に入力される第1のストリームバッファと、
第1のイベントと異なる種類の第2のイベントが時系列に入力される第2のストリームバッファと、
第2のストリームバッファに新たに入力された第2の新入イベントから見て、所定時間範囲外の過去時刻の第1のイベントを第1のストリームバッファから削除するイベント削除手段と、
第2の新入イベントの発生時刻を含む所定時間範囲に含まれる、第1のストリームバッファの1つ以上の第1のイベントを取り出すイベント取得手段と、
第2の新入イベントと、前記イベント取得手段によって取り出された1つ以上の第1のイベントとから、総当たりのイベントペアを生成するイベントペア生成手段と、
複数のイベントペアの出現頻度から、第1のイベントと第2のイベントとの間の相関度を算出する相関度算出手段と
してコンピュータを機能させることを特徴とする情報統合プログラム。
【請求項2】
前記イベント削除手段は、第1のストリームバッファに新たに入力された第1の新入イベントから見て、所定時間範囲外の過去時刻の第2のイベントを第2のストリームバッファから削除し、
前記イベント取得手段は、第1の新入イベントの発生時刻を含む所定時間範囲に含まれる、第2のストリームバッファの1つ以上の第2のイベントを取り出し、
前記イベントペア生成手段は、第1の新入イベントと、前記イベント取得手段によって取り出された1つ以上の第2のイベントとを相互に、イベント同士の総当たりのイベントペアを生成する
ようにコンピュータを機能させることを特徴とする請求項1に記載の情報統合プログラム。
【請求項3】
前記イベントは、「識別子、発生時刻」を含むタプルであり、
前記相関度は、識別子同士の組毎の出現頻度である
ようにコンピュータを機能させることを特徴とする請求項1又は2に記載の情報統合プログラム。
【請求項4】
前記イベントは、「識別子、発生時刻、属性値」を含むタプルであり、
前記相関度は、識別子及び属性値同士の組毎の出現頻度である
ようにコンピュータを機能させることを特徴とする請求項1又は2に記載の情報統合プログラム。
【請求項5】
前記相関度算出手段は、第1のイベントと第2のイベントとの間の時刻印差が小さいほど出現頻度に高く重み付け、時刻印差が大きいほど出現頻度に低く重み付ける
ようにコンピュータを機能させることを特徴とする請求項3又は4に記載の情報統合プログラム。
【請求項6】
前記相関度算出手段について、第1のイベントと第2のイベントとの間の相関度は、
第1のイベント及び第2のイベントのイベントペアの出現頻度/
((第1のイベントを一方に含むイベントペアの出現頻度)+
(第2のイベントを一方に含むイベントペアの出現頻度)−
(第1のイベント及び第2のイベントのイベントペアの出現頻度))
として算出する
ようにコンピュータを機能させることを特徴とする請求項3又は4に記載の情報統合プログラム。
【請求項7】
前記相関度が高い上位から順に所定の数、又は、所定の相関度以上のイベント同士の組み合わせを、統合イベントとして選択する統合イベント選択手段と
してコンピュータを更に機能させることを特徴とする請求項1から6のいずれか1項に記載の情報統合プログラム。
【請求項8】
前記相関度が高い上位の組み合わせから順に選択し、既に選択済みの識別子を含むイベントについては選択を完了したものとしてスキップし、所定の数、又は、所定の相関度以上のイベント同士の組み合わせを、統合イベントとして選択する統合イベント選択手段と
してコンピュータを更に機能させることを特徴とする請求項1から6のいずれか1項に記載の情報統合プログラム。
【請求項9】
第1のストリームに基づく第1のイベントは、第1の装置から送信されるアラート信号であり、
第2のストリームに基づく第2のイベントは、第2の装置から送信されるアラート信号である
ようにコンピュータを機能させることを特徴とする請求項1から8のいずれか1項に記載の情報統合プログラム。
【請求項10】
第1のストリームに基づく第1のイベントは、第1のユーザ群から送信されるメッセージであり、
第2のストリームに基づく第2のイベントは、第2のユーザ群から送信されるメッセージである
ようにコンピュータを機能させることを特徴とする請求項1から8のいずれか1項に記載の情報統合プログラム。
【請求項11】
第1のストリームにおける種々の第1のイベントと、第2のストリームにおける種々の第2のイベントとの間の相関度を導出する情報統合装置であって、
種々の第1のイベントが時系列に入力される第1のストリームバッファと、
第1のイベントと異なる種類の第2のイベントが時系列に入力される第2のストリームバッファと、
第2のストリームバッファに新たに入力された第2の新入イベントから見て、所定時間範囲外の過去時刻の第1のイベントを第1のストリームバッファから削除するイベント削除手段と、
第2の新入イベントの発生時刻を含む所定時間範囲に含まれる、第1のストリームバッファの1つ以上の第1のイベントを取り出すイベント取得手段と、
第2の新入イベントと、前記イベント取得手段によって取り出された1つ以上の第1のイベントとから、総当たりのイベントペアを生成するイベントペア生成手段と、
複数のイベントペアの出現頻度から、第1のイベントと第2のイベントとの間の相関度を算出する相関度算出手段と
を有することを特徴とする情報統合装置。
【請求項12】
装置を用いて、第1のストリームにおける種々の第1のイベントと、第2のストリームにおける種々の第2のイベントとの間の相関度を導出する情報統合方法であって、
前記装置は、種々の第1のイベントが時系列に入力される第1のストリームバッファと、第1のイベントと異なる種類の第2のイベントが時系列に入力される第2のストリームバッファとを有し、
第2のストリームバッファに新たに入力された第2の新入イベントから見て、所定時間範囲外の過去時刻の第1のイベントを第1のストリームバッファから削除する第1のステップと、
第2の新入イベントの発生時刻を含む所定時間範囲に含まれる、第1のストリームバッファの1つ以上の第1のイベントを取り出す第2のステップと、
第2の新入イベントと、前記イベント取得手段によって取り出された1つ以上の第1のイベントとから、総当たりのイベントペアを生成する第3のステップと
複数のイベントペアの出現頻度から、第1のイベントと第2のイベントとの間の相関度を算出する第4のステップと
を有することを特徴とする装置の情報統合方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば複数のデータベースに分散しているような、異なるイベント同士を統合する技術に関する。
【背景技術】
【0002】
近年、ICT(Information and Communication Technologies)システムの発展に伴って、1つの原因から様々な種類のイベントが大量に発生することがある。例えば、通信システムを想定した場合、1カ所の障害発生によって、サーバやルータ等の異なる複数の装置からイベントが大量に発生する。この場合、これら複数のイベントを、リアルタイムに且つ高速に関連付けることができれば、その原因となる障害箇所の推定も比較的容易となる。しかしながら、一般的に、イベント同士の関連性は全くの不明であるために、遡ってその原因を判断することは難しい。
【0003】
従来、複数のイベントから特徴を抽出し、その特徴に基づき障害をクラスタリングする技術がある(例えば特許文献1参照)。この技術によれば、同じ障害クラスタに含まれる同一原因の障害発生時のイベントから、障害原因判定ルールの条件句を生成することができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2011−209908号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載の技術によれば、障害イベントをクラスタリングするために、リアルタイムに判定することが難しく、膨大な障害イベントを分析するためにメモリサイズも増大し、処理時間も増大する。
【0006】
そこで、本発明は、異なる種類のイベント同士の相関度を、リアルタイムに且つ少ないメモリサイズで導出することができる情報統合プログラム、装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明によれば、装置に搭載されたコンピュータを、第1のストリームにおける種々の第1のイベントと、第2のストリームにおける種々の第2のイベントとの間の相関度を導出するように機能させる情報統合プログラムであって、
種々の第1のイベントが時系列に入力される第1のストリームバッファと、
第1のイベントと異なる種類の第2のイベントが時系列に入力される第2のストリームバッファと、
第2のストリームバッファに新たに入力された第2の新入イベントから見て、所定時間範囲外の過去時刻の第1のイベントを第1のストリームバッファから削除するイベント削除手段と、
第2の新入イベントの発生時刻を含む所定時間範囲に含まれる、第1のストリームバッファの1つ以上の第1のイベントを取り出すイベント取得手段と、
第2の新入イベントと、イベント取得手段によって取り出された1つ以上の第1のイベントとから、総当たりのイベントペアを生成するイベントペア生成手段と、
複数のイベントペアの出現頻度から、第1のイベントと第2のイベントとの間の相関度を算出する相関度算出手段と
してコンピュータを機能させることを特徴とする。
【0008】
本発明の情報統合プログラムにおける他の実施形態によれば、
イベント削除手段は、第1のストリームバッファに新たに入力された第1の新入イベントから見て、所定時間範囲外の過去時刻の第2のイベントを第2のストリームバッファから削除し、
イベント取得手段は、第1の新入イベントの発生時刻を含む所定時間範囲に含まれる、第2のストリームバッファの1つ以上の第2のイベントを取り出し、
イベントペア生成手段は、第1の新入イベントと、イベント取得手段によって取り出された1つ以上の第2のイベントとを相互に、イベント同士の総当たりのイベントペアを生成する
ようにコンピュータを機能させることも好ましい。
【0009】
本発明の情報統合プログラムにおける他の実施形態によれば、
イベントは、「識別子、発生時刻」を含むタプルであり、
相関度は、識別子同士の組毎の出現頻度である
ようにコンピュータを機能させることも好ましい。
【0010】
本発明の情報統合プログラムにおける他の実施形態によれば、
イベントは、「識別子、発生時刻、属性値」を含むタプルであり、
相関度は、識別子及び属性値同士の組毎の出現頻度である
ようにコンピュータを機能させることも好ましい。
【0011】
本発明の情報統合プログラムにおける他の実施形態によれば、
相関度算出手段は、第1のイベントと第2のイベントとの間の時刻印差が小さいほど出現頻度に高く重み付け、時刻印差が大きいほど出現頻度に低く重み付ける
ようにコンピュータを機能させることも好ましい。
【0012】
本発明の情報統合プログラムにおける他の実施形態によれば、
相関度算出手段について、第1のイベントと第2のイベントとの間の相関度は、
第1のイベント及び第2のイベントのイベントペアの出現頻度/
((第1のイベントを一方に含むイベントペアの出現頻度)+
(第2のイベントを一方に含むイベントペアの出現頻度)−
(第1のイベント及び第2のイベントのイベントペアの出現頻度))
として算出するようにコンピュータを機能させることも好ましい。
【0013】
本発明の情報統合プログラムにおける他の実施形態によれば、
相関度算出手段から出力されるイベント同士の相関度から、相関度が高い上位から順に所定の数、又は、所定の相関度以上のイベント同士の組み合わせを、相関イベントとして選択する統合イベント選択手段と
してコンピュータを更に機能させることも好ましい。
【0014】
本発明の情報統合プログラムにおける他の実施形態によれば、
相関度算出手段から出力されるイベント同士の相関度から、相関度が高い上位の組み合わせから順に選択し、既に選択済みの識別子を含むイベントについては選択を完了したものとしてスキップし、所定の数、又は、所定の相関度以上のイベント同士の組み合わせを、統合イベントとして選択する統合イベント選択手段と
してコンピュータを更に機能させることも好ましい。
【0015】
本発明の情報統合プログラムにおける他の実施形態によれば、
第1のストリームに基づく第1のイベントは、第1の装置から送信されるアラート信号であり、
第2のストリームに基づく第2のイベントは、第2の装置から送信されるアラート信号である
ようにコンピュータを機能させることも好ましい。
【0016】
本発明の情報統合プログラムにおける他の実施形態によれば、
第1のストリームに基づく第1のイベントは、第1のユーザ群から送信されるメッセージであり、
第2のストリームに基づく第2のイベントは、第2のユーザ群から送信されるメッセージである
ようにコンピュータを機能させることも好ましい。
【0017】
本発明によれば、第1のストリームにおける種々の第1のイベントと、第2のストリームにおける種々の第2のイベントとの間の相関度を導出する情報統合装置であって、
種々の第1のイベントが時系列に入力される第1のストリームバッファと、
第1のイベントと異なる種類の第2のイベントが時系列に入力される第2のストリームバッファと、
第2のストリームバッファに新たに入力された第2の新入イベントから見て、所定時間範囲外の過去時刻の第1のイベントを第1のストリームバッファから削除するイベント削除手段と、
第2の新入イベントの発生時刻を含む所定時間範囲に含まれる、第1のストリームバッファの1つ以上の第1のイベントを取り出すイベント取得手段と、
第2の新入イベントと、イベント取得手段によって取り出された1つ以上の第1のイベントとから、総当たりのイベントペアを生成するイベントペア生成手段と、
複数のイベントペアの出現頻度から、第1のイベントと第2のイベントとの間の相関度を算出する相関度算出手段と
を有することを特徴とする。
【0018】
本発明によれば、装置を用いて、第1のストリームにおける種々の第1のイベントと、第2のストリームにおける種々の第2のイベントとの間の相関度を導出する情報統合方法であって、
装置は、種々の第1のイベントが時系列に入力される第1のストリームバッファと、第1のイベントと異なる種類の第2のイベントが時系列に入力される第2のストリームバッファとを有し、
第2のストリームバッファに新たに入力された第2の新入イベントから見て、所定時間範囲外の過去時刻の第1のイベントを第1のストリームバッファから削除する第1のステップと、
第2の新入イベントの発生時刻を含む所定時間範囲に含まれる、第1のストリームバッファの1つ以上の第1のイベントを取り出す第2のステップと、
第2の新入イベントと、イベント取得手段によって取り出された1つ以上の第1のイベントとから、総当たりのイベントペアを生成する第3のステップと
複数のイベントペアの出現頻度から、第1のイベントと第2のイベントとの間の相関度を算出する第4のステップと
を有することを特徴とする。
【発明の効果】
【0019】
本発明の情報統合プログラム、装置及び方法によれば、異なる種類のイベント同士の相関度を、リアルタイムに且つ少ないメモリサイズで導出することができる。
【図面の簡単な説明】
【0020】
図1】本発明の情報統合装置における機能構成図である。
図2】ストリームバッファ101及び102に入力されるイベントを表す説明図である。
図3】ストリームバッファ101にイベント11が入力された時の説明図である。
図4】ストリームバッファ102にイベント21が入力された時の説明図である。
図5】ストリームバッファ102にイベント22が入力された時の説明図である。
図6】ストリームバッファ102にイベント23が入力された時の説明図である。
図7】ストリームバッファ101にイベント12が入力された時の説明図である。
図8】ストリームバッファ102にイベント24が入力された時の説明図である。
図9】ストリームバッファ102にイベント25が入力された時の説明図である。
図10】ストリームバッファ101にイベント13が入力された時の説明図である。
図11】ストリームバッファ101にイベント14が入力された時の説明図である。
図12】ストリームバッファ102にイベント26が入力された時の説明図である。
図13】ストリームバッファ102にイベント27が入力された時の説明図である。
図14】ストリームバッファ102にイベント28が入力された時の説明図である。
図15】ストリームバッファ101にイベント15が入力された時の説明図である。
図16】ストリームバッファ102にイベント29が入力された時の説明図である。
図17】イベント同士の相関度を表す説明図である。
【発明を実施するための形態】
【0021】
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
【0022】
図1は、本発明の情報統合装置における機能構成図である。
【0023】
本発明の情報統合装置は、基本的に、第1のストリームにおける種々の第1のイベントと、第2のストリームにおける種々の第2のイベントとの間の相関度を導出するように機能する。図1によれば、情報統合装置1は、第1のストリームバッファ101と、第2のストリームバッファ102と、イベント削除部11と、イベント取得部12と、イベントペア生成部13と、相関度算出部14と、統合イベント選択部15とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させる情報統合プログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、装置を用いた情報統合方法としても理解できる。
【0024】
[第1のストリームバッファ101][第2のストリームバッファ102]
第1のストリームバッファ101は、種々の第1のイベントが時系列に入力されるストリームバッファである。また、第2のストリームバッファ102は、第1のイベントと異なる種類の第2のイベントが時系列に入力されるストリームバッファである。情報源から到着するイベントは、概ね、イベント発生の時刻順に到着するものと想定している。そうでない場合は、イベントを、時刻順にソートすればよい。
【0025】
イベントとしては、例えば「アラート信号」であってもよい。第1のストリームに基づく第1のイベントは、第1の装置から送信されるアラート信号であり、第2のストリームに基づく第2のイベントは、第2の装置から送信されるアラート信号である。
また、イベントとしては、例えば「メッセージ」であってもよい。第1のストリームに基づく第1のイベントは、第1のユーザ群から送信されるメッセージであり、第2のストリームに基づく第2のイベントは、第2のユーザ群から送信されるメッセージである。
イベントには、他のイベントとの相関性を表す情報は全く含まれておらず、イベント同士のみを比較しても、通常、その相関性は見出せないものである。
【0026】
本願の発明者らは、同一原因に基づくイベントの時刻印は近接している(時刻印差が短い)ことに着目して、イベント同士を対応付けることができるのではないか?と考えた。そのために、「イベント」は、少なくとも「識別子、発生時刻(時刻印)」を含む「タプル」であることを前提としている。イベントが発生(生成)される都度、そのイベントには、時刻印が付与される。
【0027】
例えばイベントがアラート信号である場合、「識別子」は通信装置の識別子であってもよい。また、イベントのタプルに、1つ以上の「属性値」を更に含めたものであってもよく、その場合、「属性値」は通信装置で検出された値であってもよい。
【0028】
識別子のデータ型は、文字列型であってもよいし、整数型であってもよい。発生時刻(時刻印)のデータ型は、2014/01/01 11:22:33などの日付型又は文字列型でもよいし、所定の日時を基準にした経過時間を表す整数型であってもよい。尚、経過時間の単位は、必要に応じて、日、時、分、10秒、秒、10ミリ秒又はミリ秒としてもよい。
【0029】
ストリームバッファには、イベントがリアルタイムに入力されることによって、タプルは、時刻印の昇順に並ぶ。勿論、ストリームバッファは、イベントが入力されるものではなく、時刻印が昇順に並んだタプルを含むテーブルであってもよい。即ち、ストリームバッファは、大量のタプルを時刻印の昇順に並べて記憶するデータベースであってもよい。
【0030】
尚、本発明は、2つのストリームバッファに限られず、3つ以上のストリームバッファであっても同様に機能する。
【0031】
[イベント削除部11]
イベント削除部11は、第2のストリームバッファに新たに入力された第2の新入イベントから見て、所定時間範囲外の過去時刻の第1のイベントを第1のストリームバッファから削除する。
また、イベント削除部11は、第1のストリームバッファに新たに入力された第1の新入イベントから見て、所定時間範囲外の過去時刻の第2のイベントを第2のストリームバッファから削除する。
これは、発生時刻の差(時刻印差)が閾値時間以下となるイベントのみを統合するために、それ以外のイベントをストリームバッファから削除する。ストリームバッファには、必要なイベントのみをメモリに展開することによって、そのメモリ量をできる限り削減することができる。このようなメモリ展開によって、演算処理量も削減することができる。
【0032】
[イベント取得部12]
イベント取得部12は、第2の新入イベントの発生時刻を含む所定時間範囲に含まれる、第1のストリームバッファの1つ以上の第1のイベントを取り出す。また、イベント取得部12は、第1の新入イベントの発生時刻を含む所定時間範囲に含まれる、第2のストリームバッファの1つ以上の第2のイベントを取り出す。取り出されたイベントは、イベントペア生成部13へ出力される。
【0033】
[イベントペア生成部13]
イベントペア生成部13は、第2の新入イベントと、イベント取得手段によって取り出された1つ以上の第1のイベントとから、総当たりのイベントペアを生成する。
また、イベントペア生成部13は、第1の新入イベントと、イベント取得手段によって取り出された1つ以上の第2のイベントとを相互に、イベント同士の総当たりのイベントペアを生成する。
生成されたイベントペアは、相関度算出部14へ出力される。
【0034】
[相関度算出部14]
相関度算出部14は、イベントペアを逐次入力すると共に、第1のイベントと第2のイベントとの間の相関度を算出する。相関度としては、例えば以下のようなものであってもよい。
・識別子同士の組毎の出現頻度
・識別子及び属性値同士の組毎の出現頻度とする。
また、相関度算出部14は、第1のイベントと第2のイベントとの間の時刻印差が小さいほど出現頻度に高く重み付け、時刻印差が大きいほど出現頻度に低く重み付けるものであってもよい。
【0035】
[統合イベント選択部15]
統合イベント選択部15は、相関度が高い上位から順に所定の数、又は、所定の相関度以上のイベント同士の組み合わせを、統合イベントとして選択する。このような統合イベントは、何らかの関連性が高いと認識することができる。このとき、出現頻度の上位の組み合わせから順に選択し、既に選択済みの識別子を含むイベントについては選択を完了したものとしてスキップし、所定の数、又は、所定の相関度以上のイベント同士の組み合わせを、統合イベントとして選択することも好ましい。
【0036】
図2は、ストリームバッファ101及び102に入力されるイベントを表す説明図でる。
【0037】
図2によれば、具体的に、ストリームバッファ101及び102に、時系列の複数のイベントが入力されている。以下では図3図16によって、イベントの到着順の処理について具体的に説明する。tは、発生時刻を経過秒数で表している。また、時刻印差の閾値時間は、2秒と設定した。また、初期状態のストリームバッファは、空である。尚、生成さえれたイベントペアは、以下のように表記する。
<第1のイベント、第2のイベント>
【0038】
(S1)図3は、ストリームバッファ101にイベント11が入力された時の説明図である。
【0039】
(S2)図4は、ストリームバッファ102にイベント21が入力された時の説明図である。
イベント21とイベント11との間の時刻印差は、0秒であり、時間閾値2秒以下である。そのために、イベント11とイベント21のペアを生成する。
<11、21>
【0040】
(S3)図5は、ストリームバッファ102にイベント22が入力された時の説明図である。
イベント22とイベント11との間の時刻印差は、1秒であり、時間閾値2秒以下である。そのために、イベント11とイベント22のペアを生成する。
<11、21><11、22>
【0041】
(S4)図6は、ストリームバッファ102にイベント23が入力された時の説明図である。
イベント23とイベント11との間の時刻印差は、1秒であり、時間閾値2秒以下である。そのために、イベント11とイベント23のペアを生成する。
<11、21><11、22><11、23>
【0042】
(S5)図7は、ストリームバッファ101にイベント12が入力された時の説明図である。
イベント12と、イベント21、22、23との間の時刻印差は、2秒、1秒、1秒であり、時間閾値2秒以下である。そのために、イベント12と、イベント21、22、23それぞれとのペアを生成する。
<11、21><11、22><11、23>
<12、21><12、22><12、23>
【0043】
(S6)図8は、ストリームバッファ102にイベント24が入力された時の説明図である。
イベント24と、イベント11、12との間の時刻印差は、2秒、0秒であり、時間閾値2秒以下である。そのために、イベント24と、イベント11、12それぞれとのペアを生成する。
<11、21><11、22><11、23>
<12、21><12、22><12、23>
<11、24><12、24>
【0044】
(S7)図9は、ストリームバッファ102にイベント25が入力された時の説明図である。
イベント25と、イベント11との間の時刻印差は、3秒であり、時間閾値2秒よりも大きい。そのために、イベント11をストリームバッファ101から削除する。
一方で、イベント25と、イベント12との間の時刻印差は、1秒であり、時間閾値2秒以下である。そのために、イベント25とイベント12とのペアを生成する。
<11、21><11、22><11、23>
<12、21><12、22><12、23>
<11、24><12、24>
<12、25>
※ストリームバッファ101からイベント11を削除
【0045】
(S8)図10は、ストリームバッファ101にイベント13が入力された時の説明図である。
イベント13と、イベント21、22、23、24との間の時刻印差は、5秒、4秒、4秒、3秒であり、時間閾値2秒よりも大きい。そのために、イベント21、22、23、24をストリームバッファ102から削除する。
一方で、イベント13と、イベント25との間の時刻印差は、2秒であり、時間閾値2秒以下である。そのために、イベント13とイベント25とのペアを生成する。
<11、21><11、22><11、23>
<12、21><12、22><12、23>
<11、24><12、24>
<12、25>
<13、25>
※ストリームバッファ102からイベント21、22、23、24を削除
【0046】
(S9)図11は、ストリームバッファ101にイベント14が入力された時の説明図である。
イベント14と、イベント25との間の時刻印差は、3秒であり、時間閾値2秒よりも大きい。そのために、イベント25をストリームバッファ102から削除する。
※ストリームバッファ102からイベント25を削除
【0047】
(S10)図12は、ストリームバッファ102にイベント26が入力された時の説明図である。
イベント26と、イベント12との間の時刻印差は、4秒であり、時間閾値2秒よりも大きい。そのために、イベント12をストリームバッファ101から削除する。
一方で、イベント26と、イベント13、14との間の時刻印差は、1秒、0秒であり、時間閾値2秒以下である。そのために、イベント26と、イベント13、14それぞれとのペアを生成する。
<11、21><11、22><11、23>
<12、21><12、22><12、23>
<11、24><12、24>
<12、25>
<13、25>
<13、26><14、26>
※ストリームバッファ101からイベント12を削除
【0048】
(S11)図13は、ストリームバッファ102にイベント27が入力された時の説明図である。
イベント27と、イベント13、14との間の時刻印差は、1秒、0秒であり、時間閾値2秒以下である。そのために、イベント27と、イベント13、14それぞれとのペアを生成する。
<11、21><11、22><11、23>
<12、21><12、22><12、23>
<11、24><12、24>
<12、25>
<13、25>
<13、26><14、26>
<13、27><14、27>
【0049】
(S12)図14は、ストリームバッファ102にイベント28が入力された時の説明図である。
イベント28と、イベント13との間の時刻印差は、3秒であり、時間閾値2秒よりも大きい。そのために、イベント13をストリームバッファ101から削除する。
一方で、イベント28と、イベント14との間の時刻印差は、2秒であり、時間閾値2秒以下である。そのために、イベント28とイベント14とのペアを生成する。
<11、21><11、22><11、23>
<12、21><12、22><12、23>
<11、24><12、24>
<12、25>
<13、25>
<13、26><14、26>
<13、27><14、27>
<14、28>
※ストリームバッファ101からイベント13を削除
【0050】
(S13)図15は、ストリームバッファ101にイベント15が入力された時の説明図である。
イベント15と、イベント26、27、28との間の時刻印差は、5秒、5秒、3秒であり、時間閾値2秒よりも大きい。そのために、イベント26、27、28をストリームバッファ102から削除する。
※ストリームバッファ102から、イベント26、27、28を削除
【0051】
(S14)図16は、ストリームバッファ102にイベント29が入力された時の説明図である。
イベント29と、イベント14との間の時刻印差は、5秒であり、時間閾値2秒よりも大きい。そのために、イベント14をストリームバッファ101から削除する。
一方で、イベント29と、イベント15との間の時刻印差は、0秒であり、時間閾値2秒以下である。そのために、イベント29とイベント15とのペアを生成する。
<11、21><11、22><11、23>
<12、21><12、22><12、23>
<11、24><12、24>
<12、25>
<13、25>
<13、26><14、26>
<13、27><14、27>
<14、28>
<15、29>
※ストリームバッファ101からイベント14を削除
【0052】
図17は、イベント同士の相関度を表す説明図である。
【0053】
図17(a)は、第1のイベント(識別子id11、識別子id12)に対して各第2のイベントを組み合わせたイベントペアのリストとである。
【0054】
図17(b)は、第1のイベント(識別子id11、識別子id12)に対する各第2のイベントの出現頻度である。第1のイベントの識別子id11に対して、出現頻度の最も高い第2のイベントの識別子はid21である。また、第1のイベントの識別子id12について、出現頻度の最も高い第2のイベントの識別子はid22である。イベントペアが生成される都度、その識別子の組み合わせの出現頻度が更新される。逆に、第2のイベントに対する各第1のイベントをの出現頻度を算出するものであってもよい。
【0055】
図17(c)は、出現頻度が多い順に、第1のイベントと第2のイベントとのイベントペアを並べたものである。ここでは、イベントペア<id12、id22>が最も出現頻度が高いことが認識される。
【0056】
尚、図17によれば、相関度をイベントペアの出現頻度として説明したが、イベント同士の時刻印差を考慮して重み付けるものであってもよい。例えば、時刻印差によって以下のように、出現頻度に加算する。
時刻印差0: 増分する出現頻度=1
時刻印差1: 増分する出現頻度=0.7
時刻印差2: 増分する出現頻度=0.4
即ち、時刻印差が小さいほど出現頻度の評価が高く、時刻印差が大きいほど出現頻度の評価が低くなるようにする。
【0057】
相関度算出部14について、第1のイベントと第2のイベントとの間の相関度は、以下のように算出されることも好ましい。
第1のイベント及び第2のイベントのイベントペアの出現頻度/
((第1のイベントを一方に含むイベントペアの出現頻度)+
(第2のイベントを一方に含むイベントペアの出現頻度)−
(第1のイベント及び第2のイベントのイベントペアの出現頻度))
出現頻度が多いイベント(識別子)ほど、偶発的な発生時刻の一致又は近接による識別子の組み合わせが出現しやすい。その影響を軽減すべく、上述の式のように比率を算出する。
【0058】
以上、詳細に説明したように、本発明の情報統合プログラム、装置及び方法によれば、異なる種類のイベント同士の相関度を、リアルタイムに且つ少ないメモリサイズで導出することができる。
【0059】
本発明によれば、識別子の組み合わせの出現頻度を逐次更新するために、時間経過に伴って、偶発的な識別子の組み合わせの出現の影響が小さくなり、イベントペアの精度が改善する。従って、その時点で、最良のイベントペアを出力することができる。また、閾値以下のタプルのみをメモリ上に保存するため、必要なメモリサイズが小さくなる。更に、イベントペアに要するループ回数もメモリ上に保存されたタプル数に制限されるため、処理時間も短縮できる。
【0060】
本発明によれば、複数の情報源に存在する同一の原因に基づくイベントを対応付ける。複数の情報源に対応する複数のストリームバッファ上に、識別子及び発生時刻(時刻印)から構成されるタプルが到着し、これらタプルの時刻印差が閾値以下のイベントペアが出力される。イベントペアの組み合わせに対する出現頻度を評価し、出現頻度が高い識別子の組み合わせを抽出することができる。
【0061】
複数の異なる情報源としては、精度や粒度の異なる位置情報や、異なる複数の事業者間のデータベース連携に有効である。例えば、複数の事業者間のデータベース連携としては、例えば、レコメンデーションサービスや障害原因の分析等に活用できる。
【0062】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0063】
1 情報統合装置
101 第1のストリームバッファ
102 第2のストリームバッファ
11 イベント削除部
12 イベント取得部
13 イベントペア生成部
14 相関度算出部
15 統合イベント選択部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17