特許第6875702号(P6875702)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 大学共同利用機関法人情報・システム研究機構の特許一覧

特許6875702ネットワーク評価方法、ネットワーク評価装置及びプログラム
<>
  • 特許6875702-ネットワーク評価方法、ネットワーク評価装置及びプログラム 図000019
  • 特許6875702-ネットワーク評価方法、ネットワーク評価装置及びプログラム 図000020
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6875702
(24)【登録日】2021年4月27日
(45)【発行日】2021年5月26日
(54)【発明の名称】ネットワーク評価方法、ネットワーク評価装置及びプログラム
(51)【国際特許分類】
   G06F 11/07 20060101AFI20210517BHJP
   G06F 11/34 20060101ALI20210517BHJP
   G06F 11/30 20060101ALI20210517BHJP
【FI】
   G06F11/07 151
   G06F11/34 176
   G06F11/30 140A
   G06F11/07 140A
   G06F11/34 147
【請求項の数】5
【全頁数】14
(21)【出願番号】特願2017-180126(P2017-180126)
(22)【出願日】2017年9月20日
(65)【公開番号】特開2019-57028(P2019-57028A)
(43)【公開日】2019年4月11日
【審査請求日】2019年12月10日
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(73)【特許権者】
【識別番号】504202472
【氏名又は名称】大学共同利用機関法人情報・システム研究機構
(74)【代理人】
【識別番号】100119677
【弁理士】
【氏名又は名称】岡田 賢治
(74)【代理人】
【識別番号】100115794
【弁理士】
【氏名又は名称】今下 勝博
(72)【発明者】
【氏名】川幡 太一
(72)【発明者】
【氏名】坂井田 規夫
(72)【発明者】
【氏名】谷口 篤
(72)【発明者】
【氏名】南 勇貴
(72)【発明者】
【氏名】栗本 崇
(72)【発明者】
【氏名】漆谷 重雄
(72)【発明者】
【氏名】山田 博司
【審査官】 渡部 博樹
(56)【参考文献】
【文献】 特開2017−050715(JP,A)
【文献】 米国特許出願公開第2015/0205690(US,A1)
【文献】 MIYAZAWA Masanori, HAYASHI Michiaki, STADLER Rolf,"vNMF: Distributed Fault Detection using Clustering Approach for Network Function Virtualization",2015 IFIP/IEEE International Symposium on Integrated Network Management,P.640-645
(58)【調査した分野】(Int.Cl.,DB名)
G06F 11/07
G06F 11/30
G06F 11/34
(57)【特許請求の範囲】
【請求項1】
オペレーティングシステム(OS)のカーネル空間において、
ネットワークのサービスを構成するネットワーク機能毎に、所定の計測間隔Tで各ネットワーク資源iを計測した計測値を、前記ネットワーク資源i毎に計測開始時刻から現在時刻までの計測カウンタ量tと時間を計測間隔Tで規格化した周期T(T={T,T,・・・,T,・・・,Tν}、TはTu−1で割り切れる値、νは任意の自然数、uは1以上ν以下の自然数)に応じたメモリ位置に格納する計測蓄積手順と、
u=1の場合に、前記計測蓄積手順でそれぞれのメモリ位置に格納した前記計測値を取り出し、予め設定されたネットワーク資源iの性質jを算出する関数fを使って抽出資源量Rを計算し、ネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tに応じたメモリ位置に格納する第1段階圧縮ステップ、及び
u>1の場合に、第u−1段階圧縮手順でそれぞれのメモリ位置に格納した前記抽出資源量Rを取り出し、予め設定されたネットワーク資源iの性質jの抽出資源量Rを束ねる関数Fを使って計算した値をネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tu+1に応じたメモリ位置に格納する第u段階圧縮ステップ、
を有し、u>1の場合にu=νまで前記第u段階圧縮ステップを繰り返すデータ形成手順と、
前記データ形成手順で各メモリ位置に格納した周期Tにおける値からクラスタリング学習し、クラスタ座標を計算する座標作成手順と、
前記座標作成手順で計算したクラスタ座標とネットワーク機能の性能指標pとの比較を行う機能評価手順と、
を行うことを特徴とするネットワーク評価方法。
【請求項2】
全ての前記ネットワーク機能についての前記座標作成手順で計算した前記クラスタ座標を収集して多次元ベクトルを作成し、前記多次元ベクトルからクラスタリング学習し、サービス指標qとの比較を行うサービス評価手順をさらに行うことを特徴とする請求項1に記載のネットワーク評価方法。
【請求項3】
オペレーティングシステム(OS)のカーネル空間に、
ネットワークのサービスを構成するネットワーク機能毎に、所定の計測間隔Tで各ネットワーク資源iを計測した計測値を、前記ネットワーク資源i毎に計測開始時刻から現在時刻までの計測カウンタ量tと時間を計測間隔Tで規格化した周期T(T={T,T,・・・,T,・・・,Tν}、TはTu−1で割り切れる値、νは任意の自然数、uは1以上ν以下の自然数)に応じたメモリ位置に格納する計測蓄積手段と、
u=1の場合に、前記計測蓄積手段がそれぞれのメモリ位置に格納した前記計測値を取り出し、予め設定されたネットワーク資源iの性質jを算出する関数fを使って抽出資源量Rを計算し、ネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tに応じたメモリ位置に格納する第1段階圧縮機能、及び
u>1の場合に、第u−1段階圧縮機能がそれぞれのメモリ位置に格納した前記抽出資源量Rを取り出し、予め設定されたネットワーク資源iの性質jの抽出資源量Rを束ねる関数Fを使って計算した値をネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tu+1に応じたメモリ位置に格納する圧縮を行う第u段階圧縮機能、
を有し、u>1の場合に前記第u段階圧縮機能がu=νまで前記圧縮を繰り返すデータ形成手段と、
前記データ形成手段が各メモリ位置に格納した周期Tにおける値からクラスタリング学習し、クラスタ座標を計算する座標作成手段と、
前記座標作成手段が計算したクラスタ座標とネットワーク機能の性能指標pとの比較を行う機能評価手段と、
を形成する制御部を備えるネットワーク評価装置。
【請求項4】
全ての前記ネットワーク機能についての前記座標作成手段が計算した前記クラスタ座標を収集して多次元ベクトルを作成する計測値収集手段と、
前記計測値収集手段が作成した前記多次元ベクトルからクラスタリング学習する学習手段と、
前記学習手段がクラスタリング学習した結果とサービス指標qとの比較を行うサービス評価手段と、
をさらに備えることを特徴とするネットワーク評価装置。
【請求項5】
請求項1又は2に記載のネットワーク評価方法をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ネットワークサービスの異常を検知するためのクラスタリング学習に関する。
【背景技術】
【0002】
近年、ネットワークサービスは、PaaS(Platform as a Service)・SaaS(Software as a Service)等の発展を受け、様々なブラックボックス型のネットワーク機能を組み合わせて構成するようになってきている。そして、物理資源や仮想資源の組み合わせが複雑化し、異常発生時の原因究明が困難化し、異常の予兆検出がより重要になってきている。例えば、サービスの通信量や資源利用量の「バースト性」がサービスの異常検知の重要な要素である。
【0003】
オペレーティングシステム(OS)は、従来より細かい時間間隔、より少ない資源で、その上で動作する機能の資源利用量や性能をより自由な方法で計測が可能になり始めている。例えば、Linux(登録商標)では、従来はperfやstraceのような、固定的な性能測定しかできない機能しか無かった。しかし近年ではBerkeley Packet Filter(BPF)が性能の測定機能として注目されている。Berkeley Packet Filterは、当初、linux(登録商標)カーネル内において、自律的にパケットの内容を判断して破棄する機構であったが、近年、大幅に拡張され、カーネル内において様々な性能データを高い自由度で取得・計算できる機構として再整備された技術である。
【0004】
それとともに、サービスや機能の異常を学習、およびそれに基づく予測を迅速に行うための「クラスタリング学習による情報抽出」技術も発展してきている。クラスタリング学習は、機械学習技術の中でも、特に「短期・教師無し(半教師あり)」に好適な学習方法である。例えば、非特許文献1に記載されるクラスタリング学習は、サービスを構成するネットワーク機能の計測情報に対し、SOM(自己組織化マップ)によるクラスタリング学習・情報抽出が異常検知に対して有用なことを示している。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】M. Miyazawa, M. Hayashi, R. Stadler, “vNMF: Distributed Fault Detection using Clustering Approach for Network Function Virtualization”, 2015 IFIP/IEEE International Symposium on Integrated Network Management, pp. 640−645, 2015.
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、サービスの異常は、ハードウェア、ソフトウェア、ネットワーク、利用者及びそれらの複合などの様々な要因で起こる可能性があり、全てをサービス開始時から想定するのは困難である。さらに、サービスを構成する各ソフトウェアはプロプライエタリなものが主流になり、内部テストが困難なため外部からの計測でしか異常の検出できなくなってきている。
【0007】
サービスの異常を予知する外部計測データとして、上述した「バースト性(マイクロバースト)」が注目されているが、このバースト性を検知しようとすると細かい時間粒度の計測が必要となる。ところが、ネットワークの様々な資源量やその特徴量(バーストなど)を細かい時間粒度で計測しようとすると、膨大なデータを記憶空間に保存する必要があり、メモリが圧迫されるという課題がある。また、細粒度で計測データを加工するには通常、OSのカーネル空間とユーザ空間との切替が頻繁に発生してCPUコストがかかってしまい、サービス自体の資源(CPUやメモリ)を圧迫するという課題もある。
【0008】
そこで、本発明は、前記課題を解決するために、ネットワーク機能の短期的から長期的な特徴量をメモリを膨大に消費せずに抽出でき、OSのカーネル空間とユーザ空間との切替を極力少なくしつつネットワークの長期的な特徴量を学習できるネットワーク評価方法、ネットワーク評価装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために、本発明に係るネットワーク評価方法及び装置は、資源量の計測データの特徴量に対してOSのカーネル空間で長周期に圧縮しクラスタリング学習を行い、その学習結果に対してさらに長周期に圧縮しクラスタリング学習を行い、以降、同様の処理を所定回数、繰り返し実行することとした。
【0010】
具体的には、本発明に係るネットワーク評価方法は、 オペレーティングシステム(OS)のカーネル空間において、
ネットワークのサービスを構成するネットワーク機能毎に、所定の計測間隔Tで各ネットワーク資源iを計測した計測値を、前記ネットワーク資源i毎に計測開始時刻から現在時刻までの計測カウンタ量tと時間を計測間隔Tで規格化した周期T(T={T,T,・・・,T,・・・,Tν}、TはTu−1で割り切れる値、νは任意の自然数、uは1以上ν以下の自然数)に応じたメモリ位置に格納する計測蓄積手順と、
前記計測蓄積手順でそれぞれのメモリ位置に格納した前記計測値を取り出し、予め設定されたネットワーク資源iの性質jを算出する関数fを使って抽出資源量Rを計算し、ネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tに応じたメモリ位置に格納する第1段階圧縮ステップ、及び
u>1の場合に、第u−1段階圧縮手順でそれぞれのメモリ位置に格納した前記抽出資源量Rを取り出し、予め設定されたネットワーク資源iの性質jの抽出資源量Rを束ねる関数Fを使って計算した値をネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tu+1に応じたメモリ位置に格納する第u段階圧縮ステップ、
を有し、u>1の場合にu=νまで前記第u段階圧縮ステップを繰り返すデータ形成手順と、
前記データ形成手順で各メモリ位置に格納した周期Tにおける値からクラスタリング学習し、クラスタ座標を計算する座標作成手順と、
前記座標作成手順で計算したクラスタ座標とネットワーク機能の性能指標pとの比較を行う機能評価手順と、
を行うことを特徴とする。
【0011】
また、本発明に係るネットワーク評価装置は、 オペレーティングシステム(OS)のカーネル空間に、
ネットワークのサービスを構成するネットワーク機能毎に、所定の計測間隔Tで各ネットワーク資源iを計測した計測値を、前記ネットワーク資源i毎に計測開始時刻から現在時刻までの計測カウンタ量tと時間を計測間隔Tで規格化した周期T(T={T,T,・・・,T,・・・,Tν}、TはTu−1で割り切れる値、νは任意の自然数、uは1以上ν以下の自然数)に応じたメモリ位置に格納する計測蓄積手段と、
前記計測蓄積手段がそれぞれのメモリ位置に格納した前記計測値を取り出し、予め設定されたネットワーク資源iの性質jを算出する関数fを使って抽出資源量Rを計算し、ネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tに応じたメモリ位置に格納する第1段階圧縮機能、及び
u>1の場合に、第u−1段階圧縮機能がそれぞれのメモリ位置に格納した前記抽出資源量Rを取り出し、予め設定されたネットワーク資源iの性質jの抽出資源量Rを束ねる関数Fを使って計算した値をネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tu+1に応じたメモリ位置に格納する圧縮を行う第u段階圧縮機能、
を有し、u>1の場合に前記第u段階圧縮機能がu=νまで前記圧縮を繰り返すデータ形成手段と、
前記データ形成手段が各メモリ位置に格納した周期Tにおける値からクラスタリング学習し、クラスタ座標を計算する座標作成手段と、
前記座標作成手段が計算したクラスタ座標とネットワーク機能の性能指標pとの比較を行う機能評価手段と、
を形成する制御部を備える。
【0012】
本発明に係るネットワーク評価方法及び装置は、ネットワークのサービスを構成する各「ネットワーク機能」に対し、その資源(ネットワーク、CPU及びメモリ)を外部からオーバーヘッドを少ないままで計測し、計測値を全て蓄積せず、バースト性などの役立つ特徴量のみを様々な周期で蓄積してそれらのみで機械学習している。このため、メモリやCPUに大きな負担を与えることなく、資源利用量のクラスタリング学習と異常検知を行うことができる。
【0013】
従って、本発明は、ネットワーク機能の短期的から長期的な特徴量をメモリを膨大に消費せずに抽出でき、OSのカーネル空間とユーザ空間との切替を極力少なくしつつネットワークの長期的な特徴量を学習できるネットワーク評価方法及び装置を提供することができる。
【0014】
さらに、本発明に係るネットワーク評価方法は、全ての前記ネットワーク機能についての前記座標作成手順で計算した前記クラスタ座標を収集して多次元ベクトルを作成し、前記多次元ベクトルからクラスタリング学習し、サービス指標qとの比較を行うサービス評価手順をさらに行うことを特徴とする。
【0015】
また、本発明に係るネットワーク評価装置は、
全ての前記ネットワーク機能についての前記座標作成手段が計算した前記クラスタ座標を収集して多次元ベクトルを作成する計測値収集手段と、
前記計測値収集手段が作成した前記多次元ベクトルからクラスタリング学習する学習手段と、
前記学習手段がクラスタリング学習した結果とサービス指標qとの比較を行うサービス評価手段と、
をさらに備えることを特徴とする。
【0016】
本発明に係るネットワーク評価方法及び装置は、サービス全体の異常を予測・検知するためのクラスタリング学習も同様に行うことができる。
【0017】
本発明は、前記ネットワーク評価方法をコンピュータに実行させるためのプログラムである。
【発明の効果】
【0018】
本発明は、ネットワークの長期的な特徴量をメモリを消費せずに抽出でき、OSのカーネル空間とユーザ空間との切替を極力少なくしつつネットワークの長期的な特徴量を学習できるネットワーク評価方法及び装置を提供することができる。
【図面の簡単な説明】
【0019】
図1】本発明に係るネットワーク評価方法及び装置を説明する図である。
図2】本発明に係るネットワーク評価方法及び装置を説明する図である。
【発明を実施するための形態】
【0020】
添付の図面を参照して本発明の実施形態を説明する。以下に説明する実施形態は本発明の実施例であり、本発明は、以下の実施形態に制限されるものではない。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。
【0021】
(実施形態1)
図1は、本実施形態のネットワーク評価装置であって、資源から特徴量を算出、様々な周期で蓄積し、資源の特徴量の様々な周期のデータをメモリを無駄に使わずに蓄積し、得られた特徴量を個々の機能を搭載するOSでクラスタリング学習及び評価(異常検知)させる手法を説明する図である。
【0022】
本ネットワーク評価装置は、制御部11を備える。
制御部11は、オペレーティングシステム(OS)のカーネル空間12に、
ネットワークのサービスを構成するネットワーク機能13毎に、所定の計測間隔Tで各ネットワーク資源iを計測した計測値を、前記ネットワーク資源i毎に計測開始時刻から現在時刻までの計測カウンタ量tと時間を計測間隔Tで規格化した周期T(T={T,T,・・・,T,・・・,Tν}、TはTu−1で割り切れる値、νは任意の自然数、uは1以上ν以下の自然数)に応じたメモリ位置に格納する計測蓄積手段21と、
計測蓄積手段21がそれぞれのメモリ位置に格納した前記計測値を取り出し、予め設定されたネットワーク資源iの性質jを算出する関数fを使って抽出資源量Rを計算し、ネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tに応じたメモリ位置に格納する第1段階圧縮機能、及び
u>1の場合に、第u−1段階圧縮機能がそれぞれのメモリ位置に格納した前記抽出資源量Rを取り出し、予め設定されたネットワーク資源iの性質jの抽出資源量Rを束ねる関数Fを使って計算した値をネットワーク資源i、性質j、計測カウンタ量t、周期Tおよび周期Tu+1に応じたメモリ位置に格納する圧縮を行う第u段階圧縮機能、
を有し、u>1の場合に前記第u段階圧縮機能がu=νまで前記圧縮を繰り返すデータ形成手段22と、
データ形成手段22が各メモリ位置に格納した周期Tにおける値からクラスタリング学習し、クラスタ座標を計算する座標作成手段23と、
座標作成手段23が計算したクラスタ座標とネットワーク機能の性能指標pとの比較を行う機能評価手段24と、
を形成する。
【0023】
本ネットワーク評価装置は、非特許文献1の技術を一般化し、特に「バースト量」に着目してこれを機械学習可能としたものである。一般に、短期間のバースト量を計測しようとすると、計測時間間隔を極端に短くしなければならない。また、バースト量以外に、最大量、最小量及び平均量(相加、相乗及び調和)なども考慮すると、膨大なメモリが必要になる。これを避けるために、本ネットワーク評価装置は、計測値を一定期間毎に束ねて、次のレベルに送り込むことでメモリの利用量を削減している。例えば、第u段階圧縮機能がより長い周期で繰り返し行うことで、マイクロ秒単位の計測を、秒単位の学習データに変換させることができる。また、本ネットワーク評価装置は、分析をカーネル空間で行うことでCPU使用量を削減している。
【0024】
本ネットワーク評価装置で使用する変数について説明する。
[計測時刻・時間に関する変数]
計測開始時刻T:中立的な(システムのハイバネーションやスリープ等に影響されない)クロック供給システムにより提供される時刻
現在時刻T:現在の計測時刻
計測時間間隔T:計測は、TからT毎に計測する。次元は時間。
計測時間周期T:T={T,T,・・・,T,・・・,Tν}:任意の計測周期T(u∈{1,・・・,ν}) は、Tu−1で割り切れる、絶対時間をTで規格化した無次元量。
計測カウンタ量t:現在時刻Tと計測開始時刻Tの差をTで割ったもの。
【0025】
例えば、T=10:00、T=11:00、T=100ナノ秒の場合、計測カウンタ量tは360億と大きな数になる。これだけの粒度でパフォーマンス量を計測及び保存するのは非現実的である。そこで、T={16,256,4096,・・・,16777216}のように長周期に圧縮する。本ネットワーク評価装置は、計測データを長周期に圧縮してもパフォーマンスに影響する値を喪失させず、また異常状態と同時に学習させることでメモリの圧迫を防ぐことができる。
【0026】
[資源量に関する変数]
「r」:
資源(メモリ、ネットワーク及びCPU稼動量など)の種類i(i∈{1,・・・、l})の正規化された資源量
【0027】
「r」:
資源量rの性質であり、資源量rを関数f(平均値、最大値、バースト値などを求める関数)に適用した、機械学習の対象となる量である。ここで、j∈{1,・・・、m}である。
【0028】
「r」:
ネットワーク機能kにおけるrの値。ここで、k(k∈{1,・・・、n})は、ネットワークサービスにおける個々のネットワーク機能の管理番号である。なお、ネットワーク機能kはプロセス上で動く場合もあれば、コンテナやハイパーバイザのような仮想化機構の上で動作する場合もある。
【0029】
「r(t)」:
計測カウンタ量tにおけるrの値。もしr(t)の値が(エラーまたは計測装置そもそもの性能限界のために)取得できない場合は、r(t−1)、r(t−2)、r(t−3)、・・・等の過去の測値から推定又は外挿する。
【0030】
「M(pos)」:
(t)を計測カウンタ量tおよび計測周期Tに基づいて算出される適切なメモリ位置posに格納するメモリ。メモリ位置は数1で計算される。
【数1】
なお、計測蓄積手段21では、計測値をM0(t−1 mod b)に格納する。
【0031】
[特徴量(種類)抽出手段関数]
「関数(数2)」:
【数2】
ネットワーク機能kにおける種類iの資源の時間t〜tbiの間に計測された資源量(数3)から性質jの量(抽出資源量)Rを抽出計算する関数である。
【数3】
【0032】
「関数(数4)」:
【数4】
ネットワーク機能kにいて各計測期間T(u∈{1,・・・,ν})で得られた種類iの性質jの流出資源量(数5)をさらに束ねて抽出(相加平均や最大値検出等)する関数である。
【数5】
【0033】
「計測ウィンドウb」:
資源種類iにおける任意の性質の計測に必要な最小計測カウンタ量
【0034】
[性能指標変数]
「ネットワーク機能の性能指標p(t)」:
ネットワーク機能k(k∈{1,・・・,n})の計測カウンタ量tにおける性能指標(ネットワーク機能の性能指標とは、各ネットワーク機能が自己診断して与える、機能の正常性を判断する指標となるスカラ値)
【0035】
[学習・評価に関する関数]
「クラスタ学習関数(数6)」:
【数6】
計測周期計測期間T(u∈{1,・・・,ν−1})における、ネットワーク機能k(k∈{1,・・・,n})のクラスタ学習関数。クラスタ学習関数(数6)はネットワーク機能kにおけるr(i∈(1,・・・,l),j∈(1,・・・,m))を要素とする資源ベクトルを学習し、学習時点におけるクラスタ座標(数7)を返す。
【数7】
ただし、wは次元数である。
【0036】
「クラスタ学習関数(数8)」:
【数8】
クラスタ学習関数(数6)が返すクラスタ座標(数7)およびネットワーク機能kの性能指標pから、異常状態を示す座標との近傍状況を評価する関数。
【0037】
[制御内容]
制御部11が行う制御内容を説明する。
〔ステップS00;計測開始時の初期動作〕
計測開始時刻をTとする。計測開始時はすべてのメモリおよび計測カウンタ量tを0にリセットする。
【0038】
〔ステップS01;各周期における計測〕
各計測カウンタ量tにおいて(計測時間間隔T毎に)、ネットワーク機能k(計測・蓄積手段21)は各種類の資源量性能rをOSのカーネル空間で計測する。例えば、計測を行うタイミングとして、計測時間間隔Tでタイマー割込でカーネル空間に入り、計測してもよい。また、計測を行うタイミングとして、ネットワーク機能がシステムコール等によりカーネル空間に入った時に、現在時刻Tを測定し、(T−T)/Tの丸め値が前回計測時の計測カウンタ量tよりも更新されていた場合に計測し、該丸め値を新たな計測カウンタ量tとしてもよい。
【0039】
〔ステップS02;計測値格納〕
取得された各計測値は、ネットワーク機能内のメモリM(t−1 mod b)に格納される。このステップでは、対象となる各資源種類は未加工のままメモリに格納するため、性質による区分はなく、メモリの資源性質に関する添字jは0のみとなる。
【0040】
〔ステップS03;圧縮〕
データ形成手段22は、計測カウンタ量tがT∈Tで割り切れる場合、各ネットワーク機能k毎にステップS02で格納した計測値を圧縮する。具体的には、tが任意のt∈{T,・・・,Tν}で割り切れる場合、tはT∈{T,・・・,Tν}(u≦w)で割り切れる。その場合は、以下の処理を、Tの添字uが小さい順に次のステップを実行する。
〔ステップS03−1;u=1(第1段階)〕
本ステップでは、収集した資源量から性質情報を数2の関数で計算し格納する。具体的には、各資源種類iにおいて、各性質jに対して、メモリM(0)からM(b−1)までの値で数9を計算して第1段階のメモリ(数10)に格納する。
【数9】
【数10】
〔ステップS03−u;ν>u>1(第2段階以降)〕
本ステップでは、以前の段階で格納した性質情報を次の段階に伝える数4の関数で計算し格納する。具体的には、各資源種類iにおいて、各性質jに対して、前段階のメモリMu−1(0)からMu−1(T/Tu−1−1)までの値で数11を計算して、現段階のメモリ(数12)に格納する。
【数11】
【数12】
【0041】
ステップS03の具体例を説明する。b=10,T={4,16,64,・・・}で、t=112の場合のメモリ格納位置は次の通りである。
計測カウンタ量tの112は4と16で割り切れ、64で割り切れず、10で割ると2余る。従って、ステップS02において、メモリM(1)に計測値が格納される(第0段階)。ステップS03−1において、数9の関数についての値(数13)が数10のM(3)に格納される。
【数13】
さらに、ステップS03−2において、数11の関数についての値(数14)が数12のM(2)に格納される。
【数14】
【0042】
〔ステップS04;特徴量算出〕
座標作成手段(学習装置23)は、メモリM(pos)の値を全ての資源種類i∈{1,・・・,l}、性質j∈{1,・・・,m}で並べ(l×mマトリクス)、数6(数6は数15のようになる)で学習を行い、数7のクラスタ座標を得る。
【数15】
【0043】
〔ステップS05;評価〕
機能評価手段(評価装置24)は、得られたクラスタ座標を、数8で性能指標pと比較して異常値との近傍状況を評価し、異常値に近づいた場合は警告を発する。
【0044】
(実施形態1の効果)
本実施形態のネットワーク評価装置は、個々のネットワーク機能のメモリやCPUに大きな負担を与えずに、資源利用量の計測、評価、クラスタリング学習、並びに異常の検知を長周期で行うことができる。
【0045】
(実施形態2)
図2は、本実施形態のネットワーク評価装置であって、実施形態1で説明したネットワーク評価装置でクラスタリング学習させて得られた各ネットワーク機能の座標値を、サービス全体の計測装置で受信し、受信した座標値を連結して多次元ベクトルを作成し、それらに対してさらにクラスタリング学習及び評価(異常検知)させる手法を説明する図である。
【0046】
本実施形態のネットワーク評価装置は、実施形態1のネットワーク評価装置に、
全ての前記ネットワーク機能についての座標作成手段23が計算した前記クラスタ座標を収集して多次元ベクトルを作成する計測値収集手段31と、
計測値収集手段31が作成した前記多次元ベクトルからクラスタリング学習する学習手段32と、
学習手段32がクラスタリング学習した結果とサービス指標qとの比較を行うサービス評価手段33と、
をさらに備えることを特徴とする。
【0047】
本ネットワーク評価装置でさらに使用する変数について説明する。
[性能指標変数]
「サービスの性能指標q(t)」:
サービスの計測カウンタtにおける性能指標
(サービスの性能指標とは、サービスを統合管理するOS機能が算出する、サービス機能の正常性を判断する指標となるスカラ値)
【0048】
[学習・評価に関する関数]
「サービスクラスタ学習関数(数16)」:
【数16】
計測周期計測期間T(u∈{1,・・・,ν−1})における、各ネットワーク機能k(k∈{1,・・・,n})の学習で得た各クラスタ座標cをさらに学習し、所属クラスタ座標{sc,sc,・・・,sc}(xは次元数)を返すサービスのクラスタ学習関数。
【0049】
「クラスタ学習関数(数17)」:
【数17】
サービスのクラスタ学習関数(数16)が返す所属クラスタ座標{sc,sc,・・・,sc}およびサービスの性能指標qから、異常状態を示す座標との近傍状況を評価する関数。
【0050】
本ネットワーク評価装置の動作を説明する。
〔ステップS06;データ転送〕
データ送出手段25は、学習装置23で得られたクラスタ座標をサービス全体のクラスタ学習を行う装置100に送信する。装置100の計測値収集手段31は、各ネットワーク機能k(∈{1,・・・,n})から、計測周期Tのタイミングτ(τ mod T=0)で送信されるクラスタ座標{sc,sc,・・・,sc}(τ)および各ネットワーク機能kの性能指標p(τ)を受信する。ただし、Tが通信時間に比べて短すぎる場合は、クラスタ座標と性能指数の受信を省略して良い。計測値収集手段31は、受信したクラスタ座標と性能指数から多次元ベクトルを作成する。
【0051】
〔ステップS07;クラスタリング学習〕
装置100の学習手段32は、全多次元ベクトル群から、計測周期Tで受信されるクラスタ座標を数16で評価し、さらなるクラスタ座標{sc,sc,・・・,sc}を得る。
【0052】
〔ステップS08;評価〕
装置100のサービス評価手段33は、数17を用いて学習手段32で得られたクラスタ座標とサービスの性能指標qとから、異常値との近傍状況を評価し、異常値に近づいた場合は警告を発する。また、サービス評価手段33は、各ネットワーク機能kの性能指標pに悪化が見られる場合は、サービスの依存関係を示すグラフ(一般にDAG(有向非巡回グラフ))における、頂点ノードとなるネットワーク機能k(∈{1,・・・,n})を求め、そのkにおいて異常が発生している旨を警告する。
【0053】
(実施形態2の効果)
本実施形態のネットワーク評価装置は、サービス全体の異常を予測及び検知するためのクラスタリング学習も実施形態1と同様に行うことができる。
【実施例】
【0054】
実施形態で説明した変数や関数についての具体例を以下に述べる。
ネットワークサービスは、すべて互いに同じ種類の資源量を計測及び蓄積する計測蓄積手段21を備えるn個のネットワーク機能k(∈{1,・・・,n})から構成される。
:メモリ使用量
:メモリの平均値
:メモリのバースト利用量
:メモリの最大利用量
(・・・):計測ウィンドウにあるメモリ使用量データの相加平均値を算出する関数
(・・・):計測ウィンドウにあるメモリ使用量データのバースト量を算出する関数
(・・・):fで得られた値の任意個数の引数の相加平均値を算出する関数
(・・・):fで得られた値の任意個数の引数の最大値を選ぶ関数
:ネットワーク利用量
:CPU利用量
:1マイクロ秒
={4,16,64,256,1024,4096,16384,65536,262144,1048576}:4マイクロ秒から約1秒(1.048576秒)の10段階の計測周期
:i=1,2,3において、全て10(T)分のメモリ量
(r,r,r,r,r)(u=1,・・・,10):引数に対して、クラスタリング学習による情報抽出器(SOM(自己組織化地図)やPCA(主成分分析)など、以下情報抽出器)に基づく10段階分のクラスタリング学習を行い、クラスタ座標{c,c}を返す10個の関数
(c,c,p)(u=1,・・・,10):引数に対して、情報抽出器に基づくクラスタリングで、異常値を記憶し、近傍異常中心値との距離計測を行い、異常状態からの距離および移動ベクトルを計測する10段階分の10個の関数
SL(c,c)(u=1,・・・,10):Lと同様に情報抽出器によるクラスタリング学習を、ネットワーク機能で構成するサービス全体に対して行う10段階分の10個の関数。クラスタ座標{SC,SC}を返す。
SD(sc,sc,q)(u=1,・・・,10):Dと同様に情報抽出器によるクラスタリングで、異常値の近傍評価を、ネットワーク機能で構成するサービス全体に対して行う10段階分の10個の関数。
【符号の説明】
【0055】
11:制御部
12:カーネル空間
13:ネットワーク機能
21:計測蓄積手段
22:データ形成手段
23:学習手段
24:評価手段
25:データ送出手段
31:計測値収集手段
32:学習手段
33:評価手段
100:装置
図1
図2