特開2022-37311 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 学校法人　東洋大学の特許一覧

特開2022-37311サーバ装置、方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022037311

(43)【公開日】2022-03-09

(54)【発明の名称】サーバ装置、方法及びプログラム

(51)【国際特許分類】

H04L 43/00 20220101AFI20220302BHJP

【ＦＩ】

H04L12/70 100Z

【審査請求】未請求

【請求項の数】7

【出願形態】ＯＬ

(21)【出願番号】P 2020141372

(22)【出願日】2020-08-25

(71)【出願人】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(71)【出願人】

【識別番号】501061319

【氏名又は名称】学校法人東洋大学

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100124844

【弁理士】

【氏名又は名称】石原隆治

(72)【発明者】

【氏名】田尻兼悟

(72)【発明者】

【氏名】川原亮一

【テーマコード（参考）】

5K030

【Ｆターム（参考）】

5K030GA11

5K030HD03

5K030JA10

5K030LE03

5K030MB09

5K030MC07

5K030MC08

(57)【要約】

【課題】ネットワークオペレーションタスクを機械学習により実現する際に、処理速度及び精度を最適化する負荷分散を実現すること。
【解決手段】一実施形態に係るサーバ装置は、ルータ及びエッジサーバと接続されるサーバ装置であって、目標とする転送遅延時間に関する制約条件と通信ネットワークの帯域に関する制約条件の下で、所定の機械学習タスクの学習用データのデータ量と前記ルータにおけるデータのサンプリングレートと前記ルータでサンプリングされたデータを前記エッジサーバ又は前記サーバ装置のいずれに転送するかの比率とに関して定式化された最適化問題を解くことで、前記学習用データのデータ量を最大化する前記サンプリングレートと前記比率とを計算する計算部と、前記計算部で計算された前記サンプリングレートと前記比率とを前記ルータに送信する送信部と、を有することを特徴とする。
【選択図】図１

【特許請求の範囲】

【請求項1】

ルータ及びエッジサーバと接続されるサーバ装置であって、
目標とする転送遅延時間に関する制約条件と通信ネットワークの帯域に関する制約条件の下で、所定の機械学習タスクの学習用データのデータ量と前記ルータにおけるデータのサンプリングレートと前記ルータでサンプリングされたデータを前記エッジサーバ又は前記サーバ装置のいずれに転送するかの比率とに関して定式化された最適化問題を解くことで、前記学習用データのデータ量を最大化する前記サンプリングレートと前記比率とを計算する計算部と、
前記計算部で計算された前記サンプリングレートと前記比率とを前記ルータに送信する送信部と、
を有することを特徴とするサーバ装置。

【請求項2】

前記最大化された前記学習用データのデータ量を用いて、前記機械学習タスクを実現する機械学習モデルの精度を推定する精度推定部を有する、ことを特徴とする請求項１に記載のサーバ装置。

【請求項3】

前記精度推定部で推定された精度と前記機械学習モデルの実際の精度との差を用いて、前記精度推定部によって前記機械学習モデルの精度を推定する際のパラメータ値を調節する調節部を有することを特徴とする請求項２に記載のサーバ装置。

【請求項4】

予め設定された学習周期の間に前記ルータでサンプリングされたデータから作成された学習用データを用いて、前記機械学習タスクを実現する機械学習モデルの学習を行う学習部と、
前記学習部で学習された前記機械学習モデルを前記エッジサーバに配布する配布部と、
を有することを特徴とする請求項１乃至３の何れか一項に記載のサーバ装置。

【請求項5】

前記計算部は、
前記ルータにおける前記帯域の測定結果と前記エッジサーバで前記データから前記学習用データを作成する際の圧縮率の計算結果とを用いて、前記最適化問題を解き直し、前記サンプリングレートと前記比率とを再計算する、ことを特徴とする請求項１乃至４の何れか一項に記載のサーバ装置。

【請求項6】

ルータ及びエッジサーバと接続されるサーバ装置が、
目標とする転送遅延時間に関する制約条件と通信ネットワークの帯域に関する制約条件の下で、所定の機械学習タスクの学習用データのデータ量と前記ルータにおけるデータのサンプリングレートと前記ルータでサンプリングされたデータを前記エッジサーバ又は前記サーバ装置のいずれに転送するかの比率とに関して定式化された最適化問題を解くことで、前記学習用データのデータ量を最大化する前記サンプリングレートと前記比率とを計算する計算手順と、
前記計算手順で計算された前記サンプリングレートと前記比率とを前記ルータに送信する送信部と、
を実行することを特徴とする方法。

【請求項7】

コンピュータを、請求項１乃至５の何れか一項に記載のサーバ装置として機能させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、サーバ装置、方法及びプログラムに関する。

【背景技術】

【0002】

機械学習技術によりネットワークオペレーションタスクを実現することが従来から行われている。また、近年では、機械学習技術で要求される各種機能を仮想ネットワーク上に配置する研究も進められている。このような機能としては、生データを特定の機器に送信する「転送機能」、生データをテーブルデータに整形する「前処理機能」、前処理されたデータを蓄積する「データベース」、データベース内のデータを用いて機械学習モデルを学習する「学習機能」、学習済み機械学習モデルにより特定のネットワークオペレーションタスク（例えば、ネットワーク監視タスク等）を実施する「実施機能」等がある。

【0003】

上記の機能を仮想ネットワーク上に配置する際には同一機能を複数配置することも可能であり、この場合、各種機能に関する処理の負荷分散をどのように行うのが適切なのかが問題となる。これは、負荷分散の仕方によってデータ転送に要する時間やそれに伴う単位時間あたりに利用可能なデータ量等に差が生じ、その結果、学習機能や実施機能の処理速度と機械学習モデルの精度に影響が生じるためである。

【0004】

負荷分散方式の従来技術として、例えば、非特許文献１では、画像分析を行う際に、画像からテキストを得るための前処理を分散して行うことで、画像分析の処理速度を最適にする負荷分散方式が提案されている。

【先行技術文献】

【非特許文献】

【0005】

【非特許文献1】R. Shinkuma, S. Kato, M. Kanbayashi, Y. Ikeda, R. Kawahara, and T. Hayashi, "System Design for Predictive Road-Traffic Information Delivery using Edge-Cloud Computing," IEEE CCNC 2018, Jan. 2018.

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、従来の負荷分散方式では、データの転送方式に依存する詳細な転送速度も含めた処理速度や機械学習モデルの精度については考慮されていなかった。

【0007】

本発明の一実施形態は、上記の点に鑑みてなされたもので、ネットワークオペレーションタスクを機械学習により実現する際に、処理速度及び精度を最適化する負荷分散を実現することを目的とする。

【課題を解決するための手段】

【0008】

上記目的を達成するため、一実施形態に係るサーバ装置は、ルータ及びエッジサーバと接続されるサーバ装置であって、目標とする転送遅延時間に関する制約条件と通信ネットワークの帯域に関する制約条件の下で、所定の機械学習タスクの学習用データのデータ量と前記ルータにおけるデータのサンプリングレートと前記ルータでサンプリングされたデータを前記エッジサーバ又は前記サーバ装置のいずれに転送するかの比率とに関して定式化された最適化問題を解くことで、前記学習用データのデータ量を最大化する前記サンプリングレートと前記比率とを計算する計算部と、前記計算部で計算された前記サンプリングレートと前記比率とを前記ルータに送信する送信部と、を有することを特徴とする。

【発明の効果】

【0009】

ネットワークオペレーションタスクを機械学習により実現する際に、処理速度及び精度を最適化する負荷分散を実現することができる。

【図面の簡単な説明】

【0010】

【図1】本実施形態に係る通信ネットワークシステムの全体構成の一例を示す図である。

【図2】実運用開始前の最適負荷分散決定及び精度推定処理の流れの一例を示すフローチャートである。

【図3】実運用後の異常検知実施処理の流れの一例を示すフローチャートである。

【図4】実運用後の異常検知モデル構築処理の流れの一例を示すフローチャートである。

【図5】実運用後の処理速度算出用のパラメータ調節処理の流れの一例を示すフローチャートである。

【図6】実運用後の精度推定用のパラメータ調節処理の流れの一例を示すフローチャートである。

【図7】総検知時間と学習用データ収集時間の関係を説明するための図である。

【図8】コンピュータのハードウェア構成の一例を示す図である。

【発明を実施するための形態】

【0011】

以下、本発明の一実施形態について説明する。本実施形態では、ネットワークオペレーションタスクの一例として異常検知タスク（つまり、異常トラヒックを検知するタスク）を想定し、機械学習モデルにより異常検知を実現する際に、異常検知タスクの処理速度及び精度を最適化する負荷分散を実現可能な通信ネットワークシステム１について説明する。

【0012】

＜通信ネットワークシステム１の全体構成＞
まず、本実施形態に係る通信ネットワークシステム１の全体構成について、図１を参照しながら説明する。図１は、本実施形態に係る通信ネットワークシステム１の全体構成の一例を示す図である。

【0013】

図１に示すように、本実施形態に係る通信ネットワークシステム１には、クラウドサーバ１０と、１以上のエッジサーバ２０と、１以上のルータ３０とが含まれる。これらのクラウドサーバ１０、エッジサーバ２０及びルータ３０は、例えば、ＮＦＶ（Network Functions Virtualization）等のネットワーク仮想化技術により各種機能を汎用サーバや機器等のコンピュータ上に配置することで実現される。

【0014】

ここで、本実施形態に係るクラウドサーバ１０は通信ネットワークシステム１のクラウド側に配置されるサーバであり、機能部として、収集部１０１と、転送部１０２と、前処理部１０３と、実施部１０４と、監視部１０５と、学習部１０６と、計算部１０７と、ＤＢ（データベース）１０８とを有する。収集部１０１は、エッジサーバ２０やルータ３０から転送されたデータを収集する。転送部１０２は、異常検知タスクの処理速度及び精度を最適化する負荷分散を実現するためパラメータを各ルータ３０に送信したり、学習済み機械学習モデルを各エッジサーバ２０に配布したりする。前処理部１０３は、ルータ３０から転送されたデータに対して前処理を行う。実施部１０４は、学習済み機械学習モデルによりネットワークオペレーションタスク（本実施形態では異常検知タスク）を実施する。監視部１０５は、通信ネットワークの各種情報（例えば、帯域等）を監視及び測定する。学習部１０６は、ＤＢ１０８に蓄積されているデータを学習用データとして機械学習モデルの学習を行う。計算部１０７は、異常検知タスクの処理速度及び精度を最適化する負荷分散を実現するためのパラメータを計算する。ＤＢ１０８は、前処理後のデータを蓄積する。

【0015】

また、本実施形態に係るエッジサーバ２０は通信ネットワークシステム１のエッジ側に配置されるサーバであり、機能部として、収集部２０１と、転送部２０２と、前処理部２０３と、実施部２０４と、監視部２０５と、ＤＢ２０６とを有する。収集部２０１は、ルータ３０から転送されたデータを収集する。転送部２０２は、ＤＢ２０６に蓄積されているデータをクラウドサーバ１０に転送する。前処理部２０３は、ルータ３０から転送されたデータに対して前処理を行う。実施部２０４は、クラウドサーバ１０から配布された学習済み機械学習モデルによりネットワークオペレーションタスク（本実施形態では異常検知タスク）を実施する。監視部２０５は、通信ネットワークの各種情報（例えば、帯域等）を監視及び測定する。ＤＢ２０６は前処理後のデータを蓄積する。

【0016】

更に、本実施形態に係るルータ３０は、機能部として、収集部３０１と、転送部３０２と、監視部３０３とを有する。収集部３０１は、当該ルータ３０宛のデータを収集する。転送部３０２は、クラウドサーバ１０から送信されたパラメータに従って、データをクラウドサーバ１０又はエッジサーバ２０に転送する。監視部３０３は、通信ネットワークの各種情報（例えば、帯域等）を監視及び測定する。

【0017】

＜異常検知タスクの処理速度及び精度を最適化する負荷分散の定式化＞
本実施形態では、異常検知タスクの処理速度及び精度を最適化するために、クラウドサーバ１０の前処理部１０３とエッジサーバ２０の前処理部２０３とに対してどのように負荷分散を行うかという問題を定式化する。そこで、以降では、処理速度及び機械学習モデルの精度推定の理論式の算出方法とそれらを用いた負荷分散方式の決定方法について説明する。なお、処理速度に関する箇所と機械学習モデルの精度推定に関する箇所における記号の使用はそれぞれ独立であるものとし、記号間に関連がある場合のみその都度説明するものとする。

【0018】

本実施形態では、ネットワークオペレーションタスクとして異常検知タスクを想定しているため、生データとしてNetFlowを想定してモデル化（定式化）を行った。モデル化においては、上記の非特許文献１や参考文献１「新熊亮一, 林田尚之, 池田泰弘, 田尻兼悟, 川原亮一, "リアルタイム予測情報配信のためのエッジ-クラウド連携システムのモデル化の検討," 信学技報, vol. 117, no. 390, MoNA2017-44, pp. 19-23, 2018年1月.」に基づいて、本実施形態で想定するNetFlowデータを対象にしたモデル化を行う。以降では、ルータ３０にてサンプリングされた個々のフロー情報のことを「NetFlowフロー」又は単に「フロー」と呼び、それら複数のフロー情報をまとめて一つのパケットとしたものを「NetFlowデータ」又は「NetFlowデータパケット」と呼ぶことにする。

【0019】

NetFlowは各ルータ３０の監視部３０３で測定される。また、各ルータ３０の転送部３０２は、予め設定されたパラメータｒ（負荷分散の比率を表すパラメータｒ）を用いて、NetFlowデータパケットをクラウドサーバ１０又は最寄りのエッジサーバ２０に転送（具体的には、比率ｒでクラウドサーバ１０に転送し、比率１－ｒで最寄りのエッジサーバ２０に転送）する。そして、クラウドサーバ１０では、ルータ３０から転送されたNetFlowデータパケットの前処理が前処理部１０３により行われ、ＤＢ１０８に蓄積される。一方で、エッジサーバ２０でも、ルータ３０から転送されたNetFlowデータパケットの前処理が前処理部２０３により行われ、ＤＢ２０６に蓄積される。なお、ＤＢ２０６に蓄積されている前処理後のNetFlowデータパケット（以下、単に「前処理後データ」ともいう。）は転送部２０２により定期的又はリアルタイムにクラウドサーバ１０に転送され、クラウドサーバ１０のＤＢ１０８に蓄積される。

【0020】

また、前処理とはNetFlowデータパケットから機械学習に用いられる特徴ベクトルを生成する処理のことであり、クラウドサーバ１０及び各エッジサーバ２０は特徴ベクトルを生成するための共通のテンプレートを保持しているものとする。つまり、本実施形態における前処理後データは、１又は複数のNetFlowデータパケットから生成された特徴ベクトルのことである。なお、特徴ベクトルは、例えば、NetFlowデータパケットのsrcIP（送信元ＩＰアドレス）毎に定義されることを想定する。

【0021】

≪処理速度の算出≫
クラウドサーバ１０の実施部１０４と各エッジサーバ２０の実施部２０４による異常検知は、前処理部１０３又は前処理部２０３によって特徴ベクトルが生成される毎に実施されるものとする。この場合、ある時刻を基準としてその時刻のトラヒック情報を含むNetFlowデータパケットで異常検知を実施するまでに要する時間は、（１）NetFlowデータパケットの転送に要する時間、（２）前処理に要する時間、（３）学習済み機械学習モデルによる異常検知に要する時間、の総和で計算される。

【0022】

クラウドサーバ１０では後述する制約付き最適化問題を計算部１０７により解くことでパラメータｐ及びｒを算出し、このパラメータｐ及びｒを転送部１０２により各ルータ３０に転送する。そして、各ルータ３０ではパラメータｐ（後述するパケットサンプリングレート）に応じてNetFlowデータパケットを収集部３０１により生成した後、パラメータｒに応じて、転送部３０２により比率ｒでクラウドサーバ１０にNetFlowデータパケットを転送し、比率１－ｒで最寄りのエッジサーバ２０にNetFlowデータパケットを転送する。

【0023】

ｉを各ルータ３０のインデックスとして、λ^Ｎ _ｉをルータｉでのNetFlowフロー発生率［/s］とする。

【0024】

【数1】

である。ここで、ｐはNetFlowにおけるパケットサンプリングレート、ｑ_ｊは元のフロー（つまり、サンプリング対象のフロー）においてフロー当たりのパケット数がｊである確率、λ^Ｏ _ｉはルータｉでの元のフローの発生率［/s］である。なお、上記の数１では、元のフローにおけるフロー当たりのパケット数ｊの上限としては無限大まで考慮すればよい。

【0025】

また、ｓ_ＮをNetFlowデータパケットのサイズ［bytes］、λ_ｉをルータｉでのNetFlowデータパケット発生率［/s］、λ^ｃ _ｉをルータｉでのNetFlowデータパケットのうち、クラウドサーバ１０に転送されるNetFlowデータパケットの発生率［/s］、λ^ｅ _ｉをルータｉでのNetFlowデータパケットのうち、最寄りのエッジサーバ２０に転送されるNetFlowデータパケットの発生率［/s］とする。

【0026】

参考文献２「NetFlowおよびNetFlow データエクスポートの設定，インターネット＜ＵＲＬ：https://www.cisco.com/c/ja_jp/td/docs/cian/ios/ios15-2m-t/cg/001/nf-15-2mt/cfg-nflow-data-expt.pdf＞」に記載されているように、NetFlowでは複数のフロー情報をまとめて一つのＵＤＰパケットにしてexportされる。また、NetFlow version 5を仮定した場合、参考文献３「NetFlowバージョン5のフィールドとバイト数 NetFlow Analyzer ナレッジベース，インターネット＜ＵＲＬ：https://www.manageengine.jp/support/kb/NetFlow_Analyzer/?p=1862＞」に記載されているように、NetFlowデータパケットのヘッダサイズ２３［bytes］＋NetFlowフロー当たりのレコード４７［bytes］×３０［個］＝１４３３［bytes］である。これに対して、ＵＤＰヘッダ、ＩＰヘッダ、イーサネットヘッダのヘッダサイズの合計８＋２０＋１８＝４６［bytes］を加算した１４７９［bytes］がｓ_Ｎとなる。このＵＤＰパケットが一つのNetFlowデータパケットに対応する。また、NetFlowデータパケットの発生率λ_ｉは、λ_ｉ＝λ^Ｎ _ｉ／３０となる。更に、ルータｉにおけるNetFlowデータパケットのうち、クラウドサーバ１０に転送されるNetFlowデータパケットの発生率はλ^ｃ _ｉ＝ｒλ_ｉ、最寄りのエッジサーバ２０に転送されるNetFlowデータパケットの発生率はλ^ｅ _ｉ＝（１－ｒ）λ_ｉとなる。

【0027】

ルータｉから最寄りのエッジサーバ２０までの経路上にあるリンクの集合をＬ^ｅ _ｉ、ルータｉからクラウドサーバ１０までの経路上にあるリンクの集合をＬ^ｃ _ｉとする。各データ転送にかかるエンドエンドでの転送遅延はエンドエンドでの伝搬遅延時間と経路上の各リンクでのキューイング遅延時間との和で決まる。本実施形態では、一例として、簡単のためM/M/1の待ち行列モデルを仮定し、各リンクｋでのキューイングによる平均遅延時間Ｔ_ｋを以下の式で算出する。

【0028】

【数2】

ここで、

【0029】

【数3】

である。ただし、

【0030】

【数4】

はリンクｋのNetFlowデータ利用可能帯域［bps］とする（以下、明細書のテキスト中では、Ｃ_ｋの頭上にバー「－」を付与した記号を「^－Ｃ_ｋ」とも表記する。）。つまり、リンクｋのリンク容量Ｃ_ｋから前処理後データのデータ転送に使用する帯域分（及びその他の背景トラヒック分）を引いたものを^－Ｃ_ｋとする。より詳細な定義については後述する。したがって、本実施形態はその利用可能帯域でNetFlowデータパケットの転送を制御するように帯域制御がなされているものとする。なお、本実施形態では、その他の背景トラヒックはないものと仮定する。

【0031】

最も簡単な例としては、NetFlowデータパケット毎に特徴ベクトルが生成され、その生成時間が無視できる場合（つまり、上記の（２）の前処理に要する時間が無視できる場合）、NetFlowデータパケットが発生してから異常検知を行うまでに要する時間は、上記のリンクｋでのキューイングによる平均遅延時間Ｔ_ｋ（と伝搬遅延時間ｄ_ｋ）をルータｉから最寄りのエッジサーバ２０まで加算することで得られるエンドエンド転送遅延Ｔ_ｔｒと、当該エッジサーバ２０で学習済み機械学習モデルにより異常検知を行うのに要する時間τ_ｔｅｓｔとの和となる。なお、Ｔ_ｔｒが上記の（１）のNetFlowデータパケットの転送に要する時間であり、τ_ｔｅｓｔが上記の（３）の学習済み機械学習モデルによる異常検知に要する時間である。τ_ｔｅｓｔの具体的な値（例えば、τ_ｔｅｓｔ＝１［ms］等）は予め実験等で見積もっておけばよい。なお、ここで、上記の（２）の前処理に要する時間が無視できると仮定したが、無視しない場合には上記の（２）と同様に、予め実験によりその値を見積もっておき、エンドエンド転送遅延Ｔ_ｔｒと異常検知時間τ_ｔｅｓｔの和にその値を更に加算すればよい。

【0032】

一方で、複数のNetFlowデータパケットから特徴ベクトルが生成される場合は、最初のNetFlowデータパケットがルータ３０から送信された後、特徴ベクトルの生成に必要な個数のNetFlowデータパケットがエッジサーバ２０に到着するまでに要する時間と、異常検知時間τ_ｔｅｓｔとの和が、NetFlowデータパケットが発生してから異常検知を行うまでに要する時間となる。

【0033】

ここで、エンドエンド転送遅延Ｔ_ｔｒに要求される条件として以下の式（ａ）に示す制約条件がある。

【0034】

【数5】

ただし、Ｔ^* _ｔｒは目標転送遅延時間であり、予め設定されるパラメータである。すなわち、上記の式（ａ）はリアルタイム性の制約条件を表す。なお、エッジサーバ２０ではなく、クラウドサーバ１０に転送する場合も同様にエンドエンド転送遅延Ｔ_ｔｒに要求される条件を満たす必要がある。この場合、エンドエンド転送遅延Ｔ_ｔｒは平均遅延時間Ｔ_ｋ（と伝搬遅延時間ｄ_ｋ）をルータｉからクラウドサーバ１０まで加算することで得られるものである（つまり、上記の数５の第二式のＬ^ｅ _ｉをＬ^ｃ _ｉに置き換えたものである。）。

【0035】

以上の処理速度の定式化（つまり、上記（１）～（３）の総和の定式化）において操作可能なパラメータはｐ及びｒであり、これらのパラメータｐ及びｒを操作することにより、上記の式（ａ）の制約条件（つまり、Ｔ_ｔｒがＴ^* _ｔｒを超えないという制約条件）を満たすように制御を行うことになる。

【0036】

ところで、機械学習モデルを学習する際には、学習周期τ_Ｌ（例えば、τ_Ｌ＝１［hour］等）を予め設定し、その周期内にエッジサーバｊ（ただし、ｊはエッジサーバ２０のインデックス）で前処理した前処理後データのデータ量Ｄ_ｊを以下の式により算出する。そして、このデータ量Ｄ_ｊを用いて、後述する精度推定の式により、機械学習モデルの精度（つまり、異常検知タスクの精度）を計算する。

【0037】

【数6】

ここで、α（＜１）は前処理によるデータ圧縮率、Ｓ_ｊはエッジサーバｊにNetFlowデータを送信したルータ３０のインデックスの集合である。上述したように、τ_Ｌは学習周期であり、異常検知を行う上でどれくらい最近のデータで学習しておく必要があるかという要件から決まるパラメータである。

【0038】

データ量Ｄ_ｊはサンプリングレートｐによって調整可能であり、以下の式（ｂ）に示すリンク容量の制約条件を満たすように設定する必要がある。

【0039】

【数7】

ここで、Ｌ^ｃ _ｊはエッジサーバｊからクラウドサーバ１０までの経路上にあるリンクの集合である。すなわち、上記の式（ｂ）は帯域の制約条件を表す。

【0040】

クラウドサーバ１０の学習部１０６が機械学習モデルを学習する際に利用可能なデータ量Ｄ_{ｔｏｔａｌ}（以下、「学習用データ量Ｄ_{ｔｏｔａｌ}」ともいう。）は、各エッジサーバｊから転送された前処理後データのデータ量Ｄ_ｊと、ルータｉから直接転送されたNetFlowデータに対して前処理部１０３によって前処理を行った後の前処理後データのデータ量との和である。すなわち、

【0041】

【数8】

である。なお、クラウドサーバ１０の学習部１０６によって学習された学習済み機械学習モデルは転送部１０２により各エッジサーバ２０に配布されるが、その配布頻度は低いため、その転送量は無視できるものとする。

【0042】

詳細は機械学習モデルの精度推定の式で示すが、本実施形態における精度推定の式では学習周期τ_Ｌ中に得られる学習用データ量Ｄ_{ｔｏｔａｌ}と機械学習モデルの精度とが比例する。そのため、負荷分散制御としては、上記の式（ａ）及び式（ｂ）に示す制約条件の下で、以下の式（ｃ）を満たすパラメータｐ及びｒを探索することになる。

【0043】

【数9】

すなわち、クラウドサーバ１０は、上記の式（ａ）及び式（ｂ）に示す制約条件の下で上記の式（ｃ）に示す最適化問題を計算部１０７により解くことで、最適なパラメータｐ及びｒを得る。

【0044】

これまで出てきたパラメータのうち、通信ネットワークシステム１の実際の構成（つまり、実際のネットワーク構成や設定等）に依存するパラメータは、ｑ_ｊ、λ^Ｏ _ｉ、Ｃ_ｋ及びαである。これらは実際に通信ネットワーク上で異常トラヒックを監視する運用を行った際に各ルータ３０の監視部３０３にて帯域等の情報を測定することで決定される。ただし、αはエッジサーバ２０でのみ監視可能なため、各エッジサーバ２０の監視部２０５にて決定される。この場合、パラメータｑ_ｊ、λ^Ｏ _ｉ及びＣ_ｋが転送部３０２によりクラウドサーバ１０に転送されると共に、パラメータαが転送部２０２によりクラウドサーバ１０に転送される。そして、パラメータｑ_ｊ、λ^Ｏ _ｉ、Ｃ_ｋ及びαを用いて、クラウドサーバ１０の計算部１０７にて、上記の式（ａ）及び式（ｂ）に示す制約条件の下で上記の式（ｃ）に示す最適化問題が解き直され、パラメータｐ及びｒが再決定される。このようなパラメータの調節及び再決定処理の流れについては後述する（図５）。

【0045】

≪機械学習モデルの精度推定≫
機械学習モデルの精度推定では、ＰＡＣ学習（Probability Approximately Correct learning）の理論から導出される式を用いる。ＰＡＣ学習の理論では未知のテストデータに対する学習済み機械学習モデルの推定誤差の期待値（これを汎化誤差という）の上限を、学習用データセットや機械学習モデルの属する関数クラスの大きさ等から算出する。ＰＡＣ学習では、データセットの特性や機械学習タスク等に応じて様々な汎化誤差の上限に対する理論式が提案されており、どのような式を選ぶのかについて自由度が高い。

【0046】

本実施形態では、異常検知タスクは、時系列依存を持つトラヒックデータ（ただし、本実施形態では更にトラヒックデータの定常性も仮定した）の２クラス分類問題であるという点から、参考文献４「M. Mohri and A. Rostamizadeh, "Rademacher complexity bounds for non-iid processes," NIPS2009.」に記載されている理論式を採用した。

【0047】

２クラス分類を行うための機械学習モデルとしてはカーネルＳＶＭを仮定する。各データ（つまり、学習用データ）ｘ_ｉにはラベルｙ_ｉ∈｛－１，＋１｝が与えられているとする。なお、例えば、ｙ_ｉ＝－１は異常、ｙ_ｉ＝＋１は正常を表す。

【0048】

この場合、上記の参考文献４では、いくつかの仮定の下で次の汎化誤差の式が示されている。すなわち、ある実数ａ，β_０＞０に対してβ（ａ）≦β_０ａ^－ｒが成り立ち、かつ、グラム行列Ｋに対してＴｒ［Ｋ］≦ｍＲ^２が成り立つ場合、１－δ以上の確率で任意の仮説集合ｈ∈Ｈ_Ｋに対して以下の式（ｄ）に示す不等式が成り立つ。

【0049】

【数10】

ここで、

【0050】

【数11】

である。

【0051】

上記の汎化誤差の式の詳細は上記の参考文献４を参照されたいが、以下でいくつかの記号に関して説明を加える。

【0052】

β（ａ）は以下で定義される数値であり、データの分布に依存する量である。

【0053】

任意の正の整数ａに対してβ－ｍｉｘｉｎｇ定数は以下のように定義される。

【0054】

【数12】

ここで、||・||_TVはtotal variation normであり、

【0055】

【数13】

は

【0056】

【数14】

の同時確率分布である。

【0057】

本実施形態では、β（ａ）の上限を２つのパラメータβ_０及びｒで操作する。

【0058】

ｍは学習に用いられるデータ（つまり、学習用データ）の総量であり、仮説集合Ｈ_Ｋは本実施形態ではカーネルＳＶＭの関数集合、ｈはその関数集合の中から学習により選ばれた機械学習モデル（関数）を意味する。また、

【0059】

【数15】

は経験誤差と呼ばれる量であり、学習済み機械学習モデルの学習用データに対する識別エラーにより以下のように計算される。

【0060】

【数16】

ここで、ρは経験誤差を操作するパラメータである。

【0061】

また、上記の汎化誤差の式ではｍ＝２μａが成り立っているとされ、

【0062】

【数17】

と定義されているため、

【0063】

【数18】

である。

【0064】

また、グラム行列Ｋは学習用データ及びカーネルｋによって計算される量であり、これをパラメータＲ及びデータ量ｍで上界を定める。

【0065】

以上により、上記の式（ｄ）に示す汎化誤差で調節可能なパラメータはｒ，Ｒ，β_０，ρ及びδの５つであり、これらを適切に設定して上記の式（ｄ）に示す汎化誤差の上限を計算する。なお、上述したように、処理速度の算出と機械学習モデルの精度推定とで記号の使用は独立であることに留意されたい（したがって、例えば、上記の式（ｄ）に示す汎化誤差で調整可能なパラメータｒは、処理速度の算出で説明したパラメータｒ（負荷分散の比率を表すパラメータｒ）とは無関係である。）。

【0066】

データ量ｍが処理速度の算出で述べたＤ_{ｔｏｔａｌ}に対応する。また、上記の式（ｄ）の右辺第一項目の経験誤差は実際にデータを用いて計算される量であるため、上記の式（ｄ）に示す汎化誤差の式を、
（汎化誤差）≦（経験誤差）＋（第二項目）＋（第三項目）
とみなし、第二項目及び第三項目を計算することで機械学習モデルの精度に対する評価を行う。

【0067】

したがって、クラウドサーバ１０の計算部１０７にて、上記の式（ｃ）に示す最適化問題を解くことで得られたＤ_{ｔｏｔａｌ}をｍに代入して、上記の式（ｄ）の第二項目及び第三項目を計算することで機械学習モデルの精度を推定する。

【0068】

上記のパラメータｒ，Ｒ，β_０，ρ及びδのうちδは上記の式（ｃ）に示す汎化誤差が右辺を超えない確率であり、制約条件のパラメータであるため予め決定しておく。その他のパラメータについては、実際に異常検知を行った場合の精度（実精度）と推定された精度（推定精度）との評価を行い、予め設定された閾値ｈよりも推定精度－実精度が大きい場合は当該閾値ｈを下回るようにパラメータｒ，Ｒ，β_０及びρを調節するようにする。このようなパラメータｒ，Ｒ，β_０及びρの調節処理の流れについては後述する（図６）。

【0069】

＜各種処理の流れ＞
次に、本実施形態に係る通信ネットワークシステム１が実行する各種処理の流れについて説明する。

【0070】

≪最適負荷分散決定及び精度推定処理≫
まず、実運用開始前に実行される最適負荷分散決定及び精度推定処理の流れについて、図２を参照しながら説明する。図２は、実運用開始前の最適負荷分散決定及び精度推定処理の流れの一例を示すフローチャートである。なお、以降では、通信ネットワーク上に各種機能が配置され、図１に示す通信ネットワークシステム１が実現されているものとする。

【0071】

まず、クラウドサーバ１０の計算部１０７は、各種パラメータのうち、処理速度算出用のパラメータｐ及びｒと精度推定用のパラメータｍ以外のパラメータを決定（初期化）する（ステップＳ１０１）。なお、処理速度算出用のパラメータｐはパケットサンプリングレートを表すパラメータｐであり、処理速度算出用のパラメータｒはNetFlowデータパケットをクラウドサーバ１０又は最寄りのエッジサーバ２０のいずれに転送するかの比率を表すパラメータｒである。

【0072】

次に、クラウドサーバ１０の計算部１０７は、上記の式（ａ）及び式（ｂ）に示す制約条件下において上記の式（ｃ）に示す最適化問題を計算して、処理速度算出用のパラメータｐ及びｒを決定する（ステップＳ１０２）。

【0073】

次に、クラウドサーバ１０の転送部１０２は、上記のステップＳ１０２で決定されたパラメータｐ及びｒを各ルータ３０に転送する（ステップＳ１０３）。これらのパラメータｐ及びｒは各ルータ３０に設定される。これにより、各ルータ３０では、パラメータｐが表すサンプリングレートによりNetFlowフローがサンプリングされると共に、パラメータｒが表す比率でNetFlowデータパケットがクラウドサーバ１０又は最寄りのエッジサーバ２０のいずれかに転送される。

【0074】

次に、クラウドサーバ１０の計算部１０７は、上記のステップＳ１０２で計算されたデータ量Ｄ_{ｔｏｔａｌ}を用いて、上記の式（ｄ）の第二項目及び第三項目を計算して機械学習モデルの精度を推定する（ステップＳ１０４）。

【0075】

≪異常検知実施処理≫
次に、実運用後に実行される異常検知実施処理の流れについて、図３を参照しながら説明する。図３は、実運用後の異常検知実施処理の流れの一例を示すフローチャートである。なお、以降では、クラウドサーバ１０の学習部１０６によって異常検知タスクを実現する機械学習モデルが学習され、各エッジサーバ２０に配布済みであるものとする。

【0076】

ルータ３０の収集部３０１は、クラウドサーバ１０から転送されたパラメータｐ（つまり、サンプリングレートを表すパラメータｐ）に基づいて、NetFlowデータパケットを生成する（ステップＳ２０１）。

【0077】

次に、ルータ３０の転送部３０２は、クラウドサーバ１０から転送されたパラメータｒ（つまり、クラウドサーバ１０又は最寄りのエッジサーバ２０のいずれに転送するかの比率を表すパラメータｒ）に応じて、上記のステップＳ２０１で生成されたNetFlowデータパケットをクラウドサーバ１０又は最寄りのエッジサーバ２０に転送する（ステップＳ２０２）。上述したように、転送部３０２は、比率ｒでクラウドサーバ１０に、比率１－ｒで最寄りのエッジサーバ２０にNetFlowデータパケットを転送すればよい。

【0078】

次に、上記のステップＳ２０２で転送されたNetFlowデータパケットを受信したクラウドサーバ１０の前処理部１０３又はエッジサーバ２０の前処理部２０３は、当該NetFlowデータパケットに対して前処理を行って前処理後データを生成する（ステップＳ２０３）。

【0079】

そして、クラウドサーバ１０の実施部１０４又はエッジサーバ２０の実施部２０４は、上記のステップＳ２０３で生成された前処理後データを用いて、学習済み機械学習モデルにより異常検知を行う（ステップＳ２０４）。

【0080】

≪異常検知モデル構築処理≫
次に、実運用後に実行される異常検知モデル（つまり、異常検知タスクを実現する学習済み機械学習モデル）の構築処理の流れについて、図４を参照しながら説明する。図４は、実運用後の異常検知モデル構築処理の流れの一例を示すフローチャートである。なお、上述したように、図４に示す異常検知モデル構築処理は、学習周期τ_Ｌ毎に繰り返し実行される。

【0081】

各エッジサーバ２０の転送部２０２は、ＤＢ２０６に蓄積されている前処理後データをクラウドサーバ１０に転送する（ステップＳ３０１）。

【0082】

次に、クラウドサーバ１０の学習部１０６は、ＤＢ１０８に蓄積されている前処理後データと、上記のステップＳ３０１で各エッジサーバ２０から転送された前処理後データとを用いて、機械学習モデルを学習する（ステップＳ３０２）。

【0083】

そして、クラウドサーバ１０の転送部１０２は、上記のステップＳ３０２で学習された学習済み機械学習モデル（異常検知モデル）を各エッジサーバ２０に再配布する（ステップＳ３０３）。

【0084】

≪処理速度算出用のパラメータ調節処理≫
次に、実運用後に、処理速度算出用のパラメータｑ_ｊ、λ^Ｏ _ｉ、Ｃ_ｋ及びαを調節して、処理速度算出用のパラメータｐ及びｒを再決定する処理の流れについて、図５を参照しながら説明する。図５は、実運用後の処理速度算出用のパラメータ調節処理の流れの一例を示すフローチャートである。

【0085】

各ルータ３０の監視部３０３は、帯域等の情報を測定することで処理速度算出用のパラメータｑ_ｊ、λ^Ｏ _ｉ及びＣ_ｋを決定する（ステップＳ４０１）。

【0086】

次に、各ルータ３０の転送部３０２は、上記のステップＳ４０１で決定したパラメータｑ_ｊ、λ^Ｏ _ｉ及びＣ_ｋをクラウドサーバ１０に転送する（ステップＳ４０２）。

【0087】

また、各エッジサーバ２０の監視部２０５は、前処理部２０３による前処理のデータ圧縮率を測定することで処理速度算出用のパラメータαを計算する（ステップＳ４０３）。

【0088】

次に、各エッジサーバ２０の転送部２０２は、上記のステップＳ４０３で計算したパラメータαをクラウドサーバ１０に転送する（ステップＳ４０４）
続いて、クラウドサーバ１０の計算部１０７は、上記のステップＳ４０２で各ルータ３０から転送されたパラメータｑ_ｊ、λ^Ｏ _ｉ及びＣ_ｋと、上記のステップＳ４０４で各エッジサーバ２０から転送されたパラメータαとを用いて、上記の式（ａ）及び式（ｂ）に示す制約条件下において上記の式（ｃ）に示す最適化問題を計算して、処理速度算出用のパラメータｐ及びｒを再決定する（ステップＳ４０５）。

【0089】

次に、クラウドサーバ１０の転送部１０２は、上記のステップＳ４０５で再決定されたパラメータｐ及びｒを各ルータ３０に転送する（ステップＳ４０６）。これらのパラメータｐ及びｒは各ルータ３０に再設定される。これにより、各ルータ３０では、パラメータｐが表すサンプリングレートによりNetFlowフローがサンプリングされると共に、パラメータｒが表す比率でNetFlowデータパケットがクラウドサーバ１０又は最寄りのエッジサーバ２０のいずれかに転送される。

【0090】

次に、クラウドサーバ１０の計算部１０７は、上記のステップＳ４０５で再計算されたデータ量Ｄ_{ｔｏｔａｌ}を用いて、上記の式（ｄ）の第二項目及び第三項目を計算して機械学習モデルの精度を推定する（ステップＳ４０７）。

【0091】

≪精度推定用のパラメータ調節処理≫
次に、実運用後に、精度推定用のパラメータｒ，Ｒ，β_０及びρを調節する処理の流れについて、図６を参照しながら説明する。図６は、実運用後の精度推定用のパラメータ調節処理の流れの一例を示すフローチャートである。なお、上述したように、処理速度の算出と機械学習モデルの精度推定とで記号の使用は独立であり、精度推定用のパラメータｒと速度算出用のパラメータｒ（負荷分散の比率を表すパラメータｒ）とは無関係である。

【0092】

各エッジサーバ２０の転送部２０２は、実施部２０４による異常検知結果をクラウドサーバ１０に送信する（ステップＳ５０１）。

【0093】

クラウドサーバ１０の計算部１０７は、上記のステップＳ５０１で各エッジサーバ２０から転送された異常検知結果と、これらの異常検知結果に対するオペレータのフィードバックとを用いて、学習済み機械学習モデルの実際の精度（実精度）を計算する（ステップＳ５０２）。なお、オペレータのフィードバックとは、例えば、各エッジサーバ２０における異常検知結果が正しいか否かを示す情報のことである。

【0094】

次に、クラウドサーバ１０の計算部１０７は、学習済み機械学習モデルの推定精度－実精度が、予め設定された閾値ｈよりも大きいか否かを判定する（ステップＳ５０３）。

【0095】

ステップＳ５０３で推定精度－実精度が閾値ｈよりも大きいと判定された場合、クラウドサーバ１０の計算部１０７は、上記の式（ｄ）の第二項目＋第三項目が実精度に近くなるようにパラメータｒ，Ｒ，β_０及びρを調節し（ステップＳ５０４）、ステップＳ５０３に戻る。これにより、推定精度－実精度が閾値ｈ以下となるまで、パラメータｒ，Ｒ，β_０及びρの値が調節される。

【0096】

一方で、ステップＳ５０３で推定精度－実精度が閾値ｈ以下であると判定された場合、クラウドサーバ１０の計算部１０７は、現在のパラメータｒ，Ｒ，β_０及びρを設定する（ステップＳ５０５）。これにより、以降では、これらのパラメータｒ，Ｒ，β_０及びρを用いて異常検知が実施される。

【0097】

以上のように、本実施形態に係る通信ネットワークシステム１では、リアルタイム性の制約条件を定義するための目標転送遅延時間Ｔ^* _ｔｒと、帯域の制約条件を定義するためのNetFlowデータ利用可能帯域^－Ｃ_ｋとが与えられる場合、最適な負荷分散の比率を表すパラメータｒとサンプリングレートを表すパラメータｐとを決定し、この決定の際に得られたデータ量Ｄ_{ｔｏｔａｌ}を利用して機械学習モデルの精度（汎化誤差）を評価する。特に、データの前処理をクラウドサーバ１０に集中する場合（すなわち、ｒ＝１．０）と比較することで、例えば、学習に用いることができるデータ量やそれに付随する精度の際を定量的に評価することが可能になる。

【0098】

ここで、図７に、ルータｉで生成されたNetFlowデータパケットをクラウドサーバ１０又はエッジサーバｊに送信し、このクラウドサーバ１０又はエッジサーバｊで前処理及び異常検知を行って、前処理後データを学習用データとしてクラウドサーバ１０に集めるという一連の動作の時間的な関係性を示す。図７では、前処理に要する時間は無視できるものとして、上記の（１）～（４）の合計時間を総検知時間としている。

【0099】

＜実験結果＞
次に、本実施形態に係る通信ネットワークシステム１をシミュレーションにより実験した結果について説明する。

【0100】

本実験では、参考文献５「荒川伸一, 坂野寿和, 築島幸男, 長谷川浩, 釣谷剛宏, 廣田悠介, 戸出英樹, "日本の地域特性を考慮したフォトニックネットワークモデルの検討," 信学技報, PN2013-1, 2013年6月」に記載されているJapan Photonic Network 25 (JPN25)及びJapan Photonic Network 12 (JPN12)で表されるネットワークトポロジーを用いた。具体的には、JPN25の２５ノードをルータ３０とし、各ルータ３０にてNetFlowフローのサンプリングを行うものとした。また、JPN12の１２ノードのうち、Tokyoを表すノードをクラウドサーバ１０とし、残り１１ノード（Sapporo, Sendai, Hachioji, Kanazawa, Nagano, Nagoya, Osaka, Hiroshima, Matsuyama, Hakata, Naha）をエッジサーバ２０とした。各リンク容量は１００［Mbps］、各ルータ３０でのNetFlowデータ量はそのルータ３０に対応するノードが表す都市の人口比見合いとした。具体的には、人口を１０^５で割った商をそのルータ３０での（サンプリング前の）NetFlowデータ量［Mbps］とした。また、ノード間をつなぐ各リンクでの伝搬遅延はそのノード間の距離に応じて１０００［km］当たり５［ms］として与えた。NetFlowデータパケットのサイズをｓ_Ｎ＝１４７９［bytes］とした。なお、経路は距離をメトリックとした最短経路とした。

【0101】

また、ルータ３０がエッジサーバ２０にNetFlowデータを転送する際にはそのルータ３０から最近傍にエッジサーバ２０に転送することとした。なお、最近傍がTokyoの場合（つまり、クラウドサーバ１０の場合）には負荷分散の比率を表すパラメータｒの値に依らず、全てのデータがTokyoに転送されるものとした。更に、目標転送遅延時間Ｔ^* _ｔｒは、Ｔ^* _ｔｒ＝２０［ms］と設定した。

【0102】

また、NetFlowデータに対する前処理の圧縮率α＝０．０２とした。この圧縮率は次のように見積もった。すなわち、前処理ではNetFlowデータのsrcIP毎に４次元特徴ベクトルを生成するものとし、この４次元特徴ベクトルの各要素はdstPort数／フロー数等でいずれも０から１の値を取るものとする。srcIPで３２［bits］必要となり、４次元特徴ベクトルの各要素を例えば２^１２＝４０９６通りで表現するとすれば、４×１２＝４８［bits］必要となる。よって、各srcIP毎に、３２＋４８＝８０［bits］（＝１０［bytes］）要する。このため、例えば、１０００フロー（つまり、３３．３個のNetFlowデータパケット×１パケット当たり３０フロー格納）毎に、dstPort数等の集計を行うものとし、srcIP当たりのフロー数を平均的に１０本とすると、srcIP数は１００となり、全体で１００×１０＝１０００［bytes］となる。これにTCP/IPヘッダ４０［bytes］とイーサネットヘッダ１８［bytes］とを足した１０５８［bytes］を圧縮後のデータサイズとすると、圧縮率はα＝１０５８／（３３．３×１４７９）＝０．０２１５となる。

【0103】

以上の条件の下、フローサンプリングレートを表すパラメータｐ_ｆ（＝Σ_ｊ（１－（１－ｐ）^ｊ）ｑ_ｊ）と負荷分散の比率を表すパラメータｒとのそれぞれを０．０１刻みで変化させてＤ_{ｔｏｔａｌ}が最大となるようなｐ_ｆ及びｒを計算した。その結果、ｐ_ｆ＝０．７１及びｒ＝０のとき最大となった。ここで、ｒ＝０となっているが、最近傍がTokyoであるようなルータ３０についてはクラウドサーバ１０であるTokyoにNetFlowデータを転送している点に留意されたい。この実験の結果を「エッジクラウド連携」という。

【0104】

また、エッジクラウド連携と比較するために、クラウドサーバ１０のみにNetFlowデータが転送される場合（つまり、負荷分散を行わない場合）についても計算した。具体的には、ｒ＝１と固定し、ｐ_ｆのみを変化させてＤ_{ｔｏｔａｌ}が最大となるｐ_ｆを計算した。その結果、ｐ_ｆ＝０．１３となった。なお、この実験の結果を「クラウドのみ」という。

【0105】

また、上記の２つの結果のＤ_{ｔｏｔａｌ}の比率は、（エッジクラウド連携）／（クラウドのみ）＝１７．９９１４／３．２９４２＝５．４６１５となった。つまり、エッジクラウド連携ではクラウドのみと比較して、５．４６倍のデータを学習用データとして利用可能であることを示している。

【0106】

次に、異常検知タスクの精度推定を行った。

【0107】

クラウドのみのＤ_{ｔｏｔａｌ}と、負荷分散の比率を表すパラメータｒ＝０でのエッジクラウド連携のＤ_{ｔｏｔａｌ}との比を学習周期τ_Ｌ毎のデータ量比として汎化誤差をシミュレーションした。このとき、全パラメータは固定とし、ｒ＝１００，Ｒ＝０．１，ρ＝１，δ＝０．０１，β_０＝０．１とした。なお、このパラメータｒ＝１００は、負荷分散の比率を表すパラメータｒと同一記号を用いているが独立であることに留意されたい。

【0108】

以下の表１にクラウドのみの場合とエッジクラウド連携の場合とで上記の式（ｄ）に示す汎化誤差の右辺の第二項目及び第三項目（の和）の計算結果を示す。

【0109】

【表1】

上記の表１に示されるように、学習周期τ_Ｌに得られるデータ量により数値が変化する
こと、及びエッジクラウド連携の方がクラウドのみよりも汎化誤差の上限である第二項目
及び第三項目が小さく機械学習モデルの精度の向上に繋がっていることがわかる。

【0110】

＜ハードウェア構成＞
最後に、本実施形態に係るクラウドサーバ１０、エッジサーバ２０及びルータ３０を実現するコンピュータ（例えば、汎用サーバや機器等）のハードウェア構成について、図８を参照しながら説明する。図８は、コンピュータのハードウェア構成の一例を示す図である。

【0111】

図８に示すコンピュータ５００は、ハードウェアとして、入力装置５０１と、表示装置５０２と、外部Ｉ／Ｆ５０３と、通信Ｉ／Ｆ５０４と、プロセッサ５０５と、メモリ装置５０６とを有する。これら各ハードウェアは、それぞれがバス５０７を介して通信可能に接続されている。

【0112】

入力装置５０１は、例えば、キーボードやマウス、タッチパネル等である。表示装置５０２は、例えば、ディスプレイ等である。なお、コンピュータ５００は、入力装置５０１及び表示装置５０２のうちの少なくとも一方を有していなくてもよい。

【0113】

外部Ｉ／Ｆ５０３は、外部装置とのインタフェースである。外部装置には、記録媒体５０３ａ等がある。コンピュータ５００は、外部Ｉ／Ｆ５０３を介して、記録媒体５０３ａの読み取りや書き込み等を行うことができる。なお、記録媒体５０３ａとしては、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、ＳＤメモリカード（Secure Digital memory card）、ＵＳＢ（Universal Serial Bus）メモリカード等がある。

【0114】

通信Ｉ／Ｆ５０４は、コンピュータ５００を通信ネットワークに接続するためのインタフェースである。プロセッサ５０５は、例えば、ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等の各種演算装置である。メモリ装置５０６は、例えば、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ等の各種記憶装置である。

【0115】

本実施形態に係るクラウドサーバ１０、エッジサーバ２０及びルータ３０は、図８に示すコンピュータ５００のハードウェア構成を有することにより、上述した各種処理を実現することができる。なお、図８に示すコンピュータ５００のハードウェア構成は一例であって、コンピュータ５００は、他のハードウェア構成を有していてもよい。例えば、コンピュータ５００は、複数のプロセッサ５０５を有していてもよいし、複数のメモリ装置５０６を有していてもよい。

【0116】

本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。

【符号の説明】

【0117】

１通信ネットワークシステム
１０クラウドサーバ
２０エッジサーバ
３０ルータ
１０１収集部
１０２転送部
１０３前処理部
１０４実施部
１０５監視部
１０６学習部
１０７計算部
１０８ＤＢ
２０１収集部
２０２転送部
２０３前処理部
２０４実施部
２０５監視部
２０６ＤＢ
３０１収集部
３０２転送部
３０３監視部
５００コンピュータ
５０１入力装置
５０２表示装置
５０３ａ記録媒体
５０４通信Ｉ／Ｆ
５０５プロセッサ
５０６メモリ装置
５０７バス

【図1】