IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

7710145データセット作成装置、データセット作成方法、及びプログラム
<>
  • -データセット作成装置、データセット作成方法、及びプログラム 図1
  • -データセット作成装置、データセット作成方法、及びプログラム 図2
  • -データセット作成装置、データセット作成方法、及びプログラム 図3
  • -データセット作成装置、データセット作成方法、及びプログラム 図4
  • -データセット作成装置、データセット作成方法、及びプログラム 図5
  • -データセット作成装置、データセット作成方法、及びプログラム 図6
  • -データセット作成装置、データセット作成方法、及びプログラム 図7
  • -データセット作成装置、データセット作成方法、及びプログラム 図8
  • -データセット作成装置、データセット作成方法、及びプログラム 図9
  • -データセット作成装置、データセット作成方法、及びプログラム 図10
  • -データセット作成装置、データセット作成方法、及びプログラム 図11
  • -データセット作成装置、データセット作成方法、及びプログラム 図12
  • -データセット作成装置、データセット作成方法、及びプログラム 図13
  • -データセット作成装置、データセット作成方法、及びプログラム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-07-10
(45)【発行日】2025-07-18
(54)【発明の名称】データセット作成装置、データセット作成方法、及びプログラム
(51)【国際特許分類】
   H04L 43/04 20220101AFI20250711BHJP
   H04L 43/022 20220101ALI20250711BHJP
   H04L 41/0896 20220101ALI20250711BHJP
   G06F 18/214 20230101ALI20250711BHJP
【FI】
H04L43/04
H04L43/022
H04L41/0896
G06F18/214
【請求項の数】 6
(21)【出願番号】P 2024500740
(86)(22)【出願日】2022-02-15
(86)【国際出願番号】 JP2022005997
(87)【国際公開番号】W WO2023157090
(87)【国際公開日】2023-08-24
【審査請求日】2024-06-06
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】NTT株式会社
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】100164471
【弁理士】
【氏名又は名称】岡野 大和
(74)【代理人】
【識別番号】100176728
【弁理士】
【氏名又は名称】北村 慎吾
(72)【発明者】
【氏名】小杉 友哉
(72)【発明者】
【氏名】山田 友輝
(72)【発明者】
【氏名】竹下 絵莉奈
(72)【発明者】
【氏名】森田 章弘
(72)【発明者】
【氏名】吉原 慎一
【審査官】征矢 崇
(56)【参考文献】
【文献】特開2008-187612(JP,A)
【文献】特開2009-212654(JP,A)
【文献】国際公開第2021/038639(WO,A1)
【文献】特開2021-197640(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04L41/00-43/55
G06F18/214
(57)【特許請求の範囲】
【請求項1】
複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセットを作成するデータセット作成装置であって、
自装置の外部に設置されたプッシュ型情報配信を行うデータソースから定期不定期、あるいは更新が発生した都度に配信される、前記回線または通信装置による前記回線を介した通信に関するデータを受信する第一収集機能部と、
自装置の外部に設置されたプル型情報配信を行うデータソースにアクセスして、前記プル型情報配信を行うデータソースから予め設定された任意の周期で、前記回線または通信装置による前記回線を介した通信に関するデータを受信する第二収集機能部と、
前記第一収集機能部と前記第二収集機能部とにより受信されたデータをそれぞれ記録するデータ記録部と、
前記データ記録部に記録されたデータから、複数の特徴量を抽出し、前記複数の特徴量を所定の時間間隔でそれぞれ時系列化し、前記時系列化された複数の特徴量を結合して一つのデータセットを作成する計算機能部と、
を備えるデータセット作成装置。
【請求項2】
前記計算機能部は、前記特徴量の時間周期が前記所定の時間間隔よりも小さい場合、前記時間周期内の特徴量の代表値を決定することで、前記特徴量を前記所定の時間間隔で時系列化し、前記特徴量の時間周期が前記所定の時間間隔よりも大きい場合、前記所定の時間間隔ごとに前記特徴量となる値を補完して、前記特徴量を前記所定の時間間隔で時系列化する、請求項1に記載のデータセット作成装置。
【請求項3】
前記第一収集機能部又は前記第二収集機能部により受信されたデータと、前記データ記録部に記録されたデータとを比較し、データの内容に差分が認められた場合に、前記受信されたデータを前記データ記録部に記録させる記録判定部を更に備える、請求項1又は2に記載のデータセット作成装置。
【請求項4】
前記データセット作成装置は、一つ又は複数の第三のデータソース、及び前記一つ又は複数の第三のデータソースの状態を管理する管理システムと通信可能である第三収集機能部を更に備え、
前記第三収集機能部は、前記第三のデータソース又は前記管理システムから、前記第三のデータソースの状態変化が通知されると、前記第三のデータソースにアクセスして、データを受信し、
前記第三収集機能部は、前記第三のデータソースが通信装置である場合に、前記第三のデータソースの状態を取得するためのコマンドを発行し、前記第三のデータソースの応答から、通信リンクに収容される回線の変化、又はインターフェースの接続関係の変化の情報を抽出する、請求項1から3のいずれか一項に記載のデータセット作成装置。
【請求項5】
複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセットを作成するデータセット作成方法であって、
データセット作成装置により、
自装置の外部に設置されたプッシュ型情報配信を行うデータソースから定期不定期、あるいは更新が発生した都度配信される、前記回線または通信装置による前記回線を介した通信に関するデータを受信するステップと、
自装置の外部に設置されたプル型情報配信を行うデータソースにアクセスして、前記プル型情報配信を行うデータソースから予め設定された任意の周期で、前記回線または通信装置による前記回線を介した通信に関するデータを受信するステップと、
前記受信されたデータを記録するステップと、
前記記録されたデータから、複数の特徴量を抽出するステップと、
前記複数の特徴量を所定の時間間隔でそれぞれ時系列化するステップと、
前記時系列化された複数の特徴量を結合して一つのデータセットを作成するステップと、
を含むデータセット作成方法。
【請求項6】
コンピュータを、請求項1から4のいずれか一項に記載のデータセット作成装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセット作成装置、データセット作成方法、及びプログラムに関する。
【背景技術】
【0002】
従来、通信帯域の算出では、トラヒック量、回線の契約帯域などの特徴量の時系列情報を入力として通信帯域が計算されているが、機械学習を用いて帯域推定を行う場合には、トラヒック量あるいは回線の契約帯域にとどまらず複数の特徴量を含むデータセットを作成することが望まれる。たとえば、非特許文献1には、複数の回線が1つの通信リンクに収容される通信ネットワークにおいて、所与の通信品質を満たすための通信帯域を算出する方法が記載されている。非特許文献1に記載の方法では、図14に示すような、トラヒック量及び回線の契約帯域の時系列情報(t1、・・・、t2の情報)を入力として、通信帯域が推定される。また、一般的に機械学習を利用する際には、入力する特徴量が増えることで予測精度が向上することが知られており、機械学習を用いて帯域推定する場合には,トラヒック量あるいは回線の契約帯域にとどまらず複数の特徴量を含むデータセットを作成することが望まれる。このため、機械学習に用いられる複数の特徴量を含むデータセットは、所与の特徴量を所与の時間間隔で時系列に連続して記録されたデータである必要がある。
【先行技術文献】
【非特許文献】
【0003】
【文献】E. Takeshita、他2名、「 Traffic statistical upper limit prediction from flow features in network provisioning」、2021 IEEE Global Communications Conference (GLOBECOM)、2021
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、複数の特徴量を含むデータセットを作成する際には課題がある。第一の課題は、データ収集に関する課題である。特徴量として抽出されるデータは発生条件、データソースの保存条件などが異なることから、データの種別に応じたデータ収集方法が必要となる。たとえば、定期的に発生するため収集する必要があるデータ、更新前の情報を保持していないため定期的に収集する必要があるデータ、不定期に発生するため適切なタイミングで収集する必要があるデータなどが存在する。
【0005】
第二の課題は、特徴量の時系列化に関する課題である。特徴量を抽出する元となるデータの収集間隔が異なることから、収集されたデータから特徴量を抽出する際に特徴量の過不足が発生する。このため、抽出された特徴量に対する補完・間引きを行い、所定の時間間隔で時系列化された特徴量とする必要がある。たとえば、5分間隔で抽出されている特徴量1及び1時間ごとに抽出されている特徴量2から10分間隔のデータセットを作成する際には、特徴量1及び特徴量2に対する補完・間引きなどの適切な方法で10分間隔で時系列化された特徴量とする必要がある。そのため、上述したような課題に対応した、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用可能なデータセットを作成する技術が求められている。
【0006】
かかる事情に鑑みてなされた本発明の目的は、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用可能なデータセットを作成することができるデータセット作成装置、データセット作成方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するため、本開示に係るデータセット作成装置は、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセットを作成するデータセット作成装置であって、一つ又は複数の第一のデータソースから定期又は不定期に配信される、前記回線または通信装置による前記回線を介した通信に関するデータを受信する第一収集機能部と、一つ又は複数の第二のデータソースにアクセスして、前記一つ又は複数の第二のデータソースから予め設定された任意の周期で、前記回線または通信装置による前記回線を介した通信に関するデータを受信する第二収集機能部と、前記第一収集機能部と前記第二収集機能部とにより受信されたデータをそれぞれ記録するデータ記録部と、前記データ記録部に記録されたデータから、複数の特徴量を抽出し、前記複数の特徴量を所定の時間間隔でそれぞれ時系列化し、前記時系列化された複数の特徴量を結合して一つのデータセットを作成する計算機能部と、を備える。
【0008】
上記課題を解決するため、本開示に係るデータセット作成方法は、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセットを作成するデータセット作成方法であって、データセット作成装置により、一つ又は複数の第一のデータソースから定期又は不定期に配信される、前記回線または通信装置による前記回線を介した通信に関するデータを受信するステップと、一つ又は複数の第二のデータソースにアクセスして、前記一つ又は複数の第二のデータソースから予め設定された任意の周期で、前記回線または通信装置による前記回線を介した通信に関するデータを受信するステップと、前記受信されたデータを記録するステップと、前記記録されたデータから、複数の特徴量を抽出するステップと、前記複数の特徴量を所定の時間間隔でそれぞれ時系列化するステップと、前記時系列化された複数の特徴量を結合して一つのデータセットを作成するステップと、を含む。
【0009】
上記課題を解決するため、本開示に係るプログラムは、コンピュータを、上記データセット作成装置として機能させる。
【発明の効果】
【0010】
本開示によれば、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用可能なデータセットを作成することができる。
【図面の簡単な説明】
【0011】
図1】第一の実施形態に係るデータセット作成装置の構成例を示すブロック図である。
図2】データ記録部に記録された回線情報の一例を示す表である。
図3】データ記録部に記録された接続情報の一例を示す表である。
図4】データ記録部に記録されたリンク情報の一例を示す表である。
図5】データ記録部に記録されたトラヒック情報の一例を示す表である。
図6】計算機能部の動作を説明する図である。
図7】時系列化された複数の特徴量を結合して作成した一つのデータセットの一例を示す表である。
図8】第一の実施形態に係るデータセット作成装置が実行するデータセット作成方法の一例を示すフローチャートである。
図9】第二の実施形態に係るデータセット作成装置の構成例を示すブロック図である。
図10】第二の実施形態に係るデータセット作成装置が実行するデータセット作成方法の一例を示すフローチャートである。
図11】第三の実施形態に係るデータセット作成装置の構成例を示すブロック図である。
図12】第三の実施形態に係るデータセット作成装置が実行するデータセット作成方法の一例を示すフローチャートである。
図13】データセット作成装置として機能するコンピュータの概略構成を示すブロック図である。
図14】従来の通信帯域を計算するために使用する時系列情報を記録した表である。
【発明を実施するための形態】
【0012】
以下、本開示に係る実施形態について、図面を参照して詳細に説明する。
【0013】
(第一の実施形態)
図1は、第一の実施形態に係るデータセット作成装置1の構成例を示すブロック図である。第一の実施形態に係るデータセット作成装置1について、以下に説明する。図1に示すように、データセット作成装置1は、第一収集機能部11と、第二収集機能部12と、データ記録部13と、計算機能部14と、データバス15と、を備える。データセット作成装置1は、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセットを作成する。
【0014】
第一収集機能部11、第二収集機能部12、及び計算機能部14により制御部10(コントローラ10)を構成する。制御部10(コントローラ10)は、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などの専用のハードウェアによって構成されてもよいし、プロセッサによって構成されてもよいし、双方を含んで構成されてもよい。
【0015】
図1に示すように、データセット作成装置1は、一つ又は複数の第一のデータソース21及び一つ又は複数の第二のデータソース22と接続されている。第一のデータソース21は、Push型情報配信を行うデータソースである。Push型情報配信とは、受信者側からリクエストしなくても、発信者が能動的に、情報を送信する情報配信の方式をいう。第一のデータソース21は、例えば加入者回線に関する情報(回線情報)が記録された回線情報データベースである。第二のデータソース22a、22b、22cは、Pull型情報配信を行うデータソースである。Pull型情報配信とは、受信者側からのリクエストに基づいて、発信者が受動的に、情報を送信する情報配信の方式をいう。第二のデータソース22aは、例えば、回線を介して通信を行う通信装置のインターフェース同士の接続関係に関する情報(接続情報)が登録された設備データベースである。第二のデータソース22bは、例えば回線が収容されている通信リンクに関する情報(リンク情報)が記録されたリンク情報データベースである。第二のデータソース22cは、例えば通信装置の各インターフェースで送受信されるトラヒックに関する情報(トラヒック情報)が記録されているトラヒック情報収集データベースである。
【0016】
本実施例に記載されているデータベースは、csvなどの形式で保存されたファイルを含み、単にSQLなどのデータベース言語で作成されたデータベースに限定されない。また、本実施例に記載される通信リンクは、物理的なリンク、複数の物理リンクを束ねて1つの論理リンクとして扱うLink Aggregation、あるいはVLAN(Virtual Local Area Network)などの仮想的なリンクを含み、特定の技術に限定されない。また、本実施例に記載されるインターフェースは、物理、Link Aggregation、あるいはVLANなどの仮想的なインターフェースを含み、特定の技術に限定されない。
【0017】
また、説明の便宜ために、本実施形態では、図1に示すように、第一のデータソース21及び第二のデータソース22a、22b、22cは、それぞれ単一のデータベースであるように説明するが、それぞれのデータベースは2台以上で構成されていてもよい。さらに、第一のデータソース21からすべての加入者回線の情報(回線情報)を取得するよう説明するが、回線情報を複数のデータソースから入手することがあってもよい。また、第二のデータソース22cは、トラヒックデータを含むように説明を行うが、トラヒックデータの他に、遅延の情報、MACアドレス学習数、IPアドレス数などの時系列データを含んでいてもよい。
【0018】
第一のデータソース21は、第一収集機能部11と接続され、第二のデータソース22a、22b、22cは、第二収集機能部12と接続されている。また、第一収集機能部11と、第二収集機能部12と、データ記録部13と、計算機能部14とは、データバス15を介して接続されている。本実施例では、第一のデータソース21が第一収集機能部に接続されている例が説明されるが、第一のデータソース21は、第二収集機能部12に接続されていてもよく、第二のデータソース22a、22b、22cは、第一収集機能部11に接続されていてもよい。
【0019】
第一収集機能部11は、一つ又は複数の第一のデータソース21から定期又は不定期に配信される、回線または通信装置による回線を介した通信に関するデータを受信する。以下では、第一収集機能部11が受信したデータを、Push型データと称することがある。Push型情報配信の場合、第一のデータソース21は、第一収集機能部11からリクエストしなくても、能動的にデータを送信する。たとえば、図1に示すように、第一のデータソース21は、1日周期で回線情報のデータを第一収集機能部11に送信するものとする。なお、第一のデータソース21がデータを送信する周期は、定期に限るものではない。第一のデータソース21は、その諸元に応じて不定期に、あるいは更新が発生した都度、データを送信するものとする。第一収集機能部11は、第一のデータソース21からデータを受信すると、受信されたデータをデータ記録部13に送信する。図1では、第一収集機能部11は、一つの第一のデータソース21と接続されているが、複数の第一のデータソース21と接続されていてもよい。なお、第一のデータソース21と第一収集機能部11との間で授受されるデータの形式は、csv形式、json形式、Mib形式など、特定の形式に限定されない。
【0020】
第二収集機能部12は、一つ又は複数の第二のデータソース22にアクセスして、一つ又は複数の第二のデータソース22から予め設定された任意の周期で、回線または通信装置による回線を介した通信に関するデータを受信する。以下では、第二収集機能部12が受信したデータを、Pull型データと称することがある。Pull型情報配信の場合、第二のデータソース22は、第二収集機能部12からのリクエストに基づいて、受動的にデータを送信する。第二収集機能部12は、データの受信に成功すると、受信されたデータをデータ記録部13に送信する。第二収集機能部12は、データの受信に失敗した場合、予め指定された時間待機して、あるいは予め設定された任意の周期で再度データの受信を試みる。本実施例では、第二のデータソース22aからは1日周期で接続情報のデータを取得し、第二のデータソース22bからは1時間周期でリンク情報のデータを取得し、第二のデータソース22cからは1分周期でトラヒック情報のデータを取得するものとして説明を行う。なお、第二のデータソース22と第二収集機能部12との間で授受されるデータの形式は、csv形式、json形式、Mib形式など、特定の形式に限定されない。
【0021】
なお、回線に関するデータとは、例えば、必要な通信帯域の算出の対象となるリンクに収容される回線に関する情報(回線情報)のデータ、および、回線が収容されている通信リンクに関する情報(リンク情報)のデータなどである。また、通信装置による回線を介した通信に関するデータとは、例えば、回線を介して通信を行う通信装置のインターフェース同士の接続関係に関する情報(接続情報)のデータ、および、通信装置の各インターフェースで送受信されるトラヒックに関する情報(トラヒック情報)のデータなどである。リンクに必要な通信帯域は、そのリンクに収容される回線およびその回線を介した通信装置による通信に大きく依存する。上述した、第一収集機能部11および第二収集機能部12が取得する、回線または通信装置による回線を介した通信に関するデータはあくまでも一例であり、第一収集機能部11および第二収集機能部12は、リンクに必要な通信帯域の算出に必要な、回線およびその回線を介した通信装置による通信に関する任意のデータを取得する。
【0022】
データ記録部13は、第一収集機能部11と第二収集機能部12とにより受信されたデータをそれぞれ記録する。すなわち、データ記録部13は、Push型データ(回線情報のデータ)とPull型データ(接続情報のデータ、リンク情報のデータ、トラヒック情報のデータ)とをそれぞれ記録する。データ記録部13による記録の一例を図2から図5に示す。
【0023】
図2は、データ記録部13に記録された回線情報の一例を示す表である。図2では、回線情報として、対象とするリンクAに収容される回線(本実施例では、回線1及び回線2が収容されている。)、回線毎の開通日、契約帯域、冗長、優先制御、遅延上限及び対地数、が記録されているが、回線情報はこれらに限定されない。たとえば、回線情報は、経由リンク数、経由通信装置数、利用帯域、遅延、MAC学習数、IPアドレス数、VLAN数、evi数、VRF数、トンネル数、TCP/UDPセッション数、フロー数などの情報であってもよい。
【0024】
図3は、データ記録部13に記録された接続情報の一例を示す表である。図3では、接続情報として、通信リンク毎の作成日と、リンクAにインターフェース1及びインターフェース2が接続されていることと、リンクAのインタフェース1は通信装置XXXのインターフェースY/Z/0であってインターフェース2は通信装置XXZのインターフェースY/Z/2であることと、が記録されている。なお、通信装置の名称は通信装置のホスト名やIPアドレス等の情報であってもよい。
【0025】
図4は、データ記録部に記録されたリンク情報の一例を示す表である。図4では、2021年9月10日00時にリンクAに回線1及び回線2が、リンクBに回線2が収容されていることが記録されている。
【0026】
図5は、データ記録部に記録されたトラヒック情報の一例を示す表である。図5では、2021年10月11日00時00分から1分周期で、リンクAに登録されているノードXXXのインターフェースY/Z/0及びノードXXZのインターフェースY/Z/2の上で送受信されるトラフィック量が記録されている。
【0027】
また、図2から図5では、各情報が別々の表形式で記録されているが、各情報が検索、参照可能な形態で保存されていれば、独立の表として保存されていなくてもよい。
【0028】
計算機能部14は、データ記録部13に記録されたデータから、複数の特徴量を抽出して、複数の特徴量を所定の時間間隔でそれぞれ時系列化する。計算機能部14は、時系列化された複数の特徴量を結合して一つのデータセットを作成する。特徴量とは、分析すべきデータあるいは対象物の特徴・特性を、定量的に表した数値をいう。
【0029】
計算機能部14は、任意のタイミングで任意の複数の特徴量からなるデータセットを作成する。任意のタイミングとは、例えば、本発明外の機械学習システムなどで計算を実施するタイミングである。かかる場合、データセットの開始時間、終了期間、データの出力周期などは外部のシステムから指定されるものとする。あるいは、予め指定された時間間隔で自動的にデータセットが作成されてもよい。
【0030】
図6は、計算機能部14の動作を説明する図である。以下、本実施例では、計算機能部14の動作を図2から図6を参照しながら説明する。本実施例では、2021年10月11日00時00分から2021年11月10日23時59分までの10分周期の、リンクAにおける各回線の契約帯域、遅延上限、対地数、及びトラヒック量を複数の特徴量とするデータセットの作成を行う。図6では、所定の時間間隔は、10分である。
【0031】
上述したように、計算機能部14は、任意のタイミングで計算を開始する。計算機能部14の処理は大きく分けて、抽出処理、時系列化処理及び結合処理の3つの処理に分類される。抽出処理では、計算機能部14は、データ記録部13に記録されたリンク情報(図4)を参照して、通信帯域の推定の対象とするリンクAに収容される回線(図4に示す例では、回線1及び回線2)を抽出する。また、計算機能部14は、データ記録部13に記録された接続情報(図3)を参照して、リンクAに含まれるインタフェース(図3に示す例では、ノードXXXのインターフェースY/Z/0及びノードXXZのインターフェースY/Z/2)を抽出する。時系列化処理では、計算機能部14は、データ記録部13に記録された回線情報(図2)を参照し、回線1及び回線2それぞれに対応して記録されている、例えば、契約帯域、遅延上限及び対地数を特徴量として抽出する。また、計算機能部14は、データ記録部13に記録されたトラヒック情報(図5)を参照し、インターフェース1及びインターフェース2の上で送受信されるトラヒック量を特徴量として参照する。計算機能部14は、抽出した複数の特徴量をそれぞれ10分単位の時間間隔に時系列化する。結合処理では、計算機能部14は、時系列化処理において時系列化された回線1及び回線2に含まれる契約帯域、遅延上限、及び対地数とインターフェース1及びインターフェース2の上で送受信されるトラヒック量とを結合して、複数の特徴量を含む一つのデータセットを作成する。以下では、時系列化処理および結合処理の詳細について説明する。
【0032】
初めに、計算機能部14が実行する回線情報の時系列化処理の詳細について説明する。リンクAに収容される回線は、時間により回線数が異なることもありうる。本実施例では、上述したように、リンク情報は1時間周期の情報である。したがって、リンク情報から抽出される特徴量も1時間周期である。一方、上述したように、作成するデータセットは10分周期である。このように、リンク情報(特徴量)の時間周期がデータセットを作成する所定の時間間隔よりも大きい場合、計算機能部14は、所定の時間間隔ごとに特徴量となる値を補完して、特徴量を所定の時間間隔で時系列化する。所定の時間間隔(10分)に合わせるため、例えば、計算機能部14は、2021年10月11日00時のリンク情報(図4)に基づき、2021年10月11日00時00分、10分、20分、30分、40分、50分のリンク情報(回線1および回線2を収容)を補完する。次に、データ記録部13に記録された回線情報(図2)から、2021年10月11日の回線情報を、2021年10月1日00時00分、10分、20分、30分、40分、50分における特徴量として抽出する。リンクAの各時間の収容回線が判明していることから、当該回線の契約情報(契約帯域、帯域上限、及び対地数)が抽出される。本実施例では、2021年10月11日00時には、リンクAには回線1と回線2とが収容されている。そこで、2021年10月11日00時の回線1及び回線2の回線情報に基づき、回線1及び回線2それぞれの、2021年10月1日00時00分、10分、20分、30分、40分、50分における契約帯域、帯域上限、及び対地数を補完する。本実施例では、予め数値が記録された回線情報の特徴量を指定したが、例えば冗長、優先制御など、文字データとして記録されている特徴量は、カテゴリ変数などの手法を用いて数値に変換される。
【0033】
次に、計算機能部14が実行するトラヒック情報の時系列化処理の詳細について説明する。リンクAを構成するインターフェースは、データ記録部13に記録されている接続情報(図3)から判明しているため、データ記録部13に記録されているトラヒック情報(図5)の時系列データが参照される。本実施例では、10分周期のデータセットを作成する必要があるのに対し、トラヒック情報は1分周期で記録されている。このように、特徴量の時間周期が所定の時間間隔よりも小さい場合、計算機能部14は、2021年10月11日00時00分から00時09分までの特徴量の代表値を決定することで、特徴量を所定の時間間隔で時系列化する。ここで、代表値とは、時間周期内の最初の値、中間値、近似値、最大値、最小値、平均値などをいう。たとえば、データ記録部13に記録されたトラヒック情報(図5)から、2021年10月11日00時00分から00時09分までの特徴量の最大値である35.609が、2021年10月11日00時00分のトラヒックの特徴量とされる。ここでは代表値として最大値を選択したが、最初の値、中間値、近似値、最小値、平均値などを当該時間のトラヒックの特徴量としてもよい。本実施例とは異なり、トラヒックの特徴量の時間周期がデータセットを作成する所定の時間間隔よりも大きい場合、例えば10分周期(2021年10月11日00時00分、10分、20分、30分、40分、50分)のデータセットを作成する必要があるのに対し、トラヒック情報は1時間周期(・・・2021年10月10日23時、11日00時、01時・・・)で記録されている場合、計算機能部14は、2021年10月11日00時00分、10分、20分、30分、40分、50分のトラヒック特徴量の値を、トラヒックの特徴量の最初の値(例えば、2021年10月11日00時の値)を選択する、前後の値の中間値(例えば、2021年10月10日23時及び11日00時の値の中間値)を用いる、前後複数の値(例えば、2021年10月10日23時、11日00時、01時の値)を近似するなどの方法により、時系列化を行う。
【0034】
結合処理では、計算機能部14は、時系列化処理が行われた、回線1及び回線2に含まれる特徴量(契約帯域、遅延上限、対地数)と、インターフェース1及びインターフェース2の上で送受信されるトラヒック量の特徴量とを結合することにより、複数の特徴量を含む一つのデータセットを作成する。図7は、時系列化された複数の特徴量を結合して作成した一つのデータセットの一例を示す表である。本実施例では、10分周期のデータセットを作成するため、図7の表の1行目の日時は2021年10月11日00時00分から2021年11月10日23時59分まで10分周期に区分される。2行目のトラヒックには、各10分間のトラヒック量の最大値が記録されている。3行目の回線1及び4行目の回線2には、各10分間における契約帯域、遅延上限、及び対地数が記録されている。
【0035】
データバス15は、データセット作成装置1が備える、第一収集機能部11と、第二収集機能部12と、データ記録部13と、計算機能部14とを、相互に接続する。
【0036】
図8は、第一の実施形態に係るデータセット作成装置1が実行するデータセット作成方法の一例を示すフローチャートである。
【0037】
ステップS101では、第一収集機能部11が、一つ又は複数の第一のデータソース21から定期又は不定期に配信されるデータを受信する。
【0038】
ステップS102では、第二収集機能部12が、一つ又は複数の第二のデータソース22にアクセスして、予め設定された任意の周期でデータを受信する。ステップS101の処理及びステップS102の処理は、図8に示すように、並行して行われてもよいし、いずれか一方の処理が先に、他方の処理が後から行われてもよい。
【0039】
ステップS103では、データ記録部13が、第一収集機能部11と第二収集機能部12とによって受信されたデータをそれぞれ記録する。
【0040】
ステップS104では、計算機能部14が、データ記録部13に記録されたデータから、複数の特徴量を抽出する。
【0041】
ステップS105では、計算機能部14が、抽出された複数の特徴量を所定の時間間隔でそれぞれ時系列化する。
【0042】
ステップS106では、計算機能部14が、時系列化された複数の特徴量を結合して一つのデータセットを作成する。
【0043】
本実施形態に係るデータセット作成装置1によれば、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用可能なデータセットを作成することが可能となり、予測精度の高い帯域推定を実現することができる。
【0044】
(第二の実施形態)
図9は、第二の実施形態に係るデータセット作成装置2の構成例を示すブロック図である。図9に示すように、データセット作成装置2は、第一収集機能部11と、第二収集機能部12と、データ記録部13と、計算機能部14と、データバス15と、記録判定部16と、を備える。データセット作成装置2は、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセットを作成する。本実施形態に係るデータセット作成装置2は、第一の実施形態に係るデータセット作成装置1と比較して、記録判定部16を更に備える点が相違する。第一の実施形態と同一の構成については、第一の実施形態と同一の参照番号を付して適宜説明を省略する。
【0045】
第一収集機能部11、第二収集機能部12、計算機能部14、及び記録判定部16により制御部10a(コントローラ10a)を構成する。制御部10a(コントローラ10a)は、ASIC、FPGAなどの専用のハードウェアによって構成されてもよいし、プロセッサによって構成されてもよいし、双方を含んで構成されてもよい。
【0046】
記録判定部16は、第一収集機能部11又は第二収集機能部12により受信されたデータと、データ記録部13に記録されたデータとを比較し、データの内容に差分が認められた場合に、データの更新があったものとして、受信されたデータをデータ記録部13に送信することにより記録させる。
【0047】
本実施形態に係るデータセット作成装置2における動作を図9を参照しながら説明する。第一収集機能部11又は第二収集機能部12は、データを取得すると、記録判定部16にデータを送信する。記録判定部16は、第一収集機能部11又は第二収集機能部12からデータを受信すると、受信されたデータとデータ記録部13に記録された最新のデータとを比較する。記録判定部16は、データの内容に差分を認めると、データの更新があったものと判定して、データ記録部13に、第一収集機能部11又は第二収集機能部12が受信したデータを送信する。記録判定部16は、データの内容に差分がないと、データ記録部13にデータを送信しないで、第一収集機能部11又は第二収集機能部12からの次のデータの受信を待つ。
【0048】
図10は、第二の実施形態に係るデータセット作成装置2が実行するデータセット作成方法の一例を示すフローチャートである。
【0049】
ステップS201では、第一収集機能部11が、一つ又は複数の第一のデータソース21から定期又は不定期に配信されるデータを受信する。
【0050】
ステップS202では、第二収集機能部12が、一つ又は複数の第二のデータソース22にアクセスして、予め設定された任意の周期でデータを受信する。ステップS201の処理及びステップS202の処理は、図10に示すように、並行して行われてもよいし、いずれか一方の処理が先に、他方の処理が後から行われてもよい。
【0051】
ステップS203では、記録判定部16が、第一収集機能部11が受信したデータと、データ記録部13に記録されたデータとを比較する。データの内容に差分が認められた場合には、記録判定部16は、データの更新があったものと判定して、第一収集機能部11が受信したデータをデータ記録部13に送信して記録させる。データの内容に差分が認められない場合には、記録判定部16は、データの更新がなかったものと判定して、該データをデータ記録部13に送信しないで、第一収集機能部11からの次のデータの受信を待つ。
【0052】
ステップS204では、記録判定部16が、第二収集機能部12が受信したデータと、データ記録部13に記録されたデータとを比較する。データの内容に差分が認められた場合には、記録判定部16は、データの更新があったものと判定して、第二収集機能部12が受信したデータをデータ記録部13に送信して記録させる。データの内容に差分が認められない場合には、記録判定部16は、データの更新がなかったものと判定して、該データをデータ記録部13に送信しないで、第二収集機能部12からの次のデータの受信を待つ。
【0053】
ステップS205では、データ記録部13が、記録判定部16から送信されたデータを記録する。
【0054】
ステップS206では、計算機能部14が、データ記録部13に記録されたデータから、複数の特徴量を抽出する。
【0055】
ステップS207では、計算機能部14が、抽出された複数の特徴量を所定の時間間隔でそれぞれ時系列化する。
【0056】
ステップS208では、計算機能部14が、時系列化された複数の特徴量を結合して一つのデータセットを作成する。
【0057】
本実施形態に係るデータセット作成装置2によれば、データの記録可否を判断することにより、データセット作成装置2に係るデータ記録部13が記録するデータ量を削減することが可能となる。
【0058】
(第三の実施形態)
図11は、第三の実施形態に係るデータセット作成装置3の構成例を示すブロック図である。図11に示すように、データセット作成装置3は、第一収集機能部11と、第二収集機能部12と、データ記録部13と、計算機能部14と、データバス15と、記録判定部16と、第三収集機能部17と、を備える。データセット作成装置3は、複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセットを作成する。本実施形態に係るデータセット作成装置3は、第二の実施形態に係るデータセット作成装置2と比較して、第三収集機能部17を更に備える点が相違する。第一の実施形態又は第二の実施形態と同一の構成については、第一の実施形態又は第二の実施形態と同一の参照番号を付して適宜説明を省略する。
【0059】
第一収集機能部11、第二収集機能部12、計算機能部14、記録判定部16、及び第三収集機能部17により制御部10b(コントローラ10b)を構成する。制御部10b(コントローラ10b)は、ASIC、FPGAなどの専用のハードウェアによって構成されてもよいし、プロセッサによって構成されてもよいし、双方を含んで構成されてもよい。
【0060】
第三収集機能部17は、一つ又は複数の第三のデータソース23、及び一つ又は複数の第三のデータソース23の状態を管理する管理システム24と通信可能であり、第三のデータソース23又は管理システム24から、第三のデータソース23の状態変化が通知されると、第三のデータソース23にアクセスして、データを受信する。第三のデータソース23は、例えば通信装置であり、管理システム24は、通信装置のインベントリ管理を行うエレメントマネジメントシステム(EMS)である。インベントリ管理とは、ネットワーク上に接続されている通信装置のハードウェア構成、ソフトウェア構成などの情報を、一元管理することをいう。エレメントマネジメントシステム(EMS)とは、ネットワークを構成している各通信装置(エレメント)を直接管理するためのシステムである。本実施例では、第三のデータソース23と、管理システム24とをそれぞれ1つであるとして説明するが、2台以上の第三のデータソース23及び管理システム24が通信網に接続されていてもよい。
【0061】
図11に示すように、第三のデータソース23と、管理システム24と、第三収集機能部17とは、次の(1)から(3)の順序で連携して動作する。(1)第三のデータソース23は、設定の変更、故障時の状態変化などのイベントを管理システム24に通知する。(2)管理システム24は、第三のデータソース23からの通知を受けて、第三収集機能部17に該イベントの通知を行う。第三のデータソース23は、直接第三収集機能部17に状態の変化などのイベントを通知してもよい。(3)第三収集機能部17は、第三のデータソース23又は管理システム24から、第三のデータソース23の状態変化が通知されると、第三のデータソース23にアクセスして、データを受信する。このように、第三のデータソース23は、Push型情報配信を行うと共にPull型情報配信を行うデータソースである。すなわち、第三のデータソース23は、第三収集機能部17からリクエストしなくても、能動的に状態の変化の通知を送信すると共に、第三収集機能部17からのアクセスに基づいて、受動的にデータを送信する。第三収集機能部17は、第三のデータソース23が通信装置である場合には、telnet、sshなどを用いて第三のデータソース23に接続し、状態を取得するためのコマンドを発行し、応答を記録する。さらに応答から、例えば通信リンクに収容される回線の変化、インターフェースの接続関係の変化などの情報が抽出される。
【0062】
図12は、第三の実施形態に係るデータセット作成装置3が実行するデータセット作成方法の一例を示すフローチャートである。
【0063】
ステップS301では、第一収集機能部11が、一つ又は複数の第一のデータソース21から定期又は不定期に配信されるデータを受信する。
【0064】
ステップS302では、第二収集機能部12が、一つ又は複数の第二のデータソース22にアクセスして、予め設定された任意の周期でデータを受信する。
【0065】
ステップS303では、第三収集機能部17が、第三のデータソース23又は管理システム24から、第三のデータソース23の状態変化の通知を受信する。
【0066】
ステップS304では、第三収集機能部17が、第三のデータソース23の状態変化が通知されると、第三のデータソース23にアクセスして、データを受信する。ステップS301の処理、ステップS302の処理、及びステップS303からS304の処理は、図12に示すように、並行して行われてもよいし、いずれか一方の処理が先に、他方の処理が後から行われてもよい。
【0067】
ステップS305では、記録判定部16が、第一収集機能部11が受信したデータと、データ記録部13に記録されたデータとを比較する。データの内容に差分が認められた場合には、記録判定部16は、データの更新があったものと判定して、第一収集機能部11が受信したデータをデータ記録部13に送信して記録させる。データの内容に差分が認められない場合には、記録判定部16は、データの更新がなかったものと判定して、該データをデータ記録部13に送信しないで、第一収集機能部11からの次のデータの受信を待つ。
【0068】
ステップS306では、記録判定部16が、第二収集機能部12が受信したデータと、データ記録部13に記録されたデータとを比較する。データの内容に差分が認められた場合には、記録判定部16は、データの更新があったものと判定して、第二収集機能部12が受信したデータをデータ記録部13に送信して記録させる。データの内容に差分が認められない場合には、記録判定部16は、データの更新がなかったものと判定して、該データをデータ記録部13に送信しないで、第二収集機能部12からの次のデータの受信を待つ。
【0069】
ステップS307では、記録判定部16が、第三収集機能部17が受信したデータと、データ記録部13に記録されたデータとを比較する。データの内容に差分が認められた場合には、記録判定部16は、データの更新があったものと判定して、第三収集機能部17が受信したデータをデータ記録部13に送信して記録させる。データの内容に差分が認められない場合には、記録判定部16は、データの更新がなかったものと判定して、該データをデータ記録部13に送信しないで、第三収集機能部17からの次のデータの受信を待つ。
【0070】
ステップS308では、データ記録部13が、記録判定部16から送信されたデータを記録する。
【0071】
ステップS309では、計算機能部14が、データ記録部13に記録されたデータから、複数の特徴量を抽出する。
【0072】
ステップS310では、計算機能部14が、抽出された複数の特徴量を所定の時間間隔でそれぞれ時系列化する。
【0073】
ステップS311では、計算機能部14が、時系列化された複数の特徴量を結合して一つのデータセットを作成する。
【0074】
本実施形態に係るデータセット作成装置3によれば、第三のデータソース23又は管理システム24からの通知に基づいて特徴量の発生を認識することが可能となるため、データの発生時にのみデータを取得する、より効率の良いデータ収集が可能となる。
【0075】
上記のデータセット作成装置1、2、及び3を機能させるために、プログラム命令を実行可能なコンピュータを用いることも可能である。図13は、データセット作成装置として機能するコンピュータ100の概略構成を示すブロック図である。ここで、データセット作成装置1、2、及び3として機能するコンピュータ100は、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
【0076】
図13に示すように、コンピュータ100は、プロセッサ110と、記憶部としてROM(Read Only Memory)120、RAM(Random Access Memory)130、及びストレージ140と、入力部150と、出力部160と、通信インターフェース(I/F)170と、を備える。各構成は、データバス180を介して相互に通信可能に接続されている。
【0077】
ROM120は、各種プログラム及び各種データを保存する。RAM130は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ140は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)により構成され、オペレーティングシステムを含む各種プログラム及び各種データを保存する。本開示では、ROM120又はストレージ140に、本開示に係るプログラムが保存されている。
【0078】
プロセッサ110は、具体的にはCPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)などであり、同種又は異種の複数のプロセッサにより構成されてもよい。プロセッサ110は、ROM120又はストレージ140からプログラムを読み出し、RAM130を作業領域としてプログラムを実行することで、上記各構成の制御及び各種の演算処理を行う。なお、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。
【0079】
プログラムは、データセット作成装置1、2、及び3が読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、データセット作成装置1、2、及び3にインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性(non-transitory)の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROM、USB(Universal Serial Bus)メモリなどであってもよい。また、このプログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【0080】
以上の実施形態に関し、更に以下の付記を開示する。
【0081】
(付記項1)
複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセットを作成するデータセット作成装置であって、
メモリーと、
前記メモリーと接続されたコントローラとを備え、
前記コントローラは、
一つ又は複数の第一のデータソースから定期又は不定期に配信される、前記回線または通信装置による前記回線を介した通信に関するデータを受信して前記メモリーに記録させ、
一つ又は複数の第二のデータソースにアクセスして、前記一つ又は複数の第二のデータソースから予め設定された任意の周期で、前記回線または通信装置による前記回線を介した通信に関するデータを受信して前記メモリーに記録させ、
前記メモリーに記録されたデータから、複数の特徴量を抽出し、
前記複数の特徴量を所定の時間間隔でそれぞれ時系列化し、
前記時系列化された前記複数の特徴量を結合して一つのデータセットを作成する、
データセット作成装置。
(付記項2)
前記コントローラは、前記特徴量の時間周期が前記所定の時間間隔よりも小さい場合、前記時間周期内の特徴量の代表値を決定することで、前記特徴量を前記所定の時間間隔で時系列化し、前記特徴量の時間周期が前記所定の時間間隔よりも大きい場合、前記所定の時間間隔ごとに前記特徴量となる値を補完して、前記特徴量を前記所定の時間間隔で時系列化する、付記項1に記載のデータセット作成装置。
(付記項3)
前記コントローラは、受信されたデータと、前記メモリーに記録されたデータとを比較し、データの内容に差分が認められた場合に、前記受信されたデータを前記メモリーに記録させる、付記項1又は2に記載のデータセット作成装置。
(付記項4)
前記コントローラは、一つ又は複数の第三のデータソース、及び前記一つ又は複数の第三のデータソースの状態を管理する管理システムと通信可能であり、
前記コントローラは、前記第三のデータソース又は前記管理システムから、前記第三のデータソースの状態変化が通知されると、前記第三のデータソースにアクセスして、データを受信する、付記項1から3のいずれか一項に記載のデータセット作成装置。
(付記項5)
複数の回線が1つの通信リンクに収容される際に必要となる通信帯域の算出に使用するデータセットを作成するデータセット作成方法であって、
データセット作成装置により、
一つ又は複数の第一のデータソースから定期又は不定期に配信される、前記回線または通信装置による前記回線を介した通信に関するデータを受信するステップと、
一つ又は複数の第二のデータソースにアクセスして、前記一つ又は複数の第二のデータソースから予め設定された任意の周期で、前記回線または通信装置による前記回線を介した通信に関するデータを受信するステップと、
前記受信されたデータを記録するステップと、
前記記録されたデータから、複数の特徴量を抽出するステップと、
前記複数の特徴量を所定の時間間隔でそれぞれ時系列化するステップと、
前記時系列化された複数の特徴量を結合して一つのデータセットを作成するステップと、
を含むデータセット作成方法。
(付記項6)
コンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、前記コンピュータを付記項1から4のいずれか一項に記載のデータセット作成装置として機能させるプログラムを記憶した非一時的記憶媒体。
【0082】
上述の実施形態は代表的な例として説明したが、本開示の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、請求の範囲から逸脱することなく、種々の変形又は変更が可能である。たとえば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
【符号の説明】
【0083】
1,2,3 データセット作成装置
10,10a,10b 制御部(コントローラ)
11 第一収集機能部
12 第二収集機能部
13 データ記録部(メモリー)
14 計算機能部
15,180 データバス
16 記録判定部
17 第三収集機能部
21 第一のデータソース
22,22a,22b,22c 第二のデータソース
23 第三のデータソース
24 管理システム
100 コンピュータ
110 プロセッサ
120 ROM
130 RAM
140 ストレージ
150 入力部
160 出力部
170 通信インターフェース(I/F)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14