(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-07-12
(45)【発行日】2024-07-23
(54)【発明の名称】通信制御装置、通信端末、および通信制御方法
(51)【国際特許分類】
H04W 72/0446 20230101AFI20240716BHJP
H04W 24/02 20090101ALI20240716BHJP
H04W 24/08 20090101ALI20240716BHJP
【FI】
H04W72/0446
H04W24/02
H04W24/08
(21)【出願番号】P 2024086769
(22)【出願日】2024-05-29
【審査請求日】2024-05-29
【早期審査対象出願】
(73)【特許権者】
【識別番号】397036309
【氏名又は名称】株式会社インターネットイニシアティブ
(74)【代理人】
【識別番号】100118902
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100195408
【氏名又は名称】武藤 陽子
(72)【発明者】
【氏名】柿島 純
【審査官】鈴木 重幸
(56)【参考文献】
【文献】特表2023-524156(JP,A)
【文献】欧州特許出願公開第4346262(EP,A1)
【文献】特開2020-071845(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04B 7/24- 7/26
H04W 4/00-99/00
G06N20/00-20/20
(57)【特許請求の範囲】
【請求項1】
無線リソースを分割したリソースブロックごとの利用状況を各クラスタの観測値とした混合確率モデルについて、前記観測値の集合である観測データの分布を設定するように構成された第1設定部と、
設定された前記観測データの分布となるように前記混合確率モデルのパラメータを設定するように構成された第2設定部と、
設定された前記パラメータを有する前記混合確率モデルを、前記リソースブロックの利用状況に関する真の利用情報として、前記真の利用情報に類似する疑似利用情報を生成する生成器と、前記生成器によって生成された前記疑似利用情報と前記真の利用情報とを識別する識別器とを有する生成モデルの敵対的学習を行うように構成された学習部と、
前記学習部によって構築された学習済み生成器を通信制御情報として通信端末に通知するように構成された通知部と
を備える通信制御装置。
【請求項2】
請求項1に記載の通信制御装置において、
前記混合確率モデルは、混合ベルヌーイ分布に従うモデルであり、
前記混合確率モデルのパラメータは、前記各クラスタが前記観測値を発生する確率を表す混合比率、および前記各クラスタで前記リソースブロックが利用される確率の平均を表す平均確率を含む
ことを特徴とする通信制御装置。
【請求項3】
請求項1に記載の通信制御装置において、
前記第1設定部は、クラスタごとに前記観測値が発生する確率を設定する
ことを特徴とする通信制御装置。
【請求項4】
請求項1に記載の通信制御装置において、
前記リソースブロックは、時間領域の前記無線リソースを複数に分割したタイムスロットであり、
前記観測値は、前記タイムスロットごとの前記通信端末による信号の発信の有無を二値データで表した値である
ことを特徴とする通信制御装置。
【請求項5】
請求項1から4のいずれか1項に記載の通信制御装置から通知された前記通信制御情報に基づいて、前記学習済み生成器を用いて前記疑似利用情報を生成するように構成された生成部と、
前記生成部によって生成された前記疑似利用情報に基づいて、使用するリソースブロックを特定するように構成された特定部と、
特定された前記リソースブロックを用いて信号を発信する指示を行う通信制御部と
を備える通信端末。
【請求項6】
無線リソースを分割したリソースブロックごとの利用状況を各クラスタの観測値とした混合確率モデルについて、前記観測値の集合である観測データの分布を設定する第1設定ステップと、
設定された前記観測データの分布となるように前記混合確率モデルのパラメータを設定する第2設定ステップと、
設定された前記パラメータを有する前記混合確率モデルを、前記リソースブロックの利用状況に関する真の利用情報として、前記真の利用情報に類似する疑似利用情報を生成する生成器と、前記生成器によって生成された前記疑似利用情報と前記真の利用情報とを識別する識別器とを有する生成モデルの敵対的学習を行う学習ステップと、
前記学習ステップで構築された学習済み生成器を通信制御情報として通信端末に通知する通知ステップと
を備える通信制御方法。
【請求項7】
請求項6に記載の通信制御方法において、
前記第1設定ステップは、クラスタごとに前記観測値が発生する確率を設定する
ことを特徴とする通信制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通信制御装置、通信端末、および通信制御方法に関する。
【背景技術】
【0002】
近年、スマートフォンやタブレット端末に加え、家電、電力や水道、ガスのスマートメータ等のIoT端末が普及している。IoT端末の数が膨大となる一方で、IoT端末の通信におけるトラヒックの制御が課題となっている。例えば、複数のIoT端末の電源立ち上げの際には、トラヒックが集中することでバーストトラヒックの発生の一因にもなっている。
【0003】
そこで、特許文献1は、時刻同期サーバからの各IoT端末への配信時刻をコントロールすることにより、周期的にトラヒックを発生するIoT端末の通信におけるトラヒックの平滑化や輻輳の低減を行う技術を開示している。しかし、特許文献1が開示する通信制御システムでは、周期的に発生しないトラヒックの場合の制御を同様に行うことは困難である。このように、特許文献1が開示する通信制御システムでは、周期的に発生するトラヒックか否かにかわらず、ネットワーク管理者が意図する平準化された状態のトラヒックなどを実現するために、無線リソースの利用状況を制御することは困難であった。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来の技術によれば、意図した通信トラヒックの状態となるように、IoT端末に対して無線リソースの利用に関する通信制御を行うことが困難であった。
【0006】
本発明は、上述した課題を解決するためになされたものであり、意図した通信トラヒックの状態となるように、IoT端末に対して無線リソースの利用に関する通信制御を行うことを目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決するために、本発明に係る通信制御装置は、無線リソースを分割したリソースブロックごとの利用状況を各クラスタの観測値とした混合確率モデルについて、前記観測値の集合である観測データの分布を設定するように構成された第1設定部と、設定された前記観測データの分布となるように前記混合確率モデルのパラメータを設定するように構成された第2設定部と、設定された前記パラメータを有する前記混合確率モデルを、前記リソースブロックの利用状況に関する真の利用情報として、前記真の利用情報に類似する疑似利用情報を生成する生成器と、前記生成器によって生成された前記疑似利用情報と前記真の利用情報とを識別する識別器とを有する生成モデルの敵対的学習を行うように構成された学習部と、前記学習部によって構築された学習済み生成器を通信制御情報として通信端末に通知するように構成された通知部とを備える。
【0008】
また、本発明に係る通信制御装置において、前記混合確率モデルは、混合ベルヌーイ分布に従うモデルであり、前記混合確率モデルのパラメータは、前記各クラスタが前記観測値を発生する確率を表す混合比率、および前記各クラスタで前記リソースブロックが利用される確率の平均を表す平均確率を含んでいてもよい。
【0009】
また、本発明に係る通信制御装置において、前記第1設定部は、クラスタごとに前記観測値が発生する確率を設定してもよい。
【0010】
また、本発明に係る通信制御装置において、前記リソースブロックは、時間領域の前記無線リソースを複数に分割したタイムスロットであり、前記観測値は、前記タイムスロットごとの前記通信端末による信号の発信の有無を二値データで表した値であってもよい。
【0011】
上述した課題を解決するために、本発明に係る通信端末は、上記の通信制御装置から通知された前記通信制御情報に基づいて、前記学習済み生成器を用いて前記疑似利用情報を生成するように構成された生成部と、前記生成部によって生成された前記疑似利用情報に基づいて、使用するリソースブロックを特定するように構成された特定部と、特定された前記リソースブロックを用いて信号を発信する指示を行う通信制御部とを備える。
【0012】
上述した課題を解決するために、本発明に係る通信制御方法は、無線リソースを分割したリソースブロックごとの利用状況を各クラスタの観測値とした混合確率モデルについて、前記観測値の集合である観測データの分布を設定する第1設定ステップと、設定された前記観測データの分布となるように前記混合確率モデルのパラメータを設定する第2設定ステップと、設定された前記パラメータを有する前記混合確率モデルを、前記リソースブロックの利用状況に関する真の利用情報として、前記真の利用情報に類似する疑似利用情報を生成する生成器と、前記生成器によって生成された前記疑似利用情報と前記真の利用情報とを識別する識別器とを有する生成モデルの敵対的学習を行う学習ステップと、前記学習ステップで構築された学習済み生成器を通信制御情報として通信端末に通知する通知ステップとを備える。
【0013】
また、本発明に係る通信制御方法において、前記第1設定ステップは、クラスタごとに前記観測値が発生する確率を設定してもよい。
【発明の効果】
【0014】
本発明によれば、設定されたパラメータを有する混合確率モデルを、リソースブロックの利用状況に関する真の利用情報として、真の利用情報に類似する疑似利用情報を生成する生成器と、生成器によって生成された疑似利用情報と前の割当て情報とを識別する識別器とを有する生成モデルの敵対的学習を行う。そのため、意図した通信トラヒックの状態となるように、IoT端末に対して無線リソースの利用に関する通信制御を行うことができる。
【図面の簡単な説明】
【0015】
【
図1】
図1は、本発明の実施の形態に係る通信制御装置および通信端末を備える通信制御システムの構成を示すブロック図である。
【
図2】
図2は、本実施の形態に係る通信制御システムの概要を説明するための図である。
【
図3】
図3は、本実施の形態に係る通信制御装置が備える学習部を説明するための図である。
【
図4】
図4は、本実施の形態に係る通信制御装置が備える学習部を説明するための図である。
【
図5】
図5は、本実施の形態に係る通信制御装置が備える学習部を説明するための図である。
【
図6】
図6は、本実施の形態に係る通信制御装置のハードウェア構成を示すブロック図である。
【
図7】
図7は、本実施の形態に係る通信端末のハードウェア構成を示すブロック図である。
【
図8】
図8は、本実施の形態に係る通信制御システムの動作を示すシーケンス図である。
【
図9】
図9は、本実施の形態に係る通信制御装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0016】
以下、本発明の好適な実施の形態について、
図1から
図9を参照して詳細に説明する。
【0017】
[通信制御システムの構成]
まず、
図1を参照して、本発明の実施の形態に係る通信制御装置1および通信端末2を備える通信制御システムの概要について説明する。
【0018】
通信制御システムは、LTE/4G、5G、6Gなどのモバイル通信ネットワークに設けられる。通信制御装置1と通信端末2とは、WANやインターネットなどのネットワークNWを介して接続されている。通信制御装置1は、通信制御情報を、ネットワークNWを介して通信端末2に通知する。また、通信端末2は、通知された通信制御情報に基づいて、使用できるタイムスロットを特定し、特定されたタイムスロットを使用して信号を発信する。
【0019】
通信端末2は、スマートフォンなどの携帯通信端末、タブレット型コンピュータ、ラップトップ型コンピュータ、センサ機器など、固有のIPアドレスを有するIoT端末で実現される。本実施の形態では、通信端末2は複数存在する。例えば、通信端末2がK台(Kは2以上の整数。)のスマートフォンである場合、電源立ち上げの際や一定周期で、さらには、通信端末2の移動にともない位置登録要求信号を図示されないコアネットワークに発信する。K台の通信端末2が一定期間に同時に信号を発信すると、トラヒックが増加し、ネットワークは新たなパケットを処理することができず、遅延やトラヒックの輻輳などが生ずる場合がある。なお、通信端末2の構成の詳細は後述する。
【0020】
本実施の形態に係る通信制御システムでは、無線リソースの利用状況を混合ベルヌーイ分布によりモデル化した混合確率モデルを採用する。通信制御システムは、トラヒックの平準化など意図した通信トラヒックの状態を反映するようにパラメータが設定された混合確率モデルを敵対的学習の真のデータとして、真のデータに類似する疑似データを生成する生成器121を学習する。また、通信制御システムは、学習済み生成器121’を、各タイムスロット(リソースブロック)の利用の可否を示す通信制御情報として、通信端末2に通知する。そして、各通信端末2は利用が可能なタイムスロットを使用して信号を発信する。
【0021】
[通信制御装置の機能ブロック]
次に、本実施の形態に係る通信制御装置1の機能ブロックについて、
図1のブロック図を参照して説明する。
図1に示すように、通信制御装置1は、第1設定部10、第2設定部11、学習部12、第1記憶部13、および通知部14を備える。
【0022】
第1設定部10は、無線リソースを分割したタイムスロットごとの利用状況を各クラスタの観測値とした混合確率モデルについて、観測値の集合である観測データの分布を設定する。本実施の形態では、混合確率モデルとして混合ベルヌーイ分布に従うモデルを採用する。観測値は、タイムスロットごとの通信端末2による信号の発信の有無を二値データで表した値である。
【0023】
本実施の形態において採用される混合ベルヌーイ分布は、0と1とを要素とする長さDのベクトルが作るN個の観測データがあるとき、その集合をクラスタリングするモデルである。本実施の形態では、無線リソースの利用状況を複数のクラスタとして考え、複数のタイムスロット各々での信号の発信の有無を0と1で表した観測値の集合を観測データとする。また、観測値は、二値分布を有する複数の異なるクラスタから発生する。
【0024】
ここで、N個の二値ベクトルである観測値x1,x2,…,xNの集合の観測データXが、K個のクラスタのパラメータμ1,μ2,…,μKの集合すなわちパラメータデータセットMをもつ混合ベルヌーイ分布に従うものとする。すなわち、観測データXが複数のクラスタから生成されると仮定し、各クラスタには、信号の発信が有る確率の平均(平均確率)を表すパラメータμが対応付けられている。
【0025】
観測データXとパラメータデータセットMとは、それぞれ次式(1)、(2)のように表される(Tは転置記号である。)。
【数1】
【0026】
n番目の二値ベクトルの観測値x
nとk番目のパラメータベクトルμ
kの各々は、さらに、以下の式(3)、(4)に示すようにそれぞれがD個の要素をもつベクトルとして表される。
【数2】
【0027】
観測値x
nの要素x
n(i)(i=1,2,…,D)の各々は、前述したように0または1の値をとる二値変数である。本実施の形態では、要素x
n(i)を以下のように定義する。
【数3】
【0028】
信号を発信する確率、および信号を発信しない確率は、それぞれ次式(6)、(7)で表される。
【数4】
【0029】
上式(6)、(7)から、観測データXの観測値x
nにクラスタkが割り当てられたときに、観測値x
nは、クラスタkのパラメータμ
kをもつ、次式(8)のベルヌーイ分布に従う。
【数5】
【0030】
ここで、各クラスタ(K個)の発生頻度のパラメータデータセットπを以下のように定義する。パラメータπは、観測値x
nがどの程度各クラスタに配分されるのかを示すパラメータである。したがって、パラメータπ
kは、観測データXの観測値x
nがクラスタkで発生する混合比率である。
【数6】
【0031】
また、観測値x
nにクラスタkが割り当てられたときに、観測値x
nは、μ
kをパラメータとするD個のベルヌーイ分布に従う。さらに、各観測値x
nは、次式(10)の混合ベルヌーイ分布によって独立に生成されるものとする。
【数7】
【0032】
上式(10)の混合ベルヌーイ分布の定義式により、各クラスタにおけるベルヌーイ分布の確率を示すパラメータμkと、そのクラスタの混合比率πkとを組み合わせて、全てのクラスタから、観測値xnが発生する確率を求めることができる。上式(10)は、本実施の形態における混合確率モデルであり、無線リソースの1~D個のタイムスロットの利用状況を表している。
【0033】
第1設定部10は、各クラスタの1~D個の観測値xnのうち、信号の発信有り「1」をとる要素の個数や頻度などを、所望とされる1~D個のタイムスロットの利用パターンに応じて設定することができる。また、第1設定部10は、複数のクラスタ1~Kの全体での、信号の発信有り「1」をとる観測値xnの発生確率を設定することができる。したがって、第1設定部10は、複数の異なるクラスタごとに、所望とされる無線リソースの利用状況を反映した観測データXの分布を設定することができる。クラスタごとに観測値xnの発生確率を設定することで、通信端末2ごとの1~D個のタイムスロットでの信号の発信の可否を設定することが可能となる。
【0034】
図2は、第1設定部10による観測データXの分布の設定を説明するための図である。
図2に示すクラスタ1~Kは、利用可能な無線リソースの全体を表す。各クラスタを構成する「1~D」は、1~D個のタイムスロットを利用した信号の発信の有無を示す観測値x
nである。
図2に示すように、各クラスタの1~Dの各データは、信号の発信を許可するタイムスロット(図中の黒丸点の「発信」)と、許可しないタイムスロット(図中の黒丸点以外のデータ)とが設定されている。
【0035】
図2の例では、複数のクラスタ1~Kの各々で、1~D個のタイムスロットのうち、1つのタイムスロットを各通信端末2に割り当てる。各クラスタの1~D個のタイムスロットの時間は互いに対応しており、複数のクラスタ1~K間で各通信端末2が信号を発信する際に使用するタイムスロットの時間が重ならないように設定されている。このように、第1設定部10は、1~D個の各タイムスロットで均等な確率で信号を発信するクラスタを設定することができる。第1設定部10は、通信トラヒックが平準化されるような観測データXの具体的な値を設定する場合の他、通信ネットワークの具体的な設計などに応じて、タイムスロットの特定の利用状況のパターンが反映された観測データXの値を設定することができる。
【0036】
図1に戻り、第2設定部11は、第1設定部10によって設定された観測データXの分布となるように混合確率モデルのパラメータを設定する。より具体的には、第2設定部11は、上式(10)の混合確率モデルに、第1設定部10により設定された観測データXの値を与えた際の、パラメータμ
k、π
kの値を求める。前述した
図2の例を用いると、第1設定部10によって1~D個の各タイムスロットに均等な確率で信号を発信するクラスタが設定された場合、第2設定部11は、均等な値のパラメータμ
k、π
kを設定することができる。このようにして、各クラスタから観測値x
nが発生する確率を均等にすることができる。各クラスタから観測値x
nが発生する確率を事前に設定した混合確率モデルは、以下の学習部12による敵対的学習の際の真のデータとして用いられる。
【0037】
学習部12は、第2設定部11により設定されたパラメータμk、πkを有する混合確率モデルを、通信端末2に割り当てるタイムスロットを示す真の利用情報として、真の利用情報に類似する疑似利用情報を生成する生成器121と、生成器121によって生成された疑似利用情報と真の利用情報とを識別する識別器122とを有する生成モデルの敵対的学習を行う。真の利用情報は、所望とされる通信トラヒックの状態となるような無線リソースの利用状況が反映された情報である。学習部12は、混合確率モデルの1~K個のクラスタの各々について、学習済み生成器121’を構築することができる。
【0038】
学習部12は、
図3に示すように、生成器121および識別器122を有するGAN(Generative Adversarial Network)を敵対的に学習させる。本実施の形態では、生成器121と識別器122とのペアをクラスタの数だけ(K個)設けることができる。あるいは、
図3に示すように、K個の生成器121_1,・・・,121_Kに対して1つの識別器122を設けることができる。学習部12の学習により、K個の学習済み生成器121’(学習済み生成器121’_1,・・・,121’_K)が構築される。
【0039】
図4および
図5は、学習部12が用いるGANの生成器121および識別器122のニューラルネットワーク構成を模式的に表した図である。
図4に示すように、生成器121は、入力層、隠れ層、および出力層を有するニューラルネットワークで構成される。なお、K個の生成器121_1,・・・,121_Kはそれぞれ同じネットワーク構造を有し、以下では生成器121と総称して説明する。生成器121は、ランダムな雑音から疑似利用情報を生成するモデルである。生成器121の入力ノードには、例えば、ガウス雑音のベクトルがランダムにm個サンプルされて入力される(z
1~z
m)。
【0040】
生成器121は、入力と重みパラメータの積和演算および活性化関数によるしきい値処理を経て出力G(z)を出力する。生成器121からの出力G(z)は、第2設定部11が設定したパラメータμ
k、π
kを有する混合確率モデルにより得られる観測データXに類似するデータである。より具体的には、生成器121は、設定されたパラメータμ
k、π
kを有する混合確率モデルにより得られる各クラスタの1~D個の観測値x
nに類似するデータを生成する。
図4の各出力G(z
1)~G(z
D)は、1つのクラスタの1~D個の観測値x
nの各々に対応する。生成器121を構成するニューラルネットワークとしてCNNやResNetを用いることができる。
【0041】
図5に示す識別器122は、入力層、隠れ層、および出力層を有するニューラルネットワークで構成される。
図5の例では、訓練データの入力として、第2設定部11により設定されたパラメータμ
k、π
kを有する混合確率モデルによって得られる、各クラスタの1~D個の観測値x
nが与えられる。
【0042】
識別器122は、入力と重みパラメータの積和演算および活性化関数によるしきい値処理を経て、1または0の二値出力を出す。識別器122は、入力された真の利用情報に係る訓練データを正しく真の利用情報であると識別すると出力y=1を出力する。一方、入力された疑似利用情報に係る訓練データを正しく疑似利用情報であると識別すると出力y=0を出力する。このように、識別器122は、生成器121が生成したモデル分布を真の分布である訓練データのデータ分布から区別するモデルである。識別器122を構成するニューラルネットワークとしてCNNを用いることができる。
【0043】
図3は、学習部12によるGANの敵対的学習を説明するためのブロック図である。学習部12が採用するGANの生成器121を関数G、識別器122を関数Dと表す。また、真の利用情報をx、識別器122による出力である予測値はyと表し、正解ラベルをtと表す。正解ラベルtは、真の利用情報に対して1、生成器121で生成された疑似利用情報に対して0と設定される。このとき、識別器122は、二値分類問題として次式(1)の交差エントロピーE
CEで表すことができる。
【0044】
【0045】
上式(11)のブレース内の第1項が表すtnlnynにおいて、識別器122の予測値ynが、真の利用情報の正解ラベルtn=1の値に近づくことが望ましい。一方、ブレース内の第2項が表す(1-tn)ln(1-yn)においては、識別器122の予測値ynが、疑似利用情報と識別する正解ラベルの値(1-tn)=0に近づくことが望ましい。このように交差エントロピーECEは、予測値が正解ラベルの値に一致している場合に最大値となる。
【0046】
ここで、GANを構成する生成器121は、パラメータw
G,θ
Gを有し、関数G(w
G,θ
G)と表す。また、識別器122は、パラメータw
D,θ
Dを有し、関数D(w
D,θ
D)と表す。上式(11)の交差エントロピーE
CEに基づいた生成器121と識別器122とを備えるGANの目的関数Eは、次式(12)で表すことができる。
【数9】
【0047】
上式(12)の第1項が表すED(x)=1lnD(wD,θD)は、識別器122が真の利用情報を真の利用情報であると識別する期待値である。上式(12)の第2項が表すED(x)=0ln(1-D(G(wG,θG),wD,θD))は、生成器121により生成された疑似利用情報を識別器122が疑似利用情報であると識別する期待値である。GANの学習では、目的関数Eのmin-max最適化により、生成器121と識別器122とを敵対的に学習する。したがって、識別器122をだますような疑似利用情報を生成できるように生成器121を学習し、生成器121が生成した疑似利用情報を疑似利用情報であると識別するように識別器122を学習する。
【0048】
識別器122の学習では、真の利用情報が与えられた場合に、識別器122がy=1に近い出力を出すことで、上式(12)の目的関数Eの第1項を最大化する。一方、疑似利用情報が与えられた場合に、識別器122がy=0に近い出力を出すことで目的関数Eの第2項を最大化するように学習が行われる。
【0049】
生成器121の学習では、上式(12)のD(G(w
G,θ
G),w
D,θ
D)(
図3のD(G(z)))が1に近くなるようなG(w
G,θ
G)(
図3のG(z))を出力することで、目的関数Eを最小化する。学習部12は、生成器121のパラメータと識別器122のパラメータとを交互に更新する学習手順を用いる。なお、学習部12による生成器121および識別器122の学習手順の詳細は後述する。
【0050】
第1記憶部13は、学習部12によってGANの目的関数Eが最適化された学習済み生成器121’を記憶する。より詳細には、第1記憶部13は、クラスタ1~Kに対応するK個の学習済み生成器121’(学習済み生成器121’_1,・・・,121’_K)を記憶する。また、第1記憶部13は、パラメータμk、πkが設定された上式(10)の混合確率モデルを記憶する。
【0051】
通知部14は、学習部12によって構築された学習済み生成器121’を通信制御情報として、通信端末2に通知する。より詳細には、通知部14は、ネットワークNWを介して、例えば、K台の通信端末2の各々に、1~K個の学習済み生成器121’_1,・・・,121’_Kのうちの任意の1つの学習済み生成器121’を通信制御情報として通知することができる。
【0052】
[通信端末の機能ブロック]
次に、通信端末2の機能ブロックについて説明する。
図1に示すように、通信端末2は、取得部20、第2記憶部21、生成部22、特定部23、および通信制御部24を備える。
【0053】
取得部20は、通信制御装置1から通知された通信制御情報を取得する。具体的には、取得部20は、第2記憶部21に記憶されている通信制御情報の学習済み生成器121’を取得することができる。
【0054】
第2記憶部21は、通信制御装置1から通知された通信制御情報を記憶する。具体的には、第2記憶部21は、学習済み生成器121’を記憶する。学習済み生成器121’は、通信制御装置1の学習部12による学習によって構築されたK個の学習済み生成器121’_1,・・・,121’_Kのうちの1つである。
【0055】
生成部22は、通信制御装置1から通知された通信制御情報に基づいて、学習済み生成器121’を用いて疑似利用情報を生成する。生成部22によって生成される疑似利用情報は、上式(3)の観測値x
nのデータセットにあるように、1~D個のタイムスロット各々に、信号を発信する「1」および信号を発信しない「0」のそれぞれの値が割り当てられた情報である。例えば、
図2の「クラスタ1」の例では、疑似利用情報は、第1スロットで信号の発信を許可し、第2から第Dスロットでの信号の発信は許可されない(x
n=[x
n(1),x
n(2),x
n(3),・・・,x
n(D)]=[1,0,0,・・・,0])ことを示す。
【0056】
特定部23は、生成部22によって生成された疑似利用情報に基づいて、通信端末2が使用するタイムスロットを特定する。具体的には、特定部23は、1~D個のタイムスロットのうち、疑似利用情報の要素xn(i)のうち、値が「1」を取るタイムスロットを特定する。特定部23によって特定されたタイムスロットは、通信端末2が信号を発信する際に利用することが許可されるタイムスロットである。
【0057】
通信制御部24は、特定されたタイムスロットを用いて信号を発信する指示を行う。具体的には、通信制御部24は、図示されない基地局とのタイミングの同期、信号の生成、および信号の発信を自装置のプロセッサ202に指示することができる。通信制御部24の通信制御指示により、通信端末2は利用が許可されたタイムスロットを用いて信号を発信する。
【0058】
[通信制御装置のハードウェア構成]
次に、上述した機能を有する通信制御装置1を実現するハードウェア構成の一例について、
図6を用いて説明する。
【0059】
図6に示すように、通信制御装置1は、例えば、バス101を介して接続されるプロセッサ102、主記憶装置103、通信インターフェース104、補助記憶装置105、入出力I/O106を備えるコンピュータと、これらのハードウェア資源を制御するプログラムによって実現することができる。さらに、通信制御装置1は、表示装置107を備える。
【0060】
プロセッサ102は、CPU、GPU、FPGA、ASICなどによって実現される。
【0061】
主記憶装置103には、プロセッサ102が各種制御や演算を行うためのプログラムが予め格納されている。プロセッサ102と主記憶装置103とによって、
図1に示した第1設定部10、第2設定部11、学習部12、および通知部14など通信制御装置1の各機能が実現される。
【0062】
通信インターフェース104は、通信制御装置1と各種外部電子機器との間をネットワーク接続するためのインターフェース回路である。
【0063】
補助記憶装置105は、読み書き可能な記憶媒体と、その記憶媒体に対してプログラムやデータなどの各種情報を読み書きするための駆動装置とで構成されている。補助記憶装置105には、記憶媒体としてハードディスクやフラッシュメモリなどの半導体メモリを使用することができる。
【0064】
補助記憶装置105は、通信制御情報を生成し通信端末2に通知する通信制御プログラムを格納するプログラム格納領域を有する。また、補助記憶装置105は、通信制御装置1が実行するGANの敵対的学習を行うための学習プログラムを格納するプログラム格納領域を有する。また、補助記憶装置105は、混合ベルヌーイ分布に係る混合確率モデルの演算を行う混合確率モデル演算プログラムを格納するプログラム格納領域を有する。補助記憶装置105によって、
図1で説明した第1記憶部13が実現される。さらには、例えば、上述したデータやプログラムなどをバックアップするためのバックアップ領域などを有していてもよい。
【0065】
入出力I/O106は、外部機器からの信号を入力したり、外部機器へ信号を出力したりする入出力装置である。
【0066】
表示装置107は、有機ELディスプレイや液晶ディスプレイなどによって構成される。表示装置107は、真の利用情報を画面表示させることができる。
【0067】
[通信端末のハードウェア構成]
次に、上述した機能を有する通信端末2を実現するハードウェア構成の一例について、
図7を用いて説明する。
【0068】
図7に示すように、通信端末2は、通信制御装置1と同様に、バス201を介して接続されるプロセッサ202、主記憶装置203、通信インターフェース204、補助記憶装置205、入出力I/O206を備えるコンピュータと、これらのハードウェア資源を制御するプログラムによって実現することができる。さらに、通信端末2は、表示装置207を備える。
【0069】
主記憶装置203には、プロセッサ202が各種制御や演算を行うためのプログラムが予め格納されている。CPU、GPU、FPGA、ASICなどによって実現されるプロセッサ202と主記憶装置203とによって、
図1に示した取得部20、生成部22、特定部23、および通信制御部24など通信端末2の各機能が実現される。また、主記憶装置203は、IPアドレスを保存する。
【0070】
通信インターフェース204は、通信端末2と各種外部電子機器との間をネットワーク接続するためのインターフェース回路である。
【0071】
補助記憶装置205は、読み書き可能な記憶媒体と、その記憶媒体に対してプログラムやデータなどの各種情報を読み書きするための駆動装置とで構成されている。補助記憶装置205には、記憶媒体としてハードディスクやフラッシュメモリなどの半導体メモリを使用することができる。
【0072】
補助記憶装置205は、通信制御情報に基づいて、学習済み生成器121’の演算を行う生成プログラムを格納するプログラム格納領域を有する。また、補助記憶装置105は、特定されたタイムスロットで信号を発信するための通信制御プログラムを格納するプログラム格納領域を有する。補助記憶装置205によって、
図1で説明した第2記憶部21が実現される。さらには、例えば、上述したデータやプログラムなどをバックアップするためのバックアップ領域などを有していてもよい。
【0073】
入出力I/O206は、外部機器からの信号を入力したり、外部機器へ信号を出力したりする入出力装置である。
【0074】
表示装置207は、有機ELディスプレイや液晶ディスプレイなどによって構成される。
【0075】
SIM208は、ICチップ、セキュリティモジュール等で構成され、通信端末2のユーザの加入者識別番号(IMSI:International Mobile Subscriber Identity)、加入者であるユーザの電話番号(MSISDN:Mobile Subscriber International Subscriber Directory Number)、SIMカード番号(ICCID:Integrated Circuit Card Identifier)などの識別子情報が含まれる。通信端末2は、SIM208のIMSIによって一意に識別されることができる。
【0076】
[通信制御システムの動作シーケンス]
次に、上述した構成を有する通信制御装置1および通信端末2を備える通信制御システムの動作を、
図8のシーケンスを参照して説明する。
【0077】
図8に示すように、まず、通信制御装置1の第1設定部10は、混合確率モデルにおいて所望とされる観測データXの分布を設定する(ステップS1)。具体的には、第1設定部10は、通信トラヒックが平準化された状態など、意図した無線リソースの利用状況が反映されるように、クラスタごとに1~D個のタイムスロットのうち、信号の発信を許可するタイムスロットの数および頻度などを指定した観測データXの観測値x
n(x
n=[x
n(1),x
n(2),x
n(3),・・・,x
n(D)])を設定する。このように、ステップS1において、各クラスタから観測値x
nが発生する確率を均等とする、あるいは特定の偏りを有するように観測データXの値を設定することができる。
【0078】
次に、第2設定部11は、ステップS1で設定された観測データXの分布となるように混合確率モデルのパラメータμk、πkを設定する(ステップS2)。具体的には、第2設定部11は、上式(10)の混合確率モデルに、クラスタごとに観測値xnの発生確率が設定された観測データXを与えた際の、パラメータμk、πkを調整および決定する。パラメータμk、πkが設定された混合確率モデルは、第1記憶部13に記憶される。
【0079】
続いて、学習部12は、学習処理を行う(ステップS3)。具体的には、学習部12は、ステップS2で設定されたパラメータμk、πkを有する混合確率モデルを、タイムスロットの利用状況に関する真の利用情報として、真の利用情報に類似する疑似利用情報を生成する生成器121と、生成器121によって生成された疑似利用情報と真の利用情報とを識別する識別器122とを有するGANの敵対的学習を行う。学習処理によって、クラスタ1~Kにそれぞれ対応するK個の学習済み生成器121’_1,・・・,121’_Kが構築され、第1記憶部13に記憶される。なお、ステップS3での学習処理の詳細は後述する。
【0080】
次に、通知部14は、ステップS3で学習部12によって構築された学習済み生成器121’を通信制御情報として、ネットワークNWを介して通信端末2に通知する(ステップS4)。通知部14は、クラスタごとに構築されたK個の学習済み生成器121_1,・・・,121’_Kのうちの1つを任意に選択し、複数の通信端末2の各々に通知することができる。
【0081】
続いて、通信端末2は、通信制御装置1からの通信制御情報の通知があると、通信制御情報の学習済み生成器121’を第2記憶部21に記憶する。その後、通信端末2の取得部20は、第2記憶部21から学習済み生成器121’を読出すことで取得する(ステップS5)。
【0082】
次に、生成部22は、ステップS5で取得された学習済み生成器121’を用いて疑似利用情報を生成する(ステップS6)。その後、特定部23は、ステップS6で生成された疑似利用情報に基づいて、通信端末2が信号を発信する際に使用することが許可されたタイムスロットを特定する(ステップS7)。次に、通信制御部24は、ステップS7で特定されたタイムスロットを用いて、信号を発信する指示を行う(ステップS8)。
【0083】
ステップS8での指示に応じて、通信端末2のプロセッサ202は、特定されたタイムスロットを用いて信号を発信する(ステップS9)。なお、他の通信端末2についても、同様に、ステップS5からステップS9までの処理を実行し、それぞれで特定されたタイムスロットを使用して信号を発信する。このように、通信制御情報にしたがって特定されたタイムスロットを通信端末2に割り当てることで、複数の通信端末2が発信する信号による通信トラヒックを意図した状態とすることができる。
【0084】
例えば、
図2に示すように、学習済み生成器121’_1を用いてクラスタ1の疑似利用情報を生成した通信端末2は、第1タイムスロットを使用して信号を発信する。学習済み生成器121’_2を用いてクラスタ2の疑似利用情報を生成した別の通信端末2は、第2タイムスロットを使用して信号を発信する。学習済み生成器121’_Kを用いてクラスタKの疑似利用情報を生成したK台目の通信端末2は、第Dタイムスロットを使用して信号を発信する。したがって、複数の通信端末2は、各タイムスロットに均等な確率で、かつ、クラスタ間で均等な確率で信号を発信することができる。またその結果として、通信トラヒックが平準化され、無線リソースの効率的な利用につながる。
【0085】
次に、
図9を参照し、
図8で説明した通信制御装置1の学習部12による学習処理(ステップS3)を説明する。
図9に示す学習処理の例では、学習部12は、1~K個のクラスタごとの真の利用情報を繰り返し学習する。まず、学習部12は、真の利用情報を訓練データ124として識別器122に入力し、真の利用情報を真の利用情報(y=1)と識別するように、識別器122のパラメータw
D,θ
Dを学習し、更新する(ステップS20)。
図3の学習部12のブロック図に示すように、
図8のステップS2で設定されたパラメータμ
k、π
kを有する混合確率モデルは、タイムスロットの利用状況に関する真の利用情報として、識別器122を学習する際に入力される訓練データ124として用いられる。ステップS20では、まず、真の利用情報として、クラスタ1~クラスタKのうち、クラスタ1の1~D個の観測値x
nを訓練データ124として用いる。
【0086】
ステップS20において、学習部12は、例えば、誤差逆伝搬法などを用いて識別器122に真の利用情報を学習させることができる。ステップS20により、クラスタ1の真の利用情報を真の利用情報と識別することができる識別器122が事前に構築される。
【0087】
次に、学習部12は、ガウス雑音を発生し、発生したガウス雑音のランダムなベクトルを生成器121に入力として与える(ステップS21)。続いて、生成器121は、与えられたガウス雑音に基づいて、入力zと重みパラメータw
G,θ
Gの積和演算および活性化関数によるしきい値処理を行い、疑似利用情報G(z)を生成する(ステップS22)。ステップS22では、
図3に示すように、学習部12は、K個の生成器121_1,・・・,121_Kの各々で生成された1~K個の出力を合成して(
図3に示す点a)、1つの疑似利用情報G(z)を生成する。
【0088】
次に、学習部12は識別器122の学習を行う。識別器122の学習は、生成器121のパラメータw
D,θ
Dを固定して行われる。まず、学習部12は、
図8のステップS2で設定されたパラメータμ
k、π
kを有する混合確率モデルである、真の利用情報を訓練データ124として識別器122に入力として与える。そして、学習部12は、上式(12)の目的関数Eが最大となるように、誤差逆伝搬法などによりパラメータw
D,θ
Dを更新する(ステップS23)。なお、訓練データ124のラベルは1(真の利用情報)が設定されている。ステップS23では、まず、学習部12は、K個のクラスタ1~クラスタKのうちのクラスタ1の1~D個の観測値x
nを真の利用情報として用いて、識別器122を学習する。
【0089】
次に、学習部12は、ステップS22で生成器121によって生成された疑似利用情報を識別器122に入力として与え、上式(12)の目的関数Eが最大となるように、誤差逆伝搬法などによりパラメータwD,θDを更新する(ステップS24)。すなわち、ステップS23およびステップS24では、上式(12)の目的関数Eを最大にするために、第1項はD(wD,θD)=1が出力され、第2項はD(G(wG,θG),wD,θD)=0となるように最適化が行われる。なお、訓練データ124には、ラベルは0(疑似利用情報)が設定されている。ステップS24では、K個の生成器121_1,・・・,121_Kの各々で生成され、合成された1つの疑似利用情報G(z)を用いて、識別器122を学習する。
【0090】
ステップS23およびステップS24での識別器122の学習は、
図3に示す学習部12のブロック図において、識別器122からの出力123に基づいて、目的関数Eのブロック125で識別器誤差が算出され、その後、識別器122へ誤差逆伝搬されることを示す破線の矢印に対応する。
【0091】
次に、学習部12は生成器121の学習を行う。生成器121の学習では、識別器122のパラメータが固定されて行われる。学習部12は、ランダムなガウス雑音を生成器121に与えた際に疑似利用情報が生成されるように生成器121を学習する。具体的には、学習部12は、上式(12)の目的関数Eを最小とするために、誤差逆伝搬法などによりパラメータwG,θGを更新する(ステップS25)。
【0092】
ステップS25での学習は、
図3の学習部12のブロック図において、生成器121へ誤差逆伝搬されることを示す破線の矢印のフローに対応する。すなわち、ステップS25は、
図3の生成器121で生成された疑似利用情報が識別器122に入力され、その出力123から目的関数Eのブロック125で生成器誤差が算出され、さらには、生成器121へ誤差逆伝搬される破線矢印のフローに対応する。
【0093】
その後、目的関数Eの値がナッシュ均衡に到達して収束するまで(ステップS26:NO)、ステップS22からステップS25までの識別器122および生成器121(生成器121_1~生成器121_K)の学習が繰り返し行われる。一方、目的関数Eの値が収束した場合(ステップS26:YES)、クラスタ1~クラスタKまでのすべての真の利用情報のうち、クラスタ2~クラスタKまでの残りの真の利用情報を順番に用いて、K個の生成器121_1,・・・,121_K、および識別器122の学習が行われるまで(ステップS27:NO)、ステップS20からステップS26までの処理が繰り返される。
【0094】
その後、クラスタ2~クラスタKまでの残りのK-1個のクラスタの真の利用情報を用いて生成器121(生成器121_1,・・・,121_K)および識別器122の学習が行われた場合(ステップS27:YES)、学習部12は、1~K個の学習済み生成器121’_1,・・・,121’_Kを第1記憶部13に記憶する(ステップS28)。以上のステップS20からステップS28までの処理によって学習済み生成器121’が構築される。さらにその後、処理は、
図8のステップS4に移る。
【0095】
以上説明したように、本実施の形態に係る通信制御装置1によれば、無線リソースの利用状況を混合ベルヌーイ分布によりモデル化し、意図した通信トラヒックの状態を表す観測データXの分布となるようにパラメータμk、πkを設定した混合確率モデルをGANの敵対的学習での真のデータとして用いる。さらに、敵対的学習により構築された学習済み生成器121’を通信制御情報として通信端末2に通知するため、意図した通信トラヒックの状態となるように、IoT端末に対して無線リソースの利用に関する通信制御を行うことができる。
【0096】
また、本実施の形態に係る通信制御装置1によれば、意図した通信トラヒックの状態が反映されたパラメータμk、πkが設定された混合確率モデルを、GANの敵対的学習での真のデータである真の利用情報として用い、真の利用情報に類似する疑似利用情報を生成する生成器121を学習する。そのため、GANの敵対的学習を行うことにより、混合ベルヌーイ分布に従う混合確率モデルの潜在変数の学習を行うことができる。
【0097】
また、本実施の形態に係る通信制御装置1によれば、1つの無線リソースの1~D個のタイムスロットの利用状況を混合ベルヌーイ分布の各クラスタの観測値とするので、クラスタごとに無線リソースの利用パターンや頻度を指定することができる。そのため、無線リソースの利用パターンをより詳細に設定し、より効率的なリソース管理を実現することが可能となる。
【0098】
また、本実施の形態に係る通信制御装置1によれば、GANの敵対的学習によって構築された学習済み生成器121’を通信制御情報として、ネットワークNWを介して通信端末2に通知する。そのため、通信トラヒックの制御を遠隔で行うことができる。
【0099】
なお、説明した実施の形態では、無線リソースのリソースブロックがタイムスロットである場合を例示して説明したが、リソースブロックは、周波数帯域における異なるチャネルや空間リソースであってもよい。
【0100】
また、説明した実施の形態では、通信制御装置1がネットワークNWを介して通信端末2に通信制御情報を通知する場合を例示した。しかし、通信制御装置1は、コアネットワークや基地局を介して通信制御情報を各通信端末2に通知する構成であってもよい。
【0101】
以上、本発明の通信制御装置、通信端末、および通信制御方法における実施の形態について説明したが、本発明は説明した実施の形態に限定されるものではなく、請求項に記載した発明の範囲において当業者が想定し得る各種の変形を行うことが可能である。
【符号の説明】
【0102】
1…通信制御装置、2…通信端末、10…第1設定部、11…第2設定部、12…学習部、13…第1記憶部、14…通知部、20…取得部、21…第2記憶部、22…生成部、23…特定部、24…通信制御部、101、201…バス、102、202…プロセッサ、103、203…主記憶装置、104、204…通信インターフェース、105、205…補助記憶装置、106、206…入出力I/O、107、207…表示装置、121…生成器、122…識別器、123…出力、124…訓練データ、125…目的関数Eのブロック、NW…ネットワーク。
【要約】
【課題】意図した通信トラヒックの状態となるように、IoT端末に対して無線リソースの利用に関する通信制御を行うことを目的とする。
【解決手段】
通信制御装置1は、無線リソースを分割したリソースブロックごとの利用状況を各クラスタの観測値とした混合確率モデルについて、観測値の集合である観測データの分布を設定する第1設定部10と、設定された観測データの分布となるように混合確率モデルのパラメータを設定する第2設定部11と、設定されたパラメータを有する混合確率モデルを、リソースブロックの利用状況に関する真の利用情報として、真の利用情報に類似する疑似利用情報を生成する生成器121と識別器122とを有する生成モデルの敵対的学習を行う学習部12と、学習部12によって構築された学習済み生成器121’を通信制御情報として通信端末2に通知する通知部14とを備える。
【選択図】
図1