(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-12
(45)【発行日】2022-12-20
(54)【発明の名称】機械学習を使用してグリッドオブビームを設計するための装置および方法
(51)【国際特許分類】
H04B 7/06 20060101AFI20221213BHJP
G06N 3/08 20060101ALI20221213BHJP
G06N 20/00 20190101ALI20221213BHJP
H04B 7/08 20060101ALI20221213BHJP
H04W 16/28 20090101ALI20221213BHJP
【FI】
H04B7/06 950
G06N3/08
G06N20/00
H04B7/08 800
H04W16/28
(21)【出願番号】P 2021514102
(86)(22)【出願日】2018-09-13
(86)【国際出願番号】 US2018050872
(87)【国際公開番号】W WO2020055408
(87)【国際公開日】2020-03-19
【審査請求日】2021-05-10
(73)【特許権者】
【識別番号】513311642
【氏名又は名称】ノキア ソリューションズ アンド ネットワークス オサケユキチュア
(74)【代理人】
【識別番号】110001173
【氏名又は名称】弁理士法人川口國際特許事務所
(72)【発明者】
【氏名】ナヤック,ディーパク
(72)【発明者】
【氏名】ザジャスウィ,チャンドラシェカール
(72)【発明者】
【氏名】カルヤナサンダラム,スレシュ
(72)【発明者】
【氏名】アグラワル,ラジーブ
(72)【発明者】
【氏名】シュ,ホワ
(72)【発明者】
【氏名】ベデカー,アナンド
(72)【発明者】
【氏名】カプドゥビエル,ベロニク
(72)【発明者】
【氏名】ミハイレスク,クラウディウ
(72)【発明者】
【氏名】クアシ,ボリス
(72)【発明者】
【氏名】フェキ,アフェフ
【審査官】原田 聖子
(56)【参考文献】
【文献】A.Alkhateeb, S.Alex, P.Varkey, Y.Li, Q.Qu and D.Tujkovic,"Deep Learning Coordinated Beamforming for Highly-Mobile Millimeter Wave Systems",IEEE Access,Vol. 6,2018年06月25日,pp.37328-37348,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8395149
【文献】董 鯉、張 裕淵、府川 和彦,”MIMO小セルネットワークにおけるニューラルネットワークに基づくビームフォーミングと送信電力制御を用いたセル間干渉制御”,電子情報通信学会技術研究報告 RCS2017-347,Vol.117、No.456,2018年02月21日,pp.173-178
(58)【調査した分野】(Int.Cl.,DB名)
H04B 7/06
G06N 3/08
G06N 20/00
H04B 7/08
H04W 16/28
(57)【特許請求の範囲】
【請求項1】
少なくとも1つのプロセッサと、
コンピュータプログラムコードを含む少なくとも1つのメモリとを備える装置であって、
少なくとも1つのメモリ、および、コンピュータプログラムコードが、少なくとも1つのプロセッサによって、装置に、少なくとも、
ニューラルネットワークを訓練するためのネットワークデータを収集させ、
収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(Q)を学習するように、ニューラルネットワークを訓練させ、
グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用させ、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用され、
ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択させる
ように構成される、装置。
【請求項2】
収集されるデータが、
統計学的モデルから、または、いくつかの現実的な配備に対するレイトレーシングデータから収集されるシミュレーションデータ、および、
事前定義されたグリッドオブビーム(GoB)にわたる測定値から収集されるオンラインデータ
のうちの少なくとも1つを含む、請求項1に記載の装置。
【請求項3】
少なくとも1つのメモリ、および、コンピュータプログラムコードが、少なくとも1つのプロセッサによって、装置に、少なくとも、
(Q)を
【数1】
として近似させるように構成され、vが特徴ベクトルであり、wが重みベクトルである、請求項1に記載の装置。
【請求項4】
特徴ベクトルvが、
離散フーリエ変換(DFT)ビームの数、
マージされたビームの数、
テーパ付けされたビームの数、
ビームのビームポインティング方向、
ビームのビーム幅、および、
ビームの最大ビームフォーミング利得
のうちの少なくとも1つを含む、請求項3に記載の装置。
【請求項5】
少なくとも1つのメモリ、および、コンピュータプログラムコードが、少なくとも1つのプロセッサによって、装置に、少なくとも、
重みベクトルwまたは近似
【数2】
関数のいずれかが、反復の間に十分に変化しなくなるまで、ニューラルネットワークの訓練を反復して適用させる
ように構成される、請求項1から4のいずれか一項に記載の装置。
【請求項6】
ニューラルネットワークの訓練が、
(a)すべての状態およびアクションに対して、重みベクトルwおよび(Q)関数を初期化することと、
(b)(s,a)対、および、更新wを、以下の、
【数3】
によって、選択することであって、
【数4】
が、重みベクトルwにおいての状態アクション対(s,a)に対して計算される
【数5】
関数の勾配である、ことと、
ステップ(b)を、wベクトルまたは近似
【数6】
関数のいずれかが、反復の間に十分に変化しなくなるまで繰り返すことと
を含む、請求項1から4のいずれか一項に記載の装置。
【請求項7】
少なくとも1つのメモリ、および、コンピュータプログラムコードが、少なくとも1つのプロセッサによって、装置に、少なくとも、
グリッドオブビーム(GoB)内に含めるための、最大(Q)値を有する少なくとも1つのビームを選択させる
ように構成される、請求項1から4のいずれか一項に記載の装置。
【請求項8】
性能メトリックが、トラフィック密度で重み付けされたビームフォーミング利得を含み、
適用することが、以下の報酬
【数7】
によって、トラフィック密度で重み付けされたビームフォーミング利得を最大化する、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択するために、訓練されたニューラルネットワークを適用することを含む、
請求項1から4のいずれか一項に記載の装置。
【請求項9】
性能メトリックが、カバレッジ最適化を含み、
適用することが、以下の報酬
【数8】
によって、最小基準信号受信電力(RSRP)を最大化する、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択するために、訓練されたニューラルネットワークを適用することを含む、
請求項1から4のいずれか一項に記載の装置。
【請求項10】
性能メトリックが、ビームフォーミング利得の幾何平均を含み、
適用することが、以下の報酬
【数9】
によって、ビームフォーミング利得の幾何平均を最大化する、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択するために、訓練されたニューラルネットワークを適用することを含む、
請求項1から4のいずれか一項に記載の装置。
【請求項11】
ニューラルネットワークが、畳み込みニューラルネットワークまたはディープニューラルネットワークのうちの少なくとも1つを含む、請求項1から4のいずれか一項に記載の装置。
【請求項12】
ニューラルネットワークを訓練するためのネットワークデータを収集することと、
収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(Q)を学習するように、ニューラルネットワークを訓練することと、
グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用することであって、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用される、ことと、
ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択することと
を含む、方法。
【請求項13】
収集されるデータが、
統計学的モデルから、または、いくつかの現実的な配備に対するレイトレーシングデータから収集されるシミュレーションデータ、および、
事前定義されたグリッドオブビーム(GoB)にわたる測定値から収集されるオンラインデータ
のうちの少なくとも1つを含む、請求項12に記載の方法。
【請求項14】
方法が、
(Q)を
【数10】
として近似することをさらに含み、vが特徴ベクトルであり、wが重みベクトルである、
請求項12に記載の方法。
【請求項15】
特徴ベクトルvが、
離散フーリエ変換(DFT)ビームの数、
マージされたビームの数、
テーパ付けされたビームの数、
ビームのビームポインティング方向、
ビームのビーム幅、および、
ビームの最大ビームフォーミング利得
のうちの少なくとも1つを含む、請求項14に記載の方法。
【請求項16】
方法が、
重みベクトルwまたは近似
【数11】
関数のいずれかが、反復の間に十分に変化しなくなるまで、ニューラルネットワークの訓練を反復して適用すること
をさらに含む、請求項12から15のいずれか一項に記載の方法。
【請求項17】
ニューラルネットワークの訓練が、
(a)すべての状態およびアクションに対して、重みベクトルwおよび(Q)関数を初期化することと、
(b)(s,a)対、および、更新wを、以下の、
【数12】
によって、選択することであって、
【数13】
が、重みベクトルwにおいての状態アクション対(s,a)に対して計算される
【数14】
関数の勾配である、ことと、
ステップ(b)を、wベクトルまたは近似
【数15】
関数のいずれかが、反復の間に十分に変化しなくなるまで繰り返すことと
を含む、請求項12から15のいずれか一項に記載の方法。
【請求項18】
方法が、
グリッドオブビーム(GoB)内に含めるための、最大(Q)値を有する少なくとも1つのビームを選択すること
をさらに含む、請求項12から15のいずれか一項に記載の方法。
【請求項19】
性能メトリックが、トラフィック密度で重み付けされたビームフォーミング利得を含み、
適用することが、以下の報酬
【数16】
によって、トラフィック密度で重み付けされたビームフォーミング利得を最大化する、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択するために、訓練されたニューラルネットワークを適用することを含む、
請求項12から15のいずれか一項に記載の方法。
【請求項20】
性能メトリックが、カバレッジ最適化を含み、
適用することが、以下の報酬
【数17】
によって、最小基準信号受信電力(RSRP)を最大化する、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択するために、訓練されたニューラルネットワークを適用することを含む、
請求項12から15のいずれか一項に記載の方法。
【請求項21】
性能メトリックが、ビームフォーミング利得の幾何平均を含み、
適用することが、以下の報酬
【数18】
によって、ビームフォーミング利得の幾何平均を最大化する、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択するために、訓練されたニューラルネットワークを適用することを含む、
請求項12から15のいずれか一項に記載の方法。
【請求項22】
ニューラルネットワークが、畳み込みニューラルネットワークまたはディープニューラルネットワークのうちの少なくとも1つを含む、請求項12から15のいずれか一項に記載の方法。
【請求項23】
ニューラルネットワークを訓練するためのネットワークデータを収集するための収集する手段と、
収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(Q)を学習するように、ニューラルネットワークを訓練するための訓練する手段と、
グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用するための適用する手段であって、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用される、手段と、
ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択するための選択する手段と
を備える、装置。
【請求項24】
装置に、少なくとも以下のこと、
ニューラルネットワークを訓練するためのネットワークデータを収集することと、
収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(Q)を学習するように、ニューラルネットワークを訓練することと、
グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用することであって、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用される、ことと、
ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択することと
を行わせるためのプログラム命令を含む、コンピュータ可読
記憶媒体。
【請求項25】
装置が、少なくとも以下のこと、
ニューラルネットワークを訓練するためのネットワークデータを収集することと、
収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(Q)を学習するように、ニューラルネットワークを訓練することと、
グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用することであって、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用される、ことと、
ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択することと
を行わせるための命令を含む、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
いくつかの例示の実施形態は、一般的には、ロングタームエボリューション(LTE)または第5世代(5G)無線アクセス技術または新無線(NR)アクセス技術、または、他の通信システムなどの、モバイルまたはワイヤレス電気通信システムに関し得る。例えば、特定の実施形態は、大規模多入力多出力(MIMO)、および、機械学習により最適化されるグリッドオブビーム(GoB)に関し得る。
【背景技術】
【0002】
モバイルまたはワイヤレス電気通信システムの例は、ユニバーサルモバイル電気通信システム(UMTS)地上無線アクセスネットワーク(UTRAN)、ロングタームエボリューション(LTE)進化型UTRAN(E-UTRAN)、LTE-アドバンスト(LTE-A)、MulteFire、LTE-A Pro、および/または、第5世代(5G)無線アクセス技術もしくは新無線(NR)アクセス技術を含み得る。第5世代(5G)ワイヤレスシステムは無線システムおよびネットワークアーキテクチャの、次世代(NG)を指す。5Gは、主として、新無線(NR)上に構築されるが、5G(またはNG)ネットワークは、また、E-UTRA無線上に構築することができる。NRは、10-20Gビット/s以上の程度のビットレートを提供することになり、少なくとも増強されたモバイルブロードバンド(enhanced mobile broadband)(eMBB)および超高信頼低遅延通信(ultra-reliable low-latency-communication)(URLLC)ならびに大規模マシンタイプ通信(mMTC:massive machine type communication)をサポートすることになるということが推測される。NRは、モノのインターネット(IoT)をサポートするための、超ブロードバンド、および、超ロバストの低遅延接続性、および、大規模ネットワーキングをもたらすことが期待される。IoTおよびマシンツーマシン(M2M)通信がより普及するのに伴い、より低い電力、低いデータレート、および、長いバッテリ寿命の必要性を満たすネットワークに対する高まる必要性が存することになる。5Gにおいて、無線アクセス機能性をユーザ機器に(すなわち、E-UTRANにおいてのノードB、または、LTEにおいてのeNBと同様に)提供することができるノードは、NR無線上で構築されるときにgNBと命名され得、E-UTRA無線上で構築されるときにNG-eNBと命名され得るということが留意される。
【発明の概要】
【課題を解決するための手段】
【0003】
一実施形態が、少なくとも1つのプロセッサと、コンピュータプログラムコードを含む少なくとも1つのメモリとを含み得る、装置を対象とする。少なくとも1つのプロセッサによって、装置に、少なくとも、ニューラルネットワークを訓練するためのネットワークデータを収集させ、収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(non-discounted cumulative reward)(Q)を学習するように、ニューラルネットワークを訓練させ、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用させ、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用され、ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択させるように構成される、少なくとも1つのメモリ、および、コンピュータプログラムコード。
【0004】
別の実施形態が、ニューラルネットワークを訓練するためのネットワークデータを収集することと、収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(Q)を学習するように、ニューラルネットワークを訓練することと、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用することであって、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用される、ことと、ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択することとを含み得る、方法を対象とする。
【0005】
別の実施形態が、ニューラルネットワークを訓練するためのネットワークデータを収集するための収集する手段と、収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(Q)を学習するように、ニューラルネットワークを訓練するための訓練する手段と、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用するための適用する手段であって、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用される、手段と、ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択するための選択する手段とを含み得る、装置を対象とする。
【0006】
別の実施形態が、装置に、少なくとも以下のこと:ニューラルネットワークを訓練するためのネットワークデータを収集することと、収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(Q)を学習するように、ニューラルネットワークを訓練することと、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用することであって、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用される、ことと、ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択することとを行わせるためのプログラム命令を含む、コンピュータ可読媒体を対象とする。
【0007】
別の実施形態が、装置に、少なくとも以下のこと:ニューラルネットワークを訓練するためのネットワークデータを収集することと、収集されたデータを使用して、所与のビームをグリッドオブビーム(GoB)内へと含めることの利益を評価する非割引累積報酬(Q)を学習するように、ニューラルネットワークを訓練することと、グリッドオブビーム(GoB)内に含めるための少なくとも1つのビームを選択して性能メトリックを最適化するために、訓練されたニューラルネットワークを適用することであって、訓練されたニューラルネットワークは、グリッドオブビームに必要な数のビームが選択されるまで繰り返し適用される、ことと、ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択することとを行わせるための命令を含む、コンピュータプログラムを対象とする。
【0008】
例示の実施形態の適正な理解のために、参照が、付随する図面に対して行われるべきである。
【図面の簡単な説明】
【0009】
【
図1】一実施形態による例示のシステムを例示する図である。
【
図2】一実施形態による方法の例示のフローダイアグラムを例示する図である。
【
図3a】一実施形態による装置のブロックダイアグラムを例示する図である。
【
図3b】一実施形態による装置のブロックダイアグラムを例示する図である。
【発明を実施するための形態】
【0010】
本明細書においての図において一般的に説明および例示されるような、特定の例示の実施形態の構成要素は、多種多様の異なる構成で配置構成および設計され得るということが、たやすく理解されることになる。かくして、グリッドオブビーム(GoB)を決定するためのシステム、方法、装置、およびコンピュータプログラム製品の、いくつかの例示の実施形態の、以下の詳細な説明は、特定の実施形態の範囲を限定することを意図されるのではなく、選択される例示の実施形態を代表するものである。
【0011】
本明細書の全体を通して説明される例示の実施形態の特徴、構造、または特性は、1つ以上の例示の実施形態において、任意の適した様式で組み合わされ得る。例えば、本明細書の全体を通しての、語句「特定の実施形態」、「いくつかの実施形態」、または、他の同様の文言の使用の仕方は、一実施形態に関連して説明される個別の特徴、構造、または特性が、少なくとも1つの実施形態に含まれ得るという事実を指す。かくして、本明細書の全体を通しての、語句「特定の実施形態において」、「いくつかの実施形態において」、「他の実施形態において」、または、他の同様の文言の出現は、必ずしもすべてが実施形態の同じ群を指すとは限らず、説明される特徴、構造、または特性は、1つ以上の例示の実施形態において、任意の適した様式で組み合わされ得る。
【0012】
追加的に、必要に応じて、下記で論考される異なる機能またはステップは、異なる順序で、および/または、互いと同時的に行われ得る。さらにまた、必要に応じて、説明される機能またはステップのうちの1つ以上は、任意選択であり得、または、組み合わされ得る。しかるがゆえに、以下の説明は、特定の例示の実施形態の原理および教示について、ただ単に例示的と考えられるべきであり、原理および教示を限定すると考えられるべきではない。
【0013】
大規模MIMOの利得を達成するための1つの方法は、いわゆるグリッドオブビーム(GoB)を作ることによるものである。このGoBは、ビームのセットを表し、そのセットから、1つ以上のビームが、ダウンリンク(DL)においてUEに送信するために、または、アップリンク(UL)上でのUEの送信を受信するために選定されることになる。最良のビームは、典型的には、UEフィードバックを使用して、または、DL無線周波数(RF)チェーンとUL無線周波数(RF)チェーンとの間の較正を仮定して、時間分割複信(TDD)システムにおいてのULサウンディングを使用することにより決定される。
【0014】
GoBソリューションは、固有ビームフォーミング、ゼロフォーシング、または最大信号対漏れプラス雑音比(max-Signal-to-leakage-plus-noise ratio)スキームなどの、他の、より複雑なビームフォーミング技法と比較されるときに、実装するのがより容易であり得る。GoBソリューションは、十分な数のビームが選定され、ビームが、ビームポインティング方向、ビーム幅、サイドローブ利得、その他などのパラメータを制御することにより、うまく設計されるならば、より複雑なビームフォーミング技法の性能に近付くように作り出され得る。
【0015】
生じる問題は、適切な性能メトリックが最適化されるように、GoB内に含められるビームをどのように決定すべきかに関する。例えば、そのような性能メトリックは、信号対干渉プラス雑音比(SINR)、スループット、ビームフォーミング利得、その他を含み得るが、それらに限定されない。特に、GoB内のビームを、空間的トラフィック分布、基地局(BS)高さ、サイト間距離、伝搬条件、クラッタ、その他に適合させることが望ましくあり得る。このことは、最適化されるべき多くの相互に関係しているパラメータが存するので、非常に困難な問題であるとわかる。ビームは、特定のビーム幅を有し、強いサイドローブを有することがある。以下で論考されるように、最適化問題が定式化されるときでさえ、それは、選択され得るビームの大量の可能な選定に起因して、正確に解くのが困難である。それゆえに、特定の実施形態は、GoB内のビームを最適化する問題を解くのに良く適した、動的計画法(dynamic programming)、ならびに、機械学習(ML)および/または人工知能(AI)技法の組み合わせを使用し得る。
【0016】
GoB内のビームは、UEにおいての、追加的なオーバヘッド、および、増加したスキャニング/探索時間のために、遅い時間尺度で変化させられるということが留意される。それゆえに、いくつかの実施形態によれば、最適GoB選択モジュールが、無線アクセスネットワーク(RAN)の外側に配され得、そこでは、ML用途に対して最適化された、何らかの専用のハードウェアが使用され得る。一実施形態において、MLモデルは、訓練されると、新しいトラフィック分布および伝搬シナリオを入力として与えられるとき、推論のために使用され得る。
【0017】
本明細書において説明される特定の実施形態は、1つ以上の性能メトリックを達成することなど、適切な目的を最適化するために、GoB内に含められるビームを決定し適合させるための方法および/または装置を提供する。いくつかの実施形態は、機械学習(ML)および近似動的計画法技法を利用して、GoB内に含めるための(例えば、性能メトリックの観点での)最良の、または最適なビームを選択し得る。例示の実施形態を使用して対処および克服され得る、問題のタイプのいくつかの例は:(1)カバレッジを改善するためのSSBビーム設計、ならびに/または、(2)キャパシティおよび/もしくはスループット性能を改善するための改良されるトラフィックビーム設計、を含み得る。カバレッジを改善するためのSSBビーム設計に対して、目的関数は、セルにおいての最小基準信号受信電力(RSRP)を最大化すること、または、トラフィック密度により重み付けされたセルのRSRPの幾何平均を最大化すること、または、5パーセンタイルワーストRSRPを最大化すること、その他であり得る。キャパシティおよび/またはスループット性能を改善するための改良される/トラフィックビーム設計に対して、目的は、トラフィック密度で重み付けされた平均ビームフォーミング利得、または、ビームフォーミング利得、信号対雑音比(SNR)、SINR、スループット、その他の、トラフィック密度で重み付けされた幾何平均を最大化することであり得る。例示の実施形態が、これらの問題を参照して本明細書において説明される一方で、特定の実施形態は、これらの例に限定されず、他の変形例に等しく適用可能であることになるということが留意されるべきである。
【0018】
本明細書において説明されるように、Uは、GoB内に含められ得るすべての潜在的ビームを含むビームのユニバーサルセットを表し得る。しかるがゆえに、ユニバーサルビームセットUは、ビームの大きいコレクションまたはディクショナリを含み得る。これらのビームは、方位角/仰角ステアリング方向、ならびに、方位角面および仰角面においてのビーム幅により特徴付けられ得る。例えば、Uは、離散フーリエ変換(DFT)ビーム、方向の適切なチューニングのためのシフトされたDFTビーム、オーバサンプリングされたDFTビーム、ビーム幅の適切なチューニングのためのマージされたビーム(merged beam)、ビーム幅低減を犠牲にしたビーム間干渉低減(サイドローブ低減)のためのテーパ付けされたビーム(tapered beam)、その他を含み得る。加えて、いくつかの実施形態によれば、NB個のビームのサブセットのみが、GoBを構築するためにUから選択され得るという制約が存するということが仮定され得る。それゆえに、特定の実施形態は、適切な性能メトリックを最適化する、Uの最良のNBサイズのサブセットを選択するように構成される。例えば、性能メトリックは、トラフィック密度で重み付けされた平均ビームフォーミング利得、もしくは、トラフィック密度で重み付けされたビームフォーミング利得の幾何平均を最大化すること、トラフィック密度で重み付けされた平均SNR/SINR/スループット、その他を最大化すること、および/または、セルにおいての最小RSRPを最大化すること(カバレッジ問題)、もしくは、トラフィック密度により重み付けされたセルのRSRPの幾何平均を最大化すること、もしくは、5パーセンタイル(またはxパーセンタイル)ワーストRSRPを最大化すること、または、任意の他の適切な性能メトリックを含み得るが、それらに限定されない。
【0019】
図1は、一実施形態によるシステムの例示の機能ブロックダイアグラムを例示する。
図1の例において例示されるように、システムは、下記でより詳細に論考されることになる、訓練段階110と、推論段階120とを含み得る。下記の表1は、
図1において描写される、および、さもなければ本明細書において使用される、表記または変数を定義する。
【0020】
【0021】
図1の例において例示されるように、訓練は、最初に訓練段階110において行われ得る。一実施形態において、訓練は、シミュレーションからのデータを使用して行われ得る。いくつかの実施形態によれば、シミュレーションデータは、3GPP 3Dチャネルモデルなどの統計学的モデルからの、または、大量の現実的な配備に対するレイトレーシングデータからのものであり得る。
図1の例において描写されるように、訓練段階110は、例えば多数のセルシナリオにわたって、長期の準静的データを収集および/または記憶することを含み得る。
【0022】
いくつかの実施形態によれば、訓練のために使用される(シミュレーション)データが、シナリオを的確に表さないならば、オンラインで収集されたデータが、訓練段階110の改良のために使用され得る。この場合、事前定義されたGoBにわたるオンラインデータまたはオンライン測定値によって、質的に向上させられ、または、強化され得る、新しい訓練動作が適用され得る。
【0023】
1つの実施形態は、適切な目的関数が最適化されるように、近似動的計画法(DP)手法を利用または適用して、GoB内に含めるための最良のNB個のビームを決定し得る。特定の実施形態は、妥当なサイズのユニバーサルビームセットおよびGoBセットによってでさえ発生することになる、状態空間の爆発のために、「近似」動的計画法方法を使用し得る。例えば、|U|が100であり、NBが32であるならば、状態の数は2.59E26である。かくして、この問題を解くための価値反復および方策反復などの、正確な動的計画法技法を使用することが可能でないことがある。それゆえに、一実施形態は、例えばディープQニューラルネットワーク(DQN)手法を使用する近似方法を適用し得る。
【0024】
DQN手法によれば、Q関数
【数1】
は、状態sにおいてアクションaを選定することの即時報酬、および、次の状態s’以降からの最適な報酬の総和:
【数2】
を与え、ここで、s’は、アクションaが選定されるときに、状態sからシステムにより訪問される次の状態である。特定の実施形態に対して、次の状態s’は、アクションaが状態sにおいて選定されるときに決定論的であるということが留意される。しかしながら、上記で論考された状態およびアクション空間爆発に起因して、精確な動的計画法方法を使用してQ(s,a)を決定することが可能でないことがある。それゆえに、特定の実施形態によれば、Q(s,a)は、例えば、ディープニューラルネットワーク(DNN)に由来し、重みベクトルwによりパラメータ化され得る、
【数3】
により近似され得る。
【0025】
1つの実施形態において、特徴のセットvが選択され得、DNNは、Q関数を、状態およびアクションの代わりに、これらの特徴に応じて近似し得る。このことは、なぜならば、定義されるような状態およびアクションは、Q関数を近似できるための、DNNへの入力として提示可能な形態でないことがあるからである。例えば、いくつかの状態は、クリティカルサンプリングされたDFTビームに対応し得、他のものは、広いビームに対応し得る。それらの状態を実際に訪問することなしに、DNNが、そのような状態の間で区別することは困難であり得る。特徴ベクトルvは、
【数4】
からのマッピングであり得、Q関数は、
【数5】
として、
【数6】
の代わりに近似され得る。いくつかの実施形態によれば、例えば、以下のもののうちの1つ以上が、所与の状態sおよびアクションaに対する特徴ベクトルとして選定され得る:DFTビームの数、マージされたビームの数、テーパ付けされたビームの数、これらのビームのビームポインティング方向、これらのビームのビーム幅、および/または、これらのビームの最大ビームフォーミング利得、その他。
【0026】
一実施形態によれば、DQN方法は、観測に基づいて、Q関数の可能な限り良好な関数的近似を得ることを試みるために使用され得る。しかるがゆえに、いくつかの実施形態は、動的プログラム(DP)ベルマンの方程式アクション-価値反復を行い、Q関数をより良好に近似するようにNNを訓練するための反復を、同時に遂行し得る。DQNによって、畳み込みニューラルネットワーク(CNN)またはディープニューラルネットワーク(DNN)は、アクションaが状態sにおいて行われるときの非割引累積報酬を表す「Q関数」をモデリング/近似するために使用され得、収束まで近似を反復して継続する。かくして、CNN/DNNは、状態s(または、対応する特徴ベクトルv)を入力として使用し得、Q値を、その状態に対する各可能なアクションaに対して出力し得る。
【0027】
例えば、特定の実施形態において、DQN反復は、以下のこと:(1)すべての状態およびアクションに対して、重みwおよびQ関数を初期化すること(例えば、それらは、0に初期化され得る)と;(2)(s,a)対、および、更新を、以下の:
【数7】
によって、選択することとを含み得、ここで、
【数8】
は、重みベクトルwにおいての状態アクション対(s,a)に対して計算される
【数9】
関数の勾配である。このプロセスは、wベクトルまたは近似
【数10】
関数のいずれかが、反復の間に十分に変化しなくなるまで繰り返され得る。特定の実施形態において、w
-は、周期的にのみ更新され得、または、w
-は、wが更新されるたびに更新され得る。
【0028】
【数11】
関数が収束すると、GoB内に含めるためのビームの最適セットが決定され得る。そのようにするために、1つの実施形態は、すべてがゼロの状態によって開始し、最大Q値
【数12】
を決定することにより、含めるための最適ビームを決定し得る。システムは、次いで、状態sにおいてアクションa
*を選定することに対応する、次の状態s’に遷移することになる。
【0029】
【数13】
の最大の値を与える最良のアクションに対応する、状態s’においての最良のアクションが選択され得、以下同様である。
【0030】
一実施形態において、GoB選択に適用される際、DQNは、「非」割引累積報酬であるQ(s,a)を決定し得、なぜならば、GoB内へと追加されるすべてのビームに対する、非割引(等しい重み)報酬に対する必要性が存するからである。Q(s,a)に対して、状態sは、GoBのステータス(構築においてのGoBにおいての、選択された、および、選択されないビーム)であり、アクションaは、U(ユニバーサルビームセット)からの1つの追加的なビームの選択に対応し、アクションaに対するQ関数は、そのようなビームを更新されるGoB内に追加することからの利益を反映する。
【0031】
図1の例において例示され、上記で紹介されたように、特定の実施形態は、訓練されたGoB方策を動作するセルに適用するように構成される推論段階120を含み得る。
図1の例において描写されるように、推論段階120は、入力として、訓練段階110の出力、および、任意選択で、考慮されるセルに対する長期の準静的データを取り得る。それゆえに、一実施形態において、CNN/DNNは、訓練段階110の間に、何らかの新しい所与のビームをGoB内へと含めることのグローバルな利益を評価する非割引累積報酬Qを学習するように訓練されている。推論段階120は、次いで、GoBのビームの必要な数と同じ回数、訓練されたCNN/DNNを反復して適用し得る。
【0032】
1つの実施形態は、性能メトリックとしての、トラフィック密度で重み付けされたビームフォーミング利得を最大化することに努め得る。しかるがゆえに、目的は、{ρ,G}入力特徴を最適GoBにマッピングする方策をセットアップすることである。上記で述べられたように、例示の実施形態によれば、反復的プロセスは、GoBが構築されるところで、(ユニバーサルビームセットから選択される)GoB内のビームの最大数までのビームに次々と行われる。この実施形態において、反復ごとに、B
Sは、構築中のGoB内にここまでで含められるビームのセットを示し、構築中のGoBに追加されるビーム「a」は、以下の報酬:
【数14】
を生む。
【0033】
同様に、この実施形態によれば、ビームは、それが、この新しい候補ビームを伴わないGoBと比較されるときに、関心のある全エリアにわたってのBF利得の観点で、最良の成果/効率を確実にするならば、GoBに追加され得る。プロセスの終了においての目的は、期待される非割引累積報酬、N
Bステップ累積報酬を最大化することである:
【数15】
よって、上記のソリューションは、トラフィック密度で重み付けされたビームフォーミング利得を最大化することができる。
【0034】
カバレッジ最適化のために、別の実施形態が、セルの意図されるカバレッジエリア内のいかなるところでも最小RSRPを最大化するという目的を使用し得る。この場合、選択されるビームの数は、目標はただSSBビームを決定することであるので、より小さくあり得る。量子化された直方体/タイル(x,y,z)においてのRSRPは、ビームb
iがそのタイルをサーブしていると仮定して、
【数16】
により示される。よって、この実施形態において、報酬は、以下の:
【数17】
において、r(s,a)により与えられる。
【0035】
別の実施形態において、ビームフォーミング利得の重み付けされた総和(または最小RSRP)を最大化することの代わりに、セルの全域でのビームフォーミング利得の、公正な割り振りをもたらす別の目的は、ビームフォーミング利得の幾何平均を最大化することである。かくして、この実施形態において、最適化問題は、
【数18】
を最大化することである。この目的は、ビームフォーミング利得の、より公正な割り振りをもたらし得、なぜならば、ビームフォーミング利得の小さすぎる値は、それが算術平均を低減するよりもはるかに多く、積を低減することになるからである。このことを、加法的報酬のみを認める動的プログラム(dynamic program)(DP)として定式化するために、一実施形態は、この幾何平均の対数を最大化することができ、なぜならば、対数は、その引数の単調増加関数であるからである。かくして、例示の実施形態は、
【数19】
を最大化する
【数20】
を最大化する。
この実施形態において、報酬r(s,a)は、以下の:
【数21】
のように、ビームフォーミング利得の幾何平均を最大化するように修正され得る。
一実施形態は、logを内側に移すことができ、なぜならば、logは単調増加関数であるからである。かくして、報酬は、次式:
【数22】
により与えられることになる。このことは、利得がビームフォーミング利得のlogにより置換される、より早期の総和報酬最大化問題の平易な修正である。
【0036】
図2は、一例示の実施形態による、ネットワーク性能メトリックを最大化するために、GoB内に含めるための1つ以上のビームを決定するための方法の例示のフローダイアグラムを例示する。特定の例示の実施形態において、
図2のフローダイアグラムは、LTEまたは5G NRなどの、3GPP通信システム内のネットワークエンティティまたはネットワークノードにより行われ得る。例えば、いくつかの例示の実施形態において、
図2の方法は、LTE、5G、またはNRシステム内の、基地局、eNB、gNB、またはアクセスノード、または類するものにより行われ得る。
【0037】
1つの実施形態において、
図2の方法は、200において、ニューラルネットワーク(NN)を訓練するためのネットワークデータを収集することを含み得る。いくつかの実施形態によれば、NNは、例えば、CNN、DNN、および/またはDQNであり得る。収集されるデータは、3GPP 3Dチャネルモデルなどの統計学的モデルから、もしくは、いくつかの現実的な配備に対するレイトレーシングデータから収集されるシミュレーションデータ、および/または、事前定義されたGoBにわたる測定値から収集されるオンラインデータを含み得る。
【0038】
一実施形態によれば、
図2の方法は、また、210において、収集されたデータを使用して、所与のビームをGoB内へと含めることの利益を評価する非割引累積報酬Qを学習するように、NNを訓練することを含み得る。1つの実施形態において、方法は、Qを
【数23】
として近似することを含み得、ここで、vは特徴ベクトルであり、wは重みベクトルである。特定の実施形態において、特徴ベクトルvは、離散フーリエ変換(DFT)ビームの数;マージされたビームの数;テーパ付けされたビームの数;ビームのビームポインティング方向;ビームのビーム幅;および/または、ビームの最大ビームフォーミング利得のうちの、1つ以上を含み得る。
【0039】
一実施形態において、方法は、重みベクトルwまたは近似
【数24】
関数のいずれかが、反復の間に十分に変化しなくなるまで、NNの訓練を反復して適用することを含み得る。いくつかの実施形態によれば、NNの訓練は:(a)すべての状態およびアクションに対して、重みベクトルwおよびQ関数を初期化することと;(b)(s,a)対、および、更新wを、以下の:
【数25】
によって、選択することとを含み得、ここで、
【数26】
は、重みベクトルwにおいての状態アクション対(s,a)に対して計算される
【数27】
関数の勾配である。ステップ(b)は、次いで、wベクトルまたは近似
【数28】
関数のいずれかが、反復の間に十分に変化しなくなるまで繰り返され得る。
【0040】
1つの実施形態によれば、
図2の方法は、また、220において、GoB内に含めるための1つ以上のビームを選択して性能メトリックを最適化するために、訓練されたNNを適用することを含み得る。訓練されたNNは、GoBに必要な数のビームが選択されるまで繰り返し適用され得る。一実施形態において、方法は、次いで、230において、ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択することを含み得る。
【0041】
特定の実施形態において、GoB内に含めることのためのビームの選択は、グリッドオブビーム(GoB)内に含めるための最大Q値を有するビームを選択し、そのことにより、性能メトリックを最適化することを含み得る。1つの実施形態によれば、性能メトリックは、トラフィック密度で重み付けされたビームフォーミング利得であり得、適用すること220は、以下の報酬:
【数29】
によって、トラフィック密度で重み付けされたビームフォーミング利得を最大化する、GoB内に含めるためのビームを選択するために、訓練されたNNを適用することを含み得る。
【0042】
別の実施形態において、性能メトリックは、カバレッジ最適化であり得、適用すること220は、以下の報酬:
【数30】
によって、最小RSRPを最大化する、GoB内に含めるためのビームを選択するために、訓練されたNNを適用することを含み得る。
【0043】
なおも別の実施形態において、性能メトリックは、ビームフォーミング利得の幾何平均であり得、適用すること220は、以下の報酬:
【数31】
によって、ビームフォーミング利得の幾何平均を最大化する、GoB内に含めるためのビームを選択するために、訓練されたNNを適用することを含み得る。
【0044】
図3aは、一実施形態による装置10の例を例示する。一実施形態において、装置10は、通信ネットワーク内の、または、そのようなネットワークをサーブする、ノード、ホスト、またはサーバであり得る。例えば、装置10は、GSMネットワーク、LTEネットワーク、5G、またはNRなどの無線アクセスネットワークと関連付けられる、基地局、ノードB、進化型ノードB(eNB)、5GノードBもしくはアクセスポイント、次世代ノードB(NG-NBまたはgNB)、WLANアクセスポイント、モビリティ管理エンティティ(MME)、および/もしくはサブスクリプションサーバであり得る。
【0045】
いくつかの例示の実施形態において、装置10は、分散コンピューティングシステムとしてエッジクラウドサーバから成り得、そこでは、サーバおよび無線ノードは、無線パスを介して、もしくは、有線接続を介して互いと通信するスタンドアロン装置であり得、または、サーバおよび無線ノードは、有線接続を介して通信して、同じエンティティ内に配置され得るということが理解されるべきである。例えば、装置10がgNBを表す特定の例示の実施形態において、装置10は、gNB機能性を分割する、セントラルユニット(central unit)(CU)および分散ユニット(distributed unit)(DU)アーキテクチャにおいて構成され得る。そのようなアーキテクチャにおいて、CUは、ユーザデータの転送、モビリティ制御、無線アクセスネットワーク共有、ポジショニング、および/またはセッション管理、その他などのgNB機能を含む論理ノードであり得る。CUは、フロントホールインターフェイス上でDUの動作を制御し得る。DUは、機能分離オプションに応じてのgNB機能のサブセットを含む論理ノードであり得る。当業者は、装置10が、
図3aにおいて示されない構成要素または特徴を含み得るということを理解することになるということが留意されるべきである。
【0046】
図3aの例において例示されるように、装置10は、情報を処理し、命令または動作を実行するためのプロセッサ12を含み得る。プロセッサ12は、任意のタイプの汎用または専用プロセッサであり得る。実際、プロセッサ12は、例として、汎用コンピュータ、専用コンピュータ、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、および、マルチコアプロセッサアーキテクチャに基づくプロセッサのうちの1つ以上を含み得る。単一のプロセッサ12が
図3aにおいて示されるが、多数のプロセッサが、他の実施形態によって利用され得る。例えば、特定の実施形態において、装置10は、マルチプロセッシングをサポートし得るマルチプロセッサシステムを形成し得る、2つ以上のプロセッサを含み得る(例えば、この場合、プロセッサ12は、マルチプロセッサを表し得る)ということが理解されるべきである。特定の実施形態において、マルチプロセッサシステムは、(例えば、コンピュータクラスタを形成するために)緊密に結合され、または、緩く結合され得る。
【0047】
プロセッサ12は、例えば、アンテナ利得/位相パラメータのプリコーディング、通信メッセージを形成する個々のビットの符号化および復号、情報のフォーマッティング、ならびに、通信リソースの管理に関係しているプロセスを含む装置10の全体制御を含み得る、装置10の動作と関連付けられる機能を行い得る。
【0048】
装置10は、さらに、情報、および、プロセッサ12により実行され得る命令を記憶するための、プロセッサ12に結合され得る(内部または外部の)メモリ14を含み、または、メモリ14に結合され得る。メモリ14は、1つ以上のメモリで、および、ローカルなアプリケーション環境に適した任意のタイプのものであり得、半導体ベースのメモリデバイス、磁気メモリデバイスおよびシステム、光学メモリデバイスおよびシステム、固定メモリ、ならびに/または、リムーバブルメモリなどの、任意の適した揮発性または不揮発性データ記憶技術を使用して実装され得る。例えば、メモリ14は、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、磁気もしくは光学ディスク、ハードディスクドライブ(HDD)などの静的ストレージ、または、任意の他のタイプの非一時的機械もしくはコンピュータ可読媒体の、任意の組み合わせから成り得る。メモリ14内に記憶される命令は、プロセッサ12により実行されるときに、装置10が、本明細書において説明されるようなタスクを行うことを可能にする、プログラム命令またはコンピュータプログラムコードを含み得る。
【0049】
一実施形態において、装置10は、さらに、光学ディスク、USBドライブ、フラッシュドライブ、もしくは、任意の他の記憶媒体などの外部コンピュータ可読記憶媒体を受け付け、読み出すように構成される、(内部または外部の)ドライブもしくはポートを含み、または、ドライブもしくはポートに結合され得る。例えば、外部コンピュータ可読記憶媒体は、プロセッサ12および/または装置10による実行のための、コンピュータプログラムまたはソフトウェアを記憶し得る。
【0050】
いくつかの実施形態において、装置10は、また、装置10への、および、装置10からの、信号および/もしくはデータを、送信および受信するための、1つ以上のアンテナ15を含み、または、1つ以上のアンテナ15に結合され得る。装置10は、さらに、情報を送信および受信するように構成される送受信器18を含み、または、送受信器18に結合され得る。送受信器18は、例えば、アンテナ15に結合され得る複数の無線インターフェイスを含み得る。無線インターフェイスは、GSM、NB-IoT、LTE、5G、WLAN、Bluetooth、BT-LE、NFC、無線周波数識別子(RFID)、超広帯域(UWB)、MulteFire、および類するもののうちの1つ以上を含む、複数の無線アクセス技術に対応し得る。無線インターフェイスは、1つ以上のダウンリンクを介する送信のためにシンボルを生成するための、および、(例えば、アップリンクを介して)シンボルを受信するための、フィルタ、コンバータ(例えば、デジタルアナログコンバータおよび類するもの)、マッパ、高速フーリエ変換(FFT)モジュール、および類するものなどの構成要素を含み得る。
【0051】
しかるがゆえに、送受信器18は、アンテナ15による送信のために、キャリア波形上へと情報を変調し、装置10の他の要素によるさらなる処理のために、アンテナ15を介して受信された情報を復調するように構成され得る。他の実施形態において、送受信器18は、直接的に信号またはデータを送信および受信する能力があり得る。追加的または代替的に、いくつかの実施形態において、装置10は、入力および/または出力デバイス(I/Oデバイス)を含み得る。
【0052】
一実施形態において、メモリ14は、プロセッサ12により実行されるときに機能性を提供するソフトウェアモジュールを記憶し得る。モジュールは、例えば、装置10に対するオペレーティングシステム機能性を提供するオペレーティングシステムを含み得る。メモリは、また、装置10に対する追加的な機能性を提供するために、アプリケーションまたはプログラムなどの、1つ以上の機能モジュールを記憶し得る。装置10の構成要素は、ハードウェアにおいて、または、ハードウェアおよびソフトウェアの任意の適した組み合わせとして実装され得る。
【0053】
いくつかの実施形態によれば、プロセッサ12およびメモリ14は、処理回路網もしくは制御回路網内に含められ得る、または、処理回路網もしくは制御回路網の一部を形成し得る。加えて、いくつかの実施形態において、送受信器18は、送受信回路網内に含められ得る、または、送受信回路網の一部を形成し得る。
【0054】
本明細書において使用される際、用語「回路網(circuitry)」は、ハードウェアのみの回路網実装(例えば、アナログおよび/またはデジタル回路網)、ハードウェア回路およびソフトウェアの組み合わせ、ソフトウェア/ファームウェアとのアナログおよび/またはデジタルハードウェア回路の組み合わせ、装置(例えば、装置10)に、様々な機能を行わせるために一緒に働く(デジタル信号プロセッサを含む)ソフトウェアを伴うハードウェアプロセッサの任意の部分、ならびに/あるいは、ソフトウェアが、それが動作のために必要とされないときに存在しないことがあるという場合を除いては、動作のためにソフトウェアを使用する、ハードウェア回路および/もしくはプロセッサ、またはそれらの部分を指し得る。さらなる例として、本明細書において使用される際、用語「回路網」は、また、ただ単にハードウェア回路もしくはプロセッサ(または多数のプロセッサ)、または、ハードウェア回路もしくはプロセッサの部分、ならびに、その付随するソフトウェアおよび/またはファームウェアの実装を包含し得る。用語、回路網は、また、例えば、サーバ、セルラーネットワークノードもしくはデバイス、または、他のコンピューティングもしくはネットワークデバイス内のベースバンド集積回路を包含し得る。
【0055】
上記で紹介されたように、特定の実施形態において、装置10は、基地局、アクセスポイント、ノードB、eNB、gNB、WLANアクセスポイント、または類するものなどの、ネットワークノードまたはRANノードであり得る。特定の実施形態によれば、装置10は、
図1において例示されるもの、または、
図2において例示されるフローダイアグラムなどの、本明細書において説明される実施形態のうちの任意のものと関連付けられる機能を行うように、メモリ14およびプロセッサ12により制御され得る。いくつかの実施形態において、装置10は、1つ以上の性能メトリックが最適化されるように、GoBを設計または選択するための手順を行うように構成され得る。
【0056】
例えば、1つの実施形態において、装置10は、NNを訓練するためのネットワークデータを収集するように、メモリ14およびプロセッサ12により制御され得る。いくつかの実施形態によれば、NNは、例えば、CNN、DNN、および/またはDQNであり得る。収集されるデータは、3GPP 3Dチャネルモデルなどの統計学的モデルから、もしくは、いくつかの現実的な配備に対するレイトレーシングデータから収集されるシミュレーションデータ、および/または、事前定義されたGoBにわたる測定値から収集されるオンラインデータを含み得る。
【0057】
一実施形態によれば、装置10は、また、収集されたデータを使用して、NNを訓練して、所与のビームをGoB内へと含めることの利益を評価する非割引累積報酬Qを学習するように、メモリ14およびプロセッサ12により制御され得る。1つの実施形態において、装置10は、Qを
【数32】
として近似するように、メモリ14およびプロセッサ12により制御され得、ここで、vは特徴ベクトルであり、wは重みベクトルである。特定の実施形態において、特徴ベクトルvは、離散フーリエ変換(DFT)ビームの数;マージされたビームの数;テーパ付けされたビームの数;ビームのビームポインティング方向;ビームのビーム幅;および/または、ビームの最大ビームフォーミング利得のうちの、1つ以上を含み得る。
【0058】
一実施形態において、装置10は、重みベクトルwまたは近似
【数33】
関数のいずれかが、反復の間に十分に変化しなくなるまで、NNの訓練を反復して適用するように、メモリ14およびプロセッサ12により制御され得る。いくつかの実施形態によれば、NNの訓練は:(a)すべての状態およびアクションに対して、重みベクトルwおよびQ関数を初期化することと;(b)(s,a)対、および、更新wを、以下の:
【数34】
によって、選択することとを含み得、ここで、
【数35】
は、重みベクトルwにおいての状態アクション対(s,a)に対して計算される
【数36】
関数の勾配である。ステップ(b)は、次いで、wベクトルまたは近似
【数37】
関数のいずれかが、反復の間に十分に変化しなくなるまで繰り返され得る。
【0059】
1つの実施形態によれば、装置10は、訓練されたNNを適用して、GoB内に含めるための1つ以上のビームを選択して性能メトリックを最適化するように、メモリ14およびプロセッサ12により制御され得る。一実施形態において、装置10は、訓練されたNNを、GoBに必要な数のビームが選択されるまで繰り返し適用するように、メモリ14およびプロセッサ12により制御され得る。一実施形態において、装置10は、ユーザ機器に送信するために、または、ユーザ機器からの送信を受信するために、グリッドオブビーム(GoB)から1つ以上のビームを選択するように、メモリ14およびプロセッサ12により制御され得る。
【0060】
特定の実施形態において、装置10は、グリッドオブビーム(GoB)内に含めるための最大Q値を有するビームを選択して、そのことにより、性能メトリックを最適化するように、メモリ14およびプロセッサ12により制御され得る。1つの実施形態によれば、性能メトリックは、トラフィック密度で重み付けされたビームフォーミング利得であり得、装置10は、訓練されたNNを適用して、以下の報酬:
【数38】
によって、トラフィック密度で重み付けされたビームフォーミング利得を最大化する、GoB内に含めるためのビームを選択するように、メモリ14およびプロセッサ12により制御され得る。
【0061】
別の実施形態において、性能メトリックは、カバレッジ最適化であり得、装置10は、訓練されたNNを適用して、以下の報酬:
【数39】
によって、最小RSRPを最大化する、GoB内に含めるためのビームを選択するように、メモリ14およびプロセッサ12により制御され得る。
【0062】
なおも別の実施形態において、性能メトリックは、ビームフォーミング利得の幾何平均であり得、装置10は、訓練されたNNを適用して、以下の報酬:
【数40】
によって、ビームフォーミング利得の幾何平均を最大化する、GoB内に含めるためのビームを選択するように、メモリ14およびプロセッサ12により制御され得る。
【0063】
図3bは、別の実施形態による装置20の例を例示する。一実施形態において、装置20は、UE、モバイル機器(ME)、モバイル局、モバイルデバイス、固定式デバイス、IoTデバイス、または他のデバイスなどの、通信ネットワーク内の、または、そのようなネットワークと関連付けられる、ノードまたは要素であり得る。本明細書において説明されるように、UEは、代替的には、例えば、モバイル局、モバイル機器、モバイルユニット、モバイルデバイス、ユーザデバイス、加入者局、ワイヤレス端末、タブレット、スマートフォン、IoTデバイス、またはNB-IoTデバイス、または類するものと呼称され得る。1つの例として、装置20は、例えば、ワイヤレスハンドヘルドデバイス、ワイヤレスプラグインアクセサリ、または類するものにおいて実装され得る。
【0064】
いくつかの例示の実施形態において、装置20は、1つ以上のプロセッサ、1つ以上のコンピュータ可読記憶媒体(例えば、メモリ、ストレージ、または類するもの)、1つ以上の無線アクセス構成要素(例えば、モデム、送受信器、または類するもの)、および/またはユーザインターフェイスを含み得る。いくつかの実施形態において、装置20は、GSM、LTE、LTE-A、NR、5G、WLAN、WiFi、NB-IoT、Bluetooth、NFC、MulteFire、および/または、任意の他の無線アクセス技術などの、1つ以上の無線アクセス技術を使用して動作するように構成され得る。当業者は、装置20が、
図3bにおいて示されない構成要素または特徴を含み得るということを理解することになるということが留意されるべきである。
【0065】
図3bの例において例示されるように、装置20は、情報を処理し、命令もしくは動作を実行するためのプロセッサ22を含み、または、プロセッサ22に結合され得る。プロセッサ22は、任意のタイプの汎用または専用プロセッサであり得る。実際、プロセッサ22は、例として、汎用コンピュータ、専用コンピュータ、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、および、マルチコアプロセッサアーキテクチャに基づくプロセッサのうちの1つ以上を含み得る。単一のプロセッサ22が
図3bにおいて示されるが、多数のプロセッサが、他の実施形態によって利用され得る。例えば、特定の実施形態において、装置20は、多重処理をサポートし得るマルチプロセッサシステムを形成し得る、2つ以上のプロセッサを含み得る(例えば、この場合、プロセッサ22は、マルチプロセッサを表し得る)ということが理解されるべきである。特定の実施形態において、マルチプロセッサシステムは、(例えば、コンピュータクラスタを形成するために)緊密に結合され、または、緩く結合され得る。
【0066】
プロセッサ22は、いくつかの例として、アンテナ利得/位相パラメータのプリコーディング、通信メッセージを形成する個々のビットの符号化および復号、情報のフォーマッティング、ならびに、通信リソースの管理に関係しているプロセスを含む装置20の全体制御を含む、装置20の動作と関連付けられる機能を行い得る。
【0067】
装置20は、さらに、情報、および、プロセッサ22により実行され得る命令を記憶するための、プロセッサ22に結合され得る(内部または外部の)メモリ24を含み、または、メモリ24に結合され得る。メモリ24は、1つ以上のメモリで、および、ローカルなアプリケーション環境に適した任意のタイプのものであり得、半導体ベースのメモリデバイス、磁気メモリデバイスおよびシステム、光学メモリデバイスおよびシステム、固定メモリ、ならびに/または、リムーバブルメモリなどの、任意の適した揮発性または不揮発性データ記憶技術を使用して実装され得る。例えば、メモリ24は、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、磁気もしくは光学ディスク、ハードディスクドライブ(HDD)などの静的ストレージ、または、任意の他のタイプの非一時的機械もしくはコンピュータ可読媒体の、任意の組み合わせから成り得る。メモリ24内に記憶される命令は、プロセッサ22により実行されるときに、装置20が、本明細書において説明されるようなタスクを行うことを可能にする、プログラム命令またはコンピュータプログラムコードを含み得る。
【0068】
一実施形態において、装置20は、さらに、光学ディスク、USBドライブ、フラッシュドライブ、もしくは、任意の他の記憶媒体などの外部コンピュータ可読記憶媒体を受け付け、読み出すように構成される、(内部または外部の)ドライブもしくはポートを含み、または、ドライブもしくはポートに結合され得る。例えば、外部コンピュータ可読記憶媒体は、プロセッサ22および/または装置20による実行のための、コンピュータプログラムまたはソフトウェアを記憶し得る。
【0069】
いくつかの実施形態において、装置20は、また、ダウンリンク信号を受信するための、および、装置20からアップリンクを介して送信するための、1つ以上のアンテナ25を含み、または、1つ以上のアンテナ25に結合され得る。装置20は、情報を送信および受信するように構成される送受信器28をさらに含み得る。送受信器28は、また、アンテナ25に結合される無線インターフェイス(例えば、モデム)を含み得る。無線インターフェイスは、GSM、LTE、LTE-A、5G、NR、WLAN、NB-IoT、Bluetooth、BT-LE、NFC、RFID、UWB、および類するもののうちの1つ以上を含む、複数の無線アクセス技術に対応し得る。無線インターフェイスは、ダウンリンクまたはアップリンクにより搬送されるOFDMAシンボルなどのシンボルを処理するための、フィルタ、コンバータ(例えば、デジタルアナログコンバータおよび類するもの)、シンボルデマッパ、信号整形構成要素、逆高速フーリエ変換(IFFT)モジュール、および類するものなどの、他の構成要素を含み得る。
【0070】
例えば、送受信器28は、アンテナ25による送信のために、キャリア波形上へと情報を変調し、装置20の他の要素によるさらなる処理のために、アンテナ25を介して受信された情報を復調するように構成され得る。他の実施形態において、送受信器28は、直接的に信号またはデータを送信および受信する能力があり得る。追加的または代替的に、いくつかの実施形態において、装置10は、入力および/または出力デバイス(I/Oデバイス)を含み得る。特定の実施形態において、装置20は、グラフィカルユーザインターフェイスまたはタッチスクリーンなどのユーザインターフェイスをさらに含み得る。
【0071】
一実施形態において、メモリ24は、プロセッサ22により実行されるときに機能性を提供するソフトウェアモジュールを記憶する。モジュールは、例えば、装置20に対するオペレーティングシステム機能性を提供するオペレーティングシステムを含み得る。メモリは、また、装置20に対する追加的な機能性を提供するために、アプリケーションまたはプログラムなどの、1つ以上の機能モジュールを記憶し得る。装置20の構成要素は、ハードウェアにおいて、または、ハードウェアおよびソフトウェアの任意の適した組み合わせとして実装され得る。一例示の実施形態によれば、装置20は、任意選択で、NRなどの任意の無線アクセス技術による、ワイヤレスまたは有線通信リンク70を介して、装置10と通信するように構成され得る。
【0072】
いくつかの実施形態によれば、プロセッサ22およびメモリ24は、処理回路網もしくは制御回路網内に含められ得る、または、処理回路網もしくは制御回路網の一部を形成し得る。加えて、いくつかの実施形態において、送受信器28は、送受信回路網内に含められ得る、または、送受信回路網の一部を形成し得る。
【0073】
上記で論考されたように、いくつかの実施形態によれば、装置20は、例えば、UE、モバイルデバイス、モバイル局、ME、IoTデバイス、および/またはNB-IoTデバイスであり得る。特定の実施形態によれば、装置20は、本明細書において説明される例示の実施形態と関連付けられる機能を行うように、メモリ24およびプロセッサ22により制御され得る。例えば、いくつかの実施形態において、装置20は、本明細書において説明されるフローチャートまたはシグナリングダイアグラムのうちの任意のものにおいて描写されるプロセスのうちの1つ以上を行うように構成され得る。例えば、特定の実施形態において、装置20は、性能メトリックを最適化するために、GoBから選択されるビーム上で、ネットワークから受信する、または、ネットワークに送信するための手順を行うように構成され得る。
【0074】
ゆえに、いくつかの実施形態によれば、装置20は、GoBから選択されるビーム上で、ネットワークからのデータを受信または送信するために、性能測定基準を最適化するように、メモリ24およびプロセッサ22により制御され得る。
【0075】
それゆえに、特定の例示の実施形態は、いろいろな技術的改善、増強、および/または利点を提供する。例えば、特定の実施形態は、GoBの設計などの、ビームフォーミング技法に対する改善を提供する。
【0076】
例えば、上記で論考されたように、特定の実施形態は、ビームフォーミング利得の幾何平均を最大化することができる。いくつかの実施形態において、MLベースのGoB設計は、トラフィック分布に無関係に選定される、大まかな一様のベースラインに対して、ビームフォーミング利得の幾何平均において6dB利得をもたらし得る。例えば、特定の実施形態は、より少ないトラフィックが存する領域内で広いビームをもたらし得、高いトラフィック密度が存する領域は、その方向においてポインティングするより大量のビームを有し得る。別の例において、UEがセクタの1つのエッジにおいて疎に配置される場合、ビームの大部分は、トラフィックが集中するセルの他の領域に向けられ得、結果として、UEのビームフォーミング利得の幾何平均において、最高で4.6dB改善が存する。よって、例示の実施形態は、他のビームフォーミング技法と比較されるときに、有意な追加的なビームフォーミング利得を提供する。
【0077】
しかるがゆえに、例示の実施形態は、ネットワーク、ならびに、例えば、アクセスポイント、基地局/eNB/gNB、および、モバイルデバイスまたはUEを含むネットワークノードの、電力効率、性能、遅延、および/またはスループットを改善し得る。よって、特定の例示の実施形態の使用は、通信ネットワーク、および、それらのノードの、改善された機能実行をもたらす。
【0078】
いくつかの例示の実施形態において、本明細書において説明される方法、プロセス、シグナリングダイアグラム、アルゴリズム、またはフローチャートのうちの任意のものの機能性は、メモリ、または、他のコンピュータ可読もしくは有形媒体内に記憶され、プロセッサにより実行される、ソフトウェア、および/または、コンピュータプログラムコード、もしくは、コードの部分により実装され得る。
【0079】
いくつかの例示の実施形態において、装置が、少なくとも1つの演算プロセッサにより実行される、算術演算として、または、プログラム、もしくは、プログラムの部分(追加または更新されるソフトウェアルーチンを含む)として構成される、少なくとも1つのソフトウェアアプリケーション、モジュール、ユニット、またはエンティティとともに含められ、あるいは、少なくとも1つのソフトウェアアプリケーション、モジュール、ユニット、またはエンティティと関連付けられ得る。ソフトウェアルーチン、アプレット、およびマクロを含む、またプログラム製品またはコンピュータプログラムと呼ばれるプログラムは、任意の装置可読データ記憶媒体内に記憶され、個別のタスクを行うためのプログラム命令を含み得る。
【0080】
コンピュータプログラム製品は、プログラムが走らされるときに、いくつかの例示の実施形態を遂行するように構成される、1つ以上のコンピュータ実行可能構成要素を備え得る。1つ以上のコンピュータ実行可能構成要素は、少なくとも1つのソフトウェアコード、または、少なくとも1つのソフトウェアコードの部分であり得る。一例示の実施形態の機能性を実装するために必要な修正および構成は、追加または更新されるソフトウェアルーチンとして実装され得るルーチンとして行われ得る。ソフトウェアルーチンは、装置内へとダウンロードされ得る。
【0081】
例として、ソフトウェアもしくはコンピュータプログラムコード、または、その部分は、ソースコード形態、オブジェクトコード形態での、または、何らかの中間形態でのものであり得、プログラムを搬送する能力がある任意のエンティティまたはデバイスであり得る、何らかの種類のキャリア、配信媒体、またはコンピュータ可読媒体内に記憶され得る。そのようなキャリアは、例えば、記録媒体、コンピュータメモリ、読み出し専用メモリ、光電および/または電気キャリア信号、電気通信信号、ならびにソフトウェア配信パッケージを含み得る。必要とされる処理電力に応じて、コンピュータプログラムは、単一の電子デジタルコンピュータにおいて実行され得、または、コンピュータプログラムは、いくつかのコンピュータの間で分散され得る。コンピュータ可読媒体またはコンピュータ可読記憶媒体は、非一時的媒体であり得る。
【0082】
他の例示の実施形態において、機能性は、例えば、特定用途向け集積回路(ASIC)、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)、または、ハードウェアおよびソフトウェアの任意の他の組み合わせの使用を通して、装置(例えば、装置10または装置20)内に含まれるハードウェアまたは回路網により行われ得る。なおも別の例示の実施形態において、機能性は、インターネットまたは他のネットワークからダウンロードされる電磁信号により搬送され得る、信号、非有形手段として実装され得る。
【0083】
一例示の実施形態によれば、ノード、デバイス、または、対応する構成要素などの装置は、単一チップコンピュータ要素など、回路網、コンピュータ、もしくは、マイクロプロセッサとして、または、少なくとも、算術演算のために使用される記憶容量を提供するためのメモリと、算術演算を実行するための演算プロセッサとを含むチップセットとして構成され得る。
【0084】
当業者は、上記で論考されたような例示の実施形態が、開示されるものとは異なる順序でのステップによって、および/または、開示されるものとは異なる構成でのハードウェア要素によって実践され得るということをたやすく理解することになる。それゆえに、いくつかの実施形態が、これらの例の好ましい実施形態に基づいて説明されたが、特定の修正、変形、および代替的構築が、例示の実施形態の趣旨および範囲の中にとどまりながらも明らかなことになるということが、当業者には明らかなことになる。それゆえに、例示の実施形態の境界および範囲を決定するために、参照が、添付される特許請求の範囲に対して行われるべきである。