(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-18
(45)【発行日】2023-10-26
(54)【発明の名称】学習方法、学習装置及びプログラム
(51)【国際特許分類】
H04W 28/18 20090101AFI20231019BHJP
H04W 24/08 20090101ALI20231019BHJP
【FI】
H04W28/18 110
H04W24/08
(21)【出願番号】P 2020121299
(22)【出願日】2020-07-15
【審査請求日】2022-08-01
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(73)【特許権者】
【識別番号】504132272
【氏名又は名称】国立大学法人京都大学
(74)【代理人】
【識別番号】110001634
【氏名又は名称】弁理士法人志賀国際特許事務所
(72)【発明者】
【氏名】宮武 遼
(72)【発明者】
【氏名】淺井 裕介
(72)【発明者】
【氏名】西尾 理志
(72)【発明者】
【氏名】守倉 正博
【審査官】倉本 敦史
(56)【参考文献】
【文献】米国特許出願公開第2020/0177303(US,A1)
【文献】三熊智哉、他4名,ミリ波通信の伝送レート制御に向けた深度画像に基づくMCS Index予測の検討,電子情報通信学会技術研究報告,2020年01月23日,vol.119、no.406,pp.51-52
(58)【調査した分野】(Int.Cl.,DB名)
H04W 4/00-99/00
(57)【特許請求の範囲】
【請求項1】
無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習ステップ、
を有
し、
前記学習ステップにおいては、
前記モデルを用いて推定された前記インデックスの推定値と前記インデックスの真値とを用いて算出される損失関数の値を、前記インデックスの推定値に対応した通信速度が前記インデックスの真値に対応した通信速度よりも遅い場合には、前記インデックスの推定値に対応した通信速度が前記インデックスの真値に対応した速度よりも早い場合に比べて小さくし、前記損失関数の値に基づいて推定の精度を向上させるように前記モデルを学習する学習方法。
【請求項2】
前記インデックスの値は、通信速度が速いほど大きく、前記インデックスの真値は、前記インデックスがとり得るK個の値それぞれに対応した要素t
k(kは1以上K以下の整数)からなるone-hot表現の配列tで表され、前記インデックスの推定値は、前記インデックスがとり得るK個の値それぞれに対応し、かつ、対応する前記値である確率を表す要素y
kからなる配列yで表される場合に、
前記損失関数は、各要素番号kについて算出される要素y
kと要素t
kとの差分の2乗を重み付け加算する関数であり、
前記重み付け加算の重みは、前記要素番号kが真値に対応した要素番号よりも大きいほど大きい、
請求項
1に記載の学習方法。
【請求項3】
無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習ステップ、
を有し、
前記画像と、当該画像が撮影されたときの前記インデックスの値とを対応付けたデータを複数記憶する記憶ステップと、
類似した複数の前記画像それぞれに対応付けられた前記インデックスの値を、類似した複数の当該画像それぞれに対応付けられた前記インデックスの値のうち、最も早い通信速度に対応した値に書替えて学習データを生成する学習データ生成ステップと
、
をさらに有し、
前記学習ステップにおいては、前記学習データ生成ステップにおいて生成された前記学習データを用いて前記モデルを学習す
る学習方法。
【請求項4】
前記モデルは、ニューラルネットワークであり、
前記インデックスは、変調方式及び符号化率の組み合わせを表すMCS(Modulation and Coding Scheme) indexである、
請求項1から請求項
3のいずれか一項に記載の学習方法。
【請求項5】
無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習部、
を備え
、
前記学習部は、
前記モデルを用いて推定された前記インデックスの推定値と前記インデックスの真値とを用いて算出される損失関数の値を、前記インデックスの推定値に対応した通信速度が前記インデックスの真値に対応した通信速度よりも遅い場合には、前記インデックスの推定値に対応した通信速度が前記インデックスの真値に対応した速度よりも早い場合に比べて小さくし、前記損失関数の値に基づいて推定の精度を向上させるように前記モデルを学習する学習装置。
【請求項6】
無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習部、
を備え、
前記画像と、当該画像が撮影されたときの前記インデックスの値とを対応付けたデータを複数記憶する記憶部と、
類似した複数の前記画像それぞれに対応付けられた前記インデックスの値を、類似した複数の当該画像それぞれに対応付けられた前記インデックスの値のうち、最も早い通信速度に対応した値に書替えて学習データを生成する学習データ生成部と、
をさらに備え、
前記学習部は、前記学習データ生成部が生成した前記学習データを用いて前記モデルを学習する学習装置。
【請求項7】
コンピュータを、
請求項
5又は請求項6に記載の学習装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習方法、学習装置及びプログラムに関する。
【背景技術】
【0002】
大容量かつ高速通信を実現できる次世代無線通信技術として、ミリ波通信に期待が集まっている(例えば、非特許文献1参照)。ミリ波通信の利点の一つは利用可能な周波数幅が広帯域な点であり、1Gbit/s(ギガビット毎秒)を超える高速通信が可能である。その一方で、ミリ波は水分や酸素による減衰が大きいため、見通し通信路が人体等で遮蔽されると通信品質が急激に低下するという欠点がある(例えば、非特許文献2参照)。
【0003】
ミリ波通信における見通し通信路遮蔽問題の解決のため、RGB-D(RGB and Depth)カメラを用いたミリ波通信のためのハンドオーバシステムが検討されている(例えば、非特許文献3、4参照)。このシステムは、RGB-Dカメラを用いてミリ波通信環境を観測し、カメラにより撮影された画像・動画データから現在のミリ波通信環境や将来のミリ波通信環境を推定・予測する。推定・予測データに基づきハンドオーバ制御を行うことで、制御信号により無線帯域を圧迫することなく、見通し通信路遮蔽を含むミリ波通信環境の変化による通信品質の低下を回避できる。また、通信中ではない基地局と端末間の通信品質情報を深度画像から推定することで、無線帯域を消費せずに切替先基地局選択のための指標を取得可能である。非特許文献4においては、RGB-Dカメラと機械学習を用いたミリ波通信品質推定が提案されている。この非特許文献4の技術では、ディープニューラルネットワークを用いて、RGB-Dカメラから得られる深度画像と受信信号電力の対応モデルを学習し、学習したモデルを用いて新たな深度画像から受信信号電力を推定する。
【0004】
また、深度画像とMCS(Modulation and Coding Scheme) indexの対応関係の学習可能性が検討されている(例えば、非特許文献5参照)。MCSは、一般に変調方式や符号化率の組み合わせが格納されたMCS indexテーブルとして表される。MCS indexを決定することにより、対応する変調方式や符号化率が決定される。MCS indexを決定することをMCS制御とも記載する。非特許文献5では、ある画像に対して最適なMCSがわかると仮定した場合、深度画像からMCS indexを推定するモデルを、ディープニューラルネットワークにより学習できることを示している。
【0005】
さらには、カメラ画像を用いずにMCS制御を行う従来技術がある(例えば、非特許文献6参照)。この技術では、過去の通信履歴のみから次のMCS indexを決定する。MCS indexの決定方法として、通信が一定回数成功した場合にMCS indexを増加させ、通信が失敗した場合にMCS indexを減少させるといった方法があげられる。しかし、これらの実装はベンダー依存であり、規格化はされていない。
【先行技術文献】
【非特許文献】
【0006】
【文献】Peng Wang,Yonghui Li,Lingyang Song,Branka Vucetic,"Multi-Gigabit Millimeter Wave Wireless Communications for 5G: From Fixed Access to Cellular Networks",IEEE Communications Magazine,2015年1月,p.168-178
【文献】Sylvain Collonge,Gheorghe Zaharia,Ghais El Zein,"Influence of the Human Activity on Wide-Band Characteristics of the 60 GHz Indoor Radio Channel",IEEE Transactions on Wireless Communications,2004年11月,vol.3,no.6,p.2396-2406
【文献】Yuta Oguma,Ryohei Arai,Takayuki Nishio,Koji Yamamoto,Masahiro Morikura,"Proactive Base Station Selection Based on Human Blockage Prediction Using RGB-D Cameras for mmWave Communications",2015 IEEE Global Communications Conference (GLOBECOM),2015年,p.1-6
【文献】Takayuki Nishio,Hironao Okamoto,Kota Nakashima,Yusuke Koda,Koji Yamamoto,Masahiro Morikura,Yusuke Asai,Ryo Miyatake,"Proactive Received Power Prediction Using Machine Learning and Depth Images for mmWave Networks",IEEE Journal on Selected Areas in Communications,Vol.37,No.11,November 2019
【文献】三熊智哉,西尾理志,守倉正博,浅井裕介,宮武遼,"[ポスター講演]ミリ波通信の伝送レート制御に向けた深度画像に基づくMCS Index 予測の検討",一般社団法人 電子情報通信学会,信学技報,2020年1月,SeMI2019-111,p.51-52
【文献】Dong Xia,Jonathan Hart,Qiang Fu,"Evaluation of the Minstrel Rate Adaptation Algorithm in IEEE 802.11g WLANs",IEEE ICC 2013 - Communication QoS,Reliability and Modeling Symposium,2013年,p.2223-2228
【発明の概要】
【発明が解決しようとする課題】
【0007】
非特許文献5においては、画像からMCSへの写像可能性が検討されている。
図8は、非特許文献5の処理の流れを示す図である。この技術では、基地局と端末がミリ波で通信している状況において、深度画像に対して正解とされる最適なMCS indexが割当られたデータセットが予め準備されていることを仮定する。そして、そのデータセットを用いて、深度画像からMCS indexへの写像をディープニューラルネットワークにより学習する。非特許文献5では、学習されたモデルを用いることで、新たに深度画像が得られたときに直接的に最適(とされている)MCS indexの推定が可能であることを実験データで示し、予測的MCS制御により、回線断確率が減少できることを示している。
【0008】
非特許文献6のようにカメラ画像を用いない従来のMCS制御手法では、ミリ波通信における急峻な受信信号電力の低下に対応できず、大量のパケットロスが発生した後にMCSを変更する。そのため、頻繁に通信路が遮蔽されるような環境においては通信品質が低下する。上述した非特許文献5では、カメラ画像を用いてMCS制御を行っている。しかし、非特許文献5では、深度画像とMCS indexの対応関係が学習できるかどうかを検証することに主眼がおかれ、学習に用いられる深度画像とMCSのデータセットについては検討されていない。
【0009】
上記事情に鑑み、本発明は、人手による手間を軽減しながら用意した学習用のデータを用いて、無線通信におけるバースト誤りを低減する変調方式や符号化率の推定モデルを学習することができる学習方法、学習装置及びプログラムを提供することを目的としている。
【課題を解決するための手段】
【0010】
本発明の一態様は、無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習ステップ、を有する学習方法である。
【0011】
本発明の一態様は、無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習部、を備える学習装置である。
【0012】
本発明の一態様は、コンピュータを、上述の学習装置として機能させるためのプログラムである。
【発明の効果】
【0013】
本発明により、人手による手間を軽減しながら用意した学習用のデータを用いて、無線通信におけるバースト誤りを低減する変調方式や符号化率の推定モデルを学習することが可能となる。
【図面の簡単な説明】
【0014】
【
図1】本発明の第1の実施形態による無線通信システムの構成図である。
【
図2】同実施形態に用いられるMCS indexテーブルの例を示す図である。
【
図3】同実施形態による無線通信システムの処理を示すフロー図である。
【
図4】同実施形態によるMCS誤推定時のペナルティの非対称性の一例を示す図である。
【
図5】従来技術と実施形態それぞれの回線断確率を示す図である。
【
図6】従来技術と実施形態それぞれの平均スループットを示す図である。
【
図7】実施形態によるハードウェア構成を示す図である。
【発明を実施するための形態】
【0015】
以下、図面を参照しながら本発明の実施形態を詳細に説明する。
【0016】
(第1の実施形態)
図1は、本発明の第1の実施形態による無線通信システムの構成図である。無線通信システム1は、基地局(BS;Base Station)2と、カメラ3と、学習装置4と、無線端末(STA;Station)5とを備える。
【0017】
基地局2は、ユーザが移動しながら使用するSTA5とミリ波通信を行う。基地局2及びSTA5は、無線通信装置の一例である。ミリ波通信は大容量かつ高速通信を実現できる一方で、見通し通信路が人体等で遮蔽されることで通信品質が急峻に低下する。この問題を解決するために、学習装置4は、学習したモデルを用いて、カメラ画像からMCS(Modulation and Coding Scheme) indexを予測的に決定する。
【0018】
上記のように、ミリ波通信では、遮蔽発生時は所望信号が大きく減衰するため、信号対雑音比(SNR:Signal to Noise Ratio)が低下する。そこで、学習装置4は、遮蔽発生を予め予測し、SNRが低い場合でも通信が成功するMCS indexを選択することでパケットのバースト損失を回避する。具体的には、学習装置4は、通信環境を監視するカメラ3により撮影した画像から最適なMCS indexを直接的に推定するMCS推定モデルを学習する。学習には、例えば、カメラ画像を用いた受信電力予測手法(非特許文献4)の技術を応用することができる。なお、MCS indexが大きな値であるほど、高いSNR及び早い通信速度に対応した変調方式及び符号化率の組み合わせであるとする。
【0019】
学習のため、学習装置4は、カメラ画像を用いない従来のMCS制御によりBS2がSTA5と通信した結果を、そのときのカメラ画像と共に通信履歴データベースに保存する。次に、学習装置4は、通信履歴データベースに記憶されている各カメラ画像の類似度を計算し、類似度が所定よりも高いカメラ画像に対応するMCS indexとそのときの通信成功の有無とから通信が成功する最大のMCS indexを求める。学習装置4は、類似度が所定よりも高いそれらカメラ画像すべてに、求めた最大のMCS indexをラベル付けする。学習装置4は、このカメラ画像とラベル付けされたMCS indexとの対応関係をニューラルネットワーク等により教師あり学習する。これにより、学習装置4は、未知のカメラ画像が得られたときも通信が成功するMCS indexの中で伝送レートが最大のMCS indexを推定することができる。本実施形態により、未来の通信品質を予測したMCS制御が可能になるため、従来のMCS制御に比べてバースト誤りを低減し、高いスループットを実現可能である。
【0020】
各装置の構成について説明する。
BS2は、STA5と無線通信を行うRF(Radio Frequency:無線周波数)処理部21を備える。RF処理部21は、通信制御部22と、MCS制御部23とを備える。通信制御部22は、STA5と従来技術と同様にミリ波通信を行う。MCS制御部23は、学習装置4から通知されたMCS indexに基づいて通信を行うよう、通信制御部22に指示する。通信制御部22は、MCS制御部23により指示されたMCS indexに対応した変調方式と符号化率との組み合わせを用いてミリ波通信を行う。なお、MCS制御部23は、学習装置4がMCS推定モデルの学習を終えるまでは、従来技術と同様にMCS indexを決定する。
【0021】
カメラ3は、深度画像を撮像する撮像装置の一例である。例えば、カメラ3は、RGB-D(RGB and Depth)カメラであり、RGB-D画像など距離情報を含むカメラ画像を撮影する。カメラ3は、BS2とSTA5との間の無線の見通し通信路や、その周辺を含んだカメラ画像を撮影し、学習装置4に送信する。カメラ画像は、静止画でもよく、動画でもよい。動画の場合、動画を構成する各フレームを、1枚のカメラ画像とする。
カメラ画像は、少なくともピクセルごとの深度(距離)のデータを含む。
【0022】
学習装置4は、情報管理部41と、学習データ生成部42と、機械学習部43と、推定部44とを備える。情報管理部41は、通信履歴データベースを記憶する。通信履歴データベースは、カメラ3により撮像されたカメラ画像と、そのカメラ画像が撮像された時刻にBS2がSTA5と通信したときのMCS indexとを紐付けて保持する。通信履歴データベースには、BS2とSTA5の通信が成功したときのカメラ画像とMCS indexが紐づけて設定される。なお、通信履歴データベースには、カメラ画像とMCS indexとBS2とSTA5の通信が成功したか否かとの情報とが設定されてもよい。学習データ生成部42は、通信履歴データベースに記憶されているカメラ画像と、通信が成功したときのMCS indexとの組を用いて、モデル学習に用いる学習データを生成する。機械学習部43は、学習データ生成部42が生成した学習データを用いて、カメラ画像とMCS indexの値との対応を表すMCS推定モデルを学習する。推定部44は、機械学習部43が学習したMCS推定モデルを用いて、カメラ画像からBS2が次に用いるMCS indexの値を決定し、決定したMCS indexをBS2に指示する。
【0023】
なお、学習装置4は、カメラ3が撮像した静止画や動画から生成された画像の全てをMCS推定モデルの機械学習に利用してもよく、それら生成された画像から任意に選択した画像をMCS推定モデルの機械学習に利用してもよい。また、学習装置4は、それら生成された画像から時系列等の規範に則って複数の画像を抽出し、画素ごとに平均化や差分抽出等の画像処理することで新たに生成した画像をMCS推定モデルの機械学習に利用してもよい。
【0024】
図2は、本実施形態に用いられるMCS indexテーブルの例を示す図である。
図2では、IEEE802.11 adにおけるMCS indexテーブルを示している。MCS indexテーブルは、MCS indexの各値に対応した変調方式(Modulation)及び符号化率(Code Rate)を示す。MCS indexの値を、MCS index番号とも記載する。さらに、MCS indexテーブルは、MCS index番号に対応したN
CBPS(number of code bits per symbol)、繰り返し回数、及び、データレートを含む。
図2に示すように、MCS index番号が大きいほど、データレートも大きくなる。
【0025】
図3は、無線通信システム1の処理を示すフロー図である。BS2の通信制御部22は、STA5と無線通信する(ステップS105)。通信制御部22は、時刻の情報と、その時刻においてSTA5との通信に使用したMCS indexとを対応付けて学習装置4に出力する(ステップS110)。通信制御部22は、通信が成功した場合にのみMCS indexを学習装置4に出力してもよく、通信が成功したか否かの情報をMCS indexに付加して学習装置4に出力してもよい。通信が成功したか否かの判断には、例えば、エラーの発生が所定以下であるなど、任意の指標と閾値を用いることができる。一方、カメラ3は、撮影したカメラ画像を、学習装置4にリアルタイムに出力する(ステップS115)。カメラ画像には、時刻の情報が対応付けられている。
【0026】
学習装置4の情報管理部41は、通信履歴データベースに、カメラ3から得られたカメラ画像と、そのカメラ画像が示す時刻においてBS2が通信したときのMCS indexとを紐付けて通信履歴データベースに保存する(ステップS120)。なお、MCS推定モデルの学習が十分になされていない間、BS2は、カメラ画像を用いず従来手法のレート制御(例えば、非特許文献6参照)などを用いてSTA5と通信し、情報管理部41は、そのレート制御の結果のMCS indexを保持する。なお、ここでは、情報管理部41が保持するデータは、通信が成功したもののみとする。
【0027】
学習データ生成部42は、情報管理部41が記憶する通信履歴データベースを用いて、MCS推定モデルを学習するための教師データを作成する(ステップS125)。教師データは、正解が与えられた学習データである。具体的な教師データの生成手順は後述する。機械学習部43は、学習データ生成部42が生成した教師データを用いて、MCS推定モデルを学習する(ステップS130)。MCS推定モデルには、非特許文献4、5において用いられている、convLSTM(Convolutional Long Short-Term Memory)を含むディープニューラルネットワークなどが考えられる。このディープニューラルネットワークは、カメラ画像が入力である場合に精度の高い学習が可能であり、時系列の入力データに対する出力の関係を学習可能である。
【0028】
例えば、非特許文献4では、過去の複数枚のカメラ画像それぞれから得られた深度画像を所定の大きさの画像に圧縮する。非特許文献4のディープニューラルネットワークは、それら複数枚の圧縮された深度画像を入力とし、それら複数枚の深度画像のうち最も新しい深度画像より所定時間だけ先のパワーを出力とする。本実施形態のMCS推定モデルは、このパワーに代えて、入力に用いるそれら複数枚の深度画像のうち最も新しい深度画像より所定時間α(α≧0)だけ先のMCS indexを出力とする。
【0029】
MCS推定モデルが学習された後、推定部44は、カメラ3から新たに得られたカメラ画像を、学習したMCS推定モデルに入力することにより、その時点における通信環境に適したMCS indexを推定する(ステップS135)。推定部44は、決定したMCS indexをBS2へ通知する。
【0030】
BS2のMCS制御部23は、学習装置4から通知されたMCS indexを次の通信期間において使用することを決定する(ステップS140)。MCS制御部23は、決定したMCS indexを用いた通信を通信制御部22に指示する。通信制御部22は、指示されたMCS indexに対応した変調方式及び符号化率を用いて、STA5とミリ波通信を行う。通信制御部22がSTA5との通信を終了すると(ステップS145)、無線通信システム1は、ステップS110からの処理を繰り返す。なお、無線通信システム1は、BS2が同一のSTA5と通信している間、ステップS110~ステップS140の処理を繰り返してもよい。
【0031】
次に、学習データ生成部42における具体的な教師データの生成手順について述べる。学習データ生成部42は、情報管理部41から読み出したカメラ画像とMCS indexとの組み合わせを、カメラ画像の類似度に基づいて分類する。具体的には、学習データ生成部42は、2枚のカメラ画像の組み合わせすべてについてそれらカメラ画像間の距離を計算し、その距離を類似度として用いる。すなわち、学習データ生成部42は、距離が所定よりも近いカメラ画像を類似画像として分類する。距離の例としては、カメラ画像間の深度のユークリッドノルムが挙げられる。あるいは、学習データ生成部42は、非特許文献4の受信電力予測モデルにカメラ画像を入力し、推定された受信電力値の差を距離として用いてもよい。
【0032】
次に、学習データ生成部42は、類似画像として分類されたカメラ画像のデータ群の中から、最も大きなMCS index番号を探索し、そのデータ群に分類された全てのカメラ画像に、探索されたMCS index番号を正解としてラベル付けする。機械学習部43は、このようにしてラベル付けされたカメラ画像を教師データとしてモデル学習に用いる。
【0033】
続いて、機械学習部43がMCS推定モデルを機械学習するときに用いる損失関数について説明する。機械学習では、教師データを学習中のモデルに入力して得られた出力が、その教師データが示す正解に近づくようにモデルに用いられているパラメータ値を変更する。モデルの出力と、正解とがどれくらい近いかの指標として、損失関数により算出される値が用いられる。本実施形態では、機械学習部43は、教師データのカメラ画像をMCS推定モデルに入力して得られた推定結果と、その教師データが示す正解との誤差を、損失関数により算出する。機械学習部43は、損失関数により算出された誤差が小さくなるように、ディープニューラルネットワーク等のMCS推定モデルに用いられているパラメータ値を変更する。なお、損失関数については、例えば、参考文献「斎藤 康毅,"ゼロから作るDeep Learning -Pythonで学ぶディープラーニングの理論と実装",4.2 損失関数,株式会社オイラリー・ジャパン,2016年,p.87-91」に記載されている。
【0034】
MCS推定モデルの機械学習では、MCS indexを誤推定した場合のペナルティの非対称性に着目して、損失関数を設定する方法が考えられる。MCS indexを誤推定した場合のペナルティの非対称性とは以下のようなものである。すなわち、実際には低い値のMCS indexでしか通信できない環境において、高い値のMCS indexが誤選択された場合にはパケットのバースト誤り等が発生し通信品質が大きく劣化する。逆に、実際には高い値のMCS indexで通信できる環境において、低い値のMCS indexを誤選択した場合には大きな通信品質の劣化は起こらず、通信速度の低下が起きるのみである。このように、MCS indexを誤推定した場合のペナルティの非対称性は、品質劣化量の非対称性を表す。
【0035】
図4は、MCS誤推定時のペナルティの非対称性の一例を示す図である。現在の環境で使用可能な最大のMCS indexの真値が「5」あるとする。MCS推定モデルにより推定されたMCS indexの値が「5」であった場合、推定は正しく、現状で可能な最大速度での通信が行われる。一方、MCS推定モデルにより推定されたMCS indexの値が「7」であった場合は、誤推定であり、通信のバースト誤りが発生する。また、MCS推定モデルにより推定されたMCS indexの値が「2」であった場合、通信品質は劣化しないものの、現状で可能な最大速度より遅い速度で通信が行われる。
【0036】
無線通信においては、バースト誤りによる通信不能と比べ、通信速度低下の方が通信品質に与える影響は小さい。そのため、誤推定が起きる場合であっても、真のMCS indexよりも低い値のMCS indexであるように誤推定することが望ましい。そこで、機械学習においてもMCS indexの真値と推定値の大小関係に着目し、真値と比較して推定値が大きい場合には損失関数の出力を大きくし、逆に、真値と比較して推定値が小さい場合には損失関数の出力を小さくする。これにより、バースト誤りを防ぐ学習を行う。
【0037】
ペナルティの非対称性を反映しない従来の場合と、非対称性を反映した場合との損失関数の設定方法を以下で述べる。最初に、ペナルティの非対称性を反映しない従来の場合を説明する。損失関数の一例として、機械学習にて広く利用される二乗和誤差の式を用いて説明する。式(1)は、二乗和誤差Eの式を示す。
【0038】
【0039】
ここで、Kはy配列およびt配列の要素数であり、kは配列のインデックスを表す要素番号である。すなわち、ykは、y配列のk番目の要素を表し、tkは、t配列のk番目の要素を表す。y配列は機械学習への入力信号が、各値のMCS indexである確率を格納した配列である。また、t配列において値が最大の要素番号をi、y配列において値が最大の要素番号をjとする。t配列は、教師データ(=真値)のone-hot表現である。
【0040】
y配列、t配列、要素番号i、要素番号jの具体例を示す。例えば、MCS indexの候補値が1,2,3,4,5のいずれかであり、真値がMCS index=2である問題を考える。まず、MCS indexの候補となる値が5通りであるため、要素数K=5となる。このとき、t配列は真値に対応した要素番号の要素のみに1が設定され、それ以外の要素番号の要素には0が設定されるone-hot表現であるため、t=[0 1 0 0 0]となる。従って、例えばk=2のときのtkの値はt2=1であり、k=3のときのtkの値はt3=0である。
【0041】
次に、y配列は、入力信号がMCS indexの各値である確率を格納した推定値の配列である。つまり、y配列は、入力信号をMCS推定モデルに入力したときの出力から得られる。MCS index=1である確率が0.1、MCS index=2である確率が0.8、MCS index=3である確率が0.02、MCS index=4である確率が0.03、MCS index=5である確率が0.05である場合、y=[0.1 0.8 0.02 0.03 0.05]となる。また、t配列における最大値は2番目の要素の値1であるためi=2となり、y配列における最大値は2番目の要素の値0.8であるためj=2となる。
【0042】
式(1)では、推定されたMCS indexから得られた要素番号jの値が真のMCS indexから得られた要素番号iの値より低い場合であっても高い場合であっても、要素番号iと要素番号jの差分の絶対値(=|i-j|)が同値や近しい値の場合、二乗和誤差Eも同様に同値や近しい値となることが多い。つまり、ペナルティの非対称性が反映されにくい。一例として、t=[0 1 0 0 0]、y=[0.7 0.2 0.1 0 0]の場合(つまりi=2,j=1)のケースAと、t=[0 1 0 0 0]、y=[0.1 0.2 0.7 0 0]の場合(つまりi=2,j=3)のケースBとについて考える。ケースAとケースBのそれぞれについて二乗和誤差Eを求めると、|i-j|はどちらのケースでも1で同値あるため、式(1)により算出した二乗和誤差はケースAもケースBもE=0.57の同値となる。
【0043】
次に、ペナルティの非対称性を反映した損失関数の一例を説明する。例えば式(2)のように損失関数の式に係数akを設ける方法が考えられる。
【0044】
【0045】
係数akの決定方法としては、例えば式(3)が考えられる。
【0046】
【0047】
ここで、iはt配列において値が最大の要素番号、つまり真のMCS index番号を表す。式(3)によれば、要素番号kが要素番号iよりも大きい場合の係数akは、要素番号kが要素番号iよりも小さい場合の係数akよりも大きな値である。また、係数akは、要素番号kが要素番号iよりも大きいほど急激に大きな値となる。一方、要素番号kが要素番号i以下の場合、係数akは、要素番号kが要素番号iとの差が大きいほど小さな値となるものの減少の幅は小さい。つまり、要素番号kが要素番号iよりも大きい場合には、要素番号kが要素番号i以下の場合と比較してペナルティが大きい。
【0048】
一例として、上述のケースAとケースBのそれぞれについて式(2)により二乗和誤差Eを算出すると、ケースAではE≒0.86となり、ケースBではE≒2.0となる。このように、二乗和誤差Eは、同値とはならずペナルティの非対称性が反映できている。
【0049】
なお、本実施形態における損失関数の決定方法は、式(2)や式(3)に限定するものではなく、あくまで「推定値jと教師データ(=真値)iの大小関係やペナルティの非対称性を考慮して決定される損失関数」であればよい。
【0050】
以上説明した実施形態によれば、カメラ画像から得られた情報をもとに予測的にMCS制御を行うことができる。また、カメラ画像を用いない従来のMCS制御手法と比較して、大量のパケットロスを防ぎ、スループットを向上させることができる。
【0051】
本実施形態を用いることにより、駅や商業施設といった頻繁に通信路遮蔽が発生する環境において、ミリ波通信システムの品質を向上させることができる。
【0052】
(第2の実施形態)
上述した第1の実施形態では、変調方式と符号化率の組み合わせを表すMCS index番号の推定を行っている。本実施形態では、MCS indexテーブル内にある変調方式や符号化率それぞれに新たにindex番号を付与する。無線通信システム1は、MCS index番号に代えて、変調方式に付与したindex番号や符号化率に付与したindex番号を用いる。これにより、第2の実施形態の学習装置4は、変調方式や符号化率を直接推定する。
【0053】
(本実施形態の効果)
図5及び
図6を用いて、シミュレーションにより算出された、従来手法と比較した本実施形態の効果を説明する。従来手法としては、カメラ画像を用いない従来のMCS制御手法を用いた。また、無線通信装置を設置する環境として、駅や商業施設といった頻繁に通信路遮蔽が発生する環境を想定した。
図5は、従来手法を用いた場合の回線断確率と、本実施形態を用いた場合の期待される回線断確率とを示す図である。また、
図6は、従来手法を用いた場合の平均スループットの変化と、本実施形態を用いた場合に期待される平均スループットの変化を示す図である。これらの図から、本実施形態を適用した通信装置が設置された環境を撮像したカメラ画像等のデータを用いることにより、学習が進むに従って回線断確率が減少し、従来手法を下回ることがわかる。また、学習が進むに従って回線断確率が減少するため、平均スループットが従来手法を上回ることが期待される。
【0054】
本実施形態を用いることにより、駅や商業施設といった頻繁に通信路遮蔽が発生する環境において、ミリ波通信システムの品質を向上させることができる。また、本実施形態によれば、深度画像に対応して、変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すindex番号をラベル付けした学習データを構築し、深度画像とindex番号との対応を表すモデルを学習することができる。また、index番号が誤推定された場合であっても、バースト誤りを発生させないような学習を行うことができる。
【0055】
学習装置4は、ネットワークを介して通信可能に接続された複数台のコンピュータ装置を用いて実装されてもよい。この場合、学習装置4が備える各機能部は、複数のコンピュータ装置に分散して実装されてもよい。例えば、情報管理部41と、学習データ生成部42と、機械学習部43と、推定部44とは、それぞれ異なるコンピュータ装置に実装されてもよく、一部が異なるコンピュータ装置に実装されてもよい。
【0056】
また、学習装置4をネットワークに接続される複数のコンピュータ装置により実現してもよい。この場合、学習装置4の各機能部を、これら複数のコンピュータ装置のいずれにより実現するかは任意とすることができる。例えば、情報管理部41と、学習データ生成部42と、機械学習部43と、推定部44とが、それぞれ異なるコンピュータ装置に実装されてもよく、一部が異なるコンピュータ装置に実装されてもよい。また、同一の機能部を複数のコンピュータ装置により実現してもよい。また、学習装置4の全て又は一部の機能部をBS2が有してもよい。
【0057】
上述した実施形態における学習装置4の機能をコンピュータで実現する場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。また、このプログラムを、ネットワークを通して提供することも可能である。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
【0058】
学習装置4の機能をコンピュータで実現する場合の学習装置4のハードウェア構成例を説明する。
図7は、学習装置4のハードウェア構成例を示す装置構成図である。学習装置4は、プロセッサ71と、記憶部72と、通信インタフェース73と、ユーザインタフェース74とを備える。
【0059】
プロセッサ71は、演算や制御を行う中央演算装置である。プロセッサ71は、例えば、CPUである。プロセッサ71は、プログラムを記憶部72から読み出して実行する。記憶部72は、さらに、プロセッサ71が各種プログラムを実行する際のワークエリアなどを有する。通信インタフェース73は、BS2やカメラ3などの他装置と通信可能に接続するものである。ユーザインタフェース74は、キーボード、ポインティングデバイス(マウス、タブレット等)、ボタン、タッチパネル等の入力装置や、ディスプレイなどの表示装置である。ユーザインタフェース74により、人為的な操作が入力される。
【0060】
情報管理部41、学習データ生成部42、機械学習部43及び推定部44の機能は、プロセッサ71が記憶部72からプログラムを読み出して実行することより実現される。なお、これらの機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。
【0061】
上述した実施形態によれば、学習装置は、学習部を備える。例えば、学習部は、実施形態における機械学習部43に対応する。学習部は、無線通信システムの通信環境を撮影した画像と、その無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する。例えば、画像は、カメラ3により撮影されたカメラ画像である。また、例えば、モデルは、ニューラルネットワークである。また、例えば、インデックスには、変調方式及び符号化率の組み合わせを表すMCS indexを用いることができる。
【0062】
学習部は、モデルを用いて推定されたインデックスの推定値の精度が向上するようにモデルを学習する。推定値の精度の判定は、インデックスの推定値が真値と比較して大きい場合と、インデックスの推定値が真値と比較して小さい場合とでは、不均衡である。
【0063】
学習部は、推定の精度を表す損失関数の値を、モデルを用いて推定されたインデックスの推定値と、インデックスの真値とを用いて算出し、算出された損失関数の値に基づいて推定の精度を向上させるようにモデルを学習する。インデックスの推定値が真値と比較して大きい場合に損失関数により算出される値と、インデックスの推定値が真値と比較して小さい場合に損失関数により算出される値とは不均衡である。
【0064】
例えば、学習部は、モデルを用いて推定されたインデックスの推定値と、インデックスの真値とを用いて算出される損失関数の値を、インデックスの推定値に対応した通信速度がインデックスの真値に対応した通信速度よりも遅い場合には大きくし、インデックスの推定値に対応した通信速度がインデックスの真値に対応した速度よりも早い場合には小さくする。学習部は、損失関数の値に基づいて推定の精度を向上させるようにモデルを学習する。
【0065】
また、例えば、インデックスの値は、通信速度が速いほど大きく、インデックスの真値は、インデックスがとり得るK個の値それぞれに対応した要素tk(kは1以上K以下の整数)からなるone-hot表現の配列tで表され、インデックスの推定値は、インデックスがとり得るK個の値それぞれに対応し、かつ、対応する値である確率を表す要素ykからなる配列yで表される。この場合、損失関数は、各要素番号kについて算出される要素ykと要素tkとの差分の2乗を重み付け加算する関数である。重み付け加算における重みは、要素番号kが真値に対応した要素番号よりも大きいほど大きい。真値に対応した要素番号は、配列tにおいて1が設定されている要素番号i(iは1以上K以下のいずれかの整数)である。
【0066】
学習装置は、情報管理部と、学習データ生成部とをさらに有してもよい。情報管理部は、画像と、その画像が撮影されたときのインデックスの値とを対応付けたデータを複数記憶する。学習データ生成部は、類似した複数の画像それぞれに対応付けられたインデックスの値を、それら類似した複数の画像それぞれに対応付けられたインデックスの値のうち、最も早い通信速度に対応した値に書替えて学習データを生成する。学習部は、学習データ生成部により生成された学習データを用いてモデルを学習する。
【0067】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【産業上の利用可能性】
【0068】
通信路の遮蔽が発生する無線通信システムに適用可能である。
【符号の説明】
【0069】
1…無線通信システム、2…基地局、3…カメラ、4…学習装置、21…RF処理部、22…通信制御部、23…MCS制御部、41…情報管理部、42…学習データ生成部、43…機械学習部、44…推定部、71…プロセッサ、72…記憶部、73…通信インタフェース、74…ユーザインタフェース