特許7369402 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 日本電信電話株式会社の特許一覧 ▶ 国立大学法人京都大学の特許一覧

特許7369402学習方法、学習装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-10-18

(45)【発行日】2023-10-26

(54)【発明の名称】学習方法、学習装置及びプログラム

(51)【国際特許分類】

H04W 28/18 20090101AFI20231019BHJP

H04W 24/08 20090101ALI20231019BHJP

【ＦＩ】

H04W28/18 110

H04W24/08

【請求項の数】 7

(21)【出願番号】P 2020121299

(22)【出願日】2020-07-15

(65)【公開番号】P2022018290

(43)【公開日】2022-01-27

【審査請求日】2022-08-01

(73)【特許権者】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(73)【特許権者】

【識別番号】504132272

【氏名又は名称】国立大学法人京都大学

(74)【代理人】

【識別番号】110001634

【氏名又は名称】弁理士法人志賀国際特許事務所

(72)【発明者】

【氏名】宮武遼

(72)【発明者】

【氏名】淺井裕介

(72)【発明者】

【氏名】西尾理志

(72)【発明者】

【氏名】守倉正博

【審査官】倉本敦史

(56)【参考文献】

【文献】米国特許出願公開第２０２０／０１７７３０３（ＵＳ，Ａ１）

【文献】三熊智哉、他４名，ミリ波通信の伝送レート制御に向けた深度画像に基づくMCS Index予測の検討，電子情報通信学会技術研究報告，2020年01月23日，vol.119、no.406，pp.51-52

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｗ４／００－９９／００

(57)【特許請求の範囲】

【請求項1】

無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習ステップ、
を有し、
前記学習ステップにおいては、
前記モデルを用いて推定された前記インデックスの推定値と前記インデックスの真値とを用いて算出される損失関数の値を、前記インデックスの推定値に対応した通信速度が前記インデックスの真値に対応した通信速度よりも遅い場合には、前記インデックスの推定値に対応した通信速度が前記インデックスの真値に対応した速度よりも早い場合に比べて小さくし、前記損失関数の値に基づいて推定の精度を向上させるように前記モデルを学習する学習方法。

【請求項2】

前記インデックスの値は、通信速度が速いほど大きく、前記インデックスの真値は、前記インデックスがとり得るＫ個の値それぞれに対応した要素ｔ_ｋ（ｋは１以上Ｋ以下の整数）からなるｏｎｅ－ｈｏｔ表現の配列ｔで表され、前記インデックスの推定値は、前記インデックスがとり得るＫ個の値それぞれに対応し、かつ、対応する前記値である確率を表す要素ｙ_ｋからなる配列ｙで表される場合に、
前記損失関数は、各要素番号ｋについて算出される要素ｙ_ｋと要素ｔ_ｋとの差分の２乗を重み付け加算する関数であり、
前記重み付け加算の重みは、前記要素番号ｋが真値に対応した要素番号よりも大きいほど大きい、
請求項１に記載の学習方法。

【請求項3】

無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習ステップ、
を有し、
前記画像と、当該画像が撮影されたときの前記インデックスの値とを対応付けたデータを複数記憶する記憶ステップと、
類似した複数の前記画像それぞれに対応付けられた前記インデックスの値を、類似した複数の当該画像それぞれに対応付けられた前記インデックスの値のうち、最も早い通信速度に対応した値に書替えて学習データを生成する学習データ生成ステップと、
をさらに有し、
前記学習ステップにおいては、前記学習データ生成ステップにおいて生成された前記学習データを用いて前記モデルを学習する学習方法。

【請求項4】

前記モデルは、ニューラルネットワークであり、
前記インデックスは、変調方式及び符号化率の組み合わせを表すＭＣＳ（Modulation and Coding Scheme）ｉｎｄｅｘである、
請求項１から請求項３のいずれか一項に記載の学習方法。

【請求項5】

無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習部、
を備え、
前記学習部は、
前記モデルを用いて推定された前記インデックスの推定値と前記インデックスの真値とを用いて算出される損失関数の値を、前記インデックスの推定値に対応した通信速度が前記インデックスの真値に対応した通信速度よりも遅い場合には、前記インデックスの推定値に対応した通信速度が前記インデックスの真値に対応した速度よりも早い場合に比べて小さくし、前記損失関数の値に基づいて推定の精度を向上させるように前記モデルを学習する学習装置。

【請求項6】

無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習部、
を備え、
前記画像と、当該画像が撮影されたときの前記インデックスの値とを対応付けたデータを複数記憶する記憶部と、
類似した複数の前記画像それぞれに対応付けられた前記インデックスの値を、類似した複数の当該画像それぞれに対応付けられた前記インデックスの値のうち、最も早い通信速度に対応した値に書替えて学習データを生成する学習データ生成部と、
をさらに備え、
前記学習部は、前記学習データ生成部が生成した前記学習データを用いて前記モデルを学習する学習装置。

【請求項7】

コンピュータを、
請求項５又は請求項６に記載の学習装置として機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習方法、学習装置及びプログラムに関する。

【背景技術】

【0002】

大容量かつ高速通信を実現できる次世代無線通信技術として、ミリ波通信に期待が集まっている（例えば、非特許文献１参照）。ミリ波通信の利点の一つは利用可能な周波数幅が広帯域な点であり、１Ｇｂｉｔ／ｓ（ギガビット毎秒）を超える高速通信が可能である。その一方で、ミリ波は水分や酸素による減衰が大きいため、見通し通信路が人体等で遮蔽されると通信品質が急激に低下するという欠点がある（例えば、非特許文献２参照）。

【0003】

ミリ波通信における見通し通信路遮蔽問題の解決のため、ＲＧＢ－Ｄ（RGB and Depth）カメラを用いたミリ波通信のためのハンドオーバシステムが検討されている（例えば、非特許文献３、４参照）。このシステムは、ＲＧＢ－Ｄカメラを用いてミリ波通信環境を観測し、カメラにより撮影された画像・動画データから現在のミリ波通信環境や将来のミリ波通信環境を推定・予測する。推定・予測データに基づきハンドオーバ制御を行うことで、制御信号により無線帯域を圧迫することなく、見通し通信路遮蔽を含むミリ波通信環境の変化による通信品質の低下を回避できる。また、通信中ではない基地局と端末間の通信品質情報を深度画像から推定することで、無線帯域を消費せずに切替先基地局選択のための指標を取得可能である。非特許文献４においては、ＲＧＢ－Ｄカメラと機械学習を用いたミリ波通信品質推定が提案されている。この非特許文献４の技術では、ディープニューラルネットワークを用いて、ＲＧＢ－Ｄカメラから得られる深度画像と受信信号電力の対応モデルを学習し、学習したモデルを用いて新たな深度画像から受信信号電力を推定する。

【0004】

また、深度画像とＭＣＳ（Modulation and Coding Scheme）ｉｎｄｅｘの対応関係の学習可能性が検討されている（例えば、非特許文献５参照）。ＭＣＳは、一般に変調方式や符号化率の組み合わせが格納されたＭＣＳｉｎｄｅｘテーブルとして表される。ＭＣＳｉｎｄｅｘを決定することにより、対応する変調方式や符号化率が決定される。ＭＣＳｉｎｄｅｘを決定することをＭＣＳ制御とも記載する。非特許文献５では、ある画像に対して最適なＭＣＳがわかると仮定した場合、深度画像からＭＣＳｉｎｄｅｘを推定するモデルを、ディープニューラルネットワークにより学習できることを示している。

【0005】

さらには、カメラ画像を用いずにＭＣＳ制御を行う従来技術がある（例えば、非特許文献６参照）。この技術では、過去の通信履歴のみから次のＭＣＳｉｎｄｅｘを決定する。ＭＣＳｉｎｄｅｘの決定方法として、通信が一定回数成功した場合にＭＣＳｉｎｄｅｘを増加させ、通信が失敗した場合にＭＣＳｉｎｄｅｘを減少させるといった方法があげられる。しかし、これらの実装はベンダー依存であり、規格化はされていない。

【先行技術文献】

【非特許文献】

【0006】

【文献】Peng Wang，Yonghui Li，Lingyang Song，Branka Vucetic，"Multi-Gigabit Millimeter Wave Wireless Communications for 5G: From Fixed Access to Cellular Networks"，IEEE Communications Magazine，2015年1月，p.168－178

【文献】Sylvain Collonge，Gheorghe Zaharia，Ghais El Zein，"Influence of the Human Activity on Wide-Band Characteristics of the 60 GHz Indoor Radio Channel"，IEEE Transactions on Wireless Communications，2004年11月，vol.3，no.6，p.2396－2406

【文献】Yuta Oguma，Ryohei Arai，Takayuki Nishio，Koji Yamamoto，Masahiro Morikura，"Proactive Base Station Selection Based on Human Blockage Prediction Using RGB-D Cameras for mmWave Communications"，2015 IEEE Global Communications Conference (GLOBECOM)，2015年，p.1-6

【文献】Takayuki Nishio，Hironao Okamoto，Kota Nakashima，Yusuke Koda，Koji Yamamoto，Masahiro Morikura，Yusuke Asai，Ryo Miyatake，"Proactive Received Power Prediction Using Machine Learning and Depth Images for mmWave Networks"，IEEE Journal on Selected Areas in Communications，Vol.37，No.11，November 2019

【文献】三熊智哉，西尾理志，守倉正博，浅井裕介，宮武遼，"[ポスター講演]ミリ波通信の伝送レート制御に向けた深度画像に基づくMCS Index 予測の検討"，一般社団法人電子情報通信学会，信学技報，2020年１月，SeMI2019-111，p.51-52

【文献】Dong Xia，Jonathan Hart，Qiang Fu，"Evaluation of the Minstrel Rate Adaptation Algorithm in IEEE 802.11g WLANs"，IEEE ICC 2013 - Communication QoS，Reliability and Modeling Symposium，2013年，p.2223-2228

【発明の概要】

【発明が解決しようとする課題】

【0007】

非特許文献５においては、画像からＭＣＳへの写像可能性が検討されている。図８は、非特許文献５の処理の流れを示す図である。この技術では、基地局と端末がミリ波で通信している状況において、深度画像に対して正解とされる最適なＭＣＳｉｎｄｅｘが割当られたデータセットが予め準備されていることを仮定する。そして、そのデータセットを用いて、深度画像からＭＣＳｉｎｄｅｘへの写像をディープニューラルネットワークにより学習する。非特許文献５では、学習されたモデルを用いることで、新たに深度画像が得られたときに直接的に最適（とされている）ＭＣＳｉｎｄｅｘの推定が可能であることを実験データで示し、予測的ＭＣＳ制御により、回線断確率が減少できることを示している。

【0008】

非特許文献６のようにカメラ画像を用いない従来のＭＣＳ制御手法では、ミリ波通信における急峻な受信信号電力の低下に対応できず、大量のパケットロスが発生した後にＭＣＳを変更する。そのため、頻繁に通信路が遮蔽されるような環境においては通信品質が低下する。上述した非特許文献５では、カメラ画像を用いてＭＣＳ制御を行っている。しかし、非特許文献５では、深度画像とＭＣＳｉｎｄｅｘの対応関係が学習できるかどうかを検証することに主眼がおかれ、学習に用いられる深度画像とＭＣＳのデータセットについては検討されていない。

【0009】

上記事情に鑑み、本発明は、人手による手間を軽減しながら用意した学習用のデータを用いて、無線通信におけるバースト誤りを低減する変調方式や符号化率の推定モデルを学習することができる学習方法、学習装置及びプログラムを提供することを目的としている。

【課題を解決するための手段】

【0010】

本発明の一態様は、無線通信システムの通信環境を撮影した画像と、前記無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する学習ステップ、を有する学習方法である。

【0011】

【0012】

本発明の一態様は、コンピュータを、上述の学習装置として機能させるためのプログラムである。

【発明の効果】

【0013】

本発明により、人手による手間を軽減しながら用意した学習用のデータを用いて、無線通信におけるバースト誤りを低減する変調方式や符号化率の推定モデルを学習することが可能となる。

【図面の簡単な説明】

【0014】

【図1】本発明の第１の実施形態による無線通信システムの構成図である。

【図2】同実施形態に用いられるＭＣＳｉｎｄｅｘテーブルの例を示す図である。

【図3】同実施形態による無線通信システムの処理を示すフロー図である。

【図4】同実施形態によるＭＣＳ誤推定時のペナルティの非対称性の一例を示す図である。

【図5】従来技術と実施形態それぞれの回線断確率を示す図である。

【図6】従来技術と実施形態それぞれの平均スループットを示す図である。

【図7】実施形態によるハードウェア構成を示す図である。

【図8】従来技術の処理の流れを示す図である。

【発明を実施するための形態】

【0015】

以下、図面を参照しながら本発明の実施形態を詳細に説明する。

【0016】

（第１の実施形態）
図１は、本発明の第１の実施形態による無線通信システムの構成図である。無線通信システム１は、基地局（ＢＳ；Base Station）２と、カメラ３と、学習装置４と、無線端末（ＳＴＡ；Station）５とを備える。

【0017】

基地局２は、ユーザが移動しながら使用するＳＴＡ５とミリ波通信を行う。基地局２及びＳＴＡ５は、無線通信装置の一例である。ミリ波通信は大容量かつ高速通信を実現できる一方で、見通し通信路が人体等で遮蔽されることで通信品質が急峻に低下する。この問題を解決するために、学習装置４は、学習したモデルを用いて、カメラ画像からＭＣＳ（Modulation and Coding Scheme）ｉｎｄｅｘを予測的に決定する。

【0018】

上記のように、ミリ波通信では、遮蔽発生時は所望信号が大きく減衰するため、信号対雑音比（ＳＮＲ：Signal to Noise Ratio）が低下する。そこで、学習装置４は、遮蔽発生を予め予測し、ＳＮＲが低い場合でも通信が成功するＭＣＳｉｎｄｅｘを選択することでパケットのバースト損失を回避する。具体的には、学習装置４は、通信環境を監視するカメラ３により撮影した画像から最適なＭＣＳｉｎｄｅｘを直接的に推定するＭＣＳ推定モデルを学習する。学習には、例えば、カメラ画像を用いた受信電力予測手法（非特許文献４）の技術を応用することができる。なお、ＭＣＳｉｎｄｅｘが大きな値であるほど、高いＳＮＲ及び早い通信速度に対応した変調方式及び符号化率の組み合わせであるとする。

【0019】

学習のため、学習装置４は、カメラ画像を用いない従来のＭＣＳ制御によりＢＳ２がＳＴＡ５と通信した結果を、そのときのカメラ画像と共に通信履歴データベースに保存する。次に、学習装置４は、通信履歴データベースに記憶されている各カメラ画像の類似度を計算し、類似度が所定よりも高いカメラ画像に対応するＭＣＳｉｎｄｅｘとそのときの通信成功の有無とから通信が成功する最大のＭＣＳｉｎｄｅｘを求める。学習装置４は、類似度が所定よりも高いそれらカメラ画像すべてに、求めた最大のＭＣＳｉｎｄｅｘをラベル付けする。学習装置４は、このカメラ画像とラベル付けされたＭＣＳｉｎｄｅｘとの対応関係をニューラルネットワーク等により教師あり学習する。これにより、学習装置４は、未知のカメラ画像が得られたときも通信が成功するＭＣＳｉｎｄｅｘの中で伝送レートが最大のＭＣＳｉｎｄｅｘを推定することができる。本実施形態により、未来の通信品質を予測したＭＣＳ制御が可能になるため、従来のＭＣＳ制御に比べてバースト誤りを低減し、高いスループットを実現可能である。

【0020】

各装置の構成について説明する。
ＢＳ２は、ＳＴＡ５と無線通信を行うＲＦ（Radio Frequency：無線周波数）処理部２１を備える。ＲＦ処理部２１は、通信制御部２２と、ＭＣＳ制御部２３とを備える。通信制御部２２は、ＳＴＡ５と従来技術と同様にミリ波通信を行う。ＭＣＳ制御部２３は、学習装置４から通知されたＭＣＳｉｎｄｅｘに基づいて通信を行うよう、通信制御部２２に指示する。通信制御部２２は、ＭＣＳ制御部２３により指示されたＭＣＳｉｎｄｅｘに対応した変調方式と符号化率との組み合わせを用いてミリ波通信を行う。なお、ＭＣＳ制御部２３は、学習装置４がＭＣＳ推定モデルの学習を終えるまでは、従来技術と同様にＭＣＳｉｎｄｅｘを決定する。

【0021】

カメラ３は、深度画像を撮像する撮像装置の一例である。例えば、カメラ３は、ＲＧＢ－Ｄ（RGB and Depth）カメラであり、ＲＧＢ－Ｄ画像など距離情報を含むカメラ画像を撮影する。カメラ３は、ＢＳ２とＳＴＡ５との間の無線の見通し通信路や、その周辺を含んだカメラ画像を撮影し、学習装置４に送信する。カメラ画像は、静止画でもよく、動画でもよい。動画の場合、動画を構成する各フレームを、１枚のカメラ画像とする。
カメラ画像は、少なくともピクセルごとの深度（距離）のデータを含む。

【0022】

学習装置４は、情報管理部４１と、学習データ生成部４２と、機械学習部４３と、推定部４４とを備える。情報管理部４１は、通信履歴データベースを記憶する。通信履歴データベースは、カメラ３により撮像されたカメラ画像と、そのカメラ画像が撮像された時刻にＢＳ２がＳＴＡ５と通信したときのＭＣＳｉｎｄｅｘとを紐付けて保持する。通信履歴データベースには、ＢＳ２とＳＴＡ５の通信が成功したときのカメラ画像とＭＣＳｉｎｄｅｘが紐づけて設定される。なお、通信履歴データベースには、カメラ画像とＭＣＳｉｎｄｅｘとＢＳ２とＳＴＡ５の通信が成功したか否かとの情報とが設定されてもよい。学習データ生成部４２は、通信履歴データベースに記憶されているカメラ画像と、通信が成功したときのＭＣＳｉｎｄｅｘとの組を用いて、モデル学習に用いる学習データを生成する。機械学習部４３は、学習データ生成部４２が生成した学習データを用いて、カメラ画像とＭＣＳｉｎｄｅｘの値との対応を表すＭＣＳ推定モデルを学習する。推定部４４は、機械学習部４３が学習したＭＣＳ推定モデルを用いて、カメラ画像からＢＳ２が次に用いるＭＣＳｉｎｄｅｘの値を決定し、決定したＭＣＳｉｎｄｅｘをＢＳ２に指示する。

【0023】

なお、学習装置４は、カメラ３が撮像した静止画や動画から生成された画像の全てをＭＣＳ推定モデルの機械学習に利用してもよく、それら生成された画像から任意に選択した画像をＭＣＳ推定モデルの機械学習に利用してもよい。また、学習装置４は、それら生成された画像から時系列等の規範に則って複数の画像を抽出し、画素ごとに平均化や差分抽出等の画像処理することで新たに生成した画像をＭＣＳ推定モデルの機械学習に利用してもよい。

【0024】

図２は、本実施形態に用いられるＭＣＳｉｎｄｅｘテーブルの例を示す図である。図２では、IEEE802.11 adにおけるＭＣＳｉｎｄｅｘテーブルを示している。ＭＣＳｉｎｄｅｘテーブルは、ＭＣＳｉｎｄｅｘの各値に対応した変調方式（Modulation）及び符号化率（Code Rate）を示す。ＭＣＳｉｎｄｅｘの値を、ＭＣＳｉｎｄｅｘ番号とも記載する。さらに、ＭＣＳｉｎｄｅｘテーブルは、ＭＣＳｉｎｄｅｘ番号に対応したＮ_ＣＢＰＳ（number of code bits per symbol）、繰り返し回数、及び、データレートを含む。図２に示すように、ＭＣＳｉｎｄｅｘ番号が大きいほど、データレートも大きくなる。

【0025】

図３は、無線通信システム１の処理を示すフロー図である。ＢＳ２の通信制御部２２は、ＳＴＡ５と無線通信する（ステップＳ１０５）。通信制御部２２は、時刻の情報と、その時刻においてＳＴＡ５との通信に使用したＭＣＳｉｎｄｅｘとを対応付けて学習装置４に出力する（ステップＳ１１０）。通信制御部２２は、通信が成功した場合にのみＭＣＳｉｎｄｅｘを学習装置４に出力してもよく、通信が成功したか否かの情報をＭＣＳｉｎｄｅｘに付加して学習装置４に出力してもよい。通信が成功したか否かの判断には、例えば、エラーの発生が所定以下であるなど、任意の指標と閾値を用いることができる。一方、カメラ３は、撮影したカメラ画像を、学習装置４にリアルタイムに出力する（ステップＳ１１５）。カメラ画像には、時刻の情報が対応付けられている。

【0026】

学習装置４の情報管理部４１は、通信履歴データベースに、カメラ３から得られたカメラ画像と、そのカメラ画像が示す時刻においてＢＳ２が通信したときのＭＣＳｉｎｄｅｘとを紐付けて通信履歴データベースに保存する（ステップＳ１２０）。なお、ＭＣＳ推定モデルの学習が十分になされていない間、ＢＳ２は、カメラ画像を用いず従来手法のレート制御（例えば、非特許文献６参照）などを用いてＳＴＡ５と通信し、情報管理部４１は、そのレート制御の結果のＭＣＳｉｎｄｅｘを保持する。なお、ここでは、情報管理部４１が保持するデータは、通信が成功したもののみとする。

【0027】

学習データ生成部４２は、情報管理部４１が記憶する通信履歴データベースを用いて、ＭＣＳ推定モデルを学習するための教師データを作成する（ステップＳ１２５）。教師データは、正解が与えられた学習データである。具体的な教師データの生成手順は後述する。機械学習部４３は、学習データ生成部４２が生成した教師データを用いて、ＭＣＳ推定モデルを学習する（ステップＳ１３０）。ＭＣＳ推定モデルには、非特許文献４、５において用いられている、convLSTM（Convolutional Long Short-Term Memory）を含むディープニューラルネットワークなどが考えられる。このディープニューラルネットワークは、カメラ画像が入力である場合に精度の高い学習が可能であり、時系列の入力データに対する出力の関係を学習可能である。

【0028】

例えば、非特許文献４では、過去の複数枚のカメラ画像それぞれから得られた深度画像を所定の大きさの画像に圧縮する。非特許文献４のディープニューラルネットワークは、それら複数枚の圧縮された深度画像を入力とし、それら複数枚の深度画像のうち最も新しい深度画像より所定時間だけ先のパワーを出力とする。本実施形態のＭＣＳ推定モデルは、このパワーに代えて、入力に用いるそれら複数枚の深度画像のうち最も新しい深度画像より所定時間α（α≧０）だけ先のＭＣＳｉｎｄｅｘを出力とする。

【0029】

ＭＣＳ推定モデルが学習された後、推定部４４は、カメラ３から新たに得られたカメラ画像を、学習したＭＣＳ推定モデルに入力することにより、その時点における通信環境に適したＭＣＳｉｎｄｅｘを推定する（ステップＳ１３５）。推定部４４は、決定したＭＣＳｉｎｄｅｘをＢＳ２へ通知する。

【0030】

ＢＳ２のＭＣＳ制御部２３は、学習装置４から通知されたＭＣＳｉｎｄｅｘを次の通信期間において使用することを決定する（ステップＳ１４０）。ＭＣＳ制御部２３は、決定したＭＣＳｉｎｄｅｘを用いた通信を通信制御部２２に指示する。通信制御部２２は、指示されたＭＣＳｉｎｄｅｘに対応した変調方式及び符号化率を用いて、ＳＴＡ５とミリ波通信を行う。通信制御部２２がＳＴＡ５との通信を終了すると（ステップＳ１４５）、無線通信システム１は、ステップＳ１１０からの処理を繰り返す。なお、無線通信システム１は、ＢＳ２が同一のＳＴＡ５と通信している間、ステップＳ１１０～ステップＳ１４０の処理を繰り返してもよい。

【0031】

次に、学習データ生成部４２における具体的な教師データの生成手順について述べる。学習データ生成部４２は、情報管理部４１から読み出したカメラ画像とＭＣＳｉｎｄｅｘとの組み合わせを、カメラ画像の類似度に基づいて分類する。具体的には、学習データ生成部４２は、２枚のカメラ画像の組み合わせすべてについてそれらカメラ画像間の距離を計算し、その距離を類似度として用いる。すなわち、学習データ生成部４２は、距離が所定よりも近いカメラ画像を類似画像として分類する。距離の例としては、カメラ画像間の深度のユークリッドノルムが挙げられる。あるいは、学習データ生成部４２は、非特許文献４の受信電力予測モデルにカメラ画像を入力し、推定された受信電力値の差を距離として用いてもよい。

【0032】

次に、学習データ生成部４２は、類似画像として分類されたカメラ画像のデータ群の中から、最も大きなＭＣＳｉｎｄｅｘ番号を探索し、そのデータ群に分類された全てのカメラ画像に、探索されたＭＣＳｉｎｄｅｘ番号を正解としてラベル付けする。機械学習部４３は、このようにしてラベル付けされたカメラ画像を教師データとしてモデル学習に用いる。

【0033】

続いて、機械学習部４３がＭＣＳ推定モデルを機械学習するときに用いる損失関数について説明する。機械学習では、教師データを学習中のモデルに入力して得られた出力が、その教師データが示す正解に近づくようにモデルに用いられているパラメータ値を変更する。モデルの出力と、正解とがどれくらい近いかの指標として、損失関数により算出される値が用いられる。本実施形態では、機械学習部４３は、教師データのカメラ画像をＭＣＳ推定モデルに入力して得られた推定結果と、その教師データが示す正解との誤差を、損失関数により算出する。機械学習部４３は、損失関数により算出された誤差が小さくなるように、ディープニューラルネットワーク等のＭＣＳ推定モデルに用いられているパラメータ値を変更する。なお、損失関数については、例えば、参考文献「斎藤康毅，"ゼロから作るDeep Learning -Pythonで学ぶディープラーニングの理論と実装"，4.2 損失関数，株式会社オイラリー・ジャパン，2016年，p.87-91」に記載されている。

【0034】

ＭＣＳ推定モデルの機械学習では、ＭＣＳｉｎｄｅｘを誤推定した場合のペナルティの非対称性に着目して、損失関数を設定する方法が考えられる。ＭＣＳｉｎｄｅｘを誤推定した場合のペナルティの非対称性とは以下のようなものである。すなわち、実際には低い値のＭＣＳｉｎｄｅｘでしか通信できない環境において、高い値のＭＣＳｉｎｄｅｘが誤選択された場合にはパケットのバースト誤り等が発生し通信品質が大きく劣化する。逆に、実際には高い値のＭＣＳｉｎｄｅｘで通信できる環境において、低い値のＭＣＳｉｎｄｅｘを誤選択した場合には大きな通信品質の劣化は起こらず、通信速度の低下が起きるのみである。このように、ＭＣＳｉｎｄｅｘを誤推定した場合のペナルティの非対称性は、品質劣化量の非対称性を表す。

【0035】

図４は、ＭＣＳ誤推定時のペナルティの非対称性の一例を示す図である。現在の環境で使用可能な最大のＭＣＳｉｎｄｅｘの真値が「５」あるとする。ＭＣＳ推定モデルにより推定されたＭＣＳｉｎｄｅｘの値が「５」であった場合、推定は正しく、現状で可能な最大速度での通信が行われる。一方、ＭＣＳ推定モデルにより推定されたＭＣＳｉｎｄｅｘの値が「７」であった場合は、誤推定であり、通信のバースト誤りが発生する。また、ＭＣＳ推定モデルにより推定されたＭＣＳｉｎｄｅｘの値が「２」であった場合、通信品質は劣化しないものの、現状で可能な最大速度より遅い速度で通信が行われる。

【0036】

無線通信においては、バースト誤りによる通信不能と比べ、通信速度低下の方が通信品質に与える影響は小さい。そのため、誤推定が起きる場合であっても、真のＭＣＳｉｎｄｅｘよりも低い値のＭＣＳｉｎｄｅｘであるように誤推定することが望ましい。そこで、機械学習においてもＭＣＳｉｎｄｅｘの真値と推定値の大小関係に着目し、真値と比較して推定値が大きい場合には損失関数の出力を大きくし、逆に、真値と比較して推定値が小さい場合には損失関数の出力を小さくする。これにより、バースト誤りを防ぐ学習を行う。

【0037】

ペナルティの非対称性を反映しない従来の場合と、非対称性を反映した場合との損失関数の設定方法を以下で述べる。最初に、ペナルティの非対称性を反映しない従来の場合を説明する。損失関数の一例として、機械学習にて広く利用される二乗和誤差の式を用いて説明する。式（１）は、二乗和誤差Ｅの式を示す。

【0038】

【数1】

【0039】

ここで、Ｋはｙ配列およびｔ配列の要素数であり、ｋは配列のインデックスを表す要素番号である。すなわち、ｙ_ｋは、ｙ配列のｋ番目の要素を表し、ｔ_ｋは、ｔ配列のｋ番目の要素を表す。ｙ配列は機械学習への入力信号が、各値のＭＣＳｉｎｄｅｘである確率を格納した配列である。また、ｔ配列において値が最大の要素番号をｉ、ｙ配列において値が最大の要素番号をｊとする。ｔ配列は、教師データ（＝真値）のｏｎｅ－ｈｏｔ表現である。

【0040】

ｙ配列、ｔ配列、要素番号ｉ、要素番号ｊの具体例を示す。例えば、ＭＣＳｉｎｄｅｘの候補値が１，２，３，４，５のいずれかであり、真値がＭＣＳｉｎｄｅｘ＝２である問題を考える。まず、ＭＣＳｉｎｄｅｘの候補となる値が５通りであるため、要素数Ｋ＝５となる。このとき、ｔ配列は真値に対応した要素番号の要素のみに１が設定され、それ以外の要素番号の要素には０が設定されるｏｎｅ－ｈｏｔ表現であるため、ｔ＝［０１０００］となる。従って、例えばｋ＝２のときのｔ_ｋの値はｔ_２＝１であり、ｋ＝３のときのｔ_ｋの値はｔ_３＝０である。

【0041】

次に、ｙ配列は、入力信号がＭＣＳｉｎｄｅｘの各値である確率を格納した推定値の配列である。つまり、ｙ配列は、入力信号をＭＣＳ推定モデルに入力したときの出力から得られる。ＭＣＳｉｎｄｅｘ＝１である確率が０．１、ＭＣＳｉｎｄｅｘ＝２である確率が０．８、ＭＣＳｉｎｄｅｘ＝３である確率が０．０２、ＭＣＳｉｎｄｅｘ＝４である確率が０．０３、ＭＣＳｉｎｄｅｘ＝５である確率が０．０５である場合、ｙ＝［０．１０．８０．０２０．０３０．０５］となる。また、ｔ配列における最大値は２番目の要素の値１であるためｉ＝２となり、ｙ配列における最大値は２番目の要素の値０．８であるためｊ＝２となる。

【0042】

式（１）では、推定されたＭＣＳｉｎｄｅｘから得られた要素番号ｊの値が真のＭＣＳｉｎｄｅｘから得られた要素番号ｉの値より低い場合であっても高い場合であっても、要素番号ｉと要素番号ｊの差分の絶対値（＝|ｉ－ｊ|）が同値や近しい値の場合、二乗和誤差Ｅも同様に同値や近しい値となることが多い。つまり、ペナルティの非対称性が反映されにくい。一例として、ｔ＝［０１０００］、ｙ＝［０．７０．２０．１００］の場合（つまりｉ＝２，ｊ＝１）のケースＡと、ｔ＝［０１０００］、ｙ＝［０．１０．２０．７００］の場合（つまりｉ＝２,ｊ＝３）のケースＢとについて考える。ケースＡとケースＢのそれぞれについて二乗和誤差Ｅを求めると、|ｉ－ｊ|はどちらのケースでも１で同値あるため、式（１）により算出した二乗和誤差はケースＡもケースＢもＥ＝０．５７の同値となる。

【0043】

次に、ペナルティの非対称性を反映した損失関数の一例を説明する。例えば式（２）のように損失関数の式に係数ａ_ｋを設ける方法が考えられる。

【0044】

【数2】

【0045】

係数ａ_ｋの決定方法としては、例えば式（３）が考えられる。

【0046】

【数3】

【0047】

ここで、ｉはｔ配列において値が最大の要素番号、つまり真のＭＣＳｉｎｄｅｘ番号を表す。式（３）によれば、要素番号ｋが要素番号ｉよりも大きい場合の係数ａ_ｋは、要素番号ｋが要素番号ｉよりも小さい場合の係数ａ_ｋよりも大きな値である。また、係数ａ_ｋは、要素番号ｋが要素番号ｉよりも大きいほど急激に大きな値となる。一方、要素番号ｋが要素番号ｉ以下の場合、係数ａ_ｋは、要素番号ｋが要素番号ｉとの差が大きいほど小さな値となるものの減少の幅は小さい。つまり、要素番号ｋが要素番号ｉよりも大きい場合には、要素番号ｋが要素番号ｉ以下の場合と比較してペナルティが大きい。

【0048】

一例として、上述のケースＡとケースＢのそれぞれについて式（２）により二乗和誤差Ｅを算出すると、ケースＡではＥ≒０．８６となり、ケースＢではＥ≒２．０となる。このように、二乗和誤差Ｅは、同値とはならずペナルティの非対称性が反映できている。

【0049】

なお、本実施形態における損失関数の決定方法は、式（２）や式（３）に限定するものではなく、あくまで「推定値ｊと教師データ（＝真値）ｉの大小関係やペナルティの非対称性を考慮して決定される損失関数」であればよい。

【0050】

以上説明した実施形態によれば、カメラ画像から得られた情報をもとに予測的にＭＣＳ制御を行うことができる。また、カメラ画像を用いない従来のＭＣＳ制御手法と比較して、大量のパケットロスを防ぎ、スループットを向上させることができる。

【0051】

本実施形態を用いることにより、駅や商業施設といった頻繁に通信路遮蔽が発生する環境において、ミリ波通信システムの品質を向上させることができる。

【0052】

（第２の実施形態）
上述した第１の実施形態では、変調方式と符号化率の組み合わせを表すＭＣＳｉｎｄｅｘ番号の推定を行っている。本実施形態では、ＭＣＳｉｎｄｅｘテーブル内にある変調方式や符号化率それぞれに新たにｉｎｄｅｘ番号を付与する。無線通信システム１は、ＭＣＳｉｎｄｅｘ番号に代えて、変調方式に付与したｉｎｄｅｘ番号や符号化率に付与したｉｎｄｅｘ番号を用いる。これにより、第２の実施形態の学習装置４は、変調方式や符号化率を直接推定する。

【0053】

（本実施形態の効果）
図５及び図６を用いて、シミュレーションにより算出された、従来手法と比較した本実施形態の効果を説明する。従来手法としては、カメラ画像を用いない従来のＭＣＳ制御手法を用いた。また、無線通信装置を設置する環境として、駅や商業施設といった頻繁に通信路遮蔽が発生する環境を想定した。図５は、従来手法を用いた場合の回線断確率と、本実施形態を用いた場合の期待される回線断確率とを示す図である。また、図６は、従来手法を用いた場合の平均スループットの変化と、本実施形態を用いた場合に期待される平均スループットの変化を示す図である。これらの図から、本実施形態を適用した通信装置が設置された環境を撮像したカメラ画像等のデータを用いることにより、学習が進むに従って回線断確率が減少し、従来手法を下回ることがわかる。また、学習が進むに従って回線断確率が減少するため、平均スループットが従来手法を上回ることが期待される。

【0054】

本実施形態を用いることにより、駅や商業施設といった頻繁に通信路遮蔽が発生する環境において、ミリ波通信システムの品質を向上させることができる。また、本実施形態によれば、深度画像に対応して、変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すｉｎｄｅｘ番号をラベル付けした学習データを構築し、深度画像とｉｎｄｅｘ番号との対応を表すモデルを学習することができる。また、ｉｎｄｅｘ番号が誤推定された場合であっても、バースト誤りを発生させないような学習を行うことができる。

【0055】

学習装置４は、ネットワークを介して通信可能に接続された複数台のコンピュータ装置を用いて実装されてもよい。この場合、学習装置４が備える各機能部は、複数のコンピュータ装置に分散して実装されてもよい。例えば、情報管理部４１と、学習データ生成部４２と、機械学習部４３と、推定部４４とは、それぞれ異なるコンピュータ装置に実装されてもよく、一部が異なるコンピュータ装置に実装されてもよい。

【0056】

また、学習装置４をネットワークに接続される複数のコンピュータ装置により実現してもよい。この場合、学習装置４の各機能部を、これら複数のコンピュータ装置のいずれにより実現するかは任意とすることができる。例えば、情報管理部４１と、学習データ生成部４２と、機械学習部４３と、推定部４４とが、それぞれ異なるコンピュータ装置に実装されてもよく、一部が異なるコンピュータ装置に実装されてもよい。また、同一の機能部を複数のコンピュータ装置により実現してもよい。また、学習装置４の全て又は一部の機能部をＢＳ２が有してもよい。

【0057】

上述した実施形態における学習装置４の機能をコンピュータで実現する場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。また、このプログラムを、ネットワークを通して提供することも可能である。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。

【0058】

学習装置４の機能をコンピュータで実現する場合の学習装置４のハードウェア構成例を説明する。図７は、学習装置４のハードウェア構成例を示す装置構成図である。学習装置４は、プロセッサ７１と、記憶部７２と、通信インタフェース７３と、ユーザインタフェース７４とを備える。

【0059】

プロセッサ７１は、演算や制御を行う中央演算装置である。プロセッサ７１は、例えば、ＣＰＵである。プロセッサ７１は、プログラムを記憶部７２から読み出して実行する。記憶部７２は、さらに、プロセッサ７１が各種プログラムを実行する際のワークエリアなどを有する。通信インタフェース７３は、ＢＳ２やカメラ３などの他装置と通信可能に接続するものである。ユーザインタフェース７４は、キーボード、ポインティングデバイス（マウス、タブレット等）、ボタン、タッチパネル等の入力装置や、ディスプレイなどの表示装置である。ユーザインタフェース７４により、人為的な操作が入力される。

【0060】

情報管理部４１、学習データ生成部４２、機械学習部４３及び推定部４４の機能は、プロセッサ７１が記憶部７２からプログラムを読み出して実行することより実現される。なお、これらの機能の全て又は一部は、ＡＳＩＣ（Application Specific Integrated Circuit）やＰＬＤ（Programmable Logic Device）やＦＰＧＡ（Field Programmable Gate Array）等のハードウェアを用いて実現されてもよい。

【0061】

上述した実施形態によれば、学習装置は、学習部を備える。例えば、学習部は、実施形態における機械学習部４３に対応する。学習部は、無線通信システムの通信環境を撮影した画像と、その無線通信システムにおいて無線通信が成功したときに用いられていた変調方式、符号化率、又は、変調方式及び符号化率の組み合わせを表すインデックスの値とを対応付けたデータに基づいて、画像とインデックスの値との対応関係を表すモデルを学習する。例えば、画像は、カメラ３により撮影されたカメラ画像である。また、例えば、モデルは、ニューラルネットワークである。また、例えば、インデックスには、変調方式及び符号化率の組み合わせを表すＭＣＳｉｎｄｅｘを用いることができる。

【0062】

学習部は、モデルを用いて推定されたインデックスの推定値の精度が向上するようにモデルを学習する。推定値の精度の判定は、インデックスの推定値が真値と比較して大きい場合と、インデックスの推定値が真値と比較して小さい場合とでは、不均衡である。

【0063】

学習部は、推定の精度を表す損失関数の値を、モデルを用いて推定されたインデックスの推定値と、インデックスの真値とを用いて算出し、算出された損失関数の値に基づいて推定の精度を向上させるようにモデルを学習する。インデックスの推定値が真値と比較して大きい場合に損失関数により算出される値と、インデックスの推定値が真値と比較して小さい場合に損失関数により算出される値とは不均衡である。

【0064】

例えば、学習部は、モデルを用いて推定されたインデックスの推定値と、インデックスの真値とを用いて算出される損失関数の値を、インデックスの推定値に対応した通信速度がインデックスの真値に対応した通信速度よりも遅い場合には大きくし、インデックスの推定値に対応した通信速度がインデックスの真値に対応した速度よりも早い場合には小さくする。学習部は、損失関数の値に基づいて推定の精度を向上させるようにモデルを学習する。

【0065】

また、例えば、インデックスの値は、通信速度が速いほど大きく、インデックスの真値は、インデックスがとり得るＫ個の値それぞれに対応した要素ｔ_ｋ（ｋは１以上Ｋ以下の整数）からなるｏｎｅ－ｈｏｔ表現の配列ｔで表され、インデックスの推定値は、インデックスがとり得るＫ個の値それぞれに対応し、かつ、対応する値である確率を表す要素ｙ_ｋからなる配列ｙで表される。この場合、損失関数は、各要素番号ｋについて算出される要素ｙ_ｋと要素ｔ_ｋとの差分の２乗を重み付け加算する関数である。重み付け加算における重みは、要素番号ｋが真値に対応した要素番号よりも大きいほど大きい。真値に対応した要素番号は、配列ｔにおいて１が設定されている要素番号ｉ（ｉは１以上Ｋ以下のいずれかの整数）である。

【0066】

学習装置は、情報管理部と、学習データ生成部とをさらに有してもよい。情報管理部は、画像と、その画像が撮影されたときのインデックスの値とを対応付けたデータを複数記憶する。学習データ生成部は、類似した複数の画像それぞれに対応付けられたインデックスの値を、それら類似した複数の画像それぞれに対応付けられたインデックスの値のうち、最も早い通信速度に対応した値に書替えて学習データを生成する。学習部は、学習データ生成部により生成された学習データを用いてモデルを学習する。

【0067】

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

【産業上の利用可能性】

【0068】

通信路の遮蔽が発生する無線通信システムに適用可能である。

【符号の説明】

【0069】

１…無線通信システム、２…基地局、３…カメラ、４…学習装置、２１…ＲＦ処理部、２２…通信制御部、２３…ＭＣＳ制御部、４１…情報管理部、４２…学習データ生成部、４３…機械学習部、４４…推定部、７１…プロセッサ、７２…記憶部、７３…通信インタフェース、７４…ユーザインタフェース

【図1】