(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-07-03
(45)【発行日】2025-07-11
(54)【発明の名称】信号解析装置および信号解析方法
(51)【国際特許分類】
H04L 27/00 20060101AFI20250704BHJP
【FI】
H04L27/00 Z
(21)【出願番号】P 2024566857
(86)(22)【出願日】2023-03-07
(86)【国際出願番号】 JP2023008625
(87)【国際公開番号】W WO2024185040
(87)【国際公開日】2024-09-12
【審査請求日】2024-11-12
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】100118762
【氏名又は名称】高村 順
(72)【発明者】
【氏名】上橋 俊介
(72)【発明者】
【氏名】山下 靖貴
(72)【発明者】
【氏名】能田 康義
【審査官】谷岡 佳彦
(56)【参考文献】
【文献】特開2022-135788(JP,A)
【文献】特開2022-008030(JP,A)
【文献】特許第7130179(JP,B2)
【文献】米国特許出願公開第2021/0014092(US,A1)
【文献】特開2022-039703(JP,A)
【文献】特開2005-318246(JP,A)
【文献】特開2008-211760(JP,A)
【文献】特開2012-147094(JP,A)
【文献】高木 学 他,衛星通信システムへの機械学習適用検討,電子情報通信学会技術研究報告[online],日本,一般社団法人電子情報通信学会,2022年,Vol.122 No.163,pp.36-41,SAT2022-35(2022-08)
【文献】SHEN, Guanxiong, et al.,Radio Frequency Fingerprint Identification for LoRa Using Deep Learning,IEEE Journal on Selected Areas in Communications,Vol.39, No.8,2021年,pp.2604-2616
【文献】RAJENDRAN, Sreeraj et al.,Deep Learning Models for Wireless Signal Classification With Distributed Low-Cost Spectrum Sensors,IEEE Transactions on Cognitive Communications and Networking,Vol.4, No.3,2018年,pp.433-445
(58)【調査した分野】(Int.Cl.,DB名)
H04L 27/00
(57)【特許請求の範囲】
【請求項1】
第1の受信信号に対して、周波数およびサンプリングレートのうち少なくとも1つを調整し、第2の受信信号として出力する調整部と、
前記第2の受信信号を時間領域の信号から周波数領域の信号に変換し、周波数領域の信号に変換後の信号を第3の受信信号として出力する周波数領域変換部と、
ニューラルネットワークで構成され、前記第3の受信信号を入力とし、前記調整部において前記第1の受信信号の前記周波数または前記サンプリングレートを調整する複数の行動および各行動に対する価値を出力する行動価値計算部と、
前記価値に基づいて前記複数の行動から前記調整部で行う行動を決定し、決定した行動を前記調整部に出力する行動決定部と、
前記第2の受信信号の変調方式を推定する変調方式推定部と、
前記第2の受信信号および前記変調方式推定部で推定された前記変調方式の推定結果に基づいて、前記第1の受信信号を復調する復調部と、
前記推定結果に基づく最も確率の高い変調方式の確率、前記推定結果に基づく複数の変調方式の各確率の差分、前記復調部の復調結果に基づくコンスタレーション、前記復調結果に基づくアイパターン、前記復調結果に基づくError Vector Magnitude、および前記復調結果に基づくビットパターンのうち少なくとも1つを前記行動価値計算部に出力する入力信号生成部と、
を備え
、
前記行動価値計算部は、さらに、前記入力信号生成部からの情報を入力とし、前記複数の行動および前記価値を前記行動決定部に出力する、
ことを特徴とする信号解析装置。
【請求項2】
第1の受信信号に対して、周波数およびサンプリングレートのうち少なくとも1つを調整し、第2の受信信号として出力する調整部と、
前記第2の受信信号を時間領域の信号から周波数領域の信号に変換し、周波数領域の信号に変換後の信号を第3の受信信号として出力する周波数領域変換部と、
ニューラルネットワークで構成され、前記第3の受信信号を入力とし、前記調整部において前記第1の受信信号の前記周波数または前記サンプリングレートを調整する複数の行動および各行動に対する価値を出力する行動価値計算部と、
前記価値に基づいて前記複数の行動から前記調整部で行う行動を決定し、決定した行動を前記調整部に出力する行動決定部と、
前記第2の受信信号の変調方式を推定する変調方式推定部と、
前記第2の受信信号および前記変調方式推定部で推定された前記変調方式の推定結果に基づいて、前記第1の受信信号を復調する復調部と、
前記推定結果および前記復調部の復調結果に基づいて前記行動に対する報酬を計算し、前記行動価値計算部に出力する報酬計算部
と、
を備え、
前記行動価値計算部は、前記行動決定部に出力した前記複数の行動および前記価値、および前記報酬に基づいて、前記報酬計算部から高い報酬が得られるように前記ニューラルネットワークの各係数を更新することで学習を行う、
ことを特徴とす
る信号解析装置。
【請求項3】
前記行動価値計算部は、前記複数の行動として、前記周波数を調整する1つ以上の行動および前記サンプリングレートを調整する1つ以上の行動のうち少なくとも2つを含めて前記行動決定部に出力する、
ことを特徴とする請求項1
または2に記載の信号解析装置。
【請求項4】
前記行動決定部は、前記価値に基づいて、前記複数の行動から1つの行動を決定する、
ことを特徴とする請求項
3に記載の信号解析装置。
【請求項5】
前記行動決定部は、前記価値に基づいて、前記周波数を調整する1つ以上の行動から1つの行動を決定し、前記サンプリングレートを調整する1つ以上の行動から1つの行動を決定する、
ことを特徴とする請求項
3に記載の信号解析装置。
【請求項6】
前記周波数領域変換部は、前記第3の受信信号として、周波数軸の値、および前記周波数軸の値に対応する電力値または振幅値を出力する、
ことを特徴とする請求項1
または2に記載の信号解析装置。
【請求項7】
調整部が、第1の受信信号に対して、周波数およびサンプリングレートのうち少なくとも1つを調整し、第2の受信信号として出力する調整ステップと、
周波数領域変換部が、前記第2の受信信号を時間領域の信号から周波数領域の信号に変換し、周波数領域の信号に変換後の信号を第3の受信信号として出力する周波数領域変換ステップと、
ニューラルネットワークで構成される行動価値計算部が、前記第3の受信信号を入力とし、前記調整部において前記第1の受信信号の前記周波数または前記サンプリングレートを調整する複数の行動および各行動に対する価値を出力する行動価値計算ステップと、
行動決定部が、前記価値に基づいて前記複数の行動から前記調整部で行う行動を決定し、決定した行動を前記調整部に出力する行動決定ステップと、
変調方式推定部が、前記第2の受信信号の変調方式を推定する変調方式推定ステップと、
復調部が、前記第2の受信信号および前記変調方式推定部で推定された前記変調方式の推定結果に基づいて、前記第1の受信信号を復調する復調ステップと、
入力信号生成部が、前記推定結果に基づく最も確率の高い変調方式の確率、前記推定結果に基づく複数の変調方式の各確率の差分、前記復調部の復調結果に基づくコンスタレーション、前記復調結果に基づくアイパターン、前記復調結果に基づくError Vector Magnitude、および前記復調結果に基づくビットパターンのうち少なくとも1つを前記行動価値計算部に出力する入力信号生成ステップと、
を含
み、
前記行動価値計算ステップにおいて、前記行動価値計算部は、さらに、前記入力信号生成部からの情報を入力とし、前記複数の行動および前記価値を前記行動決定部に出力する、
ことを特徴とする信号解析方法。
【請求項8】
調整部が、第1の受信信号に対して、周波数およびサンプリングレートのうち少なくとも1つを調整し、第2の受信信号として出力する調整ステップと、
周波数領域変換部が、前記第2の受信信号を時間領域の信号から周波数領域の信号に変換し、周波数領域の信号に変換後の信号を第3の受信信号として出力する周波数領域変換ステップと、
ニューラルネットワークで構成される行動価値計算部が、前記第3の受信信号を入力とし、前記調整部において前記第1の受信信号の前記周波数または前記サンプリングレートを調整する複数の行動および各行動に対する価値を出力する行動価値計算ステップと、
行動決定部が、前記価値に基づいて前記複数の行動から前記調整部で行う行動を決定し、決定した行動を前記調整部に出力する行動決定ステップと、
変調方式推定部が、前記第2の受信信号の変調方式を推定する変調方式推定ステップと、
復調部が、前記第2の受信信号および前記変調方式推定部で推定された前記変調方式の推定結果に基づいて、前記第1の受信信号を復調する復調ステップと、
報酬計算部が、前記推定結果および前記復調部の復調結果に基づいて前記行動に対する報酬を計算し、前記行動価値計算部に出力する報酬計算ステップと、
を含み、
前記行動価値計算ステップにおいて、前記行動価値計算部は、前記行動決定部に出力した前記複数の行動および前記価値、および前記報酬に基づいて、前記報酬計算部から高い報酬が得られるように前記ニューラルネットワークの各係数を更新することで学習を行う、
ことを特徴とする信号解析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、受信信号を解析する信号解析装置、制御回路、記憶媒体および信号解析方法に関する。
【背景技術】
【0002】
従来、一般的な無線通信では、搬送波周波数または中心周波数、変調方式、シンボルレートなどの通信パラメータは、送信装置および受信装置で共有されている。一方、スペクトル監視などの分野では、これらの通信パラメータは未知であり、受信装置は、受信した信号からこれらの通信パラメータを推定し、同期処理、復調処理などを行う必要がある。特許文献1には、変調方式推定装置が、通信パラメータの不明な無線通信波の中心周波数および変調方式を、機械学習を用いて推定する技術が開示されている。特許文献1の変調方式推定装置は、ニューラルネットワークへの入力を時間領域のIQ(In-Phase/Quadrature-Phase)信号とし、ニューラルネットワークからの出力として推定される中心周波数および変調方式を得ている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記従来の技術によれば、周波数推定用ニューラルネットワークへの入力を時間領域のIQ信号としている。そのため、多数の変調方式に対応したい場合、対応する変調方式の数に応じて学習時間が増加する、という問題があった。また、入出力の対応数が多くなることで、学習時にニューラルネットワークの係数がうまく収束せず、推定精度が劣化する可能性がある、という問題があった。
【0005】
本開示は、上記に鑑みてなされたものであって、学習時間の増加および推定精度の劣化を抑制しつつ、多数の変調方式に対応可能な信号解析装置を得ることを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、本開示の信号解析装置は、第1の受信信号に対して、周波数およびサンプリングレートのうち少なくとも1つを調整し、第2の受信信号として出力する調整部と、第2の受信信号を時間領域の信号から周波数領域の信号に変換し、周波数領域の信号に変換後の信号を第3の受信信号として出力する周波数領域変換部と、ニューラルネットワークで構成され、第3の受信信号を入力とし、調整部において第1の受信信号の周波数またはサンプリングレートを調整する複数の行動および各行動に対する価値を出力する行動価値計算部と、価値に基づいて複数の行動から調整部で行う行動を決定し、決定した行動を調整部に出力する行動決定部と、第2の受信信号の変調方式を推定する変調方式推定部と、第2の受信信号および変調方式推定部で推定された変調方式の推定結果に基づいて、第1の受信信号を復調する復調部と、推定結果に基づく最も確率の高い変調方式の確率、推定結果に基づく複数の変調方式の各確率の差分、復調部の復調結果に基づくコンスタレーション、復調結果に基づくアイパターン、復調結果に基づくError Vector Magnitude、および復調結果に基づくビットパターンのうち少なくとも1つを行動価値計算部に出力する入力信号生成部と、を備える。行動価値計算部は、さらに、入力信号生成部からの情報を入力とし、複数の行動および価値を行動決定部に出力することを特徴とする。
【発明の効果】
【0007】
本開示に係る信号解析装置は、学習時間の増加および推定精度の劣化を抑制しつつ、多数の変調方式に対応可能である、という効果を奏する。
【図面の簡単な説明】
【0008】
【
図1】実施の形態1に係る信号解析装置の構成例を示す図
【
図2】実施の形態1に係る信号解析装置が備える周波数領域変換部の構成例を示す図
【
図3】実施の形態1に係る信号解析装置が備える周波数領域変換部での動作のイメージを示す図
【
図4】実施の形態1に係る信号解析装置の動作を示すフローチャート
【
図5】実施の形態1に係る信号解析装置を実現する処理回路をプロセッサおよびメモリで構成する場合の処理回路の構成例を示す図
【
図6】実施の形態1に係る信号解析装置を実現する処理回路を専用のハードウェアで構成する場合の処理回路の例を示す図
【
図7】実施の形態2に係る信号解析装置の構成例を示す図
【
図8】実施の形態2に係る信号解析装置が備える入力信号生成部の構成例を示す図
【
図9】実施の形態3に係る信号解析装置の構成例を示す図
【発明を実施するための形態】
【0009】
以下に、本開示の実施の形態に係る信号解析装置、制御回路、記憶媒体および信号解析方法を図面に基づいて詳細に説明する。
【0010】
実施の形態1.
図1は、実施の形態1に係る信号解析装置100の構成例を示す図である。信号解析装置100は、通信パラメータが未知の受信信号を受信する図示しない受信装置などに搭載され、通信パラメータが未知の受信信号を解析する装置である。信号解析装置100は、周波数サンプリングレート調整部101と、周波数領域変換部102と、行動価値計算部103と、行動決定部104と、変調方式推定部105と、復調部106と、を備える。
【0011】
周波数サンプリングレート調整部101は、信号解析装置100に入力される受信信号に対して、行動決定部104で決定された行動に従って、周波数およびサンプリングレートのうち少なくとも1つを調整する調整部である。周波数サンプリングレート調整部101は、調整後の信号を周波数領域変換部102および変調方式推定部105に出力する。信号解析装置100に入力される受信信号は、例えば、背景技術で説明したようなIQ信号である。以降の説明において、信号解析装置100に入力される受信信号、すなわち周波数サンプリングレート調整部101において調整の対象となる受信信号を第1の受信信号と称し、周波数サンプリングレート調整部101で調整後の信号を第2の受信信号と称することがある。
【0012】
周波数サンプリングレート調整部101は、例えば、信号解析装置100の起動直後であって、行動決定部104において周波数およびサンプリングレートのうち少なくとも1つを調整するための行動が決定されていない場合、信号解析装置100に入力される受信信号をそのまま出力する。なお、周波数サンプリングレート調整部101は、行動決定部104で決定された行動に従って周波数およびサンプリングレートのうち少なくとも1つへの調整を規定された回数行ってから、変調方式推定部105へ出力するようにしてもよい。すなわち、周波数サンプリングレート調整部101は、行動決定部104で決定された行動に従って周波数およびサンプリングレートのうち少なくとも1つへの調整を規定された回数行っていない場合、変調方式推定部105に対して出力しなくてもよい。
【0013】
周波数領域変換部102は、周波数サンプリングレート調整部101で調整後の信号を時間領域の信号から周波数領域の信号に変換し、周波数領域の信号に変換後の信号を行動価値計算部103に出力する。周波数領域変換部102は、周波数領域の信号に変換後の信号として、周波数軸の値、および周波数軸の値に対応する電力値または振幅値を出力する。以降の説明において、周波数領域変換部102で周波数領域の信号に変換後の信号を第3の受信信号と称することがある。周波数領域変換部102の構成について詳細に説明する。
図2は、実施の形態1に係る信号解析装置100が備える周波数領域変換部102の構成例を示す図である。周波数領域変換部102は、FFT(Fast Fourier Transform)201と、電力変換部202と、正規化部203と、を備える。ここでは、周波数領域変換部102が、周波数領域の信号に変換後の信号として、周波数軸の値、および周波数軸の値に対応する電力値を出力する場合を例にして説明する。
【0014】
FFT201は、周波数サンプリングレート調整部101で調整後の信号を時間領域の信号から周波数領域の信号に変換する。FFT201は、周波数領域の信号として、周波数軸の値、および周波数軸の値に対応するFFT結果を出力する。FFT201は、スペクトルの高精度化のため、入力信号である周波数サンプリングレート調整部101で調整後の信号を図示しないメモリに貯めておき、Welch法などを用いて平均化してから変換処理を行ってもよい。また、FFT201は、変換処理後、移動平均フィルタなどを適用して周波数領域で平均化してもよい。また、FFT201は、後述する行動価値計算部103とは別のニューラルネットワークを用いて、周波数領域でスペクトルを高精度化するように学習させ、変換処理を行ってもよい。なお、周波数領域変換部102は、周波数サンプリングレート調整部101で調整後の信号を時間領域の信号から周波数領域の信号に変換する方法として、DFT(Discrete Fourier Transform)を用いてもよい。
【0015】
電力変換部202は、FFT201から取得したFFT結果を電力値に変換する。なお、周波数領域変換部102は、前述のように、周波数領域の信号に変換後の信号として、周波数軸の値、および周波数軸の値に対応する振幅値を出力する場合、電力変換部202に替えて、FFT結果を振幅値に変換する構成を備える。
【0016】
正規化部203は、FFT201から取得した周波数軸の値、および電力変換部202から取得した電力値に対して正規化を行う。正規化部203は、正規化の処理として、各種値の平均を0にして分散を1にする処理、最大値1から最小値0の範囲に収める処理など、後段の行動価値計算部103での学習係数安定化のための正規化処理を行ってもよい。なお、周波数領域変換部102は、FFT201からの周波数軸の値、および電力変換部202からの電力値のうち一方だけを正規化してもよい。
【0017】
図3は、実施の形態1に係る信号解析装置100が備える周波数領域変換部102での動作のイメージを示す図である。周波数領域変換部102において、FFT201は、複数の変調方式のうち、BPSK(Binary Phase Shift Keying)、QPSK(Quadrature Phase Shift Keying)、16QAM(Quadrature Amplitude Modulation)、32QAM、64QAMなどの変調方式については、時間領域の信号を周波数領域の信号に変換することで、同様の信号の形状に変換できる。そのため、信号解析装置100は、周波数領域変換部102より後段の構成、すなわち行動価値計算部103での入力パターンを削減できるため、行動価値計算部103での入出力の対応数を削減することができる。なお、周波数領域変換部102は、
図3に示すように、上記の変調方式の他、MSK(Minimum Shift Keying)、FSK(Frequency Shift Keying)などの変調方式にも適用可能である。
【0018】
行動価値計算部103は、周波数領域変換部102からの周波数領域の信号に変換後の信号を入力とするニューラルネットワークで構成される。ニューラルネットワークの出力は、周波数サンプリングレート調整部101での調整の候補となる複数の行動、および各行動の価値とする。すなわち、行動価値計算部103は、周波数領域変換部102からの周波数領域の信号に変換後の信号を入力とし、周波数サンプリングレート調整部101において受信信号の周波数またはサンプリングレートを調整する複数の行動および各行動に対する価値を出力する。複数の行動については、例1に示すように、周波数の調整量およびサンプリングレートの調整量の両方を含んでいてもよいし、例2および例3に示すように、周波数の調整量およびサンプリングレートの調整量の一方のみを含むようにしてもよいし、例4に示すように、スペクトルの重心を求めるような簡易な方法、例えば周波数粗推定法を行動の1つとして含めてもよい。
【0019】
(例1)「行動1:周波数+x%」、「行動2:周波数-x%」、「行動3:サンプリングレート+y%」、「行動4:サンプリングレート-y%」
【0020】
(例2)「行動1:周波数+x%」、「行動2:周波数-x%」、「行動3:周波数+10x%」、「行動4:周波数-10x%」
【0021】
(例3)「行動1:サンプリングレート+y%」、「行動2:サンプリングレート-y%」、「行動3:サンプリングレート+10y%」、「行動4:サンプリングレート-10y%」
【0022】
(例4)「行動1:周波数+x%」、「行動2:周波数-x%」、「行動3:周波数粗推定法1」
【0023】
なお、上記の例では、周波数に対して+x%または-x%とし、サンプリングレートに対して+y%または-y%とするように、+方向および-方向で調整量を同じ大きさにしているが、これに限定されない。行動価値計算部103は、「行動1:周波数+x1%」、「行動2:周波数-x2%」のように、+方向および-方向で調整量を異なる大きさにしてもよい。また、行動価値計算部103は、「行動1:周波数x1%」、「行動2:周波数x2%」のように、+-を示さないで「x1」および「x2」のそれぞれについて+-の両方向への指示を含むようにしてもよい。また、行動価値計算部103は、前回の調整の際に行動決定部104で「行動1:周波数+x%」が選択された場合、次回の調整では+方向は同じ「行動1:周波数+x%」でもよいが、-方向は「行動2:周波数-x2%」のように調整量の大きさを変えてもよい。このように、行動価値計算部103は、複数の行動として、周波数サンプリングレート調整部101において周波数を調整する1つ以上の行動およびサンプリングレートを調整する1つ以上の行動のうち少なくとも2つを含めて行動決定部104に出力する。
【0024】
行動価値計算部103は、ニューラルネットワークの係数について、事前にシミュレーションなどで求めておく。行動価値計算部103のニューラルネットワークについては、行動決定部104に出力する価値の数値が大きいほど対応する行動をとる価値が高いなど、後段の行動決定部104が行動を決定するのに必要な情報となるように事前に学習させておく。また、行動価値計算部103は、各行動に対する調整量についても、事前に、すなわちニューラルネットワークの学習のときに決めておく。
【0025】
行動決定部104は、行動価値計算部103から複数の行動および価値を取得する。行動決定部104は、価値に基づいて複数の行動から周波数サンプリングレート調整部101で行う行動を決定、すなわち信号解析装置100に入力される受信信号に対する行動を決定し、決定した行動を周波数サンプリングレート調整部101に出力する。行動決定部104は、行動の決定方法について、例1に示すように、最も価値が高いと示された行動を1つ選択してもよいし、例2に示すように、周波数およびサンプリングレートそれぞれについて価値が高いものを1つずつ選択してもよいし、例3に示すように、出力された価値の比率に基づいて確率的に選択してもよい。
【0026】
(例1)「行動1:周波数+x% 価値=1.0」、「行動2:周波数-x% 価値=0.2」、「行動3:サンプリングレート+y% 価値=0.3」、「行動4:サンプリングレート-y% 価値=0.9」
この場合、行動決定部104は、行動1を選択する。
【0027】
(例2)「行動1:周波数+x% 価値=1.0」、「行動2:周波数-x% 価値=0.2」、「行動3:サンプリングレート+y% 価値=0.3」、「行動4:サンプリングレート-y% 価値=0.9」
この場合、行動決定部104は、行動1および行動4を選択する。
【0028】
(例3)「行動1:周波数+x% 価値=1.0」、「行動2:周波数-x% 価値=0.2」、「行動3:サンプリングレート+y% 価値=0.3」、「行動4:サンプリングレート-y% 価値=0.9」
この場合、行動決定部104は、1.0/(1.0+0.2+0.3+0.9)の確立で行動1を選択し、0.2/(1.0+0.2+0.3+0.9)の確立で行動2を選択し、0.3/(1.0+0.2+0.3+0.9)の確立で行動3を選択し、0.9/(1.0+0.2+0.3+0.9)の確立で行動4を選択する。なお、行動決定部104は、前回の選択のときに確率の低いものを選択した場合、次回の選択のときには確率の高いものを選択するようにしてもよい。
【0029】
このように、行動決定部104は、価値に基づいて、複数の行動から1つの行動を決定する。または、行動決定部104は、価値に基づいて、周波数を調整する1つ以上の行動から1つの行動を決定し、サンプリングレートを調整する1つ以上の行動から1つの行動を決定する。
【0030】
変調方式推定部105は、周波数サンプリングレート調整部101で周波数およびサンプリングレートのうち少なくとも1つが調整された信号について、変調方式の推定を行う。変調方式の推定方法については、例えば、特許第7130179号公報に記載されているようなニューラルネットワークを用いる方法があるが、これに限定されない。変調方式推定部105は、事前に受信信号の周波数範囲、受信信号のシンボルレートに対するサンプリングレートの比率すなわちオーバーサンプル率などがある程度想定して設計されているため、周波数サンプリングレート調整部101、周波数領域変換部102、行動価値計算部103、および行動決定部104での処理が複数回繰り返されて受信信号の周波数およびサンプリングレートが調整されて変調方式推定部105での想定内に入ることで、正しく変調方式を推定することができる。
【0031】
復調部106は、周波数サンプリングレート調整部101で周波数およびサンプリングレートのうち少なくとも1つが調整された信号、および変調方式推定部105で推定された変調方式の推定結果に基づいて、信号解析装置100に入力される受信信号を復調する。一般的に、無線通信においては、対象信号の周波数、シンボルレート、変調方式などが分かっていれば復調が可能である。そのため、復調部106は、前段までの推定結果を用いることで、通信パラメータが未知の受信信号の復調が可能となる。
【0032】
なお、信号解析装置100では、受信信号を受信した直後は周波数およびサンプリングレートの調整が終了しておらず、変調方式の推定精度、復調の精度などが悪いことも想定される。そのため、信号解析装置100において、周波数サンプリングレート調整部101は、調整完了フラグを管理して、変調方式推定部105および復調部106の動作を制御してもよい。例えば、周波数サンプリングレート調整部101は、周波数サンプリングレート調整部101、周波数領域変換部102、行動価値計算部103、および行動決定部104での処理が複数回繰り返され、規定された回数の調整が行われた場合、周波数およびサンプリングレートがほぼ一定値になったとして、調整完了フラグを立てる。周波数サンプリングレート調整部101は、調整完了フラグが立っていない間は、周波数およびサンプリングレートを調整後の信号を変調方式推定部105に出力せず、調整完了フラグが立っている場合、周波数およびサンプリングレートを調整後の信号を変調方式推定部105に出力する。
【0033】
図4は、実施の形態1に係る信号解析装置100の動作を示すフローチャートである。信号解析装置100において、周波数サンプリングレート調整部101は、行動決定部104で決定された行動に従って、受信信号に対して、周波数およびサンプリングレートのうち少なくとも1つについての調整を行う(ステップS1)。なお、周波数サンプリングレート調整部101は、前述のように、信号解析装置100の起動直後などで、行動決定部104で行動が決定されていない場合、ステップS1を省略してもよい。周波数領域変換部102は、周波数サンプリングレート調整部101で調整後の受信信号を、時間領域の信号から周波数領域の信号に変換する(ステップS2)。行動価値計算部103は、周波数領域変換部102から取得した周波数領域の信号に変換後の信号に基づいて、周波数サンプリングレート調整部101での調整の候補となる複数の行動、および各行動の価値を計算する(ステップS3)。
【0034】
行動決定部104は、行動価値計算部103から取得した複数の行動および価値に基づいて、行動を決定する(ステップS4)。行動決定部104は、複数の行動から選択、すなわち決定した行動を周波数サンプリングレート調整部101に出力する。変調方式推定部105は、周波数サンプリングレート調整部101から取得した、周波数サンプリングレート調整部101で調整後の受信信号について、変調方式の推定を行う(ステップS5)。復調部106は、周波数およびサンプリングレートが調整された受信信号、および変調方式の推定結果に基づいて、受信信号を復調する(ステップS6)。なお、信号解析装置100は、前述のように調整完了フラグを用いることで、調整完了フラグが立っていない間はステップS5およびステップS6の動作を行わないようにしてもよい。信号解析装置100は、調整完了フラグが立っていない間、ステップS1からステップS4までの動作を繰り返し行う。
【0035】
つづいて、信号解析装置100のハードウェア構成について説明する。信号解析装置100において、周波数サンプリングレート調整部101、周波数領域変換部102、行動価値計算部103、行動決定部104、変調方式推定部105、および復調部106は、処理回路により実現される。処理回路は、メモリに格納されるプログラムを実行するプロセッサおよびメモリであってもよいし、専用のハードウェアであってもよい。処理回路は制御回路とも呼ばれる。
【0036】
図5は、実施の形態1に係る信号解析装置100を実現する処理回路をプロセッサ901およびメモリ902で構成する場合の処理回路900の構成例を示す図である。
図5に示す処理回路900は制御回路であり、プロセッサ901およびメモリ902を備える。処理回路900がプロセッサ901およびメモリ902で構成される場合、処理回路900の各機能は、ソフトウェア、ファームウェア、またはソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェアまたはファームウェアはプログラムとして記述され、メモリ902に格納される。処理回路900では、メモリ902に記憶されたプログラムをプロセッサ901が読み出して実行することにより、各機能を実現する。すなわち、処理回路900は、信号解析装置100の処理が結果的に実行されることになるプログラムを格納するためのメモリ902を備える。このプログラムは、処理回路900により実現される各機能を信号解析装置100に実行させるためのプログラムであるともいえる。このプログラムは、プログラムが記憶された記憶媒体により提供されてもよいし、通信媒体など他の手段により提供されてもよい。
【0037】
上記プログラムは、周波数サンプリングレート調整部101が、第1の受信信号に対して、周波数およびサンプリングレートのうち少なくとも1つを調整し、第2の受信信号として出力する調整ステップと、周波数領域変換部102が、第2の受信信号を時間領域の信号から周波数領域の信号に変換し、周波数領域の信号に変換後の信号を第3の受信信号として出力する周波数領域変換ステップと、ニューラルネットワークで構成される行動価値計算部103が、第3の受信信号を入力とし、周波数サンプリングレート調整部101において第1の受信信号の周波数またはサンプリングレートを調整する複数の行動および各行動に対する価値を出力する行動価値計算ステップと、行動決定部104が、価値に基づいて複数の行動から周波数サンプリングレート調整部101で行う行動を決定し、決定した行動を周波数サンプリングレート調整部101に出力する行動決定ステップと、を信号解析装置100に実行さるプログラムであるとも言える。
【0038】
ここで、プロセッサ901は、例えば、CPU(Central Processing Unit)、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、またはDSP(Digital Signal Processor)などである。また、メモリ92は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(登録商標)(Electrically EPROM)などの、不揮発性または揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、またはDVD(Digital Versatile Disc)などが該当する。
【0039】
図6は、実施の形態1に係る信号解析装置100を実現する処理回路を専用のハードウェアで構成する場合の処理回路903の例を示す図である。
図6に示す処理回路903は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、またはこれらを組み合わせたものが該当する。処理回路については、一部を専用のハードウェアで実現し、一部をソフトウェアまたはファームウェアで実現するようにしてもよい。このように、処理回路は、専用のハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせによって、上述の各機能を実現することができる。
【0040】
以上説明したように、本実施の形態によれば、信号解析装置100において、周波数サンプリングレート調整部101は、受信信号に対して、行動決定部104で決定された行動に従って、時間領域で周波数およびサンプリングレートのうち少なくとも1つを調整する。周波数領域変換部102は、周波数サンプリングレート調整部101で調整後の信号を時間領域の信号から周波数領域の信号に変換する。ニューラルネットワークで構成される行動価値計算部103は、周波数領域変換部102で周波数領域に変換後の信号を入力とし、周波数サンプリングレート調整部101での調整の候補となる複数の行動および各行動の価値を出力とする。行動決定部104は、価値に基づいて周波数サンプリングレート調整部101での行動を決定する。これにより、信号解析装置100は、周波数サンプリングレート調整部101から行動決定部104までの一連の動作を繰り返すことで、変調方式推定部105で受信信号の変調方式を推定でき、復調部106で受信信号を復調できる程度に、受信信号の周波数およびサンプリングレートを調整することができる。信号解析装置100は、学習時間の増加および推定精度の劣化を抑制しつつ、多数の変調方式に対応可能である。
【0041】
一般的には、多数の変調方式に対応したい場合、変調方式の数に応じて学習時間が増加し、かつ入出力の対応数が多いため、学習時にニューラルネットワークの係数がうまく収束せず、推定精度が劣化する可能性がある。これに対して、本実施の形態の信号解析装置100は、受信信号を周波数領域に変換してニューラルネットワークに入力することで、異なる変調方式でも同一の周波数スペクトルで表される場合も多く、入出力の対応数を削減できることから、学習時間を削減し、高精度化が期待できる。さらに、本実施の形態の信号解析装置100は、時間領域で周波数調整を行ってから周波数領域に変換することで、周波数領域への変換の分解能に依存せず、細かい周波数偏移に対応することができる。
【0042】
また、受信信号の変調方式を推定して復号するケースで従来技術の特許文献1のように周波数推定値を直接出力するような場合、瞬時的にSNR(Signal to Noise Ratio)が落ち込む場合など、出力値が真値と大きく外れる場合、別途判定処理、補正処理などが必要になる。これに対して、本実施の形態の信号解析装置100は、ニューラルネットワークの出力を「行動」および「価値」とし、「行動」の内容を「周波数またはシンボルレートを規定された値で調整する」といった通信パラメータの調整に制限をかけることで、瞬時的な通信環境悪化による性能劣化を抑制することができる。
【0043】
また、本実施の形態の信号解析装置100は、受信信号のサンプリングレートを調整することで、学習時に想定したサンプリングレートとシンボルレートとの比率であるオーバーサンプル率に変換できるため、後段の変調方式推定部105および復調部106での動作が可能となる。
【0044】
実施の形態2.
実施の形態2では、さらに、変調方式推定部105の推定結果および復調部106の復調結果を、行動価値計算部103のニューラルネットワークへの入力とする場合について説明する。
【0045】
図7は、実施の形態2に係る信号解析装置100aの構成例を示す図である。信号解析装置100aは、通信パラメータが未知の受信信号を受信する図示しない受信装置などに搭載され、通信パラメータが未知の受信信号を解析する装置である。
図7に示す実施の形態2の信号解析装置100aは、
図1に示す実施の形態1の信号解析装置100に対して、入力信号生成部107を追加したものである。
【0046】
実施の形態2において、変調方式推定部105は、入力信号生成部107に対して、変調方式の推定結果を出力する。変調方式推定部105は、例1に示すように、最も確率が高い変調方式およびその確率値を出力してもよいし、例2に示すように、複数の変調方式および各変調方式に対する確度を出力してもよい。なお、変調方式推定部105は、推定結果の出力先が増えるだけで、変調方式の推定方法自体は実施の形態1のときと同様でよい。
【0047】
(例1)「QPSK 80%」
【0048】
(例2)「QPSK 70%」、「BPSK 20%」、「FSK 10%」
【0049】
実施の形態2において、復調部106は、入力信号生成部107に対して、復調結果を出力する。復調部106は、復調結果として、例えば、コンスタレーション、アイパターン、EVM(Error Vector Magnitude)、ビットパターンなどを出力する。なお、復調部106は、復調結果の出力先が増えるだけで、復調方法自体は実施の形態1のときと同様でよい。
【0050】
入力信号生成部107は、変調方式推定部105から取得した推定結果、および復調部106から取得した復調結果を用いて、行動価値計算部103に出力する信号を生成する。
図8は、実施の形態2に係る信号解析装置100aが備える入力信号生成部107の構成例を示す図である。入力信号生成部107は、最大確率選択部301と、確率差計算部302と、コンスタレーション生成部303と、アイパターン生成部304と、EVM計算部305と、ビットパターン解析部306と、正規化部307と、を備える。
【0051】
最大確率選択部301は、変調方式推定部105から取得した推定結果が、実施の形態2の変調方式推定部105のところで説明した例1のような場合は「QPSK 80%」を出力し、実施の形態2の変調方式推定部105のところで説明した例2のような場合は「QPSK 70%」を選択して出力する。
【0052】
確率差計算部302は、変調方式推定部105から取得した推定結果が、実施の形態2の変調方式推定部105のところで説明した例2のような場合、「QPSK 70%」および「FSK 10%」を用いて、複数の変調方式の確率の差がどれだけ離れているかを表す分散値などを計算して出力する。
【0053】
コンスタレーション生成部303は、復調部106から取得した復調結果がコンスタレーションであった場合、コンスタレーションを画像化したものを生成して出力する。
【0054】
アイパターン生成部304は、復調部106から取得した復調結果がアイパターンであった場合、アイパターンを画像化したものを生成して出力する。
【0055】
EVM計算部305は、復調部106から取得した復調結果がEVMであった場合はそのまま出力してもよいし、復調部106から取得した復調結果がコンスタレーションであった場合、コンスタレーションからEVMを計算して出力してもよい。
【0056】
ビットパターン解析部306は、復調部106から取得した復調結果がビットパターンであった場合、ビットパターンのランダム性を表す平均値、分散値などを求めて出力する。
【0057】
正規化部307は、最大確率選択部301からビットパターン解析部306からの出力に対して正規化を行う。正規化部307は、正規化の処理として、各種値の平均を0にして分散を1にする処理、最大値1から最小値0の範囲に収める処理など、後段の行動価値計算部103での学習係数安定化のための正規化処理を行ってもよい。なお、正規化部307は、最大確率選択部301からビットパターン解析部306からの出力のうち、一部のみを正規化してもよい。
【0058】
このように、入力信号生成部107は、変調方式推定部105の推定結果に基づく最も確率の高い変調方式の確率、変調方式推定部105の推定結果に基づく複数の変調方式の各確率の差分、復調部106の復調結果に基づくコンスタレーション、復調部106の復調結果に基づくアイパターン、復調部106の復調結果に基づくEVM、および復調部106の復調結果に基づくビットパターンのうち少なくとも1つを行動価値計算部103に出力する。行動価値計算部103は、さらに、入力信号生成部107からの情報を入力とし、複数の行動および価値を行動決定部104に出力する。
【0059】
信号解析装置100aのハードウェア構成について説明する。信号解析装置100aにおいて、入力信号生成部107も、処理回路により実現される。処理回路は、メモリに格納されるプログラムを実行するプロセッサおよびメモリであってもよいし、専用のハードウェアであってもよい。
【0060】
以上説明したように、本実施の形態によれば、信号解析装置100aにおいて、入力信号生成部107は、変調方式推定部105から取得した推定結果、および復調部106から取得した復調結果を用いて、行動価値計算部103に出力する信号を生成する。ニューラルネットワークで構成される行動価値計算部103は、周波数領域変換部102で周波数領域に変換後の信号、および入力信号生成部107で生成された信号を入力とし、周波数サンプリングレート調整部101での調整の候補となる複数の行動および各行動の価値を出力とする。行動決定部104は、価値に基づいて周波数サンプリングレート調整部101での行動を決定する。
【0061】
これにより、信号解析装置100aは、周波数サンプリングレート調整部101から復調部106までの一連の動作を繰り返すことで、受信信号だけではなく、後段の変調方式推定部105からの推定結果および復調部106の復調結果も扱うことができ、行動価値計算部103で計算される行動および価値の精度を高めることができる。行動は、後段処理の性能を向上させるためであるので、これらの後段処理、すなわち変調方式推定部105の推定結果および復調部106の復調結果の結果をフィードバックするものである。信号解析装置100aは、入力信号生成部107で生成された信号も用いることで、実施の形態1の信号解析装置100と比較して、行動価値計算部103で計算される行動および価値の精度を高めることができる。
【0062】
実施の形態3.
実施の形態3では、さらに、変調方式推定部105の推定結果および復調部106の復調結果に基づく報酬を、行動価値計算部103のニューラルネットワークへの入力とする場合について説明する。
【0063】
図9は、実施の形態3に係る信号解析装置100bの構成例を示す図である。信号解析装置100bは、通信パラメータが未知の受信信号を受信する図示しない受信装置などに搭載され、通信パラメータが未知の受信信号を解析する装置である。
図9に示す実施の形態3の信号解析装置100bは、
図7に示す実施の形態2の信号解析装置100aに対して、報酬計算部108を追加したものである。
【0064】
実施の形態3において、変調方式推定部105は、報酬計算部108に対して、変調方式の推定結果を出力する。変調方式推定部105は、推定結果の出力先が増えるだけで、変調方式の推定方法自体、および推定結果の内容は実施の形態2のときと同様でよい。
【0065】
実施の形態3において、復調部106は、報酬計算部108に対して、復調結果を出力する。復調部106は、復調結果の出力先が増えるだけで、復調方法自体、および復調結果の内容は実施の形態2のときと同様でよい。
【0066】
報酬計算部108は、行動決定部104から取得した行動選択結果、変調方式推定部105から取得した変調方式の推定結果、および復調部106から取得した復調結果に基づいて、行動価値計算部103を構成するニューラルネットワークの係数を更新するための報酬を計算する。
【0067】
例えば、報酬計算部108は、行動決定部104から取得した行動選択結果に基づいて、周波数またはサンプリングレートを調整するためのある行動をとった結果、周波数が所望の周波数誤差以下になった場合、またはサンプリングレートが所望のレート範囲内になった場合、高い報酬、例えば報酬「1」を出力する。報酬計算部108は、周波数またはサンプリングレートを調整するためのある行動をとった結果、逆に大きく真値と外れてしまった場合、低い報酬、例えば報酬「-1」を出力する。報酬計算部108は、周波数またはサンプリングレートを調整するためのある行動をとった結果、周波数またはサンプリングレートが所望の状態になることもなく、大きく真値と外れることもなかった場合、何もないとして報酬「0」を出力する。このような方法は、受信信号の諸元が未知の場合は難しいが、テスト信号など、諸元が既知の信号を入力して学習させる場合には有効である。
【0068】
また、報酬計算部108は、変調方式推定部105から取得した変調方式の推定結果に基づいて、最も確率の高い変調方式の確率値がある閾値を超えた場合は高い報酬を出力し、最も確率の高い変調方式の確率値がある閾値以下の場合は低い報酬を出力する。報酬計算部108は、変調方式推定部105から取得した変調方式の推定結果に基づいて、複数の変調方式の確率の差がどれだけ離れているかを表す分散値がある閾値を超えた場合は高い報酬を出力し、複数の変調方式の確率の差がどれだけ離れているかを表す分散値がある閾値以下の場合は低い報酬を出力する。
【0069】
また、報酬計算部108は、復調部106から取得した復調結果に基づいて、アイパターンの中心のばらつきが規定された範囲内すなわち小さければ高い報酬を出力し、アイパターンの中心のばらつきが規定された範囲外すなわち大きければ低い報酬を出力する。報酬計算部108は、復調部106から取得した復調結果に基づいて、EVMがある閾値以下の場合は高い報酬を出力し、EVMがある閾値を超えた場合は低い報酬を出力する。
【0070】
報酬計算部108は、上記のように、行動決定部104から取得した行動選択結果、変調方式推定部105から取得した変調方式の推定結果、および復調部106から取得した復調結果の各結果に基づいて報酬を決定してもよいし、2以上の結果に基づいて報酬を決定してもよい。
【0071】
行動価値計算部103は、実施の形態2の行動価値計算部103と比較して、さらに報酬計算部108から出力された報酬を取得する。行動価値計算部103は、報酬計算部108で計算された報酬と、自身の出力結果から行動価値計算を行うニューラルネットワークの各係数を更新、すなわち学習する。行動価値計算部103は、例えば、得られた報酬が高ければ行動および価値は正しい、得られた報酬が低ければ行動および価値は間違っているということになり、より高い報酬が得られる行動および価値を出力するように学習していく。このような学習は、一般的には強化学習と呼ばれる枠組みであり、汎用のアルゴリズムで学習を行うことができる。行動価値計算部103は、ニューラルネットワークの係数について、実施の形態1および実施の形態2では事前にシミュレーションなどで求めておくことを想定していたが、実施の形態3のように報酬計算部108を追加することで、受信信号から学習することも可能である。
【0072】
このように、報酬計算部108は、変調方式推定部105から取得した変調方式の推定結果および復調部106から取得した復調結果に基づいて、行動に対する報酬を計算し、行動価値計算部103に出力する。行動価値計算部103は、行動決定部104に出力した複数の行動および価値、および報酬計算部108から取得した報酬に基づいて、報酬計算部108から高い報酬が得られるようにニューラルネットワークの各係数を更新することで学習を行う。
【0073】
信号解析装置100bのハードウェア構成について説明する。信号解析装置100bにおいて、報酬計算部108も、処理回路により実現される。処理回路は、メモリに格納されるプログラムを実行するプロセッサおよびメモリであってもよいし、専用のハードウェアであってもよい。
【0074】
以上説明したように、本実施の形態によれば、信号解析装置100bにおいて、報酬計算部108は、行動決定部104から取得した行動選択結果、変調方式推定部105から取得した変調方式の推定結果、および復調部106から取得した復調結果に基づいて、行動価値計算部103に与える報酬を計算する。行動価値計算部103は、報酬計算部108から高い報酬が得られるように学習を行う。これにより、信号解析装置100bは、事前のシミュレーションなどによるオフライン学習だけでなく、受信信号からオンラインで学習を行うことが可能となり、対象とする受信信号の特性が変わった場合でも、環境に適応した変調方式の推定、受信信号の復調などを行うことができる。
【0075】
以上の実施の形態に示した構成は、一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、実施の形態同士を組み合わせることも可能であるし、要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。
【符号の説明】
【0076】
100,100a,100b 信号解析装置、101 周波数サンプリングレート調整部、102 周波数領域変換部、103 行動価値計算部、104 行動決定部、105 変調方式推定部、106 復調部、107 入力信号生成部、108 報酬計算部、201 FFT、202 電力変換部、203,307 正規化部、301 最大確率選択部、302 確率差計算部、303 コンスタレーション生成部、304 アイパターン生成部、305 EVM計算部、306 ビットパターン解析部、900,903 処理回路、901 プロセッサ、902 メモリ。