IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ジェンギスコム ホールディングス エルエルシーの特許一覧

特許7208917OFDMおよびMIMO-OFDMのための効率的なピーク対平均電力低減
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-01-11
(45)【発行日】2023-01-19
(54)【発明の名称】OFDMおよびMIMO-OFDMのための効率的なピーク対平均電力低減
(51)【国際特許分類】
   H04L 27/26 20060101AFI20230112BHJP
   H04B 7/0413 20170101ALI20230112BHJP
【FI】
H04L27/26 200
H04B7/0413
【請求項の数】 16
(21)【出願番号】P 2019556330
(86)(22)【出願日】2018-07-24
(65)【公表番号】
(43)【公表日】2020-10-01
(86)【国際出願番号】 US2018043573
(87)【国際公開番号】W WO2019023283
(87)【国際公開日】2019-01-31
【審査請求日】2021-06-17
(31)【優先権主張番号】62/536,955
(32)【優先日】2017-07-25
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】518031686
【氏名又は名称】ジェンギスコム ホールディングス エルエルシー
【氏名又は名称原語表記】GENGHISCOMM HOLDINGS, LLC
【住所又は居所原語表記】P.O. Box 17355,Boulder, CO 80308 (US)
(74)【代理人】
【識別番号】100169904
【弁理士】
【氏名又は名称】村井 康司
(74)【代理人】
【識別番号】100181021
【弁理士】
【氏名又は名称】西尾 剛輝
(72)【発明者】
【氏名】スティーヴ シャティル
【審査官】吉江 一明
(56)【参考文献】
【文献】特開2011-229090(JP,A)
【文献】特開2004-147126(JP,A)
【文献】特表2013-521741(JP,A)
【文献】特表2017-537514(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04L 27/26
H04B 7/0413
(57)【特許請求の範囲】
【請求項1】
複数の候補離散時間OFDM信号からピーク対平均電力比(PAPR)が低い信号を選択することによって、離散時間直交周波数分割多元接続(OFDM)信号のPAPRを低減するための方法であって、
基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間OFDM信号を生成するステップと、
基本離散時間OFDM信号および前記部分更新離散時間OFDM信号を線形結合して、更新された離散時間OFDM信号を発生させるステップと、を含むとともに、前記更新された離散時間OFDM信号が、前記複数の候補離散時間OFDM信号のうちの1つとして指定されている方法。
【請求項2】
前記基本離散時間OFDM信号が、前記基本データシンボル系列に対して稠密な可逆変換演算を実行することによって生成されるか、または、前回更新された離散時間OFDM信号から選択される、請求項1に記載の方法。
【請求項3】
前記スパース可逆変換演算が、スパース逆高速フーリエ変換(IFFT)、ウェーブレットベースの近似IFFT、スパース行列ベクトル乗算、スパース行列スパースベクトル乗算、または行列スパースベクトル乗算のうちの少なくとも1つを含む、請求項1に記載の方法。
【請求項4】
第1の部分更新離散時間OFDM信号を第2の部分更新離散時間OFDM信号と線形結合すること、または前記部分更新離散時間OFDM信号を複素数値スケーリング係数で乗算すること、のうちの少なくとも1つによって、少なくとも1つの追加の部分更新離散時間OFDM信号を生成するステップをさらに含む、請求項1に記載の方法。
【請求項5】
前記スパース可逆変換演算を実行することが、
前記基本データシンボル系列とスパース重み行列との成分ごとの乗算を実行して、スパース更新シンボル系列を生成するステップ、および前記スパース更新シンボル系列に対して可逆変換演算を実行するステップ、
前記スパース重み行列を用いて、稠密な可逆変換演算子内の要素の少なくとも1つのブロックを選択して、スパース可逆変換演算子を生成するステップ、および前記スパース可逆変換演算子を使用して、前記基本データシンボル系列に対して演算するステップ、または、
前記稠密な可逆変換演算子内の要素の少なくとも1つのブロックを選択して、前記スパース可逆変換演算子を生成するステップ、前記基本データシンボル系列内の少なくとも1つの要素を選択して、前記スパース更新シンボル系列を生成するステップ、および前記スパース可逆変換演算子を使用して、前記スパース更新シンボル系列に対して演算するステップ、
のうちの少なくとも1つを含む、請求項1に記載の方法。
【請求項6】
前記スパース可逆変換演算を実行することが、グラフィック処理装置上で実行するように前記スパース可逆変換演算を最適化するステップを含む、請求項1に記載の方法。
【請求項7】
前記PAPRが、重みでスケーリングされたPAPRの合計を含み、各重みが、対応するアンテナまたはノードに対するPAPR感受性の尺度を含む、請求項1に記載の方法。
【請求項8】
複数の候補離散時間OFDM信号からピーク対平均電力比(PAPR)が低い信号を選択することによって、離散時間直交周波数分割多元接続(OFDM)信号のPAPRを低減するための装置であって、
基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間OFDM信号を発生させるための手段と、
基本離散時間OFDM信号および前記部分更新離散時間OFDM信号を線形結合して、更新された離散時間OFDM信号を生成するための手段と、を含むとともに、前記更新された離散時間OFDM信号が、前記複数の候補離散時間OFDM信号のうちの1つとして指定されている装置。
【請求項9】
前記基本離散時間OFDM信号が、前記基本データシンボル系列に対して稠密な可逆変換演算を実行するための手段によって生成されるか、または、前回更新された離散時間OFDM信号から選択される、請求項8に記載の装置。
【請求項10】
前記スパース可逆変換演算が、スパース逆高速フーリエ変換(IFFT)、ウェーブレットベースの近似IFFT、スパース行列ベクトル乗算、スパース行列スパースベクトル乗算、または行列スパースベクトル乗算のうちの少なくとも1つを含む、請求項8に記載の装置。
【請求項11】
第1の部分更新離散時間OFDM信号を第2の部分更新離散時間OFDM信号と線形結合すること、または前記部分更新離散時間OFDM信号を複素数値スケーリング係数で乗算すること、のうちの少なくとも1つによって、少なくとも1つの追加の部分更新離散時間OFDM信号を生成するための手段をさらに備える、請求項8に記載の装置。
【請求項12】
前記部分更新離散時間OFDM信号を生成するための手段が、
前記基本データシンボル系列とスパース重み行列との成分ごとの乗算を実行して、スパース更新シンボル系列を生成するステップ、および前記スパース更新シンボル系列に対して可逆変換演算を実行するステップ、
前記スパース重み行列を用いて、稠密な可逆変換演算子内の要素の少なくとも1つのブロックを選択して、スパース可逆変換演算子を生成するステップ、および前記スパース可逆変換演算子を使用して、前記基本データシンボル系列に対して演算するステップ、または、
前記稠密な可逆変換演算子内の要素の少なくとも1つのブロックを選択して、前記スパース可逆変換演算子を生成するステップ、前記基本データシンボル系列内の少なくとも1つの要素を選択して、前記スパース更新シンボル系列を生成するステップ、および前記スパース可逆変換演算子を使用して、前記スパース更新シンボル系列に対して演算するステップ、
のうちの少なくとも1つのために構成されている、請求項8に記載の装置。
【請求項13】
前記PAPRが、重みでスケーリングされたPAPRの合計を含み、各重みが、対応するアンテナまたはノードに対するPAPR感受性の尺度を含む、請求項8に記載の装置。
【請求項14】
ワイヤレス通信のためのコンピュータプログラムであって、請求項1~7のいずれか一項に記載の前記ステップを行うための命令を含むコンピュータプログラム。
【請求項15】
候補離散時間信号のセットからピーク対平均電力比(PAPR)が低い信号を選択することによって、離散時間信号のPAPRを低減するための装置であって、
メモリと、
前記メモリに動作可能に結合された1つまたは複数のプロセッサであって、
基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間信号を生成するように構成され、かつ、
基本離散時間信号および前記部分更新離散時間信号を線形結合して、更新された離散時間信号であって、候補離散時間信号の前記セットに含まれている更新された離散時間信号を発生させるように構成された1つまたは複数のプロセッサと、
を備える装置。
【請求項16】
候補離散時間信号のセットからピーク対平均電力比(PAPR)が低い信号を選択することによって、離散時間信号のPAPRを低減するための1つまたは複数の命令を格納する非一時的なコンピュータ可読媒体であって、前記1つまたは複数の命令が、1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、
基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間信号を生成させ、かつ、
基本離散時間信号および前記部分更新離散時間信号を線形結合して、更新された離散時間信号であって、候補離散時間信号の前記セットに含まれている更新された離散時間信号を発生させる、非一時的なコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2017年7月25日に出願された米国仮特許願第62/536,955号明細書に対する優先権を主張するものであり、その内容全体が参照によって本明細書に組み込まれる。
【0002】
以下は、概して、ワイヤレス通信に関し、より具体的には、プリコーディングマルチキャリア波形に関する。
【背景技術】
【0003】
ワイヤレス通信システムは、電話通信、ビデオ、データ、メッセージ伝達、および放送などの様々な電気通信サービスを提供するために広く展開されている。典型的なワイヤレス通信システムは、利用可能なシステムリソース(例えば、帯域幅、送信電力等々)を共有することにより、複数のユーザとの通信をサポートすることが可能な多元接続技術を用いる場合がある。このような多元接続技術の例は、符号分割多元接続(CDMA)システム、時分割多元接続(TDMA)システム、周波数分割多元接続(FDMA)システム、直交周波数分割多元接続(OFDMA)システム、シングルキャリア周波数分割多元接続(SC-FDMA)システム、および時分割同期符号分割多元接続(TD-SCDMA)システムを含む。
【0004】
これらの多元接続技術は、様々な電気通信およびワイヤレスネットワーキング規格に採用され、異なるワイヤレスデバイスの通信を可能にする共通のプロトコルを提供してきた。電気通信規格の一例が、ロングタームエボリューション(LTE)である。LTEは、スペクトル効率を向上させ、コストを削減し、サービスを向上させ、新たなスペクトルを使用することによって、ならびにOFDMAをダウンリンク(DL)上で使用して、SC-FDMAをアップリンク(UL)上で使用して、および多入力多出力(MIMO)アンテナ技術を使用して他のオープンスタンダードと統合することによって、モバイル広帯域インターネットアクセスをより良好にサポートするように設計された、ユニバーサル移動体電気通信システム(UMTS)移動規格に対する一連の増強である。
【0005】
ワイヤレス通信ネットワークは、様々なタイプの複数のユーザ機器デバイス(UE)および/またはアクセスターミナルのための通信をサポートすることが可能な複数の基地局を含む場合がある。UEは、ダウンリンクおよびアップリンクを介して基地局と通信することができる。ダウンリンク(または下りリンク)とは、基地局からUEへの通信リンクを指し、アップリンク(または上りリンク)とは、UEから基地局への通信リンクを指す。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本開示の追加の特徴および利点を以下で説明する。当業者は、本開示の同じ目的を実行するための他の構造を修正、または設計するための基礎として、本開示を容易に利用し得ることを認識されたい。当業者は、そのような等価な構造は、添付の特許請求の範囲に記載されている本開示の教示から逸脱するものではないこともまた理解されたい。本開示の特性であると考えられる新規な特徴は、その編成および動作方法の両方に関して、添付の図面に関連して考慮すると、さらなる目的および利点とともに以下の説明から一層よく理解されるであろう。しかしながら、図面はそれぞれ、図解および説明目的のみで提供され、本開示の範囲を定義することを意図するものではないことが明らかに理解されるであろう。
【課題を解決するための手段】
【0007】
本明細書に開示されている態様は、候補シンボル系列に対する部分更新を活用して、OFDM信号のピーク対平均電力比(PAPR)の計算上効率的な低減を可能にする。これは、MIMO-OFDM、拡散-OFDM、SC-FDMA、およびOFDMA信号を含む(が、それらに限定されない)、様々な型のOFDM信号に適用可能である。MIMO-OFDMでは、PAPRベースのメトリックは、N個すべてのMIMO送信機、または送信機の所定のサブセット(N<N)にわたってPAPR測定値を考慮に入れることが可能である。パラメータ選択(例えば、選択的マッピング(SLM)シンボル、拡散コード、スクランブリング系列、ダミーデータシンボル、PAPR低減シンボルのためのサブチャネルのスケジューリング等々)は、計算された「最良な」PAPRベースのメトリックに対応して選択することができる。各送信機またはアンテナへのPAPRの対応を、対応するPAPR感受性のスケーリング係数によって重み付けして、PAPRベースのメトリックを作成することができる。送信機および/またはアンテナのスケジューリングは、少なくとも1つの送信機を有する分散型MIMOアンテナアレイ、またはPAPR感受性が低いアンテナを設けて、良好なPAPRベースのメトリックを発見するという最適化問題に対する少なくとも1つの追加の自由度を提供するように構成することができる。
【0008】
本明細書に開示されている態様は、データ非依存の更新スケジュール、データ依存の更新スケジュール、およびそれらの組み合わせを含むことができる。データ依存の更新スケジュールは、場合によっては(例えば、静止信号の場合)、データ非依存の更新スケジュールを有するアルゴリズムよりも収束が速いことがある。パラメータを更新するためのステップサイズを選択して、収束および/または安定性を向上させることができる。ステップサイズは、1つまたは複数の測定基準に基づいて一定である場合もあれば、可変である場合もある。いくつかの態様では、ステップサイズに関する条件は、平均および2乗平均の意味での収束をもたらすように導出される。
【0009】
いくつかの態様では、データ非依存の更新スケジュールにおいて更新されるパラメータは、無作為に選ばれる。態様は、確率的部分更新アルゴリズムを用いる場合がある。1つの例では、更新されるパラメータは、パラメータのセットの合計の複数のサブセットに区分され、次に、サブセットは各反復において更新されるように無作為に選択される。いくつかの態様では、各反復において更新されるパラメータの所定のスケジュールが提供される。
【0010】
本明細書で用いられる部分更新アルゴリズムは、計算の回数を減らし、かつ、増加したプログラムおよびデータメモリのためのコストを考慮に入れるように構成することができる。例えば、実行サイクルの回数を減らすと、中間ステップでデータを格納するのに必要になる追加のサイクルによって相殺される場合もあり得る。アルゴリズムによって最適化される処理メトリックは、これらのコストの任意の組み合わせを含むことができる。行列ベクトル乗算は、メモリに結合したアプリケーションカーネルであるが、本明細書に開示されている態様は、離散時間OFDM信号に適合された部分更新方法をもたらし、これにより、候補離散時間信号の生成が、スパース(sparse)処理演算に使用される最適化解から恩恵を受けることが可能になる。例えば、スパース行列および/またはベクトル乗算では、GPUアーキテクチャは、グローバルメモリアクセスを最適化し、共有メモリアクセスを最適化し、かつ/または、再利用および並列処理を活用するために構成することができる。他の最適化は、実行に使用されるスレッドブロックごとに複数のスレッドを変更すること、行を取り扱う複数のスレッドを変更することなどの、設定パラメータの調整をもたらす。
【0011】
一般的な技法は、稠密な(dense)サブブロックを識別し、抽出する、スパース行列ベクトル乗算の実行時の前処理から始まる。しかしながら、本明細書の部分更新技法に開示されているスパース行列は、実行時以前に知られている明確に定義された構造を有し、これにより、前処理だけでなく後続処理も単純化することができる。
【0012】
1つの態様では、{xn,u}は、入力データ系列であるとし、{wn,u}は、長さNの適応フィルタの係数を表示するとする。
=[W1,u2,u...WN,u
=[X1u2,u...XN,u
ここで、上記で定義された項は、瞬間uに対するものであり、()は、転置演算子を表示する。問題は、PAPRが最も低いOFDM信号を得るようにXおよび/またはwを選択することである。いくつかのSLMの態様では、複数の候補シンボル系列Xを提供することが可能である。SLMは、入力データシンボル系列Xを、位相回転行列または他の複素数値行列wで乗算することによって達成することができる。シンボル系列Y=wXを生成することが可能であり、式中、wは、第uthの候補位相回転行列である。
【0013】
位相最適化が信号サブブロックの最適な組み合わせを求める、部分系列送信(PTS:Partial Transmit Sequence)スキームを使用してもよい。重み値wは、重みコードブック内の候補位相系列から選択可能とすることができる。いくつかの態様では、ダミー系列挿入(DSI:Dummy Sequence Insertion)が用いられる。重み行列wは、リソースブロック内および/またはレイヤ内でダミーシンボルを適合させることなどによって、ダミーシンボル挿入を提供することができる。ダミーシンボル挿入は、通信に用いられる信号空間と直交する空間サブチャネル、または信号空間射影のような、PAPR低減のために割り当てられたサブチャネルを用いてもよい。前述したPAPR低減技法の組み合わせ、例えばDSIおよびPTSスキームの組み合わせなどを用いることができる。他の組み合わせを用いることも可能である。
【0014】
OFDM変調では、N個データシンボルからなるブロック(1つのOFDMシンボル),{x,n=1,...,N}は、各シンボルがセット{f,n=0,1,...,N}とは異なる副搬送波を変調するように、並列して送信される。N個の副搬送波は直交、すなわち、f=n△fであり、式中、△f=1/NTであり、Tはシンボル期間である。送信されたOFDM信号の複素包絡は次式:
【数1】
(式中、0≦t≦NTであり、Xは重み項を含むことができる)のように示される。
【0015】
送信されたOFDM信号のPAPRは、次式
【数2】
(式中、E[]は、期待値を表示する。相補累積分布関数(CCDF:Complementary Cumulative Distribution Function)は、PAPR低減に最もよく使用される性能評価尺度のうちの1つであり、OFDMシンボルのPAPRが所与の閾値PAPRを超過する確率を表し、これは、CCDF=Pr(PAPR>PAPR)として表示される。他のPAPR性能評価尺度、例えば、ピーク振幅、波高因子、または成形利得に関して標準化されたPAPRなどを使用してもよい。PAPRの低減により、同じハードウェアで1秒当たりにより多くのビットを送信するか、または、低電力および/または安価なハードウェアで1秒当たりに同じビットを送信するか、のいずれかが可能なシステムが得られる)から計算することができる。
【0016】
PAPRが最小であるOFDM信号を生み出すプリコーディングされたデータベクトルを発見するという最適化問題は、組み合せの最適化問題と見なすことができる。部分最適技法は、探索の複雑性の大幅な低減を実現しつつ、PAPRの許容可能な低減をもたらす重みwを導出する。部分更新は、この技法の有利なバージョンを提供することが可能である。
【0017】
SLMでは、アプローチの1つは、候補系列の平均シンボル電力の共分散を最小限にするために、それぞれの反復ごとに候補シンボル系列内のすべてのシンボルを変更することである。1対の候補シンボル系列のゼロ共分散は、それらが相互に独立していることを示す。これは、U個のサンプルを解空間にわたって広く分布させる。本開示のいくつかの態様では、重み系列は、位相シフトに加えて、振幅変動をもたらし、これにより、位相シフトだけの場合よりも候補系列間の平均シンボル電力の共分散を低減することができる。これらの振幅変動は、候補系列間のシンボル変更を減らすことができる一方で、共分散値は同じになり(、または良くなり)、これにより、全(すなわち、稠密な)重み行列の代わりにスパース(例えば、部分更新)重み行列を使用することが可能になる。これにより、スパース可逆変換演算を使用することもまた可能になる。スパース行列を用いて、変換および乗算などの演算を実行する場合、メモリ空間および処理時間を節約するために、非ゼロ要素だけを格納することが有利な場合がある。非常に効率的の良いメモリアクセスパターンを提供するスパース演算最適化が開発されており、本明細書に開示されている新規性により、SLMおよび他のPAPR低減技法のためのそのような最適化が可能になる。
【0018】
解空間の反復サンプリングでは、PAPR測定値は、候補シンボル系列のその後の選択を導くことができる。これは、部分更新が特に有用なところである。多くの反復技法では、後続のサンプルは前のサンプルに近く、したがって、系列間の平均シンボル電力の少なくともある程度の共分散が望まれる。このアプローチは解空間を適応的に探索し、グローバルまたはローカルの「最良」解に速やかに収束することができる。この場合、解空間のサンプルは、グローバルまたはローカルの最良解の近くでクラスタ状になる傾向がある。反復更新では、代替的シンボル系列が少なくとも幾分か相関していることが有用な場合がある。これにより、前の更新のPAPR測定値に基づいて次の更新を決定することが可能になる。例えば、これは、どの重み値を更新するべきか、ならびに、PAPRをさらに低減する可能性がある更新の大きさおよび/または位相を決定することができる。これにより、許容可能な、または最良のPAPRへの収束を促進することができる。開示されている態様では、重みwはデータ系列Xに依存する必要はない。さらに、重みwは、更新されるシンボルをXのシンボルコンステレーションに制約する必要はない。
【0019】
従来のSLMでは、追加の候補シンボル系列には、全(稠密な)変換、および/または全(稠密な)行列乗算が必要である。そのような稠密な演算の回数は、候補系列の数Uとともに増加するが、一方、部分更新方法では、後続の候補系列は、計算複雑性が低減された演算をもたらすことが可能である。稠密な変換は、IFFTのような高速変換技法を用いることができ、稠密な行列乗算は、一般化行列乗算(GEMM)技法のうちのいずれかを用いることができる。部分更新は、IFFTをスパースIFFTアルゴリズムに置き換えることができる。スパースIFFTアルゴリズムは、入力信号のサブセットに対してのみ演算するので、すべての周波数の値を計算する必要はない。この特性を活用することによって、周波数のサブセットだけが計算され、したがって、IFFTの計算複雑性が激減する。同様に、ウェーブレットベースの近似IFFTは、スパース入力を活用して、従来のIFFTよりも効率的に演算することができる。部分更新は、GEMMを、スパース行列ベクトル乗算(SpMV)、スパース行列スパースベクトル乗算(SpMSpV)、ならびにGPUおよびCPUアーキテクチャ用に最適化されている行列スパースベクトル乗算技法を含む、多種多様なスパース行列乗算技法に置き換えることができる。本開示の態様に従って、稠密な変換、または稠密な乗算の回数は、コンステレーションサイズおよび候補信号の数Uに依存しないものとすることができる。
【0020】
いくつかの態様では、クライアント側デバイス、中間デバイス、またはサーバ側デバイスによって実行される方法は、複数の候補離散時間信号を含むセットからPAPRが低い信号を選択することによって、離散時間信号のPAPRを低減する。方法は、基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間信号を生成するステップと、基本離散時間信号および部分更新離散時間信号を線形結合して、更新された離散時間信号を発生させるステップと、を含むことができる。更新された離散時間信号は、候補離散時間信号のセットに含まれる。基本離散時間信号は、基本データシンボル系列に対して稠密な可逆変換演算を実行することによって生成してもよいし、あるいは、前の更新された離散時間信号から選択してもよい。スパース可逆変換演算は、スパースIFFT、ウェーブレットベースの近似IFFT、スパース行列ベクトル乗算、スパース行列スパースベクトル乗算、または行列スパースベクトル乗算のうちの少なくとも1つとすることができる。少なくとも1つの追加の部分更新離散時間信号は、第1の部分更新離散時間信号を第2の部分更新離散時間信号と線形結合すること、または部分更新離散時間信号を複素数値スケーリング係数で乗算すること、のうちの少なくとも1つによって生成することができる。本明細書に開示されている方法は、GPUまたはCPU上で実行するように最適化することができる。
【0021】
1つの態様では、スパース可逆変換演算は、基本シンボル系列とスパース重み行列との成分ごとの乗算を実行して、スパース更新シンボル系列を生成するステップと、このスパース更新シンボル系列に対して可逆変換演算を実行するステップと、を含むことができる。別の態様では、スパース可逆変換演算は、スパース重み行列を用いて、稠密な可逆変換演算子内の要素の少なくとも1つのブロックを選択してスパース可逆変換演算子を生成するステップと、このスパース可逆変換演算子を使用して、基本シンボル系列に対して演算するステップと、を含むことができる。さらに別の態様では、スパース可逆変換演算は、稠密な可逆変換演算子内の要素の少なくとも1つのブロックを選択して、スパース可逆変換演算子を生成するステップと、基本シンボル系列内の少なくとも1つの要素を選択して、スパース更新シンボル系列を生成するステップと、スパース可逆変換演算子を使用して、スパース更新シンボル系列に対して演算するステップと、を含むことができる。
【0022】
いくつかの態様では、装置は、基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間信号を生成するための手段と、基本離散時間信号および部分更新離散時間信号を線形結合して、更新された離散時間信号を発生させるための手段と、を含むことができる。この装置は、第1の部分更新離散時間OFDM信号を第2の部分更新離散時間OFDM信号と線形結合すること、または部分更新離散時間OFDM信号を複素数値スケーリング係数で乗算すること、のうちの少なくとも1つによって、少なくとも1つの追加の部分更新離散時間OFDM信号を生成するための手段をさらに含むことができる。
【0023】
本明細書に開示されている態様またはその要素は、本明細書に記載の方法ステップのうちの1つまたは複数を行うための手段であって、(i)ハードウェアモジュール、(ii)ソフトウェアモジュール、または、(iii)ハードウェアモジュールおよびソフトウェアモジュールの組み合わせ、を含み得る手段の形で、実施することが可能であり、(i)~(iii)のうちのいずれかが、本明細書に記載されている特定の技法を実施し、ソフトウェアモジュールが有形のコンピュータ可読記憶媒体(または複数のそのような媒体)に格納されている。諸態様は概して、添付の図面に関して本明細書に実質的に記載されているような、また、添付の図面によって図示されているような方法、装置、システム、コンピュータプログラム製品、非一時的なコンピュータ可読媒体、ユーザ機器、ワイヤレス通信デバイス、および処理システムを含む。
【0024】
本開示の特徴、性質、および利点は、以下に記載されている図面と併せて解釈すると、下記の詳細な説明からより一層明らかになるであろう。図面および詳細な説明全体にわたって、図面の1つまたは複数の中に現れる同様の要素を識別するために、同様の参照符号を使用する場合がある。
【図面の簡単な説明】
【0025】
図1A-1D】本開示の様々な態様に従う送信機の例を図示する図である。
図2A-2D】本開示の様々な態様に従う受信器の例を図示する図である。
図3】本開示の様々な態様に従うマルチアンテナシステム内のPAPR低減を描く図である。
図4】本開示の様々な態様に従うPAPR低減のための重み選択の例を図示する図である。
図5A】本開示の様々な態様に従う例示的な重み選択器を図示する図である。
図5B-5C】本開示の様々な態様に従うPAPRを低減するための方法を図示する図である。
図6】本開示の様々な態様に従う、信号処理機能のために最適化することが可能なGPUアーキテクチャを図示する図である。
【発明を実施するための形態】
【0026】
1つの態様に記載されている要素は、具体的な詳述なしに、他の態様に対して有用に利用し得ることが企図される。
【0027】
以下に記載されている詳細な説明は、添付の図面に関連して、様々な構成の説明として意図されており、本明細書に記載の概念を実践し得る唯一の構成を表すようには意図されていない。詳細な説明は、様々な概念の十分な理解を提供する目的で、具体的な詳細を含む。しかしながら、当業者には、これらの概念がこれらの具体的な詳細なしで実践し得ることは明白であろう。いくつかの事例では、よく知られている構造および構成要素がそのような概念を不明瞭にしないように、ブロック図の形式で示されている。
【0028】
電気通信システムの諸態様が、様々な装置および方法に関連して提示されている。これらの装置および方法は、以下の詳細な説明に記載され、様々なブロック、モジュール、構成要素、回路、ステップ、処理、アルゴリズム等々(総称して「要素」と呼ばれる)によって添付の図面中に図示されている。これらの要素は、電子機器ハードウェア、コンピュータソフトウェア、またはそれらの任意の組み合わせを使用して実装することができる。そのような要素がハードウェアとして実装されるのか、またはソフトウェアとして実装されるのかは、特定のアプリケーションおよびシステム全体に課される設計制約によって決まる。
【0029】
例として、ある要素、もしくは要素の任意の部分、または要素の任意の組み合わせは、1つまたは複数のプロセッサを含む「処理システム」によって実装することができる。プロセッサの例は、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブル論理デバイス(PLD)、状態機械、ゲート制御論理、ディスクリートハードウェア回路、および本開示全体にわたって記載されている様々な機能性を実行するように構成された他の適切なハードウェアを含む。処理システム内の1つまたは複数のプロセッサが、ソフトウェアを実行することができる。ソフトウェアは、ソフトウェアと呼ばれるか、ファームウェアと呼ばれるか、ミドルウェアと呼ばれるか、マイクロコードと呼ばれるか、ハードウェア記述言語と呼ばれるか、またはそれ以外の名称で呼ばれるかに関わらず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行ファイル、実行のスレッド、プロシージャ、機能等々を意味するように広く解釈されるものとする。
【0030】
それに応じて、1つまたは複数の例示的な実施形態では、記載されている機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせにおいて実装することができる。ソフトウェアに実装するのであれば、機能は、非一時的コンピュータ可読能媒体上に格納するか、1つまたは複数の命令もしくはコードとして符号化することができる。コンピュータ可読媒体は、コンピュータ記憶媒体を含む。記憶媒体は、コンピュータによってアクセスすることが可能な任意の利用可能な媒体とすることができる。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD-ROMもしくは他の光学ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶装置、または命令もしくはデータ構造の形式で所望のプログラムコードを搭載または格納するために使用することが可能であり、かつ、コンピュータによってアクセスすることが可能な任意の他の媒体を含む場合がある。
【0031】
本明細書では特定の態様が記載されているが、これらの態様の多くの変形および置換は本開示の範囲内にある。好適な態様の利益および利点がいくつか言及されているが、本開示の範囲は特定の利益、使用、または目的に限定されるようには意図されていない。むしろ、本開示の態様は、様々なワイヤレス技術、システム構成、ネットワーク、および送信プロトコルに広く適用可能であるように意図され、それらのうちのいくつかが、図面および以下の説明において例として図示されている。詳細な説明および図面は、本開示を限定するものというよりも、むしろ、単に例示するものにすぎず、本開示の範囲は添付の特許請求の範囲およびその均等物によって定義されている。
【0032】
図1Aは、SLMプリコーディングが適用されるデータを送信するための送信機の概略的な構成を図示するブロック図である。送信機は、ベースバンドデータプロセッサ101と、SLMプリコーダ102と、変換プリコーダ103と、空間マッパ(mapper)104と、多入力多出力(MIMO)プリコーダ105と、副搬送波マッパ106と、逆DFT(IDFT)モジュール107と、サイクリックプレフィックス(CP)アペンダ(appender)108と、デジタルアナログ変換器/無線周波数(DAC/RF)モジュール109と、を含む。
【0033】
ベースバンドデータプロセッサ101は、(例えば、変調シンボルに変換されたビット系列を含む)元のデータシンボルをSLMプリコーダ102に結合し、これにより、離散時間OFDM送信信号のPAPRを低減するSLMの重みを選択し、それらの選択された重みを元のデータシンボルに適用する。例えば、SLMプリコーダ102は、元のデータシンボルに適用されると、PAPR値が最小である離散時間OFDM信号が得られるように、候補重み行列のセットから重み行列を選択し、次に、元のデータシンボルで成分ごとに乗算された選択された重み行列を含む、重み付けされたデータセットを出力することができる。SLMプリコーダ102は、各候補重み行列に対応する各離散時間OFDM信号のPAPRを計算し、このPAPRを閾値と比較し、次に、閾値を下回るPAPRを提供する重み行列を選択することができる。SLMプリコーダ102は、成分ごとに元のデータシンボルで乗算された、選択された重み行列を含む重み付けされたデータセットを出力する。
【0034】
変換プリコーダ103は、重み付けされたデータセットに対して変換プリコーディングを実行する。変換プリコーダ103は、1つまたは複数のDFTモジュールを備えるSC-FDMAプリコーダとすることができる。MポイントDFTの場合には、M個の入力サンプルからなるブロックが、周波数領域シンボルに変換される。空間マッパ104は、元のデータシンボルの少なくとも1つのソースを複数のアンテナに割り当てる。それぞれのアンテナ(ポート)にデータをマッピングすることは、空間マッピングと呼ばれる。空間マッパ104は、レイヤマッパと呼ばれる場合がある。MIMOプリコーダ105は、チャネル状態情報(CSI)から計算された空間多重化重み、またはコードブックから検索されたMIMO重みなどの空間プリコーディング行列を適用する。例えば、MIMOプリコーダ105は、空間(またはレイヤ)マッパ104によって出力された複数のレイヤに対してプリコーディングを実行する。副搬送波マッパ106は、プリコーディングされたデータを適切な(例えば、スケジューリングされた)副搬送波にマッピングする。副搬送波マッパ106は、リソース要素マッパと呼ばれる場合がある。副搬送波マッパ106は、複数の副搬送波マッパモジュール、例えば、各レイヤまたはアンテナごとに1つの副搬送波マッパモジュールを備えることができる。IDFTモジュール107は、マッピングされた周波数領域シンボルを離散時間OFDM信号に変換する。IDFTモジュール107は、各レイヤまたはアンテナごとに別個のIDFTを備えてもよい。IDFTモジュール107は、オーバーサンプリングされたIDFTを提供することができる。CPアペンダ108は、CPを各離散時間OFDM信号に加える。DAC/RFモジュール109は、デジタル信号をアナログに変換し、無線チャネルでアナログ信号を送信する。
【0035】
図1Bでは、SLMプリコーダ102は変換プリコーダ103に続き、したがってSLM重みを選択し、変換プリコーディングされたシンボルに適用する。図1Cでは、SLMプリコーダ102は空間マッパ104に続き、したがってSLM重みを選択し、空間マッピングされたシンボルに適用する。SLMプリコーダ102は、複数のSLMプリコーダモジュール、各レイヤまたはアンテナにつき1つのSLMプリコーダモジュールを備えてもよい。分散型アンテナシステムでは、SLMプリコーダ102が空間マッパ104から下流に配置されている場合には、各無線アクセスネットワークノード上、または分散型アンテナシステムの各アンテナ上に、SLMプリコーダモジュールを常駐させてもよい。図1Dでは、SLMプリコーダ102はMIMOプリコーダ105に続き、したがってSLM重みを選択し、MIMOプリコーディングされたシンボルに適用する。
【0036】
いくつかの送信機構成では、送信機チェーン内の異なる場所に位置決めされた複数のSLMプリコーダのような、2つ以上のSLMプリコーダ102を設けることができる。本明細書に開示されている送信機構成では、図面に描かれているブロックのうちのいくつかは任意とすることができる。例えば、変換プリコーダ103は任意とすることができる。空間マッパ104およびMIMOプリコーダ105は、任意とすることができる。いくつかの態様では、送信機は、変換プリコーダ103、空間マッパ104、およびMIMOプリコーダ105なしで設けられる。本発明の態様に従って、本明細書には明示的に描かれていない送信機ブロックを含む送信機構成を提供し得ることもまた認識されたい。本発明において用いられる送信機は、符号化、ビットシフト、拡散、スクランブル、および/またはインタリーブブロックを含むことができ、SLMプリコーダ102の演算は、そのような符号化、ビットシフト、拡散、スクランブル、および/またはインタリーブに対応しつつ、その機能を相応に実行するように構成することが可能である。送信機は、1つまたは複数の追加的または代替的な可逆変換演算を含むことができ、その演算を本明細書に開示されているように実行するように、SLMプリコーダ102を相応に適合させることができる。
【0037】
図2Aを参照すると、本発明の態様を実装することが可能な受信機は、RF/ADCモジュール201と、CP除去器202と、DFTモジュール203と、チャネル推定器/等化器204と、副搬送波デマッパ(demapper)205と、空間デマルチプレクサ206と、変換復号器207と、SLM復号器208と、データシンボル推定器209と、を備える。
【0038】
RF/ADCモジュール201は、受信無線信号を受信し、デジタルベースバンド信号に変換する。CP除去器202は、各受信離散時間OFDM信号のCPを除去する。DFTモジュール203は、離散時間OFDM信号を周波数領域シンボルに変換(例えば、復調)する。チャネル推定器/等化器204は、伝播チャネルを推定(例えば、CSIを導出)し、周波数領域等化を実行する。副搬送波デマッパ205は、周波数領域データを、(様々なスケジューリングされた送信チャンネルに対応する場合がある)副搬送波データに分離する。空間デマルチプレクサ(de-MUX)206は任意に設けられ、送信されたデータに適用されたプリコーディングに基づき、データに対するすべての復号化を実行する。例えば、空間de-MUX206内の復号器は、送信機と受信機とによって共有されているコードブックインデックスを用いて、復号化行列を選択することができる。空間de-MUX206は、空間逆多重化を実行して、アンテナ当たりのデータを区別することができる。変換復号器207は、データに対して変換復号化を実行する。例えば、変換プリコーダ103がDFTモジュールを含むのであれば、変換復号器207は、IDFTモジュールを含む。変換復号化されたデータシンボルは、SLM復号器208によって処理され、これにより、受信データシンボルからSLM重みを除去する。
【0039】
SLM復号器208は、送信機内のSLMプリコーダ102によって用いられる、選択された重み行列に対応するインデックス(場合によってはコードブックインデックス)を受信することができる。例えば、インデックスは、受信信号中のシンドロームから導出されるか、またはそれ以外の方法で受信機に伝達される、制御チャネル(例えば、物理的アップリンク制御チャネルまたは物理的アップリンク共有チャネル)内のサイド情報として、送信することができる。SLM復号器208は、選択された重み行列を盲目的に決定することができる。いくつかの態様では、SLM復号器208は、様々な実現可能なコードまたはコードセグメントを使用して、このSLM復号器が選択された重み行列を識別するまで復号化を実行する。SLMプリコーダ102および復号器208は、直交SLMコードを用いることができる。SLM復号器208が選択された重み行列を識別すると、このSLM復号器は、重み(すなわち、SLM系列)を受信データから除去する。データシンボル推定器209は、SLM復号化されたデータから元のデータシンボルを決定する。
【0040】
図2B図2Cおよび図2Dは、受信機構成を描き、SLM復号器208が受信機チェーン内の様々な位置に位置決めされている。そのような位置決めは、対応する送信機内の動作の順序に対応する。送信機内の任意のブロックに関して上述したように、関連する受信機構成内の対応するブロックは、任意とすることができる。例えば、空間de-MUX206は、任意とすることができる。変換復号器207は、任意とすることができる。いくつかの受信機構成は、2つ以上のSLM復号器208を含むことができ、例えば、複数のSLMプリコーダを有する送信機に対して相補的なSLM処理を提供するようにしてもよい。
【0041】
本明細書に開示されている送信機および受信機は、クライアント側デバイス、サーバ側デバイス、および/または中間(例えば、リレー)デバイスを含むことができる。クライアント側デバイスは、UE、アクセス端末、ユーザ端末、モノのインターネット(IoT)デバイス、ワイヤレスローカルエリアネットワーク(WLAN)デバイス、ワイヤレスパーソナルエリアネットワーク(WPAN)デバイス、無人航空機、および高度道路交通システム(ITS)ノードを含むことができる。クライアント側デバイスの多くはバッテリで電力供給されており、コンピュータリソースへのアクセスが制限される場合があるため、本明細書に開示されている態様におけるアップリンク通信に提供されているような電力効率の向上、および計算複雑性の低さから恩恵を受けることになろう。クライアント側デバイスは、他のクライアント側デバイス、リレー、および/またはサーバ側デバイスを備える分散型アンテナ構成内で協調MIMOを実行するように構成することができる。MIMOプリコーディングは、電力効率に対するさらなる課題を伴う可能性があり、計算上のオーバヘッドを増大させる可能性がある。コスト、電力、および/または計算上の処理制限を有するクライアント側デバイスは、計算上の処理が削減されたPAPR低減スキームから恩恵を受けることになろう。
【0042】
サーバ側デバイスは、無線基地局を含む場合があり、それらは、EnodeB、スモールセル、フェムトセル、メトロセル、リモートラジオヘッド、モバイル基地局、セルタワー、ワイヤレスアクセスポイント、ワイヤレス通信ルータ、ワイヤレスハブ、ネットワークコントローラ、ネットワークマネージャ、無線アクセスネットワーク(RAN)ノード、HetNetノード、ワイヤレス広域ネットワーク(WWAN)ノード、分散型アンテナシステム、マッシブMIMOノード、およびクラスタマネージャとも呼ばれる。いくつかの態様では、サーバ側デバイスは、サーバ側モードで動作するように構成されたクライアントデバイスおよび/またはリレーを含むことができる。サーバ側デバイスを稠密に展開することには、電力、コンピュータ処理、および/またはコスト制約を伴う場合が多い。そのようなデバイスは、本明細書に開示されている、計算上の処理が削減されたPAPR低減スキームから恩恵を受けることになろう。
【0043】
中間デバイスは、固定および/または可動リレーを含むことができる。中間デバイスは、本明細書に開示されているような、クライアントデバイスおよび/またはサーバ側デバイスを備えることができる。中間デバイスは、ワイヤレスバックホール(backhaul)および/またはフロントホール(fronthaul)を有するリモートラジオヘッドを含むことができる。アドホック型、メッシュ型、および他の分散型ネットワークトポロジでは、中間デバイスは、ネットワーク覆域の増大および性能の向上をもたらすことができる。中間デバイスは、モバイルアドホック型ネットワーク(MANET)ノード、ピアツーピアノード、ゲートウェイノード、車両アドホック型ネットワーク(VANET)ノード、スマートフォンアドホック型ネットワーク(SPAN)ノード、クラウドリレーノード、地理的に分散したMANETノード、フライングアドホック型ネットワーク(FANET)ノード、空中リレーノード等々を含む。中間デバイスは、バッテリ給電式、太陽エネルギー給電式であっても、そうでなくても利用可能な電力が限られている。同様に、中間デバイスには、コスト制約および/またはコンピュータ処理能力制限がある場合がある。そのようなデバイスは、本明細書に開示されている、計算上の処理が削減されたPAPR低減スキームから恩恵を受けることになろう。
【0044】
図3は、マルチアンテナシステムにおけるPAPR低減動作を描く流れ図である。図に描かれているブロックは、集中型プロセッサで実行される動作を表すこともできるし、クラウドコンピューティング構成におけるように、複数のプロセッサにわたって分散していてもよい。プロセッサは、協調MIMO構成内の、および/または1つまたは複数の遠隔したデータセンター内のサーバの複数のアンテナに対応するノードのような、ネットワークノード上に常駐させてもよい。
【0045】
1つまたは複数の入力データストリームは、MIMO部分空間チャネルのような、複数のMIMO送信チャンネルに対応する数N個のレイヤにマッピング301される。各レイヤ1~N内のデータは、例えば、N個の副搬送波を送信機に割り当てるスケジューリング情報に従って、複数のN個のOFDM副搬送波周波数にマッピング302.1~302.Nされる。マッピング302.1~302.Nは、データシンボルをサイズNのN個のブロックに区分することを含むことができる。データ選択303.1~303.Nは、各周波数fからfに対応するN個のデータシンボルからなるセットの選択をもたらす。各周波数fからfごとに、対応するデータシンボルが前述のN個のブロックのそれぞれから収集される。各処理303.1~303.Nに配列されたデータシンボルは、サイズNのN個のブロックにフォーマットすることができる。
【0046】
周波数fに対応するN個のデータシンボルd(f)のブロックが、N個のアンテナのそれぞれ(例えば、アンテナ1~アンテナNとして示されている)に対して処理される。これは、fまでの各周波数に対して実行される。わかり易くするために、送信アンテナの数は、レイヤの数と等しいと仮定する。しかしながら、異なるアンテナ構成、例えば、アンテナの数がNよりも大きい構成を用いることができる。
【0047】
アンテナ1のための処理は、(位相回転系列を含み得る)PAPR低減重み行列を、データブロックd(f)~d(f)304.1,1~304.1,N~304.N,1~304.N,Nのそれぞれに適用することを含むことができる。重みマトリックスW(f)~W(f)は、アンテナ1に対して用いることができ、また、WNt(f)~WNt(f)は、アンテナNに対して用いることができる。データシンボルブロックd(f)を有する、(アンテナ(j)および周波数(n)によってインデックス付けされた)重み行列W(f)の積から得られた各データブロック304.1,1~304.1,N~304.N,1~304.N,Nは、
【数3】
のように表示される。
【0048】
各アンテナ(1からN)に対応する各データシンボルブロック
【数4】
は、アンテナ(j)および周波数(n)305.1,1~305.1,N~305.N,1~305.N,Nによってインデックス付けされたMIMOプリコーディングベクトルs(f)で乗算され、対応するプリコーディングされたシンボル値を生成する。したがって、それぞれのアンテナごとに、サイズNの、N個のシンボルブロックのセットd(f),n=1,...,Nに対応する、N個のプリコーディングされたシンボル値が生成される。N個のプリコーディングされたシンボル値はそれぞれ、対応する副搬送波周波数fのブロックd(f)のN個のデータシンボルの線形結合を含む。それぞれのアンテナごとにプリコーディングされたN個のシンボル値は、IFFT307.1~307.Nのセットの入力ビンにマッピング306.1~306.Nされ、これにより、それぞれのアンテナ1~Nごとに離散時間MIMO-OFDM信号を生成する。
【0049】
図3の重み行列W(f)の選択について、図4に図示されているブロック図を参照して説明する。本明細書に開示されている態様は、例えば、マッシブMIMOアンテナアレイでの集中処理、分散型アンテナシステムでの集中処理、および分散型アンテナシステムでの分散処理のために構成することができる。本明細書において用いられる分散型プロセッサは、クラウドコンピューティングネットワークを含むことができ、例えば、1個のラック内の機械、複数のラック内の機械、および/または複数の地理的に分散したデータセンターに常駐する機械全体にわたって分散した、選択可能なプロセッサおよびメモリを備えてもよい。クラウドコンピューティングネットワークは、スイッチ、ルータ、アクセスポイント、ゲートウエイなどを含む、ソフトウェア定義された、選択可能な、および/または設定可能なネットワークリソースを含むことができる。そのような選択可能な、および/または設定可能なネットワークリソースは、バックホールネットワークへの選択可能、かつ、設定可能なアクセスをもたらすことができる。そのような選択可能、かつ、設定可能なアクセスは、選択可能な帯域幅、選択可能な待ち時間、選択可能なサービス品質などを含むことができる。クラウドコンピューティングネットワークは、協調MIMOシステムにおいてアンテナとしてだけでなく分散型プロセッサとしても機能する、協調型ワイヤレスデバイスを備えてもよい。協調型ワイヤレスデバイスはそれぞれ、処理リソース(クラウドストレージおよび仮想ネットワークリソースを含む場合がある)を含んでもよいし、本明細書に開示されているPAPR低減動作のうちの少なくともいくつかを実行するように構成してもよい。
【0050】
データマッパ401は、1つまたは複数の入力データストリームを、リソースブロックおよびレイヤにマッピングすることができる。任意に、データは、データを1つまたは複数の重み、例えば、初期重みセットW(0)で乗算するように構成された乗算器402によって、処理することができる。乗算器402は、データをスクランブルし、任意の型の拡散コードおよび/または多元接続コードを用いてデータを拡散し、かつ/または、任意の型の変換プリコーディング(SC-FDMAプリコーディングなど)を実行するように構成する場合もあり得る。マッパ401または乗算器402によって出力されたデータシンボルは、複数N個の処理分岐に入力され、処理分岐では、分岐はそれぞれ、N個のアンテナのうちの1つに対応する。処理分岐は、直列もしくは並列のプロセッサのアーキテクチャで、またはそれらの組み合わせで実装することができる。処理分岐は、集中型プロセッサ、プロセッサの分散型セット、またはそれらの組み合わせを用いてもよい。
【0051】
第1の分岐は、可逆変換404.1を経由し、かつ、初期基本離散時間MIMO-OFDM信号を生成する第1の経路と、スパース行列乗算器407.1および可逆変換409.1を経由する、1つまたは複数個(U)の部分更新離散時間MIMO-OFDM信号を生成する第2の経路と、を含む。更新された離散時間MIMO-OFDM信号を発生させるために、線形結合器405.1は、少なくとも1つの部分更新離散時間MIMO-OFDM信号を、基本離散時間MIMO-OFDM信号と合計し、これが、信号のPAPRを測定するためにPAPR測定モジュール406.1内で分析される。MIMOプリコーダ403.1は、可逆変換404.1および409.1にMIMOプリコーディング重みのセットを提供する。同様のプロセスが、残りのN-1個の(物理的または論理的)処理分岐のそれぞれにおいて実行される。
【0052】
第N thの分岐は、可逆変換404.Nを経由する、初期基本離散時間MIMO-OFDM信号を発生させる第1の経路と、スパース行列乗算器407.Nおよび可逆変換409.Nを経由する、1つまたは複数個(U)の部分更新離散時間MIMO-OFDM信号を発生させる第2の経路と、を含む。更新された離散時間MIMO-OFDM信号を発生させるために、線形結合器405.Nは、少なくとも1つの部分更新離散時間MIMO-OFDM信号を、基本離散時間MIMO-OFDM信号と合計し、これが、信号のPAPRを測定するためにPAPR測定モジュール406.1内で分析される。MIMOプリコーダ403.Nは、可逆変換404.Nおよび409.NにMIMOプリコーディング重みのセットを提供する。
【0053】
個の分岐のそれぞれに関して、わかり易くするために、本明細書では、第1の分岐の説明が提示されている。線形結合器405.1は、基本離散時間MIMO-OFDM信号y(u)を格納し、かつ/またはメモリ415.1から読み取りする場合もあり得る。1つの態様では、初期基本離散時間MIMO-OFDM信号は、線形結合器405.1で用いられる基本離散時間MIMO-OFDM信号だけである。他の態様では、更新された離散時間MIMO-OFDM信号は、基本離散時間MIMO-OFDM信号として指定することができる。PAPR測定モジュール406.1は、PAPR(例えば、PAPR(u))を格納および/または読み取りし、かつ/またはメモリ415.1に対してインデックスuを更新することができる。インデックスuは、重みコードブック内の重み行列w(u)に対応するコードブックインデックスとすることができる。PAPR測定モジュール406.1は、例えば、そのPAPRを前のPAPR測定値または何らかの閾値と比較することに応じて、更新された離散時間MIMO-OFDM信号をメモリ、そのPAPR、および対応する更新インデックスに格納することができる。PAPR測定モジュール406.1は、低いPAPRを有する更新された離散時間MIMO-OFDM信号を、基本離散時間MIMO-OFDM信号として指定する場合もあり得るとともに、以前に書き込まれた任意のデータをメモリ415.1から削除する場合もある。(メモリ415.1から読み取られたPAPR(u)および場合によってはインデックスuなどの)PAPR測定値に基づいて、スパース行列乗算器407.1は、メモリ410から重み行列W(u)を選択する場合もあり得る。
【0054】
格納された値、例えば、uおよびその対応するPAPR(u)などは、モジュール406.1によってメモリ415.1から読み取ることができ、N個の分岐からPAPRおよび重みインデックス値(ならびに場合によっては他のデータ)を収集するように構成された、PAPRアグリゲータ411に伝達することができる。各分岐のモジュール406.1~406.Nは、U個のPAPRのすべてに対応するデータ、所定の閾値を下回る複数のPAPR、または所定の数の最低PAPRを、アグリゲータ411に伝達する場合もあり得る。
【0055】
重み値がそこから受信された分岐に対応する重み値で各PAPRをスケーリングするために、PAPR重み付けモジュール412を任意に設けることができる。例えば、PAPR感受性が高い分岐の場合には、重みは1になる場合もあり、PAPR感受性が低い分岐の場合には、PAPRは0になる場合もあり得る。重み付けされたPAPR値は、次に、重み選択器413で処理され、重み選択器は、すべての分岐による使用に最良の重みセットを選択することができる。例えば、それぞれのインデックスuごとに、重み選択器413は、すべての分岐からの、対応する重み付けされたPAPR値を合計して、重み付けされたPAPRメトリックの総計を生成することができる。最良の重みセットインデックス(0≦u≦U)は、最小値を有する、対応する重み付けされたPAPRメトリックの総計から選択することができる。重みセット選択器413は、次に、最良の重みセットインデックスu(または対応する重みW(u))を、重み付け処理304.1,1~304.1,N~304.N,1~304.N,Nにおいて実施される図3に示されている処理分岐に伝達する。
【0056】
PAPR重み付け412が用いられる態様では、分岐重みはそれぞれ、分岐アンテナの(または対応するネットワークノードの)PAPRに対する感受性の尺度を含む。例えば、1に近い標準化後の分岐重みは、高いPAPR感受性に対応し得るが、ゼロに近い標準化後の分岐重みは、低いPAPR感受性に対応し得る。バッテリ給電式ノードは、バッテリ給電式デバイスの動作にとって電力効率がより重要である可能性が高いので、分岐重みが回線電力を有するノードよりも高い場合がある。1つまたは複数の回線給電式ノードをスケジューリングして、分散型アンテナシステム内にバッテリ給電式ノードのセットを有するクラスタで動作させると、分岐重みが低い回線給電式ノードの自由度を高めることができ、より低いPAPRをバッテリ給電式ノードにもたらすので、有利である。これにより、PAPR感受性が高くないノードに対して高いPAPRを可能にすることによって、重み選択413は、より低いPAPRをPAPR感受性が高いノードに対してもたらすことが可能になる。
【0057】
いくつかの態様では、PAPR重み付けモジュール412は、モジュール412に報告されている各対応ノードのバッテリ寿命(バッテリ消耗、バッテリ充電レベル、完全充電の割合、デバイスの残り実行時間、バッテリ状態(例えば、充電または放電)、およびそれらの組み合わせを含み得る)に基づき、分岐重みのうちの1つまたは複数を計算する場合もあり得る。バッテリ寿命が短いデバイスは、バッテリ寿命がほぼ長いデバイスよりも、対応する分岐重みを高くすることができる。分岐重みはそれぞれ、分岐のバッテリ充電レベルの逆数に対応する場合もあり得る。PAPR重み付けモジュール412は、各デバイスに割り当てられた電力スケーリング係数(例えば、高電力で送信するデバイスの方が、対応する分岐重みが高い場合もあり得る)、各デバイスに割り当てられたセッション持続時間(例えば、より長いセッションを有するようにスケジューリングされた、または、それらのデータサービスのタイプ、またはそれらが送信しているファイルのサイズに基づくなどのそれ以外の方法で、より長いセッションを有することが見込まれるデバイスの方が、対応する分岐重みが高い場合もあり得る)、(緊急リンクまたは非緊急リンクに基づくなどの)優先レベル、加入レベル、もしくは他の何らかのメトリック、またはそれらの組み合わせに基づき、分岐重みを計算する場合もあり得る。PAPR感受性が低い1つまたは複数のノードをスケジューリングして、分散型アンテナシステム内にPAPR感受性が高いノードのセットを有するクラスタで動作させると、PAPR感受性が低いノードの分岐重みが低いことにより、自由度を高めることができ、これにより、PAPR感受性が高いノードに対してより低いPAPRが可能になるので、有利である。
【0058】
図5Aは、第1の可逆変換504と、スパース行列乗算器507と、第2の可逆変換509と、線形結合器505と、を含むSLM重み選択器の概略的な構成を図示するブロック図である。重み選択器は、入力/出力(I/O)プロセッサ501と、CSI推定器510と、メモリ502と、MIMOプリコーダ508と、PAPR測定モジュール506と、をさらに含むことができる。
【0059】
第1の可逆変換504は、データシンボルベクトルX上で演算して、初期基本離散時間OFDM信号:
【数5】
(式中、
【数6】
は、可逆変換演算子である)を発生させる。この演算子
【数7】
は、高速変換を介して実施することができる逆DFT行列Fを含むことができる。オーバーサンプリング係数Kを有する複素NポイントIFFTの計算複雑性は、(KN/2)log(KN)複素乗算およびKNlog(KN)複素加算を含む。この演算子
【数8】
は、通常計算複雑性を増大させる、1つまたは複数の追加の行列演算子を含むことができる。例えば、MIMOプリコーダ508は、MIMOプリコーディング重みのセットを可逆変換504に提供することができる。可逆変換504は、プリコーディング重みからプリコーディング行列Sを生成し、データシンボルベクトルXを乗算することができ、積SXは、F:x=F(SX)によって変換することができる。
【0060】
スパース行列乗算器507は、長さNのスパース重みベクトルwのセットを用いて、第2の可逆変換509によって処理する前に、シンボルベクトルを乗算X=[X...XN-1することができる。いくつかの態様では、NXN対角重み行列Wを用いてもよい。スパース対角行列Wは、1つまたは複数のゼロ値を有する対角要素を含む。1つの態様では、第1のシンボル位置に対応する第1の重み行列は、w(1,0,...,0)=[1,0,...,0]とすることができ、第2のシンボル位置に対応する第2の重み行列は、w(0,1,...,0)=[0,1,...,0],...,とすることができ、また、第Nthのシンボル位置に対応する第Νthの重み行列は、w(0,0,...,1)=[0,0,...,1]とすることができる。
【0061】
スパース部分更新シンボル行列のセット(例えば、系列)w(...)Xは、以下のように計算することができる(例えば、w(...)Xは、
【数9】
のように計算され、式中、
【数10】
は、要素ごとの乗算を表示する)。部分更新シンボル行列はそれぞれ、アダマール(Hadamard)積(シューア(Schur)積、エントリ単位の積、または成分単位の積としてもまた知られている)の結果であり、それは、同じ次元の2つの行列(w(...)およびX)となり、別の行列(w(...)Χ)を生成する。なお、各要素i、jは、元の2つの行列の要素i、jの積、すなわち、(w(...)Χ)i、j=(w(...)i,j(X)i、jである。本開示の変形および代替的選択肢は、アダマール積の連想的、分配的、および/または可換的な特性を活用し得ることを認識されたい。
【0062】
いくつかの態様では、加算または減算を介して乗算を実行して、等価な結果に到達することができる。様々な対応するビットレベルの演算を用いて、本明細書に開示されている態様の乗算を達成することができる。乗算は、入力シンボル系列のコンステレーションポイントを、重み系列に従ってコンステレーションポイントの別のセットにマッピングすることによって実行することができる。
【0063】
第2の可逆変換509は、演算子
【数11】
を用いて、(データベクトルXに対する部分更新である)各スパース行列w(...)Xに対して演算して、対応する部分更新離散時間OFDM信号x(...)を発生させる。1つの態様では、可逆変換509は、MIMOプリコーダ508から受信したプリコーディング重みからプリコーディング行列Sを生成し、次に、演算子
【数12】
を計算する。この演算子
【数13】
は、メモリに格納され、各スパース行列w(...)Xに対して演算するために使用することができる。これにより、演算x(...)=(FS)(w(...)Χ)が得られる。別の態様では、演算子
【数14】
は、各スパース重み行列w(...)ごとに生成され、メモリに格納することができる。可逆変換509は、メモリから格納されている演算子を選択して、例えば、演算x(...)=(FSw(...))Xを実行するために、データベクトルXに対して演算することができる。この演算子はスパース行列であり、したがって、スパース行列ベクトル(spMV)を活用することができる。1つの態様では、FSが計算、および格納され、各w(...)ごとに、FSの対応する列が読み取りされ、その後にXとの乗算が続く。
【0064】
本明細書に開示されている演算子は、スケーリング係数で乗算することができ、この演算子を使用して、スケーリングされた部分更新離散時間OFDM信号x(...)を生成してもよい。可逆変換の線形性特性をスケーリング係数と組み合わせて活用して、可逆変換計算の回数を減らすことができる。可逆変換509は、部分更新離散時間OFDM信号x(...)をメモリに格納し、そのような信号のスケーリング後のバージョンを線形結合器505に供給することができる。
【0065】
(...)のスパース性により、複素乗算および加算の必要回数が減少することによって、
【数15】
演算が単純化される結果、部分可逆変換演算が得られる。例えば、w(...)X内のゼロの値により、w(...)Xに対して作用する演算子
【数16】
中の複素乗算および加算の回数を、初期基本離散時間OFDM信号を生成するのに必要な全変換演算と比較して、減らすことが可能になる。更新された離散時間OFDM信号は、部分更新離散時間OFDM信号を基本離散時間OFDM信号と合計することによって、生成される。この総計は、別のKN回(以下の)複素加算を含んでもよい。同様に、演算子
【数17】
は、w(...)内のゼロの値により複雑性が低減され、本明細書では、部分可逆変換演算と呼ばれている。このアプローチは、他の線形変換演算に適合させることができる。例えば、演算子
【数18】
およびその変形は、w(...)のスパース性のおかげで単純化することができ、ここでは、TおよびSはそれぞれ、任意の数の可逆変換演算子を表す。TおよびSは、拡散、プリコーディング、順列、ブロック符号化、時空間符号化などの、1つまたは複数の演算子、および/またはコンステレーションマッピング演算子を含むことができる。Fは、ウェーブレット変換、分数次フーリエ変換等々のような、任意の可逆変換演算子を含んでもよい。
【0066】
第1の可逆変換504および第2の可逆変換509は、共通の構造を含み得ることを認識されたい。可逆変換回路、プロセッサ、および/またはコードセグメントは、全可逆変換演算を用いて初期基本離散時間OFDM信号を発生させる、第1の可逆変換504として演算することができ、かつ、部分可逆変換演算を用いて部分更新離散時間OFDM信号を発生させる、第2の可逆変換509として演算することができ、この部分可逆変換演算はそれぞれ、全可逆変換演算よりも回数が少ない乗算および加算を含む。
【0067】
可逆変換509によって発生した部分更新離散時間OFDM信号x(...)は、スケーリング係数aとともに、後続の処理のためにメモリ502に格納することができる。可逆変換509および/または線形結合器505は、以前に生成された部分更新離散時間OFDM信号x(...)をスケーリングすることによって、および/または、結合することによって、新たな部分更新離散時間OFDM信号x(...)を生成してもよい。事前に計算された部分離散時間OFDM信号x(...)はそれぞれ、X中のN個のシンボル位置のうちの異なる1つに対応するが、それらを選択し、スケーリング係数aで乗算して、新たな部分更新離散時間OFDM信号x(...)を発生させることができる。本明細書に開示されている態様は、可逆変換の線形性を活用して、(拡散OFDM信号およびMIMOプリコーディングされたOFDM信号を含む)OFDM信号に複雑性が低い部分更新をもたらすことができる。
【数19】
式中、aおよびbは、スカラー値であり、
【数20】
および
【数21】
は、長さKNの部分更新離散時間OFDM信号であり、Χ(ω)およびΧ(ω)は、長さNのスパース部分更新シンボル行列(例えば、
【数22】
および
【数23】
であり、式中、W (...)およびW (...)は、X中の同じシンボル位置または異なるシンボル位置に対応する非ゼロ値を有する長さNのスパース重みベクトルである)である。
【0068】
重み値のシンボルコンステレーションが所定であるか、または適合可能であるスパース重みベクトルw(...)の場合、スケーリング係数aおよびbは、シンボルコンステレーションに従って選択し、上述のように用いて、対応する部分更新離散時間OFDM信号を発生させることができる。例えば、x(1,0,...,0)が、スパース重みベクトルw(1,0,...,0)に対応する部分可逆変換によって生成されるのであれば、w(a,0,...,0)に対応するx(a,0,...,0)は、積x(a,0,...,0)=ax(1,0,...,0)から生成される。追加の変換演算を実行する代わりに、x(a、0、...、0)が、KN回以下の複素乗算を実行することによって生成される。新たな部分更新離散時間OFDM信号は、部分更新離散時間OFDM信号の総計から生成することができる。例えば、スケーリング係数(a+b)の実施は、以下の以前に計算された信号x(a,0,...,0)と、x(b,0,...,0):x(a+b,0,...,0)=x(a,0,...,0)+x(b,0,...,0)との積算によって実現することができ、それは、変換演算の代わりに、KN回以下の複素加算を含むことができる。
【0069】
線形結合器505は、各部分更新離散時間OFDM信号を、基本離散時間OFDM信号と合計して、更新された離散時間OFDM信号を発生させるように構成されている。以下の加算:
(u)=y(0)+x(u)
(式中、x(u)は、第uthの部分更新離散時間OFDM信号であり、y(0)は、基本離散時間OFDM信号であり、y(u)は、インデックスuに対応する更新された離散時間OFDM信号である。線形結合器505は、値y(u)、y(0)、およびx(u)をメモリ502に格納することができ、また、メモリ502から値y(0)およびx(u)を読み取ることができる。線形結合器505は、本明細書に記載されているように、新たなx(u)値を生成することができる)が実行される。
【0070】
1つの態様では、最初の(u=0)反復は、初期基本離散時間MFMO-OFDM信号(y(0)によって表示されている)をメモリに書き込むことを含む。線形結合器505は、メモリ502からy(0)を読み取り、それを、可逆変換509によって生成されたx(u)と結合させることができる。線形結合器505は、線形結合器505および/またはPAPR測定モジュール506によって後で使用するために、得られた総計y(u)をメモリ502に格納する場合もあり得る。
【0071】
PAPR測定モジュール506は、y(u)のPAPRを計算し、それを、前のPAPRおよび/または少なくとも1つのPAPR閾値と比較する。比較に基づいて、信号y(u)および/またはy(0)は、本明細書のさらなる処理のために選択してもよいし、送信される信号として選択してもよい。例えば、線形結合器505または可逆変換509は、PAPRに基づいて、(例えば、以前に生成されたx(u)値を、スケーリングおよび/または線形結合することなどによって)新たなx(u)値を生成することができ、また、線形結合器505は、新たなx(u)を、y(0)または前のy(u)と結合する。いくつかの態様では、PAPR測定モジュール506は、y(u)を後続の反復において更新される値y(0)として指定するか、またはPAPR測定モジュール506が、前の値y(0)を選択する場合もあり得る。PAPR測定モジュール506は、後続の処理のためにメモリから値(例えば、x(u),y(u),y(0))を読み取るように、線形結合器505に命令することができる。PAPR測定モジュール506は、値(例えば、W(u),a)を読み取って、新たな重みを生成するように、スパース行列乗算器507に命令する場合もあり得る。
【0072】
PAPR測定モジュール506は、ピーク検出器を含むことができ、それは、ピークホールド回路または全波整流器と呼ばれる場合もある。ピーク検出器は電圧を監視し、そのピーク値を保持する。ピーク検出器回路は、極値点に到達するまで入力電圧を追跡するか、または入力電圧に追従し、入力が減少してもその値を保持する。これは、テスト中の離散時間信号に対応するデータセットから極大値を決定するようにプログラムされたデジタル回路またはプロセッサ内で実行することができる。ピーク検出器は、LNサンプルの中で極大値が最小である信号を見つけることによって、U個の離散的信号の中でピーク電力が最小である信号を識別することができる。PAPR測定モジュール506は、デジタルデータに対してアルゴリズム演算を実行して、PAPRを決定することができる。累積分布関数(CDF)または相補累積分布関数(CCDF)は、PAPRに対する性能評価尺度として使用することができる。CCDFは、OFDMシンボルのPAPRが所与の閾値、PAPRを超過する確率を表し、CCDF=Pr(PAPR>PAPR)と表示される。PAPRは、ピーク、CDF、CCDF、および/または波高率(波形の実効値に対するピーク値の比)を含むことができる。他のPAPR性能評価尺度を使用してもよい。
【0073】
I/O501は、構成要素および/または他のノードから受信したデータをメモリ502に書き込み、かつ、メモリ502からこのデータを読み取って、構成要素および/または他のノードに送信するために構成された、プロセッサを含むことができる。I/O回路類501は、1つまたは複数のワイヤレス(例えば、無線、光学、または他の何らかのワイヤレス技術)の、および/または有線(例えば、ケーブル、ファイバ、または他の何らかの有線回線技術)のトランシーバを含むことができる。I/O501は、(ノード内の、またはノードの外部の)PAPRアグリゲータ構成要素にPAPRを伝達することができ、これは、次に、重み選択のために処理される。I/O501は、重みセット選択器から、選択された重み(または対応するインデックス)を受信し、OFDM送信機によって使用するためにメモリ502にデータを格納することができる。例えば、スパース行列乗算器507は、メモリ502から、選択された重みを読み取ることができる。I/O501は、ベースバンドOFDM信号(例えば、y(u))、および/または(インデックスuなどのサイド情報を含む)他のデータを、処理および送信用の無線トランシーバ回路類に伝達することができる。
【0074】
CSI推定器510は、受信されたパイロット信号を測定し、そこからCSIを推定することができる。CSIは、MIMOプリコーダ508および/または他のノードのMIMOプリコーダによって使用するためにメモリ502に格納してもよく、そこからプリコーディング重みを選択、または生成することができる。CSIは、PAPRスケーリング重みを生成するために、PAPR重み付けモジュール412によって使用されてもよい。
【0075】
図5Bは、OFDM信号に対して部分更新を実行し、PAPRが最良である候補信号をそこから選択するための処理ステップおよび/またはプログラム要素を示す流れ図である。スパース演算子のセット(FSw(...))が計算511され、それぞれスパース重み行列のセットw(...)に対応する。例えば、個々の演算子FおよびSは、単一の稠密な演算子FSとして一緒に計算し、メモリに格納することができる。稠密な演算子FSは、各スパース重み行列w(...)に対応するスパース演算子の基底関数として用いられる。特定の演算子FSw(...)が、FSw(...)中の非ゼロブロックに対応するFS中の非ゼロブロックを選択することによって用いられる。例えば、重み行列w(...)が、単一の非ゼロ行要素(例えば、行インデックスn)を含む列ベクトルであれば、FSw(...)中に、w(...)中の単一の非ゼロ行要素に対応する非ゼロ要素を有する単一の列(例えば、列n)がある。したがって、行インデックスn、および(任意に)対応するスケーリング係数aは、メモリに格納されて、スパース重み行列w(...)を表すことができ、対応するスパース演算子FSw(...)が検索されると、例えば、可逆変換演算x(...)=(FSw(...))Xを実行するなどのために、FS中の行インデックスnに対応するブロック(例えば、列n)だけが検索され、部分更新離散時間OFDM信号を生成512するために使用される。Sを更新する必要がない限り、FSに対応するスパース演算子は、データシンボルXの後続のブロックが部分更新離散時間OFDM信号をそこから生成512するために再利用することができる。
【0076】
データシンボルXの第1のブロックのために、512で生成された部分更新離散時間OFDM信号をメモリに格納することができる。ステップ512は、以前に生成された部分更新離散時間OFDM信号をスケーリングすること、および/または線形結合することによって、追加の部分更新離散時間OFDM信号を生成することをさらに含むことができる。大きなシンボルコンステレーションがSLM重みに使用される場合には、ステップ512は、部分更新離散時間OFDM信号をスケーリングして、新たな部分更新離散時間OFDM信号を発生させることができるので、FSの追加の演算は必要ない。そのようなコンステレーションの対称性を活用して、演算の回数を減らすことができる。ステップ512は、部分更新離散時間OFDM信号を結合して、FSの追加の演算を必要とせずに、新たな部分更新離散時間OFDM信号を生成することができる。したがって、FS演算の回数は、コンステレーションのサイズおよび候補信号の数Uとは独立したものとすることができる。
【0077】
線形結合513は、少なくとも1つの部分更新離散時間OFDM信号を基本離散時間OFDM信号と合計して、新たな更新された(または候補)離散時間OFDM信号を発生させることを含む。基本離散時間OFDM信号は、初期基本離散時間OFDM信号、または前の更新された離散時間OFDM信号とすることができる。候補離散時間OFDM信号(基本離散時間OFDM信号を含む)、および各候補離散時間OFDM信号に対応するインデックスuは、メモリに格納してもよい。
【0078】
PAPR514は、それぞれの候補離散時間OFDM信号ごとに計算され、場合によってはそれがuによってインデックス付けされるように、格納される。決定プロセス515は、PAPRを、閾値および/または少なくとも1つの前のPAPRと比較し、場合によっては、uによってインデックス付けされたメモリに現在のPAPRを格納することを含む。決定515は、後続の反復を実行するかどうかを指示することができる。決定515は、現在の候補離散時間OFDM信号を、後続の反復において使用される基本離散時間OFDM信号として表示することを含んでもよい。決定515は、最良のPAPRまたは閾値を下回るPAPRに対応する離散時間OFDM信号、および/または関連データ(例えば、重み、インデックス、等々)を出力するために選択してもよい。
【0079】
後続の反復が実行される場合には、基本信号に対する後続の部分更新が、選択または適合516される。選択/適合516は、生成512および/または線形結合513の機能を制御することができる。例えば、現在のPAPR(および前のPAPR)に基づいて、選択/適合516は、基本信号と合計される部分更新、および任意に、どの基本信号を使用するかを選択することができる。選択/適合516は、更新に対応するnおよび/またはaを選択することができる。そのようなデータ依存の更新は、いくつかの場合には(例えば、静止信号の場合)、データ非依存の更新スケジュールを使用するアルゴリズムよりも速い収束をもたらすことができる。スケーリング係数aを更新するためのステップサイズを選択して、収束および/または安定性を向上させることができる。新たなスケーリング後の部分更新離散時間OFDM信号は、前の離散時間OFDM信号をスケーリングすることによって、および/または離散時間OFDM信号を結合することによって、発生させることができる。ステップサイズは、1つまたは複数の測定基準に基づいて一定である場合もあれば、可変である場合もある。ステップサイズに関する条件は、平均および2乗平均の意味での収束をもたらすように導出することができる。ステップサイズおよび他のパラメータは、メモリに格納することができる。
【0080】
図5Cは、OFDM信号に対して部分更新を実行し、PAPRが最良である候補信号を選択するための方法および/またはコンピュータプログラムの流れ図である。稠密な演算子(FS)が計算521され、メモリに格納される。稠密な演算子は、稠密なデータ行列Xに対して演算して、初期基本離散時間OFDM信号を発生させることができる。稠密な演算子は、スパースデータ行列に対して演算522して、部分更新離散時間OFDM信号を発生させる。スパースデータ行列は、スパース重み行列w(...)内のゼロ値に対するような、稠密なデータ行列内で選択される値をゼロに設定することによって発生させてもよい。稠密なデータ行列Xは、メモリに格納してもよい。また、スパースデータ行列(w(...)X)は、w(...)中の非ゼロ要素に対応するXの非ゼロ要素だけを選択することによって、提供することができる。スパース重み行列w(...)は、それぞれの非ゼロ行列要素に対応するインデックスn(例えば、列ベクトル中の行インデックス)として、および任意に、第nthの値に対応する複素数値aとして、メモリに格納してもよい。スパースデータ行列は、格納されたXから、それぞれのnに対応する要素Xを選択し、Xまたはその対応する部分更新離散時間OFDM信号を、aでスケーリングすることによって提供してもよい。
【0081】
図5Bにおけるように、部分更新離散時間OFDM信号は、基本離散時間OFDM信号と結合523され、更新された(候補)離散時間OFDM信号のPAPRが計算524され、決定プロセスが実行525される。決定525は、例えば、現在の、または前の候補信号を基本信号として指定することなどによって、基本離散時間OFDM信号を更新することを含むことができる。選択/適合526は、選択/適合516と同様に演算することができる。いくつかの態様では、選択/適合526は、ステップ522で演算される新たなスパースデータ行列をもたらすことができる。
【0082】
図6は、本明細書に開示されている信号処理機能のために最適化することが可能なグラフィック処理装置(GPU)アーキテクチャを図示する図である。ハードウェアおよび/またはソフトウェアは、離散時間OFDM信号のPAPRを低減するための部分更新方法によって可能になるスパース処理演算を最適化することができる。これらの部分更新方法により、スパース処理に固有の様々な最適化解が可能になる。GPUアーキテクチャは、グローバルメモリアクセスを最適化し、共有メモリアクセスを最適化し、かつ、再利用および並列処理を活用するために適合させることができる。スパース処理演算を最適化することは、メモリアクセスのコスト、アクセスパターン、メモリのタイプおよびレベルを特徴付けすることと、データ局所性を活用することと、を含むことができる。再利用を活用することは、オンチップメモリ内の各要素をキャッシュすることを含むことができ、また、並列処理を活用することは、同期のない並列処理を用いることを含むことができる。
【0083】
本明細書に開示されている態様は、モデル駆動型コンパイル戦略および実行時戦略を使用して、グラフィック処理装置(GPU)上で(スパース行列ベクトル乗算などの)スパース演算を最適化することを提供することができる。例示として、図6は、N個のレベルのストリーミングマルチプロセッサ(SM)610.1~610.N(SM 1,SM 2,...,SM N)を含むGPU並列コンピューティングアーキテクチャを描き、それぞれ、共有メモリ構成要素612と、レジスタのレベル614.1~614.Mと、あるレベルのストリーミングプロセッサ(SP)616.1~616.M(SP 1,SP 2,...,SP M)と、命令ユニット618と、定数キャッシュ構成要素620と、テクスチャキャッシュ構成要素622と、を含む。GPUには利用可能な様々なメモリがあり、それらは、ハイブリッドキャッシュおよびローカルストアの階層で編成することができる。メモリは、オフチップのグローバルメモリと、オフチップのローカルメモリと、オンチップの共有メモリと、オンチップのキャッシュを有するオフチップの定数メモリと、オンチップのキャッシュを有するオフチップのテクスチャメモリと、オンチップのレジスタと、を含むことができる。オフチップのデバイスメモリ構成要素624は、グローバルメモリ、および/または、定数メモリおよびテクスチャメモリを含むことができる。GPUアーキテクチャは、CPU604およびCPUメモリ606を含むか、またはそれらに通信可能に結合601することができ、これらは、CPU604の動作を実行するためのコンピュータ可読命令およびデータを格納するように適合させてもよい。CPU604は、母線、ネットワーク、または他の何らかの通信結合を介しての、GPUアーキテクチャの構成要素、または同様の構成要素との動作可能な通信とすることができる。CPU604は、GPUアーキテクチャによって実行される処理または機能の、開始およびスケジューリングを行ってもよい。
【0084】
共有メモリ612は、各SM610.1~610.N内に存在し、バンクに編成される。同じバンクに属している複数のアドレスが同時にアクセスされると、バンク競合が生じる。SM610.1~610.Nはそれぞれ、レジスタのセット614.1~614.Mもまた有する。定数メモリおよびテクスチャメモリは、グローバルメモリ空間内の読み取り専用の領域であり、それらは、オンチップの読み取り専用キャッシュを有する。定数キャッシュ620へのアクセスは速くなるが、それは単一のポートしか有しておらず、したがって、複数のプロセッサコアがキャッシュから同じ値をロードするときには、有益である。テクスチャキャッシュ624は、定数キャッシュ620よりも待ち時間が大きいが、メモリ読み取りアクセスが不規則であるときには、それほど大きな影響を受けないので、2次元(2D)の空間局所性を有するデータにアクセスするためにもまた有益である。GPUコンピューティングアーキテクチャは、単一命令複数スレッド(SIMT)実行モデルを用いることができる。カーネルのスレッドは、ワープ(warp)と呼ばれる群の中で実行され、この場合のワープは、実行の1単位である。SM内のスカラーSPは、単一の命令ユニットを共有し、ワープのスレッドは、SP上で実行される。ワープのスレッドはすべて同じ命令を実行し、各ワープは、自身のプログラムカウンタを有する。各スレッドは、階層内の異なるレベルでメモリにアクセスすることができ、またスレッドは、プライベートなローカルメモリ空間およびレジスタ空間を有する。スレッドブロック内のスレッドは、共有メモリのスペースを共有することができる。また、GPUの動的ランダムアクセスメモリ(DRAM)は、カーネルのすべてのスレッドによってアクセス可能である。
【0085】
行列ベクトル乗算などの、メモリに結合したアプリケーションの場合、メモリの設置面積の削減、およびメモリアクセス待ち時間によりよく耐える処理戦略の実装など、メモリ性能を最適化することが有利である。スパース行列ベクトル乗算の間接的、かつ不規則なメモリアクセスを取り扱うために、多くの最適化戦略が開発されている。SpMVに固有の最適化は、スパース行列の構造特性に大きく依存しており、問題は、多くの場合、これらの特性は実行時になって初めて分かるものとして定式化される。しかしながら、本開示におけるスパース行列は、実行時以前に分かっている明確に定義された構造から恩恵を受け、またこの構造は、多くのデータセットに対して同じままであることが可能である。これにより問題が単純化され、それによって、性能が向上した解決策が可能になる。スパース重みベクトルを用いると、行列ベクトル乗算は、対応するスパース演算子行列を有するSpMVとしてモデル化することができる。例えば、ゼロ値のベクトル要素だけを乗算する行列要素は、スパース行列を提供するためにゼロに設定することができる。データシンボルXおよび演算子行列にかかわらず、スパース重みベクトルwが事前に決定される場合には、スパース演算子行列の構造特性は、実行時以前に分かっており、ハードウェアおよびソフトウェア加速戦略をより精密に定義することができる。
【0086】
最適なメモリアクセスパターンもまた、計算のためにスレッドがマッピングされるやり方に依存し、関与するスレッドが多くなれば、グローバルメモリアクセスの待ち時間を隠すのに役立つので、グローバルメモリアクセスに関与するスレッドの数にもまた依存する。その結果、メモリアクセスを確実に最適化するために、スレッドマッピングスキームが開発されている。メモリ最適化は、CSR形式に基づいてもよい。また、CSR記憶形式は、GPUアーキテクチャに適するように適合させることができる。
【0087】
いくつかの態様は、同期のない並列処理を活用することができる。1つの行に対応する計算を実行するために1つのスレッドを割り当て、行のセットを取り扱うためにスレッドブロックを割り当てるのとは対照的に、SpMV計算では、行全体にわたって並列処理が利用可能であることにより、1つの行または行のセットに対応する計算をスレッドブロックに分散させることが可能になる。ハーフワープの連続したスレッドが連続した要素にアクセスする場合、グローバルメモリに有用なアクセス戦略は、ハードウェア最適化合体アクセスパターンである。例えば、ハーフワープのスレッドによって要求されたすべてのワードが同じメモリセグメント内にある場合、および、連続したスレッドが連続したワードにアクセスする場合であれば、ハーフワープのすべてのメモリリクエストは、1つのメモリトランザクションに合体される。
【0088】
戦略の1つは、連続したスレッドが行の連続した非ゼロ要素に周期的にアクセスして、これらの非ゼロ要素に対応する部分積を計算するように、1行当たり複数のスレッドをマッピングする。ある行にマッピングされたスレッドは、並列和縮約によって、部分積からその行に対応する出力ベクトル要素を計算することができる。部分積は、スレッドブロック内のスレッドによってのみアクセスされるので、共有メモリに格納することができる。
【0089】
いくつかの技法は、データの局所性を活用し、再利用する。入力ベクトルおよび出力ベクトルは、SpMV計算でのデータ再利用を示す場合がある。出力ベクトル要素の再利用は、スレッドのマッピングが最適化された同期のない並列処理を活用することによって実現することができ、これにより、各出力ベクトル要素に対する部分的な寄与が、確実にある特定のスレッドのセットによってのみ計算され、かつ、最終値が一度だけ書き込まれるようにする。入力ベクトル要素の再利用パターンは、スパース行列の非ゼロアクセスパターンに依存する。
【0090】
スレッド内またはスレッドブロック内のスレッド間での入力ベクトル要素のデータの再利用の活用は、オンチップのメモリ内に要素をキャッシュすることによって実現することができる。オンチップのメモリは、例えば、テクスチャ(ハードウェア)キャッシュ、レジスタ、または共有メモリ(ソフトウェア)キャッシュとすることができる。レジスタまたは共有メモリを利用して入力ベクトル要素をキャッシュすることは、再利用されているベクトルの部分を識別することを含むことができ、これはひいては、スパース行列内で稠密なサブブロックの識別が必要になる。スパース重みベクトルの所定のセットの場合、この情報は既に知られている。スパース行列の前処理を実行して、稠密なサブブロックを抽出することができ、また、GPUアーキテクチャに適した(例えば、きめ細やかなスレッドレベルの並列処理を可能にする)ブロック記憶フォーマットを実装することができる。データシンボルの系列の長さが変わらない場合には、サブブロックサイズは、一定のままである。これにより、SpMV最適化で通常必要とされるような、ブロックサイズおよびブロックインデックスを読み取るためのメモリアクセスペナルティーを回避する。
【0091】
本明細書に記載の技法は、実行のために使用されるスレッドブロック当たりのスレッドの数を変えること、および/または行を取り扱うスレッドの数を変えることなど、同調設定パラメータを含むことができる。高並列処理を実現し、待ち時間の制約を満たすために、SpMVは、複数のバッファを含むことができる。1つの態様では、SpMVは、2つのスパース行列バッファと、2つのポインタバッファと、2つの出力バッファと、を含んでいてもよい。2つのスパース行列バッファは、交互バッファモードでスパース行列係数をバッファするために構成され、2つのポインタバッファは、交互バッファモードでスパース行列の各列の非ゼロ係数開始位置を表すポインタをバッファするために構成され、そして2つの出力バッファは、交互バッファモードで一方の出力バッファが計算結果をバッファするために使用されている間に、もう一方の出力バッファから計算結果を出力するように構成されている。
【0092】
当業者であれば、本明細書の開示に関連して記載されている様々な例示的論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子機器ハードウェア、コンピュータソフトウェア、またはその両方の組み合わせとして実装し得ることをさらに認識するであろう。ハードウェアおよびソフトウェアのこの互換性を明確に説明するために、様々な例示的な構成要素、ブロック、モジュール、回路およびステップが、それらの機能性の観点から大体において上記で説明されている。そのような機能性がハードウェアまたはソフトウェアのどちらとして実装されるのかは、特定のアプリケーションおよびシステム全体に課される設計制約によって決まる。熟練した技術者であれば、それぞれの特定のアプリケーションのために様々なやり方で、記載された機能性を実装することができるが、そのような実装の決定は、本開示の範囲からの逸脱をもたらすものとして解釈されないものとする。
【0093】
本明細書の開示に関連して記載されている様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)もしくは他のプログラマブル論理デバイス、ディスクリートゲートもしくはトランジスタ論理、ディスクリートハードウェア構成要素、または本明細書に記載されている機能を実行するように設計されたこれらの任意の組み合わせにより、実装または実行することができる。汎用プロセッサは、マイクロプロセッサとすることができるが、代替的選択肢では、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械とすることができる。プロセッサは、コンピューティングデバイスの組み合わせ、例えば、DSPおよびマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコアと協働する1つまたは複数のマイクロプロセッサ、または任意の他のそのような構成として実装してもまたよい。
【0094】
本明細書の開示に関連して記載されている方法またはアルゴリズムのステップは、ハードウェアにおいて、プロセッサによって実行されるソフトウェアモジュールにおいて、またはこれら2つの組み合わせにおいて直接具体化することができる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD-ROM、または当技術分野において既知の任意の他の形態の記憶媒体に常駐させることができる。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合されている。代替的選択肢では、記憶媒体は、プロセッサに組み込まれていてもよい。プロセッサおよび記憶媒体は、ASIC内に常駐させてもよい。ASICは、クライアント側、サーバ側、および/または中間デバイスに常駐させてもよい。代替的選択肢では、プロセッサおよび記憶媒体は、ディスクリートコンポーネントとしてクライアント側、サーバ側、および/または中間デバイスに常駐させてもよい。
【0095】
1つまたは複数の例示的な設計では、記載されている機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせにおいて実装することができる。ソフトウェアにおいて実装する場合であれば、諸機能は、1つまたは複数の命令もしくはコードとして、コンピュータ可読媒体に格納してもよいし、コンピュータ可読媒体を介して送信してもよい。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む、コンピュータ記憶媒体および通信媒体の両方を含む。記憶媒体は、汎用または特殊用途コンピュータによってアクセスすることが可能な任意の利用可能な媒体とすることができる。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD-ROMもしくは他の光ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶デバイス、または所望のプログラムコード手段を、命令もしくはデータ構造の形態で搭載または格納するために使用することが可能であり、かつ、汎用もしくは特殊用途コンピュータ、または汎用もしくは特殊用途プロセッサによってアクセスすることが可能な任意の他の媒体を含むことができる。同様に、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、ソフトウェアが、ウェブサイト、サーバ、または他の遠隔したソースから、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無電、およびマイクロ波などのワイヤレス技術を使用して送信される場合には、この同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるものとする。特許請求の範囲を含め本明細書で使用する場合、「のうちの少なくとも1つ(at least one of)」という前置きを付けた項目の列挙で使用される「または(or)」は、選言的な列挙を示しており、例えば、「A、BまたはCのうちの少なくとも1つ」という列挙は、AまたはBまたはCまたはABまたはACまたはBCまたはABC(すなわち、AとBとC)を意味する。
図1A
図1B
図1C
図1D
図2A
図2B
図2C
図2D
図3
図4
図5A
図5B
図5C
図6