特許7208917 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ジェンギスコム　ホールディングス　エルエルシーの特許一覧

特許7208917ＯＦＤＭおよびＭＩＭＯ－ＯＦＤＭのための効率的なピーク対平均電力低減

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
1C
1D
2A
2B
2C
2D
3
4
5A
5B
5C
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-01-11

(45)【発行日】2023-01-19

(54)【発明の名称】ＯＦＤＭおよびＭＩＭＯ－ＯＦＤＭのための効率的なピーク対平均電力低減

(51)【国際特許分類】

H04L 27/26 20060101AFI20230112BHJP

H04B 7/0413 20170101ALI20230112BHJP

【ＦＩ】

H04L27/26 200

H04B7/0413

【請求項の数】 16

(21)【出願番号】P 2019556330

(86)(22)【出願日】2018-07-24

(65)【公表番号】

(43)【公表日】2020-10-01

(86)【国際出願番号】 US2018043573

(87)【国際公開番号】W WO2019023283

(87)【国際公開日】2019-01-31

【審査請求日】2021-06-17

(31)【優先権主張番号】62/536,955

(32)【優先日】2017-07-25

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】518031686

【氏名又は名称】ジェンギスコムホールディングスエルエルシー

【氏名又は名称原語表記】ＧＥＮＧＨＩＳＣＯＭＭＨＯＬＤＩＮＧＳ，ＬＬＣ

【住所又は居所原語表記】Ｐ．Ｏ．Ｂｏｘ１７３５５，Ｂｏｕｌｄｅｒ，ＣＯ８０３０８（ＵＳ）

(74)【代理人】

【識別番号】100169904

【弁理士】

【氏名又は名称】村井康司

(74)【代理人】

【識別番号】100181021

【弁理士】

【氏名又は名称】西尾剛輝

(72)【発明者】

【氏名】スティーヴシャティル

【審査官】吉江一明

(56)【参考文献】

【文献】特開２０１１－２２９０９０（ＪＰ，Ａ）

【文献】特開２００４－１４７１２６（ＪＰ，Ａ）

【文献】特表２０１３－５２１７４１（ＪＰ，Ａ）

【文献】特表２０１７－５３７５１４（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｌ２７／２６

Ｈ０４Ｂ７／０４１３

(57)【特許請求の範囲】

【請求項1】

複数の候補離散時間ＯＦＤＭ信号からピーク対平均電力比（ＰＡＰＲ）が低い信号を選択することによって、離散時間直交周波数分割多元接続（ＯＦＤＭ）信号のＰＡＰＲを低減するための方法であって、
基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間ＯＦＤＭ信号を生成するステップと、
基本離散時間ＯＦＤＭ信号および前記部分更新離散時間ＯＦＤＭ信号を線形結合して、更新された離散時間ＯＦＤＭ信号を発生させるステップと、を含むとともに、前記更新された離散時間ＯＦＤＭ信号が、前記複数の候補離散時間ＯＦＤＭ信号のうちの１つとして指定されている方法。

【請求項2】

前記基本離散時間ＯＦＤＭ信号が、前記基本データシンボル系列に対して稠密な可逆変換演算を実行することによって生成されるか、または、前回更新された離散時間ＯＦＤＭ信号から選択される、請求項１に記載の方法。

【請求項3】

前記スパース可逆変換演算が、スパース逆高速フーリエ変換（ＩＦＦＴ）、ウェーブレットベースの近似ＩＦＦＴ、スパース行列ベクトル乗算、スパース行列スパースベクトル乗算、または行列スパースベクトル乗算のうちの少なくとも１つを含む、請求項１に記載の方法。

【請求項4】

第１の部分更新離散時間ＯＦＤＭ信号を第２の部分更新離散時間ＯＦＤＭ信号と線形結合すること、または前記部分更新離散時間ＯＦＤＭ信号を複素数値スケーリング係数で乗算すること、のうちの少なくとも１つによって、少なくとも１つの追加の部分更新離散時間ＯＦＤＭ信号を生成するステップをさらに含む、請求項１に記載の方法。

【請求項5】

前記スパース可逆変換演算を実行することが、
前記基本データシンボル系列とスパース重み行列との成分ごとの乗算を実行して、スパース更新シンボル系列を生成するステップ、および前記スパース更新シンボル系列に対して可逆変換演算を実行するステップ、
前記スパース重み行列を用いて、稠密な可逆変換演算子内の要素の少なくとも１つのブロックを選択して、スパース可逆変換演算子を生成するステップ、および前記スパース可逆変換演算子を使用して、前記基本データシンボル系列に対して演算するステップ、または、
前記稠密な可逆変換演算子内の要素の少なくとも１つのブロックを選択して、前記スパース可逆変換演算子を生成するステップ、前記基本データシンボル系列内の少なくとも１つの要素を選択して、前記スパース更新シンボル系列を生成するステップ、および前記スパース可逆変換演算子を使用して、前記スパース更新シンボル系列に対して演算するステップ、
のうちの少なくとも１つを含む、請求項１に記載の方法。

【請求項6】

前記スパース可逆変換演算を実行することが、グラフィック処理装置上で実行するように前記スパース可逆変換演算を最適化するステップを含む、請求項１に記載の方法。

【請求項7】

前記ＰＡＰＲが、重みでスケーリングされたＰＡＰＲの合計を含み、各重みが、対応するアンテナまたはノードに対するＰＡＰＲ感受性の尺度を含む、請求項１に記載の方法。

【請求項8】

複数の候補離散時間ＯＦＤＭ信号からピーク対平均電力比（ＰＡＰＲ）が低い信号を選択することによって、離散時間直交周波数分割多元接続（ＯＦＤＭ）信号のＰＡＰＲを低減するための装置であって、
基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間ＯＦＤＭ信号を発生させるための手段と、
基本離散時間ＯＦＤＭ信号および前記部分更新離散時間ＯＦＤＭ信号を線形結合して、更新された離散時間ＯＦＤＭ信号を生成するための手段と、を含むとともに、前記更新された離散時間ＯＦＤＭ信号が、前記複数の候補離散時間ＯＦＤＭ信号のうちの１つとして指定されている装置。

【請求項9】

前記基本離散時間ＯＦＤＭ信号が、前記基本データシンボル系列に対して稠密な可逆変換演算を実行するための手段によって生成されるか、または、前回更新された離散時間ＯＦＤＭ信号から選択される、請求項８に記載の装置。

【請求項10】

前記スパース可逆変換演算が、スパース逆高速フーリエ変換（ＩＦＦＴ）、ウェーブレットベースの近似ＩＦＦＴ、スパース行列ベクトル乗算、スパース行列スパースベクトル乗算、または行列スパースベクトル乗算のうちの少なくとも１つを含む、請求項８に記載の装置。

【請求項11】

第１の部分更新離散時間ＯＦＤＭ信号を第２の部分更新離散時間ＯＦＤＭ信号と線形結合すること、または前記部分更新離散時間ＯＦＤＭ信号を複素数値スケーリング係数で乗算すること、のうちの少なくとも１つによって、少なくとも１つの追加の部分更新離散時間ＯＦＤＭ信号を生成するための手段をさらに備える、請求項８に記載の装置。

【請求項12】

前記部分更新離散時間ＯＦＤＭ信号を生成するための手段が、
前記基本データシンボル系列とスパース重み行列との成分ごとの乗算を実行して、スパース更新シンボル系列を生成するステップ、および前記スパース更新シンボル系列に対して可逆変換演算を実行するステップ、
前記スパース重み行列を用いて、稠密な可逆変換演算子内の要素の少なくとも１つのブロックを選択して、スパース可逆変換演算子を生成するステップ、および前記スパース可逆変換演算子を使用して、前記基本データシンボル系列に対して演算するステップ、または、
前記稠密な可逆変換演算子内の要素の少なくとも１つのブロックを選択して、前記スパース可逆変換演算子を生成するステップ、前記基本データシンボル系列内の少なくとも１つの要素を選択して、前記スパース更新シンボル系列を生成するステップ、および前記スパース可逆変換演算子を使用して、前記スパース更新シンボル系列に対して演算するステップ、
のうちの少なくとも１つのために構成されている、請求項８に記載の装置。

【請求項13】

前記ＰＡＰＲが、重みでスケーリングされたＰＡＰＲの合計を含み、各重みが、対応するアンテナまたはノードに対するＰＡＰＲ感受性の尺度を含む、請求項８に記載の装置。

【請求項14】

ワイヤレス通信のためのコンピュータプログラムであって、請求項１～７のいずれか一項に記載の前記ステップを行うための命令を含むコンピュータプログラム。

【請求項15】

候補離散時間信号のセットからピーク対平均電力比（ＰＡＰＲ）が低い信号を選択することによって、離散時間信号のＰＡＰＲを低減するための装置であって、
メモリと、
前記メモリに動作可能に結合された１つまたは複数のプロセッサであって、
基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間信号を生成するように構成され、かつ、
基本離散時間信号および前記部分更新離散時間信号を線形結合して、更新された離散時間信号であって、候補離散時間信号の前記セットに含まれている更新された離散時間信号を発生させるように構成された１つまたは複数のプロセッサと、
を備える装置。

【請求項16】

候補離散時間信号のセットからピーク対平均電力比（ＰＡＰＲ）が低い信号を選択することによって、離散時間信号のＰＡＰＲを低減するための１つまたは複数の命令を格納する非一時的なコンピュータ可読媒体であって、前記１つまたは複数の命令が、１つまたは複数のプロセッサによって実行されると、前記１つまたは複数のプロセッサに、
基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間信号を生成させ、かつ、
基本離散時間信号および前記部分更新離散時間信号を線形結合して、更新された離散時間信号であって、候補離散時間信号の前記セットに含まれている更新された離散時間信号を発生させる、非一時的なコンピュータ可読媒体。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０１７年７月２５日に出願された米国仮特許願第６２／５３６，９５５号明細書に対する優先権を主張するものであり、その内容全体が参照によって本明細書に組み込まれる。

【0002】

以下は、概して、ワイヤレス通信に関し、より具体的には、プリコーディングマルチキャリア波形に関する。

【背景技術】

【0003】

ワイヤレス通信システムは、電話通信、ビデオ、データ、メッセージ伝達、および放送などの様々な電気通信サービスを提供するために広く展開されている。典型的なワイヤレス通信システムは、利用可能なシステムリソース（例えば、帯域幅、送信電力等々）を共有することにより、複数のユーザとの通信をサポートすることが可能な多元接続技術を用いる場合がある。このような多元接続技術の例は、符号分割多元接続（ＣＤＭＡ）システム、時分割多元接続（ＴＤＭＡ）システム、周波数分割多元接続（ＦＤＭＡ）システム、直交周波数分割多元接続（ＯＦＤＭＡ）システム、シングルキャリア周波数分割多元接続（ＳＣ－ＦＤＭＡ）システム、および時分割同期符号分割多元接続（ＴＤ－ＳＣＤＭＡ）システムを含む。

【0004】

これらの多元接続技術は、様々な電気通信およびワイヤレスネットワーキング規格に採用され、異なるワイヤレスデバイスの通信を可能にする共通のプロトコルを提供してきた。電気通信規格の一例が、ロングタームエボリューション（ＬＴＥ）である。ＬＴＥは、スペクトル効率を向上させ、コストを削減し、サービスを向上させ、新たなスペクトルを使用することによって、ならびにＯＦＤＭＡをダウンリンク（ＤＬ）上で使用して、ＳＣ－ＦＤＭＡをアップリンク（ＵＬ）上で使用して、および多入力多出力（ＭＩＭＯ）アンテナ技術を使用して他のオープンスタンダードと統合することによって、モバイル広帯域インターネットアクセスをより良好にサポートするように設計された、ユニバーサル移動体電気通信システム（ＵＭＴＳ）移動規格に対する一連の増強である。

【0005】

ワイヤレス通信ネットワークは、様々なタイプの複数のユーザ機器デバイス（ＵＥ）および／またはアクセスターミナルのための通信をサポートすることが可能な複数の基地局を含む場合がある。ＵＥは、ダウンリンクおよびアップリンクを介して基地局と通信することができる。ダウンリンク（または下りリンク）とは、基地局からＵＥへの通信リンクを指し、アップリンク（または上りリンク）とは、ＵＥから基地局への通信リンクを指す。

【発明の概要】

【発明が解決しようとする課題】

【0006】

本開示の追加の特徴および利点を以下で説明する。当業者は、本開示の同じ目的を実行するための他の構造を修正、または設計するための基礎として、本開示を容易に利用し得ることを認識されたい。当業者は、そのような等価な構造は、添付の特許請求の範囲に記載されている本開示の教示から逸脱するものではないこともまた理解されたい。本開示の特性であると考えられる新規な特徴は、その編成および動作方法の両方に関して、添付の図面に関連して考慮すると、さらなる目的および利点とともに以下の説明から一層よく理解されるであろう。しかしながら、図面はそれぞれ、図解および説明目的のみで提供され、本開示の範囲を定義することを意図するものではないことが明らかに理解されるであろう。

【課題を解決するための手段】

【0007】

本明細書に開示されている態様は、候補シンボル系列に対する部分更新を活用して、ＯＦＤＭ信号のピーク対平均電力比（ＰＡＰＲ）の計算上効率的な低減を可能にする。これは、ＭＩＭＯ－ＯＦＤＭ、拡散－ＯＦＤＭ、ＳＣ－ＦＤＭＡ、およびＯＦＤＭＡ信号を含む（が、それらに限定されない）、様々な型のＯＦＤＭ信号に適用可能である。ＭＩＭＯ－ＯＦＤＭでは、ＰＡＰＲベースのメトリックは、Ｎ_ｔ個すべてのＭＩＭＯ送信機、または送信機の所定のサブセット（Ｎ_ｓ＜Ｎ_ｔ）にわたってＰＡＰＲ測定値を考慮に入れることが可能である。パラメータ選択（例えば、選択的マッピング（ＳＬＭ）シンボル、拡散コード、スクランブリング系列、ダミーデータシンボル、ＰＡＰＲ低減シンボルのためのサブチャネルのスケジューリング等々）は、計算された「最良な」ＰＡＰＲベースのメトリックに対応して選択することができる。各送信機またはアンテナへのＰＡＰＲの対応を、対応するＰＡＰＲ感受性のスケーリング係数によって重み付けして、ＰＡＰＲベースのメトリックを作成することができる。送信機および／またはアンテナのスケジューリングは、少なくとも１つの送信機を有する分散型ＭＩＭＯアンテナアレイ、またはＰＡＰＲ感受性が低いアンテナを設けて、良好なＰＡＰＲベースのメトリックを発見するという最適化問題に対する少なくとも１つの追加の自由度を提供するように構成することができる。

【0008】

本明細書に開示されている態様は、データ非依存の更新スケジュール、データ依存の更新スケジュール、およびそれらの組み合わせを含むことができる。データ依存の更新スケジュールは、場合によっては（例えば、静止信号の場合）、データ非依存の更新スケジュールを有するアルゴリズムよりも収束が速いことがある。パラメータを更新するためのステップサイズを選択して、収束および／または安定性を向上させることができる。ステップサイズは、１つまたは複数の測定基準に基づいて一定である場合もあれば、可変である場合もある。いくつかの態様では、ステップサイズに関する条件は、平均および２乗平均の意味での収束をもたらすように導出される。

【0009】

いくつかの態様では、データ非依存の更新スケジュールにおいて更新されるパラメータは、無作為に選ばれる。態様は、確率的部分更新アルゴリズムを用いる場合がある。１つの例では、更新されるパラメータは、パラメータのセットの合計の複数のサブセットに区分され、次に、サブセットは各反復において更新されるように無作為に選択される。いくつかの態様では、各反復において更新されるパラメータの所定のスケジュールが提供される。

【0010】

本明細書で用いられる部分更新アルゴリズムは、計算の回数を減らし、かつ、増加したプログラムおよびデータメモリのためのコストを考慮に入れるように構成することができる。例えば、実行サイクルの回数を減らすと、中間ステップでデータを格納するのに必要になる追加のサイクルによって相殺される場合もあり得る。アルゴリズムによって最適化される処理メトリックは、これらのコストの任意の組み合わせを含むことができる。行列ベクトル乗算は、メモリに結合したアプリケーションカーネルであるが、本明細書に開示されている態様は、離散時間ＯＦＤＭ信号に適合された部分更新方法をもたらし、これにより、候補離散時間信号の生成が、スパース（ｓｐａｒｓｅ）処理演算に使用される最適化解から恩恵を受けることが可能になる。例えば、スパース行列および／またはベクトル乗算では、ＧＰＵアーキテクチャは、グローバルメモリアクセスを最適化し、共有メモリアクセスを最適化し、かつ／または、再利用および並列処理を活用するために構成することができる。他の最適化は、実行に使用されるスレッドブロックごとに複数のスレッドを変更すること、行を取り扱う複数のスレッドを変更することなどの、設定パラメータの調整をもたらす。

【0011】

一般的な技法は、稠密な（ｄｅｎｓｅ）サブブロックを識別し、抽出する、スパース行列ベクトル乗算の実行時の前処理から始まる。しかしながら、本明細書の部分更新技法に開示されているスパース行列は、実行時以前に知られている明確に定義された構造を有し、これにより、前処理だけでなく後続処理も単純化することができる。

【0012】

１つの態様では、｛ｘ_ｎ，ｕ｝は、入力データ系列であるとし、｛ｗ_ｎ，ｕ｝は、長さＮの適応フィルタの係数を表示するとする。
Ｗ_ｕ＝［Ｗ_１，ｕＷ_２，ｕ．．．Ｗ_Ｎ，ｕ］^Ｔ
Ｘ_ｕ＝［Ｘ_１ｕＸ_２，ｕ．．．Ｘ_Ｎ，ｕ］^Ｔ
ここで、上記で定義された項は、瞬間ｕに対するものであり、（）^Ｔは、転置演算子を表示する。問題は、ＰＡＰＲが最も低いＯＦＤＭ信号を得るようにＸ_ｕおよび／またはｗ_ｕを選択することである。いくつかのＳＬＭの態様では、複数の候補シンボル系列Ｘ_ｕを提供することが可能である。ＳＬＭは、入力データシンボル系列Ｘを、位相回転行列または他の複素数値行列ｗ_ｕで乗算することによって達成することができる。シンボル系列Ｙ_ｕ＝ｗ_ｕＸを生成することが可能であり、式中、ｗ_ｕは、第ｕ^ｔｈの候補位相回転行列である。

【0013】

位相最適化が信号サブブロックの最適な組み合わせを求める、部分系列送信（ＰＴＳ：ＰａｒｔｉａｌＴｒａｎｓｍｉｔＳｅｑｕｅｎｃｅ）スキームを使用してもよい。重み値ｗ_ｕは、重みコードブック内の候補位相系列から選択可能とすることができる。いくつかの態様では、ダミー系列挿入（ＤＳＩ：ＤｕｍｍｙＳｅｑｕｅｎｃｅＩｎｓｅｒｔｉｏｎ）が用いられる。重み行列ｗ_ｕは、リソースブロック内および／またはレイヤ内でダミーシンボルを適合させることなどによって、ダミーシンボル挿入を提供することができる。ダミーシンボル挿入は、通信に用いられる信号空間と直交する空間サブチャネル、または信号空間射影のような、ＰＡＰＲ低減のために割り当てられたサブチャネルを用いてもよい。前述したＰＡＰＲ低減技法の組み合わせ、例えばＤＳＩおよびＰＴＳスキームの組み合わせなどを用いることができる。他の組み合わせを用いることも可能である。

【0014】

ＯＦＤＭ変調では、Ｎ個データシンボルからなるブロック（１つのＯＦＤＭシンボル），｛ｘ_ｎ，ｎ＝１，．．．，Ｎ｝は、各シンボルがセット｛ｆ_ｎ，ｎ＝０，１，．．．，Ｎ｝とは異なる副搬送波を変調するように、並列して送信される。Ｎ個の副搬送波は直交、すなわち、ｆ_ｎ＝ｎ△ｆであり、式中、△ｆ＝１／ＮＴであり、Ｔはシンボル期間である。送信されたＯＦＤＭ信号の複素包絡は次式：

【数1】

（式中、０≦ｔ≦ＮＴであり、Ｘ_ｎは重み項を含むことができる）のように示される。

【0015】

送信されたＯＦＤＭ信号のＰＡＰＲは、次式

【数2】

（式中、Ｅ［］は、期待値を表示する。相補累積分布関数（ＣＣＤＦ：ＣｏｍｐｌｅｍｅｎｔａｒｙＣｕｍｕｌａｔｉｖｅＤｉｓｔｒｉｂｕｔｉｏｎＦｕｎｃｔｉｏｎ）は、ＰＡＰＲ低減に最もよく使用される性能評価尺度のうちの１つであり、ＯＦＤＭシンボルのＰＡＰＲが所与の閾値ＰＡＰＲ_０を超過する確率を表し、これは、ＣＣＤＦ＝Ｐｒ（ＰＡＰＲ＞ＰＡＰＲ_０）として表示される。他のＰＡＰＲ性能評価尺度、例えば、ピーク振幅、波高因子、または成形利得に関して標準化されたＰＡＰＲなどを使用してもよい。ＰＡＰＲの低減により、同じハードウェアで１秒当たりにより多くのビットを送信するか、または、低電力および／または安価なハードウェアで１秒当たりに同じビットを送信するか、のいずれかが可能なシステムが得られる）から計算することができる。

【0016】

ＰＡＰＲが最小であるＯＦＤＭ信号を生み出すプリコーディングされたデータベクトルを発見するという最適化問題は、組み合せの最適化問題と見なすことができる。部分最適技法は、探索の複雑性の大幅な低減を実現しつつ、ＰＡＰＲの許容可能な低減をもたらす重みｗを導出する。部分更新は、この技法の有利なバージョンを提供することが可能である。

【0017】

ＳＬＭでは、アプローチの１つは、候補系列の平均シンボル電力の共分散を最小限にするために、それぞれの反復ごとに候補シンボル系列内のすべてのシンボルを変更することである。１対の候補シンボル系列のゼロ共分散は、それらが相互に独立していることを示す。これは、Ｕ個のサンプルを解空間にわたって広く分布させる。本開示のいくつかの態様では、重み系列は、位相シフトに加えて、振幅変動をもたらし、これにより、位相シフトだけの場合よりも候補系列間の平均シンボル電力の共分散を低減することができる。これらの振幅変動は、候補系列間のシンボル変更を減らすことができる一方で、共分散値は同じになり（、または良くなり）、これにより、全（すなわち、稠密な）重み行列の代わりにスパース（例えば、部分更新）重み行列を使用することが可能になる。これにより、スパース可逆変換演算を使用することもまた可能になる。スパース行列を用いて、変換および乗算などの演算を実行する場合、メモリ空間および処理時間を節約するために、非ゼロ要素だけを格納することが有利な場合がある。非常に効率的の良いメモリアクセスパターンを提供するスパース演算最適化が開発されており、本明細書に開示されている新規性により、ＳＬＭおよび他のＰＡＰＲ低減技法のためのそのような最適化が可能になる。

【0018】

解空間の反復サンプリングでは、ＰＡＰＲ測定値は、候補シンボル系列のその後の選択を導くことができる。これは、部分更新が特に有用なところである。多くの反復技法では、後続のサンプルは前のサンプルに近く、したがって、系列間の平均シンボル電力の少なくともある程度の共分散が望まれる。このアプローチは解空間を適応的に探索し、グローバルまたはローカルの「最良」解に速やかに収束することができる。この場合、解空間のサンプルは、グローバルまたはローカルの最良解の近くでクラスタ状になる傾向がある。反復更新では、代替的シンボル系列が少なくとも幾分か相関していることが有用な場合がある。これにより、前の更新のＰＡＰＲ測定値に基づいて次の更新を決定することが可能になる。例えば、これは、どの重み値を更新するべきか、ならびに、ＰＡＰＲをさらに低減する可能性がある更新の大きさおよび／または位相を決定することができる。これにより、許容可能な、または最良のＰＡＰＲへの収束を促進することができる。開示されている態様では、重みｗ_ｕはデータ系列Ｘに依存する必要はない。さらに、重みｗ_ｕは、更新されるシンボルをＸのシンボルコンステレーションに制約する必要はない。

【0019】

従来のＳＬＭでは、追加の候補シンボル系列には、全（稠密な）変換、および／または全（稠密な）行列乗算が必要である。そのような稠密な演算の回数は、候補系列の数Ｕとともに増加するが、一方、部分更新方法では、後続の候補系列は、計算複雑性が低減された演算をもたらすことが可能である。稠密な変換は、ＩＦＦＴのような高速変換技法を用いることができ、稠密な行列乗算は、一般化行列乗算（ＧＥＭＭ）技法のうちのいずれかを用いることができる。部分更新は、ＩＦＦＴをスパースＩＦＦＴアルゴリズムに置き換えることができる。スパースＩＦＦＴアルゴリズムは、入力信号のサブセットに対してのみ演算するので、すべての周波数の値を計算する必要はない。この特性を活用することによって、周波数のサブセットだけが計算され、したがって、ＩＦＦＴの計算複雑性が激減する。同様に、ウェーブレットベースの近似ＩＦＦＴは、スパース入力を活用して、従来のＩＦＦＴよりも効率的に演算することができる。部分更新は、ＧＥＭＭを、スパース行列ベクトル乗算（ＳｐＭＶ）、スパース行列スパースベクトル乗算（ＳｐＭＳｐＶ）、ならびにＧＰＵおよびＣＰＵアーキテクチャ用に最適化されている行列スパースベクトル乗算技法を含む、多種多様なスパース行列乗算技法に置き換えることができる。本開示の態様に従って、稠密な変換、または稠密な乗算の回数は、コンステレーションサイズおよび候補信号の数Ｕに依存しないものとすることができる。

【0020】

いくつかの態様では、クライアント側デバイス、中間デバイス、またはサーバ側デバイスによって実行される方法は、複数の候補離散時間信号を含むセットからＰＡＰＲが低い信号を選択することによって、離散時間信号のＰＡＰＲを低減する。方法は、基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間信号を生成するステップと、基本離散時間信号および部分更新離散時間信号を線形結合して、更新された離散時間信号を発生させるステップと、を含むことができる。更新された離散時間信号は、候補離散時間信号のセットに含まれる。基本離散時間信号は、基本データシンボル系列に対して稠密な可逆変換演算を実行することによって生成してもよいし、あるいは、前の更新された離散時間信号から選択してもよい。スパース可逆変換演算は、スパースＩＦＦＴ、ウェーブレットベースの近似ＩＦＦＴ、スパース行列ベクトル乗算、スパース行列スパースベクトル乗算、または行列スパースベクトル乗算のうちの少なくとも１つとすることができる。少なくとも１つの追加の部分更新離散時間信号は、第１の部分更新離散時間信号を第２の部分更新離散時間信号と線形結合すること、または部分更新離散時間信号を複素数値スケーリング係数で乗算すること、のうちの少なくとも１つによって生成することができる。本明細書に開示されている方法は、ＧＰＵまたはＣＰＵ上で実行するように最適化することができる。

【0021】

１つの態様では、スパース可逆変換演算は、基本シンボル系列とスパース重み行列との成分ごとの乗算を実行して、スパース更新シンボル系列を生成するステップと、このスパース更新シンボル系列に対して可逆変換演算を実行するステップと、を含むことができる。別の態様では、スパース可逆変換演算は、スパース重み行列を用いて、稠密な可逆変換演算子内の要素の少なくとも１つのブロックを選択してスパース可逆変換演算子を生成するステップと、このスパース可逆変換演算子を使用して、基本シンボル系列に対して演算するステップと、を含むことができる。さらに別の態様では、スパース可逆変換演算は、稠密な可逆変換演算子内の要素の少なくとも１つのブロックを選択して、スパース可逆変換演算子を生成するステップと、基本シンボル系列内の少なくとも１つの要素を選択して、スパース更新シンボル系列を生成するステップと、スパース可逆変換演算子を使用して、スパース更新シンボル系列に対して演算するステップと、を含むことができる。

【0022】

いくつかの態様では、装置は、基本データシンボル系列に対してスパース可逆変換演算を実行することによって、部分更新離散時間信号を生成するための手段と、基本離散時間信号および部分更新離散時間信号を線形結合して、更新された離散時間信号を発生させるための手段と、を含むことができる。この装置は、第１の部分更新離散時間ＯＦＤＭ信号を第２の部分更新離散時間ＯＦＤＭ信号と線形結合すること、または部分更新離散時間ＯＦＤＭ信号を複素数値スケーリング係数で乗算すること、のうちの少なくとも１つによって、少なくとも１つの追加の部分更新離散時間ＯＦＤＭ信号を生成するための手段をさらに含むことができる。

【0023】

本明細書に開示されている態様またはその要素は、本明細書に記載の方法ステップのうちの１つまたは複数を行うための手段であって、（ｉ）ハードウェアモジュール、（ｉｉ）ソフトウェアモジュール、または、（ｉｉｉ）ハードウェアモジュールおよびソフトウェアモジュールの組み合わせ、を含み得る手段の形で、実施することが可能であり、（ｉ）～（ｉｉｉ）のうちのいずれかが、本明細書に記載されている特定の技法を実施し、ソフトウェアモジュールが有形のコンピュータ可読記憶媒体（または複数のそのような媒体）に格納されている。諸態様は概して、添付の図面に関して本明細書に実質的に記載されているような、また、添付の図面によって図示されているような方法、装置、システム、コンピュータプログラム製品、非一時的なコンピュータ可読媒体、ユーザ機器、ワイヤレス通信デバイス、および処理システムを含む。

【0024】

本開示の特徴、性質、および利点は、以下に記載されている図面と併せて解釈すると、下記の詳細な説明からより一層明らかになるであろう。図面および詳細な説明全体にわたって、図面の１つまたは複数の中に現れる同様の要素を識別するために、同様の参照符号を使用する場合がある。

【図面の簡単な説明】

【0025】

【図1A-1D】本開示の様々な態様に従う送信機の例を図示する図である。

【図2A-2D】本開示の様々な態様に従う受信器の例を図示する図である。

【図3】本開示の様々な態様に従うマルチアンテナシステム内のＰＡＰＲ低減を描く図である。

【図4】本開示の様々な態様に従うＰＡＰＲ低減のための重み選択の例を図示する図である。

【図5A】本開示の様々な態様に従う例示的な重み選択器を図示する図である。

【図5B-5C】本開示の様々な態様に従うＰＡＰＲを低減するための方法を図示する図である。

【図6】本開示の様々な態様に従う、信号処理機能のために最適化することが可能なＧＰＵアーキテクチャを図示する図である。

【発明を実施するための形態】

【0026】

１つの態様に記載されている要素は、具体的な詳述なしに、他の態様に対して有用に利用し得ることが企図される。

【0027】

以下に記載されている詳細な説明は、添付の図面に関連して、様々な構成の説明として意図されており、本明細書に記載の概念を実践し得る唯一の構成を表すようには意図されていない。詳細な説明は、様々な概念の十分な理解を提供する目的で、具体的な詳細を含む。しかしながら、当業者には、これらの概念がこれらの具体的な詳細なしで実践し得ることは明白であろう。いくつかの事例では、よく知られている構造および構成要素がそのような概念を不明瞭にしないように、ブロック図の形式で示されている。

【0028】

電気通信システムの諸態様が、様々な装置および方法に関連して提示されている。これらの装置および方法は、以下の詳細な説明に記載され、様々なブロック、モジュール、構成要素、回路、ステップ、処理、アルゴリズム等々（総称して「要素」と呼ばれる）によって添付の図面中に図示されている。これらの要素は、電子機器ハードウェア、コンピュータソフトウェア、またはそれらの任意の組み合わせを使用して実装することができる。そのような要素がハードウェアとして実装されるのか、またはソフトウェアとして実装されるのかは、特定のアプリケーションおよびシステム全体に課される設計制約によって決まる。

【0029】

例として、ある要素、もしくは要素の任意の部分、または要素の任意の組み合わせは、１つまたは複数のプロセッサを含む「処理システム」によって実装することができる。プロセッサの例は、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ（ＤＳＰ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、プログラマブル論理デバイス（ＰＬＤ）、状態機械、ゲート制御論理、ディスクリートハードウェア回路、および本開示全体にわたって記載されている様々な機能性を実行するように構成された他の適切なハードウェアを含む。処理システム内の１つまたは複数のプロセッサが、ソフトウェアを実行することができる。ソフトウェアは、ソフトウェアと呼ばれるか、ファームウェアと呼ばれるか、ミドルウェアと呼ばれるか、マイクロコードと呼ばれるか、ハードウェア記述言語と呼ばれるか、またはそれ以外の名称で呼ばれるかに関わらず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行ファイル、実行のスレッド、プロシージャ、機能等々を意味するように広く解釈されるものとする。

【0030】

それに応じて、１つまたは複数の例示的な実施形態では、記載されている機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせにおいて実装することができる。ソフトウェアに実装するのであれば、機能は、非一時的コンピュータ可読能媒体上に格納するか、１つまたは複数の命令もしくはコードとして符号化することができる。コンピュータ可読媒体は、コンピュータ記憶媒体を含む。記憶媒体は、コンピュータによってアクセスすることが可能な任意の利用可能な媒体とすることができる。限定ではなく例として、そのようなコンピュータ可読媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭもしくは他の光学ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶装置、または命令もしくはデータ構造の形式で所望のプログラムコードを搭載または格納するために使用することが可能であり、かつ、コンピュータによってアクセスすることが可能な任意の他の媒体を含む場合がある。

【0031】

本明細書では特定の態様が記載されているが、これらの態様の多くの変形および置換は本開示の範囲内にある。好適な態様の利益および利点がいくつか言及されているが、本開示の範囲は特定の利益、使用、または目的に限定されるようには意図されていない。むしろ、本開示の態様は、様々なワイヤレス技術、システム構成、ネットワーク、および送信プロトコルに広く適用可能であるように意図され、それらのうちのいくつかが、図面および以下の説明において例として図示されている。詳細な説明および図面は、本開示を限定するものというよりも、むしろ、単に例示するものにすぎず、本開示の範囲は添付の特許請求の範囲およびその均等物によって定義されている。

【0032】

図１Ａは、ＳＬＭプリコーディングが適用されるデータを送信するための送信機の概略的な構成を図示するブロック図である。送信機は、ベースバンドデータプロセッサ１０１と、ＳＬＭプリコーダ１０２と、変換プリコーダ１０３と、空間マッパ（ｍａｐｐｅｒ）１０４と、多入力多出力（ＭＩＭＯ）プリコーダ１０５と、副搬送波マッパ１０６と、逆ＤＦＴ（ＩＤＦＴ）モジュール１０７と、サイクリックプレフィックス（ＣＰ）アペンダ（ａｐｐｅｎｄｅｒ）１０８と、デジタルアナログ変換器／無線周波数（ＤＡＣ／ＲＦ）モジュール１０９と、を含む。

【0033】

ベースバンドデータプロセッサ１０１は、（例えば、変調シンボルに変換されたビット系列を含む）元のデータシンボルをＳＬＭプリコーダ１０２に結合し、これにより、離散時間ＯＦＤＭ送信信号のＰＡＰＲを低減するＳＬＭの重みを選択し、それらの選択された重みを元のデータシンボルに適用する。例えば、ＳＬＭプリコーダ１０２は、元のデータシンボルに適用されると、ＰＡＰＲ値が最小である離散時間ＯＦＤＭ信号が得られるように、候補重み行列のセットから重み行列を選択し、次に、元のデータシンボルで成分ごとに乗算された選択された重み行列を含む、重み付けされたデータセットを出力することができる。ＳＬＭプリコーダ１０２は、各候補重み行列に対応する各離散時間ＯＦＤＭ信号のＰＡＰＲを計算し、このＰＡＰＲを閾値と比較し、次に、閾値を下回るＰＡＰＲを提供する重み行列を選択することができる。ＳＬＭプリコーダ１０２は、成分ごとに元のデータシンボルで乗算された、選択された重み行列を含む重み付けされたデータセットを出力する。

【0034】

変換プリコーダ１０３は、重み付けされたデータセットに対して変換プリコーディングを実行する。変換プリコーダ１０３は、１つまたは複数のＤＦＴモジュールを備えるＳＣ－ＦＤＭＡプリコーダとすることができる。ＭポイントＤＦＴの場合には、Ｍ個の入力サンプルからなるブロックが、周波数領域シンボルに変換される。空間マッパ１０４は、元のデータシンボルの少なくとも１つのソースを複数のアンテナに割り当てる。それぞれのアンテナ（ポート）にデータをマッピングすることは、空間マッピングと呼ばれる。空間マッパ１０４は、レイヤマッパと呼ばれる場合がある。ＭＩＭＯプリコーダ１０５は、チャネル状態情報（ＣＳＩ）から計算された空間多重化重み、またはコードブックから検索されたＭＩＭＯ重みなどの空間プリコーディング行列を適用する。例えば、ＭＩＭＯプリコーダ１０５は、空間（またはレイヤ）マッパ１０４によって出力された複数のレイヤに対してプリコーディングを実行する。副搬送波マッパ１０６は、プリコーディングされたデータを適切な（例えば、スケジューリングされた）副搬送波にマッピングする。副搬送波マッパ１０６は、リソース要素マッパと呼ばれる場合がある。副搬送波マッパ１０６は、複数の副搬送波マッパモジュール、例えば、各レイヤまたはアンテナごとに１つの副搬送波マッパモジュールを備えることができる。ＩＤＦＴモジュール１０７は、マッピングされた周波数領域シンボルを離散時間ＯＦＤＭ信号に変換する。ＩＤＦＴモジュール１０７は、各レイヤまたはアンテナごとに別個のＩＤＦＴを備えてもよい。ＩＤＦＴモジュール１０７は、オーバーサンプリングされたＩＤＦＴを提供することができる。ＣＰアペンダ１０８は、ＣＰを各離散時間ＯＦＤＭ信号に加える。ＤＡＣ／ＲＦモジュール１０９は、デジタル信号をアナログに変換し、無線チャネルでアナログ信号を送信する。

【0035】

図１Ｂでは、ＳＬＭプリコーダ１０２は変換プリコーダ１０３に続き、したがってＳＬＭ重みを選択し、変換プリコーディングされたシンボルに適用する。図１Ｃでは、ＳＬＭプリコーダ１０２は空間マッパ１０４に続き、したがってＳＬＭ重みを選択し、空間マッピングされたシンボルに適用する。ＳＬＭプリコーダ１０２は、複数のＳＬＭプリコーダモジュール、各レイヤまたはアンテナにつき１つのＳＬＭプリコーダモジュールを備えてもよい。分散型アンテナシステムでは、ＳＬＭプリコーダ１０２が空間マッパ１０４から下流に配置されている場合には、各無線アクセスネットワークノード上、または分散型アンテナシステムの各アンテナ上に、ＳＬＭプリコーダモジュールを常駐させてもよい。図１Ｄでは、ＳＬＭプリコーダ１０２はＭＩＭＯプリコーダ１０５に続き、したがってＳＬＭ重みを選択し、ＭＩＭＯプリコーディングされたシンボルに適用する。

【0036】

いくつかの送信機構成では、送信機チェーン内の異なる場所に位置決めされた複数のＳＬＭプリコーダのような、２つ以上のＳＬＭプリコーダ１０２を設けることができる。本明細書に開示されている送信機構成では、図面に描かれているブロックのうちのいくつかは任意とすることができる。例えば、変換プリコーダ１０３は任意とすることができる。空間マッパ１０４およびＭＩＭＯプリコーダ１０５は、任意とすることができる。いくつかの態様では、送信機は、変換プリコーダ１０３、空間マッパ１０４、およびＭＩＭＯプリコーダ１０５なしで設けられる。本発明の態様に従って、本明細書には明示的に描かれていない送信機ブロックを含む送信機構成を提供し得ることもまた認識されたい。本発明において用いられる送信機は、符号化、ビットシフト、拡散、スクランブル、および／またはインタリーブブロックを含むことができ、ＳＬＭプリコーダ１０２の演算は、そのような符号化、ビットシフト、拡散、スクランブル、および／またはインタリーブに対応しつつ、その機能を相応に実行するように構成することが可能である。送信機は、１つまたは複数の追加的または代替的な可逆変換演算を含むことができ、その演算を本明細書に開示されているように実行するように、ＳＬＭプリコーダ１０２を相応に適合させることができる。

【0037】

図２Ａを参照すると、本発明の態様を実装することが可能な受信機は、ＲＦ／ＡＤＣモジュール２０１と、ＣＰ除去器２０２と、ＤＦＴモジュール２０３と、チャネル推定器／等化器２０４と、副搬送波デマッパ（ｄｅｍａｐｐｅｒ）２０５と、空間デマルチプレクサ２０６と、変換復号器２０７と、ＳＬＭ復号器２０８と、データシンボル推定器２０９と、を備える。

【0038】

ＲＦ／ＡＤＣモジュール２０１は、受信無線信号を受信し、デジタルベースバンド信号に変換する。ＣＰ除去器２０２は、各受信離散時間ＯＦＤＭ信号のＣＰを除去する。ＤＦＴモジュール２０３は、離散時間ＯＦＤＭ信号を周波数領域シンボルに変換（例えば、復調）する。チャネル推定器／等化器２０４は、伝播チャネルを推定（例えば、ＣＳＩを導出）し、周波数領域等化を実行する。副搬送波デマッパ２０５は、周波数領域データを、（様々なスケジューリングされた送信チャンネルに対応する場合がある）副搬送波データに分離する。空間デマルチプレクサ（ｄｅ－ＭＵＸ）２０６は任意に設けられ、送信されたデータに適用されたプリコーディングに基づき、データに対するすべての復号化を実行する。例えば、空間ｄｅ－ＭＵＸ２０６内の復号器は、送信機と受信機とによって共有されているコードブックインデックスを用いて、復号化行列を選択することができる。空間ｄｅ－ＭＵＸ２０６は、空間逆多重化を実行して、アンテナ当たりのデータを区別することができる。変換復号器２０７は、データに対して変換復号化を実行する。例えば、変換プリコーダ１０３がＤＦＴモジュールを含むのであれば、変換復号器２０７は、ＩＤＦＴモジュールを含む。変換復号化されたデータシンボルは、ＳＬＭ復号器２０８によって処理され、これにより、受信データシンボルからＳＬＭ重みを除去する。

【0039】

ＳＬＭ復号器２０８は、送信機内のＳＬＭプリコーダ１０２によって用いられる、選択された重み行列に対応するインデックス（場合によってはコードブックインデックス）を受信することができる。例えば、インデックスは、受信信号中のシンドロームから導出されるか、またはそれ以外の方法で受信機に伝達される、制御チャネル（例えば、物理的アップリンク制御チャネルまたは物理的アップリンク共有チャネル）内のサイド情報として、送信することができる。ＳＬＭ復号器２０８は、選択された重み行列を盲目的に決定することができる。いくつかの態様では、ＳＬＭ復号器２０８は、様々な実現可能なコードまたはコードセグメントを使用して、このＳＬＭ復号器が選択された重み行列を識別するまで復号化を実行する。ＳＬＭプリコーダ１０２および復号器２０８は、直交ＳＬＭコードを用いることができる。ＳＬＭ復号器２０８が選択された重み行列を識別すると、このＳＬＭ復号器は、重み（すなわち、ＳＬＭ系列）を受信データから除去する。データシンボル推定器２０９は、ＳＬＭ復号化されたデータから元のデータシンボルを決定する。

【0040】

図２Ｂ、図２Ｃおよび図２Ｄは、受信機構成を描き、ＳＬＭ復号器２０８が受信機チェーン内の様々な位置に位置決めされている。そのような位置決めは、対応する送信機内の動作の順序に対応する。送信機内の任意のブロックに関して上述したように、関連する受信機構成内の対応するブロックは、任意とすることができる。例えば、空間ｄｅ－ＭＵＸ２０６は、任意とすることができる。変換復号器２０７は、任意とすることができる。いくつかの受信機構成は、２つ以上のＳＬＭ復号器２０８を含むことができ、例えば、複数のＳＬＭプリコーダを有する送信機に対して相補的なＳＬＭ処理を提供するようにしてもよい。

【0041】

本明細書に開示されている送信機および受信機は、クライアント側デバイス、サーバ側デバイス、および／または中間（例えば、リレー）デバイスを含むことができる。クライアント側デバイスは、ＵＥ、アクセス端末、ユーザ端末、モノのインターネット（ＩｏＴ）デバイス、ワイヤレスローカルエリアネットワーク（ＷＬＡＮ）デバイス、ワイヤレスパーソナルエリアネットワーク（ＷＰＡＮ）デバイス、無人航空機、および高度道路交通システム（ＩＴＳ）ノードを含むことができる。クライアント側デバイスの多くはバッテリで電力供給されており、コンピュータリソースへのアクセスが制限される場合があるため、本明細書に開示されている態様におけるアップリンク通信に提供されているような電力効率の向上、および計算複雑性の低さから恩恵を受けることになろう。クライアント側デバイスは、他のクライアント側デバイス、リレー、および／またはサーバ側デバイスを備える分散型アンテナ構成内で協調ＭＩＭＯを実行するように構成することができる。ＭＩＭＯプリコーディングは、電力効率に対するさらなる課題を伴う可能性があり、計算上のオーバヘッドを増大させる可能性がある。コスト、電力、および／または計算上の処理制限を有するクライアント側デバイスは、計算上の処理が削減されたＰＡＰＲ低減スキームから恩恵を受けることになろう。

【0042】

サーバ側デバイスは、無線基地局を含む場合があり、それらは、ＥｎｏｄｅＢ、スモールセル、フェムトセル、メトロセル、リモートラジオヘッド、モバイル基地局、セルタワー、ワイヤレスアクセスポイント、ワイヤレス通信ルータ、ワイヤレスハブ、ネットワークコントローラ、ネットワークマネージャ、無線アクセスネットワーク（ＲＡＮ）ノード、ＨｅｔＮｅｔノード、ワイヤレス広域ネットワーク（ＷＷＡＮ）ノード、分散型アンテナシステム、マッシブＭＩＭＯノード、およびクラスタマネージャとも呼ばれる。いくつかの態様では、サーバ側デバイスは、サーバ側モードで動作するように構成されたクライアントデバイスおよび／またはリレーを含むことができる。サーバ側デバイスを稠密に展開することには、電力、コンピュータ処理、および／またはコスト制約を伴う場合が多い。そのようなデバイスは、本明細書に開示されている、計算上の処理が削減されたＰＡＰＲ低減スキームから恩恵を受けることになろう。

【0043】

中間デバイスは、固定および／または可動リレーを含むことができる。中間デバイスは、本明細書に開示されているような、クライアントデバイスおよび／またはサーバ側デバイスを備えることができる。中間デバイスは、ワイヤレスバックホール（ｂａｃｋｈａｕｌ）および／またはフロントホール（ｆｒｏｎｔｈａｕｌ）を有するリモートラジオヘッドを含むことができる。アドホック型、メッシュ型、および他の分散型ネットワークトポロジでは、中間デバイスは、ネットワーク覆域の増大および性能の向上をもたらすことができる。中間デバイスは、モバイルアドホック型ネットワーク（ＭＡＮＥＴ）ノード、ピアツーピアノード、ゲートウェイノード、車両アドホック型ネットワーク（ＶＡＮＥＴ）ノード、スマートフォンアドホック型ネットワーク（ＳＰＡＮ）ノード、クラウドリレーノード、地理的に分散したＭＡＮＥＴノード、フライングアドホック型ネットワーク（ＦＡＮＥＴ）ノード、空中リレーノード等々を含む。中間デバイスは、バッテリ給電式、太陽エネルギー給電式であっても、そうでなくても利用可能な電力が限られている。同様に、中間デバイスには、コスト制約および／またはコンピュータ処理能力制限がある場合がある。そのようなデバイスは、本明細書に開示されている、計算上の処理が削減されたＰＡＰＲ低減スキームから恩恵を受けることになろう。

【0044】

図３は、マルチアンテナシステムにおけるＰＡＰＲ低減動作を描く流れ図である。図に描かれているブロックは、集中型プロセッサで実行される動作を表すこともできるし、クラウドコンピューティング構成におけるように、複数のプロセッサにわたって分散していてもよい。プロセッサは、協調ＭＩＭＯ構成内の、および／または１つまたは複数の遠隔したデータセンター内のサーバの複数のアンテナに対応するノードのような、ネットワークノード上に常駐させてもよい。

【0045】

１つまたは複数の入力データストリームは、ＭＩＭＯ部分空間チャネルのような、複数のＭＩＭＯ送信チャンネルに対応する数Ｎ_ｔ個のレイヤにマッピング３０１される。各レイヤ１～Ｎ_ｔ内のデータは、例えば、Ｎ個の副搬送波を送信機に割り当てるスケジューリング情報に従って、複数のＮ個のＯＦＤＭ副搬送波周波数にマッピング３０２．１～３０２．Ｎ_ｔされる。マッピング３０２．１～３０２．Ｎ_ｔは、データシンボルをサイズＮのＮ_ｔ個のブロックに区分することを含むことができる。データ選択３０３．１～３０３．Ｎは、各周波数ｆ_１からｆ_Ｎに対応するＮ_ｔ個のデータシンボルからなるセットの選択をもたらす。各周波数ｆ_１からｆ_Ｎごとに、対応するデータシンボルが前述のＮ_ｔ個のブロックのそれぞれから収集される。各処理３０３．１～３０３．Ｎに配列されたデータシンボルは、サイズＮ_ｔのＮ個のブロックにフォーマットすることができる。

【0046】

周波数ｆ_１に対応するＮ_ｔ個のデータシンボルｄ（ｆ_１）のブロックが、Ｎ_ｔ個のアンテナのそれぞれ（例えば、アンテナ１～アンテナＮ_ｔとして示されている）に対して処理される。これは、ｆ_Ｎまでの各周波数に対して実行される。わかり易くするために、送信アンテナの数は、レイヤの数と等しいと仮定する。しかしながら、異なるアンテナ構成、例えば、アンテナの数がＮ_ｔよりも大きい構成を用いることができる。

【0047】

アンテナ１のための処理は、（位相回転系列を含み得る）ＰＡＰＲ低減重み行列を、データブロックｄ（ｆ_１）～ｄ（ｆ_Ｎ）３０４．１，１～３０４．１，Ｎ～３０４．Ｎ_ｔ，１～３０４．Ｎ_ｔ，Ｎのそれぞれに適用することを含むことができる。重みマトリックスＷ_１（ｆ_１）～Ｗ_１（ｆ_Ｎ）は、アンテナ１に対して用いることができ、また、Ｗ_Ｎｔ（ｆ_１）～Ｗ_Ｎｔ（ｆ_Ｎ）は、アンテナＮ_ｔに対して用いることができる。データシンボルブロックｄ（ｆ_ｎ）を有する、（アンテナ（ｊ）および周波数（ｎ）によってインデックス付けされた）重み行列Ｗ_ｊ（ｆ_ｎ）の積から得られた各データブロック３０４．１，１～３０４．１，Ｎ～３０４．Ｎ_ｔ，１～３０４．Ｎ_ｔ，Ｎは、

【数3】

のように表示される。

【0048】

各アンテナ（１からＮ_ｔ）に対応する各データシンボルブロック

【数4】

は、アンテナ（ｊ）および周波数（ｎ）３０５．１，１～３０５．１，Ｎ～３０５．Ｎ_ｔ，１～３０５．Ｎ_ｔ，Ｎによってインデックス付けされたＭＩＭＯプリコーディングベクトルｓ_ｉ（ｆ_ｎ）で乗算され、対応するプリコーディングされたシンボル値を生成する。したがって、それぞれのアンテナごとに、サイズＮ_ｔの、Ｎ個のシンボルブロックのセットｄ（ｆ_ｎ），ｎ＝１，．．．，Ｎに対応する、Ｎ個のプリコーディングされたシンボル値が生成される。Ｎ個のプリコーディングされたシンボル値はそれぞれ、対応する副搬送波周波数ｆ_ｎのブロックｄ（ｆ_ｎ）のＮ_ｔ個のデータシンボルの線形結合を含む。それぞれのアンテナごとにプリコーディングされたＮ個のシンボル値は、ＩＦＦＴ３０７．１～３０７．Ｎ_ｔのセットの入力ビンにマッピング３０６．１～３０６．Ｎ_ｔされ、これにより、それぞれのアンテナ１～Ｎ_ｔごとに離散時間ＭＩＭＯ－ＯＦＤＭ信号を生成する。

【0049】

図３の重み行列Ｗ_ｊ（ｆ_ｎ）の選択について、図４に図示されているブロック図を参照して説明する。本明細書に開示されている態様は、例えば、マッシブＭＩＭＯアンテナアレイでの集中処理、分散型アンテナシステムでの集中処理、および分散型アンテナシステムでの分散処理のために構成することができる。本明細書において用いられる分散型プロセッサは、クラウドコンピューティングネットワークを含むことができ、例えば、１個のラック内の機械、複数のラック内の機械、および／または複数の地理的に分散したデータセンターに常駐する機械全体にわたって分散した、選択可能なプロセッサおよびメモリを備えてもよい。クラウドコンピューティングネットワークは、スイッチ、ルータ、アクセスポイント、ゲートウエイなどを含む、ソフトウェア定義された、選択可能な、および／または設定可能なネットワークリソースを含むことができる。そのような選択可能な、および／または設定可能なネットワークリソースは、バックホールネットワークへの選択可能、かつ、設定可能なアクセスをもたらすことができる。そのような選択可能、かつ、設定可能なアクセスは、選択可能な帯域幅、選択可能な待ち時間、選択可能なサービス品質などを含むことができる。クラウドコンピューティングネットワークは、協調ＭＩＭＯシステムにおいてアンテナとしてだけでなく分散型プロセッサとしても機能する、協調型ワイヤレスデバイスを備えてもよい。協調型ワイヤレスデバイスはそれぞれ、処理リソース（クラウドストレージおよび仮想ネットワークリソースを含む場合がある）を含んでもよいし、本明細書に開示されているＰＡＰＲ低減動作のうちの少なくともいくつかを実行するように構成してもよい。

【0050】

データマッパ４０１は、１つまたは複数の入力データストリームを、リソースブロックおよびレイヤにマッピングすることができる。任意に、データは、データを１つまたは複数の重み、例えば、初期重みセットＷ^（０）で乗算するように構成された乗算器４０２によって、処理することができる。乗算器４０２は、データをスクランブルし、任意の型の拡散コードおよび／または多元接続コードを用いてデータを拡散し、かつ／または、任意の型の変換プリコーディング（ＳＣ－ＦＤＭＡプリコーディングなど）を実行するように構成する場合もあり得る。マッパ４０１または乗算器４０２によって出力されたデータシンボルは、複数Ｎ_ｔ個の処理分岐に入力され、処理分岐では、分岐はそれぞれ、Ｎ_ｔ個のアンテナのうちの１つに対応する。処理分岐は、直列もしくは並列のプロセッサのアーキテクチャで、またはそれらの組み合わせで実装することができる。処理分岐は、集中型プロセッサ、プロセッサの分散型セット、またはそれらの組み合わせを用いてもよい。

【0051】

第１の分岐は、可逆変換４０４．１を経由し、かつ、初期基本離散時間ＭＩＭＯ－ＯＦＤＭ信号を生成する第１の経路と、スパース行列乗算器４０７．１および可逆変換４０９．１を経由する、１つまたは複数個（Ｕ）の部分更新離散時間ＭＩＭＯ－ＯＦＤＭ信号を生成する第２の経路と、を含む。更新された離散時間ＭＩＭＯ－ＯＦＤＭ信号を発生させるために、線形結合器４０５．１は、少なくとも１つの部分更新離散時間ＭＩＭＯ－ＯＦＤＭ信号を、基本離散時間ＭＩＭＯ－ＯＦＤＭ信号と合計し、これが、信号のＰＡＰＲを測定するためにＰＡＰＲ測定モジュール４０６．１内で分析される。ＭＩＭＯプリコーダ４０３．１は、可逆変換４０４．１および４０９．１にＭＩＭＯプリコーディング重みのセットを提供する。同様のプロセスが、残りのＮ_ｔ－１個の（物理的または論理的）処理分岐のそれぞれにおいて実行される。

【0052】

第Ｎ_ｔ ^ｔｈの分岐は、可逆変換４０４．Ｎ_ｔを経由する、初期基本離散時間ＭＩＭＯ－ＯＦＤＭ信号を発生させる第１の経路と、スパース行列乗算器４０７．Ｎ_ｔおよび可逆変換４０９．Ｎ_ｔを経由する、１つまたは複数個（Ｕ）の部分更新離散時間ＭＩＭＯ－ＯＦＤＭ信号を発生させる第２の経路と、を含む。更新された離散時間ＭＩＭＯ－ＯＦＤＭ信号を発生させるために、線形結合器４０５．Ｎ_ｔは、少なくとも１つの部分更新離散時間ＭＩＭＯ－ＯＦＤＭ信号を、基本離散時間ＭＩＭＯ－ＯＦＤＭ信号と合計し、これが、信号のＰＡＰＲを測定するためにＰＡＰＲ測定モジュール４０６．１内で分析される。ＭＩＭＯプリコーダ４０３．Ｎ_ｔは、可逆変換４０４．Ｎ_ｔおよび４０９．Ｎ_ｔにＭＩＭＯプリコーディング重みのセットを提供する。

【0053】

Ｎ_ｔ個の分岐のそれぞれに関して、わかり易くするために、本明細書では、第１の分岐の説明が提示されている。線形結合器４０５．１は、基本離散時間ＭＩＭＯ－ＯＦＤＭ信号ｙ^（ｕ）を格納し、かつ／またはメモリ４１５．１から読み取りする場合もあり得る。１つの態様では、初期基本離散時間ＭＩＭＯ－ＯＦＤＭ信号は、線形結合器４０５．１で用いられる基本離散時間ＭＩＭＯ－ＯＦＤＭ信号だけである。他の態様では、更新された離散時間ＭＩＭＯ－ＯＦＤＭ信号は、基本離散時間ＭＩＭＯ－ＯＦＤＭ信号として指定することができる。ＰＡＰＲ測定モジュール４０６．１は、ＰＡＰＲ（例えば、ＰＡＰＲ^（ｕ））を格納および／または読み取りし、かつ／またはメモリ４１５．１に対してインデックスｕを更新することができる。インデックスｕは、重みコードブック内の重み行列ｗ^（ｕ）に対応するコードブックインデックスとすることができる。ＰＡＰＲ測定モジュール４０６．１は、例えば、そのＰＡＰＲを前のＰＡＰＲ測定値または何らかの閾値と比較することに応じて、更新された離散時間ＭＩＭＯ－ＯＦＤＭ信号をメモリ、そのＰＡＰＲ、および対応する更新インデックスに格納することができる。ＰＡＰＲ測定モジュール４０６．１は、低いＰＡＰＲを有する更新された離散時間ＭＩＭＯ－ＯＦＤＭ信号を、基本離散時間ＭＩＭＯ－ＯＦＤＭ信号として指定する場合もあり得るとともに、以前に書き込まれた任意のデータをメモリ４１５．１から削除する場合もある。（メモリ４１５．１から読み取られたＰＡＰＲ^（ｕ）および場合によってはインデックスｕなどの）ＰＡＰＲ測定値に基づいて、スパース行列乗算器４０７．１は、メモリ４１０から重み行列Ｗ^（ｕ）を選択する場合もあり得る。

【0054】

格納された値、例えば、ｕおよびその対応するＰＡＰＲ^（ｕ）などは、モジュール４０６．１によってメモリ４１５．１から読み取ることができ、Ｎ_ｔ個の分岐からＰＡＰＲおよび重みインデックス値（ならびに場合によっては他のデータ）を収集するように構成された、ＰＡＰＲアグリゲータ４１１に伝達することができる。各分岐のモジュール４０６．１～４０６．Ｎ_ｔは、Ｕ個のＰＡＰＲのすべてに対応するデータ、所定の閾値を下回る複数のＰＡＰＲ、または所定の数の最低ＰＡＰＲを、アグリゲータ４１１に伝達する場合もあり得る。

【0055】

重み値がそこから受信された分岐に対応する重み値で各ＰＡＰＲをスケーリングするために、ＰＡＰＲ重み付けモジュール４１２を任意に設けることができる。例えば、ＰＡＰＲ感受性が高い分岐の場合には、重みは１になる場合もあり、ＰＡＰＲ感受性が低い分岐の場合には、ＰＡＰＲは０になる場合もあり得る。重み付けされたＰＡＰＲ値は、次に、重み選択器４１３で処理され、重み選択器は、すべての分岐による使用に最良の重みセットを選択することができる。例えば、それぞれのインデックスｕごとに、重み選択器４１３は、すべての分岐からの、対応する重み付けされたＰＡＰＲ値を合計して、重み付けされたＰＡＰＲメトリックの総計を生成することができる。最良の重みセットインデックス（０≦ｕ≦Ｕ）は、最小値を有する、対応する重み付けされたＰＡＰＲメトリックの総計から選択することができる。重みセット選択器４１３は、次に、最良の重みセットインデックスｕ（または対応する重みＷ^（ｕ））を、重み付け処理３０４．１，１～３０４．１，Ｎ～３０４．Ｎ_ｔ，１～３０４．Ｎ_ｔ，Ｎにおいて実施される図３に示されている処理分岐に伝達する。

【0056】

ＰＡＰＲ重み付け４１２が用いられる態様では、分岐重みはそれぞれ、分岐アンテナの（または対応するネットワークノードの）ＰＡＰＲに対する感受性の尺度を含む。例えば、１に近い標準化後の分岐重みは、高いＰＡＰＲ感受性に対応し得るが、ゼロに近い標準化後の分岐重みは、低いＰＡＰＲ感受性に対応し得る。バッテリ給電式ノードは、バッテリ給電式デバイスの動作にとって電力効率がより重要である可能性が高いので、分岐重みが回線電力を有するノードよりも高い場合がある。１つまたは複数の回線給電式ノードをスケジューリングして、分散型アンテナシステム内にバッテリ給電式ノードのセットを有するクラスタで動作させると、分岐重みが低い回線給電式ノードの自由度を高めることができ、より低いＰＡＰＲをバッテリ給電式ノードにもたらすので、有利である。これにより、ＰＡＰＲ感受性が高くないノードに対して高いＰＡＰＲを可能にすることによって、重み選択４１３は、より低いＰＡＰＲをＰＡＰＲ感受性が高いノードに対してもたらすことが可能になる。

【0057】

いくつかの態様では、ＰＡＰＲ重み付けモジュール４１２は、モジュール４１２に報告されている各対応ノードのバッテリ寿命（バッテリ消耗、バッテリ充電レベル、完全充電の割合、デバイスの残り実行時間、バッテリ状態（例えば、充電または放電）、およびそれらの組み合わせを含み得る）に基づき、分岐重みのうちの１つまたは複数を計算する場合もあり得る。バッテリ寿命が短いデバイスは、バッテリ寿命がほぼ長いデバイスよりも、対応する分岐重みを高くすることができる。分岐重みはそれぞれ、分岐のバッテリ充電レベルの逆数に対応する場合もあり得る。ＰＡＰＲ重み付けモジュール４１２は、各デバイスに割り当てられた電力スケーリング係数（例えば、高電力で送信するデバイスの方が、対応する分岐重みが高い場合もあり得る）、各デバイスに割り当てられたセッション持続時間（例えば、より長いセッションを有するようにスケジューリングされた、または、それらのデータサービスのタイプ、またはそれらが送信しているファイルのサイズに基づくなどのそれ以外の方法で、より長いセッションを有することが見込まれるデバイスの方が、対応する分岐重みが高い場合もあり得る）、（緊急リンクまたは非緊急リンクに基づくなどの）優先レベル、加入レベル、もしくは他の何らかのメトリック、またはそれらの組み合わせに基づき、分岐重みを計算する場合もあり得る。ＰＡＰＲ感受性が低い１つまたは複数のノードをスケジューリングして、分散型アンテナシステム内にＰＡＰＲ感受性が高いノードのセットを有するクラスタで動作させると、ＰＡＰＲ感受性が低いノードの分岐重みが低いことにより、自由度を高めることができ、これにより、ＰＡＰＲ感受性が高いノードに対してより低いＰＡＰＲが可能になるので、有利である。

【0058】

図５Ａは、第１の可逆変換５０４と、スパース行列乗算器５０７と、第２の可逆変換５０９と、線形結合器５０５と、を含むＳＬＭ重み選択器の概略的な構成を図示するブロック図である。重み選択器は、入力／出力（Ｉ／Ｏ）プロセッサ５０１と、ＣＳＩ推定器５１０と、メモリ５０２と、ＭＩＭＯプリコーダ５０８と、ＰＡＰＲ測定モジュール５０６と、をさらに含むことができる。

【0059】

第１の可逆変換５０４は、データシンボルベクトルＸ上で演算して、初期基本離散時間ＯＦＤＭ信号：

【数5】

（式中、

【数6】

は、可逆変換演算子である）を発生させる。この演算子

【数7】

は、高速変換を介して実施することができる逆ＤＦＴ行列Ｆ^Ｈを含むことができる。オーバーサンプリング係数Ｋを有する複素ＮポイントＩＦＦＴの計算複雑性は、（ＫＮ／２）ｌｏｇ_２（ＫＮ）複素乗算およびＫＮｌｏｇ_２（ＫＮ）複素加算を含む。この演算子

【数8】

は、通常計算複雑性を増大させる、１つまたは複数の追加の行列演算子を含むことができる。例えば、ＭＩＭＯプリコーダ５０８は、ＭＩＭＯプリコーディング重みのセットを可逆変換５０４に提供することができる。可逆変換５０４は、プリコーディング重みからプリコーディング行列Ｓを生成し、データシンボルベクトルＸを乗算することができ、積ＳＸは、Ｆ^Ｈ：ｘ＝Ｆ^Ｈ（ＳＸ）によって変換することができる。

【0060】

スパース行列乗算器５０７は、長さＮのスパース重みベクトルｗのセットを用いて、第２の可逆変換５０９によって処理する前に、シンボルベクトルを乗算Ｘ＝［Ｘ_０Ｘ_１．．．Ｘ_Ｎ－１］^Ｔすることができる。いくつかの態様では、ＮＸＮ対角重み行列Ｗを用いてもよい。スパース対角行列Ｗは、１つまたは複数のゼロ値を有する対角要素を含む。１つの態様では、第１のシンボル位置に対応する第１の重み行列は、ｗ^{（１，０，．．．，０）}＝［１，０，．．．，０］とすることができ、第２のシンボル位置に対応する第２の重み行列は、ｗ^{（０，１，．．．，０）}＝［０，１，．．．，０］，．．．，とすることができ、また、第Ｎ^ｔｈのシンボル位置に対応する第Ν^ｔｈの重み行列は、ｗ^{（０，０，．．．，１）}＝［０，０，．．．，１］とすることができる。

【0061】

スパース部分更新シンボル行列のセット（例えば、系列）ｗ^{（．．．）}Ｘは、以下のように計算することができる（例えば、ｗ^{（．．．）}Ｘは、

【数9】

のように計算され、式中、

【数10】

は、要素ごとの乗算を表示する）。部分更新シンボル行列はそれぞれ、アダマール（Ｈａｄａｍａｒｄ）積（シューア（Ｓｃｈｕｒ）積、エントリ単位の積、または成分単位の積としてもまた知られている）の結果であり、それは、同じ次元の２つの行列（ｗ^{（．．．）}およびＸ）となり、別の行列（ｗ^{（．．．）}Χ）を生成する。なお、各要素ｉ、ｊは、元の２つの行列の要素ｉ、ｊの積、すなわち、（ｗ^{（．．．）}Χ）_ｉ、ｊ＝（ｗ^{（．．．）}）_ｉ，ｊ（Ｘ）_ｉ、ｊである。本開示の変形および代替的選択肢は、アダマール積の連想的、分配的、および／または可換的な特性を活用し得ることを認識されたい。

【0062】

いくつかの態様では、加算または減算を介して乗算を実行して、等価な結果に到達することができる。様々な対応するビットレベルの演算を用いて、本明細書に開示されている態様の乗算を達成することができる。乗算は、入力シンボル系列のコンステレーションポイントを、重み系列に従ってコンステレーションポイントの別のセットにマッピングすることによって実行することができる。

【0063】

第２の可逆変換５０９は、演算子

【数11】

を用いて、（データベクトルＸに対する部分更新である）各スパース行列ｗ^{（．．．）}Ｘに対して演算して、対応する部分更新離散時間ＯＦＤＭ信号ｘ^{（．．．）}を発生させる。１つの態様では、可逆変換５０９は、ＭＩＭＯプリコーダ５０８から受信したプリコーディング重みからプリコーディング行列Ｓを生成し、次に、演算子

【数12】

を計算する。この演算子

【数13】

は、メモリに格納され、各スパース行列ｗ^{（．．．）}Ｘに対して演算するために使用することができる。これにより、演算ｘ^{（．．．）}＝（Ｆ^ＨＳ）（ｗ^{（．．．）}Χ）が得られる。別の態様では、演算子

【数14】

は、各スパース重み行列ｗ^{（．．．）}ごとに生成され、メモリに格納することができる。可逆変換５０９は、メモリから格納されている演算子を選択して、例えば、演算ｘ^{（．．．）}＝（Ｆ^ＨＳｗ^{（．．．）}）Ｘを実行するために、データベクトルＸに対して演算することができる。この演算子はスパース行列であり、したがって、スパース行列ベクトル（ｓｐＭＶ）を活用することができる。１つの態様では、Ｆ^ＨＳが計算、および格納され、各ｗ^{（．．．）}ごとに、Ｆ^ＨＳの対応する列が読み取りされ、その後にＸとの乗算が続く。

【0064】

本明細書に開示されている演算子は、スケーリング係数で乗算することができ、この演算子を使用して、スケーリングされた部分更新離散時間ＯＦＤＭ信号ｘ^{（．．．）}を生成してもよい。可逆変換の線形性特性をスケーリング係数と組み合わせて活用して、可逆変換計算の回数を減らすことができる。可逆変換５０９は、部分更新離散時間ＯＦＤＭ信号ｘ^{（．．．）}をメモリに格納し、そのような信号のスケーリング後のバージョンを線形結合器５０５に供給することができる。

【0065】

ｗ^{（．．．）}のスパース性により、複素乗算および加算の必要回数が減少することによって、

【数15】

演算が単純化される結果、部分可逆変換演算が得られる。例えば、ｗ^{（．．．）}Ｘ内のゼロの値により、ｗ^{（．．．）}Ｘに対して作用する演算子

【数16】

中の複素乗算および加算の回数を、初期基本離散時間ＯＦＤＭ信号を生成するのに必要な全変換演算と比較して、減らすことが可能になる。更新された離散時間ＯＦＤＭ信号は、部分更新離散時間ＯＦＤＭ信号を基本離散時間ＯＦＤＭ信号と合計することによって、生成される。この総計は、別のＫＮ回（以下の）複素加算を含んでもよい。同様に、演算子

【数17】

は、ｗ（．．．）内のゼロの値により複雑性が低減され、本明細書では、部分可逆変換演算と呼ばれている。このアプローチは、他の線形変換演算に適合させることができる。例えば、演算子

【数18】

およびその変形は、ｗ^{（．．．）}のスパース性のおかげで単純化することができ、ここでは、ＴおよびＳはそれぞれ、任意の数の可逆変換演算子を表す。ＴおよびＳは、拡散、プリコーディング、順列、ブロック符号化、時空間符号化などの、１つまたは複数の演算子、および／またはコンステレーションマッピング演算子を含むことができる。Ｆ^Ｈは、ウェーブレット変換、分数次フーリエ変換等々のような、任意の可逆変換演算子を含んでもよい。

【0066】

第１の可逆変換５０４および第２の可逆変換５０９は、共通の構造を含み得ることを認識されたい。可逆変換回路、プロセッサ、および／またはコードセグメントは、全可逆変換演算を用いて初期基本離散時間ＯＦＤＭ信号を発生させる、第１の可逆変換５０４として演算することができ、かつ、部分可逆変換演算を用いて部分更新離散時間ＯＦＤＭ信号を発生させる、第２の可逆変換５０９として演算することができ、この部分可逆変換演算はそれぞれ、全可逆変換演算よりも回数が少ない乗算および加算を含む。

【0067】

可逆変換５０９によって発生した部分更新離散時間ＯＦＤＭ信号ｘ^{（．．．）}は、スケーリング係数ａとともに、後続の処理のためにメモリ５０２に格納することができる。可逆変換５０９および／または線形結合器５０５は、以前に生成された部分更新離散時間ＯＦＤＭ信号ｘ^{（．．．）}をスケーリングすることによって、および／または、結合することによって、新たな部分更新離散時間ＯＦＤＭ信号ｘ^{（．．．）}を生成してもよい。事前に計算された部分離散時間ＯＦＤＭ信号ｘ^{（．．．）}はそれぞれ、Ｘ中のＮ個のシンボル位置のうちの異なる１つに対応するが、それらを選択し、スケーリング係数ａで乗算して、新たな部分更新離散時間ＯＦＤＭ信号ｘ^{（．．．）}を発生させることができる。本明細書に開示されている態様は、可逆変換の線形性を活用して、（拡散ＯＦＤＭ信号およびＭＩＭＯプリコーディングされたＯＦＤＭ信号を含む）ＯＦＤＭ信号に複雑性が低い部分更新をもたらすことができる。

【数19】

式中、ａおよびｂは、スカラー値であり、

【数20】

および

【数21】

は、長さＫＮの部分更新離散時間ＯＦＤＭ信号であり、Χ_１（ω）およびΧ_２（ω）は、長さＮのスパース部分更新シンボル行列（例えば、

【数22】

および

【数23】

であり、式中、Ｗ_１ ^{（．．．）}およびＷ_２ ^{（．．．）}は、Ｘ中の同じシンボル位置または異なるシンボル位置に対応する非ゼロ値を有する長さＮのスパース重みベクトルである）である。

【0068】

重み値のシンボルコンステレーションが所定であるか、または適合可能であるスパース重みベクトルｗ^{（．．．）}の場合、スケーリング係数ａおよびｂは、シンボルコンステレーションに従って選択し、上述のように用いて、対応する部分更新離散時間ＯＦＤＭ信号を発生させることができる。例えば、ｘ^{（１，０，．．．，０）}が、スパース重みベクトルｗ^{（１，０，．．．，０）}に対応する部分可逆変換によって生成されるのであれば、ｗ^{（ａ，０，．．．，０）}に対応するｘ^{（ａ，０，．．．，０）}は、積ｘ^{（ａ，０，．．．，０）}＝ａｘ^{（１，０，．．．，０）}から生成される。追加の変換演算を実行する代わりに、ｘ^{（ａ、０、．．．、０）}が、ＫＮ回以下の複素乗算を実行することによって生成される。新たな部分更新離散時間ＯＦＤＭ信号は、部分更新離散時間ＯＦＤＭ信号の総計から生成することができる。例えば、スケーリング係数（ａ＋ｂ）の実施は、以下の以前に計算された信号ｘ^{（ａ，０，．．．，０）}と、ｘ^{（ｂ，０，．．．，０）}：ｘ^{（ａ＋ｂ，０，．．．，０）}＝ｘ^{（ａ，０，．．．，０）}＋ｘ^{（ｂ，０，．．．，０）}との積算によって実現することができ、それは、変換演算の代わりに、ＫＮ回以下の複素加算を含むことができる。

【0069】

線形結合器５０５は、各部分更新離散時間ＯＦＤＭ信号を、基本離散時間ＯＦＤＭ信号と合計して、更新された離散時間ＯＦＤＭ信号を発生させるように構成されている。以下の加算：
ｙ^（ｕ）＝ｙ^（０）＋ｘ^（ｕ）
（式中、ｘ^（ｕ）は、第ｕ^ｔｈの部分更新離散時間ＯＦＤＭ信号であり、ｙ^（０）は、基本離散時間ＯＦＤＭ信号であり、ｙ^（ｕ）は、インデックスｕに対応する更新された離散時間ＯＦＤＭ信号である。線形結合器５０５は、値ｙ^（ｕ）、ｙ^（０）、およびｘ^（ｕ）をメモリ５０２に格納することができ、また、メモリ５０２から値ｙ^（０）およびｘ^（ｕ）を読み取ることができる。線形結合器５０５は、本明細書に記載されているように、新たなｘ^（ｕ）値を生成することができる）が実行される。

【0070】

１つの態様では、最初の（ｕ＝０）反復は、初期基本離散時間ＭＦＭＯ－ＯＦＤＭ信号（ｙ^（０）によって表示されている）をメモリに書き込むことを含む。線形結合器５０５は、メモリ５０２からｙ^（０）を読み取り、それを、可逆変換５０９によって生成されたｘ^（ｕ）と結合させることができる。線形結合器５０５は、線形結合器５０５および／またはＰＡＰＲ測定モジュール５０６によって後で使用するために、得られた総計ｙ^（ｕ）をメモリ５０２に格納する場合もあり得る。

【0071】

ＰＡＰＲ測定モジュール５０６は、ｙ^（ｕ）のＰＡＰＲを計算し、それを、前のＰＡＰＲおよび／または少なくとも１つのＰＡＰＲ閾値と比較する。比較に基づいて、信号ｙ^（ｕ）および／またはｙ^（０）は、本明細書のさらなる処理のために選択してもよいし、送信される信号として選択してもよい。例えば、線形結合器５０５または可逆変換５０９は、ＰＡＰＲに基づいて、（例えば、以前に生成されたｘ^（ｕ）値を、スケーリングおよび／または線形結合することなどによって）新たなｘ^（ｕ）値を生成することができ、また、線形結合器５０５は、新たなｘ^（ｕ）を、ｙ^（０）または前のｙ^（ｕ）と結合する。いくつかの態様では、ＰＡＰＲ測定モジュール５０６は、ｙ^（ｕ）を後続の反復において更新される値ｙ^（０）として指定するか、またはＰＡＰＲ測定モジュール５０６が、前の値ｙ^（０）を選択する場合もあり得る。ＰＡＰＲ測定モジュール５０６は、後続の処理のためにメモリから値（例えば、ｘ^（ｕ），ｙ^（ｕ），ｙ^（０））を読み取るように、線形結合器５０５に命令することができる。ＰＡＰＲ測定モジュール５０６は、値（例えば、Ｗ^（ｕ），ａ）を読み取って、新たな重みを生成するように、スパース行列乗算器５０７に命令する場合もあり得る。

【0072】

ＰＡＰＲ測定モジュール５０６は、ピーク検出器を含むことができ、それは、ピークホールド回路または全波整流器と呼ばれる場合もある。ピーク検出器は電圧を監視し、そのピーク値を保持する。ピーク検出器回路は、極値点に到達するまで入力電圧を追跡するか、または入力電圧に追従し、入力が減少してもその値を保持する。これは、テスト中の離散時間信号に対応するデータセットから極大値を決定するようにプログラムされたデジタル回路またはプロセッサ内で実行することができる。ピーク検出器は、ＬＮサンプルの中で極大値が最小である信号を見つけることによって、Ｕ個の離散的信号の中でピーク電力が最小である信号を識別することができる。ＰＡＰＲ測定モジュール５０６は、デジタルデータに対してアルゴリズム演算を実行して、ＰＡＰＲを決定することができる。累積分布関数（ＣＤＦ）または相補累積分布関数（ＣＣＤＦ）は、ＰＡＰＲに対する性能評価尺度として使用することができる。ＣＣＤＦは、ＯＦＤＭシンボルのＰＡＰＲが所与の閾値、ＰＡＰＲ_０を超過する確率を表し、ＣＣＤＦ＝Ｐｒ（ＰＡＰＲ＞ＰＡＰＲ_０）と表示される。ＰＡＰＲは、ピーク、ＣＤＦ、ＣＣＤＦ、および／または波高率（波形の実効値に対するピーク値の比）を含むことができる。他のＰＡＰＲ性能評価尺度を使用してもよい。

【0073】

Ｉ／Ｏ５０１は、構成要素および／または他のノードから受信したデータをメモリ５０２に書き込み、かつ、メモリ５０２からこのデータを読み取って、構成要素および／または他のノードに送信するために構成された、プロセッサを含むことができる。Ｉ／Ｏ回路類５０１は、１つまたは複数のワイヤレス（例えば、無線、光学、または他の何らかのワイヤレス技術）の、および／または有線（例えば、ケーブル、ファイバ、または他の何らかの有線回線技術）のトランシーバを含むことができる。Ｉ／Ｏ５０１は、（ノード内の、またはノードの外部の）ＰＡＰＲアグリゲータ構成要素にＰＡＰＲを伝達することができ、これは、次に、重み選択のために処理される。Ｉ／Ｏ５０１は、重みセット選択器から、選択された重み（または対応するインデックス）を受信し、ＯＦＤＭ送信機によって使用するためにメモリ５０２にデータを格納することができる。例えば、スパース行列乗算器５０７は、メモリ５０２から、選択された重みを読み取ることができる。Ｉ／Ｏ５０１は、ベースバンドＯＦＤＭ信号（例えば、ｙ^（ｕ））、および／または（インデックスｕなどのサイド情報を含む）他のデータを、処理および送信用の無線トランシーバ回路類に伝達することができる。

【0074】

ＣＳＩ推定器５１０は、受信されたパイロット信号を測定し、そこからＣＳＩを推定することができる。ＣＳＩは、ＭＩＭＯプリコーダ５０８および／または他のノードのＭＩＭＯプリコーダによって使用するためにメモリ５０２に格納してもよく、そこからプリコーディング重みを選択、または生成することができる。ＣＳＩは、ＰＡＰＲスケーリング重みを生成するために、ＰＡＰＲ重み付けモジュール４１２によって使用されてもよい。

【0075】

図５Ｂは、ＯＦＤＭ信号に対して部分更新を実行し、ＰＡＰＲが最良である候補信号をそこから選択するための処理ステップおよび／またはプログラム要素を示す流れ図である。スパース演算子のセット（Ｆ^ＨＳｗ^{（．．．）}）が計算５１１され、それぞれスパース重み行列のセットｗ^{（．．．）}に対応する。例えば、個々の演算子Ｆ^ＨおよびＳは、単一の稠密な演算子Ｆ^ＨＳとして一緒に計算し、メモリに格納することができる。稠密な演算子Ｆ^ＨＳは、各スパース重み行列ｗ^{（．．．）}に対応するスパース演算子の基底関数として用いられる。特定の演算子Ｆ^ＨＳｗ^{（．．．）}が、Ｆ^ＨＳｗ^{（．．．）}中の非ゼロブロックに対応するＦ^ＨＳ中の非ゼロブロックを選択することによって用いられる。例えば、重み行列ｗ^{（．．．）}が、単一の非ゼロ行要素（例えば、行インデックスｎ）を含む列ベクトルであれば、Ｆ^ＨＳｗ^{（．．．）}中に、ｗ^{（．．．）}中の単一の非ゼロ行要素に対応する非ゼロ要素を有する単一の列（例えば、列ｎ）がある。したがって、行インデックスｎ、および（任意に）対応するスケーリング係数ａ_ｎは、メモリに格納されて、スパース重み行列ｗ^{（．．．）}を表すことができ、対応するスパース演算子Ｆ^ＨＳｗ^{（．．．）}が検索されると、例えば、可逆変換演算ｘ^{（．．．）}＝（Ｆ^ＨＳｗ^{（．．．）}）Ｘを実行するなどのために、Ｆ^ＨＳ中の行インデックスｎに対応するブロック（例えば、列ｎ）だけが検索され、部分更新離散時間ＯＦＤＭ信号を生成５１２するために使用される。Ｓを更新する必要がない限り、Ｆ^ＨＳに対応するスパース演算子は、データシンボルＸの後続のブロックが部分更新離散時間ＯＦＤＭ信号をそこから生成５１２するために再利用することができる。

【0076】

データシンボルＸの第１のブロックのために、５１２で生成された部分更新離散時間ＯＦＤＭ信号をメモリに格納することができる。ステップ５１２は、以前に生成された部分更新離散時間ＯＦＤＭ信号をスケーリングすること、および／または線形結合することによって、追加の部分更新離散時間ＯＦＤＭ信号を生成することをさらに含むことができる。大きなシンボルコンステレーションがＳＬＭ重みに使用される場合には、ステップ５１２は、部分更新離散時間ＯＦＤＭ信号をスケーリングして、新たな部分更新離散時間ＯＦＤＭ信号を発生させることができるので、Ｆ^ＨＳの追加の演算は必要ない。そのようなコンステレーションの対称性を活用して、演算の回数を減らすことができる。ステップ５１２は、部分更新離散時間ＯＦＤＭ信号を結合して、Ｆ^ＨＳの追加の演算を必要とせずに、新たな部分更新離散時間ＯＦＤＭ信号を生成することができる。したがって、Ｆ^ＨＳ演算の回数は、コンステレーションのサイズおよび候補信号の数Ｕとは独立したものとすることができる。

【0077】

線形結合５１３は、少なくとも１つの部分更新離散時間ＯＦＤＭ信号を基本離散時間ＯＦＤＭ信号と合計して、新たな更新された（または候補）離散時間ＯＦＤＭ信号を発生させることを含む。基本離散時間ＯＦＤＭ信号は、初期基本離散時間ＯＦＤＭ信号、または前の更新された離散時間ＯＦＤＭ信号とすることができる。候補離散時間ＯＦＤＭ信号（基本離散時間ＯＦＤＭ信号を含む）、および各候補離散時間ＯＦＤＭ信号に対応するインデックスｕは、メモリに格納してもよい。

【0078】

ＰＡＰＲ５１４は、それぞれの候補離散時間ＯＦＤＭ信号ごとに計算され、場合によってはそれがｕによってインデックス付けされるように、格納される。決定プロセス５１５は、ＰＡＰＲを、閾値および／または少なくとも１つの前のＰＡＰＲと比較し、場合によっては、ｕによってインデックス付けされたメモリに現在のＰＡＰＲを格納することを含む。決定５１５は、後続の反復を実行するかどうかを指示することができる。決定５１５は、現在の候補離散時間ＯＦＤＭ信号を、後続の反復において使用される基本離散時間ＯＦＤＭ信号として表示することを含んでもよい。決定５１５は、最良のＰＡＰＲまたは閾値を下回るＰＡＰＲに対応する離散時間ＯＦＤＭ信号、および／または関連データ（例えば、重み、インデックス、等々）を出力するために選択してもよい。

【0079】

後続の反復が実行される場合には、基本信号に対する後続の部分更新が、選択または適合５１６される。選択／適合５１６は、生成５１２および／または線形結合５１３の機能を制御することができる。例えば、現在のＰＡＰＲ（および前のＰＡＰＲ）に基づいて、選択／適合５１６は、基本信号と合計される部分更新、および任意に、どの基本信号を使用するかを選択することができる。選択／適合５１６は、更新に対応するｎおよび／またはａ_ｎを選択することができる。そのようなデータ依存の更新は、いくつかの場合には（例えば、静止信号の場合）、データ非依存の更新スケジュールを使用するアルゴリズムよりも速い収束をもたらすことができる。スケーリング係数ａ_ｎを更新するためのステップサイズを選択して、収束および／または安定性を向上させることができる。新たなスケーリング後の部分更新離散時間ＯＦＤＭ信号は、前の離散時間ＯＦＤＭ信号をスケーリングすることによって、および／または離散時間ＯＦＤＭ信号を結合することによって、発生させることができる。ステップサイズは、１つまたは複数の測定基準に基づいて一定である場合もあれば、可変である場合もある。ステップサイズに関する条件は、平均および２乗平均の意味での収束をもたらすように導出することができる。ステップサイズおよび他のパラメータは、メモリに格納することができる。

【0080】

図５Ｃは、ＯＦＤＭ信号に対して部分更新を実行し、ＰＡＰＲが最良である候補信号を選択するための方法および／またはコンピュータプログラムの流れ図である。稠密な演算子（Ｆ^ＨＳ）が計算５２１され、メモリに格納される。稠密な演算子は、稠密なデータ行列Ｘに対して演算して、初期基本離散時間ＯＦＤＭ信号を発生させることができる。稠密な演算子は、スパースデータ行列に対して演算５２２して、部分更新離散時間ＯＦＤＭ信号を発生させる。スパースデータ行列は、スパース重み行列ｗ^{（．．．）}内のゼロ値に対するような、稠密なデータ行列内で選択される値をゼロに設定することによって発生させてもよい。稠密なデータ行列Ｘは、メモリに格納してもよい。また、スパースデータ行列（ｗ^{（．．．）}Ｘ）は、ｗ^{（．．．）}中の非ゼロ要素に対応するＸの非ゼロ要素だけを選択することによって、提供することができる。スパース重み行列ｗ^{（．．．）}は、それぞれの非ゼロ行列要素に対応するインデックスｎ（例えば、列ベクトル中の行インデックス）として、および任意に、第ｎ^ｔｈの値に対応する複素数値ａ_ｎとして、メモリに格納してもよい。スパースデータ行列は、格納されたＸから、それぞれのｎに対応する要素Ｘ_ｎを選択し、Ｘ_ｎまたはその対応する部分更新離散時間ＯＦＤＭ信号を、ａ_ｎでスケーリングすることによって提供してもよい。

【0081】

図５Ｂにおけるように、部分更新離散時間ＯＦＤＭ信号は、基本離散時間ＯＦＤＭ信号と結合５２３され、更新された（候補）離散時間ＯＦＤＭ信号のＰＡＰＲが計算５２４され、決定プロセスが実行５２５される。決定５２５は、例えば、現在の、または前の候補信号を基本信号として指定することなどによって、基本離散時間ＯＦＤＭ信号を更新することを含むことができる。選択／適合５２６は、選択／適合５１６と同様に演算することができる。いくつかの態様では、選択／適合５２６は、ステップ５２２で演算される新たなスパースデータ行列をもたらすことができる。

【0082】

図６は、本明細書に開示されている信号処理機能のために最適化することが可能なグラフィック処理装置（ＧＰＵ）アーキテクチャを図示する図である。ハードウェアおよび／またはソフトウェアは、離散時間ＯＦＤＭ信号のＰＡＰＲを低減するための部分更新方法によって可能になるスパース処理演算を最適化することができる。これらの部分更新方法により、スパース処理に固有の様々な最適化解が可能になる。ＧＰＵアーキテクチャは、グローバルメモリアクセスを最適化し、共有メモリアクセスを最適化し、かつ、再利用および並列処理を活用するために適合させることができる。スパース処理演算を最適化することは、メモリアクセスのコスト、アクセスパターン、メモリのタイプおよびレベルを特徴付けすることと、データ局所性を活用することと、を含むことができる。再利用を活用することは、オンチップメモリ内の各要素をキャッシュすることを含むことができ、また、並列処理を活用することは、同期のない並列処理を用いることを含むことができる。

【0083】

本明細書に開示されている態様は、モデル駆動型コンパイル戦略および実行時戦略を使用して、グラフィック処理装置（ＧＰＵ）上で（スパース行列ベクトル乗算などの）スパース演算を最適化することを提供することができる。例示として、図６は、Ｎ個のレベルのストリーミングマルチプロセッサ（ＳＭ）６１０．１～６１０．Ｎ（ＳＭ１，ＳＭ２，．．．，ＳＭＮ）を含むＧＰＵ並列コンピューティングアーキテクチャを描き、それぞれ、共有メモリ構成要素６１２と、レジスタのレベル６１４．１～６１４．Ｍと、あるレベルのストリーミングプロセッサ（ＳＰ）６１６．１～６１６．Ｍ（ＳＰ１，ＳＰ２，．．．，ＳＰＭ）と、命令ユニット６１８と、定数キャッシュ構成要素６２０と、テクスチャキャッシュ構成要素６２２と、を含む。ＧＰＵには利用可能な様々なメモリがあり、それらは、ハイブリッドキャッシュおよびローカルストアの階層で編成することができる。メモリは、オフチップのグローバルメモリと、オフチップのローカルメモリと、オンチップの共有メモリと、オンチップのキャッシュを有するオフチップの定数メモリと、オンチップのキャッシュを有するオフチップのテクスチャメモリと、オンチップのレジスタと、を含むことができる。オフチップのデバイスメモリ構成要素６２４は、グローバルメモリ、および／または、定数メモリおよびテクスチャメモリを含むことができる。ＧＰＵアーキテクチャは、ＣＰＵ６０４およびＣＰＵメモリ６０６を含むか、またはそれらに通信可能に結合６０１することができ、これらは、ＣＰＵ６０４の動作を実行するためのコンピュータ可読命令およびデータを格納するように適合させてもよい。ＣＰＵ６０４は、母線、ネットワーク、または他の何らかの通信結合を介しての、ＧＰＵアーキテクチャの構成要素、または同様の構成要素との動作可能な通信とすることができる。ＣＰＵ６０４は、ＧＰＵアーキテクチャによって実行される処理または機能の、開始およびスケジューリングを行ってもよい。

【0084】

共有メモリ６１２は、各ＳＭ６１０．１～６１０．Ｎ内に存在し、バンクに編成される。同じバンクに属している複数のアドレスが同時にアクセスされると、バンク競合が生じる。ＳＭ６１０．１～６１０．Ｎはそれぞれ、レジスタのセット６１４．１～６１４．Ｍもまた有する。定数メモリおよびテクスチャメモリは、グローバルメモリ空間内の読み取り専用の領域であり、それらは、オンチップの読み取り専用キャッシュを有する。定数キャッシュ６２０へのアクセスは速くなるが、それは単一のポートしか有しておらず、したがって、複数のプロセッサコアがキャッシュから同じ値をロードするときには、有益である。テクスチャキャッシュ６２４は、定数キャッシュ６２０よりも待ち時間が大きいが、メモリ読み取りアクセスが不規則であるときには、それほど大きな影響を受けないので、２次元（２Ｄ）の空間局所性を有するデータにアクセスするためにもまた有益である。ＧＰＵコンピューティングアーキテクチャは、単一命令複数スレッド（ＳＩＭＴ）実行モデルを用いることができる。カーネルのスレッドは、ワープ（ｗａｒｐ）と呼ばれる群の中で実行され、この場合のワープは、実行の１単位である。ＳＭ内のスカラーＳＰは、単一の命令ユニットを共有し、ワープのスレッドは、ＳＰ上で実行される。ワープのスレッドはすべて同じ命令を実行し、各ワープは、自身のプログラムカウンタを有する。各スレッドは、階層内の異なるレベルでメモリにアクセスすることができ、またスレッドは、プライベートなローカルメモリ空間およびレジスタ空間を有する。スレッドブロック内のスレッドは、共有メモリのスペースを共有することができる。また、ＧＰＵの動的ランダムアクセスメモリ（ＤＲＡＭ）は、カーネルのすべてのスレッドによってアクセス可能である。

【0085】

行列ベクトル乗算などの、メモリに結合したアプリケーションの場合、メモリの設置面積の削減、およびメモリアクセス待ち時間によりよく耐える処理戦略の実装など、メモリ性能を最適化することが有利である。スパース行列ベクトル乗算の間接的、かつ不規則なメモリアクセスを取り扱うために、多くの最適化戦略が開発されている。ＳｐＭＶに固有の最適化は、スパース行列の構造特性に大きく依存しており、問題は、多くの場合、これらの特性は実行時になって初めて分かるものとして定式化される。しかしながら、本開示におけるスパース行列は、実行時以前に分かっている明確に定義された構造から恩恵を受け、またこの構造は、多くのデータセットに対して同じままであることが可能である。これにより問題が単純化され、それによって、性能が向上した解決策が可能になる。スパース重みベクトルを用いると、行列ベクトル乗算は、対応するスパース演算子行列を有するＳｐＭＶとしてモデル化することができる。例えば、ゼロ値のベクトル要素だけを乗算する行列要素は、スパース行列を提供するためにゼロに設定することができる。データシンボルＸおよび演算子行列にかかわらず、スパース重みベクトルｗが事前に決定される場合には、スパース演算子行列の構造特性は、実行時以前に分かっており、ハードウェアおよびソフトウェア加速戦略をより精密に定義することができる。

【0086】

最適なメモリアクセスパターンもまた、計算のためにスレッドがマッピングされるやり方に依存し、関与するスレッドが多くなれば、グローバルメモリアクセスの待ち時間を隠すのに役立つので、グローバルメモリアクセスに関与するスレッドの数にもまた依存する。その結果、メモリアクセスを確実に最適化するために、スレッドマッピングスキームが開発されている。メモリ最適化は、ＣＳＲ形式に基づいてもよい。また、ＣＳＲ記憶形式は、ＧＰＵアーキテクチャに適するように適合させることができる。

【0087】

いくつかの態様は、同期のない並列処理を活用することができる。１つの行に対応する計算を実行するために１つのスレッドを割り当て、行のセットを取り扱うためにスレッドブロックを割り当てるのとは対照的に、ＳｐＭＶ計算では、行全体にわたって並列処理が利用可能であることにより、１つの行または行のセットに対応する計算をスレッドブロックに分散させることが可能になる。ハーフワープの連続したスレッドが連続した要素にアクセスする場合、グローバルメモリに有用なアクセス戦略は、ハードウェア最適化合体アクセスパターンである。例えば、ハーフワープのスレッドによって要求されたすべてのワードが同じメモリセグメント内にある場合、および、連続したスレッドが連続したワードにアクセスする場合であれば、ハーフワープのすべてのメモリリクエストは、１つのメモリトランザクションに合体される。

【0088】

戦略の１つは、連続したスレッドが行の連続した非ゼロ要素に周期的にアクセスして、これらの非ゼロ要素に対応する部分積を計算するように、１行当たり複数のスレッドをマッピングする。ある行にマッピングされたスレッドは、並列和縮約によって、部分積からその行に対応する出力ベクトル要素を計算することができる。部分積は、スレッドブロック内のスレッドによってのみアクセスされるので、共有メモリに格納することができる。

【0089】

いくつかの技法は、データの局所性を活用し、再利用する。入力ベクトルおよび出力ベクトルは、ＳｐＭＶ計算でのデータ再利用を示す場合がある。出力ベクトル要素の再利用は、スレッドのマッピングが最適化された同期のない並列処理を活用することによって実現することができ、これにより、各出力ベクトル要素に対する部分的な寄与が、確実にある特定のスレッドのセットによってのみ計算され、かつ、最終値が一度だけ書き込まれるようにする。入力ベクトル要素の再利用パターンは、スパース行列の非ゼロアクセスパターンに依存する。

【0090】

スレッド内またはスレッドブロック内のスレッド間での入力ベクトル要素のデータの再利用の活用は、オンチップのメモリ内に要素をキャッシュすることによって実現することができる。オンチップのメモリは、例えば、テクスチャ（ハードウェア）キャッシュ、レジスタ、または共有メモリ（ソフトウェア）キャッシュとすることができる。レジスタまたは共有メモリを利用して入力ベクトル要素をキャッシュすることは、再利用されているベクトルの部分を識別することを含むことができ、これはひいては、スパース行列内で稠密なサブブロックの識別が必要になる。スパース重みベクトルの所定のセットの場合、この情報は既に知られている。スパース行列の前処理を実行して、稠密なサブブロックを抽出することができ、また、ＧＰＵアーキテクチャに適した（例えば、きめ細やかなスレッドレベルの並列処理を可能にする）ブロック記憶フォーマットを実装することができる。データシンボルの系列の長さが変わらない場合には、サブブロックサイズは、一定のままである。これにより、ＳｐＭＶ最適化で通常必要とされるような、ブロックサイズおよびブロックインデックスを読み取るためのメモリアクセスペナルティーを回避する。

【0091】

本明細書に記載の技法は、実行のために使用されるスレッドブロック当たりのスレッドの数を変えること、および／または行を取り扱うスレッドの数を変えることなど、同調設定パラメータを含むことができる。高並列処理を実現し、待ち時間の制約を満たすために、ＳｐＭＶは、複数のバッファを含むことができる。１つの態様では、ＳｐＭＶは、２つのスパース行列バッファと、２つのポインタバッファと、２つの出力バッファと、を含んでいてもよい。２つのスパース行列バッファは、交互バッファモードでスパース行列係数をバッファするために構成され、２つのポインタバッファは、交互バッファモードでスパース行列の各列の非ゼロ係数開始位置を表すポインタをバッファするために構成され、そして２つの出力バッファは、交互バッファモードで一方の出力バッファが計算結果をバッファするために使用されている間に、もう一方の出力バッファから計算結果を出力するように構成されている。

【0092】

当業者であれば、本明細書の開示に関連して記載されている様々な例示的論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子機器ハードウェア、コンピュータソフトウェア、またはその両方の組み合わせとして実装し得ることをさらに認識するであろう。ハードウェアおよびソフトウェアのこの互換性を明確に説明するために、様々な例示的な構成要素、ブロック、モジュール、回路およびステップが、それらの機能性の観点から大体において上記で説明されている。そのような機能性がハードウェアまたはソフトウェアのどちらとして実装されるのかは、特定のアプリケーションおよびシステム全体に課される設計制約によって決まる。熟練した技術者であれば、それぞれの特定のアプリケーションのために様々なやり方で、記載された機能性を実装することができるが、そのような実装の決定は、本開示の範囲からの逸脱をもたらすものとして解釈されないものとする。

【0093】

本明細書の開示に関連して記載されている様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）もしくは他のプログラマブル論理デバイス、ディスクリートゲートもしくはトランジスタ論理、ディスクリートハードウェア構成要素、または本明細書に記載されている機能を実行するように設計されたこれらの任意の組み合わせにより、実装または実行することができる。汎用プロセッサは、マイクロプロセッサとすることができるが、代替的選択肢では、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械とすることができる。プロセッサは、コンピューティングデバイスの組み合わせ、例えば、ＤＳＰおよびマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、ＤＳＰコアと協働する１つまたは複数のマイクロプロセッサ、または任意の他のそのような構成として実装してもまたよい。

【0094】

本明細書の開示に関連して記載されている方法またはアルゴリズムのステップは、ハードウェアにおいて、プロセッサによって実行されるソフトウェアモジュールにおいて、またはこれら２つの組み合わせにおいて直接具体化することができる。ソフトウェアモジュールは、ＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、ＥＰＲＯＭメモリ、ＥＥＰＲＯＭメモリ、レジスタ、ハードディスク、リムーバブルディスク、ＣＤ－ＲＯＭ、または当技術分野において既知の任意の他の形態の記憶媒体に常駐させることができる。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合されている。代替的選択肢では、記憶媒体は、プロセッサに組み込まれていてもよい。プロセッサおよび記憶媒体は、ＡＳＩＣ内に常駐させてもよい。ＡＳＩＣは、クライアント側、サーバ側、および／または中間デバイスに常駐させてもよい。代替的選択肢では、プロセッサおよび記憶媒体は、ディスクリートコンポーネントとしてクライアント側、サーバ側、および／または中間デバイスに常駐させてもよい。

【0095】

１つまたは複数の例示的な設計では、記載されている機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせにおいて実装することができる。ソフトウェアにおいて実装する場合であれば、諸機能は、１つまたは複数の命令もしくはコードとして、コンピュータ可読媒体に格納してもよいし、コンピュータ可読媒体を介して送信してもよい。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む、コンピュータ記憶媒体および通信媒体の両方を含む。記憶媒体は、汎用または特殊用途コンピュータによってアクセスすることが可能な任意の利用可能な媒体とすることができる。限定ではなく例として、そのようなコンピュータ可読媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭもしくは他の光ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶デバイス、または所望のプログラムコード手段を、命令もしくはデータ構造の形態で搭載または格納するために使用することが可能であり、かつ、汎用もしくは特殊用途コンピュータ、または汎用もしくは特殊用途プロセッサによってアクセスすることが可能な任意の他の媒体を含むことができる。同様に、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、ソフトウェアが、ウェブサイト、サーバ、または他の遠隔したソースから、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無電、およびマイクロ波などのワイヤレス技術を使用して送信される場合には、この同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるものとする。特許請求の範囲を含め本明細書で使用する場合、「のうちの少なくとも１つ（ａｔｌｅａｓｔｏｎｅｏｆ）」という前置きを付けた項目の列挙で使用される「または（ｏｒ）」は、選言的な列挙を示しており、例えば、「Ａ、ＢまたはＣのうちの少なくとも１つ」という列挙は、ＡまたはＢまたはＣまたはＡＢまたはＡＣまたはＢＣまたはＡＢＣ（すなわち、ＡとＢとＣ）を意味する。

【図1A】